生物信息學課件

上傳人：a*** IP屬地：北京上傳時間：2020-09-06 格式：PPT 頁數(shù)：122 大小：2.67MB 積分：20 舉報 版權申訴

已閱讀5頁，還剩117頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、生物信息學,內容,一、生物信息學定義二、生物信息學的發(fā)展歷史三、生物信息學的主要研究內容,3,一、生物信息學定義,4,背景,人類基因組計劃(Human Genome Project, HGP)：1990年正式啟動，旨在完成人類基因組約30億對堿基的全序列測定。海量生物數(shù)據(jù)的迅速膨脹：DNA、RNA和蛋白質序列，蛋白質二級結構和三維結構數(shù)據(jù)，蛋白質相互作用數(shù)據(jù)等。對大量生物數(shù)據(jù)的管理、分析和信息化需求促進了生物信息學的迅速發(fā)展。,5,生物信息學（Bioinformatics）名詞的由來,20世紀80代末期，林華安博士認識到將計算機科學與生物學結合起來的重要意義，開始留意要為這一領域構思

2、一個合適的名稱。起初，他使用的是“CompBio”；之后，又將其更改為兼具法國風情的“bioinformatique”，看起來似乎有些古怪。不久，他便進一步把它更改為“bio-informatics”。但由于當時的電子郵件系統(tǒng)與今日不同，該名稱中的-或/符號經(jīng)常會引起許多系統(tǒng)問題，于是林博士將其去除，今天我們所看到的“bioinformatics”就正式誕生了，林博士也因此贏得了“生物信息學之父”的美譽。,6,生物信息學之父林華安,Dr. Hwa A. Lim （林華安）1987年提出 “Bio-informatique” “Bioinformatics” 1955年出生于馬來西亞。

3、聯(lián)合國Bioinformatics專家，University of Texas at Dallas分子與細胞生物學Adjunct Professor、中國科學院基因遺傳研究所客座教授。1981年英國倫敦大學帝國學院(Imperial College, London University)畢業(yè)，1986年獲得美國Rochester University生化物理學博士學位，30歲取得佛羅里達州立大學終生教授。1992年受聘擔任美國國家癌癥中心及美國國家科學基金會審核委員。1995年后，歷任多家生物科技公司生化信息執(zhí)行長、副總裁等高層管理職位。1997年，創(chuàng)立結合軟件與數(shù)據(jù)分析的專業(yè)顧問公司D Tr

4、ends，服務生物技術、制藥及衛(wèi)生保健等機構。,什么是生物信息學？,生物信息學,說文解字：生物 + 信息 + 學 (bioinformatics) biology + information + theory 廣義：應用信息科學的方法和技術，研究生物體系和生物過程中信息的存貯、信息的內涵和信息的傳遞，研究和分析生物體細胞、組織、器官的生理、病理、藥理過程中的各種生物信息，或者也可以說成是生命科學中的信息科學。狹義：應用信息科學的理論、方法和技術，管理、分析和利用生物分子數(shù)據(jù)。,9,生物信息學基本思想的產(chǎn)生,生物信息學的迅速發(fā)展,二十世紀 50年代,二十世紀 80-90年代,生物科學

5、和技術的發(fā)展,人類基因組計劃的推動,二、生物信息學的發(fā)展歷史,10,（一）前基因組時代的生物信息學,屬于生物物理學范疇的傳統(tǒng)生物信息學可以追溯到很久以前，如研究生物發(fā)光、生物電、生物磁和激素等信息物質的傳遞現(xiàn)象及其相應測定技術。以研究序列比對為標志的現(xiàn)代生物信息學則起源于20世紀7080年代。這一階段的主要成就包括核酸和蛋白質序列的初步分析、生物學數(shù)據(jù)庫的建立以及檢索工具的開發(fā)。例如Dayhoff的替換矩陣、Neelleman和Wunsch的序列比對（sequence alignment）及GenBank（由美國國立生物技術信息中心建立和維護的核酸與蛋白質序列數(shù)據(jù)庫）等大型數(shù)據(jù)庫的建

6、立，形成了生物信息學的雛形。,11,20世紀50年代，生物信息學開始孕育 20世紀60年代，生物分子信息在概念上將計算生物學和計算機科學聯(lián)系起來 20世紀70年代，生物信息學的真正開端(序列比對算法) 20世紀80年代初期，生物信息分析方法的發(fā)展 20世紀80年代以后，生物信息服務機構和數(shù)據(jù)庫 20世紀90年代后，HGP促進生物信息學的迅速發(fā)展,生物信息學的孕育和初步形成,12,1956: 美國田納西州首次召開了“生物學中的理論研討會”； 1962: Zucherkandl和Pauling研究了序列變化與進化的關系，開創(chuàng)了一個新的領域分子進化； 1967: Dayhoff研制出蛋白質序列圖

7、集，即后來著名的蛋白質信息源PIR； 1970: Needleman和Wunsch提出了著名的序列比對算法，是生物信息學發(fā)展中最重要的貢獻； 1970: Gibbs和McIntyre發(fā)表著名的矩陣打點做圖法； 1978: Gingeras等人研制了核酸序列中酶切位點識別程序； 1981: Smith和Waterman提出了著名的公共子序列識別算法，同年Doolittle提出了關于序列模式的概念；,13,1982: GenBank第3版本正式發(fā)行； 1983: Wilbur和Lipman發(fā)表了數(shù)據(jù)庫相似序列搜索算法； 1986: 日本核酸序列數(shù)據(jù)庫DDBJ誕生； 1986: 蛋白質數(shù)據(jù)庫SWIS

8、S-PROT誕生； 1988: 美國國家生物技術信息中心NCBI誕生； 1988: 成立歐洲分子生物學網(wǎng)絡(EMBNet)，EMBL數(shù)據(jù)庫誕生； 1988: Person和Lipman發(fā)表了著名的序列比較算法FASTA； 1990: 快速相似性序列搜索算法BLAST問世，1987年BLAST的改進版本PSI-BLAST投入使用,14,（二）基因組時代的生物信息學,以基因組計劃的實施為標志的基因組時代（1990年至2001年）是生物信息學成為一個較完整的新興學科并得到高速發(fā)展的時期。這一時期生物信息學確立了自身的研究領域和學科特征，成為生命科學的熱點學科和重要前沿領域之一。這一階段的主要成就包

9、括大分子序列以及表達序列標簽（expressed sequence tag，EST）數(shù)據(jù)庫的高速發(fā)展、BLAST（basic local alignment search tool）和FASTA（fast alignment）等工具軟件的研制和相應新算法的提出、基因的尋找與識別、電子克隆（in silico cloning）技術等，大大提高了管理和利用海量數(shù)據(jù)的能力。,人類基因組計劃 (HGP，Human Genome Project) 目標：整體上破解人類遺傳信息的奧秘,由美國NIH和能源部提出和帶頭，美、英、德、法、日、中共同參與的國際合作項目。重大國際研究項目：測定人類基因組全部DNA

10、序列，構建人類基因組遺傳圖譜和物理圖譜。 1990年：正式啟動，30億美元。 2001年：人類基因組草圖公開發(fā)表。 2003年：美國宣布該項目完成。,HGP的歷史回顧,1984.12 猶他州阿爾塔組織會議，初步研討測定人類整個基因組DNA序列的意義 1985 Dulbecco在Science撰文 “腫瘤研究的轉折點:人類基因組的測序” 美國能源部(DOE)提出“人類基因組計劃”草案 1987 美國能源部和國家衛(wèi)生研究院（NIH）聯(lián)合為“人類基因組計劃”下?lián)軉咏?jīng)費約550萬美元 1989 美國成立“國家人類基因組研究中心”，Watson擔任第一任主任 1990.10 經(jīng)美國國會批準，

11、人類基因組計劃正式啟動,第一個自由生物體流感嗜血菌(H. inf)的全基因組測序完成 1996 完成人類基因組計劃的遺傳作圖啟動模式生物基因組計劃,H.inf全基因組,Saccharomyces cerevisiae 釀酒酵母,Caenorhabditis elegans 秀麗線蟲,1997 大腸桿菌(E.coli)全基因組測序完成 1998 完成人類基因組計劃的物理作圖開始人類基因組的大規(guī)模測序 Celera公司加入，與公共領域競爭啟動水稻基因組計劃 1999.7 第5屆國際公共領域人類基因組測序會議，加快測序速度,大腸桿菌及其全基因組,水稻基因組計劃,1999.7 第5屆國際公共領域

12、人類基因組測序會議，加快測序速度 2000 Celera公司宣布完成果蠅基因組測序國際公共領域宣布完成第一個植物基因組擬南芥全基因組的測序工作,Drosophila melanogaster 果蠅,Arabidopsis thaliana 擬南芥,2001年2月15日Nature封面,2001年2月16日Science封面,2000.6.26 公共領域和Celera公司同時宣布完成人類基因組工作草圖 2001.2.15 Nature刊文發(fā)表國際公共領域結果 2001.2.16 Science刊文發(fā)表Celera公司及其合作者結果,21,我國對人類基因組計劃的貢獻,23,人類基因組計劃準備用

13、15年時間投入30億美元，完成人全部24(22+X+Y)條染色體中3.2109個堿基對的序列測定，主要任務包括做圖（遺傳圖譜物理圖譜以及轉錄圖譜的繪制）、測序和基因識別，其根本任務是解讀和破譯生物體的生老病死以及與疾病相關的遺傳信息。,24,人類基因組,人類基因組的組成,線粒體基因組(16.6kb),細胞核基因組(3200Mb),基因外序列,基因和基因有關序列,約10%,約90%,專一或中等重復序列,Non-coding DNA,假基因,內含子,基因片段,10%,90%,專一的或低拷貝數(shù)序列,中度至高度重復序列,2030%,7080%,分散重復序列,串聯(lián)重復序列/ 成簇重復序列,約60%,約

14、40%,蛋白編碼基因,rRNA 基因,tRNA 基因,Coding DNA,估計10萬最初公布3.5萬目前研究確定2.45萬,25,生物信息學的研究,結構基因組學時期,26,主要的數(shù)據(jù)庫資源,核酸序列數(shù)據(jù)庫主要有GenBank, EMBL, DDBJ等. 蛋白質序列數(shù)據(jù)庫主要有SWISS-PROT, PIR, TrEMBL等，蛋白結構數(shù)據(jù)庫有PDB, MMDB等，與基因組有關的數(shù)據(jù)庫還有dbEST, OMIM等，,27,3大核酸數(shù)據(jù)庫,基因組數(shù)據(jù)庫的相關背景主要的基因組數(shù)據(jù)庫資源重點介紹GenBank,28,三大基因數(shù)據(jù)庫,GenbankGenbank庫包含了所有已知的核酸序列和蛋白

15、質序列，以及與它們相關的文獻著作和生物學注釋。它是由美國國立生物技術信息中心(The National Center for Biotechnology Information, NCBI)建立和維護的。NCBI的網(wǎng)址是：。 EMBL(The European Molecular Biology Laboratory )核酸序列數(shù)據(jù)庫由歐洲生物信息學研究所(EBI)維護的核酸序列數(shù)據(jù)構成，查詢檢索可以通過通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務完成。數(shù)據(jù)庫網(wǎng)址是：http:/www.ebi.ac.uk/embl/。 DDBJ(DNA Data

16、 Bank of Japan)數(shù)據(jù)庫日本DNA數(shù)據(jù)倉庫(DDBJ)也是一個全面的核酸序列數(shù)據(jù)庫，與Genbank和EMBL核酸庫合作交換數(shù)據(jù)。使用其主頁上提供的SRS工具進行數(shù)據(jù)檢索和序列分析。DDBJ的網(wǎng)址是：http:/www.ddbj.nig.ac.jp/。,29,GenBank,Public free Available via Internet,EMBL Data Library,DDBJ (DNA Data Bank of Japan),三大基因數(shù)據(jù)庫之間的關系,30,/,http:/www.ddbj.nig.ac.jp/sear

17、ches-e.html,http:/www.ebi.ac.uk/embl/,31,美國的核酸數(shù)據(jù)庫GenBankBanson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7從1979年開始建設，1982年正式運行。,32,33,歐洲分子生物學實驗室的EMBL數(shù)據(jù)庫也于1982年開始服務。,34,35,日本于1984年開始建立國家級的核酸數(shù)據(jù)庫DDBJ，并于1987年正式服務。,36,37,蛋白質數(shù)據(jù)庫,38,主要的數(shù)據(jù)庫資源,核酸序列數(shù)據(jù)庫主要有GenBank, EMBL, DDBJ等. 蛋白質序列數(shù)據(jù)庫主要有SWISS-PROT, PIR, TrE

18、MBL等，蛋白結構數(shù)據(jù)庫有PDB, MMDB等，與基因組有關的數(shù)據(jù)庫還有dbEST, OMIM等，,39,60年代“蛋白質信息資源”(Protein Information Resource，簡稱PIR)雛形產(chǎn)生 1984年，“蛋白質信息資源” 計劃正式啟動，蛋白質序列數(shù)據(jù)庫PIR也因此而誕生。 1988年，美國的NBRF、日本的國際蛋白質信息數(shù)據(jù)庫JIPID和德國的慕尼黑蛋白質序列信息中心MIPS合作成立了國際蛋白質信息中心(PIR-International)，共同收集和維護蛋白質序列數(shù)據(jù)庫PIR。,40,PIR(protein information resource) 1. 由美國

19、NCBI翻譯自GenBank的DNA序列(1984年)； 2. 在EMBL和GenBank數(shù)據(jù)庫上均建立了鏡像站點； 3. 數(shù)據(jù)依據(jù)注釋的質量分為4類。網(wǎng)址： /,PIR數(shù)據(jù)庫的分類情況(Release 51.03),41,42,除了PIR外，另一個重要的蛋白質序列數(shù)據(jù)庫則是SwissProt。該數(shù)據(jù)庫由瑞士日內瓦大學于1986年創(chuàng)建，目前由瑞士生物信息學研究所和歐洲生物信息學研究所 EBI共同維護和管理。,43,SWISSPROT 1. 瑞士日內瓦大學醫(yī)學生物化學系和歐洲生物信息學研究所(EBI)合作維護（1986年）； 2. 在

20、EMBL和GenBank數(shù)據(jù)庫上均建立了鏡像站點; 3. 數(shù)據(jù)庫包括了從EMBL翻譯而來的蛋白質序列，這些序列經(jīng)過檢驗和注釋； SWISS-PROT的網(wǎng)址： /sprot,44,45,PIR和SwissProt是創(chuàng)建最早、使用最為廣泛的兩個蛋白質數(shù)據(jù)庫。蛋白質序列數(shù)據(jù)庫TrEMBL是從EMBL中的cDNA序列翻譯得到的。該數(shù)據(jù)庫采用SwissProt數(shù)據(jù)庫格式，包含EMBL數(shù)據(jù)庫中所有編碼序列的翻譯。 TrEMBL: /news/2004/03/02/full,46,蛋白質結構數(shù)據(jù)庫,47,主要的數(shù)據(jù)庫資源,核酸

21、序列數(shù)據(jù)庫主要有GenBank, EMBL, DDBJ等. 蛋白質序列數(shù)據(jù)庫主要有SWISS-PROT, PIR, TrEMBL等，蛋白結構數(shù)據(jù)庫有PDB, MMDB等，與基因組有關的數(shù)據(jù)庫還有dbEST, OMIM等，,48,PDB（protein data bank） 1. 目前最主要的蛋白質分子結構數(shù)據(jù)庫； 2. 1970年代建立，美國Brookhaven國家實驗室維護管理; 3. 1988年，由美國RCSB(research collaboratory for structural biology)管理； 4. 以文本格式存放數(shù)據(jù)，包括原子坐標、物種來源、測定方法、提交者信息、一級

22、結構、二級結構等； PDB的網(wǎng)址：/pdb(美國),49,50,（三）后基因組時代的生物信息學,隨著人類基因組計劃的順利進行，人類全基因組測序工作已經(jīng)完成。測序工作的完成并不代表基因組計劃的結束，相反標志著“后基因組信息學”的開始?；蚪M學研究也由結構基因組轉向了功能基因組的研究，通過對基因組的分析來了解生物體的功能成為后基因組時代的主要目標。,51,后基因組研究對象的多層次性,后基因組研究對象是多層次的，人們從包括轉錄組（Transcriptome）、蛋白質組（Proteome）、相互作用組（Interactome)、定位組（Localizome）、折疊

23、子組（foldome）、代謝組（Metabolome）、表型組（Phenome）等方面，從組的角度研究各類生物學過程。如果說基因組問題涉及遺傳圖譜（Genetic map）、限制性圖譜（Restriction map）和物理圖譜（Physical map），那么其它的組學涉及功能圖譜（Functional maps）。,52,轉錄組學研究,轉錄組學（transcriptomics），是一門在整體水平上研究細胞中基因轉錄的情況及轉錄調控規(guī)律的學科。簡而言之，轉錄組學是從RNA水平研究基因表達的情況。轉錄組即一個活細胞所能轉錄出來的所有RNA的總和，是研究細胞表型和功能的一個重要手段。,53,54

24、,基因組對生命體的整體控制必須通過它所表達的全部蛋白質來執(zhí)行，由于基因芯片技術只能反映從基因組到RNA的轉錄水平上的表達情況，由于從RNA到蛋白質還有許多中間環(huán)節(jié)的影響，因此僅憑基因芯片技術我們還不能最終掌握生物功能具體執(zhí)行者蛋白質的整體表達狀況；近幾年在發(fā)展基因芯片的同時，人們也發(fā)展了一套研究基因組所有蛋白質產(chǎn)物表達情況蛋白質組研究技術，從技術上來講包括二維凝膠電泳技術和質譜測序技術。通過二維凝膠電泳技術可以獲得某一時間截面上蛋白質組的表達情況，通過質譜測序技術就可以得到所有這些蛋白質的序列組成。這些都是技術實現(xiàn)問題，最重要的就是如何運用生物信息學理論方法去分析所得到的巨量數(shù)據(jù)，從中還原出

25、生命運轉和調控的整體系統(tǒng)的分子機制。,蛋白質組研究,55,蛋白質組研究,56,三、生物信息學的主要研究內容,1、生物分子數(shù)據(jù)的收集與管理 2、數(shù)據(jù)庫搜索及序列比較 3、基因組序列分析 4、基因表達數(shù)據(jù)的分析與處理 5、蛋白質結構預測,57,GenBank數(shù)據(jù)文件格式 GBFF,Genbank flat file (Genbank純文本文件）,58,頭部：描述區(qū),59,GenBank數(shù)據(jù)文件格式,子庫,Locus名字,定義 (標題),修改日期,序列類型 mRNA (= cDNA) rRNA snRNA DNA,序列長度,檢索號,Genbank號,序列形狀,60,GenBank的數(shù)據(jù)類型,61,物

26、種來源,作者,雜志或單位,測序方式,62,中部：注釋區(qū),63,GenBank數(shù)據(jù)文件格式,尾部：核酸序列,64,FASTA格式,65,NCBI文獻檢索開放閱讀框架查詢,66,UTR的含義是（）。 A. 編碼區(qū) B. 非編碼區(qū) C. 低復雜度區(qū)域 D. 開放閱讀框,B,Untranslated Regions,67,algorithm的含義是（）。 A. 登錄號 B. 算法 C. 比對 D. 類推,B,68,alignment的含義是（）。 A. 登錄號 B. 算法 C. 比對 D. 類推,C,69,analogy的含義是（）。 A. 登錄號 B. 算法 C. 比對 D. 類推,D,7

27、0,contig的含義是（）。 A. 基序 B. 疊連群 C. 堿基對 D. 結構域,B,71,RGP是（）。 A. 在線人類孟德爾遺傳數(shù)據(jù) B. 國家核酸數(shù)據(jù)庫 C. 人類基因組計劃 D. 水稻基因組計劃,D,72,下列FASTA格式正確的是（）。 A. seq1: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgc

28、tggctttgatgaaaactctaactaaacactccctta D. seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta,B,73,如果我們試圖做蛋白質亞細胞定位分析，應使用（）。 A. NDB數(shù)據(jù)庫 B. PDB數(shù)據(jù)庫 C. GenBank數(shù)據(jù)庫 D. SWISS-PROT數(shù)據(jù)庫,D,74,GenBank中分類碼PLN表示是（）。 A. 哺乳類序列 B. 細菌序列 C. 噬菌體序列 D. 植物、真菌和藻類序列,D,75,從cDNA文庫中獲得的短序列是（）。 A. STS (sequence-tagg

29、ed site) B. UTR (untranslated region) C. CDS (coding sequence) D. EST （expressed sequence tag）,D,76,TAIR數(shù)據(jù)庫是（）。 A. 線蟲基因組 B. 果蠅基因組 C. 擬南芥數(shù)據(jù)庫 D. 大腸桿菌基因組,C,The Arabidopsis Information Resource,77,ORF的含義是（）。 A. 調控區(qū) B. 非編碼區(qū) C. 低復雜度區(qū)域 D. 開放閱讀框,D,(open reading frame),78,mRNA 5端有( )結構。 A. 帽子 B. 尾巴 C. 帽子和尾

30、巴 D. 多聚核苷酸,A,79,mRNA 3端有( )結構。 A. 帽子 B. 尾巴 C. 帽子和尾巴 D. 多聚胞嘧啶,B,80,目前應用于基因芯片表達數(shù)據(jù)統(tǒng)計分析的主要方法是（）。 A. 卡方檢驗 B. 相關分析 C. 聚類分析 D. 正態(tài)性分布檢驗,C,81,SAGE的含義是（）。 A. 基因表達連續(xù)分析 B. 聚丙烯酰胺凝膠電泳 C. 基因組分析 D. 雙向電泳分析,A,(Serial Analysis of Gene Expression,SAGE),(polyacrylamide gelelectrophoresis, PAGE),(two-dimensional electr

31、ophoresis, 2-DE),82,domain的含義是（）。 A. 基序 B. 跨疊克隆群 C. 堿基對 D. 結構域,D,83,NCBI中人類無冗余基因數(shù)據(jù)庫是（）。 A. UniGene B. UniPro C. UniRef D. URF,A,84,Entrez使用幾種邏輯運算符對檢索關鍵詞做最基本的限制？（） A. 1種 B. 2種 C. 3種 D. 4種,C,(AND, OR, NOT),85,微衛(wèi)星標記是（）。 A. RFLP B. SNP C. SSR D. RAPD,C,(Restriction Fragment Length Polymorphism, 限制性內

32、切酶片段長度多態(tài)性),(Single Nucleotide Polymorphisms, 單核苷酸多態(tài)性),(Simple Sequence Repeats),(Random Amplified Polymorphic DNA, 隨機擴增多態(tài)性DNA標記),86,提交序列到GenBank中，使用的程序可以是（）。 A. Entrez B. SRS C. Medline D. BankIt,D,(Sequence Retrieval System,)是EMBL研制的一個基于WEB的查詢系統(tǒng),也是目前國際上最有影響的生物分子數(shù)據(jù)庫查詢系統(tǒng)之一）,87,PDB是蛋白質的（）。 A. 分類數(shù)據(jù)庫

33、B. 結構數(shù)據(jù)庫 C. 模體數(shù)據(jù)庫 D. 結構域數(shù)據(jù)庫,B,88,限制性片段長度多態(tài)性標記是（）。 A. RFLP B. SNP C. SSR D. RAPD,A,89,CDS的含義是（）。 A. 編碼區(qū) B. 非編碼區(qū) C. 低復雜度區(qū)域 D. 非調控區(qū),A,(Codingsequence),90,構建進化樹工具是（）。 A. BLAST B. ClustalW C. Mega D. GCG,C,91,在真核生物中，一個基因cDNA 的5端起始密碼子AUG的前后序列符合（）規(guī)則。 A. Kozak B. AUAG C. SD D. Poly(A)n,(Kozak序列是位于真核生物mR

34、NA 5端帽子結構后面的一段核酸序列,通常是ACCACCATGG,它可以與翻譯起始因子結合而介導含有5帽子結構的mRNA翻譯起始。),A,92,在真核生物的一個基因內含子兩端，即外顯子/內含子拼接邊界處，其符合（）規(guī)則。 A. Kozak B. GUAG C. SD D. Poly(A)n,B,93,下列序列中起始密碼子，終止密碼子，可能的內含子 5gauguucgucccggagaaccaugggcgcguacaucggauucgaagcuccacugaggcu-3,起始密碼子：AUG 終止密碼子：UAA, UGA, UAG,94,基本局部比對搜素工具是（）。 A. Mega B. Cl

35、ustalW C. BLAST D. GCG,The Basic Local Alignment Search Tool,C,95,將核酸序列按照6條鏈翻譯成蛋白質序列后搜索蛋白質序列數(shù)據(jù)庫使用的程序是（）。 A. blastp B. blastx C. tblastn D. tblastx E. blastn,(使用蛋白質序列與蛋白質數(shù)據(jù)庫中的序列進行比較),(將給定的核酸序列按照六種閱讀框架將其翻譯成蛋白質與蛋白質數(shù)據(jù)庫中的序列進行比對),(將給定的氨基酸序列與核酸數(shù)據(jù)庫中的序列（雙鏈）按不同的閱讀框進行比對),(將庫和待查核酸序列都翻譯成蛋白序列, 然后對蛋白序列進行比對),(將給定的

36、核酸序列與核酸數(shù)據(jù)庫中的序列進行比較),B,96,97,被譽為“生物信息學之父”的科學家是（）。 A. Dulbecco B. Sanger C. 吳瑞 D. 林華安1955年出生于馬來西亞，1987年，林華安博士正式命名生物信息學（bioinformatics）,D,98,DDBJ的含義是（）。 A. 美國國家生物信息中心 B. 歐洲分子生物學實驗室 C. 日本DNA數(shù)據(jù)庫 D. 中國基因組研究中心,C,99,單核苷酸標記是（）。 A. RFLP B. SNP C. SSR D. RAPD,B,（single nueleotide polymorphism，SNP）,100,GenBa

37、nk數(shù)據(jù)庫的基本信息單位是（）。 A. FASTA B. GBFF C. GCG D. ASN.1,B,(GenBank Flat File),101,OMIM是（）。 A. 在線人類孟德爾遺傳數(shù)據(jù)庫 B. 國家核酸數(shù)據(jù)庫 C. 人類基因組計劃 D. 國際水稻基因組測序計劃,A,（Online Mendelian Inheritance in Man）,(human genome project, HGP),( International Rice Genome Sequencing Project , IRGSP),102,沒有直接參與完成人類基因組計劃的國家是（）。 A. 英國 B.

38、中國 C. 俄羅斯 D. 德國,C,美國、英國、法國、德國、日本和中國,103,EMBL的含義是（）。 A. 美國國家生物信息中心 B. 歐洲分子生物學實驗室 C. 日本DNA數(shù)據(jù)庫 D. 中國國家基因組研究中心,B,(National Center for Biotechnology Information, NCBI),（The European Molecular Biology Laboratory, EMBL）,(DNA Data Bank of Japan, DDBJ),104,accession number的含義是（）。 A. 登錄號 B. 算法 algorithm C.

39、比對 alignment D. 類推 analogy,A,105,EST的含義是（）。 A. 表達序列標簽 B. 序列標簽位點 C. 高通量基因組序列 D. 人工合成序列,A,（expressed sequence tag）,(sequence-tagged site),106,Blast結果中HSP的含義是（）。 A. 空位 B. 期望值 C. 過濾 D. 高分配對片段,D,（high-scoring segment pairs）,107,Proteomics的含義是（）。 A. 生物信息學 B. 基因組學 C. 蛋白質組學 D. 表觀遺傳學,C,genomics,108,根據(jù)大量E

40、ST具有相互重疊的性質，通過計算機算法獲得cDNA全長序列，這種克隆基因的方法是（）。 A. 重疊克隆 B. 電子克隆 C. 基因步移 D. 基因重組,B,109,隱馬爾科夫模型的代號是（）。 A. HMM B. CDD C. HTGS D. GSS,（Hidden Markov Model, HMM）,A,（Conserved Domain Database, CDD, 保守結構域數(shù)據(jù)庫）,(high-throughput genome sequence, 高通量基因組序列),（Genome Survey Sequence database, 基因組勘測序列數(shù)據(jù)庫）,110,構建系統(tǒng)發(fā)生

41、樹，應使用（）。 A. BLAST B. FASTA C. UPGMA D. FTP,C,111,一類是基于距離的構建方法，利用所有物種或分類單元間的進化距離，依據(jù)一定的原則及算法構建系統(tǒng)發(fā)生樹?；舅悸肥橇谐鏊锌赡艿男蛄袑?，計算序列之間的遺傳距離，選出相似程度比較大或非常相關的序列對，利用遺傳距離預測進化關系。這類方法有非加權分組平均法（unweighted pair group method with arithmetic means, UPGMA）、鄰近歸并法（neighbor joining method, NJ）、Fitch-Margoliash法、最小進化方法（minimum evolution）等。另一類方法是基于離散特征的構建方法，利用的是具有離散特征狀態(tài)的數(shù)據(jù)，如DNA序列中的特定位點的核苷酸。建樹時，著重分析分類單位或序列間每個特征（如核苷酸位點）的進化關系等。屬于這一類的方法有最大簡約法（maximum parsimony method）、最大似然法（maximum l

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

生物信息學課件

文檔簡介

溫馨提示

最新文檔

評論

生物信息學課件

文檔簡介

溫馨提示

最新文檔

評論

相關文檔