生物信息學的現(xiàn)狀與未來_第1頁
生物信息學的現(xiàn)狀與未來_第2頁
生物信息學的現(xiàn)狀與未來_第3頁
生物信息學的現(xiàn)狀與未來_第4頁
生物信息學的現(xiàn)狀與未來_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學的現(xiàn)狀與未來鄭偉國郭英中國民用航空學院理學院(300300常春艷天津出入境檢驗檢疫局(300456摘要生物信息學已成為整個生命科學發(fā)展的重要組成部分,是生命科學研究的前沿領域?,F(xiàn)對生物信息學研究對象、重要技術、數(shù)據(jù)庫建設及其研究現(xiàn)狀等方面進行了綜述,并展望生物信息學的發(fā)展前景。關鍵詞生物信息學基因組學蛋白組學功能蛋白質組學A bst ractBioin formatics is an im portant com ponent of the whole life science,has become the advanced research domain of life scien

2、ce.These paper overviews on its research subject,the main technolosies,its cur2 rent status in erection of biology database and research w ork,als o propect its foreground.Ke y wor dsBioin formaticsG enomicsProteonicFunctional proteoni隨著生物科學技術的迅猛發(fā)展,生物信息數(shù)據(jù)資源的增長呈現(xiàn)爆炸之勢,同時計算機運算能力的提高和國際互聯(lián)網(wǎng)絡的發(fā)展使得對大規(guī)模數(shù)據(jù)的貯存

3、、處理和傳輸成為可能,為了快捷方便地對己知生物學信息進行科學的組織、有效的管理和進一步分析利用,一門由生命科學和信息科學等多學科相結合特別是由分子生物學與計算機信息處理技術緊密結合而形成的交叉學科生物信息學(Bioin formatics應運而生,并大大推動了相關研究的開展,被譽為“解讀生命天書的慧眼”1。生物信息學自產生以來大致經(jīng)歷了前基因組時代、基因組時代和后基因組時代三個發(fā)展階段。前基因組時代的標志性工作包括生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)以及DNA和蛋白質序列分析等;基因組時代的標志性工作包括基因識別與發(fā)現(xiàn)、網(wǎng)絡數(shù)據(jù)庫系統(tǒng)的建立和交互界面工具的開發(fā)等;后基因組時代的標志則是大規(guī)模基因組

4、分析、蛋白質組分析以及各種數(shù)據(jù)的比較與整合。三個階段雖無明顯的界限,卻真實地反映了整個研究重心的轉移變化歷程。對生物信息學的定義,國內外至今尚未形成統(tǒng)一的認識。以下是一些較有影響的看法:美國國家基因組研究中心認為,生物信息學是一個代表生物學、數(shù)學和計算機的綜合力量的新興學科。北京生物技術和新醫(yī)藥產業(yè)中心認為,生物信息學是在生命科學研究中以計算機為工具對生物信息進行儲存、檢索和分析的科學2。1995年,在人類基因組計劃(HG P第一個5年總結報告中給出了一個較為完整的生物信息學定義:生物信息學是包含生物信息的獲取、處理、儲存、傳遞、分析和解釋的所有方面的一門學科??v觀生物信息學豐富多彩的相關學科

5、、研究領域及其由信息流方向主導的研究過程,現(xiàn)歸納出如下定義:生物信息學是一門采用計算機技術和信息論方法對蛋白質及其核酸序列等多種生物信息采集、加工、儲存、傳遞、檢索、分析和解讀的科學,是現(xiàn)代生命科學與信息科學、計算機科學、數(shù)學、統(tǒng)計學、物理學和化學等學科相互滲透而形成的交叉學科。1研究對象生物信息學主要包括基因組學(G enomics和蛋白組學(Proteomics,其實質就是分析和解讀核酸和蛋白質序列中所表達的結構與功能的生物信息。1.1基因組學一種生物的全部遺傳構成稱為該種生物的基因組,有關基因組的研究稱為基因組學,它包含對基因組信息的獲取、處理、存儲、分配和解釋等。其中,序列基因組學(S

6、equence genomics 主要研究測序和核苷酸序列,為繪制圖譜提供材料2;結構基因組學(Structural genomics 著重于遺傳圖譜、物理圖譜和測序等方面的研究;功能基因組學(Functional genomics 則研究以轉錄圖為基礎的基因組表達圖譜3,4;比較基因組學(C om parative genomics 的研究內容則包括對不同進化階段基因組的比較和不同種群和群體基因組的比較5。1.2蛋白組學由于基因表達水平并不能代表細胞中活性蛋白質的數(shù)目(準確的說是開放讀框ORF 的數(shù)目,基因組序列并不能描述活性蛋白質所必需的翻譯后修飾和反映蛋白質種類和含量的動態(tài)變化過程,澳大

7、利亞學者Wasinger 等在1994年首次提出了蛋白組(Proteme 的概念6。在一定條件下某一基因組蛋白質表達的數(shù)量類型稱為蛋白組,代表這一有機體全部蛋白質組成及其作用方式,有關蛋白組的研究稱為蛋白組學。其中,蛋白組的研究技術與方法、雙向凝膠電泳圖譜以及對不同條件下蛋白組變化的比較分析是蛋白組學的主要研究內容7。1.3兩者的關系基因組基本上是固定不變的,而蛋白質組是動態(tài)的,具有時空性和可調節(jié)性,能反映某基因的表達時間、表達量,以及蛋白質翻譯后的加工修飾和亞細胞分布等,因此提出了功能蛋白質組學(Func 2tional proteonic 的概念,它是指在特定時間、特定環(huán)境和實驗條件下8基

8、因組中活躍表達的蛋白質9。2重要技術2.1.1結構基因組學與生產線模式把結構基因組的研究機構稱之為蛋白質結構工廠,而把它的研究流程稱為生產線(見圖110。這一過程是以傳統(tǒng)的結構解析法為基礎設計的,但與傳統(tǒng)的結構解析法相比,生產線模式增添了自動化操作,使整個過程得以快速高效地完成,這也使得大規(guī)模解析蛋白質結構得以實現(xiàn)。首先是基因組計劃的圓滿完成、cDNA 文庫的日趨完善等為結構基因組研究提供了較好的基礎,而與表達、純化及結構測定相關的技術的發(fā)展與設備的改進也為這一過程自動化提供了良好的條件。此過程中的重要步驟,蛋白質的結構測定技術X 光衍射和核磁共振光譜法(NMR 11,近幾年也有了很多新的改進

9、,出現(xiàn)了很多新的功能完善的儀器,為生產線的順利完成提供了設備保障 。圖1結構基因組研究生產線2.1.2比較基因組學和模式生物體鑒定基因功能最有效的方法是觀察基因表達被阻斷或增加后在細胞和整體水平上所產生的表型變化12,這就需要建立一個有效的模式生物體(m odel organism。迄今為止已有多種生物被當作模型使用,如大腸桿菌、釀酒酵母、美麗線蟲、果蠅、小鼠等,但在研究人類疾病和哺乳動物發(fā)育時,小鼠顯得更有優(yōu)勢。所有生物都可以通過一株共同的進化樹而聯(lián)系在一起,因此研究一個生物可為其它生物提供有用的信息。人類基因組計劃(HG P已把比較基因組學(C om parative genomics作為

10、今后工作重點之一,預計到2005年完成小鼠的全基因組測序,同時逐漸從結構的比較轉向功能的比較13。2.1.3功能基因組與微點陣、S AGE技術功能基因組學(Functional genomics的研究通常被稱為后基因組學(P ostgenomics研究,它是利用結構基因組學提供的信息和產物,系統(tǒng)地研究基因功能,以高通量、大規(guī)模實驗方法及統(tǒng)計與計算機分析為特征14。高通量的基因表達分析方法需要借助新技術微點陣(micro array技術和基因表達系列分析(Serial analysis of gene expressionS AGE。微點陣技術是指將幾百甚至上萬個寡核苷酸或DNA密集排列在硅片、

11、玻璃片、聚丙烯等固相支持物上,作為探針。把要研究的樣品(稱為靶DNA標記后與微點陣進行雜交,用合適的檢測系統(tǒng)進行檢測。根據(jù)雜交信號強弱及探針位置和序列,確定靶DNA的表達情況以及突變和多態(tài)性的存在。根據(jù)制作方法的不同,微陣列技術可分為合成和點樣兩大系別。S AGE技術的主要理論依據(jù)有兩個:一個910堿基的短核苷酸序列標簽包含有足夠信息,能夠唯一確認一種轉錄物;如果能將9堿基的標簽集中于一個克隆中進行測序,并將得到的短序列核苷酸順序以連續(xù)的數(shù)據(jù)形式輸入計算機中進行處理,就能對數(shù)以千計的mRNA轉錄物進行分析。這種方法在癌組織基因的差異表達研究方面有獨到的優(yōu)點,有助于發(fā)現(xiàn)腫瘤特異基因。2.2功能基

12、因組學與誘變技術2.2.1定向誘變(targeted mutagenesis定向誘變是利用同源重組技術,使胚胎干細胞(Embry onic stemcell EScell內目的基因產生定點突變。這些突變可進一步用于基因敲除、轉基因動物、顯性負突變等研究。近幾年發(fā)展了許多構建靶結構的新方法,如釀酒酵母中微同源重組(micro hom olog ous re2combination15。2.2.2表型誘變(phenotype-driven mutagenesis定向誘變用于已知基因的突變,而表型誘變是用于未知基因。主要優(yōu)點是無需知道哪個基因以及這些基因的何種突變導致特定的表型或疾病16。用表型誘變

13、劑進行誘變后,可以用篩查整個基因組的辦法來尋找新的顯性或隱性突變。3.研究現(xiàn)狀3.1生物學數(shù)據(jù)庫的建設數(shù)據(jù)庫是生物信息學的主要內容,至今世界各國紛紛建立了生物信息數(shù)據(jù)庫17,其數(shù)量呈爆炸性增長,幾乎涉及了生命科學的各個研究領域。目前主要有美國國立衛(wèi)生研究院全國生物技術研究中心(NC Bl的G enBank(w w w.ncbi.nlm.nih,g ov;歐洲生物信息學研究所(E Bl的(E M BL(w w w.emblhei2 delberg.de數(shù)據(jù)庫;日本國立遺傳學研究所(NIG的DNA數(shù)據(jù)庫(DDB J(w w w.nig.ac.jp(瑞士生物信息學研究所(SI B的SWISSPROT

14、(w w w.expasy.ch/sprot2 top.html;美國Brookhaven國家實驗室的PDB(w w w. /pdb/;NC BI開發(fā)的E NTERZ系統(tǒng)綜合了上述各大數(shù)據(jù)庫的信息和ME D LI NE的文獻信息。目前我國在生物信息數(shù)據(jù)庫領域的主要任務是:實驗室數(shù)據(jù)信息化管理、數(shù)據(jù)庫標準化、數(shù)據(jù)庫共享與集成;建立基因信息的評估與檢測系統(tǒng);構建我國自己特殊需要的二級、三級數(shù)據(jù)庫和專業(yè)數(shù)據(jù)庫,并與國際常用數(shù)據(jù)庫有效連接和及時更新18。3.2新型生物信息學研究方法近年來,生物信息學家已經(jīng)取得了多項研究成果,確定了數(shù)千個基因的功能,其中包括搜索堿基對序列匹配的有效方法,

15、統(tǒng)計學工具,利用新的計算機工具組裝整個基因組等,但生物信息學的發(fā)展面臨新的挑戰(zhàn),迫切需要新的研究手段和研究方法。加利福尼亞大學能源系結構生物學和分子醫(yī)學實驗室的主任David Eisenberg暗示,新的生物信息學方法19,包括羅塞塔石和系統(tǒng)發(fā)生圖譜法,將“超越尋找氨基酸序列間相關性的傳統(tǒng)測序方法”?!傲_塞塔石”法:如果兩個蛋白來自于同一類型細胞,比如在酵母中,“它們融合為一個蛋白質單鏈,我們推測這兩個蛋白的功能是相同的,因為它們一直在同一個分子中,因此我們推測:假如在大腸桿菌中它們也能發(fā)生相互作用,那么這兩個信息為我們提供了關于此系統(tǒng)的相同信息?!盓isenberg補充說:“通過使用這兩種方

16、法或更多的方法,我們就能構建出交互蛋白質的網(wǎng)絡。”系統(tǒng)發(fā)生圖譜可以預測蛋白質與蛋白質之間的相互影響,編錄試驗的交互作用,但這兩種類型的信息必須被建立,預測和比較,而且評估和區(qū)分預測的良莠的統(tǒng)計方法需要精煉。系統(tǒng)發(fā)生圖譜使科學家能把某個蛋白放置在細胞功能的環(huán)境下加以研究。Eisenberg說:“我們先觀察某個蛋白質所在的已測序的所有基因組,然后我們觀察第二個蛋白質,它在同一個基因組位置出現(xiàn)。因此這個兩個蛋白的出現(xiàn)和不出現(xiàn)是一致的。我們推測這兩個蛋白的功能是共同的,所以它們同時出現(xiàn)或不出現(xiàn)的原因是它們一起工作,因此我們就能推測出許多相關性?!?.未來發(fā)展前景第三次技術革命里有這樣的描述:“一場與工

17、業(yè)革命和以計算機為基礎的革命有相同影響力的變化正在開始。下一個偉大時代將是基因組革命時代,它現(xiàn)在處于初期階段。”基因組學的發(fā)展已經(jīng)進入后基因組研究階段20,致力于蛋白質功能研究的蛋白質組學和功能蛋白質組學正在蓬勃發(fā)展,在生物信息學發(fā)展的帶動下,我們必定能夠揭示各種生命現(xiàn)象的奧秘,并帶動多個學科的跨越式發(fā)展。生物信息學的發(fā)展將對分子生物學、藥物設計、工作流管理和醫(yī)療成像等領域產生巨大的影響,極有可能引發(fā)新的產業(yè)革命。此外,生物信息學所倡導的全球范圍的資源共享也將對整個自然科學乃至人類社會的發(fā)展產生深遠的影響。有理由相信,今日生物學數(shù)據(jù)的巨大積累將導致重大生物學規(guī)律的發(fā)現(xiàn)21,生物信息學的發(fā)展在國

18、內、外基本上都處在起步階段,因此,這是我國生物學趕超世界先進水平的一個百年一遇的極好機會。參考文獻1陳潤生.生物信息學.生物物理學報,1999;15(1:513 2北京生物技術和新醫(yī)藥產業(yè)促進中心.世紀之交的新科學:生物信息學.生物技術通報,1999;(日:49543楊福愉.展望21世紀的分子生物學.生物物理學報, 1999;15(1:154MarchiE,鐘南.基因組學在基因組計劃中的作用.生命的化學,1999;(1:9105胡德華,方平.基因組數(shù)據(jù)的處理.生物技術通訊,2000;11(1:68716Wasinger V C.C ordwell S J.Cerpa P olja K A.et

19、 al.Progress with gene product map ping g ofthe,M ollicutes:Mycoplasma gen2 italium.E lectro phoresis.1995;16(7:109010947胡志遠,賀福初.蛋白質組研究進展.生物化學與生物物理進展,1999;26(3:2022048C ordwell S J,Bassea L D J,Bje L.Lqvist B,et al.Characterisa2 tion of basic proteins from S piroplasma melliferum usingnovel imm obil

20、isd pH gradients.E lectrophoresis,1997;18(8:1393 13989Humphery Smith L,C ordwellS J,Black stock WP.Proteom ome re2 search:complementarity and limitation swith respecttothe RNA and DNA w orlds.E lectrophoresis,1997;18(8:1217124210Heinemann.S tructures by numbers,Nature,2000;408(6809: 13013211Enrique

21、A,Peter K.Automationof X-ray crystal ography.Na2 ture S truct.Biol.N ovember2000;7:97397712W oychik R P,K lebig M L,Justice M J,et al.Functional ge2 nomics in the post genomeera.MutRes.1998;400(12;3 1413C ollins.F.S,Patrinos.A,Jordan.E,et al.Newg oals for the U.S,human genome project1998-2003.Science,1998;282 (5389:68268914Hieter P,Boguski M.Functional genomics:its all h

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論