版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 人類基因組計劃和生物信息學徐新來安道昌王芷3李青付紅波(中國生物工程中心北京100081 (3中國科技信息研究所北京100038提要:介紹人類基因組計劃和生物信息學, 闡述了兩者的關系, 提出了在人類基因組計劃中發(fā)展生物信息學的策略。一、(Genom e P ro 2ject , H GP 1990年提出實施的一項大科學計劃, 在世界各國引起了很大反響。計劃的提出旨在對人類基因組3×109個脫氧核苷酸對進行作圖和測序, 進而解讀和破譯生老病死以及語言、記憶和疾病發(fā)生的遺傳信息。而生物信息學是集生物學、數(shù)學、信息學、計算機科學一體化的一門新的學科。早在H GP 提出時就預示到生物信息
2、學的重要性, 當時就成立了有42位著名專家組成的生物信息學任務組。隨著人類基因組計劃的進展, 基因組的數(shù)據(jù)和信息大量, 迅速地增加, 信息的收集、儲存、分發(fā)、分析的管理越來越顯得緊迫和重要。利用數(shù)學模式和計算機處理數(shù)據(jù)的功能來處理和分析大量增加的人類基因組信息的結果, 使人類基因組計劃和生物信息學緊緊地結合起來了, 而且隨著兩者的緊密結合和互相滲透, 人類基因組計劃的前進步伐會大大加快, 從而提前完成計劃, 為人類造福。二、從人類基因組計劃看生物信息學美國在1990年率先提出H GP , 計劃用15年時間, 投入30億美元, 完成人類全部24條染色體的3×109脫氧核苷酸對(bp 的
3、序列測定, 主要任務包括作圖(遺傳圖譜、物理圖譜的建立 、測序和基因識別。其中還包括模式生物(如大腸桿菌、酵母、線蟲、小鼠等 基因, 。、物理圖譜的建立是測序的必要條件; 遺傳圖譜是根據(jù)遺傳連鎖標志之間的重組頻率來確定它們的距離, 遺傳圖譜的建立為基因識別和完成基因定位創(chuàng)造了條件。物理圖譜是以核苷酸的長度為單位繪制而成, 詳細描述染色體上界標間的距離, 主要是編碼蛋白質的外顯子和排序DNA 克隆庫組成, 這些DNA 分子克隆庫相互交錯、重疊。人類基因組全部DNA 序列的測定是H GP 的核心部分; 隨著遺傳和物理圖譜的完成和即將完成, 測序就成為今后重中之重的工作。而大規(guī)模測序技術的改進及分析
4、大片段DNA 序列的生物信息技術的進步, 對完成人類基因組全部核苷酸順序測定起著決定性作用。測序的完成依賴物理圖譜上的排序的DNA 片段分子克隆, 這些分子圖譜通常是在較短的時間由一個研究組從單一分離群體中獲得的, 為了充分利用所有資料信息, 要對其全部標記的同時進行分析, 這種分析涉及十分龐雜和巨大的計算, 手工無法完成。基因識別是H GP 的重要內容之一; 目的是要識別全部人類的基因, 即基因組在生命活動中發(fā)生轉錄表達的DNA 片段, 并對其結構進行研究。目前常采用的有二種方法:一是從基因組順序中識別那些轉錄表達的DNA 片段; 二是從c D 2NA 文庫中挑取并克隆。兩種方法都必須依靠生
5、物信息學的幫助即信息系統(tǒng)的建立; 前者需要對基因組進行分析, 后者要對基因文庫進行分析, 甚至還要進行分類分型, 建立二級庫, 才能有效地挑取到所需要的DNA 分子克隆。模式生物基因組在H GP 中占有重要的位置; 模06高技術通訊1998181 式生物基因組結構相對比較簡單、單位DNA 片段上基因的密度高, 易于基因的識別。從進化角度講, 動物的許多基因有很大的同源性, 對模式生物基因的分析有助于人類基因的結構與功能的闡明。在這種背景下生物信息學的重要性便在基因組計劃提出后真正顯示出來了。H GP 的提出和實施, 實驗的數(shù)據(jù)和信息急劇大量的增加, 信息的管理和分析成為一項重要的研究內容。生物
6、信息學以基因組信息學為核心, 收集、儲存、, 和分析m RNA 的信息, , 發(fā)現(xiàn)新的基因, 并對基因結構和功能進行研究。信息的收集、儲存、分發(fā)、分析是基因組計劃最初提出時確定的任務, 計劃實施后, 每天都有上萬的數(shù)據(jù), 數(shù)據(jù)的取舍非常重要, 數(shù)據(jù)的標準化和檢驗成為信息處理的第一步工作。同時, 數(shù)據(jù)必須能提供給廣大的科研工作者使用, 計算機管理要提供一個工作界面, 才能有效地利用信息。另外, 這些數(shù)據(jù)還應可視化, 方便用戶使用。生物信息學的研究更重要的作用是將原始的信息庫進行分析、分類, 按照需要建立具有特殊功能的二級數(shù)據(jù)庫。二級數(shù)據(jù)庫是進一步研究開發(fā)基因組的重要手段, 通常是封閉的, 不對外
7、開放, 僅供內部使用。隨著基因組研究的發(fā)展, 向功能基因組研究轉化, 解讀生物的遺傳密碼成為生物信息學的又一項重要的任務。生物信息學另一項重要任務是分析工具的研究開發(fā), 如序列相似性比較的軟件。分析軟件是有效利用基因組信息的有利工具, 同時分析軟件也是構建二級、三級數(shù)據(jù)庫的條件和手段。分析軟件還可將不同性質的數(shù)據(jù)庫結合一起, 如將基因組序列數(shù)據(jù)和蛋白質數(shù)據(jù)結合計算, 可以推斷結構和功能的關系, 從而成為一種發(fā)現(xiàn)新基因的較為快捷的方法, 有利解讀全部生物遺傳密碼。生物信息學發(fā)展很快, 各種數(shù)據(jù)庫不斷涌現(xiàn), 數(shù)據(jù)庫各有不同的特色。美國、日本、歐盟、加拿大等國都有基因組數(shù)據(jù)庫, 有的是國際性的, 有
8、的是本國的, 有的公開, 有的不公開。其中比較有代表性的數(shù)據(jù)庫有:美國的GenB ank , 歐盟的E M BL , 日本的DDBJ 和美國的N CB I 等。數(shù)據(jù)庫的內容十分豐富, 有表達序列標記數(shù)據(jù)庫(dbEST , 有序列標記位點數(shù)據(jù)庫(dbST S , 有蛋白質序列數(shù)據(jù)庫、蛋白質序列功能位點數(shù)據(jù)庫、結, ank , 該庫已有, 近5萬條蛋白。三、生物信息學發(fā)展現(xiàn)狀隨著信息學大環(huán)境的改善, 如信息高速公路、國際互聯(lián)網(wǎng)的發(fā)展, 生物信息學發(fā)展迅速。美國、日本及歐洲各國的生物信息學已相繼在In ternet 上建立了各自的網(wǎng)絡節(jié)點, 進行管理大型數(shù)據(jù)庫, 為研究人員提供研究數(shù)據(jù)的分析、處理、
9、采集、交換的服務。國際互聯(lián)網(wǎng)所到之處, 都有各種研究機構的聯(lián)網(wǎng)、數(shù)據(jù)庫的建立, 開展生物信息學研究。各種數(shù)據(jù)庫各具特色:GenB ank 、E M BL 、DDBJ 是三大核苷酸蛋白質數(shù)據(jù)庫; GDB 數(shù)據(jù)庫主要收集遺傳學制圖的資料; CEPH 的數(shù)據(jù)庫收集YA C con tig ; Genethon 、CHL C 儲存遺傳學標記系列; W h iethead 研究所的數(shù)據(jù)庫可了解全部18000個ST S 及聯(lián)系作圖的信息; 另外還有突變序列的數(shù)據(jù)庫在建立之中。在各類數(shù)據(jù)庫建立的同時, 數(shù)據(jù)庫設計中出現(xiàn)了集成化趨勢, 集成化包括:各類數(shù)據(jù)的集成、數(shù)據(jù)庫與數(shù)據(jù)分析軟件的整合。各種數(shù)據(jù)庫分析、測
10、序應用軟件包也被開發(fā)出來。除了數(shù)據(jù)庫、數(shù)據(jù)分析軟件的發(fā)展, 生物信息學中比較基因組學的發(fā)展也較為突出。其中河豚、鼠、豬、牛和馬的基因組與人基因組的比較研究, 秀麗隱桿線蟲與人基因組的比較研究、酵母與人基因組的比較研究, 支原體與嗜血流感桿菌基因組的比較研究, 都取得了成果, 從比較中分離到一些人類遺傳病的候選基16高技術通訊1998181 因, 鑒定了一些新克隆的基因, 為人類基因組的分析提供了有益的數(shù)據(jù)。隨著計算機技術的發(fā)展和滲透, 生物信息學在人類基因組中大規(guī)模測序的自動化控制、測序結果分析處理、序列數(shù)據(jù)的計算機管理、各類遺傳圖譜、物理圖譜的繪制、研究數(shù)據(jù)的網(wǎng)絡獲取、分析和交換, 以數(shù)據(jù)分
11、析的結果輔助基因組研究等都發(fā)揮著不可替代的功能, 顯示出越來越重要的作用。四、科學重要的課題, 為全世界所關注。由于其重大的科學意義和潛在的經(jīng)濟價值, 積極開展有關的研究勢在必行。人類基因組計劃啟動時, 生物信息學技術就已成為發(fā)展的重點之一, 目前有關基因序列、圖譜的數(shù)據(jù)信息的大量積累, 使生物信息學研究在人類基因組研究中的重要性越來越突出, 在今后的人類基因研究中, 生物信息學是一個信息庫, 一種高層次研究的工具。如果生物信息學研究發(fā)展滯后, 將意味著失去信息, 失去高層次、高水平研究的基礎。中國1993年開始參與H GP 研究, 但由于資金技術等各種原因, 其研究水平與國際同行尚有較大差距
12、。我國雖然早在1993年中國人類基因組計劃中列入了生物信息學的內容, 但真正起步可能是在19951996年, 基礎比較弱, 尚處于引進國外已有數(shù)據(jù)庫, 為國內研究人員提供服務的階段。中國的人類基因組研究和生物信息學都處于一個不容樂觀的現(xiàn)狀。如何在現(xiàn)有的資金、技術條件下, 找到1個或2個突破口, 改變落后現(xiàn)狀, 在國際同類研究領域爭得一席之地, 我們認為應該在策略上作些調整。11在人類基因組研究上, 找功能基因。利用我國豐富的遺傳資源和廣泛的疾病譜系, 從“c DNA ”入手, 盡快地克隆一批新基因。“c DNA ”又稱互補DNA , 只占整個基因組DNA 很小的一部分, 是編碼蛋白質的, 即功
13、能基因, , 才可以完成, 我, , 利用我們的優(yōu)勢, 。21在引進國外數(shù)據(jù)庫的同時, 建立中國人基因資源數(shù)據(jù)庫。生物信息學對推進基因組的工作十分重要, 充分利用國際基因信息庫的信息, 建立國際合作關系, 在基因組研究工作的基礎上, 組建自己的生物信息網(wǎng)絡, 建設基因資源、基因結構的數(shù)據(jù)庫。同時, 進行分析軟件的開發(fā)研究, 構建特殊需要的二級、三級數(shù)據(jù)庫, 從已知的c DNA 文庫中, 進行測序和功能推測研究, 發(fā)現(xiàn)新基因, 才有可能在國際人類基因組計劃中占有一席之地。31人才培養(yǎng)。當務之急是對現(xiàn)有從事基因研究的科技人員進行生物信息學的培訓。只有有了中國自己的一支專門從事生物信息學研究的科研隊
14、伍, 才能在中國人類基因組研究中做出國際領先水平的工作。參考文獻1劉春宇, 夏家輝1國外醫(yī)學遺傳學分冊, 1996, 19(5 :2622李衛(wèi)東, 王明榮1國外醫(yī)學遺傳學分冊, 1996, 19(5 :2643丁達夫, 梁衛(wèi)平, 陳潔1生物信息學, 1998, 50, 2(3 :20(上接第60頁10N akano T , FujiM , N agano K et al . N ipp on S teel T echnical R ep ort , 1987, 34(7 :2111M c D avid R M , T hom as B G . M etallu rg ical and M aterials T ransactions B , 1996, 27B :67212Ho B . M aster s thesis , U niversity of Illi 2no is at U rbana 2Champaign , U rbana , I L , 199113M c D avid R M . M as
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 活動承辦合同模板
- 合同示范文本庫
- 變壓器承包合同
- 企業(yè)員工勞動合同范本
- 連帶責任擔保借款合同范本
- 2025關于土地轉讓合同范本
- 定制家具合同
- 知識產(chǎn)權許可使用及轉讓合同范本
- 2025合同模板貨車轉讓合同合同范本
- 羽絨服購銷合同
- 4-熔化焊與熱切割作業(yè)基礎知識(一)
- 2023年200MW儲能電站儲能系統(tǒng)設計方案
- 個人安全與社會責任的基本知識概述
- 建筑裝飾工程計量與計價試題一及答案
- 簡易勞務合同電子版
- 明代文學緒論
- 通用稅務自查情況說明報告(7篇)
- 體育賽事的策劃、組織與實施 體育賽事利益相關者
- 分析化學(高職)PPT完整版全套教學課件
- 晚熟的人(莫言諾獎后首部作品)
- m拱頂儲罐設計計算書
評論
0/150
提交評論