




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、生生 物物 信信 息息 學(xué)學(xué)Bioinformatics第第2講講 生物信息學(xué)研究內(nèi)容生物信息學(xué)研究內(nèi)容生 物 信 息 學(xué) 主要介紹的內(nèi)容:主要介紹的內(nèi)容: 什么是生物信息學(xué)?什么是生物信息學(xué)? 國內(nèi)外生物信息學(xué)的研究歷史和現(xiàn)狀。國內(nèi)外生物信息學(xué)的研究歷史和現(xiàn)狀。 生物信息學(xué)的研究內(nèi)容和科學(xué)目標。生物信息學(xué)的研究內(nèi)容和科學(xué)目標。 分別解讀生物分子的三大核心數(shù)據(jù)庫:分別解讀生物分子的三大核心數(shù)據(jù)庫:GenBank核酸序列數(shù)據(jù)庫、核酸序列數(shù)據(jù)庫、SWISS-PORT 蛋白質(zhì)序列數(shù)據(jù)庫、蛋白質(zhì)序列數(shù)據(jù)庫、PDF生物大分子結(jié)構(gòu)數(shù)據(jù)生物大分子結(jié)構(gòu)數(shù)據(jù)庫。庫。 介紹國內(nèi)外有關(guān)生物信息學(xué)的網(wǎng)站和網(wǎng)址。介紹國
2、內(nèi)外有關(guān)生物信息學(xué)的網(wǎng)站和網(wǎng)址。生物信息學(xué)生物信息學(xué) 在上找有關(guān)生物信息學(xué)的網(wǎng)站或網(wǎng)頁 BiologyProteinPhenotypeDNA(Genotype)基因結(jié)構(gòu)基因結(jié)構(gòu) The 4 basescNNCCCCCCCCCNNNNNHooHHHHHHHHAdenineThyminecNNCCCCCCCCNNNNHoHHoNNHHHHHGuanineCytosineNote: this is flat!Uracil replaces Tin RNAPurine ringPyrimidine ring三三 研究內(nèi)容研究內(nèi)容 生物信息學(xué)與計算生物學(xué)或生物計算有生物信息學(xué)與計算生物學(xué)或生物計算有著密
3、切的關(guān)系,但又不盡相同著密切的關(guān)系,但又不盡相同. . 目前歸入生物信息學(xué)研究領(lǐng)域的大致有目前歸入生物信息學(xué)研究領(lǐng)域的大致有以下七個方面:以下七個方面:BioinfomaticsBioinfomatics七個方面研究內(nèi)容七個方面研究內(nèi)容1.1. 建立和管理各種生物數(shù)據(jù)庫建立和管理各種生物數(shù)據(jù)庫2. 生物信息數(shù)據(jù)庫使用生物信息數(shù)據(jù)庫使用3. 生物信息學(xué)中的數(shù)學(xué)模式和算法研究生物信息學(xué)中的數(shù)學(xué)模式和算法研究4.4. 數(shù)據(jù)庫接口和檢索工具的研制數(shù)據(jù)庫接口和檢索工具的研制5.5. HGPHGP的實施,對信息采集和處理提出的要求的實施,對信息采集和處理提出的要求6.6. 生物信息學(xué)生物信息學(xué)最重要的任務(wù)
4、最重要的任務(wù),是從大量數(shù)據(jù)中,是從大量數(shù)據(jù)中提取新知識提取新知識7.7. DNADNA芯片和微陣列的發(fā)展芯片和微陣列的發(fā)展1 1 建立和管理各種生物數(shù)據(jù)庫建立和管理各種生物數(shù)據(jù)庫 各種生物數(shù)據(jù)庫的建立和管理。如核酸各種生物數(shù)據(jù)庫的建立和管理。如核酸序列數(shù)據(jù)庫、蛋白質(zhì)數(shù)據(jù)庫、各種專業(yè)序列數(shù)據(jù)庫、蛋白質(zhì)數(shù)據(jù)庫、各種專業(yè)的數(shù)據(jù)庫等。的數(shù)據(jù)庫等。 這是一切生物信息學(xué)工作的基礎(chǔ),通常這是一切生物信息學(xué)工作的基礎(chǔ),通常要有計算機科學(xué)背景的專業(yè)人員與生物要有計算機科學(xué)背景的專業(yè)人員與生物學(xué)家密切合作。學(xué)家密切合作。2、生物信息數(shù)據(jù)庫使用、生物信息數(shù)據(jù)庫使用 近些年來隨著快速序列測定、基因重組、多維近些年來隨
5、著快速序列測定、基因重組、多維核磁共振等技術(shù)的應(yīng)用,基因組與蛋白質(zhì)的實核磁共振等技術(shù)的應(yīng)用,基因組與蛋白質(zhì)的實驗數(shù)據(jù)呈爆炸性趨勢增長驗數(shù)據(jù)呈爆炸性趨勢增長;建立數(shù)據(jù)庫再結(jié)合有關(guān)的分析軟件建立數(shù)據(jù)庫再結(jié)合有關(guān)的分析軟件使大規(guī)模數(shù)據(jù)使大規(guī)模數(shù)據(jù)的貯存、處理和分析成為可能,并已發(fā)展成為的貯存、處理和分析成為可能,并已發(fā)展成為包括基因組信息與蛋白質(zhì)結(jié)構(gòu)模擬在內(nèi)的生物包括基因組信息與蛋白質(zhì)結(jié)構(gòu)模擬在內(nèi)的生物信息學(xué)研究的重要基礎(chǔ)。信息學(xué)研究的重要基礎(chǔ)。核酸序列數(shù)據(jù)庫核酸序列數(shù)據(jù)庫 GenbankGenbank,美國國家生物技術(shù)信息中心的數(shù)據(jù),美國國家生物技術(shù)信息中心的數(shù)據(jù)庫(庫( http:/ncbi.n
6、)。)。 EMBLEMBL,建立在歐洲分子生物實驗室的數(shù)據(jù)庫,建立在歐洲分子生物實驗室的數(shù)據(jù)庫 (http:/www.embl-heidelberg.de)(http:/www.embl-heidelberg.de)。 DDBJDDBJ,是是DNA Data Bank of JapanDNA Data Bank of Japan的簡稱,又的簡稱,又叫叫日本的日本的DNADNA數(shù)據(jù)庫銀行(數(shù)據(jù)庫銀行(available at available at http:/www.nig.ac.jp )http:/www.nig.ac.jp
7、)。GenbankGenbank美國國家生物技術(shù)信息中心的數(shù)據(jù)庫原中山醫(yī)科大學(xué)的網(wǎng)頁有鏈接:http:/ 真菌如釀酒酵母基因組數(shù)據(jù)庫(真菌如釀酒酵母基因組數(shù)據(jù)庫(SGD)/Saccharomyces/ 擬南芥數(shù)據(jù)庫(擬南芥數(shù)據(jù)庫(AtDB)(/Arabidopsis/) 線蟲綜合數(shù)據(jù)庫(線蟲綜合數(shù)據(jù)庫(ACEDB)ftp:/sanger.ac.uk(/pub/acedb) (自由下載自由下載,建立二次數(shù)據(jù)庫建立二次數(shù)據(jù)庫) 在線人類孟德爾遺傳數(shù)據(jù)庫在線人類孟德爾遺傳數(shù)據(jù)庫(Onl
8、ine Mendelian Inheritance in Man,OMIM) /omim/其他重要生物數(shù)據(jù)庫其他重要生物數(shù)據(jù)庫 魚類的魚類的 斑馬魚斑馬魚 / 昆蟲類的果蠅昆蟲類的果蠅(Drosophila melanogaster, fruitfly)/ 脊椎動物如小鼠脊椎動物如小鼠(Mus musculus) /genome/guide/mouse/ 細菌如大腸桿菌細菌如大腸桿菌(http:/www.genetics.wi
9、/pub/sequence/) 原生動物如人類一種寄生性的原蟲原生動物如人類一種寄生性的原蟲(Plasmodium falciparum):http:/PlasmoDB.org/三維結(jié)構(gòu)數(shù)據(jù)庫三維結(jié)構(gòu)數(shù)據(jù)庫 PDB( Protein Data Bank , http:/ )等。)等。 與蛋白質(zhì)結(jié)構(gòu)有關(guān)的數(shù)據(jù)庫還有:與蛋白質(zhì)結(jié)構(gòu)有關(guān)的數(shù)據(jù)庫還有: SCOP(available at http:/ )等。)等。80-99年年P(guān)rotein Data Bank /pdb/index.html Helix-turn-helix motif of prot
10、ein binding to DNA結(jié) 合結(jié) 合 D N A 的 蛋 白 質(zhì) 螺 旋 結(jié) 構(gòu) 基 序的 蛋 白 質(zhì) 螺 旋 結(jié) 構(gòu) 基 序 Motif數(shù)據(jù)庫數(shù)據(jù)庫-PROSITE PROSITE(/prosite/)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù) 生物信息數(shù)據(jù)庫的主要服務(wù)生物信息數(shù)據(jù)庫的主要服務(wù)借助特定的算法模型提供同源性分析是目借助特定的算法模型提供同源性分析是目前各種生物信息數(shù)據(jù)庫的最重要內(nèi)容之前各種生物信息數(shù)據(jù)庫的最重要內(nèi)容之一。一。分子生物學(xué)的中心法則分子生物學(xué)的中心法則DNAmRNA結(jié)構(gòu)結(jié)構(gòu)翻譯翻譯轉(zhuǎn)錄轉(zhuǎn)錄復(fù)制復(fù)制蛋白質(zhì)蛋白質(zhì)/酶酶cDNADNA
11、功能功能反轉(zhuǎn)錄反轉(zhuǎn)錄相互作用相互作用折疊折疊3、生物信息學(xué)中的數(shù)學(xué)模式和重要算法研究 迄今已有相當多的數(shù)學(xué)方法應(yīng)用于生物信息學(xué)迄今已有相當多的數(shù)學(xué)方法應(yīng)用于生物信息學(xué)的研究。而且一種算法本身就是一門學(xué)問,例的研究。而且一種算法本身就是一門學(xué)問,例如:如: 機器學(xué)習(xí)法機器學(xué)習(xí)法 人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò) 分形理論分形理論 密碼學(xué)密碼學(xué) 全息論全息論 高維分布的統(tǒng)計方法高維分布的統(tǒng)計方法生物信息學(xué)中的重要算法生物信息學(xué)中的重要算法-聚類分析聚類分析 生物信息學(xué)問題許多可歸為聚類問題。生物信息學(xué)問題許多可歸為聚類問題。 聚類分析:聚類是宏觀與微觀生物學(xué)研聚類分析:聚類是宏觀與微觀生物學(xué)研究中最常用的
12、一種數(shù)學(xué)方法,它的基本究中最常用的一種數(shù)學(xué)方法,它的基本目的是將目的是將n個樣本劃分為個樣本劃分為m個類,從而個類,從而使同類樣本較為相似而不同類間樣本差使同類樣本較為相似而不同類間樣本差異較大。異較大。 其中支撐矢量機算法可從網(wǎng)上學(xué)習(xí):其中支撐矢量機算法可從網(wǎng)上學(xué)習(xí):/ 尋找轉(zhuǎn)錄因子的結(jié)合位點尋找轉(zhuǎn)錄因子的結(jié)合位點 生物信息學(xué)中的重要算法生物信息學(xué)中的重要算法 遺傳算法:遺傳算法的提出,本身就是遺傳算法:遺傳算法的提出,本身就是借鑒生物界中的適者生存、優(yōu)勝劣汰的借鑒生物界中的適者生存、優(yōu)勝劣汰的遺傳機制所提出來的隨機化搜索方法,遺傳機制
13、所提出來的隨機化搜索方法,其最主要的特點就是面向結(jié)構(gòu)對象、不其最主要的特點就是面向結(jié)構(gòu)對象、不受求導(dǎo)和函數(shù)連續(xù)性的限定、具有內(nèi)在受求導(dǎo)和函數(shù)連續(xù)性的限定、具有內(nèi)在的隱并行性和良好的全局尋優(yōu)能力。的隱并行性和良好的全局尋優(yōu)能力。生 物 信 息 學(xué) 中 的 重 要 算 法生 物 信 息 學(xué) 中 的 重 要 算 法-遺傳算法遺傳算法過去過去20多年的發(fā)展,已使得遺傳算法成為多年的發(fā)展,已使得遺傳算法成為現(xiàn)代智能計算中的關(guān)鍵技術(shù)之一,并已現(xiàn)代智能計算中的關(guān)鍵技術(shù)之一,并已應(yīng)用于生物信息學(xué)的研究:應(yīng)用于生物信息學(xué)的研究: 基于蛋白質(zhì)主鏈結(jié)構(gòu)的側(cè)鏈構(gòu)象計算基于蛋白質(zhì)主鏈結(jié)構(gòu)的側(cè)鏈構(gòu)象計算 蛋白質(zhì)折疊的算法
14、模型與模擬蛋白質(zhì)折疊的算法模型與模擬 圖像匹配中的遺傳算法圖像匹配中的遺傳算法 結(jié)構(gòu)圖的同態(tài)研究結(jié)構(gòu)圖的同態(tài)研究目前較流行的數(shù)學(xué)方法和算法(目前較流行的數(shù)學(xué)方法和算法(1) 神經(jīng)網(wǎng)絡(luò)(神經(jīng)網(wǎng)絡(luò)(Neural Networks) 1982年,神經(jīng)網(wǎng)絡(luò)首次被應(yīng)用到生物學(xué)的研究年,神經(jīng)網(wǎng)絡(luò)首次被應(yīng)用到生物學(xué)的研究中來,接著中來,接著Stormo等人應(yīng)用類似的算法在預(yù)測等人應(yīng)用類似的算法在預(yù)測大腸桿菌體內(nèi)的一些蛋白質(zhì)翻譯的起始部位取大腸桿菌體內(nèi)的一些蛋白質(zhì)翻譯的起始部位取得了成功。得了成功。1988年,隨著年,隨著Qian and Sejnowski發(fā)表的一篇關(guān)發(fā)表的一篇關(guān)于蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的文章,
15、神經(jīng)網(wǎng)絡(luò)的算于蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的文章,神經(jīng)網(wǎng)絡(luò)的算法已成為蛋白質(zhì)二級結(jié)構(gòu)分析預(yù)測的主流算法。法已成為蛋白質(zhì)二級結(jié)構(gòu)分析預(yù)測的主流算法。另外,神經(jīng)網(wǎng)絡(luò)在預(yù)測信號肽,研究遺傳密碼的另外,神經(jīng)網(wǎng)絡(luò)在預(yù)測信號肽,研究遺傳密碼的結(jié)構(gòu)和起源等方面也有較多應(yīng)用。結(jié)構(gòu)和起源等方面也有較多應(yīng)用。目前較流行的數(shù)學(xué)方法和算法(目前較流行的數(shù)學(xué)方法和算法(2) Threading方法方法Threading方法或稱折疊類型的識別方法。方法或稱折疊類型的識別方法?;舅枷胧牵侯A(yù)測的蛋白的折疊類型與某基本思想是:預(yù)測的蛋白的折疊類型與某一已知結(jié)構(gòu)的蛋白的折疊類型相同,這一已知結(jié)構(gòu)的蛋白的折疊類型相同,這樣蛋白質(zhì)結(jié)構(gòu)預(yù)測問
16、題就轉(zhuǎn)變?yōu)樵谝阎獦拥鞍踪|(zhì)結(jié)構(gòu)預(yù)測問題就轉(zhuǎn)變?yōu)樵谝阎臻g結(jié)構(gòu)的蛋白質(zhì)中,選取一種最有可空間結(jié)構(gòu)的蛋白質(zhì)中,選取一種最有可能的折疊類型,從而大大減小預(yù)測蛋白能的折疊類型,從而大大減小預(yù)測蛋白質(zhì)結(jié)構(gòu)的難度。質(zhì)結(jié)構(gòu)的難度。4 4 數(shù)據(jù)庫接口和檢索工具的研制數(shù)據(jù)庫接口和檢索工具的研制 數(shù)據(jù)庫的內(nèi)容來自萬千生物學(xué)者的日積數(shù)據(jù)庫的內(nèi)容來自萬千生物學(xué)者的日積月累,最終又為生物學(xué)者們所用。但不月累,最終又為生物學(xué)者們所用。但不能要求一般生物學(xué)工作者具有高深的計能要求一般生物學(xué)工作者具有高深的計算機和網(wǎng)絡(luò)知識,因此,必須發(fā)展查詢算機和網(wǎng)絡(luò)知識,因此,必須發(fā)展查詢數(shù)據(jù)庫和向庫里提供數(shù)據(jù)的方便接口。數(shù)據(jù)庫和向庫里提供
17、數(shù)據(jù)的方便接口。這是專業(yè)人員才能勝任的工作,通常在這是專業(yè)人員才能勝任的工作,通常在生物信息中心里進行。生物信息中心里進行。5 HGP5 HGP的實施,對信息采集和處的實施,對信息采集和處理提出的要求理提出的要求 人類基因組計劃人類基因組計劃(HGP)(HGP)的實施,配合大規(guī)的實施,配合大規(guī)模的模的DNADNA自動測序,對信息的采集和處理自動測序,對信息的采集和處理提出了空前的要求。從各種圖譜的分析,提出了空前的要求。從各種圖譜的分析,大量序列片段的拼接組裝,尋找基因和大量序列片段的拼接組裝,尋找基因和預(yù)測結(jié)構(gòu)與功能,到數(shù)據(jù)和研究結(jié)果的預(yù)測結(jié)構(gòu)與功能,到數(shù)據(jù)和研究結(jié)果的視像化,無不需要高效率
18、的算法和程序。視像化,無不需要高效率的算法和程序。 因此,研究新算法、發(fā)展方便適用的程因此,研究新算法、發(fā)展方便適用的程序,是生物信息學(xué)的日常任務(wù)。序,是生物信息學(xué)的日常任務(wù)。與與HGPHGP相關(guān)研究的幾個方面表現(xiàn):相關(guān)研究的幾個方面表現(xiàn): 由于當前生物信息學(xué)發(fā)展的主要推動力由于當前生物信息學(xué)發(fā)展的主要推動力來自來自HGPHGP,所以生物信息學(xué)與,所以生物信息學(xué)與HGPHGP的關(guān)系的關(guān)系就顯得更為密切,其與就顯得更為密切,其與HGPHGP相關(guān)的研究主相關(guān)的研究主要表現(xiàn)在如下幾個方面:要表現(xiàn)在如下幾個方面:1 1)高度自動化的實驗數(shù)據(jù)的獲得、加工)高度自動化的實驗數(shù)據(jù)的獲得、加工和整理和整理 如
19、何將實驗室中得到的生物學(xué)信息轉(zhuǎn)化如何將實驗室中得到的生物學(xué)信息轉(zhuǎn)化為計算機能夠處理的數(shù)字信息,是生物為計算機能夠處理的數(shù)字信息,是生物學(xué)的一個重要課題。學(xué)的一個重要課題。 體現(xiàn)在各種自動化分子生物學(xué)儀器應(yīng)用體現(xiàn)在各種自動化分子生物學(xué)儀器應(yīng)用上,如上,如DNADNA測序儀,測序儀,PCRPCR儀等。這類儀器儀等。這類儀器將實驗所得的物理化學(xué)信號轉(zhuǎn)化為數(shù)字將實驗所得的物理化學(xué)信號轉(zhuǎn)化為數(shù)字信息,并對其作簡單分析,再將分析結(jié)信息,并對其作簡單分析,再將分析結(jié)果用于實驗條件的控制,完成高度自動果用于實驗條件的控制,完成高度自動化的實驗過程。化的實驗過程。2 2)序列片段的拼接)序列片段的拼接 目前目前
20、DNADNA自動測序儀每個反應(yīng)只能測序自動測序儀每個反應(yīng)只能測序500bp500bp左右。左右。如何將這些序列片段拼接成完整的如何將這些序列片段拼接成完整的DNADNA順序就成為順序就成為接下來接下來 的一個重要工作。的一個重要工作。 傳統(tǒng)的測序技術(shù)通常將克隆進行亞克隆并對亞克隆傳統(tǒng)的測序技術(shù)通常將克隆進行亞克隆并對亞克隆進行排序。這些工作需要大量的人力物力。進行排序。這些工作需要大量的人力物力。 現(xiàn)在生物信息學(xué)提供了自動而高速地拼接序列的算現(xiàn)在生物信息學(xué)提供了自動而高速地拼接序列的算法,不僅避免了亞克隆排序所需的大量繁瑣的工作,法,不僅避免了亞克隆排序所需的大量繁瑣的工作,還還能能使序列具有
21、一定的冗余性(使序列具有一定的冗余性(redundancyredundancy,即一,即一定數(shù)量的重復(fù))以保證序列中每個堿基的準確性。定數(shù)量的重復(fù))以保證序列中每個堿基的準確性。3 3)基因區(qū)域的預(yù)測)基因區(qū)域的預(yù)測 在完成序列的拼接后,我們得到的是很長的在完成序列的拼接后,我們得到的是很長的DNADNA序序列,甚至可能是整個基因組的序列。這些序列中包列,甚至可能是整個基因組的序列。這些序列中包含著許多未知的基因,下一步就是將基因區(qū)域從這含著許多未知的基因,下一步就是將基因區(qū)域從這些長序列中找出來。些長序列中找出來。 所謂基因區(qū)域的預(yù)測,一般是指預(yù)測所謂基因區(qū)域的預(yù)測,一般是指預(yù)測DNADNA
22、順序中編順序中編碼蛋白質(zhì)的部分,即外顯子部分。不過目前基因區(qū)碼蛋白質(zhì)的部分,即外顯子部分。不過目前基因區(qū)域的預(yù)測已從單純外顯子預(yù)測發(fā)展到整個基因結(jié)構(gòu)域的預(yù)測已從單純外顯子預(yù)測發(fā)展到整個基因結(jié)構(gòu)的預(yù)測。這些預(yù)測綜合各種外顯子預(yù)測的算法和人的預(yù)測。這些預(yù)測綜合各種外顯子預(yù)測的算法和人們對基因結(jié)構(gòu)信號們對基因結(jié)構(gòu)信號( (如如TATA boxTATA box和加尾信號和加尾信號) )的認識,的認識,預(yù)測出可能的完整基因。預(yù)測出可能的完整基因。(4 4)基因或蛋白質(zhì)功能預(yù)測)基因或蛋白質(zhì)功能預(yù)測 用實驗手段證實一個預(yù)測的新基因后,用實驗手段證實一個預(yù)測的新基因后,下一步要做的就是尋找這個基因的功能。下
23、一步要做的就是尋找這個基因的功能。-即功能基因組學(xué)即功能基因組學(xué) 蛋白質(zhì)功能預(yù)測分析,主要是分析目的蛋白質(zhì)功能預(yù)測分析,主要是分析目的蛋白質(zhì)是否與具有功能信息的已知蛋白蛋白質(zhì)是否與具有功能信息的已知蛋白質(zhì)相似。策略有二:質(zhì)相似。策略有二:同源序列分析功能區(qū)相關(guān)的保守序列特點分析。(5 5)分子進化的研究)分子進化的研究 通過上述種種方法我們可以預(yù)測出一個新基因通過上述種種方法我們可以預(yù)測出一個新基因可能具有的功能。然而預(yù)測新基因只是生物信可能具有的功能。然而預(yù)測新基因只是生物信息學(xué)研究的一個方面,這門學(xué)科的根本目標是息學(xué)研究的一個方面,這門學(xué)科的根本目標是探究隱藏在生物數(shù)據(jù)后面的生物學(xué)知識。探
24、究隱藏在生物數(shù)據(jù)后面的生物學(xué)知識。 對于基因組研究來說,一個重要的研究方向就對于基因組研究來說,一個重要的研究方向就是分子序列的進化。通過比較不同生物基因組是分子序列的進化。通過比較不同生物基因組中各種結(jié)構(gòu)成分的異同,可以大大加深我們對中各種結(jié)構(gòu)成分的異同,可以大大加深我們對生物進化的認識。這方面的研究已逐步形成一生物進化的認識。這方面的研究已逐步形成一個稱為個稱為比較基因組學(xué)比較基因組學(xué)(Comparative GenomicsComparative Genomics)的新學(xué)科。的新學(xué)科。Human genome shares 223 genes with bacteria-genes th
25、at do not exist in the worm, fly, or yeast. A reticulated tree, or net, which might more appropriately represent lifes history. 6 6 生物信息學(xué)最重要的任務(wù),是生物信息學(xué)最重要的任務(wù),是從大量數(shù)據(jù)中提取新知識從大量數(shù)據(jù)中提取新知識 生物信息學(xué)最重要的任務(wù),是從海量數(shù)據(jù)中提生物信息學(xué)最重要的任務(wù),是從海量數(shù)據(jù)中提取新知識。這首先是從取新知識。這首先是從DNADNA序列中識別編碼蛋序列中識別編碼蛋白質(zhì)的基因,以及調(diào)控基因表達的各種信號。白質(zhì)的基因,以及調(diào)控基因表達的各種
26、信號。 其次,從基因組編碼序列翻譯出的蛋白質(zhì)序列其次,從基因組編碼序列翻譯出的蛋白質(zhì)序列的數(shù)目急劇增加,根本不可能用實驗方法一一的數(shù)目急劇增加,根本不可能用實驗方法一一確定它們的結(jié)構(gòu)和功能。確定它們的結(jié)構(gòu)和功能。 從已經(jīng)積累的數(shù)據(jù)和知識出發(fā),預(yù)測蛋白質(zhì)的從已經(jīng)積累的數(shù)據(jù)和知識出發(fā),預(yù)測蛋白質(zhì)的結(jié)構(gòu)和功能,成為常規(guī)的研究任務(wù)。結(jié)構(gòu)和功能,成為常規(guī)的研究任務(wù)。7 DNA7 DNA芯片和微陣列的發(fā)展芯片和微陣列的發(fā)展 DNADNA芯片和微陣列的發(fā)展,把一定組織或生芯片和微陣列的發(fā)展,把一定組織或生物體內(nèi)萬千基因時空表達的研究提上日物體內(nèi)萬千基因時空表達的研究提上日程研究基因表達過程中的聚群關(guān)系,從程
27、研究基因表達過程中的聚群關(guān)系,從中提取調(diào)控網(wǎng)絡(luò)和代謝途徑的知識,進而中提取調(diào)控網(wǎng)絡(luò)和代謝途徑的知識,進而從整體上模擬細胞內(nèi)的全部互相輔合的生從整體上模擬細胞內(nèi)的全部互相輔合的生化反應(yīng),在亞細胞層次理解生命活動?;磻?yīng),在亞細胞層次理解生命活動?;?因 芯 片 檢 測 系 統(tǒng)基 因 芯 片 檢 測 系 統(tǒng)BioinfomaticsBioinfomatics七個方面研究內(nèi)容七個方面研究內(nèi)容1.1. 建立和管理各種生物數(shù)據(jù)庫建立和管理各種生物數(shù)據(jù)庫2. 生物信息數(shù)據(jù)庫使用生物信息數(shù)據(jù)庫使用3. 生物信息學(xué)中的數(shù)學(xué)模式和方法研究生物信息學(xué)中的數(shù)學(xué)模式和方法研究4.4. 數(shù)據(jù)庫接口和檢索工具的研制數(shù)據(jù)庫
28、接口和檢索工具的研制5.5. HGPHGP的實施,對信息采集和處理提出的要求的實施,對信息采集和處理提出的要求6.6. 生物信息學(xué)最重要的任務(wù),是從大量數(shù)據(jù)中生物信息學(xué)最重要的任務(wù),是從大量數(shù)據(jù)中提取新知識提取新知識7.7. DNADNA芯片和微陣列的發(fā)展芯片和微陣列的發(fā)展此外,專業(yè)人材的培養(yǎng),也是一個重要內(nèi)容。此外,專業(yè)人材的培養(yǎng),也是一個重要內(nèi)容。四、展望四、展望 作為計算機科學(xué)和數(shù)學(xué)應(yīng)用于分子生物學(xué)而形成的交叉學(xué)科,生物信息學(xué)已經(jīng)成為基因組研究中必不可少的有力研究手段。為了能夠更好地服務(wù)于基因組研究,生物信息學(xué)在將來的發(fā)展中需要做以下幾方面的努力:(1 1)理論研究)理論研究 任何學(xué)科的
29、發(fā)展都離不開基礎(chǔ)理論的研究,生任何學(xué)科的發(fā)展都離不開基礎(chǔ)理論的研究,生物信息學(xué)也不例外。它對許多學(xué)科都提出了巨物信息學(xué)也不例外。它對許多學(xué)科都提出了巨大的挑戰(zhàn)。大的挑戰(zhàn)。 這些學(xué)科包括分子進化遺傳學(xué)、群體遺傳學(xué)、這些學(xué)科包括分子進化遺傳學(xué)、群體遺傳學(xué)、統(tǒng)計生物學(xué)、基因組學(xué)以及計算機科學(xué)和應(yīng)用統(tǒng)計生物學(xué)、基因組學(xué)以及計算機科學(xué)和應(yīng)用數(shù)學(xué)的相關(guān)學(xué)科。如果基礎(chǔ)理論研究得不到應(yīng)數(shù)學(xué)的相關(guān)學(xué)科。如果基礎(chǔ)理論研究得不到應(yīng)有的發(fā)展,生物信息學(xué)的發(fā)展將受到嚴重的阻有的發(fā)展,生物信息學(xué)的發(fā)展將受到嚴重的阻礙。礙。(2)生物數(shù)據(jù)的質(zhì)量監(jiān)控 監(jiān)控已有的生物數(shù)據(jù)究竟具有多大的可信度,監(jiān)控已有的生物數(shù)據(jù)究竟具有多大的可
30、信度,對于物理圖譜的構(gòu)建工作將有十分重大的意義。對于物理圖譜的構(gòu)建工作將有十分重大的意義。(3 3)加強生物學(xué)家和計算機科)加強生物學(xué)家和計算機科學(xué)家以及數(shù)學(xué)家之間的溝通學(xué)家以及數(shù)學(xué)家之間的溝通 長期以來,這三類科學(xué)家都是埋頭于各自的研究領(lǐng)域,長期以來,這三類科學(xué)家都是埋頭于各自的研究領(lǐng)域,而不關(guān)心其他學(xué)科的發(fā)展和要求。這種狀況在我國尤為而不關(guān)心其他學(xué)科的發(fā)展和要求。這種狀況在我國尤為突出。生物信息學(xué)的發(fā)展要求三者之間加強溝通。其意突出。生物信息學(xué)的發(fā)展要求三者之間加強溝通。其意義不僅在于推動生物信息學(xué)自身的發(fā)展,而且將形成促義不僅在于推動生物信息學(xué)自身的發(fā)展,而且將形成促進整個生物學(xué)發(fā)展的強
31、大動力。進整個生物學(xué)發(fā)展的強大動力。 生物信息學(xué)作為基因組研究的有力武器,被廣泛地用來生物信息學(xué)作為基因組研究的有力武器,被廣泛地用來加快新基因的尋找過程,以達到將加快新基因的尋找過程,以達到將 有用有用 新基因搶先注新基因搶先注冊專利的目的。在這場世界范圍內(nèi)的競爭中,中國科學(xué)冊專利的目的。在這場世界范圍內(nèi)的競爭中,中國科學(xué)家以及科研資金投向的決策部門如何結(jié)合我國科研水平家以及科研資金投向的決策部門如何結(jié)合我國科研水平的現(xiàn)狀、優(yōu)勢領(lǐng)域等客觀情況,將有限的投資投入以求的現(xiàn)狀、優(yōu)勢領(lǐng)域等客觀情況,將有限的投資投入以求獲得最大可能的科學(xué)研究以及商業(yè)回報,是一個無法回獲得最大可能的科學(xué)研究以及商業(yè)回報
32、,是一個無法回避的新課題。避的新課題。我國科學(xué)家展望我國科學(xué)家展望 我國科學(xué)家認為,在克隆新基因的思路方面,我國我國科學(xué)家認為,在克隆新基因的思路方面,我國不應(yīng)該照搬國外克隆新基因所用的方法,而應(yīng)該走不應(yīng)該照搬國外克隆新基因所用的方法,而應(yīng)該走生物信息學(xué)和定位克隆相結(jié)合的道路。生物信息學(xué)和定位克隆相結(jié)合的道路。 具體地說就是一方面進行各種遺傳疾病家系的采集,具體地說就是一方面進行各種遺傳疾病家系的采集,從家系分析入手,尋找致病基因在染色體上的位置,從家系分析入手,尋找致病基因在染色體上的位置,然后對這個區(qū)域進行測序,再利用生物信息學(xué)的手然后對這個區(qū)域進行測序,再利用生物信息學(xué)的手段預(yù)測候選基因
33、和它的功能并用實驗加以證實;段預(yù)測候選基因和它的功能并用實驗加以證實; 另一方面直接從現(xiàn)有公共數(shù)據(jù)庫中的另一方面直接從現(xiàn)有公共數(shù)據(jù)庫中的ESTEST出發(fā),用出發(fā),用生物信息學(xué)的方法尋找可能有研究價值的新基因,生物信息學(xué)的方法尋找可能有研究價值的新基因,并用實驗方法來研究證實。這種雙管齊下克隆新基并用實驗方法來研究證實。這種雙管齊下克隆新基因的方法可能更適合我國人類基因組研究在財力、因的方法可能更適合我國人類基因組研究在財力、物力和研究人才資源等方面的客觀條件物力和研究人才資源等方面的客觀條件。在生物信息學(xué)學(xué)科建設(shè)方面在生物信息學(xué)學(xué)科建設(shè)方面 在生物信息學(xué)學(xué)科建設(shè)方面,政府應(yīng)注在生物信息學(xué)學(xué)科建
34、設(shè)方面,政府應(yīng)注意加強生物信息學(xué)學(xué)科建設(shè)的延續(xù)性,意加強生物信息學(xué)學(xué)科建設(shè)的延續(xù)性,克服青年科技人員流動性大等困難,有克服青年科技人員流動性大等困難,有重點地把工作長久地開展起來,盡快設(shè)重點地把工作長久地開展起來,盡快設(shè)立相關(guān)的學(xué)位,以利于對后繼人才的培立相關(guān)的學(xué)位,以利于對后繼人才的培養(yǎng);適當?shù)刂С謸碛形覈灾髦R產(chǎn)權(quán)養(yǎng);適當?shù)刂С謸碛形覈灾髦R產(chǎn)權(quán)的算法、軟件的后繼開發(fā)、包裝工作,的算法、軟件的后繼開發(fā)、包裝工作,這不僅僅因為其潛在的商業(yè)利潤,更要這不僅僅因為其潛在的商業(yè)利潤,更要逐漸確立中國在世界生物信息學(xué)領(lǐng)域的逐漸確立中國在世界生物信息學(xué)領(lǐng)域的地位。地位。在生物信息系統(tǒng)的構(gòu)建方面在生
35、物信息系統(tǒng)的構(gòu)建方面 國家應(yīng)當集中創(chuàng)建一兩個具有一定規(guī)模的生物信息中心,國家應(yīng)當集中創(chuàng)建一兩個具有一定規(guī)模的生物信息中心,建立面向全國的生物學(xué)數(shù)據(jù)庫檢索和數(shù)據(jù)分析系統(tǒng)。這建立面向全國的生物學(xué)數(shù)據(jù)庫檢索和數(shù)據(jù)分析系統(tǒng)。這個系統(tǒng)的建立可以分兩步走。個系統(tǒng)的建立可以分兩步走。 第一步我們要將國外公共數(shù)據(jù)庫中的內(nèi)容和相關(guān)軟件收第一步我們要將國外公共數(shù)據(jù)庫中的內(nèi)容和相關(guān)軟件收集和集中起來,提供檢索和下載。集和集中起來,提供檢索和下載。 第二步是將這些資源有機地組合,建立一個統(tǒng)一的生物第二步是將這些資源有機地組合,建立一個統(tǒng)一的生物信息平臺。通過這個平臺用戶可以將各種格式的數(shù)據(jù)提信息平臺。通過這個平臺用戶
36、可以將各種格式的數(shù)據(jù)提交給設(shè)在生物信息中心的服務(wù)器,在服務(wù)器上進行一系交給設(shè)在生物信息中心的服務(wù)器,在服務(wù)器上進行一系列的檢索和數(shù)據(jù)分析。用戶不必關(guān)心各種數(shù)據(jù)庫和軟件列的檢索和數(shù)據(jù)分析。用戶不必關(guān)心各種數(shù)據(jù)庫和軟件的輸入輸出格式,只需一個簡單的客戶端軟件甚至只需的輸入輸出格式,只需一個簡單的客戶端軟件甚至只需一個一個WWWWWW瀏覽器就能完成全部工作。整個生物信息平臺不瀏覽器就能完成全部工作。整個生物信息平臺不僅是一個集成的數(shù)據(jù)庫,而且是一個集成的軟件工具。僅是一個集成的數(shù)據(jù)庫,而且是一個集成的軟件工具。在生物信息學(xué)理論研究方面在生物信息學(xué)理論研究方面 發(fā)揮國人的聰明才智,加強數(shù)學(xué)算法研發(fā)揮國
37、人的聰明才智,加強數(shù)學(xué)算法研究究 應(yīng)用系統(tǒng)論、信息論,開展生物信息學(xué)應(yīng)用系統(tǒng)論、信息論,開展生物信息學(xué)理論研究理論研究 開展生物信息學(xué)的倫理道德研究開展生物信息學(xué)的倫理道德研究 。結(jié)語結(jié)語相信在相信在HGPHGP和即將開始的中國人類和即將開始的中國人類基因組研究計劃中,生物信息學(xué)將基因組研究計劃中,生物信息學(xué)將發(fā)揮越來越大的作用,并推動生物發(fā)揮越來越大的作用,并推動生物學(xué)進入一個全新的境界。學(xué)進入一個全新的境界。5 5、相關(guān)資源:、相關(guān)資源: European Bioinformatics Institute EBIEuropean Bioinformatics Institute EBI) ) SBDS (Southampton Bioinformatics Data ServerSBDS (Southampton Bioinformatics Data Server) ) U.S. Department of Energy - Bioinformatics U.S. Department of Energy - Bioinformatics InfrastructureInfrastructure The NASA Ames Center for BioinformaticsThe NASA Am
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省鹽城市射陽縣2024-2025學(xué)年九年級下學(xué)期3月月考化學(xué)試題(原卷版+解析版)
- 2024年春七年級語文下冊 第一單元 2 說和做-記聞一多先生言行片段教學(xué)實錄 新人教版
- 3 學(xué)會反思2023-2024學(xué)年六年級下冊道德與法治同步教學(xué)設(shè)計(統(tǒng)編版)
- 10《父母多愛我》教學(xué)設(shè)計-2023-2024學(xué)年道德與法治三年級上冊統(tǒng)編版
- 2《丁香結(jié)》教學(xué)設(shè)計-2024-2025學(xué)年六年級上冊語文統(tǒng)編版
- 基于保護動機理論的急性脂源性胰腺炎患者延續(xù)性護理方案的構(gòu)建與實施
- 2024年春八年級生物下冊 24.1 人口增長與計劃生育教學(xué)實錄 (新版)北師大版
- 2023七年級數(shù)學(xué)上冊 第5章 相交線與平行線5.2 平行線 3平行線的性質(zhì)教學(xué)實錄 (新版)華東師大版
- DB3713-T 257-2022 邦玉339高產(chǎn)栽培技術(shù)規(guī)程
- DB3708-T 22-2023 短季棉蒜后貼茬直播高效栽培技術(shù)規(guī)程
- 2024年江西青年職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 2025年安徽省煙草專賣局(公司)招聘高頻重點提升(共500題)附帶答案詳解
- 2025山東省建筑安全員-B證考試題庫及答案
- 2025年廣西平果市事業(yè)單位招聘工作人員高頻重點提升(共500題)附帶答案詳解
- 2025中國聯(lián)通廣東省分公司招聘187人高頻重點提升(共500題)附帶答案詳解
- 研學(xué)旅行課程設(shè)計廣西
- 2024-2030年中國留學(xué)中介行業(yè)轉(zhuǎn)型模式及未來發(fā)展規(guī)劃研究報告
- 子宮內(nèi)膜癌治療進展
- 營銷員二級模擬考試題含參考答案
- 2025年中考數(shù)學(xué)分類專項復(fù)習(xí)之概率
- 微測網(wǎng)題庫完整版
評論
0/150
提交評論