




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、生物信息學(xué)E-MAIL: 亞太地區(qū)蠶桑培訓(xùn)中心2003年2月 1一、概述二十一世紀(jì)是生命科學(xué)的時(shí)代,也是信息時(shí)代 近年來(lái),隨著現(xiàn)代分子生物學(xué)的發(fā)展,特別是人類基組計(jì)劃的實(shí)施,不斷產(chǎn)生出巨量的分子生物學(xué)數(shù)據(jù),這些數(shù)據(jù)有著數(shù)量巨大、關(guān)系復(fù)雜,以至于不利用計(jì)算機(jī)根本無(wú)法實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)和分析。這樣,生物信息學(xué)最終形成一門(mén)獨(dú)立的學(xué)科并被推上了生物科學(xué)發(fā)展的最前沿。2Bioinformatics: 科技界一顆耀眼的新星 在BIOINFORMATICS 沒(méi)有誕生之前, 一個(gè)新藥的問(wèn)世需要十年時(shí)間,數(shù)億美元的R&D,而B(niǎo)IOINFORMATICS已將這個(gè)過(guò)程減少三分之二,R&D的費(fèi)用也相應(yīng)大大減少。許多中小B
2、IOTECH 公司也看到了BIOINFORMATICS 的巨大作用和潛在的商機(jī),紛紛投資BIOINFORMATICS研究項(xiàng)目。3美國(guó)電腦執(zhí)照-高薪階層“BIOINFORMATICS CERTIFICATION”,這是目前最新的一門(mén)生物化學(xué)工程與電腦技術(shù)相結(jié)合的課程。Visual Basic - $1195Visual C + + - $1295BioInformatics - $2500MIT(Massachusettes Institute of Technology)(美國(guó))麻省理工學(xué)院: Course: 20.01s Date: June 24 - 28, 2002 Tuition: $
3、2,5004第二講 生物信息學(xué)現(xiàn)狀和研究方向劉吉平5主要內(nèi)容1、背景2、定義3、現(xiàn)狀1)生物數(shù)據(jù)庫(kù)的發(fā)展2)人類基因組計(jì)劃逐步完成3)科研文獻(xiàn)的增長(zhǎng)4、研究目標(biāo)6一. 什么是生物信息學(xué)? Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation. 它是一個(gè)學(xué)科領(lǐng)域,包含著基因組信息的獲取、處理、存儲(chǔ)、分配 、
4、分析和解釋的所有方面。 (The U.S. Human Genome Project: The First Five Years FY 1991-1995, by NIH and DOE) 從美國(guó)的三個(gè)國(guó)家計(jì)劃說(shuō)起:曼哈頓計(jì)劃;阿婆羅計(jì)劃;人類基因組計(jì)劃。 破譯人類遺傳密碼就要讀懂由30億符號(hào)組成的100萬(wàn)頁(yè)的“天書(shū)”7生物信息學(xué)的發(fā)展歷程 生物信息學(xué)自誕生以來(lái),經(jīng)歷了三個(gè)階段:基因組前期的生物信息學(xué):主要是序列分析、數(shù)據(jù)庫(kù)的查詢、計(jì)算機(jī)操作和PC的應(yīng)用;基因組年代的生物信息學(xué):主要是基因的尋找、數(shù)據(jù)與數(shù)據(jù)之間的比較、網(wǎng)絡(luò)相互界面(Interface);后基因組年代的生物信息學(xué):主要是數(shù)據(jù)的挖
5、掘、表達(dá)、數(shù)據(jù)多樣性的分析、相互交叉數(shù)據(jù)分布的總結(jié)與分析。其研究的內(nèi)容不僅包括基因的查尋和同源性分析;而且進(jìn)一步到基因和基因組的功能分析,即所謂的功能基因組學(xué)研究。 8二、生物信息學(xué)及其發(fā)展生物信息學(xué)(Bioinformatics)采用信息科學(xué)、計(jì)算機(jī)科學(xué)、生物數(shù)學(xué)、比較生物學(xué)等學(xué)科的觀點(diǎn)和方法對(duì)生命的現(xiàn)象及其組成分子(核酸、蛋白等)進(jìn)行研究。主要研究生命中物質(zhì)的組成、進(jìn)化、結(jié)構(gòu)與功能的規(guī)律、以及這些物質(zhì)在生命體中能量和信息的交換或傳遞。該學(xué)科以計(jì)算機(jī)和生物電子設(shè)備為工具,對(duì)生物信息進(jìn)行提取、儲(chǔ)存、加工和分析,用信息理論技術(shù)及生物數(shù)學(xué)的方法去理解和闡述生物大分子的存在和生命價(jià)值,最終對(duì)它們進(jìn)行
6、各種處理與應(yīng)用。通過(guò)這些處理和應(yīng)用,科學(xué)家不僅能理解已有的核酸和蛋白質(zhì)序列及其功能,而且能更好地著手研究新的基因和蛋白序列及其功能。9計(jì)算機(jī)運(yùn)算速度: 18個(gè)月增長(zhǎng)一倍;DNA序列數(shù)據(jù): 14個(gè)月增長(zhǎng)一倍;10近年來(lái)GenBank中的DNA堿基數(shù)目呈指數(shù)增加,大約每14個(gè)月增加一倍。到1999年12月其數(shù)目已達(dá)30億,它們來(lái)自47000種生物。2000年4月DNA堿基數(shù)目是60億。現(xiàn)在,2001年初這一數(shù)目已達(dá)110億。各種生物的EST序列已達(dá)600多萬(wàn)條,其中人類的EST序列已超過(guò)300萬(wàn)條,估計(jì)覆蓋人類基因90以上;自全長(zhǎng)1.8Mb的嗜血流感桿菌(Haemophilus influenza
7、e Rd)基因組序列于1995年發(fā)表(Fleischmann et al.,1995)以來(lái),已有54個(gè)模式生物的完整基因組被測(cè)序完成,它們中有9個(gè)古細(xì)菌、31個(gè)原核真細(xì)菌、14個(gè)真核生物的完整基因組或它們的完整染色體,其中包括釀酒酵母和線蟲(chóng)。還有另外的70余個(gè)微生物基因組正在測(cè)試當(dāng)中。11 美國(guó)的核酸數(shù)據(jù)庫(kù)GenBank從1979年開(kāi)始建設(shè),1982年正式運(yùn)行;歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL數(shù)據(jù)庫(kù)也于1982年開(kāi)始服務(wù);日本于1984年開(kāi)始建立國(guó)家級(jí)的核酸數(shù)據(jù)庫(kù)DDBJ,并于1987年正式服務(wù)。從那個(gè)時(shí)候以來(lái),DNA序列的數(shù)據(jù)已經(jīng)從80年代初期的百把條序列,幾十萬(wàn)堿基上升至現(xiàn)在的110億堿基!
8、這就是說(shuō),在短短的約18年間,數(shù)據(jù)量增長(zhǎng)了近十萬(wàn)倍。12 Dbcat統(tǒng)計(jì)的生物信息數(shù)據(jù)庫(kù)的數(shù)目分類 數(shù)據(jù)庫(kù)數(shù)目分類 數(shù)據(jù)庫(kù)數(shù)目DNA 87RNA 30蛋白質(zhì) 94基因組 58基因圖譜30蛋白質(zhì)結(jié)構(gòu) 18文獻(xiàn)43其他 15313果蠅基因組包括1.2億堿基對(duì)的編碼區(qū)已于2000年2月測(cè)序并組裝完成;人類基因組研究的標(biāo)志性工作,包含3300萬(wàn)堿基對(duì)的人第22號(hào)染色體已于1999年11月完成測(cè)序,結(jié)果發(fā)表在1999年12月2日的Nature 上。從第22號(hào)染色體已鑒定出679個(gè)基因,其中55的基因是未知的。有35種疾病與該染色體突變相關(guān),像免疫系統(tǒng)疾病、先天性心臟病和精神分裂癥。作為人類基因組研究的里
9、程碑性的工作,覆蓋率為90的人完整基因組的“工作草圖”已經(jīng)在2000年4月底完成,到2003年將獲得覆蓋率為99的人類基因組全部序列。對(duì)人的大約3萬(wàn)個(gè)基因。 到目前為止已定位在染色體上的基因數(shù)目有14015個(gè)(見(jiàn))14How many characters are in the “Heaven Book”? 3*109 10,000 books 1 book 100 pages 1 page 3,000 characters CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGTCTTTCTCCAGGAAAACGT
10、GGACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCTTCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGGCAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGCAAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGCGGGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTC
11、AATAGCGCTGTGGACGAGACAGAGGGAATGGGGCAAGGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGTGACGGCGGGCGCGAAGGCGAGCGCATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGATTGATCAATCCGCTTCAGCCTCCCGAGTAGCTGGGACTACAGACGGTGCCATCACGCCCAGCTCATTGTTGATTCCCGCCCCCTTGG
12、TAGAGACGGGATTCCGCTATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCCTCCCTCCTGGGCCTGGGCGTGGGCTCGCAAAACGCTGGGATTCCCGGATTACAGGCGGGCGCACCACACCAGGAGCAAACACTTCCGGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCTAATTAAGCATGCCCGGTTTTAAACCTCTTAAAACAACTTTTAAAATTACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGATAATATTCGACAAGCTGTTATTGC
13、CAAACTATTTTCCTATTTGTTTCCTAATGGCATCGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGGCAGATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAGACTATACTTTCAGGGATCATTTCTATAGTGTGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGCACCGAAAACCACGAGGAAGAGAGGTAGCGTTTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATTGGGAACCCCACACGCGGTGTAGAAATATATTTTAAGGGCGCG (
14、1250 characters) 關(guān)鍵是先要從一個(gè)個(gè)序列片段中得到這本天書(shū)15已測(cè)序的重要模式生物:人 家鼠果蠅線蟲(chóng)擬南芥水稻大鼠斑馬魚(yú)釀酒酵母番茄玉米布氏錐蟲(chóng)菜豆河豚大腸桿菌HIV牛瘧原蟲(chóng)16分子生物學(xué)和遺傳學(xué)的文獻(xiàn)積累從60年代中期的接近10萬(wàn)篇迅速增長(zhǎng)至60年代末期的20多萬(wàn)篇,即在3-4年間,翻了一番。此后,至80年代中期,上升至約30萬(wàn)篇,即平均每年增長(zhǎng)6-7千篇。至90年代中,文獻(xiàn)數(shù)已上升至40多萬(wàn)篇;即在10年中,平均每年增長(zhǎng)1萬(wàn)篇。到2000年,則增長(zhǎng)至約50萬(wàn)篇,即在約5年間,又增長(zhǎng)了10萬(wàn)篇(根據(jù).有關(guān)PubMed數(shù)據(jù)整理)。 171、發(fā)展現(xiàn)
15、狀生物信息學(xué)的發(fā)展將會(huì)對(duì)生命科學(xué)帶來(lái)革命性的變革。它的成果不僅對(duì)相關(guān)基礎(chǔ)學(xué)科起巨大的推動(dòng)作用,而且還將對(duì)醫(yī)藥、衛(wèi)生、食品、農(nóng)業(yè)等產(chǎn)業(yè)產(chǎn)生巨大的影響,甚至引發(fā)新的產(chǎn)業(yè)革命。18生物醫(yī)藥工業(yè)推動(dòng)生物信息學(xué)的發(fā)展生物醫(yī)藥工業(yè)也是推動(dòng)生物信息學(xué)發(fā)展的重要?jiǎng)恿?。HGP所推動(dòng)的大規(guī)模DNA測(cè)序也為生物醫(yī)藥工業(yè)提供了大量可用于新藥開(kāi)發(fā)的原材料。有些基因產(chǎn)物可以直接作為藥物,而有些基因則可以成為藥物作用的對(duì)象。生物信息學(xué)為分子生物學(xué)家提供了大量對(duì)基因序列進(jìn)行分析的工具,不但可以從資料的獲取、基因功能的預(yù)測(cè)、藥物篩選過(guò)程中的信息處理等方面大大加快新藥開(kāi)發(fā)的進(jìn)程,而且可以大大加快傳統(tǒng)的基因發(fā)現(xiàn)和研究,因而成為各贏
16、利性研究機(jī)構(gòu)和醫(yī)藥公司爭(zhēng)奪基因?qū)@闹匾ぞ?,這一競(jìng)爭(zhēng)又反過(guò)來(lái)極大的刺激了生物信息學(xué)的發(fā)展。192、國(guó)外發(fā)展現(xiàn)狀因此,各國(guó)政府和工業(yè)界對(duì)此極為重視,投入了大量資金。歐美各國(guó)及日本相繼成立了生物信息中心,如美國(guó)的國(guó)家生物技術(shù)信息中心(National Center for Biotechnology Informatics,NCBI)、歐洲生物信息學(xué)研究所 (European Bioinformatic Institute,EBI)、日本信息生物學(xué)中心(Center for Information Biology,CIB)等。NCBI、EBI和CIB相互合作,共同維護(hù)著GenBank、EMBL、
17、DDBJ三大基因序列數(shù)據(jù)庫(kù)。它們每天通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)互相交換數(shù)據(jù),使得三個(gè)數(shù)據(jù)庫(kù)能同時(shí)獲得最新數(shù)據(jù)。此外,他們每年召開(kāi)兩個(gè)年會(huì)討論合作事宜。203、國(guó)內(nèi)發(fā)展現(xiàn)狀在我國(guó),生物信息學(xué)隨著人類基因組研究的展開(kāi)才剛剛起步,但已顯露出蓬勃發(fā)展的勢(shì)頭。在政府的支持和科學(xué)家的呼吁下,國(guó)家級(jí)生物醫(yī)學(xué)信息學(xué)中心正在籌建之中。各地政府也給予了足夠重視,北京市已經(jīng)成立了北京生物工程學(xué)會(huì)生物信息學(xué)專業(yè)委員會(huì)(即北方生物信息學(xué)研究會(huì)),目的在于聯(lián)合北方地區(qū)從事生物信息學(xué)的專家,加強(qiáng)合作,促進(jìn)學(xué)科的發(fā)展,并為政府決策提供參考意見(jiàn)。214、國(guó)內(nèi)的一些科研單位國(guó)內(nèi)一些科研單位已經(jīng)開(kāi)始摸索著從事這方面的工作。清華大學(xué)在基因調(diào)控及
18、基因功能分析、蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方面、天津大學(xué)物理系和中科院理論物理所在相關(guān)算法方面、中科院生物物理所在基因組大規(guī)模測(cè)序數(shù)據(jù)的組裝和標(biāo)識(shí)方面、北京大學(xué)化學(xué)學(xué)院物理化學(xué)研究所在蛋白質(zhì)分子設(shè)計(jì)方面、華大基因組研究中心(中科院遺傳所人類基因組研究中心)在大規(guī)模測(cè)序數(shù)據(jù)處理自動(dòng)化流程體系及數(shù)據(jù)庫(kù)系統(tǒng)建立方面均已展開(kāi)相關(guān)研究。復(fù)旦大學(xué)遺傳學(xué)研究所為克隆新基因而建立的一整套生物信息系統(tǒng)也已初具規(guī)模;中科院上海生化所、生物物理所等單位在結(jié)構(gòu)生物學(xué)和基因預(yù)測(cè)研究方面也有相當(dāng)?shù)幕A(chǔ)。224、國(guó)內(nèi)的一些科研單位清華大學(xué)在基因調(diào)控及基因功能分析、蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方面、天津大學(xué)物理系和中科院理論物理所在相關(guān)算法方面、中科院生物物理所在基因組大規(guī)模測(cè)序數(shù)據(jù)的組裝和標(biāo)識(shí)方面、北京
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 社區(qū)個(gè)人工作計(jì)劃改善社區(qū)公共廚房設(shè)施
- 超聲科診療流程中的健康教育實(shí)施
- 名著《駱駝祥子》中考真題及典型模擬題訓(xùn)練(原卷版)
- 跨國(guó)企業(yè)專利侵權(quán)案件的司法管轄優(yōu)化研究
- 前臺(tái)文員如何加強(qiáng)內(nèi)部溝通計(jì)劃
- 購(gòu)物中心財(cái)務(wù)管理中的績(jī)效評(píng)估
- 八年級(jí)上冊(cè)必讀:《昆蟲(chóng)記》導(dǎo)讀資料
- 2025河南空港數(shù)字城市開(kāi)發(fā)建設(shè)有限公司招聘20人筆試參考題庫(kù)附帶答案詳解
- 2025年度長(zhǎng)江河湖建設(shè)有限公司校園招聘8人筆試參考題庫(kù)附帶答案詳解
- 國(guó)能遼寧北票 200MW 風(fēng)力發(fā)電項(xiàng)目地質(zhì)災(zāi)害危險(xiǎn)性評(píng)估報(bào)告
- 江蘇省常州市教育學(xué)會(huì)2023-2024學(xué)年下學(xué)期八年級(jí)數(shù)學(xué)考試卷
- DZ∕T 0214-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 銅、鉛、鋅、銀、鎳、鉬(正式版)
- 2024年瓦斯爆炸事故專項(xiàng)應(yīng)急演練桌面推演腳本
- 2024年遼寧大連中遠(yuǎn)海運(yùn)川崎船舶工程有限公司招聘筆試參考題庫(kù)含答案解析
- 《單層廠房鋼結(jié)構(gòu)》
- 八年級(jí)下冊(cè)二次根式作業(yè)設(shè)計(jì)
- 人音版二年級(jí)上冊(cè)第六課《跳起舞》 單元作業(yè)設(shè)計(jì)
- 第43講閉合電路歐姆定律(講義)
- (2024年)面神經(jīng)炎課件完整版
- 在社區(qū)結(jié)對(duì)共建簽約儀式上的講話3篇
評(píng)論
0/150
提交評(píng)論