生物信息學的研究內(nèi)容、方法及意義_第1頁
生物信息學的研究內(nèi)容、方法及意義_第2頁
生物信息學的研究內(nèi)容、方法及意義_第3頁
生物信息學的研究內(nèi)容、方法及意義_第4頁
生物信息學的研究內(nèi)容、方法及意義_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

生物信息學

1生物信息學說文解字:生物+信息+學(bioinformatics)biology+information+theory廣義應用信息科學的方法和技術,研究生物體系和生物過程中信息的存貯、信息的內(nèi)涵和信息的傳遞,研究和分析生物體細胞、組織、器官的生理、病理、藥理過程中的各種生物信息,或者也可以說成是生命科學中的信息科學。狹義應用信息科學的理論、方法和技術,管理、分析和利用生物分子數(shù)據(jù)。2生命信息系統(tǒng)生物所處的時空系統(tǒng)物質(zhì)系統(tǒng),信息傳遞與控制,能量3相關學科圖示4廣義概念圖示5狹義概念圖示6總結:生物信息學生物信息學(Bioinformatics)是一門新興的交叉學科,是生命科學領域中的新興學科,面對人類基因組方案等各種工程所產(chǎn)生的龐大的分子生物學信息,生物信息學的重要性將越來越突出,它將會為生命科學的研究帶來革命性的變革。生物信息學是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。生物信息學是當今生命科學和自然科學的重大前沿領域之一,同時也將是21世紀自然科學的核心領域之一,其研究重點主要表達在基因組學(Genomics)和蛋白組學(Proteomics)。7生物學根底速遞細胞(分子水平)個體生命生命之樹8生命的分子根底細胞/分子水平DNA/RNA蛋白質(zhì)糖脂類9DNA結構和堿基互補原理10中心法那么11生物信息學的歷史從人類基因組方案〔HGP〕說起12曼哈頓原子彈方案阿波羅登月方案人類基因組方案1360年代初,美國總統(tǒng)Kennedy提出兩個科學方案:登月方案攻克腫瘤方案人類遺傳信息的復雜性人類基因組方案(HGP,HumanGenomeProject)目標:整體上破解人類遺傳信息的奧秘為什么提出HGP?14生命活動三要素:物質(zhì)、能量、信息DNA:遺傳物質(zhì)(遺傳信息的載體)雙螺旋結構A,C,G,T四種根本字符的復雜文本基因〔Gene〕:具有遺傳效應的DNA分子片段DNA、基因、基因組15

基因組(Genome):包含細胞或生物體全套的遺傳信息的全部遺傳物質(zhì)。原核生物(細菌、病毒等)

真核生物(真菌、植物、動物等)人類基因組:

3.2×109bp

16HGP的歷史回憶1984.12猶他州阿爾塔組織會議,初步研討測定人類整個基因組DNA序列的意義1985Dulbecco在《Science》撰文“腫瘤研究的轉折點:人類基因組的測序〞美國能源部(DOE)提出“人類基因組方案〞草案1987美國能源部和國家衛(wèi)生研究院〔NIH〕聯(lián)合為“人類基因組方案〞下?lián)軉咏?jīng)費約550萬美元1989美國成立“國家人類基因組研究中心〞,Watson擔任第一任主任1990.10經(jīng)美國國會批準,人類基因組方案正式啟動17第一個自由生物體流感嗜血菌(H.inf)的全基因組測序完成1996完成人類基因組方案的遺傳作圖啟動模式生物基因組方案H.inf全基因組Saccharomycescerevisiae釀酒酵母Caenorhabditiselegans秀麗線蟲181997大腸桿菌(E.coli)全基因組測序完成1998完成人類基因組方案的物理作圖開始人類基因組的大規(guī)模測序Celera公司參加,與公共領域競爭啟動水稻基因組方案1999.7第5屆國際公共領域人類基因組測序會議,加快測序速度大腸桿菌及其全基因組水稻基因組方案191999.7第5屆國際公共領域人類基因組測序會議,加快測序速度2000Celera公司宣布完成果蠅基因組測序國際公共領域宣布完成第一個植物基因組——擬南芥全基因組的測序工作Drosophilamelanogaster果蠅Arabidopsisthaliana擬南芥202001年2月15日《Nature》封面2001年2月16日《Science》封面公共領域和Celera公司同時宣布完成人類基因組工作草圖《Nature》刊文發(fā)表國際公共領域結果《Science》刊文發(fā)表Celera公司及其合作者結果21我國對人類基因組方案的奉獻22HGP帶來的科學挑戰(zhàn)隨著實驗數(shù)據(jù)和可利用信息急劇增加,信息的管理和分析成為HGP的一項重要的工作發(fā)現(xiàn)生物學規(guī)律解讀生物遺傳密碼認識生命的本質(zhì)研究基因組數(shù)據(jù)之間的關系分析現(xiàn)有的基因組數(shù)據(jù)利用數(shù)學模型和計算技術23各學科參與、協(xié)作:生命科學、數(shù)學、物理學、化學、計算機科學、材料科學以及倫理、法律等社會科學……

首要科學問題

如何找到記載在基因組DNA一維結構上控制生命時間、空間的調(diào)控信息的編碼方式和調(diào)節(jié)規(guī)律。應用數(shù)學、復雜系統(tǒng)理論、信息論、非線性科學……

催生

生物信息學、計算生物學

芯片技術

交叉性技術領域:物理學、微電子信息技術、生化技術、信息技術、自動化、材料科學……

結構生物學

前沿領域之一:生物物理學、生物化學、晶體學、波譜學、光譜學以及X射線晶體衍射技術、核磁共振技術……24生物信息學的開展歷史生物信息學根本思想的產(chǎn)生生物信息學的迅速開展二十世紀50年代二十世紀80-90年代生物科學和技術的開展人類基因組方案的推動2520世紀50年代,生物信息學開始孕育20世紀60年代,生物分子信息在概念上將計算生物學和計算機科學聯(lián)系起來20世紀70年代,生物信息學的真正開端20世紀70年代到80年代初期,出現(xiàn)了一系列著名的序列比較方法和生物信息分析方法20世紀80年代以后,出現(xiàn)一批生物信息效勞機構和生物信息數(shù)據(jù)庫20世紀90年代后,HGP促進生物信息學的迅速開展26關于生物信息學開展歷程中的重要大事,請參見下面兩個網(wǎng)站的介紹:/BLASTinfo/milestones.html、:///bioinformatics/。27生物信息學的研究內(nèi)容1、生物分子數(shù)據(jù)的收集與管理2、數(shù)據(jù)庫搜索及序列比較3、基因組序列分析4、基因表達數(shù)據(jù)的分析與處理5、蛋白質(zhì)結構與功能預測6、基因-蛋白相互作用網(wǎng)絡7、整個系統(tǒng)調(diào)控網(wǎng)絡28基因組數(shù)據(jù)庫蛋白質(zhì)序列數(shù)據(jù)庫蛋白質(zhì)結構數(shù)據(jù)庫DDBJEMBLGenBankSWISS-PROT

PDBPIR生物分子數(shù)據(jù)的收集與管理29數(shù)據(jù)庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列序列比較的一個根本操作就是比對〔Alignment〕,即將兩個序列的各個字符〔代表核苷酸或者氨基酸殘基〕按照對應等同或者置換關系進行比照排列,其結果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關系。30基因組序列分析

遺傳語言分析——天書基因組結構分析基因識別基因功能注釋基因調(diào)控信息分析基因組比較31基因表達數(shù)據(jù)的分析與處理基因表達數(shù)據(jù)分析是目前生物信息學研究的熱點和重點目前對基因表達數(shù)據(jù)的處理主要是進行聚類分析,將表達模式相似的基因聚為一類,在此基礎上尋找相關基因,分析基因的功能所用方法主要有:相關分析方法、模式識別技術中的層次式聚類方法、人工智能中的自組織映射神經(jīng)網(wǎng)絡、主元分析方法等表達數(shù)據(jù)缺點:僅反映mRNA豐度,噪聲,…32蛋白質(zhì)結構預測

蛋白質(zhì)的生物功能由蛋白質(zhì)的結構所決定,蛋白質(zhì)結構預測成為了解蛋白質(zhì)功能的重要途徑蛋白質(zhì)結構預測分為:二級結構預測空間結構預測蛋白質(zhì)折疊33二級結構預測在一定程度上二級結構的預測可以歸結為模式識別問題在二級結構預測方面主要方法有:立體化學方法圖論方法統(tǒng)計方法最鄰近決策方法基于規(guī)那么的專家系統(tǒng)方法分子動力學方法人工神經(jīng)網(wǎng)絡方法預測準確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡的PHD系統(tǒng)34空間結構預測在空間結構預測方面,比較成功的理論方法是同源模型法該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結構運用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結構預測工作35生物信息學當前的主要任務

當今生物信息學界的大局部人都把注意力集中在基因組、蛋白質(zhì)組、蛋白質(zhì)結構以及與之相結合的藥物設計上,隨蛋白組學、代謝組學進一步的開展,將在整體水平進行36基因組

新基因的發(fā)現(xiàn)

通過計算分析從EST〔ExpressedSequenceTags〕序列庫中拼接出完整的新基因編碼區(qū),也就是通俗所說的“電子克隆〞;通過計算分析從基因組DNA序列中確定新基因編碼區(qū),經(jīng)過多年的積累,已經(jīng)形成許多分析方法,如根據(jù)編碼區(qū)具有的獨特序列特征、根據(jù)編碼區(qū)與非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布的統(tǒng)計方法、根據(jù)神經(jīng)網(wǎng)絡方法、根據(jù)分形方法和根據(jù)密碼學方法等。37非蛋白編碼區(qū)生物學意義的分析

38非蛋白編碼區(qū)約占人類基因組的95%,其生物學意義目前尚不是很清楚,但從演化觀點來看,其中必然蘊含著重要的生物學功能,由于它們并不編碼蛋白,一般認為,它們的生物學功能可能表達在對基因表達的時空調(diào)控上。對非蛋白編碼區(qū)進行生物學意義分析的策略有兩種,一種是基于已有的已經(jīng)為實驗證實的所有功能的DNA元件的序列特征,預測非蛋白編碼區(qū)中可能含有的功能的DNA元件,從而預測其可能的生物學功能,并通過實驗進行驗證;另一種那么是通過數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預測其可能的信息含義,最后同樣通過實驗驗證。39基因組整體功能及其調(diào)節(jié)網(wǎng)絡的系統(tǒng)把握

把握生命的本質(zhì),僅僅掌握基因組中局部基因的表達調(diào)控是遠遠不夠的,因為生命現(xiàn)象是基因組中所有功能單元相互作用共同制造出來的?;蛐酒夹g由于可以監(jiān)測基因組在各種時間斷面上的整體轉錄表達狀況,因此成為該領域中一項非常重要和關鍵的實驗技術,對該技術所產(chǎn)生的大量實驗數(shù)據(jù)進行高效分析,從中獲得基因組運轉以及調(diào)控的整體系統(tǒng)的機制或者是網(wǎng)絡機制,便成了生物信息學在該領域中首先要解決的問題。40基因組演化與物種演化(生命之樹)41盡管已經(jīng)在分子演化方面取得了許多重要的成就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想說明物種整體的演化歷史似乎不太可靠。例如,智人與黑猩猩之間有98%-99%的結構基因和蛋白質(zhì)是相同的,然而表型上卻具有如此巨大的差異,這就不能不使我們聯(lián)想到形形色色千差萬別的建筑樓群,它們的外觀如此不同,但根底的部件組成卻是幾乎一樣的,差異就在于這些根底部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個別基因在研究物種演化歷史中的重要作用。由于基因組是物種所有遺傳信息的儲藏庫,從根本上決定著物種個體的發(fā)育和生理,因此,從基因組整體結構組織和整體功能調(diào)節(jié)網(wǎng)絡方面,結合相應的生理表征現(xiàn)象,進行基因組整體的演化研究,將是揭示物種真實演化歷史的最正確途徑。42基因組對生命體的整體控制必須通過它所表達的全部蛋白質(zhì)來執(zhí)行,由于基因芯片技術只能反映從基因組到RNA的轉錄水平上的表達情況,由于從RNA到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,因此僅憑基因芯片技術我們還不能最終掌握生物功能具體執(zhí)行者——蛋白質(zhì)的整體表達狀況;近幾年在開展基因芯片的同時,人們也開展了一套研究基因組所有蛋白質(zhì)產(chǎn)物表達情況——蛋白質(zhì)組研究技術,從技術上來講包括二維凝膠電泳技術和質(zhì)譜測序技術。通過二維凝膠電泳技術可以獲得某一時間截面上蛋白質(zhì)組的表達情況,通過質(zhì)譜測序技術就可以得到所有這些蛋白質(zhì)的序列組成。這些都是技術實現(xiàn)問題,最重要的就是如何運用生物信息學理論方法去分析所得到的巨量數(shù)據(jù),從中復原出生命運轉和調(diào)控的整體系統(tǒng)的分子機制。蛋白質(zhì)組

43基因組和蛋白質(zhì)組研究的迅猛開展,使許多新蛋白序列涌現(xiàn)出來,然而要想了解它們的功能,只有氨基酸序列是遠遠不夠的,因為蛋白質(zhì)的功能是通過其三維高級結構來執(zhí)行的,而且蛋白質(zhì)三維結構也不一定是靜態(tài)的,在行使功能的過程中其結構也會相應的有所改變。因此,得到這些新蛋白的完整、精確和動態(tài)的三維結構就成為擺在我們面前的緊迫任務。目前除了通過諸如X射線晶體結構分析、多維核磁共振〔NMR〕波譜分析和電子顯微鏡二維晶體三維重構〔電子晶體學,EC〕等物理方法得到蛋白質(zhì)三維結構蛋白質(zhì)結構

44另外一種廣泛使用的方法就是通過計算機輔助預測的方法,目前,一般認為蛋白質(zhì)的折疊類型只有數(shù)百到數(shù)千種,遠遠小于蛋白質(zhì)所具有的自由度數(shù)目,而且蛋白質(zhì)的折疊類型與其氨基酸序列具有相關性,這樣就有可能直接從蛋白質(zhì)的氨基酸序列通過計算機輔助方法預測出蛋白質(zhì)的三維結構45新藥設計

46隨著結構生物學的開展,相當數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結構獲得精確測定,基于生物大分子結構知識的藥物設計成為當前的熱點。生物信息學的研究不僅可提供生物大分子空間結構的信息,還能提供電子結構的信息,如能級、外表電荷分布、分子軌道相互作用等以及動力學行為的信息,如生物化學反響中的能量變化、電荷轉移、構象變化等。理論模擬還可研究包括生物分子及其周圍環(huán)境的復雜體系和生物分子的量子效應。結構–功能–行為47但生物信息學的任務遠不止于此。在以上工作的根底上,最重要的是如何運用數(shù)理理論成果對生物體進行完整系統(tǒng)的數(shù)理模型描述,使得人類能夠從一個更加明確的角度和一個更加易于操作的途徑來認識和控制自身以及所有其他的生命體48生物信息學不僅僅是一門科學學科,它更是一種重要的研究開發(fā)工具。從科學的角度來講,它是一門研究生物和生物相關系統(tǒng)中信息內(nèi)容物和信息流向的綜合系統(tǒng)科學,只有通過生物信息學的計算處理,我們才能從眾多分散的生物學觀測數(shù)據(jù)中獲得對生命運行機制的詳細和系統(tǒng)的理解。從工具的角度來講,它是今后幾乎進行所有生物〔醫(yī)藥〕研究開發(fā)所必需的舵手和動力機,只有基于生物信息學通過對大量已有數(shù)據(jù)資料的分析處理所提供的理論指導和分析,我們才能選擇正確的研發(fā)方向,同樣,只有選擇正確的生物信息學分析方法和手段,我們才能正確處理和評價新的觀測數(shù)據(jù)并得到準確的結論。49生物信息學的研究意義生物信息學將是21世紀生物學的核心

認識生物本質(zhì)了解生物分子信息的組織和結構,破譯基因組信息,說明生物信息之間的關系改變生物學的研究方式改變傳統(tǒng)研究方式,引進現(xiàn)代信息學方法在醫(yī)學上的重要意義為疾病的診斷和治療提供依據(jù)為設計新藥提供依據(jù)50生物信息學系統(tǒng)化概圖51生物信息學所用的方法和技術

1、數(shù)學統(tǒng)計方法(高維、樣本量的問題)2、動態(tài)規(guī)劃方法3、機器學習與模式識別技術〔從數(shù)據(jù)中學習〕4、數(shù)據(jù)庫技術及數(shù)據(jù)挖掘5、人工神經(jīng)網(wǎng)絡技術6、專家系統(tǒng)7、分子模型化技術8、量子力學和分子力學計算9、生物分子的計算機模擬10、因特網(wǎng)〔Internet〕技術(Grid計算)。。。52目前進展生物信息學與系統(tǒng)生物學(SystemsBiology)復原論整體論系統(tǒng)生物學的4個層次:【?】系統(tǒng)的結構系統(tǒng)的動力學系統(tǒng)的控制系統(tǒng)的設計生物系統(tǒng)的復雜性!53一切從基因組開始…

—“基因組到生命〞〔Genomes

to

Life,GTL〕方案54國內(nèi)外狀況國外國內(nèi)北大、清華

上海生物信息中心

華大基因組信息中心(北京杭州深圳)

天大生物信息中心

中科院計算所生物信息中心

復旦理論生物中心

。。。55炎黃工程中基因與疾病相關局部將實現(xiàn)以下四個大的目標:1)選取一個代表中國人,建立覆蓋95%序列以上的全基因組精細圖譜;2)選取包括漢族、少數(shù)民族、東亞地區(qū)不同國家人群在內(nèi)的100個個體;測序約400個覆蓋度,找到能夠覆蓋所有大于1%的突變的大約100萬個分子標記,建立東亞人種特異性的高密度、高分辨醫(yī)學遺傳圖譜;3)利用醫(yī)學遺傳圖譜,建立包括可用于篩查疾病相關基因的分子標記集,大規(guī)模篩查中國〔東亞〕人群特異性疾病。初步選擇高血壓、高血糖、血脂異常、骨質(zhì)疏松四種高發(fā)多基因復雜疾病,通過疾病和正常個體的比較,識別出疾病表型強關聯(lián)性遺傳多態(tài)性位點組合,用于這些疾病的預測;4)專利疾病關聯(lián)多態(tài)性位點〔約100個〕,與商業(yè)操作相結合,擴大樣本量,并結合個體所處的環(huán)境因素,驗證候選位點,合理進行疾病的預防和個性化診療;5)對疾病相關位點進行功能分析,說明疾病致病機理,從而加快基因研究成果進入臨床的步伐。[摘自華大深圳研究院網(wǎng)站]56機遇生物信息學人才需求學校的人才培養(yǎng)(系統(tǒng)化訓練)〔深圳大學、大學城、南方科技大學〕公司/企業(yè)微芯生物是國內(nèi)研發(fā)小分子專利創(chuàng)新藥物的標志性企業(yè),其自行構建的基于化學基因組學的集成式藥物創(chuàng)新與早期評價體系是當今國際新藥研發(fā)的最重要手段之一〔2005年被批準成為“深圳市化學創(chuàng)新藥物工程技術中心〞〕。醫(yī)療機構〔北京大學深圳醫(yī)院〕57機遇個性化醫(yī)療〔疾病的治療是一種藝術〕診斷(家族歷史)治療(基因治療)制藥(中藥現(xiàn)代化)58機遇芯片技術產(chǎn)業(yè)與效勞第一種分類:微陣列芯片和微流控芯片(第二種分類:主動式芯片與被動式芯片)微陣列芯片基因芯片蛋白芯片組織芯片由科技部主辦,清華大學、中國醫(yī)藥生物技術協(xié)會、中國醫(yī)藥生物技術協(xié)會生物芯片分會、中華醫(yī)學會健康管理學分會、生物芯片北京國家工程研究中心承辦的“生物芯片在醫(yī)學和食品安檢中的應用大會〞于2023年4月21日—23日在北京中關村生命科學園內(nèi)召開。

會議就生物芯片在腫瘤研究、生殖發(fā)育研究、臨床診斷、個體化醫(yī)療、農(nóng)獸藥殘留檢測、致病微生物檢測和藥物研究及開發(fā)中的應用等主題,還舉辦了生物芯片及相關設備試劑展覽。59機遇生物數(shù)據(jù)挖掘與效勞基因篩選基因識別與發(fā)現(xiàn)基因功能預測蛋白結合位點預測蛋白組數(shù)據(jù)分析。。。60挑戰(zhàn)民間的合作學校與學校學校與企業(yè)深圳、香港、珠三角產(chǎn)學研合作61時刻銘記

實驗永遠起著決定作用計算/理論生物學的開展離不開實驗生物學的奉獻實驗生物學日益依賴計算/理論生物學的指導重視根底研究,原創(chuàng)!21世紀生命科學理論計算實驗數(shù)學與物理科學62學習和超越上海生物信息技術研究中心()2002年8月,上海市科學技術委員會依托中國科學院上海生命科學研究院、國家人類基因組南方研究中心、復旦大學、上海交通大學、上海第二醫(yī)科大學、上海醫(yī)藥工業(yè)研究院和中國科學院上海有機化學研究所等單位,整合上海生物信息學主要研究力量,正式組建了上海生物信息技術研究中心〔以下簡稱“中心〞〕?!爸行抹曌鳛樯虾J芯幹频淖允兆灾У莫毩⑹聵I(yè)法人單位,是我國第一個以推動我國生物信息學數(shù)據(jù)共享為目的,完全從事生命科學數(shù)據(jù)庫建設、生物信息學軟件開發(fā)的地方政府支持的獨立事業(yè)法人單位。63生物信息學

國際著名的生物信息中心NCBINationalCenterforBiotechnologyInformation(US)EBI EuropeanBioinformaticsInstitute(EU)HGMPHumanGenomeMappingProjectResourceCentre(UK〕ExPASyExpertofProteinAnalysisSystem(Switzerland)CMBICentreofMolecularandBiomolecule(TheNetherlands)ANGISNationalGenomeInformationService(Australia)NIGNationalInstituteofGenetics(Japan)BICNationalBioinformaticsCentre(Singapore)64分子生物學網(wǎng)站NCBI:EMBL:ExPASy:UCSC:://NIG:65DNA數(shù)據(jù)庫:EMBL:歐洲分子生物學實驗室〔歐洲的分子生物學實驗室〕核酸序列數(shù)據(jù)庫NCBI:美國國家生物技術情報中心,美國最主要的核酸序列數(shù)據(jù)庫,世界兩大核酸數(shù)據(jù)庫之一。DDBJ:日本國立遺傳學研究所〔日本國家的學會DNA數(shù)據(jù)庫為數(shù)據(jù)生物學〕維護集中。位于日本的核酸序列數(shù)據(jù)庫,為亞洲主要的核酸序列數(shù)據(jù)庫。66蛋白質(zhì)序列數(shù)據(jù)庫:

SWISS-PROT:1987年由日內(nèi)瓦大學醫(yī)學生物化學系和歐洲分子生物學實驗室共同維護;現(xiàn)在由EMBL分支機構EBI維護。PIR:〔ProteinIdentificationResource〕由美國國家生物醫(yī)學研究基金會所支持,德國馬普學會慕尼黑蛋白質(zhì)序列信息中心〔MIPS〕和日本國際蛋白質(zhì)序列數(shù)據(jù)庫〔JIPID〕共同維護。TrEMBL:〔TranslatedEMBL,TrEMBL〕。是從EMBL中翻譯出來的氨基酸序列。PDB:〔proteindatabank,PDB〕蛋白序列三維立體結構數(shù)據(jù)庫,由美國自然科學基金會、能源部和國立衛(wèi)生研究院共同投資建設。67基因組及其它數(shù)據(jù)庫GDB:人類基因組數(shù)據(jù)庫。支持構建人類基因圖譜和測序。其主節(jié)點移至加拿大多倫多兒童醫(yī)院生物信息超級計算中心。GeneCards:基因及其產(chǎn)物以及生物醫(yī)學應用的文獻庫。以色列魏茨曼科學研究所維護。其它:UniGene〔表達譜信息〕、RefSeq、dbEST、dbSTS、dbSNP、CDD〔ConservedDomainDatabase,蛋白結構域數(shù)據(jù)庫〕、OMIM〔onlinemendelianInheritanceinMan〕:是孟德爾人類遺傳學〔MIM〕的持續(xù)更新的電子版等等。68NationalCenterforBiotecnology

Information(NCBI)69NCBI起源和任務NCBI于1988年11月4日創(chuàng)立,由于參議員ClaudePepper意識到信息計算機化過程方法對指導生物醫(yī)學研究的重要性,于是提案立法設立NCBI。其隸屬于NIH的國立醫(yī)學圖書館〔NLM〕的一個分支,NLM負責創(chuàng)立生物信息學數(shù)據(jù)庫。NCBI的任務是開展新的信息學技術以提高對控制健康和疾病的根本分子和遺傳過程的理解。70NCBI的主要作用建立關于分子生物學,生物化學和遺傳學知識的存儲和分析的自動系統(tǒng)實行關于用于分析生物學重要分子和復合物的結構和功能的基于計算機的信息處理的先進方法的研究加速生物技術研究者和醫(yī)藥治療人員對數(shù)據(jù)庫和軟件的使用。全世界范圍內(nèi)的生物技術信息收集的合作努力。71NCBI的維護NCBI有一個多學科的研究小組包括計算機科學家、分子生物學家、數(shù)學家、生物化學家、實驗物理學家和結構生物學家,集中于計算分子生物學的根本的和應用的研究。他們一起用數(shù)學和計算的方法研究在分子水平上的根本的生物醫(yī)學問題。這些問題主要包括基因的組織、序列的分析和結構的預測。72NCBI所含的數(shù)據(jù)庫點擊73NCBI------DatabasesTherearethreemajorpublicDNAdatabasesGenBankDDBJEMBLHousedatEBIEuropeanBioinformaticsInstituteHousedatNCBINationalCenterforBiotechnologyInformationHousedinJapan74數(shù)據(jù)庫選擇75NCBI中一些常用的數(shù)據(jù)庫資源PubMed:Thebiomedicalliterature(PubMed)Nucleotide:sequencedatabase(GenBank)Protein:sequencedatabaseStructure:three-dimensionalmacromolecularstructuresGenome:completegenomeassembliesSNP:singlenucleotidepolymorphismsOMIM:onlineMendelianInheritanceinMan76PubMedis…

是美國國立醫(yī)學圖書館〔NationalLibraryofMedicine,NLM〕的國家生物信息中心

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論