版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第一章第一章 緒論緒論淮海工學(xué)院海洋學(xué)院淮海工學(xué)院海洋學(xué)院 申欣申欣20102010年秋季年秋季生物信息學(xué)contents1.1什么是生物信息學(xué)?什么是生物信息學(xué)?1.2生物信息學(xué)簡史生物信息學(xué)簡史1.3生物信息學(xué)研究的基本方法生物信息學(xué)研究的基本方法1.4 生物信息學(xué)主要研究內(nèi)容生物信息學(xué)主要研究內(nèi)容1.5生物信息學(xué)當(dāng)前的主要任務(wù)生物信息學(xué)當(dāng)前的主要任務(wù)1.6參考書及期刊參考書及期刊生物信息學(xué)(生物信息學(xué)(bioinformatics)是是80年代未隨年代未隨著人類基因組計劃(著人類基因組計劃(human genome project)的啟動而興起的一門新的交叉學(xué)科的啟動而興起的一門新的交叉
2、學(xué)科。它涉及生物學(xué)、數(shù)學(xué)、計算機科學(xué)和工。它涉及生物學(xué)、數(shù)學(xué)、計算機科學(xué)和工程學(xué),依賴于計算機科學(xué)、工程學(xué)和應(yīng)用程學(xué),依賴于計算機科學(xué)、工程學(xué)和應(yīng)用數(shù)學(xué)的基礎(chǔ),依賴于生物實驗和衍生數(shù)據(jù)數(shù)學(xué)的基礎(chǔ),依賴于生物實驗和衍生數(shù)據(jù)的大量儲存。的大量儲存。概念(廣義)概念(廣義)生物體系和過程中信息生物體系和過程中信息的存貯、傳遞的存貯、傳遞和表達和表達細胞、組織、器官的生理、病理細胞、組織、器官的生理、病理、藥理過程的中各種生物信息、藥理過程的中各種生物信息信息科學(xué)信息科學(xué)生生命命科科學(xué)學(xué)中中的的信信息息科科 學(xué)學(xué) 概念(狹義)概念(狹義)生物生物分子數(shù)據(jù)分子數(shù)據(jù)深層次深層次生物學(xué)知識生物學(xué)知識分子生物
3、信息學(xué)分子生物信息學(xué)molecular bioinformatics挖掘挖掘獲取獲取 將計算機科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、將計算機科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、加工、存儲、分類、檢索與分析,以達到理解這些生物大加工、存儲、分類、檢索與分析,以達到理解這些生物大分子信息的生物學(xué)意義的交叉學(xué)科。分子信息的生物學(xué)意義的交叉學(xué)科。 1995年,在美國人類基因組計劃(年,在美國人類基因組計劃(hgp)第一個五年總結(jié)報告中給出了一個第一個五年總結(jié)報告中給出了一個較為完較為完整整的生物信息學(xué)的定義:的生物信息學(xué)的定義: 生信息學(xué)是包含生物信息的獲取、處理、生信息學(xué)是包含生物信息的獲取、處理
4、、貯存、分發(fā)、分析和解釋的所有方面的一貯存、分發(fā)、分析和解釋的所有方面的一門學(xué)科,它綜合運用數(shù)學(xué)、計算機科學(xué)和門學(xué)科,它綜合運用數(shù)學(xué)、計算機科學(xué)和生物學(xué)的各種工具進行研究,目的在于了生物學(xué)的各種工具進行研究,目的在于了解大量的生物學(xué)意義。解大量的生物學(xué)意義。biology in the 21st century is being transformed from a purely lab-based science to an information science as well. /about/primer/bioinformatics.htmlnc
5、bi的解釋:的解釋:bioinformatics is the field of science in which biology, computer science, and information technology merge into a single discipline. the ultimate goal of the field is to enable the discovery of new biological insights as well as to create a global perspective from which unifying principle
6、s in biology can be discerned.1.3生物信息學(xué)研究的基本方法 1.建立生物數(shù)據(jù)庫:核苷酸順序數(shù)據(jù)庫建立生物數(shù)據(jù)庫:核苷酸順序數(shù)據(jù)庫(genbank)、protein data bank (pdb)、氨基酸順序數(shù)據(jù)庫、氨基酸順序數(shù)據(jù)庫(swiss-pro)、酵母、酵母基因組數(shù)據(jù)庫基因組數(shù)據(jù)庫(yeasts)、美國種質(zhì)保藏中心、美國種質(zhì)保藏中心(atcc)、美國、美國專利局?jǐn)?shù)據(jù)庫專利局?jǐn)?shù)據(jù)庫(uspo)等;等;2.數(shù)據(jù)庫檢索:如數(shù)據(jù)庫檢索:如blast、pubmed等;等;3.序列分析:序列對位排列、同源比較、進化分析等;序列分析:序列對位排列、同源比較、進化分析等;
7、4.統(tǒng)計模型:如隱馬爾可夫模型統(tǒng)計模型:如隱馬爾可夫模型(hidden markov model, hmm)基因識別、藥物設(shè)計;最大似然模型基因識別、藥物設(shè)計;最大似然模型(maximun likelihood model, ml)、 最大簡約法最大簡約法(maximun parsimony, mp)分子進化分析等;分子進化分析等;5.算法:如自動序列拼接、外顯子預(yù)測和同源比較、遺傳算算法:如自動序列拼接、外顯子預(yù)測和同源比較、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)法、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network)等。等。1.4 生物信息學(xué)主要研究內(nèi)容1.4.1 生物分子數(shù)據(jù)的收集與管理生
8、物分子數(shù)據(jù)的收集與管理1.4.2 數(shù)據(jù)庫搜索及序列比較數(shù)據(jù)庫搜索及序列比較 1.4.3 基因組序列分析基因組序列分析 1.4.4 基因表達數(shù)據(jù)的分析與處理基因表達數(shù)據(jù)的分析與處理 1.4.5 蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測 基因組基因組數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)序列序列數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)結(jié)構(gòu)結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)庫 ddbjemblgenbankswiss-prot pdbpir1.4.1生物分子數(shù)據(jù)的收集與管理生物分子數(shù)據(jù)的收集與管理1.4.2數(shù)據(jù)庫搜索及序列比較數(shù)據(jù)庫搜索及序列比較 搜索同源序列在一定程度上就是通過序列比較尋找搜索同源序列在一定程度上就是通過序列比較尋找相似序列相似序列 序列
9、比較的一個基本操作就是序列比較的一個基本操作就是比對比對(alignment),即將兩個序列的各個字符(代表核苷酸或者氨基,即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述似程度的一種定性描述多重序列比對多重序列比對研究的是多個序列的共性。序列的多研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。于研究一組
10、蛋白質(zhì)之間的進化關(guān)系。 發(fā)現(xiàn)同源分子1.4.3基因組序列分析基因組序列分析 遺傳語言分析遺傳語言分析天書天書 基因組結(jié)構(gòu)分析基因組結(jié)構(gòu)分析基因識別基因識別基因功能注釋基因功能注釋基因調(diào)控信息分析基因調(diào)控信息分析基因組比較基因組比較1.4.4基因表達數(shù)據(jù)的分析與處理基因表達數(shù)據(jù)的分析與處理目前對基因表達數(shù)據(jù)的處理主要是進行目前對基因表達數(shù)據(jù)的處理主要是進行聚類分析,將表達模式相似的基因聚為聚類分析,將表達模式相似的基因聚為一類,在此基礎(chǔ)上尋找相關(guān)基因,分析一類,在此基礎(chǔ)上尋找相關(guān)基因,分析基因的功能?;虻墓δ?。1.4.5蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測 蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定蛋白質(zhì)的
11、生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定 ,蛋白,蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑蛋白質(zhì)結(jié)構(gòu)預(yù)測分為蛋白質(zhì)結(jié)構(gòu)預(yù)測分為:二級結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測 蛋白質(zhì)折疊蛋白質(zhì)折疊二級結(jié)構(gòu)預(yù)測在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題 在二級結(jié)構(gòu)預(yù)測方面主要方法有:在二級結(jié)構(gòu)預(yù)測方面主要方法有:立體化學(xué)方法立體化學(xué)方法圖論方法圖論方法統(tǒng)計方法統(tǒng)計方法最鄰近決策方法最鄰近決策方法基于規(guī)則的專家系統(tǒng)方法基于規(guī)則的專家系統(tǒng)方法分子動力學(xué)方法分子動力學(xué)方法人工神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)方法 預(yù)測準(zhǔn)確率超過
12、預(yù)測準(zhǔn)確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的phd系統(tǒng)。系統(tǒng)。空間結(jié)構(gòu)預(yù)測在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是法是同源模型法同源模型法 該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu)于折疊成相似的三維空間結(jié)構(gòu)運用同源模型方法可以完成所有蛋白質(zhì)運用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測工作的空間結(jié)構(gòu)預(yù)測工作1.5生物信息學(xué)當(dāng)前的主要任務(wù)1.5.1 基因組基因組1.5.2 蛋白質(zhì)組蛋白質(zhì)組1.5.3 蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)1.5.4 新藥設(shè)計新藥設(shè)計1.5.1
13、.1 新基因的發(fā)現(xiàn)新基因的發(fā)現(xiàn) 1.5.1基因組 通過計算分析從通過計算分析從est(expressed sequence tags)序列庫中拼接出完整的新基因編碼區(qū),也就是)序列庫中拼接出完整的新基因編碼區(qū),也就是通俗所說的通俗所說的“電子克隆電子克隆”;通過計算分析從基因;通過計算分析從基因組組dna序列中確定新基因編碼區(qū)。序列中確定新基因編碼區(qū)。經(jīng)過多年的發(fā)展,已經(jīng)形成許多分析方法,如根經(jīng)過多年的發(fā)展,已經(jīng)形成許多分析方法,如根據(jù)編碼區(qū)具有的獨特序列特征、根據(jù)編碼區(qū)與非據(jù)編碼區(qū)具有的獨特序列特征、根據(jù)編碼區(qū)與非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布的統(tǒng)編碼區(qū)在堿基組成上的差異、根據(jù)高維分
14、布的統(tǒng)計方法、根據(jù)神經(jīng)網(wǎng)絡(luò)方法、根據(jù)分形方法和根計方法、根據(jù)神經(jīng)網(wǎng)絡(luò)方法、根據(jù)分形方法和根據(jù)密碼學(xué)方法等。據(jù)密碼學(xué)方法等。 非蛋白編碼區(qū)生物學(xué)意義的分析非蛋白編碼區(qū)生物學(xué)意義的分析一種一種是基于已有的已經(jīng)為實驗證實的所有功能已是基于已有的已經(jīng)為實驗證實的所有功能已知的知的dna元件的序列特征,預(yù)測非蛋白編碼區(qū)中元件的序列特征,預(yù)測非蛋白編碼區(qū)中可能含有的功能已知的可能含有的功能已知的dna元件,從而預(yù)測其可元件,從而預(yù)測其可能的生物學(xué)功能,并能的生物學(xué)功能,并通過實驗進行驗證通過實驗進行驗證;對非蛋白編碼區(qū)進行生物學(xué)意義對非蛋白編碼區(qū)進行生物學(xué)意義分析的策略有兩種。分析的策略有兩
15、種。另一種另一種則是通過數(shù)理理論直接探索非蛋白編碼區(qū)則是通過數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預(yù)測其可能的新的未知的序列特征,并從理論上預(yù)測其可能的信息含義,最后同樣的信息含義,最后同樣通過實驗驗證通過實驗驗證?;蚪M整體功能及其調(diào)節(jié)網(wǎng)絡(luò)的系統(tǒng)把握基因組整體功能及其調(diào)節(jié)網(wǎng)絡(luò)的系統(tǒng)把握 基因芯片基因芯片技術(shù)由于可以監(jiān)測基因組在各種時間技術(shù)由于可以監(jiān)測基因組在各種時間斷面上的整體轉(zhuǎn)錄表達狀況,因此成為該領(lǐng)域中斷面上的整體轉(zhuǎn)錄表達狀況,因此成為該領(lǐng)域中一項非常重要和關(guān)鍵的實驗技術(shù)。一項非常重要和關(guān)鍵的實驗技術(shù)。對該技術(shù)所產(chǎn)生的大量實驗數(shù)據(jù)進行高效分析,對該技術(shù)
16、所產(chǎn)生的大量實驗數(shù)據(jù)進行高效分析,從中獲得基因組運轉(zhuǎn)以及調(diào)控的整體系統(tǒng)的機制從中獲得基因組運轉(zhuǎn)以及調(diào)控的整體系統(tǒng)的機制或者是網(wǎng)絡(luò)機制,便成了生物信息學(xué)在該領(lǐng)域中或者是網(wǎng)絡(luò)機制,便成了生物信息學(xué)在該領(lǐng)域中首先要解決的問題。首先要解決的問題。 基因組演化與物種演化基因組演化與物種演化 out of africa1. 人類人類(現(xiàn)代智人現(xiàn)代智人)大約起源于大約起源于100,000200,000年前年前2. 45,000年前走出非洲。年前走出非洲。3. 根據(jù)線粒體基因組構(gòu)建進化樹,進行系根據(jù)線粒體基因組構(gòu)建進化樹,進行系統(tǒng)發(fā)育樹的分子進化分析。統(tǒng)發(fā)育樹的分子進化分析。4. 線粒體:母系
17、遺傳。線粒體:母系遺傳。5. 夏娃:黑人!夏娃:黑人!6. 人類遷移的歷史。人類遷移的歷史。53個人的線粒體基因組個人的線粒體基因組(16,587bp)人類遷移的路線人類遷移的路線1.5.2蛋白質(zhì)組 從技術(shù)上來講包括從技術(shù)上來講包括二維凝膠電泳技術(shù)二維凝膠電泳技術(shù)和和質(zhì)譜質(zhì)譜測測序技術(shù)。序技術(shù)。通過通過二維凝膠電泳二維凝膠電泳技術(shù)可以獲得某一時間截面技術(shù)可以獲得某一時間截面上蛋白質(zhì)組的表達情況;通過上蛋白質(zhì)組的表達情況;通過質(zhì)譜質(zhì)譜測序技術(shù)就可測序技術(shù)就可以得到所有這些蛋白質(zhì)的序列組成。以得到所有這些蛋白質(zhì)的序列組成。這些都是技術(shù)實現(xiàn)問題,最重要的就是如何運這些都是技術(shù)實現(xiàn)問題,最重要的就是如
18、何運用生物信息學(xué)理論方法去分析所得到的巨量數(shù)據(jù),用生物信息學(xué)理論方法去分析所得到的巨量數(shù)據(jù),從中還原出生命運轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分子機從中還原出生命運轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分子機制。制。 通過計算機輔助預(yù)測的方法,獲得待測蛋白的三級結(jié)構(gòu)。通過計算機輔助預(yù)測的方法,獲得待測蛋白的三級結(jié)構(gòu)。目前,一般認(rèn)為蛋白質(zhì)的折疊類型只有數(shù)百到數(shù)千種,遠目前,一般認(rèn)為蛋白質(zhì)的折疊類型只有數(shù)百到數(shù)千種,遠遠小于蛋白質(zhì)所具有的自由度數(shù)目,而且蛋白質(zhì)的折疊類型遠小于蛋白質(zhì)所具有的自由度數(shù)目,而且蛋白質(zhì)的折疊類型與其氨基酸序列具有相關(guān)性,這樣就有可能直接從蛋白質(zhì)的與其氨基酸序列具有相關(guān)性,這樣就有可能直接從蛋白質(zhì)的氨基酸
19、序列通過計算機輔助方法預(yù)測出蛋白質(zhì)的三維結(jié)構(gòu)。氨基酸序列通過計算機輔助方法預(yù)測出蛋白質(zhì)的三維結(jié)構(gòu)。1.5.3蛋白質(zhì)結(jié)構(gòu)(預(yù)測) 1.5.4新藥設(shè)計隨著結(jié)構(gòu)生物學(xué)的發(fā)展,一些蛋白質(zhì)、隨著結(jié)構(gòu)生物學(xué)的發(fā)展,一些蛋白質(zhì)、核酸、多糖的三維結(jié)構(gòu)獲得精確測定。核酸、多糖的三維結(jié)構(gòu)獲得精確測定。根據(jù)生物大分子結(jié)構(gòu)知識,有針對性地根據(jù)生物大分子結(jié)構(gòu)知識,有針對性地設(shè)計藥物成為熱點。設(shè)計藥物成為熱點。生物信息學(xué)的研究不僅可提供生物大分生物信息學(xué)的研究不僅可提供生物大分子空間結(jié)構(gòu)的信息,還能提供電子結(jié)構(gòu)子空間結(jié)構(gòu)的信息,還能提供電子結(jié)構(gòu)的信息,如能級、表面電荷分布、分子的信息,如能級、表面電荷分布、分子軌道相互作
20、用等以及動力學(xué)行為的信息軌道相互作用等以及動力學(xué)行為的信息,如生物化學(xué)反應(yīng)中的能量變化、電荷,如生物化學(xué)反應(yīng)中的能量變化、電荷轉(zhuǎn)移、構(gòu)象變化等。理論模擬還可研究轉(zhuǎn)移、構(gòu)象變化等。理論模擬還可研究包括生物分子及其周圍環(huán)境的復(fù)雜體系包括生物分子及其周圍環(huán)境的復(fù)雜體系和生物分子的量子效應(yīng)。和生物分子的量子效應(yīng)。1.61.6參考書及期刊參考書及期刊教材:陶士珩主編。生物信教材:陶士珩主編。生物信息學(xué)??茖W(xué)出版社,息學(xué)??茖W(xué)出版社,2007入門級參考書:李衍達等譯。入門級參考書:李衍達等譯。生物信息學(xué)生物信息學(xué)基因和蛋白質(zhì)基因和蛋白質(zhì)分析的實用指南。清華大學(xué)出分析的實用指南。清華大學(xué)出版社,版社,2001國內(nèi)相關(guān)期刊國內(nèi)相關(guān)期刊生物信息學(xué)生物信息學(xué)http:/ proteomics & bioinformatic
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年一般貨物運輸合同標(biāo)準(zhǔn)范文(2篇)
- 2025年個人委托開發(fā)項目合同范文(2篇)
- 木門設(shè)計合同
- 房地產(chǎn)項目銷售代理合同
- 教育培訓(xùn)合同
- 計算機系統(tǒng)集成合同
- 2025年上海二手房購房合同經(jīng)典版(三篇)
- 機床運輸安全責(zé)任合同
- 住宅翻新抵押貸款合同模板
- 2025年度個人購房貸款貸款額度調(diào)整合同4篇
- 中華人民共和國保守國家秘密法實施條例培訓(xùn)課件
- 管道坡口技術(shù)培訓(xùn)
- 2024年全國統(tǒng)一高考英語試卷(新課標(biāo)Ⅰ卷)含答案
- 2024年認(rèn)證行業(yè)法律法規(guī)及認(rèn)證基礎(chǔ)知識 CCAA年度確認(rèn) 試題與答案
- 皮膚儲存新技術(shù)及臨床應(yīng)用
- 外研版七年級英語上冊《閱讀理解》專項練習(xí)題(含答案)
- 2024年遼寧石化職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫必考題
- 上海市復(fù)旦大學(xué)附中2024屆高考沖刺模擬數(shù)學(xué)試題含解析
- 幼兒園公開課:大班健康《國王生病了》課件
- 小學(xué)六年級說明文閱讀題與答案大全
- 人教pep小學(xué)六年級上冊英語閱讀理解練習(xí)題大全含答案
評論
0/150
提交評論