




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
杜娟2013.02.27生物信息學(xué)杜娟生物信息學(xué)課程簡介課程特點課程目標(biāo)課程形式參考教材與文獻教師聯(lián)系方式成績構(gòu)成2課程簡介課程特點2生物、計算機、數(shù)學(xué)、化學(xué)等多學(xué)科交叉,知識覆蓋面廣;涉及從基因組序列分析直到藥物設(shè)計等眾多內(nèi)容,且應(yīng)用領(lǐng)域?qū)拸V;生物信息數(shù)據(jù)資源與分析工具繁多,實踐環(huán)節(jié)非常重要;理論方法尚不系統(tǒng)成熟,處于迅速發(fā)展變化階段,知識更新快。缺乏合適的教材課程特點3生物、計算機、數(shù)學(xué)、化學(xué)等多學(xué)科交叉,知識覆蓋面廣;課程特點課程目標(biāo)掌握生物信息學(xué)的基本知識與概念了解生物信息學(xué)網(wǎng)上資源針對核酸和蛋白質(zhì)的分析4課程目標(biāo)掌握生物信息學(xué)的基本知識與概念4課程形式講授概念與知識點(Textbooks)自學(xué)與討論(Websites)理解(Literaturereferences)掌握與鞏固(ComputerExperiences)5課程形式講授概念與知識點(Textbooks)5主要的參考教材1《生物信息學(xué)》,陶士珩主編科學(xué)出版社,20072《生物信息學(xué)》,DavidW.Mount著,鐘揚、王莉、張亮等譯,高等教育出版社,2003。
3生物信息學(xué)——基因和蛋白質(zhì)分析的實用指南(AndreasD.BaxevanisAndB.F.FrancisOuellette著).李衍達、孫子榮等譯.北京:清華大學(xué)出版社,2000
4《簡明生物信息學(xué)》,鐘揚等主編.高等教育出版社,2001
5《探索基因組學(xué)、蛋白質(zhì)組學(xué)和生物信息學(xué)》,孫子榮譯.科學(xué)出版社,2004
6《生物信息學(xué)方法與實踐》,張成崗賀福初編著.科學(xué)出版社,20026主要的參考教材1《生物信息學(xué)》,陶士珩主編科參考文獻主要為英文原始文獻,鼓勵大家閱讀。課題的研究方法7參考文獻主要為英文原始文獻,鼓勵大家閱讀。7聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com
成績構(gòu)成隨堂測驗、課堂表現(xiàn)30%
作業(yè)30%
項目報告40%
8聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com89生物信息學(xué)——緒論一、生物信息學(xué)及其研究意義二、生物信息學(xué)的發(fā)展現(xiàn)狀三、生物信息學(xué)當(dāng)前的主要研究內(nèi)容四、與生物信息學(xué)密切相關(guān)的學(xué)科五、生物信息學(xué)產(chǎn)業(yè)及前景9生物信息學(xué)——緒論一、生物信息學(xué)及其研究意義一、生物信息學(xué)及其研究意義生物信息學(xué)第一章課件背景1.
人類基因組計劃(HGP)投入30億美元,2003年完成精細圖,約30億個數(shù)據(jù)(堿基),相當(dāng)于3000本每本1000頁每頁1000字的“天書”。曼哈頓原子彈計劃阿波羅登月計劃人類基因組計劃11背景1.人類基因組計劃(HGP)曼哈頓原子彈計劃阿波羅登2.模式生物基因組計劃模式生物基因組計劃是人類基因組計劃的一個重要組成部分。模式生物有:大腸桿菌、酵母、擬南芥、線蟲、果蠅和小鼠等
3.相關(guān)功能基因組計劃
轉(zhuǎn)錄組,基因表達譜,蛋白質(zhì)組……122.模式生物基因組計劃12生物學(xué)數(shù)據(jù)庫的增長情況至今1000多個13生物學(xué)數(shù)據(jù)庫的增長情況至今1000多個13序列數(shù)據(jù)增長趨勢14序列數(shù)據(jù)增長趨勢14生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來所說過的話的數(shù)百倍,而且還將以越來越快的速度增長。15生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來面對堆積如山的生物學(xué)數(shù)據(jù)……16面對堆積如山的生物學(xué)數(shù)據(jù)……16數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAACGT?17數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATG多學(xué)科高度交叉
生物學(xué)醫(yī)學(xué)
數(shù)學(xué)、統(tǒng)計學(xué)物理學(xué)、化學(xué)信息、系統(tǒng)與計算科學(xué)高性能計算、數(shù)據(jù)庫、網(wǎng)格計算生物信息學(xué)與系統(tǒng)生物學(xué)18多學(xué)科高度交叉生物學(xué)醫(yī)學(xué)數(shù)學(xué)、統(tǒng)計學(xué)物理學(xué)、化學(xué)信息、多尺度數(shù)據(jù)的整合和模擬19多尺度數(shù)據(jù)的整合和模擬19什么是生物信息學(xué)
生物信息學(xué)(BIOINFORMATICS)是一門集數(shù)學(xué),計算機科學(xué)和生物學(xué)的工具以及技術(shù)于一體的涵蓋了生物信息的獲取,處理,存儲,分配,分析和闡述等各個方面以理解海量的生物學(xué)數(shù)據(jù)為目的的學(xué)科UnderstandingOurGeneticInheritance.TheUSHumanGenomeProject:TheFirstFiveYears1991-1995.NIHPublicationNo.90-1590,April,1995生物信息技術(shù)是一個多學(xué)科交叉的前沿生物技術(shù)20什么是生物信息學(xué)生物信息學(xué)(BIOINFORMA生物信息學(xué)研究的意義科學(xué)意義:可望從海量生物學(xué)數(shù)據(jù)分析中獲得對生命運行機制和疾病機理等的深入理解。應(yīng)用價值:在生物醫(yī)藥研究和相關(guān)生物技術(shù)相關(guān)產(chǎn)業(yè)(生物制藥、農(nóng)、林、牧、漁、環(huán)保等)的發(fā)展中將發(fā)揮越來越重要的作用。21生物信息學(xué)研究的意義科學(xué)意義:可望從海量生物學(xué)數(shù)據(jù)分析中獲得生物信息學(xué)是生命科學(xué)與信息技術(shù)交叉融合的新學(xué)科,也是當(dāng)今全球最具發(fā)展前途的學(xué)科之一。
WhenIgivetalkstoyoungscientistsseekingadviceaboutareasoffutureintensescientificexcitement,computationalbiologyismynumberonerecommendation.FrancisCollins,DirectorofHGPatNIH生物信息學(xué)是生命科學(xué)與信息技術(shù)交叉融合的新學(xué)科,也是當(dāng)今全球
生命科學(xué)已從一種以實驗為基礎(chǔ)的科學(xué)轉(zhuǎn)向以信息為基礎(chǔ)的科學(xué),其成功將大大依靠信息科學(xué)與生命科學(xué)的聯(lián)姻、依賴于生物信息技術(shù)的發(fā)展?;蛐畔F(xiàn)在正推動著生物制藥革命。破譯人類基因組給我們帶來了打開這個星球上最有價值的圖書館的鑰匙,但我們現(xiàn)在閱讀這些圖書還處在非常初級的水平,科學(xué)家的下一步工作將是如何把信息從這些圖書中挖掘出來。目前美國缺少有能力閱讀這部人類基因“天書”并使用其中信息的人。這個領(lǐng)域有非常多的機會,有非常大的需要。據(jù)估計,這一領(lǐng)域所需要的研究人員數(shù)量將是現(xiàn)有人數(shù)的50倍。培養(yǎng)這種人才就像破譯人類基因組一樣重要。
EricLander,200223生命科學(xué)已從一種以實驗為基礎(chǔ)的科學(xué)轉(zhuǎn)向以信息為基礎(chǔ)的科學(xué),二、生物信息學(xué)的發(fā)展現(xiàn)狀二、生物信息學(xué)的發(fā)展現(xiàn)狀生物信息學(xué)的萌芽1956年在美國召開過首次“生物學(xué)中的信息理論”討論會
60年代美國建立了手工搜集數(shù)據(jù)的蛋白質(zhì)數(shù)據(jù)庫,PIR
1962年Zuckerkandl基于序列變異分析的分子演化研究
1964年Davies開創(chuàng)了蛋白質(zhì)結(jié)構(gòu)預(yù)測的研究
1970年Needleman等發(fā)表了廣受重視的兩序列比較算法
1970年出現(xiàn)ComputerMethodsandProgramsinBiomedicine期刊
1974年Ratner首先對分子遺傳調(diào)控系統(tǒng)進行處理分析
1975年P(guān)ipas等首先提出用計算機技術(shù)預(yù)測RNA二級結(jié)構(gòu)
1979年美國洛斯阿拉莫斯國家實驗室建立GenBank25生物信息學(xué)的萌芽1956年在美國召開過首次“生物學(xué)中的信生物信息學(xué)的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計算分子生物學(xué)的綜述1982年歐洲分子生物學(xué)實驗室提供EMBL服務(wù)1984年日本著手建立國家級核酸序列數(shù)據(jù)庫DDBJ1985年出現(xiàn)ComputerApplicationintheBiosciences期刊2620世紀(jì)80年代末期,林華安博士compbio——bioinformatique——bio-informatics——bioinformatics“生物信息學(xué)之父”生物信息學(xué)的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計國外生物信息學(xué)的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌現(xiàn)生物科技公司和制藥工業(yè)內(nèi)部生物信息學(xué)部門的數(shù)量與日俱增即使象美國這樣的發(fā)達國家也面臨生物信息人才匱乏的局面許多大學(xué)和研究機構(gòu)已經(jīng)成立自己的生物信息學(xué)中心1999年美國NIH專家委員會又建議迅速在大學(xué)和研究機構(gòu)中建立20個生物計算中心,給予每個中心每年800萬美元的支持,從事有關(guān)研究和人才培養(yǎng)英國所有主要研究資助機構(gòu)達成共識,認(rèn)為應(yīng)高度優(yōu)先滿足對生物信息學(xué)技術(shù)的需求,并已實現(xiàn)對相關(guān)人才培養(yǎng)的大力資助27國外生物信息學(xué)的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌國外生物信息學(xué)的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技術(shù)信息中心(NCBI)歐洲于1993年著手建立歐洲生物信息學(xué)研究所(EBI)日本于1995年組建了自己的信息生物學(xué)中心(CIB)九十年代以來,生物數(shù)據(jù)分析技術(shù)獲得了突飛猛進的發(fā)展。生物信息專業(yè)期刊越來越多:如
Bioinformatics
JournalofComputationalBiology
BriefingsinBioinformatics
ActaBiotheoretica
BioInformaticsTechnology&Systems
BioinformNewsletter互聯(lián)網(wǎng)上的生物信息學(xué)網(wǎng)點非常繁多28國外生物信息學(xué)的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技國內(nèi)生物信息學(xué)的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委,地方政府 特別是:863計劃設(shè)立了“生物信息技術(shù)”主題眾多高校與研究機構(gòu)參與:北京大學(xué),中科院生物物理所、天津大學(xué),中科院理論物理所,清華大學(xué),內(nèi)蒙古大學(xué)、上海生命研究院,東南大學(xué),華中科技大學(xué),復(fù)旦大學(xué)等等成立了一批中心,如:北京大學(xué)于1997年成立了生物信息學(xué)中心上海生命科學(xué)研究院于2000年成立了生物信息學(xué)中心上海市于2002年成立生物信息技術(shù)工程研究中心取得了一些成績,如基因組測序與分析,數(shù)據(jù)庫,算法軟件29國內(nèi)生物信息學(xué)的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委三、生物信息學(xué)當(dāng)前的
主要研究內(nèi)容三、生物信息學(xué)當(dāng)前的
主要研究內(nèi)容生物信息學(xué)的發(fā)展過程大致經(jīng)歷了3個階段:前基因組時代--生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)、DNA和蛋白質(zhì)序列分析、全局和局部的序列對位排列;基因組時代--基因?qū)ふ液妥R別、網(wǎng)絡(luò)數(shù)據(jù)庫系統(tǒng)的建立、交互界面的開發(fā);后基因組時代--大規(guī)?;蚪M系統(tǒng)分析、蛋白質(zhì)組分析31生物信息學(xué)的發(fā)展過程大致經(jīng)歷了3個階段:31
生物信息服務(wù)平臺建設(shè)基因組序列分析蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)功能預(yù)測基因表達譜數(shù)據(jù)分析疾病基因的預(yù)測藥物設(shè)計中的應(yīng)用32生物信息學(xué)的主要研究內(nèi)容生物信息服務(wù)平臺建設(shè)32生物信息學(xué)的主要研究內(nèi)容1.生物信息服務(wù)平臺建設(shè)生物信息數(shù)據(jù)的收集,建立生物信息一級數(shù)據(jù)庫和二級數(shù)據(jù)庫;建立生物信息傳輸?shù)膰H聯(lián)網(wǎng)系統(tǒng);建立生物信息數(shù)據(jù)質(zhì)量的評估與檢測系統(tǒng);建立生物信息的可視化和在線服務(wù)系統(tǒng);331.生物信息服務(wù)平臺建設(shè)332.基因組序列分析342.基因組序列分析342.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預(yù)測(新基因的發(fā)現(xiàn))意義:得到DNA序列中蛋白編碼基因是認(rèn)識基因組、了解其運作機理的第一步;利用計算機預(yù)測蛋白編碼基因是一種方便、快捷的方法?,F(xiàn)狀:經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但效果仍難令人滿意。以人類基因組為例,目前對人類基因數(shù)量的估計仍是眾說紛紜。352.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預(yù)測(
例:WHATISGENEPREDICTION?
GIVENANUNCHARACTERIZEDDNASEQUENCE,FINDOUT:
1.WHEREDOESTHEGENESTARTSANDENDS?
2.WHICHREGIONSCODEFORAPROTEIN?
AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCgene1gene2gene3exonintergenicregionintron36例:WHATISGENEPREDICTION?
2.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預(yù)測意義:了解基因調(diào)控序列是認(rèn)識基因組、了解其運作機理的重要內(nèi)容?,F(xiàn)狀:對啟動子已經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但預(yù)測效果仍然很差。
372.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預(yù)測372.基因組序列分析(續(xù))(3)非編碼序列的分析意義:對于人類基因組,非編碼序列約占95%以上,了解這些“垃圾DNA”的作用是認(rèn)識基因組、了解其運作機理的重要內(nèi)容。現(xiàn)狀:研究剛剛開始,普遍認(rèn)為它們與基因在四維時空的表達調(diào)控有關(guān)。尋找這些區(qū)域的編碼特征,信息調(diào)節(jié)與表達規(guī)律是未來相當(dāng)長時間內(nèi)的熱點。38JunkDNA2.基因組序列分析(續(xù))(3)非編碼序列的分析38Jun2.基因組序列分析(續(xù))(4)比較基因組研究意義:比較基因組學(xué)通過對代表性物種全基因組的比較分析,構(gòu)建系統(tǒng)發(fā)育的遺傳圖譜,尋找不同物種在基因組水平上的差異和共同點,揭示基因、基因家族的起源和功能及其在進化過程中復(fù)雜化和多樣化的機制,鑒定新的基因(包括人類疾病相關(guān)基因)。現(xiàn)狀:研究剛剛開始。392.基因組序列分析(續(xù))(4)比較基因組研究3940403.蛋白質(zhì)結(jié)構(gòu)預(yù)測意義:結(jié)構(gòu)與功能密切聯(lián)系有助于闡明疾病機理,并進行藥物設(shè)計現(xiàn)狀:通過實驗的方法測定的蛋白質(zhì)結(jié)構(gòu)數(shù)量非常有限,基于計算機技術(shù)的結(jié)構(gòu)預(yù)測還處于起步階段,預(yù)測效果還不夠理想,且耗費時間較長。413.蛋白質(zhì)結(jié)構(gòu)預(yù)測意義:41
蛋白質(zhì)的空間構(gòu)象
一級結(jié)構(gòu):是蛋白質(zhì)空間構(gòu)象和特異生物學(xué)功能的基礎(chǔ)。42蛋白質(zhì)的空間構(gòu)象
一級二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividualAminoacidα-螺旋:aresultofH-bondingbetweeneveryfourthpeptidebond(viaaminoandcarbonylgroups)alongthelengthofthepolypeptidechain43二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividual二級結(jié)構(gòu):BETA折疊BETASHEET:aresultofH-bondingbetweenpolypeptidechains44二級結(jié)構(gòu):BETA折疊BETASHEET:aresLoopregionsα-Helixloopβ-Sheet45Loopregionsα-Helixloopβ-Sheet三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。46三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。46四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局和相互作用。47四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局
隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量急增,從而也產(chǎn)生大量的蛋白質(zhì)序列。目前,用實驗的方法測定蛋白質(zhì)結(jié)構(gòu)速度非常慢,這意味著已知序列的蛋白質(zhì)數(shù)量和已測定結(jié)構(gòu)的蛋白質(zhì)數(shù)量的差距將會越來越大。
48隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量NUMBEROFPROTEINENTRIESNumberoftheentries>53,9165now!49NUMBEROFPROTEINENTRIESNumbeThenumberofproteinstructuresinPDB.Lessthan90,000recently.NUMBEROFPROTEINSTRUCTURES50Thenumberofproteinstructur
…..那么如何縮小這種差距呢?51…..那么如何縮小這種差距呢?51蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測:人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建預(yù)測方法(PHD、PSIPRED等)。有效預(yù)測率:75%左右二級結(jié)構(gòu)預(yù)測通常作為蛋白質(zhì)空間結(jié)構(gòu)預(yù)測的第一步。蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測:同源性建模、線索化方法、從頭預(yù)測方法。根據(jù)數(shù)學(xué)計算,由100個氨基酸構(gòu)成的小蛋白質(zhì)的空間構(gòu)象可能會有1050種空間結(jié)構(gòu),一種氨基酸序列只可能有一種蛋白質(zhì)結(jié)構(gòu),這就是計算機預(yù)測蛋白質(zhì)結(jié)構(gòu)的意義所在。52蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測:人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建預(yù)測方53534.蛋白質(zhì)功能預(yù)測闡明蛋白質(zhì)功能是后基因組時代最重要的內(nèi)容之一。蛋白質(zhì)功能的闡明將有助于疾病治療,藥物設(shè)計。蛋白質(zhì)序列數(shù)量飛速增長,而相應(yīng)的功能注釋則遠遠滯后。544.蛋白質(zhì)功能預(yù)測闡明蛋白質(zhì)功能是后基因組時代最重要的內(nèi)
蛋白質(zhì)功能確定的思路及方法:
1.通過相似序列的數(shù)據(jù)庫比對確定功能;
2.確定序列特性:疏水性預(yù)測跨膜螺旋等
3.通過序列模體數(shù)據(jù)庫等的比對確定功能55蛋白質(zhì)功能確定的思路及方法:555.基因表達譜數(shù)據(jù)分析565.基因表達譜數(shù)據(jù)分析565.基因表達譜數(shù)據(jù)分析(續(xù))基因表達譜數(shù)據(jù)能夠從基因轉(zhuǎn)錄水平反映細胞的狀態(tài),對于從系統(tǒng)水平了解基因組的功能具有重要價值;基因表達譜數(shù)據(jù)可以用于篩選疾病相關(guān)基因,揭示疾病的分子機制;基因表達譜可以用于疾病的分型和診斷;575.基因表達譜數(shù)據(jù)分析(續(xù))基因表達譜數(shù)據(jù)能夠從基因轉(zhuǎn)錄水6.疾病基因的預(yù)測尋找疾病相關(guān)基因?qū)τ诮沂炯膊C理,研制疾病的基因診斷與防止手段具有重要意義,對于生物醫(yī)藥產(chǎn)業(yè)的發(fā)展具有重要作用;目前已經(jīng)找到約2000個人類遺傳疾病致病基因,據(jù)估計,人類疾病基因總數(shù)約7000~8000,尚有多余2/3的疾病基因有待發(fā)現(xiàn)迄今我國只發(fā)現(xiàn)了6個疾病基因;利用生物信息學(xué)方法預(yù)測疾病基因是有效發(fā)現(xiàn)疾病基因的重要途徑。586.疾病基因的預(yù)測尋找疾病相關(guān)基因?qū)τ诮沂炯膊C理,研制疾7.生物信息學(xué)與新藥研制未來的藥物研究過程將是基于生物信息知
識挖掘的過程數(shù)據(jù)處理和關(guān)聯(lián)分析發(fā)現(xiàn)藥物作用對象確定靶目標(biāo)分子針對靶目標(biāo)進行合理的藥物設(shè)計597.生物信息學(xué)與新藥研制數(shù)據(jù)處理和發(fā)現(xiàn)藥物確定靶目標(biāo)針對靶基于生物信息學(xué)的新藥設(shè)計60基于生物信息學(xué)的新藥設(shè)計60藥物靶標(biāo)識別現(xiàn)代新藥研究與開發(fā)關(guān)鍵首先是尋找、確定和制備藥物篩選靶標(biāo)!藥物靶標(biāo)是某種疾病起因或特定生化通路中的生物大分子,其活性直接或間接地和疾病或某種性狀相關(guān),每一種藥物都是通過藥物靶點發(fā)揮作用!新的藥物作用靶點一旦被發(fā)現(xiàn),往往成為一系列新藥發(fā)現(xiàn)的突破口;61藥物靶標(biāo)識別現(xiàn)代新藥研究與開發(fā)關(guān)鍵首先是尋找、確定和制備藥物四、生物信息學(xué)密切相關(guān)的學(xué)科四、生物信息學(xué)密切相關(guān)的學(xué)科1.生物生物基礎(chǔ)理論知識(分子生物學(xué)、基因組學(xué)、蛋白質(zhì)組學(xué)…)對基本的生物學(xué)實驗有一定的了解(基因測序過程、芯片技術(shù)…)對數(shù)據(jù)的后續(xù)分析…同源比較、進化分析631.生物生物基礎(chǔ)理論知識(分子生物學(xué)、基因組學(xué)、蛋2.數(shù)學(xué)統(tǒng)計學(xué),是生物信息學(xué)的數(shù)學(xué)基礎(chǔ)之一;概率論與隨機過程理論,如HMM--基因識別、藥物設(shè)計;運籌學(xué),如動態(tài)規(guī)劃法--序列比對;最優(yōu)化理論與算法--蛋白質(zhì)空間結(jié)構(gòu)預(yù)測、分子對接;幾何拓?fù)鋵W(xué)--DNA超螺旋研究、多肽鏈折疊;函數(shù)論,如傅里葉變換,小波變換;信息論,神經(jīng)網(wǎng)絡(luò),計算數(shù)學(xué);群論,組合數(shù)學(xué)等--
分子進化、蛋白質(zhì)結(jié)構(gòu)預(yù)測、序列比對;642.數(shù)學(xué)643.計算機科學(xué)技術(shù)首先是網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫(特別是關(guān)系型數(shù)據(jù)庫)管理技術(shù),包括極為重要的實驗室數(shù)據(jù)信息管理系統(tǒng)(LIMS);數(shù)據(jù)整合和可視化;數(shù)據(jù)挖掘(DataMining)與人工智能算法設(shè)計;生物信息軟件研制計算機語言(C++,java,perl…)
653.計算機科學(xué)技術(shù)65五、生物信息學(xué)產(chǎn)業(yè)五、生物信息學(xué)產(chǎn)業(yè)生物信息學(xué)產(chǎn)業(yè)的潛力基礎(chǔ)與應(yīng)用二者兼?zhèn)湓S多研究成果可以較快或立即產(chǎn)業(yè)化,成為價值很高的產(chǎn)品。是一個發(fā)展?jié)摿艽蟮男屡d高技術(shù)產(chǎn)業(yè)。67生物信息學(xué)產(chǎn)業(yè)的潛力67例子只有50名員工的德國Lion生物信息學(xué)公司,將通過掃描公共數(shù)據(jù)庫中的序列來發(fā)現(xiàn)500個可能的藥物作用靶點,以一億美元的價格預(yù)售給德國Bayer公司。美國出現(xiàn)了大批的基于生物信息學(xué)的公司,實施了許多生物信息學(xué)研究計劃,主要與藥物設(shè)計,基因工程藥物,生物芯片,代謝工程與化學(xué)工程密切相關(guān)。生物信息學(xué)工業(yè)是知識經(jīng)濟的一個典型,潛力巨大。68例子68
人類科學(xué)研究史表明,科學(xué)數(shù)據(jù)的大量積累將導(dǎo)致重大的科學(xué)規(guī)律的發(fā)現(xiàn)……69人類科學(xué)研究史表明,科學(xué)數(shù)據(jù)的大量IsaacNewton牛頓JohannesKepler開普勒TychoBrahe第谷第一次科學(xué)浪潮70天象觀測大量數(shù)據(jù)行星運動定律萬有引力定律航空航天技術(shù)IsaacNewtonJohannesKeplerTy元素與大量化合物
元素周期表
現(xiàn)代化學(xué)化工第二次科學(xué)浪潮DmitriMendeleev門捷列夫71元素與大量化合物元素周期表現(xiàn)代化學(xué)化工第二次科學(xué)大量原子光譜數(shù)據(jù)
量子論
量子力學(xué)
信息技術(shù)MaxKarlErnstLudwigPlanck普朗克AlbertEinstein愛因斯坦NielsBohr玻爾ErwinSchr?dinger薛定諤第三次科學(xué)浪潮………72大量原子光譜數(shù)據(jù)量子論量子力學(xué)信息技術(shù)Ma基因組超大量的序列和結(jié)構(gòu)數(shù)據(jù)
?重大的發(fā)現(xiàn)第四次科學(xué)浪潮?73基因組超大量的序列和結(jié)構(gòu)數(shù)據(jù)?重大的發(fā)現(xiàn)第四次科學(xué)浪潮謝謝大家!74謝謝大家!74杜娟2013.02.27生物信息學(xué)杜娟生物信息學(xué)課程簡介課程特點課程目標(biāo)課程形式參考教材與文獻教師聯(lián)系方式成績構(gòu)成76課程簡介課程特點2生物、計算機、數(shù)學(xué)、化學(xué)等多學(xué)科交叉,知識覆蓋面廣;涉及從基因組序列分析直到藥物設(shè)計等眾多內(nèi)容,且應(yīng)用領(lǐng)域?qū)拸V;生物信息數(shù)據(jù)資源與分析工具繁多,實踐環(huán)節(jié)非常重要;理論方法尚不系統(tǒng)成熟,處于迅速發(fā)展變化階段,知識更新快。缺乏合適的教材課程特點77生物、計算機、數(shù)學(xué)、化學(xué)等多學(xué)科交叉,知識覆蓋面廣;課程特點課程目標(biāo)掌握生物信息學(xué)的基本知識與概念了解生物信息學(xué)網(wǎng)上資源針對核酸和蛋白質(zhì)的分析78課程目標(biāo)掌握生物信息學(xué)的基本知識與概念4課程形式講授概念與知識點(Textbooks)自學(xué)與討論(Websites)理解(Literaturereferences)掌握與鞏固(ComputerExperiences)79課程形式講授概念與知識點(Textbooks)5主要的參考教材1《生物信息學(xué)》,陶士珩主編科學(xué)出版社,20072《生物信息學(xué)》,DavidW.Mount著,鐘揚、王莉、張亮等譯,高等教育出版社,2003。
3生物信息學(xué)——基因和蛋白質(zhì)分析的實用指南(AndreasD.BaxevanisAndB.F.FrancisOuellette著).李衍達、孫子榮等譯.北京:清華大學(xué)出版社,2000
4《簡明生物信息學(xué)》,鐘揚等主編.高等教育出版社,2001
5《探索基因組學(xué)、蛋白質(zhì)組學(xué)和生物信息學(xué)》,孫子榮譯.科學(xué)出版社,2004
6《生物信息學(xué)方法與實踐》,張成崗賀福初編著.科學(xué)出版社,200280主要的參考教材1《生物信息學(xué)》,陶士珩主編科參考文獻主要為英文原始文獻,鼓勵大家閱讀。課題的研究方法81參考文獻主要為英文原始文獻,鼓勵大家閱讀。7聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com
成績構(gòu)成隨堂測驗、課堂表現(xiàn)30%
作業(yè)30%
項目報告40%
82聯(lián)系方式及成績構(gòu)成杜娟
dujuannx@126.com883生物信息學(xué)——緒論一、生物信息學(xué)及其研究意義二、生物信息學(xué)的發(fā)展現(xiàn)狀三、生物信息學(xué)當(dāng)前的主要研究內(nèi)容四、與生物信息學(xué)密切相關(guān)的學(xué)科五、生物信息學(xué)產(chǎn)業(yè)及前景9生物信息學(xué)——緒論一、生物信息學(xué)及其研究意義一、生物信息學(xué)及其研究意義生物信息學(xué)第一章課件背景1.
人類基因組計劃(HGP)投入30億美元,2003年完成精細圖,約30億個數(shù)據(jù)(堿基),相當(dāng)于3000本每本1000頁每頁1000字的“天書”。曼哈頓原子彈計劃阿波羅登月計劃人類基因組計劃85背景1.人類基因組計劃(HGP)曼哈頓原子彈計劃阿波羅登2.模式生物基因組計劃模式生物基因組計劃是人類基因組計劃的一個重要組成部分。模式生物有:大腸桿菌、酵母、擬南芥、線蟲、果蠅和小鼠等
3.相關(guān)功能基因組計劃
轉(zhuǎn)錄組,基因表達譜,蛋白質(zhì)組……862.模式生物基因組計劃12生物學(xué)數(shù)據(jù)庫的增長情況至今1000多個87生物學(xué)數(shù)據(jù)庫的增長情況至今1000多個13序列數(shù)據(jù)增長趨勢88序列數(shù)據(jù)增長趨勢14生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來所說過的話的數(shù)百倍,而且還將以越來越快的速度增長。89生物數(shù)據(jù)爆炸性增長:生物數(shù)據(jù)量的積累已達到人類有史以來面對堆積如山的生物學(xué)數(shù)據(jù)……90面對堆積如山的生物學(xué)數(shù)據(jù)……16數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAACGT?91數(shù)據(jù)知識AGCATCGAAGTTGCATGACGATG多學(xué)科高度交叉
生物學(xué)醫(yī)學(xué)
數(shù)學(xué)、統(tǒng)計學(xué)物理學(xué)、化學(xué)信息、系統(tǒng)與計算科學(xué)高性能計算、數(shù)據(jù)庫、網(wǎng)格計算生物信息學(xué)與系統(tǒng)生物學(xué)92多學(xué)科高度交叉生物學(xué)醫(yī)學(xué)數(shù)學(xué)、統(tǒng)計學(xué)物理學(xué)、化學(xué)信息、多尺度數(shù)據(jù)的整合和模擬93多尺度數(shù)據(jù)的整合和模擬19什么是生物信息學(xué)
生物信息學(xué)(BIOINFORMATICS)是一門集數(shù)學(xué),計算機科學(xué)和生物學(xué)的工具以及技術(shù)于一體的涵蓋了生物信息的獲取,處理,存儲,分配,分析和闡述等各個方面以理解海量的生物學(xué)數(shù)據(jù)為目的的學(xué)科UnderstandingOurGeneticInheritance.TheUSHumanGenomeProject:TheFirstFiveYears1991-1995.NIHPublicationNo.90-1590,April,1995生物信息技術(shù)是一個多學(xué)科交叉的前沿生物技術(shù)94什么是生物信息學(xué)生物信息學(xué)(BIOINFORMA生物信息學(xué)研究的意義科學(xué)意義:可望從海量生物學(xué)數(shù)據(jù)分析中獲得對生命運行機制和疾病機理等的深入理解。應(yīng)用價值:在生物醫(yī)藥研究和相關(guān)生物技術(shù)相關(guān)產(chǎn)業(yè)(生物制藥、農(nóng)、林、牧、漁、環(huán)保等)的發(fā)展中將發(fā)揮越來越重要的作用。95生物信息學(xué)研究的意義科學(xué)意義:可望從海量生物學(xué)數(shù)據(jù)分析中獲得生物信息學(xué)是生命科學(xué)與信息技術(shù)交叉融合的新學(xué)科,也是當(dāng)今全球最具發(fā)展前途的學(xué)科之一。
WhenIgivetalkstoyoungscientistsseekingadviceaboutareasoffutureintensescientificexcitement,computationalbiologyismynumberonerecommendation.FrancisCollins,DirectorofHGPatNIH生物信息學(xué)是生命科學(xué)與信息技術(shù)交叉融合的新學(xué)科,也是當(dāng)今全球
生命科學(xué)已從一種以實驗為基礎(chǔ)的科學(xué)轉(zhuǎn)向以信息為基礎(chǔ)的科學(xué),其成功將大大依靠信息科學(xué)與生命科學(xué)的聯(lián)姻、依賴于生物信息技術(shù)的發(fā)展?;蛐畔F(xiàn)在正推動著生物制藥革命。破譯人類基因組給我們帶來了打開這個星球上最有價值的圖書館的鑰匙,但我們現(xiàn)在閱讀這些圖書還處在非常初級的水平,科學(xué)家的下一步工作將是如何把信息從這些圖書中挖掘出來。目前美國缺少有能力閱讀這部人類基因“天書”并使用其中信息的人。這個領(lǐng)域有非常多的機會,有非常大的需要。據(jù)估計,這一領(lǐng)域所需要的研究人員數(shù)量將是現(xiàn)有人數(shù)的50倍。培養(yǎng)這種人才就像破譯人類基因組一樣重要。
EricLander,200297生命科學(xué)已從一種以實驗為基礎(chǔ)的科學(xué)轉(zhuǎn)向以信息為基礎(chǔ)的科學(xué),二、生物信息學(xué)的發(fā)展現(xiàn)狀二、生物信息學(xué)的發(fā)展現(xiàn)狀生物信息學(xué)的萌芽1956年在美國召開過首次“生物學(xué)中的信息理論”討論會
60年代美國建立了手工搜集數(shù)據(jù)的蛋白質(zhì)數(shù)據(jù)庫,PIR
1962年Zuckerkandl基于序列變異分析的分子演化研究
1964年Davies開創(chuàng)了蛋白質(zhì)結(jié)構(gòu)預(yù)測的研究
1970年Needleman等發(fā)表了廣受重視的兩序列比較算法
1970年出現(xiàn)ComputerMethodsandProgramsinBiomedicine期刊
1974年Ratner首先對分子遺傳調(diào)控系統(tǒng)進行處理分析
1975年P(guān)ipas等首先提出用計算機技術(shù)預(yù)測RNA二級結(jié)構(gòu)
1979年美國洛斯阿拉莫斯國家實驗室建立GenBank99生物信息學(xué)的萌芽1956年在美國召開過首次“生物學(xué)中的信生物信息學(xué)的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計算分子生物學(xué)的綜述1982年歐洲分子生物學(xué)實驗室提供EMBL服務(wù)1984年日本著手建立國家級核酸序列數(shù)據(jù)庫DDBJ1985年出現(xiàn)ComputerApplicationintheBiosciences期刊10020世紀(jì)80年代末期,林華安博士compbio——bioinformatique——bio-informatics——bioinformatics“生物信息學(xué)之父”生物信息學(xué)的萌芽(續(xù))Science于1980年發(fā)表了關(guān)于計國外生物信息學(xué)的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌現(xiàn)生物科技公司和制藥工業(yè)內(nèi)部生物信息學(xué)部門的數(shù)量與日俱增即使象美國這樣的發(fā)達國家也面臨生物信息人才匱乏的局面許多大學(xué)和研究機構(gòu)已經(jīng)成立自己的生物信息學(xué)中心1999年美國NIH專家委員會又建議迅速在大學(xué)和研究機構(gòu)中建立20個生物計算中心,給予每個中心每年800萬美元的支持,從事有關(guān)研究和人才培養(yǎng)英國所有主要研究資助機構(gòu)達成共識,認(rèn)為應(yīng)高度優(yōu)先滿足對生物信息學(xué)技術(shù)的需求,并已實現(xiàn)對相關(guān)人才培養(yǎng)的大力資助101國外生物信息學(xué)的發(fā)展現(xiàn)狀各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌國外生物信息學(xué)的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技術(shù)信息中心(NCBI)歐洲于1993年著手建立歐洲生物信息學(xué)研究所(EBI)日本于1995年組建了自己的信息生物學(xué)中心(CIB)九十年代以來,生物數(shù)據(jù)分析技術(shù)獲得了突飛猛進的發(fā)展。生物信息專業(yè)期刊越來越多:如
Bioinformatics
JournalofComputationalBiology
BriefingsinBioinformatics
ActaBiotheoretica
BioInformaticsTechnology&Systems
BioinformNewsletter互聯(lián)網(wǎng)上的生物信息學(xué)網(wǎng)點非常繁多102國外生物信息學(xué)的發(fā)展現(xiàn)狀(續(xù))美國于1988年成立國家生物技國內(nèi)生物信息學(xué)的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委,地方政府 特別是:863計劃設(shè)立了“生物信息技術(shù)”主題眾多高校與研究機構(gòu)參與:北京大學(xué),中科院生物物理所、天津大學(xué),中科院理論物理所,清華大學(xué),內(nèi)蒙古大學(xué)、上海生命研究院,東南大學(xué),華中科技大學(xué),復(fù)旦大學(xué)等等成立了一批中心,如:北京大學(xué)于1997年成立了生物信息學(xué)中心上海生命科學(xué)研究院于2000年成立了生物信息學(xué)中心上海市于2002年成立生物信息技術(shù)工程研究中心取得了一些成績,如基因組測序與分析,數(shù)據(jù)庫,算法軟件103國內(nèi)生物信息學(xué)的發(fā)展現(xiàn)狀國家非常重視:科技部,教育部,基金委三、生物信息學(xué)當(dāng)前的
主要研究內(nèi)容三、生物信息學(xué)當(dāng)前的
主要研究內(nèi)容生物信息學(xué)的發(fā)展過程大致經(jīng)歷了3個階段:前基因組時代--生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)、DNA和蛋白質(zhì)序列分析、全局和局部的序列對位排列;基因組時代--基因?qū)ふ液妥R別、網(wǎng)絡(luò)數(shù)據(jù)庫系統(tǒng)的建立、交互界面的開發(fā);后基因組時代--大規(guī)模基因組系統(tǒng)分析、蛋白質(zhì)組分析105生物信息學(xué)的發(fā)展過程大致經(jīng)歷了3個階段:31
生物信息服務(wù)平臺建設(shè)基因組序列分析蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)功能預(yù)測基因表達譜數(shù)據(jù)分析疾病基因的預(yù)測藥物設(shè)計中的應(yīng)用106生物信息學(xué)的主要研究內(nèi)容生物信息服務(wù)平臺建設(shè)32生物信息學(xué)的主要研究內(nèi)容1.生物信息服務(wù)平臺建設(shè)生物信息數(shù)據(jù)的收集,建立生物信息一級數(shù)據(jù)庫和二級數(shù)據(jù)庫;建立生物信息傳輸?shù)膰H聯(lián)網(wǎng)系統(tǒng);建立生物信息數(shù)據(jù)質(zhì)量的評估與檢測系統(tǒng);建立生物信息的可視化和在線服務(wù)系統(tǒng);1071.生物信息服務(wù)平臺建設(shè)332.基因組序列分析1082.基因組序列分析342.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預(yù)測(新基因的發(fā)現(xiàn))意義:得到DNA序列中蛋白編碼基因是認(rèn)識基因組、了解其運作機理的第一步;利用計算機預(yù)測蛋白編碼基因是一種方便、快捷的方法?,F(xiàn)狀:經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但效果仍難令人滿意。以人類基因組為例,目前對人類基因數(shù)量的估計仍是眾說紛紜。1092.基因組序列分析(續(xù))(1)蛋白編碼區(qū)與基因結(jié)構(gòu)預(yù)測(
例:WHATISGENEPREDICTION?
GIVENANUNCHARACTERIZEDDNASEQUENCE,FINDOUT:
1.WHEREDOESTHEGENESTARTSANDENDS?
2.WHICHREGIONSCODEFORAPROTEIN?
AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCgene1gene2gene3exonintergenicregionintron110例:WHATISGENEPREDICTION?
2.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預(yù)測意義:了解基因調(diào)控序列是認(rèn)識基因組、了解其運作機理的重要內(nèi)容?,F(xiàn)狀:對啟動子已經(jīng)過了10多年的研究,出現(xiàn)了眾多的方法與分析軟件,但預(yù)測效果仍然很差。
1112.基因組序列分析(續(xù))(2)基因調(diào)控序列的分析預(yù)測372.基因組序列分析(續(xù))(3)非編碼序列的分析意義:對于人類基因組,非編碼序列約占95%以上,了解這些“垃圾DNA”的作用是認(rèn)識基因組、了解其運作機理的重要內(nèi)容。現(xiàn)狀:研究剛剛開始,普遍認(rèn)為它們與基因在四維時空的表達調(diào)控有關(guān)。尋找這些區(qū)域的編碼特征,信息調(diào)節(jié)與表達規(guī)律是未來相當(dāng)長時間內(nèi)的熱點。112JunkDNA2.基因組序列分析(續(xù))(3)非編碼序列的分析38Jun2.基因組序列分析(續(xù))(4)比較基因組研究意義:比較基因組學(xué)通過對代表性物種全基因組的比較分析,構(gòu)建系統(tǒng)發(fā)育的遺傳圖譜,尋找不同物種在基因組水平上的差異和共同點,揭示基因、基因家族的起源和功能及其在進化過程中復(fù)雜化和多樣化的機制,鑒定新的基因(包括人類疾病相關(guān)基因)?,F(xiàn)狀:研究剛剛開始。1132.基因組序列分析(續(xù))(4)比較基因組研究39114403.蛋白質(zhì)結(jié)構(gòu)預(yù)測意義:結(jié)構(gòu)與功能密切聯(lián)系有助于闡明疾病機理,并進行藥物設(shè)計現(xiàn)狀:通過實驗的方法測定的蛋白質(zhì)結(jié)構(gòu)數(shù)量非常有限,基于計算機技術(shù)的結(jié)構(gòu)預(yù)測還處于起步階段,預(yù)測效果還不夠理想,且耗費時間較長。1153.蛋白質(zhì)結(jié)構(gòu)預(yù)測意義:41
蛋白質(zhì)的空間構(gòu)象
一級結(jié)構(gòu):是蛋白質(zhì)空間構(gòu)象和特異生物學(xué)功能的基礎(chǔ)。116蛋白質(zhì)的空間構(gòu)象
一級二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividualAminoacidα-螺旋:aresultofH-bondingbetweeneveryfourthpeptidebond(viaaminoandcarbonylgroups)alongthelengthofthepolypeptidechain117二級結(jié)構(gòu):ALPHA-螺旋H-bondIndividual二級結(jié)構(gòu):BETA折疊BETASHEET:aresultofH-bondingbetweenpolypeptidechains118二級結(jié)構(gòu):BETA折疊BETASHEET:aresLoopregionsα-Helixloopβ-Sheet119Loopregionsα-Helixloopβ-Sheet三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。120三級結(jié)構(gòu):多肽鏈中全部氨基酸殘基的相對空間位置。46四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局和相互作用。121四級結(jié)構(gòu):蛋白質(zhì)分子中各個亞基的空間排布及亞基接觸部位的布局
隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量急增,從而也產(chǎn)生大量的蛋白質(zhì)序列。目前,用實驗的方法測定蛋白質(zhì)結(jié)構(gòu)速度非常慢,這意味著已知序列的蛋白質(zhì)數(shù)量和已測定結(jié)構(gòu)的蛋白質(zhì)數(shù)量的差距將會越來越大。
122隨著DNA測序技術(shù)的發(fā)展,DNA序列數(shù)量NUMBEROFPROTEINENTRIESNumberoftheentries>53,9165now!123NUMBEROFPROTEINENTRIESNumbeThenumberofproteinstructuresinPDB.Lessthan90,000recently.NUMBEROFPROTEINSTRUCTURES124Thenumberofproteinstructur
…..那么如何縮小這種差距呢?125…..那么如何縮小這種差距呢?51蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測:人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建預(yù)測方法(PHD、PSIPRED等)。有效預(yù)測率:75%左右二級結(jié)構(gòu)預(yù)測通常作為蛋白質(zhì)空間結(jié)構(gòu)預(yù)測的第一步。蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測:同源性建模、線索化方法、從頭預(yù)測方法。根據(jù)數(shù)學(xué)計算,由100個氨基酸構(gòu)成的小蛋白質(zhì)的空間構(gòu)象可能會有1050種空間結(jié)構(gòu),一種氨基酸序列只可能有一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國燃氣安全閥行業(yè)市場調(diào)研及未來發(fā)展趨勢預(yù)測報告
- 【高二化學(xué)芳香烴知識點】高二化學(xué)知識點總結(jié)
- 婚禮策劃行業(yè)市場全景評估及投資前景展望報告
- 【英語】數(shù)詞知識點總結(jié)經(jīng)典
- 村文化中心新建項目可行性研究報告-商業(yè)計劃書
- 【5A文】番茄粉生產(chǎn)項目可行性研究報告
- 進口食品項目風(fēng)險評估報告
- 2025年石英玻璃纖維布項目發(fā)展計劃
- 飯?zhí)醚b修合同范本
- 2019-2025年中國股權(quán)式酒店行業(yè)未來發(fā)展趨勢分析及投資規(guī)劃建議研究報告
- 2025年臨床醫(yī)師定期考核必考復(fù)習(xí)題庫及答案(1060題)
- 市場消防安全課件
- 名師工作室建設(shè)課件
- 2025-2025學(xué)年度人教版小學(xué)五年級美術(shù)下冊教學(xué)計劃
- 《電力建設(shè)工程施工安全管理導(dǎo)則》(NB∕T 10096-2018)
- 2024-2025學(xué)年廣東省部分學(xué)校高一(上)第一次聯(lián)合考試物理試卷(含答案)
- 《黃色新聞的泛濫》課件
- 2024年山東省公務(wù)員考試《行測》真題及答案解析
- 化工原理Ⅱ?qū)W習(xí)通超星期末考試答案章節(jié)答案2024年
- 2024-2025學(xué)年初中體育與健康九年級全一冊人教版(2024)教學(xué)設(shè)計合集
- 環(huán)保產(chǎn)業(yè)政策及市場發(fā)展趨勢分析研究
評論
0/150
提交評論