版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
什么是生物信息學(xué)生物信息學(xué)的誕生與發(fā)展生物信息學(xué)研究的幾個(gè)專題介紹生物信息學(xué)數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)基因發(fā)現(xiàn)研究微小RNA(miRNA)與復(fù)雜疾病精準(zhǔn)醫(yī)療(PrecisionMedicine)本課程主要內(nèi)容第一頁第二頁,共75頁。1、什么是生物信息學(xué)第二頁第三頁,共75頁。什么是生物信息學(xué)?定義一:生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、處理、存儲(chǔ)、分發(fā)、分析和解釋等在內(nèi)的所有方面,它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。--美國人類基因組計(jì)劃實(shí)施五年后的總結(jié)報(bào)告--第三頁第四頁,共75頁。什么是生物信息學(xué)?定義二:為拓展生物學(xué)、醫(yī)學(xué)、行為學(xué)和衛(wèi)生學(xué)數(shù)據(jù)的用途,而進(jìn)行有關(guān)計(jì)算機(jī)方法手段的研究、開發(fā)與應(yīng)用,包括此類數(shù)據(jù)的采集、存貯、整理、歸檔、分析和可視化等。(Bioinformatics:Research,development,orapplicationofcomputationaltoolsandapproachesforexpandingtheuseofbiological,medical,behavioralorhealthdata,includingthosetoacquire,store,organize,archive,analyze,orvisualizesuchdata.)--美國國家衛(wèi)生研究院(NIH)--第四頁第五頁,共75頁。什么是生物信息學(xué)?定義三:Bioinformatics...istheresearchdomainfocusedonlinkingthebehaviorofbiomolecules,biologicalpathways,cells,organisms,andpopulationstotheinformationencodedinthegenomes.--TempleSmith--
《CurrentTopicsinComputationalMolecularBiology》2002年4月出版第五頁第六頁,共75頁。廣義生物信息學(xué)觀點(diǎn)生物學(xué)研究可以被看成是研究信息的傳遞:從DNA經(jīng)轉(zhuǎn)錄翻譯到蛋白質(zhì),從細(xì)胞質(zhì)中到細(xì)胞核內(nèi),從母細(xì)胞到子細(xì)胞,從一個(gè)細(xì)胞或一個(gè)組織到另一個(gè)細(xì)胞或另一個(gè)組織,從一代到下一代,從一個(gè)物種到另一個(gè)物種的進(jìn)化演變。這種信息論的觀點(diǎn)即可稱為生物信息學(xué)。(Biologymaybeviewedasthestudyoftransmissionofinformation:frommothercelltodaughtercell,fromonecellortissuetypetoanother,fromonegenerationtothenext,andfromonespeciestoanother.Thisinformationalviewpointistermedbioinformatics.)
Eisenbergetal.,2006第六頁第七頁,共75頁。第七頁第八頁,共75頁。生物信息學(xué)、系統(tǒng)生物學(xué)與計(jì)算生物學(xué)系統(tǒng)生物學(xué):系統(tǒng)生物學(xué)是研究一個(gè)生物系統(tǒng)中所有組分(gene,mRNA,protein)的構(gòu)成,以及在特定條件下這些組分之間的相互關(guān)系,并通過計(jì)算生物學(xué)方法建立一個(gè)數(shù)學(xué)模型來定量描述和預(yù)測(cè)生物功能、表型和行為的學(xué)科。第八頁第九頁,共75頁。生物信息學(xué)、系統(tǒng)生物學(xué)與計(jì)算生物學(xué)計(jì)算生物學(xué):計(jì)算生物學(xué)是一門概念性學(xué)科,以生物信息為基礎(chǔ),以計(jì)算為工具,解決生物學(xué)問題。(側(cè)重于計(jì)算與問題,通過計(jì)算解決問題)第九頁第十頁,共75頁。2、生物信息學(xué)的誕生與發(fā)展第十頁第十一頁,共75頁。生物信息學(xué)的誕生和發(fā)展迅速膨脹的生物信息數(shù)據(jù)分子生物學(xué)發(fā)展的一個(gè)顯著特點(diǎn)是生物信息的劇烈膨脹。形成了巨量的生物信息庫迅速膨脹的生物信息給科學(xué)家們提出了一個(gè)新問題:如何有效管理、準(zhǔn)確解讀、充分使用這些信息?第十一頁第十二頁,共75頁。萌芽期(60-70年代)生物數(shù)據(jù)庫的建立;檢索工具的開發(fā);DNA和蛋白質(zhì)序列分析序列比對(duì):以Dayhoff的替換矩陣和Needleman-Wunsch和Smith-Waterman比對(duì)算法為代表三個(gè)發(fā)展階段半胱氨酸Cys
C;絲氨酸
Ser
S
;蘇氨酸
Thr
T脯氨酸
Pro
P;丙氨酸
Ala
A;甘氨酸
Gly
G天冬酰胺Asn
N;天冬氨酸Asp
D;谷氨酸Glu
E谷氨酰胺Gln
Q;組氨酸
第十二頁第十三頁,共75頁。通過比較兩條或多條序列之間的相似區(qū)域和保守性位點(diǎn),尋找二者之間可能的進(jìn)化關(guān)系構(gòu)建進(jìn)化樹比較基因組學(xué)研究?jī)蓷l序列比對(duì)(pairwisealignment)第十三頁第十四頁,共75頁。蛋白序列(Blast)核酸序列(Blast)兩條序列比對(duì)(pairwisealignment)第十四頁第十五頁,共75頁。蛋白序列(Clustal)多條序列比對(duì)(multiplealignment)第十五頁第十六頁,共75頁。形成期(80年代)網(wǎng)絡(luò)數(shù)據(jù)庫系統(tǒng)的建立、交互界面的開發(fā);分子數(shù)據(jù)庫和BLAST等相似性搜索程序;基因?qū)ふ液妥R(shí)別;結(jié)構(gòu)基因組。三個(gè)發(fā)展階段第十六頁第十七頁,共75頁。Blast可以進(jìn)行一條序列和數(shù)據(jù)庫的比對(duì)Blast可以兩條或多條序列的比對(duì)序列比對(duì)工具Blast第十七頁第十八頁,共75頁。三個(gè)發(fā)展階段高速發(fā)展期(90年代-)大規(guī)模基因組分析—HGP(HumanGenomeProject,1990-2003)功能基因組比較基因組學(xué)轉(zhuǎn)錄組學(xué)蛋白質(zhì)組學(xué)分子相互作用組學(xué)代謝組學(xué)第十八頁第十九頁,共75頁。于20世紀(jì)80年代提出,由美、英、日、中、德、法等國參加針對(duì)人體23對(duì)染色體全部DNA的堿基對(duì)(3×109)序列進(jìn)行測(cè)序,對(duì)大約25,000基因進(jìn)行染色體定位,構(gòu)建人類基因組遺傳圖譜和物理圖譜的國際合作研究計(jì)劃。人類基因組計(jì)劃-定義第十九頁第二十頁,共75頁。HGP對(duì)人類疾病基因研究的貢獻(xiàn)人類疾病相關(guān)的基因是人類基因組中結(jié)構(gòu)和功能完整性至關(guān)重要的信息。對(duì)于單基因病,采用“定位克隆”和“定位候選克隆”的全新思路,導(dǎo)致了亨廷頓舞蹈病、遺傳性結(jié)腸癌和乳腺癌等一大批單基因遺傳病致病基因的發(fā)現(xiàn),為這些疾病的基因診斷和基因治療奠定了基礎(chǔ)。對(duì)于心血管疾病、腫瘤、糖尿病、神經(jīng)精神類疾病(老年性癡呆、精神分裂癥)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重點(diǎn)。人類基因組計(jì)劃-意義第二十頁第二十一頁,共75頁。HGP對(duì)生物技術(shù)的貢獻(xiàn)基因工程藥物:分泌蛋白(多肽激素,生長(zhǎng)因子,趨化因子,凝血和抗凝血因子等)及其受體。診斷和研究試劑產(chǎn)業(yè):基因和抗體試劑盒、診斷和研究用生物芯片、疾病和篩藥模型。對(duì)細(xì)胞、胚胎、組織工程的推動(dòng):胚胎和成年期干細(xì)胞、克隆技術(shù)、器官再造。人類基因組計(jì)劃-意義第二十一頁第二十二頁,共75頁。人類基因組計(jì)劃的實(shí)施和完成,帶來了生物信息學(xué)這門學(xué)科的飛躍式的發(fā)展。人類基因組計(jì)劃-意義第二十二頁第二十三頁,共75頁?,F(xiàn)階段組學(xué)時(shí)代計(jì)算和生物學(xué)實(shí)驗(yàn)相結(jié)合展開科學(xué)研究計(jì)算算法和軟件在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用研究第二十三頁第二十四頁,共75頁。生物信息學(xué)研究的一些課題問題DNAsequencebasecallingandassembly(DNA測(cè)序和裝配)Transmembranesegmentprediction(蛋白質(zhì)跨膜區(qū)預(yù)測(cè))Signalpeptideprediction(信號(hào)肽預(yù)測(cè))Proteingeometry(蛋白的幾何形狀?主要指主鏈的結(jié)構(gòu)?)Homologymodeling(同源建模)Genefinding(基因發(fā)現(xiàn))Repetitivesequenceanalysis(重復(fù)序列分析)Proteinstructurecomparison(蛋白質(zhì)結(jié)構(gòu)比較)Phylogenetictreeconstructionandevolution(分子進(jìn)化樹構(gòu)建和分析)Proteindocking(分子對(duì)接)第二十四頁第二十五頁,共75頁。Drugdesign(藥物設(shè)計(jì))Proteindesign(蛋白質(zhì)設(shè)計(jì))Linkageanalysisandquantitativetraits(連鎖遺傳和數(shù)量性狀分析)Multiplesequencecomparisonandremotehomologsearch(多序列比較和遠(yuǎn)源搜索)Proteintertiarystructureprediction(蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè))RNAsecondarystructureprediction(RNA二級(jí)結(jié)構(gòu)預(yù)測(cè))Regulatorysequenceanalysis(調(diào)控序列分析)Computationalproteomics(計(jì)算蛋白質(zhì)組學(xué))Geneontologyandfunctionprediction(基因功能預(yù)測(cè))生物信息學(xué)研究的一些課題問題第二十五頁第二十六頁,共75頁。Computationalcomparativegenomics(計(jì)算比較基因組學(xué))Text(literature)mining(文獻(xiàn)挖掘)SmallRNAandanti-senseregulation(小RNA反義調(diào)控)Alternativesplicingprediction(選擇性剪切)Computationalmetabolomics(計(jì)算代謝組學(xué))Genomesemantics(基因組語義學(xué))Membraneproteinstructureprediction(膜蛋白結(jié)構(gòu)預(yù)測(cè))RNAtertiarystructureprediction(RNA三級(jí)結(jié)構(gòu)預(yù)測(cè))Post-translationalmodification(翻譯后編輯)Dynamicsofregulatorynetworks(動(dòng)態(tài)調(diào)控網(wǎng)絡(luò))Virtualcell/organismmodeling(虛擬細(xì)胞建模)生物信息學(xué)研究的一些課題問題第二十六頁第二十七頁,共75頁。3、生物信息學(xué)研究的幾個(gè)專題介紹生物信息學(xué)數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)基因發(fā)現(xiàn)研究微小RNA(miRNA)與復(fù)雜疾病第二十七頁第二十八頁,共75頁。3-1、生物信息數(shù)據(jù)庫概述第二十八頁第二十九頁,共75頁。數(shù)據(jù)庫的產(chǎn)生背景是海量數(shù)據(jù)的出現(xiàn)第二十九頁第三十頁,共75頁。一級(jí)數(shù)據(jù)庫和二級(jí)數(shù)據(jù)庫一級(jí)數(shù)據(jù)庫數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過簡(jiǎn)單的歸類整理和注釋二級(jí)數(shù)據(jù)庫(三級(jí),四級(jí),,)對(duì)原始生物分子數(shù)據(jù)進(jìn)行整理、分類的結(jié)果,是在一級(jí)數(shù)據(jù)庫、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對(duì)特定的應(yīng)用目標(biāo)而建立的。第三十頁第三十一頁,共75頁。分子生物信息數(shù)據(jù)庫分類基因組數(shù)據(jù)庫(來自基因組作圖)HGP:人;大腸桿菌、酵母、線蟲、果蠅和小鼠。核酸和蛋白質(zhì)序列(一級(jí)結(jié)構(gòu))數(shù)據(jù)庫(來自序列測(cè)定)生物大分子三級(jí)結(jié)構(gòu)數(shù)據(jù)庫(來自X射線衍射和核磁共振等結(jié)構(gòu)測(cè)定)由上述3類數(shù)據(jù)庫和文獻(xiàn)資料為基礎(chǔ)構(gòu)建的二級(jí)數(shù)據(jù)庫。第三十一頁第三十二頁,共75頁?;蚪M數(shù)據(jù)庫三大基因組數(shù)據(jù)庫NCBI:美國生物技術(shù)信息中心(TheNationalCenterforBiotechnologyInformation)Ensembl:歐洲分子生物學(xué)實(shí)驗(yàn)室(TheEuropeanMolecularBiologyLaboratory)EMBL維護(hù)UCSC:加州大學(xué)圣克魯茲分校(UniversityofCaliforniaSantaCruz,UCSC)創(chuàng)立和維護(hù)第三十二頁第三十三頁,共75頁。核酸序列數(shù)據(jù)庫
美國生物技術(shù)信息中心(TheNationalCenterforBiotechnologyInformation)的GenBank:)
歐洲分子生物學(xué)實(shí)驗(yàn)室的(TheEuropeanMolecularBiologyLaboratory)EMBL:
()
日本遺傳研究所(DNADataBankofJapan)的DDBJ:()第三十三頁第三十四頁,共75頁。蛋白質(zhì)序列數(shù)據(jù)庫SWISS-PROT(瑞士日內(nèi)瓦大學(xué)和歐洲生物信息學(xué)研究所(EBI)合作維護(hù))
()PIR(美國國家生物醫(yī)學(xué)研究基金會(huì)NBRF維護(hù))()UniProt()第三十四頁第三十五頁,共75頁。蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB()蛋白質(zhì)分類數(shù)據(jù)庫SCOP()蛋白質(zhì)分類數(shù)據(jù)庫CATH()第三十五頁第三十六頁,共75頁。3-2、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)第三十六頁第三十七頁,共75頁。關(guān)于數(shù)據(jù)庫,值得關(guān)注的一組數(shù)字核酸序列數(shù)據(jù)庫收錄約1.7ⅹ108(1億7千萬)條數(shù)據(jù)(2016-10-10)蛋白質(zhì)序列數(shù)據(jù)庫收錄約47M4.7ⅹ107(~5千萬)條數(shù)據(jù)(2016-10-10)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫收錄約0.1M1.0ⅹ105(10萬)條數(shù)據(jù)(2016-10-10)僅有約0.2%(千分之二)的蛋白質(zhì)序列解析出三級(jí)結(jié)構(gòu)。第三十七頁第三十八頁,共75頁。序列vs結(jié)構(gòu)#structurelagfarbehind#sequences第三十八頁第三十九頁,共75頁。蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)的意義由于分子生物學(xué)技術(shù)的發(fā)展,蛋白質(zhì)氨基酸序列的測(cè)定速度大大加快,而蛋白質(zhì)分子三維結(jié)構(gòu)測(cè)定的速度仍遠(yuǎn)遠(yuǎn)落后于其氨基酸序列測(cè)定的速度。隨著蛋白質(zhì)工程技術(shù)的發(fā)展和人類基因組計(jì)劃的順利進(jìn)展,對(duì)蛋白質(zhì)空間結(jié)構(gòu)與一級(jí)結(jié)構(gòu)的關(guān)系的研究也變得更加緊迫和重要。根據(jù)蛋白質(zhì)分子的氨基酸序列預(yù)測(cè)其三維空間結(jié)構(gòu)具有重要的意義,是生物信息學(xué)研究領(lǐng)域的一項(xiàng)重要挑戰(zhàn)。第三十九頁第四十頁,共75頁。蛋白質(zhì)結(jié)構(gòu)的4個(gè)層次一級(jí)結(jié)構(gòu)——組成蛋白質(zhì)的氨基酸序列;二級(jí)結(jié)構(gòu)——即骨架原子間的相互作用形成的局部結(jié)構(gòu),比如α螺旋,β折疊等;三級(jí)結(jié)構(gòu)——即二級(jí)結(jié)構(gòu)在更大范圍內(nèi)的堆積形成的空間結(jié)構(gòu);四級(jí)結(jié)構(gòu)——主要描述由三級(jí)結(jié)構(gòu)形成的不同亞基之間的相互作用。第四十頁第四十一頁,共75頁。動(dòng)物的胰島素(Insulin),氨基酸序列線性排列蛋白質(zhì)一級(jí)結(jié)構(gòu)
第四十一頁第四十二頁,共75頁。二級(jí)結(jié)構(gòu)是指多肽鏈借助于氫鍵沿一維方向排列成具有周期性的結(jié)構(gòu)的構(gòu)象,是多肽鏈局部的空間結(jié)構(gòu)主要有α-螺旋、β-片層、loop、colis等幾種形式,它們是構(gòu)成蛋白質(zhì)高級(jí)結(jié)構(gòu)的基本要素。多肽鏈中有60%的區(qū)段為α-螺旋和β-折疊。蛋白質(zhì)二級(jí)結(jié)構(gòu)
第四十二頁第四十三頁,共75頁。肽鏈主鏈骨架圍繞中心軸盤旋成螺旋狀的結(jié)構(gòu)α螺旋
第四十三頁第四十四頁,共75頁。在多肽鏈之間或一條肽鏈的肽段之間靠氫鍵聯(lián)結(jié)而成的鋸齒狀片層結(jié)構(gòu)β片層
第四十四頁第四十五頁,共75頁?;旌夕缕瑢?/p>
第四十五頁第四十六頁,共75頁。
Loops連接
-helix和b-sheet長(zhǎng)度和三級(jí)結(jié)構(gòu)不定在蛋白質(zhì)結(jié)構(gòu)的表面受點(diǎn)突變的影響小柔性好,構(gòu)象變化余地大帶電荷、極性的氨基酸比例高傾向成為活性位點(diǎn)第四十六頁第四十七頁,共75頁。結(jié)構(gòu)域(domian)domian是在二級(jí)結(jié)構(gòu)或超二級(jí)結(jié)構(gòu)的基礎(chǔ)上形成三級(jí)結(jié)構(gòu)的局部折疊區(qū)。domian通常由50-300個(gè)氨基酸殘基組成,其特點(diǎn)是在三維空間可以明顯區(qū)分和相對(duì)獨(dú)立,并且具有一定的生物功能如結(jié)合小分子。motif是結(jié)構(gòu)域的亞單位,通常由2~3個(gè)二級(jí)結(jié)構(gòu)單位組成,一般為α-螺旋、β-片層和loops。第四十七頁第四十八頁,共75頁。三級(jí)和四級(jí)結(jié)構(gòu)三級(jí)結(jié)構(gòu)肽鏈折疊成三維的空間結(jié)構(gòu)二級(jí)結(jié)構(gòu)在空間上的排布長(zhǎng)程的、共價(jià)與非共價(jià)的相互作用如果蛋白質(zhì)只有1條肽鏈,三級(jí)結(jié)構(gòu)就是最高結(jié)構(gòu)層次四級(jí)結(jié)構(gòu)多個(gè)肽鏈在空間上的排布第四十八頁第四十九頁,共75頁。蛋白質(zhì)的三級(jí)結(jié)構(gòu)
在二級(jí)結(jié)構(gòu)基礎(chǔ)上的肽鏈再折疊形成的構(gòu)象α螺旋β折疊Zn疏水核心α螺旋第四十九頁第五十頁,共75頁。蛋白質(zhì)的四級(jí)結(jié)構(gòu)
組成蛋白質(zhì)的多條肽鏈在天然構(gòu)象空間上的排列方式,多以弱鍵互相連接,疏水力、氫鍵、鹽鍵第五十頁第五十一頁,共75頁。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)一級(jí)序列(1D)MVLSEGEWQLVLHVWAKVEADVAGHGQDILIRLFKSHPETLEKFDRVKHLKTEAEMKASEDLKKHGVTVLTALGAILKKKGHHEAELKPLAQSHATKHKIPIKYLEFISEAIIHVLHSRHPGNFGADAQGAMNKALELFRKDIAAKYKELGYQG
二級(jí)結(jié)構(gòu)(2D)第五十一頁第五十二頁,共75頁。參考文獻(xiàn):Rost,B.&Sander,C.(1993),Predictionofproteinsecondarystructureatbetterthan70%Accuracy,JournalofMolecularBiology,232,584-599.Accuracy:75%PHD第五十二頁第五十三頁,共75頁。參考文獻(xiàn):Jones,D.,1999.Proteinsecondarystructurepredictionbasedonposition-specificscoringmatrices.J.Mol.Biol292,195-202.Accuracy:80%PSIPRED第五十三頁第五十四頁,共75頁。PSIPRED第五十四頁第五十五頁,共75頁。PSIPRED第五十五頁第五十六頁,共75頁。蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)同源建模法從頭預(yù)測(cè)方法Threading方法組合方法第五十六頁第五十七頁,共75頁。同源建模法同源建模是使用與目標(biāo)序列同源的某一蛋白質(zhì)的實(shí)驗(yàn)結(jié)構(gòu)作為模板,對(duì)目標(biāo)序列進(jìn)行三維結(jié)構(gòu)的預(yù)測(cè)。第五十七頁第五十八頁,共75頁。同源建模法同源建模對(duì)于詮釋蛋白質(zhì)序列、結(jié)構(gòu)和功能之間的關(guān)系至關(guān)重要。同源建模應(yīng)用廣泛,但仍有一些局限,其準(zhǔn)確性依賴于模板的質(zhì)量和關(guān)鍵步驟的準(zhǔn)確性。同源建模目前的挑戰(zhàn)仍然在于結(jié)構(gòu)模型的優(yōu)化,既需要尋找更合理的優(yōu)化方法來使模型接近真實(shí)結(jié)構(gòu)而不是模板結(jié)構(gòu)。另外一個(gè)挑戰(zhàn)在于過度依賴“序列相似,結(jié)構(gòu)相似”的規(guī)則,有些蛋白質(zhì)序列差異大結(jié)構(gòu)卻相似,需要分辨這樣的“特例”。第五十八頁第五十九頁,共75頁。從頭預(yù)測(cè)方法從頭計(jì)算(Abinitio)方法:這類方法的依據(jù)是熱力學(xué)理論,即求蛋白質(zhì)能量最小的狀態(tài)。生物學(xué)家和物理學(xué)家等認(rèn)為從原理上講能量是影響蛋白質(zhì)結(jié)構(gòu)的本質(zhì)因素。由于巨大的計(jì)算量,這種方法并不實(shí)用,目前只能計(jì)算短序列氨基酸形成的結(jié)構(gòu)。隨著超級(jí)計(jì)算機(jī)的出現(xiàn),計(jì)算機(jī)的計(jì)算能力在飛速發(fā)展,這個(gè)問題會(huì)解決嗎?第五十九頁第六十頁,共75頁。從頭預(yù)測(cè)方法能量函數(shù)鍵能(bondenergy)鍵的轉(zhuǎn)角能(bondangleenergy)二面角能(dihedralangleenergy)范德華力(vanderWaalsenergy)靜電力(electrostaticenergy)根據(jù)能量函數(shù)計(jì)算結(jié)構(gòu)的最小自由能:MolecularDynamicsorMonteCarlomethods計(jì)算量大第六十頁第六十一頁,共75頁。Threading方法穿線法(Threading)方法:由于AbInitio方法目前只有理論上的意義,Homology方法受限于待求蛋白質(zhì)必需和已知模板庫中某個(gè)蛋白質(zhì)有較高的序列相似性,對(duì)于其他大部分蛋白質(zhì)來說,有必要尋求新的方法。Threading就此應(yīng)運(yùn)而生。第六十一頁第六十二頁,共75頁。Threading方法Threading將給定序列與模板庫做序列比較(foldlibrary)評(píng)分準(zhǔn)則:給定序列是否與模板的結(jié)構(gòu)吻合(1D-3Dprofile)根據(jù)打分結(jié)果對(duì)模板適用性給予排序
TargetSequenceStructureTemplates
ALKKGF…HFDTSE第六十二頁第六十三頁,共75頁。同源建模法組合方法╋Abinitio法Threading法╋第六十三頁第六十四頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的原則蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)過程是個(gè)比較復(fù)雜的多步過程,不同類別的蛋白質(zhì),例如膜蛋白與可溶蛋白,由于不同的理化性質(zhì),可能需要不同的預(yù)測(cè)方法。一個(gè)蛋白質(zhì)可能有多個(gè)功能結(jié)構(gòu)域(domain),要直接預(yù)測(cè)具有多個(gè)domain的蛋白質(zhì)不大可能,因?yàn)閿?shù)據(jù)庫中可能沒有相應(yīng)的模板。在很大程度上,一個(gè)蛋白質(zhì)的各domain的折疊方式不依賴于其他domain的折疊方式,因此,每個(gè)domain的結(jié)構(gòu)可以單獨(dú)預(yù)測(cè)。于是如何在一個(gè)蛋白質(zhì)序列定位各個(gè)domain的邊界也成了結(jié)構(gòu)預(yù)測(cè)的一個(gè)問題。有些蛋白質(zhì)序列可能包含信號(hào)肽,它們與蛋白質(zhì)結(jié)構(gòu)信息無關(guān),所以可以切除。第六十四頁第六十五頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的原則序列一致性(sequenceidentity)大于30%→同源建模法。序列一致性(sequenceidentity)小于30%→Threading法或組合方法。第六十五頁第六十六頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的評(píng)價(jià)驗(yàn)證方法是取已知結(jié)構(gòu)的蛋白質(zhì),對(duì)這些蛋白質(zhì)進(jìn)行模擬結(jié)構(gòu)預(yù)測(cè),并將預(yù)測(cè)結(jié)構(gòu)與真實(shí)結(jié)構(gòu)進(jìn)行比較。一是分析兩者之間的均方差差距RMSD,還有一個(gè)評(píng)價(jià)標(biāo)準(zhǔn)是TM-score。權(quán)威的評(píng)判機(jī)構(gòu),建立公共認(rèn)可的蛋白質(zhì)結(jié)構(gòu)測(cè)試數(shù)據(jù)集。設(shè)立在馬里蘭生物技術(shù)研究中心的CASP就是這樣一個(gè)系統(tǒng)(
)CASP(CriticalAssessmentofTechniquesforProteinStructurePrediction)被譽(yù)為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的奧林匹克競(jìng)賽,沒兩年舉辦1次。第六十六頁第六十七頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)軟件SWISS-MODEL(同源建模)Phyre/Phyre2
(同源建模+Threading)ROBETTA(從頭計(jì)算)Hhpred(Threading)I-TASSER(組合法)第六十七頁第六十八頁,共75頁。SWISS-MODEL利用同源建模的方法實(shí)現(xiàn)對(duì)一段未知序列的三級(jí)結(jié)構(gòu)的預(yù)測(cè)。該服務(wù)創(chuàng)建于1993年,瑞士生物信息學(xué)研究院維護(hù),開
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年竹林胺片搬遷改造項(xiàng)目可行性研究報(bào)告
- 2024-2030年白藥搬遷改造項(xiàng)目可行性研究報(bào)告
- 2024-2030年版中國藥學(xué)教育行業(yè)發(fā)展展望及投資創(chuàng)新模式分析報(bào)告
- 2024-2030年版中國醫(yī)用超聲耦合劑行業(yè)未來發(fā)展趨勢(shì)及投資價(jià)值研究報(bào)告
- 2024-2030年煤球公司技術(shù)改造及擴(kuò)產(chǎn)項(xiàng)目可行性研究報(bào)告
- 2024-2030年治菌必妥搬遷改造項(xiàng)目可行性研究報(bào)告
- 2024年度企業(yè)形象攝影合作框架協(xié)議3篇
- 農(nóng)村土地租賃合同:農(nóng)業(yè)觀光園
- 五一全民健身活動(dòng)方案策劃
- 農(nóng)田租賃續(xù)簽合同
- 期末模擬卷01(全國適用)-【中職專用】高二語文上學(xué)期職業(yè)模塊期末模擬卷(解析版)
- 漏洞修復(fù)策略優(yōu)化
- 手術(shù)安全培訓(xùn)
- 司機(jī)聘用協(xié)議書與司機(jī)聘用合同
- 汽車吊安全教育培訓(xùn)
- 浙江省寧波市慈溪市2023-2024學(xué)年高二上學(xué)期期末考試 物理 含解析
- 2024七年級(jí)數(shù)學(xué)上冊(cè)第4章相交線與平等線項(xiàng)目學(xué)習(xí)2包裝中的智慧習(xí)題課件新版華東師大版
- 2024湖南田漢大劇院事業(yè)單位招聘若干人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 碼頭安全生產(chǎn)知識(shí)培訓(xùn)
- 公司招商部工作流程及管理制度
- 漢語閱讀教程第一冊(cè)第十二課
評(píng)論
0/150
提交評(píng)論