《生物信息學(xué)cha》課件_第1頁(yè)
《生物信息學(xué)cha》課件_第2頁(yè)
《生物信息學(xué)cha》課件_第3頁(yè)
《生物信息學(xué)cha》課件_第4頁(yè)
《生物信息學(xué)cha》課件_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章-2蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)主講人:孫嘯制作人:劉志華東南大學(xué)吳健雄實(shí)驗(yàn)室1編輯ppt第七章-2蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)主講人:孫嘯1編輯ppt結(jié)構(gòu)預(yù)測(cè)流程ProteinsequenceDatabasesimilaritysearchDoessequencealignwithproteinofknown3Dstructure?Proteinfamily,domain,clusteranalysisRelation-shiptoknownstructure?Structuralanalysis3DcomparativemodelingPredictedthreedimensionalstructureIsthereapredictedstructure?3Danalysisinlaboratoryyesnonono2編輯ppt結(jié)構(gòu)預(yù)測(cè)流程ProteinDatabasesimilari第四節(jié)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)1、同源模型化方法主要思想: 對(duì)于一個(gè)未知結(jié)構(gòu)的蛋白質(zhì),找到一個(gè)已知結(jié)構(gòu)的同源蛋白質(zhì),以該蛋白質(zhì)的結(jié)構(gòu)為模板,為未知結(jié)構(gòu)的蛋白質(zhì)建立結(jié)構(gòu)模型。依據(jù):任何一對(duì)蛋白質(zhì),如果兩者的序列等同部分超過(guò)30%,則它們具有相似的三維結(jié)構(gòu),即兩個(gè)蛋白質(zhì)的基本折疊相同,只是在非螺旋和非折疊區(qū)域的一些細(xì)節(jié)部分有所不同。

3編輯ppt第四節(jié)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)1、同源模型化方法3編輯p假設(shè)待預(yù)測(cè)三維結(jié)構(gòu)的目標(biāo)蛋白質(zhì)為U(Unknown),利用同源模型化方法建立結(jié)構(gòu)模型的過(guò)程包括下述6個(gè)步驟:(1)搜索結(jié)構(gòu)模型的模板(T)(2)序列比對(duì)(3)建立骨架(4)構(gòu)建目標(biāo)蛋白質(zhì)的側(cè)鏈(5)構(gòu)建目標(biāo)蛋白質(zhì)的環(huán)區(qū)(6)優(yōu)化模型UT4編輯ppt假設(shè)待預(yù)測(cè)三維結(jié)構(gòu)的目標(biāo)蛋白質(zhì)為U(Unknown),利用同構(gòu)建目標(biāo)蛋白質(zhì)的側(cè)鏈5編輯ppt構(gòu)建目標(biāo)蛋白質(zhì)的側(cè)鏈5編輯ppt預(yù)測(cè)結(jié)果準(zhǔn)確率:對(duì)于具有60%等同的序列,用上述方法所建立的三維模型非常準(zhǔn)確。若序列的等同部分超過(guò)60%,則預(yù)測(cè)結(jié)果將接近于實(shí)驗(yàn)得到的測(cè)試結(jié)果。一般如果序列的等同部分大于30%,則可以期望得到比較好的預(yù)測(cè)結(jié)果。6編輯ppt預(yù)測(cè)結(jié)果準(zhǔn)確率:6編輯ppt2、線索化方法(折疊識(shí)別方法)有很多蛋白質(zhì)具有相似的空間結(jié)構(gòu),但它們的序列等同部分小于25%,即遠(yuǎn)程同源。對(duì)于這類蛋白質(zhì),很難通過(guò)序列比對(duì)找出它們之間的關(guān)系,必須設(shè)計(jì)新的分析方法。7編輯ppt2、線索化方法(折疊識(shí)別方法)7編輯ppt對(duì)于一個(gè)未知結(jié)構(gòu)的蛋白質(zhì)(U),如果找到一個(gè)已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)(T),那么可以根據(jù)T的結(jié)構(gòu)模板通過(guò)遠(yuǎn)程同源模型化方法建立U的三維結(jié)構(gòu)模型。UT(遠(yuǎn)程同源)8編輯ppt對(duì)于一個(gè)未知結(jié)構(gòu)的蛋白質(zhì)(U),UT(遠(yuǎn)程同源一個(gè)遠(yuǎn)程同源模型化方法要解決三個(gè)問(wèn)題:(1)檢測(cè)遠(yuǎn)程同源蛋白質(zhì)(T);(2)U和T的序列必須被正確地對(duì)比排列;(3)修改一般的同源模型化過(guò)程,以應(yīng)用于相似度非常低的情況,即處理更多的環(huán)區(qū),建立合理的三維結(jié)構(gòu)模型。

如何解決第一個(gè)和第二個(gè)問(wèn)題?基本思想是建立一個(gè)從U到已知結(jié)構(gòu)T的線索,并通過(guò)一些基于環(huán)境或基于知識(shí)的勢(shì),評(píng)價(jià)序列與結(jié)構(gòu)的適應(yīng)性。至于最后建立三維結(jié)構(gòu)模型則是非常困難的序列→結(jié)構(gòu)比對(duì)9編輯ppt一個(gè)遠(yuǎn)程同源模型化方法要解決三個(gè)問(wèn)題:序列→結(jié)構(gòu)比對(duì)9線索化的主要思想:利用氨基酸的結(jié)構(gòu)傾向(如形成二級(jí)結(jié)構(gòu)的傾向、疏水性、極性等),評(píng)價(jià)一個(gè)序列所對(duì)應(yīng)的結(jié)構(gòu)是否能夠適配到一個(gè)給定的結(jié)構(gòu)環(huán)境中。10編輯ppt線索化的主要思想:10編輯ppt建立序列到結(jié)構(gòu)的線索的過(guò)程稱為線索化,線索技術(shù)又稱折疊識(shí)別技術(shù)。線索化或者折疊識(shí)別的目標(biāo)是為目標(biāo)蛋白質(zhì)U尋找合適的蛋白質(zhì)模板,這些模板蛋白質(zhì)與U沒(méi)有顯著的序列相似性,但卻是遠(yuǎn)程同源的。

11編輯ppt建立序列到結(jié)構(gòu)的線索的過(guò)程稱為線索化,線索技術(shù)又稱折疊識(shí)別技線索化方法一般有5個(gè)基本組成部分:(1)已知三維折疊結(jié)構(gòu)的數(shù)據(jù)庫(kù);(2)一種適合于進(jìn)行序列-結(jié)構(gòu)比對(duì)的三維折疊信息的表示方法;(3)一個(gè)序列-結(jié)構(gòu)匹配函數(shù),該函數(shù)對(duì)匹配程度進(jìn)行打分;(4)建立最優(yōu)線索的策略,或者是進(jìn)行序列-結(jié)構(gòu)比對(duì)的策略;(5)一種評(píng)價(jià)序列-結(jié)構(gòu)比對(duì)顯著性的方法。12編輯ppt線索化方法一般有5個(gè)基本組成部分:12編輯ppt假設(shè)存在有限數(shù)目的核心折疊(corefolds)核心折疊實(shí)際上是構(gòu)成蛋白質(zhì)空間形狀的基本模式。建立核心折疊數(shù)據(jù)庫(kù)預(yù)測(cè)----建立線索U序列與數(shù)據(jù)庫(kù)核心折疊比對(duì)取最佳核心折疊U結(jié)構(gòu)模型13編輯ppt假設(shè)存在有限數(shù)目的核心折疊(corefolds)U序列與數(shù)一種基于序列與結(jié)構(gòu)比對(duì)的最優(yōu)線索化算法令:s1,s2,…,sn為蛋白質(zhì)序列S的n個(gè)元素C1,C2,…,Cm為數(shù)據(jù)庫(kù)中核心折疊C的m個(gè)核心區(qū)域 Cij為第i個(gè)核心區(qū)域第j個(gè)氨基酸位置

每一個(gè)核心區(qū)域由若干個(gè)氨基酸殘基構(gòu)成

14編輯ppt一種基于序列與結(jié)構(gòu)比對(duì)的最優(yōu)線索化算法14編輯ppt設(shè)t是一個(gè)從序列到核心折疊的線索,那么t說(shuō)明了序列S的哪些元素si,sj,sk,…代表核心區(qū)域C1,C2,C3,…的起始位置。這實(shí)際上是一種從序列S到核心折疊C的比對(duì)令

代表核心折疊C中的環(huán)到序列S中空位的映射,顯然

是通過(guò)線索化而確定的。15編輯ppt設(shè)t是一個(gè)從序列到核心折疊的線索,那么t說(shuō)明了序列S的哪些元令f(t)是進(jìn)行比對(duì)的得分函數(shù),其定義如下:f(t)=g1(v,t)+g2(u,v,t)+g3(

,t) g1(v,t)評(píng)價(jià)氨基酸殘基v所處的位置g2(u,v,t)評(píng)價(jià)殘基u和v的相對(duì)位置,如果u和v鍵合,則得分高;g3(

,t)評(píng)價(jià)環(huán)區(qū),根據(jù)環(huán)區(qū)的大小進(jìn)行打分。

線索化問(wèn)題: 對(duì)于給定的序列S和核心折疊C,選擇一個(gè)線索t,使得f(t)的值最小,即尋找一個(gè)從S到C的最佳映射。16編輯ppt令f(t)是進(jìn)行比對(duì)的得分函數(shù),其定義如下:16編輯ppt3、從頭預(yù)測(cè)方法在既沒(méi)有已知結(jié)構(gòu)的同源蛋白質(zhì)、也沒(méi)有已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)的情況下,上述兩種蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的方法都不能用,這時(shí)只能采用從頭預(yù)測(cè)方法,即(直接)僅僅根據(jù)序列本身來(lái)預(yù)測(cè)其結(jié)構(gòu)。17編輯ppt3、從頭預(yù)測(cè)方法17編輯ppt從頭預(yù)測(cè)方法一般由下列3個(gè)部分組成:(1)一種蛋白質(zhì)幾何的表示方法 由于表示和處理所有原子和溶劑環(huán)境的計(jì)算開(kāi)銷非常大,因此需要對(duì)蛋白質(zhì)和溶劑的表示形式作近似處理。(2)一種勢(shì)函數(shù)及其參數(shù) 通過(guò)對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計(jì)分析確定勢(shì)函數(shù)中的各個(gè)參數(shù)(3)一種構(gòu)象空間搜索技術(shù)構(gòu)象空間搜索和勢(shì)函數(shù)的建立是從頭預(yù)測(cè)方法的關(guān)鍵18編輯ppt從頭預(yù)測(cè)方法一般由下列3個(gè)部分組成:18編輯pptN端的氨基酸位于坐標(biāo)系統(tǒng)的原點(diǎn)第二個(gè)氨基酸位于坐標(biāo)的(1,0)或(1,0,0)處。H-P模型-[疏水(hydrophobic)-極性(polar)]

19編輯pptN端的氨基酸位于坐標(biāo)系統(tǒng)的原點(diǎn)H-P模型-[疏水(hydr基于疏水殘基之間的接觸進(jìn)行打分每一個(gè)H和H的接觸(非相鄰殘基)對(duì)能量的貢獻(xiàn)都為-1最優(yōu)的構(gòu)象就是所有可能的構(gòu)象中具有最多H和H接觸的那個(gè)構(gòu)象圖中的二維和三維構(gòu)象的得分都是-320編輯ppt基于疏水殘基之間的接觸進(jìn)行打分20編輯ppt絕對(duì)方向表示法:每一個(gè)位置上可選擇的方向:上、右、左和下(U、R、L、D);而對(duì)于三維模型:上、右、左、下、后和前(U、R、L、D、B、F)。構(gòu)象空間搜索(R,R,D,L,D,L,U,L,U,U,R) (R,B,U,F(xiàn),L,U,R,B,L,L,F(xiàn))21編輯ppt絕對(duì)方向表示法:構(gòu)象空間搜索(R,R,D,L,D,L,U,L相對(duì)方向表示法:利用每個(gè)氨基酸殘基主鏈的轉(zhuǎn)動(dòng)方向來(lái)表示每個(gè)位置上的殘基的方向二維網(wǎng)格模型:每個(gè)殘基位置上可選擇的方向有三個(gè)左、右和前(L、R和F)三維網(wǎng)格模型:左、右、前、上和下(L、R、F、U、D)22編輯ppt相對(duì)方向表示法:22編輯ppt能量函數(shù)和優(yōu)化需要考慮的相互作用疏水作用氫鍵二硫橋靜電作用范德華力溶劑作用23編輯ppt能量函數(shù)和優(yōu)化23編輯ppt分子力學(xué)方法——假設(shè)正確的蛋白質(zhì)折疊對(duì)應(yīng)于最低能量的構(gòu)象分子力學(xué)勢(shì)能是原子坐標(biāo)的函數(shù)勢(shì)能函數(shù)由多項(xiàng)組成 成鍵作用: 化學(xué)鍵的伸縮能(鍵長(zhǎng)) 彎曲能(鍵角) 扭轉(zhuǎn)能(二面角) 非成鍵作用: 范德華力 靜電力 氫鍵分子力學(xué)中的勢(shì)能參數(shù)的來(lái)源從頭算(abinitio)和半經(jīng)驗(yàn)計(jì)算結(jié)果氨基酸和小分子的實(shí)驗(yàn)觀察結(jié)果24編輯ppt分子力學(xué)方法24編輯ppt

能量?jī)?yōu)化方法:梯度下降法 最陡下降法 共軛梯度法牛頓-拉普森方法

25編輯ppt能量?jī)?yōu)化方法:25編輯ppt分子動(dòng)力學(xué)蒙特卡羅方法模擬退火方法遺傳算法26編輯ppt分子動(dòng)力學(xué)26編輯ppt基于勢(shì)函數(shù)或者力場(chǎng)的結(jié)構(gòu)預(yù)測(cè)方法在實(shí)際應(yīng)用中存在許多問(wèn)題,主要原因:我們還沒(méi)有完全了解究竟是哪些力決定了蛋白質(zhì)的折疊過(guò)程,同時(shí)這些力之間又是如何相互作用的力場(chǎng)參數(shù)不精確,沒(méi)有對(duì)溶劑處理的好方法構(gòu)象搜索過(guò)程容易陷入局部能量極小點(diǎn)自然折疊的蛋白質(zhì)結(jié)構(gòu)與一般蛋白質(zhì)構(gòu)象之間的能量差比較小研究蛋白質(zhì)折疊的計(jì)算量非常大27編輯ppt基于勢(shì)函數(shù)或者力場(chǎng)的結(jié)構(gòu)預(yù)測(cè)方法在實(shí)際應(yīng)用中存在許多問(wèn)題,主4、預(yù)測(cè)方法評(píng)價(jià)對(duì)各種方法所得到的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)結(jié)果需要進(jìn)行驗(yàn)證,以確定預(yù)測(cè)方法是否可行,確定其適應(yīng)面。驗(yàn)證的一種方法是取已知結(jié)構(gòu)的蛋白質(zhì),對(duì)這些蛋白質(zhì)進(jìn)行模擬結(jié)構(gòu)預(yù)測(cè),并將預(yù)測(cè)結(jié)構(gòu)與真實(shí)結(jié)構(gòu)進(jìn)行比較,分析兩者之間的差距。

權(quán)威的評(píng)判機(jī)構(gòu),建立公共認(rèn)可的蛋白質(zhì)結(jié)構(gòu)測(cè)試數(shù)據(jù)集。設(shè)立在馬里蘭生物技術(shù)研究中心的CASP就是這樣一個(gè)系統(tǒng)(/casp4/)28編輯ppt4、預(yù)測(cè)方法評(píng)價(jià)28編輯ppt第五節(jié)蛋白質(zhì)空間結(jié)構(gòu)比較結(jié)構(gòu)域?qū)Φ鞍踪|(zhì)進(jìn)行序列比較,可以發(fā)現(xiàn)同源序列的保守區(qū)域。 但是對(duì)于結(jié)構(gòu)域,通過(guò)序列比較,我們只能得到一部分信息。如果在結(jié)構(gòu)這個(gè)層次上進(jìn)行比較,可以發(fā)現(xiàn)更多的信息。蛋白質(zhì)的結(jié)構(gòu)比序列更加保守,通過(guò)比較蛋白質(zhì)的空間結(jié)構(gòu),可以發(fā)現(xiàn)屬于同一家族蛋白質(zhì)的保守結(jié)構(gòu),可以發(fā)現(xiàn)特定的空間結(jié)構(gòu)模式。這些模式由多個(gè)不相鄰的序列片段組成,經(jīng)過(guò)蛋白質(zhì)折疊以后,這些一維不相鄰的元素在三維空間中結(jié)合到一起,形成特定的功能位點(diǎn),如酶的活性部位,蛋白質(zhì)結(jié)合部位等。

29編輯ppt第五節(jié)蛋白質(zhì)空間結(jié)構(gòu)比較結(jié)構(gòu)域29編輯ppt蛋白質(zhì)結(jié)構(gòu)比較有兩個(gè)主要的任務(wù):檢測(cè)蛋白質(zhì)的結(jié)構(gòu)特征在已知兩個(gè)蛋白質(zhì)對(duì)應(yīng)結(jié)構(gòu)特征的條件下,尋找將兩個(gè)蛋白質(zhì)空間結(jié)構(gòu)重疊的幾何變換,進(jìn)行三維結(jié)構(gòu)的比對(duì)(alignment)。

30編輯ppt蛋白質(zhì)結(jié)構(gòu)比較有兩個(gè)主要的任務(wù):30編輯ppt如果用數(shù)學(xué)語(yǔ)言來(lái)描述,就是給定兩個(gè)三維點(diǎn)集P={pi}和Q={qi}(i=1,2,…,n),尋找一個(gè)空間變換矩陣T,使得最小,即:這個(gè)問(wèn)題可以用最小二乘法解決

31編輯ppt如果用數(shù)學(xué)語(yǔ)言來(lái)描述,就是給定兩個(gè)三維點(diǎn)集P={pi}和Q空間點(diǎn)三元組幾何變換

目標(biāo):尋找兩個(gè)蛋白質(zhì)空間點(diǎn)三元組重疊最多的幾何變換。32編輯ppt空間點(diǎn)三元組幾何變換

目標(biāo):32編輯ppt解決這個(gè)問(wèn)題的直接算法是如下:(1)對(duì)于每一對(duì)空間點(diǎn)三元組(分別來(lái)自不同的蛋白質(zhì)),計(jì)算能使這兩個(gè)對(duì)象重疊的幾何變換;(2)統(tǒng)計(jì)在各種變換中,能夠同時(shí)重疊、或者基本重疊的空間點(diǎn)三元組個(gè)數(shù),并作為對(duì)應(yīng)變換的得分;(3)選擇得分比較高的變換,改進(jìn)這些變換,使其得分進(jìn)一步提高。33編輯ppt解決這個(gè)問(wèn)題的直接算法是如下:33編輯ppt基于幾何哈希(geometrichashing)技術(shù)的三維結(jié)構(gòu)比對(duì)方法34編輯ppt基于幾何哈

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論