版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、藥物分子設(shè)計(jì)第九講1蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測(一一)Protein Structure Prediction (I)藥物分子設(shè)計(jì)第九講2Protein Structure Prediction From Sequence to Native Structure藥物分子設(shè)計(jì)第九講3Protein Structure PredictionPSI-BLAST藥物分子設(shè)計(jì)第九講4Protein Structure Prediction藥物分子設(shè)計(jì)第九講5Multiple Sequence Alignment Tools ClustalW Multiple sequence alignments r
2、eveal: conservation of individual residues conservation of regions differences within protein families藥物分子設(shè)計(jì)第九講6 Tools HMMer Profile For each position along the sequence, tabulate how often each type of amino acid occur (include . for gap) The pro always of size Nx21, no matter how many sequences ar
3、e considered藥物分子設(shè)計(jì)第九講7Protein Structure Prediction藥物分子設(shè)計(jì)第九講8Secondary Structure Prediction Given a protein sequence a1a2aN, secondary structure prediction aims at defining the state of each amino acid ai as being either H (helix), E (extended strand), or O (other) (Some methods have 4 states: H, E,
4、T for turns, and O for other). The quality of secondary structure prediction is measured with a Qindex (Qhelix, Qstrand, Qcoil) or Q3. Q3 is the percent of residues that match “reality” (X-ray structure). 藥物分子設(shè)計(jì)第九講9Secondary Structure PredictionAmino acid sequenceActual Secondary StructureQ3=22/29=7
5、6%Q3=22/29=76%ALHEASGPSVILFGSDVTVPPASNAEQAKhhhhhooooeeeeoooeeeooooohhhhhohhhooooeeeeoooooeeeooohhhhhhhhhhhoooohhhhooohhhooooohhhhh(useful prediction)(terrible prediction) Q3 for random prediction is 33% Secondary structure assignment in real proteins is uncertain to about 10%. Therefore, a “perfect”
6、 prediction would have Q3=90%.Limitations of Q3 (Q3 = Npredicted 100%/ Nobserved) 藥物分子設(shè)計(jì)第九講10Secondary Structure Prediction Chou-Fasman Method Start by computing amino acids propensities to belong to a given type of secondary structure: Propensities 1 mean that the residue type i is likely to be fou
7、nd in the corresponding secondary structure type.)()/()()/()()/(iPTurniPiPBetaiPiPHelixiP藥物分子設(shè)計(jì)第九講11 Chou-Fasman Method參數(shù)值P、P和Pt是分別在原有相應(yīng)值的基礎(chǔ)上乘以100得到 Secondary Structure Prediction藥物分子設(shè)計(jì)第九講12Secondary Structure Prediction Chou-Fasman Method Helix prediction 沿著蛋白質(zhì)序列尋找沿著蛋白質(zhì)序列尋找 螺旋核,相鄰的螺旋核,相鄰的6 6個(gè)殘基中如果有
8、至個(gè)殘基中如果有至少少4 4個(gè)殘基傾向于形成個(gè)殘基傾向于形成 螺旋,即有螺旋,即有4 4個(gè)殘基對應(yīng)的個(gè)殘基對應(yīng)的P P 100100,則認(rèn)為是螺旋核。則認(rèn)為是螺旋核。 然后從螺旋核向兩端延伸,直至四肽片段然后從螺旋核向兩端延伸,直至四肽片段P P 的平均值小于的平均值小于100100為止。按上述方式找到的片段長度大于為止。按上述方式找到的片段長度大于5 5,并且,并且P P 的平的平均值大于均值大于P P 的平均值,那么這個(gè)片段的二級(jí)結(jié)構(gòu)就被預(yù)測的平均值,那么這個(gè)片段的二級(jí)結(jié)構(gòu)就被預(yù)測為為 螺旋。此外,不容許螺旋。此外,不容許ProPro在螺旋內(nèi)部出現(xiàn),但可出現(xiàn)在在螺旋內(nèi)部出現(xiàn),但可出現(xiàn)在C
9、C末端以及末端以及N N端的前三位,這也用于終止螺旋的延伸。端的前三位,這也用于終止螺旋的延伸。藥物分子設(shè)計(jì)第九講13Secondary Structure Prediction Chou-Fasman Method Strand Prediction 如果相鄰如果相鄰6 6個(gè)殘基中若有個(gè)殘基中若有4 4個(gè)傾向于形成個(gè)傾向于形成折疊,即有折疊,即有4 4個(gè)殘個(gè)殘基對應(yīng)的基對應(yīng)的P P 100100,則認(rèn)為是折疊核。,則認(rèn)為是折疊核。 折疊核向兩端延伸直至折疊核向兩端延伸直至4 4個(gè)殘基個(gè)殘基P P 的平均值小于的平均值小于100100為止。為止。若延伸后片段的若延伸后片段的P P 的平均值大于
10、的平均值大于105105,并且,并且P P 的平均值大的平均值大于于P P 的平均值,則該片段被預(yù)測為的平均值,則該片段被預(yù)測為折疊。折疊。藥物分子設(shè)計(jì)第九講14Secondary Structure Prediction Chou-Fasman Method Turn Prediction 轉(zhuǎn)角的模型為四肽組合模型,要考慮每個(gè)位置上殘基的組轉(zhuǎn)角的模型為四肽組合模型,要考慮每個(gè)位置上殘基的組合概率,即特定殘基在四肽模型中各個(gè)位置的概率。合概率,即特定殘基在四肽模型中各個(gè)位置的概率。 在計(jì)算過程中,對于從第在計(jì)算過程中,對于從第i i個(gè)殘基開始的連續(xù)個(gè)殘基開始的連續(xù)4 4個(gè)殘基的片個(gè)殘基的片段,
11、將上述概率相乘,根據(jù)計(jì)算結(jié)果判斷是否是轉(zhuǎn)角。如段,將上述概率相乘,根據(jù)計(jì)算結(jié)果判斷是否是轉(zhuǎn)角。如果果f f(i)(i)f f(i+1)(i+1)f f(i+2)(i+2)f f(i+3)(i+3)大于大于7.57.51010-5-5,四肽,四肽片段片段P Pt t的平均值大于的平均值大于100100,并且,并且P Pt t 的均值同時(shí)大于的均值同時(shí)大于P P 的均的均值以及值以及P P 的均值,則可以預(yù)測這樣連續(xù)的的均值,則可以預(yù)測這樣連續(xù)的4 4個(gè)殘基形成轉(zhuǎn)個(gè)殘基形成轉(zhuǎn)角。角。藥物分子設(shè)計(jì)第九講15Secondary Structure Prediction Chou-Fasman Meth
12、od Conflict 假如預(yù)測出的螺旋區(qū)域和折疊區(qū)域存在重疊,則按照重疊假如預(yù)測出的螺旋區(qū)域和折疊區(qū)域存在重疊,則按照重疊區(qū)域區(qū)域P P 均值和均值和P P 均值的相對大小進(jìn)行預(yù)測,若均值的相對大小進(jìn)行預(yù)測,若P P 的均值的均值大于大于P P 的均值,則預(yù)測為螺旋;反之,預(yù)測為折疊。的均值,則預(yù)測為螺旋;反之,預(yù)測為折疊。 藥物分子設(shè)計(jì)第九講16Secondary Structure Prediction GOR Method 是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法 GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來處理將蛋白質(zhì)序列當(dāng)作一連串的信息值來處理 GOR方法
13、不僅考慮被預(yù)測位置本身氨基酸殘基種類的影響,方法不僅考慮被預(yù)測位置本身氨基酸殘基種類的影響,而且考慮相鄰殘基種類對該位置構(gòu)象的影響而且考慮相鄰殘基種類對該位置構(gòu)象的影響 藥物分子設(shè)計(jì)第九講17Secondary Structure Prediction GOR Method 通過對已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析,計(jì)算出中心殘通過對已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析,計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率,從而產(chǎn)生一個(gè)窗口中各個(gè)位置的頻率,從而產(chǎn)生一個(gè)17172020的得分矩陣。的得分矩陣。然后利用
14、矩陣中的值來計(jì)算待預(yù)測的序列中每個(gè)殘基形成螺然后利用矩陣中的值來計(jì)算待預(yù)測的序列中每個(gè)殘基形成螺旋、折疊或者轉(zhuǎn)角的概率。旋、折疊或者轉(zhuǎn)角的概率。 藥物分子設(shè)計(jì)第九講18Secondary Structure Prediction GOR Method 首先考慮兩個(gè)事件首先考慮兩個(gè)事件S S和和R R的條件概率的條件概率P P( (S S| |R R) ),即在,即在R R發(fā)生的條件發(fā)生的條件下,下,S S發(fā)生的概率發(fā)生的概率P P( (S S, ,R R) )是同時(shí)觀察到是同時(shí)觀察到S S 和和R R 的聯(lián)合概率的聯(lián)合概率, ,而而P P( (R R) )是是R R 的出現(xiàn)概的出現(xiàn)概率。率。
15、在二級(jí)結(jié)構(gòu)預(yù)測過程中,在二級(jí)結(jié)構(gòu)預(yù)測過程中,S S 表示特殊的二級(jí)結(jié)構(gòu)類型,表示特殊的二級(jí)結(jié)構(gòu)類型,R R 代代表氨基酸殘基,表氨基酸殘基,P P( (S S| |R R) )就是殘基就是殘基R R 處于二級(jí)結(jié)構(gòu)類型處于二級(jí)結(jié)構(gòu)類型S S 的概的概率。率。P P( (S S) )是在統(tǒng)計(jì)過程中觀察到二級(jí)結(jié)構(gòu)類型是在統(tǒng)計(jì)過程中觀察到二級(jí)結(jié)構(gòu)類型S S 的概率。的概率。 Statistics: helices 29.7%, strands 19.7%, turns 12.2%, coils 38.3%藥物分子設(shè)計(jì)第九講19Secondary Structure Prediction Lim Met
16、hod 氨基酸的理化性質(zhì)對二級(jí)結(jié)構(gòu)影響較大氨基酸的理化性質(zhì)對二級(jí)結(jié)構(gòu)影響較大 在進(jìn)行結(jié)構(gòu)預(yù)測時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。如疏水在進(jìn)行結(jié)構(gòu)預(yù)測時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。如疏水性、極性、側(cè)鏈基團(tuán)的大小等,根據(jù)殘基各方面的性質(zhì)及殘性、極性、側(cè)鏈基團(tuán)的大小等,根據(jù)殘基各方面的性質(zhì)及殘基之間的組合預(yù)測可能形成的二級(jí)結(jié)構(gòu)?;g的組合預(yù)測可能形成的二級(jí)結(jié)構(gòu)。 “疏水性疏水性”是氨基酸的一種重要性質(zhì),疏水性的氨基酸傾向是氨基酸的一種重要性質(zhì),疏水性的氨基酸傾向于遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。于遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。藥物分子設(shè)計(jì)第九講20Secondary Struc
17、ture Prediction Lim Method Helix prediction 在一段序列中發(fā)現(xiàn)第在一段序列中發(fā)現(xiàn)第i、i+3、i+4位(如位(如1、4、5)是疏水)是疏水殘基時(shí),這一片段就被預(yù)測為螺旋;殘基時(shí),這一片段就被預(yù)測為螺旋; 當(dāng)發(fā)現(xiàn)第當(dāng)發(fā)現(xiàn)第i、i+1、i+4位(如位(如7,8,11)為疏水殘基時(shí),)為疏水殘基時(shí),這一片段也被預(yù)測為螺旋。這一片段也被預(yù)測為螺旋。藥物分子設(shè)計(jì)第九講21Secondary Structure Prediction Lim Method Strand prediction 對于折疊,也存在著一些特征的親疏水殘基間隔模式,埋對于折疊,也存在著一些特
18、征的親疏水殘基間隔模式,埋藏的藏的折疊通常由連續(xù)的疏水殘基組成,一側(cè)暴露的折疊折疊通常由連續(xù)的疏水殘基組成,一側(cè)暴露的折疊則通常具有親水則通常具有親水-疏水的兩殘基重復(fù)模式。疏水的兩殘基重復(fù)模式。 原則上,通過在序列中搜尋特殊的親疏水殘基間隔模式,就可原則上,通過在序列中搜尋特殊的親疏水殘基間隔模式,就可以預(yù)測螺旋和折疊。以預(yù)測螺旋和折疊。 藥物分子設(shè)計(jì)第九講22Secondary Structure Prediction Neural Network 用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋網(wǎng)絡(luò),包括輸入層、隱含層以及輸出層。網(wǎng)
19、絡(luò),包括輸入層、隱含層以及輸出層。藥物分子設(shè)計(jì)第九講23 Neural Network 預(yù)測結(jié)果是窗口所取的輸入樣本中心的殘基所在位置的二級(jí)預(yù)測結(jié)果是窗口所取的輸入樣本中心的殘基所在位置的二級(jí)結(jié)構(gòu)。結(jié)構(gòu)。 例如:例如: Pattern LSADQISTVQASFDK Target H 沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口,將窗口內(nèi)的沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口,將窗口內(nèi)的序列片段進(jìn)行編碼,窗口包括中心氨基酸序列片段進(jìn)行編碼,窗口包括中心氨基酸殘基及左右殘基及左右m個(gè)(共個(gè)(共2m+1個(gè))殘基,每一個(gè)殘基用個(gè))殘基,每一個(gè)殘基用21個(gè)神經(jīng)元編碼,因此,輸入個(gè)神經(jīng)元編碼,因此,輸入
20、層共有層共有21(2m+1)個(gè)神經(jīng)元。個(gè)神經(jīng)元。 例如:例如:Alanine 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 輸出層有輸出層有3個(gè)神經(jīng)元,分別對應(yīng)于窗口中心殘基的個(gè)神經(jīng)元,分別對應(yīng)于窗口中心殘基的H、E、C三三態(tài)。結(jié)果由三個(gè)輸出中值最大的那個(gè)決定。態(tài)。結(jié)果由三個(gè)輸出中值最大的那個(gè)決定。 例如:輸出值為(例如:輸出值為(0.2,0.1,0.1),則認(rèn)為是螺旋結(jié)構(gòu)。編),則認(rèn)為是螺旋結(jié)構(gòu)。編碼為:碼為:1 0 0 Secondary Structure Prediction藥物分子設(shè)計(jì)第九講24 Neural Network PHDsec (Pro neural network system from Heidelberg)Secondary Structure Prediction藥物分子設(shè)計(jì)第九講25 Neural Network PHDsec (Pro neural network system from Heidelberg) Input藥物分子設(shè)計(jì)第九講26 Neural Network PHDsec
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版物流企業(yè)市場調(diào)研與分析合同3篇
- 娛樂行業(yè)安全工作總結(jié)制藥行業(yè)安全工作總結(jié)
- 引導(dǎo)學(xué)生樹立正確語文學(xué)習(xí)態(tài)度
- 電子產(chǎn)品客服工作總結(jié)
- 網(wǎng)頁設(shè)計(jì)美工工作總結(jié)
- 音樂行業(yè)演出場地衛(wèi)生消毒計(jì)劃
- 二零二五年度鋼結(jié)構(gòu)建筑拆除與安裝一體化合同
- 2025版消防安全設(shè)施安裝合同3篇
- 二零二五年度環(huán)保節(jié)能設(shè)備銷售、安裝、能效評估服務(wù)合同3篇
- 二零二五版珍貴樹木銷售合作協(xié)議3篇
- 2025年1月浙江高考英語聽力試題真題完整版(含答案+文本+MP3)
- 《人工智能發(fā)展史》課件
- 《UL線材培訓(xùn)資識(shí)》課件
- 小學(xué)一年級(jí)數(shù)學(xué)20以內(nèi)的口算題(可直接打印A4)
- 《精密板料矯平機(jī) 第1部分:型式和基本參數(shù)》
- 舞蹈課家長會(huì)
- 自來水質(zhì)量提升技術(shù)方案
- 工業(yè)自動(dòng)化生產(chǎn)線操作手冊
- 房地產(chǎn)銷售任務(wù)及激勵(lì)制度
- 2024年內(nèi)蒙古中考語文試卷五套合卷附答案
- 并購指南(如何發(fā)現(xiàn)好公司)
評論
0/150
提交評論