版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析第1頁,共149頁,2023年,2月20日,星期二第六章
蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析中山大學(xué)吳忠道上海交通大學(xué)魏冬青生物信息學(xué)第2頁,共149頁,2023年,2月20日,星期二學(xué)習(xí)提綱
重點
蛋白質(zhì)的分離與鑒定方法、蛋白質(zhì)芯片分析技術(shù)以及酵母雙雜交技術(shù)。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法及其軟件、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法及其軟件。第3頁,共149頁,2023年,2月20日,星期二
難點
蛋白質(zhì)二級結(jié)構(gòu)和三維結(jié)構(gòu)算法以及軟件的使用。蛋白質(zhì)功能預(yù)測方法及其軟件的使用。蛋白質(zhì)與疾病發(fā)生。常用的蛋白質(zhì)組學(xué)數(shù)據(jù)庫。
熟悉第4頁,共149頁,2023年,2月20日,星期二第一節(jié)引言Section1Introduction第5頁,共149頁,2023年,2月20日,星期二隨著人類基因組及諸多物種基因組計劃的完成,生命科學(xué)研究已經(jīng)進入以基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等“組學(xué)”為研究標志的后基因組時代(post-genomicera)。在后基因組時代,蛋白質(zhì)組學(xué)研究越來越受到關(guān)注和重視。第6頁,共149頁,2023年,2月20日,星期二蛋白質(zhì)組(proteome):指由一個基因組(genome),或一個細胞、組織表達的所有蛋白質(zhì)(protein)。蛋白質(zhì)組學(xué)(proteomics):蛋白質(zhì)組學(xué)是采用大規(guī)模、高通量、系統(tǒng)化的方法,研究某一類型細胞、組織或體液中的所有蛋白質(zhì)組成、功能及其蛋白之間相互作用的學(xué)科。根據(jù)不同研究目的和手段,蛋白質(zhì)組學(xué)分為表達蛋白質(zhì)組學(xué)、結(jié)構(gòu)蛋白質(zhì)組學(xué)和功能蛋白質(zhì)組學(xué)。第7頁,共149頁,2023年,2月20日,星期二①表達蛋白質(zhì)組學(xué):主要采用經(jīng)典蛋白質(zhì)組學(xué)技術(shù)如雙向凝膠電泳和圖像分析技術(shù),開展細胞內(nèi)蛋白樣品表達的定量研究;②結(jié)構(gòu)蛋白質(zhì)組學(xué):以繪制出蛋白復(fù)合物結(jié)構(gòu)或存在于一個特殊的細胞器中的蛋白為研究目標的蛋白質(zhì)組學(xué),主要用于建立細胞內(nèi)信號轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)圖譜并解釋某些特定蛋白表達對細胞產(chǎn)生的特定作用;第8頁,共149頁,2023年,2月20日,星期二③功能蛋白質(zhì)組學(xué):以細胞在某一特定時間所表達或與某個功能相關(guān)的蛋白質(zhì)集合為研究對象進行研究和描述,能夠提供有關(guān)蛋白糖基化、磷酸化,蛋白信號轉(zhuǎn)導(dǎo)通路,疾病機制或蛋白-藥物之間相互作用的重要信息。第9頁,共149頁,2023年,2月20日,星期二第二節(jié)蛋白質(zhì)組數(shù)據(jù)的獲取與分析Section2ProteomicsDataAcquisitionandAnalysis第10頁,共149頁,2023年,2月20日,星期二一、二維凝膠電泳分析技術(shù)2-DE:是將樣品進行電泳后在它的直角方向再進行一次電泳,又稱雙向電泳。第一向:等電聚焦(isoelectricfocusing,IEF),蛋白質(zhì)沿pH梯度分離至各自的等電點。第二向:是十二磺酸鈉-聚丙烯酰胺凝膠電泳(SDS),蛋白質(zhì)進行分子量的分離。(一)定義及特點第11頁,共149頁,2023年,2月20日,星期二樣品經(jīng)過電荷和質(zhì)量兩次分離后,可獲得樣品分子等電點(isoelectricpoint,pI)和分子量(molecularweight,MW)等信息。分離的結(jié)果不是獲得蛋白條帶,而是蛋白斑點。這是迄今分辨率最高、信息最多的蛋白電泳技術(shù)。目前使用廣泛的2-DE蛋白分離的方法為固相pH梯度-SDS雙向凝膠電泳。第12頁,共149頁,2023年,2月20日,星期二1.樣品制備目的是從成分復(fù)雜的細胞、組織等材料中取得純度高的完整蛋白質(zhì)組分。(二)固相pH梯度-SDS雙向凝膠電泳
(IPG-DALT電泳)操作原理及技術(shù)流程第13頁,共149頁,2023年,2月20日,星期二2.蛋白質(zhì)定量BCA法、Bradford法及UV280法等,但由于這些定量方法都基于吸光度測定,而樣品溶液中往往含有高濃度尿素等溶劑可能影響吸光度的準確測定,故推薦使用雙向電泳蛋白質(zhì)定量專用試劑盒進行檢測。第14頁,共149頁,2023年,2月20日,星期二3.一向電泳一向電泳等電聚焦(isoelectricfocusing,IEF),是根據(jù)蛋白質(zhì)pI值不同,在電場力的作用下將其分離。第15頁,共149頁,2023年,2月20日,星期二4.一向膠條的平衡進行第二向電泳前,需要對IPG膠條進行平衡(equilibration),平衡過程是將IPG膠條浸沒在第二向電泳所必需的SDS緩沖體系中,以便被分離蛋白質(zhì)與SDS完全結(jié)合并順利轉(zhuǎn)移入二向電泳的凝膠中。平衡后應(yīng)立即進行第二向電泳。第16頁,共149頁,2023年,2月20日,星期二5.二向電泳即十二烷基磺酸鈉-聚丙烯酰胺凝膠電泳,是根據(jù)分子量大小各異的蛋白質(zhì)在電場中的泳動速率不同的原理而分離蛋白質(zhì)的方法。第17頁,共149頁,2023年,2月20日,星期二6.凝膠檢測適用于SDS凝膠中蛋白質(zhì)檢測的方法都可用于雙向電泳凝膠檢測。銀染和考馬斯亮藍(R250、G250)染色,是蛋白質(zhì)組研究中最為廣泛使用的兩種染色方法。第18頁,共149頁,2023年,2月20日,星期二質(zhì)譜(massspectrometry,MS)是按照物質(zhì)的質(zhì)量與電荷的比值(質(zhì)荷比,mass-to-chargeratio,m/z)順序排列成的圖譜。質(zhì)譜分析法是按照離子的質(zhì)荷比大小對離子進行分離和測定,從而對樣品進行定性和定量分析的一種方法。二、蛋白質(zhì)組質(zhì)譜分析技術(shù)第19頁,共149頁,2023年,2月20日,星期二質(zhì)譜儀(massspectrometer)是利用電磁學(xué)原理使離子按照質(zhì)荷比進行分離,從而測定物質(zhì)的質(zhì)量與含量的科學(xué)實驗儀器。(一)質(zhì)譜儀第20頁,共149頁,2023年,2月20日,星期二1.基質(zhì)輔助激光解吸/電離(matrixassistedlaserdesorption/ionization,MALDI)利用激光脈沖將與基質(zhì)結(jié)晶混合的蛋白質(zhì)樣品升華并電離出來。2.電噴霧(electrpsprayionization,ESI)將分析物從溶液中電離出來,可以方便地與液相色譜(liquid-chromatography,LC)聯(lián)用。第21頁,共149頁,2023年,2月20日,星期二1.分子量測定2.肽譜測定生物質(zhì)譜通過與特異性蛋白酶解相結(jié)合,可測定肽質(zhì)量指紋圖(peptidemassfingerprint,PMF),并獲得全部肽段的準確分子量,結(jié)合蛋白質(zhì)數(shù)據(jù)庫檢索就可實現(xiàn)蛋白質(zhì)的快速鑒別和高通量篩選。(二)質(zhì)譜的應(yīng)用第22頁,共149頁,2023年,2月20日,星期二3.肽序列測定串聯(lián)質(zhì)譜技術(shù)可直接用于肽段的測序,從一級質(zhì)譜產(chǎn)生的肽段中選擇母離子進入二級質(zhì)譜,經(jīng)惰性氣體碰撞后,肽段沿肽鏈斷裂,由所得各肽段質(zhì)量數(shù)差值推定肽段序列,并用于數(shù)據(jù)庫查尋,稱為肽序列標簽技術(shù)(peptidesequencetag,PST),目前廣泛應(yīng)用于蛋白質(zhì)組大規(guī)模篩選。第23頁,共149頁,2023年,2月20日,星期二4.巰基和二硫鍵定位利用生物質(zhì)譜的準確分子量測定特性,同時結(jié)合碘乙酰胺、4-乙烯吡啶等化學(xué)試劑對蛋白質(zhì)進行烷基化和還原烷基化以及蛋白質(zhì)酶切、肽譜技術(shù)等,可實現(xiàn)對二硫鍵和自由巰基的快速定位。第24頁,共149頁,2023年,2月20日,星期二5.蛋白質(zhì)翻譯后修飾如用MALDI-TOF-MS對雙向電泳分離蛋白質(zhì)磷酸化位點進行定位、MALDI-TOF-MS結(jié)合不同酶解方式確定糖基化位點等。第25頁,共149頁,2023年,2月20日,星期二1.MALDI-TOF質(zhì)譜測定肽質(zhì)量指紋圖將質(zhì)譜分析獲得的肽段分子質(zhì)量與蛋白質(zhì)數(shù)據(jù)庫中理論肽段的分子質(zhì)量進行比較,通過軟件分析可獲得蛋白質(zhì)信息,根據(jù)匹配情況判斷出所鑒定分析的蛋白質(zhì)是已知的還是未知的。(三)基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜(MALDI-TOF-MS)分析技術(shù)第26頁,共149頁,2023年,2月20日,星期二2.MALDI-TOF質(zhì)譜技術(shù)用于蛋白質(zhì)C-端序列分析在質(zhì)譜儀內(nèi),應(yīng)用源后衰變(post-sourcedecay,PSD)和碰撞誘導(dǎo)解離(collision-induceddissociation,CID)可產(chǎn)生包含有僅異于一個氨基酸殘基質(zhì)量的一系列肽峰質(zhì)譜。此外,用酶或化學(xué)方法從N-或C-末端按順序除去不同數(shù)目氨基酸,亦可形成大小不同的一系列梯形肽片段,所得的一定數(shù)目肽質(zhì)量由MALDI-TOF-MS測量。第27頁,共149頁,2023年,2月20日,星期二1.電噴霧電離質(zhì)譜測定蛋白質(zhì)和多肽分子質(zhì)量蛋白質(zhì)和多肽分子經(jīng)電噴霧電離時,會吸附一個或多個質(zhì)子,形成一系列帶電荷狀態(tài)不同的分子離子,在質(zhì)譜中形成荷質(zhì)比不同的譜峰。一般可根據(jù)譜峰的同位素離子峰分布情況以及利用相鄰兩峰的荷質(zhì)比和電荷數(shù)關(guān)系計算求得離子分子質(zhì)量。(四)電噴霧質(zhì)譜分析第28頁,共149頁,2023年,2月20日,星期二2.液相色譜-電噴霧質(zhì)譜法鑒定雙向凝膠電泳蛋白質(zhì)對雙向凝膠電泳分離的蛋白質(zhì)點經(jīng)酶解后的多肽混合物進行液相色譜-電噴霧質(zhì)譜聯(lián)用(LC-ESIMS)鑒定分析,同樣可以得到PMF。第29頁,共149頁,2023年,2月20日,星期二串聯(lián)質(zhì)譜的使用能夠?qū)赑MF的結(jié)果進行再分析或?qū)ξ促x值的質(zhì)譜峰信號進行研究。對于初始用PMF法鑒定的蛋白,可選擇其中部分肽段峰進行MS/MS分析,得到肽段的序列。(五)串聯(lián)質(zhì)譜(MS/MS)第30頁,共149頁,2023年,2月20日,星期二三、蛋白質(zhì)芯片分析技術(shù)蛋白質(zhì)芯片(proteinchips)技術(shù)又稱蛋白質(zhì)微陣列(proteinmicroarrays),是一種高通量的、小型化的、平行性的生物檢測技術(shù)。第31頁,共149頁,2023年,2月20日,星期二原理蛋白質(zhì)芯片是將已知蛋白點印在固定于不同種類支持介質(zhì)上,制成由高密度蛋白質(zhì)或多肽分子微陣列組成的蛋白微陣列,陣列中固定分子的位置及組成已知,未經(jīng)標記或標記(熒光物質(zhì)、酶或化學(xué)發(fā)光物質(zhì))的生物分子與芯片上探針反應(yīng),通過掃描裝置如激光掃描系統(tǒng)(laserscannerbasessystem)或電荷偶聯(lián)照像系統(tǒng)(chargecoupleddevice-camera,CCD-camera)檢測信號強度,量化分析雜交結(jié)果,檢測蛋白質(zhì)。第32頁,共149頁,2023年,2月20日,星期二蛋白質(zhì)芯片具有以下特點①特異性強;②敏感性高;③高通量;④重復(fù)性好;⑤應(yīng)用性強;⑥適用范圍廣。第33頁,共149頁,2023年,2月20日,星期二分類根據(jù)功能:功能研究型芯片(functionalproteinmicroarrays)和分析檢測型芯片(analyticalproteinmicroarrays)。第34頁,共149頁,2023年,2月20日,星期二根據(jù)蛋白質(zhì)種類:抗體芯片和抗原芯片。根據(jù)芯片表面化學(xué)成分:化學(xué)表面芯片和生物表面芯片。根據(jù)點樣蛋白質(zhì)活性功能:無活性芯片和有活性芯片。第35頁,共149頁,2023年,2月20日,星期二根據(jù)載體:普通玻璃載體芯片(plain-glassslide)、多孔凝膠覆蓋芯片(porousgelpadchip)及微孔芯片(microwellchip)等。第36頁,共149頁,2023年,2月20日,星期二待測樣品準備反應(yīng)過程:待蛋白質(zhì)芯片與被測樣品溶液在適宜溫度下孵育一定時間后用PBST洗去未反應(yīng)分子,再根據(jù)不同標記物直接檢測(如熒光標記)或顯色后檢測(如酶標記)。蛋白質(zhì)芯片檢測及分析第37頁,共149頁,2023年,2月20日,星期二芯片檢測:對于熒光標記芯片,用熒光掃描儀或激光共聚焦顯微鏡掃描,利用計算機分析各點平均熒光密度;對于酶標記芯片,顯色后可用CCD照相機拍攝,利用計算機處理信號得到各點灰度。第38頁,共149頁,2023年,2月20日,星期二結(jié)果分析:設(shè)計對照反應(yīng),或設(shè)定陰陽性結(jié)果閾值。排除各點熒光密度或灰度背景干擾后與閾值比較并定量分析。第39頁,共149頁,2023年,2月20日,星期二應(yīng)用領(lǐng)域基因表達篩選特異性抗原抗體檢測蛋白質(zhì)組學(xué)研究蛋白質(zhì)相互作用研究第40頁,共149頁,2023年,2月20日,星期二四、酵母雙雜交系統(tǒng)酵母雙雜交系統(tǒng)(yeasttwo-hybridsystem)是一種直接于酵母細胞內(nèi)檢測蛋白質(zhì)-蛋白質(zhì)相互作用且靈敏度很高的分子生物學(xué)方法。第41頁,共149頁,2023年,2月20日,星期二酵母中轉(zhuǎn)錄活化因子GAL4蛋白能激活轉(zhuǎn)錄主要因為其二個結(jié)構(gòu)可分功能相互獨立的結(jié)構(gòu)域,即位于氨基(N)端的DNA-BD及位于羧基(C)端的AD。根據(jù)GAL4特性,可構(gòu)建兩種重組質(zhì)粒載體,分別表達GAL4蛋白的DNA-BD(N端1~147個氨基酸)和AD(羧基端768~881個氨基酸)。若在DNA-BD上連接“誘餌”蛋白X基因,在AD上連接“獵物”蛋白Y基因,再將這兩個質(zhì)粒共同轉(zhuǎn)入酵母體內(nèi)表達。第42頁,共149頁,2023年,2月20日,星期二如果酵母體內(nèi)表達的蛋白X和Y在酵母核內(nèi)發(fā)生交互作用,可使得DNA-BD和AD在空間上接近,從而激活UAS下游啟動子調(diào)節(jié)的酵母特定報告基因的表達,使轉(zhuǎn)化子由于報告基因的表達而可以在特定的營養(yǎng)缺陷培養(yǎng)基上生長,同時因激活轉(zhuǎn)錄下游GAL1-LacZ和/或MEL1基因的表達,從而在X-β-Gal和/或X-α-Gal存在下顯藍色,可用于排除篩選假陽性克隆。這樣可根據(jù)報告基因是否轉(zhuǎn)錄表達判斷“誘餌”蛋白X與“獵物”蛋白Y之間相互作用。第43頁,共149頁,2023年,2月20日,星期二(二)酵母雙雜交系統(tǒng)特點與應(yīng)用1.特點不僅可以精確測定蛋白質(zhì)間微弱相互作用,且在DNA水平操作,不需要在體外進行大量表達和純化蛋白質(zhì)。第44頁,共149頁,2023年,2月20日,星期二2.應(yīng)用分析已知蛋白質(zhì)間相互作用;可篩選cDNA文庫,分離與已知蛋白作用的新配體及其基因序列。發(fā)現(xiàn)新基因的主要途徑,是研究蛋白間交互作用最有力的工具之一。第45頁,共149頁,2023年,2月20日,星期二3.局限性轉(zhuǎn)化效率低;適用范圍有限;存在假陽性及假陰性;外源蛋白毒性及翻譯后修飾。第46頁,共149頁,2023年,2月20日,星期二五、RosettaStone方法某物種中基因C的兩個片段分別與同一物種或另一物種中基因A及基因B同源,既可認為基因A與基因B存在功能相關(guān)性,借助于基因C能找到無同源性的基因A及基因B之間關(guān)聯(lián)?;駽稱為羅塞塔石碑基因(RosettaStonegene),其表達蛋白稱為羅塞塔石碑蛋白。(一)RosettaStone方法來源第47頁,共149頁,2023年,2月20日,星期二根據(jù)羅塞塔石碑蛋白C可預(yù)測蛋白質(zhì)A與蛋白質(zhì)B之間存在相互作用。該方法理論基礎(chǔ)是基于功能相關(guān)蛋白常常共進化的性質(zhì)。第48頁,共149頁,2023年,2月20日,星期二利用RosettaStone方法,檢索大腸桿菌基因組中4290種編碼蛋白基因在其他生物細胞基因組的融合情況,共發(fā)現(xiàn)6809對蛋白能構(gòu)成RosettaStone序列,其中3950對蛋白能在SWISS-PROT數(shù)據(jù)庫檢索到注釋功能,有2682對蛋白共享至少同一個關(guān)鍵詞,說明蛋白對功能相關(guān)。應(yīng)用此法檢索酵母菌基因組,發(fā)現(xiàn)45502對相關(guān)蛋白的基因序列。(二)RosettaStone方法的應(yīng)用第49頁,共149頁,2023年,2月20日,星期二RosettaStone方法預(yù)測得到的蛋白互作網(wǎng)絡(luò),必須進一步通過實驗分析以提高其準確性。可利用噬菌體展示技術(shù)、酵母雙雜交系統(tǒng)、免疫共沉淀法、X射線結(jié)晶學(xué)以及表面等離子共振技術(shù)等有效檢測蛋白質(zhì)相互作用高通量實驗技術(shù),為蛋白質(zhì)組學(xué)發(fā)展奠定堅實的基礎(chǔ)。第50頁,共149頁,2023年,2月20日,星期二六、蛋白質(zhì)組學(xué)分析軟件與數(shù)據(jù)庫1.蛋白質(zhì)表達分布圖數(shù)據(jù)庫日內(nèi)瓦大學(xué)的xPASy系統(tǒng)。2.蛋白質(zhì)組圖譜自動識別軟件包肽圖(peptidemapping)包含一個蛋白質(zhì)全部質(zhì)譜(MS)信息,肽段(peptidefragment)包含蛋白質(zhì)多個片段質(zhì)譜信息(類似于EST)。(一)常用蛋白質(zhì)組分析工具第51頁,共149頁,2023年,2月20日,星期二(二)蛋白質(zhì)組分析軟件1.圖像分析2.微量測序(microsequencing)N-末端Edman降解技術(shù)第52頁,共149頁,2023年,2月20日,星期二3.質(zhì)譜數(shù)據(jù)質(zhì)譜鑒定主要包括數(shù)據(jù)的計算機處理和蛋白質(zhì)的數(shù)據(jù)庫搜尋鑒定。質(zhì)譜數(shù)據(jù)經(jīng)計算機處理后,可使用三種數(shù)據(jù)庫搜尋方式“鑒定”蛋白質(zhì):①利用MS數(shù)據(jù)搜尋,即PMF法;②利用“原始”MS/MS數(shù)據(jù)搜尋法;③先對串聯(lián)質(zhì)譜數(shù)據(jù)進行解析,獲得部分多肽片段氨基酸序列后對蛋白質(zhì)進行序列查詢法鑒定。第53頁,共149頁,2023年,2月20日,星期二4.肽質(zhì)譜指紋圖(PMF)與肽序列測定由于氨基酸序列不同,蛋白質(zhì)酶(如胰酶)酶解后產(chǎn)生的酶切肽片段序列也不同,其肽混合物質(zhì)量數(shù)具一定特征,稱為肽質(zhì)譜指紋圖(PMF)。第54頁,共149頁,2023年,2月20日,星期二5.氨基酸組分利用氨基酸組分異質(zhì)性,基于雙向凝膠電泳圖譜鑒定蛋白質(zhì)。多種工具可用于氨基酸組分分析,如AACompIdent、ASA、FINDER、AAC-PI及PROP-SEARCH等。第55頁,共149頁,2023年,2月20日,星期二(三)蛋白質(zhì)組數(shù)據(jù)庫1.綜合性蛋白質(zhì)2DE數(shù)據(jù)庫具有數(shù)據(jù)直觀性,以蛋白質(zhì)雙向電泳圖片為基礎(chǔ),并整合其他數(shù)據(jù)庫中信息,如蛋白質(zhì)序列、結(jié)構(gòu)及功能等。數(shù)據(jù)庫包括:SWISS2D數(shù)據(jù)庫、Argonne2D數(shù)據(jù)庫、MaxPlanck感染生物學(xué)研究所(MPIB)創(chuàng)建的蛋白質(zhì)2D數(shù)據(jù)庫等。第56頁,共149頁,2023年,2月20日,星期二2.哺乳類2DE數(shù)據(jù)庫丹麥Aarhus大學(xué)人類基因組研究中心的2D數(shù)據(jù)庫、英國心臟科學(xué)中心Harefield醫(yī)院維護的心臟內(nèi)皮細胞HSC2D數(shù)據(jù)庫、德國柏林心臟研究所的人類心肌2D數(shù)據(jù)庫等。第57頁,共149頁,2023年,2月20日,星期二3.微生物類和植物類2DE數(shù)據(jù)庫微生物類2DE數(shù)據(jù)庫主要包括細菌、真菌和寄生蟲三類。植物類2DE數(shù)據(jù)庫包括:澳大利亞國立大學(xué)ANU2D、法國INRACestas的樹木2D等。第58頁,共149頁,2023年,2月20日,星期二(四)質(zhì)譜數(shù)據(jù)庫查詢和蛋白質(zhì)鑒定常用軟件1.PepSea檢索前必須先獲得肽序列標簽(PST)。在檢索較大蛋白時積分較高,隨機匹配的可能性也較大。2.SEQUEST可使用多個肽片段序列信息進行查詢,無需人工干預(yù),但查詢相當費時。3.PeptIdent/MultiIdent基于遺傳算法。第59頁,共149頁,2023年,2月20日,星期二4.ProbID基于概率模型。5.MOWSE(molecularweightsearch)基于概率算法的數(shù)據(jù)庫查詢軟件。6.ProFound基于Bayesian算法,綜合考慮每個蛋白質(zhì)序列詳細信息,同時考慮了酶解產(chǎn)生肽片段的蛋白質(zhì)序列信息,大大提高算法的靈敏度和選擇性。第60頁,共149頁,2023年,2月20日,星期二(五)PMF質(zhì)譜分析基本步驟1.核對譜圖,扣除本底等因素引起的失真,進行峰值校正,選擇分析范圍。(1)相對豐度:以質(zhì)譜中最強峰為100%(稱基峰),其他碎片峰與之相比的百分數(shù)。(2)總離子流(TIC):即一次掃描得到的所有離子強度之和。第61頁,共149頁,2023年,2月20日,星期二(3)動態(tài)范圍:即最強峰與最弱峰高之比。(4)本底:未進樣時,掃描得到的質(zhì)譜圖,空氣成分、儀器泵油、底物、緩沖液及吸附在離子源中其他樣品等所導(dǎo)致的背景峰。第62頁,共149頁,2023年,2月20日,星期二以牛血清白蛋白(bovineserumalbumin,BSA)PMF圖譜為例(圖6-1)。右上角顯示質(zhì)譜分析數(shù)據(jù)。第一列表示實驗肽段質(zhì)量數(shù),第二列表示理論酶切后肽段質(zhì)量數(shù),第三列表示BSA酶切后各肽段序列。質(zhì)譜圖中各肽段峰上數(shù)字表示各峰相對應(yīng)的質(zhì)荷比(m/z)值,(+)表示該實驗峰質(zhì)荷比值與理論酶切后肽段峰質(zhì)荷比值相比配。第63頁,共149頁,2023年,2月20日,星期二圖6-1BSA的MALDI-TOF質(zhì)譜圖譜第64頁,共149頁,2023年,2月20日,星期二各標記肽段峰上,(+)表示BSA酶切后肽段峰,(M)表示基質(zhì)峰。圖6-2BSA的MALDI-TOF質(zhì)譜圖譜500~900區(qū)域放大圖第65頁,共149頁,2023年,2月20日,星期二2.確定肽指紋譜峰值數(shù)據(jù)集,剔除與所鑒定蛋白無關(guān)的質(zhì)量峰經(jīng)剔除基質(zhì)峰、酶自解峰等信號,圖6-1中BSA的肽指紋質(zhì)量數(shù)數(shù)據(jù)集為,721.355、927.490、1163.654、1249.633、1305.694、1439.850、1479.815、1567.733、1639.953、1871.888、2044.991。第66頁,共149頁,2023年,2月20日,星期二3.數(shù)據(jù)庫搜索及參數(shù)設(shè)置(1)選擇允許的化學(xué)修飾(2)確定可耐受的質(zhì)量數(shù)精確度(masstolerance)(3)確定酶切所用蛋白酶(4)確定允許漏切的酶切位點個數(shù)(5)確定肽段質(zhì)量數(shù)值(massvalues)及計算模式(6)根據(jù)搜索蛋白的匹配對象選擇合適的數(shù)據(jù)庫及物種(taxonomy)限定(7)確定估計等電點(pI)及分子量數(shù)值第67頁,共149頁,2023年,2月20日,星期二現(xiàn)以牛血清白蛋白(bovineserumalbumin,BSA)為例,采用MASCOT搜索工具進行PMF分析鑒定(圖6-3、圖6-4、圖6-5、圖6-6)。第68頁,共149頁,2023年,2月20日,星期二圖6-3MASCOT搜索主界面第69頁,共149頁,2023年,2月20日,星期二圖6-4選擇MASCOTPeptideMassFingerprint程序第70頁,共149頁,2023年,2月20日,星期二圖6-5MASCOTPMF搜索結(jié)果界面第71頁,共149頁,2023年,2月20日,星期二圖6-6搜索結(jié)果蛋白詳細信息第72頁,共149頁,2023年,2月20日,星期二第三節(jié)蛋白質(zhì)結(jié)構(gòu)的預(yù)測Section3PredictionofProteinStructure第73頁,共149頁,2023年,2月20日,星期二一、蛋白質(zhì)結(jié)構(gòu)預(yù)測概述1961年提出的Anfinsen原理為從氨基酸序列預(yù)測蛋白質(zhì)空間結(jié)構(gòu)奠定了理論基礎(chǔ),即蛋白質(zhì)分子的一級序列決定其空間結(jié)構(gòu),而蛋白質(zhì)天然構(gòu)象是能量最低的構(gòu)象。Li和Scheraga等曾用隨機搜索方法確定多肽構(gòu)象,但單純構(gòu)象搜索對于結(jié)構(gòu)和自由度復(fù)雜得多的蛋白質(zhì)無能為力。第74頁,共149頁,2023年,2月20日,星期二目前蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法主要發(fā)展自兩個方向:1.物化理論分析:從頭預(yù)測2.統(tǒng)計學(xué)方法:同源建模,折疊識別第75頁,共149頁,2023年,2月20日,星期二二、蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法及軟件蛋白質(zhì)中約85%的殘基處于三種穩(wěn)定二級結(jié)構(gòu),α螺旋、β折疊和β轉(zhuǎn)角。二級結(jié)構(gòu)預(yù)測的目標是根據(jù)一級結(jié)構(gòu)判斷殘基是否處于特定二級結(jié)構(gòu)。其基本依據(jù)是:每段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向,通過統(tǒng)計和分析發(fā)現(xiàn)這些傾向或者規(guī)律,二級結(jié)構(gòu)預(yù)測問題可轉(zhuǎn)化為模式分類和識別問題。第76頁,共149頁,2023年,2月20日,星期二(一)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法1.DPM(雙重預(yù)測方法)先預(yù)測蛋白質(zhì)的結(jié)構(gòu)分類再預(yù)測序列的二級結(jié)構(gòu)。2.DSC算法首先預(yù)測基本概念,然后利用簡單線性統(tǒng)計方法結(jié)合概念預(yù)測二級結(jié)構(gòu),其準確率較高。第77頁,共149頁,2023年,2月20日,星期二3.PHDsec基于神經(jīng)網(wǎng)絡(luò)系統(tǒng),被認為是二級結(jié)構(gòu)預(yù)測的標準。4.SOPMA它用五種相互獨立方法預(yù)測,并匯集整理“一致預(yù)測結(jié)果”,準確率達69.5%。第78頁,共149頁,2023年,2月20日,星期二5.MLRC算法集GOR4、SIMPA96和SOPMA為一體,處理蛋白質(zhì)二級結(jié)構(gòu)預(yù)測結(jié)果,并估計分類的后驗概率。6.Jpred1998年由BartonGroup創(chuàng)建,運用Jnet神經(jīng)網(wǎng)絡(luò)算法,準確率可達到76.4%。第79頁,共149頁,2023年,2月20日,星期二(二)蛋白質(zhì)結(jié)構(gòu)域識別方法目前結(jié)構(gòu)域識別方法主要包括根據(jù)蛋白質(zhì)空間結(jié)構(gòu)信息利用機器學(xué)習(xí)方法獲取結(jié)構(gòu)域信息的方法、通過對具有代表性三級結(jié)構(gòu)的蛋白質(zhì)建立隱馬爾可夫模型方法、分析蛋白質(zhì)序列構(gòu)象熵值判定結(jié)構(gòu)域邊界的方法、運用神經(jīng)網(wǎng)絡(luò)從蛋白質(zhì)序列獲取結(jié)構(gòu)域邊界方法和基于經(jīng)驗的人工劃分方法等。第80頁,共149頁,2023年,2月20日,星期二(三)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件以人基質(zhì)金屬蛋白酶(matrixmetalloproteinase14,MMP14,NCBI蛋白質(zhì)數(shù)據(jù)庫編號NP_004986)為例,介紹Jpred、SOPMA及PredictProtein等預(yù)測軟件。第81頁,共149頁,2023年,2月20日,星期二1.Jpred(pbio.dundee.ac.uk/~www-jpred/)Jpred首頁及部分分析結(jié)果見圖6-7,預(yù)測得到MMP14有8個α-螺旋區(qū)(H)和21個β-折疊區(qū)(E),其他區(qū)域均為無規(guī)則卷曲區(qū)(-)。第82頁,共149頁,2023年,2月20日,星期二Jpred預(yù)測二級結(jié)構(gòu)第83頁,共149頁,2023年,2月20日,星期二2.SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)SOPMA主頁及預(yù)測結(jié)果如圖6-8所示,MMP14含有螺旋(h)27.66%、延伸鏈(e)19.24%、轉(zhuǎn)角(t)11.34%和無軌卷曲(c)41.75%。第84頁,共149頁,2023年,2月20日,星期二SOPMA預(yù)測二級結(jié)構(gòu)第85頁,共149頁,2023年,2月20日,星期二3.PredictProtein(/)二級結(jié)構(gòu)預(yù)測和溶劑可及性分析如圖6-9,目標蛋白序列中的Helix(紅)和Strand(藍)被RePROF(上)和PROFsec(下)兩種方法預(yù)測出來,同時溶劑可及(Exposed,藍)與不可及(Buried,黃)的殘基也被PROFacc方法計算出來。各特征殘基的比例以餅狀圖顯示。第86頁,共149頁,2023年,2月20日,星期二PredictProtein預(yù)測第87頁,共149頁,2023年,2月20日,星期二三、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法及軟件目前,蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法有三類:①比較建模(comparativemodeling,CM)需要與目標序列的相似度較高(>30%)的已知結(jié)構(gòu)模板;②當缺乏同源性較高的模板時,就需用復(fù)雜方法獲得合適的模板并產(chǎn)生更確切的比對,這種過程被稱為遠程同源建模(distanthomologymodeling)、折疊識別(foldrecognition)或穿線法(threading);③不直接用已知模板的方法稱為自由建模(freemodeling)或從頭預(yù)測(abinitio)法。第88頁,共149頁,2023年,2月20日,星期二(一)比較建模法原理比較建模又稱同源建模(homologymodeling),原理較簡單,基于進化相關(guān)的序列具有相似的三維結(jié)構(gòu)且進化過程中三維結(jié)構(gòu)比序列保守的原理,利用進化相關(guān)模板結(jié)構(gòu)信息建模。第89頁,共149頁,2023年,2月20日,星期二基本步驟①將目標序列作為查詢序列來搜索PDB和SWISS-PROT等已知蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,確定和識別一個同源模板,或選擇已知結(jié)構(gòu)的同源序列作為建模的模板;②將目標序列和模板序列進行比對,利用多種比對方法或手工校正以改進和優(yōu)化靶序列和模板結(jié)構(gòu)的比對,比對中可以加入空格;第90頁,共149頁,2023年,2月20日,星期二③以模板結(jié)構(gòu)骨架作為模型,建立目標蛋白質(zhì)骨架模型;④構(gòu)建環(huán)區(qū)(loops)和側(cè)鏈,優(yōu)化側(cè)鏈位置;⑤優(yōu)化和評估產(chǎn)生的模型,使用能量最小化或其他方法優(yōu)化結(jié)構(gòu),如利用分子動力學(xué)、模擬退火等優(yōu)化結(jié)構(gòu)。第91頁,共149頁,2023年,2月20日,星期二比較建模法的局限性最大的挑戰(zhàn)是對模板鏈進行空隙和插入的建模。目標蛋白與模板結(jié)構(gòu)保守性的程度及序列比對的正確性嚴重影響預(yù)測模型的準確性。因此,比較建模主要在序列一致性大于30%的序列間進行。第92頁,共149頁,2023年,2月20日,星期二(1)SWISS-MODEL服務(wù)器是目前最廣泛使用的基于網(wǎng)絡(luò)的免費蛋白質(zhì)3D自動建模服務(wù)器。它與ExPASy網(wǎng)站和DeepView程序緊密相聯(lián)。常用比較建模服務(wù)器和軟件第93頁,共149頁,2023年,2月20日,星期二(2)MODELLER軟件需要用戶提供目標序列與其模板的比對結(jié)果,能夠自動計算由非氫原子組成的模型,并通過搜索序列數(shù)據(jù)庫、多序列比對、聚類、對高柔性環(huán)區(qū)進行從頭建模和多模型優(yōu)化等方法,進一步修正模型。第94頁,共149頁,2023年,2月20日,星期二(3)HHpred服務(wù)器和軟件既可使用交互式服務(wù)器也可使用下載的軟件進行模板的搜索、序列比對、二級結(jié)構(gòu)預(yù)測等同源建模準備,并利用MODELLER構(gòu)建三維模型。第95頁,共149頁,2023年,2月20日,星期二(4)AccelrysDiscoveryStudio軟件是一個綜合生物大分子結(jié)構(gòu)分析和計算機輔助藥物設(shè)計等多種功能的軟件。整合MODELLER用于同源建模,和后續(xù)模型評價。并可進行相關(guān)結(jié)構(gòu)域和活性位點分析。第96頁,共149頁,2023年,2月20日,星期二(5)MOE(molecularoperatingenvironment)軟件綜合生物大分子結(jié)構(gòu)分析和計算機輔助藥物設(shè)計等多種功能的商業(yè)軟件。其優(yōu)勢在于可視化工具非常方便,便于對分子局部操作,對所建模型進一步局部優(yōu)化和修正。第97頁,共149頁,2023年,2月20日,星期二(二)折疊識別法結(jié)構(gòu)在進化上的保守性要高于序列。尤其在只能找到同源性小于30%的模板時比較適用。此方法包括兩步:①將目標蛋白序列和已知的折疊進行匹配,根據(jù)比對的進化信息在已知的結(jié)構(gòu)中找到一個或幾個匹配最好的折疊結(jié)構(gòu),作為建模的模板。②將目標序列的:線“穿”到模板的折疊結(jié)構(gòu)上,拼裝出最好的匹配模型。第98頁,共149頁,2023年,2月20日,星期二這種方法局限性在于已有的蛋白質(zhì)折疊類型還是有限的,序列相似的蛋白也可能具有明顯不同的折疊模式等等。第99頁,共149頁,2023年,2月20日,星期二(三)蛋白質(zhì)三維結(jié)構(gòu)的從頭預(yù)測方法如果目標蛋白序列缺乏已知結(jié)構(gòu)的同源蛋白質(zhì),則可采用從頭預(yù)測方法(abinitio)或稱自由建模法。從頭預(yù)測法的理論依據(jù)是Anfinsen假說,即在給定條件下蛋白質(zhì)的天然結(jié)構(gòu)對應(yīng)其自由能最低的狀態(tài)。第100頁,共149頁,2023年,2月20日,星期二成功的從頭預(yù)測依賴于以下因素的有效性:①通過能量優(yōu)化找到的蛋白質(zhì)結(jié)構(gòu)具有充分的結(jié)構(gòu)可靠性和計算可控性;②符合實際的力場或其他作用力描述方法;③高效而準確的搜索構(gòu)象空間重要區(qū)域的算法;④對獲得結(jié)構(gòu)進行準確評估的方法。第101頁,共149頁,2023年,2月20日,星期二四、對結(jié)構(gòu)預(yù)測結(jié)果的評價1.LiveBench(LB)實驗方法LB不斷地對各自動服務(wù)器進行能力評估,約半年評估這些預(yù)測方法一次。2.CASP和CAFASP實驗方法用于檢測現(xiàn)行建模方法的能力和局限、確定研發(fā)的進展并闡明問題的瓶頸,是蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的一個重要里程碑。第102頁,共149頁,2023年,2月20日,星期二3.EVA實驗方法主要用于二級結(jié)構(gòu)預(yù)測、接觸預(yù)測、比較蛋白質(zhì)結(jié)構(gòu)建模和穿線法/折疊識別。第103頁,共149頁,2023年,2月20日,星期二第四節(jié)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫Section4ProteinStructureDatabases第104頁,共149頁,2023年,2月20日,星期二PDB:包含了通過X射線單晶衍射、磁共振和電子衍射等實驗手段確定的蛋白質(zhì)、多糖和核酸等生物大分子的三維結(jié)構(gòu)數(shù)據(jù)。截止到2014年9月16日,PDB總共收錄了103354條結(jié)構(gòu)數(shù)據(jù),其中,收錄包括95633個蛋白質(zhì)結(jié)構(gòu)、2726個核酸結(jié)構(gòu)、4969個蛋白/核酸復(fù)合物和26個其他結(jié)構(gòu)。一、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫(PDB)第105頁,共149頁,2023年,2月20日,星期二PDB數(shù)據(jù)庫網(wǎng)站主頁如圖6-10,在新一代的交互式界面的支持下,其大多數(shù)頁面可由用戶自行定義不同的顯示面板。第106頁,共149頁,2023年,2月20日,星期二圖6-10PDB數(shù)據(jù)庫及其快速增長的數(shù)據(jù)量第107頁,共149頁,2023年,2月20日,星期二PDB數(shù)據(jù)庫以文本文件的方式存放數(shù)據(jù),每個分子各用一個獨立的文件,都有唯一的PDB-ID。它包含4個字符,由大寫字母和數(shù)字組成(如血紅蛋白的PDB-ID為4HHB)。文件中除了原子坐標外,還包括物種來源、化合物名稱、結(jié)構(gòu)以及有關(guān)文獻等基本注釋信息。此外,還給出分辨率、結(jié)構(gòu)因子、溫度系數(shù)、蛋白質(zhì)主鏈數(shù)目、配體分子式、金屬離子、二級結(jié)構(gòu)信息、二硫鍵位置等和結(jié)構(gòu)有關(guān)的數(shù)據(jù)。第108頁,共149頁,2023年,2月20日,星期二PDB格式的文件可以用于一些圖形軟件直觀觀察蛋白質(zhì)的三維結(jié)構(gòu),例如VMD、Jmol、Swiss-PDBviewer及RasMol等。第109頁,共149頁,2023年,2月20日,星期二PDB數(shù)據(jù)庫允許用戶用各種關(guān)鍵字進行檢索,如功能類別、PDB代碼、名稱、作者、空間群、分辨率、來源、入庫時間、分子式、參考文獻和生物來源等項。用戶不僅可以得到生物大分子的各種注釋、原子空間坐標和三維圖形,并能鏈接到一系列與PDB相關(guān)的數(shù)據(jù)庫,包括SCOP、CATH、Medline、ENZYME和SWISS-3DIMAGE等。除了使用關(guān)鍵字搜索,用戶也可以按照分類查看PDB數(shù)據(jù)庫。第110頁,共149頁,2023年,2月20日,星期二二、蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(一)SCOP(http://scop.mrc-lmb.cam.ac.uk/scop/)蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOP,是對已知蛋白質(zhì)結(jié)構(gòu)進行分類的數(shù)據(jù)庫,根據(jù)不同蛋白質(zhì)的氨基酸組成及三級結(jié)構(gòu)的相似性,描述已知結(jié)構(gòu)蛋白的功能及進化關(guān)系。SCOP數(shù)據(jù)庫的構(gòu)建除了使用計算機程序外,主要依賴于人工驗證。第111頁,共149頁,2023年,2月20日,星期二SCOP提供一個非冗余的ASTRAIL序列庫,通常被用來評估各種序列比對算法;一個PDB-ISL中介序列庫,用于比對搜索與未知結(jié)構(gòu)序列遠源的已知結(jié)構(gòu)序列;還可以鏈接到PDB等外部數(shù)據(jù)庫來檢索更多信息。第112頁,共149頁,2023年,2月20日,星期二在SCOP數(shù)據(jù)庫中對蛋白質(zhì)的分類基于樹狀層級,從根到葉依次為類(class)、折疊類型(fold)、超家族(superfamily)、家族(family)、蛋白質(zhì)結(jié)構(gòu)域(proteindomain)、來源物種(species)、單個PDB蛋白質(zhì)結(jié)構(gòu)記錄。家族用來描述相近的蛋白質(zhì)進化關(guān)系。超家族用來描述遠源的進化關(guān)系,如果序列相似性較低,但其結(jié)構(gòu)和功能特性表明有共同的進化起源,則將其視作超家族。第113頁,共149頁,2023年,2月20日,星期二折疊類型用來描述空間的幾何關(guān)系,無論有無共同的進化起源,只要二級結(jié)構(gòu)單元具有相同的排列和拓撲結(jié)構(gòu),即歸入相同的折疊方式。頂級的種類class則依據(jù)二級結(jié)構(gòu)組成分為:全螺旋,全折疊,螺旋和折疊,螺旋+折疊以及其他特殊種類。這樣的樹狀層次,便于對目標蛋白的結(jié)構(gòu)功能特征進行定位。第114頁,共149頁,2023年,2月20日,星期二(二)CATH(/)四種分類層次:蛋白質(zhì)的種類(class,C)、二級結(jié)構(gòu)的構(gòu)架(architecture,A)、拓撲結(jié)構(gòu)(topology,T)和蛋白質(zhì)同源超家族(homologoussuperfamily,H)。第115頁,共149頁,2023年,2月20日,星期二CATH的蛋白質(zhì)種類為全α、全β、α-β(α/β型和α+β型)和低二級結(jié)構(gòu)四類,其中低二級結(jié)構(gòu)類是指二級結(jié)構(gòu)成分含量很低的蛋白質(zhì)分子。第二個層次是蛋白質(zhì)分子的構(gòu)架,主要考慮α螺旋和β折疊形成超二級結(jié)構(gòu)的排列方式,而不考慮其連接關(guān)系。這一層次的分類主要依靠人工方法。第116頁,共149頁,2023年,2月20日,星期二第三個層次為拓撲結(jié)構(gòu),即二級結(jié)構(gòu)的形狀和二級結(jié)構(gòu)間的聯(lián)系,與SCOP中的折疊模式fold相當。第四個層次為結(jié)構(gòu)的同源性,是先通過序列比對再用結(jié)構(gòu)比較來確定的。第117頁,共149頁,2023年,2月20日,星期二CATH的主頁、分類層級和代表性類別第118頁,共149頁,2023年,2月20日,星期二三、其他常用蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫1.SWISS-MODEL數(shù)據(jù)庫(/)收錄的蛋白質(zhì)結(jié)構(gòu)都是使用SWISS-MODEL對蛋白質(zhì)序列進行自動同源建模所得到的結(jié)構(gòu)數(shù)據(jù)。直接從PDB中獲得最新的實測三維結(jié)構(gòu),存于其模板數(shù)據(jù)庫(SMTL)??商峁┑鞍踪|(zhì)四級結(jié)構(gòu)和必要的配體和輔助因子的注釋,以方便構(gòu)建完整的結(jié)構(gòu)模型,包括寡聚體結(jié)構(gòu)。第119頁,共149頁,2023年,2月20日,星期二新版的SWISS-MODEL允許用戶以交互方式搜索模板,根據(jù)序列相似性對其聚類,從結(jié)構(gòu)上比較不同模板,最后選擇適當?shù)哪0逵糜诮⒛P?并且還允許用戶對數(shù)據(jù)庫中的模型質(zhì)量進行評價。第120頁,共149頁,2023年,2月20日,星期二2.生物磁共振數(shù)據(jù)庫(BMRB,/)由美國威斯康星大學(xué)麥迪遜分校組織構(gòu)建的專門用于存放蛋白質(zhì)、多肽、核酸等物質(zhì)磁共振NMR波譜數(shù)據(jù),以及對應(yīng)的分子研究的源數(shù)據(jù)、研究所使用的實驗條件和設(shè)備、與研究相關(guān)的重要出版物等信息。第121頁,共149頁,2023年,2月20日,星期二第五節(jié)蛋白質(zhì)功能分析Section5AnalysisofProteinFunction第122頁,共149頁,2023年,2月20日,星期二一、蛋白質(zhì)功能分析概述蛋白質(zhì)在進化中保守的結(jié)構(gòu)通常對應(yīng)某些保守的生物化學(xué)功能。對蛋白質(zhì)功能進行分類和預(yù)測的方法主要還是依賴于結(jié)構(gòu)比對,如DaliLite、SSM、STRUCTAL、MultiProt和3DCoffee等。還有一些方法試圖將結(jié)構(gòu)相似性方法與其他方法相結(jié)合進行功能預(yù)測。例如,考慮一個系統(tǒng)發(fā)育上下文中的結(jié)構(gòu)相似性,會增加功能注釋精確性。(一)基于結(jié)構(gòu)分類的蛋白質(zhì)功能預(yù)測第123頁,共149頁,2023年,2月20日,星期二(二)基于結(jié)構(gòu)預(yù)測蛋白質(zhì)間相互作用1.基于結(jié)構(gòu)的物理對接主要用于預(yù)測兩個蛋白質(zhì)間的相互作用位點,但對體積很大的蛋白質(zhì)分子,相互作用的可能界面太多而計算工作量很大。第124頁,共149頁,2023年,2月20日,星期二2.基于相互作用界面序列特征模式的預(yù)測利用統(tǒng)計分析發(fā)掘蛋白質(zhì)相互作用界面的序列特征信息。主要分為幾類:(1)關(guān)聯(lián)性突變法不需要目標蛋白的高級結(jié)構(gòu)而只需要序列信息,且計算量比基于結(jié)構(gòu)的物理對接小得多。(2)聯(lián)用方法聯(lián)用高級結(jié)構(gòu)和序列信息。第125頁,共149頁,2023年,2月20日,星期二(3)人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法利用高級結(jié)構(gòu)信息和序列特征進行訓(xùn)練,可建立蛋白質(zhì)間相互作用界面的預(yù)測方法。預(yù)測準確度可達到70%。第126頁,共149頁,2023年,2月20日,星期二二、蛋白質(zhì)功能預(yù)測方法(一)基于基序的方法基于基序的方法(motif-basedapproaches)通過識別功能相關(guān)的蛋白質(zhì)中保守的三維基序,并建立這些保守的基序和保守的蛋白質(zhì)功能間的映射關(guān)系用于預(yù)測目標蛋白質(zhì)的某些生物化學(xué)功能。第127頁,共149頁,2023年,2月20日,星期二1.SITE程序和數(shù)據(jù)庫儲存了酶活性位點保守基序信息用位點匹配程序?qū)ふ谊P(guān)鍵的功能位點殘基作為保守殘基。2.TESS程序采用了幾何散列算法,通過模板研究和重疊,從蛋白質(zhì)的高級結(jié)構(gòu)中尋找保守的必須殘基。第128頁,共149頁,2023年,2月20日,星期二3.模糊功能形態(tài)(FFF)從三維信息角度認證與生物學(xué)功能相關(guān)位點的保守性。4.SPASM同時用主鏈α碳原子和側(cè)鏈基團作為分析對象,并列尋找保守殘基,并用于搜尋結(jié)構(gòu)數(shù)據(jù)庫中能匹配的已知功能蛋白。第129頁,共149頁,2023年,2月20日,星期二5.分子識別策略分析是基于已知功能域四周原子的疊合認證保守性預(yù)測蛋白質(zhì)功能。6.蛋白質(zhì)側(cè)鏈的保守模式分析分析重復(fù)出現(xiàn)的氨基酸側(cè)鏈的保守性。第130頁,共149頁,2023年,2月20日,星期二(二)基于表面的方法基于表面的方法(surface-basedapproaches)對給定蛋白質(zhì)進行表面模型化,利用與結(jié)構(gòu)相關(guān)聯(lián)的蛋白質(zhì)表面模型,識別蛋白質(zhì)表面上的結(jié)構(gòu)特征(如空間特征、裂隙等),進而利用這些特征來推斷蛋白質(zhì)功能。SURFACE數(shù)據(jù)庫提供對輸入蛋白質(zhì)局部表面特征模式的識別,以據(jù)此對蛋白質(zhì)功能進行預(yù)測。這種匹配算法精確性一般能達到90%左右,但計算量很大。第131頁,共149頁,2023年,2月20日,星期二(三)基于學(xué)習(xí)的方法基于學(xué)習(xí)的方法(learning-basedapproaches)是利用有效的分類方法,從最相關(guān)的結(jié)構(gòu)特征中識別最合適的功能類別,如SVM和KNN等分類方法?;趯W(xué)習(xí)的方法以蛋白質(zhì)結(jié)構(gòu)特征作為分類依據(jù),功能分類作為樣本標簽,通過數(shù)據(jù)對象之間的相似性矩陣對訓(xùn)練集中的蛋白質(zhì)進行結(jié)構(gòu)與功能關(guān)系的評估。第132頁,共149頁,2023年,2月20日,星期二三、蛋白質(zhì)結(jié)構(gòu)與功能關(guān)系數(shù)據(jù)庫(一)Pfam蛋白質(zhì)結(jié)構(gòu)域家族數(shù)據(jù)庫Pfam收集了大量使用多重序列比對和隱馬爾科夫模型對UniProtKB的蛋白質(zhì)序列數(shù)據(jù)進行結(jié)構(gòu)域歸類形成的蛋白質(zhì)家族,廣泛用于通過序列比對推測蛋白質(zhì)的結(jié)構(gòu)域排布形式及功能。第133頁,共149頁,2023年,2月20日,星期二Pfam包括高質(zhì)量、手工確定的Pfam-A,和用ADDA算法自動分類的低質(zhì)量、未注釋的Pfam-B數(shù)據(jù)庫。Pfam數(shù)據(jù)庫可使用蛋白質(zhì)或DNA序列搜索蛋白所屬家族,查看該家族的功能注釋和多序列比對,擴展至屬于同一群落的多個家族,查看一個目標序列的結(jié)構(gòu)域組成,鏈接到該序列在PDB數(shù)據(jù)庫中的結(jié)構(gòu),或直接使用關(guān)鍵字搜索。第134頁,共
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人勞務(wù)合同(網(wǎng)絡(luò)主播專用范本)4篇
- 二零二五年度網(wǎng)絡(luò)安全責(zé)任合同標準文本
- 2025年浙江房產(chǎn)稅收改革7月1日起適用合同規(guī)定3篇
- 2024年09月2024中國建設(shè)銀行廈門市分行校園招聘120人筆試歷年參考題庫附帶答案詳解
- 加油站的市場份額和盈利模式
- 2025年海南鮮品品牌產(chǎn)品線規(guī)劃與調(diào)整合同3篇
- 2024-2025年中國雷達行業(yè)發(fā)展前景預(yù)測及投資戰(zhàn)略研究報告
- 中國紫草種植市場發(fā)展前景預(yù)測及投資戰(zhàn)略咨詢報告
- 公路貨物運輸管理
- 2025年度臨時消防演習(xí)策劃與執(zhí)行合同4篇
- 廣東佛山生育保險待遇申請表
- 廣西水功能區(qū)劃報告-廣西水利信息網(wǎng)
- 機關(guān)單位檔案業(yè)務(wù)培訓(xùn)課件20170714
- ??怂咕S修保養(yǎng)使用手冊
- 人力資源部各崗位績效考核表
- 原材料試驗工作程序與質(zhì)量管理制度
- 人教版八年級下冊英語單詞默寫(可直接打印)
- 糖廠熱力衡算(6000噸每天)
- 燃氣有限公司危險作業(yè)安全管理規(guī)定
- 北京市刑事訴訟律師事務(wù)所函(擔(dān)任訴訟代理人適用)格式文書(2020版)
- XX鎮(zhèn)“我為群眾辦實事”滿意度調(diào)查問卷
評論
0/150
提交評論