核酸結(jié)構(gòu)和功能預(yù)測(cè)學(xué)習(xí)資料_第1頁(yè)
核酸結(jié)構(gòu)和功能預(yù)測(cè)學(xué)習(xí)資料_第2頁(yè)
核酸結(jié)構(gòu)和功能預(yù)測(cè)學(xué)習(xí)資料_第3頁(yè)
核酸結(jié)構(gòu)和功能預(yù)測(cè)學(xué)習(xí)資料_第4頁(yè)
核酸結(jié)構(gòu)和功能預(yù)測(cè)學(xué)習(xí)資料_第5頁(yè)
已閱讀5頁(yè),還剩169頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

核酸結(jié)構(gòu)和功能預(yù)測(cè)Strutureandfunctionpredictionofnucleicacids李琬生物物理教研室分子生物學(xué)館212liwan@教學(xué)大綱掌握:RNA二級(jí)結(jié)構(gòu)表示方法,最大堿基配對(duì)數(shù)方法了解:DNA結(jié)構(gòu)預(yù)測(cè)結(jié)構(gòu)預(yù)測(cè)(structureprediction)序列

二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)模型比較

三級(jí)結(jié)構(gòu)DNA結(jié)構(gòu)預(yù)測(cè)RNA結(jié)構(gòu)預(yù)測(cè)RNA功能預(yù)測(cè)△※兩條完全互補(bǔ)配對(duì)的鏈形成雙螺旋(doublehelix)DNA結(jié)構(gòu)預(yù)測(cè)沒(méi)有形成雙螺旋考慮“怎樣的配對(duì)能量最低”這樣的二級(jí)結(jié)構(gòu)預(yù)測(cè)問(wèn)題,只需考慮A-T和C-G這兩種配對(duì)。DNA結(jié)構(gòu)預(yù)測(cè)比較簡(jiǎn)單預(yù)測(cè)的準(zhǔn)確性較高DNA的基本功能以基因的形式荷載遺傳信息,通過(guò)精準(zhǔn)的復(fù)制,將遺傳信息傳遞給下一代;轉(zhuǎn)錄成RNA,進(jìn)而翻譯成蛋白質(zhì),通過(guò)蛋白質(zhì)實(shí)現(xiàn)生命的結(jié)構(gòu)和功能;在復(fù)制過(guò)程中有概率發(fā)生突變,為生物進(jìn)化提供了分子基礎(chǔ)。RNA結(jié)構(gòu)預(yù)測(cè)二級(jí)結(jié)構(gòu)預(yù)測(cè)三級(jí)結(jié)構(gòu)預(yù)測(cè)△※RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)(secondarystructureprediction)RNA二級(jí)結(jié)構(gòu)序列通過(guò)自身回折形成堿基配對(duì)的莖(stem)以及不配對(duì)的環(huán)(loop),包括發(fā)卡環(huán)(hairpin)、膨脹環(huán)(bulge)、內(nèi)環(huán)(internal)等等。穩(wěn)定△※(1)RNA二級(jí)結(jié)構(gòu)表示方法(2)最大堿基配對(duì)數(shù)方法(3)最小自由能模型(4)序列比較分析方法(5)統(tǒng)計(jì)學(xué)習(xí)模型(6)基于局部結(jié)構(gòu)交互的RNA假結(jié)預(yù)測(cè)(7)常用預(yù)測(cè)工具(1)RNA二級(jí)結(jié)構(gòu)表示方法常規(guī)圖(Conventional)比較直觀的展示RNA的二級(jí)結(jié)構(gòu)可以比較明了的觀察各個(gè)螺旋區(qū)與非螺旋區(qū)的結(jié)構(gòu)。是目前應(yīng)用最為廣泛的圖形法之一點(diǎn)括號(hào)圖(String)用一對(duì)圓括號(hào)表示堿基的配對(duì)關(guān)系或嵌套關(guān)系。山峰表示法(Mountainplot)把RNA序列排列成一條線(xiàn)作為最底層從兩端開(kāi)始,每遇到一對(duì)配對(duì)堿基就在線(xiàn)的上方畫(huà)一條直線(xiàn)把這兩個(gè)堿基連接起來(lái)一條條直線(xiàn)層疊起來(lái)且向中間縮短靠攏,就像一座座山峰。點(diǎn)陣圖(Dotplot)把RNA序列同時(shí)作為橫坐標(biāo)和縱坐標(biāo)滿(mǎn)足堿基配對(duì)的就在相應(yīng)的坐標(biāo)上畫(huà)一個(gè)點(diǎn)45°斜對(duì)角連成一條直線(xiàn)的可以構(gòu)成一段螺旋區(qū)。圓形圖(Circle)把RNA序列彎成一個(gè)圓形,將配對(duì)的堿基用圓弧或者直線(xiàn)連接起來(lái)。連線(xiàn)圖(Linkeddiagram)將RNA序列連成一條線(xiàn)作為最低層將配對(duì)的堿基用弧線(xiàn)連接起來(lái)。GGGAAAUCC.(((..)))AGGUAGGUCCUGU(((.....)))..(((.(..))))......(((.)))..螺旋的穩(wěn)定性取決于螺旋的長(zhǎng)度、其中的錯(cuò)配或膨脹環(huán)的個(gè)數(shù)(較少可以,特別是在長(zhǎng)螺旋中)、配對(duì)區(qū)堿基對(duì)的組成。G-C(3個(gè)氫鍵)比A-U(2個(gè)氫鍵)更穩(wěn)定包含少于三個(gè)堿基的環(huán)是空間上不能夠存在的,沒(méi)有二級(jí)結(jié)構(gòu)的大環(huán)也是不穩(wěn)定的。環(huán)的最佳長(zhǎng)度是4~8個(gè)堿基。一個(gè)給定的RNA序列可能出現(xiàn)很多莖區(qū),其中只有部分莖區(qū)是真實(shí)的。在所有可能出現(xiàn)的莖區(qū)的集合中排除冗余莖區(qū),找出真實(shí)莖區(qū)組成的子集就是RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)的主要內(nèi)容。(2)最大堿基配對(duì)數(shù)方法假設(shè)具有最大數(shù)目的堿基對(duì)的結(jié)構(gòu)是正確的結(jié)構(gòu)。主要思想動(dòng)態(tài)規(guī)劃:先定出一小段序列的最好二級(jí)結(jié)構(gòu),再用相同的法則將序列擴(kuò)展,找到相應(yīng)的最好二級(jí)結(jié)構(gòu);不斷進(jìn)行,直到全長(zhǎng)序列。在更短序列的最好二級(jí)結(jié)構(gòu)基礎(chǔ)上獲得序列i到j(luò)的最好二級(jí)結(jié)構(gòu),有4種可能的途徑:向結(jié)構(gòu)兩端各延伸一個(gè)殘基并判斷它們能否配對(duì);向5’端延伸一個(gè)不配對(duì)的殘基;向3’端延伸一個(gè)不配對(duì)的殘基;將已存在最好二級(jí)結(jié)構(gòu)的兩段合并起來(lái)。具體算法將一段長(zhǎng)度為L(zhǎng)的RNA序列記為b1,b2,……,bi,……,bj,……,bL1當(dāng)bi和bj為互補(bǔ)堿基對(duì)時(shí)定義δ(i,j)=0當(dāng)bi和bj非互補(bǔ)堿基對(duì)時(shí)記從bi到bj所構(gòu)成的子序列所能形成的最大堿基對(duì)數(shù)目為γ(i,j)初始化γ(i,j)=0,j≤i+1jGGGAAAUCCiGGGAAAUCC00000000000000000000000000000000000000000000000000000遞歸計(jì)算從所有長(zhǎng)度為2的子序列開(kāi)始,一直到長(zhǎng)度為L(zhǎng)

γ(i+1,j-1)+δ(i,j)

γ(i+1,j)γ(i,j)=max

γ(i,j-1)maxi<k<j[γ(i,k)+γ(k+1,j)]jGGGAAAUCCiGGGAAAUCC00000000000000000000000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC000000000000000000000000100000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC000000000000000000000100000011000000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC00000000000000000100000011000000111000000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC000000000000100000012000000111000000111000000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC000000100000012000000122000000111000000111000000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC00000012000000123000000122000000111000000111000000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC000000123000000123000000122000000111000000111000000000000000000000000000000000000jGGGAAAUCCiGGGAAAUCC能形成堿基對(duì)的最大數(shù)目000000123000000123000000122000000111000000111000000000000000000000000000000000000回溯過(guò)程從右上角(1,L)開(kāi)始如果γ(i+1,j-1)+δ(i,j)=γ(i,j),記錄(i,j)jGGGAAAUCCiGGGAAAUCC000000123000000123000000122000000111000000111000000000000000000000000000000000000AGGUAGGUCCUGUj

AGGUAGGUCCUGUiAGGUAGGUCCUGU0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000j

AGGUAGGUCCUGUiAGGUAGGUCCUGU0001111223444000000012333300000001223330000000112333000000011233300000000122220000000011122000000000001100000000000110000000000011000000000000000000000000000000000000000缺點(diǎn)假設(shè)前提過(guò)于簡(jiǎn)單,預(yù)測(cè)準(zhǔn)確性較低。回溯的線(xiàn)路經(jīng)常不是唯一的,所以結(jié)構(gòu)也是不唯一的,其中有些顯然是不可能的。這種方法無(wú)法考慮“假結(jié)”(pseudoknot)的情況。假結(jié)當(dāng)RNA序列中兩個(gè)堿基配對(duì)i·j和d·e滿(mǎn)足i<d<J<e非嵌套特性時(shí)形成的結(jié)構(gòu)。教學(xué)大綱掌握:最小自由能模型,常用RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)工具了解:序列比較分析方法,統(tǒng)計(jì)學(xué)習(xí)模型,基于局部結(jié)構(gòu)交互的RNA假結(jié)預(yù)測(cè),CGmodel,Vfoldmodel,3dRNA,ASSEMBLE,其他RNA三級(jí)結(jié)構(gòu)預(yù)測(cè)方法,在線(xiàn)預(yù)測(cè)工具,miRNA,lncRNA功能預(yù)測(cè)(3)最小自由能(minimumfreeenergy)模型當(dāng)沒(méi)有任何先驗(yàn)知識(shí),只給定了RNA的一級(jí)序列時(shí),預(yù)測(cè)RNA的二級(jí)結(jié)構(gòu)一般采用最小自由能模型。在一定溫度下,RNA分子通過(guò)構(gòu)象調(diào)整達(dá)到某種熱力學(xué)平衡,使之自由能達(dá)到最小,形成最穩(wěn)定的狀態(tài),此時(shí)的二級(jí)結(jié)構(gòu)即被認(rèn)為是RNA的真實(shí)二級(jí)結(jié)構(gòu)。一般莖區(qū)的自由能為負(fù)值,環(huán)區(qū)自由能為正,莖區(qū)越長(zhǎng)其自由能越小??梢越频恼J(rèn)為,配對(duì)的堿基使自由能降低,沒(méi)有形成配對(duì)的堿基使自由能升高。假設(shè)這些基本結(jié)構(gòu)單元的自由能具有可加性和相對(duì)獨(dú)立性一個(gè)二級(jí)結(jié)構(gòu)的自由能是組成它的各基本結(jié)構(gòu)單元的自由能之和且這些自由能之間是互不影響互不關(guān)聯(lián)的根據(jù)公式算出總體能量全局最小值。針對(duì)各種不同的RNA基本結(jié)構(gòu)單元并根據(jù)不同堿基組成,分別用實(shí)驗(yàn)方法測(cè)出它們的自由能,建立起一張完整的自由能參數(shù)表。為了在合理的時(shí)間內(nèi)獲得結(jié)果,搜索最小自由能結(jié)構(gòu)時(shí)會(huì)用到最近鄰假設(shè),即堿基對(duì)的能量只依賴(lài)它的前面和后面的堿基或堿基對(duì)。獲得最小自由能結(jié)構(gòu)最簡(jiǎn)單的方法是列出所有可能的結(jié)構(gòu),分別計(jì)算其自由能??赡芙Y(jié)構(gòu)的數(shù)量隨序列長(zhǎng)度的增加呈指數(shù)遞增需結(jié)合動(dòng)態(tài)規(guī)劃算法降低搜索復(fù)雜度動(dòng)態(tài)規(guī)劃算法(dynamicprogrammingalgorithm)短序列片段:計(jì)算其最低自由能。較長(zhǎng)的序列:由短序列遞歸得到其最低自由能。一旦完整序列的最低自由能確定,可確定RNA分子的二級(jí)結(jié)構(gòu)。將一段長(zhǎng)度為L(zhǎng)的RNA序列記為b1,b2,……,bi,……,bj,……,bL初始化i=1toL-3E(i,i+1)=0;E(i,i+2)=0;E(i,i+3)=0遞歸計(jì)算從子序列開(kāi)始,一直到長(zhǎng)度為L(zhǎng)

E(i+1,j-1)+α(i,j)E(i+1,j)E(i,j)=minE(i,j-1)mini<k<j[E(i,k)+E(k+1,j)]動(dòng)態(tài)規(guī)劃算法不僅能找到自由能最低的“最優(yōu)”結(jié)構(gòu),還可以根據(jù)需要返回自由能較低的“次優(yōu)結(jié)構(gòu)”。允許人為加入一些限制條件,把不合理的結(jié)構(gòu)排除在搜索范圍之外?;诰仃囘\(yùn)算的動(dòng)態(tài)規(guī)劃算法以結(jié)構(gòu)的能量大小作為評(píng)分標(biāo)準(zhǔn),比較RNA分子中所有可能的配對(duì)堿基及其能量值,直到所有的核酸都被比較過(guò)后,利用記分矩陣預(yù)測(cè)出所有可能結(jié)構(gòu)并發(fā)現(xiàn)出最合適的能量。自由能最小的RNA二級(jí)結(jié)構(gòu)即近似真實(shí)二級(jí)結(jié)構(gòu)?;谇o環(huán)(stem-loop)組合的優(yōu)化算法RNA二級(jí)結(jié)構(gòu)就是一連串莖環(huán)串聯(lián)而成的組合根據(jù)不同的莖環(huán)能量,找出總自由能最小的莖環(huán)組合,也就找到了穩(wěn)定的RNA二級(jí)結(jié)構(gòu)。莖環(huán)最優(yōu)堆積算法給定一條序列,列出其中所有可能的莖環(huán)。根據(jù)中心極限定理,用MonteCarlo隨機(jī)試驗(yàn)的方法估計(jì)每一莖環(huán)的出現(xiàn)概率。在每一步迭代中挑選莖環(huán)列表中概率較大、自由能最小的那一個(gè)加到當(dāng)前結(jié)構(gòu)上并消除產(chǎn)生沖突的情況,直到再也沒(méi)有莖環(huán)可加了。當(dāng)前結(jié)構(gòu)就作為RNA序列的二級(jí)結(jié)構(gòu)?;谶z傳算法(geneticalgorithm)的進(jìn)化算法(evolutionaryalgorithm)模擬生物的進(jìn)化原理,在一個(gè)種群數(shù)量龐大的樣本空間中,自適應(yīng)地利用選擇、交叉、變異等手段對(duì)樣本空間進(jìn)行篩選,優(yōu)化,最終依據(jù)篩選規(guī)則找出最優(yōu)解。在對(duì)RNA二級(jí)結(jié)構(gòu)的預(yù)測(cè)中,面對(duì)數(shù)量龐大的堿基對(duì)組合方式,可以根據(jù)其能量規(guī)則,利用進(jìn)化算法找出自由能最小的結(jié)構(gòu)。缺點(diǎn)該類(lèi)算法的整個(gè)運(yùn)行過(guò)程是一個(gè)自適應(yīng)過(guò)程,因此隨意性比較大,結(jié)果容易出現(xiàn)局部最優(yōu)解,導(dǎo)致運(yùn)行結(jié)果不易控制。(4)序列比較分析方法(sequencecomparativeanalysismethod)重要的RNA結(jié)構(gòu)會(huì)在進(jìn)化中體現(xiàn)出保守性在結(jié)構(gòu)保守的位置,配對(duì)堿基的序列突變會(huì)呈現(xiàn)出相關(guān)性。在不影響配對(duì)的情況下同時(shí)發(fā)生突變主要思想在已知結(jié)構(gòu)的序列數(shù)據(jù)庫(kù)中搜尋與被考察序列相似的序列,通過(guò)與已知結(jié)構(gòu)的序列進(jìn)行多條序列互補(bǔ)堿基的共變比對(duì)來(lái)推斷未知序列的二級(jí)結(jié)構(gòu)。優(yōu)勢(shì)直接反映出RNA在細(xì)胞中的結(jié)構(gòu)狀態(tài)需要額外提供同源序列作為輸入,不僅對(duì)同源序列之間的相似程度要求較高,而且比對(duì)的好壞直接影響預(yù)測(cè)的結(jié)果。先比對(duì)后折疊:使用多重序列比對(duì)工具獲得幾個(gè)RNA序列的比對(duì),發(fā)現(xiàn)同源序列,將其折疊。使用最小自由能算法,可以有效地對(duì)同源序列進(jìn)行結(jié)構(gòu)預(yù)測(cè)。速度快RNAalifoldhttp://rna.tbi.univie.ac.at/cgi-bin/RNAalifold.cgi邊折疊邊比對(duì):通過(guò)迭代,利用同源序列不斷修正堿基配對(duì)概率。多條同源序列中的每條序列在每次迭代時(shí)都計(jì)算了一次堿基配對(duì)概率,其他序列的配對(duì)概率會(huì)對(duì)當(dāng)前序列配分函數(shù)的計(jì)算進(jìn)行修正。優(yōu)勢(shì)不要求每條同源序列的結(jié)構(gòu)都嚴(yán)格保守,同源序列的選取更加靈活。TurboFold(RNAstructure)先折疊后比對(duì)(5)統(tǒng)計(jì)學(xué)習(xí)模型從已知的結(jié)構(gòu)進(jìn)行學(xué)習(xí),進(jìn)行結(jié)構(gòu)預(yù)測(cè)。假設(shè)RNA折疊服從熱力學(xué)規(guī)律通過(guò)數(shù)據(jù)集對(duì)熱力學(xué)參數(shù)進(jìn)行重新估計(jì)。假設(shè)RNA折疊不服從熱力學(xué)規(guī)律認(rèn)為真實(shí)結(jié)構(gòu)來(lái)自概率模型的一個(gè)采樣,通過(guò)最大化似然函數(shù)估計(jì)模型參數(shù)。(6)基于局部結(jié)構(gòu)交互的RNA假結(jié)預(yù)測(cè)給定的RNA序列不含假結(jié)的能量最優(yōu)結(jié)構(gòu)G假結(jié)莖區(qū)在已得到的最優(yōu)結(jié)構(gòu)基礎(chǔ)上構(gòu)建含假結(jié)的能量計(jì)算模型含假結(jié)的RNA二級(jí)結(jié)構(gòu)G’能量計(jì)算局部結(jié)構(gòu)交互配對(duì)優(yōu)化算法將結(jié)構(gòu)G中不同片段按發(fā)夾單鏈及非發(fā)夾單鏈分別存放到單鏈區(qū)庫(kù)SS_hair及SS_other中。以SS_hair為基準(zhǔn),分別與SS_hair中其他發(fā)夾單鏈及SS_other中的單鏈匹配,如果形成了假結(jié)莖區(qū),則存于一個(gè)假結(jié)莖區(qū)庫(kù)H中。莖區(qū)調(diào)整具有高能量的堿基對(duì)部分打開(kāi)或全部打開(kāi),打開(kāi)的堿基參與假結(jié)莖區(qū)H的形成莖區(qū)庫(kù)H中存儲(chǔ)的是在結(jié)構(gòu)G的基礎(chǔ)上經(jīng)調(diào)整或未經(jīng)調(diào)整而形成的所有可能的假結(jié)莖區(qū)。通過(guò)建立的含假結(jié)結(jié)構(gòu)的能量計(jì)算模型對(duì)莖區(qū)庫(kù)H中所有假結(jié)進(jìn)行計(jì)算篩選,直到所有莖區(qū)被計(jì)算完畢,保留能量最優(yōu)的假結(jié)結(jié)構(gòu),輸出結(jié)果。(7)常用預(yù)測(cè)工具NameDescriptionLinksCentroidFoldSecondarystructurepredictionbasedongeneralizedcentroidestimatorwebserverCentroidHomfoldSecondarystructurepredictionbyusinghomologoussequenceinformationwebserverContextFoldAnRNAsecondarystructurepredictionsoftwarebasedonfeature-richtrainedscoringmodels.webserverCONTRAfoldSecondarystructurepredictionmethodbasedonconditionallog-linearmodels(CLLMs),aflexibleclassofprobabilisticmodelswhichgeneralizeupon

SCFGs

byusingdiscriminativetrainingand

feature-rich

scoring.webserverCyloFoldSecondarystructurepredictionmethodbasedonplacementofhelicesallowingcomplexpseudoknots.webserverKineFoldFoldingkineticsofRNAsequencesincludingpseudoknotsbyincludinganimplementationofthepartitionfunctionforknots.webserverPknotsRGAdynamicprogrammingalgorithmforthepredictionofarestrictedclass(H-type)ofRNApseudoknots.webserverpKissAdynamicprogrammingalgorithmforthepredictionofarestrictedclass(H-typeandkissinghairpins)ofRNApseudoknots.webserverRNA123Secondarystructurepredictionviathermodynamic-basedfoldingalgorithmsandnovelstructure-basedsequencealignmentspecificforRNA.webserverRNAfoldMFERNAstructurepredictionalgorithm.IncludesanimplementationofthepartitionfunctionforcomputingbasepairprobabilitiesandcircularRNAfolding.webserverRNAshapesMFERNAstructurepredictionbasedonabstractshapes.Shapeabstractionretainsadjacencyandnestingofstructuralfeatures,butdisregardshelixlengths,thusreducesthenumberofsuboptimalsolutionswithoutlosingsignificantinformation.Furthermore,shapesrepresentclassesofstructuresforwhichprobabilitiesbasedonBoltzmann-weightedenergiescanbecomputed.webserverRNAstructureAprogramtopredictlowestfreeenergystructuresandbasepairprobabilitiesforRNAorDNAsequences.ProgramsarealsoavailabletopredictMaximumExpectedAccuracystructuresandthesecanincludepseudoknots.Structurepredictioncanbeconstrainedusingexperimentaldata,includingSHAPE,enzymaticcleavage,andchemicalmodificationaccessibility.GraphicaluserinterfacesareavailableforWindowsandforMacOS-X/Linux.ProgramsarealsoavailableforusewithUnix-styletextinterfaces.Additionally,aC++classlibraryisavailable.webserverSfoldStatisticalsamplingofallpossiblestructures.Thesamplingisweightedbypartitionfunctionprobabilities.webserverMfold/?q=mfoldRNAstructure/RNAstructure.htmlVienna

RNAhttp://www.tbi.univie.ac.at/RNA/軟件名稱(chēng)優(yōu)點(diǎn)限制主要原理RNAalifold(1)容納錯(cuò)誤字符(2)可以預(yù)測(cè)單一序列;也可以預(yù)測(cè)多個(gè)序列(3)山峰表示法(1)預(yù)測(cè)單個(gè)結(jié)構(gòu)時(shí)序列長(zhǎng)不能超過(guò)300(2)預(yù)測(cè)多個(gè)序列時(shí),只能給出一致結(jié)構(gòu),不能預(yù)測(cè)每一個(gè)序列的二級(jí)結(jié)構(gòu)(3)比對(duì)后的序列單個(gè)長(zhǎng)度不能超過(guò)2K;總長(zhǎng)度不能超過(guò)10K預(yù)測(cè)單一序列依靠最小自由能模型;預(yù)測(cè)多個(gè)序列依靠比較序列分析模型Mfold(1)每次提供多個(gè)可選擇結(jié)構(gòu)(2)提供圖形化界面輸出(點(diǎn)陣圖、圓形圖)只能預(yù)測(cè)單個(gè)序列最小自由能模型的動(dòng)態(tài)規(guī)劃算法RNAStructure(1)操作界面友好,功能強(qiáng)大(2)可以給出良好的圖形輸出(3)可以預(yù)測(cè)單一序列,也可以比較兩個(gè)或多個(gè)序列的結(jié)構(gòu)輸入字母表只有AGCU,其他字母或小寫(xiě)字母都不會(huì)被預(yù)測(cè)動(dòng)態(tài)規(guī)劃算法RNA三級(jí)結(jié)構(gòu)預(yù)測(cè)RNA分子的折疊過(guò)程二級(jí)結(jié)構(gòu)

三級(jí)結(jié)構(gòu)RNA三級(jí)結(jié)構(gòu)建?;蝾A(yù)測(cè)方法序列二級(jí)結(jié)構(gòu)三級(jí)結(jié)構(gòu)其他生物學(xué)信息片段拼接利用實(shí)驗(yàn)測(cè)定的小片段結(jié)構(gòu)拼接出一個(gè)合理的近天然態(tài)結(jié)構(gòu)。(1)CGModel(2)VfoldModel(3)3dRNA(4)ASSEMBLE(5)其他方法(6)在線(xiàn)預(yù)測(cè)工具(1)CG(coarse-grained)Model利用RNA分子粗粒化模型預(yù)測(cè)RNA分子三級(jí)結(jié)構(gòu)的方法。主要思想把每個(gè)核苷酸簡(jiǎn)化為5個(gè)偽原子,兩個(gè)表示主鏈(一個(gè)為磷酸基團(tuán),一個(gè)為糖),另外三個(gè)表示堿基用688個(gè)實(shí)驗(yàn)獲得的結(jié)構(gòu)來(lái)確定模型的參數(shù)多于5個(gè)堿基對(duì)有分辨率記錄鍵伸縮角彎曲二面角范得華力、靜電12-27nt的15個(gè)RNA分子CGModel動(dòng)力學(xué)模擬模擬退火方法在加入二級(jí)結(jié)構(gòu)或者三級(jí)結(jié)構(gòu)相互作用信息后,15個(gè)RNA分子都可以用CGModel的方法成功折疊到近天然結(jié)構(gòu)。局限預(yù)測(cè)發(fā)卡等拓?fù)浣Y(jié)構(gòu)較為簡(jiǎn)單的RNA小分子(2)VfoldModel基于自由能的三級(jí)結(jié)構(gòu)預(yù)測(cè)方法。在二級(jí)結(jié)構(gòu)折疊動(dòng)力學(xué)方法的基礎(chǔ)上改進(jìn)的搭建RNA分子三級(jí)結(jié)構(gòu)方法。主要思想用磷原子(P),碳原子(C4)和堿基偽原子(Base)三個(gè)偽原子描述相應(yīng)的核苷酸結(jié)構(gòu)。用二級(jí)結(jié)構(gòu)折疊動(dòng)力學(xué)預(yù)測(cè)出目標(biāo)RNA的二級(jí)結(jié)構(gòu)用序列和二級(jí)結(jié)構(gòu)信息搭建出粗粒化的三級(jí)結(jié)構(gòu)主鏈用實(shí)驗(yàn)片段結(jié)構(gòu)結(jié)合分子動(dòng)力學(xué)模擬的方法替換主鏈模型結(jié)構(gòu),得到預(yù)測(cè)結(jié)果根據(jù)自由能預(yù)測(cè)2D結(jié)構(gòu)序列依賴(lài)的經(jīng)驗(yàn)熱力學(xué)參數(shù)

構(gòu)建結(jié)構(gòu)模板庫(kù)PDB搜索匹配二級(jí)結(jié)構(gòu)中環(huán)的最佳模板從已知結(jié)構(gòu)中獲得3D坐標(biāo)將堿基按坐標(biāo)加入主鏈模型自由能最小天然堿基對(duì)非天然堿基對(duì)(3)3dRNA基于RNA二級(jí)結(jié)構(gòu),構(gòu)建RNA三級(jí)結(jié)構(gòu)的方法。構(gòu)建非冗余的RNA三級(jí)結(jié)構(gòu)模板SSE庫(kù)劃分為基本二級(jí)結(jié)構(gòu)單元將二級(jí)結(jié)構(gòu)單元對(duì)應(yīng)的模板組裝成完整的RNA三級(jí)結(jié)構(gòu)SSE標(biāo)準(zhǔn)螺旋形式的堿基配對(duì)結(jié)構(gòu)突環(huán)結(jié)構(gòu)內(nèi)環(huán)結(jié)構(gòu)發(fā)卡環(huán)結(jié)構(gòu)多分支環(huán)結(jié)構(gòu)假結(jié)結(jié)構(gòu)SCORRNAjunctinPDB用序列比對(duì)算法比對(duì)目標(biāo)和結(jié)構(gòu)庫(kù)中的結(jié)構(gòu)單元序列,選取相似性最高的模板結(jié)構(gòu)按照分子順序(從5’端到3’端)把挑選出來(lái)的合適結(jié)構(gòu)單元組裝成一個(gè)完整分子優(yōu)勢(shì)不僅僅局限于搭建或預(yù)測(cè)較小或拓?fù)浣Y(jié)構(gòu)較為簡(jiǎn)單的RNA分子,對(duì)較大或者較為復(fù)雜的RNA分子而言,也可以自動(dòng)搭建或預(yù)測(cè)出一個(gè)較好的合理結(jié)構(gòu)。27/3dRNA/3dRNA.html缺點(diǎn)需要輸入二級(jí)結(jié)構(gòu)(4)ASSEMBLE基于人機(jī)互動(dòng)調(diào)整優(yōu)化結(jié)構(gòu)的RNA分子三級(jí)結(jié)構(gòu)建模方法。/assemble/用多序列比對(duì)算法從同源RNA分子結(jié)構(gòu)中找到大量合適的二級(jí)和三級(jí)結(jié)構(gòu)信息幫助搭建RNA三級(jí)結(jié)構(gòu)模型。調(diào)整堿基配對(duì),堿基距離,旋轉(zhuǎn)角和二面角等三級(jí)結(jié)構(gòu)特征。優(yōu)勢(shì)在同源信息和操作者的幫助下,能極大地減少計(jì)算時(shí)間。但是這種方法對(duì)于沒(méi)有經(jīng)驗(yàn)的操作者或者同源信息較少的RNA分子結(jié)構(gòu)較難預(yù)測(cè)。(5)其他方法NAST(TheNucleicAcidSimulation)一種基于統(tǒng)計(jì)勢(shì)能函數(shù)分子動(dòng)力學(xué)模擬預(yù)測(cè)RNA三級(jí)結(jié)構(gòu)的方法。以C3’原子代替相應(yīng)的核苷酸,建立相應(yīng)的RNA粗?;Y(jié)構(gòu)模型,并利用核糖體RNA三級(jí)結(jié)構(gòu)訓(xùn)練統(tǒng)計(jì)勢(shì)能函數(shù)在僅知道預(yù)測(cè)RNA分子的序列和二級(jí)結(jié)構(gòu)信息情況下,僅能預(yù)測(cè)拓?fù)浣Y(jié)構(gòu)較為簡(jiǎn)單的小RNA分子的三級(jí)結(jié)構(gòu)。如果加入預(yù)測(cè)RNA分子的三級(jí)結(jié)構(gòu)相互作用信息來(lái)指導(dǎo)預(yù)測(cè)三級(jí)結(jié)構(gòu),NAST的預(yù)測(cè)精度會(huì)得到較大提高。BARNACLE通過(guò)隨機(jī)采樣旋轉(zhuǎn)二面角的方法來(lái)預(yù)測(cè)RNA分子三級(jí)結(jié)構(gòu)的方法??梢栽诰植拷Y(jié)構(gòu)區(qū)域進(jìn)行大量的連續(xù)采樣,進(jìn)而解決采樣的瓶頸問(wèn)題。結(jié)果表明,在利用RNA序列和二級(jí)結(jié)構(gòu)信息的情況下,BARNACLE可以較為精確地預(yù)測(cè)小分子RNA的三級(jí)結(jié)構(gòu)。然而對(duì)于長(zhǎng)度較長(zhǎng)或者拓?fù)浣Y(jié)構(gòu)較為復(fù)雜的RNA分子而言,因?yàn)槠渥杂啥冗^(guò)多不能進(jìn)行結(jié)構(gòu)采樣和預(yù)測(cè)。FARFAR通過(guò)連續(xù)片段分子結(jié)構(gòu)組裝建模的RNA三級(jí)結(jié)構(gòu)預(yù)測(cè)方法。將實(shí)驗(yàn)測(cè)定的核糖體RNA三級(jí)結(jié)構(gòu)打碎成長(zhǎng)度為3nt-9nt的RNA結(jié)構(gòu)片段,利用這些連續(xù)的片段分子來(lái)描述并預(yù)測(cè)RNA的局部三級(jí)結(jié)構(gòu)。利用預(yù)測(cè)目標(biāo)的序列或者二級(jí)結(jié)構(gòu)信息將初始直鏈結(jié)構(gòu)劃分為多個(gè)小窗口用蒙特卡洛的方法隨機(jī)從小片段結(jié)構(gòu)庫(kù)中選取片段結(jié)構(gòu)插入并替換窗口片段結(jié)構(gòu)利用能量函數(shù)對(duì)結(jié)構(gòu)進(jìn)行打分選擇和優(yōu)化,進(jìn)而得到預(yù)測(cè)的近天然態(tài)三級(jí)結(jié)構(gòu)。可以通過(guò)加入實(shí)驗(yàn)測(cè)定的二級(jí)結(jié)構(gòu)堿基配對(duì)信息來(lái)進(jìn)一步提高結(jié)構(gòu)預(yù)測(cè)的精度。只能用來(lái)預(yù)測(cè)拓補(bǔ)結(jié)構(gòu)較為簡(jiǎn)單的小RNA分子三級(jí)結(jié)構(gòu)(6-20nt),對(duì)于長(zhǎng)度較長(zhǎng)或拓?fù)浣Y(jié)構(gòu)較為復(fù)雜的RNA分子三級(jí)結(jié)構(gòu)預(yù)測(cè)仍然十分困難。方法使用原子數(shù)使用信息局限性CG多個(gè)偽原子序列、二級(jí)結(jié)構(gòu)只能預(yù)測(cè)發(fā)卡等拓?fù)浣Y(jié)構(gòu)較為簡(jiǎn)單的RNA小分子Vfold多個(gè)偽原子序列、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)3dRNA全原子序列、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)需要輸入二級(jí)結(jié)構(gòu)Assemble全原子序列、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)NAST一個(gè)偽原子序列、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)BARNACLE多個(gè)序列、二級(jí)結(jié)構(gòu)對(duì)于長(zhǎng)度較長(zhǎng)或者拓?fù)浣Y(jié)構(gòu)較為復(fù)雜的RNA分子,不能進(jìn)行結(jié)構(gòu)采樣和預(yù)測(cè)FARFAR全原子序列只能用來(lái)預(yù)測(cè)拓補(bǔ)結(jié)構(gòu)較為簡(jiǎn)單的小RNA分子三級(jí)結(jié)構(gòu)(6-20nt)(6)在線(xiàn)預(yù)測(cè)工具NameDescriptionLinksiFoldRNAthree-dimensionalRNAstructurepredictionandfoldingwebserverMC-FoldMC-SymPipelineThermodynamicsandNucleotidecyclicmotifsforRNAstructurepredictionalgorithm.2Dand3Dstructures.webserverRNA123AnintegratedplatformfordenovoandhomologymodelingofRNA3Dstructures,wherecoordinatefileinput,sequenceediting,sequencealignment,structurepredictionandanalysisfeaturesareallaccessedfrom

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論