




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章序列特征分析Analysis
ofSequenceCharacterristics第一節(jié)引言一、基因結(jié)構(gòu)Section1
Introduction
基因的概念是隨著遺傳學(xué)、分子生物學(xué)、生物化學(xué)等領(lǐng)域的發(fā)展不斷完善的。從分子生物學(xué)角度來看,基因是負(fù)載特定生物遺傳信息的DNA分子片段,在一定的條件下能夠表達(dá)這種遺傳信息,產(chǎn)生特定的生理功能。原核生物基因結(jié)構(gòu):
一個(gè)完整的原核基因結(jié)構(gòu)是從基因的5'端啟動(dòng)子區(qū)域開始,到3'端終止區(qū)域結(jié)束?;虻霓D(zhuǎn)錄開始位置由轉(zhuǎn)錄起始位點(diǎn)確定,轉(zhuǎn)錄過程直至遇到轉(zhuǎn)錄終止位點(diǎn)結(jié)束,轉(zhuǎn)錄的內(nèi)容包括5'端非翻譯區(qū)、開放閱讀框及3'端非翻譯區(qū)?;蚍g的準(zhǔn)確起止位置由起始密碼子和終止密碼子決定,翻譯的對(duì)象即為介于這兩者之間的開放閱讀框ORF。真核生物基因結(jié)構(gòu):
一個(gè)完整的真核生物基因,不但包括編碼區(qū)域,還包括5'端和3'端兩側(cè)長(zhǎng)度不等的特異性序列,雖然這些序列不編碼氨基酸,卻在基因表達(dá)的過程中起著重要的作用。所以,嚴(yán)格的“基因”這一術(shù)語的分子生物學(xué)定義是:產(chǎn)生一條多肽鏈或功能RNA所必須的全部核苷酸序列。二、蛋白質(zhì)結(jié)構(gòu)
蛋白質(zhì)是一種生物大分子,蛋白質(zhì)中相鄰的氨基酸通過肽鍵形成一條伸展的肽鏈,這條鏈稱為蛋白質(zhì)的一級(jí)結(jié)構(gòu),不同蛋白質(zhì)其肽鏈的長(zhǎng)度不同,肽鏈中不同氨基酸的組成和排列順序也各不相同。肽鏈上的氨基酸殘基形成局部的二級(jí)結(jié)構(gòu),各種二級(jí)結(jié)構(gòu)在空間卷曲折疊形成特定的三維空間結(jié)構(gòu)。有的蛋白質(zhì)由多條肽鏈組成,每條肽鏈稱為亞基,亞基之間又有特定的空間關(guān)系,稱為蛋白質(zhì)的四級(jí)結(jié)構(gòu)。蛋白質(zhì)的一級(jí)結(jié)構(gòu)蛋白質(zhì)的一級(jí)結(jié)構(gòu)決定二級(jí)結(jié)構(gòu)蛋白質(zhì)的二級(jí)結(jié)構(gòu)決定三級(jí)結(jié)構(gòu)蛋白質(zhì)的二級(jí)結(jié)構(gòu)H表示螺旋E表示折疊B表示β橋G表示3-螺旋I表示π螺旋T表示氫鍵轉(zhuǎn)角S代表轉(zhuǎn)向
對(duì)DNA序列和蛋白質(zhì)序列進(jìn)行序列特征分析,能夠使我們從分子層次上了解基因的結(jié)構(gòu)特點(diǎn),了解與基因表達(dá)調(diào)控相關(guān)的信息,了解DNA序列與蛋白質(zhì)序列之間的編碼,了解蛋白質(zhì)序列與蛋白質(zhì)空間結(jié)構(gòu)之間的關(guān)系和規(guī)律,為進(jìn)一步研究了解蛋白質(zhì)功能與蛋白質(zhì)結(jié)構(gòu)之間的關(guān)系提供理論依據(jù)。第二節(jié)DNA序列特征分析Section2
AnalysisofDNASequenceCharacteristics
分析DNA序列,除了進(jìn)行序列比對(duì)之外,更重要的工作是從序列中找到基因及其表達(dá)調(diào)控信息。尋找基因的工作有兩個(gè):一是識(shí)別與基因相關(guān)的特殊序列信號(hào),如啟動(dòng)子、起始密碼子,通過信號(hào)識(shí)別大致確定基因所在的區(qū)域;二是預(yù)測(cè)基因的編碼區(qū)域,或預(yù)測(cè)外顯子所在的區(qū)域。在此基礎(chǔ)上,結(jié)合兩個(gè)方面的結(jié)果確定基因的位置和結(jié)構(gòu)。絕大部分基因表達(dá)調(diào)控信息隱藏在基因序列的上游區(qū)域,在組成上具有一定的特征,可以通過序列分析識(shí)別這些特征。真核生物的開放閱讀框
真核生物的開放閱讀框不僅含有編碼蛋白的外顯子(exon),而且還有內(nèi)含子(intron),并且內(nèi)含子將開放閱讀框分割為若干個(gè)小片段。開放閱讀框的長(zhǎng)度變化范圍非常大,因此真核生物的基因預(yù)測(cè)遠(yuǎn)比原核生物困難。但是,在真核生物的開放閱讀框中,外顯子與內(nèi)含子之間的連接絕大部分情況下滿足GT-AG規(guī)律:內(nèi)含子序列5'端的起始兩個(gè)核苷酸總是GT,并且其3'端的最后兩個(gè)核苷酸總是AG,即:5'-GT……AG-3',這個(gè)規(guī)律有助于真核生物開放閱讀框的識(shí)別。利用GENSCAN識(shí)別基因開放閱讀框
GENSCAN是美國麻省理工學(xué)院的ChrisBurge于1997年開發(fā)成功的人類(或脊椎動(dòng)物)基因預(yù)測(cè)軟件,它是根據(jù)基因組DNA序列來預(yù)測(cè)開放閱讀框及基因結(jié)構(gòu)信息的開放式在線資源,尤其適用于脊椎動(dòng)物、擬南芥和玉米等真核生物。GENSCAN的網(wǎng)址為:
http://genes.M/GENSCAN.htmlGENSCAN在線操作頁面用GENSCAN預(yù)測(cè)AC002390序列的基因/外顯子的位置圖起始外顯子終止外顯子二、CpG島——CpGislands
CpG島是指DNA序列上的一個(gè)區(qū)域,此區(qū)域含有大量相聯(lián)的胞嘧啶(C)、鳥嘌呤(G),以及使兩者相連的磷酸酯鍵(p)。CpG島的概念是Gardiner-garden和Fromner于1987年提出的,基因中平均每100Kb即可出現(xiàn)。CpG島位于基因的啟動(dòng)子和第一個(gè)外顯子區(qū),約有60%~80%的人類基因的啟動(dòng)子和起始外顯子含有CpG島,其中GC含量大于50%,長(zhǎng)度超過200bp。因此搜索CpG島可以為基因及其啟動(dòng)子預(yù)測(cè)提供重要線索。利用CpGPlot預(yù)測(cè)分析CpG島
CpGPlot是預(yù)測(cè)CpG島的在線工具,它是由歐洲分子生物學(xué)實(shí)驗(yàn)室EMBL——EuropeanMolecularBiologyLaboratory提供的。其網(wǎng)址為:/用CpGplot預(yù)測(cè)AC002390序列的CpG島的結(jié)果用CpGReport預(yù)測(cè)AC002390序列的CpG島的結(jié)果三、轉(zhuǎn)錄終止信號(hào)
轉(zhuǎn)錄終止信號(hào)是在mRNA序列的3'端終止密碼子下游位置上的加尾信號(hào)(tailingsignal)。前體mRNA3'端多聚腺苷酸化是真核細(xì)胞內(nèi)mRNA轉(zhuǎn)錄后處理的三個(gè)最主要步驟之一,這三個(gè)步驟包括:5'帽子結(jié)構(gòu)的形成、內(nèi)含子的剪切及3'端的多聚腺苷酸化,因此,前體mRNA3'端多聚腺苷酸化與mRNA穩(wěn)定性的調(diào)節(jié)、mRNA的細(xì)胞內(nèi)轉(zhuǎn)運(yùn)、翻譯的起始以及一些其他的細(xì)胞機(jī)制和疾病機(jī)制有著重要關(guān)系。利用POLYAH預(yù)測(cè)分析轉(zhuǎn)錄終止信號(hào)SoftBerry網(wǎng)站的POLYAH軟件是識(shí)別3'端剪切和PolyA區(qū)域的在線工具。其網(wǎng)址為:,POLYAH在線頁面利用PromoterScan預(yù)測(cè)分析啟動(dòng)子區(qū)域BioInformaticsandMolecularAnalysisSection網(wǎng)站的PromoterScan軟件是預(yù)測(cè)分析啟動(dòng)子區(qū)域的在線工具。其網(wǎng)址為:
PromoterScan在線網(wǎng)頁用PromoterScan預(yù)測(cè)AC002390序列的啟動(dòng)子區(qū)域的結(jié)果五、密碼子偏好性
密碼子使用偏性是指生物體中編碼同一種氨基酸的同義密碼子的非均勻使用現(xiàn)象。這一現(xiàn)象的產(chǎn)生與諸多因素有關(guān),如基因的表達(dá)水平、翻譯起始效應(yīng)、基因的堿基組分、某些二核苷酸的出現(xiàn)頻率、G+C含量、基因的長(zhǎng)度、tRNA的豐度、蛋白質(zhì)的結(jié)構(gòu)及密碼子一反密碼子間結(jié)合能的大小等。所以對(duì)密碼子使用偏好性的分析具有重要的生物學(xué)意義。利用CodonW分析密碼子偏好性
CodonW是美國DEC公司開發(fā)的對(duì)密碼子的使用進(jìn)行分析的免費(fèi)的軟件工具。此軟件是建立在大量的統(tǒng)計(jì)學(xué)分析的基礎(chǔ)上,為了簡(jiǎn)化在線分析的復(fù)雜性而開發(fā)的,它可以在Windows環(huán)境下運(yùn)行,并且可以同時(shí)處理2000條以上的序列。通過對(duì)DNA或RNA序列的分析,CodonW會(huì)產(chǎn)生關(guān)于密碼子使用的相關(guān)指標(biāo)的統(tǒng)計(jì)學(xué)分析的數(shù)據(jù),我們可以利用這些數(shù)據(jù)對(duì)我們所要了解的序列進(jìn)行分析。其下載網(wǎng)址為:。CodonW1.4主菜單的操作頁面11個(gè)密碼子使用的指標(biāo)waxy基因的序列用CodonW分析waxy基因所得的RSCU值和個(gè)數(shù)第三節(jié)蛋白質(zhì)序列特征分析Section3
Analysisof
ProteinSequenceCharacteristics
蛋白質(zhì)是組成生物體的基本物質(zhì),是生命活動(dòng)的主要承擔(dān)者,一切生命活動(dòng)都與蛋白質(zhì)有關(guān)。雖然遺傳信息的攜帶者是核酸,但遺傳信息的傳遞和表達(dá)不僅要在酶的催化之下,并且也是在各種蛋白質(zhì)的調(diào)節(jié)控制下進(jìn)行的。因此,分析處理蛋白質(zhì)序列數(shù)據(jù)的重要性并不亞于分析DNA序列數(shù)據(jù)。蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定,因此在研究蛋白質(zhì)的功能時(shí)需要了解蛋白質(zhì)的空間結(jié)構(gòu)。
目前,一種基本認(rèn)可的假設(shè)是:蛋白質(zhì)的空間結(jié)構(gòu)由蛋白質(zhì)序列所決定,即我們可以根據(jù)蛋白質(zhì)序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),這是第二遺傳密碼的問題,也是一個(gè)更為復(fù)雜的問題,因?yàn)榈鞍踪|(zhì)序列和蛋白質(zhì)空間結(jié)構(gòu)之間的關(guān)系要比DNA序列和蛋白質(zhì)序列之間的關(guān)系復(fù)雜得多。因此我們需要分析大量的數(shù)據(jù),從中找出蛋白質(zhì)序列和蛋白質(zhì)結(jié)構(gòu)間存在的關(guān)系和規(guī)律。一、蛋白質(zhì)的理化性質(zhì)
蛋白質(zhì)是由氨基酸組成的大分子化合物,對(duì)組成蛋白質(zhì)的氨基酸進(jìn)行理化性質(zhì)的統(tǒng)計(jì)分析是對(duì)一個(gè)未知蛋白質(zhì)進(jìn)行分析的基礎(chǔ)。蛋白質(zhì)的理化性質(zhì)包括蛋白質(zhì)的分子量、氨基酸的組成、等電點(diǎn)、消光系數(shù)、親水性和疏水性、跨膜區(qū)、信號(hào)肽、翻譯后修飾位點(diǎn)等。利用ProtParam分析蛋白質(zhì)的理化性質(zhì)ExPASy(ExpertProteinAnalysisSystem)是由瑞士生物信息學(xué)中心維護(hù),并與歐洲生物信息學(xué)中心(EBI)及蛋白質(zhì)信息資源(proteininformationresource,PIR)組成UniversalProteinKnowledgebase聯(lián)盟。ExPASy數(shù)據(jù)庫提供了一系列蛋白質(zhì)理化分析工具,以便于檢索未知蛋白質(zhì)的理化性質(zhì),并基于這些理化性質(zhì)鑒別未知蛋白質(zhì)的類別,為后續(xù)實(shí)驗(yàn)提供幫助。其中ProtParam(physico-chemicalparametersofaproteinsequence)就是計(jì)算氨基酸理化參數(shù)常用的在線工具。其網(wǎng)址為:
ProtParam在線頁面用ProtParam分析G00016序列理化性質(zhì)的結(jié)果二、蛋白質(zhì)的親水性或疏水性氨基酸通常被分為三類:1.疏水氨基酸(hydrophobicaminoacid),其側(cè)鏈大部分或者全部由碳原子和氫原子組成,因此這類氨基酸不太可能與水分子形成氫鍵;2.極性氨基酸(polaraminoacid),其測(cè)鏈通常由氧原子或氮原子組成,它們比較容易與水分子形成氫鍵,因此也稱為親水氨基酸;3.帶電氨基酸(chargedaminoacids),這類氨基酸在生物
pH環(huán)境中帶有正電或負(fù)電。蛋白質(zhì)的基本組成單元是氨基酸。蛋白質(zhì)的親水性或疏水性
氨基酸的親疏水性是構(gòu)成蛋白質(zhì)折疊的主要驅(qū)動(dòng)力,一般通過親水性分布圖(hydropathyprofile)反映蛋白質(zhì)的折疊情況。蛋白質(zhì)折疊時(shí)會(huì)形成疏水內(nèi)核和親水表面,同時(shí)在潛在跨膜區(qū)出現(xiàn)高疏水值區(qū)域,據(jù)此可以測(cè)定跨膜螺旋等二級(jí)結(jié)構(gòu)和蛋白質(zhì)表面氨基酸分布。利用ProtScale分析蛋白質(zhì)的親水性或疏水性ExPASy的ProtScale程序是計(jì)算蛋白質(zhì)親疏水性分析的在線工具。其網(wǎng)址為:
ProtScale在線頁面用ProtScale分析P02699序列疏水性結(jié)果的圖形顯示Hohob./Kyte&Doolittle標(biāo)度用Windowsize=13時(shí)計(jì)算窗口內(nèi)每個(gè)位置上氨基酸的標(biāo)度權(quán)值三、蛋白質(zhì)的跨膜區(qū)
生物膜所含的蛋白質(zhì)叫膜蛋白,是生物膜功能的主要承擔(dān)者。根據(jù)蛋白質(zhì)分離的難易及在膜中分布的位置,膜蛋白基本可分為兩大類:外在膜蛋白和內(nèi)在膜蛋白。外在膜蛋白約占膜蛋白的20%~30%,分布在膜的內(nèi)外表面,主要在內(nèi)表面,為水溶性蛋白,它通過離子鍵、氫鍵與膜脂分子的極性頭部相結(jié)合,或通過與內(nèi)在蛋白質(zhì)的相互作用間接與膜結(jié)合;內(nèi)在膜蛋白約占膜蛋白的70%~80%,是雙親媒性分子,可不同程度的嵌入脂雙層分子中。有的貫穿整個(gè)脂雙層,兩端暴露于膜的內(nèi)外表面,這種類型的膜蛋白又稱跨膜蛋白。蛋白質(zhì)的跨膜區(qū)
內(nèi)在膜蛋白露出膜外的部分含較多的極性氨基酸,屬親水性,與磷脂分子的親水頭部鄰近;嵌入脂雙層內(nèi)部的膜蛋白由一些非極性的氨基酸組成,與脂質(zhì)分子的疏水尾部相互結(jié)合,因此與膜結(jié)合非常緊密。所以,對(duì)膜蛋白的跨膜區(qū)進(jìn)行預(yù)測(cè)是生物信息學(xué)的重要應(yīng)用。利用TMpred分析蛋白質(zhì)的跨膜區(qū)TMpred是EMBnet開發(fā)的一個(gè)分析蛋白質(zhì)跨膜區(qū)的在線工具,TMpred基于對(duì)TMbase數(shù)據(jù)庫的統(tǒng)計(jì)分析來預(yù)測(cè)蛋白質(zhì)跨膜區(qū)和跨膜方向。TMbase來源于Swiss-Prot庫,并包含了每個(gè)序列的一些附加信息,如:跨膜結(jié)構(gòu)區(qū)域的數(shù)量、跨膜結(jié)構(gòu)域的位置及其側(cè)翼序列的情況。TMpred利用這些信息并與若干加權(quán)矩陣結(jié)合來進(jìn)行預(yù)測(cè)。其網(wǎng)址為:
TMpred在線網(wǎng)頁用TMpred分析P51684序列所得到的可能的7個(gè)跨膜螺旋區(qū)用TMpred分析P51684序列所得到的7個(gè)可能的跨膜螺旋區(qū)的相關(guān)性列表用TMpred分析P51684序列所得到的7個(gè)可能的跨膜螺旋區(qū)的建議的跨膜拓?fù)淠P陀肨Mpred分析P51684序列所得到的7個(gè)可能的跨膜螺旋區(qū)的圖形顯示結(jié)果四、信號(hào)肽—signalpeptide
信號(hào)肽是指新合成多肽鏈中用于指導(dǎo)蛋白質(zhì)跨膜轉(zhuǎn)移的末端(通常為N末端)的氨基酸序列。信號(hào)肽中至少含有一個(gè)帶正電荷的氨基酸,中部有一個(gè)高度疏水區(qū)以通過細(xì)胞膜。信號(hào)肽假說認(rèn)為,編碼分泌蛋白的mRNA在翻譯時(shí)首先合成的是N末端帶有疏水氨基酸殘基的信號(hào)肽,它被內(nèi)質(zhì)網(wǎng)膜上的受體識(shí)別并與之相結(jié)合。信號(hào)肽經(jīng)由膜中蛋白質(zhì)形成的孔道到達(dá)內(nèi)質(zhì)網(wǎng)內(nèi)腔,隨機(jī)被位于腔表面的信號(hào)肽酶水解,由于它的引導(dǎo),新生的多肽就能夠通過內(nèi)質(zhì)網(wǎng)膜進(jìn)入腔內(nèi),最終被分泌到胞外。蛋白質(zhì)的前導(dǎo)肽—leaderPeptide
前導(dǎo)肽是信號(hào)肽的一種。在線粒體蛋白質(zhì)的跨膜轉(zhuǎn)運(yùn)過程中,通過線粒體膜的蛋白質(zhì)在轉(zhuǎn)運(yùn)之前大多數(shù)以前體形式存在,它由成熟蛋白質(zhì)和N端延伸出的一段前導(dǎo)肽共同組成。迄今已有40多種線粒體蛋白質(zhì)前導(dǎo)肽的一級(jí)結(jié)構(gòu)被闡明,它們約含20~80個(gè)氨基酸殘基,當(dāng)前體蛋白跨模時(shí),前導(dǎo)肽被一種或兩種多肽酶所水解轉(zhuǎn)變成為成熟蛋白質(zhì),同時(shí)失去繼續(xù)跨膜的能力。前導(dǎo)肽一般具有以下特性:(1)帶正電荷的堿性氨基酸(特別是精氨酸)含量較為豐富,它們分散于不帶電荷的氨基酸序列之間;(2)缺失帶負(fù)電荷的酸性氨基酸;(3)羥基氨基酸(特別是絲氨酸)含量較高;(4)有形成兩親(既有親水又有疏水部分)α-螺旋結(jié)構(gòu)的能力。利用SignalP分析蛋白質(zhì)的前導(dǎo)肽SignalP是丹麥技術(shù)大學(xué)的生物序列分析中心開發(fā)的信號(hào)肽及其剪切位點(diǎn)檢測(cè)的在線工具,該軟件基于神經(jīng)網(wǎng)絡(luò)方法,用已知信號(hào)序列的革蘭氏陰性原核生物、革蘭氏陽性原核生物及真核生物的序列分別作為訓(xùn)練集。SignalP預(yù)測(cè)的是分泌型信號(hào)肽,而不是那些參與細(xì)胞內(nèi)信號(hào)傳遞的蛋白。其網(wǎng)址為:
SignalP在線網(wǎng)頁用SignalP(神經(jīng)網(wǎng)絡(luò)方法)分析P05019序列前導(dǎo)肽的結(jié)果用SignalP(隱馬爾可夫方法)分析P05019序列前導(dǎo)肽的結(jié)果五、蛋白質(zhì)的卷曲螺旋—coiled-coil
卷曲螺旋是蛋白質(zhì)空間結(jié)構(gòu)中的一種,它是由2~7個(gè)α螺旋相互纏繞而形成超螺旋結(jié)構(gòu)的總稱。卷曲螺旋區(qū)域一般由7個(gè)氨基酸殘基為單位組成,以a、b、c、d、e、f、g位置表示,其中a和d位置為疏水性氨基酸,而其他位置的氨基酸殘基為親水性。許多含有卷曲螺旋結(jié)構(gòu)的蛋白質(zhì)具有重要的生物學(xué)功能,例如基因表達(dá)調(diào)控中的轉(zhuǎn)錄因子。含有卷曲螺旋結(jié)構(gòu)最知名的蛋白質(zhì)有原癌蛋白(oncoprotein)c-fos和jun,以及原肌球蛋白(tropomyosin)。利用COILS分析蛋白質(zhì)的卷曲螺旋COILS是由SwissEMBNet維護(hù)的預(yù)測(cè)卷曲螺旋的在線工具,該軟件是基于Lupas算法,將查詢序列在一個(gè)由已知包含卷曲螺旋蛋白結(jié)構(gòu)的數(shù)據(jù)庫中進(jìn)行搜索,同時(shí)也將查詢序列與包含球狀蛋白序列的PDB次級(jí)庫進(jìn)行比較,并根據(jù)兩個(gè)庫搜索得分決定查詢序列形成卷曲螺旋的概率。COILS也可以下載到本地進(jìn)行運(yùn)算。其網(wǎng)址為:COILS在線網(wǎng)頁用COILS分析GO45_HUMAN卷曲螺旋的圖形顯示結(jié)果用COILS分析GO45_HUMAN卷曲螺旋的文本顯示結(jié)果六、蛋白質(zhì)序列分析軟件包:Antheprot
對(duì)蛋白質(zhì)的研究是生物化學(xué)領(lǐng)域一個(gè)非常重要的部分。隨著人類基因組計(jì)劃的實(shí)施和完成,得到了大量的蛋白質(zhì)序列數(shù)據(jù),但是,面對(duì)如此眾多的蛋白質(zhì)序列數(shù)據(jù),其分析工作是一個(gè)非常困難的工作。用人工的方法是不可能完成如此大量的分析工作的。運(yùn)用計(jì)算機(jī),利用一定的運(yùn)算規(guī)則,進(jìn)行蛋白序列分析是唯一的方法。蛋白序列分析軟件包Antheprot正是這樣的一個(gè)程序。蛋白質(zhì)序列分析軟件包:AntheprotAntheprot是位于法國的蛋白質(zhì)生物與化學(xué)研究院用十多年時(shí)間開發(fā)出的蛋白質(zhì)研究軟件包,它包括了蛋白質(zhì)研究領(lǐng)域所包括的大多數(shù)內(nèi)容,功能非常強(qiáng)大。Antheprot的原始網(wǎng)站:,我們可以到這個(gè)網(wǎng)站上下載軟件包,軟件包為一個(gè)自解壓執(zhí)行文件,文件名為Antheprot.exe,大小為51.3M。執(zhí)行此文件,輸入解壓后存放的目錄名,便可將所有文件解壓在此目錄下。主程序名為Anthepro,雙擊主程序名就可以打開Antheprot_2000的主窗口。通過主程序,我們可以輸入蛋白序列,對(duì)序列進(jìn)行編輯、打印、拷貝、改變?cè)O(shè)置等操作,更重要的是,我們可以在此調(diào)用各種所需的分析工具,對(duì)蛋白序列進(jìn)行分析。Antheprot主窗口Antheprot主窗口中各按鍵的含義Openfile,打開文件;Changetextfont,更改字體、字型和大??;Changetextcolor,更改選定區(qū)域內(nèi)字的顏色;Sequenceinformation,序列信息,計(jì)算蛋白質(zhì)序列的分子量、比溶、各氨基酸殘基的百分比組成;Titrationcurve,滴定曲線,計(jì)算蛋白質(zhì)序列滴定曲線與等電點(diǎn);Helicalwheelprojection,選定序列的一個(gè)片段后,繪制Helicalwheel圖;Antheprot主窗口中各按鍵的含義Predictionofcleavagesiteforsignalpeptide,預(yù)測(cè)信號(hào)肽的剪切位點(diǎn);Secondarystructurepredictionbyall,預(yù)測(cè)蛋白質(zhì)序列的二級(jí)結(jié)構(gòu);PROSITEsite/signaturedetection,在蛋白質(zhì)序列中查找符合PROSITE數(shù)據(jù)庫的特征序列;Physico-chemicalprofiles,繪制蛋白質(zhì)序列的理化特性曲線;Pridicttransmembraneregion,預(yù)測(cè)跨膜區(qū);SimilaritysearchwithBlast,用Blast方法在選擇的數(shù)據(jù)庫中查找相似序列;Antheprot主窗口中各按鍵的含義SimilaritysearchwithFasta,用Fasta方法在選擇的數(shù)據(jù)庫中查找相似序列;DotMatrixPlot,進(jìn)行點(diǎn)陣圖分析;Multiplealignment,多序列比對(duì);Binaryalignment(BINALIGN),在當(dāng)前蛋白質(zhì)序列中查找符合Prosites數(shù)據(jù)庫的特征序列;Help,打開一個(gè)簡(jiǎn)單的幫助文件;Quit,推出程序。Antheprot基本功能1.編輯(edit)2.參數(shù)設(shè)置(setting)3.方法選擇(methods)4.數(shù)據(jù)庫(database)第四節(jié)序列綜合分析Section4
SequenceAnalysisSoftware
一、EMBOSS軟件包EMBOSS軟件包是一個(gè)開源的序列分析軟件包,該軟件包源于1988年開始開發(fā)的EGCG系統(tǒng),整合了目前可以獲得的大部分序列分析軟件,并有一套專門設(shè)計(jì)的C語言庫函數(shù)。該軟件包含160多個(gè)小型程序,能夠完成自動(dòng)識(shí)別處理不同格式存儲(chǔ)的數(shù)據(jù),可以通過互聯(lián)網(wǎng)提取數(shù)據(jù),能很好地進(jìn)行序列模體(motif)、關(guān)鍵詞同源性數(shù)據(jù)庫搜索,進(jìn)行序列比較、進(jìn)化分析、序列兩級(jí)結(jié)構(gòu)分析、限制性酶切圖譜分析、引物設(shè)計(jì)、序列模式識(shí)別與翻譯、片段拼接等工作。EMBOSS遵照GPL協(xié)議,打破了商業(yè)軟件包發(fā)展的傳統(tǒng)模式,使科研工作者在自由、免費(fèi)的軟件世界享受功能強(qiáng)大的分析工具。
EMBOSS的主頁網(wǎng)址為:
EMBOSS—EuropeanMolecularBiologyOpenSoftwareSuiteEMBOSS的運(yùn)行環(huán)境EMBOSS軟件包主要運(yùn)行于linux操作系統(tǒng)和Mac操作系統(tǒng)?,F(xiàn)在基于Windows操作系統(tǒng)的EMBOSS也是能自由免費(fèi)使用的。需要說明的是基于windows操作系統(tǒng)時(shí),主要采用staden進(jìn)入EMBOSS,在使用的同時(shí),需要安裝Emboss
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商務(wù)車租賃合同范本
- 制作印刷材料合同范本
- 包裝接單合同范本
- 公司欠款還款合同范本
- 廠家代理商合同范本
- 合同范本大會(huì)
- 合同以外合同范本有效
- 廠房漏雨維修合同范例
- 精煤銷售批發(fā)合同范本
- 個(gè)人商業(yè)購房合同范本
- 2025海南省交通投資控股限公司招聘30人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 《工業(yè)機(jī)器人現(xiàn)場(chǎng)編程》課件-任務(wù)3.涂膠機(jī)器人工作站
- 富饒的西沙群島課件
- 中英文對(duì)照版 ASTM B594 2019 鋁合金形變產(chǎn)品超聲波檢測(cè)標(biāo)準(zhǔn)慣例
- 李四光《看看我們的地球》原文閱讀
- 五年級(jí)下冊(cè)道德與法治教學(xué)計(jì)劃
- 2025屆高考數(shù)學(xué)專項(xiàng)復(fù)習(xí):阿基米德三角形【六大題型】含答案
- 讀書分享-于永正-我怎樣教語文
- 2024工貿(mào)企業(yè)重大事故隱患判定標(biāo)準(zhǔn)解讀
- 高中語文(統(tǒng)編版)選必中冊(cè)-第二單元教材分析解讀課件
- 哈爾濱鐵道職業(yè)技術(shù)學(xué)院?jiǎn)握小墩Z文》考試復(fù)習(xí)題庫(含答案)
評(píng)論
0/150
提交評(píng)論