序列的同源性比較及分子系統(tǒng)學(xué)和分子進(jìn)化分析課件_第1頁
序列的同源性比較及分子系統(tǒng)學(xué)和分子進(jìn)化分析課件_第2頁
序列的同源性比較及分子系統(tǒng)學(xué)和分子進(jìn)化分析課件_第3頁
序列的同源性比較及分子系統(tǒng)學(xué)和分子進(jìn)化分析課件_第4頁
序列的同源性比較及分子系統(tǒng)學(xué)和分子進(jìn)化分析課件_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第五章

序列的同源性比較

及分子系統(tǒng)學(xué)和分子進(jìn)化分析第五章

1相似性和同源性關(guān)系

序列的相似性和序列的同源性有一定的關(guān)系,一般來說序列間的相似性越高的話,它們是同源序列的可能性就更高,所以經(jīng)常可以通過序列的相似性來推測序列是否同源。正因為存在這樣的關(guān)系,很多時候?qū)π蛄械南嗨菩院屯葱跃蜎]有做很明顯的區(qū)分,造成經(jīng)常等價混用兩個名詞。所以有出現(xiàn)A序列和B序列的同源性為80%一說。相似性和同源性關(guān)系序列的相似性和序列的同源性有一定的關(guān)2序列相似性比較和序列同源性分析序列相似性比較:將待研究序列與DNA或蛋白質(zhì)序列庫進(jìn)行比較,用于確定該序列的生物屬性,也就是找出與此序列相似的已知序列是什么。完成這一工作只需要使用兩兩序列比較算法。常用的程序包有BLAST、FASTA等序列相似性比較和序列同源性分析序列相似性比較:3序列同源性分析:將待研究序列加入到一組與之同源,但來自不同物種的序列中進(jìn)行多序列同時比較,以確定該序列與其它序列間的同源性大小。這是理論分析方法中最關(guān)鍵的一步。完成這一工作必須使用多序列比較算法。常用的程序包有CLUSTAL等序列同源性分析:4Blast程序BLAST是一個基于序列相似性的數(shù)據(jù)庫搜索程序。是“局部相似性基本查詢工具”(BasicLocalAlignmentSearchTool)的縮寫。

Blast是一個序列相似性搜索的程序包,其中包含了很多個獨立的程序,這些程序是根據(jù)查詢的對象和數(shù)據(jù)庫的不同來定義的。Blast程序BLAST是一個基于序列相似性的數(shù)據(jù)庫5Blast程序的選擇

Blast是一個序列相似性搜索的程序包,其中包含了很多個獨立的程序,這些程序是根據(jù)查詢的對象和數(shù)據(jù)庫的不同來定義的。Blast程序的選擇Blast是一個序列相似性搜索的程6程序名查詢序列數(shù)據(jù)庫搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)庫中的序列Blastp蛋白質(zhì)蛋白質(zhì)蛋白質(zhì)序列搜索逐一蛋白質(zhì)數(shù)據(jù)庫中的序列Blastx核酸蛋白質(zhì)核酸序列6框翻譯成蛋白質(zhì)序列后和蛋白質(zhì)數(shù)據(jù)庫中的序列逐一搜索。Tblastn蛋白質(zhì)核酸蛋白質(zhì)序列和核酸數(shù)據(jù)庫中的核酸序列6框翻譯后的蛋白質(zhì)序列逐一比對。TBlastx核酸核酸核酸序列6框翻譯成蛋白質(zhì)序列,再和核酸數(shù)據(jù)庫中的核酸序列6框翻譯成的蛋白質(zhì)序列逐一進(jìn)行比對。主要的blast程序程序名查詢序列數(shù)據(jù)庫搜索方法Blastn核酸核酸核酸序列搜索7Blast資源主站點:/BLAST/(網(wǎng)絡(luò)版)

/blast/(單機版)Blast資源主站點:8其他站點:

/blast/

http://nema.cap.ed.ac.uk/ncbi_blast.html其他站點:9Blast結(jié)果Blast結(jié)果會列出跟查詢序列相似性比較高,符合限定要求的序列結(jié)果,根據(jù)這些結(jié)果可以獲取以下一些信息。查詢序列可能具有某種功能查詢序列可能是來源于某個物種查詢序列可能是某種功能基因的同源基因Blast結(jié)果Blast結(jié)果會列出跟查詢序列相似性比10Blast的版本網(wǎng)絡(luò)版本NCBI在內(nèi)的很多網(wǎng)站都提供了在線的blast服務(wù),是最經(jīng)常用到的blast服務(wù)。優(yōu)點:方便,容易操作,數(shù)據(jù)庫同步更新等優(yōu)點。缺點:不利于操作大批量的數(shù)據(jù),同時也不能自己定義搜索的數(shù)據(jù)庫Blast的版本網(wǎng)絡(luò)版本11單機版通過NCBI的ftp站點獲得。獲得程序的同時必須獲取相應(yīng)的數(shù)據(jù)庫才能在本地進(jìn)行blast分析。優(yōu)點:可以處理大批的數(shù)據(jù),可以自己定義數(shù)據(jù)庫,

缺點:需要耗費本地機的大量資源,此外操作也沒有網(wǎng)絡(luò)版直觀、方便,需要一定的計算機操作水平。單機版12Blast程序評價序列相似性的兩個數(shù)據(jù)Score:使用打分矩陣對匹配的片段進(jìn)行打分,這是對各對氨基酸殘基(或堿基)打分求和的結(jié)果,一般來說,匹配片段越長、相似性越高則Score值越大。Evalue:在相同長度的情況下,兩個氨基酸殘基(或堿基)隨機排列的序列進(jìn)行打分,得到上述Score值的概率的大小。E值越小表示隨機情況下得到該Score值的可能性越低。Blast程序評價序列相似性的兩個數(shù)據(jù)Score:使用打分矩13NCBI提供的Blast服務(wù)登陸ncbi的blast主頁核酸序列蛋白序列翻譯序列還有其他一些針對特殊數(shù)據(jù)庫的和查看以往的比對結(jié)果等NCBI提供的Blast服務(wù)登陸ncbi的blast主頁核酸14Blast任務(wù)提交表單(一)1.序列信息部分填入查詢(query)的序列序列范圍(默認(rèn)全部)選擇搜索數(shù)據(jù)庫如果接受其他參數(shù)默認(rèn)設(shè)置,點擊開始搜索Blast任務(wù)提交表單(一)1.序列信息部分填入查詢(que15Blast任務(wù)提交表單(二)設(shè)置搜索的范圍,entrez關(guān)鍵詞,或者選擇特定物種2.設(shè)置各種參數(shù)部分一些過濾選項,包括簡單重復(fù)序列,人類基因組中的重復(fù)序列等E值上限窗口大小如果你對blast的命令行選項熟悉的話,可以在這里加入更多的參數(shù)Blast任務(wù)提交表單(二)設(shè)置搜索的范圍,entrez關(guān)鍵16Blast任務(wù)提交表單(三)3.設(shè)置結(jié)果輸出顯示格式選擇需要顯示的選項以及顯示的文件格式顯示數(shù)目Alignment的顯示方式篩選結(jié)果E值范圍其他一些顯示格式參數(shù)點擊開始搜索Blast任務(wù)提交表單(三)3.設(shè)置結(jié)果輸出顯示格式選擇需要17提交任務(wù)返回查詢號(requestid)可以修改顯示結(jié)果格式修改完顯示格式后點擊進(jìn)入結(jié)果界面提交任務(wù)返回查詢號(requestid)可以修改顯示結(jié)果格18結(jié)果頁面(一)圖形示意結(jié)果結(jié)果頁面(一)圖形示意結(jié)果19結(jié)果頁面(二)目標(biāo)序列描述部分帶有g(shù)enbank的鏈接,點擊可以進(jìn)入相應(yīng)的genbank序列匹配情況,分值,e值結(jié)果頁面(二)目標(biāo)序列描述部分帶有g(shù)enbank的鏈接,點擊20結(jié)果頁面(三)詳細(xì)的比對上的序列的排列情況結(jié)果頁面(三)詳細(xì)的比對上的序列的排列情況21一個具體的例子(blastp)假設(shè)以下為一未知蛋白序列>query_seqMSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA

我們通過blast搜索來獲取一些這個序列的信息。一個具體的例子(blastp)假設(shè)以下為一未知蛋白序列22具體步驟1.登陸blast主頁/BLAST/2.根據(jù)數(shù)據(jù)類型,選擇合適的程序3.填寫表單信息4.提交任務(wù)5.查看和分析結(jié)果具體步驟1.登陸blast主頁23分析過程(一)1.登陸ncbi的blast主頁2.選擇程序,因為查詢序列是蛋白序列可以選擇blastp,點擊進(jìn)入也可以選擇tblastn作為演示,我們這里選blastp分析過程(一)1.登陸ncbi的blast主頁2.選擇程序,24分析過程(二)3.填入序列(copy+paste)Fasta格式,或者純序列4.選擇搜索區(qū)域,這里我們要搜索整個序列,不填5.選擇搜索數(shù)據(jù)庫,這里我們選nr(非冗余的蛋白序列庫)。是否搜索保守區(qū)域數(shù)據(jù)庫(cdd),蛋白序列搜索才有。我們選上分析過程(二)3.填入序列(copy+paste)4.選擇搜25分析過程(三)6.限制條件,我們限制在病毒里面找。7.其他選項保持默認(rèn)值打分矩陣分析過程(三)6.限制條件,我們限制在病毒里面找。7.其他選26分析過程(四)8.輸出格式選項保持默認(rèn)值9.點擊開始搜索分析過程(四)8.輸出格式選項保持默認(rèn)值9.點擊開始搜索27分析過程(五)10.查詢序列的一些相關(guān)信息在cdd庫里面找到兩個保守區(qū)域,點擊可以進(jìn)入分析過程(五)10.查詢序列的一些相關(guān)信息在cdd庫里面找到28分析過程(六)圖形結(jié)果分析過程(六)圖形結(jié)果29分析過程(七)匹配序列列表分析過程(七)匹配序列列表30分析過程(八)具體匹配情況分析過程(八)具體匹配情況31其他的序列相似性搜索工具

-FastAFastA算法是由Lipman和Pearson于1985年發(fā)表的(Lipman和Pearson,1985)。FastA的基本思路是識別與代查序列相匹配的很短的序列片段,稱為k-tuple。以下鏈接是EBI提供的fasta服務(wù)。

http://www.ebi.ac.uk/fasta其他的序列相似性搜索工具

32幫助信息各個參數(shù)選項填入搜索序列幫助信息各個參數(shù)選項填入搜索序列33多序列比對及Clustal的使用多序列比對及Clustal的使用34多序列比對的意義用于描述一組序列之間的相似性關(guān)系,以便了解一個基因家族的基本特征,尋找motif,保守區(qū)域等。用于描述一個同源基因之間的親緣關(guān)系的遠(yuǎn)近,應(yīng)用到分子進(jìn)化分析中。多序列比對的意義35多序列比對的方法

同源性分析中常常要通過多序列比對來找出序列之間的相互關(guān)系,和blast的局部匹配搜索不同,多序列比對大多都是采用全局比對的算法。這樣對于采用計算機程序的自動多序列比對是一個非常復(fù)雜且耗時的過程,特別是序列數(shù)目多,且序列長的情況下。多序列比對的方法同源性分析中常常要通過多序列比對來找出36多序列比對的方法

1.手工比對(輔助編輯軟件如bioedit,seaview,Genedoc等)通過輔助軟件的不同顏色顯示不同殘基,靠分析者的觀察來改變比對的狀態(tài)。

2.計算機程序自動比對通過特定的算法(如同步法,漸進(jìn)法等),由計算機程序自動搜索最佳的多序列比對狀態(tài)。多序列比對的方法1.手工比對(輔助編輯軟件如bioedi37自動多序列比對的算法1.同步法將序列兩兩比對時的二維動態(tài)規(guī)劃矩陣擴展到三維矩陣。即用矩陣的維數(shù)來反映比對的序列數(shù)目。這種方法的計算量很大,對于計算機系統(tǒng)的資源要求比較高,一般只有在進(jìn)行少數(shù)的較短的序列的比對的時候才會用到這個方法。自動多序列比對的算法1.同步法382.步進(jìn)法最常見的就是clustal所采用的方法。

其基本思想就是基于相似序列通常具有進(jìn)化相關(guān)性的這一假設(shè)。2.步進(jìn)法39多序列比對工具

-clustalwClustalw是一個單機版的基于漸進(jìn)比對的多序列比對工具,由HigginsD.G.等開發(fā)。有應(yīng)用于多種操作系統(tǒng)平臺的版本,包括linux版,DOS版的clustlw,clustalx等。多序列比對工具

-clu40

CLUSTALW是一種漸進(jìn)的比對方法,先將多個序列兩兩比對構(gòu)建距離矩陣,反應(yīng)序列之間兩兩關(guān)系;然后根據(jù)距離矩陣計算產(chǎn)生系統(tǒng)進(jìn)化指導(dǎo)樹,對關(guān)系密切的序列進(jìn)行加權(quán);然后從最緊密的兩條序列開始,逐步引入臨近的序列并不斷重新構(gòu)建比對,直到所有序列都被加入為止。CLUSTALW是一種漸進(jìn)的比對方法,先將多個序列兩兩41Clustalx的工作界面

(多序列比對模式)Clustalx的工作界面

42Clustalx的工作界面

(剖面(profile)比對模式)Clustalx的工作界面

43Clustalw的工作原理Clustalw輸入多個序列快速的序列兩兩比對,計算序列間的距離,獲得一個距離矩陣鄰接法(NJ)構(gòu)建一個樹(引導(dǎo)樹)根據(jù)引導(dǎo)樹,漸進(jìn)比對多個序列。Clustalw的工作原理Clustalw輸入多個序列快速的44Clustalw的應(yīng)用1.輸入輸出格式。輸入序列的格式比較靈活,可以是前面介紹過的FASTA格式,還可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。輸出格式也可以選擇,有ALN、GCG、PHYLIP和NEXUS等,用戶可以根據(jù)自己的需要選擇合適的輸出格式。Clustalw的應(yīng)用1.輸入輸出格式。452.兩種工作模式。

a.多序列比對模式。

b.剖面(profile)比對模式。2.兩種工作模式。46GCG序列對比軟件GCG(GeneticsComputerGroup)是生物信息界最廣為人知的分子序列分析軟件包,最早是在美國的威斯康辛大學(xué)麥迪遜校區(qū)(UniversityofWisconsin-Madison)內(nèi)發(fā)展起來的,后來獨立成為一個商業(yè)公司,期間曾經(jīng)是OxfordMolecular的分支機構(gòu),在2000年又由Pharmacopeia所并構(gòu)。GCG序列對比軟件GCG(GeneticsComp47GCG軟件包包括了超過130個獨立的序列分析程序,大致上可以分成以下12個類別:

1.SequenceComparison2.DatabaseSearchingandRetrieval3.DNA/RNASecondaryStructurePrediction4.EditingandPublication5.EvolutionaryAnalysis6.FragmentAssembly7.GeneFindingandPatternRecognition8.ImportingandExporting9.Mapping10.PrimerSelection11.ProteinAnalysis12.Translation

GCG軟件包包括了超過130個獨立的序列分析程序,大致上可48除了分析程序以外,GCG同時也提供多種生物學(xué)數(shù)據(jù)庫。 核酸相關(guān)的:

GenBank(/)EMBL(http://www.ebi.ac.uk/)

蛋白質(zhì)相關(guān)的:

SWISS-PROT(http://www.expasy.ch/sprot/)PIR(/pir/)SP-TrEMBL(http://www.expasy.ch/sprot/)

使用者可以輸入自己實驗獲得的分子序列,或者從這些數(shù)據(jù)庫中來獲取得到分子序列,再用到GCG的分析程序進(jìn)行分析。除了分析程序以外,GCG同時也提供多種生物學(xué)數(shù)據(jù)庫。49執(zhí)行GCG程序的方法1.傳統(tǒng)的命令行形式,這種情況要求用戶熟悉程序的命令。2.借助SeqLab的用戶窗口界面,通過各類表單的操作來實現(xiàn)分析任務(wù)。以上兩個執(zhí)行GCG的方法都是通過telnet來實現(xiàn)的。3.借助于WWW服務(wù)的SeqWeb,是最為簡單和方便的使用方式。

雖然命令行的操作需要一些操作,但是對于熟悉GCG的用戶來說,卻是最為快捷和有效的方法,此外這種方法還可以擴展到批處理中。執(zhí)行GCG程序的方法1.傳統(tǒng)的命令行形式,這種情況要求用戶熟50分子進(jìn)化分析與相關(guān)分析軟件的應(yīng)用分子進(jìn)化分析與51分子進(jìn)化分析介紹研究目的

從物種的一些分子特性出發(fā),從而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系。通過序列同源性的比較進(jìn)而了解基因的進(jìn)化以及生物系統(tǒng)發(fā)生的內(nèi)在規(guī)律分子進(jìn)化分析介紹研究目的52系統(tǒng)發(fā)育樹

是對一組實際對象的世系關(guān)系的描述(如基因,物種等)系統(tǒng)發(fā)育樹是對一組實際對象的世系關(guān)系的描述(如基因,物種53分子進(jìn)化研究的基礎(chǔ)核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部信息在各種不同的發(fā)育譜系及足夠大的進(jìn)化時間尺度中,許多序列的進(jìn)化速率幾乎是恒定不變的。(分子鐘理論,1965)雖然很多時候仍然存在爭議,但是分子進(jìn)化確實能闡述一些生物系統(tǒng)發(fā)生的內(nèi)在規(guī)律。分子進(jìn)化研究的基礎(chǔ)核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部54系統(tǒng)發(fā)育樹重建的基本方法最大簡約法(maximumparsimony,MP)距離法(distance)最大似然法(maximumlikelihood,ML)系統(tǒng)發(fā)育樹重建的基本方法最大簡約法(maximumpars55最大簡約法

最大簡約法(maximumparsimony,MP)最早源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進(jìn)化分析中。最大簡約法的理論基礎(chǔ)是奧卡姆(Ockham)哲學(xué)原則,這個原則認(rèn)為:解釋一個過程的最好理論是所需假設(shè)數(shù)目最少的那一個。對所有可能的拓?fù)浣Y(jié)構(gòu)進(jìn)行計算,并計算出所需替代數(shù)最小的那個拓?fù)浣Y(jié)構(gòu),作為最優(yōu)樹。最大簡約法最大簡約法(maximumparsimony56優(yōu)點: 最大簡約法不需要在處理核苷酸或者氨基酸替代的時候引入假設(shè)(替代模型)。 此外,最大簡約法對于分析某些特殊的分子數(shù)據(jù)如插入、缺失等序列有用。優(yōu)點:57缺點:

在分析的序列位點上沒有回復(fù)突變或平行突變,且被檢驗的序列位點數(shù)很大的時候,最大簡約法能夠推導(dǎo)獲得一個很好的進(jìn)化樹。 然而在分析序列上存在較多的回復(fù)突變或平行突變,而被檢驗的序列位點數(shù)又比較少的時候,最大簡約法可能會給出一個不合理的或者錯誤的進(jìn)化樹推導(dǎo)結(jié)果。缺點:58距離法距離法又稱距離矩陣法,首先通過各個物種之間的比較,根據(jù)一定的假設(shè)(進(jìn)化距離模型)推導(dǎo)得出分類群之間的進(jìn)化距離,構(gòu)建一個進(jìn)化距離矩陣。進(jìn)化樹的構(gòu)建則是基于這個矩陣中的進(jìn)化距離關(guān)系距離法距離法又稱距離矩陣法,首先通過各個物種之間的比較,根據(jù)59Fitch-MargoliashMethod(FM法)

UnweightedPairGroupMethod(UPGMA法)Fitch-MargoliashMethod60Fitch-Margoliash方法(FM法)1.找出關(guān)系最近的序列對,如A和B2.將剩余的序列作為一個簡單復(fù)合序列,分別計算A、B到所有其他序列的距離的平均值3.用這些值來計算A和B間的距離4.將A、B作為一個單一的復(fù)合序列AB,計算與每一個其他序列的距離,生成新的距離矩陣5.確定下一對關(guān)系最近的序列,重復(fù)前面的步聚計算枝長6.從每個序列對開始,重復(fù)整個過程7.對每個樹計算每對序列間的預(yù)測距離,發(fā)現(xiàn)與原始數(shù)據(jù)最符合的樹Fitch-Margoliash方法(FM法)1.找出關(guān)系最61最大似然法(ML)最大似然法(maximumlikelihood,ML)最早應(yīng)用于系統(tǒng)發(fā)育分析是在對基因頻率數(shù)據(jù)的分析上,后來基于分子序列的分析中也已經(jīng)引入了最大似然法的分析方法。最大似然法(ML)最大似然法(maximumlike62最大似然法分析中,選取一個特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個拓?fù)浣Y(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓?fù)浣Y(jié)構(gòu)作為最優(yōu)樹。在最大似然法的分析中,所考慮的參數(shù)并不是拓?fù)浣Y(jié)構(gòu)而是每個拓?fù)浣Y(jié)構(gòu)的枝長,并對似然率球最大值來估計枝長。最大似然法分析中,選取一個特定的替代模型來分析給定的一63最大似然法的建樹過程是個很費時的過程,因為在分析過程中有很大的計算量,每個步驟都要考慮內(nèi)部節(jié)點的所有可能性。

最大似然法是一個比較成熟的參數(shù)估計的統(tǒng)計學(xué)方法,具有很好的統(tǒng)計學(xué)理論基礎(chǔ),在當(dāng)樣本量很大的時候,似然法可以獲得參數(shù)統(tǒng)計的最小方差。只要使用了一個合理的、正確的替代模型,最大似然法可以推導(dǎo)出一個很好的進(jìn)化樹結(jié)果。

最大似然法的建樹過程是個很費時的過程,因為在分析過程中64常見的分子進(jìn)化分析程序1.Phylip

由華盛頓大學(xué)遺傳學(xué)系開發(fā),是一個免費的系統(tǒng)發(fā)育分析軟件包,可以通過以下地址下載。/phylip.html2.PAUP

最早是在蘋果機上開發(fā)的具有菜單界面的進(jìn)化分析軟件,早先版本只有MP法,后續(xù)版本已經(jīng)包括距離法和ML法,現(xiàn)今有mac,win,linux等多種版本,該軟件不是免費軟件,使用者需要向開發(fā)者購買。3.PAML

是免費軟件包,以下鏈接可以下載軟件和說明書http://abacus.gene.ucl.ac.uk/software/paml.html常見的分子進(jìn)化分析程序1.Phylip65Phylip軟件包介紹Phylip是一個免費的系統(tǒng)發(fā)生(phylogenetics)分析軟件包,以由華盛頓大學(xué)遺傳學(xué)系開發(fā).下鏈接可以下載:http://evolution.genetics,/phylip.html

Phylip軟件包介紹Phylip是一個免費的系統(tǒng)發(fā)生(ph66Phylip包含了35個獨立的程序,這些獨立的程序都實現(xiàn)特定的功能,這些程序基本上包括了系統(tǒng)發(fā)生分析的所有方面。

Phylip有多種不同平臺的版本(包括windows,DOS,Linux,Unix等。Phylip包含了35個獨立的程序,這些獨立的程序都67

Phylip是目前最廣泛使用的系統(tǒng)發(fā)生分析程序,主要包括一下幾個程序組:分子序列組,距離矩陣組,基因頻率組,離散字符組,進(jìn)化樹繪制組。

Phylip是目前最廣泛使用的系統(tǒng)發(fā)生分析程序,主要包括68Phylip軟件包分組介紹分子序列組:1.蛋白質(zhì)序列:protpars,proml,promlk,protdist2.核酸序列:dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacompPhylip軟件包分組介紹分子序列組:69距離矩陣組:Fitch,kitsch,neighbor基因頻率組:Gendist,contml離散字符組:Pars,mix,move,penny,dollop,dolmove,dolpenny,clique,factor進(jìn)化樹繪制組:drawtree,drawgram距離矩陣組:70Phylip軟件包的應(yīng)用1,根據(jù)你的分析數(shù)據(jù),選擇適當(dāng)?shù)某绦蛉?,你分析的是DNA數(shù)據(jù),就在核酸序列分析類中選擇程序(dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacomp)如果分析的是離散數(shù)據(jù),如突變位點數(shù)據(jù),就在離散字符組里面選擇程序。Phylip軟件包的應(yīng)用1,根據(jù)你的分析數(shù)據(jù),選擇適當(dāng)?shù)某绦?12.選擇適當(dāng)?shù)姆治龇椒ㄈ缒惴治龅氖荄NA數(shù)據(jù),可以選擇簡約法(DNAPARS),似然法(DNAML,DNAMLK),距離法等(DNADIST)3.進(jìn)行分析選擇好程序后,執(zhí)行,讀入分析數(shù)據(jù),選擇適當(dāng)?shù)膮?shù),進(jìn)行分析,結(jié)果自動保存為outfile,outtree。2.選擇適當(dāng)?shù)姆治龇椒?2Outfile是一個記錄文件,記錄了分析的過程和結(jié)果,可以直接用文本編輯器(如寫字板)打開。

Outtree是分析結(jié)果的樹文件,可以用phylip提供的繪樹程序打開查看,也可以用其他的程序來打開,如treeview。Outfile是一個記錄文件,記錄了分析的過程和結(jié)果,73PAUPPAUP是最著名的系統(tǒng)發(fā)育分析商業(yè)軟件。程序與平臺無關(guān)。PAUP使用一種稱為NEXUS的數(shù)據(jù)格式。

PAUP對系統(tǒng)進(jìn)化樹進(jìn)行重新排布時更加廣泛,對支長迭代的收斂標(biāo)準(zhǔn)更加嚴(yán)格,因此,所找到的系統(tǒng)進(jìn)化樹同PHYLIP的一樣好,或更好。PAUPPAUP是最著名的系統(tǒng)發(fā)育分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論