版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、Liaoning University Bioinformatics 生物信息學(xué)生物信息學(xué)Life Science SchoolHongsheng Liu Prof.Liaoning University Bioinformatics 第第三三章:章:序列比對序列比對Liaoning University Bioinformatics 序列比對的基本概念序列比對的基本概念 打分矩陣打分矩陣 序列比對算法序列比對算法 序列序列比對軟件使用方法介紹比對軟件使用方法介紹Liaoning University Bioinformatics 序列比對軟件使用方法介紹序列比對軟件使用方法介紹Liaonin
2、g University Bioinformatics 一致性:一致性指兩個序列相同的程度。保守性:某一氨基酸殘基或序列的改變(突變)保持了原始氨基酸殘基的物理化學(xué)特征,那么這個突變就是保守的。相似性:相似性表示序列之間相關(guān)聯(lián)的程度。與一致性比較相似性進一步考慮了發(fā)生保守突變的氨基酸的數(shù)目,即考慮了相似氨基酸的數(shù)目。同源性:如果兩個序列是來源于一個共同的祖先,那么他們是同源的。內(nèi)容回顧內(nèi)容回顧Liaoning University Bioinformatics l匹配:匹配:豎線(豎線(| |)l相似:相似:雙點(雙點(: :)l較弱的相似:較弱的相似:單點(單點(. .)l空位:空位:短橫線
3、(短橫線(- -)l不相似的替換:不相似的替換:空白空白序列比對結(jié)果的表示方法Liaoning University Bioinformatics 兩序列進行比對,通常使一個得分矩陣(兩序列進行比對,通常使一個得分矩陣(scoring scoring matixmatix)來計算比對的分值,以得到一個評價優(yōu)劣的)來計算比對的分值,以得到一個評價優(yōu)劣的標(biāo)準(zhǔn)。標(biāo)準(zhǔn)。 核酸的得分矩陣:核酸的得分矩陣:等價矩陣、等價矩陣、BLASTBLAST矩陣矩陣 蛋白質(zhì)的得分矩陣:蛋白質(zhì)的得分矩陣:等價矩陣、等價矩陣、PAMPAM矩陣、矩陣、BLUSOMBLUSOM矩矩陣陣 存在空位(存在空位(GapGap)是要
4、進行空位罰分()是要進行空位罰分(Gap penaltyGap penalty)Liaoning University Bioinformatics 序列比對常用軟件使用方法序列比對常用軟件使用方法l點陣法:點陣法:http:/myhits.isb-sib.ch/cgi-bin/dotlethttp:/myhits.isb-sib.ch/cgi-bin/dotletl動態(tài)規(guī)劃算法動態(tài)規(guī)劃算法: : 全局序列比對:全局序列比對:Needleman-WunschNeedleman-Wunsch算法算法http:/www.ebi.ac.uk/Tools/psa/emboss_needle/http:
5、/www.ebi.ac.uk/Tools/psa/emboss_needle/局部局部序列比對序列比對:Smith-Waterman算法算法http:/www.ebi.ac.uk/Tools/psa/emboss_water/http:/www.ebi.ac.uk/Tools/psa/emboss_water/雙序列比對常用軟件雙序列比對常用軟件Liaoning University Bioinformatics l全局比對:全局比對:對序列從頭到尾進行比較。試圖使盡可能對序列從頭到尾進行比較。試圖使盡可能多的字符在同一序列中匹配。全局比對適用于相似度多的字符在同一序列中匹配。全局比對適用于相
6、似度較高而長度相近的序列。較高而長度相近的序列。例子例子1 1:使用:使用Needleman-WunschNeedleman-Wunsch算法對人算法對人RBP4RBP4蛋白和小鼠蛋白和小鼠RBP4RBP4蛋白進行全局比對蛋白進行全局比對 首先在UNIPROT數(shù)據(jù)庫( /)中下載人RBP4蛋白(P02753)和小鼠RBP4蛋白(Q00724)的氨基酸序列 然后打開Needleman-Wunsch算法程序(Needle)的在線服務(wù)器網(wǎng)址 把人RBP4序列和小鼠RBP4序列分別粘貼到兩個文本框中 如果需要可以調(diào)整比對的參數(shù),如:得分矩陣,空位罰分等 然后提
7、交具體步驟:具體步驟:Liaoning University Bioinformatics 粘貼序列粘貼序列粘貼序列粘貼序列修改參數(shù)修改參數(shù)提交提交Liaoning University Bioinformatics 人人RBP4RBP4蛋白和小鼠蛋白和小鼠RBP4RBP4全局序列比對全局序列比對結(jié)果結(jié)果一致性一致性相似性相似性空位空位得分得分序列比對結(jié)果序列比對結(jié)果Liaoning University Bioinformatics l局部比對:局部比對:尋找序列中相似度最高的區(qū)域,也就是匹尋找序列中相似度最高的區(qū)域,也就是匹配密度最高的部分。局部比對適用于某些部位相似度配密度最高的部分。局
8、部比對適用于某些部位相似度較高,而其他部位差異較大的序列。較高,而其他部位差異較大的序列。例子例子2 2:使用:使用Smith-WatermanSmith-Waterman算法對人算法對人RBP4RBP4蛋白和人蛋白和人lipocalin1lipocalin1蛋白進行局部比對蛋白進行局部比對 首先在UNIPROT數(shù)據(jù)庫中下載人RBP4蛋白(P02753)和人lipocalin1蛋白(P31025)的氨基酸序列 然后打開Smith-Waterman算法程序(Water)的在線服務(wù)器網(wǎng)址 把人RBP4序列和人lipocalin1蛋白序列分別粘貼到兩個文本框中 如果需要可以調(diào)整比對的參數(shù),如:得分矩
9、陣,空位罰分等 然后提交具體步驟:具體步驟:Liaoning University Bioinformatics 人人RBP4RBP4蛋白和人蛋白和人lipocalin1lipocalin1蛋白局蛋白局部比對結(jié)果部比對結(jié)果比對不是從第一個氨基酸比對不是從第一個氨基酸開始的,也不是到最后一開始的,也不是到最后一個氨基酸結(jié)束,而是找出個氨基酸結(jié)束,而是找出了相似性最高的一部分了相似性最高的一部分(局部比對)(局部比對)全局比對結(jié)果全局比對結(jié)果Liaoning University Bioinformatics 多序列比對,實際上是一組蛋白質(zhì)之間的一系列的雙序列比對。與雙序列比對相比,多序列比對更能
10、發(fā)現(xiàn)進化保守關(guān)系信息。在雙序列比對中出現(xiàn)的相同的氨基酸殘基,雖然在兩條序列上是保守的,但這種保守可能只是偶然的。而如果某一位點在多序列比對的都出現(xiàn)了相同的氨基酸殘基,則說明該殘基是進化保守的可能性更大。多序列比對多序列比對Liaoning University Bioinformatics 序列分別為雞、小鼠、序列分別為雞、小鼠、人、豬和牛的人、豬和牛的RBP4蛋白蛋白使用了使用了Clustal Omega軟件軟件通過多序列比對可以發(fā)通過多序列比對可以發(fā)現(xiàn)現(xiàn)RBP4蛋白中的大部分蛋白中的大部分氨基酸殘基在多個哺乳氨基酸殘基在多個哺乳動物中都保守。動物中都保守。Liaoning Universi
11、ty Bioinformatics 序列分別為人的載脂蛋序列分別為人的載脂蛋白白D,人視黃醇結(jié)合蛋白,人視黃醇結(jié)合蛋白4,孕激素相關(guān)子宮內(nèi)膜,孕激素相關(guān)子宮內(nèi)膜蛋白,補體蛋白,補體8(肽),肽),lipocalin1,人氣味結(jié)合,人氣味結(jié)合蛋白蛋白2A, -1微球蛋白,微球蛋白,嗜中性明膠酶相關(guān)蛋白,嗜中性明膠酶相關(guān)蛋白,前列腺素前列腺素D2合成酶合成酶通過多序列比對可以發(fā)通過多序列比對可以發(fā)現(xiàn)人這些旁系同源物序現(xiàn)人這些旁系同源物序列高度趨異,互相之間列高度趨異,互相之間的相似度并不高。的相似度并不高。但都存在一個保守的模但都存在一個保守的模體:體:GXW,即甘氨酸,即甘氨酸-任任意氨基酸意氨
12、基酸-色氨酸。色氨酸。GXW保守保守模體模體Liaoning University Bioinformatics Clustal OmegaClustal Omegahttp:/www.ebi.ac.uk/Tools/msa/clustalo/http:/www.ebi.ac.uk/Tools/msa/clustalo/MUSCLEMUSCLEhttp:/www.ebi.ac.uk/Tools/msa/muscle/http:/www.ebi.ac.uk/Tools/msa/muscle/CLUSTAL XCLUSTAL X/clustal2/http
13、://clustal2/(下載網(wǎng)站)(下載網(wǎng)站)MEGAMEGA(分子發(fā)育分析綜合軟件,集成了(分子發(fā)育分析綜合軟件,集成了ClustalWClustalW和和MUSCLEMUSCLE)http:/ (下載網(wǎng)站)(下載網(wǎng)站)多序列比對常用軟件多序列比對常用軟件Liaoning University Bioinformatics 例子例子3 3:使用:使用Clustal OmegaClustal Omega比對人比對人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋蛋白,雞白,雞RBP4RBP4蛋白,豬蛋白,豬RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋
14、白的氨基酸序列蛋白的氨基酸序列 首先在UNIPROT數(shù)據(jù)庫中下載人RBP4蛋白(P02753),小鼠RBP4蛋白(Q00724),雞RBP4蛋白(P41263),豬RBP4蛋白(P27485),牛RBP4蛋白(P18902)的氨基酸序列 然后打開Clustal Omega的在線服務(wù)器網(wǎng)址 把所有蛋白序列粘貼到文本框中,也可以直接上傳FASTA文件 然后提交具體步驟:具體步驟:Liaoning University Bioinformatics 多序列比對結(jié)果多序列比對結(jié)果ALNALN格式,參照格式,參照第三節(jié)課第三節(jié)課PPTPPT中中介紹介紹Liaoning University Bioinf
15、ormatics 例子例子4 4:使用:使用ClstalXClstalX比對人比對人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋白,雞蛋白,雞RBP4RBP4蛋白,豬蛋白,豬RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋白的氨基酸序列蛋白的氨基酸序列 打開ClustalX后,點擊File Load Sequences,加載包含上述蛋白序列的FASTA文件 然后點擊Alignment Do complete alignment,選擇好比對結(jié)果文件的文件夾,進行序列比對具體步驟:具體步驟:lClustalX是需要安裝的軟件,需要先下載,安裝之后才能使用。Liaoning Univer
16、sity Bioinformatics Liaoning University Bioinformatics 例子例子5 5:使用:使用MEGAMEGA中的中的ClustalWClustalW比對人比對人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋白,雞蛋白,雞RBP4RBP4蛋白,豬蛋白,豬RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋白的氨基酸序蛋白的氨基酸序列列 打開MEGA后,點擊Align Edit/Built Alignment Create New Alignment Protein,出現(xiàn)序列編輯的界面 可以將蛋白質(zhì)序列粘貼進去,也可以通過菜單欄Data Open
17、Retrieve Sequences from File,加載包含上述蛋白序列的FASTA文件 然后點擊W按鈕或通過菜單欄Alignment Alignment by Clustal 出現(xiàn)參數(shù)頁面,可以調(diào)整參數(shù),一般都使用默認(rèn)參數(shù),點擊OK進行序列比對具體步驟:具體步驟:lMEGA也需要安裝之后才能使用。Liaoning University Bioinformatics Liaoning University Bioinformatics Liaoning University Bioinformatics Clustal WLiaoning University Bioinformatics ClustalW的參數(shù)設(shè)置頁面,一般的參數(shù)設(shè)置頁面,一般情況下使用默認(rèn)參數(shù)情況下使用默認(rèn)參數(shù)Liaoning University Bioinformatics Liaoning University Bioinformatics 課堂練習(xí)題課堂練習(xí)題練習(xí)課件中的例子1-5使用Clast
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑工程內(nèi)部經(jīng)濟承包合同書
- 鄉(xiāng)村公路施工合同
- 二中教學(xué)區(qū)消防安全制度(2篇)
- 三年教育質(zhì)量提升方案例文(二篇)
- 精神科醫(yī)療工作制度(3篇)
- 2025年有關(guān)我的理想演講稿模版(2篇)
- 打拔鋼板樁安全技術(shù)規(guī)定范文(2篇)
- 客運隱患排查實施方案例文(5篇)
- 水質(zhì)化驗員安全職責(zé)(3篇)
- 小記者站工作方案(6篇)
- 八大危險作業(yè)檢查表
- 工程項目管理(三控三管一協(xié)調(diào))
- 初三家長會語文教師發(fā)言
- 游戲機策劃方案
- 2024消防安全基礎(chǔ)知識培訓(xùn)課件
- 《小兒留置導(dǎo)尿管》課件
- 粵教版科學(xué)四年級上冊全冊試卷(含答案)
- 宮腔鏡診治規(guī)范
- 安全管理計劃指標(biāo)和指標(biāo)體系
- 倉庫物料盤點作業(yè)規(guī)范培訓(xùn)課件
- 六年級《牽手兩代-第二講-乖孩子為什么會厭學(xué)》家長課程培訓(xùn)
評論
0/150
提交評論