




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
生物序列的相像性搜尋
-blast簡介及其應(yīng)用2生物序列的相像性相像性(similarity):是指一種很干脆的數(shù)量關(guān)系,比如部分相同或相像的百分比或其它一些合適的度量。比如說,A序列和B序列的相像性是80%,或者4/5。這是個量化的關(guān)系。當(dāng)然可進(jìn)行自身局部比較。3同源性(homology):指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具而共同祖先的結(jié)論,屬于質(zhì)的推斷。就是說A和B的關(guān)系上,只有是同源序列,或者非同源序列兩種關(guān)系。而說A和B的同源性為80%都是不科學(xué)的。生物序列的同源性4相像性和同源性關(guān)系序列的相像性和序列的同源性有確定的關(guān)系,一般來說序列間的相像性越高的話,它們是同源序列的可能性就更高,所以常??梢酝ㄟ^序列的相像性來推想序列是否同源。正因為存在這樣的關(guān)系,很多時候?qū)π蛄械南嘞裥院屯葱跃蜎]有做很明顯的區(qū)分,造成常常等價混用兩個名詞。所以有出現(xiàn)A序列和B序列的同源性為80%一說。5數(shù)據(jù)庫搜尋目的確定特定的蛋白質(zhì)或核酸序列有哪些已知的直系同源或旁系同源序列。確定哪些蛋白質(zhì)和基因在特定的物種中出現(xiàn)。確定一個DNA或蛋白質(zhì)序列身份。發(fā)覺新基因。找尋對于一個蛋白質(zhì)的功能或結(jié)構(gòu)起關(guān)鍵作用的氨基酸殘基。6Blast簡介(一)BLAST是由美國國立生物技術(shù)信息中心(NCBI)開發(fā)的一個基于序列相像性的數(shù)據(jù)庫搜尋程序。BLAST是“局部相像性基本查詢工具”(BasicLocalAlignmentSearchTool)的縮寫。7Blast是一個序列相像性搜尋的程序包,其中包含了很多個獨(dú)立的程序,這些程序是依據(jù)查詢的對象和數(shù)據(jù)庫的不同來定義的。比如說查詢的序列為核酸,查詢數(shù)據(jù)庫亦為核酸序列數(shù)據(jù)庫,那么就應(yīng)當(dāng)選擇blastn程序。下表列出了主要的blast程序。Blast簡介(二)8程序名查詢序列數(shù)據(jù)庫搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)庫中的序列Blastp蛋白質(zhì)蛋白質(zhì)蛋白質(zhì)序列搜索逐一蛋白質(zhì)數(shù)據(jù)庫中的序列Blastx核酸蛋白質(zhì)核酸序列翻譯成蛋白質(zhì)序列后和蛋白質(zhì)數(shù)據(jù)庫中的序列逐一搜索。Tblastn蛋白質(zhì)核酸蛋白質(zhì)序列和核酸數(shù)據(jù)庫中的核酸序列翻譯后的蛋白質(zhì)序列逐一比對。TBlastx核酸核酸核酸序列翻譯成蛋白質(zhì)序列,再和核酸數(shù)據(jù)庫中的核酸序列翻譯成的蛋白質(zhì)序列逐一進(jìn)行比對。9Program
Input
Database
blastp將一個蛋白質(zhì)查詢序列與一個蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比較blastpproteinprotein1blastn將一個DNA查詢序列的兩條鏈與一個DNA數(shù)據(jù)庫進(jìn)行比較blastnDNADNA1blastx將一個DNA序列用所有可能的閱讀框翻譯成6個蛋白質(zhì),然后將它們逐一與一個蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比較blastxDNAprotein6tblastn將一個DNA數(shù)據(jù)庫中的每一條序列翻譯成6種可能的蛋白質(zhì),然后將要查詢的蛋白序列與翻譯的蛋白質(zhì)逐一進(jìn)行比較tblastnDNAprotein6tblastx將查詢DNA以及數(shù)據(jù)庫中的DNA都翻譯成6種可能的蛋白質(zhì),然后進(jìn)行36次蛋白質(zhì)-蛋白質(zhì)數(shù)據(jù)庫搜索tblastxDNADNA361011Blast程序評價序列相像性的兩個數(shù)據(jù)Score:運(yùn)用打分矩陣對匹配的片段進(jìn)行打分,這是對各對氨基酸殘基(或堿基)打分求和的結(jié)果,一般來說,匹配片段越長、相像性越高則Score值越大。Evalue:在相同長度的狀況下,兩個氨基酸殘基(或堿基)隨機(jī)排列的序列進(jìn)行打分,得到上述Score值的概率的大小。E值越小表示隨機(jī)狀況下得到該Score值的可能性越低。12NCBI供應(yīng)的Blast服務(wù)登陸ncbi的blast主頁核酸序列蛋白序列翻譯序列底下有其他一些針對特殊數(shù)據(jù)庫的和查看以往的比對結(jié)果等13Blast任務(wù)提交表單(一)1.序列信息部分填入查詢(query)的序列序列范圍(默認(rèn)全部)選擇搜尋數(shù)據(jù)庫假如接受其他參數(shù)默認(rèn)設(shè)置,點(diǎn)擊起先搜尋14Blast任務(wù)提交表單(二)設(shè)置搜尋的范圍,entrez關(guān)鍵詞,或者選擇特定物種2.設(shè)置各種參數(shù)部分一些過濾選項,包括簡潔重復(fù)序列,人類基因組中的重復(fù)序列等E值上限窗口大小假如你對blast的叮囑行選項熟悉的話,可以在這里加入更多的參數(shù)15Blast任務(wù)提交表單(三)3.設(shè)置結(jié)果輸出顯示格式選擇須要顯示的選項以及顯示的文件格式顯示數(shù)目Alignment的顯示方式篩選結(jié)果E值范圍其他一些顯示格式參數(shù)點(diǎn)擊起先搜尋16提交任務(wù)返回查詢號(requestid)可以修改顯示結(jié)果格式修改完顯示格式后點(diǎn)擊進(jìn)入結(jié)果界面17結(jié)果頁面(一)圖形示意結(jié)果18結(jié)果頁面(二)目標(biāo)序列描述部分帶有g(shù)enbank的鏈接,點(diǎn)擊可以進(jìn)入相應(yīng)的genbank序列匹配狀況,分值,e值19結(jié)果頁面(三)具體的比對上的序列的排列狀況查詢序列和目標(biāo)序列之間的字母表示兩個氨基酸相同,加號+表示兩個氨基酸相像??瞻妆硎炯炔幌嗤膊幌嘞瘛?0一個具體的例子(blastp)假設(shè)以下為一未知蛋白序列>query_seqMSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA我們通過blast搜尋來獲得一些這個序列的信息。21具體步驟1.登陸blast主頁:///BLAST/2.依據(jù)數(shù)據(jù)類型,選擇合適的程序3.填寫表單信息4.提交任務(wù)5.查看和分析結(jié)果22分析過程(一)1.登陸ncbi的blast主頁2.選擇程序,因為查詢序列是蛋白序列可以選擇blastp,點(diǎn)擊進(jìn)入也可以選擇tblastn作為演示,我們這里選blastp23分析過程(二)3.填入序列(copy+paste)Fasta格式,或者純序列4.選擇搜尋區(qū)域,這里我們要搜尋整個序列,不填5.選擇搜尋數(shù)據(jù)庫,這里我們選nr(非冗余的蛋白序列庫)。是否搜尋保守區(qū)域數(shù)據(jù)庫(cdd),蛋白序列搜尋才有。我們選上24分析過程(三)6.限制條件,我們限制在病毒里面找。7.其他選項保持默認(rèn)值打分矩陣25分析過程(四)8.輸出格式選項保持默認(rèn)值9.點(diǎn)擊起先搜尋26分析過程(五)10.查詢序列的一些相關(guān)信息在cdd庫里面找到兩個保守區(qū)域,點(diǎn)擊可以進(jìn)入27分析過程(六)圖形結(jié)果28分析過程(七)匹配序列列表29序列同源性的推斷方法:
搜尋結(jié)果是否顯著查看E值列表,是否顯著.假如是核酸序列,E≤10-6為顯著;假如是蛋白質(zhì)序列,E≤10-3為顯著查看同一性分值假如是核酸序列,Identity≥70%為顯著;假如是蛋白質(zhì)序列,Identity≥25%為顯著兩個蛋白是否具有近似的大小30兩個蛋白是否有共同的模體或信號序列.兩個蛋白質(zhì)是不是一個合理的多序列比對的一部分兩個蛋白質(zhì)是否共有一個相像的生物學(xué)功能.兩個蛋白質(zhì)是否具有相像的三維結(jié)構(gòu).PSI-BLAST搜尋31BLAST搜尋策略調(diào)整搜尋結(jié)果過多狀況加Entrez限制條件利用序列的一部分進(jìn)行搜尋調(diào)整記分矩陣調(diào)整期望值搜尋結(jié)果過少狀況去掉Entrez限制提高期望值運(yùn)用更高PAM值或更低BLOSUM值的記分矩陣高級BLAST搜尋32進(jìn)一步深化Blast1.blast22.Megablast3.Psi-blast4.PHI-blast5.其他(rpsblast,blastclust等)33Blast2兩個序列的blast比對,給定兩個序列,相互進(jìn)行blast比對。能快速檢查兩個序列是否存在相像性片斷或者是否一樣。這比起全序列比對要快很多。34Megablastmegablast接受了貪欲算法(greedyalgorithm),它連接了多個查詢序列進(jìn)行一次搜尋比對,這樣節(jié)約了很多搜尋數(shù)據(jù)庫的時間。主要針對核酸序列。是blast經(jīng)過優(yōu)化后,適用于由于測序或者其他緣由形成的略微的差別的序列之間的比較,比一般的相像性搜尋程序要快10倍,可以很快的完成兩組大數(shù)據(jù)的比對。35PSI-blastPositionspecificiterativeBLAST(PSI-BLAST)位點(diǎn)特異的迭代blast搜尋,主要針對蛋白序列。第一次blast搜尋后,結(jié)果中最相像的序列重新構(gòu)建PSSM(位點(diǎn)特異性打分矩陣),然后再運(yùn)用該矩陣進(jìn)行其次輪blast搜尋,再調(diào)整矩陣,搜尋,如此迭代。最終高度保守的區(qū)域就會得到比較高的分值,而不保守的區(qū)域則分?jǐn)?shù)降低,趨近0。這樣可以提高blast搜尋的靈敏度,有助于找尋遠(yuǎn)源相關(guān)的蛋白。36PHI-BLAST模式識別BLAST(PatternhitintiatedBLAST)PHI-BLAST能找到與查詢序列相
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司借款合同書集錦
- 勞動合同法第四條
- 國際貿(mào)易貨物買賣合同
- 交通安全統(tǒng)籌服務(wù)合同
- 醫(yī)院聘用醫(yī)師協(xié)議書
- 2025年漯河貨運(yùn)資格證考試答案
- 借貸擔(dān)保合同協(xié)議5篇
- 農(nóng)場整體出租合同范本
- 買賣礦居間合同范本
- 農(nóng)村豬種出售合同范本
- 供應(yīng)商開發(fā)流程及質(zhì)量要求
- 2024年技術(shù)監(jiān)督質(zhì)檢職業(yè)技能考試-電力技術(shù)監(jiān)督上崗員(中國華能)筆試歷年真題薈萃含答案
- 反假幣測試附有答案
- 怎樣調(diào)動員工積極性
- 2024年內(nèi)科護(hù)理學(xué)(第七版)期末考試復(fù)習(xí)題庫(含答案)
- 【上市公司的財務(wù)風(fēng)險的分析和防范:以三只松鼠為例10000字(論文)】
- 急診科培訓(xùn)急診科與其他科室的協(xié)作與溝通
- JCT414-2017 硅藻土的標(biāo)準(zhǔn)
- 肌肉注射評分標(biāo)準(zhǔn)
- 鋼結(jié)構(gòu)主要技術(shù)標(biāo)準(zhǔn)和要求
- 臘八粥 第一課時自學(xué)導(dǎo)學(xué)單
評論
0/150
提交評論