




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、一實驗項目名稱:核酸和蛋白質(zhì)序列數(shù)據(jù)的使用實驗?zāi)康模毫私獬S玫男蛄袛?shù)據(jù)庫,掌握基本的序列數(shù)據(jù)信息的查詢方法。教學基本要求:了解和熟悉NCBI核酸和蛋白質(zhì)序列數(shù)據(jù)庫,可以使用BLAST進行序列搜索,解讀BLAST搜索結(jié)果,可以對蛋白質(zhì)序列的結(jié)構(gòu)域搜索,解讀蛋白質(zhì)序列信息,可以在蛋白質(zhì)三維數(shù)據(jù)庫中查詢相關(guān)結(jié)構(gòu)信息并進行顯示。實驗內(nèi)容提要:在序列數(shù)據(jù)庫中查找某條基因序列(insulin),通過相關(guān)一系列數(shù)據(jù)庫的搜索、比對與結(jié)果解釋,回答以下問題:1. 該基因的基本功能?2. 編碼的蛋白質(zhì)序列是怎樣的?3. 該蛋白質(zhì)有沒有保守的功能結(jié)構(gòu)域 (NCBI CD-search)? 4. 該蛋白質(zhì)的功能是怎樣
2、的?5. 該蛋白質(zhì)的三級結(jié)構(gòu)是什么?如果沒有的話,和它最相似的同源物的結(jié)構(gòu)是什么樣子的?給出示意圖。實驗類型:綜合性必修或選修:必修使用的主要儀器:可以訪問國際互聯(lián)網(wǎng)的計算機。二實驗項目名稱:雙序列比對實驗?zāi)康模壕毩暿褂脛討B(tài)規(guī)劃算法進行雙序列比對;理解打分矩陣和參數(shù)對雙序列比對結(jié)果的影響;理解動態(tài)規(guī)劃算法的原理。教學基本要求:動態(tài)規(guī)劃算法是序列比對最基本的算法,可以確保找到最優(yōu)比對。分為全局比對(Needleman-Wunch algorithm)和局部比對算法(Smith-Waterman algorithm)。通過本實驗的練習,更好的理解動態(tài)規(guī)劃算法。實驗內(nèi)容提要:對如下的兩條序列進行雙序
3、列比對分析: Drosophila Sex-lethal proteinASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAFVDFTSEMDSQRAIKVLNG Mouse Huc RBDMDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGFVNYSDPNDADKAINTLNGL這些蛋白質(zhì)包含一個RNA識別模體(RNA Recognition Motif,RRM)。該模體包含兩個高度保守的兩個功能區(qū)RNP1和RNP2(已用紅色標記)。通過ebi網(wǎng)站的在線工具完成練習()。1. RNP1和RNP2是否得到
4、比對? 選擇至少三個(差別大的)空位罰分和延伸值來進行比對,2a. 算法是否找到RNP1和 RNP2的正確比對?b. 當空位開啟罰分高時,結(jié)果發(fā)生什么變化?c. 當空位延伸罰分高時,結(jié)果發(fā)生什么變化? d. 為什么k個連續(xù)的空位罰分要小于k個間隔的空位罰分?使用PAM250矩陣重復(fù)上述過程。3. 比對結(jié)果是否發(fā)生變化?繼續(xù)進行這兩條序列的局部比對,通過ebi網(wǎng)站的在線工具完成練習,網(wǎng)址:()4a. RNP1和RNP2是否在局部比對中得到比對?b. 局部比對的生物學意義是什么?c. 為什么在這種比對中我們選擇局部比對而不是全局比對? 采用不同的打分參數(shù)和其它打分矩陣。5. 比對結(jié)果發(fā)生了什么變化
5、? 實驗類型:綜合性必修或選修:必修使用的主要儀器:可以訪問國際互聯(lián)網(wǎng)的計算機。三實驗項目名稱:序列的點陣分析實驗?zāi)康模狐c陣分析是雙序列分析最直觀的工具,通過本實驗了解點陣分析的原理和方法。教學基本要求:了解和熟悉點陣分析的原理和參數(shù)對分析結(jié)果的影響,可以對結(jié)果進行解讀和解釋。實驗內(nèi)容提要:本實驗在如下網(wǎng)址完成:首先學習根據(jù)dotlet的在線教程,快速學習其基本使用方法和參數(shù)設(shè)置。然后進行如下的序列分析。回答問題:點陣分析的基本原理是什么?1. 重復(fù)序列通過點陣分析可以很容易的發(fā)現(xiàn)序列中的重復(fù),果蠅的一個蛋白質(zhì)(索引號碼:P24014)中具有幾個重復(fù)片段,請通過dotlet分析,找到這些序列重
6、復(fù)的片段。SLIT_DROME (P24014):MAAPSRTTLMPPPFRLQLRLLILPILLLLRHDAVHAEPYSGGFGSSAVSSGGLGSVGIHIPGGGVGVITEARCPRVCSCT GLNVDCSHRGLTSVPRKISADVERLELQGNNLTVIYETDFQRLTKLRMLQLTDNQIHTIERNSFQDLVSLERLDISNNVI TTVGRRVFKGAQSLRSLQLDNNQITCLDEHAFKGLVELEILTLNNNNLTSLPHNIFGGLGRLRALRLSDNPFACDCHLSW LSRFLRSATRLAPYTRCQSPSQLKGQNVADLH
7、DQEFKCSGLTEHAPMECGAENSCPHPCRCADGIVDCREKSLTSVPVTL PDDTTDVRLEQNFITELPPKSFSSFRRLRRIDLSNNNISRIAHDALSGLKQLTTLVLYGNKIKDLPSGVFKGLGSLRLLL LNANEISCIRKDAFRDLHSLSLLSLYDNNIQSLANGTFDAMKSMKTVHLAKNPFICDCNLRWLADYLHKNPIETSGARCE SPKRMHRRRIESLREEKFKCSWGELRMKLSGECRMDSDCPAMCHCEGTTVDCTGRRLKEIPRDIPLHTTELLLNDNELGR ISSDGLFG
8、RLPHLVKLELKRNQLTGIEPNAFEGASHIQELQLGENKIKEISNKMFLGLHQLKTLNLYDNQISCVMPGSFE HLNSLTSLNLASNPFNCNCHLAWFAECVRKKSLNGGAARCGAPSKVRDVQIKDLPHSEFKCSSENSEGCLGDGYCPPSCT CTGTVVACSRNQLKEIPRGIPAETSELYLESNEIEQIHYERIRHLRSLTRLDLSNNQITILSNYTFANLTKLSTLIISYN KLQCLQRHALSGLNNLRVVSLHGNRISMLPEGSFEDLKSLTHIALGSNPLYCDCGLKWFSDWIKL
9、DYVEPGIARCAEPEQ MKDKLILSTPSSSFVCRGRVRNDILAKCNACFEQPCQNQAQCVALPQREYQCLCQPGYHGKHCEFMIDACYGNPCRNNAT CTVLEEGRFSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFCSPEFNPCANGAK CMDHFTHYSCDCQAGFHGTNCTDNIDDCQNHMCQNGGTCVDGINDYQCRCPDDYTGKYCEGHNMISMMYPQTSPCQNHEC KHGVCFQPNAQGSDYLCRCHPGYTGKWCEYLTSISFVHNNS
10、FVELEPLRTRPEANVTIVFSSAEQNGILMYDGQDAHLAV ELFNGRIRVSYDVGNHPVSTMYSFEMVADGKYHAVELLAIKKNFTLRVDRGLARSIINEGSNDYLKLTTPMFLGGLPVDP AQQAYKNWQIRNLTSFKGCMKEVWINHKLVDFGNAQRQQKITPGCALLEGEQQEEEDDEQDFMDETPHIKEEPVDPCLEN KCRRGSRCVPNSNARDGYQCKCKHGQRGRYCDQGEGSTEPPTVTAASTCRKEQVREYYTENDCRSRQPLKYAKCVGGCGN QCCAAKIVRRRKVRMVC
11、SNNRKYIKNLDIVRKCGCTKKCY從uniprot或者genbank數(shù)據(jù)庫中的注釋信息進行進一步確認你所發(fā)現(xiàn)的結(jié)果。2. 低復(fù)雜度區(qū)域惡性瘧原蟲抗原蛋白前體(索引號碼:P69192)具有一段低復(fù)雜度區(qū)域的序列,通過點陣分析找到這個特點。SERA_PLAFG (P69192):MKSYISLFFILCVIFNKNVIKCTGESQTGNTGGGQAGNTVGDQAGSTGGSPQGSTGASQPGSSEPSNPVSSGHSVSTVSVSQTSTSSEKQDTIQVKSALLKDYMGLKVTGPCNENFIMFLVPHIYIDVDTEDTNIELRTTLKETNNAISFESNSGS
12、LEKKKYVKLPSNGTTGEQGSSTGTVRGDTEPISDSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSESLPANGPDSPTVKPPRNLQNICETGKNFKLVVYIKENTLIIKWKVYGETKDTTENNKVDVRKYLINEKETPFTSILIHAYKEHNGTNLIESKNYALGSDIPEKCDTLASNCFLSGNFNIEKCFQCALLVEKENKNDVCYKYLSEDIVSNFKEIKAETEDDDEDDYTEYKLTESIDNILVKMFKTNENNDKSELIKLEEVDDSLKLELMNYCSLLKDVDTTGTLDNYGMGN
13、EMDIFNNLKRLLIYHSEENINTLKNKFRNAAVCLKNVDDWIVNKRGLVLPELNYDLEYFNEHLYNDKNSPEDKDNKGKGVVHVDTTLEKEDTLSYDNSDNMFCNKEYCNRLKDENNCISNLQVEDQGNCDTSWIFASKYHLETIRCMKGYEPTKISALYVANCYKGEHKDRCDEGSSPMEFLQIIEDYGFLPAESNYPYNYVKVGEQCPKVEDHWMNLWDNGKILHNKNEPNSLDGKGYTAYESERFHDNMDAFVKIIKTEVMNKGSVIAYIKAENVMGYEFSGKKVQNLCGDDTADHAV
14、NIVGYGNYVNSEGEKKSYWIVRNSWGPYWGDEGYFKVDMYGPTHCHFNFIHSVVIFNVDLPMNNKTTKKESKIYDYYLKASPEFYHNLYFKNFNVGKKNLFSEKEDNENNKKLGNNYIIFGQDTAGSGQSGKESNTALESAGTSNEVSERVHVYHILKHIKDGKIRMGMRKYIDTQDVNKKHSCTRSYAFNPENYEKCVNLCNVNWKTCEEKTSPGLCLSKLDTNNECYFCYV四實驗項目名稱:多序列比對實驗?zāi)康模涸谛蛄蟹治鲋校嘈蛄斜葘哂袕V泛的應(yīng)用,是許多其他分析的基礎(chǔ)和前提,比如進化發(fā)生分析、構(gòu)建位置特異
15、性打分矩陣、找到一致序列等,本實驗的目的是熟悉多序列比對相關(guān)的操作和編輯方法。教學基本要求:了解和熟悉多序列比對的原理和基本方法。實驗內(nèi)容提要:1. 使用CLUSTALW 算法,比對一組蛋白質(zhì)序列,該序列屬于RAD51-RECA,在DNA的復(fù)制階段起重要作用,這些序列可以從NCBI genbank、Uniprot等序列服務(wù)器獲取,序列的索引號碼為:P25454,P25453,P0A7G6,P48295。將這些序列保存在一個文本文件。如果查詢到的序列不止一個的話,選擇第一個。P25454.1 Full=DNA repair protein RAD51MSQVQEQHISESQLQYGNGSLMS
16、TVPADLSQSVVDGNGNGSSEDIEATNGSGDGGGLQEQAEAQGEMEDEAYDEAALGSFVPIEKLQVNGITMADVKKLRESGLHTAEAVAYAPRKDLLEIKGISEAKADKLLNEAARLVPMGFVTAADFHMRRSELICLTTGSKNLDTLLGGGVETGSITELFGEFRTGKSQLCHTLAVTCQIPLDIGGGEGKCLYIDTEGTFRPVRLVSIAQRFGLDPDDALNNVAYARAYNADHQLRLLDAAAQMMSESRFSLIVVDSVMALYRTDFSGRGELSARQMHLAKFMRALQRLADQFGVAVVV
17、TNQVVAQVDGGMAFNPDPKKPIGGNIMAHSSTTRLGFKKGKGCQRLCKVVDSPCLPEAECVFAIYEDGVGDPREEDEP25453.1 Full=Meiotic recombination protein DMC1MSVTGTEIDSDTAKNILSVDELQNYGINASDLQKLKSGGIYTVNTVLSTTRRHLCKIKGLSEVKVEKIKEAAGKIIQVGFIPATVQLDIRQRVYSLSTGSKQLDSILGGGIMTMSITEVFGEFRCGKTQMSHTLCVTTQLPREMGGGEGKVAYIDTEGTFRPERIKQIAEGYELD
18、PESCLANVSYARALNSEHQMELVEQLGEELSSGDYRLIVVDSIMANFRVDYCGRGELSERQQKLNQHLFKLNRLAEEFNVAVFLTNQVQSDPGASALFASADGRKPIGGHVLAHASATRILLRKGRGDERVAKLQDSPDMPEKECVYVIGEKGITDSSDP0A7G6.2 Full=Protein RecA; AltName: Full=Recombinase AMAIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGRIVEIYGPESSGKTTLTLQVIAAAQR
19、EGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPDTGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAGNLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGSETRVKVVKNKIAAPFKQAEFQILYGEGINFYGELVDLGVKEKLIEKAGAWYSYKGEKIGQGKANATAWLKDNPETAKEIEKKVRELLLSNPNSTPDFSVDDSEGVAETNEDFP48295.2 Full=Protein RecA; AltNa
20、me: Full=Recombinase AMAGTDREKALDAALAQIERQFGKGAVMRMGDRTQEPIEVISTGSTALDIALGVGGLPRGRVVEIYGPESSGKTTLTLHAVANAQKAGGQVAFVDAEHALDPEYAKKLGVDIDNLILSQPDNGEQALEIVDMLVRSGALDLIVIDSVAALVPRAEIEGEMGDSHVGLQARLMSQALRKITSALNQSKTTAIFINQLREKIGVMFGSPETTTGGRALKFYASVRLDIRRIETLKDGTDAVGNRTRVKVVKNKVAPPFKQAEFDILYGQGISREGGLIDMG
21、VEHGFVRKAGAWYTYEGDQLGQGKENARNFLKDNPDLADEIERKIKEKLGVGVRPDAAKAEAATDAAAAADTAGTDDAAKSVPAPASKTAKATKATAVKSa. 練習使用EBI CLUSTALW();b. 將序列數(shù)據(jù)拷貝復(fù)制到窗口中;c. 采用默認參數(shù)進行比對;回答:clustalw算法的基本原理?2. 在BAliBASE網(wǎng)站查找一組蛋白質(zhì):1csy。這些蛋白質(zhì)的一致性為20-40%,屬于BAliBASE參考序列1。正確的比對結(jié)果網(wǎng)址如下:主要的比對信息截圖如下所示:注意:這里的比對是基于結(jié)構(gòu)信息的,所以是正確的。是序列的部分比對,為什么?這五條序列
22、的名稱和索引號碼如下:Sequence Name SWISSPROT Accession1csy P43405 1gri P29354(已被分為P62993和P62994,序列完全一致,任選一條即可。)1aya P35235 2pna P23727 1bfi P27986 sp|P43405|KSYK_HUMAN Tyrosine-protein kinase SYK OS=Homo sapiens GN=SYK PE=1 SV=1MASSGMADSANHLPFFFGNITREEAEDYLVQGGMSDGLYLLRQSRNYLGGFALSVAHGRKAHHYTIERELNGTYAIAGGRTH
23、ASPADLCHYHSQESDGLVCLLKKPFNRPQGVQPKTGPFEDLKENLIREYVKQTWNLQGQALEQAIISQKPQLEKLIATTAHEKMPWFHGKISREESEQIVLIGSKTNGKFLIRARDNNGSYALCLLHEGKVLHYRIDKDKTGKLSIPEGKKFDTLWQLVEHYSYKADGLLRVLTVPCQKIGTQGNVNFGGRPQLPGSHPATWSAGGIISRIKSYSFPKPGHRKSSPAQGNRQESTVSFNPYEPELAPWAADKGPQREALPMDTEVYESPYADPEEIRPKEVYLDRKLLTLEDKELGSGNF
24、GTVKKGYYQMKKVVKTVAVKILKNEANDPALKDELLAEANVMQQLDNPYIVRMIGICEAESWMLVMEMAELGPLNKYLQQNRHVKDKNIIELVHQVSMGMKYLEESNFVHRDLAARNVLLVTQHYAKISDFGLSKALRADENYYKAQTHGKWPVKWYAPECINYYKFSSKSDVWSFGVLMWEAFSYGQKPYRGMKGSEVTAMLEKGERMGCPAGCPREMYDLMNLCWTYDVENRPGFAAVELRLRNYYYDVVNsp|P62993|GRB2_HUMAN Growth factor receptor-bou
25、nd protein 2 OS=Homo sapiens GN=GRB2 PE=1 SV=1MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMKPHPWFFGKIPRAKAEEMLSKQRHDGAFLIRESESAPGDFSLSVKFGNDVQHFKVLRDGAGKYFLWVVKFNSLNELVDYHRSTSVSRNQQIFLRDIEQVPQQPTYVQALFDFDPQEDGELGFRRGDFIHVMDNSDPNWWKGACHGQTGMFPRNYVTPVNRNVsp|P62994|GRB2_RAT Growth factor rece
26、ptor-bound protein 2 OS=Rattus norvegicus GN=Grb2 PE=1 SV=1MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMKPHPWFFGKIPRAKAEEMLSKQRHDGAFLIRESESAPGDFSLSVKFGNDVQHFKVLRDGAGKYFLWVVKFNSLNELVDYHRSTSVSRNQQIFLRDIEQVPQQPTYVQALFDFDPQEDGELGFRRGDFIHVMDNSDPNWWKGACHGQTGMFPRNYVTPVNRNVsp|P35235|PTN11_MOUSE Ty
27、rosine-protein phosphatase non-receptor type 11 OS=Mus musculus GN=Ptpn11 PE=1 SV=2MTSRRWFHPNITGVEAENLLLTRGVDGSFLARPSKSNPGDFTLSVRRNGAVTHIKIQNTGDYYDLYGGEKFATLAELVQYYMEHHGQLKEKNGDVIELKYPLNCADPTSERWFHGHLSGKEAEKLLTEKGKHGSFLVRESQSHPGDFVLSVRTGDDKGESNDGKSKVTHVMIRCQELKYDVGGGERFDSLTDLVEHYKKNPMVETLGTVLQLKQPLN
28、TTRINAAEIESRVRELSKLAETTDKVKQGFWEEFETLQQQECKLLYSRKEGQRQENKNKNRYKNILPFDHTRVVLHDGDPNEPVSDYINANIIMPEFETKCNNSKPKKSYIATQGCLQNTVNDFWRMVFQENSRVIVMTTKEVERGKSKCVKYWPDEYALKEYGVMRVRNVKESAAHDYTLRELKLSKVGQALLQGNTERTVWQYHFRTWPDHGVPSDPGGVLDFLEEVHHKQESIVDAGPVVVHCSAGIGRTGTFIVIDILIDIIREKGVDCDIDVPKTIQMVRSQRSGMVQTEAQYRF
29、IYMAVQHYIETLQRRIEEEQKSKRKGHEYTNIKYSLVDQTSGDQSPLPPCTPTPPCAEMREDSARVYENVGLMQQQRSFRsp|P23727|P85A_BOVIN Phosphatidylinositol 3-kinase regulatory subunit alpha OS=Bos taurus GN=PIK3R1 PE=1 SV=1MSAEGYQYRALYDYKKEREEDIDLHLGDILTVNKGSLVALGFSDGQEAKPEEIGWLNGYNETTGERGDFPGTYVEYIGRKKISPPTPKPRPPRPLPVAPGPSKTEADSEQQ
30、ASTLPDLAEQFAPPDVAPPLLIKLVEAIEKKGLECSTLYRTQSSSNPAELRQLLDCDTASLDLEMFDVHVLADAFKRYLLDLPNPVIPVAVSSELISLAPEVQSSEEYIQLLKKLIRSPSIPHQYWLTLQYLLKHFFKLSQTSSKNLLNARVLSELFSPLLFRFPAASSENTEHLIKIIEILISTEWNERQPAPALPPKPPKPTTVANNGMNNNMSLQDAEWYWGDISREEVNEKLRDTADGTFLVRDASTKMHGDYTLTLRKGGNNKLIKIFHRDGKYGFSDPLTFNSVVELINHYRNE
31、SLAQYNPKLDVKLLYPVSKYQQDQVVKEDNIEAVGKKLHEYNTQFQEKSREYDRLYEDYTRTSQEIQMKRTAIEAFNETIKIFEEQCQTQERYSKEYIEKFKREGNETEIQRIMHNYEKLKSRISEIVDSRRRLEEDLKKQAAEYREIDKRMNSIKPDLIQLRKTRDQYLMWLTQKGVRQKKLNEWLGNENTEDQYSLVEDDEDLPHHDEKTWNVGSSNRNKAENLLRGKRDGTFLVRESSKQGCYACSVVVDGEVKHCVINKTATGYGFAEPYNLYSSLKELVLHYQHTSLVQHNDSLN
32、VTLAYPVYAQQRRsp|P27986|P85A_HUMAN Phosphatidylinositol 3-kinase regulatory subunit alpha OS=Homo sapiens GN=PIK3R1 PE=1 SV=2MSAEGYQYRALYDYKKEREEDIDLHLGDILTVNKGSLVALGFSDGQEARPEEIGWLNGYNETTGERGDFPGTYVEYIGRKKISPPTPKPRPPRPLPVAPGSSKTEADVEQQALTLPDLAEQFAPPDIAPPLLIKLVEAIEKKGLECSTLYRTQSSSNLAELRQLLDCDTPSVDLEM
33、IDVHVLADAFKRYLLDLPNPVIPAAVYSEMISLAPEVQSSEEYIQLLKKLIRSPSIPHQYWLTLQYLLKHFFKLSQTSSKNLLNARVLSEIFSPMLFRFSAASSDNTENLIKVIEILISTEWNERQPAPALPPKPPKPTTVANNGMNNNMSLQDAEWYWGDISREEVNEKLRDTADGTFLVRDASTKMHGDYTLTLRKGGNNKLIKIFHRDGKYGFSDPLTFSSVVELINHYRNESLAQYNPKLDVKLLYPVSKYQQDQVVKEDNIEAVGKKLHEYNTQFQEKSREYDRLYEEYTRTSQE
34、IQMKRTAIEAFNETIKIFEEQCQTQERYSKEYIEKFKREGNEKEIQRIMHNYDKLKSRISEIIDSRRRLEEDLKKQAAEYREIDKRMNSIKPDLIQLRKTRDQYLMWLTQKGVRQKKLNEWLGNENTEDQYSLVEDDEDLPHHDEKTWNVGSSNRNKAENLLRGKRDGTFLVRESSKQGCYACSVVVDGEVKHCVINKTATGYGFAEPYNLYSSLKELVLHYQHTSLVQHNDSLNVTLAYPVYAQQRR 從序列數(shù)據(jù)庫獲取這五條序列的fasta格式,放在一個文本文件中,選擇ebi網(wǎng)站上(/)的至少四個多序列
35、比對工具(如MAFFT、MUSCLE、CLUSTALW2、Clustal Omega、T-Coffee、DbClustal等)進行分析,將結(jié)果保存(Download Alignment File)。擴展名為.fasta?,F(xiàn)在用一個多序列比對軟件,比如bioedit、seaview或者jalview(下載安裝windows版本的比較快速)導(dǎo)入剛才保存的多序列比對結(jié)果文件(擴展名為.fasta的)。比較各個算法的比對結(jié)果(BAliBASE數(shù)據(jù)只是這些多序列比對的一部分,而我們得到的是這幾條序列全長上的比對),所以需要將不相關(guān)的列刪除掉或者用其它符號替代,或者也可以不作處理,找到相關(guān)部分就可以了。比
36、較多序列比對的結(jié)果,與BAliBASE上的相比,那個的結(jié)果更好些?你是如何評價結(jié)果的?3. 序列徽標序列徽標(sequence logo)是一個常用的直觀的多序列比對的圖示工具,對如下的一些序列,創(chuàng)建其序列徽標。網(wǎng)址:。dinD 32-52aactgtatataaatacagttdinG 15-35 tattggctgtttatacagtadinH 77-97tcctgttaatccatacagcadinI 19-39acctgtataaataaccagtalexA-1 28-48tgctgtatatactcacagcalexA-2 7-27aactgtatatacacccagggpolB(d
37、inA) 53-73gactgtataaaaccacagccrecA 59-79tactgtatgagcatacagtarecN-1 49-69tactgtatataaaaccagttrecN-2 27-47tactgtacacaataacagtarecN-3 9-29TCCTGTATGAAAAACCATTAruvAB 49-69cgctggatatctatccagcasosC 18-38tactgatgatatatacaggtsosD 14-34cactggatagataaccagcasulA 22-42tactgtacatccatacagtaumuDC 20-40tactgtatataaa
38、aacagtauvrA 83-103 tactgtatattcattcaggtuvrB 75-95aactgtttttttatccagtauvrD 57-77atctgtatatatacccagct將結(jié)果保存,簡單的解釋一下。sequence logo圖中包含的意義有什么?五實驗項目名稱:序列數(shù)據(jù)庫的搜索比對實驗?zāi)康模和ㄟ^該實驗理解BLAST和PSI-BLAST的基本原理。教學基本要求:可通過BLAST和PSI-BLAST進行數(shù)據(jù)庫的搜索比對,對結(jié)果進行恰當?shù)慕忉尅?衫肂LAST進行相關(guān)序列的檢索,利用PSI-BLAST進行遠相關(guān)序列的檢索。理解兩個工具的原理。實驗內(nèi)容提要:本實驗中,查詢下
39、面這條序列在細菌(bacterial)中的同源序列。gi|76828014|gb|BC107078.1| Homo sapiens G protein-coupled receptor, family C, group 5, member D, mRNA (cDNA clone MGC:129714 IMAGE:40027066), complete cds ATGTACAAGGACTGCATCGAGTCCACTGGAGACTATTTTCTTCTCTGTGACGCCGAGGGGCCATGGGGCATCATTCTGGAGTCCCTGGCCATACTTGGCATCGTGGTCACAATTCTGCT
40、ACTCTTAGCATTTCTCTTCCTCATGCGAAAGATCCAAGACTGCAGCCAGTGGAATGTCCTCCCCACCCAGCTCCTCTTCCTCCTGAGTGTCCTGGGGCTCTTCGGACTCGCTTTTGCCTTCATCATCGAGCTCAATCAACAAACTGCCCCCGTACGCTACTTTCTCTTTGGGGTTCTCTTTGCTCTCTGTTTCTCATGCCTCTTAGCTCATGCCTCCAATCTAGTGAAGCTGGTTCGGGGTTGTGTCTCCTTCTCCTGGACGACAATTCTGTGCATTGCTATTGGTTGCAGTCTGTTGCA
41、AATCATTATTGCCACTGAGTATGTGACTCTCATCATGACCAGAGGTATGATGTTTGTGAATATGACACCCTGCCAGCTCAATGTGGACTTTGTTGTACTCCTGGTCTATGTCCTCTTCCTGATGGCCCTCACATTCTTCGTCTCCAAAGCCACCTTCTGTGGCCCGTGTGAGAACTGGAAGCAGCATGGAAGGCTCATCTTTATCACTGTGCTCTTCTCCATCATCATCTGGGTGGTGTGGATCTCCATGCTCCTGAGAGGCAACCCGCAGTTCCAGCGACAGCCCCAGTGGGACGACCC
42、GGTCGTCTGCATTGCTCTGGTCACCAACGCATGGGTTTTCCTGCTGCTGTACATCGTCCCTGAGCTCTGCATTCTCTACAGATCGTGTAGACAGGAGTGCCCTTTACAAGGCAATGCCTGCCCCGTCACAGCCTACCAACACAGCTTCCAAGTGGAGAACCAGGAGCTCTCCAGAGCCCGAGACAGTGATGGAGCTGAGGAGGATGTAGCATTAACTTCATATGGTACTCCCATTCAGCCGCAGACTGTTGATCCCACACAAGAGTGTTTCATCCCACAGGCTAAACTAAGCCCCCAGCA
43、AGATGCAGGAGGAGTATAA1a. 在NCBI中采用blastn程序,搜索上述序列,將物種限制在“Bacteria”,其它參數(shù)默認,得到幾個結(jié)果命中?E值小于0.1的有幾條?1b. 為了擴大搜索,可以對參數(shù)進行調(diào)整,將BLASTN的word size換為7,其它同上次,得到幾個命中?E值小于0.1的有幾條?1c. 選擇BLASTX,將物種限制在“Bacteria”,其它參數(shù)默認,得到幾個結(jié)果命中?E值小于0.1的有幾條?1d. 在BLASTX中,將word size調(diào)整為2,選擇BLOSUM45打分矩陣,Gap Existence 10,Gap Extension 3,將物種限制在“
44、Bacteria”,其它參數(shù)默認,得到幾個結(jié)果命中?E值小于0.1的有幾條?2. 如下序列是剛才所檢索的核酸序列對應(yīng)的蛋白質(zhì)序列:gi|76828015|gb|AAI07079.1| G protein-coupled receptor, family C, group 5, member D Homo sapiens MYKDCIESTGDYFLLCDAEGPWGIILESLAILGIVVTILLLLAFLFLMRKIQDCSQWNVLPTQLLFLLSVLGLFGLAFAFIIELNQQTAPVRYFLFGVLFALCFSCLLAHASNLVKLVRGCVSFSWTTILCIAIGCSLL
45、QIIIATEYVTLIMTRGMMFVNMTPCQLNVDFVVLLVYVLFLMALTFFVSKATFCGPCENWKQHGRLIFITVLFSIIIWVVWISMLLRGNPQFQRQPQWDDPVVCIALVTNAWVFLLLYIVPELCILYRSCRQECPLQGNACPVTAYQHSFQVENQELSRARDSDGAEEDVALTSYGTPIQPQTVDPTQECFIPQAKLSPQQDAGGV2a. 利用著條序列進行PSI-BLAST檢索,第一輪PSI-BLAST的參數(shù)與上述最后一次的BLASTX參數(shù)一致,即word size調(diào)整為2,選擇BLOSUM45打分矩陣,Gap Existence 10,Gap Extension 3,將物種限制在“Bacteria”,得到幾個匹配?E值小于0.1的有幾條?2b. 選擇E值小于2的序列進行下一步的PSI-BLAST迭代。得到幾個匹配?E值小于0.1的有幾條?2c. 大多數(shù)你所發(fā)現(xiàn)的蛋白質(zhì)都具有相同的功能,是什么功能?如何進一步確定你的查詢序列與結(jié)果中的序列相關(guān)?實驗類型:綜合性必修或選修:必修使用的主要儀器:可以訪問國際互聯(lián)網(wǎng)的計算機。六. 實驗項目名稱:HIV病毒的進化分析實驗?zāi)康模毫私夂蛯W習系統(tǒng)發(fā)生分析的步驟和基本方法。教學
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 零售企業(yè)數(shù)字化供應(yīng)鏈協(xié)同中的供應(yīng)鏈可視化技術(shù)應(yīng)用報告
- 鄉(xiāng)村振興中的職業(yè)技能培訓:鄉(xiāng)村旅游人才培養(yǎng)報告
- 2025年醫(yī)院信息化建設(shè)與醫(yī)患溝通平臺初步設(shè)計評估報告
- 2025年餐飲業(yè)食品安全監(jiān)管信息化技術(shù)應(yīng)用與餐飲企業(yè)食品安全風險預(yù)警體系建設(shè)報告
- 2025年醫(yī)藥企業(yè)研發(fā)外包(CRO)在臨床試驗數(shù)據(jù)隱私保護中的法律法規(guī)報告001
- 周籃嫂的課件
- 2025年CCS項目在能源領(lǐng)域應(yīng)用的經(jīng)濟效益與投資決策支持研究報告
- 5G+AI融合的2025年科技互聯(lián)網(wǎng)產(chǎn)業(yè)創(chuàng)新生態(tài)構(gòu)建報告
- 環(huán)保產(chǎn)業(yè)園2025年循環(huán)經(jīng)濟發(fā)展模式中的綠色供應(yīng)鏈管理與創(chuàng)新研究報告
- 2025年醫(yī)院電子病歷系統(tǒng)優(yōu)化構(gòu)建醫(yī)療信息化大數(shù)據(jù)平臺報告
- 五年級英語質(zhì)量調(diào)研卷答題卡
- 二年級下冊語文試題 河南省商丘市永城市 第二學期二年級語文期末試題(圖片版無答案)部編版
- 工業(yè)機器人技術(shù)與智能制造
- 建筑工程聯(lián)營合作協(xié)議(合同)
- 利樂灌裝保養(yǎng)執(zhí)行
- 法人委托書范本
- 最新版焊接工藝評定格式標準
- 【圖文】泵用密封沖洗方案演示圖
- 新世紀大學英語綜合教程4 Unit1
- 振型中的節(jié)點,節(jié)線,節(jié)徑和節(jié)圓
- 虹鱒魚養(yǎng)殖項目可行性研究報告寫作范文
評論
0/150
提交評論