《資料格式》課件_第1頁
《資料格式》課件_第2頁
《資料格式》課件_第3頁
《資料格式》課件_第4頁
《資料格式》課件_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Sequenceanalysis資料格式(Dataformat)資料格式(Text)MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEGLVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHKQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTLMGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQLTVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQIATIGENLVVRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH資料格式(FASTA)>SEQUENCE_1MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEGLVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHKIPQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTLMGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQL>SEQUENCE_2SATVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQIATIGENLVVRRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH資料格式(GenBank)資料格式(Swissport)資料庫比對(duì)搜尋DatabaseSearch其他資料庫(Others)Signalingpathway,metabolicpathway……資料庫種類文獻(xiàn)資料庫(Referencedatabase)PubMed,Books,OMIN,SeqAnalRef

序列資料庫(SequenceDatabase)Nucleotide,protein

http://=PubMedReferencedatabasehttp://=BooksReferencedatabasehttp://=OMIMReferencedatabasehttp:///Referencedatabasehttp:///ReferencedatabaseSequenceDatabasesNucleotidedatabase

-DNA-mRNA/cDNA -Alternativespicing -SNP -UniGeneProteinDatabase -Sequences -Domainandfamily -Structure -Swiss-2D%3DImage -ENZYME -PDB

InternationalDNAdatabankshttp:///DataBankhttp:///Databases/DataBankhttp:///DataBankhttp:///GenomeBrowerGenomeBrowerhttp:///GenomeBrowerExpressionSequenceTag/mRNA/cDNADatabasehttp://mRNA/cDNADatabasehttp:///mRNA/cDNADatabaseAlternativesplicingAlternativeSplicingAnnotationProjectII:8080/BIPASSSingleNucleotidePolymorphism(SNP)http:///SNP/SNPdatabasehttp:///SNPdatabasehttp:///Proteindatabasehttp:///這是一個(gè)以蛋白質(zhì)功能為分類基準(zhǔn)的資料庫,資料庫內(nèi)的資料包括了蛋白質(zhì)的生化功能、來源、活性區(qū)域、胺基酸序列的一致性模式(consensuspattern)收集蛋白質(zhì)在二維電泳膠片上特定位置的資料庫http:///enzyme/ENZYME這個(gè)資料庫的資料有,酵素所催化的生化反應(yīng)方程式、酵素所需要的輔助因子(cofactor)、酵素在BoehringerMannheim所提供的生化新陳代謝圖中的位置http://OTHER-TYPEDATABASESSignalingPathwayDatabaseReference………..………..http:///cards/GeneCardshttp://BIOCARTAhttp:///KyotoEncyclopediaofGenesandGenomes(KEGG)/SignalingPathwayDatabase2007DatabasesearchTextsearch(Keyword)NCBI(Entrez;http://)EBI(SRS;)由於目前的Entrez介面提供整個(gè)Entrez資料庫的搜尋結(jié)果,所以使用者不需定義特定資料庫。在使用SRS時(shí)就需注意定義特定資料庫,再進(jìn)行搜尋。

SequencesearchNCBI(BLAST;)EBI(Fasta;)試以Fibroblastgrowthfactor9“FGF9”為keyword,練習(xí)由NCBI提供的Entrez

或由EBI提供的SRS

來搜尋文獻(xiàn)、核酸及蛋白質(zhì)資料庫。練習(xí)一Tryptophanhydroxylase2(TPH2)是大腦製造血清素的速率限制脢,請(qǐng)?jiān)囍页觯?.人類TPH2gene位於那一條chromosome上?其physicalmap的位置約在多少M(fèi)egabase(Mb)處?2.找出一篇描述TPH2function有關(guān)的paper,寫下作者、期刊名、卷號(hào)、頁數(shù)和出版年份。3.利用NCBI上現(xiàn)有的電子書,找出那一本書上的那個(gè)章節(jié)有講述TPH2的相關(guān)資訊。4.利用NCBI(Entrez及BLAST)或EBI(SRS及FASTA)的系統(tǒng),找出人類TPH2mRNAorcDNA序列並利用此序列進(jìn)行蛋白質(zhì)資料庫搜尋。顯示最好的50筆資料。作業(yè)一序列分析比對(duì)Sequencecomparison為什麼需要序列分析比對(duì)?比較序列間相似程度找出一些基因規(guī)則找出親緣基因的同緣區(qū)域序列比對(duì)指將兩個(gè)或多個(gè)序列排列在一起,標(biāo)明其相似之處。序列中可以插入間隔(通常用短橫線「-」表示)。對(duì)應(yīng)的相同或相似的符號(hào)(在核酸中是A,T(或U),C,G,在蛋白質(zhì)中是胺基酸殘基的單字母表示)排列在同一列上。為什麼需要序列分析比對(duì)?比較序列間相似程度找出一些基因規(guī)則找出親緣基因的同緣區(qū)域序列比對(duì)指將兩個(gè)或多個(gè)序列排列在一起,標(biāo)明其相似之處。序列中可以插入間隔(通常用短橫線「-」表示)。對(duì)應(yīng)的相同或相似的符號(hào)(在核酸中是A,T(或U),C,G,在蛋白質(zhì)中是胺基酸殘基的單字母表示)排列在同一列上。序列並列比對(duì)的種類Globalvs.Localalignment序列並列比對(duì)的種類常用的序列比對(duì)方法一般GlobalAlignment採用Needleman-Wunschalgorithm的演算法,是一種利用動(dòng)態(tài)規(guī)劃法則(dynamicprogramming)所開發(fā)出來的方法。一般LocalAlignment採用Smith-Waterman的演算法,也是利用dynamicprogramming所開發(fā)出來的方法。在相似度高的片段,Global和LocalAlignment得到的結(jié)果差不多。資料庫搜尋多利用LocalAlignment,Smith-Waterman最先發(fā)展出來,靈敏度最高但因計(jì)算量大,故最耗時(shí)間。FASTA發(fā)展較晚,計(jì)算速度就比Smith-Waterman快,精細(xì)程度也不差。而BLAST出現(xiàn)最晚,計(jì)算上比其他方式快了許多。它的計(jì)算速度使得它在生物序列資料庫的搜尋上有很大的優(yōu)勢(shì),也因此它可說是目前最受歡迎的序列分析工具。序列分析比對(duì)工具一、雙序列並列分析

二、多序列並列分析三、序列搜尋資料庫

Pairwisecomparisons

雙序列並列分析Pairwisesequencealignmentmethodsareusedtofindthebest-matchingpiecewise(local)orglobalalignmentsoftwoquerysequencesDot-matrixmethodsDynamicprogrammingWordmethodsMultiplesequencescomparisons

多序列並列分析Multiplesequencealignment(MSA)isanextensionofpairwisealignmenttoincorporatemorethantwosequencesatatime.MSAareoftenusedinidentifyingconservedsequenceregionsacrossagroupofsequencesDynamicprogrammingProgressivemethods

The

methodsbeginbyaligningthetwomostcloselyrelatedsequencesfirstandthensuccessivelyaligningthenextmostcloselyrelatedsequenceinthequerysettothealignmentproducedinthepreviousstep

3.Iterativemethods

theworksimilarlytoprogressivemethodsbutrepeatedlyrealigntheinitialsequencesaswellasaddingnewsequencestothegrowingMSA

4.MotiffindingOnlineSoftwareToolsPairwiseSequenceAlignment

-LALIGN

(global&local) -Align(global&local)

-BLAST2(local) -DNADot(global)MultipleSequenceAlignments

-BCMMultipleSequenceAlignments -MAP(DNAtoProtein) -CHAO

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論