版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
組學(xué)分析(一 組研究概 組數(shù)據(jù)質(zhì) 組組 預(yù) 組物種注 組功能注 組研究概 組數(shù)據(jù)質(zhì) 組組 預(yù) 組概AntonivanLeeuwenhoekLouisPasteur RobertKoch 組學(xué)(Metagenomics,又稱 組),最早由 組學(xué)(Metagenomics,又稱 組),最早由 研究對(duì)象:環(huán)境樣品中的微生物群 研 :高通 和功 篩研究目的:微生物多樣性、種群結(jié)構(gòu)、進(jìn)化關(guān)系 功能性、相互協(xié)作關(guān)系 表達(dá)與環(huán)境之間的關(guān) Q20、N50、諾禾 組實(shí)驗(yàn)上機(jī)流 組研究概 組數(shù)據(jù)質(zhì) 組組 預(yù) 組數(shù)據(jù)質(zhì)基本概
質(zhì)控結(jié)?常用格
去Ns堿去宿 read GCcontent:GC Removehost在NCBI中搜索宿主(或近緣物種) 在NCBI中搜索宿主(或近緣物種) 目 組序質(zhì)量值<=20的含量較數(shù)據(jù)優(yōu)堿基含量分布正常,AT%,GC%,N 樣品名插入片段大策下機(jī)始數(shù)(M)有效數(shù)據(jù)(M)Q20百分Q30百分比GC含量有效百分比FASTX-NGSQC
組研究概 組數(shù)據(jù)質(zhì) 組組 預(yù) 組組基本概
基本
基本…
基本ContigScaffold
基本概念具有指定長(zhǎng)度為K(suchasK=15)的DNAKmer種類:假設(shè)K=15,共有4種堿基型,則共有415種Kmer個(gè)數(shù):沿著read每走1bp取1個(gè)Kmer。可以得到Kmer的總數(shù):N=L-假設(shè)read長(zhǎng)為31bp,K=15,一共可以產(chǎn)生31-15+1=17個(gè) 基本概念基本概念基本概念Scaffold:通過使用具有paired-end關(guān)系的reads對(duì)Contig進(jìn)行Gap:序列中未確定的區(qū)域,通常用N或n表示 基本概念將組裝得到的scaffold從N連接處打斷,得到不含N的序列片段稱為 組組裝簡(jiǎn)單示意 DeBrujin圖算法(DeBrujingraph ::DeBrujin圖算法deBrujinAssembly 2222
??Clippedtheshorttipsthathadlengthslessthan2Kmers(50bpKmers=25)inthegraph.Filteredlow-coverageUsingreadpathinformation,resolvedtinyMerge??? a e e StoreStorethekmersofcontiginahash,usekmeraskey,contigidandpositionasvalues.
PEreadsmappedtoFInsertF
PEreadsmappedtotwocontigsonthesamestandRR
Mapsdirectlyonthereferencesequence,denoteasMapsreverselyandcomplementarilyonthereferencedenoteas1、read1與參考序列直接匹配2、F表示上游;R表示下 read1
read1 read11
2
read11
2Note:contig1andcontig2aretheoriginalcontigs,contig1’andcontig2’arereverseandcomplementaryAreliablelinkwillbebuiltbetweentwocontigs,whenthereare>=3pair-endreadssupport.Besidescontigorderanddirection,thegapsizecanalsobeestimatedfromtheinsertsizeandmap positionofeachreadpair.SmallGapFillFillthesmallgapbysingleLongGapFillFillthelonggapbypair-end樣品名稱Scaftigs總長(zhǎng)Scaftigs總條數(shù)Scaftigs平均長(zhǎng)度N50N90Scaftigs最長(zhǎng)值 常用組基于OLC原理構(gòu)建Contig:
基于DBG原理構(gòu)建 其它 Reads,Length100UsethesamewaytogetKmers,onereadcangenerateL-K+1Kmers(100-69+1=32).如果總 條數(shù)為N,read的長(zhǎng)度為L(zhǎng),kmer的總個(gè)數(shù)為那么:n=(L-當(dāng),k6(-6)NN;當(dāng),k6(-6)NN;因此,增加read的長(zhǎng)度,能夠有效提升kmer利用率以及的深度,更利于組裝;還能減少gap數(shù)量,使組裝結(jié)果更完 組研究概 組數(shù)據(jù)質(zhì) 組組 預(yù) 預(yù)?…
基本原基本常用
預(yù)測(cè)結(jié)Gff文結(jié)果展基本概念有遺傳效應(yīng)的 段,控制生物性狀的 位結(jié)基本概念2:CDSVSCDS(Codingsequence):編碼一段蛋白產(chǎn)物的序ORF(OpenReadingFrame)由編碼氨基酸的三。組成的連續(xù)DNA序列,由起 子開始,終 子終。-Usuallydeterminedfrom andthusareknowntobecodingfor-ThebasesequenceisdetermineddirectlyfromDNA,not Theyarepotentiallycodingforsomething,butnoconfirmedthatactuallydooraretranscribed translationtranscription是事實(shí)存在基本概念3:其 組組rRNA(ribosomalsRNA(small串聯(lián)重復(fù)序列:小DNA,微?同源預(yù)測(cè): 常 預(yù)測(cè)軟MetaGeneandGeneMarkand 基本原理一:同源預(yù)測(cè)(Similaritybasedmethods,evidenced-method,homologybasedusehomologysearchestofindgenessimilartothoseobserved 能夠預(yù)測(cè)出在referencedatabases預(yù)測(cè)依賴于已知 信不能發(fā)現(xiàn)novelor 基本原理二:從頭預(yù)測(cè)(AbBasedonintrinsicfeaturesoftheDNAsequencetodifferentiatebetweencodingregionsofasequencefromnon-codingregions.(statisticalmodels)采用的features包括:codonusagestart/stopcodonpatternsandso 基本原理二:從頭預(yù)測(cè)(AbThehiddenMarkovmodelsSupportvectorGlimmer-Artificialneuralnetworks(ANN): 預(yù)測(cè)軟件—MetaGeneandStatisticalmodelsofbacterial,archaeaandprophageFeatures:GCcontentandthedi-codonVerysensitivemethod(overOnlyworkswithreadsthatareofatleast100MetaGeneAnnotator(MGA)AnextensionofFeatures:AddingribosomalbindingsiteSlightlymoreaccuratethanMetaGeneonfragmented 預(yù)測(cè)軟件—BasedonFeatures:integratescodonusagebias,sequencingerrormethodsandstart/stopcodonpatterns.Takesintoaccountsequencingerrors,showntoimprovethetruegenepredictionRhoM,TangH,YeY.FragGeneScan:predictinggenesinshortanderror-pronereads[J].Nucleicacidsresearch,2010,38(20):e191-e191.,CDSORFMetaGeneandGeneMarkand 預(yù) 是Sanger 行描述的一種數(shù)據(jù)格式,已經(jīng)成為序列注釋的通用格式,比如序列的哪里到哪里是已經(jīng)成為序列注釋的通用格式,GFF格式舉例如下:.-0.-03.+0.+0.-0.+0“seqid”序列的編號(hào),編號(hào)的有效字符有[a-zA-Z0-9.:^x!+_?-,- 0.95)進(jìn)行聚類,選取代表性序列作為UniqueGenes ,然后統(tǒng)計(jì)各個(gè)UniqueGene比對(duì)上的reads數(shù)目,并計(jì)算得到UniqueGenes在各統(tǒng)計(jì)各樣品中,UniqueScaftigs比對(duì)上的reads綜合得到各樣品 豐度信息 豐度統(tǒng)0600000000000000000000預(yù)測(cè)基本概預(yù)測(cè)基本原預(yù)測(cè)常用軟預(yù)測(cè)基本過程及結(jié)軟件安組裝測(cè)ovo2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度企業(yè)員工借用設(shè)備使用期限合同3篇
- 2025年度定制家具行業(yè)競(jìng)業(yè)禁止模板木方買賣合同3篇
- 2025年度農(nóng)村自建房合同協(xié)議書(含智能安防監(jiān)控)
- 養(yǎng)殖場(chǎng)土地租賃合同(二零二五年度)農(nóng)業(yè)科技創(chuàng)新3篇
- 二零二五年度個(gè)人施工安全責(zé)任協(xié)議書范本3篇
- 2025年度農(nóng)村自建房工程承包合同
- 2025年度全新官方版二零二五年度離婚協(xié)議書與房產(chǎn)分割執(zhí)行細(xì)則3篇
- 二零二五年度特色農(nóng)業(yè)農(nóng)田承包合作協(xié)議
- 2025年度出租車位充電樁安裝工程驗(yàn)收及質(zhì)保合同
- 二零二五年度全新寫字樓轉(zhuǎn)租協(xié)議合同:商務(wù)樓租賃權(quán)轉(zhuǎn)讓專案2篇
- 增服葉酸預(yù)防神經(jīng)管缺陷理論知識(shí)考核試題及答案
- 新業(yè)娛樂安全評(píng)價(jià)報(bào)告
- 醫(yī)保工作自查表
- 調(diào)休單、加班申請(qǐng)單
- 小學(xué)-英語-湘少版-01-Unit1-What-does-she-look-like課件
- 單證管理崗工作總結(jié)與計(jì)劃
- 安全安全隱患整改通知單及回復(fù)
- 國有檢驗(yàn)檢測(cè)機(jī)構(gòu)員工激勵(lì)模式探索
- 采購部年終總結(jié)計(jì)劃PPT模板
- CDI-EM60系列變頻調(diào)速器使用說明書
- 【匯總】高二政治選擇性必修三(統(tǒng)編版) 重點(diǎn)知識(shí)點(diǎn)匯總
評(píng)論
0/150
提交評(píng)論