轉(zhuǎn)錄組分析流程salmon瑞客_第1頁
轉(zhuǎn)錄組分析流程salmon瑞客_第2頁
轉(zhuǎn)錄組分析流程salmon瑞客_第3頁
轉(zhuǎn)錄組分析流程salmon瑞客_第4頁
轉(zhuǎn)錄組分析流程salmon瑞客_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

(d)不基于比對,

&易o(hù)m生信e,b畢io生lo緣g;y.培b訓(xùn)io版m權(quán)e所d有c xx

(.fastq

(.fafile)

(.gtffile)(可選)

A FASTQxx

CDNA (.fa (.gtf (.fastq

FASTQqualityscores=ASCIIqualityscore-either33or Illumina e=estimatedprobabilityofthebasecallbeingwrongQ40:1errorin10,000basecalls;Q30:1errorin1,000;Q28:1.6errorin1000;Q25:3errorin1000;Q20:1errorin信,畢生緣;培訓(xùn) FASTQ CDNA (.fa (.gtf xx 信,畢生緣;培訓(xùn) 公共數(shù)據(jù)從NCBISRA使用NCBI提供的SRA-toolkit中的工具fastq-dump直接SRR文件,并轉(zhuǎn)換雙端就自動(dòng)拆分,如果是單端不受的數(shù)據(jù)集一般比較大,放入 (nohupcmd&)。nohupfastq-dump-v--split-3--nohup&fastq-dump-v--split-3--& 77 fastqc x-axis:Positionin y-axis:Quality信,畢生緣;培訓(xùn) (箱線圖通過最大值、上四分位示質(zhì)量得分。將所有reads的第一位堿基質(zhì)量得分進(jìn)行箱線 信,畢生緣;培訓(xùn) 信,畢生緣;培訓(xùn) 每個(gè)readGC含量的分布圖。橫坐標(biāo)表示平均GC含量,縱坐標(biāo)表示reads數(shù)。左圖顯示每個(gè)read的GC分布(紅線)與理論分布(藍(lán)線)相契合,GC含量均一。右圖出現(xiàn)了GC含量雙峰,表示樣品可能存在特定的序列污染如混入了引物二聚體,當(dāng)這一信,畢生緣;培訓(xùn) ../FastQC/Configuration/adapter_list.txtFastQC工具會(huì)與這兩個(gè)文件里的序列進(jìn)行比信,畢生緣;培訓(xùn) 信,畢生緣;培訓(xùn) 直方圖展示有 量異常高或低的樣本 橫軸是GC含量的判斷,縱軸是堿基橫軸表 reads數(shù),縱軸表示給定 數(shù)區(qū)間內(nèi)樣本數(shù)目,即給 深度有多 樣本 reads數(shù)低于20M的樣品沒有, 高于40M

信,畢生緣;培訓(xùn) 接頭和低質(zhì)量readsmCommondjava-jartrimmomatic-0.30.jarPE--phred33input_forward.fqinput_reverse.fqoutput_forward_paired.fqoutput_forward_unpaired.fqoutput_reverse_paired.fqoutput_reverse_unpaired.fqILLUMINACLIP:adaptor-PE.fa:2:30:10LEADING:20TRAILING:20MINLEN:36TwoinputfilesandfouroutputRemoveadapters:( um2mismatchesinthe'seed'(16bases)oftheadaptor;palindromeclipthreshold30;simpleclipthreshold10)Removeleadinglowqualitybases(belowquality20);Removetrailinglowqualitybases(belowquality20);Dropreadsbelowthe36base易s生信lo,n畢 (2x(2x150(.fastq

(.fafile)

(.gtf 信,畢生緣;培訓(xùn) Ensembl(信,畢生緣;培訓(xùn)E。nsemblcDNA指編 的 RNA- GTF(GeneTransferFormat, RNA- CDNA(.faCDNA(.fa(2x150(.fastq 易s生c信.,e畢d生u緣/F;A培Q訓(xùn)版/F權(quán)A所Q有 m1-seqname-nameofthechromosomeorscaffold;chromosomenamescanbegivenwithorwithoutthe'chr'prefix.Importantnote:theseqnamemustbeoneusedwithinEnsembl,i.e.astandardchromosomenameoranEnsemblidentifiersuchasascaffoldID,withoutanyadditionalcontentsuchasspeciesorassembly.SeetheexampleGFFoutputbelow.m2-source-nameoftheprogramthatgeneratedthisfeature,orthedatasource(databaseorprojectname)m3-feature-featuretypename,e.g.Gene,Variation, 4-start-Startpositionofthefeature,withsequencenumberingstartingat1. 5-end-Endpositionofthefeature,withsequencenumberingstartingat1. 6-score-Afloatingpointvalue. 7-strand-definedas+(forward)or- 8-frame-Oneof'0','1'or'2'.'0'indicatesthatthefirstbaseofthefeatureisthefirstbaseofacodon,'1'thatthesecondbaseisthefirstbaseofacodon,andsoon.. 9-attribute-Asemicolon-separatedlistoftag-valuepairs,providingadditional6612信,畢生緣;培訓(xùn) bed–至少3列,另外9列可選,0-start信,畢生緣;培訓(xùn) 信,畢生緣;培訓(xùn)

- (.gtffile)(.gtffile)(.fafile)(.fastqx RNA- A transcripts_index--typequasi-k <LIBTYPE>-1reads1.fq-2reads2.fqo2 定量時(shí)考慮到不同樣品 長度的改變(比如不同 g易n生e信t,te畢s生/緣D;E培訓(xùn)S版e權(quán)q所2有/。 (.fafile)(.fastqx(.fafile)(.fastqx RNA- (.gtf 信,畢生緣;培訓(xùn) (.fafile)(.fafile)(.fas

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論