宏基因組上機(jī)操作手冊(cè).doc_第1頁(yè)
宏基因組上機(jī)操作手冊(cè).doc_第2頁(yè)
宏基因組上機(jī)操作手冊(cè).doc_第3頁(yè)
宏基因組上機(jī)操作手冊(cè).doc_第4頁(yè)
宏基因組上機(jī)操作手冊(cè).doc_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目錄0. 準(zhǔn)備工作 21. 宏基因組比對(duì) 22. 宏基因組組裝 32.1 組裝軟件: SOAPdenovo 32.2 組裝軟件: Meta-Velvet 53 基因預(yù)測(cè) 64 構(gòu)建基因集 70.準(zhǔn)備工作上機(jī)步驟如下:mkdir /Metage nome#新建工作目錄cd /Metage nome#進(jìn)入工作目錄cp -R /RealBio_Tra in/Metage no me/01_clea n_reads ./ #拷貝數(shù)據(jù)1.宏基因組比對(duì)宏基因組的序列可以通過SOAPaligner比對(duì)軟件,比對(duì)上目標(biāo)基因組,從而進(jìn)行物種注釋或計(jì)算物種豐度。SOAPaligner需要先對(duì)目標(biāo)基因組進(jìn)行建庫(kù),建

2、庫(kù)命令如下:2bwt-builder |SOAPaligner 用法:soap-a -b -D -o -2 -m -x Optio nTypeContent-rINT匹配到多處時(shí)的策略:0:不顯示;1 :隨機(jī)顯示一個(gè);2:全部-MINT匹配模式:0:只允許完全匹配;1:允許一個(gè)錯(cuò)配;2:允許兩個(gè)錯(cuò)配;4:最佳匹配-pINT程序運(yùn)行的線程個(gè)數(shù)其他重要參數(shù):上機(jī)內(nèi)容為:將拷貝得到的reads比對(duì)上微生物的基因組。上機(jī)步驟如下:cd /Metage nome mkdir 02_alig nment cd 02_alig nment#先進(jìn)入個(gè)人目錄下的工作目錄#新建 02_alignment目錄#進(jìn)入

3、比對(duì)目錄cp /RealBio_Tra in/Metage no me/02_alig ner/soapalig ner.sh ./ 比對(duì)腳本#拷貝less test01.pmless test01.sm#查看比對(duì)結(jié)果#查看比對(duì)結(jié)果2.宏基因組組裝基因組組裝是指將測(cè)序儀產(chǎn)出的大量的DNA片段(Reads)拼接成原始的待測(cè)物種的染色體序列,可以類比為拼圖游戲。本手冊(cè)指導(dǎo)你如何使用SOAPdenovo( 2.04)組裝軟件對(duì)鳥槍法測(cè)序數(shù)據(jù)進(jìn)行組裝。2.1 組裝軟件:SOAPdenovoSOAPdenovo的功能是對(duì)二代測(cè)序數(shù)據(jù)進(jìn)行從頭組裝。使用SOAPdenovo前首先要清楚的是它的組裝配置文件,

4、該文件包含以下信息:Optio nContent全局配置max_rden記錄輸入數(shù)據(jù)的最大讀長(zhǎng),并根據(jù)這個(gè)配置輸入緩存大小。文庫(kù)配置,每個(gè)文庫(kù)需要以LIB表明avg_ ins記錄當(dāng)前文庫(kù)插入片段大小。asm_flags用來配置流程中哪些步驟用到當(dāng)前文庫(kù)數(shù)據(jù):1, 表示當(dāng)前文庫(kù)只在構(gòu)建con tig時(shí)用到;2, 表示當(dāng)前文庫(kù)只在構(gòu)建scaffold時(shí)用到;3,表示當(dāng)前文庫(kù)在構(gòu)建con tig與scaffold時(shí)都用到。rank配置構(gòu)建scaffold時(shí)當(dāng)前文庫(kù)的使用優(yōu)先級(jí),由于單端的reads不用于構(gòu)建scaffold,該文庫(kù)不用設(shè)置rank參數(shù)。q1/q2,q配置當(dāng)前文庫(kù)數(shù)據(jù)路徑,q1/q2用

5、于配置雙端的reads,q用于配置單端的reads本次上機(jī)使用到的完整的配置文件內(nèi)容如下:1en=l5 0LIBJavg_in3=349rank=lql/RealBio_Train/Metagenome/00_raw_read3/2015-07-20/test01* 1 * fq RealBio Train/Metagenome/00 raw reads/2015-07-20/teBt01.2 * fq LIB_asm_flagsl q=/ReaLBio_Tran/Metageiio(ine/OO_rawrefMls/2OlS-O7-2O/re3T:01. single . fq配置文件完成后

6、,即可開始進(jìn)行組裝。組裝分四步驟操作。四個(gè)步驟分別是:1. pregraph, De Bruijn圖構(gòu)建。輸入組裝配置文件,輸出圖信息文件,主要參數(shù)如下:Optio nTypeContent-sCONFIG指定組裝配置文件-oPREFIX指定輸出文件的前綴,由用戶隨意設(shè)定-pINT指定使用的線程數(shù)目。SOAPdenovo使用了多線程技術(shù)以充分利用計(jì)算機(jī)資源,一般取運(yùn)行機(jī)子的cpu核心數(shù)目即可,如你的機(jī)器是雙核一個(gè)cpu的,那么可指定為 2-KINT指定需要構(gòu)建 De Bruijn圖的kmer大小,應(yīng)根據(jù)SOAPdenovo的版本設(shè)定。如使用 31mer版本,則可取kmer為31,29,27等-

7、dINT指定構(gòu)建完De Bruijn圖后,需要對(duì)深度小于多少的kmer進(jìn)行過濾,一般設(shè)置為12.構(gòu)建con tig。輸入上一步驟產(chǎn)生的圖文件,輸出con tig序列文件,主要參數(shù)如下:Optio nTypeContent-gPREFIX輸入圖文件前綴,應(yīng)該與上面步驟中的-o參數(shù)一致-DINT設(shè)疋在進(jìn)行構(gòu)建con tig時(shí),需要對(duì)深度低于該設(shè)疋參數(shù)的con tig連接邊進(jìn)行過濾。默認(rèn)取值為1-MINT設(shè)定在進(jìn)行構(gòu)建con tig時(shí),可以先對(duì)相似的序列進(jìn)行合并, 參數(shù)最 大取值為3,表示最大程度合并相似序列;最小取值為0,表示不對(duì)相似序列進(jìn)行合并。這里取經(jīng)驗(yàn)值 2-R選擇是否利用reads的相鄰k

8、mer信息解決短重復(fù)序列,一般選擇 利用3測(cè)序數(shù)據(jù)map回con tig序列。在搭建scaffold前,需要先將輸入數(shù)據(jù)比對(duì)回 con tig序列中, 輸出比對(duì)信息。SOAPde novo在這一步中會(huì)將 reads打碎成kmer,將一個(gè)個(gè) kmer比對(duì)回con tig 上,涉及到的參數(shù)有:Optio nTypeContent-sSTR輸入組裝配置文件-gSTR輸入De Bruijn圖文件的前綴,應(yīng)該與上面步驟1中的-o參數(shù)一致-pINT指定多線程運(yùn)行使用的cpu個(gè)數(shù)4.搭建scaffold。輸入上步產(chǎn)生的con tig文件和原始數(shù)據(jù)的比對(duì)信息文件,SOAPde novo將根據(jù)比對(duì)的pair關(guān)系

9、信息,搭建scaffold,主要參數(shù)有:Optio nTypeContent-gSTR輸入De Bruijn圖文件的前綴,應(yīng)該與上面步驟1中的-o參數(shù)一致-F可選參數(shù)選擇是否在搭建完 scaffold后對(duì)其進(jìn)行補(bǔ)洞。SOAPdenovo內(nèi)置有補(bǔ)洞流程,主要思路是把落在內(nèi)洞中的reads進(jìn)行局部組裝,把裝好的序列嵌入到內(nèi)洞中去,完成補(bǔ)洞工作-u可選參數(shù)選擇是否需要對(duì)咼深度的con tig進(jìn)行屏敝后再搭建 scaffold。SOAPde novo默認(rèn)會(huì)對(duì)咼深度的con tig進(jìn)行屏敝,以減少重復(fù)序列的影響,選擇此參數(shù),將不對(duì)高深度的con tig進(jìn)行屏蔽-LINT,可選參數(shù)選擇選取多長(zhǎng)以上的con

10、 tig進(jìn)行scaffold搭建。SOAPde novo默認(rèn)選取kmer+2上機(jī)內(nèi)容為:將上一步得到的 clea n reads進(jìn)行SOAPde novo組裝,得到 con tig。上機(jī)操作的步驟如下:cd /Metage nome mkdir 03_assembly cd 03_assembly mkdir CFG#先進(jìn)入個(gè)人目錄下的工作目錄#新建03_Assembly目錄#進(jìn)入組裝目錄cp /RealBio_Trai n/Metage no me/03_assembly/CFG/test01.cfg CFG/ #拷貝組裝的config文件到當(dāng)前目錄mkdir shell#新建腳本目錄cp

11、/RealBio_Trai n/Metage nome/03_assembly/shell/test01_Kmer31.shshell/#拷貝組裝腳本到腳本目錄mkdir assemble#新建結(jié)果目錄mkdir assemble/test01#運(yùn)行組裝腳本less assemble/testO1/testO1.scafSeqss.o assemble/testO1/testO1.scafSeq模仿 CFG/test01.cfg ,生成 test02#查看組裝結(jié)果#查看組裝統(tǒng)計(jì)結(jié)果文件的 config 文件 CFG/test02.cfg,插入片段長(zhǎng)度為 412 ;模仿 shell/testO1

12、_Kmer31.sh,生成關(guān)于test02文件的組裝腳本shell/testO2_Kmer37.sh mkdir assemble/test02,kmer值設(shè)為37sh shell/testO2_Kmer37.shless assemble/testO2/testO2.scafSeqss.o assemble/tetsO2/testO2.scafSeq#運(yùn)行組裝腳本#查看組裝結(jié)果#查看組裝統(tǒng)計(jì)結(jié)果sh shell/testO1_Kmer31.sh2.2 組裝軟件:Meta-VelvetMeta-Velvet是在原來基因組組裝軟件Velvet基礎(chǔ)上改進(jìn)的,適合宏基因組數(shù)據(jù)的組裝軟件。主要參數(shù)如下

13、:Optio nTypeContent-cov_cutoffINT or autoDe Bruijn圖中節(jié)點(diǎn)過濾參數(shù),節(jié)點(diǎn)層數(shù)小于該參數(shù)即被過濾-in s_le ngthINT插入片段長(zhǎng)度,reads長(zhǎng)度加上gaps長(zhǎng)度-exp_covINT or auto基因組覆蓋層數(shù),這里選 auto上機(jī)內(nèi)容為:將上一步得到的 test03樣品的clean reads進(jìn)行SOAPdenovo組裝,得到 contig。上機(jī)操作的步驟如下:cd /Metage nomecd 03_assembly#先進(jìn)入個(gè)人目錄下的工作目錄#進(jìn)入組裝目錄cp/RealBio_Trai n/Metage nome/03_assembly/shell/test03_Kmer31.shshell/#拷貝組裝腳本到腳本目錄 mkdir assemble/test03#查看組裝結(jié)果#查看統(tǒng)計(jì)結(jié)果sh shell/testO3_Kmer31.sh# 運(yùn)行腳本less assemble/test03/meta-velvetg.c on tigs.fa ss.o assemble/test03/meta-velvetg.c on tigs.fa3基因預(yù)測(cè)宏基因組一般使用MetaGe neMark預(yù)測(cè)con tig中的cds( cod ing seq

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論