美格基因宏基因組結(jié)題報(bào)告_第1頁
美格基因宏基因組結(jié)題報(bào)告_第2頁
美格基因宏基因組結(jié)題報(bào)告_第3頁
美格基因宏基因組結(jié)題報(bào)告_第4頁
美格基因宏基因組結(jié)題報(bào)告_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

概 3.1數(shù)據(jù)預(yù)處 3.1.2數(shù)據(jù)質(zhì) 3.1.3數(shù)據(jù)質(zhì)量統(tǒng) ORF..................................................................................................................................................... 3.3.1序列聚 3.3.2豐度計(jì) 3.3.3數(shù)目Venn KEGG注 eggNOG注 CAZy注 物種-功能-豐度聚類Heatmap 組間Wilcox秩和檢 兩組間T檢 附 6.1................................................................................................................................................................ 宏組(tagnome,也稱微生物環(huán)境組或元組,是由ndlmn等1998tomsofthetotlmirobiotafoundinntur物的,目前主要指環(huán)境樣品中細(xì)菌、古菌和真菌的組總(metgnomi就是一種以環(huán)境樣品中的新的微生物研究方法。最開始的宏組學(xué)技術(shù)主要被用來從環(huán)境微生物中發(fā)掘新生物分子,包括基于功能性篩選(基于代謝功metbolicfution(mrkrgn)A的克隆以及小片段或大片段載體的構(gòu)建,構(gòu)建好的載體需要轉(zhuǎn)入適當(dāng)?shù)乃拗骶?,一般為Escherichiacoli。的研究利用宏組文庫構(gòu)建加上短序列(shotgunsequencing)方法研究了酸性礦山廢水生物膜上及Sargasso海洋中微生物群落的組成及功能構(gòu)成。然司的SOLID儀、Illumina的MiSeq、HiSeq儀的應(yīng)用,帶來的通量幅度的提高,例如SorcererII全球海洋采樣計(jì)劃(TheSorcererIIGlobalOceanSamplingproject,GOS)的開展。另一方面,宏組避免了由體外擴(kuò)增系genes(bias組的重建成為可能,同時(shí)基于生境中主要代謝網(wǎng)絡(luò)的構(gòu)建對于微生物實(shí)驗(yàn)分析流程實(shí)驗(yàn)流DNADNA樣行DNA重新提取或?qū)ΜF(xiàn)有DNA進(jìn)行純化等。檢測合格的DNA樣品加入fragmentationbuffer,采用超聲破碎儀進(jìn)行隨機(jī)打斷,將打斷后得到的短片段DNA用于文庫構(gòu)建,建好的文庫需進(jìn)行文庫質(zhì)檢,對于質(zhì)檢合格的文庫將采用Reads以FASTQ(簡稱為fq)文件格式,其中包含序列(Reads)的序列信息1生物信息分析流程質(zhì)在獲得每個(gè)樣品宏組數(shù)據(jù)之后,首先需要對的數(shù)據(jù)質(zhì)量進(jìn)行流程采用為Trimmomactic,參數(shù)為(LEADING:3TRAILING:3SLIDINGWINDOW:5:20MINLEN:50)。序列組裝及原始的序列剪切成更短的片段K-mers來組合拼接,也更適合二代結(jié)果,比如MEGAHIT,SOAPdenovo,Velet,IDBA,TruSPAdes等用的就是采用這種方法。在此我們組裝上利用 /megahit)CleanDatadenovo拼接(K-merk-min35,k-max95,k-step20。并將各樣品未被利用上的Reads放在一起進(jìn)行混合組裝,以期發(fā)現(xiàn)樣品中的低豐度物種信息。拼接完成后,組裝得到的Scaffolds從N連接的Scaftigs進(jìn)行后續(xù)分析。從單樣品和混合組裝后的Scaftigs出發(fā),采用MetaGeneMark來開放閱讀框(ORF,評估出來的ORFs數(shù)目、長度非冗余集構(gòu)建及豐度計(jì)將各樣品和混合組裝的ORFs結(jié)果放在一起,采用Linclust -e0.001min-seq-id0.9c0.80)Cluster取最長的序列為代表性序列到非冗genecatalogu(Unigenesbbmap將質(zhì)控后CleanData比對至genecatalogue,來計(jì)算得到各Unigene在各樣品中的豐度信genecatalogue各在各個(gè)樣品中的有無,進(jìn)行core-pan分析、組間數(shù)目差異分析、數(shù)目Venn圖分析;基于genecatalogue中各在各樣品中的物種及功能注釋將非冗余集的Unigenes序列與NCBI-NR數(shù)據(jù)庫比對進(jìn)行物種注釋,獲得Unigenes的物種注釋信息,并結(jié)合豐度表,獲得各個(gè)分類層級的物種組成和豐度信息。另外,利用metaphlan2將CleanReads快速分類到物種KEGGeggNOGCAZym物種及功能組成分基于物種豐度表和功能豐度,可以繪制樣品間共有特有物種()Venn樣本比較分析Beta多樣性分析來比較不同樣品在物種(功能)組成方面存在的差異樣品聚類熱圖及樣PCAPCoA圖;當(dāng)有分組重時(shí)利Anosim,Adonis等組間群落差異顯著性檢驗(yàn),揭示組間物種(功能)的差異是否顯著。物種及功能差異分能分類層級上每個(gè)物種(功能)在組間的差異情況,尋找具有統(tǒng)計(jì)學(xué)差異的環(huán)境因子關(guān)聯(lián)分析CCA/RDA、db-RNA、VPA、Man檢驗(yàn)、偏Man檢驗(yàn)等分析,找到與樣品關(guān)聯(lián)與模型分?jǐn)?shù)據(jù)預(yù)處理原始序列數(shù)據(jù)Reads的序列信息及其對應(yīng)的質(zhì)量信息。PE文庫的數(shù)據(jù)結(jié)果中,每個(gè)樣品均有兩端的Reads,并且Reads的順序是嚴(yán)格一致、相互對應(yīng)的。@HWI-D00524:166:C6AJYANXX:4:1101:1710:19731:N:0:CACTCA@HWI-D00524:166:C6AJYANXX:4:1101:1710:19731:N:0:CACTCA列名稱由Illumina儀產(chǎn)生;第2行是read的堿基序列,第4行是read中每個(gè)堿基量系統(tǒng)的Phredqualityscore(33或64),即為該堿基的質(zhì)量值(Phred值。raw_data_list.txt: 數(shù)據(jù)質(zhì)控其是末端(3’端)呈現(xiàn)明顯的下降的趨勢,因此RawReads會存在一定比例的低質(zhì)量數(shù)據(jù),同時(shí)也存在建庫過程中產(chǎn)生的PCR重復(fù)。為了保證后續(xù)分析的準(zhǔn)確可靠,質(zhì)控流程采用軟件為Trimmomactic,參數(shù)為(LEADING:3TRAILING:3SLIDINGWINDOW:5:20堿基質(zhì)量小于20,則切除;如果樣品來源于宿主(比如人或動(dòng)物的糞便通過將reads比對宿主組,去除比對到組的reads來進(jìn)行宿主過濾,推薦使用BWA( Read1Read2CleanData,使用FastQC()對 的clean_data_list.txt: 數(shù)據(jù)質(zhì)量統(tǒng)計(jì)表1數(shù)據(jù)質(zhì)量統(tǒng)計(jì)表(展示部分,詳細(xì)資料請序列組裝及序列組裝利用MEGAHIT( k-k-20,由于Scaffolds里可能存在嵌合體序列,我們嚴(yán)格的將Scaffolds從一個(gè)或者多個(gè)連續(xù)的N處reads500bpScaftigsN50等指標(biāo)評估組N50:指Scaftigs長度覆蓋50%所有核苷酸的最大序列群長度,把Scaftigs按長度從大到小排序,ScaftigsScaftigs的長度。N90含義與N50相似。相比序列平均長度,N50(N90)更能準(zhǔn)確表示此次的序列拼接效果;3Scaftigs示對應(yīng)長度的Scaftigs數(shù)占總Scaftigs數(shù)的百分比。每條所有ORFScaftigs(500bp) 90bpORFbbmapcleanreadsORFORFcleanreads0cleanreads長度≥ORFORFORF表3有效ORF信息統(tǒng)計(jì)(展示部分,詳細(xì)資料請predict_gene.summary.xls)SampleGeneNumberTotallen.(bp)Averagelen.(bp)GCpercent(%)W1S1L 注:x軸表示長度,柱狀圖對應(yīng)左側(cè)坐標(biāo),表示對應(yīng)長度的數(shù)量;曲線對應(yīng)右側(cè)坐標(biāo),表示對應(yīng)/*/protein.faa:CDS子表翻譯得到的氨基酸序列*/gene.gff:ORFs征的描述文件(gff)tab9非編碼RNA(ncRNA)是指一類本身不攜帶可以翻譯為蛋白質(zhì)的遺傳信息的,可以執(zhí)行多種生物學(xué)功能的RNA分子,主要包括有rRNA、tRNA和microRNA。rRNA的使用Barrnap,tmRNA的則利用Aragorn。 /用的reads混合拼接所得的序列 結(jié)非冗余集構(gòu)建及豐度計(jì)序列聚類將各樣品及混合組裝的結(jié)果放在一起,采用Linclust /articles/s41467-018-04964-5)進(jìn)行聚類(默認(rèn)參數(shù)為-e0.001--min-seq-id0.9-c0.80)及去冗余,將每個(gè)Cluster中最長的序列作為代表性序列,以獲得非冗余的genecatalogue(Unigenes。表5聚類結(jié)果文件(展示部分,詳細(xì)資料請Unigene ORF 表6非冗余集的代表序列及其長度統(tǒng)計(jì)表(展示部分,詳細(xì)資料請Unigene 表7非冗余集數(shù)目和長度統(tǒng)計(jì)表(展示部分,詳細(xì)資料請 Gene GC Unigenes:非冗余集GeneNumber:非冗余集的代表序列數(shù)Averagelen.:所有非冗余集序列的平均長度 豐度計(jì)算

=????

1 ??=1注:rk指比對到k的reads數(shù)目;Lk指k的長……的代表序列 Venn豐度樣品間相關(guān)性分析要求較高。根據(jù)豐度結(jié)果,我們使用R語言計(jì)算出所有樣本兩兩之間的相關(guān)系數(shù)6 物種與功能注釋物種注釋使用BLASTP(Version2.2.31+,)將非冗余的UnigenesNCBI-NRBLAST比對(e-value≤0.0001不同的分類級別,為了保證其生物意義,采取LCA算法(應(yīng)用于MEGAN的系統(tǒng)分Gene……對豐度;taxonomy為代表此Gene被注釋的物種分類Unigenes_gene_nr.txt:UnigeneNRKronaKrona分析結(jié)果來展示各樣品中不同分類學(xué)水平物種的相對豐度,Krona示例圖7使用Krona多詳細(xì)的信息請參考Krona展示結(jié)果詳解。KEGG,從分子水平信息,尤其是大型分子數(shù)據(jù)集生成的組和其他高通量實(shí)驗(yàn)技術(shù)的實(shí)用數(shù)的Pathway;第四層為每個(gè)代謝通路圖的具體注釋信息。我們統(tǒng)計(jì)各樣品在第一和第二層次的KEGG注釋結(jié)果,并提供注釋上的所有代謝通路注釋圖。使用diamond將非冗余集序列與KEGG的數(shù)據(jù)庫進(jìn)行的同源性比對(e-value<=0.001)。由于每一條序列比對結(jié)果可能不止一條,為保證后續(xù)研究的表10的相對豐度及KEGG數(shù)據(jù)庫注釋表(展示部分,詳細(xì)資料請 W1S1L… Functio

Enzy

nunigene_1

7385297

map00910(nitrate/nitrite K1transpo map02010(6.3.-00438system binding)Function:KO對應(yīng)的功能描述及編碼的酶的Hyperlink:KO的網(wǎng)頁8命名規(guī)則:K+num(ID號,表示在所有同源物種中具有相似結(jié)構(gòu)或功能的一類同源蛋白圖9KEGGLevel1水平數(shù)目柱狀圖KOko_sum.xls:koeggNOGeggNOG(evolutionarygenealogyofgenes:Non-supervisedOrthologousGroups,)數(shù)據(jù)庫是利用Smith-Waterman比對算法對構(gòu)建的直系同源分類學(xué)功能注釋。目前該數(shù)據(jù)庫(v4.5.1)1902031個(gè)物種value≤0.001 …

…bactNOG03029|bproNOG00822|COG

carbonatetransport

Class:OG所屬的功能大類注:條形圖對應(yīng)的縱坐標(biāo)指注釋到的數(shù)目,橫坐標(biāo)代表eggNOG各功能類型的代碼,簡寫全稱見右eggNOG eggNOGOrthologousCAZy GHsPLs水化合物結(jié)合模塊(Carbohydrate-BindingModules,CBMs。使用CAZy數(shù)據(jù)庫的對應(yīng)工具h(yuǎn)mmscan將非冗余集與CAZyD(ersion:2016.7.15)進(jìn)行比對,比對參數(shù)設(shè)置期望值e-value≤1e-5,獲得對應(yīng)的碳水化合物活性酶注釋信息。我們統(tǒng)計(jì)各樣品在功能大類層級的CAZy注釋結(jié)果。表12相對豐度及CAZy數(shù)據(jù)庫注釋表(展示部分,詳細(xì)資料請 name cazyclass 注:Gene_ID:unigenes的代表序列ID;Gene_ID與name中間的各列是在各個(gè)樣品中的豐度值;name:序列注釋到的CAZy;ncbi-cdd:pfam資料庫單蛋白質(zhì);cazyclass:CAZy注:條形圖的縱坐標(biāo)指匹配的數(shù)目,橫坐標(biāo)代表CAZy各功能類型的代碼,簡寫全稱見右側(cè)的圖CAZyARDB- 抗生素抗性注ARDB(AntibioticGenesDatabase,)又稱耐藥數(shù)素抗性類型所抑制的抗生素名稱(Profile)等信息。BacMet(AntibacterialBiocide&MetalGenesDatabase)是一個(gè)抗菌劑和金屬抗性數(shù)據(jù)庫,其收錄有753個(gè)經(jīng)實(shí)驗(yàn)驗(yàn)證的抗性和155,512個(gè)的抗性(截止于11March2018)。信息,及其所抑制的抗生素名稱,結(jié)合unigenes代表序列的相對豐度獲得相對豐度及BacMet數(shù)據(jù)庫注釋表。表13ARBD數(shù)據(jù)庫注釋表(展示部分,詳細(xì)資料請Require AminoglycosideN-

gentamicin,sisomicin-描述;Profile:抗生素抗性類型所抑制的抗生素名稱;RequireUnigenes:。圖12 Profile數(shù)目條形圖 注釋Unigenes_abundance_bacmetFunc.tsv:BacMet注釋表Unigenes.ardb.output.txt:ARDB注釋結(jié)果Unigenes.ardb.bltOut.txt:ARDB注釋結(jié)果 VFDB致病菌毒力因子注釋VFDB數(shù)據(jù)庫(htt /VFs/main.htm)全稱為VirulenceFactorsofPathogenicBacteria,是專門用于研究致病細(xì)菌、衣原體和支原體致病因子的數(shù)據(jù)庫。其中,1796,30178表14相對豐度及VFDB數(shù)據(jù)庫注釋表(展示部分,詳細(xì)資料請

注:Gene_ID:unigenes的代表序列ID;Gene_ID與VFDBID中間的各列是在各個(gè)樣品中的豐度值;VFDBID:毒力因子的;Virulencefactor:VFDB數(shù)據(jù)庫中的毒力信息描述;Function:VFDB數(shù)據(jù)庫中的功能描述;Sourcespecies:毒力因子的物種來源。13每個(gè)樣品VFDB3.4-3.4-物種與功能注釋/3.4.6-VFDB致病菌毒力因子注釋/Unigenes.VFs.tsv:VF注釋結(jié)果Unigenes.vf_sum.txt:VFDB二級分類統(tǒng)計(jì)表Unigenes.vf_pieplot.png:VFDB二級分類豐度餅圖PHI病原與宿主互作注釋PHI(PathogenHostInteractions,)病原與宿主互作數(shù)據(jù)原與宿主互作關(guān)系,264種病原體,176種宿主等信息。對豐度獲得PHI數(shù)據(jù)庫功能注釋信息。3.4-3.4-物種與功能注釋/3.4.7-PHI病原與宿主互作注釋/Unigenes.phi.annotation.tsv:PHI注釋結(jié)果TCDB轉(zhuǎn)運(yùn)蛋白分類注釋謝產(chǎn)物以及信號轉(zhuǎn)導(dǎo)等廣泛的細(xì)胞活動(dòng)中起著重要的作用。轉(zhuǎn)運(yùn)蛋白類別數(shù)據(jù)庫多種非冗余轉(zhuǎn)運(yùn)系統(tǒng),分為1000多個(gè)轉(zhuǎn)運(yùn)蛋白。該分類系統(tǒng)采用類似于酶分類的ECfamilies、subfamilies和transportsystems,每個(gè)層級對應(yīng)TC里的一個(gè)字母或數(shù)字,每表15相對豐度及TCDB轉(zhuǎn)運(yùn)蛋白資料庫注釋表(展示部分,詳細(xì)資料請 …n

The

binding unigene_1738 Q5513.A.1.16 (ABC)

GO:00151 注:Gene_ID:unigenes的代表序列ID;Gene_ID與Proteinid之間各列為在各樣品中的豐度;Proteinid及TCDBid:轉(zhuǎn)運(yùn)蛋白在TCDB數(shù)據(jù)庫中的對應(yīng)的系統(tǒng)分類;IDDescription:轉(zhuǎn)運(yùn)蛋白描述信DataBank中對應(yīng)PDBID;Pfam:PfamPfamID;GO:GO數(shù)據(jù)庫中對GOID。3.4-3.4-物種與功能注釋/3.4.8-TCDB轉(zhuǎn)運(yùn)蛋白分類注釋/Unigenes.tcdb.annotation.txt:TCDB注釋結(jié)果物種與功能組成分析物種-功能-豐度柱狀圖 phylum/*.pdf:門階層class/*.pdf:綱階層order/*.pdf:目階層family/*.pdf:科階層;genus/*.pdf:屬階層;speices/*.pdf:種階層物種-功能-VennCAZy的注釋結(jié)果。圖1512物種數(shù)目圖15.2功能數(shù)目的Unigene個(gè)數(shù)。 /Venn/:物種-功能-豐度聚類Heatmap對于物種豐度Heatmap圖,基于各樣品(組)物種分類的結(jié)果及其相對豐度,默認(rèn)在phylumspeciesHeatmapKEGG的KOeggNOGOG圖16.1物種相對豐度heatmap圖(門 圖16.2物種heatmap圖(屬圖16.3功能heatmap圖(KEGG 圖16.4功能heatmap圖(eggnog某個(gè)分類上的Z值為樣品在該分類上的相對豐度和所有樣品在該分類的平均相對豐度的差除以所有樣品Heatmap圖phylum/*.pdf:門階層class/*.pdf:綱階層order/*.pdf:目階層family/*.pdf:科階層;genus/*.pdf:屬階層;speices/*.pdf:種階層Heatmap圖/KEGG/Heatmap圖/NOG/Heatmap圖物種-功能-Bubblephylumspecies水平、KEGG、eggNOG及CAZy各分類結(jié)果的豐度分布,以幫助尋找優(yōu)勢及差異的物種、KEGG、NOG及CAZy功能等信息,以及分析其變化趨勢。圖17.1物種Bubble圖(屬 圖17.2功能Bubble圖(KEGGLevel3.5-3.5-物種與功能組成分析/3.5.4-物種-功能-Bubble圖/-物種Bubble圖/top50*_[L2/L3/L4/L5/L6/L7].pdfL2~L7分別以門、綱、目、科、屬、種豐度所繪制top50_*_[ko/L1/L2].pdf:各分類階層繪制top50_*_[L1/L2].pdf:各分類階層繪制:Ternary三元相5的物種-功能-ternaryplot(三元相圖-功能-在不同分類水18三元相圖(門phylum/*.pdf:門階層class/*.pdf:綱階層order/*.pdf:目階層family/*.pdf:科階層;genus/*.pdf:屬階層;speices/*.pdf:種階層注:*-VS*-VS-*為任選三樣本(組)比較分析,可根據(jù)您的需求找尋想要比較的組合Single為單樣本,組名樣本比較分析分別基于物種、KEGGKO、eggNOGOG、CAZY的第二層級功能類(Level2)等相對豐度數(shù)據(jù),利用beta多樣性距離矩陣等統(tǒng)計(jì)方法,分析樣品間的差異情況。樣本間相關(guān)性分析重復(fù)間相關(guān)系數(shù)要求較高。根據(jù)豐度結(jié)果,我們使用R語言計(jì)算出所有樣本兩兩之間的相關(guān)系數(shù)(Sperman相關(guān)系數(shù)spearmam_*_[ko/L1/L2].pdf:各分類階層繪制spearmam_*_[L1/L2].pdf:各分類階層繪制spearmam_*_[L1/family].pdf:各分類階層繪制 聚類與柱狀圖組合分Bray-Curtis距離矩陣以及層次聚pairgroupmethodwitharithmeticmean)算法構(gòu)建樹狀結(jié)構(gòu),得到樹狀關(guān)系形式用于可視化注:左側(cè)是UPGMA聚類樹結(jié)構(gòu),每個(gè)分支代表一個(gè)樣本,右側(cè)是各樣本在種水平、KEGG(Level2)、eggNOG(Level2)OGCAZY(Level1)的物種-功能-相對豐度柱狀圖,不同顏色代表不同物種-功能-。圖3.6-3.6-樣本比較分析/3.6.2-UPGMA聚類與柱狀圖組合分析/-UPGMA物種聚類與柱狀圖:3.6-樣本比較分析/3.6.2-UPGMA聚類與柱狀圖組合分析/-UPGMA功能聚類與柱狀圖:3.6-樣本比較分析/3.6.2-UPGMA聚類與柱狀圖組合分析/-UPGMA功能聚類與柱狀圖:3.6-樣本比較分析/3.6.2-UPGMA聚類與柱狀圖組合分析/-UPGMA功能聚類與柱狀圖:PCA主成分分PCA(PrincipalComponentysis,主成分分析)是一種傳統(tǒng)的數(shù)據(jù)降維方法,常用注:一個(gè)點(diǎn)代表一個(gè)樣本,點(diǎn)與點(diǎn)空間距離表示物種-功能-組成結(jié)構(gòu)的差異程度。主成分1(PC1)和主成分2(PC2)是造成樣品間差異的第一和第二大特征值,百分比表示兩個(gè)主成分對樣品差異的方差貢獻(xiàn)3.6-3.6-樣本比較分析/3.6.3-PCA主成分分析/-物種PCA主成分分析/[組名]PCA_*_[L2/L3/L4/L5/L6/L7].pdfL2~L7分別以門、綱、目、科、屬、種豐度所繪制:PCA_*_[L1/L2].pdf:各分類階層繪制:注:各命名中如出現(xiàn)(1)ellipase表加橢圓區(qū);(2)label表加樣本名稱PCoA主坐標(biāo)分PCA是基于原始的物種-功能-兩種距離來進(jìn)行PCoA分析,并選取貢獻(xiàn)率最大的兩個(gè)主成分進(jìn)行作圖展示。注:一個(gè)點(diǎn)代表一個(gè)樣本,點(diǎn)與點(diǎn)空間距離表示物種-功能-組成結(jié)構(gòu)的差異程度。主成分1(PC1)和主成分2(PC2)是造成樣品間差異的第一和第二大特征值,百分比表示兩個(gè)主成分對樣品差異的方差貢獻(xiàn)物種:功能:功能:功能:注:各命名中如出現(xiàn)(1)ellipase表加橢圓區(qū);(2)label表加樣本名稱NMDS非度量尺度分NMDS(NonmetricMultidimensionalScaling,非度量尺度法)常用于比較樣本組(PCA、PCoA)的缺點(diǎn),能更好地反映生態(tài)學(xué)數(shù)據(jù)的非線性結(jié)構(gòu)。樣品的空間距離物種:功能:功能:功能:注:各命名中如出現(xiàn)(1)ellipase表加橢圓區(qū);(2)label表加樣本名稱MDS標(biāo)度法分多元數(shù)據(jù)分析技術(shù),是一種將空間的研究對象(樣本或變量)簡化到低進(jìn)行定位、物種:功能:功能:功能:注:各命名中如出現(xiàn)(1)ellipase表加橢圓區(qū);(2)label表加樣本名稱組間比較分析PCA、PCoA等分析之后,雖然肉眼能大概分辨分組是否可以清組間群落差異顯著性檢驗(yàn)又稱DissimilarityTest(非相似性檢驗(yàn)(Anosim析(MRPP)這三種方法,并默認(rèn)基于物種-功能-Bray-Curtis、Jaccard這三種距離矩陣分別進(jìn)行分析。這些方法不單可以輸出組間群落結(jié)構(gòu)差異程度(R值能得到檢驗(yàn)的顯著性(P值)等結(jié)果。 置換多元方差分析Adonis(PermutationalMmultivariateysisofVariance,PERMANOVA)又稱置換多得到R和P值。表18Adonis分析結(jié)果(展示部分,詳細(xì)資料請

1vssub-

l

)

9

注:表中dis表所使用計(jì)算distancematrice方法[bray/jaccard];method表[CCA/DCA/RDA/NMDS/MDS/PCoAtest表用[adonis/anosim/mrppSub-condition1vssub-condition2表任兩組子分組做比較;Df為度;SumsOfSqs為總方差,又稱離差平方和;MeanSqs為均方(差),即SumsOfSqs/Df;F.Model為F檢驗(yàn)值;R2為不同分組對樣品差異的解釋度,即分組方差與總方差的比值,R2值接近1表示分組對差異的解釋度越高;PrP值,小于0.05說明檢驗(yàn)的可性度高。物種:功能功能功能Anosim組間相似性分間的距離矩陣,根據(jù)分組信息分別計(jì)算組內(nèi)及組間的差異大小,得到R值,使用置換檢驗(yàn)對分組進(jìn)行顯著性分析得到P值。下表以基于物種的Bray-CurtisJaccard距離矩陣的Anosim分析結(jié)果為例進(jìn)行展示。

Leaf.W1vs 注:表中dis表所使用計(jì)算distancematrice方法[bray/jaccard];method表[CCA/DCA/RDA/NMDS/MDS/PCoAtest表用[adonis/anosim/mrppSub-condition1vssub-condition2表任兩組子分組做比較;R值理論上范圍為-11,但一般介于01之間,R值越接1表示組間差異越大,組間R值越大說明采樣或分組越合理,P值小于0.05時(shí)說明檢驗(yàn)的度高。物種:功能功能功能MRPP多響應(yīng)置換過程分析表20MRPP分析結(jié)果(展示部分,詳細(xì)資料請sub-condition1vs

Leaf.W1vs 注:表中dis表所使用計(jì)算distancematrice方法[bray/jaccard];method表[CCA/DCA/RDA/NMDS/MDS/PCoAtest表用[adonis/anosim/mrppSub-condition1vssub-condition2表任兩組子分組做比較A為不同分組對樣品差異的解釋度,A0說明組間差異大于組內(nèi)差異,A值小于0說明組內(nèi)差異大于組間差異,A值越大表示分組對差異的解釋度越高;observeddelta值越大說明組內(nèi)差異越大;expectdelta值越大說明組間差異大;Significance值小于0.05說明檢驗(yàn)的可性度高。物種:功能功能功能物種與功能差異分析Speces組間Wilcox秩和檢Wilcox秩和檢驗(yàn)(Wilcoxonrank-sumtest,也叫曼-U檢驗(yàn)(Mann–WhitneyUtest豐度的兩組間差異分析。以下展示W(wǎng)ilcox秩和檢驗(yàn)的分析結(jié)果: 注:文件名則顯示在特定分組(Condition1)下,子分組(A)與子分組(B)之間的分析,L2表菌種階層;ID:第一欄為各階層物種-功能-名Wilcoxon_p.vlaueWilcoxp-value值。Wilcox_sig0代表無顯著差異(p>-0.051表p<0.05且呈現(xiàn)含量下降(BA含量下降1表p<0.05且呈現(xiàn)含量上升(B較A含量上升)。--注:文件名則顯示在特定分組(Condition1)下,子分組(A)與子分組(B)之間的分析L7表菌種階層enriched:列出p<0.05且含量上升(B相較A)的物種-功能-名depleted:列出p<0.05且含量下降(B相較于A)的物種-無25組間差異顯著物種-功能-組間WilcoxAll_pvalue_ttest_[組名]_[子組名]-[子組名]_[L2/L3/L4/L5/L6/L7].txt:列出檢驗(yàn)下的p-value值heatmap_sig_ttest_[組名]_[子組名]-[子組名]_[L2/L3/L4/L5/L6/L7].txt:組間差異顯著物種All_pvalue_ttest_[組名]_[子組名]-[子組名]_[ko/L1].txt:列出檢驗(yàn)下的p-value值sig_ttest_[組名]_[子組名]-[子組名]_[ko/L1].txt:列出檢驗(yàn)下p<0.05的功能heatmap_sig_ttest_[組名]_[子組名]-[子組名]_[ko/L1].txt:組間差異顯著功能熱圖All_pvalue_ttest_[組名]_[子組名]-[子組名]_[L1/L2].txt:列出檢驗(yàn)下的p-value值sig_ttest_[組名]_[子組名]-[子組名]_[L1/L2].txt:列出檢驗(yàn)下p<0.05的功能heatmap_sig_ttest_[組名]_[子組名]-[子組名]_[L1/L2].txt:組間差異顯著功能熱圖3.8-物種與功能差異分析/3.8.1-wilcoxon/-wilcoxon/CAZy/[組名]All_pvalue_ttest_[組名]_[子組名]-[子組名]_[L1/family].txt:p-value值sig_wilcoxon_[組名]_[子組名]-[子組名]_[L1/family].txt:列出檢驗(yàn)下p<0.05的功能兩組間T檢test據(jù)滿足正態(tài)分布,由于大部分實(shí)驗(yàn)設(shè)計(jì)屬于獨(dú)立樣本,我們默認(rèn)采用獨(dú)立樣本t檢驗(yàn)。驗(yàn)進(jìn)行功能豐度的兩組間差異分析。以下展示t檢驗(yàn)的分析結(jié)果: 注:文件名則顯示在特定分組(Condition1)下,子分組(A)與子分組(B)之間的分析,L7表菌種階層;ID:第一欄為各階層物種-功能-名t-test_p.vlaue

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論