版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
22/目目 一、RNA類產(chǎn) (一)轉(zhuǎn)錄組 真核轉(zhuǎn)錄組de 原核轉(zhuǎn)錄組真核轉(zhuǎn)錄組 原核轉(zhuǎn)錄組 (二)表達(dá) fication SmallRNA與mRNA聯(lián)合分 (三)非編碼 真核Small (四)降解 二、DNA類產(chǎn) (一)重人全組重 RAD-SeqBin
MHC
(二)de 33/動植物de 葉綠體/線粒體de 真菌de 細(xì)菌denovo 細(xì)菌Optical BAC/Fosmidde (三)表 組Bisulfite甲基 (四 分 Illumina分 Affymetrix分 譜SNP檢 三、Meta類產(chǎn)
16S/18S/ITS
四、質(zhì)譜平臺產(chǎn) (一)蛋白類產(chǎn) Ⅰ蛋白鑒定 全譜分 膠點鑒定、膠條鑒 蛋白分子量測 Ⅱ蛋白定量 Ⅲ目標(biāo)蛋白 Ⅳ蛋白修飾 蛋白磷酸化分 五、常規(guī)服 (一)Sanger業(yè) 44/Fosmid文庫構(gòu) Shotgun文庫構(gòu)建及cDNA文庫構(gòu)建及EST酵母雙雜交文庫構(gòu) PCR重/SNP檢測/walking 細(xì)菌、真菌菌種鑒 單個樣品 BAC文庫構(gòu) (二)合成業(yè) 合 六、其他產(chǎn) (一)生物云計 (三)RNA提取協(xié)助服 修訂記 PAGEPAGE6/deRA0101:denovoHS-702-1002:91PE(HiSeq4000)HS-702-1003:101PE(HiSeq4000)XB0101:XbiodenovomRNA的集合。蛋白質(zhì)是行使細(xì)胞功能的主要承擔(dān)者,而由于目前蛋白質(zhì)實驗技以及一些RNA提取、容易降解的特殊樣品等高通量需求。cDNA部分序列,代表一個完整的一小部分,在數(shù)據(jù)庫中其長度一般從20到7000bp不360±120bp[1,2]EST來源于一定環(huán)境下mRNAcDNA文庫,因此EST也能說明該組織中各的表達(dá)水平[3]。研究(microarray)是將來進(jìn)行分析表達(dá)差異[4]。高通量技術(shù)研究轉(zhuǎn)錄本則是利用第二代技術(shù),直接對其是基于Illumina高通量平臺的轉(zhuǎn)錄組技術(shù)能夠在單核苷酸水平對任意物種的整1轉(zhuǎn)錄組研究技術(shù)比較 cDNAESTSanger 高低高是否高低低是是>8000是是轉(zhuǎn)錄組denovo是指在不需要物種組詳細(xì)信息的情況下,用第二代高通量117/策略:Hiseq平臺,推薦PE101或PE151并與引物結(jié)合,在一定的反應(yīng)體系下,在PCR儀上按照相應(yīng)程序合成一鏈cDNA;cDNA雙鏈的粘性末端進(jìn)行修復(fù),使之修復(fù)成平齊末端,并回A堿基,為接下來的接頭連接做準(zhǔn)備;PCR反應(yīng)及產(chǎn)物回收:PCR擴(kuò)增連接產(chǎn)物,并對產(chǎn)物進(jìn)行純化回收,最后貼上,文庫文庫質(zhì)量檢測:構(gòu)建好的文庫使用Agilent2100Bio yzer和ABIStepOnePlusReal-TimePCRSystem進(jìn)行質(zhì)量和產(chǎn)量的檢測。mRNAmRNAcDNA成TotalPCRcDNA第二鏈合加2denovo8/3denovoUnigene功能注釋及COG9/*Unigene等同于“轉(zhuǎn)錄本”或“Transcript”2denovo構(gòu)建完成的文庫,采用Agilent2100檢測濃度和片段長度,并用qPCR檢測文庫的摩爾濃度。文庫片段大小,濃度必須符合IlluminaHiseq上機(jī)標(biāo)準(zhǔn)。adapter去除含N5%10/合格4RawreadsATCG波動大,ATCG5Rawreads11/PAGEPAGE14/果文件包括組裝和注釋兩個部分。contigunigene組裝的詳細(xì)信息在組裝文件夾下。注釋Nr、Swissprot、NT、COG、KEGGGO預(yù)測結(jié)果,SSRSNP對于數(shù)據(jù)量低于50G的項目,華大提供免費的FTP服務(wù),數(shù)據(jù)在()或者(。如果數(shù)據(jù)量小于50G表5錄組dem≥228S/18Level1μg≤m<2LevelAgilentm≥40028S/18Level400LevelAgilentm≥2c≥20Level1μg≤m<2LevelAgilentm≥228S/18Level1μg≤m<2LeveldscDNA真包括PCRm≥2c≥151K以上Level1μg≤m<2Level去rRNA的Agilentm≥0.2c≥20ng/μL1K以上Level LevelB:B類樣品,指的是質(zhì)量滿足建庫要求,且總量可以滿足1次但不足2次建庫LevelC:C類樣品,指的是質(zhì)量不完全滿足建庫要求,可以風(fēng)險建庫但不保證測真核轉(zhuǎn)錄組denovo周針對性的自主軟件開發(fā):tophat、cufflinksRNA分析軟件及華大作伙伴的個性化需求,信息分析團(tuán)隊在不斷進(jìn)行RNA分析軟件的開發(fā)和現(xiàn)有信息分析mRNA;另外,核酸雜交的背景噪音很高,存在交叉雜交現(xiàn)象。轉(zhuǎn)錄組是直接對下,通過轉(zhuǎn)錄組您還可以分析可變剪切、結(jié)構(gòu)變異、全組水平表達(dá)豐式無關(guān)。如果不設(shè)生物學(xué)重復(fù),高影響因子的可能會因此而拒稿。Q6:核酸平臺是否會對客戶樣品進(jìn)行DNaseA6:DNaseDNaseQ7:普通反轉(zhuǎn)錄技術(shù)和SMARTSMARTmRNAQ8:SMART“帽子結(jié)構(gòu)”GcDNAdC,SMART用這個反應(yīng)得到能擴(kuò)增的cDNA,因此擴(kuò)增得到的cDNA就是全長cDNA。15/PAGEPAGE16/Wangetal.DeNovoassemblyandcharacterizationofroottranscriptomeusingIlluminapaired-endsequencinganddevelopmentofcSSRmarkersinsweetpotato(Ipomoeabatatas).BMCGenomics.2010,11:726.案例描述:利用轉(zhuǎn)錄組技術(shù)(denovo)建立第一個甘薯轉(zhuǎn)錄組數(shù)據(jù)庫,并開發(fā)yzerIIx(PE75產(chǎn)出:>59Mreads,平均75-mer1759831.14%)Unigenes被分到124個,且可用于點制高密度以便于將來用于鑒定塊狀根形成和發(fā)育這些生物進(jìn)程中的表達(dá)譜。成千的cSSRs標(biāo)記在本研究中被鑒定出來,豐富了甘薯的利用MISAPerlscript從組裝出的unigene中,開發(fā)出4,114個候選cSSRs標(biāo)記,選取100個標(biāo)記(44個在編碼區(qū),21個在5’UTR,13個在3’UTR,,22),6.0設(shè)計引物,用于擴(kuò)增驗證和估算混合組DNABLASTx軟件與Nr數(shù)據(jù)庫,Swiss-ProtCOG數(shù)據(jù)庫比對:總計有個11983個unigenes分別GOCOG分UnigeneGO和COG材料獲?。焊适韷K莖三個生長發(fā)育階段:直徑0.5-1.0cm最初的塊根;直徑3.0-3.5cm膨脹的塊根和直徑>5.0cm成 片段長度為200bp(25bp)cDNA文庫構(gòu)建。
61DeNovoAssemblyoftheManilaClamRuditapesphilippinarumTranscriptomeProvidesNewInsightsintoExpressionBias,MitochondrialDoublyUniparentalInheritanceandMol.Biol.Evol.的組,不同的表型需要的差異表達(dá)。此外,蛤蜊的線粒體雙重單親遺傳現(xiàn)象(DoublyUniparentalInheritance,DUI)會影響其生殖細(xì)胞的分化。為揭示蛤蜊的分化遺傳控制,本文利用IlluminaGenomeyzerII平臺,對菲律賓蛤蜊的轉(zhuǎn)錄組進(jìn)行了分析,探究了蛤蜊的分化控制。3 *2個家系=24個樣品,各樣品分別提取totalRNA,加入 策略:IlluminayzerII進(jìn)行71b。產(chǎn)出 共產(chǎn)生了約900,000,000個reads 進(jìn)
應(yīng)用BLASTx軟件與有8713個
Burrows-WheelerAlignmenttool將各樣品數(shù)據(jù)與組裝好的到差異表達(dá):1,575個基因在不同各種中有差異表達(dá),165個在兩個家系中有差異表達(dá),47個的表達(dá)受到家系和的雙重影響。
Blast2GOV.2
SAMtools與組裝好SNPs檢測:各樣品的SNPs范圍在14740到27666中166個SNPs與PAGEPAGE19/
圖72BoguskiMS,TolstoshevCM,BassettDEJr.GenediscoveryindbEST.ScienceGerhardDS,etal.Thestatus,quality,andexpansionoftheNIHfull-lengthcDNAproject:the lianGeneCollection(MGC).GenomeRes.2004,14:2121–2127.WangZ,GersteinM,SnyderM.RNA-Seq:arevolutionarytoolfortranscriptomics.NatureReviewGenet.2009,10(1):57–63.RoyceTE,RozowskyJS,GersteinMB.Towardauniversalmicroarray:predictionofgeneCloonanN,etal.Stemcelltranscriptomeprofilingviamassive-scalemRNANatureMethods.2008,HansenMB,VerdurmenWP,etal.Amodularandnoncovalenttransductionsystemforleucine-zipper-taggedproteins.Chembiochem.2011,12(15):2294-7.fragmentsFPKM(A)UnigeneA的表達(dá)量,則C為唯一比對到UnigeneAfragments數(shù),N為唯一比對到所有Unigene的總fragments數(shù),L為UnigeneA的堿基數(shù)。FPKM法能消除長度和量差異對計算表達(dá)的影響,計算得到的表達(dá)量基于的差異方法,通常是對差異檢驗的p-value作多重假設(shè)檢驗校正,通FDR(FalseDiscoveryRate)p-valueFDR值同時,采用表達(dá)量計算方法RPKM(readsperkilobaseofexonpermillionmappedsequencereads)法計算在不同樣本間的差異表達(dá)倍數(shù)。以FDR≤0.001且存在2倍以上表達(dá)差異作為圖8差異統(tǒng)計圖(VS前為對照組差異表達(dá)GeneOntology功能顯著性分表6根據(jù)篩選出的差異,GO功能顯著性富集分析首先把所有差異表達(dá)向GeneOntology數(shù)據(jù)庫()的各個term映射,計算每個term的數(shù)條目。通過GO功能顯著性富集分析能確定差異表達(dá)行使的主要生物學(xué)功能。表6差異表達(dá)pathway顯著性富集分與GO富集類似,對差異表達(dá)的與各信號通路進(jìn)行分析,尋找具有顯著性富集的pathway,通過Pathway顯著性富集能確定差異表達(dá)參與的最主要生化代謝途徑和信號9KEGGBcellreceptorsignalingpathway 一般在200bp以下,其兩端的序列高度保守,可設(shè)計引物進(jìn)行PCR擴(kuò)增,揭示其多態(tài)性。20/基于轉(zhuǎn)錄組的SSR檢測是以組裝出來Unigene作為參考序列,使用SSR軟件 SOAPsnp是SOAP中的一員。它也是一種重工具,可以為基于原始片段在主成分分析(principalcomponentsysis,PCA)是一種簡化數(shù)據(jù)集的技術(shù),它把原集的維數(shù),同時保持?jǐn)?shù)據(jù)集的對方差貢獻(xiàn)最大的特征。R語言中的p函數(shù)可以進(jìn)行21/2222/113D功能分析,可以揭示出樣品中正在發(fā)生的特異性生物過程,并可以輔助RNA層次的biomarkers開發(fā)。令ei(g)為g在樣品i中的reads數(shù)則g在所有樣品中的reads數(shù)為 令si為樣品i中所有reads數(shù)則期望的每個在樣品i中的reads數(shù)與 對于g如果它在所有組織中均勻地表達(dá)則期望的它在組織i中reads數(shù)為fi=E(g)pi。定義expressionenrient(EE)EEi(g)=ei(g)/fi(g),即g在樣品i中的reads數(shù)觀測值對期望值的比例。更大的EEi(g)代表著g更加偏向于在樣品i中表達(dá)。同時,為了評估一個較大的EEi(g)值是由于偶然因素而不是真實的偏向性表達(dá)情況,為expressionenrient值定義一個P-value,它由如下給出:我們通常定義滿足:EEi(g)>5和Pi<10?3.5的為條件特異表達(dá)2323/圖12條件特異表達(dá)統(tǒng)計圖PAGEPAGE25/
RA0106:ResequencingHS-702-1002:91PE(HiSeq4000)HS-702-1003:101PE(HiSeq4000)XB0102:XbioResequencing轉(zhuǎn)錄組的研究對象為特定細(xì)胞在某能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,該產(chǎn)品目前主要針對mRNA。轉(zhuǎn)錄組是連接組遺傳信息與生物功能的蛋白質(zhì)組的必然紐帶,轉(zhuǎn)錄組研究是功能及結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點,通過新一代高通量,能夠全1DGE低中高高否否是否否是2626/11策略:Hiseq平臺,推薦PE101或PE151首先對合格的樣品進(jìn)行DNaseI消化,然后用oligo(dT)磁珠分離出mRNA,用超聲圖2轉(zhuǎn)錄組建庫流dUDNAUNG酶(尿嘧啶-N-糖基化酶)可以選擇性水解斷裂鏈(負(fù)鏈)即可上機(jī),進(jìn)行邊合成邊;在的過程中先測得一些是正鏈reads,再測得一些是負(fù)鏈reads,在這些序列比對到參考組或參考時,那些比對到互補(bǔ)鏈物加以區(qū)分開。這些反義轉(zhuǎn)錄產(chǎn)物最后均可進(jìn)行SNP,表達(dá)量等信息分析。下圖為轉(zhuǎn)錄組27/圖3鏈特異性轉(zhuǎn)錄組建庫流++28/4reads的處理29/分析,例如,“在激素處理后2小時、4小時、8小時皆有差異表達(dá)的”)差異表達(dá)Pathway顯著富集分15).Indel 第1,2,3,4,7,9-14,23條4-1018-1921-2230/PAGEPAGE31/表2真核轉(zhuǎn)錄組Resequencing質(zhì)控內(nèi)針對RNA樣本,采用電泳、NanoDrop、AgilentBio yzer等方法進(jìn)行樣品檢測。樣構(gòu)建完成的文庫,采用Agilent2100檢測濃度和片段長度,并用qPCR檢測文庫分子濃度。文庫片段大小,濃度必須符合IlluminaHiseq上機(jī)標(biāo)準(zhǔn)。去除含N10%的5Rawreads6Rawreads曲線較平緩,不會有大的波動,AT,C與G的曲線基本重合,N貼平。Reads普通組物種,建議4Gb;對于數(shù)據(jù)量低于50G的項目,華大提供免費的FTP服務(wù),數(shù)據(jù)在()或者()。如果數(shù)據(jù)量小于50G,;Windows用戶:推薦winRAR 文件打開或瀏覽方法:txtWindowsEditplus或UltraEdit作為瀏覽程序,否則會因文件過大造成死機(jī)。UnixLinux系統(tǒng)比較適2100m≥228S/18Level1μg≤m<2LevelAgilentm≥40028S/18Level400LevelAgilentm≥2c≥20Level1μg≤m<2LevelAgilentm≥228S/18LevelLeveldscDNA真核LevelLevelrRNAAgilentLevelLevelLevelB:B類樣品,指的是質(zhì)量滿足建庫要求,且總量可以滿足1次但不足2次建庫A1:RNA提取質(zhì)量的好壞主要取決于樣品本身的質(zhì)量即新鮮程度。除此外,Invitrogen公pBIOZOL試劑或CTAB-PVPLiClQIAGEN公司的RNeasylipidminikit進(jìn)行提取。dUTPcDNATU。UNG酶能特異性模板就只剩下cDNA一鏈。下機(jī)后的reads1mRNA負(fù)鏈,reads2mRNA正鏈。A6:轉(zhuǎn)錄組后可通過實時熒光定量PCR(qRT-PCR)技術(shù)來驗證結(jié)果華大科技與合作伙伴共同對一個人進(jìn)行了轉(zhuǎn)錄組和小RNA研究,在該個22,688RNA編輯現(xiàn)象,絕大多數(shù)突變(~93%)AI(G),這與已知的RNA依賴嘌呤脫氨酶作用機(jī)制相一致(下圖。7RNA為Malat1/NR_002819。在炎黃轉(zhuǎn)錄組數(shù)據(jù)中發(fā)現(xiàn)的RNA編輯位點用紅色框標(biāo)出,綠色框代表DARNED數(shù)據(jù)中發(fā)現(xiàn)的編輯位點。在水稻轉(zhuǎn)錄組項目中,研究人員發(fā)現(xiàn)了很多新的轉(zhuǎn)錄本。通過與水稻cDNA數(shù)據(jù)圖8轉(zhuǎn)錄組與cDNA相比可以發(fā)現(xiàn)低拷貝轉(zhuǎn)錄A.新鑒定轉(zhuǎn)錄本長度分布;B.新轉(zhuǎn)錄本與cDNA表達(dá)水平比較華大科技與其合作伙伴攜手,對來自14個的癌樣本以及它們的正常組織對照樣本進(jìn)行了轉(zhuǎn)錄組研究,發(fā)現(xiàn)大量與癌相關(guān)的融合和其他突變現(xiàn)象(下圖。14個腫瘤樣本中,有3個(21.4%)具有TMPRSS2-ERG融合,2個新的融TT15195=352%(D)通過RT-PCR和Sanger來驗證所發(fā)現(xiàn)的融合現(xiàn)科學(xué)家們利用轉(zhuǎn)錄組技術(shù)研究了擬南芥全組范圍的可變剪接(下圖,共發(fā)現(xiàn)UNG酶法鏈特異性文庫構(gòu)建方法的建立德國科學(xué)家在NucleicAcidsResearch上的一篇文獻(xiàn),闡述了利用UNG酶處理來獲化掉。這樣在后續(xù)的建庫中就只剩下了cDNA一鏈,從而解決了常規(guī)轉(zhuǎn)錄組不能識別下圖為同一在常規(guī)轉(zhuǎn)錄組及鏈特異性轉(zhuǎn)錄組情況下的reads比對情況。從中可以看出基PengZY,ChengYB,TanBCM,etal.Comprehensive ysisofRNA-SeqdatarevealsextensiveRNAeditinginahumantranscriptome.NatureBiotechnology.2012,30:253–260.ZhangGJ,GuoGW,HuXD,etal.DeepRNAsequencingatsinglebase-pairresolutionrevealshighcomplexityofthericetranscriptome.GenomeResearch.2010,20:646-654.RenSC,PengZY,MaoJH,etal.RNA-Seq ysisofprostatecancerinthe identifiesrecurrentgenefusions,cancer-associatedlongnoncodingRNAsandaberrantalternativesplicing.CellResearch.2012,1-16.MarquezY,BrownJW.S.,SimpsonC,etal.TranscriptomesurveyrevealsincreasedcomplexityofthealternativesplicinglandscapeinArabidopsis.GenomeResearch.2012, DmitriP,TatianaB,AlexeyS,etal.Transcriptome ysisbystrand-specificsequencingofcomplementaryDNA.NucleicAcidsResearch.2009,Vol.37,No.18.序。如果打斷隨機(jī)性差,reads偏向于來自特定區(qū)域,將會直接影響轉(zhuǎn)錄組的各項分析我們利用reads在上的分布來評價打斷隨機(jī)性。由于不同參考有不同長度,我們把reads在上的位置標(biāo)準(zhǔn)化到相對位置(reads在上的位置與長度的比值,cDNAmRNAcDNA然后片段化要好。我們的實驗使用RNAfragmentation方案。圖12.(Wang,etal2009)文庫:RNA片段化和cDNA片段化的方法比化后深度的分布相對更均一,但在5’和3’端的分布較少。中,最大表達(dá)量與最小表達(dá)量的比值(或理解為動態(tài)范圍)44RNA-seq9,560。圖中Tag數(shù)目是酵母菌5000個ORFs18的平均深度。39/PAGEPAGE42/和轉(zhuǎn)錄本表達(dá)量統(tǒng)計 設(shè)FPKM(A)為A的表達(dá)量,則C為唯一比對到A的fragments數(shù),N為唯一比對到參考的總fragments數(shù),L為A編碼區(qū)的堿基數(shù)。FPKM法能消除長度)13IGVIGV的組數(shù)據(jù)瀏覽方法,詳見我們結(jié)題報告里提供的使用手冊,信息請官網(wǎng):。基于表達(dá)水平的分析(只針對多樣品生物學(xué)重復(fù)是任何生物實驗所必須的,高通量技術(shù)也不例外(Hansenetal.)。樣關(guān)性。根據(jù)Encode計劃建議的標(biāo)準(zhǔn),屬于生物重復(fù)的兩個樣品,相關(guān)性系數(shù)的平方141516基于的差異方法,通常是對差異檢驗的p-value作多重假設(shè)檢驗校正,通FDR(FalseDiscoveryRate)p-valueFDR值同時,采用表達(dá)量計算方法FPKM法計算在不同樣本間的差異表達(dá)倍數(shù)。以FDR≤0.001且存在2倍以上表達(dá)差異作為判斷表達(dá)差異顯著的閾值,也可以選取更小的FDR閾值和更大的倍數(shù)差異,F(xiàn)DR值越小、倍數(shù)差異越大,則表明表達(dá)差異越顯著。圖17差異統(tǒng)計圖(VS前為對照組組情況進(jìn)行驗證。我們利用cluster軟件,以歐氏距離為距離距陣計算,對差異表達(dá)基因和實驗條件同時進(jìn)行分層聚類分析,聚類結(jié)果用javaTreeview顯示,如下圖。4444/變化倍數(shù)或表達(dá)量用不同顏色表示,對于差異聚類:紅色表示表達(dá)上調(diào),綠色表示表達(dá)差異表達(dá)GeneOntology功能富集分根據(jù)篩選出的差異,GO功能富集分析首先把所有差異表達(dá)向GeneOntology數(shù)據(jù)庫()的各個term映射,計算每個term的數(shù)目,然后過GO功能顯著性富集分析能確定差異表達(dá)行使的主要生物學(xué)功能。計算如下:其中,N為所有中具有GO注釋的數(shù)目;n為N中差異表達(dá)的數(shù)目;M為所有中注釋為某特定GOterm的數(shù)目;m為注釋為某特定GOterm的差異表達(dá)基p-valueBonferronicorrectedp-value≤0.05為閾值,滿足此條件的GOterm定義為在差異表達(dá)中顯著富集的GOterm。通過GO功能顯著性4圖19.GO分析中富集到的細(xì)胞功能(molucular_function)從屬關(guān)系pvalue值的范圍,層級從上往下依次細(xì)化,最底層標(biāo)出富集到此TERM路徑的基因ID.得到每個差異的GO注釋后,我們用WEGO軟件對差異做GO功能分類統(tǒng)計,從宏觀上認(rèn)識差異的功能分布特征,結(jié)果如圖18所示.45/ 圖20.GO差異表達(dá)pathway顯著性富集分步了解的生物學(xué)功能。KEGG是有關(guān)Pathway的主要公共數(shù)據(jù)庫,Pathway顯著性富集中顯著性富集的Pathway。該分析的計算同GO功能顯著性富集分析,在這里N為所有中具有Pathway注釋的數(shù)目;n為N中差異表達(dá)的數(shù)目;M為所有中注釋為某特定Pathway的數(shù)目;m為注釋為某特定Pathway的差異表達(dá)數(shù)目。經(jīng)過多重檢驗校正之后,我們選擇Qvalue≤0.05的Pathway定義為在差異表達(dá)中顯Pathway。QvalueFDRp-value的一種校正。某一個假設(shè)檢驗的QvalueFDRFDRPathway46/ 注:Qvalue≤0.05Pathway21Pathway注:Qvalue≤0.05Pathway21Pathway注:KEGG數(shù)據(jù)庫中Bcellreceptorsignalingpathway的詳細(xì)信息。在圖中,上調(diào)用紅框47/ 20的pathway異表達(dá)的中位于該pathway條目的數(shù)目與所有有注釋中位于該pathway條目的總數(shù)的比值,RichFactor越大,表示富集的程度越大。Qvalue是做過多重假設(shè)檢驗校正20的pathway圖22.KEGG蛋白互作網(wǎng)絡(luò)分析整合了BIND、BioGrid、HPRD等相互作用網(wǎng)絡(luò)數(shù)據(jù)庫的組成.結(jié)果Medusa軟件顯示.進(jìn)入網(wǎng)頁版的界面如下(注:需要蛋白相互作用數(shù)據(jù)庫中有該物種的注釋信息):在文本輸入框中輸入ID號,便可得到如下所示的圖(若找得到網(wǎng)絡(luò)互作48/PAGEPAGE49/圖22.差異的轉(zhuǎn)錄因子分析(適用于植物質(zhì),這些蛋白質(zhì)能調(diào)控其靶的轉(zhuǎn)錄,具有DNA結(jié)合結(jié)構(gòu)域和轉(zhuǎn)錄激活結(jié)構(gòu)域。我們用hmmsearch搜索植物中的轉(zhuǎn)錄因子的特征結(jié)構(gòu)域來預(yù)測編碼轉(zhuǎn)錄因子的。針對數(shù)據(jù)的tophat的splicedjunction比對結(jié)果,后續(xù)采用RPKM(ReadsPerkbtranscriptomeperMillionreads)統(tǒng)計外顯子的表達(dá)量,具體 C指的是唯一比對到外顯子Areads數(shù),由于存在一條read長度的中位數(shù);Nreads數(shù);L指的是外顯子的長度(RPKM圖23.用Cufflink軟件對reads進(jìn)行組裝,將組裝的轉(zhuǎn)錄本與參考序列的注釋信息進(jìn)行比5’3’16所示。圖24結(jié)構(gòu)優(yōu)化方剪接研究在人、小鼠、擬南芥中發(fā)現(xiàn)了很多新的可變剪接。在生物體內(nèi),主要存在7種可變剪接類型:A)Exonskip;B)Intronretention;C)Alternative5'splicesite;D)Alternative3'splicesite;E)Alternativefirstexon;F)Alternativelastexon;G)Mutuallyexclusiveexon。下圖是我們利用高通量數(shù)據(jù)鑒別出來的7種A)ExonSkip:AK070385發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本,第1種轉(zhuǎn)錄51/ 剪接形成兩種不同的轉(zhuǎn)錄本,第2種轉(zhuǎn)錄本由retainedIntron與兩側(cè)的外顯子一起形成新的外顯子。C)Alternative5'splicesite:AK067602發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本,它們的3'端剪接位點一致但5'端剪接位點不同。D)Alternative3'splicesite:AK067602發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本,它們的5'端剪接位點一致但3'端剪接位點不同。E)AlternativeFirstExon:AK068497發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本,它們的不同之處在于第一個外顯子不同。F)AlternativeLastExon:AK064908發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本,它們的不同之處在于最后一個外顯子不同。G)MutuallyExclusiveExon:基因AK101575發(fā)生可變剪接形成兩種不同的轉(zhuǎn)錄本,兩轉(zhuǎn)錄本之間相同的外顯子稱為constitutiveexoninclusiveexoninclusiveexon不能同時存在與同轉(zhuǎn)錄本的組裝轉(zhuǎn)錄本必須滿足以下條件:距離現(xiàn)有的注釋gene 200bp以上;長度不短于180bp;深度不小于2。圖18所示為新轉(zhuǎn)錄本預(yù)測的方法。SNP(單核苷酸多態(tài)性SingleNucleotidePolymorphisms)在這里指的是樣品的RNA序A,T,C或G的變異。流程中使用軟件GATKSNP檢測。GATK是由BroadInstitute研發(fā)的一款用于二代數(shù)據(jù)分析的軟件包。該工具包提供大的處理引擎,高性能計算等特點使其在各類項目中得以廣泛應(yīng)用。GATK信息請參考。SNP檢測后,使用AnnoDB做注釋和分類,詳細(xì)注釋結(jié)果在文件[Sample-ID].snp.annot.csv,CSV格式,可用Excel等打開。也對SNP注釋52/ 27SNPIdeaminasesthatactatRNA)的催化條款,使腺苷酸(A)變成了次黃嘌呤核苷酸(I)。并28RNA53/5454/ Indelpair-endreads進(jìn)行開gapInDels(小的插入/缺失)。流程使用軟件來檢測制。目前融合的研究主要集中在的研究中,比如,白血病、癌、等,SOAPfuse(/soapfuse.html)分析軟件是由華大自主開發(fā)的一SOAPfuse算法4個步驟:產(chǎn)生的reads與人組參考序列比對,并且注釋轉(zhuǎn)錄PAGEPAGE56/HS-702-1002:91PE(HiSeq4000)HS-702-1003:101PE(HiSeq4000)轉(zhuǎn)錄組的研究對象為特定細(xì)胞在某能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,該產(chǎn)品目前主要針對mRNA。轉(zhuǎn)錄組是連接組遺傳信息與生物功能的蛋白質(zhì)組的必然紐帶,轉(zhuǎn)錄組研究是功能及結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點,通過新一代高通量,能夠全錄組,與參考組比較,可以得到表達(dá)差異、GO功能分析、以及代謝通路分析目前用于分析轉(zhuǎn)錄表達(dá)的方法有表達(dá)、DGE、RNA-seq(定量)和轉(zhuǎn)錄組。轉(zhuǎn)DGE低低高高否否是司高通量平臺,通過信息分析,可以獲得表達(dá)差異信息、SNP分析、預(yù)測新轉(zhuǎn)錄本等信息,這為研究的結(jié)構(gòu)和的表達(dá)調(diào)控提供了一個重要的。原核轉(zhuǎn)錄組4.1技術(shù)流cDNA合成:用六堿基隨機(jī)引物(randomhexamers)cDNA鏈,然后加入緩沖液、dNTPs、RNaseH和DNApolymeraseI合成第二條cDNA鏈;
1fq標(biāo)準(zhǔn)信息分析主要包括數(shù)據(jù)評估、表達(dá)注釋、SNP分析,預(yù)測新轉(zhuǎn)錄本,篩選差 57/PAGEPAGE58/2標(biāo)準(zhǔn)信息分析(需提供參考序列、參考組序列及注釋結(jié)果(reads的處理2..1評 2.3表達(dá)注 2.4.差異表達(dá)分析(兩個或兩個以上的樣品,10次比對以上作為個性化分析條標(biāo)準(zhǔn)信息分析(無參考序列Unigene功能注釋及COGUnigene的GOUnigene在樣品間的差異GO分類(需兩個或兩個以上樣品)和Pathway富集性分SNPSSR*Unigene等同于“轉(zhuǎn)錄本”或“Transcript”表2原核轉(zhuǎn)錄組質(zhì)控內(nèi)此步驟的質(zhì)控用于檢測樣本的質(zhì)量和濃度。通過Agilent2100TotalRNA的完整性以及濃度,同時還會運用NanoDrop檢測樣品是否存在鹽離子等污染,為建庫取樣
4去除N10%的60/;獲得cleanreads。5Rawreads6Rawreads61/PAGEPAGE62/對于數(shù)據(jù)量低于50G的項目,華大提供免費的FTP服務(wù),數(shù)據(jù)在()或者()。如果數(shù)據(jù)量小于50G,3原核TotalLeveldscDNA不包括PCR產(chǎn)物、LevelrRNA的LevelLevelC:C類樣品,指的是質(zhì)量不完全滿足建庫要求,可以風(fēng)險建庫但不保證測46注:1.純包含數(shù)據(jù)處理、報告撰寫、報告提隊在不斷進(jìn)行RNA分析軟件的開發(fā)和現(xiàn)有信息分析平臺的升級。PAGEPAGE64/PengZY,ChengYB,TanBCM,etal.ComprehensiveysisofRNA-SeqdatarevealsextensiveRNAeditinginahumantranscriptome.NatureBiotechnology.2012,30:253–260.ZhangGJ,GuoGW,HuXD,etal.DeepRNAsequencingatsinglebase-pairresolutionrevealshighcomplexityofthericetranscriptome.GenomeResearch.2010,20:646-654.RenSC,PengZY,MaoJH,etal.RNA-seqysisofprostatecancerinthepopulationidentifiesrecurrentgenefusions,cancer-associatedlongnoncodingRNAsandaberrantalternativesplicing.CellResearch.2012,1-16.MarquezY,BrownJW.S.,SimpsonC,etal.TranscriptomesurveyrevealsincreasedcomplexityofthealternativesplicinglandscapeinArabidopsis.GenomeResearch.2012,:DmitriP,TatianaB,AlexeyS,etal.Transcriptomeysisbystrand-specificsequencingofcomplementaryDNA.NucleicAcidsResearch.2009,Vol.37,No.18.PAGEPAGE65/
RA0104:SP-201-1101:原核鏈特異性轉(zhuǎn)錄組文庫HS-702-1002:91PE(HiSeq4000)HS-702-1003:101PE(HiSeq4000)BA-101-1104:BA-301-1104:轉(zhuǎn)錄組的研究對象為特定細(xì)胞在某能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,該產(chǎn)品目前主要針對mRNA。轉(zhuǎn)錄組是連接組遺傳信息與生物功能的蛋白質(zhì)組的必然紐帶,轉(zhuǎn)錄組研究是功能及結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點,通過新一代高通量,能夠全原核鏈特異性全譜轉(zhuǎn)錄組和常規(guī)轉(zhuǎn)錄組類似,對提取的TotalRNA直接進(jìn)行文庫,分析內(nèi)容。sRNA參與多種生物學(xué)過程,如和細(xì)胞分化(DicF、mRNA的穩(wěn)定(oxyS(RNAI致病性(RNAIII)以及碳的(csrBC)等,sRNA的作用不斷突出,越來越多的研究開始圍繞sRNA,而原核鏈特異性全譜轉(zhuǎn)錄組為這一研究提供了很好的平臺。目前用于分析轉(zhuǎn)錄表達(dá)的方法有表達(dá)、DGE、RNA-seq(定量)和轉(zhuǎn)錄組,轉(zhuǎn)不僅能夠?qū)Ρ磉_(dá)進(jìn)行定量,而且還能夠進(jìn)行定性分析。原核鏈特異性全譜轉(zhuǎn)錄組各
DGE低低高高否否是否否否是是是原核鏈特異性全譜轉(zhuǎn)錄組通過對原核TotalRNA樣本去rRNA后進(jìn)行文庫,采用Illumina公司高通量平臺后進(jìn)行信息分析,可以確定一條轉(zhuǎn)錄本是來自正義鏈還比常規(guī)轉(zhuǎn)錄組更精確統(tǒng)計轉(zhuǎn)錄本的數(shù)量,而且可以挖掘sRNA信息。鏈特異性文加“A”和接頭:在cDNA上添加“A”6868/1數(shù)據(jù)以fq格式保存: 6969/23sRNAPAGEPAGE70/ 2.3.表達(dá)注 差異表達(dá)分析(兩個或兩個以上的樣品,10次比對以上作為個性化分2.7.1子預(yù)3’UTR中Rho-independentterminatorPncRNA差異表達(dá)分析(兩個或兩個以上樣品,10ncRNAncRNA靶預(yù)Unigene功能注釋及COGUnigene的GOUnigene在樣品間的差異GO分類(需兩個或兩個以上樣品)和Pathway富集性SNPSSR*Unigene等同于“轉(zhuǎn)錄本”或“Transcript”表3原核連特異性全譜轉(zhuǎn)錄組質(zhì)控內(nèi)此步驟的質(zhì)控用于檢測樣品的質(zhì)量和濃度。通過Agilent2100TotalRNA的完整性以及濃度,同時還會運用NanoDrop檢測樣品是否存在鹽離子等污染,為建庫取樣以及后期分析提供參考。2100檢測基線平滑不,RIN值高代表樣品RNA完整性好。運用實時熒光定量PCR對文庫再次定量。5去除N10%的;獲得cleanreads。6Rawreads7Rawreads
對于數(shù)據(jù)量低于50G的項目,華大提供免費的FTP服務(wù),數(shù)據(jù)在()或者()。如果數(shù)據(jù)量小于50G,4組原核Total抬;5S峰正LevelLevelrRNA的56注:1.純包含數(shù)據(jù)處理、報告撰寫、報告提針對性的自主軟件開發(fā)RNASOAP系列軟件(SOAPsnp等),針對轉(zhuǎn)錄組分析的共性問題和合作伙伴的個性化需求,信息分析團(tuán)A3:鏈特異性最主要的是為了區(qū)分+/-UNG酶處理的過Denovo確定組裝的Unigene有Refc.豐富的分析內(nèi)容:TSS,Operon,UTR,SD序列預(yù)測,Rio-independent終止子,sRNA 德國科學(xué)家在NucleicAcidsResearch上的一篇文獻(xiàn),闡述了利用UNG酶處理來獲化掉。這樣在后續(xù)的建庫中就只剩下了cDNA一鏈,從而解決了常規(guī)轉(zhuǎn)錄組不能識別下圖為同一在常規(guī)轉(zhuǎn)錄組及鏈特異性轉(zhuǎn)錄組情況下的reads比對情況。從中可以看出基圖 F為非鏈特異性比對圖,G為鏈特異性比對圖,正向的為藍(lán)色,反向的為紅色SorekR,CossartP.(2010)Prokaryotictranscriptomics:anewviewonregulation,physiologyandpathogenicity.NatRevGenet.11(1):9-16.SeilaAC,CalabreseJM,etal.(2008)DivergenttranscriptionfromactiveLeightonJ.Core*,etal.(2008)NascentRNASequencingRevealsWidespreadPausingandDivergentInitiationatHumanPromoters.Science.322(5909):1845–1848.PrekerP,etal.(2008).RNAexosomedepletionrevealstranscriptionupstreamofactivehumanpromoters.Science.322(5909):1851-4.HeY,VogelsteinB.etal.(2008)Theantisensetranscriptomesofhumancells.Science.Semsey,S.,A.D?tsch,etal.(2012).ThePseudomonasaeruginosaTranscriptomeinnktonicCulturesandStaticBiofi UsingRNASequencing.PLoSONE.7(2):e31092.Hovik,H.,W.H.Yu,etal.(2011).ComprehensiveTranscriptome ysisofthePeriodontopathogenicBacteriumPorphyromonasgingivalisW83.JournalofBacteriology.194(1):100-114.A.Toledo-Arana,A.Dobin,etal.(2011).Genome-wideantisensetranscriptiondrivesmRNAprocessinginbacteria.PNAS.108(50):20172.DmitriP,TatianaB,AlexeyS,etal.Transcriptomeysisbystrand-specificsequencingofcomplementaryDNA.NucleicAcidsResearch.2009,Vol.37,No.18.Se( fication ProtonRNA-Seq( SP-201-1404:CGRNA-Seq(fication)文庫構(gòu)建(RNaseH探針法)SP-201-1405:CGRNA-Seq(fication)文庫構(gòu)建(OligodT調(diào)離法)HS-101-1001:50SEHS-901-1001:CGNorthernBlotRNA印跡,用于檢測真核生物RNA的表達(dá)量及豐度估計,是研究真核細(xì)胞表達(dá)的基本方法。該技術(shù)的缺點是低通量,并且在檢測稀有RNAs時靈敏度不夠。tativereal-timePCR(qRT-PCR)即實時熒光定量PCRPCR,廣泛用于表達(dá)研究,指在PCR反應(yīng)體系中加入熒光基團(tuán),利用熒光信號累積實時監(jiān)測整個PCR進(jìn)程,最后通過標(biāo)準(zhǔn)曲線對未知模板進(jìn)行定量分析的方法。可用于表達(dá)的定量和用DNA陳列技術(shù)檢測證實的差異表達(dá)。實時PCR最大的缺點是價格昂貴。到目前為止,RT-PCR和NorthernBlot聯(lián)合使用,可用于定量檢測miRNAs。1995年,SAGE(SerialysisofGeneExpression,SAGE)技術(shù)首次出現(xiàn)[1],它是一種外,對一些未知特別是低拷貝的發(fā)現(xiàn)起到巨大推動作用。SAGE技術(shù)首先從待檢RNAcDNA,隨后用一種被稱為錨定酶的限制性內(nèi)切酶(Anchoringenzyme)cDNAcDNA片段與不同的接頭連接,再用酶酶切處理后得到SAGESAGE形成二聚體并進(jìn)行PCR擴(kuò)增,最后錨定酶切除接頭序列以形成二聚體的多聚體,對其新一代高通量組儀的迅速發(fā)展(Solexa,454GS-FLX,SOLiD,tSMS)不僅給基過序列比對得到最后的轉(zhuǎn)錄組,標(biāo)志著一個新的測定轉(zhuǎn)錄組的“RNA”法出現(xiàn),該技術(shù)稱為RNA技術(shù)(RNAsequancing,RNA-seq)。fication算出細(xì)胞的轉(zhuǎn)錄組表達(dá)水平。而且,數(shù)字表達(dá)譜升級版技術(shù)得到的長度比SAGE數(shù)字表達(dá)譜升級版(RNA-Seq(fication))是用來研究某一生物對象在特定生平臺豐富:提供Hiseq4000,IonProton,CG等多 80/表1.HiSeq4000,IonProton和CG平臺之間的比HiSeq4000IonCGBlack4412-43run3slide,8以完成16個RNA-Seq(20Mclean每個樣品建議10Mclean fication)產(chǎn)品目前僅提供20Mcleanreads/Total
1實驗技術(shù)流程(HiseqProton平臺81/用試劑盒去除rRNA即得到富集的mRNA;cDNAmRNA為模板,用六堿基隨機(jī)引物進(jìn)行反轉(zhuǎn)錄,合成雙A并在連接酶的作用下PCRPCR反應(yīng)體系對連接產(chǎn)物進(jìn)行擴(kuò)增,并用磁珠純化;至此,文庫文庫質(zhì)控:使用Agilent2100Bioyzer和實時熒光定量PCR進(jìn)行質(zhì)量和產(chǎn)量的利用Oligo(dT)利用Oligo(dT)末端修復(fù),加接頭后PCR2實驗流程圖(HiseqProton平臺實驗技術(shù)流程(CG平臺TotalRNA的處理(RNaseH探針法和OligodT調(diào)離法,兩種方法都能做RNaseH探針法(rRNA去除)DNArRNA,RNaseHDNA/RNA雜交鏈,再用DNaseI消化掉DNARNA82/ 形成雙鏈DNA。入片段的3’端與接頭之間有一個缺口。缺口平移及連接產(chǎn)物進(jìn)行一步缺口平移補(bǔ)成完整的雙鏈,然后PCR83/ Total
a.rRNA b.mRNARandomN6primer
Secondstrand HeatHeatSplint
DNB3CGRNA-SeqProton以bam格式保存84/4Reads在參考/組上的分布85/PAGEPAGE86/9)差異的蛋白互作網(wǎng)絡(luò)分析;表1數(shù)字表達(dá)譜升級版質(zhì)控內(nèi) 針對RNA樣本,采用電泳、NanoDrop、AgilentBioyzer等方法進(jìn)行樣品檢測。樣度,并用qPCR檢測文庫分子濃度。文庫片段大小,濃度必須符合上機(jī)標(biāo)準(zhǔn)。(質(zhì)量值Q≤10的堿基數(shù)占整條read的50%以上)。Proton平臺:去除長度低于設(shè)定閾值(30)readsreadsadaptor,若修剪后口結(jié)尾到reads結(jié)尾的所有堿基,若修剪后長度小于設(shè)定閾值則去除。cleanreads/樣品。對于數(shù)據(jù)量低于50G的項目,華大提供免費的FTP服務(wù),數(shù)據(jù)在()或者()。如果數(shù)據(jù)量小于50G,表2aHiseq4000平臺下送樣建議和級別判定(針對RNA- ficationPAGEPAGE88/論2100m≥1028S/18上抬;5S5μg≤m<10Levelm≥428S/18上抬;5S2μg≤m<4Levelm≥10c≥200上抬;5S5μg≤m<10Levelm≥1028S/18上抬;5S5μg≤m<10LevelrRNAm≥0.1c≥15ng/μL1K以Level2100 上抬;5SLevel昆蟲Total上抬;5SLevel動物Total上抬;5SLevelSe(fication2100m≥1028S/185μg≤m<10Levelm≥228S/181μg≤m<2Levelm≥10c≥2005μg≤m<10Levelm≥1028S/185μg≤m<10LevelrRNAm≥0.1rRNA比例于1KntLevel表2cCG平臺下送樣建議和級別判定(針對CGRNA-Seq(fication2100m≥528S/182.5μg≤m<5Levelm≥0.428S/180.2Levelm≥10c≥2005μg≤m<10Levelm≥528S/182.5μg≤m<5LevelmRNA,去rRNAm≥0.1rRNA比例于1KntLevelLevelB:B類樣品,指的是質(zhì)量滿足建庫要求,且總量可以滿足1次但不足2次建庫LevelC:C類樣品,指的是質(zhì)量不完全滿足建庫要求,可以風(fēng)險建庫但不保證測HiseqPAGEPAGE90/3030個,不能保證④一次送樣超過384是編碼的數(shù)量相差并不大,一般物種在3萬左右,所以,對于一般物種RNA-Seq推薦10Mcleanreads數(shù)據(jù)量。ZhipengLiu,LichaoMa,etal.ComparativeTranscriptionalProfilingProvidesInsightsintotheEvolutionandDevelopmentoftheZygomorphicFlowerofViciasativa案例描述:利用轉(zhuǎn)錄組和RNA-seq技術(shù),在組的尺度內(nèi),對豌豆的花進(jìn)行單2、AP1主要在萼片和背向、橫向、腹部花瓣中表達(dá)。AP3和PI主要在3種花瓣和中表達(dá);AG主要在和心皮中表達(dá);SEP1在6個花中都有表達(dá);瓣的Unigenes,可能為闡明花序兩側(cè)對稱的分子機(jī)制提供了重要線索;4、TCP的VsCγC1、VsCγC2、VsCγC3可能在控制豌豆花序兩側(cè)對稱中起決定作91/ (1)ExpressionpatternsofthehomologoustranscriptsidentifiedbetweenvetchArabidopsisArabidopsis92/PAGEPAGE94/(2)(2)Theexpressionpatternsofsomekeyvetch51HifzurRahman,NJagadeeshselvam,etal.Transcriptomeysisofsalinityresponsivenessincontrastinggenotypesoffingermillet(EleusinecoracanaL.)throughRNA-sequencingntMolBiol(2014)85:485-503.影響因子迫下的糧食作物的遺傳改良提供幫助(利用Proton平臺。表達(dá);同時會造成Trichy1中與黃酮生物合成相關(guān)的表達(dá)下調(diào)3、眾多涉及光合作用的在鹽脅迫下,在兩種亞型中都表達(dá)下調(diào),但在易感型CO12中Summarystatisticsofsalinityresponsivetranscriptomesequencingdatainthecontrastingfingermillet(Eleusinecoracana)genotypesanddetailsonmapofE.coracanatranscriptreadsagainstricereferenceReferencegenomesequencesusedformap;TIGR:O.sativassp.japonicaVenndiagramshowingthenumbercommonandgenotypespecificdifferentiallyexpressedgenes(DEGs)inresponsetosalinitystressintwocontrastingfingermilletgenotypes.DEGswereselectedbasedonfoldchange(twofold)andstatisticalsignificanceofρ=A.Thenumberoftranscriptsup-regulated(>twofold)duringsalinitystressinCO12andTrichy1;B.Thenumberoftranscriptsdown-regulated(>twofold)duringsalinitystressinCO12andComparisonofGeneOntology(GO)classificationsofdifferentiallyexpressed(DEGs)accordingtoGRAMENELocation,TIGRGOFunctionandKEGGPathwayinthesusceptibleCO12andthetolerantTrichy1inresponsetosalinitystress
62RoyceTE,RozowskyJS,GersteinMB.Towardauniversalmicroarray:predictionofgeneexpressionthroughnearest-neighborprobesequenceidentification.NucleicAcidsRes.2007,35,e99.WangZ,GersteinM,SnyderM.RNA-Seq:arevolutionarytoolfortranscriptomics.NatureReviewGenet.2009,10(1):57-63.MortazaviA,WilliamsBA,etal.Mapandfyingm liantranscriptomesbyRNA-Seq.NatureMethods.(2008).們需要經(jīng)過一系列數(shù)據(jù)處理以去除雜質(zhì)數(shù)據(jù),從而得到cleanreads。Hiseq平臺的原始數(shù)ATGCreads每個位置的堿基含量是否穩(wěn)定來衡量建庫、是否合格。正常情況下,reads每個位置的堿基含量分布穩(wěn)定,無AT或GC分離現(xiàn)象。堿基質(zhì)量分布反映了reads的準(zhǔn)確性,儀、試圖8a堿基含量和質(zhì)量分布圖(Hiseq平臺圖8b堿基含量和質(zhì)量分布圖(Proton平臺3使用比對軟件(Hiseq平臺/CGBWA(Li,HandDurbin,R.,2009)將32)飽和度分飽和度分析可以在一定程度上判斷數(shù)據(jù)量是否滿足需求。隨著數(shù)據(jù)量增長速度趨于平緩,說明檢測到的數(shù)趨于飽和。圖9飽和度正常情況下,Reads均勻地覆蓋在全長的各個位置,然而樣品降解、mRNA片段化時的偏向性、PCRReads的分布。同時,2009NatureReviewGenetics的一篇文章,展示了兩種不同片段化方法對隨機(jī)性的影響:
10RNAcDNA圖11樣品的Reads在參考上的分布均勻性統(tǒng)判斷上感區(qū)段的Reads覆蓋度、Gene數(shù)目分布等。對于未組裝成的組序列,我們挑選最長的24條Scaffold進(jìn)行作圖。各個樣品在組上的分布圖如下:PAGEPAGE99/對于Hiseq平臺/CG平臺,使用RSEM工具(LiBandDeweyCN.,2011)進(jìn)行表達(dá)定量。RSEM用Paired-end的關(guān)系、reads的長度、fragment的長度分布、質(zhì)量值等,基于對于Proton平臺,用Sailfish工具進(jìn)行表達(dá)定量。Sailfish用k-mer來進(jìn)行定量,首reference和k-merIndex,然后基于最大期望的算法建立最大似然的豐度估計模型,用以區(qū)分哪些轉(zhuǎn)錄本是同一個的不同亞型。水平定量結(jié)果(RSEM軟件PAGEPAGE100/Encode計劃建議的標(biāo)準(zhǔn),屬于生物重復(fù)的兩個樣品,相關(guān)性系數(shù)的平方(R2)應(yīng)513示,而三個以上則無法按比例顯示,最多允許做5個樣品間的維恩圖:14PCA作用。實際項目中,我們可以通過PCA找出離群樣品、判別相似性高的樣品簇等。PCA結(jié)主成分值,相似度高的樣品通常會成簇,同時可以判別離群樣品。15PCA3D條件特異表達(dá)分析(CG平臺需要定制化來做功能分析,可以揭示出樣品中正在發(fā)生的特異性生物過程,并可以輔助RNA層次的biomarker開發(fā)。101/令ei(g)g在樣品i中的reads數(shù),則g在所有樣品中的reads數(shù)為E(g)=∑iei(g)。令si為樣品i中所有reads數(shù),則期望的每個在樣品i中的reads數(shù)與pi=si/∑isi成比例,對于g,如果它在所有組織中均勻地表達(dá),則期望的它在組織i中reads數(shù)為fi=E(g)pi.定義富集表達(dá)(EE)EEi=ei(g)/fi(g),即g在樣品i中的reads數(shù)觀測值對期望值的比例。更大的EEi(g)代表著g更加偏向于在樣品i中表達(dá)。同時,為了評估一個較大的EEi(g)P值,它由如下公(
E(g)Pg=∑ x)pi1?我們通常定義滿足EEi(g)>5和Pi<10e-3.5的為條件特異表達(dá)。針對每個樣品篩選出來的條件特異表達(dá),會以xls文件(列的含義同定量結(jié)果并畫出統(tǒng)圖16樣品特異表達(dá)統(tǒng)計軟件包分析;③EBSeq6軟件包分析;③EBSeq6差異表達(dá)分析結(jié)果(以基于泊松分布為例102/Noiseq軟件包分析,用于篩選兩組間差異表達(dá),組內(nèi)樣品要求是生物重復(fù)。采取響因子13.6)的文獻(xiàn)。研究發(fā)現(xiàn)大部分其他方法強(qiáng)烈依賴于深度,假陽性率會隨readsNoiseq的則會保持的比較平穩(wěn);另外,Noiseq方法建立的噪聲分布模M和3030M/D分布圖(1626為i在g組所有樣品中的表達(dá)量,然后用它算出i在組間(比如g=1,g=2這兩組的差異倍數(shù)M和絕對差值DMi=log2(x1i)andDi=|xi?xix x2發(fā)生差異表達(dá)的概率P就是P(Gi=1|xi,xi)=P(Gi=1|Mi=mi,Di= 7差異表達(dá)分析結(jié)果(Noiseq分析包照組,其他若干個樣品為groupB處理組,過濾條件為差異倍數(shù)不少于2及7差異表達(dá)分析結(jié)果(Noiseq分析包9.9表達(dá)模式聚類分表達(dá)模式相似的通常具有功能相關(guān)性。我們利用cluster軟件,以歐氏距離為距離103/圖17差異表達(dá)等級聚類上圖為差異表達(dá)模式聚類圖例子。每列代表一個實驗條件(如exp1-VS-exp2),每行代表一個,不同表達(dá)變化倍數(shù)用不同顏色表示,紅色表示表達(dá)上調(diào),綠色表示表達(dá)下調(diào)。用鼠標(biāo)點擊左邊箭頭的線,其分支的線會變成紅色,中間部分所顯示的是左邊選定部分的一個放大,最右邊部分是左邊選定部分所對應(yīng)的ID或者注釋。GeneOntology(GO)是一個國際標(biāo)準(zhǔn)化的功能分類體系,提供了一套動態(tài)更新的標(biāo)準(zhǔn)詞匯表(controlledvocabulary)來全面描述生物體中和產(chǎn)物的屬性。GO總共有三個ontology,分別描述的分子功能(molecularfunction)、所處的細(xì)胞位置(cellularcomponent)、參與的生物過程(biologicalprocess)。GO功能顯著性富集分析提供與參考功能顯著相關(guān)。該分析首先把所有差異表達(dá)向GeneOntology數(shù)據(jù)庫()的各個term映射,計算每個term的數(shù)目,然后應(yīng)用超幾何檢驗,找出與整個組背景相比,在差異表達(dá)中顯著富集的GO條目,通過GO功能顯著性富集分析能確定差異表達(dá)行使的主要生物學(xué)功能。GO功能分析中同時整合了immuneresponse為在差異表達(dá)中最顯著富集的一個GOterm。104/PAGEPAGE105/8GO-行代表一個。紅色表示上調(diào),綠色表示下調(diào)。表達(dá)模式聚類分析所用工具為cluster和javaTreeview軟件。圖18參與immuneresponse的差異表達(dá)模式聚類參與的生物過程(biologicalprocess)三個部分,分別繪制富集到的TERM的從屬關(guān)系圖(對層級從上往下依次細(xì)化,最底層標(biāo)出富集到此TERM路徑的ID):圖19差異表達(dá)模式從屬關(guān)系GeneOntology得到每個差異的GO注釋后,我們用WEGO軟件(Ye,J.,etal.,2006)對差異做GO功能分類統(tǒng)計,從宏觀上認(rèn)識差異 的功能分布特征,結(jié)果展示如下:20GO在生物體內(nèi),不同相互協(xié)調(diào)行使其生物學(xué)功能,基于pathway的分析有助于更進(jìn)一步了解的生物學(xué)功能。KEGG是有關(guān)pathway的主要公共數(shù)據(jù)庫(Kanehisa,etpathway顯著性富集分析以KEGGpathway為單位,應(yīng)用超幾何檢驗,找出與整個組相比較后差異表達(dá)中顯著性富集的pathway。Qvalue≤0.05的pathway定義為在差異表達(dá)中顯著富集的pathway。通過pathway顯著性富集能確定差異表達(dá)參與的最主要生
注:Qvalue≤0.05的Pathway在差異表達(dá)中顯著富集,見表中紅框所示差異表達(dá)的pathway顯著性富集分析不但得到最有意義的pathway列表,點擊其中的pathway還將得到KEGG數(shù)據(jù)庫中pathway的詳細(xì)信息,如點上表第一列第三行的:21KEGGBcellreceptorsignalingpathway此外,我們還對KEGG富集分析結(jié)果以圖形化方式展示,見下方散點圖列表。其中RichFactor指差異表達(dá)的中位于該pathway條目的數(shù)目與所有具有注釋中位于該pathway條目的總數(shù)的比值,RichFactor越大,表示富集的程度越大。Qvalue是做過107/2020pathway22KEGG蛋白互作網(wǎng)絡(luò)分析整合了BIND、BioGrid、HPRD等相互作用網(wǎng)絡(luò)數(shù)據(jù)庫的組成。結(jié)果Medusa軟件(Hooperetal.2005)顯示。進(jìn)入網(wǎng)頁版的界面如下(注需要蛋白相互作108/23因拖動時,其他相關(guān)會隨著動;勾選Directed,顯示相互作用的有向箭頭;勾選Edgecolours,給邊;點擊Layout,Relax框變不可用,位置會重新布局,且拖動一個基此外,Cytoscape也是一款圖形化展示網(wǎng)絡(luò)并進(jìn)行分析和編輯的軟件,數(shù)據(jù)能直接圖24蛋白網(wǎng)絡(luò)互作分析圖(利用Cytoscape軟件109/差異的轉(zhuǎn)錄因子分析(適用于植物10轉(zhuǎn)錄因子又稱為反式作用因子,是指能夠結(jié)合在某上游特異的核苷酸序列上的蛋白質(zhì),這些蛋白質(zhì)能調(diào)控其靶的轉(zhuǎn)錄,具有DNA結(jié)合結(jié)構(gòu)域和轉(zhuǎn)錄激活結(jié)構(gòu)域。我們用hmmsearch搜索植物中的轉(zhuǎn)錄因子的特征結(jié)構(gòu)域來預(yù)測編碼轉(zhuǎn)錄因子的。各組差異編碼的相關(guān)轉(zhuǎn)錄因子信息結(jié)果示例如下:10110/PAGEPAGE112/
SmallRNAmRNARA0501:mRNA與小RNA小RNA和mRNA一直是功能組研究領(lǐng)域的熱點與重點,小RNA和轉(zhuǎn)錄組、提高小RNA靶預(yù)測準(zhǔn)確性,充分挖掘海量數(shù)據(jù)信息。注:小RNA樣品和mRNA樣品需要一一對應(yīng),或高通量數(shù)據(jù)均可使用;需要5對以上case+control樣品的mRNA和smRNA數(shù)據(jù)。PAGEPAGE114/(三)非編碼SmallSP-201-1302:TruSeqsmallRNA文庫HS-101-1001:50SE(HiSeq2000)什么是smallRNASmallRNAmiRNA、siRNApiRNA。它們通過各種序列特異性的沉默作用,包括RNA干擾(RNAi)、翻譯抑制、異染色質(zhì)形成SmallRNA技術(shù)則是借助第二代高通量技術(shù),對某物種某組織在特定狀態(tài)下的鑒定出的相應(yīng)已知miRNA和新miRNA進(jìn)行靶預(yù)測。通過對miRNA靶的相關(guān)分析,GOpathwaymiRNA與相應(yīng)表型差異關(guān)聯(lián)起來,從而為解釋smallRNA發(fā)展可靠性。RNA雜交的缺點是低通量,并且在檢測稀有miRNAs時靈敏度不夠。RAKEassay基于RNA引物陣列的Klenow酶(RNA-primedarray-basedKlenowemzyme,于Northernblot和其它的microarray基礎(chǔ)上的分析平臺。檢測數(shù)量低于毫克的總RNA。這種方法的特點是無序列偏移,原位合成的DNA微陣列(DNAmicroarray)探針在序列和大小上均選擇性的與成miRNA匹配,所需樣本量小而產(chǎn)量高。以上微或者微陣列技術(shù)所具有的共同特征是可高通量檢測miRNA,并可同時定PCRSQ-中,逆轉(zhuǎn)錄和連接反應(yīng)共同把分析檢測中的序列特征靶向區(qū)分miRNAs成員的區(qū)域,泛應(yīng)用于核酸檢測。由于生物化學(xué)的繁榮發(fā)展,SQ-PCR很輕易地就可發(fā)展為用于定量任何序列,從而也適用于高通量地靈敏定量已經(jīng)證實的和推測出的miRNAs。18-40nt)的smallRNA進(jìn)行高通量。繼而通過數(shù)據(jù)庫比對進(jìn)行信息分析。包括文庫構(gòu)SmallRNA為全面了解某組織在特定狀態(tài)下的smallRNA組成和功能提供了契機(jī),miRNA角度理解、解釋相關(guān)生理過程奠定了基礎(chǔ)。但為了更科學(xué)的從多角度同時解釋相關(guān)生理過程,smallRNA還可與數(shù)字表達(dá)譜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版商業(yè)建筑外墻改造與拆除一體化服務(wù)合同3篇
- 2025版土地承包經(jīng)營權(quán)轉(zhuǎn)包合同(含農(nóng)業(yè)保險)2篇
- 二零二五版物流運輸保證合同印花稅繳納規(guī)定2篇
- 2025年度木材產(chǎn)業(yè)鏈上下游合作發(fā)展合同4篇
- 2025年寬帶網(wǎng)絡(luò)安全協(xié)約
- 2025年壓瘡預(yù)防護(hù)理服務(wù)合同
- 2025年委托招標(biāo)合同
- 2025年卵巢囊腫手術(shù)協(xié)議
- 2025年度木材加工行業(yè)安全監(jiān)管合作協(xié)議3篇
- 2025年加盟運營推廣合作協(xié)議
- 眼的解剖結(jié)構(gòu)與生理功能課件
- 小學(xué)網(wǎng)管的工作總結(jié)
- 2024年銀行考試-興業(yè)銀行筆試參考題庫含答案
- 泵站運行管理現(xiàn)狀改善措施
- 2024屆武漢市部分學(xué)校中考一模數(shù)學(xué)試題含解析
- SYT 0447-2014《 埋地鋼制管道環(huán)氧煤瀝青防腐層技術(shù)標(biāo)準(zhǔn)》
- 浙教版七年級下冊科學(xué)全冊課件
- 弧度制及弧度制與角度制的換算
- 瓦楞紙箱計算公式測量方法
- DB32-T 4004-2021水質(zhì) 17種全氟化合物的測定 高效液相色譜串聯(lián)質(zhì)譜法-(高清現(xiàn)行)
- DB15T 2724-2022 羊糞污收集處理技術(shù)規(guī)范
評論
0/150
提交評論