rna-seq技術(shù)在生物轉(zhuǎn)錄組學中的應(yīng)用_第1頁
rna-seq技術(shù)在生物轉(zhuǎn)錄組學中的應(yīng)用_第2頁
rna-seq技術(shù)在生物轉(zhuǎn)錄組學中的應(yīng)用_第3頁
rna-seq技術(shù)在生物轉(zhuǎn)錄組學中的應(yīng)用_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

rna-seq技術(shù)在生物轉(zhuǎn)錄組學中的應(yīng)用

干預(yù)組研究是探索功能基因的重要途徑,是基因功能和結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點。轉(zhuǎn)錄組學相對于基因組學而言,只研究被轉(zhuǎn)錄的基因,研究范圍縮小,針對性更強。經(jīng)典的減法雜交(subtractivehybridization)、差示篩選(differentialscreening)、cDNA代表差異分析(representativedifferenceanalysis、RDA)以及mRNA差異顯示(differentialdisplay)、表達序列標簽(EST)等技術(shù)已被廣泛用于鑒定和克隆差異表達的基因,但是這些技術(shù)不能勝任對大量的植物基因進行全面、系統(tǒng)的分析,也不能對細胞內(nèi)基因表達進行準確的定量研究。于是,cDNA微陣列(cDNAmicroarray)、DNA芯片(DNAchip)、基因表達的系統(tǒng)分析(serialanalysisofgeneexpression,SAGE)和大規(guī)模平行測序技術(shù)(MPSS)等能夠大規(guī)模地進行基因差異表達分析的技術(shù)應(yīng)運而生。而近年來,基于新一代測序技術(shù)的轉(zhuǎn)錄組測序(RNA-seq)成為大規(guī)模研究轉(zhuǎn)錄組的一種新的且更為有效的方法。轉(zhuǎn)錄組測序(RNA-seq)是利用大規(guī)模測序技術(shù)直接對cDNA序列進行測序,產(chǎn)生數(shù)以千萬計的reads數(shù)量,從而使得一段特殊的基因組區(qū)域的轉(zhuǎn)錄水平可以直接通過比對到該基因組區(qū)域的reads數(shù)來衡量。RNA-seq是一個高度靈活的平臺,與其他轉(zhuǎn)錄組學技術(shù)比較,具有以下優(yōu)點:通量高、成本低、靈敏度高,可以獲得低豐度的表達基因,不局限于已知的基因組序列信息,適用于未知基因組序列的物種,不需要克隆的步驟,操作簡單,應(yīng)用領(lǐng)域廣(表1)。轉(zhuǎn)錄組測序技術(shù)被認為是一種在轉(zhuǎn)錄水平上更為精確的測定分析方法,在轉(zhuǎn)錄組學的應(yīng)用上具有革命性意義。目前,高通量測序主要有3種測序平臺(表2),測序原理及序列長度的差異決定了這3種測序儀在不同領(lǐng)域的應(yīng)用,這些測序技術(shù)已經(jīng)在動植物研究領(lǐng)域中得到了極為廣泛的應(yīng)用,開創(chuàng)了生物學研究的新時代。相對于傳統(tǒng)的sanger測序,轉(zhuǎn)錄組測序成本效率高,但其讀長較短,特異性測序誤差以及缺乏物理克隆,對序列的組裝、分析和序列的準確性提出了相當大的挑戰(zhàn),同時由于高通量的測序技術(shù),獲得海量的數(shù)據(jù),如何從這些數(shù)據(jù)中找出生物學信息,尤其是功能基因的發(fā)掘,成為這項技術(shù)能否帶來新的科學發(fā)現(xiàn)的關(guān)鍵。目前,這些問題已經(jīng)通過測序方式結(jié)合的雜交測序策略,更深度的測序,以及運用新的組裝方法和生物信息學工具解決。1干預(yù)組研究過程的主要方法和步驟1.1信息分析評估數(shù)據(jù)量是否滿足信息分析要求高通量測序數(shù)據(jù)以FASTQ格式來記錄所測的堿基讀段和質(zhì)量分數(shù)。數(shù)據(jù)產(chǎn)出后,對樣品測序獲得的Reads進行統(tǒng)計,通過統(tǒng)計各樣品Reads長度、數(shù)量、堿基數(shù)以及GC含量等指標,評估數(shù)據(jù)量是否滿足信息分析要求。之后對原始數(shù)據(jù)進行質(zhì)量評估,過濾低質(zhì)量數(shù)據(jù),應(yīng)用BLAST、RepeatMasker、Seqclean或Crossmatch等軟件遮蔽數(shù)據(jù)組中不屬于表達的基因的贗象序列,去除鑲嵌克隆,最后獲得高質(zhì)量數(shù)據(jù)再進行后續(xù)分析。1.2從頭測序組裝到illumina一般分為有參考基因組的重測序的讀長定位和無參考基因組的從頭測序組裝。重測序的讀長定位:是指針對有參考序列的數(shù)據(jù)組裝,首先將讀長進行排序,然后將所有測序讀段通過序列映射定位(mapping)到參考基因組上,與參考基因組進行比對分析,挑選出匹配好的所有讀長用于后續(xù)分析,同時進行讀長的基因定位,用于后續(xù)分析。重組裝在已具有基因組序列的模式植物中得到了廣泛應(yīng)用,目前組裝定位軟件有BWA、SOAP、SAMtools、MAQ、ZOOM等。從頭測序組裝(Denovosequenceassembly):從頭測序組裝是將各測序讀長按順序拼接成連疊群(contig),再組裝成支架(scaffle),最后將支架中間空隙的部分gap進行填洞,最終組裝成連續(xù)的較長的序列,再通過與模式植物進行比對分析(BLAST),確定基因序列。從頭組裝對于無參考序列以及短序列的組裝提供了一個有效的方法,能夠快速獲得表達基因。Roche/454技術(shù)因產(chǎn)生的讀長較長,相對容易進行從頭組裝,但對Illumina以及SOLID技術(shù)由于讀長較短,如何將短讀長拼接成一個較長的序列,在拼接策略上存在相當大的難度,近年來研究者們針對該問題,設(shè)計了各種適用于Illumina的組裝軟件,取得了較好的拼接效果。自2010年在發(fā)表在Nature雜志上的運用denovo測序(Illumina技術(shù))得到熊貓的全基因組序列,至今已在大量非模式動植物中通過3種測序平臺互相結(jié)合的方法,進行從頭測序組裝得到單一序列。目前從頭組裝最常用的軟件有:SOAPdenovo、Velvet、Oases、Abyss、ALLPATH等。1.3數(shù)據(jù)庫、搜索比對軟件和基因功能分類基因注釋,是基于假設(shè)“同源等于功能相似”,利用生物信息學方法,將未知基因序列在公共數(shù)據(jù)庫進行相似性搜索比對,通過與數(shù)據(jù)庫中已注釋基因的同源性,來推測未知基因的功能。目前已注釋的核酸數(shù)據(jù)庫主要有:GenBank(NC-BI)、EMBL、DDBJ,蛋白質(zhì)數(shù)據(jù)庫主要有:SWISS-PROT、TrEMBL。采用的搜索比對軟件主要有BLAST、FASTA等。目前使用的基因功能分類主要有2種方法:GeneOntology(簡稱GO)分類和KEGG功能分類。GO是基因功能國際標準化分類體系,把基因按照其參與生物學過程(biologicalprocess)、構(gòu)成細胞的成分(cellularcomponent)和實現(xiàn)的分子功能(molecularfunction)3個部分進行分類,適用于各個物種,能對基因進行限定和描述。KEGG數(shù)據(jù)庫能夠系統(tǒng)分析基因產(chǎn)物在細胞中的代謝途徑以及功能,生物體內(nèi),不同基因相互協(xié)調(diào)行使其生物學功能,基于KEGG(KyotoEncyclopediaofG-enesandGenomes)的分析有助于更進一步分析表達基因中存在哪些顯著性富集的Pathway注釋。2干預(yù)組研究過程中的基因挖掘2.1轉(zhuǎn)錄組檢測和基因挖掘通過測序所得到的大量的EST序列,進行處理拼接后得到Unigene,通過與多個公共數(shù)據(jù)庫的比對和注釋,運用BLAST等軟件,可從中獲得有參考注釋功能的候選基因或進行新基因的發(fā)掘。該種方法主要用于已知基因組信息或無基因組信息但有較為清楚的代謝途徑的物種的基因的發(fā)掘。對玉米的頂端分生組織(SAM)進行激光捕獲顯微切割技術(shù)獲取得到,進行454測序,共獲得261000條EST序列,通過與公共數(shù)據(jù)庫的EST的比對和注釋,最后得到18560條Unigene,通過RT-PCR方法對SAM細胞和其他組織細胞中進行了基因的驗證,同時發(fā)現(xiàn)超過大量比對不上的EST中有一些基因在SAM細胞中是特異的。以水稻的愈傷組織、莖尖、根尖、葉片、稻穗為材料,進行轉(zhuǎn)錄組的測序,共檢測到7232個新轉(zhuǎn)錄本,同時發(fā)現(xiàn)1356個融合基因,鑒定了234個候選嵌合轉(zhuǎn)錄本。利用454測序技術(shù)對美國西洋參的根進行了轉(zhuǎn)錄組的測序,共產(chǎn)生了31088單一序列,與公共數(shù)據(jù)庫NCBI的數(shù)據(jù)進行比對和功能注釋等生物信息學分析,共發(fā)現(xiàn)了150個細胞色素P450和235個糖基轉(zhuǎn)移酶單一序列,通過茉莉酸甲酯誘導試驗和real-timePCR進行組織性特異性表達分析與驗證,最終確定了1個CYP450和4個UDP基因作為與人參皂苷合成途徑的最相關(guān)的候選基因。運用Ilumina平臺對鷹嘴豆的根、芽、葉和花芽的混合池共3個樣本分別進行了轉(zhuǎn)錄組測序,對全部測序數(shù)據(jù)進行了從頭組裝,獲得了53409條非冗余轉(zhuǎn)錄本,與公共數(shù)據(jù)庫比對,有85.5%轉(zhuǎn)錄本能夠進行蛋白注釋,且與其它豆科植物的Unigene具有顯著的相似性,這些轉(zhuǎn)錄本為鷹嘴豆在不同生物代謝途徑過程中基因的發(fā)掘提供了一種有效方法。對飛蝗的轉(zhuǎn)錄組進行Illumina測序,對測序得到的序列進行從頭組裝,通過與其它已測序昆蟲進行比較,得到了72977條轉(zhuǎn)錄本,并鑒定了11490個蝗蟲蛋白編碼基因,發(fā)現(xiàn)了18個與發(fā)育相關(guān)的基因。2.2轉(zhuǎn)錄組測序與數(shù)字基因表達譜的結(jié)合對于無參考基因組且分子基礎(chǔ)研究較為薄弱的非模式物種,可以利用轉(zhuǎn)錄組測序比較得到差異表達基因,對這些差異表達基因進行聚類分析,將具有相似功能的基因聚到一起,通過已知功能基因來確定聚為一類的未知基因的功能。采用Illumina平臺對桉樹的木質(zhì)部和非木質(zhì)部組織分別進行轉(zhuǎn)錄組測序分析,通過2個轉(zhuǎn)錄組的BLAST比對和GO分析,從中區(qū)別了一批快速生長的木質(zhì)化桉樹與非木質(zhì)化桉樹的基因。對鳳眼蓮屬2種不同授粉方式(自交和雜交),4種不同基因型的花進行了Illumina轉(zhuǎn)錄組測定,通過對序列進行從頭組裝,與相對近緣種水稻進行BLAST比對和功能注釋,對4個轉(zhuǎn)錄組數(shù)據(jù)的差異比較分析,從而確定了269個與花發(fā)育相關(guān)的基因。數(shù)字基因表達譜(digitalgeneexpression,DGE)是指通過構(gòu)建處于某一特定狀態(tài)下的細胞或組織的非偏性cDNA文庫,大規(guī)模cDNA測序,收集cDNA序列片段、定性、定量分析其mRNA群體組成,從而描繪該特定細胞或組織在特定狀態(tài)下的基因表達種類和豐度信息。轉(zhuǎn)錄組測序?qū)τ诮沂巨D(zhuǎn)錄組復(fù)雜性,確定基因,以及轉(zhuǎn)錄本結(jié)構(gòu)、可變剪接、非編碼RNA和新轉(zhuǎn)錄本,作用非常強大。比較而言,DGE是更適合用于比較基因表達研究,其無偏性,因此對于細胞生物的轉(zhuǎn)錄表達譜是更為敏感和準確的方法。將轉(zhuǎn)錄組測序(RNA-seq)和DGE2種方法結(jié)合,對于無參考基因組或基因組較大且復(fù)雜的物種,可以有效地發(fā)掘新的功能基因,已經(jīng)在人類、動物和植物中基因的發(fā)掘研究中廣泛應(yīng)用。運用Illumina平臺,將各個發(fā)育階段、表型的雌性和雄性稻飛虱進行混合,進行轉(zhuǎn)錄組的測序,獲得大量Unigene,同時結(jié)合6個發(fā)育階段的蟲體的表達譜的測定,對不同發(fā)育階段表達基因進行定量分析,通過比較表達譜的差異基因,獲得了與表型差異相關(guān)以及特異發(fā)育時期的基因,并從中隨意選擇一些基因進行qRT-PCR定量分析,證實了轉(zhuǎn)錄組與表達譜結(jié)合所獲得基因以及基因表達量的可靠性和準確性。通過轉(zhuǎn)錄組測序與數(shù)字基因表達譜的結(jié)合,對非模式物種深海魚對鱸魚的免疫遺傳性進行了研究,結(jié)果表明,通過轉(zhuǎn)錄組測序可以得到2673個與免疫相關(guān)的基因,通過感染細菌與正常組織的表達譜的差異基因分析,表明具有顯著上調(diào)和下調(diào)的基因與免疫系統(tǒng)的形成表現(xiàn)是密切相關(guān)的。對紅豆杉的轉(zhuǎn)錄組進行了測序,有23515個單一序列被鑒定,同時使用DGE檢測了紅豆杉的根、莖、葉3種組織的基因差異表達情況,進行GO和KEGG分析,從而鑒定出了一批組織特異性功能基因和紫杉烷生物合成途徑的相關(guān)基因。利用Illumina技術(shù),對羅漢果花后50d和70d的果實組織進行轉(zhuǎn)錄組測序分析,所得數(shù)據(jù)用于從頭組裝和功能注釋,同時對果實發(fā)育不同階段(花后3d、50d和70d)分別進行了DEG測序,以轉(zhuǎn)錄組序列為參考,比較3個DEG的表達基因和基因表達量,在差異基因中找到了與羅漢果三萜物質(zhì)的生物合成的10個候選基因?;诟咄康霓D(zhuǎn)錄組測序與DEG的結(jié)合使用,是在轉(zhuǎn)錄組水平上開展功能基因組學研究的強有力的工具,為非模式植物的功能基因的發(fā)掘提供一個有效的方法。最近,根據(jù)標準化的Cleantag數(shù)據(jù),采用RPKM(ReadsPer

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論