




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、轉(zhuǎn)錄組測序(RNA-Seq),Jun Yang,RNA-Seq 的技術(shù)背景,RNA-Seq又稱轉(zhuǎn)錄組高通量測序(transcriptome sequencing)或稱為全轉(zhuǎn)錄組鳥槍法測序(Whole Transcriptom Shotgun Sequencing WTSS) 2005年以來, 以Roche 公司的454 技術(shù)、Illumina 公司的Solexa 技術(shù)和ABI 公司的SOLiD 技術(shù)為標(biāo)志的新一代測序技術(shù)誕生, 之后HelicosBiosciences 公司又推出單分子測序(Single molecule sequencing, SMS)技術(shù)。新一代測序又稱作深度測序或高通量測
2、序。,轉(zhuǎn)錄組是特定組織或細(xì)胞在某一功能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,包括mRNA和非編碼RNA。 轉(zhuǎn)錄組(transcriptome)廣義上指某一生理?xiàng)l件下,細(xì)胞內(nèi)所有轉(zhuǎn)錄產(chǎn)物的集合,包括信使RNA、核糖體RNA、轉(zhuǎn)運(yùn)RNA及非編碼RNA;狹義上指所有mRNA的集合。蛋白質(zhì)是行使細(xì)胞功能的主要承擔(dān)者,蛋白質(zhì)組是細(xì)胞功能和狀態(tài)的最直接描述,轉(zhuǎn)錄組成為研究基因表達(dá)的主要手段,轉(zhuǎn)錄組是連接基因組遺傳信息與生物功能的蛋白質(zhì)組的必然紐帶,轉(zhuǎn)錄水平的調(diào)控是目前研究最多的,也是生物體最重要的調(diào)控方式。,轉(zhuǎn)錄組?,轉(zhuǎn)錄本,All transcripts,All mRNAs,Total RNA樣品檢測,
3、OD260/280:1.82.2; RNA 28S:18S 1.0; RIN7 ; 樣品總量不低于15ug; 樣品濃度:total RNA濃度不低于400ng/ul。,樣品RNA準(zhǔn)備 2. 測序文庫構(gòu)建 使用oligo dT微珠純化mRNA mRNA片段化處理 反轉(zhuǎn)錄反應(yīng)合成合成雙鏈cDNA 雙鏈DNA末端修復(fù)及3末端加A 使用特定的測序接頭連接DNA片段兩端 高保真聚合酶擴(kuò)增構(gòu)建成功的測序文庫 3. DNA成簇(Cluster)擴(kuò)增 4. 高通量測序(Illumina Genome Analyzer IIx) 5. 數(shù)據(jù)分析 原始數(shù)據(jù)讀取 與數(shù)據(jù)庫比對并進(jìn)行注釋 深層次數(shù)據(jù)分析,實(shí)驗(yàn)流程,標(biāo)
4、準(zhǔn)信息分析流程,生物信息分析,基本信息分析,數(shù)據(jù)量產(chǎn)出:2Gb per sample 測序策略:HiSeq2000, PE91 or 101 插入片段大?。?00 bps 測序質(zhì)量控制:Q20% 80,相關(guān)概念,高通量測序中,每測一個(gè)堿基會(huì)給出一個(gè)相應(yīng)的質(zhì)量值,這個(gè)質(zhì)量值是衡量測序準(zhǔn)確度的。Q20與Q30則表示質(zhì)量值大于等于20或30的堿基所占百分比。 Q20值是指的測序過程堿基識(shí)別過程中,對所識(shí)別的堿基給出的錯(cuò)誤概率。 質(zhì)量值Q20,錯(cuò)誤識(shí)別概率是1%,即正確率是99%;質(zhì)量值Q30,錯(cuò)誤識(shí)別概率是0.1%,即正確率是99.9%;質(zhì)量值Q40,錯(cuò)誤識(shí)別概率是0.01%,即正確率99.99%;
5、Q“N”0的質(zhì)量值,就是正確率有N個(gè)9的百分比。 N50 即覆蓋50%所有核苷酸的最大Unigene長度或覆蓋 50%所有核苷酸的最大序列重疊群長度。,相關(guān)概念,高通量測序時(shí),在芯片上的每個(gè)反應(yīng),會(huì)讀出一條序列,是比較短的,叫read,它們是原始數(shù)據(jù);有很多reads通過片段重疊,能夠組裝成一個(gè)更大的片段,稱為contig;多個(gè)contigs通過片段重疊,組成一個(gè)更長的scaffold;一個(gè)contig被組成出來之后,鑒定發(fā)現(xiàn)它是編碼蛋白質(zhì)的基因,就叫singleton;多個(gè)contigs組裝成scaffold之后,鑒定發(fā)現(xiàn)它編碼蛋白質(zhì)的基因,叫unigene。 Unigene是UniqueG
6、ene的英文縮寫,意為廣泛通用的基因數(shù)據(jù)庫,通過電腦對相同基因座(Locus)的收集整理集合形成一個(gè)非冗余的基因數(shù)據(jù)庫。,相關(guān)數(shù)據(jù)庫概念,NR是NCBI里的非冗余蛋白數(shù)據(jù)庫,即NCBI的blastp程序中的NR數(shù)據(jù)庫 ,我們可以用自己的query序列,blast搜索這個(gè)數(shù)據(jù)庫,得到這些query序列的具有序列相似性的蛋白序列。 NT:NCBI的blast頁面,選擇nucleotide blast,數(shù)據(jù)庫選others,也就是(nr/nt). SWISS-PROT是經(jīng)過注釋的蛋白質(zhì)序列數(shù)據(jù)庫,由歐洲生物信息學(xué)研究所(EBI)維護(hù)。 KEGG(Kyoto Encyclopedia of Genes
7、 and Genomes,京都基因與基因組百科全書)是基因組破譯方面的數(shù)據(jù)庫。 COG是Cluster of Orthologous Groups of proteins(蛋白相鄰類的聚簇)的縮寫,即直系同源基因數(shù)據(jù)庫。 COG是對基因產(chǎn)物進(jìn)行直系同源分類的數(shù)據(jù)庫,每個(gè)COG蛋白都被假定來自祖先蛋白,COG數(shù)據(jù)庫是基于細(xì)菌、藻類、真核生物具有完整基因組的編碼蛋白、系統(tǒng)進(jìn)化關(guān)系進(jìn)行構(gòu)建的,我們將Unigene和COG數(shù)據(jù)庫進(jìn)行比對,預(yù)測Unigene可能的功能并對其做功能分類統(tǒng)計(jì),從宏觀上認(rèn)識(shí)該物種的基因功能分布特征。 GO(gene ontology)是基因本體聯(lián)合會(huì)(Gene Onotolo
8、gy Consortium)所建立的數(shù)據(jù)庫,旨在建立一個(gè)適用于各種物種的,堆積因和蛋白質(zhì)功能進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語言詞匯標(biāo)準(zhǔn),相關(guān)概念,基因的編碼區(qū)(Coding region),亦稱為“編碼序列”(Coding sequence)或“CDS”(Coding DNA Sequence),是指mRNA序列中編碼蛋白質(zhì)的那部分序列。CDS也等同于ORF(open reading frame)是編碼蛋白質(zhì)的序列,以ATG開始-終止密碼子結(jié)束。,環(huán)境轉(zhuǎn)錄組也可以這樣做,使用RNA-seq手段對實(shí)驗(yàn)樣本進(jìn)行轉(zhuǎn)錄組分析,關(guān)注個(gè)體或者組織器官在不同環(huán)境條件下基因表達(dá)的動(dòng)態(tài)變化,挖掘
9、生物對逆境適應(yīng)的分子機(jī)制。 方案設(shè)計(jì)思路建議: (1)植物個(gè)體受到較多環(huán)境因素的影響,包括溫度、干旱、澇害、光照、鹽堿、污染物、蟲害以及病原菌侵染等等,相應(yīng)采取的應(yīng)答策略也較為多樣,可以通過激素信號分子和細(xì)胞表面受體調(diào)控相關(guān)基因的表達(dá)。建議設(shè)置多個(gè)關(guān)鍵處理時(shí)間點(diǎn),研究植物個(gè)體短時(shí)間內(nèi)和長時(shí)間內(nèi)轉(zhuǎn)錄組動(dòng)態(tài)變化趨勢;揭示同一器官組織在不同環(huán)境脅迫下或不同器官組織在同一環(huán)境脅迫下基因的時(shí)空表達(dá)模式; (2)動(dòng)物器官組織樣本主要來源畜牧動(dòng)物、水產(chǎn)動(dòng)物、昆蟲、人以及模式動(dòng)物小鼠和線蟲,關(guān)注點(diǎn)為溫度處理、光照處理、污染物處理、病原菌/蟲感染、用藥前后特異性表達(dá)基因,根據(jù)基因表達(dá)模式分析揭示器官組織響應(yīng)環(huán)境
10、脅迫過程的分子機(jī)制; (3)對于微生物樣本,主要通過環(huán)境轉(zhuǎn)錄組分析不同培養(yǎng)環(huán)境、次生代謝產(chǎn)物積累以及毒素產(chǎn)生差異基因表達(dá),解析環(huán)境誘導(dǎo)活性物質(zhì)生產(chǎn)的分子機(jī)理。,環(huán)境轉(zhuǎn)錄組也可以這樣做,有參考基因組序列生物信息分析,基因結(jié)構(gòu)優(yōu)化 鑒定基因可變剪接 預(yù)測新轉(zhuǎn)錄本 SNP 分析 基因融合鑒定,有參考基因組序列信息分析流程,無參考基因組生物信息分析,Unigene功能注釋 Unigene的GO分類 Unigene代謝通路分析 預(yù)測編碼蛋白框(CDS) Unigene表達(dá)差異分析 Unigene在樣品間的差異GO分類和Pathway富集性分析,De novo reads組裝流程,Unigene GO 分類,Unigene COG 功能分類,基因表達(dá)差異分析,N1:total tag Number in sample A N2:total tag Number in sample B X :Gene expression level in sample A y :Gene expression level in sam
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 卓別林的課件
- 惠州市高三模擬數(shù)學(xué)試卷
- 湖南湘教版初一數(shù)學(xué)試卷
- 合肥一中數(shù)學(xué)試卷
- 河南體育單招數(shù)學(xué)試卷
- 健康童年暑期活動(dòng)課件
- 2020-2025年中國土壤化肥速測儀行業(yè)市場調(diào)研分析及投資前景預(yù)測報(bào)告
- 中國煤泥行業(yè)調(diào)查報(bào)告
- 遼寧省丹東市通遠(yuǎn)堡高中2025年物理高二下期末達(dá)標(biāo)測試試題含解析
- 銅排銅條加工項(xiàng)目可行性研究報(bào)告
- 2025年中小學(xué)暑假安全教育主題家長會(huì) 課件
- 2025年佛山市南海區(qū)圖書館招聘題庫帶答案分析
- 基于學(xué)科核心素養(yǎng)的初中化學(xué)單元整體教學(xué)設(shè)計(jì)課題研究的階段小結(jié)基于學(xué)科核心素養(yǎng)的初中化學(xué)單元整體教學(xué)設(shè)計(jì)研究
- GMP質(zhì)量管理體系文件 玻璃器皿檢定規(guī)程
- 三年級英語閱讀理解(打印)
- 多彩全動(dòng)畫像素游戲風(fēng)格PPT模板
- GB/T 4169.19-2006塑料注射模零件第19部分:澆口套
- GB/T 31586.1-2015防護(hù)涂料體系對鋼結(jié)構(gòu)的防腐蝕保護(hù)涂層附著力/內(nèi)聚力(破壞強(qiáng)度)的評定和驗(yàn)收準(zhǔn)則第1部分:拉開法試驗(yàn)
- 領(lǐng)導(dǎo)干部的決策力與執(zhí)行力
- 史上最全最權(quán)威婦產(chǎn)科icd編碼培訓(xùn)【版】課件
- 運(yùn)梁便道施工技術(shù)方案(填土)
評論
0/150
提交評論