系統(tǒng)生物學(xué)轉(zhuǎn)錄組學(xué)市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第1頁(yè)
系統(tǒng)生物學(xué)轉(zhuǎn)錄組學(xué)市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第2頁(yè)
系統(tǒng)生物學(xué)轉(zhuǎn)錄組學(xué)市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第3頁(yè)
系統(tǒng)生物學(xué)轉(zhuǎn)錄組學(xué)市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第4頁(yè)
系統(tǒng)生物學(xué)轉(zhuǎn)錄組學(xué)市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第5頁(yè)
已閱讀5頁(yè),還剩191頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三講 轉(zhuǎn)錄組學(xué)第1頁(yè)主要內(nèi)容RNA種類和作用RNA研究方法高通量技術(shù)研究轉(zhuǎn)錄組學(xué)策略轉(zhuǎn)錄組學(xué)研究進(jìn)展microRNA研究第2頁(yè)RNA是解讀基因組關(guān)鍵RNAProteinPhenotypeGenotype DNA第3頁(yè)轉(zhuǎn)錄(transcription) 生物體以DNA為模板合成RNA過(guò)程 。 轉(zhuǎn)錄RNADNA 第4頁(yè)轉(zhuǎn)錄(Transcription):遺傳信息由DNA轉(zhuǎn)換到RNA過(guò)程。作為蛋白質(zhì)生物合成第一步,轉(zhuǎn)錄是mRNA以及非編碼RNA(tRNA、rRNA等)合成步驟。以特定DNA片段作為模板,以DNA依賴核糖核酸聚合酶(RNA聚合酶或RNA合成酶)作為催化劑而合成前mRNA過(guò)程。mRNA

2、轉(zhuǎn)錄時(shí),DNA分子雙鏈打開,在RNA聚合酶作用下,游離4種核糖核苷酸按照堿基互補(bǔ)配對(duì)標(biāo)準(zhǔn)結(jié)合到DNA單鏈上,并在RNA聚合酶作用下形成單鏈mRNA分子。轉(zhuǎn)錄本:transcript。也稱為剪切體。一條基因經(jīng)過(guò)不一樣剪接可組成不一樣轉(zhuǎn)錄本。第5頁(yè)參加轉(zhuǎn)錄物質(zhì)原料: NTP(ATP, UTP, GTP, CTP)模板: DNA酶: RNA聚合酶(RNA polymerase, RNA-pol)其它蛋白質(zhì)因子第6頁(yè)一、RNA種類和作用1. RNA種類2. 各類RNA作用第7頁(yè)RNA常見(jiàn)種類1.核糖體RNA(rRNA)2.轉(zhuǎn)運(yùn)RNA(tRNA)3.信使RNA (mRNA)第8頁(yè)RNA其它種類1.不均一

3、核RNA(hnRNA)2.小核RNA(snRNA)3. 核仁小RNA(snoRNA)4.小胞質(zhì)RNA(scRNA/7s-RNA)5. microRNA6.轉(zhuǎn)移-信使RNA(tmRNA)7.端粒酶RNA8.反義RNA第9頁(yè)核糖體RNA(rRNA)1. rRNA是核糖體組成成份 rRNA普通與核糖體蛋白質(zhì)結(jié)合在一起,形成核糖體(ribosome) 假如把rRNA從核糖體上除掉,核糖體結(jié)構(gòu)就會(huì)發(fā)生塌陷。 2. 定位(起始翻譯) 16 SrRNA3端有一段核苷酸序列與mRNA前導(dǎo)序列是互補(bǔ),這有利于mRNA與核糖體結(jié)合,進(jìn)而起始翻譯。 核糖體RNA,原核生物包含5s,16s,23s,真核生物包含5s,

4、5.8s,18s和28s,而每種rRNA各自有各自功效。第10頁(yè)轉(zhuǎn)運(yùn)RNA(tRNA) 在蛋白質(zhì)合成中作為氨基酸載體 合成i蛋白質(zhì)原材料20種氨基酸與mRNA堿基之間缺乏特殊親和力。所以,必須用一個(gè)特殊RNA轉(zhuǎn)運(yùn)RNA(tRNA)把氨基酸搬運(yùn)到核糖體上,tRNA能依據(jù)mRNA遺傳密碼依次準(zhǔn)確地把它攜帶氨基酸連結(jié)起來(lái)形成多肽鏈。 第11頁(yè)信使RNA(mRNA) 作為蛋白質(zhì)合成時(shí)模板 mRNA是以DNA一條鏈為模板,以堿基互補(bǔ)配對(duì)標(biāo)準(zhǔn),轉(zhuǎn)錄而形成一條單鏈。其功效就是把DNA上遺傳信息準(zhǔn)確無(wú)誤地轉(zhuǎn)錄下來(lái),然后再由mRNA堿基次序決定蛋白質(zhì)氨基酸次序,完成翻譯,合成蛋白質(zhì)。 第12頁(yè)不均一核RNA(h

5、nRNA)概念:在真核生物中,轉(zhuǎn)錄形成前體RNA中含有大量非編碼序列,大約只有25%序列經(jīng)加工成為mRNA,最終翻譯為蛋白質(zhì)。而因?yàn)槲唇?jīng)加工前體mRNA(pre-mRNA)在分子大小上差異很大,所以通常稱為不均一核RNA 。hn-RNA在受到加工之后,移至細(xì)胞質(zhì),作為mRNA而發(fā)揮其功效。而大部分hnRNA在核內(nèi)與各種特異蛋白質(zhì)形成復(fù)合體而存在著。 第13頁(yè)小核RNA(snRNA)概念:小核RNA,也見(jiàn)譯為核內(nèi)小RNA,是含有100到300堿基RNA,它是真核生物轉(zhuǎn)錄后加工過(guò)程中RNA剪接體主要成份。 功效:它參加真核生物細(xì)胞核中RNA加工。snRNA和許多蛋白質(zhì)結(jié)合在一起成為小核核糖核蛋白,

6、參加信使RNA前體(也就是hnRNA)剪接,使后者成為成熟mRNA。 第14頁(yè)核仁小RNA(snoRNA) 概念:核仁小分子RNA是一大類RNA分子,其大小普通在幾十到幾百個(gè)核苷酸,它們能與特定蛋白質(zhì)(如本身免疫抗原等)相結(jié)合生成snoRNP,在細(xì)胞中穩(wěn)定存在,而且富集于核仁區(qū),所以被稱為核仁小分子RNA。 功效:負(fù)責(zé)rRNA加工(切割和修飾) ,參加核糖體生物合成。第15頁(yè)小胞質(zhì)RNA(scRNA/7s-RNA)存在于細(xì)胞質(zhì)中小RNA分子(如信號(hào)識(shí)別顆粒組分中含有7sRNA),是蛋白質(zhì)內(nèi)質(zhì)網(wǎng)定位合成信號(hào)識(shí)別體組成。第16頁(yè)小RNA分子有些小RNA分子能直接調(diào)控一些基因開關(guān)從而控制細(xì)胞生長(zhǎng)發(fā)育

7、并決定細(xì)胞分化組織類型小RNA分子本身又包含了若干類RNA,依據(jù)小RNA 生成、結(jié)構(gòu)和功效大約可分為以下三類:miRNA (microRNA)siRNA (small interfering RNA)其它小RNA第17頁(yè)microRNA概念: MicroRNAs (miRNAs)是一個(gè)大小約2123個(gè)堿基單鏈小分子RNA是由含有發(fā)夾結(jié)構(gòu)約70-90個(gè)堿基大小單鏈RNA前體經(jīng)過(guò)Dicer酶加工后生成。不一樣于siRNA,不過(guò)和siRNA親密相關(guān)。功效:microRNA經(jīng)過(guò)與對(duì)應(yīng)蛋白結(jié)合,形成一個(gè)“RNA誘導(dǎo)轉(zhuǎn)錄緘默復(fù)合體”。該復(fù)合體主要有4個(gè)作用:1.降解靶mRNA;2.抑制mRNA翻譯;3.在

8、細(xì)胞核內(nèi)募集組蛋白脫乙?;傅纫蜃?,緘默DNA表示;4.擴(kuò)增對(duì)應(yīng)microRNA。 對(duì)一部分miRNAs研究分析提醒:miRNAs參加生命過(guò)程中一系列主要進(jìn)程,包含早期發(fā)育,細(xì)胞增殖,細(xì)胞凋亡,細(xì)胞死亡,脂肪代謝和細(xì)胞分化。第18頁(yè)第一個(gè)被確認(rèn)miRNA在線蟲中首次發(fā)覺(jué)lin-4 和let-7 ,能夠經(jīng)過(guò)部分互補(bǔ)結(jié)合到目標(biāo)mRNA靶3非編碼區(qū)(3UTRs),以一個(gè)未知方式誘發(fā)蛋白質(zhì)翻譯抑制,進(jìn)而抑制蛋白質(zhì)合成,經(jīng)過(guò)調(diào)控一組關(guān)鍵mRNAs翻譯從而調(diào)控線蟲發(fā)育進(jìn)程。 繼線蟲之后,隨即多個(gè)研究小組在包含人類、果蠅、植物等各種生物物種中判別出數(shù)百個(gè)miRNAs。 第19頁(yè)轉(zhuǎn)移-信使RNA(tmRNA)

9、tmRNA是一類含有類似tRNA分子和mRNA分子雙重功效小分子RNA,它在一個(gè)特殊翻譯模式反式翻譯模式過(guò)程中發(fā)揮主要作用。最近又發(fā)覺(jué)它與基因表示調(diào)控及細(xì)胞周期調(diào)控等生命過(guò)程親密相關(guān)。反式翻譯是細(xì)菌體內(nèi)一個(gè)修復(fù)翻譯水平上受阻遺傳信息表示過(guò)程機(jī)制。第20頁(yè)端粒酶RNA端粒酶是一個(gè)逆轉(zhuǎn)錄酶,是染色體端粒RNA序列。 功效:端粒酶是真核生物端粒復(fù)制模板,它能夠 使用其部分RNA作為模板來(lái)合成端粒重復(fù)單元。在大多數(shù)真核生物中,染色體末端DNA逐步丟失會(huì)被端粒酶所抑制。在含有端粒酶活性細(xì)胞內(nèi),它任務(wù)是作為反轉(zhuǎn)錄模板然后加在端粒末端以處理染色體因復(fù)制而變短問(wèn)題。這種酶在大多數(shù)細(xì)胞里是沒(méi)有活性,但在一些腫瘤

10、細(xì)胞,轉(zhuǎn)化細(xì)胞,干細(xì)胞以及生殖細(xì)胞里活性較高。 第21頁(yè)反義RNA(antisenseRNA)反義RNA(antisenseRNA),可經(jīng)過(guò)與靶位序列互補(bǔ)而與之結(jié)合RNA,或直接阻止靶序列功效,或改變靶部位構(gòu)象而影響其功效。第22頁(yè)RNA分析方法第23頁(yè)mRNA檢測(cè)技術(shù)核酸雜交技術(shù)原位雜交逆轉(zhuǎn)錄PCR (Reverse transcription PCR,RT-PCR)RACE第24頁(yè)northern blot第25頁(yè)放射性同位素標(biāo)識(shí)物-32P-dCTP靈敏度達(dá)0.01pg非放射性標(biāo)識(shí)物地高辛靈敏度達(dá)0.1pgDIG-dUTP-經(jīng)過(guò)酶促反應(yīng)摻入到DNA/RNA中去制成探針-雜交-加抗地高辛-酶

11、復(fù)合物加底物顯色探針制備第26頁(yè)探測(cè)不一樣條件下基因表示改變B. WITEK-ZAWADA,28S rRNA18S rRNA第27頁(yè)FISH:Fluorescence In Situ Hybridization原位雜交第28頁(yè)原位雜交Moroz LL, 第29頁(yè)第30頁(yè)RT-PCR是將RNA反轉(zhuǎn)錄(RT)和cDNA聚合酶鏈?zhǔn)綌U(kuò)增(PCR)相結(jié)合技術(shù)。首先經(jīng)反轉(zhuǎn)錄酶作用從RNA合成 cDNA,再以cDNA為模板,擴(kuò)增合成目標(biāo)片段。RT-PCR第31頁(yè)轉(zhuǎn)錄本All transcripts All mRNAs第32頁(yè)DNARNA蛋白質(zhì)基因組學(xué)RNA組學(xué)蛋白質(zhì)組學(xué)第33頁(yè)轉(zhuǎn)錄組轉(zhuǎn)錄組概念由Velcul

12、escu等在1995年首次提出。轉(zhuǎn)錄組:廣義上指一個(gè)細(xì)胞內(nèi)基因組DNA轉(zhuǎn)錄得到全部轉(zhuǎn)錄產(chǎn)物以及轉(zhuǎn)錄物在細(xì)胞特定發(fā)育時(shí)期或特定生理?xiàng)l件下表示水平,包含編碼RNA(mRNA)和非編碼RNA(如tRNA、rRNA、snRNA、miRNA等),狹義上指全部mRNA集合。轉(zhuǎn)錄組研究是基因功效及結(jié)構(gòu)研究基礎(chǔ)和出發(fā)點(diǎn),是解讀基因組功效原件和揭示細(xì)胞及組織分子組成所必需。第34頁(yè)轉(zhuǎn)錄組特點(diǎn):受到內(nèi)外各種原因調(diào)整,因而是動(dòng)態(tài)可變。能夠揭示不一樣物種、不一樣個(gè)體、不一樣細(xì)胞、不一樣發(fā)育階段及不一樣生理病理狀態(tài)下基因差異表示信息。第35頁(yè)轉(zhuǎn)錄組學(xué)(Transcriptomics):研究細(xì)胞在某一功效狀態(tài)下所含mRN

13、A類型與拷貝數(shù);比較不一樣功效狀態(tài)下mRNA表示改變,搜尋與功效狀態(tài)改變緊密相關(guān)主要基因群。 第36頁(yè)轉(zhuǎn)錄組研究主要目標(biāo)發(fā)覺(jué)全部轉(zhuǎn)錄本種類 確定基因結(jié)構(gòu) 確定基因表示發(fā)覺(jué)差異表示基因第37頁(yè)轉(zhuǎn)錄組測(cè)序技術(shù)主要包含:表示序列標(biāo)簽(EST)表示系列分析(SAGE)基因芯片(Chip)高通量測(cè)序技術(shù)(NGS)第38頁(yè)轉(zhuǎn)錄組測(cè)序RNA_Seq主要分支RNA_Seq是指針對(duì)轉(zhuǎn)錄產(chǎn)物RNA測(cè)序技術(shù),主要有以下分支:轉(zhuǎn)錄組分析表示譜分析小RNA分析降解組測(cè)序針對(duì)mRNA測(cè)序轉(zhuǎn)錄組測(cè)序是針對(duì)特定樣品特定時(shí)期轉(zhuǎn)錄mRNA測(cè)序技術(shù),重點(diǎn)在對(duì)翻譯蛋白mRNA測(cè)序研究。第39頁(yè)轉(zhuǎn)錄組測(cè)序特點(diǎn)應(yīng)用對(duì)象靈活廣泛針對(duì)不一樣

14、物種,不一樣個(gè)體,不一樣時(shí)期,都能夠在mRNA水平準(zhǔn)確分析性狀或功效差異,結(jié)構(gòu)變異等信息。研究范圍多樣化從未知基因組物種,到研究成熟人體病變組織,小鼠組織等特異組織,均可經(jīng)過(guò)轉(zhuǎn)錄組分析進(jìn)行研究。研究深度多樣化從大規(guī)模功效轉(zhuǎn)錄本發(fā)掘到特定基因可變剪接不一樣功效分析,都能夠定位研究。第40頁(yè)表示序列標(biāo)簽(EST)測(cè)定及分析1、什么是EST?2、EST應(yīng)用 3、EST序列測(cè)定及分析過(guò)程第41頁(yè)(2) 什么是表示序列標(biāo)簽? (expressed sequence tag, EST) 從已建好cDNA庫(kù)中隨機(jī)取出一個(gè)克隆,從5末端或3末端進(jìn)行一輪單向自動(dòng)測(cè)序,所取得約60-500bp一段cDNA序列?;?/p>

15、因組表示為RNA序列: mRNA和功效RNA1、表示序列與表示序列標(biāo)簽概念(1) 什么是表示序列?第42頁(yè)EST取得路徑第43頁(yè)cDNA文庫(kù)構(gòu)建非標(biāo)準(zhǔn)化cDNA文庫(kù)構(gòu)建。(可用于基因表示量分析) 經(jīng)標(biāo)準(zhǔn)化或扣除雜交處理cDNA文庫(kù)。(富集表示豐度較低基因) Oligo d(T) cDNA文庫(kù)。(非翻譯區(qū)因?yàn)椴缓芯幋a序列,與編碼區(qū)保守序列相比所受到選擇壓力比較小,因而其多態(tài)性程度比較高,便于多態(tài)性位點(diǎn)選擇以用于遺傳圖譜構(gòu)建。 ) 隨機(jī)引物cDNA文庫(kù)。(所取得EST在基因功效判定時(shí)含有更多信息含量,而且在構(gòu)建EST數(shù)據(jù)庫(kù)時(shí)更有優(yōu)勢(shì),同時(shí)有利于利用EST數(shù)據(jù)庫(kù)聚類完整基因和閱讀框?qū)ふ?,便于利用?/p>

16、敏感蛋白質(zhì)比較來(lái)尋找同源基因。 )第44頁(yè)cDNA文庫(kù)構(gòu)建常見(jiàn)問(wèn)題RNA得率低mRNA分離效率低cDNA產(chǎn)物少原因:多糖、多酚、內(nèi)源性核酸蛋白酶、 miRNA等第45頁(yè)原因多糖-糖蛋白(核酸蛋白酶,植物血凝素等)、多酚類等次生代謝產(chǎn)物在RNA分離時(shí),經(jīng)常與RNA共沉降,造成RNA 丟失?;蛟斐煞蛛x后RNA嚴(yán)重不純,影響mRNA分離得率。內(nèi)源性核酸酶存在較多情況下,可降解雙鏈DNA、RNA或者DNA-RNA雜合體,致使RNA易降解,轉(zhuǎn)錄后DNA接頭無(wú)法連接,是cDNA得率低原因之一。miRNA存在造成mRNA降解第46頁(yè)大規(guī)模EST序列測(cè)定開始1983年:Costanzo等提出EST概念雛形19

17、91年:Adams測(cè)定了三種人腦組織共609條EST,宣告 了cDNA大規(guī)模測(cè)序時(shí)代開始代1991年:Okubo等提出大規(guī)模cDNA測(cè)序研究戰(zhàn)略1993年:Venter等創(chuàng)建現(xiàn)在EST技術(shù)1993年:Boguski & Schuler提出以EST為界標(biāo)人類 基因組轉(zhuǎn)錄圖譜計(jì)劃第47頁(yè) 93年前ESTs數(shù)據(jù)收錄于GenBank, EBI和DDBJ。 1993年NCBI(National Center of Biotechnology Information)建立了一個(gè)專門EST數(shù)據(jù)庫(kù)dbEST來(lái)保留和搜集全部EST數(shù)據(jù)。 95年中期GenBank 中EST數(shù)目超出了非EST數(shù)目。 現(xiàn)在GenBa

18、nk中EST數(shù)目已經(jīng)超出了三千五百萬(wàn),約占GenBank中序列數(shù)60%.第48頁(yè)EST數(shù)量排名前10物種Organism ESTsHomo sapiens (human) 8,301,471Mus musculus + domesticus (mouse) 4,852,146Zea mays (maize) 2,018,798Bos taurus (cattle) 1,620,962Arabidopsis thaliana (thale cress) 1,559,485Danio rerio (zebrafish) 1,527,299Glycine max (soybean) 1,481,93

19、0Xenopus tropicalis (western clawed frog) 1,422,983Oryza sativa (rice) 1,271,375Ciona intestinalis(玻璃海鞘) 1,249,110第49頁(yè)EST技術(shù)流程體內(nèi):翻譯體外研究:反轉(zhuǎn)錄連接,轉(zhuǎn)化轉(zhuǎn)化效率問(wèn)題(基因芯片)文庫(kù)構(gòu)建技術(shù)已經(jīng)成熟測(cè)序采樣問(wèn)題(SAGE)測(cè)序成本已經(jīng)大大降低大數(shù)據(jù)量分析理念已經(jīng)形成第50頁(yè)ESTs應(yīng)用ESTs與基因識(shí)別 ESTs已經(jīng)被廣泛應(yīng)用于基因識(shí)別,因?yàn)镋STs數(shù)目比GenBank中其它核苷酸序列多,研究人員更輕易在EST庫(kù)中搜尋到新基因(Boguski et al., 19

20、94). 在同一物種中搜尋基因家族新組員(paralogs)。 在不一樣物種間搜尋功效相同基因(orthologs)。 已知基因不一樣剪切模式搜尋?!咀ⅲ翰贿^(guò)極難確定一個(gè)新序列是因?yàn)榻惶婕羟挟a(chǎn)生或是因?yàn)閏DNA文庫(kù)中污染了基因組DNA序列(Wolfsberg et al., 1997)】第51頁(yè)ESTs與基因圖譜繪制 EST能夠借助于序列標(biāo)簽位點(diǎn)(sequence-tagged sites)用于基因圖譜構(gòu)建. STS本身是從人類基因組中隨機(jī)選擇出來(lái)長(zhǎng)度在200-300bp左右經(jīng)PCR檢測(cè)基因組中唯一一段序列。來(lái)自mRNA3非翻譯區(qū)ESTs更適合做為STSs,用于基因圖譜繪制。其優(yōu)點(diǎn)主要包含:

21、因?yàn)闆](méi)有內(nèi)含子存在,所以在cDNA及基因組模板中其PCR產(chǎn)物大小相同; 與編碼區(qū)含有很強(qiáng)保守性不一樣,3UTRs序列保守性較差,所以很輕易將單個(gè)基因與編碼序列關(guān)系非常緊密相同基因家族組員分開。 (James Sikela等,1991年)第52頁(yè)ESTs與基因預(yù)測(cè) 因?yàn)镋ST起源于cDNA,所以每一條EST均代表了文庫(kù)建立時(shí)所采樣品特定發(fā)育時(shí)期和生理狀態(tài)下一個(gè)基因部分序列。使用適當(dāng)比對(duì)參數(shù),大于90已經(jīng)注釋基因都能在EST庫(kù)中檢測(cè)到(Bailey et al., 1998)。ESTs能夠做為其它基因預(yù)測(cè)算法補(bǔ)充,因?yàn)樗鼈儗?duì)預(yù)測(cè)基因交替剪切和3 非翻譯區(qū)很有效。第53頁(yè)ESTs與SNPs 來(lái)自不一

22、樣個(gè)體冗余ESTs可用于發(fā)覺(jué)基因組中轉(zhuǎn)錄區(qū)域存在SNPs。最近許多研究都證實(shí)對(duì)ESTs數(shù)據(jù)分析能夠發(fā)覺(jué)基因相關(guān)SNPs (Buetow et al., 1999;Garg et al., 1999; Marth et al., 1999; Picoult-Newberg et al., 1999) 。 應(yīng)注意區(qū)分真正SNPs和因?yàn)闇y(cè)序錯(cuò)誤( ESTs為單向測(cè)序得來(lái),錯(cuò)誤率可達(dá)2)而引發(fā)本身不存在SNPs。處理這一問(wèn)題能夠經(jīng)過(guò): 提升ESTs分析準(zhǔn)確性。 對(duì)所發(fā)覺(jué)SNPs進(jìn)行試驗(yàn)驗(yàn)證。第54頁(yè)利用ESTs大規(guī)模分析基因表示水平 因?yàn)镋ST序列是從某以特定組織cDNA文庫(kù)中隨機(jī)測(cè)序而得到,所以能夠

23、用利用未經(jīng)標(biāo)準(zhǔn)化和差減雜交cDNA文庫(kù)EST分析特定組織基因表示譜。標(biāo)準(zhǔn)化cDNA文庫(kù)和經(jīng)過(guò)差減雜交cDNA文庫(kù)則不能反應(yīng)基因表示水平。 CGAP 為研究癌癥分子機(jī)理,美國(guó)國(guó)家癌癥研究所NCI癌癥基因組解析計(jì)劃(Cancer Genome Anatomy Project , CGAP)構(gòu)建了很多正?;蚴前┌Y前期和癌癥后期組織cDNA文庫(kù),并進(jìn)行了大規(guī)模EST測(cè)序,其中大部分文庫(kù)未經(jīng)標(biāo)準(zhǔn)化或差減雜交處理。 基因表示系列分析(Serial Analysis of Gene Expression, SAGE) 基因表示系列分析是一個(gè)用于定量,高通量基因表示分析試驗(yàn)方法(Velculescu et a

24、l., 1995)。SAGE原理就是分離每個(gè)轉(zhuǎn)錄本特定位置較短單一序列標(biāo)簽(約9-21個(gè)堿基對(duì)),這些短序列被連接、克隆和測(cè)序,特定序列標(biāo)簽出現(xiàn)次數(shù)就反應(yīng)了對(duì)應(yīng)基因表示豐度。 DNA微陣列或基因芯片研究 高密度寡核苷酸cDNA 芯片或cDNA微陣列是一個(gè)新大規(guī)模檢測(cè)基因表示技術(shù),含有高通量分析優(yōu)點(diǎn)。在許多情況下,cDNA芯片探針起源于3EST (Duggan et al., 1999),所以EST序列分析有利于芯片探針設(shè)計(jì)。第55頁(yè)ESTs數(shù)據(jù)不足ESTs很短,沒(méi)有給出完整表示序列;低豐度表示基因不易取得。因?yàn)橹皇且惠啘y(cè)序結(jié)果,犯錯(cuò)率達(dá)2%-5%;有時(shí)有載體序列和核外mRNA起源cDNA污染或

25、是基因組DNA污染;有時(shí)出現(xiàn)鑲嵌克?。恍蛄腥哂?,造成所需要處理數(shù)據(jù)量很大。第56頁(yè)EST數(shù)據(jù)庫(kù)1993年前:EST收錄于GenBank, EBI和DDBJ1993年 NCBI 建立dbEST第57頁(yè)慣用EST數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)名稱網(wǎng)址說(shuō)明dbEST/dbEST/綜合UniGene/unigene綜合Gene Indices/tgi/綜合第58頁(yè)(1)dbEST(database of EST) Genbank數(shù)據(jù)庫(kù)一部分描述:Publication文件:文件文件,文件發(fā)表信息Library文件:文庫(kù)文件,試驗(yàn)信息Contact文件:聯(lián)絡(luò)人文件,聯(lián)絡(luò)信息EST文件:EST數(shù)據(jù)文件,關(guān)鍵數(shù)據(jù)第59頁(yè)(2

26、)UniGene數(shù)據(jù)庫(kù) Genbank數(shù)據(jù)庫(kù)一部分一條紀(jì)錄為一個(gè)gene cluster介紹查詢UniGene經(jīng)過(guò)NCBI Ftp 下載:/repository/UniGene/使用dbEST數(shù)據(jù)庫(kù)檢索第60頁(yè)(3)Gene Indices數(shù)據(jù)庫(kù) The Institute of Genomic Research Database (TIGR)中一個(gè)子庫(kù)/tgi/ 介紹數(shù)據(jù)組成42類動(dòng)物47類植物15類原生生物10類真菌第61頁(yè)EST數(shù)據(jù)分析方法隨機(jī)挑取克隆進(jìn)行5或3端測(cè)序序列前處理聚類和拼接基因注釋及功效分類第62頁(yè)去除低質(zhì)量序列(如使用Phred)應(yīng)用BLAST、RepeatMasker或

27、Crossmatch屏蔽數(shù)據(jù)組中不屬于表示基因贗象序列(artifactual sequences) 載體序列(/repository/vector) 重復(fù)序列(RepBase,) 污染序列 (如核糖體RNA、細(xì)菌或其它物種基因組DNA等)去除其中嵌合克隆最終去除長(zhǎng)度小于100bp序列(1)序列前處理第63頁(yè)聚類目標(biāo):未來(lái)自同一個(gè)基因或同一個(gè)轉(zhuǎn)錄本含有重合部分(over-lapping) ESTs整合至單一簇(cluster)中聚類作用: 產(chǎn)生較長(zhǎng)一致性序列(contigs) ,用于注釋 降低數(shù)據(jù)冗余,糾正錯(cuò)誤數(shù)據(jù)。 能夠用于檢測(cè)選擇性剪切。ESTs聚類數(shù)據(jù)庫(kù)主要有三個(gè): UniGene (/

28、UniGene) TIGR Gene Indices (/tdb/tgi/ ) STACK (http:/www.sanbi.ac.za/Dbases.html )(2)ESTs聚類第64頁(yè)ESTs聚類和拼接 聚類目標(biāo)就是未來(lái)自同一個(gè)基因或同一個(gè)轉(zhuǎn)錄本含有重合部分(overlapping)ESTs整合至單一簇(cluster)中。聚類作用: 產(chǎn)生較長(zhǎng)一致性序列(consensus sequence),用于注釋。 降低數(shù)據(jù)冗余,糾正錯(cuò)誤數(shù)據(jù)。 能夠用于檢測(cè)選擇性剪切。 基因表示譜分析ESTs聚類數(shù)據(jù)庫(kù)主要有三個(gè): UniGene (/UniGene) TIGR Gene Indices (/td

29、b/tgi/) STACK (http:/www.sanbi.ac.za/Dbases.html)第65頁(yè)不嚴(yán)格和嚴(yán)格聚類 (loose and stringent clustering) loose clustering 產(chǎn)生一致性序列比較長(zhǎng) 表示基因ESTs數(shù)據(jù)覆蓋率高 含有同一基因不一樣轉(zhuǎn)錄形式,如各種選擇性剪接體 每一類中可能包含旁系同源基因(paralogous expressed gene)轉(zhuǎn)錄本 序列保真度低 stringent clustering 產(chǎn)生一致性序列比較短 表示基因ESTs數(shù)據(jù)覆蓋率低 所以所含有同一基因不一樣轉(zhuǎn)錄形式少 序列保真度高第66頁(yè)(EST cluste

30、ring tutorial, httP:/www.sanbi.ac.za)有參考和無(wú)參考聚類 (Supervised and unsupervised clustering) Supervised clustering 依據(jù)已知參考序列(如全長(zhǎng)mRNA、已拼接好一致性序列) 聚類。 Unsupervised clustering 沒(méi)有依據(jù)參考序列進(jìn)行分類。第67頁(yè)Cluster連接利用cDNA克隆信息和5,3端Reads信息,不一樣Cluster能夠連接在一起。第68頁(yè)聚類問(wèn)題錯(cuò)拼 poly(A) , Linker-to-linker, Gene Families, repeat漏拼 Low

31、quality, Linker-to-linker, repeat選擇性剪切 polyAlinker第69頁(yè)(3)序列注釋和分析一級(jí)序列同源性比對(duì):使用BLAST等工具蛋白質(zhì)結(jié)構(gòu)域和功效位點(diǎn)搜索基因功效分類:Gene Ontology 表示量比較分析:不一樣組織或發(fā)育階段基因表示量比較通路分析可變剪切分析第70頁(yè) 很好匹配InterproScanNt BlastnEST sequencesNr Blastx完成注釋無(wú)理想匹配很好匹配完成注釋無(wú)理想匹配很好匹配無(wú)理想匹配New sequences域注釋后 續(xù) 分 析慣用基因注釋流程第71頁(yè)BLASTBasic Local Alignment Se

32、arch Tool (BLAST)結(jié)合了動(dòng)態(tài)規(guī)劃算法和間接啟發(fā)式算法優(yōu)點(diǎn),同時(shí)把數(shù)據(jù)庫(kù)檢索建立在嚴(yán)格統(tǒng)計(jì)學(xué)基礎(chǔ)之上,是當(dāng)前最慣用同源檢索工具。局部比對(duì)軟件比對(duì)比較準(zhǔn)確細(xì)致用來(lái)做同源序列比對(duì),進(jìn)行基因功效注釋耗時(shí)較長(zhǎng)第72頁(yè)BLAST介紹命令及參數(shù)介紹比對(duì)類型,5種不一樣比對(duì)程序在線比對(duì)和當(dāng)?shù)乇葘?duì)程序名查詢序列類型查詢數(shù)據(jù)庫(kù)類型應(yīng)用blastp蛋白質(zhì)蛋白質(zhì)使用取代矩陣尋找較遠(yuǎn)關(guān)系blastn核酸核酸尋找較高分值匹配,對(duì)較遠(yuǎn)關(guān)系不太適用blastx核酸(翻譯)蛋白質(zhì)用于分析新cDNA序列或ESTtblastn蛋白質(zhì)核酸(翻譯)用于尋找數(shù)據(jù)庫(kù)中沒(méi)有標(biāo)注編碼區(qū)tblastx核酸(翻譯)核酸(翻譯)用于

33、更深入分析EST第73頁(yè)BLAST結(jié)果介紹BLAST比對(duì)結(jié)果詳解74第74頁(yè)nr&ntnr(Non-redundant protein sequences)包含GenBank全部編碼序列,以及PDB,swissprot,PIR,PRF數(shù)據(jù)庫(kù)全部編碼序列一個(gè)非冗余數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)完整度高,氨基酸序列數(shù)據(jù)庫(kù)。nt(Nucleotide collection)包含GenBank和PDB中(不包含EST,STS,GSS)全部核苷酸序列信息,存在冗余數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)完整度高。第75頁(yè)UniprotUniprot(Universal Protein Resource)UniProt是一個(gè)集中收錄蛋白質(zhì)資源并能

34、與其它資源相互聯(lián)絡(luò)數(shù)據(jù)庫(kù),也是當(dāng)前為止收錄蛋白質(zhì)序列目錄最廣泛、功效注釋最全方面一個(gè)數(shù)據(jù)庫(kù)。整合三大數(shù)據(jù)庫(kù):Swissprot、TrEMBL、PIR(Protein Information Resource)。數(shù)據(jù)庫(kù)組成:UniprotKB(知識(shí)庫(kù))、Uniprotarc(歸檔)、Uniref(參考資料庫(kù))。第76頁(yè)Uniprot介紹UniProtKBProtein knowledgebase, consists of two sections:Swiss-Prot, which is manually annotated and reviewed.TrEMBL, which is autom

35、atically annotated and is not reviewed.Includes complete and reference proteome sets.UniRefSequence clusters, used to speed up sequence similarity searches.UniParcSequence archive, used to keep track of sequences and their identifiers.Uniprot數(shù)據(jù)庫(kù)最主要組成部分UniprotKB(Uniprot knowledgebase)第77頁(yè)UniProtKB/Sw

36、iss-ProtUniProtKB/Swiss-Prot主要收錄人工注釋序列及其相關(guān)文件信息和經(jīng)過(guò)計(jì)算機(jī)輔助分析序列。這些注釋都是由專業(yè)生物學(xué)家給出,準(zhǔn)確性無(wú)需置疑。注釋結(jié)果全方面翔實(shí),注釋包含對(duì)蛋白質(zhì)功效、酶學(xué)特征、剪接異構(gòu)體、相關(guān)疾病信息注釋等等。注釋結(jié)果無(wú)冗余。/docs/relnotes/relstat.html第78頁(yè)UniprotKB/TrEMBLUniprotKB/TrEMBL主要收錄則是高質(zhì)量經(jīng)計(jì)算機(jī)分析后進(jìn)行自動(dòng)注釋和分類序列。因?yàn)榇笠?guī)模測(cè)序產(chǎn)生海量數(shù)據(jù)無(wú)法經(jīng)過(guò)Swissprot嚴(yán)謹(jǐn)注釋思緒來(lái)進(jìn)行注釋。TrEMBL存放了比較全方面完整物種編碼序列信息。存在冗余。http:/w

37、ww.ebi.ac.uk/uniprot/TrEMBLstats/第79頁(yè)Uniprot注釋路徑網(wǎng)頁(yè)提交序列當(dāng)?shù)谺LAST/第80頁(yè)COG第81頁(yè) 第82頁(yè)KEGG注釋路徑網(wǎng)絡(luò)提交任務(wù)blasthttp:/www.genome.jp/tools/blast/第83頁(yè)KEGG注釋結(jié)果BLAST比對(duì)結(jié)果依據(jù)比對(duì)結(jié)果提取代謝通路圖依據(jù)基因?qū)?yīng)KO號(hào)能夠從KEGG官網(wǎng)得到對(duì)應(yīng)PATHWAY圖片第84頁(yè)KEGG注釋結(jié)果第85頁(yè)InterproscanInterproscanInterPro是一個(gè)關(guān)于蛋白家族(protein families)、功效保守區(qū)域(domains)和功效位點(diǎn) (funtiona

38、l sites)數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包含了PROSITE, PRINTS, Pfam , ProDom等著名蛋白結(jié)構(gòu)和功效位點(diǎn)及保守域數(shù)據(jù)庫(kù)。第86頁(yè)Interproscanhttp:/www.ebi.ac.uk/Tools/pfa/iprscan/第87頁(yè)基因注釋數(shù)據(jù)庫(kù) 注釋上基因所占百分比TIGR OGI(ver17)7126 94.3 TIGR PseudoMolecule(ver5)6151 81.4 NCBI UNIGENE(ver62)6714 88.8 NCBI nr protein database5831 77.2 93-11 BGI_Scan5854 77.5 Uniprot

39、protein database3628 48.0 TIGR to GO4565 60.4 KEGG Automatic Annotation Server945 12.5 一共有7250 (95.9%) unigenes被注釋。 第88頁(yè) 技術(shù)路線cDNA文庫(kù)構(gòu)建隨機(jī)測(cè)序得到EST序列讀取與處理序列拼接和注釋表示豐度和功效分析表示譜特征分析表示量在不一樣文庫(kù)中分布表示譜比較分析差異表示基因判定與分類功效分析作用機(jī)理分析Q-PCR驗(yàn)證第89頁(yè) EST軟件平臺(tái)EST序列庫(kù)/序列質(zhì)量檢驗(yàn)測(cè)序量監(jiān)控聚類和拼接檢驗(yàn)(借助于基因組信息)全長(zhǎng)ORF尋找發(fā)覺(jué)全長(zhǎng)基因研究表示基因概況主要試驗(yàn)伎倆(DNA ch

40、ip、proteomics先驅(qū))功效分類表示量分析交替剪接檢測(cè)EST特有信息第90頁(yè)Microarray和GeneChip大規(guī)模表示譜或全景式表示譜(global expression profile):是生物體(組織、細(xì)胞)在某一狀態(tài)下基因表示整體情況。微陣列或基因芯片(DNA chip):利用光導(dǎo)化學(xué)合成、攝影平板印刷以及固相表面化學(xué)合成等技術(shù),在固相表面合成成千上萬(wàn)個(gè)寡核苷酸探針,并與放射性同位素或熒光物標(biāo)識(shí)來(lái)自不一樣細(xì)胞、組織或整個(gè)器官DNA或mRNA反轉(zhuǎn)錄生成第一鏈cDNA進(jìn)行雜交,然后用特殊檢測(cè)系統(tǒng)對(duì)每個(gè)雜交點(diǎn)進(jìn)行定量分析。第91頁(yè)Spotted MicroarrayscDNA A

41、rraysOligo Arrays In Situ Oligo SynthesisPhotosynthesisPlaner surfaceMicrofluidics chipE-field synthesisIntegrated Chips Integrated uF, microarray and detection chips with PCR, fluorescence or e-detectionMicrofluidicsPlasticsCeramics SiliconOther materials不一樣生物芯片技術(shù)平臺(tái)點(diǎn)樣芯片原位合成芯片微流體芯片整合型芯片第92頁(yè)基因芯片探針第93

42、頁(yè)Tagged RNA fragments flushed over arrayLaser activation of fluorescent tagsOptical scanning of hybridization intensities基因芯片雜交試驗(yàn)第94頁(yè)Experimental overview:HybridizationWashingScan cy5 channelScan cy3 channel“Overlay images”Quantify pixel intensities.Cellpopulation ACell population BRNAextractionAABB

43、ReversetranscriptionAABBKlenowlabel incorporationSample B labelledwith cy3 dyeSample A labelled with cy5 dye第95頁(yè)圖像掃描Cy5Cy3第96頁(yè)Limit of Detection: 1 in 30,000 transcripts 20 transcripts/cellRed increase of Cy5 sample transcriptsGreen increase of Cy3 sample transcriptsYellow equal abundance第97頁(yè)差異表示基因篩

44、選原理:采取cy3/cy5ratio值對(duì)差異基因進(jìn)行 判斷,或采取統(tǒng)計(jì)方法對(duì)差異基因進(jìn)行統(tǒng)計(jì)推斷。 方法:倍數(shù)法:cy3/cy5比值大于2或者小于 0.5第98頁(yè) 基因芯片或微陣列技術(shù)流程.Clone反轉(zhuǎn)錄(可選)讀取光密度聚類分析(非同源功效注釋)標(biāo)識(shí)雜交反轉(zhuǎn)錄EST分析.Gene Chip0.1 0.06 0.05 0.04 0 0 0.07 0.01 表示量矩陣G1,G3,G5G2,G4G6,G9利用EST,SAGE分析結(jié)果制作芯片(研究已發(fā)覺(jué)基因)連接,轉(zhuǎn)化 Rice genome-wide DNA chip (60,000+預(yù)測(cè)基因) 果蠅基因芯片原位合成 第99頁(yè)高通量測(cè)序轉(zhuǎn)錄組研

45、究策略第100頁(yè)高通量測(cè)序中主要名詞解釋1、測(cè)序深度:測(cè)序得到總堿基數(shù)與待測(cè)基因組大小比值。假設(shè)一個(gè)基因組大小為7M,測(cè)序總堿基數(shù)為70M,則測(cè)序深度為10。2、覆蓋度:測(cè)序取得序列占整個(gè)基因組百分比。因?yàn)榛蚪M中高GC含量,重復(fù)序列等復(fù)雜結(jié)構(gòu)存在,測(cè)序最終拼接組裝序列往往無(wú)法覆蓋全部區(qū)域,這些區(qū)域就叫做Gap。二者關(guān)系:測(cè)序深度與基因組覆蓋度之間是一個(gè)正相關(guān)關(guān)系,測(cè)序帶來(lái)錯(cuò)誤率或假陽(yáng)性結(jié)果會(huì)伴隨測(cè)序深度提升而下降。當(dāng)測(cè)序深度在1015X以上時(shí),基因組覆蓋度和測(cè)序錯(cuò)誤率控制均得以確保。 第101頁(yè)RNA-seq技術(shù)路線文庫(kù)制備測(cè)序短序列定位計(jì)數(shù)第102頁(yè)Workflow of RNA-Seq樣

46、品檢測(cè)文庫(kù)制備Cluster StationIllumina Sequencing生物信息分析第103頁(yè)Total RNA樣品檢測(cè) Agilent 2200 檢測(cè)OD260/280:1.82.2 RNA 28S:18S 1.0; RIN7 新型安捷倫2200 TapeStation系統(tǒng)是新一代測(cè)序(NGS)、生物微陣列芯片分析和qPCR工流程以及蛋白質(zhì)純化和抗體生產(chǎn)過(guò)程中對(duì)生物樣品進(jìn)行質(zhì)量控制(QC)理想處理方案??蓴U(kuò)展通量16聯(lián)或96孔微量滴定板快速得到結(jié)果平均每個(gè)樣品只需一分鐘便可取得結(jié)果使用簡(jiǎn)單可直接使用ScreenTape預(yù)制膠條簡(jiǎn)化了工作流程樣品用量少每次運(yùn)行僅需要不到2ul樣品第1

47、04頁(yè)真核mRNA純化mRNA純化主要經(jīng)過(guò)磁珠與生物素吸附原理從而分離純化Oligo(dT)25磁珠純化原理主要是mRNA3poly A與磁珠在bindingbuffer作用下相結(jié)合。磁珠經(jīng)過(guò)MPC(磁分離器)從溶液中分離出來(lái)。mRNA與磁珠結(jié)合后,再用Tris-HCL在加熱條件下解離洗脫到溶液中。鏈霉親合素包被磁珠+生物素標(biāo)識(shí)Oligo(dT)25+poly(A)第105頁(yè)原核mRNA純化Ambion MICROExpress KitLNA扣鎖型探針第106頁(yè)mRNA反轉(zhuǎn)錄-fragment+RT純化過(guò)mRNA樣品加入1 lfragment buffer 70作用1.5min。加入1lsto

48、p buffer終止反應(yīng)。加入沉淀劑(NaAc 糖原 無(wú)水乙醇)沉淀產(chǎn)物。RTds cDNA第107頁(yè)末端修復(fù)(預(yù)防自連)cDNA 3末端加AAdapter連接第108頁(yè)第一天消化DNAmRNA分離mRNA打斷cDNA合成第二天末端修復(fù) 加接頭膠回收3端加A第三天PCRPCR膠回收 文庫(kù)制備 文庫(kù)質(zhì)量檢測(cè):Aligent 2100:片段大小、純度、濃度qPCR:片段大小、濃度手工檢測(cè):跑膠驗(yàn)證。第109頁(yè)ApplicationRNA-Seq (單端測(cè)序-Quantification)RNA-Seq (雙端測(cè)序-Transcriptome)Expression-profilingAlternat

49、ive SplicingFusion GeneSNP detectionHiSeq 2500Applications of RNA-Seq110第110頁(yè)轉(zhuǎn)錄組分析兩種策略左邊是先比對(duì),再經(jīng)過(guò)表示量和junction信息得到轉(zhuǎn)錄本,這種方法能夠檢測(cè)到低表示量轉(zhuǎn)錄本;右邊是對(duì)mRNA-seqreads直接進(jìn)行de novo 組裝,得到轉(zhuǎn)錄本,但對(duì)于低表示量轉(zhuǎn)錄本不易發(fā)覺(jué)。第111頁(yè)轉(zhuǎn)錄組分析兩種策略有Reference轉(zhuǎn)錄組分析以比對(duì)為基礎(chǔ),分析有基因組樣品可變剪接信息,以及預(yù)測(cè)可變剪接帶來(lái)功效差異,同時(shí)定量不一樣品mRNA表示豐度進(jìn)行差異基因相關(guān)分析。無(wú)Reference轉(zhuǎn)錄組分析經(jīng)過(guò)測(cè)序數(shù)據(jù)

50、組裝大規(guī)模發(fā)掘?qū)?yīng)物種轉(zhuǎn)錄本信息,對(duì)組裝得到轉(zhuǎn)錄本做功效注釋分析,同時(shí)定量轉(zhuǎn)錄本不一樣豐度進(jìn)行差異分析。第112頁(yè)兩種分析思緒原始數(shù)據(jù)Reference基因組Gff基因結(jié)構(gòu)注釋差異基因分析及功效注釋分析有參考基因組無(wú)參考基因組聚類得到UnigeneUnigene差異表示及功效注釋分析可變剪接結(jié)果可變剪接作圖TopHat+Cufflinks可變剪接分析測(cè)序數(shù)據(jù)組裝差異基因聚類分析差異基因功效注釋結(jié)構(gòu)預(yù)測(cè)分析差異基因聚類分析差異基因功效注釋第113頁(yè)有參考基因組分析可變剪接依據(jù)軟件對(duì)基因可變剪接結(jié)果做預(yù)測(cè)結(jié)合相關(guān)基因功效進(jìn)行深入研究(性狀相關(guān).)原始數(shù)據(jù)Reference基因組Gff基因結(jié)構(gòu)注釋T

51、opHat+Cufflinks可變剪接分析第114頁(yè)可變剪接介紹一個(gè)基因在轉(zhuǎn)錄過(guò)程中經(jīng)過(guò)不一樣剪接處理得到不一樣mRNA從而產(chǎn)生不一樣蛋白,是生物性狀多樣化主要原因。第115頁(yè)可變剪接類型外顯子跳過(guò)內(nèi)含子滯留互斥外顯子可變5剪接可變3剪接保守剪接類型第116頁(yè)可變剪接分析軟件TopHat針對(duì)高通量RNA_Seq序列剪接檢測(cè)軟件,采取短序列比對(duì)軟件Bowtie進(jìn)行序列比對(duì)和剪接檢測(cè)。Cufflinks利用Tophat檢測(cè)結(jié)果和測(cè)序Reads比對(duì)情況組裝構(gòu)建轉(zhuǎn)錄本并進(jìn)行表示豐度分析軟件。第117頁(yè)新基因發(fā)覺(jué)新編碼區(qū)域定位經(jīng)過(guò)比對(duì)結(jié)果發(fā)覺(jué)原本無(wú)基因注釋區(qū)域出現(xiàn)了編碼mRNA序列新基因功效注釋分析對(duì)新

52、基因序列做功效注釋第118頁(yè)無(wú)參考基因組分析數(shù)據(jù)組裝Orf預(yù)測(cè)SSR分析經(jīng)過(guò)BLAST做基因功效注釋分析原始數(shù)據(jù)聚類得到Unigene測(cè)序數(shù)據(jù)組裝結(jié)構(gòu)預(yù)測(cè)分析(SSR、Orf及編碼序列)第119頁(yè)測(cè)序數(shù)據(jù)組裝組裝基本原理基于測(cè)序reads之間overlap進(jìn)行序列組裝組裝軟件介紹Trinity TransabyssSOAP-Trans第120頁(yè)Trinity介紹TrinityTrinity是一個(gè)組裝構(gòu)建無(wú)Reference全長(zhǎng)轉(zhuǎn)錄本組裝軟件,專門針對(duì)高通量RNA測(cè)序設(shè)計(jì),組裝效果很好。第121頁(yè)基因表示聚類分析轉(zhuǎn)錄組學(xué)方法應(yīng)用造成基因表示數(shù)據(jù)爆炸性增加。怎樣對(duì)這些數(shù)據(jù)進(jìn)行分析,從中提取有意義生

53、物學(xué)信息,已成為轉(zhuǎn)錄組學(xué)研究熱點(diǎn)和技術(shù)瓶頸。 聚類分析技術(shù)能將待處理對(duì)象分配到對(duì)應(yīng)聚類中,使得同一聚類中對(duì)象差異較小,不一樣聚類之間對(duì)象差異較大。聚類分析技術(shù)在轉(zhuǎn)錄組學(xué)研究中,非常適合大批量分析基因群功效。 第122頁(yè)有參考基因組序列信息分析流程第123頁(yè)Reads 在基因組上分布第124頁(yè)基因結(jié)構(gòu)優(yōu)化 經(jīng)過(guò)轉(zhuǎn)錄組測(cè)序判定出酵母3 和5 UTR區(qū)域第125頁(yè) 判定基因可變剪接exon1exon2exon3exon1exon2exon3exon1exon3common readsjunction readsmRNA第126頁(yè)判定融合基因第127頁(yè)新轉(zhuǎn)錄本預(yù)測(cè)Genomic intergenic

54、regionReadsclusterPaired ReadsdistributionPaired-End (PE) Reads第128頁(yè)SNP分析第129頁(yè)Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptomeRice TranscriptomeMaterial callus root at seedling stage(14d) shoot at seedling stage(14d) flag leaves(2 stages) panicle(3

55、 stages)Methods RNASeq(paired-end & single end) DGE small RNA(18-30 nt)基因功效注釋基因結(jié)構(gòu)分析判定出大量新轉(zhuǎn)錄本可變剪接判定基因融合判定第130頁(yè)無(wú)參考基因組生物信息分析Unigene功效注釋UnigeneGO分類Unigene代謝通路分析預(yù)測(cè)編碼蛋白框(CDS)Unigene表示差異分析Unigene在樣品間差異GO分類和Pathway富集性分析第131頁(yè)De novo reads組裝流程第132頁(yè)Unigene GO 分類第133頁(yè)Unigene COG 功效分類第134頁(yè)基因表示差異分析N1:total tag Nu

56、mber in sample A N2:total tag Number in sample BX :Gene expression level in sample A y :Gene expression level in sample BReference:Audic S. et al. The significance of digital gene expression profiles. Genome Res. 1997 7(10):986-995 第135頁(yè)Unigene pathway 富集性分析第136頁(yè)P(yáng)athway富集性分析列表第137頁(yè)第138頁(yè)Genome Res Ca

57、se 試驗(yàn)材料搜集: 葉片,花序, 果實(shí), 根 時(shí)間點(diǎn):0 , 4, 8, 12, 16, 20和 24 h 將每個(gè)時(shí)間點(diǎn)采集樣品均勻混合 測(cè)序策略: Illumina 測(cè)序,1G data第139頁(yè)1. High light 2.Heat 3. Cold 4. Salt 5.Drought抗逆相關(guān)可變剪接第140頁(yè)外包膜蛋白16 (AT2G28900)Intron-retentionControlLow Temperature Resistance低溫脅迫相關(guān)AS低溫脅迫下這個(gè)內(nèi)含子和對(duì)攝影比被保留了下來(lái),揭示了可變剪接有主要功效。第141頁(yè)AS調(diào)整機(jī)制CCA1生物鐘相關(guān)基因,比如調(diào)整氣孔開

58、關(guān)等第142頁(yè)RNA-Seq單端測(cè)序(Quantification)生物信息分析內(nèi)容測(cè)序數(shù)據(jù)評(píng)定篩選差異表示基因表示模式聚類分析GO 功效富集分析Pathway 富集分析蛋白互作網(wǎng)絡(luò)分析第143頁(yè)RNA-Seq單端測(cè)序(Quantification)信息分析流程第144頁(yè)RNA-Seq與基因芯片優(yōu)缺點(diǎn)比較技術(shù)優(yōu)點(diǎn)缺點(diǎn)RNA-seq1)檢測(cè)基因數(shù)比基因芯片多25%2)定量準(zhǔn),可重復(fù)性高(重復(fù)相關(guān)系數(shù)0.99)3)數(shù)字化信號(hào),無(wú)背景噪音,無(wú)交叉雜交4)高、低豐度基因均可檢測(cè)5)不受研究物種限制,模式生物和非模式生物均可檢測(cè)6)數(shù)據(jù)可與時(shí)俱進(jìn),即隨數(shù)據(jù)庫(kù)更新而更新7)含有很好分析兼容性,數(shù)據(jù)格式與芯

59、片相同,可與芯片分析軟件兼容1)樣本要求量比基因芯片多2)數(shù)據(jù)量大,需要具備一定生物信息分析基礎(chǔ),才能愈加好挖掘數(shù)據(jù)蘊(yùn)含豐富信息基因芯片1)平臺(tái)應(yīng)用較早2)信息分析軟件較多3)有些平臺(tái)要求樣品量少1)檢測(cè)靈敏度較低、重復(fù)性差、檢測(cè)閾值較狹窄2)有背景噪音,假陽(yáng)性率1%3)受物種限制,只能檢測(cè)部分模式生物4)受基因拷貝數(shù)限制,無(wú)法檢測(cè)出低豐度基因5)只能檢測(cè)已知轉(zhuǎn)錄本,無(wú)法檢測(cè)出新轉(zhuǎn)錄本6)受數(shù)據(jù)庫(kù)數(shù)據(jù)所限,因探針依靠現(xiàn)有數(shù)據(jù)庫(kù)或比較舊版本數(shù)據(jù)庫(kù)來(lái)設(shè)計(jì),可能出現(xiàn)注釋不準(zhǔn)確情況第145頁(yè)casePlant Physiology 取樣: 選取在成熟季節(jié)開花后 5, 10, 和15個(gè)星期葡萄分別代表葡

60、萄果實(shí)成熟中三個(gè)時(shí)期(post setting, veraison和ripening)數(shù)據(jù)量: 超出59M reads數(shù)據(jù), 長(zhǎng)度在36-44bp之間利用RNA-Seq技術(shù)對(duì)葡萄果實(shí)發(fā)育過(guò)程中復(fù)雜轉(zhuǎn)錄特征研究。第146頁(yè)表二 reads在基因組上分布情況表一 測(cè)序數(shù)據(jù)葡萄RNA-Seq單端測(cè)序第147頁(yè)漿果發(fā)育三個(gè)階段共有、特有基因表示分布圖基因表示量分布第148頁(yè)表示簇分類分布情況差異表示基因GO功效注釋-分成了19個(gè)功效類群-按照基因在三個(gè)不一樣時(shí)期表示趨勢(shì)進(jìn)行分類,分成8個(gè)cluster。將基因表示和它調(diào)控一個(gè)生理功效聯(lián)絡(luò)在了一起。第149頁(yè)RNA-Seq對(duì)漿果標(biāo)識(shí)基因驗(yàn)證用RNA-Se

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論