![生物測序技術(shù)概述-轉(zhuǎn)錄組測序_第1頁](http://file4.renrendoc.com/view/ea72246861454b031792db4c602832ab/ea72246861454b031792db4c602832ab1.gif)
![生物測序技術(shù)概述-轉(zhuǎn)錄組測序_第2頁](http://file4.renrendoc.com/view/ea72246861454b031792db4c602832ab/ea72246861454b031792db4c602832ab2.gif)
![生物測序技術(shù)概述-轉(zhuǎn)錄組測序_第3頁](http://file4.renrendoc.com/view/ea72246861454b031792db4c602832ab/ea72246861454b031792db4c602832ab3.gif)
![生物測序技術(shù)概述-轉(zhuǎn)錄組測序_第4頁](http://file4.renrendoc.com/view/ea72246861454b031792db4c602832ab/ea72246861454b031792db4c602832ab4.gif)
![生物測序技術(shù)概述-轉(zhuǎn)錄組測序_第5頁](http://file4.renrendoc.com/view/ea72246861454b031792db4c602832ab/ea72246861454b031792db4c602832ab5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、生物測序技術(shù)概述轉(zhuǎn)錄組測序轉(zhuǎn)錄本All transcripts All mRNAs一、轉(zhuǎn)錄組測序簡介轉(zhuǎn)錄組轉(zhuǎn)錄組概念由Velculescu等在1995年首次提出。轉(zhuǎn)錄組:廣義上指一個細(xì)胞內(nèi)基因組DNA轉(zhuǎn)錄得到的所有轉(zhuǎn)錄產(chǎn)物以及轉(zhuǎn)錄物在細(xì)胞特定發(fā)育時期或特定生理條件下的表達(dá)水平,包括編碼RNA(mRNA)和非編碼RNA(如tRNA、rRNA、snRNA、miRNA等),狹義上指所有mRNA的集合。轉(zhuǎn)錄組研究是基因功能及結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點,是解讀基因組功能原件和揭示細(xì)胞及組織分子組成所必需的。什么是轉(zhuǎn)錄組測序RNA測序又稱轉(zhuǎn)錄組測序,就是把mRNA,smallRNA和 non-coding R
2、NA(ncRNA)全部或者其中一些用高通量測序技術(shù)進(jìn)行測序分析的技術(shù)。什么是轉(zhuǎn)錄組測序RNA_Seq的重要分支RNA_Seq是指針對轉(zhuǎn)錄產(chǎn)物RNA的測序技術(shù),主要有以下分支:轉(zhuǎn)錄組分析表達(dá)譜分析小RNA分析降解組測序針對mRNA的測序轉(zhuǎn)錄組測序是針對特定樣品特定時期的轉(zhuǎn)錄mRNA的測序技術(shù),重點在對翻譯蛋白的mRNA的測序研究。The Central Dogma of Molecular BiologyThe genome is only a source of information. In order to function, it must be expressed. The trans
3、cription of genes to produce RNA is the first stage ofgene expression. The transcriptome is the complete set of RNA transcripts produced by the genome at any one time.DNA-seqRNA-seq7轉(zhuǎn)錄組測序興起的背景生物信息學(xué)的大發(fā)展自從人類基因組測序完成,宣布后基因組時代的研究到來,基于測序的生物信息學(xué)發(fā)展空前爆發(fā)。轉(zhuǎn)錄組測序的特點應(yīng)用對象靈活廣泛針對不同物種,不同個體,不同時期,都可以在mRNA水平準(zhǔn)確的分析性狀或功能差異,
4、結(jié)構(gòu)變異等信息。研究范圍多樣化從未知基因組物種,到研究成熟的人體病變組織,小鼠組織等特異組織,均可通過轉(zhuǎn)錄組分析進(jìn)行研究。研究深度多樣化從大規(guī)模功能轉(zhuǎn)錄本發(fā)掘到特定基因的可變剪接的不同功能分析,都可以定位研究。二、基因注釋和注釋庫簡介基因功能注釋簡介同源序列比對探尋基因功能比對工具blast基因功能注釋數(shù)據(jù)庫nr、nt、UniprotCOG、interproscan、Kegg、GOBLASTBasic Local Alignment Search Tool (BLAST)結(jié)合了動態(tài)規(guī)劃算法和間接的啟發(fā)式算法的優(yōu)點,同時把數(shù)據(jù)庫檢索建立在嚴(yán)格的統(tǒng)計學(xué)基礎(chǔ)之上,是目前最常用的同源檢索工具。局部比對
5、軟件比對比較精確細(xì)致用來做同源序列比對,進(jìn)行基因功能注釋耗時較長BLAST簡介命令及參數(shù)簡介建庫命令(formatdb)比對類型,5種不同的比對程序程序名查詢序列類型查詢數(shù)據(jù)庫類型應(yīng)用blastp蛋白質(zhì)蛋白質(zhì)使用取代矩陣尋找較遠(yuǎn)關(guān)系blastn核酸核酸尋找較高分值的匹配,對較遠(yuǎn)關(guān)系不太適用blastx核酸(翻譯)蛋白質(zhì)用于分析新的cDNA序列或ESTtblastn蛋白質(zhì)核酸(翻譯)用于尋找數(shù)據(jù)庫中沒有標(biāo)注的編碼區(qū)tblastx核酸(翻譯)核酸(翻譯)用于更進(jìn)一步的分析ESTBLAST結(jié)果簡介BLAST比對結(jié)果詳解14nr&ntnr(Non-redundant protein sequences
6、)包含GenBank所有編碼序列,以及PDB,swissprot,PIR,PRF數(shù)據(jù)庫的所有編碼序列的一個非冗余數(shù)據(jù)庫,數(shù)據(jù)庫完整度高,氨基酸序列數(shù)據(jù)庫。nt(Nucleotide collection)包含GenBank和PDB中(不包含EST,STS,GSS)的所有核苷酸序列信息,存在冗余的數(shù)據(jù)庫,數(shù)據(jù)庫完整度高。nr&nt比對結(jié)果nr&nt注釋結(jié)果UniprotUniprot(Universal Protein Resource)UniProt是一個集中收錄蛋白質(zhì)資源并能與其它資源相互聯(lián)系的數(shù)據(jù)庫,也是目前為止收錄蛋白質(zhì)序列目錄最廣泛、功能注釋最全面的一個數(shù)據(jù)庫。整合三大數(shù)據(jù)庫:Swis
7、sprot、TrEMBL、PIR(Protein Information Resource)。數(shù)據(jù)庫組成:UniprotKB(知識庫)、Uniprotarc(歸檔)、Uniref(參考資料庫)。Uniprot簡介UniProtKBProtein knowledgebase, consists of two sections:Swiss-Prot, which is manually annotated and reviewed.TrEMBL, which is automatically annotated and is not reviewed.Includes complete and r
8、eference proteome sets.UniRefSequence clusters, used to speed up sequence similarity searches.UniParcSequence archive, used to keep track of sequences and their identifiers.Uniprot數(shù)據(jù)庫的最重要組成部分UniprotKB(Uniprot knowledgebase)UniProtKB/Swiss-ProtUniProtKB/Swiss-Prot主要收錄人工注釋的序列及其相關(guān)文獻(xiàn)信息和經(jīng)過計算機輔助分析的序列。這些注釋
9、都是由專業(yè)的生物學(xué)家給出的,準(zhǔn)確性無需置疑。注釋結(jié)果全面翔實,注釋包括對蛋白質(zhì)功能、酶學(xué)特性、剪接異構(gòu)體、相關(guān)疾病信息的注釋等等。注釋結(jié)果無冗余。/docs/relnotes/relstat.htmlUniprotKB/TrEMBLUniprotKB/TrEMBL主要收錄的則是高質(zhì)量的經(jīng)計算機分析后進(jìn)行自動注釋和分類的序列。由于大規(guī)模測序產(chǎn)生的海量數(shù)據(jù)無法通過Swissprot的嚴(yán)謹(jǐn)注釋思路來進(jìn)行注釋。TrEMBL存儲了比較全面完整的物種編碼序列信息。存在冗余。http:/www.ebi.ac.uk/uniprot/TrEMBLstats/Uniprot注釋途徑網(wǎng)頁提交序列本地BLAST/CO
10、GClusters of Orthologous Groups of proteins (COGs)蛋白質(zhì)直系同源數(shù)據(jù)庫。通過對菌類,藻類和真核生物等66個完整基因組的編碼蛋白,根據(jù)系統(tǒng)進(jìn)化關(guān)系構(gòu)建而成。對于預(yù)測單個蛋白的功能和整個基因組中蛋白質(zhì)的功能具有重要的作用。/COG/COGKEGG注釋途徑網(wǎng)絡(luò)提交任務(wù)blasthttp:/www.genome.jp/tools/blast/KEGG注釋結(jié)果BLAST比對結(jié)果根據(jù)比對結(jié)果提取代謝通路圖根據(jù)基因?qū)?yīng)的KO號可以從KEGG官網(wǎng)得到對應(yīng)的PATHWAY圖片KEGG注釋結(jié)果InterproscanInterproscanInterPro是一個關(guān)
11、于蛋白家族(protein families)、功能保守區(qū)域(domains)和功能位點 (funtional sites)的數(shù)據(jù)庫。該數(shù)據(jù)庫包括了PROSITE, PRINTS, Pfam , ProDom等知名蛋白結(jié)構(gòu)和功能位點及保守域的數(shù)據(jù)庫。Interproscanhttp:/www.ebi.ac.uk/Tools/pfa/iprscan/三、轉(zhuǎn)錄組測序技術(shù)方法及數(shù)據(jù)分析三、轉(zhuǎn)錄組測序技術(shù)方法轉(zhuǎn)錄組測序技術(shù)主要包括表達(dá)序列標(biāo)簽(EST)技術(shù)、表達(dá)系列分析(SAGE)技術(shù)、大規(guī)模平行測序技術(shù)(MPSS)、基因芯片和高通量測序技術(shù)。表達(dá)序列標(biāo)簽(EST)表達(dá)序列標(biāo)簽(EST)一、表達(dá)序列標(biāo)
12、簽簡介二、EST數(shù)據(jù)分析(2) 什么是表達(dá)序列標(biāo)簽? (expressed sequence tag, EST) 從已建好的cDNA庫中隨機取出一個克隆,從5末端或3末端進(jìn)行一輪單向自動測序,所獲得的約60-500bp的一段cDNA序列?;蚪M表達(dá)為RNA的序列: mRNA和功能RNA1、表達(dá)序列與表達(dá)序列標(biāo)簽概念(1) 什么是表達(dá)序列?EST的獲得途徑2、EST的用途 基因組物理圖譜的繪制 基因識別的驗證 基因表達(dá)譜的構(gòu)建 發(fā)現(xiàn)新基因 電子PCR克隆 SNP(single nucleotide polymorphism)發(fā)現(xiàn)(1) ESTs與基因圖譜的繪制基因組物理圖譜的構(gòu)建: 借助序列標(biāo)簽
13、位點(sequence-tagged sites,STS) 物理圖譜也稱為STS圖譜 EST是一種STS1995發(fā)表的人類基因組物理圖譜含有15086個STS,其中大多數(shù)為EST,平均密度為1個標(biāo)記/199kb(2) ESTs與基因預(yù)測的驗證某一個物種的基因組測序完成之后,首要任務(wù)是對基因組所包含的全部基因進(jìn)行預(yù)測,而現(xiàn)有基因預(yù)測軟件不能百分之百準(zhǔn)確預(yù)測全部基因,此時需要對預(yù)測基因進(jìn)行驗證,每一條EST代表特定基因的部分序列,因此將預(yù)測基因同物種所有的EST進(jìn)行比對,有助于基因預(yù)測的驗證。(3) ESTs與基因預(yù)測( Blast數(shù)據(jù)庫搜索)在同一物種中搜尋基因家族的新成員(paralogs)在
14、不同物種間搜尋功能相同的基因(orthologs)已知基因的不同剪切模式的搜尋(4) ESTs與SNP位點預(yù)測來自不同個體的冗余的ESTs可用于發(fā)現(xiàn)基因組中轉(zhuǎn)錄區(qū)域存在的SNPs。 應(yīng)注意區(qū)別真正的SNPs和由于測序錯誤而引起的本身不存在的SNPs。解決這一問題可以通過: 提高ESTs分析的準(zhǔn)確性 對所發(fā)現(xiàn)的SNPs進(jìn)行實驗驗證(5) ESTs與基因表達(dá)譜的構(gòu)建.Clone反轉(zhuǎn)錄(可選)讀取光密度聚類分析(非同源功能注釋)標(biāo)記雜交反轉(zhuǎn)錄EST分析.Gene Chip0.1 0.06 0.05 0.04 0 0 0.07 0.01 表達(dá)量矩陣G1,G3,G5G2,G4G6,G9利用EST,SAG
15、E分析結(jié)果制作芯片(研究已發(fā)現(xiàn)的基因)連接,轉(zhuǎn)化 Rice genome-wide DNA chip (60,000+預(yù)測基因) 果蠅基因芯片原位合成 (6) EST數(shù)據(jù)的不足ESTs很短,沒有給出完整的表達(dá)序列;低豐度表達(dá)基因不易獲得(SAGE可以解決);由于只是一輪測序結(jié)果,出錯率達(dá)2%5%;有時有載體序列和核外mRNA來源的cDNA污染或是基因組DNA的污染;有時出現(xiàn)鑲嵌克??;序列的冗余,導(dǎo)致所需要處理的數(shù)據(jù)量很大。表達(dá)序列標(biāo)簽(EST)一、表達(dá)序列標(biāo)簽簡介二、EST數(shù)據(jù)分析1、cDNA文庫的構(gòu)建與EST數(shù)據(jù)的實驗獲取非標(biāo)準(zhǔn)化cDNA文庫的構(gòu)建標(biāo)準(zhǔn)化 cDNA文庫的構(gòu)建(雜交方法如扣除雜
16、交)cDNA逆轉(zhuǎn)錄引物檢測低豐度表達(dá)基因不能用于表達(dá)譜研究適用于表達(dá)譜研究測序成本較高Oligo T引物隨機引物EST技術(shù)流程體內(nèi):翻譯體外研究:反轉(zhuǎn)錄連接,轉(zhuǎn)化文庫構(gòu)建技術(shù)已經(jīng)成熟大數(shù)據(jù)量分析理念已經(jīng)形成2、EST數(shù)據(jù)庫1993年前:EST收錄于GenBank, EBI和DDBJ1993年 NCBI 建立dbEST常用的EST數(shù)據(jù)庫數(shù)據(jù)庫名稱網(wǎng)址說明dbEST/dbEST/綜合UniGene/unigene綜合Gene Indices/tgi/綜合(1)dbEST(database of EST) Genbank的一部分63,236,621條數(shù)據(jù)(20091016)描述:向dbEST提交數(shù)據(jù)
17、按格式編輯數(shù)據(jù)通過E-mail提交更新數(shù)據(jù)dbEST數(shù)據(jù)格式Publication文件:文獻(xiàn)文件,文獻(xiàn)發(fā)表信息Library文件:文庫文件,實驗信息Contact文件:聯(lián)系人文件,聯(lián)系信息EST文件:EST數(shù)據(jù)文件,核心數(shù)據(jù)在dbEST中檢索數(shù)據(jù)利用Entrez檢索系統(tǒng)登錄NCBI FTP下載: /repository/dbEST 例:在Entrez中檢索人類血紅蛋白EST數(shù)據(jù)1). 檢索欄內(nèi)輸入關(guān)鍵詞,如“HBB Human”2). 檢索結(jié)果訪問號數(shù)據(jù)描述Gi號/數(shù)據(jù)庫來源3). 檢索結(jié)果的解讀數(shù)據(jù)記錄的編號:DN991377數(shù)據(jù)記錄的描述:數(shù)據(jù)記錄的格式:Genbank格式、EST格式數(shù)據(jù)
18、記錄的下載:下載FASTA格式序列、下載Genbank格式的文本文件(2)UniGene數(shù)據(jù)庫 Genbank的一部分一條紀(jì)錄為一個gene cluster簡介查詢UniGene通過NCBI Ftp 下載:/repository/UniGene/使用dbEST數(shù)據(jù)庫檢索例:檢索人類血紅蛋白亞基的UniGene數(shù)據(jù)1). 檢索欄內(nèi)輸入關(guān)鍵詞“HBB Human”2). 獲得檢索結(jié)果頁面3). 檢索結(jié)果解讀數(shù)據(jù)名稱:數(shù)據(jù)描述:數(shù)據(jù)格式(主要字段):SELECTED PROTEIN SIMILARITIES:基因類中相似蛋白質(zhì)集合GENE EXPRESSTION:基因表達(dá)信息SEQUECNES:與基
19、因類相關(guān)的序列,如mRNA、EST等等(3)Gene Indices數(shù)據(jù)庫 The Institute of Genomic Research Database (TIGR)中的一個子庫/tgi/ 簡介數(shù)據(jù)構(gòu)成42類動物47類植物15類原生生物10類真菌3、EST數(shù)據(jù)分析方法隨機挑取克隆進(jìn)行5或3端測序序列前處理聚類和拼接基因注釋及功能分類去除低質(zhì)量的序列(如使用Phred)應(yīng)用BLAST、RepeatMasker或Crossmatch屏蔽數(shù)據(jù)組中不屬于表達(dá)基因的贗象序列(artifactual sequences) 載體序列(/repository/vector) 重復(fù)序列(RepBase,
20、) 污染序列 (如核糖體RNA、細(xì)菌或其他物種的基因組DNA等)去除其中的嵌合克隆最后去除長度小于100bp的序列(1)序列前處理聚類目的:將來自同一個基因或同一個轉(zhuǎn)錄本的具有重疊部分(over-lapping) 的ESTs整合至單一的簇(cluster)中聚類作用: 產(chǎn)生較長的一致性序列(contigs) ,用于注釋 降低數(shù)據(jù)的冗余,糾正錯誤數(shù)據(jù)。 可以用于檢測選擇性剪切。ESTs聚類的數(shù)據(jù)庫主要有三個: UniGene (/UniGene) TIGR Gene Indices (/tdb/tgi/ ) STACK (http:/www.sanbi.ac.za/Dbases.html )(2
21、)ESTs的聚類PhrapCAP3TIGR AssemblerStaden Package(3)ESTs序列聚類拼接的主要軟件 4種ESTs聚類和拼接軟件比較PhrapCAP3TIGR AssemblerStaden Package應(yīng)用平臺UnixUnix/WindowsUnixUnix/Windows可獲得性學(xué)術(shù)用戶取得認(rèn)證后可免費下載使用需要聯(lián)系作者獲取免費下載免費下載輸入數(shù)據(jù)海量數(shù)據(jù),長短reads皆可大量數(shù)據(jù)大量數(shù)據(jù)大量數(shù)據(jù)用戶界面命令行命令行命令行命令行/圖形界面主要應(yīng)用基因組、ESTESTEST基因組、EST(4)序列注釋和分析一級序列同源性比對:使用BLAST等工具蛋白質(zhì)結(jié)構(gòu)域和
22、功能位點搜索基因功能分類:Gene Ontology 表達(dá)量比較分析:不同組織或發(fā)育階段基因表達(dá)量比較通路分析可變剪切分析基因表達(dá)系列分析(SAGE)一、SAGE技術(shù)原理簡介基因表達(dá)系列分析(Serial Analysis of Gene Expression,SAGE): 1995,Velculescu高通量、平行性檢測簡介三個基本要點9-14bp的短核苷酸序列“標(biāo)簽”(Tag)可以特異確定一個轉(zhuǎn)錄本串聯(lián)體(多聚體)分子批量分析mRNA 各轉(zhuǎn)錄本的表達(dá)水平可以用特定標(biāo)簽被測得的次數(shù)定量SAGE技術(shù)原理二、SAGE技術(shù)方案構(gòu)建SAGE文庫多聚體分子的克隆與測序標(biāo)簽序列的提取反轉(zhuǎn)錄酶切連接測序單
23、條測序相當(dāng)于對3040條EST測序分析由于采樣量大大提高,可對低表達(dá)基因進(jìn)行分析:基因表達(dá)量分析、尋找新基因等等實驗步驟較長要求較高SAGE技術(shù)方案三、SAGE技術(shù)應(yīng)用前景全基因組表達(dá)譜分析與比較深入認(rèn)識基因調(diào)控網(wǎng)絡(luò)四、SAGE數(shù)據(jù)庫與分析軟件1. NCBI SAGE數(shù)據(jù)庫 (GEO)2. SAGEnet3. The Mouse SAGE Site4. 其他SAGE數(shù)據(jù)庫(一)SAGE數(shù)據(jù)庫1. NCBI SAGE數(shù)據(jù)庫:GEOGene Expression Omnibus,2000,NCBIGEO數(shù)據(jù)庫四個基本實體 1)提交者,2)平臺,3)樣本,4)系列GEO簡介GEO數(shù)據(jù)庫查詢:在Ent
24、reZ中查詢Entrez GEO數(shù)據(jù)集 查詢所有的實驗注解 /sites/entrez?db=gds Entrez GEO表達(dá)譜查詢樣品和系列紀(jì)錄 /sites/entrez?db=geoGEO數(shù)據(jù)庫查詢: 在GEO主頁查詢/geo/例:查詢GDS325數(shù)據(jù)集的結(jié)果數(shù)據(jù)記錄的相關(guān)信息Expression Profiles:表達(dá)譜數(shù)據(jù) Data Analysis Tools:分析工具 Sample subsets:樣本子集表達(dá)譜信息分析工具樣本子集GEO數(shù)據(jù)分析Find genes 工具:快速尋找指定基因Cluster heatmap工具:樣本層次聚類圖Query Group A versus
25、B 工具:子集比較查詢Experiment design and Value distribution:數(shù)據(jù)集的數(shù)值分布GEO BLAST :使用BLAST搜索感興趣序列的表達(dá)譜數(shù)據(jù)Subset effects:子集效應(yīng),提供不同子集之間的差異信號Find genes Cluster heatmapExperiment design and Value distributionGEO數(shù)據(jù)提交與更新創(chuàng)建GEO賬號: GEO主頁點擊“Create a new account”選擇提交方式 Direct Deposit/Update:直接提交 Web Deposit/Update:Web交互方式提交
26、準(zhǔn)備數(shù)據(jù),執(zhí)行提交2. SAGEnetSAGEnet是一個關(guān)于SAGE技術(shù)方法、文檔、資訊以及收錄SAGE數(shù)據(jù)的網(wǎng)絡(luò)資源庫/主要內(nèi)容: FINDNGS:SAGE技術(shù)介紹 RESOURCES:資料及數(shù)據(jù)下載 PUBLICATIONS:SAGE出版物 CONFERENCES:相關(guān)會議信息 CONTACS US:聯(lián)系獲取SAGE資料/3. The MOUSE SAGE Site小鼠SGAE數(shù)據(jù)庫,由捷克科學(xué)院分子遺傳研究所構(gòu)建http:/mouse.img.cas.cz/sage/4. 其他SAGE數(shù)據(jù)庫GutSAGE: /GutSAGE/StormSAGE: /StomSAGE/GermSAGE:
27、 /germsage/home.html (二)SAGE分析軟件 對SAGE數(shù)據(jù)分析主要包括從原始的序列中得到標(biāo)簽列表,比較來自不同組織細(xì)胞或不同生理狀態(tài)乃至不同物種的標(biāo)簽及其出現(xiàn)頻率,在相應(yīng)數(shù)據(jù)庫中搜索匹配序列,進(jìn)行基因功能的分析或發(fā)現(xiàn)新的基因等。SAGE300與sagenet實驗方案配套使用/protocol/index.htm WEBSAGE對SAGE數(shù)據(jù)進(jìn)行統(tǒng)計分析,鑒別差異表達(dá)的標(biāo)簽,繪制分析結(jié)果的散點圖等。http:/www2.mnhn.fr/websage/ATCG從標(biāo)簽序列來構(gòu)建基因表達(dá)圖譜/ACTG/ 接受10bp的短SAGE標(biāo)簽、17bp的長SAGE標(biāo)簽、13bp的MPSS
28、標(biāo)簽、16bp的MPSS或SBS標(biāo)簽POWER-SAGE對不同大小的樣本和不同使用頻率的標(biāo)簽的組合進(jìn)行“虛擬”的SAGE實驗分析,用以確定最好的實驗方案郵件獲?。簃ichale.man 使用ATCG進(jìn)行在線的SAGE標(biāo)簽數(shù)據(jù)分析新一代高通量測序技術(shù)(RNA-seq)高通量測序技術(shù)(High-throughput sequencing)是指能夠一次并行對幾十萬到幾百萬條DNA分子進(jìn)行序列測定,每一次序列測定的讀長一般較短的測序技術(shù)。 高通量測序技術(shù)是對傳統(tǒng)測序一次革命性的改變,一次對幾十萬到幾百萬條DNA分子進(jìn)行序列測定,因此在有些文獻(xiàn)中稱其為下一代測序技術(shù)(next generation se
29、quencing),足見其劃時代的改變。同時高通量測序使得對一個物種的轉(zhuǎn)錄組和基因組進(jìn)行細(xì)致全貌的分析成為可能,所以又被稱為深度測序(deep sequencing)。新一代測序技術(shù)(Next Generation Sequencing)測序通量高(測序數(shù)據(jù)產(chǎn)出量);測序成本低(時間和價格);代表 有454,Solexa,Hiseq 2000等;高通量轉(zhuǎn)錄組測序的優(yōu)勢高通量轉(zhuǎn)錄組測序優(yōu)勢測序通量高;測序成本低;主要的測序類型454轉(zhuǎn)錄組測序(讀長較長,通量低,成本高);Illumina Solexa高通量測序(讀長短,通量高,覆蓋度更高,定量更準(zhǔn)確,測序成本低);測序儀品牌技術(shù)原理開發(fā)商Roc
30、he 454焦磷酸測序RocheIllumina Solexa邊合成邊測序IlluminaABI SOLiD基于磁珠的大規(guī)模并行連接測序ABIHelicos單分子熒光測序HelicosIon Torrent半導(dǎo)體測序ABISMRT單分子實時測序Pacific Bio現(xiàn)有主要高通量測序儀轉(zhuǎn)錄組實驗與測序原理mRNA的提取通過成熟mRNA的polyA結(jié)構(gòu)提取組織樣品的表達(dá)mRNA。反轉(zhuǎn)錄為cDNA將mRNA隨機打斷,通過利用反轉(zhuǎn)錄酶合成對應(yīng)mRNA的cDNA雙端測序?qū)DNA片段采用高通量測序儀進(jìn)行Pair-End測序。雙端測序cDNA片段化Solexa雙端測序產(chǎn)生數(shù)據(jù)類型成對Reads測序一般流
31、程(Solexa)Illumina Solexa原理橋式PCR邊合成邊測序Sequencing by Synthesis可逆終止物HiSeq 2000Illumina Solexa 測序流程a、Solexa 測序?qū)S玫臏y序芯片(flow cell)表面連接有一層單鏈引物(Primer),單鏈狀態(tài)的 DNA片斷與芯片表面的引物通過堿基互補被一端固定在芯片上;b、通過擴增反應(yīng)使得單鏈 DNA成為雙鏈 DNA;文庫制備:將基因組DNA打成幾百個堿基(或更短)的小片段,并在兩個末端加上接頭(adapter)。c、雙鏈再次變性后成為單鏈,其一端固定在測序芯片上,另外一端(5或 3)隨機和附近的另外一個引
32、物互補,被固定住,形成“橋“(bridge);d、在測序芯片上同時有上千萬 DNA 單分子發(fā)生以上的反應(yīng);e、c 中形成的單鏈橋,以周圍的引物為擴增引物,在測序芯片表面再次進(jìn)行擴增,形成雙鏈;f、雙鏈經(jīng)變性成單鏈,再次形成橋,成為下一輪擴增的模板繼續(xù)擴增反應(yīng);g、在反復(fù)進(jìn)行 30 多輪擴增,每個單分子得到了 1000 倍擴增,成為單克隆“DNA簇群”;h、“DNA簇群”在Genome Analyzer IIx測序儀上進(jìn)行序列分析;Illumina Solexa Base Calling123789456T T T T T T T G T T G C T A C G A T RNA-seq技術(shù)路
33、線文庫制備測序短序列定位計數(shù)轉(zhuǎn)錄組數(shù)據(jù)分析流程Solexa原始數(shù)據(jù)轉(zhuǎn)錄組分析流程分析結(jié)果轉(zhuǎn)錄組分析的兩種策略左邊是先比對,再通過表達(dá)量和junction信息得到轉(zhuǎn)錄本,這種方法能夠檢測到低表達(dá)量的轉(zhuǎn)錄本;右邊是對mRNA-seq的reads直接進(jìn)行de novo 組裝,得到轉(zhuǎn)錄本,但對于低表達(dá)量的轉(zhuǎn)錄本不易發(fā)現(xiàn)。轉(zhuǎn)錄組分析的兩種策略有Reference的轉(zhuǎn)錄組分析以比對為基礎(chǔ),分析有基因組的樣品的可變剪接信息,以及預(yù)測可變剪接帶來的功能差異,同時定量不同樣品的mRNA表達(dá)豐度進(jìn)行差異基因的相關(guān)分析。無Reference的轉(zhuǎn)錄組分析通過測序數(shù)據(jù)組裝大規(guī)模發(fā)掘?qū)?yīng)物種的轉(zhuǎn)錄本信息,對組裝得到轉(zhuǎn)錄本
34、做功能注釋分析,同時定量轉(zhuǎn)錄本的不同豐度進(jìn)行差異分析。兩種分析思路原始數(shù)據(jù)Reference基因組Gff基因結(jié)構(gòu)注釋差異基因分析及功能注釋分析有參考基因組無參考基因組聚類得到UnigeneUnigene的差異表達(dá)及功能注釋分析可變剪接結(jié)果可變剪接作圖TopHat+Cufflinks的可變剪接分析測序數(shù)據(jù)組裝差異基因聚類分析差異基因功能注釋結(jié)構(gòu)預(yù)測分析差異基因聚類分析差異基因功能注釋有參考基因組分析可變剪接根據(jù)軟件對基因可變剪接結(jié)果做預(yù)測結(jié)合相關(guān)基因的功能進(jìn)行深入的研究(性狀相關(guān).)原始數(shù)據(jù)Reference基因組Gff基因結(jié)構(gòu)注釋TopHat+Cufflinks的可變剪接分析可變剪接簡介一個基因在轉(zhuǎn)錄過程中經(jīng)過不同的剪接處理得到不同的mRNA從而產(chǎn)生不同的蛋白,是生物性狀多樣化的重要原因??勺兗艚宇愋屯怙@子跳過內(nèi)含子滯留互斥外顯子可變5剪接可變3剪接保守剪接類型可變剪接分析軟件TopHat針對高通量RNA_Seq的序列剪接檢測軟件,采用短序列比對軟件Bowtie進(jìn)行序列比對和剪接檢測。IGVIntegrative Genomics Viewer,圖形化瀏覽結(jié)果。Cufflink
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度農(nóng)家樂項目承包管理服務(wù)合同
- 2025年度網(wǎng)絡(luò)安全短期技術(shù)支持人員勞動合同
- 自然災(zāi)害下的臨時設(shè)施應(yīng)急救援中安全保障機制建設(shè)報告
- 二零二五年度企業(yè)團(tuán)餐配送服務(wù)合同模板
- 二零二五年度2025年度老舊小區(qū)環(huán)境衛(wèi)生清掃保潔與高效收運合同
- 二零二五年度私人房子抵押借款合同(綠色建筑推廣)
- 二零二五年度家電貨款分期支付合同
- 2025年度新型門窗系統(tǒng)集成銷售合同
- 現(xiàn)代城市小區(qū)的綠色能源管理模式
- 現(xiàn)代醫(yī)療培訓(xùn)中多媒系統(tǒng)的實踐與探索
- 2024-2030年中國產(chǎn)教融合行業(yè)市場運營態(tài)勢及發(fā)展前景研判報告
- 2024年微生物檢測試劑行業(yè)商業(yè)計劃書
- 高中英語選擇性必修一單詞表
- 初中生物校本課程綱要
- 物業(yè)公司介紹
- JTGT H21-2011 公路橋梁技術(shù)狀況評定標(biāo)準(zhǔn)
- 【永輝超市公司員工招聘問題及優(yōu)化(12000字論文)】
- 中國直銷發(fā)展四個階段解析
- 2024屆浙江省寧波市鎮(zhèn)海區(qū)鎮(zhèn)海中學(xué)高一物理第一學(xué)期期末質(zhì)量檢測試題含解析
- 部編版語文四年級下冊 教材解讀
- 《一次函數(shù)與方程、不等式》說課稿
評論
0/150
提交評論