第二代測序簡介_第1頁
第二代測序簡介_第2頁
第二代測序簡介_第3頁
第二代測序簡介_第4頁
第二代測序簡介_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二代測序簡介

劉云山第一代測序第一代技術(shù)主要采用1977年Sanger發(fā)明的末端終止測序法在每一輪的Sanger測序反應(yīng)中,在鏈延伸的同時加入熒光標(biāo)記過的ddNTP,被結(jié)合的鏈將終止合成反應(yīng),沒有被結(jié)合的將繼續(xù)根據(jù)模板鏈合成,一直重復(fù)這樣的過程直到所有的合成反應(yīng)都被終止。這樣將得到大量長短—末端被同熒光標(biāo)記的序列,通過電泳對以將不同長度的序列分離開,這樣就可以逐個堿基的讀出整個序列了。一個反應(yīng)所測的序列不可能太長,通常為1000個核苷酸左右,測序通量不大,且測序反應(yīng)費時費力;由于DNA聚合酶造成的堿基錯配,因此測序的準(zhǔn)確度并不高;基于技術(shù)的基因組測序十分昂貴,從基因組中預(yù)測基因的方法也十分有限。測序技術(shù)的發(fā)展90年代:DNA芯片技術(shù)21世紀(jì):第二代高通量測序技術(shù)第二代測序第二代測序,即大規(guī)模平行測序平臺,具有通量大,讀長短的特點。代表技術(shù): Illumina公司遺傳分析儀

(Solexa)

:邊合成邊測序法; Roche公司的454平臺:焦磷酸合成測序法; ABI公司推出的SOLiD系統(tǒng):邊連接邊測序法。Illumina-Solexa基本流程:1.構(gòu)建測序文庫。提取基因組DNA,隨機打斷成100~200bp片段,末端加上接頭;2.橋式擴增。解鏈后的單鏈DNA片段兩端被分別固定于芯片上,形成橋狀結(jié)構(gòu),進(jìn)行橋式PCR擴增。經(jīng)過PCR擴增,產(chǎn)生數(shù)百萬條待測的DNA片段,隨后被線性化;3.測序。將熒光標(biāo)記的dNTP、聚合酶、引物加入到測序通道啟動測序循環(huán)。DNA合成時,伴隨著堿基的加入會有焦磷酸被釋放,從而發(fā)出熒光,不同堿基用不同熒光標(biāo)記,讀取到核苷酸發(fā)出的熒光后,將3′羥基末端切割,隨后加入第2個核苷酸,重復(fù)第一個核苷酸的步驟,直到模板序列全部被合成雙鏈DNA。特點:測序通量大、速度快、成本低;性價比最高。Illumina-SolexaFlow-cellRoche-454基本流程:1.構(gòu)建測序文庫。將基因組DNA打碎成300~800bp的片段后,在兩端加上錨定接頭;2.乳液PCR擴增。每個含有接頭的DNA片段被固定在特定的磁珠上,進(jìn)行乳液PCR擴增。多個循環(huán)后,磁珠表面被打破,擴增產(chǎn)生的成千上萬個拷貝仍然在磁珠表面;3.焦磷酸測序。將磁珠轉(zhuǎn)移到PTP板上,每個PTP板上的小孔只能容下1個磁珠。分別裝有A、T、C、G4種堿基的試劑瓶,依次進(jìn)入PTP板,每次只進(jìn)1個堿基,如果發(fā)生配對,就會釋放1個焦磷酸,釋放出的熒光信號會被CCD捕獲到。每個堿基反應(yīng)都會捕獲到1個熒光信號,由此一一對應(yīng),模板的堿基序列由此獲得。特點:讀長長,但是準(zhǔn)確率低、成本高。Roche-454乳化:形成油包水的混合物。ABI-SOLiD基本流程:

1.文庫制備。將基因組DNA打斷,在其兩頭加上接頭,構(gòu)建成文庫;2.乳液PCR/磁珠富集。此過程與454測序技術(shù)類似,不過SOLiD的微珠只有1μm;3.連接測序?;旌系模笁A基單鏈熒光探針為連接反應(yīng)的底物,探針的5′端用4色熒光標(biāo)記,3′端第1、2位堿基對應(yīng)5′端熒光信號的顏色。因為只有四色熒光,而2個堿基卻有16個組合情況,故4種堿基對應(yīng)一種顏色的熒光。單次測序由5輪測序反應(yīng)組成,反應(yīng)后得到的為原始顏色序列。特點:通量最大,最準(zhǔn)確(>99.94%);但讀長最短,雙末端測序困難。ABI-SOLiDSingle-read,Paired-end,Mate-pair單末端測序(Single-read):,首先將DNA樣本進(jìn)行片段化處理形成200-500bp的片段,引物序列連接到DNA片段的一端,然后末端加上接頭,將片段固定在flowcell上生成DNA簇,上機測序單端讀取序列。這種方法較簡單,但是它只有一端有拼接信息,不利于拼裝;Single-read,Paired-end,Mate-pair雙末端測序(Paired-end):構(gòu)建待測DNA文庫時在兩端的接頭上都加上測序引物結(jié)合位點,在第一輪測序完成后,去除第一輪測序的模板鏈,用對讀測序模塊(Paired-End

Module)引導(dǎo)互補鏈在原位置再生和擴增,以達(dá)到第二輪測序所用的模板量,進(jìn)行第二輪互補鏈的合成測序。Single-read,Paired-end,Mate-pairMate-pair文庫制備:旨在生成一些短的DNA片段,這些片段包含基因組中較大跨度(2-10kb)片段兩端的序列,更具體地說:首先將基因組DNA隨機打斷到特定大?。?-10kb范圍可選);然后經(jīng)末端修復(fù),生物素標(biāo)記和環(huán)化等實驗步驟后,再把環(huán)化后的DNA分子打斷成400-600bp的片段并通過帶有鏈親和霉素的磁珠把那些帶有生物素標(biāo)記的片段捕獲。這些捕獲的片段再經(jīng)末端修飾和加上特定接頭后建成mate-pair文庫,然后上機測序。第二代測序的應(yīng)用

——基因組學(xué)與轉(zhuǎn)錄組學(xué)基因組從頭測序及重測序從頭測序:

denovosequencing,主要應(yīng)用于基因組序列未知的物種,DNA片段測序后,用生物信息學(xué)軟件對序列進(jìn)行拼接、組裝,從而獲得該物種的基因組序列圖譜。重測序是指該物種基因組序列已被測序,有參考基因組序列的測序工作。由于第2代測序技術(shù)測序讀長較短,完成基因組的從頭測序一般需要第一代測序技術(shù)的輔助,但是可以完成簡單生物的基因組從頭測序及所有生物的基因組重測序。在第二代測序技術(shù)的推動下,大量生物的全基因組被順利測序,大量物種的基因組計劃完成。基因組研究策略

主要分為基因組測序、基因組組裝、基因組完成、基因預(yù)測、基因注釋和基因組比較分析六大部分。

第一步:DNA的提取及測序。

常用平臺有:Solexa、454、SOLiD。第二步:基因組組裝。

常用的軟件有Newbler、AMOScmp、Phred/Phrap/Consed和Velvet等。第三步:基因組完成。即確定組裝獲得的Contigs之間的連接順序并修補Gaps。第四步:基因預(yù)測。常用的蛋白質(zhì)編碼基因預(yù)測軟件有Glimmer、GeneMarkS和Prodigal。第五步:基因注釋。通常要整合多個數(shù)據(jù)庫,通過序列比對進(jìn)行預(yù)測基因的注釋。第六步:基因組比較分析。通常會進(jìn)行相近物種之間或同一物種不同個體之間的基因組比較分析。轉(zhuǎn)錄組研究內(nèi)容

轉(zhuǎn)錄本結(jié)構(gòu)的研究(起始密碼子鑒定、內(nèi)含子邊界確定、UTR確定、可變剪切等),表達(dá)量研究,SNP(單核苷酸多態(tài)性)位點研究,新轉(zhuǎn)錄本檢測,非編碼區(qū)功能研究(小RNA、非編碼RNA的研究)

轉(zhuǎn)錄組:是指在特定的發(fā)育階段和生理條件下細(xì)胞中轉(zhuǎn)錄產(chǎn)生的所有轉(zhuǎn)錄物,包括mRNA、rRNA、tRNA和其他的非編碼RNA,狹義上也可以指細(xì)胞所能轉(zhuǎn)錄出的所有mRNA,這個術(shù)語適用的范圍是一個給定的有機體、組織或者特定的細(xì)胞集合。轉(zhuǎn)錄組學(xué)(transcriptomics):是一門從整體水平上研究基因轉(zhuǎn)錄情況和轉(zhuǎn)錄調(diào)控規(guī)律的學(xué)科。轉(zhuǎn)錄組學(xué)研究分為序列水平與表達(dá)量水平兩個層面的內(nèi)容,這兩個層面綜合在一起完整的反映了生物體遺傳信息的表達(dá)方式。序列水平的研究:包括對未知轉(zhuǎn)錄本的探索以及對同一個基因在不同樣品中的序列差異分析。表達(dá)量水平的研究:可以加深了解生物體基因調(diào)節(jié)的過程和特殊性狀產(chǎn)生的分子機制。RNA-seq:基于第二代測序平臺的轉(zhuǎn)錄組測序技術(shù)。轉(zhuǎn)錄組研究策略第一步:RNA提取和測序。提取總RNA,進(jìn)行預(yù)處理;將預(yù)處理后的RNA打斷后反轉(zhuǎn)錄成cDNA,在兩端加上接頭后固定到測序芯片上;隨后對測序芯片上的每個cDNA進(jìn)行擴增和測序,測到的每一段序列都是一個read。測得的所有reads就包含了樣品中的轉(zhuǎn)錄組信息。第二步,檢查reads質(zhì)量。當(dāng)二代測序的原始數(shù)據(jù)拿到手之后,第一步要做的就是看一看原始reads的質(zhì)量,常用的工具就是fastqc。轉(zhuǎn)錄組研究策略橫軸代表位置,縱軸quality。紅色表示中位數(shù),黃色是25%-75%區(qū)間,觸須是10%-90%區(qū)間,藍(lán)線是平均數(shù)。若任一位置的下四分位數(shù)低于10或中位數(shù)低于25,報"WARN";若任一位置的下四分位數(shù)低于5或中位數(shù)低于20,"FAIL".第三步,Readsmapping首先將Reads進(jìn)行Mapping,從而獲得Reads在基因組上的位置,常用的Mapping軟件有BWA、Bowtie、SOAP2等?;诤缶YTrie思想的Burrows-Wheeler轉(zhuǎn)換可以用“循環(huán)、排序”四個字來概括.將基因組序列按一定規(guī)則壓縮并建立索引,再通過查找和回溯來定位讀段,在查找時可通過堿基替代來實現(xiàn)允許的錯配。轉(zhuǎn)錄組研究策略轉(zhuǎn)錄組研究策略第四步,根據(jù)Readsmapping結(jié)果,進(jìn)行后繼分析。TSS鑒定:根據(jù)基因組上的Readscoverage來鑒定轉(zhuǎn)錄起始位點;5′UTR和3′UTR鑒定:鑒定編碼基因中轉(zhuǎn)錄但不翻譯的區(qū)域,即5′UTR和3′UTR;Operon鑒定:根據(jù)TSS、Readscoverage等鑒定;新基因鑒定:找出之前沒有注釋但是表達(dá)的區(qū)域,并根據(jù)是否存在ORF區(qū)分為蛋白質(zhì)編碼基因(Codinggene)和非蛋白質(zhì)編碼基因(SmallRNAgene);AntisenseRNA鑒定:根據(jù)SmallRNA與其他基因的位置關(guān)系確定是否是AntisenseRNA;Pseudogenes分析:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論