核酸測(cè)序技術(shù)的回顧與展望_圖文_第1頁
核酸測(cè)序技術(shù)的回顧與展望_圖文_第2頁
核酸測(cè)序技術(shù)的回顧與展望_圖文_第3頁
核酸測(cè)序技術(shù)的回顧與展望_圖文_第4頁
核酸測(cè)序技術(shù)的回顧與展望_圖文_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、核酸測(cè)序技術(shù)的回顧與展望盧辰 蔬菜學(xué) 2009305010014摘要在過去的30多年中,核酸(包括DNA 和RNA )測(cè)序技術(shù),作為最重要的分子生物學(xué)研究手段之一,經(jīng)歷了多次技術(shù)突破,數(shù)據(jù)產(chǎn)出能力呈指數(shù)增長(zhǎng),并且測(cè)序技術(shù)本身也演變成為生物工程和物理學(xué)的新技術(shù)增長(zhǎng)點(diǎn)。本文回顧了從第一代Sanger 測(cè)序到下一代測(cè)序的技術(shù)特點(diǎn)和應(yīng)用,并對(duì)即將投入應(yīng)用的第三代測(cè)序技術(shù)進(jìn)行了前瞻性的展望。關(guān)鍵詞:核酸測(cè)序 下一代測(cè)序AbstractAs one of the most important tools of molecular biology, the nucleic acid (including D

2、NA and RNA sequencing technology has experienced several breakthroughs in the past three decades. The sequencing technology has not only been improving its productivity in the exponential growth rate but also been evolving into a new layout of technological territories toward bioengineering and phys

3、ical disciplines. This view look into the technical characteristics and applications from Sanger sequencing to the next generation sequencing, and provide prospective insights into the third generation sequencing.Keywords: Nucleic acids sequencing, next generation sequencing現(xiàn)代生物學(xué)的核心問題之一,就是遺傳信息的傳遞、表達(dá)

4、及其調(diào)控。為了理解這個(gè)問題,獲得遺傳信息的攜帶者核酸(DNA 和RNA )的具體序列,就顯得尤為重要。因此,核酸測(cè)序技術(shù)也就順理成章地成為分子生物學(xué)的核心研究手段之一。上世紀(jì)70年代中期,F(xiàn)rederick Sanger發(fā)明了末端終止測(cè)序技術(shù),因此獲得1980年諾貝爾化學(xué)獎(jiǎng)。隨即,基于Sanger 法的第一代自動(dòng)化測(cè)序技術(shù)被開發(fā)出來,人們終于可以大批量地深入了解生物遺傳的密碼。近40年來,測(cè)序技術(shù)領(lǐng)域發(fā)生了翻天覆地的變化,測(cè)序通量的升級(jí)速率,猶如半導(dǎo)體工業(yè)的摩爾定律(Moores Law一般呈指數(shù)級(jí)地增長(zhǎng)。測(cè)序技術(shù)的高速發(fā)展,海量涌現(xiàn)的序列數(shù)據(jù),改變了整個(gè)生命科學(xué)領(lǐng)域的研究方式,并推動(dòng)了基因組

5、學(xué)、生物信息學(xué)、系統(tǒng)生物學(xué)、合成生物學(xué)等等一系列學(xué)科的創(chuàng)立和發(fā)展。而這些學(xué)科的發(fā)展,又需要更加強(qiáng)大的測(cè)序技術(shù)來提供更多更精確的數(shù)據(jù)加以支持,反過來也激勵(lì)了相關(guān)技術(shù)理論和工程實(shí)踐的進(jìn)一步發(fā)展。無論哪種測(cè)序技術(shù),基本都可以被認(rèn)為是模板制備,讀取堿基信息和顯示,以及數(shù)據(jù)分析這幾個(gè)部分的組合。本文根據(jù)國際上通行的世代劃分,對(duì)測(cè)序技術(shù)的發(fā)展歷程及其應(yīng)用進(jìn)行回顧和展望。I 第1代測(cè)序技術(shù)Sanger 末端標(biāo)記法第1代測(cè)序技術(shù),都是基于Sanger 發(fā)明的人工末端標(biāo)記法 (Sanger, 1988。其主要思路是在待測(cè)序列的一端加上統(tǒng)一的測(cè)序接頭,用放射性同位素標(biāo)記根據(jù)接頭設(shè)計(jì)的引物,然后由此開始延伸待測(cè)序列

6、。這個(gè)過程要進(jìn)行四套獨(dú)立的反應(yīng),每套反應(yīng)中分別加入四種雙脫氧核苷三磷酸 (ddNTP 中的一種。由于ddNTP 缺乏延伸所必要的3-OH ,這樣每套反應(yīng)中延長(zhǎng)的寡聚核苷酸鏈就會(huì)選擇性地在不同的A 、C 、G 、T 處終止,得到一組長(zhǎng)度不同的鏈終止產(chǎn)物。然后利用高分辨率的變性凝膠電泳在四個(gè)泳道中分離各個(gè)片段,通過讀取放射自顯影顯示的不同長(zhǎng)度片段就可獲得每個(gè)位置上的堿基信息。1.1 最早版本的自動(dòng)化測(cè)序技術(shù)20世紀(jì)80年代中期,加州理工學(xué)院的Leroy Hood 研究組在Sanger 法的基礎(chǔ)上發(fā)明了最早版本的第1代測(cè)序儀,最大的改進(jìn)就是不再在引物上進(jìn)行同位素標(biāo)記,而是采用不同顏色的熒光基團(tuán)直接標(biāo)

7、記不同的ddNTP ,這樣在一個(gè)反應(yīng)體系中就可以同時(shí)進(jìn)行四種末端終止反應(yīng),然后采用聚丙酰胺凝膠電泳分離,通過計(jì)算機(jī)來讀取并分析熒光信號(hào)。第二年,ABI 公司采用這個(gè)技術(shù)推出了第一款半自動(dòng)DNA 測(cè)序儀ABI 370,并迅速推廣開來。1.2 改進(jìn)后的第1代測(cè)序技術(shù)上世紀(jì)末,在第1版技術(shù)基礎(chǔ)上上,研究者采用緊湊的毛細(xì)管電泳代替了平板電泳,采用自動(dòng)上樣,大大降低了試劑的消耗,同時(shí)測(cè)序進(jìn)程的并行化程度也隨之大幅提升。采用這種改進(jìn)版技術(shù)的ABI 3730和Amersham Mega-BACE等測(cè)序儀終于實(shí)現(xiàn)了測(cè)序的完全自動(dòng)化,并在最早開展的幾個(gè)物種全基因組測(cè)序計(jì)劃,尤其人類基因組計(jì)劃的后期階段起到了關(guān)鍵

8、作用。經(jīng)過二十年的逐步改進(jìn),第1代測(cè)序儀的讀長(zhǎng)可以超過1,000 bp ,原始數(shù)據(jù)的準(zhǔn)確率可以達(dá)到99.999%,每千堿基序列的成本是0.5美元,每臺(tái)測(cè)序儀的數(shù)據(jù)通量可以達(dá)到6105 bp/day。但是由于第1代測(cè)序技術(shù)對(duì)電泳分離技術(shù)的依賴,很難再進(jìn)一步提升分析速率和并行化程度,其發(fā)展已經(jīng)到達(dá)了極限。當(dāng)然,第1代測(cè)序技術(shù)經(jīng)過多年的考驗(yàn),在低通量常規(guī)測(cè)序,比如PCR 產(chǎn)物測(cè)序、質(zhì)粒和細(xì)菌人工染色體的末端測(cè)序等等方面還將會(huì)繼續(xù)得到廣泛應(yīng)用。II 第2代測(cè)序技術(shù)微陣列循環(huán)合成法隨著現(xiàn)代生物學(xué)的發(fā)展,研究者對(duì)測(cè)序通量的要求越來越高。為了滿足這樣的要求,人們開發(fā)出了多種多樣的下一代測(cè)序技術(shù) (next-

9、generation sequencing, NGS。盡管這些技術(shù)的生化基礎(chǔ)和實(shí)現(xiàn)手段各有千秋,但是其基本思想都是采用矩陣結(jié)構(gòu)的微陣列形式,實(shí)現(xiàn)樣品的微量化和處理的大規(guī)模并行化。大概的測(cè)序流程也大同小異,首先制備測(cè)序?qū)ο竽0逦膸?,在雙鏈片段兩端連接上接頭序列,變性得到單鏈模板,固定到反應(yīng)介質(zhì)上,對(duì)樣本文庫進(jìn)行擴(kuò)增,然后開始測(cè)序反應(yīng),在測(cè)序反應(yīng)進(jìn)行的過程中通過顯微設(shè)備觀測(cè)并記錄連續(xù)循環(huán)反應(yīng)中的光學(xué)信號(hào),來獲得每個(gè)位置上的堿基信息 (Metzker, 2010。相比第1代測(cè)序技術(shù),NGS 有下列幾個(gè)顯著特點(diǎn):第一,微陣列形式可以實(shí)現(xiàn)大規(guī)模并行化。第二,不采用電泳,樣本和試劑的消耗大大降低,設(shè)備也易

10、于微型化。第三,由于對(duì)序列信息的獲取是直接讀取反應(yīng)中的光學(xué)信號(hào),因此從理論上說,檢測(cè)獨(dú)立光學(xué)事件所需要的波長(zhǎng),即光的衍射極限,才是并行化程度的極限。2.1 目前已經(jīng)應(yīng)用的下一代測(cè)序技術(shù)NGS 技術(shù)在上世紀(jì)90年代末就已經(jīng)研發(fā)出來,而在2005年之后紛紛投入實(shí)際使用。其中Roche 454,Illumina Solexa 和Life/APGs SOLiD 三種是大規(guī)模商業(yè)化應(yīng)用最為廣泛的,此外還有一些未能得到普遍應(yīng)用的。Roche 公司的454測(cè)序儀利用微乳滴PCR (emulsion PCR, emPCR 擴(kuò)增單鏈文庫片段,采用焦磷酸法來進(jìn)行測(cè)序。首先將已經(jīng)固化了引物的玻璃微球和單鏈文庫模板與

11、脫氧核苷三磷酸 (dNTP、聚合酶等PCR 反應(yīng)體系必要化合物一起混合,微球和文庫片段按一定比例確保大多數(shù)微球結(jié)合的單鏈核酸分子不超過1個(gè)。整個(gè)反應(yīng)體系是水油混合物,以玻璃微球?yàn)橹行男纬捎桶Y(jié)構(gòu)的乳滴,每個(gè)乳滴都是一個(gè)PCR 反應(yīng)的微量反應(yīng)器。經(jīng)過多輪循環(huán)反應(yīng),每個(gè)微球表面都結(jié)合了數(shù)千個(gè)相同的DNA 拷貝。變性后,使微球上結(jié)合的都是單鏈DNA 片段。再富集微球,轉(zhuǎn)移并放置到刻有大規(guī)模規(guī)則微孔陣列的微孔板上,每個(gè)微孔只能容納一個(gè)微球(圖1a )。隨后的測(cè)序反應(yīng)在微孔板上進(jìn)行。微孔板是流通池的一部分,一面可以通過測(cè)序反應(yīng)的化合物,另一面與光學(xué)檢測(cè)系統(tǒng)連接。順次向流通池中加入4種dNTP 中的一種

12、,流過微孔板的一面。當(dāng)dNTP 與脫氧核糖骨架連接后釋放出焦磷酸,在向測(cè)序反應(yīng)體系中事先加入的A TP 硫?;负蜔晒馑孛缸饔孟庐a(chǎn)生一系列級(jí)聯(lián)反應(yīng),放出不同的光信號(hào)。每個(gè)微孔中光信號(hào)的有無,就表明對(duì)應(yīng)的dNTP 是否連接到了片段上,也就確定了該位置是否存在這個(gè)堿基(圖1b )。 454測(cè)序儀采用的焦磷酸測(cè)序法不需要額外的化合物用于DNA 鏈的延長(zhǎng),擴(kuò)增反應(yīng)可以一直進(jìn)行,出錯(cuò)的幾率也較低,因此在多種NGS 技術(shù)中,測(cè)序速度較快,讀長(zhǎng)最長(zhǎng)可以達(dá)到500 bp 。但是由于沒有特定的終止基團(tuán)來停止鏈的延伸,在遇到相同核苷酸連續(xù)排列的區(qū)域時(shí),不得不依靠光信號(hào)的強(qiáng)度來推斷同聚核苷酸的長(zhǎng)度,很容易產(chǎn)生錯(cuò)誤。

13、因此454測(cè)序儀主要的錯(cuò)誤類型是堿基的插入和缺失,而不是替換。454測(cè)序的另一個(gè)缺點(diǎn)是焦磷酸檢測(cè)需要的酶種類較多, 試劑價(jià)格相對(duì)較高。Illumina 公司的Solexa 技術(shù),是通過固相擴(kuò)增(solid-phased amplification 來擴(kuò)增單鏈文庫,采用合成法進(jìn)行測(cè)序。單鏈DNA 兩端加上非對(duì)稱的通用接頭,接頭與事先固定在固相芯片表面的序列互補(bǔ),因此單鏈DNA 就結(jié)合到芯片表面形成橋式結(jié)構(gòu)。然后使用接頭引物進(jìn)行PCR 擴(kuò)增,在一個(gè)芯片上可以形成上億個(gè)不相關(guān)的單鏈DNA 分子簇,其一端固定在芯片表面,另一端是自由的(圖2a )。隨后測(cè)序引物就可以雜交到自由的通用接頭序列上,開始測(cè)序

14、反應(yīng)。測(cè)序使用的dNTP 經(jīng)過改造,每種堿基被不同的熒光基團(tuán)標(biāo)記,同時(shí)脫氧核糖的3-OH 被封閉,這樣每輪測(cè)序循環(huán)只能延伸一個(gè)核苷酸。圖1. Roche 454測(cè)序原理a. 微乳滴PCR ;b. 焦磷酸法測(cè)序引自Metzker, 2010讀取堿基熒光信號(hào),就能知道這一輪每個(gè)簇結(jié)合上的是什么核苷酸,也就獲得了模板中這一位置的序列信息。然后切除熒光基團(tuán),打開被封閉的3-OH ,繼續(xù)進(jìn)行下一輪反應(yīng)(圖2b )。 Solexa 法的合成測(cè)序過程,要求每一個(gè)簇中所有DNA 鏈的延伸要保持同 步。但由于化學(xué)反應(yīng)的錯(cuò)誤難以避免,例如不能及時(shí)切掉熒光基團(tuán)或者去除封閉基團(tuán),這就會(huì)導(dǎo)致一個(gè)簇中的DNA 鏈延伸長(zhǎng)短

15、不一,進(jìn)而引起光信號(hào)的衰減或相位偏移。因此Solexa 法的錯(cuò)誤主要是堿基的替換,并且這種錯(cuò)誤是可以隨著鏈的延伸而累加的,因而也限制了Solexa 測(cè)序的讀長(zhǎng),目前經(jīng)過改進(jìn)也只能達(dá)到100 bp。 Life/APG公司的SOLiD (supportoligonucleotide ligation detection 測(cè)序儀,與454同樣通過與玻璃微球結(jié)合的微乳滴PCR 來擴(kuò)增模板文庫,但測(cè)序反應(yīng)采取的是連接反應(yīng),而不是聚合反應(yīng),同時(shí)使用雙堿基編碼策略來檢測(cè)錯(cuò)誤。測(cè)序采用的是一種特殊設(shè)計(jì)的八 聚核苷酸探針,其5開始的1,2位是正常堿基,3,4,5三個(gè)是變性堿基,6,7,8是通用堿基,探針的3末端

16、用熒光基團(tuán)標(biāo)記,顏色與1,2位的堿基組合嚴(yán)格對(duì)應(yīng)。每次測(cè)序反應(yīng)的第1輪,測(cè)序引物1與固定在微球表面的接頭序列互補(bǔ)形成平末端,然后開始與探針連接。當(dāng)探針1,2位與待測(cè)序列模板互補(bǔ)并連接上之后,獲取熒光信息。然后在探針的5,6位之間切開探針,進(jìn)行下一個(gè)連接反應(yīng)。這樣重復(fù)多次,可以獲得模板序列的第1-2, 6-7, 11-12, 16-17位置的信息。整個(gè)一輪反應(yīng)結(jié)束后,將已經(jīng)擴(kuò)增的雙鏈變性恢復(fù)成單鏈,使用測(cè)序引物2與接頭序列配對(duì),但引物5末端比前一輪提前1位,然后進(jìn)行新一圖2. Solexa測(cè)序原理a. 固相橋式PCRb. 合成法測(cè)序引自Metzker, 2010輪的連接反應(yīng)循環(huán)。這次讀取的就是模

17、板序列的0-1, 5-6, 10-11, 15-16位置的信息。這樣重復(fù)進(jìn)行,每輪重置的引物都比上一輪要提前1位,直到所有位置上的序列信息都被讀?。▓D3)。SOLiD 測(cè)序過程中由于每個(gè)堿基都被獨(dú)立測(cè)定了兩遍,因此可以知道測(cè)序錯(cuò) 誤發(fā)生在什么位置,相應(yīng)地其準(zhǔn)確率也是最高的,但測(cè)序速度也是最低的。而且由于同一個(gè)微球上的鏈延伸同樣存在移相和錯(cuò)誤累積的問題,因此SOLiD 法測(cè)序的讀長(zhǎng)也受到限制,在50 bp左右。Polonator G.007采用與SOLiD 類似的微乳滴PCR 和連接法,但不采用雙堿基編碼策略。它同樣采用熒光標(biāo)記的寡聚 核苷酸探針,探針與引物-模板鏈連接后,讀取熒光信號(hào),得到對(duì)應(yīng)

18、位置的堿基信息。然后并不連續(xù)延伸,而是變性后再與另一批探針進(jìn)行重新連接,如此反復(fù)直到讀出所有位置。Polonator G.007不需要進(jìn)行連續(xù)的連接反應(yīng),因此錯(cuò)誤不會(huì)累積,保證了其準(zhǔn)確性。但探針的讀取位置也因此受到限制,其測(cè)序讀長(zhǎng)是最短的,僅有不到30bp 。但Polonator G.007進(jìn)程簡(jiǎn)單,是最便宜的NGS 技術(shù),而且其技術(shù)平臺(tái)是開源 的,用戶可以自己變更并改進(jìn)操作和試劑。2.2 單分子測(cè)序上述幾種NGS 技術(shù),除了454之外,讀長(zhǎng)都不超過100 bp (當(dāng)然,與Sanger法相比,454的讀長(zhǎng)也太短),成為其的致命傷。制約讀長(zhǎng)的主要原因,是因?yàn)樾蛄行畔⑹且揽孔x取DNA 簇延伸時(shí)統(tǒng)一

19、發(fā)出的光信號(hào)才獲得的,一旦延伸不同步導(dǎo)致光信號(hào)移相就會(huì)產(chǎn)生錯(cuò)誤。為了解決這個(gè)問題,單分子測(cè)序技術(shù)(single moleculesequencing, SMS)應(yīng)運(yùn)而生。SMS 的主要思想是直接將模板文庫在陣列表面進(jìn)行合成測(cè)序,不需要經(jīng)過PCR 擴(kuò)增,直接讀取每個(gè)分子延伸時(shí)產(chǎn)生的光信號(hào)。這樣避免了DNA 簇延伸不同步導(dǎo)致的光信號(hào)移相問題,也使得測(cè)序的通量進(jìn)一步提高。但是單分子測(cè)序最大的挑戰(zhàn)就是如何準(zhǔn)確檢測(cè)單分子水平的光學(xué)信號(hào),避免非特異性的背景干擾。目前有幾種不同的方法來解決這個(gè)問題,基本的原則都是將檢測(cè)局限在測(cè)序反應(yīng)發(fā)生的實(shí)際位置附近。Helicos BioSciences 公司在Quake

20、 公司技術(shù)基礎(chǔ)上研發(fā)的HeliScope 是最早在市場(chǎng)上出現(xiàn)的SMS 圖3. SOLiD連接法雙堿基測(cè)序原理 引自Metzker, 2010系統(tǒng)。首先將通用引物固定在陣列表面(可以達(dá)到109數(shù)量級(jí)),被加上接頭的單鏈模板文庫與之配對(duì)結(jié)合(圖4a )。每輪測(cè)序反應(yīng)中,堿基上被不同熒光基團(tuán)標(biāo)記的四種dNTP 中的一種和核酸聚合酶流過,能夠延伸的鏈就會(huì)發(fā)出熒光并被記錄下來。然后經(jīng)過洗脫,末端熒光基團(tuán)被切除,進(jìn)行下一輪的反應(yīng)(圖4b )。在這個(gè)過程中,每個(gè)單分子鏈的延伸都是獨(dú)立操作的,根本不用考慮移相的問題。為了避免未參加反應(yīng)的熒光基團(tuán)的干擾,HeliScope 采用與Solexa 類似的全內(nèi)反射熒光

21、 (total internal reflection fluorescence, TIRF 技術(shù),只有靠近反應(yīng)表面很薄的一層空間內(nèi)的熒光基團(tuán)才能被激發(fā)產(chǎn)生熒光。盡管如此,準(zhǔn)確捕獲單分子光學(xué)信號(hào)仍然不是一件容易的事情,出錯(cuò)的幾率依然較高。因此HeliScope 采取了雙向測(cè)序的策略進(jìn)行改進(jìn)。將模板單鏈兩端加上不同的接頭,通過一端接頭把模板直接固定在陣列上,當(dāng)向一個(gè)方向延伸測(cè)序完畢后,變性,將模板重置為最初的狀態(tài),利用遠(yuǎn)端接頭(圖4c ),從相反的方向再進(jìn)行一次測(cè)序,以校正錯(cuò)誤。不過其讀長(zhǎng)依然受到很大的限制,平均僅為32 bp。 與焦磷酸法一樣,HeliScope 對(duì)相同核苷酸連續(xù)排列的區(qū)域讀取

22、也存在問題。不過單分子操作的優(yōu)勢(shì)就是可以通過動(dòng)力學(xué)來控制NDA 聚合酶的反應(yīng),降低延伸的速率,減少多個(gè)連續(xù)相同核苷酸連圖4. HeliScope測(cè)序原理a. 固定引物的單向測(cè)序b. 合成法測(cè)序反應(yīng)c. 固定模板的雙向測(cè)序引自Metzker, 2010接在鏈上的可能性。Pacific Biosciences公司宣布在2010年底將其單分子實(shí)時(shí) (single molecule real time, SMRT 測(cè)序技術(shù)投入市場(chǎng),這是目前最值得期待的NGS 技術(shù)。這一技術(shù)依賴于零級(jí)波導(dǎo) (zero mode waveguide, ZMW 納米結(jié)構(gòu)來實(shí)時(shí)觀察DNA 的聚合過程 (Eid et al.,

23、 2009。所謂ZMW ,是在一片薄金屬膜上蝕刻出數(shù)千個(gè)直徑為數(shù)十納米的亞波長(zhǎng)小孔,再將金屬膜附著在透明基質(zhì)上。由于小孔尺寸低于光的波長(zhǎng),因此光線從透明一側(cè)入射時(shí)無法投射,而是在每個(gè)小孔底部形成指數(shù)級(jí)衰減的消逝波,這樣就形成了一個(gè)體積受到嚴(yán)格限制的檢測(cè)空間。每個(gè)小孔底部固定一個(gè)已經(jīng)結(jié)合了引物和模板的29 DNA聚合酶分子(圖5a ),測(cè)序反應(yīng)所用的dNTP 的磷酸上標(biāo)記有熒光受體基團(tuán)。每次測(cè)序反應(yīng)加入一種核苷酸,聚合酶在檢測(cè)空間內(nèi)將其捕獲后產(chǎn)生光曝。通過連續(xù)實(shí)時(shí)檢測(cè)每個(gè)孔內(nèi)的熒光信號(hào),就快速測(cè)定了每個(gè)孔內(nèi)的模板序列(圖5b )。這種連續(xù)實(shí)時(shí)讀取的錯(cuò)誤率相對(duì)較高,但是可以通過對(duì)同一樣品重置后多次

24、測(cè)序來提升準(zhǔn)確率。 Pacific Biosciences的SMRT 技術(shù)無需暫停DNA 合成的反應(yīng),在測(cè)序速率、讀長(zhǎng)和成本方面有巨大的潛力。2.3 下一代測(cè)序技術(shù)的應(yīng)用NGS 由于其高通量的特性,在出現(xiàn)之初就被用于全基因組測(cè)序和基因組重測(cè)序 (Gilad et al., 2009 。隨著NGS 的廣泛應(yīng)用,基因組測(cè)序的進(jìn)度大大加快了,不少使用第1代測(cè)序技術(shù)多年未完成的物種基因組,在使用NGS 后很快完成,例如西紅柿、馬鈴薯等等。不過由于NGS 的讀長(zhǎng)普遍較短,圖5. Pacific Biosciences測(cè)序原理a. 固定聚合酶b. SMRT引自Metzker, 2010因此測(cè)序結(jié)果的組裝和

25、連配就顯得尤為重要。利用NGS 對(duì)同一物種的不同個(gè)體進(jìn)行測(cè)序比較,可以很快發(fā)現(xiàn)之間存在的序列差異,進(jìn)而找到突變。為進(jìn)一步的個(gè)性化功能分析,比如人類疾病研究,農(nóng)作物品質(zhì)鑒定等等提供依據(jù)。某些情況下為了研究某些基因,需要獲得精細(xì)的遺傳連鎖圖譜。NGS 不僅僅可以很容易找到SNP 這樣的分子標(biāo)記,而且將傳統(tǒng)的分子標(biāo)記技術(shù)(如AFLP )與NGS 結(jié)合,可以快速獲得大量的分子標(biāo)記,用來構(gòu)建精細(xì)連鎖圖。由于RNA 單鏈分子很容易降解,第1代測(cè)序技術(shù)一般都是通過測(cè)定cRNA 或者EST 的來間接獲得mRNA 的序列。然而隨著RNA 的各種重要的生物學(xué)功能被逐步揭示,人們已經(jīng)不滿足于只能間接獲得部分的RNA

26、 序列,迫切需要了解各種轉(zhuǎn)錄本的信息,包括mRNA 、非編碼RNA 和小RNA 等等。而下一代測(cè)序技術(shù),雖然最初都是為了DNA 測(cè)序而開發(fā)的,但目前主流的三種技術(shù),都可以稍加改造后用于RNA 測(cè)序 (Wang et al., 2009。小RNA 在生物體中起著重要的調(diào)控作用,由于其片段短,數(shù)量大,天然就適合NGS 。近年來利用NGS 已經(jīng)發(fā)現(xiàn)了許多新的小RNA 和其作用靶標(biāo)?;赗NA 測(cè)序,研究者可以高通量地來研究基因表達(dá)模式和表達(dá)調(diào)控。相比microarray 來說,NGS 不需要已知基因組序列的參考,在背景噪音和可重復(fù)性方面也有較大的優(yōu)勢(shì),因此大有取代microarray 的趨勢(shì)。例如用

27、于研究轉(zhuǎn)錄因子與基因組結(jié)合的染色質(zhì)免疫共沉淀 (chromatin immunoprecipitation, ChIP 技術(shù),就從ChIP-chip 演變?yōu)榱薈hIP-seq 。而新出現(xiàn)紫外交聯(lián)免疫共沉淀和高通量測(cè)序偶聯(lián)技術(shù) (ultraviolet cross-linking and immunoprecipitation and high-throughput sequencing, CLIP-seq,更是研究蛋白質(zhì)與RNA 作用的利器。III 第3代測(cè)序技術(shù)直接測(cè)序法與第1代測(cè)序技術(shù)相比,雖然第2代測(cè)序技術(shù)擺脫了電泳的限制,但仍然要通過聚合或連接之類的生化反應(yīng)來延伸核酸鏈,并讀取延伸過程

28、中釋放出的光學(xué)信號(hào),其本質(zhì)上還是一種間接的測(cè)序形式。監(jiān)測(cè)、存儲(chǔ)和分析光學(xué)信息,都大大提升了儀器的復(fù)雜性和成本;標(biāo)記熒光基團(tuán)、鏈延伸等等生化反應(yīng)也需要耗費(fèi)不少的試劑和耗材。為了進(jìn)一步降低成本,提升測(cè)序通量,人們?cè)诘?代測(cè)序技術(shù)方興未艾的時(shí)候,就已經(jīng)開始緊鑼密鼓地研發(fā)第3代測(cè)序技術(shù)。第3代測(cè)序技術(shù)目前都還處在概念驗(yàn)證階段,各種奇思妙想層出不窮,但歸結(jié)起來無外乎一個(gè)基本思路,那就是采用分辨率足夠高的技術(shù),直接讀取核酸序列的信息。目前有一定突破的是非光學(xué)顯微鏡成像和納米孔技術(shù),而又尤以納米孔技術(shù)更為人們所關(guān)注 (Branton et al., 2008。納米孔測(cè)序(nanopore sequencin

29、g )技術(shù),就是利用固態(tài)物質(zhì)或生物分子制成直徑在納米尺度的小孔,在電場(chǎng)驅(qū)動(dòng)下,使線狀核酸分子魚貫通過小孔,檢測(cè)核苷酸通過納米孔時(shí)的物理狀態(tài)來確定核酸的序列。一類方法是采用溶血蛋白作為納米孔材料。這種蛋白的微孔直徑,恰恰可以容納一條核苷酸單鏈通過,而且其穩(wěn)定性相當(dāng)好,在溫度接近水的沸點(diǎn)時(shí)仍然可以保持活性構(gòu)象。當(dāng)微孔分別處于無阻礙(開放狀態(tài))和有單鏈核酸通過(阻塞狀態(tài))時(shí),通過微孔的離子電流會(huì)發(fā)生顯著變化(圖6a ),而且不同核苷酸組成的核酸通過時(shí),變化的狀態(tài)也有不同。但是這個(gè)方法目前的分辨率還不能達(dá)到單個(gè)核苷酸。主要原因是孔道的長(zhǎng)度一般都在5 nm 以上,而這個(gè)長(zhǎng)度可以容納10-15個(gè)核苷酸。O

30、xford Nanopore Technologies 對(duì)溶血蛋白進(jìn)行了改造,在微孔上加上一個(gè)氨基化環(huán)糊精 (aminocyclodextrin 接頭。當(dāng)驅(qū)動(dòng)四種不同的單磷酸核苷酸 (dNMP通過這種納米孔時(shí),離子電流將分別降低到四種不同的水平。只要使用外切酶將DNA 鏈順次切成dNMP ,并使之單獨(dú)通過納米孔,就可以讀出每個(gè)位置上的序列信息(圖6b )。該方法的關(guān)鍵就在于如何保證外切酶切割下來的dNMP 能被嚴(yán)格單一地運(yùn)送并準(zhǔn)確通過納米孔 (Clarke et al., 2009。另一種思路是不檢測(cè)通過納米孔的離子電流,而是在納米孔兩側(cè)植入電極和電子探針,產(chǎn)生橫向的隧道電流,當(dāng)核酸鏈通過納米

31、孔時(shí)測(cè)定每個(gè)核苷酸對(duì)隧道電流的影響(圖7a )。當(dāng)然也有研究者采用化學(xué)探針,能夠分別與磷酸基團(tuán)和堿基形成氫鍵(圖7b ),當(dāng)然為了識(shí)別四種堿基,就需要設(shè)計(jì)四種探針。圖6. 納米孔離子電流測(cè)序原理a. 離子電流通過-溶血蛋白納米孔的兩種狀態(tài)b. 外切酶測(cè)序(金黃色為核酸鏈,右側(cè)藍(lán)色為外切酶)引自 Branton et al., 2008無論哪種方法,控制核酸分子通過納米孔的速度都是技術(shù)難點(diǎn)之一。為了提升測(cè)序速率,核酸鏈通過納米孔的速度必須較快,目前可以達(dá)到1 nt/s 。但是如果速度過快目前的速度確實(shí)已經(jīng)過快了,就沒有足夠的時(shí)間去分辨單個(gè)堿基,而且微觀尺度下的隨機(jī)運(yùn)動(dòng)和分子間非特異相互作用還會(huì)進(jìn)一步使這個(gè)問題復(fù)雜化。IV 小結(jié)與展望第1代和第2代測(cè)序技術(shù)之間,測(cè)序通量和讀長(zhǎng)如同魚與熊掌不可得兼,因此兩代測(cè)序技術(shù)在目前都擁有強(qiáng)大的生命力。但是隨著2010年年底Pacific Biosciences的SMRT 技術(shù)投入市場(chǎng),以及第3代測(cè)序技術(shù)的陸續(xù)實(shí)現(xiàn),人類將很快進(jìn)入低成本、高通量的測(cè)序時(shí)代。有報(bào)道已經(jīng)樂觀估計(jì)人類將在2012-2014年進(jìn)入10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論