第4章基因組測(cè)序與序列組裝3+1陳竺_第1頁(yè)
第4章基因組測(cè)序與序列組裝3+1陳竺_第2頁(yè)
第4章基因組測(cè)序與序列組裝3+1陳竺_第3頁(yè)
第4章基因組測(cè)序與序列組裝3+1陳竺_第4頁(yè)
第4章基因組測(cè)序與序列組裝3+1陳竺_第5頁(yè)
已閱讀5頁(yè),還剩58頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章基因組測(cè)序與序列組裝1、DNA測(cè)序的方法鏈終止法測(cè)序化學(xué)降解法測(cè)序自動(dòng)化測(cè)序非常規(guī)DNA測(cè)序1.1鏈終止法測(cè)序(thechainterminationmethod)

基本原理:

通過合成與單鏈DNA互補(bǔ)的多核苷酸鏈,由于合成的互補(bǔ)鏈可在不同位置隨機(jī)終止反應(yīng),產(chǎn)生只差一個(gè)核苷酸的DNA分子,從而來(lái)讀取待測(cè)DNA分子的順序。(一)DNA的酶法測(cè)序(雙脫氧終止法)1955確定牛胰島素結(jié)構(gòu),1958獲諾貝爾化學(xué)獎(jiǎng)1975設(shè)計(jì)出DNA測(cè)序法,1980獲諾貝爾化學(xué)獎(jiǎng)Sanger合成一段與待測(cè)DNA序列互補(bǔ)的DNA片段群1971年,吳瑞將引物延伸(primerextension)用于DNA測(cè)序。吳瑞發(fā)明的聯(lián)接子(linker)和銜接子(adaptor)迄今仍然是克隆DNA的常用工具他主編的《重組DNA》曾風(fēng)靡分子生物學(xué)和生物技術(shù)界。上世紀(jì)80年代后,吳瑞在水稻轉(zhuǎn)基因技術(shù)上有先導(dǎo)性貢獻(xiàn)。吳瑞(1928-2008)吳瑞在分子生物學(xué)和植物生物學(xué)等領(lǐng)域有重要貢獻(xiàn)。技術(shù)路線與要求制備單鏈模板↓將單鏈模板與一小段引物退火↓加入DNA多聚酶4種脫氧核苷酸分別加入少量4種雙脫氧核苷酸

↓將4種反應(yīng)產(chǎn)物分別在4條泳道電泳↓根據(jù)4個(gè)堿基在4條泳道的終止位置讀出基因序列A克隆于質(zhì)粒中DNA→用堿或熱變性BM13克隆單鏈DNAC噬??寺NADPCR產(chǎn)生單鏈DNAA高酶活性B無(wú)5’→3′外切酶活性C無(wú)3′→5′外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子連接的是氫原子,不是羥基對(duì)DNA聚合酶的要求A高酶活性:

聚合酶在終止合成前,多聚核苷酸分子可延伸的有效長(zhǎng)度B無(wú)5’→3′外切酶活性外切核酸酶活性C無(wú)3′→5′外切酶活性較讀功能Klenow酶250bp測(cè)序酶sequenase

3’5’5’3’外切酶聚合酶NC5’3’外切酶小片段大片段(klenow片段)切除RNA引物損傷修復(fù)校讀功能(常用的工具酶)聚合功能蛋白水解酶水解有限產(chǎn)物,68000和35000的片段,用途:雙鏈DNA5'突出(5'overhang)末端的補(bǔ)平(fill-in);雙鏈DNA3'突出(3'overhang)的打平(也稱削平);5'突出末端的標(biāo)記;隨機(jī)引物法進(jìn)行DNA標(biāo)記;Sanger雙脫氧法進(jìn)行DNA測(cè)序;cDNA第二鏈的合成或定點(diǎn)突變反應(yīng)第二鏈的合成。3'→5'外切酶活性──校對(duì)作用這種酶活性的主要功能是從3'→5'方向識(shí)別和切除不配對(duì)的DNA生長(zhǎng)鏈末端的核苷酸。5'→3'外切酶活性──切除修復(fù)作用從5’→3’方向水解DNA生長(zhǎng)鏈前方的DNA鏈,主要產(chǎn)生5’-脫氧核苷酸。A克隆于質(zhì)粒中DNA對(duì)模板的要求小于3kb的可以進(jìn)行,是包裝在噬菌體中的單鏈DNA,容易丟失和重排。用堿或熱變性,可能有未純化的DNA沾染,干擾測(cè)序反應(yīng),但是最常用方法。BM13克隆單鏈DNAC噬??寺NA10kb,質(zhì)粒自身的復(fù)制起點(diǎn),還有一個(gè)M13或者其他的單鏈DNA噬菌體的復(fù)制起點(diǎn),大腸桿菌中含有噬粒和輔助噬菌體時(shí),因攜帶噬菌體復(fù)制酶和外殼蛋白的基因,所以激活噬菌體DNA復(fù)制,產(chǎn)生單鏈?zhǔn)闪J删w,比M13穩(wěn)定。用標(biāo)記了金屬粒子的引物,磁性裝置純化后使用。對(duì)模板的要求DPCR產(chǎn)生單鏈DNA對(duì)引物的要求1.2化學(xué)降解法測(cè)序基本原理:

在選定的核苷酸堿基中引入化學(xué)基團(tuán),再用化合物處理,使DNA分子在被修飾的位置降解.技術(shù)路線將雙鏈DNA樣品變?yōu)閱捂湣總€(gè)單鏈的同一方向末端都用放射性同位素標(biāo)記,以便顯示DNA條帶↓分別用不同方法處理,獲得只差一個(gè)核苷酸的降解DNA群體↓電泳,讀取DNA的核苷酸順序Maxam-Gilbert法所用的化學(xué)技術(shù)

堿基特異修飾方法GPh8.0,用硫酸二甲酯對(duì)N7進(jìn)行甲基化,使C8-C9鍵對(duì)堿基裂解有特殊敏感性A+GpH2.0哌啶甲酸可使嘌呤環(huán)的N原子位置脫嘌呤,并因此消弱腺嘌呤和鳥嘌呤的糖苷鍵C+T肼可打開嘧啶環(huán),后者重新環(huán)化成五元環(huán)后易除去C1.5mol/LNaCl存在時(shí),可用肼除去胞嘧啶化學(xué)法測(cè)序?qū)嵗哙ち蛩岫柞?.3自動(dòng)化測(cè)序基本原理與鏈終止法測(cè)序原理相同,只是用不同的熒光色彩標(biāo)記ddNTP,ddATP標(biāo)記紅色熒光ddCTP標(biāo)記藍(lán)色熒光ddGTP標(biāo)記黃色熒光ddTTP標(biāo)記綠色熒光.由于每種ddNTP帶有各自特定的熒光顏色,而簡(jiǎn)化為由1個(gè)泳道同時(shí)判讀4種堿基.DNA序列分析儀:四色熒光基團(tuán)標(biāo)記的dNTP120臺(tái)毛細(xì)管電泳裝置24小時(shí)連續(xù)作業(yè),一天工作量是1億個(gè)堿基長(zhǎng)度的DNA,4天就可測(cè)完水稻基因組光點(diǎn)測(cè)序脫氧三磷酸核苷酸連接到DNA3’-末端時(shí)會(huì)釋放1個(gè)焦磷酸(PPi),焦磷酸在磷酸化酶的作用下轉(zhuǎn)化為化學(xué)能,并發(fā)出光亮.1.4非常規(guī)測(cè)序DNA芯片測(cè)序?qū)⒏鞣N排列順序的寡核苷酸點(diǎn)播在芯片上,每個(gè)點(diǎn)播的寡核苷酸在排列的方陣中都有指定的位置.待檢測(cè)的DNA分子與芯片溫浴,凡是能雜交的寡核苷酸都會(huì)在確定位置發(fā)出信號(hào),然后根據(jù)獲取的信息將寡核苷酸的順序進(jìn)行對(duì)比組裝,拼接成完全的DNA順序.利用基因芯片進(jìn)行雜交測(cè)序的原理可測(cè)DNA片段的長(zhǎng)度是芯片上排列的寡聚核苷酸數(shù)目的平方根。2、基因組測(cè)序2.1基因組測(cè)序的策略作圖測(cè)序(克隆依次測(cè)序)按照大分子DNA克隆繪制的物理圖分別在單個(gè)大分子DNA克隆內(nèi)部進(jìn)行測(cè)序和序列組裝,然后將彼此相連的大分子克隆按排列次序搭建支架,最后以分子標(biāo)記為向?qū)⒋罱ê玫闹Ъ苤饌€(gè)錨定到基因組整合圖上。2、基因組測(cè)序2.1基因組測(cè)序的策略鳥槍法測(cè)序(全基因組隨機(jī)測(cè)序)將整個(gè)基因組DNA打斷成小片段后將其克隆到質(zhì)粒載體中,然后隨機(jī)挑選克隆對(duì)插入片段進(jìn)行測(cè)序,以獲得的測(cè)序序列構(gòu)建重疊群。在此基礎(chǔ)上進(jìn)一步搭建序列支架,最后以分子標(biāo)記為向?qū)⑿蛄兄Ъ苠^定在基因組整合圖上。基因組測(cè)序覆蓋面:隨機(jī)測(cè)序獲得的序列總長(zhǎng)與單倍體基因組序列總長(zhǎng)之比,覆蓋面越大,遺漏的序列越少。2.2基因組測(cè)序的覆蓋面基因組測(cè)序覆蓋率達(dá)到99.99%,覆蓋面要達(dá)到8次以上。序列間隙:測(cè)序時(shí)遺漏的序列。2.3序列間隙和物理間隙2.3序列間隙和物理間隙物理間隙:構(gòu)建基因組文庫(kù)時(shí)丟失的DNA序列。1、堿基組成特殊,著絲粒附近,高度重復(fù),缺少酶切位點(diǎn),難已獲得大分子克隆2、高度重復(fù)序列不穩(wěn)定,在擴(kuò)增中容易丟失3、某些基因的表達(dá)產(chǎn)物對(duì)宿主菌有毒性序列間隙:先設(shè)計(jì)探針,找到陽(yáng)性克隆,然后設(shè)計(jì)引物,PCR,重建克隆體,測(cè)序物理間隙:原因:1、堿基組成特殊,著絲粒附近,高度重復(fù),缺少酶切位點(diǎn),難已獲得大分子克隆2、高度重復(fù)序列不穩(wěn)定,在擴(kuò)增中容易丟失3、某些基因的表達(dá)產(chǎn)物對(duì)宿主菌有毒性,2.4插入片段的兩端測(cè)序3序列的組裝3.1隨機(jī)測(cè)序與序列組裝

隨機(jī)測(cè)序也稱”鳥槍法”.序列組裝原理:直接從已測(cè)序的小片段中尋找彼此重疊的測(cè)序克隆,然后依次向兩側(cè)鄰接的序列延伸.優(yōu)點(diǎn):不需預(yù)先了解任何基因組的情況.ABCABCABCABC小片段測(cè)序計(jì)算機(jī)拼裝ABC小片段測(cè)序計(jì)算機(jī)拼裝鳥槍法(Shotgun)測(cè)序的問題CAATGCATTA……GCAGCCAATGCGAP錯(cuò)裝實(shí)例:流感嗜血桿菌基因組的測(cè)序及順序組裝

Ceralagenomics公司1995超聲波打斷純化的基因組DNA↓瓊脂糖電泳收集1.6~2.0Kb的區(qū)段、純化

↓構(gòu)建到質(zhì)粒載體中↓隨機(jī)挑選19687個(gè)克隆,進(jìn)行28643次測(cè)序,得到可讀順序?yàn)?1631485bp↓組裝成140個(gè)覆蓋全基因組范圍的獨(dú)立的順序重疊群,↓各重疊群間仍有間隙(139個(gè))

序列間隙(99個(gè))物理間隙(23個(gè))

↓↓

載體或宿主菌選用不當(dāng)而被丟失的順序測(cè)序時(shí)遺漏的測(cè)序解決辦法:通過相鄰已知順序作為探針篩選已有的基因組文庫(kù)解決辦法:利用其它宿主菌與載體重新構(gòu)建文庫(kù)解決辦法:利用其它宿主菌與載體重新構(gòu)建文庫(kù)42個(gè)解決了23個(gè)解決辦法:通過相鄰已知順序作為探針篩選已有的基因組文庫(kù)99個(gè)3.2指導(dǎo)測(cè)序與序列組裝在人類基因組進(jìn)入測(cè)序組裝階段就采用此方法:A構(gòu)建平均為2Kb的人類基因組質(zhì)粒文庫(kù),進(jìn)行雙向測(cè)序;B構(gòu)建平均10Kb的人類基因組質(zhì)粒文庫(kù),進(jìn)行雙向測(cè)序,讀取2個(gè)端部順序;C參考人類基因組圖,特別是大量的STS位標(biāo)作為基點(diǎn),進(jìn)行序列組裝,排成重疊克隆群.建立在基因組圖譜基礎(chǔ)上的”鳥槍法”,即所謂”指導(dǎo)鳥槍法”或”指導(dǎo)測(cè)序”。限制測(cè)序:是指將一段染色體區(qū)段的DNA順序進(jìn)行組裝.一些已繪制了遺傳圖與物理圖的微生物基因組測(cè)序中也采用這一方法.如高等植物擬南芥基因組的測(cè)序完全依據(jù)克隆重疊群,先進(jìn)行各個(gè)BAC克隆的隨機(jī)測(cè)序,再進(jìn)行序列組裝;

水稻基因組測(cè)序計(jì)劃采取得策略與此相同.先將染色體打成比較大的片段(幾十-幾百Kb),利用分子標(biāo)記將這些大片段排成重疊的克隆群(Contig),分別測(cè)序后拼裝.這種策略叫基于克隆群(contig-based)的策略.ABCABC大片段contig小片段測(cè)序拼裝兩種策略的比較鳥槍法策略指導(dǎo)測(cè)序策略不需背景信息構(gòu)建克隆群(遺傳、物理圖譜)時(shí)間短需要幾年的時(shí)間需要大型計(jì)算機(jī)得到的是草圖(Draft)得到精細(xì)圖譜3.4其他測(cè)序路線重要區(qū)域優(yōu)先測(cè)序人們對(duì)感興趣的基因或與疾病相關(guān)的基因優(yōu)先測(cè)序.如:人類主要組織相容性復(fù)合區(qū)位于第6號(hào)染色體,與人類免疫系統(tǒng)有關(guān),因而優(yōu)先測(cè)序.3.6*106bp,224個(gè)基因座組成,93個(gè)是直接通過基因組測(cè)序發(fā)現(xiàn)的,MHC基因分布最密集,16kb一個(gè)基因多態(tài)性分布最密集的區(qū)域,有些座位的等位基因成員超過200.與風(fēng)濕性關(guān)節(jié)炎,牛皮癬,閱讀障礙、癌癥有關(guān)。EST(Expressedsequencetag)測(cè)序優(yōu)點(diǎn):AmRNA可直接反轉(zhuǎn)錄成cDNA,而且cDNA文庫(kù)也比較容易構(gòu)建;B不必反復(fù)檢測(cè)EST序列的準(zhǔn)確性;CEST為基因的編碼區(qū),不包括內(nèi)含子和基因間區(qū)域,一次測(cè)序的結(jié)果足以鑒定所代表的基因;EST是一種重要的基因組圖分子標(biāo)記,以EST為探針很容易從cDNA文庫(kù)中篩選全基因,又可從BAC克隆中找到其基因組的基因序列.EST測(cè)序鏈終止法是1%,但是基因組測(cè)序是0.01%,要測(cè)3次以上。98年底,有100多萬(wàn)個(gè)人類EST,4.人類基因組計(jì)劃

人類基因組計(jì)劃(Humangenomeproject)于1990年啟動(dòng),我國(guó)于1999年加入該計(jì)劃,承擔(dān)其中1%的任務(wù),即人類3號(hào)染色體短臂上約30Mb的測(cè)序任務(wù)。

A.CeleraGenomics人類基因組的測(cè)序策略4.1人類基因組測(cè)序策略采集5個(gè)自愿者的DNA樣品構(gòu)建3種不同插入子大小的基因組文庫(kù)2Kb,10Kb和50Kb完成約2700萬(wàn)次插入子末端測(cè)序,總長(zhǎng)14800MbGenBank下載104018個(gè)BAC末端順序PFP(政府資助的人類基因組計(jì)劃)發(fā)表的公開數(shù)據(jù)主要為BAC克隆的順序,共4443.3Mb隨機(jī)測(cè)序與序列組裝方法和指導(dǎo)測(cè)序與序列組裝方法相結(jié)合進(jìn)行序列組裝B國(guó)際人類基因組測(cè)序策略構(gòu)建BAC克隆↓限制性酶處理獲得指紋↓根據(jù)指紋重疊方法組建BAC克隆重疊群↓根據(jù)STS標(biāo)記,將BAC克隆重疊群標(biāo)定在物理圖上↓每個(gè)BAC克隆內(nèi)部采用鳥槍法測(cè)序,組裝↓將BAC插入順序與BAC克隆指紋及重疊群比對(duì),將已閱讀的順序錨定到物理圖上4.2人類基因組測(cè)序結(jié)果基因數(shù)是3萬(wàn)、4萬(wàn)還是10萬(wàn)?人類遺傳基因數(shù)量比原先估計(jì)的少很多。目前研究表明,人類基因組中約有3萬(wàn)至4萬(wàn)個(gè)蛋白編碼基因,僅僅是果蠅基因數(shù)目的兩倍,人有而鼠沒有的基因只有300個(gè)。人類基因組研究的驚人發(fā)現(xiàn)19號(hào)染色體是含基因最

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論