基因測序原理_第1頁
基因測序原理_第2頁
基因測序原理_第3頁
基因測序原理_第4頁
基因測序原理_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

關于基因測序原理主要內(nèi)容:什么是基因組什么是基因DNA測序的方法DNA序列的組裝人類基因組計劃水稻基因組計劃后基因組學第2頁,共81頁,2024年2月25日,星期天1.什么是基因組

基因組就是一個物種中所有基因的整體組成?;蚪M有兩層意義:遺傳物質和遺傳信息。要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結構與功能、基因之間的相互關系。第3頁,共81頁,2024年2月25日,星期天Zeamays8,000Homosapiens3,000Oryzasativa400Drosophilamelanogaster165Arabidopsisthaliana100Saccharomycescerevisiae12E.coli4.6GenomeSize(Mb)第4頁,共81頁,2024年2月25日,星期天什么是C值?通常是指一種生物單倍體基因組DNA的總量.

在真核生物中,C值一般隨著生物的進化而增加,高等生物C值一般大于低等生物。

C值悖理:生物的復雜性與基因組的大小并不完全成比例增加第5頁,共81頁,2024年2月25日,星期天細菌真菌等動物陰影部分為一個門內(nèi)C-值的范圍第6頁,共81頁,2024年2月25日,星期天重復順序

高度重復順序:長度:幾個——幾千個bp

拷貝數(shù):幾百個——上百萬個首尾相連,串聯(lián)排列集中分布于染色體的特定區(qū)段(如端粒,著絲粒等)也稱衛(wèi)星DNA中度重復順序:一般分散于整個基因組中;長度和拷貝數(shù)差別很大單一順序:基因主要位于單一順序動物中單一順序約占50%植物中單一順序約占20%第7頁,共81頁,2024年2月25日,星期天第8頁,共81頁,2024年2月25日,星期天第9頁,共81頁,2024年2月25日,星期天

是遺傳信息的物理和功能單位,包含產(chǎn)生一條多肽鏈或功能RNA所必需的全部核苷酸序列。

基因分類:編碼RNA的基因,如rRNA基因,snRNA基因等;編碼蛋白質的基因2.什么是基因?第10頁,共81頁,2024年2月25日,星期天第11頁,共81頁,2024年2月25日,星期天第12頁,共81頁,2024年2月25日,星期天第13頁,共81頁,2024年2月25日,星期天第14頁,共81頁,2024年2月25日,星期天*一個基因完全在另一個基因內(nèi)部如:B和A,E和D

其讀碼結構互不相同---ATG-----//------AATGCC----//---ATAACG---//--TAA----A*BATGCCN----NNATAA第15頁,共81頁,2024年2月25日,星期天*部分重疊如:K和C*兩個基因共用少數(shù)堿基對如:D和J-------TAATG-------D終止密碼子J起始密碼子第16頁,共81頁,2024年2月25日,星期天3.DNA測序的方法鏈終止法測序化學降解法測序自動化測序非常規(guī)DNA測序第17頁,共81頁,2024年2月25日,星期天3.1鏈終止法測序(thechainterminationmethod)

基本原理:

通過合成與單鏈DNA互補的多核苷酸鏈,由于合成的互補鏈可在不同位置隨機終止反應,產(chǎn)生只差一個核苷酸的DNA分子,從而來讀取待測DNA分子的順序。第18頁,共81頁,2024年2月25日,星期天技術路線與要求制備單鏈模板↓將單鏈模板與一小段引物退火↓加入DNA多聚酶

4種脫氧核苷酸分別加入少量4種雙脫氧核苷酸

↓將4種反應產(chǎn)物分別在4條泳道電泳↓根據(jù)4個堿基在4條泳道的終止位置讀出基因序列

A克隆于質粒中DNA→用堿或熱變性BM13克隆單鏈DNAC噬??寺NADPCR產(chǎn)生單鏈DNAA高酶活性B無5’→3′外切酶活性C無3′→5′外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子連接的是氫原子,不是羥基第19頁,共81頁,2024年2月25日,星期天第20頁,共81頁,2024年2月25日,星期天第21頁,共81頁,2024年2月25日,星期天3.2化學降解法測序基本原理:

在選定的核苷酸堿基中引入化學集團,再用化合物處理,使DNA分子在被修飾的位置降解.第22頁,共81頁,2024年2月25日,星期天技術路線

將雙鏈DNA樣品變?yōu)閱捂湣總€單鏈的同一方向末端都用放射性同位素標記,以便顯示DNA條帶↓分別用不同方法處理,獲得只差一個核苷酸的降解DNA群體↓電泳,讀取DNA的核苷酸順序第23頁,共81頁,2024年2月25日,星期天Maxam-Gilbert法所用的化學技術

堿基特異修飾方法GPh8.0,用硫酸二甲酯對N7進行甲基化,使C8-C9鍵對堿基裂解有特殊敏感性A+GpH2.0哌啶甲酸可使嘌呤環(huán)的N原子化,從而導致脫嘌呤,并因此消弱腺嘌呤和鳥嘌呤的糖苷鍵C+T肼可打開嘧啶環(huán),后者重新環(huán)化成五元環(huán)后易除去C1.5mol/LNaCl存在時,可用肼除去胞嘧啶第24頁,共81頁,2024年2月25日,星期天第25頁,共81頁,2024年2月25日,星期天3.3自動化測序基本原理與鏈終止法測序原理相同,只是用不同的熒光色彩標記ddNTP,如ddATP標記紅色熒光,ddCTP標記藍色熒光,ddGTP標記黃色熒光,ddTTP標記綠色熒光.由于每種ddNTP帶有各自特定的熒光顏色,而簡化為由1個泳道同時判讀4種堿基.第26頁,共81頁,2024年2月25日,星期天第27頁,共81頁,2024年2月25日,星期天第28頁,共81頁,2024年2月25日,星期天DNA芯片測序基本原理將各種排列順序的寡核苷酸點播在芯片上,每個點播的寡核苷酸在排列的方陣中都有指定的位置.待檢測的DNA分子與芯片溫浴,凡是能雜交的寡核苷酸都會在確定位置發(fā)出信號,然后根據(jù)獲取的信息將寡核苷酸的順序進行對比組裝,拼接成完全的DNA順序.第29頁,共81頁,2024年2月25日,星期天利用基因芯片進行雜交測序的原理第30頁,共81頁,2024年2月25日,星期天4序列的組裝4.1隨機測序與序列組裝

隨機測序也稱”鳥槍法”.

序列組裝原理:直接從已測序的小片段中尋找彼此重疊的測序克隆,然后依次向兩側鄰接的序列延伸.

優(yōu)點:不需預先了解任何基因組的情況.ABCABCABCABC小片段測序計算機拼裝第31頁,共81頁,2024年2月25日,星期天ABC小片段測序計算機拼裝鳥槍法(Shotgun)測序的問題CAATGCATTA……GCAGCCAATGCGAP錯裝第32頁,共81頁,2024年2月25日,星期天實例:流感嗜血桿菌基因組的測序及順序組裝超聲波打斷純化的基因組DNA↓瓊脂糖電泳收集1.6~2.0Kb的區(qū)段、純化

↓構建到質粒載體中↓隨機挑選19687個克隆,進行28643次測序,得到可讀順序為11631485bp↓組裝成140個覆蓋全基因組范圍的獨立的順序重疊群,↓第33頁,共81頁,2024年2月25日,星期天

各重疊群間仍有間隙

順序間隙物理間隙

↓↓

載體或宿主菌選用不當而被丟失的順序測序時遺漏的測序解決辦法:通過相鄰已知順序作為探針篩選已有的基因組文庫解決辦法:利用其它宿主菌與載體重新構建文庫第34頁,共81頁,2024年2月25日,星期天4.2

限制測序

限制測序:是指將一段染色體區(qū)段的DNA順序進行組裝.

一些已繪制了遺傳圖與物理圖的微生物基因組測序中也采用這一方法.

如高等植物擬南芥基因組的測序完全依據(jù)克隆重疊群,先進行各個BAC克隆的隨機測序,再進行序列組裝;

水稻基因組測序計劃采取得策略與此相同.第35頁,共81頁,2024年2月25日,星期天4.3

指導測序與序列組裝

建立在基因組圖譜基礎上的”鳥槍法”,即所謂”指導鳥槍法”或”指導測序”。在人類基因組進入測序組裝階段就采用此方法,其基本步驟如下:A構建平均為2Kb的人類基因組質粒文庫,進行雙向測序;B構建平均10Kb的人類基因組質粒文庫,進行雙向測序,讀取2個端部順序;C參考人類基因組圖,特別是大量的STS位標作為基點,進行序列組裝,排成重疊克隆群.第36頁,共81頁,2024年2月25日,星期天

先將染色體打成比較大的片段(幾十-幾百Kb),利用分子標記將這些大片段排成重疊的克隆群(Contig),分別測序后拼裝.這種策略叫基于克隆群(contig-based)的策略.ABCABC大片段contig小片段測序拼裝第37頁,共81頁,2024年2月25日,星期天兩種策略的比較鳥槍法策略指導測序策略不需背景信息構建克隆群

(遺傳、物理圖譜)時間短需要幾年的時間需要大型計算機得到的是草圖(Draft)得到精細圖譜第38頁,共81頁,2024年2月25日,星期天4.5

其他測序路線重要區(qū)域優(yōu)先測序人們對感興趣的基因或與疾病相關的基因優(yōu)先測序.如:人類主要組織相容性復合區(qū)位于第6號染色體,與人類免疫系統(tǒng)有關,因而優(yōu)先測序.第39頁,共81頁,2024年2月25日,星期天EST(Expressedsequencetag)測序

EST是一種重要的基因組圖分子標記,以EST為探針很容易從cDNA文庫中篩選全基因,又可從BAC克隆中找到其基因組的基因序列.

優(yōu)點:AmRNA可直接反轉錄成cDNA,而且cDNA文庫也比較容易構建;B對cDNA文庫大量測序,即可獲得大量EST的序列;CEST為基因的編碼區(qū),不包括內(nèi)含子和基因間區(qū)域,一次測序的結果足以鑒定所代表的基因;第40頁,共81頁,2024年2月25日,星期天5.人類基因組計劃

人類基因組計劃(Humangenomeproject)于1990年啟動,我國于1999年加入該計劃,承擔其中1%的任務,即人類3號染色體短臂上約30Mb的測序任務。

第41頁,共81頁,2024年2月25日,星期天5.1人類基因組計劃的目的

闡明人類基因組30億個堿基對的序列,發(fā)現(xiàn)所有人類基因,并搞清其在染色體上的位置;破譯人類全部遺傳信息,使人類第一次在分子水平上全面地認識自我;解碼生命、了解生命的起源、了解生命體生長發(fā)育的規(guī)律;認識種屬之間和個體之間存在差異的起因、認識疾病產(chǎn)生的機制以及長壽與衰老等生命現(xiàn)象、為疾病的診治提供科學依據(jù)。第42頁,共81頁,2024年2月25日,星期天5.2人類基因組草圖的完成

2000年6月26日是人類歷史上值得紀念的一天。人類基因組的工作草圖已經(jīng)繪制完畢并于這天向全世界公布。最終完成圖要求測序所用的克隆能忠實地代表常染色體的基因組結構,序列錯誤率低于萬分之一。第43頁,共81頁,2024年2月25日,星期天A.CeleraGenomics人類基因組的測序策略5.3人類基因組測序策略第44頁,共81頁,2024年2月25日,星期天采集5個自愿者的DNA樣品構建3種不同插入子大小的基因組文庫2Kb,10Kb和50Kb完成約2700萬次插入子末端測序,總長14800MbGeneBank下載104018個BAC末端順序PFP發(fā)表的公開數(shù)據(jù)主要為BAC克隆的順序,共4443.3Mb隨機測序與序列組裝方法和指導測序與序列組裝方法相結合進行序列組裝第45頁,共81頁,2024年2月25日,星期天B國際人類基因組測序策略構建BAC克隆↓限制性酶處理獲得指紋↓根據(jù)指紋重疊方法組建BAC克隆重疊群↓根據(jù)STS標記,將BAC克隆重疊群標定在物理圖上↓每個BAC克隆內(nèi)部采用鳥槍法測序,組裝↓將BAC插入順序與BAC克隆指紋極重疊群對比,將已閱讀的順序錨定到物理圖上第46頁,共81頁,2024年2月25日,星期天第47頁,共81頁,2024年2月25日,星期天第48頁,共81頁,2024年2月25日,星期天人類基因組研究的驚人發(fā)現(xiàn)?19號染色體是含基因最豐富的染色體,而13號染色體含基因量最少?目前已經(jīng)發(fā)現(xiàn)和定位了26000多個功能基因,其中尚有42%的基因尚不知道功能?人類基因組中存在“熱點”和大片“荒漠”。在染色體上有基因成簇密集分布的區(qū)域,也有大片的區(qū)域只有“無用DNA”——不包含或含有極少基因的成分?;蚪M上大約有1/4的區(qū)域沒有基因的片段。

?35.3%的基因包含重復的序列。這說明那些原來被認為是“垃圾”的DNA也起重要作用,應該被進一步研究。第49頁,共81頁,2024年2月25日,星期天什么是單核苷酸多態(tài)性

人類99.9%的基因密碼是相同的,而差異不到0.1%,不同人群僅有140萬個核苷酸差異。這些差異是由“單一核苷酸多樣性”(SNP)產(chǎn)生的,它構成了不同個體的遺傳基礎,個體的多樣性被認為是產(chǎn)生遺傳疾病的原因。在整個基因組序列中,人與人之間的變異僅為萬分之一,從而說明人類不同“種屬”之間并沒有本質上的區(qū)別。第50頁,共81頁,2024年2月25日,星期天5.5人類基因組計劃的意義隨著人類基因組逐漸被破譯,一張生命之圖將被繪就,人們的生活也將發(fā)生巨大變化。人類基因研究的意義在于它可以支持和推動生命科學中一系列重要的基礎性研究。如基因組遺傳語言的破譯,基因的結構與功能關系,生命的起源和進化,細胞發(fā)育、生產(chǎn)、分化的分子機理,疾病發(fā)生的機理等。第51頁,共81頁,2024年2月25日,星期天5.6人類基因組計劃的論理學A個人DNA順序的隱私權.

如:”次等”基因攜帶者可能受到岐視,職業(yè)限制,醫(yī)療保險等問題;B基因專利問題第52頁,共81頁,2024年2月25日,星期天6.后人類基因組計劃

伴隨著人類基因組計劃的迅速進展,基因的全序列逐步被完整的測出,會出現(xiàn)大量的不知道任何功能信息的序列。因此,在HGP完成之后,即全部人類基因被定序之后,還需要:破解貯存于基因組之中的遺傳語言;識別、分離、鑒定和克隆所有基因;搞清每個基因的功能及基因之間的相互作用和相互關系。第53頁,共81頁,2024年2月25日,星期天7水稻的基因組

2002年我國科學家完成了水稻基因組定序和初步分析。出人意表的是,水稻的基因竟比人類基因還要多得多。人類基因大約有3-4萬個,水稻有46022-55615個基因。因此水稻基因組可說是繼人類基因組之后,完成定序的最大基因組,也是至今已知最大的植物基因組。由于水稻是全球半數(shù)以上人口的主食,對解決全球糧食問題具有重要意義。第54頁,共81頁,2024年2月25日,星期天本章要點鏈終止法測序人類基因組計劃了解其他基因測序方法和基因拼接方法第55頁,共81頁,2024年2月25日,星期天本章內(nèi)容結束謝謝!第56頁,共81頁,2024年2月25日,星期天第二講基因組序列詮釋第57頁,共81頁,2024年2月25日,星期天問題基因組序列所包含的全部遺傳信息是什么?基因組作為一個整體如何行使其功能?用什么方法尋找基因,研究基因地功能呢?第58頁,共81頁,2024年2月25日,星期天主要內(nèi)容:尋找基因獲取基因的全長cDNA序列確定DNA順序中基因的位置研究基因的功能基因表達蛋白質組學第59頁,共81頁,2024年2月25日,星期天1.尋找基因1.1根據(jù)開放讀碼框預測基因A起始密碼子ATG第一個ATG的確定則依據(jù)Kozak規(guī)則;Kozak規(guī)則是基于已知數(shù)據(jù)的統(tǒng)計結果,所謂Kozak規(guī)則,即第一個ATG側翼序列的堿基分布所滿足的統(tǒng)計規(guī)律.第60頁,共81頁,2024年2月25日,星期天

若將第一個ATG中的堿基A,T,G分別標為1,2,3位,則Kozak規(guī)則可描述如下:(1)第4位的偏好堿基為G;(2)ATG的5’端約15bp范圍的側翼序列內(nèi)不含堿基T;(3)在-3,-6和-9位置,G是偏好堿基;(4)除-3,-6和-9位,在整個側翼序列區(qū),C是偏好堿基。第61頁,共81頁,2024年2月25日,星期天信號肽分析信號肽分析軟件(SignalPhttp://www.cbs.dtu.dk/services/signalP)

把預測過程中證實含完整mRNA5’端的Contig翻譯為蛋白序列;

然后用SignalP軟件對前50個氨基酸序列(從第一個ATG對應的甲硫氨酸Met開始)進行評估,如果SignalP分析給出正面結果,則測試序列有可能為信號肽;

假如在該測試序列的第一個Met5’端存在終止密碼子,該序列為信號肽的可能性更大。第62頁,共81頁,2024年2月25日,星期天B終止密碼子終止密碼子:TAA,TAG,TGAGC%=50%終止密碼子每64bp出現(xiàn)一次;

GC%>50%終止密碼子每100-200bp出現(xiàn)一次;由于多數(shù)基因ORF均多于50個密碼子,因此最可能的選擇應該是ORF不少于100個密碼子。第63頁,共81頁,2024年2月25日,星期天C3’端的確認

3’端的確認主要根據(jù)Poly(A)尾序列,若測試Contig不含Poly(A)序列,則根據(jù)加尾信號序列“AATAAA”和BLAST同源性比較結果共同判斷。第64頁,共81頁,2024年2月25日,星期天D非編碼序列、內(nèi)含子高等真核生物多數(shù)外顯子長度不少于100個密碼子,有的不到50個密碼子甚至更少;第65頁,共81頁,2024年2月25日,星期天E密碼子偏愛性編碼同一氨基酸的不同密碼子稱為同義密碼,其差別僅在密碼子的第3位堿基不同。不同種屬間使用同義密碼的頻率有很大差異,如人類基因中,丙氨酸(Ale)密碼子多為GCA,GCC或GCT,而GCG很少使用。第66頁,共81頁,2024年2月25日,星期天F外顯子-內(nèi)含子邊界外顯子和內(nèi)含子的邊界有一些明顯的特征,如:內(nèi)含子的5‘端或稱供體位(donorsite)常見的順序為5’-AG↓GTTAAGT-3’;

3’端又稱受體位(acceptorsite),多為5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);第67頁,共81頁,2024年2月25日,星期天G上游控制順序幾乎所有基因(或操縱子)上游都有調控序列,它們可與DNA結合蛋白作用,控制基因表達。另外個別生物的基因組特有組成也可作為判別依據(jù),如脊椎動物基因組許多基因的上游都有CpG島。

第68頁,共81頁,2024年2月25日,星期天H軟件預測采用NCBI的ORF預測軟件(ORFfinder:/gorf/orfig.cgi)判斷ORF的可能范圍。第69頁,共81頁,2024年2月25日,星期天1.2mRNA的5’端即轉錄起始位點區(qū)通過同源性比較來預測mRNA的5’端,最常用的與轉錄起始位點相關的數(shù)據(jù)庫是真核啟動子數(shù)據(jù)庫(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http://www

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論