版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第一講 基因組序列解析-1主要內(nèi)容:什么是基因組什么是基因DNA測序的方法DNA序列的組裝人類基因組方案水稻基因組方案后基因組學(xué)1. 什么是基因組 基因組就是一個物種中所有基因的整體組成。 基因組有兩層意義:遺傳物質(zhì)和遺傳信息。 要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結(jié)構(gòu)與功能、基因之間的相互關(guān)系。 Homo sapiens 3,000E.coli 4.6Genome Size (Mb)什么是C 值?通常是指一種生物單倍體基因組DNA的總量. 在真核生物中,C值一般隨著生物的進(jìn)化而增加,高等生物C值一般大于低等生物。 C值悖理: 生物的復(fù)雜性與基因組的大小并不完全成比例增加細(xì)
2、菌真菌等動物陰影局部為一個門內(nèi)C-值的范圍重復(fù)順序高度重復(fù)順序: 長度:幾個幾千個bp 拷貝數(shù):幾百個上百萬個 首尾相連,串聯(lián)排列 集中分布于染色體的特定區(qū)段如端粒,著絲粒等 也稱衛(wèi)星DNA中度重復(fù)順序: 一般分散于整個基因組中; 長度和拷貝數(shù)差異很大單一順序: 基因主要位于單一順序 動物中單一順序約占50 植物中單一順序約占20 是遺傳信息的物理和功能單位,包含產(chǎn)生一條多肽鏈或功能RNA所必需的全部核苷酸序列。 基因分類: 編碼RNA的基因,如rRNA基因,snRNA基因等; 編碼蛋白質(zhì)的基因2. 什么是基因?基因的不連續(xù)性Intron 和Exon: 大多數(shù)真核生物蛋白質(zhì)基因的編碼順序(Ex
3、on)都被或長或短的非編碼順序(Intron)隔開基因家族 一群具有一致的或相似順序的基因,有的還擔(dān)負(fù)類似的生物學(xué)功能, 可以相互補償, 比方:E2f transcription factor Mouse symbolHuman OrthologE2f1E2F1 E2f2E2F2E2f3E2F3E2f4E2F4E2f5E2F5E2f6E2F6假基因(Pseudogene) 來源于功能基因 但已失去活性 的DNA序列產(chǎn)生假基因的原因有:由重復(fù)產(chǎn)生的假基因;加工的假基因, 由RNA反轉(zhuǎn)錄為cDNA 后再整合到基因組中;殘缺的基因(Truncated gene) 重疊基因:同一段DNA 能攜帶兩種不
4、同蛋白的信息.重迭基因有以下幾種情況:*一個基因完全在另一個基因內(nèi)部*局部重疊* 兩個基因共用少數(shù)堿基對 *一個基因完全在另一個基因內(nèi)部如:B和A, E和D 其讀碼結(jié)構(gòu)互不相同 -ATG-/-AATGCC -/-ATAACG-/-TAA-A*BATGCCN-NNATAA*局部重疊 如: K和C *兩個基因共用少數(shù)堿基對 如: D和J-TAATG-D 終止密碼子J 起始密碼子3. DNA測序的方法鏈終止法測序化學(xué)降解法測序自動化測序-鏈終止法測序非常規(guī)DNA測序3.3 自動化測序根本原理 與鏈終止法測序原理相同,只是用不同的熒光色彩標(biāo)記ddNTP,如ddATP標(biāo)記紅色熒光,ddCTP標(biāo)記藍(lán)色熒光
5、, ddGTP標(biāo)記黃色熒光, ddTTP標(biāo)記綠色熒光.由于每種ddNTP帶有各自特定的熒光顏色,而簡化為由1個泳道同時判讀4種堿基. PCR產(chǎn)物直接測序和克隆測序的比較4 序列的組裝4.1 隨機測序與序列組裝 隨機測序也稱鳥槍法. 序列組裝原理:直接從已測序的小片段中尋找彼此重疊的測序克隆,然后依次向兩側(cè)鄰接的序列延伸. 優(yōu)點:不需預(yù)先了解任何基因組的情況.ABCABCABCABC小片段測序計算機拼裝ABC小片段測序計算機拼裝鳥槍法(Shotgun)測序的問題 CAATGCATTAGCAGCCAATGCGAP錯裝實例:流感嗜血桿菌基因組的測序及順序組裝超聲波打斷純化的基因組DNA 瓊脂糖電泳收
6、集1.62.0Kb的區(qū)段、純化 構(gòu)建到質(zhì)粒載體中 隨機挑選19687個克隆,進(jìn)行28643次測序,得到可讀順序為11 631 485 bp 組裝成140個覆蓋全基因組范圍的獨立的順序重疊群, 各重疊群間仍有間隙 順序間隙 物理間隙 載體或宿主菌 選用不當(dāng)而被喪失的順序測序時遺漏的測序解決方法:通過相鄰順序作為探針篩選已有的基因組文庫解決方法:利用其它宿主菌與載體重新構(gòu)建文庫4.2 限制測序 限制測序:是指將一段染色體區(qū)段的DNA 順序進(jìn)行組裝. 一些已繪制了遺傳圖與物理圖的微生物基因組測序中也采用這一方法. 如高等植物擬南芥基因組的測序完全依據(jù)克隆重疊群,先進(jìn)行各個BAC克隆的隨機測序,再進(jìn)行
7、序列組裝; 水稻基因組測序方案采取得策略與此相同.4.3 指導(dǎo)測序與序列組裝 建立在基因組圖譜根底上的鳥槍法,即所謂指導(dǎo)鳥槍法或指導(dǎo)測序。 先將染色體打成比較大的片段(幾十-幾百Kb), 利用分子標(biāo)記將這些大片段排成重疊的克隆群(Contig), 分別測序后拼裝. 這種策略叫基于克隆群(contig-based)的策略.ABCABC大片段contig小片段測序拼裝兩種策略的比較鳥槍法策略 指導(dǎo)測序策略不需背景信息 構(gòu)建克隆群 (遺傳、物理圖譜)時間短 需要幾年的時間 需要大型計算機得到的是草圖(Draft) 得到精細(xì)圖譜4.5 其他測序路線重要區(qū)域優(yōu)先測序 人們對感興趣的基因或與疾病相關(guān)的基因
8、優(yōu)先測序.如:人類主要組織相容性復(fù)合區(qū)位于第6號染色體,與人類免疫系統(tǒng)有關(guān),因而優(yōu)先測序.EST (Expressed sequence tag) 測序 EST是一種重要的基因組圖分子標(biāo)記,以EST為探針很容易從 cDNA文庫中篩選全基因,又可從BAC克隆中找到其基因組的基因序列. 優(yōu)點: A mRNA 可直接反轉(zhuǎn)錄成cDNA,而且cDNA文庫也比較容易構(gòu)建; B 對cDNA文庫大量測序,即可獲得大量EST的序列; C EST為基因的編碼區(qū),不包括內(nèi)含子和基因間區(qū)域,一次測序的結(jié)果足以鑒定所代表的基因;5.人類基因組方案 人類基因組方案Human genome project于1990年啟動,
9、我國于1999年參加該方案,承擔(dān)其中1%的任務(wù),即人類3號染色體短臂上約30Mb的測序任務(wù)。 5.1 人類基因組方案的目的說明人類基因組30億個堿基對的序列,發(fā)現(xiàn)所有人類基因,并搞清其在染色體上的位置;破譯人類全部遺傳信息,使人類第一次在分子水平上全面地認(rèn)識自我;解碼生命、了解生命的起源、了解生命體生長發(fā)育的規(guī)律;認(rèn)識種屬之間和個體之間存在差異的起因、認(rèn)識疾病產(chǎn)生的機制以及長壽與衰老等生命現(xiàn)象、為疾病的診治提供科學(xué)依據(jù)。5.2 人類基因組草圖的完成 2000年6月26日是人類歷史上值得紀(jì)念的一天。人類基因組的工作草圖已經(jīng)繪制完畢并于這天向全世界公布。最終完成圖要求測序所用的克隆能忠實地代表常染
10、色體的基因組結(jié)構(gòu),序列錯誤率低于萬分之一。5.4 人類基因組測序結(jié)果基因數(shù)是3萬、4萬還是10萬 人類遺傳基因數(shù)量比原先估計的少很多。目前研究說明,人類基因組中約有3萬至4萬個蛋白編碼基因,僅僅是果蠅基因數(shù)目的兩倍,人有而鼠沒有的基因只有300個。此結(jié)論是由兩大科研小組的數(shù)據(jù)是從DNA水平上得出的;而“人類有10萬多個基因那么是從RNA水平上得出的結(jié)論。所以,這些數(shù)據(jù)不能推翻“人類有10萬個基因的說法。人類基因組研究的驚人發(fā)現(xiàn) 19號染色體是含基因最豐富的染色體,而13號染色體含基因量最少目前已經(jīng)發(fā)現(xiàn)和定位了26000多個功能基因,其中尚有42%的基因尚不知道功能人類基因組中存在“熱點和大片“
11、荒漠。在染色體上有基因成簇密集分布的區(qū)域,也有大片的區(qū)域只有“無用DNA 不包含或含有極少基因的成分。基因組上大約有14的區(qū)域沒有基因的片段。 353的基因包含重復(fù)的序列。這說明那些原來被認(rèn)為是“垃圾的DNA也起重要作用,應(yīng)該被進(jìn)一步研究。什么是單核苷酸多態(tài)性 人類999的基因密碼是相同的,而差異不到01,不同人群僅有140萬個核苷酸差異。這些差異是由“單一核苷酸多樣性SNP產(chǎn)生的,它構(gòu)成了不同個體的遺傳根底,個體的多樣性被認(rèn)為是產(chǎn)生遺傳疾病的原因。在整個基因組序列中,人與人之間的變異僅為萬分之一,從而說明人類不同“種屬之間并沒有本質(zhì)上的區(qū)別。 5.6 人類基因組方案的論理學(xué)A 個人DNA順序
12、的隱私權(quán). 如:次等基因攜帶者可能受到岐 視,職業(yè)限制,醫(yī)療保險等問題;B 基因?qū)@麊栴}6. 后人類基因組方案 破解貯存于基因組之中的遺傳語言;識別、別離、鑒定和克隆所有基因;搞清每個基因的功能及基因之間的相互作用和相互關(guān)系。7 水稻的基因組 2002年我國科學(xué)家完成了水稻基因組定序和初步分析。出人意表的是,水稻的基因竟比人類基因還要多得多。人類基因大約有3-4萬個,水稻有46022-55615個基因。因此水稻基因組可說是繼人類基因組之后,完成定序的最大基因組,也是至今最大的植物基因組。由于水稻是全球半數(shù)以上人口的主食,對解決全球糧食問題具有重要意義。第二講 基因組序列解析-2問題基因組序列所
13、包含的全部遺傳信息是什么?基因組作為一個整體如何行使其功能?用什么方法尋找基因,研究基因地功能呢?主要內(nèi)容:尋找基因獲取基因的全長cDNA序列確定DNA順序中基因的位置研究基因的功能基因表達(dá)蛋白質(zhì)組學(xué)1. 尋找基因1.1 根據(jù)開放讀碼框預(yù)測基因A 起始密碼子 ATG第一個ATG確實定那么依據(jù)Kozak規(guī)那么; Kozak規(guī)那么是基于數(shù)據(jù)的統(tǒng)計結(jié)果,所謂Kozak規(guī)那么,即第一個ATG側(cè)翼序列的堿基分布所滿足的統(tǒng)計規(guī)律. 假設(shè)將第一個ATG中的堿基A,T,G分別標(biāo)為1,2,3位,那么Kozak規(guī)那么可描述如下:(1)第4位的偏好堿基為G;(2)ATG的5端約15bp范圍的側(cè)翼序列內(nèi)不含堿基T;(
14、3)在-3,-6和-9位置,G是偏好堿基;(4)除-3,-6和-9位,在整個側(cè)翼序列區(qū),C是偏好堿基。信號肽分析 信號肽分析軟件(SignalP :/ ) 把預(yù)測過程中證實含完整mRNA 5端的Contig翻譯為蛋白序列; 然后用SignalP軟件對前50個氨基酸序列(從第一個ATG對應(yīng)的甲硫氨酸Met開始)進(jìn)行評估,如果SignalP分析給出正面結(jié)果,那么測試序列有可能為信號肽; C 3端確實認(rèn) 3端確實認(rèn)主要根據(jù)Poly(A)尾序列,假設(shè)測試Contig不含Poly(A)序列,那么根據(jù)加尾信號序列“AATAAA和BLAST同源性比較結(jié)果共同判斷。E 密碼子偏愛性 編碼同一氨基酸的不同密碼子
15、稱為同義密碼,其差異僅在密碼子的第3位堿基不同。 不同種屬間使用同義密碼的頻率有很大差異,如人類基因中,丙氨酸Ale密碼子多為GCA,GCC或GCT,而GCG很少使用。H 軟件預(yù)測 采用NCBI的ORF預(yù)測軟件 ( ORF finder: :/ )判斷ORF的可能范圍。1.2 mRNA的5端即轉(zhuǎn)錄起始位點區(qū) 通過同源性比較來預(yù)測mRNA的5端,最常用的與轉(zhuǎn)錄起始位點相關(guān)的數(shù)據(jù)庫是真核啟動子數(shù)據(jù)庫(The TRADAT Project , Eukaryotic Promoter Database, EPD. :/ )。1.3 同源查詢途徑 通過已存入數(shù)據(jù)庫中的基因順序與待查的基因組序列進(jìn)行比較,從中查找可與之匹配的堿基順序及其比例,用于界定基因的方法稱為同源查詢。 同源有如下幾種情況: A DNA序列某些片段完全相同;B 開放讀碼框ORF排列類似,如有長外顯子;C 開放讀碼框翻譯成氨基酸序列的相似性;D 模擬多肽高級結(jié)構(gòu)相似1.4 試驗分析A Northern 雜交確定DNA片段是表達(dá)序列: 本卷須知: a 當(dāng)某一基因的轉(zhuǎn)錄產(chǎn)物進(jìn)行可變剪接時,由于連接的外顯子不同,會產(chǎn)生好幾條長度不一的雜交帶,如果該基因是某一基因家族的成員也會出現(xiàn)多個信息; b 考慮組織專一性和發(fā)育階段的問題; C 基因表達(dá)產(chǎn)物豐度的問題 如
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《珠寶玉石教程》課件
- 車輛租賃協(xié)議三篇
- 人力資源行業(yè)員工福利顧問工作總結(jié)
- 2003年海南高考語文真題及答案
- 水利行業(yè)的保安工作總結(jié)
- 2023-2024年企業(yè)主要負(fù)責(zé)人安全培訓(xùn)考試題附答案【培優(yōu)】
- 2023年-2024年項目部安全培訓(xùn)考試題【易錯題】
- 1000字的貧困申請書范文5篇
- 開題答辯概覽
- 電灼傷護(hù)理查房
- 智能化施工管理平臺
- 2024年國家能源集團(tuán)江蘇電力有限公司招聘筆試參考題庫附帶答案詳解
- 江西省九江市2023-2024學(xué)年部編版九年級上學(xué)期期末歷史試題(含答案)
- 山東省濟南市2023-2024學(xué)年高三上學(xué)期期末學(xué)習(xí)質(zhì)量檢測物理試題(原卷版)
- 2024年新華人壽保險股份有限公司招聘筆試參考題庫含答案解析
- 能源托管服務(wù)投標(biāo)方案(技術(shù)方案)
- 2024年新奧集團(tuán)股份有限公司招聘筆試參考題庫含答案解析
- 乳頭混淆疾病演示課件
- 高速公路涉路施工許可技術(shù)審查指南(一)
- 海南物流行業(yè)發(fā)展趨勢分析報告
- 安全運維配置檢查
評論
0/150
提交評論