![基因組學(xué)與比較基因組學(xué)課件_第1頁](http://file4.renrendoc.com/view/23d77972879298a9fc6af9d70682b62f/23d77972879298a9fc6af9d70682b62f1.gif)
![基因組學(xué)與比較基因組學(xué)課件_第2頁](http://file4.renrendoc.com/view/23d77972879298a9fc6af9d70682b62f/23d77972879298a9fc6af9d70682b62f2.gif)
![基因組學(xué)與比較基因組學(xué)課件_第3頁](http://file4.renrendoc.com/view/23d77972879298a9fc6af9d70682b62f/23d77972879298a9fc6af9d70682b62f3.gif)
![基因組學(xué)與比較基因組學(xué)課件_第4頁](http://file4.renrendoc.com/view/23d77972879298a9fc6af9d70682b62f/23d77972879298a9fc6af9d70682b62f4.gif)
![基因組學(xué)與比較基因組學(xué)課件_第5頁](http://file4.renrendoc.com/view/23d77972879298a9fc6af9d70682b62f/23d77972879298a9fc6af9d70682b62f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics基礎(chǔ)分子生物學(xué)期末安排考試時間:
2009年
1月
12日下午
2:00-4:00考試地點:三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)
基因組計劃基因組(genome)是生物體內(nèi)遺傳信息的集合,是某個特定物種細(xì)胞內(nèi)全部DNA分子的總和。基因組學(xué)(genomics)是指研究并解析生物體整個基因組的所有遺傳信息的學(xué)科?;蚪M計劃(GenomeProject)是指對人類以及其它生物體全基因組的測序工作(sequencing)。人類基因組計劃(HumanGenomeProject,HGP):90年代提出并已基本完成,同40年代原子彈爆炸,60年代人類登月一起被認(rèn)為是二十世紀(jì)科技發(fā)展史上的三大創(chuàng)舉。Publiceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:
基因組DNA大片段文庫的構(gòu)建
YAC(yeastartificialchromosome,酵母人工染色體):含有三種必需成分:著絲粒、端粒和復(fù)制起點。是迄今容量最大的克隆載體,插入片段平均長度為200-1000Kbp,最大的可以達到2Mbp。BAC(Bacterialartificialchromosome),用細(xì)菌的F質(zhì)粒及其調(diào)控基因構(gòu)建了細(xì)菌染色體克隆載體,其克隆能力在125~150Kbp左右。以BAC為基礎(chǔ)的克隆載體形成嵌合體的頻率較低,轉(zhuǎn)化效率高,而且以環(huán)狀結(jié)構(gòu)存在于細(xì)菌體內(nèi),易于分辨和分離純化,已被科學(xué)界廣泛接受。BAC的構(gòu)建pBAC108L來自細(xì)菌的一個小型F質(zhì)粒,其中oriS和repE控制了質(zhì)粒的復(fù)制起始,parB和parA控制了拷貝數(shù)。100-150KbpinsertionDNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)記是RFLP(RestrictionFragmentLengthPolymorphism)。DNA序列上的微小變化,甚至1個核苷酸的變化,也能引起限制性內(nèi)切酶切點的丟失或產(chǎn)生,導(dǎo)致酶切片段長度的變化。第二代DNA遺傳標(biāo)記SSLP(SimpleSeqeuceLengthPolymorphism)利用了存在于人類基因組中的大量重復(fù)序列,包括重復(fù)單位長度在15-65個核苷酸左右的小衛(wèi)星DNA(minisatelliteDNA),重復(fù)單位長度在2-6個核苷酸之間的微衛(wèi)星DNA(microsatelliteDNA)。第三代DNA遺傳標(biāo)記SNP
(singlenucleotidepolymorphism),也是最廣泛的遺傳標(biāo)記,是分散于基因組中的單個堿基的差異。這種差異包括單個堿基的缺失和插入,但更常見的是單個核苷酸的替換,即單核苷酸的多態(tài)性。到目前為止已經(jīng)在人類基因組發(fā)現(xiàn)了超過1000萬個SNP位點,平均每300bp中就有一個SNP!RFLPmarkerSSLPmarkersWTmutSNPmarker鳥槍法序列測定技術(shù)全基因組鳥槍法測序(shotgunsequencing)技術(shù):隨機挑選帶有基因組DNA的質(zhì)粒進行末端序列測定,然后用計算機程序進行序列拼接。鳥槍法測序的主要缺點是,隨著所測基因組總量增大,所需測序的片段大量增加;其次,高等真核生物(如人類)基因組中有大量重復(fù)序列,導(dǎo)致判斷失誤DNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencing大規(guī)模DNA序列拼接
DNA序列拼接問題與組合數(shù)學(xué)中的最短超串問題相似。最短超串問題即給定一個字符串的集合,找出一最短的字符串稱為超串,并將集合中的任何一元素作為其子串。PopularAssemblersTIGRAssembler(TIGR)Phrap(WashU)CeleraAssembler(Celera,TIGR)Arachne(MITBroad)Phusion(Sanger–usesPhrap)Atlas(BaylorHGSC)AssemblyoftheIndividualSequencesKeepaddingindividualsequencingreadstobuildlargerandfewercontigsAssemblyoftheIndividualSequencesEventuallyallsequencingreads
mergetoasingleconsensussequence(alargecontig)foreachchromosome.鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列
高通量DNA序列分析技術(shù)
人類基因組計劃的成功很大程度上得益于有效減少DNA測序成本的技術(shù)更新。通過改良測序方法,不斷提升其自動化程度,DNA測序的成本降低了100倍,從20世紀(jì)70-80年代$10/bp降低到本世紀(jì)初$0.1/bp!如果一個熟練的DNA序列分析人員采取早期80年代方法每天測定1000bp計算,人類基因組(約3×109bp)的全序列分析,至少也得需要100名這樣的工人花上100年的時間才能完成。而2000年代的高通量測序儀可達到月測序1-6Mbp!目前???$2/1Mbp3Gbp/machine/dayDNAsequencingtechnologies
?“Classical” –Sangerdideoxysequencing?“NextGeneration”,commercialized
–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation?Singlemolecule(tetheredDNApolymerase)
–Heliscope(cyclicalbaseaddition) –VisiGen(realtime,FRET-based)Illumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runRoche/454:GenomeSequencerFLXRealTimeSequencingbySynthesisChemiluminescencedetectioninpicotiterplatesAmplification:emulsionPCRPyrosequencingupto400,000reads/runonaverage250bases/readupto100Mb/runRoche/454GenomeSequencerFLX100Mb/runPyrosequencing---454SequencingGenomesequencinginmicrofabricatedhigh-densitypicolitrereactorsMargulies,M.Eghold,M.etal.Nature.2005Sep15;437(7057):326-7AsectionofPyrosequencingreadsIllumina/Solexa:GeneticAnalyzerRealTimeSequencingbySynthesisClonalSingleMoleculeArrayAmplification:bridgingPCR60millionreads/runupto50bases/read2Gb/run8channels,app.5mioreads/channelFluorescentlabelsReversible3‘OHblockingIllumina/SolexaGeneticAnalyzer2000Mb/runReversibleterminator-basedsequencing(Solexa)FragmentDNAandligateadaptorsComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencingreversibleterminatorsCost$$$$to$$$$$$$$$$$AccuracyConsensus99.99%Singleread>99.5%;Consensus>99.99%?AssemblyBestBetterBadGapClosureandFinishingToughTougherPossible?RealTimeSequencingbyLigationEmulsionPCRandBeadsonslides85millionreads/runUpto35bases/read3Gb/rundualfluorescentlabels8individualchannels/flowcell2flowcells/runAppliedBiosystemsSOLiD3000Mb/runOligonucleotide
Ligation&Detection(SOLiD)SOLiD:Substrateattachment;dibaseprobesMakesequencinglibrarybyshearingandadapterligationAttachDNAfragmentstobeadsandamplifypoloniesinemulsionAttachbeadstoslideSOLiD:SequencingligationcyclesSOLiD:DataCollectionandImageAnalysisSOLiD:DecodingthesequenceMardis2008Comparisonof“NextGeneration”SequencingTechnologiesApplicationsGeneticAnalyzerSingleMolecule
SequencingTechnologies:onthehorizon
?ArrayoftetheredDNApolymerasemolecules?Boundtotemplatestrand+primer?Heliscope –Cyclicalbaseaddition(similartoSolexa)?VisiGen –Realtime,imagingFRETflashes –Hopefulprediction:1Mb/sec“NextGeneration”Sequencing
Technologies:RateLimitingFactors
?Frontend:Makingthesequencinglibrary?Backend:Bioinformaticstomakesenseof
the“sequencetsunami”---essemblyWhatdowesequence?denovogenomesequencinggenomeresequencing(SNPidentification)metagenomesorcomplexsamplestranscriptomeprofilingsmallRNAidentification(applications)ExamplesofApplicationsof“NextGeneration”SequencingTechnologiesBestfor“re-sequencing”,i.e.,aligninggeneratedsequencetoareferencegenomeNextgenerationDNAtechnologiesmayreplacemicroarraysforsomeapplicationsShendure&Ji2008The“$10,000humangenomesequencing”prize?Tothefirstteamthatcanbuildadeviceanduseittosequence:–100humangenomeswithin10daysorless,–Accuracy:atmost1errorper100,000bases,–Accuratecoverageofatleast98%ofthegenome,–Recurringcostofnomorethan$10,000(US)pergenome.?Prize:$10million?Deadline:12:01AMPST,October4,2013.?Donors:XFoundation,J.CraigVenterFoundationHumanHapMapProjectHapMap的構(gòu)建分為三個步驟:(a)在多個個體的DNA樣品中鑒定單核苷酸多態(tài)性(SNPs);(b)將群體中頻率大于1%的那些共同遺傳的相鄰SNPs組合成單體型;(c)在單體型中找出用于識別這些單體型的標(biāo)簽SNPs。通過對圖中的三個標(biāo)簽SNPs進行基因分型,可以確定每個個體擁有哪一個單體型。SCIENCE315:1781(30MARCH2007)Metagenomesor
complexsamples轉(zhuǎn)錄圖(transcriptprofiling)
基因轉(zhuǎn)錄圖(cDNA圖),或者基因的cDNA片段圖,即表達序列標(biāo)簽圖(EST,expressedsequencetag),是基因組圖的重要組成部分。大規(guī)模生產(chǎn)EST的主要程序如下:分離特定組織在某一發(fā)展階段或某種生理條件下的總mRNA,合成雙鏈cDNA,克隆到plasmid中并進行兩端測序。PyrosequencingProvidesEvidenceforNovelTranscriptsandTranscriptArchitecture
smallRNAidentification
(i.e.microRNA)到2006年底已完成的基因組項目()
根據(jù)2007年1月的數(shù)據(jù),全球已啟動2296個基因組項目,其中607個項目已經(jīng)完成,已經(jīng)公開發(fā)表481個基因組序列,包括403個細(xì)菌基因組,33個古細(xì)菌基因組和45個真核生物基因組。其它基因組計劃到2006年12月全世界主要基因組計劃的進展情況
Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocomparethegenecontentofoneorganismtoanotherorganism.Tostudygene/genomeevolution.Tostudyorganismalevolution.Asafoundationforfutureexperimentation.不同模式生物基因組的比較物種基因組大小估計基因數(shù)尿殖道支原體
Mycoplasmagenitalium580Kb467肺炎支原體
Mycoplasmapneumoniae816Kb677流感嗜血桿菌
Haemophilusinfluenzae1.8Mb1709枯草芽孢桿菌
Bacillussubtilis4.2Mb4100大腸桿菌
Escherichiacoli4.6Mb4288釀酒酵母
Saccharomycescerevisiae13Mb6275線蟲
Caenorhabditiselegans100Mb18891擬南芥
Arabidopsisthaliana125Mb25498果蠅
Drosophilamelanogaster165Mb14113人類
Homosapiens3Gb約2.5萬比較基因組學(xué)(Comparativegenomics)比較基因組學(xué)的威力在于它能根據(jù)對一種生物相關(guān)基因的認(rèn)識來理解、詮釋甚至克隆分離另一種生物的基因。遠(yuǎn)緣基因組間的比較為認(rèn)識生物學(xué)機制的普遍性,尋找研究復(fù)雜生理和病理過程所需的實驗?zāi)P吞峁┝死碚撘罁?jù),而近緣基因組間的比較則為認(rèn)識基因結(jié)構(gòu)與功能等細(xì)節(jié)提供了參數(shù)。物種名基因數(shù)目轉(zhuǎn)錄因子數(shù)量比例擬南芥約2938815335.9酵母約58852093.5線蟲約188916693.5果蠅約133796354.5FunctionalCategoriesinEukaryoticProteomesApplicationstoMedicineAkeyapplicationofhumangenomeresearchistofinddiseasegenesbypositionalcloningThismethodinvolvesmappingthechromosomalregioncontainingthegenebylinkageanalysisinaffectedfamiliesThehumangenomicse
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三農(nóng)村義務(wù)教育實施方案
- 珠寶鑒定與評估技術(shù)作業(yè)指導(dǎo)書
- 居民采暖供用熱合同
- 信息安全防護技術(shù)作業(yè)指導(dǎo)書
- 2025年毫州考貨運資格證考試內(nèi)容
- 2025年延安道路運輸從業(yè)資格證考試
- 2025年銀川貨車從業(yè)資格證考試試題
- 2025年襄陽道路客貨運輸從業(yè)資格證模擬考試下載
- 電力資源整合合同(2篇)
- 電力公司勞動合同范本(2篇)
- DB50T 662-2015 公交首末站規(guī)劃設(shè)計規(guī)范
- 2024至2030年中國女裝行業(yè)市場發(fā)展監(jiān)測及投資前景展望報告
- 海洋工程裝備制造經(jīng)濟效益和社會效益分析報告
- 《煉油與化工企業(yè)設(shè)備完整性管理 體系要求》
- SYT 6968-2021 油氣輸送管道工程水平定向鉆穿越設(shè)計規(guī)范-PDF解密
- 醫(yī)美中心發(fā)展規(guī)劃方案
- 譯林版六年級上冊英語Unit 7《Protect the earth》單元話題閱讀理解專項練習(xí)(含答案)
- (正式版)QBT 5998-2024 寵物尿墊(褲)
- 光伏、儲能、充電一體化系統(tǒng)用電纜的標(biāo)準(zhǔn)與要求
- 醫(yī)院優(yōu)質(zhì)服務(wù)提升方案及措施
- 第二單元(知識清單)高二語文(選擇性必修中冊)
評論
0/150
提交評論