版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Bioinformatics多樣本混合測序的編碼設計和解碼算法孫嘯
生物電子學國家重點實驗室東南大學
2017.04.23長沙1BioinformaticsDNA測序技術快速發(fā)展2全球首批NovaSeq進駐南京2017.03.30Bioinformatics多樣本混合測序3充分利用測序通量——同時測序多個樣本關鍵問題區(qū)分不同樣本——編碼(1)Barcoding(顯性編碼)(2)Overlappooling(隱性編碼)NatRevGenet.2014,15(11):749-63Bioinformatics多樣本混合測序4Barcoding(顯性編碼)readBarcode樣本標記NatMethods.2008,5(3):235-7.關注的問題編碼的數量編碼的容錯和糾錯能力Bioinformatics多樣本重疊混合測序5Overlappooling(隱性編碼)GenomeRes.200919:1243-1253GenomeRes.200919:1254-1261NatureBiotechnology,2009.以樣本的混合模式作為編碼提高測序效率編碼設計復雜,解碼困難多樣本混合測序實驗設計及數據解碼CaoCC,SunX.QuantitativeBiology,2016,
4(1):36–46.重疊混合測序編碼解碼6OverlappingPoolSequencing重疊混合7混合池1混合池2混合池3樣本混合模式樣本之間重疊混合樣本混合矩陣一個混合池測序多個樣本一個樣本在多個池中測序重疊混合測序的編碼與解碼
篩選稀有變異攜帶者8問題:保證準確解碼辨別測序誤差與突變辨別多個陽性樣本重疊混合測序的優(yōu)化設計測序深度模型分組重疊混合模型OptimalsequencingdepthsofcoverageforpooledsequencingofdiploidsamplesDatarequirementfordifferentnumberofblocks9重疊混合測序的優(yōu)化設計測序深度模型分組重疊混合模型優(yōu)化選擇代價模型:文庫+數據+混合
根據代價選擇最優(yōu)設計CaoCC,SunX.GeneticEpidemiology.201310重疊混合測序的優(yōu)化設計優(yōu)化選擇樣本混合方案利用群試理論進行解碼單獨測序成本大幅降低篩選稀有突變攜帶者的測序成本CaoCC,SunX.GeneticEpidemiology.2013在不同混合樣本數目下的測序代價11STD設計參數:n=200,d=2基于定量群試的重疊混合測序設計及解碼前面只用到每個混合池的陽性樣本定性檢測結果攜帶突變的測序片段個數能夠反映攜帶者的比例定量群試:利用覆蓋變異位點測序片段個數信息1號2號3號4號5號6號7號8號I號II號III號IV號V號12基于定量群試的重疊混合測序設計及解碼樣本混合設計定義PI指標評價樣本混合設計PI為陽性混合池數目比陽性樣本數目
與不確定屬性的陰性樣本數目之和還高的概率值
PI能夠反映識別稀有突變攜帶者的可能性大小根據PI選擇隨機設計的最優(yōu)設計參數
解碼:識別突變攜帶者貝葉斯解碼算法A:樣本混合模式O:測序結果13基于定量群試的重疊混合測序設計及解碼與普通群試相比,該方法能夠容許檢測更多的稀有變異攜帶者CaoCC,SunX.BMCBioinformatics.2014Leastsequencingdatathroughputrequiredtoachievea95%correctdecodingrate.Only36poolswereallowedtoidentifyheterozygousvariantcarriersamong100diploidsamples.Performanceofoverlappingpoolsequencingusingrandomk-setpooldesign14正確解碼前提下的數據通量需求面向單倍型的混合測序解碼從混合測序結果中準確估計單倍型頻率,并判斷稀有單倍型攜帶者Ehapp—新算法CaoCC,SunX.Bioinformatics.2015.15面向單倍型的混合測序解碼Ehapp在較短的測序讀長下具有較大的優(yōu)勢應用重疊混合測序篩選稀有單倍型攜帶者CaoCC,SunX.Bioinformatics.2015.16基于重疊混合的單倍型測序方法研究動機:嘗試將重疊混合測序方法應用于單倍型測序,解決存在的問題,以期提高單倍型構建性能17Bioinformatics單倍型測序18單倍型測序的主要方法
物理分割克隆測序稀釋基因組DNAGlusmanetal.GenomeMedicine2014,6:73NatureBiotechnology,29:38–39(2011)單倍型測序基于克隆或稀釋的單倍型測序
基因組片段混合在各個池子中
每個池中局部單倍型盡量不重疊NatRevGenet.2015Jun;16(6):344-58.基于重疊混合的單倍型測序方法待解決兩個問題
克隆重疊問題
錯誤連接問題解決問題的思路準確識別覆蓋每個allele的克隆提高單倍體構建的準確性Chimericfragments…A…A…C……A…T…G……G…T…G……A…A…G…20Bioinformatics基于重疊混合的單倍型測序方法21
多次混合——將克隆看成為重疊混合測序的樣本Someotheroverlappingpools利用不同的Overlap信息解碼根據不同混合池中的不同覆蓋判斷重疊部分的歸屬解決問題的基本策略核心準確識別SNP位點以及覆蓋每個allele的所有克隆進而確定每個克隆上各個allele及其順序前提:覆蓋某allele的克隆個數相對于整個克隆文庫來說是稀有的SNP位置重疊混合測序解碼SNP集覆蓋SNP的克隆集形成局部單倍型并組裝22基于重疊混合的單倍型測序方法稀釋到多個混合池構建測序文庫并測序比對&檢測SNP重構局部單倍型連接局部單倍體構建個體克隆文庫完整單倍體基因組23解碼方法Figure1.Illustrationofallelesassignment.(A)Fiveclonesarepooledintothreepools,whichmeanspool#1containsclones1,4and5;pool#2containsclones2and4;andpool#3containsclones3and5.(B)Thesequencingresults.Forexample,allele2issequencedthree,twoandonetimesinpools#1,#2and#3,respectively.(C)AccordingtoMandY,thevectorxforeveryallelecouldbesolvedandthefiveclonescouldbereconstructedaccordingly,asshownin(C).Forexample,thesequencingresultofallele2is(3,2,1)T,equalingthedot-productofthevectorMwiththetargetvectorxof(1,1,0,1,1)T,whichmeansallele2iscontainedinclone1,clone2,clone4andclone5,butnotinclone3.DecodingAlgorithmAllelesassignmentM:poolingmatrixY:countofallelejintheithpoolx:either1or0,indicatingiftheclonecontainsthealleleLiCetal.NucleicAcidsRes.201624實驗設計25Experimentaldesign(分組設計)HapMapsampleNA12878:producedtwohaplotypesequencesThelengthoftheclonesfollowedaPoissondistribution,wheretheaveragelengthwasapproximately140kb.130110clonesweregenerated,with6×clonecoverage.實驗結果LiCetal.NucleicAcidsRes.2016Thecorrectdecodingratefordifferentcombinationsofvariousk(thepercentofclonesthatarepooledineachpool),t(thenumberofpools)anddtvalues(thedatathroughputforeachpool).Thecolorandsizeofthecircledenotethecorrectdecodingrateforeachscenario解碼正確率隨混合池個數及數據通量的變化選擇最優(yōu)的混合測序參數,以獲得最高的解碼正確率26實驗結果LiCetal.NucleicAcidsRes.201627在1號染色體上,221,009個同時被來自于兩個同源染色體的克隆所覆蓋的變異位點中有220,734(99.9%)個被準確的恢復。Table2.Thestatisticsoftheassembledhaplotypesforchromosome1準確地識別變異位點構建的單倍體更長實驗結果Thenumberofallelesineachreconstructedclonesequencethatsupporteachhaplotypeinthediploidindividual.LiCetal.Nuc
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版學校食堂肉類食材采購及食品安全風險評估與培訓服務合同3篇
- 二零二五年度高端定制家具采購合同范本9篇
- 2025版小區(qū)停車場租賃合同附停車場升級改造及智慧化服務協(xié)議3篇
- 二零二五版鍋爐采購、安裝及智能化節(jié)能系統(tǒng)合同3篇
- 2025年度美容行業(yè)美容院美容產品品牌推廣合同范本4篇
- 全新2025年度技術咨詢合同3篇
- 2025版團購業(yè)務金融風險管理合同3篇
- 公共基礎-2021年試驗檢測師《公共基礎》真題
- 土壤生物技術改良策略考核試卷
- 居民健康自我管理培訓考核試卷
- 2024版塑料購銷合同范本買賣
- JJF 2184-2025電子計價秤型式評價大綱(試行)
- GB/T 44890-2024行政許可工作規(guī)范
- 2024年安徽省中考數學試卷含答案
- 2025屆山東省德州市物理高三第一學期期末調研模擬試題含解析
- 2024年滬教版一年級上學期語文期末復習習題
- 兩人退股協(xié)議書范文合伙人簽字
- 2024版【人教精通版】小學英語六年級下冊全冊教案
- 汽車噴漆勞務外包合同范本
- 2024年重慶南開(融僑)中學中考三模英語試題含答案
- 2023年最新的校長給教師春節(jié)祝福語
評論
0/150
提交評論