hi c輔助基因組組裝項目方案_第1頁
hi c輔助基因組組裝項目方案_第2頁
hi c輔助基因組組裝項目方案_第3頁
hi c輔助基因組組裝項目方案_第4頁
hi c輔助基因組組裝項目方案_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Hi-C技術(shù)構(gòu)建棉花組項目方一、背景介利用Hi-C輔助組組裝背景概Hi-C技術(shù)是染色質(zhì)構(gòu)象捕獲技術(shù)(Chromosomeconformationcapture)結(jié)合高通量(High-throughputsequencing)衍生的一種技術(shù)。Hi-C主要將空間結(jié)構(gòu)的DN段進(jìn)行交聯(lián),并將交聯(lián)的DN段富集,然后進(jìn)行高通量,對數(shù)據(jù)進(jìn)行分析即可揭示染色質(zhì)間的相互作用。利用Hi-C輔助組組裝主要基于內(nèi)的DNA片段的交互作用大于間的交互作用和內(nèi)的DNA片段間交互作用與其線性距離服從冪次規(guī)律。因而可以實現(xiàn)將初步組裝的組草圖中的序列定位到,并能夠確定這些序列在上的順序和方向為獲得高質(zhì)量的序列圖譜奠定重要的基礎(chǔ)。利用Hi-C輔助組組裝相比于傳統(tǒng)遺傳圖譜在特異性、覆蓋度、誤差和成本上都具有顯著地優(yōu)勢。首先Hi-CRead在輔助組裝過程中可以認(rèn)為是一個分子標(biāo)記,故其在長度上是普通SSRSNP4-5倍,這使得其比傳統(tǒng)遺傳圖譜上的標(biāo)記具有更高的特異性;其次利用Hi-C技術(shù)能夠捕獲初步組裝的所有的ScaffoldsContigs初步組裝序列的的定位與順序的確定相比遺傳圖譜具備了更高的覆蓋度;再次Hi-C數(shù)據(jù)僅來源于一個,這就使得該方法連接的scaffold具有更加真因而Hi-C輔助組組裝具有更低的誤差率最后Hi-C的輔助組裝方法要求的基礎(chǔ)數(shù)據(jù)為進(jìn)行組材料的單一株系Hi-C交互數(shù)據(jù),整個過程無需構(gòu)建龐大的遺傳群體和進(jìn)行大規(guī)模的分型工作,具有實驗周期短、規(guī)模小,因而節(jié)約了時間和成本尤其是對于高雜合率或者多倍體的植物組的輔助組裝其棉花Hi-C構(gòu)某棉(大小近似亞洲棉1.7Gb)的組由“2+3”技術(shù)已完成,并完成組拼接,其中ScaffoldN50=3.08Mb,ScaffoldN90=517Kb。我們會基該棉的Sfold水平進(jìn)行構(gòu)建,一般情況大于50Kb的片段即可掛載到染色體上(一般精度會更高。所以我們至少保證90%的掛載率是沒有問的。在完成構(gòu)建之前,我們會根據(jù)Scaffold之間的Hi-C互作頻率,來判斷組大片段組裝的錯誤性。在reads深度低的地方為錯誤的連接點(diǎn),我們會將此處斷開,并重新連接,已糾正組的組裝錯(但是糾錯可能會導(dǎo)致Scaffold組裝指標(biāo)的下降)二、建庫方90%的組序列組裝到上圖Hi-C構(gòu)建原具體的建庫策略如下表所示1Hi-C量可以選擇與組樣本不同,原則上越近越好。需要送無污染幼10g三、項目預(yù)整體報價5萬元(包含樣本的提取、建庫、和分析四、實驗方實驗流Hi-C技術(shù)是構(gòu)象捕獲技術(shù)結(jié)合高通量衍生的一種技術(shù)主要研究染色質(zhì)的三維結(jié)構(gòu)通過對染色質(zhì)內(nèi)全部DNA間的交互作用進(jìn)行捕獲獲得交聯(lián)、內(nèi)切酶酶切、末端修復(fù)、環(huán)化、DNA純化及捕獲和上機(jī)等步驟[4]。圖1Hi-C實驗流程Hi-C文庫構(gòu)粘性末端,保存互作關(guān)系之間的距離關(guān)系和互作頻率,一般使用HindIII;環(huán)化:將末端修復(fù)后的DNA進(jìn)行環(huán)化,將含有互作的DNA片段之間行環(huán)化,確保后續(xù)和分析過程中確定互作DNA的位置DNADNA解交聯(lián),純化DNA,300bp-700bp的DNA片段進(jìn)行文庫構(gòu)建。Hi-C文庫質(zhì)Hi-C文庫上機(jī)(庫檢合格后,應(yīng)用IlluminaHiSeq平臺進(jìn)行上機(jī)一般用Xten平(分析流對RawData進(jìn)行數(shù)據(jù)過濾,去除其中的接頭序列及低質(zhì)量Reads獲得高質(zhì)量的CleanData。將CleanData與初步組裝的組進(jìn)行序列比對,獲得MappedData?;谶@些數(shù)據(jù)將作為文庫質(zhì)量評估的依據(jù);利用上步獲得的有效的Hi-C數(shù)據(jù)對初步組裝的組序列進(jìn)行進(jìn)一步的組Hi-C輔助組組裝分析流程如圖2所示五、結(jié)果

圖2Hi-C輔助組組裝生物信息分析流程組裝結(jié)果統(tǒng)我們對Hi-C輔助組組裝的初步結(jié)果列在下表中表某組組裝數(shù)據(jù)統(tǒng)計ShotgunassemblyTotalassemblylength,includinggapsNumberofcontigsorN50scaffoldsize%sequence(%contigs)clusteredinto%clusteredsequence(%contigs)mis-%clusteredsequence(%contigs)%orderedsequence(%contigs)w/ordering%orderedsequence(%contigs)w/orientation注:*:Clustering和Ordering下的contigs均指初步組裝序列中的contig或者scaffold序列;Orderingerror指相對參考組,在確定順序的序列中與鄰近c(diǎn)ontig或者scaffold序列順序不一致的比例;Orientation組裝結(jié)果統(tǒng)我們基于LACHESIS軟件開發(fā)了相關(guān)組裝流程,整合了組糾錯功能,并對組序列進(jìn)行群組的劃分、排序和定向,并對組裝結(jié)果進(jìn)行評估。Hi-C對原組組裝糾表組的統(tǒng)計信Contig/ScaffoldContig/ScaffoldContig/ScaffoldN50Contig/ScaffoldN90Contig/ScaffoldMaxGaptotallength注:PacBio+BioNanoCorrected:糾錯后contig結(jié)果;NGS+PacBio+Bionano+Corrected:scaffold組裝結(jié)Hi-C輔助組組我們會給出利用Hi-C組裝出的組大小占原組裝組大小的比(掛載效率。以及每個群組(類似于遺傳圖譜的連鎖群)Hi-C數(shù)據(jù)統(tǒng)計表格。以及我們能夠確定Scaffold方向和順序的組大小和Scaffold數(shù)目等信Hi-C組裝結(jié)果評這里除了近緣物種組、Unigene的評估,我們重點(diǎn)開發(fā)了熱圖評估和近緣物種組的共線性評估。圖Hi-C組裝交互熱 ScaffoldN50Trachinotus

Colinear BlockDraft LAC

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論