基因組結(jié)構(gòu)變異檢測的基本方法與前沿技術(shù),醫(yī)學(xué)遺傳學(xué)論文_第1頁
基因組結(jié)構(gòu)變異檢測的基本方法與前沿技術(shù),醫(yī)學(xué)遺傳學(xué)論文_第2頁
基因組結(jié)構(gòu)變異檢測的基本方法與前沿技術(shù),醫(yī)學(xué)遺傳學(xué)論文_第3頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基因組結(jié)構(gòu)變異檢測的基本方法與前沿技術(shù),醫(yī)學(xué)遺傳學(xué)論文摘要:本研究介紹了基因組構(gòu)造變異檢測的生物信息學(xué)基本方式方法和前沿技術(shù)。對基于第二代測序技術(shù)的四種檢測方式方法(讀對方式方法,讀深方式方法,分裂片段方式方法和序列拼接方式方法)的原理和特點進(jìn)行了具體解讀,分析了第二代測序技術(shù)應(yīng)用在檢測構(gòu)造變異上的特點與發(fā)展趨勢。最后介紹了三代測序、Linked-reads和光學(xué)物理圖譜等新技術(shù)在基因組構(gòu)造變異檢測中的應(yīng)用,闡述了融合新技術(shù)的構(gòu)造變異檢測方式方法的特點與優(yōu)勢。本文關(guān)鍵詞語:構(gòu)造變異;測序片段;第二代測序技術(shù);長片段測序技術(shù);光學(xué)物理圖譜技術(shù);Abstract:Thebasicmethodsandfrontiertechnologiesofgenomestructuralvariationsdetectionwereintroducedinthispaper.Theprinciplesandfeaturesofthe4detectionmethods(Read-pairmethod,Read-depthmethod,SpiltreadmethodandSequenceAssemblymethod)basedonnextgenerationsequencingtechnologywereelaboratedandthecharacteristicsanddevelopmenttrendofthenextgenerationsequencingtechnologyondetectingstructuralvariationswereanalyzed.Finally,somenewtechnologiesandtheirapplicationsindetectinggenomestructuralvariationswereintroduced,includingthethirdgenerationsequencing,linked-readsandopticsphysicalmaps.Thefeaturesandadvantagesofthedetectionmethodsmixedwithnewtechnologieswerediscussed.Keyword:Structuralvariations;Sequencingreads;Nextgenerationsequencing;Longreadssequencing;Opticsphysicalmaps;從基因的概念被提出伊始,對人類本身基因信息的探究一直是生命科學(xué)的熱門問題之一,人類基因組計劃(humangenomeproject,HGP)于2001年第一次完成了人類24條染色體的序列測定后,人們發(fā)現(xiàn)個體之間基因的類似程度到達(dá)99.9%,存在著大約0.1%的片段上的差異,我們稱之為基因組的多態(tài)性或基因組變異,正是這些差異導(dǎo)致了人與人之間截然不同的各類性狀差異。根據(jù)發(fā)生變異的堿基數(shù)量,基因組變異又能夠分為單核苷酸變異(singlenucleotidevariations,SNV)與構(gòu)造變異(structuralvariation,SV)。SNV是指發(fā)生在基因組水平上的單個核苷酸的變異;SV最初提出是指長度在1000bp以上的基因的大片段的變異(Feuketal.,2006),隨著對SV認(rèn)識的不斷發(fā)展,現(xiàn)SV一般指長度在50bp以上DNA片段變異(Alkanetal.,2018)。在構(gòu)造變異中,根據(jù)長度能夠分為長度在3MB下面的亞顯微水平的構(gòu)造變異和長度在3MB以上的顯微水平的構(gòu)造變異;根據(jù)類型能夠分為十多種不同的構(gòu)造變異,幾種常見的類型為缺失(Deletion)、重復(fù)(Duplication)、插入(Insertion)、倒位(Inversion)、易位(Translocation)等(圖1),華而不實缺失、重復(fù)、插入等改變基因組堿基對數(shù)量的構(gòu)造變異以及互相組合衍生出的復(fù)雜的構(gòu)造變異又能夠稱為拷貝數(shù)變異(copynumbervariation,CNV)(Cooperetal.,2007)。構(gòu)造變異的影響能夠歸納為兩大方面(Hurlesetal.,2008)。首先,在基因表示出方面,構(gòu)造變異會通太多種方式影響基因的轉(zhuǎn)錄與翻譯。當(dāng)基因發(fā)生重復(fù)、插入和缺失等變異時,會導(dǎo)致基因劑量的改變;當(dāng)編碼區(qū)域發(fā)生構(gòu)造變異時,會改變基因的轉(zhuǎn)錄翻譯;當(dāng)非編碼區(qū)域發(fā)生構(gòu)造變異時,會通過位置效應(yīng)影響基因表示出調(diào)控元件的調(diào)控作用;當(dāng)發(fā)生加強(qiáng)子或抑制子的刪除變異時,會影響基因的轉(zhuǎn)錄水平。其次,在疾病方面,構(gòu)造變異會導(dǎo)致性狀的非正常表示出,進(jìn)而引發(fā)各類遺傳性疾病。除了已經(jīng)為人們熟知的部分顯微水平的構(gòu)造變異引發(fā)的疾病,例如21號染色體3體引發(fā)的唐氏綜合征,5號染色體短臂上的缺失引發(fā)的貓叫綜合征等等;也有越來越多關(guān)于亞顯微構(gòu)造的構(gòu)造變異引發(fā)的疾病的報道,例如視蛋白基因的基因重組可能會引發(fā)紅綠色盲疾病(Lupski,2021);17q21.31部位的缺失變異會引發(fā)學(xué)習(xí)障礙(Koolenetal.,2006);16p11.2部位的缺失變異會引發(fā)孤單癥(W-eissetal.,2008)。最初,基因組中大量存在的SNV被以為是影響遺傳和表型的主要因素,但后來發(fā)現(xiàn)基因組中普遍存在大量的SV片段,同樣在人類疾病、復(fù)雜性狀和進(jìn)化的研究中具有重要意義(Check,2005),因而吸引了大量研究。一方面,研究集中于人類基因組構(gòu)造變異的檢測。從2008年開場,中、英、美各國共同發(fā)起的國際千人基因組計劃(The1000GenomesProject),對基因組的構(gòu)造變異作了當(dāng)時最全面最完善的分析。在2020年和2021年,國際千人基因組計劃分別發(fā)布了1092個樣本(GenomesProjectetal.,2020)和2504個樣本(Sudmantetal.,2021)的測序數(shù)據(jù)以及具體的構(gòu)造變異檢測結(jié)果。之后陸續(xù)有關(guān)于構(gòu)造變異檢測成果的報道,到2021年10月,韓國國立首爾大學(xué)醫(yī)學(xué)院針對一名韓國人的基因組(AK1)進(jìn)行了相關(guān)分析(Seoetal.,2021),發(fā)布了迄今為止最為具體的人類基因組構(gòu)造變異檢測結(jié)果。另一方面,人們關(guān)注于構(gòu)造變異與相關(guān)疾病的關(guān)聯(lián)分析,已經(jīng)有多種本身免疫性疾病(Yangetal.,2007;Wangetal.,2020)、病毒感染(Gonzalezetal.,2005)、肥胖(Falchietal.,2020)、骨質(zhì)疏松(Yangetal.,2008)等被證明與構(gòu)造變異相關(guān),尤其在癌癥與構(gòu)造變異的關(guān)聯(lián)性研究中,更是發(fā)現(xiàn)構(gòu)造變異是導(dǎo)致食道癌(Chengetal.,2021)、兒童神經(jīng)母細(xì)胞瘤(Pughetal.,2020)、小細(xì)胞肺癌(Georgeetal.,2021)等最主要的因素。圖1構(gòu)造變異的幾種常見類型Figure1Severalcommontypesofstructuralvariations其實早在上世紀(jì)五十年代,對于構(gòu)造變異的研究便已經(jīng)開場,但受限于技術(shù)手段,過去人們往往只能通過顯微鏡觀察到顯微水平的構(gòu)造變異。上世紀(jì)七十年代,人們用遺傳學(xué)方式方法對構(gòu)造變異進(jìn)行了更深切進(jìn)入的研究(SperlingandWiesner,1972)。21世紀(jì)以來,一方面隨著微陣列(Microarrays)、細(xì)菌人工染色體(bacteriaartificialchromosome,BAC)、單分子分析(Single-moleculeanalysis)等實驗技術(shù)的發(fā)展,人們開場使用陣列比擬基因組雜交(arraycomparativegenomichybridization,aCGH)、SNP微陣列(SNPmicroarrays)以及熒光原位雜交(fluorescentinsituhybridization,FISH)等方式方法來檢測構(gòu)造變異(Iafrateetal.,2004)。另一方面,隨著聚合酶鏈?zhǔn)椒错?polymerasechainreaction,PCR)、DNA測序以及基因組序列比擬分析等技術(shù)的發(fā)展,人們開場通過基于測序數(shù)據(jù)的計算機(jī)處理方式方法檢測構(gòu)造變異,尤其隨著新一代測序技術(shù)(nextgenerationsequencing,NGS)的發(fā)展和普及,基于測序數(shù)據(jù)的分析方式方法開場被大量使用。最近幾年來,為了彌補(bǔ)NGS技術(shù)檢測構(gòu)造變異的各種缺乏,人們開場通過單分子實時測序(single-moleculerealtimesequencing,SMRT)、納米孔(Nanopore)等第三代測序技術(shù)(thirdgenerationsequencing,TGS)進(jìn)行SV檢測。本研究主要就基于測序技術(shù)發(fā)展起來的一系列檢測構(gòu)造變異的方式方法和技術(shù)進(jìn)行介紹和討論。1、基因組構(gòu)造變異檢測基本方式方法每段DNA的測序序列的原始數(shù)據(jù)稱之為測序片段(Reads),基于測序技術(shù)的構(gòu)造變異檢測方式方法大部分通過reads與參考基因組的比對進(jìn)行檢測。主要檢測方式方法分為四種(Medvedevetal.,2018;Alkanetal.,2018;Millsetal.,2018),分別是讀對方式方法(Read-pairMethod)、讀深方式方法(Read-depthmethod)、分裂片段方式方法(Split-readmethod)以及序列拼接方式方法(Sequenceassemblymethod)。1.1、讀對方式方法將同一段DNA分別從兩端測得不同方向的序列信息稱之為雙端測序(Paired-endreads)。讀對方式方法通過雙端測序,獲得DNA片段兩端成對reads的分布的信息,再尋找比對到參考基因組上后分布和方向與參考基因組不一致的Reads,以此為特征判定構(gòu)造變異的類型(Alkanetal.,2018)。讀對方式方法以PEM算法(Korbeletal.,2007)、BreakDancer算法(Chenetal.,2018)、HYDRA算法(Quinlanetal.,2018)等為代表。以PEM算法為例,首先對樣本DNA進(jìn)行雙端測序(圖2A),能夠獲得DNA片段兩端成對reads的距離和方向等信息。之后將測得的成對的reads比對到參考基因組上,分析其在參考基因組上的距離和方向信息,根據(jù)比對前后距離和方向信息的不一致性(圖2B),來判定能否存在SV。發(fā)生缺失變異的片段兩端的reads在比對到參考基因組上時,其距離會增大,而發(fā)生插入變異的片段則會出現(xiàn)距離減少的情況,發(fā)生倒位變異的片段會出現(xiàn)方向上的變化。讀對方式方法是基于高通量測序數(shù)據(jù)檢測構(gòu)造變異的方式方法中使用最廣泛的,最早通過乳腺癌細(xì)胞系MCF-7產(chǎn)生的BAC序列驗證該方式方法的可行性(Voliketal.,2003)。理論上讀對方式方法能夠檢測各種類型的構(gòu)造變異,但是在處理基因組重復(fù)區(qū)域的比對時會遭到很大干擾。同時由于DNA片段長度的限制,讀對方式方法無法檢測大片段的構(gòu)造變異。1.2、讀深方式方法讀深方式方法首先假設(shè)在參考基因組上測序深度(Readdepth)是隨機(jī)分布的(通常服從泊松分布或者修正泊松分布)。將通過高通量測序獲得的樣本基因組的reads比對參考基因組上,分析其測序深度,通過測序深度在某些區(qū)域的差異變化來發(fā)現(xiàn)重復(fù)變異和缺失變異:重復(fù)區(qū)域的測序深度會出現(xiàn)明顯增加,缺失區(qū)域的測序深度會出現(xiàn)明顯減少(Alkanetal.,2018)。讀深方式方法以EWT算法(Yoonetal.,2018)、CNV-nator算法(Abyzovetal.,2018)等為代表。以EWT算法為例,首先在參考基因組上每100bp取互不重疊的窗,計算每個窗中比對到參考基因組上的reads的起始位點的個數(shù)(圖3A),再乘以與基因組中GC含量相關(guān)的比例系數(shù),作為每個窗的序列深度。依次計算每個窗中的測序深度,DNA片段上所有窗的測序深度總體應(yīng)當(dāng)近似服從泊松分布,但假如出現(xiàn)缺失變異、重復(fù)變異等拷貝數(shù)變異,則必然會引起連續(xù)的窗中的序列深度發(fā)生明顯的增加或降低的情況(圖3B)。圖2PEM算法檢測SV的流程與特征Figure2TheworkflowandfeaturesofPEMalgorithmforSVdetection注:A:雙端測序經(jīng)過,將基因組DNA剪切成長度為3kb左右的DNA片段,在片段兩端用生物素標(biāo)記后環(huán)化,再將環(huán)化片段隨機(jī)剪切,挑選出具有生物素標(biāo)記的片段,然后對挑選出的片段進(jìn)行測序,進(jìn)而分析獲得DNA片段兩端成對reads的距離和方向信息;B:不同構(gòu)造變異檢測時的不同特征,假設(shè)本來DNA片段長度為3kb,兩端序列在比對到參考基因組上后,若距離變?yōu)榱?kb,則DNA片段中可能出現(xiàn)了插入變異;若距離變成了5kb,則可能出現(xiàn)了缺失變異;若一端的序列出現(xiàn)方向上的變化,則可能出現(xiàn)倒位變異Note:A:Thefigureofprogressofpaired-endsequencing.ThegenomeDNAwasshearedtoyieldDNAfragmentsof3kb,andthenthefragmentswerelabeledbybiotinatbothendsandcircularized.Andthecircularizedfragmentswererandomlyshearedandthebiotinylatedfragmentswerescreened,thentheselectedfragmentsweresequenced,andthedistanceanddirectioninformationofthepair-endreadsoftheDNAfragmentswereobtained;B:Thefigureofvariousfeatureswhendetectingdifferentkindsofstructuralvariations;SupposethatthelengthoftheoriginalDNAfragmentsis3kb.Ifthelengthbecomes2kbaftertheirpaired-endreadsaremappedtothereferencegenome,theremightbeinsertionsintheDNAfragment;ifthelengthbecomes5kb,theremightbedeletions;ifoneofthereadsdirectionchanges,theremightbeinversions讀深方式方法是通過reads比對的統(tǒng)計信息檢測構(gòu)造變異的方式方法,其最早被用來解釋在癌癥細(xì)胞中發(fā)生的基因重組的現(xiàn)象(Campbelletal.,2008)。讀深方式方法在檢測基因組重復(fù)、缺失構(gòu)造變異時的效果非常顯著,且能夠用來預(yù)測基因的拷貝數(shù),但其無法檢測其他類型的構(gòu)造變異,無法區(qū)分串聯(lián)重復(fù)和散在重復(fù),而且讀深方式方法無法獲得斷點的相關(guān)信息,只能判定片段中能否存在構(gòu)造變異,而不能判定出構(gòu)造變異的準(zhǔn)確位置。圖3EWT算法檢測SV的原理Figure3TheprincipleofEWTalgorithmforSVdetection注:A:EWT算法計算測序深度經(jīng)過;方框的長度為100bp,以此作為一個窗,計算窗內(nèi)reads的起始位點(標(biāo)記區(qū)域內(nèi))個數(shù),作為這個窗的測序深度的計算標(biāo)準(zhǔn);B:模擬的缺失變異樣本基因組的測序深度分布情況;在樣本157224~157238kb的長度為14kb的DNA片段上共構(gòu)建了140個窗,這些窗的測序深度的分布在正常情況下近似服從期望為70的泊松分布;在157227~157229kb的區(qū)域內(nèi),序列深度出現(xiàn)了連續(xù)且明顯的降低則能夠判定在這一區(qū)域內(nèi)出現(xiàn)了缺失變異Note:A:Theprogressofcalculatingread-depthinEWTalgorithm;Thelengthoftheboxis100bp,itiscalledawindow,thenumberofstartpoints(themarkedregion)ofthereadsinthiswindowisthestandardoftheread-depth;B:Thedistributionofread-depthsofsimulatedsamplegenomewithdeletions;Fromthepoint15722kbtothepoint157238kb,theDNAfragmentslengthis14kb;Webuilt140windows,thedistributionofthewindowsoughttoobeythepoissondistributionwhoseexpectationis70;Intheregionbetween157227kband157229kb,theread-depthdecreasedobviouslyandcontinuously;Itcanbejudgedthatheremightbedeletionsinthisregion1.3、分裂片段方式方法樣本基因組測序獲得的reads通常要比對到參考基因組上,由于發(fā)生構(gòu)造變異,在某些reads的某個位置的左右兩側(cè),堿基對的坐標(biāo)和方向與參考基因組不一致,這個位置被稱為斷點(Breakpoint)。分裂片段方式方法通過尋找構(gòu)造變異樣本中含有斷點的reads上準(zhǔn)確的斷點位置信息來檢測構(gòu)造變異(Alkanetal.,2018)(圖4A)。分裂片段方式方法將樣本基因的各個reads比對到參考基因組上,尋找無法比對的reads,分別在無法比對的reads的特定堿基位置設(shè)置斷點,按斷點分裂成兩小段reads,再通過觀察兩個小段reads比對到參考基因組中的情況,進(jìn)而判定構(gòu)造變異情況。分裂片段方式方法以Pindel算法(Yeetal.,2018)、AGE算法(AbyzovandGerstein,2018)等為代表。以Pindel算法為例,首先通過SSAHA2軟件將所的reads比對到參考基因組上,尋找華而不實一端能比對到基因組上而另一端無法比對的reads,再從能夠比對的一端開場使用形式增長(Patterngrowth)算法搜索最大-最小子串,來尋找斷點的精到準(zhǔn)確位置,再將reads按斷點分裂成兩段,將片段分別比對到基因組上,來判定構(gòu)造變異的詳細(xì)信息(圖4B)。分裂片段方式方法基于對reads的分段來檢測構(gòu)造變異的斷點,能夠檢測單堿基分辨率的缺失變異和插入變異,對有明確的斷點特征的構(gòu)造變異具有很好的檢測效果,當(dāng)reads的長度大于插入片段的長度時,分裂片段方式方法的拓展還能夠用來檢測移動元素插入(mobile-elementinsertions,MEI)(Millsetal.,2018)。但仍有大量的構(gòu)造變異不存在斷點特征,無法通過分裂片段方式方法檢測,且其在具有大量重復(fù)片段的區(qū)域檢測效果不佳。分裂片段方式方法最早是基于Sanger測序法開發(fā)的(Millsetal.,2006),測序片段越長,檢測效果越好,二代測序數(shù)據(jù)讀長短的特點會嚴(yán)重影響分裂片段方式方法檢測的效果。1.4、序列拼接方式方法序列拼接方式方法通過對樣本基因組的reads片段進(jìn)行從頭拼接(Denovoassembly),重新組裝后解碼樣本基因組的序列,再將其與參考基因組序列進(jìn)行比對,進(jìn)而能夠清楚地判定能否存在構(gòu)造變異以及構(gòu)造變異類型(Alkanetal.,2018)。序列拼接的方式方法以ABySS算法(Simpsonetal.,2018)、Velvet算法(ZerbinoandBirney,2008)和SOA-Pdenovo算法(Lietal.,2018)等為代表。以ABySS算法為例,首先根據(jù)目的k值,通過測序片段產(chǎn)生所有可能的長度為k的子串,移除子串?dāng)?shù)據(jù)集讀取誤差,再通過deBruijn圖算法構(gòu)建初始的重疊群(Contigs),之后使用配對信息來消除Contigs的重疊模糊性,拓展Contigs的范圍,進(jìn)而獲得最后的拼接結(jié)果(圖5A)。用拼接獲得的完好的樣本基因組片段與參考基因組片段進(jìn)行比對時,在未發(fā)生構(gòu)造變異的區(qū)域比對完全一致,在發(fā)生構(gòu)造變異的區(qū)域比對則會出現(xiàn)差異(圖5B)。相對于前三種方式方法,序列拼接方式方法采用了截然不同的非reads比對的思路。從理論上來講,假如能夠拼接樣本基因組的全部序列,則能夠檢測出所有的SV與SNV,但以測序長度為100bp的Illumina測序儀為代表的第二代測序技術(shù)普遍讀長偏短,使得拼接難度大大提升,同時假如基因組上出現(xiàn)大量重復(fù)片段時,會引發(fā)拼接算法的崩潰性錯誤(Chaissonetal.,2021)。怎樣提高測序片段長度并改良序列拼接的算法是序列拼接方式方法亟待解決的問題。圖4使用分裂片段方式方法檢測SV原理Figure4TheprincipleofSplit-readmethodforSVdetection注:A:構(gòu)造變異的斷點示意,樣本基因組標(biāo)記區(qū)域內(nèi)為缺失變異區(qū)域,在構(gòu)造變異區(qū)域之外的reads能夠正確比對到參考基因組上,構(gòu)造變異區(qū)域的reads無法正確比對到參考基因組上,在構(gòu)造變異區(qū)域的起始和終止位置的reads,其標(biāo)記之外的部分是能夠正確比對的,標(biāo)記處的位置即為reads的斷點;B:不同構(gòu)造變異檢測時的不同特征,發(fā)生插入變異的DNA片段,插入片段前后的reads在斷點處各有一部分能夠比對到參考基因組上的相鄰位置;發(fā)生缺失變異的DNA片段,缺失部分的reads按斷點能夠分別比對到參考基因組前后不同位置Note:A:ThefigureofthebreakpointofSV,theregioninsidethemarkedareaisdeletionregion,theReadsoutofthemarkcanbemappedtothereferencegenomecorrectly,andtheReadsinthevariationregionscannotbemappedtothereferencegenome;Inthestartandendregions,thepartoutofthemarkcanbecorrectlymapped,andthemarkpositionsarethebreakpointsoftheReads;B;Thefigureofvariousfeatureswhendetectingdifferentkindsofstructuralvariants.IntheDNAfragmentswithinsertions,theReadsbeforeandaftertheinsertionregioncanbepartlymappedtotheadjacentpositionsofthereferencegenome;intheDNAfragmentswithdeletions,thereadscanbepartlymappedtodispersedpositionsinreferencegenome1.5、當(dāng)下構(gòu)造變異檢測方式方法的特點以及發(fā)展趨勢當(dāng)前的測序技術(shù)以第二代測序技術(shù)為主,第二代測序技術(shù)又稱為新一代測序技術(shù),NGS技術(shù)的代表是Illumina公司的測序儀,其每次產(chǎn)生的reads長度在100bp左右,重要特點是技術(shù)成熟、通量高、測序成本低、測序速度快,是當(dāng)前基因組測序的主要手段。借助NGS技術(shù),能夠通過單次測序?qū)嶒灠l(fā)現(xiàn)不同類型的構(gòu)造變異,而且得益于NGS技術(shù)的高準(zhǔn)確度,能夠準(zhǔn)確檢測出基因組的拷貝數(shù)變化,且具備了發(fā)現(xiàn)完好基因組變異的潛力。同時由于NGS技術(shù)高通量的特點,提高了構(gòu)造變異檢測效率并降低了其成本。但是,NGS技術(shù)存在讀長短的缺陷,會制約讀對和分段方式方法的檢測效率,且對序列拼接方式方法帶來極大困難。使用NGS數(shù)據(jù)檢測構(gòu)造變異的靈敏度不高,且大多局限于短片段的缺失變異和插入變異,無法檢測大片段的復(fù)雜構(gòu)造變異。圖5序列拼接方式方法檢測SV原理Figure5TheprincipleofSequenceassemblymethodforSVdetection注:A:為序列拼接經(jīng)過,通過大量互相重疊的reads進(jìn)行拼接,能夠獲得長度較長的Contigs,再對Contigs進(jìn)行拼接,能夠獲得長片段Scaffold;B部分為含有缺失變異的Scaffold與參考基因組比對示意圖,非缺失部分的序列都能夠正常比對到基因組上,缺失部分則無法正常比對,由此能夠非常直觀地得到變異區(qū)域的詳細(xì)信息Note:A:Thefigureoftheprogressofsequenceassembly,ThelongContigscanbeachievedbyassemblinglargenumberofoverlappingreads,andtheScaffoldcanbeachievedbyassemblingcontigs;B:ThefigureoftheresulttheScaffoldwithdeletionsmappedtothereferencegenome;Thenormalpartcanbemappedtothereferencegenomecorrectly,butthedeletionpartcannotbemappedcorrectly;Accordingtothis,thespecificinformationofthevariantpartscanbeobtaineddirectly在國際千人基因組計劃于2020年發(fā)布1092個個體的構(gòu)造變異檢測結(jié)果中,所有樣本的數(shù)據(jù)均通過低覆蓋度NGS獲得,包括6x覆蓋度的全基因組測序(whole-genomesequencing,WGS)和全外顯子組測序(whole-exomesequencing,WES),運用BreakDancer、CNVnator、Delly、Pindel、GenomeSTRiP(Handsakeretal.,2018)等構(gòu)造變異檢測算法,檢測了14000多個大片段的缺失變異以及小片段的串聯(lián)重復(fù)序列;而在2021年發(fā)布的構(gòu)造變異檢測結(jié)果中,除了使用了低覆蓋度的全基因組測序,還參加了單分子實時測序、SNP微陣列等各種技術(shù)相結(jié)合的測序手段,使用同樣的算法,共檢測了68000多個構(gòu)造變異,包括了缺失、重復(fù)、倒置、插入等不同類型的構(gòu)造變異,華而不實有48000多個構(gòu)造變異是從未發(fā)現(xiàn)的,而且近一半的構(gòu)造變異沒有明顯的斷點特征。比照來看,由于測序技術(shù)的區(qū)別,固然采用一樣的算法,但兩次檢測構(gòu)造變異的結(jié)果存在宏大差異。僅僅采用低覆蓋度的二代測序數(shù)據(jù)只能檢測出相對少量的SV,且大多只局限于缺失變異。同時,不同的構(gòu)造變異被檢測出的程度也不盡一樣,據(jù)估計,68%的倒位變異和35%的重復(fù)變異尚未被檢測出;相反,80%的缺失變異已經(jīng)被檢測。所以,僅僅采用低覆蓋度的二代測序產(chǎn)生的數(shù)據(jù)來檢測構(gòu)造變異已經(jīng)逐步無法知足檢測的需求。對于怎樣提高構(gòu)造變異的檢測水平,能夠從3個方面入手(HuddlestonandEichler,2021)。(1)提高測序深度,改良測序形式:NGS的測序深度至少要到達(dá)30x,而不是簡單的6覆蓋度,這樣才能夠提高檢測構(gòu)造變異的靈敏度。同時最好以家庭為單位來進(jìn)行測序,以了解表型特征的傳遞以及變異頻率等信息;(2)提高測序長度,完善序列拼接算法:使用單分子實時測序(Singlemoleculereal-timesequencing)等長片段測序方式方法提高Reads長度,隨著讀長增加,序列拼接算法的效果會出現(xiàn)顯著提高,序列拼接的難度也會顯著降低,實現(xiàn)基因組的完全解碼成為可能;(3)綜合使用檢測算法,采用讀深方式方法、讀對方式方法、分裂片段方式方法和序列拼接方式方法相結(jié)合的構(gòu)造變異檢測方式方法,例如CNVer算法(Medvedevetal.,2018)、GenomeSTRiP算法等彌補(bǔ)單一方式方法的缺乏。2、構(gòu)造變異檢測前沿技術(shù)和新方式方法2.1、基因組分析新技術(shù)最近幾年來,在基因組分析上出現(xiàn)了很多新技術(shù),這些技術(shù)都圍繞著獲取長片段的基因組測序序列的進(jìn)行,主要分為三類:(1)直接獲取長片段的新測序技術(shù),即第三代測序技術(shù);(2)對NGS獲得的短片段進(jìn)行處理獲取長片段的技術(shù),即連Link-reads技術(shù);(3)構(gòu)建基因組物理圖譜輔助序列拼接的技術(shù),即光學(xué)圖譜技術(shù)。第三代測序技術(shù)以PacificBioSciences公司的單分子實時測序(singlemoleculereal-time,SMRT)技術(shù)(RhoadsandAu,2021)為代表。SMRT技術(shù)通過熒光信號獲取序列信息,其優(yōu)點是讀長超長,平均讀取長度能夠到達(dá)16kb左右,在基因組組裝和構(gòu)造變異檢測方面能夠起突破性的作用。然而三代測序技術(shù)相較于二代測序技術(shù)錯誤率高,準(zhǔn)確率在85%左右,固然能夠通太多次重復(fù)測序使測序準(zhǔn)確率到達(dá)95%以上,但成本也會成倍增加;測序通量低,單次測序的通量是MB級別,與NGS的通量差距宏大,因而測序成本高,無法大規(guī)模應(yīng)用。Linked-reads技術(shù)(Kitzman,2021)以10XGenomics公司的GemCode平臺為代表。GemCode平臺對基因組上同一區(qū)域內(nèi)的DNA片段標(biāo)記以一樣的特殊堿基序列,在通過Illumina平臺測序后,連接一樣特殊堿基序列標(biāo)記的DNA片段,產(chǎn)生一種新的數(shù)據(jù)類型:連接片段(Linked-reads),進(jìn)而能夠以相對較低的成本來獲得長度到達(dá)10kb以上的測序片段,進(jìn)而能更好地進(jìn)行基因組組裝并提高構(gòu)造變異檢測靈敏度。Gemcode的缺點在于其對樣本質(zhì)量要求高,需要制備大小不同的文庫,且其測序基礎(chǔ)是基于Illumina測序的,所以無法改善高GC或低GC含量時測序覆蓋效果較差的情況(Rossetal.,2020)。光學(xué)圖譜技術(shù)又被稱為新一代圖譜(next-generationalmapping,NGM)技術(shù),以BioNano公司的Irys平臺為代表。Irys平臺通過酶切技術(shù)和熒光標(biāo)記成像技術(shù)構(gòu)建基因組的物理圖譜,描繪DNA上能夠辨別的標(biāo)記的位置(包括限制性內(nèi)切酶的酶切位點,基因等)和互相之間的距離,構(gòu)建基因組的宏觀框架,按照框架能夠使測序信息準(zhǔn)確地回歸到染色體上,進(jìn)而提高序列拼接的長度和準(zhǔn)確度,解決在高度重復(fù)區(qū)域的基因組組裝和構(gòu)造變異檢測問題。在基因組分析方面,光學(xué)圖譜技術(shù)只是一項輔助技術(shù),但其能夠很好地復(fù)原DNA分子的真實信息,輔助序列重新組裝,并且能夠與第二、第三代測序技術(shù)完美兼容,具有重要的應(yīng)用價值。2.2、融合長片段測序和物理圖譜的構(gòu)造變異檢測方式方法隨著上述新技術(shù)的出現(xiàn),基因組測序的片段長度大大提高,彌補(bǔ)了序列拼接方式方法的缺陷,其檢測效果獲得了突破性地提高,能夠檢測大片段和復(fù)雜的構(gòu)造變異。從最新的關(guān)于構(gòu)造變異的相關(guān)報道來看,以NGS短片段數(shù)據(jù)結(jié)合長片段測序數(shù)據(jù),輔助以基因組物理圖譜技術(shù),使用序列拼接方式方法檢測構(gòu)造變異的流程大概分為兩個部分(圖6):(1)對長測序片段進(jìn)行序列拼接,構(gòu)成長度在MB級別的Contigs,NGS短片段補(bǔ)充細(xì)節(jié),將Bionano基因組圖譜與Contigs相結(jié)合,構(gòu)建大片段的Scaffolds,與參考基因組比對,檢測構(gòu)造變異;(2)以長片段數(shù)據(jù)為框架,對NGS短片段數(shù)據(jù)進(jìn)行序列拼接,將拼接獲得的Contigs與參考基因組比對,檢測構(gòu)造變異?;谝陨戏绞椒椒?在構(gòu)造變異的檢測上有了新的突破。2021年6月,PacificBiosciences(PacBio)公司給出了SMRT測序組裝人類基因組的成果(Pendletonetal.,2021),選用的樣本是NA12878。其主要使用SMRT測序數(shù)據(jù)結(jié)合Bionano物理圖譜技術(shù),構(gòu)建樣本基因組Scaffolds,再使用NGS測序數(shù)據(jù)填補(bǔ)缺口,使用序列拼接方式方法等進(jìn)行構(gòu)造變異檢測。使用SMRT測序數(shù)據(jù)拼接獲得的Contigs的N50長度能夠到達(dá)900kb以上,Scaffold的N50長度高達(dá)30MB,相對于NGS測序數(shù)據(jù)拼接的長度有了顯著提高。在檢測構(gòu)造變異方面,除了檢測出了各種小片段的構(gòu)造變異,以及類型為插入、缺失以及片段重復(fù)的90多個長度在6kb以上的長片段SV,更是通過基因組圖譜檢測出了長度在100~400kb之間的8個大片段缺失變異與11個大片段插入變異。2021年12月,10Genomics公司給出了Linkedreads測序組裝人類基因組的結(jié)果(Mostovoyetal.,2021),選用的樣本同樣是NA12878。其首先對NGS數(shù)據(jù)使用SOAPdenovo算法進(jìn)行拼接,再結(jié)合10Genomics的Gemcode平臺產(chǎn)生的連接讀取數(shù)據(jù),構(gòu)成大片段的scaffold,最后再與Bionano物理圖譜相結(jié)合,產(chǎn)生最后的序列拼接結(jié)果,與參考基因組進(jìn)行比對,檢測構(gòu)造變異。最終綜合各種方式方法拼接的scaffold的N50長度同樣能夠到達(dá)與SMRT技術(shù)一樣的30MB以上。在檢測構(gòu)造變異方面,該實驗同樣檢測出了各種小片段的插入、刪除變異,同時還給出了200個大片段的重復(fù)變異的詳細(xì)分布情況。2021年韓國國立首爾大學(xué)醫(yī)學(xué)院給出的AK1基因組的相關(guān)分析中,綜合PacBio長讀長測序,Illumina短讀長測序,10Genomics連接片段,BioNanoGenomics光學(xué)圖譜以及細(xì)菌人工染色體(BAC)等方式方法,對AK1基因組進(jìn)行從頭組裝和基因組分析,在亞洲人的基因組構(gòu)造變異檢測方面獲得了大量進(jìn)展。其首先使用Illumina短讀長測序數(shù)據(jù),結(jié)合10G的Gemcode與BAC產(chǎn)生的數(shù)據(jù),進(jìn)行序列拼接,檢測構(gòu)造變異;再使用PacBio長讀長測序數(shù)據(jù)進(jìn)行序列拼接,結(jié)合Bionano物理圖譜技術(shù),構(gòu)建Scaffold,檢測長片段構(gòu)造變異。通過PacBio測序數(shù)據(jù)拼接獲得的Contigs的N50長度能夠到達(dá)17.7MB,而最終綜合拼接獲得的Scaffold的N50長度到達(dá)了44.8MB。在檢測構(gòu)造變異方面共鑒定到了18210個大片段的構(gòu)造變異,包含7358個缺失,10077個插入,71個倒置和704個復(fù)雜變異,華而不實47%的缺失變異與76%的插入變異等都是未曾報道過的。圖6融合NGS,長片段測序與物理圖譜的構(gòu)造變異檢測方式方法流程Figure6TheworkflowofSVdetectioncombinedNGS,longreadssequencingandphysicalmaps3、總結(jié)與考慮隨著測序技術(shù)的迅猛發(fā)展以及基因組分析技術(shù)的不斷進(jìn)步,人們對人類基因組的構(gòu)造變異逐步有了具體與系統(tǒng)的認(rèn)識?;跍y序技術(shù)的讀深、讀對、分裂片段、序列拼接方式方法為構(gòu)造變異的檢測提供了高效準(zhǔn)確的方式方法,開拓了實驗與計算機(jī)數(shù)據(jù)處理相結(jié)合檢測構(gòu)造變異的新形式,即便各項技術(shù)不斷進(jìn)步,仍然在圍繞著這些方式方法展開。隨著新技術(shù)的發(fā)展,測序片段的長度不斷增加,檢測構(gòu)造變異的準(zhǔn)確度和靈敏度也在不斷提高,而從最新的一些報道來看,無一例外的都選擇了序列拼接方式方法主導(dǎo)的檢測方式方法。一方面,固然四種基本方式方法在基于短片段的構(gòu)造變異檢測上都有各自不可替代的優(yōu)勢,但序列拼接方式方法通過解碼基因組序列,能夠愈加直觀、直接地檢測所有類型的構(gòu)造變異,并能夠精準(zhǔn)判定出不同長度、不同類型的構(gòu)造變異的詳細(xì)位置。隨著測序片段長度到達(dá)10kb甚至更長后,序列拼接方式方法的準(zhǔn)確性大大提高,準(zhǔn)確拼接長片段的技術(shù)難度也隨之降低。另一方面,隨著序列拼接方式方法逐步成為構(gòu)造變異的主流檢測方式方法,對序列拼接方式方法相關(guān)算法的研究也在不斷深切進(jìn)入,更多高效高準(zhǔn)確率的算法在不斷提出,序列拼接方式方法在不斷彰顯其蓬勃的生命力。作者奉獻(xiàn)楊金晶負(fù)責(zé)論文的整體框架設(shè)計,文獻(xiàn)資料總結(jié)以及文稿寫作,李成負(fù)責(zé)文獻(xiàn)資料補(bǔ)充和綜述文稿的修改,孫嘯是論文的指導(dǎo)者及負(fù)責(zé)人,指導(dǎo)論文架構(gòu)設(shè)計,論文寫作與修改。全體作者都閱讀并同意最終的文本。以下為參考文獻(xiàn)[]AbyzovA.,andGersteinM.,2018,AGE:definingbreakpointsofgenomicstructuralvariantsatsingle-nucleotideresolution,throughoptimalalignmentswithgapexcision,Bioinformatics,27(5):595-603[]AbyzovA.,UrbanA.E.,SnyderM.,andGersteinM.,2018,CN-Vnator:anapproachtodiscover,genotype,andcharacterizetypicalandatypicalCNVsfromfamilyandpopulationgenomesequencing,GenomeResearch,21(6):974-984[]AlkanC.,CoeB.P.,andEichlerE.E.,2018,Genomestructuralvariationdiscoveryandgenotyping,NatureReviewsGenetics,12(5):363-376[]CampbellP.J.,StephensP.J.,PleasanceE.D.,OMearaS.,LiH.,SantariusT.,StebbingsL.A.,LeroyC.,EdkinsS.,HardyC.,TeagueJ.W.,MenziesA.,GoodheadI.,TurnerD.J.,CleeC.M.,QuailM.A.,CoxA.,BrownC.,DurbinR.,HurlesM.E.,EdwardsP.A.W.,BignellG.R.,StrattonM.R.,andFutrealP.A.,2008,Identificationofsomaticallyacquiredrearrangementsincancerusinggenome-widemassivelyparallelpairedendsequencing,NatureGenetics,40(6):722-729[]ChaissonM.J.,WilsonR.K.,andEichlerE.E.,2021,Geneticvariationandthedenovoassemblyofhumangenomes,NatureReviewsGenetics,16(11):627-640[]CheckE.,2005,Humangenome:patchworkpeople,Nature,437(7062):1084-1086[]ChenK.,WallisJ.W.,McLellanM.D.,LarsonD.E.,KalickiJ.M.,PohlC.S.,McGrathS.D.,WendlM.C.,ZhangQ.,LockeD.P.,ShiX.,FultonR.S.,LeyT.J.,WilsonR.K.,DingL.,andMardisE.R.,2018,Breakdancer:analgorithmforhigh-resolutionmappingofgenomicstructuralvariation,NatureMethods,6(9):677-681[]ChengC.,ZhouY.,LiH.,XiongT.,LiS.,BiY.,KongP.,WangF.,CuiH.,LiY.,FangX.,YanT.,LiY.,WangJ.,YangB.,ZhangL.,JiaZ.,SongB.,HuX.,YangJ.,QiuH.,ZhangG.,LiuJ.,XuE.,ShiR.,ZhangY.,LiuH.,HeC.,ZhaoZ.,QianY.,RongR.,HanZ.,ZhangY.,LuoW.,Wang,J.,PengS.,YangX.,LiX.,LiL.,FangH.,LiuX.,MaL.,ChenY.,GuoS.,ChenX.,XiY.,LiG.,LiangJ.,YangX.,GuoJ.,JiaJ.,LiQ.,ChengX.,ZhanQ.,andCuiY.,2021,Whole-genomesequencingrevealsdiversemodelsofstructuralvariationsinesophagealsquamouscellcarcinoma,AmericanJournalofHumanGenetics,98(2):256-274[]CooperG.M.,NickersonD.A.,andEichlerE.E.,2007,Mutationalandselectiveeffectsoncopy-numbervariantsinthehumangenome,NatureGenetics,39(7S):22-29[]FalchiM.,El-SayedMoustafaJ.S.,TakousisP.,PesceF.,BonnefondA.,Andersson-AssarssonJ.C.,SudmantP.H.,DorajooR.,Al-ShafaiM.N.,BottoloL.,OzdemirE.,SoH.C.,DaviesR.W.,PatriceA.,DentR.,ManginoM.,HysiP.G.,DechaumeA.,HuyvaertM.,SkinnerJ.,PigeyreM.,CaiazzoR.,RaverdyV.,VaillantE.,FieldS.,BalkauB.,MarreM.,Visvikis-SiestS.,WeillJ.,Poulain-GodefroyO.,JacobsonP.,SjostromL.,HammondC.J.,DeloukasP.,ShamP.C.,McPhersonR.,LeeJ.,TaiE.S.,SladekR.,CarlssonL.M.,WalleyA.,EichlerE.E.,PattouF.,SpectorT.D.,andFroguelP.,2020,Lowcopynumberofthesalivaryamylasegenepredisposestoobesity,NatureGenetics,46(5):492-497[]FeukL.,CarsonA.R.,andSchererS.W.,2006,Structuralvariationinthehumangenome,NatureReviews,Genetics,7(2):85-97[]GenomesProjectC.,AbecasisG.R.,AutonA.,BrooksL.D.,DePristoM.A.,DurbinR.M.,HandsakerR.E.,KangH.M.,MarthG.T.,andMcVeanG.A.,2020,Anintegratedmapofgeneticvariationfrom1092humangenomes,Nature,491(7422):56-65[]GeorgeJ.,LimJ.S.,JangS.J.,CunY.,OzreticL.,KongG.,LeendersF.,LuX.,Fernandez-CuestaL.,BoscoG.,MullerC.,DahmenI.,JahchanN.S.,ParkK.S.,YangD.,KarnezisA.N.,VakaD.,TorresA.,WangM.S.,KorbelJ.O.,MenonR.,ChunS.M.,KimD.,WilkersonM.,HayesN.,EngelmannD.,PutzerB.,BosM.,MichelsS.,VlasicI.,SeidelD.,PintherB.,SchaubP.,BeckerC.,AltmullerJ.,YokotaJ.,KohnoT.,I-wakawaR.,TsutaK.,NoguchiM.,MuleyT.,HoffmannH.,SchnabelP.A.,PetersenI.,ChenY.,SoltermannA.,TischlerV.,ChoiC.M.,KimY.H.,MassionP.P.,ZouY.,JovanovicD.,KonticM.,WrightG.M.,RussellP.A.,SolomonB.,KochI.,LindnerM.,MuscarellaL.A.,laTorreA.,FieldJ.K.,JakopovicM.,KnezevicJ.,Castanos-VelezE.,RozL.,PastorinoU.,BrustugunO.T.,Lund-IversenM.,ThunnissenE.,KohlerJ.,SchulerM.,BotlingJ.,SandelinM.,Sanchez-CespedesM.,SalvesenH.B.,AchterV.,LangU.,BogusM.,SchneiderP.M.,ZanderT.,AnsenS.,HallekM.,WolfJ.,VingronM.,YatabeY.,TravisW.D.,NurnbergP.,ReinhardtC.,PernerS.,HeukampL.,ButtnerR.,HaasS.A.,BrambillaE.,PeiferM.,SageJ.,andThomasR.K.,2021,Comprehensivegenomicprofilesofsmallcelllungcancer,Nature,524(7563):47-53[]GonzalezE.,KulkarniH.,BolivarH.,ManganoA.,SanchezR.,CatanoG.,NibbsR.J.,FreedmaB.I.,QuinonesM.P.,BamshadM.J.,MurthyK.K.,RovinB.H.,BradleyW.,ClarkR.A.,AndersonS.A.,OConnellR.J.,AganB.K.,AhujaS.S.,BolognaR.,SenL.,DolanM.J.,andAhujaS.K.,2005,TheinfluenceofCCL3L1gene-containingsegmentalduplicationsonHIV-1/AIDSsusceptibility,Science,307(5714):1434-1440[]HandsakerR.E.,KornJ.M.,NemeshJ.,andMcCarrollS.A.,2018,Discoveryandgenotypingofgenomestructuralpolymorphismbysequencingonapopulationscale,NatureGenetics,43(3):269-276[]HuddlestonJ.,andEichlerE.E.,2021,Anincompleteunderstandingofhumangeneticvariation,Genetics,202(4):1251-1254[]HurlesM.E.,DermitzakisE.T.,andTyler-SmithC.,2008,Thefunctionalimpactofstructuralvariationinhumans,TrendsinGeneticsTig,24(5):238-245[]IafrateA.J.,FeukL.,RiveraM.N.,ListewnikM.L.,DonahoeP.K.,QiY.,SchererS.W.,andLeeC.,2004,Detectionoflargescalevariationinthehumangenome,NatureGenetics,36(9):949-951[]KitzmanJ.O.,2021,Haplotypesdropbydrop,NatureBiotechnology,34(3):296-298[]KoolenD.A.,VissersL.E.,PfundtR.,deLeeuwN.,KnightS.J.,ReganR.,KooyR.F.,ReyniersE.,RomanoC.,FicheraM.,SchinzelA.,BaumerA.,AnderlidB.M.,SchoumansJ.,KnoersN.V.,vanKesselA.G.,SistermansE.A.,VeltmanJ.A.,BrunnerH.G.,anddeVriesB.B.,2006,Anewchromosome17q21.31microdeletionsyndromeassociatedwithacommoninversionpolymorphism,NatureGenetics,38(9):999-1001[]KorbelJ.O.,UrbanA.E.,AffourtitJ.P.,GodwinB.,GrubertF.,SimonsJ.F.,KimP.M.,PalejevD.,CarrieroN.J.,DuL.,TaillonB.E.,ChenZ.,TanzerA.,SaundersA.C.,ChiJ.,YangF.,CarterN.P.,HurlesM.E.,WeissmanS.M.,HarkinsT.T.,GersteinM.B.,EgholmM.,andSnyderM.,2007,Paired-endmappingrevealsextensivestructuralvariationinthehumangenome,Science,318(5849):420-426[]LiR.,ZhuH.,RuanJ.,QianW.,FangX.,ShiZ.,LiY.,LiS.,ShanG.,KristiansenK.,LiS.,YangH.,WangJ.,andWangJ.,2018,Denovoassemblyofhumangenomeswithmassivelyparallelshortreadsequencing,GenomeResearch,20(2):265-272[]LupskiJ.R.,2021,Structuralvariationmutagenesisofthehumangenome:Impactondiseaseandevolution,EnvironmentalandMolecularMutagenesis,56(5):419-436[]MostovoyY.,Levy-SakinM.,LamJ.,LamE.T.,HastieA.R.,MarksP.,LeeJ.,ChuC.,LinC.,DzakulaZ.,CaoH.,SchlebuschS.A.,GiordaK.,Schnall-LevinM.,WallJ.D.,andKwokP.Y.,2021,Ahybridapproachfordenovohumangenomesequenceassemblyandphasing,NatureMethods,13(7):587-590[]MedvedevP.,FiumeM.,DzambaM.,SmithT.,andBrudnoM.,2018,Detectingcopynumbervariationwithmatedshortreads,GenomeResearch,20(11):1613-1622[]MedvedevP.,StanciuM.,andBrudnoM.,2018,Computationalmethodsfordiscoveringstructuralvariationwithnext-generationsequencing,NatureMethods,6(11Suppl):S13-S20[]MillsR.E.,LuttigC.T.,LarkinsC.E.,BeauchampA.,TsuiC.,PittardW.S.,andDevineS.E.,2006,Aninitialmapofinsertionanddeletion(INDEL)variationinthehumangenome,GenomeResearch,16(9):1182-1190[]MillsR.E.,WalterK.,StewartC.,HandsakerR.E.,ChenK.,AlkanC.,AbyzovA.,YoonS.C.,YeK.,CheethamR.K.,ChinwallaA.,ConradD.F.,FuY.,GrubertF.,HajirasoulihaI.,HormozdiariF.,IakouchevaL.M.,IqbalZ.,KangS.,KiddJ.M.,KonkelM.K.,KornJ.,KhuranaE.,KuralD.,LamH.Y.,LengJ.,LiR.,LiY.,LinC.Y.,LuoR.,MuX.J.,NemeshJ.,PeckhamH.E.,RauschT.,ScallyA.,ShiX.,StrombergM.P.,StutzA.M.,UrbanA.E.,WalkerJ.A.,WuJ.,ZhangY.,ZhangZ.D.,BatzerM.A.,DingL.,MarthG.T.,McVeanG.,SebatJ.,SnyderM.,WangJ.,YeK.,EichlerE.E.,GersteinM.B.,HurlesM.E.,LeeC.,McCarrollS.A.,KorbelJ.O.,andGenomesP.,2018,Mappingcopynumbervariationbypopulation-scalegenomesequencing,Nature,470(7332):59-65[]PendletonM.,SebraR.,PangA.W.,UmmatA.,FranzenO.,RauschT.,StutzA.M.,StedmanW.,AnantharamanT.,HastieA.,DaiH.,FritzM.H.,CaoH.,CohainA.,DeikusG.,DurrettR.E.,BlanchardS.C.,AltmanR.,ChinC.S.,GuoY.,PaxinosE.E.,KorbelJ.O.,DarnellR.B.,McCombieW.R.,KwokP.Y.,MasonC.E.,SchadtE.E.,andBashirA.,2021,Assemblyanddiploidarchitectureofanindividualhumangenomeviasingle-moleculetechnologies,NatureMethods,12(8):780-786[]PughT.J.,MorozovaO.,AttiyehE.F.,AsgharzadehS.,WeiJ.S.,AuclairD.,CarterS.L.,CibulskisK.,HannaM.,KiezunA.,KimJ.,LawrenceM.S.,LichensteinL.,McKennaA.,PedamalluC.S.,RamosA.H.,SheflerE.,SivachenkoA.,SougnezC.,StewartC.,AllyA.,BirolI.,ChiuR.,CorbettR.D.,HirstM.,JackmanS.D.,KamohB.,KhodabakshiA.H.,KrzywinskiM.,LoA.,MooreR.A.,MungallK.L.,QianJ.,TamA.,ThiessenN.,ZhaoY.,ColeK.A.,DiamondM.,DiskinS.J.,MosseY.P.,WoodA.C.,JiL.,SpostoR.,BadgettT.,LondonW.B.,MoyerY.,Gastier-FosterJ.M.,SmithM.A.,GuidryAuvilJ.M.,GerhardD.S.,HogartyM.D.,JonesS.J.,LanderE.S.,GabrielS.B.,GetzG.,SeegerR.C.,KhanJ.,MarraM.A.,MeyersonM.,andMarisJ.M.,2020,Thegeneticlandscapeofhigh-riskneuroblastoma,NatureGenetics,45(3):279-284[]QuinlanA.R.,ClarkR.A.,SokolovaS.,LeibowitzM.L.,ZhangY.,HurlesM.E.,MellJ.C.,andHallI.M.,2018,Genome-widemappingandassemblyofstructuralvariantbreakpointsinthemousegenome,GenomeResearch,20(5):623-635[]RhoadsA.,andAuK.F.,2021,PacBiosequencinganditsapplications,Genomics,ProteomicsandBioinformatics,13(5):278-289[]RossM.G.,RussC.,CostelloM.,HollingerA.,LennonN.J.,HegartyR.,NusbaumC.,andJaffeD.B.,2020,Characterizingandmeasuringbiasinsequencedata,GenomeBiology,14(5):R51[]SeoJ.S.,RhieA.,KimJ.,LeeS.,SohnM.H.,KimC.U.,HastieA.,Cao

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論