GB-T微生物超低頻突變測定 雙重測序法征求意見稿編制說明_第1頁
GB-T微生物超低頻突變測定 雙重測序法征求意見稿編制說明_第2頁
GB-T微生物超低頻突變測定 雙重測序法征求意見稿編制說明_第3頁
GB-T微生物超低頻突變測定 雙重測序法征求意見稿編制說明_第4頁
GB-T微生物超低頻突變測定 雙重測序法征求意見稿編制說明_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、任務(wù)來源

本國家標(biāo)準(zhǔn)的制定任務(wù)列入國家標(biāo)準(zhǔn)化管理委員會《國家標(biāo)準(zhǔn)委關(guān)于下達(dá)2018年第

二批國家標(biāo)準(zhǔn)制修訂計劃的通知》(國標(biāo)委綜合〔2018〕41號),項目編號“20181040-T-424”。

該標(biāo)準(zhǔn)由中國標(biāo)準(zhǔn)化研究院提出并歸口,由清華大學(xué)等單位承擔(dān)該標(biāo)準(zhǔn)的制定任務(wù)。

二、標(biāo)準(zhǔn)制定目的和意義

隨著二代測序技術(shù)的發(fā)展,單位測序成本越來越低,各領(lǐng)域仰賴其高通量的特性獲取

基因序列信息,結(jié)合不同分析手段,獲得更多發(fā)現(xiàn),突破科研瓶頸,并逐步將前沿技術(shù)帶

入社會大眾的生活當(dāng)中,拓展應(yīng)用價值。

然而,對于單堿基差異便影響巨大的工作,包括但不限于疾病研究,二代測序擁有足

夠的通量卻未能達(dá)到需求的測序精度,當(dāng)待測文庫的突變率低于一定數(shù)值時,便難以常規(guī)

的測序方法準(zhǔn)確檢測。許多技術(shù)圍繞此痛點(diǎn)展開,并取得良好的成果。此標(biāo)準(zhǔn)的編制旨在

規(guī)范提高測序精度的工作方法,以更好地推動相關(guān)領(lǐng)域的發(fā)展。

(一)測序精度的提高

二代測序的在樣本制備、測序、和分析步驟,會引入約10-2~10-4的突變誤差,其可能

來自于建庫中PCR過程的保真性、人為操作或機(jī)器檢測的偏差等,當(dāng)待測DNA文庫中的

突變率小于10-4時,便無法以現(xiàn)有平臺正確識別?;パa(bǔ)標(biāo)簽的設(shè)計,有助于在不影響通量

的情形下,排除引入的誤差,還原真實(shí)的變異位點(diǎn),提高測序的精度。

(二)適配于現(xiàn)有測序平臺

雙重測序法透過建庫過程的設(shè)計和數(shù)據(jù)分析的模型建立來達(dá)到增加準(zhǔn)確性的目的,完

全適配于現(xiàn)有測序平臺,無需過多的調(diào)整變動。

三、標(biāo)準(zhǔn)制定原則和依據(jù)

(一)標(biāo)準(zhǔn)編制原則

本標(biāo)準(zhǔn)參考了其他同類國家標(biāo)準(zhǔn)的內(nèi)容,同時充分考慮我國超低頻突變測定的使用經(jīng)

驗(yàn)和要求。

(二)標(biāo)準(zhǔn)制訂主要依據(jù)

1

1、標(biāo)準(zhǔn)編寫遵循GB1.1-2009《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)的結(jié)構(gòu)和編寫規(guī)則》

的有關(guān)要求。

2、標(biāo)準(zhǔn)編寫內(nèi)容參考的相關(guān)標(biāo)準(zhǔn),包括:

GB/T6682-2008分析實(shí)驗(yàn)室用水規(guī)格和試驗(yàn)方法

GB/T30989-2014高通量基因測序技術(shù)規(guī)程

四、標(biāo)準(zhǔn)主要技術(shù)內(nèi)容

(一)標(biāo)準(zhǔn)適用范圍說明

本標(biāo)準(zhǔn)規(guī)定了雙重測序法的建庫操作、樣品質(zhì)量的控制及測序數(shù)據(jù)的處理模型;超低

頻突變檢測的儀器設(shè)備及器具、主要試劑、操作步驟和結(jié)果分析。

(二)內(nèi)容提要

其技術(shù)原理為通過DNA雙鏈體的兩條鏈進(jìn)行獨(dú)立標(biāo)記和測序。在雙螺旋的DNA片段的

兩條鏈,接上一段12nt隨機(jī)且互補(bǔ)的雙鏈核苷酸序列。后續(xù)透過文庫制備及二代測序,

從結(jié)果信息進(jìn)行對比。因?yàn)镈NA雙鏈體的兩股練是互補(bǔ)的,突變會同時存在互補(bǔ)家族的同

一個位置上,排除掉制備過程中所造成的變異,正確偵得實(shí)際的突變位點(diǎn)。

圖1、雙重測序法作用原理圖

五、主要工作過程

2016年接到編制任務(wù),開展資料收集和分析工作。研究了GB/T6682《分析實(shí)驗(yàn)室

用水規(guī)格和試驗(yàn)方法》、GB/T30989-2014《高通量基因測序技術(shù)規(guī)程》。了解二代測序的

2

相關(guān)要求,同時收集查閱了相關(guān)資料。為了使編制的標(biāo)準(zhǔn)能更好的應(yīng)用于超低頻突變的檢

測,在2016年10月提出了標(biāo)準(zhǔn)討論提綱,確定了編制原則和主要內(nèi)容。該標(biāo)準(zhǔn)于2017

年10月在全國標(biāo)準(zhǔn)信息公共服務(wù)平臺上進(jìn)行公示,于2018年2月召開專家會,聽取專家

意見。

六、方法驗(yàn)證及結(jié)果

(一)接頭合成驗(yàn)證

雙重測序法的接頭合成完成之后,以放射性同位素及PAGE驗(yàn)證結(jié)果如圖2,以

確保后續(xù)建庫測序能夠順利以雙重測序法進(jìn)行。

圖2、(a)14%(wt/vol)聚丙烯酰胺凝膠圖。

各泳道分別對應(yīng)《超低頻突變偵測雙重測序法》中8.1各步驟。

泳道1:退火后接頭;泳道2:延伸后接頭;泳道3:酶切后接頭;泳道4:最終的接頭。

(b)各步驟接頭示意圖。數(shù)字和字母標(biāo)記分別對應(yīng)a中各泳道及各條帶。

(二)建庫過程的樣品驗(yàn)證

3

在進(jìn)行PCR前,須先對樣品進(jìn)行長度定量,連接反應(yīng)可能導(dǎo)致多峰值的產(chǎn)生,

如圖3中的雙峰是很常見的,峰的分布可能會有多種狀況,此將不影響后續(xù)的測序

準(zhǔn)確度。

圖3、PCR反應(yīng)前對樣品進(jìn)行長度定量,數(shù)據(jù)由AgilentTapeStation2200測得。

另外,對于DNA樣品和雙重測序法接頭的添加比例請務(wù)必參考《超低頻突變頻

率檢測方法:雙重測序》中規(guī)范,若濃度失衡將導(dǎo)致長度分布混亂,所測得數(shù)據(jù)質(zhì)

量低,而不可用于后續(xù)的分析。圖4為接頭濃度過高,導(dǎo)致接頭本身互相連接之情

況。

圖4、雙重測序法接頭與待測片段濃度不當(dāng)導(dǎo)致長度分布混亂。數(shù)據(jù)由Bioanalyzer

2100測得。

樣品正式上機(jī)測序前,對DNA片段進(jìn)行長度定量,推測操作過程中PCR輪次是

4

否需要增減,以確保后續(xù)數(shù)據(jù)質(zhì)量,下圖數(shù)據(jù)對應(yīng)《超低頻突變頻率檢測方法:雙

重測序》中8.3之步驟結(jié)果。若使用單一酶切片段,則確認(rèn)無多余峰值產(chǎn)生,如圖7

所示。

圖5、理想的定量后結(jié)果,數(shù)據(jù)由AgilentTapeStation2200測得。

圖6、PCR輪次過度造成較多大片段的產(chǎn)生,需調(diào)整PCR輪次,數(shù)據(jù)由AgilentTapeStation

2200測得。

5

圖7、酶切片段長度116bp經(jīng)連接和PCR后的長度定量結(jié)果,數(shù)據(jù)由Bioanalyzer

2100測得。

(三)測序結(jié)果分析

獲得測序的原始數(shù)據(jù)(rawdata)后,需評估數(shù)據(jù)質(zhì)量,若為Illumina平臺注意Q20

代表被識別錯誤機(jī)率為1%,即正確率是99%,其值不可小于90;Q30代表被識別錯誤

機(jī)率為0.1%,即正確率是99.9%,其值不可小于80。

表1為圖7之樣品經(jīng)Illumina平臺測序后,分析得到的質(zhì)量數(shù)據(jù);序列準(zhǔn)確性

如表2。

表1、圖7樣品經(jīng)Illumina平臺測序分析質(zhì)量結(jié)果

Read1Read2

Q2094.7492.52

Q3092.288.99

表2、圖7樣品經(jīng)Illumina平臺測序結(jié)果(樣品為單一序列片段,無突變庫混合)

MutationSite

099.88%

10.12%

20.0004%

6

分析測序數(shù)據(jù)得到標(biāo)簽家族(tagfamily)的大小分布,亦即為各組標(biāo)簽的讀數(shù)

(reads)。若所得結(jié)果偏低,如圖9所示,代表太少的讀數(shù)共用一組標(biāo)簽(tag),難以

對比找出突變位點(diǎn);若偏高如圖10,則不能有效產(chǎn)生更多雙鏈同源序列(DSCs),浪費(fèi)

了測序的數(shù)據(jù)容量。而圖6樣品分析標(biāo)簽家族大小的整體分布結(jié)果如圖10所示。

圖8、理想的標(biāo)簽家族(tagfamily)分布圖。

圖9、標(biāo)簽家族(tagfamily)的分布偏小,可能是進(jìn)行PCR的樣品太少所致。

圖10、標(biāo)簽家族(tagfamily)的分布偏大,可能是進(jìn)行PCR的樣品太多所致。

7

圖11、圖7樣品測序數(shù)據(jù)分析標(biāo)簽家族(tagfamily)大小的整體分布結(jié)果

在得到標(biāo)簽家族(tagfamily)的大小分布后,分析峰族(peakfamily)的大小。

由于每個標(biāo)簽家族的讀數(shù)不同,且存在一定的分布性,以峰族大小(peakfamilysize)

作為后續(xù)雙鏈同源序列(DSCs)的數(shù)據(jù)指標(biāo)。峰族大小(peakfamilysize)定義為大

于1的標(biāo)簽家族所擁有最高比例的讀數(shù)。圖12和圖13以圖8數(shù)據(jù),進(jìn)行峰族大小

分析。

圖12、有效產(chǎn)生雙鏈同源序列(DSCs)數(shù)據(jù)的峰族大小。在峰族大小為6時,能最高效的產(chǎn)

生雙鏈同源序列(DSCs),此時每個雙鏈同源序列對應(yīng)的原始數(shù)據(jù)讀數(shù)約為40。

8

圖13、在峰族大小低于16之前,雙鏈同源序列(DSCs)的數(shù)量持續(xù)增加;當(dāng)峰族大小大于

16之后,則雙鏈同源數(shù)列的數(shù)量無明顯增加。

(三)突變率識別分析

以帶有LacZα片段的M13mp2質(zhì)粒制備突變庫,對其做單位點(diǎn)的突變設(shè)計,按

比例混合兩者,后轉(zhuǎn)入大腸桿菌進(jìn)行藍(lán)白篩選驗(yàn)證,并以IlluminaHiSEq2000同時

進(jìn)行常規(guī)測序及雙重測序法。從圖14可看出當(dāng)突變率低于10-2時,常規(guī)的測序方法

開始出現(xiàn)很大的偏差,而雙重測序法在突變率達(dá)10-4時,皆能準(zhǔn)確識別突變。

圖14、將已知的單點(diǎn)突變M13mp2與野生M13mp2按比例混合,分析常規(guī)測序及雙重測序法

的數(shù)據(jù)結(jié)果。測序深度約20,000x。

9

圖15為混合樣品比例達(dá)時,對比常規(guī)方法及雙重測序法經(jīng)Illumina

?6

HiSeq2000測序所得的突變率3檢.0測×結(jié)10果。常規(guī)方法所分析得到的突變率為,

?3

比樣品庫真正的突變率高了1000倍,暗示一般的測序方法有的突3.8變×識1別0是

有誤的。比對單鏈同源序列得到的突變率結(jié)果,代>表9999.%9的%測序偏差已被

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論