科內(nèi)培訓(xùn)基因變異的表述方法_第1頁
科內(nèi)培訓(xùn)基因變異的表述方法_第2頁
科內(nèi)培訓(xùn)基因變異的表述方法_第3頁
科內(nèi)培訓(xùn)基因變異的表述方法_第4頁
科內(nèi)培訓(xùn)基因變異的表述方法_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基因變異的表述方法

1整理課件上集回憶@DNA的化學(xué)結(jié)構(gòu)。@查找序列。@正義鏈和反義鏈。@堿基書寫順序。@mRNA和前體mRNA。@外顯子和內(nèi)含子。@CDS和UTR。@外顯子≠CodingDNA。@全基因突變、熱點突變和突變。2整理課件HGVS標(biāo)準(zhǔn)了基因及蛋白的變異表述表述不統(tǒng)一將造成互相理解障礙3整理課件“突變〞與“多態(tài)性〞的不同Mutation突變Change改變〔罕見的〕Disease-causingchange致病改變Polymorphism多態(tài)性Changein>1%inpopulation人類群體中大于1%的改變Notdiseasecausingchange不致病的改變4整理課件建議使用的詞語Mutation突變Polymorphism多態(tài)性負(fù)面正面建議使用中性詞Variant/Alteration變異CNV拷貝數(shù)變異SNV〔NotSNP〕單核苷酸變異5整理課件“指南〞的定義6整理課件PGM中的Variant7整理課件VariantCaller的導(dǎo)出結(jié)果寫成“SNV〞為好8整理課件報告有待標(biāo)準(zhǔn)寫成“變異〞為好9整理課件標(biāo)準(zhǔn)的基因名稱-1或搜索引擎搜索關(guān)鍵詞“HGNCgene〞10整理課件標(biāo)準(zhǔn)的基因名稱-211整理課件參考序列出處-1基因的核酸信息包括染色體基因組DNA序列和mRNA序列,核酸信息參考NCBIGenBank核酸序列數(shù)據(jù)庫參考序列〔ReferenceSequence,RefSeq〕?;蚪MDNA序列GenBank注冊號前面用NT、NC或AC加下劃線進(jìn)行標(biāo)注,其中以“NT_〞標(biāo)注的序列為BAC克隆或鳥槍測序法獲得的不完整的基因組測序序列。如10號染色體上的片段NT_030059,同一序列號有不同的版本號時,后面用點加版本號表示,如NT_030059.14。成熟mRNA轉(zhuǎn)錄本12整理課件參考序列出處-2美國國立生物技術(shù)信息中心〔NCBI〕收錄的參考序列編碼具有權(quán)威性及唯一性。其中前綴“NM_〞表示為mRNA序列,“NP_〞表示多肽序列,“NG_〞表示基因組序列?;蚪M參考序列應(yīng)列出完整基因序列,包括5'以及3'非編碼區(qū)〔UTR〕。當(dāng)使用某段編碼DNA參考序列描述突變時,應(yīng)選擇適宜的轉(zhuǎn)錄體,且轉(zhuǎn)錄體的起始轉(zhuǎn)錄點應(yīng)當(dāng)明確,例如選擇最常見的轉(zhuǎn)錄體,或者是的最大轉(zhuǎn)錄體,或者具有組織特異性的編輯轉(zhuǎn)錄體。當(dāng)某一參考序列具有多種轉(zhuǎn)錄方式時,選擇NCBI數(shù)據(jù)庫里注釋最全面的版本?!?腫瘤個體化檢測治療指南〔試行〕?國家衛(wèi)生計生委個體化醫(yī)學(xué)檢測技術(shù)專家委員會制定13整理課件參考序列出處-HGVS有不同看法HGVS建議使用LRG〔LocusReferenceGenomic〕序列作為首選參考序列。如果該基因沒有LRG序列,那么采用RefSeq作為參考序列。HGNC的頁面14整理課件LRG序列的web頁面點擊這些綠色的+號得到有意思的內(nèi)容15整理課件前綴——應(yīng)指出突變位于哪種序列中“g.〞表示基因組序列,如g.476A>T?!癱.〞表示CodingDNA〔編碼DNA〕序列,如c.76A>T?!癿.〞表示線粒體DNA序列,如m.8993T>C?!皉.〞表示RNA序列,如r.76a>u?!皀.〞表示非編碼RNA序列?!皃.〞表示蛋白質(zhì)序列,如p.Lys76Asn。對于DNA變異的表述,“c.〞優(yōu)于“g.〞——直觀地得知該變異點在外顯子上還是內(nèi)含子上,會不會造成氨基酸編碼改變,與表型聯(lián)系起來。16整理課件序列位置編號-1基因組、線粒體DNA、RNA、非編碼RNA、蛋白序列:以參考序列的第一個堿基或氨基酸確立為1,直接數(shù)其在對應(yīng)參考序列中的位置即可。如:g.476,m.9222,p.76。17整理課件序列位置編號-2CodingDNA〔編碼DNA〕序列:將CodingDNA看成連續(xù)的〔排除內(nèi)含子間隔〕,以起始密碼子ATG的第一個堿基A確立為1,以終止密碼子的最后一個堿基確立為結(jié)束N。假設(shè)堿基在CodingDNA范圍內(nèi),那么其位置為1~N區(qū)間內(nèi)的自然數(shù),如c.112。起始密碼子ATG的上游的第一個堿基確立為-1,一直向5’端推移編號為-2、-3……,整個5’UTR區(qū)域位置均為負(fù)數(shù)表示,如c.-72?!獩]有“0〞堿基。終止密碼子下游的第一個堿基確立為*1,一直向3’端推移編號為*2、*3……,整個3’UTR區(qū)域位置均為“*自然數(shù)〞表示,如c.*85。對于內(nèi)含子起始片段內(nèi)的位點,以上一外顯子最后一個堿基的位置、加號和距離這個堿基的位置表示,如c.77+1;對于內(nèi)含子末端的位置,以下一外顯子第一個堿基的位置、減號和距離這個堿基的位置表示,如c.77-2?!?〞和“-〞的分界線需謹(jǐn)慎決定。5’UTR假設(shè)有內(nèi)含子,內(nèi)含子上的堿基位置以“-23+1,-23+2,...,-22-2,-22-1〞形式表示;3’UTR假設(shè)有內(nèi)含子,內(nèi)含子上的堿基位置以“*154+1,*154+2,...,*155-2,*155-1〞形式表示。不建議使用c.IVS1+1G,c.IVS1-2G形式的表示〔IVS:interveningsequence〕。原因:外顯子/內(nèi)含子的編號比CodingDNA編號更易引起混亂。18整理課件序列位置編號-列表舉例19整理課件c.171c.247c.246c.312序列位置編號-外顯子&內(nèi)含子舉例c.246+6c.247-420整理課件序列位置編號-5’端舉例c.-26c.-25-6c.-25c.121整理課件變異的表述總體標(biāo)準(zhǔn)-1“>〞〔英文輸入法的大于號〕表示堿基替換,如c.76A>T?!癬〞〔英文輸入法的下劃線,不是中劃線〕表示從起始位置編號到終止位置編號范圍的受到影響,如c.76_78del?!癲el〞表示缺失,如c.76delA?!癲up〞表示重復(fù),如c.8dupG〔不是c.8_9insG,重復(fù)和插入的定義不同,見后〕?!癷ns〞表示插入,如c.76_77insG?!癲elins〞表示同時有缺失和插入,如c.112_117delinsTG?!癷nv〞表示倒位,如c.76_83inv?!癱on〞表示轉(zhuǎn)換,如c.123_678conNM_004006.1:c.123_678?!癴s〞表示移碼〔frameshift〕,變異導(dǎo)致在起始密碼子和終止密碼子之間的開放閱讀框發(fā)生改變,如p.Arg97Profs*23?!癳xt〞表示延伸〔extension〕,變異發(fā)生在起始密碼子或終止密碼子上,導(dǎo)致氨基酸序列較之原序列變長了。如p.Met1ValextMet-12?!?)〞〔英文輸入法的圓括號〕表示發(fā)生變異的具體位置不確定,如c.(67_70)insG,但是圓括號內(nèi)的位置范圍要盡可能縮到最小?!癧]〞〔英文輸入法的方括號〕表示發(fā)生在某個等位基因上,如c.[76A>T];或者已確定的數(shù)量,如c.123_124[4]。22整理課件變異的表述總體標(biāo)準(zhǔn)-2DNA:前綴〔c.〕+位置編號〔76〕+參考序列堿基〔A〕+變化〔>〕+改變后的堿基〔如果有〕〔T〕:c.76A>T。堿基以大寫字母表示,包括A、T、G、C、Y、R、W等。RNA:前綴〔r.〕+位置編號〔39〕+參考序列堿基〔a〕+變化〔>〕+改變后的堿基〔如果有〕〔u〕:r.39a>u。堿基以小寫字母表示,包括a、u、g、c、y、r、w等。蛋白:前綴〔p.〕+參考序列氨基酸〔Trp〕+位置編號〔52〕+變化〔沒有“>〞,但“del〞、“ins〞等不變〕+改變后的氨基酸〔如果有〕〔Ala〕:p.Trp52Ala。氨基酸以三字母〔第一個字母大寫〕或單字母表示,如Trp或W。建議以三字母表示〔第一個字母大寫〕,不建議以單字母表示,因為單字母容易和堿基混淆。23整理課件變異的表述總體標(biāo)準(zhǔn)-關(guān)于氨基酸終止HGVS:用“Ter〞或“*〞〔英文輸入法且英文字體下的星號鍵〕表示氨基酸翻譯終止,如p.Asn26Ter或p.Asn26*,不使用“X〞表示氨基酸翻譯終止。原因:IUPAC-IUB(InternationalUnionofPureandAppliedChemistry,InternationalUnionofBiochemistryandMolecularBiology)已規(guī)定“X〞用來表示未指定或未知氨基酸,所以不能用來表示終止?!癤〞符號代表終止密碼子。例如,p.Gly542X表示542位點的甘氨酸殘基被終止密碼子所代替?!?腫瘤個體化檢測治療指南〔試行〕?此處存在爭議24整理課件變異的表述——替換替換〔substitution〕:一個堿基/氨基酸被另一個堿基/氨基酸替換。特征是“一對一〞。如果是一個堿基/氨基酸變異成多個堿基/氨基酸,那是缺失-插入。如果是多個堿基/氨基酸變異成一個堿基/氨基酸,那是缺失或缺失-插入。如果是多個堿基/氨基酸變異成多個堿基/氨基酸,那是缺失-插入或轉(zhuǎn)換。故沒有“c.76_77AG>TT〞這種寫法。用“>〞〔英文輸入法的大于號〕表示某個堿基變成了另一個堿基,不建議使用“A76T〞類似的形式表示。但是氨基酸替換沒有“>〞,要寫成“p.Trp52Ala〞這樣的形式。舉例:c.76A>T,p.Glu26Asp。25整理課件變異的表述——缺失缺失〔deletion〕:原本該有的沒有了。舉例:c.76del或c.76delA;c.76_78del或c.76_78delACT〔可以不用寫成c.76_78del3〕;p.Gln8del;p.Gln8_Ala10del。氨基酸移碼變化見后。最靠近3’端法那么〔most3’position〕:缺失的堿基,認(rèn)為其靠近3’端,而不是5’端。ACTTTGTGCC變成ACTTGCC,缺失了哪三個堿基?ACTTTGTGCC還是ACTTTGTGCC?——TGT比TTG更靠近序列的3’端,故認(rèn)為缺失了TGT〔c.5_7del〕,而不是TTG〔c.4_6del〕。ctttagGCATG變成cttagGCATG,寫成c.301-3delT,而不是c.301-4delT、c.301-5delT。但是該法那么有例外,在描述外顯子/內(nèi)含子邊界的變異時,認(rèn)為缺失的堿基影響外顯子大于影響內(nèi)含子。如CAGgtg變成CAgtg,寫成c.3delG,而非c.3+1delG。不確定斷裂位置的情況〔見于使用MLPA和PCR法發(fā)現(xiàn)的外顯子缺失〕,要使用圓括號和預(yù)估的斷裂位置范圍,例如:c.(87+1_88-1)_(300+1_301-1)del,表示某基因Exon3、4缺失,5’斷裂點在Intron2〔c.87+1_88-1,不確定具體在哪處〕,3’斷裂點在Intron4〔c.300+1_301-1,不確定具體在哪處〕c.(?_-30)_(12+1_13-1)del,表示從基因5’某個位置開始至Intron1中的某個位置缺失。c.(?_-1)_(*1_?)del,表示整個基因都缺失了。提醒:不要隨便打“?〞。能確定具體斷裂位置就不要打問號。26整理課件變異的表述——重復(fù)重復(fù)〔duplication〕:堿基或氨基酸多出了一份拷貝〔不是多份拷貝〕,并且多出來的局部直接加在其3’端。如果不是直接加在其3’端,而是插到了其它地方,那叫“插入〞。舉例:c.7dup或c.7dupT〔注意不寫成c.7_8insT〕;c.77_79dup或c.77_79dupCTG;c.(87+1_88-1)_(301+1_302-1)dup;p.Gly4_Gln6dup;描述重復(fù)的位置時也須符合“最靠近3’端法那么〞。例如:MKMGHQHQCC變成MKMGHQHQHQCC,寫成p.His7_Gln8dup,不寫成p.His5_Gln6dup.27整理課件變異的表述——多份重復(fù)多份拷貝重復(fù)〔repeat〕:堿基或氨基酸多出了多份拷貝,并且多出來的局部直接加在其3’端。如果不是直接加在其3’端,而是插到了其它地方,那叫“插入〞。表示形式:“第一個重復(fù)單元起始位置_第一個重復(fù)單元終止位置+[總共的重復(fù)數(shù)]〞,如c.123_124[4]?;蛘撸暗谝粋€重復(fù)單元起始位置+重復(fù)單元+[總共的重復(fù)數(shù)]〞,如c.123TG[4]。不用“c.123_124TG[4]〞形式表示——顯得冗余。特殊舉例:脆性X綜合癥FMR1基因5’端重復(fù)單元:c.-128_-126[79]——確定共有79個重復(fù)單元;c.-128_-126[(600_800)]——重復(fù)單元數(shù)在600~800之間,具體數(shù)量不確定〔通過SouthernBlot做出的結(jié)果〕。不要寫成c.-128GGC[79],因為該基因中有的GGC重復(fù)單元可能變異為GGA單元,寫成c.-128GGC[79]就不符合實際情況。亨廷頓舞蹈癥HTT基因重復(fù)單元:c.53AGC[21],p.Gln[23]〔為什么此處不寫氨基酸編號原因不明〕。群體研究:g.1209_4523[12_45]——該片段在人群中重復(fù)12~45次不等。28整理課件變異的表述——插入插入〔insertion〕:原本沒有的卻有了,且多出的局部不是其5’端緊鄰的堿基或氨基酸的拷貝——和“重復(fù)〞的區(qū)別。舉例:c.51_52insGAGA;c.123+54_123+55insAB012345.2:g.76_420;p.Lys2_Met3insGlnSerLys;p.Trp182_Gln183ins17;注意:所描述插入位置一定是由下劃線連接起來的范圍,而非單個點?!癱.51_52insGAGA〞清晰的說明了插入位置是在c.51和c.52之間?!癱.51insGAGA〞就會引起混淆:插入位置是在c.51的5’端還是3’端?不確定時需打圓括號,如“c.(67_70)insG〞——不確定是在c.67~c.70間的哪個位置插入了G;“c.11_12ins(2)〞或者“c.11_12insNN〞——確定插入了兩個堿基,但不確定插入的堿基序列是什么;“c.11_12ins(100)〞或者“c.11_12insN[100]〞——確定插入了100個堿基,但不確定插入的堿基序列是什么;29整理課件變異的表述——插入〔續(xù)〕如果插入DNA或RNA的堿基很多〔多到無法把所有插入的堿基都寫出來〕,應(yīng)盡量尋找所插入的堿基來源,參加到描述中,如“c.123+54_123+55insAB012345.2:g.76_420〞。實在找不到插入堿基的來源,怎么辦?——HGVS未指明。個人看法,僅供參考:可以用“ins+插入堿基的數(shù)量〔加括號〕〞來表示,數(shù)量要打括號,如“c.11_12ins(100)〞。不直接寫成“c.11_12ins100〞。但,在已清晰地描述了DNA或RNA的變異根底上,氨基酸變異描述可以不加括號,直接寫插入的數(shù)量,如“p.Trp182_Gln183ins17〞。30整理課件變異的表述——缺失-插入組合先缺失,再插入。同時滿足缺失和插入的表述標(biāo)準(zhǔn)。舉例:c.112_117delinsTG或者c.112_117delAGGTCAinsTG;c.113delinsTACTAGC或者c.113delGinsTACTAGC;p.Cys28delinsTrpVal;氨基酸的在碼變異〔inframe〕和移碼變異〔frameshift〕:在碼變異〔inframe〕:一個或多個氨基酸變成另外的一個或多個氨基酸,但其它氨基酸編碼不受影響。DNA的單堿基替換,或堿基缺失/增加的數(shù)量是3的倍數(shù),可導(dǎo)致在碼變異。移碼變異〔frameshift〕:DNA的堿基缺失或增加不是3的倍數(shù),造成在起始密碼子和終止密碼子之間的開放閱讀框發(fā)生了變化。變異發(fā)生處C端下游的氨基酸編碼都受到影響。注意以上概念和蛋白“延伸〞的區(qū)別。31整理課件變異的表述——移碼變異在碼變異的表述:沒有“fs〞,如“p.Gln8_Ala10del〞;“p.Cys28delinsTrpVal〞。移碼變異的表述:1、短描述:前綴+受影響的第一個氨基酸+fs,如“p.Arg97fs〞。2、長描述〔推薦采用〕:前綴+受影響的第一個氨基酸的變異情況+fsTer〔或fs*〕+變異后的新終止位置,如“p.Arg97Glyfs*26〞。不要參加“del〞、“ins〞、“dup〞等字眼。關(guān)于確定變異后新的終止位置:受影響的第一個氨基酸確立為1,然后再新的開放閱讀框中,其C端下游的氨基酸依次編號為2、3……#。#即為終止密碼子所對應(yīng)的氨基酸位置編號。把#直接連在“fsTer〞或“fs*〞的后面。舉例:變異后新的開放閱讀框為Trp112〔受影響的第一個氨基酸,原本是Asn〕,Ala113,Gln114,Asp115,Leu116,*117。那么變異寫作“p.Asn112Trpfs*6〞〔117-112+1=6〕,不是寫作“p.Asn112Trpfs*5〞,“p.Asn112Trpfs*117〞,亦或“p.Asn112Trpfs*118〞。在變異后新的開放閱讀框中沒有發(fā)現(xiàn)終止密碼子,那么“#〞用“?〞代替,如“p.Ile327Argfs*?〞。32整理課件查看移碼后的翻譯序列-133整理課件查看移碼后的翻譯序列-234整理課件氨基酸的特殊變化-1#同義變化:氨基酸沒有改變,用“p.(=)〞表示。不使用“p.Leu54Leu〞或“p.L54L〞形式表示。打括號說明沒有在蛋白水平和RNA水平上進(jìn)行實驗實證。不建議用“p.Leu54=〞或“p.L54=〞形式表示〔僅是不建議,不是禁止〕。但國內(nèi)的?指南?對同義變化的表述沒有談及。#無義變化:用“Ter〞或“*〞〔英文輸入法且英文字體下的星號鍵〕表示氨基酸翻譯終止,如p.Asn26Ter或p.Asn26*,不使用“X〞表示氨基酸翻譯終止?!嬖跔幾h。特殊例子:p.*110Glnext*4或p.*110Qext*4,表示原110位氨基酸應(yīng)為終止位置“*〞,但變成了Gln,延伸出了4個新氨基酸〔包括這個Gln〕,然后在114位終止。即Gln110〔原本是*〕、Ala111、Asp112、Trp113、*114。p.*321Argext*?或p.*321Rext*?,表示原321位氨基酸應(yīng)為終止位置“*〞,但變成了Arg,延伸出了很多個新氨基酸,沒發(fā)現(xiàn)終止密碼子,不知道在哪里終止,因此打上“?〞。35整理課件氨基酸的特殊變化-2#第一氨基酸的變化:因為啟動子區(qū)或起始密碼子的變異導(dǎo)致沒有蛋白翻譯出來,并且提供了實驗數(shù)據(jù)支持,那么用“p.0〞表示。因為啟動子區(qū)或起始密碼子的變異推測沒有蛋白翻譯出來,不能提供實驗數(shù)據(jù)支持〔這種情況較常見〕,那么用“p.0?〞或“p.Met1?〞表示。因為啟動子區(qū)或起始密碼子的變異導(dǎo)致翻譯起始位點改變:1、翻譯起始位點變到了上游舉例:“p.Met1ValextMet-12〞或“p.M1VextM-12〞,表示原第一位Met變成了Val,新的氨基酸較之參考氨基酸序列多出了12個氨基酸〔從Met-12到Thr-1〕。新的第一個氨基酸變成了Met-12。編號規(guī)那么與CodingDNA5’UTR編號規(guī)那么一致。同樣沒有“0〞位氨基酸。2、翻譯起始位點變到了下游舉例:“p.Phe2_Met46del〞或“p.F2_M46del〞,表示發(fā)生變異后,較之于參考氨基酸序列相當(dāng)于原第2位的Phe到第46位的Met都缺失了。為什么不是寫成“p.Met1_Lys45del〞?原序列:Met1、Phe2……Lys45、Met46、Ala47、新序列:Met1、Phe2……Lys45、Met1、Ala2、對于氨基酸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論