生物命名法規(guī)簡介_第1頁
生物命名法規(guī)簡介_第2頁
生物命名法規(guī)簡介_第3頁
生物命名法規(guī)簡介_第4頁
生物命名法規(guī)簡介_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

生物命名法規(guī)簡介生物命名法規(guī)簡介生物命名法規(guī)簡介V:1.0精細(xì)整理,僅供參考生物命名法規(guī)簡介日期:20xx年X月生物命名法規(guī)簡介植物命名法規(guī)概要人類基因命名的規(guī)則和過程楊泉?jiǎng)?楊岐生(浙江大學(xué),杭州310027)關(guān)鍵詞:人類基因;命名;GDB/HUGO1.概述如今,至少已有10000多條人類基因被發(fā)現(xiàn),而且每天約有9條新基因登錄。在下一個(gè)10年中,人類的所有基因?qū)⒈话l(fā)現(xiàn)。這些基因的命名往往在它的結(jié)構(gòu)功能闡明以前就要進(jìn)行,因此如果要求基因的命名能表明其功能就不可能。而且,當(dāng)一個(gè)基因的功能已相當(dāng)清楚時(shí),一些習(xí)用的命名仍在使用,這就容易引起誤解。白介素轉(zhuǎn)化酶相關(guān)蛋白酶就是一個(gè)典型的例子。按命名者的偏好,這個(gè)酶曾被使用過FILCE、MACH、Mch5、ICErelⅡ、ICH-2和TX等名字,現(xiàn)在則統(tǒng)一命名為caspase,依據(jù)該酶是一個(gè)在“天冬氨酸后切斷的半胱氨酸蛋白酶”(cysteineproteasewithabilitytocleaveafterasparticacid)。因此建立一個(gè)統(tǒng)一命名規(guī)則及命名程序就顯得非常迫切[1~3]。人類基因命名由人類基因命名委員會(CommitteeofHumanGeneNomenclature,網(wǎng)址http://www.gene.ucl.ac.uk/nomenclature)管理。2.獲得一個(gè)人類新基因命名符號的過程2.1根據(jù)人類基因命名規(guī)則命名一個(gè)基因命名的原則將在本文第3節(jié)中詳細(xì)說明。2.2查找GDB(genomedatabase)數(shù)據(jù)庫GDB網(wǎng)址http://。通過查找GDB以確定命名的新基因名在GDB數(shù)據(jù)庫中沒有出現(xiàn)過。要注意的是,新基因名在GDB中沒有出現(xiàn)過不僅是指新基因的全名在GDB數(shù)據(jù)庫中沒有出現(xiàn)過,而且新基因符號的詞根在GDB中也要沒有出現(xiàn)過。如要命名一個(gè)基因?yàn)椤癙TGG1”,雖然在GDB數(shù)據(jù)庫中沒有出現(xiàn)過“PTGG1”,但“PTGG1”仍不能作為基因符號,因?yàn)椤癙TG”已用于代表前列腺素(prostaglandin),用“PTGG1”將干擾已用“PTG”為頭命名的基因系列:PTGDR前列腺素D2受體基因

PTGDS前列腺素D2合酶基因

PTGER1前列腺素E受體1基因

PTGER2前列腺素E受體2基因

PTGER3前列腺素E受體3基因

PTGER4前列腺素E受體4基因

PTGIR前列腺素I2受體基因

PTGIS前列腺素I2合酶基因此外,如果一個(gè)要命名的新基因已有一些相關(guān)的基因符號存在,則新基因的命名應(yīng)借鑒相關(guān)基因的命名模式,這就是“平行規(guī)則”。如前列腺素I2合酶基因不能用基因符號“PIS”來命名,而應(yīng)根據(jù)平行規(guī)則命名為“PTGIS”。2.3查詢?nèi)祟惢蛎麛?shù)據(jù)庫(網(wǎng)址http://www.gene.ucl.ac.uk/cgibin/nomenclature/searchgenes.pl)確認(rèn)命名的基因沒有與基因家族的基因符號相沖突。有些基因家族和超家族有自己專門的命名小組。例如,細(xì)胞色素P450基因超家族[4]用“CYP”為頭命名所有超家族成員,以數(shù)字區(qū)分家族成員,再用字母加數(shù)字表示亞家族成員,如CYP2C38等。其它一些有自己專門命名規(guī)則的還有HLA[5]、CD抗原[6]及磷酸二酯酶[7]等。2.4將命名的基因符號遞交給HUGO/GDB基因符號如果得到確認(rèn),將進(jìn)入GDB數(shù)據(jù)庫,網(wǎng)址http://www.gene.ucl.ac.uk/nomenclature/submit.html。通過以上步驟就獲得了一個(gè)基因的命名符號。3.人類基因命名規(guī)則[8]3.1一般規(guī)則(1)基因符號應(yīng)為大寫的拉丁字母或大寫的拉丁字母和阿拉伯?dāng)?shù)字的組合?;蚍枮榱擞惺褂玫膬r(jià)值應(yīng)盡可能地簡潔,而且不要試圖它包含一個(gè)基因所有的已知信息。理想的符號應(yīng)不超過6個(gè)字符。基因符號在書寫時(shí)應(yīng)用斜體或加下劃線,但在目錄中例外。新的基因符號不能與已存在的基因符號重復(fù)。(2)基因符號的第一個(gè)字符必須是字母,隨后的字符可以是字母或字母與數(shù)字的組合。(3)基因符號在書寫時(shí)應(yīng)在同一行,不允許在基因符號中使用上標(biāo)或下標(biāo)。(4)不能使用羅馬數(shù)字。在以前使用的基因符號中的羅馬數(shù)字應(yīng)改成相應(yīng)的阿拉伯?dāng)?shù)字。(5)不能使用希臘字母,所有的希臘字符應(yīng)改成相應(yīng)的拉丁字母。希臘拉丁字母互換表請查閱網(wǎng)頁http://www.gene.ucl.ac.uk/nomenclature/guidelines.html(6)在以希臘字母打頭的基因符號中須將它改成相應(yīng)的拉丁字母并放在基因符號的后面。如GLA(galactosidase,alpha)、GLB(galatosidase,beta)。(7)基因符號應(yīng)簡潔和特異,并能傳達(dá)基因的功能或特性。3.2基因符號的構(gòu)建建議3.2.1等級符號,基因家族和系列(1)為了方便一批相關(guān)基因從計(jì)算機(jī)數(shù)據(jù)庫中獲取,應(yīng)盡量使用等級方式。(2)當(dāng)不同的基因編碼具有類似功能的基因產(chǎn)物時(shí),基因位點(diǎn)的命名應(yīng)緊跟在基因符號后加阿拉伯?dāng)?shù)字,字母和數(shù)字之間不能使用空格,如ADH1、ADH2、ADH3(三個(gè)乙醇脫氫酶基因位點(diǎn))。但是,如果它們已在歷史上存在,單個(gè)字母的后綴也可來命名這些基因位點(diǎn),如LDHA、LDHB、LDHC(三個(gè)乳酸脫氫酶位點(diǎn))。(3)基因符號的最后一個(gè)字符可用來指定基因的某一特性。在歷史上曾用組織分布指定基因特性,但如今更傾向于使用阿拉伯?dāng)?shù)字。因?yàn)橐郧罢J(rèn)為的組織特異性在后來證實(shí)基因可能并不局限在這些組織中表達(dá)。3.2.2同源基因(1)在不同脊椎動(dòng)物中的同源基因應(yīng)有相同的命名。(2)如果一個(gè)基因先在其它物種中發(fā)現(xiàn),然后發(fā)現(xiàn)它在人中的同源基因,則人的基因不應(yīng)以H開頭予以命名。(3)為了區(qū)分來自不同物種的同源基因,可在基因符號前加由人類細(xì)胞遺傳學(xué)標(biāo)準(zhǔn)化委員會(CommitteeonStandardizationinHumanCytogenetics)制定的三字母代碼(物種縮寫表請查閱網(wǎng)頁http://www.gene.ucl.ac.uk/nomenclature/guidelines.html)。但要注意的是,這三字母代碼僅用作出版,而不作為基因符號的一部分。這個(gè)物種代碼是加在基因符號前。如HAS代表人類(Homosapiens),MMU代表家鼠(Musmusculus)。使用這些物種符號的基因符號的例子如(HSA)G6PD、(HSA)HBB、(MMU)A1b。(4)如果與非脊椎動(dòng)物或原核生物同源,人類基因可用這些同源基因的名字,并可在后面加L表示類似的(like)和加上數(shù)字編號(如果在人中有多個(gè)同源基因)。用H來表示同源的方法已不推薦,將被停止使用。3.2.3酶和蛋白質(zhì)酶和蛋白質(zhì)的命名應(yīng)參照國際生物化學(xué)和分子生物學(xué)聯(lián)盟命名委員會(NomenclatureCommitteeoftheInternationalUnionofBiochemistryandMolecularBiology,網(wǎng)址http://alpha.qmw.ac.uk/~ugca000/iupac/jcbn)的推薦[9]。3.2.4一些具有特殊用途的保留字一些字母或字母的組合放在基因符號的最后一個(gè)字母的后面表示特定的意義,如P代表假基因(但要注意BP代表結(jié)合蛋白),L代表類似的,R代表受體或調(diào)節(jié)因子,N或NH代表抑制子。在其它場合應(yīng)避免使用這些字母或字母的組合。4.DNA片段的命名DNA片段的命名一般由四部分組成。第一部分用D表示DNA;第二部分用0、1、2、...22、X、Y、XY表示DNA片段所在的染色體位置,其中0代表還不知染色體位置,而XY表示片段在X和Y染色體上都有該片段;第三部分表示用探針檢測到的DNA片段的復(fù)雜程度,S代表這是一條獨(dú)一無二的DNA片段,Z代表在染色體一個(gè)單一位置重復(fù)出現(xiàn)的DNA片段,F代表在多條染色體上都存在同源序列但還沒有定義家族的DNA片段;第四部分為區(qū)分不同的DNA片段加上一個(gè)數(shù)字編號,比如微衛(wèi)星DNA標(biāo)簽(microsatelliteDNAmarker)DXS990表示在X染色體上獨(dú)一無二的編號990的DNA片段。如果DNA片段是一個(gè)表達(dá)序列,可在上述四部分后加一個(gè)后綴E。5.推測基因的命名推測基因包括從EST簇或染色體序列中推測而來的基因、假基因及通過交叉雜交(crosshybridization)或計(jì)算機(jī)搜索序列數(shù)據(jù)庫而來的基因三種。從EST簇或染色體序列中推測得來的基因的命名是在基因所在染色體的編號后加一個(gè)絕對數(shù)字編號。假基因是指該序列自己不轉(zhuǎn)錄但是與轉(zhuǎn)錄的結(jié)構(gòu)基因在序列上高度同源的基因。為了表示假基因與結(jié)構(gòu)基因的對應(yīng)關(guān)系,假基因的命名是在結(jié)構(gòu)基因后加一個(gè)P表示,如ACTBP2(actinbetapseudogene2)。通過交叉雜交或計(jì)算機(jī)搜索序列數(shù)據(jù)庫得來的基因的命名一般是在已知基因后加一個(gè)L以表示類似的。6.基因命名的發(fā)展趨勢人類基因的命名不僅僅只與人類基因相關(guān)?;蛲ㄟ^同源性分析而來的同源基因往往借用其它物種中同源基因的名字。一些基因家族和超家族有自己專門的命名體系。因此不同物種命名委員會之間及命名委員會與家族或超家族命名體系間的相互協(xié)調(diào)對于提高命名有用性,減少命名的管理費(fèi)用及方便用戶查詢是必不可少的[10]。參考文獻(xiàn)

[1]WhiteBJetal.Nature,1999,401:411

[2]Nature,1999,401:411

[3]WhiteBJ.Nature,1997,390:397

[4]NelsonDRetal.Pharmacogenetics,1996,6(1):1--2

[5]TissueAntigen,2000,55(1):100

[6]BullWorldHea

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論