




已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基因注釋與功能分類(lèi)基因注釋與功能分類(lèi)Gene Annotation And Functional Classification第一節(jié)第一節(jié) 引引 言言背景隨著 后基因組 (post-genomics)時(shí)代的來(lái)臨,基因組學(xué)的研究重心開(kāi)始從闡明所有遺傳信息轉(zhuǎn)移到在整體分子水平對(duì)功能進(jìn)行研究。這種轉(zhuǎn)變的一個(gè)重要標(biāo)志是產(chǎn)生了 功能基因組學(xué)(functional genomics)。任務(wù)功能基因組學(xué)的主要任務(wù)之一是進(jìn)行基因組 功能注釋?zhuān)╣enome annotation), 了解基因的功能,認(rèn)識(shí)基因與疾病的關(guān)系,掌握基因的產(chǎn)物及其在生命活動(dòng)中的作用等。意義快速有效的基因注釋對(duì)進(jìn)一步識(shí)別基因,研究基因的表達(dá)調(diào)控機(jī)制,研究基因在生物體代謝途徑中的地位,分析基因、基因產(chǎn)物之間的相互作用關(guān)系,預(yù)測(cè)和發(fā)現(xiàn)蛋白質(zhì)功能,揭示生命的起源和進(jìn)化等具有重要的意義。 第二節(jié)第二節(jié) 基因注釋數(shù)據(jù)庫(kù)基因注釋數(shù)據(jù)庫(kù) Gene Annotation Database一、研究人員已經(jīng)掌握了大量的 全基因組數(shù)據(jù) ,同時(shí)關(guān)于基因、基因產(chǎn)物以及 生物學(xué)通路 的數(shù)據(jù)也越來(lái)越多,解釋生物學(xué)實(shí)驗(yàn)的結(jié)果,尤其從基因組角度,需要系統(tǒng)的方法。 基因注釋數(shù)據(jù)庫(kù)產(chǎn)生的原因二、在基因組范圍內(nèi)描述蛋白質(zhì)功能十分復(fù)雜,最好的工具就是計(jì)算機(jī)程序,提供結(jié)構(gòu)化的標(biāo)準(zhǔn)的生物學(xué)模型,以便計(jì)算機(jī)程序進(jìn)行分析,成為從整體水平系統(tǒng)研究基因及其產(chǎn)物的一項(xiàng)基本需求。 一、 基因本體( gene ontology, GO)數(shù)據(jù)庫(kù)基因本體數(shù)據(jù)庫(kù)是 GO組織( Gene Ontology Consortium)在 2000年構(gòu)建的一個(gè)結(jié)構(gòu)化 的標(biāo)準(zhǔn) 生物學(xué)模型,旨在建立基因及其產(chǎn)物知識(shí)的標(biāo)準(zhǔn)詞匯體系,涵蓋了基因的 細(xì)胞組分(cellular component)、分子功能( molecular function) 、 生物學(xué)過(guò)程( biological process) 。 n GO數(shù)據(jù)庫(kù)最初收錄的基因信息來(lái)源于 3個(gè)模式生物數(shù)據(jù)庫(kù): 果蠅、酵母和小鼠 ,隨后相繼收錄了更多數(shù)據(jù),其中包括國(guó)際上主要的植物,動(dòng)物和微生物基因組數(shù)據(jù)庫(kù)。n GO術(shù)語(yǔ)在多個(gè)合作數(shù)據(jù)庫(kù)中的統(tǒng)一使用,促進(jìn)了各類(lèi)數(shù)據(jù)庫(kù)對(duì)基因描述的一致性。 GO數(shù)據(jù)庫(kù)收錄的基因組數(shù)據(jù)列表 GO注釋體系特點(diǎn)n GO通過(guò)控制注釋詞匯的層次結(jié)構(gòu)使得研究人員能夠從不同層面查詢(xún)和使用基因注釋信息。n 從整體上來(lái)看 GO注釋系統(tǒng)是一個(gè)有向無(wú)環(huán)圖 (Directed Acyclic Graphs),包含三個(gè)分支 ,即 : 生物學(xué)過(guò)程 (biological process),分子功能(molecular function)和 細(xì)胞組分 (cellular component)。n 注釋系統(tǒng)中每一個(gè)結(jié)點(diǎn) (node)都是基因或蛋白的一種描述 ,結(jié)點(diǎn)之間保持嚴(yán)格的關(guān)系 ,即 “is a”或 “part of”。1. 用關(guān)鍵詞檢索用關(guān)鍵詞檢索 GO數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)n 檢索檢索 GO數(shù)據(jù)庫(kù)通常先進(jìn)入數(shù)據(jù)庫(kù)通常先進(jìn)入 AmiGO的首頁(yè)。在的首頁(yè)。在 GO數(shù)據(jù)庫(kù)中,每條記錄數(shù)據(jù)庫(kù)中,每條記錄都有一個(gè)都有一個(gè) 數(shù)據(jù)標(biāo)識(shí)號(hào) GO:XXXXXX和對(duì)應(yīng)的術(shù)語(yǔ)。因此檢索時(shí)需要知和對(duì)應(yīng)的術(shù)語(yǔ)。因此檢索時(shí)需要知道待查基因的數(shù)字標(biāo)識(shí)號(hào)或術(shù)語(yǔ),將它們直接輸入框中檢索即可。如道待查基因的數(shù)字標(biāo)識(shí)號(hào)或術(shù)語(yǔ),將它們直接輸入框中檢索即可。如果檢索的基因或蛋白質(zhì)存在別名,可在檢索框下勾選果檢索的基因或蛋白質(zhì)存在別名,可在檢索框下勾選 “gene or proteins”,并在檢索框中輸入別名檢索;并在檢索框中輸入別名檢索; “exact match”表示是否完全匹表示是否完全匹配,可供選擇。配,可供選擇。一、使用 GO數(shù)據(jù)庫(kù) n 這里以檢索這里以檢索 神經(jīng)源性分化因子 6( NEUROD6) 為例。在檢索框?yàn)槔?。在檢索框中輸入中輸入 “NEUROD6”并勾選并勾選 “gene and proteins”和和 “exact match”,運(yùn)行后所得基因產(chǎn)物檢索結(jié)果如圖所示。運(yùn)行后所得基因產(chǎn)物檢索結(jié)果如圖所示。舉例 人民衛(wèi)生出版社 8年制及 7年制臨床醫(yī)學(xué)等專(zhuān)業(yè)用 生物信息學(xué) 此圖顯示了該基因產(chǎn)物的基本信息,包括類(lèi)型、物種、別名來(lái)源和序列 此圖顯示了該基因產(chǎn)物的術(shù)語(yǔ)關(guān)聯(lián)( term associations)圖,圖中記錄名稱(chēng) “Term”是 GO記錄的名字,“Ontology”是該基因產(chǎn)物的特性,如要查看其分子功能,可點(diǎn)擊其中的一條記錄 “nervous system development”。 此圖上部先對(duì)神經(jīng)源性分化因子 6的相關(guān)信息做簡(jiǎn)單描述,中間 術(shù)語(yǔ)系譜( term lineage) 成階梯狀分布,記錄了 GO數(shù)據(jù)庫(kù)中全部分子功能所處的位置和關(guān)系。下方 “External Reference”提供了與外部相關(guān)數(shù)據(jù)的鏈接。 點(diǎn)擊 上圖 右上方的可視化視圖( graphical view)就更清晰地顯示了分子功能記錄之間構(gòu)成的復(fù)雜網(wǎng)狀結(jié)構(gòu),既有上下隸屬關(guān)系,也存在平行關(guān)系。2. 用序列檢索用序列檢索 GO數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)n 對(duì)于未知基因名的序列,可對(duì)于未知基因名的序列,可以用序列直接檢索以用序列直接檢索 GO 數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)。點(diǎn)擊。點(diǎn)擊 AmiGO首頁(yè)上方的首頁(yè)上方的“BLAST”。n 界面風(fēng)格類(lèi)似于其他數(shù)據(jù)庫(kù)界面風(fēng)格類(lèi)似于其他數(shù)據(jù)庫(kù)BLAST搜索的網(wǎng)頁(yè),在檢索搜索的網(wǎng)頁(yè),在檢索框中鐵如氨基酸或核酸序列框中鐵如氨基酸或核酸序列,網(wǎng)頁(yè)能自動(dòng)識(shí)別并相應(yīng)地,網(wǎng)頁(yè)能自動(dòng)識(shí)別并相應(yīng)地做做 BLASTP或或 BLASTX和數(shù)據(jù)和數(shù)據(jù)庫(kù)中的序列比對(duì)。庫(kù)中的序列比對(duì)。n 這里以檢索這里以檢索 RPIA基因的序列基因的序列為例,如圖所示。為例,如圖所示。1. 簡(jiǎn)介簡(jiǎn)介 n 京都基因與基因組百科全書(shū)京都基因與基因組百科全書(shū) (Kyoto encyclopedia of genes and genomes, KEGG) 是系統(tǒng)分析基因功能、基因組信息的是系統(tǒng)分析基因功能、基因組信息的數(shù)據(jù)庫(kù),它整合了基因組學(xué)、生物化學(xué)以及系統(tǒng)功能組學(xué)數(shù)據(jù)庫(kù),它整合了基因組學(xué)、生物化學(xué)以及系統(tǒng)功能組學(xué)的信息,有助于研究者把基因及表達(dá)信息作為一個(gè)整體網(wǎng)的信息,有助于研究者把基因及表達(dá)信息作為一個(gè)整體網(wǎng)絡(luò)進(jìn)行研究。絡(luò)進(jìn)行研究。n KEGG提供的整合代謝途徑查詢(xún)十分出色,包括碳水化合提供的整合代謝途徑查詢(xún)十分出色,包括碳水化合物、核苷酸、氨基酸等代謝及有機(jī)物的生物降解,不僅提物、核苷酸、氨基酸等代謝及有機(jī)物的生物降解,不僅提供了所有可能的代謝途徑,還對(duì)催化各步反應(yīng)的酶進(jìn)行了供了所有可能的代謝途徑,還對(duì)催化各步反應(yīng)的酶進(jìn)行了全面的注解,包含其氨基酸序列、到全面的注解,包含其氨基酸序列、到 PDB數(shù)據(jù)庫(kù)的鏈接等數(shù)據(jù)庫(kù)的鏈接等。此外,。此外, KEGG還提供基于還提供基于 Java的圖形工具訪(fǎng)問(wèn)基因組圖的圖形工具訪(fǎng)問(wèn)基因組圖譜、比較基因組圖譜和操作表達(dá)圖譜,以及其他序列比較譜、比較基因組圖譜和操作表達(dá)圖譜,以及其他序列比較、圖形比較和通路計(jì)算的工具。因此,、圖形比較和通路計(jì)算的工具。因此, KEGG數(shù)據(jù)庫(kù)是進(jìn)數(shù)據(jù)庫(kù)是進(jìn)行生物體內(nèi)代謝分析、代謝網(wǎng)絡(luò)分析等研究的強(qiáng)有力工具行生物體內(nèi)代謝分析、代謝網(wǎng)絡(luò)分析等研究的強(qiáng)有力工具之一。之一。二、 京都基因與基因組百科全書(shū)n KEGG目前共包含了目前共包含了 19個(gè)子數(shù)據(jù)庫(kù),它們被分類(lèi)成系統(tǒng)信息個(gè)子數(shù)據(jù)庫(kù),它們被分類(lèi)成系統(tǒng)信息、基因組信息和化學(xué)信息三個(gè)類(lèi)別、基因組信息和化學(xué)信息三個(gè)類(lèi)別 。KEGG存儲(chǔ)內(nèi)容 基因組信息存儲(chǔ)在基因組信息存儲(chǔ)在 GENES數(shù)據(jù)庫(kù)里,包括全部完整的基因組序列和部數(shù)據(jù)庫(kù)里,包括全部完整的基因組序列和部分測(cè)序的基因組序列,并伴有實(shí)時(shí)更新的基因相關(guān)功能的注釋。分測(cè)序的基因組序列,并伴有實(shí)時(shí)更新的基因相關(guān)功能的注釋。 KEGG中化學(xué)信息的中化學(xué)信息的 6個(gè)數(shù)據(jù)庫(kù)被稱(chēng)為個(gè)數(shù)據(jù)庫(kù)被稱(chēng)為 KEGG LIGAND數(shù)據(jù)庫(kù),包含數(shù)據(jù)庫(kù),包含化學(xué)物質(zhì)、酶分子、酶化反應(yīng)等信息。化學(xué)物質(zhì)、酶分子、酶化反應(yīng)等信息。 KEGG BRITE數(shù)據(jù)庫(kù)是一個(gè)包數(shù)據(jù)庫(kù)是一個(gè)包含多個(gè)生物學(xué)對(duì)象的基于功能進(jìn)行等級(jí)劃分的本體論數(shù)據(jù)庫(kù),它包括含多個(gè)生物學(xué)對(duì)象的基于功能進(jìn)行等級(jí)劃分的本體論數(shù)據(jù)庫(kù),它包括分子、細(xì)胞、物種、疾病、藥物、以及它們之間的關(guān)系。分子、細(xì)胞、物種、疾病、藥物、以及它們之間的關(guān)系。 一些小的通路模塊被存儲(chǔ)在一些小的通路模塊被存儲(chǔ)在 MODULE數(shù)據(jù)庫(kù)中,該數(shù)據(jù)庫(kù)還存儲(chǔ)了其數(shù)據(jù)庫(kù)中,該數(shù)據(jù)庫(kù)還存儲(chǔ)了其他的一些相關(guān)功能的模塊以及化合物信息。他的一些相關(guān)功能的模塊以及化合物信息。 KEGG DRUG數(shù)據(jù)庫(kù)存儲(chǔ)了目前在日本所有非處方藥和美國(guó)的大部分?jǐn)?shù)據(jù)庫(kù)存儲(chǔ)了目前在日本所有非處方藥和美國(guó)的大部分處方藥品。處方藥品。 KEGG DISEASE是一個(gè)存儲(chǔ)疾病基因、通路、藥物、以及疾病診斷標(biāo)是一個(gè)存儲(chǔ)疾病基因、通路、藥物、以及疾病診斷標(biāo)記等信息的新型數(shù)據(jù)庫(kù)。記等信息的新型數(shù)據(jù)庫(kù)。 KEGG通常被看通常被看作是生物系統(tǒng)的計(jì)算作是生物系統(tǒng)的計(jì)算機(jī)表示,它囊括了生機(jī)表示,它囊括了生物系統(tǒng)中的各個(gè)對(duì)象物系統(tǒng)中的各個(gè)對(duì)象與對(duì)象之間的關(guān)系。與對(duì)象之間的關(guān)系。在分子層面、細(xì)胞層在分子層面、細(xì)胞層面、組織層面都可以面、組織層面都可以對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索。對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索。每個(gè)數(shù)據(jù)庫(kù)中的檢索每個(gè)數(shù)據(jù)庫(kù)中的檢索條目按照一定規(guī)律被條目按照一定規(guī)律被賦予一個(gè)檢索號(hào),也賦予一個(gè)檢索號(hào),也就是就是 ID。表中列出了。表中列出了KEGG的的 13個(gè)核心數(shù)據(jù)個(gè)核心數(shù)據(jù)庫(kù)的檢索號(hào)。庫(kù)的檢索號(hào)。KEGG數(shù)據(jù)庫(kù)的注釋與檢索 n 另外一種化學(xué)注釋的方法是另外一種化學(xué)注釋的方法是以小分子化學(xué)結(jié)構(gòu)的生物學(xué)以小分子化學(xué)結(jié)構(gòu)的生物學(xué)意義為特征來(lái)實(shí)現(xiàn)的。意義為特征來(lái)實(shí)現(xiàn)的。n 在在 KEGG數(shù)據(jù)庫(kù)中,酶與酶數(shù)據(jù)庫(kù)中,酶與酶之間的反應(yīng)信息以及相關(guān)的之間的反應(yīng)信息以及相關(guān)的化學(xué)結(jié)構(gòu)信息分別存儲(chǔ)在化學(xué)結(jié)構(gòu)信息分別存儲(chǔ)在KEGG REACTION數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)和KEGG REPAIR數(shù)據(jù)庫(kù)中。數(shù)據(jù)庫(kù)中。n 每個(gè)化合物的化學(xué)結(jié)構(gòu)都被每個(gè)化合物的化學(xué)結(jié)構(gòu)都被轉(zhuǎn)化為轉(zhuǎn)化為 RDM (atom type changes at R:reaction center D:diffevent atom M:matched atom )模式。模式。 n 下面以人類(lèi)編碼葡萄糖磷酸變位酶的基因下面以人類(lèi)編碼葡萄糖磷酸變位酶的基因 “PGM1”為例:為例:首先進(jìn)入首先進(jìn)入 KEGG首頁(yè),在首頁(yè)頂端的輸入框中輸入類(lèi)葡萄首頁(yè),在首頁(yè)頂端的輸入框中輸入類(lèi)葡萄糖磷酸變位酶基因名稱(chēng)糖磷酸變位酶基因名稱(chēng) “PGM1” KEGG數(shù)據(jù)庫(kù)的注釋與檢索 n 點(diǎn)擊搜索按鈕點(diǎn)擊搜索按鈕 “GO”進(jìn)入查詢(xún)結(jié)果頁(yè)面,該頁(yè)面會(huì)列出針進(jìn)入查詢(xún)結(jié)果頁(yè)面,該頁(yè)面會(huì)列出針對(duì)基因?qū)?“PGM1”在在 KEGG數(shù)據(jù)庫(kù)中的搜索結(jié)果,除人類(lèi)外數(shù)據(jù)庫(kù)中的搜索結(jié)果,除人類(lèi)外,包含,包含 “PGM1”基因的物種條目也會(huì)被列出?;虻奈锓N條目也會(huì)被列出。n 其中排在第一位的是人類(lèi)其中排在第一位的是人類(lèi)基因基因 “PGM1”的相關(guān)信息的相關(guān)信息,點(diǎn)擊該條目進(jìn)入到詳細(xì),點(diǎn)擊該條目進(jìn)入到詳細(xì)信息頁(yè)面。信息頁(yè)面。n 該頁(yè)面以表格的形式列出該頁(yè)面以表格的形式列出了該基因有關(guān)的詳細(xì)信息了該基因有關(guān)的詳細(xì)信息,包括基因編號(hào),基因的,包括基因編號(hào),基因的詳細(xì)定義,所編碼的酶的詳細(xì)定義,所編碼的酶的編號(hào),基因所在通路,以編號(hào),基因所在通路,以及序列的編碼信息。同時(shí)及序列的編碼信息。同時(shí),在頁(yè)面的右側(cè)還提供了,在頁(yè)面的右側(cè)還提供了該基因在其他分子生物學(xué)該基因在其他分子生物學(xué)數(shù)據(jù)庫(kù)的鏈接,如數(shù)據(jù)庫(kù)的鏈接,如 OMIM、 NCBI、 GenBank等。等。n 通過(guò)點(diǎn)擊相應(yīng)的鏈接,我們可以通過(guò)點(diǎn)擊相應(yīng)的鏈接,我們可以進(jìn)入該基因相應(yīng)信息的頁(yè)面。在進(jìn)入該基因相應(yīng)信息的頁(yè)面。在pathway這一欄中列出了該基因所這一欄中列出了該基因所在的生物學(xué)通路,點(diǎn)擊編號(hào)為在的生物學(xué)通路,點(diǎn)擊編號(hào)為hsa00010(糖酵解(糖酵解 /糖異生通路)糖異生通路)的通路,進(jìn)入到該通路的相應(yīng)頁(yè)的通路,進(jìn)入到該通路的相應(yīng)頁(yè)面。該編號(hào)為面。該編號(hào)為 hsa00010的通路頁(yè)的通路頁(yè)面以簡(jiǎn)單的幾何圖形顯示出了糖面以簡(jiǎn)單的幾何圖形顯示出了糖酵解酵解 /糖異生相關(guān)生物過(guò)程。圖中糖異生相關(guān)生物過(guò)程。圖中紅色的方框即為基因紅色的方框即為基因 “PGM1”所所編碼的酶,以此就可以通過(guò)該酶編碼的酶,以此就可以通過(guò)該酶所在位置以及通路的拓?fù)浣Y(jié)構(gòu)來(lái)所在位置以及通路的拓?fù)浣Y(jié)構(gòu)來(lái)綜合分析基因。綜合分析基因。n 此外,可以通過(guò)頁(yè)面頂部的下拉此外,可以通過(guò)頁(yè)面頂部的下拉列表框來(lái)選擇該通路在其他物種列表框來(lái)選擇該通路在其他物種中的信息,也可以通過(guò)該列表框中的信息,也可以通過(guò)該列表框的選擇來(lái)查看相關(guān)的基因、酶、的選擇來(lái)查看相關(guān)的基因、酶、反應(yīng)、化合物等相關(guān)通路信息。反應(yīng)、化合物等相關(guān)通路信息。n KEGG PATHWAY還存儲(chǔ)了一些人類(lèi)疾病通路數(shù)據(jù),這些還存儲(chǔ)了一些人類(lèi)疾病通路數(shù)據(jù),這些疾病通路被分為六個(gè)子類(lèi):癌癥、免疫系統(tǒng)疾病、神經(jīng)退行疾病通路被分為六個(gè)子類(lèi):癌癥、免疫系統(tǒng)疾病、神經(jīng)退行性疾病、循環(huán)系統(tǒng)疾病、代謝障礙、傳染病循環(huán)系統(tǒng)疾病。性疾病、循環(huán)系統(tǒng)疾病、代謝障礙、傳染病循環(huán)系統(tǒng)疾病。n KEGG DRUG數(shù)據(jù)庫(kù)也在不斷地完善,其中的藥物數(shù)據(jù)幾乎數(shù)據(jù)庫(kù)也在不斷地完善,其中的藥物數(shù)據(jù)幾乎涵蓋了日本的所有非處方藥和美國(guó)的大部分處方藥品。涵蓋了日本的所有非處方藥和美國(guó)的大部分處方藥品。DRUG 是一個(gè)以存儲(chǔ)結(jié)構(gòu)為基礎(chǔ)的數(shù)據(jù)庫(kù),每條記錄都包含是一個(gè)以存儲(chǔ)結(jié)構(gòu)為基礎(chǔ)的數(shù)據(jù)庫(kù),每條記錄都包含唯一的化學(xué)結(jié)構(gòu)以及該藥物的標(biāo)準(zhǔn)名稱(chēng),以及藥物的藥效、唯一的化學(xué)結(jié)構(gòu)以及該藥物的標(biāo)準(zhǔn)名稱(chēng),以及藥物的藥效、靶點(diǎn)信息、類(lèi)別信息等。藥物的靶點(diǎn)通過(guò)靶點(diǎn)信息、類(lèi)別信息等。藥物的靶點(diǎn)通過(guò) KEGG PATHWAY查詢(xún),藥物的分類(lèi)信息是查詢(xún),藥物的分類(lèi)信息是 KEGG BRITE數(shù)據(jù)庫(kù)的一部分,通數(shù)據(jù)庫(kù)的一部分,通過(guò)藥物的標(biāo)準(zhǔn)名稱(chēng)可以找到該藥物的商品名,還可以找到藥過(guò)藥物的標(biāo)準(zhǔn)名稱(chēng)可以找到該藥物的商品名,還可以找到藥物銷(xiāo)售的標(biāo)簽信息。此外,物銷(xiāo)售的標(biāo)簽信息。此外, DRUG還包括一些天然的藥物和還包括一些天然的藥物和中藥的信息,有些藥物被日本藥典所收錄。中藥的信息,有些藥物被日本藥典所收錄。KEGG數(shù)據(jù)庫(kù)的改進(jìn)與更新 n 為了滿(mǎn)足日益增長(zhǎng)的科學(xué)研究需求,為了滿(mǎn)足日益增長(zhǎng)的科學(xué)研究需求, KEGG數(shù)據(jù)庫(kù)在最近數(shù)據(jù)庫(kù)在最近幾年里不斷擴(kuò)充,新增加的幾年里不斷擴(kuò)充,新增加的 50多個(gè)通路使多個(gè)通路使 KEGG PATHWAY數(shù)據(jù)庫(kù)更加完善。這數(shù)據(jù)庫(kù)更加完善。這 50多個(gè)新增加的通路包括多個(gè)新增加的通路包括信號(hào)傳導(dǎo)通路、細(xì)胞生物過(guò)程通路和人類(lèi)疾病通路等。信號(hào)傳導(dǎo)通路、細(xì)胞生物過(guò)程通路和人類(lèi)疾病通路等。n KEGG對(duì)通路數(shù)據(jù)新增了兩個(gè)補(bǔ)充內(nèi)容:第一個(gè)補(bǔ)充是一對(duì)通路數(shù)據(jù)新增了兩個(gè)補(bǔ)充內(nèi)容:第一個(gè)補(bǔ)充是一張全局通路圖,這張全局通路圖是通過(guò)手工拼接張全局通路圖,這張全局通路圖是通過(guò)手工拼接 KEGG的的120多個(gè)現(xiàn)存通路圖生成的,存儲(chǔ)為多個(gè)現(xiàn)存通路圖生成的,存儲(chǔ)為 SVG文件。另一個(gè)補(bǔ)文件。另一個(gè)補(bǔ)充內(nèi)容是充內(nèi)容是 KEGG MODULE數(shù)據(jù)庫(kù),這是一個(gè)收集了通路數(shù)據(jù)庫(kù),這是一個(gè)收集了通路模塊以及其他一些功能單元的新型數(shù)據(jù)庫(kù),功能模塊是在模塊以及其他一些功能單元的新型數(shù)據(jù)庫(kù),功能模塊是在KEGG子通路中被定義為一些小的片段,通常包括幾個(gè)連子通路中被定義為一些小的片段,通常包括幾個(gè)連續(xù)的反應(yīng)步驟、操縱子、調(diào)控單元,以及通過(guò)基因組比對(duì)續(xù)的反應(yīng)步驟、操縱子、調(diào)控單元,以及通過(guò)基因組比對(duì)得到的系統(tǒng)發(fā)生單元和分子的復(fù)合物等。得到的系統(tǒng)發(fā)生單元和分子的復(fù)合物等。KEGG數(shù)據(jù)庫(kù)的改進(jìn)與更新 第三節(jié)第三節(jié) 基因集功能富集分析基因集功能富集分析 Gene Set Enrichment Analysis 一組基因直接注釋的結(jié)果是得到大量的功能結(jié)點(diǎn)。這些功能具有概念上的交疊現(xiàn)象,導(dǎo)致分析結(jié)果冗余,不利于進(jìn)一步的精細(xì)分析,所以研究人員希望對(duì)得到的功能結(jié)點(diǎn)加以過(guò)濾和篩選,以便獲得更有意義的功能信息。 進(jìn)行基因集功能富集分析的原因n 富集分析方法通常是分析一組基因在某個(gè)功能結(jié)點(diǎn)上是否富集分析方法通常是分析一組基因在某個(gè)功能結(jié)點(diǎn)上是否過(guò)出現(xiàn)過(guò)出現(xiàn) (over-presentation)。這個(gè)原理可以由單個(gè)基因的注。這個(gè)原理可以由單個(gè)基因的注釋分析發(fā)展到大基因集合的成組分析。釋分析發(fā)展到大基因集合的成組分析。n 由于分析的結(jié)論是基于一組相關(guān)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 深度解析漢語(yǔ)語(yǔ)用的特征試題及答案
- Photoshop圖像表現(xiàn)技巧探討試題及答案
- 現(xiàn)代漢語(yǔ)句式變化訓(xùn)練試題及答案
- 知識(shí)點(diǎn)間關(guān)聯(lián)性2025年計(jì)算機(jī)二級(jí)VB考試試題及答案
- MS Office卓越績(jī)效的試題及答案
- 強(qiáng)化Msoffice應(yīng)用實(shí)際的試題及答案解析
- 解題思路2025年軟件設(shè)計(jì)師試題及答案
- WPS文件備份建議試題及答案
- 計(jì)算機(jī)一級(jí)wps考試核心要點(diǎn)試題及答案
- 社會(huì)文化影響Photoshop試題及答案
- 神經(jīng)病學(xué)人衛(wèi)版習(xí)題集+期末試卷
- 車(chē)輛違章處理委托書(shū)委托書(shū)
- 氮化爐安全操作規(guī)程
- 初中物理電功率高低溫檔專(zhuān)題解析課件
- 3D打印技術(shù)基礎(chǔ)及實(shí)踐學(xué)習(xí)通課后章節(jié)答案期末考試題庫(kù)2023年
- 核醫(yī)學(xué)主治醫(yī)師考試:核醫(yī)學(xué)專(zhuān)業(yè)知識(shí)真題模擬匯編(共569題)
- 中央空調(diào) 應(yīng)急預(yù)案
- 英語(yǔ)論文Result-Discussion課件
- 中學(xué)生紀(jì)律處分登記表
- 愛(ài)情公寓第二季1至5集劇本
- 醫(yī)學(xué)免疫學(xué)病例分析題,可憐的老張
評(píng)論
0/150
提交評(píng)論