




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、 簡介 2021/6/6.產(chǎn)生的背景 如何借助計算機全面地展現(xiàn)細胞和生物所包含的生物學信息是后基因組時代的艱苦挑戰(zhàn)之一??茖W家期望可以根據(jù)基因組中的信息,用計算機計算或者預測出比較復雜的細胞中的通路或者生物的復雜行為。出于這個目的,日本京都大學生物信息學中心的Kanehisa實驗室于1995年建立了生物信息學數(shù)據(jù)庫KEGG。.特點 KEGG是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫。把從曾經(jīng)完好測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態(tài)系統(tǒng)程度的系統(tǒng)功能關聯(lián)起來是KEGG數(shù)據(jù)庫的特征之一。 人工創(chuàng)建了一個知識庫,這個知識庫是基于運用一種可計算的方式捕捉和組織實驗得到的知識而構(gòu)
2、成的系統(tǒng)功能知識庫。它是一個生物系統(tǒng)的計算機模擬。 與其他數(shù)據(jù)庫相比,KEGG 的一個顯著特點就是具有強大的圖形功能,它利用圖形而不是繁縟的文字來引見眾多的代謝途徑以及各途徑之間的關系,這樣可以使研討者可以對其所要研討的代謝途徑有一個直觀全面的了解。.用途 各個數(shù)據(jù)庫中包含了大量的有用信息。基因組信息存儲在GENES數(shù)據(jù)庫里,包括完好和部分測序的基因組序列;更高級的功能信息存儲在PATHWAY數(shù)據(jù)庫里,包括圖解的細胞生化過程如代謝、膜轉(zhuǎn)運、信號傳送、細胞周期,還包括同系保守的子通路等信息;KEGG的另一個數(shù)據(jù)庫LIGAND,包含關于化學物質(zhì)、酶分子、酶反響等信息。 經(jīng)過與世界上其它一些大型生物
3、信息學數(shù)據(jù)庫的銜接,KEGG可以為研討者提供更為豐富的生物學信息(LinkDB)。 KEGG提供了Java的圖形工具來訪問基因組圖譜,比較基因組圖譜和操作表達圖譜,以及其它序列比較、圖形比較和通路計算的工具,可以免費獲取。.影響及開展 KEGG建立了KEGG直系同源系統(tǒng)(the KEGG Orthology (KO) system),這個系統(tǒng)經(jīng)過把分子網(wǎng)絡的相關信息銜接到基因組中,從而開展和促進了跨物種注釋流程。 結(jié)果闡明,KEGG被當做一個參考知識庫,被廣泛的用于基因組測序和其他高通量實驗技術(shù)得到的大規(guī)模數(shù)據(jù)集的整合和解釋中。除了堅持對根底研討的支持,隨著KEGG分子網(wǎng)絡的一些小變化,KEG
4、G正在朝著更加偏向于實踐運用的方向開展,這些運用主要集中在整合人類疾病、藥物和其他與安康相關的物質(zhì)。.KEGG數(shù)據(jù)庫 KEGG是一個綜合數(shù)據(jù)庫,它們大致分為系統(tǒng)信息、基因組信息和化學信息三大類。進一步可細分為16個主要的數(shù)據(jù)庫。可以經(jīng)過不同的顏色編碼來區(qū)分。.分類分類數(shù)據(jù)庫數(shù)據(jù)庫目錄目錄顏色顏色系統(tǒng)信息KEGG PATHWAYKEGG通路圖KEGG BRITEBRITE功能層次KEGG MODULEKEGG功能單元的模塊KEGG DISEASE人類疾病KEGG DRUG藥物KEGG ENVIRON天然藥物和與安康相關的物質(zhì)基因組信息KEGG ORTHOLOGYKEGG直系同源(KO)組KEGG
5、 GENOMEKEGG中帶有完好基因組的物種KEGG GENES在完好基因組中的基因目錄KEGG SSDB與基因有關的序列類似性數(shù)據(jù)庫化學信息KEGG COMPOUND代謝物及其他小分子化合物KEGG GLYCAN多糖KEGG REACTION生化反響KEGG RPAIR化學反響中的反響物對KEGG RCLASSRPAIR定義的反響級別KEGG ENZYME酶命名法.三類數(shù)據(jù)庫的關系.KEGG對象標識符DatabaseObjectPrefixExampleKEGG PATHWAYPathway mapmap, ko, ec, rn, (org)hsa04930KEGG BRITEFunctio
6、nal hierarchybr, jp, ko, (org)ko01003KEGG MODULEKEGG moduleM, (org)_MM00010KEGG DISEASEHuman diseaseHH00004KEGG DRUGDrugDD01441KEGG ENVIRONCrude drug, etc.EE00048KEGG ORTHOLOGYKO groupKK04527KEGG GENOMEKEGG organismTT01001 (hsa)KEGG GENESGene / proteinhsa:3643KEGG COMPOUNDSmall moleculeCC00031KEGG G
7、LYCANGlycanGG00109KEGG REACTIONReactionRR00259KEGG RPAIRReactant pairRPRP04458KEGG RCLASSReaction classRCRC00046KEGG ENZYMEEnzymeec:2.7.10.1數(shù)據(jù)庫中包含各種各樣的數(shù)據(jù)對象,這些數(shù)據(jù)對象是為了用來對生物系統(tǒng)進展計算機模擬的。因此,各個數(shù)據(jù)庫中的數(shù)據(jù)記錄都被稱為KEGG對象。這些對象可以經(jīng)過KEGG對象標識符來識別,標識符由一個與數(shù)據(jù)庫相關的前綴加五個數(shù)字構(gòu)成。(org) represents three-, four-, or five-letter org
8、anism code.當前數(shù)據(jù)庫中的記錄KEGG Database as of 2021/6/5KEGG PATHWAYPathway maps, reference (total)0 (246,368)KEGG BRITEFunctional hierarchies, reference (total)140 (78,848)KEGG MODULEKEGG modules, reference (total)566 (185,274)KEGG DISEASEHuman diseases1,301KEGG DRUGDrugs9,910KEGG ENVIRONCrude drugs and he
9、alth-related substances845KEGG ORTHOLOGY KEGG Orthology (KO) groups16,748KEGG GENOMEKEGG Organisms2,697KEGG GENESGenes in high-quality genomes(190 eukaryotes, 2336 bacteria, 153 archaea)10,821,739KEGG SSDBBest hit relations within GENESBi-directional best hit relations within GENES130,947,959,9572,9
10、96,848,546KEGG DGENESGenes in draft genomes (18 eukaryotes)432,488KEGG EGENESGenes as EST contigs (99 eukaryotes)3,792,883KEGG MGENESGenes in metagenomes (716 samples)90,754,418KEGG COMPOUND Metabolites and other small molecules17,012KEGG GLYCANGlycans10,985KEGG REACTIONBiochemical reactions9,320KEG
11、G RPAIRReactant pair chemical transformations14,092KEGG RCLASSReaction class2,807KEGG ENZYMEEnzyme nomenclature5,973.KEGG PATHWAY DatabaseKEGG PATHWAY數(shù)據(jù)庫是一個手工畫的代謝通路的集數(shù)據(jù)庫是一個手工畫的代謝通路的集合,包含以下幾方面的分子間相互作用和反響網(wǎng)絡:合,包含以下幾方面的分子間相互作用和反響網(wǎng)絡:1.新陳代謝新陳代謝2.遺傳信息加工遺傳信息加工3.環(huán)境信息加工環(huán)境信息加工4.細胞過程細胞過程5.生物體系統(tǒng)生物體系統(tǒng)6.人類疾病人類疾病7.
12、藥物開發(fā)藥物開發(fā).PATHWAY的五種類型僅僅第一種參考通路(reference pathway)圖是手動畫出來的,其他的通路圖都是經(jīng)過計算產(chǎn)生的。 pathway中的每一個框(或線)都對應一個或多個K編號、EC編號及R編號。map - Reference pathway 對于代謝相關的通路,在reference pathway中,一個點同時表示一個基因、這個基因編碼的酶及這個酶參與的反響ko - Reference pathway (KO) ko通路中的點只表示基因ec - Reference pathway (EC) ec通路中的點只表示相關的酶rn - Reference pathway
13、 (Reaction) Reaction通路中的點只表示改點參與的某個反響、反響物對及反響類型org - Organism-specific pathway map 對于一切的代謝和非代謝通路,K編號都被以為是基因的標識符,這個標識符在每一個物種中對應該物種中的某個基因,從而得到物種特異性的pathway。. map00010ko00010ec00010rn00010hsa00010.KEGG BRITE DatabaseKEGG BRITE是一個層級分類的數(shù)據(jù)庫,包含是一個層級分類的數(shù)據(jù)庫,包含生物系統(tǒng)各個方面的知識。相對于生物系統(tǒng)各個方面的知識。相對于KEGG PATHWAY僅限于分子間相
14、互作用和反響,僅限于分子間相互作用和反響,KEGG BRITE包含了許多不同的關系類型。例包含了許多不同的關系類型。例如,可以查詢酶和底物之間的關系,也可以如,可以查詢酶和底物之間的關系,也可以查詢某種酶的同源基因。查詢某種酶的同源基因。.tp53在BRITE中的查詢結(jié)果.KEGG MODULE DatabaseKEGG MODULE是一個人工定義的功能單元的集合。被用于是一個人工定義的功能單元的集合。被用于已測序基因組的注釋和生物學上的解釋。各個模塊運用已測序基因組的注釋和生物學上的解釋。各個模塊運用M開頭的編號及與其對應的一系列開頭的編號及與其對應的一系列K開頭的編號來表示。開頭的編號來表
15、示。四種主要的四種主要的KEGG模塊模塊1.通路模塊:代表在通路模塊:代表在KEGG代謝通路圖中的復雜功能單元,代謝通路圖中的復雜功能單元,例如例如M00002(糖酵解,與三碳化合物相關的中心模塊糖酵解,與三碳化合物相關的中心模塊)2.構(gòu)造復合物:通常構(gòu)成分子機械,例如構(gòu)造復合物:通常構(gòu)成分子機械,例如M00072(寡糖轉(zhuǎn)寡糖轉(zhuǎn)移酶移酶)3.功能集:根本單元的其他方式,例如功能集:根本單元的其他方式,例如M00360(氨?;滨;?tRNA 合酶,原核生物合酶,原核生物)4.特征模塊:作為某種表型的標志,例如特征模塊:作為某種表型的標志,例如M00363(腸出血腸出血性大腸桿菌致病性特征,志賀
16、毒素性大腸桿菌致病性特征,志賀毒素).KEGG ORTHOLOGY (KO) DatabaseKEGG參考通路圖,BRITE功能層次以及KEGG模塊都是以一種廣泛的方式來表示,都可以用于一切物種。而KEGG直系同源系統(tǒng)(KO System)是這一表示方式的根底。包含手動定義的直系同源組,這些直系同源組就相當于KEGG通路中的點,BRITE層級中的點以及KEGG模塊中的點。(這些點并不是某個詳細物種的某一個基因,而是在許多物種中都存在的直系同源的某一個基因)。一旦基因被分配了KO標識或K編號,經(jīng)過基因組注釋流程,物種特異性的通路圖、BRITE功能層次和KEGG模塊就可以自動產(chǎn)生了。.直系同源與旁
17、系同源l 直系同源(orthology)是比較基因組學中最重要的定義。直系同源的定義是:l (1).在進化上來源于一個始祖基因并垂直傳送的同源基因;l (2).分布于兩種或兩種以上物種的基因組;l (3).功能高度保守乃至于近乎一樣,甚至于其在近緣物種可以相互交換;l (4).構(gòu)造類似;l (5).組織特異性與亞細胞分布類似。 l 旁系同源(paralogy)基因是指同一基因組(或同系物種的基因組)中,由于始祖基因的加倍而橫向產(chǎn)生的幾個同源基因。直系與旁系的共性是同源,都源于各自的始祖基因。其區(qū)別在于:在進化來源上,直系同源是強調(diào)在不同基因組中的垂直傳送,旁系同源那么是在同一基因組中的橫向加倍
18、;在功能上,直系同源要求功能高度類似,而旁系同源在定義上對功能上沒有嚴厲要求,能夠類似,但也能夠并不類似(雖然構(gòu)造上具一定程度的類似),甚至于沒有功能(如基因家族中的假基因)。.Image depicts concepts of Orthology and paralogy. from Protein Kinase C Orthologs.Neurotrophin(神運營養(yǎng)因子神運營養(yǎng)因子) signaling pathway(ko04722)從這個圖上可以看到基因之間的相互作用。.ko編號表示一個通路,這個通路是不分物種的,相當于一切物種的這一通路的并集。.Ortholog table(ko04722) .K編號表示一個基因,是ko通路中的根本單位,某一K編號代表的不是某一詳細物種的基因,而是一切物種的某一同源基因的統(tǒng)稱。.KEGG GENOME Database該數(shù)據(jù)庫中搜集了2679中物種(190 eukaryotes, 2336 bacteria, 153 archaea)的基因組信息,這些物種都曾經(jīng)具有完好的基因組序列,并根據(jù)大量的EST數(shù)據(jù)集進展了增補。.KEGG
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 創(chuàng)新團隊課題申報書
- 高質(zhì)量發(fā)展課題申報書
- 民間音樂課題申報書
- 調(diào)研課題申報立項書格式
- 鹵菜技術(shù)傳授合同范本
- 課題申報書保障條件
- 員工繳納公積金合同范本
- 個人承包私活合同范本
- 包銷合同范本版
- 售房補充合同范本
- 接力版六年級下冊小學英語 Lesson 4 Sally is going to Beijing. 第一課時 教案(教學設計)
- 食堂蔬菜品種及質(zhì)量標準
- 《大數(shù)據(jù)分析與應用》教學大綱
- FZW2812F(FDR)型用戶分界真空負荷開關安裝使用說明書完
- 2022年中國遠洋海運集團有限公司招聘考試題庫及答案解析
- 供應鏈管理課件第5章供應鏈合作伙伴選擇與評價
- 4D現(xiàn)場管理培訓ppt課件(PPT 45頁)
- 餐飲店面投資預算(900平方米)
- 小學生個人簡歷WORD模板
- 檢驗科危急值管理.
- 五輥研磨機(課堂PPT)
評論
0/150
提交評論