第八章基因注釋與功能分類PPT課件_第1頁
第八章基因注釋與功能分類PPT課件_第2頁
第八章基因注釋與功能分類PPT課件_第3頁
第八章基因注釋與功能分類PPT課件_第4頁
第八章基因注釋與功能分類PPT課件_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、背景 隨著后基因組(post-genomics)時代的來臨,基因組學的研究重心開始從闡明所有遺傳信息轉(zhuǎn)移到在整體分子水平對功能進行研究。這種轉(zhuǎn)變的一個重要標志是產(chǎn)生了功能基因組學(functional genomics)。任務 功能基因組學的主要任務之一是進行基因組功能注釋(genome annotation),了解基因的功能,認識基因與疾病的關(guān)系,掌握基因的產(chǎn)物及其在生命活動中的作用等。意義 快速有效的基因注釋對進一步識別基因,研究基因的表達調(diào)控機制,研究基因在生物體代謝途徑中的地位,分析基因、基因產(chǎn)物之間的相互作用關(guān)系,預測和發(fā)現(xiàn)蛋白質(zhì)功能,揭示生命的起源和進化等具有重要的意義。 一、研究

2、人員已經(jīng)掌握了大量的全基因組數(shù)據(jù),同時關(guān)于基因、基因產(chǎn)物以及生物學通路的數(shù)據(jù)也越來越多,解釋生物學實驗的結(jié)果,尤其從基因組角度,需要系統(tǒng)的方法。 基因注釋數(shù)據(jù)庫產(chǎn)生的原因基因注釋數(shù)據(jù)庫產(chǎn)生的原因 二、在基因組范圍內(nèi)描述蛋白質(zhì)功能十分復雜,最好的工具就是計算機程序,提供結(jié)構(gòu)化的標準的生物學模型,以便計算機程序進行分析,成為從整體水平系統(tǒng)研究基因及其產(chǎn)物的一項基本需求。 一、一、基因本體(基因本體(gene ontology, GO)數(shù)據(jù)庫)數(shù)據(jù)庫 基因本體數(shù)據(jù)庫是GO組織(Gene Ontology Consortium)在2000年構(gòu)建的一個結(jié)構(gòu)化的標準的標準生物學模型,旨在建立基因及其產(chǎn)物知

3、識的標準詞匯體系,涵蓋了基因的細胞組分細胞組分(cellular component)、分子功能()、分子功能(molecular function)、生生物學過程(物學過程(biological process)。 nGO數(shù)據(jù)庫最初收錄的基因信息來源于3個模式生物數(shù)據(jù)庫:果蠅、酵母和小鼠果蠅、酵母和小鼠,隨后相繼收錄了更多數(shù)據(jù),其中包括國際上主要的植物,動物和微生物基因組數(shù)據(jù)庫。nGO術(shù)語在多個合作數(shù)據(jù)庫中的統(tǒng)一使用,促進了各類數(shù)據(jù)庫對基因描述的一致性。GO數(shù)據(jù)庫收錄的基因組數(shù)據(jù)列表數(shù)據(jù)庫收錄的基因組數(shù)據(jù)列表 GO注釋體系特點注釋體系特點nGO通過控制注釋詞匯的層次結(jié)構(gòu)使得研究人員能夠從不同

4、層面查詢和使用基因注釋信息。n從整體上來看GO注釋系統(tǒng)是一個有向無環(huán)圖(Directed Acyclic Graphs),包含三個分支,即: 生物學過程生物學過程(biological process),分子功能,分子功能(molecular function)和細胞組分細胞組分(cellular component)。n注釋系統(tǒng)中每一個結(jié)點(node)都是基因或蛋白的一種描述,結(jié)點之間保持嚴格的關(guān)系,即“is a”或“part of”。AmiGO數(shù)據(jù)標識號數(shù)據(jù)標識號GO:XXXXXXgene or proteinsexact match一、使用一、使用GO數(shù)據(jù)庫數(shù)據(jù)庫 神經(jīng)源性分化因子神經(jīng)源

5、性分化因子6(NEUROD6)NEUROD6gene and proteinsexact match舉例舉例 人民衛(wèi)生出版社8年制及7年制臨床醫(yī)學等專業(yè)用生物信息學此圖顯示了該基因產(chǎn)物的基本信息,包括類型、物種、此圖顯示了該基因產(chǎn)物的基本信息,包括類型、物種、別名來源和序列別名來源和序列 此圖顯示了該基因產(chǎn)物此圖顯示了該基因產(chǎn)物的術(shù)語關(guān)聯(lián)(的術(shù)語關(guān)聯(lián)(term associations)圖,圖中)圖,圖中記錄名稱記錄名稱“Term”是是GO記錄的名字,記錄的名字,“Ontology”是該基因是該基因產(chǎn)物的特性,如要查看產(chǎn)物的特性,如要查看其分子功能,可點擊其其分子功能,可點擊其中的一條記錄中的

6、一條記錄“nervous system development”。 此圖上部先對神經(jīng)源此圖上部先對神經(jīng)源性分化因子性分化因子6的相關(guān)的相關(guān)信息做簡單描述,中信息做簡單描述,中間間術(shù)語系譜(術(shù)語系譜(term lineage)成階梯狀分成階梯狀分布,記錄了布,記錄了GO數(shù)據(jù)數(shù)據(jù)庫中全部分子功能所庫中全部分子功能所處的位置和關(guān)系。下處的位置和關(guān)系。下方方“External Reference”提供了與提供了與外部相關(guān)數(shù)據(jù)的鏈接。外部相關(guān)數(shù)據(jù)的鏈接。 點擊上圖右上方的可視化視圖(graphical view)就更清晰地顯示了分子功能記錄之間構(gòu)成的復雜網(wǎng)狀結(jié)構(gòu),既有上下隸屬關(guān)系,也存在平行關(guān)系。二、二

7、、京都基因與基因組百科全書京都基因與基因組百科全書KEGG存儲內(nèi)容存儲內(nèi)容 KEGG數(shù)據(jù)庫的注釋與檢索數(shù)據(jù)庫的注釋與檢索 KEGG數(shù)據(jù)庫的注釋與檢索數(shù)據(jù)庫的注釋與檢索 KEGG數(shù)據(jù)庫的改進與更新數(shù)據(jù)庫的改進與更新 KEGG數(shù)據(jù)庫的改進與更新數(shù)據(jù)庫的改進與更新 一組基因直接注釋的結(jié)果是得到大量的功能結(jié)點。這些功能具有概念上的交疊現(xiàn)象,導致分析結(jié)果冗余,不利于進一步的精細分析,所以研究人員希望對得到的功能結(jié)點加以過濾和篩選,以便獲得更有意義的功能信息。 進行基因集功能富集分析的原因進行基因集功能富集分析的原因一、富集分析算法一、富集分析算法 二、常用富集分析軟件二、常用富集分析軟件 二、富集分析應

8、用實例二、富集分析應用實例 人民衛(wèi)生出版社8年制及7年制臨床醫(yī)學等專業(yè)用生物信息學近來已經(jīng)發(fā)展了很多基于GO數(shù)據(jù)庫或KEGG數(shù)據(jù)庫的方法,利用高通量的基因表達和蛋白質(zhì)互作數(shù)據(jù)進行功能預測,其中一些新開發(fā)的方法試圖整合多種數(shù)據(jù)類型,通過構(gòu)建功能相關(guān)網(wǎng)絡(luò)的方式預測基因功能。 基因功能預測算法基因功能預測算法 當前基于當前基于GO或或KEGG的基因功能預測策略的基因功能預測策略一、基于一、基于GO的基因功能預測的基因功能預測 二、基于二、基于KEGG的基因功能預測的基因功能預測 通路分析是現(xiàn)在經(jīng)常被使用的芯片數(shù)據(jù)基因功能分析法。與GO分類法(應用單個基因的GO分類信息)不同,通路分析法利用的資源是許多已經(jīng)研究清楚

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論