基因芯片分析的理論與方法ppt課件_第1頁
基因芯片分析的理論與方法ppt課件_第2頁
基因芯片分析的理論與方法ppt課件_第3頁
基因芯片分析的理論與方法ppt課件_第4頁
基因芯片分析的理論與方法ppt課件_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基因芯片分析的實(shí)際與方法ericexist163. com:7049971基因芯片概論基因芯片分析的概念n基因芯片(Gene chip)技術(shù)是指經(jīng)過微陣列(Microarray)技術(shù)將高密度DNA片段陣列經(jīng)過高速機(jī)器人或原位合成方式以一定的順序或陳列方式使其附著在如玻璃片等固相外表,以熒光標(biāo)志的DNA探針,借助堿基互補(bǔ)雜交原理,進(jìn)展大量的基因表達(dá)及監(jiān)測(cè)等方面研討的技術(shù)。基因芯片分析的優(yōu)點(diǎn)n快速n高通量(104 - 106)n自動(dòng)化n運(yùn)用的試劑少n低本錢基因芯片分析的運(yùn)用范圍nAcademic research of genetic diseasesnCancernPrenatal geneti

2、cs產(chǎn)前遺傳學(xué)研討nGeneral genetic diseasesnInfectious diseasesnDrug discoverynAnimal farming/veterinary nIndustrial (fermentation)nEnvironmental開展的方向:從多角度研討提示生命景象nStages: developmental,transformation, time fter treatment, etc.nTreatments (stimuli, drugs, nutrients, etc.) nPhysiological states (stressed, fas

3、ting, etc.)nTissue distributionn(position, 3D)基因芯片的開展是推進(jìn)系統(tǒng)生物學(xué)開展的動(dòng)力利用基因芯片研討生命景象的測(cè)略nFactors involved = ComponentsnOrder of events = PathwaysnInteractions = Circuit KEGGGO基因芯片的分類E xp ressio n C h ip sG en o m ic C h ip sS eq u en cin g C h ip sD N A C h ip s基因芯片的分類nOligonucleotide arrayn Synthesized on

4、 a chip Affymetrixn Spot on a solid matrix CompugenncDNA array Incyte 一些開展中的基因芯片技術(shù)平臺(tái)n利用生物分子的電物理特性進(jìn)展基因表達(dá)監(jiān)測(cè):監(jiān)測(cè)速度很快,適用于基因表大,蛋白質(zhì)組及基因型的研討n利用電場(chǎng)原理進(jìn)展高密度芯片消費(fèi):基于適宜用于生物學(xué)的集成電路,集成電路包含可以獨(dú)立尋址的微電極陣列,結(jié)合特殊的液體流動(dòng)系統(tǒng),可以使大部分生物分子按照來自于計(jì)算機(jī)的數(shù)字指令運(yùn)動(dòng)。n噴墨點(diǎn)樣技術(shù):以高度定位的方式把合成好的寡核苷酸分子噴點(diǎn)倒玻璃外表。n寡核苷酸包被的微珠芯片n平行信號(hào)測(cè)序技術(shù):對(duì)基因表達(dá)進(jìn)展定量分析基因芯片分析實(shí)驗(yàn)方法基

5、因芯片分析的主要步驟cDNA基因芯片分析的主要步驟cDNA芯片分析的主要步驟nSpot by Array spottercDNA芯片分析的主要步驟Hybridizing by Automatic hybridization processorcDNA芯片分析的主要步驟nLaser scannerOligonucleotide array GeneChip總總RNA的制備的制備反轉(zhuǎn)錄反轉(zhuǎn)錄體外體外轉(zhuǎn)錄轉(zhuǎn)錄生物素標(biāo)志的生物素標(biāo)志的cRNAcRNA片段化處置片段化處置帶標(biāo)志的帶標(biāo)志的cRNA片斷片斷35-200 bases0.5-2 ug/ul起始用量起始用量5-10ug5-10ugIVT操作流程以

6、真核生物為例操作流程以真核生物為例標(biāo)志的標(biāo)志的cRNA片斷片斷雜交混合液的制備雜交混合液的制備EukaryoticHyb.ControlControlOligo B2 雜交雜交16hour 數(shù)據(jù)分析數(shù)據(jù)分析 掃掃 描描 洗脫洗脫染色染色Oligonucleotide array 的特點(diǎn)1 個(gè)平方厘米的面積至少可陳個(gè)平方厘米的面積至少可陳列四十多萬個(gè)探針合成區(qū)列四十多萬個(gè)探針合成區(qū)“點(diǎn)點(diǎn)基因基因2 2基因基因1cDNA1cDNA基因基因2cDNA2cDNA用于用于cDNAcDNA芯片的探針芯片的探針Oligo probeOligo probe基因基因1 1多個(gè)檢測(cè)結(jié)果可以參考多個(gè)檢測(cè)結(jié)果可以參考

7、Oligonucleotide array 的優(yōu)越性 序列準(zhǔn)確性高 原位合成 PCR擴(kuò)增,點(diǎn)樣 起始Total RNA 110ug 50ug 均一的退火溫度 25mer 300bp3Kb 特異性更高 多段探針 單個(gè)探針 非特異性雜交 2 30cDNA 芯片芯片Affy 芯片芯片優(yōu)優(yōu) 勢(shì)勢(shì)芯片分析數(shù)據(jù)的規(guī)范化nQuantitation ndata-quality assessmentsn背景處置:圖像上各點(diǎn)的吸光度值包含了樣品和背景信號(hào),在提取數(shù)據(jù)前必需將背景扣除n雜交點(diǎn)質(zhì)量:由于點(diǎn)樣或膜變形等緣由目前較多的軟件對(duì)雜交點(diǎn)的識(shí)別定位仍需求人為的調(diào)整n數(shù)據(jù)的規(guī)范化:其目的是防止基因芯片實(shí)驗(yàn)中因系統(tǒng)差

8、別呵斥芯片間數(shù)據(jù)比較的困難。最常用的是“看家基因法,它預(yù)先選擇一組表達(dá)程度不變的看家基因,計(jì)算出這組基因平均ratio 值為1 時(shí)的規(guī)范化系數(shù),然后將其運(yùn)用于全部的數(shù)據(jù)以到達(dá)規(guī)范化的目的Scatter plots for a Cy5-liver/Cy3-liver control hubridization A Cy5-ovarian tumor/Cy3-normal ovary hubridization The value of Cy3 and Cy5 hydridization signals from each clone were plotted directly onto the

9、plot 卵巢癌Data Analysis - Reveal the Difference基因芯片數(shù)據(jù)分析和信息發(fā)掘方法一. 聚類分析聚類分析n聚類分析是方式識(shí)別中一種非常有吸引力聚類分析是方式識(shí)別中一種非常有吸引力的方法,特別適用于方式分類數(shù)不知道的的方法,特別適用于方式分類數(shù)不知道的情況。情況。n從機(jī)器學(xué)習(xí)的角度來看,有兩種根本的聚從機(jī)器學(xué)習(xí)的角度來看,有兩種根本的聚類分析:類分析:n有教師聚類有教師聚類n無教師聚類無教師聚類n基因表達(dá)數(shù)據(jù)聚類分析普通包括以下幾個(gè)基因表達(dá)數(shù)據(jù)聚類分析普通包括以下幾個(gè)步驟:步驟:n確定基因表達(dá)的數(shù)據(jù)確定基因表達(dá)的數(shù)據(jù)n計(jì)算類似性矩陣,各個(gè)矩陣元素代計(jì)算類似性

10、矩陣,各個(gè)矩陣元素代表兩個(gè)基因的表達(dá)能否類似表兩個(gè)基因的表達(dá)能否類似n選擇算法進(jìn)展聚類分析選擇算法進(jìn)展聚類分析n顯示分析結(jié)果。顯示分析結(jié)果。n對(duì)數(shù)據(jù)進(jìn)展聚類分析之前,必需將包含在基因表對(duì)數(shù)據(jù)進(jìn)展聚類分析之前,必需將包含在基因表達(dá)矩陣中的數(shù)據(jù)進(jìn)展類似程度分析,并且對(duì)分析達(dá)矩陣中的數(shù)據(jù)進(jìn)展類似程度分析,并且對(duì)分析結(jié)果進(jìn)展量化。結(jié)果進(jìn)展量化。 n通常情況下,類似往往被賦于一個(gè)較大的量化的通常情況下,類似往往被賦于一個(gè)較大的量化的值,而不類似那么由一個(gè)較小的量化的值來表示。值,而不類似那么由一個(gè)較小的量化的值來表示。n在實(shí)踐計(jì)算中,往往以間隔替代類似的概念,類在實(shí)踐計(jì)算中,往往以間隔替代類似的概念,類

11、似性度量被轉(zhuǎn)化為兩個(gè)基因表達(dá)方式之間的間隔。似性度量被轉(zhuǎn)化為兩個(gè)基因表達(dá)方式之間的間隔。間隔越小,表達(dá)方式越相近,反之,那么表達(dá)方間隔越小,表達(dá)方式越相近,反之,那么表達(dá)方式差別大。式差別大。兩個(gè)表達(dá)方式之間的關(guān)系(a) 類似(b) 變化趨勢(shì)一致(c) 兩個(gè)基因的調(diào)控結(jié)果不一樣或甚至相反聚類分析的目的n可誘導(dǎo)基因是共表達(dá)的 n許多構(gòu)成性表達(dá)的基因不受調(diào)理n根據(jù)表達(dá)類似形陳列基因n功能類似的基因被聚為不同的類n可以提示細(xì)胞的生理形狀n可以協(xié)助研討未知基因的功能聚類結(jié)果顯示聚類結(jié)果顯示: Cluster, Cluster viewer二二. 基因調(diào)控網(wǎng)絡(luò)分析基因調(diào)控網(wǎng)絡(luò)分析2.1 基 本 理 論定

12、義n一個(gè)基因網(wǎng)絡(luò)一個(gè)基因網(wǎng)絡(luò)(pathway)由一組生物分子如基由一組生物分子如基因、蛋白質(zhì)以及它們之間的相互作用構(gòu)成,這因、蛋白質(zhì)以及它們之間的相互作用構(gòu)成,這些生物分子共同完成一些特定的細(xì)胞功能義務(wù)些生物分子共同完成一些特定的細(xì)胞功能義務(wù)n在實(shí)踐分析過程中,往往以圖這種數(shù)據(jù)構(gòu)造表示在實(shí)踐分析過程中,往往以圖這種數(shù)據(jù)構(gòu)造表示基因網(wǎng)絡(luò),圖中的節(jié)點(diǎn)代表基因或者蛋白質(zhì),而基因網(wǎng)絡(luò),圖中的節(jié)點(diǎn)代表基因或者蛋白質(zhì),而節(jié)點(diǎn)之間的連線代表基因、蛋白質(zhì)之間的相互作節(jié)點(diǎn)之間的連線代表基因、蛋白質(zhì)之間的相互作用?;蚓W(wǎng)絡(luò)描畫了特定細(xì)胞或組織中的功能途用?;蚓W(wǎng)絡(luò)描畫了特定細(xì)胞或組織中的功能途徑,如代謝、基因調(diào)控

13、,信號(hào)傳導(dǎo)等。徑,如代謝、基因調(diào)控,信號(hào)傳導(dǎo)等。原理n基因表達(dá)實(shí)踐上是細(xì)胞、組織、器官受遺傳和環(huán)基因表達(dá)實(shí)踐上是細(xì)胞、組織、器官受遺傳和環(huán)境影響的結(jié)果。境影響的結(jié)果。n一個(gè)基因的轉(zhuǎn)錄和表達(dá)由細(xì)胞的生化形狀所決議,一個(gè)基因的轉(zhuǎn)錄和表達(dá)由細(xì)胞的生化形狀所決議,在一個(gè)基因的轉(zhuǎn)錄過程中,一組轉(zhuǎn)錄因子作用于在一個(gè)基因的轉(zhuǎn)錄過程中,一組轉(zhuǎn)錄因子作用于該基因的啟動(dòng)子區(qū)域,控制該基因轉(zhuǎn)錄,而這些該基因的啟動(dòng)子區(qū)域,控制該基因轉(zhuǎn)錄,而這些轉(zhuǎn)錄因子本身又是其它基因的產(chǎn)物。轉(zhuǎn)錄因子本身又是其它基因的產(chǎn)物。n當(dāng)一個(gè)基因經(jīng)過轉(zhuǎn)錄、翻譯形勝利能基因產(chǎn)物后,當(dāng)一個(gè)基因經(jīng)過轉(zhuǎn)錄、翻譯形勝利能基因產(chǎn)物后,它將改動(dòng)細(xì)胞的生化形狀

14、,從而直接或間接地影它將改動(dòng)細(xì)胞的生化形狀,從而直接或間接地影響其它基因的表達(dá),甚至影響本身的表達(dá)。多個(gè)響其它基因的表達(dá),甚至影響本身的表達(dá)。多個(gè)基因的表達(dá)不斷變化,使得細(xì)胞的生化形狀不斷基因的表達(dá)不斷變化,使得細(xì)胞的生化形狀不斷地變化。地變化。n一個(gè)基因的表達(dá)受其它基因的影響,而這一個(gè)基因的表達(dá)受其它基因的影響,而這個(gè)基因又會(huì)影響其它基因的表達(dá),這種相個(gè)基因又會(huì)影響其它基因的表達(dá),這種相互影響、相互制約關(guān)系構(gòu)成了復(fù)雜的基因互影響、相互制約關(guān)系構(gòu)成了復(fù)雜的基因表達(dá)調(diào)控網(wǎng)絡(luò)。表達(dá)調(diào)控網(wǎng)絡(luò)。 n基因表達(dá)數(shù)據(jù)之中隱含基因之間的相互作基因表達(dá)數(shù)據(jù)之中隱含基因之間的相互作用關(guān)系,因此可以經(jīng)過分析基因表達(dá)

15、數(shù)據(jù),用關(guān)系,因此可以經(jīng)過分析基因表達(dá)數(shù)據(jù),構(gòu)建基因調(diào)控網(wǎng)絡(luò)構(gòu)建基因調(diào)控網(wǎng)絡(luò)運(yùn)用nBetter understand the physiology of the organismnPredict the effect of a drug Predict the weaknesses or side effects of a drugnPredict good or bad drug combinationsnUnderstand disease processesnGene function assignmentnMake a “perfect simulation of cellularnf

16、unction to use as an experimental modelnMany tools “feed into this understanding including microarrays2.2 pathway 數(shù)據(jù)庫引見Pathway 數(shù)據(jù)庫nGOnKEGGnGENMAPPnBIACARTAnGeneNetn細(xì)胞因子網(wǎng)絡(luò)數(shù)據(jù)庫n自在基信號(hào)數(shù)據(jù)庫關(guān)于GOnGO(gene ontology)是基因本體論結(jié)合會(huì)(Gene Ontology Consortium)所建立的數(shù)據(jù)庫,旨在建立一個(gè)適用于各種物種的,對(duì)基因和蛋白功能進(jìn)展限定和描畫的,并隨著研討的不斷深化而更新的言語詞匯規(guī)范。

17、GO是多種生物學(xué)本體論言語中的一種,提供了三層構(gòu)造的系統(tǒng)定義方式,用于描畫基因產(chǎn)物的功能。nGO可以被用來在小鼠基因組中查詢和信號(hào)轉(zhuǎn)導(dǎo)相關(guān)的基因產(chǎn)物nGO開展了具有三級(jí)構(gòu)造的規(guī)范言語ontologies。根據(jù)基因產(chǎn)物的相關(guān)分子功能,生物學(xué)途徑,細(xì)胞學(xué)組件而給予定義,無物種相關(guān)性。關(guān)于KEGGnKEGG (Kyoto Encyclopedia of Genes and Genomes) 京都大學(xué)基因和基因組百科全書數(shù)據(jù)庫京都大學(xué)基因和基因組百科全書數(shù)據(jù)庫nKEGG 是系統(tǒng)分析基因功能的數(shù)據(jù)庫,將基因組的信息是系統(tǒng)分析基因功能的數(shù)據(jù)庫,將基因組的信息與基因功能聯(lián)絡(luò)起來,旨在提示生命景象的遺傳與化學(xué)

18、藍(lán)與基因功能聯(lián)絡(luò)起來,旨在提示生命景象的遺傳與化學(xué)藍(lán)圖圖數(shù)據(jù)庫KEGG PATHWAY DatabaseKEGG GENES DatabaseKEGG LIGAND Database用途搜索pathway, 產(chǎn)生能夠的反響途徑搜索類似的基因序列搜索類似的基因組序列搜索類似的復(fù)合物構(gòu)造,類似的多糖構(gòu)造及類似的反響類別通路信息基因組信息化學(xué)信息KEGG中的通路分為五大類:1 新陳代謝通路2 遺傳信息處置通路3 環(huán)境信息處置通路4 細(xì)胞內(nèi)通路5 人類病癥相關(guān)通路PATHWAY提供所選定通路的參考資料、涉及的反響和在其他生物中的通路情況。由GIF等平板文件類型圖示,方框顯示為涉及的酶EC稱號(hào),圓滑框?yàn)?/p>

19、反響類型,以實(shí)線和箭頭銜接反響物和方向,虛線指向預(yù)測(cè)的反響類型。關(guān)于GenMappnGemapp (GenMAPP.org) nGenMAPP 是一個(gè)以學(xué)術(shù)研討為根底的科學(xué)團(tuán)體,提供100個(gè)以上的通路圖. Silicon Genetics公司曾經(jīng)和 GenMAPP組織達(dá)成了協(xié)議 ,把這些通路整合到了 GeneSpring的通路庫. 利用 GeneSpring分析的基因芯片數(shù)據(jù)可以用 GenMAPP的通路可視化,使研討者研討某些基因在通路中的作用.關(guān)于BioCartanBioCarta:“Carta中文意思是地圖,BioCarta 即用圖形來描畫生物相關(guān)知識(shí),構(gòu)成生物學(xué)家所熟習(xí)的生化調(diào)控通路(b

20、iochemical pathways)。nBioCarta 公司為客戶免費(fèi)提供通路繪制軟件,讓他們根據(jù)本人的研討領(lǐng)域發(fā)表通路,建成數(shù)據(jù)庫,通路中的蛋白都是按照HUGO的規(guī)范建立的.nBioCarta已搜集各物種共大約120,000基因及個(gè)調(diào)控通路,數(shù)據(jù)庫載不斷添加,其信號(hào)傳導(dǎo)通路(signal transduction pathways)是當(dāng)前最全的.GeneNetn真核生物生理過程的調(diào)控網(wǎng)絡(luò)(GeneNet)nGeneNet展現(xiàn)了協(xié)調(diào)方式下基因的整體功能,良好的調(diào)控功能和對(duì)外界刺激的反響。該基因網(wǎng)具有以下根本功能:n(a) 描畫執(zhí)行特定生物功能時(shí)所涉及到的整體基因交互作用n(b) 描畫基因

21、的蛋白質(zhì)編碼n(c) 描畫基因?qū)ν饨绱碳さ膫鞲型緩絥(d) 經(jīng)過一組反響自動(dòng)地穩(wěn)定網(wǎng)絡(luò)參數(shù)或者使網(wǎng)絡(luò)轉(zhuǎn)換到新的功能形狀n(e) 利用外部信號(hào)、激素和代謝產(chǎn)物作為生理學(xué)參數(shù)激發(fā)基因網(wǎng)糾正其作用n該基因網(wǎng)描畫了四類實(shí)體:n (a) 細(xì)胞(組織,器官)n (b) 蛋白質(zhì)n (c) 基因n (d) 物質(zhì)n該基因網(wǎng)還描畫了實(shí)體間兩種關(guān)系:n(a) 反響reaction, 即經(jīng)過交互作用產(chǎn)生新的實(shí)體或過程n(b) 調(diào)控regulatory事件, 特定反響對(duì)實(shí)體的作用。 2.3 功能富集分析功能富集分析定義n功能富集分析(Functional Enrichment Analysis)又稱功能聚類分析,借助于

22、各種生物學(xué)信息數(shù)據(jù)庫如GO , KEGG, GENMAPP, BIACARTA, TRANSFAC, OMIM和分析工具如MAPPFinder, ArrayXPath進(jìn)展統(tǒng)計(jì)分析,發(fā)掘同差別表達(dá)或共表達(dá)這組感興趣基因具有顯 著差別的功能類別。n功能富集分析的統(tǒng)計(jì)原理是用超幾何分布型來檢驗(yàn)一組基 因共表達(dá)或差別表達(dá)中某個(gè)功能類的顯著性,并結(jié)合 多重假設(shè)檢驗(yàn)判別思想選擇同這組基因顯著相關(guān)功能類別MAPPFindernMAPPFinder is a tool that creates a global gene-expression profile across all areas of biolo

23、gy by integrating the annotations of the Gene Ontology (GO) Project with the free software package nGenMAPP GenMAPP.org. 可以整合GO定義,產(chǎn)生整體的基因表達(dá)譜. 輸出可以搜索的閱讀器,協(xié)助用戶快速識(shí)別代表性的差別表達(dá)基因在GO的定義。任務(wù)方式Z值得計(jì)算GOminernGominer:最初Version在算法上雖亞于GenMAPP, 在再建立可視關(guān)系上(tree-like structure 和directed acyclic graph)有其獨(dú)特之處.n今年對(duì)Origina

24、l Version進(jìn)展較大改良,不僅可以富集significant GO categories, 還可以同時(shí)對(duì)多套芯片實(shí)驗(yàn)數(shù)據(jù)批量分析,控制假發(fā)現(xiàn)率FDR, 還整合轉(zhuǎn)錄因子結(jié)合位點(diǎn)信息.綜合而言, 尤其適宜TIME-COURSE功能富集分析n需求建立當(dāng)?shù)豈ysql數(shù)據(jù)庫,建立JDB數(shù)據(jù)源 Pathway ExplorernPathwayExplorer:provides comprehensive and easily accessible representations of expression profiles onto major regulatory, metabolic and c

25、ellular pathways. The integrated pathway resources include KEGG, BioCarta and GenMAPP.nLocusLink was again used as root identifier. The LocusLinks are linked with the user-defined gene identifier groups (UniGene, GeneOntology, GenBank and/or RefSeq), which are used then to align the mapped gene IDs.

26、nhttpspathwayexplorer.genome.tugraz.atArrayXPathna web-based service for mapping and visualizing microarray gene-expression data for integrated biological pathway resources nWhen one inputs gene-expression clusters, ArrayXPath produces a list of the best matching pathways for each cluster napplied Fishers exact

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論