公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦(達人學社)課件_第1頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦(達人學社)課件_第2頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦(達人學社)課件_第3頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦(達人學社)課件_第4頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦(達人學社)課件_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、李曦 副教授 中南大學湘雅醫(yī)院臨床藥理研究所 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略 及分析方法 1 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Nature Reviews Genetics 16, 8597 (2015) 2 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 什么是數(shù)據(jù)挖掘 從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。 3 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 為什么要學習數(shù)據(jù)挖掘 l把握自己的命運 l最大化利用已有數(shù)據(jù) l尋找新的課題 4 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達

2、人學社) 數(shù)據(jù)挖掘的步驟 5 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 生物醫(yī)學研究人員的優(yōu)勢 l數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成 l數(shù)據(jù)挖掘表型的確定 l數(shù)據(jù)的選擇 l數(shù)據(jù)挖掘結果的解讀 6 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 生物醫(yī)學數(shù)據(jù)挖掘所需技能 l必備技能必備技能: 基本的生物信息學知識 各種數(shù)據(jù)庫的使用、數(shù)據(jù)庫信息的解讀 基本的生物統(tǒng)計學知識 分析方法的選擇,分析軟件的使用 l可選技能:可選技能: R語言的基本操作 R包的使用 Linux系統(tǒng)的基本操作 生物信息學分析軟件的使用 7 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方

3、法李曦(達人學社) 基因組表達譜數(shù)據(jù)挖掘流程 l確定研究策略 l獲取表達譜數(shù)據(jù) l處理表達譜數(shù)據(jù) l統(tǒng)計分析 l驗證分析 8 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 數(shù)據(jù)挖掘案例 9 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 分析策略 l 核心思路: 影響腦膠質瘤發(fā)生發(fā)展的基因可能影響腦膠質瘤的預后 l 分析流程: 獲取包含腦膠質瘤組織和正常腦組織的全基因組表達數(shù)據(jù) 的多個數(shù)據(jù)集 鑒定在腦膠質瘤組織和正常腦組織中差異表達的基因 在自己收集的樣本中驗證這些基因 分析這些基因與腫瘤分級以及總生存期之間的關系 10 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分

4、 析方法李曦(達人學社) 11 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 12 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 13 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 14 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 15 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 策略舉例 l影響阿糖胞苷藥物敏感性的基因可能影響AML預后。 l影響鉑類藥物敏感性的基因可能影響多種腫瘤的預后。 l在高低腫瘤分級中存在差異的基因可能影響癌癥預后。 16 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(

5、達人學社) 研究策略如何確定 l研究策略可以千變萬化 l研究策略決定了論文的上限 l應根據(jù)自身專業(yè)選擇有意義的研究策略 17 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫 Gene Expression Omnibus (GEO) https:/ ArrayExpress https:/ The Cancer Genome Atlas (TCGA) / International Cancer Genome Consortium 18 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖

6、掘策略及分 析方法李曦(達人學社) GEO數(shù)據(jù)庫關鍵名詞 Profile:數(shù)據(jù)庫整理好的單個基因的概述 Datasets:見GDS和GSE。 GSM:單個樣本的實驗數(shù)據(jù) GDS:數(shù)據(jù)庫整理好的關于某個話題的GSM集合。一個GDS中 的所有GSM為同一平臺。 GSE:一個實驗項目中的多個GSM合集,可能使用多個平臺。 GPL:芯片平臺,如Affymetrix, Agilent等。 19 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 20 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Profile示例 實驗描述實驗結果展示 21 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘

7、策略及分 析方法李曦(達人學社) Value:歸一化的相對表達量 Rank:探針表達值在所有表 達值中的排名的百分比。 Rank越高,表達越高。 22 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Datasets示例 23 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 24 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 25 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 芯 片 介 紹 26 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 芯片注釋文件 27 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法

8、李曦(達人學社) 樣本描述 28 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 29 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 30 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 31 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 32 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 33 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Limma法分析的TOP250結果 34 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 35 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分

9、析方法李曦(達人學社) 36 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 37 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 38 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 韋恩圖 39 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 40 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 通路分析 41 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 42 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 43 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社)

10、 44 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 45 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 生存分析驗證 Survexpress http:/bioinformatica.mty.itesm.mx:8080/Biomatec/ SurvivaX.jsp KM Plotter 46 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 輸入基因名 47 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 48 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 選擇分析表型 49 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策

11、略及分 析方法李曦(達人學社) 50 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 51 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 52 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 53 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 54 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) GEO數(shù)據(jù)本機處理 統(tǒng)計分析+作圖軟件 SPSS Graphad R 55 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Kaplan-Meier法 單因素生存分析 分類變量 做生存曲線圖 Cox回歸

12、模型 單因素或多因素生存分析 分類或連續(xù)變量 計算HR和95%CI 生存分析 56 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 57 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 58 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) P值HR 59 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 60 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 61 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 62 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 63 公用數(shù)據(jù)庫基因組

13、表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 雙擊彈出 64 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 65 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 66 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 謝謝!謝謝! 腫瘤靶向藥物的個體化治療腫瘤靶向藥物的個體化治療 67 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 數(shù)量性狀 連續(xù)變量,如:身高、體重、藥物劑量等 質量性狀 分類變量,如:性別、療效、等級等 其他類型性狀 時間依賴性變量,如:生存期,中位生存時間等 研究表型 68 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策

14、略及分 析方法李曦(達人學社) 參數(shù)檢驗(符合正態(tài)分布時) T檢驗(獨立樣本或配對樣本):兩樣本均數(shù)比較 方差分析:兩個以上樣本均數(shù)比較 線性回歸分析:多個因素對因變量的影響 非參數(shù)檢驗(不符合正態(tài)分布時) Mann-Whitney U 檢測:兩獨立樣本 Kolmogorov-Smirnov 檢測:兩獨立樣本 McNemar檢驗:配對樣本 Kruskal-Wallis檢驗:多獨立樣本 數(shù)量性狀常用統(tǒng)計分析方法 69 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 卡方檢驗:單因素對因變量的影響 邏輯回歸:多個因素對因變量的影響 質量性狀常用統(tǒng)計分析方法 A:期望值5且樣本量40

15、,用 Pearson卡方。 B:1期望值5且樣本量40,用連 續(xù)校正。(僅用于四格表資料) C:期望值5或樣本量40,用Fisher 精確檢驗。 70 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 還有問題解決不了怎么辦?還有問題解決不了怎么辦? 71 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 加入達人學社加入達人學社QQ群群 (加群請注明信息:單位(加群請注明信息:單位+專業(yè)專業(yè)+姓名,每人限加一個群)姓名,每人限加一個群) 、491043563 496353730、496740737 496974932、273757394 大神幫你解決高難文獻大神幫你解決高難文獻 群內共享資源群內共享資源 資源獲取技術教學視頻資源獲取技術教學視頻 同行分享交流(主要為同行分享交流(主要為 生物、醫(yī)學、化學專業(yè))生物、醫(yī)學、化學專業(yè)) 72 公用數(shù)據(jù)庫基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論