版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、李曦 副教授 中南大學湘雅醫(yī)院臨床藥理研究所 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略 及分析方法 1 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Nature Reviews Genetics 16, 8597 (2015) 2 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 什么是數(shù)據(jù)挖掘 從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。 3 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 為什么要學習數(shù)據(jù)挖掘 l把握自己的命運 l最大化利用已有數(shù)據(jù) l尋找新的課題 4 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達
2、人學社) 數(shù)據(jù)挖掘的步驟 5 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 生物醫(yī)學研究人員的優(yōu)勢 l數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成 l數(shù)據(jù)挖掘表型的確定 l數(shù)據(jù)的選擇 l數(shù)據(jù)挖掘結果的解讀 6 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 生物醫(yī)學數(shù)據(jù)挖掘所需技能 l必備技能必備技能: 基本的生物信息學知識 各種數(shù)據(jù)庫的使用、數(shù)據(jù)庫信息的解讀 基本的生物統(tǒng)計學知識 分析方法的選擇,分析軟件的使用 l可選技能:可選技能: R語言的基本操作 R包的使用 Linux系統(tǒng)的基本操作 生物信息學分析軟件的使用 7 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方
3、法李曦(達人學社) 基因組表達譜數(shù)據(jù)挖掘流程 l確定研究策略 l獲取表達譜數(shù)據(jù) l處理表達譜數(shù)據(jù) l統(tǒng)計分析 l驗證分析 8 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 數(shù)據(jù)挖掘案例 9 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 分析策略 l 核心思路: 影響腦膠質瘤發(fā)生發(fā)展的基因可能影響腦膠質瘤的預后 l 分析流程: 獲取包含腦膠質瘤組織和正常腦組織的全基因組表達數(shù)據(jù) 的多個數(shù)據(jù)集 鑒定在腦膠質瘤組織和正常腦組織中差異表達的基因 在自己收集的樣本中驗證這些基因 分析這些基因與腫瘤分級以及總生存期之間的關系 10 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分
4、 析方法李曦(達人學社) 11 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 12 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 13 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 14 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 15 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 策略舉例 l影響阿糖胞苷藥物敏感性的基因可能影響AML預后。 l影響鉑類藥物敏感性的基因可能影響多種腫瘤的預后。 l在高低腫瘤分級中存在差異的基因可能影響癌癥預后。 16 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(
5、達人學社) 研究策略如何確定 l研究策略可以千變萬化 l研究策略決定了論文的上限 l應根據(jù)自身專業(yè)選擇有意義的研究策略 17 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫 Gene Expression Omnibus (GEO) https:/ ArrayExpress https:/ The Cancer Genome Atlas (TCGA) / International Cancer Genome Consortium 18 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖
6、掘策略及分 析方法李曦(達人學社) GEO數(shù)據(jù)庫關鍵名詞 Profile:數(shù)據(jù)庫整理好的單個基因的概述 Datasets:見GDS和GSE。 GSM:單個樣本的實驗數(shù)據(jù) GDS:數(shù)據(jù)庫整理好的關于某個話題的GSM集合。一個GDS中 的所有GSM為同一平臺。 GSE:一個實驗項目中的多個GSM合集,可能使用多個平臺。 GPL:芯片平臺,如Affymetrix, Agilent等。 19 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 20 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Profile示例 實驗描述實驗結果展示 21 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘
7、策略及分 析方法李曦(達人學社) Value:歸一化的相對表達量 Rank:探針表達值在所有表 達值中的排名的百分比。 Rank越高,表達越高。 22 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Datasets示例 23 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 24 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 25 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 芯 片 介 紹 26 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 芯片注釋文件 27 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法
8、李曦(達人學社) 樣本描述 28 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 29 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 30 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 31 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 32 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 33 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Limma法分析的TOP250結果 34 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 35 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分
9、析方法李曦(達人學社) 36 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 37 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 38 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 韋恩圖 39 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 40 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 通路分析 41 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 42 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 43 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社)
10、 44 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 45 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 生存分析驗證 Survexpress http:/bioinformatica.mty.itesm.mx:8080/Biomatec/ SurvivaX.jsp KM Plotter 46 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 輸入基因名 47 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 48 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 選擇分析表型 49 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策
11、略及分 析方法李曦(達人學社) 50 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 51 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 52 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 53 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 54 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) GEO數(shù)據(jù)本機處理 統(tǒng)計分析+作圖軟件 SPSS Graphad R 55 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) Kaplan-Meier法 單因素生存分析 分類變量 做生存曲線圖 Cox回歸
12、模型 單因素或多因素生存分析 分類或連續(xù)變量 計算HR和95%CI 生存分析 56 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 57 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 58 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) P值HR 59 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 60 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 61 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 62 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 63 公用數(shù)據(jù)庫基因組
13、表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 雙擊彈出 64 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 65 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 66 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 謝謝!謝謝! 腫瘤靶向藥物的個體化治療腫瘤靶向藥物的個體化治療 67 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 數(shù)量性狀 連續(xù)變量,如:身高、體重、藥物劑量等 質量性狀 分類變量,如:性別、療效、等級等 其他類型性狀 時間依賴性變量,如:生存期,中位生存時間等 研究表型 68 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策
14、略及分 析方法李曦(達人學社) 參數(shù)檢驗(符合正態(tài)分布時) T檢驗(獨立樣本或配對樣本):兩樣本均數(shù)比較 方差分析:兩個以上樣本均數(shù)比較 線性回歸分析:多個因素對因變量的影響 非參數(shù)檢驗(不符合正態(tài)分布時) Mann-Whitney U 檢測:兩獨立樣本 Kolmogorov-Smirnov 檢測:兩獨立樣本 McNemar檢驗:配對樣本 Kruskal-Wallis檢驗:多獨立樣本 數(shù)量性狀常用統(tǒng)計分析方法 69 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 卡方檢驗:單因素對因變量的影響 邏輯回歸:多個因素對因變量的影響 質量性狀常用統(tǒng)計分析方法 A:期望值5且樣本量40
15、,用 Pearson卡方。 B:1期望值5且樣本量40,用連 續(xù)校正。(僅用于四格表資料) C:期望值5或樣本量40,用Fisher 精確檢驗。 70 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 還有問題解決不了怎么辦?還有問題解決不了怎么辦? 71 公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分 析方法李曦(達人學社) 加入達人學社加入達人學社QQ群群 (加群請注明信息:單位(加群請注明信息:單位+專業(yè)專業(yè)+姓名,每人限加一個群)姓名,每人限加一個群) 、491043563 496353730、496740737 496974932、273757394 大神幫你解決高難文獻大神幫你解決高難文獻 群內共享資源群內共享資源 資源獲取技術教學視頻資源獲取技術教學視頻 同行分享交流(主要為同行分享交流(主要為 生物、醫(yī)學、化學專業(yè))生物、醫(yī)學、化學專業(yè)) 72 公用數(shù)據(jù)庫基
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版電子產(chǎn)品銷售公司庫存管理外包合同范本
- 龍崗工廠設計裝修施工方案
- 2025版銷售經(jīng)理崗位招聘協(xié)議范例2篇
- 設備租金保障方案
- 2025版童裝新品研發(fā)與市場推廣合作協(xié)議3篇
- 二零二五年度高端住宅小區(qū)地下車庫車位租賃服務合同范本3篇
- 汽車團購活動方案
- 二零二五年度公共消防安全評估合同書3篇
- 路基支擋和防護施工方案
- 裝修施工安全協(xié)議書范本
- 2025-2030年中國減肥連鎖市場發(fā)展前景調研及投資戰(zhàn)略分析報告
- 寶鋼BQB 481-2023全工藝冷軋中頻無取向電工鋼帶文件
- 車輛定損情況確認書范本
- 玻璃反應釜安全操作及保養(yǎng)規(guī)程
- 高中英語新課標詞匯表(附詞組)
- 證券公司信用風險和操作風險管理理論和實踐中金公司
- 2022年高考湖南卷生物試題(含答案解析)
- GB/T 20909-2007鋼門窗
- GB/T 17854-1999埋弧焊用不銹鋼焊絲和焊劑
- GB/T 15593-2020輸血(液)器具用聚氯乙烯塑料
- 員工崗位能力評價標準
評論
0/150
提交評論