版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
李曦副教授中南大學湘雅醫(yī)院臨床藥理研究所公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦副教授公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法1NatureReviewsGenetics
16,
85–97
(2015)NatureReviewsGenetics
16,
852什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。3為什么要學習數(shù)據(jù)挖掘把握自己的命運最大化利用已有數(shù)據(jù)尋找新的課題為什么要學習數(shù)據(jù)挖掘把握自己的命運4數(shù)據(jù)挖掘的步驟數(shù)據(jù)挖掘的步驟5生物醫(yī)學研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成數(shù)據(jù)挖掘表型的確定數(shù)據(jù)的選擇數(shù)據(jù)挖掘結果的解讀生物醫(yī)學研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成6生物醫(yī)學數(shù)據(jù)挖掘所需技能必備技能:基本的生物信息學知識各種數(shù)據(jù)庫的使用、數(shù)據(jù)庫信息的解讀基本的生物統(tǒng)計學知識分析方法的選擇,分析軟件的使用可選技能:R語言的基本操作R包的使用Linux系統(tǒng)的基本操作生物信息學分析軟件的使用生物醫(yī)學數(shù)據(jù)挖掘所需技能必備技能:7基因組表達譜數(shù)據(jù)挖掘流程確定研究策略獲取表達譜數(shù)據(jù)處理表達譜數(shù)據(jù)統(tǒng)計分析驗證分析基因組表達譜數(shù)據(jù)挖掘流程確定研究策略8數(shù)據(jù)挖掘案例數(shù)據(jù)挖掘案例9分析策略核心思路:影響腦膠質瘤發(fā)生發(fā)展的基因可能影響腦膠質瘤的預后分析流程:獲取包含腦膠質瘤組織和正常腦組織的全基因組表達數(shù)據(jù)的多個數(shù)據(jù)集鑒定在腦膠質瘤組織和正常腦組織中差異表達的基因在自己收集的樣本中驗證這些基因分析這些基因與腫瘤分級以及總生存期之間的關系分析策略核心思路:10公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件11公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件12公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件13公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件14公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件15策略舉例影響阿糖胞苷藥物敏感性的基因可能影響AML預后。影響鉑類藥物敏感性的基因可能影響多種腫瘤的預后。在高低腫瘤分級中存在差異的基因可能影響癌癥預后。……策略舉例影響阿糖胞苷藥物敏感性的基因可能影響AML預后。16研究策略如何確定研究策略可以千變萬化研究策略決定了論文的上限應根據(jù)自身專業(yè)選擇有意義的研究策略研究策略如何確定研究策略可以千變萬化17包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫18GEO數(shù)據(jù)庫關鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的概述Datasets:見GDS和GSE。GSM:單個樣本的實驗數(shù)據(jù)GDS:數(shù)據(jù)庫整理好的關于某個話題的GSM集合。一個GDS中的所有GSM為同一平臺。GSE:一個實驗項目中的多個GSM合集,可能使用多個平臺。GPL:芯片平臺,如Affymetrix,Agilent等。GEO數(shù)據(jù)庫關鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的19公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件20Profile示例實驗描述實驗結果展示Profile示例實驗描述實驗結果展示21Value:歸一化的相對表達量Rank:探針表達值在所有表達值中的排名的百分比。Rank越高,表達越高。Value:歸一化的相對表達量22Datasets示例Datasets示例23公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件24公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件25芯片介紹芯片介紹26芯片注釋文件芯片注釋文件27樣本描述樣本描述28公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件29公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件30公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件31公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件32公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件33Limma法分析的TOP250結果Limma法分析的TOP250結果34公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件35公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件36公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件37https://paolo.shinyapps.io/ShinyVolcanoPlot/https://paolo.shinyapps.io/Shi38韋恩圖http://bioinformatics.psb.ugent.be/webtools/Venn/韋恩圖http://bioinformatics.psb.u39公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件40通路分析/通路分析/41公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件42公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件43公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件44公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件45生存分析驗證Survexpresshttp://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jspKMPlotter/analysis//生存分析驗證Survexpress46輸入基因名輸入基因名47公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件48選擇分析表型選擇分析表型49公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件50公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件51公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件52公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件53公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件54GEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件SPSSGraphadRGEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件55Kaplan-Meier法單因素生存分析分類變量做生存曲線圖Cox回歸模型單因素或多因素生存分析分類或連續(xù)變量計算HR和95%CI生存分析Kaplan-Meier法生存分析56公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件57公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件58P值HRP值HR59公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件60公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件61公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件62公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件63雙擊彈出雙擊彈出64公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件65公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件66謝謝!腫瘤靶向藥物的個體化治療謝謝!腫瘤靶向藥物的個體化治療67數(shù)量性狀連續(xù)變量,如:身高、體重、藥物劑量等質量性狀分類變量,如:性別、療效、等級等其他類型性狀時間依賴性變量,如:生存期,中位生存時間等
研究表型數(shù)量性狀研究表型68參數(shù)檢驗(符合正態(tài)分布時)T檢驗(獨立樣本或配對樣本):兩樣本均數(shù)比較方差分析:兩個以上樣本均數(shù)比較線性回歸分析:多個因素對因變量的影響
非參數(shù)檢驗(不符合正態(tài)分布時)Mann-WhitneyU檢測:兩獨立樣本Kolmogorov-Smirnov檢測:兩獨立樣本McNemar檢驗:配對樣本Kruskal-Wallis檢驗:多獨立樣本數(shù)量性狀常用統(tǒng)計分析方法參數(shù)檢驗(符合正態(tài)分布時)數(shù)量性狀常用統(tǒng)計分析方法69卡方檢驗:單因素對因變量的影響邏輯回歸:多個因素對因變量的影響質量性狀常用統(tǒng)計分析方法A:期望值>5且樣本量>40,用Pearson卡方。
B:1<期望值<5且樣本量>40,用連續(xù)校正。(僅用于四格表資料)
C:期望值<5或樣本量≤40,用Fisher精確檢驗。卡方檢驗:單因素對因變量的影響質量性狀常用統(tǒng)計分析方法A:期70還有問題解決不了怎么辦?還有問題解決不了怎么辦?71加入達人學社QQ群(加群請注明信息:單位+專業(yè)+姓名,每人限加一個群)33405037、491043563496353730、496740737496974932、273757394大神幫你解決高難文獻群內共享資源資源獲取技術教學視頻同行分享交流(主要為生物、醫(yī)學、化學專業(yè))加入達人學社QQ群大神幫你解決高難文獻72請關注達人學社微信公眾號甲骨文技術負責人微信號請注明個人信息:單位、專業(yè)、姓名張常昕夏艷東請關注達人學社微信公眾號甲骨文技術負責人微信號請注明個人信息73講座主辦單位達人學社湖南甲骨文生物醫(yī)藥有限公司講座主辦單位74李曦副教授中南大學湘雅醫(yī)院臨床藥理研究所公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦副教授公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法75NatureReviewsGenetics
16,
85–97
(2015)NatureReviewsGenetics
16,
8576什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學規(guī)律。77為什么要學習數(shù)據(jù)挖掘把握自己的命運最大化利用已有數(shù)據(jù)尋找新的課題為什么要學習數(shù)據(jù)挖掘把握自己的命運78數(shù)據(jù)挖掘的步驟數(shù)據(jù)挖掘的步驟79生物醫(yī)學研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成數(shù)據(jù)挖掘表型的確定數(shù)據(jù)的選擇數(shù)據(jù)挖掘結果的解讀生物醫(yī)學研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成80生物醫(yī)學數(shù)據(jù)挖掘所需技能必備技能:基本的生物信息學知識各種數(shù)據(jù)庫的使用、數(shù)據(jù)庫信息的解讀基本的生物統(tǒng)計學知識分析方法的選擇,分析軟件的使用可選技能:R語言的基本操作R包的使用Linux系統(tǒng)的基本操作生物信息學分析軟件的使用生物醫(yī)學數(shù)據(jù)挖掘所需技能必備技能:81基因組表達譜數(shù)據(jù)挖掘流程確定研究策略獲取表達譜數(shù)據(jù)處理表達譜數(shù)據(jù)統(tǒng)計分析驗證分析基因組表達譜數(shù)據(jù)挖掘流程確定研究策略82數(shù)據(jù)挖掘案例數(shù)據(jù)挖掘案例83分析策略核心思路:影響腦膠質瘤發(fā)生發(fā)展的基因可能影響腦膠質瘤的預后分析流程:獲取包含腦膠質瘤組織和正常腦組織的全基因組表達數(shù)據(jù)的多個數(shù)據(jù)集鑒定在腦膠質瘤組織和正常腦組織中差異表達的基因在自己收集的樣本中驗證這些基因分析這些基因與腫瘤分級以及總生存期之間的關系分析策略核心思路:84公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件85公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件86公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件87公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件88公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件89策略舉例影響阿糖胞苷藥物敏感性的基因可能影響AML預后。影響鉑類藥物敏感性的基因可能影響多種腫瘤的預后。在高低腫瘤分級中存在差異的基因可能影響癌癥預后?!呗耘e例影響阿糖胞苷藥物敏感性的基因可能影響AML預后。90研究策略如何確定研究策略可以千變萬化研究策略決定了論文的上限應根據(jù)自身專業(yè)選擇有意義的研究策略研究策略如何確定研究策略可以千變萬化91包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫92GEO數(shù)據(jù)庫關鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的概述Datasets:見GDS和GSE。GSM:單個樣本的實驗數(shù)據(jù)GDS:數(shù)據(jù)庫整理好的關于某個話題的GSM集合。一個GDS中的所有GSM為同一平臺。GSE:一個實驗項目中的多個GSM合集,可能使用多個平臺。GPL:芯片平臺,如Affymetrix,Agilent等。GEO數(shù)據(jù)庫關鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的93公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件94Profile示例實驗描述實驗結果展示Profile示例實驗描述實驗結果展示95Value:歸一化的相對表達量Rank:探針表達值在所有表達值中的排名的百分比。Rank越高,表達越高。Value:歸一化的相對表達量96Datasets示例Datasets示例97公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件98公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件99芯片介紹芯片介紹100芯片注釋文件芯片注釋文件101樣本描述樣本描述102公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件103公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件104公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件105公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件106公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件107Limma法分析的TOP250結果Limma法分析的TOP250結果108公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件109公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件110公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件111https://paolo.shinyapps.io/ShinyVolcanoPlot/https://paolo.shinyapps.io/Shi112韋恩圖http://bioinformatics.psb.ugent.be/webtools/Venn/韋恩圖http://bioinformatics.psb.u113公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件114通路分析/通路分析/115公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件116公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件117公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件118公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件119生存分析驗證Survexpresshttp://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jspKMPlotter/analysis//生存分析驗證Survexpress120輸入基因名輸入基因名121公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件122選擇分析表型選擇分析表型123公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件124公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件125公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件126公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件127公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件128GEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件SPSSGraphadRGEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件129Kaplan-Meier法單因素生存分析分類變量做生存曲線圖Cox回歸模型單因素或多因素生存分析分類或連續(xù)變量計算HR和95%CI生存分析Kaplan-Meier法生存分析130公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件131公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件132P值HRP值HR133公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件134公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件135公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件136公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件137雙擊彈出雙擊彈出138公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件139公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件140謝謝!腫瘤靶向藥物的個體化治療謝謝!腫瘤靶向藥物的個體化治療141數(shù)量性狀連續(xù)變量,如:身高、體重、藥物劑量等質量性狀分類變量,如:性別、療效、等級等其他類型性狀時間依賴性變量,如:生存期,中位生存時間等
研究表型數(shù)量性狀研究表型142參數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版商業(yè)建筑外墻改造與拆除一體化服務合同3篇
- 2025版土地承包經營權轉包合同(含農業(yè)保險)2篇
- 二零二五版物流運輸保證合同印花稅繳納規(guī)定2篇
- 2025年度木材產業(yè)鏈上下游合作發(fā)展合同4篇
- 2025年寬帶網絡安全協(xié)約
- 2025年壓瘡預防護理服務合同
- 2025年委托招標合同
- 2025年卵巢囊腫手術協(xié)議
- 2025年度木材加工行業(yè)安全監(jiān)管合作協(xié)議3篇
- 2025年加盟運營推廣合作協(xié)議
- 眼的解剖結構與生理功能課件
- 小學網管的工作總結
- 2024年銀行考試-興業(yè)銀行筆試參考題庫含答案
- 泵站運行管理現(xiàn)狀改善措施
- 2024屆武漢市部分學校中考一模數(shù)學試題含解析
- SYT 0447-2014《 埋地鋼制管道環(huán)氧煤瀝青防腐層技術標準》
- 浙教版七年級下冊科學全冊課件
- 弧度制及弧度制與角度制的換算
- 瓦楞紙箱計算公式測量方法
- DB32-T 4004-2021水質 17種全氟化合物的測定 高效液相色譜串聯(lián)質譜法-(高清現(xiàn)行)
- DB15T 2724-2022 羊糞污收集處理技術規(guī)范
評論
0/150
提交評論