淺談生物醫(yī)學(xué)大數(shù)據(jù)及其應(yīng)用課件_第1頁(yè)
淺談生物醫(yī)學(xué)大數(shù)據(jù)及其應(yīng)用課件_第2頁(yè)
淺談生物醫(yī)學(xué)大數(shù)據(jù)及其應(yīng)用課件_第3頁(yè)
淺談生物醫(yī)學(xué)大數(shù)據(jù)及其應(yīng)用課件_第4頁(yè)
淺談生物醫(yī)學(xué)大數(shù)據(jù)及其應(yīng)用課件_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、淺談生物醫(yī)學(xué)大數(shù)據(jù)及其應(yīng)用基于組學(xué)數(shù)據(jù)的因果推斷與疾病預(yù)后概述整合策略及方法實(shí)例分析討論概述實(shí)例分析討論整合策略及方法生物(健康)數(shù)據(jù)之特點(diǎn)優(yōu)點(diǎn):質(zhì)量高、精確性好缺點(diǎn):?jiǎn)蝹€(gè)變量效應(yīng)微弱變量間關(guān)系復(fù)雜實(shí)時(shí)采集數(shù)據(jù)實(shí)時(shí)分析數(shù)據(jù)實(shí)時(shí)結(jié)局預(yù)警單個(gè)數(shù)據(jù)集分析的局限性從樣本的角度(縱向)樣本量有限多重性校正力度大。從指標(biāo)的角度(橫向)不全面容易遺漏重要的預(yù)測(cè)因素。把握度不高預(yù)測(cè)效果不理想Cell, 2014Big Data, being pooled48 GWAS + Validation sets339,224 individualsBig Data, being pooled11 GWAS + 41

2、custom array studies21594 cases vs. 54156 controlsBig Data, being Bigger基線 多態(tài)性拷貝數(shù)甲基化 轉(zhuǎn)錄組 蛋白組 代謝組樣本外周血組織單細(xì)胞細(xì)胞株微生物群樣本類型 樣本數(shù)量 數(shù)據(jù)種類 離散程度 實(shí)時(shí)健康數(shù)據(jù)Big Data, being Integrated概述整合策略及方法實(shí)例分析討論How to deal with.基線 多態(tài)性拷貝數(shù)甲基化 轉(zhuǎn)錄組 蛋白組 代謝組樣本BloodTissueSingle CellCell lineMicrobiomeCaCaCaCaCaCaCaCaCaCaCaCaCaCablock mi

3、ssing disaster多組學(xué)數(shù)據(jù)整合雙重雙向填補(bǔ)法整合數(shù)據(jù),“盤(pán)活”已有數(shù)據(jù), 提高數(shù)據(jù)的“完整性”,達(dá)到充分利用的目的。 Nature Biotechnology,2015塊狀缺失數(shù)據(jù)填補(bǔ)要求:快!盡可能維持方差/協(xié)方差結(jié)構(gòu)不變傳統(tǒng)方法:均值填補(bǔ),MCMC填補(bǔ)機(jī)器學(xué)習(xí)方法: Multi-layer perceptron(多層感知機(jī),MLP)KNN填補(bǔ)Bridging by COVListwise deletion(LD)只利用#7#12號(hào)記錄Pairwise deletion(PD)計(jì)算方差協(xié)方差矩陣時(shí)只考慮兩個(gè)變量間的缺失消去變換法obsX1X2X3X4X5Y1xxx2xxx3xxx

4、4xxx5xxx6xxx789101112S12S1,2S22S1,3S2,3S32S1,4S2,4S3,4S42S1,5S2,5S3,5S4,5S52高維數(shù)據(jù)快速初篩序貫Bayes精細(xì)整合、三次篩選( Bayes )隨機(jī)森林重要性排序、再次篩選( Random forest )加權(quán)迭代熵初步整合、快速篩選( Iterated Entropy )10萬(wàn)100萬(wàn)ERB篩選法Journal CoverCancer Discovery (IF=19). 11 February 2014Journal CoverCancer Cell (IF=23). 11 February 2013Borrow i

5、nformation from human bodyBiological network analysis多組學(xué)聯(lián)合篩檢中的效應(yīng)分解中介分析(Mediation analysis)Baron&Kenny,1986Tyler VanderWeele, 2010PMID:25000145Google Scholar, cited 5wWeb of Science, cited 2wExposureMediatorOutcomedirect effectdirect causal effectall unexplainable effect 概述整合策略及方法實(shí)例分析討論實(shí)例1:基于組學(xué)數(shù)據(jù)的因果推

6、斷genetic variationPLT ARDS患病風(fēng)險(xiǎn)Wei Y, Chen F, et al. Chest 2015. IF 7.483實(shí)例2:基于組學(xué)數(shù)據(jù)的因果推斷genetic variationPLT ARDS預(yù)后Wei Y, Chen F, et al. AJRCCM 2016. IF 13.118實(shí)例3:基于組學(xué)數(shù)據(jù)的因果推斷環(huán)境砷暴露擾亂臍帶血代謝 低出生體重M1+M2+M3Birth weightCord blood arsenic levelCord blood laurate (12:0) (M1)r=0.42, =0.29, p=0.0211r=0.38, =0.3

7、6, p=0.0095r=0.31, =0.22, p=0.0296r=-0.13, =-61.93, p=0.0236r=-0.27, =-51.57, p=0.0350r=-0.19, =-57.56, p=0.0207Cord blood 17-methylstearate (M2)Cord blood 4-vinylphenol sulfate (M3), p=0.0036Direct effect=-9.40, 95%CI=(-76.66, 59.08), p=0.7832, p=0.0014Indirect effect = -18.08, 95%CI=(-40.35, -2.55

8、), p=0.0128Wei Y, Chen F. J Expo Sci Env Epi 2016. IF 3.141概述整合策略及方法實(shí)例分析討論討論統(tǒng)計(jì)學(xué)知識(shí)+生物學(xué)先驗(yàn)老數(shù)據(jù)玩出新花樣多樣化健康數(shù)據(jù)實(shí)時(shí)采集更精確的統(tǒng)計(jì)建模/預(yù)測(cè) 用數(shù)據(jù)指導(dǎo)更健康生活宏觀健康數(shù)據(jù)+微觀數(shù)據(jù)精細(xì)分析、干預(yù)切入點(diǎn)因果推斷方法為后續(xù)功能實(shí)驗(yàn)提供更充分的依據(jù)任何數(shù)據(jù)都是有價(jià)值的!就看怎么利用!怎么解釋!討論大數(shù)據(jù)思維數(shù)據(jù)量大 大數(shù)據(jù)。大數(shù)據(jù)就是全數(shù)據(jù);大數(shù)據(jù)思維就是全局思維;大數(shù)據(jù)分析就是利用一切有用信息尋找事物內(nèi)部的客觀規(guī)律。何謂大數(shù)據(jù)?中國(guó)北緯46度至48度既往初步勘探數(shù)據(jù)哈爾濱到齊齊哈爾之間機(jī)器類型推測(cè)油井直徑/深度井架密度推測(cè)產(chǎn)量日本公司招標(biāo)獲勝毫無(wú)懸鏈!高價(jià)推銷煉油設(shè)施!或許,我們?nèi)钡牟皇菙?shù)據(jù)。是缺少一雙發(fā)現(xiàn)美的慧眼!Team:Feng

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論