




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、淺談生物醫(yī)學(xué)大數(shù)據(jù)及其應(yīng)用基于組學(xué)數(shù)據(jù)的因果推斷與疾病預(yù)后概述整合策略及方法實(shí)例分析討論概述實(shí)例分析討論整合策略及方法生物(健康)數(shù)據(jù)之特點(diǎn)優(yōu)點(diǎn):質(zhì)量高、精確性好缺點(diǎn):?jiǎn)蝹€(gè)變量效應(yīng)微弱變量間關(guān)系復(fù)雜實(shí)時(shí)采集數(shù)據(jù)實(shí)時(shí)分析數(shù)據(jù)實(shí)時(shí)結(jié)局預(yù)警單個(gè)數(shù)據(jù)集分析的局限性從樣本的角度(縱向)樣本量有限多重性校正力度大。從指標(biāo)的角度(橫向)不全面容易遺漏重要的預(yù)測(cè)因素。把握度不高預(yù)測(cè)效果不理想Cell, 2014Big Data, being pooled48 GWAS + Validation sets339,224 individualsBig Data, being pooled11 GWAS + 41
2、custom array studies21594 cases vs. 54156 controlsBig Data, being Bigger基線 多態(tài)性拷貝數(shù)甲基化 轉(zhuǎn)錄組 蛋白組 代謝組樣本外周血組織單細(xì)胞細(xì)胞株微生物群樣本類型 樣本數(shù)量 數(shù)據(jù)種類 離散程度 實(shí)時(shí)健康數(shù)據(jù)Big Data, being Integrated概述整合策略及方法實(shí)例分析討論How to deal with.基線 多態(tài)性拷貝數(shù)甲基化 轉(zhuǎn)錄組 蛋白組 代謝組樣本BloodTissueSingle CellCell lineMicrobiomeCaCaCaCaCaCaCaCaCaCaCaCaCaCablock mi
3、ssing disaster多組學(xué)數(shù)據(jù)整合雙重雙向填補(bǔ)法整合數(shù)據(jù),“盤(pán)活”已有數(shù)據(jù), 提高數(shù)據(jù)的“完整性”,達(dá)到充分利用的目的。 Nature Biotechnology,2015塊狀缺失數(shù)據(jù)填補(bǔ)要求:快!盡可能維持方差/協(xié)方差結(jié)構(gòu)不變傳統(tǒng)方法:均值填補(bǔ),MCMC填補(bǔ)機(jī)器學(xué)習(xí)方法: Multi-layer perceptron(多層感知機(jī),MLP)KNN填補(bǔ)Bridging by COVListwise deletion(LD)只利用#7#12號(hào)記錄Pairwise deletion(PD)計(jì)算方差協(xié)方差矩陣時(shí)只考慮兩個(gè)變量間的缺失消去變換法obsX1X2X3X4X5Y1xxx2xxx3xxx
4、4xxx5xxx6xxx789101112S12S1,2S22S1,3S2,3S32S1,4S2,4S3,4S42S1,5S2,5S3,5S4,5S52高維數(shù)據(jù)快速初篩序貫Bayes精細(xì)整合、三次篩選( Bayes )隨機(jī)森林重要性排序、再次篩選( Random forest )加權(quán)迭代熵初步整合、快速篩選( Iterated Entropy )10萬(wàn)100萬(wàn)ERB篩選法Journal CoverCancer Discovery (IF=19). 11 February 2014Journal CoverCancer Cell (IF=23). 11 February 2013Borrow i
5、nformation from human bodyBiological network analysis多組學(xué)聯(lián)合篩檢中的效應(yīng)分解中介分析(Mediation analysis)Baron&Kenny,1986Tyler VanderWeele, 2010PMID:25000145Google Scholar, cited 5wWeb of Science, cited 2wExposureMediatorOutcomedirect effectdirect causal effectall unexplainable effect 概述整合策略及方法實(shí)例分析討論實(shí)例1:基于組學(xué)數(shù)據(jù)的因果推
6、斷genetic variationPLT ARDS患病風(fēng)險(xiǎn)Wei Y, Chen F, et al. Chest 2015. IF 7.483實(shí)例2:基于組學(xué)數(shù)據(jù)的因果推斷genetic variationPLT ARDS預(yù)后Wei Y, Chen F, et al. AJRCCM 2016. IF 13.118實(shí)例3:基于組學(xué)數(shù)據(jù)的因果推斷環(huán)境砷暴露擾亂臍帶血代謝 低出生體重M1+M2+M3Birth weightCord blood arsenic levelCord blood laurate (12:0) (M1)r=0.42, =0.29, p=0.0211r=0.38, =0.3
7、6, p=0.0095r=0.31, =0.22, p=0.0296r=-0.13, =-61.93, p=0.0236r=-0.27, =-51.57, p=0.0350r=-0.19, =-57.56, p=0.0207Cord blood 17-methylstearate (M2)Cord blood 4-vinylphenol sulfate (M3), p=0.0036Direct effect=-9.40, 95%CI=(-76.66, 59.08), p=0.7832, p=0.0014Indirect effect = -18.08, 95%CI=(-40.35, -2.55
8、), p=0.0128Wei Y, Chen F. J Expo Sci Env Epi 2016. IF 3.141概述整合策略及方法實(shí)例分析討論討論統(tǒng)計(jì)學(xué)知識(shí)+生物學(xué)先驗(yàn)老數(shù)據(jù)玩出新花樣多樣化健康數(shù)據(jù)實(shí)時(shí)采集更精確的統(tǒng)計(jì)建模/預(yù)測(cè) 用數(shù)據(jù)指導(dǎo)更健康生活宏觀健康數(shù)據(jù)+微觀數(shù)據(jù)精細(xì)分析、干預(yù)切入點(diǎn)因果推斷方法為后續(xù)功能實(shí)驗(yàn)提供更充分的依據(jù)任何數(shù)據(jù)都是有價(jià)值的!就看怎么利用!怎么解釋!討論大數(shù)據(jù)思維數(shù)據(jù)量大 大數(shù)據(jù)。大數(shù)據(jù)就是全數(shù)據(jù);大數(shù)據(jù)思維就是全局思維;大數(shù)據(jù)分析就是利用一切有用信息尋找事物內(nèi)部的客觀規(guī)律。何謂大數(shù)據(jù)?中國(guó)北緯46度至48度既往初步勘探數(shù)據(jù)哈爾濱到齊齊哈爾之間機(jī)器類型推測(cè)油井直徑/深度井架密度推測(cè)產(chǎn)量日本公司招標(biāo)獲勝毫無(wú)懸鏈!高價(jià)推銷煉油設(shè)施!或許,我們?nèi)钡牟皇菙?shù)據(jù)。是缺少一雙發(fā)現(xiàn)美的慧眼!Team:Feng
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)學(xué)-福建省莆田市2025屆高中畢業(yè)班第二次教學(xué)質(zhì)量檢測(cè)試卷(莆田二檢)試題和答案
- 2025年中考道德與法治二輪復(fù)習(xí):熱點(diǎn)時(shí)政專題練習(xí)題(含答案)
- 2025年中考道德與法治二輪復(fù)習(xí):七~九年級(jí)高頻考點(diǎn)提綱
- 刀片刺網(wǎng)施工方案
- 輕鋼平頂施工方案
- 苗木養(yǎng)護(hù)施工方案
- 2025年中考物理二輪復(fù)習(xí):簡(jiǎn)單機(jī)械、功和機(jī)械能 尖子生測(cè)試卷(含答案解析)
- 四川省金堂縣2025屆中考考前最后一卷生物試卷含解析
- 山西省朔州市朔城區(qū)重點(diǎn)名校2025屆中考生物模擬試卷含解析
- 別墅房建合同范例
- 社會(huì)科學(xué)基礎(chǔ)(高職學(xué)前教育專業(yè))PPT完整全套教學(xué)課件
- 藥物治療學(xué)-藥物治療的一般原則課件
- 空中乘務(wù)職業(yè)教育專業(yè)教學(xué)資源庫(kù)申報(bào)書(shū)
- 人教版PEP五年級(jí)下冊(cè)英語(yǔ)unit1單元復(fù)習(xí)課件
- 心肌炎病人的護(hù)理
- 四川麻將業(yè)余一級(jí)考級(jí)題庫(kù)
- 【人教版】三年級(jí)下冊(cè)數(shù)學(xué)課件《口算乘法》兩位數(shù)乘兩位數(shù)優(yōu)秀(第1課時(shí))
- 《小小理財(cái)家》課件PPT
- 《相交線與平行線》復(fù)習(xí)課一等獎(jiǎng)?wù)n件
- 部編版四年級(jí)語(yǔ)文下冊(cè)第3單元大單元整體教學(xué)設(shè)計(jì)課件(教案配套)
- 廉政建設(shè)監(jiān)理實(shí)施細(xì)則
評(píng)論
0/150
提交評(píng)論