




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、大數(shù)據(jù) 醫(yī)療&工程建設(shè) 演講人: 徐啟雄 周聰資料收集:宋佳琪 馬宇寰 邢洪達ppt制作: 向琪工程管理1101班 2014年6月6日 PART 1 大數(shù)據(jù)在 醫(yī)療領(lǐng)域 的應用outline一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望醫(yī)療費用在不斷上升GDP的占比非常高10-19%0-9%趨勢分析: 我們正處在醫(yī)療行業(yè)的一個重要轉(zhuǎn)折點% of population over age 6
2、030+ %25-29%20-24%2050WW Average Age 60+: 21%Source: United Nations “Population Aging 2002”全球老齡化平均年齡60 +: 目前的10%, 到2050年將達到20%Source: McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Size and Forecast以美國為例: 醫(yī)療大數(shù)據(jù)的價值3千億美元/年, 相當于每年生成總值增長0.7%01500010
3、00050002010 2011 2012 2013 2014 2015趨勢分析:我們正處在醫(yī)療行業(yè)的一個重要轉(zhuǎn)折點存儲的增長醫(yī)療服務(wù)產(chǎn)生的數(shù)據(jù)總量(PB)AdminImagingEMREmailFileNon Clin ImgResearch醫(yī)療影像歸檔一個醫(yī)療系統(tǒng)案例的數(shù)據(jù)到2020年, 醫(yī)療數(shù)據(jù)將急劇增長到35 Zetabytes, 相當于2009年數(shù)據(jù)量的44倍增長Source: McKinsey Global Institute AnalysisESG Research Report 2011 North American Health Care Provider Market Si
4、ze and Forecast一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望大數(shù)據(jù)對于“大數(shù)據(jù)”(Big data)研究機構(gòu)Gartner給出了這樣的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。4V:Volume(大量)Velocity(高速)Variety(多樣)veracity(真實性)/Value(價值性)1. 制藥企業(yè)/生命科學3. 費用報銷, 利用率 和 欺詐監(jiān)管2. 臨床決策支持 & 其他臨床應用 (包括診斷相關(guān)的影像信息)4.
5、 患者行為/社交網(wǎng)絡(luò)醫(yī)療大數(shù)據(jù)簡介數(shù)據(jù)來源包括哪些?我們?nèi)绾卫么髷?shù)據(jù)創(chuàng)造價值? (示例)2. 臨床決策支持4. 由生活方式和行為引發(fā)的疾病分析1. 個體化醫(yī)療3. 欺詐監(jiān)測得以加強McKinsey Global Institute Analysis醫(yī)療大數(shù)據(jù)相關(guān)解決方案健康信息服務(wù)新興的醫(yī)療服務(wù)應用數(shù)據(jù)分析及視覺化處理數(shù)據(jù)處理/管理分布式平臺老齡社會腫瘤基因組學醫(yī)療影像分析醫(yī)療影像影像數(shù)據(jù)處理加速基礎(chǔ)醫(yī)療服務(wù)臨床決策支持類SQL的檢索醫(yī)療記錄存儲優(yōu)化個人健康管理個體化醫(yī)療機器學習基因數(shù)據(jù)安全和隱私一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五
6、、 案例分析六、 總結(jié)與展望大數(shù)據(jù)的挑戰(zhàn)不僅來自于數(shù)據(jù)量的增長.需要新技術(shù)的支持檢驗結(jié)果, 費用數(shù)據(jù), 影像, 設(shè)備產(chǎn)生的感應數(shù)據(jù), 基因數(shù)據(jù)等數(shù)據(jù)量結(jié)構(gòu)化數(shù)據(jù), 遵循標準的數(shù)據(jù)標準(如,HL7)非結(jié)構(gòu)化數(shù)據(jù), 如口述、手寫、照片、影像等類型實時有效的商業(yè)價值基于現(xiàn)有數(shù)據(jù)庫中的數(shù)據(jù)進行分析,來支持不同種類的業(yè)務(wù):如費用及報銷、患者病史、歸檔影像分析、實時臨床決策支持(數(shù)據(jù)分析) 實時數(shù)據(jù)分析,而非傳統(tǒng)的批量處理分析 數(shù)據(jù)以流的方式進入系統(tǒng),進行抽取和分析 對于實時運行中的每個時間節(jié)點產(chǎn)生影響,而不是事后處理在傳統(tǒng)的解決方案之上,引入新的數(shù)據(jù)及分析模型和技術(shù),價值速度一、 醫(yī)療與大數(shù)據(jù)的趨勢二
7、、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望傳統(tǒng)解決方案環(huán)境ERP, CRM, Batch,OLTP-DBData Center ProvisioningDiscreteVirtualCloud As A ServiceHPC關(guān)注數(shù)據(jù)的價值大數(shù)據(jù)存儲的考慮傳統(tǒng)存儲方式大規(guī)模分析 Hadoop*海量數(shù)據(jù)庫 Hive*大規(guī)模備份 Lustre*數(shù)據(jù)源文本-語音-視頻-傳感器Requesting Or M2M通訊批量 商業(yè)應用豐富的視覺化效果 安全的數(shù)據(jù)分析和緩存邊緣服務(wù)器(Edge)分析同步端到端Machine-to-MachineSource-
8、to-Source可行的解決方案體系(示例)Applications & ServicesVisualization File Structure & AnalyticalToolsData Delivery, Operational & GraphicalAnalyticsData Management & ComputationalAnalyticsCompute Storage & InfrastructurePlatforms高效的大數(shù)據(jù)訪問途徑 (客戶端)“Know Me”“Free Me”“Express Me”智能手機移動醫(yī)療助理平板電腦筆
9、記本,Ultrabook其他設(shè)備臺式機數(shù)字標牌自助終端MobilityVital sign,I & O entryMedicationadministrationTemplatedata entryFree-format textdata entryLarge diagnosticimagesData inquiryManageability“Link Me”大數(shù)據(jù)在中國醫(yī)療行業(yè)中的應用模式1.制藥企業(yè)/生命科學3.費用報銷, 利用率 和 欺詐監(jiān)管2.臨床決策支持 &其他臨床應用 (包括診斷相關(guān)的影像信息)4.患者行為/社交網(wǎng)絡(luò)藥品研發(fā)對藥品實際 作用進行分析;實施藥品市場預測
10、基因測序分布式計算加快基因測序計算效率公共衛(wèi)生實時統(tǒng)計分析發(fā)現(xiàn)公共衛(wèi)生疫情及公民健康狀況新農(nóng)合基金數(shù)據(jù)分析及時了解基金狀況,預測風險輔助制定農(nóng)合基金的起付線,賠付病種等基本藥物臨床應用分析分析基本藥物在處方中的比例臨床數(shù)據(jù)比對匹配同類型的病人,用藥臨床決策支持利用規(guī)則和數(shù)據(jù)實時分析給出智能提示遠程監(jiān)控采集并分析病人隨身攜帶儀器數(shù)據(jù),給出智能建議人口統(tǒng)計學分析對不同群體人群的就醫(yī),健康數(shù)據(jù)實施人口統(tǒng)計分析了解病人就診行為發(fā)現(xiàn)病人的特定就診行為,分配醫(yī)療資源一、 醫(yī)療與大數(shù)據(jù)的趨勢二 、什么是醫(yī)療大數(shù)據(jù)三 、大數(shù)據(jù)面臨的挑戰(zhàn)四、 如何管理和利用大數(shù)據(jù)五、 案例分析六、 總結(jié)與展望案例分享: Reg
11、ional Health Info Network ChinaReal-time Clinical Decision Support 實時的醫(yī)療數(shù)據(jù)處理(電子健康檔案,醫(yī)療影像數(shù)據(jù)),支持醫(yī)療協(xié)同、臨床決策支持和公共衛(wèi)生管理 采用 Hadoop* (HBase*/Hive*)來實現(xiàn)醫(yī)療數(shù)據(jù)分析和處理 未來將擴展到不同領(lǐng)域、不同區(qū)域/地區(qū)(包括數(shù)據(jù)交換、處理和分析) 與本地的軟件廠商及OEM廠商進行了廣泛合作 技術(shù)挑戰(zhàn) Hadoop (HBase/Hive)與傳統(tǒng)關(guān)系型數(shù)據(jù)庫如何有效結(jié)合大數(shù)據(jù)在區(qū)域衛(wèi)生信息平臺中的切實可行應用場景PublicHealthHospitalPrimary care(
12、Grassroots)HealthInformationDWEHRData &ServicesRegistriesData &ServicesLongitudinal Record ServicesHealth Information Access LayerCare CoordinationClinical decision supportData AnalyticR&DRHINAncillaryData &Services分布式數(shù)據(jù)服務(wù)系統(tǒng)展現(xiàn)層(報告, 視圖)區(qū)域醫(yī)療及基層醫(yī)療信息系統(tǒng)大數(shù)據(jù)解決方案(Hadoop*)集成的用戶應用界面(居民、醫(yī)生、衛(wèi)生行政
13、管理人員)數(shù)據(jù)挖掘(Mahout)分布式批量處理框架(Map/Reduce)區(qū)域衛(wèi)生信息訪問層區(qū)域衛(wèi)生信息訪問層(HIAL)醫(yī)院信息系統(tǒng)醫(yī)院信息系統(tǒng)語言和編譯(Hive)實時數(shù)據(jù)庫(Hbase)基層醫(yī)療信息系統(tǒng)醫(yī)療服務(wù)藥品管理新農(nóng)合醫(yī)療保險服務(wù)器虛擬化基礎(chǔ)設(shè)施虛擬化基礎(chǔ)設(shè)施虛擬化網(wǎng)絡(luò)虛擬化 存儲虛擬化基于云的區(qū)域基層醫(yī)療服務(wù)系統(tǒng)多租戶應用多租戶應用分布式文件系統(tǒng) 協(xié)作 服務(wù)(HDFS) (Zookeeper)結(jié)構(gòu)化數(shù)據(jù)采集器 日志數(shù)據(jù)采集器(Sqoop) (Flume)健康檔案數(shù)據(jù)存儲公共衛(wèi)生運營管理Sequencing3 BillionBase PairsDataProcessingClou
14、d StorageVisualizationMillions ofVariantsInterpretation &AnalyticsMillions of VariantsMillions of PatientsCommercializingTargetedTherapeuticsCompanionDiagnosticsActionable Biomarkers案例分享: NEXTBIO基因數(shù)據(jù)分析Cost to sequence a genome has fallen by800 x in the last 4 yearsEach genome has 4 million varia
15、ntsGrowth in the genomics data in the publicand private domainData available in variety of sourcesStructured, semi-structured, unstructuredNew aggregated data growingexponentially案例分享: NEXTBIO病人相關(guān)性數(shù)據(jù)Novel DiscoveriesBiomarkersDisease MechanismDrug IndicationsClinical Trial ParametersPatient Care Opt
16、ionsLarge content repository of public and private genomic datacombined with proprietary and patented correlation engine案例分享: NEXTBIONextbio & Intel 合作方向技術(shù)挑戰(zhàn):Immutable Data write once,never change, read many timesTraditional Bloom Filters worksHadoop* & HBase* well suited1 genome 10 million
17、rows100 genomes 1billion rows1M genomes 10 trillion rows100M genomes 1 quadrillion1,000,000,000,000,000 rowsApp can dynamically partitions HBaseas data size grows英特爾對于Hadoop提供的優(yōu)化:Optimized Hadoop stack in opensourceStabilize HBase to provide reliablescalable deploymentOptimize and support scale-out
18、asdata size dramatically growsExploring cluster auto tuning,Security & Compliance, etc.案例分享: Kaiser Permanente 大數(shù)據(jù)應用數(shù)據(jù)的發(fā)展趨勢結(jié)構(gòu)化數(shù)據(jù)80%非結(jié)構(gòu)化數(shù)據(jù)全世界 80% 的數(shù)據(jù)是非結(jié)構(gòu)化的 (大量的移動終端設(shè)備, 機器產(chǎn)生的數(shù)據(jù))在未來十年,數(shù)據(jù)將迎來 44 倍的增長 (35zettabytes by 2020)主要的數(shù)據(jù) 增長 來自于 非結(jié)構(gòu)化數(shù)據(jù) (在線的歸檔數(shù)據(jù), 醫(yī)療影像, 在線視頻和存儲, 照片等)全球數(shù)據(jù)的構(gòu)成Kaiser的數(shù)據(jù)中, 90% 是非結(jié)構(gòu)化的
19、(80%的EHR和影像數(shù)據(jù))在未來十年,數(shù)據(jù)將會有 25 倍的增長 (Oneexabyte by 2020)主要的數(shù)據(jù) 增長 來自于 非結(jié)構(gòu)化數(shù)據(jù) (醫(yī)療影像, 視頻, 文本, 音頻等)信息 給 實時個性化醫(yī)療服務(wù)帶來了可能性(Requires Contextual device,environment, spatial, Demographics,Social and Behavioral profiles inaddition to medical information)Kaiser 正在評估大數(shù)據(jù)相關(guān)技術(shù)Kaiser的數(shù)據(jù)構(gòu)成結(jié)構(gòu)化數(shù)據(jù)90%UNSTRUCTURED 構(gòu)化數(shù)據(jù)DATA非
20、結(jié)信息 給各行業(yè)發(fā)展帶來了新一輪的機遇 (零售, 金融, 保險, 制造, 醫(yī)療,)各行業(yè)已經(jīng)開始采用 大數(shù)據(jù)技術(shù) 用于信息提取Source: KaiserMaster Integrate built/bought Real-time PredictiveAnalytical Solutions or Processing logicDiscontinuous ChangeSAN/NASSMP (5$)SAN/NASIn-Memory(50$)Share-NothingDistributed Storage andCompute ($)Fault-tolerant MasterSlave Arc
21、hitecturecapable of withstanding partial system failuresData is distributed across processing slavenodesResources containing data are not sharedMaster manages the data distribution, jobscheduling across slave nodes and aggregatingresult setsSlave(s)DASSAN/NASMPP (10$)SAN/NASSMP (Disk Caching,High Sp
22、eed Network)(10$)數(shù)據(jù)平臺計算的趨勢 分布式計算Kaiser is looking to exploitthis capability Structured, RelationalTabular Data Interactive Query Support Real-time Analytics SQL Transaction Data Unstructured, Non-tabularData Rich Ad Hoc Integration Real-time Analytics UQL ALL Data大數(shù)據(jù)平臺需求分析處理的特性 Intuition(Simulation,
23、Optimization,Stochastic Optimization) Information(Standard & Ad Hocreporting, Query, Alerts,Forecasting, Access) Interrogation(Clustering, Statistical,Quality, Semantics) Integration(Alignment, Semantics,Completeness, Quality) Ingestion(Data Model, MetadataReference Data, Store)Information drive
24、s process optimizations withstrategic impact. Modeling business intuitionfrom data deluge.Ability to model information and transition frommultiple access methods to generating, sharing,collaborating and acting on insights anytime,anywhere on any device.Support current BI tools focused on structuredi
25、nformation. Build/buy packaged unstructureddata processing and analytics tools.A portfolio of tools to manage (profile,cleanse, classify, synchronize, aggregate,integrate, share) ALL types of data.A unified information storage methodologyenabling users to manage data from ALL sources.數(shù)據(jù)的特性數(shù)據(jù)量 (Senso
26、rs, EMR,Claims, Pharmacy,Images)速度 (SLAs, Real-timeDecision Support &ContextualIntelligence)類型(Structured, Text,Unstructured,Documents, Images)大數(shù)據(jù) 界定的標準DATA SIZEDATA TYPEDATA CLASSDATA CATALOGDATA VELOCITYDATA ACCESSDATABASE TYPEGigabytes, Terabytes,PetabytesStructured, Semi-Structured,Unstructu
27、redHuman Generated,Machine GeneratedText, Image, Audio, VideoBatch, StreamingAnalytics, Search, Transaction (ACID, BASE)Relational ,File Based, Columnar, NoSQL, Document, Graph, RDFFRAMEWORKSANALYTICSFinancial, Computer Vision Engine, Geospatial, Machine Learning,Mathematical, Natural Language Processing, Neural Networks,Statistical Modeling, Time-Series Analysis, Voice EngineStandard Reporting, Ad hoc Reporting, Query/Drill downs, AlertsForecasting, Simulations, Optimization, Stochastic OptimizationsSERVERARCHITECTUREDISTRIBUTEDPROCESSINGSTO
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 全國各省市高三英語調(diào)研試卷之完形填空篇
- 2025至2030年中國對甲基苯酚數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國復合消脂劑數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國垂直式平面氣動絲印機數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國發(fā)光燈數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國初中物理分組實驗材料數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國仿羊絨印花毛衫數(shù)據(jù)監(jiān)測研究報告
- 2025年中國鷓鴣鳥熟肉制品市場調(diào)查研究報告
- 2025年中國鱸魚配合飼料市場調(diào)查研究報告
- 2025年中國超聲波加工機市場調(diào)查研究報告
- 咖啡店合同咖啡店合作經(jīng)營協(xié)議
- 2025年山東鋁業(yè)職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 全套電子課件:技能成就夢想
- 2024年教育公共基礎(chǔ)知識筆記
- 2025年江蘇農(nóng)林職業(yè)技術(shù)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 異構(gòu)數(shù)據(jù)融合技術(shù)-深度研究
- 北京市朝陽區(qū)2024-2025學年七年級上學期期末考試數(shù)學試卷(含答案)
- 《銷售合同執(zhí)行》課件
- 2025年春新外研版(三起)英語三年級下冊課件 Unit4第2課時Speedup
- 山東2024年山東經(jīng)貿(mào)職業(yè)學院第二批招聘102人歷年參考題庫(頻考版)含答案解析
- 急性呼吸窘迫綜合征的護理課件(演示)
評論
0/150
提交評論