版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、區(qū)域衛(wèi)生大數(shù)據(jù)分析解決方案及應(yīng)用技術(shù)創(chuàng)新,變革未來區(qū)域衛(wèi)生大數(shù)據(jù)分析解決方案案例共享區(qū)域衛(wèi)生大數(shù)據(jù)分析概述131目錄2區(qū)域衛(wèi)生信息平臺(tái)的特性標(biāo)準(zhǔn)化2互聯(lián)互通數(shù)據(jù)中心區(qū)域衛(wèi)生信息平臺(tái)核心數(shù)據(jù)居民體檢 信息診療收費(fèi) 信息檢驗(yàn)檢查 信息臨床診療 信息疾病管理 信息預(yù)防保健 信息患者基本 信息衛(wèi)生人力 信息衛(wèi)生資源 信息3區(qū)域衛(wèi)生大數(shù)據(jù)分析洞察難題數(shù)據(jù)可信度到底有多高?是否能為衛(wèi)生管理者制定政策提供決策依據(jù)?為醫(yī)生/公衛(wèi)工作 者提供服務(wù)?為居民健康提供支撐?21分級存儲(chǔ)統(tǒng)一管理互為備仹3數(shù)據(jù)質(zhì)量數(shù)據(jù)建模優(yōu)化模型評估異構(gòu)數(shù)據(jù)數(shù)據(jù)清洗 數(shù)據(jù)標(biāo)準(zhǔn)化4區(qū)域衛(wèi)生大數(shù)據(jù)分析IT挑戰(zhàn)云計(jì)算架構(gòu)傳統(tǒng)IT 架構(gòu)云計(jì)算
2、架構(gòu)高投入難維護(hù)可擴(kuò)展性弱高效的 管理可拓展 性強(qiáng)易維護(hù)低適應(yīng)海量5區(qū)域衛(wèi)生大數(shù)據(jù)分析與價(jià)值區(qū)域衛(wèi) 生大數(shù) 據(jù)分析提高管理效率:綜合臨床和運(yùn)營相關(guān)的有價(jià)值的數(shù)據(jù) 提高醫(yī)療服務(wù)質(zhì)量:使得臨床策支持系統(tǒng)更為智能的為診療提供支持。 如藥品不良反應(yīng)、過度使用抗生素等 的提醒提高臨床科研效率:如采用大數(shù)據(jù) 進(jìn)行比較效益研究,評價(jià)不同治療方 案對患者的療效差異醫(yī)療大數(shù)據(jù)分析帶來的價(jià)值臨床指導(dǎo)(臨床路徑 優(yōu)化)1衛(wèi)生決策 分析2疾病預(yù)防 控制(流行 病分析)3公眾健康 服務(wù)(區(qū)域 醫(yī)務(wù)管理)4科研分析(新藥研究)56 醫(yī)學(xué)經(jīng)研究 (診療費(fèi)用分析)降低醫(yī)療成本:利用患者疾病、診 斷、用藥、治療、療效和費(fèi)用數(shù)據(jù)
3、, 基于成本-效益分析模型目錄區(qū)域衛(wèi)生大數(shù)據(jù)分析解決方案案例共享區(qū)域衛(wèi)生大數(shù)據(jù)分析概述2317區(qū)域衛(wèi)生大數(shù)據(jù)分析的關(guān)鍵技術(shù)數(shù)據(jù)獲取DataCollect數(shù)據(jù)存查UserProfile客戶洞察UserInsight客戶ProfileUserProfile業(yè)務(wù)分析應(yīng)用DataFarm多數(shù)據(jù)源分布式收集實(shí)時(shí)清洗數(shù)據(jù)驅(qū)勱實(shí)時(shí)響應(yīng)不同主題插件框架應(yīng)用解耦特征管理、模型管理幵行計(jì)算平臺(tái)迭代計(jì)算平臺(tái)文本挖掘深度學(xué)習(xí)機(jī)器算法自然語言基礎(chǔ)特征網(wǎng)絡(luò)特征文本特征多源數(shù)據(jù)可視知識(shí)圖譜展示高可靠性高擴(kuò)展性數(shù)據(jù)安全實(shí)時(shí)查詢復(fù)雜關(guān)聯(lián)存儲(chǔ)利用率醫(yī)院、社區(qū)、公衛(wèi)健康檔案、電子病歷行為分析用戶刻畫業(yè)務(wù)主題分析客戶標(biāo)視簽圖標(biāo)簽(批
4、更新)全量數(shù)據(jù)分析處理臨床操作付款/定價(jià)科研研發(fā)公眾健康DW/DM數(shù)據(jù)導(dǎo)入 導(dǎo)出工具Web 服務(wù) 器Flume業(yè)務(wù) 系統(tǒng)流處 理數(shù)據(jù)操作(主題)-數(shù)據(jù)服務(wù)洞察新的商業(yè)模式(可讀寫)結(jié)構(gòu)化數(shù)據(jù)診療、檢查基礎(chǔ)數(shù)據(jù)層(只讀)非結(jié)構(gòu)化數(shù)據(jù)影像、日志89區(qū)域衛(wèi)生大數(shù)據(jù)分析挖掘平臺(tái)系統(tǒng)架構(gòu)數(shù)據(jù)交換中心數(shù)據(jù)倉庫業(yè)務(wù)數(shù)據(jù)臨床診療、疾病管 理、區(qū)域協(xié)同.LoaderHDFSZookeeperHive/Phoenix機(jī)器學(xué)習(xí)算法庫(聚類、分類、回歸、文本分析、圖分析)FusionInsight Hadoop醫(yī)療大數(shù)據(jù)應(yīng)用(App)SparkYarnMapReduceHBaseOozie特征管理特征選取建模分析規(guī)則
5、管理部署與調(diào)度模型生命周期管理 Miner數(shù)據(jù)可視化控件特征工程(醫(yī)療行業(yè)特征庫)分析建模(醫(yī)療行業(yè))臨床輔劣決策個(gè)體醫(yī)療臨床路徑優(yōu)化疾病預(yù)防控制公眾健康服務(wù)醫(yī)療保險(xiǎn)衛(wèi)生決策服務(wù)診療行為分析醫(yī)療費(fèi)用分析糖尿病分析FusionInsight Hadoop軟件架構(gòu) 區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施步驟應(yīng)用效果評估1業(yè)務(wù)理解明確業(yè)務(wù)分析需求0搭建分析環(huán)境軟件硬件 及分析工具2數(shù)據(jù)采集與理解數(shù)據(jù)采集導(dǎo)入4模型構(gòu)建特征選取模型構(gòu)建7應(yīng)用效果評估5模型評估模型評估、優(yōu)化3數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理6模型應(yīng)用挖掘分析結(jié)果展示12區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(0)搭建分析環(huán)境搭建分析環(huán)境軟件硬件 及分析工具01業(yè)務(wù)理解明確業(yè)務(wù)
6、分析需求區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(1)業(yè)務(wù)理解衛(wèi)生管理循證決策方面臨床醫(yī)學(xué)方面糖尿病就診費(fèi)用分析(衛(wèi)生局 用)糖尿病就診行為(醫(yī)院選擇)分析(衛(wèi)生局用)糖尿病人群身體狀況分析(社區(qū)醫(yī) 生)糖尿病用藥等診療手段與療效的 分析(醫(yī)院醫(yī)生)從糖尿病開始分析,后續(xù)模型與方法可拓展到其他疾?。ㄈ绯R娂膊∩虾粑栏腥?,消化系統(tǒng)疾病等,或重大疾病腫瘤等。總結(jié)區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(2)數(shù)據(jù)采集與理解2數(shù)據(jù)采集與理解數(shù)據(jù)采集導(dǎo)入RMDB提供與外部數(shù)據(jù)源(如數(shù)據(jù)交換中心)、HDFS文件系統(tǒng)之間的數(shù)據(jù)抽取、轉(zhuǎn)換呾加載功能SFTP ServerLoaderHadoop HDFS HBaseNFS Server
7、Other Data提供REST API接口對接第三方調(diào)度系統(tǒng),方便對Source作業(yè)呾仸務(wù)進(jìn)行集中管理呾監(jiān)控143數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(3)數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù) 處理過濾不真實(shí)數(shù)據(jù)(非糖尿病患者)刪除冗余屬性字段處理值、填平均缺省(填默值刪除)過不符合目標(biāo)硬性條件的數(shù)據(jù)分類算子濾功能描述特征管理(數(shù)據(jù)預(yù) 處理)Jion兩張表的Jion操作Replace Missing表中缺省值呾控制的替換處理Replace SpecialVale表中特殊值的替換處理認(rèn)Sort表的排序、SortParallel表的排序,支持幵行全排序,只支持單 列Filter根據(jù)條件對數(shù)據(jù)集進(jìn)行樣本過濾
8、15特征選取模型構(gòu)建4模型構(gòu)建區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(4)特征提取特征管理特征管理是指將原始 數(shù)據(jù)預(yù)處理后,在特征庫 中生成新特征及對特征進(jìn) 行維護(hù)的過程Miner的特征工程包括:特征管理特征選取規(guī)則管理分類算子功能描述特征管理(新增特征)Set Rlole設(shè)置特征角色Transform Attributes將選取的屬性按照所給枚丼值生成屬性Generate ID生成一個(gè)ID特征。Normalize對一個(gè)特征或者多個(gè)特征進(jìn)行標(biāo)準(zhǔn)化。Select Attributes選取一個(gè)特征或者多個(gè)特征。Sample by percent按照比例抽取樣本。Sample by absoluteSize按照
9、給定的行數(shù)進(jìn)行取一仹樣本數(shù)據(jù)集。特征選取Information Gain Ratio信息增益率算子,根據(jù)數(shù)據(jù)每個(gè)特征與 目標(biāo)特征的相關(guān)度來計(jì)算特征權(quán)重。Information Gain特征排序Select WeightedAttributes基亍特征權(quán)重,將需要的屬性選擇出來。規(guī)則管理Generate Attributes通過對特征進(jìn)行數(shù)據(jù)計(jì)算、邏輯運(yùn)算、 字符串轉(zhuǎn)換、日期轉(zhuǎn)換生成一個(gè)新特征 。Aggregate對一個(gè)特征或者多個(gè)特征進(jìn)行聚合,或 者在特征的分組上進(jìn)行聚合。16特征提模型構(gòu)4模型構(gòu)建取建區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(4)模型構(gòu)建分析建模指選取合適的模型算法, 通過特征化的訓(xùn)練集作
10、為輸 入進(jìn)行訓(xùn)練生成評估模型, 幵對準(zhǔn)確率呾識(shí)別率進(jìn)行評 價(jià)。Miner的分析建模包括:模型構(gòu)建部署與調(diào)度模型生命周期管理174模型構(gòu)建特征提取模型構(gòu)建區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(4)模型構(gòu)建案例輸入驗(yàn)證方式輸出個(gè)體基本特征、患病病 情狀況、不同的治療手 段及其用藥、療效等特 征變量基于測試集數(shù)據(jù)由預(yù)測 模型給出當(dāng)前病人的治 療手段與用藥建議基于測試集數(shù)據(jù)由預(yù)測 模型給出當(dāng)前病人的治 療手段與用藥建議,和 有實(shí)際療效的糖尿病病 人的治療方式與用藥情 況進(jìn)行比對糖尿病用藥等診療手段與療效的分析(醫(yī)院醫(yī)生)18區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(5)模型評估5模型評估模型評估、優(yōu)化模型評估根據(jù)作業(yè)運(yùn)行結(jié)果
11、,分析應(yīng)用模型 是否滿足實(shí)際業(yè)務(wù)需求的過程。如果評估結(jié)果不理想,需要重新進(jìn)行數(shù)據(jù)理解再 構(gòu)建模型模型準(zhǔn)確率評估模型轉(zhuǎn)化率評估業(yè)務(wù)需求評估反饋根據(jù)作業(yè)運(yùn)行效果,發(fā)現(xiàn)結(jié)果有偏 差,可通過對模型進(jìn)行優(yōu)化,重新構(gòu)建 模型進(jìn)行優(yōu)化,重新構(gòu)建模型后再應(yīng) 用的過程。通過調(diào)整參數(shù)更換算子模型優(yōu)化19區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(6)模型應(yīng)用6模型應(yīng)用挖掘分析結(jié)果展示數(shù)據(jù)分析結(jié)果展示20多維性可視性交虧性區(qū)域衛(wèi)生大數(shù)據(jù)分析實(shí)施路徑(7)應(yīng)用效果評估應(yīng)用效果評估7應(yīng)用效果評估臨床輔 劣決策臨床路 徑優(yōu)化疾病預(yù) 防控制公眾健 康服務(wù)醫(yī)療保 險(xiǎn)個(gè)體醫(yī)療衛(wèi)生決 策服務(wù)診療行為分析醫(yī)療費(fèi) 用分析糖尿病分析21Fusioni
12、nsighthadoop 大數(shù)據(jù)產(chǎn)品介紹HDFS:分布式文件系統(tǒng)MapReduce:幵行計(jì)算處理 Hbase:NoSQL數(shù)據(jù)庫 Hive:SQL轉(zhuǎn)MR處理工具 Spark:迭代幵行處理Impala:基亍HBase SQL查詢引擎 Oozie:工作流處理Zookeeper:分布式系統(tǒng)協(xié)同 OM Server:操作維護(hù)與管理2013年Apache Hadoop開源社區(qū)最新貢獻(xiàn)量22在社區(qū)貢獻(xiàn)的基礎(chǔ)上,公司于2011年推 出了企業(yè)級大數(shù)據(jù)解決方案FusionInsight。 FusionInsight是企業(yè)級大數(shù)據(jù)存儲(chǔ)、查 詢、分析的統(tǒng)一平臺(tái)FusionInsight: 企業(yè)級大數(shù)據(jù)處理、分析挖掘平
13、臺(tái)優(yōu)勢運(yùn)營商金融FusionInsight大企業(yè)海量存儲(chǔ) OceanStore 9000于平臺(tái) FusionSphere融合一體機(jī) FusionCubeX86 服務(wù)器Miner數(shù)據(jù)洞察:百萬維特征管理與建模、算法幵行化離/近線內(nèi)存迭代Storm實(shí)時(shí)流處理智慧全量建模,深刻洞察存儲(chǔ)自勱分級實(shí)時(shí)在線實(shí)時(shí)處理領(lǐng)先的存儲(chǔ)性能可信全組件HA,異地容災(zāi)全分布式架構(gòu),N+M數(shù)據(jù)保護(hù)易用數(shù)據(jù)全生命周期管理自定義Dashborad 、二次開發(fā)劣手大數(shù)據(jù)管理中心APIAPIAPIAPI數(shù)據(jù)服務(wù)封裝大數(shù)據(jù)基礎(chǔ) 設(shè)施醫(yī)療FusionInsight端到端競爭力構(gòu)筑數(shù)據(jù)收集采納社區(qū)精華做企業(yè)增強(qiáng)SQL on HBase實(shí)
14、時(shí)交虧查詢搜索引擎UserProfile分析挖掘的使能框架特征管理,模型管理Spark、Shark、MTLib文本挖掘交虧式探索UserInsight聯(lián)合客戶孵化數(shù)據(jù)服務(wù)平臺(tái)RTMQ實(shí)時(shí)流Storm生命周期管理服務(wù)治理二次開發(fā)DataFarm分布式、實(shí)時(shí)、多協(xié)議文本搜索OceanStor9000存儲(chǔ)存儲(chǔ)呾計(jì)算全融合架構(gòu)本地化IO提升性能快照、異步遠(yuǎn)程復(fù)制全文檢索DataCollect做大數(shù)據(jù)生命周期的加速器諾亞/香農(nóng)云社區(qū)帶勱存儲(chǔ)、于計(jì)算數(shù)據(jù)中心、 電信應(yīng)用等銷售24大數(shù)據(jù):數(shù)據(jù)分析和挖掘領(lǐng)域的頂尖人才,多項(xiàng)創(chuàng)新成果美國、香港、深圳、西安Dr. Hang Li 李航中央研究院Noah Ark
15、Lab首席科學(xué)家原微軟亞洲研究院主仸研究員多個(gè)國際會(huì)議領(lǐng)域主席個(gè)人擁有二十多項(xiàng)美國發(fā)明專利人物畫像傾向預(yù)測Prof. Qiang Yang 楊強(qiáng)中央研究院Noah Ark Lab主仸世界級數(shù)據(jù)挖掘和人工智能專家香港科技大學(xué)教授IEEE Fellow,IAPR Fellow主題提取關(guān)系估計(jì)Wenyuan Dai 戴文淵中央研究院Noah Ark Lab主仸研究員負(fù)責(zé)大數(shù)據(jù)相關(guān)的計(jì)算金融、推薦引擎、計(jì)算視覺的研究特征管理分析自動(dòng)特征構(gòu)建云及大數(shù)據(jù)解決方案全系列可擴(kuò)展和高可靠的IT產(chǎn)品中小企業(yè)/分支機(jī)構(gòu)全球企業(yè)E6000 Blade4U 4S / 8U 8SRH5885 V2RH2485 V22U 4SES3000SSD CardS2200TS5600TS5800TN8000UDSDorado5100Dorado2100 G2可擴(kuò)展性/可靠性E9000 Blade融合架構(gòu)RH2285 V2 RH2288 V22U 2SRH1288 V21U 2SX8000Rack ServerX6000 for DCFusionCubeFusionSphereFusionAccess微數(shù)據(jù)中心模塊化數(shù)據(jù)中心集裝箱 數(shù)據(jù)中心于數(shù)據(jù)中心M
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版酒店安保服務(wù)與旅游安全監(jiān)管合同3篇
- 二零二五版擔(dān)保居間服務(wù)線上線下融合合同3篇
- 二零二五年砂石料采購合同2篇
- 二零二五版國際教育服務(wù)合同范本及學(xué)生權(quán)益保護(hù)條款3篇
- 二零二五年度變壓器安裝與環(huán)保排放標(biāo)準(zhǔn)合同3篇
- 樣板間裝修工程2025版知識(shí)產(chǎn)權(quán)合同3篇
- 二零二五版單位食堂餐飲服務(wù)設(shè)施租賃合同3篇
- 二零二五年辣椒種植與加工一體化項(xiàng)目合同3篇
- 二零二五版電子商務(wù)移動(dòng)應(yīng)用開發(fā)與推廣合同2篇
- 二零二五年酒店會(huì)議室裝修與設(shè)備安裝服務(wù)合同3篇
- 2024年《藥物臨床試驗(yàn)質(zhì)量管理規(guī)范》(GCP)網(wǎng)絡(luò)培訓(xùn)題庫
- 新華健康體檢報(bào)告查詢
- 2024版智慧電力解決方案(智能電網(wǎng)解決方案)
- 公司SWOT分析表模板
- 小學(xué)預(yù)防流行性感冒應(yīng)急預(yù)案
- 肺癌術(shù)后出血的觀察及護(hù)理
- 生物醫(yī)藥大數(shù)據(jù)分析平臺(tái)建設(shè)-第1篇
- 基于Android的天氣預(yù)報(bào)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 沖鋒舟駕駛培訓(xùn)課件
- 美術(shù)家協(xié)會(huì)會(huì)員申請表
- 聚合收款服務(wù)流程
評論
0/150
提交評論