從專家診病模型實(shí)例理解智慧醫(yī)療大數(shù)據(jù)文庫(kù)_第1頁(yè)
從專家診病模型實(shí)例理解智慧醫(yī)療大數(shù)據(jù)文庫(kù)_第2頁(yè)
從專家診病模型實(shí)例理解智慧醫(yī)療大數(shù)據(jù)文庫(kù)_第3頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、從專家診病模型實(shí)例理解智慧醫(yī)療大數(shù)據(jù)大數(shù)據(jù)可謂是當(dāng)紅炸子雞,對(duì)于它的應(yīng)用場(chǎng)景,人們已經(jīng)做了充分的想象,很多也在逐步落地,比如智慧醫(yī)療。醫(yī)療行業(yè)正更多的融入人工智慧、傳感技術(shù)等高科技,使醫(yī)療服務(wù)走向真正意義的智能化。面對(duì)不同受眾,智慧醫(yī)療有著不同的內(nèi)涵。對(duì)于公眾,意味著更便捷可及的醫(yī)療服務(wù);對(duì)于醫(yī)護(hù)人員,不僅可以提高診療速度,還可以讓診療更加精準(zhǔn),通過(guò)大量的數(shù)據(jù)分析支持他們的診斷。這里就不得不提到專家系統(tǒng),它應(yīng)該是一個(gè)典型的醫(yī)療應(yīng)用,是大數(shù)據(jù)和人工智能的緊密結(jié)合。專家系統(tǒng)是一個(gè)具有大量的專門知識(shí)與經(jīng)驗(yàn)的程序系統(tǒng),它應(yīng)用人工智能技術(shù)和計(jì)算機(jī)技術(shù),根據(jù)某領(lǐng)域一個(gè)或多個(gè)專家提供的知識(shí)和經(jīng)驗(yàn),進(jìn)行推理和

2、判斷,模擬人類專家的決策過(guò)程,以便解決那些需要人類專家處理的復(fù)雜問(wèn)題。簡(jiǎn)言之,專家系統(tǒng)是一種模擬人類專家解決領(lǐng)域問(wèn)題的計(jì)算機(jī)程序系統(tǒng)。專家系統(tǒng)的發(fā)展已經(jīng)歷了3個(gè)階段,正向第四代過(guò)渡和發(fā)展。第一代專家系統(tǒng)(dendral、macsyma等)以高度專業(yè)化、求解專門問(wèn)題的能力強(qiáng)為特點(diǎn)。但在體系結(jié)構(gòu)的完整性、可移植性、系統(tǒng)的透明性和靈活性等方面存在缺陷,求解問(wèn)題的能力弱。第二代專家系統(tǒng)(mycin、casnet、prospector、hearsay等)屬單學(xué)科專業(yè)型、應(yīng)用型系統(tǒng),其體系結(jié)構(gòu)較完整,移植性方面也有所改善,而且在系統(tǒng)的人機(jī)接口、解釋機(jī)制、知識(shí)獲取技術(shù)、不確定推理技術(shù)、增強(qiáng)專家系統(tǒng)的知識(shí)表示

3、和推理方法的啟發(fā)性、通用性等方面都有所改進(jìn)。第三代專家系統(tǒng)屬多學(xué)科綜合型系統(tǒng),采用多種人工智能語(yǔ)言,綜合采用各種知識(shí)表示方法和多種推理機(jī)制及控制策略,并開(kāi)始運(yùn)用各種知識(shí)工程語(yǔ)言、骨架系統(tǒng)及專家系統(tǒng)開(kāi)發(fā)工具和環(huán)境來(lái)研制大型綜合專家系統(tǒng)。在總結(jié)前三代專家系統(tǒng)的設(shè)計(jì)方法和實(shí)現(xiàn)技術(shù)的基礎(chǔ)上,已開(kāi)始采用大型多專家協(xié)作系統(tǒng)、多種知識(shí)表示、綜合知識(shí)庫(kù)、自組織解題機(jī)制、多學(xué)科協(xié)同解題與并行推理、專家系統(tǒng)工具與環(huán)境、人工神經(jīng)網(wǎng)絡(luò)知識(shí)獲取及學(xué)習(xí)機(jī)制等最新人工智能技術(shù)來(lái)實(shí)現(xiàn)具有多知識(shí)庫(kù)、多主體的第四代專家系統(tǒng)。接下來(lái)將通過(guò)生動(dòng)有趣的過(guò)程講解,幫助讀者了解使用SmartMining敏捷挖掘桌面版,以決策樹(shù)算法為背景,

4、依托大數(shù)據(jù)如何構(gòu)建專家診病模型,以及如何通過(guò)可視化探索數(shù)據(jù),實(shí)現(xiàn)決策樹(shù)同樣的計(jì)算結(jié)果!該案例的工作流如下:廣歡I:.研以L*3廣商業(yè)目標(biāo)業(yè)務(wù)理解:該案例所用的數(shù)據(jù)是一份醫(yī)生診病的數(shù)據(jù),如下:表1數(shù)據(jù)視圖其中,年齡、性別、血壓、膽固醇、鈉、鉀是病人的指標(biāo),而藥物是醫(yī)生針對(duì)病人的情況開(kāi)出的藥物。業(yè)務(wù)目標(biāo):建立專家診病系統(tǒng),當(dāng)把病人的指標(biāo)輸入到該系統(tǒng)時(shí),系統(tǒng)會(huì)自動(dòng)輸出該給此類病人開(kāi)出的藥物。數(shù)據(jù)挖掘目標(biāo):建立專家診病模型,該模型以病人的病例指標(biāo)為輸入,以藥物為目標(biāo),建立預(yù)測(cè)模型,該模型可以根據(jù)輸入指標(biāo)的值,計(jì)算預(yù)測(cè)值(藥物)。操作實(shí)現(xiàn):新建工作流可以點(diǎn)擊文件菜單下的"新建"或者點(diǎn)

5、擊工具欄左方的新建按鈕()開(kāi)始創(chuàng)建工作流。點(diǎn)擊后會(huì)彈出以下向?qū)Ы缑妫狠斎牍ぷ髁鞯拿趾蠹纯赏瓿蓜?chuàng)建:圖1新建工作流導(dǎo)入數(shù)據(jù)CSV文件,CSV導(dǎo)入節(jié)點(diǎn)拖到右此時(shí)要根據(jù)數(shù)據(jù)存儲(chǔ)文件的格式選擇相應(yīng)的導(dǎo)入節(jié)點(diǎn)。在這里由于數(shù)據(jù)源是因此可以選擇CSV導(dǎo)入節(jié)點(diǎn)(也可以使用可變文件)。左側(cè)節(jié)點(diǎn)庫(kù)中側(cè)的工作流中。雙擊節(jié)點(diǎn)或者右鍵菜單中選擇"配置",彈出如下配置窗口:-S圖2CSV節(jié)點(diǎn)配置點(diǎn)擊按鈕,選擇相應(yīng)的數(shù)據(jù)文件。注意,此處如果數(shù)據(jù)第一行包含字段名,則選中讀取字段名(該數(shù)據(jù)有),如果有行ID字段,則選中讀取行邛(該數(shù)據(jù)無(wú),則不選中)。配置完成后,點(diǎn)擊節(jié)點(diǎn)下方的預(yù)警符號(hào)從©T3變成

6、了。紅色表示節(jié)點(diǎn)尚未配置或者配置有誤,此時(shí)節(jié)點(diǎn)不可執(zhí)行;黃色表示節(jié)點(diǎn)可以執(zhí)行。點(diǎn)擊右鍵菜單的町I或者點(diǎn)擊>工具欄的L,即可執(zhí)行工作流。執(zhí)行完成后預(yù)警符號(hào)變成I1o。配聶.隊(duì)執(zhí)行帶:開(kāi)瞄翎復(fù)位目京節(jié)京£汪*斯於工心*fe將貝書(shū)制£1!鏘(U)v2ft(R】H»(D)宜文件震丈件表點(diǎn)擊右鍵菜單的I1可以查詢數(shù)據(jù)。另外,節(jié)點(diǎn)的右端口也會(huì)懸停顯示數(shù)據(jù)的行數(shù)和字段數(shù)。i文件表(行20。,列:7)理解數(shù)據(jù)使用統(tǒng)計(jì)分析菜單下的統(tǒng)計(jì)節(jié)點(diǎn)可以對(duì)數(shù)據(jù)進(jìn)行描述,這是建模之前必須要做的工作,方面是為了設(shè)計(jì)合理的實(shí)施方案,另外一方面也是為了更好的選擇合適的算法。從表2中可以看出每種分

7、類變量的取值及每種取值的個(gè)數(shù)。比如,從這里我們可以看出藥物字段一共包含五種取值,且出現(xiàn)最多的是Y藥物。在這里目標(biāo)變量為分類型,因此只能選擇分類預(yù)測(cè)類模型,如決策樹(shù)、邏輯回歸等。表2數(shù)據(jù)描述預(yù)建模接下來(lái)便是嘗試建模,看看建模效果。圖3預(yù)建模首先,從數(shù)據(jù)準(zhǔn)備列轉(zhuǎn)換菜單下選擇類型轉(zhuǎn)換節(jié)點(diǎn)。由于性別、血壓、膽固醇三個(gè)字段實(shí)際存儲(chǔ)類型該是字符型,但這里是整型,因此為了便于以下分析,使用類型轉(zhuǎn)換節(jié)點(diǎn)將它們的類型從整型轉(zhuǎn)化為字符型。配置如下:其次,使用類型節(jié)點(diǎn)指定目標(biāo)變量的角色,將藥物的角色設(shè)為目標(biāo)。再次,從數(shù)據(jù)準(zhǔn)備的行菜單中選擇分區(qū)節(jié)點(diǎn)。使用分區(qū)節(jié)點(diǎn)可以將數(shù)據(jù)集分成測(cè)試集和訓(xùn)練集,訓(xùn)練集用于訓(xùn)練模型,測(cè)試

8、集用于測(cè)試模型。配置如下:注意,如果選中使用隨機(jī)種子(使用靜態(tài)種子),則每次運(yùn)行分區(qū)結(jié)果將會(huì)是使用靜態(tài)神子一樣的,否則每次運(yùn)行的結(jié)果將會(huì)不同,進(jìn)而建模的結(jié)果也會(huì)不同。通常是選擇選中該項(xiàng),使得訓(xùn)練集和測(cè)試集都固定。另外,此處還有個(gè)很重要的用途,不選中多次運(yùn)行可以測(cè)試數(shù)據(jù)分布規(guī)律和模型穩(wěn)定性。還有一點(diǎn)要注意,這里分區(qū)即把數(shù)據(jù)集隨機(jī)分成兩份,通常訓(xùn)練集要比測(cè)試集大,通常分為5:5,6:4,7:3,8:2,9:1。數(shù)據(jù)集越小,訓(xùn)練集應(yīng)該分的更多,原因是要保證模型的穩(wěn)定性,參與訓(xùn)練的數(shù)據(jù)要足夠多。實(shí)際中,各種比例都會(huì)嘗試,目的有二:一是選擇最佳的比例,二是測(cè)試模型的穩(wěn)定性。然后,選擇分類預(yù)測(cè)節(jié)點(diǎn),因?yàn)槟?/p>

9、標(biāo)變量(藥物)為分類型。此處我們重點(diǎn)學(xué)習(xí)決策樹(shù)算法,所以就先選擇決策樹(shù)算法節(jié)點(diǎn)。節(jié)點(diǎn)連接如上圖3所示,在決策樹(shù)(訓(xùn)練)節(jié)點(diǎn)配置中選擇目標(biāo)變量藥物。其中,決策樹(shù)(訓(xùn)練)節(jié)點(diǎn)連接分區(qū)節(jié)點(diǎn)。決策樹(shù)訓(xùn)練節(jié)點(diǎn)可以采用默認(rèn)配置,無(wú)需修改配置,如下:最后,使用分類評(píng)估節(jié)點(diǎn)評(píng)估模型的準(zhǔn)確性。配置如下圖所示:評(píng)估結(jié)果:表3模型評(píng)估1從表3中可以看出,模型測(cè)試準(zhǔn)確度為95%,誤判5%。預(yù)建模的目的是為了從整體判斷現(xiàn)有變量與目標(biāo)變量的相關(guān)性,以便可以根據(jù)經(jīng)驗(yàn)預(yù)估最終的效果和可操作性。接下來(lái)如何優(yōu)化模型呢?通常來(lái)說(shuō)有三種辦法:第一,增加新數(shù)據(jù),以便引入更多重要的影響因素;第二,嘗試其他模型,以便找到更適合的模型;第三

10、,優(yōu)化輸入,即基于已有般企數(shù)據(jù)派生更多重要的變量,或者過(guò)濾不重要的變量。這三者中,第一種最難以實(shí)現(xiàn),業(yè)的數(shù)據(jù)是有限的,企業(yè)內(nèi)部可用數(shù)據(jù)及外部可用網(wǎng)絡(luò)數(shù)據(jù),在項(xiàng)目需求調(diào)研階段就應(yīng)該明確,而企業(yè)外部行業(yè)數(shù)據(jù)難以獲取。第二種最容易嘗試,所有可用模型可以快速嘗試一遍,這個(gè)是每個(gè)項(xiàng)目中都必做的,但卻不是最重要的方法。而第三種方法才是項(xiàng)目中最可行,也是最重要的辦法。如何優(yōu)化輸入?這是第三種方法的實(shí)現(xiàn)目標(biāo)。而優(yōu)化輸入最重要的環(huán)節(jié)就是數(shù)據(jù)探索。數(shù)據(jù)探索圖4數(shù)據(jù)可視化探索數(shù)據(jù)探索最核心的一項(xiàng)工作就是探索輸入變量與目標(biāo)變量的相關(guān)性。分析變量的相關(guān)性可以使用相關(guān)性計(jì)算,也可以使用圖形化分析,而后者最直觀常用。分析兩個(gè)分類型變量可以使用條形圖、網(wǎng)絡(luò)圖或者交叉表。分析兩個(gè)數(shù)值型變量可以使用散點(diǎn)圖。分析一個(gè)數(shù)值型變量和一個(gè)分類型變量可以使用直方圖。通過(guò)分析,血壓和藥物字段有著強(qiáng)相關(guān)性,因?yàn)閺膱D中可以看出使用藥物B和藥物A的人都是高

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論