X第三部分數(shù)據(jù)挖掘與統(tǒng)計決策決策樹關(guān)聯(lián)遺傳_第1頁
X第三部分數(shù)據(jù)挖掘與統(tǒng)計決策決策樹關(guān)聯(lián)遺傳_第2頁
X第三部分數(shù)據(jù)挖掘與統(tǒng)計決策決策樹關(guān)聯(lián)遺傳_第3頁
X第三部分數(shù)據(jù)挖掘與統(tǒng)計決策決策樹關(guān)聯(lián)遺傳_第4頁
X第三部分數(shù)據(jù)挖掘與統(tǒng)計決策決策樹關(guān)聯(lián)遺傳_第5頁
已閱讀5頁,還剩145頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、課程名稱:課程名稱: 數(shù)據(jù)挖掘與統(tǒng)計決策數(shù)據(jù)挖掘與統(tǒng)計決策 教教 師:師: 廖廖 芹芹 Email : Email : 問題:問題:如果有如果有6060個因素影響銀行貸款,要判別是否給企業(yè)貸款,如個因素影響銀行貸款,要判別是否給企業(yè)貸款,如何用少數(shù)主要的若干個影響因素,建立貸款判別規(guī)則?即如何從一何用少數(shù)主要的若干個影響因素,建立貸款判別規(guī)則?即如何從一組數(shù)據(jù)提取具有因果關(guān)系的分類判別規(guī)則?組數(shù)據(jù)提取具有因果關(guān)系的分類判別規(guī)則? 決策樹:決策樹:通過樣本數(shù)據(jù)對分類類別信息的確定性程度,建立樹結(jié)構(gòu)通過樣本數(shù)據(jù)對分類類別信息的確定性程度,建立樹結(jié)構(gòu)表示分類因果關(guān)系,以提取分類規(guī)則的分類方法。表示分

2、類因果關(guān)系,以提取分類規(guī)則的分類方法。問題:問題:對下列對下列14個分類樣本數(shù)據(jù)集,如何建立天氣分類決策樹?個分類樣本數(shù)據(jù)集,如何建立天氣分類決策樹?五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算法算法P150五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算法算法P152五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算法算法P153在條件在條件V下,減少或下,減少或五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算法算法P153五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算

3、法算法P154五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算法算法補充補充類似類似P155(5.6)五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算法算法補充補充類似類似P155(5.7)五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹- - ID3算法算法補充補充類似類似P155(5.7)五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹(比特)(比特)決策樹決策樹- - ID3算法算法P156補充補充類似類似P155(5.8),(5.9),P156(5.10)決策樹決策樹- - ID3算法算法P156五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹

4、決策樹決策樹決策樹- - ID3算法算法天氣天氣風(fēng)力風(fēng)力濕度有雨有雨 晴晴 多云多云 潮濕潮濕 正常正常 有風(fēng)有風(fēng) 無風(fēng)無風(fēng) 可以看到:可以看到:對樣本需要四個屬性才能分類的問題,通過決策樹可以用兩個屬性就對樣本需要四個屬性才能分類的問題,通過決策樹可以用兩個屬性就 可以分類??梢酝ㄟ^決策樹提取分類的判別規(guī)則以應(yīng)用。可以分類??梢酝ㄟ^決策樹提取分類的判別規(guī)則以應(yīng)用。 問題:問題:少了某因素變量的決策樹是否合理?是否可以應(yīng)用?少了某因素變量的決策樹是否合理?是否可以應(yīng)用?五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹用建立的決策樹檢驗第用建立的決策樹檢驗第1 1號樣本:號樣本: 1 1號樣本:天氣

5、:晴;溫度:熱;濕度:潮濕;風(fēng)力:沒風(fēng);號樣本:天氣:晴;溫度:熱;濕度:潮濕;風(fēng)力:沒風(fēng); 用規(guī)則用規(guī)則1 1 :則氣候?qū)儆冢簞t氣候?qū)儆贜 N類,與樣本的專家判別結(jié)果一樣類,與樣本的專家判別結(jié)果一樣結(jié)論:最多用兩個因素變量(屬性)即可以判別天氣類別。結(jié)論:最多用兩個因素變量(屬性)即可以判別天氣類別。只有一個因素變只有一個因素變量就可以判別量就可以判別五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹Clementine輔助決策樹輔助決策樹五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹Clementine輔助決策樹輔助決策樹決策樹決策樹- - C4.5算法

6、算法P158H(X,a)=(X,a)()()()(a) 決策樹決策樹- - C4.5算法算法P154決策樹決策樹 C4.5算法算法P158五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-C4.5-C4.5算法算法P158-P159五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-C4.5算法算法P159五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-C4.5算法算法補充補充一、決策樹一、決策樹 -C4.5算法算法補充補充五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-C4.5算法算法補充補充五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-C4.5

7、算法算法補充補充五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-CART算法算法P159五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-CART算法算法P159五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-CART算法算法P160五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-CART算法算法P160決策樹決策樹-CART算法算法P161決策樹決策樹-CART算法算法P161五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-CART算法算法補充補充五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹P170五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決

8、策樹決策樹 葉結(jié)點深度是指葉結(jié)點相距葉結(jié)點深度是指葉結(jié)點相距根結(jié)點的層數(shù)。如下決策樹,根結(jié)點的層數(shù)。如下決策樹, 葉結(jié)點數(shù)葉結(jié)點數(shù)=2+3+1=6=2+3+1=6, 葉結(jié)點深度和葉結(jié)點深度和=2=2* *2+32+3* *2+12+1* *1=111=11決策樹決策樹- -剪枝算法剪枝算法當(dāng)?shù)竭_某結(jié)點的樹具有指定的實例識別率時,停止生長當(dāng)?shù)竭_某結(jié)點的樹具有指定的實例識別率時,停止生長P171決策樹決策樹-剪枝算法剪枝算法P171五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-剪枝算法剪枝算法P172五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-剪枝算法剪枝算法P172決策

9、樹決策樹-剪枝算法剪枝算法P172五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-剪枝算法剪枝算法P173五、數(shù)據(jù)挖掘方法五、數(shù)據(jù)挖掘方法決策樹決策樹決策樹決策樹-剪枝算法剪枝算法P173決策樹決策樹-剪枝算法剪枝算法P174數(shù)據(jù)挖掘軟件數(shù)據(jù)挖掘軟件ClementineClementine輔助決策樹輔助決策樹城市醫(yī)療水平能力綜合評價分類決策樹建立城市醫(yī)療水平能力綜合評價分類決策樹建立1 1、導(dǎo)入評價樣本數(shù)據(jù)并選擇模型;、導(dǎo)入評價樣本數(shù)據(jù)并選擇模型;2 2、設(shè)置參數(shù)、設(shè)置參數(shù)城市醫(yī)療水平能力綜合評價分類決策樹建立城市醫(yī)療水平能力綜合評價分類決策樹建立10個樣本個樣本如果導(dǎo)入數(shù)據(jù)時選擇是

10、連續(xù)如果導(dǎo)入數(shù)據(jù)時選擇是連續(xù)型取值的型取值的范圍范圍,則,則C5.0方法方法的決策樹也是兩叉形式,只的決策樹也是兩叉形式,只有選擇離散型的取值時,才有選擇離散型的取值時,才有三叉以上的輸出。有三叉以上的輸出。 當(dāng)修剪嚴重度為當(dāng)修剪嚴重度為90%90%、95%95%時,決策樹分別見下面左與右,時,決策樹分別見下面左與右,左樹的深度減少了一層,右樹的深度減少了兩層。左樹的深度減少了一層,右樹的深度減少了兩層。城市醫(yī)療水平能力綜合評價分類決策樹建立城市醫(yī)療水平能力綜合評價分類決策樹建立樣本樣本不修剪分類不修剪分類正確率正確率修剪修剪90%90%分分類正確率類正確率修剪修剪95%95%分分類正確率類正

11、確率建模樣本建模樣本100%90%70%檢驗樣本檢驗樣本44.44%44.44%33.33%與神經(jīng)網(wǎng)絡(luò)模型預(yù)與神經(jīng)網(wǎng)絡(luò)模型預(yù)測誤差相比,檢驗測誤差相比,檢驗樣本誤差增加了。樣本誤差增加了。城市醫(yī)療水平能力綜合評價分類城市醫(yī)療水平能力綜合評價分類二叉決策樹二叉決策樹建立建立模型建立:模型建立: 選擇選擇“建模建?!敝械闹械摹癈&RC&R樹樹”節(jié)點,右鍵設(shè)置模型參數(shù)。分別設(shè)置根以下的節(jié)點,右鍵設(shè)置模型參數(shù)。分別設(shè)置根以下的層為層為5,35,3和和2 2,得到不同的決策樹,得到不同的決策樹。 模型結(jié)果:模型結(jié)果: 運行模型得到?jīng)Q策樹分類結(jié)果,右鍵瀏覽模型結(jié)果:根以下層為運行模型得到?jīng)Q

12、策樹分類結(jié)果,右鍵瀏覽模型結(jié)果:根以下層為5 5時,表示根以下層數(shù)目不會超時,表示根以下層數(shù)目不會超過過5 5,結(jié)果如下所示,可以發(fā)現(xiàn),結(jié)果只有,結(jié)果如下所示,可以發(fā)現(xiàn),結(jié)果只有3 3層,也就是說根以下層達到層,也就是說根以下層達到3 3時,已經(jīng)對數(shù)據(jù)完全分類。時,已經(jīng)對數(shù)據(jù)完全分類。若設(shè)置根以下層為若設(shè)置根以下層為3 3,結(jié)果也是與下面結(jié)果一致。,結(jié)果也是與下面結(jié)果一致。 城市醫(yī)療水平能力綜合評價分類城市醫(yī)療水平能力綜合評價分類二叉決策樹二叉決策樹建立建立根以下根以下5 5層與層與3 3層決策樹結(jié)果見左圖,根以下層決策樹結(jié)果見左圖,根以下2 2層決策樹結(jié)果見右圖:層決策樹結(jié)果見右圖:模型檢驗

13、:模型檢驗: 可以看到模型的自檢驗的可以看到模型的自檢驗的100%100%準確的,誤差是準確的,誤差是0 0,而檢驗樣本檢驗的絕對平均誤差是,而檢驗樣本檢驗的絕對平均誤差是1.778.1.778.可以把分類結(jié)果導(dǎo)出,可以看出建模樣本的準確率是可以把分類結(jié)果導(dǎo)出,可以看出建模樣本的準確率是100%100%,檢驗樣本的準確率是,檢驗樣本的準確率是33.33%33.33%。 城市醫(yī)療水平能力綜合評價分類城市醫(yī)療水平能力綜合評價分類二叉決策樹二叉決策樹建立建立學(xué)習(xí)樣本學(xué)習(xí)樣本病人數(shù)病人數(shù)醫(yī)生數(shù)醫(yī)生數(shù)工作人員數(shù)工作人員數(shù)門診所數(shù)門診所數(shù)死亡率死亡率醫(yī)療能力評醫(yī)療能力評價價醫(yī)療能力評價醫(yī)療能力評價(根以下

14、(根以下3 3層)層)醫(yī)療能力評價醫(yī)療能力評價(根以下(根以下2 2層)層)上海上海0.50.51.51.51.51.51.51.5-1.5-1.51.51.51.51.51.51.5北京北京-0.5-0.51.51.51.51.51.51.50.50.51.51.51.51.51.51.5沈陽沈陽-1.5-1.5-1.5-1.5-1.5-1.5-0.5-0.50.50.5-1.5-1.5-1.5-1.5-1.5-1.5武漢武漢0.50.50.50.50.50.5-0.5-0.5-1.5-1.5-0.5-0.5-0.5-0.5-0.25-0.25哈爾濱哈爾濱1.51.50.50.5-0.5-0

15、.5-1.5-1.5-0.5-0.5-0.5-0.5-0.5-0.5-0.25-0.25重慶重慶0.50.50.50.5-1.5-1.5-1.5-1.5-1.5-1.5-1.5-1.5-1.5-1.5-1.5-1.5成都成都-0.5-0.50.50.50.50.5-0.5-0.5-0.5-0.5-0.5-0.5-0.5-0.5-0.25-0.25蘭州蘭州1.51.50.50.5-0.5-0.50.50.51.51.51.51.51.51.51.51.5青島青島0.50.5-1.5-1.51.51.51.51.5-0.5-0.50.50.50.50.50.50.5鞍山鞍山0.50.5-0.5-0

16、.5-0.5-0.5-1.5-1.51.51.50.50.50.50.5-0.25-0.25天津天津-1.5-1.50.50.5-1.5-1.50.50.5-0.5-0.5-1.5-1.51.51.51.51.5廣州廣州-0.5-0.50.50.50.50.50.50.5-0.5-0.50.50.51.51.51.51.5南京南京-1.5-1.50.50.50.50.50.50.5-0.5-0.50.50.51.51.51.51.5西安西安0.50.50.50.5-0.5-0.50.50.50.50.50.50.5-0.5-0.51.51.5長春長春0.50.50.50.50.50.5-0.5

17、-0.50.50.50.50.51.51.5-0.25-0.25太原太原1.51.50.50.50.50.50.50.51.51.51.51.5-1.5-1.51.51.5大連大連-1.5-1.5-0.5-0.5-1.5-1.5-0.5-0.50.50.5-1.5-1.51.51.5-1.5-1.5濟南濟南1.51.51.51.51.51.50.50.5-0.5-0.51.51.5-1.5-1.51.51.5撫順撫順0.50.5-1.5-1.5-1.5-1.5-1.5-1.50.50.5-0.5-0.51.51.5-1.5-1.5三層樣本正確率:自檢三層樣本正確率:自檢100%, 100%,

18、檢驗檢驗 33%33%二層樣本正確率:自檢二層樣本正確率:自檢40%, 40%, 檢驗檢驗 33%33%城市醫(yī)療水平能力綜合評價分類城市醫(yī)療水平能力綜合評價分類二叉決策樹二叉決策樹建立建立問題:問題:智能功能實現(xiàn),需要知識規(guī)則和知識推理的支持,決策樹可智能功能實現(xiàn),需要知識規(guī)則和知識推理的支持,決策樹可以支持提取確定性的知識規(guī)則,但實際中可能出現(xiàn)許多不確定的情以支持提取確定性的知識規(guī)則,但實際中可能出現(xiàn)許多不確定的情況。如何提取不確定性規(guī)則?況。如何提取不確定性規(guī)則?購物籃問題:購物籃問題:超市中每天有大量的購買數(shù)據(jù),這些數(shù)據(jù)中發(fā)現(xiàn)啤酒超市中每天有大量的購買數(shù)據(jù),這些數(shù)據(jù)中發(fā)現(xiàn)啤酒與尿片的關(guān)系

19、密切,是否需要關(guān)注這種情況而改變超市中這兩種物與尿片的關(guān)系密切,是否需要關(guān)注這種情況而改變超市中這兩種物品的擺放位置,以適應(yīng)顧客的需要?品的擺放位置,以適應(yīng)顧客的需要?應(yīng)用問題:應(yīng)用問題:為了促銷產(chǎn)品,應(yīng)該以什么方案配置才具有激勵購買積為了促銷產(chǎn)品,應(yīng)該以什么方案配置才具有激勵購買積極性的作用?極性的作用?擴展問題:擴展問題:未來產(chǎn)品產(chǎn)業(yè)鏈的發(fā)展與什么有關(guān)?發(fā)展速度與增長幅未來產(chǎn)品產(chǎn)業(yè)鏈的發(fā)展與什么有關(guān)?發(fā)展速度與增長幅度的可能性如何預(yù)測?度的可能性如何預(yù)測?思路:思路:可以采用關(guān)聯(lián)分析或時序關(guān)聯(lián)分析,發(fā)現(xiàn)事物之間同時出現(xiàn)可以采用關(guān)聯(lián)分析或時序關(guān)聯(lián)分析,發(fā)現(xiàn)事物之間同時出現(xiàn)可能性大的行為模式和

20、規(guī)則,以支持原因之間、原因與結(jié)果之間的可能性大的行為模式和規(guī)則,以支持原因之間、原因與結(jié)果之間的推理。推理。六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析思路:思路:1 1、物品或項目出現(xiàn)可能性大的才關(guān)注;、物品或項目出現(xiàn)可能性大的才關(guān)注; 2 2、A A出現(xiàn)導(dǎo)致出現(xiàn)導(dǎo)致B B出現(xiàn)可能性大的規(guī)則才關(guān)注;出現(xiàn)可能性大的規(guī)則才關(guān)注; 3 3、指定期望可能性,大于這一可能性的項目或規(guī)則才關(guān)注。、指定期望可能性,大于這一可能性的項目或規(guī)則才關(guān)注。由此定義支持度與置信度。由此定義支持度與置信度。 補充補充關(guān)聯(lián)規(guī)則分析主要概念關(guān)聯(lián)規(guī)

21、則分析主要概念=P189關(guān)聯(lián)規(guī)則分析主要概念關(guān)聯(lián)規(guī)則分析主要概念關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori方法方法P189關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori方法方法=P190六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析其中,其中,“過濾過濾”是指判別項目集是否大于最小支持度,如果大于就是指判別項目集是否大于最小支持度,如果大于就保留,否則淘汰保留,否則淘汰六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析補充,類似補充,類似P191例例6.2 六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析補充,類似補充,類似P192例例6.2 六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析補充,類似

22、補充,類似P193例例6.2 問題:問題:除除BCEBCE外,還有其外,還有其它的最大頻繁集嗎?它的最大頻繁集嗎?六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析設(shè)有五種物品:設(shè)有五種物品:A,B,C,D,E,銷售記錄的五項業(yè)務(wù)銷售記錄的五項業(yè)務(wù)T為:為: 業(yè)務(wù):業(yè)務(wù):T001 T002 T003 T004 T005T001 T002 T003 T004 T005 物品:物品:ACD BCE ABCE ABCEACD BCE ABCE ABCE D D問題:問題:下面物品中,哪些物品之間被購買有密切關(guān)系?什么物品被下面物品中,哪些物品之間被購買有密切關(guān)系?什么物品被買可以導(dǎo)致另一些物品被買?買

23、可以導(dǎo)致另一些物品被買?同理可以得到同理可以得到: BCE,BE C,CE B 的規(guī)則的規(guī)則 六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析Clementine 輔助過程及結(jié)果輔助過程及結(jié)果六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析Clementine 輔助過程及結(jié)果輔助過程及結(jié)果六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析Clementine 輔助城市醫(yī)療水平影響因素的關(guān)聯(lián)分析輔助城市醫(yī)療水平影響因素的關(guān)聯(lián)分析學(xué)習(xí)樣本學(xué)習(xí)樣本樣本樣本病人數(shù)病人數(shù)醫(yī)生數(shù)醫(yī)生數(shù)工作人員數(shù)工作人員數(shù)門診所數(shù)門診所數(shù)死亡率死亡率醫(yī)療能力評價醫(yī)療能力評價上海上海0.51.51.51.5-1.51.5北京北

24、京-0.51.51.51.50.51.5沈陽沈陽-1.5-1.5-1.5-0.50.5-1.5武漢武漢0.50.50.5-0.5-1.5-0.5哈爾濱哈爾濱1.50.5-0.5-1.5-0.5-0.5重慶重慶0.50.5-1.5-1.5-1.5-1.5成都成都-0.50.50.5-0.5-0.5-0.5蘭州蘭州1.50.5-0.50.51.51.5青島青島0.5-1.51.51.5-0.50.5鞍山鞍山0.5-0.5-0.5-1.51.50.5檢驗樣本檢驗樣本樣本樣本病人數(shù)病人數(shù)醫(yī)生數(shù)醫(yī)生數(shù)工作人員數(shù)工作人員數(shù)門診所數(shù)門診所數(shù)死亡率死亡率醫(yī)療能力評價醫(yī)療能力評價天津天津-1.50.5-1.50

25、.5-0.5-1.5廣州廣州-0.50.50.50.5-0.50.5南京南京-1.50.50.50.5-0.50.5西安西安0.50.5-0.50.50.50.5長春長春0.50.50.5-0.50.50.5太原太原1.50.50.50.51.51.5大連大連-1.5-0.5-1.5-0.50.5-1.5濟南濟南1.51.51.50.5-0.51.5撫順撫順0.5-1.5-1.5-1.50.5-0.5Clementine Clementine 輔助城市醫(yī)療水平影響因素的關(guān)聯(lián)分析輔助城市醫(yī)療水平影響因素的關(guān)聯(lián)分析1 1、導(dǎo)入評價樣本數(shù)據(jù)并選擇模型,其中、導(dǎo)入評價樣本數(shù)據(jù)并選擇模型,其中數(shù)據(jù)集中的

26、取值轉(zhuǎn)換為定性取值:數(shù)據(jù)集中的取值轉(zhuǎn)換為定性取值: 1.5=V, 0.5=g, -0.5=a, -1.5=b1.5=V, 0.5=g, -0.5=a, -1.5=b2 2、設(shè)置參數(shù)、設(shè)置參數(shù)六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析Clementine Clementine 輔助城市醫(yī)療水平影響因素的關(guān)聯(lián)分析輔助城市醫(yī)療水平影響因素的關(guān)聯(lián)分析 不同支持度和置信度下的關(guān)聯(lián)規(guī)則數(shù)目不同支持度和置信度下的關(guān)聯(lián)規(guī)則數(shù)目最小支持度最小支持度50%50%40%40%30%30%30%30%20%20%最小置信度最小置信度50%50%40%40%50%50%40%40%20%20%規(guī)則數(shù)目規(guī)則數(shù)目2

27、22 238385151349349 最小支持度為最小支持度為30%30%和最小置信度為和最小置信度為50%50%時的部分關(guān)聯(lián)規(guī)則時的部分關(guān)聯(lián)規(guī)則后項前項支持度支持度 % %置信度置信度 % %醫(yī)生數(shù)=g醫(yī)療能力評價=a30100病人數(shù)=g死亡率=b30100工作人員數(shù)=v門診所數(shù)=v30100門診所數(shù)=v工作人員數(shù)=v30100病人數(shù)=v工作人員數(shù)=a3067死亡率=v工作人員數(shù)=a3067死亡率死亡率 = a= a醫(yī)療能力評價醫(yī)療能力評價 = a = a and and 醫(yī)生數(shù)醫(yī)生數(shù) = g= g303067 67 門診所數(shù)門診所數(shù) = a= a醫(yī)療能力評價醫(yī)療能力評價 = a = a a

28、nd and 醫(yī)生數(shù)醫(yī)生數(shù) = g= g303067 67 醫(yī)生數(shù)醫(yī)生數(shù) = g= g死亡率死亡率 = b and = b and 病人數(shù)病人數(shù) = g= g303067 67 醫(yī)療能力評價醫(yī)療能力評價 = = v v門診所數(shù)門診所數(shù) = v and = v and 工作人員數(shù)工作人員數(shù) = v= v303067 67 病人數(shù)病人數(shù) = g= g門診所數(shù)門診所數(shù) = v and = v and 工作人員數(shù)工作人員數(shù) = v= v303067 67 醫(yī)療能力評價醫(yī)療能力評價 = = a a醫(yī)生數(shù)醫(yī)生數(shù) = g= g505060 60 死亡率死亡率 = b= b病人數(shù)病人數(shù) = g= g50506

29、0 60 六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析 對最小支持度為對最小支持度為30%30%和最小置信度為和最小置信度為50%50%時得到的模型,進行建模檢驗樣本的關(guān)系預(yù)測。時得到的模型,進行建模檢驗樣本的關(guān)系預(yù)測。建模樣本關(guān)系預(yù)測:對每一樣本,把與樣本項相關(guān)的后項或建模樣本關(guān)系預(yù)測:對每一樣本,把與樣本項相關(guān)的后項或前項結(jié)果列示,顯示對應(yīng)的規(guī)則置信度,以及有關(guān)規(guī)則數(shù)前項結(jié)果列示,顯示對應(yīng)的規(guī)則置信度,以及有關(guān)規(guī)則數(shù)六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析檢驗樣本關(guān)系預(yù)測檢驗樣本關(guān)系預(yù)測六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法關(guān)聯(lián)分析關(guān)聯(lián)分析問題問題1:有多少顧客購買了打印機后,相隔多

30、長時間會購買打印紙?有多少顧客購買了打印機后,相隔多長時間會購買打印紙?其中又有多少顧客其中又有多少顧客相隔多長時間會購買硒鼓相隔多長時間會購買硒鼓 ? 問題問題2:顧客購買了顧客購買了A移動銷售方案,相隔多長時間會轉(zhuǎn)購買移動銷售方案,相隔多長時間會轉(zhuǎn)購買B移動移動銷售方案?銷售方案? 思路:思路:1)對具有時間特點的顧客行為模式進行關(guān)聯(lián)分析,稱為時序關(guān)聯(lián),挖掘)對具有時間特點的顧客行為模式進行關(guān)聯(lián)分析,稱為時序關(guān)聯(lián),挖掘具有時間先后發(fā)生的判別規(guī)則。具有時間先后發(fā)生的判別規(guī)則。 2)把同一顧客的先后行為模式轉(zhuǎn)換為具有先后項目順序的序列表示,在)把同一顧客的先后行為模式轉(zhuǎn)換為具有先后項目順序的序

31、列表示,在序列中求頻繁出現(xiàn)的項目序列。序列中求頻繁出現(xiàn)的項目序列。主要概念:主要概念:例:例:A A顧客:顧客:2 2月購買月購買“打印機,打印紙打印機,打印紙”, 3 3月購買月購買“打印紙打印紙”,7 7月購買月購買“硒鼓硒鼓” ” ; B B顧客顧客:1 1月購買月購買“打印紙打印紙”, 2 2月購買月購買“打印機打印機”,6 6月購買硒鼓月購買硒鼓 ; C C顧客:顧客:1 1月購買月購買“打印機,打印紙,硒鼓打印機,打印紙,硒鼓 ” ”,4,4月購買月購買“打印紙打印紙”,6,6月購買月購買“打印紙打印紙”六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法時序關(guān)聯(lián)分析時序關(guān)聯(lián)分析例如打印機例如打印機是

32、一項目是一項目例如例如A顧客顧客先買先買“打印機,打印紙打印機,打印紙”,再買,再買“硒硒鼓鼓”是一項目集組成的序列:是一項目集組成的序列:s1,s2,其中,其中, s1由由“打印機,打印紙打印機,打印紙”組成,組成,s2由硒由硒鼓組成。鼓組成。問題:問題:有有B B顧客,先買打印機,再買打印紙顧客,先買打印機,再買打印紙 有有C C顧客,買打印機顧客,買打印機 有有D顧客,先買打印機,再買硒鼓顧客,先買打印機,再買硒鼓問哪一顧客的購買模式被問哪一顧客的購買模式被A顧客模式包含?顧客模式包含?Supp六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法時序關(guān)聯(lián)分析時序關(guān)聯(lián)分析P208 時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則

33、分析主要問題主要問題六、數(shù)據(jù)挖掘方法六、數(shù)據(jù)挖掘方法時序關(guān)聯(lián)分析時序關(guān)聯(lián)分析時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法P208 思路:思路:先從事務(wù)數(shù)據(jù)中找大項目集,由大項目先從事務(wù)數(shù)據(jù)中找大項目集,由大項目集組成可能出現(xiàn)的時序模式,再求大序列集。集組成可能出現(xiàn)的時序模式,再求大序列集。時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法大項目集挖掘過程如下:大項目集挖掘過程如下:時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法 當(dāng)總顧客

34、數(shù)為當(dāng)總顧客數(shù)為5 5時,最少支持度為時,最少支持度為10%10%,則項目集支持度要大于,則項目集支持度要大于1/5=10%,1/5=10%,才保留。才保留。所以,(所以,(3030),(),(4040),(),(7070),(),(9090),(),(4040,7070)是大頻繁)是大頻繁集集時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法顧客號映射如下顧客號映射如下時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法補充補充時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則

35、分析-Apriori-G方法方法補充補充時序時序關(guān)聯(lián)規(guī)則分析關(guān)聯(lián)規(guī)則分析-Apriori-G方法方法六七月份同一日期六七月份同一日期有識別情況有識別情況時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助過程輔助過程時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助過程輔助過程時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助過程輔助過程時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助過程輔助過程把三種后項結(jié)果列示,當(dāng)樣本中出現(xiàn)對把三種后項結(jié)果列示,當(dāng)樣本中出現(xiàn)對應(yīng)應(yīng)T的項與列示的后項被包含在挖掘規(guī)的項與列示的后項被包含在挖掘規(guī)則中時,顯示規(guī)則的置信度為

36、則中時,顯示規(guī)則的置信度為0.5.時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)問題:問題:城市醫(yī)療建設(shè)過程的影響因素具有哪些時序發(fā)展關(guān)系?城市醫(yī)療建設(shè)過程的影響因素具有哪些時序發(fā)展關(guān)系?年限年限樣本樣本基礎(chǔ)基礎(chǔ)建設(shè)建設(shè)醫(yī)生醫(yī)生引進引進工作人員工作人員 引進引進門診所門診所 建設(shè)建設(shè)設(shè)備設(shè)備建設(shè)建設(shè)環(huán)境環(huán)境建設(shè)建設(shè)1997上海aaabbb1998上海ggaabb1999上海ggggaa2000上海vvvvgg1997北京aabbba1998北京aaaaba1999北京aggggg2000北京avvvgv1997沈陽bbbagb1998沈

37、陽aabagb1999沈陽babaga2000沈陽bbbagb1997武漢abaabb1998武漢aagabb1999武漢gaaabb2000武漢gggaba1997哈爾濱aaabbb1998哈爾濱agbaba1999哈爾濱ggbaab2000哈爾濱vgabaa年限年限樣本樣本基礎(chǔ)基礎(chǔ)建設(shè)建設(shè)醫(yī)生醫(yī)生引進引進工作人工作人員引進員引進門診所門診所 建設(shè)建設(shè)設(shè)備設(shè)備建設(shè)建設(shè)環(huán)境環(huán)境建設(shè)建設(shè)1997重慶babbbb1998重慶aaabba1999重慶agaabb2000重慶ggbabb1997成都abbbab1998成都abaaaa1999成都aagaaa2000成都gggaaa1997蘭州abba

38、ab1998蘭州aaaaaa1999蘭州ggagag2000蘭州vgagvv1997青島bbaabb1998青島bbagab1999青島abggaa2000青島abvvag1997鞍山abbbab1998鞍山ababaa1999鞍山gaabga2000鞍山gaabvg1 1)數(shù)據(jù)預(yù)處理)數(shù)據(jù)預(yù)處理 數(shù)據(jù)進行處理,使得數(shù)據(jù)具有變量和時間特征,如下表所示,數(shù)據(jù)進行處理,使得數(shù)據(jù)具有變量和時間特征,如下表所示,A-FA-F分別代表各分別代表各個標量,中間的個標量,中間的a,b,v,ga,b,v,g為原來變量的取值,為原來變量的取值,1-41-4代表不同的年份代表不同的年份 年限年限樣本樣本基礎(chǔ)建設(shè)基

39、礎(chǔ)建設(shè)A A醫(yī)生引進醫(yī)生引進B B工作人員工作人員引進引進C C門診所建門診所建設(shè)設(shè)D D設(shè)備建設(shè)設(shè)備建設(shè)E E環(huán)境建設(shè)環(huán)境建設(shè)F F19971997上海上海Aa1Aa1Ba1Ba1Ca1Ca1Db1Db1Eb1Eb1Fb1Fb119981998上海上海Ag2Ag2Bg2Bg2Ca2Ca2Da2Da2Eb2Eb2Fb2Fb219991999上海上海Ag3Ag3Bg3Bg3Cg3Cg3Dg3Dg3Ea3Ea3Fa3Fa320002000上海上海Av4Av4Bv4Bv4Cv4Cv4Dv4Dv4Eg4Eg4Fg4Fg4時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)輔

40、助城市醫(yī)療建設(shè)時序關(guān)聯(lián)2 2)時序關(guān)聯(lián)規(guī)則模型建立)時序關(guān)聯(lián)規(guī)則模型建立 時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)3 3)模型結(jié)果分析)模型結(jié)果分析 分別設(shè)置不同的置信度和支持度,運行時序規(guī)則模型,規(guī)則數(shù)目如下:分別設(shè)置不同的置信度和支持度,運行時序規(guī)則模型,規(guī)則數(shù)目如下:最小支持度最小支持度70%70%60%60%50%50%最小置信度最小置信度70%70%60%60%50%50%規(guī)則數(shù)目規(guī)則數(shù)目1 16 63131 最小支持度為最小支持度為60%60%和最小置信度為和最小置信度為60%60%時的時的有效規(guī)則有效規(guī)則前項前項 后

41、項后項支持度支持度 % %置信度置信度 % %Cb1Cb1Aa2Aa260.060.0100.0100.0Aa1Aa1Aa2Aa270.070.085.7185.71Aa1Aa1Da2Da270.070.085.7185.71Fb1Fb1Aa2Aa290.090.077.7877.78Fb1Fb1Ca2Ca290.090.066.6766.67Fb1Fb1Da2Da290.090.066.6766.67時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)將提取的規(guī)則轉(zhuǎn)換為文字:將提取的規(guī)則轉(zhuǎn)換為文字:規(guī)則規(guī)則1 1:若工作人員引進:若工作人員

42、引進=b=b,則第二年基礎(chǔ)建設(shè),則第二年基礎(chǔ)建設(shè)=a=a,支持度為,支持度為60%60%,置信度,置信度100%100%規(guī)則規(guī)則2 2:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a,=a,則第二年基礎(chǔ)建設(shè)則第二年基礎(chǔ)建設(shè)=a=a,支持度為,支持度為70%70%,置信度,置信度85.71%85.71%規(guī)則規(guī)則3 3:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a,=a,則第二年門診所建設(shè)則第二年門診所建設(shè)=a=a,支持度為,支持度為70%70%,置信度,置信度85.71%85.71%規(guī)則規(guī)則4 4:若環(huán)境建設(shè):若環(huán)境建設(shè)=b, =b, 則第二年基礎(chǔ)建設(shè)則第二年基礎(chǔ)建設(shè)=a=a,支持度為,支持度為90%90%,置信度,置信度77.78

43、%77.78%規(guī)則規(guī)則5 5:若環(huán)境建設(shè):若環(huán)境建設(shè)=b, =b, 則工作人員引進則工作人員引進=a=a,支持度為,支持度為90%90%,置信度,置信度66.67%66.67%規(guī)則規(guī)則6 6:若環(huán)境建設(shè):若環(huán)境建設(shè)=b, =b, 則第二年門診所建設(shè)則第二年門診所建設(shè)=a=a,支持度為,支持度為90%90%,置信度,置信度66.67%66.67%時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)若不考慮事務(wù)發(fā)生的時間間隔性,可將數(shù)據(jù)處理為:若不考慮事務(wù)發(fā)生的時間間隔性,可將數(shù)據(jù)處理為:年限年限樣本樣本基礎(chǔ)建設(shè)基礎(chǔ)建設(shè)A A醫(yī)生引進醫(yī)生引進B

44、B工作人員引進工作人員引進C C門診所建設(shè)門診所建設(shè)D D設(shè)備建設(shè)設(shè)備建設(shè)E E環(huán)境建設(shè)環(huán)境建設(shè)F F19971997上海上海AaAaBaBaCaCaDbDbEbEbFbFb19981998上海上海AgAgBgBgCaCaDaDaEbEbFbFb19991999上海上海AgAgBgBgCgCgDgDgEaEaFaFa20002000上海上海AvAvBvBvCvCvDvDvEgEgFgFg分別設(shè)置不同的置信度和支持度,運行分別設(shè)置不同的置信度和支持度,運行時序規(guī)則模型,在沒有先后時間條件下,時序規(guī)則模型,在沒有先后時間條件下,規(guī)則數(shù)目、最小支持度和最小置信度都是規(guī)則數(shù)目、最小支持度和最小置信度都

45、是60%60%的有效規(guī)則如下所示:的有效規(guī)則如下所示:最小支持度最小支持度80%80%70%70%60%60%50%50%最小置信度最小置信度80%80%70%70%60%60%50%50%規(guī)則數(shù)目規(guī)則數(shù)目7 730307777235235前項前項 后項后項支持度支持度 % %置信度置信度 % %FbFbFaFa90.090.0100.0100.0FbFbAaAa90.090.088.8988.89FbFbCaCa90.090.088.8988.89AaAaCaCa100.0100.080.080.0AaAaFaFa100.0100.080.080.0AaAaAaAa100.0100.080.

46、080.0AaAaDaDa100.0100.080.080.0時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)取值沒有時間的時序關(guān)聯(lián),提取規(guī)則的文字表示:取值沒有時間的時序關(guān)聯(lián),提取規(guī)則的文字表示:規(guī)則規(guī)則1 1:若環(huán)境建設(shè):若環(huán)境建設(shè)=b=b,則未來環(huán)境建設(shè),則未來環(huán)境建設(shè)=a=a,支持度為,支持度為90%90%,置信度,置信度100%100%規(guī)則規(guī)則2 2:若環(huán)境建設(shè):若環(huán)境建設(shè)=b=b,則未來基礎(chǔ)建設(shè),則未來基礎(chǔ)建設(shè)=a=a,支持度為,支持度為90%90%,置信度,置信度88.89%88.89%規(guī)則規(guī)則3 3:若環(huán)境建設(shè):若環(huán)境建設(shè)

47、=b=b,則未來工作人員引進,則未來工作人員引進=a=a,支持度為,支持度為90%90%,置信度,置信度88.89%88.89%規(guī)則規(guī)則4 4:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a=a,則未來工作人員引進,則未來工作人員引進=a=a,支持度為,支持度為100%100%,置信度,置信度80%80%規(guī)則規(guī)則5 5:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a=a,則未來環(huán)境建設(shè),則未來環(huán)境建設(shè)=a=a,支持度為,支持度為100%100%,置信度,置信度80%80%規(guī)則規(guī)則6 6:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a=a,則未來基礎(chǔ)建設(shè),則未來基礎(chǔ)建設(shè)=a=a,支持度為,支持度為100%100%,置信度,置信度80%80%規(guī)則規(guī)則7 7

48、:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a=a,則未來門診所建設(shè),則未來門診所建設(shè)=a=a,支持度為,支持度為100%100%,置信度,置信度80%80% 時序關(guān)聯(lián)分析案例時序關(guān)聯(lián)分析案例Clementine12輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)輔助城市醫(yī)療建設(shè)時序關(guān)聯(lián)取值體現(xiàn)時間的時序關(guān)聯(lián),提取規(guī)則的文字表示:取值體現(xiàn)時間的時序關(guān)聯(lián),提取規(guī)則的文字表示:規(guī)則規(guī)則1 1:若工作人員引進:若工作人員引進=b=b,則第二年基礎(chǔ)建設(shè),則第二年基礎(chǔ)建設(shè)=a=a,支持度為,支持度為60%60%,置信度,置信度100%100%規(guī)則規(guī)則2 2:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a,=a,則第二年基礎(chǔ)建設(shè)則第二年基礎(chǔ)建設(shè)=a=a,支持度為,支

49、持度為70%70%,置信度,置信度85.71%85.71%規(guī)則規(guī)則3 3:若基礎(chǔ)建設(shè):若基礎(chǔ)建設(shè)=a,=a,則第二年門診所建設(shè)則第二年門診所建設(shè)=a=a,支持度為,支持度為70%70%,置信度,置信度85.71%85.71%規(guī)則規(guī)則4 4:若環(huán)境建設(shè):若環(huán)境建設(shè)=b, =b, 則第二年基礎(chǔ)建設(shè)則第二年基礎(chǔ)建設(shè)=a=a,支持度為,支持度為90%90%,置信度,置信度77.78%77.78%規(guī)則規(guī)則5 5:若環(huán)境建設(shè):若環(huán)境建設(shè)=b, =b, 則工作人員引進則工作人員引進=a=a,支持度為,支持度為90%90%,置信度,置信度66.67%66.67%規(guī)則規(guī)則6 6:若環(huán)境建設(shè):若環(huán)境建設(shè)=b, =

50、b, 則第二年門診所建設(shè)則第二年門診所建設(shè)=a=a,支持度為,支持度為90%90%,置信度,置信度66.67%66.67%遺傳算法遺傳算法基本概念基本概念P241七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法問題:問題:1、如何求一組評價指標值(、如何求一組評價指標值(X1,X2,X3,X4,X5),使醫(yī)療評價能力最大且醫(yī)療成本最?。?,使醫(yī)療評價能力最大且醫(yī)療成本最?。?2、對、對N個股票,如何分配投資比例,使收益最大且風(fēng)險在可接受范圍?個股票,如何分配投資比例,使收益最大且風(fēng)險在可接受范圍? 3、要使網(wǎng)絡(luò)收益在期望范圍,影響網(wǎng)絡(luò)收益的因素應(yīng)在什么范圍變化?、要使網(wǎng)絡(luò)收益在期望范圍,影響網(wǎng)絡(luò)

51、收益的因素應(yīng)在什么范圍變化?特點:隨機搜索,優(yōu)勝劣汰特點:隨機搜索,優(yōu)勝劣汰七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法基本概念基本概念P241-242七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法基本概念基本概念補充補充七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法補充補充P242七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法 對個體進行選擇復(fù)制對個體進行選擇復(fù)制 按一定概率和定義進行變異按一定概率和定義進行變異 按一定概率和定義進行交叉按一定概率和定義進行交叉滿足終止條件滿足終止條件 對每一個體計算適應(yīng)值對每一個體計算適應(yīng)值 顯示適應(yīng)值或最優(yōu)解顯示

52、適應(yīng)值或最優(yōu)解 隨機產(chǎn)生初始種群隨機產(chǎn)生初始種群遺傳算法遺傳算法主要流程主要流程P243遺傳算法遺傳算法編碼設(shè)計編碼設(shè)計P242七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法編碼設(shè)計編碼設(shè)計P242七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法適應(yīng)值函數(shù)設(shè)計適應(yīng)值函數(shù)設(shè)計P243七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法選擇選擇算子設(shè)計算子設(shè)計P244遺傳算法遺傳算法選擇選擇算子設(shè)計算子設(shè)計P244遺傳算法遺傳算法交叉算子設(shè)計交叉算子設(shè)計P245遺傳算法遺傳算法交叉算子設(shè)計交叉算子設(shè)計P246七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳

53、算法遺傳算法遺傳算法交叉算子設(shè)計交叉算子設(shè)計P246七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法交叉算子設(shè)計交叉算子設(shè)計P246七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法交叉算子設(shè)計交叉算子設(shè)計P246遺傳算法遺傳算法交叉算子設(shè)計交叉算子設(shè)計P246七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法變異變異算子設(shè)計算子設(shè)計P247遺傳算法遺傳算法變異變異算子設(shè)計算子設(shè)計P247七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法應(yīng)用例應(yīng)用例P247七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法應(yīng)用例應(yīng)用例P2

54、48遺傳算法遺傳算法應(yīng)用例應(yīng)用例P249七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化P250遺傳算法遺傳算法應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化P250七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化P250七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化P250七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化P251七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法

55、遺傳算法遺傳算法應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化P251七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法模式定理有關(guān)概念模式定理有關(guān)概念P251七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法遺傳算法模式定理有關(guān)概念模式定理有關(guān)概念P252遺傳算法遺傳算法模式定理有關(guān)概念模式定理有關(guān)概念P252遺傳算法的遺傳算法的模式定理有關(guān)概念模式定理有關(guān)概念P253七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法遺傳算法的遺傳算法的模式定理模式定理P254 分析:分析:第二章管理與決策支持的數(shù)據(jù)挖掘方法(三)第二章管理與決策支持的數(shù)據(jù)挖掘方法(三)遺傳算法的遺傳算法的模式定

56、理模式定理P2542 2)遺傳算法的遺傳算法的模式定理模式定理P2543 3)4 4)遺傳算法的遺傳算法的模式定理模式定理P2545 5)七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法問題描述問題描述 在城市醫(yī)療能力評價中,令在城市醫(yī)療能力評價中,令X1病床數(shù),病床數(shù),X2醫(yī)生數(shù),醫(yī)生數(shù),X3工作人員工作人員數(shù),數(shù),X4診所數(shù),診所數(shù),X5死亡率,死亡率,Y醫(yī)療能力,醫(yī)療能力, 若設(shè)若設(shè)Xi?1000,10000,i=1,2,3,X4 ?10,100, X5 ?0,0.2,Y ?0,1, X=(X1,X2,X3,X4,X5)要求:要求:設(shè)計遺傳算法,求達到醫(yī)療能力最好且總成本最小的設(shè)計遺傳算

57、法,求達到醫(yī)療能力最好且總成本最小的X(即(即Xi的最優(yōu)組的最優(yōu)組合)?合)?設(shè)計包括:設(shè)計包括:(1)定義醫(yī)生、病床、工作人員、診所的成本條件;)定義醫(yī)生、病床、工作人員、診所的成本條件;(2)設(shè)計編碼、適值函數(shù)、選擇算子、交叉算子和變異算子;)設(shè)計編碼、適值函數(shù)、選擇算子、交叉算子和變異算子; 其中,適應(yīng)值函數(shù)要求設(shè)計為一般形式;當(dāng)輸入其中,適應(yīng)值函數(shù)要求設(shè)計為一般形式;當(dāng)輸入ai、bi、C、D時,可以時,可以建立不同參數(shù)下的適值函數(shù)建立不同參數(shù)下的適值函數(shù): DcbXaXfnitiii1)(1)(軟件輔助遺傳算法的求解軟件輔助遺傳算法的求解七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法

58、七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法 為了能夠使用為了能夠使用MatlabMatlab里面的遺傳算法工具箱來解決此次問題,需要把里面的遺傳算法工具箱來解決此次問題,需要把MatlabMatlab升級到升級到7.107.10(20122012版本)或者以上。版本)或者以上。 打開打開MatlabMatlab之后,直接的窗口中輸入之后,直接的窗口中輸入optimtooloptimtool,然后選擇,然后選擇gaga,或者直接輸入,或者直接輸入gatoolgatool,調(diào)用遺傳,調(diào)用遺傳算法工具箱。如下圖所示:算法工具箱。如下圖所示: 界面分界面分3 3個板塊,其中個板塊,其中左邊和中間

59、左邊和中間的板塊是遺傳算法參數(shù)的設(shè)置區(qū)域,第三板塊是對于各個參數(shù)的板塊是遺傳算法參數(shù)的設(shè)置區(qū)域,第三板塊是對于各個參數(shù)的說明。的說明。 在使用遺傳算法工具箱之前,需要對之前寫好的適應(yīng)值函數(shù)做小小的修改,以使其能應(yīng)用在遺在使用遺傳算法工具箱之前,需要對之前寫好的適應(yīng)值函數(shù)做小小的修改,以使其能應(yīng)用在遺傳算法工具箱里面。傳算法工具箱里面。 七、數(shù)據(jù)挖掘方法七、數(shù)據(jù)挖掘方法遺傳算法遺傳算法利用利用Matlab的多層感知機的神經(jīng)網(wǎng)絡(luò)模型,學(xué)習(xí)后提取的模型參數(shù)如下:的多層感知機的神經(jīng)網(wǎng)絡(luò)模型,學(xué)習(xí)后提取的模型參數(shù)如下:隱節(jié)點隱節(jié)點1 1權(quán)值權(quán)值1 1:1.37141.3714閾值:閾值:0.295420

60、.29542權(quán)值權(quán)值2 2:3.21343.2134權(quán)值權(quán)值3 3:1.91931.9193權(quán)值權(quán)值4 4:0.662170.66217權(quán)值權(quán)值5 5:1.97821.9782隱節(jié)點隱節(jié)點2 2權(quán)值權(quán)值1 1:-3.4496-3.4496閾值:閾值:-0.0020444-0.0020444權(quán)值權(quán)值2 2:-1.2138-1.2138權(quán)值權(quán)值3 3:1.62771.6277權(quán)值權(quán)值4 4:-2.7673-2.7673權(quán)值權(quán)值5 5:0.0430260.043026隱節(jié)點隱節(jié)點3 3權(quán)值權(quán)值1 1:2.80842.8084閾值:閾值:0.50380.5038權(quán)值權(quán)值2 2:-0.93835-0.93835權(quán)值權(quán)值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論