版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
指導(dǎo)教師:XXX人工智能指導(dǎo)教師:XXX人工智能9.1知識工程簡介9.2專家系統(tǒng)可以解決的問題9.3模糊專家可以解決的問題9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題9.5遺傳算法可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)第九章知識工程和數(shù)據(jù)挖掘第九章知識工程和數(shù)據(jù)挖掘9.1本章討論如何選擇正確的工具,構(gòu)建智能系統(tǒng)并將數(shù)據(jù)轉(zhuǎn)化為知識?選擇正確的工具對于構(gòu)建智能系統(tǒng)而言是最關(guān)鍵的部分構(gòu)建智能系統(tǒng)的過程從理解問題域開始。首先要評估問題,確定可用的數(shù)據(jù)及解決問題需要的信息。一旦理解了問題,就可以選擇合適的工具并用這個工具開發(fā)系統(tǒng)了9.1本章討論如何選擇正確的工具,構(gòu)建智能系統(tǒng)并將數(shù)據(jù)轉(zhuǎn)化構(gòu)建基于知識的智能系統(tǒng)的過程稱為知識工程知識有6個基本階段1)評估問題2)獲取數(shù)據(jù)和知識3)開發(fā)原型系統(tǒng)4)開發(fā)完整的系統(tǒng)5)評估并修訂系統(tǒng)6)整合和維護(hù)系統(tǒng)構(gòu)建基于知識的智能系統(tǒng)的過程稱為知識工程知識有6個基本階段9.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?案例:診斷專家系統(tǒng)開發(fā)一個智能系統(tǒng),幫助修理Mac電腦的故障。專家系統(tǒng)可以解決這樣的問題嗎?9.2專家系統(tǒng)可以解決什么問題?案例:診斷專家系統(tǒng)要開發(fā)計算機(jī)診斷系統(tǒng),就要獲取計算機(jī)故障排除的知識。使用故障排除手冊是比較好的方法,手冊中的知識非常簡練,幾乎可以直接用在專家系統(tǒng)中。完全可以不必咨詢專家。9.2專家系統(tǒng)可以解決什么問題?要開發(fā)計算機(jī)診斷系統(tǒng),就要獲取計算機(jī)故障排除的知識。9.2故障是通過一系列可視的檢查或測試來發(fā)現(xiàn)的。首先收集最初的信息(系統(tǒng)沒有啟動),根據(jù)其作出推斷。然后,收集另外的信息(電源良好、電線沒有問題)。最終確定導(dǎo)致故障的原因。9.2專家系統(tǒng)可以解決什么問題?故障是通過一系列可視的檢查或測試來發(fā)現(xiàn)的。9.2專家系統(tǒng)可大9.2專家系統(tǒng)可以解決什么問題?大9.2專家系統(tǒng)可以解決什么問題?Rule:1if taskis‘systemstart-up’then askproblemRule:2if taskis‘systemstart-up’and problemis‘systemdoesnotstart’then ask‘testpowercords’Rule:3if taskis‘systemstart-up’and problemis‘systemdoesnotstart’and ‘testpowercords’isokthen ask‘testPowerstrip’9.2專家系統(tǒng)可以解決什么問題?Rule:19.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?如何選擇專家系統(tǒng)開發(fā)工具?應(yīng)該使問題的特征和工具的功能相匹配工具不僅包含高級程序語言,如LISP、OPS、C、Java,也包含專家系統(tǒng)框架語言提供了更大的靈活性,但是要求的編程技巧也很高框架雖然不靈活,但是提供了內(nèi)建推理引擎、解釋工具盒用戶界面,只需輸入英語編寫的規(guī)則,可快速構(gòu)建原型9.2專家系統(tǒng)可以解決什么問題?如何選擇專家系統(tǒng)開發(fā)工具?9.2專家系統(tǒng)可以解決什么問題?如何選擇框架?選擇專家系統(tǒng)框架的時候,要考慮的是如何表達(dá)知識的(規(guī)則或者結(jié)構(gòu))它使用的推理機(jī)制(前向鏈接或者后向鏈接)是什么框架是否支持部準(zhǔn)確的推理以及使用的技術(shù)是什么(貝葉斯推理、確定因子或者模糊邏輯)框架是否有“開放”的架構(gòu)以允許使用外部的數(shù)據(jù)文件和程序以及用戶如何和專家系統(tǒng)交互選擇工具的一個重要指標(biāo)是提供工具的公司的穩(wěn)定性9.2專家系統(tǒng)可以解決什么問題?如何選擇框架?9.2專家系統(tǒng)可以解決什么問題?公司穩(wěn)定性的指標(biāo)是什么一些重要的指標(biāo),例如,公司是哪年成立的、員工的人數(shù)、總收入、智能系統(tǒng)產(chǎn)品的總收入如、已售產(chǎn)品的數(shù)量等。9.2專家系統(tǒng)可以解決什么問題?公司穩(wěn)定性的指標(biāo)是什么9.2專家系統(tǒng)可以解決什么問題?要先確定模糊技術(shù)是否適合解決這類問題如果不能為每個可能的情況制定出一系列的規(guī)則,那就使用模糊邏輯。如果問題本身就不嚴(yán)密,那么模糊技術(shù)就是最好的選擇案例3:決策支持模糊技術(shù)開發(fā)一個智能系統(tǒng)來評估抵押申請。模糊專家系統(tǒng)能處理這樣的問題嗎?9.3模糊專家系統(tǒng)可以解決的問題要先確定模糊技術(shù)是否適合解決這類問題9.3模糊專家系統(tǒng)可以首先用模糊術(shù)語表達(dá)抵押申請評估中的基本概念然后用合適的模糊工具在原型系統(tǒng)中實(shí)現(xiàn)這個概念最后用選定的測試用例來測試和優(yōu)化系統(tǒng)9.3模糊專家系統(tǒng)可以解決的問題首先用模糊術(shù)語表達(dá)抵押申請評估中的基本概念9.3模糊專家系9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題開發(fā)原型系統(tǒng)的最后一個階段是評估和測試9.3模糊專家系統(tǒng)可以解決的問題開發(fā)原型系統(tǒng)的最后一個階段是評估和測試9.3模糊專家系統(tǒng)可案例5:預(yù)測神經(jīng)網(wǎng)絡(luò)開發(fā)一個進(jìn)行房地產(chǎn)評估的智能系統(tǒng),神經(jīng)網(wǎng)絡(luò)可以解決這個問題嗎?房地產(chǎn)評估是一個根據(jù)類似住房銷售價格的知識預(yù)測給定房產(chǎn)的市場價的問題選擇神經(jīng)網(wǎng)絡(luò),我們無法理解房產(chǎn)的估價是如何得出的,因?yàn)樯窠?jīng)網(wǎng)絡(luò)對于用戶來講是個黑盒子9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題案例5:預(yù)測神經(jīng)網(wǎng)絡(luò)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題輸入(房產(chǎn)的位置、居住面積、臥室數(shù)量、浴室數(shù)量、土地尺寸、供熱系統(tǒng)等)輸出就是我們試圖預(yù)測的結(jié)果我們有很多例子來訓(xùn)練神經(jīng)網(wǎng)絡(luò),即最近銷售的房屋及其價格的特征,訓(xùn)練集需要足夠的豐富9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題輸入(房產(chǎn)的位置、居住面積、臥室數(shù)量、浴室數(shù)量、土地尺寸、供如何讓確定訓(xùn)練集“足夠大”?網(wǎng)絡(luò)的推廣能力取決于三個主要因素:訓(xùn)練集大小、網(wǎng)絡(luò)的架構(gòu)和問題的復(fù)雜性。公式其中N是訓(xùn)練例子的數(shù)量,nw是網(wǎng)絡(luò)中突出權(quán)重的數(shù)量,e是測試允許額網(wǎng)絡(luò)誤差有些特征(例如房子的條件和位置)可以確定在1(沒有吸引力)到10(很有吸引力之間)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何讓確定訓(xùn)練集“足夠大”?9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題修改數(shù)據(jù)數(shù)據(jù)分為三種類型:連續(xù)數(shù)據(jù)、離散數(shù)據(jù)和分類數(shù)據(jù)
例如,例子中的面積在59~231,我們可以將最小值設(shè)為50,最大值設(shè)為250,任何地域最小值的值都映射為最小值,大于最大值的值映射為最大值實(shí)際面積為121,9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題修改數(shù)據(jù)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題離散數(shù)據(jù),例如臥室的數(shù)量和浴室的數(shù)量,也有最大值和最小值臥室的數(shù)量一般為0~4修改后的離散數(shù)據(jù)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題離散數(shù)據(jù),例如臥室的數(shù)量和浴室的數(shù)量,也有最大值和最小值9.分類數(shù)據(jù),例如性別和婚姻狀態(tài)可以用1/N編碼來修改例如,婚姻狀態(tài)可以是單身、離異、已婚、#寡,已婚的人可以用(0010)表示9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題分類數(shù)據(jù),例如性別和婚姻狀態(tài)可以用1/N編碼來修改9.4神輸入層(有十個神經(jīng)元)將修改后的輸入值傳到隱含層隱含層包含兩個神經(jīng)元,輸出層只有一個神經(jīng)元,隱含層和輸出層的神經(jīng)元使用S型激活函數(shù)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題輸入層(有十個神經(jīng)元)將修改后的輸入值傳到隱含層9.4神經(jīng)如何解釋網(wǎng)絡(luò)的輸出?網(wǎng)絡(luò)輸出層的值為0~1之間的連續(xù)值,要解釋這個結(jié)果只需要倒轉(zhuǎn)程序即可例如,在訓(xùn)練集中,銷售價格的范圍在$52500~$225000之間,輸出值將$50000映射為0,$250000映射為1,如果網(wǎng)絡(luò)的輸出是0.3546,結(jié)果為9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何解釋網(wǎng)絡(luò)的輸出?9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何驗(yàn)證結(jié)果?為了驗(yàn)證結(jié)果可以使用沒有遇到過的例子集。在訓(xùn)練前,將所有可用的數(shù)據(jù)隨機(jī)分成訓(xùn)練集和測試集,可以用測試集進(jìn)行測試神經(jīng)網(wǎng)絡(luò)是不透明的,要想把握輸入輸出之間的關(guān)系,可以通過靈敏度分析執(zhí)行靈敏度分析要將每個輸入設(shè)成最小值,然后再設(shè)成最大值,并測量網(wǎng)絡(luò)的輸出9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何驗(yàn)證結(jié)果?9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題遺傳算法可以用于很多優(yōu)化問題。優(yōu)化是為問題尋找較好解決方法的基本過程。問題可能有多余一個的解決方案,而這些解決方案品質(zhì)不同。遺傳算法產(chǎn)生候選解決種群,然后通過自然選擇使這些解決方案進(jìn)化,不好的解決方案趨向于淘汰,好的方案存活并繼續(xù)繁殖。不斷的重復(fù)這個過程,遺傳算法就得到了最優(yōu)解9.5遺傳算法可以解決的問題遺傳算法可以用于很多優(yōu)化問題。優(yōu)化是為問題尋找較好解決方法的案例:旅行推銷員問題開發(fā)一個可以產(chǎn)生優(yōu)化路線的智能系統(tǒng),開車旅行并參觀歐洲中部和西部的主要城市然后再回家,遺傳算法可以解決這個問題嗎?這就是著名的旅行推銷員問題(TSP)。給定有限個城市N,以及每兩個城市之間旅行的費(fèi)用(或距離),我們要找出花費(fèi)最少(或路程最短)的路線,而每個城市都能到達(dá)且僅到達(dá)一次后回到出發(fā)點(diǎn)TSP問題經(jīng)常出現(xiàn)在運(yùn)輸和后勤應(yīng)用中,例如學(xué)校所屬區(qū)域接送孩子,給回家的人送飯,安排收取郵件的卡車路線9.5遺傳算法可以解決的問題案例:旅行推銷員問題9.5遺傳算法可以解決的問題遺傳算法是怎么解決TSP問題的?首先,要決定如何表達(dá)推銷員的路線。最自然的方法就是路徑表示法。每個城市用字母或數(shù)字命名,城市間的路線用染色體來表示,用合適的遺傳操作來產(chǎn)生新的路線9.5遺傳算法可以解決的問題遺傳算法是怎么解決TSP問題的?9.5遺傳算法可以解決的問TSP中的交叉操作如何進(jìn)行傳統(tǒng)形式的交叉操作不能直接在TSP中使用9.5遺傳算法可以解決的問題TSP中的交叉操作如何進(jìn)行9.5遺傳算法可以解決的問題TSP交叉過程9.5遺傳算法可以解決的問題TSP交叉過程9.5遺傳算法可以解決的問題TSP突變操作如何進(jìn)行?有兩種突變操作:倒數(shù)交換和倒置9.5遺傳算法可以解決的問題TSP突變操作如何進(jìn)行?9.5遺傳算法可以解決的問題如何定義TSP的適應(yīng)函數(shù)?(標(biāo)準(zhǔn))一旦定義了適應(yīng)性函數(shù)和遺傳操作,就可以實(shí)現(xiàn)并運(yùn)行GA例如,假設(shè)在一個1*1的正方形中有20個城市首先選擇染色體種群的大小和遺傳代數(shù)??梢宰尫N群從小到大。9.5遺傳算法可以解決的問題如何定義TSP的適應(yīng)函數(shù)?(標(biāo)準(zhǔn))9.5遺傳算法可以解決的9.5遺傳算法可以解決的問題9.5遺傳算法可以解決的問題如何得知已經(jīng)找到了最佳路線?實(shí)際上我們不可能知道是否找到了最佳路線。只有用不同的染色體種群大小、不同的交叉率和突變率做更多的測試,才能得到答案9.5遺傳算法可以解決的問題如何得知已經(jīng)找到了最佳路線?9.5遺傳算法可以解決的問題要解決現(xiàn)實(shí)世界中復(fù)雜的應(yīng)用問題,需要融合專家系統(tǒng)、模糊邏輯、神經(jīng)網(wǎng)絡(luò)和進(jìn)化計算這些方法的優(yōu)點(diǎn)的復(fù)雜智能系統(tǒng)混合智能系統(tǒng)還在發(fā)展中,神經(jīng)網(wǎng)絡(luò)可以從數(shù)據(jù)中進(jìn)行學(xué)習(xí),模糊邏輯最重要的優(yōu)勢是模擬人類的決策能力9.6混合智能系統(tǒng)可以解決的問題要解決現(xiàn)實(shí)世界中復(fù)雜的應(yīng)用問題,需要融合專家系統(tǒng)、模糊邏輯、案例:神經(jīng)模糊決策支持系統(tǒng)開發(fā)一個根據(jù)心臟圖像進(jìn)行心肌灌注診斷的智能系統(tǒng)。有一些心臟圖像以及臨床說明和應(yīng)聲的注解?;旌舷到y(tǒng)可以解決這個問題嗎?9.6混合智能系統(tǒng)可以解決的問題案例:神經(jīng)模糊決策支持系統(tǒng)9.6混合智能系統(tǒng)可以解決的問題現(xiàn)代心臟內(nèi)科學(xué)診斷的基礎(chǔ)是分析SPECT(單光子發(fā)射計算機(jī)斷層圖像)圖像。給患者注入放射性示蹤劑,就可以獲得兩套SPECT圖像(負(fù)荷圖像和靜息圖像),心臟專家通過比較兩個圖像就可以發(fā)現(xiàn)心臟功能的異常SPECT圖像時一種256個灰度的高分辨率的二維黑白圖像。圖像中比較明亮的地方和心肌灌注良好的部分對應(yīng),較暗的地方表示缺血,通過觀察SPECT圖像比較主觀,容易出錯,所以智能系統(tǒng)就體現(xiàn)了很大的價值所在9.6混合智能系統(tǒng)可以解決的問題現(xiàn)代心臟內(nèi)科學(xué)診斷的基礎(chǔ)是分析SPECT(單光子發(fā)射計算機(jī)斷在本案例中我們使用276個心臟診斷病例。每個病例有2個SPECT圖像,每個圖像分成22個區(qū)域,用0~100的整數(shù)表示灌注是否良好每個心臟診斷病例用44個連續(xù)的特征和一個二值特征來表示,二值特征表示最后的診斷異?;蛘哒U麄€SPECT的數(shù)據(jù)集有55個正常病例(陽性病例)和212個異常病例(陰性病例)。數(shù)據(jù)集分成訓(xùn)練集和測試集。訓(xùn)練集有40個陽性病例和40個陰性病例,測試集有15個陽性病例和172個陰性病例9.6混合智能系統(tǒng)可以解決的問題在本案例中我們使用276個心臟診斷病例。每個病例有2個SPE可以訓(xùn)練后向傳送神經(jīng)網(wǎng)絡(luò)來SPECT圖像分成正常圖像和異常圖像嗎?后向傳送神經(jīng)網(wǎng)絡(luò)確實(shí)可以用于分類SPECT圖像-訓(xùn)練集足夠大,則網(wǎng)絡(luò)就可以完成分類。但是,在用測試集進(jìn)行測試時,我們發(fā)現(xiàn)網(wǎng)絡(luò)的性能很差-大概25%的正常心臟診斷病例被無分為異常,而超過35%的異常病例被診斷為正常,總的誤差達(dá)到了33%。9.6混合智能系統(tǒng)可以解決的問題可以訓(xùn)練后向傳送神經(jīng)網(wǎng)絡(luò)來SPECT圖像分成正常圖像和異常圖這就表示訓(xùn)練集中缺少些重要的病例對異常病例的誤分類的后果要比正常對正常病例誤分類的結(jié)果嚴(yán)重的多。因此,要減少異常的誤分類比例,就要增加正常圖像的誤分類比例神經(jīng)網(wǎng)絡(luò)陳勝兩種輸出:圖像屬于normal類的概率和abnormal例:0.92和0.16正常017和0.51異常0.51和0.49無法判斷9.6混合智能系統(tǒng)可以解決的問題這就表示訓(xùn)練集中缺少些重要的病例9.6混合智能系統(tǒng)可以解決可以在醫(yī)學(xué)診斷的決策制定中使用模糊邏輯嗎?實(shí)際上,醫(yī)生通過依賴于自身的經(jīng)驗(yàn)和直覺來發(fā)現(xiàn)心肌的異常情況。模糊邏輯就是一種模擬心臟專家評估心臟病發(fā)作風(fēng)險的辦法構(gòu)建模糊系統(tǒng),首先要確定輸入(NNoutput1和NNoutput2[0~1])和輸出(心臟病發(fā)作的風(fēng)險),定義模糊集,構(gòu)建模糊規(guī)則9.6混合智能系統(tǒng)可以解決的問題可以在醫(yī)學(xué)診斷的決策制定中使用模糊邏輯嗎?9.6混合智能系9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題風(fēng)險在30%~50%之間的病例很難歸類為normal或abnormal,這樣的病例是不確定的我們可以用心臟專家的經(jīng)驗(yàn)和知識將這些不確定的病例分類嗎?9.6混合智能系統(tǒng)可以解決的問題風(fēng)險在30%~50%之間的病例很難歸類為normal或abn1)如果區(qū)域i在負(fù)荷時的灌注高于靜息時的灌注,則心臟病的風(fēng)險減少2)如果區(qū)域i在負(fù)荷時的灌注不高于靜息時的灌注,則心臟病的風(fēng)險增加步驟1:將心臟病病例輸入神經(jīng)模糊系統(tǒng)步驟2:如果風(fēng)險不在30%~50%之間,結(jié)束。否則,到步驟3步驟3:對于區(qū)域1,負(fù)荷時的灌注高于靜息時的灌注,則將結(jié)果乘以0.99以減少當(dāng)前風(fēng)險,否則乘以1.01來增加當(dāng)前的風(fēng)險。重復(fù)直至22個區(qū)域都計算完步驟4:如果還有在30%~50%之間的則還確定為uncertain類9.6混合智能系統(tǒng)可以解決的問題1)如果區(qū)域i在負(fù)荷時的灌注高于靜息時的灌注,則心臟病的風(fēng)發(fā)現(xiàn)分類的準(zhǔn)確性得到了很大的提升:總體的診斷誤差率不超過5%,僅有3%的異常病例誤歸到正常類。正常病例的誤診率較高,但是也好過心臟專家的分類結(jié)果9.6混合智能系統(tǒng)可以解決的問題發(fā)現(xiàn)分類的準(zhǔn)確性得到了很大的提升:總體的診斷誤差率不超過5%數(shù)據(jù)是我們收集和存儲的,知識是幫助我們做決策的。從數(shù)據(jù)中提取知識稱為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘也可以定義成在大量數(shù)據(jù)中進(jìn)行探索和分析,以便發(fā)現(xiàn)有意義的模式和規(guī)則。數(shù)據(jù)挖掘的最終目標(biāo)是發(fā)現(xiàn)知識我們生活在數(shù)據(jù)快速增長的時代,需要有能夠幫助我們提取有意義的信息和知識的方法9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)數(shù)據(jù)是我們收集和存儲的,知識是幫助我們做決策的。從數(shù)據(jù)中提取現(xiàn)代企業(yè)必須對市場的變化做出快速響應(yīng),需要快速的助理數(shù)據(jù)倉庫中當(dāng)前的數(shù)據(jù)什么是數(shù)據(jù)倉庫?數(shù)據(jù)倉庫的主要特征是容量數(shù)據(jù)倉庫是用來支持企業(yè)制定決策的,所需要的數(shù)據(jù)通過查詢工具來獲得查詢工具和數(shù)據(jù)挖掘之間區(qū)別查詢工具需要假設(shè),數(shù)據(jù)挖掘不需要假設(shè)9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)現(xiàn)代企業(yè)必須對市場的變化做出快速響應(yīng),需要快速的助理數(shù)據(jù)倉庫數(shù)據(jù)挖掘還是一個全新的不斷發(fā)展的領(lǐng)域,但是他在銀行、金融、營銷和電信領(lǐng)域已經(jīng)有了大量的應(yīng)用統(tǒng)計方法不能解決數(shù)據(jù)挖掘的問題數(shù)據(jù)挖掘通常使用神經(jīng)網(wǎng)絡(luò)和神經(jīng)模糊系統(tǒng)。數(shù)據(jù)挖掘最常見的工具是決策樹9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)數(shù)據(jù)挖掘還是一個全新的不斷發(fā)展的領(lǐng)域,但是他在銀行、金融、營決策樹可以定義為推理過程的圖。通過樹形結(jié)構(gòu)來表述數(shù)據(jù)集。特別適合解決分類問題決策樹包含節(jié)點(diǎn)、分支和葉子9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)決策樹可以定義為推理過程的圖。9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)大大因變量決定研究的目標(biāo),他是由用戶選擇的。Household被設(shè)置成因變量取值可以是responded或notresponded兩種根節(jié)點(diǎn)下面是樹的下一層。書選擇了變量Homeownership作為因變量的預(yù)測器,并將所有的家庭按照預(yù)測器的值進(jìn)行拆分。數(shù)據(jù)的拆分也叫分割。9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)因變量決定研究的目標(biāo),他是由用戶選擇的。Household被最佳分割最適合用于創(chuàng)建某一類占主導(dǎo)地位的節(jié)點(diǎn)有幾種方法可以計算分割數(shù)據(jù)的預(yù)測器的能力,最好的方法是基于基尼不均勻系數(shù)基尼系數(shù)是評價預(yù)測器分割秦代節(jié)點(diǎn)中所包含的類的好壞的一種度量方法9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)最佳分割最適合用于創(chuàng)建某一類占主導(dǎo)地位的節(jié)點(diǎn)9.7數(shù)據(jù)挖掘?qū)蔷€和財富絕對均等分配相對應(yīng),上曲線為真實(shí)的經(jīng)濟(jì)情況基尼系數(shù)就是陰影面積除以對角線下方的面積9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)對角線和財富絕對均等分配相對應(yīng),上曲線為真實(shí)的經(jīng)濟(jì)情況9.7決策樹要盡力分割出最大的一個類不存在可以把一個類和另一個類明確分隔開的數(shù)據(jù)庫字段9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)決策樹要盡力分割出最大的一個類9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)用基尼不均等度量選擇的分割自動生長大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)用基尼不均等度量選擇的分割自動生大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)按照經(jīng)驗(yàn)進(jìn)行猜測來分割大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)按照經(jīng)驗(yàn)進(jìn)行猜測來分割大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)從根節(jié)點(diǎn)到東段節(jié)點(diǎn)的路徑就是決策規(guī)則if (Predictor1=no)and (Predictor4=no)and (Predictor6=no)then class=ClassA9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)從根節(jié)點(diǎn)到東段節(jié)點(diǎn)的路徑就是決策規(guī)則9.7數(shù)據(jù)挖掘和知識發(fā)案例:數(shù)據(jù)挖掘的決策樹有一份公眾健康調(diào)查的結(jié)果,想知道那些人有患高血壓的風(fēng)險。決策樹可以解決這個問題嗎?決策樹的典型任務(wù)是確定導(dǎo)致某種結(jié)果的條件。因此用決策樹來勾勒患有高血壓的人群是很好的選擇9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)案例:數(shù)據(jù)挖掘的決策樹9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)首先,保持?jǐn)?shù)據(jù)是干凈的,決策樹不能處理有噪音和被污染的數(shù)據(jù)然后,增加數(shù)據(jù),例如obesity選擇決策樹工具,本案例用的是Angoss的KnowledgeSEEKER,用Bloodpresure作文根節(jié)點(diǎn)開始構(gòu)建決策樹,將所有答卷人分為三類:optimal、normal、high9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)首先,保持?jǐn)?shù)據(jù)是干凈的,決策樹不能處理有噪音和被污染的數(shù)據(jù)9KnowledgeSEEKER確定每個變量對血壓的影響,并將最重要的變量排序9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)KnowledgeSEEKER確定每個變量對血壓的影響,并將大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)大9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)決策樹優(yōu)勢在于結(jié)果的可視化,容易跟蹤某條路徑。決策樹發(fā)現(xiàn)的關(guān)系可以用一系列規(guī)則表示,規(guī)則可以用于開發(fā)專家系統(tǒng)缺點(diǎn):連續(xù)數(shù)據(jù)必須按范圍進(jìn)行分組,數(shù)據(jù)必須是干凈的,每次處理的變量不能超過一個盡管有缺點(diǎn),但是決策樹還是數(shù)據(jù)挖掘所使用的最成功的技術(shù),能夠產(chǎn)生清晰地規(guī)則9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)決策樹優(yōu)勢在于結(jié)果的可視化,容易跟蹤某條路徑。決策樹發(fā)現(xiàn)的關(guān)Thankyou!Thankyou!指導(dǎo)教師:XXX人工智能指導(dǎo)教師:XXX人工智能9.1知識工程簡介9.2專家系統(tǒng)可以解決的問題9.3模糊專家可以解決的問題9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題9.5遺傳算法可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)第九章知識工程和數(shù)據(jù)挖掘第九章知識工程和數(shù)據(jù)挖掘9.1本章討論如何選擇正確的工具,構(gòu)建智能系統(tǒng)并將數(shù)據(jù)轉(zhuǎn)化為知識?選擇正確的工具對于構(gòu)建智能系統(tǒng)而言是最關(guān)鍵的部分構(gòu)建智能系統(tǒng)的過程從理解問題域開始。首先要評估問題,確定可用的數(shù)據(jù)及解決問題需要的信息。一旦理解了問題,就可以選擇合適的工具并用這個工具開發(fā)系統(tǒng)了9.1本章討論如何選擇正確的工具,構(gòu)建智能系統(tǒng)并將數(shù)據(jù)轉(zhuǎn)化構(gòu)建基于知識的智能系統(tǒng)的過程稱為知識工程知識有6個基本階段1)評估問題2)獲取數(shù)據(jù)和知識3)開發(fā)原型系統(tǒng)4)開發(fā)完整的系統(tǒng)5)評估并修訂系統(tǒng)6)整合和維護(hù)系統(tǒng)構(gòu)建基于知識的智能系統(tǒng)的過程稱為知識工程知識有6個基本階段9.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?案例:診斷專家系統(tǒng)開發(fā)一個智能系統(tǒng),幫助修理Mac電腦的故障。專家系統(tǒng)可以解決這樣的問題嗎?9.2專家系統(tǒng)可以解決什么問題?案例:診斷專家系統(tǒng)要開發(fā)計算機(jī)診斷系統(tǒng),就要獲取計算機(jī)故障排除的知識。使用故障排除手冊是比較好的方法,手冊中的知識非常簡練,幾乎可以直接用在專家系統(tǒng)中。完全可以不必咨詢專家。9.2專家系統(tǒng)可以解決什么問題?要開發(fā)計算機(jī)診斷系統(tǒng),就要獲取計算機(jī)故障排除的知識。9.2故障是通過一系列可視的檢查或測試來發(fā)現(xiàn)的。首先收集最初的信息(系統(tǒng)沒有啟動),根據(jù)其作出推斷。然后,收集另外的信息(電源良好、電線沒有問題)。最終確定導(dǎo)致故障的原因。9.2專家系統(tǒng)可以解決什么問題?故障是通過一系列可視的檢查或測試來發(fā)現(xiàn)的。9.2專家系統(tǒng)可大9.2專家系統(tǒng)可以解決什么問題?大9.2專家系統(tǒng)可以解決什么問題?Rule:1if taskis‘systemstart-up’then askproblemRule:2if taskis‘systemstart-up’and problemis‘systemdoesnotstart’then ask‘testpowercords’Rule:3if taskis‘systemstart-up’and problemis‘systemdoesnotstart’and ‘testpowercords’isokthen ask‘testPowerstrip’9.2專家系統(tǒng)可以解決什么問題?Rule:19.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?9.2專家系統(tǒng)可以解決什么問題?如何選擇專家系統(tǒng)開發(fā)工具?應(yīng)該使問題的特征和工具的功能相匹配工具不僅包含高級程序語言,如LISP、OPS、C、Java,也包含專家系統(tǒng)框架語言提供了更大的靈活性,但是要求的編程技巧也很高框架雖然不靈活,但是提供了內(nèi)建推理引擎、解釋工具盒用戶界面,只需輸入英語編寫的規(guī)則,可快速構(gòu)建原型9.2專家系統(tǒng)可以解決什么問題?如何選擇專家系統(tǒng)開發(fā)工具?9.2專家系統(tǒng)可以解決什么問題?如何選擇框架?選擇專家系統(tǒng)框架的時候,要考慮的是如何表達(dá)知識的(規(guī)則或者結(jié)構(gòu))它使用的推理機(jī)制(前向鏈接或者后向鏈接)是什么框架是否支持部準(zhǔn)確的推理以及使用的技術(shù)是什么(貝葉斯推理、確定因子或者模糊邏輯)框架是否有“開放”的架構(gòu)以允許使用外部的數(shù)據(jù)文件和程序以及用戶如何和專家系統(tǒng)交互選擇工具的一個重要指標(biāo)是提供工具的公司的穩(wěn)定性9.2專家系統(tǒng)可以解決什么問題?如何選擇框架?9.2專家系統(tǒng)可以解決什么問題?公司穩(wěn)定性的指標(biāo)是什么一些重要的指標(biāo),例如,公司是哪年成立的、員工的人數(shù)、總收入、智能系統(tǒng)產(chǎn)品的總收入如、已售產(chǎn)品的數(shù)量等。9.2專家系統(tǒng)可以解決什么問題?公司穩(wěn)定性的指標(biāo)是什么9.2專家系統(tǒng)可以解決什么問題?要先確定模糊技術(shù)是否適合解決這類問題如果不能為每個可能的情況制定出一系列的規(guī)則,那就使用模糊邏輯。如果問題本身就不嚴(yán)密,那么模糊技術(shù)就是最好的選擇案例3:決策支持模糊技術(shù)開發(fā)一個智能系統(tǒng)來評估抵押申請。模糊專家系統(tǒng)能處理這樣的問題嗎?9.3模糊專家系統(tǒng)可以解決的問題要先確定模糊技術(shù)是否適合解決這類問題9.3模糊專家系統(tǒng)可以首先用模糊術(shù)語表達(dá)抵押申請評估中的基本概念然后用合適的模糊工具在原型系統(tǒng)中實(shí)現(xiàn)這個概念最后用選定的測試用例來測試和優(yōu)化系統(tǒng)9.3模糊專家系統(tǒng)可以解決的問題首先用模糊術(shù)語表達(dá)抵押申請評估中的基本概念9.3模糊專家系9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題9.3模糊專家系統(tǒng)可以解決的問題開發(fā)原型系統(tǒng)的最后一個階段是評估和測試9.3模糊專家系統(tǒng)可以解決的問題開發(fā)原型系統(tǒng)的最后一個階段是評估和測試9.3模糊專家系統(tǒng)可案例5:預(yù)測神經(jīng)網(wǎng)絡(luò)開發(fā)一個進(jìn)行房地產(chǎn)評估的智能系統(tǒng),神經(jīng)網(wǎng)絡(luò)可以解決這個問題嗎?房地產(chǎn)評估是一個根據(jù)類似住房銷售價格的知識預(yù)測給定房產(chǎn)的市場價的問題選擇神經(jīng)網(wǎng)絡(luò),我們無法理解房產(chǎn)的估價是如何得出的,因?yàn)樯窠?jīng)網(wǎng)絡(luò)對于用戶來講是個黑盒子9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題案例5:預(yù)測神經(jīng)網(wǎng)絡(luò)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題輸入(房產(chǎn)的位置、居住面積、臥室數(shù)量、浴室數(shù)量、土地尺寸、供熱系統(tǒng)等)輸出就是我們試圖預(yù)測的結(jié)果我們有很多例子來訓(xùn)練神經(jīng)網(wǎng)絡(luò),即最近銷售的房屋及其價格的特征,訓(xùn)練集需要足夠的豐富9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題輸入(房產(chǎn)的位置、居住面積、臥室數(shù)量、浴室數(shù)量、土地尺寸、供如何讓確定訓(xùn)練集“足夠大”?網(wǎng)絡(luò)的推廣能力取決于三個主要因素:訓(xùn)練集大小、網(wǎng)絡(luò)的架構(gòu)和問題的復(fù)雜性。公式其中N是訓(xùn)練例子的數(shù)量,nw是網(wǎng)絡(luò)中突出權(quán)重的數(shù)量,e是測試允許額網(wǎng)絡(luò)誤差有些特征(例如房子的條件和位置)可以確定在1(沒有吸引力)到10(很有吸引力之間)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何讓確定訓(xùn)練集“足夠大”?9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題修改數(shù)據(jù)數(shù)據(jù)分為三種類型:連續(xù)數(shù)據(jù)、離散數(shù)據(jù)和分類數(shù)據(jù)
例如,例子中的面積在59~231,我們可以將最小值設(shè)為50,最大值設(shè)為250,任何地域最小值的值都映射為最小值,大于最大值的值映射為最大值實(shí)際面積為121,9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題修改數(shù)據(jù)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題離散數(shù)據(jù),例如臥室的數(shù)量和浴室的數(shù)量,也有最大值和最小值臥室的數(shù)量一般為0~4修改后的離散數(shù)據(jù)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題離散數(shù)據(jù),例如臥室的數(shù)量和浴室的數(shù)量,也有最大值和最小值9.分類數(shù)據(jù),例如性別和婚姻狀態(tài)可以用1/N編碼來修改例如,婚姻狀態(tài)可以是單身、離異、已婚、#寡,已婚的人可以用(0010)表示9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題分類數(shù)據(jù),例如性別和婚姻狀態(tài)可以用1/N編碼來修改9.4神輸入層(有十個神經(jīng)元)將修改后的輸入值傳到隱含層隱含層包含兩個神經(jīng)元,輸出層只有一個神經(jīng)元,隱含層和輸出層的神經(jīng)元使用S型激活函數(shù)9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題輸入層(有十個神經(jīng)元)將修改后的輸入值傳到隱含層9.4神經(jīng)如何解釋網(wǎng)絡(luò)的輸出?網(wǎng)絡(luò)輸出層的值為0~1之間的連續(xù)值,要解釋這個結(jié)果只需要倒轉(zhuǎn)程序即可例如,在訓(xùn)練集中,銷售價格的范圍在$52500~$225000之間,輸出值將$50000映射為0,$250000映射為1,如果網(wǎng)絡(luò)的輸出是0.3546,結(jié)果為9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何解釋網(wǎng)絡(luò)的輸出?9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何驗(yàn)證結(jié)果?為了驗(yàn)證結(jié)果可以使用沒有遇到過的例子集。在訓(xùn)練前,將所有可用的數(shù)據(jù)隨機(jī)分成訓(xùn)練集和測試集,可以用測試集進(jìn)行測試神經(jīng)網(wǎng)絡(luò)是不透明的,要想把握輸入輸出之間的關(guān)系,可以通過靈敏度分析執(zhí)行靈敏度分析要將每個輸入設(shè)成最小值,然后再設(shè)成最大值,并測量網(wǎng)絡(luò)的輸出9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題如何驗(yàn)證結(jié)果?9.4神經(jīng)網(wǎng)絡(luò)可以解決的問題遺傳算法可以用于很多優(yōu)化問題。優(yōu)化是為問題尋找較好解決方法的基本過程。問題可能有多余一個的解決方案,而這些解決方案品質(zhì)不同。遺傳算法產(chǎn)生候選解決種群,然后通過自然選擇使這些解決方案進(jìn)化,不好的解決方案趨向于淘汰,好的方案存活并繼續(xù)繁殖。不斷的重復(fù)這個過程,遺傳算法就得到了最優(yōu)解9.5遺傳算法可以解決的問題遺傳算法可以用于很多優(yōu)化問題。優(yōu)化是為問題尋找較好解決方法的案例:旅行推銷員問題開發(fā)一個可以產(chǎn)生優(yōu)化路線的智能系統(tǒng),開車旅行并參觀歐洲中部和西部的主要城市然后再回家,遺傳算法可以解決這個問題嗎?這就是著名的旅行推銷員問題(TSP)。給定有限個城市N,以及每兩個城市之間旅行的費(fèi)用(或距離),我們要找出花費(fèi)最少(或路程最短)的路線,而每個城市都能到達(dá)且僅到達(dá)一次后回到出發(fā)點(diǎn)TSP問題經(jīng)常出現(xiàn)在運(yùn)輸和后勤應(yīng)用中,例如學(xué)校所屬區(qū)域接送孩子,給回家的人送飯,安排收取郵件的卡車路線9.5遺傳算法可以解決的問題案例:旅行推銷員問題9.5遺傳算法可以解決的問題遺傳算法是怎么解決TSP問題的?首先,要決定如何表達(dá)推銷員的路線。最自然的方法就是路徑表示法。每個城市用字母或數(shù)字命名,城市間的路線用染色體來表示,用合適的遺傳操作來產(chǎn)生新的路線9.5遺傳算法可以解決的問題遺傳算法是怎么解決TSP問題的?9.5遺傳算法可以解決的問TSP中的交叉操作如何進(jìn)行傳統(tǒng)形式的交叉操作不能直接在TSP中使用9.5遺傳算法可以解決的問題TSP中的交叉操作如何進(jìn)行9.5遺傳算法可以解決的問題TSP交叉過程9.5遺傳算法可以解決的問題TSP交叉過程9.5遺傳算法可以解決的問題TSP突變操作如何進(jìn)行?有兩種突變操作:倒數(shù)交換和倒置9.5遺傳算法可以解決的問題TSP突變操作如何進(jìn)行?9.5遺傳算法可以解決的問題如何定義TSP的適應(yīng)函數(shù)?(標(biāo)準(zhǔn))一旦定義了適應(yīng)性函數(shù)和遺傳操作,就可以實(shí)現(xiàn)并運(yùn)行GA例如,假設(shè)在一個1*1的正方形中有20個城市首先選擇染色體種群的大小和遺傳代數(shù)??梢宰尫N群從小到大。9.5遺傳算法可以解決的問題如何定義TSP的適應(yīng)函數(shù)?(標(biāo)準(zhǔn))9.5遺傳算法可以解決的9.5遺傳算法可以解決的問題9.5遺傳算法可以解決的問題如何得知已經(jīng)找到了最佳路線?實(shí)際上我們不可能知道是否找到了最佳路線。只有用不同的染色體種群大小、不同的交叉率和突變率做更多的測試,才能得到答案9.5遺傳算法可以解決的問題如何得知已經(jīng)找到了最佳路線?9.5遺傳算法可以解決的問題要解決現(xiàn)實(shí)世界中復(fù)雜的應(yīng)用問題,需要融合專家系統(tǒng)、模糊邏輯、神經(jīng)網(wǎng)絡(luò)和進(jìn)化計算這些方法的優(yōu)點(diǎn)的復(fù)雜智能系統(tǒng)混合智能系統(tǒng)還在發(fā)展中,神經(jīng)網(wǎng)絡(luò)可以從數(shù)據(jù)中進(jìn)行學(xué)習(xí),模糊邏輯最重要的優(yōu)勢是模擬人類的決策能力9.6混合智能系統(tǒng)可以解決的問題要解決現(xiàn)實(shí)世界中復(fù)雜的應(yīng)用問題,需要融合專家系統(tǒng)、模糊邏輯、案例:神經(jīng)模糊決策支持系統(tǒng)開發(fā)一個根據(jù)心臟圖像進(jìn)行心肌灌注診斷的智能系統(tǒng)。有一些心臟圖像以及臨床說明和應(yīng)聲的注解?;旌舷到y(tǒng)可以解決這個問題嗎?9.6混合智能系統(tǒng)可以解決的問題案例:神經(jīng)模糊決策支持系統(tǒng)9.6混合智能系統(tǒng)可以解決的問題現(xiàn)代心臟內(nèi)科學(xué)診斷的基礎(chǔ)是分析SPECT(單光子發(fā)射計算機(jī)斷層圖像)圖像。給患者注入放射性示蹤劑,就可以獲得兩套SPECT圖像(負(fù)荷圖像和靜息圖像),心臟專家通過比較兩個圖像就可以發(fā)現(xiàn)心臟功能的異常SPECT圖像時一種256個灰度的高分辨率的二維黑白圖像。圖像中比較明亮的地方和心肌灌注良好的部分對應(yīng),較暗的地方表示缺血,通過觀察SPECT圖像比較主觀,容易出錯,所以智能系統(tǒng)就體現(xiàn)了很大的價值所在9.6混合智能系統(tǒng)可以解決的問題現(xiàn)代心臟內(nèi)科學(xué)診斷的基礎(chǔ)是分析SPECT(單光子發(fā)射計算機(jī)斷在本案例中我們使用276個心臟診斷病例。每個病例有2個SPECT圖像,每個圖像分成22個區(qū)域,用0~100的整數(shù)表示灌注是否良好每個心臟診斷病例用44個連續(xù)的特征和一個二值特征來表示,二值特征表示最后的診斷異?;蛘哒U麄€SPECT的數(shù)據(jù)集有55個正常病例(陽性病例)和212個異常病例(陰性病例)。數(shù)據(jù)集分成訓(xùn)練集和測試集。訓(xùn)練集有40個陽性病例和40個陰性病例,測試集有15個陽性病例和172個陰性病例9.6混合智能系統(tǒng)可以解決的問題在本案例中我們使用276個心臟診斷病例。每個病例有2個SPE可以訓(xùn)練后向傳送神經(jīng)網(wǎng)絡(luò)來SPECT圖像分成正常圖像和異常圖像嗎?后向傳送神經(jīng)網(wǎng)絡(luò)確實(shí)可以用于分類SPECT圖像-訓(xùn)練集足夠大,則網(wǎng)絡(luò)就可以完成分類。但是,在用測試集進(jìn)行測試時,我們發(fā)現(xiàn)網(wǎng)絡(luò)的性能很差-大概25%的正常心臟診斷病例被無分為異常,而超過35%的異常病例被診斷為正常,總的誤差達(dá)到了33%。9.6混合智能系統(tǒng)可以解決的問題可以訓(xùn)練后向傳送神經(jīng)網(wǎng)絡(luò)來SPECT圖像分成正常圖像和異常圖這就表示訓(xùn)練集中缺少些重要的病例對異常病例的誤分類的后果要比正常對正常病例誤分類的結(jié)果嚴(yán)重的多。因此,要減少異常的誤分類比例,就要增加正常圖像的誤分類比例神經(jīng)網(wǎng)絡(luò)陳勝兩種輸出:圖像屬于normal類的概率和abnormal例:0.92和0.16正常017和0.51異常0.51和0.49無法判斷9.6混合智能系統(tǒng)可以解決的問題這就表示訓(xùn)練集中缺少些重要的病例9.6混合智能系統(tǒng)可以解決可以在醫(yī)學(xué)診斷的決策制定中使用模糊邏輯嗎?實(shí)際上,醫(yī)生通過依賴于自身的經(jīng)驗(yàn)和直覺來發(fā)現(xiàn)心肌的異常情況。模糊邏輯就是一種模擬心臟專家評估心臟病發(fā)作風(fēng)險的辦法構(gòu)建模糊系統(tǒng),首先要確定輸入(NNoutput1和NNoutput2[0~1])和輸出(心臟病發(fā)作的風(fēng)險),定義模糊集,構(gòu)建模糊規(guī)則9.6混合智能系統(tǒng)可以解決的問題可以在醫(yī)學(xué)診斷的決策制定中使用模糊邏輯嗎?9.6混合智能系9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題9.6混合智能系統(tǒng)可以解決的問題風(fēng)險在30%~50%之間的病例很難歸類為normal或abnormal,這樣的病例是不確定的我們可以用心臟專家的經(jīng)驗(yàn)和知識將這些不確定的病例分類嗎?9.6混合智能系統(tǒng)可以解決的問題風(fēng)險在30%~50%之間的病例很難歸類為normal或abn1)如果區(qū)域i在負(fù)荷時的灌注高于靜息時的灌注,則心臟病的風(fēng)險減少2)如果區(qū)域i在負(fù)荷時的灌注不高于靜息時的灌注,則心臟病的風(fēng)險增加步驟1:將心臟病病例輸入神經(jīng)模糊系統(tǒng)步驟2:如果風(fēng)險不在30%~50%之間,結(jié)束。否則,到步驟3步驟3:對于區(qū)域1,負(fù)荷時的灌注高于靜息時的灌注,則將結(jié)果乘以0.99以減少當(dāng)前風(fēng)險,否則乘以1.01來增加當(dāng)前的風(fēng)險。重復(fù)直至22個區(qū)域都計算完步驟4:如果還有在30%~50%之間的則還確定為uncertain類9.6混合智能系統(tǒng)可以解決的問題1)如果區(qū)域i在負(fù)荷時的灌注高于靜息時的灌注,則心臟病的風(fēng)發(fā)現(xiàn)分類的準(zhǔn)確性得到了很大的提升:總體的診斷誤差率不超過5%,僅有3%的異常病例誤歸到正常類。正常病例的誤診率較高,但是也好過心臟專家的分類結(jié)果9.6混合智能系統(tǒng)可以解決的問題發(fā)現(xiàn)分類的準(zhǔn)確性得到了很大的提升:總體的診斷誤差率不超過5%數(shù)據(jù)是我們收集和存儲的,知識是幫助我們做決策的。從數(shù)據(jù)中提取知識稱為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘也可以定義成在大量數(shù)據(jù)中進(jìn)行探索和分析,以便發(fā)現(xiàn)有意義的模式和規(guī)則。數(shù)據(jù)挖掘的最終目標(biāo)是發(fā)現(xiàn)知識我們生活在數(shù)據(jù)快速增長的時代,需要有能夠幫助我們提取有意義的信息和知識的方法9.7數(shù)據(jù)挖掘和知識發(fā)現(xiàn)數(shù)據(jù)是我們收集和存儲的,知識是幫助我們做決策的。從數(shù)據(jù)中提取現(xiàn)代企業(yè)必須對市場的變化做出快速響應(yīng),需要快速的助理數(shù)據(jù)倉庫中當(dāng)前的數(shù)據(jù)什么是數(shù)據(jù)倉庫?數(shù)據(jù)倉庫的主要特征是容量數(shù)據(jù)倉庫是用來支持企業(yè)制定決策的,所需要的數(shù)據(jù)通過查詢工具來獲得查詢工具和數(shù)據(jù)挖掘之
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報參考:教育現(xiàn)代化視域下我國學(xué)校體育數(shù)字化評估監(jiān)測體系構(gòu)建研究
- 2025版放射性物質(zhì)運(yùn)輸安全責(zé)任書3篇
- 《鄉(xiāng)村廁所建設(shè)技術(shù)標(biāo)準(zhǔn)》
- 二零二五年快遞行業(yè)包裝回收利用合同范本3篇
- 2025版教育培訓(xùn)外協(xié)合同協(xié)議書3篇
- 二零二五不銹鋼罐體生產(chǎn)質(zhì)量管理體系認(rèn)證合同3篇
- 2024版汽車修理工勞動合同模板格式
- 2025年度特色民宿租賃運(yùn)營管理合同3篇
- 2025年度個人收入證明專業(yè)審核與制作合同3篇
- 二零二五年度醫(yī)院門衛(wèi)醫(yī)療服務(wù)合同
- 2024年蘇州工業(yè)園區(qū)服務(wù)外包職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 人教版初中語文2022-2024年三年中考真題匯編-學(xué)生版-專題08 古詩詞名篇名句默寫
- 2024-2025學(xué)年人教版(2024)七年級(上)數(shù)學(xué)寒假作業(yè)(十二)
- 山西粵電能源有限公司招聘筆試沖刺題2025
- 醫(yī)療行業(yè)軟件系統(tǒng)應(yīng)急預(yù)案
- 使用錯誤評估報告(可用性工程)模版
- 《精密板料矯平機(jī) 第2部分:技術(shù)規(guī)范》
- 2024光伏發(fā)電工程交流匯流箱技術(shù)規(guī)范
- 旅游活動碳排放管理評價指標(biāo)體系構(gòu)建及實(shí)證研究
- 2022年全國職業(yè)院校技能大賽-電氣安裝與維修賽項(xiàng)規(guī)程
- 小學(xué)德育養(yǎng)成教育工作分層實(shí)施方案
評論
0/150
提交評論