基于bayes判別法的胃病鑒別_第1頁
基于bayes判別法的胃病鑒別_第2頁
基于bayes判別法的胃病鑒別_第3頁
基于bayes判別法的胃病鑒別_第4頁
基于bayes判別法的胃病鑒別_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于bayes判別準則的胃病分類模型 摘要(針對什么問題,采用了什么方法原理,建立了什么模型,得到了什么結果,10分,3/4最合適)本文解決的問題是如何根據被檢驗者的各項生化指標,建立合理的判別準則,將被混淆的12個樣本結果區(qū)分開來,并且判別胃病的類別。在合理的假設下,利用系統(tǒng)聚類原理,將所給的12組數據進行分類,計算分類后患胃癌、萎縮性胃炎、非胃病的概率分別為、,再利用bayes判別函數求出待測樣本的的得分,判別待測樣本的所屬類型。 針對問題一,首先利用spss軟件對樣本a、b、c(題中已給定類別的三組)數據進行系統(tǒng)聚類。再利用bayes判別模型,由分類后數據求出判別函數,帶入樣本的指標計算

2、得分,判別出混淆的12個樣本的所屬類型。 針對問題二,由問題一得出的判別準則,把待判數據x、y、z帶入判別函數,得出x、y為胃炎患者,z為非胃病患者。本文最后將被混淆的12個樣本區(qū)分開來,并且判別就診者中有兩個胃炎患者,另一個是非胃病患者,文章的末尾給出模型的評價及模型的改進方向。關鍵詞:系統(tǒng)聚類;bayes函數判別法;spss統(tǒng)計1問題重述胃癌患者易誤診為萎縮性胃炎患者以及非胃病患者。進行胃癌的鑒別主要是通過化驗4項生化指標:血清銅藍蛋白(x1)、藍色反應(x2)、尿吲哚乙酸(x3)、中性硫化物(x4)。本來從胃癌患者、萎縮性胃炎患者以及非胃病患者中一共抽取了12人進行指標化驗,但是由于醫(yī)護

3、人員的疏忽,將化驗結果搞混了?,F(xiàn)有以前對胃癌患者、萎縮性胃炎患者以及非胃病患者化驗的結果各一例,依次為(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化驗結果見附件醫(yī)學上一般根據臨床的經驗認為,患同一種病的人所表現(xiàn)出來的特征往往是相似的?,F(xiàn)在需要解決兩個問題(1.)建立一種判別準則,把上述混淆的結果區(qū)分開來。(2).再給你三個病人的化驗指標如下:(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),試區(qū)分他們各屬于哪一類人群。2問題分析:題中有三個已知

4、樣本,一個胃癌患者、一個萎縮性胃炎患者、一個非胃病患者,但是樣本量太小,為得到一個可靠的標準,首先對混淆的十五個樣本聚類,然后用聚類后得到的樣本建立判別準則。第一步:利用系統(tǒng)聚類的方法,將13、14、15三個已知樣本加入到十二個混淆樣本中進行聚類,聚成三類得到一個較大樣本的,成為待判三個樣本的判別標準。第二步:,由第一步得到的判別標準,利用bayes判別法判斷這三個待判病人(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14)。分別屬于哪一類3模型假設:(要合理,要與模型相關,不要無中生有)假設1:被檢測的人員除本題研究的疾病相關

5、外無任何疾病。假設2:被檢測的人員種族,血緣之間沒有任何關聯(lián)。假設3:被檢驗的四項生化指標兩兩之間無關聯(lián)。 4符號說明:(一定要做兩次說明,在模型建立的時候還要做一次說明,要讓閱卷老師看起來方便)為第i個函數(i=1、2、3)為第i個方程第j個指標前的系數(i=1、2、3;j=1、2、3、4)為第i個方程的常數項(i=1、2、3)為胃病的樣本(i=1、2、3),其中1為胃癌,2為胃炎,3為非胃病為兩兩樣品間的距離()5 模型建立(一般模型的建立與求解是寫在一起的,占4060分)5.1模型一利用系統(tǒng)聚類的方法處理數據(交代所采用的方法的原理)由于各指標的單位和數量級差異較大,應先將所有數據標準化

6、。定義為不同指標,為待測數據序號,公式如下: (1)先把12個混淆樣本和三個已知樣本單獨視為一類,即分成15類,算出每兩類間的距離共個距離,定義兩兩樣品間的距離為, 其中我們采用歐氏距離計算。定義分別表示不同的類別,(1、2、3、4)表示維數。則為: (2)然后根據距離最小的原則,依次選出一對分類對象,并成新類。如果其中一個分類對象已歸于一類,則把另一個也歸入該類;如果一對分類對象正好屬于已歸的兩類,則把這兩類并為一類。每一次歸并,都劃去該對象所在的列與列序相同的行。經過14次就可以把全部分類對象歸為一類,這樣就可以得到譜系聚類圖。對于新類與當前類的距離,我們需先重新確定新類的重心,再用重心坐

7、標算歐氏距離即可。假設將類和合并成新類。則的重心為: (3)聚類的過程如下:各自確定一個聚點計算兩兩類之間的距離,將距離最近的聚成一類重新確定聚點分類是否合理分類結束修改模型yesno經過數據處理后我們就得到了一個已知類型的樣本,其中13、14、15分別屬于一類。5.2模型二經過模型一處理后我們就得到了一個已知類型的樣本,其中13、14、15分別屬于一類,在模型一的求解過程中可以得到胃癌患者、胃炎患者、非胃病患者的發(fā)生的概率分別為、,利用bayes判別法就可以建立三個判別函數,根據判別函數,將待測數據標準化后帶入判別函數,計算得分,得到樣本發(fā)生的后驗概率,就可以判別出待測樣品的類型。貝葉斯公式

8、: (4)我們用byes判別法,確定三個類的判別函數這一組的分類函數是=+這組的分類函數是 (5)=+這組的分類函數是=+根據這三個函數我們可以計算出待判的三個樣本的得分。 取max(,)=,得出待判樣本屬于第i類。6模型求解(表格兩邊不封口,表名用五號字體,字不如表,表不如圖) 我們將混淆的十二個樣本與已知的三個樣本作為一個有十五個數據整體,進行多次快速聚類,將已知的三個樣本分別標號13、14、15。當我們把數據分成三類時,我們發(fā)現(xiàn)我們并不能將14、15,明確的區(qū)分開來,于是我們采用先聚兩類,聚類結果如表1: 表1(第一次聚類的結果)從表1中我們看到胃癌患者從中分離出來,有1、2、5、13,

9、共四個樣本,畫出散點圖(圖1),看到胃癌患者離其他兩類的距離較遠。 圖1(典型判別函數的散點圖)于是可以將四個樣本從中分離出來后,進行二次聚類。結果如表2;表21(去掉胃癌樣本后的第一次聚類結果) 表2 2(去掉胃癌樣本后的第二次聚類結果) 表21、表22是經過這兩次分類后依然無法將14、15分開,說明5、7這兩個樣本影響了我們的正常分類,將聚類的模型稍作修改即我們先將它們去掉,在做聚類得到表3如下: 表3(去掉兩個特殊樣本后將胃炎與非胃病患者分開的結果)表3說明14、15已經被分開在兩個不同的類別中。 此時我們已經將三個已知的樣本成功的分在了不同的類別當中,這是以這十五個樣本作為判別標準,建

10、立bayes判別函數,判別5、7這兩個特殊樣本。表4(利用bayes判別法判別5、7的結果)我們看到加入前面的數據后利用beyes判別法可以將5、7判別出來、于是利用聚類我們就得到了一個新的、樣本容量更大的判別準則。利用得出樣本分類結果,我們可以建立相應的模型,得到判別準則,判斷出待測樣本的類型。 bayes判別函數系數患病類型胃炎非胃病胃癌x1.176.144.170x2.741.568.567x3-113.130-91.85040.401x4-88.350-63.595-52.272常數項-57.759-35.843-56.166利用spss軟件求解出三個beyes判別函數的系數,在上圖中

11、讀出相應的系數,帶入模型,得到如下判別函數這一組的分類函數是=0.176+0.741-113.130-88.350-57.759這組的分類函數是=0.144+0.568-91.850-63.595-35.843這組的分類函數是=0.170+0.567+40.401-52.272-56.166解出三個判別函數后,將待判樣本帶入判斷,得到如下表5結果:表5(待測樣本的分類結果)從表5的結果我們看到,根據判別函數,判別出待判的三個樣本中,有兩個胃炎患者,另一個是非胃病患者,而沒有胃癌患者。7模型分析與檢驗:7.1模型的優(yōu)點采用beyes判別函數得到的結果與先驗相比,準確率達到了92.3%,說明函數判別的準確率很高,模型是合7.2模型的缺點(判別法有與生俱來的缺點,要找到他的原理的相關的書籍,把東西說明白)7.3模型的改進參考文獻:(格式是,作者,書名,出版社,連標點符號都不能錯)【1】數學建模章紹輝 科學出版社;【2】概率論與數理統(tǒng)計萬星火 科學出版社;【3】spss統(tǒng)計分析盧紋岱 電子工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論