基于bayes判別法的胃病鑒別_第1頁(yè)
基于bayes判別法的胃病鑒別_第2頁(yè)
基于bayes判別法的胃病鑒別_第3頁(yè)
基于bayes判別法的胃病鑒別_第4頁(yè)
基于bayes判別法的胃病鑒別_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于bayes判別準(zhǔn)則的胃病分類模型 摘要(針對(duì)什么問(wèn)題,采用了什么方法原理,建立了什么模型,得到了什么結(jié)果,10分,3/4最合適)本文解決的問(wèn)題是如何根據(jù)被檢驗(yàn)者的各項(xiàng)生化指標(biāo),建立合理的判別準(zhǔn)則,將被混淆的12個(gè)樣本結(jié)果區(qū)分開(kāi)來(lái),并且判別胃病的類別。在合理的假設(shè)下,利用系統(tǒng)聚類原理,將所給的12組數(shù)據(jù)進(jìn)行分類,計(jì)算分類后患胃癌、萎縮性胃炎、非胃病的概率分別為、,再利用bayes判別函數(shù)求出待測(cè)樣本的的得分,判別待測(cè)樣本的所屬類型。 針對(duì)問(wèn)題一,首先利用spss軟件對(duì)樣本a、b、c(題中已給定類別的三組)數(shù)據(jù)進(jìn)行系統(tǒng)聚類。再利用bayes判別模型,由分類后數(shù)據(jù)求出判別函數(shù),帶入樣本的指標(biāo)計(jì)算

2、得分,判別出混淆的12個(gè)樣本的所屬類型。 針對(duì)問(wèn)題二,由問(wèn)題一得出的判別準(zhǔn)則,把待判數(shù)據(jù)x、y、z帶入判別函數(shù),得出x、y為胃炎患者,z為非胃病患者。本文最后將被混淆的12個(gè)樣本區(qū)分開(kāi)來(lái),并且判別就診者中有兩個(gè)胃炎患者,另一個(gè)是非胃病患者,文章的末尾給出模型的評(píng)價(jià)及模型的改進(jìn)方向。關(guān)鍵詞:系統(tǒng)聚類;bayes函數(shù)判別法;spss統(tǒng)計(jì)1問(wèn)題重述胃癌患者易誤診為萎縮性胃炎患者以及非胃病患者。進(jìn)行胃癌的鑒別主要是通過(guò)化驗(yàn)4項(xiàng)生化指標(biāo):血清銅藍(lán)蛋白(x1)、藍(lán)色反應(yīng)(x2)、尿吲哚乙酸(x3)、中性硫化物(x4)。本來(lái)從胃癌患者、萎縮性胃炎患者以及非胃病患者中一共抽取了12人進(jìn)行指標(biāo)化驗(yàn),但是由于醫(yī)護(hù)

3、人員的疏忽,將化驗(yàn)結(jié)果搞混了?,F(xiàn)有以前對(duì)胃癌患者、萎縮性胃炎患者以及非胃病患者化驗(yàn)的結(jié)果各一例,依次為(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化驗(yàn)結(jié)果見(jiàn)附件醫(yī)學(xué)上一般根據(jù)臨床的經(jīng)驗(yàn)認(rèn)為,患同一種病的人所表現(xiàn)出來(lái)的特征往往是相似的?,F(xiàn)在需要解決兩個(gè)問(wèn)題(1.)建立一種判別準(zhǔn)則,把上述混淆的結(jié)果區(qū)分開(kāi)來(lái)。(2).再給你三個(gè)病人的化驗(yàn)指標(biāo)如下:(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),試區(qū)分他們各屬于哪一類人群。2問(wèn)題分析:題中有三個(gè)已知

4、樣本,一個(gè)胃癌患者、一個(gè)萎縮性胃炎患者、一個(gè)非胃病患者,但是樣本量太小,為得到一個(gè)可靠的標(biāo)準(zhǔn),首先對(duì)混淆的十五個(gè)樣本聚類,然后用聚類后得到的樣本建立判別準(zhǔn)則。第一步:利用系統(tǒng)聚類的方法,將13、14、15三個(gè)已知樣本加入到十二個(gè)混淆樣本中進(jìn)行聚類,聚成三類得到一個(gè)較大樣本的,成為待判三個(gè)樣本的判別標(biāo)準(zhǔn)。第二步:,由第一步得到的判別標(biāo)準(zhǔn),利用bayes判別法判斷這三個(gè)待判病人(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14)。分別屬于哪一類3模型假設(shè):(要合理,要與模型相關(guān),不要無(wú)中生有)假設(shè)1:被檢測(cè)的人員除本題研究的疾病相關(guān)

5、外無(wú)任何疾病。假設(shè)2:被檢測(cè)的人員種族,血緣之間沒(méi)有任何關(guān)聯(lián)。假設(shè)3:被檢驗(yàn)的四項(xiàng)生化指標(biāo)兩兩之間無(wú)關(guān)聯(lián)。 4符號(hào)說(shuō)明:(一定要做兩次說(shuō)明,在模型建立的時(shí)候還要做一次說(shuō)明,要讓閱卷老師看起來(lái)方便)為第i個(gè)函數(shù)(i=1、2、3)為第i個(gè)方程第j個(gè)指標(biāo)前的系數(shù)(i=1、2、3;j=1、2、3、4)為第i個(gè)方程的常數(shù)項(xiàng)(i=1、2、3)為胃病的樣本(i=1、2、3),其中1為胃癌,2為胃炎,3為非胃病為兩兩樣品間的距離()5 模型建立(一般模型的建立與求解是寫(xiě)在一起的,占4060分)5.1模型一利用系統(tǒng)聚類的方法處理數(shù)據(jù)(交代所采用的方法的原理)由于各指標(biāo)的單位和數(shù)量級(jí)差異較大,應(yīng)先將所有數(shù)據(jù)標(biāo)準(zhǔn)化

6、。定義為不同指標(biāo),為待測(cè)數(shù)據(jù)序號(hào),公式如下: (1)先把12個(gè)混淆樣本和三個(gè)已知樣本單獨(dú)視為一類,即分成15類,算出每?jī)深愰g的距離共個(gè)距離,定義兩兩樣品間的距離為, 其中我們采用歐氏距離計(jì)算。定義分別表示不同的類別,(1、2、3、4)表示維數(shù)。則為: (2)然后根據(jù)距離最小的原則,依次選出一對(duì)分類對(duì)象,并成新類。如果其中一個(gè)分類對(duì)象已歸于一類,則把另一個(gè)也歸入該類;如果一對(duì)分類對(duì)象正好屬于已歸的兩類,則把這兩類并為一類。每一次歸并,都劃去該對(duì)象所在的列與列序相同的行。經(jīng)過(guò)14次就可以把全部分類對(duì)象歸為一類,這樣就可以得到譜系聚類圖。對(duì)于新類與當(dāng)前類的距離,我們需先重新確定新類的重心,再用重心坐

7、標(biāo)算歐氏距離即可。假設(shè)將類和合并成新類。則的重心為: (3)聚類的過(guò)程如下:各自確定一個(gè)聚點(diǎn)計(jì)算兩兩類之間的距離,將距離最近的聚成一類重新確定聚點(diǎn)分類是否合理分類結(jié)束修改模型yesno經(jīng)過(guò)數(shù)據(jù)處理后我們就得到了一個(gè)已知類型的樣本,其中13、14、15分別屬于一類。5.2模型二經(jīng)過(guò)模型一處理后我們就得到了一個(gè)已知類型的樣本,其中13、14、15分別屬于一類,在模型一的求解過(guò)程中可以得到胃癌患者、胃炎患者、非胃病患者的發(fā)生的概率分別為、,利用bayes判別法就可以建立三個(gè)判別函數(shù),根據(jù)判別函數(shù),將待測(cè)數(shù)據(jù)標(biāo)準(zhǔn)化后帶入判別函數(shù),計(jì)算得分,得到樣本發(fā)生的后驗(yàn)概率,就可以判別出待測(cè)樣品的類型。貝葉斯公式

8、: (4)我們用byes判別法,確定三個(gè)類的判別函數(shù)這一組的分類函數(shù)是=+這組的分類函數(shù)是 (5)=+這組的分類函數(shù)是=+根據(jù)這三個(gè)函數(shù)我們可以計(jì)算出待判的三個(gè)樣本的得分。 取max(,)=,得出待判樣本屬于第i類。6模型求解(表格兩邊不封口,表名用五號(hào)字體,字不如表,表不如圖) 我們將混淆的十二個(gè)樣本與已知的三個(gè)樣本作為一個(gè)有十五個(gè)數(shù)據(jù)整體,進(jìn)行多次快速聚類,將已知的三個(gè)樣本分別標(biāo)號(hào)13、14、15。當(dāng)我們把數(shù)據(jù)分成三類時(shí),我們發(fā)現(xiàn)我們并不能將14、15,明確的區(qū)分開(kāi)來(lái),于是我們采用先聚兩類,聚類結(jié)果如表1: 表1(第一次聚類的結(jié)果)從表1中我們看到胃癌患者從中分離出來(lái),有1、2、5、13,

9、共四個(gè)樣本,畫(huà)出散點(diǎn)圖(圖1),看到胃癌患者離其他兩類的距離較遠(yuǎn)。 圖1(典型判別函數(shù)的散點(diǎn)圖)于是可以將四個(gè)樣本從中分離出來(lái)后,進(jìn)行二次聚類。結(jié)果如表2;表21(去掉胃癌樣本后的第一次聚類結(jié)果) 表2 2(去掉胃癌樣本后的第二次聚類結(jié)果) 表21、表22是經(jīng)過(guò)這兩次分類后依然無(wú)法將14、15分開(kāi),說(shuō)明5、7這兩個(gè)樣本影響了我們的正常分類,將聚類的模型稍作修改即我們先將它們?nèi)サ?,在做聚類得到?如下: 表3(去掉兩個(gè)特殊樣本后將胃炎與非胃病患者分開(kāi)的結(jié)果)表3說(shuō)明14、15已經(jīng)被分開(kāi)在兩個(gè)不同的類別中。 此時(shí)我們已經(jīng)將三個(gè)已知的樣本成功的分在了不同的類別當(dāng)中,這是以這十五個(gè)樣本作為判別標(biāo)準(zhǔn),建

10、立bayes判別函數(shù),判別5、7這兩個(gè)特殊樣本。表4(利用bayes判別法判別5、7的結(jié)果)我們看到加入前面的數(shù)據(jù)后利用beyes判別法可以將5、7判別出來(lái)、于是利用聚類我們就得到了一個(gè)新的、樣本容量更大的判別準(zhǔn)則。利用得出樣本分類結(jié)果,我們可以建立相應(yīng)的模型,得到判別準(zhǔn)則,判斷出待測(cè)樣本的類型。 bayes判別函數(shù)系數(shù)患病類型胃炎非胃病胃癌x1.176.144.170x2.741.568.567x3-113.130-91.85040.401x4-88.350-63.595-52.272常數(shù)項(xiàng)-57.759-35.843-56.166利用spss軟件求解出三個(gè)beyes判別函數(shù)的系數(shù),在上圖中

11、讀出相應(yīng)的系數(shù),帶入模型,得到如下判別函數(shù)這一組的分類函數(shù)是=0.176+0.741-113.130-88.350-57.759這組的分類函數(shù)是=0.144+0.568-91.850-63.595-35.843這組的分類函數(shù)是=0.170+0.567+40.401-52.272-56.166解出三個(gè)判別函數(shù)后,將待判樣本帶入判斷,得到如下表5結(jié)果:表5(待測(cè)樣本的分類結(jié)果)從表5的結(jié)果我們看到,根據(jù)判別函數(shù),判別出待判的三個(gè)樣本中,有兩個(gè)胃炎患者,另一個(gè)是非胃病患者,而沒(méi)有胃癌患者。7模型分析與檢驗(yàn):7.1模型的優(yōu)點(diǎn)采用beyes判別函數(shù)得到的結(jié)果與先驗(yàn)相比,準(zhǔn)確率達(dá)到了92.3%,說(shuō)明函數(shù)判別的準(zhǔn)確率很高,模型是合7.2模型的缺點(diǎn)(判別法有與生俱來(lái)的缺點(diǎn),要找到他的原理的相關(guān)的書(shū)籍,把東西說(shuō)明白)7.3模型的改進(jìn)參考文獻(xiàn):(格式是,作者,書(shū)名,出版社,連標(biāo)點(diǎn)符號(hào)都不能錯(cuò))【1】數(shù)學(xué)建模章紹輝 科學(xué)出版社;【2】概率論與數(shù)理統(tǒng)計(jì)萬(wàn)星火 科學(xué)出版社;【3】spss統(tǒng)計(jì)分析盧紋岱 電子工

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論