




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、科技學(xué)院第十一組:劉晶晶 向雄峰 余 濤 乳腺癌的判別數(shù)學(xué)模型 摘要 本文解決的問題是利用9項(xiàng)指標(biāo),綜合來判別乳腺腫瘤是良性還是惡性。 我 們通過初步數(shù)據(jù)分析,得出各個(gè)指標(biāo)與腫瘤良惡性存在一定的線性關(guān)系, 于是我 們建立了多元線性回歸模型。 對(duì)于問題一,我們先將附錄表一中1-60組數(shù)據(jù)運(yùn)用MATLAB回歸分析命令 regress作初步的回歸分析。根據(jù)所得的殘差及其置信區(qū)間圖,我們將其中6組 離群點(diǎn)予以剔除。然后將余下的 54組數(shù)據(jù)運(yùn)用Excel作回歸分析,由回歸統(tǒng)計(jì) 表中可以得出回歸方程中常量和各個(gè)系數(shù),由此可以得到判別乳腺癌是良性還是 惡性的多元線性回歸方程: A y - -0.32858
2、0.060725X, -0.08212x2 0.10584x3 0.015509x4 0.010307x5 0.042092 x60.001685x70.031964x80.034681x9 同時(shí)依據(jù)得到的回歸統(tǒng)計(jì)、方差分析、殘差分析等數(shù)據(jù)作出r檢驗(yàn)r2二0.90732, F檢驗(yàn)F -47.86135,來衡量線性回歸的擬合度,以及線性方程中各參數(shù)的顯著 性,發(fā)現(xiàn)其回歸程度較好,均一致認(rèn)為所建立的多元線性回歸模型的回歸效果顯 著,于是我們認(rèn)可所得的多元線性回歸方程可以依據(jù)9項(xiàng)指標(biāo)來判別乳腺腫瘤是 良性還是惡性。最后我們?cè)賹⒈硪恢?1-78組數(shù)據(jù)回代入上述多元線性回歸方 程,經(jīng)由計(jì)算分析得出所得的
3、回歸方程判別乳腺腫瘤是良性還是惡性的正確率高 達(dá)100%預(yù)測(cè)能力顯著,明顯可以看出所得到回歸方程判別乳腺腫瘤是良性還 是惡性方法是合理正確的。至此我們得到了依據(jù)9項(xiàng)指標(biāo)綜合判別乳腺腫瘤是良 性還是惡性的方法:將待判別病例的9項(xiàng)指標(biāo)的數(shù)據(jù)代入回歸方程,計(jì)算出y的 估計(jì)值,并對(duì)其值作四舍五入取整,y =0,腫瘤是良性;y =1,腫瘤是惡性。 對(duì)于問題二,將附錄表二中20組需要判別的病例的數(shù)據(jù)代入模型一中所得 回歸方程中計(jì)算出y的估計(jì)值,依據(jù)問題一的判別方法判別得出20個(gè)病例中第 1, 4, 5, 7,10,11,15, 19組共8個(gè)病例是惡性腫瘤,余下12個(gè)病例是良性 腫瘤。 對(duì)于問題三,回歸參數(shù)
4、表中回歸系數(shù)的統(tǒng)計(jì)量的線性系數(shù)顯著性Fj值,表 征了該系數(shù)的顯著性水平,也表征了該項(xiàng)因素對(duì)于因變量判定的影響程度,我們 通過對(duì)模型一進(jìn)行逐步回歸分析,剔除模型中那些對(duì)因變量作用不顯著的自變 量,得到最優(yōu)化的線性回歸模型,那些保留下來的自變量,即是區(qū)分乳腺腫瘤是 “良性”還是“惡性”的主要指標(biāo)。作逐步回歸分析后,最終所得結(jié)果為:乳腺 腫瘤腫塊的厚度、細(xì)胞大小的均勻性、細(xì)胞形狀的均勻性、裸核、正常的核仁、 有絲分裂是區(qū)分乳腺腫瘤是“良性”還是“惡性”的主要指標(biāo),得到最優(yōu)化的回 歸模型為: A y = -0.32092 0.063858X, - 0.07021x2 0.097702x3 0.4774
5、4X60.035044x80.45451x9 關(guān)鍵詞:多元線性回歸模型逐步回歸 顯著性水平檢驗(yàn) 1問題重述 全世界每年約有120萬婦女患乳腺癌,50萬人死于乳腺癌,乳腺癌已經(jīng)成 為全球女性發(fā)病率最高的惡性腫瘤。 下面是某醫(yī)院乳腺腫瘤患者的一組數(shù)據(jù)見附錄一表一,其中前面9個(gè)指標(biāo)分 別表示乳腺腫瘤腫塊的厚度、細(xì)胞大小的均勻性、細(xì)胞形狀的均勻性、邊緣的粘 連、單層上皮細(xì)胞的大小、裸核、溫和的染色質(zhì)、正常的核仁、有絲分裂,尾數(shù) 0表示確診為“良性”,1表示確診為“惡性”,數(shù)據(jù)已經(jīng)歸一化為 0到10之間 的自然數(shù)。 問題一、根據(jù)以上數(shù)據(jù),請(qǐng)?zhí)岢鲆环N或多種判別乳腺腫瘤屬于“良性”還 是“惡性”的方法,并檢
6、驗(yàn)?zāi)闾岢龅姆椒ǖ恼_性。 問題二、現(xiàn)有一組乳腺腫瘤患者的九個(gè)指標(biāo)數(shù)據(jù)見附錄一表二,請(qǐng)你按照你 在問題一中提出的方法分別判別屬于“良性”還是“惡性”。 問題三、試確定哪些指標(biāo)是區(qū)分乳腺腫瘤是“良性”還是“惡性”的主要指 標(biāo),請(qǐng)采用主要指標(biāo)建立區(qū)分“良性”和“惡性”乳腺腫瘤的模型,以便用于 乳腺腫瘤的輔助診斷時(shí)可以減少化驗(yàn)的指標(biāo)。 2模型的假設(shè)與符號(hào)說明 2.1模型的假設(shè) 假設(shè)1:題目所給數(shù)據(jù)是合理、正確的。 假設(shè)2:假設(shè)表中給出化驗(yàn)數(shù)據(jù)科學(xué)可信。確診病例確診情況(患病、健康) 準(zhǔn)確無誤。 假設(shè)3:假設(shè)各位被測(cè)患者無其他疾病,不會(huì)干擾被測(cè)數(shù)值。 假設(shè)4:假設(shè)醫(yī)生不會(huì)僅僅依靠化驗(yàn)結(jié)果對(duì)患病情況作出最
7、終判斷,化驗(yàn)僅 僅作為醫(yī)生診斷的一種輔助手段,所以化驗(yàn)結(jié)果單方面的現(xiàn)實(shí)結(jié)果可以跟實(shí)際有 一定程度的偏差。 假設(shè)5:題目中給出的原始數(shù)據(jù)有兩組無效,將其舍去認(rèn)為對(duì)解題無影響。 2.2符號(hào)說明 x 乳腺腫瘤腫塊的厚度指標(biāo); X2 細(xì)胞大小的均勻性指標(biāo); X3 細(xì)胞形狀的均勻性指標(biāo); X4 邊緣的粘連指標(biāo); X5 單層上皮細(xì)胞的大小指標(biāo); x 裸核指標(biāo); X7 溫和的染色質(zhì)指標(biāo); X 正常的核仁指標(biāo); X9 有絲分裂指標(biāo); y 診斷結(jié)果; ? 診斷結(jié)果估計(jì)值; Po 回歸常數(shù); 耳 回歸系數(shù); f?0 回歸常數(shù)估計(jì)值; ? 回歸系數(shù)估計(jì)值; F檢驗(yàn)法 提出假設(shè): 線性關(guān)系不顯著 3不全為0線性關(guān)系顯
8、著 計(jì)算檢驗(yàn)統(tǒng)計(jì)量: 54人 (11) ,SSE 八(y-y)2 i A F -2.1009 因?yàn)镽非常接近1,同時(shí)F遠(yuǎn)大于F-.,故拒絕H。,認(rèn)為在顯著性水平下,y與 XX2,,X9之間存在顯著的線性相關(guān)關(guān)系。 5.3.2模型的準(zhǔn)確性檢驗(yàn) 將表一驗(yàn)證樣本的值代入(7)式判別出18個(gè)樣本的病例情況: 病歷號(hào) 61 62 63 64 65 66 67 68 69 結(jié)果 惡性 良性 惡性 良性 惡性 惡性 良性 良性 惡性 病歷號(hào) 70 71 72 73 74 75 76 77 78 結(jié)果 良性 惡性 惡性 良性 良性 良性 良性 良性 良性 根據(jù)題目中所給的已知信息,可以看出,我們運(yùn)用所求的判別
9、函數(shù)所檢驗(yàn)的結(jié)果 與實(shí)際情況幾乎不存在的誤差,也就是說運(yùn)用一次線性模型判定的結(jié)果可信度很 6.問題二的解答 運(yùn)用問題一中所求得的的最優(yōu)判別函數(shù),我們對(duì)附錄一中表二中 20組病例 各項(xiàng)指標(biāo)對(duì)應(yīng)數(shù)據(jù)代入模型一中進(jìn)行判別(用MATLA求解源程序見附錄二),我 們將結(jié)果整理可制成以下表: 表:對(duì)20組病例各項(xiàng)指標(biāo)對(duì)應(yīng)數(shù)據(jù)的判定結(jié)果 病例號(hào) 1 2 3 4 5 6 7 8 9 10 結(jié)果 惡性 良性 良性 惡性 惡性 良性 惡性 良性 良性 惡性 病歷號(hào) 11 12 13 14 15 16 17 18 19 20 結(jié)果 惡性 良性 良性 良性 惡性 良性 良性 良性 惡性 良性 從上表結(jié)果中我們可以得知
10、,運(yùn)用模型一中的判別方法可以判定附錄一中表 二中20組病例中第1, 4, 5, 7, 10,11, 15, 19組共8個(gè)病例是惡性腫瘤,余 下12個(gè)病例是良性腫瘤。 7問題三的解答 我們應(yīng)用剔除法對(duì)模型中的不顯著元素逐個(gè)進(jìn)行剔除,最終保留下來的元素就 是區(qū)分乳腺腫瘤是“良性”還是“惡性”的主要指標(biāo)。 我們知道回歸平方和SSR描述了全體自變量,X2,,Xp對(duì)y的總影響。為了 研究某個(gè)Xj的作用,先Xj把從p個(gè)自變量X1, X2/ ,Xp中扣除下來,只考慮p -1個(gè) 自變量的影響,作這p -1個(gè)自變量的回歸平方和,記作 SSRj),并記 Uj = SSR- SSRj) 其中,Uj為在X1, X2/
11、 ,Xp中Xj的偏回歸平方和,用它來衡量在y對(duì)X1,X2 / ,Xg的 線性回歸中Xj的作用大小。 Ujo 由于Uj的自由度為1,且(1),選統(tǒng)計(jì)量 Q Uj Fj 二SSE 1F(1,門一卩一嘰 72,9) / n _ p -1 算出Fj的值,對(duì)給出的顯著水平:,查出F(1,n-p-1)。 代入數(shù)據(jù)得Fj ,其中最小為F7 =0.0077對(duì)置信水平=0.05,查表得: F:(1,44) =4.1009。 所以考慮去掉x7 o 同理,將保留下來的項(xiàng),再代入數(shù)據(jù),求得Fj,其中最小為F5 =0.3236對(duì) 置信水平=0.05,查表得:1.(1,45)=4.0566。 所以我們考慮去掉X5 o 同
12、理,將保留下來的項(xiàng),再代入數(shù)據(jù),求得Fj ,其中最小為F 2.0145對(duì) 置信水平-0.05,查表得:F:.(1,46) =4.0517。 所以我們考慮去掉X4 o 由于保留下來的X,對(duì)y有顯著的線性回歸作用,因此,它們所對(duì)應(yīng)的指標(biāo) 即為區(qū)分乳腺腫瘤是“良性”還是“惡性”的主要指標(biāo),它們分別是乳腺腫瘤腫 塊的厚度、細(xì)胞大小的均勻性、細(xì)胞形狀的均勻性、裸核、正常的核仁、有絲分裂。 我們將對(duì)應(yīng)的樣本數(shù)據(jù)代入上式,利用Excel軟件,求得各參數(shù)項(xiàng)的線性回 歸系數(shù)分別為: 0 二-0.32092,訂=0.06385 x1=5 5 36 4 8 1 2 2 4 1 2 5 1 8 7 4 4 10 6
13、7 10 3 1 5 3 5 2 1 3 10 2 3 2 10 6 5 2 10 6 510 1 3 1 4 7 9 5 10 5 10 10 8 8 5 9 5 1 9; x2=1 4 1 8 1 10 1 1 1 2 1 1 3 1 7 4 1 1 7 1 3 51 1 2 2 1 1 1 1 7 1 1 1 10 2 4 5 4 10 6 10 1 7 1 1 8 5 3 3 5 5 6 10 2 2 5 3 1 10; x3=1 4 1 8 1 10 1 2 1 1 1 1 3 1 5 6 1 1 7 1 2 51 1 3 1 1 1 3 1 7 1 2 1 10 1 4 3 3 1
14、0 510 1 7 1 1 7 8 3 6 5 5 6 10 4 3 5 5 1 10; x4=1 5 1 1 3 8 1 1 1 1 1 1 3 1 10 4 1 1 6 1 10 3 1 1 4 1 1 1 1 1 3 2 1 1 8 1 9 3 1 2 6 4 1 4 1 3 2 1 4 2 8 6 3 1 1 1 2 5 1 1; x5=2 7 2 3 2 7 2 2 2 2 1 2 2 2 7 6 2 2 4 2 5 6 2 2 2 1 2 2 2 1 8 2 2 2 6 1 2 6 3 8 10 8 2 4 2 2 4 2 2 3 10 8 4 3 5 6 2 3 2 10; x6
15、=1 10 2 4 1 10 10 1 1 1 1 1 3 3 9 1 1 1 10 1 10 7 1 1 7 1 1 1 1 1 5 1 1 1 1 1 10 7 3 10 1 1 1 9 1 1 8 3 4 5 8 8 5 6 1 10 2 3 2 8; x7=3 3 3 3 3 9 3 3 1 2 3 2 4 3 5 4 2 3 4 3 5 7 2 3 3 2 2 2 1 2 7 3 2 2 8 7 5 7 6 7 3 8 2 4 2 3 3 2 3 4 7 7 3 3 5 5 5 4 2 3; x8=1 2 1 7 1 7 1 1 1 1 1 1 4 1 5 3 1 1 1 1 4 1
16、0 1 1 6 1 1 1 1 1 4 1 1 1 9 1 6 5 5 3 1 10 1 8 1 1 8 1 4 10 3 1 6 9 4 1 1 10 1 3; x9=1 1 1 1 1 1 1 1 5 1 1 1 1 1 4 1 1 1 2 1 4 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 2 3 1 1 2 1 1 1 2 5 1 2 7 1 1 1 4 1 1 1 1 1; n=60; m=9; X=o nes( n,1),x1,x2,x3,x4,x5,x6,x7,x8,x9; b,bi nt,r,ri nt,s=regress(y,X); b,b in t,
17、s, rcoplot(r,ri nt) 第二問源程序: 對(duì)第二問中20組數(shù)據(jù)進(jìn)行檢驗(yàn)而編寫的驗(yàn)證程序 3; x=11 1 1 1; 10 5 5 5 5; 4 1 2 4 1; 7 1 2 6 1; 2 1 2 6 1 1 1 1 1 8 1 6 1 1 6 1511 7 1511 3 1811 1 1 1 1 1 8 10 1 2 1 5 3111 53111 51111 1 1 1 1 1 7 1 1 3 4 6 1 1 4 2 4 1 1 4 3 8 1 1 10 5 2 2 2 4 3 2 4 2 1 2 2 2 2 2 10 2 1 5 3 2; 8 1 1 10 10 1 10 1
18、 1 10 10 1 1 1 10 1 1 1 8 1; 6 3 2 4 3 1 3 3 2 4 7 3 1 1 9 1 1 3 7 1; 1 1; 1 2 3 4 1 4 1 1 3 6 1 1 1 5 1 3 3 6 1; 1 1; 2 1 1 2 1 1 1 1 1 1 1 1 1 3 1 1 1 1 b=-0.32858 0.060725 -0.08212 0.10584 0.01551 0.01031 0.04209 0.00168 0.03196 0.03468; for i=1:20 y=b*x(:,i); fprintf(i=%d y=%.4fn,i,rou nd(y); en
19、d 第三冋源程序: 從而本程序 在第三問中我們是根據(jù)單個(gè)指標(biāo)變量對(duì)回歸方程的顯著性而剔出次要指標(biāo)因素, 是根據(jù)多元線性回歸而編寫的: clear;clc; 0 0; y1=0 1; 0; 1; 1; 1; S1=0;ev=0.48148; for i=1:6 for j=1:9 m=(y1(i,j)-ev)A2; S1=S1+m; end end fprintf( SST=%.4dn,S1); y2=0.148681983 0.069324661 0.118974492 1.285159521 0.284611376 0.072347794 0.101864472 0.004154119 -0
20、.104523738; -0.035176632 -0.01003266 1.024620112 0.706340335 0.086272695 0.087957319 1.107983827 0.209406646 0.96436467; 1.166398093 0.025548031 -0.094216671 0.737138534 -0.066877611 0.146997358 -0.035176632 0.114093683 0.015240964; 1.027852254 -0.017983421 0.131387833 -0.035176632 1.079716202 0.123
21、719502 0.885929381 0.679709746 1.019105172; 1.070259537 -0.061219863 0.798865398 -0.095901296 0.118974492 0.919533106 1.025210061 1.335488806 1.007981748; 0.987958073 0.95072849 1.020822474 0.800482188 0.701668574 0.547435382 0.853686004 -0.05380929 1.046099336; S2=0;eve=0.48148; for i=1:6 for j=1:9
22、 n=(y2(i,j)-evf2; S2=S2+n; end end fprintf(SSR=%.4fn,S2); fprintf(SSE=%.4fn,S1-S2); S=11.4785 11.9837 11.8280; 12.1916 12.2226 11.6118; 12.2318 12.0045 12.1521; F0=4.0617; for i=1:3 for j=1:3 u=S2-S(i,j); F=44*u/1.2495; if FF0 D(1,:)=F; fprintf(i=%d,F=%.4fn,3*(i-1)+j,F); else break end end end fprin
23、tf(7?a x ?D?o ? u ? o | 卩? ?d ? e ? i T3y)n s1=12.23181332; S3=11.47852968 11.98373906 11.82802738; 12.19155653 12.22262476 11.61179146; 1112.00448406 12.15209715; for i=1:3 for j=1:3 u=s1-S3(i,j); F=44*u/1.2495; if FF0 D(1,:)=F; fprintf(i=%d,F=%.4fn,3*(i-1)+j,F); else break ; end end end fprintf( 5
24、?a x ?D?o ? u ? o | 卩? ?d ? e ? i T3y);n S2=12.21889223; S4=11.32729644 11.97956448 11.78325664; 12.16168558 1111.54865906; 1111.99657911 12.11429211; for i=1:3 for j=1:3 u=s2-S4(i,j); F=44*u/1.2495; if FF0 D(1,:)=F; fprintf(i=%d,F=%.4fn ,3*(i-1)+j,F); else break ; end end end fprintf( 4?a x ?D?o ? u ? o | 卩? ?d ? 士e士 ? i T3y)n S3=12.16168558; S5=11.20393294 11.96192794 11.77763389; 111111.20264765; 1111.84512684 11.9997
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年脈沖反應(yīng)堆及配套產(chǎn)品合作協(xié)議書
- 化妝品檢測(cè)服務(wù)合同范本
- 北美買車合同范本
- 低價(jià)格回收合同范本
- 個(gè)人酒店租房合同范本
- 出口蔬菜供應(yīng)合同范本
- 合同范本寫才有效
- 單位購(gòu)銷合同范本
- 電商直播主播簽約合作合同范本
- 洗車店轉(zhuǎn)讓合同范本
- 禮儀與教化 課件-2023-2024學(xué)年高中美術(shù)湘美版(2019)美術(shù)鑒賞
- 新生兒早期基本保健課件
- 采礦學(xué)課程設(shè)計(jì)硯北煤礦新井設(shè)計(jì)全套圖紙
- 第19章-城市設(shè)計(jì)課件
- 人事管理管理制度
- 大型儲(chǔ)罐計(jì)算書
- 2022-2023學(xué)年廣東省廣州市荔灣區(qū)統(tǒng)考初三第一次??紨?shù)學(xué)試題含解析
- 針對(duì)本項(xiàng)目售后服務(wù)方案
- 2022年桂林電子科技大學(xué)高等學(xué)歷繼續(xù)教育學(xué)士學(xué)位英語(yǔ)考試真
- 新人教版七至九年級(jí)英語(yǔ)單詞表 漢譯英(含音標(biāo))
- 新固廢法課件PPT
評(píng)論
0/150
提交評(píng)論