判別分析實(shí)例_第1頁(yè)
判別分析實(shí)例_第2頁(yè)
判別分析實(shí)例_第3頁(yè)
判別分析實(shí)例_第4頁(yè)
判別分析實(shí)例_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、例:人文與發(fā)展指數(shù)是聯(lián)合國(guó)開發(fā)計(jì)劃署于1990年5月發(fā)表的第一份人類發(fā)展報(bào)告中公布的。該報(bào)告建議,目前對(duì)人文發(fā)展的衡量指標(biāo)應(yīng)當(dāng)以人生的三大要素為重點(diǎn)。衡量人生的三大要素的指標(biāo)分別為:實(shí)際人均GDP指數(shù)、出生時(shí)的預(yù)期壽命指數(shù)、受教育程度指數(shù)(由成人識(shí)字率指數(shù)和綜合總?cè)藢W(xué)率指數(shù)按2/3、1/3的權(quán)重加權(quán)而得),將一生三個(gè)指數(shù)合成為一個(gè)指數(shù)就是人文發(fā)展指數(shù)。今從2007年世界各國(guó)人文發(fā)展指數(shù)(2005年)的排序中,選取高發(fā)展水平、中等發(fā)展水平和低發(fā)展水平國(guó)家各6個(gè)作為三組樣品,另選四個(gè)國(guó)家作為待判樣品,資料如下表所示。試用判別分析過程對(duì)以下數(shù)據(jù)資料進(jìn)行判別分析,并據(jù)此對(duì)待選的四個(gè)國(guó)家進(jìn)行判別歸類。國(guó)

2、家人均GDP(美元)出生時(shí)的預(yù)期壽命(歲)成人識(shí)字率(%)初等、中等和高等教育入學(xué)率(%)第一類:高發(fā)展水平國(guó)家美國(guó)4189077.999.593.3德國(guó)2946179.199.288希臘2338178.99699新加坡2966379.492.587.3意大利2852980.398.490.6韓國(guó)2202977.99996第二類:中等發(fā)展水平國(guó)家古巴600077.799.887.6羅馬尼亞906071.997.376.8巴西840271.788.687.5泰國(guó)867769.692.671.2菲律賓51377192.681.1土耳其840771.487.468.7第三類:低發(fā)展水平國(guó)家尼泊爾15

3、5062.648.658.1尼日利亞112846.569.156.2喀麥隆229949.867.962.3巴基斯坦237064.649.940越南307173.790.363.9印度尼西亞384369.790.468.2待判組日本3126782.39985.9印度345263.76163.8中國(guó)675772.590.969.1南非1111050.882.477data develop;input type gdp life rate zhrate;cards;1 4189077.999.593.31 2946179.199.2881 2338178.996991 2966379.492.587

4、.31 2852980.398.490.61 2202977.999962 600077.799.887.62 906071.997.376.82 840271.788.687.52 867769.692.671.22 51377192.681.12 840771.487.468.73 155062.648.658.13 112846.569.156.23 229949.867.962.33 237064.649.9403 307173.790.363.93 384369.790.468.2. 3126782.39985.9. 345263.76163.8. 675772.590.969.1.

5、 1111050.882.477;proc discrim simple wcov distance list;/*simple:要求技術(shù)各類樣品的簡(jiǎn)單描述統(tǒng)計(jì)量;選項(xiàng)WCOV要求計(jì)算類內(nèi)協(xié)方差陣;選項(xiàng)DISTANCE要求計(jì)算馬氏距離;選項(xiàng)LIST要求輸出重復(fù)替換歸類結(jié)果。由于沒有給出方法選項(xiàng),所以系統(tǒng)按缺省時(shí)的正態(tài)分布進(jìn)行有關(guān)參數(shù)的估計(jì)和歸類。*/class type;var gdp life rate zhrate;run;proc discrim pool=test slpool=0.05 list; /*simple: */class type;priors 1=0.3 2=0.4 3

6、=0.3 ;run;proc discrim method=npar k=2 list; /*simple: */class type;run;proc candisc out=result ncan=2; /*simple: */class type;var gdp life rate zhrate;run;proc gplot data=reult;plot can1*can2=type;run;proc discrim data=result distance list;class type;var can1 can2;run;表1 已知樣本分類水平信息表2 樣本統(tǒng)計(jì)量信息表3 類間距離

7、及三類總體均值差異的顯著性檢驗(yàn)表3給出了類1與類2之間的馬氏距離為37.58288,類1與類3之間的馬氏距離為75.97603,類2與類3之間的馬氏距離為10.91428.類與類之間總體均值的F檢驗(yàn)統(tǒng)計(jì)量值分布為22.54978,45.58562,22.54973,對(duì)應(yīng)的檢驗(yàn)概率分別為0.0001, 0.0001,0.0001, 說明三類總體均值兩輛之間的差異是顯著的,因此判別分析有意義。表4 線形判別函數(shù)由表4可寫出線形判別函數(shù)如下:高發(fā)展水平:y1=-157.18932+0.00204gdp+1.66582life-0.37085rate+1.72851zhrate中等發(fā)展水平Y(jié)2=-99

8、.12840+0.0006250gdp+1.49389life-0.09262rate+1.19559zhrate低發(fā)展水平:Y3=-62.22473+0.0002576gdp+1.31631life-0.08940rate+0.85253zhrate表5:用距離判別法判別分析結(jié)果由表5得,最后四個(gè)觀測(cè)的歸類結(jié)果為19號(hào)(日本)觀測(cè)為高發(fā)展水平國(guó)家,第20號(hào)(印度)為第3類,即低發(fā)展水平國(guó)家,21號(hào)(中國(guó))和22號(hào)(南非)歸為中等發(fā)展水平國(guó)家。表6 距離判別法判別分析結(jié)果小結(jié) 表6給出了分類錯(cuò)誤信息,由輸出結(jié)果可知分類錯(cuò)誤的比率為0,即正確的比率為100%。 本程序中第二個(gè)判別分析過程的選項(xiàng)“

9、pool=test”,要求進(jìn)行類內(nèi)協(xié)方差陣一致性檢驗(yàn),檢驗(yàn)的顯著性水平由選項(xiàng)”slpool=0.05”給出為0.05. priors語(yǔ)句給出了各發(fā)展水平國(guó)家的先驗(yàn)概率。表7 分類信息及類內(nèi)協(xié)方差陣一致性檢驗(yàn)結(jié)果 表7表明3個(gè)類的先驗(yàn)概率分別為0.3,0.4,0.3,類內(nèi)協(xié)方差陣行列式的自然對(duì)數(shù)不相等,表明類內(nèi)協(xié)方差陣不相等,而卡方統(tǒng)計(jì)量值為46.068898,對(duì)應(yīng)的概率是0.0008,在0.05的顯著性水平下是顯著的,即類內(nèi)協(xié)方差陣存在顯著差異。由于類內(nèi)協(xié)方差陣不等,所以判別函數(shù)應(yīng)是二次函數(shù)。表8 類間配對(duì)廣義馬氏距離由表8可知,類內(nèi)廣義馬氏距離不再為0,而且類間的廣義馬氏距離也不再相等,因而

10、類內(nèi)協(xié)方差和先驗(yàn)概率對(duì)后驗(yàn)概率的計(jì)算是起作用的。表9 用 Bayes判別法得到的判別分析部分結(jié)果 由表9可知,用BAYES判別法對(duì)待判樣品的判別結(jié)果與距離判別法結(jié)果一致。本程序中的第三個(gè)過程要求進(jìn)行非參數(shù)分析,即對(duì)類密度函數(shù)進(jìn)行非參數(shù)估計(jì)。選項(xiàng)K=2要求用最近鄰的兩個(gè)樣品進(jìn)行密度函數(shù)估計(jì),選項(xiàng)list要求輸出重復(fù)替換歸類結(jié)果。該過程運(yùn)行結(jié)果如下:表10 用NPAR方法得到的判別分析部分結(jié)果由表10可知,4個(gè)待判的樣品中19號(hào)和21號(hào)歸類結(jié)果與BAYES判別歸類結(jié)果是一致的,但20號(hào)和22號(hào)所屬類別則不能確定,這是與前面2中判別方法結(jié)果不一致的地方。 第四種FISHER判別:第一個(gè)過程執(zhí)行典型判

11、別分析。第二個(gè)過程要求繪制第一個(gè)典型變量CAN1和第二個(gè)典型變量CAN2的散點(diǎn)圖,以便更加直觀了解分類情況。第一、二個(gè)過程輸出結(jié)果如下:表11 典型相關(guān)的多變量檢驗(yàn)結(jié)果由上表對(duì)相關(guān)陣的顯著性檢驗(yàn)結(jié)果可知,至少有表12 典型相關(guān)與特征值上表可知,第一典型相關(guān)為0.969875,而第二典型相關(guān)為0.653396。第一個(gè)特征值為15.8514,所占比例為95.51%,第二個(gè)特征值為0.7450,所占比例僅有4.49%,說明只需用第一個(gè)典型變量即可。表13 原始變量的典型相關(guān)系數(shù)由表12可得兩個(gè)典型變量分別為:CAN1=0.0002096544gdp+0.0382960552life-0.0346472260rate+0.0988009134zhrateCan2=-0.0001135485gdp+0.0394378902life+0.0500655661rate+0.0390500134zhrate表14 類間馬氏距離及各類總體均值的顯著性檢驗(yàn)由上表的顯著性概率可知,在0.05的顯著性水平下,三個(gè)類的總體均值兩兩顯著不等。表15 線性判別函數(shù)由表15得3個(gè)類的線形判

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論