![聚類分析例子_第1頁](http://file4.renrendoc.com/view/8947279d178470294a4fd7686896f2d0/8947279d178470294a4fd7686896f2d01.gif)
![聚類分析例子_第2頁](http://file4.renrendoc.com/view/8947279d178470294a4fd7686896f2d0/8947279d178470294a4fd7686896f2d02.gif)
![聚類分析例子_第3頁](http://file4.renrendoc.com/view/8947279d178470294a4fd7686896f2d0/8947279d178470294a4fd7686896f2d03.gif)
![聚類分析例子_第4頁](http://file4.renrendoc.com/view/8947279d178470294a4fd7686896f2d0/8947279d178470294a4fd7686896f2d04.gif)
![聚類分析例子_第5頁](http://file4.renrendoc.com/view/8947279d178470294a4fd7686896f2d0/8947279d178470294a4fd7686896f2d05.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)例題1:下表是我國(guó)16個(gè)地區(qū)農(nóng)民在1982年支出情況的抽樣調(diào)查數(shù)據(jù)的匯總資料,每個(gè)地區(qū)都調(diào)查了反映每人平均生活消費(fèi)支出情況的六個(gè)指標(biāo)。試?yán)谜{(diào)查資料對(duì)16個(gè)地區(qū)進(jìn)行分類。地區(qū)食品衣著燃料住房生活用品及其他文化生活服務(wù)支出北京190.3343.779.7360.5449.019.04天津135.236.410.4744.1636.493.94河北95.2122.839.322.4422.812.8山西104.7825.116.49.8918.173.25內(nèi)蒙古128.41
2、27.638.9412.5823.993.27遼寧145.6832.8317.1927.2939.093.47吉林159.3733.3818.3711.8125.295.52黑龍江116.2229.5713.2413.7621.756.04上海221.1138.6412.53115.6550.825.89江蘇144.9829.1211.6742.627.35.74浙江169.9232.7512.7247.1234.355安徽153.1123.0915.6223.5418.186.39福建144.9221.2616.9619.5221.756.73江西140.5121.517.6419.1915
3、.974.94山東115.8430.2612.233.6133.773.85河南101.1823.268.4620.220.54.3下面用統(tǒng)計(jì)學(xué)軟件 SAS(Statistical Analysis System)data dfdf;input city $ x1 x2 x3 x4 x5 x6;cards;beijing 190.33 43.77 9.73 60.54 49.01 9.04tianjing 135.20 36.40 10.47 44.16 36.49 3.94hebei 95.21 22.83 9.30 22.44 22.81 2.80shanxi 104.78 25.11 6
4、.40 9.89 18.17 3.25neimenggu 128.41 27.63 8.94 12.58 23.99 3.27liaoning 145.68 32.83 17.19 27.29 39.09 3.47jilin 159.37 33.38 18.37 11.81 25.29 5.22heilongjiang 116.22 29.57 13.24 13.76 21.75 6.04shanghai 221.11 38.64 12.53 115.65 50.82 5.89jiangsu 144.98 29.12 11.67 42.60 27.30 5.74zhejiang 169.92
5、32.75 12.72 47.12 34.35 5.00anhui 153.11 23.09 15.62 23.54 18.18 6.39fujian 144.92 21.26 16.96 19.52 21.75 6.73jiangxi 140.54 21.50 17.64 19.19 15.97 4.94shandong 115.84 30.26 12.20 33.61 33.77 3.85henan 101.18 23.26 8.46 20.20 20.50 4.30;run;proc cluster data=dfdf std outtree=tree method=ave pesudo
6、 rsq;id city;run; /*ward離差平方和法 war; 類平均法 ave; 重心法 cen;最長(zhǎng)距離法 com;中間距離法 med; 最短距離法 sin;密度估計(jì)法 den;極大似然法 eml; 可變類平均 fle;相似分析法 mcq; 兩階段密度估計(jì) two; */proc tree data=tree out=new graphics horizontal; id city;run;ClusterHistoryNormRMSNCLClustersJoined-FREQSPRSQRSQPSFPST2Dist15anhuifujian20.00250.99828.7.0.193
7、14hebeihenan20.00550.99219.1.0.286913CL14shanxi30.00680.98516.71.20.311612CL15jiangxi30.00990.97514.440.348111jiangsuzhejiang20.00890.96614.4.0.36610CL13neimengg40.01060.95614.41.70.36929tianjingshandong20.00920.94715.5.0.37118CL9CL1140.02370.92313.72.60.49577liaoningjilin20.01890.90414.1.0.53296hei
8、longjCL1240.02670.87714.34.30.54635CL8CL760.05280.82412.93.50.66814CL5CL6100.12690.6989.26.60.78233CL4CL10140.19550.5026.67.80.87512beijingshanghai20.05620.44611.3.0.91841CL2CL3160.44580.11.31.5454(1)統(tǒng)計(jì)量(列標(biāo)題為)用于評(píng)價(jià)每次合并成個(gè)類時(shí)的聚類效果?,F(xiàn)考察的值隨的變化。比如,在分為四個(gè)類之前()的并類過程中的減少是逐漸的,改變不大;當(dāng)分為四個(gè)類時(shí)的,而下一次合并后分為三個(gè)類時(shí)下降較多(),由此
9、可以通過對(duì)統(tǒng)計(jì)量的變化分析可得出分為四個(gè)類是較合適的。(2)半偏(列標(biāo)題為)得到。根據(jù)半偏的值是上一步驟與該步驟的差值,故某步驟的半偏值越大,說明上一步驟合并的效果越好,此例半偏最大和次大分別為,說明根據(jù)半偏準(zhǔn)則分為兩個(gè)類,四個(gè)類和五個(gè)類是較合適的。(3)偽統(tǒng)計(jì)量(列標(biāo)題為)用于評(píng)價(jià)分為個(gè)類的聚類效果。偽值越大表示這些觀測(cè)樣品可以顯著地分為個(gè)類。此例中偽最大和次大分別為(當(dāng)),說明根據(jù)偽準(zhǔn)則分為五個(gè)類或兩個(gè)類較合適的。(4)偽統(tǒng)計(jì)量(列標(biāo)題為)用以評(píng)價(jià)此步驟合并的效果。由該統(tǒng)計(jì)量的定義知,偽大表明上一次合并的兩個(gè)類是很分開的,也就是上依次聚類的效果是好的。此例子中最大和次大分別為,說明根據(jù)偽準(zhǔn)
10、則分為兩個(gè)類,四個(gè)類和五個(gè)類是較合適的。綜合分析,認(rèn)為采用類平均法分類,將16個(gè)地區(qū)分為兩個(gè)類或五個(gè)類較合適。分為五個(gè)類的結(jié)果為:北京,上海,天津、山東、江蘇、浙江、遼寧、吉林,黑龍江、安徽、福建、江西,河北、河南、山西、內(nèi)蒙;若分為兩類,北京,上海,天津、山東、江蘇、浙江、遼寧、吉林,黑龍江、安徽、福建、江西,河北、河南、山西、內(nèi)蒙。類別第一類第二類第三類第四類第五類該類所包含的區(qū)域河北 河南山西 內(nèi)蒙黑龍江 安徽福建 江西天津 山東 江蘇 浙江 遼寧 吉林北京上海食品平均消費(fèi)107.395138.698145.165190.33221.11衣著平均消費(fèi)24.70823.85532.4574
11、3.7738.64燃料平均消費(fèi)8.27515.86513.8709.7312.53住房平均消費(fèi)16.27819.00034.43160.54115.65生活用品以及其他平均消費(fèi)21.36819.41332.71549.0150.82文化生活服務(wù)支出平均消費(fèi)3.4056.0254.5379.045.89例題2:對(duì)305名女中學(xué)生測(cè)量八個(gè)體型指標(biāo):身高 :體重 :手臂長(zhǎng) :頸圍上肢長(zhǎng) :胸圍 :下肢長(zhǎng) :胸寬相關(guān)矩陣如下表。我們用相關(guān)系數(shù)來度量各對(duì)變量之間的相似性。相應(yīng)于最長(zhǎng)距離法,類與類之間的相似系數(shù)定義為兩類變量間的最小相關(guān)系數(shù),每次聚類時(shí)合并兩個(gè)相似系數(shù)最大的類。1.0000.8461.00
12、00.8050.8811.0000.8590.8260.8011.0000.4730.3760.3800.4361.0000.3980.3260.3190.3290.7621.0000.3010.2770.2370.3270.7300.5831.0000.3820.4150.3450.3650.6290.5770.5391.000/*用變量聚類過程varclus對(duì)變量進(jìn)行分類data jlfx (type=corr);input id x1 x2 x3 x4 x5 x6 x7 x8;_type_=corr;cards;1 1.000 . . . . . . .2 0.846 1.000 . . . . . .3 0.805 0.881 1.000 . . . . .4 0.859 0.826 0.801 1.000 . . . .5 0.473 0.376 0.380 0.436 1.000 . . .6 0.398 0.326 0.319 0.329 0.762 1.000 . . 7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 深圳市出租房屋合同書(28篇)
- 湖南信息職業(yè)技術(shù)學(xué)院2024年單招考試職業(yè)技能測(cè)試E組樣題
- 設(shè)計(jì)方案優(yōu)化函
- 2025年信貸調(diào)整協(xié)商協(xié)議
- 2025年醫(yī)院合同管理策略與優(yōu)化措施
- 2025年互聯(lián)網(wǎng)電商員工保密協(xié)議規(guī)范
- 2025年獵頭項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告模范
- 2025年二手住宅帶閣樓出售合同規(guī)范
- 2025年煙膠項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告模稿
- 2025年二手房合同糾紛隱患與預(yù)防
- 2025年道路運(yùn)輸企業(yè)安全生產(chǎn)管理人員考試題(附答案)
- 建設(shè)工程質(zhì)量安全監(jiān)督人員考試題庫含答案
- 居間合同標(biāo)準(zhǔn)范本
- 2025年上半年山東人才發(fā)展集團(tuán)限公司社會(huì)招聘易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上海民航職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 2024年山東理工職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 《生命與宗教》課件
- 《中華人民共和國(guó)學(xué)前教育法》專題培訓(xùn)
- 食品分析實(shí)驗(yàn)講義(1)
- 泥炭生化復(fù)合肥建設(shè)項(xiàng)目可行性研究報(bào)告
- 軟件公司K3渠道招募制度
評(píng)論
0/150
提交評(píng)論