![第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第1頁(yè)](http://file1.renrendoc.com/fileroot_temp2/2021-2/1/4e61a14e-0780-4e7c-9e17-0ffc366b53db/4e61a14e-0780-4e7c-9e17-0ffc366b53db1.gif)
![第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第2頁(yè)](http://file1.renrendoc.com/fileroot_temp2/2021-2/1/4e61a14e-0780-4e7c-9e17-0ffc366b53db/4e61a14e-0780-4e7c-9e17-0ffc366b53db2.gif)
![第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第3頁(yè)](http://file1.renrendoc.com/fileroot_temp2/2021-2/1/4e61a14e-0780-4e7c-9e17-0ffc366b53db/4e61a14e-0780-4e7c-9e17-0ffc366b53db3.gif)
![第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第4頁(yè)](http://file1.renrendoc.com/fileroot_temp2/2021-2/1/4e61a14e-0780-4e7c-9e17-0ffc366b53db/4e61a14e-0780-4e7c-9e17-0ffc366b53db4.gif)
![第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第5頁(yè)](http://file1.renrendoc.com/fileroot_temp2/2021-2/1/4e61a14e-0780-4e7c-9e17-0ffc366b53db/4e61a14e-0780-4e7c-9e17-0ffc366b53db5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第六章習(xí)題 習(xí)題6.3 解:用SAS的proc fastclus將各個(gè)國(guó)家聚為三類(lèi),即如果如下: 聚類(lèi)散點(diǎn)圖如下: x23020100101111111111111111111111111111111111111111111111111111111111111111112030Cluster1140x121111150311160 (2)聚為四類(lèi)結(jié)果散點(diǎn)圖如下: x230201001011111111111111111111111111111111111111111111111111111111111111111120Cluster30111140x11111250111311604 習(xí)題6.
2、4 解:通過(guò)proc fastclus聚為三類(lèi)結(jié)果如下: 15 / 1 Cluster Listing Obs years Cluster Distance from Seed 1 1978 1 474.3 2 1979 1 433.2 3 1980 1 362.1 4 1981 1 288.9 5 1982 1 260.0 6 1983 1 218.3 7 1984 1 141.7 8 1985 1 60.4851 9 1986 1 169.3 10 1987 1 350.2 11 1988 1 730.5 12 1989 1 890.3 13 1990 2 985.0 14 1991 2
3、723.8 15 1992 2 249.2 16 1993 2 484.6 17 1994 2 1475.1 18 1995 3 1086.4 19 1996 3 394.5 20 1997 3 96.1975 21 1998 3 471.9 22 1999 3 958.6 聚類(lèi)結(jié)果散點(diǎn)圖:15 / 2 x220001900180017001600150014001300120011001000900800700600500400300200100111111111111111111111110000Cluster2000x111111300031112114000 6.6 習(xí)題用最短距離法得
4、到的聚,過(guò)程中取選項(xiàng)“method=single”1解:()在proc cluster 類(lèi)結(jié)果如下所示: Cluster History NCL Clusters Joined FREQ Min Dist T i e 10 N Da 2 1 T 9 Fr I 2 1 T 8 CL9 S 3 1 7 E CL10 3 2 6 CL8 P 4 3 5 CL7 G 4 4 4 CL5 Du 5 5 T 3 CL4 CL6 9 5 2 CL3 H 10 8 T 1 CL2 Fi 11 8 的時(shí)候,將挪威語(yǔ)和丹麥語(yǔ)聚為一上述聚類(lèi)過(guò)程為:首先在最短距離為110個(gè)樣本,這是全部類(lèi)被分為2CL10=類(lèi),得新類(lèi)
5、丹麥語(yǔ),挪威語(yǔ),其中包含15 / 3 類(lèi);其次,將法語(yǔ)和意大利語(yǔ)聚為一類(lèi),CL9=法語(yǔ),意大利語(yǔ);其中包含兩個(gè)樣本,這是全部樣本被分為9類(lèi),接著在最短距離為2的時(shí)候,波蘭語(yǔ)被分到CL9當(dāng)中,也即CL8=CL9,波蘭語(yǔ),然后英語(yǔ)被分到CL10中,的新類(lèi)CL7=CL10,英語(yǔ)=丹麥語(yǔ),挪威語(yǔ),英語(yǔ),如此等等,最后在最短距離為8的時(shí)候,所有類(lèi)并入CL2中,這樣全部樣品歸為一類(lèi),系統(tǒng)聚類(lèi)結(jié)束。 由譜系聚類(lèi)法能夠細(xì)致的看出由小到大的聚類(lèi)過(guò)程,由合并時(shí)的距離水平可以看出樣本之間的親疏程度。 然后利用proc tree 過(guò)程可以畫(huà)出最短距離譜系圖如下所示: 其中以E、N、Da、Du、G、Fr、S、I、P、H
6、、Fi分別代表英語(yǔ)、挪威語(yǔ)、丹麥語(yǔ)、荷蘭語(yǔ)、德語(yǔ)、法語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)、波蘭語(yǔ)、匈牙利語(yǔ)、芬蘭語(yǔ)等11中語(yǔ)言。 identityENDaGDuFrISPHFi0123Minimum Distance Between Clusters56784 (2)最長(zhǎng)距離法。在proc cluster過(guò)程中選取”method=conplete”,得到最長(zhǎng)距離法聚類(lèi)過(guò)程見(jiàn)下表: 15 / 4 Cluster History NCL Clusters Joined FREQ Max Dist T i e 10 N Da 2 1 T 9 Fr I 2 1 T 8 E CL10 3 2 T 7 CL9 S 3
7、2 6 Du G 2 5 T 5 CL7 P 4 5 4 CL8 CL6 5 7 T 3 H Fi 2 8 2 CL4 CL3 7 9 1 CL2 CL5 11 10 倒數(shù)第六步兩種方法合并次序和合并距離水平有所與最短距離法聚類(lèi)過(guò)程相比, 不同。identityENDaDuGHFiFrISP109678401235Maximum Distance Between Clusters 得到最長(zhǎng)距離”method=average,”proc cluster3()類(lèi)平均距離法。在過(guò)程中選取 法聚類(lèi)過(guò)程見(jiàn)下表:15 / 5 Cluster History NCL Clusters Joined FREQ
8、 Aver Dist T i e 10 N Da 2 1 T 9 Fr I 2 1 T 8 CL9 S 3 1.5 7 E CL10 3 2 6 CL8 P 4 4 5 CL7 G 4 5 T 4 CL5 Du 5 5.75 3 CL4 CL6 9 6.9 2 H Fi 2 8 1 CL3 CL2 11 9.0556 在最長(zhǎng)距離聚與最短距離法聚類(lèi)過(guò)程相比,倒數(shù)第二步兩種方法合并次序不同, 聚為一類(lèi)。類(lèi)中時(shí)將匈牙利語(yǔ)和芬蘭語(yǔ)先合并為一類(lèi)在和CL3最長(zhǎng)距離聚類(lèi)法譜系圖如下所示 : identityENDaGDuFrISPHFi109678401235Average Distance Between
9、 Clusters 得到最長(zhǎng)距離法聚類(lèi)”method=centroid,”proc cluster4()重心法。在過(guò)程中選取 過(guò)程見(jiàn)下表:15 / 6 Cluster History NCL Clusters Joined FREQ Squared Cent Dist T i e 10 N Da 2 1 T 9 Fr I 2 1 T 8 CL9 S 3 1.25 7 E CL10 3 1.75 6 CL8 P 4 3.5556 5 CL7 G 4 4.4444 T 4 CL5 CL6 8 4.0625 3 CL4 Du 9 5.3594 2 CL3 Fi 10 6.5679 1 CL2 H 1
10、1 6.22 重心法與前述幾種方法在類(lèi)的合并以及距離水平都有所差異。 其譜系聚類(lèi)結(jié)果如下所示: identityENDaGFrISPDuFiH7.06.06.54.04.55.05.53.51.50.00.51.02.02.53.0Distance Between Cluster Centroids 6.7 習(xí)題2.得到最長(zhǎng)距,”method=complete”過(guò)程中選取proc 最長(zhǎng)距離法。在cluster)(解:1:離法聚類(lèi)過(guò)程見(jiàn)下表 15 / 7 Cluster History NCL Clusters Joined FREQ Max Dist 15 1989 1990 2 13.9 1
11、4 1999 2000 2 17.06 13 1985 1986 2 18.83 12 1991 1992 2 29.022 11 1996 1997 2 31.489 10 CL13 1987 3 47.606 9 CL15 CL12 4 53.244 8 CL11 1998 3 68.7 7 1995 CL8 4 81.253 6 CL10 1988 4 118.56 5 CL9 1993 5 123.18 4 CL7 CL14 6 144.09 3 1994 CL4 7 199.95 2 CL6 CL5 9 306.9 1 CL2 CL3 16 672.8 然后得到聚為三類(lèi)的結(jié)果:199
12、3 、19911989、1990、1992第一類(lèi):1994 1995、1997、1998、2000第二類(lèi):1999、1996、1988 1992、第三類(lèi):1985、Obs years CLUSTER CLUSNAME 1 1989 1 CL5 2 1990 1 CL5 3 1999 2 CL3 4 2000 2 CL3 5 1985 3 CL6 6 1986 3 CL6 7 1991 1 CL5 8 1992 1 CL5 9 1996 2 CL3 10 1997 2 CL3 15 / 8 Obs years198519861987years CLUSTER CLUSNAME 11 1987 3
13、 CL6 12 1998 2 CL3 13 1995 2 CL3 14 1988 3 CL6 15 1993 1 CL5 16 1994 2 CL3 譜系聚類(lèi)結(jié)果圖: 1988198919901991199219931994199519961997199819992000700650500550600250300350400450200050100150Maximum Distance Between Clusters 得到最長(zhǎng)距離,method=average”)類(lèi)平均距離法。在proc cluster過(guò)程中選取”2( 法聚類(lèi)過(guò)程見(jiàn)下表:、Cluster History NCL Cluste
14、rs Joined FREQ Aver Dist T i e 15 1989 1990 2 13.9 14 1999 2000 2 17.06 13 1985 1986 2 18.83 12 CL15 1991 3 23.508 11 1996 1997 2 31.489 10 CL13 1987 3 38.338 9 CL12 1992 4 42.159 8 CL11 1998 3 56.317 15 / 9 Cluster History NCL Clusters Joined FREQ Aver Dist T i e 7 1995 CL8 4 73.327 6 1988 CL9 5 89
15、.989 5 CL7 CL14 6 110.9 4 CL6 1993 6 122.26 3 1994 CL5 7 171.24 2 CL10 CL4 9 185.58 1 CL2 CL3 16 466.34 譜系聚類(lèi)結(jié)果圖如下所示: years1985198619871988198919901991199219931994199519961997199819992000500450350400150200250300100050Average Distance Between Clusters 然后得到聚為三類(lèi)的結(jié)果:1993 1991、1988、1990第一類(lèi):1989、19921994 、
16、19951997、1996、19982000第二類(lèi):1999、1985 1987、1986第三類(lèi):、Obs years CLUSTER CLUSNAME 1 1989 1 CL4 2 1990 1 CL4 3 1999 2 CL3 4 2000 2 CL3 5 1985 3 CL10 15 / 10 Obs years CLUSTER CLUSNAME 6 1986 3 CL10 7 1991 1 CL4 8 1996 2 CL3 9 1997 2 CL3 10 1987 3 CL10 11 1992 1 CL4 12 1998 2 CL3 13 1995 2 CL3 14 1988 1 CL
17、4 15 1993 1 CL4 16 1994 2 CL3 3)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化之后,得到聚為三類(lèi)的結(jié)果分別為:( 最長(zhǎng)距離法: 聚為三類(lèi)的結(jié)果為:1994 、1997、19981999、2000、1996、第一類(lèi):1993 、1992、第二類(lèi)結(jié)果:19891990、19911988 、1987第三類(lèi)結(jié)果為:1895、1986Obs years CLUSTER CLUSNAME 1 1999 1 CL3 2 2000 1 CL3 3 1989 2 CL4 4 1990 2 CL4 5 1985 3 CL6 6 1986 3 CL6 7 1996 1 CL3 8 1997 1 CL3 9 199
18、1 2 CL4 10 1992 2 CL4 11 1987 3 CL6 12 1998 1 CL3 13 1995 1 CL3 14 1988 3 CL6 15 / 11 Obs years CLUSTER CLUSNAME 15 1993 2 CL4 16 1994 1 CL3 類(lèi)平均距離法聚聚為三類(lèi)的結(jié)果: 1998、1994、1995、1997第一類(lèi):1999、2000、1996、1993 1992、1990、1991、第二類(lèi):1989、1988 1987、1986、第三類(lèi):1985Obs years CLUSTER CLUSNAME 1 1999 1 CL3 2 2000 1 CL3
19、3 1989 2 CL4 4 1990 2 CL4 5 1985 3 CL5 6 1986 3 CL5 7 1991 2 CL4 8 1996 1 CL3 9 1997 1 CL3 10 1987 3 CL5 11 1992 2 CL4 12 1998 1 CL3 13 1995 1 CL3 14 1988 3 CL5 15 1993 2 CL4 16 1994 1 CL3 在數(shù)據(jù)標(biāo)準(zhǔn)化之前不同聚類(lèi)方法得到的結(jié)果不僅盡相同,觀察聚類(lèi)結(jié)果發(fā)現(xiàn),兩種不同而且在標(biāo)準(zhǔn)化前后聚類(lèi)結(jié)果也是不要一樣的,但是在數(shù)據(jù)標(biāo)準(zhǔn)化之后, 的聚類(lèi)方法聚類(lèi)結(jié)果完全相同。6.8 3.習(xí)題 解:首先從相關(guān)系數(shù)矩陣出發(fā),通過(guò)變換
20、得到距離矩陣。rddD ,從令出發(fā),得到變換之后的距離矩陣:)1?(ijijij15 / 12 ?0?00.423? 0.4910.4010?00.6130.6110.564?0.05380.5380.5740.477?用最短距,”過(guò)程中取選項(xiàng)“(1)最短距離聚類(lèi)法。在proc clustermethod=single 離法得到的聚類(lèi)結(jié)果如下所示:Cluster History NCL Clusters Joined FREQ Min Dist T i e 4 x2 x3 2 0.5825 3 x1 CL4 3 0.6209 2 x4 x5 2 0.708 1 CL3 CL2 5 0.8394 譜系聚類(lèi)結(jié)果圖:identitxx2x3x4x50.00.10.20.30.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 涉外建設(shè)工程施工合同
- 家居行業(yè)設(shè)計(jì)風(fēng)格與文化內(nèi)涵的融合
- 三農(nóng)行業(yè)手冊(cè)合作社運(yùn)營(yíng)
- 廚房承包合同書(shū)參考
- Go語(yǔ)言基礎(chǔ)概念與實(shí)踐作業(yè)指導(dǎo)書(shū)
- 內(nèi)部審計(jì)與風(fēng)險(xiǎn)管理作業(yè)指導(dǎo)書(shū)
- 擔(dān)保書(shū)之擔(dān)保型買(mǎi)賣(mài)合同
- 物流信息管理系統(tǒng)作業(yè)指導(dǎo)書(shū)
- 私人教練勞動(dòng)合同
- 石油化工行業(yè)安全環(huán)保管理體系建設(shè)方案
- 二零二五年度大型自動(dòng)化設(shè)備買(mǎi)賣(mài)合同模板2篇
- 2024版金礦居間合同協(xié)議書(shū)
- 江西省部分學(xué)校2024-2025學(xué)年高三上學(xué)期1月期末英語(yǔ)試題(含解析無(wú)聽(tīng)力音頻有聽(tīng)力原文)
- 2025內(nèi)蒙古匯能煤化工限公司招聘300人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2023年廣州金融控股集團(tuán)有限公司招聘筆試題庫(kù)及答案解析
- 七上解一元一次方程100道練習(xí)習(xí)題(有答案)
- 2021年山東省威海市中考物理真題
- 血液科品管圈匯報(bào)-PPT課件
- 六年級(jí)上冊(cè)數(shù)學(xué)150道簡(jiǎn)便計(jì)算
- 管道保溫及面積計(jì)算公式
- 江西省日照小時(shí)數(shù)
評(píng)論
0/150
提交評(píng)論