第六章數(shù)據(jù)分析(梅長林)習(xí)題答案_第1頁
第六章數(shù)據(jù)分析(梅長林)習(xí)題答案_第2頁
第六章數(shù)據(jù)分析(梅長林)習(xí)題答案_第3頁
第六章數(shù)據(jù)分析(梅長林)習(xí)題答案_第4頁
第六章數(shù)據(jù)分析(梅長林)習(xí)題答案_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第六章習(xí)題習(xí)題6.3解:用SAS的procfastclus將各個(gè)國家聚為三類,即如果如下:聚類散點(diǎn)圖如下:x23011111111111201111111111111111111111111111111111110111111111111111111110102030405060x1Cluster111111121113(2)聚為四類結(jié)果散點(diǎn)圖如下:x23011111111111201001111111111111111111111111111111111111111111111111111111102030405060x1Cluster1111111211131114習(xí)題6.4解:通過procfastclus聚為三類結(jié)果如下:1/15ClusterListingObsyears11978ClusterDistancefromSeed474.3121979111111111112222233333433.231980362.141981288.951982260.061983218.371984141.78198560.4851169.391986101987111988121989131990141991151992161993171994181995191996201997211998350.2730.5890.3985.0723.8249.2484.61475.11086.4394.596.1975471.9221999958.6聚類結(jié)果散點(diǎn)圖:2/15x2200011900180017001600150014001300120011001000900800700600500400300200111111111111111111111100010002000x130004000Cluster111111121113習(xí)題6.61)在proccluster過程中取選項(xiàng)解:(“method=single”,用最短距離法得到的聚類結(jié)果如下所示:ClusterHistoryTiMinDistNCLClustersJoinedFREQe10NDaI21T1T19Fr238CL97ESCL10P326CL85CL74CL53CL42CL31CL243G44DuCL6H55T5910118T8Fi上述聚類過程為:首先在最短距離為1的時(shí)候,將挪威語和丹麥語聚為一類,得新類CL10={丹麥語,挪威語},其中包含2個(gè)樣本,這是全部類被分為103/15類;其次,將法語和意大利語聚為一類,CL9={法語,意大利語9類,接著在最短距離為2的時(shí)候,波蘭語被分到CL9當(dāng)中,也即CL8={CL9,波蘭語},然后英語被分到CL10中,的新類}={丹麥語,挪威語,英語},如此等等,最后在最短距離為8的時(shí)候,所有類并入CL2中,這樣全部樣品歸為一類,系統(tǒng)聚類結(jié)束。};其中包含兩個(gè)樣本,這是全部樣本被分為CL7={CL10,英語由譜系聚類法能夠細(xì)致的看出由小到大的聚類過程,由合并時(shí)的距離水平可以看出樣本之間的親疏程度。然后利用proctree過程可以畫出最短距離譜系圖如下所示:E、N、Da、Du、G、Fr、S、I、P、H、Fi分別代表英語其中以、挪威語、丹、荷蘭語、德語、法語、西班牙語、意大利語、波蘭語、匈牙利語、芬蘭語麥語等11中語言。identityENDaGDuFrISPHFi012345678MinimumDistanceBetweenClusters(2)最長距離法。在proccluster過程中選取”method=conplete”,得到最長距離法聚類過程見下表:4/15ClusterHistoryTiMaxDistNCLClustersJoinedFREQe10NDaI21T1T2T29Fr238ECL10S7CL96Du5CL74CL83H3G25T5P4CL6Fi57T822CL41CL2CL3CL5791110與最短距離法聚類過程相比,倒數(shù)第六步兩種方法合并次序和合并距離水平有所不同。identityENDaDuGHFiFrISP012345678910MaximumDistanceBetweenClusters(3)類平均距離法。在proccluster過程中選取”method=average”,得到最長距離法聚類過程見下表:5/15ClusterHistoryTiAverNCLClustersJoinedFREQDiste1T1T1.510NDaI29Fr238CL97ESCL10P326CL85CL74CL53CL42H44G45T5.756.9DuCL6Fi59281CL3CL2119.0556與最短距離法聚類過程相比,倒數(shù)第二步兩種方法合并次序不同,在最長距離聚類中時(shí)將匈牙利語和芬蘭語先合并為一類在和CL3聚為一類譜系圖如下所示:。最長距離聚類法identityENDaGDuFrISPHFi012345678910AverageDistanceBetweenClusters(4)重心法。在proccluster過程中選取”method=centroid”,得到最長距離法聚類過程見下表:6/15ClusterHistoryTiSquaredNCLClustersJoinedFREQCentDiste10NDaI21T9Fr231T8CL97ES1.25CL10P31.756CL85CL74CL53CL42CL31CL243.55564.4444T4.06255.35946.56796.22G4CL6DuFi891011H重心法與前述幾種方法在類的合并以及距離水平都有所差異。其譜系聚類結(jié)果如下所示:identityENDaGFrISPDuFiH0.00.51.01.52.02.53.03.54.04.55.05.56.06.57.0DistanceBetweenClusterCentroids2.習(xí)題6.7最長距離法。在proccluster過程中選取”method=complete”,得到最長距解:(1)離法聚類過程見下表:7/15ClusterHistoryMaxDistNCLClustersJoinedFREQ151989199020001986199219971987CL121998CL8213.917.0614199913198512199111199610CL139CL158CL11719956CL105CL922223434456791618.8329.02231.48947.60653.24468.781.253118.56123.18144.09199.95306.919881993CL14CL44CL7319942CL6CL51CL2CL3672.8然后得到聚為三類的結(jié)果:第一類:1989、1990、1992、1991、1993第二類:1999、2000、1996、1997、1998、1995、1994第三類:1985、1992、1988Obsyears11989CLUSTERCLUSNAME1CL51CL52CL32CL33CL63CL61CL51CL52CL32CL321990319994200051985619867199181992919961019978/15Obsyears111987CLUSTERCLUSNAME3CL62CL32CL33CL61CL52CL3121998131995141988151993161994譜系聚類結(jié)果圖:years1985198619871988198919901991199219931994199519961997199819992000050100150200250300350400450500550600650700MaximumDistanceBetweenClusters)類平均距離法。在proccluster過程中選取”method=average”,得到最長距離(2法聚類過程見下表:、ClusterHistoryTAveriNCLClustersJoinedFREQDiste15198919902000198619911997198719921998213.914199913198512CL1511199610CL139CL128CL11223234317.0618.8323.50831.48938.33842.15956.3179/15ClusterHistoryTiAverNCLClustersJoinedFREQDiste71995CL8CL9CL141993CL5CL4CL3473.327619885CL74CL6319942CL101CL25689.989110.96122.26171.24185.58466.347916譜系聚類結(jié)果圖如下所示:years1985198619871988198919901991199219931994199519961997199819992000050100150200250300350400450500AverageDistanceBetweenClusters然后得到聚為三類的結(jié)果:第一類:1989、1990、1992、1988、1991、1993第二類:1999、2000、1996、1997、1998、1995、1994第三類:1986、1987、1985Obsyears11989CLUSTERCLUSNAME1CL41CL42CL32CL33CL102199031999420005198510/15Obsyears61986CLUSTERCLUSNAME3CL101CL42CL32CL33CL101CL42CL32CL31CL41CL42CL3719918199691997101987111992121998131995141988151993161994(3)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化之后,得到聚為三類的結(jié)果分別為:最長距離法:聚為三類的結(jié)果為:第一類:1999、2000、1996、1997、1998、1994第二類結(jié)果:1989、1990、1991、1992、1993第三類結(jié)果為:1895、1986、1987、1988Obsyears11999CLUSTERCLUSNAME1CL31CL32CL42CL43CL63CL61CL31CL32CL42CL43CL61CL31CL33CL6220003198941990519856198671996819979199110199211198712199813199514198811/15Obsyears151993161994CLUSTERCLUSNAME2CL41CL3類平均距離法聚聚為三類的結(jié)果:第一類:1999、2000、1996、1997、1994、1995、1998、第二類:1989、1990、1991、1992、1993第三類:1985、1986、1987、1988Obsyears11999CLUSTERCLUSNAME1CL31CL32CL42CL43CL53CL52CL41CL31CL33CL52CL41CL31CL33CL52CL41CL32200031989419905198561986719918199691997101987111992121998131995141988151993161994觀察聚類結(jié)果發(fā)現(xiàn),在數(shù)據(jù)標(biāo)準(zhǔn)化之前不同聚類方法得到的結(jié)果不僅盡相同,而且在標(biāo)準(zhǔn)化前后聚類結(jié)果也是不要一樣的,但是在數(shù)據(jù)標(biāo)準(zhǔn)化之后,兩種不同的聚類方法聚類結(jié)果完全相同。3.習(xí)題6.8解:首先從相關(guān)系數(shù)矩陣出發(fā),通過變換得到距離矩陣。令d1r,從D(d)出發(fā),得到變換之后的距離矩陣:ijijij12/1500.42300.4910.40100.6130.6110.56400.5380.5380.5740.4770(1)最短距離聚類法。在proccluster過程中取選項(xiàng)“method=single”,用最短距離法得到的聚類結(jié)果如下所示:ClusterHistoryTMinDistiNCLClustersJoinedFREQe4x2x320.58250.62090.7083x1CL4x53252x41CL3CL20.8394譜系聚類結(jié)果圖:identityx1x2x3x4x50.00

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論