SPSS處理聚類分析_第1頁
SPSS處理聚類分析_第2頁
SPSS處理聚類分析_第3頁
SPSS處理聚類分析_第4頁
SPSS處理聚類分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

實驗五:聚類分析一.實驗目的1.學會用spss進行聚類分析。2.了解層次聚類和K值聚類法的有缺點。二.實驗要求利用2001年全國31個省市自治區(qū)各類小康和現(xiàn)代化指數的數據,對地區(qū)別作分層聚類和K-Means聚類分析。數據見:聚類分析數據(小康指數)。三.實驗內容方法一:層次聚類1.試驗步驟:依次點擊“分析”——“分類”——“系統(tǒng)聚類”如下圖一所示,將“省市”放入標注個案中,將其余放入“變量”中?!緢D一】點擊統(tǒng)計量,選中“合并進程表,相似性矩陣”如下圖二所示:【圖二】點擊“圖”,設置相應操作,如下圖三所示:【圖三】選中“方法”,設置如下圖四:【圖四】點擊“確定”得到輸出結果,如下表一:【表一】聚類案例處理匯總(a)案例有效缺失總計N百分比N百分比N百分比31100.00.031100.0

a

Ward聯(lián)結聚類表階群集組合系數首次出現(xiàn)階群集下一階群集1群集2群集1群集21262819.735001121244.62500173121381.11500642427117.710001051921160.355001861218206.332301371517284.397001381011368.2920015945452.2220021102429545.8334012112630641.6451016122425764.93310020131215902.666672214691050.28600191510231202.14480261620261378.2270112317131574.21720291814191795.372052219672059.159140262022242336.9680122321482630.10590272212142961.9381318242320223467.6861620252412163980.051220282520314553.96423028266105196.11119152727467302.5312126292812209617.935242530291415114.2651727303011235858.78829280

******HIERARCHICAL

CLUSTER

ANALYSIS******DendrogramusingWardMethodRescaledDistanceClusterCombineCASE

0

5

10

15

20

25Label

Num

+---------+---------+---------+---------+---------+甘肅

26

江西

28

貴州

30

青海

20

安徽

24

廣西

27

河南

29

云南

25

寧夏

22

西藏

31

湖北

12

陜西

13

內蒙古

18

山西

15

重慶

17

湖南

19

四川

21

河北

14

海南

16

北京

1

上海

2

天津

3

浙江

4

廣東

5

福建

8

黑龍江

10

吉林

11

新疆

23

江蘇

6

山東

9

遼寧

7

試驗結果分析:在聚類表中:第一列表示聚類分析的第幾步,第二列第三列表示本步驟類中哪兩個樣本或小類聚成一類,第四列是個體距離或小類距離,第五列第六列表示本步驟類中參與聚類的是個體還是小類,0表示樣本,非0表示由第幾步驟生成的小類參與本布聚類,第七列表示本步驟類的結果將在以下第幾步中用到。在第一步中,26號樣品與28號樣品聚成一小類,它們的個體距離是19.735,且它們都是樣本,這個小類將在下面的第11步用到;在第11步中,30號樣品與第一步聚成的小類(26和28)又聚成一個小類,它們的距離是641.645,形成的小類將在下面的第16步用到,群集1表示群集1是第一步類聚生成的小類。在樹狀圖中可以看出,若想將其分為兩類只需從10處向下劃豎線,此時26、28、30、20、24、27、29、25、22、31、12、13、18、15、17、19、21、14、16是一類,1、2、3、4、5、8、10是一類,同理,若要化為3類只需從5出向下畫豎線。方法二:K值聚類法操作步驟:依次點擊“分析”——“分類”——“K值聚類法”,“省市”加到“標注個案”中,其余加到“變量”中,將聚類數改為3,保存中全選中,如下圖五所示:【圖五】輸出結果如下表二所示:【表二】快速聚類初始聚類中心聚類123綜合指數79.2092.3051.10社會結構90.4095.1061.90經濟與技術發(fā)展86.9092.7031.50人口素質65.90112.0056.00生活質量86.5095.4041.00法制與治安59.4057.5075.60

迭代歷史記錄(a)迭代聚類中心內的更改123124.3876.30723.5792.000.000.000

a

由于聚類中心內沒有改動或改動較小而達到收斂。任何中心的最大絕對坐標更改為.000。當前迭代為2。初始中心間的最小距離為49.349。最終聚類中心聚類123綜合指數75.4991.1360.02社會結構82.8696.1766.86經濟與技術發(fā)展72.4192.0344.03人口素質77.74106.1369.32生活質量75.8494.2751.81法制與治安67.1758.5776.15

每個聚類中的案例數聚類17.00023.000321.000有效31.000缺失.000

試驗結果分析:“初始類中心點”展示了3個類的初始類中心點的情況,可見第二類是最優(yōu)的,第一類次之,第三類最不理想?!暗鷼v史”中,展示了3個類中心點每次迭代的偏移情況,由表只,第一次迭代后,三個類的中心點分別偏移了24.387,6.307,23.579,第三類中心偏移最大,第二次迭代后,3個類的中心點的偏移均小于指定的判定標準(0.02)?!懊總€聚類中的案例數”表明,第一類有7個省市自治區(qū),第二類有3個省市自治區(qū),第三類有21個省市自治區(qū)。四、存在問題與解決情況聚類分析是研究“物以類聚”的一種科學有效的方法。做聚類分析時,出于不同的目的和要求,可以選擇不同的統(tǒng)計量和聚類方法。系統(tǒng)聚類是目前應用最為廣泛的一種聚類方法,其基本思想是:先將待聚類的n個樣品(或者變量)各自看成一類,共有n類;然后按照實現(xiàn)選定的方法計算每兩類之間的聚類統(tǒng)計量,即某種距離(或者相似系數),將關系最為密切的兩類合為一類,其余不變,即得到n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論