《統(tǒng)計分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第1頁
《統(tǒng)計分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第2頁
免費預(yù)覽已結(jié)束,剩余11頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 統(tǒng)計分析與SPSS的應(yīng)用(第五版)(薛薇) 課后練習(xí)答案 第 10 章 SPSS 的聚類分析 1 1、根據(jù)高??蒲醒芯?sav.sav 數(shù)據(jù),利用層次聚類分析對各省市的高??蒲星闆r進(jìn)行層次聚 類分析。要求: 1 1) 根據(jù)凝聚狀態(tài)表利用碎石圖對聚類類數(shù)進(jìn)行研究。 2 2) 繪制聚類樹形圖,說明哪些省市聚在一起。 3 3) 繪制各類的科研指標(biāo)的均值對比圖。 4 4) 利用方差分析方法分析各類在哪些科研指標(biāo)上存在顯著差異。 采用歐氏距離,組間平均鏈鎖法 利用凝聚狀態(tài)表中的組間距離和對應(yīng)的組數(shù),回歸散點圖,得到碎石圖。大約聚成 4 4 類。 步驟:分析 分類

2、系統(tǒng)聚類 按如下方式設(shè)置 昱大蹩嶷數(shù)兇: 甜秦卿芙分祈:筑計 邁似值矩陣(巳 -略甌 G甲一方家國) O 方家范圍遲, :樂堺取込I幫助 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 結(jié)果: 凝聚計劃 階段 組合的集群 系數(shù) 首次出現(xiàn)階段集群 下一個階段 集群 1 集群 2 集群 1 集群 2 1 26 30 328.189 0 0 2 2 26 29 638.295 1 0 7 3 1053.42 0 2 2 0 5 4 4 12 1209.922 0 0 15 5 8 0 3 6 2 1505.03 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8

3、7 11 1929.891 0 0 11 1 9 5 8 2302.024 0 6 22 1 10 24 31 2487.209 7 0 22 1 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 1 16 2 3 4229.375 11 0 21 1 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20

4、 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 1 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 1 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 30 1 2 293834.503 0 29 0 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考

5、學(xué)習(xí)資料 1 1- -JI JI京 N N 大津 嚴(yán)A A 二壺 *山西 21:番 耳一葦 2 23 3J J. .- -I1 I1 1 1WW福連 威山東 少,円 養(yǎng) 2Ct丙 MM . . .S S 亠円r rffiffi 易.宦 0 00 0- - . .S S 帛也 咅江西 22學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 便用平均聯(lián)接 (紐間)的譜系圖 將系數(shù)復(fù)制下來后,在 EXCELEXCEL 中建立工作表 選中數(shù)據(jù)列,點擊“插入”菜單 拆線圖學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 1 1 32B.1M 2 2 638.295 3 3 1053.423 4 屯 1209.922 b 5

6、1505 期5 6 6 1760.17 7 7 IE31.9囲 S S 1929.891 9 9 2302.024 10 12437.2 11 12709.337 12 1 3TO7JO6 13 12916.551 14 11 3290,752 15 13491.595 Ifi 14229 J75 17 14612,423 ieie IS 5377.253 19 15622.415 2020 2593丸5泊 21 26827.276 22 2793O.TO5 23 2 9475.498 24 214059.704 25 219623.05 Q胃創(chuàng)i A B E3P 就貝 kJ 11 磁罪- 4

7、?看 G 儲 SmartArt 抒4BE圖 293334.503 4 9475. 79X1.765 6537. J76 12 注意隆序 3491.505 1 2 ffiSBRURBW.年1 瘟 ? 1! 1L 12 13 14 15 15 5933.538 5J7?獲 SS12.W 229.375 4 5 L JL 10 11 tfS 二B30 r M 323.184 A C D t 1 91313.53 854 3細(xì)堿 24042. 1W23.Q5 14SL59, EM 14 16 7 1B 2D _21 25 3SS3.T52 2936.551 2937. 翊抑 2302.0 4 1謝呦

8、JM5.035 JOT.S2E 接下來,添加一個變量 CLU4_1 CLU4_1 ,其值為類別值。(1 1、2 2、3 3、4 4),再數(shù)據(jù) 匯總 設(shè)置 確定。 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 均值對比,依據(jù)聚類解,利用分類匯總,計算各個聚類變量的均值 CLU4_1 x3 meain x5 mean M6=irnean 1 6795 0D 3737.00 339S03.M 3261.00 2723 00 12270.M 237.00 2 2209 17 1051 42 56046 08 923 67 462 58 4800 08 14333 3 96D.15 442.46 7061 6

9、2 372 31 171.85 2117.OD 64.08 4 4137 80 1996 00 122009 0 2115.00 912.S0 8609 20 271 60 方差分析結(jié)果:分析 比較均值 單因素 ANOVA ANOVA 設(shè)置 確定 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 ANOVA 平方和 df 均方 F 顯著性 投入人年數(shù) 組之間 59778341.196 3 19926113.732 26.428 .00: 組內(nèi) 20357294.159 27 753973.858 總計 80135635.355 30 投入高級職稱的人年數(shù) 組之間 16485966.820 3 54953

10、22.273 34.553 .000 組內(nèi) 4294074.147 27 159039.783 總計 20780040.968 30 投入科研事業(yè)費(百元) 組之間 132451401880.8 84 3 44150467293. 628 324.318 .000 組內(nèi) 3675602946.794 27 136133442.47 4 總計 136127004827.6 77 30 課題總數(shù) 組之間 16470536.564 3 5490178.855 32.181 .00: 組內(nèi) 4606273.436 27 170602.720 總計 21076810.000 30 專著數(shù) 組之間 720

11、3690.385 3 2401230.128 61.327 .000: 組內(nèi) 1057167.809 27 39154.363 總計 8260858.194 30 論文數(shù) 組之間 219675698.219 3 73225232.740 17.693 .000 組內(nèi) 111743385.717 27 4138643.915 總計 331419083.935 30 獲獎數(shù) 組之間 169882.049 3 56627.350 3.619 .026 組內(nèi) 422436.790 27 15645.807 總計 592318.839 30 不同組在各個聚類變量上的均值均存在顯著差異。 2 2、試說明當(dāng)

12、變量存在數(shù)量級上的差異,進(jìn)行層次聚類分析時為什么要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處 理? 因為數(shù)量級將對距離產(chǎn)生較大影響,并影響最終聚類結(jié)果。 3 3、 試說明變量之間的高度相關(guān)性是否會對層次聚類分析結(jié)果造成影響?為什么? 會。如果所選變量之間存在較強的線性關(guān)系, 能夠相互替代,在計算距離時同類變量將重復(fù) “貢獻(xiàn)”,占有較高權(quán)重,而使最終的聚類結(jié)果偏向該類變量。 4 4、 試說明 K K- -MeanMean 聚類分析的基本步驟。 K K- -MeMeansans 聚類分析步驟: 確定聚類數(shù)目 K K-確定 K K 個初始類中心點-根據(jù)距離最近原則進(jìn)行分類 -重新確定 K K 個 類中心點-判斷是否已經(jīng)滿足

13、終止條件。 是一個反復(fù)迭代的分類過程。在聚類過程中,樣本所屬的類會不斷調(diào)整,直至達(dá)到最終 穩(wěn)定為止。 5 5、收集到我國 20072007 年各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費支出數(shù)據(jù), 數(shù)據(jù)文件名為:“消 費結(jié)構(gòu).sav.sav”,變量包括:地區(qū)、消費性支出總額、食品、衣著、居住、家庭設(shè)備用品及服學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 務(wù)、醫(yī)療保健、交通和通信、教育文化娛樂服務(wù)、醫(yī)療保健、雜項商品和服務(wù)支出。若采用 層次聚類法(個體間距離定義為平方歐氏距離,類間距離定義為組間平均鏈鎖距離) 的碎石圖如下: (1 1) 依據(jù)上圖,數(shù)據(jù)聚成幾類較為恰當(dāng)? (2 2) 試采用 K K- -MEAN

14、SMEANS 聚類方法,從類內(nèi)相似性和類間差異性角度分析將數(shù)據(jù)聚成幾類較 為恰當(dāng)。 (1 1)聚成 3 3 類較為恰當(dāng)。 注:碎石圖可按第 9 9 章第 1 1 題方式繪制,也可按如下方式繪制。 步驟:分析降維因子分析導(dǎo)入全部變量到變量框中(地區(qū)變量除外) ?。哼x中碎石圖繼續(xù)確定。繪制 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 葩因子亦描匪 期吵:二二 3 彌 - 紳 殛相矢性矩陣 L 的國孑l iE) 百協(xié)方整毎陣也 V 第基于將tEiltlb 榊證15尢于曲: T O因子的EJ腳童迪 夢提中旳因于:口 : 最那取挙雄侑衣數(shù)因:包匚 |ja輸 | 科 m 組件號 (2 2)用 K K- -ME

15、ANSMEANS 聚類方法進(jìn)行分類,比較分類數(shù)為 2 2、3 3、4 4 時的差別。 步驟:分析 分類 K K- -平均聚類 地區(qū)變量導(dǎo)入到標(biāo)注個案,其他變量全部導(dǎo)入 到變量框中 聚類數(shù)填 2 2 選項:選中初始聚類中心和 A ANOVA NOVA 繼續(xù) 確定5 5- CT II II III 11 2 3 4 5 6 7 6 得到:(可以看出,分成 3 3 類恰當(dāng)) 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 ANOVA 聚類 錯誤 F 顯著性 均方 df 均方 df 食品 13927902.967 1 246753.779 29 56.445 .000 衣著 278718.565 1 3755

16、5.425 29 7.422 .011 居住 667583.436 1 31940.764 29 20.901 .000 家庭設(shè)備用品及服務(wù) 411657.258 1 14558.041 29 28.277 .000 醫(yī)療保健 325304.302 1 34400.296 29 9.456 .005 交通和通信 10285607.457 1 57486.400 29 178.922 .000 教育文化娛樂服務(wù) 5226361.465 1 69080.933 29 75.656 .000 雜項商品和服務(wù) 248312.931 1 6496.550 29 38.222 .000 僅當(dāng)岀于描述目的時

17、才應(yīng)該使用 F檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。 受觀察的顯 著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設(shè)的檢驗。 每個聚類中的個案數(shù)量 聚類 1 4.000 Sieiistics - 礙班弟申心 IVANOVA 表 每個什翼審?fù)聤X嵐&迄F 邑矢值 題按?1用排陣4笨(P C曲H群障牛猱 Q 得到: 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 2 27.000 有效 31.000 缺失 .000 將上圖中的聚類數(shù)修改為 3 3,則得到: ANOVA 聚類 錯誤 F 顯著性 均方 df 均方 df 食品 8311754.509 2 1592

18、94.770 28 52.178 .000 學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 學(xué)習(xí)資料 衣著 100878.509 2 41645.317 28 2.422 .107 居住 565811.147 2 16508.690 28 34.274 .000 家庭設(shè)備用品及服務(wù) 237257.836 2 12833.027 28 18.488 .000 醫(yī)療保健 198689.996 2 33054.746 28 6.011 .007 交通和通信 4709934.064 2 90458.748 28 52.067 .000 教育文化娛樂服務(wù) 2676015.304 2 67059.926 28 39.905

19、 .000 雜項商品和服務(wù) 150742.666 2 4829.555 28 31.213 .000 僅當(dāng)岀于描述目的時才應(yīng)該使用 F檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。 受觀察的 顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設(shè)的檢驗。 每個聚類中的個案數(shù)量 聚類 1 1.000 2 25.000 3 5.000 有效 31.000 缺失 .000 將上圖中的聚類數(shù)修改為 4 4,則得到: ANOVA 聚類 錯誤 F 顯著性 均方 df 均方 df 食品 6461251.597 3 62963.251 27 102.619 .000 衣著 135334.013 3 35623.106 27 3.799 .022 居住 237725.271 3 32618.140 27 7.288 .001 家庭設(shè)備用品及服務(wù) 142250.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論