《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第1頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第2頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第3頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第4頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》(薛薇)課后練習(xí)答案第10章SPSS的聚類分析1、根據(jù)“高??蒲醒芯?sav”數(shù)據(jù),利用層次聚類分析對(duì)各省市的高??蒲星闆r進(jìn)行層次聚類分析。要求:根據(jù)凝聚狀態(tài)表利用碎石圖對(duì)聚類類數(shù)進(jìn)行研究。繪制聚類樹形圖,說明哪些省市聚在一起。繪制各類的科研指標(biāo)的均值對(duì)比圖。利用方差分析方法分析各類在哪些科研指標(biāo)上存在顯著差異。采用歐氏距離,組間平均鏈鎖法利用凝聚狀態(tài)表中的組間距離和對(duì)應(yīng)的組數(shù),回歸散點(diǎn)圖,得到碎石圖。大約聚成4類步驟:分析T分類T系統(tǒng)聚類一按如下方式設(shè)置……結(jié)果:凝聚計(jì)劃階段組合的集群系數(shù)首次出現(xiàn)階段集群下一個(gè)階段集群1集群2集群1集群212630328.18900222629638.295107320251053.42300544121209.922001558201505.03503668161760.170509724261831.926021087111929.89100119582302.02406221024312487.209702211272709.88708161222282897.1060019136232916.55100171410193280.7520025154213491.585402116234229.37511021176134612.42313020189185377.25300251914225622.41501224206155933.5181702321246827.276161526225247930.765910242324252627282930659292212714106175929475.4982002614959.70422192819623.05018142724042.66921232832829.4662502948360.85426242991313.530282730293834.5030290將系數(shù)復(fù)制下來后,在EXCEL中建立工作表。選中數(shù)據(jù)列,點(diǎn)擊“插入”菜單T拆線圖碎石圖:由圖可知,北京自成一類,江蘇、廣東、上海、湖南、湖北聚成一類。其他略。-確定。接下來,添加一個(gè)變量CLU4_1,其值為類別值。(1、2、3、4),再數(shù)據(jù)-匯總T設(shè)置均值對(duì)比,依據(jù)聚類解,利用分類匯總,計(jì)算各個(gè)聚類變量的均值-確定。方差分析結(jié)果:分析T比較均值T單因素ANOVAT設(shè)置......T確定ANOVA平方和df均方F顯著性投入人年數(shù)組之間59778341.196319926113.73226.428.000組內(nèi)20357294858總計(jì)80135635.35530投入高級(jí)職稱的人年數(shù)組之間16485966.82035495322.27334.553.000組內(nèi)4294074783總計(jì)20780040.96830投入科研事業(yè)費(fèi)(百元)組之間132451401880.8344150467293.324.318.00084628組內(nèi)136133442.473675602946.794274總計(jì)136127004827.67730課題總數(shù)組之間16470536.56435490178.85532.181.000組內(nèi)4606273.43627170602.720總計(jì)21076810.00030專著數(shù)組之間7203690.38532401230.12861.327.000組內(nèi)1057167.8092739154.363論文數(shù)獲獎(jiǎng)數(shù)總計(jì)8260858.19430組之間219675698.219373225232.74017.693.000組內(nèi)111743385.717274138643.915總計(jì)331419083.93530組之間169882.049356627.3503.619.026組內(nèi)422436.7902715645.807總計(jì)592318.83930不同組在各個(gè)聚類變量上的均值均存在顯著差異。2、試說明當(dāng)變量存在數(shù)量級(jí)上的差異,進(jìn)行層次聚類分析時(shí)為什么要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理?因?yàn)閿?shù)量級(jí)將對(duì)距離產(chǎn)生較大影響,并影響最終聚類結(jié)果。3、試說明變量之間的高度相關(guān)性是否會(huì)對(duì)層次聚類分析結(jié)果造成影響?為什么?會(huì)。如果所選變量之間存在較強(qiáng)的線性關(guān)系,能夠相互替代,在計(jì)算距離時(shí)同類變量將重復(fù)“貢獻(xiàn)”,占有較高權(quán)重,而使最終的聚類結(jié)果偏向該類變量。4、試說明K-Mean聚類分析的基本步驟。K-Means聚類分析步驟:確定聚類數(shù)目K--確定K個(gè)初始類中心點(diǎn)--根據(jù)距離最近原則進(jìn)行分類--重新確定K個(gè)類中心點(diǎn)--判斷是否已經(jīng)滿足終止條件。是一個(gè)反復(fù)迭代的分類過程。在聚類過程中,樣本所屬的類會(huì)不斷調(diào)整,直至達(dá)到最終穩(wěn)定為止。5、收集到我國2007年各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費(fèi)支出數(shù)據(jù),數(shù)據(jù)文件名為“消費(fèi)結(jié)構(gòu).sav”,變量包括:地區(qū)、消費(fèi)性支出總額、食品、衣著、居住、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通和通信、教育文化娛樂服務(wù)、醫(yī)療保健、雜項(xiàng)商品和服務(wù)支出。若采用層次聚類法(個(gè)體間距離定義為平方歐氏距離,類間距離定義為組間平均鏈鎖距離),繪制的碎石圖如下:(1) 依據(jù)上圖,數(shù)據(jù)聚成幾類較為恰當(dāng)?(2) 試采用K-MEANS聚類方法,從類內(nèi)相似性和類間差異性角度分析將數(shù)據(jù)聚成幾類較為恰當(dāng)。1)聚成3類較為恰當(dāng)。注:碎石圖可按第9章第1題方式繪制,也可按如下方式繪制。步驟:分析T降維T因子分析T導(dǎo)入全部變量到變量框中(地區(qū)變量除外)T抽取:選中碎石圖T繼續(xù)T確定。得到:(可以看出,分成3類恰當(dāng))(2)用K-MEANS聚類方法進(jìn)行分類,比較分類數(shù)為2、3、4時(shí)的差別。步驟:分析T分類TK-平均聚類T地區(qū)變量導(dǎo)入到標(biāo)注個(gè)案,其他變量全部導(dǎo)入到變量框中T聚類數(shù)填29選項(xiàng):選中初始聚類中心和ANOVAT繼續(xù)T確定。得到:ANOVA聚類錯(cuò)誤F顯著性均方df均方df食品13927902.9671246753.7792956.445.000衣著278718.565137555.425297.422.011居住667583.436131940.7642920.901.000家庭設(shè)備用品及服務(wù)411657.258114558.0412928.277.000醫(yī)療保健325304.302134400.296299.456.005交通和通信10285607.457157486.40029178.922.000教育文化娛樂服務(wù)5226361.465169080.9332975.656.000雜項(xiàng)商品和服務(wù)248312.93116496.5502938.222.000僅當(dāng)出于描述目的時(shí)才應(yīng)該使用F檢驗(yàn),因?yàn)橐堰x擇聚類用于將不同聚類中的個(gè)案的差異最大化。受觀察的顯著性級(jí)別并未因此得到更正,所以無法將這些級(jí)別解釋為“聚類方法是等同的”假設(shè)的檢驗(yàn)。每個(gè)聚舉中的個(gè)案數(shù)量聚類14.000227.000有效31.000缺失.000將上圖中的聚類數(shù)修改為3,則得到:ANOVA聚類錯(cuò)誤F顯著性均方df均方df食品8311754.5092159294.7702852.178.000衣著100878.509241645.317282.422.107居住565811.147216508.6902834.274.000家庭設(shè)備用品及服務(wù)237257.836212833.0272818.488.000醫(yī)療保健198689.996233054.746286.011.007

交通和通信4709934.064290458.7482852.067.000教育文化娛樂服務(wù)2676015.304267059.9262839.905.000雜項(xiàng)商品和服務(wù)150742.66624829.5552831.213.000僅當(dāng)出于描述目的時(shí)才應(yīng)該使用F檢驗(yàn),因?yàn)橐堰x擇聚類用于將不同聚類中的個(gè)案的差異最大化。受觀察的顯著性級(jí)別并未因此得到更正,所以無法將這些級(jí)別解釋為“聚類方法是等同的”假設(shè)的檢驗(yàn)。每個(gè)聚類中的個(gè)案數(shù)量聚類11.000225.00035.000有效31.000缺失.000將上圖中的聚類數(shù)修改為4,則得到:ANOVA聚類錯(cuò)誤F顯著性均方df均方df食品6461251.597362963.25127102.619.000衣著135334.013335623.106273.799.022居住237725.271332618.140277.288.001家庭設(shè)備用品及服務(wù)142250.914315077.322279.435.000醫(yī)療保健111992.289336553.186273.064.045交通和通信3596731.324343056.2632783.536.000教育文化娛樂服務(wù)1812882.568366335.5862727.329.000雜項(xiàng)商品和服務(wù)97486.29135342.7412718.246.000僅當(dāng)出于描述目的時(shí)才應(yīng)該使用F檢驗(yàn),因?yàn)橐堰x擇聚類用于將不同聚類中的個(gè)案的差異最大化。受觀察的顯著性級(jí)別并未因此得到更正,所以無法將這些級(jí)別解釋為“聚類方法是等同的”假設(shè)的檢驗(yàn)。每個(gè)聚類中的個(gè)案數(shù)量聚類11.00023.000315.000412.000有效31.000缺失.000從3個(gè)ANOVA表可以■出,分為2類時(shí),P-值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論