主成分分析與聚類分析和判別分析_第1頁
主成分分析與聚類分析和判別分析_第2頁
主成分分析與聚類分析和判別分析_第3頁
主成分分析與聚類分析和判別分析_第4頁
主成分分析與聚類分析和判別分析_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

實驗三主成分分析、聚類分析和判別分析學院:地理科學學院專業(yè):自然地理學姓名:郭國洋實驗內容(1)中國31個省份、直轄市、自治區(qū)(不包括港澳臺)經(jīng)濟狀況的7項指標。(2)用主成分分析剖析出影響中國大陸經(jīng)濟狀況的主要指標,并對中國大陸的經(jīng)濟綜合實力進行排序。(3)用主成分剖析出的指標,用聚類分析對中國大陸的經(jīng)濟狀況進行評價,并對每類的經(jīng)濟綜合狀況進行評價。(4)結合本題,談談聚類分析和主成分分析兩種方法如何結合使用來分析問題。實驗目的(1)鞏固主成分和聚類分析的基本原理和方法步驟以及在實際分析中的意義。(2)用SPSS軟件完成地理的主成分分析和聚類分析。第一部分主成分分析實驗數(shù)據(jù)查閱2012年中國統(tǒng)計年鑒,數(shù)據(jù)表示2011年的指標。得到中國31個省份、直轄市、自治區(qū)(不含港澳臺)的7項經(jīng)濟統(tǒng)計指標數(shù)據(jù),包括:總人口/10M人,城鎮(zhèn)人口比例/%,第一產(chǎn)業(yè)總產(chǎn)值/10八8元,工業(yè)生產(chǎn)總值/10八8元,公共財政預算收入/10A8元,城鄉(xiāng)居民儲蓄余額/10八8元,城鎮(zhèn)單位就業(yè)人員工資總額/10A8元。樣本容量:31,變量:7,如圖1。總人口Wlk城甘1匚士直奧一總人口Wlk城甘1匚士直奧一L_E鄭■置10H繪廣慫渲他価元^SriCBnT^EFIOBtz:it京2&18CKJ0085.2W013AZTW3044790C3WO2B1S1Z0.13TOWWM2W天建135OCKJQ0BOMB15972W昭腳EHQP14K13cizaorra14^19!TO3m北T24D51A0聒閃00JW573CO117703£|001T377717S24U0M1575站4604山3昭.荻□簡4200£655并阻1213羽1O4-55.4fiKCi1&5S釀豳5內錄赳24617100M.fiEOO7101fflMM1366675<23.&5M11220-4£?遼寧43&3OQD0fl4.O5ffl1915&70D1C696540026431516335.665002242T3EJ3O7古時274D.41N53.4W012774484617.95QQ6M105B35.515JCIWO2Kfl5甘3跆OTQQ56.5W0170150W5W2T6QQ彌藥enTjowgHS5帥陰09上海2347-^0069.-3WO評SW73K59W3429-931735.4WW3TJ552ZTO_1Q3:養(yǎng)T嘛測QI51.WQ0?畑77DQ22ZW510PZ591474M11S江fi2MM146S-1的血也了02SWCI44^314fi-i£i12去譽咅卿44.4M05015^10070*2OOODl4B3SfiS231672M1&M1362013372^0000Sfi.100016127BT5間015O1J122:70曲妙14江西4*163曲£54570001531D7D0E411BflOD1063437123.5&93O10405BE5O15山FW37OT0050.95COJ97365W21275B9flD54559322173.27?3M14&7D16河狷OMSOTOO40.5?55122MW33001T2170H640.42?277537?017罔it5TO7OTQ051.&?2刪3CWBMfi040Q11291.573002&M922W實驗步驟及分析(1)點擊“分析”一“降維”一“因子分析”,將上述的7個指標選擇為變量。SPSS中的

主成分分析”嵌入到“因子分析”中,因此在操作的過程中我們要先進行因子分析。如2。捅城市a療匹--E134.1.於城就口雄疫學一嚴||..息尸捅城市a療匹--E134.1.於城就口雄疫學一嚴||..息尸於工業(yè)生產(chǎn)總值余公共財政預篡護城仝宙代年E.1涉城棋單位就業(yè)選攔孌呈回[+值也)…旋轉①械]I粘貼巴11重置遲}取前趣頃?…描述?…期取匡)幫肋圖2選擇因子分析變量(2)依次點擊“因子分析”框中的“描述”、“抽取”、“旋轉”、“得分”、“選項”,勾選相應的選項,如圖3、4、5、6、7所示圖3圖3抽取圖4旋轉越醫(yī)子分桁:疝擊統(tǒng)計統(tǒng)廿量□單導呈肅休宅也)越醫(yī)子分桁:疝擊統(tǒng)計統(tǒng)廿量□單導呈肅休宅也)|』忌詰■:'祈工采①相雄陣0糸數(shù)(臼E迸謨聖凹門昱著住水平區(qū))因再生但)門遼翌電).…..….旦脛轡豐.13應◎頁辰亟£贛極函尺凰因子分析:因子得分叵孚■-方法,@回歸徑?Bartlett(B)?Anderson-Rubin(A)□顯示因子得分系數(shù)矩陣應}圖4描述統(tǒng)計圖5因子得分圖6選項圖7旋轉3)點擊“確定”,得到相應的結果并分析。KMO利Bartlett的驗臉取樣足夠度的Kaiser-hleyer-OIkinBartlett的球形度檢驗近似卡方dfSig..787321.99521.000圖8KMO和Bartlett檢驗分析:圖8中,在進行因子分析之前,需要檢驗變量之間是否具備進行分析的條件。由圖中

可知KMO值為0.787〉0.5,說明數(shù)據(jù)變量之間具有結構效度,Sig〈0.05,說明可以進行因子分析。益因子右羞初始提取總人口鬥0A4A1.000.969城鎮(zhèn)人口比重」%1.000.898第一產(chǎn)業(yè)總嚴值門少0元1.000.923工業(yè)生嚴總值門D吃兀1.000.935公共財政預算收入元1.000.952城爭居民年底儲蓄余額10吒元1.000.956城鎮(zhèn)單位就業(yè)人員工潼總額M艸元1.000.925提取方法:主成倚分析*圖9公因子方差分析:圖9是指全部公共因子對于變量的總方差做所的貢獻,說明了全部公共因子反映出的原變量的信息的百分比。例如:“總人口”的共同度是0.969,即提取的公因子對原變量的方差作出了96.9%的貢獻。圖9中我們知道提取公因子之后各個變量的數(shù)值都比較大,說明在變量空間轉化為因子空間是,保存了比較多的信息,因此,因子分析的效果是顯著的。爾釋的焙片蒂叨始恃征恒提取平方和哉;\立轉平右和載人合il士差的為訊14.959?0.83670.8364.95970.83670.B363.48549.7B649.78621.59322.83193.6671.59022.33133.0673.07243.83293.6673.2173.10096.768£.1321.83198.6485.041.50499.232G.03d.49299.7257.019.2761LiO.LiOLi捉取上i怎;主成忻汙析*圖10解釋的總方差分析:圖10中可以看到各個特征值的貢獻率以及累積貢獻率??梢姡诒敬卧囼炛?,前兩個因子的累積貢獻率已達到93.667%。

分析:圖11橫坐標為因子數(shù),縱坐標為特征值,從圖中可以看出前面兩個因子的特征值比較大,都大于1,從第三個因子以后,折線平緩,因此,本次實驗選擇前面2個因子。12息人口/10啊人.850-49712息人口/10啊人.850-497.J1S.861第一亠蟲巳亠伯rU4廠/I/-EL|辿主廣1息沮n問元355-J50總扶財政預宜收入1卩日元?.-??F.:-Q0969.125墟審羊位就業(yè)兒貞工資總荻門卩8元.002.933成{甘程阡=堤妙法?主成怕<a巳捱取了2個成悅*圖12因子載荷矩陣戊門12RAOMO^A.9BB.111城槓人口比重槪-.251.£仁集一L業(yè)乩廣伯門cpbtl.951-.005工Ji生產(chǎn)總值/ItTOE.015.520£扶時改預宜收入10叩元.53DF1P城孕匿民年區(qū)儲蓄余甑10fl8j£.643,3城禎羊垃若JL,貝二資總勵冋元.45BM旺皓朋1寸租F*-羸虛當?i52r杠壯山旳T丈惜轉達-a旋轉在3.',狂代副論圖13旋轉成分矩陣分析:在圖12中我們發(fā)現(xiàn)工業(yè)生產(chǎn)總值、公共財政預算收入、城鄉(xiāng)居民年底儲蓄余額、城鎮(zhèn)單位就業(yè)人員工資總額在第2個主因子的載荷值都比較低,不能對因子作出很好的解釋。本實驗有必要對因子載荷矩陣實施旋轉,得到圖13的結果。用具有Kaiser標準化的正交旋轉法旋轉之后我們發(fā)現(xiàn)第一因子主要由“總人口、第一產(chǎn)業(yè)總產(chǎn)值、工業(yè)生產(chǎn)總值”決定,第二因子主要由“城鎮(zhèn)人口比重、公共財政預算收入、儲蓄余額、工資總額”決定。

1211.000.0002.000-1.000民恥壬i,士.壬蟲&構啟詣沿-圖14成份得分協(xié)方差矩陣分析:圖14的結果告訴我們兩個因子之間是不相關的。戰(zhàn)恃得分毎數(shù)距陣成份12總人Q/10^4A<34-.119城禎人口比重?%-.190.455弟一廠業(yè)總嚴值門爐8元<73-.204工業(yè)生產(chǎn)總值"[吩元.107.057公共財玫預算收入1卩8元133.249城鄉(xiāng)居民年底儲蓄余額1Oa0tl丄茨.183城頸單位就業(yè)人員工資總WIOA3元-102.277提取方法:主咸份*旋轉法:具有Kaiser標隹化的正更旋轉法。構成潯分0圖15成份得分系數(shù)矩陣分析:圖15給出了因子得分系數(shù)矩陣,將公共因子表示成原始變量的線性組合,將公因子對變量做線性回歸,得到系數(shù)的最小二乘估計就是所謂的因子得分系數(shù)。k□萬人ScfltA匚比衛(wèi)畢一L業(yè)總廣IS區(qū)工衛(wèi)生L藝匱応元?甥.時毆預鼻強入元億元我字居匡年城筷單臣前並人員工費藝咼億元FA^C1_1FAC5.1-2018.6000B62000136270D3CyB.79OO30D6.?a1012B137MSMS6B260-14611224-22301355.OTWBOMOD159T20D5430.9400H55.136123077W1M31B500■1510B61D15M72-W.510045.60002905.730011770.3&001737.7717S24.330K)19*75.251601J6586-.3^193593.OQDQ49eaon9414-2QD5959.9-6001213.4-31D45546QM1&9B?40823-D63122461.71?56620013065000!7101.6M0135C.67&423oeow112204520-46S5O--&EW&O^363.000064D5DD191557001D696.54Z1D2043.15153056faD022^2735BDD75B7&saia2749.410053-KiDO1277+4004917.95008S0.10&8353154094026605-46113-期開3B34.OQDQ565QDD170150QD5602.7600997.55E⑷4030014359E50D-19760-171492347.?006930D0124WJD7308.59003^29.831720645500373552200-13587623200078Sfi.&0M61@000S0647700222fiD.6l0051012&914742D036732S50014BB8213057954&3.Q0M62MOD15S3網(wǎng)E14&33.03003150.&02^70254M4M0.14MQ3&7E51液285968.00M44&CIDO20153100!7062.0000M63.56血那572W1&901S820471&0--&4550BTM.OQDQ581QDD13122-H3D7B75.QMD15D1.51MSB61900227D2EfigD-1B4D31855144関.斗碣457000139107005411.80001053.43T123509301?05&620-0234S-&73629037.00005Q95DD3973B5QD21275.3KD3455.5322173273DQ39561497D211042363259368.00?4057003512240013^9.32001721.76K-5B42700277527900176741-&4?1057S7.50D0im^rM^AnTMi61B3DD25他3000l.rjirtrwweBS3B.O4dOixjMWb^r?in15^.9111291&7300亠r^rc-d—fUdTMT"2&8S§22血■!rWUX^TS6568-25278圖16因子得分分析:

根據(jù)估計出來的得分系數(shù),可以計算因子得分,由于在圖6的“因子得分”中勾選了“保存為變量”在SPSS數(shù)據(jù)視圖中出現(xiàn)的facl_、fac_2就是變量的因子得分,如圖16。旋義空間中的成分圖咸艱十|:比車咸艱十|:比車戢鎮(zhèn)單F就£O額応兀°口舍■期眾頂算收人忑“:畤駁氏蓄金靚區(qū)'I:I..II::g-總|§£||;總人I:AM第-f,ll:迫蘋區(qū)川O圖17因子載荷圖分析:圖17說明了我們提取了兩個公因子,所以輸出的是二位平面圖,我們可以看到旋轉后在主因子為坐標軸的二維平面上原變量的位置。3)計算主成分綜合得分點擊“轉換”一“計算變量”,輸入目標變量一一Z1、Z2(總得分)和數(shù)學表達式:Y=0.70643*FAC1_1+0.22545*FAC2_1D.70&q3TFAC11+0.225^5^^21工tunaaaacl□□□aswuzoxl^v二:嚇:l骨耘量(「:??工tunaaaacl□□□aswuzoxl^v二:嚇:l骨耘量(「:??-G叱⑨:CCF2-'^:i.--CDF?炯:|h|碗]粘貼巴重蚩變j職消幫脅|圖18計算變量

1K*-=re-=-ir空ii丘〒?z對匕witeJir:一w<ter?fr?!.節(jié)FAC1JFAC2_1¥元丘元親B!甌TSSETETr13S27Q0卻4叮閭0■C^.201^1Ml13?00渕的?無御-1.461122.^22305W01597MWS&MDUM.1361Z3077DOWH19500-1.51?10啊-開290573001737.771?160-3661974暢64142i:fl國固照IQ1213.431W5546CA0159BO4D-06312-M62CC13D63KO71D1&ao135fi.fi7y23C6£(lD1122W52D-.4SB5C--C&MQ-3505M1915=?吠歸54汕36+3.15嶼忙頗22427M90.0T37&Wi$KiJCCfl1277■19179:410654I.1D5B353154D940^05-.40113-3330B50001701WOO56027^0咖5餉彳屮妙01^5^580-17149■18血侈泗72閱網(wǎng)Q陽悶172854SA03735SHOD-1.W6232000-U瞰306^?S2&361005W.91幽kT42ilfl3fi73285001.4886213K-791353MI15B3?flW303flO3150.002347025400+W014B40.3572513K2H56BKC201531C07Dfi2Kfl[]1461.5B3335770D159013O2D.4T18O-5155021100016122+XiW50*WO1?1.&1woeeisoo22麹測go-1WC1?£61-胞?1D910700即1遜1053.43712356630IDE556213-.D2344-TO62-15M石魁0212756^)034^.932MT32Z300盟56H9T03^251575700351220■39?^flO17Z1.701464S*2刊Q2775275001.70^41-54^10110蹄負1536.911129157300翅曙血go.56566-2557B曲圖19因子總得分分析:該圖的列Zl、Z2代表主成分變量,由此可以相關的線性組合方程組。(4)對31個觀察量的綜合得分進行排序點擊“數(shù)據(jù)”一“排序個案”,選擇Y作為變量,選擇“降序”,點擊確定。如圖20所示。STan1516LIT東江蘇河EBZZ.IS北浙江葡北文徉舊審和gl麗世戲選回/按⑴.已折『也疋葫切田*唾I洱舸IETT;』祜二世fi刑v^tEE^eiE-ILwOiilltOti可見z交遼0決西總人口1<MA犧範人口比■:Jft-r-jt.c-rftw工蟲生L甜?悶謝吐價謔收丄昭產(chǎn)氏年恚憂鷲事用單n我血人e1&M4.&I90665000266520(1D246456OD05514&414DW50700&|E5F49033090370000SJ05OO3^3B5QD21275.S90C3455.^3221733730038561^70陶B.BW061306+7T0C-22260610025^15W卿R.QW0<J3512Z4QD139^32001TZ17014C?Ag42TWZTO2T9BOSQ50DOOd玄窓151Ob049105001B14734&X?簽C5妙7230.6100STan1516LIT東江蘇河EBZZ.IS北浙江葡北文徉舊審和gl麗世戲選回/按⑴.已折『也疋葫切田*唾I洱舸IETT;』祜二世fi刑v^tEE^eiE-ILwOiilltOti可見z交遼0決西總人口1<MA犧範人口比■:Jft-r-jt.c-rftw工蟲生L甜?悶謝吐價謔收丄昭產(chǎn)氏年恚憂鷲事用單n我血人e1&M4.&I90665000266520(1D246456OD05514&414DW50700&|E5F49033090370000SJ05OO3^3B5QD21275.S90C3455.^3221733730038561^70陶B.BW061306+7T0C-22260610025^15W卿R.QW0<J3512Z4QD139^32001TZ17014C?Ag42TWZTO2T9BOSQ50DOOd玄窓151Ob049105001B14734&X?簽C5妙7230.6100452005JatlD117703300172777l7S3fl33DOO1S75251BOM3.D000621565Q4QD1466303003150aoZM70254jXi閥5.60002766030D0122750015170716695T71D5757.500025693000053BCUOO152691112915T3OO2C6J9229D潮B.CCW斗I2Q1531007062OTQOH635615?13020-□aa.owoCH19155T0C?100905^002W15153MDGBW2242T35M'W5DWG21M723PP鈿51I3TOT94T理KE3WKOT1113M31D^720.0000581B122400Tfi76M0fliSCd51K^afi-100022702MSO4J630.&KCI141101OD2994^00065K0珈0117S2昶00i4afiA3654513S1OTOD5411AMDIflEfl<371235£6Xi10&358fi2D37426000耳122090005B5792DQ1500139172DS?W15363934iMO501TQ15000MC2710QO597羽8W^Q9W14@598560羯圏莫■彈3亙白亙國蘭r身羞堀常^lS^d3J&圖20綜合得分排序4部分小結在以上的操作過程中我們提取了兩個公因子(主成分),發(fā)現(xiàn)兩個主成分可以保存有原變量的93.188%的信息,因此我們認為主成分的提取是有效。“總人口、第一產(chǎn)業(yè)總產(chǎn)值、工業(yè)生產(chǎn)總值,可以由第一主成分代替,“城鎮(zhèn)人口比重、公共財政預算收入、儲蓄余額、工資總額,可以由第二主成分代替。在對因子載荷矩陣進行旋轉之后,我們發(fā)現(xiàn)可以就不難建立因子模型,在得到因子得分后,就可以得到以兩個組成分為變量的因子總得分,達到實驗的要求和目的。本次實驗是有效的。第二部分聚類分析1實驗原理聚類分析,亦稱群分析或點群分析,它是研究多要素事物分類問題的數(shù)量方法。其基本原理是,根據(jù)樣本自身的屬性,用數(shù)學方法按照某種相似性或差異性指標,定量地確定樣本之間的親疏關系,并按這種親疏關系程度對樣本進行聚類。最近鄰元素:也是最近距離法。定義類與類之間的距離為兩類中最近的樣品之間的距離2實驗步驟1)點擊“分析”—“分類”—“系統(tǒng)聚類”,將上述的7個指標選擇為變量。如圖所示。如芙曲折-[1)點擊“分析”—“分類”—“系統(tǒng)聚類”,將上述的7個指標選擇為變量。如圖所示。如芙曲折-[確定[粘賭昨「|重置遲訂取浦..耕助;.jf-T^--■::in匕I?疏?愷7E掙■戸=11-.3=“護工業(yè)生產(chǎn)總值/城勞國民年底…匿城禎單位社業(yè)JE:叮案冏:i帥Di方法迪._2)依次點擊“系統(tǒng)聚類分析”框中的“統(tǒng)計量”、“繪制”、“方法”、“保存”,勾選相應的選項,如圖所示。方法選擇:最近鄰元素(最近距離法)、距離選擇:歐式距離。

點擊“確定”,得到相應的結果,如圖所示。室例込理匯總啟'b案刮有效缺失總計N百芬止N百芬比N百芬比3183.6616.237100.0b:J^^"dean距康已使用分析:上圖給出了樣本處理的基本信息,包括樣本數(shù)為31、含有缺失值的樣本數(shù)為0以及百分比等。目又來豐階系數(shù)下階群集1群■集2群集1群■集212930105579.86000222129689448.743015314201002013.164009424281067488.619006521261213332.8132021624311281848.9684019717181459967.652001488271609732.85600998141776932.509831010482101684.3150912117222137666.594001212473536871.652101113134253884365.107120151412173992460.1190718

154154134004347.41816244201107.69317255300445.220182126083277.612192247278463.644203238849477.0312122110623438.134223617010842.5742331620454033.81124101521802131.864251922829572.231262324845266.603271226060636.0182811153341687.3782911068613699.031301192.263E813016015171601817141918621002219526200232202600290027212327252628270292824302900分析:上表是聚類過程表,其中勒出了聚類中觀測量或者合并的順序。試驗中共有31個觀測量,經(jīng)過30步的聚類,所有的觀測量被合并為1類。第一步,首先將距離最近的29、30號觀測量合并為一類G1(首次出現(xiàn)階聚類中,群集1=群集2=0),出現(xiàn)復聚類的下一階段為第二步。第二步是將21號樣品并入G1類中(首次出現(xiàn)階聚類中,群集1=0、群集2=1),形成G2類,下一階段的復聚類將出現(xiàn)在第4步。以此類推。d.隨著聚類進程,系數(shù)的數(shù)值一直在增大,說明聚類剛開始的時候樣品或者類間的差異比較小,聚類結束時,類與類的差異變得比較大,體現(xiàn)了聚類分析的基本思想。分析:上面兩圖分別為冰柱圖和樹狀圖。二者表達的內容是一樣的,區(qū)別在于:首先是表達形式上的差距,其次是樹狀圖可以讀出樣品或者觀測量的距離,而冰柱圖卻沒有這個功能。因此,本實驗就分析樹狀圖。假定,將31個觀測量分為2類:第1類是廣東,第2類為其他城市。此時的距離為25。假定,將31個觀測量分為3類:第1類是廣東,第2類為江蘇和山東,第3類為其他城市,此時的距離范圍可以為14到23。假定,將31個觀測量分為5類的情況:第1類是廣東,第2類是江蘇和山東,第3類是浙江、第4類是北京和上海。第5類為其它城市。假定,將31個觀測量分為8類的情況:第1類是廣東,第2類是江蘇和山東,第3類是浙江,第4類上海,第5類是北京,第6類是河南,第7類是遼寧,第8類是為其他城市。實驗總結本次實驗中國31個省份、直轄市、自治區(qū)(不包括港澳臺)經(jīng)濟狀況的7項指標,樣本容量31,進行了主成分和聚類分析,實驗過程步驟清晰,得出的結果有效。進行主成分分析后,總人口、第一產(chǎn)業(yè)總產(chǎn)值、工業(yè)總產(chǎn)值用第一主成分代表;說明了第一產(chǎn)業(yè)和工業(yè)這樣的勞動密集型產(chǎn)業(yè)需要大量的勞動力投入,人口的多少一定程度上決定了第一產(chǎn)業(yè)和工業(yè)的總產(chǎn)值。城鎮(zhèn)人口比重、公共財政預算內收入、城鄉(xiāng)居民年底儲蓄余額、城鎮(zhèn)單位人員工資總額用第二主成分代表。四者中經(jīng)濟成分比較明顯。用成分得分計算得到總分,即綜合得分,并對其排序,得到綜合這7個影響因子下的綜合實力的順序。廣東居首,江蘇、浙江分別在3、7,西藏、青海、寧夏排在最后,而上海、北京、天津的排在23、25、27。對比這些城市GDP總體指標下的排名,經(jīng)濟發(fā)達的上海、北京、天津等城市的綜合排名矛盾。說明在不同的經(jīng)濟指標影響下,城市的綜合實力也收到影響。因此在對一個事物進行分析時,我們要認清楚影響事物的主要因子是哪些,起到了影響程度怎么樣,才能分析更加到位。根據(jù)聚類分析的結果可知,大體上廣東單獨為一類,北京和上海為一類,浙江和江蘇為一類,其他城市為一類。說明了在同一類中的城市在經(jīng)濟發(fā)展過程中受到相似的因子影響,說明了主成分分析的結果和聚類分析的結果在一定程度上能夠吻合。在分類的結果中也可以發(fā)現(xiàn),大體上經(jīng)濟特別發(fā)達的城市為一類、東部沿海城市為一類、其他的中部城市和西部城市為一類,從樹狀圖中也可以知道,三類之間的距離最大為23左右,說明中國經(jīng)濟發(fā)展內部差異還是比較大,結果和中國實際的經(jīng)濟發(fā)展狀況相似。第三部分判別分析1實驗內容國家分類與判別。數(shù)據(jù)來源于聯(lián)合國開發(fā)計劃署(UN-DP)發(fā)表的《2000年人類發(fā)展報告》UN-DP的人類發(fā)展報告采用出生時預期壽命、成人識字率、人均GDP等的指標將全世界的國家分為三類。指標選取三個:出生時預期壽命、成人識字率和人均GDP。2實驗數(shù)據(jù)原數(shù)據(jù)來源于聯(lián)合國開發(fā)計劃署(UN-DP)發(fā)表的《2000年人類發(fā)展報告》如圖1.ABGDE111213V」右16171819_類別岀生時預期壽命成人識字率A^ir-n-加拿大/y.1j:cb=Z圭國7fi.?;旳?<n^R時、COOS買2嚴瑞士?¥.7%25512阿根廷7h.1X-712013阿聯(lián)酋/b,rl.sL7V1U古N75.8削一=3967俄羅斯聯(lián)邦66.7応□泊匯保加利亞7.c9>.24SD9哥倫岀亞70.7汨一?■YiiYf;、U■Jl-兌Li:巴拉圭-A.?;9z.=4283南亠sU.£r.j4036埃及阪75r.13041待到別恣720659侍列別/y.Lyc.=13943待判別^-1^,1/7A.97.=5648待劌別1'0渕淤.Jno:圖1實驗數(shù)據(jù)實驗原理(1)判別分析是根據(jù)地理對象的一些數(shù)量特征,來判別其類型歸屬的一種統(tǒng)計方法。(2)判別分析的作用即對已分好的類型進行合理性檢驗、判別某地地理類型的歸屬問題和確定區(qū)域界線、評價各要素特征值在判別分析中貢獻率的大小。(3)判別分析與聚類分析既有相同之處,又有差別。相同處在于:都能確定地理類型;不同點在于:判別分析兼有判別和分類的兩種性質,但以判別為主,判別分析必須事先已知類型為前提,而聚類分析則不必事先已知類型,類型的劃分是聚類的結果。實驗目的(1)通過本次實驗了解判別分析的基本思想,理解判別分析與聚類分析的區(qū)別和聯(lián)系。(2)理解判別函數(shù)在判別分析過程中所起的作用,對判別分析結果做出合理的統(tǒng)計學和實際含義的解釋。實驗步驟(1)導入數(shù)據(jù),定義變量,在“類別”中用1表示高人類發(fā)展水平,2表示中等人類發(fā)展水平,0表示待判別,并定義為數(shù)值格式。如圖2所示。

類別匡家容禰丄生時砂許囪,現(xiàn)字率人均GDP11虹拿大79.1992358221美國7689929605m豐8D.09923257:1蠱士7B.79925512叵恨廷73.19712D136175.07517719I?oE75.8953967誡歩斯甲邦?6.71006460:2曝加利二71.3984809哥樓比亞70.7916006112峪&計:72.9駝335312132巳拉圭69.8934288菊非S9.478403014152埃及66.75430417B7992D659100希搭782971394317D羅烏走亞70.29856481S0乍£63.0833105圖2(2)點擊“分析”—“分類”—“判別”,分別選擇分組變量(定義范圍最小值為1,最大值為2)、自變量,選擇“一起輸入自變量”如圖3,圖4,圖5.文忤舊軸輯旦視國直[數(shù)摒回轉拉①守折回直圉曲⑥客用樹創(chuàng)SD(VV)m約EJ「cS三約EJ「cS三1家名轉田主壓13三本:琳士6阿袈苦7三:一e菠爭斎庭邦丄atCfUZr哥fcttlE11榕言古L12二卜三扛圭13二寺非1415—持刪16特丼別希喑1718薦列別1--屮■孌盂視田T,1-is咳計比狡均值聞-襯:打.二洱里叵)廣義墟性理廟產(chǎn)疔二匡)「J'R)時購性棋型衛(wèi)0呑埜㈢瞇滾址宙F非翅檢驗朗■t-:.'.!:[)2宀;2詢多£響應也E二①:忙汕F:H:-h!i:Q)QROC曲線圖f.-/J=3DP變量9923582992960599Z32&79D2551297120137517719陽3刪QDR4fi0BS兩步廨KD竊2:直乂:畑;色工尹于也)...7mx(N)...97139J39B5648SS3105圖30期冊圖4土加權案例分析案例處理摘要N0期冊圖4土加權案例分析案例處理摘要N百八比有效1477.8排除的缺失或越界組代碼422.2至少一個缺失判別變量0.0缺失或越界組代碼還有至少一個缺失0.0判別變量合計422.2-合計181000由上圖我們可以看出參加判別分析的觀測量為18,其中有效觀測量數(shù)為14,有效觀測量占總數(shù)的77.8%。弋Li/:I/BCCP圖53)分別點擊“統(tǒng)計量”、“分類”和“保存”,勾選相應的選項,6數(shù)據(jù)處理結論及分析組均值的均等性的檢驗Wilks的LambdaFdf1df2Sig出生時預期壽命.39518.397112.001成人識字率.943.720112.413人均GDP.16261.889112.000

Wilks的LambdcFdf1df2Sig出生時預期壽命成人識字率.395.94318.397.720111212.001.413a.由組均值相等的檢驗表可知,出生時預期壽命和人均GDP兩個變量類內均值檢驗的顯著性概率(sig)都小于0.05,且WiiksLamabda的值都比較接近0,說明除了成人識字率外,其余變量之間類內均值都存在顯著差異,可以進行判別分析。a.出生時預期壽命成人識字率人均GDP協(xié)方差出生時預期壽命8.37618.8184401.042成人識字率18.818182.96016182.267人均GDP44010421618226716874782000人均GDP相關性出生時預期壽命1.000.481.370成人識字率.4811.000.291―人均GDP3702911000協(xié)方差矩陣的自由度為12。匯聚的組內矩陣分為兩部分,即自變量間合并的協(xié)方差矩陣和自變量間相關系數(shù)矩陣。其中,關系數(shù)值可知,各著。箱的M22.系數(shù)矩陣。其中,關系數(shù)值可知,各著。箱的M22.319F近似。2.646df16df2795.195Sig015檢驗結果協(xié)方差矩陣的自由度為12,從相變量之間的線性相關關系都不顯對相等總體協(xié)方差矩陣的零假設進行檢驗。從檢驗結果圖可以看出,Sig的值為0.015小于0.1,所以我們認為判別分析是顯著的,說明判錯率將很小。而圖中箱的M值為22.319小于0.05,說明在該顯著性水平下各類協(xié)方差矩陣相等,可以進行Bayes檢驗。函數(shù)特征值特征值方差的%累積%正則相關性1579910001000924

函數(shù)特征值特征值方差的%累壬廠1%正則相關性15799口10001000924a.分析中使用了前1個典型判別式函數(shù)。分析:本次實驗得出一個判別函數(shù)用于分析,特征值為5.799,方差的百分比和累積百分比都是100%,相關系數(shù)為0.924。函數(shù)檢驗Wilks的L卡方dfSig1147201273000分析:這是對判別函數(shù)的顯著性檢驗,其中Wiiks的Lamabda值為0.147,非常小,卡方為20.127,較大,自由度為3,Sig為0.000,因此認為判別函數(shù)有效。函數(shù)x/\1人均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論