主成分分析方法在主成分分析方法中的應(yīng)用_第1頁
主成分分析方法在主成分分析方法中的應(yīng)用_第2頁
主成分分析方法在主成分分析方法中的應(yīng)用_第3頁
主成分分析方法在主成分分析方法中的應(yīng)用_第4頁
主成分分析方法在主成分分析方法中的應(yīng)用_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、主成分分析與因子分析及SPSS實現(xiàn)(一):原理與方法(2014-09-0813:33:57)轉(zhuǎn)載一、主成分分析(1)問題提出在問題研究中,為了不遺漏和準(zhǔn)確起見,往往會面面俱到,取得大量的指標(biāo)來進(jìn)行分析。比如為了研究某種疾病的影響因素,我們可能會收集患者的人口學(xué)資料、病史、體征、化驗檢查等等數(shù)十項指標(biāo)。如果將這些指標(biāo)直接納入多元統(tǒng)計分析,不僅會使模型變得復(fù)雜不穩(wěn)定,而且還有可能因為變量之間的多重共線性引起較大的誤差。有沒有一種辦法能對信息進(jìn)行濃縮,減少變量的個數(shù),同時消除多重共線性?這時,主成分分析隆重登場。(2)主成分分析的原理主成分分析的本質(zhì)是坐標(biāo)的旋轉(zhuǎn)變換,將原始的n個變量進(jìn)行重新的線性組

2、合,生成n個新的變量,他們之間互不相關(guān),稱為n個“成分”。同時按照方差最大化的原則,保證第一個成分的方差最大,然后依次遞減。這n個成分是按照方差從大到小排列的,其中前m個成分可能就包含了原始變量的大部分方差(及變異信息)。那么這m個成分就成為原始變量的“主成分,他們包含了原始變量的大部分信息。注意得到的主成分不是原始變量篩選后的剩余變量,而是原始變量經(jīng)過重新組合后的“綜合變量”。我們以最簡單的二維數(shù)據(jù)來直觀的解釋主成分分析的原理。假設(shè)現(xiàn)在有兩個變量XI、X2,在坐標(biāo)上畫出可見,他們之間存在相關(guān)關(guān)系,如果我們將坐標(biāo)軸整體逆時針旋轉(zhuǎn)45,變成新的坐標(biāo)系Y1、Y2,如下圖:根據(jù)坐標(biāo)變化的原理,我們可

3、以算出:Y1=sqrt(2)/2*X1+sqrt(2)/2*X2Y2=sqrt(2)/2*X1-sqrt(2)/2*X2其中sqrt(x)為x的平方根。通過對XI、X2的重新進(jìn)行線性組合,得到了兩個新的變量Y1、Y2。此時,Y1、Y2變得不再相關(guān),而且Y1方向變異(方差)較大,Y2方向的變異(方差)較小,這時我們可以提取Y1作為XI、X2的主成分,參與后續(xù)的統(tǒng)計分析,因為它攜帶了原始變量的大部分信息。至此我們解決了兩個問題:降維和消除共線性。對于二維以上的數(shù)據(jù),就不能用上面的幾何圖形直觀的表示了,只能通過矩陣變換求解,但是本質(zhì)思想是一樣的。二、因子分析(一)原理和方法:因子分析是主成分分析的擴

4、展。在主成分分析過程中,新變量是原始變量的線性組合,即將多個原始變量經(jīng)過線性(坐標(biāo))變換得到新的變量。因子分析中,是對原始變量間的內(nèi)在相關(guān)結(jié)構(gòu)進(jìn)行分組,相關(guān)性強的分在一組,組間相關(guān)性較弱,這樣各組變量代表一個基本要素(公共因子)。通過原始變量之間的復(fù)雜關(guān)系對原始變量進(jìn)行分解,得到公共因子和特殊因子。將原始變量表示成公共因子的線性組合。其中公共因子是所有原始變量中所共同具有的特征,而特殊因子則是原始變量所特有的部分。因子分析強調(diào)對新變量(因子)的實際意義的解釋。舉個例子:比如在市場調(diào)査中我們收集了食品的五項指標(biāo)(x1-x5):味道、價格、風(fēng)味、是否快餐、能量,經(jīng)過因子分析,我們發(fā)現(xiàn)了:x1=0.

5、02*z1+0.99*z2+e1x2=0.94*z1-0.01*z2+e2x3=0.13*z1+0.98*z2+e3x4=0.84*z1+0.42*z2+e4x5=0.97*z1-0.02*z2+e1(以上的數(shù)字代表實際為變量間的相關(guān)系數(shù),值越大,相關(guān)性越大)第一個公因子z1主要與價格、是否快餐、能量有關(guān),代表“價格與營養(yǎng)”第二個公因子z2主要與味道、風(fēng)味有關(guān),代表“口味”e1-5是特殊因子,是公因子中無法解釋的,在分析中一般略去。同時,我們也可以將公因子z1、z2表示成原始變量的線性組合,用于后續(xù)分析。(二)使用條件:樣本量足夠大。通常要求樣本量是變量數(shù)目的5倍以上,且大于100例。原始變量

6、之間具有相關(guān)性。如果變量之間彼此獨立,無法使用因子分析。在SPSS中可用KMO檢驗和Bartlett球形檢驗來判斷。生成的公因子要有實際的意義,必要時可通過因子旋轉(zhuǎn)(坐標(biāo)變化)來達(dá)到。三、主成分分析和因子分析的聯(lián)系與區(qū)別聯(lián)系:兩者都是降維和信息濃縮的方法。生成的新變量均代表了原始變量的大部分信息且互相獨立,都可以用于后續(xù)的回歸分析、判別分析、聚類分析等等。區(qū)別:主成分分析是按照方差最大化的方法生成的新變量,強調(diào)新變量貢獻(xiàn)了多大比例的方差,不關(guān)心新變量是否有明確的實際意義。因子分析著重要求新變量具有實際的意義,能解釋原始變量間的內(nèi)在結(jié)構(gòu)。下一篇文章,將介紹主成分分析和因子分析的在SPSS中的實現(xiàn)

7、。主成分分析與因子分析及SPSS實現(xiàn)(二):實例討論(2014-09-1306:34:09)轉(zhuǎn)載標(biāo)簽:分類:SPSSspss教育統(tǒng)計因子分析SPSS沒有提供單獨的主成分分析方法,而是混在因子分析當(dāng)中,下面通過一個例子來討論主成分分析與因子分析的實現(xiàn)方法及相關(guān)問題。一、問題提出男子十項全能比賽包含100米跑、跳遠(yuǎn)、跳高、撐桿跳、鉛球、鐵餅、標(biāo)槍、400米跑、1500米跑、110米跨欄十個項目,總分為各個項目得分之和。為了分析十項全能主要考察哪些方面的能力,以便有針對性的進(jìn)行訓(xùn)練,研究者收集了134個頂級運動員的十項全能成績單,將通過因子分析來達(dá)到分析目的。二、分析過程變量視圖:名稱L類型寬度小數(shù)

8、J|標(biāo)簽1百米跑數(shù)值(N)82伽來砂)2跳遠(yuǎn)數(shù)值(N)&2跳遠(yuǎn)株)3數(shù)值訓(xùn))32扮球(米)4跳高數(shù)值(N)32跳高淪5四百來跑數(shù)值(N)S240D來渺6-百一十來欄數(shù)值(N)S21鐵餅數(shù)值(N)&2鐵餅咪)8樟桿跳數(shù)值(N)&2撐桿跳偽09標(biāo)愴數(shù)值(N)82標(biāo)槍(米)10千五百采跑數(shù)值821500)11總分?jǐn)?shù)值S0總亦數(shù)據(jù)視圖(部分):鉛球瞇高四百托跑一百一+卅欄”11.25皿15.402.2746M15.1310.87L4514.971.9747.T114.6衛(wèi)a11.197.4414.201.&740.2&U.Q143.66410.B27.3B16.022.0349.0614.72J4.8

9、0511.027.4312.1.&747.4414/0上個61083772135B2124Q34-141SZI3.O6711.187.0514.122.0649.34-14.39乩氏a11D5S9515342004821143641_32911.167.1214.522034&.1514.6642.3&10112372B15251974860147648021110.947.4E低弭1.S74&.H4i.se1211137.3*1440194490215.114?7&1311.D27.2912.922.0648.2314.9439.M話109973713&11押47.93U7043.81511

10、.Q37.4514.2D1.9743.941陽4如用1611.037.0B14.51210349.旳14.7B4J.2C1711.466.751&.072.00S1.2S1&.Q650.66菜單選擇(分析-降維-因子分析):報告描述統(tǒng)計表CD比較均值迪股線性模型電廣雯線性模型相冥回歸遲)對數(shù)線性模型匸)神經(jīng)剛絡(luò)沿類CD隣維JffiCS)非壟數(shù)檢臉迥)“J廉:優(yōu)盡滾)-.預(yù)測14.94分析兇4S.23H1:1一百一十米欄48.9015.1347.71U.4548.2514.S149.0G14.7247.4414.4048.3414.1849.34U.3948.2114.35jn斗七AACC因子井

11、帝F.打開因子分析的主界面,將十項成績選入”變量“框中(不要包含總分),如下:點擊”描述“按鈕,打開對話框,選中”系數(shù)“和”KMO和Bartlett球形度檢驗“:上圖相關(guān)解釋:”系數(shù)“:為變量之間的相關(guān)系數(shù)陣列,可以直觀的分析相關(guān)性?!盞MO和Bartlett球形度檢驗“:用于定量的檢驗變量之間是否具有相關(guān)性。點擊”繼續(xù)“,回到主界面,點擊”抽取“,打開對話框?!狈椒ā?”主成分“,”輸出“=”未旋轉(zhuǎn)的因子解“和”碎石圖“,”抽取“=”基于特征值“其余選擇默認(rèn)。解釋:因子抽取的方法:選取默認(rèn)的主成分法即可,其余方法的計算結(jié)果可能有所差異。輸出:未旋轉(zhuǎn)的因子解極為主成分分析結(jié)果。碎石圖有助于我們

12、判斷因子的重要性(詳細(xì)介紹見后面)。抽?。簽槌槿≈鞒煞郑ㄒ蜃樱┑姆椒?,一般是基于特征值大于1,默認(rèn)即可。點擊繼續(xù)“,回到主界面,點擊確定“,進(jìn)入分析。輸出的主要表格如下:(1)相關(guān)性檢驗因子分析要求變量之間有相關(guān)性,所以首先要進(jìn)行相關(guān)性檢驗。首先輸出的是變量之間的相關(guān)系數(shù)矩陣:T0奘邁環(huán)lao離母護(hù)J傾:衛(wèi):)貂化【円拝忖i煩計t劉口占甘TH冗協(xié)旅:僭】-;6#i-.420”餉.751.用-.627-.C91i.oaa.391-636-.6$4.632.446-.470.3911.000321-14-2-489.656.B+3703.2C471.3211.00027S.376.4口.33B-j

13、JS9B-.616-.142-.275tDD0055-154-521.751-矽-汕-487655tODO-JD3-70S-.350.H.353376SSBJ97B-.154.6142-碩.632.643-521-7D91m557-Q7.446703.338-.150J50.&18.5571.000.254-.356.202-13?.554.155.2E6-oro.451.DC可以直觀的看到,變量之間有相關(guān)性。但需要檢驗,接著輸出的是相關(guān)性檢驗:KMO和Bartlett冏襁驗取樣足夠度的Kaiser-Me/er-Olkin度量-.788Bartlett的球薛度檢驗刪卡方2115SGdf45Si

14、g.000上圖有兩個指標(biāo):第一個是KMO值,一般大于07就說明不了之間有相關(guān)性了。第二個是Bartlett球形度檢驗,P值0.001。綜合兩個指標(biāo),說明變量之間存在相關(guān)性,可以進(jìn)行因子分析。否則,不能進(jìn)行因子分析。(2)提取主成分和公因子接下來輸出主成分結(jié)果:解釋的總方芒戰(zhàn)怕提顒方和載扎K計方羌的%累積方羌的碼象枳%15.02450.23550.2355.02450.23550.23522.00020.79971.0342.08020.79971.0343.7357.35578.3894.6866.85785.2465.376376389.0096.302302192.0307.2862.85

15、594.8850.2242.23897.123g.2052.D4799.17010.083.530100.000提取方;丈:主成恃分析這就是主成分分析的結(jié)果,表中第一列為10個成分;第二列為對應(yīng)的”特征值“,表示所解釋的方差的大??;第三列為對應(yīng)的成分所包含的方差占總方差的百分比;第四列為累計的百分比。一般來說,選擇”特征值“大于1的成分作為主成分,這也是SPSS默認(rèn)的選擇。在本例中,成分1和2的特征值大于1,他們合計能解釋71.034%的方差,還算不錯。所以我們可以提取1和2作為主成分,抓住了主要矛盾,其余成分包含的信息較少,故棄去。下面,輸出碎石圖,如下:碎石圖來源于地質(zhì)學(xué)的概念。在巖層斜坡

16、下方往往有很多小的碎石,其地質(zhì)學(xué)意義不大。碎石圖以特征值為縱軸,成分為橫軸。前面陡峭的部分特征值大,包含的信息多,后面平坦的部分特征值小,包含的信息也小。由圖直觀的看出,成分1和2包含了大部分信息,從3開始就進(jìn)入平臺了。接下來,輸出提取的成分矩陣成勵巨瞭1250米砂)跳姒料鉛球(制跳高(制4皿米刪110米:砂)刪咪)揮桿炭(濟樣愴(料15嘰米(秒)-.804.810.726.600-.660-.837.687.872.657-.187.294-.235.569-.011.616.189.601.08943Q.737撮取方法:主成亦目展取了2卩成份。上表中的數(shù)值為公因子與原始變量之間的相關(guān)系數(shù),

17、絕對值越大,說明關(guān)系越密切。公因子1和9個運動項目都正相關(guān)(注意跑步運動運動的計分方式,時間越短,分?jǐn)?shù)越高),看來只能稱為“綜合運動”因子了。公因子2與鐵餅、鉛球正相關(guān),與1500米跑、400米跑負(fù)相關(guān),這究竟代表什么意思呢?看來只能成為“不知所云”因子了。三)因子旋轉(zhuǎn)前面提取的兩個公因子一個是大而全的“綜合因子”,一個不知所云,得到這樣的結(jié)果,無疑是分析的失敗。不過,不要灰心,我們可以通過因子的旋轉(zhuǎn)來獲得更好的解釋。在主界面中點擊“旋轉(zhuǎn)”按鈕,打開對話框,“方法”=“最大方差法”,“輸出”=“旋轉(zhuǎn)解”。因子分析:旋轉(zhuǎn)方法無最六四突方值法電)磊犬方差法世)最大平衡值法匡)匚直接Qtllnwi;

18、feCO)PromaaKP)DeltaDJ:oKap-pa(K)4-輸出回旋轉(zhuǎn)解IE)國曼詞到U懸犬枝斂性送代次數(shù)色):西維續(xù)(取洋”幫助點擊“繼續(xù)”,回到主界面點擊“確認(rèn)”進(jìn)行分析。輸出結(jié)果如下:尿轉(zhuǎn)成旳尬陣日成12100()785-341豳咪)-783.352鉛球刖-.134.S13跳高(灤)-.442.406400).903-.00911D葡紅閔737-.440嘶咪)-.084.S09-.570.C66掃槍(米)-.179.7651冗D米砂).678.441I提取方法:主成恃。提轉(zhuǎn)法:具有Kaiser麻對漁正交提蒐法_玄握轉(zhuǎn)在迭代后收飯這是選擇后的成分矩陣。經(jīng)過旋轉(zhuǎn),可以看出:公因子1得

19、分越高,所有的跑步和跨欄成績越差,而跳遠(yuǎn)、撐桿跳等需要助跑類項目的成績也越差,所以公因子1代表的是奔跑能力的反向指標(biāo),可稱為“奔跑能力”。公因子2與鐵餅和鉛球的正相關(guān)性很高,與標(biāo)槍、撐桿跳等需要上肢力量的項目也正相關(guān),所以該因子可以成為“上肢力量”。經(jīng)過旋轉(zhuǎn),可以看出公因子有了更合理的解釋。四)結(jié)果的保存在最后,我們還要將公因子儲存下來供后續(xù)使用。點擊“得分”按鈕,打開對話框,選中“保存為變量”方法采用默認(rèn)的“回歸”方法,同時選中“顯示因子得分系數(shù)矩陣”。SPSS會自動生成2個新變量,分別為公因子的取值,放在數(shù)據(jù)的最后。同時會輸出一個因子系數(shù)表格:成旳礙井珮效巨陣成121M槪秒)論球般)跳高(

20、米)40詠秒)110初他嘶囲掃槍(米)1500()-.160.161.145.119-.131-.167.137.174.131-.037.142-.137.273-.DD5.296091.289.043.207.378提取方法;主成由上圖,我們可以寫出公因子的表達(dá)式(用F1、F2代表兩個公因子,Z1Z10分別代表原始變量):F1=-0.16*Z1+0.161*Z2+0.145*Z3+0.199*Z4-0.131*Z5-0.167*Z6+0.137*Z7+0.174*Z8+0.131*Z9-0.037*Z10F2同理,略去。注意,這里的變量Z1Z10,F(xiàn)1、F2不再是原始變量,而是標(biāo)準(zhǔn)正態(tài)變換

21、后的變量。當(dāng)前位置:一起大數(shù)據(jù)自學(xué)中心軟件SPSS正文SPSS主成分分析與因子分析之比較及實證分析xsmile發(fā)布于2015-07-20分類:SPSS/數(shù)據(jù)分析閱讀(399)評論(1)來自 HYPERLINK /ysuncn/article/details/1924502 /ysuncn/article/details/1924502一、問題的提出在科學(xué)研究或日常生活中,常常需要判斷某一事物在同類事物中的好壞、優(yōu)劣程度及其發(fā)展規(guī)律等問題。而影響事物的特征及其發(fā)展規(guī)律的因素(指標(biāo))是多方面的,因此,在對該事物進(jìn)行研究時,為了能更全面、準(zhǔn)確地反映出它的特征及其發(fā)展規(guī)律,就不應(yīng)僅從單個指標(biāo)或單方面去

22、評價它,而應(yīng)考慮到與其有關(guān)的多方面的因素,即研究中需要引入更多的與該事物有關(guān)系的變量,來對其進(jìn)行綜合分析和評價。多變量大樣本資料無疑能給研究人員或決策者提供很多有價值的信息,但在分析處理多變量問題時,由于眾變量之間往往存在一定的相關(guān)性,使得觀測數(shù)據(jù)所反映的信息存在重疊現(xiàn)象。因此為了盡量避免信息重疊和減輕工作量,人們就往往希望能找出少數(shù)幾個互不相關(guān)的綜合變量來盡可能地反映原來數(shù)據(jù)所含有的絕大部分信息。而主成分分析和因子分析正是為解決此類問題而產(chǎn)生的多元統(tǒng)計分析方法。近年來,這兩種方法在社會經(jīng)濟問題研究中的應(yīng)用越來越多,其應(yīng)用范圍也愈加廣泛。因子分析是主成分分析的推廣和發(fā)展,二者之間就勢必有著許多

23、共同之處,而SPSS軟件不能直接進(jìn)行主成分分析,致使一些應(yīng)用者在使用SPSS進(jìn)行這兩種方法的分析時,常常會出現(xiàn)一些混淆性的錯誤,這難免會使人們對分析結(jié)果產(chǎn)生質(zhì)疑。因此,有必要在運用SPSS分析時,將這兩種方法加以嚴(yán)格區(qū)分,并針對實際問題選擇正確的方法。二、主成分分析與因子分析的聯(lián)系與區(qū)別兩種方法的出發(fā)點都是變量的相關(guān)系數(shù)矩陣,在損失較少信息的前提下,把多個變量(這些變量之間要求存在較強的相關(guān)性,以保證能從原始變量中提取主成分)綜合成少數(shù)幾個綜合變量來研究總體各方面信息的多元統(tǒng)計方法,且這少數(shù)幾個綜合變量所代表的信息不能重疊,即變量間不相關(guān)。主要區(qū)別:主成分分析是通過變量變換把注意力集中在具有較

24、大變差的那些主成分上,而舍棄那些變差小的主成分因子分析是因子模型把注意力集中在少數(shù)不可觀測的潛在變量(即公共因子)上,而舍棄特殊因子。主成分分析是將主成分表示為原觀測變量的線性組合,即乩丈雋(1)主成分的個數(shù)i=原變量的個數(shù)P,其中j=1,2,P,陽是相關(guān)矩陣的特征值所對應(yīng)的特征向量矩陣中的元素,是原始變量的標(biāo)準(zhǔn)化數(shù)據(jù),均值為0,方差為1。其實質(zhì)是p維空間的坐標(biāo)變換,不改變原始數(shù)據(jù)的結(jié)構(gòu)。而因子分析則是對原觀測變量分解成公共因子和特殊因子兩部分。因子模型如式(2),(2)其中i=1,2,,p,m是因子分析過程中的初始因子載荷矩陣中的元素,月是第j個公共因子,必是第i個原觀測變量的特殊因子。且此

25、處的兀與四的均值都為0,方差都為1。主成分的各系數(shù)西,是唯一確定的、正交的。不可以對系數(shù)矩陣進(jìn)行任何的旋轉(zhuǎn),且系數(shù)大小并不代表原變量與主成分的相關(guān)程度;而因子模型的系數(shù)矩陣是不唯一的、可以進(jìn)行旋轉(zhuǎn)的,且該矩陣表明了原變量和公共因子的相關(guān)程度。主成分分析,可以通過可觀測的原變量X直接求得主成分Y,并具有可逆性;因子分析中的載荷矩陣是不可逆的,只能通過可觀測的原變量去估計不可觀測的公共因子,即公共因子得分的估計值等于因子得分系數(shù)矩陣與原觀測變量標(biāo)準(zhǔn)化后的矩陣相乘的結(jié)果。還有,主成分分析不可以像因子分析那樣進(jìn)行因子旋轉(zhuǎn)處理。綜合排名。主成分分析一般依據(jù)第一主成分的得分排名,若第一主成分不能完全代替原

26、始變量,則需要繼續(xù)選擇第二個主成分、第三個等等,此時綜合得分=汽(各主成分得分X各主成分所對應(yīng)的方差貢獻(xiàn)率),主成分得分是將原始變量的標(biāo)準(zhǔn)化值,代入主成分表達(dá)式中計算得到;而因子分析的綜合得分=2(各因子得分X各因子所對應(yīng)的方差貢獻(xiàn)率)寺2各因子的方差貢獻(xiàn)率,因子得分是將原始變量的標(biāo)準(zhǔn)化值,代入因子得分函數(shù)中計算得到。區(qū)別中存聯(lián)系,聯(lián)系中顯區(qū)別由于上文提到主成分可表示為原觀測變量的線性組合,其系數(shù)為原始變量相關(guān)矩陣的特征值所對應(yīng)的特征向量,且這些特征向量正交,因此,從X到Y(jié)的轉(zhuǎn)換關(guān)系是可逆的,便得到如下的關(guān)系:垠=丈Y聽(3)下面對其只保留前m個主成分(貢獻(xiàn)大),舍棄剩下貢獻(xiàn)很小的主成分,得:

27、i=1珞p(4)由此可見,式(4)在形式上已經(jīng)與因子模型(2)忽略特殊因子后的模型即:(2)*相一致,且用(j=1,2,m)之間相互獨立。由于模型(2)*是因子分析中未進(jìn)行因子載荷旋轉(zhuǎn)時建立的模型,故如果不進(jìn)行因子載荷旋轉(zhuǎn),許多應(yīng)用者將容易把此時的因子分析理解成主成分分析,這顯然是不正確的。然而此時的主成分的系數(shù)陣即特征向量與因子載荷矩陣確實存在如下關(guān)系:主成分分析中,主成分的方差等于原始數(shù)據(jù)相關(guān)矩陣的特征根,其標(biāo)準(zhǔn)差也即特征根的平方根,于是可以將除以其標(biāo)準(zhǔn)差(單位化)后轉(zhuǎn)化成合適的公因子,即令,則式(4)變?yōu)椋海?)*式(5)便是主成分系數(shù)矩陣與初始因子載荷陣之間的聯(lián)系。不能簡單地將初始因子

28、載荷矩陣認(rèn)為是主成分系數(shù)矩陣(特征向量矩陣),否則會造成偏差。三、實證分析通過實例來研究SPSS軟件中的因子分析和主成分分析及二者分析結(jié)果的比較。運用兩種分析方法對2005年江蘇省13個主要城市的經(jīng)濟發(fā)展綜合水平進(jìn)行分析。本文在選取指標(biāo)時遵循了指標(biāo)選取的基本原則,即針對性、可操作性、層次性、全面性等原則,選取了以下反映城市經(jīng)濟發(fā)展綜合水平的9項指標(biāo):GDP(X1)億元、人均GDP(X2)元、城鎮(zhèn)居民人均可支配收入(X3)元、農(nóng)村居民純收入(X4)元、第三產(chǎn)業(yè)占GDP比重(X5)%、金融機構(gòu)存款余額(X6)億元、萬人中各專業(yè)技術(shù)人員數(shù)(X7)人、科技三項和文教科衛(wèi)支出(X8)億元、實際利用外資(

29、X9)億美元。(一)數(shù)據(jù)來源及處理按照上述指標(biāo)體系,選取了江蘇13個城市的數(shù)據(jù),(所有數(shù)據(jù)均來源于江蘇統(tǒng)計年鑒(2006)。指標(biāo)都是正指標(biāo),無需歸一化,SPSS130將自動對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理,消除指標(biāo)量綱及數(shù)量級的影響。(二)運用SPSS進(jìn)行分析首先,通過SPSS中的DataReduction-Factor命令進(jìn)行因子分析,本文采取主成分分析法來抽取公共因子,并依據(jù)特征值大于1來確定因子數(shù)目。相關(guān)的分析結(jié)果及分析,如下:kiM?it.XI-USHUIaarnClSWCigRaiDFEi*i.12VI29OKIJacriavGLtLWQEXJf-ilJEmu1QW9*wtOJHT巳比

30、T7UJ4?innj1-5Ua-wrtazrw100X1nj-WBOOPanmt-0時工!ill7am!口觸4aJWi.oaUanmFiJMil-ndllIT曹顧Ja-raia#i:lOJRanr?imw-2去LIDW91?TiaTuiQIW!nuiuvmatT:*t貧-rjrj.r占-nfwaJ-i一1相關(guān)系數(shù)矩陣由于因子分析是基于相關(guān)矩陣進(jìn)行的,即要求各指標(biāo)之間具有一定的相關(guān)性,求出相關(guān)矩陣是必要的。KMO統(tǒng)計量是0659,且Bartlett球體檢驗值為190.584,卡方統(tǒng)計值的顯著性水平為0.000小于001,都說明各指標(biāo)之間具有較高相關(guān)性,因此本文數(shù)據(jù)適用于作因子分析。2.總方差分解

31、mufAisijftftvINFilhrE!事斶主曲哼號hriflfi!:;15TMiEUTiJicirITI4*1+Yi十51上于I*.r4lr-表2中,依據(jù)特征值大于1的原則,提取了2個公因子(主成分),它們的累積方差貢獻(xiàn)率達(dá)91.4555%,這2個公因子(主成分)包含了原指標(biāo)的絕大部分信息,可以代替原來9個變量對城市經(jīng)濟發(fā)展水平現(xiàn)狀進(jìn)行衡量。3.主成分表達(dá)式與因子模型初始因子載荷矩陣(見表3)反映了公因子與原始變量之間的相關(guān)程度,而主成分的系數(shù)矩陣并不反映公因子與原始變量之間的相關(guān)程度,故不能直接用表3中的數(shù)據(jù)表示。根據(jù)該系數(shù)矩陣與初始因子載荷陣之間的關(guān)系(如式(5),可以計算出前2個特

32、征值所對應(yīng)的特征向量陣(系數(shù)矩陣),見表4。*3如蚯的醫(yī)子枚荷巫垃靱君的西子迪抽離新BT1;n丙子2硏2|X|-4k1352X2a.42-O.CM32X3252110.091X4O.fM344kl出1X5QXICIS加呦Xfi誦驅(qū)G.13d*U4溜0.91M4.02S3xy知4009幻0.345=22矩D.36070.3510J515-OJ42I1IS354UTOI.脯Q.35IX10.34L1SO.CIfllQXS.3412H(G7Z陶.32-&HU現(xiàn)很明顯表4和表3中的數(shù)據(jù)相差很大,因此,如果將初始因子載荷陣誤認(rèn)為是主成分系數(shù)矩陣,分析結(jié)果將會產(chǎn)生較大偏差。主成分的表達(dá)式應(yīng)為:(6)Y1=

33、03622*Z1+03607*Z2+03260*Z9Y2=-01298*Z1-00799*Z2+-03849*Z9血=(79.4012*Y1+12.0543*Y2)/100因子模型:X1=09684*F1-01352*F2X2=09642*F1-00832*F2X9=08714*F1-04009*F2其中Z1Z9是X1X9的標(biāo)準(zhǔn)化數(shù)據(jù).4因子得分函數(shù)從表3得知,各因子在各變量上的載荷已經(jīng)向0和1兩極分化,故無需進(jìn)行因子旋轉(zhuǎn)。公因子是不可觀測的,估計因子得分應(yīng)借助于未旋轉(zhuǎn)因子得分系數(shù)矩陣,見表5。KTiiKi固于丄序IIXIJJ55HIJ247二IJ49范3Q.M32!Q.tJL?-QIK5D.U574.0.S3543.EJ4W_!793K7.I2M(umHn.l.27fi-0J3S丄IWg-O.lrMfe得到以下因子得分函數(shù):(7)F1=01355*Z1+01349*Z2+01219*Z9F2=-01247*Z1-00767*Z2+-03696*Z9同樣Z1Z9是標(biāo)準(zhǔn)化的數(shù)據(jù),其綜合得分計算公式:=(734228*F1+1803

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論