




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主成分分析與因子分析及SPSS實(shí)現(xiàn)(一):原理與方法
(2014-09-0813:33:57)轉(zhuǎn)載▼一、主成分分析(1)問(wèn)題提出在問(wèn)題研究中,為了不遺漏和準(zhǔn)確起見,往往會(huì)面面俱到,取得大量的指標(biāo)來(lái)進(jìn)行分析。比如為了研究某種疾病的影響因素,我們可能會(huì)收集患者的人口學(xué)資料、病史、體征、化驗(yàn)檢查等等數(shù)十項(xiàng)指標(biāo)。如果將這些指標(biāo)直接納入多元統(tǒng)計(jì)分析,不僅會(huì)使模型變得復(fù)雜不穩(wěn)定,而且還有可能因?yàn)樽兞恐g的多重共線性引起較大的誤差。有沒(méi)有一種辦法能對(duì)信息進(jìn)行濃縮,減少變量的個(gè)數(shù),同時(shí)消除多重共線性?這時(shí),主成分分析隆重登場(chǎng)。(2)主成分分析的原理主成分分析的本質(zhì)是坐標(biāo)的旋轉(zhuǎn)變換,將原始的n個(gè)變量進(jìn)行重新的線性組合,生成n個(gè)新的變量,他們之間互不相關(guān),稱為n個(gè)“成分”。同時(shí)按照方差最大化的原則,保證第一個(gè)成分的方差最大,然后依次遞減。這n個(gè)成分是按照方差從大到小排列的,其中前m個(gè)成分可能就包含了原始變量的大部分方差(及變異信息)。那么這m個(gè)成分就成為原始變量的“主成分”,他們包含了原始變量的大部分信息。注意得到的主成分不是原始變量篩選后的剩余變量,而是原始變量經(jīng)過(guò)重新組合后的“綜合變量”。我們以最簡(jiǎn)單的二維數(shù)據(jù)來(lái)直觀的解釋主成分分析的原理。假設(shè)現(xiàn)在有兩個(gè)變量X1、X2,在坐標(biāo)上畫出散點(diǎn)圖如下:可見,他們之間存在相關(guān)關(guān)系,如果我們將坐標(biāo)軸整體逆時(shí)針旋轉(zhuǎn)45°,變成新的坐標(biāo)系Y1、Y2,如下圖:根據(jù)坐標(biāo)變化的原理,我們可以算出:Y1=sqrt(2)/2*X1+sqrt(2)/2*X2Y2=sqrt(2)/2*X1-sqrt(2)/2*X2其中sqrt(x)為x的平方根。通過(guò)對(duì)X1、X2的重新進(jìn)行線性組合,得到了兩個(gè)新的變量Y1、Y2。此時(shí),Y1、Y2變得不再相關(guān),而且Y1方向變異(方差)較大,Y2方向的變異(方差)較小,這時(shí)我們可以提取Y1作為X1、X2的主成分,參與后續(xù)的統(tǒng)計(jì)分析,因?yàn)樗鼣y帶了原始變量的大部分信息。至此我們解決了兩個(gè)問(wèn)題:降維和消除共線性。對(duì)于二維以上的數(shù)據(jù),就不能用上面的幾何圖形直觀的表示了,只能通過(guò)矩陣變換求解,但是本質(zhì)思想是一樣的。二、因子分析(一)原理和方法:因子分析是主成分分析的擴(kuò)展。在主成分分析過(guò)程中,新變量是原始變量的線性組合,即將多個(gè)原始變量經(jīng)過(guò)線性(坐標(biāo))變換得到新的變量。因子分析中,是對(duì)原始變量間的內(nèi)在相關(guān)結(jié)構(gòu)進(jìn)行分組,相關(guān)性強(qiáng)的分在一組,組間相關(guān)性較弱,這樣各組變量代表一個(gè)基本要素(公共因子)。通過(guò)原始變量之間的復(fù)雜關(guān)系對(duì)原始變量進(jìn)行分解,得到公共因子和特殊因子。將原始變量表示成公共因子的線性組合。其中公共因子是所有原始變量中所共同具有的特征,而特殊因子則是原始變量所特有的部分。因子分析強(qiáng)調(diào)對(duì)新變量(因子)的實(shí)際意義的解釋。舉個(gè)例子:比如在市場(chǎng)調(diào)查中我們收集了食品的五項(xiàng)指標(biāo)(x1-x5):味道、價(jià)格、風(fēng)味、是否快餐、能量,經(jīng)過(guò)因子分析,我們發(fā)現(xiàn)了:x1=0.02*z1+0.99*z2+e1x2=0.94*z1-0.01*z2+e2x3=0.13*z1+0.98*z2+e3x4=0.84*z1+0.42*z2+e4x5=0.97*z1-0.02*z2+e1(以上的數(shù)字代表實(shí)際為變量間的相關(guān)系數(shù),值越大,相關(guān)性越大)第一個(gè)公因子z1主要與價(jià)格、是否快餐、能量有關(guān),代表“價(jià)格與營(yíng)養(yǎng)”第二個(gè)公因子z2主要與味道、風(fēng)味有關(guān),代表“口味”e1-5是特殊因子,是公因子中無(wú)法解釋的,在分析中一般略去。同時(shí),我們也可以將公因子z1、z2表示成原始變量的線性組合,用于后續(xù)分析。(二)使用條件:(1)樣本量足夠大。通常要求樣本量是變量數(shù)目的5倍以上,且大于100例。(2)原始變量之間具有相關(guān)性。如果變量之間彼此獨(dú)立,無(wú)法使用因子分析。在SPSS中可用KMO檢驗(yàn)和Bartlett球形檢驗(yàn)來(lái)判斷。(3)生成的公因子要有實(shí)際的意義,必要時(shí)可通過(guò)因子旋轉(zhuǎn)(坐標(biāo)變化)來(lái)達(dá)到。三、主成分分析和因子分析的聯(lián)系與區(qū)別聯(lián)系:兩者都是降維和信息濃縮的方法。生成的新變量均代表了原始變量的大部分信息且互相獨(dú)立,都可以用于后續(xù)的回歸分析、判別分析、聚類分析等等。區(qū)別:(1)主成分分析是按照方差最大化的方法生成的新變量,強(qiáng)調(diào)新變量貢獻(xiàn)了多大比例的方差,不關(guān)心新變量是否有明確的實(shí)際意義。(2)因子分析著重要求新變量具有實(shí)際的意義,能解釋原始變量間的內(nèi)在結(jié)構(gòu)。下一篇文章,將介紹主成分分析和因子分析的在SPSS中的實(shí)現(xiàn)。主成分分析與因子分析及SPSS實(shí)現(xiàn)(二):實(shí)例討論
(2014-09-1306:34:09)轉(zhuǎn)載▼標(biāo)簽:
spss
教育
統(tǒng)計(jì)
因子分析分類:
SPSSSPSS沒(méi)有提供單獨(dú)的主成分分析方法,而是混在因子分析當(dāng)中,下面通過(guò)一個(gè)例子來(lái)討論主成分分析與因子分析的實(shí)現(xiàn)方法及相關(guān)問(wèn)題。
一、問(wèn)題提出男子十項(xiàng)全能比賽包含100米跑、跳遠(yuǎn)、跳高、撐桿跳、鉛球、鐵餅、標(biāo)槍、400米跑、1500米跑、110米跨欄十個(gè)項(xiàng)目,總分為各個(gè)項(xiàng)目得分之和。為了分析十項(xiàng)全能主要考察哪些方面的能力,以便有針對(duì)性的進(jìn)行訓(xùn)練,研究者收集了134個(gè)頂級(jí)運(yùn)動(dòng)員的十項(xiàng)全能成績(jī)單,將通過(guò)因子分析來(lái)達(dá)到分析目的。二、分析過(guò)程變量視圖:
數(shù)據(jù)視圖(部分):菜單選擇(分析->降維->因子分析):打開因子分析的主界面,將十項(xiàng)成績(jī)選入”變量“框中(不要包含總分),如下:
點(diǎn)擊”描述“按鈕,打開對(duì)話框,選中”系數(shù)“和”KMO和Bartlett球形度檢驗(yàn)“:上圖相關(guān)解釋:”系數(shù)“:為變量之間的相關(guān)系數(shù)陣列,可以直觀的分析相關(guān)性?!盞MO和Bartlett球形度檢驗(yàn)“:用于定量的檢驗(yàn)變量之間是否具有相關(guān)性。
點(diǎn)擊”繼續(xù)“,回到主界面,點(diǎn)擊”抽取“,打開對(duì)話框?!狈椒ā?>”主成分“,”輸出“=>”未旋轉(zhuǎn)的因子解“和”碎石圖“,”抽取“=>”基于特征值“,其余選擇默認(rèn)。
解釋:①因子抽取的方法:選取默認(rèn)的主成分法即可,其余方法的計(jì)算結(jié)果可能有所差異。②輸出:”未旋轉(zhuǎn)的因子解”極為主成分分析結(jié)果。碎石圖有助于我們判斷因子的重要性(詳細(xì)介紹見后面)。③抽?。簽槌槿≈鞒煞郑ㄒ蜃樱┑姆椒?,一般是基于特征值大于1,默認(rèn)即可。
點(diǎn)擊”繼續(xù)“,回到主界面,點(diǎn)擊”確定“,進(jìn)入分析。
輸出的主要表格如下:
(1)相關(guān)性檢驗(yàn)因子分析要求變量之間有相關(guān)性,所以首先要進(jìn)行相關(guān)性檢驗(yàn)。首先輸出的是變量之間的相關(guān)系數(shù)矩陣:可以直觀的看到,變量之間有相關(guān)性。但需要檢驗(yàn),接著輸出的是相關(guān)性檢驗(yàn):
上圖有兩個(gè)指標(biāo):第一個(gè)是KMO值,一般大于0.7就說(shuō)明不了之間有相關(guān)性了。第二個(gè)是Bartlett球形度檢驗(yàn),P值<0.001。綜合兩個(gè)指標(biāo),說(shuō)明變量之間存在相關(guān)性,可以進(jìn)行因子分析。否則,不能進(jìn)行因子分析。(2)提取主成分和公因子接下來(lái)輸出主成分結(jié)果:這就是主成分分析的結(jié)果,表中第一列為10個(gè)成分;第二列為對(duì)應(yīng)的”特征值“,表示所解釋的方差的大小;第三列為對(duì)應(yīng)的成分所包含的方差占總方差的百分比;第四列為累計(jì)的百分比。一般來(lái)說(shuō),選擇”特征值“大于1的成分作為主成分,這也是SPSS默認(rèn)的選擇。在本例中,成分1和2的特征值大于1,他們合計(jì)能解釋71.034%的方差,還算不錯(cuò)。所以我們可以提取1和2作為主成分,抓住了主要矛盾,其余成分包含的信息較少,故棄去。下面,輸出碎石圖,如下:
碎石圖來(lái)源于地質(zhì)學(xué)的概念。在巖層斜坡下方往往有很多小的碎石,其地質(zhì)學(xué)意義不大。碎石圖以特征值為縱軸,成分為橫軸。前面陡峭的部分特征值大,包含的信息多,后面平坦的部分特征值小,包含的信息也小。由圖直觀的看出,成分1和2包含了大部分信息,從3開始就進(jìn)入平臺(tái)了。接下來(lái),輸出提取的成分矩陣:上表中的數(shù)值為公因子與原始變量之間的相關(guān)系數(shù),絕對(duì)值越大,說(shuō)明關(guān)系越密切。公因子1和9個(gè)運(yùn)動(dòng)項(xiàng)目都正相關(guān)(注意跑步運(yùn)動(dòng)運(yùn)動(dòng)的計(jì)分方式,時(shí)間越短,分?jǐn)?shù)越高),看來(lái)只能稱為“綜合運(yùn)動(dòng)”因子了。公因子2與鐵餅、鉛球正相關(guān),與1500米跑、400米跑負(fù)相關(guān),這究竟代表什么意思呢?看來(lái)只能成為“不知所云”因子了。
(三)因子旋轉(zhuǎn)
前面提取的兩個(gè)公因子一個(gè)是大而全的“綜合因子”,一個(gè)不知所云,得到這樣的結(jié)果,無(wú)疑是分析的失敗。不過(guò),不要灰心,我們可以通過(guò)因子的旋轉(zhuǎn)來(lái)獲得更好的解釋。在主界面中點(diǎn)擊“旋轉(zhuǎn)”按鈕,打開對(duì)話框,“方法”=>“最大方差法”,“輸出”=>“旋轉(zhuǎn)解”。
點(diǎn)擊“繼續(xù)”,回到主界面點(diǎn)擊“確認(rèn)”進(jìn)行分析。輸出結(jié)果如下:
這是選擇后的成分矩陣。經(jīng)過(guò)旋轉(zhuǎn),可以看出:公因子1得分越高,所有的跑步和跨欄成績(jī)?cè)讲?,而跳遠(yuǎn)、撐桿跳等需要助跑類項(xiàng)目的成績(jī)也越差,所以公因子1代表的是奔跑能力的反向指標(biāo),可稱為“奔跑能力”。公因子2與鐵餅和鉛球的正相關(guān)性很高,與標(biāo)槍、撐桿跳等需要上肢力量的項(xiàng)目也正相關(guān),所以該因子可以成為“上肢力量”。經(jīng)過(guò)旋轉(zhuǎn),可以看出公因子有了更合理的解釋。(四)結(jié)果的保存在最后,我們還要將公因子儲(chǔ)存下來(lái)供后續(xù)使用。點(diǎn)擊“得分”按鈕,打開對(duì)話框,選中“保存為變量”,方法采用默認(rèn)的“回歸”方法,同時(shí)選中“顯示因子得分系數(shù)矩陣”。SPSS會(huì)自動(dòng)生成2個(gè)新變量,分別為公因子的取值,放在數(shù)據(jù)的最后。同時(shí)會(huì)輸出一個(gè)因子系數(shù)表格:
由上圖,我們可以寫出公因子的表達(dá)式(用F1、F2代表兩個(gè)公因子,Z1~Z10分別代表原始變量):F1=-0.16*Z1+0.161*Z2+0.145*Z3+0.199*Z4-0.131*Z5-0.167*Z6+0.137*Z7+0.174*Z8+0.131*Z9-0.037*Z10F2同理,略去。注意,這里的變量Z1~Z10,F(xiàn)1、F2不再是原始變量,而是標(biāo)準(zhǔn)正態(tài)變換后的變量。當(dāng)前位置:一起大數(shù)據(jù)
>
自學(xué)中心
>
軟件
>
SPSS
>
正文SPSS主成分分析與因子分析之比較及實(shí)證分析xsmile發(fā)布于2015-07-20分類:SPSS
/
數(shù)據(jù)分析閱讀(399)評(píng)論(1)來(lái)自
/ysuncn/article/details/1924502一、問(wèn)題的提出在科學(xué)研究或日常生活中,常常需要判斷某一事物在同類事物中的好壞、優(yōu)劣程度及其發(fā)展規(guī)律等問(wèn)題。而影響事物的特征及其發(fā)展規(guī)律的因素(指標(biāo))是多方面的,因此,在對(duì)該事物進(jìn)行研究時(shí),為了能更全面、準(zhǔn)確地反映出它的特征及其發(fā)展規(guī)律,就不應(yīng)僅從單個(gè)指標(biāo)或單方面去評(píng)價(jià)它,而應(yīng)考慮到與其有關(guān)的多方面的因素,即研究中需要引入更多的與該事物有關(guān)系的變量,來(lái)對(duì)其進(jìn)行綜合分析和評(píng)價(jià)。多變量大樣本資料無(wú)疑能給研究人員或決策者提供很多有價(jià)值的信息,但在分析處理多變量問(wèn)題時(shí),由于眾變量之間往往存在一定的相關(guān)性,使得觀測(cè)數(shù)據(jù)所反映的信息存在重疊現(xiàn)象。因此為了盡量避免信息重疊和減輕工作量,人們就往往希望能找出少數(shù)幾個(gè)互不相關(guān)的綜合變量來(lái)盡可能地反映原來(lái)數(shù)據(jù)所含有的絕大部分信息。而主成分分析和因子分析正是為解決此類問(wèn)題而產(chǎn)生的多元統(tǒng)計(jì)分析方法。近年來(lái),這兩種方法在社會(huì)經(jīng)濟(jì)問(wèn)題研究中的應(yīng)用越來(lái)越多,其應(yīng)用范圍也愈加廣泛。因子分析是主成分分析的推廣和發(fā)展,二者之間就勢(shì)必有著許多共同之處,而SPSS軟件不能直接進(jìn)行主成分分析,致使一些應(yīng)用者在使用SPSS進(jìn)行這兩種方法的分析時(shí),常常會(huì)出現(xiàn)一些混淆性的錯(cuò)誤,這難免會(huì)使人們對(duì)分析結(jié)果產(chǎn)生質(zhì)疑。因此,有必要在運(yùn)用SPSS分析時(shí),將這兩種方法加以嚴(yán)格區(qū)分,并針對(duì)實(shí)際問(wèn)題選擇正確的方法。二、主成分分析與因子分析的聯(lián)系與區(qū)別兩種方法的出發(fā)點(diǎn)都是變量的相關(guān)系數(shù)矩陣,在損失較少信息的前提下,把多個(gè)變量(這些變量之間要求存在較強(qiáng)的相關(guān)性,以保證能從原始變量中提取主成分)綜合成少數(shù)幾個(gè)綜合變量來(lái)研究總體各方面信息的多元統(tǒng)計(jì)方法,且這少數(shù)幾個(gè)綜合變量所代表的信息不能重疊,即變量間不相關(guān)。主要區(qū)別:1.主成分分析是通過(guò)變量變換把注意力集中在具有較大變差的那些主成分上,而舍棄那些變差小的主成分;因子分析是因子模型把注意力集中在少數(shù)不可觀測(cè)的潛在變量(即公共因子)上,而舍棄特殊因子。2.主成分分析是將主成分表示為原觀測(cè)變量的線性組合,(1)主成分的個(gè)數(shù)i=原變量的個(gè)數(shù)p,其中j=1,2,…,p,是相關(guān)矩陣的特征值所對(duì)應(yīng)的特征向量矩陣中的元素,是原始變量的標(biāo)準(zhǔn)化數(shù)據(jù),均值為0,方差為1。其實(shí)質(zhì)是p維空間的坐標(biāo)變換,不改變?cè)紨?shù)據(jù)的結(jié)構(gòu)。而因子分析則是對(duì)原觀測(cè)變量分解成公共因子和特殊因子兩部分。因子模型如式(2),(2)其中i=1,2,…,p,m是因子分析過(guò)程中的初始因子載荷矩陣中的元素,是第j個(gè)公共因子,是第i個(gè)原觀測(cè)變量的特殊因子。且此處的與的均值都為0,方差都為1。3.主成分的各系數(shù),是唯一確定的、正交的。不可以對(duì)系數(shù)矩陣進(jìn)行任何的旋轉(zhuǎn),且系數(shù)大小并不代表原變量與主成分的相關(guān)程度;而因子模型的系數(shù)矩陣是不唯一的、可以進(jìn)行旋轉(zhuǎn)的,且該矩陣表明了原變量和公共因子的相關(guān)程度。4.主成分分析,可以通過(guò)可觀測(cè)的原變量X直接求得主成分Y,并具有可逆性;因子分析中的載荷矩陣是不可逆的,只能通過(guò)可觀測(cè)的原變量去估計(jì)不可觀測(cè)的公共因子,即公共因子得分的估計(jì)值等于因子得分系數(shù)矩陣與原觀測(cè)變量標(biāo)準(zhǔn)化后的矩陣相乘的結(jié)果。還有,主成分分析不可以像因子分析那樣進(jìn)行因子旋轉(zhuǎn)處理。5.綜合排名。主成分分析一般依據(jù)第一主成分的得分排名,若第一主成分不能完全代替原始變量,則需要繼續(xù)選擇第二個(gè)主成分、第三個(gè)等等,此時(shí)綜合得分=∑(各主成分得分×各主成分所對(duì)應(yīng)的方差貢獻(xiàn)率),主成分得分是將原始變量的標(biāo)準(zhǔn)化值,代入主成分表達(dá)式中計(jì)算得到;而因子分析的綜合得分=∑(各因子得分×各因子所對(duì)應(yīng)的方差貢獻(xiàn)率)÷∑各因子的方差貢獻(xiàn)率,因子得分是將原始變量的標(biāo)準(zhǔn)化值,代入因子得分函數(shù)中計(jì)算得到。區(qū)別中存聯(lián)系,聯(lián)系中顯區(qū)別由于上文提到主成分可表示為原觀測(cè)變量的線性組合,其系數(shù)為原始變量相關(guān)矩陣的特征值所對(duì)應(yīng)的特征向量,且這些特征向量正交,因此,從X到Y(jié)的轉(zhuǎn)換關(guān)系是可逆的,便得到如下的關(guān)系:(3)下面對(duì)其只保留前m個(gè)主成分(貢獻(xiàn)大),舍棄剩下貢獻(xiàn)很小的主成分,得:i=1,2,…p(4)由此可見,式(4)在形式上已經(jīng)與因子模型(2)忽略特殊因子后的模型即:(2)*相一致,且(j=1,2,…,m)之間相互獨(dú)立。由于模型(2)*是因子分析中未進(jìn)行因子載荷旋轉(zhuǎn)時(shí)建立的模型,故如果不進(jìn)行因子載荷旋轉(zhuǎn),許多應(yīng)用者將容易把此時(shí)的因子分析理解成主成分分析,這顯然是不正確的。然而此時(shí)的主成分的系數(shù)陣即特征向量與因子載荷矩陣確實(shí)存在如下關(guān)系:主成分分析中,主成分的方差等于原始數(shù)據(jù)相關(guān)矩陣的特征根,其標(biāo)準(zhǔn)差也即特征根的平方根,于是可以將除以其標(biāo)準(zhǔn)差(單位化)后轉(zhuǎn)化成合適的公因子,即令,,則式(4)變?yōu)椋海?)*可得,(5)式(5)便是主成分系數(shù)矩陣與初始因子載荷陣之間的聯(lián)系。不能簡(jiǎn)單地將初始因子載荷矩陣認(rèn)為是主成分系數(shù)矩陣(特征向量矩陣),否則會(huì)造成偏差。三、實(shí)證分析通過(guò)實(shí)例來(lái)研究SPSS軟件中的因子分析和主成分分析及二者分析結(jié)果的比較。運(yùn)用兩種分析方法對(duì)2005年江蘇省13個(gè)主要城市的經(jīng)濟(jì)發(fā)展綜合水平進(jìn)行分析。本文在選取指標(biāo)時(shí)遵循了指標(biāo)選取的基本原則,即針對(duì)性、可操作性、層次性、全面性等原則,選取了以下反映城市經(jīng)濟(jì)發(fā)展綜合水平的9項(xiàng)指標(biāo):GDP(X1)億元、人均GDP(X2)元、城鎮(zhèn)居民人均可支配收入(X3)元、農(nóng)村居民純收入(X4)元、第三產(chǎn)業(yè)占GDP比重(X5)%、金融機(jī)構(gòu)存款余額(X6)億元、萬(wàn)人中各專業(yè)技術(shù)人員數(shù)(X7)人、科技三項(xiàng)和文教科衛(wèi)支出(X8)億元、實(shí)際利用外資(X9)億美元。(一)數(shù)據(jù)來(lái)源及處理按照上述指標(biāo)體系,選取了江蘇13個(gè)城市的數(shù)據(jù),(所有數(shù)據(jù)均來(lái)源于《江蘇統(tǒng)計(jì)年鑒(2006)》)。指標(biāo)都是正指標(biāo),無(wú)需歸一化,SPSS13.0將自動(dòng)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理,消除指標(biāo)量綱及數(shù)量級(jí)的影響。(二)運(yùn)用SPSS進(jìn)行分析首先,通過(guò)SPSS中的DataReduction-Factor命令進(jìn)行因子分析,本文采取主成分分析法來(lái)抽取公共因子,并依據(jù)特征值大于1來(lái)確定因子數(shù)目。相關(guān)的分析結(jié)果及分析,如下:
1.相關(guān)系數(shù)矩陣由于因子分析是基于相關(guān)矩陣進(jìn)行的,即要求各指標(biāo)之間具有一定的相關(guān)性,求出相關(guān)矩陣是必要的。KMO統(tǒng)計(jì)量是0.659,且Bartlett球體檢驗(yàn)值為190.584,卡方統(tǒng)計(jì)值的顯著性水平為0.000小于0.01,都說(shuō)明各指標(biāo)之間具有較高相關(guān)性,因此本文數(shù)據(jù)適用于作因子分析。2.總方差分解
表2中,依據(jù)特征值大于1的原則,提取了2個(gè)公因子(主成分),它們的累積方差貢獻(xiàn)率達(dá)91.4555%,這2個(gè)公因子(主成分)包含了原指標(biāo)的絕大部分信息,可以代替原來(lái)9個(gè)變量對(duì)城市經(jīng)濟(jì)發(fā)展水平現(xiàn)狀進(jìn)行衡量。3.主成分表達(dá)式與因子模型初始因子載荷矩陣(見表3)反映了公因子與原始變量之間的相關(guān)程度,而主成分的系數(shù)矩陣并不反映公因子與原始變量之間的相關(guān)程度,故不能直接用表3中的數(shù)據(jù)表示。根據(jù)該系數(shù)矩陣與初始因子載荷陣之間的關(guān)系(如式(5)),可以計(jì)算出前2個(gè)特征值所對(duì)應(yīng)的特征向量陣(系數(shù)矩陣),見表4。
很明顯表4和表3中的數(shù)據(jù)相差很大,因此,如果將初始因子載荷陣誤認(rèn)為是主成分系數(shù)矩陣,分析結(jié)果將會(huì)產(chǎn)生較大偏差。主成分的表達(dá)式應(yīng)為:(6)
Y1=0.3622*Z1+0.3607*Z2+…+0.3260*Z9
Y2=-0.1298*Z1-0.0799*Z2+…-0.3849*Z9
=(79.4012*Y1+12.0543*Y2)/100因子模型:
X1=0.9684*F1-0.1352*F2
X2=0.9642*F1-0.0832*F2
…
X9=0.8714*F1-0.4009*F2
其中Z1~Z9是X1~X9的標(biāo)準(zhǔn)化數(shù)據(jù).4.因子得分函數(shù)從表3得知,各因子在各變量上的載荷已經(jīng)向0和1兩極分化,故無(wú)需進(jìn)行因子旋轉(zhuǎn)。公因子是不可觀測(cè)的,估計(jì)因子得分應(yīng)借助于未旋轉(zhuǎn)因子得分系數(shù)矩陣,見表5。
得到以下因子得分函數(shù):(7)
F1=0.1355*Z1+0.1349*Z2+…+0.1219*Z9
F2=-0.1247*Z1-0.0767*Z2+…-0.3696*Z9
同樣Z1~Z9是標(biāo)準(zhǔn)化的數(shù)據(jù),其綜合得分計(jì)算公式:
=(73.4228*F1+18.0327*F2)/91.4555(8)(三)兩種方法綜合排名比較按照主成分綜合得分和因子綜合得分,對(duì)江蘇13個(gè)城市的經(jīng)濟(jì)發(fā)展綜合水平進(jìn)行排名,見表6。表6中,綜合得分出現(xiàn)負(fù)值,這只表明該城市的綜合水平處于平均水平之下(由于主成分(因子)已經(jīng)標(biāo)準(zhǔn)化了)。從該表看出,主成分分析與因子分析的實(shí)證結(jié)果,不僅大部分城市的排名存在差異,且綜合得分值上存在較大差異,其定量值差異較大,這對(duì)于后來(lái)的綜合定量定性分析,最終所提出的政策建議等都會(huì)產(chǎn)生較大影響。因此不能混用。四、結(jié)束語(yǔ)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廣東省惠州市單招職業(yè)適應(yīng)性考試題庫(kù)有答案
- 2025年廣西交通職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性考試題庫(kù)及答案1套
- 2025年北京戲曲藝術(shù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫(kù)及答案1套
- 2025年博爾塔拉職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)有答案
- 2025年川南幼兒師范高等專科學(xué)校單招綜合素質(zhì)考試題庫(kù)及答案參考
- 2025年福州外語(yǔ)外貿(mào)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)標(biāo)準(zhǔn)卷
- 2025年貴州健康職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性考試題庫(kù)含答案
- 2025年成都工貿(mào)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性考試題庫(kù)參考答案
- 2025年畢節(jié)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性考試題庫(kù)參考答案
- 荒山綠化承包合同書
- 中小學(xué)校2025年“學(xué)雷鋒月”系列活動(dòng)方案:踐行雷鋒精神綻放時(shí)代光芒
- 2025年湖南信息職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及參考答案
- 2025年湖南司法警官職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)學(xué)生專用
- 2025年湖南工業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)審定版
- 人教版高一下英語(yǔ)單詞表
- 如何做好實(shí)習(xí)生帶教
- 2025年中國(guó)游戲行業(yè)市場(chǎng)深度分析及發(fā)展前景預(yù)測(cè)報(bào)告
- 專項(xiàng)訓(xùn)練:電磁感應(yīng)中的電路、電荷量及圖像問(wèn)題(10大題型)(原卷版)
- 2025年春季學(xué)期各周國(guó)旗下講話安排表+2024-2025學(xué)年度第二學(xué)期主題班會(huì)安排表
- 汽車電腦故障解碼器項(xiàng)目可行性研究報(bào)告評(píng)審方案設(shè)計(jì)2025年發(fā)改委標(biāo)準(zhǔn)
- 安慰劑效應(yīng)在臨床應(yīng)用研究-深度研究
評(píng)論
0/150
提交評(píng)論