spss統(tǒng)計(jì)分析及應(yīng)用教程-第8章-主成分分析和因子分析_第1頁(yè)
spss統(tǒng)計(jì)分析及應(yīng)用教程-第8章-主成分分析和因子分析_第2頁(yè)
spss統(tǒng)計(jì)分析及應(yīng)用教程-第8章-主成分分析和因子分析_第3頁(yè)
spss統(tǒng)計(jì)分析及應(yīng)用教程-第8章-主成分分析和因子分析_第4頁(yè)
spss統(tǒng)計(jì)分析及應(yīng)用教程-第8章-主成分分析和因子分析_第5頁(yè)
已閱讀5頁(yè),還剩101頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第8章主成分分析和因子分析第8章主成分分析和因子分析本章學(xué)習(xí)目標(biāo)理解主成分分析和因子分析的原理與根本思想;掌握主成分分析和因子分析實(shí)驗(yàn)?zāi)康?、?shí)驗(yàn)內(nèi)容和實(shí)驗(yàn)步驟;掌握實(shí)驗(yàn)結(jié)果的統(tǒng)計(jì)分析;理解主成分分析和因子分析的異同點(diǎn)。第8章主成分分析和因子分析主成分分析(PrimaryComponentAnalysis)主要是通過(guò)降維過(guò)程,將多個(gè)相關(guān)聯(lián)的數(shù)值轉(zhuǎn)化為少數(shù)幾個(gè)互不相關(guān)的綜合指標(biāo)的統(tǒng)計(jì)方法,即用較少的指標(biāo)代替和綜合反映原來(lái)較多的信息,這些綜合后的指標(biāo)就是原來(lái)多指標(biāo)的主要成分。因子分析〔FactorAnalysis〕是主成分分析的推廣和發(fā)揮,也是利用降維方法進(jìn)行統(tǒng)計(jì)分析的一種多元統(tǒng)計(jì)方法。因子分析研究相關(guān)矩陣或協(xié)方差的內(nèi)部依賴關(guān)系,由于它將多個(gè)變量綜合為少數(shù)幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系實(shí)驗(yàn)一主成分分析實(shí)驗(yàn)?zāi)康拿鞔_與主成分分析有關(guān)的根本概念;理解主成分分析的根本思想與原理;理解主成分分析的方法;熟練應(yīng)用SPSS軟件進(jìn)行主成分分析;培養(yǎng)運(yùn)用主成分分析解決實(shí)際問(wèn)題的能力。實(shí)驗(yàn)一主成分分析準(zhǔn)備知識(shí)主成分分析的定義主成分分析是利用降維的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)方法。通常把轉(zhuǎn)化生成的綜合指標(biāo)稱之為主成分,其中每個(gè)主成分都是原始變量的線性組合,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。主成分分析的根本思想它通過(guò)對(duì)原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原始變量的線性組合形成幾個(gè)綜合指標(biāo)(主成分),在保存原始變量主要信息的前提下起到降維與簡(jiǎn)化問(wèn)題的作用,使得在研究復(fù)雜問(wèn)題時(shí)更容易抓住主要矛盾。主成分分析的根本理論設(shè)有n個(gè)樣本,每個(gè)樣本都有p個(gè)變量,對(duì)其作線性組合得到:

其中上式的系數(shù)應(yīng)按以下原那么求解:與〔互相獨(dú)立。主成分分析的根本理論是的一切線性組合中方差最大的;是與不相關(guān)的的一切線性組合中方差最大的;是一次原始數(shù)據(jù)的一切線性組合中方差最大的。主成分分析的根本理論根據(jù)以上原那么確定的變量一次的原始變量的第一、第二、…、第p個(gè)主成分。其中在總方差中所占比例依次遞減,這原始變量的能力也一次減弱??梢宰C明系數(shù)向量,〔i=1,2,…,p〕恰好協(xié)方差矩陣Σ的特征值〔〕所對(duì)應(yīng)的特征向量,而且的方差也是上述的特征值,所以主成分的名次是按特征值的順序排序的。在主成分分析的實(shí)際應(yīng)用中,一般指選取前幾個(gè)方差較大的主成分,這樣既減少了變量數(shù)目,又能夠用較少的主成分反映原始變量的大局部信息。主成分分析的根本理論第i個(gè)主成分的奉獻(xiàn)率為:

反映了相應(yīng)的主成分代表原來(lái)p個(gè)指標(biāo)多大的信息,有多大的綜合能力。前k個(gè)主成分的累計(jì)奉獻(xiàn)率為:

說(shuō)明了前k個(gè)主成分包含了原始變量所具有的信息量,共有多大的綜合能力。主成分分析的根本步驟1將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除量綱的影響2建立變量之間的相關(guān)系數(shù)矩陣A3求R的特征值和特征向量4寫出主成分并進(jìn)行分析主成分分析的根本步驟SPSS中選取主成分的方法有兩種:一種是根據(jù)特征根大于等于1來(lái)選?。涣硪环N是根據(jù)用戶直接規(guī)定主成分的個(gè)數(shù)來(lái)選取。

特征值的奉獻(xiàn)還可以從SPSS的碎石圖中看出。

可以把第一和第二主成分的點(diǎn)畫出一個(gè)二維圖,以直觀地顯示它們是如何解釋原來(lái)的變量的。實(shí)驗(yàn)一主成分分析實(shí)驗(yàn)內(nèi)容2011年浙江省11座城市國(guó)民經(jīng)濟(jì)主要指標(biāo):x1-人均生產(chǎn)總值(元),x2-全社會(huì)從業(yè)人員年末數(shù)(萬(wàn)人〕,x3-社會(huì)消費(fèi)品零售總額(億元),x4-固定資產(chǎn)投資(億元),x5-出口總額(億美元),x6-財(cái)政總收入(億元),x7-地方財(cái)政收入,x8-城鄉(xiāng)居民儲(chǔ)蓄存款年末余額(億元),x9-城鎮(zhèn)居民人均可支配收入(元),x10-農(nóng)村居民人均純收入(元)。對(duì)浙江省11座城市的國(guó)民經(jīng)濟(jì)開(kāi)展水平進(jìn)行主成分分析,并計(jì)算11個(gè)城市國(guó)民經(jīng)濟(jì)主要指標(biāo)主成分綜合得分。實(shí)驗(yàn)一主成分分析實(shí)驗(yàn)步驟主成分分析的計(jì)算是由SPSS的因子分析子過(guò)程來(lái)實(shí)現(xiàn)的。在SPSS中,主成分分析與因子分析均在因子分析模塊中完成。實(shí)驗(yàn)一主成分分析實(shí)驗(yàn)步驟

〔1〕準(zhǔn)備工作。在SPSSl7.0中翻開(kāi)數(shù)據(jù)文件8-1.sav,通過(guò)選擇“文件—翻開(kāi)”命令將數(shù)調(diào)入SPSSl7.0的工作文件窗口,如下圖2011年浙江省11座城市國(guó)民經(jīng)濟(jì)主要指標(biāo)〔2〕選擇“分析—降維—因子分析”命令,如下圖,翻開(kāi)因子分析〔3〕指定參與分析的變量。在“因子分析”主對(duì)話框中,從左側(cè)的變量列表中選擇參與分析的變量,單擊向右的箭頭按鈕,使之添加到右邊的變量框中,如下圖。本例中從因子分析對(duì)話框左側(cè)的變量列表中依次將變量x1,x2,x3,x4,x5,x6,x7,x8,x9,x10選中并點(diǎn)向右的箭頭按鈕,使這10個(gè)變量被選入右邊的變量框中。〔4〕運(yùn)行主成分分析過(guò)程。其他選項(xiàng)均為SPSS系統(tǒng)默認(rèn)值。單擊“因子分析”對(duì)話框左下方確實(shí)定按鈕,即可得SPSS主成分分析有關(guān)的計(jì)算結(jié)果。上面的主成分分析中,SPSS默認(rèn)是從相關(guān)矩陣出發(fā)求解主成分,且默認(rèn)保存特征根大于1的主成分。(5)主成分分析其他結(jié)果的計(jì)算。由SPSS軟件默認(rèn)選項(xiàng)輸出的結(jié)果,直接得不到用原始變量表示出主成分的表達(dá)式及其他一些有用的結(jié)果,這就需要對(duì)因子分析模塊中的設(shè)置做一些調(diào)整。單擊“描述”按鈕,翻開(kāi)描述子對(duì)話框,選擇描述統(tǒng)計(jì)量,如下圖。

本例選擇“原始分析結(jié)果”、“系數(shù)”,單擊“連續(xù)”按鈕,回到因子分析對(duì)話框。單擊“抽取”按鈕,翻開(kāi)抽取對(duì)話框,如下圖,由分析設(shè)置可見(jiàn)系統(tǒng)默認(rèn)的提取公因子的方法為主成份法,由分析設(shè)置可見(jiàn)SPSS默認(rèn)是從相關(guān)矩陣出發(fā)求解主成分的。由抽取選框可以自己確定主成分的個(gè)數(shù),默認(rèn)的選擇是基于特征值提取主成分,后面的文本框可以輸入數(shù)值來(lái)指定SPSS軟件保存特征根的大小,即提取特征根大于輸入數(shù)值的主成分,系統(tǒng)默認(rèn)保存特征根大于1的主成分;另外還可以選擇因子的固定數(shù)量主成分,固定數(shù)量后的文本框直接確定主成分的個(gè)數(shù)。在輸出復(fù)選框中的未旋轉(zhuǎn)的因子解〔默認(rèn)選擇〕即顯示主成分提取的結(jié)果;碎石圖那么可以顯示按特征值大小排列的主成分序號(hào)與特征值為兩個(gè)坐標(biāo)軸的碎石圖。本例選擇“方法”選項(xiàng)和“分析”選項(xiàng)均為SPSS系統(tǒng)默認(rèn);選取“輸出”中的未旋轉(zhuǎn)的因子解和碎石圖;在“抽取”選框選擇基于特征值,單擊“繼續(xù)”按鈕,回到因子分析對(duì)話框。單擊“確定按鈕,SPSS自動(dòng)完成計(jì)算。SPSS結(jié)果輸出窗口中就會(huì)給出主成分分析的有關(guān)結(jié)果。實(shí)驗(yàn)結(jié)果和分析相關(guān)矩陣公因子方差可以看出,提取的主成分包含了原始變量至少86.5%的信息解釋的總方差可以看出本例保存了兩個(gè)主成分,第一個(gè)主成分對(duì)應(yīng)的特征值為7.791,即第一個(gè)主成分描述了10個(gè)原始變量中的7.791,第一個(gè)主成分解釋10個(gè)原始變量信息的77.911%〔即主成分奉獻(xiàn)率〕;第二個(gè)主成分對(duì)應(yīng)的特征值為1.406,即第二個(gè)主成分描述了10個(gè)原始變量中的1.406,第一個(gè)主成分解釋10個(gè)原始變量信息的14.062%,說(shuō)明兩個(gè)主成分提供了原始變量足夠信息,主成分分析的效果比較好。標(biāo)準(zhǔn)化后的原始變量總的變差:

第一個(gè)主成分的奉獻(xiàn)率前兩個(gè)主成分的累計(jì)奉獻(xiàn)率:前兩個(gè)主成分的累計(jì)奉獻(xiàn)率:

主成分碎石圖成份矩陣

表輸出的是第一主成分、第二主成分與原始變量的關(guān)系。而兩個(gè)主成分對(duì)應(yīng)的特征根可得為2.7912,為1.1857,用其除以結(jié)果表中的第二列和第三列可以得到主成分表達(dá)式的系數(shù)(即每個(gè)特征值對(duì)應(yīng)的單位特征向量),由此可以得到各個(gè)主成分表達(dá)式:另外通常還可以將標(biāo)準(zhǔn)化后的原始數(shù)據(jù)代入主成分表達(dá)式計(jì)算各個(gè)樣本的主成分得分。首先,將原始數(shù)據(jù)標(biāo)準(zhǔn)化處理。選擇分析—描述統(tǒng)計(jì)—描述命令翻開(kāi)“描述”對(duì)話框。在翻開(kāi)的描述的對(duì)話框中,如下圖,從左端對(duì)話框中依次選擇變量x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,移動(dòng)到對(duì)話框右端的變量中,鉤選“將標(biāo)準(zhǔn)化得分另存為變量”,保存標(biāo)注化后的結(jié)果。標(biāo)準(zhǔn)化后的變量依次為zx1,zx2…,zx10保存在數(shù)據(jù)編輯窗口,如下圖。其次,計(jì)算各個(gè)主成分得分。本例將標(biāo)準(zhǔn)化變換以后變量值z(mì)x1,zx2…,zx10代入式〔8-1-2〕和式〔8-1-3〕中,可以計(jì)算各個(gè)樣本的第一主成分得分和第二主成分得分??梢赃x擇“轉(zhuǎn)換—計(jì)算變量”命令翻開(kāi)計(jì)算變量對(duì)話框,如下圖,在計(jì)算變量對(duì)話框中設(shè)置公式完成。在計(jì)算變量對(duì)話框的目標(biāo)變量文本框中輸入y1〔第一主成分得分〕,標(biāo)準(zhǔn)化之后的原始變量zx1,zx2…,zx10組成的表達(dá)式。把上面的表達(dá)式鍵入數(shù)字表達(dá)式文本框中,單擊確定按鈕,表達(dá)式如下圖。在SPSS數(shù)據(jù)編輯窗口將會(huì)出現(xiàn)一個(gè)名為y1的變量,即為第一主成分得分。同理,在計(jì)算變量對(duì)話框的目標(biāo)變量文本框中輸入y2〔第二主成分得分〕,標(biāo)準(zhǔn)化之后的原始變量zx1,zx2…,zx10組成的表達(dá)式:0.421*Zx1-0.306*Zx2-0.248*Zx3-0.138*Zx4+0.062*Zx5-0.095*Zx6-0.117*Zx7-0.272*Zx8+0.367*Zx9+0.644*Zx10把上面的表達(dá)式鍵入數(shù)字表達(dá)式文本框中,單擊確定按鈕,在SPSS數(shù)據(jù)編輯窗口將會(huì)出現(xiàn)一個(gè)名為y2的變量,即為第二主成分得分,即為第二主成分得分。最后,計(jì)算綜合得分。如果要計(jì)算各個(gè)地區(qū)的綜合得分,按照下式:y=0.7791*y1+0.1406*y2其中y1為樣本第一主成分得分,y2為樣本第二主成分得分,由綜合得分可以對(duì)各個(gè)地區(qū)國(guó)民經(jīng)濟(jì)主要指標(biāo)進(jìn)行排名。綜合得分可在計(jì)算變量對(duì)話框中完成,如下圖。在目標(biāo)變量文本框中輸(綜合得分),在數(shù)字表達(dá)式文本框中構(gòu)造由第一主成分得分、第二主成分得分和第一主成分、第二主成分的奉獻(xiàn)率構(gòu)成的表達(dá)式:y=0.7791*y1+0.1406*y2第一主成分得分、第二主成分得分以及主成分綜合得分計(jì)算結(jié)果顯示在SPSS數(shù)據(jù)編輯窗口y1,y2,y三列,如下圖。實(shí)驗(yàn)總結(jié)主成分分析不能看作是研究的結(jié)果,它經(jīng)常與其他方法相結(jié)合使用,在主成分分析的根底上繼續(xù)采用其他多元統(tǒng)計(jì)方法來(lái)解決實(shí)際問(wèn)題。實(shí)驗(yàn)總結(jié)

一般來(lái)說(shuō),由協(xié)方差矩陣出發(fā)求解主成分所得結(jié)果與由相關(guān)矩陣出發(fā)求解主成分所得結(jié)果有很大不同。對(duì)于度量單位不同的指標(biāo)或取值范圍彼此差異非常大的指標(biāo),不能直接由其協(xié)方差矩陣出發(fā)進(jìn)行主成分分析,而應(yīng)該考慮將數(shù)據(jù)標(biāo)準(zhǔn)化(從相關(guān)矩陣出發(fā))。對(duì)于同度量單位或取值范圍在同量級(jí)的數(shù)據(jù)還是直接從協(xié)方差矩陣求解。實(shí)驗(yàn)總結(jié)主成分分析適用于變量之間存在較強(qiáng)相關(guān)性的數(shù)據(jù),如果原始數(shù)據(jù)相關(guān)性較弱,應(yīng)用主成分分析后不能起到很好的降維作用,所得的各個(gè)主成分濃縮原始變量信息的能力相差不大。一般認(rèn)為,當(dāng)原始數(shù)據(jù)大局部變量的相關(guān)系數(shù)都小于0.3時(shí),應(yīng)用主成分分析取得的效果不理想。實(shí)驗(yàn)總結(jié)

為了分析各樣本在主成分所反映的經(jīng)濟(jì)意義方面的情況,還可以將標(biāo)準(zhǔn)化后的原始數(shù)據(jù)代入主成分表達(dá)式計(jì)算出各樣本的主成分綜合得分,例如可以按照主成分得分對(duì)樣本進(jìn)行排序、分類等。實(shí)驗(yàn)二因子分析實(shí)驗(yàn)?zāi)康拿鞔_因子分析有關(guān)的根本概念;理解因子分析的根本思想與原理;理解因子分析的方法;熟練應(yīng)用SPSS軟件進(jìn)行因子分析;培養(yǎng)運(yùn)用因子分析解決實(shí)際問(wèn)題的能力。實(shí)驗(yàn)二因子分析準(zhǔn)備知識(shí)因子分析的定義因子分析〔FactorAnalysis〕是一種將多變量化簡(jiǎn)的技術(shù),它可以被看成是主成分分析的推廣。因子分析的目的是分解原始變量,從中歸納出潛在的“類別”,相關(guān)性較強(qiáng)的指標(biāo)歸為一類,不同類間變量的相關(guān)性那么降低。每一類變量代表了一個(gè)“共同因子”,即一種內(nèi)在結(jié)構(gòu)、因子分析就是要尋找該結(jié)構(gòu)。因子分析模型及根本概念因子分析的出發(fā)點(diǎn)是用較少的互相獨(dú)立的因子變量來(lái)代替原始變量的大局部信息,可以通過(guò)下面的數(shù)學(xué)模型來(lái)表示:其中為原始的p個(gè)變量,且都為均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)化變量,〔k<p〕為k個(gè)因子變量,分別是均值為0,標(biāo)準(zhǔn)差為1的隨機(jī)變量。為p個(gè)特殊因子,分別是均值為0,方差為的隨機(jī)變量。表示成矩陣的形式為:因子分析模型及根本概念表示成矩陣的形式為:其中F稱為因子變量,A稱為因子載荷矩陣,(i=1,2,…,p;j=1,2,…,k)稱為因子載荷,即第i個(gè)原始變量在第j個(gè)因子變量上的載荷;k為公共因子的數(shù)目;稱為特殊因子,它的各個(gè)分量也是互相獨(dú)立且不可觀測(cè)的隨機(jī)變量,而且它與公共因子F也是互相獨(dú)立的,它表示了原始變量不能被公共因子解釋的局部,使用公共因子作線性組合對(duì)于原始變量的信息喪失由特殊因子來(lái)補(bǔ)充。因子分析通常采取的幾種方法計(jì)算相關(guān)系數(shù)矩陣

1最簡(jiǎn)單的方法是計(jì)算原有變量的簡(jiǎn)單相關(guān)系數(shù)矩陣并進(jìn)行統(tǒng)計(jì)檢驗(yàn)。如果相關(guān)系數(shù)矩陣中的大局部相關(guān)系數(shù)值均小于0.3,即各個(gè)變量間大多為弱相關(guān),那么原那么上這些變量是不適合進(jìn)行因子分析的。因子分析通常采取的幾種方法巴特利特球形檢驗(yàn)

2

巴特利特球形檢驗(yàn)以原始變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),其零假設(shè)是相關(guān)系數(shù)矩陣為單位矩陣,即相關(guān)系數(shù)矩陣主對(duì)角元素均為1,非主對(duì)角元素均為0。巴特利特球形檢驗(yàn)統(tǒng)計(jì)量依據(jù)相關(guān)系數(shù)矩陣的行列式計(jì)算得到,近似服從卡方分布。如果統(tǒng)計(jì)量值較大且對(duì)應(yīng)的伴隨概率(Sig)值小于給定的顯著性水平時(shí),零假設(shè)不成立,即說(shuō)明相關(guān)系數(shù)矩陣不太可能是單位矩陣,變量之間存在相關(guān)關(guān)系,適合做因子分析。因子分析通常采取的幾種方法計(jì)算反映像相關(guān)矩陣3反映像相關(guān)矩陣檢驗(yàn)以變量的偏相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),將偏相關(guān)系數(shù)矩陣的每個(gè)元素取反,得到反映像相關(guān)矩陣。如果其主對(duì)角線外的元素大多絕對(duì)值較小,對(duì)角線上的元素值較接近1,那么說(shuō)明這些變量的相關(guān)性較強(qiáng),適合進(jìn)行因子分析。因子分析通常采取的幾種方法KMO檢驗(yàn)4KMO檢驗(yàn)的統(tǒng)計(jì)量是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為:其中是變量i和變量j之間的簡(jiǎn)單相關(guān)系數(shù),是變量i和變量j之間的偏相關(guān)系數(shù)。因子提取和因子載荷矩陣的求解因子分析的關(guān)鍵是根據(jù)樣本數(shù)據(jù)求解因子載荷矩陣。主成分法確定因子載荷是進(jìn)行因子分析之前先對(duì)數(shù)據(jù)進(jìn)行一次主成分分析,然后把前面幾個(gè)主成分作為未旋轉(zhuǎn)的公共因子。相對(duì)于其他確定因子載荷的方法而言,主成分法比較簡(jiǎn)單。第i個(gè)公共因子的奉獻(xiàn)率為:如果數(shù)據(jù)已經(jīng)標(biāo)準(zhǔn)化,第i個(gè)公共因子的奉獻(xiàn)率為:因子提取和因子載荷矩陣的求解前k個(gè)公共因子的累計(jì)奉獻(xiàn)率為:如果數(shù)據(jù)已經(jīng)標(biāo)準(zhǔn)化,前k個(gè)公共因子的累計(jì)奉獻(xiàn)率為:

具體選擇幾個(gè)公共因子還要看實(shí)際情況而定,具體問(wèn)題具體分析,總之要使所選取的公因子能夠合理地描述原始變量相關(guān)陣的結(jié)構(gòu),同時(shí)要有利于因子模型的解釋。因子命名和因子載荷矩陣的旋轉(zhuǎn)因子變量的命名解釋是因子分析的另外一個(gè)核心問(wèn)題,對(duì)模型中的公共因子給予合理的解釋,以便進(jìn)行進(jìn)一步的分析。在實(shí)際分析中,主要是通過(guò)對(duì)載荷矩陣A的值進(jìn)行分析,得到因子變量和原始變量的關(guān)系,從而對(duì)新的因子變量進(jìn)行命名。因子旋轉(zhuǎn)的方法主要有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)。而正交旋轉(zhuǎn)方式通常有四次方最大法(quartmax)、最大方差法(varimax)、最大平衡值法(equamax)等,其中最常用的是最大方差法。計(jì)算因子得分因子得分是因子分析的最終表達(dá)。在因子分析的實(shí)際應(yīng)用中,當(dāng)因子確定以后,便可計(jì)算各因子在每個(gè)樣本上的具體數(shù)值,這些數(shù)值稱為因子得分,形成的變量稱為因子變量。在后面的分析中就可以用因子變量代替原始變量進(jìn)行建模,或利用因子變量對(duì)樣本進(jìn)行分類、回歸、排序與評(píng)價(jià)等研究,進(jìn)而實(shí)現(xiàn)降維和簡(jiǎn)化問(wèn)題的目標(biāo)。計(jì)算因子得分首先將因子變量表示為原始變量的線性組合,即因子得分函數(shù):

〔j=1,2,…,k〕因子分析中另外幾個(gè)重要的相關(guān)概念變量共同度2即公因子方差或公共方差,變量的共同度是因子載荷矩陣A中第i行元素的平方和,數(shù)學(xué)定義為反映了公共因子f對(duì)的影響,為公共因子f對(duì)的“奉獻(xiàn)”。實(shí)際反映了變量對(duì)公共因子f的依賴程度。在變量標(biāo)準(zhǔn)化時(shí)那么有:因子分析中另外幾個(gè)重要的相關(guān)概念因子的方差貢獻(xiàn)3考慮指定的一個(gè)公共因子對(duì)各個(gè)變量的影響。實(shí)際上對(duì)各個(gè)變量的影響可由因子載荷矩陣A中第j列的元素來(lái)描述,數(shù)學(xué)定義為因子分析前提條件檢驗(yàn)因子分析的目的是從眾多的原始變量中構(gòu)造出少數(shù)幾個(gè)具有代表意義的因子變量,這必定有一個(gè)潛在的前提條件,即原始變量之間要具有較強(qiáng)的相關(guān)性。如果原始變量之間不存在較強(qiáng)的相關(guān)關(guān)系,那么就無(wú)法從中綜合出能反映某些變量共同特性的少數(shù)公共因子變量。因此,在因子分析時(shí),需要對(duì)原始變量相關(guān)性進(jìn)行分析。

因子分析中另外幾個(gè)重要的相關(guān)概念因子載荷

1因子分析表達(dá)式中各因子的系數(shù)值,它的統(tǒng)計(jì)意義是第i個(gè)變量與第j個(gè)因子的相關(guān)系數(shù),用來(lái)反映公共因子與各個(gè)原始變量之間的相關(guān)程度。因子載荷絕對(duì)值越大,說(shuō)明各個(gè)因子對(duì)變量影響程度越大。高載荷的變量可以幫助理解公共因子的意義并據(jù)此給公共因子命名。因子分析的根本步驟1因子分析的前提條件2因子提取3因子旋轉(zhuǎn)4計(jì)算因子得分實(shí)驗(yàn)二因子分析實(shí)驗(yàn)內(nèi)容2006年省會(huì)城市和方案單列市主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),其中x1:年底總?cè)丝?萬(wàn)人),x2:地區(qū)生產(chǎn)總值(萬(wàn)元),x3:貨運(yùn)量(萬(wàn)噸),x4:地方財(cái)政預(yù)算內(nèi)收入(萬(wàn)元),x5:固定資產(chǎn)投資總額(萬(wàn)元),x6:城鄉(xiāng)居民儲(chǔ)蓄年末余額(萬(wàn)元),x7:在崗職工平均工資(元),x8:社會(huì)商品零售總額(萬(wàn)元),x9:貨物進(jìn)出口總額(萬(wàn)美元),x10:年末實(shí)有公共汽電車營(yíng)運(yùn)車輛數(shù)(輛),x11:普通高等學(xué)校在校學(xué)生數(shù)(人),x12:醫(yī)院與衛(wèi)生院個(gè)數(shù)(個(gè))。試作因子分析,對(duì)35個(gè)城市的經(jīng)濟(jì)開(kāi)展水平進(jìn)行評(píng)價(jià)(根本數(shù)據(jù)見(jiàn)8-4.sav。資料來(lái)源:徐秋艷等,SPSS統(tǒng)計(jì)分析方法與應(yīng)用實(shí)驗(yàn)教程,中國(guó)水利水電出版社,2011)。實(shí)驗(yàn)二因子分析實(shí)驗(yàn)步驟

〔1〕準(zhǔn)備工作。在SPSSl7.0中翻開(kāi)數(shù)據(jù)文件8-4.sav,通過(guò)選擇“文件—翻開(kāi)”命令將數(shù)據(jù)調(diào)入SPSSl7.0的工作文件窗口。。2006年省會(huì)城市和方案單列市主要經(jīng)濟(jì)指標(biāo)

〔2〕選擇“分析—降維—因子分析”命令,翻開(kāi)因子分析主對(duì)話框,如下圖。

(3)選擇參與因子分析的變量。在因子分析主對(duì)話框中,從左側(cè)的變量列表中選擇參與因子分析的變量,單擊向右的箭頭按鈕,使之添加到右邊的變量框中,如下圖。本例因子分析對(duì)話框左側(cè)的變量列表中選擇參與因子分析的變量x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,單擊向右的箭頭按鈕,使之添加到右邊的變量框中。

〔4〕單擊Descriptives按鈕,翻開(kāi)描述子對(duì)話框,指定輸出結(jié)果,如下圖。描述對(duì)話框各個(gè)選項(xiàng)如下:統(tǒng)計(jì)量:用于選擇輸出相關(guān)的根本統(tǒng)計(jì)量。其中:?jiǎn)巫兞棵枋鲂裕罕硎据敵龈鱾€(gè)變量的根本描述統(tǒng)計(jì)量(即各個(gè)變量的均值與標(biāo)準(zhǔn)差)。原始分析結(jié)果:表示輸出因子分析的初始解,輸出的是因子提取前分析變量的公因子方差。

相關(guān)矩陣:用于檢驗(yàn)變量是否適合作因子分析的幾種方法。其中:系數(shù):表示輸出相關(guān)系數(shù)矩陣R。顯著性水平:表示輸出相關(guān)系數(shù)檢驗(yàn)的概率p值。行列式:可以給出相關(guān)系數(shù)矩陣的行列式值。逆模型:表示輸出相關(guān)系數(shù)矩陣的逆矩陣。再生:選擇給出因子分析后的相關(guān)陣,還給出殘差,原始相關(guān)與再生相關(guān)之間的差值。

反映像:表示輸出反映像相關(guān)矩陣。反映像相關(guān)矩陣,包括偏相關(guān)系數(shù)的取反;反映像協(xié)方差矩陣,包括偏協(xié)方差的取反。在一個(gè)好的因子分析模型中除對(duì)角線上的系數(shù)較大外,其他元素應(yīng)該比較小。KMO和Bartlett的球形檢驗(yàn):表示進(jìn)行KMO檢驗(yàn)和巴特利特球形檢驗(yàn)。本例選中選取“單變量描述”和“原始分析結(jié)果”選項(xiàng);并在相關(guān)矩陣框選擇“系數(shù)”選項(xiàng),“反映像”選項(xiàng)和“KMO和Bartlett的球形檢驗(yàn)”選項(xiàng)。然后單擊“繼續(xù)”按鈕,回到上一級(jí)菜單因子分析對(duì)話框。

(5)單擊抽取按鈕,翻開(kāi)抽取對(duì)話框,選擇因子提取的方法。“方法”框中提供了7種提取因子的方法主成份分析法,是SPSS默認(rèn)的方法。該方法假定原變量是因子變量的線性組合。未加權(quán)的最小二乘法,該方法使觀察的和再生的相關(guān)矩陣之差的平方和最小。廣義最小二乘法,用變量的倒數(shù)值加權(quán),使得觀察的和再生的相關(guān)矩陣之差的平方和最小。

“方法”框中提供了7種提取因子的方法極大似然法,此方法不要求多元正態(tài)分布,給出參數(shù)估計(jì),如果樣本來(lái)自多元正態(tài)總體,它們與原始變量的相關(guān)矩陣極為相似。主軸因子法,使用多元相關(guān)系數(shù)的平方作為對(duì)公因子方差的初始估計(jì)值。因子法,此方法把分析的變量看作來(lái)自一個(gè)潛在總體的樣本,使因子的??煽啃宰畲蟆S诚褚蜃犹崛》?,也稱多元回歸法,把局部映像(變量的公共局部)看作剩余變量的多元線性回歸。

分析框:用于選擇提取因子變量的依據(jù)。相關(guān)性矩陣:表示依據(jù)相關(guān)系數(shù)矩陣提取公共因子,可用于分析度量單位不同的變量,為系統(tǒng)默認(rèn)選擇項(xiàng)。協(xié)方差矩陣:指定以分析變量的協(xié)方差矩陣為提取公共因子的依據(jù)。統(tǒng)計(jì)分析方法及應(yīng)用實(shí)驗(yàn)教程。

抽取框:對(duì)給出了因子的提取數(shù)目界定的標(biāo)準(zhǔn)。基于特征根:后面的文本框可以輸入數(shù)值來(lái)指定SPSS軟件保存特征根的大小,SPSS將提取特征值大于該值的因子。在此項(xiàng)后面的框中系統(tǒng)給出的默認(rèn)值為1,即要求提取那些特征根大于1的因子因子的固定數(shù)量:表示選取固定數(shù)量的公共因子,后面的文本框可以輸入要提取因子的個(gè)數(shù),SPSS將提取指定個(gè)數(shù)的因子??梢愿鶕?jù)方差累計(jì)奉獻(xiàn)率到達(dá)一定要求來(lái)輸入提取的因子的數(shù)目。

輸出框:指定與因子提取有關(guān)的輸出項(xiàng)。未旋轉(zhuǎn)的因子解:表示輸出未經(jīng)旋轉(zhuǎn)的因子載荷矩陣,系統(tǒng)默認(rèn)選擇。碎石圖:顯示輸出因子與其特征值的碎石圖,按特征值的大小排列,有助于確定保存多少個(gè)因子。典型的碎石圖會(huì)有一個(gè)明顯的拐點(diǎn),該點(diǎn)之前是與大的特征值對(duì)應(yīng)的因子連接的陡峭折線,之后是與小的特征值對(duì)應(yīng)的因子相連的緩坡折線。

最大收斂性迭代次數(shù)框:用于指定因子分析收斂的最大迭代次數(shù),系統(tǒng)默認(rèn)的最大迭代次數(shù)為25次。本例中在“分析”框選擇“主成份”法提取公共因子;分析框中選項(xiàng),從相關(guān)系數(shù)矩陣出發(fā)提取公共因子;輸出框選擇“未旋轉(zhuǎn)的因子解”和“碎石圖”選項(xiàng);“抽取”框因子的固定數(shù)量后面的文本框中輸入3。單擊繼續(xù)按鈕,返回因子分析對(duì)話框。

(6)單擊“旋轉(zhuǎn)”按鈕,翻開(kāi)旋轉(zhuǎn)對(duì)話框,選擇因子旋轉(zhuǎn)方法,如下圖,選項(xiàng)如下:旋轉(zhuǎn)框:用于選擇因子旋轉(zhuǎn)方法,其中:無(wú):不作因子旋轉(zhuǎn),系統(tǒng)默認(rèn)選項(xiàng)。最大方差法:它使得每個(gè)因子上的具有最高載荷的變量數(shù)目最小,因此可以簡(jiǎn)化對(duì)因子的解釋。直接Oblimin方法:直接斜交(非正交)旋轉(zhuǎn),指定該項(xiàng)可以在下面的矩形框中輸入Delta值,此值在0-1之間。

旋轉(zhuǎn)框:用于選擇因子旋轉(zhuǎn)方法,其中:最大四次方值法:使需要解釋每個(gè)變量的因子數(shù)最少,可以簡(jiǎn)化對(duì)觀測(cè)變量的解釋。最大平衡值法:相等最大正交旋轉(zhuǎn)法,是最大方差法方法與最大四次方值法方法的結(jié)合,對(duì)變量和因子均作旋轉(zhuǎn)。Promax(P)法:斜交旋轉(zhuǎn)方法,允許因子間相關(guān)。它比直接斜交旋轉(zhuǎn)計(jì)算速度快,適用于大樣本數(shù)據(jù),同時(shí)給出Kappa值,默認(rèn)值為4。

輸出框:用于選擇輸出與因子旋轉(zhuǎn)相關(guān)的信息,其中:旋轉(zhuǎn)解:輸出旋轉(zhuǎn)后的因子載荷矩陣。載荷圖:表示輸出旋轉(zhuǎn)后的因子載荷散點(diǎn)圖。本例中選擇最大方差法,并選中旋轉(zhuǎn)解和散點(diǎn)圖項(xiàng),輸出旋轉(zhuǎn)后的因子載荷矩陣和載荷散點(diǎn)圖,單擊繼續(xù)按鈕,返回因子分析對(duì)話框。

(7)單擊“得分”按鈕進(jìn)入因子分析對(duì)話框,選擇計(jì)算因子得分的方法,如下圖,選項(xiàng)如下:保存為變量:將因子得分作為新變量保存在數(shù)據(jù)文件中,程序運(yùn)行結(jié)束后,在數(shù)據(jù)編輯窗口將顯示出新變量,生成幾個(gè)因子便會(huì)產(chǎn)生幾個(gè)SPSS變量。變量名的形式為FACn_m,其中n是因子編號(hào),m表示是第幾次分析的結(jié)果。

方法框:用于指定計(jì)算因子得分的方法。其中:回歸法:因子得分的均值為0,方差等于估計(jì)因子得分與實(shí)際因子得分?jǐn)?shù)值之間的多元相關(guān)系數(shù)平方。巴特利特法〔Bartlette〕:因子得分均值為0,超出變量范圍的因子的平方和被最小化。安德森一魯賓法(Anderson-Rubin):為保證因子的正交性對(duì)Bartlett因子得分進(jìn)行調(diào)整,因子得分的均值為0,標(biāo)準(zhǔn)差為1。

顯示因子得分系數(shù)矩陣:表示輸出因子得分系數(shù)矩陣,是標(biāo)準(zhǔn)化的得分系數(shù),原始變量值進(jìn)行標(biāo)準(zhǔn)化后,可以根據(jù)該矩陣給出的系數(shù)計(jì)算各觀測(cè)變量的因子得分。本例中因子得分選擇“回歸”選項(xiàng);選擇“最大方差法”;選中“顯示因子得分系數(shù)矩陣”,輸出因子得分系數(shù)矩陣;選擇“保存為變量”,把因子得分作為新變量保存在數(shù)據(jù)編輯窗口;單擊“繼續(xù)”按鈕,返回因子分析對(duì)話框。

(8)單擊“選項(xiàng)”按鈕,進(jìn)入選項(xiàng)對(duì)話框,指定缺失值的處理方法和因子載荷矩陣的輸出方法,如下圖,選項(xiàng)如下:缺失值框:用于指定缺失值的處理方法。選擇項(xiàng)有:按列表排除個(gè)案:去掉所有含缺失值的個(gè)案以后再進(jìn)行分析。按對(duì)排除個(gè)案:成對(duì)剔除含有缺失值的個(gè)案以后再進(jìn)行分析。使用平均值替換:用平均值替代缺失值。

系數(shù)顯示框:用于指定因子載荷矩陣的輸出方式。其中:按大小排序:載荷系數(shù)按照數(shù)值的大小排列使得在同一因子上具有較高載荷的變量排列在一起,為因子解釋提供了方便,便于得出結(jié)論。取消小系數(shù):不顯示那些絕對(duì)值小于指定值的載荷系數(shù)。選中此項(xiàng),需要在后面的框中輸入一個(gè)擇此項(xiàng)可以突出載荷較大的變量。

實(shí)驗(yàn)結(jié)果

描述統(tǒng)計(jì)量相關(guān)矩陣

KMO和Bartlett的檢驗(yàn)表輸出的是KMO檢驗(yàn)和Bartlett球度檢驗(yàn)的結(jié)果。KMO檢驗(yàn)比較了觀測(cè)到的變量間的相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小,用于檢驗(yàn)指標(biāo)是否適合進(jìn)行因子分析。一般而言,KMO值大于0.5意味著因子分析可以進(jìn)行,本例的KMO值為0.813,說(shuō)明所選變量很適合做因子分析。同時(shí),Bartlett球度檢驗(yàn)是通過(guò)轉(zhuǎn)化為檢驗(yàn)來(lái)完成對(duì)變量之間是否獨(dú)立進(jìn)行檢驗(yàn)。可以看出,Bartlett球度檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值為694.102,相應(yīng)的伴隨概率為0.000,小于顯著性水平0.05,因此拒絕Bartlett球度檢驗(yàn)的零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣與單位矩陣有顯著差異,即原有變量適合進(jìn)行因子分析。

表是因子分析的初始結(jié)果,顯示了各個(gè)變量的三個(gè)因子共同度。第一列給出了12個(gè)原始變量名第二列是根據(jù)因子分析的初始解給出的變量共同度,它說(shuō)明對(duì)原始的12個(gè)變量采用主成分分析方法提取所有特征根(12個(gè)),每個(gè)原始變量

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論