SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第1頁(yè)
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第2頁(yè)
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第3頁(yè)
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第4頁(yè)
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS軟件進(jìn)行主成分分析的應(yīng)用例子2002年16家上市公司4項(xiàng)指標(biāo)的數(shù)據(jù)5見(jiàn)表2,定量綜合贏利能力分析如下:表2 2002年16家上市公司 4項(xiàng)指標(biāo)的數(shù)據(jù)公司銷售凈利率(Xi)資產(chǎn)凈利率(X2)凈資產(chǎn)收益率(X3)銷售毛利率(%)歌華有線五糧液?用友軟件太太藥業(yè)浙江陽(yáng)光煙臺(tái)萬(wàn)華方正科技紅河光43.3117.1121.1129.5511.0017.632.7329.1120.293.9922.654.437.3912.136.038.628.4113.864.225.449.484.6411.137.308.7317.297.0010.1311.8315.4117.166.0912.979.3

2、514.314.3654.8944.2589.377325.2236.449.9656.2682.2313.0450.5129.04明貴州茅臺(tái)中鐵二局5.407.0619.827.268.902.7910.532.9912.535.2418.556.9965.519.7942.0422.72紅星發(fā)展伊利股份青島海爾湖北宜化雅戈?duì)??福建南?. 主成分分析的做法第一,將EXCEL中的原始數(shù)據(jù)導(dǎo)入到 SPSS軟件中;、/1. 、/ : 注意:導(dǎo)入Spss的數(shù)據(jù)不能出現(xiàn)空缺的現(xiàn)象,如出現(xiàn)可用0補(bǔ)齊。第二,對(duì)四個(gè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理;【1】“分析” | “描述統(tǒng)計(jì)” | “描述”。【2】彈出“描述統(tǒng)計(jì)”

3、對(duì)話框,首先將準(zhǔn)備標(biāo)準(zhǔn)化的變量移入變量組中,此時(shí),最重要的一步就是勾選“將標(biāo)準(zhǔn)化得分另存為變量”,最后點(diǎn)擊確定。【3】返回SPSS的“數(shù)據(jù)視圖”,此時(shí)就可以看到新增了標(biāo)準(zhǔn)化后數(shù)據(jù)的字段。所做工作:a.原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理數(shù)據(jù)標(biāo)準(zhǔn)化主要功能就是消除變量間的量綱關(guān)系,從而使數(shù)據(jù)具有可比性,可以舉個(gè)簡(jiǎn)單的例子,一個(gè)百分制的變量與一個(gè) 5分值的變量在一起怎么比較?只有通過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化,都把它們標(biāo)準(zhǔn)到同一個(gè)標(biāo)準(zhǔn)時(shí)才具有可比性,一般標(biāo)準(zhǔn)化采用的是Z標(biāo)準(zhǔn)化,即均值為0,方差為1,當(dāng)然也有其他標(biāo)準(zhǔn)化,比如0-1標(biāo)準(zhǔn)化等等,可根據(jù)自己的研究目的進(jìn)行選擇,這里介紹怎么進(jìn)行數(shù)據(jù)的Z標(biāo)準(zhǔn)化。所的結(jié)論:標(biāo)準(zhǔn)化后的所有指標(biāo)

4、數(shù)據(jù)。SPSS在調(diào)用Factor Analyze過(guò)程進(jìn)行分析時(shí),SPSS會(huì)自動(dòng)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,所以在得到計(jì)算結(jié)果后的變量都是指經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的變量,但SPSS并不直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù) ,如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives 過(guò) 程進(jìn)行計(jì)算。第三,并把標(biāo)準(zhǔn)化后的數(shù)據(jù)保存在數(shù)據(jù)編輯窗口中然后利用SPSS的factor過(guò)程對(duì)數(shù)據(jù)進(jìn)行因子分析(指標(biāo)之間的相關(guān)性判定略)?!?】“分析” | “降維” | “因子分析”選項(xiàng)卡,將要進(jìn)行分析的變量選入“變 量”列表;【2】設(shè)置“描述”,勾選“原始分析結(jié)果”和“KMO與 Bartlett球形度檢驗(yàn)”復(fù)選框;【3】設(shè)置“抽取”,勾

5、選“碎石圖”復(fù)選框;【4】設(shè)置“旋轉(zhuǎn)”,勾選“最大方差法”復(fù)選框;【5】設(shè)置“得分”,勾選“保存為變量”和“因子得分系數(shù)”復(fù)選框;【6】查看分析結(jié)果。所做工作:a.查看KMOffi Bartlett 的檢驗(yàn)KMO值接近1.KMO值越接近于1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析;Bartlett 球度度檢驗(yàn)的 Sig值越小于顯著水平 0.05,越說(shuō)明變量之間存在相關(guān) 關(guān)系。所的結(jié)論:符合因子分析的條件,可以進(jìn)行因子分析,并進(jìn)一步完成主成分分析1. KM0( Kaiser-Meyer-Olkin)KMO統(tǒng)計(jì)量是取值在 0和1之間。當(dāng)所有變量間的簡(jiǎn)單相關(guān)系數(shù)平方和遠(yuǎn)遠(yuǎn)大于偏相關(guān)系數(shù)平

6、方和時(shí),KMO值接近1.KMO值越接近于1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析;當(dāng)所有變量間的簡(jiǎn)單相關(guān)系數(shù)平方和接近0時(shí),KMOfi接近0.KMO值越接近于0,意味著變量間的相關(guān)性越弱,原有變量越不適合作因子分 析。Kaiser給出了常用的kmo度量標(biāo)準(zhǔn):0.9以上表示非常適合;0.8表示適合;0.7 表示一般;0.6表示不太適合;0.5以下表示極不適合。2. Bartlett球度檢驗(yàn):巴特利特球度檢驗(yàn)的統(tǒng)計(jì)量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到的,如果該值較大,且其對(duì)應(yīng)的相伴概率值小于用戶心中的顯著性水平,那么應(yīng)該拒絕零假設(shè),認(rèn)為 相關(guān)系數(shù)矩陣不可能是單位陣,即原始變量之間存在相關(guān)

7、性,適合于做主成份分析; 相反,如果該統(tǒng)計(jì)量比較小,且其相對(duì)應(yīng)的相伴概率大于顯著性水平,則不能拒絕零 假設(shè),認(rèn)為相關(guān)系數(shù)矩陣可能是單位陣,不宜于做因子分析。Bartlett球度檢驗(yàn)的原假設(shè)為相關(guān)系數(shù)矩陣為單位矩陣,Sig值為0.001小于顯著水平0.05,因此拒絕原假設(shè),說(shuō)明變量之間存在相關(guān)關(guān)系,適合做因子分析。所做工作:b.全部解釋方差或者解釋的總方差(Total Variance Explained)初始特征根(InitialEigenvalues )大于 1并且累計(jì)百分比達(dá)到80%85%以上查看相關(guān)系數(shù)矩陣的特征根及方差貢獻(xiàn)率見(jiàn)表3,由于前2個(gè)主成分貢獻(xiàn)率85%結(jié)合表4中變量不出現(xiàn)丟失,

8、所以提取的主成分個(gè)數(shù)m=2所的結(jié)論:初始特征根:入1=1.897入2=1.550主成分貢獻(xiàn)率:r 1=0.47429 r 2=0.38740主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來(lái)判定,如前所說(shuō),相關(guān)系數(shù)矩陣 的特征根剛好等于主成分的方差,而方差是變量數(shù)據(jù)蘊(yùn)涵信息的重要判據(jù)之一。根據(jù) 入值決定主成分?jǐn)?shù)目的準(zhǔn)則有三:1. 只取入1的特征根對(duì)應(yīng)的主成分從Total Variance Explained表中可見(jiàn),第一、第二和第三個(gè)主成分對(duì)應(yīng)的入值都大于1,這意味著這三個(gè)主成分得分的方差都大于1。本例正是根據(jù)這條準(zhǔn)則提取主成分的。2. 累計(jì)百分比達(dá)到 80%85%以上的入值對(duì)應(yīng)的主成分在Total

9、Variance Explained表可以看出,前三個(gè)主成分對(duì)應(yīng)的入值累計(jì)百分比達(dá)到89.584%,這暗示只要選取三個(gè)主成分,信息量就夠了。3. 根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量從特征根分布的折線圖(Scree Plot )上可以看到,第 4個(gè)入值是一個(gè)明顯的折 點(diǎn),這暗示選取的主成分?jǐn)?shù)目應(yīng)有 p4。那么,究竟是3個(gè)還是4個(gè)呢?根據(jù)前面兩 條準(zhǔn)則,選3個(gè)大致合適(但小有問(wèn)題)。第四,計(jì)算特征向量矩陣(主成分表達(dá)式的系數(shù))【1】將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入 (可用復(fù)制粘貼的方法)到數(shù)據(jù)編輯窗 口(為變量VI、V2);Fi=Vi/SQR(入 1)【2】然后利用“轉(zhuǎn)換” | “計(jì)算變量”

10、,打開(kāi)“計(jì)算變量”對(duì)話框,在“目標(biāo)變量” 文本框中輸入“ Fi”,然后在數(shù)字表達(dá)式中輸入“ V/SQR(入1)” 注:入1=1.897,即可得到 特征向量【3】然后利用“轉(zhuǎn)換” | “計(jì)算變量”,打開(kāi)“計(jì)算變量”對(duì)話框,在“目標(biāo)變量” 文本框中輸入“ F2”,然后在數(shù)字表達(dá)式中輸入“ WSQR(入2)” 注:入1=1.550,即可得到 特征向量F2;【4】最后得到特征向量矩陣(主成分表達(dá)式的系數(shù))。所做工作:a.成分矩陣或者初始因子載荷矩陣( Component Matrix )初始因子載荷矩陣見(jiàn)上圖,通過(guò)初始因子載荷矩陣還不能得出主成分的表達(dá)式, 還需要把初始因子載荷矩陣中的每列的系數(shù)(主成

11、分的載荷)除以其相應(yīng)主成分的特 征根的平方根后才能得到主成分系數(shù)向量(主成分的得出系數(shù)); 所的結(jié)論:1. 用于計(jì)算主成分表達(dá)式系數(shù)的初始因子載荷矩陣中每個(gè)指標(biāo)的載荷。2. 計(jì)算后,得到的主成分表達(dá)式的系數(shù)矩陣。1. 主成分表達(dá)式的系數(shù)提取出來(lái)的全部主成分可以基本反映全部指標(biāo)的信息,但這些新變量(主成分)的表達(dá)卻不能從輸出窗口中直接得到,即:主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù)不是初始因子載荷矩陣中的對(duì)應(yīng)指標(biāo)的載荷,因?yàn)椤癈omponent Matrix ”是指初始因子載荷矩陣,每一個(gè)載荷量表示主成分與對(duì)應(yīng)變量的相關(guān)系數(shù)。2. 主成分表達(dá)式系數(shù)的計(jì)算方法初始因子載荷矩陣或主成分載荷矩陣(Comp on

12、ent Matrix)中的數(shù)據(jù)除以主成分相對(duì)應(yīng)的特征根(或特征值)開(kāi)平方根便得到兩個(gè)主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù)。Fi=Vi/SQR(入 1)3. 主成分的指標(biāo)劃分與命名初始因子載荷矩陣或主成分載荷矩陣(Comp onent Matrix)中每列表示相應(yīng)主成分與對(duì)應(yīng)變量的相關(guān)系數(shù),每個(gè)主成分所反映的原始指標(biāo)各有不同,為進(jìn)一步明確每個(gè) 主成分側(cè)重反應(yīng)的具體原始指標(biāo),需要對(duì)原始指標(biāo)在每個(gè)主成分上的載荷進(jìn)行比較, 其中載荷越大,其對(duì)應(yīng)的主成分反映該原始指標(biāo)的信息量越大,反之亦然;如果某一 原始指標(biāo)在幾個(gè)主成分的載荷絕對(duì)值不相上下,歸類比較含混,導(dǎo)致主成分的原始指 標(biāo)劃分不清。說(shuō)明有必要作進(jìn)一步的因子

13、分析。從Component Matrix即主成分載荷表中可以看出,哪一原始指標(biāo)在哪一主成分上載荷絕對(duì)值較大,亦即與該主成分的相關(guān)系數(shù)較高【注:相關(guān)分為正負(fù)相關(guān)】。第五,計(jì)算主成分得分矩陣(主成分得分)【1】將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù).相乘,然后就可以得出主成分函數(shù)的表達(dá) 式;Zi= F ii*zXi+ F 12*7X2+ F ia*zXa+ F i4*zX4Z2= F 2i*zX 計(jì) F 22*zX2+ F 23*zX3+ F 24*zX4?(其中,zXi 為標(biāo)準(zhǔn)化后的數(shù)據(jù))【2】然后利用“轉(zhuǎn)換” | “計(jì)算變量”,打開(kāi)“計(jì)算變量”對(duì)話框,在“目標(biāo)變量”文本框中輸入“乙”,然后在數(shù)字表達(dá)

14、式中輸入“ 0.531* Z (銷售凈利率)+0.594*Z (資產(chǎn)凈利率)+0.261*Z(凈資產(chǎn)收益率)+0.546*Z(銷售毛利率)”注:F 1=0.531,0.594,0.261,0.546,即可得到特征向量 Zi;【3】同理注:F2=-0.412,0.404,0.720,-0.383,可得到特征向量乙;【4】求出16家上市公司的主成分值。所做工作:a.對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù);所的結(jié)論:1.用于計(jì)算主成分表達(dá)式系數(shù)的初始因子載荷矩陣中每個(gè)指標(biāo)的載荷。1.特征向量矩陣載荷的用運(yùn)Zi= F ii*zXi+ F i2*zX2+ F i3*zX3+ F i4*zX4乙=F2i*

15、zXi+ F22*zX2+ F23*zX3+ F24*zX4?(其中,zXi 為標(biāo)準(zhǔn)化后的數(shù)據(jù))第六,最后利用主成分函數(shù)、綜合主成分公式:【1】將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分表達(dá)式;Z=ri*Zi+r 2*Z2【2】然后利用“轉(zhuǎn)換” | “計(jì)算變量”,打開(kāi)“計(jì)算變量”對(duì)話框,在“目標(biāo)變量” 文本框中輸入“Z”,然后在數(shù)字表達(dá)式中輸入“ri*Zi+r2*Z2” 注:r 1=0.47429,2=0.3874, 即可得到綜合主成分;【3】綜合主成分(贏利能力)值。所做工作:a.對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù);所的結(jié)論:1.用于計(jì)算主成分表達(dá)式系數(shù)的初始因子載荷矩陣中每個(gè)指標(biāo)的載荷。、/1. 、/ : 注意:1.綜合主成分得分的計(jì)算方法Z=ri*Zi+r2*Z2(Z:綜合主成分得分;:主成分貢獻(xiàn)率;乙:主成分i得分)表5.主成分、綜合主成分(贏利能力)值公司Z1Z2Z煙臺(tái)萬(wàn)1.211.461.14華1.161.461.12五糧液1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論