因子分析例題_第1頁
因子分析例題_第2頁
因子分析例題_第3頁
因子分析例題_第4頁
因子分析例題_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

因子分析因子分析(FactorAnalysis)是主成分分析的推廣,它也是從研究相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯綜復雜關(guān)系的變量歸結(jié)為少數(shù)幾個綜合變量的一種多變量統(tǒng)計分析方法。第一節(jié)因子分析的基本思想首先我們看下面兩個實際例子:例1.例1.某企業(yè)招聘人才,對每位應聘者進行外貌、申請書的形式、專業(yè)能力、討人喜歡的能力、自信心、洞察力、誠實、推銷本領(lǐng)、經(jīng)驗、積極性、抱負、理解能力、潛在能力、實際能力、適應性等15個方面的考核。這15個方面可歸結(jié)為應聘者的外露能力、討人喜歡的能力、經(jīng)驗、專業(yè)能力4個方面,每一方面稱之為一個公共因子。企業(yè)可根據(jù)這4個公共因子的情況來衡量應聘者的綜合水平。例2.例2.在企業(yè)經(jīng)濟效益的評價中,有經(jīng)濟效益的指標體系。通常這個指標體系有八項指標:固定資產(chǎn)利稅率、資金利稅率、銷售收入利稅率、資金利稅率、固定資產(chǎn)產(chǎn)值率、流動資金周轉(zhuǎn)天數(shù)、萬元產(chǎn)值能耗、全員勞動生產(chǎn)率等。這八項指標可概括為盈利能力、資金和人力利用、產(chǎn)值能耗三個方面。這三個方面在企業(yè)的生產(chǎn)經(jīng)營活動中為主要因子,起著支配作用,企業(yè)要提高經(jīng)濟效益就要在這三個公共因子方面下功夫。因子分析的基本思想:是通過變量(或樣品)的相關(guān)系數(shù)矩陣(對樣品是相似系數(shù)矩陣)內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量(或樣品)的少數(shù)幾個隨機變量去描述多個變量(或樣品)之間的相關(guān)(相似)關(guān)系,但在這里,這少數(shù)幾個隨機變量是不可觀測的,通常稱為因子。因子分析分為兩類,即R型因子分析(對變量作因子分析),Q型因子分析(對樣品作因子分析)。第二節(jié)第二節(jié)因子分析的數(shù)學模型1.模型(R型)x=(X,X,…,x)為觀察到的隨機向量,F(xiàn)=(F,F,…,F)是不可觀測的向量設(shè)有即其12p/習夕A'J口JpXl/|/L早,12mIJ夕口JIF早。設(shè)有即其中£=(£i,…,£p)‘稱作誤差或特殊因子。m<m<pcov(F,£)=0,1)2)3)var(F)=I,var(£)=diag(bj-.q2)稱F.為第i個公共因子,aj為因子載荷。因子分析與主成分的關(guān)系:

3)聯(lián)系:兩者都可以看作逼近協(xié)方差矩陣£。差別:主成分分析的數(shù)學模型是一種變換,因子分析模型是描述X的協(xié)方差£的結(jié)構(gòu)的一種模型。其次,主成分中%.唯一確定,但因子分析中,每個因子的系數(shù)不是唯一的。與多變量回歸分析不同,此處的“自變量”F是不可觀測的。公共因子:因子載荷和變量共同度的統(tǒng)計意義。假定因子模型中,所有變量和因子都已標準化。(1)因子載荷的統(tǒng)計意義設(shè)x=aF+—FaF+si=1,…,pTOC\o"1-5"\h\zii11inm由于Fk,Fj不相關(guān),且r(F代1即E(xF)=£aE(FF)=£ar=aikkjik(FF)ij由于Fk,Fj不相關(guān),且r(F代1即(i=1,(i=1,—,p)稱作變量氣的共同度:a2var(F)+b2=£a2+b2=h2+q2

ijjiijiiij=1即1="2即共同度是公共因子所占的X的方差,其共同度越大,說明公共因子var(x)=^Evar(aF)+var(s)=£iijjij=1包含的七的信息就越多。公共因子f.的方差貢獻的統(tǒng)計意義因子載荷矩陣中列的平方和。稱。為公共因子F}對七的貢獻,是衡量公共因子相對重要性的指標。第三節(jié)第三節(jié)因子載荷的估計方法這是常用的主成分法,設(shè)隨機向量X=(x1,…,的協(xié)方差為£,£的特征值為人Z人>…>X>0其相應的特征向量為e,e,…e,(標準正交基)則.12p12p當公共因子F?有P個時,特殊因子為0,所以,X=AFA為因子載荷陣。因此,D(X)=var(AF)=Avar(F)4=AA,所以,£=AA',因此,A為/-,:^e,—,、入eA=(「人e,?—,、'*e)(111\pp),所以,11Vp/所以第j列因子載何為第j個主成分七與(廠的乘積。所以稱為主成分法。當最后p-m個特征根很小時,去掉1虧,+1,…-"此時,A=(孫1。1,…習m),方差£=AA'+£=(匕:仇e,—e*e)(\快e',—,(入eD'+diaQ(c2,—,c2)S11mm*11'mmag1p另外,當£未知時,用樣本協(xié)方差,代替£,或樣本相關(guān)陣R代替。一般設(shè)小、..八八X1>…>七為樣本相關(guān)陣R的特征根,相應的標準正交化特征向量為e1,…,ep。設(shè)人-/-匚刀~-必p,則因子載荷陣的估計為A=(%)即A=(『1匕,…*mem)

第四節(jié)第四節(jié)因子旋轉(zhuǎn)建立因子分析數(shù)學模型的目的不僅是為了找出公共因子,更重要的是要知道每個公共因子的意義,以便對實際問題進行分析。如果每個公共因子的涵義不清,不便于對實際背景進行解釋,這時根據(jù)因子載荷陣的不唯一性,可對因子載荷陣實行旋轉(zhuǎn),即用一個正交陣右乘使旋轉(zhuǎn)后的因子載荷陣結(jié)構(gòu)簡化,便于對公共因子進行解釋。所謂結(jié)構(gòu)簡化就是使每個變量僅在一個公共因子上有較大的載荷,而在其余公共因子上的載荷比較小。這種變換因子載荷的方法稱為因子旋轉(zhuǎn)。因子旋轉(zhuǎn)有方差最大正交旋轉(zhuǎn)和斜交旋轉(zhuǎn),此處只介紹方差最大正交旋轉(zhuǎn)。先考慮兩個因子的平面正交旋轉(zhuǎn),設(shè)因子載荷矩陣為:(aa)1112A=aa::aaIplp2^r=,'cos甲^sin甲-sin甲'cos甲/r為正交矩陣。A%b—..—??(*)bbXplp2/這樣做目的是希望所得結(jié)果能使載荷矩陣的每一列元素按其平方值說或者盡(*)可能大或者盡可能小,即向1和0兩極分化,或者說因子的貢獻越分散越好。這實際上是希望將變量%,%2,…,七分成兩部分,一部分主要與第一因子有關(guān),另一部分主要與第二因子有關(guān),這也就是要求(?,...,""'^22)這兩組數(shù)據(jù)的方差要盡可能地大,考慮各列的相對方差這里取bJ是為了消除符號不同的影響,除以h2是為了消除各個變量對公共因子依賴程度不同的影響?,F(xiàn)在要求總的方差達到最大,即要求使G=匕+匕達到最大值,于是考慮G對中的導數(shù),求出最大值。如果公共因子多于2個,我們可以逐次對每2個進行上述的旋轉(zhuǎn),當公共因子數(shù)m>2時,可以每次取2個,全部配對旋轉(zhuǎn),旋轉(zhuǎn)時總是對A陣中第a列、P列兩列進行,此時公式(*)中只需將aji―aa,aj2―?七就行了。因此共需進行次旋轉(zhuǎn),但是旋轉(zhuǎn)完畢后,并不能認為就已經(jīng)達到目的,還可以重新開始,進行第二輪Cm2次配對旋轉(zhuǎn)。依次進行,可以是總的方差越來越大,直到收斂到某一極限。例:考察我國各省市社會發(fā)展綜合狀況一、一、運用方法:多元統(tǒng)計一因子分析因子分析的基本思想:通過變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能夠控制所有變量的少數(shù)幾個隨機變量的少數(shù)幾個隨機變量去描述多個變量之間的相關(guān)關(guān)系,但在這里,這少數(shù).幾個隨機變量是不可觀測的,通常稱為因子。然后根據(jù)相關(guān)性的大小把變量分組,只得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量相關(guān)性較低。二、二、因子分析方法的計算步驟:第一步:將原始數(shù)據(jù)標準化。第二步:建立變量的相關(guān)系數(shù)R。第三步:求R的特征根極其相應的單位特征向量。第四步:對因子載荷陣施行最大正交旋轉(zhuǎn)。第五步:計算因子得分。以下是我國各省市綜合發(fā)展情況做因子分析。數(shù)據(jù)表中選取了六個指標分別是:人均GDP(元)X1,新增固定資產(chǎn)(億元)X2,城鎮(zhèn)居民人均年可支配收入(元)X3,農(nóng)村居民機家庭純收入(元)X4,高等學校數(shù)量(所)X5,衛(wèi)生機構(gòu)數(shù)量(所)X6。原始數(shù)據(jù)見下表:地區(qū)人均gdp新增資產(chǎn)城鎮(zhèn)人均農(nóng)村人均高校數(shù)量衛(wèi)生機構(gòu)北京1026530.8162353223654955天津816449.1349292406213182河北337677.76392116684710266山西281933.9733051206265922內(nèi)蒙古301354.5128631208194915遼寧6103124.0237061756616719吉林370328.6531741609433891黑龍江442748.5133751766387637上海15204128.9371914245455286江蘇5785101.09463424566712039浙江614941.8862212966378721安徽252155.7437951302356593福建538618.3545062048304537江西237626.2833761537315423山東4473102.54426417154810463河南247571.3632991231507661湖北334137.7542081511569744湖南270143.0146991425479137廣東638051.8274382699428848廣西277232.5247911446275571海南48025.354770151951653四川251680.97400211586418885貴州155322.0739311086223934云南249048.4840851010266395陜西234426.313309962466215甘肅192514.843152880174131青海29104.163319102971176寧夏26857.94338299871028新疆393526.6541631136213932數(shù)據(jù)來源《中國統(tǒng)計年鑒》1、將原始數(shù)據(jù)標準化2、建立六個指標的相關(guān)系數(shù)陣R3、共因子方差4、總方差解建立因子載荷陣:5、建立因子載荷陣:由于前三個特征值的累計貢獻率已達93.505%,所以取前三個特征值建立因子載荷陣如下:6、對因子載荷陣施行方差最大旋轉(zhuǎn),旋轉(zhuǎn)后得正交因子表矩陣如下:由此有:X1=0.947F1+0.178F2-0.115F3X2=0.940F1+0.105F2+0.261F3X3=0.893F1-0.0747F2+0.404F3X4=0.0364F

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論