多元統(tǒng)計(jì)-因子_第1頁
多元統(tǒng)計(jì)-因子_第2頁
多元統(tǒng)計(jì)-因子_第3頁
多元統(tǒng)計(jì)-因子_第4頁
多元統(tǒng)計(jì)-因子_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析返回返回3.1.1 3.1.1 引引 例例3.1.2 3.1.2 因子分析的基本思想因子分析的基本思想3.1.3 3.1.3 與主成分分析的區(qū)別與主成分分析的區(qū)別2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析百貨商場(chǎng)的形象。,并解釋分析,變量來描述原始可測(cè)的相關(guān)和一個(gè)特殊因子也稱為潛因子),的公共因子個(gè)不可觀測(cè)的相互獨(dú)立用這pimimimiiiFFFaFaFampi112211(), 1( 3.1.1 引 例2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)

2、院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.1.2 因子分析的基本思想 因子分析(factor analysis)是一種數(shù)據(jù)簡化的技術(shù)。它是通過尋找眾多變量的公共因素來簡化變量中存在的復(fù)雜關(guān)系的一種方法。它將多個(gè)變量綜合為少數(shù)幾個(gè)“因子”(假想變量),以再現(xiàn)原始變量與“因子”之間的相互關(guān)系。這幾個(gè)因子能夠反映原來眾多變量的主要信息。原始的變量是可觀測(cè)的顯在變量,而因子是不可觀測(cè)的潛在變量。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 通過因子分析得來的新變量是對(duì)每一個(gè)原始變量進(jìn)行內(nèi)

3、部剖析,打比喻來說,原始變量就如成千上萬的糕點(diǎn),每一種糕點(diǎn)的原料都有面粉、油、糖及相應(yīng)的不同原料,這其中,面粉、油、糖是所有糕點(diǎn)的共同材料,正如因子分析中的新變量即因子變量, 正確選擇因子變量后,如果想考慮成千上萬糕點(diǎn)的物價(jià)變動(dòng),只需重點(diǎn)考慮面粉、油、糖等共因子的物價(jià)變動(dòng)即可。 3.1.2 因子分析的基本思想 所以因子分析不是對(duì)原始變量的重新組合,而是對(duì)原始變量進(jìn)行分解,分解為公共因子與特殊因子兩部分。即因子分析就是要利用少數(shù)幾個(gè)公共因子去解釋較多個(gè)要觀測(cè)變量中存在的復(fù)雜關(guān)系,它把原始變量分解為兩部分因素,一部分是由所有變量共同具有的少數(shù)幾個(gè)公共因子構(gòu)成的,另一部分是每個(gè)原始變量獨(dú)自具有的因素

4、,即特殊因子。 2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.1.2 因子分析的基本思想 因子分析分為兩類,即R型因子分析(對(duì)變量作因子分析),Q型因子分析(對(duì)樣品作因子分析)。這兩種因子分析的處理方法一樣,只是出發(fā)點(diǎn)不同, R型從變量的相關(guān)陣出發(fā), Q型從樣品相似陣出發(fā)。 對(duì)一批觀測(cè)數(shù)據(jù),可以根據(jù)實(shí)際問題的要求來決定采用哪一種類型的因子分析。本章主要介紹R型因子分析。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 因子分析(Factor Ana

5、lysis)是主成分分析的推廣,它也是利用降維的思想,從研究原始變量相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合變量(因子)的一種多變量統(tǒng)計(jì)分析方法。 相對(duì)于主成分分析,因子分析更傾向于描述原始變量之間的相關(guān)關(guān)系;因此,因子分析的出發(fā)點(diǎn)是原始變量的相關(guān)矩陣。 3.1.2 因子分析的基本思想2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 主成分分析分析與因子分析不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。 主成分分析:原始變量的線性組合表示新的綜合變量,即主成分; 因子分析:潛在

6、的假想變量和隨機(jī)影響變量的線性組合表示原始變量。3.1.3 與主成分分析的區(qū)別2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 因子分析與主成分分析的區(qū)別因子分析與主成分分析的區(qū)別(參見主成分分析與因子分析的異同比較及應(yīng)用): 1、主成分分析不能作為一個(gè)模型來描述,它只是通常的變量變換;而因子分析需要構(gòu)造因子模型。 2、主成分分析中主成分的個(gè)數(shù)和變量的個(gè)數(shù)P相同,它是將一組具有相關(guān)性的變量變換為一組獨(dú)立的變量(注意應(yīng)用主成分分析解決實(shí)際問題時(shí),一般只選取前m(mp)個(gè)主成分;而因子分析的目的是要用盡可能少的公因子,以便構(gòu)造一

7、個(gè)結(jié)構(gòu)簡單的因子模型。 3、主成分分析是將主成分表示為可觀測(cè)的原變量的線性組合;而因子分析是將原始變量表示為公因子和特殊因子的線性組合。 另一方面,這兩種分析方法之間在某些情況下也有一定聯(lián)系,我們將從下面的介紹中看到。3.1.3 與主成分分析的區(qū)別2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析3.1.3 與主成分分析的區(qū)別 因子分析與回歸分析不同,因子分析中的因子是一個(gè)比較抽象的概念,而回歸因子有非常明確的實(shí)際意義。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多

8、元統(tǒng)計(jì)分析 3.1.2 因子分析的基本思想這些綜合指標(biāo)稱為因子變量,是原變量的重新組構(gòu);個(gè)數(shù)遠(yuǎn)遠(yuǎn)少于原變量個(gè)數(shù),但可反映原變量的絕大部分方差;不相關(guān)性,對(duì)因子變量的分析能夠?yàn)檠芯抗ぷ魈峁┹^大的便利;因子變量具有可命名解釋性;2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 因子分析把每個(gè)原始變量分解成兩個(gè)部分:一部分是由所有變量共同具有的少數(shù)幾個(gè)因子構(gòu)成的,即所謂公共因素部分;另一部分是每個(gè)變量獨(dú)自具有的因素,即所謂獨(dú)特因素部分。 設(shè) 為觀察到的隨機(jī)向量, 是不可觀測(cè)的向量(m應(yīng)小于p)。于是:),(21mFFFF 3.2.

9、1 初始因子模型(R型)p,212007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析相等。與相關(guān)陣且協(xié)方差陣,協(xié)方差矩陣)(均值向量是可觀測(cè)隨機(jī)變量,且、REp,)cov(0,121)。,且方差皆為是相互獨(dú)立的(不相關(guān)各分量即向量,協(xié)方差矩陣)(值向量均是不可觀測(cè)的變量,其,、1,)cov(0,221FIFFEpmFFFFm 3.2.1 初始因子模型(R型)則模型:獨(dú)立的,的各分量之間也是相互是對(duì)角陣,說明的協(xié)方差陣,)(且相互獨(dú)立,與,、0, 0),cov(321EFFp2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一

10、下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 因子模型的一般表達(dá)形式:Xi=ai1F1+ai2F2+aimFm+ i( i=1, ,p)pmpm2p21p1p2m2m22212121m1m2121111FaFaFaxFaFaFaxFaFaFax 3.2.1 初始因子模型(R型)2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 也可以矩陣的形式表示為:X=AF+ 式中Xi(i=1,2,m)和Fj(j=1,2,p)都是標(biāo)準(zhǔn)化變量。 pmpmppmmpFFFaaaaaaaaa212121222211121121

11、3.2.1 初始因子模型(R型)或:2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析aaaaaaaaapmppmm212222111211pmpFFF,111,其中系數(shù)矩陣。是待估的pmpmppmmpFFFaaaaaaaaa2121212222111211212007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 1、因子模型中F l,F(xiàn) 2,F(xiàn) m叫做因子變量或公(共)因子(潛因子)(Common factors),它們是在各個(gè)原觀測(cè)變量 Xi 的表達(dá)式中共同

12、出現(xiàn)的因子(是各個(gè)原觀測(cè)變量所共有的因子)。 可理解為原始變量共同具有的公共因素,每個(gè)公因子 Fj (j=1, ,m)假定至少對(duì)兩個(gè)原始變量有作用(有貢獻(xiàn)),否則它將歸入特殊因子。 3.2.2 因子分析的幾個(gè)相關(guān)概念2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 公因子是相互獨(dú)立的不可觀測(cè)的理論變量(之所以稱其為因子,是因?yàn)樗遣豢捎^測(cè)的,即不是具體的變量,與聚類分析不同)。公共因子的含義,必須結(jié)合具體問題的實(shí)際意義而定。 3.2.2 因子分析的幾個(gè)相關(guān)概念2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專

13、業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.2.2 因子分析的幾個(gè)相關(guān)概念 2、 (i=1,2,p)叫做特殊因子(Unique factor),是向量X的分量 Xi (i=1,,P)所特有的因子。i 每個(gè)特殊因子 僅僅出現(xiàn)在與之相應(yīng)的第 i 個(gè)原始變量Xi 的表達(dá)式中,它只對(duì)這個(gè)原始變量有作用,表示該變量不能被公因子所解釋的部分。相當(dāng)于回歸分析中的殘差項(xiàng)。i2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.2.2 因子分析的幾個(gè)相關(guān)概念 3、模型中的矩陣A=(aij)中的元素aij稱為因子載荷(factor

14、 loadings),它是第i個(gè)變量在第j個(gè)公因子上的負(fù)載(或者叫做第i個(gè)變量在第j個(gè)主因子上的權(quán)) ,在各公共因子不相關(guān)的前提下,因子載荷aij就是第 i 個(gè)原有變量與第 j 個(gè)公共因子的相關(guān)系數(shù)。 AFEFFAEFAFEFEFEFEEF)()()()()()(),cov(aFxijjijijiFxFxr),cov()var()var(),cov( 因子載荷aij表示 Xi 依賴 Fj 的程度(比重)(心理學(xué)家將它稱為載荷) ,反映了第i 個(gè)原有變量在第 j 個(gè)公共因子上的相對(duì)重要性。因此, aij 的絕對(duì)值越大,則公共因子Fj 與原有變量Xi 的關(guān)系越強(qiáng)?;蚍Q公共因子Fj 對(duì)于Xi 的載荷

15、量大,矩陣A稱為因子載荷矩陣。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 例:五個(gè)觀測(cè)變量,兩個(gè)公因子的模型: X1=0.9562F1+0.2012F2+0.2126 1 X2=0.8735F1+0.2896F2+0.3913 2 X3=0.1744F1+0.8972F2+0.40573 X4=0.5675F1+0.7586F2+0.32024 X5=0.8562F1+0.3315F2+0.39625 可看出,公因子F1與變量 X1,X2,X4,X5關(guān)系密切,它主要代表了這些變量的信息;公因子 F2 與變量 X3,X4

16、 關(guān)系密切,它主要代表了這兩個(gè)變量的信息。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 變量的方差由兩部分組成,一部分由公因子決定,一部分由特殊因子決定。), 1(), 1()()()()()(22122122222122221212211pipiVVarVarVarVariiiimjijimiimiiimimiiiimimiiihahFFaaaFaFaFaFaFaFa于是令相互獨(dú)立),因 3.2.2 因子分析的幾個(gè)相關(guān)概念 Xi標(biāo)準(zhǔn)化后 2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)

17、專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析aaaaaaaaapmppmm212222111211 h12=a112+a122+a1m2 h22=a212+a222+a2m2 hp2=ap12+ap22+apm2mjijiah122 3.2.2 因子分析的幾個(gè)相關(guān)概念2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 A的行元素平方和(因子載荷陣中第 i行元素的平方和)。反映了 Xi 對(duì)公共因子的共同依賴程度,它的意義在于說明如果用公因子替代原觀測(cè)變量后,原來每個(gè)變量的信息被保留的程度。故被稱為變量 Xi 的共同度。 3.2.2 因子

18、分析的幾個(gè)相關(guān)概念2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 公因子方差 表示了變量方差中能被公因子所解釋的部分(即反映了全部公因子對(duì)變量Xi 的影響,是全部公因子對(duì)Xi 的方差所做出的貢獻(xiàn)公因子對(duì)變量Xi 的方差貢獻(xiàn)),公因子方差越大,變量能被公因子說明的程度越高( 越接近1,說明公共因子已經(jīng)解釋說明了原有變量 Xi 的幾乎全部信息)。hi2hi2 3.2.2 因子分析的幾個(gè)相關(guān)概念2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.2.2 因子

19、分析的幾個(gè)相關(guān)概念 特殊因子的方差,反映了原有變量方差中無法被公共因子描述的比例。僅與變量 Xi 本身的變化有關(guān)。 2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 對(duì)于上面所舉的五個(gè)觀測(cè)變量、兩個(gè)公因子的例子,計(jì)算出每個(gè)變量的公因子方差, =0.9548,表明 F1和F2 兩 個(gè)因子解釋了變量 X1 信息量的95.48%。h21 3.2.2 因子分析的幾個(gè)相關(guān)概念2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.2.2 因子分析的幾個(gè)相關(guān)概念 因子載

20、荷矩陣A中第 j 列各元素的平方和,表示第j個(gè)公共因子 Fj 對(duì)于 X 諸分量 Xi 所提供的方差的總和。稱第j個(gè)公共因子的方差貢獻(xiàn)。是衡量公共因子相對(duì)重要性的指標(biāo)。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 S21=a112+a212+ap12 S 22=a122+a222+ap22 S2m=a1m2+a2m2+apm2aaaaaaaaapmppmm212222111211 3.2.2 因子分析的幾個(gè)相關(guān)概念 每個(gè)公因子對(duì)原始數(shù)據(jù)的解釋能力,用該因子所解釋的總方差(稱為該因子的貢獻(xiàn))來衡量,公因子 的貢獻(xiàn)等于和該因子

21、有關(guān)的因子載荷量的平方和。piijjas122(j=1, ,m)si22007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析的估計(jì)。載荷矩陣解決此問題,關(guān)鍵是求因子。要,提煉出最有影響的公我們就能夠以此為依據(jù)序,來,使相應(yīng)的貢獻(xiàn)有順的各列平方和都計(jì)算出愈大。如果把載荷矩陣的貢獻(xiàn)對(duì)愈大,恰好相反,的共同度的統(tǒng)計(jì)意義與,22221222sssFshsmjjiij 3.2.2 因子分析的幾個(gè)相關(guān)概念2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院miiaS12121miiaS12222 miippaS122ijijpjjmiiash21212

22、mSp211mSp222mSppp2 pjjmSp12pjmjmpjjpjjiahahah122122221212因子負(fù)荷矩陣的一般格式休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析3.3.1 3.3.1 因子載荷的求解因子載荷的求解3.3.2 3.3.2 求主因子解的步驟求主因子解的步驟2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 要建立某實(shí)際問題的因子分析模型,關(guān)鍵是要根據(jù)樣本數(shù)據(jù)矩陣估計(jì)載荷矩陣A(即求解初始因子主要目的是確定能夠解釋觀測(cè)變量之間相互關(guān)系的最小因子個(gè)數(shù))。根據(jù)所依據(jù)的準(zhǔn)

23、則不同,有很多種求因子解的方法。其中使用最為普遍的方法是主成分法。 3.3.1 因子載荷的求解2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析設(shè)隨機(jī)向量的協(xié)差陣為。為的特征根,標(biāo)準(zhǔn)正交化特征向量(只要特征根不等,對(duì)應(yīng)的單位特征向量一定是正交的),則根據(jù)線性代數(shù)知識(shí)分解為:為對(duì)應(yīng)的 3.3.1 因子載荷的求解,21puuu2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析pppppiiiiPuuuuuuUUuu2211221111, 00 , 上面的分解式恰是

24、公共因子與變量個(gè)數(shù)一樣多且特殊因子的方差為0時(shí),因子模型中協(xié)差陣的結(jié)構(gòu)。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析因?yàn)檫@時(shí)因子模型為:其中,所以:即對(duì)照的分解式,則因子載荷陣A的第列應(yīng)該是也就是說除常數(shù):外,第列 因子載荷恰是第成分個(gè)主的系數(shù),故稱為主成分法。 3.3.1 因子載荷的求解ujjuj2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 上邊給出的表達(dá)式是精確的,但實(shí)際應(yīng)用時(shí)總是希望公共因子個(gè)數(shù)小于變量的個(gè)數(shù)即 mp ,當(dāng)最后pm個(gè)特征根較小

25、時(shí),通常是略去最后pm項(xiàng)對(duì)的貢獻(xiàn),于是得到: 3.3.1 因子載荷的求解ppmmuu,112007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 上式是假定了因子模型中特殊因子是不重要的,因而從的分解中忽略掉特殊因子的方差。如果考慮了特殊因子以后,協(xié)差陣為: 3.3.1 因子載荷的求解mmmmuuuuuu221122112007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 當(dāng)未知,可用樣本協(xié)差陣S去代替,要經(jīng)過標(biāo)準(zhǔn)化處理,則S與相關(guān)陣R相同,仍然可作上面類似的表示。

26、 3.3.1 因子載荷的求解22122112211, 00 ,Pmmmmuuuuuu2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析則因子載荷陣的估計(jì)為:一般設(shè)為樣本相關(guān)陣R的特征根,相應(yīng)的標(biāo)準(zhǔn)正交化特征向量為;設(shè) m p,即 3.3.1 因子載荷的求解,21puuuuuumm,22112007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 AFiFaaaaaaaaapppppp212222111211=pppppppppuuuuuuuuu22112222121

27、1212111 當(dāng)公共因子 有P個(gè)時(shí),特殊因子為0,所以, A為因子載荷陣。 設(shè)隨機(jī)向量 的協(xié)方差為 , 的特征值為 ,其相應(yīng)的特征向量為 (標(biāo)準(zhǔn)正交基) 則因子載荷矩陣: ),(, 1pxxX021p,21puuu2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 aaaaaaaaapmppmm212222111211=mpmppmmmmuuuuuuuuu221122221211212111 因?yàn)橐蜃虞d荷矩陣A是前m個(gè)主成分系數(shù)的倍數(shù),所以稱為主成分解。 由于因子分析的目的是減少變量個(gè)數(shù),因此,在計(jì)算因子載荷矩陣時(shí),一般不選

28、取所有特征值,而只選取前m個(gè)特征值和對(duì)應(yīng)的特征向量,得到下面的有m個(gè)公共變量的因子載荷矩陣:2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 另外,當(dāng) 未知時(shí),用樣本協(xié)方差S 代替 ,或樣本相關(guān)陣R 代替 。一般設(shè) 為樣本相關(guān)陣R 的特征根,相應(yīng)的標(biāo)準(zhǔn)正交化特征向量為 。設(shè) ,則因子載荷陣的估計(jì)為 ,即p1 uup,1pm )(ijaA ),(11mmuuA2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.4.1 因子旋轉(zhuǎn) 建立因子分析數(shù)學(xué)模型的目的不

29、僅是為了找出公共因子,更重要的是要知道每個(gè)公共因子的意義,到底代表了什么?為此就要考察各個(gè)變量 X1,X2,XP 在某個(gè)因子上的負(fù)荷,負(fù)荷絕對(duì)值大的變量顯然與該因子的聯(lián)系就更密切,可是如果因子負(fù)荷的大小相差不大,對(duì)因子的解釋可能就有困難。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 為了能更清楚地將因子與變量的關(guān)系顯現(xiàn),希望通過某種手段使每個(gè)變量在盡可能少的因子上有比較高的載荷,即:在理想狀態(tài)下,讓某個(gè)變量在某個(gè)因子上的載荷趨于1,而在其他因子上的載荷趨于0。解釋因子時(shí),這些小的載荷一般可以略去不計(jì)。 3.4.1 因子旋

30、轉(zhuǎn)2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 實(shí)現(xiàn)上述目標(biāo)的方法是對(duì)初始公因子進(jìn)行線性組合,即根據(jù)因子載荷陣的不唯一性,對(duì)因子載荷陣實(shí)行旋轉(zhuǎn),目的是通過改變坐標(biāo)軸的位置,重新分配各個(gè)因子所解釋的方差的比例,使因子結(jié)構(gòu)更簡單,更易于解釋,以期找到意義更為明確,實(shí)際意義更明顯的公因子。 3.4.1 因子旋轉(zhuǎn) 簡單的因子結(jié)構(gòu)要求: 每一列上的載荷大部分為很小的盡可能接近0的值; 每一行中只有少量的最好只有一個(gè)較大的載荷值; 每兩列中大載荷與小載荷的排列模式應(yīng)該不同。這種變換因子載荷的方法稱為因子旋轉(zhuǎn)。 2007.8安徽財(cái)經(jīng)大

31、學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析F1F1F2F2X1X2X3X4X5X6 簡單結(jié)構(gòu) 示意圖 因子旋轉(zhuǎn)有方差最大正交旋轉(zhuǎn)和斜交旋轉(zhuǎn),應(yīng)用最為普遍的是方差最大正交旋轉(zhuǎn)。兩因子的方差最大正交旋轉(zhuǎn):2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析2112112121121112112122211211cossinsincoscossinsincoscossinsincosppppppppbbbbaaaaaaaaACBCaaaaaaA2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)

32、學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 這樣做的目的是希望所得結(jié)果能使載荷矩陣的每一列元素盡可能向1和0兩極分化,即原始變量中一部分主要與第一因子有關(guān),另一部分主要與第二因子有關(guān),也就是要求 這兩組的方差盡量大。 bbbbpp2221221211, 3.4.1 因子旋轉(zhuǎn) 旋轉(zhuǎn)后變量共同度沒有改變,但公共因子的方差貢獻(xiàn)發(fā)生了變化。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.4.2 因子得分 因子分析的數(shù)學(xué)模型是將變量表示為公共因子的線性組合,由于公共因子能反映原始變量的相關(guān)關(guān)

33、系,用公共因子代表原始變量時(shí)有時(shí)更有利于描述研究對(duì)象的特征,因而往往需要反過來將公共因子表示為變量的線性組合,即因子得分函數(shù),用它來計(jì)算每個(gè)樣本的公共因子得分。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 其實(shí),在因子模型建立起來后,我們應(yīng)當(dāng)反過來考察每一個(gè)樣本。例如企業(yè)經(jīng)濟(jì)效益的因子模型建立之后,我們希望知道每個(gè)企業(yè)經(jīng)濟(jì)效益的優(yōu)劣,把諸企業(yè)劃分歸類,如哪些企業(yè)是優(yōu)等,哪些企業(yè)是中等,哪些又是差等。要解決這個(gè)問題,在統(tǒng)計(jì)模型上就需要將公共因子F用變量的線性組合來表示,也即由企業(yè)經(jīng)濟(jì)效益的八項(xiàng)指標(biāo)值來估計(jì)它的因子得分。 3

34、.4.2 因子得分2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 設(shè)公共因子F由變量x表示的線性組合為:pmpmmmppppxbxbxbFxbxbxbFxbxbxbF22112222121212121111 稱上式為因子得分函數(shù),用它可計(jì)算每個(gè)樣本的公因子得分。如果取m=2,則將每個(gè)樣品的P個(gè)變量代入上式,即可算出每個(gè)樣品的因子得分F1和F2 ,這樣就可以在二維平面上作出因子得分的散點(diǎn)圖,進(jìn)而對(duì)樣品進(jìn)行分類或?qū)栴}做更深入的研究。 3.4.2 因子得分2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干

35、課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析 3.4.2 因子得分 以每個(gè)因子的方差貢獻(xiàn)率為權(quán)數(shù),進(jìn)行加權(quán)綜合,計(jì)算出每個(gè)因子的總得分,以此排隊(duì)。的方差貢獻(xiàn)率的方差貢獻(xiàn)率的方差貢獻(xiàn)率總得分FFmmFFFF2211 因子得分多用于對(duì)樣本及變量的分類,也可用于綜合評(píng)價(jià)。2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析因子分析常常有以下四個(gè)基本步驟: (1)確認(rèn)待分析的原有變量是否適合作因子分析。 (2)構(gòu)造因子變量(求解初始因子)。 (3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性。 (4)計(jì)算因子變量得分。 3.5.1 計(jì)算步驟2007.8安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院休息一下休息一下統(tǒng)計(jì)學(xué)專業(yè)主干課程統(tǒng)計(jì)學(xué)專業(yè)主干課程多元統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論