因子分析和對(duì)應(yīng)分析_第1頁
因子分析和對(duì)應(yīng)分析_第2頁
因子分析和對(duì)應(yīng)分析_第3頁
因子分析和對(duì)應(yīng)分析_第4頁
因子分析和對(duì)應(yīng)分析_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于因子分析與對(duì)應(yīng)分析第一張,PPT共五十八頁,創(chuàng)作于2022年6月 主成分分析是將多個(gè)指標(biāo)化為少數(shù)相互無關(guān)的綜合指標(biāo)的統(tǒng)計(jì)方法,通常數(shù)學(xué)上的處理就是將原來的p個(gè)指標(biāo)做線性組合,作為新的綜合指標(biāo),記第一個(gè)綜合指標(biāo)為F1。 選取這個(gè)線性組合的原則是令F1的方差最大,稱F1為第一主成分;然后選取第二主成分F2,且F1與F2的協(xié)方差為0,類似構(gòu)造其余的主成分。主成分分析【Factor】過程對(duì)觀測(cè)量數(shù)目沒有嚴(yán)格要求第二張,PPT共五十八頁,創(chuàng)作于2022年6月第一節(jié) 因子分析【Factor】過程主成分分析的推廣和發(fā)展,對(duì)觀測(cè)量數(shù)目要求至少是變量的5倍以上,且越多越好 一、因子分析簡(jiǎn)介做什么? 因子分析

2、是多元統(tǒng)計(jì)分析中處理降維的一種統(tǒng)計(jì)方法,它主要將具有錯(cuò)綜復(fù)雜關(guān)系的變量或者樣品綜合為數(shù)量較少的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系?;舅枷耄?(1)首先,通過變量(或樣品)的相關(guān)系數(shù)矩陣(或相似系數(shù)矩陣)內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量(或樣品)的少數(shù)幾個(gè)隨機(jī)變量(常稱為因子)去描述多個(gè)變量(或樣品)之間的相關(guān)(相似)關(guān)系; (2)然后,根據(jù)相關(guān)性(或相似性)的大小把變量(或樣品)分組,使得同組內(nèi)的變量(或樣品)之間的相關(guān)性(或相似性)較高,但不同組的變量相關(guān)性(或相似性)較低。第三張,PPT共五十八頁,創(chuàng)作于2022年6月依據(jù)處理的對(duì)象不同,可以分為兩類: R型因子分析,對(duì)變量做

3、降維處理 Q型因子分析,對(duì)樣本做降維處理 R型因子分析第四張,PPT共五十八頁,創(chuàng)作于2022年6月第五張,PPT共五十八頁,創(chuàng)作于2022年6月因子分析的幾個(gè)概念:1、因子載荷第六張,PPT共五十八頁,創(chuàng)作于2022年6月2、變量共同度 第七張,PPT共五十八頁,創(chuàng)作于2022年6月3、公因子Fj的方差貢獻(xiàn) 第八張,PPT共五十八頁,創(chuàng)作于2022年6月4、因子旋轉(zhuǎn) 因子旋轉(zhuǎn)的目的是為了使得因子載荷陣的結(jié)構(gòu)簡(jiǎn)化,便于對(duì)公共因子進(jìn)行解釋。 這里所謂的結(jié)構(gòu)簡(jiǎn)化是使每個(gè)變量?jī)H在一個(gè)公共因子上有較大的載荷,而在其余公共因子上載荷比較小。 這種變換因子載荷陣的方法稱為因子軸的旋轉(zhuǎn)。旋轉(zhuǎn)的方法有很多種,

4、如正交旋轉(zhuǎn),斜交旋軸等。 第九張,PPT共五十八頁,創(chuàng)作于2022年6月5、因子得分第十張,PPT共五十八頁,創(chuàng)作于2022年6月因子分析的一般步驟第十一張,PPT共五十八頁,創(chuàng)作于2022年6月二、引例(練習(xí)一)例1 利用因子分析過程分析各個(gè)城市的市政設(shè)施建設(shè)情況。數(shù)據(jù)文件:“各地區(qū)城市市政設(shè)施.sav”,下表是部分?jǐn)?shù)據(jù)。第十二張,PPT共五十八頁,創(chuàng)作于2022年6月【Analyze】/【Data Reduction】/【Factor】要求:選入分析變量(因子分析的變量)(定義記錄旋轉(zhuǎn)條件)第十三張,PPT共五十八頁,創(chuàng)作于2022年6月要求:輸出相關(guān)系數(shù)矩陣;進(jìn)行因子分析適用條件的檢驗(yàn)D

5、escriptives:選擇需要輸出的統(tǒng)計(jì)量(統(tǒng)計(jì)量)單變量描述統(tǒng)計(jì)量:各分析變量的均值、標(biāo)準(zhǔn)差及觀測(cè)數(shù)原始分析結(jié)果:原變量的公因子方差、與變量相同個(gè)數(shù)的因子、各因子的特征根及其所占總方差的百分比和累計(jì)百分比(相關(guān)矩陣)所有變量間的相關(guān)系數(shù)矩陣顯著性水平相關(guān)系數(shù)矩陣的行列式值KMO 檢驗(yàn)和Bartlett球形檢驗(yàn)相關(guān)系數(shù)矩陣的逆矩陣再生相關(guān)系數(shù)矩陣反映像協(xié)方差陣和相關(guān)陣第十四張,PPT共五十八頁,創(chuàng)作于2022年6月要求:輸出碎石圖Extraction:選擇因子提取的方法(選擇公共因子的提取方法)公共因子的提取方法:(1)主成分分析法(默認(rèn));(2)不加權(quán)最小二乘法;(3)廣義最小二乘法;(4

6、)極大似然法;(5)主軸因子法;(6) 因子法;(7)影像因子法相關(guān)矩陣協(xié)方差矩陣(設(shè)定公共因子提取標(biāo)準(zhǔn))顯示未經(jīng)旋轉(zhuǎn)變換的因子提取結(jié)果顯示碎石圖,體現(xiàn)各因子重要程度自定義提取因子的數(shù)量以特征根大于指定數(shù)值為提取標(biāo)準(zhǔn)(收斂時(shí)的最大迭代次數(shù))第十五張,PPT共五十八頁,創(chuàng)作于2022年6月Rotation:選擇因子旋轉(zhuǎn)的方法方差最大化正交旋轉(zhuǎn)斜交旋轉(zhuǎn)法四分旋轉(zhuǎn)法平均正交旋轉(zhuǎn)法斜交旋轉(zhuǎn)法(設(shè)置旋轉(zhuǎn)解的輸出)(因子旋轉(zhuǎn)的方法)輸出主成分轉(zhuǎn)換矩陣輸出二維或三維的因子載荷圖第十六張,PPT共五十八頁,創(chuàng)作于2022年6月要求:輸出因子得分系數(shù)矩陣Factor Scores:因子得分(在數(shù)據(jù)文件中建立一個(gè)

7、新變量,用于保存各觀測(cè)量的因子得分)(因子得分計(jì)算方法)回歸法巴特列特法安德森-魯賓法(輸出因子得分系數(shù)矩陣及因子協(xié)方差矩陣)第十七張,PPT共五十八頁,創(chuàng)作于2022年6月要求:用均值代替缺失值Options對(duì)話框(選擇缺失值處理方法)(選擇系數(shù)的輸出方式)因子載荷矩陣和結(jié)構(gòu)矩陣按數(shù)值大小排序不顯示絕對(duì)值小于指定數(shù)的載荷系數(shù)第十八張,PPT共五十八頁,創(chuàng)作于2022年6月變量間相關(guān)性很高結(jié)果解讀:1、相關(guān)系數(shù)矩陣表第十九張,PPT共五十八頁,創(chuàng)作于2022年6月接近0.9,適合做因子分析拒絕原假設(shè),認(rèn)為各變量之間不獨(dú)立 2、 KMO檢驗(yàn)和Bartlett球形檢驗(yàn)結(jié)果表 注: KMO檢驗(yàn)用于檢

8、驗(yàn)變量間的偏相關(guān)系數(shù)是否過小,一般, KMO大于0.9時(shí)效果最佳,小于0.5時(shí)不適宜做因子分析。 Bartlett球形檢驗(yàn)用于檢驗(yàn)相關(guān)系數(shù)矩陣是否是單位陣,如果結(jié)論是不拒絕該假設(shè),則表示各個(gè)變量都是各自獨(dú)立的。第二十張,PPT共五十八頁,創(chuàng)作于2022年6月該變量95.4的信息已經(jīng)被提取 3、變量共同度表給出了提取公共因子前后各變量的共同度(衡量公共因子的相對(duì)重要性指標(biāo))說明:比如變量X1的共同度位0.954,即提取的公共因子對(duì)變量X1的方差做出了95.4%的貢獻(xiàn)。第二十一張,PPT共五十八頁,創(chuàng)作于2022年6月 4、主成分表列出了所有的主成分,且按照特征根從大到小次序排列。說明:第一主成分

9、特征根為5.280,方差貢獻(xiàn)率為88.001%,前兩個(gè)主成分的累計(jì)貢獻(xiàn)率為94.504%,根據(jù)提取因子的條件特征值大于1,本例只選出一個(gè)因子。第二十二張,PPT共五十八頁,創(chuàng)作于2022年6月提取一個(gè)主成分即可5、碎石圖按照特征根大小排列的主成分散點(diǎn)圖??v坐標(biāo)為特征值,橫坐標(biāo)為因子數(shù)。第二十三張,PPT共五十八頁,創(chuàng)作于2022年6月 6、因子負(fù)荷矩陣用來反映各個(gè)變量的變異主要由哪些因子解釋。第二十四張,PPT共五十八頁,創(chuàng)作于2022年6月 7、因子得分系數(shù)矩陣得出用各個(gè)變量的線性組合表達(dá)的主成分。第二十五張,PPT共五十八頁,創(chuàng)作于2022年6月 8、因子得分的協(xié)方差矩陣反映各因子間的聯(lián)系

10、程度。注:本例只提取了一個(gè)公共因子,故表格內(nèi)容無實(shí)際意義。第二十六張,PPT共五十八頁,創(chuàng)作于2022年6月例2 利用因子分析過程分析一年內(nèi)各個(gè)城市的日照情況。數(shù)據(jù)文件:“主要城市日照數(shù).sav” ?!続nalyze】/【Data Reduction】/【Factor】要求:選入分析變量第二十七張,PPT共五十八頁,創(chuàng)作于2022年6月要求:輸出因子分析適用條件的檢驗(yàn)第二十八張,PPT共五十八頁,創(chuàng)作于2022年6月要求:輸出碎石圖第二十九張,PPT共五十八頁,創(chuàng)作于2022年6月要求:輸出因子得分系數(shù)陣第三十張,PPT共五十八頁,創(chuàng)作于2022年6月要求:采用方差最大化正交旋轉(zhuǎn);輸出因子載荷

11、圖第三十一張,PPT共五十八頁,創(chuàng)作于2022年6月結(jié)果解讀: 1、 KMO檢驗(yàn)和Bartlett球形檢驗(yàn)結(jié)果表 說明: KMO檢驗(yàn)結(jié)果為0.798,大于0.5,比較適合作因子分析; Bartlett球形檢驗(yàn)的Sig.值為0,各變量不獨(dú)立。第三十二張,PPT共五十八頁,創(chuàng)作于2022年6月2、變量共同度表說明:變量“Jan”的共同度為0.915,即選取的公共因子提取了變量“Jan”91.5%的信息。第三十三張,PPT共五十八頁,創(chuàng)作于2022年6月 3、主成分表說明:第一主成分特征根為6.854,方差貢獻(xiàn)率為57.041%,前3個(gè)主成分的累積貢獻(xiàn)率為84.421%,根據(jù)提取因子的條件特征值大于

12、1,本例選出3個(gè)因子。第三十四張,PPT共五十八頁,創(chuàng)作于2022年6月 4、碎石圖說明:前3個(gè)主成分的特征根都在1以上。第三十五張,PPT共五十八頁,創(chuàng)作于2022年6月5、因子載荷矩陣給出各變量的因子表達(dá)式。第三十六張,PPT共五十八頁,創(chuàng)作于2022年6月6、旋轉(zhuǎn)后因子載荷矩陣經(jīng)過正交旋轉(zhuǎn)后的因子載荷矩陣,給出旋轉(zhuǎn)后的各變量的因子表達(dá)式。說明:第一主因子主要由前5個(gè)變量決定,第二主因子主要由中間4個(gè)變量決定,第三主因子主要由最后3個(gè)變量決定。第三十七張,PPT共五十八頁,創(chuàng)作于2022年6月7、因子轉(zhuǎn)換矩陣旋轉(zhuǎn)前的因子載荷矩陣乘以因子轉(zhuǎn)換矩陣等于旋轉(zhuǎn)后的因子載荷矩陣。第三十八張,PPT共

13、五十八頁,創(chuàng)作于2022年6月8、因子旋轉(zhuǎn)后的因子載荷圖圖中的坐標(biāo)軸就是各個(gè)主因子。第三十九張,PPT共五十八頁,創(chuàng)作于2022年6月9、因子得分系數(shù)矩陣得到因子得分表達(dá)式。第四十張,PPT共五十八頁,創(chuàng)作于2022年6月10、因子得分的協(xié)方差矩陣說明:因子得分的協(xié)方差矩陣為單位陣,得出提取的3個(gè)公共因子之間是不相關(guān)的。第四十一張,PPT共五十八頁,創(chuàng)作于2022年6月第二節(jié) 簡(jiǎn)單對(duì)應(yīng)分析【Correspondebce Analysis】過程又稱列聯(lián)表對(duì)應(yīng)分析一、對(duì)應(yīng)分析簡(jiǎn)介 對(duì)應(yīng)分析是通過進(jìn)行主成分分析來描述兩個(gè)或多個(gè)分類變量各水平間相關(guān)性的分析方法,它的分析結(jié)果主要采用反映變量間相互關(guān)系的

14、對(duì)應(yīng)分析圖來表示。對(duì)應(yīng)分析在SPSS中分為兩類: 簡(jiǎn)單對(duì)應(yīng)分析【Correspondebce Analysis】過程:主要研究?jī)蓚€(gè)分類變量之間的關(guān)系。 多元對(duì)應(yīng)分析 【Optimal Scaling】過程第四十二張,PPT共五十八頁,創(chuàng)作于2022年6月對(duì)應(yīng)分析表(列聯(lián)表):第四十三張,PPT共五十八頁,創(chuàng)作于2022年6月 最后分別對(duì)行剖面點(diǎn)集和列剖面點(diǎn)集做主成分分析,以判斷兩個(gè)變量的聯(lián)系情況。 第四十四張,PPT共五十八頁,創(chuàng)作于2022年6月例2 利用簡(jiǎn)單對(duì)應(yīng)分析過程分析不同年齡段選民的傾向。數(shù)據(jù)文件:voter.sav二、引例(練習(xí)二)第四十五張,PPT共五十八頁,創(chuàng)作于2022年6月

15、【Analyze】/【Dimension Reduction】/【Correspondence Analysis】要求:選入行變量(取值范圍為13)與列變量(取值范圍為14)(行變量)定義行變量取值范圍(列變量)定義列變量取值范圍第四十六張,PPT共五十八頁,創(chuàng)作于2022年6月Model:模式子對(duì)話框(設(shè)置分析結(jié)果維數(shù))(選擇距離測(cè)量方式)卡方距離歐氏距離,主要用于連續(xù)變量(變量的標(biāo)準(zhǔn)化方式)(正則化方法)對(duì)稱法(默認(rèn))第四十七張,PPT共五十八頁,創(chuàng)作于2022年6月Satistics:設(shè)置需要輸出的統(tǒng)計(jì)量輸出對(duì)應(yīng)分析表(列聯(lián)表)輸出行點(diǎn)概述表輸出列點(diǎn)概述表輸出行輪廓表輸出列輪廓表指定的前

16、n個(gè)維度輸出基于行列得分的原始表格(輸出行點(diǎn)和列點(diǎn)的標(biāo)準(zhǔn)差、以及各維度坐標(biāo)間的相關(guān)系數(shù))第四十八張,PPT共五十八頁,創(chuàng)作于2022年6月Plots:設(shè)置需要輸出圖形(輸出對(duì)應(yīng)分析圖)雙變量散點(diǎn)圖行點(diǎn)圖列點(diǎn)圖限制標(biāo)簽長(zhǎng)度輸出各行變量分類對(duì)應(yīng)于行得分的散點(diǎn)圖輸出各列變量分類對(duì)應(yīng)于列得分的散點(diǎn)圖(圖形維度)輸出分析結(jié)果的所有維度限制輸出維度的數(shù)目第四十九張,PPT共五十八頁,創(chuàng)作于2022年6月結(jié)果解讀:1、對(duì)應(yīng)分析表給出不同年齡階段的人群分別投票給三位總統(tǒng)候選人的人數(shù)。第五十張,PPT共五十八頁,創(chuàng)作于2022年6月2、結(jié)果匯總表列出維數(shù)、奇異值(慣量的平方根)、慣量(又指特征根)、總的卡方檢驗(yàn)

17、及Sig.值維數(shù)奇異值特征根總的卡方檢驗(yàn)注:慣量用于說明對(duì)應(yīng)分析各個(gè)維度的結(jié)果能夠解釋列聯(lián)表中兩個(gè)變量聯(lián)系的程度。說明:表中兩個(gè)維度分別解釋了總信息量的99.6%和0.4%,說明二維圖形完全可以表示兩個(gè)變量間的信息,且觀察時(shí)以第一維度為主。第五十一張,PPT共五十八頁,創(chuàng)作于2022年6月3、行點(diǎn)概述表給出行變量的3個(gè)分組在兩個(gè)維度中的分值每組所占百分比每組所對(duì)各個(gè)維度的貢獻(xiàn)量(點(diǎn)對(duì)維度慣量的貢獻(xiàn)量)(維度對(duì)點(diǎn)慣量的貢獻(xiàn)量)分組在第一、第二維度的坐標(biāo)值第五十二張,PPT共五十八頁,創(chuàng)作于2022年6月4、列點(diǎn)概述表給出列變量的4個(gè)分組在兩個(gè)維度中的分值每組所占百分比分組在第一、第二維度的坐標(biāo)值

18、每組所對(duì)各個(gè)維度的貢獻(xiàn)量(點(diǎn)對(duì)維度慣量的貢獻(xiàn)量)(維度對(duì)點(diǎn)慣量的貢獻(xiàn)量)第五十三張,PPT共五十八頁,創(chuàng)作于2022年6月5、對(duì)應(yīng)分析圖首先看同一變量的不同分組在某一側(cè)維度上靠的遠(yuǎn)近程度,較近表示這些分組在該維度上區(qū)別不大,比如第二維度;然后看不同變量的各分組間的位置,從圖形中心(0,0)出發(fā),相同方位上大致相同的區(qū)域內(nèi)的不同變量的分組彼此有聯(lián)系。說明:可看出4564歲這個(gè)階段的選民都傾向于克林頓,其他的沒有明顯的傾向性。第五十四張,PPT共五十八頁,創(chuàng)作于2022年6月第三節(jié) 最優(yōu)尺度分析【Optimal Scaling】過程初步認(rèn)識(shí)【Analyze】/【Dimension Reduction】/【Optimal Scaling】多元對(duì)應(yīng)分析分類變量主成分分析非

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論