因子分析在CSI項目中應用_第1頁
因子分析在CSI項目中應用_第2頁
因子分析在CSI項目中應用_第3頁
因子分析在CSI項目中應用_第4頁
因子分析在CSI項目中應用_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、關(guān)于因子分析在CSI項目中的應用第一張,PPT共三十一頁,創(chuàng)作于2022年6月因子分析的定義 在社會、政治、經(jīng)濟和醫(yī)學等領(lǐng)域的研究中往往需要對反映事物的多個變量進行大量的觀察,收集大量的數(shù)據(jù)以便進行分析,尋找規(guī)律。在大多數(shù)情況下,許多變量之間存在一定的相關(guān)關(guān)系。 因此,有可能用較少的綜合指標分析存在于各變量中的各類信息,而各綜合指標之間彼此是不相關(guān)的,代表各類信息的綜合指標稱為因子。因子分析就是用少數(shù)幾個因子來描述許多指標或因素之間的聯(lián)系,以較少幾個因子反映原資料的大部分信息的統(tǒng)計學方法。 對高維變量空間進行降維處理。第二張,PPT共三十一頁,創(chuàng)作于2022年6月 (1)因子變量的數(shù)量遠少于原

2、有的指標變量的數(shù)量,對因子變量的分析能夠減少分析中的計算工作量。 (2)因子變量不是對原有變量的取舍,而是根據(jù)原始變量的信息進行重新組構(gòu),它能夠反映原有變量大部分的信息。 (3)因子變量之間不存在線性相關(guān)關(guān)系,對變量的分析比較方便。 (4)因子變量具有命名解釋性,即該變量是對某些原始變量信息的綜合和反映。 因子分析的特點第三張,PPT共三十一頁,創(chuàng)作于2022年6月 因子分析有兩個核心問題:一是如何構(gòu)造因子變量;二是如何對因子變量進行命名解釋。因子分析有下面4個基本步驟。 (1)確定待分析的原有若干變量是否適合于因子分析。 (2)構(gòu)造因子變量。 (3)利用旋轉(zhuǎn)使得因子變量更具有可解釋性。 (4

3、)確定因子權(quán)重。 因子分析的4個基本步驟第四張,PPT共三十一頁,創(chuàng)作于2022年6月 因子分析是從眾多的原始變量中構(gòu)造出少數(shù)幾個具有代表意義的因子變量,這里面有一個潛在的要求,即原有變量之間要具有比較強的相關(guān)性。如果原有變量之間不存在較強的相關(guān)關(guān)系,那么就無法從中綜合出能反映某些變量共同特性的少數(shù)公共因子變量來。因此,在因子分析時,需要對原有變量作相關(guān)分析。第一步:確定待分析變量是否適合于因子分析 第五張,PPT共三十一頁,創(chuàng)作于2022年6月 如果相關(guān)系數(shù)矩陣在進行統(tǒng)計檢驗中,大部分相關(guān)系數(shù)都小于0.3,并且未通過統(tǒng)計檢驗,那么這些變量就不適合于進行因子分析。 (1)相關(guān)系數(shù) r的取值在-

4、1和+1之間。 r0,正相關(guān);r0.8,相關(guān)關(guān)系較強;|r|0.05,我們就接受假設,認為此r值的很可能是從此總體中取得的。因此判斷兩變量間無顯著關(guān)系;如果取得r值的概率P0.05或P0.01,我們就在=0.05或=0.01水準上拒絕檢驗假設,認為該r值不是來自=0的總體,而是來自0的另一個總體,因此就判斷兩變量間有顯著關(guān)系。 SPSS將自動計算簡單相關(guān)系數(shù)、t檢驗統(tǒng)計量得觀測值和對應的概率P值方法一:簡單相關(guān)系數(shù)第六張,PPT共三十一頁,創(chuàng)作于2022年6月 1巴特利特球形檢驗(Bartlett Test of Sphericity)如果統(tǒng)計量的觀測值比較大,且對應的P值小于給定的顯著性水平

5、r,則相關(guān)系數(shù)矩陣原有變量存在相關(guān)性,適合因子分析; 2KMO(Kaiser-Meyer-Olkin)檢驗KMO統(tǒng)計量的取值范圍為01,KMO大于等于0.9,非常適合,0.8適合,0.7一般,0.6不太適合,0.5以下,極不適合。方法二:KMO和巴特利球形檢驗統(tǒng)計值的觀測值對應的概率PKMO統(tǒng)計量第七張,PPT共三十一頁,創(chuàng)作于2022年6月 因子分析中有多種確定因子變量的方法,如基于主成分模型的主成分分析法和基于因子分析模型的主軸因子法、極大似然法、最小二乘法等。其中基于主成分模型的主成分分析法是使用最多的因子分析方法之一。第二步:構(gòu)造因子變量第八張,PPT共三十一頁,創(chuàng)作于2022年6月第

6、三步:決定旋轉(zhuǎn)方法 在因子提取時通常提取初始因子后,對因子無法做有效的解釋,(因子Fi不能典型代表任何一個原有變量Xi)為了更好的解釋因子,可通過因子旋轉(zhuǎn)的方式使一個變量只在盡可能少的因子上有比較高的載荷(Aij)。 因子旋轉(zhuǎn)方式有兩種:正交旋轉(zhuǎn)和斜交選擇。為能繼續(xù)保持新生成的因子的不相關(guān)性,一般選擇正旋轉(zhuǎn)。 方差最大法、四次方最大法、等量最大法第九張,PPT共三十一頁,創(chuàng)作于2022年6月第四步:確定因子權(quán)重 每個公共因子對原始數(shù)據(jù)的解釋能力,稱為該因子的貢獻率,常用該因子所解釋的總方差來衡量,它等于和該因子有關(guān)的因子負荷的平方和,實際中常用相對指標來表示,相對指標體現(xiàn)公共因子的相對重要性,

7、即每個公共因子所解釋的方差占所有變量總方差的比例。第十張,PPT共三十一頁,創(chuàng)作于2022年6月因子分析的定義和數(shù)學模型9.1SPSS中實現(xiàn)過程9.2SPSS結(jié)果解釋9.2目錄第十一張,PPT共三十一頁,創(chuàng)作于2022年6月 實現(xiàn)步驟選擇命令:Analyze-Data Reducation-Factor圖1 在菜單中選擇“Factor”命令打開命令窗口第十二張,PPT共三十一頁,創(chuàng)作于2022年6月 圖2 “Factor Analysis”對話框 實現(xiàn)步驟:把參與因子分析的變量選到Variable框中選擇參與因子分析的樣本,把作為條件變量的變量指定到該處,只有滿足條件的樣本數(shù)據(jù)才能參與因子分析

8、選擇參與因子分析的變量第十三張,PPT共三十一頁,創(chuàng)作于2022年6月 圖3 “Factor Analysis:Descriptives”對話框 實現(xiàn)步驟:在圖2窗口中單擊Descriptives(輸出結(jié)果)按鈕打開如下對話框1.指定輸出哪些基本統(tǒng)計量(1).各個變量的基本描述統(tǒng)計量(均值、標準差、樣本量)(2).初始因子分析結(jié)果(因子提取前分析變量的公因子方差)2.檢驗變量是否適合因子分析,列舉了三種常用方法確定待分析的原有若干變量是否適合于因子分析第十四張,PPT共三十一頁,創(chuàng)作于2022年6月圖4 “Factor Analysis:Extraction”對話框 實現(xiàn)步驟:在圖2窗口中單擊

9、Extraction 按鈕打開如下對話框因子提取選擇項1.因子提取方法選擇項2.因子提取的依據(jù)Correlation matrix 相關(guān)系數(shù)矩陣Covariance matrix 協(xié)方差陣3.輸出與因子提取有關(guān)的信息Unratoted factor solution輸出未旋轉(zhuǎn)的因子載荷矩陣Scree plot 輸出因子的碎石圖4.選擇如何確定因子數(shù)目Eigenvaluse over 大于該值得特征根Number of factors 提取因子的數(shù)目第十五張,PPT共三十一頁,創(chuàng)作于2022年6月 圖5 “Factor Analysis:Rotation”對話框 因子旋轉(zhuǎn)方法的選擇 實現(xiàn)步驟:在

10、圖2窗口中單擊Rotation按鈕打開如下對話框1.選擇因子旋轉(zhuǎn)方法None 不旋轉(zhuǎn)Varimax 方差最大法Quartimax 四次方最大法Exqumax 等量最大法其他為斜交旋轉(zhuǎn)法2.指定輸出與因子旋轉(zhuǎn)相關(guān)的信息Rotated solution 表示輸出旋轉(zhuǎn)后的因子載荷矩陣Loading plot(s)表示輸出旋轉(zhuǎn)后的因子載荷散點圖第十六張,PPT共三十一頁,創(chuàng)作于2022年6月圖6 “Factor Analysis:Facfor Scores”對話框 計算因子得分的方法 實現(xiàn)步驟:在圖2窗口中單擊Scores按鈕打開如下對話框1.表示將因子得分保存到spss變量中,生成幾個因子便產(chǎn)生幾個

11、spss變量。在Method中指定計算因子得分的方法Regression為回歸法,系統(tǒng)默認2.輸出因子得分系數(shù)矩陣第十七張,PPT共三十一頁,創(chuàng)作于2022年6月圖7 “Factor Analysis:Options”對話框缺失值的處理方式及因子載荷矩陣的輸出方法2.指定因子載荷矩陣的輸出方式Sorted by size 表示以第一因子得分的降序輸出因子載荷矩陣Suppress absolute values less than輸入一個數(shù)值,表示只輸出大于該值的因子載荷第十八張,PPT共三十一頁,創(chuàng)作于2022年6月因子分析的定義和數(shù)學模型9.1SPSS中實現(xiàn)過程9.2SPSS結(jié)果解釋9.2目

12、錄第十九張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果1:原有變量的相關(guān)系數(shù)矩陣結(jié)果2:巴特利特球檢驗和KMO檢驗結(jié)果3:因子分析的初始解結(jié)果4:因子解釋原有變量方差的情況結(jié)果5:因子碎石圖結(jié)果6:因子載荷矩陣結(jié)果7:旋轉(zhuǎn)后的因子載荷矩陣輸出結(jié)果列表按照第二部分的操作命令,得到如上7個結(jié)果,下面將分別對7個結(jié)果進行解讀第二十張,PPT共三十一頁,創(chuàng)作于2022年6月案例分析:影響網(wǎng)點業(yè)務發(fā)展的因素對影響網(wǎng)點業(yè)務發(fā)展的24個指標進行因子分析,樣本來源:243個網(wǎng)點評價第二十一張,PPT共三十一頁,創(chuàng)作于2022年6月考察原有變量是否適合進行因子分析(1)具體操作如圖2和圖3:借助于相關(guān)系數(shù)矩陣、

13、巴特利特球狀檢驗和KMO檢驗大部分的相關(guān)系數(shù)值大于0.3大部分的檢驗值小于0.05(結(jié)果1:原有變量的相關(guān)系數(shù)矩陣)第二十二張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果2:巴特利特球檢驗和KMO檢驗檢驗統(tǒng)計值的觀察值較大概率P小于0.05假設檢驗顯著性水平KMO大于0.8考察原有變量是否適合進行因子分析(2)由此得出原有變量適合進行因子分析第二十三張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果3:因子分析的初始解(一)按照圖4操作,得到因子分析的初始解如右表所示,Initial列表示如果對原有24個變量提取所有特征根,原有變量的所有方差都可被解釋,變量的共同方差均為1,第二列表示采用主成分分

14、析法提取因子并選取特征根值大于1的特征根,可以看到大部分的變量有60%左右的信息可被因子解釋,網(wǎng)點周邊資源變量的信息丟失較為嚴重(接近60%)因此,本次因子提取的總體效果并不理想,該結(jié)果未達到因子分析的目標(降維)重新制定提取特征根的標準,指定提取8個因子( Number of factors 處輸入8),分析結(jié)果如下表:第二十四張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果3:因子分析的初始解(二)重新制定提取特征根的標準,在圖4中指定提取8個因子( Number of factors 處輸入8),分析結(jié)果右表:由表可知,此時24個變量的共同方差均較高,各個變量的信息丟失都較少,因此本次因子

15、提取的總體效果較理想。第二十五張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果4:因子解釋原有變量方差的情況第一列為因子編號,以后三列組成一組,每組中數(shù)據(jù)項的含義依次是特種根值、方差貢獻率、累計方差貢獻率初始因子解的情況因子解的情況最終因子解的情況(因子旋轉(zhuǎn)后所得)因子旋轉(zhuǎn)后,累計方差比沒有改變(76.174),重新分配了各個因子解釋原有變量的方差,改變了各因子方差貢獻,使得因子更容易理解。(比如:第一個因子旋轉(zhuǎn)前后對總方差的解釋度由42.031變?yōu)?5.602)按照圖5操作,按照方差最大法旋轉(zhuǎn)第二十六張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果5:因子碎石圖右圖中,橫坐標為因子數(shù)目,縱坐標為

16、特征值。由圖可見,第一個因子的特征值很高,對解釋原有變量的貢獻最大,第8個以后的因子特征值都較小,對解釋原有變量的貢獻很小,已經(jīng)成為可被忽略的碎石,因此提取8個因子是適合的。第二十七張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果6:因子載荷矩陣從表中可以看到,變量在第1個因子上的負荷都很高,意味著它們與第1個因子的相關(guān)程度高,其余因子與變量的相關(guān)性相對較小,另外可以看到,這8個因子的實際含義比較模糊,所以采用了方差最大法對因子載荷矩陣進行旋轉(zhuǎn),得到結(jié)果7,如下頁所示:第二十八張,PPT共三十一頁,創(chuàng)作于2022年6月結(jié)果7:旋轉(zhuǎn)后的因子載荷矩陣分別將在每個因子上的載荷較高的變量歸為一起。因為輸出時使用了以第一因子得分的降序輸出因子載荷矩陣,所以前6個變量為第一個因子的變量,依次類推觀察第二個因子的所屬變量網(wǎng)點管理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論