因子分析在CSI項目中的應用PPT課件_第1頁
因子分析在CSI項目中的應用PPT課件_第2頁
因子分析在CSI項目中的應用PPT課件_第3頁
因子分析在CSI項目中的應用PPT課件_第4頁
因子分析在CSI項目中的應用PPT課件_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、1因子分析在csi項目中的應用制作人:王鳳榮時間:2012-03-102因子分析的定義因子分析的定義9.1spssspss中實現(xiàn)過程中實現(xiàn)過程9.2spssspss結(jié)果解釋結(jié)果解釋9.23 在社會、政治、經(jīng)濟和醫(yī)學等領域的研究中往在社會、政治、經(jīng)濟和醫(yī)學等領域的研究中往往需要對反映事物的多個變量進行大量的觀察,收往需要對反映事物的多個變量進行大量的觀察,收集大量的數(shù)據(jù)以便進行分析,尋找規(guī)律。在大多數(shù)集大量的數(shù)據(jù)以便進行分析,尋找規(guī)律。在大多數(shù)情況下,許多變量之間存在一定的相關關系。情況下,許多變量之間存在一定的相關關系。 因此,有可能用較少的綜合指標分析存在于各因此,有可能用較少的綜合指標分析

2、存在于各變量中的各類信息,而各綜合指標之間彼此是不相變量中的各類信息,而各綜合指標之間彼此是不相關的,代表各類信息的綜合指標稱為關的,代表各類信息的綜合指標稱為因子因子。因子分因子分析就是用少數(shù)幾個因子來描述許多指標或因素之間析就是用少數(shù)幾個因子來描述許多指標或因素之間的聯(lián)系,以較少幾個因子反映原資料的大部分信息的聯(lián)系,以較少幾個因子反映原資料的大部分信息的統(tǒng)計學方法。的統(tǒng)計學方法。 對高維變量空間進行降維處理。對高維變量空間進行降維處理。4 (1 1)因子變量的數(shù)量遠少于原有的指標變量的數(shù))因子變量的數(shù)量遠少于原有的指標變量的數(shù)量,對因子變量的分析能夠減少分析中的計算工作量。量,對因子變量的

3、分析能夠減少分析中的計算工作量。 (2 2)因子變量不是對原有變量的取舍,而是根據(jù)因子變量不是對原有變量的取舍,而是根據(jù)原始變量的信息進行重新組構(gòu)原始變量的信息進行重新組構(gòu),它能夠反映原有變量大,它能夠反映原有變量大部分的信息。部分的信息。 (3 3)因子變量之間不存在線性相關關系,對變量)因子變量之間不存在線性相關關系,對變量的分析比較方便。的分析比較方便。 (4 4)因子變量具有)因子變量具有命名解釋性命名解釋性,即該變量是對某,即該變量是對某些原始變量信息的綜合和反映。些原始變量信息的綜合和反映。 5 因子分析有兩個核心問題:一是如何構(gòu)造因子因子分析有兩個核心問題:一是如何構(gòu)造因子變量;

4、二是如何對因子變量進行命名解釋。因子分變量;二是如何對因子變量進行命名解釋。因子分析有下面析有下面4 4個基本步驟。個基本步驟。 (1 1)確定待分析的原有若干變量是否適合于因)確定待分析的原有若干變量是否適合于因子分析。子分析。 (2 2)構(gòu)造因子變量。)構(gòu)造因子變量。 (3 3)利用旋轉(zhuǎn)使得因子變量更具有可解釋性。)利用旋轉(zhuǎn)使得因子變量更具有可解釋性。 (4 4)確定因子權(quán)重。)確定因子權(quán)重。 6 因子分析是從眾多的原始變量中構(gòu)造出少數(shù)幾因子分析是從眾多的原始變量中構(gòu)造出少數(shù)幾個具有代表意義的因子變量,這里面有一個潛在的個具有代表意義的因子變量,這里面有一個潛在的要求,即原有變量之間要具有

5、比較強的相關性。如要求,即原有變量之間要具有比較強的相關性。如果原有變量之間不存在較強的相關關系,那么就無果原有變量之間不存在較強的相關關系,那么就無法從中綜合出能反映某些變量共同特性的少數(shù)公共法從中綜合出能反映某些變量共同特性的少數(shù)公共因子變量來。因此,在因子分析時,需要對原有變因子變量來。因此,在因子分析時,需要對原有變量作相關分析。量作相關分析。 7 如果相關系數(shù)矩陣在進行統(tǒng)計檢驗中,大部分相關系數(shù)都小于0.3,并且未通過統(tǒng)計檢驗,那么這些變量就不適合于進行因子分析。 (1)相關系數(shù) r的取值在-1和+1之間。 r0,正相關;r0.8,相關關系較強;|r|0.05,我們就接受假設,認為此

6、r值的很可能是從此總體中取得的。因此判斷兩變量間無顯著關系;如果取得r值的概率p0.05或p0.01,我們就在=0.05或=0.01水準上拒絕檢驗假設,認為該r值不是來自=0的總體,而是來自0的另一個總體,因此就判斷兩變量間有顯著關系。 spss將自動計算簡單相關系數(shù)、t檢驗統(tǒng)計量得觀測值和對應的概率p值8 1 1巴特利特球形檢驗(巴特利特球形檢驗(bartlett test of sphericitybartlett test of sphericity)如果統(tǒng)計量的觀測值比較大,且對應的如果統(tǒng)計量的觀測值比較大,且對應的p p值小于給定的顯著性水平值小于給定的顯著性水平r,r,則相關系數(shù)矩

7、則相關系數(shù)矩陣原有變量存在相關性,適合因子分析;陣原有變量存在相關性,適合因子分析; 2 2kmokmo(kaiser-meyer-olkinkaiser-meyer-olkin)檢驗)檢驗kmokmo統(tǒng)計量的取值范圍為統(tǒng)計量的取值范圍為01,kmo01,kmo大于等于大于等于0.90.9,非常適合,非常適合,0.8適合,適合,0.7一般,一般,0.6不太適合,不太適合,0.5以下,極不適合。以下,極不適合。統(tǒng)計值的觀測值對應的概率pkmo統(tǒng)計量9 因子分析中有多種確定因子變量的方法,如基因子分析中有多種確定因子變量的方法,如基于主成分模型的主成分分析法和基于因子分析模型于主成分模型的主成分分

8、析法和基于因子分析模型的主軸因子法、極大似然法、最小二乘法等。的主軸因子法、極大似然法、最小二乘法等。其中其中基于主成分模型的主成分分析法是使用最多的因子基于主成分模型的主成分分析法是使用最多的因子分析方法之一。分析方法之一。10 在因子提取時通常提取初始因子后,對因子無在因子提取時通常提取初始因子后,對因子無法做有效的解釋,(因子法做有效的解釋,(因子fifi不能典型代表任何一個不能典型代表任何一個原有變量原有變量xi)xi)為了更好的解釋因子,可通過因子旋轉(zhuǎn)為了更好的解釋因子,可通過因子旋轉(zhuǎn)的方式使一個變量只在盡可能少的因子上有比較高的方式使一個變量只在盡可能少的因子上有比較高的載荷(的載

9、荷(aij)aij)。 因子旋轉(zhuǎn)方式有兩種:正交旋轉(zhuǎn)和斜交選擇。因子旋轉(zhuǎn)方式有兩種:正交旋轉(zhuǎn)和斜交選擇。為能繼續(xù)保持新生成的因子的不相關性,為能繼續(xù)保持新生成的因子的不相關性,一般選擇一般選擇正旋轉(zhuǎn)。正旋轉(zhuǎn)。 方差最大法方差最大法、四次方最大法、等量最大法、四次方最大法、等量最大法11 每個公共因子對原始數(shù)據(jù)的解釋能力,稱為該因每個公共因子對原始數(shù)據(jù)的解釋能力,稱為該因子的貢獻率,常用該因子所解釋的總方差來衡量,它子的貢獻率,常用該因子所解釋的總方差來衡量,它等于和該因子有關的因子負荷的平方和,實際中常用等于和該因子有關的因子負荷的平方和,實際中常用相對指標來表示,相對指標體現(xiàn)公共因子的相對重

10、要相對指標來表示,相對指標體現(xiàn)公共因子的相對重要性,即性,即每個公共因子所解釋的方差占所有變量總方差每個公共因子所解釋的方差占所有變量總方差的比例的比例。12因子分析的定義和數(shù)學模型因子分析的定義和數(shù)學模型9.1spssspss中實現(xiàn)過程中實現(xiàn)過程9.2spssspss結(jié)果解釋結(jié)果解釋9.213 實現(xiàn)步驟實現(xiàn)步驟選擇命令:選擇命令:analyze-data reducation-factor打開命令窗口打開命令窗口14 實現(xiàn)步驟實現(xiàn)步驟: :把參與因子分析的變量選到把參與因子分析的變量選到variablevariable框中框中選擇參與因子分析的樣本,把作為條件變量的變量指定到該處,只有滿足條

11、件的樣本數(shù)據(jù)才能參與因子分析選擇參與因子分析的變量選擇參與因子分析的變量15 實現(xiàn)步驟實現(xiàn)步驟: :在圖在圖2 2窗口中單擊窗口中單擊descriptivesdescriptives(輸出結(jié)果)按鈕打開(輸出結(jié)果)按鈕打開如下對話框如下對話框1.指定輸出哪些基本統(tǒng)計量(1).各個變量的基本描述統(tǒng)計量(均值、標準差、樣本量)(2).初始因子分析結(jié)果(因子提取前分析變量的公因子方差)2.檢驗變量是否適合因子分析,列舉了三種常用方法確定待分析的原有若干變量是否適合于因子分析確定待分析的原有若干變量是否適合于因子分析16 實現(xiàn)步驟實現(xiàn)步驟: :在圖在圖2 2窗口中單擊窗口中單擊 按鈕打開如下對話框按鈕

12、打開如下對話框因子提取選擇項因子提取選擇項1.因子提取方法選擇項2.因子提取的依據(jù)correlation matrix 相關系數(shù)矩陣covariance matrix 協(xié)方差陣3.輸出與因子提取有關的信息unratoted factor solution輸出未旋轉(zhuǎn)的因子載荷矩陣scree plot 輸出因子的碎石圖4.選擇如何確定因子數(shù)目eigenvaluse over 大于該值得特征根number of factors 提取因子的數(shù)目17因子旋轉(zhuǎn)方法的選擇因子旋轉(zhuǎn)方法的選擇 實現(xiàn)步驟實現(xiàn)步驟: :在圖在圖2 2窗口中單擊窗口中單擊按鈕打開如下對話框按鈕打開如下對話框1.選擇因子旋轉(zhuǎn)方法non

13、e 不旋轉(zhuǎn)varimax 方差最大法quartimax 四次方最大法exqumax 等量最大法其他為斜交旋轉(zhuǎn)法2.指定輸出與因子旋轉(zhuǎn)相關的信息rotated solution 表示輸出旋轉(zhuǎn)后的因子載荷矩陣loading plot(s)表示輸出旋轉(zhuǎn)后的因子載荷散點圖18計算因子得分的方法計算因子得分的方法 實現(xiàn)步驟實現(xiàn)步驟: :在圖在圖2 2窗口中單擊窗口中單擊按鈕打開如下對話框按鈕打開如下對話框1.表示將因子得分保存到spss變量中,生成幾個因子便產(chǎn)生幾個spss變量。在method中指定計算因子得分的方法regression為回歸法,系統(tǒng)默認2.輸出因子得分系數(shù)矩陣19缺失值的處理方式及因子

14、載荷矩陣的輸出方法缺失值的處理方式及因子載荷矩陣的輸出方法2.指定因子載荷矩陣的輸出方式sorted by size 表示以第一因子得分的降序輸出因子載荷矩陣suppress absolute values less than輸入一個數(shù)值,表示只輸出大于該值的因子載荷20因子分析的定義和數(shù)學模型因子分析的定義和數(shù)學模型9.1spssspss中實現(xiàn)過程中實現(xiàn)過程9.2spssspss結(jié)果解釋結(jié)果解釋9.221結(jié)果結(jié)果1 1:原有變量的相關系數(shù)矩陣:原有變量的相關系數(shù)矩陣結(jié)果結(jié)果2 2:巴特利特球檢驗和:巴特利特球檢驗和kmokmo檢驗檢驗結(jié)果結(jié)果3 3:因子分析的初始解:因子分析的初始解結(jié)果結(jié)果

15、4 4:因子解釋原有變量方差的情況:因子解釋原有變量方差的情況結(jié)果結(jié)果5 5:因子碎石圖:因子碎石圖結(jié)果結(jié)果6 6:因子載荷矩陣:因子載荷矩陣結(jié)果結(jié)果7 7:旋轉(zhuǎn)后的因子載荷矩陣:旋轉(zhuǎn)后的因子載荷矩陣輸出結(jié)果列表輸出結(jié)果列表按照第二部分的操作命令,得到如上7個結(jié)果,下面將分別對7個結(jié)果進行解讀22案例分析:影響網(wǎng)點業(yè)務發(fā)展的因素案例分析:影響網(wǎng)點業(yè)務發(fā)展的因素對影響網(wǎng)點業(yè)務發(fā)展的對影響網(wǎng)點業(yè)務發(fā)展的2424個指標進行因子分析,樣本來源:個指標進行因子分析,樣本來源:243243個網(wǎng)點評價個網(wǎng)點評價23考察原有變量是否適合進行因子分析(考察原有變量是否適合進行因子分析(1)具體操作如圖具體操作如

16、圖2 2和圖和圖3 3:借助于相關系數(shù)矩陣、巴特利特球狀檢驗和:借助于相關系數(shù)矩陣、巴特利特球狀檢驗和kmokmo檢驗檢驗大部分的相關系數(shù)值大于0.3大部分的檢驗值小于0.05(結(jié)果1:原有變量的相關系數(shù)矩陣)24結(jié)果2:巴特利特球檢驗和kmo檢驗檢驗統(tǒng)計值的觀察值較大概率p小于0.05假設檢驗顯著性水平kmo大于0.8考察原有變量是否適合進行因子分析(考察原有變量是否適合進行因子分析(2)由此得出原有變量適合進行因子分析由此得出原有變量適合進行因子分析25結(jié)果結(jié)果3:因子分析的初始解(一):因子分析的初始解(一)按照圖4操作,得到因子分析的初始解如右表所示,initial列表示如果對原有24

17、個變量提取所有特征根,原有變量的所有方差都可被解釋,變量的共同方差均為1,第二列表示采用主成分分析法提取因子并選取特征根值大于1的特征根,可以看到大部分的變量有60%左右的信息可被因子解釋,網(wǎng)點周邊資源變量的信息丟失較為嚴重(接近60%)因此,本次因子提取的總體效果并不理想,該結(jié)果未達到因子分析的目標(降維)重新制定提取特征根的標準,指定提取8個因子( number of factors 處輸入8),分析結(jié)果如下表:26結(jié)果結(jié)果3:因子分析的初始解(二):因子分析的初始解(二)重新制定提取特征根的標準,在圖4中指定提取8個因子( number of factors 處輸入8),分析結(jié)果右表:由

18、表可知,此時24個變量的共同方差均較高,各個變量的信息丟失都較少,因此本次因子提取的總體效果較理想。27結(jié)果結(jié)果4:因子解釋原有變量方差的情況:因子解釋原有變量方差的情況第一列為因子編號,以后三列組成一組,每組中數(shù)據(jù)項的含義依次是特種根值、方差貢獻率、累計方差貢獻率初始因子解的情況因子解的情況最終因子解的情況(因子旋轉(zhuǎn)后所得)因子旋轉(zhuǎn)后,累計方差比沒有改變(76.174),重新分配了各個因子解釋原有變量的方差,改變了各因子方差貢獻,使得因子更容易理解。(比如:第一個因子旋轉(zhuǎn)前后對總方差的解釋度由42.031變?yōu)?5.602)按照圖5操作,按照方差最大法旋轉(zhuǎn)28結(jié)果結(jié)果5:因子碎石圖:因子碎石圖右圖中,橫坐標為因子數(shù)目,縱坐標為特征值。由圖可見,第一個因子的特征值很高,對解釋原有變量的貢獻最大,第8個以后的因子特征值都較小,對解釋原有變量的貢獻很小,已經(jīng)成為可被忽略的碎石,因此提取8個因子

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。