因子分析主成分分析_第1頁
因子分析主成分分析_第2頁
因子分析主成分分析_第3頁
因子分析主成分分析_第4頁
因子分析主成分分析_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

關于因子分析主成分分析問題的提出 假定你現(xiàn)在掌握了一個區(qū)域內評價自然資源的多個指標。這些指標從不同的側面反映所評價自然資源特征 如果讓你分析該區(qū)域的自然資源情況,能不能找到綜合變量來對該區(qū)域內的發(fā)展水平排序呢?

第2頁,共89頁,2024年2月25日,星期天方法的選擇常用方法:主成分分析找出主要影響因素(主成分)因子分析找出公共因子,該公共因子可以概括其所包含的變量第3頁,共89頁,2024年2月25日,星期天方法的選擇主成分分析找出主要影響因素(主成分)減少需要考慮的變量綜合排序優(yōu)先考慮第一主成分各變量對整個樣本的影響程度第4頁,共89頁,2024年2月25日,星期天方法的選擇因子分析找出公共因子綜合排序綜合考慮各公共因子各變量對整個樣本的影響程度第5頁,共89頁,2024年2月25日,星期天方法的選擇主成分分析與因子分析的區(qū)別對原始數(shù)據(jù)的要求因子分析要求各變量互不相關主成分分析要考慮各變量的物理意義(即是否有些變量可以不考慮)計算方法因子分析:要對系數(shù)矩陣做旋轉主成分分析:不需要對系數(shù)矩陣旋轉第6頁,共89頁,2024年2月25日,星期天方法的選擇主成分分析與因子分析的優(yōu)缺點比較對原始變量的保留因子分析:不對原始變量進行取舍,只是重新組合主成分分析:舍棄小部分原始變量對實際工作量的影響因子分析:對工作量減少的影響有限(因綜合考慮各變量)主成分分析:大幅減少工作量(因只考慮主成分,實際工作中可以舍棄非主成分)綜合排序的準確性(理論上)因子分析大于主成分分析第7頁,共89頁,2024年2月25日,星期天方法的選擇分析建立在大樣本的基礎之上有人認為樣本容量要大于50個有人認為樣本容量要是變量個數(shù)的10倍以上有人認為如果數(shù)據(jù)均勻,則不需要大樣本有人認為……第8頁,共89頁,2024年2月25日,星期天方法的選擇本實驗適合做因子分析,不適合做主成分分析本實驗首先詳細介紹因子分析然后用本實驗的數(shù)據(jù),介紹SPSS中主成分分析的方法第9頁,共89頁,2024年2月25日,星期天方法的選擇因子分析試圖:在力保數(shù)據(jù)信息丟失最少原則下研究指標體系的少數(shù)幾個線性組合幾個線性組合所構成的綜合指標能盡可能多地保留原來指標的信息這些綜合指標就稱公共因子。第10頁,共89頁,2024年2月25日,星期天方法的選擇選擇幾個公共因子???因子分析的目的是簡化變量,公共因子的個數(shù)應該小于原始變量個數(shù)保留幾個公共因子??應該權衡公共因子個數(shù)和保留的信息的程度,一般要保留原始信息的85%以上。第11頁,共89頁,2024年2月25日,星期天方法的選擇SPSS適用于統(tǒng)計初學者或非統(tǒng)計學專業(yè)人員數(shù)據(jù)轉換功能較強Spss(*.sav)Excel(*.xls)Text(*.txt)dBase(*.dbf)……..第12頁,共89頁,2024年2月25日,星期天實驗步驟1.數(shù)據(jù)的準備操作打開保存數(shù)據(jù)2.數(shù)據(jù)描述分析(Descriptive)3.因子分析4.輸出結果分析第13頁,共89頁,2024年2月25日,星期天一、數(shù)據(jù)準備1)首先在Excel中打開“水樣元素成分分析數(shù)據(jù)”,刪除表名“水樣元素成分分析數(shù)據(jù)”,保存數(shù)據(jù)。2)在SPSS中打開保存好的Excel數(shù)據(jù)第14頁,共89頁,2024年2月25日,星期天一、數(shù)據(jù)準備在Excel中刪除在SPSS中自動轉為列標題第15頁,共89頁,2024年2月25日,星期天數(shù)據(jù)準備啟動SPSS雙擊SPSS15.0圖標在開始菜單中找到SPSS15.0forWindows,點擊。。。。第16頁,共89頁,2024年2月25日,星期天選擇文件選擇

Openanexistingdatasource雙擊MoreFile第17頁,共89頁,2024年2月25日,星期天選擇文件在文件類型中選擇Excel第18頁,共89頁,2024年2月25日,星期天選擇文件“Worksheet”表示的是Excel表格中的行范圍第19頁,共89頁,2024年2月25日,星期天數(shù)據(jù)編輯窗口SPSS中的列名為Excel中第一行第20頁,共89頁,2024年2月25日,星期天數(shù)據(jù)編輯窗口左下角的兩個選項卡,DataView和VariableView默認狀態(tài)下是DataView切換到VariableView第21頁,共89頁,2024年2月25日,星期天變量格式設置窗口在VariableView中可以設置變更的名稱、類型等參數(shù)名稱類型小數(shù)顯示位數(shù)輸出結果中變量的顯示名稱輸出結果中變量內容的顯示名稱第22頁,共89頁,2024年2月25日,星期天VariableViewName—更改變量名稱Type—選擇變量類型(如numeric

、string)Decimals—設定小數(shù)顯示的位數(shù)Label—分析輸出結果中變量的顯示名稱Values—分析輸出結果中變量內容的顯示名稱第23頁,共89頁,2024年2月25日,星期天結果輸出窗口Output為結果輸出窗口,可以顯示我們對文件的操作信息以及對數(shù)據(jù)的分析結果第24頁,共89頁,2024年2月25日,星期天數(shù)據(jù)格式轉換將Excel數(shù)據(jù)轉換成為SPSS數(shù)據(jù),第25頁,共89頁,2024年2月25日,星期天保存文件點擊File菜單下的SaveAs選項第26頁,共89頁,2024年2月25日,星期天保存文件保存時類型為SPSS(*.sav)第27頁,共89頁,2024年2月25日,星期天保存結果輸出文件Output結果輸出窗口點擊File菜單下的SaveAs選項第28頁,共89頁,2024年2月25日,星期天保存結果輸出文件保存時類型為SPSS(*.spo)第29頁,共89頁,2024年2月25日,星期天因子分析的步驟:1.判斷是否需要進行因子分析判斷方法:對變量進行線性回歸分析(spss中的Descriptive命令可以實現(xiàn))通常各變量的線性回歸系數(shù)沒有明顯差別,為了使各變量的線性回歸系數(shù)向0或1兩極分化,要進行旋轉依據(jù)變量的相關性進行判斷,采用Bartlett球檢驗法或KMO檢驗法,確定是否有進行因子分析的必要2.如果有因子分析的必要,則進行因子分析第30頁,共89頁,2024年2月25日,星期天二、數(shù)據(jù)特征描述操作:命令Descriptive該命令可完成多種統(tǒng)計指標:均值、中位數(shù)、眾數(shù)、和標準差、方差(標準差的平方)極大值、極小值、全距均值的標準誤差偏度、峰度。第31頁,共89頁,2024年2月25日,星期天Descriptives過程點擊Analyze下的DescriptiveStatistics(描述統(tǒng)計)選項,選擇該選項下的Descriptives第32頁,共89頁,2024年2月25日,星期天Descriptives選中待處理的變量(左側的As…..Hg等);點擊使變量As…..Hg移至Variable(s)中;選中Savestandrdizedvaluesasvariables(保存標準化值作為變量);點擊Options(選項)12第33頁,共89頁,2024年2月25日,星期天Descriptives過程選擇所要的特征值:Mean(均數(shù))Std.deviation(標準差)Minimum(最小值)Maximum(最大值)升序排列(Ascendingmeans)點擊Continue第34頁,共89頁,2024年2月25日,星期天Descriptives過程原始數(shù)據(jù)標準化將原始數(shù)據(jù)轉換成標準Z分值并存入數(shù)據(jù)庫根據(jù)原始數(shù)據(jù)與均值的大小,大于均值的為正值,小于均值的為負值,相等的為零輸出原始數(shù)據(jù)特征的描述參數(shù),如均值、方差等第35頁,共89頁,2024年2月25日,星期天數(shù)據(jù)標準化標準化過程就是將數(shù)據(jù)進行處理后,新數(shù)據(jù)具有均值為0、標準差為1的特征第36頁,共89頁,2024年2月25日,星期天因子分析法(數(shù)據(jù)標準化)

對于具有不同級或不同單位的數(shù)據(jù)進行處理,使資料在更平等的條件下進行分析。假設為原觀測值,為數(shù)據(jù)均值,S為標準差,則標準化后的觀測值(標準正態(tài)變換)為

第37頁,共89頁,2024年2月25日,星期天Descriptives過程點擊OK第38頁,共89頁,2024年2月25日,星期天Descriptives過程標準化處理后的數(shù)據(jù)第39頁,共89頁,2024年2月25日,星期天Descriptives過程樣品數(shù)量最小值最大值均數(shù)標準差第40頁,共89頁,2024年2月25日,星期天三、因子分析點擊Analyze下的DataReduction(數(shù)據(jù)降維)選項,選擇該選項下的Factor(因子分析)過程第41頁,共89頁,2024年2月25日,星期天因子分析1、選中待處理的變量,移至Variables第42頁,共89頁,2024年2月25日,星期天因子分析2、點擊Descriptives判斷是否有進行因子分析的必要Coefficients(計算相關系數(shù)矩陣)Significancelevels(顯著水平)KMOandBartlett’stestofsphericity(對相關系數(shù)矩陣進行統(tǒng)計學檢驗)第43頁,共89頁,2024年2月25日,星期天因子分析判斷是否有進行因子分析的必要Inverse(倒數(shù)模式):求出相關矩陣的反矩陣(因子分析用不到)Reproduced(重制的):顯示重制相關矩陣(因子分析用不到)Determinant(行列式):求出前述相關矩陣的行列式值(因子分析用不到)Anti-image(反映像):求出反映像的共同量及相關矩陣。(因子分析用不到)第44頁,共89頁,2024年2月25日,星期天因子分析Statistics選項框:選中

Univariatedescriptive單變量描述統(tǒng)計量(輸出被選中的各變量的均數(shù)與標準差)Initialsolution未旋轉之統(tǒng)計量(顯示未旋轉前之共同性、特征值、變異數(shù)百分比及累積百分比,由于因子分析要求進行旋轉操作,所以此處不必選擇)點擊Continue第45頁,共89頁,2024年2月25日,星期天因子分析3、點擊Extraction(因子提?。┑?6頁,共89頁,2024年2月25日,星期天因子分析選擇因子分析方法(因子分析一般使用用Principalcomponents,即公共因子分析法),該方法要求Extract選項中的特征值大于1)輸出未旋轉的因子載荷矩陣(可選)第47頁,共89頁,2024年2月25日,星期天因子分析Method所提供的選項有:PrincipalComponents公共因子分析法Unweightedleastsquares未加權最小平方法Generalizedleastsquares綜合最小平方法Maximumlikelihood極大似然估計法Principalaxisfactoring主軸因子法Alpphafatoringα因子法Imagefatoring多元回歸法第48頁,共89頁,2024年2月25日,星期天因子分析選中Principalcomponents(注:此對話框中的選項,除Display外,均為Principalcomponents法默認的選項,一般情況下,不需要更改以相關矩陣為依據(jù)提取因子變量提取特征值大于1的因子作為因子變量旋轉前輸出未旋轉的因子載荷矩陣迭代到25次后終止分析

碎石圖(顯示特征值的貢獻率,可選)此處可輸入限定之因子個數(shù)以共變量矩陣為依據(jù)提取因子變量第49頁,共89頁,2024年2月25日,星期天因子分析4、點擊Rotation(旋轉)第50頁,共89頁,2024年2月25日,星期天因子分析輸出旋轉后的因子載荷矩陣第51頁,共89頁,2024年2月25日,星期天因子分析選中

Varimax(正交旋轉選中

Rotatedsolution(輸出選中后的因子載荷矩陣)點擊Continue因子載荷圖:繪出因子載荷散布圖(可選)全體旋轉

四分旋轉

直接斜交旋轉法

旋轉時執(zhí)行的疊代最多次數(shù)六種因素旋轉方法斜交法

第52頁,共89頁,2024年2月25日,星期天因子分析因子載荷矩陣旋轉使用方差最大正交旋轉或斜交旋轉,其他旋轉方法一般不用于因子分析中方差最大正交旋轉:保持變量之間互不相關,使載荷向0、1兩端分化。本實驗中,認為As、Pb、Cu等變量之間無必然的聯(lián)系,所以采用方差最大正交旋轉斜交旋轉:在變量之間必定存在某種聯(lián)系的時候使用,比如,在經(jīng)濟學中,人的消費心理、產品質量、文化差異之間必定會存在聯(lián)系,所以用斜交旋轉第53頁,共89頁,2024年2月25日,星期天因子分析5、點擊Scores第54頁,共89頁,2024年2月25日,星期天因子分析選中

Saveasvariables(把因子得分保存在數(shù)據(jù)文件中)選中

Regression(回歸因子得分)點擊Continue計算因素分數(shù)的方法在分析結果中給出因子得分系數(shù)矩陣及其相關矩陣第55頁,共89頁,2024年2月25日,星期天因子分析Regression:回歸因子得分Bartlett:極大似然估計Anderson-Rubin:Bartlett算法的改進算法計算因素分數(shù)的方法第56頁,共89頁,2024年2月25日,星期天因子分析6、點擊Options第57頁,共89頁,2024年2月25日,星期天因子分析選中Excludecaseslistwise(去除所有含缺失數(shù)據(jù)的樣本、再進行分析,只要樣品數(shù)據(jù)中有缺失,就刪除該樣品數(shù)據(jù))選中Sortedbysize(載荷系數(shù)將按照數(shù)值大小排列,并構成矩陣)不顯示絕對值小于設定值的載荷系數(shù),設定值范圍0~1點擊Continue第58頁,共89頁,2024年2月25日,星期天因子分析Excludecasespairwise(當樣品數(shù)據(jù)中缺少2個或2個以上的數(shù)據(jù)時,才刪除該樣品數(shù)據(jù),選中此項最大限度的利用得來不易的數(shù)據(jù))Raplacewithmean(當分析計算涉及含有缺失值的變量時,用平均值代替該缺失值)第59頁,共89頁,2024年2月25日,星期天因子分析7、點擊OK第60頁,共89頁,2024年2月25日,星期天結果分析SPSS輸出的第一個表格列出了標準化后數(shù)據(jù)的平均值(Mean)、標準差(Std.Deviation)和分析用到的取值個數(shù)(N)

Univariatedescriptive單變量描述統(tǒng)計量(輸出被選中的各變量的均數(shù)與標準差)第61頁,共89頁,2024年2月25日,星期天結果分析系統(tǒng)輸出的第2個表格是8個原始變量的相關矩陣與單尾顯著性檢驗第62頁,共89頁,2024年2月25日,星期天結果分析多個變量之間的相關系數(shù)較大,說明這些變量之間存在著較為顯著的相關性,且其對應的Sig值(顯著性)普遍較小,根據(jù)分析,這些數(shù)據(jù)有進行因子分析的必要。第63頁,共89頁,2024年2月25日,星期天結果分析KMO檢驗法和巴特利特球形檢驗法(KMOandBartlettTestofSphericity)的檢驗結果第64頁,共89頁,2024年2月25日,星期天結果分析Bartlett球形檢驗統(tǒng)計量的Sig<0.01,認為各變量之間存在著顯著的相關性,可以進行因子分析.第65頁,共89頁,2024年2月25日,星期天結果分析一般,KMO大于0.9時,認為因子分析的結果可靠,0.7以上可以接受,0.5以下可能不能接受第66頁,共89頁,2024年2月25日,星期天結果分析SPSS輸出的第四個表格“成分矩陣”是初始的未經(jīng)旋轉的因子載荷矩陣第67頁,共89頁,2024年2月25日,星期天結果分析已選出了3個主因子,以替代原有的8個變量第68頁,共89頁,2024年2月25日,星期天結果分析SPSS輸出的第七個表格“旋轉成分矩陣”是經(jīng)過旋轉后的因子載荷矩陣。第69頁,共89頁,2024年2月25日,星期天結果分析旋轉后每個公因子上的載荷分配地更清晰,因子變量代表的變量相對集中,比未旋轉時更容易解釋各因子的意義。第70頁,共89頁,2024年2月25日,星期天結果分析載荷絕對值較大的因子與變量的關系更為密切,也更能代表這個變量第71頁,共89頁,2024年2月25日,星期天結果分析第1公因子代表Cd、Zn、As、Pb這幾個變量因素第2公因子代表Cr、P兩個變量第3公因子代表Cu、Hg兩個變量第72頁,共89頁,2024年2月25日,星期天結果分析可以根據(jù)實際情況對第1公因子、第2公因子、第3公因子命名我們將第1公因子命名為鎘類,第2公因子命名為鉻類,第3公因子命名為銅類第73頁,共89頁,2024年2月25日,星期天結果分析SPSS輸出的第八個表格,是將Cd、Zn、As、Pb用第1因子代替、Cr、Pb用第2因子代替,Cu、Hg用第3因子代替,顯示了因子分析后,提取出的各因子之間的相關性,因子之間相關性越小,結果越可靠可以看到,本實驗的各公共因子之間的相關性比較大,認為本實驗的因子分析結果不可靠第74頁,共89頁,2024年2月25日,星期天結果分析SPSS輸出的第六個表格表示各因子變量的特征值與累積貢獻率提取因子的初始值旋轉后提取因子的值特征值貢獻率累計貢獻率第75頁,共89頁,2024年2月25日,星期天結果分析由于前3個因子累計貢獻率達到91.798%,根據(jù)累計貢獻率大于85%的原則,故選取這三個因子提取因子的初始特征值旋轉后提取因子的特征值特征值貢獻率累計貢獻率第76頁,共89頁,2024年2月25日,星期天結果分析SPSS輸出的第五個表格表示所提取的公共因子對該變量的信息綜合、解釋能力第77頁,共89頁,2024年2月25日,星期天結果分析As的為0.974,可以理解為3個公共因子能夠綜合As的信息的97.4%;Pb的為0.581,可以理解為3個公共因子能夠解釋As的信息的58.1%。第78頁,共89頁,2024年2月25日,星期天結果分析回到DataView窗口的當前數(shù)據(jù)集,會看到文件中增加了3列FAC1_1(第1因子得分)、FAC2_1(第2因子得分)和FAC3_1(第3因子得分),得分表示的是每個公共因子所占的權重。比如,本實驗中表示的是每類元素的含量所占的權重。第1公因子代表Cd、Zn、As、Pb第2公因子代表Cr、P第3公因子代表Cu、Hg第79頁,共89頁,2024年2月25日,星期天結果分析我們可以通過第1因子得分來了解鎘類元素的分布情況,通過第2公因子來了解鉻類元素的分布情況,通過第3公因子來了解銅類元素的分布情況第1公因子代表Cd、Zn、As、Pb第2公因子代表Cr、P第3公因子代表Cu、Hg第80頁,共89頁,2024年2月25日,星期天結果分析樣號為Z-W-2-02的樣品Cd、Zn、As、Pb含量較高,樣號為C-W-06-01的樣品Cr、P含量較高,樣號為C-W-01-02的樣品重金屬含量較高第1公因子代表Cd、Zn、As、Pb第2公因子

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論