因子分析、主成分分析_第1頁
因子分析、主成分分析_第2頁
因子分析、主成分分析_第3頁
因子分析、主成分分析_第4頁
因子分析、主成分分析_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

準備工作:請:

1、把360殺毒軟件和安全衛(wèi)士關(guān)掉

2、在Lenovo-e1、e2機子的共享文件夾中的\SPSS\目錄拷取數(shù)據(jù)到F盤中

3、打開“SPSS15注冊詳解”Word文件按步驟注冊因子分析

主成分分析中南大學(xué)地球科學(xué)與信息物理學(xué)院問題的提出 假定你現(xiàn)在掌握了一個區(qū)域內(nèi)評價自然資源的多個指標。這些指標從不同的側(cè)面反映所評價自然資源特征 如果讓你分析該區(qū)域的自然資源情況,能不能找到綜合變量來對該區(qū)域內(nèi)的發(fā)展水平排序呢?

方法的選擇常用方法:主成分分析找出主要影響因素(主成分)因子分析找出公共因子,該公共因子可以概括其所包含的變量方法的選擇主成分分析找出主要影響因素(主成分)減少需要考慮的變量綜合排序優(yōu)先考慮第一主成分各變量對整個樣本的影響程度方法的選擇因子分析找出公共因子綜合排序綜合考慮各公共因子各變量對整個樣本的影響程度方法的選擇主成分分析與因子分析的區(qū)別對原始數(shù)據(jù)的要求因子分析要求各變量互不相關(guān)主成分分析要考慮各變量的物理意義(即是否有些變量可以不考慮)計算方法因子分析:要對系數(shù)矩陣做旋轉(zhuǎn)主成分分析:不需要對系數(shù)矩陣旋轉(zhuǎn)方法的選擇主成分分析與因子分析的優(yōu)缺點比較對原始變量的保留因子分析:不對原始變量進行取舍,只是重新組合主成分分析:舍棄小部分原始變量對實際工作量的影響因子分析:對工作量減少的影響有限(因綜合考慮各變量)主成分分析:大幅減少工作量(因只考慮主成分,實際工作中可以舍棄非主成分)綜合排序的準確性(理論上)因子分析大于主成分分析方法的選擇分析建立在大樣本的基礎(chǔ)之上有人認為樣本容量要大于50個有人認為樣本容量要是變量個數(shù)的10倍以上有人認為如果數(shù)據(jù)均勻,則不需要大樣本有人認為……方法的選擇本實驗適合做因子分析,不適合做主成分分析本實驗首先詳細介紹因子分析然后用本實驗的數(shù)據(jù),介紹SPSS中主成分分析的方法方法的選擇因子分析試圖:在力保數(shù)據(jù)信息丟失最少原則下研究指標體系的少數(shù)幾個線性組合幾個線性組合所構(gòu)成的綜合指標能盡可能多地保留原來指標的信息這些綜合指標就稱公共因子。方法的選擇選擇幾個公共因子???因子分析的目的是簡化變量,公共因子的個數(shù)應(yīng)該小于原始變量個數(shù)保留幾個公共因子??應(yīng)該權(quán)衡公共因子個數(shù)和保留的信息的程度,一般要保留原始信息的85%以上。方法的選擇SPSS適用于統(tǒng)計初學(xué)者或非統(tǒng)計學(xué)專業(yè)人員數(shù)據(jù)轉(zhuǎn)換功能較強Spss(*.sav)Excel(*.xls)Text(*.txt)dBase(*.dbf)……..實驗步驟1.數(shù)據(jù)的準備操作打開保存數(shù)據(jù)2.數(shù)據(jù)描述分析(Descriptive)3.因子分析4.輸出結(jié)果分析一、數(shù)據(jù)準備1)首先在Excel中打開“水樣元素成分分析數(shù)據(jù)”,刪除表名“水樣元素成分分析數(shù)據(jù)”,保存數(shù)據(jù)。2)在SPSS中打開保存好的Excel數(shù)據(jù)一、數(shù)據(jù)準備在Excel中刪除在SPSS中自動轉(zhuǎn)為列標題數(shù)據(jù)準備啟動SPSS雙擊SPSS15.0圖標在開始菜單中找到SPSS15.0forWindows,點擊。。。。選擇文件選擇

Openanexistingdatasource雙擊MoreFile選擇文件在文件類型中選擇Excel選擇文件“Worksheet”表示的是Excel表格中的行范圍數(shù)據(jù)編輯窗口SPSS中的列名為Excel中第一行數(shù)據(jù)編輯窗口左下角的兩個選項卡,DataView和VariableView默認狀態(tài)下是DataView切換到VariableView變量格式設(shè)置窗口在VariableView中可以設(shè)置變更的名稱、類型等參數(shù)名稱類型小數(shù)顯示位數(shù)輸出結(jié)果中變量的顯示名稱輸出結(jié)果中變量內(nèi)容的顯示名稱VariableViewName—更改變量名稱Type—選擇變量類型(如numeric

、string)Decimals—設(shè)定小數(shù)顯示的位數(shù)Label—分析輸出結(jié)果中變量的顯示名稱Values—分析輸出結(jié)果中變量內(nèi)容的顯示名稱結(jié)果輸出窗口Output為結(jié)果輸出窗口,可以顯示我們對文件的操作信息以及對數(shù)據(jù)的分析結(jié)果數(shù)據(jù)格式轉(zhuǎn)換將Excel數(shù)據(jù)轉(zhuǎn)換成為SPSS數(shù)據(jù),保存文件點擊File菜單下的SaveAs選項保存文件保存時類型為SPSS(*.sav)保存結(jié)果輸出文件Output結(jié)果輸出窗口點擊File菜單下的SaveAs選項保存結(jié)果輸出文件保存時類型為SPSS(*.spo)因子分析的步驟:1.判斷是否需要進行因子分析判斷方法:對變量進行線性回歸分析(spss中的Descriptive命令可以實現(xiàn))通常各變量的線性回歸系數(shù)沒有明顯差別,為了使各變量的線性回歸系數(shù)向0或1兩極分化,要進行旋轉(zhuǎn)依據(jù)變量的相關(guān)性進行判斷,采用Bartlett球檢驗法或KMO檢驗法,確定是否有進行因子分析的必要2.如果有因子分析的必要,則進行因子分析二、數(shù)據(jù)特征描述操作:命令Descriptive該命令可完成多種統(tǒng)計指標:均值、中位數(shù)、眾數(shù)、和標準差、方差(標準差的平方)極大值、極小值、全距均值的標準誤差偏度、峰度。Descriptives過程點擊Analyze下的DescriptiveStatistics(描述統(tǒng)計)選項,選擇該選項下的DescriptivesDescriptives選中待處理的變量(左側(cè)的As…..Hg等);點擊使變量As…..Hg移至Variable(s)中;選中Savestandrdizedvaluesasvariables(保存標準化值作為變量);點擊Options(選項)12Descriptives過程選擇所要的特征值:Mean(均數(shù))Std.deviation(標準差)Minimum(最小值)Maximum(最大值)升序排列(Ascendingmeans)點擊ContinueDescriptives過程原始數(shù)據(jù)標準化將原始數(shù)據(jù)轉(zhuǎn)換成標準Z分值并存入數(shù)據(jù)庫根據(jù)原始數(shù)據(jù)與均值的大小,大于均值的為正值,小于均值的為負值,相等的為零輸出原始數(shù)據(jù)特征的描述參數(shù),如均值、方差等數(shù)據(jù)標準化標準化過程就是將數(shù)據(jù)進行處理后,新數(shù)據(jù)具有均值為0、標準差為1的特征因子分析法(數(shù)據(jù)標準化)

對于具有不同級或不同單位的數(shù)據(jù)進行處理,使資料在更平等的條件下進行分析。假設(shè)為原觀測值,為數(shù)據(jù)均值,S為標準差,則標準化后的觀測值(標準正態(tài)變換)為

Descriptives過程點擊OKDescriptives過程標準化處理后的數(shù)據(jù)Descriptives過程樣品數(shù)量最小值最大值均數(shù)標準差三、因子分析點擊Analyze下的DataReduction(數(shù)據(jù)降維)選項,選擇該選項下的Factor(因子分析)過程因子分析1、選中待處理的變量,移至Variables因子分析2、點擊Descriptives判斷是否有進行因子分析的必要Coefficients(計算相關(guān)系數(shù)矩陣)Significancelevels(顯著水平)KMOandBartlett’stestofsphericity(對相關(guān)系數(shù)矩陣進行統(tǒng)計學(xué)檢驗)因子分析判斷是否有進行因子分析的必要Inverse(倒數(shù)模式):求出相關(guān)矩陣的反矩陣(因子分析用不到)Reproduced(重制的):顯示重制相關(guān)矩陣(因子分析用不到)Determinant(行列式):求出前述相關(guān)矩陣的行列式值(因子分析用不到)Anti-image(反映像):求出反映像的共同量及相關(guān)矩陣。(因子分析用不到)因子分析Statistics選項框:選中

Univariatedescriptive單變量描述統(tǒng)計量(輸出被選中的各變量的均數(shù)與標準差)Initialsolution未旋轉(zhuǎn)之統(tǒng)計量(顯示未旋轉(zhuǎn)前之共同性、特征值、變異數(shù)百分比及累積百分比,由于因子分析要求進行旋轉(zhuǎn)操作,所以此處不必選擇)點擊Continue因子分析3、點擊Extraction(因子提?。┮蜃臃治鲞x擇因子分析方法(因子分析一般使用用Principalcomponents,即公共因子分析法),該方法要求Extract選項中的特征值大于1)輸出未旋轉(zhuǎn)的因子載荷矩陣(可選)因子分析Method所提供的選項有:PrincipalComponents公共因子分析法Unweightedleastsquares未加權(quán)最小平方法Generalizedleastsquares綜合最小平方法Maximumlikelihood極大似然估計法Principalaxisfactoring主軸因子法Alpphafatoringα因子法Imagefatoring多元回歸法因子分析選中Principalcomponents(注:此對話框中的選項,除Display外,均為Principalcomponents法默認的選項,一般情況下,不需要更改以相關(guān)矩陣為依據(jù)提取因子變量提取特征值大于1的因子作為因子變量旋轉(zhuǎn)前輸出未旋轉(zhuǎn)的因子載荷矩陣迭代到25次后終止分析

碎石圖(顯示特征值的貢獻率,可選)此處可輸入限定之因子個數(shù)以共變量矩陣為依據(jù)提取因子變量因子分析4、點擊Rotation(旋轉(zhuǎn))因子分析輸出旋轉(zhuǎn)后的因子載荷矩陣因子分析選中

Varimax(正交旋轉(zhuǎn)選中

Rotatedsolution(輸出選中后的因子載荷矩陣)點擊Continue因子載荷圖:繪出因子載荷散布圖(可選)全體旋轉(zhuǎn)

四分旋轉(zhuǎn)

直接斜交旋轉(zhuǎn)法

旋轉(zhuǎn)時執(zhí)行的疊代最多次數(shù)六種因素旋轉(zhuǎn)方法斜交法

因子分析因子載荷矩陣旋轉(zhuǎn)使用方差最大正交旋轉(zhuǎn)或斜交旋轉(zhuǎn),其他旋轉(zhuǎn)方法一般不用于因子分析中方差最大正交旋轉(zhuǎn):保持變量之間互不相關(guān),使載荷向0、1兩端分化。本實驗中,認為As、Pb、Cu等變量之間無必然的聯(lián)系,所以采用方差最大正交旋轉(zhuǎn)斜交旋轉(zhuǎn):在變量之間必定存在某種聯(lián)系的時候使用,比如,在經(jīng)濟學(xué)中,人的消費心理、產(chǎn)品質(zhì)量、文化差異之間必定會存在聯(lián)系,所以用斜交旋轉(zhuǎn)因子分析5、點擊Scores因子分析選中

Saveasvariables(把因子得分保存在數(shù)據(jù)文件中)選中

Regression(回歸因子得分)點擊Continue計算因素分數(shù)的方法在分析結(jié)果中給出因子得分系數(shù)矩陣及其相關(guān)矩陣因子分析Regression:回歸因子得分Bartlett:極大似然估計Anderson-Rubin:Bartlett算法的改進算法計算因素分數(shù)的方法因子分析6、點擊Options因子分析選中Excludecaseslistwise(去除所有含缺失數(shù)據(jù)的樣本、再進行分析,只要樣品數(shù)據(jù)中有缺失,就刪除該樣品數(shù)據(jù))選中Sortedbysize(載荷系數(shù)將按照數(shù)值大小排列,并構(gòu)成矩陣)不顯示絕對值小于設(shè)定值的載荷系數(shù),設(shè)定值范圍0~1點擊Continue因子分析Excludecasespairwise(當(dāng)樣品數(shù)據(jù)中缺少2個或2個以上的數(shù)據(jù)時,才刪除該樣品數(shù)據(jù),選中此項最大限度的利用得來不易的數(shù)據(jù))Raplacewithmean(當(dāng)分析計算涉及含有缺失值的變量時,用平均值代替該缺失值)因子分析7、點擊OK結(jié)果分析SPSS輸出的第一個表格列出了標準化后數(shù)據(jù)的平均值(Mean)、標準差(Std.Deviation)和分析用到的取值個數(shù)(N)

Univariatedescriptive單變量描述統(tǒng)計量(輸出被選中的各變量的均數(shù)與標準差)結(jié)果分析系統(tǒng)輸出的第2個表格是8個原始變量的相關(guān)矩陣與單尾顯著性檢驗結(jié)果分析多個變量之間的相關(guān)系數(shù)較大,說明這些變量之間存在著較為顯著的相關(guān)性,且其對應(yīng)的Sig值(顯著性)普遍較小,根據(jù)分析,這些數(shù)據(jù)有進行因子分析的必要。結(jié)果分析KMO檢驗法和巴特利特球形檢驗法(K

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論