SAS入門到精通第10章_第1頁
SAS入門到精通第10章_第2頁
SAS入門到精通第10章_第3頁
SAS入門到精通第10章_第4頁
SAS入門到精通第10章_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第十章主成分分析和因子分析主成分分析因子分析一、主成分分析主成分分析是最根本的一種數(shù)據(jù)降維方法,它被廣泛地應用于因子分析、變量聚類分析、典型判別分析和典型相關分析等。主成分分析的根本思想是:用原變量的線性組合來提取數(shù)據(jù)中的信息,當?shù)谝粋€線性組合不能提取足夠多的信息時,再用第二個線性組合來繼續(xù)提取信息……。如此進行下去,直到所提取的信息與原變量反映的信息差不多時為止。這樣,我們就得到了一系列的線性組合,將它們作為綜合指標去代替原來的變量,既到達了數(shù)據(jù)降維的目的,又不會損失太多的信息。如何來反映數(shù)據(jù)的信息呢?我們一般通過變量的方差來描述:變量的方差越大,代表其包含的信息越多。如果綜合指標的方差接近于原變量的方差,那么認為它們較好的反映了原始數(shù)據(jù)的信息。1、根本思想一、主成分分析2、根本模型一、主成分分析2、根本模型一、主成分分析3、根本步驟一、主成分分析3、根本步驟一、主成分分析4、PRINCOMP過程PRINCOMP過程是SAS提供的用于實現(xiàn)主成分分析的過程,其語句格式為:PROCPRINCOMPDATA=數(shù)據(jù)集名<選項>;VAR變量名列表;PARTIAL變量名;BY分組變量名;RUN;其中,只有PROC語句是必須的,其他語句可以根據(jù)用戶需要進行選用。一、主成分分析4、PRINCOMP過程語句說明:〔1〕PROC語句用于規(guī)定運行PRINCOMP過程,并指定要分析的數(shù)據(jù)集名。選項有:OUT=數(shù)據(jù)集名——規(guī)定一個輸出數(shù)據(jù)集,其中包含原始數(shù)據(jù)以及主成分得分。N=n——規(guī)定要計算的主成分個數(shù)。STANDARD——規(guī)定將OUT=的數(shù)據(jù)集中的主成分得分標準化為單位方差。如果沒有規(guī)定此選項,主成分得分的方差等于相應的特征值。〔2〕VAR語句用來列出要分析的數(shù)值型變量的名字。如果不使用該語句,那么沒有在其它語句規(guī)定的所有數(shù)值型變量都是要分析的變量?!?〕PARTIAl語句規(guī)定了偏出變量,使得PRINCOMP過程基于偏相關陣或偏協(xié)方差陣進行主成分分析。二、因子分析因子分析是多元統(tǒng)計分析中一種重要的數(shù)據(jù)降維方法,是主成分分析的推廣和開展。它通過研究協(xié)方差陣或相關系數(shù)矩陣內(nèi)部的結構,將多個變量綜合為少數(shù)幾個不可觀測的因子來到達簡化數(shù)據(jù)的目的。因子分析通過研究眾多變量之間的依賴關系,使用少數(shù)的抽象因子來表達數(shù)據(jù)的根本結構,這些因子通常是不可觀測的潛在變量,只能通過其他具體的指標來間接反映。通過分析這些因子,我們可以對實際問題進行更深入的研究,作出更加合理的解釋和正確的評價。1、根本思想二、因子分析2、根本模型二、因子分析2、根本模型二、因子分析3、根本步驟〔1〕參數(shù)估計:為建立因子模型,首先要估計因子載荷和特殊因子的方差,常用的方法有主成分法,主因子法和極大似然估計法等?!?〕確定公共因子:在求出因子載荷陣后,即可以建立因子模型:〔3〕因子載荷陣的旋轉(zhuǎn):由于因子載荷陣并不是唯一的,所以可以對它進行適當?shù)男D(zhuǎn),使得因子載荷陣的結構更加清楚,以利于我們對因子進行解釋。常用的幾種旋轉(zhuǎn)方法有:方差最大正交旋轉(zhuǎn)、均方最大正交旋轉(zhuǎn)、四次方最大正交旋轉(zhuǎn)、Procrustes斜交旋轉(zhuǎn)等。〔4〕計算因子得分:當我們獲得公共因子和因子載荷陣以后,就可以計算公共因子在每個樣本上對應的數(shù)值,即因子得分。常用的估計因子得分的方法有最小二乘法和回歸法。4、FACTOR過程FACTOR過程是SAS提供的用于實現(xiàn)因子分析的過程,其語句格式為:PROCFACTORDATA=數(shù)據(jù)集名<選項>;VAR變量名列表;PRIORS先驗估計值;PARTIAL變量名;BY分組變量名;RUN;其中,只有PROC語句是必須的,其他語句可以根據(jù)用戶需要進行選用。二、因子分析4、FACTOR過程語句說明:〔1〕PROC語句用于規(guī)定運行FACTOR過程,并指定要分析的數(shù)據(jù)集名。選項有:OUT=數(shù)據(jù)集名——規(guī)定一個輸出數(shù)據(jù)集,其中包含原始數(shù)據(jù)以及公共因子得分。在使用選項時,要指定公共因子的個數(shù)。METHOD=選項——規(guī)定提取公共因子的方法。N=n——規(guī)定被提取因子的最大數(shù)目,缺省值為變量的個數(shù)。SCORE——規(guī)定打印因子得分系數(shù)。

二、因子分析4、FACTOR過程語句說明:〔1〕PROC語句用于規(guī)定運行FACTOR過程,并指定要分析的數(shù)據(jù)集名。選項有:OUT=數(shù)據(jù)集名——規(guī)定一個輸出數(shù)據(jù)集,其中包含原始數(shù)據(jù)以及公共因子得分。在使用選項時,要指定公共因子的個數(shù)。METHOD=選項——規(guī)定提取公共因子的方法。N=n——規(guī)定被提取因子的最大數(shù)目,缺省值為變量的個數(shù)。SCORE——規(guī)定打印因子得分系數(shù)。

二、因子分析4、FACTOR過程〔2〕VAR語句用來列出要分析的數(shù)值型變量的名字。如果不使用該語句,那么沒有在其它語句規(guī)定的所有數(shù)值型變量都是要分析的變量。〔3〕PRIOR

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論