




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第33章SAS系統(tǒng)內四種多變量分析程序概 第34章主成份分析統(tǒng)計程序 P程序概 如何撰寫 P程 第35章因子分析統(tǒng)計程序PROC 因子分析法中的因子一詞指什 PROCFACTOR程序概 如何撰寫PROCFACTOR程 第36章典型相關分析統(tǒng)計程序PROC PROCCANCORR程序概 如何撰寫PROCCANCORR程 第37章多次元尺度法統(tǒng)計程序PROC PROCMDS程序概 如何撰寫PROCMDS程 注意事 33章SAS本章將簡要地介紹四種多變量分析的統(tǒng)計程序即主成份分析( P)傳統(tǒng)式因子分析(FACTOR)典型相關分析(CANCORR)和多次元尺度分析(MDS)這四種統(tǒng)計程序的功能在于找尋多個變量之間的關系或簡化數據的復雜性這些變量并不一定得視為自變量或因變量其中主成份分析傳統(tǒng)式因子分析以及多次元尺度分析都是對一組變量作分析而典型相關則是對兩組變量作分析SAS還有其它的統(tǒng)計程序可以執(zhí)行多變量的統(tǒng)計分析如CATMOD變異數分析回歸分析集群分析及鑒別分析等P程序主成份分析 間互相依賴的程度將這些線性相關以主成份值表示其分析的結果包括 準化后的主成份值這些主成份值可以代替變量的原始數據進行進一步的分析處理如制圖 執(zhí)行回歸分析或集群分析 值得讀者注意的是 主成份分析(Principal ysis)與主軸因子分析(PrincipalAxisCommonFactor ysis)不是同義FACTOR程序(傳統(tǒng)式因子分析)對同一組觀察體內的多個變量執(zhí)行上述的主成份分析及傳統(tǒng)式因子分析因子分析法還附帶有因子的坐標轉換以取得最大的詮釋效果其分析結果可以是標準化的主成份值也可以是傳統(tǒng)因子分析的值傳統(tǒng)式因子分析的目的在尋求一小群隱藏的變量以解釋原變量之間的相關和主成份分析不同的是這一小群隱藏的變量不直接由原變量間的線性組合導出因素分析"因此對本書讀者而言這CANCORR程序(典型相關分析)對兩組變量執(zhí)行典型相關分析其分析的結果是典型變量值典型相關分析的目的是藉一小群有最高組間相關的組內變量之線性組合(又稱向量)來解釋并概述兩組變量之間的關系構成向量的變量多少并沒有限制若某個向量中只含一個變量則典型相關的作 第七部分多變量的分析MDS程序(多次元尺度分析)MDS是MultidimensionalScaling的簡稱它代表一系列的分析法其目的在于從或變量或刺激詞)的坐標如此讀者可藉圖形的視覺效果如上所述FACTOR程序除了涵蓋 P程序并且包括了另外幾種常用的因子分析法當讀者使用FACTOR程序時若不指明用那一種分析法則主成份分析便是FACTOR程序的內設值FACTOR程序產生的主成份值是經過標準化的然而P程序所產生的主成份值是 標準化的不過讀者也可額外地要求P與FACTOR程序相 P程序的優(yōu)點如最適用于變量多但主成份少的大型資料文件可節(jié)省電腦處理時間 P程序相比FACTOR程序的優(yōu)點如下 P程序廣泛包括誤差值的檢定因子坐標轉換的角度及特性根由大到小的排列等 P程序只有一種分析法 即主成份分析法然而FACTOR程序內有九種分析法供你選擇第34章主成份分析統(tǒng)計程序 P P程序對輸入資料文件執(zhí)行主成份分析其輸入資料文件可以是原始數據也可以是一個相關系數矩陣或是一個變異數共變異數矩陣輸出資料則包括特性根特性向量及()標準化的主成份值主成份分析是一個多變量的統(tǒng)計程序可用來檢定多個數值變量之間的關系主成要目的是求出一組變量的線性組合即主成份)這些線性組合就是原變量矩陣的特性向(Pearson)1901(Holing1933)(Rao1964)(CooleyandLohnes1971)和干那氏(Gnanadesikan1977)的著作如何撰寫 P程PPARTIAL變量名稱串PPARTIAL變量名稱串 一般而言只須用到前兩個指令亦即 P以及指令#1 P選項指明到底對那一個SAS資料文件執(zhí)行PROC P的分析這個輸入資料文件可以是原始數據也可以是一個相關系數矩陣(TYPE=CORR或UCORR)或是一個變異數共變異數矩陣(TYPE=COV或UCOV)或TYPE=FACTORSSCPESP等不同形式的資料文件若省略此選項則SAS會自動找出在此程序之前最后形成的資料文件對它執(zhí)行主成份分析這一個輸出資料文件包含下列的統(tǒng)計值算術平均數標準差觀察體的總數關系數(它們的代號與定義如下定義 特性根N=界定成份個數少于實際導出的個數界定的個數為準 特性向量這些向量值一般是用來計算主成份值或被輸送到FACTOR程序作因子坐標的轉換) 值的總和 若讀者在程序中包括了PARTIAL指令而且定 則SUMWGT的值是加權值的總和減去PARTIAL變量串的自由度當SUMWGT與N值相同時SUMWGT的變量不會被納入OUTSTAT=輸出資料文件內要求相關矩陣或變異數共變異數矩陣不針對平均數作校正 要求以變異數共變異數矩陣為分析的數據 若省略此選項則此統(tǒng)計分析將以要求OUT=輸出資料文件中含標準化的主成份值 若省略此選項則輸出資料文 標準化的主成份值(這些值的變異數等于特性根的值)為主成份命名內設值是PRIN1 ...PRINn n為正整數主成份的名字(包括字母及數字)不得超過八個字母或數字VARDEF=DFNWGT DF代表自由度是此選項的內設N是樣本總數WGT是后的樣本總數WDF則是(WGT-#2VAR 若省略此指令則本程序內其它指令里未曾提#3PARTIAL 若讀者在程序中同時界定OUT=或OUTSTAT=輸出資料文件名則此輸出資料文件也會含凈化后的殘差變量(Residual 這些殘差變量名原則是R_加上VAR指令所界定之變量名稱的前六個字母所以如果VAR指令含X Z三個變量則其所對應的殘差變量就是R_X R_Z了#4FREQ 所以計算自由度時將以#5WEIGHT 派不同的值以區(qū)分各觀察體的重要性這些值可被存入一個WEIGHT變量內#6BY此指令指示SAS將輸入資料文件分成幾個小的資料文件然后對每一個小的資料文BY指令里所列舉的變量值作從小到大的排列這個步驟可藉PROCSORT達成 例一一月和七月的氣溫分析本例的輸入資料文件(TEMPERAT)是個城市一月與七月的平均日溫分PROCPLOT畫出原始數據的分配圖然后用P程序執(zhí)行主成份PRIN1PRIN2)COV選項使得一月在第一主成份上的負荷量較重最后用PROCPLOT畫出兩個主成份上各城市的負荷量PLOT程序所求得的兩個圖表來歸納出第一與第二主成份是原坐標軸旋轉30度的結果程DATATEMPERAT;TITLE'MeanTemperatureinJanuaryandJulyforSelectedCities';INPUTCITY$:16.JANUARY:4.1JULY:5.1@@;51.281.620.651.291.232.739.581.435.245.175.221.529.973.023.724.872.732.232.075.842.135.678.740.554.681.08.267.282.331.142.478.026.929.074.528.422.971.936.823.875.138.127.975.032.319.475.128.131.380.728.433.376.945.452.981.914.221.568.040.533.476.638.329.273.344.825.573.343.614.263.852.18.565.628.012.271.916.847.181.740.527.878.8Ri37.531.378.625.420.569.334.522.677.219.431.969.326.6結結34.1;PROCPLOTJULY*JANUARY=CITY/VPOS=31;RUN; PCOVOUT=PRIN;VARJULYJANUARY;RUN;PROCPLOT;TITLE2'PlotofPrincipalComponents';95||
MeanTemperatureinJanuaryandJulyforSeletedCitiesPlotofJULY*JANUARY.Symbolisvalueof 90|||85 O C 80 N K R 75 IBCA D ACHP 70 BMC |65 |60| NOTE:3obs642
EigenvaluesoftheCovariance 0 PlotofPrincipalPlotofPRIN2*PRIN1.Symbolisvalueof10||P||SOKWOD|BMDSL||0
ACHD
N CR A M G CP |||-10 NOTE:4obs例二率的分本例的輸入資料文件(CRIME)是一個五十個觀察體乘以七個變量的原始數據矩陣它包含了五十個州在七種項目上的發(fā)生頻率 這七種罪名分別是 謀殺 強 搶劫 騷擾 夜間偷 竊盜(LARCENY)及偷車(AUTO) 成份分析法簡化到只用兩個或三個特性向量就可以地表示程TITLE'CrimeRatesper100,000PopulationbyINPUTSTATE$1-14MURDER18-21RAPE23-26ROBBERY28-32ASSAULT34-BURGLARY40-45LARCENY47-52AUTO53-59;14.225.296.8278.31135.510.851.696.8284.01331.79.534.2138.2312.32346.18.827.683.2203.4972.611.549.4287.0358.02139.46.342.0170.7292.91935.2NewNewNewNewNorthNorthRhodeSouthSouth1.415.930.8101.21348.29.023.392.1165.7986.24.339.6106.2224.81605.6West6.042.2597.42.852.2846.9;5.439.7811.6PROCPPROCIDVARPRIN1VARPRIN1PRIN2MURDERRAPEROBBERYASSAULTBURGLARYLARCENYTITLE2'StatesListedinOrderofOverallCrimeTITLE3'AsDeterminedbytheFirstPrincipalPROCSORT; PROC IDVARPRIN1PRIN2MURDERRAPEROBBERYASSAULTBURGLARYLARCENYAUTO;TITLE2'StatesListedinOrderofPropertyVs.ViolentCrime';TITLE3'AsDeterminedbytheSecondPrincipalPROC TITLE2'PlotoftheFirstTwoPrincipalComponents';PROC TITLE2'PlotoftheFirstandThirdPrincipal76%的變異數若再加上第三個主軸則百分比升到87%見報表34.2a)第一個主成份代表一般率的高低它的特性向量在這七個變量上差不多第二個主成份似乎在類型中分出財物偷竊和的不同第三主成份的解釋則不甚清楚為了詮釋這些主成份的意義可將原始數據依各主成份的值重新排列然后印出整理過后的數據見報表34.2b) 然后試著去了解各區(qū)(如中西部東南部)在坐標圖上的分布(見報表34.2c) 州如 第一圖上有四個"A"開頭的州名即 AlabamaArkansasAlaska和Arizona在這四州中Alabama的位置最靠近橫軸其坐標值是(-.0499 閱坐標值與圖形以便識別各州在率上的分507
CrimeRatesper100,000PopulationbyStatePrincipalComponent Simple 1291.9040002671.288000432.455711725.908707CorrelationEigenvaluesoftheCorrelationCrimeRatesper100,000PopulationbyStateStatesListedinOrderofOverallCrimeRateAsDeterminedbytheFirstPrincipalComponentB RRRRBALCA IIDAEUAEU NNEPRLRNT 12REYTYY -3.17203- -3.14772- -1.72691- -1.72007- -1.50736- -1.43245- -1.05441- -0.91621- NorthCarolina-0.69925- -0.63407- -0.32136- -0.13660- -0.04988- 0.49041- 0.55637- 2311.3 1.12020- 1.21417- 1.39696- CrimeRatesper100,000PopulationbyStateStatesListedinOrderofPropertyVs.ViolentCrimeAsDeterminedbytheSecondPrincipalComponentRABULMOSRASPPUBSGRTRRRRBALCAAIIDAEUAEUTNNEPRLRNTE12REYTYYO CrimeRatesper100,000PopulationbyStatePlotoftheFirstTwoPrincipalComponentsPlotofPRIN2*PRIN1.SymbolisvalueofSTATE.3| | 2 | 1 V PRIN2| NM 0+ OI | -1 |-2 | |-3 NOTE:2obsCrimeRatesper100,000PopulationbyStatePlotoftheFirstandThirdPrincipalComponentsPlotofPRIN3*PRIN1.Symbolisvalueof3 |2||1|||| TANM 0 A N VMI -1 | -2 35PROC因子分析法中的因子許多人對因子分析法中所指的因子一詞不甚了解本節(jié)特就此說明之因子分析法中提到兩種因子又稱共因子)和獨特因子這兩種因子都是指一個(或一組)假設的抽象的變量所謂共同因子指一個假設的抽象的變量它可用來解釋兩個或兩個以上的原始變量然而獨特因子則指一個假設的抽象的變量它只能用來解釋一個原始的變量與其如上所述因子指假設的抽象的變量它的功能在于詮釋原始變量之間的關系或結構然而主成份是指原始變量間的線性組合它的功能在于簡化原有的變量群共因子分析法的模型允許每一變量有一獨特因子Yij=Xi1b1j+Xi2b2j+...+Xiqbqj+其中Yij=ijXik=ikbkj=被第k個共因子用來預測第j個變量的回歸系 又稱因子負荷Eij=ijq共同因子的總數PROCFACTORPROCFACTOR可以對輸入資料文件執(zhí)行許多種不同的共因子分析及主成份分析也可將分析的結果經過坐標的轉換以利于詮釋PROCFACTOR的輸入資料文件可以是多變量數據一個相關系數矩陣一個變異數(FactorPattern)(FactorScoreCoefficient)的矩陣FACTOR程序也接受其它程序的輸出資料文件所以輸入資料文件變化很多詳35.6FACTOR程序提供九種因子提煉的方法供讀者選用 這九種方法將在介紹選項METHOD=中詳加解釋另外FACTOR程序也提供了六種方法來預估變量間的共通性見選項PRIORS=的說明一般而言因子坐標的轉換可分正交及斜交兩大類 FACTOR程序提供了八種坐標轉換的方法供讀者選擇見選項ROTATE=的說明FACTOR程序所產生的輸出資料文件不止一個 它們分別在選項OUTSTAT=中逐Spearman)1904年首創(chuàng)Gould1981)及KimandMueller1978)的書籍以便對分析法的目的及模型有初步的認識較深入的討論可參看慕雷克(Mulaik1972)Harman1976)的著作PROCFACTORPROCFACTOR含七道指令PROCFACTORVAR#1PROCFACTORPROCFACTOR的選項可分下列五大類討論 第二類與因子提煉有關第三類與因子坐標的轉換有關第四類選項控制報表的印出第 若省略此選項則SAS會自動找出在此程序之前最后形成的SAS資料文件對它執(zhí)行因子分析這一個資料文件內含有Procrustes坐標轉換后理想的 必須與PROCRUSTES這一個輸出資料文件包括原輸入資料文件的觀察值以及因子分數(FactorScore)這些值以FACTOR1 FACTOR2等表示讀者必須同時用NFACTOR=選項界定OUT=OUTSTAT文代號(TYPE 定 _NAME_ ImageCoefficientMatrix)矩陣內各橫列的變量名字以_NAME_表示 ImageCovarianceMatrix)矩陣內各橫列的變量名字以_NAME_表示 變量的 (ReferenceStructure FactorStructure SCORE程序以便產生共因子分數見第12章的例一) METHOD=一般而言此選項的內設值是MEHTOD=PRINCIPAL但當輸入資料文件是TYPE=FACTORMETHOD=PATTERN下列九種因子提煉的 PRIORS=而定(或PRIN或P) 項不與PRIORS=并用 或與PRIORS=ONE并用時 法是主軸因子分析法(PrincipalAxisCommonFactor 界定循環(huán)式主軸因子分析(I tivePrincipalAxisM=ULS(或U) 界定未的最小誤差平方之因子分析(UnweightedLeastSquaresMethod)M=ALPHA(或 界定阿爾法因子分析(Alpha M=ML(或M) 界定最大可能率因子分析此法要求一個滿秩的相關系數M=HARRIS(或H)界定哈里斯氏(Harris)于1962年S-1RS-1主軸分析此處S是變量的變異數共變異數矩陣R是變量間的相關系數矩陣此法要求一個滿秩的相關系數M=IMAGE(或I) 針對映象共變異數矩陣作主成份分析(PrincipalComponentysisofImageCovarianceMatrix)此法要求一個滿秩的相關系數矩陣請讀者注意比法與凱斯(Kaiser196319701974)所提的映象分析(Imageysis) 從輸入資料文件(其 或 間的相關系數也必須同時輸入(TYPE='FCORR'的數據) 從輸入資料文件(其 或 括變量間的相關系數或其變異數共變異數矩陣PRIORS=ONE(或 設定所有共通性的預估值為PRIORS=MAX(或 取每一變量與其它變量的最大相關系數絕對值為PRIORS=SMC(或 取每一變量與其它變量的復相關平方值為該變量 將上述的復相關(SMC)調整使其總和等于最大 正比(Cureton 如果輸入資料文件的 則讀者可用此選項SAS會進入資料文件內尋找='PRIORS'或_TYPE_='COMMUNAL'的變 此PRIORS=RANDOM(R)01因子提煉的方 共通性預測值的內設 (不適用 (不適用 (不適用 (不適用起始隨機隨機數表的起始值與選項2)PRIORS=RANDOM界定METHOD=PRINITULSALPHA或ML等因子分析法中循環(huán)分析的次數內設值是30CONVERGECONV)=界定METHOD=PRINITULSALPHA或ML等因子分析法中循環(huán)分析的收斂值它的定義是兩次循環(huán)所求得變量之共通性的差距當這個差距小于此選項001要求FACTOR程序對變異數共變異數矩陣(而非相關系數矩陣)執(zhí)行因子分析此選項必須與METHOD=PRINCIPALPRINITULS或IMAGE適用要求FACTOR程序對一個經過調整的相關系數矩陣或變異數共變異數矩陣執(zhí)行因子分析選用此項時必須同時滿足下列的條件 ULS輸入資料文件的 UCOV或各變量的值由_TYPE_='WEIGHT'提 三個選項則SAS會自動挑選最小的值 或N)=正整 或P)=百分比(正實數不帶%符號1(即百分之百METHOD=PATTERNSCORE要求SAS保留特性根大于此選項所設定的那些因子此選項不可與METHOD=PATTERNSCORE合用一般而言其內設值是0若讀者對未過的相關系數矩陣進行因子分析則其內設值等于1但如果讀者同時省略NFACTORS=PROPORTION=及MINEIGEN=三選項時SAS會依下面的原則MINEIGEN當 則MINEIGEN的值ALPHA或 TotalImage其它的方法而 經過調整的總變異 一般而言當共通性的預估值超過1 ALPHAML立刻停止分析的過程并設因子的總個數為 HEYWOOD將大于1的變量共通性重新調整為 如此分析可以繼續(xù)進改變規(guī)定允許變量的共通性大于1 此選項極可能導致不合理的分析結果因 R=VARIMAX(或V) R=QUARTIMAX(或Q) R=EQUAMAX(或E) 界定標準正交轉換 其加權值來自選 界定哈雷斯-凱斯(Harris-Kaiser)坐標轉換法 選項HKPOWER=合用它界定特性根開方的次數R=PROMAX(或 界定最優(yōu)斜交轉換 可與選項PREROTATE=POWER=合用 則PRER-OTATE=VARIMAX而且POWER=3 界定斜交轉換法TARGET=R=NONE(或 不執(zhí)行任何坐標轉換是R=的內設 決定標準正交轉換的程 此選項只能和ROTATE=ORTHOMAX界定特性根開方的次 開方過的特性根是用來調整特性向量的元 也可以和 MAX或ORTHOMAX合用此選項的值常介于0與1之間內設值為1時界定ROTATE=PROMAX方法中所需的次方數以達到理想的矩陣形態(tài)內設值是3只適合與ROTATE=PROMAX選項適用它用來界定初步坐標轉換的方法內設值是VARIMAX此選項不可是PROMAX或PROCRUSTES當METHOD=PATTERN時PREROTATE必須是NONENORM=KAISERWEIGHTCOVRAW為因子系數矩陣的列(Row)界定一個標準化的方法內設值是KAISER若NORM=KAISER則采凱斯氏標準化之法若NORM=WEIGHT各列以Cureton-MulaikNORM=COV而非相關系數)若NORM=NONERAW則不進行任何標準化 SIMPLECORR控制其它變量后)的凈相關矩陣此矩陣又稱為負反映象(NegativeAnti-ImageCorrelationsMatrix)Kaiser的抽樣合宜度(MeasureofSamplingAdequacy)(Kaiser1970CernyandKaiser1977)將特性根由大到小排列后以圖形顯示SCREEEIGENVECTORS印出輸入資料文件中有關因子負荷 因子分數系數的數 此選項只適合METHOD=PATTERNSCORERESIDUALS NPLOT=印出前幾(4)個最重要的因子負荷量矩陣 最小值是2 這些系數可再輸入PROCSCORE以便計算各觀察體因子PLOTNPLOTREORDER重新排列因子系數矩陣的列使那些在第一因子上負荷量的絕對值高的變量排在前面幾列以協助解釋因子的含意100后ROUND所訂的值將以星號標明之FUZZ=所定的值均會以句號(表遺漏數據)取代之以簡化矩陣 與METHOD=PATTERN或SCORE聯用相關系數矩陣被納入輸出資料文件內界定一個矩陣不滿秩的標準10-8界定變異數與共變異數計算時所用的分母 N值減i未使用PARTIAL指令)或N-p-i使PARTIAL指令)i0NOINT選項)或1如果未界定NOINT選項)p等于PARTIAL指令中界定的變量個數WEIGHT(或 WGT-iPARTIAL指令)WGT-p-i使用PARTIAL指令)ip的定義同DFVARDEF#2PRIORS01之間VAR應PROCPROCVARXYZ;PRIORS.7.8.9;XYZ#3VAR 若省略此指令則本程序內其它指令中未曾提#4PARTIAL 系數矩陣而非相關系數矩陣#5FREQ#6WEIGHT 來指派不同的值以區(qū)分各觀察體的重要性WEIGHT變量的值就代表這些值#7BYSAS依據此指令所列舉的變量將資料文件分成幾個小的資料文件(如男/女組等)然后對每一個小的資料文件單獨進行因子分析當讀者選用此指令時資料文件內BYPROCSORTPROCPROCCORRDATA=RAW*TYPE=CORR的資料文件PROCFACTORDATA=CORRELMETHOD=ML*最大可能率因子分析法PROCFACTOR *主成份分析PROCPROCFACTORDATA=RAWOUTSTAT=FACT*主成份分析PROCFACTORROTATE=VARIMAX; *VARIMAX坐標轉換法;PROCFACTORROTATE=QUARTIMAX; X Y Z.4;DATACORRELINPUT_NAME_$XYZ;PROC注相關系數矩陣經ML法分析后其樣本數都會設定為100,000讀者必須參考HarmanDATACORRELINPUT_NAME_$XYZ;PROCDATADATAPATINPUT_NAME_$XYZ;FACTOR1.5.7FACTOR2.8.2;PROCFACTORROTATE=PROMAXDATADATAPATINPUT_TYPE_$_NAME_$XYZ;PATTERNPATTERN; .7 .2 .2.21.0PROCFACTORROTATE=PROMAX 下面三個因子分析的示范都是用同一套輸入資料文件(SOCECON)這一組資料代表洛杉磯市十二個社區(qū)的社會經濟情況(以五個變量表示)這五個社經變量是人POP)(SCHOOL)EMPLOY)(SERVICES)及房價(HOUSE)例一主成份分析(PrincipalComponentPRIORS=METHOD=的內設值是主成份分析)分析的結果并沒有經過坐標轉換結果顯示兩個主成份因子似乎足以解釋93.4%的總變異數程DATATITLE'FiveSocioeconomic INPUTSCHOOLEMPLOYSERVICES12.827010.9108.8101401406039080100;PROCFACTORPROCFACTORDATA=SOCECONSIMPLETITLE3'Principal 12.873314 當我們檢視因子形態(tài)時發(fā)現五個變量在第一主成份上的負荷量均是大于0.50的正值在第二主成份的負荷量則有正有負由于這個因子形態(tài)坐標軸的轉換我們只能說第一主成份是一個一般性的社經成份然而第二主成份則與社區(qū)經濟較有關這是因為POPEMPLOY在第二主成份上的負荷量為正值而區(qū)民教育程度與房價的負荷量是負最后POP)的因子共通性最高35.35.1(PrincipalFiveSocioeconomicSeePage14ofHarman:ModernFctor ysis,3rdEDPrincipalComponent MeansandStandardDeviationsfrom12Std EMPLOY InitialFactorMethod:PrincipalPriorCommunalityEstimates:EigenvaluesoftheCorrelationMatrix:Total=5123452factorswillberetainedbyMINEIGENInitialFactorMethod:Principal VarianceexinedbyeachfactorFACTOR1FACTOR22.873314FinalCommunalityEstimates:Total= EMPLOYSERVICES 0.9878260.8851060.9793060.8802360.937500例二(PrincipalAxisCommonFactor程對同一套輸入資料文件執(zhí)行主軸因子分析因變量的共通性預估值是SMC故METHOD選項的內設值是主軸因子分析因子的坐標轉換采PROMAX法這個例子REORDER選項)最后將分析結果放入一個叫FACT_ALL的輸出資料文件內程PROCPROCFACTORDATA=SOCECONPRIORS=SMCMSASCREERESIDUALPREPLOTROTATE=PROMAXREORDERPLOTTITLE3'PrincipalFactor ysisPromaxRotation';PROCPRINT;TITLE3'FactorOutputData結與SCHOOL為主另一類因子以POP與EMPLOY為主這兩類因子可解釋成經濟因(FACTOR1)(FACTOR2)VARIMAXPROMAX的坐標轉換后顯明出來但變量SERVICES一直介于這兩個因子之間無法被納入某一個因子SERVICES在任一因子上的負荷量時可試著采用HK轉換法此法所需輸入資料文件可由例二的輸出資料文件提供唯一必須修飾的地方是刪除_TYPE_='PATTERN'與_TYPE_='FCORR'的觀察體并將_TYPE_='UNROTATE'IF_TYPE_='PATTERN'|_TYPE_='FCORR'THENDELETE;IF_TYPE_='UNROTATE'THEN_TYPE_='PATTERN';PROCFACTORROTATE=HKNORM=WEIGHTREORDERTITLE3'Harris-KaiserRotationwithCureton-MulaikWeights';35.2(PrincipalAxisCommonFiveSocioeconomicSeePage14ofHarman:ModernFctorysis,3rdPrincipalComponentysisPrincipalFactorysisPromaxRotationInitialFactorMethod:PrincipalPartialCorrelationsControllingallotherKaiser'sMeasureofSamplingAdequacy:Over-allMSA=0. EMPLOY 0.4720790.5515880.4885110.806644PriorCommunalityEstimates: EMPLOYSERVICES 0.9685920.8222850.9691810.785724EigenvaluesoftheReducedCorrelationMatrix:Total=4. Average=0.123452factorswillberetainedbythePROPORTIONScreePlotofE3 e2 a1 e0 FactorPattern Varianceexinedbyeachfactor 2.734301FinalCommunalityEstimates:Total=0.71370- 0.9781130.817564ResidualCorrelationsWithUniquenessontheRootMeanSquareOff-diagonalResiduals:Over-all=0. EMPLOY 0.0081530.0181300.0138280.021517PartialCorrelationsControllingRootMeanSquareOff-diagonalPartials:Over-all= EMPLOYSERVICES 0.1585080.1902590.2318180.154470PlotofFactorPatternforFACTOR1and1 E -1-.9-.8-.7-.6-.5-.4-.3-.2-.10.1.2.3.4.5.6.7.8.91.0- - - SCHOOL EMPLOY PrerotationMethod:Varimax1212RotatedFactorVarianceexinedbyeach 2.349857FinalCommunalityEstimates:Total=4.450370 EMPLOY 0.9781130.8175640.9719990.797743PlotofFactorPatternforFACTOR1andFACTOR21E C -1-.9-.8-.7-.6-.5-.4-.3-.2-.10.1.2.3.4.5.6.7.8.9-O-R-2SCHOOL- RotationMethod:TargetMatrixforProcrustean 121-2- NormalizedObliqueTransformationMatrix 1 2- Inter-factor ReferenceAxis 1.00000- - RotatedFactorPattern(StdReg ReferenceStructure(Semipartial - - - Varianceexinedbyeachfactoreliminatingotherfactors 2.248089FactorStructureVarianceexinedbyeachignoringotherfactors FinalCommunalityEstimates:Total=4.450370 EMPLOY 2.447349 0.9781130.8175640.9719990.797743PlotofReferenceStructureforFACTOR1andReferenceAxisCorrelation=-0.2019Angle=101.64711EB -1-.9-.8-.7-.6-.5-.4-.3-.2-.10.1.2.3.4.5.6.7.8.91.0- - -2SCHOOLEMPLOY FiveSocioeconomicSeePage14ofHarman:ModernFctorysis,3rdEDFactorOutputDataSet123N456789--...-... 例三最大可能率的因子分析(umLikelihoodFactor對SOCECONMETHOD=ML)分析過程包括單因子(N=1)N=2)N=3)的解法每一解法均以Chi-Square最后我們還是覺得雙因子的結論最合適三因子的解法太多余而單因子解法并程PROCPROCFACTORDATA=SOCECONMETHOD=MLHEYWOODTITLE3' un-LikelihoodFactor ysiswithOneFactor';PROCFACTORDATA=SOCECONMETHOD=MLHEYWOODN=2;TITLE3' un-LikelihoodFactor ysiswithTwoFactors';PROCFACTORDATA=SOCECONMETHOD=MLHEYWOODN=3;TITLE3 un-Likelihood ysiswithThree結所以經過這三次因子分析檢定35.335.3umLikelihoodFiveSocioeconomicSeePage14ofHarman:ModernFctorysis,3rdun-LikelihoodFactorysiswithOneFactor(單因子的解法InitialFactorMethod:umPriorCommunalityEstimates: EMPLOYSERVICES 0.9685920.8222850.9691810.785724PreliminaryEigenvalues:Total= Average=123451factorswillberetainedbytheNFACTORIter 10.0000.938280.722271.000000.7194020.0000.945660.023801.000000.26493ConvergencecriterionSignificancetestsbasedon12TestofH0:Nocommonfactors. TestofH0:1Factorsaresufficient.vsHA:Atleastonecommon vsHA:MorefactorsareChi-square=54.252 df=10 Prob>chi**2=0.0000 Chi-square=24.466 df=5 Chi-squarewithoutBartlett'scorrection=34.Akaike'sInformationCriterion=24.Schwarz'sBayesianCriterion=21.TuckerandLewis'sReliabilityCoefficient=SquaredCanonicalEigenvaluesoftheWeightedReducedCorrelationTotal=0Average= 1.927160-0.228313-0.792956- 2.1554730.564643FactorVariance inedbyeach UnweightedFinalCommunalityEstimatesandVariableTotalCommunality:Weighted= Unweighted= EMPLOYSERVICES 0.9456560.0238031.0000000.2649350.014866 18.401165 1.360424un-LikelihoodFactorysiswithTwoFactors(雙因子的解法)PriorCommunalityEstimates:SMC EMPLOYSERVICES 0.9685920.8222850.9691810.785724PreliminaryEigenvalues:Total= Average=123452factorswillberetainedbytheNFACTOR11.000000.806720.950580.7934821.000000.808210.960230.8104831.000000.811490.959480.8167741.000000.809850.959630.8149851.000000.810190.959550.81569ConvergencecriterionSignificancetestsbasedon12TestofH0:Nocommonfactors. TestofH0:2Factorsaresufficient.vsHA:Atleastonecommon vsHA:MorefactorsareChi-square=54.252 df=10 Prob>chi**2=0.0000 Chi-square=2.198 df=1 Chi-squarewithoutBartlett'scorrection=3.Akaike'sInformationCriterion=1.Schwarz'sBayesianCriterion=0.TuckerandLewis'sReliabilityCoefficient=SquaredCanonicalCorrelations 1.0000000.951889EigenvaluesoftheWeightedReducedCorrelationMatrix:Total=19. Average=4.123123-0.039771-- - Factor Variance inedbyeach 24.4329712.138861FinalCommunalityEstimatesandVariableTotalCommunality:Weighted= Unweighted= EMPLOY 0.8101450.815603.5.2682945.425646un-LikelihoodFactorysiswithThreeFactors(三因子的解法)PriorCommunalityEstimates:SMC EMPLOYSERVICES 0.9685920.8222850.9691810.785724PreliminaryEigenvalues:Total= Average= 63.70100913.0547190.327639-0.347281- 50.64628912.7270800.674920 - - 3factorswillberetainedbytheNFACTORWARNING:Toomanyfactorsforauniquesolution.IterCriterion 0.031 0.960810.841841.000000.80175 0.031 0.980810.887131.000000.7955934.13501E-0.981950.886031.000000.8049842.53532E-0.982020.885851.000000.80561Converged,butnottoaproperoptimum.Tryadifferent'PRIORS'statement.Significancetestsbasedon12TestofH0:Nocommonfactors. TestofH0:3Factorsaresufficient.vsHA:Atleastonecommon vsHA:MorefactorsareChi-square= df= Prob>chi**2= Chi-square= df=- Prob>chi**2=Chi-squarewithoutBartlett'scorrection=2. Akaike'sInformationCriterion=4.Schwarz'sBayesianCriterion=TuckerandLewis'sReliabilityCoefficient=0SquaredCanonicalCorrelations 1.0000000.975189EigenvaluesoftheWeightedReducedCorrelationMatrix:Total=41. Average=10.12345.-..-.FactorVarianceexinedbyeachfactor 54.61152439.305483Unweighted2.2492602.276344FinalCommunalityEstimatesandVariableTotalCommunality:Weighted= Unweighted= EMPLOYSERVICES 0.9820170.8858521.0000000.805643 55.606690 5.14442636章PROC典型相關的功能在于分析兩組變量間的關系這兩組變量的數目可以不止一個或不等當兩組都只含一個變量時典型相關就是皮爾森相關當一組含一個變量另一組含多個變量時典型相關就是復相關當兩組都含多個變量時就是典型相關所以皮爾森相PROCCANCORRCANCORR程序可用來執(zhí)行典型相關分析典型凈相關分析及典型冗余分析(CanonicalRedundancyysis)(過)標準化的典型相關系數所有典型變量與原始變量之間的相關系數以及典型變量值為了了解CANCORR程序如何找出兩組變量之間的關系讀者必須先熟悉三個名詞典型變量典型相關及典型系數典型變量乃各組變量所形成的線性組合典型相即典型變量)之間的相關又稱典型加權值)表示分析時CANCORR程序從各組內找出具有最高典型相關的一對典型變量稱為第一然后CANCORR程序再找出具有次高典型相關的另一對典型變量稱為第二典型變量如此重復多次重復的次數等于含較少變量那一組的變量數目CANCORR程序假F檢定來檢驗典型相關是否為0請讀者注意即第一對典型變量第二對典型變量...)之間必須是獨立無關的另外組內每一個典型變量只可和另一組內相對應的典型變量有相關而必須CANCORRCooleyLohns1971)TimmPROCCANCORRPROCCANCORR含七道指令PROC PROC WITH#1PROCCANCORRPROCCANCORR的選項可分五大類來討論 第二類選項可用來控制報表的打印第三類選項界定報表上變量名與計算過程的有關事宜第四類選項與回歸分析有關第五類選項與回歸分析中產生的統(tǒng)計量有關 為輸入資料文件命名這個資料文件可以包含原始變量的數據也可以是一個相關系數矩陣(TYPE=CORR或UCORR)或是一個變異數共變異數矩陣(TYPE=COV或UCOV)甚或TYPE=SSCP或TYPE=FACTOR的資料文件若省略此選項則SASSAS資料文件 件是一個相關系數或是一個變異數共變異數矩陣時不可用此選項 號 值的總和是選用WEIGHT指令的結 95% 95% F F t t SIMPLECORRREDUNDANCYFNCAN= 則讀者可用此選項界定F檢定中分母的自由度內設值是有效觀察體的總數減1 則讀者可用此選項界定F檢定中分子的自由度內設值是原回歸分析中自變量的數目SINGULARSING)=10108次方若某一變量與其它變量的復相關平方大于或等于1-P則此變量將自動從典型相關分析中剔出此時這個變量的典型系數便等于0VPREFIXVP)=VAR指令所導出的典型變量命名若讀者指定VP=ABC則第一第二典型ABC1ABC2內設值是V1V2等WPREFIXWP)=為WITH指令所導出的典型變量命名 若讀者指定WP=XYZ 則第一第二典型變量就是XYZ1 內設值是W1 VNAMEVN)='VAR變量名稱VAR指令中所列的變量串命名字數限在四十個字母之內且用單引號括之WNAMEWN)='WITH變量名稱讀者可用此選項在報表上為WITH指令中所列的變量串命名同樣地字數限在四十個字母之內用單引號括起來第四類選項這一對選項要求將VAR的變量串當作因變量 將WITH變量串當作自變量進行多變量的復回歸分析(MultivariateMultipleRegression)與上述(1)(2)的作法剛好相反這一對選項要求將WITH的變量串當作因變量將VAR變量串當作自變量進行多變量的復回歸分析第五類選項此選項)然而若你又界定了NOPRINT的選項則統(tǒng)計量不會在報表上印出來OUTSTAT=的輸出文件內BSEBTPROBTBT針對每一個回歸系數t(在此tT)F要求打印凈相關系數的平方(10)要求打印半凈相關系數的平方(11)#2VAR 若省略此指令則在本程序內其#3WITHCANCORR程序中使用這一道指令不可省略此指令列舉典型相關#4PARTIAL 其值將由第一第二組變量中凈化出來然后SAS再對凈化過后的兩組變量執(zhí)行典型凈相關分析#5FREQ#6WEIGHT這個變量的值是正實數代表觀察體的或#7BYSAS依據此指令所列舉的變量將資料文件分成幾個小的資料文 然后對每一個的資料文件分別執(zhí)行典型相關分 當讀者選用此指令時資料文件內的數據必須先BY變量串的值做由小到大的重新排列PROCSORT 例 FIT)包括兩組變量的數據第一組變量包括三個生理變量即WEIGHT)WAIST)PULSE)第二組變量包括三個運動變量即CHINS)仰臥起坐次數(SITUPS)及跳高成績(JUMPS)這些數據由一家的二十位中年會員所提供DATAINPUTDATAINPUTWEIGHTWAISTPULSECHINSSITUPSJUMPS;PROCCANCORRDATA=FIT8164VPREFIX=PHYSVPREFIX=PHYSVNAME='PhysiologicalMeasurements'WPREFIX=EXERWNAME='Exercise';VARWEIGHTWAISTPULSE;WITHCHINSSITUPSTITLE'Middle-AgedMeninaHealthFitnessTITLE2'DataCourtesyofDr.A.C.Linnerud,NCState結(-.6456)各組內變量的相關較高在生理變量組內最高的相關系數是體重和(.8702)(.6957)也是最高系數).7956F檢定后其顯著度在0635上下故無法下任何有力的結論其余兩個次要的典型系數都沒有達到任何顯著度所以歸納起來只能勉強算有一個典型系數因為各變量測量的單位不大相同(1.5793)+(-0.7754)+(-.0591)脈搏(0.7164)+(-1.0540)+(-.3495)0最后冗余分析的結果第一典型變量對另一組變量的解釋程度偏低只28.54%的生理變量以及25.84%Middle-AgedMeninaHealthFitnessClubDataCourtesyofDr.A.C.Linnerud,NCStateUnivMeansandStandard3PhysiologicalMeasurements Std320CorrelationsAmongtheOriginalCorrelationsAmongthePhysiological CorrelationsAmongthe -CorrelationsAmongtheOriginalCorrelationsBetweenthePhysiologicalMeasurementsandthe --CanonicalCorrelation Eigenvaluesof=CanRsq/(1- EigenvalueDifferenceProportionCorrelation1122-3.3.TestofH0:Thecanonicalcorrelationsinthecurrentrowandallthatfollowarezero Approx Num Den Pr>192431MultivariateStatisticsandF Num DenDFPr>Wilks'9Pillai's9Holing-Lawley9Roy'sGreatest3NOTE:FStatisticforRoy'sGreatestRootisanupperRawCanonicalCoefficientsforthePhysiological RawCanonicalCoefficientsfortheWEIGHT-CHINS-WAIST.SITUPS-PULSE-JUMPSStandardizedCanonicalCoefficients forthePhysiologicalMeasurements fortheExercise--CanonicalCorrelationsBetweenthePhysiological CorrelationsBetweentheExerciseMeasurementsandTheirCanonicalVariables andTheirCanonicalVariablesCanonicalCorrelationsBetweenthePhysiologicalMeasurements CorrelationsBetweentheExerciseandtheCanonicalandtheCanonicalVariablesoftheExercise VariablesofthePhysiologicalMeasurementsCanonicalRedundancyRawVarianceofthePhysiologicalExinedTheir TheCanonical Canonical 123RawVarianceoftheExerciseExinedbyTheir TheCanonical Canonical123StandardizedVarianceofthePhysiologicalExinedTheir TheCanonical Canonical123StandardizedVarianceoftheExinedTheir TheCanonical Canonical 123SquaredMultipleCorrelationsBetweenthePhysiologicalMeasurementsandtheFirst'M'CanonicalVariablesoftheExerciseM123SquaredMultipleCorrelationsBetweentheExerciseandtheFirst'M'CanonicalVariablesofthePhysiologicalMeasurementsM12337章PROCPROCMDSMDS是MultidimensionalScaling的簡稱中文的翻譯是多次元尺度法一般而言MDS代表一系列分析法其目的在于從一組距離矩陣中找出觀察體的坐標簡而言之MDSA與BA的坐標是(1,9)B的坐標是(-4,0)因此兩點間的歐幾里得距離是
反過來說若我們只知道A與B間的距離是 如何能AB點的位置亦即它們的坐標值呢?在執(zhí)行MDS的分析過程中讀者有許多的選擇比方說歐幾里得的距離計算只是其中的一種定義其它的定義可能導出的坐標值就不盡相同了其次距離與數據間吻合的程度也可有多種不同的定義最后輸入的資料文件內除了含觀察體兩兩之間的距離資料外也可含其它的變量早上中午下午等)如此就形成一個三元的MDS模型來解釋這一類型的數據MDS(Proximity兩個觀察點(如南非)或刺激詞(如紅色 橘色)間的距離長短這個距離可以是相似性的(Similarity)或相異性的(Dissimilarity) 或類似的程度比方說社會學家所研究的同儕指標(Sociometric)就屬于相似性數據此外兩個種族間通婚的頻率或兩城市間彼此通 相異性數據是上述相似性數據的亦即數據值愈大 最典型的相異性數據就是兩點間的歐幾里得距離或兩城市間飛行的距離等若一位研究 其所使用的測驗工具是1-5的相異度量表受試者以此量表判斷兩兩職業(yè)(如醫(yī)生與護士)間差異的程度 MDS程序利用非線性最小誤差法(NonlinearLeastSquares)根據輸入資料文件內的距離資料來估計各坐標值(Dimension這個名詞來自歐氏空間模型(WeightedEuclideanModel)與Carroll與Chang(1970)(INDSCAL)(GroupEuclideanSpace)相乘(IndividualEuclideanSpace)(0.5)INDSCAL模型中個人值(SubjectWeight)的平方根(Transformation距離作對應的關系視讀者對選項LEVEL=的界定轉換函數可以是一個回歸的模型或計量的模型若函數的形式是回歸的模型則其 fit(輸入數據) 若函數以計量模型的形式呈現則如下 fitFIT=所界定的函數轉 等于由選項LEVEL=界定的對應函數其形式可以是線性的仿射的誤差是左邊與右邊平衡時所需的差MDS程序假設誤差的分配是常態(tài)分配彼此之間是統(tǒng)計獨立的在這些假設的條件下最小誤差平方的估計法所導出的參數估計值是MDSKruskalWish CarrollDeSarboYoung1987)MDS實際應用的例子Torgerson1958MDS的理論基礎與心理計量學的發(fā)展 Young 示范MDS如何在很短的時間內把十大城市間的航空距離轉變成報表上的地圖格局這十個城市分別是亞特蘭大(Atlanta) 芝加哥(Chicago)丹佛(Denver) 休斯頓(Houston) 洛杉磯(LosAngeles) 邁阿密(Miami) 紐約(NewYork)舊金山(SanFrancisco) 西雅圖(Seattle) 及華府(WashingtonD.C) 的數據與第43章第6節(jié)的例一完全相同 讀者可參考該例附的地圖及十大城市的原由于輸入資料文件內的航空距離與兩兩城市間的歐氏距離十分接近故程序中測量度設定為(LEVEL=ABSOLUTE)這些選項導致上一節(jié)中所提到的轉換函數不產分析的結果會產生每一個城市在二度空間內的坐標值這些坐標值收集在一個輸出資料文件內然后經由PLOT程序繪出圖來OPTIONSOPTIONSLS=78PS=60TITLEDATAysisofagesbetween10AmericanINPUT(ATLANTACHICAGODENVERHOUSTONLOSANGELMIAMINEWYORKSEATTLEWASHDC)(5.)@56CITYNAME$000000Los748713142024510New3470San218217370ysisofagesbetweenysisofagesbetween10AmericanMultidimensionalScaling:Shape=TRIANGLECond=MATRIXLevel=ABSOLUTECoef=IDENTITYDim=2Formula=1Gconverge=0.01Maxiter=100Over=1C
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB32/T 3909-2020病媒生物防制技術規(guī)范居民區(qū)
- DB32/T 3858-2020白葉黑茶加工技術規(guī)程
- DB31/T 914.2-2021小型游樂設施安全第2部分:安裝要求
- DB31/T 891-2015預拌現澆泡沫混凝土應用技術規(guī)程
- DB31/T 637-2012高等學校學生公寓管理服務規(guī)范
- DB31/T 540-2022重點單位消防安全管理要求
- DB31/T 300-2018燃氣燃燒器具安全和環(huán)保技術要求
- DB31/T 1303-2021誠信計量示范社(街)區(qū)建設評價導則
- DB31/T 1230-2020呼吸道傳染病流行期間社會福利機構安全操作指南
- DB31/T 1146.3-2019智能電網儲能系統(tǒng)性能測試技術規(guī)范第3部分:頻率調節(jié)應用
- 2025年廣東省深圳市羅湖區(qū)中考英語二模試卷
- 四川省成都市2025屆高三第三次診斷性檢測數學試卷(含答案)
- 信息技術與社會發(fā)展試題及答案
- 供電公司安全日活動課件
- 兒童輸血指南課件
- 2025-2030中國充電機器人行業(yè)市場現狀分析及競爭格局與投資發(fā)展研究報告
- 胸腺瘤切除術后的護理
- dl∕t 5491-2014 電力工程交流不間斷電源系統(tǒng)設計技術規(guī)程
- 2025年共青團入團考試測試題庫及答案
- 《讀讀童謠和兒歌》(一-四測)閱讀練習題
- 公安指揮中心業(yè)務培訓
評論
0/150
提交評論