主成分分析課件_第1頁
主成分分析課件_第2頁
主成分分析課件_第3頁
主成分分析課件_第4頁
主成分分析課件_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

主成分分析

主成分分析1§11.1什么是主成分分析及其基本思想問題的提出:

在對某一事物進行實證分析研究中,為了更全面準確反映出事物的特征及其發(fā)展規(guī)律,往往考慮與其有關系的多個指標,因此會產生的問題:(1)為避免漏掉重要信息而考慮盡量多的指標(2)隨著考慮指標的增多增加了問題的復雜性,并且多指標之間不可避免會造成信息的大量重疊(相關性),這種重疊有時甚至會掩蓋事物的真正特征與內在規(guī)律。

目的:§11.1什么是主成分分析及其基本思想問題的提出:2§11.1什么是主成分分析及其基本思想

主成分分析(PrincipalComponentAnalysis,PCA)也稱為主分量分析,是一種數(shù)據(jù)降維技術,主成分分析正是研究如何將多個具有較強相關性指標化為少數(shù)幾個綜合指標來解釋原來變量絕大多數(shù)信息的一種多元統(tǒng)計方法。把轉化生成的綜合指標稱之為主成分。

§11.1什么是主成分分析及其基本思想3§11.1什么是主成分分析及其基本思想

例1:某廠商要做一件上衣,需要測量很多尺寸,如身長,體重,袖長,胸圍,腰圍,肩寬,肩厚等十幾項指標

將多種指標綜合成幾個少數(shù)的綜合指標,作為分類的型號,可綜合成3項指標:一項反映長度的指標,一項反映胖瘦的指標,一項反映特體的指標?!?1.1什么是主成分分析及其基本思想4例2:醫(yī)學研究中常常需要對患者的健康狀況等進行評價,而這類評價要求內容全面,多個測量指標,最后產出綜合評價結果。將多個指標進行綜合總會面臨以下問題:1.各指標量綱不同,不能直接相加;2.各指標間存在相關,直接相加產生信息重疊;3.相加時需要考慮各指標的權重。

主成分分析ppt課件5主成分分析的基本思想:

設法將用原來眾多具有一定相關性的指標(比如p個)重新組合成一組新的相互無關的綜合指標來代替原來指標,同時根據(jù)實際需要,從中取幾個較少的綜合指標(主成分)盡可能多地反映原來指標的信息?!?1.1什么是主成分分析及其基本思想§11.1什么是主成分分析及其基本思想6注:

通常數(shù)學上的處理:新的綜合指標是原來p個指標的線性組合。指標“信息量”的表達用方差來表示,方差越大,表示該指標包含的信息越多。因此,在所有的線性組合中選取方差最大的F1作為第一主成分,將方差次大的F2作為第二主成分,且要求Cov(F1,)=0,保證F1中的信息不出現(xiàn)在F2中,以此類推,構造第三、第四,…第p主成分。

§11.1什么是主成分分析及其基本思想§11.1什么是主成分分析及其基本思想7§11.1什么是主成分分析及其基本思想實際工作中,挑選前幾個最大的主成分代替原來的指標信息,雖然會損失一部分信息,但是由于我們抓住了主要矛盾,在實際問題的研究中得益比損失大,這種既減少了變量的數(shù)目又抓住了主要矛盾的做法有利于問題的分析和處理?!?1.1什么是主成分分析及其基本思想8原始指標的線性組合綜合指標間不相關,且方差遞減第一主成分,第二主成分,…第p主成分選取前幾個最大的主成分代替原來指標的信息盡可能多地找出相關指標作為原始指標主成分分析流程圖:原始指標的線性組合綜合指標間不相關,且方差遞減第一主成分,第9§11.2主成分分析數(shù)學模型及幾何解釋§11.2主成分分析數(shù)學模型及幾何解釋10上述方程組要求:§11.2主成分分析數(shù)學模型及幾何解釋上述方程組要求:§11.2主成分分析數(shù)學模型及幾何解釋11§11.2主成分分析數(shù)學模型及幾何解釋用數(shù)學語言描述就是要求:§11.2主成分分析數(shù)學模型及幾何解釋用數(shù)學語言描述就是12§11.2主成分分析數(shù)學模型及幾何解釋注:(1)數(shù)學模型中用線性組合基于兩種原因:數(shù)學上容易處理和在實踐中效果好。(2)每次主成分的選取使Var(Fi)最大,如果不加限制就可使Var(Fi)趨于無窮大,就沒有意義了,常用的限制要求就是:§11.2主成分分析數(shù)學模型及幾何解釋注:13?????????????????????????????????????主成分分析的幾何解釋平移、旋轉坐標軸??????????????????????????????14

如果我們將xl

軸和x2軸先平移,再同時按逆時針方向旋轉角度,得到新坐標軸Fl和F2。Fl和F2是兩個新變量。如果我們將xl軸和x2軸先平移,再同時按15

根據(jù)旋轉變換的公式:根據(jù)旋轉變換的公式:16

旋轉變換的目的是為了使得n個樣品點在Fl軸方向上的離散程度最大,即Fl的方差最大。變量Fl代表了原始數(shù)據(jù)的絕大部分信息,在研究某問題時,即使不考慮變量F2也無損大局。經過上述旋轉變換原始數(shù)據(jù)的大部分信息集中到Fl軸上,對數(shù)據(jù)中包含的信息起到了濃縮作用。旋轉變換的目的是為了使得n個樣品點17§11.3總體主成分的推導及性質(1)主成分的推導:求主成分就是尋找X的線性函數(shù)使相應的方差盡可能地大,即使§11.3總體主成分的推導及性質(1)主成分的推導:18§11.3總體主成分的推導及性質§11.3總體主成分的推導及性質19§11.3總體主成分的推導及性質§11.3總體主成分的推導及性質20§11.3總體主成分的推導及性質§11.3總體主成分的推導及性質21§11.3總體主成分的推導及性質上述推導表明:

X1,X2,…Xp的主成分就是以Σ的特征向量為系數(shù)的線性組合,它們互不相關,其方差為Σ的特征根。主成分的名詞是按照特征根取值大小的順序排列的。在解決實際問題時,一般不是取p個主成分,而是根據(jù)累計貢獻率的大小取前K個?!?1.3總體主成分的推導及性質上述推導表明:22§11.3總體主成分的推導及性質定義:稱第一主成分的貢獻率為,由于,所以,

因此,第一主成分的貢獻率及時第一主成分方差在全部方差中的比值,這個比值越大,表明第一主成分綜合X1,X2,…,Xp信息的能力越強?!?1.3總體主成分的推導及性質定義:23§11.3總體主成分的推導及性質

前K個主成分的貢獻率(累計貢獻率)定義為:

如果前k個主成分的貢獻率達到85%,表明取前k個主成分基本包含了全部測量指標所具有的信息,這樣既減少了變量的個數(shù)又便于對實際問題的分析和研究?!?1.3總體主成分的推導及性質前K個主24§11.3總體主成分的推導及性質(2)主成分性質性質1性質2§11.3總體主成分的推導及性質(2)主成分性質25§11.3總體主成分的推導及性質性質3F1…FK…FPX1ρ(F1,X1)…ρ(FK,X1)…ρ(FP,X1)X2ρ(F1,X2)…ρ(FK,X2)…ρ(FP,X2)………………Xpρ(F1,XP)…ρ(FK,XP)…ρ(FP,XP)§11.3總體主成分的推導及性質性質3F1…FK…FPX26§11.3總體主成分的推導及性質性質4§11.3總體主成分的推導及性質性質427§11.3總體主成分的推導及性質性質5

此性質說明:上表中Fk對應的每一列關于各變量相關系數(shù)的加權平方和為λk即Var(Fk)?!?1.3總體主成分的推導及性質性質528§11.3總體主成分的推導及性質§11.3總體主成分的推導及性質29§11.4有關問題的討論(一)從協(xié)差陣出發(fā)還是從相關陣出發(fā)求主成分

從協(xié)差陣出發(fā)——求原始數(shù)據(jù)的協(xié)差陣的特征值特征向量的過程。

從相關陣出發(fā)——求原始數(shù)據(jù)的相關陣(標準化數(shù)據(jù)的協(xié)差陣)的特征值特征向量的過程。

從協(xié)差陣出發(fā)和從相關陣出發(fā)所求得的主成分一般來說是有差別的,而且這種差別有時候還很大?!?1.4有關問題的討論(一)從協(xié)差陣出發(fā)還是從相關陣出30§11.4有關問題的討論

對于度量單位不同的指標或是取值范圍彼此差異非常大的指標,一般不直接由其協(xié)差陣出發(fā)而應該考慮將數(shù)據(jù)標準化。

原始數(shù)據(jù)標準化處理后傾向于各個指標的作用在主成分的構成中相等。數(shù)據(jù)標準化的過程實際上就是抹殺原始變量離散程度差異的過程,標準化后各變量方差相等均等于1,而實際上方差也是對數(shù)據(jù)信息的重要概括形式,即對原始數(shù)據(jù)進行標準化后抹殺了一部分重要信息,因此才使得標準化后各變量在對主成分構成中的作用趨于相等。

§11.4有關問題的討論對于度量單位不同的31§11.4有關問題的討論

因此從相關陣出發(fā)求主成分有其不足之處,實際問題中不可盲目將數(shù)據(jù)標準化處理,可分別從協(xié)差陣和相關陣出發(fā)進行求解并研究其結果的差別,看是否有顯著差異并分析產生差異的原因,以確定用哪種結果更為可信?!?1.4有關問題的討論32§11.4有關問題的討論(二)主成分分析不要求數(shù)據(jù)來自正態(tài)總體

與很多多元統(tǒng)計分析方法不同,主成分分析不要求數(shù)據(jù)來自于正態(tài)總體,主成分分析實際上就是對矩陣結構的分析,主要用到矩陣運算及矩陣對角化技術?!?1.4有關問題的討論33§11.4有關問題的討論(三)主成分分析與重疊信息

主成分分析適用于變量之間存在較強相關性的數(shù)據(jù),如果原始數(shù)據(jù)相關性較弱,運用主成分分析后不能起到很好的降維作用,即所得的各個主成分濃縮原始變量信息的能力差別不大。一般當原始數(shù)據(jù)大部分變量的相關系數(shù)都小于0.3時,運用主成分分析不會取得很好的效果。

§11.4有關問題的討論(三)主成分分析與重疊信息34§11.4有關問題的討論

主成分分析對重疊信息的剔除是無能為力的。在實際選取初始變量進入分析時,對原始變量存在多重共線性的問題,應用主成分分析方法時要慎重。要考慮選取的初始變量是否合適,如果出于避免漏掉某些信息而特意選取了過多存在重疊信息的變量時,就要注意應用主成分分析得到的結果。

如果所得樣本協(xié)差陣的最小特征值接近于0,就意味著原始變量之間存在著多重共線性,即原始變量存在著不可忽視的重疊信息?!?1.4有關問題的討論主成分分析對重疊35§11.5由樣本數(shù)據(jù)求主成分例1.測得10名幼兒的身高,體重如下表,求主成分。對象號x1體重(kg)x2身高(cm)116.3108213.088318.3111415.095511.988614.495713.594812.188913.3931013.595均數(shù)14.1395.5標準差1.9658477.989577§11.5由樣本數(shù)據(jù)求主成分例1.測得10名幼兒的身高361.求相關系數(shù)矩陣Rr11=r22=1,r12=r21=0.95472.求R的特征根,解方程:即(1-λ)*(1-λ)-0.9547*0.9547=0得兩個根1.9547和0.0453,記為:λ1=1.9547,λ2=0.04531.求相關系數(shù)矩陣R2.求R的特征根,解方程:即(1-λ)*373.求特征向量Liλ1=1.9547所對應的特征向量用下式解:l11+0.9547l12=1.9547l110.9547l11+l12=1.9547l12l112+l122=1得l11=0.7071,l12=0.7071,第一主成分為:C1=0.7071X1+0.7071X2同樣的方法,用λ2=0.0453可計算出第二主成分,此處略。3.求特征向量Li38§11.5由樣本數(shù)據(jù)求主成分

設樣本觀測矩陣為Xn*p,樣本主成分計算步驟:1.將原始數(shù)據(jù)標準化(可選)2.求原始數(shù)據(jù)的協(xié)差陣Σ或相關陣R3.求Σ(或R)的特征根和特征向量4寫出主成分

§11.5由樣本數(shù)據(jù)求主成分39§11.5由樣本數(shù)據(jù)求主成分練習:§11.5由樣本數(shù)據(jù)求主成分練習:4041特征值標準正交特征向量是否有接近0的情況是其他處理否主成分對主成分進行分析深入分析選擇初始變量度量或取值范圍相同?是否(否)對比分析相關陣分析協(xié)方差陣主成分分析的邏輯框圖見圖5-3:41特征值標準正交特征向量是否有接近0的情況是其他處理否主成41【例5.2】數(shù)據(jù)集Employeedata為Midwestern銀行在1969-1971年之間雇員情況的數(shù)據(jù),共包括474條觀測及如下10個變量:Id(觀測號)、Gender(性別)、Bdate(出生日期)、Educ(受教育程度(年數(shù)))、Jobcat(工作種類)、Salary(目前年薪)、Salbegin(開始受聘時的年薪)、Jobtime(受雇時間(月))、Prevexp(受雇以前的工作時間(月))、Minority(是否少數(shù)民族)。下面我們用主成分分析方法處理該數(shù)據(jù),以期用少數(shù)變量來描述該地區(qū)居民的雇傭情況。2023/8/9中國人民大學六西格瑪質量管理研究中心42

目錄上頁下頁返回結束

§11.6主成分分析的上機實現(xiàn)SPSS軟件FACTOR模塊提供了主成分分析的功能。下面先以SPSS軟件包自帶的數(shù)據(jù)Employeedata.sav為例介紹主成分分析的上機實現(xiàn)方法,在SPSS軟件的安裝目錄下可以找到該數(shù)據(jù)集;然后,我們舉一個實際的例子介紹主成分分析的具體應用。2023/8/9【例5.2】數(shù)據(jù)集Employeedata為Midwes42§11.6主成分分析的上機實現(xiàn)

進入SPSS軟件,打開數(shù)據(jù)集Employeedata.sav。依次點選Analyze→DataReduction→Factor….進入FactorAnalysis(因子分析)對話框。(在SPSS軟件中,主成分分析與因子分析均在FactorAnalysis模塊中完成。此時,數(shù)據(jù)集Employeedata.sav中的變量名均已顯示在左邊的窗口中,依次選中變量educ、salary、salbegin、jobtime、prevexp并點向右的箭頭按鈕,這五個變量便進入variables窗口(此時若選中variables窗口中的變量,則窗口左側的箭頭按鈕即轉向左側,點此按鈕即可剔除所選中變量)。點擊右側的OK按鈕,即可得到如下輸出結果5-1?!?1.6主成分分析的上機實現(xiàn)進入SPSS軟件,打開43§11.6主成分分析的上機實現(xiàn)輸出結果11-1(1)Communalities給出了該次分析從每個原始變量中提取的信息,表格下面的注示表明,該次分析是用Factoranalysis模塊默認的信息提取方法即主成分分析完成的??梢钥吹匠芙逃潭刃畔p失較大外,主成分幾乎包含了各個原始變量至少90%的信息?!?1.6主成分分析的上機實現(xiàn)輸出結果11-1(1)Com44輸出結果11-1(2)TotalVarianceExplained表則顯示了各主成分解釋原始變量總方差的情況,SPSS默認保留特征根大于1的主成分,在本例中看到當保留3個主成分為宜,這3個主成分集中了原始5個變量信息的90.66%,可見效果是比較好的。輸出結果11-1(2)TotalVarianceExpl45輸出結果11-1(3)輸出結果11-1(3)46SPSS默認是從相關陣出發(fā)求解主成分,且默認保留特征根大于1的主成分,實際上,對主成分的個數(shù)我們可以自己確定SPSS默認是從相關陣出發(fā)求解主成分,且默認保留特征根大于147

【例11.2】在企業(yè)經濟效益的評價中,設計的指標往往很多。為了簡化系統(tǒng)結構,抓住經濟效益評價中的主要問題,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分。在對我國部分省、市、自治區(qū)獨立核算的工業(yè)企業(yè)的經濟效益評價中,涉及到9項指標,原始數(shù)據(jù)見表11-7,即樣品數(shù)n=28,變量數(shù)p=9?!纠?1.2】48

100固定資產原值實現(xiàn)值(%)100元固定資產原值實現(xiàn)利稅(%)100元資金實現(xiàn)利稅(%)100元工業(yè)總產值實現(xiàn)利稅(%)100元銷售收入實現(xiàn)利稅(%)每噸標準煤實現(xiàn)工業(yè)產值(元)每千瓦時電力實現(xiàn)工業(yè)產值(元)全員勞動生產率(元/人.年)100元流動資金實現(xiàn)產值(元)北京(1)119.2930.9829.9225.9715.4821783.4121006296.7天津(2)143.9831.5930.2121.9412.2928524.2920254363.1河北(3)94.817.217.9518.149.3711672.0312607322.2山西(4)65.811.0811.0612.1516.848.821.6510166284.7內蒙(5)54.799.249.5416.866.278941.87564225.4遼寧(6)94.5121.1222.8322.3511.2814162.3613.386311.7吉林(7)80.4913.3613.7616.67.1413062.079400274.1黑龍江(8)75.8615.8216.6720.8610.3712672.269830267上海(9)187.7945.939.7724.4415.0943464.1131246418.6江蘇(10)205.9627.6522.5813.427.8132024.6923377407.2浙江(11)207.4633.0625.7815.949.2838114.1922054385.5安徽(12)110.7820.720.1218.696.614682.2312578341.1福建(13)122.7622.5219.9318.348.3522002.6312164301.2表11-7100固定資產原值實現(xiàn)值(%)100元固定資產原值實現(xiàn)利稅(%)100元資金實現(xiàn)利稅(%)100元工業(yè)總產值實現(xiàn)利稅(%)100元銷售收入實現(xiàn)利稅(%)每噸標準煤實現(xiàn)工業(yè)產值(元)每千瓦時電力實現(xiàn)工業(yè)產值(元)全員勞動生產率(元/人.年)100元流動資金實現(xiàn)產值(元)北京(1)119.2930.9829.9225.9715.4821783.4121006296.7天津(2)143.9831.5930.2121.9412.2928524.2920254363.1河北(3)94.817.217.9518.149.3711672.0312607322.2山西(4)65.811.0811.0612.1516.848.821.6510166284.7內蒙(5)54.799.249.5416.866.278941.87564225.4遼寧(6)94.5121.1222.8322.3511.2814162.3613.386311.7吉林(7)80.4913.3613.7616.67.1413062.079400274.1黑龍江(8)75.8615.8216.6720.8610.3712672.269830267上海(9)187.7945.939.7724.4415.0943464.1131246418.6江蘇(10)205.9627.6522.5813.427.8132024.6923377407.2浙江(11)207.4633.0625.7815.949.2838114.1922054385.5安徽(12)110.7820.720.1218.696.614682.2312578341.1福建(13)122.7622.5219.9318.348.3522002.6312164301.2100固定資產49

江西(14)94.9414.714.1815.496.6916692.2410463274.4山東(15)117.5821.9320.8918.659.118202.817829331.1河南(16)85.9817.317.1820.127.6713061.8911247276.5湖北(17)103.9619.518.4818.779.1618292.7515745308.9湖南(18)104.0321.4721.2820.638.7212721.9813161309廣東(19)136.4423.6420.8317.337.8529593.7116259334廣西(20)100.7222.0420.921.889.6717322.1312441296.4四川(21)84.7314.3514.1716.937.9613102.3411703242.5貴州(22)59.0514.4814.3524.538.0910681.329710206.7云南(23)73.7221.9122.729.729.3814471.9412517295.8陜西(24)78.0213.1312.5716.839.1917312.0811369220.3甘肅(25)59.6214.0716.2423.5911.349261.1313084246.8青海(26)51.668.328.2616.117.0510551.319246176.49寧夏(27)52.958.258.8215.576.588341.1210406245.4新疆(28)60.2911.2613.1418.688.3910412.910983266續(xù)表5-7江西(14)950

0.4235231.3384051.5902821.6875562.2396340.4819710.9547461.2603710.0488050.9951991.4096491.6314530.6672281.0658731.1887581.8553941.1338441.200166-0.14352-0.271-0.10906-0.29487-0.00854-0.57821-0.45763-0.152790.49097-0.81499-0.98577-1.08721-1.811432.740046-1.79273-0.84655-0.56349-0.15927-1.06992-1.20067-1.303-0.61894-1.14919-0.86449-0.69303-1.00129-1.18752-0.150240.1868270.5837370.7710330.694243-0.3171-0.11989-2.27170.308902-0.47486-0.71949-0.7039-0.68477-0.82907-0.43245-0.4167-0.69238-0.34307-0.58206-0.43218-0.290780.393790.359408-0.47334-0.22224-0.62003-0.466192.0095833.0809562.9886561.3001862.0961332.7554331.6711712.9832842.1625242.4302940.9494850.548246-1.48989-0.582541.5557832.264781.6592991.9648512.4650251.5813351.002539-0.85187-0.041662.1944081.7530481.43671.5885780.2264810.1377740.199007-0.15562-1.02776-0.26257-0.25294-0.157670.8186910.5038680.3503370.172033-0.24423-0.383850.5050410.156444-0.227320.126834-0.14028-0.56298-0.64428-0.9658-0.99465-0.05179-0.24271-0.51352-0.337870.3839290.2814290.308322-0.16574-0.107890.1065570.3304330.725830.645294表5-8首先標準化原始數(shù)據(jù),標準化后的數(shù)據(jù)見表5-8。0.4235251§5.7主成分分析的上機實現(xiàn)

-0.34774-0.25932-0.218380.206435-0.63406-0.43245-0.60092-0.38161-0.301460.068569-0.00238-0.03382-0.13536-0.085810.1159940.279260.375190.2603510.070190.2277050.3636890.335558-0.24771-0.4681-0.50881-0.059580.2620850.8206170.4811450.299804-0.49995-0.567831.3009631.2617850.4616730.695579-0.006450.2942770.3097410.6520370.1018430.014276-0.35529-0.180720.043603-0.37669-0.60386-0.6457-0.60122-0.52735-0.42825-0.14036-0.30489-0.89101-0.97128-0.58868-0.620141.322972-0.47952-0.68202-1.18429-0.64022-1.51177-0.631610.2790930.5652822.636993-0.00486-0.28459-0.54975-0.167930.033199-0.53205-0.74635-0.87284-0.62654-0.074770.013227-0.40646-0.36109-1.27595-0.95809-0.63656-0.351821.084980.71632-0.83093-1.37875-0.07253-0.81645-1.14239-1.30812-1.48472-0.80883-0.86219-0.69566-1.19453-0.71829-2.03561-1.11252-1.3163-1.40522-0.94555-1.03512-0.92741-1.38899-0.52311-0.84073-0.94257-0.96475-0.79192-0.15815-0.36913-0.710340.432779-0.42603-0.48353續(xù)表5-8§5.7主成分分析的上機實現(xiàn)52

將表5-8數(shù)據(jù)導入spss軟件,依次點選Analyze-DataReduction-Factor進入FactorAnalysis對話框。(在spss中,主成分分析與因子分析均在FactorAnalysis模塊中完成。)如圖5-4所示:將表5-8數(shù)據(jù)導入spss軟件,依次53§5.7主成分分析的上機實現(xiàn)

此時,數(shù)據(jù)集5-5.sav中的變量名均顯示在對話框左邊的窗口中,選擇變量x1,x2,x3,x4,x5,x6,x7,x8,x9進入variables窗口中,操作如圖5-5所示:圖5-5§5.7主成分分析的上機實現(xiàn)此時,54

圖5-5點擊descriptives按鈕,在彈出的對話框中,在correlationmatrix中選擇coefficients?;氐皆瓕υ捒螯c擊右側的Ok,即可得到輸出結果5-4和輸出結果5-5。圖5-5點擊descriptives55

輸出結果5-4輸出結果5-456

輸出結果5-5由輸出結果5-4看到,前面2個主成分、的方差和占全部方差的比例為84.7%。我們就選取為第一主成分,為第二主成分,且這兩個主成分之方差和占全部方差的84.7%,即基本上保留了原來指標的信息,這樣由原來的9個指標轉化為2個新指標,起到了降維的作用。輸出結果5-5由輸出結果5-4看到,57

SPSS軟件得到因子載荷矩陣如下圖:SPSS軟件得到因子載荷矩陣如下圖:58

對SPSS的因子分析模塊運行結果輸出的ComponentMatrix的第列的每個元素分別除以第個特征根的平方根就得到主成分分析的第個主成分的系數(shù)。結果如下表:對SPSS的因子分析模塊運行結果輸出的Compo59

主成分1主成分2x10.3755586-0.25951x20.39339580.134374x30.37525560.265294x40.09353430.711329x50.1745590.491327x60.3721494-0.16496x70.3616165-0.2254x80.3513161-0.05236x90.3625942-0.12675主成分1主成分2x10.3755586-0.25951x260

(11.13)

其中,表示對原始變量標準化后的變量。由上表得到前2個主成分,,的線性組合為:由上表得到前2個主成分,,的線性組合為:其中,表示對原始變量標準化后的變量。由上表得到前2個主成分,,的線性組合為:

(11.13)其中,61

對所選主成分作經濟解釋。主成分分析的關鍵在于能否給主成分賦予新的意義,給出合理的解釋,這個解釋應根據(jù)主成分的計算結果結合定性分析來進行。主成分是原來變量的線性組合,在這個線性組合中,各變量的系數(shù)有大有小,有正有負,有的大小相當,因而不能簡單地認為這個主成分是某個原變量的屬性的作用。線性組合中個變量的系數(shù)的絕對值大者表明該主成分主要綜合了絕對值大的變量,有幾個變量系數(shù)大小相當時,應認為這一主成分是這幾個變量的總和,這幾個變量綜合在一起應賦予怎樣的經濟意義,要結合經濟專業(yè)知識,給出恰如其分的解釋,才能達到深刻分析經濟成因的目的。對所選主成分作經濟解釋。主成分分析62

我們所取的例子中有9個指標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論