![第六章 主成分分析法_第1頁](http://file4.renrendoc.com/view/fac7f03e0ffa180701e5af00ab16712c/fac7f03e0ffa180701e5af00ab16712c1.gif)
![第六章 主成分分析法_第2頁](http://file4.renrendoc.com/view/fac7f03e0ffa180701e5af00ab16712c/fac7f03e0ffa180701e5af00ab16712c2.gif)
![第六章 主成分分析法_第3頁](http://file4.renrendoc.com/view/fac7f03e0ffa180701e5af00ab16712c/fac7f03e0ffa180701e5af00ab16712c3.gif)
![第六章 主成分分析法_第4頁](http://file4.renrendoc.com/view/fac7f03e0ffa180701e5af00ab16712c/fac7f03e0ffa180701e5af00ab16712c4.gif)
![第六章 主成分分析法_第5頁](http://file4.renrendoc.com/view/fac7f03e0ffa180701e5af00ab16712c/fac7f03e0ffa180701e5af00ab16712c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第六章主成分分析法主成分分析法是將高維空間變量指標轉(zhuǎn)化為低維空間變量指標的一種統(tǒng)計方法。由于評價對象往往具有多個屬性指標,較多的變量對分析問題會帶來一定的難度和復(fù)雜性。然而,這些指標變量彼此之間常常又存在一定程度的相關(guān)性,這就使含在觀測數(shù)據(jù)中的信息具有一定的重疊性。正是這種指標間的相互影響和重疊,才使得變量的降維成為可能。即在研究對象的多個變量指標中,用少數(shù)幾個綜合變量代替原高維變量以達到分析評價問題的目的。當然,這少數(shù)指標應(yīng)該綜合原研究對象盡可能多的信息以減少信息的失真和損失,而且指標之間彼此相互獨立。第一節(jié)引言主成分分析,也稱主分量分析,由皮爾遜(Pearson)于1901年提出,后由霍特林(Hotelling)于1933年發(fā)展了,這也正是現(xiàn)在多元統(tǒng)計分析中的一種經(jīng)典統(tǒng)計學觀點。經(jīng)典統(tǒng)計學家認為主成分分析是確定一個多元正態(tài)分布等密度橢球面的主軸,這些主軸由樣本來估計。然而,現(xiàn)代越來越多的人從數(shù)據(jù)分析的角度出發(fā),用一種不同的觀點來考察主成分分析。這時,不需要任何關(guān)于概率分布和基本統(tǒng)計模型的假定。這種觀點實際上是采用某種信息的概念,以某種代數(shù)或幾何準則最優(yōu)化技術(shù)對一個數(shù)據(jù)陣的結(jié)構(gòu)進行描述和簡化。主成分分析方法的主要目的就是通過降維技術(shù)把多個變量化為少數(shù)幾個主要成分進行分析的統(tǒng)計方法。這些主要成分能夠反映原始變量的絕大部分信息,它們通常表示為原始變量的某種線性組合。為了使這些主要成分所含的信息互不重迭,應(yīng)要求它們互不相關(guān)。當分析結(jié)束后,最后要對主成分做出解釋。當主成分用于回歸或聚類時,就不需要對主成分做出解釋。另外,主成分還有簡化變量系統(tǒng)的統(tǒng)計數(shù)字特征的作用。對于任意?個變量,描述它1們自身及其相互關(guān)系的數(shù)字特征包括均值、方差、協(xié)方差等,共有〃+號P(P-1)個參數(shù)。經(jīng)過主成分分析后,每個新變量的均值和協(xié)方差都為零,所以,變量系統(tǒng)的數(shù)字特征減少了P+1P(P-1)個。在對變量系統(tǒng)進行簡化時,最重要的是當系統(tǒng)變量被有效地降到2維時(即兩個主成分),就可以在平面上描繪每個樣本點,以獲得直接觀察樣本點間的相關(guān)關(guān)系以及樣本群點的分布特點和結(jié)構(gòu)。所以,主成分分析使高維數(shù)據(jù)點的可見性成為可能。在數(shù)據(jù)信息的分析過程中,對直觀圖像的觀察是一種重要手段,它能更好地協(xié)助系統(tǒng)分析人員的思維與判斷,及時發(fā)現(xiàn)大規(guī)模復(fù)雜數(shù)據(jù)群重的普遍規(guī)律與特殊現(xiàn)象,極大地體高數(shù)據(jù)信息的分析效率。在當今的決策支持系統(tǒng)理論與方法的研究中,將抽象空間或者高維空間中的信息以及一些更為復(fù)雜現(xiàn)象轉(zhuǎn)換為直觀的平面圖示是一種重要的研究途徑,能夠提高決策人員的洞察能力。主成分分析法來源于實踐。例如,從事數(shù)據(jù)分析工作的人往往面臨一張數(shù)據(jù)表,即數(shù)據(jù)矩陣。例如,在分析學生學習情況時,得到一張成績表,該表的列表示某門課程各學生成績,行表示一個學生的各科成績。一般而言,我們可以構(gòu)造一個數(shù)據(jù)矩陣,列表示變量或指標,行表示相應(yīng)變量的測量數(shù)據(jù)。一個數(shù)據(jù)矩陣階數(shù)往往非常大,使人眼花繚亂,抓不住重點,找不出規(guī)律。主成分分析的主要任務(wù)就是以某種最優(yōu)方法綜合一張數(shù)據(jù)表的信息,以達到簡化數(shù)據(jù)矩陣,降低數(shù)據(jù)維數(shù),從而揭示其主要結(jié)構(gòu)信息,并提出關(guān)于數(shù)據(jù)矩陣所提供信息的合理解釋。尤其是,這方面的一個著名成功應(yīng)用實例是美國統(tǒng)計學家斯通(Stone)在1947年對美國國民經(jīng)濟的研究。他利用美國1929—1938年各年的數(shù)據(jù),得到了17個反映國民收入與支出的變量要素,如雇主補貼、消費資料、生產(chǎn)資料、純公共支出、凈增庫、股息、利息、以及外貿(mào)平衡等等。在進行主成分分析后,用三個變量就取代了原來的17個變量,并且精度高達97.4%。根據(jù)經(jīng)濟學知識,斯通給這三個綜合變量分別取名為總收入F1、總收入變化率F2、經(jīng)濟發(fā)展或衰退的趨勢F3。更有意思的是,這三個新變量其實都是可以直接測量的。主成分分析法的主要降維思想可用如下簡單幾何觀點解釋。假設(shè)矩陣A是對具有p個變量指標的n個樣本所測量的數(shù)據(jù)矩陣。矩陣A的n行可看作空間Rp中的n個點或向量,表示n個個體X,X,…,X,而X=(x,x,…,x)T。主成分分析本質(zhì)上就是對原坐12 n k k1k2 kp標系進行平移和旋轉(zhuǎn)變換,使得新坐標的原點與數(shù)據(jù)群的重心重合,新坐標系的第一個坐標軸與數(shù)據(jù)變異的最大方向相對應(yīng),新坐標系的第二軸與第一軸標準正交,并且對應(yīng)于數(shù)據(jù)變異的第二大方向,以此類推。這些新軸分別被稱為第一主軸U],第二主軸U2,…。如果經(jīng)過舍去少量信息后,主軸U1,U2,…,Um(m<p)能夠十分有效地表示原數(shù)據(jù)的變異情況,則原來的p維空間Rp就被降至m維空間Rm。生成的空間宙(U「U2,…,Um)被稱為m維主超平面,尤其是當m=2時,就簡稱為主平面。這樣就可以用原樣本群點在主超平面上的投影來近似表達原樣本群。原樣本點在主超平面的第一主軸上的投影稱為第一主成分u「它構(gòu)成新數(shù)據(jù)表的第一個分析變量,在主超平面的第二主軸上的投影稱為第二主成分u2,它構(gòu)成新數(shù)據(jù)表的第二個分析變量,…。記主成分%均值和方差分別為E(uk)、Var(w),則主成分的分析結(jié)果為E(u)=0,k-1,2,…,m, Var(u)>Var(u)>…>Var(u)第二節(jié)數(shù)學原理對于給定的一個高維(p維)復(fù)雜變量系統(tǒng)(n個樣本),現(xiàn)在需要分析此變量系統(tǒng)的信息結(jié)構(gòu)。為此,我們希望對原數(shù)據(jù)進行簡化,但要達到信息損失最小,以期分析數(shù)據(jù)結(jié)構(gòu)。從數(shù)學上講,就是要對原數(shù)據(jù)變量降維,以獲得新的變量對問題進行解釋。要達到這一目的,可從多種途徑考察,現(xiàn)簡述如下。數(shù)據(jù)變異方向最大原理如果試圖以一個一維向量空間取代原p維向量空間,則應(yīng)該尋找數(shù)據(jù)群點分布方差最大的一個方向%,將其作為新的綜合變量方向,再將所有樣本點在該方向上投影,就可獲得原數(shù)據(jù)群在一維空間的最佳近似表示。如果要在二維空間中近似地表示原數(shù)據(jù)群點,則要尋找一個與u1垂直的方向u2,且數(shù)據(jù)群在此方向u2的分布方差僅次于Var(u?,是第二大的。如此下去,直到滿足最大限度地保持原數(shù)據(jù)信息為止。最小二乘原理對原p維空間Rp中的樣本群G={X1,X尸…,Xn},現(xiàn)在要通過一個線性變換,將其變?yōu)楦途S的空間宙(u「u2,…,Um),使得原數(shù)據(jù)點在此空間的投影能近似地代替原數(shù)據(jù),且信息損失最少。這實際上只需應(yīng)用最小二乘原理。設(shè)原數(shù)據(jù)點Xk在空間的投影點為土,則信息損失最少就是下式成立min才w|〔X-Xk=1其中w^(k=1,2,...,n)為樣本點的權(quán)重。(3) 數(shù)據(jù)群相似度改變最小原理假設(shè)以距離來衡量樣本點之間的相似性,則主成分分析理論證明主超平面可以使數(shù)據(jù)群的相似性改變最?。ù藭r用m維主超平面近似表達原數(shù)據(jù)群),此即min差nwwfX-XII2—||X-X2、ijVij" 11ij)i=1j=1(4) 系統(tǒng)變量綜合表現(xiàn)能力最佳原理如果試圖用一個綜合變量來代替原數(shù)據(jù)變量,則第一主成分u1就是最好的選擇。用統(tǒng)計語言描述就是變量u1與原數(shù)據(jù)變量的相關(guān)系數(shù)最大,maxfR2(u,X)k=1如果是用兩個主成分U]、u2來綜合原數(shù)據(jù)信息,則要求下式成立max差2R2(u,X)k=1i=1下面以系統(tǒng)變量綜合表現(xiàn)能力最佳原理為出發(fā)點,詳細討論主成分分析原理。對于給定的p維隨機向量X=(氣,%,...,X「TGRp,假定二階矩存在,記R=E(X),V=V(X)=E(X-E(X))(X-E(X))t。考慮如下線性變換_*TOC\o"1-5"\h\z\o"CurrentDocument"y=aTX=a x+a x H Fa x1 1 111 122 1pp\o"CurrentDocument"y=atX=a x+a x + +a x< 2 2 211 222 2pp (6.1)??.??????y=aTX=ax+ax+ +axpp p11p22 ppp我們的目的是變換后的y1是氣,x2,…,x的一切線性函數(shù)中方差最大的。但由于有Var(katX)=k2Var(atX)\o"CurrentDocument"1 1所以應(yīng)該限制變換(6.1)的系數(shù)矩陣行向量aT為單位向量。這樣問題變?yōu)槿缦聠栴}maxVar(y)=aTVast. aTa=1ii的解,此時y稱為第一主成分。
設(shè)人>X>…>x>0為非負定矩陣V的特征根,u,U設(shè)人>X>…>x>0為非負定矩陣V的特征根,u,U,…,U為相應(yīng)的單位特征1 2 p 1 2 p向量,且兩兩相互正交。令u=(u『、,???,u)=(u..) 為正交矩陣,則有ijpxp由于有aTVaUtup-1=ZXatukk==X£atuuTak=uTakk=&kk=1YXuutkkkK=1(atu)21k電1k=1(6.2)Z(a「u)2k=XatuuTa=XaTa特別取a1=u1有utVu=ut(Xu)=Xiiiiii因此,七=urX就是所求的第一主成分,其方差具有最大值X]。如果第一主成分所含信息不夠多,不足以代表原始的p個變量,則要考慮第二主成分y2。為了使y2所含信息與y1不重迭,應(yīng)要求Cov(七,y2)=0因此,第二主成分就是下列問題的解maxV(y)=aTVas.t. Cov(y,y)=0 (6.3)aTa=1l 22同樣可以求第三主成分,第四主成分等等。一般而言,第k主成分是下列問題的解maxV(y)=aTVas.t. Cov(y,y)=0,i=1,2,...,k-1aTa=1、 kk現(xiàn)在求第二主成分。由(6.3)知Cov(y,y)=Cov(utX,aTX)=aTVu=XaTu=0
1 2 1 2 2 1 121于是,aTu=021從而有
=£X(aTu)2k=2Var(y)=aTVa=Xx(aT=£X(aTu)2k=22 2 2 k2kk=1喬(mu)2k=2=XX(aTu)2=XaTUUta=XaT喬(mu)2k=22 2k22 2 222k=1當取a2="時,則有utVu=ut(utVu=ut(Xu)=X2 22 2=u;x就是所求的第二主成分,且具有方差X2。以此類推我們可求出第k主成分為yk=uTX或者具體寫為yy=uX+UXH FUk1k1 2k2(6.4)具有方差X具有方差X*(k=1,2,???,p)。第三節(jié)性質(zhì)及算法假設(shè)反映研究對象屬性的指標有p個,X=(%,x2,-,x「t,將這些指標看成p維隨機變量,則它的期望記為1^=E(X),二階矩(協(xié)方差矩陣)記為V=V(X)=E(X-E(X))(X-E(X))T。對于這種對象觀察了n個樣本,其數(shù)據(jù)矩陣記為Xg=(X,,)。從上面的分析看出,當把每個指^k(k=1,2,.../)看成隨機變量時,觀察的n個對象便是相應(yīng)樣本值。據(jù)此計算矩陣V的特征根X1>X2>...>Xp>0和相應(yīng)的單位特征向量勺,u2,…,u,便可構(gòu)造第k主成分y=utX,k=1,2,…,pkk可直接寫成Y=UtX。為了統(tǒng)一認識,下面將這種主成分的性質(zhì)羅列出來以備查用。(1)主成分的均值、協(xié)方差、方差記主成分y=(y,y,…,y)T,從前面的討論知道y=utx。寫1 2 p
fE(七):E(y「.A,A=〔E(y))' nk1E(Y)=X2則有則有E(Y)=E(UtX)=UtE(X)=Ut記Var(Y)=UTVar(X)U=UtVU=A對于原始變量與主成分之間的總方差,由于tr(A)=tr(UtVU)=tr(UtUV)=tr(V)所以£var(x)=£var(y)=£Xk=1 K=1 k=1也就是說,主成分分析把原始的p個變量七(k=1,2,...,p)的總方差tr(V)分解成了p個不相關(guān)變量yk(k=1,2,...逆)的方差之和£\。k=1(2)主成分yk(k=1,2,...,p)兩兩正交,且yTy,=0,1<i。j<pIy|2=X,k=1,2,(3)我們稱Y=UtX為對X的主成分變換。此變換是可逆的,且X=UY,被稱為用主成分的恢復(fù)數(shù)據(jù)變換。(4)原始變量X與主成分Y之間的相關(guān)性根據(jù)Y=UtX得X=UY,此即(6.5)=uy+uyh fuy,k=1,2,…,p(6.5)k11 k22 kpp故有Cov(x,y)=Cov(uy,y)=jCov(x,y)G—Cov(x,y)G—..VTjvr^7u=5門,,T2-,p(5)主成分對原始變量的貢獻率我們將第k主成分尸^^占總方差的比例p氣,yi)=vUijj(6.6)入(k=1,2,...,p)人ii=1稱為主成分yk的貢獻率。第一主成分y1的貢獻率最大,表明它解釋原始變量x(k=1,2,...,p)的能力最強,而y,y,…,y的解釋能力依次減弱。主成分分析的目的就k 1 2 p是為了減少變量的個數(shù),因此一般是不會使用所有p個主成分的,忽略一些帶有較小方差的主成分將不會給總方差帶來大的影響。前q個主成分的貢獻率之和為£氣£氣(6.7)A=4 =-k=1 (1<q<p)(6.7)q&乙k kkk=1 k=1稱為主成分y,y,…,y的累計貢獻率。它表明y,y,…,y解釋原始變量1 2 q 1 2 qxk(k=1,2,...,p)的能力。通常取較小的主成分變量維數(shù)q,使得累計貢獻率達到一個較高的百分比(通常要求80%以上)。這時的主成分y1,y2,…,yq可用來代替原始變量X1,x2,…,xp,從而達到降低變量維數(shù)的目的,同時使得原始信息損失盡量小。在了解了主成分的性質(zhì)后,我們現(xiàn)在可以討論主成分的計算步驟。對于給定的p維空間Rp中的n個樣本,其數(shù)據(jù)矩陣記為Xg=(x〃)。主成分的計算過程如下:Step1:計算隨機變量X的協(xié)方差矩陣V=V(X),其中E(X)=(E(x1),E(x2),...,E(xp))tV=V(X)=E(X-E(X))(X-E(X))t'Var(x) Cov(x,x)…Cov(x,x)'TOC\o"1-5"\h\z1 1 2 1PCov(x,x) Var(x) …Cov(x,x)(6.8)\o"CurrentDocument"= 2 1 2 2p(6.8)\o"CurrentDocument": : … :.?.Cov(x,x)Cov(x,x)… Var(x)\o"CurrentDocument"p1 p2 pStep2:計算矩陣S的前q個特征根使得A;>a,其中a通常取80%左右,A;通過(6.6)計算。Step3:計算矩陣S的前q個特征根所對應(yīng)的單位特征向量u=(u,u,…,u)t,k=1,2,...,qStep4:根據(jù)(6.4)計算前q個主成分分量y=ux+uxh fux,k=1,2,…,q (6.9)k1k1 2k2 pkp
Step5:根據(jù)(6.9)中原始變量與各主成分之間的系數(shù)關(guān)系做出解釋,必要時給出圖示。說明:由于有些問題中各項指標的量綱不一致,從而可能造成協(xié)方差矩陣中數(shù)據(jù)差異較大,為了消除這種差異,可以將協(xié)方差矩陣改為相關(guān)矩陣,上面的所有討論結(jié)果完全一樣,并不影響最終的結(jié)果。所以,可用相關(guān)矩陣R代替二階矩V,此時有R=(r) ,r=S3,,七) (6.10)可pxp 司qVar(x)Var(x.)注意公式(6.10)與(6.8)的差別。如果不知道隨機變量X的分布,從而無法計算其期望及二階矩,則還可以用樣本的點估計代替。假設(shè)對隨機變量X進行了n次觀察,其樣本矩陣記為Xg=(x.)似p,則有如下估計計算,令X=—l^xX=—l^x,k-1,2,—,p,^i=1s.=1£(x.-X)(x.-X)nk=1 3則有( 、svii、jj/pxp 一,、£?一. (3)當用協(xié)方差矩陣S=(s.)pxp或者R計算主成分時,獲得的主成分表達式(6.9)要變?yōu)閜kp+u~ bu~,k=1,2,.?.,qpkp此時對應(yīng)的指標是:x-x,如果V=S=<七£,如果V=RJsL「kk第四節(jié)應(yīng)用技術(shù)主成分分析法主要是對研究對象的高維指標實施降維,以便簡化問題,分析問題。因此,當獲得了需要的主成分后,我們首先就是對主成分做出解釋,分析主成分表達式6.9)的系數(shù)及其代表的含義。其次,主成分可用于揭示數(shù)據(jù)的奇異性,達到最終剔除奇異數(shù)據(jù)的目的。最后,也是主成分應(yīng)用最重要的一點,就是對研究對象及其系統(tǒng)做出綜合評價。一、主成分的解釋主成分y,七,…,y是對原始變量x,x,…,x的綜合,然而原始變量都有明確的含1 2 q 1 2 p義,無論是物理的,還是經(jīng)濟的。于是,自然要問對原始變量綜合后的每個主成分又有什么含義呢?這就是主成分的解釋。這種解釋可以幫助我們更清楚地認識研究系統(tǒng)的系統(tǒng)結(jié)構(gòu)、系統(tǒng)構(gòu)成、系統(tǒng)特征等。尤其是對時間序列數(shù)據(jù)進行主成分分析時,主成分分析能夠反映系統(tǒng)特征的變化趨勢,這種趨勢對于系統(tǒng)預(yù)測具有非常重要的意義。解釋主成分時,主要分析主成分表達式(6.9)的組合系數(shù),并結(jié)合實際背景確定主成分及其相關(guān)系數(shù)含義。對于公式(6.9)右端的系數(shù)"狄(j=1,2,...,p)稱為第k主成分七在第j個原始變量七上的載荷。它度量了Xj對yk的重要程度。在解釋主成分時,我們需要考察載荷以及主成分yk與原始變量乂)之間的相關(guān)性。根據(jù)公式(6.6)可知,載荷%(j=1,2,...,p)與相關(guān)系數(shù)p(xj,y^)成正比,僅相差一個常數(shù)倍。這樣,我們可以通過觀察主成分(6.9)的組合系數(shù)的大小及其符號,對主成分yk的物理含義做出解釋、判斷。如果這些系數(shù)既有正,又有負,說明該項主成分與一部分原始變量正相關(guān),一部分負相關(guān)。正相關(guān)時,*與Xj的變化趨勢同向;負相關(guān)時,反向。如果組合系數(shù)ujk(j=1,2,...,p)大,說明yk與xj的關(guān)系密切。通??梢愿鶕?jù)這些分析及其研究問題的背景,給出主成分的名稱定義。另外,對于公式(6.4)中最后一個主成分yp,由于它的貢獻率往往非常小,此時可以認為Var(y^)=0,此即y^接近于一個常數(shù)。雖然,y,的貢獻小而顯得不重要,但卻可能揭示出變量之間的一個共線性關(guān)系。如果最后幾個主成分的貢獻率都非常小,則可能表示變量之間有幾個共線性關(guān)系。這方面容易忽略,但對問題的分析確有幫助,應(yīng)該重視。二、綜合評價從前面的討論知道,第一主成分與原始變量的綜合相關(guān)度最大。從這個意義上來講,如果試圖應(yīng)用一個綜合變量來代替原始變量,則選擇第一主成分是最好的辦法。另一方面,第一主成分y1也是數(shù)據(jù)變異最大的方向,即y1是使原數(shù)據(jù)信息損失最小、精度最高的一維綜合變量。所以說,可以將y1用作系統(tǒng)評估指數(shù)。同時,由于在第一主成分方向上,樣本點的性質(zhì)差距最大,也易于對它們進行排序評估。顯然,y1的貢獻率可當作評估的精度。但要注意,如果對問題進行排序評價時,則要小心。此時要求第一主成分表達式中的所有載荷都為正,即y1與所有原始變量都正相關(guān),才能將y1用作系統(tǒng)排序評價。否則,不能將y1用作系統(tǒng)評價排序。另外需要注意的是,第一主成分的載荷必須滿足">0,j=1,2,…,p,才能將其用作jk綜合評價指標。因為如果某項載荷為零’即j?!蚪茷榱恪瘎t在評價時’可能會遺漏對應(yīng)指標七的重要信息。一般情況下,如果要將所有主成分都用作評價系統(tǒng)時,有文獻建議如下評價公式上式中的yk為前k個主成分,其系數(shù)為權(quán)重。這里同樣需要注意一個問題,就是所有主成分的載荷都為正時,才能將此公式用作綜合評價。否則,由于這種多指標屬性的無序(一些正相關(guān),一些負相關(guān)),不能這樣簡單地構(gòu)造評價公式。第五節(jié)應(yīng)用范例為了說明主成分分析的應(yīng)用,這里將用兩個實例進行分析。問題A:中國城鎮(zhèn)居民家庭消費分析[1]為了分析我國城鎮(zhèn)居民家庭消費結(jié)構(gòu),統(tǒng)計了1999年我國31個省、市和自治區(qū)的城鎮(zhèn)居民家庭平均每人全年消費性支出的八個主要變量數(shù)據(jù)(資料來源:2000年《中國統(tǒng)計年鑒》),單位:元,具體見表6-1。這八個變量分別是:x=食品x15x=衣著x26x=家庭設(shè)備用品及服務(wù)x37x4=醫(yī)療保健x8=交通和通訊=娛樂教育文化服務(wù)居住=雜項商品和服務(wù)城鎮(zhèn)居民家庭消費性支出數(shù)據(jù)表6-1地區(qū)x1x2x3x4x5x6x7x8北京2959.19730.79749.41513.34467.871141.82476.42457.64天津2459.77495.47697.33302.87284.19735.97570.84305.08河北1495.63515.90362.37285.32272.95540.58364.91186.63山西1406.33477.77290.15206.57201.50414.72281.84212.10內(nèi)蒙古1303.97524.29254.83192.17249.81463.09287.87192.96遼寧1730.84553.90246.91279.81239.18445.20330.24163.86吉林1561.86492.42200.49216.36220.69459.62360.48147.76黑龍江1410.11510.71211.88277.11224.65376.82317.61152.85上海3712.31550.74893.37346.93527.001034.98720.33462.03江蘇2207.58449.37572.40211.92302.09585.23429.77252.54
浙江2629.16557.32689.73435.69514.66795.87575.76323.36安徽1844.78430.29271.28126.33250.56513.18314.00151.39福建2709.46426.11334.12160.77405.14461.67535.13232.29江西1563.78303.65233.81107.90209.70393.99509.39160.12山東1675.75613.32550.71219.79272.59599.43371.62211.84河南1427.65431.79286.55206.14217.00337.76421.31165.32湖北1783.43511.88282.84201.01237.60617.74523.52182.52湖南1942.23512.27401.39206.06321.29697.22492.60226.45廣東3055.17353.23564.56356.27811.88873.06106.82420.81廣西2033.87300.82336.65157.78329.06621.74587.02216.27海南2057.86186.44202.72171.79329.65477.17312.93279.19重慶2303.29589.99516.21236.55403.92730.05436.41225.80四川1974.28507.76344.79203.21240.24575.10430.36223.40貴州1673.82437.75461.61153.32254.66445.59346.11191.48云南2194.25537.01369.07249.54290.84561.91407.70330.95西藏2646.61839.70204.44209.11379.30371.04269.59389.33陜西1472.95390.89447.95259.51230.61490.90469.10191.34甘肅1525.57472.98326.90219.86206.65449.69249.66226.19青海1654.69437.77256.78303.00244.93479.53286.56236.51寧夏1375.46480.89273.84317.32251.08424.75226.73195.93新疆1606.82536.05432.46235.82250.28541.30344.85214.40消費性支出相關(guān)矩陣數(shù)據(jù)表6-2x1x2x3x4x5x6x7x8x11.000x20.2471.000x30.6980.2581.000x40.4680.4230.6211.000x50.8280.0860.5850.5311.000x60.7690.2550.8560.6840.7081.000x70.670-0.2010.5690.3140.8000.6471.000x80.8770.3490.6670.6280.7760.7450.5251.000由于各項指標數(shù)據(jù)差異較大,下面通過相關(guān)矩陣進行主成分分析。通過計算,給出的8
項指標的相關(guān)矩陣R列于表6-2。由于相關(guān)矩陣的對稱性,所以表6-2中僅列出了下三角部分數(shù)據(jù)。 M 一 一一... 一、通過計算,相關(guān)矩陣R前三個特征根、特征向量、貢獻率見表6-3。M 一 一... 、一R的刖三個特征根、特征向量、貢獻率表6-3特征向量u1u2u3~x10.401-0.0770.415?x20.1320.7490.332?x30.3750.065-0.442?x40.3200.345-0.478?x50.388-0.2320.279?x60.4060.027-0.310?x70.326-0.496-0.034?x80.3960.0960.345特征值5.0981.3520.574貢獻率0.6370.1690.072累計貢獻率0.6370.8060.878由表6-3可知,取前兩個和三個特征根就可獲得累計貢獻率80.6%和87.8%。于是可構(gòu)造前三個主成分如下:y=0.401~+0.132~+0.375~+0.32~+0.388~+0.406~+0.326~+0.396~1 1 2 3 4 5 6 7 8y2=—0.077~1+0.749%+0.065%+0.345~4-0.232%+0.027%-0.326%+0.096%對于第一主成分y1,除了在~2上的載荷稍偏小外,其余都有幾乎相等的正載荷,反映了綜合性消費支出水平。因此,第一主成分y1稱為綜合消費性支出成分。第二主成分y2在變量~2上有很高的正載荷,在變量~4上有中等的正載荷,而在其余變量上有負載荷或很小的正載荷??梢哉J為這個主成分度量了受地區(qū)氣候影響的消費性支出(主要是衣著x2,其次是醫(yī)療保健尤4)在所有消費性支出中占的比重(也可理解為一種消費傾向)第二主成分可稱為消費傾向成分。第三主成分很難給出明顯的解釋,因此我們只取前面兩個主成分。TOC\o"1-5"\h\z記x二丈x,它是消費性總支出。y與x之間存在著高達r=0.989的正相關(guān)性,雖0 k 1 0然這兩個變量的關(guān)系極為密切,且意義相近,但兩者還是有一定區(qū)別的。氣,x2,…,x8中各變量對x的作用可以有很大的不同。如x的作用就特別大;而y是對x,x,…,x作標準0 1 1 12 8化變換(是基于對每項消費性支出平等看待的要求)后得到的,依據(jù) y1的表達式,x,x,…,x中的每個變量對y的作用是大致相同的。此
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度辦公用品店租賃與品牌合作推廣合同
- 二零二五年度藝術(shù)報刊物流配送與藝術(shù)交流合同
- 2025年度半年租賃合同糾紛快速裁決服務(wù)合同
- 三農(nóng)產(chǎn)品綠色消費認知與引導(dǎo)方案
- 滕竹的離婚協(xié)議書
- 臨床醫(yī)學與健康科學作業(yè)指導(dǎo)書
- 房屋拆除合同
- 人力資源合作協(xié)議書合同
- 跨境電商環(huán)境下供應(yīng)鏈管理優(yōu)化方案設(shè)計
- 三農(nóng)行業(yè)養(yǎng)殖場動物防疫方案
- 人教版二年級上冊加減混合計算300題及答案
- 車間主管年終總結(jié)報告
- 2023年四川省成都市武侯區(qū)中考物理二診試卷(含答案)
- 鮮切水果行業(yè)分析
- 《中國探月工程》課件
- 義務(wù)教育物理課程標準(2022年版)測試題文本版(附答案)
- 人工智能在地理信息系統(tǒng)中的應(yīng)用
- 第7章-無人機法律法規(guī)
- 藥劑科基本藥物處方用藥狀況點評工作表
- 拆遷征收代理服務(wù)投標方案
- 完形療法概述
評論
0/150
提交評論