版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、注意電子文檔使用范圍多 元 統(tǒng) 計(jì) 分 析Multivariate Statistical Analysis主講:統(tǒng)計(jì)學(xué)院 許啟發(fā)(xuqifa1975)統(tǒng)計(jì)學(xué)院應(yīng)用統(tǒng)計(jì)學(xué)教研室School of Statistics2004年9月第三章 主成分分析【教學(xué)目的】1 讓學(xué)生了解主成分分析的背景、基本思想;2 掌握主成分分析的基本原理與方法;3 掌握主成分分析的操作步驟和基本過程;4 學(xué)會(huì)應(yīng)用主成分分析解決實(shí)際問題?!窘虒W(xué)重點(diǎn)】1 主成分分析的幾何意義;2 主成分分析的基本原理。§1 概述一、 什么是主成分分析1研究背景在實(shí)際問題的研究中,為了全面分析問題,往往涉及眾多有關(guān)的變量。但是,
2、變量太多不但會(huì)增加計(jì)算的復(fù)雜性,而且也給合理地分析問題和解釋問題帶來困難。一般說來,雖然每個(gè)變量都提供了一定的信息,但其重要性有所不同。實(shí)際上,在很多情況下,眾多變量間有一定的相關(guān)關(guān)系,人們希望利用這種相關(guān)性對(duì)這些變量加以“改造”,用為數(shù)較少的新變量來反映原變量所提供的大部分信息,通過對(duì)新變量的分析達(dá)到解決問題的目的。主成分分析及典型相關(guān)分析便是在這種降維的思維下產(chǎn)生的處理高維數(shù)據(jù)的統(tǒng)計(jì)方法。本章主要介紹主成分分析。主成分分析的基本方法是通過構(gòu)造原變量的適當(dāng)?shù)木€性組合,以產(chǎn)生一系列互不相關(guān)的新變量,從中選出少數(shù)幾個(gè)新變量并使它們含有盡可能多的原變量帶有的信息,從而使得用這幾個(gè)新變量代替原變量分
3、析問題和解決問題成為可能。當(dāng)研究的問題確定之后,變量中所含“信息”的大小通常用該變量的方差或樣本方差來度量。概括地說,主成分分析(principal component analysis)就是一種通過降維技術(shù)把多個(gè)指標(biāo)約化為少數(shù)幾個(gè)綜合指標(biāo)的綜合統(tǒng)計(jì)分析方法,而這些綜合指標(biāo)能夠反映原始指標(biāo)的絕大部分信息,它們通常表現(xiàn)為原始幾個(gè)指標(biāo)的線性組合。主成分概念最早是由Karl Parson于1901年引進(jìn)的,1933年Hotelling把這個(gè)概念推廣到隨機(jī)向量。在實(shí)踐中,主成分分析既可以單獨(dú)使用,也可和其它方法結(jié)合使用,如主成分回歸可克服多重共線性。2基本思想及意義哲學(xué)理念:抓住問題的主要矛盾。主成分
4、分析將具有一定相關(guān)性的眾多指標(biāo)重新組合成新的無相互關(guān)系的綜合指標(biāo)來代替。通常數(shù)學(xué)上的處理就是將這個(gè)指標(biāo)進(jìn)行線性組合作為新的綜合指標(biāo)。問題是:這樣的線性組合會(huì)很多,如何選擇?如果將選取的第一個(gè)線性組合即第一個(gè)綜合指標(biāo)記為,希望它能盡可能多地反映原來指標(biāo)的信息,即越大,所包含的原指標(biāo)信息 度量信息最經(jīng)典的方差是方差。就越多,的方差應(yīng)該最大,稱為第一主成分。如果第一主成分不足以代表原來個(gè)指標(biāo)的信息,再考慮選取即選擇第二個(gè)線性組合。為了有效地反映原來的信息,中已包含的信息,無須出現(xiàn)在中,即,稱為第二主成分。仿此可以得到個(gè)主成分。我們可以發(fā)現(xiàn)這些主成分之間互不相關(guān)且方差遞減,即數(shù)據(jù)的信息包含在前若干個(gè)主
5、成分中,因而只需挑選前幾個(gè)主成分就基本上反映了原始指標(biāo)的信息。這種既減少了變量的數(shù)目又抓住了主要矛盾的做法有利于問題的解決。二、 主成分分析的數(shù)學(xué)模型及幾何意義1數(shù)學(xué)模型(總體主成分)設(shè)有個(gè)樣品,每個(gè)樣品觀測(cè)個(gè)指標(biāo):,得到原始數(shù)據(jù)資料陣:。其中,。其協(xié)方差矩陣為它是一個(gè)階半正定矩陣。設(shè)為個(gè)常數(shù)向量,考慮如下的線性組合 簡(jiǎn)記為易知有如果我們希望用代替原來p個(gè)變量,這就要求盡可能地反映原p個(gè)變量的信息。這里,“信息”用的方差來度量,即越大,表示所含的中的信息越多。但由方差的表達(dá)式可知,必須對(duì)加以限制,否則無界。而最方便的限制是要求所有具有單位長(zhǎng)度,即因此,我們希望在約束條件之下,求使達(dá)到最大,由此
6、所確定的隨機(jī)變量稱為的第一主成分。如果第一主成分還不足以反映原變量的信息,考慮采用。為了有效地反映原變量的信息,中已有的信息就不必要再包含在中,用統(tǒng)計(jì)的語(yǔ)言來講,要求與不相關(guān),即于是,在約束條件及之下,求使達(dá)到最大,由此所確定的隨機(jī)變量稱為的第二主成分。一般地,在約束條件及之下,求使達(dá)到最大,由此所確定的隨機(jī)變量稱為的第主成分。2主成分的幾何意義從代數(shù)學(xué)觀點(diǎn)看主成分就是的一些特殊的線性組合,而在幾何上這些線性組合正是把構(gòu)成的坐標(biāo)系旋轉(zhuǎn)產(chǎn)生的新的坐標(biāo)系,新坐標(biāo)系使之通過樣品方差最大化方向。下面以二元正態(tài)變量為例說明主成分的幾何意義。當(dāng)時(shí),原變量是,設(shè),它們有下圖的相關(guān)關(guān)系:對(duì)于二元正態(tài)變量,個(gè)點(diǎn)
7、的散布大致是一個(gè)橢圓,在其長(zhǎng)軸方向取坐標(biāo)軸,在其短軸方向取坐標(biāo)軸。這相當(dāng)于在平面上作一坐標(biāo)變換,即按逆時(shí)針方向旋轉(zhuǎn)角度,得或這里的為正交矩陣,即。因此,在坐標(biāo)系中有如下性質(zhì):(1)和為的線性組合;(2)與不相關(guān);(3)與的總方差大部分歸結(jié)為軸上,而軸上很少。幾何意義:一般情況,個(gè)變量組成維空間,個(gè)樣品點(diǎn)就是維空間的個(gè)點(diǎn),對(duì)元正態(tài)分布變量來說,找主成分的問題就是找維空間中橢球體的主軸問題。§2 主成分的推導(dǎo)及性質(zhì)這里首先從理論上給出總體主成分,探討總體主成分的性質(zhì),而后再給出樣本主成分。一、 總體主成分1總體主成分的推導(dǎo)設(shè),其中且,。求主成分的過程就是尋找的線性組合,使相應(yīng)的方差盡可能
8、地大的過程。設(shè)協(xié)差陣的特征根為,相應(yīng)的正交單位特征向量為,則因此,所以,而事實(shí)上,當(dāng)時(shí)有由此可知,在約束條件之下,當(dāng)時(shí),使達(dá)到最大值,且。同理可求,且結(jié)論:的主成分就是以的特征向量為系數(shù)的線性組合,它們互不相關(guān),其方差為的特征根,主成分的名次是按照特征根大小的順序排列的。2總體主成分的性質(zhì)性質(zhì)1:設(shè)為的主成分,則其協(xié)差陣為由的協(xié)差所對(duì)應(yīng)特征根組成的對(duì)角陣。性質(zhì)2:。證明:。NOTE:此性質(zhì)說明各變量方差之和等于各個(gè)主成分的方差之和,即。因此,描述了第個(gè)主成分提取的信息占總信息量的份額。為此,可以給出方差貢獻(xiàn)率和方差累積貢獻(xiàn)率的定義。定義:稱為第個(gè)主成分的方差貢獻(xiàn)率,稱為前個(gè)主成分的方差累積貢獻(xiàn)
9、率。累積貢獻(xiàn)率表明了前個(gè)主成分提取了中的總信息量的份額。在實(shí)際應(yīng)用中,通常選取,使前個(gè)主成分的累積貢獻(xiàn)率達(dá)到一定的比例(如85%)。這樣用前個(gè)主成分代替原來的變量而不至于損失太多的信息,從而達(dá)到減少變量個(gè)數(shù)的目的。性質(zhì)3:。證明:因?yàn)椋?這里為第個(gè)分量為1其余分量為0的單位向量。并且使用了這個(gè)結(jié)論。所以,。3標(biāo)準(zhǔn)化變量的主成分 一個(gè)總體往往由個(gè)變量所組成,代表不同性質(zhì)的個(gè)指標(biāo),具有不同的計(jì)量單位,使得主成分方差的大小取決于量綱的選擇,從而導(dǎo)致各主成分方差大小排序的偏誤。實(shí)施標(biāo)準(zhǔn)化后,使得不同變量或指標(biāo)反映信息量的大小具有可比性。在實(shí)際問題中,不同的變量往往有不同的量綱,由于不同的量綱會(huì)引起個(gè)變
10、量取值的分散程度差異較大,這時(shí),總體方差則主要受方差較大的變量的控制。若用求主成分,則優(yōu)先照顧了方差大的變量,有時(shí)會(huì)造成很不合理的結(jié)果。為了消除由于量綱的不同可能帶來的影響,常采用變量標(biāo)準(zhǔn)化的方法,即令其中,。這時(shí),的協(xié)方差矩陣便是的相關(guān)矩陣,其中利用的相關(guān)矩陣作主成分分析,平行于前面的結(jié)論,可以有如下的定理。定理:設(shè)為標(biāo)準(zhǔn)化的隨機(jī)向量,其協(xié)方差矩陣(即的相關(guān)矩陣)為,則的第個(gè)主成分并且其中為相關(guān)矩陣的特征值,為相應(yīng)的正交單位化特征向量。這時(shí),第個(gè)主成分的貢獻(xiàn)為,前個(gè)主成分的累積貢獻(xiàn)為。4標(biāo)準(zhǔn)化和非標(biāo)準(zhǔn)化數(shù)據(jù)的主成分例:設(shè)協(xié)方差矩陣和對(duì)應(yīng)的相關(guān)矩陣分別為,如果從出發(fā)作主成分分析,易求得其特征值
11、和相應(yīng)的單位正交化特征向量為,則的兩個(gè)主成分分別為,第一主成分的貢獻(xiàn)率為我們看到由于的方差很大,它完全控制了提取信息量占99.2%的第一主成分(在中的系數(shù)為0.999),淹沒了變量的作用。如果從相關(guān)矩陣出發(fā)求主成分,可求得其特征值和相應(yīng)的單位正交化特征向量為,則的兩個(gè)主成分分別為此時(shí),第一個(gè)主成分的貢獻(xiàn)率有所下降,為。由此看到,原變量在第一主成分中的相對(duì)重要性由于標(biāo)準(zhǔn)化而有很大的變化。在由所求得的第一主成分中的,和的權(quán)重系數(shù)分別為0.040和0.999,主要由大方差的變量控制。而在由所求得的第一主成分中,和的權(quán)重系數(shù)反而成了0.707和0.0707,即的相對(duì)重要性得到提升。此例也表明,由和求得
12、的主成分一般是不相同的,而且,其中一組主成分也不是第二組主成分的某簡(jiǎn)單函數(shù)。在實(shí)際應(yīng)用中,當(dāng)涉及的各變量的變化范圍差異較大時(shí),從出發(fā)求主成分比較合理。二、 樣本主成分1樣本主成分的導(dǎo)出面討論的是總體主成分,但在實(shí)際問題中,一般(或)是未知的,需要通過樣本來估計(jì)。設(shè)為取處的一個(gè)容量為的簡(jiǎn)單隨機(jī)樣本,則樣本協(xié)方差矩陣及樣本相關(guān)矩陣分別為:其中,分別以和作為和的估計(jì),按照前面所述方法,從樣本協(xié)差陣和相關(guān)陣出發(fā)求出的主成分稱為樣本主成分。定理:設(shè)是樣本協(xié)方差矩陣,其特征值為,相應(yīng)的正交單位化特征向量為,則第個(gè)樣本主成分為其中為的任一觀測(cè)值。當(dāng)依次代入的個(gè)觀測(cè)值時(shí),便得到第個(gè)樣本主成分的個(gè)觀測(cè)值。這時(shí)這
13、時(shí),第個(gè)樣本主成分的貢獻(xiàn)率定義為:。同時(shí)為了消除量綱的影響,我們可以對(duì)樣本進(jìn)行標(biāo)準(zhǔn)化,即令則標(biāo)準(zhǔn)化數(shù)據(jù)的樣本協(xié)方差矩陣即為原數(shù)據(jù)的樣本相關(guān)矩陣。由出發(fā)所得的樣本主成分稱為標(biāo)準(zhǔn)化樣本主成分。只要求出的特征值及相應(yīng)的單位正交化特征向量,類似上述結(jié)果可求得標(biāo)準(zhǔn)化樣本主成分。這時(shí)標(biāo)準(zhǔn)化樣本的樣本總方差為。證明:對(duì)于標(biāo)準(zhǔn)化數(shù)據(jù)矩陣,樣本相關(guān)矩陣為,其中為相關(guān)矩陣的單位正交特征向量所組成的矩陣其特征根分別為,滿足?,F(xiàn)在考察從而新變量的樣本方差為,即對(duì)于有最大的方差;有次大的方差,。并且協(xié)方差為由于所以,新變量的樣本協(xié)方差結(jié)論:由推導(dǎo)過程可以看到,由變量,經(jīng)過正交變換得到的新變量不僅彼此不相關(guān),而且它們的方
14、差是特征根。這表明新變量就是所尋求的主成分,為了書寫的方便用來表示。2樣本主成分的性質(zhì)性質(zhì)1:第個(gè)主成分的系數(shù)向量是第個(gè)特征根所對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量,即若,則性質(zhì)2:第個(gè)主成分的方差為第個(gè)特征根,且任意兩個(gè)主成分都是不相關(guān)的,也就是主成分的樣本協(xié)方差矩陣是對(duì)角矩陣。性質(zhì)3:樣本主成分的總方差等于原變量樣本的總方差,即事實(shí)上,性質(zhì)4:第個(gè)主成分與第個(gè)變量樣本之間的相關(guān)系數(shù)為:, 證明過程詳見孫慧鈞P99。性質(zhì)4表明特征向量的第個(gè)分量描述了第個(gè)變量對(duì)第個(gè)主成分的重要性。習(xí)慣上稱主成分與變量的相關(guān)系數(shù)為中變量的載(負(fù))荷量。性質(zhì)5:第個(gè)主成分對(duì)所有變量的載荷量平方之和為主成分的方差,即,它表示主成分
15、對(duì)的總方差貢獻(xiàn),并等于對(duì)每個(gè)方差貢獻(xiàn)之和。性質(zhì)6:所有主成分對(duì)變量的總方差貢獻(xiàn)為,三、 主成分個(gè)數(shù)的選取我們知道,主成分分析的根本目的是把復(fù)雜的高維空間的(樣本)點(diǎn)降至低維空間進(jìn)行處理分析,這種降維要在盡量不損失原維空間信息的基礎(chǔ)上進(jìn)行。而信息總量的多少已經(jīng)過數(shù)據(jù)的正交變換集中反映在新變量的總方差上,即。而根據(jù)特征根的性質(zhì)知道:前面的特征根取值較大。因此,在實(shí)際研究過程只取個(gè)主成分中的前個(gè)進(jìn)行討論,因?yàn)樗辛诵畔⒖偭康慕^大部分。到底選擇多少進(jìn)行分析合適?需要確定相應(yīng)的準(zhǔn)則。185%原則 該原則是在實(shí)踐中總結(jié)出來的,與其它原則相比,通常有選取較多主成分的傾向。記方差的累積貢獻(xiàn)率為根據(jù)我國(guó)主成分
16、分析的實(shí)踐來看,通??梢员WC分析結(jié)果的可靠性。2的原則 實(shí)踐中,該準(zhǔn)則通常容易選取較少的主成分。先計(jì)算,然后將與之進(jìn)行比較,選取的前個(gè)變量的主成分。由于由樣本數(shù)據(jù)的相關(guān)矩陣所求得,所以,故只要選取的前個(gè)變量作為主成分即可。3斯格理(Screet)原則 這是從相反的方向來確定主成分的一種做法。實(shí)踐中,該準(zhǔn)則也傾向于選擇較多的主成分,而且一般不單獨(dú)使用。具體做法:計(jì)算特征根的差,如果前個(gè)比較近,即出現(xiàn)了較為穩(wěn)定的差值,則后個(gè)變量可以確定為非主成分。4巴特萊特檢驗(yàn)(Bartlet)原則 該檢驗(yàn)的精確性受到樣本容量大小的影響,當(dāng)較小時(shí),有可能低估突出變量的數(shù)目;當(dāng)較大時(shí),有可能高估突出變量的數(shù)目。檢驗(yàn)
17、的原假設(shè)是最后個(gè)分量均等于或不顯著地大于零。檢驗(yàn)統(tǒng)計(jì)量:其中:,具體做法:從開始,一直檢驗(yàn)到最后個(gè)個(gè)變量不顯著為止。§3 主成分的解釋主成分是原始變量進(jìn)行線性組合所得到的新變量,對(duì)于這些新變量賦予恰當(dāng)?shù)暮x是主成分分析中至關(guān)重要的一個(gè)環(huán)節(jié)。同時(shí),應(yīng)該注意主成分分析的使用場(chǎng)合。一、 主成分的解釋對(duì)主成分經(jīng)濟(jì)意義的解釋,通常只能結(jié)合被研究事物的具體指標(biāo)及其變量系數(shù)的大小作出,歸納起來主要有以下幾種解釋思路或方法。1從特征向量的各個(gè)分量數(shù)值的大小入手進(jìn)行分析與概括表明了變量與主成分之間的關(guān)系。主成分在變量上的系數(shù)越大,說明該主成分主要代表了該變量的信息;反之,若越接近于0,則表明幾乎沒有該
18、變量什么信息。2從特征向量的各個(gè)分量數(shù)值的符號(hào)入手進(jìn)行分析與概括主成分系數(shù)的符號(hào)表明了變量與主成分之間的作用關(guān)系,一般地,正號(hào)表示變量與主成分的作用同方向;而負(fù)號(hào)則表示變量與主成分作用是逆向變動(dòng)關(guān)系。3如果變量分組較有規(guī)則,則從特征向量各分量數(shù)值作出組內(nèi)、組間對(duì)比分析4如果主成分中,各變量的系數(shù)都大致相同,則要考慮是否存在一個(gè)一般性的影響因素二、 主成分分析適應(yīng)的場(chǎng)合由主成分分析的基本原理可知,其主要作用就是將若干相關(guān)指標(biāo)進(jìn)行綜合,根據(jù)相關(guān)程度的高低可以得出主成分的作用效果不完全相同,現(xiàn)將其歸納如下:3不完全相關(guān)主成分分析效果較好可以實(shí)施主成分分析高度相關(guān)中度相關(guān)低度相關(guān)1完全相關(guān)2完全不相關(guān)
19、不必實(shí)施主成分分析三、 主成分分析的基本步驟(計(jì)算過程)STEP01:將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,得;STEP02:計(jì)算的相關(guān)系數(shù)矩陣;STEP03:求相關(guān)系數(shù)矩陣的特征根及相應(yīng)的單位正交特征向量;STEP04:計(jì)算方差累積貢獻(xiàn)率,確定主成分的個(gè)數(shù);STEP05:寫出主成分,解釋其實(shí)際經(jīng)濟(jì)意義并指導(dǎo)實(shí)踐。§4 主成分分析法的應(yīng)用一、 主成分分析在經(jīng)營(yíng)管理中的應(yīng)用1企業(yè)經(jīng)濟(jì)效益分析某主管局管轄20個(gè)工廠,現(xiàn)要對(duì)每個(gè)工廠作經(jīng)濟(jì)效益分析,經(jīng)研究確定從所取得的生產(chǎn)成果同所消耗的人力、物力、財(cái)力的比率,選取五個(gè)指標(biāo)(或變量)作分析。:固定資產(chǎn)產(chǎn)值率;:凈產(chǎn)值勞動(dòng)生產(chǎn)率;:百元產(chǎn)值流動(dòng)資金占用率;:百
20、元產(chǎn)值利潤(rùn)率;:百元資金利潤(rùn)率;對(duì)這20個(gè)工廠同時(shí)按照這五個(gè)指標(biāo)收集數(shù)據(jù)(孫慧鈞P107)。解答:STEP01:將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,得;1-1.02 0.97 0.13 2.03 0.81 2-1.04 -0.96 0.85 -0.43 -0.90 3-1.25 0.69 1.20 1.36 -0.46 40.20 1.02 0.49 0.58 0.00 5-0.26 -1.07 0.13 -0.52 -0.11 6-1.29 -0.98 1.86 -0.21 -1.08 7-0.63 0.22 -0.29 1.02 0.61 80.21 0.33 -0.57 -0.46 -0.13 9-0
21、.71 0.39 -0.51 -0.32 -0.86 10-0.59 -0.28 0.48 -0.22 -0.57 111.60 2.32 -0.91 0.64 2.34 120.35 0.04 -1.58 0.01 0.24 131.34 -0.06 -0.96 -1.10 0.09 141.06 -0.08 -0.66 -1.17 -0.54 151.15 -0.62 -0.73 -1.46 -0.81 16-0.72 -1.35 0.12 -0.99 -1.05 171.34 1.46 -1.10 -0.31 1.04 180.17 -1.16 -0.04 -1.08 -0.52 191
22、.28 0.45 -0.32 1.18 2.35 20-1.18 -1.36 2.38 1.43 -0.45 STEP02:計(jì)算的相關(guān)系數(shù)矩陣;STEP03:求相關(guān)系數(shù)矩陣的特征根及相應(yīng)的單位正交特征向量;表1 相關(guān)系數(shù)矩陣的特征值及方差累積貢獻(xiàn)率 表2 相關(guān)系數(shù)矩陣的特征值所對(duì)應(yīng)的特征向量STEP04:計(jì)算方差累積貢獻(xiàn)率,確定主成分的個(gè)數(shù);根據(jù)85%原則,可以選擇個(gè)主成分。STEP05:寫出主成分,解釋其實(shí)際經(jīng)濟(jì)意義并指導(dǎo)實(shí)踐。表3 前2個(gè)主成分的組成變量主成分0.5030.499-0.4730.0690.518-0.3450.2870.3840.7470.309根據(jù)分析,在綜合其它變量所反
23、映信息的基礎(chǔ)上,突出地反映了經(jīng)營(yíng)能力的大小。在綜合其它變量所反映信息的基礎(chǔ)上,突出地反映了企業(yè)盈利水平的高低。2食品業(yè)的經(jīng)營(yíng)決策某食品企業(yè)在對(duì)“未來開發(fā)方針的目標(biāo)”作出決策之前,要進(jìn)行廣泛的社會(huì)調(diào)查,以研究廣大消費(fèi)者對(duì)各種食品的嗜好程度。通常是將消費(fèi)者按男、女及年齡共分10個(gè)組作調(diào)查,如表所示表 調(diào)查對(duì)象分組性別男性女性組號(hào)12345678910年齡(歲)15以下15-2020-3030-4040以上15以下15-2020-3030-4040以上為了能從每個(gè)小組得到充分的信息,每個(gè)小組都至少調(diào)查50名消費(fèi)者,共發(fā)出785張調(diào)查表。在每張調(diào)查表中,列出100種食品,要求每個(gè)消費(fèi)者按自己的嗜好程度
24、對(duì)每種食品給予評(píng)分。最受歡迎的食品給9分,最不受歡迎的給1分。收回所有調(diào)查表后,作出初步匯總,即以小組為單元,在每個(gè)小組中,各成員都對(duì)這100種食品給予評(píng)分,求出每小組對(duì)每種食品的評(píng)分的均值,這樣每個(gè)小組就有100個(gè)數(shù)據(jù)。根據(jù)STEP01STEP04的分析,只需選擇前3個(gè)主成分即可,這3個(gè)主成分為:變量主成分0.2860.3310.3230.2990.2610.3090.3440.3480.3460.3030.4430.235-0.172-0.364-0.5090.4090.2560.036-0.160-0.2600.1940.3360.4420.3750.123-0.034-0.174-0.
25、290-0.322-0.522下面進(jìn)行STEP05,即分析主成分的經(jīng)濟(jì)意義及作用。在第一主成分中,每個(gè)變量的系數(shù)都在0.3左右,這表明反映了同年齡、性別無關(guān)的公共平均嗜好程度,即人們普遍的嗜好程度。由于的方差貢獻(xiàn)達(dá)到68.26%,所以如果充分考慮人們普遍的嗜好,作出經(jīng)營(yíng)決策就有七成把握。在第二主成分中,不論男性或女性都有著共同的規(guī)律,即年齡小的系數(shù)為正值,年齡大的系數(shù)為負(fù)值,而且隨年齡增大而下降。于是在綜合了各小組的信息基礎(chǔ)上,突出反映了年齡的嗜好程度。在第三主成分中,男性的系數(shù)為正值,女性的系數(shù)為負(fù)值,因而明顯地反映了性別的嗜好程度。綜上所述,食品加工業(yè)的經(jīng)營(yíng)決策,只需從三個(gè)方面充分地考慮:
26、人們喜歡吃與不喜歡吃的;青少年喜歡吃的,成人喜歡吃的;男性喜歡吃的,女性喜歡吃的。二、 主成分分析在經(jīng)濟(jì)指標(biāo)綜合評(píng)價(jià)中的應(yīng)用在實(shí)際工作中,多指標(biāo)的綜合評(píng)價(jià)不僅要求對(duì)被評(píng)事物(樣本點(diǎn))給出一個(gè)諸多方面的綜合描述,更需要用一個(gè)總指標(biāo)來說明被評(píng)事物的一般水平,通過排序確定其在總體中的相對(duì)位置,以便對(duì)被評(píng)事物之間作對(duì)比分析。主成分分析就滿足這樣的要求,在多指標(biāo)綜合評(píng)價(jià)中顯示出較強(qiáng)的優(yōu)越性,主要表現(xiàn)在:第一,主成分分析在對(duì)數(shù)據(jù)作標(biāo)準(zhǔn)化處理中,抽象掉各變量的異度量性,抽象掉各指標(biāo)(變量)的實(shí)際經(jīng)濟(jì)內(nèi)涵,使各指標(biāo)不受計(jì)量單位、數(shù)量級(jí)的影響,能夠通過數(shù)值的大小進(jìn)行對(duì)比分析和綜合。第二,主成分分析通過正交變換尋找主成分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全國(guó)閩教版初中信息技術(shù)八年級(jí)上冊(cè)第一單元《綜合活動(dòng)1 展評(píng)平面設(shè)計(jì)作品》說課稿
- 教育科學(xué)出版社《體育與健康》九年級(jí)羽毛球動(dòng)作組合練習(xí)說課稿
- Unit 3 Reading ②說課稿 -2024-2025學(xué)年滬教版(五四制)英語(yǔ)六年級(jí)上冊(cè)
- 2025年建筑用化工產(chǎn)品購(gòu)銷合同2篇
- Unit 2 Hobbies(Pronunciation) 說課稿 -2024-2025學(xué)年譯林版(2024)七年級(jí)英語(yǔ)上冊(cè)
- 26好的故事(說課稿)2024-2025學(xué)年六年級(jí)上冊(cè)語(yǔ)文統(tǒng)編版
- 信息技術(shù)必修二第三章第三節(jié)《搭建和優(yōu)化小型物流信息系統(tǒng)》說課稿001
- Unit 1 Teenage Life Discovering Useful Structures 說課稿-2024-2025學(xué)年高中英語(yǔ)人教版(2019)必修第一冊(cè)
- Starter Unit 3 Welcome Section A 1a-2d 說課稿2024-2025學(xué)年人教版英語(yǔ)七年級(jí)上冊(cè)
- Module 3 Unit 1 In our school(說課稿)-2024-2025學(xué)年牛津上海版(試用本)英語(yǔ)四年級(jí)上冊(cè)
- 電網(wǎng)調(diào)度自動(dòng)化系統(tǒng)調(diào)試報(bào)告模板
- 托福閱讀講義
- 輸電線路基礎(chǔ)知識(shí)輸電線路組成與型式
- 三年級(jí)數(shù)字加減法巧算
- GB/T 9755-2001合成樹脂乳液外墻涂料
- GB/T 10609.3-1989技術(shù)制圖復(fù)制圖的折疊方法
- GB 4053.2-2009固定式鋼梯及平臺(tái)安全要求第2部分:鋼斜梯
- 通力電梯培訓(xùn)教材:《LCE控制系統(tǒng)課程》
- 品管圈PDCA持續(xù)質(zhì)量改進(jìn)提高靜脈血栓栓塞癥規(guī)范預(yù)防率
- 一次函數(shù)單元測(cè)試卷(含答案)
- 陜西省榆林市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)
評(píng)論
0/150
提交評(píng)論