《主成分分析實(shí)驗(yàn)》課件_第1頁(yè)
《主成分分析實(shí)驗(yàn)》課件_第2頁(yè)
《主成分分析實(shí)驗(yàn)》課件_第3頁(yè)
《主成分分析實(shí)驗(yàn)》課件_第4頁(yè)
《主成分分析實(shí)驗(yàn)》課件_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

主成分分析principalcomponentanalysis主成分的定義---綜合目的的尋求首先,將各變量規(guī)范化。對(duì)規(guī)范化變換后的變量xi,按以下步驟尋求一個(gè)又一個(gè)綜合目的:(1)尋求綜合目的C1:C1=a11x1+a12x2+…+a1pxp,且使Var(C1)最大,那么稱C1為第一主成分;〔2〕尋求綜合目的C2:C2=a21x1+a22x2+…+a2pxp,(a21,a22,…,a2p)垂直于(a11,a12,…,a1p),且使Var(C2)最大。按以上原那么繼續(xù)尋求綜合目的。主成分的性質(zhì)主成分間互不相關(guān):Corr(Ci,Cj)=0組合系數(shù)(ai1,ai2,…,aip)構(gòu)成的向量為單位向量:各主成分的方差是依次遞減的:Var(C1)≥Var(C2)≥…≥Var(Cp)總方差不增不減:Var(C1)+Var(C2)+…+Var(Cp)=Var(x1)+Var(x2)+…+Var(xp)=p主成分是原變量的線性組合,是對(duì)原變量信息的一種改組,主成分不添加總信息量,也不減少總信息量。計(jì)算X1,X2,…,Xp的相關(guān)矩陣R;求矩陣R的全部特征值,由大到小依次記為1,2,…i…,p;求相應(yīng)于特征值i的特征向量(ai1,ai2,…,aip)。主成分分析的實(shí)踐計(jì)算步驟第i主成分的方差PROCPRINCOMP過(guò)程PROCPRINCOMP<options>;1〕OUT=SAS-data-set〔SAS數(shù)據(jù)集〕---規(guī)定一個(gè)包含原始數(shù)據(jù)以及主成分的輸出數(shù)據(jù)集。2〕OUTSTAT=SAS-data-set〔SAS數(shù)據(jù)集〕---生成一個(gè)包含均值,規(guī)范差,觀測(cè)個(gè)數(shù),相關(guān)陣或協(xié)差陣,特征值和特征向量的輸出SAS數(shù)據(jù)集。3〕N=number〔個(gè)數(shù)〕---規(guī)定被計(jì)算的主分量個(gè)數(shù)。的值必需是大于等于零的整數(shù)。4〕PREFIX=name〔名字〕---規(guī)定主分量名字的前綴。缺省時(shí)的名字為PRIN1,PRIN2,PRINn。假設(shè)PREFIX=C,那么主分量名字為C1,C2,C3等。兩兩之間具有不同程度的相關(guān)性dataaa;inputidx1x2x3x4x5x6;cards;1 173.28 93.62 60.10 86.72 38.97 27.512 172.09 92.83 60.38 87.39 38.62 27.823 171.46 92.78 59.74 85.59 38.83 27.464 170.08 92.25 58.04 85.92 38.33 27.295 170.61 92.36 59.67 87.46 38.38 27.146 171.69 92.85 59.44 87.45 38.19 27.107 171.46 92.93 58.70 87.06 38.58 27.368 171.60 93.28 59.75 88.03 38.68 27.229 171.60 92.26 60.50 87.63 38.79 26.6310 171.16 92.62 58.72 87.11 38.19 27.1811 170.04 92.17 56.95 88.08 38.24 27.6512 170.27 91.94 56.00 84.52 37.16 26.8113 170.61 92.50 57.34 85.61 38.52 27.3614 171.39 92.44 58.92 85.37 38.83 26.4715 171.83 92.79 56.85 85.35 38.58 27.0316 171.36 92.53 58.39 87.09 38.23 27.0417 171.24 92.61 57.69 83.98 39.04 27.0718 170.49 92.03 57.56 87.18 38.54 27.5719 169.43 91.67 57.22 83.87 38.41 26.6020 168.57 91.40 55.96 83.02 38.74 26.9721 170.43 92.38 57.87 84.87 38.78 27.3722 169.88 91.89 56.87 86.34 38.37 27.1923 167.94 90.91 55.97 86.77 38.17 27.1624 168.82 91.30 56.07 85.87 37.61 26.6725 168.02 91.26 55.28 85.63 39.66 28.0726 167.87 90.96 55.79 84.92 38.20 26.5327 168.15 91.50 54.56 84.81 38.44 27.3828 168.99 91.52 55.11 86.23 38.30 27.14;procprincomp;varx1-x6;run;procprincompout=bbprefix=C;varx1-x6;run;某小學(xué)10名男學(xué)生六個(gè)工程的智力丈量計(jì)分表受試者常識(shí)算術(shù)了解填圖積木譯碼合計(jì)編號(hào)X1X2X3X4X5X6114132814223913021014151434351223111219132439118477792023735131224122638125619142216233713172016262138691908910149314611999815131446105109912102346109作業(yè)要求:計(jì)算相關(guān)矩陣、特征值并寫出各主成分的表達(dá)式。例18-3陳峰(1991)報(bào)告了主成分回歸的一個(gè)實(shí)例。有22例胎兒受精齡(Y,周)與胎兒外形丈量目的:身長(zhǎng)(X1,cm),頭圍(X2,cm),體重(X3,g)的數(shù)據(jù)如表25.5所示(引自中國(guó)衛(wèi)生統(tǒng)計(jì),1991,8(1))。試求由X1,X2,X3推算Y的回歸方程。dataaa;inputnox1x2x3y;cards;1 13.0 9.2 50.0 13.02 18.7 13.2 102.0 14.03 21.0 14.8 150.0 15.04 19.0 13.3 110.0 16.05 22.8 16.0 200.0 17.06 26.0 18.2 330.0 18.07 28.0 19.7 450.0 19.08 31.4 22.5 450.0 20.09 30.3 21.4 550.0 21.010 29.2 20.5 640.0 22.011 36.2 25.2 800.0 23.012 37.0 26.1 1090.0 24.013 37.9 27.2 1140.0 25.014 41.6 30.0 1500.0 26.015 38.2 27.1 1180.0 27.016 39.4 27.4 1320.0 28.017 39.2 27.6 1400.0 29.018 42.0 29.4 1600.0 30.019 43.0 30.0 1600.0 31.020 41.1 27.2 1400.0 33.021 43.0 31.0 2050.0 35.022 49.0 34.8 2500.0 36.0;線性回歸和線性相關(guān)分析procreg;modely=x1-x3;run;proccorr;varx1x2x3;run;主成分回歸分析procprincompout=bbprefix=C;varx1-x3;run;procreg;modely=C1-C2;run;C1=a11x1+a12x2+a13x3=0.58057x1+0.58107x2+0.57034x3C2=a21x1+a22x2+a23x3=-0.41852x1-0.38789x2+0.82121x3主成分回歸這里C1,C2的累計(jì)奉獻(xiàn)達(dá)99.92%,即我們利用了原資料的99.92%的信息,在丟掉0.08%的信息后,所得方程更符合實(shí)踐情況。如只取一個(gè)主成分與y作回歸,亦能得到合理的解釋。當(dāng)取全部主成分與y作回歸,所得方程與用原變量與y作回歸所得方程一樣。作業(yè):2.鄭俊池和王國(guó)立(1994)發(fā)表了一份30名嬰幼兒身高X1(cm)、體重X2(kg)、體外表積Y(cm2)的資料,現(xiàn)僅轉(zhuǎn)錄其中15例男性嬰幼兒的資料如表25.14所示(摘自中國(guó)衛(wèi)生統(tǒng)計(jì),1994,11(3))。PROCPRINCOMPOUT=SAS-data-set〔SAS數(shù)據(jù)集〕規(guī)定一個(gè)包含原始數(shù)據(jù)以及主分量得分的輸出數(shù)據(jù)集。假設(shè)用戶想創(chuàng)建永久的SAS數(shù)據(jù)集,他必需規(guī)定兩級(jí)名字。2OUTSTAT=SAS-data-set〔SAS數(shù)據(jù)集〕生成一個(gè)包含均值,規(guī)范差,觀測(cè)個(gè)數(shù),相關(guān)陣或協(xié)差陣,特征值和特征向量的輸出SAS數(shù)據(jù)集COVARIANCE/COV―要求從協(xié)差陣出發(fā)計(jì)算主分量N=number〔個(gè)數(shù)〕―規(guī)定被計(jì)算的主分量個(gè)數(shù)5PREFIX=name〔名字〕――規(guī)定主分量名字的前綴。缺省時(shí)的名字為PRIN1,PRIN2,PRINn。假設(shè)規(guī)定PREFIX=ABC,那么主分量名字為ABC1,ABC2,ABC3等等。前綴的字符個(gè)數(shù)加上數(shù)字的位數(shù)不能超越8?jìng)€(gè)。6STANDARD/STD―要求在OUT=的數(shù)據(jù)集里把主分量得分規(guī)范化為單位方差。假

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論