版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、主成分分析的基本原理 v假定有n個樣本,每個樣本共有p個變量,構(gòu)成一個np階的數(shù)據(jù)矩陣npnnppxxxxxxxxxX212222111211(1) v降維處理!當(dāng)p較大時,在p維空間中考察問題比較麻煩。降維是用較少的幾個綜合指標(biāo)代替原來較多的變量指標(biāo),而且使這些較少的綜合指標(biāo)既能盡量多地反映原來較多變量指標(biāo)所反映的信息,同時它們之間又是彼此獨(dú)立的。定義:記x1,x2,xP為原變量指標(biāo),z1,z2,zm(mp)為新變量指標(biāo)pmpmmmppppxlxlxlzxlxlxlzxlxlxlz22112222121212121111(2) v系數(shù)lij的確定原則: zi與zj( ij;i,j=1,2
2、,m )相互無關(guān); z1是x1,x2,xP的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,xP的所有線性組合中方差最大者; zm是與z1,z2,zm1都不相關(guān)的x1,x2,xP, 的所有線性組合中方差最大者。 則新變量指標(biāo)z1,z2,zm分別稱為原變量指標(biāo)x1,x2,xP的第一,第二,第m主成分。 從以上的分析可以看出,主成分分析的實質(zhì)就是確定原來變量xj(j=1,2 , p)在諸主成分zi(i=1,2,m)上的載荷 lij( i=1,2,m; j=1,2 ,p)。 從數(shù)學(xué)上可以證明,載荷lij分別是相關(guān)矩陣的m個較大的特征值所對應(yīng)的特征向量。 二、計算步驟 (一)計算相關(guān)系數(shù)矩陣
3、(一)計算相關(guān)系數(shù)矩陣 rij(i,j=1,2,p)為原變量xi與xj的相關(guān)系數(shù), rij=rji,其計算公式為:pppppprrrrrrrrrR212222111211(3) nknkjkjikinkjkjikiijxxxxxxxxr11221)()()((4) (二)計算特征值與特征向量:(二)計算特征值與特征向量: 解特征方程,求出特征值,并使其按大小順序排列 ; 0RI0,21p 分別求出對應(yīng)于特征值的特征向量 ,要求 =1,即,其中表示向量 的第j個分量。i), 2 , 1(piliil112pjijlijlil 計算主成分貢獻(xiàn)率及累計貢獻(xiàn)率 貢獻(xiàn)率:),2, 1(1pipkki累計
4、貢獻(xiàn)率: ),2, 1(11pipkkikk一般取累計貢獻(xiàn)率達(dá)8595%的特征值所對應(yīng)的第一、第二、第m(mp)個主成分。 m,21pnpnnppxxxlllllllllZ.21212222111211(6) 各主成分的得分三、 主成分分析方法應(yīng)用實例表表1 1 某農(nóng)業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)各區(qū)域單元的有關(guān)數(shù)據(jù)某農(nóng)業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)各區(qū)域單元的有關(guān)數(shù)據(jù) 668.3372.03276.2041540.29216.398.1284.0650.0114.861795.4160.80171.106926.35291.528.1354.0630.0124.862862.9011.65273.3071501.24225
5、.2518.3522.6450.0343.201986.6240.84168.904897.36196.3716.8615.1760.0556.1671091.3940.81266.502911.24226.5118.2795.6430.0764.4771176.9120.85850.302103.52217.0919.7934.8810.0016.1651251.2741.04164.609968.33181.384.0054.0660.0155.4021368.8310.83662.804957.14194.049.114.4840.0025.791477.3010.62360.10282
6、4.37188.0919.4095.7215.0558.4131576.9481.02268.0011255.42211.5511.1023.1330.013.4251699.2650.65460.7021251.03220.914.3834.6150.0115.59317118.5050.66163.3041246.47242.1610.7066.0530.1548.70118141.4730.73754.206814.21193.4611.4196.4420.01212.94519137.7610.59855.9011124.05228.449.5217.8810.06912.654201
7、17.6121.24554.503805.67175.2318.1065.7890.0488.46121122.7810.73149.1021313.11236.2926.7247.1620.09210.078步驟如下:(1)將表1中的數(shù)據(jù)作標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理,然后將它們代入公式(4)計算相關(guān)系數(shù)矩陣(見表2)。x1x2x3x4x5x6x7x8x9x11-0.327 -0.714 -0.3360.3090.4080.790.1560.744x2-0.331-0.0350.6440.420.2550.009-0.0780.094x3-0.71-0.03510.07-0.74-0.755-0.93-
8、0.109-0.924x4-0.340.6440.0710.3830.069-0.05-0.0310.073x50.3090.42-0.740.38310.7340.6720.0980.747x60.4080.255-0.7550.0690.73410.6580.2220.707x70.790.009-0.93-0.0460.6720.6581-0.030.89x80.156-0.078 -0.109 -0.0310.0980.222-0.0310.29x90.7440.094-0.9240.0730.7470.7070.890.291表表2 2相關(guān)系數(shù)矩陣相關(guān)系數(shù)矩陣 (2)由相關(guān)系數(shù)矩陣計
9、算特征值,以及各個主成分的貢獻(xiàn)率與累計貢獻(xiàn)率(見表3)。由表3可知,第一,第二,第三主成分的累計貢獻(xiàn)率已高達(dá)86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 表表3 3特征值及主成分貢獻(xiàn)率特征值及主成分貢獻(xiàn)率 (3)對于特征值=4.6610,=2.0890,=1.0430分別求出其特征向量l1,l2,l3。表表4 4 主成分載荷主成分載荷 z1z2z3占方差的百分?jǐn)?shù)(%)x10.739-0.532-0.006182.918x20.1230.887-0.002880.191x3-0.9640.00960.009592.948x40.00420.8680.003775.346x50.8130.444-0.001185.811x60.8190.1790.12571.843x70.933-0.133-0.25195.118x80.197-0.10.9798.971x90.964-0.00250.009292.939 第一主成分z1與x1,x5,x6,x7,x9呈顯出較強(qiáng)的正相關(guān),與x3呈顯出較強(qiáng)的負(fù)相關(guān),而這幾個變量則綜合反映了生態(tài)經(jīng)濟(jì)結(jié)構(gòu)狀況,因此可以認(rèn)為第一主成分z1是生態(tài)經(jīng)濟(jì)結(jié)構(gòu)的代表。 第二主成分z2與x2,x4,x5呈顯出較強(qiáng)的正相關(guān),與x1呈顯出較強(qiáng)的負(fù)相關(guān),其中,除了x1為人口總數(shù)外,x2,x4,x5都反映了人均占有資源量的情況
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年統(tǒng)編版八年級歷史下冊階段測試試卷
- 2025年滬教新版九年級地理下冊階段測試試卷
- 2025年牛津上海版必修三生物下冊月考試卷
- 2025年新科版選修4歷史上冊階段測試試卷含答案
- 2025年度共享辦公空間租賃協(xié)議延期及使用權(quán)轉(zhuǎn)讓合同4篇
- 按揭二手車轉(zhuǎn)讓合同(2篇)
- 二零二五年度新能源汽車電池回收利用合同集錦2篇
- 二零二五年度企業(yè)并購財務(wù)盡職調(diào)查合同3篇
- 二零二五年度農(nóng)家樂鄉(xiāng)村旅游資源整合開發(fā)合同4篇
- 二零二五年度紡織機(jī)械設(shè)備租賃合同范本4篇
- 【寒假預(yù)習(xí)】專題04 閱讀理解 20篇 集訓(xùn)-2025年人教版(PEP)六年級英語下冊寒假提前學(xué)(含答案)
- 2024年智能監(jiān)獄安防監(jiān)控工程合同3篇
- 2024年度窯爐施工協(xié)議詳例細(xì)則版B版
- 幼兒園籃球課培訓(xùn)
- 【企業(yè)盈利能力探析的國內(nèi)外文獻(xiàn)綜述2400字】
- 統(tǒng)編版(2024新版)七年級《道德與法治》上冊第一單元《少年有夢》單元測試卷(含答案)
- 100道20以內(nèi)的口算題共20份
- 高三完形填空專項訓(xùn)練單選(部分答案)
- 護(hù)理查房高鉀血癥
- 項目監(jiān)理策劃方案匯報
- 《職業(yè)培訓(xùn)師的培訓(xùn)》課件
評論
0/150
提交評論