統(tǒng)計(jì)建模與R軟件實(shí)驗(yàn)報(bào)告_第1頁(yè)
統(tǒng)計(jì)建模與R軟件實(shí)驗(yàn)報(bào)告_第2頁(yè)
統(tǒng)計(jì)建模與R軟件實(shí)驗(yàn)報(bào)告_第3頁(yè)
統(tǒng)計(jì)建模與R軟件實(shí)驗(yàn)報(bào)告_第4頁(yè)
統(tǒng)計(jì)建模與R軟件實(shí)驗(yàn)報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、開(kāi)課學(xué)院、實(shí)驗(yàn)室: 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 實(shí)驗(yàn)時(shí)間 : 2013 年 3 月 日實(shí)驗(yàn)項(xiàng)目名 稱(chēng)多維數(shù)組和矩陣實(shí)驗(yàn)項(xiàng)目類(lèi)型驗(yàn)證演示綜合設(shè)計(jì)其他指導(dǎo)教師張應(yīng)應(yīng)成 績(jī)一、實(shí)驗(yàn)?zāi)康?.了解R軟件的基本功能以及基本操作2.掌握R軟件的基本操作二、實(shí)驗(yàn)內(nèi)容 生成一個(gè)5階的Hilbert矩陣(1) 計(jì)算Hilbert矩陣H的行列式(2) 求H的逆矩陣 (3) 求H的特征值和特征向量。三、實(shí)驗(yàn)原理、方法(算法)、步驟 1.函數(shù)det(A)是求矩陣A的行列式的值 2.求矩陣A的逆,其命令形式為slove(A) 3.函數(shù)eigen(Sm)是求對(duì)稱(chēng)矩陣Sm的特征值與特征向量n<-5;x<-array(0,di

2、m=c(n,n)for (i in 1:n)for (j in 1:n)xi,j<-1/(i+j-1);xdet(x)solve(x)eigen(x)四、實(shí)驗(yàn)環(huán)境(所用軟件、硬件等)及實(shí)驗(yàn)數(shù)據(jù)文件 軟件: R 2.15.3 五、實(shí)驗(yàn)結(jié)果及實(shí)例分析> n<-5;x<-array(0,dim=c(n,n)> for (i in 1:n)+ for (j in 1:n)+ xi,j<-1/(i+j-1)+ + ;x ,1 ,2 ,3 ,4 ,51, 1.0000000 0.5000000 0.3333333 0.2500000 0.20000002, 0.5000

3、000 0.3333333 0.2500000 0.2000000 0.16666673, 0.3333333 0.2500000 0.2000000 0.1666667 0.14285714, 0.2500000 0.2000000 0.1666667 0.1428571 0.12500005, 0.2000000 0.1666667 0.1428571 0.1250000 0.1111111> det(x)1 3.749295e-12> solve(x) ,1 ,2 ,3 ,4 ,51, 25 -300 1050 -1400 6302, -300 4800 -18900 268

4、80 -126003, 1050 -18900 79380 -117600 567004, -1400 26880 -117600 179200 -882005, 630 -12600 56700 -88200 44100> eigen(x)$values1 1.567051e+00 2.085342e-01 1.140749e-02 3.058980e-04 3.287929e-06$vectors ,1 ,2 ,3 ,4 ,51, 0.7678547 0.6018715 -0.2142136 0.04716181 0.0061738632, 0.4457911 -0.2759134

5、0.7241021 -0.43266733 -0.1166927473, 0.3215783 -0.4248766 0.1204533 0.66735044 0.5061636584, 0.2534389 -0.4439030 -0.3095740 0.23302452 -0.7671911935, 0.2098226 -0.4290134 -0.5651934 -0.55759995 0.376245545分析:從實(shí)驗(yàn)結(jié)果來(lái)看。R軟件在處理數(shù)據(jù)上相當(dāng)準(zhǔn)確,方便。教師簽名年 月 日開(kāi)課學(xué)院、實(shí)驗(yàn)室:數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 實(shí)驗(yàn)時(shí)間 : 2013 年 3 月 日實(shí)驗(yàn)項(xiàng)目名 稱(chēng)描述統(tǒng)計(jì)量實(shí)驗(yàn)項(xiàng)目類(lèi)型驗(yàn)證演

6、示綜合設(shè)計(jì)其他指導(dǎo)教師張應(yīng)應(yīng)成 績(jī)一、實(shí)驗(yàn)?zāi)康?.掌握利用R軟件描述統(tǒng)計(jì)量的方法2.學(xué)會(huì)利用R軟件繪制數(shù)據(jù)的分布圖3.掌握多元數(shù)據(jù)的數(shù)據(jù)特征與相關(guān)分析在R軟件中的操作二、實(shí)驗(yàn)內(nèi)容 用Pearson相關(guān)檢驗(yàn)法檢驗(yàn)習(xí)題3.7中的身高與體重是否相關(guān)3、 實(shí)驗(yàn)原理、方法(算法)、步驟Pearson相關(guān)性檢驗(yàn):利用統(tǒng)計(jì)量t服從自由度為n-2的t分布的性質(zhì),對(duì)數(shù)據(jù)X和Y的相關(guān)性進(jìn)行檢驗(yàn)。其中。四、實(shí)驗(yàn)環(huán)境(所用軟件、硬件等)及實(shí)驗(yàn)數(shù)據(jù)文件 R 2.15.3 數(shù)據(jù)文件 3.7數(shù)據(jù).txt,其內(nèi)容如下:學(xué)號(hào) 姓名 性別 年齡 身高 體重01 Alice F 13 56.5 84.002 Becka F 13

7、65.3 98.003 Gail F 14 64.3 90.004 Karen F 12 56.3 77.005 Kathy F 12 59.8 84.506 Mary F 15 66.5 112.007 Sandy F 11 51.3 50.508 Sharon F 15 62.5 112.509 Tammy F 14 62.8 102.510 Alfred M 14 69.0 112.511 Duke M 14 63.5 102.512 Guido M 15 67.0 133.013 James M 12 57.3 83.014 Jeffrey M 13 62.5 84.015 John

8、M 12 59.0 99.516 Philip M 16 72.0 150.017 Robert M 12 64.8 128.018 Thomas M 11 57.5 85.019 William M 15 66.5 112.0五、實(shí)驗(yàn)結(jié)果及實(shí)例分析 student<-read.table("3.7數(shù)據(jù).txt",header=T) attach(student)> cor.test(身高,體重) #Pearson相關(guān)性檢驗(yàn) Pearson's product-moment correlationdata: 身高 and 體重 t = 7.5549, d

9、f = 17, p-value = 7.887e-07alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.7044314 0.9523101 sample estimates: cor 0.8777852 其p值7.887e-07<0.05,拒絕原假設(shè),所以身高與體重相關(guān)教師簽名年 月 日開(kāi)課學(xué)院、實(shí)驗(yàn)室: 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 實(shí)驗(yàn)時(shí)間 : 2013年 月 日實(shí)驗(yàn)項(xiàng)目名 稱(chēng)參數(shù)估計(jì)實(shí)驗(yàn)項(xiàng)目類(lèi)型驗(yàn)證演示綜合設(shè)計(jì)其他指導(dǎo)教師張應(yīng)應(yīng)成 績(jī)一、實(shí)驗(yàn)?zāi)康?、學(xué)會(huì)利用R軟

10、件完成一個(gè)和兩個(gè)正態(tài)總體的區(qū)間估計(jì)。2、學(xué)會(huì)利用R軟件完成非正態(tài)總體的區(qū)間估計(jì)。3、學(xué)會(huì)利用R軟件進(jìn)行單側(cè)置信區(qū)間估計(jì)二、實(shí)驗(yàn)內(nèi)容 正常人的脈搏平均每分鐘72次,某一聲測(cè)得10例四乙基鉛中毒患者的脈搏數(shù)(次/min)如下:54 67 68 78 70 66 67 70 65 69已知人的脈搏次數(shù)服從正態(tài)分布,試計(jì)算這10名患者平均脈搏次數(shù)的點(diǎn)估計(jì)和95%的區(qū)間估計(jì),并做單側(cè)區(qū)間估計(jì),試分析這10名患者的平均脈搏次數(shù)是否低于正常人的平均脈搏次數(shù)。三、實(shí)驗(yàn)原理、方法(算法)、步驟假設(shè)正態(tài)總體,為來(lái)自總體的一個(gè)樣本,為置信度,為樣本均值,為樣本方差。分別討論總體方差已知和未知情況下,均值的單側(cè)置信區(qū)

11、間估計(jì)。若已知,得到,于是得到的置信度為的單側(cè)置信區(qū)間分別為,因此,的置信度為的單側(cè)置信下限、上限分別為:,若未知,得到,于是得到的置信度為的單側(cè)置信區(qū)間分別為,因此,的置信度為的單側(cè)置信下限、上限分別為,4、 實(shí)驗(yàn)環(huán)境(所用軟件、硬件等)及實(shí)驗(yàn)數(shù)據(jù)文件 數(shù)據(jù)見(jiàn)實(shí)驗(yàn)內(nèi)容,所用軟件:R2.15.15、 實(shí)驗(yàn)結(jié)果及實(shí)例分析在R軟件中運(yùn)行代碼:> x<-c(54,67,68,78,70,66,67,70,65,69)> t.test(x) #做單樣本正態(tài)分布區(qū)間估計(jì) One Sample t-testdata: x t = 35.947, df = 9, p-value = 4.9

12、38e-11alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 63.1585 71.6415 sample estimates:mean of x 67.4 #平均脈搏點(diǎn)估計(jì)為 67.4 , 95%置信度的區(qū)間估計(jì)為 63.1585, 71.6415 。> t.test(x,alternative="less",mu=72) #做單樣本正態(tài)分布單側(cè)區(qū)間估計(jì) One Sample t-testdata:

13、x t = -2.4534, df = 9, p-value = 0.01828alternative hypothesis: true mean is less than 72 95 percent confidence interval: -Inf 70.83705 sample estimates:mean of x 67.4 p-value = 0.01828<0.05,拒絕原假設(shè),平均脈搏低于常人。教師簽名年 月 日開(kāi)課學(xué)院、實(shí)驗(yàn)室: 實(shí)驗(yàn)時(shí)間 : 2013 年 月 日實(shí)驗(yàn)項(xiàng)目名 稱(chēng)假設(shè)檢驗(yàn)實(shí)驗(yàn)項(xiàng)目類(lèi)型驗(yàn)證演示綜合設(shè)計(jì)其他指導(dǎo)教師張應(yīng)應(yīng)成 績(jī)一、實(shí)驗(yàn)?zāi)康?、了解假設(shè)檢驗(yàn)的基本概

14、念與步驟2、掌握幾種重要的參數(shù)檢驗(yàn)3、掌握若干重要的非參數(shù)檢驗(yàn)二、實(shí)驗(yàn)內(nèi)容 為研究某中心要對(duì)抗凝血酶活力的影響,隨機(jī)安排新藥組病人12例,對(duì)照組病人10例,分別測(cè)定其抗凝血酶活力,其結(jié)果如下:新藥組:126 125 136 128 123 138 142 116 110 108 115 140對(duì)照組:162 172 177 170 175 152 157 159 160 162試分析新藥組和對(duì)照粗病人的抗凝血酶活力有無(wú)差別()3、 實(shí)驗(yàn)原理、方法(算法)、步驟 1.基本原理:解決一個(gè)具體的假設(shè)檢驗(yàn)問(wèn)題,一般要借助直觀(guān)分析和理論分析思想。其基本原理是實(shí)際推斷原理:“小概率事件在一次實(shí)驗(yàn)中幾乎不可

15、能發(fā)生”,如果發(fā)生,就認(rèn)為是不正常的,應(yīng)該拒絕。  2.方法: (1)提出原假設(shè)Ho  (2)確定假設(shè)檢驗(yàn)統(tǒng)計(jì)量Z,并在Ho成立的條件下,導(dǎo)出Z的分布  (3)確定拒絕域:由直觀(guān)分析先確定拒絕的形式,然后由顯著水平及Z的分布P確定拒絕域的臨界值,進(jìn)而確定拒絕域C  (4)根據(jù)具體的一次樣本值做出推斷 3.具體算法: 假設(shè)是來(lái)自總體的樣本,是來(lái)自總體的樣本,且兩樣本獨(dú)立,其檢驗(yàn)問(wèn)題有:雙邊檢驗(yàn): ,單邊檢驗(yàn)I ,單邊檢驗(yàn)II ,方差未知,和分別是和的樣本方差。由統(tǒng)計(jì)知識(shí)可知,當(dāng)為真時(shí),其中因此,當(dāng)T滿(mǎn)足(成為拒絕域):雙邊檢驗(yàn): 單邊檢驗(yàn)I 單邊

16、檢驗(yàn)II 則認(rèn)為不成立,此方法也稱(chēng)為t檢驗(yàn)法。4、 實(shí)驗(yàn)環(huán)境(所用軟件、硬件等)及實(shí)驗(yàn)數(shù)據(jù)文件 見(jiàn)實(shí)驗(yàn)內(nèi)容 軟件:R2.15.3R軟件。五、實(shí)驗(yàn)結(jié)果及實(shí)例分析> a <- c(126,125,136,128,123,138,142,116,110,108,115,140)> b <- c(162,172,177,170,175,152,157,159,160,162)#正態(tài)性檢驗(yàn):> ks.test(a,"pnorm",mean(a),sd(a) One-sample Kolmogorov-Smirnov testdata: a D = 0.1

17、464, p-value = 0.9266alternative hypothesis: two-sided > ks.test(b,"pnorm",mean(b),sd(b) One-sample Kolmogorov-Smirnov testdata: b D = 0.2222, p-value = 0.707alternative hypothesis: two-sided #方差齊性檢驗(yàn):> var.test(a,b) F test to compare two variancesdata: a and b F = 1.9646, num df = 11

18、, denom df = 9, p-value = 0.32alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.5021943 7.0488630 sample estimates:ratio of variances 1.964622 #可認(rèn)為a和b的方差相同。#選用方差相同模型t檢驗(yàn):> t.test(a,b,var.equal=TRUE) Two Sample t-testdata: a and b t = -8.8148, df =

19、20, p-value = 2.524e-08alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -48.24975 -29.78358 sample estimates:mean of x mean of y 125.5833 164.6000 p-value = 2.524e-08<0.05,因而認(rèn)為兩者有顯著差別。教師簽名年 月 日開(kāi)課學(xué)院、實(shí)驗(yàn)室: 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 實(shí)驗(yàn)時(shí)間 : 2013 年 月 日實(shí)驗(yàn)項(xiàng)目名 稱(chēng) 回歸分析實(shí)驗(yàn)項(xiàng)目類(lèi)型驗(yàn)

20、證演示綜合設(shè)計(jì)其他指導(dǎo)教師張應(yīng)應(yīng)成 績(jī)一、實(shí)驗(yàn)?zāi)康?.掌握回歸分析的原理以及在R軟件上的使用2.掌握回歸診斷在R軟件上的使用3.掌握回歸診斷的原理二、實(shí)驗(yàn)內(nèi)容 為了估計(jì)山上積雪融化后對(duì)下游灌溉的影響,在山上建立一個(gè) 觀(guān)測(cè)站,測(cè)量最大面積積雪深度X與當(dāng)年灌溉面積Y,測(cè)得連續(xù)10年的數(shù)據(jù)10年中最大積雪深度與當(dāng)年灌溉面積的數(shù)據(jù)年序X/mY/hm2序號(hào)X/mY/hm215.1190767.8300023.5128774.5194737.1270085.6227346.2237398.0311358.83260106.424931.試畫(huà)相應(yīng)的散點(diǎn)圖,判斷Y與X是否有線(xiàn)性關(guān)系2.求出Y關(guān)于X的一元線(xiàn)性回

21、歸方程;3.對(duì)方程做顯著性分析;4.先測(cè)得今年的數(shù)據(jù)是X=7m,給出今年灌溉面積的預(yù)測(cè)值和相應(yīng)的區(qū)間估計(jì)(=0.05)三、實(shí)驗(yàn)原理、方法(算法)、步驟 回歸分析研究的主要問(wèn)題是: 1.確定Y與X1,X2.Xp間的定量關(guān)系表達(dá)式,即回歸方程 2.對(duì)求得的回歸方程的可信度進(jìn)行檢驗(yàn) 3.判斷自變量Xj(j=1,2,.p)對(duì)Y有無(wú)影響 4.利用所求的的回歸方程進(jìn)行預(yù)測(cè)和控制,在比較嚴(yán)密的分析中,一般不輕易剔除變量,而是對(duì)顯著差異變量進(jìn)行分析。四、實(shí)驗(yàn)環(huán)境(所用軟件、硬件等)及實(shí)驗(yàn)數(shù)據(jù)文件 軟件: R 2.15.3 數(shù)據(jù)見(jiàn)實(shí)驗(yàn)內(nèi)容 五、實(shí)驗(yàn)結(jié)果及實(shí)例分析#輸入數(shù)據(jù)并運(yùn)行得:x<-c(5.1,3.5

22、,7.1,6.2,8.8,7.8,4.5,5.6,8.0,6.4)y<-c(1907,1287,2700,2373,3260,3000,1947,2273,3113,2493)plot(x,y)分析結(jié)果:由散點(diǎn)圖可得x,y線(xiàn)性相關(guān)lm.sol<-lm(y1+x)summary(lm.sol)Call:lm(formula = y 1 + x)Residuals: Min 1Q Median 3Q Max -128.591 -70.978 -3.727 49.263 167.228 Coefficients: Estimate Std. Error t value Pr(>|t

23、|) (Intercept) 140.95 125.11 1.127 0.293 x 364.18 19.26 18.908 6.33e-08 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 96.42 on 8 degrees of freedomMultiple R-squared: 0.9781, Adjusted R-squared: 0.9754 F-statistic: 357.5 on 1 and 8 DF, p-value: 6.33e-08分析結(jié)果:由上述結(jié)果可得y關(guān)于x的一元

24、線(xiàn)性回歸方程為y=140.95+364.18x;并由F檢驗(yàn)和t檢驗(yàn),可得回歸方程通過(guò)了回歸方程的顯著性檢驗(yàn)#對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),并且給相應(yīng)的區(qū)間估計(jì)new<-data.frame(x=7)lm.pred<-predict(lm.sol,new,interval="prediction",level=0.95)lm.pred fit lwr upr1 2690.227 2454.971 2925.484分析結(jié)果:預(yù)測(cè)值為2690.227,估計(jì)區(qū)間為2454.971 ,2925.484教師簽名年 月 日開(kāi)課學(xué)院、實(shí)驗(yàn)室:數(shù)學(xué)與統(tǒng)計(jì) 實(shí)驗(yàn)時(shí)間 :2013年 04月 20日

25、實(shí)驗(yàn)項(xiàng)目名 稱(chēng)判別分析實(shí)驗(yàn)項(xiàng)目類(lèi)型驗(yàn)證演示綜合設(shè)計(jì)其他指導(dǎo)教師張應(yīng)應(yīng)成 績(jī)一、實(shí)驗(yàn)?zāi)康?.在已知樣本有多少類(lèi)的情況下對(duì)樣本進(jìn)行分類(lèi);2.熟悉R軟件的各種操作;3.利用R軟件進(jìn)行各種方式的判別分析。二、實(shí)驗(yàn)內(nèi)容 根據(jù)經(jīng)驗(yàn) 今天與昨天的溫度差X1及今天的壓溫差(氣壓與溫度之差)X2是預(yù)報(bào)明天下雨或不下雨的兩個(gè)重要因素?,F(xiàn)有一批已收集的數(shù)據(jù)資料,如表所示,金測(cè)得x1=8.1,x2=2.0試問(wèn)預(yù)報(bào)明天下雨還是預(yù)報(bào)明天不下雨?分別用距離判別、Bayes判別、(考慮方差相同與方差不同兩種情況)和Fisher判別來(lái)得到你所需要的結(jié)論。具體數(shù)據(jù)見(jiàn)統(tǒng)計(jì)建模與R軟件P420表8.7.三、實(shí)驗(yàn)原理、方法(算法)、步

26、驟距離判別法:,判斷其值是否大于0.Bayes判別法: ,判斷值與的關(guān)系;Fisher判別法: 4、 實(shí)驗(yàn)環(huán)境(所用軟件、硬件等)及實(shí)驗(yàn)數(shù)據(jù)文件 實(shí)驗(yàn)數(shù)據(jù)見(jiàn)實(shí)驗(yàn)內(nèi)容 軟件:R2.15.1五、實(shí)驗(yàn)結(jié)果及實(shí)例分析:# 距離判別classX1=data.frame(x1=c(-1.9,-6.9,5.2,5.0,7.3,6.8,0.9,-12.5,1.5,3.8),x2=c(3.2,10.4,2.0,2.5,0.0,12.7,-15.4,-2.5,1.3,6.8)classX2=data.frame(x1=c(0.2,-0.1,0.4,2.7,2.1,-4.6,-1.7,-2.6,2.6,-2.8),

27、x2=c(0.2,7.5,14.6,8.3,0.8,4.3,10.9,13.1,12.8,10.0)TstX=data.frame(x1=c(8.1),x2=c(2.0)# 對(duì)訓(xùn)練樣本的回代情況# var.equal=T:有4個(gè)錯(cuò)判,錯(cuò)判率為4/20=0.2# var.equal=F:有5個(gè)錯(cuò)判,錯(cuò)判率為5/20=0.25source("discriminiant.distance.R")discriminiant.distance(classX1,classX2,var.equal=T)discriminiant.distance(classX1,classX2,var.

28、equal=F)# 對(duì)測(cè)試樣本進(jìn)行判別:均判為第1組discriminiant.distance(classX1,classX2,TstX,var.equal=T)discriminiant.distance(classX1,classX2,TstX,var.equal=F)# Bayes# TrnX1, TrnX2以矩陣的形式輸入TrnX1=matrix(c(-1.9,-6.9,5.2,5.0,7.3,6.8,0.9,-12.5,1.5,3.8,3.2,10.4,2.0,2.5,0.0,12.7,-15.4,-2.5,1.3,6.8),ncol=2)TrnX2=matrix(c(0.2,-0

29、.1,0.4,2.7,2.1,-4.6,-1.7,-2.6,2.6,-2.8,0.2,7.5,14.6,8.3,0.8,4.3,10.9,13.1,12.8,10.0),ncol=2)TstX=data.frame(x1=c(8.1),x2=c(2.0)# 對(duì)訓(xùn)練樣本的回代情況# var.equal=T:有4個(gè)錯(cuò)判,錯(cuò)判率為4/20=0.2# var.equal=F:有5個(gè)錯(cuò)判,錯(cuò)判率為5/20=0.25source("discriminiant.bayes.R")discriminiant.bayes(TrnX1,TrnX2,rate=1,var.equal=T)disc

30、riminiant.bayes(TrnX1,TrnX2,rate=1,var.equal=F)# 對(duì)測(cè)試樣本進(jìn)行判別:均判為第1組discriminiant.bayes(TrnX1,TrnX2,rate=1,TstX,var.equal=T)discriminiant.bayes(TrnX1,TrnX2,rate=1,TstX,var.equal=F)discriminiant.bayes(classX1,classX2,rate=1,TstX,var.equal=T)discriminiant.bayes(classX1,classX2,rate=1,TstX,var.equal=F)# F

31、isher# 對(duì)訓(xùn)練樣本的回代情況# 有4個(gè)錯(cuò)判,錯(cuò)判率為4/20=0.2source("discriminiant.fisher.R")discriminiant.fisher(classX1,classX2)# 對(duì)測(cè)試樣本進(jìn)行判別:判為第1組discriminiant.fisher(classX1,classX2,TstX)# 三種方法均預(yù)報(bào)明天下雨colMeans(classX1)colMeans(classX2)x1 x2 -0.38 8.25 教師簽名年 月 日開(kāi)課學(xué)院、實(shí)驗(yàn)室: 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 實(shí)驗(yàn)時(shí)間 : 2013年 4月 日實(shí)驗(yàn)項(xiàng)目名 稱(chēng)主成分分析實(shí)驗(yàn)項(xiàng)目類(lèi)

32、型驗(yàn)證演示綜合設(shè)計(jì)其他指導(dǎo)教師張應(yīng)應(yīng)成 績(jī)一、實(shí)驗(yàn)?zāi)康?.掌握利用主成分分析的理論思想,將多指標(biāo)化為少數(shù)幾個(gè)綜合的指標(biāo);2.熟練應(yīng)用R軟件來(lái)進(jìn)行主成分分析;3.利用主成分分析的結(jié)果對(duì)具體問(wèn)題作出合理的解釋分析。二、實(shí)驗(yàn)內(nèi)容 用主成分法探討城市工業(yè)主體,表格里是某市工業(yè)部門(mén)13個(gè)行業(yè),分別是冶金,電力,煤炭,化學(xué),機(jī)械,建材,食品,森工,紡織,縫紉,皮革,造紙,文教藝術(shù)品,8個(gè)指標(biāo),分別是年末固定資產(chǎn)凈值X1,職工人數(shù)X2,工業(yè)總產(chǎn)值X3,全員勞動(dòng)生產(chǎn)率X4,百元固定原值實(shí)現(xiàn)產(chǎn)值X5,資金利稅率X6,標(biāo)準(zhǔn)燃料消費(fèi)量X7,和能源利用開(kāi)發(fā)效果X8.的數(shù)據(jù)。 見(jiàn)統(tǒng)計(jì)建模與R軟件 P475 表9.7(1

33、) 利用主成分分析方法分析確定8個(gè)指標(biāo)的幾個(gè)主成分,并對(duì)主成分進(jìn)行解釋?zhuān)?2) 利用主成分得分對(duì)13個(gè)行業(yè)內(nèi)進(jìn)行排序和分類(lèi)。3、 實(shí)驗(yàn)原理、方法(算法)、步驟基本原理:主成分分析是數(shù)學(xué)上對(duì)數(shù)據(jù)降維的一種方法。其基本思想是設(shè)法將原來(lái)眾多的具有一定相關(guān)性的指標(biāo)X1,X2,XP(比如p個(gè)指標(biāo)),重新組合成一組較少個(gè)數(shù)的互不相關(guān)的綜合指標(biāo)Fm來(lái)代替原來(lái)指標(biāo)。計(jì)算步驟:(1) 計(jì)算協(xié)方差矩陣;(2) 求出的特征值i及相應(yīng)的正交化單位特征向量;(3) 選擇主成分;(4) 選擇主成分;(5)選擇主成分.四、實(shí)驗(yàn)環(huán)境(所用軟件、硬件等)及實(shí)驗(yàn)數(shù)據(jù)文件 數(shù)據(jù)見(jiàn)實(shí)驗(yàn)內(nèi)容 R 2.15.35、 實(shí)驗(yàn)結(jié)果及實(shí)例分析(

34、1)利用主成分確定了8個(gè)指標(biāo)的主成分,有4個(gè),即主成分碎石圖所示> industry<-data.frame(+X1=c(90342,4903,6735,49454,139190,12215,2372,11062,17111,1206,2150,5251,14341),+X2=c(52455,1973,21139,36241,203505,16219,6572,23078,23907,3930,5704,6155,13203),+X3=c(101091,2035,3767,81557,215898,10351,8103,54935,52108,6126,6200,10383,193

35、96),+X4=c(19272,10313,1780,22504,10609,6382,12329,23804,21796,15586,10870,16875,14691),+ X5=c(82.0,34.2,36.1,98.1,93.2,62.5,184.4,370.4,221.5,330.4,184.2,146.4,94.6),+ X6=c(16.1,7.1,8.2,25.9,12.6,8.7,22.2,41.0,21.5,29.5,12.0,27.5,17.8),+X7=c(197435,592077,726396,348226,139572,145818,20921,65486,6380

36、6,1840,8913,78796,6354),+X8=c(0.172,0.003,0.003,0.985,0.628,0.066,0.152,0.263,0.276,0.437,0.274,0.151,1.574) )> industry.pr<-princomp(industry,cor=T) > summary(industry.pr) #做主成分分析,得到4個(gè)主成分,累積貢獻(xiàn)率達(dá)94.68%Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5Standard deviation 1.7620762 1

37、.7021873 0.9644768 0.80132532 0.55143824Proportion of Variance 0.3881141 0.3621802 0.1162769 0.08026528 0.03801052Cumulative Proportion 0.3881141 0.7502943 0.8665712 0.94683649 0.98484701 Comp.6 Comp.7 Comp.8Standard deviation 0.29427497 0.179400062 0.0494143207Proportion of Variance 0.01082472 0.00

38、4023048 0.0003052219Cumulative Proportion 0.99567173 0.999694778 1.0000000000> load<-loadings(industry.pr) #求出載荷矩陣> loadLoadings: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8X1 -0.477 -0.296 -0.104 0.184 0.758 0.245X2 -0.473 -0.278 -0.163 -0.174 -0.305 -0.518 0.527X3 -0.424 -0.37

39、8 -0.156 -0.174 -0.781X4 0.213 -0.451 0.516 0.539 0.288 -0.249 0.220X5 0.388 -0.331 -0.321 -0.199 -0.450 0.582 0.233 X6 0.352 -0.403 -0.145 0.279 -0.317 -0.714 X7 -0.215 0.377 -0.140 0.758 -0.418 0.194 X8 -0.273 0.891 -0.322 0.122 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8SS loadings 1.

40、000 1.000 1.000 1.000 1.000 1.000 1.000 1.000Proportion Var 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125Cumulative Var 0.125 0.250 0.375 0.500 0.625 0.750 0.875 1.000> plot(load,1:2) > text(load,1,load,2,adj=c(-0.4,-0.3)> screeplot(industry.pr,npcs=4,type="lines") #得出主成分的碎石圖> biplot(industry.pr) #得出在第一,第二主成分之下的散點(diǎn)圖> p<-predict(industry.pr) #預(yù)測(cè)數(shù)據(jù),講預(yù)測(cè)值放入p中&

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論