【建模教程】-建模作業(yè)-數(shù)據(jù)的預(yù)處理_第1頁(yè)
【建模教程】-建模作業(yè)-數(shù)據(jù)的預(yù)處理_第2頁(yè)
【建模教程】-建模作業(yè)-數(shù)據(jù)的預(yù)處理_第3頁(yè)
【建模教程】-建模作業(yè)-數(shù)據(jù)的預(yù)處理_第4頁(yè)
【建模教程】-建模作業(yè)-數(shù)據(jù)的預(yù)處理_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

----宋停云與您分享--------宋停云與您分享----衡陽(yáng)師范學(xué)院數(shù)學(xué)與計(jì)算科學(xué)系學(xué)生實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)課程名稱: 數(shù)學(xué)建模(2)系別:數(shù)計(jì)系 年級(jí):2012 專業(yè)和班級(jí)數(shù)學(xué) 2 班學(xué) 號(hào)開課時(shí)間: 2014 年 下 學(xué) 期每次試驗(yàn)得分每次試驗(yàn)得分平均分30%評(píng)閱人陽(yáng)志鋒評(píng)閱時(shí)間2014月日----宋停云與您分享--------宋停云與您分享----實(shí)驗(yàn)二:數(shù)據(jù)的預(yù)處理2014-09-25 星期四一、問題表述1、下面表格是某高校15個(gè)學(xué)院09級(jí)同一生源地新生的數(shù)學(xué)成績(jī)抽樣數(shù)據(jù)。(1)將各個(gè)學(xué)院新生的數(shù)學(xué)成績(jī)合并(按列拉直),并檢驗(yàn)數(shù)據(jù)的正態(tài)性;若數(shù)據(jù)非正態(tài),請(qǐng)進(jìn)行適當(dāng)?shù)恼龖B(tài)化變換;(2)數(shù)據(jù)集中是否存在異常值?若存在異常值,請(qǐng)作適當(dāng)?shù)奶幚?。學(xué)學(xué)院生123456789101112131415181608571767372567362737152698526971839166527763637857724972573766428627370626289846437855283474726977705380799060837076717254564645859914474727587695560896675063828259714866747280786682786756876744386346972665866875987461646370645981725962487769789678459699181815758807568677255108463886063727279866988745565661175717959893069635762627249657612756854936564836353836484417971136251707066528472807756806252871473526376907379676873839545709215728764766959636464706352646277166156767972786665736870534658561777836175796665668841666462726718758070885162477874685546536762198373658545696685776272763681682075587867677253906859615765497321887673764366729167496965265970228366637179637559837577525062722368908278618465705996739750607724577088918656818556587669906662----宋停云與您分享--------宋停云與您分享----257877538168647754797464696980702688856875744765717659789348717627838862726954576364788171676378287960737967395254497071636888622978717672517478696673575362686830666485586848697368856059875845二、實(shí)驗(yàn)過程與結(jié)果(含程序代碼)(1)將各個(gè)學(xué)院新Th的數(shù)學(xué)成績(jī)合并(按列拉直),并檢驗(yàn)數(shù)據(jù)的正態(tài)性;若數(shù)據(jù)非正態(tài),請(qǐng)進(jìn)行適當(dāng)?shù)恼龖B(tài)化變換:首先,將各個(gè)學(xué)院新生的數(shù)學(xué)成績(jī)求和得以下數(shù)據(jù):表一學(xué)學(xué)院生12345678910111213141518160857176737256736273715269852697183916652776363785772497257376642862737062628984643785528347472697770538079906083707671725456464585991447472758769556089667506382825971486674728078668278675687674438634697266586687598746164637064598172596248776978967845969918181575880756867725510846388606372727986698874556566117571795989306963576262724965761275685493656483635383648441797113625170706652847280775680625287147352637690737967687383954570921572876476695963646470635264627716615676797278666573687053465856177783617579666566884166646272671875807088516247787468554653676219837365854569668577627276368168207558786767725390685961576549732188767376436672916749696526597022836663717963755983757752506272236890827861846570599673975060772457708891865681855658766990666225787753816864775479746469698070----宋停云與您分享--------宋停云與您分享----2688856875744765717659789348717627838862726954576364788171676378287960737967395254497071636888622978717672517478696673575362686830666485586848697368856059875845和221920902074223020831878207020352107209320852017180020132135由于本題涉及的數(shù)據(jù)較多,我們可以首先將上述表格用EXCEL軟件保存并且命名為“shumo.xls”,再將其置于workxlsread命令可以讀取EXCEL表格中的數(shù)據(jù),這樣就省去了輸入大量數(shù)據(jù)的工作,然后用 MATLAB軟件中的normplot函數(shù)判斷數(shù)據(jù)的正態(tài)性,程序代碼如下:clearclcx=xlsread('shumo');x=reshape(x,450,1);normplot(x)其中代碼x=reshape(x,450,1)達(dá)到將各個(gè)學(xué)院新生的數(shù)學(xué)成績(jī)合并(按列拉直)的目的。以上程序代碼得出下圖:NormalProbabilityPlot0.9990.9970.990.980.950.90----宋停云與您分享--------宋停云與您分享----P

0.750.500.25----宋停云與您分享--------宋停云與您分享--------宋停云與您分享--------宋停云與您分享----0.100.050.020.010.0030.001

40 50 60

Data圖一

70 80 90----宋停云與您分享--------宋停云與您分享--------宋停云與您分享--------宋停云與您分享----下面用冪變換將數(shù)據(jù)進(jìn)行正態(tài)化變換,經(jīng)典冪變換公式為:x,0----宋停云與您分享--------宋停云與您分享----改進(jìn)的冪變換公式為:

yln

x,0----宋停云與您分享--------宋停云與您分享----yx1,0y lnx,0下面對(duì)冪變換進(jìn)行分析。冪變換后yx按下列方法估計(jì),即求L(最大:----宋停云與您分享--------宋停云與您分享----L()nln[1y2 n i

2]n

lnxi----宋停云與您分享--------宋停云與您分享----jj其中1 n x1yi----宋停云與您分享--------宋停云與您分享----求解過程的MATLAB的程序?yàn)椋篺unction[lamda,y]=lamda(x)x=load('shumo.txt');x=reshape(x,450,1);[m,n]=size(x);ifm~=1&&n~=1error('mornmustbe1!');return

n j1----宋停云與您分享--------宋停云與您分享----endifn==1n=m;endf=@(s)(-(-0.5*n*log(var((x.^s-1)/s))+(s-1)*n*mean(log(x))));%f表示經(jīng)驗(yàn)函數(shù)的相反數(shù)ezplot(f);s0=input('請(qǐng)輸入極值所在區(qū)間的左端點(diǎn):');%輸入0s1=input('請(qǐng)輸入極值所在區(qū)間的右斷點(diǎn):');%輸入100lamda=fminbnd(f,s0,利用該函數(shù)找到固定區(qū)間內(nèi)單變量函數(shù)最小值y=(x.^lamda-1)./lamda;figure(2);lamdaL(圖像qqplot(y);title('yQ-Q圖');----宋停云與您分享--------宋停云與您分享----190018001700160015001400130012001100

(-(-0.5nlog(var((x.s-1)/s))+(s-1)nmean(log(x))))----宋停云與您分享--------宋停云與您分享--------宋停云與您分享--------宋停云與您分享-----6 -4 -2 s

2 4 6----宋停云與您分享--------宋停云與您分享----圖二估計(jì)函數(shù)L( )圖像yQ-Q圖400350----宋停云與您分享--------宋停云與您分享----300maS 250unIo 200eQ 15010050-4 -3 -2 -1 0 1StandardNormalQuantiles圖三正態(tài)變換后的Q-Q圖

2 3 4----宋停云與您分享--------宋停云與您分享----(2)數(shù)據(jù)集中是否存在異常值?若存在異常值,請(qǐng)作適當(dāng)?shù)奶幚恚旱侥壳盀橹?,異常?shù)據(jù)尚沒有一個(gè)被普遍采納的定義。這里引用Hawkins對(duì)其的定義:常用的異常值檢驗(yàn)方法有準(zhǔn)則是建立在正態(tài)分布的等精度重復(fù)測(cè)量基礎(chǔ)上而造成奇異數(shù)據(jù)的干擾或噪聲難以滿足正態(tài)分布。如果一組測(cè)量數(shù)據(jù)中某個(gè)測(cè)量值的殘余誤差的絕對(duì)值符合下式:|X|那么,該測(cè)量值為異常值。用MATLAB程序根據(jù)以上方法找出異常值,程序代碼如下:x=xlsread('shumo');將數(shù)據(jù)排列成一行u=mean(x);a=std(x);p=u-3*a;q=u+3*a;B=[];fori=1:450ifx(i)<=p|x(i)>=qB=[x(i)]endend根據(jù)以上代碼運(yùn)行結(jié)果可知28,30,26是異常值數(shù)據(jù)(在表一中標(biāo)出)。30xij----宋停云與您分享--------宋停云與您分享----x'j

i1 a----宋停云與您分享--------宋停云與您分享----在本題中,由于異常值為3個(gè),分別位于3,6,13列,所以這里的j3,6,13,這三列見表一)。每一列有30個(gè)數(shù)據(jù),因而a30。代入以上數(shù)據(jù)知:2869,3063,26。----宋停云與您分享--------宋停云與您分享----統(tǒng)計(jì)建模與r軟件第八章答案r軟件-4~9章習(xí)題】x-c(0.1,0.2,0.9,0.8,0.7,0.7)n-length(x)a1-mean(x);m2-(n-1)/n*var(x)a1-1/(1-a1)-2;a1[1]0.3076923極大似然估計(jì)f-function(a2){sum(log(x))+n/(1+a2)}out-uniroot(f,c(0,1));a2-out$root;a2[1]0.2111824.2x-c(rep(5,365),rep(15,245),rep(25,150),rep(35,100),rep(45,70),rep(55,45),rep(65,25)) lamda-length(x)/sum(x);lamda[1]0.054.3取均值即可。x-c(rep(0,17),rep(1,20),rep(2,10),rep(3,2),rep(4,1))mean(x)[1]11個(gè)。4.4obj-function(x){f-c(-13+x[1]+((5-x[2])*x[2]-2)*x[2],-29+x[1]+((x[2]+1)*x[2]-14)*x[2]);sum(f^2)}x0-c(0.5,-2)nlm(obj,x0)$minimum[1]48.98425$estimate[1]11.4127791-0.8968052$gradient[1] 1.411401e-08-1.493206e-07$code[1]1$iterations----宋停云與您分享--------宋停云與您分享----[1]164.5x-c(54,67,68,78,70,66,67,70,65,69)t.test(x) #t.test()做單樣本正態(tài)分布區(qū)間估計(jì)onesamplet-testdata: xt=35.947,df=9,p-value=4.938e-11alternativehypothesis:truemeanisnotequalto095percentconfidenceinterval:63.158571.6415sampleestimates:meanofx67.4平均脈搏點(diǎn)估計(jì)為67.4,95%區(qū)間估計(jì)為63.158571.6415。t.test(x,alternative=less,mu=72) #t.test()做單樣本正態(tài)分布單側(cè)區(qū)間估計(jì)onesamplet-testdata: xt=-2.4534,df=9,p-value=0.01828alternativehypothesis:truemeanislessthan7295percentconfidenceinterval:-inf70.83705sampleestimates:meanofx67.4p0.05,拒絕原假設(shè),平均脈搏低于常人。4.6x-c(140,137,136,140,145,148,140,135,144,141);x[1]140137136140145148140135144141y-c(135,118,115,140,128,131,130,115,131,125);y[1]135118115140128131130115131125t.test(x,y,var.equal=true)twosamplet-testdata: xandyt=4.6287,df=18,p-value=0.0002087alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:7.5362620.06374----宋停云與您分享--------宋停云與您分享----sampleestimates:meanofxmeanofy140.6 126.8期望差的95%置信區(qū)間為7.5362620.06374。4.7x-c(0.143,0.142,0.143,0.137)y-c(0.140,0.142,0.136,0.138,0.140)t.test(x,y,var.equal=true)twosamplet-testdata: xandyt=1.198,df=7,p-value=0.2699alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:-0.001996351 0.006096351sampleestimates:meanofxmeanofy0.141250.13920期望差的的區(qū)間估計(jì)為-0.001996351 0.0060963514.84.6var.test(x,y)ftesttocomparetwovariancesdata: xandyf=0.2353,numdf=9,denomdf=9,p-value=0.04229alternativehypothesis:trueratioofvariancesisnotequalto195percentconfidenceinterval:0.058452760.94743902sampleestimates:ratioofvariances0.2353305var.test 可做兩樣本方差比的估計(jì)。此結(jié)果可認(rèn)為方差不等,因此,4.6中,計(jì)算期望差時(shí)應(yīng)該采取方差不等的參數(shù)。t.test(x,y)welchtwosamplet-testdata: xandyt=4.6287,df=13.014,p-value=0.0004712alternativehypothesis:truedifferenceinmeansisnotequalto0----宋停云與您分享--------宋停云與您分享----95percentconfidenceinterval:7.35971320.240287sampleestimates:meanofxmeanofy140.6 126.8期望差的95%置信區(qū)間為7.35971320.240287。4.9x-c(rep(0,7),rep(1,10),rep(2,12),rep(3,8),rep(4,3),rep(5,2))n-length(x)tmp-sd(x)/sqrt(n)*qnorm(1-0.05/2)mean(x)[1]1.904762mean(x)-tmp;mean(x)+tmp[1]1.494041[1]2.315483平均呼喚次數(shù)為1.90.95的置信區(qū)間為1.49,2,324.10x-c(1067,919,1196,785,1126,936,918,1156,920,948)t.test(x,alternative=greater)onesamplet-testdata: xt=23.9693,df=9,p-value=9.148e-10alternativehypothesis:truemeanisgreaterthan095percentconfidenceinterval:920.8443infsampleestimates:meanofx997.1燈泡平均壽命置信度95%的單側(cè)置信下限為920.84435.1x-c(220,188,162,230,145,160,238,188,247,113,126,245,164,231,256,183,190,158,224,175)t.test(x,mu=225)###雙邊檢驗(yàn)onesamplet-testdata: xt=-3.4783,df=19,p-value=0.002516alternativehypothesis:truemeanisnotequalto22595percentconfidenceinterval:----宋停云與您分享--------宋停云與您分享----172.3827211.9173sampleestimates:meanofx192.15p0.05,拒絕原假設(shè),認(rèn)為油漆工人的血小板計(jì)數(shù)與正常成年男子有差異。(原假設(shè):油漆工人的血小板計(jì)數(shù)與正常成年男子無差異;備擇假設(shè):油漆工人的血小板計(jì)數(shù)與正常成年男子有差異。)t.test(x,mu=225,alternative=less)##單邊檢驗(yàn)(備擇假設(shè))onesamplet-testdata: xt=-3.4783,df=19,p-value=0.001258alternativehypothesis:truemeanislessthan22595percentconfidenceinterval:-inf208.4806sampleestimates:meanofx192.15結(jié)論:油漆工人的血小板計(jì)數(shù)小于正常成年男子。5.2pnorm(1000,mean(x),sd(x))[1]0.5087941x[1]1067 9191196 7851126 936 9181156 920 948pnorm(1000,mean(x),sd(x))[1]0.5087941結(jié)論:x=1000的概率為0.509,x大于1000的概率為0.491.5.3a-c(113,120,138,120,100,118,138,123)b-c(138,116,125,136,110,132,130,110)t.test(a,b,paired=true)pairedt-testdata: aandbt=-0.6513,df=7,p-value=0.5357alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:-15.628898.87889sampleestimates:----宋停云與您分享--------宋停云與您分享----meanofthedifferences-3.375p0.05,接受原假設(shè),即兩種治療方法無差異。5.4(1)正態(tài)性w檢驗(yàn):x-c(-0.7,-5.6,2,2.8,0.7,3.5,4,5.8,7.1,-0.5,2.5,-1.6,1.7,3,0.4,4.5,4.6,2.5,6,-1.4)y-c(3.7,6.5,5,5.2,0.8,0.2,0.6,3.4,6.6,-1.1,6,3.8,2,1.6,2,2.2,1.2,3.1,1.7,-2) shapiro.test(x)shapiro-wilknormalitytestdata: xw=0.9699,p-value=0.7527shapiro.test(y)shapiro-wilknormalitytestdata: y【篇二:統(tǒng)計(jì)建模與r軟件課后習(xí)題答案2-5章】用薛毅編的《統(tǒng)計(jì)建模與r軟件》吧,找不出更好的了……工作環(huán)境仍是linux。第二章答案:ex2.1x-c(1,2,3)y-c(4,5,6)e-c(1,1,1)z=2*x+y+ez1=crossprod(x,y)#z1x1x2x%*%yz2=tcrossprod(x,y)#z1x1x2x%o%yz;z1;z2要點(diǎn):基本的列表賦值方法,內(nèi)積和外積概念。內(nèi)積為標(biāo)量,外積為矩陣。ex2.2a-matrix(1:20,c(4,5));ab-matrix(1:20,ow=4,byrow=true);bc=a+b;c#ab這種寫法e=a*b;ef-a[1:3,1:3];fh-matrix(c(1,2,4,5),ow=1);h#h起過渡作用,不規(guī)則的數(shù)組下標(biāo)g-b[,h];g要點(diǎn):矩陣賦值方法。默認(rèn)是byrow=false,數(shù)據(jù)按列放置。----宋停云與您分享--------宋停云與您分享----取出部分?jǐn)?shù)據(jù)的方法??梢杂脭?shù)組作為數(shù)組的下標(biāo)取出數(shù)組元素。ex2.3x-c(rep(1,times=5),rep(2,times=3),rep(3,times=4),rep(4,times=2));x#或者省略times=,如下面的形式x-c(rep(1,5),rep(2,3),rep(3,4),rep(4,2));x要點(diǎn):rep()的使用方法。rep(a,b)ab次ex2.4n-5;h-array(0,dim=c(n,n))for(iin1:n){for(jin1:n){h[i,j]-1/(i+j-1)}};hgsolve(h);gh的逆矩陣eveigen(h);evh的特征值和特征向量要點(diǎn):數(shù)組初始化;for循環(huán)的使用待解決:如何將很長(zhǎng)的命令(for循環(huán))用幾行打出來再執(zhí)行?每次想換行的時(shí)候一按回車就執(zhí)行了還沒打完的命令...ex2.5studentdata-data.frame(name=c(zhangsan,lisi,wangwu,zhaoliu,dingyi),sex=c(f,m,f,m,f),age=c(14,15,16,14,15),height=c(156,165,157,162,159),weight=c(42,49,41.5,52,45.5));studentdata要點(diǎn):數(shù)據(jù)框的使用待解決:ssh登陸linux服務(wù)器中文顯示亂碼。此處用英文代替。ex2.6write.table(studentdata,file=studentdata.txt)#studentdata在工作目錄里輸出,輸出的文件名為studentdata.txt.studentdata_a-read.table(studentdata.txt);studentdata_a#以數(shù)據(jù)框的形式讀取文檔studentdata.txt,存入數(shù)據(jù)框studentdata_a中。write.csv(studentdata_a,studentdata.csv)#把數(shù)據(jù)框studentdata_a在工作目錄里輸出,輸出的文件名為studentdata.csv,可用excel打開.要點(diǎn):讀寫文件。read.table(file)write.table(rdata,file)read.csv(file) write.csv(rdata,file)外部文件,不論是待讀入或是要寫出的,命令中都得加雙引號(hào)。ex2.7fun-function(n){----宋停云與您分享--------宋停云與您分享----if(n=0)list(fail=pleaseinputaintegerabove0!)else{repeat{if(n==1)breakelseif(n%%2==0){n-n/2}elsen-3*n+1}list(sucess!)}linuxr2.7.rrsource(2.7.r),即打開了這個(gè)程序腳本。然后就可以執(zhí)行函數(shù)了。輸入fun(67),顯示輸入fun(-1),顯示$failpleaseinputaintegerabove0!待解決:source(*.r)rr環(huán)r文件呢?ok,自己寫的第一個(gè)r程序~~第二章答案:ex2.1x-c(1,2,3)y-c(4,5,6)e-c(1,1,1)z=2*x+y+ez1=crossprod(x,y)#z1x1x2x%*%yz2=tcrossprod(x,y)#z1x1x2x%o%yz;z1;z2要點(diǎn):基本的列表賦值方法,內(nèi)積和外積概念。內(nèi)積為標(biāo)量,外積ex2.2a-matrix(1:20,c(4,5));ab-matrix(1:20,ow=4,byrow=true);bc=a+b;c#ab這種寫法e=a*b;ef-a[1:3,1:3];fh-matrix(c(1,2,4,5),ow=1);h----宋停云與您分享--------宋停云與您分享----#h起過渡作用,不規(guī)則的數(shù)組下標(biāo)g-b[,h];gbyrow=false,ex2.3x-c(rep(1,times=5),rep(2,times=3),rep(3,times=4),rep(4,times=2));xtimes=,如下面的形式x-c(rep(1,5),rep(2,3),rep(3,4),rep(4,2));x要點(diǎn):rep()的使用方法。rep(a,b)ab次ex2.4n-5;h-array(0,dim=c(n,n))for(iin1:n){for(jin1:n){h[i,j]-1/(i+j-1)}};hgsolve(h);gh的逆矩陣eveigen(h);evh的特征值和特征向量要點(diǎn):數(shù)組初始化;for循環(huán)的使用待解決:如何將很長(zhǎng)的命令(for循環(huán))用幾行打出來再執(zhí)行?每次想換行的時(shí)候一按回車就執(zhí)行了還沒打完的命令...ex2.5studentdata-data.frame(name=c(zhangsan,lisi,wangwu,zhaoliu,dingyi),sex=c(f,m,f,m,f),age=c(14,15,16,14,15),height=c(156,165,157,162,159),weight=c(42,49,41.5,52,45.5));studentdata要點(diǎn):數(shù)據(jù)框的使用待解決:ssh登陸linux服務(wù)器中文顯示亂碼。此處用英文代替。ex2.6write.table(studentdata,file=studentdata.txt)#studentdata在工作目錄里輸出,輸出的文件名為studentdata.txt.studentdata_a-read.table(studentdata.txt);studentdata_a#以數(shù)據(jù)框的形式讀取文檔

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論