matlAB第10講數(shù)據(jù)的統(tǒng)計(jì)分析與描述.ppt_第1頁(yè)
matlAB第10講數(shù)據(jù)的統(tǒng)計(jì)分析與描述.ppt_第2頁(yè)
matlAB第10講數(shù)據(jù)的統(tǒng)計(jì)分析與描述.ppt_第3頁(yè)
matlAB第10講數(shù)據(jù)的統(tǒng)計(jì)分析與描述.ppt_第4頁(yè)
matlAB第10講數(shù)據(jù)的統(tǒng)計(jì)分析與描述.ppt_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2019/7/15,1,數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn),數(shù)據(jù)的統(tǒng)計(jì)描述和分析,實(shí)驗(yàn)?zāi)康?實(shí)驗(yàn)內(nèi)容,2、掌握用數(shù)學(xué)軟件包求解統(tǒng)計(jì)問(wèn)題。,1、直觀了解統(tǒng)計(jì)基本內(nèi)容。,1、統(tǒng)計(jì)的基本理論。,3、實(shí)驗(yàn)作業(yè)。,2、用數(shù)學(xué)軟件包求解統(tǒng)計(jì)問(wèn)題。,2019/7/15,3,統(tǒng)計(jì)的基本概念,參數(shù)估計(jì),假設(shè)檢驗(yàn),數(shù)據(jù)的統(tǒng)計(jì)描述和分析,2019/7/15,4,一、統(tǒng)計(jì)量,2019/7/15,5,2019/7/15,6,二、分布函數(shù)的近似求法,2019/7/15,7,三、幾個(gè)在統(tǒng)計(jì)中常用的概率分布,1,正態(tài)分布,密度函數(shù):,分布函數(shù):,其中,m,為均值,,為方差,,.,標(biāo)準(zhǔn)正態(tài)分布:,N,(0,1),密度函數(shù),,,分布函數(shù),2019/7/15,8,2019/7/15,9,2019/7/15,10,返回,F分布F(10,50)的密度函數(shù)曲線,2019/7/15,11,參數(shù)估計(jì),2019/7/15,12,一、點(diǎn)估計(jì)的求法,(一)矩估計(jì)法,2019/7/15,13,(二)極大似然估計(jì)法,2019/7/15,14,二、區(qū)間估計(jì)的求法,2019/7/15,15,1、已知DX,求EX的置信區(qū)間,2 未知方差DX,求EX的置信區(qū)間,(一)數(shù)學(xué)期望的置信區(qū)間,(二)方差的區(qū)間估計(jì),返回,2019/7/15,16,1.參數(shù)檢驗(yàn):如果觀測(cè)的分布函數(shù)類型已知,這時(shí)構(gòu)造出的 統(tǒng)計(jì)量依賴于總體的分布函數(shù),這種檢驗(yàn)稱為參數(shù)檢驗(yàn). 參數(shù)檢驗(yàn)的目的往往是對(duì)總體的參數(shù)及其有關(guān)性質(zhì)作出明 確的判斷.,對(duì)總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計(jì)的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).,假設(shè)檢驗(yàn),2.非參數(shù)檢驗(yàn):如果所檢驗(yàn)的假設(shè)并非是對(duì)某個(gè)參數(shù)作出明 確的判斷,因而必須要求構(gòu)造出的檢驗(yàn)統(tǒng)計(jì)量的分布函數(shù) 不依賴于觀測(cè)值的分布函數(shù)類型,這種檢驗(yàn)叫非參數(shù)檢驗(yàn). 如要求判斷總體分布類型的檢驗(yàn)就是非參數(shù)檢驗(yàn).,2019/7/15,17,假設(shè)檢驗(yàn)的一般步驟是:,2019/7/15,18,(一)單個(gè)正態(tài)總體均值檢驗(yàn),一、參數(shù)檢驗(yàn),2019/7/15,19,2019/7/15,20,(二)單個(gè)正態(tài)總體方差檢驗(yàn),(三)兩個(gè)正態(tài)總體均值檢驗(yàn),(四)兩個(gè)正態(tài)總體方差檢驗(yàn),2019/7/15,23,二、非參數(shù)檢驗(yàn),(二)概率紙檢驗(yàn)法,概率紙是一種判斷總體分布的簡(jiǎn)便工具.使用它們,可以很快地判斷總體分布的類型.概率紙的種類很多.,返回,2019/7/15,24,統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令,1.數(shù)據(jù)的錄入、保存和調(diào)用,2.基本統(tǒng)計(jì)量,3.常見概率分布的函數(shù),4.頻 數(shù) 直 方 圖 的 描 繪,5.參數(shù)估計(jì),6.假設(shè)檢驗(yàn),7.綜合實(shí)例,返回,2019/7/15,25,一、數(shù)據(jù)的錄入、保存和調(diào)用,例1 上海市區(qū)社會(huì)商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下,統(tǒng)計(jì)工具箱中的基本統(tǒng)計(jì)命令,2019/7/15,26,1、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。 命令格式: x=a:h:b t=78:87,2、分別以x和y代表變量職工工資總額和商品零售總額。 x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,3、將變量t、x、y的數(shù)據(jù)保存在文件data中。 save data t x y,4、進(jìn)行統(tǒng)計(jì)分析時(shí),調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。 load data,To MATLAB(txy),方法1,2019/7/15,27,1、輸入矩陣: data=78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,2、將矩陣data的數(shù)據(jù)保存在文件data1中:save data1 data,3、進(jìn)行統(tǒng)計(jì)分析時(shí),先用命令: load data1 調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y: t=data(1,:) x=data(2,:) y=data(3,:) 若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令: data(:,j),方法2,To MATLAB(data),返回,2019/7/15,28,二、基本統(tǒng)計(jì)量,對(duì)隨機(jī)變量x,計(jì)算其基本統(tǒng)計(jì)量的命令如下: 均值:mean(x) 中位數(shù):median(x) 標(biāo)準(zhǔn)差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x),例 對(duì)例1中的職工工資總額x,可計(jì)算上述基本統(tǒng)計(jì)量。,To MATLAB(tjl),返回,2019/7/15,29,三、常見概率分布的函數(shù),Matlab工具箱對(duì)每一種分布都提供五類函數(shù),其命令字符為: 概率密度:pdf 概率分布:cdf 逆概率分布:inv 均值與方差:stat 隨機(jī)數(shù)生成:rnd,(當(dāng)需要一種分布的某一類函數(shù)時(shí),將以上所列的分布命令字符與函數(shù)命令字符接起來(lái),并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.),2019/7/15,30,在Matlab中輸入以下命令: x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2); plot(x,y,x,z),1、密度函數(shù):p=normpdf(x,mu,sigma) (當(dāng)mu=0,sigma=1時(shí)可缺省),To MATLAB(liti2),如對(duì)均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:,2019/7/15,31,To MATLAB(liti3),3、逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PXx=P.此命令可用來(lái)求分位數(shù).,2、概率分布:P=normcdf(x,mu,sigma),To MATLAB(liti4),2019/7/15,32,To MATLAB(liti5),4、均值與方差:m,v=normstat(mu,sigma),例5 求正態(tài)分布N(3,52)的均值與方差. 命令為:m,v=normstat(3,5) 結(jié)果為:m=3,v=25,5、隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機(jī)數(shù)矩陣.,例6 命令:M=normrnd(1 2 3;4 5 6,0.1,2,3) 結(jié)果為:M=0.9567 2.0125 2.8854 3.8334 5.0288 6.1191,To MATLAB(liti6),此命令產(chǎn)生了23的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從N(1,0.12), N(2,22), N(3, 32), N(4,0.12), N(5, 22),N(6, 32),返回,2019/7/15,33,1、給出數(shù)組data的頻數(shù)表的命令為: N,X=hist(data,k) 此命令將區(qū)間min(data),max(data)分為k個(gè)小區(qū)間(缺省為10),返回?cái)?shù)組data落在每一個(gè)小區(qū)間的頻數(shù)N和每一個(gè)小區(qū)間的中點(diǎn)X.,2、描繪數(shù)組data的頻數(shù)直方圖的命令為: hist(data,k),四、頻 數(shù) 直 方 圖 的 描 繪,返回,2019/7/15,34,五、參數(shù)估計(jì),1、正態(tài)總體的參數(shù)估計(jì),設(shè)總體服從正態(tài)分布,則其點(diǎn)估計(jì)和區(qū)間估計(jì)可同時(shí)由以下命令獲得: muhat,sigmahat,muci,sigmaci = normfit(X,alpha),此命令在顯著性水平alpha下估計(jì)數(shù)據(jù)X的參數(shù)(alpha缺省時(shí)設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計(jì)值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值, muci是均值的區(qū)間估計(jì),sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計(jì).,2019/7/15,35,2、其它分布的參數(shù)估計(jì),有兩種處理辦法: 一.取容量充分大的樣本(n50),按中心極限定理,它近似地 服從正態(tài)分布; 二.使用Matlab工具箱中具有特定分布總體的估計(jì)命令.,(1)muhat, muci = expfit(X,alpha)- 在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計(jì)及其區(qū)間估計(jì). (2)lambdahat, lambdaci = poissfit(X,alpha)- 在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X 的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì). (3)phat, pci = weibfit(X,alpha)- 在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X 的參數(shù)的點(diǎn)估計(jì)及其區(qū)間估計(jì).,返回,2019/7/15,36,六、假設(shè)檢驗(yàn),在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).,1、總體方差sigma2已知時(shí),總體均值的檢驗(yàn)使用 z-檢驗(yàn),h,sig,ci = ztest(x,m,sigma,alpha,tail) 檢驗(yàn)數(shù)據(jù) x 的關(guān)于均值的某一假設(shè)是否成立,其中sigma 為已知方差, alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值: tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 m ” tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 m ” tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 m ” tail的缺省值為 0, alpha的缺省值為 0.05.,返回值 h 為一個(gè)布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為均值的 1-alpha 置信區(qū)間.,2019/7/15,37,例7 Matlab統(tǒng)計(jì)工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國(guó)1993年一月份和二月份的汽油平均價(jià)格(price1,price2分別是一,二月份的油價(jià),單位為美分),它是容量為20的雙樣本.假設(shè)一月份油價(jià)的標(biāo)準(zhǔn)偏差是一加侖四分幣(=4),試檢驗(yàn)一月份油價(jià)的均值是否等于115.,解 作假設(shè):m = 115. 首先取出數(shù)據(jù),用以下命令: load gas 然后用以下命令檢驗(yàn) h,sig,ci = ztest(price1,115,4),返回:h = 0,sig = 0.8668,ci = 113.3970 116.9030.,檢驗(yàn)結(jié)果: 1. 布爾變量h=0, 表示不拒絕零假設(shè). 說(shuō)明提出的假設(shè)均值115 是合理的. 2. sig-值為0.8668, 遠(yuǎn)超過(guò)0.5, 不能拒絕零假設(shè) 3. 95%的置信區(qū)間為113.4, 116.9, 它完全包括115, 且精度很 高. .,To MATLAB(liti7),2019/7/15,38,2、總體方差sigma2未知時(shí),總體均值的檢驗(yàn)使用t-檢驗(yàn),h,sig,ci = ttest(x,m,alpha,tail) 檢驗(yàn)數(shù)據(jù) x 的關(guān)于均值的某一假設(shè)是否成立,其中alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值: tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 m ” tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 m ” tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 m ” tail的缺省值為 0, alpha的缺省值為 0.05.,返回值 h 為一個(gè)布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為均值的 1-alpha 置信區(qū)間.,2019/7/15,39,返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.,檢驗(yàn)結(jié)果: 1. 布爾變量h=1, 表示拒絕零假設(shè). 說(shuō)明提出的假 設(shè)油價(jià)均值115是不合理的. 2. 95%的置信區(qū)間為116.8 120.2, 它不包括 115, 故不能接受假設(shè). 3. sig-值為4.9517e-004, 遠(yuǎn)小于0.5, 不能接受零 假設(shè).,To MATLAB(liti8),例8 試檢驗(yàn)例8中二月份油價(jià) Price2的均值是否等于115.,解 作假設(shè):m = 115, price2為二月份的油價(jià),不知其方差,故用以下命令檢驗(yàn) h,sig,ci = ttest( price2 ,115),2019/7/15,40,3、兩總體均值的假設(shè)檢驗(yàn)使用 t-檢驗(yàn),h,sig,ci = ttest2(x,y,alpha,tail) 檢驗(yàn)數(shù)據(jù) x ,y 的關(guān)于均值的某一假設(shè)是否成立,其中alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值: tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 y 的均值 ” tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 y 的均值 ” tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 y 的均值 ” tail的缺省值為 0, alpha的缺省值為 0.05.,返回值 h 為一個(gè)布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為與x與y均值差的的 1-alpha 置信區(qū)間.,2019/7/15,41,返回:h = 1,sig = 0.0083,ci =-5.8,-0.9.,檢驗(yàn)結(jié)果:1. 布爾變量h=1, 表示拒絕零假設(shè). 說(shuō)明提出的 假設(shè)“油價(jià)均值相同”是不合理的. 2. 95%的置信區(qū)間為-5.8,-0.9,說(shuō)明一月份油 價(jià)比二月份油價(jià)約低1至6分. 3. sig-值為0.0083, 遠(yuǎn)小于0.5, 不能接受“油價(jià)均 相同”假設(shè).,To MATLAB(liti9),例9 試檢驗(yàn)例8中一月份油價(jià)Price1與二月份的油價(jià)Price2均值是否相同.,解 用以下命令檢驗(yàn) h,sig,ci = ttest2(price1,price2),2019/7/15,42,4、非參數(shù)檢驗(yàn):總體分布的檢驗(yàn),Matlab工具箱提供了兩個(gè)對(duì)總體分布進(jìn)行檢驗(yàn)的命令:,(1)h = normplot(x),(2)h = weibplot(x),此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來(lái)自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).,此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來(lái)自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).,返回,2019/7/15,43,例10 一道工序用自動(dòng)化車床連續(xù)加工某種零件,由于刀具損壞等會(huì)出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時(shí)出現(xiàn)故障機(jī)會(huì)均相同.工作人員是通過(guò)檢查零件來(lái)確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時(shí)該刀具完成的零件數(shù)如下: 459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851 試觀察該刀具出現(xiàn)故障時(shí)完成的零件數(shù)屬于哪種分布.,2019/7/15,44,解 1、數(shù)據(jù)輸入,To MATLAB(liti101),2、作頻數(shù)直方圖 hist(x,10),3、分布的正態(tài)性檢驗(yàn) normplot(x),4、參數(shù)估計(jì): muhat,sigmahat,muci,sigmaci = normfit(x),(看起來(lái)刀具壽命服從正態(tài)分布),(刀具壽命近似服從正態(tài)分布),估計(jì)出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為 553.4962,634.5038,方差的0.95置信區(qū)間為 179.2276,237.1329.,To MATLAB(liti104),To MATLAB(liti102),To MATLAB(liti103),2019/7/15,45,5、假設(shè)檢驗(yàn),To MATLAB(liti105),已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗(yàn)其均值 m 是否等于594.,結(jié)果:h =

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論