第10講數(shù)據(jù)的統(tǒng)計分析與描述_第1頁
第10講數(shù)據(jù)的統(tǒng)計分析與描述_第2頁
第10講數(shù)據(jù)的統(tǒng)計分析與描述_第3頁
第10講數(shù)據(jù)的統(tǒng)計分析與描述_第4頁
第10講數(shù)據(jù)的統(tǒng)計分析與描述_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計描述和分析數(shù)據(jù)的統(tǒng)計描述和分析實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容實(shí)驗(yàn)內(nèi)容2掌握用數(shù)學(xué)軟件包求解統(tǒng)計問題掌握用數(shù)學(xué)軟件包求解統(tǒng)計問題.1直觀了解統(tǒng)計基本內(nèi)容直觀了解統(tǒng)計基本內(nèi)容.1 1統(tǒng)計的基本理論統(tǒng)計的基本理論. .3 3實(shí)驗(yàn)作業(yè)實(shí)驗(yàn)作業(yè). .2用數(shù)學(xué)軟件包求解統(tǒng)計問題用數(shù)學(xué)軟件包求解統(tǒng)計問題.統(tǒng)計的基本概念統(tǒng)計的基本概念參數(shù)估計參數(shù)估計假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)數(shù)據(jù)的統(tǒng)計描述和分析數(shù)據(jù)的統(tǒng)計描述和分析一、統(tǒng)計量一、統(tǒng)計量二、分布函數(shù)的近似求法二、分布函數(shù)的近似求法三、幾個在統(tǒng)計中常用的概率分布三、幾個在統(tǒng)計中常用的概率分布-4-2024600.050.10.150.

2、20.250.30.350.41正態(tài)分布正態(tài)分布),(2smN密度函數(shù):222)(21)(smsp-=xexp分布函數(shù):dyexFyx222)(21)(smsp-=其中m為均值,2s為方差,+-x.標(biāo)準(zhǔn)正態(tài)分布:N(0,1)密度函數(shù)2221)(xex-=pjdyexyx2221)(-=Fp 分布函數(shù)0510152000.020.040.060.080.10.120.140.16-6-4-2024600.050.10.150.20.250.30.350.400.511.522.5300.10.20.30.40.50.60.70.80.91返回返回F(10,50)分布的密度函數(shù)曲線一、點(diǎn)估計的求法

3、一、點(diǎn)估計的求法(一)矩估計法(二)極大似然估計法二、區(qū)間估計的求法二、區(qū)間估計的求法1已知已知DX,求,求EX的置信區(qū)間的置信區(qū)間2 未知方差未知方差DX,求,求EX的置信區(qū)間的置信區(qū)間(一一)數(shù)學(xué)期望的置信區(qū)間數(shù)學(xué)期望的置信區(qū)間(二)方差的區(qū)間估計(二)方差的區(qū)間估計返回返回1.參數(shù)檢驗(yàn)參數(shù)檢驗(yàn):如果觀測的分布函數(shù)類型已知,這時構(gòu)造出的 統(tǒng)計量依賴于總體的分布函數(shù),這種檢驗(yàn)稱為參數(shù)檢驗(yàn). 參數(shù)檢驗(yàn)的目的往往是對總體的參數(shù)及其有關(guān)性質(zhì)作出明 確的判斷. 對總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).2.非

4、參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn):如果所檢驗(yàn)的假設(shè)并非是對某個參數(shù)作出明 確的判斷,因而必須要求構(gòu)造出的檢驗(yàn)統(tǒng)計量的分布函數(shù) 不依賴于觀測值的分布函數(shù)類型,這種檢驗(yàn)叫非參數(shù)檢驗(yàn). 如:要求判斷總體分布類型的檢驗(yàn)就是非參數(shù)檢驗(yàn).假設(shè)檢驗(yàn)的一般步驟假設(shè)檢驗(yàn)的一般步驟(一)單個正態(tài)總體均值的檢驗(yàn)(一)單個正態(tài)總體均值的檢驗(yàn)一、參數(shù)檢驗(yàn)一、參數(shù)檢驗(yàn)2總總體體方方差差2s未未知知(二)單個正態(tài)總體方差的檢驗(yàn)(二)單個正態(tài)總體方差的檢驗(yàn)(三)兩個正態(tài)總體均值的檢驗(yàn)(三)兩個正態(tài)總體均值的檢驗(yàn)構(gòu)造統(tǒng)計量212121222211)2() 1() 1(nnnnnnsnsnYXt+-+-+-=,(四)兩個正態(tài)總體方差的檢驗(yàn)(四

5、)兩個正態(tài)總體方差的檢驗(yàn)(一)(一) 皮爾遜皮爾遜2擬合檢驗(yàn)法擬合檢驗(yàn)法二、非參數(shù)檢驗(yàn)二、非參數(shù)檢驗(yàn)(二)概率紙檢驗(yàn)法(二)概率紙檢驗(yàn)法 概率紙是一種判斷總體分布的簡便工具.使用他們,可以很快地判斷總體分布的類型.概率紙的種類很多.返回返回統(tǒng)計工具箱中的基本統(tǒng)計命令統(tǒng)計工具箱中的基本統(tǒng)計命令1. 數(shù)據(jù)的錄入、保存和調(diào)用數(shù)據(jù)的錄入、保存和調(diào)用2. 基本統(tǒng)計量基本統(tǒng)計量3. 常見的概率分布函數(shù)常見的概率分布函數(shù)4. 頻頻 數(shù)數(shù) 直直 方方 圖圖 的的 描描 繪繪5. 參數(shù)估計參數(shù)估計6. 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)7. 綜合實(shí)例綜合實(shí)例返回返回一、數(shù)據(jù)的錄入、保存和調(diào)用一、數(shù)據(jù)的錄入、保存和調(diào)用 例例1 上

6、海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下:統(tǒng)計工具箱中的基本統(tǒng)計命令統(tǒng)計工具箱中的基本統(tǒng)計命令1年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入. 命令格式: x=a:h:b t=78:872分別以x和y代表變量職工工資總額和商品零售總額.x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.03將變量t、x、y的數(shù)據(jù)保存在文件data中. save data t x y 4進(jìn)行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù). load

7、dataTo MATLAB(txy)1輸入矩陣:data=78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.02將矩陣data的數(shù)據(jù)保存在文件data1中:save data1 data3 3進(jìn)行統(tǒng)計分析時,先用命令:load data1 調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y: t=data(1,:) x=da

8、ta(2,:) y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令: data(:,j)To MATLAB(data)返回返回二、基本統(tǒng)計量二、基本統(tǒng)計量對隨機(jī)變量x,計算其基本統(tǒng)計量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x) 方差:var(x)偏度:skewness(x) 峰度:kurtosis(x)例例 對例1中的職工工資總額x,可計算上述基本統(tǒng)計量.To MATLAB(tjl)返回返回三三、常見概率分布的函數(shù)常見概率分布的函數(shù)MATLAB工具箱對每一種分布都提供5類函數(shù),其命令字符為:概率密度:pdf 概率分布:cdf逆概率分布:inv

9、 均值與方差:stat隨機(jī)數(shù)生成:rnd (當(dāng)需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)例例 2 畫出正態(tài)分布) 1 , 0(N和)2 , 0(2N的概率密度函數(shù)圖形.在MATLAB中輸入以下命令:x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2);plot(x,y,x,z)1密度函數(shù)密度函數(shù):p=normpdf(x,mu,sigma) (當(dāng)mu=0,sigma=1時可缺省)To MATLAB(liti2)如對均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:To MATL

10、AB(liti3)3逆概率分布逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PX50),按中心極限定理,它近似地 服從正態(tài)分布;二、使用MATLAB工具箱中具有特定分布總體的估計命令.(1)muhat, muci = expfit(X,alpha) 在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計及其區(qū)間估計.(2)lambdahat, lambdaci = poissfit(X,alpha) 在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計及其區(qū)間估計.(3)phat, pci = weibfit(X,alpha) 在顯著性水平alpha下,求

11、Weibull分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計及其區(qū)間估計.返回返回六、假設(shè)檢驗(yàn)六、假設(shè)檢驗(yàn) 在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).1總體方差總體方差 已知時,總體均值的檢驗(yàn)使用已知時,總體均值的檢驗(yàn)使用 z檢驗(yàn)檢驗(yàn) h,sig,ci = ztest(x,m,sigma,alpha,tail)檢驗(yàn)數(shù)據(jù) x 的關(guān)于均值的某一假設(shè)是否成立,其中sigma 為已知方差, alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值:tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 m ”tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 m ”tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 m ”ta

12、il的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為均值的 1-alpha 置信區(qū)間.2s 例例7 MATLAB統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年1月份和2月份的汽油平均價格(price1,price2分別是1、2月份的油價,單位為美分),它是容量為20的雙樣本.假設(shè)1月份油價的標(biāo)準(zhǔn)偏差是每加侖4分幣(s=4),試檢驗(yàn)1月份油價的均值是否等于115.解解 作假設(shè):m = 115.首先取出數(shù)據(jù),用以下命令: load gas然后用以下命令檢驗(yàn) h,sig

13、,ci = ztest(price1,115,4)返回:h = 0,sig = 0.8668,ci = 113.3970 116.9030.檢驗(yàn)結(jié)果: 1. 布爾變量h=0, 表示不拒絕零假設(shè). 說明提出的假設(shè)均值115 是合理的. 2. sig值為0.8668, 遠(yuǎn)超過0.5, 不能拒絕零假設(shè) 3. 95%的置信區(qū)間為113.4, 116.9, 它完全包括115, 且精度很 高. To MATLAB(liti7)2總體方差總體方差 未知時,總體均值的檢驗(yàn)使用未知時,總體均值的檢驗(yàn)使用t 檢驗(yàn)檢驗(yàn) h,sig,ci = ttest(x,m,alpha,tail)檢驗(yàn)數(shù)據(jù) x 的關(guān)于均值的某一假

14、設(shè)是否成立,其中alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值:tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 m ”tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 m ”tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 m ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為均值的 1-alpha 置信區(qū)間.2s返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.檢驗(yàn)結(jié)果: 1. 布爾變量h=1, 表示拒絕零假設(shè). 說明提出的假

15、設(shè)油價均值115是不合理的. 2. 95%的置信區(qū)間為116.8 120.2, 它不包括 115, 故不能接受假設(shè). 3. sig值為4.9517e-004, 遠(yuǎn)小于0.5, 不能接受零 假設(shè). To MATLAB(liti8)例例8 試檢驗(yàn)例8中2月份油價price2的均值是否等于115.解解 作假設(shè):m = 115,price2為2月份的油價,不知其方差,故用以下命令檢驗(yàn)h,sig,ci = ttest( price2 ,115)3兩總體均值的假設(shè)檢驗(yàn)兩總體均值的假設(shè)檢驗(yàn)使用使用 t 檢驗(yàn)檢驗(yàn) h,sig,ci = ttest2(x,y,alpha,tail)檢驗(yàn)數(shù)據(jù) x ,y 的關(guān)于均值

16、的某一假設(shè)是否成立,其中alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值:tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 y 的均值 ”tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 y 的均值 ”tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 y 的均值 ”tail的缺省值為 0, alpha的缺省值為 0.05. 返回值 h 為一個布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為與x與y均值差的的 1-alpha 置信區(qū)間.返回:h = 1,sig = 0.0083,ci =-5.8,-0.9.檢驗(yàn)結(jié)果:1. 布爾變量h=1, 表示拒絕

17、零假設(shè). 說明提出的 假設(shè)“油價均值相同”是不合理的. 2. 95%的置信區(qū)間為-5.8,-0.9,說明一月份油 價比二月份油價約低1至6分. 3. sig-值為0.0083, 遠(yuǎn)小于0.5, 不能接受“油價均 相同”假設(shè). To MATLAB(liti9)例例9 試檢驗(yàn)例8中1月份油價price1與2月份的油價price2均值是否相同.解解 用以下命令檢驗(yàn)h,sig,ci = ttest2(price1,price2)4非參數(shù)檢驗(yàn):總體分布的檢驗(yàn)非參數(shù)檢驗(yàn):總體分布的檢驗(yàn)MATLAB工具箱提供了兩個對總體分布進(jìn)行檢驗(yàn)的命令:(1)h = normplot(x)(2)h = weibplot(

18、x) 此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài). 此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回返回例例10 一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時出現(xiàn)故障機(jī)會均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下: 459 362 624 542 509 584 433 748 815 505 612

19、 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496

20、 468 499 544 645 764 558 378 765 666 763 217 715 310 851試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布.解解 1數(shù)據(jù)輸入To MATLAB(liti101)2作頻數(shù)直方圖 hist(x,10) 3分布的正態(tài)性檢驗(yàn) normplot(x)4參數(shù)估計: muhat,sigmahat,muci,sigmaci=normfit(x)(看起來刀具壽命服從正態(tài)分布)(刀具壽命近似服從正態(tài)分布)估計出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為 553.4962,634.5038,方差的0.95置信區(qū)間為 179.2276,237.1329.To MATLAB(liti104)To MATLAB(liti102)To MATLAB(liti103)5假設(shè)檢驗(yàn)To MATLAB(liti105) 已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗(yàn)其均值 m 是否等于594.結(jié)果:h = 0,sig = 1,ci =553.4962,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論