




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、實(shí)驗(yàn)五 數(shù)據(jù)的統(tǒng)計(jì)分析,數(shù)學(xué)實(shí)驗(yàn),現(xiàn)實(shí)生活中的許多數(shù)據(jù)都是隨機(jī)產(chǎn)生的,如考試分?jǐn)?shù)、月降雨量、燈泡壽命等。,從數(shù)理統(tǒng)計(jì)角度來看,這些數(shù)據(jù)其實(shí)都是符合某種分布的,這種規(guī)律就是統(tǒng)計(jì)規(guī)律。,本實(shí)驗(yàn)主要通過對概率密度函數(shù)曲線的直觀認(rèn)識和數(shù)據(jù)分布的形態(tài)猜測,以及密度函數(shù)的參數(shù)估計(jì),進(jìn)行簡單的正態(tài)假設(shè)檢驗(yàn),揭示日常生活中隨機(jī)數(shù)據(jù)的一些統(tǒng)計(jì)規(guī)律。,問題背景和實(shí)驗(yàn)?zāi)康?Matlab相關(guān)命令介紹,pdf 概率密度函數(shù),y=pdf(name,x,A),y=pdf(name,x,A,B) 或 y=pdf(name,x,A,B,C),返回由 name 指定的單參數(shù)分布的概率密度,x為樣本數(shù)據(jù),name 用來指定分布類型
2、,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、ncx2、norm、 poiss、rayl、t、unif、unid、wbl。,返回由 name 指定的雙參數(shù)或三參數(shù)分布的概率密度,Matlab相關(guān)命令介紹,例:,x=-8:0.1:8; y=pdf(norm,x,0,1); y1=pdf(norm,x,1,2); plot(x,y,x,y1,:),注:,y=pdf(norm,x,0,1),y=normpdf(x,0,1),相類似地,,y=pdf(beta,x,A,B),y=betapdf(x,A,
3、B),y=pdf(bino,x,N,p),y=binopdf(x,N,p), ,Matlab相關(guān)命令介紹,normfit 正態(tài)分布中的參數(shù)估計(jì),muhat,sigmahat,muci,sigmaci=normfit(x,alpha),對樣本數(shù)據(jù) x 進(jìn)行參數(shù)估計(jì),并計(jì)算置信度為 1-alpha 的置信區(qū)間 alpha 可以省略,缺省值為 0.05,即置信度為 95%,load 從matlab數(shù)據(jù)文件中載入數(shù)據(jù),S=load(數(shù)據(jù)文件名),hist 繪制給定數(shù)據(jù)的直方圖,hist(x,m),Matlab相關(guān)命令介紹,table=tabulate(x),繪制頻數(shù)表,返回值 table 中,第一列為
4、x的值,第二列為該值出現(xiàn)的次數(shù),最后一列包含每個值的百分比。,ttest(x,m,alpha),假設(shè)檢驗(yàn)函數(shù)。此函數(shù)對樣本數(shù)據(jù) x 進(jìn)行顯著性水平為 alpha 的 t 假設(shè)檢驗(yàn),以檢驗(yàn)正態(tài)分布樣本 x(標(biāo)準(zhǔn)差未知)的均值是否為 m。,Matlab相關(guān)命令介紹,normplot(x),統(tǒng)計(jì)繪圖函數(shù),進(jìn)行正態(tài)分布檢驗(yàn)。研究表明:如果數(shù)據(jù)是來自一個正態(tài)分布,則該線為一直線形態(tài);如果它是來自其他分布,則為曲線形態(tài)。,wblplot(x),統(tǒng)計(jì)繪圖函數(shù),進(jìn)行 Weibull 分布檢驗(yàn)。,Matlab相關(guān)命令介紹,其它函數(shù),cdf 系列函數(shù):累積分布函數(shù) inv 系列函數(shù):逆累積分布函數(shù) rnd 系列函
5、數(shù):隨機(jī)數(shù)發(fā)生函數(shù) stat 系列函數(shù):均值與方差函數(shù),例:,p=normcdf(-2:2,0,1),x=norminv(0.025 0.975,0,1),n=normrnd(0,1,1 5),n=1:5; m,v=normstat(n*n,n*n),常見的概率分布,連續(xù)分布:正態(tài)分布,正態(tài)分布(連續(xù)分布),如果隨機(jī)變量 X 的密度函數(shù)為:,則稱 X 服從正態(tài)分布。記做:,標(biāo)準(zhǔn)正態(tài)分布:N (0, 1),正態(tài)分布也稱高斯分布,是概率論中最重要的一個分布。,如果一個變量是大量微小、獨(dú)立的隨機(jī)因素的疊加,那么它一定滿足正態(tài)分布。如測量誤差、產(chǎn)品質(zhì)量、月降雨量等,正態(tài)分布舉例,x=-8:0.1:8;
6、 y=normpdf(x,0,1); y1=normpdf(x,1,2); plot(x,y,x,y1,:),例:標(biāo)準(zhǔn)正態(tài)分布和非標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)圖形,連續(xù)分布:均勻分布,均勻分布(連續(xù)分布),如果隨機(jī)變量 X 的密度函數(shù)為:,則稱 X 服從均勻分布。記做:,均勻分布在實(shí)際中經(jīng)常使用,譬如一個半徑為 r 的汽車輪胎,因?yàn)檩喬ド系娜我稽c(diǎn)接觸地面的可能性是相同的,所以輪胎圓周接觸地面的位置 X 是服從 0,2r 上的均勻分布。,均勻分布舉例,x=-10:0.01:10; r=1; y=unifpdf(x,0,2*pi*r); plot(x,y);,連續(xù)分布:指數(shù)分布,指數(shù)分布(連續(xù)分布),如果
7、隨機(jī)變量 X 的密度函數(shù)為:,則稱 X 服從參數(shù)為 的指數(shù)分布。記做:,在實(shí)際應(yīng)用問題中,等待某特定事物發(fā)生所需要的時間往往服從指數(shù)分布。如某些元件的壽命;隨機(jī)服務(wù)系統(tǒng)中的服務(wù)時間;動物的壽命等都常常假定服從指數(shù)分布。,指數(shù)分布具有無記憶性:,指數(shù)分布舉例,x=0:0.1:30; y=exppdf(x,4); plot(x,y),例: =4 時的指數(shù)分布密度函數(shù)圖,離散分布:幾何分布,幾何分布是一種常見的離散分布,在貝努里實(shí)驗(yàn)中,每次試驗(yàn)成功的概率為 p,設(shè)試驗(yàn)進(jìn)行到第 次才出現(xiàn)成功,則 的分布滿足:,其右端項(xiàng)是幾何級數(shù) 的一般項(xiàng),于是人們稱它為幾何分布。,x=0:30; y=geopdf(x
8、,0.5); plot(x,y),例: p=0.5 時的幾何分布密度函數(shù)圖,離散分布:二項(xiàng)分布,二項(xiàng)分布屬于離散分布,如果隨機(jī)變量 X 的分布列為:,則稱這種分布為二項(xiàng)分布。記做:,x=0:50; y=binopdf(x,500,0.05); plot(x,y),例: n=500,p=0.05 時的二項(xiàng)式分布密度函數(shù)圖,離散分布: Poisson 分布,泊松分布也屬于離散分布,是1837年由法國數(shù)學(xué)家 Poisson 首次提出,其概率分布列為:,記做:,泊松分布是一種常用的離散分布,它與單位時間(或單位面積、單位產(chǎn)品等)上的計(jì)數(shù)過程相聯(lián)系。如:單位時間內(nèi),電話總機(jī)接到用戶呼喚次數(shù);1 平方米內(nèi)
9、,玻璃上的氣泡數(shù)等。,Poisson 分布舉例,x=0:50; y=poisspdf(x,25); plot(x,y),例: =25 時的泊松分布密度函數(shù)圖,離散分布:均勻分布,如果隨機(jī)變量 X 的分布列為:,則稱這種分布為離散均勻分布。記做:,n=20; x=1:n; y=unidpdf(x,n); plot(x,y,o-),例: n=20 時的離散均勻分布密度函數(shù)圖,抽樣分布: 2分布,設(shè)隨機(jī)變量 X1, X2, , Xn 相互獨(dú)立,且同服從正態(tài)分布 N(0,1),則稱隨機(jī)變量 n2= X12+X22+ +Xn2服從自由度為 n 的 2 分布,記作 ,亦稱隨機(jī)變量 n2 為 2 變量。,x
10、=0:0.1:20; y=chi2pdf(x,4); plot(x,y),例: n=4 和 n=10 時的 2 分布密度函數(shù)圖,x=0:0.1:20; y=chi2pdf(x,10); plot(x,y),抽樣分布: F 分布,設(shè)隨機(jī)變量 ,且 X 與 Y 相互獨(dú)立,則稱隨機(jī)變量,x=0.01:0.1:8.01; y=fpdf(x,4,10); plot(x,y),例: F(4,10) 的分布密度函數(shù)圖,為服從自由度 (m, n) 的 F 分布。記做:,抽樣分布: t 分布,設(shè)隨機(jī)變量 ,且 X 與 Y 相互獨(dú)立,則稱隨機(jī)變量,x=-6:0.01:6; y=tpdf(x,4); plot(x,
11、y),例: t (4) 的分布密度函數(shù)圖,為服從自由度 n 的 t 分布。記做:,頻數(shù)直方圖或頻數(shù)表,對于給定的數(shù)據(jù)集,假設(shè)它們滿足以上十種分布之一,如何確定屬于哪種分布?,x=load(data1.txt); x=x(:); hist(x),例 1:某次筆試的分?jǐn)?shù)見 data1.txt,試畫出頻數(shù)直方圖,繪制頻數(shù)直方圖,或列出頻數(shù)表,從圖形上看,筆試成績較為接近正態(tài)分布,頻數(shù)直方圖或頻數(shù)表,x=load(data2.txt); x=x(:); hist(x),例 2:某次上機(jī)考試的分?jǐn)?shù)見 data2.txt,試畫出頻數(shù)直方圖,從圖形上看,上機(jī)考試成績較為接近離散均勻分布,x=load(dat
12、a3.txt); x=x(:); hist(x),例 3:上海1998年來的月降雨量的數(shù)據(jù)見 data3.txt , 試畫出頻數(shù)直方圖,從圖形上看,月降雨量較為接近 2 分布,頻數(shù)直方圖或頻數(shù)表,在重復(fù)數(shù)據(jù)較多的情況下,我們也可以利用Matlab自帶的 tabulate 函數(shù)生成頻數(shù)表,并以頻數(shù)表的形式來發(fā)掘數(shù)據(jù)分布的規(guī)律。,x=load(data4.txt); x=x(:); tabulate(x) hist(x),例 4:給出數(shù)據(jù) data4.txt,試畫出其直方圖,并生成頻數(shù)表,頻數(shù)直方圖或頻數(shù)表,x=load(data5.txt); x=x(:); hist(x) fiugre his
13、tfit(x) % 加入較接近的正態(tài)分布密度曲線,例 5:現(xiàn)累積有100次刀具故障記錄,當(dāng)故障出現(xiàn)時該批刀具完成的零件數(shù)見 data5.txt,試畫出其直方圖。,從圖形上看,較為接近正態(tài)分布,參數(shù)估計(jì),當(dāng)我們可以基本確定數(shù)據(jù)集 X 符合某種分布后,我們還需要確定這個分布的參數(shù)。,由于正態(tài)分布情況發(fā)生的比較多,故我們主要考慮正態(tài)分布的情形。,對于未知參數(shù)的估計(jì),可分兩種情況:,點(diǎn)估計(jì) 區(qū)間估計(jì),參數(shù)估計(jì):點(diǎn)估計(jì),構(gòu)造樣本 X 與某個統(tǒng)計(jì)量有關(guān)的一個函數(shù),作為該統(tǒng)計(jì)量的一個估計(jì),稱為點(diǎn)估計(jì)。,Matlab 統(tǒng)計(jì)工具箱中,一般采用最大似然估計(jì)法給出參數(shù)的點(diǎn)估計(jì)。,泊松分布 P () 的 最大似然估計(jì)
14、是,指數(shù)分布 Exp () 的 最大似然估計(jì)是,點(diǎn)估計(jì)舉例,正態(tài)分布 N (, 2) 中, 最大似然估計(jì)是 , 2 的最大似然估計(jì)是,x=load(data1.txt); x=x(:); mu,sigma=normfit(x),例 6:已知例 1 中的數(shù)據(jù)服從正態(tài)分布 N (, 2) ,試求其參數(shù) 和 的值。,使用 normfit 函數(shù),參數(shù)估計(jì):區(qū)間估計(jì),構(gòu)造樣本 X 與某個統(tǒng)計(jì)量有關(guān)的兩個函數(shù),作為該統(tǒng)計(jì)量的下限估計(jì)與上限估計(jì),下限與上限構(gòu)成一個區(qū)間,這個區(qū)間作為該統(tǒng)計(jì)量的估計(jì),稱為區(qū)間估計(jì)。,Matlab 統(tǒng)計(jì)工具箱中,一般也采用最大似然估計(jì)法給出參數(shù)的區(qū)間估計(jì)。,區(qū)間估計(jì)舉例,x=lo
15、ad(data1.txt); x=x(:); mu,sigma,muci,sigmaci=normfit(x),例 7:已知例 1 中的數(shù)據(jù)服從正態(tài)分布 N (, 2) ,試求出 和 2 的置信度為 95% 的區(qū)間估計(jì)。,x=load(data6.txt); x=x(:); mu,sigma,muci,sigmaci=normfit(x,0.01),例 8:從自動機(jī)床加工的同類零件中抽取16件,測得長度值見 data6.txt,已知零件長度服從正態(tài)分布 N (, 2) ,試求零件長度均值 和標(biāo)準(zhǔn)差 的置信度為 99% 的置信區(qū)間。,假設(shè)檢驗(yàn),對總體的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀
16、察值,運(yùn)用數(shù)理統(tǒng)計(jì)的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè),這就是假設(shè)檢驗(yàn)問題。,以正態(tài)假設(shè)檢驗(yàn)為例,來說明假設(shè)檢驗(yàn)的基本過程。,正態(tài)假設(shè)檢驗(yàn),正態(tài)假設(shè)檢驗(yàn)的一般過程:,假設(shè)檢驗(yàn):利用 Matlab 統(tǒng)計(jì)工具箱給出的常用的假設(shè)檢驗(yàn)方法的函數(shù) ttest,進(jìn)行顯著性水平為 alpha 的 t 假設(shè)檢驗(yàn),以檢驗(yàn)正態(tài)分布樣本 x(標(biāo)準(zhǔn)差未知)的均值是否為 m。運(yùn)行結(jié)果中,當(dāng) h=1 時,表示拒絕零假設(shè);當(dāng) h=0 時,表示不能拒絕零假設(shè)。,對比正態(tài)分布的概率密度函數(shù)分布圖,判斷某統(tǒng)計(jì)量的分布可能服從正態(tài)分布,利用統(tǒng)計(jì)繪圖函數(shù) normplot 或 wblplot 進(jìn)行正態(tài)分布檢驗(yàn),正態(tài)假設(shè)檢驗(yàn)舉例,x=load(data5.txt); x=x(:); normplot(x),例 9:試說明例 5 中的刀具使用壽命服從正態(tài)分布,并且說明在方差未知的情況下其均值 m 取為 597 是否合理。,(1) 對比刀具使用壽命分布圖與正態(tài)分布的概率密度分布函數(shù)圖,得初步結(jié)論:該批刀具的使用壽命可能服從正態(tài)分布。,解:,(2) 利用統(tǒng)計(jì)繪圖函數(shù) norm
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 出生人口登記員考試試卷及答案
- 航空液壓系統(tǒng)密封性檢查員崗位面試問題及答案
- 化工分析工(滴定分析)崗位面試問題及答案
- 上市公司股東權(quán)益保護(hù)股份管理合同
- 股份轉(zhuǎn)讓與產(chǎn)業(yè)園區(qū)建設(shè)合作合同
- 股權(quán)投資與退出機(jī)制執(zhí)行合同
- 車輛保險代理銷售與理賠服務(wù)合同
- 股東合作協(xié)議:保密條款與全球市場拓展
- 能源咨詢顧問長期聘用合同范本
- 互聯(lián)網(wǎng)股份公司創(chuàng)始股東股權(quán)激勵與退出協(xié)議
- 神經(jīng)內(nèi)科??谱o(hù)士進(jìn)修匯報
- 危險化學(xué)品應(yīng)急處置卡
- 金屬材料生物相容性研究
- 幕墻工程施工的重點(diǎn)難點(diǎn)分析及針對措施
- 新版人教版七年級全冊英語單詞表(含音標(biāo))可打印
- 2024-2026胡潤財(cái)富報告
- 人教版六年級數(shù)學(xué)下冊全冊分層作業(yè)設(shè)計(jì)含答案
- 中國舞蹈家協(xié)會《中國舞蹈考級》第四版教材教學(xué)內(nèi)容
- 自動駕駛卡車的應(yīng)用與發(fā)展詳述
- 備考2024四川省安全員之C2證(土建安全員)通關(guān)提分題庫(考點(diǎn)梳理)
- 高標(biāo)準(zhǔn)農(nóng)田建設(shè)項(xiàng)目工程建設(shè)進(jìn)度計(jì)劃與措施
評論
0/150
提交評論