




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
概率論與數理統(tǒng)計實驗實驗3
參數估計假設檢驗目前一頁\總數五十七頁\編于十四點實驗目的實驗內容直觀了解統(tǒng)計描述的基本內容。2、假設檢驗1、參數估計3、實例4、作業(yè)目前二頁\總數五十七頁\編于十四點一、參數估計參數估計問題的一般提法設有一個統(tǒng)計總體,總體分布函數為F(x,),
其中是未知參數,現從該總體抽樣,得樣本目前三頁\總數五十七頁\編于十四點參數估計點估計區(qū)間估計點估計
——
估計未知參數的值。區(qū)間估計——
根據樣本構造出適當的區(qū)間,使它以一定的概率包含未知參數或未知參數的已知函數的真值。目前四頁\總數五十七頁\編于十四點(一)點估計的求法1、矩估計法
基本思想是用樣本矩估計總體矩
.設總體分布含有個k未知參數
1
,…,k計算總體的前k階矩l=1,...,k階矩目前五頁\總數五十七頁\編于十四點解此方程組得其根為
分別估計參數i,i=1,...,k,并稱其為i的矩估計。由于樣本的l階矩依概率收斂到總體的l階矩l。所以令目前六頁\總數五十七頁\編于十四點2、最大似然估計法設總體X有概率密度f(x;)(或分布律
p(x;)),=(1,...,k)。設X1,...,Xn是來自總體的簡單隨機樣本,x1,...,xn是樣本觀測值。最大似然估計的想法是選取參數i,i=1,...,k,使樣本X1,...,Xn在樣本值x1,...,xn附近取值的概率達到最大。即構造似然函數或目前七頁\總數五十七頁\編于十四點若有參數=(1,...,k)的取值,使得似然函數L(1,...,k)達到最大,則稱它為參數1,...,k的最大似然估計。目前八頁\總數五十七頁\編于十四點(二)區(qū)間估計目前九頁\總數五十七頁\編于十四點置信區(qū)間的意義樞軸量目前十頁\總數五十七頁\編于十四點1、數學期望的置信區(qū)間設樣本
來自正態(tài)母體X~N(,2)(1)方差
2已知,
的置信區(qū)間(2)方差2
未知
,
的置信區(qū)間
目前十一頁\總數五十七頁\編于十四點2、方差的區(qū)間估計
未知時,方差2
的置信區(qū)間為目前十二頁\總數五十七頁\編于十四點(三)參數估計的命令1、正態(tài)總體的參數估計
設總體服從正態(tài)分布,則其點估計和區(qū)間估計可同時由以下命令獲得:
[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令以alpha為顯著性水平,在數據X下,對參數進行估計。(alpha缺省時設定為0.05),返回值muhat是正態(tài)分布的均值的點估計值,sigmahat是標準差的點估計值,
muci是均值的區(qū)間估計,sigmaci是標準差的區(qū)間估計.X為矩陣(列為變量)時,輸出行變量。目前十三頁\總數五十七頁\編于十四點例1.給出容量為50的正態(tài)分布N(10,
22)的隨機數,并以此為樣本值,給出和
的點估計和區(qū)間估計;給出容量為100的正態(tài)分布N(10,
22)的隨機數,并以此為樣本值,給出
和
的點估計和區(qū)間估計;給出容量為1000的正態(tài)分布N(10,
22)的隨機數,并以此為樣本值,給出和
的點估計和區(qū)間估計.命令:X1=normrnd(10,2,50,1);[mu1,sigm1,muci1,sigmci1]=normfit(X1)X2=normrnd(10,2,100,1);[mu2,sigm2,muci2,sigmci2]=normfit(X2)X3=normrnd(10,2,1000,1);[mu3,sigm3,muci3,sigmci3]=normfit(X3)目前十四頁\總數五十七頁\編于十四點例2.中國改革開放30年來的經濟發(fā)展使人民的生活得到了很大的提高,不少家長都覺得這一代孩子的身高比上一代有了明顯變化。下面數據是近期在一個經濟比較發(fā)達的城市中學收集的17歲的男生身高(單位:cm),若數據來自正態(tài)分布,計算學生身高的均值和標準差的點估計和置信水平為0.95的區(qū)間估計。170.1,179,171.5,173.1,174.1,177.2,170.3,176.2,175.4,163.3,179.0,176.5,178.4,165.1,179.4,176.3,179.0,173.9,173.7173.2,172.3,169.3,172.8,176.4,163.7,177.0,165.9,166.6,167.4174.0,174.3,184.5,171.9,181.4,164.6,176.4,172.4,180.3,160.5166.2,173.5,171.7,167.9,168.7,175.6,179.6,171.6,168.1,172.2目前十五頁\總數五十七頁\編于十四點例3.產生正態(tài)分布隨機數作為樣本值,計算區(qū)間估計的覆蓋率。寫出fugailv.m文件。functionfugailv(mu,sigm,n,m,alpha)X=normrnd(mu,sigm,m,1);[Mu,Sigm,Muci,Sigmci]=normfit(X,alpha);muratio=0;sigmratio=0;fori=1:nX=normrnd(mu,sigm,m,1);[Mu(i),Sigm(i),muci,sigmci]=normfit(X,alpha);endforj=1:nif(Mu(j)>=Muci(1))&&(Mu(j)<=Muci(2))muratio=muratio+1;endif(Sigm(j)>=Sigmci(1))&&(Mu(j)<=Sigmci(2))sigmratio=sigmratio+1;endendmuratio=muratio/nsigmratio=sigmratio/n目前十六頁\總數五十七頁\編于十四點[muratio,sgmratio]=fugailv(0,1,1000,200,0.05)[muratio,sgmratio]=fugailv(10,2,2000,500,0.01)[muratio,sgmratio]=fugailv(4,6,5000,400,0.025)目前十七頁\總數五十七頁\編于十四點2、其它分布的參數估計(1).取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;(2).使用Matlab工具箱中具有特定分布總體的估計命令.10[muhat,muci]=expfit(X,alpha)-----
在顯著性水平alpha下,求指數分布的數據X的均值的點估計及其區(qū)間估計.20[lambdahat,lambdaci]=
poissfit(X,alpha)-----
在顯著性水平alpha下,求泊松分布的數據X的參數的點估計及其區(qū)間估計.30[phat,pci]=weibfit(X,alpha)-----
在顯著性水平alpha下,求Weibull分布的數據X的參數的點估計及其區(qū)間估計.目前十八頁\總數五十七頁\編于十四點函數名參數估計對應的參數調用格式mle極大似然估計phat=mle(‘dist’,data)[phat,pci]=mle(‘dist’,data)[phat,pci]=mle(‘dist’,data,alpha)[phat,pci]=mle(‘dist’,data,alpha,pl)normlike對數正態(tài)似然函數L=normlike(params,data)normfit正態(tài)分布
[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)目前十九頁\總數五十七頁\編于十四點函數名參數估計對應的參數調用格式poissfit泊松分布lambdahat=poissfit(X)[lambdahat,lambdaci]=poissfit(X)unifit均勻分布[ahat,bhat]=unifit(X)[ahat,bhat,ACI,BCI]=unifit(X)[ahat,bhat,ACI,BCI]=unifit(X,alpha)[lambdahat,lambdaci]=poissfit(X,alpha)目前二十頁\總數五十七頁\編于十四點函數名參數估計對應的參數調用格式weibfit威布爾分布weiblike威布爾對數似然函數logL=weiblike(params,data)[logL,info]=weiblike(params,data)phat=weibfit(X)[phat,pci]=weibfit(X)[phat,pci]=weibfit(X,alpha)目前二十一頁\總數五十七頁\編于十四點說明:命令mle的調用格式中:[phat,pci]=mle(‘dist’,data,alpha,p1)只用于二項分布,其中p1為試驗次數例4.rv=binornd(20,0.75,1,10)%產生10個二項分布隨機數參數為20和0.75[p,pci]=mle('binomial',rv,0.05,20)rv=12141813121416151816p=0.7400pci=[0.6734,0.7993]目前二十二頁\總數五十七頁\編于十四點例5.生成指數分布隨機數100個,假設均值參數真值為0.5,以此為樣本值,給出參數的點估計和區(qū)間估計命令:r=exprnd(0.5,100,1);[lamta,lamtaci]=expfit(r);[lamta,lamtaci]=expfit(r,0.01);結果:lamta=0.4579lamtaci=0.3799,0.5627lamta=0.4579lamtaci=0.3587,0.6015目前二十三頁\總數五十七頁\編于十四點3.不常用分布的參數估計(極大似然估計)此類問題一般歸結為無約束最優(yōu)化問題。無約束最優(yōu)化問題的一般形式:參數的極大似然估計就是取目標函數為的無約束最優(yōu)化問題。目前二十四頁\總數五十七頁\編于十四點方法:①最速下降法②Newton(牛頓)法及其修正的方法。③共軛方向法和共軛梯度法④變尺度法(擬牛頓法)等等詳見北京大學出版社高惠璇編著《統(tǒng)計計算》P359------P379目前二十五頁\總數五十七頁\編于十四點二、假設檢驗
對總體X的分布律或分布參數作某種假設,根據抽取的樣本觀察值,運用數理統(tǒng)計的分析方法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設.統(tǒng)計推斷的另一類重要問題是假設檢驗問題。在總體的分布函數完全未知或只知其形式,但不知其參數的情況,為了推斷總體的某些未知特性,提出某些關于總體的假設。目前二十六頁\總數五十七頁\編于十四點1.參數檢驗:如果總體的分布函數類型已知,這時構造出的統(tǒng)計量依賴于總體的分布函數,這種檢驗稱為參數檢驗.參數檢驗的目的往往是對總體的參數及其有關性質出明確的判斷.2.非參數檢驗:如果所檢驗的假設并非是對某個分布的參數作出明確的判斷,檢驗統(tǒng)計量的分布函數不依賴于總體的分布類型,這種檢驗叫非參數檢驗.如判斷總體分布類型的檢驗就是非參數檢驗.目前二十七頁\總數五十七頁\編于十四點假設檢驗的一般步驟是:①根據實際問題提出原假設H0與備擇假設H1,即說明需要檢驗的假設的具體內容。②選擇適當的統(tǒng)計量,構造恰當的拒絕域.③根據樣本觀測值計算統(tǒng)計量的觀測值,看其是否落入拒絕域中,從而在檢驗水平條件下對拒絕或接受原假設H0作出判斷
.目前二十八頁\總數五十七頁\編于十四點(一)參數檢驗1、單個正態(tài)總體X~N(,2)均值檢驗--------方差
2已知時采用
z檢驗------方差
2未知,采用t
檢驗目前二十九頁\總數五十七頁\編于十四點目前三十頁\總數五十七頁\編于十四點2、單個正態(tài)總體方差檢驗------2目前三十一頁\總數五十七頁\編于十四點3、兩個正態(tài)總體N(1,12)和N(2,22)均值檢驗(1)已知選取統(tǒng)計量(2)方差未知,檢驗選取統(tǒng)計量目前三十二頁\總數五十七頁\編于十四點(2)方差未知,檢驗選取統(tǒng)計量當|t|>t
1/2(n1+n2-2)時拒絕原假設,否則接受原假設。-----t
1/2
(n1+n2-2)為t分布t
(n1+n2-2)的下測1/2分位數,n1為來自總體N(1,12)
的樣本的容量,n2是來自總體N(2,22)的樣本的容量。目前三十三頁\總數五十七頁\編于十四點4、兩個正態(tài)總體方差檢驗目前三十四頁\總數五十七頁\編于十四點5、參數檢驗的計算機命令10z檢驗(1)
命令ztest函數(2)功能:給定方差條件下進行正態(tài)總體均值得檢驗(3)語法:h=ztest(x,m,sigm);h=ztest(x,m,sigm,alpha);[h,sig,ci]=ztest(x,m,sigm,alpha,tail);h=1,則拒絕原假設,h=0,則接收原假設(4)描述:ztest(x,m,sigm)在0.05水平下進行Z檢驗,以確定服從正態(tài)分布的樣本均值是否為m,sigm為給定的標準差h=ztest(x,m,sigm,alpha)給出顯著水平控制參數alpha,[h,sig,ci]=ztest(x,m,sigm,alpha,tail)允許指定是進行單側檢驗還是雙側檢驗。目前三十五頁\總數五十七頁\編于十四點tail參數可以有下面幾個取值:?tail=0(為默認設置)指定備擇假設?tail=1指定備擇假設?tail=-1指定備擇假設sig為與Z統(tǒng)計量相關的p值。ci為均值真值的1-alpha置信區(qū)間。(5)應用實例目前三十六頁\總數五十七頁\編于十四點例6、生成100個標準正態(tài)分布的隨機數,假設均值和標準差的觀測值與真值之間沒有差異,進行檢驗。過程如下:x=normrnd(0,1,1,100);[h,sig,ci]=ztest(x,0,1)結果:h=0sig=0.6317ci=[-0.14810.2439]目前三十七頁\總數五十七頁\編于十四點例7、某批礦砂的5個樣品中的鎳含量,經測定為(%)
3.253.273.243.263.24設測定值總體服從正態(tài)分布,標準差為0.04,問在0.01水平上能否接受假設:這批鎳含量的均值為3.25。過程如下:x=[3.253.273.243.263.24];[h,sig,ci]=ztest(x,3.25,0.04,0.01)結果:h=0sig=0.9110ci=[3.20593.298]目前三十八頁\總數五十七頁\編于十四點例8、下面列出的是某工廠隨機選取的20只部件的裝配時間
9.810.410.69.69.79.910.911.19.610.210.39.69.911.210.69.810.510.110.59.7設總體服從正態(tài)分布,標準差為0.4,問在0.05水平上能否認為裝配時間的均值顯著的大于10。
需檢驗H0:
10,H1:>10過程如下:x=[9.810.410.69.69.79.910.911.19.610.210.39.69.911.210.69.810.510.110.59.7];[h,sig,ci]=ztest(x,10,0.4,0.05,1)結果:h=1sig=0.0127ci=[10.0529inf]拒絕原假設目前三十九頁\總數五十七頁\編于十四點20單個樣本的t檢驗(1)
命令ttest函數(2)功能:未知方差條件下進行正態(tài)總體均值得檢驗(3)語法:h=ttest(x,m);h=ttest(x,m,alpha);[h,sig,ci]=ttest(x,m,alpha,tail);h=1,則拒絕原假設,h=0,則接收原假設(4)格式的使用和參數的取值含義與ztest大致相同(5)應用實例目前四十頁\總數五十七頁\編于十四點例9、測得一批剛件20個樣品的屈服點(單位:T/mm2)為:
4.985.115.205.115.005.614.885.275.385.205.465.275.234.965.355.155.354.775.335.54設屈服點服從正態(tài)分布,在0.05水平上,檢驗該樣本的均值是否為5.20,的假設檢驗。
需檢驗H0:
=5.20,H1:5.20過程如下:x=[4.985.115.205.115.005.614.885.275.385.205.465.275.234.965.355.155.354.775.335.54];m=mean(x)[h,sig,ci]=ttest(x,5.20,0.05)結果:m=5.2075h=0sig=0.8796ci=[5.10525.3098]目前四十一頁\總數五十七頁\編于十四點30兩個樣本的t檢驗(1)
命令ttest2函數(2)功能:兩個樣本均值差異的t檢驗(3)語法:[h,significance,ci]=ttest2(x,y);[h,significance,ci]=ttest2(x,y,alpha);[h,significance,ci]=ttest2(x,y,alpha,tail);h=1,則拒絕原假設,h=0,則接收原假設(4)格式的使用和參數的取值含義與ttest大致相同(5)應用實例目前四十二頁\總數五十七頁\編于十四點例10、對兩種不同的水稻品種A,B分別統(tǒng)計了8個地區(qū)的單位面積產量(單位:kg)品種A:8687569384937579
品種B:8079589177827666要求檢驗兩個水稻品種的單位面積產量之間是否有顯著差異?過程如下:x=[8687569384937579];y=[8079589177827666];[h,significance,ci]=ttest2(x,y)結果:h=0significance=0.3393ci=-6.423617.4236目前四十三頁\總數五十七頁\編于十四點(二)非參數檢驗1.Jarque-Bera檢驗(1)
數學原理:
Jarque-Bera檢驗是評價X服從正態(tài)分布的假設是否成立。該檢驗基于樣本偏度和峰度,樣本偏度接近于0,樣本峰度接近于3?;诖藰嬙煲粋€包含2
統(tǒng)計量:
JB=n(g1^2+(g2-3)^2/4)/6(n為樣本容量)
Jarque和Bera證明了在正態(tài)性假定下,JB漸進的服從自由度為2的2分布,若JB超過了12(2),即2(2)的下測1分位數,則拒絕正態(tài)分布零假設,反之,接受零假設。目前四十四頁\總數五十七頁\編于十四點(2)函數名稱:jbtest(3)語法:H=jbtest(x);H=jbtest(x,alpha);[H,p,jbstat,cv]=jbtest(x,alpha);H=1,則拒絕服從正態(tài),H=0,則接收服從正態(tài)(4)alpha為顯著水平,p為p值,jbstat為檢驗統(tǒng)計量的值,cv為確定是否拒絕原假設的的臨界值。目前四十五頁\總數五十七頁\編于十四點(5)應用實例例11、對下列數據確定其是否服從正態(tài)分布。459362624542509584433748815505
612452434982640742565706593680
9266531644877346084281153593844
527552513781474388824538862659
77585975549697515628954771609
402960885610292837473677358638
699634555570844166061062484120
447654564339280246687539790581
621724531512577496468499544645
764558378765666763217715310851目前四十六頁\總數五十七頁\編于十四點2.總體分布的χ2檢驗法總體X的樣本觀測值為x1,x2,…,xn,考慮如下檢驗問題:H0:X的分布函數為F(x),這里F(x)為已知的分布函數在實數軸上取k個分點t1,t2,…,tk,得到互不相交的區(qū)間設樣本觀測值為x1,x2,…,xn落入第i個區(qū)間的個數為vi,其頻率為vi/n.目前四十七頁\總數五十七頁\編于十四點如果H0成立,由給定的分布函數F(x),可以計算X落在每個小區(qū)間的概率為:其中考慮統(tǒng)計量目前四十八頁\總數五十七頁\編于十四點Pearson在1900年證明了如下定理:設F(x)是隨機變量X的分布函數,當H0成立時,上述給出的χ2的極限分布為χ2(k),k為分點個數,其中F(x)中不含有未知參數,vi稱為實際頻數,npi為理論頻數。由此定理可得:給定顯著性水平α,查χ2分布表可得臨界值χ2α(k),當χ2>χ2α(k)時,則拒絕H0,認為總體X的分布函數與F(x)有顯著差異。若χ2≤χ2α(k),不能拒絕H0。目前四十九頁\總數五十七頁\編于十四點當總體F(x)中含有未知參數θ1,θ2,…,θr時,則需要先利用數據對未知參數進行估計(通常采用極大似然估計),此時有如下定理:設F(x)是隨機變量X的分布函數,且F(x)中含有r個未知參數當H0成立時,上述給出的χ2的極限分布為χ2(k-r),r為參數個數.此方法對離散型隨機變量和連續(xù)型隨機變量均適用。由此定理可得:給定顯著性水平α,查χ2分布表可得臨界值χ2α(k-r),當χ2>χ2α(k-r)時,則拒絕H0,認為總體X的分布函數與F(x)有顯著差異。若χ2≤χ2α(k-r)不能拒絕H0。目前五十頁\總數五十七頁\編于十四點例12:盧瑟福在2608個等時間間隔
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 提高溝通技巧的試題及答案
- 2025年中國農業(yè)銀行個人購房借款合同
- 模擬醫(yī)學護膚培訓課件
- 2025租房合同簡化范本
- 2025加盟代理合同范本
- 2025優(yōu)化股權激勵計劃租賃直升機合同
- 前端面試題 題庫及答案
- 2025企業(yè)預拌混凝土采購合同
- 長沙商貿旅游職業(yè)技術學院《甲骨文和金文》2023-2024學年第一學期期末試卷
- 汕頭大學《高等代數上》2023-2024學年第一學期期末試卷
- 火龍罐綜合灸療法
- 05價值觀探索-職業(yè)生涯規(guī)劃
- HY/T 075-2005海洋信息分類與代碼
- 全封閉聲屏障施工專項方案正文范本
- 頰癌病人的護理查房
- 體外培育牛黃-省中西醫(yī)結合醫(yī)院呼吸科課件
- 智能化成品保護方案
- 特種設備使用登記表(范本)
- 漢譯巴利三藏相應部5-大篇
- 2022年青海大學醫(yī)學院附屬藏醫(yī)院醫(yī)護人員招聘筆試模擬試題及答案解析
- 城市地理學-第八章城市空間分布體系
評論
0/150
提交評論