吳贛昌編-概率論與數(shù)理統(tǒng)計-第7章課件_第1頁
吳贛昌編-概率論與數(shù)理統(tǒng)計-第7章課件_第2頁
吳贛昌編-概率論與數(shù)理統(tǒng)計-第7章課件_第3頁
吳贛昌編-概率論與數(shù)理統(tǒng)計-第7章課件_第4頁
吳贛昌編-概率論與數(shù)理統(tǒng)計-第7章課件_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第七章假設(shè)檢驗假設(shè)檢驗的基本概念正態(tài)總體參數(shù)的假設(shè)檢驗第七章假設(shè)檢驗假設(shè)檢驗的基本概念17.1假設(shè)檢驗的基本概念數(shù)理統(tǒng)計的主要任務(wù)是從樣本出發(fā),對總體的分布作出推斷。作推斷的方法,主要有兩種,一種是上一章講的參數(shù)估計,另一種是假設(shè)檢驗。引例:設(shè)一箱中有紅白兩種顏色的球共100個,甲說這里有98個白球,乙從箱中任取一個,發(fā)現(xiàn)是紅球,問甲的說法是否正確?先作假設(shè)H0:箱中確有98個白球

如果假設(shè)H0正確,則從箱中任取一球時紅球的概率只有0.02.通常認(rèn)為在一次隨機試驗中,概率小的事件不易發(fā)生,因此,若乙從箱中任取一個,發(fā)現(xiàn)是白球,則沒有理由懷疑假設(shè)H0的正確性。今乙任取一個發(fā)現(xiàn)是紅球,即小概率事件竟然在一次試驗中發(fā)生了,故有理由拒絕假設(shè)H0.7.1假設(shè)檢驗的基本概念數(shù)理統(tǒng)計的主要任務(wù)是2例7.1某廠生產(chǎn)合金鋼,其抗拉強度X(單位:kg/mm2)可以認(rèn)為服從正態(tài)分布N(μ,σ2)。據(jù)廠方說,抗拉強度的平均值μ=48?,F(xiàn)抽查5件樣品,測得抗拉強度為46.845.048.345.144.7問廠方的說法是否可信?這相當(dāng)于先提出了一個假設(shè)H0:μ=48,然后要求從樣本觀測值出發(fā),檢驗它是否成立。例7.1某廠生產(chǎn)合金鋼,其抗拉強度X(單位:kg/mm23例7.2為了研究飲酒對工作能力的影響,任選19名工人分成兩組,一組工人工作前飲一杯酒,一組工人工作前不飲酒,讓他們每人做一件同樣的工作,測得他們的完工時間(單位:分鐘)如下:飲酒者30465134484539615867未飲酒者282255453935423820問飲酒對工作能力是否有顯著的影響?兩組工人完成工作的時間,可以分別看作是兩個服從正態(tài)分布的總體X~N(μ1,σ12)和Y~N(μ2,σ22),如果飲酒對工作能力沒有影響,兩個總體的均值應(yīng)該相等。所以問題相當(dāng)于要求我們根據(jù)實際測得的樣本數(shù)據(jù),檢驗假設(shè)H0:μ1=μ2是否成立。例7.2為了研究飲酒對工作能力的影響,任選19名工人分成4例7.3某班學(xué)生的一次考試成績?yōu)閤1,x2,…,xn,問學(xué)生的考試成績X是否服從正態(tài)分布?學(xué)生的考試成績可以看作是總體X的樣本觀察值,該例題相當(dāng)于提出這樣一個問題H0:X~N(μ,σ2)然后要求從樣本出發(fā),檢驗它是否成立。例7.1-7.3有一個共同的特點,就是先提出一個假設(shè),然后要求從樣本出發(fā)檢驗它是否成立。我們稱這樣的問題為假設(shè)檢驗問題。在假設(shè)檢驗中,提出要求檢驗的假設(shè),稱為原假設(shè)或零假設(shè),記為H0,原假設(shè)如果不成立,就要接受另一個假設(shè),這另一個假設(shè)稱為備擇假設(shè)或?qū)α⒓僭O(shè),記為H1。例7.3某班學(xué)生的一次考試成績?yōu)閤1,x2,…,xn,問5例7.1中,原假設(shè)是H0:μ=48,備擇假設(shè)H1:μ≠48,例7.2中,H0:μ1=μ2,H1:μ1≠

μ2例7.3中,H0:X~N(μ,σ2),H1:X不服從正態(tài)分布問題:設(shè)總體X~N(μ,σ2),已知其中σ=σ0,(x1,x2,…,xn)是X的樣本,要檢驗H0:μ=μ0,(μ0是已知常數(shù)),H1:μ≠

μ0例7.1中,原假設(shè)是H0:μ=48,問題:設(shè)總體X~N(μ,61、檢驗方法總體X~N(μ,σ2),要檢驗μ是否為μ0,而μ是未知的.我們知道μ的無偏估計是的大小在一定程度上反映了,樣本均值μ的大小,因此,當(dāng)H0為真時,即μ=μ0時,的觀察值與μ0的偏差一般不應(yīng)太大。如果我們就應(yīng)懷疑假設(shè)H0的正確性并拒絕H0,而可歸結(jié)為統(tǒng)計量的大小。當(dāng)H0為真時,統(tǒng)計量過分大,的大小,由此,我們可選定一正數(shù)k,使得當(dāng)時就拒絕H0,時,則接受H0。1、檢驗方法的大小在一定程度上反映了,樣本均值μ的大小,因此7稱使成立的樣本值(x1,x2,…,xn)為檢驗的拒絕域,記為稱使成立的樣本值(x1,x2,…,xn)為檢驗的接受域,記為W0。稱使成立的樣本值(x1,x2,…,xn)為檢驗的拒絕域,記為82、檢驗的兩類錯誤當(dāng)H0為真時,作出拒絕H0的判斷,稱這類錯誤為第一類錯誤或棄真錯誤;當(dāng)H0不真時,作出接受H0的判斷,稱這類錯誤為第二類錯誤或取偽錯誤。記α=P{拒絕H0|

H0真};β=P{接受H0|

H0假}對于給定的一對H0和H1,總可找出許多臨界域W,人們自然希望找到這種臨界域W,使得犯兩類錯誤的概率都很小。奈曼—皮爾遜(Neyman—Pearson)提出了一個原則:“在控制犯第一類錯誤的概率不超過指定值的條件下,盡量使犯第二類錯誤小”,按這種法則做出的檢驗稱為“顯著性檢驗”,稱為顯著性水平或檢驗水平。2、檢驗的兩類錯誤對于給定的一對H0和H1,總可找出許多臨界93、假設(shè)檢驗的步驟(1)提出原假設(shè)H0和備擇假設(shè)H1;(2)選取合適的統(tǒng)計量,當(dāng)H0為真時,其分布是確定的;(3)對給定的顯著性水平α,由P{拒絕H0|H0真}=,查標(biāo)準(zhǔn)正態(tài)分布表,求出臨界值,用它來劃分拒絕域W1和接受域W0;(4)由樣本觀察值計算檢驗統(tǒng)計量的值;(5)由統(tǒng)計量的樣本值,作出拒絕還是接受H0的判斷。3、假設(shè)檢驗的步驟107.2正態(tài)總體下參數(shù)的假設(shè)檢驗一、單個正態(tài)總體下參數(shù)的假設(shè)檢驗對于一個正態(tài)總體均值的檢驗,常見的有以下三種類型:(1)H0:μ=μ0,H1:μ≠μ0;(2)H0:μ≤μ0,H1:μ>μ0;(3)H0:μ≥μ0,H1:μ<μ0;雙邊假設(shè)檢驗單邊假設(shè)檢驗7.2正態(tài)總體下參數(shù)的假設(shè)檢驗一、單個正態(tài)總體下參數(shù)的假111、總體方差σ2已知,正態(tài)總體的均值檢驗

構(gòu)造檢驗統(tǒng)計量當(dāng)μ=μ0時,統(tǒng)計量U服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)。對于給定的顯著性水平α,有(1)H0:μ=μ0,H1:μ≠μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H01、總體方差σ2已知,正態(tài)總體的均值檢驗構(gòu)造檢驗統(tǒng)計量12(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(3)H0:μ≥μ0,H1:μ<μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒絕13例7.4設(shè)某產(chǎn)品的某項質(zhì)量指標(biāo)服從正態(tài)分布,已知它的標(biāo)準(zhǔn)差σ=150,現(xiàn)從一批產(chǎn)品中隨機地抽取26個,測得該項指標(biāo)的平均值為1637。問能否認(rèn)為這批產(chǎn)品的該項指標(biāo)值為1600(α=0.05)?解(1)提出原假設(shè):H0:μ=1600,H1:μ≠1600;(2)選取統(tǒng)計量(3)對于給定的顯著性水平α=0.05,查標(biāo)準(zhǔn)正態(tài)分布表(4)計算統(tǒng)計量觀察值(5)結(jié)論接受原假設(shè)H0即不能否定這批產(chǎn)品該項指標(biāo)為1600。

例7.4設(shè)某產(chǎn)品的某項質(zhì)量指標(biāo)服從正態(tài)分布,已知它的標(biāo)準(zhǔn)14例7.5完成生產(chǎn)線上某件工作的平均時間不少于15.5分鐘,標(biāo)準(zhǔn)差為3分鐘。對隨機抽取的9名職工講授一種新方法,訓(xùn)練期結(jié)束后,9名職工完成此項工作的平均時間為13.5分鐘。這個結(jié)果是否說明用新方法所需時間比用老方法所需時間短?設(shè)α=0.05,并假定完成這件工作的時間服從正態(tài)分布。解(單邊檢驗問題)(1)提出原假設(shè)H0:μ≥15.5,H1μ<15.5;(2)選取統(tǒng)計量(3)查標(biāo)準(zhǔn)正態(tài)分布表對于給定的顯著性水平α=0.05,已知n=9,σ=3,(4)計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即說明用新方法所需時間比用老方法所需時間短。

例7.5完成生產(chǎn)線上某件工作的平均時間不少于15.5分鐘152、總體方差σ2未知,正態(tài)總體的均值檢驗由于總體方差σ2未知,故選取統(tǒng)計量當(dāng)μ=μ0時,統(tǒng)計量T服從自由度為n-1的t分布。對于給定的顯著性水平α,有(1)H0:μ=μ0,H1:μ≠μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H02、總體方差σ2未知,正態(tài)總體的均值檢驗由于總體方差σ2未知16(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(3)H0:μ≥μ0,H1:μ<μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒17例7.6某地區(qū)青少年犯罪年齡構(gòu)成服從正態(tài)分布,現(xiàn)隨機抽取9名罪犯,其年齡如下:22,17,19,25,25,18,16,23,24試以95%的概率判斷犯罪青少年的平均年齡是否為18歲。解(1)提出原假設(shè):H0:μ=18,H1:μ≠18;(2)選取統(tǒng)計量對于給定的顯著性水平α=0.05,(3)查t分布表得(4)由題意,計算得到樣本均值和樣本方差分別為計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即能以95%的把握推斷該地區(qū)青少年犯罪的平均年齡不是18歲。

例7.6某地區(qū)青少年犯罪年齡構(gòu)成服從正態(tài)分布,現(xiàn)隨機抽取18例7.7食品罐頭的細(xì)菌含量按規(guī)定標(biāo)準(zhǔn)不能大于62.0,現(xiàn)從一批罐頭中抽取9個,檢驗其細(xì)菌含量,經(jīng)計算得樣本均值為62.5,樣本標(biāo)準(zhǔn)差為0.3。問這批罐頭的質(zhì)量是否完全符合標(biāo)準(zhǔn)(α=0.05)?(設(shè)罐頭的細(xì)菌含量服從正態(tài)分布)

解(1)由題意建立假設(shè):H0:μ≤62.0,H1:μ>62.0;(2)選取統(tǒng)計量對于給定的顯著性水平α=0.05,(3)查t分布表得(4)由題意,計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即認(rèn)為這批罐頭細(xì)菌含量大于62.0,質(zhì)量不符合標(biāo)準(zhǔn)。

例7.7食品罐頭的細(xì)菌含量按規(guī)定標(biāo)準(zhǔn)不能大于62.0,現(xiàn)193、正態(tài)總體方差的檢驗

常見的正態(tài)總體方差的假設(shè)檢驗有以下三種類型:(1)H0:σ2=σ02,H1:σ2≠σ02

;(2)H0:σ2≤σ02,H1:σ2>σ02;(3)H0:σ2≥σ02,H1:σ2<σ02。雙邊假設(shè)檢驗單邊假設(shè)檢驗3、正態(tài)總體方差的檢驗常見的正態(tài)總體方差的假設(shè)檢驗有以下三20選取統(tǒng)計量當(dāng)H0為真時,服從自由度為n-1的χ2分布。對于給定的顯著性水平α,有(1)H0:σ2=σ02,H1:σ2≠σ02

;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0或選取統(tǒng)計量當(dāng)H0為真時,服從自由度為n-1的21(2)H0:σ2≤σ02,H1:σ2>σ02;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(3)H0:σ2≥σ02,H1:σ2<σ02;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:σ2≤σ02,H1:σ2>σ02;檢驗規(guī)則為當(dāng)22例7.8一家超市從生產(chǎn)玻璃器皿的廠家訂購了一批玻璃花瓶,要求其折射率的標(biāo)準(zhǔn)差不能超過0.01。貨到后,隨機抽出一個容量為20的花瓶的樣本進行檢查,發(fā)現(xiàn)樣本折射率的標(biāo)準(zhǔn)差為0.015。試問在α=0.01的條件下,該超市應(yīng)該是接受還是拒絕這批玻璃花瓶?解(1)由題意建立假設(shè):H0:σ2≤0.012,H1:σ2>0.012(2)選取統(tǒng)計量對于給定的顯著性水平α=0.01,(3)查χ2分布表得(4)由題意,S=0.015,計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即認(rèn)為這批玻璃花瓶折射率的標(biāo)準(zhǔn)差顯著地超過了標(biāo)準(zhǔn),該超市應(yīng)該拒絕接受這批花瓶。例7.8一家超市從生產(chǎn)玻璃器皿的廠家訂購了一批玻璃花瓶,要求237.3兩個正態(tài)總體下參數(shù)的假設(shè)檢驗對于兩個正態(tài)總體均值的檢驗,常見的有以下三種類型:(1)H0:μ1-μ2=μ0,H1:μ1-μ2≠μ0;(2)H0:μ1-μ2≤μ0,H1:μ1-μ2>μ0;(3)H0:μ1-μ2≥μ0,H1:μ1-μ2<μ0。通常稱為兩個正態(tài)總體均值差的檢驗。7.3兩個正態(tài)總體下參數(shù)的假設(shè)檢驗對于兩241、兩個正態(tài)總體的方差已知設(shè)總體X~N(μ1,σ12),Y~N(μ2,σ22),X、Y相互獨立,(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分別來自總體X、Y的樣本。構(gòu)造檢驗統(tǒng)計量當(dāng)μ1-μ2=μ0時,U~N(0,1)對于給定的顯著性水平α,有(1)H0:μ1-μ2=μ0,H1:μ1-μ2≠μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H01、兩個正態(tài)總體的方差已知設(shè)總體X~N(μ1,σ12),Y~25當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ0,H1:μ1-μ2>μ0;檢驗規(guī)則為(3)H0:μ1-μ2≥μ0,H1:μ1-μ2<μ0,檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ026例7.9已知某運輸公司等待甲、乙船運公司貨物的時間均服從正態(tài)分布,其標(biāo)準(zhǔn)差分別為4.6和4.9天?,F(xiàn)作隨機抽樣,得到了35個等待甲船運公司的時間,其平均時間為14.8天,得到47個乙船運公司貨物的時間,其平均時間為17.8天。試問:等待甲、乙船運公司貨物的時間有無顯著差異?(α=0.05)解設(shè)等待甲公司貨物的時間均值為μ1,等待乙公司貨物的時間均值為μ2。由題意建立假設(shè)H0:μ1=μ2,H1:μ1≠μ2;由于兩個總體都服從正態(tài)分布,選取統(tǒng)計量對于給定的顯著性水平α=0.05,查正態(tài)分布表計算統(tǒng)計量觀察值已知由于所以拒絕原假設(shè)H0,而接受H1,即認(rèn)為等待甲、乙船運公司貨物的時間有顯著差異。

例7.9已知某運輸公司等待甲、乙船運公司貨物的時間均服從272、兩個正態(tài)總體方差未知,但相等由于兩個正態(tài)總體的方差未知但相等,因此構(gòu)造檢驗統(tǒng)計量

當(dāng)μ1-μ2=μ0時,T~t(n1+n2-2)對于給定的顯著性水平α,有(1)H0:μ1-μ2=μ0,H1:μ1-μ2≠μ0;檢驗規(guī)則為當(dāng)拒絕H0當(dāng)接受H02、兩個正態(tài)總體方差未知,但相等由于兩個正態(tài)總體的方差未知但28當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ0,H1:μ1-μ2>μ0;檢驗規(guī)則為(3)H0:μ1-μ2≥μ0,H1:μ1-μ2<μ0,檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ029例7.10某企業(yè)經(jīng)理認(rèn)為女性員工每年病假天數(shù)多于男性員工,為此作了一個調(diào)查。從男女員工中隨機抽取了10名,得到病假天數(shù)分別為

女性:371921351640126325男性:244218150910202213已知男女員工的病假天數(shù)均服從正態(tài)分布,且方差相等,試問:女性員工的病假天數(shù)是否多于男性員工?(α=0.05)解設(shè)女性員工的年病假天數(shù)的均值為μ1,男性員工的年病假天數(shù)的均值為μ2;由題意建立假設(shè)

H0:μ1≤μ2,H1:μ1>μ2;選取統(tǒng)計量對于給定的顯著性水平α=0.05,查t分布表由題意可計算得統(tǒng)計量觀察值為t=0.8696由于t=0.8696<tα(18)=1.7341,接受H0,即不能認(rèn)為女性員工的年病假天數(shù)多于男性員工。例7.10某企業(yè)經(jīng)理認(rèn)為女性員工每年病假天數(shù)多于男性員工303、兩個正態(tài)總體方差的檢驗對于兩個正態(tài)總體方差的檢驗,常見的有以下三種類型:(1)H0:σ12=σ22,H1:σ12≠σ22;(2)H0:σ12≤σ22,H1:σ12>σ22;(3)H0:σ12≥σ22,H1:σ12<σ22。通常稱為兩個正態(tài)總體方差比的檢驗。3、兩個正態(tài)總體方差的檢驗對于兩個正態(tài)總體方31設(shè)總體X~N(μ1,σ12),Y~N(μ2,σ22),X、Y相互獨立,(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分別來自總體X、Y的樣本。S12,S22分別為兩個樣本的樣本方差。構(gòu)造統(tǒng)計量當(dāng)H0為真,即σ12=σ22時,F(xiàn)=S12/S22服從自由度分別為n1-1和n2-1的F分布。對于給定的顯著性水平α,有

(1)H0:σ12=σ22,H1:σ12≠σ22;的檢驗規(guī)則為當(dāng)或時,拒絕H0當(dāng)時,接受H0設(shè)總體X~N(μ1,σ12),Y~N(μ2,σ22),X、Y32(2)H0:σ12≤σ22,H1:σ12>σ22;檢驗規(guī)則為當(dāng)當(dāng)當(dāng)當(dāng)時,拒絕H0時,拒絕H0時,接受H0(3)H0:σ12≥σ22,H1:σ12<σ22。檢驗規(guī)則為時,接受H0(2)H0:σ12≤σ22,H1:σ12>σ22;檢驗規(guī)33例7.11在例7.10中,我們假定男女員工年病假的天數(shù)服從正態(tài)分布,且方差相等。但從樣本測得的數(shù)據(jù),計算得S12=18.32,S22=11.22,即兩個樣本方差存在著一定的差異,因而需要檢驗這兩個總體的方差是否真的相等。(α=0.05)解由題意建立假設(shè)H0:σ12=σ22,H1:σ12≠σ22;取統(tǒng)計量當(dāng)H0為真,即σ12=σ22時,F(xiàn)~F(n1-1,n2-1)對于給定的顯著性水平α,n1=n2=10,查F分布表計算統(tǒng)計量的觀察值為

所以接受原假設(shè)H0,即認(rèn)為這兩個總體的方差無顯著差異。

例7.11在例7.10中,我們假定男女員工年病假的天數(shù)服34例7.12設(shè)保險絲的融化時間服從正態(tài)分布,取9根測得其熔化時間(單位:分)的樣本均值為62,標(biāo)準(zhǔn)差為10。(1)是否可以認(rèn)為整批保險絲的熔化時間服從N(60,92)?(=0.05)(2)是否可以認(rèn)為整批保險絲的熔化時間的方差顯著大于70?(=0.05)答(1)|t|=0.6<tα/2=2.306,接受60;2.18<χ2=9.877<17.535,接受92(2)χ2=11.428<15.507,認(rèn)為方差不顯著大于70。例7.12設(shè)保險絲的融化時間服從正態(tài)分布,取9根測得其熔35例7.13比較甲,乙兩種安眠藥的療效。將20名患者分成兩組,每組10人。其中10人服用甲藥后延長睡眠的時數(shù)分別為1.9,0.8,1.1,0.1,-0.1,4.4,5.5,1.6,4.6,3.4;另10人服用乙藥后延長睡眠的時數(shù)分別為0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,0.0,2.0。若服用兩種安眠藥后增加的睡眠時數(shù)服從方差相同的正態(tài)分布。試問兩種安眠藥的療效有無顯著性差異?(=0.10)解=0.10拒絕H0認(rèn)為兩種安眠藥的療效有顯著性差異。例7.13比較甲,乙兩種安眠藥的療效。將20名患者分成兩36例7.13中,試檢驗是否甲安眠藥比乙安眠藥療效顯著?這里t=1.86>1.3304,故拒絕H0,認(rèn)為甲安眠藥比乙安眠藥療效顯著。例7.13中,試檢驗是否甲安眠藥比乙安眠藥療效顯著?這里t=37第七章假設(shè)檢驗假設(shè)檢驗的基本概念正態(tài)總體參數(shù)的假設(shè)檢驗第七章假設(shè)檢驗假設(shè)檢驗的基本概念387.1假設(shè)檢驗的基本概念數(shù)理統(tǒng)計的主要任務(wù)是從樣本出發(fā),對總體的分布作出推斷。作推斷的方法,主要有兩種,一種是上一章講的參數(shù)估計,另一種是假設(shè)檢驗。引例:設(shè)一箱中有紅白兩種顏色的球共100個,甲說這里有98個白球,乙從箱中任取一個,發(fā)現(xiàn)是紅球,問甲的說法是否正確?先作假設(shè)H0:箱中確有98個白球

如果假設(shè)H0正確,則從箱中任取一球時紅球的概率只有0.02.通常認(rèn)為在一次隨機試驗中,概率小的事件不易發(fā)生,因此,若乙從箱中任取一個,發(fā)現(xiàn)是白球,則沒有理由懷疑假設(shè)H0的正確性。今乙任取一個發(fā)現(xiàn)是紅球,即小概率事件竟然在一次試驗中發(fā)生了,故有理由拒絕假設(shè)H0.7.1假設(shè)檢驗的基本概念數(shù)理統(tǒng)計的主要任務(wù)是39例7.1某廠生產(chǎn)合金鋼,其抗拉強度X(單位:kg/mm2)可以認(rèn)為服從正態(tài)分布N(μ,σ2)。據(jù)廠方說,抗拉強度的平均值μ=48?,F(xiàn)抽查5件樣品,測得抗拉強度為46.845.048.345.144.7問廠方的說法是否可信?這相當(dāng)于先提出了一個假設(shè)H0:μ=48,然后要求從樣本觀測值出發(fā),檢驗它是否成立。例7.1某廠生產(chǎn)合金鋼,其抗拉強度X(單位:kg/mm240例7.2為了研究飲酒對工作能力的影響,任選19名工人分成兩組,一組工人工作前飲一杯酒,一組工人工作前不飲酒,讓他們每人做一件同樣的工作,測得他們的完工時間(單位:分鐘)如下:飲酒者30465134484539615867未飲酒者282255453935423820問飲酒對工作能力是否有顯著的影響?兩組工人完成工作的時間,可以分別看作是兩個服從正態(tài)分布的總體X~N(μ1,σ12)和Y~N(μ2,σ22),如果飲酒對工作能力沒有影響,兩個總體的均值應(yīng)該相等。所以問題相當(dāng)于要求我們根據(jù)實際測得的樣本數(shù)據(jù),檢驗假設(shè)H0:μ1=μ2是否成立。例7.2為了研究飲酒對工作能力的影響,任選19名工人分成41例7.3某班學(xué)生的一次考試成績?yōu)閤1,x2,…,xn,問學(xué)生的考試成績X是否服從正態(tài)分布?學(xué)生的考試成績可以看作是總體X的樣本觀察值,該例題相當(dāng)于提出這樣一個問題H0:X~N(μ,σ2)然后要求從樣本出發(fā),檢驗它是否成立。例7.1-7.3有一個共同的特點,就是先提出一個假設(shè),然后要求從樣本出發(fā)檢驗它是否成立。我們稱這樣的問題為假設(shè)檢驗問題。在假設(shè)檢驗中,提出要求檢驗的假設(shè),稱為原假設(shè)或零假設(shè),記為H0,原假設(shè)如果不成立,就要接受另一個假設(shè),這另一個假設(shè)稱為備擇假設(shè)或?qū)α⒓僭O(shè),記為H1。例7.3某班學(xué)生的一次考試成績?yōu)閤1,x2,…,xn,問42例7.1中,原假設(shè)是H0:μ=48,備擇假設(shè)H1:μ≠48,例7.2中,H0:μ1=μ2,H1:μ1≠

μ2例7.3中,H0:X~N(μ,σ2),H1:X不服從正態(tài)分布問題:設(shè)總體X~N(μ,σ2),已知其中σ=σ0,(x1,x2,…,xn)是X的樣本,要檢驗H0:μ=μ0,(μ0是已知常數(shù)),H1:μ≠

μ0例7.1中,原假設(shè)是H0:μ=48,問題:設(shè)總體X~N(μ,431、檢驗方法總體X~N(μ,σ2),要檢驗μ是否為μ0,而μ是未知的.我們知道μ的無偏估計是的大小在一定程度上反映了,樣本均值μ的大小,因此,當(dāng)H0為真時,即μ=μ0時,的觀察值與μ0的偏差一般不應(yīng)太大。如果我們就應(yīng)懷疑假設(shè)H0的正確性并拒絕H0,而可歸結(jié)為統(tǒng)計量的大小。當(dāng)H0為真時,統(tǒng)計量過分大,的大小,由此,我們可選定一正數(shù)k,使得當(dāng)時就拒絕H0,時,則接受H0。1、檢驗方法的大小在一定程度上反映了,樣本均值μ的大小,因此44稱使成立的樣本值(x1,x2,…,xn)為檢驗的拒絕域,記為稱使成立的樣本值(x1,x2,…,xn)為檢驗的接受域,記為W0。稱使成立的樣本值(x1,x2,…,xn)為檢驗的拒絕域,記為452、檢驗的兩類錯誤當(dāng)H0為真時,作出拒絕H0的判斷,稱這類錯誤為第一類錯誤或棄真錯誤;當(dāng)H0不真時,作出接受H0的判斷,稱這類錯誤為第二類錯誤或取偽錯誤。記α=P{拒絕H0|

H0真};β=P{接受H0|

H0假}對于給定的一對H0和H1,總可找出許多臨界域W,人們自然希望找到這種臨界域W,使得犯兩類錯誤的概率都很小。奈曼—皮爾遜(Neyman—Pearson)提出了一個原則:“在控制犯第一類錯誤的概率不超過指定值的條件下,盡量使犯第二類錯誤小”,按這種法則做出的檢驗稱為“顯著性檢驗”,稱為顯著性水平或檢驗水平。2、檢驗的兩類錯誤對于給定的一對H0和H1,總可找出許多臨界463、假設(shè)檢驗的步驟(1)提出原假設(shè)H0和備擇假設(shè)H1;(2)選取合適的統(tǒng)計量,當(dāng)H0為真時,其分布是確定的;(3)對給定的顯著性水平α,由P{拒絕H0|H0真}=,查標(biāo)準(zhǔn)正態(tài)分布表,求出臨界值,用它來劃分拒絕域W1和接受域W0;(4)由樣本觀察值計算檢驗統(tǒng)計量的值;(5)由統(tǒng)計量的樣本值,作出拒絕還是接受H0的判斷。3、假設(shè)檢驗的步驟477.2正態(tài)總體下參數(shù)的假設(shè)檢驗一、單個正態(tài)總體下參數(shù)的假設(shè)檢驗對于一個正態(tài)總體均值的檢驗,常見的有以下三種類型:(1)H0:μ=μ0,H1:μ≠μ0;(2)H0:μ≤μ0,H1:μ>μ0;(3)H0:μ≥μ0,H1:μ<μ0;雙邊假設(shè)檢驗單邊假設(shè)檢驗7.2正態(tài)總體下參數(shù)的假設(shè)檢驗一、單個正態(tài)總體下參數(shù)的假481、總體方差σ2已知,正態(tài)總體的均值檢驗

構(gòu)造檢驗統(tǒng)計量當(dāng)μ=μ0時,統(tǒng)計量U服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)。對于給定的顯著性水平α,有(1)H0:μ=μ0,H1:μ≠μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H01、總體方差σ2已知,正態(tài)總體的均值檢驗構(gòu)造檢驗統(tǒng)計量49(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(3)H0:μ≥μ0,H1:μ<μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒絕50例7.4設(shè)某產(chǎn)品的某項質(zhì)量指標(biāo)服從正態(tài)分布,已知它的標(biāo)準(zhǔn)差σ=150,現(xiàn)從一批產(chǎn)品中隨機地抽取26個,測得該項指標(biāo)的平均值為1637。問能否認(rèn)為這批產(chǎn)品的該項指標(biāo)值為1600(α=0.05)?解(1)提出原假設(shè):H0:μ=1600,H1:μ≠1600;(2)選取統(tǒng)計量(3)對于給定的顯著性水平α=0.05,查標(biāo)準(zhǔn)正態(tài)分布表(4)計算統(tǒng)計量觀察值(5)結(jié)論接受原假設(shè)H0即不能否定這批產(chǎn)品該項指標(biāo)為1600。

例7.4設(shè)某產(chǎn)品的某項質(zhì)量指標(biāo)服從正態(tài)分布,已知它的標(biāo)準(zhǔn)51例7.5完成生產(chǎn)線上某件工作的平均時間不少于15.5分鐘,標(biāo)準(zhǔn)差為3分鐘。對隨機抽取的9名職工講授一種新方法,訓(xùn)練期結(jié)束后,9名職工完成此項工作的平均時間為13.5分鐘。這個結(jié)果是否說明用新方法所需時間比用老方法所需時間短?設(shè)α=0.05,并假定完成這件工作的時間服從正態(tài)分布。解(單邊檢驗問題)(1)提出原假設(shè)H0:μ≥15.5,H1μ<15.5;(2)選取統(tǒng)計量(3)查標(biāo)準(zhǔn)正態(tài)分布表對于給定的顯著性水平α=0.05,已知n=9,σ=3,(4)計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即說明用新方法所需時間比用老方法所需時間短。

例7.5完成生產(chǎn)線上某件工作的平均時間不少于15.5分鐘522、總體方差σ2未知,正態(tài)總體的均值檢驗由于總體方差σ2未知,故選取統(tǒng)計量當(dāng)μ=μ0時,統(tǒng)計量T服從自由度為n-1的t分布。對于給定的顯著性水平α,有(1)H0:μ=μ0,H1:μ≠μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H02、總體方差σ2未知,正態(tài)總體的均值檢驗由于總體方差σ2未知53(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(3)H0:μ≥μ0,H1:μ<μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ≤μ0,H1:μ>μ0;檢驗規(guī)則為當(dāng)時,拒54例7.6某地區(qū)青少年犯罪年齡構(gòu)成服從正態(tài)分布,現(xiàn)隨機抽取9名罪犯,其年齡如下:22,17,19,25,25,18,16,23,24試以95%的概率判斷犯罪青少年的平均年齡是否為18歲。解(1)提出原假設(shè):H0:μ=18,H1:μ≠18;(2)選取統(tǒng)計量對于給定的顯著性水平α=0.05,(3)查t分布表得(4)由題意,計算得到樣本均值和樣本方差分別為計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即能以95%的把握推斷該地區(qū)青少年犯罪的平均年齡不是18歲。

例7.6某地區(qū)青少年犯罪年齡構(gòu)成服從正態(tài)分布,現(xiàn)隨機抽取55例7.7食品罐頭的細(xì)菌含量按規(guī)定標(biāo)準(zhǔn)不能大于62.0,現(xiàn)從一批罐頭中抽取9個,檢驗其細(xì)菌含量,經(jīng)計算得樣本均值為62.5,樣本標(biāo)準(zhǔn)差為0.3。問這批罐頭的質(zhì)量是否完全符合標(biāo)準(zhǔn)(α=0.05)?(設(shè)罐頭的細(xì)菌含量服從正態(tài)分布)

解(1)由題意建立假設(shè):H0:μ≤62.0,H1:μ>62.0;(2)選取統(tǒng)計量對于給定的顯著性水平α=0.05,(3)查t分布表得(4)由題意,計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即認(rèn)為這批罐頭細(xì)菌含量大于62.0,質(zhì)量不符合標(biāo)準(zhǔn)。

例7.7食品罐頭的細(xì)菌含量按規(guī)定標(biāo)準(zhǔn)不能大于62.0,現(xiàn)563、正態(tài)總體方差的檢驗

常見的正態(tài)總體方差的假設(shè)檢驗有以下三種類型:(1)H0:σ2=σ02,H1:σ2≠σ02

;(2)H0:σ2≤σ02,H1:σ2>σ02;(3)H0:σ2≥σ02,H1:σ2<σ02。雙邊假設(shè)檢驗單邊假設(shè)檢驗3、正態(tài)總體方差的檢驗常見的正態(tài)總體方差的假設(shè)檢驗有以下三57選取統(tǒng)計量當(dāng)H0為真時,服從自由度為n-1的χ2分布。對于給定的顯著性水平α,有(1)H0:σ2=σ02,H1:σ2≠σ02

;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0或選取統(tǒng)計量當(dāng)H0為真時,服從自由度為n-1的58(2)H0:σ2≤σ02,H1:σ2>σ02;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(3)H0:σ2≥σ02,H1:σ2<σ02;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:σ2≤σ02,H1:σ2>σ02;檢驗規(guī)則為當(dāng)59例7.8一家超市從生產(chǎn)玻璃器皿的廠家訂購了一批玻璃花瓶,要求其折射率的標(biāo)準(zhǔn)差不能超過0.01。貨到后,隨機抽出一個容量為20的花瓶的樣本進行檢查,發(fā)現(xiàn)樣本折射率的標(biāo)準(zhǔn)差為0.015。試問在α=0.01的條件下,該超市應(yīng)該是接受還是拒絕這批玻璃花瓶?解(1)由題意建立假設(shè):H0:σ2≤0.012,H1:σ2>0.012(2)選取統(tǒng)計量對于給定的顯著性水平α=0.01,(3)查χ2分布表得(4)由題意,S=0.015,計算統(tǒng)計量觀察值(5)由于所以拒絕原假設(shè)H0,而接受H1,即認(rèn)為這批玻璃花瓶折射率的標(biāo)準(zhǔn)差顯著地超過了標(biāo)準(zhǔn),該超市應(yīng)該拒絕接受這批花瓶。例7.8一家超市從生產(chǎn)玻璃器皿的廠家訂購了一批玻璃花瓶,要求607.3兩個正態(tài)總體下參數(shù)的假設(shè)檢驗對于兩個正態(tài)總體均值的檢驗,常見的有以下三種類型:(1)H0:μ1-μ2=μ0,H1:μ1-μ2≠μ0;(2)H0:μ1-μ2≤μ0,H1:μ1-μ2>μ0;(3)H0:μ1-μ2≥μ0,H1:μ1-μ2<μ0。通常稱為兩個正態(tài)總體均值差的檢驗。7.3兩個正態(tài)總體下參數(shù)的假設(shè)檢驗對于兩611、兩個正態(tài)總體的方差已知設(shè)總體X~N(μ1,σ12),Y~N(μ2,σ22),X、Y相互獨立,(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分別來自總體X、Y的樣本。構(gòu)造檢驗統(tǒng)計量當(dāng)μ1-μ2=μ0時,U~N(0,1)對于給定的顯著性水平α,有(1)H0:μ1-μ2=μ0,H1:μ1-μ2≠μ0;檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H01、兩個正態(tài)總體的方差已知設(shè)總體X~N(μ1,σ12),Y~62當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ0,H1:μ1-μ2>μ0;檢驗規(guī)則為(3)H0:μ1-μ2≥μ0,H1:μ1-μ2<μ0,檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ063例7.9已知某運輸公司等待甲、乙船運公司貨物的時間均服從正態(tài)分布,其標(biāo)準(zhǔn)差分別為4.6和4.9天。現(xiàn)作隨機抽樣,得到了35個等待甲船運公司的時間,其平均時間為14.8天,得到47個乙船運公司貨物的時間,其平均時間為17.8天。試問:等待甲、乙船運公司貨物的時間有無顯著差異?(α=0.05)解設(shè)等待甲公司貨物的時間均值為μ1,等待乙公司貨物的時間均值為μ2。由題意建立假設(shè)H0:μ1=μ2,H1:μ1≠μ2;由于兩個總體都服從正態(tài)分布,選取統(tǒng)計量對于給定的顯著性水平α=0.05,查正態(tài)分布表計算統(tǒng)計量觀察值已知由于所以拒絕原假設(shè)H0,而接受H1,即認(rèn)為等待甲、乙船運公司貨物的時間有顯著差異。

例7.9已知某運輸公司等待甲、乙船運公司貨物的時間均服從642、兩個正態(tài)總體方差未知,但相等由于兩個正態(tài)總體的方差未知但相等,因此構(gòu)造檢驗統(tǒng)計量

當(dāng)μ1-μ2=μ0時,T~t(n1+n2-2)對于給定的顯著性水平α,有(1)H0:μ1-μ2=μ0,H1:μ1-μ2≠μ0;檢驗規(guī)則為當(dāng)拒絕H0當(dāng)接受H02、兩個正態(tài)總體方差未知,但相等由于兩個正態(tài)總體的方差未知但65當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ0,H1:μ1-μ2>μ0;檢驗規(guī)則為(3)H0:μ1-μ2≥μ0,H1:μ1-μ2<μ0,檢驗規(guī)則為當(dāng)時,拒絕H0當(dāng)時,接受H0當(dāng)時,拒絕H0當(dāng)時,接受H0(2)H0:μ1-μ2≤μ066例7.10某企業(yè)經(jīng)理認(rèn)為女性員工每年病假天數(shù)多于男性員工,為此作了一個調(diào)查。從男女員工中隨機抽取了10名,得到病假天數(shù)分別為

女性:371921351640126325男性:244218150910202213已知男女員工的病假天數(shù)均服從正態(tài)分布,且方差相等,試問:女性員工的病假天數(shù)是否多于男性員工?(α=0.05)解設(shè)女性員工的年病假天數(shù)的均值為μ1,男性員工的年病假天數(shù)的均值為μ2;由題意建立假設(shè)

H0:μ1≤μ2,H1:μ1>μ2;選取統(tǒng)計量對于給定的顯著性水平α=0.05,查t分布表由題意可計算得統(tǒng)計量觀察值為t=0.8696

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論