版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第七章假設(shè)檢驗(yàn)第七章假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的一般理論正態(tài)總體均值與方差的假設(shè)檢驗(yàn)分布擬合檢驗(yàn)置信區(qū)間與假設(shè)檢驗(yàn)之間的關(guān)系有許多實(shí)際問題,需要通過部分信息量,對(duì)某種看法進(jìn)行判定或估計(jì).
例7.1
某企業(yè)生產(chǎn)一種零件,以往的資料顯示零件平均長度為4cm,標(biāo)準(zhǔn)差為0.1cm.工藝改革后,抽查100個(gè)零件發(fā)現(xiàn)其平均長度為3.94cm.問:工藝改革后零件長度是否發(fā)生了顯著變化?假設(shè)檢驗(yàn)問題的提出在本節(jié)中,我們將討論不同于參數(shù)估計(jì)的另一類重要的統(tǒng)計(jì)推斷問題.這就是根據(jù)樣本的信息檢驗(yàn)關(guān)于總體的某個(gè)假設(shè)是否正確.
這類問題稱作假設(shè)檢驗(yàn)問題.所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè).假設(shè)檢驗(yàn)參數(shù)假設(shè)檢驗(yàn)總體分布已知,檢驗(yàn)關(guān)于未知參數(shù)的某個(gè)假設(shè)非參數(shù)假設(shè)檢驗(yàn)總體分布未知時(shí)的假設(shè)檢驗(yàn)問題把每一罐都打開倒入量杯,看看容量是否合于標(biāo)準(zhǔn).這樣做顯然不行!生產(chǎn)流水線上罐裝可樂不斷地封裝,然后裝箱外運(yùn).怎么知道這批罐裝可樂的容量是否合格呢?例7.3
罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)在350毫升和360毫升之間.7.1假設(shè)檢驗(yàn)的一般理論
如每隔1小時(shí),抽查5罐,得5個(gè)容量的值x1,…,x5,根據(jù)這些值來判斷生產(chǎn)是否正常.每隔一定時(shí)間,抽查若干罐.如發(fā)現(xiàn)不正常,就應(yīng)停產(chǎn),找出原因,排除故障,然后再生產(chǎn);如沒有問題,就繼續(xù)按規(guī)定時(shí)間再抽樣,以此監(jiān)督生產(chǎn),保證質(zhì)量.通常的辦法是進(jìn)行抽樣檢查.在正常生產(chǎn)條件下,由于種種隨機(jī)因素的影響,每罐可樂的容量應(yīng)在355毫升上下波動(dòng).這些因素中沒有哪一個(gè)占有特殊重要的地位.因此,根據(jù)中心極限定理,假定每罐容量服從正態(tài)分布是合理的.罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)在350毫升和360毫升之間.那么,如何判斷原假設(shè)H0是否成立呢?較大、較小是一個(gè)相對(duì)的概念,合理的界限在何處?應(yīng)由什么原則來確定?由于是正態(tài)分布的期望值,它的估計(jì)量是樣本均值,因此可以根據(jù)與的差距來判斷H0
是否成立.較小時(shí),可以認(rèn)為H0是成立的;當(dāng)生產(chǎn)已不正常.當(dāng)較大時(shí),應(yīng)認(rèn)為H0不成立,即然而,這種隨機(jī)性的波動(dòng)是有一定限度的,如果差異超過了這個(gè)限度,則我們就不能用抽樣的隨機(jī)性來解釋了.必須認(rèn)為這個(gè)差異反映了事物的本質(zhì)差別,即反映了生產(chǎn)已不正常.這種差異稱作“系統(tǒng)誤差”.問題是,根據(jù)所觀察到的差異,如何判斷它究竟是由于偶然性在起作用,還是生產(chǎn)確實(shí)不正常?即差異是“抽樣誤差”還是“系統(tǒng)誤差”所引起的?這里需要給出一個(gè)量的界限.問題是:如何給出這個(gè)量的界限?這里用到人們在實(shí)踐中普遍采用的一個(gè)原則:小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.下面我們用一例說明這個(gè)原則.這里有兩個(gè)盒子,各裝有100個(gè)球.99個(gè)白球一個(gè)紅球…99個(gè)…99個(gè)99個(gè)紅球一個(gè)白球現(xiàn)從兩盒中隨機(jī)取出一個(gè)盒子,問這個(gè)盒子里是白球99個(gè)還是紅球99個(gè)?小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.現(xiàn)在我們從中隨機(jī)摸出一個(gè)球,發(fā)現(xiàn)是此時(shí)你如何判斷這個(gè)假設(shè)是否成立呢?小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.我們不妨先假設(shè):這個(gè)盒子里有99個(gè)白球.…99個(gè)概率反證法它不同于一般的反證法概率反證法的邏輯是:如果小概率事件在一次試驗(yàn)中居然發(fā)生,我們就以很大的把握否定原假設(shè).一般的反證法要求在原假設(shè)成立的條件下導(dǎo)出的結(jié)論是絕對(duì)成立的,如果事實(shí)與之矛盾,則完全絕對(duì)地否定原假設(shè).現(xiàn)在回到我們前面罐裝可樂的例中:在提出原假設(shè)H0后,如何作出接受和拒絕H0的結(jié)論呢?在假設(shè)檢驗(yàn)中,我們稱這個(gè)小概率為顯著性水平,用表示.的選擇要根據(jù)實(shí)際情況而定.常取提出假設(shè)選檢驗(yàn)統(tǒng)計(jì)量~N(0,1)H0:=355H1:≠355由于已知,它能衡量差異大小且分布已知.對(duì)給定的顯著性水平
,可以在N(0,1)表中查到分位點(diǎn)的值,使故我們可以取拒絕域?yàn)椋阂簿褪钦f,“”是一個(gè)小概率事件.C:如果由樣本值算得該統(tǒng)計(jì)量的實(shí)測值落入?yún)^(qū)域C,則拒絕H0;否則,不能拒絕H0.如果顯著性水平
取得很小,則拒絕域也會(huì)比較小.其產(chǎn)生的后果是:H0難于被拒絕.如果在很小的情況下H0仍被拒絕了,則說明實(shí)際情況很可能與之有顯著差異.基于這個(gè)理由,人們常把時(shí)拒絕H0稱為是顯著的,而把在時(shí)拒絕H0稱為是高度顯著的.例7.4某工廠生產(chǎn)的一種螺釘,標(biāo)準(zhǔn)要求長度是32.5毫米.實(shí)際生產(chǎn)的產(chǎn)品,其長度X假定服從正態(tài)分布未知,現(xiàn)從該廠生產(chǎn)的一批產(chǎn)品中抽取6件,得尺寸數(shù)據(jù)如下:32.56,29.66,31.64,30.00,31.87,31.03問這批產(chǎn)品是否合格?…下面,我們結(jié)合另一個(gè)例子,進(jìn)一步說明假設(shè)檢驗(yàn)的一般步驟.即
是一個(gè)小概率事件.
第三步:對(duì)給定的顯著性水平,查表確定臨界值,使得否定域(拒絕域)C:|t|>4.0322故不能拒絕H0.第四步:將樣本值代入,算出統(tǒng)計(jì)量t的實(shí)測值|t|=2.997<4.0322沒有落入拒絕域假設(shè)檢驗(yàn)會(huì)不會(huì)犯錯(cuò)誤呢?由于作出結(jié)論的依據(jù)是小概率原理:小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.不是一定不發(fā)生如果H0成立,但統(tǒng)計(jì)量的實(shí)測值落入否定域,從而作出否定H0的結(jié)論,那就犯了“以真為假”的錯(cuò)誤.如果H0不成立,但統(tǒng)計(jì)量的實(shí)測值未落入否定域,從而沒有作出否定H0的結(jié)論,即接受了錯(cuò)誤的H0,那就犯了“以假為真”的錯(cuò)誤.假設(shè)檢驗(yàn)的兩類錯(cuò)誤H0為真實(shí)際情況決定拒絕H0接受H0H0不真第一類錯(cuò)誤正確正確第二類錯(cuò)誤兩類錯(cuò)誤是互相關(guān)聯(lián)的,當(dāng)樣本容量固定時(shí),一類錯(cuò)誤概率的減少導(dǎo)致另一類錯(cuò)誤概率的增加.要同時(shí)降低兩類錯(cuò)誤的概率,或者要在不變的條件下降低,或者需要增加樣本容量.犯兩類錯(cuò)誤的概率顯著性水平為犯第一類錯(cuò)誤的概率.P{拒絕H0|H0為真}=,P{接受H0|H0不真}=.例:某廠生產(chǎn)的螺釘,標(biāo)準(zhǔn)強(qiáng)度為68克/mm2,而實(shí)際生產(chǎn)的螺釘強(qiáng)度X服從
,若
,則認(rèn)為這批螺釘符合要求,
否則認(rèn)為不符合要求.為此提出如下假設(shè):現(xiàn)從該廠生產(chǎn)的螺釘中抽取容量為36的樣本,其樣本均值為,問原假設(shè)是否正確?若原假設(shè)正確,則拒絕域?yàn)槁淙虢邮苡?則接受原假設(shè).犯第一類錯(cuò)誤的概率=P(拒絕H0|H0為真)若H0為真,則
所以,拒絕H0的概率為,又稱為顯著性水平,越大,
犯第一類錯(cuò)誤的概率越大,即越顯著.H0不真,即68,可能小于68,
也可能大于68,的大小取決于的真值的大小.設(shè)
=66,n=36,犯第二類錯(cuò)誤的概率=P(接受H0|H0不真)若
=69,
n=36,取偽的概率較大./2/2H0
真H0
不真仍取=0.05,則由可以確定拒絕域?yàn)?/p>
(,67.118)與(68.882,+)因此,接受域?yàn)?67.118,68.882)現(xiàn)增大樣本容量,取n=64,=66,則命題:當(dāng)樣本容量確定后,犯兩類錯(cuò)誤的概率不可能同時(shí)減少.此時(shí)犯第二類錯(cuò)誤的概率為證設(shè),在水平給定下,檢驗(yàn)假設(shè)又由此可見,當(dāng)
n固定時(shí)1)若2)若7.2正態(tài)總體均值與方差的假設(shè)檢驗(yàn)抽樣分布回顧:若(x)/2/21-0xz/2-z/2為樣本,則單個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)假設(shè)設(shè)
為樣本,
為已知數(shù)(1)
(雙側(cè))1.已知的情形(z
檢驗(yàn))2.
未知的情形(t
檢驗(yàn))(3)
(左單側(cè))(2)
(右單側(cè))相同點(diǎn)(1)平均數(shù)值在中央且等于0,以縱軸為對(duì)稱軸.(2)曲線由中央向兩側(cè)逐漸降低,兩尾部無限延伸與橫軸相靠始終不相交.(3)面積為1.
t分布與正態(tài)分布的區(qū)別不同點(diǎn)(1)標(biāo)準(zhǔn)正態(tài)曲線的形狀不隨n(自由度)的大小而改變.t分布曲隨著n的不同而變化,曲線不是一條,而是多條(一簇),即不同的自由度有不同的曲線.(2)n愈小,t分布曲線愈平坦,曲線中間愈低,兩側(cè)尾部翹得愈高.n愈大,t分布曲線愈接近正態(tài)分布曲線.為∞時(shí),分布曲線與標(biāo)準(zhǔn)正態(tài)分布曲線完全重合.分布就可由標(biāo)準(zhǔn)正態(tài)分布來取代.雙邊z
檢驗(yàn)設(shè)取自正態(tài)總體的一個(gè)樣本,為已知常數(shù).(1)檢驗(yàn)假設(shè)分析比較集中的反映總體均值信息,所以檢驗(yàn)函數(shù)從樣本均值著手考慮1.已知的情形(z
檢驗(yàn))H0成立時(shí),可選用z統(tǒng)計(jì)量做為檢驗(yàn)函數(shù)因此,應(yīng)在0的周圍隨機(jī)擺動(dòng),遠(yuǎn)離0的可能性較小,拒絕域選在兩側(cè).(2)選用z
統(tǒng)計(jì)量(3)給定顯著性水平,查正態(tài)分布表,使即則尋找上側(cè)分位點(diǎn),使確定拒絕域(4)計(jì)算樣本實(shí)測值值,判斷其是否落入拒絕域.若,即,拒絕原假設(shè).否則接受原假設(shè).解:總體分布為例7.6某產(chǎn)品指標(biāo)服從正態(tài)分布,均方差已知,為150小時(shí).今在一批產(chǎn)品中隨機(jī)抽取了26個(gè)樣本,測得指標(biāo)的平均值為1637小時(shí),問在5%的顯著性水平下,能否認(rèn)為這批產(chǎn)品的指標(biāo)為1600小時(shí)?提出假設(shè)代入,并由樣本值計(jì)算得統(tǒng)計(jì)量u的實(shí)測值z0
=1.2578<1.96故接受原假設(shè)H0.沒有落入否定域取統(tǒng)計(jì)量否定域?yàn)镃:不能否認(rèn)這批產(chǎn)品的指標(biāo)為1600小時(shí).設(shè)取自正態(tài)總體的一個(gè)樣本,為已知常數(shù).單邊z
檢驗(yàn)(1)檢驗(yàn)假設(shè)為小概率事件查正態(tài)分布表,拒絕域確定拒絕域,分兩種情況:(2)假設(shè)檢驗(yàn)(a),拒絕域(b),選統(tǒng)計(jì)量H0成立時(shí),z0遠(yuǎn)大于0的可能性較小,拒絕域應(yīng)在右側(cè)由于z0分布未知,考慮即因此,在給定條件下,使事件所以H0成立時(shí),對(duì)假設(shè)H0,為小概事件,拒絕域仍為C.(3)檢驗(yàn)假設(shè)拒絕域(4)檢驗(yàn)假設(shè)拒絕域解:提出假設(shè):例7.7某織物強(qiáng)力指標(biāo)X的均值公斤.改進(jìn)工藝后生產(chǎn)一批織物,今從中取30件,測得公斤.假設(shè)強(qiáng)力指標(biāo)服從正態(tài)分布且已知公斤,問在顯著性水平下,新生產(chǎn)織物比過去的織物強(qiáng)力是否有提高?代入,并由樣本值計(jì)算得統(tǒng)計(jì)量z的實(shí)測值z0=2.51>2.33故拒絕原假設(shè)H0.落入否定域此時(shí)可能犯第一類錯(cuò)誤,犯錯(cuò)誤的概率不超過0.01.取統(tǒng)計(jì)量否定域?yàn)镃
:
是一小概率事件例7.8
已知某煉鐵廠的鐵水含碳量(%)在正常情況下服從正態(tài)分布N(4.55,0.112),今測得5爐鐵水含碳量如下:4.28,4.40,4.42,4.35,4.37.若標(biāo)準(zhǔn)差不變,鐵水的含碳量是否有明顯的降低?(
)
解此為方差
時(shí)的左邊單側(cè)檢驗(yàn),由題設(shè)知n=5,
,又由樣本觀察值計(jì)算出其假設(shè)為所以拒絕H0接受H1,即認(rèn)為鐵水的含碳量有顯著下降.設(shè)取自正態(tài)總體的一個(gè)樣本,為未知數(shù).雙邊t檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造t統(tǒng)計(jì)量
2.
2
未知的情形(t
檢驗(yàn))其中(3)給定顯著性水平,確定拒絕域由查t-分布表,自由度取n-1,確定分位點(diǎn)拒絕域單邊t檢驗(yàn)(1)檢驗(yàn)假設(shè)拒絕域(2)檢驗(yàn)假設(shè)拒絕域(3)檢驗(yàn)假設(shè)拒絕域(4)檢驗(yàn)假設(shè)拒絕域例7.9
假設(shè)糧食產(chǎn)量服從正態(tài)分布.某縣在秋收時(shí)隨機(jī)抽查了20個(gè)村的產(chǎn)量(單位:kg),平均產(chǎn)量為981kg,
=50kg,問該縣已達(dá)到噸糧縣的結(jié)論是否成立?(
)
解本題是
未知的左邊單側(cè)檢驗(yàn)由于
未知,用t檢驗(yàn).由題設(shè)n=20,=50,則所以接受H0,認(rèn)為該縣已經(jīng)達(dá)到了噸糧縣的標(biāo)準(zhǔn).若取
=0.06,由于t0<-t0.06(19)=-1.6280,則應(yīng)當(dāng)拒絕H0,認(rèn)為該縣尚未達(dá)到噸糧縣的標(biāo)準(zhǔn).
雙正態(tài)總體均值的假設(shè)檢驗(yàn)欲檢驗(yàn)假設(shè):設(shè)1.
已知時(shí)的z檢驗(yàn)2.
但未知時(shí)的t檢驗(yàn)(3)左邊單側(cè)檢驗(yàn)
(1)雙側(cè)檢驗(yàn)(2)右邊單側(cè)檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造z
統(tǒng)計(jì)量設(shè)和分別為取自正態(tài)總體和的樣本,在方差
已知的條件下1.
已知時(shí)的z
檢驗(yàn)查正態(tài)分布表,拒絕域
(3)給定顯著性水平,確定拒絕域(4)求樣本觀測值的z值,判斷與否.(1)檢驗(yàn)假設(shè)(2)構(gòu)造t統(tǒng)計(jì)量2.
但未知時(shí)的t檢驗(yàn)設(shè)和分別為取自正態(tài)總體和的樣本,在方差的條件下其中特別時(shí),可以推廣至檢驗(yàn)此時(shí)將t統(tǒng)計(jì)量分子換成查t-分布表拒絕域
(3)給定顯著性水平,確定拒絕域(4)求樣本觀測值的t-值,判斷與否.例7.10
為比較兩種農(nóng)藥殘留時(shí)間的長短,現(xiàn)分別取12塊地施甲種農(nóng)藥,10塊地施乙種農(nóng)藥,經(jīng)一段時(shí)間后,分別測得結(jié)果為:假設(shè)兩藥的殘留時(shí)間均服從正態(tài)分布且方差相等,試問兩種農(nóng)藥的殘留時(shí)間有無顯著差異?(
)解此為
但未知時(shí),兩個(gè)正態(tài)總體均值差的t檢驗(yàn).
所以在顯著性水平=0.05下接受H0,認(rèn)為兩種農(nóng)藥的殘留時(shí)間無顯著差異.若=0.052,拒絕H0
.單個(gè)正態(tài)總體方差假設(shè)檢驗(yàn)檢驗(yàn)假設(shè)設(shè)1.已知時(shí),2的2檢驗(yàn)2.未知時(shí),2的2檢驗(yàn)(1)雙側(cè)檢驗(yàn)(2)右邊單側(cè)檢驗(yàn)(3)左邊單側(cè)檢驗(yàn)(1)檢驗(yàn)假設(shè)設(shè)取自正態(tài)總體的一個(gè)樣本,為已知常數(shù)雙邊2檢驗(yàn)
1.已知時(shí),2的2檢驗(yàn)比較集中的反映了的信息(2)選取統(tǒng)計(jì)量做為檢驗(yàn)函數(shù)H0成立時(shí),因此,遠(yuǎn)離n的可能性較小拒絕域選在兩側(cè).
(3)給定顯著性水平,確定拒絕域,使拒絕域?yàn)榱擞?jì)算方便,取查-分布表知,上側(cè)分位點(diǎn)使分位點(diǎn)使單邊2檢驗(yàn)(1)檢驗(yàn)假設(shè)拒絕域(2)檢驗(yàn)假設(shè)拒絕域(1)檢驗(yàn)假設(shè)拒絕域選統(tǒng)計(jì)量H0成立時(shí),
遠(yuǎn)大于n的可能性較小,拒絕域應(yīng)在右側(cè)由于
分布未知,考慮即因此,在給定條件下,使事件所以H0成立時(shí),對(duì)假設(shè)H0,為小概事件,拒絕域仍為C.(1)檢驗(yàn)假設(shè)(2)構(gòu)造統(tǒng)計(jì)量設(shè)取自正態(tài)總體的一個(gè)樣本,未知.雙邊2檢驗(yàn)2.未知時(shí),2的2檢驗(yàn)
(3)給定顯著性水平,確定拒絕域,使拒絕域查-分布表知,上側(cè)分位點(diǎn)使分位點(diǎn)使為了計(jì)算方便,取單邊2檢驗(yàn)(1)檢驗(yàn)假設(shè)拒絕域(2)檢驗(yàn)假設(shè)拒絕域
例11
已知某種棉花的纖度服從N(,0.0482),現(xiàn)從中任取8個(gè)樣品,測得纖度為1.36,1.40,1.38,1.32,1.42,1.36,1.44,1.32.問棉花纖度的方差與已知纖度的方差是否相同?(=0.10)解這是未知情況下,對(duì)總體方差的雙側(cè)檢驗(yàn).由于
,
且由樣本觀察值計(jì)算得對(duì)=0.10,查
2
分布表得由于所以接受H0,認(rèn)為棉花纖度的方差與0.0482無顯著不同.
例12
在進(jìn)行工藝改革時(shí),一般若方差顯著增大,可作相反方向的改革以減小方差.若方差變化不顯著,可試行別的改革方案.今進(jìn)行某項(xiàng)工藝改革,加工23個(gè)活塞,測量其直徑,,設(shè)改革前活塞直徑方差為0.0004,問進(jìn)一步改革的方向應(yīng)如何(假設(shè)改革前后活塞直徑服從正態(tài)分布,=0.10)解這是未知情況下,對(duì)總體方差的單側(cè)檢驗(yàn).對(duì)=0.05,查
2
分布表得由于所以拒絕H0,認(rèn)為改革后的直徑方差大于改革前,下一步改革朝相反方向進(jìn)行.選擇統(tǒng)計(jì)量兩個(gè)正態(tài)總體方差檢驗(yàn)假設(shè)且它們相互獨(dú)立設(shè)1.1,2已知時(shí)方差齊性的F檢驗(yàn)2.1,2未知時(shí)方差齊性的F檢驗(yàn)(1)雙側(cè)檢驗(yàn)(2)右邊單側(cè)檢驗(yàn)(3)左邊單側(cè)檢驗(yàn)(1)檢驗(yàn)假設(shè)
(2)構(gòu)造F統(tǒng)計(jì)量設(shè)和分別為取自正態(tài)總體和的樣本,在均值
已知的條件下1.1,2已知時(shí)方差齊性的F檢驗(yàn)(3)給定顯著性水平,確定拒絕域注意:(1)檢驗(yàn)假設(shè)(2)構(gòu)造F統(tǒng)計(jì)量2.1,2未知時(shí)方差齊性的F檢驗(yàn)設(shè)和分別為取自正態(tài)總體和的樣本,在方差
未知的條件下
(3)給定顯著性水平,確定拒絕域例12為比較兩臺(tái)自動(dòng)機(jī)床的精度,分別取容量為10和8的兩個(gè)樣本,測量某個(gè)指標(biāo)的尺寸(假定服從正態(tài)分布),得到下列結(jié)果:在時(shí),問這兩臺(tái)機(jī)床是否有同樣的精度?車床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42車床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38
解:設(shè)兩臺(tái)自動(dòng)機(jī)床的方差分別為在下檢驗(yàn)假設(shè):取統(tǒng)計(jì)量否定域?yàn)镃:或由樣本值可計(jì)算得F的實(shí)測值為:F0=1.51查表得由于0.304<1.51<3.68,故接受H0.這時(shí)可能犯第二類錯(cuò)誤.若含氮量都服從正態(tài)分布,問其含氮量是否相同?(=0.05)解此題是兩正態(tài)總體方差未知,亦不知是否齊性的情況下對(duì)兩總體均值差的檢驗(yàn).須先作方差齊性檢驗(yàn),再用t
檢驗(yàn).例13
甲乙兩種氮肥,其含氮量的抽樣數(shù)據(jù)分別為:(1)假設(shè)所以接受H0,即認(rèn)為方差是齊性的.
已得到方差齊性的結(jié)論,已經(jīng)滿足t檢驗(yàn)的條件.進(jìn)而檢驗(yàn)
所以接受H0,認(rèn)為兩種氮肥的含氮量基本相同(無顯著差異).
統(tǒng)計(jì)量成對(duì)數(shù)據(jù)假設(shè)檢驗(yàn)
前面討論的用于兩個(gè)正態(tài)總體均值的比較檢驗(yàn)中,我們假設(shè)了來自這兩個(gè)正態(tài)總體的樣本是相互獨(dú)立的.但是,在實(shí)際中,有時(shí)候情況不總是這樣.可能這兩個(gè)正態(tài)總體的樣本是來自同一個(gè)總體上的重復(fù)測量,它們是成對(duì)出現(xiàn)的且是相關(guān)的.例如,為了考察一種降血壓藥的效果,測試了n個(gè)高血壓病人服藥前后的血壓分別為和
.這里
是第i個(gè)病人服藥前和服藥后的血壓.它們是有關(guān)系的,不會(huì)相互獨(dú)立.另一方面,
是n個(gè)不同病人的血壓,由于各人體質(zhì)諸方面的條件不同,這n個(gè)觀測值也不能看成來自同一個(gè)正態(tài)總體的樣本.也一樣.這樣的數(shù)據(jù)稱為成對(duì)數(shù)據(jù).就消除了人的體質(zhì)諸方面的條件差異,僅剩下降血壓的效果.從而我們可以把
看成來自正態(tài)總體的樣本.其中
就是降血壓藥的平均效果.降血壓藥是否有效,就歸結(jié)為檢驗(yàn)如下假設(shè)
即為來自正態(tài)總體
的隨機(jī)樣本.H0為真時(shí),檢驗(yàn)函數(shù)為拒絕域?yàn)榱罾?4
為了檢驗(yàn)A、B兩種測定鐵礦石含鐵量的方法是否有明顯差異,現(xiàn)用這兩種方法測定了取自12個(gè)不同鐵礦的礦石標(biāo)本的含鐵量(%),結(jié)果列于表.問這兩種測定方法是否有顯著差異?解將方法A和方法B的測定分別記為和.由于這12個(gè)標(biāo)本來自不同鐵礦,因此,不能看成來自同一個(gè)總體的樣本,也一樣.故需用成對(duì)t檢驗(yàn).拒絕域?yàn)橛?jì)算實(shí)測值沒有落入拒絕域,接受原假設(shè),認(rèn)為兩種測定方法無顯著差異.假設(shè)檢驗(yàn)中的大樣本方法
問題:總體不是服從正態(tài)分布,而是0-1分布,怎么樣對(duì)0-1分布的參數(shù)p進(jìn)行假設(shè)檢驗(yàn)?當(dāng)樣本容量n足夠大時(shí),總體X~B(1,p),p為未知參數(shù),為事件成功的頻數(shù),檢驗(yàn)H0為真時(shí),檢驗(yàn)函數(shù)為拒絕域?yàn)?x)/2/21-0xz/2-z/2一般說來,按照檢驗(yàn)所用的統(tǒng)計(jì)量的分布,分為F檢驗(yàn)用F分布z檢驗(yàn)用正態(tài)分布t檢驗(yàn)用t分布檢驗(yàn)用分布在大樣本的條件下,若能求得檢驗(yàn)統(tǒng)計(jì)量的極限分布,依據(jù)它去決定臨界值C.按照對(duì)立假設(shè)的提法,分為單側(cè)檢驗(yàn),它的拒絕域取在左側(cè)或右側(cè).雙側(cè)檢驗(yàn),它的拒絕域取在兩側(cè);
1.據(jù)往年統(tǒng)計(jì),某杏園中株產(chǎn)杏服從N(54,0.752),2010年整枝施肥后,收獲時(shí)任取10株單收,算得平均株產(chǎn)量為56.22.如果方差不變,問2010年株產(chǎn)量是否有顯著提高?(=0.05)
2.某內(nèi)服藥有使病人血壓增高的副作用,已知血壓增量服從均值22的正態(tài)分布,現(xiàn)就一種新藥品,測得10名服用者的血壓增量平均值為17.9,問能否得出副作用小的結(jié)論?練習(xí)題
3.杜鵑總是把蛋生在別的鳥巢中,現(xiàn)有從兩種鳥巢中得到的蛋共24只,測量其長度.試鑒別杜鵑蛋的長度與它們被發(fā)現(xiàn)的鳥巢不同是否有關(guān)?(設(shè)兩個(gè)樣本來自同方差的正態(tài)總體)
z檢驗(yàn)
t檢驗(yàn)
t檢驗(yàn)7.3分布擬合檢驗(yàn)在前面的課程中,我們已經(jīng)了解了假設(shè)檢驗(yàn)的基本思想,并討論了當(dāng)總體分布為正態(tài)時(shí),關(guān)于其中未知參數(shù)的假設(shè)檢驗(yàn)問題.然而可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對(duì)總體分布提出一個(gè)假設(shè).例如,從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個(gè)隨機(jī)變量,椐統(tǒng)計(jì),這432年間共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下:戰(zhàn)爭次數(shù)X01234
22314248154
發(fā)生X次戰(zhàn)爭的年數(shù)在概率論中,大家對(duì)泊松分布產(chǎn)生的一般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)爭的次數(shù),可以用一個(gè)泊松隨機(jī)變量來近似描述.也就是說,我們可以假設(shè)每年爆發(fā)戰(zhàn)爭次數(shù)分布X近似泊松分布.上面的數(shù)據(jù)能否證實(shí)X具有泊松分布的假設(shè)是正確的?現(xiàn)在的問題是:又如,某鐘表廠對(duì)生產(chǎn)的鐘進(jìn)行精確性檢查,抽取100個(gè)鐘作試驗(yàn),撥準(zhǔn)后隔24小時(shí)以后進(jìn)行檢查,將每個(gè)鐘的誤差(快或慢)按秒記錄下來.問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?再如,某工廠制造一批骰子,聲稱它是均勻的.為檢驗(yàn)骰子是否均勻,要把骰子實(shí)地投擲若干次,統(tǒng)計(jì)各點(diǎn)出現(xiàn)的頻率與1/6的差距.也就是說,在投擲中,出現(xiàn)1點(diǎn),2點(diǎn),…,6點(diǎn)的概率都應(yīng)是1/6.得到的數(shù)據(jù)能否說明“骰子均勻”的假設(shè)是可信的?問題是:K.皮爾遜這是一項(xiàng)很重要的工作,不少人把它視為近代統(tǒng)計(jì)學(xué)的開端.解決這類問題的工具是英國統(tǒng)計(jì)學(xué)家K.皮爾遜在1900年發(fā)表的一篇文章中引進(jìn)的所謂
檢驗(yàn)法.
檢驗(yàn)法是在總體X的分布未知時(shí),根據(jù)來自總體的樣本,檢驗(yàn)關(guān)于總體分布的假設(shè)的一種檢驗(yàn)方法.
H0:總體X的分布函數(shù)為F(x)
然后根據(jù)樣本的經(jīng)驗(yàn)分布和所假設(shè)的理論分布之間的吻合程度來決定是否接受原假設(shè).使用
對(duì)總體分布進(jìn)行檢驗(yàn)時(shí),我們先提出原假設(shè):檢驗(yàn)法這種檢驗(yàn)通常稱作擬合優(yōu)度檢驗(yàn),它是一種非參數(shù)檢驗(yàn).在用
檢驗(yàn)法檢驗(yàn)假設(shè)H0時(shí),若在H0下分布類型已知,但其參數(shù)未知,這時(shí)需要先用極大似然估計(jì)法估計(jì)參數(shù),然后作檢驗(yàn).分布擬合的
檢驗(yàn)法的基本原理和步驟如下:3.根據(jù)所假設(shè)的理論分布,可以算出總體X
的值落入每個(gè)Ai的概率pi,于是npi就是落入Ai的樣本值的理論頻數(shù).1.將總體X的取值范圍分成k個(gè)互不重迭的小區(qū)間,記作A1,A2,…,Ak.2.把落入第i個(gè)小區(qū)間Ai的樣本值的個(gè)數(shù)記
作fi,稱為實(shí)測頻數(shù).所有實(shí)測頻數(shù)之和
f1+f2+…+fk等于樣本容量n.標(biāo)志著經(jīng)驗(yàn)分布與理論分布之間的差異的大小.皮爾遜引進(jìn)如下統(tǒng)計(jì)量表示經(jīng)驗(yàn)分布與理論分布之間的差異:統(tǒng)計(jì)量的分布是什么?在理論分布已知的條件下,npi是常量實(shí)測頻數(shù)理論頻數(shù)皮爾遜證明了如下定理:若原假設(shè)中的理論分布F(x)已經(jīng)完全給定,那么當(dāng)時(shí),統(tǒng)計(jì)量分布漸近為(k-1)個(gè)自由度的分布.如果理論分布F(x)中有r個(gè)未知參數(shù)需用相應(yīng)的估計(jì)量來代替,那么當(dāng)時(shí),統(tǒng)計(jì)量分布漸近為
(k-r-1)個(gè)自由度的分布.是k個(gè)近似正態(tài)的變量的平方和.這些變量之間存在著一個(gè)制約關(guān)系:故統(tǒng)計(jì)量漸近(k-1)個(gè)自由度的分布.
在理論分布F(x)完全給定的情況下,每個(gè)pi
都是確定的常數(shù).由棣莫佛-拉普拉斯中心極限定理,當(dāng)n充分大時(shí),實(shí)測頻數(shù)fi
漸近正態(tài),因此在F(x)尚未完全給定的情況下,每個(gè)未知參數(shù)用相應(yīng)的估計(jì)量代替,就相當(dāng)于增加一個(gè)制約條件,因此,自由度也隨之減少一個(gè).若有r個(gè)未知參數(shù)需用相應(yīng)的估計(jì)量來代替,自由度就減少r個(gè).此時(shí)統(tǒng)計(jì)量漸近(k-r-1)個(gè)自由度的分布.如果根據(jù)所給的樣本值X1,X2,…,Xn算得統(tǒng)計(jì)量的實(shí)測值落入拒絕域,則拒絕原假設(shè),否則就認(rèn)為差異不顯著而接受原假設(shè).得拒絕域:(不需估計(jì)參數(shù))(估計(jì)r個(gè)參數(shù))查分布表可得臨界值,使得根據(jù)這個(gè)定理,對(duì)給定的顯著性水平,皮爾遜定理是在n無限增大時(shí)推導(dǎo)出來的,因而在使用時(shí)要注意n要足夠大,以及npi
不太小這兩個(gè)條件.根據(jù)計(jì)算實(shí)踐,要求n不小于50,以及npi
都不小于5.否則應(yīng)適當(dāng)合并區(qū)間,使npi滿足這個(gè)要求.讓我們回到開始的一個(gè)例子,檢驗(yàn)每年爆發(fā)戰(zhàn)爭次數(shù)分布是否服從泊松分布.提出假設(shè)H0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 買賣合同模板集錦六篇
- 2024年版短期租房合同樣本
- 2024年版智能家居玻璃膠采購與供應(yīng)合同
- 大班社會(huì)教案4篇
- 公司市場部工作計(jì)劃模板
- 客服人員個(gè)人工作總結(jié)總結(jié)計(jì)劃
- 2021-2026年中國抗貧血藥鐵劑行業(yè)市場全景調(diào)研及投資規(guī)劃建議報(bào)告
- 一年級(jí)語文老師述職報(bào)告
- 2022年中職教師工作計(jì)劃個(gè)人
- 三年級(jí)上冊數(shù)學(xué)說課稿范文集錦七篇
- 汽修廠消防培訓(xùn)課件
- 智慧大棚方案
- 紀(jì)委案件工作總結(jié)
- 醫(yī)療研究小組成員及其角色劃分
- 陰道助產(chǎn)完整課件
- 宜家品牌分析報(bào)告
- 新媒體個(gè)人賬號(hào)分析報(bào)告
- 土地清查服務(wù)流程
- 農(nóng)民專業(yè)合作社章程(參考范本)
- 搶救儀器設(shè)備管理培訓(xùn)課件
- 幼兒園大班上學(xué)期社會(huì)教案《今天我當(dāng)家》及教學(xué)反思
評(píng)論
0/150
提交評(píng)論