概率論與數(shù)理統(tǒng)計 第7章 假設檢驗課件_第1頁
概率論與數(shù)理統(tǒng)計 第7章 假設檢驗課件_第2頁
概率論與數(shù)理統(tǒng)計 第7章 假設檢驗課件_第3頁
概率論與數(shù)理統(tǒng)計 第7章 假設檢驗課件_第4頁
概率論與數(shù)理統(tǒng)計 第7章 假設檢驗課件_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第七章假設檢驗第七章假設檢驗假設檢驗的一般理論正態(tài)總體均值與方差的假設檢驗分布擬合檢驗置信區(qū)間與假設檢驗之間的關系有許多實際問題,需要通過部分信息量,對某種看法進行判定或估計.

例7.1

某企業(yè)生產(chǎn)一種零件,以往的資料顯示零件平均長度為4cm,標準差為0.1cm.工藝改革后,抽查100個零件發(fā)現(xiàn)其平均長度為3.94cm.問:工藝改革后零件長度是否發(fā)生了顯著變化?假設檢驗問題的提出在本節(jié)中,我們將討論不同于參數(shù)估計的另一類重要的統(tǒng)計推斷問題.這就是根據(jù)樣本的信息檢驗關于總體的某個假設是否正確.

這類問題稱作假設檢驗問題.所謂假設檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定是否接受或否定原假設.假設檢驗參數(shù)假設檢驗總體分布已知,檢驗關于未知參數(shù)的某個假設非參數(shù)假設檢驗總體分布未知時的假設檢驗問題把每一罐都打開倒入量杯,看看容量是否合于標準.這樣做顯然不行!生產(chǎn)流水線上罐裝可樂不斷地封裝,然后裝箱外運.怎么知道這批罐裝可樂的容量是否合格呢?例7.3

罐裝可樂的容量按標準應在350毫升和360毫升之間.7.1假設檢驗的一般理論

如每隔1小時,抽查5罐,得5個容量的值x1,…,x5,根據(jù)這些值來判斷生產(chǎn)是否正常.每隔一定時間,抽查若干罐.如發(fā)現(xiàn)不正常,就應停產(chǎn),找出原因,排除故障,然后再生產(chǎn);如沒有問題,就繼續(xù)按規(guī)定時間再抽樣,以此監(jiān)督生產(chǎn),保證質(zhì)量.通常的辦法是進行抽樣檢查.在正常生產(chǎn)條件下,由于種種隨機因素的影響,每罐可樂的容量應在355毫升上下波動.這些因素中沒有哪一個占有特殊重要的地位.因此,根據(jù)中心極限定理,假定每罐容量服從正態(tài)分布是合理的.罐裝可樂的容量按標準應在350毫升和360毫升之間.那么,如何判斷原假設H0是否成立呢?較大、較小是一個相對的概念,合理的界限在何處?應由什么原則來確定?由于是正態(tài)分布的期望值,它的估計量是樣本均值,因此可以根據(jù)與的差距來判斷H0

是否成立.較小時,可以認為H0是成立的;當生產(chǎn)已不正常.當較大時,應認為H0不成立,即然而,這種隨機性的波動是有一定限度的,如果差異超過了這個限度,則我們就不能用抽樣的隨機性來解釋了.必須認為這個差異反映了事物的本質(zhì)差別,即反映了生產(chǎn)已不正常.這種差異稱作“系統(tǒng)誤差”.問題是,根據(jù)所觀察到的差異,如何判斷它究竟是由于偶然性在起作用,還是生產(chǎn)確實不正常?即差異是“抽樣誤差”還是“系統(tǒng)誤差”所引起的?這里需要給出一個量的界限.問題是:如何給出這個量的界限?這里用到人們在實踐中普遍采用的一個原則:小概率事件在一次試驗中基本上不會發(fā)生.小概率事件在一次試驗中基本上不會發(fā)生.下面我們用一例說明這個原則.這里有兩個盒子,各裝有100個球.99個白球一個紅球…99個…99個99個紅球一個白球現(xiàn)從兩盒中隨機取出一個盒子,問這個盒子里是白球99個還是紅球99個?小概率事件在一次試驗中基本上不會發(fā)生.現(xiàn)在我們從中隨機摸出一個球,發(fā)現(xiàn)是此時你如何判斷這個假設是否成立呢?小概率事件在一次試驗中基本上不會發(fā)生.我們不妨先假設:這個盒子里有99個白球.…99個概率反證法它不同于一般的反證法概率反證法的邏輯是:如果小概率事件在一次試驗中居然發(fā)生,我們就以很大的把握否定原假設.一般的反證法要求在原假設成立的條件下導出的結論是絕對成立的,如果事實與之矛盾,則完全絕對地否定原假設.現(xiàn)在回到我們前面罐裝可樂的例中:在提出原假設H0后,如何作出接受和拒絕H0的結論呢?在假設檢驗中,我們稱這個小概率為顯著性水平,用表示.的選擇要根據(jù)實際情況而定.常取提出假設選檢驗統(tǒng)計量~N(0,1)H0:=355H1:≠355由于已知,它能衡量差異大小且分布已知.對給定的顯著性水平

,可以在N(0,1)表中查到分位點的值,使故我們可以取拒絕域為:也就是說,“”是一個小概率事件.C:如果由樣本值算得該統(tǒng)計量的實測值落入?yún)^(qū)域C,則拒絕H0;否則,不能拒絕H0.如果顯著性水平

取得很小,則拒絕域也會比較小.其產(chǎn)生的后果是:H0難于被拒絕.如果在很小的情況下H0仍被拒絕了,則說明實際情況很可能與之有顯著差異.基于這個理由,人們常把時拒絕H0稱為是顯著的,而把在時拒絕H0稱為是高度顯著的.例7.4某工廠生產(chǎn)的一種螺釘,標準要求長度是32.5毫米.實際生產(chǎn)的產(chǎn)品,其長度X假定服從正態(tài)分布未知,現(xiàn)從該廠生產(chǎn)的一批產(chǎn)品中抽取6件,得尺寸數(shù)據(jù)如下:32.56,29.66,31.64,30.00,31.87,31.03問這批產(chǎn)品是否合格?…下面,我們結合另一個例子,進一步說明假設檢驗的一般步驟.即

是一個小概率事件.

第三步:對給定的顯著性水平,查表確定臨界值,使得否定域(拒絕域)C:|t|>4.0322故不能拒絕H0.第四步:將樣本值代入,算出統(tǒng)計量t的實測值|t|=2.997<4.0322沒有落入拒絕域假設檢驗會不會犯錯誤呢?由于作出結論的依據(jù)是小概率原理:小概率事件在一次試驗中基本上不會發(fā)生.不是一定不發(fā)生如果H0成立,但統(tǒng)計量的實測值落入否定域,從而作出否定H0的結論,那就犯了“以真為假”的錯誤.如果H0不成立,但統(tǒng)計量的實測值未落入否定域,從而沒有作出否定H0的結論,即接受了錯誤的H0,那就犯了“以假為真”的錯誤.假設檢驗的兩類錯誤H0為真實際情況決定拒絕H0接受H0H0不真第一類錯誤正確正確第二類錯誤兩類錯誤是互相關聯(lián)的,當樣本容量固定時,一類錯誤概率的減少導致另一類錯誤概率的增加.要同時降低兩類錯誤的概率,或者要在不變的條件下降低,或者需要增加樣本容量.犯兩類錯誤的概率顯著性水平為犯第一類錯誤的概率.P{拒絕H0|H0為真}=,P{接受H0|H0不真}=.例:某廠生產(chǎn)的螺釘,標準強度為68克/mm2,而實際生產(chǎn)的螺釘強度X服從

,若

,則認為這批螺釘符合要求,

否則認為不符合要求.為此提出如下假設:現(xiàn)從該廠生產(chǎn)的螺釘中抽取容量為36的樣本,其樣本均值為,問原假設是否正確?若原假設正確,則拒絕域為落入接受域,則接受原假設.犯第一類錯誤的概率=P(拒絕H0|H0為真)若H0為真,則

所以,拒絕H0的概率為,又稱為顯著性水平,越大,

犯第一類錯誤的概率越大,即越顯著.H0不真,即68,可能小于68,

也可能大于68,的大小取決于的真值的大小.設

=66,n=36,犯第二類錯誤的概率=P(接受H0|H0不真)若

=69,

n=36,取偽的概率較大./2/2H0

真H0

不真仍取=0.05,則由可以確定拒絕域為

(,67.118)與(68.882,+)因此,接受域為(67.118,68.882)現(xiàn)增大樣本容量,取n=64,=66,則命題:當樣本容量確定后,犯兩類錯誤的概率不可能同時減少.此時犯第二類錯誤的概率為證設,在水平給定下,檢驗假設又由此可見,當

n固定時1)若2)若7.2正態(tài)總體均值與方差的假設檢驗抽樣分布回顧:若(x)/2/21-0xz/2-z/2為樣本,則單個正態(tài)總體均值的假設檢驗假設設

為樣本,

為已知數(shù)(1)

(雙側)1.已知的情形(z

檢驗)2.

未知的情形(t

檢驗)(3)

(左單側)(2)

(右單側)相同點(1)平均數(shù)值在中央且等于0,以縱軸為對稱軸.(2)曲線由中央向兩側逐漸降低,兩尾部無限延伸與橫軸相靠始終不相交.(3)面積為1.

t分布與正態(tài)分布的區(qū)別不同點(1)標準正態(tài)曲線的形狀不隨n(自由度)的大小而改變.t分布曲隨著n的不同而變化,曲線不是一條,而是多條(一簇),即不同的自由度有不同的曲線.(2)n愈小,t分布曲線愈平坦,曲線中間愈低,兩側尾部翹得愈高.n愈大,t分布曲線愈接近正態(tài)分布曲線.為∞時,分布曲線與標準正態(tài)分布曲線完全重合.分布就可由標準正態(tài)分布來取代.雙邊z

檢驗設取自正態(tài)總體的一個樣本,為已知常數(shù).(1)檢驗假設分析比較集中的反映總體均值信息,所以檢驗函數(shù)從樣本均值著手考慮1.已知的情形(z

檢驗)H0成立時,可選用z統(tǒng)計量做為檢驗函數(shù)因此,應在0的周圍隨機擺動,遠離0的可能性較小,拒絕域選在兩側.(2)選用z

統(tǒng)計量(3)給定顯著性水平,查正態(tài)分布表,使即則尋找上側分位點,使確定拒絕域(4)計算樣本實測值值,判斷其是否落入拒絕域.若,即,拒絕原假設.否則接受原假設.解:總體分布為例7.6某產(chǎn)品指標服從正態(tài)分布,均方差已知,為150小時.今在一批產(chǎn)品中隨機抽取了26個樣本,測得指標的平均值為1637小時,問在5%的顯著性水平下,能否認為這批產(chǎn)品的指標為1600小時?提出假設代入,并由樣本值計算得統(tǒng)計量u的實測值z0

=1.2578<1.96故接受原假設H0.沒有落入否定域取統(tǒng)計量否定域為C:不能否認這批產(chǎn)品的指標為1600小時.設取自正態(tài)總體的一個樣本,為已知常數(shù).單邊z

檢驗(1)檢驗假設為小概率事件查正態(tài)分布表,拒絕域確定拒絕域,分兩種情況:(2)假設檢驗(a),拒絕域(b),選統(tǒng)計量H0成立時,z0遠大于0的可能性較小,拒絕域應在右側由于z0分布未知,考慮即因此,在給定條件下,使事件所以H0成立時,對假設H0,為小概事件,拒絕域仍為C.(3)檢驗假設拒絕域(4)檢驗假設拒絕域解:提出假設:例7.7某織物強力指標X的均值公斤.改進工藝后生產(chǎn)一批織物,今從中取30件,測得公斤.假設強力指標服從正態(tài)分布且已知公斤,問在顯著性水平下,新生產(chǎn)織物比過去的織物強力是否有提高?代入,并由樣本值計算得統(tǒng)計量z的實測值z0=2.51>2.33故拒絕原假設H0.落入否定域此時可能犯第一類錯誤,犯錯誤的概率不超過0.01.取統(tǒng)計量否定域為C

:

是一小概率事件例7.8

已知某煉鐵廠的鐵水含碳量(%)在正常情況下服從正態(tài)分布N(4.55,0.112),今測得5爐鐵水含碳量如下:4.28,4.40,4.42,4.35,4.37.若標準差不變,鐵水的含碳量是否有明顯的降低?(

)

解此為方差

時的左邊單側檢驗,由題設知n=5,

,又由樣本觀察值計算出其假設為所以拒絕H0接受H1,即認為鐵水的含碳量有顯著下降.設取自正態(tài)總體的一個樣本,為未知數(shù).雙邊t檢驗(1)檢驗假設(2)構造t統(tǒng)計量

2.

2

未知的情形(t

檢驗)其中(3)給定顯著性水平,確定拒絕域由查t-分布表,自由度取n-1,確定分位點拒絕域單邊t檢驗(1)檢驗假設拒絕域(2)檢驗假設拒絕域(3)檢驗假設拒絕域(4)檢驗假設拒絕域例7.9

假設糧食產(chǎn)量服從正態(tài)分布.某縣在秋收時隨機抽查了20個村的產(chǎn)量(單位:kg),平均產(chǎn)量為981kg,

=50kg,問該縣已達到噸糧縣的結論是否成立?(

)

解本題是

未知的左邊單側檢驗由于

未知,用t檢驗.由題設n=20,=50,則所以接受H0,認為該縣已經(jīng)達到了噸糧縣的標準.若取

=0.06,由于t0<-t0.06(19)=-1.6280,則應當拒絕H0,認為該縣尚未達到噸糧縣的標準.

雙正態(tài)總體均值的假設檢驗欲檢驗假設:設1.

已知時的z檢驗2.

但未知時的t檢驗(3)左邊單側檢驗

(1)雙側檢驗(2)右邊單側檢驗(1)檢驗假設(2)構造z

統(tǒng)計量設和分別為取自正態(tài)總體和的樣本,在方差

已知的條件下1.

已知時的z

檢驗查正態(tài)分布表,拒絕域

(3)給定顯著性水平,確定拒絕域(4)求樣本觀測值的z值,判斷與否.(1)檢驗假設(2)構造t統(tǒng)計量2.

但未知時的t檢驗設和分別為取自正態(tài)總體和的樣本,在方差的條件下其中特別時,可以推廣至檢驗此時將t統(tǒng)計量分子換成查t-分布表拒絕域

(3)給定顯著性水平,確定拒絕域(4)求樣本觀測值的t-值,判斷與否.例7.10

為比較兩種農(nóng)藥殘留時間的長短,現(xiàn)分別取12塊地施甲種農(nóng)藥,10塊地施乙種農(nóng)藥,經(jīng)一段時間后,分別測得結果為:假設兩藥的殘留時間均服從正態(tài)分布且方差相等,試問兩種農(nóng)藥的殘留時間有無顯著差異?(

)解此為

但未知時,兩個正態(tài)總體均值差的t檢驗.

所以在顯著性水平=0.05下接受H0,認為兩種農(nóng)藥的殘留時間無顯著差異.若=0.052,拒絕H0

.單個正態(tài)總體方差假設檢驗檢驗假設設1.已知時,2的2檢驗2.未知時,2的2檢驗(1)雙側檢驗(2)右邊單側檢驗(3)左邊單側檢驗(1)檢驗假設設取自正態(tài)總體的一個樣本,為已知常數(shù)雙邊2檢驗

1.已知時,2的2檢驗比較集中的反映了的信息(2)選取統(tǒng)計量做為檢驗函數(shù)H0成立時,因此,遠離n的可能性較小拒絕域選在兩側.

(3)給定顯著性水平,確定拒絕域,使拒絕域為了計算方便,取查-分布表知,上側分位點使分位點使單邊2檢驗(1)檢驗假設拒絕域(2)檢驗假設拒絕域(1)檢驗假設拒絕域選統(tǒng)計量H0成立時,

遠大于n的可能性較小,拒絕域應在右側由于

分布未知,考慮即因此,在給定條件下,使事件所以H0成立時,對假設H0,為小概事件,拒絕域仍為C.(1)檢驗假設(2)構造統(tǒng)計量設取自正態(tài)總體的一個樣本,未知.雙邊2檢驗2.未知時,2的2檢驗

(3)給定顯著性水平,確定拒絕域,使拒絕域查-分布表知,上側分位點使分位點使為了計算方便,取單邊2檢驗(1)檢驗假設拒絕域(2)檢驗假設拒絕域

例11

已知某種棉花的纖度服從N(,0.0482),現(xiàn)從中任取8個樣品,測得纖度為1.36,1.40,1.38,1.32,1.42,1.36,1.44,1.32.問棉花纖度的方差與已知纖度的方差是否相同?(=0.10)解這是未知情況下,對總體方差的雙側檢驗.由于

,

且由樣本觀察值計算得對=0.10,查

2

分布表得由于所以接受H0,認為棉花纖度的方差與0.0482無顯著不同.

例12

在進行工藝改革時,一般若方差顯著增大,可作相反方向的改革以減小方差.若方差變化不顯著,可試行別的改革方案.今進行某項工藝改革,加工23個活塞,測量其直徑,,設改革前活塞直徑方差為0.0004,問進一步改革的方向應如何(假設改革前后活塞直徑服從正態(tài)分布,=0.10)解這是未知情況下,對總體方差的單側檢驗.對=0.05,查

2

分布表得由于所以拒絕H0,認為改革后的直徑方差大于改革前,下一步改革朝相反方向進行.選擇統(tǒng)計量兩個正態(tài)總體方差檢驗假設且它們相互獨立設1.1,2已知時方差齊性的F檢驗2.1,2未知時方差齊性的F檢驗(1)雙側檢驗(2)右邊單側檢驗(3)左邊單側檢驗(1)檢驗假設

(2)構造F統(tǒng)計量設和分別為取自正態(tài)總體和的樣本,在均值

已知的條件下1.1,2已知時方差齊性的F檢驗(3)給定顯著性水平,確定拒絕域注意:(1)檢驗假設(2)構造F統(tǒng)計量2.1,2未知時方差齊性的F檢驗設和分別為取自正態(tài)總體和的樣本,在方差

未知的條件下

(3)給定顯著性水平,確定拒絕域例12為比較兩臺自動機床的精度,分別取容量為10和8的兩個樣本,測量某個指標的尺寸(假定服從正態(tài)分布),得到下列結果:在時,問這兩臺機床是否有同樣的精度?車床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42車床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38

解:設兩臺自動機床的方差分別為在下檢驗假設:取統(tǒng)計量否定域為C:或由樣本值可計算得F的實測值為:F0=1.51查表得由于0.304<1.51<3.68,故接受H0.這時可能犯第二類錯誤.若含氮量都服從正態(tài)分布,問其含氮量是否相同?(=0.05)解此題是兩正態(tài)總體方差未知,亦不知是否齊性的情況下對兩總體均值差的檢驗.須先作方差齊性檢驗,再用t

檢驗.例13

甲乙兩種氮肥,其含氮量的抽樣數(shù)據(jù)分別為:(1)假設所以接受H0,即認為方差是齊性的.

已得到方差齊性的結論,已經(jīng)滿足t檢驗的條件.進而檢驗

所以接受H0,認為兩種氮肥的含氮量基本相同(無顯著差異).

統(tǒng)計量成對數(shù)據(jù)假設檢驗

前面討論的用于兩個正態(tài)總體均值的比較檢驗中,我們假設了來自這兩個正態(tài)總體的樣本是相互獨立的.但是,在實際中,有時候情況不總是這樣.可能這兩個正態(tài)總體的樣本是來自同一個總體上的重復測量,它們是成對出現(xiàn)的且是相關的.例如,為了考察一種降血壓藥的效果,測試了n個高血壓病人服藥前后的血壓分別為和

.這里

是第i個病人服藥前和服藥后的血壓.它們是有關系的,不會相互獨立.另一方面,

是n個不同病人的血壓,由于各人體質(zhì)諸方面的條件不同,這n個觀測值也不能看成來自同一個正態(tài)總體的樣本.也一樣.這樣的數(shù)據(jù)稱為成對數(shù)據(jù).就消除了人的體質(zhì)諸方面的條件差異,僅剩下降血壓的效果.從而我們可以把

看成來自正態(tài)總體的樣本.其中

就是降血壓藥的平均效果.降血壓藥是否有效,就歸結為檢驗如下假設

即為來自正態(tài)總體

的隨機樣本.H0為真時,檢驗函數(shù)為拒絕域為令例14

為了檢驗A、B兩種測定鐵礦石含鐵量的方法是否有明顯差異,現(xiàn)用這兩種方法測定了取自12個不同鐵礦的礦石標本的含鐵量(%),結果列于表.問這兩種測定方法是否有顯著差異?解將方法A和方法B的測定分別記為和.由于這12個標本來自不同鐵礦,因此,不能看成來自同一個總體的樣本,也一樣.故需用成對t檢驗.拒絕域為計算實測值沒有落入拒絕域,接受原假設,認為兩種測定方法無顯著差異.假設檢驗中的大樣本方法

問題:總體不是服從正態(tài)分布,而是0-1分布,怎么樣對0-1分布的參數(shù)p進行假設檢驗?當樣本容量n足夠大時,總體X~B(1,p),p為未知參數(shù),為事件成功的頻數(shù),檢驗H0為真時,檢驗函數(shù)為拒絕域為(x)/2/21-0xz/2-z/2一般說來,按照檢驗所用的統(tǒng)計量的分布,分為F檢驗用F分布z檢驗用正態(tài)分布t檢驗用t分布檢驗用分布在大樣本的條件下,若能求得檢驗統(tǒng)計量的極限分布,依據(jù)它去決定臨界值C.按照對立假設的提法,分為單側檢驗,它的拒絕域取在左側或右側.雙側檢驗,它的拒絕域取在兩側;

1.據(jù)往年統(tǒng)計,某杏園中株產(chǎn)杏服從N(54,0.752),2010年整枝施肥后,收獲時任取10株單收,算得平均株產(chǎn)量為56.22.如果方差不變,問2010年株產(chǎn)量是否有顯著提高?(=0.05)

2.某內(nèi)服藥有使病人血壓增高的副作用,已知血壓增量服從均值22的正態(tài)分布,現(xiàn)就一種新藥品,測得10名服用者的血壓增量平均值為17.9,問能否得出副作用小的結論?練習題

3.杜鵑總是把蛋生在別的鳥巢中,現(xiàn)有從兩種鳥巢中得到的蛋共24只,測量其長度.試鑒別杜鵑蛋的長度與它們被發(fā)現(xiàn)的鳥巢不同是否有關?(設兩個樣本來自同方差的正態(tài)總體)

z檢驗

t檢驗

t檢驗7.3分布擬合檢驗在前面的課程中,我們已經(jīng)了解了假設檢驗的基本思想,并討論了當總體分布為正態(tài)時,關于其中未知參數(shù)的假設檢驗問題.然而可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對總體分布提出一個假設.例如,從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個隨機變量,椐統(tǒng)計,這432年間共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下:戰(zhàn)爭次數(shù)X01234

22314248154

發(fā)生X次戰(zhàn)爭的年數(shù)在概率論中,大家對泊松分布產(chǎn)生的一般條件已有所了解,容易想到,每年爆發(fā)戰(zhàn)爭的次數(shù),可以用一個泊松隨機變量來近似描述.也就是說,我們可以假設每年爆發(fā)戰(zhàn)爭次數(shù)分布X近似泊松分布.上面的數(shù)據(jù)能否證實X具有泊松分布的假設是正確的?現(xiàn)在的問題是:又如,某鐘表廠對生產(chǎn)的鐘進行精確性檢查,抽取100個鐘作試驗,撥準后隔24小時以后進行檢查,將每個鐘的誤差(快或慢)按秒記錄下來.問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?再如,某工廠制造一批骰子,聲稱它是均勻的.為檢驗骰子是否均勻,要把骰子實地投擲若干次,統(tǒng)計各點出現(xiàn)的頻率與1/6的差距.也就是說,在投擲中,出現(xiàn)1點,2點,…,6點的概率都應是1/6.得到的數(shù)據(jù)能否說明“骰子均勻”的假設是可信的?問題是:K.皮爾遜這是一項很重要的工作,不少人把它視為近代統(tǒng)計學的開端.解決這類問題的工具是英國統(tǒng)計學家K.皮爾遜在1900年發(fā)表的一篇文章中引進的所謂

檢驗法.

檢驗法是在總體X的分布未知時,根據(jù)來自總體的樣本,檢驗關于總體分布的假設的一種檢驗方法.

H0:總體X的分布函數(shù)為F(x)

然后根據(jù)樣本的經(jīng)驗分布和所假設的理論分布之間的吻合程度來決定是否接受原假設.使用

對總體分布進行檢驗時,我們先提出原假設:檢驗法這種檢驗通常稱作擬合優(yōu)度檢驗,它是一種非參數(shù)檢驗.在用

檢驗法檢驗假設H0時,若在H0下分布類型已知,但其參數(shù)未知,這時需要先用極大似然估計法估計參數(shù),然后作檢驗.分布擬合的

檢驗法的基本原理和步驟如下:3.根據(jù)所假設的理論分布,可以算出總體X

的值落入每個Ai的概率pi,于是npi就是落入Ai的樣本值的理論頻數(shù).1.將總體X的取值范圍分成k個互不重迭的小區(qū)間,記作A1,A2,…,Ak.2.把落入第i個小區(qū)間Ai的樣本值的個數(shù)記

作fi,稱為實測頻數(shù).所有實測頻數(shù)之和

f1+f2+…+fk等于樣本容量n.標志著經(jīng)驗分布與理論分布之間的差異的大小.皮爾遜引進如下統(tǒng)計量表示經(jīng)驗分布與理論分布之間的差異:統(tǒng)計量的分布是什么?在理論分布已知的條件下,npi是常量實測頻數(shù)理論頻數(shù)皮爾遜證明了如下定理:若原假設中的理論分布F(x)已經(jīng)完全給定,那么當時,統(tǒng)計量分布漸近為(k-1)個自由度的分布.如果理論分布F(x)中有r個未知參數(shù)需用相應的估計量來代替,那么當時,統(tǒng)計量分布漸近為

(k-r-1)個自由度的分布.是k個近似正態(tài)的變量的平方和.這些變量之間存在著一個制約關系:故統(tǒng)計量漸近(k-1)個自由度的分布.

在理論分布F(x)完全給定的情況下,每個pi

都是確定的常數(shù).由棣莫佛-拉普拉斯中心極限定理,當n充分大時,實測頻數(shù)fi

漸近正態(tài),因此在F(x)尚未完全給定的情況下,每個未知參數(shù)用相應的估計量代替,就相當于增加一個制約條件,因此,自由度也隨之減少一個.若有r個未知參數(shù)需用相應的估計量來代替,自由度就減少r個.此時統(tǒng)計量漸近(k-r-1)個自由度的分布.如果根據(jù)所給的樣本值X1,X2,…,Xn算得統(tǒng)計量的實測值落入拒絕域,則拒絕原假設,否則就認為差異不顯著而接受原假設.得拒絕域:(不需估計參數(shù))(估計r個參數(shù))查分布表可得臨界值,使得根據(jù)這個定理,對給定的顯著性水平,皮爾遜定理是在n無限增大時推導出來的,因而在使用時要注意n要足夠大,以及npi

不太小這兩個條件.根據(jù)計算實踐,要求n不小于50,以及npi

都不小于5.否則應適當合并區(qū)間,使npi滿足這個要求.讓我們回到開始的一個例子,檢驗每年爆發(fā)戰(zhàn)爭次數(shù)分布是否服從泊松分布.提出假設H0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論