版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第六章 假設(shè)檢驗(yàn)與方差分析第一節(jié) 假設(shè)檢驗(yàn)的基本原理 第二節(jié) 總體均值的假設(shè)檢驗(yàn) 第三節(jié) 總體比例的假設(shè)檢驗(yàn) 第四節(jié) 單因子方差分析第五節(jié) 雙因子方差分析第六節(jié) Excel在假設(shè)檢驗(yàn)與方差 分析中的應(yīng)用2掌握要點(diǎn)假設(shè)檢驗(yàn)的基本原理和步驟,以及相關(guān)概念Z統(tǒng)計(jì)量、t統(tǒng)計(jì)量、F統(tǒng)計(jì)量的計(jì)算和應(yīng)用方差分析的基本概念針對(duì)單因素、雙因素的方差分析構(gòu)造F統(tǒng)計(jì)量3第一節(jié) 假設(shè)檢驗(yàn)的基本原理一 什么是假設(shè)檢驗(yàn)二 原假設(shè)與備擇假設(shè)三 檢驗(yàn)統(tǒng)計(jì)量四 顯著性水平、P-值與臨界值五 雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)六 假設(shè)檢驗(yàn)的兩類錯(cuò)誤七 關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解4顯著性檢驗(yàn)的基本思想用小概率原理解釋小概率原理認(rèn)為,小概率事件在一次試
2、驗(yàn)中是幾乎不可能發(fā)生的。如果對(duì)總體的某個(gè)假設(shè)是真實(shí)的,而在這樣的總體中事件A發(fā)生的概率非常小,那么,就可認(rèn)為在一次試驗(yàn)中,事件A是不會(huì)發(fā)生的。如果在一次試驗(yàn)中事件A事實(shí)上發(fā)生了。那就只能認(rèn)為事件A不是來(lái)自之前假設(shè)的總體,也就是說(shuō),之前對(duì)總體所做的假設(shè)不正確。5一、什么是假設(shè)檢驗(yàn)例6-1:假定咖啡的分袋包裝生產(chǎn)線的裝袋重量服從正態(tài)分布N(,2)。生產(chǎn)線按每袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?,F(xiàn)從生產(chǎn)線抽取簡(jiǎn)單隨機(jī)樣本n=100袋,測(cè)得其平均重量為 =149.8克,樣本標(biāo)準(zhǔn)差S=0.872克。問(wèn)該生產(chǎn)線的裝袋凈重的期望值是否為150克(即問(wèn)生產(chǎn)線是否處于控制狀態(tài))?6所謂假設(shè)檢驗(yàn),就是事先對(duì)總體的參
3、數(shù)或總體分布形式做出一個(gè)假設(shè),然后利用抽取的樣本信息來(lái)判斷這個(gè)假設(shè)(原假設(shè))是否合理,即判斷總體的真實(shí)情況與原假設(shè)是否存在顯著的系統(tǒng)性差異,所以假設(shè)檢驗(yàn)又被稱為顯著性檢驗(yàn)。7一個(gè)完整的假設(shè)檢驗(yàn)過(guò)程,包括以下幾個(gè)步驟:(1)提出假設(shè);(2)構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本計(jì) 算統(tǒng)計(jì)量的具體數(shù)值;(3)規(guī)定顯著性水平,建立檢驗(yàn)規(guī)則;(4)做出判斷。8二、原假設(shè)與備擇假設(shè)原假設(shè)一般用H0表示,通常是設(shè)定總體參數(shù)等于某值,或服從某個(gè)分布函數(shù)等;備擇假設(shè)是與原假設(shè)互相排斥的假設(shè),原假設(shè)與備擇假設(shè)不可能同時(shí)成立。所謂假設(shè)檢驗(yàn)問(wèn)題實(shí)質(zhì)上就是要判斷H0是否正確,若拒絕原假設(shè)H0 ,則意味著接受備擇假設(shè)H1 。
4、 9注意:原假設(shè)和備擇假設(shè)合在一起,應(yīng)涵蓋所研究的總體特征的所有可能性。原假設(shè)是指觀察到的差異只反映機(jī)會(huì)變異備擇假設(shè)是指觀察到的差異是真實(shí)的。10如在例6-1中,我們可以提出兩個(gè)假設(shè):假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)沒(méi)有顯著差異,記為H0: = 150;假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)有顯著差異,記為H1: 150。11注意:一般而言,凡有關(guān)總體參數(shù)的顯著性檢驗(yàn),都應(yīng)把總體參數(shù)等于某定值作為原假設(shè),這樣便于在原假設(shè)成立的假設(shè)下討論檢驗(yàn)統(tǒng)計(jì)量的分布。12實(shí)際上,原假設(shè)和備擇假設(shè)的設(shè)置方法還同我們?nèi)绾吾槍?duì)總體的不同狀態(tài)采取行動(dòng)有關(guān)。13三、檢驗(yàn)統(tǒng)計(jì)量所謂檢驗(yàn)統(tǒng)計(jì)量,就是根據(jù)所抽取的樣本計(jì)算
5、的用于檢驗(yàn)原假設(shè)是否成立的隨機(jī)變量。檢驗(yàn)統(tǒng)計(jì)量中應(yīng)當(dāng)含有所要檢驗(yàn)的總體參數(shù),以便在“總體參數(shù)等于某數(shù)值”的假定下研究樣本統(tǒng)計(jì)量的觀測(cè)結(jié)果。14檢驗(yàn)統(tǒng)計(jì)量還應(yīng)該在“H0成立”的前提下有已知的分布,從而便于計(jì)算出現(xiàn)某種特定的觀測(cè)結(jié)果的概率。15例6-2 構(gòu)造例6-1的檢驗(yàn)統(tǒng)計(jì)量,并計(jì)算相應(yīng)的樣本觀測(cè)值。 1617 18四、顯著性水平、P-值與臨界值小概率事件:在單獨(dú)一次的試驗(yàn)中基本上不會(huì)發(fā)生,可以不予考慮。在假設(shè)檢驗(yàn)中,我們做出判斷時(shí)所依據(jù)的邏輯是:如果在原假設(shè)正確的前提下,檢驗(yàn)統(tǒng)計(jì)量的樣本觀測(cè)值的出現(xiàn)屬于小概率事件,那么可以認(rèn)為原假設(shè)不可信,從而否定它,轉(zhuǎn)而接受備擇假設(shè)。19至于小概率的標(biāo)準(zhǔn)是多
6、大?這要根據(jù)實(shí)際問(wèn)題而定。假設(shè)檢驗(yàn)中,稱這一標(biāo)準(zhǔn)為顯著性水平,用來(lái)表示。在應(yīng)用中,通常取 =0.01, =0.05。一般來(lái)說(shuō),犯第一類錯(cuò)誤可能造成的損失越大, 的取值應(yīng)當(dāng)越小。對(duì)假設(shè)檢驗(yàn)問(wèn)題做出判斷可依據(jù)兩種規(guī)則:一是P-值規(guī)則;二是臨界值規(guī)則。20(一)P-值規(guī)則 所謂P-值,實(shí)際上是檢驗(yàn)統(tǒng)計(jì)量超過(guò)(大于或小于)具體樣本觀測(cè)值的概率。 如果P-值小于所給定的顯著性水平,則認(rèn)為原假設(shè)不太可能成立; 如果P-值大于所給定的標(biāo)準(zhǔn),則認(rèn)為沒(méi)有充分的證據(jù)否定原假設(shè)。21例6-3假定 =0.05,根據(jù)例6-2的結(jié)果,計(jì)算該問(wèn)題的P-值,并做出判斷。22解:查標(biāo)準(zhǔn)正態(tài)概率表,當(dāng)z=2.29時(shí),陰影面積為0
7、.9890,尾部面積為1-0.9890=0.011,由對(duì)稱性可知,當(dāng)z= 2.29時(shí),左側(cè)面積為0.011。0.011/2=0.0250.011這個(gè)數(shù)字意味著,假若我們反復(fù)抽取n=100的樣本,在100個(gè)樣本中僅有可能出現(xiàn)一個(gè)使檢驗(yàn)統(tǒng)計(jì)量等于或小于2.29的樣本。該事件發(fā)生的概率小于給定的顯著性水平,所以,可以判斷=150的假定是錯(cuò)誤的,也就是說(shuō),根據(jù)觀測(cè)的樣本,有理由表明總體的與150克的差異是顯著存在的。23例:某電視機(jī)廠聲稱其產(chǎn)品耐用時(shí)間超過(guò)1200小時(shí)。隨機(jī)抽取100件產(chǎn)品后測(cè)得均值為1251小時(shí),標(biāo)準(zhǔn)差s=300小時(shí)。問(wèn)該廠產(chǎn)品耐用時(shí)間是否高于1200小時(shí)?(顯著水平0.05)24(
8、二)臨界值規(guī)則假設(shè)檢驗(yàn)中,還有另外一種做出結(jié)論的方法:根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)(它是概率密度曲線的尾部面積)查表得到相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,稱作臨界值。直接用檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值與臨界值作比較,觀測(cè)值落在臨界值所劃定的尾部(稱之為拒絕域)內(nèi),便拒絕原假設(shè);25觀測(cè)值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的范圍內(nèi),則認(rèn)為拒絕原假設(shè)的證據(jù)不足。這種做出檢驗(yàn)結(jié)論的方法,我們稱之為臨界值規(guī)則。26顯然,P-值規(guī)則和臨界值規(guī)則是等價(jià)的。在做檢驗(yàn)的時(shí)候,只用其中一個(gè)規(guī)則即可。P-值規(guī)則較之臨界值規(guī)則具有更明顯的優(yōu)點(diǎn)。這主要是:第一,它更加簡(jiǎn)捷;第二,在值規(guī)則的檢驗(yàn)結(jié)論中,對(duì)于犯第一類錯(cuò)誤的概率的表
9、述更加精確。推薦使用P-值規(guī)則。27例6-4假定=0.05,根據(jù)例6-2的結(jié)果,用臨界值規(guī)則做出判斷。28解:查表得到,臨界值z(mì)0.025= 1.96。由于z= 2.29 1.96,即,檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值落在臨界值所劃定的左側(cè)(即落在拒絕域),因而拒絕=150克的原假設(shè)。上面的檢驗(yàn)結(jié)果意味著,由樣本數(shù)據(jù)得到的觀測(cè)值的差異提醒我們:裝袋生產(chǎn)線的生產(chǎn)過(guò)程已經(jīng)偏離了控制狀態(tài),正在向裝袋重量低于技術(shù)標(biāo)準(zhǔn)的狀態(tài)傾斜。29五、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn) 圖6-1 雙側(cè)、單側(cè)檢驗(yàn)的拒絕域分配/21 /2Z /2 Z/2 (a)雙側(cè)檢驗(yàn) Z 0 (b)左側(cè)檢驗(yàn) 0 Z (c)右側(cè)檢驗(yàn) 30表6-1 拒絕域的單、雙側(cè)與
10、備擇假設(shè)之間的對(duì)應(yīng)關(guān)系拒絕域位置P-值檢驗(yàn)的顯著性水平判斷標(biāo)準(zhǔn)原假設(shè)備擇假設(shè)雙側(cè)/2H0:0H1:0左單側(cè)H0:0H1:031六、假設(shè)檢驗(yàn)的兩類錯(cuò)誤顯著性檢驗(yàn)中的第一類錯(cuò)誤是指:原假設(shè)事實(shí)上正確,可是檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值卻落入拒絕域,因而否定了本來(lái)正確的假設(shè)。這是棄真的錯(cuò)誤。發(fā)生第一類錯(cuò)誤的概率在雙側(cè)檢驗(yàn)時(shí)是兩個(gè)尾部的拒絕域面積之和;在單側(cè)檢驗(yàn)時(shí)是單側(cè)拒絕域的面積。32顯著性檢驗(yàn)中的第二類錯(cuò)誤是指:原假設(shè)事實(shí)上不正確,而檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值卻落入了不能拒絕域,因而沒(méi)有否定本來(lái)不正確的原假設(shè),這是取偽的錯(cuò)誤。發(fā)生第二類錯(cuò)誤的概率是把來(lái)自=1(10)的總體的樣本值代入檢驗(yàn)統(tǒng)計(jì)量所得結(jié)果落入接受域的概率
11、。33根據(jù)不同的檢驗(yàn)問(wèn)題,對(duì)于和大小的選擇有不同的考慮。例如,在例6-1中,如果檢驗(yàn)者站在賣方的立場(chǎng)上,他較為關(guān)心的是不要犯第一類錯(cuò)誤,即不要發(fā)生產(chǎn)品本來(lái)合格卻被錯(cuò)誤地拒收這樣的事情,這時(shí), 要較小。反之,如果檢驗(yàn)者站在買者的立場(chǎng)上,他關(guān)心的是不要把本來(lái)不合格的產(chǎn)品誤當(dāng)作合格品收下,也就是說(shuō),最好不要犯第二類錯(cuò)誤,因此, 要較小。34在樣本容量n不變的條件下,犯兩類錯(cuò)誤的概率常常呈現(xiàn)反向的變化,要使和都同時(shí)減小,除非增加樣本的容量。為此,統(tǒng)計(jì)學(xué)家奈曼與皮爾遜提出了一個(gè)原則,即在控制犯第一類錯(cuò)誤的概率情況下,盡量使犯第二類錯(cuò)誤的概率小。在實(shí)際問(wèn)題中,我們往往把要否定的陳述作為原假設(shè),而把擬采納的
12、陳述本身作為備擇假設(shè),只對(duì)犯第一類錯(cuò)誤的概率加以限制,而不考慮犯第二類錯(cuò)誤的概率 。35七、關(guān)于假設(shè)檢驗(yàn)結(jié)論的理解這就是說(shuō)在假設(shè)檢驗(yàn)中,相對(duì)而言,當(dāng)原假設(shè)被拒絕時(shí),我們能夠以較大的把握肯定備擇假設(shè)的成立。而當(dāng)原假設(shè)未被拒絕時(shí),我們并不能認(rèn)為原假設(shè)確實(shí)成立。 36注意:顯著性檢驗(yàn)到底回答了什么樣的問(wèn)題?顯著性檢驗(yàn)只是回答了所觀察到的差異(樣本數(shù)據(jù)與我們對(duì)總體所作的推測(cè)之間的差異)是純屬于機(jī)會(huì)變異,還是反映了真實(shí)的差異?37不能企圖用顯著性檢驗(yàn)回答其不能回答的問(wèn)題(1)如果顯著性檢驗(yàn)得到差異顯著的結(jié)論(觀察到的差異提供了較充分的證據(jù)表明差異真實(shí)存在),這時(shí)并不能評(píng)價(jià)差異的大小和重要性。38不能企圖
13、用顯著性檢驗(yàn)回答其不能回答的問(wèn)題(2)顯著性檢驗(yàn)只能告訴我們差異是否在事實(shí)上存在,并不能回答差異產(chǎn)生的原因。(3)顯著性檢驗(yàn)不能檢查我們對(duì)實(shí)驗(yàn)所作的設(shè)計(jì)是否有缺陷。39第二節(jié) 總體均值為某定值的顯著性檢驗(yàn)40注意:總體指在隨機(jī)試驗(yàn)中所觀測(cè)的隨機(jī)變量??傮w均值指的是隨機(jī)變量的期望值。41總體均值的顯著性檢驗(yàn)包括:雙尾情況左單尾右單尾42如下就總體分布的不同情況總體方差是否已知的不同情況樣本大小的不同情況分別介紹檢驗(yàn)統(tǒng)計(jì)量和檢驗(yàn)規(guī)則。43(一)總體為正態(tài)分布,總體方差已知,樣本不論大小來(lái)自總體的樣本為(x1, x2, , xn)。對(duì)于假設(shè):H0: = 0,在H0成立的前提下,有檢驗(yàn)統(tǒng)計(jì)量 44(二
14、)總體分布未知,總體方差已知,大樣本 來(lái)自總體的樣本為(x1, x2, , xn)。對(duì)于假設(shè):H0: = 0,在H0成立的前提下,如果樣本足夠大(n30),近似地有檢驗(yàn)統(tǒng)計(jì)量 45(三)總體為正態(tài)分布,總體方差未知,小樣本來(lái)自總體的樣本為(x1, x2, , xn)。對(duì)于假設(shè):H0: = 0,在H0成立的前提下,有檢驗(yàn)統(tǒng)計(jì)量 若自由度(n-1)30,該t統(tǒng)計(jì)量近似服從標(biāo)準(zhǔn)正態(tài)分布。46例:已知初婚年齡服從正態(tài)分布。根據(jù)9個(gè)人的調(diào)查結(jié)果,樣本均值為 歲,樣本標(biāo)準(zhǔn)差s=3歲。問(wèn)是否可以認(rèn)為該地區(qū)初婚年齡數(shù)學(xué)期望已經(jīng)超過(guò)20歲( )47(四)總體分布未知,總體方差未知,大樣本來(lái)自總體的樣本為(x1, x2, , xn)。對(duì)于假設(shè):H0: = 0,在H0成立的前提下,如果總體偏斜適度,且樣本足夠大,近似地有檢驗(yàn)統(tǒng)計(jì)量48例6-5 某廠采用自動(dòng)包裝機(jī)分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標(biāo)準(zhǔn)重量為1000克,某日隨機(jī)抽查9包,測(cè)得樣本平均重量為986克,樣本標(biāo)準(zhǔn)差是24克。試問(wèn)在=0.05的顯著性水平上,能否認(rèn)為這天自動(dòng)包裝機(jī)工作正常?49解:第一步:確定原假設(shè)與備擇假設(shè)。H0: = 1000, H1: 1000第二步:構(gòu)造出檢驗(yàn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度板材生產(chǎn)技術(shù)改造合同3篇
- 二零二五年度文化旅游地產(chǎn)開(kāi)發(fā)合同書(shū)6篇
- 2024版建筑勞務(wù)分包協(xié)議樣本版
- 二零二五年度環(huán)保設(shè)備銷售與節(jié)能改造合同范本2篇
- 2024版物業(yè)服務(wù)合同文本3篇
- 二零二五年度安徽省住宅租賃代理服務(wù)協(xié)議2篇
- 2024年長(zhǎng)沙住宅租賃協(xié)議樣式版B版
- 二零二五年度個(gè)人住房按揭貸款服務(wù)協(xié)議3篇
- 2024年藝術(shù)品購(gòu)銷合同起訴狀范本
- 2025年度倉(cāng)儲(chǔ)租賃合同范本:倉(cāng)儲(chǔ)數(shù)據(jù)分析服務(wù)3篇
- 湖南省邵陽(yáng)市初中聯(lián)考2023-2024學(xué)年九年級(jí)上學(xué)期期末地理試題
- 美術(shù)概論課件
- 綠籬移栽施工方案
- 機(jī)器人論文3000字范文
- 中國(guó)保險(xiǎn)行業(yè)協(xié)會(huì)-2022年度商業(yè)健康保險(xiǎn)經(jīng)營(yíng)數(shù)據(jù)分析報(bào)告
- 新人教版小學(xué)五年級(jí)數(shù)學(xué)上冊(cè)知識(shí)點(diǎn)歸納總結(jié)
- 四年級(jí)上冊(cè)口算、豎式計(jì)算、脫式計(jì)算
- 腎內(nèi)科降低透析器凝血發(fā)生率品管圈PDCA成果匯報(bào)
- 回族做禮拜的念詞集合6篇
- 臺(tái)區(qū)線損綜合分析臺(tái)區(qū)線損分類及計(jì)算方法
- 辯論賽醫(yī)術(shù)更重要
評(píng)論
0/150
提交評(píng)論