《假設(shè)檢驗》講義_第1頁
《假設(shè)檢驗》講義_第2頁
《假設(shè)檢驗》講義_第3頁
《假設(shè)檢驗》講義_第4頁
《假設(shè)檢驗》講義_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《假設(shè)檢驗》講義客觀現(xiàn)象數(shù)量表現(xiàn)統(tǒng)計總體數(shù)量特征統(tǒng)計研究的程序統(tǒng)計研究目的統(tǒng)計設(shè)計統(tǒng)計調(diào)查統(tǒng)計整理推斷分析描述分析2008-2009假設(shè)檢驗在統(tǒng)計方法中的地位統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗2008-2009學(xué)習(xí)目標假設(shè)檢驗的基本思想和原理

假設(shè)檢驗的步驟總體均值的檢驗總體比例的檢驗

P值的計算與應(yīng)用用Excel進行檢驗2008-20096.1假設(shè)檢驗的基本問題假設(shè)的陳述兩類錯誤與顯著性水平統(tǒng)計量與拒絕域利用P值進行決策2008-2009什么是假設(shè)?(hypothesis)對總體參數(shù)的具體數(shù)值所作的陳述總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述我認為這種新藥的療效比原有的藥物更有效!假設(shè)的陳述2008-2009什么是假設(shè)檢驗?(hypothesistest)先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程有參數(shù)檢驗和非參數(shù)檢驗邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理2008-2009原假設(shè)(nullhypothesis)研究者想收集證據(jù)予以反對的假設(shè)又稱“0假設(shè)”總是有符號

,或表示為H0H0:

=某一數(shù)值

指定為符號=,或

例如,H0:

10cm2008-2009研究者想收集證據(jù)予以支持的假設(shè)也稱“研究假設(shè)”總是有符號

,

或表示為

H1H1:

<某一數(shù)值,或某一數(shù)值例如,H1:

<10cm,或10cm備擇假設(shè)(alternativehypothesis)2008-2009【例】一種零件的生產(chǎn)標準是直徑應(yīng)為10cm,為對生產(chǎn)過程進行控制,質(zhì)量監(jiān)測人員定期對一臺加工機床檢查,確定這臺機床生產(chǎn)的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進行調(diào)整。試陳述用來檢驗生產(chǎn)過程是否正常的原假設(shè)和備擇假設(shè)提出假設(shè)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正常”。建立的原假設(shè)和備擇假設(shè)為H0:

10cmH1:

10cm2008-2009【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<500500g2008-2009【例】一家研究機構(gòu)估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構(gòu)隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設(shè)與備擇假設(shè)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為

H0:

30%H1:

30%2008-2009原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立在一項假設(shè)檢驗中,原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立先確定備擇假設(shè),再確定原假設(shè)等號“=”總是放在原假設(shè)上因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)的結(jié)論與建議2008-2009備擇假設(shè)沒有特定的方向性,并含有符號“”的假設(shè)檢驗,稱為雙側(cè)檢驗或雙尾檢驗(two-tailedtest)備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗(one-tailedtest)備擇假設(shè)的方向為“<”,稱為左側(cè)檢驗

備擇假設(shè)的方向為“>”,稱為右側(cè)檢驗

雙側(cè)檢驗與單側(cè)檢驗2008-2009假設(shè)的形式假設(shè)雙側(cè)檢驗單側(cè)檢驗左側(cè)檢驗右側(cè)檢驗原假設(shè)H0:m=m0H0

:m

m0H0:m

m0備擇假設(shè)H1:m≠m0H1

:m<m0H1:m>m02008-2009假設(shè)檢驗中的兩類錯誤第Ⅰ類錯誤(棄真錯誤)原假設(shè)為真時拒絕原假設(shè)第Ⅰ類錯誤的概率記為被稱為顯著性水平第Ⅱ類錯誤(取偽錯誤)原假設(shè)為假時未拒絕原假設(shè)第Ⅱ類錯誤的概率記為(Beta)兩類錯誤與顯著性水平2008-2009H0:

無罪陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假未拒絕H0正確決策(1–a)第Ⅱ類錯誤(b)拒絕H0第Ⅰ類錯誤(a)正確決策(1-b)假設(shè)檢驗就好像一場審判過程統(tǒng)計檢驗過程決策結(jié)果2008-2009錯誤和

錯誤的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系就像翹翹板,小就大,大就小2008-2009影響錯誤的因素1. 總體參數(shù)的真值隨著假設(shè)的總體參數(shù)的減少而增大2. 顯著性水平當(dāng)減少時增大3. 總體標準差

當(dāng)增大時增大4. 樣本容量n當(dāng)n

減少時增大2008-2009顯著性水平

(significantlevel)1. 是一個概率值2. 原假設(shè)為真時,拒絕原假設(shè)的概率被稱為抽樣分布的拒絕域3. 表示為(alpha)常用的值有4. 由研究者事先確定2008-2009假設(shè)檢驗中的小概率原理什么是小概率?1. 在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率2. 在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)3. 小概率由研究者事先確定2008-2009根據(jù)樣本觀測結(jié)果計算得到的,并據(jù)以對原假設(shè)和備擇假設(shè)作出決策的某個樣本統(tǒng)計量對樣本估計量的標準化結(jié)果原假設(shè)H0為真點估計量的抽樣分布檢驗統(tǒng)計量(teststatistic)統(tǒng)計量與拒絕域標準化的檢驗統(tǒng)計量2008-2009拒絕域能夠拒絕原假設(shè)的檢驗統(tǒng)計量的所有可能取值的集合。由顯著性水平圍成的區(qū)域。如果檢驗統(tǒng)計量的具體數(shù)值落在了拒絕域內(nèi),就拒絕原假設(shè),否則就不拒絕原假設(shè)。根據(jù)給定的顯著性水平確定的拒絕域的邊界值,稱為臨界值。(查表所得)2008-2009顯著性水平和拒絕域抽樣分布0臨界值臨界值a/2a/2樣本統(tǒng)計量拒絕H0拒絕H01-置信水平雙側(cè)檢驗

2008-20090臨界值臨界值a/2

a/2樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-置信水平雙側(cè)檢驗2008-20090臨界值臨界值

a/2a/2樣本統(tǒng)計量拒絕H0拒絕H0抽樣分布1-置信水平2008-2009單側(cè)檢驗

0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平2008-2009左側(cè)檢驗

0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平觀察到的樣本統(tǒng)計量2008-20090臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平2008-2009右側(cè)檢驗

0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平觀察到的樣本統(tǒng)計量2008-20090臨界值a樣本統(tǒng)計量抽樣分布1-置信水平拒絕H02008-2009決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z或z/2,t或t/2將檢驗統(tǒng)計量的值與水平的臨界值進行比較作出決策雙側(cè)檢驗:I統(tǒng)計量I>臨界值,拒絕H0左側(cè)檢驗:統(tǒng)計量<-臨界值,拒絕H0右側(cè)檢驗:統(tǒng)計量>臨界值,拒絕H02008-2009什么是P值(P-value)在原假設(shè)為真的條件下,檢驗統(tǒng)計量的觀察值大于或等于其計算值的概率雙側(cè)檢驗為分布中兩側(cè)面積的總和反映實際觀測到的數(shù)據(jù)與原假設(shè)H0之間不一致的程度被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕H0利用P值進行決策2008-2009雙側(cè)檢驗的P值/

2/

2Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值P

值1/2P

值1/22008-2009左側(cè)檢驗的P值0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平計算出的樣本統(tǒng)計量P

值2008-2009右側(cè)檢驗的P值0臨界值a拒絕H0抽樣分布1-置信水平計算出的樣本統(tǒng)計量P值2008-2009假設(shè)檢驗步驟的總結(jié)陳述原假設(shè)和備擇假設(shè)從所研究的總體中抽出一個隨機樣本確定一個適當(dāng)?shù)臋z驗統(tǒng)計量,并利用樣本數(shù)據(jù)算出其具體數(shù)值確定一個適當(dāng)?shù)娘@著性水平,并計算出其臨界值,指定拒絕域?qū)⒔y(tǒng)計量的值與臨界值進行比較,作出決策統(tǒng)計量的值落在拒絕域,拒絕H0,否則不拒絕H0也可以直接利用P值作出決策2008-20096.2總體均值的檢驗大樣本的檢驗方法小樣本的檢驗方法2008-2009一個總體參數(shù)的檢驗z檢驗(單尾和雙尾)t檢驗(單尾和雙尾)z檢驗(單尾和雙尾)

2檢驗(單尾和雙尾)均值一個總體比例方差2008-2009總體均值的檢驗(作出判斷)是否已知小樣本容量n大是否已知否t檢驗否z檢驗是z檢驗

是z檢驗2008-2009總體均值的檢驗(大樣本)假定條件正態(tài)總體或非正態(tài)總體大樣本(n30)使用z檢驗統(tǒng)計量2已知:2未知:大樣本的檢驗方法)1,0(~0Nnxzsm-=)1,0(~0Nnsxzm-=2008-2009總體均值的檢驗(2

已知)【例】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為。取顯著性水平,檢驗該天生產(chǎn)的飲料容量是否符合標準要求?雙側(cè)檢驗綠色健康飲品綠色健康飲品2552552008-2009由題已知H0

:=255H1

255n

=40σ=5臨界值(c):檢驗統(tǒng)計量:z01.96-1.960.025拒絕H0拒絕H00.025決策:結(jié)論:

不拒絕H0樣本提供的證據(jù)表明:該天生產(chǎn)的飲料符合標準要求01.14052558.2550=-=-=nxzsm2008-2009

用Excel計算P值第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“NORMSDIST”,然后確定第3步:將z

的絕對值錄入,得到的函數(shù)值為

P值=2(1-)=

P值遠遠大于,故不拒絕H02008-2009【例】(2未知)

一種機床加工的零件尺寸絕對平均誤差允許值為。生產(chǎn)廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低?(=0.01)

左側(cè)檢驗50個零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗(2

未知)2008-2009由題已知H0

H1

n=50臨界值(c):檢驗統(tǒng)計量:拒絕H0新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.016061.250365749.035.13152.1-=-=z2008-20090-2.33a=0.05z拒絕H0抽樣分布1-計算出的樣本統(tǒng)計量=-2.6061P值P=0.004579

2008-2009用Excel計算P值(z檢驗)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“ZTEST”,然后確定第3步:在所出現(xiàn)的對話框Array框中,輸入原始數(shù)據(jù)所在區(qū)域;在X后輸入?yún)?shù)的某一假定值(這里為);在Sigma后輸入已知的總體標準差(若未總體標準差未知則可忽略不填,系統(tǒng)將自動使用樣本標準差代替)第4步:用1減去得到的函數(shù)值即為P值

P值=1-0.995421023=

P值<,拒絕H02008-2009【例】(2未知)

某一小麥品種的平均產(chǎn)量為5200kg/hm2。一家研究機構(gòu)對小麥品種進行了改良以期提高產(chǎn)量。為檢驗改良后的新品種產(chǎn)量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標準差為120/hm2。試檢驗改良后的新品種產(chǎn)量是否有顯著提高?(=0.05)右側(cè)檢驗2008-2009H0

5200H1

:>5200n=36臨界值(c):檢驗統(tǒng)計量:拒絕H0

(P

=0.000088<=0.05)改良后的新品種產(chǎn)量有顯著提高決策:結(jié)論:z0拒絕H00.051.64575.33612052005275=-=z2008-2009抽樣分布P=0.000088

01.645a=0.05拒絕H01-計算出的樣本統(tǒng)計量=3.75P值2008-2009總體均值(大樣本)的檢驗方法的總結(jié)假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0統(tǒng)計量已知:未知:拒絕域P值決策拒絕H02008-2009總體均值的檢驗(小樣本)假定條件總體服從正態(tài)分布小樣本(n<

30)檢驗統(tǒng)計量2已知:2未知:小樣本的檢驗方法)1,0(~0Nnxzsm-=)1(~0--=ntnsxtm2008-2009總體均值(小樣本)檢驗方法的總結(jié)假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0

:m=m0H1:

mm0H0:mm0H1:

m<m0H0:

mm0

H1:

m>m0統(tǒng)計量已知:未知:拒絕域P值決策拒絕H0注:已知的拒絕域同大樣本2008-2009【例】

一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產(chǎn)企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進?,F(xiàn)對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.32008-2009由題已知H0

:=12H1

12df=10-1=9臨界值(c):檢驗統(tǒng)計量:不拒絕H0該供貨商提供的零件符合要求決策:結(jié)論:t02.262-2.2620.025拒絕H0拒絕H00.0257035.0104932.01289.11-=-=t2008-2009用Excel計算P值(t檢驗)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“TDIST”,然后確定第3步:在出現(xiàn)對話框的X欄中輸入計算出的t的絕對值,在Deg-freedom(自由度)欄中輸入本例的自由度9,在Tails欄中輸入2(表明是雙側(cè)檢驗,如果是單側(cè)檢驗則在該欄輸入1)第4步:P值=

P值>,故不拒絕H0

2008-20096.3總體比例的檢驗大樣本的檢驗方法2008-2009總體比例檢驗假定條件總體服從二項分布可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論