版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第8章假設檢驗8.1、假設檢驗的基本思想8.2、總體平均值的假設檢驗8.3、比例的假設檢驗8.4、方差的假設檢驗8.5、兩個總體參數的假設檢驗8.6、參數估計和建設檢驗的關系8.1、假設檢驗的基本思想8.1.1假設檢驗的數理邏輯與反證法假設檢驗就是根據關于總體參數的某種假設,依據樣本分布規(guī)律如果能推論出幾乎不可能的事件,即小概率事件,這時我們可以認為關于總體參數的某個假設幾乎不成立。假設檢驗的思想也被稱為小概率原理。例8.1、在例7.1的數據中,某醫(yī)院育嬰房隨機抽取9名新生兒,檢查他(她)們的體重數據如下(單位KG):2.8,3.1,3.6,3.7,3.8,3.2,2.9,3.3,4.1。假設新生兒體重分布服從正態(tài)分布,且標準差為0.4。根據樣本數據,能否判斷新生兒平均體重為4.0公斤?解:首先,假設新生兒體重為4.0公斤(原假設H0),如果這一說法不正確,則新生兒體重不等于4.0公斤(備擇假設H1)第一步:構造原假設和備擇假設第二步:構造樣本統(tǒng)計量第三步,根據抽樣所得樣本數據計算樣本統(tǒng)計量數值第四步,將樣本統(tǒng)計量值臨界值比較,做決策。根據標準正態(tài)分布規(guī)律,標準正態(tài)變量在95%的概率下落入(-1.96,+1.96)之間,顯然-4.58沒有落入這一區(qū)間,小概率事件出現(不足5%),拒絕原假設。此時,我們的結論是認為新生兒體重總體均值不是4.0公斤。8.1.2假設檢驗中的基本概念1.原假設(NullHypothesis)與備擇假設(AlternativeHypothesis)原假設是對于總體參數所做的陳述,也有叫做零假設、虛無假設等等,原假設是研究著想予以否定的假設。而研究者通過搜集樣本數據想予以證明或支持的假設稱為備擇假設,備擇假設也是我們的研究假設。如果能夠得出與原假設相違背的結論,則拒絕原假設(接受備擇假設),否則不能拒絕原假設。例8.2、
在企業(yè)持續(xù)生產的生產線上,質量控制人員定期對某個金屬零件的孔徑進行檢查,以確定金屬零件的孔徑是否為3.0厘米。如果孔徑大于或小于3.0厘米均表示生產線失去控制,試表述在這一檢驗過程中,檢驗人員的原假設和備擇假設。解:根據上面的陳述,在正常生產條件下,金屬零件孔徑cm,此時生產線處于控制狀態(tài)。研究者最關心或者最想證明的是金屬零件孔徑大于或小于3.0厘米。例8.3、
某廠家生產一種新型輪胎,廠家廣告聲稱其平均使用里程超過25000公里。對一個由16個輪胎組成的隨機樣本做了試驗,得到其樣本平均值和標準差分別為27000公里和4000公里。假定輪胎壽命服從正態(tài)分布,試表述在這一檢驗過程中的原假設和備擇假設。解:根據上面的陳述,要能夠證明輪胎平均使用里程大于25000公里,則應該處于備擇假設的位置,那么與之相反的應該處于原假設,所以:
(廠家廣告不真實)
(廠家廣告真實)例8.4、
根據統(tǒng)計,某個工作崗位上平均每周的事故次數為5.5次,研究者為了降低事故發(fā)生率,重新設定了工作流程和新的安全計劃,為了檢驗新的方案是否降低了事故發(fā)生率,試表述在這一檢驗過程中的原假設和備擇假設。解:根據上面的陳述,要能夠降低事故發(fā)生率,這也是研究者最關心的,因此處于備擇假設位置。(事故頻率沒有降低)(事故頻率得到有效降低)2.顯著性水平(levelofsignificance)和臨界值在例8.1中,樣本統(tǒng)計量仍有5%的概率落入區(qū)間(-1.96,+1.96)之外,拒絕原假設則意味著可能犯錯誤,也就是說我們最多還有5%的概率犯“拒絕一個正確原假設”的錯誤,我們把犯這類錯誤的概率稱為顯著性水平(levelofsignificance)。通常在假設檢驗中,顯著性水平是根據研究需要事先給定的,一般取1%,5%或者10%。臨界值是顯著性水平對應的統(tǒng)計量值。例8.1中
稱落入拒絕域稱落入非拒絕域3.假設檢驗中的兩類錯誤第一類錯誤,或棄真錯誤,即在原假設正確前提下,犯拒絕正確原假設的概率第二類錯誤,也叫做取偽錯誤,即我們沒有拒絕錯誤的原假設,法官審判審判(原假設無罪)假設檢驗(原假設H0)裁決結果實際情況決策結果實際情況無罪有罪H0為真H0為假無罪正確錯誤未拒絕
正確決策(1-a)第Ⅱ類錯誤(β)有罪錯誤正確拒絕第Ⅰ類錯誤(a)正確決策(1-β)4、p-值(p-value)在例8.1中,由于|Z|=4.58>Z0.025=1.96拒絕原假設,此時犯第一類錯誤的概率不超過5%,但是到底真實犯第一類錯的概率是多少呢?當原假設正確時,|Z|仍有可能大于4.58,因此p值即P(|Z|>4.58),所以p值是一個概率值,可以認為是犯第一類錯誤(棄真錯誤)的概率,通俗的可以理解為,按照所取得的樣本計算的統(tǒng)計量值判斷,原假設為真的概率為p。當原假設正確時,|Z|仍有可能大于4.58,因此p值即P(|Z|>4.58),所以p值是一個概率值,可以認為是犯第一類錯誤(棄真錯誤)的概率,通俗的可以理解為,按照所取得的樣本計算的統(tǒng)計量值判斷,原假設為真的概率為p。5.單尾檢驗中的接受域和拒絕域左尾檢驗右尾檢驗6、假設檢驗決策規(guī)則1)根據顯著性水平
查表取得臨界值給定顯著性水平
,查表得出相應的臨界值Za
(單尾檢驗)或Za/2(雙尾檢驗),根據總體分布情況、樣本容量大小等也會用到ta(單尾檢驗)或ta/2(雙尾檢驗)2)比較,觀察統(tǒng)計量值落入拒絕域還是非拒絕域將檢驗統(tǒng)計量的值與
水平的臨界值進行比較,作出決策(注意單尾檢驗臨界值的正負號)。雙側檢驗:|統(tǒng)計量|>臨界值,拒絕H0
左側檢驗:統(tǒng)計量<-臨界值,拒絕H0
右側檢驗:統(tǒng)計量>臨界值,拒絕H08.2總體平均數的假設檢驗8.2.1檢驗統(tǒng)計量的確定1樣本量總體服從正態(tài)分布時,樣本均值服從正態(tài)分布??傮w未服從正態(tài)分布,樣本容量足夠大時,樣本均值仍然近似服從正態(tài)分布。當總體標準差未知時,樣本容量足夠大(大于30),可以用樣本標準差s代替總體標準差σ2、樣本標準差是否已知在小樣本情況下,如果總體標準差
σ已知,根據前面的分析樣本統(tǒng)計量仍然服從正態(tài)分布,可采用Z統(tǒng)計量作為檢驗統(tǒng)計量。如果總體標準差σ未知,需要用s來替代總體標準差σ
,這時由于樣本標準差的隨機性,使得樣本統(tǒng)計量具有更大的隨機性,根據第6章的證明,需采用t統(tǒng)計量,計算公式:8.2.2均值的雙尾檢驗例8.5有一臺生產金屬零件的加工機床,零件的直徑平均值為0.5cm,假設在一段時間內生產的零件中取得n=50的樣本,測量得到樣本平均值為0.46cm和標準差s=0.075cm。試以5%的顯著性水平檢驗機床生產狀態(tài)是否正常。解:第一步構造假設H0:μ=0.5(機床生產狀態(tài)正常)H1:
μ≠0.5(機床生產狀態(tài)不正常)第二步:構造樣本統(tǒng)計量,用s替代總體標準差
σ,由于n>30,可以采用Z統(tǒng)計量第三步,根據抽樣所得樣本數據計算樣本統(tǒng)計量數值,由于是雙尾檢驗,故根據顯著性水平
查Za/2=Z0.05/2=1.96第四步,將樣本統(tǒng)計量值臨界值比較,做決策。|Z|=3.77>Z0.025=1.96因此,檢驗統(tǒng)計量落入拒絕域,故拒絕原假設,接受備擇假設,有充足理由說明機床生產狀態(tài)不正常。在本例中,由于用s替代總體標準差
σ,用Z統(tǒng)計量的原因是當n較大時正態(tài)統(tǒng)計量的與t統(tǒng)計量的近似程度較好。如果我們用t統(tǒng)計量,則更加準確一些,只是t統(tǒng)計量本身有自由度,需要查表,但是在有計算機條件下,查表并不困難。因此,上面的例子如若用t統(tǒng)計量,t值仍然是-3.77,只是第三步查表時需要查t0.025(49)=2.0103.77>2.010,結論是一致的。8.2.3均值的單尾檢驗1.左尾檢驗例8.7、一位餐廳總經理為了減少顧客點單后等候的時間,采用了一種新的電子菜單點單流程。在傳統(tǒng)點單情況下,顧客的平均等待時間為16分鐘,采用新的流程后,對隨機36名顧客等待時間做了記錄,得到平均等待時間為11.2分鐘,標準差s為6分鐘,試以0.05的顯著性水平檢驗顧客等待時間是否有顯著下降。解:由于餐廳經理最關心等待時間下降,即
,因此想要驗證的結論出與備擇假設,所以,第一步構造假設:H0:μ≥18(等待時間沒有顯著下降)H1:μ<18(等待時間顯著下降)第二步,計算統(tǒng)計量。由于用樣本標準差s替代總體標準差σ,統(tǒng)計量:由于是左側檢驗(犯錯誤的概率在左側),查
t0.05(35)=1.6896將t=-4.8和臨界值作比較t=-4.8t<-t0.05(35)=-1.6896因此拒絕原假設,即有充分證據說明改變后的電子下單方式使顧客平均等待時間顯著下降。在本例左尾檢驗中,p-value就是t分布落在-4.8左側的概率,用EXCEL函數TDIST查得1.4655×10-5,幾乎是0,顯然小于給定的顯著性水平5%。2、右尾檢驗例8.8對于例8.3,某廠家生產一種新型輪胎,廠家廣告聲稱其平均使用里程超過25000公里。對一個由16個輪胎組成的隨機樣本做了試驗,得到其樣本平均值和標準差分別為27000公里和4000公里。試以0.05和0.01的顯著性水平分別檢驗廠家的廣告是否真實。解:第一步構造假設H0:μ≤25000(廠家廣告不真實)H1:μ>25000
(廠家廣告真實)第二步,計算t統(tǒng)計量第三步,根據給定的顯著性水平0.05和0.01查t臨界值當顯著性水平取a=0.05時,t=2>t0.05(15)=1.7531
,故拒絕原假設,接受備擇假設,說明廠家廣告為真。當顯著性水平a取0.01時,t=2<t0.01(15)=2.6025
,故不能拒絕原假設,不能說明廠家廣告為真。在這里,顯著性水平不同會影響到假設檢驗決策的結果。如何理解?8.3比例的假設檢驗根據第6章比例的抽樣分布規(guī)律(公式6.5),我們知道當
和np>5和n(1-p)>5
時,因此,檢驗統(tǒng)計量可以采用,1.雙尾檢驗例8.10一個市場調研公司聲稱他們通過郵件回訪了8%的產品用戶。為了檢驗這一說法是否正確。現隨機取得了該產品用戶中的500人作為樣本,其中有25人表示接受到市場調研公司的回訪,試以5%的顯著性水平檢驗這一說法的正確性。解:第一步,做假設H0:π=8%H1:π≠8%第二步,計算樣本統(tǒng)計量由于|Z|=2.47<Z0.025=1.96,故落入拒絕域,拒絕原假設,接受備擇假設,說明該市場調研公司的回訪比例不是8%。根據Excel中的標準正態(tài)分布函數NORMSDIST查得p-value是0.0135<0.05。2.單尾檢驗例8.11、2009年的一項調查數據表明,周末看電視的家庭主婦中,有40%收看綜合娛樂節(jié)目。而在2010年周末收看電視的家庭主婦中,隨機抽取了120名,其中有57人收看綜合娛樂節(jié)目。此證據是否表明2010年家庭主婦收看綜合娛樂節(jié)目的比例高于2009年?顯著性水平a取0.05。解:p=57÷120=0.475H0:π≤0.4(2010年比例沒有提高)H1:π>0.4(2010年比例有提高)樣本統(tǒng)計量由于
Z=1.68>Z0.05=1.64,故拒絕原假設,說明2010年周末看電視的家庭主婦收看綜合娛樂節(jié)目的比例高于2009年。P-value可以通過查正態(tài)分布表,即P(Z>1.68)=0.0465。8.4方差的假設檢驗根據第6章樣本方差的分布規(guī)律(公式6.6),若總體方差為σ02
,則方差的檢驗統(tǒng)計量可以采用:其中,樣本方差例8-12在罐頭食品包裝過程中,不僅每罐的平均裝填量很重要,而且裝填量的方差同樣需得到控制。如果裝填量的方差過大,就會出現盡管平均值滿足需要,但是有些罐頭裝填量太多,而又有些罐頭裝填量則太少。假定根據企業(yè)產品質量標準,規(guī)定平均值為8盎司的罐頭裝填量的標準差應小于0.1盎司,質檢人員在生產線上隨機抽樣得到10個罐頭,并測得樣本數據如下:7.96,7.90,7.98,8.01,7.97,7.96,8.03,8.02,8.04,8.02。試以顯著性水平0.05檢驗裝填量的方差是否滿足要求。解:裝填量的方差要滿足要求,即方差小于0.1H0:σ2≥0.1(裝填量方差不符合要求)H1:σ2<0.1(裝填量方差符合要求)
2=1.66<
20.952(9)=3.32518.5兩個總體參數的假設檢驗8.5.1兩個總體均值之差的假設檢驗:獨立雙樣本在兩個總體方差已知時構造統(tǒng)計量。兩個總體的方差
是未知的,因此需要根據樣本方差
來估計,當樣本容量很大時,仍然可以采用標準正態(tài)統(tǒng)計量。在小樣本條件下,需要根據兩個總體方差是否相等分別構造不同的檢驗統(tǒng)計量,如果有理由認為兩個獨立樣本的方差相等。如果沒有理由認為兩個獨立樣本的方差相等,那么檢驗統(tǒng)計量仍然采用。例8.13、計算機焦慮指數(TheComputerAnxietyRatingScale,CARS)是衡量人們面對計算機信息時代產生焦慮情緒的一種指數,指數的計算取值在20(沒有焦慮情緒)到100(焦慮情緒最高)之間,研究者為了了解某大學工商管理碩士(MBA)的焦慮情緒是否在男女不同性別之間存在差異,隨機抽取了172名MBA學員,通過問卷測評匯總得到表8-5的數據,試以5%的顯著性水平檢驗焦慮情緒是否在性別之間存在差異。男性女性40.2636.25s13.359.42N10072解:根據題意構造假設H0:μ1=μ2(焦慮程度不存在差異)H1:μ1≠μ2(焦慮程度存在差異)由于總體方差未知,但是樣本容量足夠大,因此我們可以考慮構造Z統(tǒng)計量由于|Z|=2.3095>Z0.025=1.96,所以拒絕原假設,接受備擇假設,證據表明計算機焦慮程度在不同性別之間存在顯著差異。例8.14某銀行在市中心CBD的營業(yè)網點上,觀察每天中午飯時間(12:00-下午1:00)顧客的等待時間,記錄下顧客從快進大廳直到到柜臺接受服務的時間,隨機取得的15個樣本數據(單位:分鐘),4.21,5.55,3.02,5.13,4.77,2.34,3.54,3.20,4.50,6.10,0.38,5.12,6.46,6.19,3.79。假定這家銀行在郊區(qū)某營業(yè)網點按照同樣的方法取得15個樣本數據:9.66,5.90,8.02,5.79,8.73,3.82,8.01,8.35,10.49,6.68,5.64,4.08,6.17,9.91,5.47。假定等待時間服從正態(tài)分布,且兩個營業(yè)網點等待時間的方差相等,試以0.05的顯著性水平檢驗兩個網點顧客的平均等待時間是否相等?
CBD市郊平均4.2866666677.114666667方差2.6829952384.335512381觀測值1515合并方差3.50925381
假設平均差0
df28
tStat-4.134306277
P(T<=t)單尾0.00014642
t單尾臨界1.701130908
P(T<=t)雙尾0.000292839
t雙尾臨界2.048407115
8.5.2兩個總體均值之差的假設檢驗:匹雙樣本根據我們第7章區(qū)間估計中,關于匹配樣本均值之差的抽樣分布規(guī)律的介紹,根據匹配樣本進行均值之差假設檢驗時檢驗統(tǒng)計量可采用例8.15為了考察消費者對兩類跑步鞋耐用性的評價,有10名消費者分別使用了A、B兩種跑步鞋并舉錄下使用時間(單位:周),下面的數據(見表8-7)是否支持A類鞋的使用壽命更長?取顯著性水平0.05。表8-7消費者使用兩類鞋的時間(單位:周)12345678910A27351939343215261817B23281631383017221516di4738-42-2431Excel運算的結果
AB平均26.223.6方差73.9555555662.04444444觀測值1010泊松相關系數0.905112025
假設平均差0
df9
tStat2.247922629
P(T<=t)單尾0.025588328
t單尾臨界1.833112923
P(T<=t)雙尾0.05117
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《壽司店策劃》課件
- 《種苗檔案建設》課件
- 二次函數復習課件
- 2024-2025學年廣東省清遠市四校聯(lián)考高一上學期11月期中聯(lián)考物理試題(解析版)
- 單位管理制度集粹匯編職員管理十篇
- 《危險管理與保險》課件
- 單位管理制度匯編大合集職工管理十篇
- 三年級數學欣賞與設計課件
- 單位管理制度分享大全【人事管理篇】十篇
- 《孔徑孔容計算》課件
- 連退生產過程操作優(yōu)化-質量預報監(jiān)測及診斷
- 梅毒專題知識培訓
- 小說閱讀抓住矛盾沖突參考資料課件
- 簡約企業(yè)報刊報紙設計排版word模板
- 矛盾糾紛排查化解登記表
- 大班科學活動 有害的噪音
- 建筑施工成品保護措施
- 魚骨圖PPT模板精品教案0002
- 冠狀動脈造影基本知識-
- 油墨組成和分類
- DB37T 5175-2021 建筑與市政工程綠色施工技術標準
評論
0/150
提交評論