均值假設(shè)檢驗_第1頁
均值假設(shè)檢驗_第2頁
均值假設(shè)檢驗_第3頁
均值假設(shè)檢驗_第4頁
均值假設(shè)檢驗_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、均值假設(shè)檢驗第1頁,共55頁,2022年,5月20日,11點37分,星期二2 1 .假設(shè)檢驗的本質(zhì)The Nature of Hypothesis Testing第2頁,共55頁,2022年,5月20日,11點37分,星期二3假設(shè)(hypothesis)關(guān)于某事為真的陳述:每包xx餅干的平均重量與包裝袋上記載的454 g 不同排課時間影響選修統(tǒng)計學(xué)同學(xué)的成績表現(xiàn)姚明本周的表現(xiàn)是否失常一種新藥的臨床實驗表現(xiàn)要好到什么程度才能說它不是安慰劑第3頁,共55頁,2022年,5月20日,11點37分,星期二4然而統(tǒng)計假設(shè)實際上包含兩部分,零與備擇假設(shè) (Null and Alternative Hypo

2、theses)零假設(shè)(Null Hypotheses):被檢驗的假設(shè)。我們使用符號H0來表示零假設(shè)。H0: = 0備擇假設(shè)(Alternative Hypotheses):與零假設(shè)形成對立的假設(shè),使用符號 H0 或 H1 來表示對立假設(shè)。Ha : 0,雙側(cè),雙尾檢驗(two-tailed test)Ha : 0 ,右側(cè)(right-tailed test),單側(cè)或單尾檢驗(one-tailed test)Ha : 0 ,左側(cè)(left-tailed test),單側(cè)或單尾檢驗(one-tailed test)第4頁,共55頁,2022年,5月20日,11點37分,星期二5假設(shè)檢驗之邏輯(The

3、 Logic of Hypothesis Testing)先假設(shè)零假設(shè)為真,自總體取一隨機樣本,倘若樣本資料與零假設(shè)一致,則不拒絕零假設(shè);倘若樣本資料與零假設(shè)不一致(且其方向與備擇假設(shè)一致),則拒絕零假設(shè),并結(jié)論備擇假設(shè)為真。何謂與零假設(shè)(不)一致?-需訂出具體標(biāo)準(zhǔn)。有時我們也說接受零假設(shè),但這并不準(zhǔn)確。就像打官司的時候,我們說某人無罪,是應(yīng)為無法證明其有罪,不利于被告的證據(jù)不足以采信。所以,準(zhǔn)確的說法是無法拒絕零假設(shè)。第5頁,共55頁,2022年,5月20日,11點37分,星期二6樣本25袋脆餅中95.44%的平均重量落在的2個標(biāo)準(zhǔn)差(3.12g)之間。第6頁,共55頁,2022年,5月20

4、日,11點37分,星期二7(a)拒絕零假設(shè)的訣策準(zhǔn)則;(b) 若零假設(shè)為真,將拒絕零假設(shè)的訣策準(zhǔn)則套上 的正態(tài)曲線。第7頁,共55頁,2022年,5月20日,11點37分,星期二8圖示樣本平均數(shù)(450g)距離零假設(shè)中的總體平均數(shù)(454g)的相對位置(以標(biāo)準(zhǔn)差為單位)。第8頁,共55頁,2022年,5月20日,11點37分,星期二92 .專有名詞,誤差及假設(shè)Terms, Errors, and Hypotheses第9頁,共55頁,2022年,5月20日,11點37分,星期二10檢驗統(tǒng)計量,拒絕區(qū),非拒絕區(qū),臨界值(Test Statistic, Rejection Region, Nonr

5、ejection Region, Critical Values)檢驗統(tǒng)計量(Test Statistic):為了檢驗是否拒絕零假設(shè)時所計算的統(tǒng)計數(shù)。拒絕區(qū)(Rejection Region):可以拒絕零假設(shè)的檢驗統(tǒng)計量之區(qū)間。非拒絕區(qū)(Nonrejection Region):無法拒絕零假設(shè)的檢驗統(tǒng)計量之區(qū)間。臨界值(Critical Values):區(qū)隔拒絕區(qū)與非拒絕區(qū)的檢驗統(tǒng)計量之值。臨界值被視為拒絕區(qū)的一部分。第10頁,共55頁,2022年,5月20日,11點37分,星期二11第11頁,共55頁,2022年,5月20日,11點37分,星期二12圖示雙尾拒絕區(qū)、左尾拒絕區(qū)及右尾拒絕區(qū)。第

6、12頁,共55頁,2022年,5月20日,11點37分,星期二13 3 .當(dāng)已知,一個總體平均數(shù)的假設(shè)檢驗Hypotheses Tests for One Population Mean When is Known第13頁,共55頁,2022年,5月20日,11點37分,星期二14取得臨界值(Obtaining Critical Values)若假設(shè)檢驗依照顯著性水平來進行,則所選取的臨界值應(yīng)可滿足,若零假設(shè)為真,檢驗統(tǒng)計量落入拒絕區(qū)的機率為。第14頁,共55頁,2022年,5月20日,11點37分,星期二15當(dāng)該檢驗為:(a)雙尾,(b)左尾,(c)右尾,則假設(shè)檢驗在顯著性水平下的臨界值位置

7、。 常用的 z:第15頁,共55頁,2022年,5月20日,11點37分,星期二16總體平均數(shù)的單一樣本Z檢驗(臨界值法)(The One-Sample z-Test for a Population Mean (Critical-Value Approach )假設(shè):正態(tài)總體或大樣本。已知。步驟一:零假設(shè)為H0 : = 0 ,備擇假設(shè)為或 或(雙側(cè)) (左側(cè)) (右側(cè))步驟二:決定顯著性水平。第16頁,共55頁,2022年,5月20日,11點37分,星期二17步驟三:計算檢驗統(tǒng)計量步驟四:臨界值為 或 或 (雙尾) (左尾) (右尾)使用表A-5找出臨界值。第17頁,共55頁,2022年,5

8、月20日,11點37分,星期二18步驟五:若此統(tǒng)計檢驗量的值落在拒絕區(qū)內(nèi),則拒絕H0;反之,則無法拒絕H0 。步驟六:解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的,在非正態(tài)總體中的大樣本中則是趨近于正確的。Statistical vs. practical significance第18頁,共55頁,2022年,5月20日,11點37分,星期二19使用z檢驗的時機(When to Use the z-Test)小型樣本(樣本小于15):z檢驗只能用于當(dāng)總體為正態(tài)分布或非常趨近正態(tài)時。中型樣本(樣本介于1530):除了資料當(dāng)中有離散值或者總體分布嚴(yán)重偏離正態(tài)分布之外,可以使用z檢驗。大型樣

9、本(樣本大于30):在z檢驗的基本使用上并無限制。然而,若離散值存在且無正當(dāng)理由將之移除,則應(yīng)檢驗離散值的影響。我們需各做一次包含與不含離散值的假設(shè)檢驗,若這兩者的結(jié)論相同,則可以接受此一結(jié)論;否則應(yīng)采用不同的統(tǒng)計方法或取另一個樣本。若有正當(dāng)理由移除離散值,則可以使用此z檢驗法。第19頁,共55頁,2022年,5月20日,11點37分,星期二20P值P-Values第20頁,共55頁,2022年,5月20日,11點37分,星期二21若零假設(shè)H0為真,得到檢驗統(tǒng)計量的值等于目前的值或比之更極端的機率。稱為P值(p-value),observed significance level,probab

10、ility value。P值越小,越支持備擇假設(shè),也就是備擇假設(shè)成立的證據(jù)越強。第21頁,共55頁,2022年,5月20日,11點37分,星期二22當(dāng)檢驗為(a)雙尾;(b)左尾;(c)右尾時,Z檢驗的P值。第22頁,共55頁,2022年,5月20日,11點37分,星期二23P值代表觀測到的顯著性水平(observed significance level)假設(shè)檢驗的P值等于可以拒絕零假設(shè)的最小顯著性水平,那就是說,得以讓目前樣本資料拒絕H0的最低最小顯著性水平。第23頁,共55頁,2022年,5月20日,11點37分,星期二24使用P值作為假設(shè)檢驗的臨界值(Decision Criterio

11、n for a Hypothesis Test Using the P-Value)若P值小于或等于顯著性水平時,拒絕零假設(shè);反之,則不拒絕零假設(shè)。第24頁,共55頁,2022年,5月20日,11點37分,星期二25總體平均數(shù)的單一樣本Z檢驗(P值法)(The One-Sample z-Test for a Population Mean (P-Value Approach )假設(shè):正態(tài)總體或大樣本。已知。步驟一:零假設(shè)為H0 : = 0 ,備擇假設(shè)為或 或(雙側(cè)) (左側(cè)) (右側(cè))步驟二:確定顯著水平。第25頁,共55頁,2022年,5月20日,11點37分,星期二26步驟三:計算檢驗統(tǒng)計

12、量并標(biāo)記為z0。步驟四:臨界值為 或 或 (雙尾) (左尾) (右尾)使用表A-5找出臨界值。第26頁,共55頁,2022年,5月20日,11點37分,星期二27步驟五:若P,則拒絕H0;反之,無法拒絕H0 。步驟六:解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的,在非正態(tài)總體中的大樣本里則是趨近于正確的。第27頁,共55頁,2022年,5月20日,11點37分,星期二28臨界值法 vs. p值法臨界值法P值法步驟一:寫出零假設(shè)及備擇假設(shè)步驟一:寫出零假設(shè)及備擇假設(shè)步驟二:確定顯著性水平,步驟二:確定顯著性水平,步驟三:計算統(tǒng)計檢驗數(shù)的值步驟三:計算統(tǒng)計檢驗數(shù)的值步驟四:計算臨界值步驟四:

13、計算P值步驟五:若此統(tǒng)計檢驗數(shù)的值落入拒絕區(qū),拒絕H0;反之,則不拒絕H0步驟五:若P,拒絕H0;反之,則不拒絕H0步驟六:解釋假設(shè)檢驗的結(jié)果步驟六:解釋假設(shè)檢驗的結(jié)果第28頁,共55頁,2022年,5月20日,11點37分,星期二29當(dāng)未知,一個總體平均數(shù)的假設(shè)檢驗Hypotheses Tests for One Population Mean When is Unknown第29頁,共55頁,2022年,5月20日,11點37分,星期二30當(dāng)檢驗為(a)雙尾;(b)左尾;(c)右尾時,t檢驗的P值。但由于t-table不夠詳盡,t檢驗的p值只能以區(qū)間表示(可用統(tǒng)計軟件獲得確切值)第30頁,

14、共55頁,2022年,5月20日,11點37分,星期二31以樣本大小為12及統(tǒng)計檢驗值t = -1.938,來估計左尾t檢驗的P值。第31頁,共55頁,2022年,5月20日,11點37分,星期二32以樣本大小為25及統(tǒng)計檢驗值t=-0.895,來估計雙尾t檢驗的P值。第32頁,共55頁,2022年,5月20日,11點37分,星期二33總體平均數(shù)的單一樣本t檢驗(臨界值法)(The One-Sample t-Test for a Population Mean (Critical-Value Approach )假設(shè):正態(tài)總體/大樣本。未知。步驟一:零假設(shè)為H0 : = 0 ,備擇假設(shè)為或 或

15、(雙側(cè)) (左側(cè)) (右側(cè))步驟二:確定顯著水平。第33頁,共55頁,2022年,5月20日,11點37分,星期二34步驟三:計算檢驗統(tǒng)計量步驟四:臨界值為 或 或 (雙尾) (左尾) (右尾)使用表A-6找出臨界值。第34頁,共55頁,2022年,5月20日,11點37分,星期二35步驟五:若此統(tǒng)計檢驗量的值落在拒絕區(qū)內(nèi),則拒絕H0;反之,則無法拒絕H0 。步驟六:解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的,在非正態(tài)總體中的大樣本里則是趨近于正確的。第35頁,共55頁,2022年,5月20日,11點37分,星期二36總體平均數(shù)的單一樣本t檢驗(P值法)(The One-Sample

16、t-Test for a Population Mean (P-Value Approach )假設(shè):正態(tài)總體/大樣本。未知。步驟一:零假設(shè)為H0 : = 0 ,備擇假設(shè)為或 或(雙側(cè)) (左側(cè)) (右側(cè))步驟二:確定顯著性水平。第36頁,共55頁,2022年,5月20日,11點37分,星期二37步驟三:計算檢驗統(tǒng)計量并標(biāo)記為t0。步驟四:臨界值為 或 或 (雙尾) (左尾) (右尾)使用表A-6找出臨界值。第37頁,共55頁,2022年,5月20日,11點37分,星期二38步驟五:若P,則拒絕H0;反之,無法拒絕H0 。步驟六:解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的,在非正態(tài)總體

17、中的大樣本里則是趨近于正確的。第38頁,共55頁,2022年,5月20日,11點37分,星期二397 .應(yīng)該選用何種方法?Which Procedure Should be Used?第39頁,共55頁,2022年,5月20日,11點37分,星期二40類型假設(shè)統(tǒng)計檢驗數(shù)z檢驗1.正態(tài)分布或大樣本2.已知t檢驗1.正態(tài)分布/小樣本2.未知自由度=(n-1)W檢驗對稱總體W=絕對值排序后,符號為+的加總第40頁,共55頁,2022年,5月20日,11點37分,星期二41第41頁,共55頁,2022年,5月20日,11點37分,星期二42對稱總體?開始正態(tài)總體?大樣本?與統(tǒng)計員討論標(biāo)準(zhǔn)差已知?使用單

18、一樣本 z檢驗使用單一樣本 t檢驗使用 Wilcoxon Signed-Rank檢驗是是是是否否否否第42頁,共55頁,2022年,5月20日,11點37分,星期二Alpha 越大,檢驗越有說服力?43第43頁,共55頁,2022年,5月20日,11點37分,星期二44第一型錯誤及第二型錯誤(Type and Type Errors)第一類型錯誤(Type Error):當(dāng)零假設(shè)為真時,錯誤地拒絕零假設(shè)。佘祥林案第二類型錯誤(Type Error):當(dāng)零假設(shè)為偽時,錯誤地沒有拒絕零假設(shè)。辛普森案Type I & II error第44頁,共55頁,2022年,5月20日,11點37分,星期二4

19、5顯著水平(Significance Level)發(fā)生第類型錯誤的機率為,意即在零假設(shè)正確時拒絕零假設(shè)的機率。也是假設(shè)檢驗時的顯著水平(Significance Level)。發(fā)生第類型錯誤的機率,則為。第45頁,共55頁,2022年,5月20日,11點37分,星期二46第與第類型錯誤機率之間的關(guān)系(Relation Between Type and Type Error Probabilities)理想上,假設(shè)檢驗時第一類型與第二類型錯誤的機率都應(yīng)越低越好,但是.樣本大小固定時,當(dāng)顯著水平越小時,(虛無假設(shè)為偽時,未拒絕虛無假設(shè)的機率)越大。為什么?令可錯殺三千,不可放走一人?第46頁,共55頁,2022年,5月20日,11點37分,星期二47假設(shè)檢驗可能的結(jié)論(Possible Conclusion for a Hypothesis Test)若零假設(shè)被拒絕,我們下結(jié)論:備擇假設(shè)是正確的。若零假設(shè)不被拒絕,我們下結(jié)論:這些資料無法提供足夠的證據(jù)來支持備擇假設(shè)。第47頁,共55頁,2022年,5月20日,11點37分,星期二48 犯第類型錯誤的機率;統(tǒng)計功效Type Error Probabilities; Power第48頁,共55頁,2022年,5月20日,11點37分,星期二49小問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論