均值假設(shè)檢驗

上傳人：農(nóng)*** IP屬地：廣東上傳時間：2022-09-23 格式：PPT 頁數(shù)：55 大?。?.44MB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩50頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、均值假設(shè)檢驗第1頁，共55頁，2022年，5月20日，11點37分，星期二2 1 .假設(shè)檢驗的本質(zhì)The Nature of Hypothesis Testing第2頁，共55頁，2022年，5月20日，11點37分，星期二3假設(shè)（hypothesis）關(guān)于某事為真的陳述：每包xx餅干的平均重量與包裝袋上記載的454 g 不同排課時間影響選修統(tǒng)計學(xué)同學(xué)的成績表現(xiàn)姚明本周的表現(xiàn)是否失常一種新藥的臨床實驗表現(xiàn)要好到什么程度才能說它不是安慰劑第3頁，共55頁，2022年，5月20日，11點37分，星期二4然而統(tǒng)計假設(shè)實際上包含兩部分，零與備擇假設(shè) (Null and Alternative Hypo

2、theses）零假設(shè)（Null Hypotheses）：被檢驗的假設(shè)。我們使用符號H0來表示零假設(shè)。H0: = 0備擇假設(shè)（Alternative Hypotheses）：與零假設(shè)形成對立的假設(shè)，使用符號 H0 或 H1 來表示對立假設(shè)。Ha : 0，雙側(cè)，雙尾檢驗（two-tailed test）Ha : 0 ，右側(cè)（right-tailed test），單側(cè)或單尾檢驗（one-tailed test）Ha : 0 ，左側(cè)（left-tailed test），單側(cè)或單尾檢驗（one-tailed test）第4頁，共55頁，2022年，5月20日，11點37分，星期二5假設(shè)檢驗之邏輯（The

3、 Logic of Hypothesis Testing）先假設(shè)零假設(shè)為真，自總體取一隨機樣本，倘若樣本資料與零假設(shè)一致，則不拒絕零假設(shè)；倘若樣本資料與零假設(shè)不一致（且其方向與備擇假設(shè)一致），則拒絕零假設(shè)，并結(jié)論備擇假設(shè)為真。何謂與零假設(shè)（不）一致？-需訂出具體標(biāo)準(zhǔn)。有時我們也說接受零假設(shè)，但這并不準(zhǔn)確。就像打官司的時候，我們說某人無罪，是應(yīng)為無法證明其有罪，不利于被告的證據(jù)不足以采信。所以，準(zhǔn)確的說法是無法拒絕零假設(shè)。第5頁，共55頁，2022年，5月20日，11點37分，星期二6樣本25袋脆餅中95.44%的平均重量落在的2個標(biāo)準(zhǔn)差（3.12g）之間。第6頁，共55頁，2022年，5月20

4、日，11點37分，星期二7(a)拒絕零假設(shè)的訣策準(zhǔn)則；(b) 若零假設(shè)為真，將拒絕零假設(shè)的訣策準(zhǔn)則套上的正態(tài)曲線。第7頁，共55頁，2022年，5月20日，11點37分，星期二8圖示樣本平均數(shù)（450g）距離零假設(shè)中的總體平均數(shù)（454g）的相對位置（以標(biāo)準(zhǔn)差為單位）。第8頁，共55頁，2022年，5月20日，11點37分，星期二92 .專有名詞，誤差及假設(shè)Terms, Errors, and Hypotheses第9頁，共55頁，2022年，5月20日，11點37分，星期二10檢驗統(tǒng)計量，拒絕區(qū)，非拒絕區(qū)，臨界值（Test Statistic, Rejection Region, Nonr

5、ejection Region, Critical Values）檢驗統(tǒng)計量（Test Statistic）：為了檢驗是否拒絕零假設(shè)時所計算的統(tǒng)計數(shù)。拒絕區(qū)（Rejection Region）：可以拒絕零假設(shè)的檢驗統(tǒng)計量之區(qū)間。非拒絕區(qū)（Nonrejection Region）：無法拒絕零假設(shè)的檢驗統(tǒng)計量之區(qū)間。臨界值（Critical Values）：區(qū)隔拒絕區(qū)與非拒絕區(qū)的檢驗統(tǒng)計量之值。臨界值被視為拒絕區(qū)的一部分。第10頁，共55頁，2022年，5月20日，11點37分，星期二11第11頁，共55頁，2022年，5月20日，11點37分，星期二12圖示雙尾拒絕區(qū)、左尾拒絕區(qū)及右尾拒絕區(qū)。第

6、12頁，共55頁，2022年，5月20日，11點37分，星期二13 3 .當(dāng)已知，一個總體平均數(shù)的假設(shè)檢驗Hypotheses Tests for One Population Mean When is Known第13頁，共55頁，2022年，5月20日，11點37分，星期二14取得臨界值（Obtaining Critical Values）若假設(shè)檢驗依照顯著性水平來進行，則所選取的臨界值應(yīng)可滿足，若零假設(shè)為真，檢驗統(tǒng)計量落入拒絕區(qū)的機率為。第14頁，共55頁，2022年，5月20日，11點37分，星期二15當(dāng)該檢驗為：(a)雙尾，(b)左尾，(c)右尾，則假設(shè)檢驗在顯著性水平下的臨界值位置

7、。常用的 z:第15頁，共55頁，2022年，5月20日，11點37分，星期二16總體平均數(shù)的單一樣本Z檢驗（臨界值法）（The One-Sample z-Test for a Population Mean （Critical-Value Approach ）假設(shè)：正態(tài)總體或大樣本。已知。步驟一：零假設(shè)為H0 ： = 0 ，備擇假設(shè)為或或（雙側(cè)）（左側(cè)）（右側(cè)）步驟二：決定顯著性水平。第16頁，共55頁，2022年，5月20日，11點37分，星期二17步驟三：計算檢驗統(tǒng)計量步驟四：臨界值為或或（雙尾）（左尾）（右尾）使用表A-5找出臨界值。第17頁，共55頁，2022年，5

8、月20日，11點37分，星期二18步驟五：若此統(tǒng)計檢驗量的值落在拒絕區(qū)內(nèi)，則拒絕H0；反之，則無法拒絕H0 。步驟六：解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的，在非正態(tài)總體中的大樣本中則是趨近于正確的。Statistical vs. practical significance第18頁，共55頁，2022年，5月20日，11點37分，星期二19使用z檢驗的時機（When to Use the z-Test）小型樣本（樣本小于15）：z檢驗只能用于當(dāng)總體為正態(tài)分布或非常趨近正態(tài)時。中型樣本（樣本介于1530）：除了資料當(dāng)中有離散值或者總體分布嚴(yán)重偏離正態(tài)分布之外，可以使用z檢驗。大型樣

9、本（樣本大于30）：在z檢驗的基本使用上并無限制。然而，若離散值存在且無正當(dāng)理由將之移除，則應(yīng)檢驗離散值的影響。我們需各做一次包含與不含離散值的假設(shè)檢驗，若這兩者的結(jié)論相同，則可以接受此一結(jié)論；否則應(yīng)采用不同的統(tǒng)計方法或取另一個樣本。若有正當(dāng)理由移除離散值，則可以使用此z檢驗法。第19頁，共55頁，2022年，5月20日，11點37分，星期二20P值P-Values第20頁，共55頁，2022年，5月20日，11點37分，星期二21若零假設(shè)H0為真，得到檢驗統(tǒng)計量的值等于目前的值或比之更極端的機率。稱為P值（p-value），observed significance level，probab

10、ility value。P值越小，越支持備擇假設(shè)，也就是備擇假設(shè)成立的證據(jù)越強。第21頁，共55頁，2022年，5月20日，11點37分，星期二22當(dāng)檢驗為(a)雙尾；(b)左尾；(c)右尾時，Z檢驗的P值。第22頁，共55頁，2022年，5月20日，11點37分，星期二23P值代表觀測到的顯著性水平（observed significance level）假設(shè)檢驗的P值等于可以拒絕零假設(shè)的最小顯著性水平，那就是說，得以讓目前樣本資料拒絕H0的最低最小顯著性水平。第23頁，共55頁，2022年，5月20日，11點37分，星期二24使用P值作為假設(shè)檢驗的臨界值（Decision Criterio

11、n for a Hypothesis Test Using the P-Value）若P值小于或等于顯著性水平時，拒絕零假設(shè)；反之，則不拒絕零假設(shè)。第24頁，共55頁，2022年，5月20日，11點37分，星期二25總體平均數(shù)的單一樣本Z檢驗（P值法）（The One-Sample z-Test for a Population Mean （P-Value Approach ）假設(shè)：正態(tài)總體或大樣本。已知。步驟一：零假設(shè)為H0 ： = 0 ，備擇假設(shè)為或或（雙側(cè)）（左側(cè)）（右側(cè)）步驟二：確定顯著水平。第25頁，共55頁，2022年，5月20日，11點37分，星期二26步驟三：計算檢驗統(tǒng)計

12、量并標(biāo)記為z0。步驟四：臨界值為或或（雙尾）（左尾）（右尾）使用表A-5找出臨界值。第26頁，共55頁，2022年，5月20日，11點37分，星期二27步驟五：若P，則拒絕H0；反之，無法拒絕H0 。步驟六：解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的，在非正態(tài)總體中的大樣本里則是趨近于正確的。第27頁，共55頁，2022年，5月20日，11點37分，星期二28臨界值法 vs. p值法臨界值法P值法步驟一：寫出零假設(shè)及備擇假設(shè)步驟一：寫出零假設(shè)及備擇假設(shè)步驟二：確定顯著性水平，步驟二：確定顯著性水平，步驟三：計算統(tǒng)計檢驗數(shù)的值步驟三：計算統(tǒng)計檢驗數(shù)的值步驟四：計算臨界值步驟四：

13、計算P值步驟五：若此統(tǒng)計檢驗數(shù)的值落入拒絕區(qū)，拒絕H0；反之，則不拒絕H0步驟五：若P，拒絕H0；反之，則不拒絕H0步驟六：解釋假設(shè)檢驗的結(jié)果步驟六：解釋假設(shè)檢驗的結(jié)果第28頁，共55頁，2022年，5月20日，11點37分，星期二29當(dāng)未知，一個總體平均數(shù)的假設(shè)檢驗Hypotheses Tests for One Population Mean When is Unknown第29頁，共55頁，2022年，5月20日，11點37分，星期二30當(dāng)檢驗為(a)雙尾；(b)左尾；(c)右尾時，t檢驗的P值。但由于t-table不夠詳盡，t檢驗的p值只能以區(qū)間表示（可用統(tǒng)計軟件獲得確切值）第30頁，

14、共55頁，2022年，5月20日，11點37分，星期二31以樣本大小為12及統(tǒng)計檢驗值t = -1.938，來估計左尾t檢驗的P值。第31頁，共55頁，2022年，5月20日，11點37分，星期二32以樣本大小為25及統(tǒng)計檢驗值t=-0.895，來估計雙尾t檢驗的P值。第32頁，共55頁，2022年，5月20日，11點37分，星期二33總體平均數(shù)的單一樣本t檢驗（臨界值法）（The One-Sample t-Test for a Population Mean （Critical-Value Approach ）假設(shè)：正態(tài)總體/大樣本。未知。步驟一：零假設(shè)為H0 ： = 0 ，備擇假設(shè)為或或

15、（雙側(cè)）（左側(cè)）（右側(cè)）步驟二：確定顯著水平。第33頁，共55頁，2022年，5月20日，11點37分，星期二34步驟三：計算檢驗統(tǒng)計量步驟四：臨界值為或或（雙尾）（左尾）（右尾）使用表A-6找出臨界值。第34頁，共55頁，2022年，5月20日，11點37分，星期二35步驟五：若此統(tǒng)計檢驗量的值落在拒絕區(qū)內(nèi)，則拒絕H0；反之，則無法拒絕H0 。步驟六：解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的，在非正態(tài)總體中的大樣本里則是趨近于正確的。第35頁，共55頁，2022年，5月20日，11點37分，星期二36總體平均數(shù)的單一樣本t檢驗（P值法）（The One-Sample

16、t-Test for a Population Mean （P-Value Approach ）假設(shè)：正態(tài)總體/大樣本。未知。步驟一：零假設(shè)為H0 ： = 0 ，備擇假設(shè)為或或（雙側(cè)）（左側(cè)）（右側(cè)）步驟二：確定顯著性水平。第36頁，共55頁，2022年，5月20日，11點37分，星期二37步驟三：計算檢驗統(tǒng)計量并標(biāo)記為t0。步驟四：臨界值為或或（雙尾）（左尾）（右尾）使用表A-6找出臨界值。第37頁，共55頁，2022年，5月20日，11點37分，星期二38步驟五：若P，則拒絕H0；反之，無法拒絕H0 。步驟六：解釋此假設(shè)檢驗的結(jié)果。此假設(shè)檢驗在正態(tài)總體是精確的，在非正態(tài)總體

17、中的大樣本里則是趨近于正確的。第38頁，共55頁，2022年，5月20日，11點37分，星期二397 .應(yīng)該選用何種方法？Which Procedure Should be Used？第39頁，共55頁，2022年，5月20日，11點37分，星期二40類型假設(shè)統(tǒng)計檢驗數(shù)z檢驗1.正態(tài)分布或大樣本2.已知t檢驗1.正態(tài)分布/小樣本2.未知自由度=（n-1）W檢驗對稱總體W=絕對值排序后，符號為+的加總第40頁，共55頁，2022年，5月20日，11點37分，星期二41第41頁，共55頁，2022年，5月20日，11點37分，星期二42對稱總體？開始正態(tài)總體？大樣本？與統(tǒng)計員討論標(biāo)準(zhǔn)差已知？使用單

18、一樣本 z檢驗使用單一樣本 t檢驗使用 Wilcoxon Signed-Rank檢驗是是是是否否否否第42頁，共55頁，2022年，5月20日，11點37分，星期二Alpha 越大，檢驗越有說服力？43第43頁，共55頁，2022年，5月20日，11點37分，星期二44第一型錯誤及第二型錯誤（Type and Type Errors）第一類型錯誤（Type Error）：當(dāng)零假設(shè)為真時，錯誤地拒絕零假設(shè)。佘祥林案第二類型錯誤（Type Error）：當(dāng)零假設(shè)為偽時，錯誤地沒有拒絕零假設(shè)。辛普森案Type I & II error第44頁，共55頁，2022年，5月20日，11點37分，星期二4

19、5顯著水平（Significance Level）發(fā)生第類型錯誤的機率為，意即在零假設(shè)正確時拒絕零假設(shè)的機率。也是假設(shè)檢驗時的顯著水平（Significance Level)。發(fā)生第類型錯誤的機率，則為。第45頁，共55頁，2022年，5月20日，11點37分，星期二46第與第類型錯誤機率之間的關(guān)系（Relation Between Type and Type Error Probabilities）理想上，假設(shè)檢驗時第一類型與第二類型錯誤的機率都應(yīng)越低越好，但是.樣本大小固定時，當(dāng)顯著水平越小時，（虛無假設(shè)為偽時，未拒絕虛無假設(shè)的機率）越大。為什么？令可錯殺三千，不可放走一人？第46頁，共55頁，2022年，5月20日，11點37分，星期二47假設(shè)檢驗可能的結(jié)論（Possible Conclusion for a Hypothesis Test）若零假設(shè)被拒絕，我們下結(jié)論：備擇假設(shè)是正確的。若零假設(shè)不被拒絕，我們下結(jié)論：這些資料無法提供足夠的證據(jù)來支持備擇假設(shè)。第47頁，共55頁，2022年，5月20日，11點37分，星期二48 犯第類型錯誤的機率；統(tǒng)計功效Type Error Probabilities; Power第48頁，共55頁，2022年，5月20日，11點37分，星期二49小問

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

均值假設(shè)檢驗

文檔簡介

溫馨提示

最新文檔

評論

均值假設(shè)檢驗

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔