第七章-假設(shè)檢驗(yàn).ppt_第1頁
第七章-假設(shè)檢驗(yàn).ppt_第2頁
第七章-假設(shè)檢驗(yàn).ppt_第3頁
第七章-假設(shè)檢驗(yàn).ppt_第4頁
第七章-假設(shè)檢驗(yàn).ppt_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余82頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第七章假設(shè)檢驗(yàn),宋沈超,假設(shè)檢驗(yàn)在統(tǒng)計(jì)方法中的地位,參數(shù)估計(jì)和假設(shè)檢驗(yàn),參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,都是利用樣本對總體進(jìn)行某種推斷,但推斷的角度不同。 參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法。 假設(shè)檢驗(yàn)討論的是用樣本信息去檢驗(yàn)對總體參數(shù)的某種假設(shè)是否成立的程序和方法。,教學(xué)內(nèi)容,第一節(jié) 假設(shè)檢驗(yàn)基本思想 第二節(jié) 假設(shè)檢驗(yàn)基本步驟 第三節(jié) I型錯(cuò)誤與II型錯(cuò)誤 第四節(jié) 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn) 第五節(jié) 假設(shè)檢驗(yàn)需要注意的問題 第六節(jié) 假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系,教學(xué)目標(biāo),掌握:假設(shè)檢驗(yàn)的基本思想和基本步驟,掌握并理解I型錯(cuò)誤與II型錯(cuò)誤、檢驗(yàn)效能的概念 熟悉:假設(shè)檢驗(yàn)需要注意的問

2、題,單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)的概念和正確選擇;理解假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系。,第一節(jié) 假設(shè)檢驗(yàn)基本思想,一、 假設(shè)檢驗(yàn)問題的提出 例1 已知一個(gè)暗箱中有100個(gè)白色與黑色球,不知各有多少個(gè)。現(xiàn)有人猜測其中有95個(gè)白色球,是否能相信他的猜測呢?,他相當(dāng)于提出假設(shè): p=P(A)=0.05,A=任取一球是黑球.,可有兩種解釋:,現(xiàn)隨機(jī)從中抽出一個(gè)球, 發(fā)現(xiàn)是黑球, 怎樣 解釋這一事實(shí)?,1)他的猜測是正確的,恰抽得黑球是隨機(jī)性 所致;,2)他的猜測錯(cuò)了.,應(yīng)接受哪一種呢?,根據(jù)小概率事件原理, 事件A(黑球)的發(fā)生不能不使人們懷疑他的猜測,更傾向于認(rèn)為箱中白球個(gè)數(shù)不是95個(gè).,例2 某醫(yī)院用新藥與常規(guī)藥

3、物治療嬰幼兒貧血,將20名貧血患兒隨機(jī)等分兩組,分別接受兩種藥物治療,測得血紅蛋白增加量(g/L)見表7-1。問新藥與常規(guī)藥的療效有無差別? 表7-1 兩種藥物治療嬰幼兒貧血結(jié)果 治療藥物 血紅蛋白增加量(g/L) 新藥組24 36 25 14 26 34 23 20 15 19 常規(guī)藥組14 18 20 15 22 24 21 25 27 23,由于事先對兩種藥品療效(總體)情況一無所知,目前所關(guān)心的問題是如何根據(jù)兩組樣本患者治療后血紅蛋白增加量推斷兩種藥品的療效有無差異。可假設(shè)兩組患者(總體)治療后血紅蛋白平均增加量無差異,即假設(shè) 然后,利用兩組樣本患者治療后血紅蛋白平均增加量來檢驗(yàn)這一假

4、設(shè)是否正確。,例3:根據(jù)1989年的統(tǒng)計(jì)資料,某地女性新生兒的平均體重為3190克。1990年從該地女性新生兒中隨機(jī)抽取30人,測得其平均體重為3210克。從樣本數(shù)據(jù)看,1990年女新生兒體重比1989年略高。究竟是否存在顯著差異? 差異產(chǎn)生的兩種可能(假設(shè)): 隨機(jī)誤差導(dǎo)致的差異: 生活水平提高使孕婦營養(yǎng)狀況改善導(dǎo)致新生兒體重實(shí)質(zhì)性增加: 利用樣本信息檢驗(yàn)假設(shè)能否成立的過程稱為假設(shè)檢驗(yàn)。,上述案例的共同特點(diǎn)是:樣本統(tǒng)計(jì)量與總體參數(shù)之間,或不同組樣本統(tǒng)計(jì)量之間出現(xiàn)差異,這就提出了需要解決的問題:差異產(chǎn)生的原因(假設(shè))?由兩種誤差導(dǎo)致: 由隨機(jī)誤差導(dǎo)致樣本來自同一總體, 非本質(zhì)差異 不是隨機(jī)誤差

5、導(dǎo)致樣本來自另一總體, 本質(zhì)差異 用樣本信息檢驗(yàn)(推斷)上述假設(shè)哪個(gè)正確?,統(tǒng)計(jì)假設(shè),假設(shè)檢驗(yàn),如何正確區(qū)分這兩種誤差, 是解決問題的關(guān)鍵。,假設(shè)檢驗(yàn)就是處理這一類 問題的一種科學(xué)方法 它所根據(jù)的原理是小概率原理。,二、小概率原理,假設(shè)檢驗(yàn)所依據(jù)的基本原理是小概率原理。 什么是小概率? 概率是01之間的一個(gè)數(shù),因此小概率就是接近0的一個(gè)數(shù),一般指概率在0.05以下的事件。 著名的英國統(tǒng)計(jì)家Ronald Fisher 把20分之1作為標(biāo)準(zhǔn),也就是0.05,從此0.05或比0.05小的概率都被認(rèn)為是小概率。Fisher沒有任何深?yuàn)W的理由解釋他為什么選擇0.05,只是說他忽然想起來的,什么是小概率原

6、理?,小概率原理發(fā)生概率很小的隨機(jī)事件(小概率事件)在一次實(shí)驗(yàn)中幾乎是不可能發(fā)生的。在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。 根據(jù)這一原理,可以先假設(shè)總體參數(shù)的某項(xiàng)取值為真,也就是假設(shè)其發(fā)生的可能性很大,然后抽取一個(gè)樣本進(jìn)行觀察,如果樣本信息顯示出現(xiàn)了與事先假設(shè)相反的結(jié)果且與原假設(shè)差別很大,則說明原來假定的小概率事件在一次實(shí)驗(yàn)中發(fā)生了,這是一個(gè)違背小概率原理的不合理現(xiàn)象,因此有理由懷疑和拒絕原假設(shè);否則不能拒絕原假設(shè)。 檢驗(yàn)中使用的小概率由研究者在檢驗(yàn)前事先確定。,小概率原理舉例:,某工廠質(zhì)檢部門規(guī)定該廠產(chǎn)品次品率不超過4方能出廠。今從1000件產(chǎn)品中抽出10件,經(jīng)檢驗(yàn)有4件次

7、品,問這批產(chǎn)品是否能出廠? 如果假設(shè)這批產(chǎn)品的次品率P4,則可計(jì)算事件“抽10件產(chǎn)品有4件次品”的出現(xiàn)概率為: 可見,概率是相當(dāng)小的,1萬次實(shí)驗(yàn)中可能出現(xiàn)4次,然而概率如此小的事件,在一次實(shí)驗(yàn)中居然發(fā)生了,這是不合理的,而不合理的根源在于假設(shè)這批產(chǎn)品次品率P4 ,因而認(rèn)為假設(shè)次品率P4是不能成立的,故按質(zhì)檢部門的規(guī)定,這批產(chǎn)品不能出廠。,又例 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L? 如果從事鉛作業(yè)不會(huì)影響工人的血紅蛋白含量,則說明樣本均數(shù)130.83g/L

8、與總體均數(shù)140g/L的差異是由抽樣誤差引起的,即=0=140g/L,鉛作業(yè)男性工人的平均血紅蛋白含量與正常成年男性的相等。,據(jù)此,可提出原假設(shè):H0: =0=140g/L 若原假設(shè)成立,事件 應(yīng)該是一個(gè)小概率事件(發(fā)生的概率為)。現(xiàn)在 |2.138| t0.05/2,35=2.030 P 0.05,這說明小概率事件在一次試驗(yàn)中發(fā)生了,而這一事件的概率僅為0.05,即平均每20次試驗(yàn)才出現(xiàn)一次現(xiàn)在我們只作了一次試驗(yàn),居然就發(fā)生了,因此我們有理由懷疑假設(shè) “鉛作業(yè)男性工人的平均血紅蛋白含量與正常成年男性的相等”的原假設(shè),即可認(rèn)為從事鉛作業(yè)會(huì)影響工人的血紅蛋白含量。,三、假設(shè)檢驗(yàn)的基本思想,假設(shè)樣

9、本是從原總體中抽取的,在此假設(shè)下構(gòu)造一個(gè)小概率事件。若假設(shè)成立,則小概率事件一般是不會(huì)發(fā)生的。但在一次抽樣中,如果小概率事件居然就發(fā)生了,則有理由懷疑假設(shè)的正確性,此時(shí)拒絕接受這個(gè)假設(shè);而一次抽樣中小概率事件沒有發(fā)生,則沒有理由懷疑假設(shè)的正確性,于是接受這個(gè)假設(shè),認(rèn)為樣本仍來源于原總體。,假設(shè)檢驗(yàn)的基本思想,. 因此我們拒絕假設(shè) 1=0= 50,樣本均值,m0,= 50,抽樣分布,H0,假設(shè)檢驗(yàn)的過程,通過上述實(shí)例可以看出,假設(shè)檢驗(yàn)的目的是推斷樣本統(tǒng)計(jì)量之差是由于總體參數(shù)存在差異造成的,抑或是由于抽樣誤差造成的。假設(shè)檢驗(yàn)的基本思想是在總體參數(shù)相等這一假設(shè)成立的前提下,計(jì)算出現(xiàn)等于及大于(或等于

10、及小于)現(xiàn)有樣本統(tǒng)計(jì)量的可能性(P值)。如果P值很小,小于等于事先規(guī)定的一個(gè)界值(例如5%),結(jié)論就是拒絕假設(shè)“總體參數(shù)相等”,認(rèn)為總體參數(shù)之間存在差異。如果P值大于事先規(guī)定的界值,就不能拒絕這個(gè)假設(shè),尚不能認(rèn)為總體參數(shù)之間存在差異。,假設(shè)檢驗(yàn)的兩個(gè)特點(diǎn):,第一,假設(shè)檢驗(yàn)采用邏輯上的反證法,即為了檢驗(yàn)一個(gè)假設(shè)是否成立,首先假設(shè)它是真的,然后對樣本進(jìn)行觀察,如果發(fā)現(xiàn)出現(xiàn)了不合理現(xiàn)象,則可以認(rèn)為假設(shè)是不合理的,拒絕假設(shè)。否則可以認(rèn)為假設(shè)是合理的,接受假設(shè)。,第二,假設(shè)檢驗(yàn)采用的反證法帶有概率性質(zhì)。所謂假設(shè)的不合理不是絕對的,而是基于實(shí)踐中廣泛采用的小概率事件幾乎不可能發(fā)生的原則。至于事件的概率小到

11、什么程度才算是小概率事件,并沒有統(tǒng)一的界定標(biāo)準(zhǔn),而是必須根據(jù)具體問題而定。 如果一旦判斷失誤,錯(cuò)誤地拒絕原假設(shè)會(huì)造成巨大損失,那么拒絕原假設(shè)的概率就應(yīng)定的小一些;如果一旦判斷失誤,錯(cuò)誤地接受原假設(shè)會(huì)造成巨大損失,那么拒絕原假設(shè)的概率就應(yīng)定的大一些。,小概率通常用表示,又稱為檢驗(yàn)的顯著性水平。通常取0.05或0.01,即把概率不超過0.05或0.01的事件當(dāng)作小概率事件。,第二節(jié) 假設(shè)檢驗(yàn)基本步驟,提出(建立)檢驗(yàn)假設(shè) 確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量 規(guī)定顯著性水平 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值 確定P值,作出統(tǒng)計(jì)推斷(決策),一、提出(建立)檢驗(yàn)假設(shè), 檢驗(yàn)假設(shè)分為原假設(shè)與備擇假設(shè),是根據(jù)問題的需要提出的一對對立

12、的假設(shè)。 什么是原假設(shè)?(null hypothesis) 是待檢驗(yàn)的假設(shè),又稱“零假設(shè)”、“無效假設(shè)”、“無差異假設(shè)”。 是研究者想收集證據(jù)予以反對的假設(shè) 3.總是有等號(hào) , 或 4.表示為 H0 H0: 某一數(shù)值 指定為 = 號(hào),即 或 例如, H0: 3190(克), 什么是備擇假設(shè)?(alternative hypothesis) 與原假設(shè)H0對立的假設(shè),也稱“研究假設(shè)” 研究者想收集證據(jù)予以支持的假設(shè),總是有不等號(hào): , 或 ;備擇假設(shè)的方向與想要證明其正確性的方向一致 表示為 H1 H1: 某一數(shù)值,或 某一數(shù)值 例如, H0:=3910(克),H1: 3910(克) H0:=0,

13、 H1: 0; H0:=0, H1: =1; H0:0, H1: 0;,一、提出(建立)檢驗(yàn)假設(shè),原假設(shè)和備擇假設(shè)的確定,(1)對于總體均值是否等于某一確定值的原假設(shè)可以表示為: H0: (如H0: 3190克) 其對應(yīng)的備擇假設(shè)則表示為: H1: (如H1: 3190克) (2)對于總體均值X是否大于某一確定值X0 的原假設(shè)可以表示為:H0:XX0 (如H0:X2000克) 其對應(yīng)的備擇假設(shè)則表示為: H1:XX0 (如H1: X 2000克) (3)對于總體均值X是否小于某一確定值X0的原假設(shè)可以表示為:H0:XX0 (如H0:X 5) 其對應(yīng)的備擇假設(shè)則表示為: H1:XX0 (如H1:

14、X5) 注意:原假設(shè)總是有等號(hào): 或 或。,原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對立 在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有一個(gè)成立,而且只有一個(gè)成立 先確定備擇假設(shè),再確定原假設(shè) 等號(hào)“=”總是放在原假設(shè)上 因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論),提出假設(shè) (結(jié)論與建議), 什么檢驗(yàn)統(tǒng)計(jì)量(test statistic) ? 1.根據(jù)樣本觀測結(jié)果計(jì)算得到的,并據(jù)以對原假設(shè)和備擇假設(shè)作出假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷的某個(gè)樣本統(tǒng)計(jì)量,如Z值、t值、F值、2值等。 2.選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知 檢驗(yàn)統(tǒng)計(jì)量的基本形式為,

15、二、確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量(選擇合適的檢驗(yàn)方法),三、規(guī)定顯著性水平(significant level), 什么是顯著性水平? 1.是一個(gè)概率值(小概率事件發(fā)生的概率值) 2.原假設(shè)為真時(shí),拒絕原假設(shè)的概率 被稱為抽樣分布的拒絕域 3.表示為 (alpha) 常用的 值有0.01, 0.05, 0.10 4.由研究者事先確定,假設(shè)檢驗(yàn)中的拒絕域和接受域,什么是拒絕域?(rejection region) 能夠拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的所有可能取值范圍 區(qū)域大小由顯著性水平?jīng)Q定 什么是臨界值?(critical value) 根據(jù)給定的顯著性水平確定的拒絕域的邊界值。臨界值將統(tǒng)計(jì)量的所有可能取值區(qū)

16、間分為兩個(gè)互不相交的部分,即原假設(shè)的拒絕域和接受域。 常用的 值有0.01, 0.05, 0.10 查表得出相應(yīng)的臨界值z或z/2, t或t/2 對于正態(tài)總體,總體均值的假設(shè)檢驗(yàn)可有如下圖示,正態(tài)總體,總體均值假設(shè)檢驗(yàn)圖示:(1) 雙側(cè)檢驗(yàn),設(shè)H0:XX0 , H1:XX0,有兩個(gè)臨界值,兩個(gè)拒絕域,每個(gè)拒絕域的面積為/2。也稱雙尾檢驗(yàn)。,雙側(cè)檢驗(yàn)示意圖,X0,雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計(jì)量,雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計(jì)量,雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計(jì)量,(2)單側(cè)檢驗(yàn)有

17、一個(gè)臨界值,一個(gè)拒絕域,拒絕域的面積為。分為左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)兩種情況。 單側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域),左側(cè)檢驗(yàn),設(shè)H0:XX0 ,H1:XX0;臨界值和拒絕域均在左側(cè)。也稱下限檢驗(yàn)。,X0,左側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),左側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計(jì)量,右側(cè)檢驗(yàn),設(shè)H0 :XX0 ,H1:XX0; 臨界值和拒絕域均在右側(cè)。也稱上限檢驗(yàn)。,X0,右側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),右側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),觀察到的樣本統(tǒng)計(jì)量,四、計(jì)算檢驗(yàn)統(tǒng)計(jì)量,根據(jù)選定的適宜檢驗(yàn)方法,計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量,如Z值、t值等。,五、確定P值,作出統(tǒng)計(jì)推

18、斷(決策),決策規(guī)則 給定顯著性水平,查表得出相應(yīng)的臨界值z或z/2, t 或 t/2 將檢驗(yàn)統(tǒng)計(jì)量的值與 水平的臨界值進(jìn)行比較 作出統(tǒng)計(jì)推斷(決策) 雙側(cè)檢驗(yàn):|統(tǒng)計(jì)量| 臨界值,拒絕H0 左側(cè)檢驗(yàn): 統(tǒng)計(jì)量 臨界值,拒絕H0 右側(cè)檢驗(yàn): 統(tǒng)計(jì)量 臨界值,拒絕H0,利用P值進(jìn)行決策,什么是P 值?(P-value),是一個(gè)概率值 如果原假設(shè)為真,P-值是抽樣分布中出現(xiàn)大于或小于樣本統(tǒng)計(jì)量的概率 左側(cè)檢驗(yàn)時(shí),P-值為曲線上方小于等于 檢驗(yàn)統(tǒng)計(jì)量部分的面積 右側(cè)檢驗(yàn)時(shí),P-值為曲線上方大于等于 檢驗(yàn)統(tǒng)計(jì)量部分的面積 被稱為觀察到的(或?qū)崪y的)顯著性水平 H0 能被拒絕的最小值,雙側(cè)檢驗(yàn)的P 值,

19、左側(cè)檢驗(yàn)的P 值,右側(cè)檢驗(yàn)的P 值,利用 P 值進(jìn)行檢驗(yàn)(決策準(zhǔn)則),單側(cè)檢驗(yàn) 若p-值 ,不拒絕 H0 若p-值 /2, 不拒絕 H0 若p /2 -值 /2, 拒絕 H0,假設(shè)檢驗(yàn)結(jié)論的表述,假設(shè)檢驗(yàn)的目的就在于試圖找到拒絕原假設(shè)的理由,而不在于證明什么是正確的 拒絕原假設(shè)時(shí)結(jié)論是清楚的 例如,H0:=3190,拒絕H0時(shí),我們可以說3190 當(dāng)不拒絕原假設(shè)時(shí) 并非肯定原假設(shè) 含義是 “不否定原假設(shè)” 或 “保留原假設(shè)” 例如,當(dāng)不拒絕H0:=3190,我們并未說它就是3190,但也未說它不是3190。我們只能說樣本提供的證據(jù)還不足以推翻原假設(shè),假設(shè)檢驗(yàn)結(jié)論的表述,報(bào)告結(jié)果時(shí),首先須給出檢

20、驗(yàn)統(tǒng)計(jì)量,如U值、t值、自由度、P值,然后報(bào)告是否拒絕H0,最后結(jié)合問題的具體背景給出專業(yè)結(jié)論。 拒絕原假設(shè)時(shí),表述為“差異有統(tǒng)計(jì)學(xué)意義”,簡稱“有統(tǒng)計(jì)學(xué)意義”。 不拒絕H0時(shí),表述為“差異無統(tǒng)計(jì)學(xué)意義”,簡稱“無統(tǒng)計(jì)學(xué)意義”,第三節(jié) I型錯(cuò)誤與II型錯(cuò)誤(決策風(fēng)險(xiǎn)),根據(jù)假設(shè)檢驗(yàn)做出判斷無非下述四種情況: 1、原假設(shè)真實(shí), 并接受原假設(shè),判斷正確; 2、原假設(shè)不真實(shí),且拒絕原假設(shè),判斷正確; 3、原假設(shè)真實(shí), 但拒絕原假設(shè),判斷錯(cuò)誤; 4、原假設(shè)不真實(shí),卻接受原假設(shè),判斷錯(cuò)誤。,假設(shè)檢驗(yàn)的兩類錯(cuò)誤,假設(shè)檢驗(yàn)是依據(jù)樣本提供的信息進(jìn)行判斷,有犯錯(cuò)誤的可能。所犯錯(cuò)誤有兩種類型: 第一類錯(cuò)誤是原假設(shè)

21、H0為真時(shí),檢驗(yàn)結(jié)果把它當(dāng)成不真而拒絕了。犯這種錯(cuò)誤的概率用表示,也稱作錯(cuò)誤(error)或棄真錯(cuò)誤。 第二類錯(cuò)誤是原假設(shè)H0不為真時(shí),檢驗(yàn)結(jié)果把它當(dāng)成真而接受了。犯這種錯(cuò)誤的概率用表示,也稱作錯(cuò)誤(error)或取偽錯(cuò)誤。,假設(shè)檢驗(yàn)的兩類錯(cuò)誤正確決策和犯錯(cuò)誤的概率可以歸納為下表:,假設(shè)檢驗(yàn)中各種可能結(jié)果的概率,假設(shè)檢驗(yàn)兩類錯(cuò)誤關(guān)系的圖示以單側(cè)上限檢驗(yàn)為例,設(shè)H0 :XX0 ,H1:XX0,從上圖可以看出,如果臨界值沿水平方向右移,將變小而變大,即若減小錯(cuò)誤,就會(huì)增大犯錯(cuò)誤的機(jī)會(huì);如果臨界值沿水平方向左移,將變大而變小,即若減小錯(cuò)誤,也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。,圖(a) XX0 H0為真 圖(b)

22、 XX1X0 H0為偽, 錯(cuò)誤和 錯(cuò)誤的關(guān)系,在樣本容量n一定的情況下,假設(shè)檢驗(yàn)不能同時(shí)做到犯和兩類錯(cuò)誤的概率都很小。若減小錯(cuò)誤,就會(huì)增大犯錯(cuò)誤的機(jī)會(huì);若減小錯(cuò)誤,也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。要使和同時(shí)變小只有增大樣本容量。但樣本容量增加要受人力、經(jīng)費(fèi)、時(shí)間等很多因素的限制,無限制增加樣本容量就會(huì)使抽樣調(diào)查失去意義。因此假設(shè)檢驗(yàn)需要慎重考慮對兩類錯(cuò)誤進(jìn)行控制的問題。,兩類錯(cuò)誤的控制準(zhǔn)則,假設(shè)檢驗(yàn)中人們普遍執(zhí)行同一準(zhǔn)則:首先控制棄真錯(cuò)誤(錯(cuò)誤)。假設(shè)檢驗(yàn)的基本法則以為顯著性水平就體現(xiàn)了這一原則。 兩個(gè)理由: 統(tǒng)計(jì)推斷中大家都遵循統(tǒng)一的準(zhǔn)則,討論問題會(huì)比較方便。 更重要的是: 原假設(shè)常常是明確的,而備擇

23、假設(shè)往往是模糊的。如H0:XX0很清楚, 而H1:XX0則不太清楚,是XX0還是XX0 ?大多少小多少都不清楚。對含義清晰的數(shù)量標(biāo)準(zhǔn)進(jìn)行檢驗(yàn)更容易被接受。 因此,第一類錯(cuò)誤成為控制兩類錯(cuò)誤的重點(diǎn)。,第四節(jié) 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn),根據(jù)假設(shè)的形式不同,假設(shè)檢驗(yàn)可以分為雙側(cè)假設(shè)檢驗(yàn)(two-tailed test) 和單側(cè)假設(shè)檢驗(yàn)(one-tailed test)。 若原假設(shè)是總體參數(shù)等于某一數(shù)值,如H0: X X0 ,即備擇假設(shè)H1: X X 0,那么只要X X 0和X X 0 二者中有一個(gè)成立,就可以否定原假設(shè)。這種假設(shè)檢驗(yàn)稱為雙側(cè)檢驗(yàn)。,例如,某研究試圖了解甲、乙兩地7歲男童身高是否有差異,該研

24、究只想證明(檢驗(yàn))這種差異是否存在,不在乎哪個(gè)地區(qū)7歲男童身高更高 建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: 1 = 2 H1: 1 2,雙側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),若原假設(shè)是總體參數(shù)大于等于或小于等于某一數(shù)值,如H0: X X 0 (即H1:XX0);或H0 :XX0 (即H1:XX0),那么對于前者當(dāng)XX0時(shí),對于后者當(dāng)XX0 時(shí),可以否定原假設(shè)。這種假設(shè)檢驗(yàn)稱為單側(cè)檢驗(yàn)。可以分為左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)。 將研究者想收集證據(jù)予以支持的假設(shè)作為備擇假設(shè)H1 將研究者想收集證據(jù)證明其不正確的假設(shè)作為原假設(shè)H0 先確立備擇假設(shè)H1,例:研究表明,采用新療法后,將會(huì)使某種癌癥患者的期望壽命延長1

25、0年以上。檢驗(yàn)這一結(jié)論是否成立 研究者總是想證明自己的研究結(jié)論(壽命延長)是正確的 備擇假設(shè)的方向?yàn)椤啊?壽命延長) 建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: 10 H1: 10,單側(cè)檢驗(yàn)有一個(gè)臨界值,一個(gè)拒絕域,拒絕域的面積為。分為左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)兩種情況。 左側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域),右側(cè)檢驗(yàn)示意圖(顯著性水平與拒絕域 ),雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式),第五節(jié) 假設(shè)檢驗(yàn)需要注意的問題,1.要有嚴(yán)密的研究設(shè)計(jì) 組間應(yīng)均衡,具有可比性。除對比的主要因素(如臨床試驗(yàn)用新藥和對照藥)外,其它可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對比組間應(yīng)相同或相近。,配對設(shè)計(jì)計(jì)量資料:

26、配對t檢驗(yàn)。 完全隨機(jī)設(shè)計(jì)兩樣本計(jì)量資料: 小樣本(任一ni60)且方差齊: 兩樣本t檢驗(yàn) 方差不齊: 近似t檢驗(yàn) 大樣本(所有ni60): u檢驗(yàn)。,2.不同資料應(yīng)選用不同檢驗(yàn)方法,3.正確理解“significance”一詞的含義 過去稱差別有或無“顯著性”,易造成兩樣本統(tǒng)計(jì)量之間比較相差很大的誤解。 現(xiàn)在稱差別有或無“統(tǒng)計(jì)學(xué)意義”,相應(yīng)推斷為:可以認(rèn)為或還不能認(rèn)為兩個(gè)或多個(gè)總體參數(shù)有差別。,4.結(jié)論不能絕對化 因統(tǒng)計(jì)結(jié)論具有概率性質(zhì),故“肯定”、“一定”、“必定”等詞不要使用。 在報(bào)告結(jié)論時(shí),最好列出檢驗(yàn)統(tǒng)計(jì)量的值,盡量寫出具體P值,而不簡單寫成P0.05,以便讀者與同類研究進(jìn)行比較或進(jìn)

27、行循證醫(yī)學(xué)時(shí)采用Meta分析。,P ,拒絕H0,不能認(rèn)為H0肯定不成立,因?yàn)殡m然在H0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)計(jì)量的概率雖小,但仍有可能出現(xiàn); 同理,P ,不拒絕H0,更不能認(rèn)為H0肯定成立。由此可見,假設(shè)檢驗(yàn)的結(jié)論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發(fā)生錯(cuò)誤,即第一類錯(cuò)誤或第二類錯(cuò)誤,5.統(tǒng)計(jì)“有意義”與醫(yī)學(xué)“有意義” 統(tǒng)計(jì)“有意義”對應(yīng)統(tǒng)計(jì)結(jié)論,醫(yī)學(xué)“有意義”對應(yīng)專業(yè)結(jié)論。 統(tǒng)計(jì)結(jié)論有意義,專業(yè)結(jié)論無意義,最終結(jié)論沒有意義,樣本含量過大或設(shè)計(jì)存在問題。 統(tǒng)計(jì)結(jié)論無意義,專業(yè)結(jié)論有意義,檢查設(shè)計(jì)是否合理、樣本含量是否足夠。,第六節(jié) 假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系,參數(shù)估計(jì)與假

28、設(shè)檢驗(yàn)都是統(tǒng)計(jì)推斷的重要內(nèi)容。參數(shù)估計(jì)是根據(jù)樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的真值;假設(shè)檢驗(yàn)是根據(jù)樣本統(tǒng)計(jì)量來檢驗(yàn)對總體參數(shù)的檢驗(yàn)假設(shè)是否成立。,一、區(qū)間估計(jì)與假設(shè)檢驗(yàn)的主要區(qū)別 1.區(qū)間估計(jì)通常求得的是以樣本估計(jì)值為中心的雙側(cè)置信區(qū)間,而假設(shè)檢驗(yàn)以假設(shè)總體參數(shù)值為基準(zhǔn),不僅有雙側(cè)檢驗(yàn)也有單側(cè)檢驗(yàn); 2.區(qū)間估計(jì)立足于大概率,通常以較大的把握程度(置信水平)1-去保證總體參數(shù)的置信區(qū)間。而假設(shè)檢驗(yàn)立足于小概率,通常是給定很小的顯著性水平去檢驗(yàn)對總體參數(shù)的先驗(yàn)假設(shè)是否成立。,二、區(qū)間估計(jì)與假設(shè)檢驗(yàn)的聯(lián)系,1.區(qū)間估計(jì)與假設(shè)檢驗(yàn)都是根據(jù)樣本信息對總體參數(shù)進(jìn)行推斷,都是以抽樣分布為理論依據(jù),都是建立在概率基礎(chǔ)

29、上的推斷,推斷結(jié)果都有一定的可信程度或風(fēng)險(xiǎn)。 2.對同一問題的參數(shù)進(jìn)行推斷,二者使用同一樣本、同一統(tǒng)計(jì)量、同一分布,因而二者可以相互轉(zhuǎn)換。區(qū)間估計(jì)問題可以轉(zhuǎn)換成假設(shè)問題,假設(shè)問題也可以轉(zhuǎn)換成區(qū)間估計(jì)問題。區(qū)間估計(jì)中的置信區(qū)間對應(yīng)于假設(shè)檢驗(yàn)中的接受區(qū)域,置信區(qū)間以外的區(qū)域就是假設(shè)檢驗(yàn)中的拒絕域。因此,利用置信區(qū)間可以進(jìn)行假設(shè)檢驗(yàn)。,練習(xí),1、兩樣本比較時(shí),分別取以下檢驗(yàn)水準(zhǔn),哪一個(gè)的第二類錯(cuò)誤最小 A.=0.05 B.=0.01 C.=0.10 D.=0.20 E.=0.02 2、在假設(shè)檢驗(yàn)中,P值和 的關(guān)系為 A.P值越大, 值就越大 B.P值越大, 值就越小 C. P值和 值均可由研究者事先

30、設(shè)定 D. P值和 值都不可以由研究者事先設(shè)定 E. P值的大小與 值的大小無關(guān),3、假設(shè)檢驗(yàn)中的第二類錯(cuò)誤是指 A.拒絕了實(shí)際上成立的H0 B.不拒絕實(shí)際上成立的H0 C.拒絕了實(shí)際上成立的H1 D.不拒絕實(shí)際上不成立的H0 E.拒絕時(shí)所犯的錯(cuò)誤 4、統(tǒng)計(jì)推斷的內(nèi)容是 A用樣本指標(biāo)推斷總體指標(biāo) B檢驗(yàn)統(tǒng)計(jì)上的“假設(shè)”CA、B均不是 DA、B均是,是非題,1進(jìn)行兩均數(shù)差別的假設(shè)檢驗(yàn)時(shí),當(dāng)P0.05時(shí),則拒絕H0;當(dāng)P0.05時(shí),則接受H0,認(rèn)為兩總體均數(shù)無差別。,答案:錯(cuò)誤。當(dāng)P 0.05,拒絕H0時(shí),我們是依據(jù)這一小概率來下結(jié)論的。而當(dāng)P 0.05時(shí),我們對兩總體均數(shù)無差別這一結(jié)論無任何概率保證,因此不能貿(mào)然下無差別的結(jié)論。正確的說法是,按所取檢驗(yàn)水準(zhǔn),接受H1的統(tǒng)計(jì)證據(jù)不足,或尚不能認(rèn)為兩總體均數(shù)有差別。,2通常單側(cè)檢驗(yàn)較雙側(cè)檢驗(yàn)更為靈敏,更易檢驗(yàn)出差別,應(yīng)此宜廣泛使用。,答案:錯(cuò)誤。根據(jù)專業(yè)知識(shí)推斷兩個(gè)總體是否有差別時(shí),是甲高于乙,還是乙高于甲,當(dāng)兩種可能都存在時(shí),一般選雙側(cè);若根據(jù)專業(yè)知識(shí),如果甲不會(huì)低于乙,或者研究者僅關(guān)心其中一種可能時(shí),可選用單側(cè)。一般來講,雙側(cè)檢驗(yàn)較為穩(wěn)妥。單側(cè)檢驗(yàn),應(yīng)以專業(yè)知識(shí)為依據(jù),它充分利用了另一側(cè)的不可能性,故檢出率高,但應(yīng)慎用。,3只要增加樣本含量到足夠大,就可以避

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論