抽樣誤差與假設(shè)檢驗(yàn)_第1頁(yè)
抽樣誤差與假設(shè)檢驗(yàn)_第2頁(yè)
抽樣誤差與假設(shè)檢驗(yàn)_第3頁(yè)
抽樣誤差與假設(shè)檢驗(yàn)_第4頁(yè)
抽樣誤差與假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第四章第四章 抽樣誤差與假設(shè)檢驗(yàn)抽樣誤差與假設(shè)檢驗(yàn) (Sampling Sampling E Error and rror and H Hypothesis ypothesis T Testest) 哈爾濱醫(yī)科大學(xué)哈爾濱醫(yī)科大學(xué) 李康李康 第一節(jié)第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤 一、均數(shù)的抽樣誤差一、均數(shù)的抽樣誤差 在醫(yī)學(xué)研究中,絕大多數(shù)情況是由樣本信息研在醫(yī)學(xué)研究中,絕大多數(shù)情況是由樣本信息研究總體。由于個(gè)體存在差異,因此通過樣本推論究總體。由于個(gè)體存在差異,因此通過樣本推論總體時(shí)會(huì)存在一定的誤差,如樣本均數(shù)總體時(shí)會(huì)存在一定的誤差,如樣本均數(shù) 往往不往往不等于總體均數(shù)等

2、于總體均數(shù) ,這種由抽樣造成的樣本均數(shù)與總,這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差體均數(shù)的差異稱為抽樣誤差。對(duì)于抽樣研究,抽。對(duì)于抽樣研究,抽樣誤差不可避免。樣誤差不可避免。X 二、抽樣誤差的分布二、抽樣誤差的分布 理論上可以證明:若從正態(tài)總體理論上可以證明:若從正態(tài)總體 中,反中,反復(fù)多次隨機(jī)抽取樣本含量固定為復(fù)多次隨機(jī)抽取樣本含量固定為n 的樣本,那么的樣本,那么這些樣本均數(shù)這些樣本均數(shù) 也服從正態(tài)分布,即也服從正態(tài)分布,即 的總體均的總體均數(shù)仍為數(shù)仍為 ,樣本均數(shù)的標(biāo)準(zhǔn)差為,樣本均數(shù)的標(biāo)準(zhǔn)差為 。2N( ,) XX/n抽樣分布抽樣分布 抽樣分布示意圖抽樣分布示意圖 中心極限

3、定理中心極限定理: : 當(dāng)樣本含量很大的情況下,無(wú)論原始測(cè)量變量服當(dāng)樣本含量很大的情況下,無(wú)論原始測(cè)量變量服從什么分布,從什么分布, 的抽樣分布的抽樣分布均均近似正態(tài)。近似正態(tài)。 X抽樣分布抽樣分布 抽樣分布示意圖抽樣分布示意圖 三、標(biāo)準(zhǔn)誤(三、標(biāo)準(zhǔn)誤(Standard ErrorStandard Error) 樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的樣本均數(shù)的變異越小說明估計(jì)越精確,變異越小說明估計(jì)越精確,因此可以用標(biāo)準(zhǔn)誤表因此可以用標(biāo)準(zhǔn)誤表示抽樣誤差的大?。菏境闃诱`差的大?。?實(shí)際中總體標(biāo)準(zhǔn)差實(shí)際中總體標(biāo)準(zhǔn)差 往往未知,故只能求往往未知,故只能求得樣本均數(shù)標(biāo)準(zhǔn)誤的

4、估計(jì)值得樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值 : nXXSnSSX 例例4.1 在某地隨機(jī)抽查成年男子在某地隨機(jī)抽查成年男子140人,計(jì)算得紅人,計(jì)算得紅細(xì)胞均數(shù)細(xì)胞均數(shù)4.771012/L,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差0.38 1012/L ,試計(jì),試計(jì)算均數(shù)的標(biāo)準(zhǔn)誤。算均數(shù)的標(biāo)準(zhǔn)誤。 標(biāo)準(zhǔn)誤是抽樣分布的重要特征之一,可用于衡標(biāo)準(zhǔn)誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間估計(jì)和對(duì)不同組之間的參數(shù)進(jìn)行比較。間估計(jì)和對(duì)不同組之間的參數(shù)進(jìn)行比較。120.380.032( 10 /L)140XSSn 第二節(jié)第二節(jié) 總體均數(shù)的估計(jì)總體均數(shù)的估計(jì) 一

5、、可信區(qū)間的概念一、可信區(qū)間的概念( (Confidence IntervalConfidence Interval) 區(qū)間估計(jì):區(qū)間估計(jì):指按預(yù)先給定的概率,計(jì)算出一個(gè)區(qū)間,指按預(yù)先給定的概率,計(jì)算出一個(gè)區(qū)間, 使它能夠包含未知的總體均數(shù)。事先給定的概率使它能夠包含未知的總體均數(shù)。事先給定的概率 稱為可信度,通常取稱為可信度,通常取 。 參數(shù)估計(jì)參數(shù)估計(jì)點(diǎn)估計(jì):不考慮抽樣誤差,如點(diǎn)估計(jì):不考慮抽樣誤差,如區(qū)間估計(jì):考慮抽樣誤差區(qū)間估計(jì):考慮抽樣誤差195. 01X二、可信區(qū)間的計(jì)算二、可信區(qū)間的計(jì)算 (一)(一) 已知已知nXu/95. 096. 1/96. 1nXP95. 096. 196

6、. 1nXnXP)96.1 ,96.1(XXXX),(2/2/XXuXuX一般情況一般情況其中其中 為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)界值。為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)界值。 2/u 可信區(qū)間:可信區(qū)間:v 5v 1v ( )f t標(biāo)準(zhǔn)正態(tài)分布(二)(二) 未知未知 通常未知,這時(shí)可以用其估計(jì)量通常未知,這時(shí)可以用其估計(jì)量S 代替,但代替,但 已不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服已不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從著名的從著名的 t 分布。分布。)/()(nSX 圖圖4-2 4-2 不同自由度的不同自由度的 t 分布圖分布圖 可信區(qū)間的計(jì)算可信區(qū)間的計(jì)算: : 計(jì)算可信區(qū)間的原理與前完全相同,僅僅是兩計(jì)算可信區(qū)間的原理與前完

7、全相同,僅僅是兩側(cè)概率的界值有些差別。即側(cè)概率的界值有些差別。即1)/()(2/)(2/tnSXtP). .()(2/)(2/XXStXStX,可信區(qū)間:可信區(qū)間: 需要注意:在小樣本情況下,應(yīng)用這一公式的需要注意:在小樣本情況下,應(yīng)用這一公式的條件是原始變量服從正態(tài)分布。在大樣本情況下條件是原始變量服從正態(tài)分布。在大樣本情況下(如(如n100),100),也可以用也可以用 替換替換 近似計(jì)算。近似計(jì)算。2/u2/t 例例4.2 4.2 某醫(yī)生測(cè)得某醫(yī)生測(cè)得2525名動(dòng)脈粥樣硬化患者血漿名動(dòng)脈粥樣硬化患者血漿纖維蛋白原含量的均數(shù)為纖維蛋白原含量的均數(shù)為3.32 3.32 g/Lg/L,標(biāo)準(zhǔn)差為

8、標(biāo)準(zhǔn)差為0.57 0.57 g/Lg/L,試計(jì)算該種病人血漿纖維蛋白原含量總體均試計(jì)算該種病人血漿纖維蛋白原含量總體均數(shù)的數(shù)的95%95%可信區(qū)間??尚艆^(qū)間。下限:下限:上限:上限:(g/L) 09. 325/57. 0064. 232. 3.)(2/XStX(g/L) 56. 325/57. 0064. 232. 3.)(2/XStX 例例4.3 4.3 試計(jì)算例試計(jì)算例4.14.1中該地成年男子紅細(xì)胞總體中該地成年男子紅細(xì)胞總體均數(shù)的均數(shù)的95%95%可信區(qū)間??尚艆^(qū)間。 本例屬于大樣本,可采用正態(tài)近似的方法計(jì)算本例屬于大樣本,可采用正態(tài)近似的方法計(jì)算可信區(qū)間。因?yàn)榭尚艆^(qū)間。因?yàn)?,則,則

9、95%95%可可信區(qū)間為:信區(qū)間為:14038.077.4n,)L/10(71. 4140/38. 096. 177. 4.122/XSuX)L/10(83. 4140/38. 096. 177. 4.122/XSuX下限:下限:上限:上限: 三、模擬實(shí)驗(yàn)三、模擬實(shí)驗(yàn) 模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定模擬抽樣成年男子紅細(xì)胞數(shù)。設(shè)定: : 產(chǎn)生產(chǎn)生100100個(gè)隨機(jī)樣本,分別計(jì)算其個(gè)隨機(jī)樣本,分別計(jì)算其95%95%的可信區(qū)間,的可信區(qū)間,結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)可信區(qū)間包含總體參數(shù)可信區(qū)間包含總體參數(shù) ,只有,只有6 6個(gè)可信區(qū)間個(gè)可

10、信區(qū)間沒有包含總體參數(shù)(用星號(hào)標(biāo)記)。沒有包含總體參數(shù)(用星號(hào)標(biāo)記)。14039.075.4n,754. 圖圖4-4-2 2 模擬抽樣成年男子紅細(xì)胞數(shù)模擬抽樣成年男子紅細(xì)胞數(shù)100100次的次的95%95%可信區(qū)間示意圖可信區(qū)間示意圖 )14039.075.4(n,* 第三節(jié)第三節(jié) 假設(shè)檢驗(yàn)的意義和步驟假設(shè)檢驗(yàn)的意義和步驟 ( (H Hypothesis ypothesis T Test)est) 統(tǒng)計(jì)推斷的另一個(gè)重要內(nèi)容,目的是統(tǒng)計(jì)推斷的另一個(gè)重要內(nèi)容,目的是通過樣通過樣本數(shù)據(jù)本數(shù)據(jù)比較總體參數(shù)之間有無(wú)差別。比較總體參數(shù)之間有無(wú)差別。 一、假設(shè)檢驗(yàn)的基本思想一、假設(shè)檢驗(yàn)的基本思想 例例4.4

11、 4.4 使用使用黑加侖油軟膠囊黑加侖油軟膠囊治療治療高脂血癥高脂血癥,3030名名高脂血癥高脂血癥患者治療前后血清甘油三酯檢測(cè)結(jié)患者治療前后血清甘油三酯檢測(cè)結(jié)果的差值為果的差值為1.381.380.76 (0.76 (g/L)g/L),問治療后血清甘問治療后血清甘油三酯是否有所改善?油三酯是否有所改善? 樣樣 本本治療前后甘油三治療前后甘油三酯的變化(差值)酯的變化(差值)d38. 1 76. 0 30dSnd?0d問題歸納:?jiǎn)栴}歸納: 樣本療效樣本療效 藥物作用藥物作用 + 機(jī)遇機(jī)遇 ?d01.38d對(duì)上面問題可以作如下考慮:對(duì)上面問題可以作如下考慮: 問題:?jiǎn)栴}: 究竟多大能夠下究竟多大

12、能夠下“有效有效”的結(jié)論?的結(jié)論?|d|0 假定治療前后血清甘油三酯檢測(cè)結(jié)果的差值服從正態(tài)分布,假定治療前后血清甘油三酯檢測(cè)結(jié)果的差值服從正態(tài)分布,若若 則則 服從服從t t 分布。分布。 根據(jù)根據(jù) t 分布能夠計(jì)算出有如此大差異的概率分布能夠計(jì)算出有如此大差異的概率P P ,如果,如果P P 值很小,即計(jì)算出的值很小,即計(jì)算出的t t 值超出了給定的界限,則傾向于拒絕值超出了給定的界限,則傾向于拒絕H0 0,認(rèn)為治療前后有差別。認(rèn)為治療前后有差別。 0:0dHnSdtd/0圖圖4-4-3 3 利用利用t t 分布進(jìn)行假設(shè)檢驗(yàn)原理示意圖分布進(jìn)行假設(shè)檢驗(yàn)原理示意圖 二、假設(shè)檢驗(yàn)的基本步驟二、假設(shè)

13、檢驗(yàn)的基本步驟 1. 1.建立假設(shè)和確定檢驗(yàn)水準(zhǔn)建立假設(shè)和確定檢驗(yàn)水準(zhǔn) 無(wú)效假設(shè)無(wú)效假設(shè)H0 0( (null hypothesis)null hypothesis)指需要檢驗(yàn)的假設(shè),指需要檢驗(yàn)的假設(shè),備擇假設(shè)備擇假設(shè)H1 1( (alternative hypothesis)alternative hypothesis)指在指在H0 0成成立證據(jù)不足的情況下而被接受的假設(shè)。例如建立立證據(jù)不足的情況下而被接受的假設(shè)。例如建立治療前后血清甘油三酯療效的無(wú)效假設(shè)和備擇假治療前后血清甘油三酯療效的無(wú)效假設(shè)和備擇假設(shè)分別為設(shè)分別為 0:0dH0:1dH 檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn) 是預(yù)先規(guī)定的拒絕域的概率值,實(shí)

14、是預(yù)先規(guī)定的拒絕域的概率值,實(shí)際中一般取際中一般取 。 05. 0 說明說明 :備擇假設(shè)有雙側(cè)和單側(cè)兩種情況。雙側(cè):備擇假設(shè)有雙側(cè)和單側(cè)兩種情況。雙側(cè)檢驗(yàn)指不論正方向還是負(fù)方向的誤差,若顯著地超出檢驗(yàn)指不論正方向還是負(fù)方向的誤差,若顯著地超出檢驗(yàn)水準(zhǔn)則拒絕檢驗(yàn)水準(zhǔn)則拒絕H0 0, 即為雙側(cè)檢驗(yàn);單側(cè)即為雙側(cè)檢驗(yàn);單側(cè)檢驗(yàn)指僅在出現(xiàn)正方向或負(fù)方向誤差超出規(guī)定的水準(zhǔn)檢驗(yàn)指僅在出現(xiàn)正方向或負(fù)方向誤差超出規(guī)定的水準(zhǔn)時(shí)則拒絕時(shí)則拒絕H0 0 ,如治療后血清甘油三酯下降的假設(shè)可如治療后血清甘油三酯下降的假設(shè)可表示為表示為 ):H :Hd1d10(或 001d:H 雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)應(yīng)如何選擇,需根據(jù)研究目

15、的雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)應(yīng)如何選擇,需根據(jù)研究目的和專業(yè)知識(shí)而定。和專業(yè)知識(shí)而定。一般情況下,雙側(cè)檢驗(yàn)更為穩(wěn)妥,一般情況下,雙側(cè)檢驗(yàn)更為穩(wěn)妥,因?yàn)閷?duì)相同的樣本,雙側(cè)檢驗(yàn)得出有顯著性差別的結(jié)因?yàn)閷?duì)相同的樣本,雙側(cè)檢驗(yàn)得出有顯著性差別的結(jié)論,單側(cè)檢驗(yàn)也一定是顯著的。論,單側(cè)檢驗(yàn)也一定是顯著的。 2.2.選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 根據(jù)資料類型、研究設(shè)計(jì)方案和統(tǒng)計(jì)推斷的目的,根據(jù)資料類型、研究設(shè)計(jì)方案和統(tǒng)計(jì)推斷的目的,選擇適當(dāng)?shù)臋z驗(yàn)方法,不同檢驗(yàn)方法各有其相應(yīng)的檢選擇適當(dāng)?shù)臋z驗(yàn)方法,不同檢驗(yàn)方法各有其相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量及計(jì)算公式。許多假設(shè)檢驗(yàn)方法是以檢驗(yàn)統(tǒng)驗(yàn)統(tǒng)計(jì)量及計(jì)算公式。

16、許多假設(shè)檢驗(yàn)方法是以檢驗(yàn)統(tǒng)計(jì)量來(lái)命名的,如計(jì)量來(lái)命名的,如 t 檢驗(yàn)、檢驗(yàn)、u檢驗(yàn)、檢驗(yàn)、F檢驗(yàn)和檢驗(yàn)和 檢驗(yàn)檢驗(yàn)等。等。 3. 3.確定確定P P 值并做出統(tǒng)計(jì)推斷結(jié)論值并做出統(tǒng)計(jì)推斷結(jié)論 查表得到檢驗(yàn)用的臨界值,然后將算得的統(tǒng)計(jì)量查表得到檢驗(yàn)用的臨界值,然后將算得的統(tǒng)計(jì)量與拒絕域的臨界值作比較,確定與拒絕域的臨界值作比較,確定P 值。如對(duì)雙側(cè)值。如對(duì)雙側(cè) t 檢檢驗(yàn)驗(yàn) ,則,則 , ,按檢驗(yàn)水準(zhǔn)按檢驗(yàn)水準(zhǔn) 拒絕拒絕H0 0。 2/2()t| t |P 小小 結(jié)結(jié) 1.1.總體參數(shù)值在現(xiàn)實(shí)中通常不能獲得總體參數(shù)值在現(xiàn)實(shí)中通常不能獲得, ,而是通過而是通過隨機(jī)樣本來(lái)進(jìn)行估計(jì)。由于個(gè)體存在差異,

17、因此通隨機(jī)樣本來(lái)進(jìn)行估計(jì)。由于個(gè)體存在差異,因此通過樣本推論總體時(shí)會(huì)存在一定的誤差,這種由抽樣過樣本推論總體時(shí)會(huì)存在一定的誤差,這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差。抽樣誤差抽樣誤差的大小可以用標(biāo)準(zhǔn)誤進(jìn)行衡量。的大小可以用標(biāo)準(zhǔn)誤進(jìn)行衡量。 2. 2.參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方式。點(diǎn)估參數(shù)估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方式。點(diǎn)估計(jì)計(jì)的重要表達(dá)方式是平均值;的重要表達(dá)方式是平均值;區(qū)間估計(jì)是指按預(yù)先區(qū)間估計(jì)是指按預(yù)先給定的概率,計(jì)算出一個(gè)區(qū)間,使它能夠包含未知給定的概率,計(jì)算出一個(gè)區(qū)間,使它能夠包含未知的總體均數(shù)。區(qū)間的總體均數(shù)。區(qū)間越窄

18、說明估計(jì)的準(zhǔn)確度越高。越窄說明估計(jì)的準(zhǔn)確度越高。 3.3.總體均數(shù)可信區(qū)間的計(jì)算公式可以利用總體均數(shù)可信區(qū)間的計(jì)算公式可以利用 的的抽樣分布獲得。抽樣分布獲得。一種重要的方法是利用一種重要的方法是利用 t 分布計(jì)算分布計(jì)算區(qū)間兩端的可信限區(qū)間兩端的可信限 。單側(cè)可信區(qū)間只需單側(cè)可信區(qū)間只需將公式中的雙側(cè)界值換成單側(cè)界值將公式中的雙側(cè)界值換成單側(cè)界值。 4. 4.假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的的思想是,首先對(duì)所需要比較的總思想是,首先對(duì)所需要比較的總體提出一個(gè)體提出一個(gè)無(wú)差別的無(wú)差別的假設(shè),然后通過樣本數(shù)據(jù)去推假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)斷是否拒絕這一假設(shè)。其。其實(shí)質(zhì)是判斷觀察到的實(shí)質(zhì)是判斷觀察到的“差差別別”是抽樣誤差引起還是總體上的不同,目的是抽樣誤差引起還是總體上的不同,目的是評(píng)是評(píng)價(jià)兩個(gè)不同的參數(shù)或兩種不同處理引起效應(yīng)不同的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論