抽樣誤差與假設(shè)檢驗_第1頁
抽樣誤差與假設(shè)檢驗_第2頁
抽樣誤差與假設(shè)檢驗_第3頁
抽樣誤差與假設(shè)檢驗_第4頁
抽樣誤差與假設(shè)檢驗_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1第四章

抽樣誤差與假設(shè)檢驗2第一節(jié)均數(shù)的抽樣誤差與標準誤

假設(shè)某地12歲男孩身高的總體均數(shù)為138.7cm,現(xiàn)在隨機抽取200例,其身高的樣本均數(shù)為139.6cm,兩均數(shù)不相等,為什么?

由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差(samplingerror)。3若隨機變量X服從正態(tài)分布N(μ,σ2),那么:當n足夠大時,均數(shù)也服從正態(tài)分布。樣本均數(shù)的總體均數(shù)仍然為μ。樣本均數(shù)的標準差為:實際工作中總體標準差往往未知,用樣本標準差S

代替σ,可求得樣本均數(shù)標準誤:樣本均數(shù)的標準差稱為標準誤(standarderror,SE)。4

例4.1在某地隨機抽查成年男子140人,計算得紅細胞均數(shù)4.77×1012/L,標準差0.38×1012/L,試計算均數(shù)的標準誤。

標準誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間估計和對不同組之間的參數(shù)進行比較。5第二節(jié)總體均數(shù)的估計可信區(qū)間的概念參數(shù)估計(parameterestimation)用樣本的統(tǒng)計量估計總體的參數(shù)。有兩種方法:點估計(pointestimation)用樣本的統(tǒng)計量直接作為總體的參數(shù)值。該法沒有考慮抽樣誤差,無法評價其可信度。區(qū)間估計(intervalestimation)按預先給定的概率估計總體參數(shù)的可能范圍,即總體參數(shù)的置信區(qū)間(confidenceinterval,CI)。6可信區(qū)間的兩個要素:準確度(accuracy):反映可信度(1-α)的大小,即可信區(qū)間包容μ的概率大小,愈接近1愈好。精確度(precision):反映在區(qū)間的長度,區(qū)間長度愈小精確度愈高。7總體均數(shù)可信區(qū)間的計算σ已知或未知,樣本含量n≥50,按正態(tài)分布原理,估計總體均數(shù)的可信區(qū)間。按標準正態(tài)分布規(guī)律,95%(1-α)的u值在-1.96和1.96之間,即:一般情況:8

σ未知,樣本含量n<50

可以用其估計量S代替,但已不再服從標準正態(tài)分布,而是服從著名的t分布。

W.S.Goset于1908年證明了服從自由度ν=n–1的t

分布(t-distribution),也可稱為studentt分布。9曲線以0為中心,兩邊對稱。曲線的變化與自由度ν有關(guān)。ν趨于∞時,t分布趨向標準正態(tài)分布。10可信區(qū)間的計算按t分布原理,總體的均數(shù)的區(qū)間估計為:對上式進行變換,總體的均數(shù)可信區(qū)間為:11

例4.2某醫(yī)生測得25名動脈粥樣硬化患者血漿纖維蛋白原含量的均數(shù)為3.32g/L,標準差為0.57g/L,試計算該種病人血漿纖維蛋白原含量總體均數(shù)的95%可信區(qū)間。樣本含量n=25,=3.32,S=0.57,ν=n–1=24,α取0.05,查t界值表:

t0.05/2(24)=2.064該種病人血漿纖維蛋白原含量總體均數(shù)的95%可信區(qū)間為:(3.08g/L

,3.56g/L

)12

例4.3試計算例4.1中該地成年男子紅細胞總體均數(shù)的95%可信區(qū)間。

本例屬于大樣本,可采用正態(tài)近似的方法計算可信區(qū)間。因為,則95%可信區(qū)間為:下限:上限:13模擬實驗?zāi)M抽樣成年男子紅細胞數(shù)。設(shè)定:

產(chǎn)生100個隨機樣本,分別計算其95%的可信區(qū)間,結(jié)果用圖示的方法表示。從圖可以看出:絕大多數(shù)可信區(qū)間包含總體參數(shù),只有6個可信區(qū)間沒有包含總體參數(shù)(用星號標記)。14

圖4-2模擬抽樣成年男子紅細胞數(shù)100次的95%可信區(qū)間示意圖

******15可信區(qū)間的含義:以95%的可信區(qū)間為例,意味著在同一總體中作100次重復抽樣,可得100個可信區(qū)間,平均有95個可信區(qū)間包含總體均數(shù)(估計正確),只有5個可信區(qū)間不包含總體均數(shù)(估計不正確),對于某一個區(qū)間而言,它包含總體均數(shù)的可能性為95%,而不包含總體均數(shù)的可能性僅為5%。16總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別區(qū)別點參考值范圍總體均數(shù)可信區(qū)間含義“正常人”的解剖、生理、生化某項指標的波動范圍。個體值的波動范圍以95%的可信區(qū)間為例,意味著在同一總體中作100次重復抽樣,可得100個可信區(qū)間,平均有95個可信區(qū)間包含總體均數(shù),只有5個可信區(qū)間不包含總體均數(shù)??傮w均數(shù)的可能范圍計算公式正態(tài)分布:偏態(tài)分布:

PX~P100~Xn≥50:n<50:用途絕大多數(shù)(如95%)觀察對象某項指標的分布范圍??傮w均數(shù)的區(qū)間估計17第三節(jié)假設(shè)檢驗的意義和步驟

對所估計的總體首先提出一個假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè),稱為假設(shè)檢驗(hypothesistesting)假設(shè)檢驗是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。18

假設(shè)檢驗的原理與思想例4.4使用黑加侖油軟膠囊治療高脂血癥,30名高脂血癥患者治療前后血清甘油三酯檢測結(jié)果的差值的均數(shù)為1.38±0.76(g/L),問治療后血清甘油三酯是否有所改善?本例中,治療前后甘油三酯的變化的差異可能有兩種原因造成:

抽樣誤差所致

環(huán)境條件的影響19

假定治療前后血清甘油三酯檢測結(jié)果的差值服從正態(tài)分布,若則服從t分布。

根據(jù)t

分布能夠計算出有如此大差異的概率P,如果P值很小,即計算出的t值超出了給定的界限,則傾向于拒絕H0,認為治療前后有差別。

圖4-3

利用t分布進行假設(shè)檢驗原理示意圖

20假設(shè)檢驗的基本步驟建立假設(shè)和確定檢驗水準無效假設(shè)(nullhypothesis)符號H0,即認為樣本均數(shù)與總體均數(shù)相等。記為H0:μ=μ0

或μ-μ0=0

若不拒絕H0

,則認為兩均數(shù)的差異由抽樣誤差所致。備擇假設(shè)(alternativehypothesis)符號為H1,它是在拒絕H0的情況下而接受的假設(shè)。即認為樣本均數(shù)與總體均數(shù)相等。記為H1:μ≠μ0

若拒絕H0

,則認為兩均數(shù)存在本質(zhì)差異。21假設(shè)檢驗中單雙側(cè)檢驗的選擇需根據(jù)研究目的和專業(yè)知識而定。除非已知不會出現(xiàn)μ<μ0

(或μ>μ0

)的情況,否則均采用雙側(cè)檢驗(two-sidedtest)。對于總體均數(shù)的推斷,均采用雙側(cè)檢驗。22檢驗水準檢驗水準(leveloftest)用α表示。通常取0.05。α取值較小時,有利于提高檢驗結(jié)果的可靠性,但是精密度下降。α取值加大時,有利于發(fā)現(xiàn)研究總體可能存在的差異,但是其可靠性降低。23

選擇檢驗方法和統(tǒng)計推斷分析選擇檢驗方法和計算檢驗統(tǒng)計量根據(jù)資料類型,設(shè)計方案和統(tǒng)計推斷的目的,選擇適當?shù)臋z驗方法,并計算相應(yīng)的檢驗統(tǒng)計量。如:u檢驗,t檢驗,F(xiàn)檢驗等等。確定P值和作出統(tǒng)計推斷P≤α,按α檢測水準,拒絕H0

,接受H1

。P>α,現(xiàn)有樣本信息不足以拒絕H0

。最后的統(tǒng)計推斷需結(jié)合統(tǒng)計結(jié)論和專業(yè)結(jié)論進行推斷。24小結(jié)

進行統(tǒng)計推斷,就是要求通過從樣本中所獲得的信息推斷總體的規(guī)律。

由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差。這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異稱為抽樣誤差。抽樣誤差的大小可以用標準誤進行衡量。25參數(shù)估計有點估計和區(qū)間估計兩種方式。點估計:用樣本的統(tǒng)計量直接作為總體的參數(shù)值。區(qū)間估計:按預先給定的概率估計總體參數(shù)的可能范圍,使它能夠包含未知的總體均數(shù)。總體均數(shù)可信區(qū)間的計算方法大樣本時,利用u分布計算小樣本時,利用t分布計算26

假設(shè)檢驗的思想

對所需要比較的總體提出一個無差別的假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)。其實質(zhì)是:判斷觀察到的“

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論