醫(yī)學統(tǒng)計學:計量資料的統(tǒng)計推斷_第1頁
醫(yī)學統(tǒng)計學:計量資料的統(tǒng)計推斷_第2頁
醫(yī)學統(tǒng)計學:計量資料的統(tǒng)計推斷_第3頁
醫(yī)學統(tǒng)計學:計量資料的統(tǒng)計推斷_第4頁
醫(yī)學統(tǒng)計學:計量資料的統(tǒng)計推斷_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、計量資料的統(tǒng)計推斷計量資料的統(tǒng)計推斷教師:衛(wèi)生統(tǒng)計教研室 胡冬梅統(tǒng)計推斷統(tǒng)計推斷 在醫(yī)學研究中,通常在總體中隨機抽取一在醫(yī)學研究中,通常在總體中隨機抽取一定數(shù)量觀察單位作為樣本進行抽樣研究,定數(shù)量觀察單位作為樣本進行抽樣研究,然后有樣本信息推斷總體特征,這個過程然后有樣本信息推斷總體特征,這個過程稱為統(tǒng)計推斷稱為統(tǒng)計推斷樣本樣本抽取部分觀察單位抽取部分觀察單位 統(tǒng)計推斷統(tǒng)計推斷如:如:樣本均數(shù)樣本均數(shù) 樣本標準差樣本標準差S 樣本率樣本率 P如:如: 總體均數(shù)總體均數(shù) 總體標準差總體標準差 總體率總體率X統(tǒng)計推斷主要內容:統(tǒng)計推斷主要內容:1. 均數(shù)的抽樣誤差與標準誤均數(shù)的抽樣誤差與標準誤2.

2、 t分布分布3. 總體均數(shù)的估計總體均數(shù)的估計4. 假設檢驗假設檢驗5. t檢驗檢驗 抽樣誤差:由于抽樣所引起的樣本統(tǒng)計量(樣抽樣誤差:由于抽樣所引起的樣本統(tǒng)計量(樣本均數(shù)、標準差、樣本率)間以及樣本統(tǒng)計量本均數(shù)、標準差、樣本率)間以及樣本統(tǒng)計量與總體參數(shù)間的差異。(舉例抽樣誤差的產(chǎn)生)與總體參數(shù)間的差異。(舉例抽樣誤差的產(chǎn)生) 均數(shù)的抽樣誤差:由于抽樣引起的樣本均數(shù)以均數(shù)的抽樣誤差:由于抽樣引起的樣本均數(shù)以及樣本均數(shù)與總體均數(shù)間的誤差,即為標準誤及樣本均數(shù)與總體均數(shù)間的誤差,即為標準誤(樣本均數(shù)的標準差,(樣本均數(shù)的標準差,standard error of mean) 。一、均數(shù)的分布及其

3、標準誤一、均數(shù)的分布及其標準誤 均數(shù)的抽樣誤差均數(shù)的抽樣誤差總體總體=5=5,=0.5=0.5 X樣本號紅細胞計數(shù)( 1012/L, )1234M5.59 5.11 4.26 5.11 4.74 5.554.65 4.65 5.59 5.70 4.46 5.324.56 4.87 5.21 4.53 4.53 4.234.08 4.73 4.84 4.88 4.65 5.33 5.16 4.49 5.26 5.02 4.64 4.565.045.034.714.664.900.440.520.330.460.29S一、均數(shù)的分布及其標準誤一、均數(shù)的分布及其標準誤 數(shù)理統(tǒng)計的中心極限定理和大數(shù)定

4、理表數(shù)理統(tǒng)計的中心極限定理和大數(shù)定理表明:明: 從正態(tài)總體從正態(tài)總體N N(,2 2)中隨機抽?。┲须S機抽取含量為含量為n n的樣本,其樣本均數(shù)服從正態(tài)分布;的樣本,其樣本均數(shù)服從正態(tài)分布;即使從偏態(tài)總體中隨機抽樣,當即使從偏態(tài)總體中隨機抽樣,當n n足夠大時足夠大時(如(如n30n30),樣本均數(shù)也近似正態(tài)分布;),樣本均數(shù)也近似正態(tài)分布; 從均數(shù)為從均數(shù)為,標準差為,標準差為的總體中隨機抽取的總體中隨機抽取含量為含量為n n的樣本,則樣本均數(shù)的均數(shù)也為的樣本,則樣本均數(shù)的均數(shù)也為,樣本均數(shù)的標準差為樣本均數(shù)的標準差為 。 xS 抽樣分布抽樣分布 抽樣分布示意圖抽樣分布示意圖 中心極限定理中

5、心極限定理: :一、均數(shù)的抽樣誤差與標準誤一、均數(shù)的抽樣誤差與標準誤 標準誤反映了抽樣誤差的大小,標準誤越小,標準誤反映了抽樣誤差的大小,標準誤越小,抽樣誤差越小,當標準誤趨近于抽樣誤差越小,當標準誤趨近于0,樣本均數(shù),樣本均數(shù)趨近于總體均數(shù),用樣本均數(shù)估計總體均數(shù)可趨近于總體均數(shù),用樣本均數(shù)估計總體均數(shù)可靠程度高??砍潭雀摺一定情況下,一定情況下,n越大,標準誤越越大,標準誤越小。小。 標準誤計算:標準誤計算: 當當已知已知 當當未知未知xnxSSn 標準誤:樣本均數(shù)的標準差標準誤:樣本均數(shù)的標準差 標準誤標準誤 標準差標準差2211kiixxkn個體差異個體差異樣本均樣本均數(shù)差異數(shù)差異

6、例例4.1 4.1 在某地隨機抽查成年男子在某地隨機抽查成年男子140140人,計算得紅人,計算得紅細胞均數(shù)細胞均數(shù)4.774.7710101212/L/L,標準差,標準差0.38 0.38 10101212/L /L ,試計,試計算均數(shù)的標準誤。算均數(shù)的標準誤。 標準誤是抽樣分布的重要特征之一,可用于衡量標準誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間估計和對不同組之間的參數(shù)進行比較。估計和對不同組之間的參數(shù)進行比較。120.380.032( 10 /L)140XSSn 例例 某地隨機抽取某地隨機抽取2020歲

7、健康男性歲健康男性2020名,求得其血中葡萄糖名,求得其血中葡萄糖樣本均數(shù)樣本均數(shù)=39.5mg/100ml=39.5mg/100ml,標準差,標準差S=0.69mg/100ml,S=0.69mg/100ml,問其抽問其抽樣誤差是多少?樣誤差是多少? 本例:本例:s=0.69mg/100mls=0.69mg/100ml,n=20n=20,將其代入公式得,將其代入公式得 即該研究的抽樣誤差為即該研究的抽樣誤差為0.15mg/100ml0.15mg/100ml。 0.690.15(/100)20 xssmgmln第二節(jié)第二節(jié) t t分布分布XuX隨機變量隨機變量X XN N( , 2 2)標準正態(tài)

8、分布標準正態(tài)分布N N(0 0,1 12 2)u變換均數(shù)均數(shù)標準正態(tài)分布標準正態(tài)分布N N(0 0,1 12 2)nXu),(2nN1,nvSXnSXtXStudent Student t t分布分布自由度:自由度:n n-1-1自由度自由度舉例:三個人分舉例:三個人分10個蘋果個蘋果自由度:隨意變化量個數(shù)自由度:隨意變化量個數(shù)自由度自由度=變量個數(shù)變量個數(shù)-約束條件個數(shù)約束條件個數(shù)t t分布曲線分布曲線0.00.10.10.20.20.30.30.40.4-4-3-2-101234tf(t)自由度為1的t分布自由度為9的t分布標準正態(tài)分布 t t 分布分布有如下性質:有如下性質:單峰分布,曲

9、線在單峰分布,曲線在t t0 0 處最高,并以處最高,并以t t0 0為中心為中心左右對稱左右對稱與正態(tài)分布相比,曲線與正態(tài)分布相比,曲線最高處較矮,兩最高處較矮,兩尾部翹得尾部翹得高高(見綠線)(見綠線) 隨自由度增大,曲線逐隨自由度增大,曲線逐漸接近正態(tài)分布;分布的漸接近正態(tài)分布;分布的極限為標準正態(tài)分布。極限為標準正態(tài)分布。t t值的分布與自由度值的分布與自由度 有關(實際是樣本含有關(實際是樣本含量量n n不同)。不同)。t t 分布的圖形不是一條曲線,分布的圖形不是一條曲線,而是一簇曲線。而是一簇曲線。 =(標準正態(tài)分布)=5=1012345-1-2-3-4-5f(t)0.10.20

10、.3 不同自由度下的不同自由度下的t t分布圖分布圖t界值界值1.1.縱坐標:自由度,縱坐標:自由度, 橫坐標:概率,橫坐標:概率, P P, , 即曲線下陰影部分的面積即曲線下陰影部分的面積; ; 表中的數(shù)字:相應的表中的數(shù)字:相應的 |t|t | | 界值界值, ,用用t t(v v)表示表示。2.2.t t 值表規(guī)律:值表規(guī)律:(1) (1) 自由度(自由度()一定時,)一定時,p p 與與 t t 成反比成反比; ;(2)(2) 概率(概率(p p) 一定時,一定時, 與與 t t 成反比成反比; ;3.3.t t雙側雙側t t單側單側,t t單側單側=t=t22雙側雙側三、三、 總體

11、均數(shù)的點估計(總體均數(shù)的點估計(point point estimationestimation)與區(qū)間估計)與區(qū)間估計pSX、參數(shù)的估計參數(shù)的估計點估計點估計:由樣本統(tǒng)計量:由樣本統(tǒng)計量 直接估計直接估計 總體參數(shù)總體參數(shù)區(qū)間估計區(qū)間估計:在一定:在一定可信度可信度(Confidence level) 下下,同時考慮抽樣誤差,同時考慮抽樣誤差、可信區(qū)間可信區(qū)間可信區(qū)間或置信區(qū)間(可信區(qū)間或置信區(qū)間(CI),根據(jù)樣本均數(shù),按一),根據(jù)樣本均數(shù),按一定的定的可信度可信度計算計算 出總體均數(shù)很可能在的一個出總體均數(shù)很可能在的一個數(shù)值范數(shù)值范圍圍,這個范圍稱為總體均數(shù)的可信區(qū)間。,這個范圍稱為總體均

12、數(shù)的可信區(qū)間。1-1-為可為可信度,常取雙側信度,常取雙側95%95%,即,即=0.05=0.05可信區(qū)間的兩個要素:可信區(qū)間的兩個要素:1.準確度:可信區(qū)間包括準確度:可信區(qū)間包括的概率大小,的概率大小,1-來衡量來衡量2.精密度:區(qū)間的長度,越小,精密度越高精密度:區(qū)間的長度,越小,精密度越高3.準確度高,精密度就低,同時提高準確度和精密度,準確度高,精密度就低,同時提高準確度和精密度,只能增大樣本含量只能增大樣本含量n??尚艆^(qū)間的計算可信區(qū)間的計算1.未知未知2.已知或已知或未知但未知但n足夠大足夠大 已知已知 未知但未知但n足夠大足夠大 ,vvXXXtSXtS,XXXX ,XXXSXS

13、可信區(qū)間與參考值范圍的區(qū)別可信區(qū)間與參考值范圍的區(qū)別四、假設檢驗四、假設檢驗 亦稱顯著性檢驗是對所估計的總體首先提出一亦稱顯著性檢驗是對所估計的總體首先提出一個假設,然后通過樣本數(shù)據(jù)去推斷是否拒絕這個假設,然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設一假設 科研數(shù)據(jù)處理的重要工具科研數(shù)據(jù)處理的重要工具; 某事發(fā)生了:某事發(fā)生了: 是由于碰巧?還是由于必然的原因?統(tǒng)計學家是由于碰巧?還是由于必然的原因?統(tǒng)計學家運用顯著性檢驗來處理這類問題運用顯著性檢驗來處理這類問題 舉例:上課遲到,買雞蛋舉例:上課遲到,買雞蛋假設檢驗原因假設檢驗原因 由于個體差異的存在,即使從同一總體由于個體差異的存在,即使從同一總

14、體中嚴格的隨機抽樣,中嚴格的隨機抽樣,X X1 1、X X2 2、X X3 3、X X4 4、,、,不同。不同。 因此,因此,X X1 1、X X2 2 不同有兩種(而且只有兩種)不同有兩種(而且只有兩種)可能:可能:(1 1)分別所代表的總體均數(shù)相同,由于抽樣誤)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性差造成了樣本均數(shù)的差別。差別無顯著性 。(2 2)分別所代表的總體均數(shù)不同。差別有顯著)分別所代表的總體均數(shù)不同。差別有顯著性。性。假設檢驗基本原理假設檢驗基本原理1.假設假設=0,即差異是由于抽樣誤差引起的,即差異是由于抽樣誤差引起的, t分布,則分布,則 若

15、若tt 0.05,則,則P0.05 , 小概率事件發(fā)生了,拒絕原小概率事件發(fā)生了,拒絕原假設,選擇備擇假設假設,選擇備擇假設2.例題見書例題見書32頁頁0/xSn00.050.05/xttSn例例4.4已知健康成年男子的脈搏均數(shù)為已知健康成年男子的脈搏均數(shù)為72次次/分。某分。某醫(yī)生在某山區(qū)隨機調查醫(yī)生在某山區(qū)隨機調查30名健康男子,求得名健康男子,求得脈搏均數(shù)為脈搏均數(shù)為74.2次次/分,標準差微分,標準差微6.5次次/分。分。能否認為該山區(qū)的成年男子的脈搏均數(shù)高于能否認為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)?一般成年男子的脈搏均數(shù)?樣本均數(shù)和總體均數(shù)的差異有兩種可能:樣本均

16、數(shù)和總體均數(shù)的差異有兩種可能:1.抽樣誤差所致抽樣誤差所致2.有本質差異有本質差異假設檢驗步驟假設檢驗步驟1.建立假設:無效假設建立假設:無效假設 H0:相等,:相等,0 備擇假設備擇假設 H1:不等,:不等,0 一般采用雙側檢驗一般采用雙側檢驗2.確定檢驗水準(顯著水準)確定檢驗水準(顯著水準) =0.05,即發(fā)生的概率,即發(fā)生的概率小于小于為小概率事件為小概率事件3.選擇檢驗統(tǒng)計量選擇檢驗統(tǒng)計量4.判定結論判定結論 P,拒絕,拒絕H0,接受接受H1 P,不能拒絕,不能拒絕H05.推斷得出專業(yè)結論推斷得出專業(yè)結論假設檢驗特點假設檢驗特點1.類似于數(shù)學中的反證法類似于數(shù)學中的反證法 先建立假設

17、(假設上課不遲到,雞蛋是新鮮的),先建立假設(假設上課不遲到,雞蛋是新鮮的),然后通過計算證明,得出結論是小概率事件發(fā)生,然后通過計算證明,得出結論是小概率事件發(fā)生,則該假設不成立則該假設不成立2.數(shù)學推斷是確定性的,而統(tǒng)計學是以概率給出的,數(shù)學推斷是確定性的,而統(tǒng)計學是以概率給出的,因此結論是相對的,得到任何結論都存在發(fā)生錯誤因此結論是相對的,得到任何結論都存在發(fā)生錯誤的可能。的可能。假設檢驗兩類錯誤假設檢驗兩類錯誤 P42 當當H H0 0為真時,檢驗結論拒絕為真時,檢驗結論拒絕H H0 0接受接受H H1 1,這類錯誤稱為第一,這類錯誤稱為第一類錯誤或類錯誤或型錯誤型錯誤(type errortype error),亦稱假陽性錯誤),亦稱假陽性錯誤 檢驗水準,就是預先規(guī)定的允許犯檢驗水準,就是預先規(guī)定的允許犯型錯誤概率的最大值,型錯誤概率的最大值,用用表示表示 當真實情況為當真實情況為H H0 0不成立而不成立而H H1 1成立時,檢驗結論不拒絕成立時,檢驗結論不拒絕H H0 0,這類錯誤稱為第二類錯誤或這類錯誤稱為第二類錯誤或型錯誤型錯誤(type errortype error),),亦稱假陰

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論