正態(tài)分布參考值抽樣誤差課件_第1頁
正態(tài)分布參考值抽樣誤差課件_第2頁
正態(tài)分布參考值抽樣誤差課件_第3頁
正態(tài)分布參考值抽樣誤差課件_第4頁
正態(tài)分布參考值抽樣誤差課件_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

正態(tài)分布參考值抽樣誤差課件1第1頁,共60頁,2023年,2月20日,星期五例某地用隨機抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測結(jié)果如表2-15.953.82正態(tài)分布和醫(yī)學(xué)參考值范圍第2頁,共60頁,2023年,2月20日,星期五紅細(xì)胞數(shù)組中值頻數(shù)頻率(%)3.80~3.9021.44.00~4.1064.34.20~4.30117.94.40~4.502517.94.60~4.703222.94.80~4.902719.35.00~5.101712.15.20~5.30139.35.40~5.5042.95.60~5.7021.45.80~6.005.9010.7某地140名正常男子紅細(xì)胞數(shù)頻數(shù)表第3頁,共60頁,2023年,2月20日,星期五直方圖第4頁,共60頁,2023年,2月20日,星期五f(x)=(fi/n)以頻率為縱坐標(biāo)第5頁,共60頁,2023年,2月20日,星期五隨著組段不斷分細(xì)和觀察人數(shù)的增多,直條頂端將逐漸接近于一條光滑的曲線,如下圖。這條曲線稱為頻率密度曲線,呈中間高、兩邊低、左右對稱,形狀似座鐘。類似于數(shù)學(xué)上的正態(tài)分布曲線。因為頻率的總和等于1,故橫軸上曲線下的面積等于1。頻率密度f(x)=(fi/n)/i(i=0.1)第6頁,共60頁,2023年,2月20日,星期五第7頁,共60頁,2023年,2月20日,星期五這條所描述的分布,便近似于我們通常所說的正態(tài)概率分布,簡稱正態(tài)分布。正態(tài)分布是自然界最常見的一種分布,例如,測量的誤差、人體的身高、體重、許多生化指標(biāo)的值(例如血壓、血紅蛋白含量、紅細(xì)胞數(shù)等等)等都屬于正態(tài)分布或近似正態(tài)分布。還有些偏態(tài)資料可經(jīng)數(shù)據(jù)轉(zhuǎn)換成正態(tài)或近似正態(tài)分布,例如抗體滴度、血鉛值等。第8頁,共60頁,2023年,2月20日,星期五一、正態(tài)分布的密度函數(shù)式中μ為總體均數(shù),σ為總體標(biāo)準(zhǔn)差,π為圓周率,e為自然對數(shù)的底,x為變量,當(dāng)μ、σ已知,以x為橫軸,f(x)為縱軸,即可給出正態(tài)分布曲線的圖形。第9頁,共60頁,2023年,2月20日,星期五二、正態(tài)分布的特征1.正態(tài)分布在橫軸上方,均數(shù)處最高,以均數(shù)μ為中心,左右對稱。2.正態(tài)分布的X取值范圍理論上沒有邊界,X離μ越遠(yuǎn),f(X)值越接近0,但不會等于0。3.正態(tài)分布曲線下的面積分布有一定的規(guī)律。所有的正態(tài)分布曲線,在μ左右任意個標(biāo)準(zhǔn)差范圍內(nèi)面積相同。第10頁,共60頁,2023年,2月20日,星期五4.正態(tài)分布完全由兩個參數(shù)即均數(shù)μ與標(biāo)準(zhǔn)差σ決定,其中μ是位置參數(shù),σ是變異參數(shù)。常用N(μ,σ2)來表示。第11頁,共60頁,2023年,2月20日,星期五μ=0、σ=1的標(biāo)準(zhǔn)正態(tài)分布第12頁,共60頁,2023年,2月20日,星期五標(biāo)準(zhǔn)正態(tài)分布曲線及其面積分布第13頁,共60頁,2023年,2月20日,星期五三、正態(tài)分布的應(yīng)用不少醫(yī)學(xué)現(xiàn)象服從正態(tài)分布或近似正態(tài)分布確定醫(yī)學(xué)參考值范圍質(zhì)量控制圖正態(tài)分布是很多統(tǒng)計方法的理論基礎(chǔ)第14頁,共60頁,2023年,2月20日,星期五醫(yī)學(xué)參考值范圍的估計1.醫(yī)學(xué)參考值范圍的概念

指特定的“正常”人群的解剖、生理、生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個體的取值所在的范圍。2.醫(yī)學(xué)參考值范圍的確定要求確定研究總體,例如“正常人”。選擇足夠數(shù)量的觀察對象。統(tǒng)一測定方法,控制實驗誤差,保證數(shù)據(jù)的可靠性。決定取單側(cè)范圍還是雙側(cè)范圍值選擇恰當(dāng)?shù)陌俜址秶?5頁,共60頁,2023年,2月20日,星期五醫(yī)學(xué)參考值范圍的估計3.醫(yī)學(xué)參考值范圍的計算方法正態(tài)分布法百分位數(shù)法第16頁,共60頁,2023年,2月20日,星期五正態(tài)分布法

適用于正態(tài)或近似分布資料

式中為均數(shù),s為標(biāo)準(zhǔn)差,u值可根據(jù)要求查表。公式為:第17頁,共60頁,2023年,2月20日,星期五常用的u界值參考值范圍(%)單側(cè)雙側(cè)9095991.2821.6452.3261.6451.9602.576第18頁,共60頁,2023年,2月20日,星期五第19頁,共60頁,2023年,2月20日,星期五例某地調(diào)查正常成年男子144人的紅細(xì)胞數(shù)近似正態(tài)分布,得均數(shù)為5.38(1012/L),標(biāo)準(zhǔn)差為0.44(1012/L),試估計該地成年男子紅細(xì)胞數(shù)的95%參考值范圍。第20頁,共60頁,2023年,2月20日,星期五百分位數(shù)法:

適用于偏態(tài)分布資料

例如白細(xì)胞數(shù)的95%參考值范圍:因為白細(xì)胞數(shù)無論過高或過低均屬異常,則分別計算P2.5和P97.5,這是雙側(cè)95%參考值范圍。百分范圍(%)單側(cè)雙側(cè)下限上限下限上限95P5P95P2.5P97.599P1P99P0.5P99.5第21頁,共60頁,2023年,2月20日,星期五例某年某市調(diào)查了200例正常成人血鉛含量(μg/100g)如下,試估計該市成人血鉛含量95%醫(yī)學(xué)參考值范圍(用百分位數(shù)法計算)。第22頁,共60頁,2023年,2月20日,星期五第23頁,共60頁,2023年,2月20日,星期五練習(xí)1:調(diào)查某地120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態(tài)分布,其血紅蛋白平均值為117.4(g/L),標(biāo)準(zhǔn)差為10.2(g/L),試估計該地健康女性血紅蛋白的95%醫(yī)學(xué)參考值范圍。

血紅蛋白過高、過低均為異常,應(yīng)按雙側(cè)計算:第24頁,共60頁,2023年,2月20日,星期五一、均數(shù)的抽樣分布與抽樣誤差抽樣研究的目的就是要用樣本信息來推斷總體特征。由于存在個體變異,樣本均數(shù)(X)往往不等于總體均數(shù)(),因此抽樣后各個樣本均數(shù)也往往不等于總體均數(shù),且各個樣本均數(shù)間也不一定都相等。這種由抽樣造成的樣本均數(shù)與總體均數(shù)的差異或各樣本均數(shù)之間的差異稱為抽樣誤差,抽樣誤差是不可避免的。數(shù)值變量的參數(shù)估計第25頁,共60頁,2023年,2月20日,星期五第26頁,共60頁,2023年,2月20日,星期五第27頁,共60頁,2023年,2月20日,星期五110名20歲健康男大學(xué)生的身高均數(shù)為172.73cm。第28頁,共60頁,2023年,2月20日,星期五已知Σf=110,ΣfX=19000,需要在該表中增加fx2欄,由第(3)、(4)欄相乘,再將該欄數(shù)據(jù)相加,將ΣfX2=3283646代入公式第29頁,共60頁,2023年,2月20日,星期五110名20歲男大學(xué)生的平均身高X=172.73cm,標(biāo)準(zhǔn)差s=4.09cm。假設(shè)該110個身高數(shù)值作為假設(shè)的有限總體,即:

μ=172.73cm,σ=4.09cm現(xiàn)在從該總體中隨機抽10個學(xué)生身高為1號樣本。計算得:X1=173.22cms1=4.05cm第30頁,共60頁,2023年,2月20日,星期五第31頁,共60頁,2023年,2月20日,星期五重復(fù)100次剛才的抽樣,得到100個樣本(每個樣本含量均為10個),可算得100個樣本均數(shù)X。第32頁,共60頁,2023年,2月20日,星期五各樣本均數(shù)的均數(shù)X=172.66cmμ=172.73cm第33頁,共60頁,2023年,2月20日,星期五第34頁,共60頁,2023年,2月20日,星期五樣本均數(shù)的抽樣分布具有以下特點:各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異;樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù),中間多、兩邊少,左右基本對稱,也服從正態(tài)分布;樣本均數(shù)的變異較之原變量的變異大大縮小。第35頁,共60頁,2023年,2月20日,星期五總體均數(shù)為μ,標(biāo)準(zhǔn)差σ樣本1(,s)樣本2(,s)樣本3(,s)樣本m(,s)抽樣,樣本量為n…第36頁,共60頁,2023年,2月20日,星期五根據(jù)正態(tài)分布原理,若隨機變量X服從正態(tài)分布,則樣本均數(shù)X也服從正態(tài)分布。隨機變量X:N(μ,2)

樣本均數(shù):N(μ,)

第37頁,共60頁,2023年,2月20日,星期五均數(shù)的標(biāo)準(zhǔn)誤及計算

反映均數(shù)抽樣誤差大小的指標(biāo)是樣本均數(shù)X的標(biāo)準(zhǔn)差簡稱標(biāo)準(zhǔn)誤(理論值),用表示,或SE、SEM。由于在實際抽樣研究中往往未知,通常用某一樣本標(biāo)準(zhǔn)差s來替代,得標(biāo)準(zhǔn)誤的估計值(通常也簡稱為標(biāo)準(zhǔn)誤),其計算公式為:第38頁,共60頁,2023年,2月20日,星期五以1號樣本=173.22cm,s1=4.05cm為例:均數(shù)的標(biāo)準(zhǔn)誤及計算第39頁,共60頁,2023年,2月20日,星期五

一般情況下未知,常用估計抽樣誤差的大小,也即的估計值。例2000年某研究者隨機調(diào)查某地健康成年男子27人,得到血紅蛋白量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計該樣本均數(shù)的抽樣誤差。將X=125g/L,s=15g/L,n=27代入第40頁,共60頁,2023年,2月20日,星期五例:已知s=6.85,

n=100則樣本均數(shù)的抽樣誤差為多少?第41頁,共60頁,2023年,2月20日,星期五標(biāo)準(zhǔn)誤的應(yīng)用1.反映樣本均數(shù)的可靠性;

標(biāo)準(zhǔn)誤反映抽樣誤差的大小。標(biāo)準(zhǔn)誤大,表示抽樣誤差大,則樣本均數(shù)估計總體均數(shù)的可靠性差。反之,標(biāo)準(zhǔn)誤小,抽樣誤差小,樣本均數(shù)估計總體均數(shù)的可靠性好。2.估計總體均數(shù)的可信區(qū)間;3.用于均數(shù)的假設(shè)檢驗。

第42頁,共60頁,2023年,2月20日,星期五二、總體均數(shù)的可信區(qū)間估計即用樣本指標(biāo)(統(tǒng)計量)估計總體指標(biāo)(參數(shù))有兩種常用方法:點估計和區(qū)間估計(一)點估計:樣本均數(shù)()就是總體均數(shù)的點估計值(μ)

該法簡單,但未考慮抽樣誤差,而抽樣誤差在抽樣研究中是不可忽視的。第43頁,共60頁,2023年,2月20日,星期五(二)區(qū)間估計:結(jié)合樣本統(tǒng)計量和標(biāo)準(zhǔn)誤可以確定一個具有一定可信度的包含總體參數(shù)的區(qū)間,該區(qū)間稱為總體參數(shù)的1-α可信區(qū)間(confidenceinterval,CI)第44頁,共60頁,2023年,2月20日,星期五即按一定的概率估計未知總體均數(shù)的所在范圍。

習(xí)慣上用總體均數(shù)的95%(或99%)可信區(qū)間,表示該區(qū)間包含總體均數(shù)的概率為95%(或99%),用此范圍估計總體平均數(shù),表示100次抽樣中,有95(99)次包含總體均數(shù)。例如:總體均數(shù)的可信區(qū)間第45頁,共60頁,2023年,2月20日,星期五(1)未知,但樣本例數(shù)n足夠大(如n﹥50),總體均數(shù)的1-α雙側(cè)可信區(qū)間為總體均數(shù)95%的雙側(cè)可信區(qū)間為:總體均數(shù)可信區(qū)間的計算總體均數(shù)99%的雙側(cè)可信區(qū)間為:第46頁,共60頁,2023年,2月20日,星期五例某市2000年隨機測量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,試估計該市2000年19歲健康男大學(xué)生平均身高的95%可信區(qū)間。本例n=90,可按正態(tài)分布近似法計算故該市2000年19歲健康男大學(xué)生平均身高的95%可信區(qū)間為(171.3,173.1)cm。第47頁,共60頁,2023年,2月20日,星期五t分布第48頁,共60頁,2023年,2月20日,星期五

前面講過,通過u變換,可將正態(tài)分布N(μ,2)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布N(0,1)。同樣,若從正態(tài)分布N(μ,2)總體中隨機抽樣并算得多個樣本均數(shù),它們?nèi)苑目傮w均數(shù)為μ,總體標(biāo)準(zhǔn)差為的正態(tài)分布N(μ,),則服從第49頁,共60頁,2023年,2月20日,星期五標(biāo)準(zhǔn)正態(tài)分布N(0,1)。在實際工作中,往往是未知,常用替代,即

這時,對正態(tài)變量X采取的不是u變換而是t變換了,t值的分布稱為t分布。第50頁,共60頁,2023年,2月20日,星期五第51頁,共60頁,2023年,2月20日,星期五1.單峰分布,以0為中心,左右對稱;2.t分布是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)n-1。越小,與的差別越大,t值越分散,曲線的峰部越矮,尾部越粗。越大,t分布越接近于標(biāo)準(zhǔn)正態(tài)分布。t分布的特征:第52頁,共60頁,2023年,2月20日,星期五自由度分別為1、5、∞的t分布第53頁,共60頁,2023年,2月20日,星期五由于t分布不是一條曲線,而是一簇曲線。因此,t分布曲線下面積的95%或99%界值不是一個常量,而是隨著自由度大小而變化的。為便于使用,可根據(jù)t界值表查找。第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論