




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、抽樣誤差和可信區(qū)間 Sampling Error & Confidence Intervals,Medical statistics 醫(yī)學(xué)統(tǒng)計(jì)學(xué),主要內(nèi)容(Content),抽樣誤差及其規(guī)律性 標(biāo)準(zhǔn)誤 抽樣分布與t分布 統(tǒng)計(jì)推斷與參數(shù)估計(jì) 總結(jié),一均數(shù)的抽樣誤差(sampling error)與標(biāo)準(zhǔn)誤(standard error, SE),抽樣研究的目的是要用樣本信息推斷總體特征,稱統(tǒng)計(jì)推斷,1. 抽樣誤差的定義,假如事先知道某地七歲男童的平均身高為119.41cm。為了估計(jì)七歲男童的平均身高(總體均數(shù)),研究者從所有符合要求的七歲男童中每次抽取100人,共計(jì)抽取了三次。,三次抽樣得到了不同
2、的結(jié)果,原因何在?,【定義】由于個(gè)體變異的存在,在抽樣研究中產(chǎn)生樣本統(tǒng)計(jì)量和總體參數(shù)之間的差異,稱為抽樣誤差(sampling error)。 各種參數(shù)都有抽樣誤差,這里我們以均數(shù)為研究對(duì)象,抽樣誤差的定義,抽樣誤差的表現(xiàn),抽樣誤差的重要性,總體 同質(zhì)個(gè)體、個(gè)體變異,總體參數(shù) 未知,樣本 代表性、抽樣誤差,隨機(jī) 抽樣,樣本統(tǒng)計(jì)量 已知,統(tǒng)計(jì)推斷,風(fēng) 險(xiǎn),2. 抽樣誤差的規(guī)律性(分布),既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的?,SAMPLE 1:x11 x12 x13 x14.x1n,SAMPLE 2:x21 x22 x23 x24.x2n,SAMPLE k:xk1 xk2 x
3、k3 xk4.xkn,A Simulation Study,原始 總體 ,k個(gè)樣本均數(shù)的頻數(shù)分布圖,從正態(tài)總體中隨機(jī)抽樣,其樣本均數(shù)服從正態(tài)分布; 從任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),其樣本均數(shù)的分布逐漸逼近正態(tài)分布; 樣本均數(shù)之均數(shù)的位置始終在總體均數(shù)的附近; 隨著樣本含量的增加,樣本均數(shù)的離散程度越來(lái)越小,表現(xiàn)為樣本均數(shù)的分布范圍越來(lái)越窄,其高峰越來(lái)越尖。,(1)xN(, 2) 則 N(, 2/n) x是偏態(tài)總體,n30 近似正態(tài) (2) 的總體均數(shù)為, 標(biāo)準(zhǔn)差 =/,3. 標(biāo)準(zhǔn)誤的定義,抽樣誤差的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(standard error)。 樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差反映了從某個(gè)總體
4、中隨機(jī)抽樣所得樣本之均數(shù)分布的離散程度。,標(biāo)準(zhǔn)誤的計(jì)算,計(jì)算公式為 其中,為總體標(biāo)準(zhǔn)差,n為抽樣的樣本例數(shù) 在研究工作時(shí),由于總體標(biāo)準(zhǔn)差常常未知,可以利用樣本標(biāo)準(zhǔn)差近似估計(jì),標(biāo)準(zhǔn)誤的意義,反映了樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)分布的離散程度,體現(xiàn)了抽樣誤差的大小。 標(biāo)準(zhǔn)誤越大,說(shuō)明樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)的離散程度越大,即用樣本統(tǒng)計(jì)量來(lái)直接估計(jì)總體參數(shù)越不可靠。反之亦然。 標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差有關(guān),在例數(shù)n一定時(shí),從標(biāo)準(zhǔn)差大的總體中抽樣,標(biāo)準(zhǔn)誤較大;而當(dāng)總體一定時(shí),樣本例數(shù)越多,標(biāo)準(zhǔn)誤越小。說(shuō)明我們可以通過(guò)增加樣本含量來(lái)減少抽樣誤差的大小。,二t分布,xN(, 2) 作變換u= N(0,
5、1) 同理u= 但 通常未知 t= t(n-1),二 t分布,根據(jù)中心極限定理的內(nèi)容,當(dāng)樣本含量足夠大時(shí),對(duì)從均數(shù)為,標(biāo)準(zhǔn)差為的任意總體中隨機(jī)抽樣所得的樣本均數(shù)進(jìn)行標(biāo)準(zhǔn)化變換,有,t分布的演化,由于總體標(biāo)準(zhǔn)差往往是未知的,此時(shí)往往用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差, 這里,為自由度,取值為n-1 由W.S. Gosset提出,自由度分別為1、5、 時(shí)的 t 分布,t分布的圖形,t分布的性質(zhì),t分布為一簇單峰分布曲線,高峰在0的位置上,說(shuō)明從正態(tài)總體中隨機(jī)抽樣所得樣本計(jì)算出的t值接近0的可能性較大。 t分布以0為中心,左右對(duì)稱。 分布的高峰位置比 u 分布低,尾部高。 t分布與自由度有關(guān),自由度越小,t
6、分布的峰越低,而兩側(cè)尾部翹得越高;自由度逐漸增大時(shí),t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度為無(wú)窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。 每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表 。,t分布曲線下的面積,t界值表,單側(cè): P(t t,)= 雙側(cè): P(t t,)= 即:P(-t,t t,)= 1- 例 查t界值表得t值表達(dá)式 t 0.05,10=2.228 (雙側(cè)) t 0.05,10=1.812 (單側(cè)),統(tǒng)計(jì)推斷,所謂統(tǒng)計(jì)推斷(statistical inference),是指如何抽樣,以及如何用樣本性質(zhì)推斷總體特征。 參數(shù)估計(jì)(parameter estimation) 假設(shè)檢驗(yàn)(hyp
7、othesis testing),三. 參數(shù)估計(jì),點(diǎn)估計(jì)(Point Estimation) 區(qū)間估計(jì) (Interval Estimation),參數(shù)估計(jì)之一:點(diǎn)估計(jì),用樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì) 例如: 用樣本均數(shù)作為總體均數(shù)的一個(gè)估計(jì),區(qū)間估計(jì),可信區(qū)間的定義 總體均數(shù)之可信區(qū)間的求解 均數(shù)之差的可信區(qū)間 可信區(qū)間的要素 正確理解可信區(qū)間的含義,區(qū)間估計(jì),【例4.1】 隨機(jī)抽取某地25名正常成年男子,測(cè)得該樣本的脈搏均數(shù)為73.6次/分,標(biāo)準(zhǔn)差為6.5次/分,估計(jì)正常成年男子脈搏總體均數(shù)。,區(qū)間估計(jì)的實(shí)質(zhì),假設(shè)某個(gè)總體的均數(shù)為,需要找到兩個(gè)量A和B,使得在一個(gè)比較高的可信度下(如95%
8、),區(qū)間(A,B)能包含。即 P(AB)=0.95,可信區(qū)間的定義,按一定的概率或可信度(1-)用一個(gè)區(qū)間來(lái)估計(jì)總體參數(shù)所在的范圍,該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間(confidence interval,CI),預(yù)先給定的概率(1-)稱為可信度或者置信度(confidence level),常取95%或99%。 可信區(qū)間(CL, CU )是一開(kāi)區(qū)間 CL、CU 稱為可信限,均數(shù)的(1-)100%可信區(qū)間,1-,均數(shù)的95%可信區(qū)間,樣本含量不是很大時(shí), 樣本含量較大時(shí),t分布逼近u分布,例:,【例4.1】 隨機(jī)抽取某地25名正常成年男子,測(cè)得該樣本的脈搏均數(shù)為73.6次/分,標(biāo)準(zhǔn)差為
9、6.5次/分,求該地正常成年男子脈搏總體均數(shù)95%的可信區(qū)間。 【例4.2】 某市2001年120名7歲男童的身高=123.62(cm),標(biāo)準(zhǔn)差s=4.75(cm),計(jì)算該市7歲男童總體均數(shù)90%的可信區(qū)間。,均數(shù)之差可信區(qū)間的計(jì)算,正常組 肝炎組, 1- 2 ?,合并方差與均數(shù)之差的標(biāo)準(zhǔn)誤,合并方差(方差的加權(quán)平均) 均數(shù)之差的標(biāo)準(zhǔn)誤,與均數(shù)之差有關(guān)的抽樣分布,“均數(shù)之差”與“均數(shù)之差的標(biāo)準(zhǔn)誤”之比, 服從自由度 = n1+n2 -2的 t 分布。 樣本含量較大時(shí),服從標(biāo)準(zhǔn)正態(tài)分布。,計(jì)算,可信區(qū)間的兩個(gè)要素,可信度(Confidence):準(zhǔn)確性,可靠性,即1-。 一般取90%,95,可人
10、為控制 精確性(Precision):區(qū)間的大小,越小越好。 必須二者兼顧,可信區(qū)間的寬度及影響因素,均數(shù)的95%可信區(qū)間為 則其寬度為,可信區(qū)間的寬度,可信度越大,可信區(qū)間越寬,說(shuō)明用該區(qū)間來(lái)估計(jì)總體參數(shù)(總體均數(shù))越可靠。 標(biāo)準(zhǔn)差越小,可信區(qū)間就越窄,意味著如果總體內(nèi)變異程度較小時(shí),在相同的可信度下,只需要一個(gè)比較窄的可信區(qū)間就可以估計(jì)總體均數(shù)。 隨著樣本含量的增加,可信區(qū)間逐漸變窄。,正確理解可信區(qū)間,可信度為95%的CI的涵義: 每100個(gè)樣本,按同樣方法計(jì)算95%的CI,平均有95%的CI包含了總體參數(shù)。 這里的95%,指的是方法本身!而不是某個(gè)區(qū)間! 總體參數(shù)雖未知,但卻是固定的值,而不是隨機(jī)變量值 。,95%可信區(qū)間的含義,按這種方法構(gòu)建的可信區(qū)間,理論上平均每100次,有95次可以估計(jì)到總體參數(shù)。,下列說(shuō)法正確嗎?,算得某95%的可信區(qū)間,則: 總體參數(shù)有95%的可能落在該區(qū)間。 有95%的總體
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)驅(qū)動(dòng)的員工能力發(fā)展研究-洞察及研究
- 安全生產(chǎn)獎(jiǎng)懲條例
- 驅(qū)動(dòng)精準(zhǔn)營(yíng)銷-客戶細(xì)分與大數(shù)據(jù)分析結(jié)合-洞察及研究
- 郵件服務(wù)業(yè)個(gè)人信息保護(hù)措施-洞察闡釋
- 微服務(wù)容錯(cuò)機(jī)制優(yōu)化-洞察及研究
- 綠色建筑設(shè)計(jì)標(biāo)準(zhǔn)與實(shí)踐-洞察闡釋
- 教師職業(yè)規(guī)劃與教育政策對(duì)接案例分析
- 醫(yī)療知識(shí)更新與終身學(xué)習(xí)的必由之路
- 教育心理學(xué)視角下的遠(yuǎn)程教育學(xué)習(xí)行為分析
- 教育心理學(xué)在科技教育中的實(shí)踐與思考
- 體檢中心接待規(guī)范流程
- 夏季食堂食品安全注意事項(xiàng)
- 知識(shí)產(chǎn)權(quán)合規(guī)管理體系解讀
- JJF(陜) 035-2020 雨滴譜式降水現(xiàn)象儀現(xiàn)場(chǎng)校準(zhǔn)規(guī)范
- 科研倫理與學(xué)術(shù)規(guī)范(研究生)期末試題
- 2024年網(wǎng)格員考試題庫(kù)完美版
- 出入境交通運(yùn)輸工具檢查課件
- 2024年廣東省安全員C證(專職安全生產(chǎn)管理人員)考試試題題庫(kù)
- 防雨雪冰凍應(yīng)急演練
- GB/T 44536-2024CVD陶瓷涂層熱膨脹系數(shù)和殘余應(yīng)力試驗(yàn)方法
- 大疆在線測(cè)評(píng)題
評(píng)論
0/150
提交評(píng)論