




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、Department of Epidemiology and BiostatisticsSchool of Public Health, Nanjing Medical University衛(wèi)生統(tǒng)計(jì)學(xué)抽樣誤差和抽樣分布Sampling Error and Sampling Distribution主要內(nèi)容o抽樣誤差n抽樣誤差的重要性n抽樣誤差的定義n抽樣誤差的規(guī)律性o標(biāo)準(zhǔn)誤n標(biāo)準(zhǔn)誤的定義n標(biāo)準(zhǔn)誤的計(jì)算n標(biāo)準(zhǔn)誤的意義n標(biāo)準(zhǔn)誤的作用ot分布nt分布的演化nt分布的圖形nt分布的性質(zhì)oF分布o(jì)2分布1.1 抽樣誤差的重要性o既然有誤差,為什么還要抽樣?n無限總體的客觀存在n試驗(yàn)研究的成本效益問題(c
2、ost effect)抽樣誤差的重要性總體同質(zhì)個(gè)體、個(gè)體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機(jī)抽樣樣本統(tǒng)計(jì)量已知統(tǒng)計(jì)推斷風(fēng) 險(xiǎn)1.2 抽樣誤差的定義o假如事先知道某地七歲男童的平均身高為119.41cm。為了估計(jì)七歲男童的平均身高(總體均數(shù)),研究者從所有符合要求的七歲男童中每次抽取100人,共計(jì)抽取了五次。119.41cm= 4.38cm118.21cm=4.45cmXs120.18cm=4.90cmXs117.78cm=3.98cmXs119.87m=5.15cmXs120.81cm=4.33cmXs抽樣誤差的定義o五次抽樣得到了不同的結(jié)果,原因何在?個(gè)體變異隨機(jī)抽樣不同男童的身高不同每
3、次抽到的人幾乎不同抽樣誤差抽樣誤差的定義【定義】由于個(gè)體變異的存在,在抽樣研究中產(chǎn)生樣本統(tǒng)計(jì)量和總體參數(shù)之間的差異,稱為抽樣誤差(sampling error)。各種參數(shù)都有抽樣誤差,這里我們以均數(shù)為研究對(duì)象抽樣誤差的表現(xiàn)抽樣誤差的表現(xiàn)樣本均數(shù)和總體均數(shù)間的差別iX樣本均數(shù)和樣本均數(shù)間的差別ijXX抽樣誤差o定義。o只要有個(gè)體變異和隨機(jī)抽樣研究,抽樣誤差就是不可避免的。o抽樣誤差有自己的客觀規(guī)律,統(tǒng)計(jì)學(xué)就是撥開抽樣誤差之霧來洞察客觀規(guī)律的利器。1.3 抽樣誤差的規(guī)律性 既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的? Lets Enjoy Our Experiments!中心極限定理
4、(central limit theorem)的表現(xiàn)o從正態(tài)總體中隨機(jī)抽樣,其樣本均數(shù)服從正態(tài)分布;o從任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),其樣本均數(shù)的分布逐漸逼近正態(tài)分布;o樣本均數(shù)之均數(shù)的位置始終在總體均數(shù)的附近;o隨著樣本含量的增加,樣本均數(shù)的離散程度越來越小,表現(xiàn)為樣本均數(shù)的分布范圍越來越窄,其高峰越來越尖。2.1 標(biāo)準(zhǔn)誤的定義o樣本統(tǒng)計(jì)量(如均數(shù))也服從一定的分布;o與描述觀測值離散趨勢(shì)的指標(biāo)類似,我們使用樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差來反映抽樣誤差的大小。又稱標(biāo)準(zhǔn)誤(standard error)。222XXXXkk標(biāo)準(zhǔn)誤(standard error)22xn2.2 標(biāo)準(zhǔn)誤的計(jì)算o計(jì)算公
5、式為其中,為總體標(biāo)準(zhǔn)差,n為抽樣的樣本例數(shù)o在研究工作時(shí),由于總體標(biāo)準(zhǔn)差常常未知,可以利用樣本標(biāo)準(zhǔn)差近似估計(jì)XnXssn標(biāo)準(zhǔn)誤的計(jì)算【例】根據(jù)7歲男童的身高資料,在已知總體標(biāo)準(zhǔn)差時(shí),標(biāo)準(zhǔn)誤為4.38/10=0.438cm而若以第一次抽樣的樣本標(biāo)準(zhǔn)差來代替總體標(biāo)準(zhǔn)差,則標(biāo)準(zhǔn)誤為4.45/10=0.445cm2.3 標(biāo)準(zhǔn)誤的意義o標(biāo)準(zhǔn)誤的意義n反映了樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)分布的離散程度,體現(xiàn)了抽樣誤差的大小。n標(biāo)準(zhǔn)誤越大,說明樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)的離散程度越大,即用樣本統(tǒng)計(jì)量來直接估計(jì)總體參數(shù)越不可靠。反之亦然。n標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差有關(guān),在例數(shù)n一定時(shí),從標(biāo)準(zhǔn)差大的總體中抽樣,
6、標(biāo)準(zhǔn)誤較大;而當(dāng)總體一定時(shí),樣本例數(shù)越多,標(biāo)準(zhǔn)誤越小。說明我們可以通過增加樣本含量來減少抽樣誤差的大小。2.4 標(biāo)準(zhǔn)誤的作用o標(biāo)準(zhǔn)誤的用途n衡量樣本統(tǒng)計(jì)量代表總體參數(shù)的可靠性;n估計(jì)總體參數(shù)的可信區(qū)間;n進(jìn)行假設(shè)檢驗(yàn)。2.5 標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的聯(lián)系與區(qū)別標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤對(duì)象個(gè)體變異抽樣誤差計(jì)算方法定義定義性質(zhì)n越大,標(biāo)準(zhǔn)差越穩(wěn)定n越大,標(biāo)準(zhǔn)誤越小用途參考值范圍衡量離散程度可信區(qū)間,假設(shè)檢驗(yàn)3.1 樣本均數(shù)的抽樣分布規(guī)律o中心極限定理u從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)總體中隨機(jī)抽樣,樣本均數(shù)服從均數(shù)為,標(biāo)準(zhǔn)差為 的正態(tài)分布。u從均數(shù)為,標(biāo)準(zhǔn)差為的任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),樣本均數(shù)近似服從均數(shù)為,
7、標(biāo)準(zhǔn)差為 的正態(tài)分布。 nn3.2 t分布的演化o根據(jù)中心極限定理的內(nèi)容,當(dāng)樣本含量足夠大時(shí),對(duì)從均數(shù)為,標(biāo)準(zhǔn)差為的任意總體中隨機(jī)抽樣所得的樣本均數(shù)進(jìn)行標(biāo)準(zhǔn)化變換,有(0,1)iiXNnt分布的演化o由于總體標(biāo)準(zhǔn)差往往是未知的,此時(shí)往往用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,這里,為自由度(degree of freedom,df),取值為n-1o由W.S. Gosset提出Xttsn f(t) =(標(biāo)準(zhǔn)正態(tài)曲線) =5 =10.10.2-4-3-2-1012340.3自由度分別為1、5、 時(shí)的 t 分布3.3 t分布的圖形由Gosset提出3.4 t分布的性質(zhì)ot分布為一簇單峰分布曲線。ot分布以0為中
8、心,左右對(duì)稱。o分布的高峰位置比 u 分布低,尾部高。即相同的尾部面積對(duì)應(yīng)的界值,比 u 分布大。例如:P=0.05,u=1.64,而,而自由度為10的 t分布界值,t = 1.812。ot分布與自由度有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高;自由度逐漸增大時(shí),t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度為無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。o每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表 。t界值表單側(cè): P(t =t,)= 雙側(cè): P(t =t,)= 即:P(-t,t t,)= 1-例 查t界值表得t值表達(dá)式 t 0.05,10=2.228 (雙側(cè)) t 0.05,10=1.812
9、 (單側(cè))-tt04 2分布o(jì)設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為 和s,設(shè):o則2值服從自由度為n-1的2分布(2-distribution),是小寫希臘字母,讀作chi??梢姡?分布是方差的抽樣分布。X222) 1(sn 2分布的特征o2分布為一簇單峰正偏態(tài)分布曲線,o自由度為的2分布,其均數(shù)為,方差為2。o1時(shí)2分布實(shí)際上是標(biāo)準(zhǔn)正態(tài)分布變量之平方。自由度為的2分布實(shí)際上是個(gè)標(biāo)準(zhǔn)正態(tài)分布變量之平方和。可表示為:2=u12+ u22+ uv2 o每一自由度下的2分布曲線都有其自身分布規(guī)律=4=3=520246810120.00.10.20.30.40.5f(
10、2)=1=2=62分布的作用o方差的抽樣分布研究 o樣本分布與理論分布的擬合優(yōu)度檢驗(yàn)o率或構(gòu)成比的比較 iiiTTA22)(5 F分布o(jì)設(shè)從兩個(gè)方差相等的正態(tài)分布N(1,2)和N(2,2)總體中隨機(jī)抽取含量分別為n1和n2的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為 、s1和 、 s2。設(shè): o則F值服從自由度為(n1-1,n2-1)的F分布(F-distribution)。 2X1X2221ssF F分布的特征oF分布為一簇單峰正偏態(tài)分布曲線,與兩個(gè)自由度有關(guān)。o若F服從自由度為(1,2)的F分布,則其倒數(shù)1/F服從自由度為(2,1)的F分布。o自由度為(1,2)的F分布,其均數(shù)為2/(2-2),與第一自由度無關(guān)。o第一自由度11時(shí),F(xiàn)分布實(shí)際上是t分布之平方;第二自由度2時(shí),F(xiàn)分布實(shí)際上等于2分布。o每一對(duì)自由度下的F分布曲線下的面積分布規(guī)律。 0123450.00.20.40.60.81.0 012345 0.00.20.40.60.81.01
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年秘書證考試知識(shí)整合及試題及答案
- 社區(qū)志愿服務(wù)隊(duì)企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 全面概述珠寶鑒定師考試試題及答案
- 慢性胃潰瘍的護(hù)理
- 化工廠職業(yè)健康教育培訓(xùn)
- 2024年記者證考試學(xué)習(xí)方法試題及答案
- 人教版高中物理精講精練-必修3第十二章 電能 能量守恒定律(解析版)
- 人教版高中物理精講精練-選擇性必修3第三章《熱力學(xué)定律》高分必刷鞏固達(dá)標(biāo)檢測卷(培優(yōu)卷) 解析版
- 把握2024年二級(jí)建造師考試試題及答案
- 2024年檔案管理工作展望試題及答案
- 完工工程量確認(rèn)單
- 國開土地利用規(guī)劃形考任務(wù)1-4答案
- 崗位價(jià)值評(píng)估表
- 學(xué)校食堂招標(biāo)書學(xué)校食堂招標(biāo)書
- 遵義會(huì)議與遵義會(huì)議精神簡化版教學(xué)課件
- 安全隱患排查情況登記表(學(xué)生宿舍)
- 經(jīng)陰道無張力尿道中段吊帶術(shù)術(shù)
- 《病毒》優(yōu)質(zhì)課一等獎(jiǎng)?wù)n件
- 權(quán)責(zé)發(fā)生制課件ppt
- 氣化爐的類型
- GB/T 39167-2020電阻點(diǎn)焊及凸焊接頭的拉伸剪切試驗(yàn)方法
評(píng)論
0/150
提交評(píng)論