衛(wèi)生統(tǒng)計學之抽樣誤差和抽樣分布概述_第1頁
衛(wèi)生統(tǒng)計學之抽樣誤差和抽樣分布概述_第2頁
衛(wèi)生統(tǒng)計學之抽樣誤差和抽樣分布概述_第3頁
衛(wèi)生統(tǒng)計學之抽樣誤差和抽樣分布概述_第4頁
衛(wèi)生統(tǒng)計學之抽樣誤差和抽樣分布概述_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、衛(wèi)生統(tǒng)計學抽樣誤差和抽樣分布Sampling Error and Sampling Distribution主要內(nèi)容容抽樣誤差差抽樣誤差差的重要要性抽樣誤差差的定義義抽樣誤差差的規(guī)律律性標準誤標準誤的的定義標準誤的的計算標準誤的的意義標準誤的的作用t分布t分布的的演化t分布的的圖形t分布的的性質(zhì)F分布2分布1.1抽抽樣誤誤差的重重要性既然有誤誤差,為為什么還還要抽樣樣?無限總體體的客觀觀存在試驗研究究的成本本效益問問題(cost effect)抽樣誤差差的重要要性總體同質(zhì)個體體、個體體變異總體參數(shù)數(shù)未知樣本代表性、抽樣誤誤差隨機抽樣樣本統(tǒng)計計量已知統(tǒng)計推斷斷風險險1.2抽抽樣誤誤差的定定義假如

2、事先先知道某某地七歲歲男童的的平均身身高為119.41cm。為了估估計七歲歲男童的的平均身身高(總總體均數(shù)數(shù)),研研究者從從所有符符合要求求的七歲歲男童中中每次抽抽取100人,共計計抽取了了五次。119.41cm= 4.38cm抽樣誤差差的定義義五次抽樣樣得到了了不同的的結(jié)果,原因何何在?個體變異隨機抽樣不同男童的身高不同每次抽到的人幾乎不同抽樣誤差抽樣誤差差的定義義【定義】由于個體體變異的的存在,在抽樣樣研究中中產(chǎn)生樣樣本統(tǒng)計計量和總總體參數(shù)數(shù)之間的的差異,稱為抽抽樣誤差差(samplingerror)。各種參數(shù)數(shù)都有抽抽樣誤差差,這里里我們以以均數(shù)為為研究對對象抽樣誤差差的表現(xiàn)現(xiàn)抽樣誤差的

3、表現(xiàn)樣本均數(shù)和總體均數(shù)間的差別樣本均數(shù)和樣本均數(shù)間的差別抽樣誤差差定義。只要有個個體變異異和隨機機抽樣研研究,抽抽樣誤差差就是不可避免免的。抽樣誤差差有自己己的客觀觀規(guī)律,統(tǒng)計學學就是撥撥開抽樣樣誤差之之霧來洞洞察客觀觀規(guī)律的的利器。1.3抽抽樣誤誤差的規(guī)規(guī)律性既然抽樣樣誤差是是有規(guī)律律的,那那么到底底它的分分布規(guī)律律到底是是怎樣的的?LetsEnjoyOurExperiments!中心極限限定理(central limit theorem)的表現(xiàn)從正態(tài)總總體中隨隨機抽樣樣,其樣樣本均數(shù)數(shù)服從正正態(tài)分布布;從任意總總體中隨隨機抽樣樣,當樣樣本含量量足夠大大時,其其樣本均均數(shù)的分分布逐漸漸逼近正

4、正態(tài)分布布;樣本均數(shù)數(shù)之均數(shù)數(shù)的位置置始終在在總體均均數(shù)的附附近;隨著樣本本含量的的增加,樣本均均數(shù)的離離散程度度越來越越小,表表現(xiàn)為樣樣本均數(shù)數(shù)的分布布范圍越越來越窄窄,其高高峰越來來越尖。2.1標標準誤誤的定義義樣本統(tǒng)計計量(如如均數(shù))也服從從一定的的分布;與描述觀觀測值離離散趨勢勢的指標標類似,我們使使用樣本統(tǒng)計計量的標標準差來反映抽抽樣誤差差的大小小。又稱稱標準誤(standarderror)。標準誤(standarderror)樣本統(tǒng)計計量的標標準差稱稱為標準準誤。樣本均數(shù)數(shù)的標準差稱稱為均數(shù)數(shù)的標準準誤。樣本均數(shù)數(shù)的標準準誤表示示樣本均均數(shù)的變變異度。2.2標標準誤誤的計算算計算公

5、式式為其中,為總體標標準差,n為抽樣的的樣本例例數(shù)在研究工作時,由于總體標準準差常常未知,可可以利用用樣本標標準差近近似估計計標準誤的的計算【例】根據(jù)7歲男童的的身高資資料,在已知總總體標準準差時,標準誤誤為4.38/10=0.438cm而若以第第一次抽抽樣的樣樣本標準準差來代代替總體體標準差差,則標標準誤為為4.45/10=0.445cm2.3標標準誤誤的意義義標準誤的的意義反映了樣樣本統(tǒng)計計量(樣樣本均數(shù)數(shù),樣本本率)分分布的離離散程度度,體現(xiàn)現(xiàn)了抽樣樣誤差的的大小。標準誤越越大,說說明樣本本統(tǒng)計量量(樣本本均數(shù),樣本率率)的離離散程度度越大,即用樣樣本統(tǒng)計計量來直直接估計計總體參參數(shù)越不

6、不可靠。反之亦亦然。標準誤的的大小與與標準差差有關,在例數(shù)數(shù)n一定時,從標準準差大的的總體中中抽樣,標準誤誤較大;而當總總體一定定時,樣樣本例數(shù)數(shù)越多,標準誤誤越小。說明我我們可以以通過增增加樣本本含量來來減少抽抽樣誤差差的大小小。2.4標標準誤誤的作用用標準誤的的用途衡量樣本本統(tǒng)計量量代表總總體參數(shù)數(shù)的可靠靠性;估計總體體參數(shù)的的可信區(qū)區(qū)間;進行假設設檢驗。2.5標標準差差和標準準誤的聯(lián)聯(lián)系與區(qū)區(qū)別標準差標準誤對象個體變異抽樣誤差計算方法定義定義性質(zhì)n越大,標準差越穩(wěn)定n越大,標準誤越小用途參考值范圍衡量離散程度可信區(qū)間,假設檢驗3.1樣樣本均均數(shù)的抽抽樣分布布規(guī)律中心極限限定理從均數(shù)為為,

7、標準差差為的正態(tài)總總體中隨隨機抽樣樣,樣本本均數(shù)服服從均數(shù)數(shù)為,標準差差為的的正正態(tài)分布布。從均數(shù)為為,標準差差為的任意總總體中隨隨機抽樣樣,當樣樣本含量量足夠大大時,樣樣本均數(shù)數(shù)近似服服從均數(shù)數(shù)為,標準差差為的的正正態(tài)分布布。 3.2t分布布的演化化根據(jù)中心心極限定定理的內(nèi)內(nèi)容,當當樣本含含量足夠夠大時,對從均均數(shù)為,標準差差為的任意總總體中隨隨機抽樣樣所得的的樣本均均數(shù)進行行標準化化變換,有t分布的演演化由于總體體標準差差往往是是未知的的,此時時往往用用樣本標標準差代代替總體體標準差差,這里,為自由度度(degreeoffreedom,df),取值為為n-1由W.S.Gosset提出 f(

8、t) =(標準正態(tài)曲線) =5 =10.10.2-4-3-2-1012340.3自由度分分別為1、5、時的t分布3.3t分布布的圖形形由Gosset提出3.4t分布的性性質(zhì)t分布為一一簇單峰峰分布曲曲線。t分布以0為中心,左右對對稱。分布的高高峰位置置比u分布低,尾部高高。即相相同的尾尾部面積積對應的的界值,比u分布大。例如:P=0.05,u=1.64,而自由度為為10的t分布界值值,t= 1.812。t分布與自自由度有關,自自由度越越小,t分布的峰峰越低,而兩側(cè)側(cè)尾部翹翹得越高高;自由由度逐漸漸增大時時,t分布逐漸漸逼近標標準正態(tài)態(tài)分布;當自由由度為無無窮大時時,t分布就是是標準正正態(tài)分布布

9、。每一自由由度下的的t分布曲線線都有其其自身分分布規(guī)律律。t界值表。t界值表單側(cè):P(t=t,)=雙側(cè):P(t=t,)=即:P(-t,tt,)=1-例查t界值表得得t值表達式式t0.05,10=2.228(雙側(cè))t0.05,10=1.812(單側(cè))-tt042分布設從正態(tài)態(tài)分布N(,2)中隨機機抽取含含量為n的樣本,樣本均均數(shù)和標標準差分分別為和和s,設:則2值服從自自由度為為n-1的2分布(2-distribution),是小寫希希臘字母母,讀作作chi??梢?,2分布是方方差的抽抽樣分布布。2分布的特特征2分布為一一簇單峰峰正偏態(tài)態(tài)分布曲曲線,自由度為為的2分布,其其均數(shù)為為,方差為為2。1

10、時2分布實際際上是標標準正態(tài)態(tài)分布變變量之平平方。自自由度為為的2分布實際際上是個標準正正態(tài)分布布變量之之平方和和??杀肀硎緸椋?=u12+u22+uv2每一自由由度下的的2分布曲線線都有其其自身分分布規(guī)律律=4=3=520246810120.00.10.20.30.40.5f(2)=1=2=62分布的作作用方差的抽抽樣分布布研究樣本分布布與理論論分布的的擬合優(yōu)優(yōu)度檢驗驗率或構(gòu)成成比的比比較5F分布設從兩個個方差相相等的正正態(tài)分布布N(1,2)和N(2,2)總體中中隨機抽抽取含量量分別為為n1和n2的樣本,樣本均均數(shù)和標標準差分分別為、s1和、s2。設:則F值服從自自由度為為(n1-1,n2-1)的的F分布(F-distribution)。F分布的特特征F分布為一一簇單峰峰正偏態(tài)態(tài)分布曲曲線,與與兩個自自由度有有關。若F服從自由由度為(1,2)的F分布,則則其倒數(shù)數(shù)1/F服從自由由度為(2,1)的F分布。自由度為為(1,2)的F分布,其其均數(shù)為為2/(2-2),與第一一自由度度無關。第一自由由度11時,F(xiàn)分布實際際上是t分布之平平方;第第二自由由度2時,F(xiàn)分布實際際上等于于2分布。每一對自自由度下下的F分布曲線線下的面面積分布布規(guī)律。 0123450.00.20.4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論