抽樣誤差區(qū)間估計_第1頁
抽樣誤差區(qū)間估計_第2頁
抽樣誤差區(qū)間估計_第3頁
抽樣誤差區(qū)間估計_第4頁
抽樣誤差區(qū)間估計_第5頁
已閱讀5頁,還剩59頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計學(xué)

—MedicalStatistics彭志行DepartmentofEpidemiology&BiostatisticsSchoolofPublicHealthNanjingMedicalUniversityReview:□統(tǒng)計資料的整理與描述□頻數(shù)分布和描述集中位置的指標(biāo)□描述離散趨勢的指標(biāo)□正態(tài)分布的特征及曲線的面積規(guī)律□標(biāo)準(zhǔn)正態(tài)分布□正態(tài)分布的應(yīng)用4.1抽樣誤差和抽樣分布SamplingErrorandSamplingDistribution主要內(nèi)容□抽樣誤差抽樣誤差的重要性抽樣誤差的定義抽樣誤差的規(guī)律性□標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤的定義標(biāo)準(zhǔn)誤的計算標(biāo)準(zhǔn)誤的意義標(biāo)準(zhǔn)誤的作用□

t分布t分布的演化t分布的圖形t分布的性質(zhì)抽樣誤差的重要性既然有誤差,為什么還要抽樣?□無限總體的客觀存在□試驗研究的成本效益問題(costeffect)總體同質(zhì)個體、個體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機抽樣樣本統(tǒng)計量已知統(tǒng)計推斷風(fēng)險抽樣誤差的重要性

抽樣誤差的定義假如事先知道某地七歲男童的平均身高為119.41cm。為了估計七歲男童的平均身高(總體均數(shù)),研究者從所有符合要求的七歲男童中每次抽取100人,共計抽取了五次。μ=119.41cmσ=4.38cm抽樣誤差的定義五次抽樣得到了不同的結(jié)果,原因何在?個體變異隨機抽樣不同男童的身高不同每次抽到的人幾乎不同抽樣誤差抽樣誤差的定義【定義】由于個體變異的存在,在抽樣研究中產(chǎn)生樣本統(tǒng)計量和總體參數(shù)之間的差異,稱為抽樣誤差(samplingerror)。各種參數(shù)都有抽樣誤差,這里我們以均數(shù)為研究對象抽樣誤差的表現(xiàn)抽樣誤差的表現(xiàn)樣本均數(shù)和總體均數(shù)間的差別樣本均數(shù)和樣本均數(shù)間的差別抽樣誤差□只要有個體變異和隨機抽樣研究,抽樣誤差就是不可避免的。□抽樣誤差有自己的客觀規(guī)律,統(tǒng)計學(xué)就是撥開抽樣誤差之霧來洞察客觀規(guī)律的利器。抽樣誤差的規(guī)律性

既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的?

□從正態(tài)總體中隨機抽樣,其樣本均數(shù)服從正態(tài)分布;□從任意總體中隨機抽樣,當(dāng)樣本含量足夠大時,其樣本均數(shù)的分布逐漸逼近正態(tài)分布;□樣本均數(shù)之均數(shù)的位置始終在總體均數(shù)的附近;□隨著樣本含量的增加,樣本均數(shù)的離散程度越來越小,表現(xiàn)為樣本均數(shù)的分布范圍越來越窄,其高峰越來越尖。中心極限定理(centrallimittheorem)的表現(xiàn)標(biāo)準(zhǔn)誤的定義□樣本統(tǒng)計量(如均數(shù))也服從一定的分布;□與描述觀測值離散趨勢的指標(biāo)類似,我們使用樣本統(tǒng)計量的標(biāo)準(zhǔn)差來衡量抽樣誤差的大小。又稱標(biāo)準(zhǔn)誤(standarderror,SE)?!跛詷颖揪鶖?shù)的標(biāo)準(zhǔn)差,稱為均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤的計算□計算公式為其中,σ為總體標(biāo)準(zhǔn)差,n為抽樣的樣本例數(shù)□在研究工作時,由于總體標(biāo)準(zhǔn)差常常未知,可以利用樣本標(biāo)準(zhǔn)差近似估計標(biāo)準(zhǔn)誤的計算【例9】根據(jù)7歲男童的身高資料,在已知總體標(biāo)準(zhǔn)差時,標(biāo)準(zhǔn)誤為4.38/10=0.438cm而若以第一次抽樣的樣本標(biāo)準(zhǔn)差來代替總體標(biāo)準(zhǔn)差,則標(biāo)準(zhǔn)誤為4.45/10=0.445cm標(biāo)準(zhǔn)誤的意義□反映了樣本統(tǒng)計量(樣本均數(shù),樣本率)分布的離散程度,體現(xiàn)了抽樣誤差的大小?!鯓?biāo)準(zhǔn)誤越大,說明樣本統(tǒng)計量(樣本均數(shù),樣本率)的離散程度越大,即用樣本統(tǒng)計量來直接估計總體參數(shù)越不可靠。反之亦然。□標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差有關(guān),在例數(shù)n一定時,從標(biāo)準(zhǔn)差大的總體中抽樣,標(biāo)準(zhǔn)誤較大;而當(dāng)總體一定時,樣本例數(shù)越多,標(biāo)準(zhǔn)誤越小。說明我們可以通過增加樣本含量來減少抽樣誤差的大小。標(biāo)準(zhǔn)誤的作用標(biāo)準(zhǔn)誤的用途□衡量樣本統(tǒng)計量代表總體參數(shù)的可靠性;□估計總體參數(shù)的可信區(qū)間;□進行假設(shè)檢驗。標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)差的區(qū)別和聯(lián)系區(qū)別1、意義上標(biāo)準(zhǔn)差描述個體值之間的變異,即觀察值之間的離散程度;而標(biāo)準(zhǔn)誤是描述統(tǒng)計量的抽樣誤差,即樣本統(tǒng)計量和總體參數(shù)的接近程度;2、用途上標(biāo)準(zhǔn)差常用于表現(xiàn)觀察值的波動范圍;標(biāo)準(zhǔn)誤常表示抽樣誤差的大小,估計總體參數(shù)的可信區(qū)間。3、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤與樣本含量標(biāo)準(zhǔn)差是隨著樣本含量的增多,逐漸趨于穩(wěn)定。標(biāo)準(zhǔn)誤是隨著樣本含量的增多,逐漸減少。聯(lián)系首先,標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤都是變異指標(biāo),說明個體之間的變異用標(biāo)準(zhǔn)差,說明統(tǒng)計量之間的變異用標(biāo)準(zhǔn)誤。其次,當(dāng)樣本含量不變時,標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤亦越大,均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。樣本均數(shù)的抽樣分布規(guī)律中心極限定理從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)總體中隨機抽樣,樣本均數(shù)服從均數(shù)為μ,標(biāo)準(zhǔn)差為的正態(tài)分布。從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的任意總體中隨機抽樣,當(dāng)樣本含量足夠大時,樣本均數(shù)近似服從均數(shù)為μ,標(biāo)準(zhǔn)差為的正態(tài)分布。t分布的演化根據(jù)中心極限定理的內(nèi)容,當(dāng)樣本含量足夠大時,對從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的任意總體中隨機抽樣所得的樣本均數(shù)進行標(biāo)準(zhǔn)化變換,有□由于總體標(biāo)準(zhǔn)差往往是未知的,此時往往用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,

這里,ν為自由度(degreeoffreedom,df),取值為n-1,□由W.S.Gosset提出。t分布的演化

f(t)

=∞(標(biāo)準(zhǔn)正態(tài)曲線)

=5

=10.10.2-4-3-2-1012340.3自由度分別為1、5、∞時

t分布的圖形t分布的性質(zhì)□t分布為一簇單峰分布曲線,以0為中心,左右對稱?!醴植嫉母叻逦恢帽萿分布低,尾部高。即相同的尾部面積對應(yīng)的界值,比u分布大。例如:P=0.05,u=1.64,而自由度為10的t分布界值,t=1.812。□t分布與自由度

有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高;自由度逐漸增大時,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度為無窮大時,t分布就是標(biāo)準(zhǔn)正態(tài)分布。□每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表每一自由度下的t分布曲線都有其自身分布規(guī)律,這個規(guī)律可見于t界值表。表上的陰影部分,表示t

,

以外的尾部面積占總面積的百分數(shù),即概率P。表中數(shù)據(jù)表示

確定時相應(yīng)的t界值(criticalvalue),常記為t

,

。例如,當(dāng)

=10,單尾概率

=0.05時,查表得單尾t0.05,10=1.812,表明,按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,則由該樣本計算的t值大于等于1.812的概率為0.05,或者小于等于-1.812的概率亦為0.05,可表示為:P(t≤-1.812)=0.05或P(t≥1.812)=0.05例如,當(dāng)

=10,雙尾概率

=0.05時,查表得雙尾t0.05,10=2.228,表明,按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,則由該樣本計算的t值大于等于2.228的概率為0.025,小于等于-2.228的概率亦為0.025??杀硎緸椋篜(t≤-2.228)+P(t≥2.228)=0.05或:P(-2.228<t<2.228)=1-0.05=0.95。從t分布圖不難看出:①在相同自由度時∣t∣值越大,概率P越小;②在相同t值時,雙尾概率P為單尾概率P的兩倍。如雙尾t0.10,10=單尾t0.05,10=1.812。t界值表單側(cè):P(t<=-tα,ν)=α或

P(t>=tα,ν)=α雙側(cè):

P(t<=-tα,ν)+P(t>=tα,ν)=α

即:P(-tα,ν<t<tα,ν)=1-α【例10】查t界值表得t值表達式

t0.05,10=2.228(雙側(cè))

t0.05,10=1.812(單側(cè))-tt0小結(jié)□抽樣誤差的定義和表現(xiàn)□抽樣誤差的規(guī)律:中心極限定理□標(biāo)準(zhǔn)誤的定義及其意義□t分布的演化、圖形、特征及意義4.2區(qū)間估計和可信區(qū)間IntervalEstimationandConfidenceInterval主要內(nèi)容□統(tǒng)計推斷□點估計□區(qū)間估計區(qū)間估計的實質(zhì)可信區(qū)間的定義總體均數(shù)可信區(qū)間的計算□正確理解可信區(qū)間的含義統(tǒng)計推斷所謂統(tǒng)計推斷(statisticalinference),是指如何抽樣,以及如何用樣本性質(zhì)推斷總體特征。

參數(shù)估計(parameterestimation)

假設(shè)檢驗(hypothesistesting)統(tǒng)計推斷的思路總體個體、個體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機抽樣樣本統(tǒng)計量已知統(tǒng)計推斷風(fēng)險參數(shù)估計

□點估計(PointEstimation)Touseanumbertoestimatetheparameter.□區(qū)間估計(IntervalEstimation)Toobtainarangesoastoincludetheparameter.(1)點估計用樣本統(tǒng)計量作為總體參數(shù)的估計例如:用樣本均數(shù)作為總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論