第五章 參數(shù)估計(jì)_第1頁(yè)
第五章 參數(shù)估計(jì)_第2頁(yè)
第五章 參數(shù)估計(jì)_第3頁(yè)
第五章 參數(shù)估計(jì)_第4頁(yè)
第五章 參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2011級(jí)預(yù)防醫(yī)學(xué)專業(yè)

《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》沈月平副教授,PhD醫(yī)學(xué)部公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)教研室E-mail:shenyueping@.cmOffice:401-14032015/10/121第五章參數(shù)估計(jì)前言第一節(jié)抽樣誤差第二節(jié)t-分布和二項(xiàng)分布第三節(jié)單個(gè)總體參數(shù)的置信區(qū)間第四節(jié)兩總體之差的置信區(qū)間小結(jié)作業(yè)2計(jì)量資料的統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷集中趨勢(shì)離散趨勢(shì)參數(shù)估計(jì)假設(shè)檢驗(yàn)點(diǎn)估計(jì),區(qū)間估計(jì)兩樣本均數(shù)比較t,u-test多個(gè)樣本均數(shù)比較F-test計(jì)數(shù)資料的統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷集中趨勢(shì)離散趨勢(shì)參數(shù)估計(jì)假設(shè)檢驗(yàn)絕對(duì)數(shù),相對(duì)數(shù)率的標(biāo)準(zhǔn)誤點(diǎn)估計(jì),區(qū)間估計(jì)兩樣本率比較χ2-test多個(gè)樣本率比較χ2-test第一節(jié)抽樣誤差抽樣誤差(samplingerror)

:由抽樣造成的統(tǒng)計(jì)量與總體參數(shù)及樣本統(tǒng)計(jì)量之間的差別稱為抽樣誤差。均數(shù)抽樣誤差和率的抽樣誤差是建立在抽樣研究基礎(chǔ)上所發(fā)生的偏差,只能減小,不可避免5一、均數(shù)的抽樣誤差由于隨機(jī)抽樣所引起的樣本均數(shù)與總體均數(shù)之間的差異或樣本均數(shù)之間的差異;如何評(píng)估抽樣誤差?6如何評(píng)估抽樣誤差?抽樣試驗(yàn)(samplingtrial)7抽樣試驗(yàn)?zāi)呈?008年19歲女生身高服從均數(shù)μ=160.5cm,σ=5.2cm的正態(tài)分布;從X~N(160.5,5.22)的正態(tài)總體中隨機(jī)抽樣,樣本含量nj=20,g=100;共抽100次;圖1.2008年某市19歲女生身高均數(shù)

N(160.5,5.22)的抽樣示意μ=160.5cmσ=5.2cmX1,X2,X3…Xj…,

160.19,1.05158.97,1.39160.37,1.47:161.64,1.44100個(gè)新的分布特點(diǎn)10樣本均數(shù)組成一個(gè)新的分布特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存在差異;樣本均數(shù)的分布很有規(guī)律;100個(gè)樣本均數(shù)的均數(shù)為160.43cm,而原總體均數(shù)為160.5cm()樣本均數(shù)的變異范圍較原變量的變異范圍大大縮??;標(biāo)準(zhǔn)差為1.18(5.2);

中心極限定理若原變量服從正態(tài)分布,則新變量服從正態(tài)分布;若原變量不服從正態(tài)分布,n較大(大于等于30或50),則新變量服從正態(tài)分布;n較小,新變量為非正態(tài)分布;標(biāo)準(zhǔn)誤:估計(jì)抽樣誤差大小的指標(biāo)標(biāo)準(zhǔn)誤(standarderror,SE):樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差;樣本均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM):;樣本均數(shù)的標(biāo)準(zhǔn)誤的估計(jì)值:例2000年某研究者隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白含量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差。均數(shù)標(biāo)準(zhǔn)誤的含義反映均數(shù)抽樣誤差大小的一個(gè)指標(biāo);均數(shù)的標(biāo)準(zhǔn)誤與原分布的標(biāo)準(zhǔn)差成

正比,與抽樣樣本量n開(kāi)根號(hào)成反比;欲減少抽樣誤差,可增加樣本量;利用均數(shù)標(biāo)準(zhǔn)誤可以進(jìn)行總體均數(shù)的置信區(qū)間的估計(jì)和假設(shè)檢驗(yàn)。第二節(jié)t分布t分布的由來(lái)t分布的圖形和特征t界值表

標(biāo)準(zhǔn)正態(tài)變換X0,1ut變換0t抽樣實(shí)驗(yàn)

t分布的由來(lái)Xt分布圖形的演變

t分布圖形的演變英國(guó)統(tǒng)計(jì)學(xué)家Gosset于1908年以筆名“Student”發(fā)表了一篇論文,提出了t分布(distribution)的理論,因此t分布又稱為學(xué)生氏t分布,其分布密度函數(shù)是:其中,為伽瑪函數(shù)符號(hào),它是已知函數(shù);π為圓周率;ν表示自由度。24t分布圖形的特征單峰分布,以0為中心,左右對(duì)稱只有一個(gè)參數(shù)ν(自由度n-1),

ν越小,則t值越分散,峰部越矮而尾部翹得越高當(dāng)ν逼近∞時(shí),t分布逼近u分布t分布圖形下面積具有規(guī)律性總面積為1;任意兩區(qū)間的面積都可以用積分的方法求出;當(dāng)單雙側(cè)確定時(shí),自由度ν確定時(shí),尾部面積(α)與橫軸t值之間有一一對(duì)應(yīng)的關(guān)系;tα/2,ν表示雙側(cè)尾部面積為α,自由度為ν時(shí)的t界值;tα,ν表示單側(cè)尾部面積為α,自由度為ν時(shí)的t界值;t界值表的特點(diǎn)(p410)表示在單雙側(cè)確定時(shí),自由度ν確定時(shí),t界值越大,外圍面積(P)越??;反之亦然;單雙側(cè)確定時(shí),外圍面積(α或P)確定時(shí),自由度ν越大,t界值越小,當(dāng)ν→∞時(shí),t=u;t0.05/2,∞=1.96;t0.01/2,∞=2.58第三節(jié)單個(gè)總體參數(shù)的置信區(qū)間(二)區(qū)間估計(jì)(intervalestimation)按預(yù)先給定的概率(1-α)確定的包含未知總體參數(shù)的可能范圍。(一)點(diǎn)估計(jì):用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值1、σ已知單側(cè):雙側(cè):或一、總體均數(shù)的置信區(qū)間(一)正態(tài)分布法2、σ未知,但樣本例數(shù)n足夠大時(shí)(n>50)雙側(cè):?jiǎn)蝹?cè):或(一)正態(tài)分布法3、σ未知時(shí),n不是很大(最常用)雙側(cè):~單側(cè):或(二)t分布法例5.332置信區(qū)間的含義表示以一定的置信區(qū)間(1-α)估計(jì)總體均數(shù)(參數(shù))可能的波動(dòng)范圍;總體均數(shù)95%CI(confidenceinterval)表示隨機(jī)抽樣100次(n固定),計(jì)算100個(gè)置信區(qū)間,平均有95個(gè)區(qū)間包含總體均數(shù),有5個(gè)不包含;但對(duì)一次抽樣來(lái)講,只能說(shuō)是包含或不包含95%CI與99%CI的區(qū)別點(diǎn)估計(jì)與置信區(qū)間的差別正常參考值范圍與置信區(qū)間的差別33二、二項(xiàng)分布

(Binomialdistribution)與率的置信區(qū)間Bernoulli試驗(yàn)以A表示所感興趣的事件,A事件發(fā)生稱為“成功”,不出現(xiàn)稱為“失敗”。相應(yīng)的這類試驗(yàn)稱作為“成一敗型”試驗(yàn)或Bernoulli試驗(yàn)。Bernoulli試驗(yàn)滿足條件(1)每次試驗(yàn)結(jié)果只能是兩個(gè)互斥結(jié)果之一(A或非A)。(2)每次試驗(yàn)的條件不變,每次試驗(yàn)結(jié)果A事件發(fā)生的概率為常數(shù)

。(3)各次試驗(yàn)獨(dú)立,即每次試驗(yàn)出現(xiàn)事件A的概率與前面各次試驗(yàn)出現(xiàn)的結(jié)果無(wú)關(guān)。二項(xiàng)分布的概念n次重復(fù)獨(dú)立試驗(yàn)(Bernoulli試驗(yàn)),當(dāng)每次試驗(yàn)的“陽(yáng)性概率”保持不變時(shí),出現(xiàn)“陽(yáng)性”的次數(shù)k=0,1,2…,n的一種概率分布。,k=0,1,2,…n

n為試驗(yàn)例數(shù),k為陽(yáng)性次數(shù),

π為陽(yáng)性率,

當(dāng)n和

不同時(shí),二項(xiàng)分布的概率是不同的,所以說(shuō)n和

是二項(xiàng)分布的兩個(gè)重要參數(shù)。如果隨機(jī)變量x服從以n和

為參數(shù)的二項(xiàng)分布,則記作x~B(n,

)。二項(xiàng)分布的概率計(jì)算

恰好有k例陽(yáng)性數(shù)的概率為最多發(fā)生k例,即x

k的累計(jì)概率為最少發(fā)生k例,即x

k的累計(jì)概率二項(xiàng)分布概率的遞推公式為二項(xiàng)分布的性質(zhì)

2、二項(xiàng)分布的正態(tài)近似(normalapproximation)

概率論中的中心極限定理證明:當(dāng)n足夠大時(shí),且

不接近于0也不接近于1時(shí),且

n

和n(1-)≥5,二項(xiàng)分布x~B(n,

)近似于正態(tài)分布

N(n

,)。樣本率的分布和正態(tài)近似

樣本率的分布和正態(tài)近似例5-X從陽(yáng)性率樣本率

=0.6的總體中隨機(jī)抽取樣本量為16的樣本,求樣本率p的均數(shù)和標(biāo)準(zhǔn)差。樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。同樣樣本率的標(biāo)準(zhǔn)差也稱為率的標(biāo)準(zhǔn)誤,它描述了樣本率抽樣誤差的大小。樣本率的分布和正態(tài)近似樣本率分布的正態(tài)近似當(dāng)樣本量n較大,總體率

不接近于0也不接近1時(shí),且n

和n(1-)≥5,樣本陽(yáng)性率也近似服從正態(tài)分布p~N(

,)。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論