參數(shù)估計(jì)基礎(chǔ)_第1頁
參數(shù)估計(jì)基礎(chǔ)_第2頁
參數(shù)估計(jì)基礎(chǔ)_第3頁
參數(shù)估計(jì)基礎(chǔ)_第4頁
參數(shù)估計(jì)基礎(chǔ)_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

參數(shù)估計(jì)基礎(chǔ)1第一頁,共四十五頁,編輯于2023年,星期五第六章參數(shù)估計(jì)基礎(chǔ)

第一節(jié)抽樣分布與抽樣誤差第二節(jié)t分布第三節(jié)總體均數(shù)及總體概率的估計(jì)2第二頁,共四十五頁,編輯于2023年,星期五總體(population)與樣本(sample)參數(shù)(parameter)與統(tǒng)計(jì)量(statistics)參數(shù)的獲取途徑對總體進(jìn)行研究抽樣研究有關(guān)知識的回顧3第三頁,共四十五頁,編輯于2023年,星期五有關(guān)知識的回顧總體樣本隨機(jī)抽樣

統(tǒng)計(jì)推斷抽樣研究過程示意圖統(tǒng)計(jì)描述統(tǒng)計(jì)表統(tǒng)計(jì)圖統(tǒng)計(jì)指標(biāo)總體樣本4第四頁,共四十五頁,編輯于2023年,星期五第一節(jié)抽樣分布與抽樣誤差一、樣本均數(shù)的抽樣分布與抽樣誤差二、樣本頻率的抽樣分布與抽樣誤差5第五頁,共四十五頁,編輯于2023年,星期五一、樣本均數(shù)的抽樣分布與抽樣誤差1、樣本均數(shù)的抽樣分布

抽樣模擬實(shí)驗(yàn):

假定總體:某年某地13歲女學(xué)生身高值

X~N(155.4,5.3)

隨機(jī)抽樣:n=30,K=100

6第六頁,共四十五頁,編輯于2023年,星期五實(shí)驗(yàn)6-1從已知13歲女學(xué)生身高總體中隨機(jī)抽樣示意圖(n=30,k=100)μ=155.4σ=5.3……7第七頁,共四十五頁,編輯于2023年,星期五樣本號均數(shù)樣本號均數(shù)1156.751155.72158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.245155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.7100156.6100個(gè)隨機(jī)樣本的樣本均數(shù)(n=30)8第八頁,共四十五頁,編輯于2023年,星期五2、樣本均數(shù)抽樣分布的特點(diǎn)9第九頁,共四十五頁,編輯于2023年,星期五表6-2從正態(tài)總體(155.4,5.3)隨機(jī)抽樣得到樣本均數(shù)的頻數(shù)分布(n=30,k=100)組段頻數(shù)頻率(%)152.6~1

1.0153.2~4

4.0153.8~4

4.0154.4~2222.0155.0~2525.0155.6~2121.0156.2~1717.0156.8~3

3.0157.4~2

2.0158.0~158.61

1.0合計(jì)100100.010第十頁,共四十五頁,編輯于2023年,星期五樣本均數(shù)抽樣分布的特點(diǎn):(1)各樣本均數(shù)未必等于總體均數(shù)(2)樣本均數(shù)之間存在差異(3)樣本均數(shù)的分布呈對稱分布(4)樣本均數(shù)的變異較原變量的變異大大縮小11第十一頁,共四十五頁,編輯于2023年,星期五

3、樣本均數(shù)的抽樣誤差(1)概念:由個(gè)體變異產(chǎn)生,抽樣引起的樣本均數(shù)與總體均數(shù)間的差異。(2)表現(xiàn)形式:樣本均數(shù)與總體均數(shù)間的差異;樣本均數(shù)之間的差異12第十二頁,共四十五頁,編輯于2023年,星期五(3)產(chǎn)生的條件抽樣研究個(gè)體變異(4)特點(diǎn):隨機(jī)、不可避免、有規(guī)律可循13第十三頁,共四十五頁,編輯于2023年,星期五4、樣本均數(shù)的標(biāo)準(zhǔn)誤如何度量抽樣誤差的大?。烤鶖?shù)的抽樣誤差可表現(xiàn)為樣本均數(shù)與總體均數(shù)的差值均數(shù)的抽樣誤差也可表現(xiàn)為多個(gè)樣本均數(shù)間的離散程度14第十四頁,共四十五頁,編輯于2023年,星期五

中心極限定理(centrallimittheorem)的涵義從均數(shù)為、標(biāo)準(zhǔn)差為σ的正態(tài)總體中抽樣,當(dāng)n固定,樣本均數(shù)的分布趨于均數(shù)為、標(biāo)準(zhǔn)差為的正態(tài)分布。即:X~N~N15第十五頁,共四十五頁,編輯于2023年,星期五理論標(biāo)準(zhǔn)誤:估計(jì)標(biāo)準(zhǔn)誤:當(dāng)未知16第十六頁,共四十五頁,編輯于2023年,星期五

從非正態(tài)總體抽樣,抽樣實(shí)驗(yàn)

X~偏態(tài)分布

~偏態(tài)分布當(dāng)n較小n≥50~近似正態(tài)分布17第十七頁,共四十五頁,編輯于2023年,星期五樣本均數(shù)的標(biāo)準(zhǔn)誤(standarderror,SE)概念:符號:計(jì)算:意義:影響因素:18第十八頁,共四十五頁,編輯于2023年,星期五1、樣本頻率的抽樣分布電腦摸球?qū)嶒?yàn):設(shè)一口袋中有黑白兩色球,黑球占20%,從袋中有放回地重復(fù)摸球35次,計(jì)算摸到黑球的百分比。將上述實(shí)驗(yàn)重復(fù)100次,得到100個(gè)樣本頻率。二、樣本頻率的抽樣分布與抽樣誤差19第十九頁,共四十五頁,編輯于2023年,星期五

實(shí)驗(yàn)6-3電腦摸球?qū)嶒?yàn)隨機(jī)抽樣示意圖(n=35,k=100)20第二十頁,共四十五頁,編輯于2023年,星期五表6-3從總體(π=20%)中隨機(jī)抽樣得到100個(gè)樣本頻率的分布(n=35)組段(%)頻數(shù)頻率(%)5.0~33.08.0~77.011.0~55.014.0~88.017.0~1616.020.0~2222.022.0~1515.025.0~77.028.0~77.031.0~55.034.0~33.0

37.0~40.022.0合計(jì)100100.021第二十一頁,共四十五頁,編輯于2023年,星期五2、樣本頻率抽樣分布的特點(diǎn)22第二十二頁,共四十五頁,編輯于2023年,星期五樣本頻率抽樣分布的特點(diǎn):(1)各樣本頻率未必等于總體概率(2)各樣本頻率之間存在差異(3)樣本頻率圍繞總體概率呈對稱分布23第二十三頁,共四十五頁,編輯于2023年,星期五3、樣本頻率的抽樣誤差(1)概念(2)表現(xiàn)形式(3)產(chǎn)生條件(4)特點(diǎn)24第二十四頁,共四十五頁,編輯于2023年,星期五4、樣本率的標(biāo)準(zhǔn)誤概念符號計(jì)算統(tǒng)計(jì)學(xué)意義影響因素當(dāng)未知25第二十五頁,共四十五頁,編輯于2023年,星期五1、什么是抽樣誤差?決定抽樣誤差大小的因素有哪些?如何控制抽樣誤差?2、抽樣誤差能避免么?為什么?3、抽樣誤差有規(guī)律么?4、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤有何區(qū)別與聯(lián)系?思考題26第二十六頁,共四十五頁,編輯于2023年,星期五第二節(jié)t分布一、t值與t分布二、t分布的圖形三、t界值表27第二十七頁,共四十五頁,編輯于2023年,星期五一、t值與t分布

X~N(m,s2)Z~N(0,1)t~t(n-1)Z~N(0,1)隨機(jī)抽樣當(dāng)未知28第二十八頁,共四十五頁,編輯于2023年,星期五29第二十九頁,共四十五頁,編輯于2023年,星期五

f(t)

=∞(標(biāo)準(zhǔn)正態(tài)曲線)

=5

=10.10.2-4-3-2-1012340.3自由度分別為1、5、∞時(shí)的t分布t值30第三十頁,共四十五頁,編輯于2023年,星期五二、t分布的圖形一簇曲線單峰分布以t=0為對稱軸曲線形態(tài)取決于其極限形式為標(biāo)準(zhǔn)正態(tài)分布曲線31第三十一頁,共四十五頁,編輯于2023年,星期五三、t界值表(tcriticalvalue)1、t界值表的結(jié)構(gòu)橫標(biāo)目:υ=n-1縱標(biāo)目:概率P,即曲線下尾部陰影部分面積表中的數(shù)字:t界值(t≥0)單側(cè)概率(one-tailedprobability)t界值記為tα,ν雙側(cè)概率(two-tailedprobability

)t界值記為tα/2,ν32第三十二頁,共四十五頁,編輯于2023年,星期五-tt0第三十三頁,共四十五頁,編輯于2023年,星期五2、查表練習(xí)

(1)t0.05,16=1.746(單側(cè))

P(t≥1.746)=0.05或P(t≤-1.746)=0.05

(2)t0.05/2,16=2.120(雙側(cè))

P(t≥2.120)+P(t≤-2.120)=0.05或P(-2.120<t<2.120)=0.95

t分布曲線的兩端尾部面積表示:在隨機(jī)抽樣中獲得的等于及大于某|t|值(界值)的概率,即P值。34第三十四頁,共四十五頁,編輯于2023年,星期五單、雙側(cè)t分布示意圖單側(cè)雙側(cè)35第三十五頁,共四十五頁,編輯于2023年,星期五3、t界值表的特點(diǎn)同一自由度下,t值越大則P值越小對于相同t值,雙側(cè)概率為單側(cè)概率的兩倍υ→∞時(shí),t界值為Z界值36第三十六頁,共四十五頁,編輯于2023年,星期五第三節(jié)總體均數(shù)及總體概率的估計(jì)一、參數(shù)估計(jì)(parameterestimation)的概念1、概念:用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)2、方法:

(1)點(diǎn)估計(jì)(pointestimation)

(2)區(qū)間估計(jì)(intervalestimation)

37第三十七頁,共四十五頁,編輯于2023年,星期五二、置信區(qū)間的計(jì)算(一)總體均數(shù)的置信區(qū)間

1.t分布法適用條件:σ未知時(shí),t分布原理計(jì)算公式:

38第三十八頁,共四十五頁,編輯于2023年,星期五2、正態(tài)近似法適用條件:σ未知且n足夠大(如n>50),正態(tài)分布原理。計(jì)算公式:39第三十九頁,共四十五頁,編輯于2023年,星期五例1:為了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機(jī)抽取了1歲嬰兒35人,測得其血紅蛋白均數(shù)為123.7g/L,標(biāo)準(zhǔn)差為11.9g/L。試估計(jì)該地1歲嬰兒的血紅蛋白平均濃度。40第四十頁,共四十五頁,編輯于2023年,星期五例2:某地抽得正常成人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,試估計(jì)該地正常成人血清膽固醇均數(shù)的95%和99%置信區(qū)間41第四十一頁,共四十五頁,編輯于2023年,星期五(二)總體概率的置信區(qū)間1、查表法:適用條件n≤50直接查附表6(百分率的可信區(qū)間)2、正態(tài)近似法:適用條件:n>50且np、n(1-p)均>5

計(jì)算公式:

95%的總體率的置信區(qū)間

99%的總體率的置信區(qū)間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論