總體均數(shù)估計_第1頁
總體均數(shù)估計_第2頁
總體均數(shù)估計_第3頁
總體均數(shù)估計_第4頁
總體均數(shù)估計_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1第六章

總體均數(shù)的估計

2西南財經(jīng)大學(xué)近日發(fā)布《中國家庭金融調(diào)查報告》,報告顯示截至2011年8月,中國家庭資產(chǎn)平均為121.69萬元,城市家庭平均為247.60萬元,農(nóng)村家庭平均為37.70萬元。有網(wǎng)民說,看到這個數(shù)字第一個反應(yīng)是自己“被平均了”。(據(jù)《現(xiàn)代快報》)3

10%的家庭收入占整個社會總收入的57%,5%家庭收入占整個社會總收入的44%,說明中國家庭收入不均等。

——李宏彬

中國城市家庭平均資產(chǎn)有200多萬,但平均資產(chǎn)的中位數(shù)只有40.5萬。兩者差距越大,表明財產(chǎn)分布越不均。

——甘犁

4城鎮(zhèn)單位職工平均工資(1952-2007)

567891011@火炮大師

:昨天晚上,老弟說去協(xié)和醫(yī)院給我嬸掛號看病。。。結(jié)果被工作人員告知,要排隊掛號的話,得排3天。。。我就XXX的!??!這年頭看病也太恐怖了吧。。。廢話少說。。。上圖。。。你沒有看錯。。。這不是收容所。。。這都是排隊掛號的。。。。

12主要內(nèi)容均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計13一、均數(shù)的抽樣誤差總體樣本隨機抽樣推斷14

由于個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異稱為抽樣誤差。1.抽樣誤差(samplingerror)15

常把這種由抽樣研究造成的樣本均數(shù)與總體均數(shù)間的差異稱為均數(shù)的抽樣誤差。

由抽樣研究造成的樣本率與總體率間的差異稱為率的抽樣誤差。16

抽樣誤差是不可避免的,但能估計其大小。常用樣本均數(shù)的標(biāo)準(zhǔn)差作為衡量均數(shù)抽樣誤差大小的尺度。即均數(shù)標(biāo)準(zhǔn)誤。2.標(biāo)準(zhǔn)誤(Standarderror)17σ標(biāo)準(zhǔn)誤示意圖xμσpopulationx18抽樣試驗

從正態(tài)分布總體N(5.00,0.502)中,每次隨機抽取樣本含量n=5,并計算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實驗;比較計算結(jié)果。19抽樣試驗(n=5)2021抽樣試驗(n=10)2223抽樣試驗(n=30)24251000份樣本抽樣計算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913263個抽樣實驗結(jié)果圖示:27抽樣實驗小結(jié)1.均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。2.均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤

與總體標(biāo)準(zhǔn)差相差一個常數(shù)的倍數(shù),即3.從正態(tài)總體N(m,s2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(m,s2/n)

。281.從正態(tài)分布N(

,

2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布,樣本均數(shù)的總體均數(shù)仍為

,樣本均數(shù)的標(biāo)準(zhǔn)差為2.即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;3.隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。中心極限定理centrallimittheorem29從同一個總體做3次抽樣的結(jié)果圖示:30標(biāo)準(zhǔn)誤(standarderror)樣本均數(shù)的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤,是說明均數(shù)抽樣誤差大小的指標(biāo),大,抽樣誤差大;反之,小,抽樣誤差小。標(biāo)準(zhǔn)誤的計算:標(biāo)準(zhǔn)誤的估計值:31影響標(biāo)準(zhǔn)誤大小的因素

的大小與

成正比與樣本含量n的平方根成反比32例6.1隨機抽取某地正常成年男性200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,試估計抽樣誤差:33例子6.2兩文獻表述有何區(qū)別34標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別:(1)概念不同

標(biāo)準(zhǔn)差是描述樣本個體值間的變異,標(biāo)準(zhǔn)差小,說明變量值圍繞均數(shù)的波動小,均數(shù)的代表性好。

標(biāo)準(zhǔn)誤是描述樣本均數(shù)的抽樣誤差,標(biāo)準(zhǔn)誤越小,表示樣本均數(shù)圍繞總體均數(shù)的波動越小。35(2)用途不同

標(biāo)準(zhǔn)差表示變量值對均數(shù)的波動大小,當(dāng)資料呈正態(tài)分布時,與均數(shù)結(jié)合估計正常值范圍、計算變異系數(shù)、標(biāo)準(zhǔn)誤等。標(biāo)準(zhǔn)誤表示樣本統(tǒng)計量對總體參數(shù)的波動情況,用于估計參數(shù)的可信區(qū)間、進行假設(shè)檢驗。361)兩者均為變異指標(biāo);2)樣本含量不變時,均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比;3)兩者均可與均數(shù)結(jié)合使用(但描述的內(nèi)容各不相同)。(3)聯(lián)系37在應(yīng)用過程中要注意標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別:383940414243444546t分布

t分布的由來t分布的特征t分布曲線下的面積47總體

樣本均數(shù)

中心極限定理標(biāo)準(zhǔn)正態(tài)分布

標(biāo)準(zhǔn)正態(tài)分布

未知t分布

t分布的由來變量變換48如果抽取例數(shù)n=5的樣本k個,每個樣本又都可以按公式(9.20)計算出一個t值,可將k個t值編制成頻數(shù)表,作出直方圖,當(dāng)k無限增大時,則可得到一條光滑的曲線。

(9.20

)同理,如果抽取例數(shù)n=10時,仍能得到一條t分布曲線,因此,當(dāng)n變化時,就可以得到不同的t分布曲線,如下圖49xμpopulation

t1

t2

t3

tkN=5N=5N=5N=550xμpopulation

t1

t2

t3

tkN=10N=10N=10N=10圖3.2自由度分別為4、9、∞的t分布

52t分布曲線的特點

①單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱②與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見紅線)③其形態(tài)變化與自由度

的大小有關(guān)。自由度

越小,則t值越分散,曲線越低平;隨自由度增大,曲線逐漸接近正態(tài)分布。53

它與樣本例數(shù)n或自由度ν

有關(guān),某個自由度對應(yīng)于一條t分布曲線。當(dāng)n或ν不同時,曲線形狀不同。當(dāng)

時,t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。自由度:ν=n-1隨機變量能夠自由取值的個數(shù)54t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化,如附表3。55附表3,t分布表的特點附表3的橫標(biāo)目為自由度

,縱標(biāo)目為概率P,表中數(shù)值為其相應(yīng)的t界值,記作t

,

;t取值于某個區(qū)間的概率P相當(dāng)與橫軸上該區(qū)間與曲線所夾面積。附表3給出了t分布曲線下單側(cè)或雙側(cè)尾部面積所對應(yīng)的界值;雙側(cè)t0.05/2,9=2.262=單側(cè)t0.025.9單側(cè)t0.05,9=1.833雙側(cè)t0.05/2,∞=1.96=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.64t分布曲線下面積57附表3只列出正值,若計算的t值為負(fù)值時,可用其絕對值查表。其通式為雙側(cè):P(t≤-t

/2,

)+P(t≥t

/2,

)=

單側(cè):P(t≤-t

,

)=

或P(t≥t

,

)=

圖中非陰影部分面積的概率為,P(-t

/2,

<t<t

/2,

)=1-

-t

,

t

,

2.5%2.5%0以下附圖的陰影部分表示t

,

以外尾部面積的概率。59二、總體均數(shù)的估計

參數(shù)的估計點估計:由樣本統(tǒng)計量直接估計總體參數(shù)缺點:沒有考慮抽樣誤差。區(qū)間估計:在一定可信度下,同時考慮抽樣誤差。601.點估計11名18歲男大學(xué)生身高均數(shù)資料得,

=172.25cm,S=3.31cm,試估計該地18歲男大學(xué)生身高總體均數(shù)?答:該地18歲男大學(xué)生身高總體均數(shù)為172.25cm612.區(qū)間估計

概念:即按一定的概率(1-

)估計總體均數(shù)所在的范圍。概率(1-

)稱為置信度。常取95%和99%,又稱置信區(qū)間(ConfidenceInterval,CI)。

62

有1-α的把握認(rèn)為該區(qū)間包含了總體參數(shù)。而非總體參數(shù)落在該范圍的可能性為α。

置信區(qū)間的含義

63置信區(qū)間的確切含義

95%置信區(qū)間:從總體中作隨機抽樣,作100次抽樣,每個樣本可算得一個置信區(qū)間,得100個置信區(qū)間,平均有95個可信區(qū)間包括μ(估計正確),只有5個可信區(qū)間不包括μ(估計錯誤)。圖100個來自N(0,1)的樣本所估計的可信區(qū)間示意

65一次抽樣算得的置信區(qū)間,當(dāng)

=0.05時,95%CI估計正確的概率為0.95,估計錯誤的概率小于或等于0.05,即有95%的可能性包含了總體均數(shù)。

66置信區(qū)間的兩個要素

準(zhǔn)確度:反映在置信度(1-

)的大小上,即置信區(qū)間包含總體均數(shù)的可能性大小,從準(zhǔn)確度的角度看,愈接近1愈好,如置信度99%比95%好。精密度:反映在置信區(qū)間的長度上,用區(qū)間長度CU-CL衡量。即長度愈小精密度愈好。67

在抽樣誤差確定的情況下,二者是相互矛盾的,若提高了可信度,可信區(qū)間勢必增大,精密度下降。一般情況下,常用95%置信區(qū)間。

在置信度確定的情況下,增加樣本含量可減小區(qū)間寬度。68

資料不同,總體均數(shù)的估計方法也不同,根據(jù)資料的條件,計算方法有三種:總體均數(shù)的置信區(qū)間估計方法(1)

未知,且n?。喊磘分布原理計算可信區(qū)間。

-t

,

t

,

2.5%2.5%0

由于:則:70所以,總體均數(shù)的100(1-α)%可信區(qū)間的通式為:

71例6.3:在某地成年男子中隨機抽取25人,測得其脈搏均數(shù)為72次/min,標(biāo)準(zhǔn)差為8次/min。試估計該地成年男性脈搏總體均數(shù)的95%置信區(qū)間。

=(68.7,75.3)次/分

根據(jù)樣本計算,可推斷該地成年男性脈搏總體均數(shù)的95%置信區(qū)間為(68.7,75.3)次/分。72(2)

未知,但n足夠大時(n>100),t分布逼近z分布。按z

分布原理計算可信區(qū)間。z

-z

由于:則:所以,總體均數(shù)的100(1-α)%之置信區(qū)間的通式為:

74例

測得某地110名18歲男大學(xué)生身高=172.73cm,s=4.09cm,估計該地18歲男大學(xué)生身高均數(shù)的95%可信區(qū)間。

本例n=110,=172.73cm,s=4.09cm,雙側(cè)z0.05/2=1.96按式(3.7)計算:即:該地18歲男大學(xué)生身高均數(shù)的95%可信區(qū)間為171.97cm~173.49cm75(3)σ已知:故可按正態(tài)分布原理估計總體均數(shù)的可信區(qū)間,計算公式為:76

未知,且n小

已知:

未知,但n足夠大:三種情況兩總體均數(shù)差值的置信區(qū)間(自學(xué))

假設(shè)正態(tài)總體和,當(dāng),均未知,但時,則兩總體均數(shù)之差()的雙側(cè)()置信區(qū)間為:其中,,當(dāng)n1,n2均較大時,差值的置信區(qū)間為:78例6.5測定28例結(jié)核病患者和34例對照者的腦脊液中鎂(mmol/L)的含量,結(jié)果見表6.5,試估計結(jié)核病人和對照者的腦脊液中鎂含量的總體均數(shù)之差的95%置信區(qū)間。

表6.5兩對比組腦脊液中鎂含量(mmol)

組別例數(shù)均數(shù)標(biāo)準(zhǔn)差結(jié)核組281.040.17對照組341.280.14解:假定兩組方差齊,根據(jù)公式6.7,6.8,6.9可得:

故兩總體均數(shù)之差的95%可信區(qū)間為(0.16,0.32)mmol/L80可信區(qū)間的注意問題1.可信區(qū)間的涵義意思是從總體中作隨機抽樣,每個樣本可以算得一個可信區(qū)間。如95%可信區(qū)間意味著做100次抽樣,算得100個可信區(qū)間,平均有95個估計正確,估計錯誤的只有5次。5%是小概率事件,實際發(fā)生的可能性很小,當(dāng)然這種估計方法會有5%犯錯誤的風(fēng)險。812.可信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論