第 參數(shù)估計(jì)基礎(chǔ)_第1頁
第 參數(shù)估計(jì)基礎(chǔ)_第2頁
第 參數(shù)估計(jì)基礎(chǔ)_第3頁
第 參數(shù)估計(jì)基礎(chǔ)_第4頁
第 參數(shù)估計(jì)基礎(chǔ)_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

會(huì)計(jì)學(xué)1第參數(shù)估計(jì)基礎(chǔ)

二、標(biāo)準(zhǔn)誤的計(jì)算【例5-1】假設(shè)已知100名(總體)正常成年男性紅細(xì)胞數(shù)的均值為5.001012/L,標(biāo)準(zhǔn)差為0.431012/L,現(xiàn)從該總體中進(jìn)行隨機(jī)抽樣,每次抽取10名正常成年男子,并測得他們的紅細(xì)胞數(shù),最終共抽取100份樣本,并計(jì)算出每份樣本的均數(shù)。第1頁/共62頁第2頁/共62頁將一百個(gè)樣本均數(shù)看成一批資料或?yàn)橐粋€(gè)新樣本,我們可以計(jì)算其均數(shù)與標(biāo)準(zhǔn)差,均數(shù)值為4.9097,標(biāo)準(zhǔn)差為0.1350。將樣本均數(shù)的“標(biāo)準(zhǔn)差”定名為均數(shù)的標(biāo)準(zhǔn)誤,簡稱標(biāo)準(zhǔn)誤,以區(qū)別于通常所說的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差表示個(gè)體值的變異程度,而標(biāo)準(zhǔn)誤則說明樣本均數(shù)的變異程度,兩者不能混淆。第3頁/共62頁將第1號樣本的標(biāo)準(zhǔn)差及例數(shù)代入式(5-2),得

(5-2)

(5-1)

第4頁/共62頁

100個(gè)樣本均數(shù)的頻數(shù)分布圖第5頁/共62頁標(biāo)準(zhǔn)誤統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(如均數(shù)標(biāo)準(zhǔn)誤、率的標(biāo)準(zhǔn)誤);均數(shù)的標(biāo)準(zhǔn)誤是描述均數(shù)抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。第6頁/共62頁標(biāo)準(zhǔn)誤的用途:1.衡量樣本均數(shù)的可靠性。2.結(jié)合樣本均數(shù)和正態(tài)分布曲線下的面積分布規(guī)律,估計(jì)總體均數(shù)的置信區(qū)間。3.用于均數(shù)的假設(shè)檢驗(yàn)。思考題:標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差的區(qū)別?第7頁/共62頁則z~N(0,1)第二節(jié)t分布

則z~N(0,1);~(μ,),作z轉(zhuǎn)換x~N(μ,σ),作轉(zhuǎn)換,

一、t分布的概念第8頁/共62頁t變量為用以推斷總體均數(shù)的樣本檢驗(yàn)統(tǒng)計(jì)量。t

分布只有1個(gè)參數(shù)自由度ν=n-1。1.當(dāng)σ已知時(shí),可作z轉(zhuǎn)換,推斷總體均數(shù)的樣本檢驗(yàn)統(tǒng)計(jì)量為z。2.當(dāng)σ未知時(shí),可作正態(tài)變量的t轉(zhuǎn)換,第9頁/共62頁二、t分布的特征與t界值表

圖5-1不同自由度t分布的概率密度曲線第10頁/共62頁3.當(dāng)

→∞時(shí),t分布逼近z分布;特征:1.單峰分布,以0為中心,左右對稱;2.越小,t值越分散,t分布的峰部越矮而尾部翹得越高;4.t分布曲線下的面積有一定規(guī)律。第11頁/共62頁雙側(cè):單側(cè):第12頁/共62頁圖5-2ν=9時(shí)單側(cè)(a)與雙側(cè)(b)分布曲線下尾部面積第13頁/共62頁第三節(jié)總體均數(shù)的估計(jì)【例5-2】

隨機(jī)抽取某地100名16歲男孩,測得其體重均數(shù)為48.65kg,標(biāo)準(zhǔn)差為15.23kg,試估計(jì)該地16歲男孩體重的總體均數(shù)。

一、點(diǎn)估計(jì)(pointestimation)

用樣本統(tǒng)計(jì)量作為總體參數(shù)的點(diǎn)值估計(jì)第14頁/共62頁二、區(qū)間估計(jì)(intervalestimation)

結(jié)合樣本統(tǒng)計(jì)量和抽樣誤差在一定的可信度100(1-)%下估計(jì)總體參數(shù)所在的范圍,稱為總體參數(shù)的置信區(qū)間(confidenceinterval,CI)。

置信區(qū)間的概念第15頁/共62頁1.Z分布法正態(tài)分布原理計(jì)算總體均數(shù)的1-可信區(qū)間為:

/2/21--z/2z/2(1)σ已知(小樣本要求資料服從正態(tài))均數(shù)置信區(qū)間的計(jì)算第16頁/共62頁(2)σ未知,但樣本例數(shù)n足夠大時(shí)(n>50)

注意:若總體不服從正態(tài)分布時(shí),一般是很難確定其總體中的未知參數(shù),但當(dāng)樣本量n很大時(shí),我們可利用中心極限定理按上式對其總計(jì)均數(shù)作出近似的區(qū)間估計(jì)。第17頁/共62頁2.t分布法(σ未知)根據(jù)t分布原理,P(-t/2,<t<t/2,)=1-

0/2/21--t/2t/2總體均數(shù)(1-)可信區(qū)間計(jì)算公式如下:第18頁/共62頁

對于例5-2,因?yàn)榭傮w標(biāo)準(zhǔn)差未知,所以采用公式(5-6)計(jì)算總體均數(shù)的95%置信區(qū)間為:

48.65±1.984×1.523=48.65±3.02=(45.63,51.67)kg第19頁/共62頁95%可信區(qū)間~

可以認(rèn)為是每抽100個(gè)由樣本含量相等的樣本算得的置信區(qū)間,平均有95個(gè)置信區(qū)間會(huì)包括總體均數(shù),只有5個(gè)置信區(qū)間不會(huì)包括總體均數(shù)。置信區(qū)間的涵義第20頁/共62頁(1)置信區(qū)間~包括總體均數(shù)的可能性為95%;

(2)總體均數(shù)落在置信區(qū)間~范圍內(nèi)的可能性為95%;

(3)通過樣本資料計(jì)算出的95%置信區(qū)間19.6~23.2kg包括總體均數(shù)的可能性為95%。判斷:第21頁/共62頁置信區(qū)間的兩個(gè)要素:1.準(zhǔn)確度2.精密度反映在可信度1-的大小上,從準(zhǔn)確度的角度,愈接近1越好,如99%可信區(qū)間比95%的好;它反映在區(qū)間的寬度上,即區(qū)間越窄越好第22頁/共62頁均數(shù)可信區(qū)間與參考值范圍的區(qū)別1.含義:均數(shù)可信區(qū)間用于估計(jì)總體參數(shù),而參考值范圍用于估計(jì)變量值的分布范圍。2.計(jì)算公式:均數(shù)可信區(qū)間的計(jì)算公式是基于統(tǒng)計(jì)量的抽樣分布,而參考值范圍的計(jì)算基于變量值的分布。第23頁/共62頁Bernoulli試驗(yàn)以A表示所感興趣的事件,A事件發(fā)生稱為“成功”,不發(fā)生稱為“失敗”。相應(yīng)的這類試驗(yàn)稱作為“成——敗型”試驗(yàn)或Bernoulli試驗(yàn)。一、二項(xiàng)分布第四節(jié)

二項(xiàng)分布和Poisson分布

第24頁/共62頁必須滿足下列三條件:(1)每次試驗(yàn)結(jié)果只能是兩個(gè)互斥結(jié)果之一(A或非A)。(2)每次試驗(yàn)的條件不變,每次試驗(yàn)結(jié)果

A事件發(fā)生的概率為常數(shù)。(3)各次試驗(yàn)獨(dú)立,即每次試驗(yàn)出現(xiàn)事件

A的概率與前面各次試驗(yàn)出現(xiàn)的結(jié)果無關(guān)。第25頁/共62頁概率的運(yùn)算法則乘法法則:幾個(gè)相互獨(dú)立事件的乘積(同時(shí)發(fā)生)的概率等于各獨(dú)立事件概率之積:

P(A1A2···An)=P(A1)P(A2)···P(An

)可加性:互不相容事件A1、A2、、An(任一次試驗(yàn)至多一個(gè)出現(xiàn))的和(至少一個(gè)發(fā)生)的概率等于各事件發(fā)生的概率之和:

P(A1+A2+···An)=P(A1)+P(A2)++P(An)第26頁/共62頁二項(xiàng)分布—成功次數(shù)的概率分布

某實(shí)驗(yàn)中小白鼠染毒后死亡概率:為0.7,則生存概率為:1-=0.3,故對一只小白鼠進(jìn)行實(shí)驗(yàn)的結(jié)果為:死(概率為)或生(概率為1-

);第27頁/共62頁對二只小白鼠(甲乙)進(jìn)行實(shí)驗(yàn)的結(jié)果為:甲乙均死 [概率為2]甲死乙生 [概率為(1-)]乙死甲生 [概率為(1-)]甲乙均生 [概率為(1-)2]概率相加得:

2+(1-)+(1-)+(1-)2

=[+(1-)]2

第28頁/共62頁對三只小白鼠(甲乙丙)進(jìn)行實(shí)驗(yàn)的結(jié)果為:表3只白鼠各種實(shí)驗(yàn)結(jié)果及其發(fā)生概率概率相加得:[+(1-)]3

第29頁/共62頁

對n只小白鼠進(jìn)行實(shí)驗(yàn),所有可能結(jié)果的概率相加得:n+Cn1(1-)n-1+…+Cnx

x(1-)n-x+…+(1-)n=[+(1-)]nn次試驗(yàn)中事件A出現(xiàn)的次數(shù)為x的概率是:

,k=0,1,2,…n

記為xB(n,)第30頁/共62頁表5-3接種3人可能出現(xiàn)不適反應(yīng)的人數(shù)及其概率第31頁/共62頁二項(xiàng)分布的性質(zhì):(1)二項(xiàng)分布的概率之和等于1,即(2)單側(cè)累積概率至少有m例陽性的概率(上側(cè)累積概率)至多有m例陽性的概率(下側(cè)累積概率)第32頁/共62頁(3)二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差若x~B(n,),則x

的總體均數(shù)μ=n,x的總體方差2=n

(1-)x的標(biāo)準(zhǔn)差第33頁/共62頁(4)二項(xiàng)分布的正態(tài)近似性

二項(xiàng)分布圖形的形狀取決于和n

的大??;二項(xiàng)分布的圖形有如下特征:當(dāng)=0.5時(shí),無論n的大小,均為對稱分布;當(dāng)

<或>0.5,n較小時(shí)為偏態(tài)分布,n較大時(shí)逼近正態(tài)分布。第34頁/共62頁第35頁/共62頁n=5=0.3第36頁/共62頁n=10=0.3第37頁/共62頁n=20=0.3第38頁/共62頁當(dāng)不接近于0或1,n不是很小,n≥5且n(1-)≥5時(shí),二項(xiàng)分布近似正態(tài)分布,有因此,二項(xiàng)分布的正態(tài)近似拓寬了二項(xiàng)分布的應(yīng)用范圍,應(yīng)用十分方便。第39頁/共62頁樣本率p的總體均數(shù):

當(dāng)樣本含量較大,總體陽性率不接近與0,也不接近于1時(shí),樣本中的陽性數(shù)近似正態(tài)分布N(n,),樣本陽性率也近似正態(tài)分布N(,p),故有樣本率p的標(biāo)準(zhǔn)差:樣本率的分布和正態(tài)近似第40頁/共62頁例補(bǔ)1:根據(jù)以往經(jīng)驗(yàn),新生兒染色體異常率一般為1%,某醫(yī)院觀察了當(dāng)?shù)?00名新生兒,只有l(wèi)例染色體異常,問該地新生兒染色體異常率是否低于一般?H0:=0.01H1:<0.01(1/400<0.01)單側(cè)=0.05P(x1)=P(0)+P(1)=0.99400+4000.010.99399=0.0905P=0.0905>0.05,按=0.05水準(zhǔn)尚不能拒絕H0,尚不能認(rèn)為該地新生兒染色體異常率低于一般。第41頁/共62頁P(yáng)oisson分布更多地專用于研究單位時(shí)間、單位面積、單位空間,單位人群內(nèi)某罕見事件發(fā)生次數(shù)的分布。如某種細(xì)菌在單位容積空氣或水中出現(xiàn)的情況,某段時(shí)間特定人群中某種惡性腫瘤患者的分布或出生缺陷的發(fā)病情況,放射性物質(zhì)在單位時(shí)間內(nèi)的放射次數(shù),單位空間某種昆蟲數(shù)的分布等等。二、泊松分布第42頁/共62頁用于描述事件出現(xiàn)概率很小而樣本含量或試驗(yàn)次數(shù)很大的隨機(jī)變量的概率分布。理論上可以證明二項(xiàng)分布當(dāng)n很大而很小時(shí)的極限分布是泊松分布。由二項(xiàng)分布的概率公式可推導(dǎo)出泊松分布的概率計(jì)算公式為:泊松分布的概率函數(shù)為:記作k=0,1,2,

第43頁/共62頁例5-4某地新生兒先天性心臟病的發(fā)病率為9‰,該地100名新生兒中有3人患先天性心臟病的人數(shù)概率有多大?將n=100,=9‰代入公式得:=0.9=0.049即該地100名新生兒中有3人患先天性心臟病的人數(shù)概率為49‰。(程序)第44頁/共62頁泊松分布的性質(zhì)

1.泊松分布的均數(shù)和方差=2

2.泊松分布的可加性

隨機(jī)變量x1,x2,,…,xk相互獨(dú)立,分別服從參數(shù)(均數(shù))為μ1,μ2,…,μk的泊松分布,則也服從泊松分布,參數(shù)μ

1+μ

2+…+μ

k

第45頁/共62頁3.泊松分布的正態(tài)近似

若已知參數(shù),可計(jì)算不同x取值的概率,以x為橫坐標(biāo),可能取值的概率P為縱坐標(biāo),可繪制泊松分布的圖形。

當(dāng)足夠大時(shí),泊松分布趨向于正態(tài)分布。一般

20,即可認(rèn)為泊松分布近似于正態(tài)分布。第46頁/共62頁

μ=3

μ=5第47頁/共62頁

μ=10第48頁/共62頁

μ=20第49頁/共62頁例補(bǔ)2:據(jù)以往大量觀察得某溶液中平均每毫升有細(xì)菌3個(gè)。某研究者想了解該溶液放在5℃冰箱中3天,溶液中細(xì)菌是否會(huì)增長。他采取已放在5℃冰箱中3天的該溶液1毫升,測得細(xì)菌5個(gè),請作統(tǒng)計(jì)推斷。第50頁/共62頁P(yáng)(X≥5)>,故不拒絕H0,即不能認(rèn)為該溶液在5℃冰箱中放置3天,會(huì)引起溶液中的細(xì)菌數(shù)增長。第51頁/共62頁第五節(jié)總體率的估計(jì)【例5-5】某市疾控中心對該市郊區(qū)200名小學(xué)生進(jìn)行貧血的檢測,結(jié)果發(fā)現(xiàn)有80名小學(xué)生貧血,檢出率為40.0%,則認(rèn)為該市郊區(qū)小學(xué)生貧血率為40.0%?!締栴}】

(1)這是什么資料?(2)該研究屬于何種設(shè)計(jì)方案?(3)以此次抽樣得到小學(xué)生貧血率40.0%來代表該市郊區(qū)小學(xué)生貧血率是否合適?(4)怎樣估計(jì)該市郊區(qū)小學(xué)生貧血率?第52頁/共62頁一、率的抽樣誤差與標(biāo)準(zhǔn)誤由于抽樣而引起的樣本率與總體率及樣本率間的差異稱為率的抽樣誤差,與均數(shù)的抽樣誤差可以用均數(shù)的標(biāo)準(zhǔn)誤度量一樣,率的抽樣誤差的大小亦可以用率的標(biāo)準(zhǔn)誤來度量。率的標(biāo)準(zhǔn)誤由下式計(jì)算例6-6,n=200,p=0.40,代入公式得sp=0.035。第53頁/共62頁

二、總體率的估計(jì)當(dāng)樣本例數(shù)較?。╪50),特別是p接近于0或1時(shí),根據(jù)二項(xiàng)分布的原理確定總體率的可信區(qū)間。1970年,Miettinen根據(jù)二項(xiàng)分布和F分布的關(guān)系,導(dǎo)出了總體率的可信區(qū)間算法。精確概率法或查表法第54頁/共62頁

【例5-6】2003年4~6月某醫(yī)院重癥監(jiān)護(hù)病房收治重癥SARS患者38人,其中死亡12人,求SARS病死概率的置信區(qū)間。查附表3,n=38,x=12,在x與n的縱橫交叉處,得到SARS病死概率的95%置信區(qū)間為18%~49%。第55頁/共62頁正態(tài)近似法當(dāng)樣本例數(shù)n較大,p和1-p均不太小,如np和n(1-p)均大于5??傮w率的1-的可信區(qū)間為(p-z/2

Sp,p+z/2Sp)即該鄉(xiāng)鎮(zhèn)小學(xué)生貧血率的95%置信區(qū)間為(33.2%,46.8%)。例5-5,n=200比較大,p=0.4,np=80,n(1-p)=120,均大于5,第56頁/共62頁最佳選擇題1.描述均數(shù)抽樣誤差大小的統(tǒng)計(jì)指標(biāo)是()。A.標(biāo)準(zhǔn)差B.方差C.均數(shù)的標(biāo)準(zhǔn)誤D.變異系數(shù)E.離均差平方和2.

減少均數(shù)的抽樣誤差的可行方法之一是():A.嚴(yán)格執(zhí)行隨機(jī)抽樣B.增大樣本含量C.

設(shè)立對照D.選一些處于中間狀態(tài)的個(gè)體E.選一些處于極端狀態(tài)的個(gè)體第57頁/共62頁3.在標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的關(guān)系中,說法正確的是():A.樣本例數(shù)增大時(shí),標(biāo)準(zhǔn)差減小,標(biāo)準(zhǔn)誤不變B.可信區(qū)間大小與標(biāo)準(zhǔn)差有關(guān),而正常值范圍與標(biāo)準(zhǔn)誤有關(guān)C.樣本例數(shù)增大時(shí),標(biāo)準(zhǔn)差增大,標(biāo)準(zhǔn)誤也增大D.樣本的例數(shù)增大時(shí),標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤均減小E.總體標(biāo)準(zhǔn)差一定時(shí),增大樣本例數(shù)會(huì)減小標(biāo)準(zhǔn)誤4.關(guān)于t分布的圖形,下述哪項(xiàng)是錯(cuò)誤的()。A.當(dāng)自由度

趨于無窮大時(shí),t分布趨于標(biāo)準(zhǔn)正態(tài)分布B.無論自由度為多少,t分布曲線下的面積都為1C.自由度越小,則t分布的尾部越高D.t分布是一條以為中心左右對稱的曲線E.t分布是一簇曲線,故臨界值因自由度的不同而不同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論