統(tǒng)計(jì)學(xué)課件 ch6 參數(shù)估計(jì)課件_第1頁
統(tǒng)計(jì)學(xué)課件 ch6 參數(shù)估計(jì)課件_第2頁
統(tǒng)計(jì)學(xué)課件 ch6 參數(shù)估計(jì)課件_第3頁
統(tǒng)計(jì)學(xué)課件 ch6 參數(shù)估計(jì)課件_第4頁
統(tǒng)計(jì)學(xué)課件 ch6 參數(shù)估計(jì)課件_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第6章參數(shù)估計(jì)教學(xué)內(nèi)容6.1抽樣與抽樣分布6.2參數(shù)估計(jì)的基本方法6.3總體均值的區(qū)間估計(jì)6.4總體成數(shù)的區(qū)間估計(jì)6.5樣本容量的確定學(xué)習(xí)目標(biāo)掌握樣本平均數(shù)和樣本成數(shù)的抽樣分布理解總體參數(shù)點(diǎn)估計(jì)的基本方法及其優(yōu)良標(biāo)準(zhǔn);掌握總體均值和成數(shù)指標(biāo)的區(qū)間估計(jì)方法;會(huì)做題目6.1抽樣與抽樣分布6.1.1什么是抽樣推斷抽樣推斷是按隨機(jī)性原則,從研究對(duì)象中抽取一部分個(gè)體進(jìn)行觀察,并根據(jù)所得到的觀察數(shù)據(jù),對(duì)研究對(duì)象的數(shù)量特征作出具有一定可靠程度的估計(jì)和推斷,以達(dá)到認(rèn)識(shí)總體的目的的一種統(tǒng)計(jì)方法。統(tǒng)計(jì)推斷的過程樣本總體樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差總體均值、比例、方差6.1抽樣與抽樣分布6.1.2抽樣推斷中的基本概念總體與樣本(見第一章)樣本量與樣本個(gè)數(shù)總體參數(shù)與樣本統(tǒng)計(jì)量重復(fù)抽樣與不重復(fù)抽樣這些概念是統(tǒng)計(jì)學(xué)特有的,體現(xiàn)了統(tǒng)計(jì)學(xué)的基本思想與方法。4-6(一)總體和樣本(參見第1章)1.總體:又稱全及總體、母體,指所要研究對(duì)象的全體,由許多客觀存在的具有某種共同性質(zhì)的單位構(gòu)成??傮w單位數(shù)用N

表示。2.樣本:又稱子樣,來自總體,是從總體中按隨機(jī)原則抽選出來的部分,由抽選的單位構(gòu)成。樣本單位數(shù)用

n

表示。3.總體是唯一的、確定的,而樣本是不確定的、可變的、隨機(jī)的。4-7(二)樣本容量與樣本個(gè)數(shù)樣本容量:一個(gè)樣本中所包含的單位數(shù),用n表示。樣本個(gè)數(shù):又稱樣本可能數(shù)目,指從一個(gè)總體中所可能抽取的樣本的個(gè)數(shù)。對(duì)于有限總體,樣本個(gè)數(shù)可以計(jì)算出來。樣本個(gè)數(shù)的多少與抽樣方法有關(guān)。(這個(gè)概念只是對(duì)有限總體有意義,對(duì)無限總體沒有意義!)8(三)總體參數(shù)和樣本統(tǒng)計(jì)量總體參數(shù):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、確定的。樣本統(tǒng)計(jì)量:根據(jù)樣本分布計(jì)算的指標(biāo)。是隨機(jī)變量。平均數(shù)標(biāo)準(zhǔn)差、方差成數(shù)參數(shù)、2P統(tǒng)計(jì)量s、s2p總體樣本9(四)重復(fù)抽樣與不重復(fù)抽樣重置抽樣與不重置抽樣例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2重復(fù)抽樣:樣本總個(gè)數(shù)=不重復(fù)抽樣:不考慮順序:樣本總個(gè)數(shù)注:不重復(fù)抽樣的樣本量受總體大小限制,即n不能超過N,最多等于N;但重復(fù)抽樣的樣本量不受總體大小的影響。106.1.3抽樣分布抽樣分布:主要求出樣本平均數(shù)的期望與方差包括以下內(nèi)容樣本平均數(shù)的分布樣本成數(shù)的分布抽樣分布

設(shè)從總體中抽出的樣本為X1,X2,…,Xn,由于是重復(fù)抽樣,每個(gè)Xi,(i=1,2,…,n)都是從總體中隨機(jī)抽出的,都是與總體同分布的隨機(jī)變量,并且是相互獨(dú)立的。我們?cè)O(shè)總體的平均數(shù)為,方差為2,則樣本平均數(shù)的期望值與方差分別是:一、重置抽樣條件下樣本平均數(shù)的抽樣分布12(一)樣本平均數(shù)的分布(P108-109)某班組5個(gè)工人的日工資為34、38、42、46、50元。=422=32現(xiàn)用重置抽樣的方法從5人中隨機(jī)抽2個(gè)構(gòu)成樣本。共有52=25個(gè)樣本。如右圖。13驗(yàn)證了以下兩個(gè)結(jié)論:抽樣平均數(shù)的標(biāo)準(zhǔn)差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用表示。(一)樣本平均數(shù)的分布14(一)樣本平均數(shù)的分布由概率論知,如果總體是正態(tài)分布的,則樣本平均數(shù)的抽樣分布是如下正態(tài)分布這是一個(gè)非常重要的結(jié)論,有廣泛的應(yīng)用。15(二)樣本成數(shù)的分布(P111-112)總體成數(shù)P是指具有某種特征的單位在總體中的比重。成數(shù)是一個(gè)特殊平均數(shù),設(shè)總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設(shè)x是0、1變量(總體單位有該特征,則x取1,否則取0),則有:現(xiàn)從總體中抽出n個(gè)單位,如果其中有相應(yīng)特征的單位數(shù)是n1,則樣本成數(shù)是:p也是一個(gè)隨機(jī)變量,利用樣本平均數(shù)的分布性質(zhì)結(jié)論,即有:16二、不重置抽樣條件下樣本均值和成數(shù)的抽樣分布樣本均值的分布性質(zhì):樣本成數(shù)的分布性質(zhì)17抽樣分布總結(jié)樣本平均數(shù)的分布樣本成數(shù)的分布重復(fù)抽樣不重復(fù)抽樣(三)抽樣分布定理1.正態(tài)分布再生定理113總體是正態(tài)分布,抽取容量n的樣本,樣本平均數(shù)也服從正態(tài)分布。樣本平均數(shù)是更加集中的分布在總體平均數(shù)的周圍。2.中心極限定理114大樣本的平均數(shù)近似服從正態(tài)分布。6.2參數(shù)估計(jì)6.2.1估計(jì)量與估計(jì)值用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù),用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量叫做估計(jì)量,估計(jì)量的取值稱為估計(jì)值。參數(shù)估計(jì)的方法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)二、點(diǎn)估計(jì)

點(diǎn)估計(jì)的定義

點(diǎn)估計(jì)就是根據(jù)總體參數(shù)與樣本統(tǒng)計(jì)量之間的內(nèi)在聯(lián)系,直接以樣本統(tǒng)計(jì)量作為相應(yīng)總體參數(shù)的估計(jì)量。在統(tǒng)計(jì)中經(jīng)常使用的點(diǎn)估計(jì)量有:【例6-1】對(duì)某企業(yè)的產(chǎn)品進(jìn)行抽樣檢驗(yàn),設(shè)抽出100件產(chǎn)品,其中不合格產(chǎn)品5件,試估計(jì)該企業(yè)產(chǎn)品的合格率是多少?

我們可以通過樣本的合格率來估計(jì)企業(yè)產(chǎn)品的合格率。樣本合格率p=95/100=95%,我們估計(jì)該企業(yè)產(chǎn)品的合格率是95%。二、點(diǎn)估計(jì)所謂區(qū)間估計(jì),就是估計(jì)總體參數(shù)的區(qū)間范圍,并要求給出區(qū)間估計(jì)成立的概率值。設(shè)和是兩個(gè)統(tǒng)計(jì)量(<),分別作為總體參數(shù)區(qū)間估計(jì)的下限與上限,則要求:

P()=1-α式中α(0<α<1)是區(qū)間估計(jì)的顯著性水平,其取值大小由實(shí)際問題確定,經(jīng)常取1%、5%和10%;1-α稱為置信度。(二)區(qū)間估計(jì)1、總體未知參數(shù)落在區(qū)間內(nèi)的概率2、表示為(1-為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率3、常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平(置信度)區(qū)間與置信水平均值的抽樣分布(1-)%區(qū)間包含了

%的區(qū)間未包含1-aa/2a/2(二)區(qū)間估計(jì)參數(shù)估計(jì)應(yīng)滿足以下兩個(gè)要求:一是估計(jì)的精確度要求,二是可靠性要求。所謂精確度就是估計(jì)誤差的最大范圍,即誤差的最大值,可通過極限誤差來反映;所謂可靠性是指估計(jì)結(jié)果正確的概率大小。置信區(qū)間越小,精確性越高,但是可靠性下降;置信區(qū)間越大,可靠性越大,但是精確性降低。因此,精確性和可靠性是一對(duì)矛盾。

無偏性用表示總體的待估計(jì)參數(shù),是估計(jì)的樣本統(tǒng)計(jì)量,我們說是的無偏估計(jì),指的是滿足:6.2.3評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)

無偏性無偏性要求用來估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量,其分布是以總體參數(shù)真值為中心的。在一次具體的抽樣估計(jì)中,估計(jì)量或者大于總體參數(shù),或者小于總體參數(shù);但是,在進(jìn)行重復(fù)抽樣估計(jì)的過程中,所有估計(jì)量的平均數(shù)應(yīng)該等于待估的總體參數(shù)。這說明,無偏估計(jì)要求估計(jì)量沒有系統(tǒng)偏差。估計(jì)量的優(yōu)良性準(zhǔn)則——(無偏性)P(X)XCA無偏有偏無偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)這就是為什么樣本方差用n-1的原因!

一致性一致性是指隨著樣本容量不斷增大,樣本統(tǒng)計(jì)量接近總體參數(shù)的可能性就越來越大,或者,對(duì)于任意給定的偏差控制水平,兩者間偏差高于此控制水平的可能性越來越小,接近于0。

一致性用公式表示就是:

公式中,ε為一任意小的數(shù)。上式說明,當(dāng)n充分大時(shí),與之間的偏差,可以有很大的把握被控制在任意給定的范圍之內(nèi)。當(dāng)n趨于無窮大時(shí),估計(jì)量依概率收斂于。估計(jì)量的優(yōu)良性準(zhǔn)則——(一致性)一致性:隨著樣本容量的增大,估計(jì)量越來越接近被估計(jì)的總體參數(shù)AB較小的樣本容量較大的樣本容量P(X)X

有效性

和都是總體參數(shù)的無偏估計(jì)量,如果,則說明估計(jì)量比更有效。

有效性設(shè)總體的方差是,我們有:顯然,樣本平均數(shù)的方差比樣本中某個(gè)單位的標(biāo)志值的方差要小,只是其方差的1/n,所以作為估計(jì)量,樣本平均數(shù)更加有效。6.3.1區(qū)間估計(jì)基本原理6.3總體均值的區(qū)間估計(jì)所謂抽樣極限誤差范圍是指變動(dòng)的樣本估計(jì)值與確定的總體參數(shù)之間離差的可能范圍,它可以用樣本估計(jì)值與總體參數(shù)的最大絕對(duì)誤差限來表示。6.3.2正態(tài)分布且總體方差已知;或非正態(tài)分布方差未知,且大樣本2

已知2未知均值方差成數(shù)區(qū)間

估計(jì)平均數(shù)的區(qū)間估計(jì)對(duì)總體平均數(shù)區(qū)間估計(jì)時(shí),使用下面的式子

(式中Δ是極限誤差)有兩種模式:1、根據(jù)置信度1-α,求出極限誤差Δ,并指出總體平均數(shù)的估計(jì)區(qū)間。2、給定極限誤差,求置信度(略)。當(dāng)σ已知時(shí),根據(jù)相關(guān)的抽樣分布定理,服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)。查正態(tài)分布概率表,

可得(一般記為),則,根據(jù)重復(fù)抽樣與不重復(fù)抽樣的求法的不同,進(jìn)一步可得總體平均數(shù)的估計(jì)區(qū)間:重復(fù)抽樣時(shí),區(qū)間的上下限為:不重復(fù)抽樣時(shí),區(qū)間的上下限為:均值區(qū)間估計(jì)—第1種模式(求置信區(qū)間)正態(tài)分布且總體方差已知P.119【例6.3】這一類計(jì)算題的基本做法:先計(jì)算出樣本指標(biāo),然后根據(jù)所給條件(重復(fù)抽樣或不重復(fù)抽樣)進(jìn)行抽樣平均誤差的計(jì)算,抽樣極限誤差的計(jì)算,最后根據(jù)樣本指標(biāo)和極限誤差進(jìn)行期間估計(jì)。大樣本,一般總體在大樣本條件下,根據(jù)中心極限定理,樣本平均數(shù)近似服從正態(tài)分布,仍可按上述方法進(jìn)行估計(jì)。如果總體方差已知用總體方差,如果總體方差未知用樣本方差代替總體方差,樣本平均數(shù)仍然近似服從正態(tài)分布。

大樣本,一般總體(方差已知)【例】某地區(qū)的電視臺(tái)委托調(diào)查公司估計(jì)地區(qū)內(nèi)居民平均每日的看電視時(shí)間。調(diào)查公司隨機(jī)抽取了100名居民進(jìn)行調(diào)查,樣本數(shù)據(jù)顯示平均每人每天看電視時(shí)間是4個(gè)小時(shí)。如果已知總體的標(biāo)準(zhǔn)差σ=1.5小時(shí)。試求:(1)該地區(qū)內(nèi)居民每天看電視的平均時(shí)間的置信區(qū)間(置信度是95%);大樣本,一般總體(方差未知)總體分布未知且總體方差未知,大樣本條件下,由中心極限定理知,近似服從正態(tài)分布,此處用樣本方差s代替總體方差。P120,例6.4總體方差未知(2未知),小樣本

當(dāng)總體服從正態(tài)分布但方差未知時(shí),可用樣本的標(biāo)準(zhǔn)差s代替總體標(biāo)準(zhǔn)差。這時(shí)統(tǒng)計(jì)量是:t服從的分布不是標(biāo)準(zhǔn)正態(tài)分布,而是自由度為n-1的t-分布(當(dāng)n很大時(shí),近似正態(tài)分布)。因此,總體均值的區(qū)間估計(jì)是:總體方差未知(2未知)

:重復(fù)抽樣不重復(fù)抽樣

4-48總體均值區(qū)間估計(jì)總結(jié)總體平均數(shù)估計(jì)區(qū)間的上下限總體方差已知N(0,1)重復(fù)抽樣不重復(fù)抽樣總體方差未知t(n-1)大樣本時(shí)近似服從N(0,1)重復(fù)抽樣不重復(fù)抽樣

如果是正態(tài)總體4-49

如果不是正態(tài)總體,或分布未知總體方差已知且是大樣本總體方差未知且是大樣本

此時(shí)不考慮小樣本情況因此,大樣本情況下,直接用標(biāo)準(zhǔn)正態(tài)分布求置信區(qū)間即可。成數(shù)指標(biāo)是一個(gè)特殊的平均數(shù)。所以,類似于總體平均數(shù)的區(qū)間估計(jì),總體成數(shù)的區(qū)間估計(jì)是:式中的成數(shù)抽樣平均誤差在重復(fù)抽樣條件下是:在不重復(fù)抽樣的條件下是:在實(shí)踐中,由于總體成數(shù)常常未知,這時(shí),抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。6.4總體成數(shù)的區(qū)間估計(jì)【例6-3】某工廠要估計(jì)一批總數(shù)5000件的產(chǎn)品的廢品率,于是采用不重復(fù)性抽樣方法,隨機(jī)抽出400件產(chǎn)品進(jìn)行檢測(cè),發(fā)現(xiàn)有32件廢品。試給出該批產(chǎn)品的廢品率的區(qū)間估計(jì)(置信度是90%)。

總體平均數(shù)的區(qū)間估計(jì)第一,樣本抽取后,用簡單算術(shù)平均或加權(quán)平均的方法計(jì)算樣本平均數(shù)。第二,搜集總體數(shù)量標(biāo)志方差的經(jīng)驗(yàn)數(shù)據(jù)或計(jì)算樣本數(shù)量標(biāo)志方差s2。第三,計(jì)算抽樣平均數(shù)的平均誤差:第四,根據(jù)概率F(Z)確定Z,計(jì)算平均數(shù)的極限誤差。第五,總體平均數(shù)的置信區(qū)間。區(qū)間估計(jì)小結(jié)(重置抽樣)(不重置抽樣)第一,樣本抽取后,計(jì)算樣本成數(shù)。第二,用樣本是非標(biāo)志方差p(1-p)或經(jīng)驗(yàn)數(shù)據(jù)代替總體是非標(biāo)志方差P(1-P)。第三,計(jì)算抽樣成數(shù)的平均誤差:第四,根據(jù)概率F(Z)確定Z,計(jì)算平均數(shù)的極限誤差:第五,總體平均數(shù)P的置信區(qū)間。

總體成數(shù)的區(qū)間估計(jì)(重置抽樣)(不重置抽樣)練習(xí)某地有八家銀行,從它們所有的全體職工中隨機(jī)抽取600人進(jìn)行調(diào)查,得知其中的486人在銀行里有個(gè)人儲(chǔ)蓄存款,存款金額平均每人3400元,標(biāo)準(zhǔn)差500元,試以95.45%的可靠性推斷:(1-α=95.45%,則z=2)1)全體職工中有儲(chǔ)蓄存款者所占比率的區(qū)間范圍2)平均每人存款金額的區(qū)間范圍(1)已知:n=600,p=81%,又1-α=95.45%,則z=2所以故全體職工中有儲(chǔ)蓄存款者所占比率的區(qū)間范圍為81%±0.032%(2)平均每人存款金額的區(qū)間范圍為6.5樣本容量的確定在前面我們已經(jīng)知道,極限誤差、概率度與抽樣平均誤差三者間的數(shù)量關(guān)系是:。當(dāng)抽樣平均誤差保持不變時(shí),極限誤差與概率度兩者間關(guān)系是:Δ增大,z也增大了,Δ減小,z也減小了。樣本容量的確定因此,抽樣估計(jì)的精度與可靠性之間存在矛盾:要提高精度(Δ減小),需以犧牲概率度(z減小)為代價(jià);要提高概率度(z增大),又要以犧牲估計(jì)精度(Δ增大)為代價(jià)。在不變的情況下,這對(duì)矛盾是不可調(diào)和的;但是,降低抽樣平均誤差后,就可以同時(shí)提高估計(jì)的精度與概率度。樣本容量的確定例如:通過增加樣本容量n來達(dá)到降低抽樣平均誤差目標(biāo)。這時(shí)應(yīng)該考慮,樣本容量n究竟取多大合適?這就是樣本容量的確定問題。6.5.1估計(jì)總體均值時(shí)樣本容量的確定總體方差已知,重復(fù)抽樣(重點(diǎn))這時(shí)有:上式兩邊平方整理后可得:

這就是在給定極限誤差、概率度要求下,至少應(yīng)抽取的樣本容量。估計(jì)總體均值時(shí)樣本容量的確定總體方差已知,不重復(fù)抽樣這時(shí)有:上式兩邊平方整理后可得:

6.5.2估計(jì)總體成數(shù)時(shí)樣本容量的確定重復(fù)抽樣(重點(diǎn))不重復(fù)抽樣4-62確定樣本容量在設(shè)計(jì)抽樣時(shí),先確定允許的誤差范圍和必要的概率保證程度,然后根據(jù)歷史資料或試點(diǎn)資料確定總體的標(biāo)準(zhǔn)差,最后來確定樣本容量。估計(jì)總體均值時(shí)樣本容量的確定重復(fù)抽樣不重復(fù)抽樣估計(jì)成數(shù)時(shí)樣本容量的確定重復(fù)抽樣不重復(fù)抽樣6.5.3應(yīng)注意的問題

計(jì)算樣本容量時(shí),一般總體的方差與成數(shù)都是未知的,可用有關(guān)資料替代:一是用歷史資料已有的方差與成數(shù)代替;二是在進(jìn)行正式抽樣調(diào)查前進(jìn)行幾次試驗(yàn)性調(diào)查,用試驗(yàn)中方差的最大值代替總體方差;三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的最大值0.25代替。三、應(yīng)注意的問題

如果進(jìn)行一次抽樣調(diào)查,同時(shí)估計(jì)總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論