版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
一、抽樣的基本概念
1.樣本容量與樣本個(gè)數(shù)
(1)樣本容量。樣本是從總體中抽出的部分單位的集合,這個(gè)集合的大小稱為樣本容量,一般用n表示,它表明一個(gè)樣本中所包含的單位數(shù)。一般地,樣本單位數(shù)大于30個(gè)的樣本稱為大樣本,小于等于30個(gè)的樣本稱為小樣本。(2)樣本個(gè)數(shù)。樣本個(gè)數(shù)又稱樣本可能數(shù)目,它是指從一個(gè)總體中可能抽取多少個(gè)樣本。樣本個(gè)數(shù)的多少與抽樣方法有關(guān)。第一頁,共93頁。第一頁,共93頁。2.重復(fù)抽樣與不重復(fù)抽樣簡單抽樣的抽樣方法有重復(fù)抽樣與不重復(fù)抽樣。(1)重復(fù)抽樣。重復(fù)抽樣(或重置抽樣)是指從總體中抽出一個(gè)樣本單位,記錄其標(biāo)志值后,又將其放回總體中繼續(xù)參加下一輪單位的抽取。重復(fù)抽樣的特點(diǎn)是:第一,n個(gè)單位的樣本是由n次試驗(yàn)的結(jié)果構(gòu)成的。第二,每次試驗(yàn)是獨(dú)立的。第三,每個(gè)單位在多次試驗(yàn)中選中的機(jī)會(huì)(概率)是相同的。在重復(fù)試驗(yàn)中,樣本可能的個(gè)數(shù)是第二頁,共93頁。第二頁,共93頁。(2)不重復(fù)抽樣。不重復(fù)抽樣亦稱為不重置抽樣,即每次從總體抽取一個(gè)單位,登記后不放回原總體,下一次繼續(xù)從總體中余下的單位抽取樣本。其特點(diǎn)是:第一,n個(gè)單位的樣本由n次試驗(yàn)結(jié)果構(gòu)成,但由于每次抽出不重復(fù),所以實(shí)質(zhì)上相當(dāng)于從總體中同時(shí)抽取n個(gè)樣本單位。第二,每次試驗(yàn)結(jié)果不是獨(dú)立的。第三,每個(gè)單位在多次(輪)試驗(yàn)中中選的機(jī)會(huì)是不等的。不重復(fù)抽樣,如果是考慮順序,其樣本可能個(gè)數(shù)為如果不考慮順序,其樣本可能個(gè)數(shù)為
第三頁,共93頁。第三頁,共93頁。3.總體參數(shù)與樣本統(tǒng)計(jì)量(1)總體參數(shù)??傮w分布的數(shù)量特征就是總體的參數(shù),也是抽樣統(tǒng)計(jì)推斷的對象。常見的總體參數(shù)有:總體的均值,總體成數(shù)(比例),總體的方差。都是反映總體分布特征的重要指標(biāo)。(總體參數(shù)是常數(shù),但是未知的,需要估計(jì))
第四頁,共93頁。第四頁,共93頁。(2)樣本統(tǒng)計(jì)量。與總體參數(shù)相對應(yīng),是樣本的一個(gè)函數(shù),是一個(gè)隨機(jī)變量。我們利用統(tǒng)計(jì)量來估計(jì)和推斷總體的有關(guān)參數(shù)。常見的統(tǒng)計(jì)量有:第五頁,共93頁。第五頁,共93頁。抽樣分布是樣本統(tǒng)計(jì)量的概率分布,是一種理論概率分布某個(gè)樣本統(tǒng)計(jì)量的抽樣分布是由容量相同的所有可能樣本算出的統(tǒng)計(jì)量數(shù)值的相對頻數(shù)分布 二、抽樣分布第六頁,共93頁。第六頁,共93頁。抽樣分布總體計(jì)算樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差樣本第七頁,共93頁。第七頁,共93頁。樣本均值的抽樣分布形成過程
(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差第八頁,共93頁。第八頁,共93頁。樣本均值的抽樣分布
(例題分析)
現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))第九頁,共93頁。第九頁,共93頁。樣本均值的抽樣分布計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布(縱軸為概率)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5第十頁,共93頁。第十頁,共93頁。樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X第十一頁,共93頁。第十一頁,共93頁。(一)樣本平均數(shù)的抽樣分布1.重復(fù)抽樣設(shè)從總體中抽出的樣本為由于是重復(fù)抽樣,每個(gè)xi都是從總體中隨機(jī)抽出的,都是與總體同分布的隨機(jī)變量,并且是相互獨(dú)立的。我們設(shè)總體的則樣本平均數(shù)的期望值與方差分別是:
第十二頁,共93頁。第十二頁,共93頁。樣本平均數(shù)的方差是總體方差的1/n,因此,樣本平均數(shù)分布的集中趨勢優(yōu)于總體。由于樣本平均數(shù)能“集中”分布于總體平均數(shù)附近,可以考慮用樣本平均數(shù)來估計(jì)總體的平均數(shù)。但是估計(jì)時(shí)難免有誤差,如果該隨機(jī)變量的“集中”程度大,這個(gè)誤差的嚴(yán)重性就會(huì)低一些。因此,用抽樣平均數(shù)的標(biāo)準(zhǔn)差來反映抽樣平均數(shù)與總體平均數(shù)的平均誤差程度,稱為抽樣平均誤差,即:第十三頁,共93頁。第十三頁,共93頁。(例4-7)第十四頁,共93頁。第十四頁,共93頁。影響抽樣誤差的因素樣本容量抽樣方式總體內(nèi)部差異第十五頁,共93頁。第十五頁,共93頁。2.不重置抽樣分布樣本平均數(shù)的抽樣分布(考慮順序)第十六頁,共93頁。第十六頁,共93頁。第十七頁,共93頁。第十七頁,共93頁。第十八頁,共93頁。第十八頁,共93頁。第十九頁,共93頁。第十九頁,共93頁。計(jì)算結(jié)果表明:在不重復(fù)抽樣條件下,樣本平均數(shù)分布的中心還是總體的中心;而抽樣平均誤差比重復(fù)抽樣要小。不重復(fù)抽樣的平均誤差比重復(fù)抽樣小的原因是:不重復(fù)抽樣抽出后不放回,排除了“每次抽出的都是極端值”的可能,顯然對降低抽樣誤差有利。數(shù)學(xué)上可以證明,在不重置抽樣條件下,抽樣誤差為:當(dāng)N遠(yuǎn)大于n時(shí),修正系數(shù)近似1,這時(shí)可以不考慮抽樣方式差異,都按重置抽樣處理。第二十頁,共93頁。第二十頁,共93頁。均值分布的數(shù)學(xué)期望和方差抽樣方法 均值 方差 標(biāo)準(zhǔn)差 (1)從無限總體抽樣和有限總體放回抽樣(2)從有限總體不放回抽樣抽樣誤差抽樣誤差第二十一頁,共93頁。第二十一頁,共93頁。總體成數(shù)P是指具有某種特征的單位在總體中的比重。成數(shù)是一個(gè)特殊平均數(shù),設(shè)X是0、1變量,即:總體單位有該特征,則X取1,否則取0,則有:——樣本成數(shù)第二十二頁,共93頁。第二十二頁,共93頁。(例4-8)1.重復(fù)抽樣樣本成數(shù)抽樣分布
(二)樣本成數(shù)的抽樣分布第二十三頁,共93頁。第二十三頁,共93頁。2.不重復(fù)抽樣樣本成數(shù)抽樣分布第二十四頁,共93頁。第二十四頁,共93頁。成數(shù)分布的數(shù)學(xué)期望和方差抽樣方法 均值 方差 標(biāo)準(zhǔn)差 (1)從無限總體抽樣和有限總體放回抽樣(2)從有限總體不放回抽樣根據(jù)中心極限定理,只要樣本足夠大,的分布就近似正態(tài)分布。(np和nq大于5時(shí))抽樣誤差抽樣誤差第二十五頁,共93頁。第二十五頁,共93頁。第四節(jié)大數(shù)定理與中心極限定理一、大數(shù)定理獨(dú)立同分布的隨機(jī)變量設(shè)它們的平均數(shù)為X,方差為σ,即,則對任意的正數(shù)ε,有:說明當(dāng)n充分大時(shí),獨(dú)立同分布的一系列隨機(jī)變量,其平均數(shù)與它們共同的期望值之間的偏差,可以有很大的把握被控制在任意給定的范圍之內(nèi)。第二十六頁,共93頁。第二十六頁,共93頁。由于成數(shù)指標(biāo)是一個(gè)特殊的平均數(shù),大數(shù)定理對成數(shù)指標(biāo)自然也成立。即:第二十七頁,共93頁。第二十七頁,共93頁。二、中心極限定理根據(jù)正態(tài)分布的再生定理:如果總體服從正態(tài)分布,則總體中所有變量相加后仍服從正態(tài)分布,即樣本平均數(shù)服從正態(tài)分布中心極限定理是解釋非正態(tài)總體的:隨機(jī)變量X1,X2…Xn,…相互獨(dú)立,且服從同一分布,該分布存在有限的期望和方差:則當(dāng)n趨于無窮大時(shí),算術(shù)平均數(shù)近似服從正態(tài)分布,即:第二十八頁,共93頁。第二十八頁,共93頁。結(jié)論:無論總體服從何種分布,只要它的期望值與方差存在,大樣本的平均數(shù)就近似服從正態(tài)分布。對于成數(shù)指標(biāo)也適用(當(dāng)n>30且np>5、nq>5時(shí),為大樣本)第二十九頁,共93頁。第二十九頁,共93頁。練習(xí)題1.設(shè)總體標(biāo)準(zhǔn)差為20,用重復(fù)抽樣方式從總體中抽取容量為20的樣本,則樣本均值的標(biāo)準(zhǔn)差等于()A.1B.4.47C.20D.5.472.設(shè)總體方差為100,用不重復(fù)抽樣方式從3000個(gè)單位中抽取容量為200的樣本,則樣本均值的標(biāo)準(zhǔn)差等于(填空)3.已知從總體中抽取一個(gè)樣本容量為10的樣本,樣本均值的方差為55,則總體的方差為()A.5.5B.550C.0.55D.551.B2.0.68323.B第三十頁,共93頁。第三十頁,共93頁。第五章參數(shù)估計(jì)第一節(jié)點(diǎn)估計(jì)和區(qū)間估計(jì)第二節(jié)參數(shù)估計(jì)中樣本容量的確定第三節(jié)不同抽樣組織形式下的參數(shù)估計(jì)第三十一頁,共93頁。第三十一頁,共93頁。參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)第三十二頁,共93頁。第三十二頁,共93頁。抽樣推斷的過程樣本總體樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差總體均值、比例、方差等第三十三頁,共93頁。第三十三頁,共93頁。一、總體參數(shù)估計(jì)概述總體參數(shù)估計(jì)就是以樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù)。抽樣推斷應(yīng)滿足以下兩個(gè)要求:一是估計(jì)的精度要求,二是可靠性要求。設(shè)待估計(jì)的總體參數(shù)是θ,用以估計(jì)該參數(shù)的統(tǒng)計(jì)量是,抽樣估計(jì)的極限誤差是Δ,即。Δ越小,估計(jì)的精度要求越高第一節(jié)點(diǎn)估計(jì)和區(qū)間估計(jì)第三十四頁,共93頁。第三十四頁,共93頁。可靠性是抽樣估計(jì)本身正確性的一個(gè)概率保證,通常稱為估計(jì)的置信度。用統(tǒng)計(jì)量估計(jì)總體參數(shù)值,稱為點(diǎn)估計(jì)。點(diǎn)估計(jì)完全正確的概率通常為0。因此,我們更多的是考慮用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)的范圍,這就是區(qū)間估計(jì)。估計(jì)中精度要求與可靠性要求是一對矛盾。第三十五頁,共93頁。第三十五頁,共93頁。參數(shù)估計(jì)的方法矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)常用第三十六頁,共93頁。第三十六頁,共93頁。二、點(diǎn)估計(jì)(一)點(diǎn)估計(jì)的定義點(diǎn)估計(jì)就是根據(jù)總體參數(shù)與樣本統(tǒng)計(jì)量之間的內(nèi)在聯(lián)系,直接以樣本統(tǒng)計(jì)量作為相應(yīng)總體參數(shù)的估計(jì)量,點(diǎn)估計(jì)又稱為定值估計(jì)。常用的點(diǎn)估計(jì)量有:第三十七頁,共93頁。第三十七頁,共93頁。點(diǎn)估計(jì)的優(yōu)點(diǎn)是,直接給出了總體參數(shù)的估計(jì)值,通過樣本資料就能得到總體參數(shù)的具體數(shù)據(jù)。缺點(diǎn)是,不能提供估計(jì)準(zhǔn)確性的信息。因此,我們有必要考慮點(diǎn)估計(jì)的優(yōu)良性。點(diǎn)估計(jì)優(yōu)良性的三條標(biāo)準(zhǔn)是:無偏性、有效性和一致性。第三十八頁,共93頁。第三十八頁,共93頁。1.無偏性無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù),即:P(
)BA無偏有偏第三十九頁,共93頁。第三十九頁,共93頁。樣本平均數(shù)是總體平均數(shù)的一個(gè)無偏估計(jì),樣本方差是總體方差的一個(gè)無偏估計(jì),樣本成數(shù)是總體成數(shù)的一個(gè)無偏估計(jì),即:方差的證明如下:第四十頁,共93頁。第四十頁,共93頁。第四十一頁,共93頁。第四十一頁,共93頁。2.有效性有效性:對于同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效
AB的抽樣分布的抽樣分布P(
)第四十二頁,共93頁。第四十二頁,共93頁。3.一致性一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)。用公式表示為:AB較小的樣本容量較大的樣本容量P(
)第四十三頁,共93頁。第四十三頁,共93頁。三、區(qū)間估計(jì)(一)區(qū)間估計(jì)的含義為了彌補(bǔ)點(diǎn)估計(jì)可靠性的不足,需要進(jìn)行區(qū)間估計(jì)所謂區(qū)間估計(jì),就是估計(jì)總體參數(shù)的區(qū)間范圍,并要求給出區(qū)間估計(jì)成立的概率值,即要求:其中和是兩個(gè)統(tǒng)計(jì)量(),是總體參數(shù)θ區(qū)間估計(jì)的下限與上限,α(0<α<1)是區(qū)間估計(jì)的顯著性水平,經(jīng)常取1%、5%和10%;1-α稱為置信度。第四十四頁,共93頁。第四十四頁,共93頁。(二)平均數(shù)的區(qū)間估計(jì)均值的區(qū)間估計(jì)分兩種情況:1.正態(tài)總體方差已知或非正態(tài)總體方差未知(但大樣本),樣本平均數(shù)的估計(jì)使用正態(tài)Z統(tǒng)計(jì)量。2.正態(tài)總體、方差未知且是小樣本時(shí),樣本平均數(shù)的估計(jì)使用t統(tǒng)計(jì)量。第四十五頁,共93頁。第四十五頁,共93頁??傮w方差已知使用正態(tài)統(tǒng)計(jì)量:對于給出的顯著性水平α,通過(反)查標(biāo)準(zhǔn)正態(tài)分布表可得到臨界值,滿足:即可求總體平均數(shù)在顯著性水平α下的區(qū)間估計(jì):(查標(biāo)準(zhǔn)正態(tài)分布表)第四十六頁,共93頁。第四十六頁,共93頁。臨界值與置信度1-α,兩者間通過查標(biāo)準(zhǔn)正態(tài)表,可互相確定。如果置信度提高,α就要相應(yīng)地減小,臨界值增大。因此,也稱臨界值為概率度,簡記為z,用來間接衡量區(qū)間估計(jì)的概率大小。關(guān)于極限誤差、抽樣平均誤差、概率度三者間的關(guān)系,有如下結(jié)果:或第四十七頁,共93頁。第四十七頁,共93頁。對于給出的置信度1-α,得到置信區(qū)間的公式:
(下頁例)當(dāng)總體方差未知(但大樣本)時(shí),式中的用樣本標(biāo)準(zhǔn)差s代替第四十八頁,共93頁。第四十八頁,共93頁。例1.要估計(jì)某地區(qū)內(nèi)居民平均每天的看電視時(shí)間。隨機(jī)抽取了100名居民進(jìn)行調(diào)查,樣本數(shù)據(jù)顯示平均每人每天看電視時(shí)間是4小時(shí)。已知總體的標(biāo)準(zhǔn)差σ=1.5小時(shí)。試求:該地區(qū)居民每天看電視的平均時(shí)間的置信區(qū)間(置信度是95%)。例2.某燈具廠希望估計(jì)一批燈泡的平均壽命。現(xiàn)隨機(jī)地抽取50只燈泡進(jìn)行測試,其平均壽命是1600小時(shí),樣本方差是2500小時(shí)平方。試給出這批燈泡平均壽命的區(qū)間估計(jì)。(置信度為90%)第四十九頁,共93頁。第四十九頁,共93頁。2.總體方差未知且是小樣本時(shí)假定條件總體服從正態(tài)分布,且方差(2)
未知小樣本(n<=30)使用t分布統(tǒng)計(jì)量。均值的區(qū)間估計(jì)為:(查t分布表)第五十頁,共93頁。第五十頁,共93頁。例3.設(shè)鋼珠的直徑服從正態(tài)分布,現(xiàn)從一批鋼珠中隨機(jī)抽出9個(gè),測量它們的直徑,并求得其樣本的平均值是31.06毫米,樣本標(biāo)準(zhǔn)差是0.25毫米。試以95%的概率保證,估計(jì)鋼珠直徑的置信區(qū)間。第五十一頁,共93頁。第五十一頁,共93頁。參數(shù)的區(qū)間估計(jì)簡單隨機(jī)抽樣待估計(jì)參數(shù)已知條件置信區(qū)間正態(tài)總體,σ2已知正態(tài)總體,σ2未知且n<=30非正態(tài)總體,n>30總體均值(μ)σ未知時(shí),用Sσ未知時(shí),用S不重復(fù)抽樣,n>30不重復(fù)抽樣,n<=30第五十二頁,共93頁。第五十二頁,共93頁。(三)成數(shù)指標(biāo)的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量Z3.總體比例在1-置信水平下的置信區(qū)間為(注意:p是樣本成數(shù))第五十三頁,共93頁。第五十三頁,共93頁??傮w成數(shù)的區(qū)間估計(jì)
(例題分析)【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個(gè)下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
第五十四頁,共93頁。第五十四頁,共93頁。簡單隨機(jī)抽樣待估計(jì)參數(shù)已知條件置信區(qū)間無限總體,np和nq都大于5總體成數(shù)(p)有限總體,不重復(fù)抽樣np和nq都大于5第五十五頁,共93頁。第五十五頁,共93頁。練習(xí)題1.當(dāng)給定顯著性水平時(shí),總體參數(shù)的置信區(qū)間
A.0.95B.0.05C.0.975D.1.962.評價(jià)點(diǎn)估計(jì)優(yōu)良性的標(biāo)準(zhǔn)主要有()A.準(zhǔn)確性B.有效性C.無偏性D.一致性E.全面性3.置信區(qū)間的大小表達(dá)了區(qū)間估計(jì)的()A.可靠性B.精度C.可靠概率D.顯著性第五十六頁,共93頁。第五十六頁,共93頁。4.置信概率表達(dá)了區(qū)間估計(jì)的()A.顯著性B.規(guī)范性C.可靠性D.精度5.置信概率越大,則置信區(qū)間相應(yīng)()A.越小B.越大C.不變D.有效6.設(shè)總體服從正態(tài)分布,其中方差已知,則下列說法正確的是()A.當(dāng)置信度減小時(shí),估計(jì)的精度提高B.當(dāng)置信度減小時(shí),估計(jì)的精度降低C.當(dāng)顯著性水平減小時(shí),估計(jì)的精度降低D.當(dāng)顯著性水平減小時(shí),估計(jì)的精度提高E.無論置信度如何變化,估計(jì)的精度不變第五十七頁,共93頁。第五十七頁,共93頁。7.某快餐店想要估計(jì)每位顧客午餐的平均花費(fèi)金額,按不重復(fù)抽樣在來快餐店消費(fèi)的200名顧客中選取了49名顧客組成一個(gè)簡單隨機(jī)樣本。(1)假定總體標(biāo)準(zhǔn)差為15元,求樣本均值的抽樣平均誤差(2)在95%的置信水平下,求極限誤差(3)如果樣本均值為120元,求總體均值95%的置信區(qū)間第五十八頁,共93頁。第五十八頁,共93頁。答案1.A2.BCD3.B4.C5.B6.AC7.(1)1.87(2)3.665(3)(116.335,123.665)第五十九頁,共93頁。第五十九頁,共93頁。2.某微波爐廠家想要了解微波爐進(jìn)入居民家庭生活的深度。他們從某地區(qū)已購買了微波爐的居民戶中按重復(fù)抽樣隨機(jī)抽取了15戶,每戶一個(gè)月中使用微波爐的時(shí)間(假定總體服從正態(tài)分布)如下(分鐘):300,450,900,50,700,400,520,600,340,280,380,800,750,550,1100。求:(1)該地區(qū)購買微波爐的居民戶中平均一戶一個(gè)月使用微波爐時(shí)間的點(diǎn)估計(jì)(2)試已95%的置信水平估計(jì)平均一戶一個(gè)月使用微波爐的時(shí)間第六十頁,共93頁。第六十頁,共93頁。解:(1)根據(jù)資料計(jì)算得出:所以,平均一戶一個(gè)月使用微波爐時(shí)間的點(diǎn)估計(jì)為:其標(biāo)準(zhǔn)差為:第六十一頁,共93頁。第六十一頁,共93頁。(2)已知總體服從正態(tài)分布,且n=15,應(yīng)用t統(tǒng)計(jì)量,1-=95%,=0.05,查表得:,由(1)得:
總體均值在1-置信水平下的置信區(qū)間為即平均一戶一個(gè)月使用微波爐的時(shí)間的置信區(qū)間為(390.16,692.5)分鐘第六十二頁,共93頁。第六十二頁,共93頁。第二節(jié)參數(shù)估計(jì)中樣本量的確定在區(qū)間估計(jì)中,過寬的置信區(qū)間往往沒有意義,而過小的區(qū)間,其可靠性又很低。在樣本量一定的條件下,這對矛盾不可調(diào)和。如果想要縮小置信區(qū)間(即提高精度)又不降低可靠性,就要增大樣本量。但樣本量的增加又會(huì)受到調(diào)查費(fèi)用和工作量的限制。所以,應(yīng)找到樣本量與精度以及可靠度的最優(yōu)結(jié)合點(diǎn)。第六十三頁,共93頁。第六十三頁,共93頁。一、估計(jì)總體均值時(shí)樣本量的確定1.總體方差已知,重復(fù)抽樣:樣本容量n與總體方差、極限誤差、概率度之間的關(guān)系為:與總體方差成正比與極限誤差成反比與概率度成正比第六十四頁,共93頁。第六十四頁,共93頁。2.總體方差已知,不重復(fù)抽樣:第六十五頁,共93頁。第六十五頁,共93頁。二、估計(jì)成數(shù)時(shí)樣本量的確定1.重復(fù)抽樣:2.不重復(fù)抽樣:第六十六頁,共93頁。第六十六頁,共93頁。樣本數(shù)的確定待估計(jì)參數(shù)已知條件樣本數(shù)的確定正態(tài)總體,σ2已知,重復(fù)抽樣總體均值(μ)簡單隨機(jī)抽樣有限總體,不重復(fù)抽樣,σ2已知總體成數(shù)(P)服從正態(tài)分布,重復(fù)抽樣有限總體,不放回抽樣第六十七頁,共93頁。第六十七頁,共93頁。三、確定樣本量時(shí)應(yīng)注意的問題1.一般總體方差與成數(shù)都是未知的,可用有關(guān)資料替代:一是用歷史資料代替;二是在進(jìn)行正式抽樣調(diào)查前進(jìn)行幾次試驗(yàn)性調(diào)查,用試驗(yàn)中方差的最大值代替總體方差;三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的最大值0.25代替(當(dāng)p=0.5時(shí)方差最大)。2.如果一次抽樣調(diào)查,同時(shí)估計(jì)總體均值與成數(shù),則計(jì)算出兩個(gè)樣本容量,應(yīng)取其中的最大值。3.計(jì)算結(jié)果如果帶小數(shù),不按四舍五入法取整數(shù),而是都進(jìn)位。取比這個(gè)數(shù)大的最小整數(shù)。(下頁例)第六十八頁,共93頁。第六十八頁,共93頁。例1.對某型號(hào)電池進(jìn)行電流強(qiáng)度檢驗(yàn),根據(jù)以往正常生產(chǎn)的經(jīng)驗(yàn)數(shù)據(jù),已知電流強(qiáng)度的標(biāo)準(zhǔn)差為0.4安培,合格率為90%。采用重復(fù)抽樣,需要在95%的概率保證下,抽樣平均電流的誤差范圍不超過0.08安培,抽樣合格率誤差范圍不超過5%,試問應(yīng)抽取多少單位作為樣本?(n=139)第六十九頁,共93頁。第六十九頁,共93頁。例2.對某企業(yè)產(chǎn)品合格率進(jìn)行抽樣調(diào)查,根據(jù)歷史上進(jìn)行的兩次調(diào)查資料,合格率分別為90%和80%,這次抽樣調(diào)查誤差不超過4%,概率保證程度為90%,問至少應(yīng)抽出多少產(chǎn)品作為樣本?(n=271)第七十頁,共93頁。第七十頁,共93頁。練習(xí)某超市想要估計(jì)每個(gè)顧客平均每次購物花費(fèi)的金額。根據(jù)過去的經(jīng)驗(yàn),標(biāo)準(zhǔn)差大約為120元,現(xiàn)要求以95%的置信水平估計(jì)每個(gè)購物金額的置信區(qū)間,并要求極限誤差不超過20元,應(yīng)抽取多少個(gè)顧客作為樣本?(n=139)第七十一頁,共93頁。第七十一頁,共93頁。第三節(jié)不同抽樣組織形式下的參數(shù)估計(jì)一、類型抽樣二、整群抽樣三、等距抽樣四、不同抽樣組織設(shè)計(jì)的比較第七十二頁,共93頁。第七十二頁,共93頁。一、類型抽樣類型抽樣也稱分層抽樣,它是按一定標(biāo)志對總體各單位進(jìn)行分類,然后分別從每一類中按隨機(jī)原則抽取一定的單位構(gòu)成樣本。例如:調(diào)查我國居民消費(fèi)狀況,可以從各省份按一定的比例抽取樣本。優(yōu)點(diǎn)(與簡單隨機(jī)抽樣相比):1.可以避免樣本全來自某一個(gè)或幾個(gè)省份所產(chǎn)生的系統(tǒng)偏差,保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,使得抽樣誤差與組間方差無關(guān),從而提高估計(jì)的精度;2.組織實(shí)施調(diào)查方便;3.既可以對總體參數(shù)進(jìn)行估計(jì),也可以對各層的目標(biāo)量進(jìn)行估計(jì)。第七十三頁,共93頁。第七十三頁,共93頁。總體N樣本n均值:平均層內(nèi)方差:估計(jì)第七十四頁,共93頁。第七十四頁,共93頁。同樣不重復(fù)抽樣條件下的抽樣平均誤差為:所以,整群重復(fù)抽樣條件下的抽樣平均誤差為:(下例)均值的區(qū)間估計(jì)為:或第七十五頁,共93頁。第七十五頁,共93頁。例.假設(shè)某農(nóng)場種植小麥1200畝,根據(jù)其地理?xiàng)l件劃分為三類,按5%的比例重復(fù)抽樣總共抽取60畝進(jìn)行調(diào)查,結(jié)果如下表所示。試以95%的概率估計(jì)農(nóng)場平均畝產(chǎn)量的置信區(qū)間。麥田類型總體面積抽查面積抽樣平均畝產(chǎn)(斤)畝產(chǎn)標(biāo)準(zhǔn)差(斤)甲6003060020乙3601846025丙2401240036合計(jì)120060————第七十六頁,共93頁。第七十六頁,共93頁。二、整群抽樣整群抽樣就是將總體各單位分成若干群,然后從其中隨機(jī)抽取部分群,對中選的群進(jìn)行全面調(diào)查的抽樣組織方式。特點(diǎn):1.整群抽樣只需群的抽樣框,可簡化工作量。2.整群抽樣調(diào)查的地點(diǎn)相對集中,節(jié)省調(diào)查費(fèi)用,方便實(shí)施。3.整群抽樣都是不重復(fù)抽樣。4.缺點(diǎn)是估計(jì)的精度較差,抽樣平均誤差只取決于群間方差第七十七頁,共93頁。第七十七頁,共93頁??傮w群數(shù)RABCDEFGHIJKLMNOPLHPD樣本群數(shù)r估計(jì)均值:群間方差:置信區(qū)間抽樣誤差(下例)第七十八頁,共93頁。第七十八頁,共93頁。例.某水泥廠大量連續(xù)生產(chǎn)100公斤裝水泥,一晝夜產(chǎn)量為14400袋,平均每分鐘產(chǎn)量10袋?,F(xiàn)每隔144分鐘抽取一分鐘的產(chǎn)量(10袋為一群),一晝夜共抽取100袋水泥,結(jié)果如下。試以95%的概率估計(jì)每袋水泥重量的區(qū)間。樣本編號(hào)各群每袋平均重量樣本編號(hào)各群每袋平均重量19869821027100310489641069100510010106(P112)第七十九頁,共93頁。第七十九頁,共93頁。三、等距抽樣等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣,它是將總體各單位按某一標(biāo)志進(jìn)行排列,然后按固定的間隔來抽取樣本單位的抽樣組織形式。等距抽樣的間隔大小為k=N/n。優(yōu)點(diǎn):操作簡便,可提高估計(jì)的精度缺點(diǎn):對估計(jì)量方差的估計(jì)比較困難(等距抽樣的間隔,應(yīng)避免與現(xiàn)象本身的節(jié)奏性或循環(huán)周期相重合)第八十頁,共93頁。第八十頁,共93頁。等距抽樣樣本平均數(shù):為了方便起見,可以采用簡單隨機(jī)抽樣的平均誤差代替等距抽樣平均誤差:
(下例)第八十一頁,共93頁。第八十一頁,共93頁。例.某塊麥地長300米,寬120米,包括120條垅,每垅長300米?,F(xiàn)按等距抽樣抽取50個(gè)2米長的垅作為樣本進(jìn)行試驗(yàn),數(shù)據(jù)如下。試以95%的概率估計(jì)畝產(chǎn)量的置信區(qū)間和這塊麥地總產(chǎn)量的區(qū)間。樣本產(chǎn)量x(公斤)單位數(shù)n0.861.0121.2141.4121.66合計(jì)50第八十二頁,共93頁。第八十二頁,共93頁。四、不同抽樣組織設(shè)計(jì)的比較1.簡單隨機(jī)抽樣是基本抽樣組織方式代表性好的樣本,就是要避免抽樣人員的“主觀”影響,抽取樣本都要滿足“隨機(jī)性”任何概率推斷,抽樣設(shè)計(jì)時(shí)都應(yīng)考慮在某個(gè)階段或某個(gè)環(huán)節(jié)上遵從隨機(jī)性要求,否則的話,樣本的代表性就值得懷疑。第八十三頁,共93頁。第八十三頁,共93頁。2.類型抽樣與整群抽樣比較類型抽樣的平均誤差與組間方差無關(guān),決定于組內(nèi)方差的平均水平;整群抽樣的平均誤差與群內(nèi)方差無關(guān),決定于群間方差大小。總體方差等于組間方差加上組內(nèi)方差的平均數(shù)。我們由此可推導(dǎo)出減小類型抽樣與整群抽樣平均誤差的方法。第八十四頁,共93頁。第八十四頁,共93頁。練習(xí)1.調(diào)查學(xué)生在校外上網(wǎng)情況,事先將學(xué)生按性別分類,然后從每一類中隨機(jī)抽取若干名學(xué)生進(jìn)行調(diào)查,這稱為()A.等距抽樣B.整群抽樣C.分層抽樣D.簡單隨機(jī)抽樣2.以樣本統(tǒng)計(jì)量估計(jì)總體參數(shù),要求該估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù),這一數(shù)學(xué)性質(zhì)稱為()A.一致性B.無偏性C.有效性D.期望性第八十五頁,共93頁。第八十五頁,共93頁。3.用簡單隨機(jī)重復(fù)抽樣抽取樣本單位,如果要使抽樣平均誤差降低50%,則樣本容量要擴(kuò)大到原來的()A.2倍B.3倍C.3.5倍D.4倍4.某工廠連續(xù)性生產(chǎn),為檢查產(chǎn)品質(zhì)量,在24小時(shí)中,每隔30分鐘取2分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報(bào)參考:近代中國平民教育與中國早期動(dòng)畫的媒介性研究
- 二零二五年度科技助力離婚撫養(yǎng)合同4篇
- 2025版城市配送司機(jī)服務(wù)協(xié)議2篇
- 二零二五版無息農(nóng)業(yè)貸款合同協(xié)議范本3篇
- 2025年度智慧交通信號(hào)控制系統(tǒng)承包合同3篇
- 2025年度美容護(hù)膚品促銷禮品定制合同3篇
- 龍湖一期2025年土石方開挖及回填工程服務(wù)合同4篇
- 2025版事業(yè)單位職工食堂職工餐飲服務(wù)滿意度提升承包合同2篇
- 惠州2025年法務(wù)專員招聘及企業(yè)法律風(fēng)險(xiǎn)管理合同2篇
- 2025年度面條品牌授權(quán)與加盟連鎖經(jīng)營合同范本
- 2024-2025學(xué)年北京石景山區(qū)九年級(jí)初三(上)期末語文試卷(含答案)
- 第一章 整式的乘除 單元測試(含答案) 2024-2025學(xué)年北師大版數(shù)學(xué)七年級(jí)下冊
- 春節(jié)聯(lián)歡晚會(huì)節(jié)目單課件模板
- 中國高血壓防治指南(2024年修訂版)
- 糖尿病眼病患者血糖管理
- 抖音音樂推廣代運(yùn)營合同樣本
- 濕瘡的中醫(yī)護(hù)理常規(guī)課件
- 初中音樂聽課筆記20篇
- NUDD新獨(dú)難異 失效模式預(yù)防檢查表
- 內(nèi)蒙古匯能煤電集團(tuán)有限公司長灘露天煤礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 排水干管通球試驗(yàn)記錄表
評論
0/150
提交評論