




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第八章 抽樣推斷分析法 1第八章 抽樣推斷分析法8.1 抽樣方法概述8.2 概率與概率分布8.3 抽樣分布8.4 抽樣估計的方法與應(yīng)用8.5 抽樣推斷誤差的控制2第一節(jié) 抽樣方法概述 一、抽樣的概念和特點抽樣 根據(jù)隨機原則從總體中抽取一部分單位作為樣本,并根據(jù)樣本數(shù)量特征對總體數(shù)量特征做出具有一定可靠程度的估計與推斷。特點 按隨機原則抽取樣本單位 用部分信息推斷總體數(shù)量特征 抽樣推斷具有一定的概率保證程度 抽樣誤差可以事先計算并控制3抽樣的應(yīng)用對不可能進(jìn)行全面調(diào)查的社會現(xiàn)象對不必要進(jìn)行全面調(diào)查的社會現(xiàn)象對普查資料進(jìn)行必要的修正4二、有關(guān)抽樣的幾個基本概念樣本 從總體抽取出的、用以代表和推斷總體
2、的部分單位的集合體。注意 1樣本的單位必須取自總體; 2由一個總體可以抽取許多樣本; 3樣本的抽取必須排除主觀因素的影響,以確保其客觀性與代表性。5樣本容量和樣本個數(shù)樣本容量:一個樣本中所包含的個體單位數(shù),一般用n表示。樣本個數(shù):一個抽樣方案中所有的可能被抽取的樣本的總數(shù)量,即可能的樣本個數(shù) 。6第二節(jié) 概率與概率分布 一、樣本空間及簡單隨機抽樣方式試驗 從總體中隨機抽取一個單位并把結(jié)果記錄下來稱為一次試驗。 樣本(點) 連續(xù)n次試驗的結(jié)果構(gòu)成一個樣本(點)。 樣本空間 以全部樣本點為元素組成的集合稱為樣本空間。7簡單隨機抽樣的兩種方式重復(fù)抽樣每次從N個單位的總體中隨機抽取1個單位,登記后放回
3、總體參加下一次的抽取,連續(xù)進(jìn)行n次。1、n個單位的樣本由n次連續(xù)試驗構(gòu)成。2、每次試驗的結(jié)果相互獨立。3、每次試驗都在相同條件下進(jìn)行,每個單位被選中的機會(概率)在各次是相同的。特點:8簡單隨機抽樣的兩種方式不重復(fù)抽樣每次從N個單位的總體中隨機抽取1個單位,登記后不放回原總體,下次從總體中余下的單位里抽取,連續(xù)進(jìn)行n次。1、n個單位的樣本由n次連續(xù)試驗構(gòu)成,由于每次抽出后不放回,所以相當(dāng)于從總體中同時抽取n個樣本單位。2、每次試驗的結(jié)果不獨立。3、每抽一次總體的單位數(shù)少一個,每個單位被選中的機會(概率)在各次是不等的。特點:9簡單隨機抽樣的樣本個數(shù)重復(fù)抽樣如果考慮順序,可能的樣本個數(shù)是 。不重
4、復(fù)抽樣如果考慮順序,可能的樣本個數(shù)為 ; 如果不考慮順序,可能的樣本個數(shù)為 。10二、事件及其概率事件樣本空間中滿足給定性質(zhì)的樣本點組成事件。簡單事件復(fù)合事件對應(yīng)樣本空間中一個樣本點的事件,是不可再分事件(基本事件)。由若干個簡單事件結(jié)合成的事件。必然事件不可能事件每次實驗中必定發(fā)生,是樣本空間本身。在任何實驗中都不發(fā)生,是空集。11實驗中發(fā)生該事件的可能性大小。若樣本空間中各樣本點出現(xiàn)的可能性大小相同,可用樣本空間中屬于該事件的樣本點個數(shù)與樣本空間中全部樣本點個數(shù)之比來計算。事件A、B之和A+B表示事件A或事件B發(fā)生。 A+B= AB 事件發(fā)生的概率事件的和事件的積復(fù)合事件的概率是簡單事件的
5、概率通過代數(shù)運算得到的。事件A、B之積AB表示事件A和事件B同時發(fā)生。 AB = AB 12兩種常用的復(fù)合事件的概率互不相容事件的和的概率A、B互不相容表示AB= 若事件A與事件B互不相容,則:P(A+B)=P(A)+P(B)。概率的加法定理:幾個互不相容事件中至少一個發(fā)生的概率等于這幾個事件各自發(fā)生的概率之和。推論 設(shè) 表示A的對立事件,則: P( )=1-P(A)13兩種常用的復(fù)合事件的概率互相獨立事件的積的概率A、B互相獨立表示事件B發(fā)生與否對事件A沒有影響。 若事件A與事件B互相獨立,則:P(AB)=P(A)P(B)。概率的乘法定理:幾個互相獨立事件同時發(fā)生的概率等于這幾個事件各自發(fā)生
6、的概率之積。推論 設(shè)A、B互相獨立,則: P(A+B)=P(A)+P(B)-P(A)P(B)14隨機變量離散型隨機變量連續(xù)型隨機變量三、離散型隨機變量的概率分布概率分布表將離散型隨機變量的所有可能取值及相應(yīng)的概率按順序列成表。 XX x1 x2 xn x1 x2 PP p(x1) p(x2) p(xn) p(x1)p(x2) 15(i=1,2, ) 離散型隨機變量的概率分布也可以用等式表述為:離散型隨機變量的概率分布的性質(zhì):(i=1,2, ); 16例:連續(xù)拋兩次硬幣,正面向上的次數(shù)的概率分布為:17離散型隨機變量的概率分布還可以用概率分布函數(shù)來表示。18例:連續(xù)拋兩次硬幣,正面向上的次數(shù)的概
7、率分布用分布函數(shù)表示為:19一次試驗只有兩種結(jié)果:事件A發(fā)生或 A不發(fā)生 貝努里試驗n重貝努里試驗中事件A出現(xiàn)的次數(shù)k服從二項分布。k 0 1 2 n 0 1 2 n P k 20四、連續(xù)型隨機變量的概率分布連續(xù)型隨機變量的概率分布只能用概率分布函數(shù)來表示。其中f(x)是分布函數(shù)F(x)的導(dǎo)數(shù),稱為密度函數(shù)。21連續(xù)型隨機變量的密度函數(shù)的性質(zhì):1、f(x)02、3、 a bxP(a Xb)f(x)22五、隨機變量的數(shù)值特征常用的有:數(shù)學(xué)期望、方差離散型隨機變量的數(shù)學(xué)期望(一)隨機變量的數(shù)學(xué)期望連續(xù)型隨機變量的數(shù)學(xué)期望23數(shù)學(xué)期望的兩個重要性質(zhì):24連續(xù)型隨機變量的方差(二)隨機變量的方差離散型
8、隨機變量的方差25方差的兩個重要性質(zhì):26六、正態(tài)分布 最重要的連續(xù)型隨機變量分布正態(tài)分布的密度函數(shù)稱隨機變量X服從均值為,方差為2 的正態(tài)分布,記為XN(, 2 )。27f(x)xf(x)正態(tài)分布的密度函數(shù)曲線 是該分布的中心,是標(biāo)準(zhǔn)差,反映分布的離散程度,越大,分布曲線越平緩,離散程度越大;越小,分布曲線越陡峭,分布越集中。 28正態(tài)分布的分布函數(shù)利用正態(tài)分布函數(shù)可計算正態(tài)分布隨機變量X落在任意區(qū)間的概率:對于不同的和2都要計算上述積分很麻煩。29標(biāo)準(zhǔn)正態(tài)分布=0,=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,相應(yīng)的隨機變量稱為標(biāo)準(zhǔn)正態(tài)隨機變量,用Z表示,即ZN(0,1) 。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)標(biāo)準(zhǔn)正
9、態(tài)分布的分布函數(shù)書中把z在03.49的取值及其相應(yīng)的概率編成正態(tài)分布面積表,通過查表可求出Z落在任意區(qū)間的概率。30正態(tài)分布函數(shù)的標(biāo)準(zhǔn)化設(shè)XN(, 2 ),令Z= 即:ZN(0,1) 。把一般正態(tài)分布化成標(biāo)準(zhǔn)正態(tài)分布后,通過查正態(tài)分布概率表即可求出一般正態(tài)分布隨機變量落在任意區(qū)間的概率。31例1:設(shè)XN(,2 ),求X落在區(qū)間(-a,+a )的概率。解:令Z= , X落在區(qū)間(-a,+a ),等價于Z落在區(qū)間 。查正態(tài)分布表可得其概率為 ,此即為X落在區(qū)間(-a,+a )的概率。32例2:設(shè)部隊?wèi)?zhàn)士的身高服從正態(tài)分布XN(175,42 ),軍服廠要制100000套軍服,問身高在171179的應(yīng)
10、制多少套?解:令Z= , X落在區(qū)間(171,179 )等價于Z落在區(qū)間(-1,1 )。查正態(tài)分布表可得1-21-F(1)=0.6827,所以軍服廠應(yīng)制68270套身高在171179的軍服。33第三節(jié) 抽樣分布 一、基本概念總體參數(shù)總體分布的數(shù)量特征。樣本統(tǒng)計量定義在樣本空間上的一個函數(shù),也稱樣本指標(biāo)。本身也是隨機變量。抽樣分布樣本統(tǒng)計量的概率分布。本節(jié)主要討論簡單隨機抽樣的抽樣分布。34抽樣分布的形成過程總體計算樣本統(tǒng)計量如:樣本均值、成數(shù)、方差樣本35二、重復(fù)抽樣分布樣本平均數(shù)的分布例:某班組有5個工人,他們的單位工時工資分別是4、6、8、10、12元,現(xiàn)用重復(fù)抽樣方式從5個工人中抽出2人
11、,求樣本平均工時工資的抽樣分布。 解:先計算總體工時工資的平均數(shù)和方差:36樣本變量468101244567865678986789101078910111289101112 樣本工時平均工資 (單位:元) 37樣本工時平均工資(元)頻數(shù)頻率411/25522/25633/25744/25855/25944/251033/251122/251211/25合計251樣本工時平均工資分布38計算樣本平均工時工資的平均數(shù)和標(biāo)準(zhǔn)差:39從理論上推導(dǎo)樣本平均數(shù)的分布:40結(jié)論:在重復(fù)抽樣的情況下,樣本平均數(shù)的平均數(shù)等于總體平均數(shù)。樣本平均數(shù)的標(biāo)準(zhǔn)差反映樣本平均數(shù)與總體平均數(shù)的平均誤差程度,等于總體標(biāo)準(zhǔn)差
12、的 ,稱為抽樣平均(標(biāo)準(zhǔn))誤差。記為 。41樣本成數(shù)的分布成數(shù)是01分布的變量的平均數(shù),設(shè)總體成數(shù)為 ,總體方差為結(jié)論:在重復(fù)抽樣的情況下,樣本成數(shù)p的平均數(shù)等于總體成數(shù)P,即 。樣本成數(shù)的標(biāo)準(zhǔn)差即抽樣平均誤差為 。42例:某產(chǎn)品的一級品率為80%,現(xiàn)采用重復(fù)抽樣方式從中抽取100件,求樣本一級品率的抽樣平均誤差。解:樣本一級品率的抽樣平均誤差為:43三、不重復(fù)抽樣分布樣本平均數(shù)的分布例:某班組有5個工人,他們的單位工時工資分別是4、6、8、10、12元,現(xiàn)用不重復(fù)抽樣方式從5個工人中抽出2人,求樣本平均工時工資的抽樣分布。 解:先計算總體工時工資的平均數(shù)和方差:44樣本變量46810124-
13、567865-789867-91010789-1112891011- 樣本工時平均工資 (單位:元) 45樣本工時平均工資 (元)頻數(shù)頻率522/20622/20744/20844/20944/201022/201122/20合計201樣本工時平均工資分布46計算樣本平均工時工資的平均數(shù)和標(biāo)準(zhǔn)差:47結(jié)論:在不重復(fù)抽樣的情況下,樣本平均數(shù)的平均數(shù)等于總體平均數(shù)。樣本平均數(shù)的標(biāo)準(zhǔn)差反映樣本平均數(shù)與總體平均數(shù)的平均誤差程度,稱為抽樣平均(標(biāo)準(zhǔn))誤差。記為注意:當(dāng)N較大時, ,這個系數(shù)稱為不重復(fù)抽樣的修正系數(shù),當(dāng)N遠(yuǎn)大于n時,修正系數(shù)近似于1,即可用重復(fù)抽樣的誤差公式代替不重復(fù)抽樣的誤差公式。48樣
14、本成數(shù)的分布結(jié)論:在不重復(fù)抽樣的情況下,樣本成數(shù)p的平均數(shù)等于總體成數(shù)P,即 。樣本成數(shù)的標(biāo)準(zhǔn)差即抽樣平均誤差為 。注意:當(dāng)總體成數(shù)P未知時,可用樣本成數(shù)p 代替總體成數(shù)P計算抽樣平均誤差 。49例:要估計某地區(qū)10000名適齡兒童的入學(xué)率,現(xiàn)采用不重復(fù)抽樣方式從中抽取400名兒童, 檢查有320名兒童入學(xué),求樣本入學(xué)率的抽樣平均誤差。解:樣本入學(xué)率的抽樣平均誤差為:50四、大數(shù)定理與中心極限定理大數(shù)定理獨立同分布的隨機變量: ,設(shè)它們的平均數(shù)為 ,方差為 ,即 , ,(i=1,2,)。則對任意的正數(shù),有:設(shè)m是n次試驗中事件A發(fā)生的次數(shù),p是事件A發(fā)生的概率,則對于任意小的正數(shù),有大數(shù)定理應(yīng)
15、用于成數(shù)指標(biāo):51中心極限定理正態(tài)分布的再生定理:從服從正態(tài)分布的總體中抽出一個容量是n 的樣本,則樣本平均數(shù) 也服從正態(tài)分布。如果總體的平均數(shù)是 ,標(biāo)準(zhǔn)差是 ,則樣本平均數(shù)所服從的正態(tài)分布的中心仍是 ,標(biāo)準(zhǔn)差是抽樣平均誤差 。52獨立同分布的隨機變量: ,設(shè)它們的平均數(shù)為 ,方差為 ,即 , ,(i=1,2,)。則當(dāng)n趨于無窮大時,算術(shù)平均數(shù) 的分布趨近于正態(tài)分布 。中心極限定理:53如果總體變量X的期望和方差有限: , ,(i=1,2,)。從該總體中抽出一個容量是n 的樣本,則樣本平均數(shù) 的分布隨著n的增大而趨近于平均數(shù)是 ,標(biāo)準(zhǔn)差是抽樣平均誤差 的正態(tài)分布。由中心極限定理得:54中心極限
16、定理應(yīng)用于成數(shù):從任一總體成數(shù)為P,方差為P(1-P)的(0,1)分布總體中,抽取容量為n 的樣本,其樣本成數(shù)p的分布隨著n的增大而趨近于正態(tài)分布 。注意:一般認(rèn)為,樣本單位數(shù)不少于30的樣本為大樣本 ,抽樣分布就接近于正態(tài)分布。55例1:某高??忌雽W(xué)成績平均分為550分,標(biāo)準(zhǔn)差為250分。從考生中隨機抽100名,問這100名考生平均成績在540580分之間的概率。解:這100名考生平均成績 近似服從即:這100名考生平均成績在540580分之間的概率為54.04%。56例2:某縣糧食平均畝產(chǎn)為760公斤,標(biāo)準(zhǔn)差為380公斤。從中隨機抽400畝,求樣本平均畝產(chǎn)在800公斤以上的概率。解:樣本
17、平均畝產(chǎn) 近似服從即:樣本平均畝產(chǎn)在800公斤以上的概率為1.785%。57比較:上例中,如果該縣糧食畝產(chǎn)服從正態(tài)分布,求畝產(chǎn)在800公斤以上所占的比例。解:該縣糧食畝產(chǎn)X服從因此,畝產(chǎn)在800公斤以上的概率為:即:該縣糧食畝產(chǎn)在800公斤以上所占的比例為46%。58例3:某廠零件加工的不合格品率為6%,現(xiàn)從加工件中隨機抽取100件,求樣本不合格品率在4%以下的概率。樣本不合格品率p近似服從即:樣本不合格品率在4%以下的概率為20.3%。解:總體成數(shù)為P=6%,方差為P(1-P)=0.056459第四節(jié) 抽樣估計的方法與應(yīng)用 一、總體參數(shù)估計概述總體參數(shù)估計用樣本統(tǒng)計量來估計總體參數(shù),有點估計
18、和區(qū)間估計兩種。要有合適的統(tǒng)計量作為估計量。要有合理的允許誤差范圍。(估計的準(zhǔn)確度)要有一個可接受的置信度。(估計的可靠性)科學(xué)的抽樣估計方法應(yīng)具備的三個基本條件:60二、總體參數(shù)的點估計點估計直接以樣本統(tǒng)計量的取值作為相應(yīng)總體參數(shù)的估計值,又稱定值估計。優(yōu)點:能提供總體參數(shù)的具體估計值,可作為決策的數(shù)量依據(jù)。缺點:不能提供估計的準(zhǔn)確度和可靠性信息。61評價估計量優(yōu)良性的三個標(biāo)準(zhǔn):1、無偏性:樣本統(tǒng)計量的期望值等于被估計的總體參數(shù)。設(shè) 表示總體的待估參數(shù), 是估計 的樣本統(tǒng)計量,無偏估計指的是 滿足: 如:由于 ,所以樣本平均數(shù)是總體平均數(shù)的無偏估計量。 622、一致性:當(dāng)樣本的單位數(shù)充分大時
19、,樣本統(tǒng)計量也充分靠近總體參數(shù)。所以樣本平均數(shù)是總體平均數(shù)的一致估計量。如:633、有效性:作為優(yōu)良估計量,其方差應(yīng)比其它無偏估計量的方差小。如:設(shè) 和 都是總體參數(shù) 的無偏估計量,如果 ,則說明估計量 比 更有效。 64總體方差的估計:以樣本方差 作為總體方差 的估計量。原因:重復(fù)抽樣的情況下,樣本方差 是總體方差的無偏估計量。65證明如下:66注意:雖然樣本方差 是總體方差的無偏估計量,但樣本標(biāo)準(zhǔn)差 并不是總體標(biāo)準(zhǔn)差 的無偏估計量,只是總體標(biāo)準(zhǔn)差的漸近無偏估計量。67證明如下:68三、總體參數(shù)的區(qū)間估計區(qū)間估計根據(jù)給定的置信度要求,指出總體參數(shù)被估計的上限和下限。方法:對總體被估計參數(shù) ,
20、找出樣本的兩個估計量 和 ,要求滿足: 式中(01)是區(qū)間估計的顯著性水平, 1-稱為置信度 。特點:能提供估計的準(zhǔn)確度和可靠性信息。69置信度的意義:設(shè)以樣本平均數(shù) 估計總體平均數(shù) ,表示極限誤差,則:樣本估計區(qū)間 是可變的,如果反復(fù)抽樣的結(jié)果,有1-(如:90%)的估計區(qū)間 包含 ,其余(10%)的估計區(qū)間不包含 ,則認(rèn)為 落在 區(qū)間內(nèi)的判斷只有1-(90%)的可信度。70設(shè)以樣本平均數(shù) 估計總體平均數(shù) ,表示極限誤差, 1-表示置信度,當(dāng)樣本為大樣本時, 的分布接近于正態(tài)分布 置信度與允許極限誤差的關(guān)系:稱稱 為概率度,則有: 71總體平均數(shù)的估計1、總體方差已知時:如果總體服從正態(tài)分布
21、,則根據(jù)正態(tài)分布再生定理樣本平均數(shù) ;如果總體正態(tài)性不成立,但是樣本容量n充分大時,根據(jù)中心極限定理,近似地也有 。因此,可根據(jù)置信度與允許極限誤差的關(guān)系,知道其中一個就可求另一個,并進(jìn)行區(qū)間估計。72已知置信度1-的區(qū)間估計步驟:抽取樣本,計算樣本平均數(shù) ,根據(jù)總體方差計算抽樣平均誤差 ;根據(jù)給定的置信度1-(即F(z) =1-/2 ),查表求概率度z;根據(jù)z和 求抽樣極限誤差,并據(jù)此得出估計區(qū)間 。73已知允許極限誤差的區(qū)間估計步驟:抽取樣本,計算樣本平均數(shù) ,根據(jù)總體方差計算抽樣平均誤差 ;根據(jù)已知的允許極限誤差,求出估計區(qū)間 ;根據(jù) 和 求概率度z,再根據(jù)z值查表求出F(z),可得置信
22、度(即1-=1-21-F(z) )。74例:某鄉(xiāng)水稻20000畝,畝產(chǎn)標(biāo)準(zhǔn)差為72.6公斤,隨機抽400畝,平均畝產(chǎn)為645公斤,(1)試以95%的概率保證程度估計該鄉(xiāng)畝產(chǎn)量和總產(chǎn)量;(2)給定極限誤差7.2公斤,試對該鄉(xiāng)畝產(chǎn)量和總產(chǎn)量進(jìn)行區(qū)間估計。解:樣本平均畝產(chǎn) , 抽樣平均誤差 75(1)由1-=0.95 (F(z)=0.975) ,查表得z=1.96,根據(jù) z 和 求抽樣極限誤差:據(jù)此可得出畝產(chǎn)量的估計區(qū)間(637.9,652.1)公斤。因此總產(chǎn)量的估計區(qū)間為(1275.8,1304.2)萬公斤。(2)根據(jù) =7.2 和 求概率度z:再根據(jù)z=2查表得F(z)=0.9772,置信度為0
23、.9544 。因此,以95.44%的概率保證程度估計該鄉(xiāng)畝產(chǎn)量的估計區(qū)間為(637.8,652.2)公斤,總產(chǎn)量的估計區(qū)間為(1275.6,1304.4)萬公斤。76總體平均數(shù)的估計2、總體方差未知時:如果總體服從正態(tài)分布,則可用樣本的標(biāo)準(zhǔn)差s代替總體標(biāo)準(zhǔn)差。這時的統(tǒng)計量為:t 服從的不是標(biāo)準(zhǔn)正態(tài)分布,而是自由度為n-1的t-分布。估計時要查t-分布表(自由度為n-1 ,雙側(cè)值)大樣本時,t-分布接近標(biāo)準(zhǔn)正態(tài)分布,可查標(biāo)準(zhǔn)正態(tài)分布表(這時對總體沒有正態(tài)性的限制)。 77例1:設(shè)鋼珠的直徑服從正態(tài)分布,現(xiàn)從一批鋼珠中隨機抽出9個,測量它們的直徑,并求得其樣本的平均值是31.06毫米,樣本標(biāo)準(zhǔn)差是
24、0.25毫米。試以95%的概率保證,估計鋼珠直徑的置信區(qū)間。解:依題意有:由1-=0.95,查自由度為8的 t-分布表得:據(jù)此可得出置信度為95%的鋼珠直徑的估計區(qū)間為(30.868,31.252)毫米。78例2:燈具廠要估計一批燈泡的平均壽命。現(xiàn)隨機地抽取50只燈泡進(jìn)行測試,其平均壽命是1600小時,樣本方差是2500小時平方。試給出這批燈泡平均壽命95%的置信度區(qū)間估計。解:由于n大于30,是大樣本,依題意有:由1-=0.95,查正態(tài)分布表得:據(jù)此可得出置信度為95%的燈泡平均壽命的估計區(qū)間為(1586.14,1613.86)小時 。79總體成數(shù)的估計已知置信度1-的區(qū)間估計步驟:抽取樣本
25、,計算樣本成數(shù)p,以 p代替總體成數(shù)P計算總體方差并推算抽樣平均誤差 ;根據(jù)給定的置信度1-(即F(z)=1-/2),查表求概率度z;根據(jù)z和 求抽樣極限誤差 ,并據(jù)此得出總體成數(shù)的估計區(qū)間 。設(shè)總體成數(shù)是P,樣本成數(shù)是p,則當(dāng)樣本容量充分大時, p近似服從 。80例1:在一項廣告活動調(diào)查中,隨機調(diào)查400人有240人能記起廣告語,求能記起廣告語比率的置信度95%的估計區(qū)間。解:樣本成數(shù)p=60%,總體標(biāo)準(zhǔn)差為抽樣平均誤差由1-=0.95 (F(z)=0.975) , 查表得z=1.96,根據(jù) z 和 求抽樣極限誤差據(jù)此得出總體成數(shù)的估計區(qū)間(55.2%,64.8%)。81總體成數(shù)的估計抽取樣
26、本,計算樣本成數(shù)p,以 p代替總體成數(shù)P計算總體方差并推算抽樣平均誤差 ;根據(jù)已知的允許極限誤差 ,求出估計區(qū)間 ;根據(jù) 和 求概率度z,再根據(jù)z值查表求出F(z),可得置信度(即1-=1-21- F(z) )。已知允許極限誤差的區(qū)間估計步驟:82例2:為估計某市居民戶擁有空調(diào)的普及率,隨機抽取900居民戶,有675戶有空調(diào)。要求抽樣極限誤差不超過2.8%,試對該市居民戶空調(diào)的普及率進(jìn)行估計。解:樣本成數(shù)p=75%,總體標(biāo)準(zhǔn)差為抽樣平均誤差因此,以95.44%的概率保證程度估計該市居民戶空調(diào)普及率的區(qū)間為(72.2%,77.8%)。根據(jù) 和 求概率度z:根據(jù)z值查表得F(z) =0.9772,
27、置信度1-= 0.9544。83第五節(jié) 抽樣推斷誤差的控制 一、必要樣本單位數(shù)的確定必要的樣本單位數(shù):在一定的概率保證程度下,要使抽樣誤差不超過某一給定范圍所必需的樣本單位數(shù)。 84總體的標(biāo)志變異程度抽樣極限誤差 抽樣推斷的概率保證程度抽樣方法和抽樣組織方式 影響必要樣本單位數(shù)大小的因素 :85必要樣本單位數(shù)的確定:根據(jù)給定的抽樣極限誤差和概率保證程度計算必要的樣本單位數(shù)。1、估計總體平均數(shù)時:重復(fù)抽樣下不重復(fù)抽樣下862、估計總體成數(shù)時:重復(fù)抽樣下不重復(fù)抽樣下注意:在多主題抽樣情況下,一個樣本要調(diào)查多項指標(biāo),此時要采用樣本單位數(shù)較大的設(shè)計方案。87例:某市要進(jìn)行職工家計調(diào)查,由歷史資料知該市
28、職工家庭年收入與消費支出的標(biāo)準(zhǔn)差分別為2400元和1500元。現(xiàn)采用重復(fù)抽樣方法,要求在95.44%的置信度下,平均年收入與消費支出的極限誤差分別不超過200元和120元,求樣本必要的單位數(shù)。解: 由1-=0.9544得F(z)=0.9772,查表得概率度z=2,根據(jù)重復(fù)抽樣的樣本必要單位數(shù)公式:因此,樣本必要的單位數(shù)為625戶。88抽樣設(shè)計的基本原則保證隨機原則的實現(xiàn)(要有合適的抽樣框,保證隨機取樣的實現(xiàn))。要考慮樣本容量和結(jié)構(gòu),以及調(diào)查費用。要采用適當(dāng)?shù)某闃咏M織形式。常用的抽樣組織形式:簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、階段抽樣等。二、抽樣組織設(shè)計89簡單隨機抽樣按隨機原則直接從
29、總體N個單位中抽取n 個單位作為樣本,又稱單純隨機抽樣。對總體的要求:總體分布均勻。有抽樣框的名單??墒孪却_定總體的標(biāo)準(zhǔn)差。方法:直接抽取法 抽簽法 隨機數(shù)表法90簡單隨機抽樣的缺點:當(dāng)總體很大時,編號抽簽有困難。在已掌握關(guān)于總體的有關(guān)信息時,此法不能充分利用這些信息。簡單隨機抽樣可作為發(fā)展其它更復(fù)雜的抽樣組織形式的基礎(chǔ),成為衡量它們的抽樣效果的比較標(biāo)準(zhǔn)。91類型抽樣按一定標(biāo)志對總體各單位進(jìn)行分類,然后分別從每一類中按隨機原則抽取一定的單位構(gòu)成樣本,又稱分層抽樣。適用的條件:總體各單位在被研究標(biāo)志上有明顯差別。事先掌握總體相關(guān)的信息。優(yōu)點:把統(tǒng)計分組和抽樣原理有機結(jié)合,使抽取的樣本更具代表性,
30、能有效減小抽樣誤差。與所研究的標(biāo)志值大小有關(guān)92方法:設(shè)總體由N個單位組成,按對總體的認(rèn)識,把總體分為k組,使得:現(xiàn)從各組中分別按隨機方式抽出 個單位組成樣本。設(shè)樣本容量為n,它滿足: 為保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)相同,通常按比例抽樣,即保證:因此,各組的樣本單位數(shù)應(yīng)為:93樣本平均數(shù)與抽樣平均誤差的計算:設(shè)樣本為: 則各組平均數(shù)為:因此,樣本平均數(shù)為: 各組的組內(nèi)方差為: 94重復(fù)抽樣下樣本平均數(shù)的方差為: 不重復(fù)抽樣下樣本平均數(shù)的方差為: 95例:假設(shè)某農(nóng)場種植小麥1200畝,根據(jù)其地理條件劃分為甲、乙、丙三類,按5%的比例總共抽取60畝進(jìn)行調(diào)查,結(jié)果如下表所示。試以95%的概率估計農(nóng)場平均畝
31、產(chǎn)量的區(qū)間范圍。麥田類別總體面積(畝)抽查面積(畝)抽樣平均畝產(chǎn)(斤)畝產(chǎn)標(biāo)準(zhǔn)差(斤)甲6003060020乙3601846025丙2401240036合計12006096解: 樣本平均數(shù)為:組內(nèi)方差平均數(shù)為:抽樣平均誤差為:由1-=0.95查表得概率度z=1.96,因此極限誤差由此可得農(nóng)場平均畝產(chǎn)量的估計區(qū)間為:(511.73,524.27)斤。97結(jié)論:由于總體方差=組內(nèi)方差平均數(shù)+組間方差,因此類型抽樣的平均誤差一般小于簡單隨機抽樣,僅當(dāng)組間方差為0時二者才相等。由于總體方差唯一確定,因此類型抽樣分組時應(yīng)盡可能擴大組間方差,縮小組內(nèi)方差,這樣可減小抽樣誤差,提高抽樣效果。98等距抽樣將總
32、體各單位按某一標(biāo)志進(jìn)行順序排列,然后按固定的間隔來抽取樣本單位的抽樣組織形式,又稱機械抽樣或系統(tǒng)抽樣。特點:事先需了解總體的一些輔助信息。在各單位順序排列的基礎(chǔ)上,再按某種規(guī)則依一定間隔取樣,可保證取到的樣本單位在總體中分布均勻,使樣本有較高的代表性。僅當(dāng)排列的標(biāo)志與所研究的標(biāo)志有較密切的關(guān)系時,才能提高抽樣效果。99方法:無關(guān)標(biāo)志排隊法有關(guān)標(biāo)志排隊法按排列的標(biāo)志與所研究的標(biāo)志關(guān)系是否密切無關(guān)標(biāo)志排隊法:設(shè)總體有N個單位,現(xiàn)要抽取容量為n的樣本。先將總體N個單位按一定標(biāo)志(與所研究的標(biāo)志無關(guān))排隊,再將其劃分為n個相等部分,每部分k個單位,k=N/n?,F(xiàn)在從第一部分中隨機抽出第i個單位 ,第二
33、部分抽第k+i個單位,第三部分抽第2k+i個單位,第n部分抽第(n-1)k+i個單位,一共n個單位構(gòu)成樣本,相鄰兩個樣本單位的間隔為k。用此方法共可抽k個樣本。100有關(guān)標(biāo)志排隊法:將總體N個單位按有關(guān)標(biāo)志排隊,并根據(jù)樣本容量n等分后,有兩種取樣方法:半距中點取樣:取每一部分處于中間位置的單位,第一部分取第(k+1)/2個單位,第二部分取第k+(k +1)/2個單位,第n部分取第(n-1)k+(k +1)/2個單位,相鄰單位的距離為k ,一共n個單位構(gòu)成樣本。原因:因按有關(guān)標(biāo)志排隊,所以各組處于中間位置的單位最能代表該組水平。缺點:隨機性較差,只能抽一個樣本。101對稱等距取樣:從第一部分中隨
34、機抽出第i個單位 ,第二部分抽倒數(shù)第i個即第2k+1-i個單位,第三部分抽第2k+i個單位,第四部分抽第4k+1-i個單位, ,一共n個單位構(gòu)成樣本。原因:因按有關(guān)標(biāo)志排隊,所以當(dāng)?shù)谝粋€單位的標(biāo)志值偏小時,第二個單位的標(biāo)志值就會偏大,反之亦然。這樣既實現(xiàn)了隨機原則,又可取到比較有代表性的樣本。用此方法共可抽k個樣本。102注意:避免抽樣間隔與現(xiàn)象本身的周期性節(jié)奏相重合,否則會引起系統(tǒng)誤差。抽樣誤差的計算:等距抽樣的樣本平均數(shù)為: 等距抽樣采用無關(guān)標(biāo)志排隊法時,其抽樣誤差接近于不重復(fù)抽樣的簡單隨機抽樣誤差:103例:某塊麥地長300米,寬120米,包括120條垅,每垅長300米。現(xiàn)從這塊麥地按等
35、距抽樣的方式(采用半距中點取樣法) ,抽取50個2米長垅為樣本單位進(jìn)行實割實測,得各樣本單位產(chǎn)量如下表所示: 樣本產(chǎn)量(公斤)單位數(shù) 0.864.8-0.40.961.01212.0-0.20.481.21416.8001.41216.80.20.481.669.60.40.96合計5060-2.88104試計算平均畝產(chǎn)量的抽樣平均誤差,并以95%的概率保證程度估計這塊麥地的畝產(chǎn)量和總產(chǎn)量。 解: 樣本單位平均產(chǎn)量為:樣本單位標(biāo)準(zhǔn)差 樣本單位的抽樣平均誤差 由于1公畝= 100平方米,1公畝=0.15市畝,所以樣本單位面積=2平方米=0.02公畝=0.003市畝,所以樣本平均畝產(chǎn)量為:1.2/
36、0.003=400(公斤)平均畝產(chǎn)量的抽樣平均誤差為:0.034/0.003=11.33 (公斤) 105由置信度0.95查表得概率度z=1.96,因此平均畝產(chǎn)量的抽樣極限誤差因此麥地畝產(chǎn)量的估計區(qū)間為:(400-22.21,400+22.21)=(377.79,422.21)公斤。 麥地的總面積為:300120=36 000(平方米)=360(公畝)=54(市畝) 因此麥地總產(chǎn)量的估計區(qū)間為:(54377.79, 54422.21)=(20400.66,22799.34)公斤。 106整群抽樣將總體各單位分成若干群,然后從其中隨機抽取部分群,對中選的群進(jìn)行全面調(diào)查的抽樣組織方式,又稱集團抽樣。優(yōu)點:因?qū)χ羞x的群進(jìn)行全面調(diào)查,調(diào)查單位很集中,組織抽樣簡單,節(jié)省費用。適用條件:在沒有總體的有關(guān)信息可利用時,可采用整群抽樣。107樣本平均數(shù)與抽樣平均誤差的計算:設(shè)總體的全部N個單位被劃分為R群,每群含有M個單位,即N=RM。現(xiàn)在從總體R群中隨機抽出r群組成樣本,對中選的群中的所有單位進(jìn)行全面調(diào)查。 第i群的樣本平均數(shù)是: 總的樣本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中外民俗知到課后答案智慧樹章節(jié)測試答案2025年春哈爾濱商業(yè)大學(xué)
- 中西人論與文學(xué)知到課后答案智慧樹章節(jié)測試答案2025年春浙江大學(xué)
- 2025年腎上腺皮質(zhì)激素類藥項目合作計劃書
- 三級人力資源管理師-《企業(yè)人力資源管理師(理論知識)》考前強化模擬卷7
- 河北省武邑中學(xué)高三下學(xué)期開學(xué)考試英語試題2
- 遼寧省葫蘆島一中2017-2018學(xué)年高一下學(xué)期3月期初考地理試卷
- 擬IPO企業(yè)股東簽訂《一致行動人協(xié)議》重點問題解析
- 歷史教學(xué)學(xué)生史料實證素養(yǎng)的培養(yǎng)
- 可視化的對象-關(guān)系數(shù)據(jù)庫原型系統(tǒng)-V-ORDBMS的解決方案
- 淺析社保經(jīng)辦機構(gòu)工作人員績效管理
- 手機攝影教程全套課件
- 2025屆寧夏銀川一中高三上學(xué)期第五次月考英語試題及答案
- 2025年云南省公安廳招聘文職人員18人歷年高頻重點模擬試卷提升(共500題附帶答案詳解)
- 健康教育學(xué)(全套課件)
- 光伏工程施工組織設(shè)計
- 體育運動中的交流與合作 課件 2024-2025學(xué)年人教版(2024)初中體育與健康七年級全一冊
- DB53∕T 1269-2024 改性磷石膏用于礦山廢棄地生態(tài)修復(fù)回填技術(shù)規(guī)范
- 二年級下冊口算題大全(全冊可直接打印)
- 小學(xué)科學(xué)湘科版六年級下冊全冊同步練習(xí)含答案
- T∕CGMA 033002-2020 壓縮空氣站節(jié)能設(shè)計指南
- 橋梁工程施工組織設(shè)計
評論
0/150
提交評論