精品 統(tǒng)計(jì)學(xué)課件配暨南大學(xué)出版社_統(tǒng)計(jì)學(xué)原理 第七版_第1頁(yè)
精品 統(tǒng)計(jì)學(xué)課件配暨南大學(xué)出版社_統(tǒng)計(jì)學(xué)原理 第七版_第2頁(yè)
精品 統(tǒng)計(jì)學(xué)課件配暨南大學(xué)出版社_統(tǒng)計(jì)學(xué)原理 第七版_第3頁(yè)
精品 統(tǒng)計(jì)學(xué)課件配暨南大學(xué)出版社_統(tǒng)計(jì)學(xué)原理 第七版_第4頁(yè)
精品 統(tǒng)計(jì)學(xué)課件配暨南大學(xué)出版社_統(tǒng)計(jì)學(xué)原理 第七版_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 抽樣估計(jì)抽樣估計(jì)問(wèn)題的提出:現(xiàn)有10000盒火柴.欲知平均每盒火柴棍兒根數(shù).現(xiàn)有10000顆螺絲釘.其中有合格品,有不合格品.欲知合格率.日常生活中,人們同樣經(jīng)常用到抽樣方法。廚師做菜;買(mǎi)米;醫(yī)生看病;特別是對(duì)社會(huì)熱點(diǎn)問(wèn)題的民意測(cè)驗(yàn)。蘭德公司Research and Development, RAND 對(duì)朝鮮戰(zhàn)爭(zhēng)的預(yù)測(cè)統(tǒng)計(jì)估計(jì)推斷的過(guò)程樣本總體樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差總體均值、比例、方差全面調(diào)查的局限性破壞性調(diào)查,不宜全面調(diào)查.無(wú)限總體或總體過(guò)大,無(wú)法全面調(diào)查.于是,人們很自然地想到,能否僅從總體中抽取局部單位,就這局部單位進(jìn)行觀察或調(diào)查.并就對(duì)局部單位觀察或調(diào)查的結(jié)果計(jì)算

2、出有關(guān)的指標(biāo),然后,用這一指標(biāo)來(lái)估計(jì)總體的數(shù)字特征.如:從10000盒火柴中抽取100盒或30盒,點(diǎn)數(shù)之后,算得這100盒平均每盒根數(shù).譬如:49根.然后用這49根,來(lái)代表10000盒火柴平均每盒根數(shù).再如,從10000顆螺絲釘中抽取100顆或30顆或50顆.進(jìn)行檢測(cè)后得其合格率.如95%.然后,用這95%代表整個(gè)10000顆螺絲釘?shù)暮细衤? 實(shí)際生活中人們也是這么做的.而且很有效.然后,接下來(lái)的問(wèn)題是:采用何種方法來(lái)抽取局部單位?抽取多少單位?用這局部單位的指標(biāo)代表總體指標(biāo),準(zhǔn)確性如何?用這局部單位的指標(biāo)代表總體指標(biāo),有多大把握? 抽樣推斷是按隨機(jī)原那么從全部研究對(duì)象中抽取局部單位進(jìn)行觀察,

3、并根據(jù)樣本的實(shí)際數(shù)據(jù)對(duì)總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷。 抽樣推斷的特點(diǎn):它是由局部推斷整體的一種認(rèn)識(shí)方法抽樣推斷建立在隨機(jī)取樣的根底上抽樣推斷運(yùn)用概率估計(jì)的方法。抽樣推斷的誤差可以事先計(jì)算并加以控制 參數(shù)估計(jì) 參數(shù)估計(jì)是依據(jù)所獲得的樣本觀察資料,對(duì)所研究現(xiàn)象總體的水平、結(jié)構(gòu)、規(guī)模等數(shù)量特征進(jìn)行估計(jì)。 假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征所作的假設(shè)是否可信的一種統(tǒng)計(jì)分析方法。抽樣推斷的內(nèi)容第八章 抽樣估計(jì)一、根本內(nèi)容第一節(jié) 抽樣估計(jì)中的幾個(gè)根本概念第二節(jié) 樣本平均數(shù)的分布規(guī)律第三節(jié) 抽樣估計(jì)二、學(xué)習(xí)目的與要求通過(guò)本章教學(xué),使同學(xué)們明確抽樣調(diào)查的概念和

4、根本原理,掌握概率根底的根本運(yùn)算,熟練掌握簡(jiǎn)單隨機(jī)抽樣和類(lèi)型抽樣,了解等距抽樣、整群抽樣和多階段抽樣。三、學(xué)習(xí)的重點(diǎn)與難點(diǎn)本章學(xué)習(xí)的重點(diǎn)是樣本平均數(shù)的分布。難點(diǎn)是抽樣估計(jì)。四、授課課時(shí) 4-6學(xué)時(shí)第一節(jié) 抽樣估計(jì)中的幾個(gè)根本概念一、總體、樣本、抽樣框二、隨機(jī)抽樣與隨機(jī)樣本三、抽樣方法四、抽樣組織方式五、總體指標(biāo)與樣本指標(biāo)六、常用的總體指標(biāo)與樣本指標(biāo)七、抽樣誤差一、總體與樣本、樣本框研究對(duì)象的全體稱(chēng)總體。從總體中隨機(jī)地抽取一局部單位,稱(chēng)這一局部單位為一個(gè)樣本。被抽取的每一個(gè)單位,稱(chēng)為樣本單位。樣本中包含樣本單位的數(shù)目稱(chēng)為樣本容量。樣本單位數(shù)大于30個(gè)的樣本稱(chēng)為大樣本,不超過(guò)30個(gè)的樣本稱(chēng)為小樣本

5、。一、總體與樣本、樣本框樣本框也稱(chēng)抽樣范圍,是指一次直接抽樣時(shí)總體中所有元素的名單。樣本單位抽樣單位就是一次直接的抽樣所使用的根本單位。抽樣單位與構(gòu)成總體的元素有時(shí)相同,有時(shí)又不同。如一次直接抽取出100名學(xué)生;一次直接抽取出4個(gè)班級(jí),而4個(gè)班級(jí)全部學(xué)生作為樣本。在單一層次抽樣中,抽樣單位即總體單位。例如在一個(gè)城市對(duì)居民戶(hù)做調(diào)查,由市一級(jí)一步到位抽取居民戶(hù),此時(shí)居民戶(hù)既是總體單位,又是抽樣單位。在多層次抽樣中,抽樣單位與總體單位那么不一定是同一單位。例如上邊所說(shuō)的居民戶(hù)調(diào)查,改由市一級(jí)先抽取街道辦事處,再由街道辦事處抽居委會(huì),最后由居委會(huì)抽取居民戶(hù),在這種情況下,第一步的抽取單位是街道辦事處,

6、第二部的抽取單位是居委會(huì),由于他們都不是所采集資料的承擔(dān)者,故都不是總體單位。只有第三步中的居民戶(hù)即可視作抽樣單位,同時(shí)也是總體單位 。二、隨機(jī)抽樣與隨機(jī)樣本隨機(jī)抽樣是按隨機(jī)原那么從調(diào)查對(duì)象中抽取一局部單位作為樣本進(jìn)行觀察,然后根據(jù)樣本數(shù)據(jù)去推算調(diào)查對(duì)象的總體特征時(shí)機(jī)是均等的。如此抽得的樣本稱(chēng)為隨機(jī)樣本. 三、抽樣方法重復(fù)抽樣是指每次隨機(jī)抽取一個(gè)單位進(jìn)行觀察后放回去,再抽下一個(gè),再放回去,連續(xù)隨機(jī)抽取n次,構(gòu)成一個(gè)容量為n的樣本.不重復(fù)抽樣那么不將已抽取的單位放回去.(n/N30采用歷史資料.如果同時(shí)有幾個(gè)大小不同的歷史資料,那么選用數(shù)值較大者. 例:從10000盒火柴中,隨機(jī)抽取50盒,算得

7、樣本平均數(shù)為49根,樣本均方差為2根.求其抽樣平均誤差. 從10000顆螺絲釘中,隨機(jī)抽取100顆,經(jīng)檢測(cè)有5顆不合格.求其抽樣平均誤差. 從一批燈泡中,隨機(jī)抽取200個(gè),經(jīng)測(cè)算得平均壽命為4800小時(shí),樣本標(biāo)準(zhǔn)差為300小時(shí),求其抽樣平均誤差. 一批罐頭中隨機(jī)抽查300瓶.過(guò)去幾次同樣調(diào)查所得合格率分99%,98%.求合格率的抽樣平均誤差.第三節(jié) 抽樣估計(jì)一、點(diǎn)估計(jì)二、區(qū)間估計(jì)三、樣本容量確實(shí)定抽樣估計(jì)就是用樣本統(tǒng)計(jì)量去估計(jì)總體的未知參數(shù)。例如,估計(jì)總體均值、總體方差等。一、點(diǎn)估計(jì)點(diǎn)估計(jì)主要有矩估計(jì)法和最大似然估計(jì)法。矩估計(jì)法是樣本矩去估計(jì)總體矩的一種估計(jì)法;最大似然估計(jì)法是把待估計(jì)的總體參

8、數(shù)看作一個(gè)可以取不同數(shù)值的變量,計(jì)算當(dāng)總體參數(shù)取上述不同數(shù)值的時(shí)候,發(fā)生我們當(dāng)前所得到的樣本觀測(cè)值的不同概率,總體參數(shù)取哪一個(gè)數(shù)值的時(shí)候這種概率最大,便把這個(gè)數(shù)值作為對(duì)總體參數(shù)的估計(jì)結(jié)果。為什么可以這么來(lái)估計(jì)呢? 象樣本平均數(shù),在數(shù)理統(tǒng)計(jì)中被稱(chēng)為無(wú)偏估計(jì)量.所謂無(wú)偏估計(jì)量是指樣本平均數(shù)這一隨機(jī)變量,其數(shù)學(xué)期望等于總體的被估計(jì)參數(shù),即等于總體平均數(shù).所以稱(chēng)其為無(wú)偏估計(jì)量.例如.我們通過(guò)前面的例子已經(jīng)驗(yàn)證過(guò).雖然各個(gè)可能樣本的樣本平均數(shù)具有隨機(jī)性,可能等于總體平均數(shù),也可能不等于總體平均數(shù).但是平均起來(lái)看,樣本平均數(shù)的平均數(shù)(數(shù)學(xué)期望)一定等于總體平均數(shù).這種性質(zhì)在數(shù)理統(tǒng)計(jì)中叫做無(wú)偏性.具有這一性

9、質(zhì)的估計(jì)量叫做無(wú)偏估計(jì)量.樣本成數(shù)也是無(wú)偏估計(jì)量.估計(jì)量的優(yōu)良性準(zhǔn)那么無(wú)偏性無(wú)偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。如樣本平均是總體均值的一個(gè)無(wú)偏估計(jì)。 P( X )XCA無(wú)偏有偏估計(jì)量的優(yōu)良性準(zhǔn)那么有效性AB中位數(shù)的抽樣分布均值的抽樣分布XP(X )有效性:一個(gè)方差較小的無(wú)偏估計(jì)量稱(chēng)為一個(gè)更 有效的估計(jì)量。如,與其他估計(jì)量相比 ,樣本均值是一個(gè)更有效的估計(jì)量估計(jì)量的優(yōu)良性準(zhǔn)那么一致性一致性: 隨著樣本容量的增大,估計(jì)量 越來(lái)越 接近被估計(jì)的總體參數(shù).一批產(chǎn)品2000件,抽取樣本進(jìn)行檢驗(yàn)得其優(yōu)質(zhì)品率為85%.試對(duì)這批產(chǎn)品的合格品率及合格品數(shù)量做出點(diǎn)估計(jì).例題:點(diǎn)估計(jì)的缺陷:無(wú)法說(shuō)明抽樣誤

10、差的大小無(wú)法說(shuō)明估計(jì)結(jié)果的把握程度二、區(qū)間估計(jì) 區(qū)間估計(jì)就是根據(jù)樣本統(tǒng)計(jì)量及其抽樣分布,以一定可靠程度推斷總體參數(shù)可能范圍。區(qū)間估計(jì)不是指出被估計(jì)總體參數(shù)確實(shí)切數(shù)值,而是指出它的可能范圍。這種估計(jì)方法不僅以樣本值為依據(jù),而且考慮了抽樣誤差的大小,能說(shuō)明估計(jì)結(jié)果的把握程度。進(jìn)行區(qū)間估計(jì)時(shí),應(yīng)考慮兩個(gè)因素:一是估計(jì)的精確程度,二是可靠性要求。精確程度就是要求估計(jì)誤差必須控制在一定的范圍內(nèi)。允許誤差的最大值可以通過(guò)極限誤差來(lái)反映。極限誤差越小,估計(jì)的精度越高,極限誤差越大,估計(jì)的精度越低??煽啃允侵附Y(jié)果正確的概率保證,可用置信度來(lái)反映。區(qū)間估計(jì)中的精度要求與可靠性要求常常是一對(duì)矛盾。(一)抽樣極限誤

11、差在抽樣估計(jì)時(shí),應(yīng)根據(jù)所研究對(duì)象的變異程度和分析目的要求確定可允許的誤差范圍,我們把這種可允許的最大誤差范圍稱(chēng)為抽樣極限誤差。設(shè)x、p分別表示抽樣平均數(shù)極限誤差和抽樣成數(shù)極限誤差。那么有:區(qū)間 稱(chēng)為平均數(shù)的估計(jì)區(qū)間或稱(chēng)平均數(shù)的置信區(qū)間。區(qū)間 稱(chēng)為成數(shù)的估計(jì)區(qū)間或稱(chēng)成數(shù)的置信區(qū)間。抽樣極限誤差的概率度基于概率估計(jì)的要求,抽樣極限誤差通常需要以抽樣平均誤差 或 為標(biāo)準(zhǔn)單位來(lái)衡量。把極限誤差 或 分別除以 或 所得相對(duì)數(shù)t,表示誤差范圍為抽樣平均誤差的t倍。t是測(cè)量估計(jì)可靠程度的一個(gè)參數(shù)稱(chēng)為抽樣誤差的概率度。 三區(qū)間估計(jì)公式tt概率度t極限誤差概率度t概率估計(jì)區(qū)間0.50.382910.68271.

12、50.86641.960.950020.954530.9973落在總體均值某一區(qū)間內(nèi)的樣本X95.45% 的樣本99.73% 的樣本x- 368.27%的樣本x- 2x- X+ 3X+2X+ x總體參數(shù)的區(qū)間估計(jì)抽樣誤差范圍的概率保證度在確定允許的抽樣誤差范圍后,從主觀愿望說(shuō),希望抽樣調(diào)查的結(jié)果,樣本指標(biāo)的估計(jì)值都能夠落在允許的誤差范圍內(nèi),但這并非都能實(shí)現(xiàn)的事情。由于抽樣指標(biāo)值隨著樣本的變動(dòng)而變動(dòng),它本身是個(gè)隨機(jī)變量,因而抽樣指標(biāo)和總體指標(biāo)的誤差仍然是個(gè)隨機(jī)變量,不能保證誤差不超過(guò)一定范圍的這件事是必然的,而只能給以一定程度的概率保證。抽樣估計(jì)置信度就是說(shuō)明抽樣指標(biāo)和總體指標(biāo)的誤差不超過(guò)一定范

13、圍的概率保證程度??傮w參數(shù)區(qū)間的根本特點(diǎn):是根據(jù)給定的概率保證程度的要求,利用實(shí)際抽樣資料,指出總體被估計(jì)值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍。換句話(huà)說(shuō),對(duì)于總體的被估計(jì)指標(biāo)X,找出樣本的兩個(gè)估計(jì)量x1和x2,使被估計(jì)指標(biāo)X落在區(qū)間x1,x2內(nèi)的概率1-,01,為的。 即Px1Xx2)=1一是給定的。我們稱(chēng)區(qū)間 x1,x2 為總體指標(biāo)X的置信區(qū)間,稱(chēng)1-為估計(jì)置信度,稱(chēng)為顯著性水平,x1是置信下限,x2是置信上限。抽樣誤差范圍,求概率保證度 計(jì)算步驟是:首先抽取樣本,計(jì)算抽樣指標(biāo)如計(jì)算抽樣平均數(shù)或抽樣成數(shù),作為相應(yīng)總體指標(biāo)的估計(jì)值,并計(jì)算樣本標(biāo)準(zhǔn)差以推算抽樣平均誤差。其次,根據(jù)給定

14、的抽樣極限誤差范圍,估計(jì)總體指標(biāo)的下限和上限。最后,將抽樣極限誤差除以抽樣平均誤差求出概率度t值,再根據(jù)t值查?正態(tài)分布概率表?求出相應(yīng)的置信度F(t),并對(duì)總體參數(shù)作區(qū)間估計(jì)。 例1 對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查的資料分組列表如下,要求耐用時(shí)數(shù)的允許誤差范圍x=10.5小時(shí),試估計(jì)該批電子元件的平均耐用時(shí)數(shù)。抽樣誤差范圍, 求概率保證度(應(yīng)用耐用時(shí)數(shù)組中值元件數(shù)900以下900-950950-10001000-10501050-11001100-11501150-12001200以上875925975102510751125117512251263543931合計(jì)1001、計(jì)算抽

15、樣平均數(shù)和標(biāo)準(zhǔn)差2、根據(jù)給定的=10.5小時(shí),計(jì)算總體平均數(shù)的上下限,下限= 上限=3、根據(jù)t= ,查概率表得置信度 F(t)=0.9545 我們可以作如下估計(jì),即可以概率95.45%的保證程度,估計(jì)該批電子元件的耐用時(shí)數(shù)在1045-1066小時(shí)之間。某鄉(xiāng)水稻面積20000畝,以不重復(fù)抽樣方法從中隨機(jī)抽取400畝,求得樣本平均畝產(chǎn)645公斤,標(biāo)準(zhǔn)差72.6公斤。要求抽樣極限誤差不超過(guò)7.2公斤,試對(duì)該鄉(xiāng)水稻畝產(chǎn)和總產(chǎn)量作估計(jì)。給定的置信度要求,推算極限誤差的可能范圍 計(jì)算步驟是:首先抽取樣本,計(jì)算抽樣指標(biāo),作為相應(yīng)總體指標(biāo)的估計(jì)值,并計(jì)算樣本標(biāo)準(zhǔn)差以推算抽樣平均誤差。其次,根據(jù)給定的置信度F(

16、t)要求,查表求得概率度t值。最后,根據(jù)概率度t和抽樣平均誤差來(lái)推算抽樣極限誤差的可能范圍,再根據(jù)抽樣極差求出被估計(jì)總體措標(biāo)的上下限,對(duì)總體參數(shù)作區(qū)間估計(jì)。例:某紗廠某時(shí)期內(nèi)生產(chǎn)了10萬(wàn)個(gè)單位的紗,以不重復(fù)抽樣方法總隨機(jī)抽取2000個(gè)單位檢驗(yàn),檢驗(yàn)結(jié)果合格率為95%,廢品率為5%,試以95%的把握程度,估計(jì)全部紗合格品率的區(qū)間范圍及合格品數(shù)量的區(qū)間范圍?已知:區(qū)間下限:區(qū)間上限:從10000盒火柴中,隨機(jī)抽取50盒,算得樣本平均數(shù)為49根,樣本均方差為2根.試以95.45%的把握程度,估計(jì)總體平均每盒火柴棍根數(shù).從10000顆螺絲釘中,隨機(jī)抽取100顆,經(jīng)檢測(cè)有5顆不合格.試以95%的把握程度

17、估計(jì)這10000顆螺絲釘?shù)暮细衤?樣本容量即樣本所包括的樣本單位數(shù),抽樣數(shù)目。如前所述,抽樣平均誤差與樣本單位數(shù)的方根成反比.也就是說(shuō),n越大,抽樣平均誤差就是越小.抽樣估計(jì)的準(zhǔn)確性就越高.極端的情況:當(dāng)樣本單位數(shù)等于總體單位數(shù)時(shí),就成了全面調(diào)查,那估計(jì)的結(jié)果必然是100%地準(zhǔn)確。但是,樣本單位數(shù)越大,抽樣實(shí)際工作所需人力,物力,財(cái)力就越多,本錢(qián)就越高.所以,不能無(wú)限制地?cái)U(kuò)大大樣本容量。三、樣本容量確實(shí)定 適宜作法是: 根據(jù)抽樣工作性質(zhì)的要求.,所允許的極限誤差,以及所要求的把握程度,來(lái)確定必要地樣本容量因此,樣本容量可以根據(jù)極限誤差的公式來(lái)確定.從導(dǎo)出的公式中可以看出:第一.總體的方差越大,所需樣本容量越大.第二.要求

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論