抽樣與參數(shù)估計(jì)_第1頁
抽樣與參數(shù)估計(jì)_第2頁
抽樣與參數(shù)估計(jì)_第3頁
抽樣與參數(shù)估計(jì)_第4頁
抽樣與參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、抽樣與參數(shù)估計(jì)1第1頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三 第6章 抽樣(Sampling) 與參數(shù)估計(jì)(Estimate) 學(xué)習(xí)目的和要求學(xué)習(xí)重點(diǎn)學(xué)習(xí)難點(diǎn) 教學(xué)方法 授課時數(shù) 基本內(nèi)容 2第2頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三學(xué)習(xí)目的與要求通過本章學(xué)習(xí)能理解參數(shù)估計(jì)的一般問題;掌握參數(shù)的區(qū)間估計(jì)并會對樣本容量的確定掌握。3第3頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三學(xué)習(xí)重點(diǎn)均值的區(qū)間估計(jì)方法的應(yīng)用成數(shù)的區(qū)間估計(jì)方法的應(yīng)用 4第4頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三學(xué)習(xí)難點(diǎn)在不同條件下的區(qū)間估計(jì)5第5頁,共71

2、頁,2022年,5月20日,14點(diǎn)28分,星期三教學(xué)方法 討論講授6第6頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三基本內(nèi)容第1節(jié) 抽樣與抽樣分布第2節(jié) 參數(shù)估計(jì)的基本方法 第3節(jié) 總體均值的區(qū)間估計(jì)第4節(jié) 總體比例的區(qū)間估計(jì)第5節(jié) 樣本容量的確定第6節(jié) 其它抽樣方法及其抽樣分布特征7第7頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三抽樣法的特點(diǎn):隨機(jī)原則 部分估計(jì)總體 存在誤差并可以控制抽樣法的應(yīng)用:對某些不可能進(jìn)行全面調(diào)查而又需要了解其 全面情況的社會經(jīng)濟(jì)現(xiàn)象,必須應(yīng)用抽樣法。(破壞性試驗(yàn)、總體過大、單位過于分散,實(shí)際調(diào)查不可能的)8第8頁,共71頁,2022年,

3、5月20日,14點(diǎn)28分,星期三第1節(jié) 抽樣與抽樣分布一、有關(guān)抽樣的基本概念總體(母體)(Population)樣本(子樣)(Sample)總體指標(biāo)(總體參數(shù))(Population parameter)樣本指標(biāo)(樣本統(tǒng)計(jì)量)(Sample statistic)9第9頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三抽樣方法 重置抽樣(重復(fù)抽樣)(Sampling with replacement) 要從總體N個單位中隨機(jī)抽取一個容量為n的樣本,每次從總體中抽取一個單位,把順序號登記下來之后,重新放回參加下一次抽選,連續(xù)反復(fù)抽取n次組成所要求容量的樣本。 不重置抽樣(不重復(fù)抽樣)(Sa

4、mpling without replacement) 要從總體N個單位中隨機(jī)抽取一個容量為n的樣本,每 次從總體中抽取一個單位,被抽中的單位不再放回參加下一次抽選,連續(xù)進(jìn)行次便組成樣本。 不重復(fù)抽樣所得樣本對總體的代表性較大,抽樣誤差較小,所以實(shí)踐中通常采用不重復(fù)抽樣。 10第10頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三 概率抽樣的組織方式簡單隨機(jī)抽樣:從總體中抽取樣本最常用的方法。從容量為N的總體中進(jìn)行抽樣,如果容量為n 的每個可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡單隨機(jī)樣本。 分層抽樣:也稱分類抽樣或類型抽樣,它是按某個主要標(biāo)志對總體各單位進(jìn)行分類,然后從各

5、層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。等距抽樣也稱機(jī)械抽樣或系統(tǒng)抽樣。它是先將總體單位按一定順序排隊(duì),計(jì)算出抽樣間隔(或抽樣距離),然后按固定的順序和間隔抽取樣本單位。整群抽樣:也稱叢聚抽樣或集團(tuán)抽樣。它是將總體分為若干部分(每一部分稱為一個群),然后按隨機(jī)原則從中一群一群地抽選,對抽中群內(nèi)的所有單位進(jìn)行全面調(diào)查。11第11頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三總體中各元素的觀察值所形成的分布 分布通常是未知的可以假定它服從某種分布 總體分布(population distribution)總體12第12頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三一個

6、樣本中各觀察值的分布 也稱經(jīng)驗(yàn)分布 當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布 樣本分布(sample distribution)樣本13第13頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三二、抽樣分布(Sampling distribution)1、抽樣分布的意義 對統(tǒng)計(jì)量的所有可能取值及其對應(yīng)概率的描述,就是統(tǒng)計(jì)量的抽樣分布,即抽樣分布。抽樣分布反映樣本統(tǒng)計(jì)量的分布特征,根據(jù)抽樣分布的規(guī)律,可揭示樣本統(tǒng)計(jì)量與總體參數(shù)之間的關(guān)系,計(jì)算抽樣誤差,并說明抽樣推斷的可靠程度。 14第14頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三抽樣分布 (sampling di

7、stribution)總體計(jì)算樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差樣本15第15頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:樣本均值的抽樣分布【例】設(shè)一個總體,含有4個元素(個體) ,即總體單位數(shù)N=4。4 個個體分別為x1=1、x2=2、x3=3 、x4=4 ??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差16第16頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三現(xiàn)從總體中抽取n2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有44=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33

8、211,21,11第二個觀察值第一個觀察值所有可能的n = 2 的樣本(共16個)17第17頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P (X )1.53.04.03.52.02.518第18頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三樣本均值的分布與總體分布的比較 = 2.5 2 =1.25總體分布14230.1.2

9、.3抽樣分布P ( X )1.00.1.2.31.53.04.03.52.02.5X19第19頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三2、樣本均值的抽樣分布樣本平均數(shù)的標(biāo)準(zhǔn)差反映了樣本平均數(shù)與總體平均數(shù)的平均誤差,故稱之為抽樣平均誤差(或抽樣標(biāo)準(zhǔn)差)。計(jì)算公式: (重復(fù)抽樣)可見,抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比變化,與樣本容量的平方根成反比變化。 當(dāng)總體為正態(tài)分布時,對于任何樣本容量,樣本平均數(shù)的抽樣分布是正態(tài)分布。若總體方差2未知,則可用樣本方差s2取而代之 。樣本容量很大,無論總體分布如何,樣本平均數(shù)近似服從正態(tài)分布。 20第20頁,共71頁,2022年,5月20日,14

10、點(diǎn)28分,星期三3、樣本比例的抽樣分布 當(dāng)從總體中抽出一個容量為n的樣本時,樣本比例服從二項(xiàng)分布。 當(dāng)n時,二項(xiàng)分布趨近于正態(tài)分布。所以,在大樣本下,若np5且n(1-p) 5,樣本比例p近似服從正態(tài)分布。比例的抽樣平均誤差 (重復(fù)抽樣)式中,P為總體比例,實(shí)際計(jì)算時通常采用以往經(jīng)驗(yàn)數(shù)據(jù)或樣本比例 。21第21頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:燈泡廠從10000只燈泡中隨機(jī)抽取500只檢查其耐用時數(shù),結(jié)果如下表。該廠規(guī)定耐用時數(shù)在850以下為不合格。求平均耐用時數(shù)及不合格率的抽樣平均誤差。耐用時數(shù)燈泡數(shù) xxf800-850850-900900-950950-100

11、01000-10501050-1100371291851024078258759259751025107530525112875171125994504100075253700003225000255000400000157500合計(jì)500462500147500022第22頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三解:重復(fù)抽樣條件下 不重復(fù)抽樣條件下 23第23頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三練習(xí):1、從某大學(xué)學(xué)生中隨機(jī)抽選100名調(diào)查體重,結(jié)果平均體重為58千克。根據(jù)過去的資料知道該校學(xué)生體重標(biāo)準(zhǔn)差為10千克。求抽樣誤差。2、某工廠共生產(chǎn)新型聚光燈

12、2000只,隨機(jī)抽選400只進(jìn)行耐用時間調(diào)查,結(jié)果平均壽命為4800小時,標(biāo)準(zhǔn)差為300小時。求抽樣誤差。3、從某校學(xué)生中隨機(jī)抽選400名,發(fā)現(xiàn)戴眼鏡的有80人。計(jì)算求抽樣誤差。4、一批食品罐頭60000桶,隨機(jī)抽查300桶,有6桶不合格。求合格率的抽樣誤差。5、假設(shè)4個人工資分別為:400、500、700、800元,現(xiàn)隨機(jī)抽選2人進(jìn)行調(diào)查。(1)驗(yàn)證(2)計(jì)算重復(fù)抽樣及不重復(fù)抽樣的抽樣平均誤差。24第24頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三第2節(jié) 參數(shù)估計(jì)的基本方法 參數(shù)估計(jì)以實(shí)際觀察的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量作為未知總體參數(shù)的估計(jì)值。 一、點(diǎn)估計(jì)(Point estim

13、ate) 點(diǎn)估計(jì)也稱定值估計(jì),就是直接以樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值。點(diǎn)估計(jì)的優(yōu)點(diǎn)是它提供了總體參數(shù)的具體估計(jì)值,可作為決策的依據(jù),其缺點(diǎn)是不能提供有關(guān)抽樣誤差的信息。樣本均值是總體均值的點(diǎn)估計(jì)量,樣本方差s2是總體方差2的點(diǎn)估計(jì)量,樣本比例p是總體比例P的點(diǎn)估計(jì)量。優(yōu)良估計(jì)量的標(biāo)準(zhǔn): 無偏性 有效性 一致性25第25頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三二、區(qū)間估計(jì)(Interval estimate) 抽樣誤差統(tǒng)計(jì)調(diào)查的誤差,是指調(diào)查所得結(jié)果與總體真值之間的差異。誤差的來源有登記性誤差和代表性誤差兩大類。代表性誤差分為系統(tǒng)性誤差和偶然性誤差。抽樣估計(jì)中所謂的抽樣誤差,

14、就是指這種偶然性誤差或隨機(jī)誤差。(1)實(shí)際抽樣誤差。指某一特定樣本的樣本估計(jì)值與總體參數(shù)真值之間的離差。 (2)抽樣平均誤差。統(tǒng)計(jì)學(xué)中常用標(biāo)準(zhǔn)差來衡量均值的代表性,所以抽樣平均誤差可以衡量樣本對總體的代表性大小。 (3)抽樣極限誤差。指一定概率條件下抽樣誤差的可能范圍,也稱允許誤差。抽樣極限誤差的可能范圍與抽樣估計(jì)的可能性即概率緊密相聯(lián)。 26第26頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三樣本平均數(shù)的抽樣極限誤差樣本比例的抽樣極限誤差抽樣誤差與抽樣可靠性的關(guān)系27第27頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三影響抽樣誤差的主要因素 1、抽樣單位數(shù)的多少。在其

15、它條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差愈小;反之抽樣單位數(shù)愈少,抽樣誤差就愈大。 2、總體離散程度的高低。當(dāng)其它條件不變時,總體離散程度愈低,抽樣誤差愈小;反之總體離散程度愈高,抽樣誤差愈大。 3、抽樣方法 4、組織方式28第28頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三 第3節(jié) 總體均值的區(qū)間估計(jì)一、區(qū)間估計(jì)的基本原理1、大數(shù)定律大數(shù)定律主要是說明:當(dāng)n足夠大時,獨(dú)立同分布的隨機(jī)變量的算術(shù)平均數(shù)趨近于數(shù)學(xué)期望;事件發(fā)生的頻率接近于其發(fā)生的概率。 即樣本統(tǒng)計(jì)量接近于總體參數(shù)。 2、中心極限定理中心極限定理是說明:當(dāng)n充分大時,大量的起微小作用的相互獨(dú)立的隨機(jī)變量之和趨于正

16、態(tài)分布。29第29頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三大樣本(n30)下總體均值的區(qū)間估計(jì)區(qū)間估計(jì)就是根據(jù)樣本求出總體未知參數(shù)的估計(jì)區(qū)間,并使其可靠程度達(dá)到預(yù)定要求。(1) 總體方差2已知時由于 ,所以對于給定的置信度1-,有即 可見,極限誤差的計(jì)算公式為則總體均值的置信區(qū)間為30第30頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:從某大學(xué)學(xué)生中隨機(jī)抽取100名調(diào)查體重情況。經(jīng)稱量和計(jì)算,得到平均體重為58千克。根據(jù)過去的資料知道大學(xué)生體重的標(biāo)準(zhǔn)差是10千克。在95%的置信水平下,求該大學(xué)學(xué)生平均體重的置信區(qū)間。解:已知 =58,=10,z/2=1.96,

17、n=100 =10/10=1(千克) =1.961=1.96(千克) 置信下限為58-1.96=57.04, 置信上限為58+1.96=59.96故所求置信區(qū)間為(57.04,59.96)千克。31第31頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三 (2) 總體方差2未知時由于 t(n-1),對于給定的置信度1-,有置信下限 置信上限 在大樣本下,總體均值的置信區(qū)間為32第32頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三33第33頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:某進(jìn)出口公司出口一種名茶,規(guī)定每包重量不低于150克?,F(xiàn)不重復(fù)抽取1%檢驗(yàn),

18、結(jié)果如下。以95.45%的概率估計(jì)這批茶葉平均每包重量范圍,以確定該批茶葉是否達(dá)到要求。每包重量(克)包數(shù)xxf14814914915015015115115210205020148.5149.5150.5151.5148529907525303032.412.8228.8合計(jì)100150307634第34頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三解: 在95.45%的概率保證下, =20.087=0.174(g) 則總體平均數(shù)置信區(qū)間為 即(150.126,150.474)之間 說明該批茶葉達(dá)到要求。35第35頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三小樣本下

19、(n30)總體均值的區(qū)間估計(jì)在小樣本條件下,樣本平均數(shù)的分布依賴于總體的概率分布。若總體服從正態(tài)分布,無論樣本容量如何,樣本平均數(shù)都服從正態(tài)概率分布。若總體不服從正態(tài)分布,必須擴(kuò)大樣本容量。(1)總體方差2已知時 總體均值的置信區(qū)間為 (2)總體方差2未知時總體均值的置信區(qū)間為 ( , )36第36頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:某保險(xiǎn)公司投保人年齡設(shè)某保險(xiǎn)公司投保人年齡呈正態(tài)分布,現(xiàn)從中抽取10人,其年齡分別為:32,50,40,24,33,44,45,48,44,47歲。試以95%的置信水平估計(jì)該保險(xiǎn)公司投保人的平均年齡。 解:當(dāng)置信度為95%時, =2.26

20、22 2.6544=6.00(歲) 因?yàn)?0.7-6.00=34.7 40.7+6.00=46.7所以該保險(xiǎn)公司投保人的平均年齡的置信區(qū)間為(34.7,46.7)歲。 37第37頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三第4節(jié) 總體比例的區(qū)間估計(jì)在大樣本條件下,若np5,n(1-p)5,則樣本比例趨近于正態(tài)分布。對于給定置信度,有總體比例的置信區(qū)間為小樣本條件下,不作介紹。38第38頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:總體比例的區(qū)間估計(jì)【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估

21、計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知 n=100,p65% , 1-= 95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%74.35% 39第39頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:某廠對一批產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn),隨機(jī)重復(fù)抽取樣品100只,樣本合格品率為95,試計(jì)算把握程度為90的合格品率置信區(qū)間。解:已知n=100,p=95%,1-=90%,查表得z/2=1.645 =0.0218 p=z/2 =1.6450.0218=0.0359或3.59% 95%-3.59%=91.41%,95%+3.59%=98.59%故該批產(chǎn)品合格率的置信區(qū)間為(

22、91.41%,98.59%)40第40頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三練習(xí)1 、從一批產(chǎn)品中按不重復(fù)隨機(jī)方法抽選1/20,共200件, 其中廢品8件。當(dāng)概率保證程度為 95.45%時,可否認(rèn)為該批產(chǎn)品的廢品率不超過5%?2、一電視節(jié)目主持人想了解觀眾對電視節(jié)目的喜歡情況,他選取500名觀眾作樣本,結(jié)果說喜歡該節(jié)目的175人?,F(xiàn)以95%的概率估計(jì)觀眾喜歡這一節(jié)目的區(qū)間范圍。若該主持人希望估計(jì)極限誤差不超過5%,有多大把握?3、已知煉鋼廠的鐵水含碳量在正常情況下服從正態(tài)分布,其方差為0.1080.108,現(xiàn)測定了9爐鋼水,平均含碳量4.484。按95%的可靠程度估計(jì)該廠鐵

23、水含碳量。41第41頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三4.某市抽查25戶家庭用戶電力消費(fèi)量,結(jié)果如下。試以95%的概率保證,估計(jì)全市家庭用戶電力平均消費(fèi)量的置信區(qū)間、總消費(fèi)量的置信區(qū)間及用電量在85度以上的比例。用電量(度)戶數(shù)4555556565757585859525963合計(jì)2542第42頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三第5節(jié) 樣本容量的確定 在重置抽樣下,所以,必要抽樣單位數(shù)在不重置抽樣下,必要抽樣單位數(shù) 43第43頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:某市進(jìn)行職工家庭生活費(fèi)抽樣調(diào)查,已知職工家庭平均每人每月生活

24、費(fèi)收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。 解: 例:某企業(yè)要調(diào)查產(chǎn)品合格率,已知以往的合格率曾有90%、98%、99%?,F(xiàn)要求誤差不超過1%,把握程度為95%,問需要抽選多少件產(chǎn)品? 解: 例:要調(diào)查某校大學(xué)生英語四級考試成績,假設(shè)根據(jù)歷史資料該校學(xué)生平均成績的標(biāo)準(zhǔn)差為20分,及格率為65%?,F(xiàn)用重復(fù)抽樣方法,要求在95%的置信度下,平均分?jǐn)?shù)的誤差不超過2分,及格率的誤差不超過4%,求必要抽樣數(shù)目。 解: 44第44頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要

25、估計(jì)年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?解:45第45頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三影響必要抽樣數(shù)目的因素(1)允許誤差范圍。當(dāng)其它條件不變時,允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差2。其他條件不變的情況下,總體方差2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計(jì)的可靠程度1-。當(dāng)其他條件不變時,抽樣估計(jì)的可靠程度愈高,z/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計(jì)的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由

26、于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。 除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個原因 。46第46頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三練習(xí):1、假定總體為5000單位,被研究的標(biāo)志方差不小于400,抽樣極限誤差不超過3。當(dāng)概率為99.73%時,需要有多少不重復(fù)抽樣單位?(371)2、對某型號電池進(jìn)行電流強(qiáng)度檢查,根據(jù)以往正常生產(chǎn)經(jīng)驗(yàn),電流強(qiáng)度的標(biāo)準(zhǔn)差為0。4安培,合格率為90%?,F(xiàn)用重復(fù)抽樣方式,要求在95.45%的置信度下,抽樣平均電流強(qiáng)度的誤差范圍不超過0.08安培,抽樣合格率的極限誤差不超過5%,問必要的抽樣單位數(shù)應(yīng)為多

27、少?(144)3、對某型號電子元件10000只進(jìn)行耐用性能檢查。根據(jù)以往抽樣測定,求得耐用時數(shù)的均方差為51.91小時,合格率的均方差為28.62%,試計(jì)算:(1)概率保證為68.27%時,元件平均耐用時數(shù)的誤差范圍不超過9小時,在重復(fù)抽樣的條件下,要抽查多少元件?(34)(2)概率保證為99.73%時,元件合格率的極限誤差不超過5%,在重復(fù)抽樣的條件下,要抽查多少元件?(295)(3)在不重復(fù)抽樣的條件下,要同時滿足上述(1)、(2)條件,要抽查多少元件?47第47頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三4、某藥廠為了檢查瓶裝藥片數(shù)量,從成品庫隨機(jī)抽檢100瓶,結(jié)果平均每瓶

28、101.5片,標(biāo)準(zhǔn)差為3片。試以99.73%的概率推斷成品庫中該種藥平均每瓶數(shù)量的置信區(qū)間。如果允許誤差減少到原來的1/2,其它條件不變,問需要抽取多少瓶?5、在對一條廣告效應(yīng)進(jìn)行的電話追蹤調(diào)查中,30名被追蹤者中有20名會想起廣告用語。試求在看過該廣告的所有人中,會想起廣告語的人所占比重的置信區(qū)間。(=5%)6、設(shè)成年男子身高呈正態(tài)分布。某地區(qū)成年男子平均身高170厘米,標(biāo)準(zhǔn)差為2厘米。(1)若抽查10人,問這10人的平均身高介于166.2173.8厘米之間的可能性有多大?(2)如果進(jìn)行一次成年男子身高的抽樣調(diào)查,要求以95%的把握程度保證誤差不超過3厘米,問需抽查多少人?(3)如果以95%

29、的把握保證誤差不超過1.5厘米,問需抽查多少人?這一結(jié)果與上一結(jié)果有何關(guān)系?(4)如果允許誤差仍為1.5厘米,但要求保證程度提高到99.73%,問需要抽查多少人?48第48頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三7、某公司電話咨詢服務(wù)部門在每次通話結(jié)束時都要記下通話時間,從一個由16個記錄組成的隨機(jī)樣本得出平均一次通話時間為16分鐘。已知總體服從正態(tài)分布,其標(biāo)準(zhǔn)差為0.7分鐘。試以95.45%的概率推斷總體均值的置信區(qū)間。 8、某公司推出一種營養(yǎng)型豆奶,為了做好促銷工作,隨機(jī)地選取顧客詢問喜歡此豆奶情況。若要使置信度為95%,抽樣誤差不超過0.05,在下列情況下,你建議樣本的

30、容量為多大?(1)假如初步估計(jì)約有60%的顧客喜歡此豆奶;(2)假如無任何資料可用來估計(jì)喜歡此豆奶的比例。9、對某磚廠產(chǎn)品質(zhì)量進(jìn)行抽樣調(diào)查,要求抽樣誤差不超過0.01111,概率把握程度為0.9545。已知過去進(jìn)行的幾次同樣調(diào)查所得不合格產(chǎn)品比例為1.25%、1.23%、1.14%,試確定必要的抽樣數(shù)目。49第49頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三10、根據(jù)高教廳統(tǒng)計(jì),某地區(qū)有17%的大學(xué)生申請免息教育貸款。假定樣本容量為300。試求:(1)當(dāng)?shù)卮髮W(xué)生中申請免息教育貸款的總體比例的95.45%的置信區(qū)間。(2)當(dāng)?shù)卮髮W(xué)生中申請免息教育貸款的總體比例的99%的置信區(qū)間。(

31、3)當(dāng)把握程度由95.45%提高到99%時,允許誤差如何變動?11、某職業(yè)研究所隨機(jī)抽取100名IT行業(yè)人員了解本地人員薪金,樣本均值為50124.58元,樣本標(biāo)準(zhǔn)差為1685元,試分別求IT行業(yè)人員年薪的總體均值的90%、95%和99%的置信區(qū)間。當(dāng)置信水平增大時,置信區(qū)間的寬度如何變化?50第50頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三第6節(jié) 其它抽樣方法及其抽樣分布特征 一、分層抽樣(Stratified sampling) 設(shè)總體容量為N,將總體劃分為k層(組或類),有N=N1+N2+Nk。從每層的Ni個單位中抽取ni個單位構(gòu)成容量為n的樣本,即n=n1+n2+nk。

32、 從每層中抽取樣本單位時,為了保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)相同,通常采用按(等)比例取樣,即按各層單位數(shù)占總體單位數(shù)的比例從中抽取樣本,使各層樣本單位數(shù)與各層總體單位數(shù)之比等于樣本容量與總體容量之比。即 51第51頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三分層抽樣的抽樣平均誤差 重置抽樣下, 不重置抽樣下, 對于等比例分層抽樣,其分布特征如下: 樣本平均數(shù) 總體層內(nèi)方差平均數(shù) 抽樣平均誤差 (重復(fù)抽樣) (不重復(fù)抽樣) 52第52頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三總體方差未知時樣本層內(nèi)方差平均數(shù)抽樣平均誤差計(jì)算公式為 (重復(fù)抽樣) (不重復(fù)抽樣) 對于分層抽樣

33、,若總體各層為正態(tài)分布或?yàn)榇髽颖痉钦龖B(tài)分布,則各子樣本平均數(shù)、樣本平均數(shù)均服從或近似服從正態(tài)分布。對于給定的置信度1-,總體均值的置信區(qū)間為: 53第53頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三比例的抽樣平均誤差 重置抽樣不重置抽樣總體比例未知時,其中,當(dāng)總體服從或近似服從正態(tài)分布時,對于給定的置信度1-,總體比例的置信區(qū)間為:54第54頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三例:某電視臺分別從三個縣按比例抽選600戶,調(diào)查晚間新聞的收視率和每周看電視時間(小時),結(jié)果如表所示。在95%的置信度下,求(1) 三縣總體收視率的置信區(qū)間;(2) 三縣住戶每周看電

34、視的平均時間置信區(qū)間。縣住戶抽選戶比例平均數(shù)層內(nèi)方差12340000140006000400140600.270.180.1714.3518.7419.98237.24168.47131.0155第55頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三樣本容量的確定 重復(fù)抽樣不重復(fù)抽樣分層抽樣有如下的特點(diǎn): 1、由于總體方差等于組內(nèi)方差與組間方差之和,所以分層抽樣的誤差一般小于簡單隨機(jī)抽樣的誤差。2、由于總體方差是唯一確定的數(shù)值,因此分層抽樣時可以擴(kuò)大層間方差,縮小層內(nèi)方差,使抽樣誤差減小。 56第56頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三練習(xí):1、某鄉(xiāng)全部糧食耕地

35、5000畝,按平原和山區(qū)面積比例抽取樣本,容量為630畝,計(jì)算各組平均畝產(chǎn)和標(biāo)準(zhǔn)差如下。以95%的概率保證對全鄉(xiāng)平均畝產(chǎn)作區(qū)間估計(jì)。全部面積抽樣面積平均畝產(chǎn)標(biāo)準(zhǔn)差平原山區(qū)40001000504126960750200400合計(jì)500063091825357第57頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三2、對某公司職工的工資進(jìn)行抽樣調(diào)查,共抽取600名職工,其中400名工人,200名職員,結(jié)果如下。試分別計(jì)算類型抽樣和簡單隨機(jī)抽樣的誤差,并加以比較。現(xiàn)若采用類型抽樣方式,試對該公司職工平均工資作區(qū)間估計(jì)。如果要求誤差不超過1元,應(yīng)至少抽選多少工人和職員?(置信度為95%)工人職

36、員月工資人數(shù)月工資人數(shù)500600600700700800100180120700800800900900100070805058第58頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三3、從三種不同規(guī)模的工廠中,分別隨機(jī)抽查1%機(jī)床,得到機(jī)床利用率如下,試以95.45%的概率確定全部機(jī)床利用率的置信區(qū)間。工廠類型金屬切削機(jī)床數(shù)機(jī)床利用率(%)全部抽樣小型中型大型800025000300008025030083655959第59頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三4、假定類型抽樣的結(jié)果如下,試確定總體均值的95.45%的置信區(qū)間。區(qū)域抽取單位標(biāo)志平均數(shù)標(biāo)準(zhǔn)差甲乙6

37、003003236203060第60頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三二、等距抽樣(Systematic sampling) 如果對總體的差異程度不了解,可以按無關(guān)標(biāo)志排隊(duì)。這種抽樣結(jié)果接近于簡單隨機(jī)抽樣的效果,所以可采用簡單隨機(jī)抽樣的誤差計(jì)算方法,但要注意等距抽樣通常都是不重置抽樣。 如果對總體的變異程度有所了解,可以按有關(guān)標(biāo)志排隊(duì)。按有關(guān)標(biāo)志排隊(duì)的等距抽樣實(shí)質(zhì)上運(yùn)用了分層抽樣的一些特點(diǎn),有利于提高樣本的代表性,與分層抽樣不同的,只是分類更細(xì)致,層數(shù)更多,在各層只抽取1個單位。因此,一般可以采用不重復(fù)分層抽樣的誤差公式來近似計(jì)算。61第61頁,共71頁,2022年,5

38、月20日,14點(diǎn)28分,星期三按有關(guān)標(biāo)志排隊(duì)并將總體單位n等分后,取樣方法有以下兩種: 1、半距中點(diǎn)取樣。即在每部分的中間(抽樣距離的一半)抽取一個單位組成樣本。如,第一部分取第k/2單位,第二部分取第3k/2單位,第n部分取第(2n-1)k/2單位。這種取樣方法,使所抽取的各單位最能代表每部分的一般水平,從而提高樣本的代表性,其不足之處是只能取一個樣本。2、對稱等距取樣。即第一部分隨機(jī)抽取一個單位,然后據(jù)此在各部分中抽取兩兩對稱的樣本單位組成樣本。如,第一部分取第i單位,第二部分取第2k-i單位,第三部分取第2k+i單位,第四部分取第4k-i單位,第(n-1)部分取第(n-2)k+i單位,第

39、n部分取第nk-i單位。這種取樣方法,既遵循隨機(jī)原則,又能取到較有代表性的樣本,并且可以抽取k個樣本。樣本容量確定的方法與不重復(fù)分層抽樣相同 。62第62頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三練 習(xí)1、假定對總體2000個單位進(jìn)行5%的機(jī)械抽樣。試確定:(1)將總體劃分為多少個同等部分?(2)抽選的間隔如何?(3)每部分的單位數(shù)是多少?(4)能否說出抽取單位的號碼和抽取單位的總數(shù)?2、某產(chǎn)品零件方差為另一同類零件方差(0.12)的3倍,若以95%的可靠性估計(jì)抽樣誤差不多于0.17厘米,現(xiàn)打算從4000件零件中做機(jī)械抽樣,必須抽出多少零件做檢驗(yàn)?63第63頁,共71頁,2022年,5月20日,14點(diǎn)28分,星期三三、整群抽樣(Cluster sampling) 設(shè)總體N個單位劃分為R群,每群包含M個單位,即N=RM?,F(xiàn)從總體R群中隨機(jī)抽取r群,并分別對中選群的所有M個單位進(jìn)行調(diào)查。整群抽樣都采用不重復(fù)抽樣。 整群抽樣的抽樣誤差只受群間差異程度的影響。這與分層抽樣只受組內(nèi)方差影響的情形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論