




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、.1Chapter 2 簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣(Simple Random Sampling)簡(jiǎn)單隨機(jī)抽樣的定義與抽選方法簡(jiǎn)單隨機(jī)抽樣的定義與抽選方法簡(jiǎn)單估計(jì)量及其性質(zhì)簡(jiǎn)單估計(jì)量及其性質(zhì)比率估計(jì)量及其性質(zhì)比率估計(jì)量及其性質(zhì)回歸估計(jì)量及其性質(zhì)回歸估計(jì)量及其性質(zhì)樣本量的確定原則樣本量的確定原則若干問(wèn)題的補(bǔ)充若干問(wèn)題的補(bǔ)充.21 簡(jiǎn)單隨機(jī)抽樣的定義簡(jiǎn)單隨機(jī)抽樣的定義與抽選方法與抽選方法一、定義一、定義 從大小為從大小為N的總體抽取樣本量為的總體抽取樣本量為n的樣本,若全部的樣本,若全部可能的樣本被抽中的可能的樣本被抽中的概率都相等概率都相等,則稱這樣的抽樣為簡(jiǎn),則稱這樣的抽樣為簡(jiǎn)單隨機(jī)抽樣。單隨機(jī)
2、抽樣。 根據(jù)抽樣單位是否放回可分為放回簡(jiǎn)單隨機(jī)抽樣和根據(jù)抽樣單位是否放回可分為放回簡(jiǎn)單隨機(jī)抽樣和不放回簡(jiǎn)單隨機(jī)抽樣。不放回簡(jiǎn)單隨機(jī)抽樣。 放回放回簡(jiǎn)單隨機(jī)抽樣:每個(gè)樣本抽中的概率簡(jiǎn)單隨機(jī)抽樣:每個(gè)樣本抽中的概率 不放回不放回簡(jiǎn)單隨機(jī)抽樣:每個(gè)樣本抽中的概率簡(jiǎn)單隨機(jī)抽樣:每個(gè)樣本抽中的概率nN1nNC1簡(jiǎn)單隨機(jī)抽樣。簡(jiǎn)單隨機(jī)抽樣。實(shí)踐中,考慮不放回的實(shí)踐中,考慮不放回的.3二、實(shí)施方法二、實(shí)施方法 簡(jiǎn)單隨機(jī)樣本的抽選,首先要將總體從簡(jiǎn)單隨機(jī)樣本的抽選,首先要將總體從1到到 N 編號(hào),每個(gè)單位對(duì)應(yīng)一個(gè)號(hào);然后從所編的編號(hào),每個(gè)單位對(duì)應(yīng)一個(gè)號(hào);然后從所編的號(hào)中抽號(hào),如果抽到某個(gè)號(hào),則對(duì)應(yīng)的那個(gè)單號(hào)中
3、抽號(hào),如果抽到某個(gè)號(hào),則對(duì)應(yīng)的那個(gè)單位入樣,直到抽夠位入樣,直到抽夠 n 個(gè)單位為止。個(gè)單位為止。 抽簽法抽簽法 隨機(jī)數(shù)法隨機(jī)數(shù)法.4 抽簽法:抽簽法:簡(jiǎn)單隨機(jī)抽樣就是從盛有簡(jiǎn)單隨機(jī)抽樣就是從盛有N張票子的盒子張票子的盒子里里隨機(jī)無(wú)放回地隨機(jī)無(wú)放回地摸取摸取n(N)張票,它可以有兩種取法:張票,它可以有兩種取法: 1)從盒子中一次性摸取從盒子中一次性摸取n張票張票 2)從盒子中隨機(jī)地摸取一張票,相應(yīng)的單元入樣后,從盒子中隨機(jī)地摸取一張票,相應(yīng)的單元入樣后,票不放回盒子;從余下的票不放回盒子;從余下的N-1張票中再隨機(jī)地摸取一張張票中再隨機(jī)地摸取一張票,相應(yīng)的單元也入樣且票也不放回盒子;依次實(shí)施
4、,票,相應(yīng)的單元也入樣且票也不放回盒子;依次實(shí)施,直到第直到第n個(gè)樣本入樣。個(gè)樣本入樣。 兩種抽取的方法是等價(jià)的。兩種抽取的方法是等價(jià)的。每個(gè)樣本的被抽中的概率每個(gè)樣本的被抽中的概率都是都是 nNC/1?率率為為什什么么是是種種取取法法中中樣樣本本入入樣樣的的概概第第nNC1)2.512,niiiY YY第第二二種種抽抽取取中中,不不妨妨假假設(shè)設(shè)先先后后入入樣樣,則則),(,21niiiYYYP121312121() (|) (|)(|)nniiiiiiiiiiP YP YYP YY YP YY YY 11111 nNNN!)!(NnN !,21nYYYniii有有得得到到這這組組的的樣樣本本
5、的的個(gè)個(gè)數(shù)數(shù)后后順順序序無(wú)無(wú)關(guān)關(guān),這這組組樣樣本本與與其其入入樣樣的的先先.11!/)!( !nNCnNNnNn )入入樣樣的的概概率率為為樣樣本本(niiiYYY,21.6隨機(jī)數(shù)法隨機(jī)數(shù)法 當(dāng)總體較大時(shí),抽簽法實(shí)施起來(lái)比較困難,當(dāng)總體較大時(shí),抽簽法實(shí)施起來(lái)比較困難,這時(shí)可以利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子、搖獎(jiǎng)機(jī)、這時(shí)可以利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子、搖獎(jiǎng)機(jī)、計(jì)算機(jī)產(chǎn)生的偽隨機(jī)數(shù)進(jìn)行抽樣。計(jì)算機(jī)產(chǎn)生的偽隨機(jī)數(shù)進(jìn)行抽樣。 (1)利用隨機(jī)數(shù)表進(jìn)行抽選。利用隨機(jī)數(shù)表進(jìn)行抽選。 隨機(jī)數(shù)表是一張由隨機(jī)數(shù)表是一張由0,1,2,9這十個(gè)數(shù)這十個(gè)數(shù)字組成的,一般常用的是五位數(shù)的隨機(jī)數(shù)字表,字組成的,一般常用的是五位數(shù)的
6、隨機(jī)數(shù)字表,10個(gè)數(shù)字在表中出現(xiàn)的順序是隨機(jī)的,每個(gè)數(shù)字個(gè)數(shù)字在表中出現(xiàn)的順序是隨機(jī)的,每個(gè)數(shù)字都有同樣的機(jī)會(huì)被抽中。都有同樣的機(jī)會(huì)被抽中。 .7(2)利用隨機(jī)數(shù)骰子進(jìn)行抽選。利用隨機(jī)數(shù)骰子進(jìn)行抽選。(3)利用搖獎(jiǎng)機(jī)進(jìn)行抽選。利用搖獎(jiǎng)機(jī)進(jìn)行抽選。 (4)利用計(jì)算機(jī)產(chǎn)生的偽隨機(jī)數(shù)進(jìn)行抽選。通利用計(jì)算機(jī)產(chǎn)生的偽隨機(jī)數(shù)進(jìn)行抽選。通常產(chǎn)生的偽隨機(jī)數(shù)有循環(huán)周期。常產(chǎn)生的偽隨機(jī)數(shù)有循環(huán)周期。Excel、SPSS等都有隨機(jī)數(shù)發(fā)生器等等都有隨機(jī)數(shù)發(fā)生器等.8簡(jiǎn)單隨機(jī)抽樣在抽樣理論中的地位簡(jiǎn)單隨機(jī)抽樣在抽樣理論中的地位u缺點(diǎn):缺點(diǎn):要求每一個(gè)單元都有一個(gè)號(hào)碼,這意味著必要求每一個(gè)單元都有一個(gè)號(hào)碼,這意味著必須有
7、一個(gè)包含所有單元的完整抽樣框,而當(dāng)須有一個(gè)包含所有單元的完整抽樣框,而當(dāng)N很大很大時(shí),這點(diǎn)常常是不具備的;由此得到的樣本很分散,時(shí),這點(diǎn)常常是不具備的;由此得到的樣本很分散,不利于調(diào)查。例如,對(duì)全國(guó)進(jìn)行人口調(diào)查,總體單不利于調(diào)查。例如,對(duì)全國(guó)進(jìn)行人口調(diào)查,總體單元超過(guò)元超過(guò)1212億,要對(duì)全國(guó)每個(gè)人都編上號(hào),編制一個(gè)億,要對(duì)全國(guó)每個(gè)人都編上號(hào),編制一個(gè)完整的抽樣框?qū)嶋H上是不可能的。即使可能,當(dāng)抽完整的抽樣框?qū)嶋H上是不可能的。即使可能,當(dāng)抽到一個(gè)人也很難找到到一個(gè)人也很難找到。u優(yōu)點(diǎn):優(yōu)點(diǎn):簡(jiǎn)單隨機(jī)抽樣在抽樣理論中占有重要地位,簡(jiǎn)單隨機(jī)抽樣在抽樣理論中占有重要地位,它是其它抽樣方法的基礎(chǔ),其理論
8、也最為成熟。其它它是其它抽樣方法的基礎(chǔ),其理論也最為成熟。其它許多方法都是建立在簡(jiǎn)單隨機(jī)抽樣的基礎(chǔ)上。許多方法都是建立在簡(jiǎn)單隨機(jī)抽樣的基礎(chǔ)上。.9相關(guān)符號(hào)相關(guān)符號(hào)12,NNY YY 總總體體:12, ,ni ii抽抽中中的的號(hào)號(hào)碼碼:12(,)niiiyY YY 樣樣本本:12(,)nyyy nSampling fractionfN 抽抽樣樣比比()Nn 1.10有關(guān)指標(biāo)與符號(hào)有關(guān)指標(biāo)與符號(hào)指指 標(biāo)標(biāo) 總總 體體 樣樣 本本 總值總值均值均值比例比例比率比率有限總體方差有限總體方差無(wú)限總體方差無(wú)限總體方差 NiiYY1 NiiYNY11)或或(0 1,111 iNiiYYNNNPXYXYXYR
9、NiiNii 1121221)(11 NNYYNSNi NjYYN122)(1 niiyy1 niiyny11)或或 0 1( ,111 iniiyynnnpxyxyxyRniinii 11212)(11yynsnii .11引理引理 引理引理1:從大小為從大小為N的總體中抽取一個(gè)樣本容量為的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)單的簡(jiǎn)單隨機(jī)樣本,則總體中隨機(jī)樣本,則總體中每個(gè)特定的單元每個(gè)特定的單元入樣的概率為入樣的概率為n/N,兩個(gè)特定單元兩個(gè)特定單元入樣的概率為入樣的概率為n(n1)/N(N-1)。)。入樣的樣本數(shù)為入樣的樣本數(shù)為特定單元特定單元證明:樣本總數(shù)證明:樣本總數(shù)inNYC ;1111
10、 nNCC入樣的樣本數(shù)為入樣的樣本數(shù)為,兩個(gè)特定單元兩個(gè)特定單元)(jiYYji 2222 nNCC由古典概型的計(jì)算公式由古典概型的計(jì)算公式一個(gè)特定單元入樣的概率一個(gè)特定單元入樣的概率NnCCCnNnN 1111兩個(gè)特定單元入樣的概率兩個(gè)特定單元入樣的概率)1()1(2222 NNnnCCCnNnN.121211(,)nniNyyyYC 樣樣本本,將將所所有有可可能能出出現(xiàn)現(xiàn)的的樣樣本本求求和和,總總體體中中每每個(gè)個(gè)單單元元 都都出出現(xiàn)現(xiàn)了了次次,因因此此11nNiiiiyY 取取遍遍所所有有樣樣本本11 nNC或求期望)或求期望)求平均值求平均值(11iiiniNNnnNyYC 取取遍遍所所
11、有有樣樣本本 )(1niiyE即即1NiinNY )()( NjijinjijiYYYYYyYyE問(wèn)問(wèn):)1()1( NNnn)(1 niiyE求求.13 引理引理2:從大小為從大小為N的總體中抽取一個(gè)樣本容量為的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)的簡(jiǎn)單隨機(jī)樣本。若令:?jiǎn)坞S機(jī)樣本。若令:10iiYa 入入樣樣否否則則 1inE afN則則: 21in NnV affNN 13 cov,1,11ijffnna aijN NNN NnaPNnaPii 1)0(,)1(1,證證明明:由由引引理理 inE afN于于是是 1in NnVar affNN )1()1()1(1 NNnnaaPji,由由引引理
12、理 1cov,()()()1ijijijffa aE a aE a E aN .14簡(jiǎn)單估計(jì)量的定義簡(jiǎn)單估計(jì)量的定義簡(jiǎn)單估計(jì)量簡(jiǎn)單估計(jì)量 的性質(zhì)的性質(zhì)放回簡(jiǎn)單隨機(jī)抽樣的簡(jiǎn)單估計(jì)放回簡(jiǎn)單隨機(jī)抽樣的簡(jiǎn)單估計(jì)設(shè)計(jì)效應(yīng)設(shè)計(jì)效應(yīng)影響估計(jì)量精度的因素影響估計(jì)量精度的因素2.2 簡(jiǎn)單估計(jì)量及其性質(zhì)簡(jiǎn)單估計(jì)量及其性質(zhì)y.15一、簡(jiǎn)單估計(jì)量的定義一、簡(jiǎn)單估計(jì)量的定義 對(duì)于簡(jiǎn)單隨機(jī)抽樣,在沒(méi)有其它信息的條件對(duì)于簡(jiǎn)單隨機(jī)抽樣,在沒(méi)有其它信息的條件下,最簡(jiǎn)單的估計(jì)是利用樣本均值作為總體均值下,最簡(jiǎn)單的估計(jì)是利用樣本均值作為總體均值的估計(jì),即總體均值的簡(jiǎn)單估計(jì)量為:的估計(jì),即總體均值的簡(jiǎn)單估計(jì)量為: 11niiYyyn
13、 也就是說(shuō),樣本均值是總體均值的簡(jiǎn)單估計(jì)量。也就是說(shuō),樣本均值是總體均值的簡(jiǎn)單估計(jì)量。YynNYNYnii估估計(jì)計(jì)總總體體總總和和 1. yN,著著重重研研究究和和的的估估計(jì)計(jì)只只相相差差由由于于總總體體均均值值和和總總體體總總.16的性質(zhì)的性質(zhì)二、簡(jiǎn)單估計(jì)量二、簡(jiǎn)單估計(jì)量 y 例例2.1:一個(gè):一個(gè)N=6的總體中抽取的總體中抽取n=3的樣本,設(shè)這的樣本,設(shè)這6個(gè)單個(gè)單元的值分別為元的值分別為 Y1=21,Y2=12,Y3=15,Y4=24,Y5=6,Y6=18,則則總共可能有總共可能有 個(gè)樣本,每個(gè)樣本所包含的單元號(hào)及其數(shù)個(gè)樣本,每個(gè)樣本所包含的單元號(hào)及其數(shù)值見(jiàn)值見(jiàn)表表2.1總體均值總體均值
14、:總體方差總體方差: 發(fā)現(xiàn):發(fā)現(xiàn): 樣本均值的均值總體均值樣本均值的均值總體均值 樣本方差的均值總體方差樣本方差的均值總體方差這并不是偶然的,是其重要的性質(zhì)。這并不是偶然的,是其重要的性質(zhì)。1611 NiiYNY42)(11122 NiiYYNSYyE)(22)(SsE.17證明:(方法一:對(duì)稱性證法)證明:(方法一:對(duì)稱性證法) )(1)(1 niiyEnyEYyEYy )(:1 . 2的的無(wú)無(wú)偏偏估估計(jì)計(jì),即即是是對(duì)對(duì)于于簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽抽樣樣,定定理理YYNnnNii 11證明:(方法二:引入示性變量)證明:(方法二:引入示性變量) 否否則則。,個(gè)個(gè)單單元元入入樣樣;若若第第0, 1i
15、ai NiiiYany11于于是是 NiiiYaEnyE1)(1)()inE aN 由由于于YYNnnyENii 11)(的無(wú)偏估計(jì)。的無(wú)偏估計(jì)。是是于是于是YyN.18221)(:2 . 2SnfSnNnNyVy 的的方方差差本本均均值值對(duì)對(duì)于于簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽抽樣樣,樣樣定定理理證明:(方法一:引入示性變量)證明:(方法一:引入示性變量) )(yMSE 否否則則。,個(gè)個(gè)單單元元入入樣樣;若若第第0, 1iai NiiiYany11于于是是 )1()(1NiiiYanVyV)(112iNiiYaVn NiNjijijiiiaaYYaVYn122),cov(2)(1 1iV aff 1cov
16、,1ijffa aijN )(yV NiNjijiiYYNYNNNnf1221)1(121)()1(1YYNnfNii 21)(SnfyV 于于是是221)(SnfNyNV 于于是是.19證明:(方法二:對(duì)稱性證法)證明:(方法二:對(duì)稱性證法) 212)1()()(YynEyEyEyVnii 2211()niiEyYn )(1)(12212 jijiniiYyYyEnYyEn根據(jù)對(duì)稱性論證法,有根據(jù)對(duì)稱性論證法,有 )(21YyEnii 21)(YYNnNii jijiYyYyE)()()1()1(YYYYNNnnjjii .20)()1()1(1)(1)(2212YYYYNNnnnYYNnn
17、yVjijiNii )(11)(121YYYYNnYYnNjjiiNii (11)()111(12121YYNnYYNnnNNiiNii 2211)(11SnfYYNnNnNNii .21回顧回顧簡(jiǎn)單隨機(jī)抽樣的定義與抽選方法簡(jiǎn)單隨機(jī)抽樣的定義與抽選方法簡(jiǎn)單隨機(jī)抽樣的實(shí)施方法簡(jiǎn)單隨機(jī)抽樣的實(shí)施方法兩個(gè)引理兩個(gè)引理簡(jiǎn)單估計(jì)量的定義簡(jiǎn)單估計(jì)量的定義樣本均值是總體均值的無(wú)偏估計(jì)。樣本均值是總體均值的無(wú)偏估計(jì)。YyEYy )(:1 . 2的的無(wú)無(wú)偏偏估估計(jì)計(jì),即即是是對(duì)對(duì)于于簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽抽樣樣,定定理理221)(:2 . 2SnfSnNnNyVy 的的方方差差本本均均值值對(duì)對(duì)于于簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽
18、抽樣樣,樣樣定定理理.22221)()(:2 . 2SnfSnNnNyVyMSEy 的的方方差差本本均均值值對(duì)對(duì)于于簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽抽樣樣,樣樣定定理理與與樣樣本本量量幾幾乎乎成成反反比比。體體方方差差成成正正比比的的統(tǒng)統(tǒng)計(jì)計(jì)意意義義:精精度度與與總總,)(V yQ1:估計(jì)量的精度與抽樣比的關(guān)系大嗎?估計(jì)量的精度與抽樣比的關(guān)系大嗎?A1: 當(dāng)當(dāng)N很大時(shí),抽樣精度基本取決于樣本量很大時(shí),抽樣精度基本取決于樣本量n,而與抽而與抽樣比幾乎無(wú)關(guān)。樣比幾乎無(wú)關(guān)。Q2: 進(jìn)行人口抽樣調(diào)查,如果需要各個(gè)省的數(shù)據(jù),要達(dá)進(jìn)行人口抽樣調(diào)查,如果需要各個(gè)省的數(shù)據(jù),要達(dá)到相同的精度,大省和小省所需要的樣本量幾乎相同
19、還到相同的精度,大省和小省所需要的樣本量幾乎相同還是相差很大?是相差很大?A2:幾乎相同。雖然此時(shí)抽樣比相差很大,但如果抽樣比幾乎相同。雖然此時(shí)抽樣比相差很大,但如果抽樣比相同,必然會(huì)導(dǎo)致小省精度不夠,大省抽樣過(guò)多而浪費(fèi)。相同,必然會(huì)導(dǎo)致小省精度不夠,大省抽樣過(guò)多而浪費(fèi)。.23一點(diǎn)解釋?zhuān)阂稽c(diǎn)解釋?zhuān)?-f1-f:fpc (finite population correction )有限總體校正有限總體校正系數(shù)系數(shù) 總體未入樣率總體未入樣率從一無(wú)限總體中抽取一個(gè)樣本容量為從一無(wú)限總體中抽取一個(gè)樣本容量為n的隨機(jī)樣本的隨機(jī)樣本n2nsn22,它它的的無(wú)無(wú)偏偏估估計(jì)計(jì)是是均均值值的的方方差差是是 有有
20、限限總總體體的的校校正正系系數(shù)數(shù)。對(duì)對(duì)標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差(標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤)為為對(duì)對(duì)方方差差,于于是是稱稱。引引進(jìn)進(jìn)因因子子化化,總總體體有有限限時(shí)時(shí),產(chǎn)產(chǎn)生生了了變變fffNnN 111 一般而言,當(dāng)抽樣比小于一般而言,當(dāng)抽樣比小于5%時(shí),時(shí),fpc 可以忽略不計(jì)算,這樣可以忽略不計(jì)算,這樣的話估計(jì)量的標(biāo)準(zhǔn)差就估計(jì)的稍微高一些。的話估計(jì)量的標(biāo)準(zhǔn)差就估計(jì)的稍微高一些。.24為為樣樣本本方方差差。的的方方差差的的無(wú)無(wú)偏偏估估計(jì)計(jì):定定理理221)(3 . 2ssnfyvy 簡(jiǎn)單估計(jì)量方差的無(wú)偏估計(jì)簡(jiǎn)單估計(jì)量方差的無(wú)偏估計(jì)證明:說(shuō)明樣本方差是總體方差的無(wú)偏估計(jì)即可。證明:說(shuō)明樣本方差是總體方差的無(wú)偏估計(jì)即可
21、。 212)(11yynsnii 21)()(11YyYynnii )()(11221YynYynnii 根據(jù)對(duì)稱性論證法和方差性質(zhì)根據(jù)對(duì)稱性論證法和方差性質(zhì))(21YyEnii 21)(YYNnNii 2)1(SNNn )(2YynE 2)(YynE )(ynV 2SNnN 222)() 1() 1()(SnNNnNnSsE 于于是是)()(yVyvE 于于是是.25簡(jiǎn)單估計(jì)量的性質(zhì)小結(jié)簡(jiǎn)單估計(jì)量的性質(zhì)小結(jié)YyEYy )(:1 . 2的的無(wú)無(wú)偏偏估估計(jì)計(jì),即即是是對(duì)對(duì)于于簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽抽樣樣,定定理理221)()(:2 . 2SnfSnNnNyVyMSEy 的的方方差差本本均均值值對(duì)對(duì)于
22、于簡(jiǎn)簡(jiǎn)單單隨隨機(jī)機(jī)抽抽樣樣,樣樣定定理理21)(3 . 2snfyvy 的的方方差差的的無(wú)無(wú)偏偏估估計(jì)計(jì):定定理理的的具具有有相相應(yīng)應(yīng)的的性性質(zhì)質(zhì)。對(duì)對(duì)應(yīng)應(yīng)地地:yNY 置置信信區(qū)區(qū)間間:的的下下,于于是是,在在置置信信度度%100)1(1aY (),() ,yuV yyuV yu 此此時(shí)時(shí)為為雙雙側(cè)側(cè)分分位位數(shù)數(shù)。( ),( ) yuv yyuv y .26具體例子具體例子 例:從一個(gè)容量為例:從一個(gè)容量為100的總體中抽出樣本容量為的總體中抽出樣本容量為10的簡(jiǎn)的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體平均水平,并給出置信度為單隨機(jī)樣本,要估計(jì)總體平均水平,并給出置信度為95%的置信區(qū)間。的置信區(qū)間。序號(hào)
23、序號(hào)i 1 2 3 4 5 6 7 8 9 10yi4 5 2 0 4 6 6 15 0 8 1 . 010010,10,100 fnN解解:由由題題意意:,510101 iiyyY1111.19,422,910210221022 syyysiiii由由于于3115. 1)()(72. 11)(2 YvYssnfYv,95%的置信區(qū)間為的置信區(qū)間為5-1.961.3115, 5+1.961.31152.43,7.57.27 例:從一個(gè)容量為例:從一個(gè)容量為100的總體中抽出樣本容量為的總體中抽出樣本容量為10的簡(jiǎn)的簡(jiǎn)單隨機(jī)樣本,單隨機(jī)樣本,序號(hào)序號(hào)i 1 2 3 4 5 6 7 8 9 10y
24、i4 5 2 0 4 6 6 15 0 8 續(xù)上續(xù)上若問(wèn)若問(wèn): (2)估計(jì)總體的估計(jì)總體的總量總量以及以及95的置信區(qū)間。的置信區(qū)間。,5005100 yNY15.1313115. 1100)()()( YvNYsNYs95%的置信區(qū)間為的置信區(qū)間為N5-1.961.3115, 5+1.961.31151002.43,7.57243,757(3)總體均值估計(jì)的絕對(duì)誤差和相對(duì)誤差總體均值估計(jì)的絕對(duì)誤差和相對(duì)誤差57. 23115. 196. 1)( Yvud 絕絕對(duì)對(duì)誤誤差差514. 053115. 196. 1 Ydr相相對(duì)對(duì)誤誤差差.28(三)放回簡(jiǎn)單隨機(jī)抽樣的簡(jiǎn)單估計(jì)量放回簡(jiǎn)單隨機(jī)抽樣的簡(jiǎn)
25、單估計(jì)量YyEnyEnii )(1)(1nyVnyVnii212)(1)( nsyv2)( 方方差差的的無(wú)無(wú)偏偏估估計(jì)計(jì)量量有放回抽樣的精度低于不放回抽樣的精度。有放回抽樣的精度低于不放回抽樣的精度。.29百分?jǐn)?shù)的估計(jì)及其誤差百分?jǐn)?shù)的估計(jì)及其誤差在問(wèn)卷調(diào)查中對(duì)某個(gè)問(wèn)題的回答為在問(wèn)卷調(diào)查中對(duì)某個(gè)問(wèn)題的回答為“是是”或或“否否”的情況:若某個(gè)問(wèn)題的答案只有兩個(gè),的情況:若某個(gè)問(wèn)題的答案只有兩個(gè),“是是”或或“否否”,則選擇,則選擇“是是”或或“否否”的的比例比例 即是需要估即是需要估計(jì)的總體比例計(jì)的總體比例多項(xiàng)選擇題:某個(gè)問(wèn)題有多項(xiàng)選擇題:某個(gè)問(wèn)題有5種可選答案種可選答案A、B、C、D、E,每人可
26、任意選擇一項(xiàng),那么對(duì)答案,每人可任意選擇一項(xiàng),那么對(duì)答案A而言,每個(gè)而言,每個(gè)人的選擇可以是人的選擇可以是“A”或或“非非A”,由此,由此“選擇選擇A的比的比例例”即是需要估計(jì)的總體比例。即是需要估計(jì)的總體比例。同理,選擇同理,選擇B、C、D及及E的比例都是我們需要估計(jì)的總體比例。的比例都是我們需要估計(jì)的總體比例??傮w比例常用百分?jǐn)?shù)來(lái)表示,有時(shí)也俗稱為總體比例常用百分?jǐn)?shù)來(lái)表示,有時(shí)也俗稱為。.30 如果我們只關(guān)心總體中某些特定類(lèi)型的集合占整個(gè)總?cè)绻覀冎魂P(guān)心總體中某些特定類(lèi)型的集合占整個(gè)總體的比例,那么我們的盒子模型中的票子分為兩類(lèi):我們體的比例,那么我們的盒子模型中的票子分為兩類(lèi):我們感興趣
27、的全標(biāo)為感興趣的全標(biāo)為1,其余全標(biāo)為,其余全標(biāo)為0。于是盒子成為:。于是盒子成為: 1 0個(gè)個(gè)1N個(gè)個(gè)1NN 0-1盒子模型盒子模型.31 。個(gè)個(gè)單單元元不不具具有有某某種種屬屬性性,總總體體第第個(gè)個(gè)單單元元具具有有某某種種屬屬性性;總總體體第第規(guī)規(guī)定定:iiYi0, 111NNNN 元數(shù)為元數(shù)為;不具有該種屬性的單;不具有該種屬性的單為為的單元數(shù)的單元數(shù)個(gè)單元,具有某種屬性個(gè)單元,具有某種屬性設(shè)總體中有設(shè)總體中有具有該種屬性的比例為:具有該種屬性的比例為:YYNNNPNii 111(1)具有某種屬性單位的個(gè)數(shù)具有某種屬性單位的個(gè)數(shù)N1的估計(jì)就是對(duì)總體總值估計(jì)的估計(jì)就是對(duì)總體總值估計(jì)(2)對(duì)總
28、體比例的估計(jì)就是對(duì)總體均值的估計(jì)對(duì)總體比例的估計(jì)就是對(duì)總體均值的估計(jì)元總數(shù)元總數(shù)總體具有某種屬性的單總體具有某種屬性的單AYYNii 1.32方差用比例表示方差用比例表示 總體方差總體方差 樣本方差樣本方差 NiiYYNS122)(11)(11212YNYNNii )(112NPPNN )1(1PPNN niiyyns122)(11)1(1ppnn .33估計(jì)量的定義和性質(zhì)估計(jì)量的定義和性質(zhì) ynynnpPnii 11總體比例的估計(jì)量總體比例的估計(jì)量yNnyNNpNnii 11數(shù)數(shù)的的估估計(jì)計(jì)量量總總體體含含有有某某種種特特性性的的個(gè)個(gè)估計(jì)量的性質(zhì)估計(jì)量的性質(zhì) PYyEpE )()()1(21
29、)()()2(SnfyVpV )1(11PPNNnf 21)()3(snfpv 方差的無(wú)偏估計(jì)方差的無(wú)偏估計(jì))1(11ppnnnf )1(11ppnf 總總和和的的估估計(jì)計(jì)呢呢?.341)()1(NNPNpE 總總和和的的估估計(jì)計(jì):221)()2(SnfNNpV )1(112PPNNnfN 221)()3(snfNNpv 方差的無(wú)偏估計(jì)方差的無(wú)偏估計(jì))1(112ppnfN .35的的置置信信區(qū)區(qū)間間的的置置信信度度為為百百分分?jǐn)?shù)數(shù)或或比比例例 1P (1)當(dāng)當(dāng)N,n,N-n都比較大時(shí),都比較大時(shí),a(樣本中(樣本中1的個(gè)數(shù))近似的個(gè)數(shù))近似服從服從正態(tài)分布正態(tài)分布, 常常用用)的的近近似似置置
30、信信區(qū)區(qū)間間為為:(的的置置信信度度為為故故此此時(shí)時(shí) 1P)11,11(pqnfuppqnfup (2)當(dāng)當(dāng)N很大,但很大,但n不是很大時(shí)不是很大時(shí),a近似服從近似服從二項(xiàng)分布二項(xiàng)分布。二。二項(xiàng)分布是個(gè)離散分布,而正態(tài)分布是個(gè)連續(xù)分布,因此項(xiàng)分布是個(gè)離散分布,而正態(tài)分布是個(gè)連續(xù)分布,因此可將其進(jìn)行連續(xù)性修正。可將其進(jìn)行連續(xù)性修正。P經(jīng)修正后的近似置信區(qū)間為:經(jīng)修正后的近似置信區(qū)間為: )2111(),2111(npqnfupnpqnfup ) )(, )(pvuppvup .36應(yīng)用舉例應(yīng)用舉例 例例 :某超市開(kāi)張一段時(shí)間之后,為改進(jìn)銷(xiāo)售服務(wù)環(huán)境,欲調(diào)查附:某超市開(kāi)張一段時(shí)間之后,為改進(jìn)銷(xiāo)售服
31、務(wù)環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購(gòu)物的滿意度。于是在總體中抽取了一近幾個(gè)小區(qū)居民到該超市購(gòu)物的滿意度。于是在總體中抽取了一個(gè)樣本容量為個(gè)樣本容量為200人的樣本。調(diào)查發(fā)現(xiàn)對(duì)該超市的購(gòu)物環(huán)境表示人的樣本。調(diào)查發(fā)現(xiàn)對(duì)該超市的購(gòu)物環(huán)境表示滿意和基本滿意的居民有滿意和基本滿意的居民有130位,請(qǐng)估計(jì)對(duì)超市購(gòu)物滿意的居民位,請(qǐng)估計(jì)對(duì)超市購(gòu)物滿意的居民的比例,并在置信度為的比例,并在置信度為95%下,給出估計(jì)的絕對(duì)誤差,相對(duì)誤差下,給出估計(jì)的絕對(duì)誤差,相對(duì)誤差和和變異系數(shù)變異系數(shù)coefficient of variation和置信區(qū)間。和置信區(qū)間。0338. 0)(;001143. 035. 06
32、5. 01200111)(%6565. 0200130; 11 ,130,200 pspqnfpvnapfan略略解解:由由題題意意抽抽樣樣比比可可忽忽052. 065. 00338. 0)(%2 .10102. 065. 00663. 0%;63. 6)(,%95 ppscvpdrpsud變變異異系系數(shù)數(shù)相相對(duì)對(duì)誤誤差差絕絕對(duì)對(duì)誤誤差差下下在在置置信信度度為為置信區(qū)間為(置信區(qū)間為(0.65-0.0663,0.65+0.0663)即()即(58.37,71.63%).37樣本量的確定樣本量的確定(2.5.1)確定樣本量的主要考慮因素確定樣本量的主要考慮因素 樣本量與精度的關(guān)系樣本量與精度的關(guān)
33、系估計(jì)量的精度要求高,意味著抽樣誤差小,樣本量大。估計(jì)量的精度要求高,意味著抽樣誤差小,樣本量大。樣本量與實(shí)際調(diào)查運(yùn)作的限制樣本量與實(shí)際調(diào)查運(yùn)作的限制調(diào)查的經(jīng)費(fèi)能支持多大的樣本?允許調(diào)查持續(xù)的時(shí)間調(diào)查的經(jīng)費(fèi)能支持多大的樣本?允許調(diào)查持續(xù)的時(shí)間有多長(zhǎng)?需要多少調(diào)查人員?有多長(zhǎng)?需要多少調(diào)查人員?由于大部分限制條件難以量化,確定樣本量的計(jì)算公由于大部分限制條件難以量化,確定樣本量的計(jì)算公式時(shí)往往只式時(shí)往往只在抽樣精度與調(diào)查費(fèi)用兩者之間權(quán)衡。在抽樣精度與調(diào)查費(fèi)用兩者之間權(quán)衡。確定樣本量的原則確定樣本量的原則最優(yōu)設(shè)計(jì)最優(yōu)設(shè)計(jì) 在總費(fèi)用一定的條件下使精度最高;在總費(fèi)用一定的條件下使精度最高; 在滿足一定
34、精度要求的條件下使費(fèi)用最小。在滿足一定精度要求的條件下使費(fèi)用最小。.38其他影響樣本量的因素其他影響樣本量的因素 問(wèn)題的重要性問(wèn)題的重要性 所研究問(wèn)題的目標(biāo)量個(gè)數(shù)所研究問(wèn)題的目標(biāo)量個(gè)數(shù) 參照同類(lèi)調(diào)查參照同類(lèi)調(diào)查 調(diào)查表的回收率調(diào)查表的回收率 有效樣本有效樣本.39樣本量與精度樣本量與精度精度的衡量:精度的衡量: 估計(jì)量的標(biāo)準(zhǔn)誤,估計(jì)量的標(biāo)準(zhǔn)誤, 一定概率保證下的絕對(duì)誤差一定概率保證下的絕對(duì)誤差d及相對(duì)誤差及相對(duì)誤差r 變異系數(shù)變異系數(shù)cv等等)()1( Sud / )(/)2(Sudr / )()()3(Scv 樣樣本本量量。確確定定我我們們的的可可以以通通過(guò)過(guò)絕絕對(duì)對(duì)誤誤差差限限來(lái)來(lái)是是樣樣
35、本本量量的的函函數(shù)數(shù),所所以以因因?yàn)闉?( S.40考慮精度決定樣本量考慮精度決定樣本量nVyVyMSEVy量量求滿足條件的最小樣本求滿足條件的最小樣本,即,即的方差上限為的方差上限為設(shè)要求估計(jì)量設(shè)要求估計(jì)量,)()( 21)(SnfyV 由于由于VSnNnN 2nNVSnN 2)(于于是是 n22SNVNS NVSVS/1/22 20SnV 總總體體方方差差若若令令樣樣本本均均值值方方差差Nnnn/100 樣本量樣本量 通常先計(jì)算出通常先計(jì)算出n的近似值的近似值n0,實(shí)際實(shí)際n比比n0小。當(dāng)小。當(dāng)n0 N,兩者之比小于兩者之比小于0.05時(shí),則時(shí),則可取可取nn0,否則進(jìn)行修正。,否則進(jìn)行修
36、正。.41(1)絕對(duì)誤差上限絕對(duì)誤差上限d決定樣本量決定樣本量Nnnn/100 均值的樣本量均值的樣本量Vud 由由于于2 udV于于是是2222220dSuudSVSn 此時(shí)此時(shí)r相對(duì)誤差上限相對(duì)誤差上限)2( 20YrSun cv變異系數(shù)上限變異系數(shù)上限)3(YVcv 由由于于 2YcvV 于于是是2220)(YcvSVSn 此此時(shí)時(shí).42舉例舉例 例:一批電子元件有例:一批電子元件有1600只,為估計(jì)元件的平均壽命,先根據(jù)抽只,為估計(jì)元件的平均壽命,先根據(jù)抽樣計(jì)算出樣本平均壽命為樣計(jì)算出樣本平均壽命為8400小時(shí),標(biāo)準(zhǔn)差為小時(shí),標(biāo)準(zhǔn)差為760小時(shí),如果要小時(shí),如果要求估計(jì)的絕對(duì)誤差限為求
37、估計(jì)的絕對(duì)誤差限為168小時(shí),可靠程度在小時(shí),可靠程度在95%以上,問(wèn)至少以上,問(wèn)至少應(yīng)抽取多少只元件?應(yīng)抽取多少只元件?2220dsun 解解:由由題題意意22168)76096. 1( 79 ,05. 00 Nn由于注意到由于注意到790 nn取取.43具體例子具體例子 從一個(gè)容量為從一個(gè)容量為100的總體中抽出樣本容量為的總體中抽出樣本容量為10的簡(jiǎn)單隨的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體平均水平,并給出置信度為機(jī)樣本,要估計(jì)總體平均水平,并給出置信度為95%的的置信區(qū)間。置信區(qū)間。序號(hào)序號(hào)i 1 2 3 4 5 6 7 8 9 10yi4 5 2 0 4 6 6 15 0 8 1 . 01001
38、0,10,100 fnN解解:由由題題意意:,510101 iiyyY1111.19,422,910210221022 syyysiiii由由于于3115. 1)()(72. 11)(2 YvYssnfYv,95%的置信區(qū)間為的置信區(qū)間為5-1.961.3115, 5+1.961.31152.43,7.57.44 上例中,如果現(xiàn)在要求以上例中,如果現(xiàn)在要求以95%的把握保證相對(duì)誤差不的把握保證相對(duì)誤差不超過(guò)超過(guò)10%,樣本量至少是多少?,樣本量至少是多少?1111.195,1002 syN,20 yrsun 解解:由由題題意意 22)51 . 0(1111.1996. 1294注意:不要忘了修
39、正樣本量!注意:不要忘了修正樣本量! Nnnn/100樣樣本本量量100/2941294 75 .45 練習(xí):練習(xí): 欲估計(jì)一個(gè)農(nóng)村的每月平均副業(yè)收入,已知該村欲估計(jì)一個(gè)農(nóng)村的每月平均副業(yè)收入,已知該村共有共有1000戶農(nóng)戶,月副業(yè)收入的標(biāo)準(zhǔn)差不超過(guò)戶農(nóng)戶,月副業(yè)收入的標(biāo)準(zhǔn)差不超過(guò)300元。元。(1)現(xiàn)要求置信度為)現(xiàn)要求置信度為95%,估計(jì)每戶月副業(yè)收入的誤差,估計(jì)每戶月副業(yè)收入的誤差不超過(guò)不超過(guò)50元,應(yīng)抽取多少戶作為樣本?元,應(yīng)抽取多少戶作為樣本?(2)若每戶調(diào)查費(fèi)若每戶調(diào)查費(fèi)用為用為15元,調(diào)查管理費(fèi)用為元,調(diào)查管理費(fèi)用為800元,該項(xiàng)調(diào)查預(yù)計(jì)費(fèi)用是元,該項(xiàng)調(diào)查預(yù)計(jì)費(fèi)用是多少?多少?(
40、3)要估計(jì)全村要估計(jì)全村1000戶一月的副業(yè)總收入,允許總戶一月的副業(yè)總收入,允許總量的誤差為量的誤差為40000,置信度為,置信度為95%,應(yīng)抽取多少樣本?,應(yīng)抽取多少樣本? ,139)1(2220 dsun 解:解:123/100 Nnnn元元264512315800)2(0 n,哪哪里里產(chǎn)產(chǎn)生生變變化化?,現(xiàn)現(xiàn)在在考考慮慮總總量量的的樣樣本本量量計(jì)計(jì)算算中中YVSny20 VSNnY220 的的樣樣本本量量計(jì)計(jì)算算中中2174000030096. 11000)3(222222220 dsuNn 179/100 Nnnn.46小結(jié):簡(jiǎn)單抽樣的公式一覽表小結(jié):簡(jiǎn)單抽樣的公式一覽表均值均值總量
41、總量Y1.估計(jì)公式估計(jì)公式2.均方誤差均方誤差3.均方誤差的均方誤差的估計(jì)量估計(jì)量4.的置的置信區(qū)間信區(qū)間Y.475. 樣樣本本容容量量確確定定給定絕對(duì)誤差限給定絕對(duì)誤差限d給定相對(duì)誤差限給定相對(duì)誤差限r(nóng) 給定方差上限給定方差上限V給定變異系數(shù)上限給定變異系數(shù)上限C .48習(xí)題習(xí)題 1.為調(diào)查某地區(qū)為調(diào)查某地區(qū)1960個(gè)村新棉收購(gòu)情況,以簡(jiǎn)單不重復(fù)抽樣方式隨個(gè)村新棉收購(gòu)情況,以簡(jiǎn)單不重復(fù)抽樣方式隨機(jī)抽取機(jī)抽取49個(gè)村進(jìn)行調(diào)查,求得個(gè)村進(jìn)行調(diào)查,求得 試以試以95%的可靠程度估計(jì)該地區(qū)平均每村收購(gòu)多少斤?的可靠程度估計(jì)該地區(qū)平均每村收購(gòu)多少斤? 2.從從5620個(gè)中學(xué)中抽出一個(gè)含有個(gè)中學(xué)中抽出一
42、個(gè)含有300個(gè)學(xué)校的簡(jiǎn)單隨機(jī)樣本,其中個(gè)學(xué)校的簡(jiǎn)單隨機(jī)樣本,其中有有187個(gè)學(xué)校贊成一項(xiàng)提案,試估計(jì)贊成該提案的比例及總的學(xué)校個(gè)學(xué)校贊成一項(xiàng)提案,試估計(jì)贊成該提案的比例及總的學(xué)校數(shù)。數(shù)。 3. 對(duì)某問(wèn)題進(jìn)行調(diào)查,在總體中抽取容量為對(duì)某問(wèn)題進(jìn)行調(diào)查,在總體中抽取容量為200的簡(jiǎn)單隨機(jī)樣本,的簡(jiǎn)單隨機(jī)樣本,若贊成,反對(duì)及不表態(tài)的人數(shù)分別為若贊成,反對(duì)及不表態(tài)的人數(shù)分別為132,51,17,試給出贊成、,試給出贊成、反對(duì)及不回答比例的反對(duì)及不回答比例的90%的近似置信區(qū)間。的近似置信區(qū)間。 公斤公斤及1807000sx.49實(shí)踐題實(shí)踐題 取一本厚的英漢字典,以一頁(yè)作為一個(gè)抽樣單取一本厚的英漢字典,以
43、一頁(yè)作為一個(gè)抽樣單元,從中抽取一個(gè)數(shù)量為元,從中抽取一個(gè)數(shù)量為頁(yè)的簡(jiǎn)單隨機(jī)樣頁(yè)的簡(jiǎn)單隨機(jī)樣本(用隨機(jī)數(shù)表),計(jì)算每一樣本單元的收詞本(用隨機(jī)數(shù)表),計(jì)算每一樣本單元的收詞數(shù),用此樣本數(shù),用此樣本 (1)估計(jì)全字典的單詞收詞總數(shù),并計(jì)算此)估計(jì)全字典的單詞收詞總數(shù),并計(jì)算此估計(jì)的方差的估計(jì)值估計(jì)的方差的估計(jì)值 (2)若要求相對(duì)誤差不超過(guò))若要求相對(duì)誤差不超過(guò)10% ,應(yīng)抽取多,應(yīng)抽取多大的樣本量?大的樣本量?.50回顧回顧的性質(zhì)的性質(zhì)均值均值簡(jiǎn)單隨機(jī)抽樣中,樣本簡(jiǎn)單隨機(jī)抽樣中,樣本y. 1YyEYy )()1(的的無(wú)無(wú)偏偏估估計(jì)計(jì),即即是是為為總總體體方方差差。22,1)()()2(SSnfyV
44、yMSE 為為樣樣本本方方差差。的的方方差差的的無(wú)無(wú)偏偏估估計(jì)計(jì):22,1)()3(ssnfyvy 的置信區(qū)間:的置信區(qū)間:下,下,在置信度在置信度Y 1)4( ),( ) ytv yytv y 相相關(guān)關(guān)計(jì)計(jì)算算關(guān)關(guān)于于總總體體總總和和的的估估計(jì)計(jì)的的相相關(guān)關(guān)計(jì)計(jì)算算關(guān)關(guān)于于總總體體均均值值的的估估計(jì)計(jì)的的掌掌握握)2()1(對(duì)對(duì)誤誤差差、變變異異系系數(shù)數(shù)置置信信限限、絕絕對(duì)對(duì)誤誤差差、相相的的含含義義f 1.51的性質(zhì)的性質(zhì)比例比例簡(jiǎn)單隨機(jī)抽樣中,樣本簡(jiǎn)單隨機(jī)抽樣中,樣本p. 2(1)具有某種屬性單位的個(gè)數(shù)具有某種屬性單位的個(gè)數(shù)N1的估計(jì)就是對(duì)總體總和的估計(jì)的估計(jì)就是對(duì)總體總和的估計(jì)(2)對(duì)
45、總體比例的估計(jì)就是對(duì)總體均值的估計(jì)對(duì)總體比例的估計(jì)就是對(duì)總體均值的估計(jì)PpE )()1(21)()2(SnfpV PQNNnf11 21)()3(snfpv 方差的無(wú)偏估計(jì)方差的無(wú)偏估計(jì)pqnf11 )11,11(pqnftppqnftp 的置信區(qū)間:的置信區(qū)間:下,下,在置信度在置信度P 1)4(.52樣本量的確定樣本量的確定. 3最最優(yōu)優(yōu)設(shè)設(shè)計(jì)計(jì))1(.)2(nVy,確確定定樣樣本本量量的的方方差差上上限限為為給給定定估估計(jì)計(jì)量量20SnV 總總體體方方差差令令樣樣本本均均值值方方差差上上限限Nnnn/100 樣本量樣本量 通常先計(jì)算出通常先計(jì)算出n的近似值的近似值n0,實(shí)際實(shí)際n比比n0
46、小。小。 當(dāng)當(dāng)n0 N,兩者之比小于兩者之比小于0.05時(shí),則時(shí),則可取可取nn0,否進(jìn)行修正。,否進(jìn)行修正。預(yù)預(yù)調(diào)調(diào)查查等等得得到到!未未知知,通通過(guò)過(guò)以以往往調(diào)調(diào)查查或或一一般般總總體體方方差差2S.53樣樣本本方方差差上上限限總總體體方方差差 VSn20d已已知知絕絕對(duì)對(duì)誤誤差差上上限限)1(r已已知知相相對(duì)對(duì)誤誤差差上上限限)2(cv已已知知變變異異系系數(shù)數(shù)上上限限)3(2220dStn 2220rYStn 220)(YcvSn 預(yù)預(yù)調(diào)調(diào)查查得得到到!未未知知,通通過(guò)過(guò)以以往往調(diào)調(diào)查查或或一一般般Y樣本量的。樣本量的。是對(duì)于樣本均值來(lái)確定是對(duì)于樣本均值來(lái)確定注意:這些計(jì)算公式都注意:這
47、些計(jì)算公式都.54 練習(xí):練習(xí): 欲估計(jì)一個(gè)農(nóng)村的每月平均副業(yè)收入,已知該村共有欲估計(jì)一個(gè)農(nóng)村的每月平均副業(yè)收入,已知該村共有1000戶農(nóng)戶,戶農(nóng)戶,月副業(yè)收入的標(biāo)準(zhǔn)差不超過(guò)月副業(yè)收入的標(biāo)準(zhǔn)差不超過(guò)300元元。(。(1)現(xiàn)要求置信度)現(xiàn)要求置信度為為95%,估計(jì),估計(jì)每戶月副業(yè)收入的誤差不超過(guò)每戶月副業(yè)收入的誤差不超過(guò)50元元,應(yīng)抽取多少戶,應(yīng)抽取多少戶作為樣本?作為樣本? (2)要估計(jì)全村要估計(jì)全村1000戶一月的副業(yè)總收入,允許戶一月的副業(yè)總收入,允許總量的總量的誤差為誤差為40000,置信度為置信度為95%,應(yīng)抽取多少樣本?,應(yīng)抽取多少樣本? ,1395030096. 1)1(22222
48、20 dstn解解:123/100 Nnnn,哪哪里里產(chǎn)產(chǎn)生生變變化化?,現(xiàn)現(xiàn)在在考考慮慮總總量量的的樣樣本本量量計(jì)計(jì)算算中中YVSny20 21710004000030096. 1)2(2222220 dstn179/100 Nnnn.55估計(jì)總體比例時(shí)樣本量的確定估計(jì)總體比例時(shí)樣本量的確定nVp本本量量,求求滿滿足足條條件件的的最最小小樣樣的的方方差差上上限限為為設(shè)設(shè)要要求求估估計(jì)計(jì)量量PQNNnfSnfpV111)(2 由由于于VPQNnnN )1(VNnPQnN)1()( 于于是是 nPQVNVNPQ NVPQVPQ NVPQVPQ11 VPQn 0若若令令Nnnn1100 樣本量樣本
49、量 通常先計(jì)算出通常先計(jì)算出n的近似值的近似值n0,實(shí)際實(shí)際n比比n0小。當(dāng)小。當(dāng)n0 N,兩者之比小于兩者之比小于0.05時(shí),則時(shí),則可取可取nn0,否則進(jìn)行修正。,否則進(jìn)行修正。.56Nnnn)1(100 比例的樣本量比例的樣本量VPQn 0)1(220(2)dPQtn PcvQPcvPQn 220)(4)PrQtrPPQtn22220)(3) (1)實(shí)際中實(shí)際中P值通常是通過(guò)歷史數(shù)據(jù)或試調(diào)查的數(shù)據(jù)得到。值通常是通過(guò)歷史數(shù)據(jù)或試調(diào)查的數(shù)據(jù)得到。 由于由于n0與與PQ成正比成正比(除了(除了P或或Q很接近很接近0或或1) PQ值值的變化都比較小。的變化都比較小。當(dāng)當(dāng)P=0.5時(shí)即時(shí)即PQ=0
50、.25時(shí)時(shí)PQ 取到最大值。取到最大值。當(dāng)當(dāng)P不太不太大或不太小時(shí)大或不太小時(shí),可以取可以取 p0q00.5作為作為n0的一個(gè)的一個(gè)保守估計(jì)保守估計(jì)。220(2)dPQtn .57當(dāng)估計(jì)當(dāng)估計(jì)P0.5,則選取較小的,則選取較小的P,如若估計(jì),如若估計(jì)P為為0.6,0.8,則選取,則選取P為為0.6 若對(duì)若對(duì)P一無(wú)所知,則取一無(wú)所知,則取P=0.5,此時(shí)用,此時(shí)用保守估計(jì)保守估計(jì)當(dāng)當(dāng)P值很小,即事件為稀有事件,需要用其他方法來(lái)值很小,即事件為稀有事件,需要用其他方法來(lái)估計(jì)。估計(jì)?;舻ぃɑ舻ぃ℉aldane)1945年提出一種稱為年提出一種稱為逆抽樣逆抽樣的方法的方法,專(zhuān)門(mén)用于小比例事件(稀有事件
51、)的抽樣。,專(zhuān)門(mén)用于小比例事件(稀有事件)的抽樣。 .58 例:在人口變動(dòng)情況調(diào)查中,出生率例:在人口變動(dòng)情況調(diào)查中,出生率P是一個(gè)重要指標(biāo)。是一個(gè)重要指標(biāo)。根據(jù)以前調(diào)查數(shù)據(jù),出生率根據(jù)以前調(diào)查數(shù)據(jù),出生率P的估計(jì)可取為的估計(jì)可取為18。問(wèn)在。問(wèn)在95%,的置信度下,實(shí)際調(diào)查估計(jì)的置信度下,實(shí)際調(diào)查估計(jì)P的絕對(duì)誤差限為的絕對(duì)誤差限為0.5 和相對(duì)誤差限和相對(duì)誤差限5%,各需要多大的樣本量?各需要多大的樣本量?,0005. 0)1(982. 0,018. 0 dQP解解:由由題題意意220dPQtn 221.960.018(10.018)271617()0.0.0005 人人(2) r=0.05
52、PrQtn220 018. 005. 0982. 096. 122 人)人)(38383 由于上述數(shù)字均比實(shí)際人口小很多,故不考慮修正。由于上述數(shù)字均比實(shí)際人口小很多,故不考慮修正。 注意不要忘了修正:首先要判斷是否需要修正哦!注意不要忘了修正:首先要判斷是否需要修正哦!.59 例:某銷(xiāo)售公司希望了解全部例:某銷(xiāo)售公司希望了解全部3000家客戶對(duì)公司的滿意度,決定用家客戶對(duì)公司的滿意度,決定用電話調(diào)查一個(gè)簡(jiǎn)單隨機(jī)樣本。這時(shí)銷(xiāo)售公司希望以電話調(diào)查一個(gè)簡(jiǎn)單隨機(jī)樣本。這時(shí)銷(xiāo)售公司希望以95的把握保的把握保證客戶滿意度比例證客戶滿意度比例P在樣本比例在樣本比例p10,p+10范圍內(nèi),但對(duì)總范圍內(nèi),但對(duì)
53、總體比例體比例P無(wú)法給出一個(gè)大致范圍。這時(shí)調(diào)查多少個(gè)客戶,才能保證無(wú)法給出一個(gè)大致范圍。這時(shí)調(diào)查多少個(gè)客戶,才能保證滿足要求?滿足要求?分析:總體的容量分析:總體的容量N=3000, 絕對(duì)誤差限絕對(duì)誤差限d=0.1 置信度為置信度為0.95 P的大致范圍沒(méi)有給出,最保守的估計(jì)是假設(shè)的大致范圍沒(méi)有給出,最保守的估計(jì)是假設(shè)P=0.5,于是,于是971 . 05 . 05 . 096. 122220 dPQtn由于由于 97/3000=0.0321,表明所考慮的抽樣設(shè)計(jì)的效率不如簡(jiǎn)單隨機(jī)抽樣;,表明所考慮的抽樣設(shè)計(jì)的效率不如簡(jiǎn)單隨機(jī)抽樣;若若deff1,表明該抽樣設(shè)計(jì)的效率比簡(jiǎn)單隨機(jī)抽樣高。,表明該
54、抽樣設(shè)計(jì)的效率比簡(jiǎn)單隨機(jī)抽樣高。 的設(shè)計(jì)效應(yīng)的設(shè)計(jì)效應(yīng)計(jì)算放回簡(jiǎn)單隨機(jī)抽樣計(jì)算放回簡(jiǎn)單隨機(jī)抽樣f 11.65 deff的功效的功效1:為了比較不同抽樣方案的效率或:為了比較不同抽樣方案的效率或效果。效果。deff的功效的功效2:確定樣本量:確定樣本量 對(duì)于復(fù)雜抽樣,樣本量比較難確定。對(duì)于復(fù)雜抽樣,樣本量比較難確定。 一定的精度要求下,簡(jiǎn)單隨機(jī)抽樣的樣本量一定的精度要求下,簡(jiǎn)單隨機(jī)抽樣的樣本量n容易確定容易確定若估計(jì)了該復(fù)雜抽樣的若估計(jì)了該復(fù)雜抽樣的deff,則在同樣精度要求下,則在同樣精度要求下,樣本量為樣本量為:deffnn .66練習(xí):練習(xí):在超市問(wèn)卷調(diào)查中進(jìn)行預(yù)調(diào)查,置信度為在超市問(wèn)卷調(diào)查中進(jìn)行預(yù)調(diào)查,置信度為95%,抽取,抽取50個(gè)樣本,得到的滿意度的相對(duì)誤差為個(gè)樣本,得到的滿意度的相對(duì)誤差為5%,現(xiàn)希望在,現(xiàn)希望在相同的置信度下,使相對(duì)誤差減少到原來(lái)的一半,則相同的置信度下,使相對(duì)誤差減少到原來(lái)的一半,則需要再抽取多大的樣本量?需要再抽取多大的樣本量?以知某個(gè)抽樣方案的設(shè)計(jì)效應(yīng)是以知某個(gè)抽樣方案的設(shè)計(jì)效應(yīng)是4,在精度相同情況下,在精度相同情況下,已知簡(jiǎn)單隨機(jī)抽樣所需要的樣本量為已知簡(jiǎn)單隨機(jī)抽樣所需要的樣本量為25,則該抽樣方
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中長(zhǎng)期的借款合同
- 展覽館管理合作協(xié)議
- 新材料研發(fā)與應(yīng)用在制造業(yè)中的推廣方案設(shè)計(jì)
- 農(nóng)村電商農(nóng)村電商國(guó)際合作與交流方案
- 環(huán)??萍荚谒Y源管理中的應(yīng)用合作協(xié)議
- 保證金質(zhì)押擔(dān)保協(xié)議書(shū)
- 房屋租賃合同三方協(xié)議
- 可再生能源設(shè)備采購(gòu)合同
- 項(xiàng)目季度工作總結(jié)與前景展望報(bào)告
- 大數(shù)據(jù)平臺(tái)開(kāi)發(fā)協(xié)議
- 《生物經(jīng)濟(jì)學(xué)》課程教學(xué)大綱
- 2018中國(guó)技能?賽全國(guó)選拔賽“3D數(shù)字游戲藝術(shù)”項(xiàng)?技能樣題
- 家庭清潔課件教學(xué)課件
- 2024-2025學(xué)年北師版八年級(jí)生物上學(xué)期 第18章 生物圈中的微生物(知識(shí)清單)
- 2024年重慶客運(yùn)駕駛員考試卷及答案
- API設(shè)計(jì)與文檔規(guī)范
- 物流無(wú)人機(jī)垂直起降場(chǎng)選址與建設(shè)規(guī)范
- 2024年綠化工職業(yè)技能理論知識(shí)考試題庫(kù)(含答案)
- JT-T-775-2016大跨度斜拉橋平行鋼絲拉索
- 醫(yī)學(xué)檢驗(yàn)技術(shù)專(zhuān)業(yè)《血液學(xué)檢驗(yàn)》課程標(biāo)準(zhǔn)
- 2024年高考改革新方案
評(píng)論
0/150
提交評(píng)論