MRAF調(diào)查分析預(yù)測(cè)培訓(xùn)_第1頁(yè)
MRAF調(diào)查分析預(yù)測(cè)培訓(xùn)_第2頁(yè)
MRAF調(diào)查分析預(yù)測(cè)培訓(xùn)_第3頁(yè)
MRAF調(diào)查分析預(yù)測(cè)培訓(xùn)_第4頁(yè)
MRAF調(diào)查分析預(yù)測(cè)培訓(xùn)_第5頁(yè)
已閱讀5頁(yè),還剩60頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

調(diào)查分析預(yù)測(cè)

MRAF

10

章抽樣估計(jì)與樣本量確定1調(diào)查分析預(yù)測(cè)

MRAF七、抽樣誤差?

調(diào)查結(jié)果的準(zhǔn)確性無(wú)疑是調(diào)查組織者十分

重視的問(wèn)題。其準(zhǔn)確性通常用抽樣誤差的

高低來(lái)反映,

在抽樣方式和總體既定的前

提下,抽樣誤差的大小主要取決于抽樣數(shù)

目的多少

對(duì)抽樣誤差的控制主要是通過(guò)

控制抽樣數(shù)目來(lái)實(shí)現(xiàn)的。因此,

抽樣誤差

與抽樣數(shù)目

的確定,是隨機(jī)抽樣市場(chǎng)調(diào)查

中兩個(gè)重要的問(wèn)題。2MRAF?(一)抽樣誤差的估算方法?1.抽樣誤差大小的影響因素?(1)總體各單位之間的差異程度??傮w變量存在變異是客觀的,差異程度愈大,其分布就愈分散,抽樣誤差就愈大;反之,愈小。這種差異程度,在統(tǒng)計(jì)上叫做標(biāo)志變異度,通常用方差或標(biāo)準(zhǔn)差來(lái)表示。?(2)樣本數(shù)目,即樣本容量有多少。當(dāng)樣本容量達(dá)到與總體容量一樣時(shí),抽樣調(diào)查就變成全面市場(chǎng)調(diào)查了,抽樣誤差隨即消失。?(3)抽樣方式。一般地說(shuō),等距隨機(jī)抽樣和分層隨機(jī)抽樣的抽樣誤差要小于簡(jiǎn)單隨機(jī)抽樣和分群隨機(jī)抽樣的誤差。不重復(fù)抽樣的誤差要小于重復(fù)抽樣的誤差。因此,要根據(jù)不同的抽樣方式分別估算抽樣誤差。調(diào)查分析預(yù)測(cè)3調(diào)查分析預(yù)測(cè)

MRAF4調(diào)查分析預(yù)測(cè)

MRAF5調(diào)查分析預(yù)測(cè)

MRAF6調(diào)查分析預(yù)測(cè)

MRAF樣本量的確定?

(二)必要抽樣數(shù)目的確定?

抽樣數(shù)目過(guò)多,使得抽樣調(diào)查所需成本費(fèi)

用提高,從而帶來(lái)不經(jīng)濟(jì);抽樣數(shù)目過(guò)少,

又會(huì)使調(diào)查結(jié)果存在較大誤差,達(dá)不到要

求的精度。?

所謂

必要抽樣數(shù)目,就是在事先給定的抽

樣誤差范圍內(nèi)所確定的、能夠達(dá)到對(duì)調(diào)查

結(jié)果精確度要求的樣本單位數(shù)。

7調(diào)查分析預(yù)測(cè)

MRAF樣本量的確定?

1.

影響合理的必要抽樣數(shù)目的因素?

1

)總體各單位之間的標(biāo)志差異程度。

總體單位

之間的差異越小,一定數(shù)目的總體單位對(duì)總體的

代表性就越高。當(dāng)總體單位的標(biāo)志值都相等時(shí),

一個(gè)總體單位的標(biāo)志值就足以代表總體的平均水

平。?

2

)允許誤差的大小。

一般來(lái)說(shuō),調(diào)查的準(zhǔn)確度

要求高、調(diào)查力強(qiáng)、調(diào)查經(jīng)費(fèi)充足,允許誤差就

可以定得小一些。?

3

)不同的抽樣方式和方法。

一般情況下,簡(jiǎn)單

隨機(jī)抽樣和分群隨機(jī)抽樣比等距隨機(jī)抽樣和分層

隨機(jī)抽樣所需的樣本單位數(shù)要多,重復(fù)抽樣比不

重復(fù)抽樣的樣本單位數(shù)要多。

8調(diào)查分析預(yù)測(cè)

MRAF9調(diào)查分析預(yù)測(cè)

MRAF10調(diào)查分析預(yù)測(cè)

MRAF11調(diào)查分析預(yù)測(cè)

MRAF12調(diào)查分析預(yù)測(cè)

MRAF13調(diào)查分析預(yù)測(cè)

MRAF14調(diào)查分析預(yù)測(cè)

MRAF15調(diào)查分析預(yù)測(cè)

MRAF總體參數(shù)的點(diǎn)估計(jì)?

點(diǎn)估計(jì)就是用樣本的估計(jì)量直接作為總體

參數(shù)的估計(jì)值

。例如,用樣本均值直接作

為總體均值的估計(jì),或者用兩個(gè)樣本均值

之差直接作為總體均值之差的估計(jì)。?

點(diǎn)估計(jì)是容易做到的,但是,點(diǎn)估計(jì)沒(méi)有

給出估計(jì)值接近總體參數(shù)程度的信息。?

當(dāng)樣本均值與總體均值不完全相同時(shí),樣

本均值與實(shí)際總體均值就存在著差距,形

成抽樣誤差。16調(diào)查分析預(yù)測(cè)

MRAF總體參數(shù)的區(qū)間估計(jì)?

區(qū)間估計(jì):在點(diǎn)估計(jì)的基礎(chǔ)上,對(duì)總體參數(shù)的區(qū)

間或范圍進(jìn)行估計(jì)。?

區(qū)間估計(jì)不僅要說(shuō)明區(qū)間大小,還要說(shuō)明點(diǎn)估計(jì)

值在區(qū)間內(nèi)的概率,即置信度。置信度是一個(gè)百

分比,用來(lái)說(shuō)明結(jié)果正確的長(zhǎng)期概率。被估計(jì)的

區(qū)間則被稱為置信區(qū)間。?

根據(jù)樣本統(tǒng)計(jì)量的抽樣分布理論,總體參數(shù)的區(qū)

間范圍是在一定的概率度下,由樣本統(tǒng)計(jì)量加減

抽樣誤差而得到。17調(diào)查分析預(yù)測(cè)

MRAF訓(xùn)練題?

P237—238

)?

4.

假設(shè)某快餐館想要為一個(gè)新的菜單項(xiàng)目估計(jì)平

均銷售量,這個(gè)餐館觀察了一個(gè)類似地點(diǎn)的銷量,

連續(xù)觀測(cè)到如下結(jié)果:樣本容量為

25

,樣本標(biāo)準(zhǔn)

差為

100

,每日平均銷售量為

500

。試估計(jì)這個(gè)餐

館啟用新菜單后每天在

95%

的時(shí)間內(nèi)銷售量的范

圍。18調(diào)查分析預(yù)測(cè)

MRAF訓(xùn)練題?

5.

一家電器連鎖商店正在進(jìn)行空調(diào)的季節(jié)性降價(jià)促銷。被抽取的

10

個(gè)

樣本商店銷售出的空調(diào)數(shù)量如下(單位:臺(tái)):

82

,

113

,

2

41

71

83

99

,

52

,

84

,

30

。那么,根據(jù)這些數(shù)據(jù)能否說(shuō)明這次促銷

期間每家商店平均銷售空調(diào)數(shù)量多于

50

臺(tái)(

95%

)?19調(diào)查分析預(yù)測(cè)

MRAF訓(xùn)練題?

6.

假設(shè)你正計(jì)劃對(duì)某市養(yǎng)狗的家庭進(jìn)行抽樣,

以確定他們每月購(gòu)買的狗食的平均數(shù)量。

已經(jīng)制定了下面的標(biāo)準(zhǔn):

95%

的置信度,

小于

5

個(gè)單位的誤差。以前的調(diào)研說(shuō)明了標(biāo)

準(zhǔn)差應(yīng)該是

6

個(gè)單位。那么,該項(xiàng)調(diào)查需要

多大的樣本容量?20調(diào)查分析預(yù)測(cè)

MRAF訓(xùn)練題?

7.

在一項(xiàng)涉及

400

人的調(diào)查中,

60%

的人都對(duì)一個(gè)

問(wèn)題持積極態(tài)度。試在

95%

的置信度下確定比例

的區(qū)間估計(jì)。?

8.

在一個(gè)全國(guó)性的調(diào)查中,調(diào)研人員期望總體中

30%

的人將會(huì)同意某個(gè)態(tài)度陳述,要求誤差小

2

個(gè)百分點(diǎn),并且具有

95%

的把握性,那么,需

要多大的樣本容量?假設(shè)調(diào)查總體為

12000

人,

事先預(yù)計(jì)調(diào)查的回答率約為

55%

,那么,樣本容

量又應(yīng)該為多少?21調(diào)查分析預(yù)測(cè)

MRAF22調(diào)查分析預(yù)測(cè)

MRAF

開(kāi)篇案例“

百腦匯

調(diào)研中的樣本計(jì)劃問(wèn)題?

百腦匯

在中國(guó)華北幾個(gè)省市經(jīng)營(yíng)連鎖電腦超市,它希

望獲得更多關(guān)于其現(xiàn)有客戶特點(diǎn)方面的信息。接受調(diào)研委

托的李文博士指派班上的王洪同學(xué)為樣本計(jì)劃小組的負(fù)責(zé)

人。?

通過(guò)與

百腦匯

的市場(chǎng)部經(jīng)理喬蘭的初次會(huì)談,王洪了

解到調(diào)研的一個(gè)主要目的是分別按人口和心理因素來(lái)估計(jì)

百腦匯

的客戶構(gòu)成和比例。此外,確認(rèn)總體估計(jì)值不

超過(guò)實(shí)際值的

±5

0

%,可靠度為

95

%。?

為了達(dá)到這些要求,王洪和他的小組正努力尋找計(jì)算所需

樣本容量的方法。

23調(diào)查分析預(yù)測(cè)

MRAF10

1

引言?

估計(jì)就是根據(jù)從樣本中收集的信息對(duì)

總體未知量進(jìn)行推斷的過(guò)程。?

抽樣估計(jì)涉及的重要問(wèn)題:

一個(gè)樣本單元的

設(shè)計(jì)權(quán)數(shù)

問(wèn)題

。

抽樣估計(jì)

,

包括總體總量、均值和比例以及抽

樣誤差的估計(jì)。

樣本量的確定

構(gòu)成抽樣設(shè)計(jì)程序的重要步驟和

內(nèi)容。同時(shí),樣本量的確定與樣本估計(jì)值的精

度密不可分。24調(diào)查分析預(yù)測(cè)

MRAF10

2

加權(quán)及權(quán)數(shù)調(diào)整?

設(shè)計(jì)權(quán)數(shù)

設(shè)計(jì)權(quán)數(shù)是指每個(gè)樣本單元所代表的調(diào)查總體的單元

數(shù),它是由抽樣設(shè)計(jì)所決定的,通常以

w

d

表示。確定

設(shè)計(jì)權(quán)數(shù)是估計(jì)的第一步。?

加權(quán)估計(jì)

設(shè)計(jì)權(quán)數(shù)其實(shí)就是樣本單元的入樣概率的倒數(shù)。假如

入樣概率是

1/10

,那么每個(gè)入選樣本代表總體中的

10

個(gè)單元,此時(shí)設(shè)計(jì)權(quán)數(shù)即為

10

。

不同樣本單元的設(shè)計(jì)權(quán)數(shù)可能不同,這取決于抽樣設(shè)

計(jì)。因此,加權(quán)估計(jì)應(yīng)區(qū)分等概率抽樣的加權(quán)和不等

概率抽樣的加權(quán)。25調(diào)查分析預(yù)測(cè)

MRAF等概率抽樣的加權(quán)?

當(dāng)每個(gè)單元都有相同的入樣概率時(shí),所有樣

本單元的設(shè)計(jì)權(quán)數(shù)都相同,這種抽樣就是

加權(quán)設(shè)計(jì)

。

SRS

抽樣和

SYS

抽樣都屬于自加權(quán)設(shè)計(jì),比例分

層抽樣也是自加權(quán)設(shè)計(jì)。

另外,

PPS

等也可以設(shè)計(jì)為一個(gè)自加權(quán)抽樣。?

對(duì)于自加權(quán)抽樣設(shè)計(jì),如果無(wú)需對(duì)權(quán)數(shù)調(diào)整,

則在計(jì)算比例、均值等估計(jì)量時(shí)可將其忽略,

對(duì)總值估計(jì)也僅需將樣本總值乘上某個(gè)倍數(shù)。

(

P215)26收入層次各層單位數(shù)樣本數(shù)量設(shè)計(jì)權(quán)數(shù)高收入層200033.3wd,1=N1/n1=2000/33.3=60.1中收入層12000133.3wd,2=N2/n2=12000/133.3=90.0低收入層600033.3wd,3=N3/n3=6000/33.3=180.2調(diào)查分析預(yù)測(cè)

MRAF不等概率抽樣的加權(quán)?

自加權(quán)設(shè)計(jì)并不總是可行的。如,在使用分層抽樣進(jìn)行

一個(gè)全國(guó)調(diào)查時(shí),可能需要采用紐曼分層。?

當(dāng)所采用的抽樣設(shè)計(jì)不是等概率時(shí),正確地使用設(shè)計(jì)權(quán)

數(shù)就顯得尤為重要。?

[例10.2]

有關(guān)各層總體數(shù)和樣本數(shù)資料見(jiàn)表10-1。對(duì)

于這項(xiàng)調(diào)查,被調(diào)查者的設(shè)計(jì)權(quán)數(shù)是多少呢?27調(diào)查分析預(yù)測(cè)

MRAF設(shè)計(jì)權(quán)數(shù)的調(diào)整?

上述等概率抽樣的加權(quán)和不等概率抽樣的

加權(quán)都是加權(quán)的基本形式。?

權(quán)數(shù)估計(jì)常會(huì)遇到更真實(shí)和復(fù)雜的情況:

考慮無(wú)回答的情況,然后對(duì)權(quán)數(shù)做出調(diào)整;

考慮來(lái)自其他渠道的、更具權(quán)威性的某些輔助

信息,將它們合并到權(quán)數(shù)中。28調(diào)查分析預(yù)測(cè)

MRAF對(duì)無(wú)回答的權(quán)數(shù)調(diào)整?

單元無(wú)回答

是指一個(gè)樣本單元幾乎所有的數(shù)據(jù)都缺失。

簡(jiǎn)單的處理辦法是忽略它。然而,如果發(fā)現(xiàn)忽略單元

無(wú)回答是不適當(dāng)?shù)?,則應(yīng)該對(duì)權(quán)數(shù)進(jìn)行調(diào)整。即,

設(shè)計(jì)權(quán)數(shù)×無(wú)回答調(diào)整因子=無(wú)回答的調(diào)整權(quán)數(shù)?

無(wú)回答調(diào)整因子

是原樣本單元的權(quán)數(shù)和與給出回答的

單元的權(quán)數(shù)和的比值。對(duì)于自加權(quán)設(shè)計(jì),該比值可用

原樣本的單元數(shù)與給出回答的單元數(shù)的比值來(lái)表示。?

無(wú)回答權(quán)數(shù)調(diào)整應(yīng)區(qū)分兩種不同情況:

等概率抽樣

不等概率抽樣29調(diào)查分析預(yù)測(cè)

MRAF對(duì)無(wú)回答的權(quán)數(shù)調(diào)整

(SRS)?

[例10.3]

從一個(gè)

N=100人的總體中

抽取一個(gè)n=25人

的簡(jiǎn)單隨機(jī)樣本。

記回答單元的數(shù)量

為nr,結(jié)果顯示只

有20個(gè)人提供了所

需的信息。那么,

此時(shí)無(wú)回答的調(diào)整

權(quán)數(shù)是多少?步驟

1

:計(jì)算設(shè)計(jì)權(quán)數(shù)。

入樣概率p為:P=n/N=25/100=1/4

故,每個(gè)樣本單元的設(shè)計(jì)權(quán)數(shù)為4。步驟

2

:計(jì)算無(wú)回答調(diào)整因子。

由于在n=25人中只有nr=20人提供了所需的信息,最終樣本量應(yīng)為20。假定回答單元不僅能代表回答單元且能代表無(wú)回答單元,計(jì)算無(wú)回答調(diào)整因子為:

n

/

nr

=

25/20

=

1.25步驟

3

:計(jì)算無(wú)回答的調(diào)整權(quán)數(shù)。

無(wú)回答的調(diào)整權(quán)數(shù)wnr等于設(shè)計(jì)權(quán)數(shù)與無(wú)回答調(diào)整因子的乘積:30層總體大小樣本量回答者數(shù)量城市N=10001n=2001n=150r,1農(nóng)村N=1002n=502n=40r,2調(diào)查分析預(yù)測(cè)

MRAF對(duì)無(wú)回答的權(quán)數(shù)調(diào)整

(STR)?

[例10.4]

對(duì)于一項(xiàng)公共交通表

10-2

公交系統(tǒng)調(diào)查的分層數(shù)據(jù)系統(tǒng)調(diào)查,總體由1100人組成,并按城鄉(xiāng)分為兩個(gè)層。分層及樣本數(shù)據(jù)如表10-2所示。那么,回答者的權(quán)數(shù)是多少?

步驟

1

:各層的設(shè)計(jì)權(quán)數(shù)為:

城市層

wd,1

N1/n1==5

農(nóng)村層

wd,2

N2/n2==2

步驟

2

:調(diào)整以彌補(bǔ)無(wú)回答。各層的無(wú)回答調(diào)整因子計(jì)算如下

城市層

n1

/

nr,1==200/150==1.33

農(nóng)村層

n2

/

nr,2==50/40==1.25

步驟

3

:無(wú)回答的調(diào)整權(quán)數(shù)等于設(shè)計(jì)權(quán)數(shù)與無(wú)回答調(diào)整因子的乘積

城市層

農(nóng)村層

:31調(diào)查分析預(yù)測(cè)

MRAF使用輔助信息調(diào)整權(quán)數(shù)?

為什么要使用輔助信息來(lái)調(diào)整權(quán)數(shù)呢?

首先,使調(diào)查的估計(jì)值與已知總體總值相匹配。例如,

使用最新的人口普查數(shù)據(jù)來(lái)調(diào)整估計(jì)值,以確保這些

估計(jì)值

(

如年齡、性別分布等

)

的一致性。

二是為了提高估計(jì)值的精度。將輔助信息與抽樣設(shè)計(jì)

相結(jié)合,將有助于提高估計(jì)的精度。

?

要想在調(diào)查設(shè)計(jì)階段使用輔助信息,抽樣框中的所有單元都

必須具備這個(gè)輔助信息。否則,就只能在數(shù)據(jù)收集上來(lái)后,

在估計(jì)階段利用輔助信息提高估計(jì)值的精度。32回答者數(shù)量男性女性總計(jì)吸煙人數(shù)25530總?cè)藬?shù)5545100(n)r調(diào)查的估計(jì)值男性女性總計(jì)吸煙人數(shù)19539234總?cè)藬?shù)429351780吸煙者的比例0.4550.1110.30事后分層估計(jì)值男性女性總計(jì)吸煙人數(shù)16447211總?cè)藬?shù)360420780吸煙者比例0.4550.1110.27133調(diào)查分析預(yù)測(cè)

MRAF使用輔助信息調(diào)整權(quán)數(shù)?

[例10.5]

為得到某公司職員是否

有吸煙習(xí)慣的信息,進(jìn)行了一項(xiàng)調(diào)

查。從N=780人的名錄中抽出了一

個(gè)n=100人的簡(jiǎn)單隨機(jī)樣本。?

在收集有關(guān)吸煙習(xí)慣信息時(shí),收集

了每個(gè)回答者的年齡和性別情況,

且100人都做出了回答,由此得到

樣本數(shù)據(jù)的分布如表10-3所示:

10-3

某公司吸煙習(xí)慣抽樣調(diào)查數(shù)據(jù)表

10-4

根據(jù)某公司吸煙習(xí)慣抽樣計(jì)算的估計(jì)值表

10-5

利用輔助信息對(duì)抽樣調(diào)查估計(jì)值的調(diào)整調(diào)查分析預(yù)測(cè)

MRAF10

3

抽樣分布與抽樣誤差?

抽樣調(diào)查的目的是要對(duì)總體做出推斷。?

了解統(tǒng)計(jì)推斷的理論基礎(chǔ),首先注意區(qū)分三

種不同性質(zhì)的分布:

總體分布

樣本分布

抽樣分布?

同時(shí),特別注意總體分布與抽樣分布的關(guān)系。34分布類型均值比例標(biāo)準(zhǔn)差總體分布樣本分布抽樣分布XPS調(diào)查分析預(yù)測(cè)

MRAF三種不同性質(zhì)的分布?

總體分布

:總體各單位的觀察值所形成的頻數(shù)分布,總

體分布通常是未知的。?

樣本分布

:一個(gè)樣本中各個(gè)觀察值所形成的頻數(shù)分布就

叫做。當(dāng)樣本容量

n

逐漸增大時(shí),樣本分布逐漸接近總

體的分布。?

抽樣分布

:樣本統(tǒng)計(jì)量的抽樣分布,是指在重復(fù)選取容

量為

n

的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相

對(duì)頻數(shù)分布。抽樣分布是一種理論分布。?

抽樣分布提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ)。表10-6

各種分布的均值、比例和標(biāo)準(zhǔn)差的符號(hào)表示35調(diào)查分析預(yù)測(cè)

MRAF樣本均值的抽樣分布?

樣本均值的抽樣分布,是

指在重復(fù)選取容量為

n

樣本時(shí),由樣本均值的所

有可能取值形成的相對(duì)頻

數(shù)分布。?

[例10.6]

設(shè)一個(gè)總體,含

有4個(gè)元素,即總體單位數(shù)

N

=4。4個(gè)個(gè)體分別為

x

1

=1,

x

2

=2,

x

3

=3,

x

4

=4。

則總體分布如圖

10-1

。?

現(xiàn)在從總體中有放回地抽

n

=2

的簡(jiǎn)單隨機(jī)樣本,

則樣本均值的抽樣分布如

10-2

。36調(diào)查分析預(yù)測(cè)

MRAF均值抽樣分布的規(guī)律比較樣本均值的分布與總體分布

,得出如下結(jié)論:

(1)

樣本均值的數(shù)學(xué)期望

等于總體均值,即

E(

)=

μ

。

(2)

在重復(fù)抽樣條件下,樣本均值的方差等于總體方差的

1/n

,或者說(shuō),

樣本均值的標(biāo)準(zhǔn)誤

。

(3)

如果總體服從正態(tài)分布,即

x

N

(

μ

,

σ

2

)

,那么樣本均值也服從正

態(tài)分布,即

N

(

μ

,

σ

2

/

n

)

。

(4)

如果總體不服從正態(tài)分布,那么當(dāng)樣本量足夠大時(shí),樣本均值

也服從正態(tài)分布。中心極限定理

,概括為:

設(shè)從均值為

、方差為

2

的一個(gè)任意總體中隨機(jī)抽取容量為

n

的樣本,

當(dāng)

n

足夠大

(

n

30)

時(shí),樣本均值的抽樣分布近似服從均值為

μ

、方差

σ

2

/

n

的正態(tài)分布。

37調(diào)查分析預(yù)測(cè)

MRAF樣本比例的抽樣分布?

樣本比例的抽樣分布

,是在重復(fù)抽取容量為

n

的樣本時(shí),

由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布。?

比較樣本比例的分布與總體分布,得出如下結(jié)論:

當(dāng)樣本容量足夠大時(shí),樣本比例的抽樣分布近似地服從正態(tài)分布,

樣本比例的數(shù)學(xué)期望等于總體比例,即

E(p)=π

;在重復(fù)抽樣條件

下,樣本比例的方差為總體方差的

1/n

,即樣本比例的方差

:樣本比例的標(biāo)準(zhǔn)誤:?

樣本比例的中心極限定理

設(shè)從比例為

π

、方差為

2

的一個(gè)任意總體中隨機(jī)抽取容量為

n

的樣

本,當(dāng)

n

足夠大

(

n

30)

時(shí),樣本比例的抽樣分布近似服從比例為

π

、方差為

(1-

)

/

n

的正態(tài)分布。

38調(diào)查分析預(yù)測(cè)

MRAF正態(tài)分布及標(biāo)準(zhǔn)值

Z?

正態(tài)分布有以下幾個(gè)重要特征:

正態(tài)曲線呈鐘形,曲線下的面積等于

1

,表明它

包括了所有的調(diào)查結(jié)果。

在正態(tài)曲線下任意兩個(gè)變量值之間的面積,等于

在這一范圍內(nèi)隨機(jī)抽取一個(gè)觀察對(duì)象的概率。例

如,任意抽取一個(gè)樣本單元,

IQ

分?jǐn)?shù)落在

55-145

之間的概率是

99.72%

,即圖

10-3

中正態(tài)曲線下

55-145

之間的面積。

所有的正態(tài)分布在平均數(shù)

±1

個(gè)標(biāo)準(zhǔn)差之間的面積

相同,都占曲線下方面積的

68

26

%。這是正態(tài)

分布的比例性,為統(tǒng)計(jì)推斷提供了基礎(chǔ)。

一個(gè)正態(tài)分布的特殊性由其平均數(shù)和標(biāo)準(zhǔn)差決定。39調(diào)查分析預(yù)測(cè)

MRAF標(biāo)準(zhǔn)正態(tài)分布?

標(biāo)準(zhǔn)正態(tài)分布是一種平均值等于

0

、標(biāo)準(zhǔn)差

等于

1

的正態(tài)分布

(

如圖

10-4)

。?

研究者可以將任何正態(tài)變量

X

轉(zhuǎn)換為標(biāo)準(zhǔn)正

態(tài)變量值

(

標(biāo)準(zhǔn)值

)

Z

。計(jì)算方法就是,用將

要進(jìn)行轉(zhuǎn)換的值中減去均值,然后再除以標(biāo)

準(zhǔn)差。即

式中,

x

——

變量值;

μ——

平均數(shù)的假設(shè)或預(yù)期值;

σ——

變量的標(biāo)準(zhǔn)差。?

求出標(biāo)準(zhǔn)值

Z

之后,就可以查閱正態(tài)分布表

(

附錄

B-2)

,得到

Z

值的標(biāo)準(zhǔn)正態(tài)分布曲線下

的面積

(

概率

)

。40調(diào)查分析預(yù)測(cè)

MRAF10

4

參數(shù)估計(jì)?

參數(shù)估計(jì)就是根據(jù)從樣本中收集的信息對(duì)總體參數(shù)

進(jìn)行推斷的過(guò)程。?

樣本估計(jì)量

(

如樣本均值、比例等

)

都是隨機(jī)變量,

在具有特定概率

(

抽樣

)

分布的樣本之間有所變化。

參數(shù)估計(jì)就是根據(jù)推斷理論所闡明的抽樣分布與總

體分布之間的關(guān)系,由樣本統(tǒng)計(jì)量的具體值估計(jì)總

體參數(shù)

(

如總體均值、比例和方差等

)

。?

參數(shù)估計(jì)有兩種估計(jì)方法:

點(diǎn)估計(jì)

區(qū)間估計(jì)41調(diào)查分析預(yù)測(cè)

MRAF總體參數(shù)的點(diǎn)估計(jì)?

點(diǎn)估計(jì)就是用樣本的估計(jì)量直接作為總體參數(shù)的

估計(jì)值。例如,用樣本均值直接作為總體均值的

估計(jì),或者用兩個(gè)樣本均值之差直接作為總體均

值之差的估計(jì)。?

點(diǎn)估計(jì)是容易做到的,但是,點(diǎn)估計(jì)沒(méi)有給出估

計(jì)值接近總體參數(shù)程度的信息。?

當(dāng)樣本均值與總體均值不完全相同時(shí),樣本均值

與實(shí)際總體均值就存在著差距,形成抽樣誤差。42調(diào)查分析預(yù)測(cè)

MRAF總體參數(shù)的區(qū)間估計(jì)?

區(qū)間估計(jì):在點(diǎn)估計(jì)的基礎(chǔ)上,對(duì)總體參數(shù)的

區(qū)間或范圍進(jìn)行估計(jì)。?

區(qū)間估計(jì)不僅要說(shuō)明區(qū)間大小,還要說(shuō)明點(diǎn)估

計(jì)值在區(qū)間內(nèi)的概率,即置信度。置信度是一

個(gè)百分比,用來(lái)說(shuō)明結(jié)果正確的長(zhǎng)期概率。被

估計(jì)的區(qū)間則被稱為置信區(qū)間。?

根據(jù)樣本統(tǒng)計(jì)量的抽樣分布理論,總體參數(shù)的

區(qū)間范圍是在一定的概率度下,由樣本統(tǒng)計(jì)量

加減抽樣誤差而得到。43調(diào)查分析預(yù)測(cè)

MRAF總體均值的區(qū)間估計(jì)?

SRS

抽樣情況下,樣本統(tǒng)計(jì)量

的抽樣分布均服從正態(tài)分布。可

使用正態(tài)分布統(tǒng)計(jì)量

Z

來(lái)描述總

體均值的區(qū)間估計(jì),將總體均值

區(qū)間估計(jì)表達(dá)為:μ=±在上式中,代表一定置信度下的

Z

值。

注意,

α

應(yīng)除以

2

,以便確定均值的每一邊所包含曲線下區(qū)域的百分比。

代表樣本均值的標(biāo)準(zhǔn)誤,

當(dāng)

σ

未知,用

S

來(lái)估計(jì)

σ

,樣本均值的標(biāo)準(zhǔn)誤:

當(dāng)

σ

已知,樣本均值的標(biāo)準(zhǔn)誤的估計(jì)公式

:44調(diào)查分析預(yù)測(cè)

MRAF總體均值的區(qū)間估計(jì)?

t-

分布

若調(diào)查從總體中隨機(jī)抽取一個(gè)很小樣本

(

n

<

30)

,則樣

本均值的抽樣分布服從自由度為

(n-1)

t-

分布

(

較正態(tài)

分布平坦和分散

)

。隨著自由度增大,

t

分布也逐漸趨

于正態(tài)分布。在上述假設(shè)條件下,使用

t

分布統(tǒng)計(jì)量

(

附錄

B-3)

來(lái)估計(jì)總體均值的置信區(qū)間。

t

分布條件下總體均值置信區(qū)間的估計(jì)方法與正態(tài)分布條件下非常類似,只是查

t

分布表需要考慮自由度為

(n-1)

。統(tǒng)計(jì)量總

體置信區(qū)

μ=~

t(n-1)

±45調(diào)查分析預(yù)測(cè)

MRAF總體均值的區(qū)間估計(jì)

例題?

[例10.7]

某銀行收集到由

36信用卡用戶組成的隨機(jī)樣

本,得到各用戶年齡(周歲)

數(shù)據(jù)如下

23,35,39,27,36,44;36

,42,46,43,31,33,42,

53,45,54,47,24,34,28

,39,36,44,40,39,49,

38,34,48,50,34,39,45

,48,45,32。?

試建立信用卡用戶年齡90%

的置信區(qū)間。已知

n

=36

,

1-

=

90%

Z

/2

=1.64

。根據(jù)樣本數(shù)據(jù)計(jì)算得:

=39.5

,

s=7.77

則,信用卡用戶總體平均年齡

在90%

置信水平下的置信區(qū)間為:

μ=

±

=39.5±1.64×

=39.5±2.12

=

37.38

,

41.62

)結(jié)論是:在

90%

的置信度下,信用卡用戶的平均年齡為

37.38

41.62

歲。

46調(diào)查分析預(yù)測(cè)

MRAF總體比例的區(qū)間估計(jì)?

總體比例的區(qū)間估計(jì)假定總體服從二項(xiàng)分布。二項(xiàng)分布是

指重復(fù)進(jìn)行

n

次試驗(yàn),出現(xiàn)

成功

的次數(shù)的概率分布。

總體比例的抽樣分布仍然可以由正態(tài)分布來(lái)近似,即適用

中心極限定理。使用正態(tài)分布統(tǒng)計(jì)量

Z

來(lái)描述總體比例的

區(qū)間估計(jì),將總體比例區(qū)間估計(jì)表達(dá)如下:

π=

p

±在上式中,代表一定置信度下的

Z

值。

注意,

α

應(yīng)除以

2

,以便確定比例的每一邊所包含曲線下區(qū)域的百分比。

代表樣本比例的標(biāo)準(zhǔn)誤,

當(dāng)

π

未知,樣本比例的標(biāo)準(zhǔn)誤

的估計(jì)式

當(dāng)

π

已知,樣本比例的標(biāo)準(zhǔn)誤的估計(jì)式:47調(diào)查分析預(yù)測(cè)

MRAF總體比例的區(qū)間估計(jì)例題?

[例10.8]

某商業(yè)公

司想要估計(jì)經(jīng)常光顧

其大型購(gòu)物中心中女

性所占的比例,隨機(jī)

地抽取了400名經(jīng)常

性顧客,發(fā)現(xiàn)其中

260名為女性。?

試以95%的置信水平

估計(jì)經(jīng)常光顧該大型

購(gòu)物中心中女性比例

的置信區(qū)間。解:已知

n

=400

,

p

65%=0.65

,

1

-

=

95%

,

Z

/2

=1.96

則,總體比例

π

95%

置信水平下的置信區(qū)間為:

π=

p

±

=0.65±1.96×

=0.65±0.047

=

0.603

,

0.697

)結(jié)論:在

95%

的置信度下,經(jīng)常光顧該大型購(gòu)物中心中女性比例的置信區(qū)間為

60.3%

69.7%

。48調(diào)查分析預(yù)測(cè)

MRAF總體方差的區(qū)間估計(jì)?

在重復(fù)選取容量為

n

的樣本時(shí),由樣本方

差的所有可能取值形成的相對(duì)頻數(shù)分布,

構(gòu)成樣本方差的抽樣分布。?

對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則

(n

-1)

倍的樣本方差與總體方差的比值的抽樣

分布服從自由度為

(

n

-1)

2

分布,即

2

(

n

-1)

2

分布的特性

總體方差的區(qū)間估計(jì)提供了理論依據(jù)。當(dāng)總體服從正態(tài)

分布時(shí),總體方差

2

的點(diǎn)估計(jì)量為

s

2

。借助

2

分布表

(

附錄

B-4)

以查得

χ

21-α/2

χ

2α/2

分布曲線下的面積

(

概率

)

。然后,可以給出總體

方差在

1-

置信水平下的區(qū)間估計(jì)

:49調(diào)查分析預(yù)測(cè)

MRAF10

5

樣本量的確定?

樣本量的確定問(wèn)題,首先涉及對(duì)總體參數(shù)估計(jì)值

的精度要求,同時(shí)也涉及與各種運(yùn)作限制

(

如可

獲得的預(yù)算、資源和時(shí)間

)

之間的平衡問(wèn)題。?

理論上,總體參數(shù)估計(jì)的精度取決于抽樣誤差和

非抽樣誤差兩類誤差的大小。但是,確定樣本量

是為控制抽樣誤差,而不是對(duì)非抽樣誤差進(jìn)行控

制,進(jìn)而提高對(duì)總體估計(jì)的精度。50調(diào)查分析預(yù)測(cè)

MRAF估計(jì)精度與樣本量的關(guān)系?

總體參數(shù)的置信區(qū)間可以描述為:

總體參數(shù)

=

總體參數(shù)的估計(jì)值

±

抽樣誤差的范圍?

顯然,估計(jì)精度取決于抽樣誤差大小。假設(shè)用

E

來(lái)定義抽

樣誤差范圍,則當(dāng)簡(jiǎn)單隨機(jī)選擇一個(gè)容量足夠大

(

n

30)

的樣本時(shí),樣本均值的抽樣誤差范圍可以表示為:

E

抽樣誤差的范圍是估計(jì)量標(biāo)準(zhǔn)誤的倍數(shù),乘數(shù)因子取決于在調(diào)查

估計(jì)中所希望達(dá)到的置信水平。?

在放回

(

重復(fù)

)

SRS

抽樣條件下,假設(shè)回答率為

100%

則樣本均值的標(biāo)準(zhǔn)誤公式可用來(lái)解釋估計(jì)精度與樣本量之

間的基本關(guān)系:51調(diào)查分析預(yù)測(cè)

MRAF估計(jì)精度與樣本量?

無(wú)論是重復(fù)抽樣還是不重復(fù)抽樣,抽樣誤差的大

(

即估計(jì)精度

)

與樣本量緊密相關(guān):

隨著樣本量的增加,對(duì)應(yīng)估計(jì)量的抽樣標(biāo)準(zhǔn)差就會(huì)不

斷減小,調(diào)查估計(jì)的精度則會(huì)不斷提高。

同理,當(dāng)要求不斷提高調(diào)查估計(jì)值的精度要求時(shí),所

需樣本量也會(huì)不斷增加。?

樣本量要根據(jù)估計(jì)所要求的精度來(lái)計(jì)算和確定。

下面的討論分為兩部分:

對(duì)初始樣本量的確定及考慮

復(fù)雜情況的考慮及對(duì)初始樣本量的調(diào)整52調(diào)查分析預(yù)測(cè)

MRAF初始樣本量的確定?

1

.給定總體均值估計(jì)精度下確定初始樣本量

初始樣本量基于以下假定:抽樣采用放回的

SRS

抽樣,

并且調(diào)查回答率為

100%

。

樣本均值的標(biāo)準(zhǔn)誤表示為

抽樣誤差范圍表示為

E

從上式中解得樣本量

n

從公式看出,樣本容量

n

與置信系數(shù)和總體方差成正比,與邊際誤差成反比。

為確定樣本量

n

,需要知道允許的抽樣誤差范圍

E

、與給定置信水平相對(duì)應(yīng)的

標(biāo)準(zhǔn)值

Z

、總體方差估計(jì)

σ

2

。

53調(diào)查分析預(yù)測(cè)

MRAF初始樣本量的確定?

2

.給定比例估計(jì)精度下確定初始樣本量

初始樣本量基于以下假定:抽樣采用放回的

SRS

抽樣,

并且調(diào)查回答率為

100%

。

樣本比例的標(biāo)準(zhǔn)誤表示為

抽樣誤差范圍表示為

E

從上式中解得樣本量

n

從公式看出,樣本容量

n

與置信系數(shù)和總體方差成正比,與邊際誤差成反比。

為確定樣本量

n

,需要知道允許的抽樣誤差范圍

E

、與給定置信水平相對(duì)應(yīng)的

標(biāo)準(zhǔn)值

Z

、總體比例

π

54調(diào)查分析預(yù)測(cè)

MRAF對(duì)樣本量基本公式的應(yīng)用考慮?

在確定初始樣本量的公式中,抽樣誤差范圍假定

已知。但在實(shí)踐中,如何確定調(diào)查估計(jì)的精度水

(

抽樣誤差范圍

)

,卻是一個(gè)值得思考的問(wèn)題。

1

.多大的抽樣誤差對(duì)調(diào)研目標(biāo)而言可以接受

?

常用

95

%的置信度、

±6

%的抽樣誤差范圍對(duì)客戶的調(diào)查目標(biāo)

是否適宜,估計(jì)值是否需要更高或者更低的精度?

2

.是否需要對(duì)調(diào)查總體中的子總體

(

)

進(jìn)行估計(jì)

?

例如,對(duì)一項(xiàng)全國(guó)性抽樣調(diào)查而言,主辦者可能要求對(duì)全國(guó)估

計(jì)的抽樣誤差范圍為

±3

%;但是對(duì)于省級(jí)估計(jì)值,抽樣誤差范

圍可能確定為

±5

%;而對(duì)于地市的估計(jì)值,

±10

%的抽樣誤差

范圍就足夠了。

55樣本量抽樣誤差范圍5010050010000.13860.09800.04380.0310調(diào)查分析預(yù)測(cè)

MRAF對(duì)樣本量基本公式的應(yīng)用考慮?

3

.相對(duì)于調(diào)查估計(jì)值的抽樣誤差應(yīng)該多大為宜

例如,政府要決定是否執(zhí)行為某種使用人數(shù)較少的語(yǔ)種提供服務(wù)

的新政策,假定做出決定的前提,是至少有

5%

的人群對(duì)這一語(yǔ)

種存在需求。在這里,

p

0

05

就是要確定的最小估計(jì)值。相對(duì)

于該估計(jì)值,必須規(guī)定更小的抽樣誤差范圍,如

≤±0

01(

即,置

信區(qū)間為

0

05±0

01)

。?4

.精度要求的實(shí)際含義是什么

隨著樣本量的增加,估計(jì)值的精度也將提高。然而,精度的得益

并不與樣本量的增加成正比。如表

10-10

中描述的例子。

表10-10

簡(jiǎn)單隨機(jī)抽樣估計(jì)比例P的樣本量與抽樣誤差范圍(當(dāng)P=0.5)56調(diào)查分析預(yù)測(cè)

MRAF關(guān)于確定樣本量的

現(xiàn)實(shí)復(fù)雜考慮?

在確定樣本量基本公式之外,又有一些

現(xiàn)實(shí)因素影響調(diào)查估計(jì)量的精度,進(jìn)而

影響樣本量。這些因素主要包括

總體指標(biāo)的變異程度

總體大小,

樣本設(shè)計(jì)和所用的估計(jì)量

以及回答率57調(diào)查分析預(yù)測(cè)

MRAF關(guān)于確定樣本量的現(xiàn)實(shí)復(fù)雜考慮?

1

.總體的變異程度

隨著調(diào)查總體中所研究指標(biāo)的實(shí)際變異程度的增加,

樣本量也必須隨之增大,以滿足估計(jì)的精度要求。

為確保達(dá)到調(diào)查要求的精度,在計(jì)算樣本量時(shí),建議

對(duì)某一指標(biāo)的總體變異程度采取保守估計(jì),即假定研

究指標(biāo)具有最大的變異程度。例如,對(duì)于二元變量,

應(yīng)該假定總體中該變量的變異程度為

50

-50

%對(duì)半平

分,即假定

p=0

5

。

為確保樣本量對(duì)所有的研究指標(biāo)都足夠大,應(yīng)該根據(jù)

最大變異程度或被認(rèn)為最重要的指標(biāo)來(lái)確定樣本量。58調(diào)查分析預(yù)測(cè)

MRAF關(guān)于確定樣本量的現(xiàn)實(shí)復(fù)雜考慮?

2

.總體大小

在基本公式中,樣本量的

確定似乎與總體大小沒(méi)有

關(guān)系。因?yàn)楫?dāng)時(shí)假定在大

總體中進(jìn)行有放回的重復(fù)

抽樣,抽樣總體的影響被

忽略掉了。然而,在調(diào)研

實(shí)踐中,總體單元數(shù)量可

能是有限的,而且可能采

取非重復(fù)抽樣,這時(shí)總體

大小對(duì)樣本容量的影響就

應(yīng)該被考慮進(jìn)來(lái)了。在樣本不放回的非重復(fù)抽樣條件下樣本均值的標(biāo)準(zhǔn)誤表示為

:抽樣誤差范圍表示為

E

=從上式中解得樣本量

:在樣本不放回的非重復(fù)抽樣條件下樣本比例的標(biāo)準(zhǔn)誤

:抽樣誤差范圍表示為

E

=從上式中解得樣本量

:59調(diào)查分析預(yù)測(cè)

MRAF關(guān)于確定樣本量的現(xiàn)實(shí)復(fù)雜考慮?

3

.樣本設(shè)計(jì)和估計(jì)量

當(dāng)使用復(fù)雜的樣本設(shè)計(jì)時(shí),估計(jì)值可能比

SRS

精確。當(dāng)估計(jì)值更

精確時(shí),稱所采用的樣本設(shè)計(jì)更為有效。因此,實(shí)際抽樣時(shí)必須

考慮實(shí)際所用抽樣設(shè)計(jì)的效率,并對(duì)初始樣本量做出調(diào)整。即,

SRS

抽樣的樣本量計(jì)算公式基礎(chǔ)上乘以一個(gè)

設(shè)計(jì)效應(yīng)因子

設(shè)計(jì)效應(yīng)

(Deff)

是指在給定抽樣設(shè)計(jì)下估計(jì)值的抽樣方差,與相

等樣本量下的簡(jiǎn)單隨機(jī)抽樣的估計(jì)值的抽樣方差之比。設(shè)某一抽樣設(shè)計(jì)樣本估計(jì)值的方差為,同等樣本量的

SRS

設(shè)計(jì)的樣本估計(jì)值的方差為,則抽樣設(shè)計(jì)效應(yīng):

Deff

=顯然,對(duì)于簡(jiǎn)單隨機(jī)抽樣設(shè)計(jì),

Deff=1

;若

Deff

1

,表明實(shí)際使用的抽樣設(shè)計(jì)的效率高于簡(jiǎn)單隨機(jī)抽樣;若

Deff

1

,表明實(shí)際使用的抽樣設(shè)計(jì)的效率低于簡(jiǎn)單隨機(jī)抽樣。特定抽樣設(shè)計(jì)所需的樣本量(

n

1

)調(diào)整為:

n

1

=n

0

·Deff

60調(diào)查分析預(yù)測(cè)

MRAF關(guān)于確定樣本量的現(xiàn)實(shí)復(fù)雜考慮?

4

.調(diào)查的回答率

調(diào)查回答率

是指調(diào)查回收的有效問(wèn)卷數(shù)占計(jì)劃訪問(wèn)的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論