第九章 二階與多階抽樣(抽樣調(diào)查理論與方法-北京商學(xué)院 李平)_第1頁
第九章 二階與多階抽樣(抽樣調(diào)查理論與方法-北京商學(xué)院 李平)_第2頁
第九章 二階與多階抽樣(抽樣調(diào)查理論與方法-北京商學(xué)院 李平)_第3頁
第九章 二階與多階抽樣(抽樣調(diào)查理論與方法-北京商學(xué)院 李平)_第4頁
第九章 二階與多階抽樣(抽樣調(diào)查理論與方法-北京商學(xué)院 李平)_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第九章第九章 二階與多階抽樣二階與多階抽樣 二階抽樣與分層抽樣、整群抽樣二階抽樣與分層抽樣、整群抽樣的一個的一個共同特點共同特點是:是:將將總體分為若干個群總體分為若干個群;所;所不同的不同的是是:分層抽樣是每個群內(nèi)都進(jìn)分層抽樣是每個群內(nèi)都進(jìn)行抽樣,整群抽樣是抽若干個群再在群內(nèi)普查,而二階抽樣行抽樣,整群抽樣是抽若干個群再在群內(nèi)普查,而二階抽樣則是抽若干個群再在群內(nèi)抽樣則是抽若干個群再在群內(nèi)抽樣。因此,可將分層抽樣與整群。因此,可將分層抽樣與整群抽樣看作是二階抽樣的特殊情況。抽樣看作是二階抽樣的特殊情況。 在整群抽樣中,如果抽中的群內(nèi)所含的次級單元個數(shù)相在整群抽樣中,如果抽中的群內(nèi)所含的次級單

2、元個數(shù)相當(dāng)?shù)囟啵藭r對該群作普查會感到當(dāng)?shù)囟?,此時對該群作普查會感到“心有余而力不足心有余而力不足”。特。特別當(dāng)群內(nèi)的次級單元差異不大,即別當(dāng)群內(nèi)的次級單元差異不大,即 比較大,這種情形下比較大,這種情形下對群內(nèi)所有的次級單元一一訪問似乎完全沒有必要,一個省對群內(nèi)所有的次級單元一一訪問似乎完全沒有必要,一個省時省錢又省力的念頭會在調(diào)查者的頭腦中油然而生,何不在時省錢又省力的念頭會在調(diào)查者的頭腦中油然而生,何不在抽到的群內(nèi)再作一定方式的抽樣呢?這種在選中的初級單元抽到的群內(nèi)再作一定方式的抽樣呢?這種在選中的初級單元中再進(jìn)行抽樣的方法稱為中再進(jìn)行抽樣的方法稱為二階抽樣二階抽樣。倘若在抽取的次級單元

3、。倘若在抽取的次級單元中又包含許多更次一級的單元,在這些單元中繼續(xù)抽樣就自中又包含許多更次一級的單元,在這些單元中繼續(xù)抽樣就自然地稱為然地稱為三階抽樣三階抽樣。c 抽樣形式抽樣形式第一階段第一階段第二階段第二階段分層抽樣分層抽樣整群抽樣整群抽樣二階抽樣二階抽樣抽全部抽全部抽部分抽部分抽全部抽全部抽部分抽部分抽部分抽部分抽部分抽部分二階與多階抽樣的二階與多階抽樣的優(yōu)點優(yōu)點:1、它具有實施上的方便,比如在編制抽樣框時那些沒有被、它具有實施上的方便,比如在編制抽樣框時那些沒有被抽到的群或次一級群內(nèi)的單元就沒有必要也去編制抽樣框。抽到的群或次一級群內(nèi)的單元就沒有必要也去編制抽樣框。僅需對那些已抽中的單

4、元才去準(zhǔn)備下一級單元的抽樣框,而僅需對那些已抽中的單元才去準(zhǔn)備下一級單元的抽樣框,而且許多抽樣調(diào)查常常采用行政系統(tǒng)及隸屬單元,這給多階抽且許多抽樣調(diào)查常常采用行政系統(tǒng)及隸屬單元,這給多階抽樣本身創(chuàng)造了有利的條件。樣本身創(chuàng)造了有利的條件。 另外,多階抽樣方法可以用到關(guān)于散料的抽樣。所謂散另外,多階抽樣方法可以用到關(guān)于散料的抽樣。所謂散料是指連續(xù)松散的不易區(qū)分為個體或抽樣單元的材料。例如料是指連續(xù)松散的不易區(qū)分為個體或抽樣單元的材料。例如,煤、糧食、水泥、化肥等原料的質(zhì)量檢測,此時抽樣單元,煤、糧食、水泥、化肥等原料的質(zhì)量檢測,此時抽樣單元常常需要人為劃分,一般取自然單位,諸如一公斤、一杯子常常需

5、要人為劃分,一般取自然單位,諸如一公斤、一杯子等;而初級單元則為包裝袋、一卡車、一個車皮等。這種數(shù)等;而初級單元則為包裝袋、一卡車、一個車皮等。這種數(shù)量眾多的散料的質(zhì)量檢測采用二階或多階抽樣也許是最有效量眾多的散料的質(zhì)量檢測采用二階或多階抽樣也許是最有效的手段。為方便,本章主要討論二階抽樣。的手段。為方便,本章主要討論二階抽樣。2、能夠滿足各級政府部門對抽樣調(diào)查資料的需求。因為各、能夠滿足各級政府部門對抽樣調(diào)查資料的需求。因為各級政府領(lǐng)導(dǎo)都關(guān)心全國和本地區(qū)、本部門的社會經(jīng)濟(jì)發(fā)展?fàn)罴壵I(lǐng)導(dǎo)都關(guān)心全國和本地區(qū)、本部門的社會經(jīng)濟(jì)發(fā)展?fàn)顩r,希望抽樣調(diào)查能同時滿足全國性和地方性的需要。因而況,希望抽樣

6、調(diào)查能同時滿足全國性和地方性的需要。因而采用二階或多階抽樣,在一定程度上能夠滿足各級政府、部采用二階或多階抽樣,在一定程度上能夠滿足各級政府、部門對調(diào)查資料的需求。門對調(diào)查資料的需求。3、有利于減少抽樣誤差、提高抽樣估計精度。這種抽樣調(diào)查、有利于減少抽樣誤差、提高抽樣估計精度。這種抽樣調(diào)查方法,可以使每個一階樣本單位分布比較均勻,具有很好的方法,可以使每個一階樣本單位分布比較均勻,具有很好的代表性;對于方差大的階段多抽些樣本單位以提高精度。代表性;對于方差大的階段多抽些樣本單位以提高精度。 先作一些基本假設(shè):先作一些基本假設(shè): (1 1)初級單元中包含的次級單元個數(shù)同為初級單元中包含的次級單元

7、個數(shù)同為 M M,因此在因此在抽中的初級單元中再抽取的次級單元個數(shù)也相等,記為抽中的初級單元中再抽取的次級單元個數(shù)也相等,記為 m m。1 1 初級單元大小相等的二階抽樣初級單元大小相等的二階抽樣 (2 2)兩個階段的抽樣方法都是簡單隨機(jī)抽樣兩個階段的抽樣方法都是簡單隨機(jī)抽樣。 (3 3)在抽中的若干初級單元中作第二階抽樣是相互獨(dú)在抽中的若干初級單元中作第二階抽樣是相互獨(dú)立進(jìn)行的立進(jìn)行的。 再引進(jìn)一些必要的記號:再引進(jìn)一些必要的記號:ijY表示第表示第 初級單元中第初級單元中第 個次級單元個次級單元1,2,;1,2,iNjM ijijy表示樣本中第表示樣本中第 初級單元中第初級單元中第 個次級

8、單元的觀測值個次級單元的觀測值1,2, ;1,2,in jm ij1MiijjYY 第第 初級單元總和初級單元總和iiiYYM 第第 初級單元平均值初級單元平均值i11111NMNijiijiYYYNMN 總體平均值總體平均值222111()(1)NMijiijSYYN M 初級單元初級單元(群群)內(nèi)的方差內(nèi)的方差22111()1NiiSYYN 總體中初級單元總體中初級單元(群群)間方差間方差將將 改為改為 ,N改為改為n,M改為改為m,則為相應(yīng)的樣本指標(biāo)值則為相應(yīng)的樣本指標(biāo)值Yy第第 i 群內(nèi)次級單元間的方差記為:群內(nèi)次級單元間的方差記為:22211()1MiijijSYYM 顯然有顯然有

9、所有所有 的平均數(shù)。的平均數(shù)。222211NiiSSN 22iS1、估計量及其方差、估計量及其方差 總體平均數(shù)總體平均數(shù) 的估計是用樣本平均數(shù)進(jìn)行估計的的估計是用樣本平均數(shù)進(jìn)行估計的Y11111nnmiijiijyyynnm 容易證明,這個估計量容易證明,這個估計量 是是 的無偏估計。的無偏估計。yY其方差為:其方差為:22121211( )ffVar ySSnnm(9.1)其中其中 ,1nfN 2mfM 方差的無偏估計為:方差的無偏估計為:22112121(1)( )fffv yssnnm (9.2)總體總數(shù)總體總數(shù) 的估計為:的估計為:Y yNM y 方差的無偏估計為:方差的無偏估計為:2

10、( )()( )v yNMv y 總體平均數(shù)總體平均數(shù)95的置信區(qū)間為的置信區(qū)間為(1.96( ) ,1.96( )yv yyv y總體總數(shù)總體總數(shù)95的置信區(qū)間為的置信區(qū)間為(1.96( ) ,1.96( )yv yyv y例例9.1:新華書店某柜臺上月共用去發(fā)票新華書店某柜臺上月共用去發(fā)票70本,每本本,每本100張,張,現(xiàn)隨機(jī)從中抽出現(xiàn)隨機(jī)從中抽出10本,每本隨機(jī)抽出本,每本隨機(jī)抽出15張發(fā)票,得到數(shù)據(jù)張發(fā)票,得到數(shù)據(jù)如下表:給出上月柜臺營業(yè)總額的估計及其方差。如下表:給出上月柜臺營業(yè)總額的估計及其方差。i151ijjy 12345678910375.25408.30323.40502.

11、50234.00387.75284.20256.60314.10280.501521ijjy 11280.2512115.998752.7617833.753953.0011302.506573.044822.366921.015827.2525.0227.2221.5633.5015.6025.8518.9517.1120.9418.70135.0271.58127.1671.4321.6197.3784.7530.7924.5541.56iy22is解:解:N=70,n=10,M=100,m=15101511111110 15nmijijijijyyynm 1375.25280.5022.

12、44410 15 117f 20.15f 70 100 22.444157108yNM y 故上月柜臺營業(yè)總額的估計為故上月柜臺營業(yè)總額的估計為157108.00元元22111()29.761niisyyn 22221170.58niissn 22112121(1)( )2.61fffv yssnnm 標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為 元元( )70 1002.6111308.85v y 營業(yè)總額營業(yè)總額95的置信區(qū)間為的置信區(qū)間為22( )()( )(70100)2.61v yNMv y (1.96( ) ,1.96( )yv yyv y(134942.65 ,179273.35) 2、最優(yōu)抽樣比、最優(yōu)抽樣

13、比 如果初級單元(或群)之間的旅行費(fèi)用不占重要地位的如果初級單元(或群)之間的旅行費(fèi)用不占重要地位的話,常采用簡單線性費(fèi)用函數(shù):話,常采用簡單線性費(fèi)用函數(shù): 二階抽樣存在兩次概率抽樣,因而存在兩個抽樣比二階抽樣存在兩次概率抽樣,因而存在兩個抽樣比 因此我們面臨的問題是:因此我們面臨的問題是:(1)在總費(fèi)用給定的條件下,如何在總費(fèi)用給定的條件下,如何確定確定 與與 而使而使 的方差達(dá)到最??;的方差達(dá)到最小;(2)在給定估計量的精在給定估計量的精度度 條件下,如何確定條件下,如何確定 與與 以使總費(fèi)用最小。以使總費(fèi)用最小。y12,ff1f2f1f2f( )Var y0c12,cc其中其中 是基本費(fèi)

14、用,是基本費(fèi)用, 是每調(diào)查一個初級單元與次級單元是每調(diào)查一個初級單元與次級單元所花費(fèi)的費(fèi)用。所花費(fèi)的費(fèi)用。012Ccc nc nm (9.3)將方差表達(dá)成:將方差表達(dá)成:222222111( )()SSSVar ySnMnmN(9.4) 于是,在固定于是,在固定C下極小化下極小化 或在固定或在固定 下極小化下極小化C均等價于使下式極小化:均等價于使下式極小化:( )Var y( )Var y222201SSSM其中:其中: 。但這里要求。但這里要求 。2222010SSSM2222010SSSM假如假如 ,表明群內(nèi)差異明顯地大于群間的差異,表明群內(nèi)差異明顯地大于群間的差異,因此對于抽到的群來說

15、,最好作全面調(diào)查才能保證樣本的代因此對于抽到的群來說,最好作全面調(diào)查才能保證樣本的代表性,此時總使表性,此時總使mM。2222010SSSM現(xiàn)考慮現(xiàn)考慮222222101122220121( )()()()()()SSVar ySCcScc mNMmSScc mm(9.5)在在(9.5)式中,由于式中,由于 都是常數(shù),為使都是常數(shù),為使(9.5)達(dá)到最達(dá)到最小,只要小,只要220212,SSc c222102S cQS c mm(9.6)達(dá)到最小,這兩個加項的乘積恰好為常數(shù)達(dá)到最小,這兩個加項的乘積恰好為常數(shù) ,因此,因此只要這兩項相等就可使只要這兩項相等就可使Q達(dá)到最小,此時應(yīng)取達(dá)到最小,此

16、時應(yīng)取220212S S c c1202cSSmc m 或者或者m的最優(yōu)取值為:的最優(yōu)取值為:2102optScmSc (9.7)一般地,一般地, 不是整數(shù),記不是整數(shù),記 為為 的最小整數(shù)部分,那的最小整數(shù)部分,那么么 ( 為為 的小數(shù)部分,且的小數(shù)部分,且 )。)。optmoptmoptmoptoptmmaoptma0a 2(12 )optaa m如果如果 ,則取,則取 1optmm如果如果 ,則取,則取2(12 )optaa moptmm 易見,對于易見,對于 的小數(shù)部分大于或等于的小數(shù)部分大于或等于0.5的情況,我們總?cè)〉那闆r,我們總?cè)?,這符合通常的,這符合通常的“五入五入”規(guī)則,是

17、否規(guī)則,是否“四舍四舍”?當(dāng)當(dāng) 時,就要看時,就要看 的最小整數(shù)部分的大小了。的最小整數(shù)部分的大小了。optm 1optmmoptm0.5a 由由 m 的選取,代入的選取,代入(9.3)或或(9.4)立即可以得到立即可以得到 n 的數(shù)值。的數(shù)值。3、分層二階抽樣、分層二階抽樣 所謂分層二階抽樣就是將總體分為所謂分層二階抽樣就是將總體分為 k 個層,在每層內(nèi)進(jìn)個層,在每層內(nèi)進(jìn)行二階抽樣。比如,一所大學(xué)有行二階抽樣。比如,一所大學(xué)有 8 個系,每個系有若干個班個系,每個系有若干個班級,每班大約人數(shù)為級,每班大約人數(shù)為40人,為了解學(xué)生的情況需要作一次抽人,為了解學(xué)生的情況需要作一次抽樣調(diào)查,在每個

18、系都隨機(jī)抽幾個班,再在抽中的班級里抽取樣調(diào)查,在每個系都隨機(jī)抽幾個班,再在抽中的班級里抽取若干人的簡單隨機(jī)抽樣,這就構(gòu)成二階分層抽樣。若干人的簡單隨機(jī)抽樣,這就構(gòu)成二階分層抽樣。 本節(jié)討論的二階分層抽樣,假設(shè)在同一層內(nèi)初級單元大本節(jié)討論的二階分層抽樣,假設(shè)在同一層內(nèi)初級單元大小相等,但不同層可以不相等。設(shè)第小相等,但不同層可以不相等。設(shè)第 h 層含層含 個初級單元,個初級單元,每個初級單元包含每個初級單元包含 個次級單元,于是總體中共含有個次級單元,于是總體中共含有個次級單元。又假設(shè)在第個次級單元。又假設(shè)在第 h 層按照簡單隨機(jī)抽樣方法抽取層按照簡單隨機(jī)抽樣方法抽取個初級單元,在每個被抽中的初

19、級單元中再抽取容量為個初級單元,在每個被抽中的初級單元中再抽取容量為 的的簡單隨機(jī)抽樣。簡單隨機(jī)抽樣。hNhM1khhhN M hnhmhy 設(shè)第設(shè)第 h 層中樣本的層中樣本的(二階抽樣二階抽樣)平均數(shù)為平均數(shù)為 ,因此按照分,因此按照分層估計的技巧,總體的層估計的技巧,總體的(按次級單元按次級單元)平均數(shù)平均數(shù) 的分層二階估的分層二階估計量為:計量為:Y111khhhkhsthhkhhhhN M yyW yN M (9.8)其中其中 為第為第 h 層層(按次級單元按次級單元)的層權(quán):的層權(quán):hW1hhhkhhhN MWN M (9.9)(9.10)而而11hhnmhijijhhhyyn m

20、由于各層的抽樣相互獨(dú)立,而由二階抽樣的有關(guān)討論,由于各層的抽樣相互獨(dú)立,而由二階抽樣的有關(guān)討論, 的的方差及其方差估計是已知的,因此:方差及其方差估計是已知的,因此:hy2221212111()()khhsthhhhhhhffVar yWSSnn m (9.11)2221121211(1)()()khhhsthhhhhhhfffv yWssnn m (9.12)其中其中 分別為第分別為第 h 層中的兩個抽樣比。層中的兩個抽樣比。12hhhhhhnmffNM、 和和 是第是第 h 層中的群間和群內(nèi)方差,層中的群間和群內(nèi)方差, 與與 是第是第 h 層中層中樣本的群間和群內(nèi)方差。樣本的群間和群內(nèi)方差

21、。21hS22hS21hs22hs顯然,總體總和的分層二階抽樣估計為:顯然,總體總和的分層二階抽樣估計為:1ksthhhhyN M y (9.13)其方差及其方差估計為:其方差及其方差估計為:22221212111()()khhsthhhhhhhhffVar yN MSSnn m 22221121211(1)()()khhhsthhhhhhhhfffv yN Mssnn m 在分層二階抽樣中當(dāng)然也存在最優(yōu)抽樣比的問題,不過此在分層二階抽樣中當(dāng)然也存在最優(yōu)抽樣比的問題,不過此時假定費(fèi)用函數(shù)一般應(yīng)當(dāng)與時假定費(fèi)用函數(shù)一般應(yīng)當(dāng)與“層層”有關(guān)系:有關(guān)系:0112211kkhhhhhhhCcc ncn m

22、 (9.14)固定費(fèi)用固定費(fèi)用C而使方差達(dá)到最小或方差有一定精度要求下使而使方差達(dá)到最小或方差有一定精度要求下使費(fèi)用達(dá)到最小,此時費(fèi)用達(dá)到最小,此時 的最優(yōu)選擇為:的最優(yōu)選擇為:hm2122212hhhhhhhScmcSSM (9.15)其中總假設(shè)對所有的其中總假設(shè)對所有的 h ,都有都有 。22120hhhSSM2 2 初級單元大小不等的二階抽樣初級單元大小不等的二階抽樣 在實踐中,除少數(shù)情況外,初級單元的大小不一定相等在實踐中,除少數(shù)情況外,初級單元的大小不一定相等當(dāng)然理想一些的情況,我們在分群時就注意到先將單元按照當(dāng)然理想一些的情況,我們在分群時就注意到先將單元按照大小分層,使得同一層中

23、初級單元大小相等,然后利用上面大小分層,使得同一層中初級單元大小相等,然后利用上面所講的分層二階抽樣的辦法來做。只可惜在實際操作中,分所講的分層二階抽樣的辦法來做。只可惜在實際操作中,分層分群常常有一些層分群常常有一些“自然自然”形式,例如從行政系統(tǒng)劃分等。形式,例如從行政系統(tǒng)劃分等。因此,我們只能面對初級單元大小不等的情形,由于初級單因此,我們只能面對初級單元大小不等的情形,由于初級單元大小不一樣,合理的手段是對初級單元采用不等概率抽樣元大小不一樣,合理的手段是對初級單元采用不等概率抽樣。 先給出一些相關(guān)的記號:先給出一些相關(guān)的記號:ijY表示第表示第 初級單元中第初級單元中第 個次級單元個

24、次級單元1,2,;1,2,iiNjM ij1iMiijjYY 第第 初級單元總和初級單元總和iiiiYYM 第第 初級單元平均值初級單元平均值i111iMNNiijiijYYY總體總和總體總和01NiiMM 0YY M 總體平均數(shù)總體平均數(shù)(按次級單元按次級單元)YY N 總體平均數(shù)總體平均數(shù)(按初級單元按初級單元)22211()1iMiijijiSYYM 第第 i 初級單元內(nèi)方差初級單元內(nèi)方差1、只抽取一個初級單元情形(只抽取一個初級單元情形(n=1) 先考慮從先考慮從 N N 個初級單元中隨機(jī)選取個初級單元中隨機(jī)選取 1 1 個以推斷總體個以推斷總體. .這種情形看起來似乎很特殊,但在生活

25、中也不少見,例如在這種情形看起來似乎很特殊,但在生活中也不少見,例如在隨機(jī)地選的一個班級中抽取幾個人進(jìn)行考試以測試全年級的隨機(jī)地選的一個班級中抽取幾個人進(jìn)行考試以測試全年級的教育質(zhì)量。只選取教育質(zhì)量。只選取 1 1 個單元,仍有等概率與不等概率之分個單元,仍有等概率與不等概率之分. .(1)等概率抽取初級單元等概率抽取初級單元 考慮對總體平均數(shù)考慮對總體平均數(shù) 的估計的估計. .Y首先使用抽中的初級單元中的樣本平均數(shù)首先使用抽中的初級單元中的樣本平均數(shù) 對對 進(jìn)行估計進(jìn)行估計IyY11imIiijjiyyym (9.16)對第對第 i 初級單元來講初級單元來講,由盒子模型可知,由盒子模型可知,

26、 是是 的無偏估計。的無偏估計。由于第由于第 i 個抽樣單元是等概率抽取,相當(dāng)于從盒子個抽樣單元是等概率抽取,相當(dāng)于從盒子中等可能抽取一次,那么所得之?dāng)?shù)一定是這個盒子平均數(shù)的中等可能抽取一次,那么所得之?dāng)?shù)一定是這個盒子平均數(shù)的無偏估計,即無偏估計,即iyiY1(,)NYY11()NIiiE yYYN YY 而而 ,那么,那么 不是不是 的無偏估計,而是有偏估計!的無偏估計,而是有偏估計!YIyY因此,對因此,對 只能求均方誤差:只能求均方誤差:22221111()()()NNiiIiiiiiiMmMSE yYYYYSNNM m 作為作為 的有偏估計,的有偏估計, 的均方誤差由三部分構(gòu)成:一是由

27、偏的均方誤差由三部分構(gòu)成:一是由偏倚引起的平方和,這就是倚引起的平方和,這就是(9.17)式右邊的第一項;二是按初級式右邊的第一項;二是按初級單元單元(此時初級單元的特征指標(biāo)當(dāng)然只能是其平均數(shù)此時初級單元的特征指標(biāo)當(dāng)然只能是其平均數(shù))而計算的而計算的總體方差,總體方差, (9.17)式右邊的第二項恰好體現(xiàn)出這一點;最后一式右邊的第二項恰好體現(xiàn)出這一點;最后一部分是初級單元中次級單元的方差平方和,這恰好是部分是初級單元中次級單元的方差平方和,這恰好是(9.17)式式右邊的第三項。右邊的第三項。YIy()IMSE y 從從 的表達(dá)式可以看出,其第一項和第二項都與的表達(dá)式可以看出,其第一項和第二項都

28、與 的選擇沒有任何關(guān)系,倘若要盡力減少誤差,目標(biāo)自然注意的選擇沒有任何關(guān)系,倘若要盡力減少誤差,目標(biāo)自然注意到第三項,然而第三部分是無法知道且也是無法估計的,因為到第三項,然而第三部分是無法知道且也是無法估計的,因為既然我們只選取一個初級單元,又如何能估計所有的既然我們只選取一個初級單元,又如何能估計所有的 呢?呢?22iSim 由于是二階抽樣,也不可能取由于是二階抽樣,也不可能取 。在一般情況下,。在一般情況下,為了方便起見,常采用選取為了方便起見,常采用選取 常數(shù),不管取到哪常數(shù),不管取到哪一個初級單元,總抽預(yù)先指定好的樣本容量,要不,取一個初級單元,總抽預(yù)先指定好的樣本容量,要不,取 與

29、與 成一定的比例比較合理一些。成一定的比例比較合理一些。iimM imm imiMIy 不是不是 的無偏估計這一缺陷是由的無偏估計這一缺陷是由“等可能等可能”抽取而引抽取而引起的,這時候每一個起的,這時候每一個 有著同等重要的地位有著同等重要的地位而由于初級單元大小不同,在而由于初級單元大小不同,在 的構(gòu)造中顯然的構(gòu)造中顯然 不是有著不是有著同等地位的,這個事實使我們找到了一個彌補(bǔ)同等地位的,這個事實使我們找到了一個彌補(bǔ)“等可能等可能”所引所引起缺陷的辦法,那就是在構(gòu)造估計量時考慮被抽到的初級單起缺陷的辦法,那就是在構(gòu)造估計量時考慮被抽到的初級單元的大小作為元的大小作為“權(quán)權(quán)”:Y(1,2,)

30、iY iN YiY0IIiiiiMN MyyyMM (9.18)其中其中 表示所有初級單元的平均大小。這個估計的表示所有初級單元的平均大小。這個估計的意義很清楚,它的意義很清楚,它的 乘以乘以 成為第成為第 i 個初級單元內(nèi)總和的個初級單元內(nèi)總和的估計,再乘以估計,再乘以 N 成為總體總和的估計,這個估計除以成為總體總和的估計,這個估計除以 作作為為 的估計量是合理的。的估計量是合理的。0MM N iMiy0MY“權(quán)權(quán)” 的作用是使初級單元的指標(biāo)化為次級單元的有關(guān)的作用是使初級單元的指標(biāo)化為次級單元的有關(guān)指標(biāo)。既然指標(biāo)。既然 是第是第 i 個初級單元的總和的無偏估計,由于個初級單元的總和的無偏

31、估計,由于第一階抽樣的第一階抽樣的“等可能性等可能性”, 應(yīng)當(dāng)是總體總和的無偏估應(yīng)當(dāng)是總體總和的無偏估計,于是有:計,于是有: iMMiiM yiiNM y()IIEyY (9.19)222211()11()IINNiiiiiiiiiMM MmVar yYYSNMNMm (9.20)IIy的方差為:的方差為: 應(yīng)當(dāng)指出,應(yīng)當(dāng)指出, 對對 彌補(bǔ)的只是彌補(bǔ)的只是“期望期望”或或“平均平均”上的偏上的偏倚,至于在精度上是否獲益則很難定。例如,倘若各個初級倚,至于在精度上是否獲益則很難定。例如,倘若各個初級單元的平均數(shù)單元的平均數(shù) 比較穩(wěn)定,而比較穩(wěn)定,而 相距較大,引起相距較大,引起 前的系前的系數(shù)

32、數(shù) 的差異較大,這種場合下的差異較大,這種場合下 比起比起 來變化范圍來變化范圍顯然大得多,效果就比較差。顯然大得多,效果就比較差。IIyIyiYiMiyiMMIIyIy(2)不等概率抽取初級單元不等概率抽取初級單元 用等概率方法抽取初級單元對于大小不等的初級單元情用等概率方法抽取初級單元對于大小不等的初級單元情形顯然不太合理,精度較差是可想而知的。一般地,我們采形顯然不太合理,精度較差是可想而知的。一般地,我們采用的不等概率抽取法有如下幾種:用的不等概率抽取法有如下幾種: 按概率按概率 抽取到第抽取到第 i 個初級單元,此時構(gòu)造的估計個初級單元,此時構(gòu)造的估計量為:量為:0iMMIIIiyy

33、 (9.21)IIIyIy 與與 表面上形式相同,只不過表面上形式相同,只不過 取取 的概率為的概率為Iyiy1N而而 取取 的概率為的概率為IIIyiy0iMM111001()iMNNiIIIiijiijME yyYYMM (9.22)IIIy即即 是是 的無偏估計量。的無偏估計量。Y222110011()()()NNiiIIIiiiiiiMMVar yYYSMMmM 222110()1()NNiiiiiiiiMmM YYSMm (9.23)抽取概率抽取概率按預(yù)先指定的一組概率按預(yù)先指定的一組概率 來實施,來實施,構(gòu)造估計量為:構(gòu)造估計量為:1,1NiiiZZ 0iiIViMyyMz(9.2

34、4)1100()NNiiiIViiiiiMYME yZYYMZM (9.25)IVy即即 是是 的無偏估計量。的無偏估計量。Y2222221100111()()()NNiiiIViiiiiiiiiM YMVar yZYZSM ZMZmM 220221101()NNiiiiiiiiiiiiM YMMmZM YSMZZm (9.26)顯然,若取顯然,若取 ,則,則 。若取若取 ,則,則 。0iiZMM IVIIIyy 1iZN IVIIyy 抽取方式與抽取方式與相同,但構(gòu)造的關(guān)于相同,但構(gòu)造的關(guān)于 的估計量為:的估計量為:YViyy (9.27)此時,每個此時,每個 具有權(quán)具有權(quán) ,因此,因此iY

35、iZ1()NViiZiE yZ YY (9.28)一般地一般地 ,因此,因此 是有偏估計。其均方誤差為:是有偏估計。其均方誤差為:ZYY Vy222211()()()()NNiiiVZiiZiiiiiZ MmMSE yYYZ YYSM m (9.29) Cochran構(gòu)造了一個虛擬總體構(gòu)造了一個虛擬總體(N3)進(jìn)行抽樣以對上述進(jìn)行抽樣以對上述五種方法進(jìn)行比較:五種方法進(jìn)行比較:例例9.2 Cochran(1977)N=3 初級單元初級單元(大小不等大小不等)的虛擬總體的虛擬總體iijYiMiY22iSiY1230,11,2,2,33,3,4,4,5,524618240.5000.6670.80

36、00.52.04.0012M 33Y 0332.7512YYM1(0.52.04.0)2.1673Y 方方法法抽取各單元的概率抽取各單元的概率 的的估計量估計量Y是否是否無偏無偏MSE2()偏偏倚倚單元間單元間 單元內(nèi)單元內(nèi) 總計總計11 1 1( , )3 3 3N0iiNMyM無偏無偏0 5.792 0.256 6.0480(0.17,0.33,0.50)iMMiy無偏無偏0 1.813 0.189 2.002(0.2,0.4,0.4)iZ0iiiMyMz無偏無偏0 3.583 0.213 3.796(0.2,0.4,0.4)iZiy有偏有偏0.062 1.800 0.173 2.035a

37、b11 1 1( , )3 3 3N11 1 1( , )3 3 3Niy 有偏有偏0.340 2.056 0.144 2.5410.340 2.056 0.183 2.579取取2im b唯唯 取取2iimM 上表中最后一列的上表中最后一列的MSE是比較優(yōu)劣的關(guān)鍵,是比較優(yōu)劣的關(guān)鍵, 盡管是盡管是無偏估計,但是效果最差。同樣是無偏估計,無偏估計,但是效果最差。同樣是無偏估計, 的效果最的效果最好。好。IIyIIIy 這兩個事實也表明了這兩個事實也表明了“無偏性無偏性”對于估計量的誤差判斷并對于估計量的誤差判斷并非是決定性的,有時為了使均方誤差小一些,人們寧可放棄非是決定性的,有時為了使均方誤

38、差小一些,人們寧可放棄無偏性,無偏性, 作為有偏估計其效果幾乎不亞于作為有偏估計其效果幾乎不亞于 。注意到。注意到、三種方法都是不等概率抽樣,三種方法都是不等概率抽樣,與與除了除了 不同不同外其余均相同,由于外其余均相同,由于 與與 差異不大,因此差異不大,因此的效果相的效果相對也就比較好。而對于對也就比較好。而對于 ,盡管,盡管 與與 相同,但對其估計相同,但對其估計量量“刻意刻意”要求無偏卻引起了均方誤差的很不理想!要求無偏卻引起了均方誤差的很不理想!VyIIIyiZiZ0iMMVyiZIVy2、抽取、抽取 個初級單元情形個初級單元情形1n 兩個以上的初級單元里進(jìn)行第二階抽樣,合理的基本假

39、兩個以上的初級單元里進(jìn)行第二階抽樣,合理的基本假定是在不同的初級單元內(nèi)的抽樣過程相互之間獨(dú)立。為方便定是在不同的初級單元內(nèi)的抽樣過程相互之間獨(dú)立。為方便起見,仍像以前一樣假定第二階抽樣為簡單隨機(jī)抽樣,在這起見,仍像以前一樣假定第二階抽樣為簡單隨機(jī)抽樣,在這一小段討論中,我們主要考慮總體總和的估計。一小段討論中,我們主要考慮總體總和的估計。(1)初級單元按多項抽樣方法抽?。┏跫墕卧炊囗棾闃臃椒ǔ槿?設(shè)初級單元以給定的一組概率設(shè)初級單元以給定的一組概率 逐個放回地逐個放回地1(,1)NiiiZZ imim抽取抽取 n 次,在每個被抽中的初級單元里實施容量為次,在每個被抽中的初級單元里實施容量為

40、的簡的簡單隨機(jī)抽樣:假若第單隨機(jī)抽樣:假若第 i 個初級單元在第一階抽樣中被抽中二個初級單元在第一階抽樣中被抽中二次或二次以上,那么在第次或二次以上,那么在第 i 個初級單元中將獨(dú)立地對全體次個初級單元中將獨(dú)立地對全體次級單元進(jìn)行二次或二次以上的容量為級單元進(jìn)行二次或二次以上的容量為 的簡單隨機(jī)抽樣。的簡單隨機(jī)抽樣。 顯然,對第顯然,對第 i 個初級單元的總和個初級單元的總和 可自然地找到無偏估可自然地找到無偏估計計 ,以這些,以這些 代替代替 的話,那么整群抽樣中的的話,那么整群抽樣中的HansenHurwitz型估計無疑為型估計無疑為 提供了無偏估計:提供了無偏估計:iYiYYiy iii

41、yM y 1111nniiiHHiiiiyM yynznz (9.30)其方差為:其方差為:2222211(1)11()NNiiiHHiiiiiiiYMfVar yZYSnZnm Z (9.31)其中其中2(1,2,)iiimfiNM(2)初級單元按簡單隨機(jī)抽取方式抽?。┏跫墕卧春唵坞S機(jī)抽取方式抽取 由于二階抽樣都是采用簡單隨機(jī)抽樣形式,于是可對總由于二階抽樣都是采用簡單隨機(jī)抽樣形式,于是可對總體總和采用一個最為簡單的估計形式:體總和采用一個最為簡單的估計形式:11nnuiiiiiNNyM yynn(9.32)由于由于 與與 是是 與與 的無偏估計,因此的無偏估計,因此 也是也是 的無的無偏

42、估計。偏估計。iyiy iYiYYuy 其方差為:其方差為: 2212221111()111NuiiNiiiiiVar yNYYnNNNMSnmM (9.33)方差方差 的無偏估計為:的無偏估計為:()uVar y 2212221111()111Nuiuiniiiiiv yNyynNnNMsnmM (9.34)其中其中11nuiiyyn 22211()1imiijijisyym 這類簡單估計雖然形式簡單,而且結(jié)構(gòu)也容易為人們接這類簡單估計雖然形式簡單,而且結(jié)構(gòu)也容易為人們接受,同時又是總體的無偏估計,但是它的效果并不理想,方受,同時又是總體的無偏估計,但是它的效果并不理想,方差顯得較大。差顯得

43、較大。(3)按不放回不等概率抽取初級單元)按不放回不等概率抽取初級單元 如果抽取到的第如果抽取到的第 i 個初級單元的總和估計為個初級單元的總和估計為 (簡單簡單隨機(jī)抽樣下的無偏估計隨機(jī)抽樣下的無偏估計),那么由第六章第二節(jié)易知,總體,那么由第六章第二節(jié)易知,總體總和的二階估計可采用如下形式的總和的二階估計可采用如下形式的HorvitzThompson估計估計量。量。iiM y 現(xiàn)在考慮初級單元是按不放回不等概率抽取,而第二階現(xiàn)在考慮初級單元是按不放回不等概率抽取,而第二階抽取仍為在抽取的初級單元中實行簡單隨機(jī)抽樣。那么在第抽取仍為在抽取的初級單元中實行簡單隨機(jī)抽樣。那么在第一階抽樣中就存在包

44、含概率一階抽樣中就存在包含概率 。,iij 11nniiiHTiiiiM yyy(9.35)由于由于 或或 是是 的無偏估計,又的無偏估計,又 是是 的無偏估的無偏估計,所以計,所以 是是 的無偏估計。的無偏估計。iiM yiy iYY1niiiy YHTy 其方差為:其方差為:22211()()NNNjiiHTijijij iiijiYYVar y (9.38)其中其中 222211111iMiiijijiiiMYYnMM 方差方差 的無偏估計為:的無偏估計為:()HTVar y 22211()()nnNjiiHTijijij iiijiyyv y (9.39)其中其中 222211111i

45、niiijijiiiMyynMn 3 3 三階及多階抽樣三階及多階抽樣 將有關(guān)二階抽樣的一些公式與估計推廣到三階乃至更高將有關(guān)二階抽樣的一些公式與估計推廣到三階乃至更高階的情況是很現(xiàn)實的,其實基本上是依樣畫葫蘆,只不過在階的情況是很現(xiàn)實的,其實基本上是依樣畫葫蘆,只不過在符號與計算方面更為復(fù)雜些,尤其是對于各級單元大小都相符號與計算方面更為復(fù)雜些,尤其是對于各級單元大小都相等時更是如此,下面以三階為例。等時更是如此,下面以三階為例。1、各級單元大小均相等時的三階抽樣、各級單元大小均相等時的三階抽樣 設(shè)總體中含有設(shè)總體中含有N個初級單元,每個初級單元包含個初級單元,每個初級單元包含M個次個次級單元,而每一個次級單元均包含級單元,而每一個次級單元均包含K個三級單元。各階的抽個三級單元。各階的抽樣容量分別為樣容量分別為 n、m、k,引進(jìn)一些必要的記號:,引進(jìn)一些必要的記號:ijtY表示第表示第 初

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論