第十五章 總體特征抽樣調(diào)查的設(shè)計(jì)與分析_第1頁
第十五章 總體特征抽樣調(diào)查的設(shè)計(jì)與分析_第2頁
第十五章 總體特征抽樣調(diào)查的設(shè)計(jì)與分析_第3頁
第十五章 總體特征抽樣調(diào)查的設(shè)計(jì)與分析_第4頁
第十五章 總體特征抽樣調(diào)查的設(shè)計(jì)與分析_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第十五章第十五章總體特征抽樣調(diào)查的總體特征抽樣調(diào)查的設(shè)計(jì)與分析設(shè)計(jì)與分析主要內(nèi)容主要內(nèi)容單純隨機(jī)抽樣單純隨機(jī)抽樣系統(tǒng)抽樣系統(tǒng)抽樣分層隨機(jī)抽樣分層隨機(jī)抽樣第一節(jié)第一節(jié) 單純隨機(jī)抽樣單純隨機(jī)抽樣例例15-1 某地區(qū)共有250名社區(qū)醫(yī)生,一個(gè)研究組從名單中隨機(jī)抽取90名進(jìn)行調(diào)查,發(fā)現(xiàn)他們一個(gè)月內(nèi)家訪平均次數(shù)為4.89,標(biāo)準(zhǔn)差為3.48;其中有40位是醫(yī)科大學(xué)畢業(yè)。試估計(jì)當(dāng)?shù)匾粋€(gè)月內(nèi)平均每位社區(qū)醫(yī)生的家訪平均次數(shù)、全體社區(qū)醫(yī)生的家訪總次數(shù)以及社區(qū)醫(yī)生中大學(xué)畢業(yè)者所占的百分比。 單純隨機(jī)抽樣單純隨機(jī)抽樣 單純隨機(jī)抽樣(simple random sampling)。 一個(gè)月內(nèi)平均每位社區(qū)醫(yī)生家訪的平均次

2、數(shù)約為4.89 全體社區(qū)醫(yī)生家訪的總次數(shù)約為4.89250=1222.5 社區(qū)醫(yī)生中大學(xué)畢業(yè)者所占的百分比約為(40/90)100%=44.4% 單純隨機(jī)抽樣單純隨機(jī)抽樣 連續(xù)型變量總體均數(shù)的估計(jì)連續(xù)型變量總體均數(shù)的估計(jì) 無限總體(infinite population) 從正態(tài)分布總體 ,則樣本均數(shù)的標(biāo)準(zhǔn)誤為總體均數(shù) u 的可信區(qū)間),(2Nnsxx)SE(/2,1SE()nXtX/2SE()XZX單純隨機(jī)抽樣單純隨機(jī)抽樣 有限總體(finite population) 樣本均數(shù)的標(biāo)準(zhǔn)誤: 可信區(qū)間: /2,1SE()nXtXnsNnxx1)SE(/2SE()XZX有限總體校正因子抽樣頻率單

3、純隨機(jī)抽樣單純隨機(jī)抽樣例15-1 :總體均數(shù)u的95%置信區(qū)間: 2935. 09048. 3250901)SE(x)47. 5,31. 4()2935. 0(96. 189. 4單純隨機(jī)抽樣單純隨機(jī)抽樣總體中所有X值之和的置信區(qū)間可以用u的置信區(qū)間乘以N倍來估計(jì),即全體社區(qū)醫(yī)生一個(gè)月內(nèi)家訪總次數(shù)的95%置信區(qū)間 : /2 , 1SE()nN XtX)5 .1367,5 .1077()47. 5,31. 4(250單純隨機(jī)抽樣單純隨機(jī)抽樣 0-1變量總體概率的估計(jì)變量總體概率的估計(jì) 二項(xiàng)分布無限總體: 已知在含有n個(gè)個(gè)體的獨(dú)立隨機(jī)樣本中,有y個(gè)個(gè)體具有某種特定屬性,則該屬性的樣本頻率樣本頻率變

4、異性的標(biāo)準(zhǔn)誤 : nyp nppnppp)1 (1)1 ()SE(單純隨機(jī)抽樣單純隨機(jī)抽樣有限總體 :總體概率的置信區(qū)間 :1)1 (1)SE(nppNnp)SE(2/pZp單純隨機(jī)抽樣單純隨機(jī)抽樣 例15-1:當(dāng)?shù)厝w社區(qū)醫(yī)生一個(gè)月內(nèi)家訪的總次數(shù)約介于1077.5和 1367.5之間,平均每位社區(qū)醫(yī)生家訪的平均次數(shù)約介于4.31和5.47之間;而社區(qū)醫(yī)生中,大學(xué)畢業(yè)者所占的百分比則約介于36.2%和52.6%之間。 9040nyp042. 0190)90/401)(90/40(2509011)1 (1)SE(nppNnp)527. 0,362. 0()042. 0(96. 19040單純隨機(jī)

5、抽樣單純隨機(jī)抽樣 樣本量的估算樣本量的估算 樣本量估算的依據(jù)樣本量估算的依據(jù)樣本量的信息:1總體中個(gè)體的變異程度 如果個(gè)體間變異程度小,則所需樣本量也較少;通常用變異系數(shù)V來反映個(gè)體間變異。2精度 通常用最大的相對(duì)誤差反映精度的要求,是最終估計(jì)范圍的半寬度與真值之比。精度要求越高,樣本含量就越大。3置信程度 即置信水平反映置信程度。置信程度越高要求的樣本含量也越大。 單純隨機(jī)抽樣單純隨機(jī)抽樣 連續(xù)型變量總體均數(shù)估計(jì)的樣本量連續(xù)型變量總體均數(shù)估計(jì)的樣本量需準(zhǔn)備如下信息:1變異系數(shù)V 即總體標(biāo)準(zhǔn)差與總體均數(shù)之比 2相對(duì)誤差 由研究者根據(jù)問題的背景自行規(guī)定。3置信水平 也由研究者根據(jù)問題的背景自行規(guī)

6、定。通常取90%,95%,99%。如果取99.7%,理論上認(rèn)為這時(shí)的置信區(qū)間基本上覆蓋真值,所以稱之為“實(shí)質(zhì)上肯定”(virtual certainty)的水平,此時(shí)標(biāo)準(zhǔn)正態(tài)分布的臨界值 V32/003. 0Z單純隨機(jī)抽樣單純隨機(jī)抽樣 最小樣本量的公式為 續(xù)例15-1,將已獲得的90名社區(qū)醫(yī)生的資料視為預(yù)調(diào)查 22/VZn712. 089. 448. 3V492 . 0)712. 0(96. 12n單純隨機(jī)抽樣單純隨機(jī)抽樣 關(guān)于社區(qū)醫(yī)生家訪次數(shù)的估計(jì),欲使相對(duì)誤差不超過20%,而保持置信水平為95%,至少需要調(diào)查49名社區(qū)醫(yī)生。比由此,為了估計(jì)平均家訪次數(shù),預(yù)調(diào)查90名社區(qū)醫(yī)生的資料已經(jīng)足夠了

7、。還少?需要說明的是,如果算出的最小樣本量n超過了總體內(nèi)個(gè)體數(shù)N,則最小樣本量就應(yīng)該是N,即需要作全數(shù)調(diào)查。單純隨機(jī)抽樣單純隨機(jī)抽樣 0-1變量總體概率估計(jì)的樣本量 事先需知(1)總體概率的猜測值P 可以通過預(yù)調(diào)查的資料來粗略估計(jì)。(2)相對(duì)誤差 由研究者根據(jù)問題的背景自行規(guī)定。(3)置信水平 也由研究者根據(jù)問題的背景自行規(guī)定 概率的變異系數(shù)的計(jì)算公式為最小樣本量的公式為關(guān)于社區(qū)醫(yī)生中大學(xué)畢業(yè)者所占百分比的估計(jì),欲使相對(duì)誤差不超過20%,而保持置信水平95%,至少需要調(diào)查121名社區(qū)醫(yī)生。PppV)1 ( PPZn222/)1 (12105.120)90/40()2 . 0()90/401 (

8、)96. 1 (22n系統(tǒng)抽樣系統(tǒng)抽樣 系統(tǒng)抽樣需要事先為總體中的個(gè)體編號(hào)。 如果欲調(diào)查的變量值或特定的屬性與編號(hào)之間沒有確定的上升、下降或周期性關(guān)系,這時(shí)可以按單純隨機(jī)抽樣的辦法來估計(jì)參數(shù)和估算樣本量。 如果個(gè)體的編號(hào)不具有隨機(jī)性,就應(yīng)考慮采用其它的抽樣設(shè)計(jì)和相應(yīng)的統(tǒng)計(jì)方法。第二節(jié)第二節(jié) 分層隨機(jī)抽樣分層隨機(jī)抽樣例例15-2 欲抽樣調(diào)查某醫(yī)院病人的藥費(fèi)開支和自費(fèi)病人所占頻率。決定將病人分為內(nèi)科、外科、婦科、兒科和其他5個(gè)“層”;將每一層視為一個(gè)小總體,在每一層內(nèi)作隨機(jī)抽樣 。 已知一天內(nèi)5個(gè)層的門診人次數(shù)分別:N1=2800,N2=900,N3=700,N4=400,N5=200, 總的人次

9、數(shù)n=5000,總的樣本數(shù)n=1000,抽樣的比例為n/N=0.2。于是,5個(gè)“層”中抽出的樣本量分別:n1=560,n2=180,n3=140,n4=80,n5=40。 按單純隨機(jī)抽樣的計(jì)算方法,得到各個(gè)層內(nèi)每人次門診藥費(fèi)開支(元)的樣本均數(shù)分別 樣本方差分別為 各個(gè)層內(nèi)完全自費(fèi)者的頻率分別為 3501x1502x2803x2104x1205x1000021s250022s640023s360024s160025s%301p%502p%403p%404p%205p分層隨機(jī)抽樣分層隨機(jī)抽樣 分層隨機(jī)抽樣(stratified random sampling)。此時(shí)可簡單估計(jì)該醫(yī)院病人平均每人次

10、門診的藥費(fèi)開支(元)約為 門診病人中完全自費(fèi)者所占頻率約為 點(diǎn)估計(jì),需要進(jìn)行區(qū)間估計(jì),其關(guān)鍵仍是估計(jì)標(biāo)準(zhǔn)誤 8 .2835000141900020040070090028002001204002107002809001502800350%4 .3550001770200400700900280020020. 040040. 070040. 090050. 0280030. 0分層隨機(jī)抽樣分層隨機(jī)抽樣連續(xù)型變量總體均數(shù)的估計(jì)連續(xù)型變量總體均數(shù)的估計(jì)各層的抽樣比例相等各層的抽樣比例相等總樣本量按比例分配(proportional allocation)到各層,權(quán)重為層的相對(duì)大小 NnNnhhNNW

11、hhNNnnWnhhh分層隨機(jī)抽樣分層隨機(jī)抽樣 總的樣本均數(shù):上述點(diǎn)估計(jì)就是以各層的相對(duì)大小為權(quán)重, 將各層的樣本均數(shù)作加權(quán)平均,以求得總的樣本均數(shù) 樣本均數(shù)的方差 自由度=n-L LhhhxWx122SE()1hhhhhnsXNnLhhWx12h2)xSE()SE(分層隨機(jī)抽樣分層隨機(jī)抽樣 各層的相對(duì)大小為 總體均數(shù)的估計(jì) 56. 0500028001W18. 050009002W14. 050007003W08. 050004004W04. 050002005W8 .283)120(04. 0)210(08. 0)280(14. 0)150(18. 0)350(56. 01LhhhxWx分

12、層隨機(jī)抽樣分層隨機(jī)抽樣 計(jì)算各層樣本均數(shù)的方差 總樣本均數(shù)的方差為 2857.145601000028005601)SE(21x1111.1118025009001801)SE(22x5714.3614064007001401)SE(23x36803600400801)SE(24x32401600200401)SE(25x28.19)32(04. 0)36(08. 0)5714.36(14. 0)1111.11(18. 0)2857.14(56. 0)SE(2x分層隨機(jī)抽樣分層隨機(jī)抽樣 標(biāo)準(zhǔn)誤 總體均數(shù)的95%置信區(qū)間 該醫(yī)院一天中門診病人藥費(fèi)總和的95%置信區(qū)間 該醫(yī)院一天中門診病人的總藥費(fèi)

13、介于1376000和1462000元之間 39. 4)SE(x)4 .292,2 .275()39. 4(96. 18 .283)1462000,1376000()4 .292,2 .275(5000分層隨機(jī)抽樣分層隨機(jī)抽樣0-1變量總體概率的估計(jì)變量總體概率的估計(jì)總的樣本頻率:總的樣本頻率:將各層的樣本頻率作加權(quán)平均,將各層的樣本頻率作加權(quán)平均,可以求得總的樣本頻率可以求得總的樣本頻率 樣本頻率的方差 LhhhpWp11)1 (1)SE(2hhhhhhnppNnpLhhpWp12h2)SE()SE(分層隨機(jī)抽樣分層隨機(jī)抽樣 總體概率的估計(jì)當(dāng)樣本量相當(dāng)大時(shí),總體概率的置信區(qū)間:例15-2 ,總

14、的樣本頻率為 )SE(2/pZp%4 .35)2 . 0(04. 0)4 . 0(08. 0)4 . 0(14. 0)5 . 0(18. 0)3 . 0(56. 01LhhhpWp分層隨機(jī)抽樣分層隨機(jī)抽樣 各層內(nèi)樣本頻率的方差: 總頻率的方差: 總頻率的標(biāo)準(zhǔn)誤 0003. 01560)3 . 01 (3 . 028005601)SE(21p0011. 01180)5 . 01 (5 . 09001801)SE(22p0014. 01140)4 . 01 (4 . 07001401)SE(23p0024. 0180)4 . 01 (4 . 0400801)SE(24p0033. 0140)2 .

15、 01 (2 . 0200401)SE(25p000886. 0)0033(.04. 0)0024(.08. 0)0014(.14. 0)0011(.18. 0)0003(.56. 0)SE(2p0298. 0)SE(p分層隨機(jī)抽樣分層隨機(jī)抽樣 總體概率的95%置信區(qū)間 該醫(yī)院門診病人中完全自費(fèi)的比例介于29.6%和41.2%之間 )412. 0,296. 0()0298. 0(96. 1354. 0分層隨機(jī)抽樣分層隨機(jī)抽樣樣本量的估算樣本量的估算例15-3 某社區(qū)衛(wèi)生站成立之初計(jì)劃調(diào)查本轄區(qū)一年內(nèi)平均每人去醫(yī)院門診看病的次數(shù)。擬按年齡分成30歲以下、30-44歲、45-59歲和60歲以上4個(gè)

16、“層”,按比例抽樣。已知4個(gè)年齡層的人口數(shù)分別為n1=5000,n2=5000,n3=6000,n4=4000。 4個(gè)年齡層一年內(nèi)平均每人去醫(yī)院門診看病的次數(shù)分別為0.8, 0.5, 0.4和1.1;同年齡層內(nèi)的方差分別為0.65, 0. 49, 0.16和1.14。此項(xiàng)調(diào)查要求相對(duì)誤差不超過20%,置信水平達(dá)到95%。試估算樣本量。 分層隨機(jī)抽樣分層隨機(jī)抽樣 連續(xù)型變量總體均數(shù)估計(jì)的樣本量 類似于單純隨機(jī)抽樣,事先需準(zhǔn)備如下信息變異系數(shù)變異系數(shù):相對(duì)誤差相對(duì)誤差 置信水平置信水平 wxV 分層隨機(jī)抽樣分層隨機(jī)抽樣 最小樣本量的公式例15-3,根據(jù)以往資料,4個(gè)年齡層的均數(shù)和方差的加權(quán)平均分別

17、 22/VZn665. 020000) 1 . 1 (4000)4 . 0(6000)5 . 0(5000)8 . 0(5000561. 020000)14. 1 (4000)16. 0(6000)49. 0(5000)65. 0(50002wx2786. 1)665. 0(561. 0222wxV分層隨機(jī)抽樣分層隨機(jī)抽樣 最小樣本量為 按比例分到4個(gè)年齡層 4個(gè)年齡層的樣本量分別為31, 31, 37和25 1238.122)20.0()2786.1()96.1(22n3175.302000050001231n3175.302000050001232n379 .362000060001233

18、n256 .242000040001234n分層隨機(jī)抽樣分層隨機(jī)抽樣 0-1變量總體概率估計(jì)的樣本量例例15-4 為調(diào)查某小學(xué)的學(xué)生中無麻疹免疫力者的概率,決定按年級(jí)作分層隨機(jī)抽樣。已知該校共有學(xué)生N=1325人,6個(gè)年級(jí)的學(xué)生總數(shù)分別為n1=290,n2=210,n3=230,n4=184,n5=193,n6=218。據(jù)當(dāng)?shù)亓硪凰鶎W(xué)校報(bào)告的資料,6個(gè)年級(jí)無麻疹免疫力者的頻率分別為p1=0.042,p2=0.035,p3=0.072,p4=0.178,p5=0.195,p6=0.188。要求相對(duì)誤差不超過20%,置信水平達(dá)到95%。試估算各年級(jí)需抽取的人數(shù)。分層隨機(jī)抽樣分層隨機(jī)抽樣單純隨機(jī)抽樣,事先需準(zhǔn)備如下信息: 總體概率的猜測值總體概率的猜測值P 相對(duì)誤差相對(duì)誤差 置信水平置信水平 最小樣本量的計(jì)算同公式 PPZn222/)1 (分層隨機(jī)抽樣分層

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論