




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第十五章第十五章總體特征抽樣調(diào)查的總體特征抽樣調(diào)查的設(shè)計(jì)與分析設(shè)計(jì)與分析主要內(nèi)容主要內(nèi)容單純隨機(jī)抽樣單純隨機(jī)抽樣系統(tǒng)抽樣系統(tǒng)抽樣分層隨機(jī)抽樣分層隨機(jī)抽樣第一節(jié)第一節(jié) 單純隨機(jī)抽樣單純隨機(jī)抽樣例例15-1 某地區(qū)共有250名社區(qū)醫(yī)生,一個(gè)研究組從名單中隨機(jī)抽取90名進(jìn)行調(diào)查,發(fā)現(xiàn)他們一個(gè)月內(nèi)家訪平均次數(shù)為4.89,標(biāo)準(zhǔn)差為3.48;其中有40位是醫(yī)科大學(xué)畢業(yè)。試估計(jì)當(dāng)?shù)匾粋€(gè)月內(nèi)平均每位社區(qū)醫(yī)生的家訪平均次數(shù)、全體社區(qū)醫(yī)生的家訪總次數(shù)以及社區(qū)醫(yī)生中大學(xué)畢業(yè)者所占的百分比。 單純隨機(jī)抽樣單純隨機(jī)抽樣 單純隨機(jī)抽樣(simple random sampling)。 一個(gè)月內(nèi)平均每位社區(qū)醫(yī)生家訪的平均次
2、數(shù)約為4.89 全體社區(qū)醫(yī)生家訪的總次數(shù)約為4.89250=1222.5 社區(qū)醫(yī)生中大學(xué)畢業(yè)者所占的百分比約為(40/90)100%=44.4% 單純隨機(jī)抽樣單純隨機(jī)抽樣 連續(xù)型變量總體均數(shù)的估計(jì)連續(xù)型變量總體均數(shù)的估計(jì) 無限總體(infinite population) 從正態(tài)分布總體 ,則樣本均數(shù)的標(biāo)準(zhǔn)誤為總體均數(shù) u 的可信區(qū)間),(2Nnsxx)SE(/2,1SE()nXtX/2SE()XZX單純隨機(jī)抽樣單純隨機(jī)抽樣 有限總體(finite population) 樣本均數(shù)的標(biāo)準(zhǔn)誤: 可信區(qū)間: /2,1SE()nXtXnsNnxx1)SE(/2SE()XZX有限總體校正因子抽樣頻率單
3、純隨機(jī)抽樣單純隨機(jī)抽樣例15-1 :總體均數(shù)u的95%置信區(qū)間: 2935. 09048. 3250901)SE(x)47. 5,31. 4()2935. 0(96. 189. 4單純隨機(jī)抽樣單純隨機(jī)抽樣總體中所有X值之和的置信區(qū)間可以用u的置信區(qū)間乘以N倍來估計(jì),即全體社區(qū)醫(yī)生一個(gè)月內(nèi)家訪總次數(shù)的95%置信區(qū)間 : /2 , 1SE()nN XtX)5 .1367,5 .1077()47. 5,31. 4(250單純隨機(jī)抽樣單純隨機(jī)抽樣 0-1變量總體概率的估計(jì)變量總體概率的估計(jì) 二項(xiàng)分布無限總體: 已知在含有n個(gè)個(gè)體的獨(dú)立隨機(jī)樣本中,有y個(gè)個(gè)體具有某種特定屬性,則該屬性的樣本頻率樣本頻率變
4、異性的標(biāo)準(zhǔn)誤 : nyp nppnppp)1 (1)1 ()SE(單純隨機(jī)抽樣單純隨機(jī)抽樣有限總體 :總體概率的置信區(qū)間 :1)1 (1)SE(nppNnp)SE(2/pZp單純隨機(jī)抽樣單純隨機(jī)抽樣 例15-1:當(dāng)?shù)厝w社區(qū)醫(yī)生一個(gè)月內(nèi)家訪的總次數(shù)約介于1077.5和 1367.5之間,平均每位社區(qū)醫(yī)生家訪的平均次數(shù)約介于4.31和5.47之間;而社區(qū)醫(yī)生中,大學(xué)畢業(yè)者所占的百分比則約介于36.2%和52.6%之間。 9040nyp042. 0190)90/401)(90/40(2509011)1 (1)SE(nppNnp)527. 0,362. 0()042. 0(96. 19040單純隨機(jī)
5、抽樣單純隨機(jī)抽樣 樣本量的估算樣本量的估算 樣本量估算的依據(jù)樣本量估算的依據(jù)樣本量的信息:1總體中個(gè)體的變異程度 如果個(gè)體間變異程度小,則所需樣本量也較少;通常用變異系數(shù)V來反映個(gè)體間變異。2精度 通常用最大的相對(duì)誤差反映精度的要求,是最終估計(jì)范圍的半寬度與真值之比。精度要求越高,樣本含量就越大。3置信程度 即置信水平反映置信程度。置信程度越高要求的樣本含量也越大。 單純隨機(jī)抽樣單純隨機(jī)抽樣 連續(xù)型變量總體均數(shù)估計(jì)的樣本量連續(xù)型變量總體均數(shù)估計(jì)的樣本量需準(zhǔn)備如下信息:1變異系數(shù)V 即總體標(biāo)準(zhǔn)差與總體均數(shù)之比 2相對(duì)誤差 由研究者根據(jù)問題的背景自行規(guī)定。3置信水平 也由研究者根據(jù)問題的背景自行規(guī)
6、定。通常取90%,95%,99%。如果取99.7%,理論上認(rèn)為這時(shí)的置信區(qū)間基本上覆蓋真值,所以稱之為“實(shí)質(zhì)上肯定”(virtual certainty)的水平,此時(shí)標(biāo)準(zhǔn)正態(tài)分布的臨界值 V32/003. 0Z單純隨機(jī)抽樣單純隨機(jī)抽樣 最小樣本量的公式為 續(xù)例15-1,將已獲得的90名社區(qū)醫(yī)生的資料視為預(yù)調(diào)查 22/VZn712. 089. 448. 3V492 . 0)712. 0(96. 12n單純隨機(jī)抽樣單純隨機(jī)抽樣 關(guān)于社區(qū)醫(yī)生家訪次數(shù)的估計(jì),欲使相對(duì)誤差不超過20%,而保持置信水平為95%,至少需要調(diào)查49名社區(qū)醫(yī)生。比由此,為了估計(jì)平均家訪次數(shù),預(yù)調(diào)查90名社區(qū)醫(yī)生的資料已經(jīng)足夠了
7、。還少?需要說明的是,如果算出的最小樣本量n超過了總體內(nèi)個(gè)體數(shù)N,則最小樣本量就應(yīng)該是N,即需要作全數(shù)調(diào)查。單純隨機(jī)抽樣單純隨機(jī)抽樣 0-1變量總體概率估計(jì)的樣本量 事先需知(1)總體概率的猜測值P 可以通過預(yù)調(diào)查的資料來粗略估計(jì)。(2)相對(duì)誤差 由研究者根據(jù)問題的背景自行規(guī)定。(3)置信水平 也由研究者根據(jù)問題的背景自行規(guī)定 概率的變異系數(shù)的計(jì)算公式為最小樣本量的公式為關(guān)于社區(qū)醫(yī)生中大學(xué)畢業(yè)者所占百分比的估計(jì),欲使相對(duì)誤差不超過20%,而保持置信水平95%,至少需要調(diào)查121名社區(qū)醫(yī)生。PppV)1 ( PPZn222/)1 (12105.120)90/40()2 . 0()90/401 (
8、)96. 1 (22n系統(tǒng)抽樣系統(tǒng)抽樣 系統(tǒng)抽樣需要事先為總體中的個(gè)體編號(hào)。 如果欲調(diào)查的變量值或特定的屬性與編號(hào)之間沒有確定的上升、下降或周期性關(guān)系,這時(shí)可以按單純隨機(jī)抽樣的辦法來估計(jì)參數(shù)和估算樣本量。 如果個(gè)體的編號(hào)不具有隨機(jī)性,就應(yīng)考慮采用其它的抽樣設(shè)計(jì)和相應(yīng)的統(tǒng)計(jì)方法。第二節(jié)第二節(jié) 分層隨機(jī)抽樣分層隨機(jī)抽樣例例15-2 欲抽樣調(diào)查某醫(yī)院病人的藥費(fèi)開支和自費(fèi)病人所占頻率。決定將病人分為內(nèi)科、外科、婦科、兒科和其他5個(gè)“層”;將每一層視為一個(gè)小總體,在每一層內(nèi)作隨機(jī)抽樣 。 已知一天內(nèi)5個(gè)層的門診人次數(shù)分別:N1=2800,N2=900,N3=700,N4=400,N5=200, 總的人次
9、數(shù)n=5000,總的樣本數(shù)n=1000,抽樣的比例為n/N=0.2。于是,5個(gè)“層”中抽出的樣本量分別:n1=560,n2=180,n3=140,n4=80,n5=40。 按單純隨機(jī)抽樣的計(jì)算方法,得到各個(gè)層內(nèi)每人次門診藥費(fèi)開支(元)的樣本均數(shù)分別 樣本方差分別為 各個(gè)層內(nèi)完全自費(fèi)者的頻率分別為 3501x1502x2803x2104x1205x1000021s250022s640023s360024s160025s%301p%502p%403p%404p%205p分層隨機(jī)抽樣分層隨機(jī)抽樣 分層隨機(jī)抽樣(stratified random sampling)。此時(shí)可簡單估計(jì)該醫(yī)院病人平均每人次
10、門診的藥費(fèi)開支(元)約為 門診病人中完全自費(fèi)者所占頻率約為 點(diǎn)估計(jì),需要進(jìn)行區(qū)間估計(jì),其關(guān)鍵仍是估計(jì)標(biāo)準(zhǔn)誤 8 .2835000141900020040070090028002001204002107002809001502800350%4 .3550001770200400700900280020020. 040040. 070040. 090050. 0280030. 0分層隨機(jī)抽樣分層隨機(jī)抽樣連續(xù)型變量總體均數(shù)的估計(jì)連續(xù)型變量總體均數(shù)的估計(jì)各層的抽樣比例相等各層的抽樣比例相等總樣本量按比例分配(proportional allocation)到各層,權(quán)重為層的相對(duì)大小 NnNnhhNNW
11、hhNNnnWnhhh分層隨機(jī)抽樣分層隨機(jī)抽樣 總的樣本均數(shù):上述點(diǎn)估計(jì)就是以各層的相對(duì)大小為權(quán)重, 將各層的樣本均數(shù)作加權(quán)平均,以求得總的樣本均數(shù) 樣本均數(shù)的方差 自由度=n-L LhhhxWx122SE()1hhhhhnsXNnLhhWx12h2)xSE()SE(分層隨機(jī)抽樣分層隨機(jī)抽樣 各層的相對(duì)大小為 總體均數(shù)的估計(jì) 56. 0500028001W18. 050009002W14. 050007003W08. 050004004W04. 050002005W8 .283)120(04. 0)210(08. 0)280(14. 0)150(18. 0)350(56. 01LhhhxWx分
12、層隨機(jī)抽樣分層隨機(jī)抽樣 計(jì)算各層樣本均數(shù)的方差 總樣本均數(shù)的方差為 2857.145601000028005601)SE(21x1111.1118025009001801)SE(22x5714.3614064007001401)SE(23x36803600400801)SE(24x32401600200401)SE(25x28.19)32(04. 0)36(08. 0)5714.36(14. 0)1111.11(18. 0)2857.14(56. 0)SE(2x分層隨機(jī)抽樣分層隨機(jī)抽樣 標(biāo)準(zhǔn)誤 總體均數(shù)的95%置信區(qū)間 該醫(yī)院一天中門診病人藥費(fèi)總和的95%置信區(qū)間 該醫(yī)院一天中門診病人的總藥費(fèi)
13、介于1376000和1462000元之間 39. 4)SE(x)4 .292,2 .275()39. 4(96. 18 .283)1462000,1376000()4 .292,2 .275(5000分層隨機(jī)抽樣分層隨機(jī)抽樣0-1變量總體概率的估計(jì)變量總體概率的估計(jì)總的樣本頻率:總的樣本頻率:將各層的樣本頻率作加權(quán)平均,將各層的樣本頻率作加權(quán)平均,可以求得總的樣本頻率可以求得總的樣本頻率 樣本頻率的方差 LhhhpWp11)1 (1)SE(2hhhhhhnppNnpLhhpWp12h2)SE()SE(分層隨機(jī)抽樣分層隨機(jī)抽樣 總體概率的估計(jì)當(dāng)樣本量相當(dāng)大時(shí),總體概率的置信區(qū)間:例15-2 ,總
14、的樣本頻率為 )SE(2/pZp%4 .35)2 . 0(04. 0)4 . 0(08. 0)4 . 0(14. 0)5 . 0(18. 0)3 . 0(56. 01LhhhpWp分層隨機(jī)抽樣分層隨機(jī)抽樣 各層內(nèi)樣本頻率的方差: 總頻率的方差: 總頻率的標(biāo)準(zhǔn)誤 0003. 01560)3 . 01 (3 . 028005601)SE(21p0011. 01180)5 . 01 (5 . 09001801)SE(22p0014. 01140)4 . 01 (4 . 07001401)SE(23p0024. 0180)4 . 01 (4 . 0400801)SE(24p0033. 0140)2 .
15、 01 (2 . 0200401)SE(25p000886. 0)0033(.04. 0)0024(.08. 0)0014(.14. 0)0011(.18. 0)0003(.56. 0)SE(2p0298. 0)SE(p分層隨機(jī)抽樣分層隨機(jī)抽樣 總體概率的95%置信區(qū)間 該醫(yī)院門診病人中完全自費(fèi)的比例介于29.6%和41.2%之間 )412. 0,296. 0()0298. 0(96. 1354. 0分層隨機(jī)抽樣分層隨機(jī)抽樣樣本量的估算樣本量的估算例15-3 某社區(qū)衛(wèi)生站成立之初計(jì)劃調(diào)查本轄區(qū)一年內(nèi)平均每人去醫(yī)院門診看病的次數(shù)。擬按年齡分成30歲以下、30-44歲、45-59歲和60歲以上4個(gè)
16、“層”,按比例抽樣。已知4個(gè)年齡層的人口數(shù)分別為n1=5000,n2=5000,n3=6000,n4=4000。 4個(gè)年齡層一年內(nèi)平均每人去醫(yī)院門診看病的次數(shù)分別為0.8, 0.5, 0.4和1.1;同年齡層內(nèi)的方差分別為0.65, 0. 49, 0.16和1.14。此項(xiàng)調(diào)查要求相對(duì)誤差不超過20%,置信水平達(dá)到95%。試估算樣本量。 分層隨機(jī)抽樣分層隨機(jī)抽樣 連續(xù)型變量總體均數(shù)估計(jì)的樣本量 類似于單純隨機(jī)抽樣,事先需準(zhǔn)備如下信息變異系數(shù)變異系數(shù):相對(duì)誤差相對(duì)誤差 置信水平置信水平 wxV 分層隨機(jī)抽樣分層隨機(jī)抽樣 最小樣本量的公式例15-3,根據(jù)以往資料,4個(gè)年齡層的均數(shù)和方差的加權(quán)平均分別
17、 22/VZn665. 020000) 1 . 1 (4000)4 . 0(6000)5 . 0(5000)8 . 0(5000561. 020000)14. 1 (4000)16. 0(6000)49. 0(5000)65. 0(50002wx2786. 1)665. 0(561. 0222wxV分層隨機(jī)抽樣分層隨機(jī)抽樣 最小樣本量為 按比例分到4個(gè)年齡層 4個(gè)年齡層的樣本量分別為31, 31, 37和25 1238.122)20.0()2786.1()96.1(22n3175.302000050001231n3175.302000050001232n379 .362000060001233
18、n256 .242000040001234n分層隨機(jī)抽樣分層隨機(jī)抽樣 0-1變量總體概率估計(jì)的樣本量例例15-4 為調(diào)查某小學(xué)的學(xué)生中無麻疹免疫力者的概率,決定按年級(jí)作分層隨機(jī)抽樣。已知該校共有學(xué)生N=1325人,6個(gè)年級(jí)的學(xué)生總數(shù)分別為n1=290,n2=210,n3=230,n4=184,n5=193,n6=218。據(jù)當(dāng)?shù)亓硪凰鶎W(xué)校報(bào)告的資料,6個(gè)年級(jí)無麻疹免疫力者的頻率分別為p1=0.042,p2=0.035,p3=0.072,p4=0.178,p5=0.195,p6=0.188。要求相對(duì)誤差不超過20%,置信水平達(dá)到95%。試估算各年級(jí)需抽取的人數(shù)。分層隨機(jī)抽樣分層隨機(jī)抽樣單純隨機(jī)抽樣,事先需準(zhǔn)備如下信息: 總體概率的猜測值總體概率的猜測值P 相對(duì)誤差相對(duì)誤差 置信水平置信水平 最小樣本量的計(jì)算同公式 PPZn222/)1 (分層隨機(jī)抽樣分層
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 項(xiàng)目五 描述洗衣機(jī)的洗衣流程-了解算法及其基本控制結(jié)構(gòu)教學(xué)設(shè)計(jì)2024-2025學(xué)年高一上學(xué)期必修1滬科版(2019)
- 2024國家電投集團(tuán)中國電力招聘(22人)筆試參考題庫附帶答案詳解
- 第五章 第四節(jié) 二 溫帶氣候類型 寒帶氣候和高原山地氣候教學(xué)設(shè)計(jì)-2024-2025學(xué)年湘教版初中地理七年級(jí)上冊(cè)
- 2025年粉體食品物料殺菌設(shè)備項(xiàng)目建議書
- 第二單元《散步》莫懷戚教學(xué)設(shè)計(jì)-2023-2024學(xué)年統(tǒng)編版語文七年級(jí)上冊(cè)標(biāo)簽標(biāo)題
- 第5課《黃河頌》教學(xué)設(shè)計(jì)2023-2024學(xué)年統(tǒng)編版語文七年級(jí)下冊(cè)
- 第二章 問題研究 從市中心到郊區(qū)你選擇住在哪里-教學(xué)設(shè)計(jì) 2023-2024學(xué)年高一下學(xué)期地理人教版(2019)必修第二冊(cè)
- 2025年廣西國際商務(wù)職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫審定版
- 2025年無機(jī)礦物填充塑料合作協(xié)議書
- 遼寧省朝陽市建平縣2023-2024學(xué)年高三上學(xué)期1月期末考試地理試題(解析版)
- 教學(xué)教案、作業(yè)、記錄檢查記錄表
- 數(shù)控銑床(加工中心)編程與操作完整版課件
- 感動(dòng)中國人物-于敏
- 《中國特色社會(huì)主義法治理論》復(fù)習(xí)題集及解析共20篇
- 融資租賃租金計(jì)算表
- 數(shù)據(jù)結(jié)構(gòu)英文教學(xué)課件:Chapter 5 Recursion
- 《中國—東盟自由貿(mào)易區(qū)概論》新版
- 棕色偵探推理劇本殺活動(dòng)方案項(xiàng)目介紹ppt模板
- 降低鉆孔灌注樁混凝土充盈系數(shù)QC
- 華中數(shù)控車床編程及操作PPT課件
- 趣味歷史(課堂PPT)
評(píng)論
0/150
提交評(píng)論