




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十一章其他抽樣方法技術(shù)第一節(jié)捕獲再捕獲抽樣第二節(jié)樣本輪換第三節(jié)敏感性問題的處理第四節(jié)交叉子樣本12
以前各章基本假設(shè)總體單元數(shù)N是已知的,然后對(duì)總體的有關(guān)特征如均值、總值、比例等進(jìn)行估計(jì)。但有些場合,總體單元數(shù)是未知的,是要估計(jì)的目標(biāo),如:一個(gè)池塘中魚的數(shù)量,一片森林中鳥的數(shù)量等。彼得森(Peterson,1896)提出捕獲再捕獲抽樣,并將此方法用于野生動(dòng)物的數(shù)量研究中。第一節(jié)捕獲再捕獲抽樣以捕魚為例說明:假如要估計(jì)湖中的魚的數(shù)量N;從湖中捕獲200條魚做記號(hào)放回湖中,讓它們與湖中未做記號(hào)的魚充分混合。然后從湖中再捕獲100條魚,假設(shè)這次捕獲的魚中有20條是已經(jīng)做了記號(hào)的,若假定魚的總體沒有變化,兩次捕魚都是簡單隨機(jī)抽樣,就可以估計(jì)湖中的魚20%做了標(biāo)記,由此可以推斷N的估計(jì)值是1000。3這種方法依賴于以下假定:(1)總體是封閉的——兩次抽樣間沒有魚進(jìn)入或離開該湖。即對(duì)每次抽樣而言,N相同。(2)每個(gè)樣本都是來自總體的簡單隨機(jī)抽樣。即湖中每條魚都有同樣機(jī)會(huì)被捕獲。(3)兩個(gè)樣本是獨(dú)立的。即第一次捕獲并放回湖中再次與總體混合,標(biāo)記與否和第二次被捕獲的概率沒有關(guān)系。(4)魚不會(huì)丟失其標(biāo)記,從而有記號(hào)的魚可以被識(shí)別。45若為第二次抽樣的樣本量,m為第二次捕獲有記號(hào)的單元的數(shù)量,有則一、直接抽樣法◆先從單元數(shù)為N(未知)的總體中抽取一個(gè)隨機(jī)樣本,設(shè)樣本量為,把這些單元做上記號(hào),然后放回總體,使其與原總體的單元充分混合;這時(shí),做記號(hào)的數(shù)量占總體數(shù)量的比例為,N未知,P待估計(jì);◆再抽取一個(gè)樣本,觀察其中做記號(hào)的單元所占的比例,對(duì)總體的單元數(shù)進(jìn)行估計(jì)。7由比率估計(jì)方差可以得到:有偏當(dāng)?shù)谝淮螛颖玖亢偷诙螛颖玖孔銐虼髸r(shí),偏差會(huì)逐步變小。通常對(duì)N是略有高估的。在大樣本情況下,估計(jì)量近似正態(tài)分布,可以給出一定置信度下的置信區(qū)間。8前例中,例:欲估計(jì)某個(gè)森林中啄木鳥的數(shù)量。首先隨即捕捉了150只啄木鳥,并在鳥的翅膀下染上顏色作為記號(hào),然后予以放飛,適當(dāng)?shù)囊欢螘r(shí)間后,在第二次捕捉中目標(biāo)是捕到有記號(hào)的啄木鳥35只,結(jié)果一共捕捉了100只。要求估計(jì)啄木鳥的數(shù)量,并給出估計(jì)標(biāo)準(zhǔn)誤。10某出版社要調(diào)查某一暢銷書的盜版數(shù)量,由于正版發(fā)行多少冊(cè)是已知的,相當(dāng)于已做記號(hào)的的冊(cè),然后可以隨機(jī)的抽取個(gè)購買該書的讀者,若其中有冊(cè)正版書,則可以推算出正版書和盜版書的總量,從而算出盜版書的數(shù)量。推算總的網(wǎng)站數(shù)量。在CN下注冊(cè)的網(wǎng)站的數(shù)量是已知的,但在CN外的就無法掌握……11捕獲再捕獲的抽樣方法起源于野生動(dòng)物的估計(jì),可以進(jìn)一步擴(kuò)展用于社會(huì)經(jīng)濟(jì)的統(tǒng)計(jì)。廣場集會(huì)人數(shù)的調(diào)查。如某報(bào)社要報(bào)導(dǎo)某次自發(fā)性的集會(huì)人數(shù),可以在廣場入口處散發(fā)一些小紅帽,然后由記者隨機(jī)抽取一個(gè)參與集會(huì)的樣本,該樣本中有多少有小紅帽,就可以推斷出總?cè)藬?shù)。采用條樣(Quadratsamples)
估計(jì)總體密度和數(shù)量直接抽樣和逆抽樣都是建立在總體單位流動(dòng)性比較大的基礎(chǔ)上;對(duì)于有些總體的流動(dòng)性并不是很大,例如松林中發(fā)生的松毛蟲災(zāi)害,大氣中的可吸入顆粒物,就不適宜采用捕捉再捕捉抽樣;通常采用抽取若干樣本來估計(jì)總體密度,然后根據(jù)總體的面積或體積來估計(jì)總體數(shù)量。12設(shè)一個(gè)地區(qū)的面積為A,從中隨機(jī)抽取n個(gè)樣本,這種樣本通常稱為條樣。若每個(gè)條樣的面積為a,則總體劃分為N個(gè)a,總面積A=Na。13這些元素在總體中的密度為在對(duì)密度的估計(jì)中,通常假設(shè)總體的元素在總體中的分布是隨機(jī)的,而不是聚集在一起的,即分布沒有一定的規(guī)則順序,因此在條樣中的分布近似于泊松分布;14先計(jì)算樣本每個(gè)條樣中的平均元素?cái)?shù):再估計(jì)條樣的密度:總體的元素總量M的估計(jì)值為:其方差估計(jì)為:例:在一項(xiàng)耕地的切根蟲調(diào)查中,抽取的工具是一個(gè)20cm長和20cm寬的一個(gè)正方形測框,取10cm的表土來計(jì)量切根蟲的數(shù)量。隨機(jī)取了10個(gè)樣框資料,得到每個(gè)測框中平均有切根蟲2條。試估計(jì)在一塊5000平方米的耕地中有多少切根蟲,并給出估計(jì)標(biāo)準(zhǔn)誤。15解:切根蟲數(shù)已知該耕地切根蟲數(shù)估計(jì)為25萬條,估計(jì)標(biāo)準(zhǔn)誤為5.59萬條。17二、樣本輪換的最優(yōu)比例假定抽樣是放回的簡單隨機(jī)抽樣;設(shè)在第一個(gè)時(shí)期的樣本量為n,在第二個(gè)時(shí)期保留樣本的比例為p,即保留的樣本量為np,同時(shí)獨(dú)立的補(bǔ)充新的樣本量nq,p+q=1。第二個(gè)時(shí)期的樣本量仍然為n。18第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的np個(gè)單位在第一個(gè)時(shí)期的均值第一個(gè)時(shí)期的nq個(gè)單位在第一個(gè)時(shí)期的均值np個(gè)單位在第二個(gè)時(shí)期的均值nq個(gè)補(bǔ)充單位在第二個(gè)時(shí)期的均值估計(jì)第二個(gè)時(shí)期的均值,并希望此均值充分利用第一個(gè)時(shí)期的信息,令20該估計(jì)量的方差:如果不利用前期信息,只根據(jù)第二期的結(jié)果來估計(jì)均值,有21其方差為計(jì)算利用前期信息后的設(shè)計(jì)效應(yīng)見書P208:可以得到最優(yōu)的輪換比:22三、樣本輪換方法(P209)四、樣本輪換應(yīng)該遵循的原則23第三節(jié)敏感性問題的處理一、敏感性問題所調(diào)查的內(nèi)容涉及個(gè)人隱私,受訪者不愿或不便于公開的問題。如果直接使用對(duì)這類問題的答案構(gòu)成的調(diào)查結(jié)果來推斷總體,顯然可靠性值得懷疑。一般從兩個(gè)方面改進(jìn):改進(jìn)問卷設(shè)計(jì);通過引入專門的抽樣技術(shù)(隨機(jī)化模型),消除受訪者的防衛(wèi)心理,降低受訪者因真實(shí)回答遭受的隱私受侵害的風(fēng)險(xiǎn)。
是指在調(diào)查中使用特定的隨機(jī)化裝置,使得被調(diào)查者以預(yù)定的概率來回答敏感性問題。這一技術(shù)的宗旨就是最大限度地為被調(diào)查者保守秘密,從而取得被調(diào)查者的信任。隨機(jī)化回答技術(shù)比如在調(diào)查學(xué)生考試作弊的問題中,設(shè)計(jì)外形完全一樣的卡片k張,其中k1張卡片上寫上“你考試是否作過弊?”,n-k1張卡片上寫上另外的問題。然后放在一盒子里。調(diào)查時(shí),由被調(diào)查者從盒子里任抽一卡片,根據(jù)卡片上的問題做出回答,至于卡片上具體是什么問題,調(diào)查者無權(quán)過問。這樣就起到了為被調(diào)查者保密的作用。因而相對(duì)于直接問答調(diào)查,易于得到被調(diào)查者的合作。
沃納隨機(jī)化回答模型
西蒙斯模型(Simmonsmodel)隨機(jī)應(yīng)答技術(shù)的類型
兩種卡片的比例是已知的??ㄆ珹的比例是P,卡片B的比例是1-P。在大規(guī)模調(diào)查中,抽中卡片A的概率P(A)=P,抽中卡片B的概率P(B)=1-P
沃納隨機(jī)化回答模型
若樣本量為n,回答“是”的人有m個(gè),則回答“是”的有兩種情況:一種抽中了卡片A,正好是作了弊,另一種是抽到了卡片B,沒有作弊的。28受訪者卡片A卡片B是不是不是是具有A特征具有B特征具有A特征具有B特征不管抽到卡片A還是B,作過弊的概率是相等的,假設(shè)為舉例:P224.6解:仍然存在的兩個(gè)問題1.在模型設(shè)計(jì)中,受訪者需要回答的兩個(gè)問題仍然都是敏感的;2.要求P≠1/2,而且當(dāng)P越接近1/2,估計(jì)量方差越大,效率越低。但從消除受訪者的顧慮角度看,兩種卡片的比例最好是1/2,這樣抽中這兩類問題的機(jī)會(huì)是均等的。西蒙斯提出一種修改方案:無關(guān)問題的隨機(jī)化回答模型。將一張卡片的問題改為與所調(diào)查的敏感問完全無關(guān)的非敏感問題。31三、西蒙斯模型
設(shè)提敏感性問題的卡片的比例是P,無關(guān)問題的卡片的比例是1-P。
對(duì)于敏感性問題回答“是”的比例為,對(duì)無關(guān)問題回答“是”比例為。
若樣本量為n,回答“是”的人有m個(gè),則有33估計(jì)量方差例見教材P217敏感性問題調(diào)查方法的應(yīng)用
某高校在開展關(guān)于普及性知識(shí)的活動(dòng)中,要求對(duì)學(xué)校的學(xué)生是否有過性行為這一問題進(jìn)行抽樣調(diào)查。該調(diào)查問題具有敏感性,運(yùn)用通常采取的調(diào)查方式,調(diào)查根本無法進(jìn)行,因此運(yùn)用了敏感性問題抽樣調(diào)查方法;該高校在校生人數(shù)為6000人,隨機(jī)抽取1500名學(xué)生進(jìn)行抽樣調(diào)查,且分別運(yùn)用了以上的兩種方法,比較統(tǒng)計(jì)結(jié)果。
采用隨機(jī)化的回答技術(shù)設(shè)計(jì)了兩種用信封封裝比例一定的問卷;一種問題為:“你有過性行為嗎?”;另一種問題為:“你沒有過性行為嗎?”。在調(diào)查時(shí),讓同學(xué)任意選取一個(gè)信封并回答上面的問題,當(dāng)然調(diào)查人員是不知道該同學(xué)回答的是哪一個(gè)問題。第一種方法:沃納隨機(jī)化回答模型提出兩個(gè)都具有敏感性相關(guān)問題
這樣同學(xué)們根據(jù)他們的實(shí)際情況回答抽到的問題,與自己的情況一致的則回答“是”;否則回答“不是”。研究者在設(shè)計(jì)問卷時(shí),設(shè)計(jì)第一種問題占60%,這樣兩個(gè)問題所占的比例比較接近,有助于讓被調(diào)查者消除顧慮,對(duì)收回的問卷進(jìn)行統(tǒng)計(jì),結(jié)果對(duì)兩種問題回答“是”的有638人,占樣本的比例為:m/n=638/1500=0.4253已知m/n=638/1500=0.4253,P=60%將它代入其方差為:得到回答第一種問題為“是”的人數(shù)估計(jì)比例:估計(jì)標(biāo)準(zhǔn)誤為:
同樣采用隨機(jī)化的回答技術(shù)設(shè)計(jì)了兩種用信封封裝比例一定的問卷,然而一種問題為:“你有過作弊行為嗎?”;為了統(tǒng)計(jì)的方便,另一種問題設(shè)計(jì)為:“你是四月份出生的嗎?”。
顯然,第二個(gè)問題與所要調(diào)查的問題無關(guān),而且被調(diào)查同學(xué)當(dāng)中是四月份出生的比例可以很容易從學(xué)校教務(wù)處學(xué)生信息中心收集到。經(jīng)統(tǒng)計(jì)該校學(xué)生中四月份出生者所占的比例為15.38%。其中設(shè)計(jì)的問卷中第一種問題同樣占60%,統(tǒng)計(jì)結(jié)果為對(duì)兩種問題回答“是”的有206人,占樣本的比例為:
m/n=206/1500第二種方法:提出的兩個(gè)問題,一個(gè)為敏感性問題,另一個(gè)為與調(diào)查內(nèi)容無關(guān)的非敏感性問題。得到回答第一種問題為“是”的人數(shù)估計(jì)比例:其方差為:可以看出采用兩種調(diào)查技術(shù),最終得出的結(jié)果是接近的
估計(jì)標(biāo)準(zhǔn)誤為:第四節(jié)交叉子樣本交叉子樣本方法,又稱為隨機(jī)組方法,是將抽出的樣本分成若干組,每個(gè)組形成一個(gè)子樣本,再利用每個(gè)子樣本之間的離散程度構(gòu)造方差估計(jì)量。對(duì)于復(fù)雜抽樣便于計(jì)算估計(jì)量方差和估計(jì)標(biāo)準(zhǔn)誤;還可以用于發(fā)現(xiàn)偏差,核對(duì)調(diào)查員的調(diào)查質(zhì)量。40一、獨(dú)立的交叉子樣本設(shè)總體為N,從中抽取容量為n的樣本。并不直接抽取,而是抽取k個(gè)子樣本,每個(gè)子樣本的容量為m,n=km,每個(gè)子樣本都可以得到總體指標(biāo)
的無偏估計(jì)量,那么總體指標(biāo)的估計(jì)量及其方差為:4142123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125………………………………………………………………376377378379380381382383384385386387388389390391392393394395396397398399400例:教材P220195192190188185每個(gè)子樣本房屋數(shù)合計(jì)估計(jì)量方差估計(jì)為43估計(jì)量方差估計(jì)為44交叉子樣本方法也適用于復(fù)雜的估計(jì)量,比如,比率估計(jì)量。如果每個(gè)子樣本的估計(jì)量為,則總體的比率估計(jì)量為:估計(jì)量方差的樣本估計(jì)為:例.為研究被調(diào)查者拒答情況,實(shí)施一項(xiàng)調(diào)查。抽樣方式為兩階段抽樣,第一階段采用分層隨機(jī)抽樣從各城區(qū)中隨機(jī)抽取居委會(huì),假設(shè)各層層權(quán)相同。第二階段從抽中的居委會(huì)隨機(jī)抽取住戶。抽出樣本一后將其放回總體,再按相同的抽樣方式抽取樣本二,兩樣本的拒答統(tǒng)計(jì)結(jié)果見下
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 燃料整改報(bào)告范文
- 請(qǐng)求贊助報(bào)告范文
- 浙江國企招聘2024溫州市國有資本投資運(yùn)營有限公司招聘3人筆試參考題庫附帶答案詳解
- 二零二五年度獨(dú)立財(cái)務(wù)顧問代理記賬免責(zé)條款
- 二零二五年度股權(quán)激勵(lì)與股東利益共享協(xié)議
- 二零二五年度藥房藥品質(zhì)量管理員聘用合同
- 二零二五年度鋁合金門窗工程綠色施工與材料供應(yīng)合同
- 2025年茶山茶葉品牌授權(quán)合作承包協(xié)議
- 2025年度集體合同簽訂前的準(zhǔn)備工作規(guī)范
- 2025年度物流企業(yè)貨車司機(jī)勞動(dòng)爭議處理與仲裁協(xié)議
- 2025年深圳市高三一模英語試卷答案詳解講評(píng)課件
- 2025年江西青年職業(yè)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 全套教學(xué)課件《工程倫理學(xué)》
- 江蘇省建筑與裝飾工程計(jì)價(jià)定額(2014)電子表格版
- 2024年山東經(jīng)貿(mào)職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 清華大學(xué)考生自述
- 五年級(jí)下冊(cè)英語課件--Lesson--7《Arriving-in-Beijing-》|冀教版-(三起)-(共21張PPT)
- 武發(fā)[2004]13關(guān)于積極推進(jìn)“ 城中村”綜合改造工作的意見
- 體溫單(三測單)
- 2019福建省物業(yè)管理?xiàng)l例
- 江戶時(shí)代以后的戰(zhàn)國家族們
評(píng)論
0/150
提交評(píng)論