常用的抽樣方法_第1頁
常用的抽樣方法_第2頁
常用的抽樣方法_第3頁
常用的抽樣方法_第4頁
常用的抽樣方法_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于常用的抽樣方法第1頁,共49頁,2022年,5月20日,0點5分,星期四一、單純隨機抽樣(simple random sampling) 1、抽樣方法 根據(jù)研究目的選定總體,首先對總體中所有的觀察單位編號,遵循隨機原則,采用不放回抽取方法,從總體中隨機抽取一定數(shù)量觀察單位組成樣本。 具體方法 隨機數(shù)字法 抽簽法第2頁,共49頁,2022年,5月20日,0點5分,星期四 2、優(yōu)缺點 對所有觀察單位編號,當數(shù)量大時,有難度 抽樣誤差的計算較方便第3頁,共49頁,2022年,5月20日,0點5分,星期四 3、抽樣誤差的估計 有限總體與無限總體 總體類型 均數(shù)標準誤 率的標準誤 無限總體 有限總體

2、 第4頁,共49頁,2022年,5月20日,0點5分,星期四 二、系統(tǒng)抽樣(systematic sampling) 又稱等距/機械抽樣 1、抽樣方法 先將總體的觀察單位按某順序號等分成n個部分再從第一部分隨機抽第k號觀察單位,依次用相等間隔,機械地從每一部分各抽取一個觀察單位組成樣本。 第5頁,共49頁,2022年,5月20日,0點5分,星期四 2、優(yōu)缺點(1)抽樣方法簡便(2)易得到一個按比例分配的樣本,抽樣誤差較?。?)仍需對每個觀察單位編號(4)當觀察單位按順序有周期趨勢或單調性趨勢時,產(chǎn)生明顯偏性第6頁,共49頁,2022年,5月20日,0點5分,星期四 3、抽樣誤差 無固定的計算公

3、式,常按單純隨機抽樣方法來計算,與總體的性質和被抽樣個體間的間隔有關。第7頁,共49頁,2022年,5月20日,0點5分,星期四三、整群抽樣(cluster sampling) 1、抽樣方法 先將總體劃分為若干個“群”組,每個群包括若干個觀察單位,再隨機抽取n個群,被抽到的各群的全部觀察單位則組成樣本。第8頁,共49頁,2022年,5月20日,0點5分,星期四 2、優(yōu)缺點(1)在較大規(guī)模的現(xiàn)場調查中,易組織,較節(jié)省。(2)若各群間的差異較大,該抽樣方法的誤差較大。 3、抽樣誤差第9頁,共49頁,2022年,5月20日,0點5分,星期四四、分層抽樣(stratified sampling) 1、

4、抽樣方法 先將總體按某種特征分成若干層,再從每一層內隨機抽取一定數(shù)量的觀察單位,合起來組成樣本。第10頁,共49頁,2022年,5月20日,0點5分,星期四(1)按比例分配:按總體各層觀察單位數(shù)的多少分配(2)最優(yōu)分配:按各層觀察單位數(shù)多少及其變異大小分配 第11頁,共49頁,2022年,5月20日,0點5分,星期四 2、優(yōu)缺點(1)在一定程度上控制了抽樣誤差,尤其是最優(yōu)分配法(2)應盡量使層內差別小而層間差別大,以提高效率(3)事先應了解各層的總體含量,最優(yōu)分配還應了解標準差第12頁,共49頁,2022年,5月20日,0點5分,星期四多階段隨機抽樣第13頁,共49頁,2022年,5月20日,

5、0點5分,星期四 樣本含量的估計第14頁,共49頁,2022年,5月20日,0點5分,星期四單純隨機抽樣一、先決條件 1、容許誤差,預計樣本統(tǒng)計量與相應總體參數(shù)的最大相差控制在什么范圍。常取可信區(qū)間長度一半。 2、所調查總體標準差,若不了解,須通過預試驗的標準差S或前人的資料作出估計; 3、第一類錯誤的概率 4、對有限總體抽樣時,還須了解總體觀察單位數(shù)。第15頁,共49頁,2022年,5月20日,0點5分,星期四二、計算公式第16頁,共49頁,2022年,5月20日,0點5分,星期四隨機應答技術Randomized Response Techniques (RRT)第17頁,共49頁,2022

6、年,5月20日,0點5分,星期四 敏感問題(sensitive problem) 是指涉及個人(或單位)的隱私或利益的問題以及大多數(shù)人認為不便在公開場合表態(tài)或陳述的問題,在某些情況下,還包括一些違法犯罪的行為。 第18頁,共49頁,2022年,5月20日,0點5分,星期四敏感問題的特點:一般是社會輿論導向所不認同的或反對的行為或觀點不同特征的人群有不同的敏感問題不同敏感問題在敏感程度上存在差異敏感問題的分類:屬性特征敏感問題數(shù)量特征敏感問題第19頁,共49頁,2022年,5月20日,0點5分,星期四 對于敏感性問題,若采用直接回答的形式,被調查者難免產(chǎn)生抵觸情緒,不愿據(jù)實回答,這樣導致調查數(shù)據(jù)

7、失真、調查結果無效。 因此尋求解決敏感性問題調查的有效方法至關重要。 第20頁,共49頁,2022年,5月20日,0點5分,星期四 隨機化回答是指在調查中使用特定的隨機化裝置,使得被調查者以預定的概率來回答敏感性問題。這一技術的宗旨就是最大限度地為被調查者保守秘密,從而取得被調查者的信任。 RRT技術的基本原理在于當被調查者確信調查者及其他人無法從被調查者的回答中獲知他們的真實行為時,能更加真實地對敏感問題進行回答。并且RRT技術保護調查對象的個人隱私,能充分得到調查對象的配合,最終可顯著降低無應答率和誤答率,得到高質量的調查結果。 隨機應答技術Randomized Response Tech

8、niques (RRT)第21頁,共49頁,2022年,5月20日,0點5分,星期四(一)沃納模型(Warner model) 1965年由Warner提出的,其設計思想是向被調查者顯示兩個與敏感性問題(具有特征A)有關,但完全對立的問題,讓調查者按預定的概率從中選一個回答,調查者無權過問被調查者回答的是哪一個問題,從而起到了為被調查者保密的效果。 (二)西蒙斯模型 1967年由西蒙斯提出的,其基本思想仍以沃納模型為基礎,但有一些改進,它將沃納模型中與敏感性問題相對的具有特征A的問題改為一個與敏感性問題不相關的其它問題。 (三)“隨機變量和”回答模型隨機化應答模型第22頁,共49頁,2022年

9、,5月20日,0點5分,星期四一、隨機應答技術的步驟 設計一對問題,使兩個問題的答案種數(shù)和編碼完全一致,應答者隨機選取一個問題,將答案編碼選出,在答案上做出相應的記號。由于答卷上沒有問題的編號,只有一套答案編碼,人們無從知曉應答者回答的是哪一個問題,因而起到保密作用。 1向應答者提出一對問題第23頁,共49頁,2022年,5月20日,0點5分,星期四 (1)兩個相關聯(lián)問題模式: 設計兩個相對立的陳述。 例如 問題1:你曾經(jīng)吸過毒嗎? 是 否 問題2:你從未吸過毒嗎? 是 否(2)兩個不相關聯(lián)問題模式: 第一陳述為敏感性問題,第二陳述是與第一陳述無關的非敏感性問題,可以得到確切的答案。 例如 問

10、題1:你曾經(jīng)吸過毒嗎? 是 否 問題2:你是工人嗎? 是 否第24頁,共49頁,2022年,5月20日,0點5分,星期四2設置一個隨機裝置進行調查 使用一個內裝許多黑、白兩色小球的匣子,黑白球的比例接近1:1,但不等于1:1,例如可以是60和40。 混合均勻后,被調查者從匣子中隨機摸取一球,摸取的是黑球還是白球只有被調查者知道。若摸取的是黑球,則回答第一個問題,否則,回答第二個問題。 答卷上只有答案選擇,沒有題號,可按如下格式設計:“請將你的回答在相應的編號處做上記號:是 否”。第25頁,共49頁,2022年,5月20日,0點5分,星期四3根據(jù)概率理論進行計算(1) 問題1:你曾經(jīng)吸過毒嗎?

11、是 否 問題2:你從未吸過毒嗎? 是 否 假設黑球所占的比例為P,白球所占的比例為1-P,應答者中回答“是”的總比例為r,那么對第一個問題回答“是”的比例RA可以由下式推算: rPRA+ (1-P)(1-RA) RA= r - (1-P)/(2P-1) (1P0.50)第26頁,共49頁,2022年,5月20日,0點5分,星期四(2) 問題1:你曾經(jīng)吸過毒嗎? 是 否 問題2:你是工人嗎? 是 否 假設回答者中工人占的比例為RU,則r與RA的關系為: r PRA+(1-P) RU RAr (1-P) RU/ P 第27頁,共49頁,2022年,5月20日,0點5分,星期四例14-1: 欲調查某

12、地已婚育齡婦女有無婚前性行為的比例。 (1)先把這項技術的意義、性質和方法,特別是其保密功能,坦誠地告訴調查對象,以取得理解、信任和合作。 (2)問卷中設A、B兩個問題。 (3)備有一個口袋,里面裝有黑白兩種顏色的球(也可用圍棋的黑子和白子),兩種球的比例不是1:1,例如可以是60和40。第28頁,共49頁,2022年,5月20日,0點5分,星期四(4)調查對象在填寫答案前,先隨機抽取一個球(球的顏色對調查員保密),據(jù)球的顏色決定回答兩個問題中的哪一個。(5)由于調查員不知道某一對象抽取的球是什么顏色的,所以無法知道某一對象回答的是問題A還是問題B,也無法知道調查對象的“秘密”。(6)設立兩個

13、問題: 問題A:婚前有過性行為?回答: 是 否 問題B:婚前沒有性行為?回答: 是 否 第29頁,共49頁,2022年,5月20日,0點5分,星期四(7)如果調查對象抽取的球是黑色的,則回答問題A;如果調查對象抽取的球是白色的,則回答問題B。(8)計算調查對象中婚前有性行為者的比例。第30頁,共49頁,2022年,5月20日,0點5分,星期四若調查200人,回答“是”的比例為=0.48,第31頁,共49頁,2022年,5月20日,0點5分,星期四第32頁,共49頁,2022年,5月20日,0點5分,星期四二、估計比例用的3種改進模型1、模型I 把問題 B改為一個完全無關、答案為“是”的概率是已

14、知值的問題將沃納模型中與敏感性問題相對的具有特征A的問題改為一個與敏感性問題不相關的其它問題。 BA第33頁,共49頁,2022年,5月20日,0點5分,星期四例14-: 欲調查某地已婚育齡婦女有無婚前性行為的比例。問題A:婚前有過性行為?回答: 是 否 問題B:你生日(月日)除以余數(shù)是嗎? 回答: 是 否第34頁,共49頁,2022年,5月20日,0點5分,星期四有無性行為第35頁,共49頁,2022年,5月20日,0點5分,星期四 如果黑球比例為p=60%,同時回答問題A和B均為是的比例=0.24,生日(月日)除以余數(shù)是占0=33.33%,則第36頁,共49頁,2022年,5月20日,0點

15、5分,星期四西蒙斯模型的不足之處(1) 是預先已知或待估計的值, 的估計偏差會增加估計方差。(2)要提高估計精度,應增大P值和減小 值。但隨著P值的增大和 的減小,被調查者的疑慮會增加。第37頁,共49頁,2022年,5月20日,0點5分,星期四2、模型II 將模型I中設立無關聯(lián)問題B的方法改為兩套抽取球的裝置 優(yōu)點:對問題B回答“是”的概率不必是已知的。 要求調查對象抽取兩次彩球和回答問題兩次。 裝置中黑球的比例是P1和P2,有專家建議,兩者都不要取0或0.5,習慣k常取P2=1P1。 不論對于第一裝置還是對于第二裝量,摸到黑球者如實回答問題A,摸到白球者如實回答問題B。 要求調查對象在兩次

16、回答問題中不能有矛盾。 第38頁,共49頁,2022年,5月20日,0點5分,星期四例14-3 對于前面所說的調查婚前性行為的研究中,假定共480名調查對象。問題A:你在婚前有過性行為嗎? 回答 是 否 。問題B:你在這3天內是吃過魚嗎?回答 是 否 。 第39頁,共49頁,2022年,5月20日,0點5分,星期四第40頁,共49頁,2022年,5月20日,0點5分,星期四第41頁,共49頁,2022年,5月20日,0點5分,星期四課本上有誤第42頁,共49頁,2022年,5月20日,0點5分,星期四第43頁,共49頁,2022年,5月20日,0點5分,星期四兩次試驗模型的主要缺陷(1)若對同

17、一批被調查者試驗兩次,他們兩次回答的結果必具有相關性,從而破壞了模型的隨機性。但如果對兩批被調查者分別進行試驗,又不容易保證兩次的結構具有相似性,從而產(chǎn)生較大誤差。(2)方差V()是兩次試驗產(chǎn)生的方差之和,在相同條件下,它比西蒙斯模型的方差要大得多。(3) P1和P2不能太接近。當p1=p2時,模型就沒有意義了。要減小方差V() ,就應該增大P1而減小P2 ,但當p1增得過大時, 又會減少被調查者的配合。第44頁,共49頁,2022年,5月20日,0點5分,星期四3模型III 本方法的優(yōu)點是不需要設立非敏感問題。但是球的顏色要有3種(紅、黑、白)。每種球的比例是已知的(P31-P1-P2),要求摸到紅球者如實回答問題,摸到黑球者全部回答“是”,摸到白球者全部回答“否”。 第45頁,共49頁,2022年,5月20日,0點5分,星期四第46頁,共49頁,20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論