社會調(diào)查方法教程講義11.抽樣11_第1頁
社會調(diào)查方法教程講義11.抽樣11_第2頁
社會調(diào)查方法教程講義11.抽樣11_第3頁
社會調(diào)查方法教程講義11.抽樣11_第4頁
社會調(diào)查方法教程講義11.抽樣11_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

社會調(diào)查中的抽樣dys@

董運生

吉林大學社會學系以調(diào)查對象的范圍為分類1、普查2、抽樣調(diào)查3、個案調(diào)查4、典型調(diào)查

普查

抽樣調(diào)查

個案調(diào)查

典型調(diào)查運用一定的方法在調(diào)查對象總體中抽取一部分調(diào)查對象作為樣本,并對樣本調(diào)查結(jié)果來推斷總體的方法。如何通過選擇一小部分人進行研究,并將結(jié)論推及到千百萬未被研究的人。抽樣調(diào)查(Samplingsurvey)一、基本術(shù)語元素(element)

元素是構(gòu)成總體的最基本單位,是搜集信息的單位和進行分析的基礎(chǔ)

總體(population)

總體是構(gòu)成它的所有元素的集合

總體通常與構(gòu)成它的元素(Element)共同定義:總體是構(gòu)成它的所有元素的集合,而元素則是構(gòu)成總體的基本單位。(一個總體所包含的元素數(shù)常用大寫字母N表示)研究總體

研究總體是在理論上明確界定的個體的集合體它必須受幾個方面的限定:

內(nèi)容、單位、范圍、時間

調(diào)查總體

調(diào)查總體是研究者從中實際抽取調(diào)查樣本的個體的集合體它往往是對研究總體的進一步界定,即對時間、范圍做更進一步規(guī)定一般地說,樣本只能推論調(diào)查總體而不是研究總體樣本

樣本(sample)就是從總體中按一定方式抽取出的一部分元素的集合一個樣本就是總體的一個子集抽樣

所謂抽樣(sampling),指的是從組成某個總體的所有元素的集合中,按一定的方式選擇或抽取一部分元素(即抽取總體的一個子集)的過程

抽樣是從總體中按一定方式選擇或抽取樣本的過程

抽樣單位

(samplingunit)

抽樣單位就是一次直接的抽樣所使用的基本單位指在抽樣各階段中考慮選取的某個元素或者某組元素

在更復雜的抽樣中,需要采用不同層次的抽樣單位

抽樣框

抽樣框(samplingframe)又稱做抽樣范圍,它指的是一次直接抽樣時總體中所有抽樣單位的名單

參數(shù)值

參數(shù)值(parameter)也稱為總體值,它是關(guān)于總體中某一變量的綜合描述,或者說是總體中所有元素的某種特征的綜合數(shù)量表現(xiàn)在統(tǒng)計中最常見的參數(shù)值是某一變量的平均值

參數(shù)值只有通過對總體中的每一個元素都進行調(diào)查或測量才能得到

統(tǒng)計值

統(tǒng)計值(statistic)也稱為樣本值,它是關(guān)于樣本中某一變量的綜合描述是樣本中所有元素的某種特征的綜合數(shù)量表現(xiàn)

抽樣的目的之一,就是要通過這些樣本值去估計和推斷各種參數(shù)值抽樣設計的目標,就是盡可能使所抽取的樣本的估計量接近總體的參數(shù)值抽樣誤差

概率抽樣方法很少能提供與所要推論的總體參數(shù)值完全相等的統(tǒng)計值置信水平與置信區(qū)間

置信水平與置信區(qū)間是測量抽樣誤差程度的兩個關(guān)鍵概念我們用置信水平來表示樣本統(tǒng)計值的精確度,它是指樣本統(tǒng)計值落在參數(shù)值某一正負區(qū)間內(nèi)的概率

置信區(qū)間是某個統(tǒng)計值的擴展,可使我們的置信度提高

抽樣方法非概率抽樣概率抽樣多段抽樣系統(tǒng)抽樣分層抽樣整群抽樣簡單隨機抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣二、非概率抽樣方法偶遇抽樣判斷抽樣定額抽樣滾雪球抽樣空間抽樣1、偶遇抽樣(accidentalsampling)

又稱作方便抽樣或自然抽樣是研究者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象2、判斷抽樣(judgmentalsampling)

又叫立意抽樣

(purposivesampling)調(diào)查者根據(jù)研究的目標和自己主觀的分析來選擇和確定調(diào)查對象的方法3、定額抽樣(quotasampling)

(重點)又稱作配額抽樣研究者盡可能地依據(jù)那些有可能影響研究變量的各種因素來對總體分層,并找出具有各種不同特征的成員在總體中所占的比例然后依據(jù)依據(jù)這種劃分以及各類成員的比例選擇調(diào)查對象例:

假設某高校有4000名學生,其中男生占60%,女生占40%;文科學生和理科學生各占50%;一年級學生占40%、二年級、三年級、四年級學生分別占30%、20%和l0%。

現(xiàn)在要用定額抽樣方法依上述三個變數(shù)抽取一個規(guī)模為100人的樣本。

依據(jù)總體的構(gòu)成和樣本規(guī)模,我們得到的定額表

男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(30人)年級一二三四一二三四一二三四一二三四人數(shù)129631296386428642

社區(qū)調(diào)查對象配額表(200人,性別,年齡,職業(yè))4、滾雪球抽樣(snowballsampling)

當我們無法了解總體情況時,可以從總體中少數(shù)成員入手,對他們進行調(diào)查,向他們詢問還知道哪些符合條件的人;再去找那些人并再詢問他們知道的人。

5、空間抽樣(spacesampling)

游行、集會時適用三、概率抽樣方法簡單隨機抽樣系統(tǒng)抽樣分層抽樣整群抽樣多段抽樣……….同質(zhì)性與異質(zhì)性

所謂隨機抽取,就是保證總體中的每一個個體都有同等的機會入選樣本??傮w中的每一個成員被抽中的概率相等(也即被抽中的機會相等)。而且,任何一個個體的入選與否,與其他個體毫不相關(guān),互不影響。每一個個體的抽取都是相互獨立的,是一種隨機事件。常用的方法:

A、總體元素較少時,類似于抽簽方法。

B、總體元素較多時,隨機數(shù)表法基本原理:從N中抽取n

練習1:我系共有學生300人,系學生會打算采用簡單隨機抽樣的辦法,從中抽取60人進行調(diào)查。具體方法(總體元素少時):先編制一個抽樣框,把總體各單位編上號碼寫在紙片上搓成紙團,作成簽和鬮(給每個學生編號,從001到300,并寫在紙片上);然后,把簽和鬮放在一個盒子內(nèi)攪拌均勻;最后,隨機從盒子內(nèi)抽取簽和鬮,被抽中的簽和鬮上的號碼所代表的單位就是樣本,直到抽滿規(guī)定的樣本為止(從300張紙條里抽取60張,并找相關(guān)同學)。特點:總體單位很多時,寫號碼的工作量就很大,攪拌均勻也不容易,因而此法經(jīng)常在總體規(guī)模較小的時候使用隨機數(shù)表總體元素多時,采用隨機數(shù)表利用隨機數(shù)表進行抽樣的具體步驟:先取得一份總體所有元素的名單(即抽樣框)將總體中所有元素一一按順序編號

根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼以總體的規(guī)模為標準,對隨機數(shù)表中的數(shù)碼逐一進行衡量并決定取舍根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個數(shù)依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應的元素對照附表中的隨機數(shù)表,練習隨機抽樣。要從3000個人(或其他分析單位)的總體中用簡單隨機抽樣的方法選取100個人作為樣本進行調(diào)查。

練習是把總體的單位進行編號排序后,在計算出來某種間隔,然后按照這一固定的間隔抽取個體的號碼來組成樣本的方法。

練習:在某大學總共3000名學生中,抽取一個容量為300的大學生樣本。 001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√值得注意的是,系統(tǒng)抽樣的一個十分重要的前提條件,是總體中個體的排列,相對于研究的變量來說,應是隨機的,即不存在某種與研究變量相關(guān)的規(guī)則分布。否則,系統(tǒng)抽樣的結(jié)果將會產(chǎn)生極大的偏差。因此,我們在使用系統(tǒng)抽樣方法時,一定要注意抽樣框的編制方法。注意:總體名單中,個體的排列具有某種次序上的先后、等級上的高低的情況

例如:我們從2000戶家庭的社區(qū),抽取50戶進行消費狀況的調(diào)查,而2000戶家庭的名單是按照家庭收入的多少按照由高到低排列的。抽樣間距=2000/50=40

如果兩個人選擇樣本,一個人選擇初始號碼為3,另一個人選擇初始號碼為38,那么肯定前者家庭平均收入遠遠高于后者。

解決措施:重新編排總體名單;改用其他抽樣方法??傮w名單中,個體的排列上有與抽樣間隔相對應的周期性分布的情況

例如:某大學總共3000名學生,抽取100人,抽樣間隔為30。但是如果總體名單按教學班排列、每班剛好30人左右,而且各班的名單按照成績高低排列,如果樣本的初始號為2號,那么樣本全是好學生;如果樣本初始號為25號,樣本全部為差學生。3、分層抽樣(stratifiedsampling)

又稱做類型抽樣是先將總體中的所有單位按某種特征或標志(如性別、年齡、職業(yè)或地域等)劃分為若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系統(tǒng)抽樣的方法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。分類隨機抽樣總體子群樣本分層抽樣示意圖需要注意:分層的標準問題(分層原則):以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標準。以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。以那些已有明顯層次區(qū)分的變量作為分層變量。分層的比例問題:按比例分層:指的是按照各種類型或?qū)哟沃械膯挝粩?shù)目同總體單位數(shù)目間的比例來抽取子樣本的方法。不按比例分層:便于對不同層次的子總體進行專門研究或進行相互比較,但若要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權(quán)處理。例題:長春市朝陽區(qū)共有居民20000戶,根據(jù)統(tǒng)計年鑒,按照收入高低進行分類。其中高收入的居民有4000戶,收入標準差為300元;中收入的居民有12000戶,收入標準差為200元;低收入的居民有4000戶,收入標準差為100元;現(xiàn)在要抽取200戶居民進行調(diào)查,請分別以等比例分層抽樣和非比例分層抽樣兩種方法計算樣本組成。答案:等比例:40;120;40

非等比例:60;120;20(公式)

4、整群抽樣(ClusterRandomSampling)

抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內(nèi)的所有元素構(gòu)成調(diào)查的樣本。對小群體的抽取可采用簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣的方法。整群抽樣示意圖劃分子群隨機抽樣5、多階段抽樣(multistagesampling)

又稱為多級抽樣或分段抽樣是按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣過程分為幾個階段進行

e.g.大學——院系——班級——學生假設某市共有2.4萬名教師,他們分布在全市10個區(qū)的200所學校中?,F(xiàn)在要抽取一個由1200名教師組成的樣本。例題:

抽樣方案選擇第一階段第二階段第三階段方案1:方案2:方案3:方案4:方案5:方案6:方案7:方案8:方案9:抽10個區(qū)抽2個區(qū)抽10個區(qū)抽8個區(qū)抽5個區(qū)抽4個區(qū)抽3個區(qū)抽2個區(qū)抽1個區(qū)每個區(qū)抽4所學校每個區(qū)抽20所學校每個區(qū)抽20所學校每個區(qū)抽15所學校每個區(qū)抽12所學校每個區(qū)抽10所學校每個區(qū)抽10所學校每個區(qū)抽10所學校每個區(qū)抽20所學校每個學校抽30名教師每個學校抽30名教師每個學校抽6名教師每個學校抽10名教師每個學校抽20名教師每個學校抽30名教師每個學校抽40名教師每個學校抽60名教師每個學校抽50名教師主要考慮的因素各個抽樣階段中的子總體同質(zhì)性程度要考慮研究者所擁有的人力和經(jīng)費

6、戶內(nèi)抽樣(KISH)一、戶內(nèi)抽樣

——以家庭為單位時,從入選家庭中抽取一個成年人構(gòu)成訪談對象的抽樣方法。(一)方法:科什選擇法(kish)

具體做法:1、調(diào)查表編號。表編號AB1B2CDE1E2F表數(shù)量(N)1/61/121/121/61/61/121/121/62、印制選擇卡,給每個調(diào)查員發(fā)一套(八張)Kish

選擇表A式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11213141516或以上1B1式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11213141526或以上2B2式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11213142526或以上2C式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11213242536或以上3D式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223243546或以上4E1式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223343536或以上5E2式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223244556或以上5F式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223344556或以上63、給抽中家庭每個成年人進行編號并排序。方法是男性在前、年級大的在前。序號年齡和性別特征1最年長的男性2次年長的男性……n最年幼的男性n+1最年長的女性n+2次年長的女性……n+m最年幼的女性序號成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲4、根據(jù)調(diào)查表上的編號找出編號相同的那種“選擇表”查出中選個體的序號,進行調(diào)查。序號成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲F

式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223344556或以上618周歲及以上且在這一戶內(nèi)居住的人口按“先排男性,后排女性;在同一性別中,先排年齡大者,后排年齡小者”的規(guī)則進行排序,并按此順序?qū)⒊蓡T的性別和年齡填在下面的《KISH選樣表》中;選樣表的第一行有A到H共8個字母,其中有一個字母所在列被加以陰影。這一列和住戶成員排序的最后一位所在的那一行的交匯處的數(shù)字,就是被選中的住戶成員的序號;請在《KISH選樣表》Y1一欄以√標出被選中的被選者。

7、PPS抽樣

8、繪圖抽樣在抽中的村委會和居委會中抽取要調(diào)查的家庭時,最重要的一點是建立一個盡可能覆蓋在調(diào)查時點上,身處該村委會或居委會的全體個人的清單(抽樣框)。由于我國流動人口眾多,人戶分離狀況嚴重,無法利用村委會和居委會戶籍資料進行抽樣;而村委會和居委會的常住人口登記又非常不完備,無法充當抽樣框。在此情況下,較為可靠的方法是利用村委會和居委會中的住址進行抽樣,但由于我國尚未建立起完備的門牌地址系統(tǒng),所以在調(diào)查中我們只能深入村委會和居委會的實地,用地圖法繪制出村委會和居委會的所有建筑物,并進一步列舉出建筑物中的所有住宅,以此作為抽樣框來抽取家庭。地圖法實地抽樣是在中國這樣快速變遷的發(fā)展中國家所采用的一種獨特的抽樣方法。四、樣本規(guī)模樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論