抽樣和研究設計_第1頁
抽樣和研究設計_第2頁
抽樣和研究設計_第3頁
抽樣和研究設計_第4頁
抽樣和研究設計_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第第五五講講 抽樣和研究設計抽樣和研究設計引言和問題引言和問題 在很多情況下,社會研究者希望對某一社會現(xiàn)象總體或某一類人的總體作出描述,但若對這些總體中的每一個元素(或個體)都進行研究,則往往是不現(xiàn)實的。因此,選擇能夠代表總體的一部分個體,成為研究者必須解決的問題之一。這種選擇就是抽樣。 問題:問題: 1我們?yōu)槭裁匆闃樱?2. 如何抽樣,抽樣包括哪些類型? 3. 有哪些具體的抽樣方法? 4. 如何做好一個研究設計?思考:央視調查顯示有80%左右的觀眾對春晚滿意,新浪網(wǎng)站調查現(xiàn)實只有20%的觀眾對春晚滿意。一、抽樣的意義和作用一、抽樣的意義和作用(一)抽樣的優(yōu)勢:時間、成本和準確。(一)抽樣的

2、優(yōu)勢:時間、成本和準確。在很多情況下,社會研究者希望對某一社會現(xiàn)象總體或某一類人的總體作出描述,但若對這些總體中的每一個元素(或個體)都進行研究,則往往是不現(xiàn)實的。因此,選擇能夠代表總體的一部分個體,成為研究者必須解決的問題之一。這種選擇就是抽樣。抽樣能夠節(jié)省時間和成本。同時,在研究結果的準確性上,認真抽樣后所研究的結果,并不比研究總體中的每一個個體的結果差。(二)抽樣的作用(二)抽樣的作用向人們提供一種實現(xiàn)“由部分認識總體”這一目標的途徑和手段。案例:里根于案例:里根于1984年當選為美國新一任年當選為美國新一任總統(tǒng)。(見:風笑天,總統(tǒng)。(見:風笑天,2009,119頁)頁)對于任何類型的研

3、究者來說,抽樣都是個問題。抽樣都是個問題。我們不能、也不應該祈求研究自己感興趣的每一個個案。每個科學計劃都試著通過研究少數(shù)例子,發(fā)現(xiàn)能夠被應用于所有事物的東西,這種研究的結果,按照我們的通常說法,是“通則化的”。貝克爾,交易的詭計,67 (四)抽樣的兩種類型:(四)抽樣的兩種類型: 1. 概率抽樣:以數(shù)學上的概率抽樣:以數(shù)學上的概率理論概率理論為基礎,按為基礎,按隨機原則隨機原則進行抽進行抽樣。樣?!按蟛糠钟嘘P抽樣的討論來自定量研究者。他們的基本目標是獲取一個有代表性的樣本,或從一個較大的單位或個案的集合或總體中,獲取一個小的單位或個案的集合,這樣,研究者可以研究較小的群體,并對較大的群體進行

4、精確的推論。研究者關注能產(chǎn)生較大代表性樣本(即樣本與總體非常相似)的特定技術。定量研究者傾向于使用以數(shù)學上的概率理論為基礎的抽樣類型(被稱為概率抽樣)”(紐曼2007:266)。2. 非概率抽樣:依據(jù)研究者的非概率抽樣:依據(jù)研究者的主觀意愿、判斷或是否方便主觀意愿、判斷或是否方便等因等因素來抽樣。素來抽樣。 “定性研究者不太關注樣本的代表性和抽取一個概率樣本的技術細節(jié)。相反,他們關注樣本、小的單位、個案或行為的集合,是怎樣展示社會生活的。抽樣的基本目的是收集特殊的個案,事件和行動,以澄清和深化理解。定性研究這側重的是發(fā)現(xiàn)個案,以提升研究者在特定內容方面對社會生活過程的認識。由于這個原因,定性研

5、究者傾向于采用第二類的抽樣:非概率抽樣?!保~曼2007:267)。3. 這兩種類型的抽樣還可以細分出若干不同的形式。兩種類型的抽樣還可以細分出若干不同的形式。(見風笑天2009:120) 三三 抽樣的概念(風笑天,抽樣的概念(風笑天,2009,116-118頁)頁) 1、總體(、總體(population) (1)總體(population)是由構成它的所有元素所形成的集合。 (2)元素(element)是構成總體的最基本單位。 在社會研究中,最常見的總體是由社會中的某些個人組成的,這些個人便是這個總體的元素。 案例一:要研究某省在校大學生的擇業(yè)傾向。那么,該省所有在校大學生的集合就是我們研

6、究的總體,而每一個在校大學生就是該總體的元素。 案例二:要研究某城市居民的家庭生活質量。那么,該市所有居民家庭就是總體,而其中的每一戶家庭就是該總體的要素。 2. 樣本和抽樣樣本和抽樣 (1)樣本(sample):從總體中按一定方式抽出的一部分元素的集合?;蛘哒f,一個樣本是一個總體的一個子集。 (2)抽樣(sampling):從組成某個總體的所有元素的集合中,按一定的方式選擇或抽出一部分元素的過程過程。 3. 抽樣單位和抽樣框抽樣單位和抽樣框(1)抽樣單位(sampling unit):一次直接抽樣所使用的基本單位。 抽樣單位與元素有時相同,有時不同。如:若從該省在校大學生總體(12.8萬)中

7、直接抽取1000名大學生,這些單個大學生單個大學生同時是元素和抽樣單位。若從該總體中抽取40個班級(這些班級的人數(shù)恰好是1000人),這時,班級班級就是抽樣單位。(2)抽樣框(sampling frame)又稱抽樣范圍。是在一次直接抽樣時,總體中所有抽樣單位的名單。如案例一,在研究某省在校大學生的擇業(yè)傾向時,直接抽取的1000名單個大學生的名單就是這次抽樣的抽樣框。而那40個班級的名單是另外一個抽樣框。 案例討論:案例討論:美國雜志文學摘要曾在1920年、1924年、1928年和1932年在美國總統(tǒng)選舉的時候,從車主登記簿和電話簿挑選樣本寄送明信片調查選舉意向,被調查者把投票意向寄回,這四次預

8、測全部正確。在1936年將樣本增加到1000萬人,預測蘭登會大勝羅斯福,但結果是錯誤的。羅斯福當選了。 分析:分析: (1)原因在于抽樣框錯誤,沒有正確代表目標總體(所有選民),排除了沒有電話或汽車的人,在1936年,這部分選民占很高百分比,這個框架排除了近65%的總體元素和傾向于偏好羅斯福的低收入選民。 (2)前幾次預測正確的原因:高收入和低收入人群的投票對象沒有多大差異;另外在大恐慌之前,較多的低收入者可能也買得起電話和汽車。 “好的抽樣框是達到好的抽樣的關鍵。抽樣框與概念所界定的總體之間不吻合,可能是偏差的主要來源。正如變量的理論定義和操作定義之間的不匹配,會產(chǎn)生缺乏效度的測量,抽樣框和

9、總體之間的不匹配也會產(chǎn)生無效的抽樣。研究者要盡力減少這種不匹配的情況”(紐曼2007:274)。 4. 參數(shù)值和統(tǒng)計值參數(shù)值和統(tǒng)計值 (1)參數(shù)值(parametre),也稱總體值,關于總體中某一變量的綜合描述,或者是,總體中所有元素的某種特征(變量)的綜合數(shù)量表現(xiàn)。在統(tǒng)計中最常見的就是某一變量的平均值,如某市待業(yè)青年的平均年齡。 (2)統(tǒng)計值(statistic),也稱樣本值。關于樣本中某一變量的綜合描述?;蛘呤牵瑯颖局兴性氐哪撤N特征(變量)的綜合數(shù)量表現(xiàn)。 樣本值是從樣本的所有元素中計算出來的,對于相應的總體來說,這只是一個估量值。 5. 抽樣分布:抽樣分布:從一個總體中不斷抽取樣本時

10、,各種可能出現(xiàn)的樣本統(tǒng)計值的分布情況。它是一種根據(jù)概率原則而成立的理性分布。三、如何抽樣:(一)非概率抽樣三、如何抽樣:(一)非概率抽樣 非概率抽樣不是按照等概率原則,而是按照人們的主觀經(jīng)驗或其他條件來抽取樣本。常常只在定性研究中使用。常見的幾種方法如下。 (一)偶遇抽樣(一)偶遇抽樣(accidental sampling ) 又稱方便抽樣或自然抽樣。研究者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為對象,或僅僅選擇那些離得近、最容易找到的人作為對象。 (二)定額抽樣(二)定額抽樣(quota sampling) 又稱作配額抽樣。又稱作配額抽樣。 1、研究者對總體進行分類,然后決定在每

11、一個類別、研究者對總體進行分類,然后決定在每一個類別中抽取的人數(shù)。中抽取的人數(shù)。 2、可以保證樣本具有總體的某些差異。、可以保證樣本具有總體的某些差異。 (三)判斷抽樣(三)判斷抽樣(judgemental sampling) 又稱立意抽樣(purposive sampling),研究者根據(jù)自己的研究目標和主觀分析來選擇和確定研究對象的方法。 這種方法帶有很大的主觀性,其結果如何,往往與研究者的理論修養(yǎng)、實際經(jīng)驗以及對對象的熟悉程度有很大關系。 “它借助專家的判斷來選擇個案,或者以心中特定的目的來選擇個案”(紐曼2007:269)。 1、使用它選擇特別能提供信息的獨特個案。 2、研究者可能使用

12、立意抽樣來選取很難接近的特殊總體中的成員。 3、研究者確認特殊個案類型,以便進行深入探究。 (四)滾雪球抽樣(四)滾雪球抽樣(snowball sampling) 當我們無法了解總體的情況時,可先調查總體中的少數(shù)成員,向他們詢問他們還知道哪些符合條件的人;再去調查那些人,并詢問他們還知道哪些人符合條件。(風笑天2009:148) “社會研究者常對相互關聯(lián)的人或者組織網(wǎng)絡感興趣。這種網(wǎng)絡可以是全世界探討相同問題的科學家、在一個中等規(guī)模城市中的精英分子、從事組織化犯罪的家庭的成員、出任重要銀行和企業(yè)董事會的董事或在大學校園中彼此有性關系的人。其中的關鍵特征是每一個人或單位都和其他部分通過直接或間接

13、的聯(lián)系而聯(lián)結起來。這并不意味著網(wǎng)絡中每一個人會彼此直接認識、相互交往或是受對方的影響。相反的,這意味著,大部分的人和事物都會因直接或間接的關系,置身于一個具有相互關聯(lián)的網(wǎng)絡中”(紐曼2007:270)。 (五)異常個案抽樣(五)異常個案抽樣 “當研究者搜尋與主導模式不同,或與其他個案主要特征不同的個案時,會采用異常個案抽樣法(也稱為極端個案抽樣法)。與立意抽樣類似,研究者使用多種技術來確定具有某種特征的個案。而異常個案抽樣與立意抽樣不同之處在于,其目的是確定一個不平常、有差異或特殊的個案集合,并不要求它代表總體。之所以選中某些異常個案,是因為它們是不平常的,研究者希望通過考察那些落在一般模式之

14、外的個案,或者說包含超出主流事件的東西,更多地了解社會生活?!保~曼2007:271) (六)理論抽樣(六)理論抽樣“當研究者發(fā)展出扎根理論時,他會采用理論抽樣,仔細地選擇樣本(例如,人群、局面、時間、時間段等)。不斷增長的理論興趣引導個不斷增長的理論興趣引導個案的選取。研究者根據(jù)對個案特點新的理解來選案的選取。研究者根據(jù)對個案特點新的理解來選取個案。取個案。例如,實地研究者也許會在周末觀察某個場景和一群人。理論上,它也許會問在其他時間、場景的其他方面改變后,人們的行為是否相同。于是研究者可能會在其他時間段(例如,夜晚和周末)進行抽樣以獲取更豐富的圖像,了解重要的條件是否相同?!保~曼2007

15、:272) 案例:關于微博現(xiàn)象的考察。II 如何抽樣(二):概率抽樣如何抽樣(二):概率抽樣(probobility sampling) (一)定義(一)定義 1. 概率抽樣:以數(shù)學上的概率理論為基礎,按隨機原則進行抽樣。 2. 隨機(random) “隨機一詞在數(shù)學上有其特殊的意義,它指的是產(chǎn)生一種數(shù)學上所謂隨機結果的過程。這就是說,選擇過程講求的是真正隨機的方法,而且研究者能夠計算出結果出現(xiàn)的概率。在真正的隨機歷程中,每一個元素都有同等大小被選取的概率”(紐曼2007:275)。 3. 案例討論:美國雜志文學摘要曾在1920年、1924年、1928年和1932年在美國總統(tǒng)選舉的時候,從車主

16、登記簿和電話簿挑選樣本寄送明信片調查選舉意向,被調查者把投票意向寄回,這四次預測全部正確。在1936年將樣本增加到1000萬人,預測蘭登會大勝羅斯福,但結果是錯誤的。羅斯福當選了。 分析:分析: (1)抽樣框錯誤)抽樣框錯誤的原因,沒有正確代表目標總體(所有選民),排除了沒有電話或汽車的人,在1936年,這部分選民占很高百分比,這個框架排除了近65%的總體元素和傾向于偏好羅斯福的低收入選民。 (2)前幾次預測正確的原因:高收入和低收入人群的投票對象沒有多大差異;另外在大恐慌之前,較多的低收入者可能也買得起電話和汽車。 4. 抽樣分布:從一個總體中不斷抽取樣本時,各種可能出現(xiàn)的樣本統(tǒng)計值的分布情

17、況。它是一種根據(jù)概率原則而成立的理性分布。 (二)概率抽樣的一般程序(二)概率抽樣的一般程序 1. 界定總體:在抽樣前,對總體的范圍與界限做明確的界定。 2. 制定抽樣框:收集全部抽樣單位的名單,并對名單統(tǒng)一編號。 3. 決定抽樣方案:決定具體采用哪種抽樣方法。 4. 實際抽取樣本:到實地抽取樣本。 5. 評估樣本質量:根據(jù)研究者的抽樣設計和抽樣實施過程的質量進行評估。通常用比較法比較法:將可得到的反應總體中某些重要特征及其分布的資料,與樣本中的同類指標的資料進行對比。若二者之見差別小,則樣本的質量較高;反之,則樣本的質量較低。案例見風笑天2009:127. (三)抽樣設計的原則:(三)抽樣設

18、計的原則: 1. 目的性原則。設計抽樣方案時,要從所研究的問題、最有利于研究資料的獲取、以及最符合研究目的等因素出發(fā)。 2. 可測性原則:能從樣本自身計算出有效的估計值。 3. 可行性原則:抽樣方案必須在實際中切實可行。 4. 經(jīng)濟性原則:抽樣方案要與可得資源相適應。 1. 簡單隨機抽樣(簡單隨機抽樣(simple random sampling)又稱純隨機抽樣。)又稱純隨機抽樣。 按等概率原則直接從含有N個元素的總體中隨機抽取n個元素,以此來組成樣本,其中Nn。這類似于抽簽。 (1)最簡單的隨機樣本,同時也是其它類型模仿的對象。 (2)發(fā)展一個準確的抽樣框,對抽樣框內部的所有元素編號,根據(jù)數(shù)

19、學隨機數(shù)從抽樣框中選取元素。 中央極限定理:“隨著抽樣分布中不同的隨機樣本組數(shù)的不斷增加,直至無限大時,樣本的模式和總體參數(shù)將變得越來越可預測。在很多組隨機樣本下,抽樣分布會呈現(xiàn)出一條常態(tài)曲線,而且這個曲線的中點,隨著抽出的樣本組數(shù)的增加,就會趨近總體的參數(shù)”(紐曼2007:278)。 “隨機抽樣并不保證每一組隨機樣本都能完美地代表總體。相反的,它是指大部分的隨機樣本在大多數(shù)的情況下,都相當接近總體;因而可以計算出某組特定樣本不準確的概率。研究者利用從這組樣本得到的信息估計抽樣分布,進而估計這組樣本偏離或不代表總體的機會(即抽樣誤差的大?。?。同時,他把這些信息與中央極限定理的知識結合起來構造置

20、信區(qū)間”(紐曼2007:279)。 2. 系統(tǒng)抽樣(系統(tǒng)抽樣(systematic sampling)又)又稱等距抽樣或機械抽樣。稱等距抽樣或機械抽樣。 把總體中的單位進行編號后,再計算出某種間隔,然后按這一固定間隔抽取個體的號碼,以此來組成樣本。 K(抽樣間距)= N(總體規(guī)模)/n(樣本規(guī)模) 優(yōu)點:比簡單隨機抽樣簡便易行。 (1)對抽樣框中的每一個元素編號。 (2)計算抽樣間距,間距成為準隨機的抽取方法。 3. 分層抽樣(分層抽樣(stratified sampling)又稱類型抽樣。)又稱類型抽樣。 先將總體中的所有單位按某種特征劃分成若干類型或層次,然后再每一個層次中用簡單隨機抽樣或

21、系統(tǒng)抽樣方法抽取一個子樣本,最后把這些子樣本合起來,以此構成總體的樣本。 (1)根據(jù)補充信息將總體分為若干個次總體(層)。 (2)將總體分層之后,從每一個次總體中選取隨機樣本(可采取簡單隨機抽樣或系統(tǒng)抽樣)。 (3)控制每一個層的相對大小,而不是任由隨機過程控制各層抽到的個數(shù),固定一組樣本中各層抽取的比例。 優(yōu)點:優(yōu)點: (1)在不增加樣本規(guī)模的情況下,降低抽樣誤差。 (2)便于理解總體內不同層次的情況,以及對總體中不同的層次進行單獨研究,或進行比較。 4. 整群抽樣(整群抽樣(cluster sampling):): 從總體中抽取一些小的群體,由這些群體的所有元素構成樣本。 與前面三種抽樣方

22、法最大的不同就在于,整群抽樣的抽樣單位不是單個的個體,而是成群的個體。 (1)為什么要采用整群抽樣? 1.1面對的是一個分散的總體,缺少一個理想的抽樣框。 1.2取得樣本的成本很昂貴。 (2)過程:第一階段隨機抽取較大的群,第二階段是在每個大群中隨機抽取小群,第三階段從被抽出的小群中再抽出元素。 優(yōu)點:簡便易行、節(jié)省費用。 缺點:樣本的分布面不廣、樣本對總體的代表性比較差。 5. 多段抽樣(多段抽樣(multistage sampling) 前提:元素之間具有隸屬關系或層次關系。并且,中每一個階段中,元素的規(guī)模是相同的。 方法:先從總體中隨機抽取若干大群(組),然后再從這幾個大群中抽取幾個小群

23、(組),這樣一層層抽下來,指導抽到最基本的元素為止。 6. 戶內抽樣(戶內抽樣(within-househlod sampling) 研究者以家庭為分析單位,以入戶訪談的方法收集資料。 戶內抽樣是從所抽中的每戶家庭中抽取一個成年人,以組成訪談對象的樣本。 7. PPS抽樣抽樣(sampling with probability to size) 原理:以階段性的不等概率換取最終的、總體的等概率。 方法見風笑天2009:143-144. III 樣本規(guī)模與抽樣誤差樣本規(guī)模與抽樣誤差 (一)樣本規(guī)模(一)樣本規(guī)模(sample size) 樣本規(guī)模:即樣本的容量,指樣本中所含的個案的數(shù)目。 大樣本

24、:大于30個個案。 小樣本:小于30個個案。 一般來說,社會研究中的樣本規(guī)模不能小于100個個案。 (二)抽樣誤差(二)抽樣誤差(sampling error) 1. 抽樣誤差:就是樣本統(tǒng)計值與總體參數(shù)值之間的偏差。 它是由抽樣本身的隨機性所引起的誤差。無論采用什么樣的抽樣方式,這種誤差都是不可避免的。但是,在樣本設計中也可事先進行一定程度的控制。 2. 度量誤差:是由記錄、填答、匯總等工作中所出現(xiàn)的誤差。IV 研究設計研究設計 一 具體方案(風笑天,2009,82頁) 從大的方面說,一項研究的具體方案應當包括以下幾個方面的內容:(風笑天2009:82-84) 1. 說明研究課題的目的和意義說

25、明研究課題的目的和意義 即包括對研究課題本身含義的理解,即該研究要探討什么問題和回答什么問題。 也包括研究課題組人們認識社會、改造社會中所具有的作用的理解。 2. 說明研究的內容說明研究的內容 研究內容是對研究目的的具體分解和細化,說明應該研究哪些對象。 這可為研究指標的選擇、問卷的設計打下就好基礎。 3. 說明研究的理論假設說明研究的理論假設 在解釋性研究的具體方案中,必須對所采用的理論假設作出明確陳述。 在探索性研究和描述性研究中,可以不做理論假設。 4. 說明研究的分析單位和抽樣方案說明研究的分析單位和抽樣方案 確定分析單位,可以避免層次謬誤和簡化論的錯誤。 在具體的抽樣方案中,需要說明: (1) 研究的總體是什么,即對研究對象所取自的總體做界定。 (2)采用什么樣的抽樣方法和程序進行抽樣。即是以某一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論