《調(diào)查研究方法》第五章抽樣調(diào)查類型_第1頁
《調(diào)查研究方法》第五章抽樣調(diào)查類型_第2頁
《調(diào)查研究方法》第五章抽樣調(diào)查類型_第3頁
《調(diào)查研究方法》第五章抽樣調(diào)查類型_第4頁
《調(diào)查研究方法》第五章抽樣調(diào)查類型_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章抽樣調(diào)查類型第一節(jié)抽樣調(diào)查中的關(guān)鍵概念第二節(jié)抽樣的一般程序第三節(jié)隨機抽樣的方法第四節(jié)

非隨機抽樣的方法第五節(jié)

在線調(diào)研抽樣第六節(jié)

非抽樣誤差和抽樣誤差第七節(jié)

確定樣本規(guī)模思考題第六節(jié)和第七節(jié)選學。對于低年級同學不做必學要求。抽樣調(diào)查是從調(diào)查對象的總體中抽取一部分單位組成樣本,將樣本作為調(diào)查對象開展調(diào)查活動,并根據(jù)樣本調(diào)查的結(jié)果來推斷總體特征的方法類型。抽樣調(diào)查屬于非全面調(diào)查,是隨著近代數(shù)學和計算機技術(shù)的發(fā)展而形成的一種方法類型。第一節(jié)抽樣調(diào)查中的關(guān)鍵概念一、隨機抽樣和非隨機抽樣(一)隨機抽樣的概念和特點

1.隨機抽樣,是遵循隨機原則,按照某種事先設計的程序,從總體中抽取部分單位的抽樣方法。概率抽樣又可分為等概率抽樣和不等概率抽樣兩種類型。2.隨機抽樣的主要特點調(diào)查對象是總體單位中的一部分,而不是全部,但也不是個別或少數(shù)幾個單位;樣本單位是按隨機原則抽取的,而不是按照調(diào)查者的主觀意愿進行選擇或確定的;抽樣調(diào)研的目的不僅僅是了解樣本本身的情況,而是要通過樣本來推斷總體、說明總體。(二)非隨機抽樣的概念和特點1.非隨機抽樣,是指抽樣時并不遵循隨機原則,而是依據(jù)研究者的主觀意愿、判斷、或方便與否來抽取調(diào)查對象的方法。2.非隨機抽樣的特點優(yōu)點:簡單、快捷、經(jīng)濟,不需要樣本框,就可以收集數(shù)據(jù),應用空間還是比較大的。局限:難以保證樣本的代表性,不能計算抽樣誤差,且容易產(chǎn)生較大的系統(tǒng)性誤差,因此,常常被用在研究的初期階段或者探索性研究上。如果樣本不夠大,就不能用樣本數(shù)據(jù)對總體情況進行推斷。如果樣本足夠大,那么非隨機抽樣數(shù)據(jù)也可以被用來推斷總體。二、目標總體和抽樣總體總體,是指所要調(diào)查研究對象的全體。目標總體,是指所要研究對象的全體,是由所有性質(zhì)相同的個體所組成的。組成總體的每個個體被稱作總體單位。抽樣總體,是指從中抽取樣本的總體。通常情況下,抽樣總體與目標總體應該是一致的,但是在實踐中可能出現(xiàn)兩者不一致的情況。三、總體參數(shù)和統(tǒng)計量(一)總體參數(shù)的概念和類型表達在統(tǒng)計學中,總體的特征被稱為參數(shù),也可以說,參數(shù)是總體的某個特征值,是總體的某個特征的數(shù)量表現(xiàn)。只要確定了總體的范圍,那么總體參數(shù)就客觀存在了??傮w參數(shù)值是數(shù)據(jù)的理論值,是唯一確定的,但是是未知的,需要通過抽樣調(diào)查的結(jié)果來對總體參數(shù)進行推斷。1.總體均值,也稱作總體平均數(shù)。2.總體總值,也稱作總體總量。3.總體比例,是指總體中具有某一特征的單位數(shù)量占總體數(shù)量的比例。4.總體比率,是指兩個不同總體的總量值或者均值的比。此部分知識在《統(tǒng)計學》中可以學到,此部分內(nèi)容在此簡單介紹。(二)統(tǒng)計量的概念和類型表達統(tǒng)計量,也叫估計量,是根據(jù)樣本中各單位的變量值計算出的一個量,用于對總體參數(shù)的估計。1.均值估計,用樣本均值作為總體均值的估計。2.總值估計,用樣本均值乘以總體單位數(shù)而得。3.比例估計,用樣本比例作為總體比例的估計。4.比率估計,用樣本比率作為總體比率的估計。四、抽樣框和樣本規(guī)模抽樣總體,也稱作抽樣框,是抽樣的范圍。具體來看,抽樣框可以是一份包含所有抽樣單位的名單,給每一個抽樣單位編上一個號碼,就可以按一定的隨機化程序進行抽樣。抽樣框可以是按照名錄排列的名錄框,可以是按照地域排列的地域框,當然也可以是將名錄和地域結(jié)合起來的樣本框。例如,我們在一個村莊進行農(nóng)戶抽樣時,抽樣框可以是全村的農(nóng)戶名單,可以是農(nóng)戶住宅的地理位置信息,也可以是農(nóng)戶名單與地理位置信息的結(jié)合。從抽樣框中抽取樣本的過程,被稱作抽樣。抽取的樣本是由從總體中隨機抽選出來進行調(diào)查的一部分單位組成的,是抽取的若干單位的集合。當從抽樣框中抽取樣本后,樣本中的每一個單位就被稱為樣本單位。樣本單位可以是一個農(nóng)戶、一位農(nóng)民、一個鄉(xiāng)鎮(zhèn)企業(yè),或一個學校等。例如,從某鄉(xiāng)5000個農(nóng)戶中抽取100個農(nóng)戶進行農(nóng)戶負擔狀況調(diào)查。在這里,5000個農(nóng)戶的綜合體即是“總體”,抽取出的100個農(nóng)戶為“樣本”,其中,被抽中的每一個農(nóng)戶即為一個“樣本單位”。總體單位數(shù)通常用N表示,樣本單位數(shù)通常用n表示。抽樣調(diào)查主要包括調(diào)查準備、抽樣選取調(diào)查對象(利用各種抽樣方法和技術(shù)抽取樣本單位)、進行調(diào)查(利用各種調(diào)查方法,包括實地觀察法、問卷調(diào)查法、訪談調(diào)查法等收集資料)、總結(jié)整理分析資料、最后形成調(diào)查研究報告等幾個主要的階段。其中,抽樣環(huán)節(jié)直接決定了調(diào)查研究的可行性和調(diào)查數(shù)據(jù)的質(zhì)量。第二節(jié)抽樣的一般程序一、界定目標總體和抽樣總體二、確定和編制樣本框當抽樣分成幾個階段、在不同的抽樣層次上進行時,需要分別編制幾個不同的抽樣框。抽樣框是計算樣本單位入樣概率的依據(jù)。三、設計抽樣方案關(guān)鍵點:確定抽樣類型和方法。四、落實抽樣方案五、評估樣本質(zhì)量第三節(jié)隨機抽樣的方法一、簡單隨機抽樣簡單隨機抽樣(simplerandomsampling),又稱為純隨機抽樣,即對總體單位不進行任何處理,僅按隨機原則直接從總體中抽取樣本。調(diào)查總體中的任何單位都有同樣被抽取的機會。(一)簡單隨機抽樣的方法1.直接抽選法直接抽選法就是直接從調(diào)查總體中隨機抽取樣本單位的方法。俗話說,“閉著眼睛摸一個”,就是這種方法的生動展現(xiàn)。例如,我們打算調(diào)查食品標簽標識是否規(guī)范,就可以直接從貨架、攤位上抽取商品。2.抽簽法抽簽法就是先將總體的每個單位編上序號,將號碼寫在紙片上捏成團,做成簽,摻和均勻后,再從中隨機抽選,一直到抽滿預先設計的樣本量為止。3.隨機數(shù)表法,又叫做亂數(shù)表抽樣法。具體做法是:首先把調(diào)查總體中的所有單位加以編號,根據(jù)編號的最大位數(shù)確定使用隨機數(shù)表中若干列或行數(shù)字的欄數(shù),以組成需要的抽樣數(shù)字;然后以任意組成的行或列的任意一個數(shù)字開始,向任何方向數(shù)過去;碰上屬于總體單位編號范圍內(nèi)的數(shù)字號碼,就摘錄下來,作為樣本單位。如果不屬于總體單位編號范圍內(nèi)的數(shù)字號碼,就越過去;如果是不重復抽樣,那么碰到重復的數(shù)字就跳過去。抽樣一直持續(xù)到抽足預定的樣本數(shù)量為止。例1:從50個總體單位中抽取5個樣本。抽樣步驟:第一步,將總體單位按01~50編號,編號最大的數(shù)50是一個兩位數(shù),故取兩位數(shù)為抽取單位;第二步,在隨機數(shù)表中任意取定兩列,然后從任一數(shù)字開始,由上而下,或由左至右,抽取50范圍內(nèi)的數(shù)字作為樣本。這里隨機選取數(shù)字表中的第5、6列,然后以07為起點,由上而下,抽取的樣本為07、38、40、28、50;或者由左至右,抽取的樣本為07,45,44,17,16。4.計算機抽取法計算機抽取法是指利用計算機生成符合總體單位編碼要求的隨機數(shù),將其作為抽取樣本單位的方法。這種方法適用于抽取的樣本規(guī)模比較大的情況。具體過程是:將總體(抽樣框)中的所有單位進行唯一編碼;然后利用MicrosoftExcel中的隨機數(shù)生成函數(shù),計算機可以很容易地、快速地生成一列或一行、多列或多行的隨機數(shù);調(diào)研人員將生成的隨機數(shù)與總體單位的編碼進行匹配,按照樣本規(guī)模要求,選擇足夠數(shù)量的隨機數(shù),就可以形成一個樣本。如果有重復的隨機數(shù),則直接跳過,不再選用。(二)對簡單隨機抽樣方法的評價簡單隨機抽樣是一種最基本的概率抽樣方法,是其他抽樣方法的基礎(chǔ)。此法的優(yōu)點是符合隨機原則,簡單易行,只要有總體單位的名冊和登記表就行了,但其只適用于總體單位數(shù)量不多且分布較均勻的調(diào)查總體,否則無法保證樣本的代表性。二、等距抽樣等距抽樣(systematicsampling),又稱機械抽樣或系統(tǒng)抽樣,即把總體中所有單位按某一標志排列,然后依固定順序和相等的間隔來抽取調(diào)查樣本的調(diào)查方式。(一)等距抽樣的步驟1.把總體單位按一定順序排列。這個排列可以是完全隨機的,可以按抽樣框原有的順序,也可以按一定的標志排列,如按姓氏筆劃、時間先后、地理位置等排序。2.確定抽樣間隔。計算公式為總體規(guī)模(N)除以樣本規(guī)模(n),即可得出抽樣間距(k)。如果總體規(guī)模N不是樣本規(guī)模n的整數(shù)倍,也就是說,當K不是整數(shù)時,處理的方法如下:循環(huán)等距抽樣;調(diào)整直線等距抽樣參見課本56-57頁。拓展知識,了解3.選擇隨機起點(r)。在第一個抽樣間隔(1—k)內(nèi),隨機抽取一個單位作為第一個樣本單位。第一個樣本單位的抽取原則完全是隨機的。4.以第一個樣本單位(r)為起點,每隔固定間距(k)抽取一個樣本,直到抽取完最后一個樣本為止。例題:采取等距抽樣的方法,從某鄉(xiāng)2000個農(nóng)戶中抽取100戶調(diào)查家庭收入狀況。抽取樣本的具體步驟為:首先,將2000個農(nóng)戶按一定標志(如按行政村或自然村位置)加以排列,編上0001~2000的序號;然后,用總體單位數(shù)除以樣本單位數(shù)求出抽樣間距,即2000÷100=20,并在第一個抽樣間距1~20號內(nèi),隨機抽取一個單位作為第一個樣本單位,假定是11;最后,依據(jù)間距大小依次確定樣本單位,即31,51,71,…直到抽取完第50個樣本單位為止。(二)對等距抽樣方法的評價優(yōu)點:抽取的樣本單位在總體中的分布比較均勻,與簡單隨機抽樣相比,代表性比較好;簡便易行。局限:調(diào)查總體的單位不能太多,否則對總體單位進行編號的工作量非常大;同時,等距抽樣需要有調(diào)查總體單位的完整的登記冊,否則就難以進行操作。三、類型抽樣類型抽樣(stratifiedsampling),又稱為分層隨機抽樣,即將總體的所有單位按其屬性或特征等分類標準,將其劃分成各種類型或若干層次,然后按隨機原則從各類型中抽取樣本。(一)類型抽樣的步驟1.按照某一種或幾種特征對總體單位進行分層。之所以進行分層或分類,主要是因為要把總體單位中性質(zhì)相近的單位分在一起,使按照某類性質(zhì)劃分的每一類或每一層內(nèi)的單位的差異盡可能地小,而類與類之間、層與層之間的差異盡可能地大,這樣分類或分層抽取的子樣本對每一類或每一層的代表性就更強,子樣本的集合對調(diào)查總體的代表性也就會更強。2.確定各層次中抽取樣本的數(shù)量。等比例分層抽樣,是指各層樣本單位數(shù)占樣本總單位數(shù)的比例與各層單位數(shù)占總體單位數(shù)的比例相同,即各層樣本單位數(shù)/樣本總單位數(shù)=各層單位數(shù)/總體單位數(shù)。非等比例分層抽樣,是指各層樣本單位數(shù)占樣本單位總數(shù)的比例與各層單位數(shù)占總體單位數(shù)的比例不相同。3.抽取樣本。例題:參見課本第58頁和第59頁(二)對類型抽樣方法的評價適用于:總體單位數(shù)量多,且各單位間差異性大的調(diào)查對象。優(yōu)點:由于分層,同一層次中每個單位間的差異較小,并且各種類型的情況都能包括在所抽取的樣本中。保證抽取的樣本中包含具有各種特征的抽樣單元,樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)特征相近,不僅可以對各類型的目標量進行估計,而且還可以進一步估計總體參數(shù),而且分層后,各層間的差異不再影響抽樣的誤差,樣本代表性比較高。同時,便于組織實施。局限:調(diào)查者必須對總體各單位的情況有較多的了解,否則便無法進行恰當?shù)姆诸悺K?、整群抽樣整群抽?clustersampling),又稱聚類抽樣、分群抽樣,它先將總體各單位按一定標準分成許多子群體或集體,然后以子群體為抽取樣本的單位,運用隨機抽樣的辦法(如簡單隨機抽樣、等距抽樣、分層抽樣等)從中抽取若干子群,對抽中的子群體內(nèi)所有單位進行全面調(diào)查。(一)整群抽樣的步驟1.將整體分群。2.以群為單位隨機抽取樣本。3.對抽中的子群內(nèi)的所有單位進行全面調(diào)查。(二)對整群抽樣方法的評價優(yōu)點:只需要編制以群為單位的樣本框,這簡化了樣本框的編制工作,進而調(diào)查工作便于組織,調(diào)查樣本容易抽取,可達到節(jié)省人財物力的目的。在抽樣面較廣、設計層次較多、對總體情況又不太了解的情況下,使用這一方法較簡便。局限:雖然我們在分群的時候盡量要求群體內(nèi)部的各單位的差異性要盡可能大些,但是群內(nèi)的各單位之間或多或少存在著相似性,因此樣本的代表性和精確性會差些。與其他抽樣方法相比,在樣本量相同時,整群抽樣的誤差較大。當然,為了提高精度,可以采用增加基本調(diào)查單位數(shù)量的做法。五、分段抽樣又稱為多階段抽樣,即把從調(diào)查總體中抽取樣本的過程分成兩個或幾個階段來進行。它是在整群抽樣的基礎(chǔ)上發(fā)展起來的。(一)多階段抽樣的步驟1.將調(diào)查總體各單位按一定標準分成若干集體,作為抽樣的第一級單位;2.從被抽取的第一級單位中,再抽取第二級單位;3.從被抽取的第二級單位中,再抽取第三級單位,依次類推,再抽取第四級、第五級等單位;4.一直抽取到所有需要的樣本,并對中選樣本群體內(nèi)的全部單位進行調(diào)查。(二)對分段抽樣方法的評價優(yōu)點:可以把各種抽樣方法的優(yōu)點綜合起來加以利用,用于研究總體單位多、分布面廣、且單位之間差異性大的情況。局限:每段抽樣都可能產(chǎn)生誤差,因此,經(jīng)過多階段抽樣得到的樣本誤差也相應會增大。六、對隨機抽樣方法的評價優(yōu)點:樣本具有較強的代表性和客觀性,因為樣本一般是按隨機原則抽取的;推斷總體比較準確,適宜對總體做定量研究,因為調(diào)研結(jié)論是運用數(shù)學方法計算得出的;與普查比較,抽樣調(diào)查花費少,速度快,因為調(diào)查是針對總體中的少量樣本單位進行的。局限:抽樣調(diào)查中有嚴格的抽樣技術(shù)要求,且涉及較多的數(shù)學知識、統(tǒng)計知識、計算機知識等,使缺乏這方面知識的人應用起來非常困難,同時,與典型調(diào)查、個別調(diào)查相比,抽樣調(diào)查涉及的調(diào)查對象數(shù)量多,因此其調(diào)查內(nèi)容的深度和廣度受到一定的局限。第四節(jié)非隨機抽樣的方法非隨機抽樣,是根據(jù)研究者的意愿、判斷或方便程度等條件來選取樣本的方法。非隨機抽樣具有很強的主觀性,抽取的樣本單位很難確定抽樣概率,因此,也被稱作非概率抽樣。常用的非概率抽樣方法有:偶遇抽樣、判斷抽樣、定額抽樣、滾雪球抽樣等。一、偶遇抽樣又稱為任意抽樣、方便抽樣,是調(diào)研人員憑借偶然的機會或方便的條件,任意地來抽選樣本。例如,我們深入農(nóng)村調(diào)查時,經(jīng)常是在田間、地頭、馬路等處,隨便選擇一些農(nóng)民作為調(diào)查的對象進行調(diào)查。該抽樣方法簡便易行,省時省錢,但樣本的代表性差,有很大的偶然性。二、判斷抽樣又稱立意抽樣、目的抽樣,是調(diào)查者根據(jù)自己的主觀判斷來抽選樣本。樣本的代表性取決于調(diào)查者對總體的了解程度和判斷能力。判斷抽樣主要適用于兩種情況:(1)調(diào)查總體范圍較小,總體各單位之間差異較小,或由于調(diào)查時間、設備的限制而無法進行隨機抽樣的情況;(2)用于探索性研究。例如,為了設計調(diào)查問卷,檢驗問卷題條的設計是否得當,而采用判斷抽樣的方法進行研究探索。三、定額抽樣又稱為配額抽樣,與分層抽樣相似之處是,先將總體中的所有單位按其屬性或特征,以一定的分類標準劃分為若干層次或類型,然后在各層中抽樣。與分層抽樣不同的是,在抽樣時,并不遵循隨機原則,而是由調(diào)查者主觀確定各層中抽取的樣本,只需在各層中抽取樣本時保持適當比例。定額抽樣簡單易行,快速靈活,在民意調(diào)查或市場調(diào)查中經(jīng)常使用。四、滾雪球抽樣先從總體中的少數(shù)幾個成員入手調(diào)查,然后通過對他們的調(diào)查,得到更多的適合調(diào)查的對象或單位,從而進一步擴大調(diào)查范圍的方法。依此調(diào)查下去,就如同滾雪球一樣,我們可以找到越來越多具有相同性質(zhì)的群體成員;如果總體不大,有時會達到近似飽和狀況,后面訪問的人再介紹的調(diào)查對象可能都是以往已經(jīng)調(diào)查過的。五、自愿抽樣指調(diào)查對象自愿參加,成為樣本中的一份子,向調(diào)查人員提供信息。例如,我們在做農(nóng)村地區(qū)某一重大疾病的防控調(diào)查時,由于預先不知道哪些人患有該疾病,抽樣總體是未知的,無法開展調(diào)查活動,這時就可以通過募集志愿者的方式獲取自愿樣本,以完成該項調(diào)查。第五節(jié)在線調(diào)研抽樣在線調(diào)研是在互聯(lián)網(wǎng)上獲取調(diào)查樣本,并完成調(diào)查問卷填寫的一種調(diào)研類型。因為填寫線上問卷調(diào)查的對象來源不同,所以線上調(diào)研樣本的生成可以有多種路徑。在線調(diào)研抽樣適用于產(chǎn)品需求、消費者滿意度等主題的市場調(diào)研究需要。在線調(diào)研樣本選擇可以采取從在線樣本庫中隨機抽樣和從在線調(diào)查平臺上非隨機抽樣兩種方法。一、從在線樣本庫中隨機抽樣在線樣本庫的隨機抽樣是指采取隨機原則從在線樣本庫中抽取樣本。在線樣本庫包括在線客戶名單數(shù)據(jù)庫、電子郵件列表清單、在線企業(yè)名錄、在線電話名錄等等。從在線樣本庫中抽取樣本,可以把抽樣時間段內(nèi)的樣本庫看作是一個抽樣框,從中隨機抽取在線調(diào)查對象。這個抽樣過程研究人員或者樣本需求方是看不見的,但這個抽樣獲得的樣本數(shù)據(jù)應該是對此階段抽樣框總體具有代表性的。研究人員可以委托擁有在線樣本庫的互聯(lián)網(wǎng)公司、調(diào)查公司或服務商提供樣本抽取和調(diào)查服務,購買一個用于分析的樣本數(shù)據(jù)?;诖?,調(diào)研人員作為需求方需要向供給方支付一定的費用,支付標準以調(diào)研人員對抽樣的嚴格程度、樣本規(guī)模大小等雙方商定。當然,研究人員在付費購買高質(zhì)量樣本數(shù)據(jù)的同時,也有權(quán)利要求樣本數(shù)據(jù)供給方提供如下信息:樣本單位是如何抽選的?樣本庫的規(guī)模有多大?樣本庫成員是如何被招募的?如何控制的樣本數(shù)據(jù)質(zhì)量?在線樣本庫一般是由專業(yè)互聯(lián)網(wǎng)公司投資進行建設和維護的。他們會在互聯(lián)網(wǎng)上招募愿意參與在線市場調(diào)查的人員,構(gòu)建在線樣本庫;并且依據(jù)加入樣本庫時個人提供的年齡、性別、學歷、家庭規(guī)模、工作行業(yè)、生活方式、居住地址等多方面的信息,互聯(lián)網(wǎng)公司還可以構(gòu)建基于不同特征的在線樣本組,這樣尋找調(diào)查對象時容易找到符合研究人員(數(shù)據(jù)需求方)要求的人選。[趙國棟,黃永中.網(wǎng)絡調(diào)查研究方法概論.北京:北京大學出版社,2008:112-118.]在線樣本庫中成員的招募有開放式招募和封閉式招募兩種方式。開放式在線樣本庫招募的環(huán)境寬松,只要能夠上網(wǎng)、并且愿意接受調(diào)查的人,都可以選擇加入。通過這種方式招募成員的好處是可以快速建立起一個在線樣本庫。但是,也存在樣本庫中成員質(zhì)量出參差不齊的情況。特別是在線市場調(diào)查中職業(yè)問卷填答者的出現(xiàn),他們加入各種線上樣本庫,填寫各類問卷,從而獲得各種獎勵。封閉式招募的在線樣本庫的成員是應邀參加的,一般只允許具有某一特征的人或者提前得到驗證的人才可以加入樣本庫。這種招募方式下,提供在線樣本庫的互聯(lián)網(wǎng)公司或服務商通常會與大公司、大品牌、特定行業(yè)企業(yè)建立合作關(guān)系,向他們的客戶發(fā)送邀請,建立起具有某種特征、能夠服務與某種具體需求的在線樣本庫。因為市場上的企業(yè)分布行業(yè)廣泛、類型多樣,所以構(gòu)建多個在線樣本庫需要市場調(diào)研服務平臺與企業(yè)進行溝通,從而花費比較多的時間和精力。封閉式招募成員的好處是在線樣本庫提供商的服務對研究人員來講更珍貴,樣本數(shù)據(jù)的代表性相對較好,也可以大大減少職業(yè)問卷填答者帶來的問題。在線調(diào)查的問卷回答率并不高,有效回答的比率可能更低。因此,在線問卷調(diào)查中,給予問卷回答者以激勵是鼓勵在線樣本庫中的成員參與在線調(diào)研的一種手段。通常參與在線調(diào)研可以從中獲得現(xiàn)金、代金券、積分換購、抽獎等多種獎勵,這也是出現(xiàn)職業(yè)問卷填答者的主要原因。除了構(gòu)建在線樣本庫、積極鼓勵成員參與調(diào)研,在線樣本庫的供給方也必須持續(xù)地加強對在線樣本庫成員的管理,控制好成員參與問卷調(diào)查的次數(shù)、保護好成員的個人隱私和信息、及時更新成員信息、保持在線樣本庫的規(guī)模等等。二、從在線調(diào)查平臺上非隨機抽樣因為調(diào)查成本低和便利性等原因,很多研究人員經(jīng)常采用在線調(diào)查平臺提供的免費在線調(diào)查服務。這種情況下,樣本選取沒有抽樣框,回收問卷的數(shù)量依賴于填答者的網(wǎng)絡偶遇,或者調(diào)查人員的運氣,屬于非隨機在線抽樣。這樣的抽樣沒有代表性,適用于試調(diào)查或者僅限于對收集的資料進行描述。比如,利用免費的問卷星進行網(wǎng)絡問卷調(diào)查、或者利用微信朋友圈或者互聯(lián)網(wǎng)論壇發(fā)放問卷等方式,均屬于非隨機在線抽樣調(diào)查。第六節(jié)非抽樣誤差和抽樣誤差一、非抽樣誤差非抽樣誤差是指在抽樣誤差之外,由其他原因引起的樣本統(tǒng)計量與總體真值之間的差異。任何由調(diào)查者帶來的概念性、邏輯性錯誤以及被訪者不回答或者回答錯誤等原因都是引起誤差的原因,需要盡量避免。具體來看有以下幾個方面需要關(guān)注:一是抽樣框誤差。二是受訪者無回答誤差。三是調(diào)查人員誤差。四是其他誤差。非抽樣誤差成因復雜,難以進行計量,且樣本量越大,非抽樣誤差出現(xiàn)的可能性越大,所以從調(diào)查設計、調(diào)查方法、測量工具、數(shù)據(jù)采集和錄入等全過程,都必須進行精心設計和實施。二、抽樣誤差(一)幾個概念抽樣誤差不是指個體誤差,是指抽樣平均誤差。個體誤差是指一個樣本指標與總體指標之間的離差。抽樣誤差是指多個樣本單位誤差的平均數(shù),被稱為抽樣平均誤差,可以用來測定抽樣指標與總體指標的離差的平均數(shù),是所有樣本平均值的標準差。在統(tǒng)計學中,抽樣平均誤差也被稱作“標準誤”。它反映了樣本統(tǒng)計量與相應總體參數(shù)的平均誤差程度,表示用樣本統(tǒng)計量推斷總體的精準程度。抽樣誤差是由抽樣的隨機性引起的,是用樣本統(tǒng)計量估計總體參數(shù)時出現(xiàn)的誤差。當從總體中隨機抽取樣本時,待選樣本很多,從中選出任何一個樣本都是隨機的,而抽到不同的樣本,對總體的估計就會不同,這就是抽樣誤差產(chǎn)生的原因。(二)抽樣誤差的計算方法1.抽樣平均數(shù)的抽樣平均誤差計算公式重復抽樣下:不重復抽樣下:當總體單位數(shù)很大時,接近于,可用代替,則可將上面的公式簡化為:2.抽樣成數(shù)的抽樣平均誤差計算公式重復抽樣下:不重復抽樣下:當總體單位數(shù)很大時,接近于,可用代替,則可將上面的公式簡化為:(三)影響抽樣誤差的因素在概率抽樣中,抽樣誤差主要與以下因素有關(guān):一是抽樣誤差與總體各單位標志值的差異有關(guān)。差異越大,意味著總體方差越大,抽樣誤差也就越大;反之,抽樣誤差就比較小。二是抽樣誤差與抽取的樣本規(guī)模有關(guān)。隨機抽取的樣本規(guī)模越大,精確度越高,抽樣誤差相對就越小,普查就是一種極端地把所有單位都抽取出來的進行調(diào)查的方式,樣本規(guī)模最大,誤差也是最小的;反之,抽樣誤差就比較大。三是抽樣誤差與抽樣方法和估計方法有關(guān)。與簡單隨機抽樣相比,同樣的總體下、面對相同的抽樣規(guī)模要求,抽樣方法上人們會選擇分層抽樣,因為分層抽樣具有顯著的統(tǒng)計效果,分層抽樣的估計精確性高于簡單隨機抽樣;但是整群抽樣的抽樣誤差比簡單隨機抽樣的抽樣誤差就要大一些。三、極限抽樣誤差(一)極限抽樣誤差的概念極限抽樣誤差是控制在一定范圍的抽樣平均誤差。抽樣誤差可以在調(diào)查前根據(jù)調(diào)查樣本數(shù)量和總體中各單位之間的差異程度進行計算,并控制在允許的范圍內(nèi)。根據(jù)概率原理,以一定的可靠程度保證抽樣誤差不超過某一給定的范圍,統(tǒng)計上把這個給定的范圍稱作極限抽樣誤差??梢?,極限抽樣誤差是用一定倍數(shù)的抽樣平均誤差(標準誤)來表示的。倍數(shù)t在統(tǒng)計學中也稱作“概率度”。(二)極限抽樣誤差的計算公式根據(jù)前述的抽樣平均誤差和極限抽樣誤差的計算公式,可得樣本平均數(shù)和樣本成數(shù)的極限抽樣誤差計算公式為:(三)區(qū)間估計方法通過計算極限抽樣誤差,我們可以根據(jù)樣本指標和樣本指標可允許變動的上限或下限來估計推算總體指標的可能范圍,即進行區(qū)間估計。根據(jù)如上的公式可知,在總體平均數(shù)和總體成數(shù)、平均數(shù)標準差和成數(shù)標準差都定下來的情況,倍數(shù)t影響總體均值的分布區(qū)間。根據(jù)中心極限定理,對于任何總體,不論其分布如何,隨著樣本容量增加,抽樣平均數(shù)和抽樣比例的分布(抽樣分布)趨近于正態(tài)分布。正態(tài)分布的形狀由平均數(shù)和標準差決定,并且以平均數(shù)對稱,呈鐘型;正態(tài)曲線下方面積等于1,表明它包括了所有的觀測值。根據(jù)上述公式可以看出,極限抽樣誤差(精確度)與樣本規(guī)模有關(guān)系。樣本容量越大,精確度越高,抽樣誤差越??;但是,隨著樣本規(guī)模增加,抽樣誤差下降得越來越慢,也就是說,樣本規(guī)模的等量增加并不能帶來精確度的等量增加。第七節(jié)確定樣本規(guī)模一、簡單隨機抽樣下的樣本規(guī)模推算(一)按照平均數(shù)的極限抽樣誤差公式推算樣本規(guī)模n例如,某奶業(yè)企業(yè)擬從抽樣總體N為20000的消費者名單中抽取樣本,對消費者每月奶制品的消費支出情況進行調(diào)查研究。管理者對調(diào)查精確度的要求是控制消費支出的估計值與實際值的差異為為元;總體消費者月均奶制品支出平均數(shù)標準誤的倍數(shù)為1.96(或者說置信度為95%);根據(jù)以往經(jīng)驗,確定消費者奶制品月消費支出的標準差為10.5元。根據(jù)以上條件,計算抽取的樣本規(guī)模。重復抽樣下,計算的樣本規(guī)模為:不重復抽樣下,計算的樣本規(guī)模為:(二)按照成數(shù)的極限抽樣誤差公式推算樣本規(guī)模n例如,某奶業(yè)企業(yè)擬從抽樣總體N為20000的消費者名單中抽取樣本,對消費者是否購買本企業(yè)奶制品的情況進行調(diào)查研究。管理者預期50%(P)的人會購買企業(yè)的奶制品;對調(diào)查精確度的要求是控制極限抽樣誤差在以內(nèi);假定成數(shù)標準誤的倍數(shù)分別為1.96和2.58(或者說置信度分別是95%和99%)。根據(jù)以上條件,計算抽取的樣本規(guī)模。當

時,重復抽樣下,樣本規(guī)模為:不重復抽樣下,樣本規(guī)模為:當

時,重復抽樣下,樣本規(guī)模為:不重復抽樣下,樣本規(guī)模為:通過以上公式可以發(fā)現(xiàn),影響樣本規(guī)模的因素主要有抽樣的精確度、總體方差、極限抽樣誤差、置信度、抽樣方式和方法等。上述例子也表明,置信度越大,精確性越高,需要抽取的樣本規(guī)模也越大。在實際的調(diào)研活動中,有時候很難完全按照公式來計算樣本規(guī)模,依據(jù)經(jīng)驗來確定樣本規(guī)模也是一種方法,例如,在全國性的民意調(diào)查中,1200的樣本規(guī)模是一個經(jīng)驗性的約定。另外,需要關(guān)注的是從小規(guī)??傮w中抽取樣本的規(guī)模確定問題。一般來講,樣本規(guī)模超過總體規(guī)模5%的總體,被稱作小規(guī)??傮w,此時,抽取的樣本規(guī)模需要使用有限總體修正乘數(shù)進行調(diào)整。當從大規(guī)??傮w中抽取的樣本規(guī)模占總體的比例很少時,假設樣本的抽取是相互獨立的;但是當樣本規(guī)模占總體比例大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論