抽樣方法與樣本含量的確定_第1頁
抽樣方法與樣本含量的確定_第2頁
抽樣方法與樣本含量的確定_第3頁
抽樣方法與樣本含量的確定_第4頁
抽樣方法與樣本含量的確定_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、抽樣方法與樣本含量的確定在設(shè)計(jì)一個(gè)抽樣調(diào)查時(shí),我們通常需要做的工作是:定義總體及抽樣單元、確定或構(gòu)置抽樣框、選擇抽樣技術(shù)、確定樣本量的大小、制定實(shí)施細(xì)節(jié)并實(shí)施。這里我們著重介紹一下定量研究的抽樣方法和樣本量這兩個(gè)技術(shù)環(huán)節(jié)。最基本的定量研究的抽樣方法分為兩類,一類為非概率抽樣,一類為概率抽樣。一、非概率抽樣非概率抽樣是不能計(jì)算抽樣誤差的,因?yàn)樗强空{(diào)研者個(gè)人的判斷來進(jìn)行的抽樣。它包括偶遇抽樣或者方便抽樣、判斷抽樣、配額抽樣、雪球抽樣等。偶遇抽樣(方便抽樣)常見的未經(jīng)許可的街頭隨訪或攔截式訪問、郵寄式調(diào)查、雜志內(nèi)問卷調(diào)查等都屬于偶遇抽樣的方式。偶遇抽樣是所有抽樣技術(shù)中花費(fèi)最小的(包括經(jīng)費(fèi)和時(shí)間)。

2、抽樣單元是可以接近的、容易測(cè)量的、并且是合作的。但盡管有許多優(yōu)點(diǎn),這種形式的抽樣還是有嚴(yán)重的局限性。許多可能的選擇偏差都會(huì)存在, 如被調(diào)查者的自我選擇、抽樣的主觀性偏差等。這種抽樣不 能代表總體和推斷總體。因此,當(dāng)我們?cè)谶M(jìn)行街頭訪問或郵寄調(diào)查時(shí), 一定要謹(jǐn)慎對(duì)待調(diào)查 結(jié)果。判斷抽樣判斷抽樣是基于調(diào)研者對(duì)總體的了解和經(jīng)驗(yàn),從總體中抽選"有代表性的""典型的"單位作為樣本,例如從全體企業(yè)中抽選若干先進(jìn)的、居中的、落后的企業(yè)作為樣本,來考察全體企業(yè)的經(jīng)營狀況。如果判斷準(zhǔn),這種方法有可能取得具有較好代表性的樣本,但這種方法受主觀因素影響較大。配額抽樣配額抽樣是根

3、據(jù)總體的結(jié)構(gòu)特征來給調(diào)查員分派定額,以取得一個(gè)與總體結(jié)構(gòu)特征大體相似的樣本,例如根據(jù)人口的性別、年齡構(gòu)成來給調(diào)查員規(guī)定不同性別、年齡的調(diào)查人數(shù)。配額保證了在這些特征上樣本的組成與總體的組成是一致的。一旦配額分配好了, 選擇樣本元素的自由度就很大了。唯一的要求就是所選的元素要適合所控制的特性。這種抽樣方法的目的是使樣本對(duì)總體具有更好的代表性,但仍不一定能保證樣本就是有代表性的。如果與問題相關(guān)聯(lián)的某個(gè)特征未被考慮進(jìn)配額,配額樣本可能就不具有代表性,但在實(shí)施中包括太多的控制特征是十分困難的。另外,用這種方法進(jìn)行選擇時(shí),往往存在調(diào)查員的選擇偏好,因而也 難以避免主觀因素的影響。 如果在嚴(yán)格控制調(diào)查員和

4、調(diào)查過程的條件下,可使配額抽樣獲得與某些概率抽樣非常接近的結(jié)果。在進(jìn)行配額抽樣時(shí),要特別注意配額與調(diào)查結(jié)果之間的密切聯(lián)系。雪球抽樣雪球抽樣是先選擇一組調(diào)查對(duì)象,通常是隨機(jī)地選取的。 訪問這些調(diào)查對(duì)象之后, 再請(qǐng)他們提供另外一些屬于所研究的目標(biāo)總體的調(diào)查對(duì)象,根據(jù)所提供的線索,選擇此后的調(diào)查對(duì)象。這一過程會(huì)繼續(xù)下去, 形成一種滾雪球的效果。 此抽樣的主要目的是估計(jì)在總體中十分稀有 的人物特征。由于后來被推薦的人可能類似于推薦他們的那些人,因此這種方式的調(diào)查也是非概率的。二、概率抽樣概率抽樣包括簡單隨機(jī)抽樣,分層抽樣,等距抽樣,整群抽樣等,每個(gè)樣本的中選概率是已知的,因此可以計(jì)算抽樣誤差。通常的實(shí)

5、地調(diào)查中,是把這幾種抽樣方法相互結(jié)合。簡單隨機(jī)抽樣總體中的每一個(gè)元素都有一個(gè)相等的被抽中概率。簡單隨機(jī)抽樣可以通過抽簽法和隨機(jī)數(shù)字表方法來實(shí)現(xiàn)。先確定或搜集一個(gè)抽樣框, 將抽樣框中的每個(gè)元素都編上號(hào)。然后把所有抽簽抽中的號(hào)碼的元素或隨機(jī)數(shù)字對(duì)應(yīng)的號(hào)碼的元素做為樣本進(jìn)行調(diào)查。等距抽樣(系統(tǒng)抽樣)按照某種順序給總體中所有單元編號(hào),然后隨機(jī)地抽取一個(gè)編號(hào)作為樣本的第一個(gè)單元,樣本的其它單元?jiǎng)t按照某種確定的規(guī)則抽取(如等距原則),這種抽樣方法稱為系統(tǒng)抽樣。其中最常用最簡單的系統(tǒng)抽樣叫等距抽樣。分層抽樣分層抽樣的特點(diǎn)是先將總體按照某種特征或指標(biāo)分成幾個(gè)排斥的又是窮盡的子總體,或?qū)?,然后在每個(gè)層內(nèi)按照隨機(jī)

6、的方法抽取元素。其原則是子總體內(nèi)元素間差異可能小,而不同子總體間差異大。整群抽樣整群抽樣首先將總體劃成許多相互排斥的子總體或群,然后以群為初級(jí)抽樣單元,按某種概率抽樣技術(shù),如簡單隨機(jī)抽樣,從中抽取若干個(gè)群,對(duì)抽中的群內(nèi)的所有單元都進(jìn)行調(diào)查。多級(jí)抽樣在每個(gè)抽中的群中, 再抽取若力與整群抽樣的區(qū)別在于第二階同時(shí)它的抽樣精度比整群抽樣也叫多階段抽樣。它是在第一階段從所有群中抽取若干群, 單元進(jìn)行調(diào)查。它與分層抽樣的區(qū)別在于第一層是抽取部分, 段是抽取部分。這在實(shí)際實(shí)施中是最為常見的一種抽樣方式。 高,操作性更強(qiáng)。什么時(shí)候用概率抽樣,什么時(shí)候用非概率抽樣,應(yīng)當(dāng)根據(jù)各種條件來決定,例如研究的性質(zhì)、 對(duì)誤

7、差容忍的程度、抽樣誤差與非抽樣誤差的相對(duì)大小、 總體中的變差、以及統(tǒng)計(jì)上的操作 上的考慮等。盡管非概率抽樣不能推斷總體, 不能計(jì)算抽樣誤差,但在實(shí)際調(diào)查中仍常被應(yīng)用。一方面是操作的考慮, 減少非抽樣誤差的發(fā)生,另一方面也是因?yàn)樗{(diào)查內(nèi)容不需投射總體,而且一般總體的同質(zhì)性較強(qiáng)。如概念測(cè)試、包裝測(cè)試、名稱測(cè)試以及廣告測(cè)試等,這 類研究中,主要的興趣集中在樣本給出各種不同應(yīng)答的比例。概率抽樣用于需要對(duì)總體給出很準(zhǔn)確的估計(jì)的情況,例如要估計(jì)市場占有率、整個(gè)市場的銷售量、估計(jì)某個(gè)地區(qū)的電視收 視率等。還有全國性的市場跟蹤研究(提供有關(guān)產(chǎn)品分類和品牌使用率等信息的研究),以及用戶的心理特征和人口分布的研究

8、等,都采取概率抽樣。但在概率抽樣時(shí)要特別注意控制調(diào)查過程中的非抽樣誤差。如何確定樣本量在抽樣設(shè)計(jì)中,還要考慮樣本含量, 即觀察單位數(shù)的多少問題。因?yàn)闃颖竞窟^少,所得指 標(biāo)不夠穩(wěn)定,用于推斷總體的精確度差;樣本含量過多,不但造成不必要的浪費(fèi),也給調(diào)查的質(zhì)量控制帶來更多的困難。因此,估計(jì)樣本含量,目的是在保證一定精確度的前提下,確定最少的觀察單位數(shù)。抽樣方法不同,估計(jì)樣本含量的方法各異,用單純隨機(jī)抽樣估計(jì)總體參數(shù)時(shí)(率)時(shí),樣本n的估計(jì)方法。為此要:1)確定容許誤差8 2)確定標(biāo)準(zhǔn)誤差的置信水平 U“3) 了解調(diào)查 總體的率7rU a 2 兀(1-兀)n=舉例:估計(jì)過去一個(gè)月內(nèi),市民上網(wǎng)的比例。

9、首先要估計(jì)此次調(diào)查可接受的抽樣誤差范圍,即 8的值。假設(shè)此次可接受的誤差范圍為 ±4%,刃B么 8=0.04假設(shè)研究人員要求抽樣在總體比例的土4%范圍內(nèi)的置信度為 95%,則U “ =1.96在一年前的一次類似調(diào)查中,有20%的調(diào)查者在一個(gè)月內(nèi)上過網(wǎng),我們可以用0.20作為兀值帶入公式。U J 兀(1-兀)1.9620.20 (1-0.20 )因止匕:n= = =3848 20.04 2研究人員如果缺乏估計(jì) 兀的依據(jù),可以對(duì) 兀值做最悲觀或最糟糕的假設(shè)。當(dāng)兀=0.5時(shí),兀(1-兀)有極大值0.25存在,如此避免 n值過小。這是無限總體的樣本含量估計(jì)方法。,在有限總體中,須用公式作進(jìn)一

10、步校正。根據(jù)經(jīng)驗(yàn),但樣本容量超過總體的5%時(shí),就需要調(diào)整樣本容量了。NnNc=1+(n-1)/N1+n/N在市場調(diào)查的實(shí)際抽樣中,所代表的城市人口都很大,所以樣本含量和所要調(diào)查的城市人口多少關(guān)系不大,這也是為什么在調(diào)查大小不同城市時(shí),每個(gè)城市的樣本含量一樣的原因。在確定樣本含量、置信水平下的抽樣范圍誤差估計(jì)在實(shí)際的工作中,我們常會(huì)根據(jù)客戶的要求或預(yù)算來確定樣本含量,這時(shí)常常想知道,在這樣的樣本量和確定的置信水平下,估計(jì)抽樣誤差的范圍是多少。同理:U a 2兀。-兀)n=28如此:U a 2兀。-兀)28 =n要求置信度水平為 90%時(shí),則U“=1;要求置信度水平為 95%時(shí),則U a =1.9

11、6 ;要求置信度水平為99%時(shí),則U a =2.58不同樣本含量、置信水平下的抽樣范圍誤差估計(jì)表樣本量誤差90 %的置信水平95 %的置信水平99%的置信水平1005.00%9.80%12.90%2003.54%6.93%9.12%3002.89%5.66%7.45%4002.50%4.90%6.45%5002.24%4.38%5.77%6002.04%4.00%5.27%7001.89%3.70%4.88%8001.77%3.46%4.56%9001.67%3.27%4.30%10001.58%3.10%4.08%11001.51%2.95%3.89%12001.44%2.83%3.72%1

12、3001.39%2.72%3.58%14001.34%2.62%3.45%15001.29%2.53%3.33%16001.25%2.45%3.23%17001.21%2.38%3.13%18001.18%2.31%3.04%19001.15%2.25%2.96%20001.12%2.19%2.88%21001.09%2.14%2.82%22001.07%2.09%2.75%23001.04%2.04%2.69%24001.02%2.00%2.63%25001.00%1.96%2.58%26000.98%1.92%2.53%27000.96%1.89%2.48%28000.94%1.85%2.44%29000.93%1.82%2.40%30000.91%1.79%2.36%31000.90%1.76%2.32%32000.88%1.73%2.28%33000.87%1.71%2.25%34000.86%1.68%2.21%35000.85%1.66%2.18%36000.83%1.63%2.15%37000.82%1.61%2.12%38000.81%1.59%2.09%39000.80%1.57%2.07%40000.79

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論