抽樣方法與樣本含量的確定

上傳人：d*** IP屬地：天津上傳時(shí)間：2022-02-12 格式：DOCX 頁數(shù)：6 大?。?4.60KB 積分：18 舉報(bào) 版權(quán)申訴

免費(fèi)預(yù)覽已結(jié)束，剩余1頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、抽樣方法與樣本含量的確定在設(shè)計(jì)一個(gè)抽樣調(diào)查時(shí)，我們通常需要做的工作是：定義總體及抽樣單元、確定或構(gòu)置抽樣框、選擇抽樣技術(shù)、確定樣本量的大小、制定實(shí)施細(xì)節(jié)并實(shí)施。這里我們著重介紹一下定量研究的抽樣方法和樣本量這兩個(gè)技術(shù)環(huán)節(jié)。最基本的定量研究的抽樣方法分為兩類，一類為非概率抽樣，一類為概率抽樣。一、非概率抽樣非概率抽樣是不能計(jì)算抽樣誤差的，因?yàn)樗强空{(diào)研者個(gè)人的判斷來進(jìn)行的抽樣。它包括偶遇抽樣或者方便抽樣、判斷抽樣、配額抽樣、雪球抽樣等。偶遇抽樣（方便抽樣）常見的未經(jīng)許可的街頭隨訪或攔截式訪問、郵寄式調(diào)查、雜志內(nèi)問卷調(diào)查等都屬于偶遇抽樣的方式。偶遇抽樣是所有抽樣技術(shù)中花費(fèi)最小的（包括經(jīng)費(fèi)和時(shí)間）。

2、抽樣單元是可以接近的、容易測(cè)量的、并且是合作的。但盡管有許多優(yōu)點(diǎn)，這種形式的抽樣還是有嚴(yán)重的局限性。許多可能的選擇偏差都會(huì)存在，如被調(diào)查者的自我選擇、抽樣的主觀性偏差等。這種抽樣不能代表總體和推斷總體。因此，當(dāng)我們?cè)谶M(jìn)行街頭訪問或郵寄調(diào)查時(shí)，一定要謹(jǐn)慎對(duì)待調(diào)查結(jié)果。判斷抽樣判斷抽樣是基于調(diào)研者對(duì)總體的了解和經(jīng)驗(yàn)，從總體中抽選"有代表性的""典型的"單位作為樣本，例如從全體企業(yè)中抽選若干先進(jìn)的、居中的、落后的企業(yè)作為樣本，來考察全體企業(yè)的經(jīng)營狀況。如果判斷準(zhǔn)，這種方法有可能取得具有較好代表性的樣本，但這種方法受主觀因素影響較大。配額抽樣配額抽樣是根

3、據(jù)總體的結(jié)構(gòu)特征來給調(diào)查員分派定額，以取得一個(gè)與總體結(jié)構(gòu)特征大體相似的樣本，例如根據(jù)人口的性別、年齡構(gòu)成來給調(diào)查員規(guī)定不同性別、年齡的調(diào)查人數(shù)。配額保證了在這些特征上樣本的組成與總體的組成是一致的。一旦配額分配好了，選擇樣本元素的自由度就很大了。唯一的要求就是所選的元素要適合所控制的特性。這種抽樣方法的目的是使樣本對(duì)總體具有更好的代表性，但仍不一定能保證樣本就是有代表性的。如果與問題相關(guān)聯(lián)的某個(gè)特征未被考慮進(jìn)配額，配額樣本可能就不具有代表性，但在實(shí)施中包括太多的控制特征是十分困難的。另外，用這種方法進(jìn)行選擇時(shí)，往往存在調(diào)查員的選擇偏好，因而也難以避免主觀因素的影響。如果在嚴(yán)格控制調(diào)查員和

4、調(diào)查過程的條件下，可使配額抽樣獲得與某些概率抽樣非常接近的結(jié)果。在進(jìn)行配額抽樣時(shí)，要特別注意配額與調(diào)查結(jié)果之間的密切聯(lián)系。雪球抽樣雪球抽樣是先選擇一組調(diào)查對(duì)象，通常是隨機(jī)地選取的。訪問這些調(diào)查對(duì)象之后，再請(qǐng)他們提供另外一些屬于所研究的目標(biāo)總體的調(diào)查對(duì)象，根據(jù)所提供的線索，選擇此后的調(diào)查對(duì)象。這一過程會(huì)繼續(xù)下去，形成一種滾雪球的效果。此抽樣的主要目的是估計(jì)在總體中十分稀有的人物特征。由于后來被推薦的人可能類似于推薦他們的那些人，因此這種方式的調(diào)查也是非概率的。二、概率抽樣概率抽樣包括簡單隨機(jī)抽樣，分層抽樣，等距抽樣，整群抽樣等，每個(gè)樣本的中選概率是已知的，因此可以計(jì)算抽樣誤差。通常的實(shí)

5、地調(diào)查中，是把這幾種抽樣方法相互結(jié)合。簡單隨機(jī)抽樣總體中的每一個(gè)元素都有一個(gè)相等的被抽中概率。簡單隨機(jī)抽樣可以通過抽簽法和隨機(jī)數(shù)字表方法來實(shí)現(xiàn)。先確定或搜集一個(gè)抽樣框，將抽樣框中的每個(gè)元素都編上號(hào)。然后把所有抽簽抽中的號(hào)碼的元素或隨機(jī)數(shù)字對(duì)應(yīng)的號(hào)碼的元素做為樣本進(jìn)行調(diào)查。等距抽樣（系統(tǒng)抽樣）按照某種順序給總體中所有單元編號(hào)，然后隨機(jī)地抽取一個(gè)編號(hào)作為樣本的第一個(gè)單元，樣本的其它單元?jiǎng)t按照某種確定的規(guī)則抽取（如等距原則），這種抽樣方法稱為系統(tǒng)抽樣。其中最常用最簡單的系統(tǒng)抽樣叫等距抽樣。分層抽樣分層抽樣的特點(diǎn)是先將總體按照某種特征或指標(biāo)分成幾個(gè)排斥的又是窮盡的子總體，或?qū)?，然后在每個(gè)層內(nèi)按照隨機(jī)

6、的方法抽取元素。其原則是子總體內(nèi)元素間差異可能小，而不同子總體間差異大。整群抽樣整群抽樣首先將總體劃成許多相互排斥的子總體或群，然后以群為初級(jí)抽樣單元，按某種概率抽樣技術(shù)，如簡單隨機(jī)抽樣，從中抽取若干個(gè)群，對(duì)抽中的群內(nèi)的所有單元都進(jìn)行調(diào)查。多級(jí)抽樣在每個(gè)抽中的群中，再抽取若力與整群抽樣的區(qū)別在于第二階同時(shí)它的抽樣精度比整群抽樣也叫多階段抽樣。它是在第一階段從所有群中抽取若干群，單元進(jìn)行調(diào)查。它與分層抽樣的區(qū)別在于第一層是抽取部分, 段是抽取部分。這在實(shí)際實(shí)施中是最為常見的一種抽樣方式。高，操作性更強(qiáng)。什么時(shí)候用概率抽樣，什么時(shí)候用非概率抽樣，應(yīng)當(dāng)根據(jù)各種條件來決定，例如研究的性質(zhì)、對(duì)誤

7、差容忍的程度、抽樣誤差與非抽樣誤差的相對(duì)大小、總體中的變差、以及統(tǒng)計(jì)上的操作上的考慮等。盡管非概率抽樣不能推斷總體，不能計(jì)算抽樣誤差，但在實(shí)際調(diào)查中仍常被應(yīng)用。一方面是操作的考慮，減少非抽樣誤差的發(fā)生，另一方面也是因?yàn)樗{(diào)查內(nèi)容不需投射總體，而且一般總體的同質(zhì)性較強(qiáng)。如概念測(cè)試、包裝測(cè)試、名稱測(cè)試以及廣告測(cè)試等，這類研究中，主要的興趣集中在樣本給出各種不同應(yīng)答的比例。概率抽樣用于需要對(duì)總體給出很準(zhǔn)確的估計(jì)的情況，例如要估計(jì)市場占有率、整個(gè)市場的銷售量、估計(jì)某個(gè)地區(qū)的電視收視率等。還有全國性的市場跟蹤研究（提供有關(guān)產(chǎn)品分類和品牌使用率等信息的研究），以及用戶的心理特征和人口分布的研究

8、等，都采取概率抽樣。但在概率抽樣時(shí)要特別注意控制調(diào)查過程中的非抽樣誤差。如何確定樣本量在抽樣設(shè)計(jì)中，還要考慮樣本含量，即觀察單位數(shù)的多少問題。因?yàn)闃颖竞窟^少，所得指標(biāo)不夠穩(wěn)定，用于推斷總體的精確度差；樣本含量過多，不但造成不必要的浪費(fèi)，也給調(diào)查的質(zhì)量控制帶來更多的困難。因此，估計(jì)樣本含量，目的是在保證一定精確度的前提下，確定最少的觀察單位數(shù)。抽樣方法不同，估計(jì)樣本含量的方法各異，用單純隨機(jī)抽樣估計(jì)總體參數(shù)時(shí)（率）時(shí)，樣本n的估計(jì)方法。為此要：1）確定容許誤差8 2）確定標(biāo)準(zhǔn)誤差的置信水平 U“3）了解調(diào)查總體的率7rU a 2 兀（1-兀）n=舉例：估計(jì)過去一個(gè)月內(nèi)，市民上網(wǎng)的比例。

9、首先要估計(jì)此次調(diào)查可接受的抽樣誤差范圍，即 8的值。假設(shè)此次可接受的誤差范圍為 ±4%,刃B么 8=0.04假設(shè)研究人員要求抽樣在總體比例的土4%范圍內(nèi)的置信度為 95%,則U “ =1.96在一年前的一次類似調(diào)查中，有20%的調(diào)查者在一個(gè)月內(nèi)上過網(wǎng)，我們可以用0.20作為兀值帶入公式。U J 兀（1-兀）1.9620.20 （1-0.20 ）因止匕：n= = =3848 20.04 2研究人員如果缺乏估計(jì) 兀的依據(jù)，可以對(duì) 兀值做最悲觀或最糟糕的假設(shè)。當(dāng)兀=0.5時(shí)，兀（1-兀）有極大值0.25存在，如此避免 n值過小。這是無限總體的樣本含量估計(jì)方法。，在有限總體中，須用公式作進(jìn)一

10、步校正。根據(jù)經(jīng)驗(yàn)，但樣本容量超過總體的5%時(shí)，就需要調(diào)整樣本容量了。NnNc=1+(n-1)/N1+n/N在市場調(diào)查的實(shí)際抽樣中，所代表的城市人口都很大，所以樣本含量和所要調(diào)查的城市人口多少關(guān)系不大，這也是為什么在調(diào)查大小不同城市時(shí)，每個(gè)城市的樣本含量一樣的原因。在確定樣本含量、置信水平下的抽樣范圍誤差估計(jì)在實(shí)際的工作中，我們常會(huì)根據(jù)客戶的要求或預(yù)算來確定樣本含量，這時(shí)常常想知道，在這樣的樣本量和確定的置信水平下，估計(jì)抽樣誤差的范圍是多少。同理：U a 2兀。-兀)n=28如此：U a 2兀。-兀)28 =n要求置信度水平為 90%時(shí)，則U“=1；要求置信度水平為 95%時(shí)，則U a =1.9

11、6 ;要求置信度水平為99%時(shí)，則U a =2.58不同樣本含量、置信水平下的抽樣范圍誤差估計(jì)表樣本量誤差90 %的置信水平95 %的置信水平99%的置信水平1005.00%9.80%12.90%2003.54%6.93%9.12%3002.89%5.66%7.45%4002.50%4.90%6.45%5002.24%4.38%5.77%6002.04%4.00%5.27%7001.89%3.70%4.88%8001.77%3.46%4.56%9001.67%3.27%4.30%10001.58%3.10%4.08%11001.51%2.95%3.89%12001.44%2.83%3.72%1

12、3001.39%2.72%3.58%14001.34%2.62%3.45%15001.29%2.53%3.33%16001.25%2.45%3.23%17001.21%2.38%3.13%18001.18%2.31%3.04%19001.15%2.25%2.96%20001.12%2.19%2.88%21001.09%2.14%2.82%22001.07%2.09%2.75%23001.04%2.04%2.69%24001.02%2.00%2.63%25001.00%1.96%2.58%26000.98%1.92%2.53%27000.96%1.89%2.48%28000.94%1.85%2.44%29000.93%1.82%2.40%30000.91%1.79%2.36%31000.90%1.76%2.32%32000.88%1.73%2.28%33000.87%1.71%2.25%34000.86%1.68%2.21%35000.85%1.66%2.18%36000.83%1.63%2.15%37000.82%1.61%2.12%38000.81%1.59%2.09%39000.80%1.57%2.07%40000.79

人人文庫> 全部分類> 應(yīng)用文書 > 研究報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

抽樣方法與樣本含量的確定

文檔簡介

溫馨提示

最新文檔

評(píng)論

抽樣方法與樣本含量的確定

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔