第四章-抽樣方法

上傳人：1*** IP屬地：湖北上傳時間：2023-09-22 格式：PPT 頁數(shù)：99 大小：961.54KB 積分：6 舉報 版權(quán)申訴

已閱讀5頁，還剩94頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

第七章抽樣方法

抽樣是通過抽取總體中的部分單元，收集這些單元的信息，用來對作為整體的總體進行統(tǒng)計推斷的一種手段。本章討論了抽樣的基本問題。抽樣的兩種主要類型是概率抽樣與非概率抽樣。

非概率抽樣的用途是有限的，因為抽選單元的傾向性不允許對調(diào)查總體進行推斷。然而非概率抽樣快速簡便，對探索性研究很有用，特別是在市場調(diào)查中應用非常廣泛。。

一、非概率抽樣

非概率抽樣是用主觀的(非隨機的)方法從總體中抽選單元，是一種快速、簡易且節(jié)省的從總體中選取樣本單元的方法。要對總體進行推斷需要對樣本進行一些假定，即要求樣本對總體具有代表性。在這點上非概率抽樣一般不具備。

由于非概率抽樣抽取樣本有傾向性與偏差且沒有一個抽樣框，不可能計算出各個單元的入樣概率。從而無法得到總體目標量的可靠估計值及其抽樣誤差估計值。非概率抽樣能用在下面幾個方面的研究中：用來形成一種想法；作為設計開發(fā)概率抽樣調(diào)查的初始步驟；在后續(xù)步驟中幫助理解概率抽樣調(diào)查結(jié)果。有時，非概率抽樣是唯一可行的選擇。例如，在醫(yī)學實驗中，采用志愿者抽樣可能是取得數(shù)據(jù)的唯一途徑。非概率抽樣常被用于抽選參加焦點座談和深入訪問的個人。另一個能較好發(fā)揮非概率抽樣作用的例子是預研究。

非概率抽樣的優(yōu)點是：快速簡便；費用相對較低；不需要抽樣框；對探索性研究和調(diào)查的設計開發(fā)很有用。非概率抽樣的缺點是：為了對總體進行推斷，需要對樣本的代表性做很強的假定。不可能得到可靠的估計值以及抽樣誤差估計值。

非概率抽樣的種類

非概率抽樣方法有五種：隨意抽樣自愿抽樣判斷抽樣配額抽樣修正的概率抽樣。

1.隨意抽樣隨意抽樣的樣本單元的抽選以無目標、隨意的方式進行，幾乎沒有或完全沒有計劃。它假定總體是同質(zhì)的，即總體單元都相似。比如“街道攔截”訪問法。

2.志愿者抽樣

被調(diào)查者都是志愿者。例如具有特定病情的人參加某些醫(yī)療實驗；打電話參與廣播或電視節(jié)目的人；抽選參加焦點座談或深入訪問的人。

3.判斷抽樣由專家有目的地抽選有代表性的樣本。它適用于探索性研究，如：抽選參加焦點座談或深入訪談的人，但不宜用在試調(diào)查中。

4.配額抽樣

這是最常見的一種非概率抽樣。抽樣要從各個子總體中選取特定數(shù)量的單元(配額)。

總樣本量：900人18-2526-3031-3536-4041-45男女比例28%17%17%19%19%50-55%50-45%1936年總統(tǒng)選舉預測得票率

單候

選

人實際得票率《文摘》雜志預測蓋洛普預測

羅斯福

60．243．054．0

蘭

登

39．857．0

46．0

合

計

100．0100．0100．0

那么，《文摘》雜志失敗，蓋洛普成功的原因究竟何在呢?蓋洛普采用的是一種叫作“分配法’的方法。這種方法力求使調(diào)查對象在州，市，鎮(zhèn)，村的大小，年齡，性別、社會階層，人種等方面，能準確地代表美國的所有選民。例如，如果二十幾歲的人占全體選民的27%，那么在3000人的調(diào)查對象中，二十幾歲的人也應占27%，即810人。為確保所分配的比率不致出錯，務必要求調(diào)查員直接面見調(diào)查對象，以便確認。因此，調(diào)查的實施多采取訪問調(diào)查的方法。

蓋洛普應用分配法進行總統(tǒng)選舉顱測調(diào)查獲得極大成功以后，該方法開始被廣泛應用于民意調(diào)查和市場調(diào)查?？墒窃?948年的總統(tǒng)選舉中，采用同樣方法預言杜威將當選，結(jié)果與預測恰恰相反，杜魯門當選了。預測實際候選人CrossleyGallupRoper結(jié)果杜魯門45%44%38%50%杜威50%50%53%45%

從此，蓋洛普失去了在民意調(diào)查界神話般的地位。不僅如此，其它調(diào)查機構(gòu)也都出現(xiàn)了同樣的失敗。人們開始向民意調(diào)查投來了懷疑的目光。于是，由許多學者和專家組成了一個委員會，對失敗的原因進行了研究。結(jié)果指出分配法的下列缺點：

采用分配法的目的最終在于使所抽選的調(diào)查對象能正確代表全體選民?？墒欠峙浞ńo予調(diào)查員的僅僅是這樣一些關于基本特征方面的框框；大城市30-40歲的白人男子多少人，大城市40-50歲的黑人女子多少人等等，只要是屬于這個框框之內(nèi)的人調(diào)查對象的最終確定就完全取決于調(diào)查員的個人判斷了。

因此，不可避免調(diào)查員的愛好，調(diào)查對象對訪問的配合程度等因素的影響。即使在年齡，社會階層等分配調(diào)查對象時考慮到了的幾個特征上，調(diào)查對象能完全代表全體選民，但其他特征還是可能出現(xiàn)偏差。研究結(jié)果，隨機抽樣方法作為消除分配法主觀因素影響的手段開始受到重視。

蓋洛普后來的成功—采用概率抽樣年份樣本容量獲勝后選人蓋洛普選舉結(jié)果誤差

預測值

19525385艾森豪威爾51%55.4%+4.4%

19568144艾森豪威爾59.5%57.8%-1.7%19608015肯尼迪51%50.1%0.1%19646625約翰遜64%61.3%-2.7%19684414尼克松43%43.5%0.5%19723689尼克松62%61.8%-0.2%19763439卡特49.5%51.1%1.6%19803500里根55.3%51.6%-3.7%19843456里根59.0%59.2%0.2%19884089布什56.0%53.9%-2.1%

5.修正的概率抽樣

修正的概率抽樣是概率抽樣與非概率抽樣的結(jié)合。主要用于多階段抽樣，前幾個階段用概率抽樣，最后用非概率抽樣，一般是配額抽樣。

二、概率抽樣在需要根據(jù)樣本的結(jié)果對總體進行推斷時應使用概率抽樣。最簡單的概率抽樣設計是等概率抽樣，包括簡單隨機抽樣和系統(tǒng)抽樣。不等概率抽樣比較復雜且大多需要輔助抽樣框信息。不等概率抽樣有：概率與大小成比例的抽樣，整群抽樣，分層抽樣，多階段抽樣和多相抽樣。不等概率抽樣通常用來提高抽樣設計方案的效率，或降低抽樣費用。

概率抽樣有兩條基本準則：1)單元是隨機抽取的；

2)調(diào)查總體中的每個單元都有一個非零的入樣概率，并且能計算出這些概率。

概率抽樣的主要優(yōu)點有：能得到總體的可靠估計值并能計算每個估計值的抽樣誤差，因而能對總體進行推斷。

概率抽樣的主要缺點有：與非概率抽樣相比，概率抽樣比較復雜，更費時，通常也更費錢。但總的說來，其利遠大于弊。

概率抽樣的種類

概率抽樣有七種：簡單隨機抽樣，系統(tǒng)抽樣，等比例抽樣，整群抽樣，分層抽樣，多階抽樣，多相抽樣。

簡單隨機抽樣（SRS）是所有概率抽樣的出發(fā)點和理論基礎。簡單隨機抽樣是一種一步抽樣法，它保證樣本量為n的每個可能的樣本都有相同的被抽中的概率p=n/N。抽樣可以是放回的，也可以是不放回的。簡單隨機樣本（圖示）簡單隨機抽樣在實際抽樣中應用很少，常被用作評估其他抽樣方法的效率的標準。抽樣的誤差是通過其抽樣方差來測量的，如果一種抽樣方法的抽樣方差比另一種抽樣方法的抽樣方差小，我們就稱這種抽樣方法更有效率（統(tǒng)計效率）。與其他抽樣技術相比，簡單隨機抽樣有以下優(yōu)點：是最簡單的抽樣技術；抽樣框不需要其他（輔助）信息，唯一需要的只是一個關于調(diào)查總體所有單元的一個完全的清單和與其如何聯(lián)系的信息；關于樣本量的確定、總體估計與方差估計都有現(xiàn)成的標準公式可以利用，因此技術發(fā)展已經(jīng)成熟。簡單隨機抽樣的缺點是：抽樣框中即使有現(xiàn)成的輔助信息也不加利用，使得估計的統(tǒng)計效率較其他利用輔助信息的樣本設計低；由于樣本在總體中的地理分布范圍比較廣，如果采用面訪，費用較高；有可能抽到一個“差的”樣本；如果不用計算機，而用隨機數(shù)表抽一個大樣本將十分單調(diào)勞神。

系統(tǒng)抽樣（SYS）其抽樣單元是從總體中等距抽出的。它需要一個抽樣間距和一個隨機起點。抽樣間距是k=N/n，隨機起點r是介于1到k之間的一個隨機數(shù)。被抽中的單元是：r，r十k，r+2k，r+3k，…，r+(n-1)k。

系統(tǒng)樣本（圖示）在系統(tǒng)抽樣中，樣本單元是從總體中按一定的（抽樣）間距抽出的。如果N不能被n整除，則可以使用圓形系統(tǒng)抽樣法來避免出現(xiàn)可能樣本量不一致的情況。

系統(tǒng)抽樣有以下優(yōu)點：在沒有抽樣框時，可代替簡單隨機抽樣；與簡單隨機抽樣一樣，系統(tǒng)抽樣不需要輔助的抽樣框信息；與簡單隨機抽樣相比，系統(tǒng)抽樣樣本的分布較好（這還取決于抽樣間隔及名錄是如何排列的）；與簡單隨機抽樣一樣，估計值容易計算；系統(tǒng)抽樣比簡單隨機抽樣簡單。系統(tǒng)抽樣的另一個優(yōu)點是，在事先沒有總體單元名錄的情況下，也可以用。此時，我們可以使用并構(gòu)造一個概念抽樣框（只需要單元的排列順序），每隔k個抽一個單元直到總體的末尾。這種方法的一個缺點是，只有抽樣完成后才知道實際樣本量n。

系統(tǒng)抽樣的缺點有：如果抽樣間距正好碰上總體變化的某種未知的周期性，就會得到一個“差的”系統(tǒng)樣本；由于不使用抽樣框中的輔助信息，抽樣策略的效率不高；在使用概念框時，不能預先知道最終樣本量；抽樣方差沒有一個無偏的估計量；在總體大小N不能被樣本量n整除且不使用圓形抽樣法時，會得到樣本量不同的樣本。與大?。ɑ蛞?guī)模）成比例的概率(PPS)抽樣PPS抽樣是一種使用輔助信息從而使入樣概率不相等的抽樣技術。如果單元大小的度量是準確的，而且所研究的變量與單元的大小相關，PPS抽樣能極大地提高精度。PPS抽樣的一個很好的例子是商業(yè)調(diào)查。單元大小度量可用雇員數(shù)、年銷售額、經(jīng)營場所數(shù)等。

在PPS抽樣中，單元的大小決定入樣概率的大小。這就是說，以農(nóng)場作為例子，一個面積為200公頃的農(nóng)場被抽入樣本的概率，是面積為100公頃的農(nóng)場的二倍。

假定一個總體有六個農(nóng)場，我們要估計這個農(nóng)場總體的總支

出。假定我們已知每個農(nóng)場的規(guī)模(以公頃計的農(nóng)場大小)，為便于說明，

進一步假定我們已知它們的支出?？紤]下面的農(nóng)場名錄(總體值)：抽樣單元：農(nóng)場抽樣框輔助信息：以公頃計的農(nóng)場規(guī)模調(diào)查變量：支出（元）15026000210004700003125638004300145000550023000062512500總計2000947300

對這個六個農(nóng)場的總體，真正的總支出為947,300元。假定我們沒有對

這六個農(nóng)場進行普查的經(jīng)費，預算只夠?qū)σ粋€農(nóng)場的樣本進行調(diào)查(把樣本

量取為1，只是為了說明方便，在實際調(diào)查中，只抽一個單元的情況極少)，

我們可以抽簡單隨機樣本，每個樣本只含一個單元、每個單元入選的概率為

1／6、大小為n=1的樣本有六種可能。

下面我們來分析簡單隨機抽樣的結(jié)果。對大小為1的樣本，總體總支出的估計值，由抽中樣本的單元的支出乘以該單元的權(quán)數(shù)1/6(權(quán)數(shù)是樣本單元所代表的總體單元個數(shù))得到。

所有可能的n=1的簡單隨機樣本。

樣本（抽中的農(nóng)場）農(nóng)場的如樣概率農(nóng)場的樣本權(quán)數(shù)農(nóng)場的支出（元）總體總支出的估計值（元）樣本11/6626000156000樣本21/664700002820000樣本31/6663800382800樣本41/66145000870000樣本51/662300001380000樣本61/661250075000估計總值的平均數(shù)947300

用簡單隨機抽樣時，總體的估計值隨樣本的不同而不同，其變化范圍從75,000元到2,800,000元。PPS抽樣能得到抽樣變異性較小的估計值。樣本（抽中的農(nóng)場）農(nóng)場的如樣概率農(nóng)場的樣本權(quán)數(shù)農(nóng)場的支出（元）總體總支出的估計值（元）樣本150/20002000/50260001040000樣本21000/20002000/1000470000940000樣本3125/20002000/125638001020800樣本4300/20002000/300145000966667樣本5500/20002000/500230000920000樣本625/20002000/25125001000000估計總值的平均數(shù)947300所有可能的n=1的PPS樣本

對PPS樣本，抽樣變異性要小得多。從六個可能的樣本得到的估計值的

變化范圍，從最低的920,000元到最高的1,040,000元，比簡單隨機樣本好

得多(PPS抽樣的入樣概率是按農(nóng)場規(guī)模除以所有農(nóng)場總規(guī)模計算得到的)。

本例中假定農(nóng)場的支出與其規(guī)模(大小)有關，這一假定在這里顯然是成立的，否則PPS抽樣不會這樣有效。實際上，如果調(diào)查變量與大小變量不相關，PPS抽樣可能不比簡單隨機抽樣好(甚至可能更差)。

PPS抽樣的主要優(yōu)點是它使用了輔助信息，提高了抽樣策略的統(tǒng)計效率，與簡單隨機抽樣甚至與分層抽樣相比，都能顯著地減少抽樣誤差。

PPS抽樣的主要優(yōu)點是：由于使用了輔助信息，提高了抽樣策略的統(tǒng)計效率，能顯著地減少抽樣誤差。PPS抽樣有以下的缺點：抽樣框中的所有單元，都要有高質(zhì)量的、能用作大小度量的輔助信息；抽樣框的創(chuàng)建比簡單隨機抽樣和系統(tǒng)抽樣成本高，更復雜，因為需要度量和存儲總體中每一個單元的大?。徊⒎窃谌魏吻闆r下都能使用，因為并不是每一個總體都有穩(wěn)定且與主要調(diào)查變量相關的有關大小或規(guī)模的度量；抽樣及估計（特別對不放回抽樣）相當復雜；當單元大小度量不準確或不穩(wěn)定時不適用，此時更好的辦法是將單元按大小分組并使用分層抽樣。

整群抽樣

整群抽樣中，總體單元被分為群，抽樣時先抽取群的樣本，調(diào)查被抽中的群中的所有單元。采用整群抽樣的兩個理由：）抽選群能大大降低數(shù)據(jù)收集的費用，當總體的分布比較廣且調(diào)查采用面訪時更是如此；）從總體中直接抽選個體在實際中并不總是可行的（沒有關于個體的抽樣框）；

整群樣本（圖示）

整群抽樣策略的統(tǒng)計效率取決于群內(nèi)單元的相似程度有多大，每個群中有多少單元，及抽中群的數(shù)量。需要選擇最優(yōu)的群數(shù)量和大小，同時使總費用最小。

整群抽樣的優(yōu)點有：由于樣本不如簡單隨機樣本那樣分散，整群抽樣能大大降低數(shù)據(jù)收集的費用；當總體單元自然聚合成群（例如：住戶、學校）時，整群抽樣比簡單隨機抽樣或系統(tǒng)抽樣更容易；如果對于調(diào)查變量而言，群內(nèi)單元差異較大，而不同群的差異較小，整群抽樣策略比簡單隨機抽樣的統(tǒng)計效率更高。(例如為估計性別比采用按戶的整群抽樣)；

整群抽樣的缺點有：對調(diào)查變量，若群內(nèi)單元有趨同性，則整群抽樣的統(tǒng)計效率比簡單隨機抽樣低，（這正是通常遇到的情況），但對此項效率的損失可通過增加群的抽取個數(shù)來彌補；通常無法提前知道調(diào)查總樣本量，因為在進行調(diào)查前，我們通常不知道一個群內(nèi)到底有多少個單元；方差估計可能比簡單隨機抽樣更為復雜。

分層抽樣（STR）采用分層抽樣時，總體被分為同質(zhì)的、互不重迭的若干子總體（層），然后，在每一個層中獨立地抽取樣本?？梢允褂萌魏我环N抽樣方法來對每個層進行抽樣。

分層樣本（圖示）

進行分層有三個主要理由：抽樣方法的效率較高；能保證欲進行分析的特定研究域有足夠的樣本量，以便進行分析；避免抽到一個“差的”樣本。為充分利用分層抽樣的效率，層內(nèi)必須有高度的同質(zhì)性（即同一層內(nèi)的每一個單元的調(diào)查指標應是相近的），而不同層之間的差異應盡可能大。

分層抽樣的優(yōu)點有：能提高對總體估計值的精度；能保證樣本對被定義為層的那些子總體的代表性，從而得到有效的估計；操作與管理方便；能避免得到一個“差的”樣本；在不同的層中可以使用不同的抽樣框和不同的抽樣方法。

分層抽樣的缺點有：要求抽樣框中的所有單元，都必須有能用于分層的輔助信息；調(diào)查框的創(chuàng)建較簡單隨機抽樣和系統(tǒng)抽樣需更多的費用，也更為復雜。

多階抽樣多階抽樣是用兩個或更多連續(xù)的階段抽取樣本的過程。第一階段抽取的單元稱為初級或一級抽樣單元（PSU），第二階段抽取的單元稱為次級或二級抽樣單元（SSU），以此類推。

多階樣本（圖示）常見的多階抽樣是二階抽樣：第一階抽樣用地域框抽地理小區(qū)（PSU）；第二階用系統(tǒng)抽樣抽小區(qū)內(nèi)的住所（SSU）。在前面介紹的（一階）整群抽樣中，樣本群中的所有單元都入樣。在兩階抽樣中，從每個抽中的群（一級）單元中再抽一部分（二級）單元進行調(diào)查。多階抽樣常與地域框結(jié)合使用，作為解決整群抽樣效率低問題的一種方法。多階抽樣中的階數(shù)越多，設計（及估計）越復雜，通常我們只用二階或三階抽樣。例：加拿大勞動力調(diào)查（LFS）全國被劃分為1100多個層，每個層由一組普查小區(qū)（EA）組成。普查小區(qū)是由人口普查時所確定的地理區(qū)域，普查員能對它所覆蓋的區(qū)域進行詳細清查。第一階抽樣是從每個層中抽取關于普查小區(qū)或普查小區(qū)組的分層樣本。在第二階抽樣中，將這些小區(qū)繪圖，列出它們中的所有住所，并從中按系統(tǒng)抽樣抽取住所。然后，調(diào)查抽中住所內(nèi)的所有人。

多階抽樣的優(yōu)點有：當群內(nèi)單元對于調(diào)查變量是同質(zhì)時，多階抽樣比單階整群抽樣的效率高；樣本分布相對集中，因此采用面訪的旅行時間和費用都大為降低；不需要有整個總體的名錄框，所要的只是在每個階段抽樣都有一個完整的抽樣框。

多階抽樣的缺點有：雖然多階抽樣的效率比一階整群抽樣的高，但它沒有簡單隨機抽樣的效率高；通常不能提前知道多階抽樣的樣本量，因為在具體調(diào)查前，我們不知道在每個大單元中到底包含多少個下級單元（若固定每個大單元中的抽樣數(shù)目，則總的樣本量也可控制）；調(diào)查的組織較為復雜（比單階整群抽樣復雜）；估計值與抽樣方差的計算較為復雜。

多相抽樣多相抽樣先抽一個有很多單元的大樣本，收集基本的信息，然后在這個大樣本中抽取一個子樣本，收集更詳細的信息。多相抽樣能用在抽樣框缺乏輔助信息，而又想對總體進行分層或篩選部分總體的情況。當沒有充足的預算收集整個樣本的信息，或這樣做會導致額外的回答負擔時，也可以用多相抽樣抽取子樣本的方法來收集更詳細的信息。

多相樣本（圖示）第一相是批發(fā)零售貿(mào)易月度調(diào)查。每個月，批發(fā)零售貿(mào)易月度調(diào)查要求批發(fā)零售基層單位提供兩個數(shù)據(jù)：月度銷售額和庫存量。零售商品季度調(diào)查再從這些零售基層單位抽取一個子樣本，在調(diào)查時要求它們把銷售額分解到各類商品，如服裝、電器、食品等。例：加拿大零售商品季度調(diào)查（QRCS）多相抽樣可以用于在一項調(diào)查中不同問題的數(shù)據(jù)收集費用差異很大的情形。第一相收集的數(shù)據(jù)除能用作分層及篩選信息外，還能用來提高估計的效率（例如用于比估計或回歸估計）。

多相抽樣的優(yōu)點是：能顯著提高估計值精度（與簡單隨機抽樣相比）；能用來獲得抽樣框中所沒有的輔助信息（特別是分層信息）；適用于某些調(diào)查指標的數(shù)據(jù)收集費用特別高，或會給被調(diào)查者帶來較重的回答負擔的情況；

多相抽樣的缺點有：如果需要根據(jù)第一相的結(jié)果來進行第二相調(diào)查，得到整個調(diào)查結(jié)果的時間比單相調(diào)查長；由于對某些樣本單元訪問次數(shù)超過一次，故所需費用比一相調(diào)查要多；調(diào)查的組織會很復雜；估計值和抽樣誤差的計算會相當復雜。

(三)抽樣設計的比較

如果要以樣本的結(jié)果為基礎對總體進行推斷，則選用概率抽樣。如果有目錄，或能以適當?shù)耐度雱?chuàng)建總體各單元的一個目錄，則考慮用簡單隨機抽樣。如果數(shù)據(jù)使用者不管你使用什么樣的設計，都認為樣本是簡單隨機樣本，則考慮用簡單隨機抽樣或系統(tǒng)抽樣。

如果總體分布的地理距離很寬，且每個單元的數(shù)據(jù)收集費用很高，則考慮使用多階段抽樣設計。如果總體單元自然成群，或有總體單元分組目錄，或者打算使用地域抽樣框，則使用多階整群抽樣。如果抽樣框有能用作分層或能用作規(guī)模度量等的輔助信息，且這些變量與主要調(diào)查變量相關，則考慮用分層抽樣；如果有準確且與主要調(diào)查變量相關的規(guī)模度量，則考慮使用與大小成比例的概率抽樣；如果規(guī)模度量不準確，則考慮按規(guī)模度量分組并按規(guī)模分層。如果需要作域估計且這些域能在抽樣框中確定，則考慮將域作為層進行分層抽樣。

如果抽樣框缺乏想用來分層或?qū)傮w進行篩選的輔助信息，則考慮進行多相抽樣，取一個較大的第一相樣本用來收集在第二相要使用的分層信息。如果要收集的部分信息收集起來費用較高，則考慮使用多相抽樣。影響調(diào)查樣本量大小的因素主要有兩個：一是調(diào)查估計值所希望達到的精度，也就是調(diào)查估計值所能允許的誤差；二是調(diào)查實際操作的限制條件，如經(jīng)費、時間等。

樣本量的確定1．影響精度的因素(1)總體的變異程度大；(2)總體的大??；(3)樣本設計方式和所用的估計量；(4)調(diào)查的回答率的高低?？傮w大小

在樣本量確定過程中，總體所起的作用因它的大小而有所差異。對于小規(guī)?？傮w，它起著重要作用；對于中等規(guī)模的總體，其作用中等；而大總體對樣本量影響的作用很小。

例如：用簡單隨機抽樣估計P，要求在置信度為95%下誤差限為0.05所需的樣本量（p=0.05）總體大小N所需的樣本量n5044100805002221000286500037010000385100000398100000040010000000400

樣本設計和估計量一般來說，當樣本量采用簡單隨機抽樣的計算公式，而實際使用的是更復雜的抽樣方式時，為達到給定精度所需的樣本量，應該在此基礎上乘以一個稱為設計效應因子。設計效應是對于相等的樣本量，給定樣本設計估計量的抽樣方差對簡單隨機抽樣估計量的抽樣方差的比率。簡單隨機抽樣設計，設計效應等于1；分層抽樣設計，設計效應一般小于等于1；整群或多階抽樣設計，設計效應一般大于等于1。對于非概率抽樣，假設設計效應等于2或3。

若過去相同或相似主題的調(diào)查所用的抽樣設計與我們計劃實施的抽樣設計相同或相似，就能得到當前調(diào)查主要變量設計效應的估計值。我們也可以從試調(diào)查中得到設計效應的估計值。

設計效應

調(diào)查的回答率

需要根據(jù)預計的回答率調(diào)整樣本量的大小，根據(jù)預計的回答率確定一個較大的樣本才可能達到精度要求。

樣本量的計算步驟1）對于簡單隨機抽樣，對平均值估計的樣本量計算：第1步：計算初始樣本量

第2步：對總體大小進行調(diào)整：第3步：如果抽樣設計不是簡單隨機抽樣，則用下面公式對樣本量進行調(diào)整：

其中，B是設計效應。

第

人人文庫> 全部分類> 應用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第四章-抽樣方法

文檔簡介

溫馨提示

最新文檔

評論

第四章-抽樣方法

文檔簡介

溫馨提示

最新文檔

評論

相關文檔