抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第1頁(yè)
抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第2頁(yè)
抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第3頁(yè)
抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第4頁(yè)
抽樣調(diào)查-第11章調(diào)查中的非抽樣誤差課件_第5頁(yè)
已閱讀5頁(yè),還剩59頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十一章調(diào)查中的非抽樣誤差§11.1引言

非抽樣誤差是指除抽樣誤差以外的,由于各種原因引起的誤差。在概率抽樣、非概率抽樣、其他全面調(diào)查和非全面調(diào)查已及普查中,非抽樣誤差都有可能存在。第十一章調(diào)查中的非抽樣誤差§11.1引言1同抽樣誤差相比,非抽樣誤差有如下特點(diǎn):1、非抽樣誤差不是由于抽樣的隨機(jī)性帶來(lái)的,所以在抽樣調(diào)查中,它不可能隨著樣本量的增大而減??;2、在抽樣調(diào)查中,由于非抽樣誤差的影響,往往造成估計(jì)量的有偏;3、有些非抽樣誤差難以識(shí)別和測(cè)定。如抽樣框是不完善的,而調(diào)查設(shè)計(jì)人員并沒(méi)有意識(shí)到;4、有些非抽樣誤差成因復(fù)雜,對(duì)其研究不夠,因此,在很多時(shí)候非抽樣誤差比抽樣誤差造成的影響更嚴(yán)重,對(duì)此必須引起高度重視。同抽樣誤差相比,非抽樣誤差有如下特點(diǎn):2根據(jù)非抽樣誤差的來(lái)源、性質(zhì)

可分為以下三類(lèi):(1)抽樣框誤差,即由不完善的抽樣框引起的誤差;(2)無(wú)回答誤差,即由于種種原因沒(méi)有從被調(diào)查單元獲得調(diào)查結(jié)果,造成調(diào)查數(shù)據(jù)的缺失;(3)計(jì)量誤差,即所獲得的調(diào)查數(shù)據(jù)與其真值之間不一致造成的誤差。根據(jù)非抽樣誤差的來(lái)源、性質(zhì)

可分為以下三類(lèi):(1)抽樣框誤3一、概念抽樣調(diào)查中的總體有兩個(gè):目標(biāo)總體—調(diào)查研究對(duì)象的全體。抽樣總體—從中抽取樣本的總體。(即抽樣框)理想抽樣框的標(biāo)志是目標(biāo)總體和抽樣總體完全重合。否則抽樣框就是不完善的?!?1.2抽樣框誤差一、概念§11.2抽樣框誤差4二、抽樣框誤差的類(lèi)型及影響(1)抽樣框誤差的類(lèi)型●丟失目標(biāo)總體單元?!癜悄繕?biāo)總體單元?!癯闃涌蛑械膯卧c目標(biāo)總體單元不一一對(duì)應(yīng)。(存在一對(duì)多或多對(duì)一的情況)●不正確的輔助信息。(如分層抽樣、不等概抽樣、比率估計(jì)和回歸估計(jì)等所需的輔助信息)二、抽樣框誤差的類(lèi)型及影響(1)抽樣框誤差的類(lèi)型5(2)對(duì)抽樣框誤差的基本認(rèn)識(shí)●有些誤差來(lái)自構(gòu)成抽樣框資料本身,而不是由于抽樣設(shè)計(jì)的問(wèn)題?!癯闃涌虼嬖诘膯?wèn)題,有些是不容易解決的。因此抽樣框的維護(hù)、抽樣框使用情況的不斷總結(jié)與研討,對(duì)于經(jīng)常性的調(diào)查項(xiàng)目來(lái)說(shuō)是十分必要的?!癯闃涌虻牟煌晟撇⒉皇遣荒苁褂???梢赃M(jìn)行修補(bǔ)、調(diào)整。(2)對(duì)抽樣框誤差的基本認(rèn)識(shí)6(3)抽樣框誤差的影響設(shè)目標(biāo)總體單元:N抽樣框中單元:N1抽樣框中丟失的單元:N0

N=N1+N0

■總體總量的估計(jì)總體總量的真值是:現(xiàn)從抽樣框中的N1個(gè)單元中采用簡(jiǎn)單隨機(jī)抽樣抽出容量為n的一個(gè)樣本,由于n取自于N1對(duì)總體總量的估計(jì)為:(3)抽樣框誤差的影響現(xiàn)從抽樣框中的N1個(gè)單元中7顯然此時(shí)的估計(jì)是有偏的,偏倚為:這表明估計(jì)量低估了總體總量,令Y的相對(duì)偏倚可以寫(xiě)為顯然此時(shí)的估計(jì)是有偏的,偏倚為:這表明估計(jì)量低估了總體總量,8由上式可知,總體總和的相對(duì)偏倚取決于

和■總體均值的估計(jì)在抽樣框存在丟失單元情況下,均值估計(jì)量為:此時(shí)估計(jì)量的偏倚為:的相對(duì)偏倚可以寫(xiě)為:由上式可知,總體總和的相對(duì)偏倚取決于和■9由上式可以看出,如果丟失單元的均值與抽樣單元的均值相同,即,則估計(jì)量是目標(biāo)變量的無(wú)偏估計(jì)。反之,如果,偏倚狀況則隨著的變化而變化。由上式可以看出,如果丟失單元的均值與抽樣單10三、不完善抽樣框的使用抽樣框不完善并不是不能使用,因?yàn)闃?gòu)造一個(gè)完善的抽樣框有時(shí)是非常困難的。使用不完善抽樣框時(shí)若能采用一些補(bǔ)救措施,有助于減小抽樣框誤差。主要采用以下三項(xiàng)補(bǔ)救措施:

●利用核查,掌握誤差情況,對(duì)不完善抽樣框進(jìn)行調(diào)整;●事先制定一些規(guī)則,對(duì)發(fā)現(xiàn)的抽樣框問(wèn)題進(jìn)行現(xiàn)場(chǎng)處理;

●使用多個(gè)抽樣框進(jìn)行抽樣。三、不完善抽樣框的使用抽樣框不完善并不11§11.3無(wú)回答誤差一、概念

無(wú)回答誤差是指在調(diào)查中由于各種原因,調(diào)查人員沒(méi)能夠從入選樣本的單元處獲得所需要的信息,由于數(shù)據(jù)缺失造成估計(jì)量的偏差。無(wú)回答誤差是一種重要的非抽樣誤差,這種現(xiàn)象十分普遍,對(duì)估計(jì)量的危害也比較大,所以國(guó)際上對(duì)這方面的討論一直比較熱烈,目前這種討論還在繼續(xù)?!?1.3無(wú)回答誤差一、概念12從無(wú)回答的內(nèi)容來(lái)看可分為:

單元無(wú)回答(被調(diào)查單元沒(méi)有參入或拒絕受調(diào)查,他們交的是一份白卷)

項(xiàng)目無(wú)回答

(被調(diào)查單元雖然接受了調(diào)查,但對(duì)其中的一些項(xiàng)目沒(méi)有回答)從無(wú)回答的內(nèi)容來(lái)看可分為:13從無(wú)回答的性質(zhì)來(lái)看可分為:

有意無(wú)回答(有意無(wú)回答常常與調(diào)查內(nèi)容有關(guān),如對(duì)調(diào)查內(nèi)容反感,或涉及個(gè)人隱私不愿意回答)

無(wú)意無(wú)回答

(無(wú)意無(wú)回答常常與調(diào)查內(nèi)容無(wú)關(guān),之所以無(wú)回答是因?yàn)楸徽{(diào)查者生病或很忙,無(wú)法接受調(diào)查)從無(wú)回答的性質(zhì)來(lái)看可分為:14

有意無(wú)回答對(duì)數(shù)據(jù)質(zhì)量的影響很大,回答者和不回答者之間往往存在系統(tǒng)性差異。這種不回答不僅減少了有效樣本量,造成估計(jì)量方差增大,而且會(huì)帶來(lái)估計(jì)偏倚。

無(wú)意無(wú)回答可以看成是隨機(jī)的,這種不回答雖然會(huì)造成估計(jì)量方差增大,但通常認(rèn)為不會(huì)帶來(lái)估計(jì)偏倚。

有意無(wú)回答對(duì)數(shù)據(jù)質(zhì)量的影響很大,回答者和15

二、無(wú)回答產(chǎn)生的原因及影響如果把采集數(shù)據(jù)的過(guò)程劃分為查找、接觸和采訪三個(gè)階段,三個(gè)階段都有可能出現(xiàn)無(wú)回答。1、查找階段調(diào)查人員無(wú)法找到被調(diào)查者,主要原因有地址不詳、被調(diào)查者搬遷、調(diào)查人員不熟悉地址;2、接觸階段被調(diào)查生病、對(duì)調(diào)查不感興趣或別的原因拒訪;3、采訪階段調(diào)查開(kāi)始后被調(diào)查者對(duì)某些問(wèn)題不愿提供答案、調(diào)查員由于粗心遺漏某些項(xiàng)目等二、無(wú)回答產(chǎn)生的原因及影響1、查找階段調(diào)查人員16無(wú)回答的影響:回答層(N1)總體(N)無(wú)回答層(N0)則總體均值為:回答層樣本(n1)總體樣本(n)

無(wú)回答層樣本(n0

)無(wú)回答的影響:則總體均值為:17根據(jù)回答層單元計(jì)算出的樣本均值為用作為總體真值得估計(jì)量,其偏倚為:偏倚相對(duì)偏倚由上式可以看出:無(wú)回答偏倚主要來(lái)自兩個(gè)方面:一個(gè)是回答層與無(wú)回答層之間的數(shù)量差異;一個(gè)是無(wú)回答率。根據(jù)回答層單元計(jì)算出的樣本均值為偏倚相對(duì)偏倚由18三、降低無(wú)回答的措施主要措施是預(yù)防,預(yù)防措施有:●問(wèn)卷設(shè)計(jì)得具有吸引力;●注意適當(dāng)?shù)拈L(zhǎng)度;●充分利用調(diào)查組織單位的權(quán)威性和影響力;●注意調(diào)查員的挑選;●做好調(diào)查員的培訓(xùn);●注意調(diào)查過(guò)程的監(jiān)控;●獎(jiǎng)勵(lì)措施;●再次調(diào)查。三、降低無(wú)回答的措施主要措施是預(yù)防,預(yù)防措施有:19四、對(duì)存在無(wú)回答數(shù)據(jù)的調(diào)整

調(diào)查中無(wú)回答的情況總是難以避免,由于無(wú)回答造成數(shù)據(jù)不全,如果不加處理,就有可能造成估計(jì)量偏倚。下面介紹幾種數(shù)據(jù)調(diào)整的方法:

1、再抽樣調(diào)整在第一次無(wú)回答的單元中隨機(jī)抽取一個(gè)子樣本,通過(guò)更細(xì)致、更充分的工作,獲得該子樣本的數(shù)據(jù),作為整個(gè)無(wú)回答層的代表值。四、對(duì)存在無(wú)回答數(shù)據(jù)的調(diào)整調(diào)查中無(wú)回答的情20

2、加權(quán)調(diào)整

對(duì)存在無(wú)回答數(shù)據(jù)進(jìn)行補(bǔ)救的另一種方法是采用加權(quán)調(diào)整。加權(quán)調(diào)整法是通過(guò)對(duì)調(diào)查中所獲得的回答數(shù)據(jù)使用加權(quán)因子,達(dá)到對(duì)數(shù)據(jù)的調(diào)整,減小由于無(wú)回答造成的估計(jì)偏倚。

3、相關(guān)推估法

相關(guān)推估法主要用于調(diào)查中的項(xiàng)目無(wú)回答,即調(diào)查單元不是完全拒絕調(diào)查,而是拒絕其中某些項(xiàng)目的調(diào)查。這時(shí)可以利用回答項(xiàng)目的信息對(duì)無(wú)回答數(shù)據(jù)進(jìn)行推估。2、加權(quán)調(diào)整214、插補(bǔ)調(diào)整

在數(shù)據(jù)整理階段,利用調(diào)查結(jié)果,采用一定的方式,為無(wú)回答的缺失值確定一個(gè)合理的估計(jì)值,插補(bǔ)到原缺失數(shù)據(jù)的位置上。實(shí)際使用時(shí),用得較多的是均值插補(bǔ),其方法是:首先根據(jù)輔助信息將樣本分為若干組,是組內(nèi)各單元的主要特征相似。然后分別計(jì)算各組目標(biāo)變量Y的均值,將各組均值作為組內(nèi)所有缺失項(xiàng)的替補(bǔ)值4、插補(bǔ)調(diào)整22§11.4計(jì)量誤差

計(jì)量誤差是指由于種種原因,調(diào)查中所獲得的數(shù)據(jù)與真值不一致。計(jì)量誤差主要成因來(lái)自于以下幾個(gè)方面:

●設(shè)計(jì)誤差(設(shè)計(jì)方面原因造成計(jì)量誤差)

●被調(diào)查者誤差(被調(diào)查者提供的數(shù)據(jù)失真)

●調(diào)查者誤差(現(xiàn)場(chǎng)調(diào)查人員造成的誤差)●其他誤差(由于測(cè)量工具、編碼、錄入)§11.4計(jì)量誤差計(jì)量誤差是指由于種種23減少計(jì)量誤差的措施

減少計(jì)量誤差需要對(duì)調(diào)查全過(guò)程進(jìn)行質(zhì)量監(jiān)控:(1)調(diào)查設(shè)計(jì)方面調(diào)查問(wèn)卷設(shè)計(jì)出來(lái)后,應(yīng)組織有關(guān)人員對(duì)問(wèn)卷進(jìn)行討論。如果是大型調(diào)查活動(dòng),還要在正式調(diào)查之前進(jìn)行預(yù)調(diào)查,在實(shí)踐中對(duì)問(wèn)卷進(jìn)行檢驗(yàn)。(2)現(xiàn)場(chǎng)準(zhǔn)備方面在收集數(shù)據(jù)之前,需要做好準(zhǔn)備工作:招聘調(diào)查員;培訓(xùn)訪問(wèn)員;編寫(xiě)調(diào)查手冊(cè)。減少計(jì)量誤差的措施減少計(jì)量誤差需要對(duì)調(diào)查全24(3)調(diào)查結(jié)果審核方面審核是對(duì)調(diào)查質(zhì)量進(jìn)行控制的一道重要的工序,也是減少計(jì)量誤差的有效方法。審核的目的是要保證調(diào)查所得數(shù)據(jù)的完整性、一致性和有效性。審核可以在調(diào)查過(guò)程中的任何階段進(jìn)行:

收據(jù)數(shù)據(jù)時(shí)進(jìn)行審核(調(diào)查員在調(diào)查進(jìn)行過(guò)程中根據(jù)常識(shí)和經(jīng)驗(yàn),可以判斷出一些問(wèn)題的答案是否屬于“可接受”范圍)

數(shù)據(jù)收集完畢后的審核(審核的重點(diǎn)是數(shù)據(jù)的一致性審核和離群值的檢測(cè))(3)調(diào)查結(jié)果審核方面審核是對(duì)調(diào)查質(zhì)量進(jìn)行控制25§11.5離群值的檢測(cè)和處理一、離群值的概念離群值是指調(diào)查數(shù)據(jù)集中的極端值,是指與其他數(shù)據(jù)明顯不一致的觀測(cè)值。離群值的出現(xiàn)可能有以下兩個(gè)原因:由于數(shù)據(jù)本身具有的差異性。看起來(lái)值得懷疑的東西也許是真實(shí)的;由于被調(diào)查者回答數(shù)據(jù)有錯(cuò)誤或調(diào)查人員記錄數(shù)據(jù)有錯(cuò)誤?!?1.5離群值的檢測(cè)和處理一、離群值的概念26二、離群值的確認(rèn)

通常離群值的檢測(cè)是通過(guò)測(cè)量它們與數(shù)據(jù)中心的相對(duì)距離來(lái)辨認(rèn)的。例如,若是要觀測(cè)的樣本數(shù)據(jù),m和s分別是側(cè)度數(shù)據(jù)集中趨勢(shì)和離散趨勢(shì)的指標(biāo),那么,離數(shù)據(jù)中心的相對(duì)距離可以定義為二、離群值的確認(rèn)通常離群值的檢測(cè)是通過(guò)測(cè)量它27

如果越過(guò)了預(yù)先確定的偏離值,那么該觀測(cè)值就被認(rèn)為是離群的。另外,離群值也可以通過(guò)下面的置信區(qū)間進(jìn)行確認(rèn):式中和分別為根據(jù)預(yù)先確定的置信度得到的標(biāo)準(zhǔn)正態(tài)分布的上限和下限值。落在這個(gè)區(qū)間之外的觀測(cè)值被認(rèn)為是離群值。

如果越過(guò)了預(yù)先確定的偏離值,那么28三、離群值的處理

如果在調(diào)查進(jìn)行中發(fā)現(xiàn)離群值,就要及時(shí)處理,例如進(jìn)行回訪核實(shí),對(duì)錯(cuò)誤進(jìn)行更正。如果在調(diào)查完畢后的審核中發(fā)現(xiàn)離群值,通常對(duì)離群值采用插補(bǔ)處理,即將離群值剔除,然后使用插補(bǔ)法調(diào)整。如果在審核時(shí)沒(méi)有進(jìn)行處理的離群值可以在估計(jì)的時(shí)候處理。估計(jì)時(shí)有以下三種方法處理離群值:三、離群值的處理如果在調(diào)查進(jìn)行中發(fā)現(xiàn)離29

●改變數(shù)值

這種方法首先要將樣本數(shù)據(jù)按從大到小依次排序,然后再按下面的步驟計(jì)算:在簡(jiǎn)單隨機(jī)抽樣中,總體總量Y的無(wú)偏估計(jì)公式為:式中,i表示樣本中第i個(gè)單元,s為所有樣本的集合.●改變數(shù)值式中,i表示樣本中第i個(gè)單元,s為所有樣30

若樣本數(shù)據(jù)中第k個(gè)最大值kth被認(rèn)為是離群值,單側(cè)k次縮尾估計(jì)量就可以通過(guò)第n-k個(gè)最大值yn-k代替這些離群值,即●調(diào)整權(quán)重

處理離群值的另一種方法是降低離群值的權(quán)重,從而使它們的影響變小。例如,賦予離群值的權(quán)重為1,即離群值僅僅代表它自己而不代表其他總體單元。若樣本數(shù)據(jù)中第k個(gè)最大值kth被認(rèn)為是離31

●選取穩(wěn)健估計(jì)量

在經(jīng)典的估計(jì)理論中,通常假定估計(jì)量服從正態(tài)分布,樣本均值和樣本方差估計(jì)量在正態(tài)分布的假設(shè)下也是最理想的。但是,這些估計(jì)量對(duì)離群值非常敏感。穩(wěn)健估計(jì)量則能克服這種局限性,例如中位數(shù)比均值更穩(wěn)定,四分位數(shù)比通常的方差估計(jì)量更穩(wěn)定。(第十一章結(jié)束)●選取穩(wěn)健估計(jì)量(第十一章結(jié)束)32第十一章調(diào)查中的非抽樣誤差§11.1引言

非抽樣誤差是指除抽樣誤差以外的,由于各種原因引起的誤差。在概率抽樣、非概率抽樣、其他全面調(diào)查和非全面調(diào)查已及普查中,非抽樣誤差都有可能存在。第十一章調(diào)查中的非抽樣誤差§11.1引言33同抽樣誤差相比,非抽樣誤差有如下特點(diǎn):1、非抽樣誤差不是由于抽樣的隨機(jī)性帶來(lái)的,所以在抽樣調(diào)查中,它不可能隨著樣本量的增大而減??;2、在抽樣調(diào)查中,由于非抽樣誤差的影響,往往造成估計(jì)量的有偏;3、有些非抽樣誤差難以識(shí)別和測(cè)定。如抽樣框是不完善的,而調(diào)查設(shè)計(jì)人員并沒(méi)有意識(shí)到;4、有些非抽樣誤差成因復(fù)雜,對(duì)其研究不夠,因此,在很多時(shí)候非抽樣誤差比抽樣誤差造成的影響更嚴(yán)重,對(duì)此必須引起高度重視。同抽樣誤差相比,非抽樣誤差有如下特點(diǎn):34根據(jù)非抽樣誤差的來(lái)源、性質(zhì)

可分為以下三類(lèi):(1)抽樣框誤差,即由不完善的抽樣框引起的誤差;(2)無(wú)回答誤差,即由于種種原因沒(méi)有從被調(diào)查單元獲得調(diào)查結(jié)果,造成調(diào)查數(shù)據(jù)的缺失;(3)計(jì)量誤差,即所獲得的調(diào)查數(shù)據(jù)與其真值之間不一致造成的誤差。根據(jù)非抽樣誤差的來(lái)源、性質(zhì)

可分為以下三類(lèi):(1)抽樣框誤35一、概念抽樣調(diào)查中的總體有兩個(gè):目標(biāo)總體—調(diào)查研究對(duì)象的全體。抽樣總體—從中抽取樣本的總體。(即抽樣框)理想抽樣框的標(biāo)志是目標(biāo)總體和抽樣總體完全重合。否則抽樣框就是不完善的。§11.2抽樣框誤差一、概念§11.2抽樣框誤差36二、抽樣框誤差的類(lèi)型及影響(1)抽樣框誤差的類(lèi)型●丟失目標(biāo)總體單元?!癜悄繕?biāo)總體單元?!癯闃涌蛑械膯卧c目標(biāo)總體單元不一一對(duì)應(yīng)。(存在一對(duì)多或多對(duì)一的情況)●不正確的輔助信息。(如分層抽樣、不等概抽樣、比率估計(jì)和回歸估計(jì)等所需的輔助信息)二、抽樣框誤差的類(lèi)型及影響(1)抽樣框誤差的類(lèi)型37(2)對(duì)抽樣框誤差的基本認(rèn)識(shí)●有些誤差來(lái)自構(gòu)成抽樣框資料本身,而不是由于抽樣設(shè)計(jì)的問(wèn)題。●抽樣框存在的問(wèn)題,有些是不容易解決的。因此抽樣框的維護(hù)、抽樣框使用情況的不斷總結(jié)與研討,對(duì)于經(jīng)常性的調(diào)查項(xiàng)目來(lái)說(shuō)是十分必要的?!癯闃涌虻牟煌晟撇⒉皇遣荒苁褂???梢赃M(jìn)行修補(bǔ)、調(diào)整。(2)對(duì)抽樣框誤差的基本認(rèn)識(shí)38(3)抽樣框誤差的影響設(shè)目標(biāo)總體單元:N抽樣框中單元:N1抽樣框中丟失的單元:N0

N=N1+N0

■總體總量的估計(jì)總體總量的真值是:現(xiàn)從抽樣框中的N1個(gè)單元中采用簡(jiǎn)單隨機(jī)抽樣抽出容量為n的一個(gè)樣本,由于n取自于N1對(duì)總體總量的估計(jì)為:(3)抽樣框誤差的影響現(xiàn)從抽樣框中的N1個(gè)單元中39顯然此時(shí)的估計(jì)是有偏的,偏倚為:這表明估計(jì)量低估了總體總量,令Y的相對(duì)偏倚可以寫(xiě)為顯然此時(shí)的估計(jì)是有偏的,偏倚為:這表明估計(jì)量低估了總體總量,40由上式可知,總體總和的相對(duì)偏倚取決于

和■總體均值的估計(jì)在抽樣框存在丟失單元情況下,均值估計(jì)量為:此時(shí)估計(jì)量的偏倚為:的相對(duì)偏倚可以寫(xiě)為:由上式可知,總體總和的相對(duì)偏倚取決于和■41由上式可以看出,如果丟失單元的均值與抽樣單元的均值相同,即,則估計(jì)量是目標(biāo)變量的無(wú)偏估計(jì)。反之,如果,偏倚狀況則隨著的變化而變化。由上式可以看出,如果丟失單元的均值與抽樣單42三、不完善抽樣框的使用抽樣框不完善并不是不能使用,因?yàn)闃?gòu)造一個(gè)完善的抽樣框有時(shí)是非常困難的。使用不完善抽樣框時(shí)若能采用一些補(bǔ)救措施,有助于減小抽樣框誤差。主要采用以下三項(xiàng)補(bǔ)救措施:

●利用核查,掌握誤差情況,對(duì)不完善抽樣框進(jìn)行調(diào)整;●事先制定一些規(guī)則,對(duì)發(fā)現(xiàn)的抽樣框問(wèn)題進(jìn)行現(xiàn)場(chǎng)處理;

●使用多個(gè)抽樣框進(jìn)行抽樣。三、不完善抽樣框的使用抽樣框不完善并不43§11.3無(wú)回答誤差一、概念

無(wú)回答誤差是指在調(diào)查中由于各種原因,調(diào)查人員沒(méi)能夠從入選樣本的單元處獲得所需要的信息,由于數(shù)據(jù)缺失造成估計(jì)量的偏差。無(wú)回答誤差是一種重要的非抽樣誤差,這種現(xiàn)象十分普遍,對(duì)估計(jì)量的危害也比較大,所以國(guó)際上對(duì)這方面的討論一直比較熱烈,目前這種討論還在繼續(xù)?!?1.3無(wú)回答誤差一、概念44從無(wú)回答的內(nèi)容來(lái)看可分為:

單元無(wú)回答(被調(diào)查單元沒(méi)有參入或拒絕受調(diào)查,他們交的是一份白卷)

項(xiàng)目無(wú)回答

(被調(diào)查單元雖然接受了調(diào)查,但對(duì)其中的一些項(xiàng)目沒(méi)有回答)從無(wú)回答的內(nèi)容來(lái)看可分為:45從無(wú)回答的性質(zhì)來(lái)看可分為:

有意無(wú)回答(有意無(wú)回答常常與調(diào)查內(nèi)容有關(guān),如對(duì)調(diào)查內(nèi)容反感,或涉及個(gè)人隱私不愿意回答)

無(wú)意無(wú)回答

(無(wú)意無(wú)回答常常與調(diào)查內(nèi)容無(wú)關(guān),之所以無(wú)回答是因?yàn)楸徽{(diào)查者生病或很忙,無(wú)法接受調(diào)查)從無(wú)回答的性質(zhì)來(lái)看可分為:46

有意無(wú)回答對(duì)數(shù)據(jù)質(zhì)量的影響很大,回答者和不回答者之間往往存在系統(tǒng)性差異。這種不回答不僅減少了有效樣本量,造成估計(jì)量方差增大,而且會(huì)帶來(lái)估計(jì)偏倚。

無(wú)意無(wú)回答可以看成是隨機(jī)的,這種不回答雖然會(huì)造成估計(jì)量方差增大,但通常認(rèn)為不會(huì)帶來(lái)估計(jì)偏倚。

有意無(wú)回答對(duì)數(shù)據(jù)質(zhì)量的影響很大,回答者和47

二、無(wú)回答產(chǎn)生的原因及影響如果把采集數(shù)據(jù)的過(guò)程劃分為查找、接觸和采訪三個(gè)階段,三個(gè)階段都有可能出現(xiàn)無(wú)回答。1、查找階段調(diào)查人員無(wú)法找到被調(diào)查者,主要原因有地址不詳、被調(diào)查者搬遷、調(diào)查人員不熟悉地址;2、接觸階段被調(diào)查生病、對(duì)調(diào)查不感興趣或別的原因拒訪;3、采訪階段調(diào)查開(kāi)始后被調(diào)查者對(duì)某些問(wèn)題不愿提供答案、調(diào)查員由于粗心遺漏某些項(xiàng)目等二、無(wú)回答產(chǎn)生的原因及影響1、查找階段調(diào)查人員48無(wú)回答的影響:回答層(N1)總體(N)無(wú)回答層(N0)則總體均值為:回答層樣本(n1)總體樣本(n)

無(wú)回答層樣本(n0

)無(wú)回答的影響:則總體均值為:49根據(jù)回答層單元計(jì)算出的樣本均值為用作為總體真值得估計(jì)量,其偏倚為:偏倚相對(duì)偏倚由上式可以看出:無(wú)回答偏倚主要來(lái)自兩個(gè)方面:一個(gè)是回答層與無(wú)回答層之間的數(shù)量差異;一個(gè)是無(wú)回答率。根據(jù)回答層單元計(jì)算出的樣本均值為偏倚相對(duì)偏倚由50三、降低無(wú)回答的措施主要措施是預(yù)防,預(yù)防措施有:●問(wèn)卷設(shè)計(jì)得具有吸引力;●注意適當(dāng)?shù)拈L(zhǎng)度;●充分利用調(diào)查組織單位的權(quán)威性和影響力;●注意調(diào)查員的挑選;●做好調(diào)查員的培訓(xùn);●注意調(diào)查過(guò)程的監(jiān)控;●獎(jiǎng)勵(lì)措施;●再次調(diào)查。三、降低無(wú)回答的措施主要措施是預(yù)防,預(yù)防措施有:51四、對(duì)存在無(wú)回答數(shù)據(jù)的調(diào)整

調(diào)查中無(wú)回答的情況總是難以避免,由于無(wú)回答造成數(shù)據(jù)不全,如果不加處理,就有可能造成估計(jì)量偏倚。下面介紹幾種數(shù)據(jù)調(diào)整的方法:

1、再抽樣調(diào)整在第一次無(wú)回答的單元中隨機(jī)抽取一個(gè)子樣本,通過(guò)更細(xì)致、更充分的工作,獲得該子樣本的數(shù)據(jù),作為整個(gè)無(wú)回答層的代表值。四、對(duì)存在無(wú)回答數(shù)據(jù)的調(diào)整調(diào)查中無(wú)回答的情52

2、加權(quán)調(diào)整

對(duì)存在無(wú)回答數(shù)據(jù)進(jìn)行補(bǔ)救的另一種方法是采用加權(quán)調(diào)整。加權(quán)調(diào)整法是通過(guò)對(duì)調(diào)查中所獲得的回答數(shù)據(jù)使用加權(quán)因子,達(dá)到對(duì)數(shù)據(jù)的調(diào)整,減小由于無(wú)回答造成的估計(jì)偏倚。

3、相關(guān)推估法

相關(guān)推估法主要用于調(diào)查中的項(xiàng)目無(wú)回答,即調(diào)查單元不是完全拒絕調(diào)查,而是拒絕其中某些項(xiàng)目的調(diào)查。這時(shí)可以利用回答項(xiàng)目的信息對(duì)無(wú)回答數(shù)據(jù)進(jìn)行推估。2、加權(quán)調(diào)整534、插補(bǔ)調(diào)整

在數(shù)據(jù)整理階段,利用調(diào)查結(jié)果,采用一定的方式,為無(wú)回答的缺失值確定一個(gè)合理的估計(jì)值,插補(bǔ)到原缺失數(shù)據(jù)的位置上。實(shí)際使用時(shí),用得較多的是均值插補(bǔ),其方法是:首先根據(jù)輔助信息將樣本分為若干組,是組內(nèi)各單元的主要特征相似。然后分別計(jì)算各組目標(biāo)變量Y的均值,將各組均值作為組內(nèi)所有缺失項(xiàng)的替補(bǔ)值4、插補(bǔ)調(diào)整54§11.4計(jì)量誤差

計(jì)量誤差是指由于種種原因,調(diào)查中所獲得的數(shù)據(jù)與真值不一致。計(jì)量誤差主要成因來(lái)自于以下幾個(gè)方面:

●設(shè)計(jì)誤差(設(shè)計(jì)方面原因造成計(jì)量誤差)

●被調(diào)查者誤差(被調(diào)查者提供的數(shù)據(jù)失真)

●調(diào)查者誤差(現(xiàn)場(chǎng)調(diào)查人員造成的誤差)●其他誤差(由于測(cè)量工具、編碼、錄入)§11.4計(jì)量誤差計(jì)量誤差是指由于種種55減少計(jì)量誤差的措施

減少計(jì)量誤差需要對(duì)調(diào)查全過(guò)程進(jìn)行質(zhì)量監(jiān)控:(1)調(diào)查設(shè)計(jì)方面調(diào)查問(wèn)卷設(shè)計(jì)出來(lái)后,應(yīng)組織有關(guān)人員對(duì)問(wèn)卷進(jìn)行討論。如果是大型調(diào)查活動(dòng),還要在正式調(diào)查之前進(jìn)行預(yù)調(diào)查,在實(shí)踐中對(duì)問(wèn)卷進(jìn)行檢驗(yàn)。(2)現(xiàn)場(chǎng)準(zhǔn)備方面在收集數(shù)據(jù)之前,需要做好準(zhǔn)備工作:招聘調(diào)查員;培訓(xùn)訪問(wèn)員;編寫(xiě)調(diào)查手冊(cè)。減少計(jì)量誤差的措施減少計(jì)量誤差需要對(duì)調(diào)查全56(3)調(diào)查結(jié)果審核方面審核是對(duì)調(diào)查質(zhì)量進(jìn)行控制的一道重要的工序,也是減少計(jì)量誤差的有效方法。審核的目的是要保證調(diào)查所得數(shù)據(jù)的完整性、一致性和有效性。審核可以在調(diào)查過(guò)程中的任何階段進(jìn)行:

收據(jù)數(shù)據(jù)時(shí)進(jìn)行審核(調(diào)查員在調(diào)查進(jìn)行過(guò)程中根據(jù)常識(shí)和經(jīng)驗(yàn),可以判斷出一些問(wèn)題的答案是否屬于“可接受”范圍)

數(shù)據(jù)收集完畢后的審核(審核的重點(diǎn)是數(shù)據(jù)的一致性審核和離群值的檢測(cè))(3)調(diào)查結(jié)果審核方面審核是對(duì)調(diào)查質(zhì)量進(jìn)行控制57§11.5離群值的檢測(cè)和處理一、離群值的概念離群值是指調(diào)查數(shù)據(jù)集中的極端值,是指與其他數(shù)據(jù)明顯不一致的觀測(cè)值。離群值的出現(xiàn)可能有以下兩個(gè)原因:由

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論