




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、中國勞動力動態(tài)(CLDS)“勞動力數(shù)據(jù)”權(quán)數(shù)計(jì)算說明梁中山大會科學(xué)中心二一三年四月本說明系中山大會科學(xué)中心“中國勞動力動態(tài)(CLDS)”的版本。說明文件。本說明文件會隨著時間不斷有所更新,提醒讀者注意是否本文的梁 技術(shù)建議:,中山大,2013,中國勞動力追蹤計(jì)算說明,中國勞動力追蹤系列會科學(xué)中心。聯(lián)絡(luò)方式:中山大會科學(xué)中心目錄介紹一、村居問卷的權(quán)數(shù)(一)、村居的抽樣設(shè)計(jì)權(quán)數(shù)(二)、執(zhí)行調(diào)整權(quán)數(shù)二、家庭問卷的權(quán)數(shù)(一)、抽樣設(shè)計(jì)權(quán)數(shù)(二)、執(zhí)行調(diào)整權(quán)數(shù)(三)、事后分層調(diào)整權(quán)數(shù)(四)、家庭戶的各類的效果對比:三、勞動力問卷的權(quán)數(shù)(一)、抽樣設(shè)計(jì)權(quán)數(shù)(二)、執(zhí)行調(diào)整權(quán)數(shù)(三)、事后分層調(diào)整權(quán)數(shù)(四)
2、、勞動力的各類的效果對比:四、變量列表五、使用的注意事項(xiàng)六、使用 SA進(jìn)行分析的說明介紹這份帶有備忘錄性質(zhì)的文件勞動力動態(tài)(以下簡稱“CLDS”)”國際的技術(shù)的,該方法所的,是勞動力動態(tài)下獲得的成果?!爸袊鴦趧恿討B(tài)”國際委員會成員如下:()基于的建議,中國勞動力動態(tài)(CLDS)被設(shè)計(jì)成一個輪換跟。CLDS作為一個輪換蹤 告主,其權(quán)數(shù)包含基線權(quán)數(shù)和追蹤權(quán)數(shù)。本報方法。明其基線數(shù)據(jù)的CLDS基線抽樣框(東部的抽樣設(shè)計(jì)是一個三階段不等概率的整群抽樣設(shè)計(jì),包含7個大省群、中部大省群、西部大省群、東部小省群、中部小省群、西部小省群、補(bǔ)充樣本)組成的7個子總體(樣小省本、東部大省樣本、中部大省樣本、西部
3、小省樣本、大省樣本、東部補(bǔ)充樣本)。樣本、中部小省樣本、西部CLDS一共進(jìn)行了3個層次的,即村居層次、家庭層次和勞動力層次。所以提供這3個層次的數(shù)據(jù)庫。每個數(shù)據(jù)庫包含多個變量,為了得到目標(biāo)變量的無偏或近似無偏估計(jì)量,并對數(shù)據(jù)進(jìn)行更準(zhǔn)確的定量分析,CLDS的權(quán)數(shù)進(jìn)行了計(jì)算,并向使用者提供對社區(qū)、家庭和勞動力的每個回答抽樣設(shè)計(jì)權(quán)數(shù)、調(diào)整權(quán)數(shù)、事后調(diào)整權(quán)數(shù)三種類型的權(quán)數(shù)。為了幫助讀者使用這些權(quán)數(shù),分析的說明。介紹了在SA下使用這些權(quán)數(shù)進(jìn)行一、村居問卷的權(quán)數(shù)(一)、村居的抽樣設(shè)計(jì)權(quán)數(shù)抽樣設(shè)計(jì)權(quán)數(shù)即樣本單元入樣概率的倒數(shù)。CLDS 的村居抽樣是按 2 個階段進(jìn)行的,所以該類權(quán)數(shù)計(jì)算的過程中需要考慮 2
4、個階段的權(quán)數(shù),即在每個抽樣框中抽取樣本區(qū)縣的權(quán)數(shù)、在每個樣本區(qū)縣中抽取樣本村居的權(quán)數(shù)。1、第一階段的設(shè)計(jì)權(quán)數(shù)第一階段的抽樣設(shè)計(jì)概率是每個抽樣框中每個樣本區(qū)縣的入樣概率,即:Nsjpcj;其中, N 是第s個抽樣框的總數(shù), N 是第s個抽樣框中第j個sjssj/樣本區(qū)縣的數(shù), Js 是第s個抽樣框的樣本區(qū)縣的總個數(shù)。下標(biāo)s表示抽樣框,s=1,2,7;下標(biāo) j 表示區(qū)縣,j=1,2, n j , n j 表示第i個抽樣框中抽中的區(qū)縣樣本數(shù)。第一階段的設(shè)計(jì)權(quán)數(shù)是第一階段的設(shè)計(jì)概率的倒數(shù)。2、第二階段的抽樣權(quán)數(shù)第二階段的抽樣設(shè)計(jì)概率是每個樣本縣區(qū)中每個樣本村居的入樣概率,即:Nsjkpcj;其中, N
5、 是第s個抽樣框第k個區(qū)縣的總數(shù), N是第s個sjksksjksk /s抽樣框中第j個樣本區(qū)縣中的第k個村居的總數(shù), Ks 是第s個抽樣框的第j個樣本區(qū)縣的村居總數(shù)。下標(biāo)k表示村居,k=1,2, nk , nk 表示第k抽中的區(qū)縣中的村居樣本總數(shù)。針對補(bǔ)充樣本的調(diào)整。為了可以更精確的分析大城市樣本,采用了補(bǔ)充樣本的設(shè)計(jì)(supplemental sle design),即對于被抽中的大城市,其入樣概率在36%以上的虛擬區(qū),增加了一倍的村居樣本。最終有6個大城市有過度抽樣(oversle)。 因此需要建立一個新的權(quán)數(shù),將補(bǔ)充樣本與樣本(core sle)在一起。的補(bǔ)充樣本,是在第二階段抽取,因此
6、,需要在這個階段考慮新權(quán)數(shù)。使用了OMuircheartaigh and Pedlow (2002) 以及Wes(2006)混合方法補(bǔ)充樣本的增加,不應(yīng)該增加該城市在樣本中的比例。換(pooled approach)。句話說,新的該城市補(bǔ)充樣本與樣本的權(quán)數(shù)之和,也應(yīng)該等于該城市的規(guī)模。因此,假定分析某個變量 ,假設(shè)0 1,兩個樣本放在一起的值為: c (1 ) s其中, c 代表樣本的值, s 代表補(bǔ)充樣本的值。因?yàn)闃颖竞脱a(bǔ)充樣本是獨(dú)立的,因此作為權(quán)數(shù), 的最優(yōu)解為:nc / dc nc / dc ns / dsns / ds1 nc / dc ns / ds其中, nc 和ns 為樣本與補(bǔ)充
7、樣本的樣本量, dc 和ds 為樣本與補(bǔ)充樣本的設(shè)計(jì)效應(yīng)。因?yàn)樵O(shè)計(jì)中,樣本與補(bǔ)充樣本的樣本量相等,樣本與補(bǔ)充樣本的設(shè)計(jì)效應(yīng)也相等,因此, 0.5 。所以,在加抽補(bǔ)充樣本的大城市中,需要進(jìn)行的調(diào)整是,補(bǔ)充樣本與樣本的設(shè)計(jì)入樣概率為原來的一半。第二階段的設(shè)計(jì)權(quán)數(shù)是第二階段的設(shè)計(jì)概率的倒數(shù)。3、抽樣設(shè)計(jì)權(quán)數(shù)抽樣設(shè)計(jì)概率是上述 2 個各階段抽樣設(shè)計(jì)概率的乘積。 Nsj Nsjkpcj N Ndes/ J/ Ks s ssk抽樣設(shè)計(jì)權(quán)數(shù)就是抽樣設(shè)計(jì)概率的倒數(shù)。(二)、執(zhí)行調(diào)整權(quán)數(shù)無回答村居,是指在被抽中的縣區(qū)中,沒有獲得任何一份有效的家庭問卷。這種情況一共發(fā)生了15次,其中2個分布在無回答調(diào)整概率為:補(bǔ)
8、充樣本中。N cj sjpcjsjN cj jkN cj sj 和 N cj jk 分布代表第s個抽樣框中第j個樣本區(qū)縣中實(shí)際村居數(shù)量和設(shè)計(jì)村居數(shù)量。村居的執(zhí)行調(diào)整概率是抽樣設(shè)計(jì)概率乘以無回答調(diào)整概率: N cj sj NsjNsjkp cj runN / JN/ Kcjss sks Njk村居的執(zhí)行調(diào)整權(quán)數(shù)是村居的執(zhí)行調(diào)整概率的倒數(shù)。二、家庭問卷的權(quán)數(shù)(一)、抽樣設(shè)計(jì)權(quán)數(shù)CLDS 抽樣是按 3 個階段進(jìn)行抽取家庭的,所以權(quán)數(shù)計(jì)算的過程中需要考慮 3 個階段的權(quán)數(shù),即在每個抽樣框中抽取樣本區(qū)縣的權(quán)數(shù)、在每個樣本區(qū)縣中抽取樣本村居的權(quán)數(shù)、在每個樣本村居的家戶抽樣框中抽取樣本家戶的權(quán)數(shù)。1、第一階
9、段的設(shè)計(jì)權(quán)數(shù)第一階段的抽樣設(shè)計(jì)概率是每個抽樣框中每個樣本區(qū)縣的入樣概率,即:N hsjph;其中, Nhs 是第s個抽樣框的總戶數(shù), N sj 是第s個抽樣框中第jhsjhs /s個樣本區(qū)縣的總戶數(shù), Js 是第s個抽樣框的樣本區(qū)縣的總個數(shù)。下標(biāo)s表示抽樣框,s=1,2,7;下標(biāo) j 表示區(qū)縣,j=1,2, n j , n j 表示第i個抽樣框中抽中的區(qū)縣樣本數(shù)。第一階段的設(shè)計(jì)權(quán)數(shù)是第一階段的設(shè)計(jì)概率的倒數(shù)。2、第二階段的抽樣權(quán)數(shù)第二階段的抽樣設(shè)計(jì)概率是每個樣本縣區(qū)中每個樣本村居的入樣概率,即:N hsjkhhhp;其中, Nsk 是第s個抽樣框第k個區(qū)縣的總戶數(shù), N sjk 是第s個sjk
10、hsk /s抽樣框中第j個樣本區(qū)縣中的第k個村居的總戶數(shù), Ks 是第s個抽樣框的第j個樣本區(qū)縣的村居總數(shù)。下標(biāo)k表示村居,k=1,2, nk , nk 表示第k抽中的區(qū)縣中的村居樣本總數(shù)。針對補(bǔ)充樣本的調(diào)整。為了可以更精確的分析大城市樣本,采用了補(bǔ)充樣本的設(shè)計(jì)(supplemental sle design),即對于被抽中的大城市,其入樣概率在36%以上的虛擬區(qū),增加了一倍的村居樣本。最終有6個大城市有過度抽樣(oversle)。 因此需要建立一個新的權(quán)數(shù),將補(bǔ)充樣本與樣本(core sle)在一起。的補(bǔ)充樣本,是在第二階段抽取,因此,需要在這個階段考慮新權(quán)數(shù)。補(bǔ)充樣本的增加,不應(yīng)該增加該城
11、市在樣本中的比例。換句話說,新的該城市補(bǔ)充樣本與樣本的權(quán)數(shù)之和,也應(yīng)該等于該城市的規(guī)模。因此,假定分析某個變量 ,假設(shè)0 1,兩個樣本放在一起的值為: c (1 ) s其中, c 代表樣本的值, s 代表補(bǔ)充樣本的值。因?yàn)闃颖竞脱a(bǔ)充樣本是獨(dú)立的,因此作為權(quán)數(shù), 的最優(yōu)解為:nc / dc nc / dc ns / dsns / ds1 nc / dc ns / ds其中, nc 和ns 為樣本與補(bǔ)充樣本的樣本量, dc 和ds 為樣本與補(bǔ)充樣本的設(shè)計(jì)效應(yīng)。因?yàn)樵O(shè)計(jì)中,樣本與補(bǔ)充樣本的樣本量相等,樣本與補(bǔ)充樣本的設(shè)計(jì)效應(yīng)也相等,因此, 0.5 。所以,在加抽補(bǔ)充樣本的大城市中,需要進(jìn)行的調(diào)整是,
12、補(bǔ)充樣本與樣本的設(shè)計(jì)入樣概率為原來的一半。第二階段的設(shè)計(jì)權(quán)數(shù)是第二階段的設(shè)計(jì)概率的倒數(shù)。3、第三階段的抽樣設(shè)計(jì)權(quán)數(shù)第三階段的抽樣設(shè)計(jì)概率是每個樣本村居中抽取家庭戶的概率,即:N hs /(JK )h ss 其中, Nhpsjk 是第s個抽樣框中第j個樣本區(qū)縣中的第k個村居的sjkhN hsjk戶數(shù); N hs 是第s個抽樣框的總戶數(shù);總計(jì)劃Js 表示第s個抽樣框的樣本區(qū)縣數(shù); Ks 表示第s個抽樣框中第j個區(qū)縣抽取的村居數(shù)量,這樣, Js Ks 即是第s個抽樣框所要抽取的總村居樣本數(shù)。在研究設(shè)計(jì)中, N hsjk 設(shè)計(jì)為35戶。第三階段的設(shè)計(jì)權(quán)數(shù)是第三階段的設(shè)計(jì)概率的倒數(shù)。4、抽樣設(shè)計(jì)權(quán)數(shù)抽樣
13、設(shè)計(jì)概率是上述各階段抽樣設(shè)計(jì)概率的乘積。 N hsjk N hs /(JK ) N hsjp h ss desN hs / JN hsk / KN hsjks s 家庭的抽樣設(shè)計(jì)權(quán)數(shù)就是抽樣設(shè)計(jì)概率的倒數(shù)。(二)、執(zhí)行調(diào)整權(quán)數(shù)0、村居無回答調(diào)整無回答村居,是指在被抽中的縣區(qū)中,沒有獲得任何一份有效的家庭問卷。這種情況一共發(fā)生了15次,其中2個分布在補(bǔ)充樣本中。無回答調(diào)整概率為:N cj sjpcjsjN cj jkN cj sj 和 N cj jk 分布代表第s個抽樣框中第j個樣本區(qū)縣中實(shí)際村居數(shù)量和設(shè)計(jì)村居數(shù)量。1、樣本的戶膨脹調(diào)整知道,在實(shí)際抽樣中,會存在入戶成功率小于1的情況,因此,在抽
14、取家庭的時候,采取膨脹樣本,且樣本無替換的方法。例如計(jì)劃抽取35戶,實(shí)際抽取50戶(假定成功率平均為70%,這樣35/0.7=50),這樣,膨脹系數(shù)為1.43。因此,勞動力在膨脹樣本后的入樣概率,即: Ns /(Js Ks ) .index,其中index為第k個村居的膨脹系數(shù),其計(jì)算方phsjkhisjksjkN hsjk .H法為實(shí)際接觸戶數(shù)除以原來設(shè)計(jì)的35戶: indexsjk contact_f/35 。2、無回答調(diào)整CLDS獲得的數(shù)據(jù)經(jīng)過事后與2010年第六次普查資料在性別、戶規(guī)模、教育等的分布進(jìn)行比較,發(fā)現(xiàn)不僅各區(qū)縣的成功率有同,甚至同一區(qū)縣的不同戶規(guī)模、性別、分組的成功率也盡相
15、同,因此能假設(shè)無回答(non-response)的現(xiàn)象是完全隨即的( missing compley at random, MCAR),在此情況之下,如按成功率進(jìn)行調(diào)整, 則能代表原抽樣總體。無回答調(diào)整權(quán)數(shù)主要是針對CLDS實(shí)際中的各個階段(區(qū)縣、村居、家戶、)的各種類型(無法聯(lián)系、拒訪等)的單元無回答進(jìn)行的進(jìn)一步調(diào)整。從方便操作的角度出發(fā),假定同一村居的回答具有相似性,以此為前提,采用了簡單的以村居為組的無回答調(diào)整方法。家戶無回答系數(shù),需要同時考慮村居層次的無回答調(diào)整系數(shù)和家戶層次的無回答調(diào)整系數(shù),是這兩者的乘積。其中村居層次的無回答調(diào)整系數(shù)見村居權(quán)數(shù)說明部分。家戶層次的無回答調(diào)整系數(shù)如下:
16、h n non _ sjk和nhph;其中nh分別表示家庭成員問卷的第s個抽non _ sjkhnon _ sjknon _ sjknhnon _ sjk樣框的第j個樣本區(qū)縣第k個樣本村居中的總接觸家戶數(shù)和總完成家戶數(shù)。3、戶的戶的執(zhí)行調(diào)整權(quán)數(shù)執(zhí)行概率,是戶的抽樣設(shè)計(jì)概率乘以戶的的執(zhí)行調(diào)整概率: nhnon _ sjk N h /(J K ) N cj sj N hN hsjsjksphrunss N cj indexnhnon _ sjkhhN hsjkN/ JN/ Ks s jk ssksjk戶的執(zhí)行調(diào)整權(quán)數(shù)是戶的執(zhí)行調(diào)整概率的倒數(shù)。(三)、事后分層調(diào)整權(quán)數(shù)樣本的結(jié)構(gòu)與總體符,strati
17、fication weights)1、多變量反復(fù)需要采取的補(bǔ)救措施有事后分層法(Raking)2。方法(t1事后分層法是同時對幾個同的變量的聯(lián)合分布進(jìn)。該方法先將同變量組合的總體分成不同的子總體(由于每個子總體具有一樣的特征,例如城市的 1519 歲的男性子群、農(nóng)村的 2025 歲的女性子群,統(tǒng)計(jì)上當(dāng)做均質(zhì)的層,因此稱為事后分層),再算出每一層內(nèi)的權(quán)數(shù),進(jìn)而一次就直接將幾個目標(biāo)變量進(jìn)過關(guān),并使得后的目標(biāo)變量與總體在這些變量上的分布完全一致。因此事后分層方法因其計(jì)算方成為最常被采取的方法。但是這個方法要求必須可以得到總體在所選取變量上的聯(lián)合分布的情況;而實(shí)際上經(jīng)常做不到。因此,這就提出了多變量反
18、復(fù)法。2多變量反復(fù)法則是一次對一個變量進(jìn),目標(biāo)是要讓若干個變量得到一致的分布,則須先后依照順序?qū)@些變量進(jìn),斷重復(fù)對這些變量進(jìn)至所有變量同時與總體分布一致為止,在反復(fù)庭民族分兩類、,當(dāng)?shù)谝淮芜^序中,如的變量有戶中規(guī)模分 8 類、家將戶中規(guī)模的分布與總體比分布一致后,第二次將家庭民族二分類調(diào)整與總體比分布一致時,戶中規(guī)模的各分類的比又可能與總體比符,所以多變量反復(fù)法就是要通過多次迭代(iterative proportional事后分層方法要求必須具有進(jìn)行的多個變量的聯(lián)合分布;而多變量反復(fù)法則在僅僅擁有進(jìn)行的多個變量的各自分布的情況下即可執(zhí)行。使用了中國 2010 年普查資料中給出的家庭有關(guān)變量
19、的分布數(shù)據(jù)。但是非常遺憾,該資料僅僅有這些變量(家庭規(guī)模、家庭民族、家庭結(jié)構(gòu)、家庭世代結(jié)構(gòu))與地區(qū)變量的聯(lián)合分布,沒有家庭規(guī)模、家庭民族、家庭結(jié)構(gòu)、家庭世代結(jié)構(gòu)之間的聯(lián)合分布,因此不適合使用事后分層方法。所以采用多變量反復(fù)法進(jìn)行事后。在可以進(jìn)行多變量反復(fù)的事后變量中,家庭規(guī)模、家庭結(jié)構(gòu)、家庭世代結(jié)構(gòu)之間具有很強(qiáng)的相關(guān),如家庭規(guī)模為 1,則家庭世代結(jié)構(gòu)也只能是一代人,這使得他們之間的聯(lián)合分布中,會出現(xiàn)很多為 0 的各自,且無法合并(例如家庭規(guī)模為 1,在家庭世代結(jié)構(gòu)為 2 代、3 代、4 代的格子總均為 0 觀測個案);因此經(jīng)過考慮,僅保留家庭規(guī)模,而舍棄家庭世代結(jié)構(gòu)變量。以下是進(jìn)行調(diào)整的相關(guān)家
20、庭變量分布:的樣本不包括海南和,但2010 年普查資料中的資料是匯總,數(shù)據(jù)顯示,海南和的家庭規(guī)模僅占全部資料的 0.7%,具體見下表:fitting algorithm),最終達(dá)到將若干需要方法由 Deming and Stephan (1940)提出,序 ipfweight 來完成。的變量同時調(diào)整與總體比分布一致為止。該使用 Michael Bergmann 給出的 SA 分析程去除海南和的全國家庭總戶數(shù)海南家庭戶占全國比例海南家庭戶數(shù)家庭戶總數(shù)無60歲及以上老年人的戶有6064歲老年人的戶有65歲及以上老年人的戶普查數(shù)據(jù)0.694130.086840.21903單一民族戶二個或以上民族戶普
21、查數(shù)據(jù)0.972580.02742城市鄉(xiāng)鎮(zhèn)農(nóng)村普查數(shù)據(jù)0.320100.195380.48452一人戶二人戶三人戶四人戶五人戶六人或以上戶普查數(shù)據(jù)0.145290.243690.268650.175650.100350.06639因此,即使海南和在這些變量上的分布與有巨大的差異,對每個變量的影響會非常小。因此直接使用資料。法獲得的事后數(shù)3。多變量反復(fù)經(jīng)過多變量反復(fù)法在計(jì)算時,是以戶的執(zhí)行調(diào)整權(quán)數(shù)為起點(diǎn)。直接給出戶的事后調(diào)整權(quán)數(shù)。(四)、家庭戶的各類的效果對比:下面列出以上不同下的關(guān)鍵變量上的分布:規(guī)模,分為6類,從1人戶到5人戶,以及6人以上戶;家庭設(shè)計(jì)權(quán)數(shù)修訂權(quán)數(shù)事后權(quán)數(shù)0.35490.35
22、920.32010.15560.16780.19540.489540.47300.4845無設(shè)計(jì)權(quán)數(shù)修訂權(quán)數(shù)事后權(quán)數(shù)0.95680.95340.95340.97260.04320.04660.04660.02743使用 Michael Bergmann 給出的 SA 命令 ipfweight 來完成多變量迭代權(quán)數(shù)后的分布,與總體分布的差異在 0.001%以內(nèi)。(IPF-Algorithm adjustment weights),樣本無60歲及以上老年人的戶有6064歲老年人的戶有65歲及以上老年人的戶普查數(shù)據(jù)0.694130.086840.21903單一民族戶二個或以上民族戶普查數(shù)據(jù)0.972
23、580.02742城市鄉(xiāng)鎮(zhèn)農(nóng)村普查數(shù)據(jù)0.320100.195380.48452無0.41750.15760.4249一人戶二人戶三人戶四人戶五人戶六人或以上戶普查數(shù)據(jù)0.145290.243690.268650.175650.100350.06639無0.11970.29570.27570.16810.09110.0497設(shè)計(jì)權(quán)數(shù)0.11850.30820.27250.16750.08850.0447修訂權(quán)數(shù)0.12070.29910.26740.17150.09120.0501事后權(quán)數(shù)0.14530.24370.26860.17560.10030.066440193419639893220
24、930019870.0074688520.74060.73210.73660.69410.08570.08660.08610.08680.17380.18130.17730.2190無設(shè)計(jì)權(quán)數(shù)修訂權(quán)數(shù)事后權(quán)數(shù)多變量反復(fù)迭代法是在無需要的多變量的聯(lián)合分布下的事后方法。六普數(shù)據(jù)中有城鄉(xiāng)和家庭規(guī)模這兩個變量的聯(lián)合分布,因此,給出結(jié)果多變量反復(fù)迭代法獲得的事后個方法有所比較:組別在這 2 個變量上的聯(lián)合分布,以便數(shù)據(jù)使用者對這 2無回答權(quán)數(shù)調(diào)整比例0.04632450.11368310.115420.04984790.02511940.00885160.0187690.04740430.0407829
25、0.03015080.01903040.01163410.05559130.1380040.11115520.09153250.04704350.0296556事后分層調(diào)整權(quán)數(shù)比例 0.05072230.08431570.10459850.04577380.02452920.01016040.02610110.04418640.04757290.03582680.02446180.01723110.06846370.1151830.11647320.09404590.0513570.03899722010比例抽樣設(shè)計(jì)權(quán)數(shù)比例家庭規(guī)模樣本比例城鄉(xiāng)城市城市城市城市城市城市鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)農(nóng)
26、村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村1234561234561234560.05746970.08905590.10613620.03881870.02000210.00862180.02754140.04769380.05426710.03491470.01881020.01214870.06027710.10694120.10824430.10191340.06153380.04560980.05597440.13352810.13635510.05588010.02676220.00904640.01743310.04428950.03788160.02845830.017810.01168490.0
27、4626840.11788540.10148890.08377310.04655110.02892950.04301610.11662490.11887540.04602170.02286130.00748460.01786710.04541410.03800540.02703110.01773260.00958460.05765210.14612090.11563330.09444860.04794890.0276771三、勞動力問卷的權(quán)數(shù)(一)、抽樣設(shè)計(jì)權(quán)數(shù)抽樣設(shè)計(jì)權(quán)數(shù)即樣本單元入樣概率的倒數(shù)。由于 CLDS 抽樣是按 3 個階段進(jìn)行的,所以該類權(quán)數(shù)計(jì)算的過程中需要考慮 3 個階段的權(quán)數(shù),
28、即在每個抽樣框中抽取樣本區(qū)縣的權(quán)數(shù)、在每個樣本區(qū)縣中抽取樣本村居的權(quán)數(shù)、在每個樣本村居的家戶抽樣框中抽取樣本家戶的權(quán)數(shù);最后在家庭中抽取所有勞動力范圍內(nèi)的。1、第一階段的設(shè)計(jì)權(quán)數(shù)第一階段的抽樣設(shè)計(jì)概率是每個抽樣框中每個樣本區(qū)縣的入樣概率,即:Nsjp ;其中, N 是第s個抽樣框的總數(shù), N 是第s個抽樣框中第j個sjssj/ss樣本區(qū)縣的數(shù), Js 是第s個抽樣框的樣本區(qū)縣的總個數(shù)。下標(biāo)s表示抽樣框,s=1,2,7;下標(biāo) j 表示區(qū)縣,j=1,2, n j , n j 表示第i個抽樣框中抽中的區(qū)縣樣本數(shù)。第一階段的設(shè)計(jì)權(quán)數(shù)是第一階段的設(shè)計(jì)概率的倒數(shù)。2、第二階段的抽樣權(quán)數(shù)第二階段的抽樣設(shè)計(jì)概
29、率是每個樣本縣區(qū)中每個樣本村居的入樣概率,即:Nsjkp;其中, N 是第s個抽樣框第k個區(qū)縣的總數(shù), N是第s個抽sjksksjk/sks樣框中第j個樣本區(qū)縣中的第k個村居的總數(shù), Ks 是第s個抽樣框的第j個樣本區(qū)縣的村居總數(shù)。下標(biāo)k表示村居,k=1,2, nk , nk 表示第k抽中的區(qū)縣中的村居樣本總數(shù)。針對補(bǔ)充樣本的調(diào)整。為了可以更精確的分析大城市樣本,采用了補(bǔ)充樣本的設(shè)計(jì)(supplemental sle design),即對于被抽中的大城市,其入樣概率在36%以上的虛擬區(qū),增加了一倍的村居樣本。最終有6個大城市有過度抽樣(oversle)。 因此需要建立一個新的權(quán)數(shù),將補(bǔ)充樣本與
30、樣本(core sle)在一起。的補(bǔ)充樣本,是在第二階段抽取,因此,需要在這個階段考慮新權(quán)數(shù)。補(bǔ)充樣本的增加,不應(yīng)該增加該城市在樣本中的比例。換句話說,新的該城市補(bǔ)充樣本與樣本的權(quán)數(shù)之和,也應(yīng)該等于該城市的規(guī)模。因此,假定分析某個變量 ,假設(shè)0 1,兩個樣本放在一起的值為: c (1 ) s其中, c 代表樣本的值, s 代表補(bǔ)充樣本的值。因?yàn)闃颖竞脱a(bǔ)充樣本是獨(dú)立的,因此作為權(quán)數(shù), 的最優(yōu)解為:nc / dc nc / dc ns / dsns / ds1 nc / dc ns / ds其中, nc 和ns 為樣本的設(shè)計(jì)效應(yīng)。因?yàn)闃颖九c補(bǔ)充樣本的樣本量, dc 和ds 為樣本與補(bǔ)充設(shè)計(jì)中,樣本
31、與補(bǔ)充樣本的樣本量相等,樣本與補(bǔ)充樣本的設(shè)計(jì)效應(yīng)也相等,因此, 0.5 。所以,在加抽補(bǔ)充樣本的大城市中,一半。需要進(jìn)行的調(diào)整是,補(bǔ)充樣本與樣本的設(shè)計(jì)入樣概率為原來的第二階段的設(shè)計(jì)權(quán)數(shù)是第二階段的設(shè)計(jì)概率的倒數(shù)。3、第三階段的抽樣設(shè)計(jì)權(quán)數(shù)第三階段的抽樣設(shè)計(jì)概率是每個樣本村居中抽取勞動力的入樣概率,即: Ns /(Js Ks ) 其中, N hsjk 是第s個抽樣框中第j個樣本區(qū)縣中的第k個村居的總psjkhN hsjk .H接觸戶數(shù);H為平均戶內(nèi)勞動力數(shù); Ns 是第s個抽樣框的總數(shù); Js 表示第s個抽樣框的樣本區(qū)縣數(shù); Ks 表示第s個抽樣框中第j個區(qū)縣抽取的村居數(shù)量,這樣, Js Ks
32、即是第s個抽樣框所要抽取的總村居樣本數(shù);理論上,在沒有無回答h家庭戶的情況下, Nsjk 等于 N sjk .H 。戶,城市中,每戶有2.07個勞動力在研究設(shè)計(jì)中,每個村居計(jì)劃抽取35,農(nóng)村中每戶有2.17勞動力。第三階段的設(shè)計(jì)權(quán)數(shù)是第三階段的設(shè)計(jì)概率的倒數(shù)。4、抽樣設(shè)計(jì)權(quán)數(shù)抽樣設(shè)計(jì)概率是上述各階段抽樣設(shè)計(jì)概率的乘積。 Ns /(Js Ks ) NsjNsjkpdes N N / J/ KN hsjk .Hss sks 抽樣設(shè)計(jì)權(quán)數(shù)就是抽樣設(shè)計(jì)概率的倒數(shù)。(二)、執(zhí)行調(diào)整權(quán)數(shù)0、村居無回答調(diào)整無回答村居,是指在被抽中的縣區(qū)中,沒有獲得任何一份有效的家庭問卷。這種情況一共發(fā)生了15次,其中2個分
33、布在補(bǔ)充樣本中。無回答調(diào)整概率為:N cj sjpcjsjN cj jkN cj sj 和 N cj jk 分布代表第s個抽樣框中第j個樣本區(qū)縣中實(shí)際村居數(shù)量和設(shè)計(jì)村居數(shù)量。1、樣本的戶膨脹調(diào)整知道,在實(shí)際抽樣中,會存在入戶成功率小于1的情況,因此,在抽取家庭的時候,采取膨脹樣本,且樣本無替換的方法。例如計(jì)劃抽取35戶,實(shí)際抽取50戶(假定成功率平均為70%,這樣35/0.7=50),這樣,膨脹系數(shù)為1.43。因此,勞動力在膨脹樣本后的入樣概率,即: Ns /(Js Ks ) .index,其中index為第k個村居的膨脹系數(shù),其計(jì)算方phsjkhisjksjkN hsjk .H法為實(shí)際接觸戶
34、數(shù)除以原來設(shè)計(jì)的35戶: indexsjk contact_f/35 。3、無回答調(diào)整 CLDS獲得的數(shù)據(jù)經(jīng)過事后與2010年第六次普查資料在性別、戶規(guī)模、教育等的分布進(jìn)行比較,發(fā)現(xiàn)不僅各區(qū)縣的成功率有同,甚至同一區(qū)縣的不同戶規(guī)模、性別、分組的成功率也盡相同,因此能假設(shè)無回答(non-response)的現(xiàn)象是完全隨即的( missing compley at random, MCAR),在此情況之下,如按調(diào)整, 則能代表原抽樣總體。成功率進(jìn)行3.1、家戶層次的無回答調(diào)整家戶層次的無回答調(diào)整主要是針對CLDS實(shí)際中的各個階段(區(qū)縣、村居、家戶、)的各種類型(無法聯(lián)系、拒訪等)的單元無回答進(jìn)行的
35、進(jìn)一步調(diào)整。從方便操作的角度出發(fā),假定同一村居的回答具有相似性,以此為前提,采用了簡單的以村居為組的無回答調(diào)整方法。家戶無回答系數(shù),需要同時考慮村居層次的無回答調(diào)整系數(shù)和家戶層次的無回答調(diào)整系數(shù),是這兩者的乘積。其中村居層次的無回答調(diào)整系數(shù)見村居權(quán)數(shù)說明部分。家戶層次的無回答調(diào)整系數(shù)如下:h nnon _ sjk和nhph;其中nh分別表示家庭成員問卷的第s個抽non _ sjkhnon _ sjknon _ sjknhnon _ sjk樣框的第j個樣本區(qū)縣第k個樣本村居中的總接觸家戶數(shù)和總完成家戶數(shù)。3.2、勞動力勞動力層次的無回答調(diào)整的回答概率,采用傾向性匹配的辦法??紤]到不同省份的城鄉(xiāng)具
36、有社會信任、文化上的一致性,導(dǎo)致成功率的差異較大(總體上家庭內(nèi)的勞動力成功率為74.02%,其中分城市區(qū)、縣級市、縣分別為:67.96%;78.14%和77.17%),為了排除這個部分造成的偏誤,使用多層次logistic模型來所有家庭戶內(nèi)的勞動力的回答概率。家庭問卷中的全部家庭成員中的勞動力作為第一層次;被對象所屬的省份的城鄉(xiāng)類型作為第二層次;合格的家庭成員是否回答了勞動力問卷作為因變量?;诙鄬哟蝜ogistic模型來每個勞動力的回答傾向性,并將其分為200組(平均每組包含110個勞動力),這時可以假定他們均具有相似的背景和回答概率,其回答概率計(jì)算為: nnon _ pg和np;其中n分別
37、表示第g個傾向性分組中的完成non _ p _ gnon _ pgnon _ pgnnon _ pg回答的勞動力總數(shù)和應(yīng)該成勞動力總數(shù);g=1,2,3,200。變量 i.countytype gender marryage edu poli health hukou fin_N old youth zhu內(nèi)容地區(qū)類型變量類型分類分類分類分類連續(xù)分類連續(xù)分類連續(xù)分類分類分類狀況最高學(xué)歷是否黨員健康狀況戶口家庭數(shù)是否有老人 是否有兒童 房屋所有情況模型結(jié)果為:Mixed-effects logistic regresNumber of obs=22303Group variable: procNu
38、mber of groups=59Obs per group: min =175avg =378.0max =1672egration pos =7Wald chi2(12)=1073.32Log likelihood = -12335.115Prob chi2=0.0000nomiss |Coef.Std. Err.zP|z|95% Conf.erval-+- gender |.2722582.03173228.580.000.2100642.3344522marry |.1171664.03128953.740.000.0558401.1784927age |.0729752.007442
39、19.810.000.0583891.0875614age2 | -.0007177.0000914-7.850.000-.0008969-.0005384edu | -.0096335.008828-1.090.275-.026936.007669poli | -.0444863.0580827-0.770.444-.1583263.0693537health | -.0368472.017869-2.060.039-.0718697-.0018247hukou |.3673215.04535218.100.000.278433.45621fin_N | -.2505741.0128557-
40、19.490.000-.2757707-.2253774old | -.1738993.0389113-4.470.000-.2501641-.0976346youth |.3197597.03769978.480.000.2458697.3936498zhu|.0350126.04163540.840.400-.0465913.1166166_cons | -.7553909.1819084-4.150.000-1.111925-.3988571Random-effects Parameters |EstimateStd. Err.95% Conf.erval proc: Identity|
41、sd(_cons) |.6915138.0684129.5696259.8394831回答組與未回答組的傾向性得分分布如下圖,分析顯示,完成的勞動力和沒有完成的勞動力是不同的群體,存在著選擇性。因此,使用傾向性匹配的方法進(jìn)行,可以較好的處理選擇效應(yīng)帶來的偏誤。在數(shù)據(jù)庫中給出的調(diào)整整權(quán)數(shù)是上述抽樣設(shè)計(jì)權(quán)數(shù)與樣本膨脹系數(shù)、無回答調(diào)整系數(shù)與的乘積。4、勞動力勞動力的的執(zhí)行調(diào)整權(quán)數(shù)執(zhí)行概率,是勞動力的抽樣設(shè)計(jì)概率乘以勞動力的的執(zhí)行調(diào)整概率: Ncjnh n NN Ns /(JsKs) sjnon_ sjk non_ pg sj sjkpindex non sjk run N N/ K Ncjhn n/
42、 JNh.Hs s jk non_ pg sjksjkssk勞動力的執(zhí)行調(diào)整權(quán)數(shù)是勞動力的執(zhí)行調(diào)整概率的倒數(shù)。density: Predicted mean012340.2.4.6.81Predicted meandensity: Predicted meandensity: Predicted mean(三)、事后分層調(diào)整權(quán)數(shù)家庭數(shù)據(jù)的抽樣設(shè)計(jì)權(quán)數(shù)是三個階段的權(quán)數(shù)的乘積。在計(jì)算過程中,利用國家第六次普查數(shù)據(jù)中的家庭戶數(shù)據(jù)和過程中的地圖法中的住宅地圖資料、住戶門牌資料和家庭資料所得到的地址結(jié)果和家戶結(jié)果,對第三個階段家戶層次的權(quán)數(shù)進(jìn)行了回答率修正?;谕瑯拥姆椒?,考慮到不同利用國家第六次普查數(shù)
43、據(jù)中的勞動力統(tǒng)計(jì)數(shù)據(jù)計(jì)算了勞動力數(shù)據(jù)的抽樣設(shè)計(jì)權(quán)數(shù)。一方面由于在抽樣設(shè)計(jì)工作中某些重要指標(biāo)在抽樣之前不可能獲得,另一方面由于樣本成功率因?yàn)椴煌卣鞑煌?,所以最終的樣本在這些重要指標(biāo)上的分布情況與總體相比會呈現(xiàn)一定程度的不一致。由于CLDS的抽樣總體為已知(即1564歲的勞動力),故應(yīng)該采用事后分層方法進(jìn)行。事后分層,是將獲得的數(shù)據(jù)資料按照已知總體的分布結(jié)構(gòu),給與每一個被個案一個值,使得處理后的資料在變量上的分布與總體一致。主要在城鄉(xiāng)、教育等變量上對數(shù)據(jù)進(jìn)行事后分層調(diào)整,通過對數(shù)據(jù)進(jìn)行事后分層調(diào)整,使樣本輔助變量與總體的輔助變量相一致,從而減小抽樣誤差,提高估計(jì)精度。家庭問卷數(shù)據(jù)庫按照家庭戶規(guī)模
44、和城鄉(xiāng)變量進(jìn)行事后分層調(diào)整。其中,的劃分標(biāo)準(zhǔn)分為1人家庭、2人家庭、10人以家庭戶規(guī)模按照國家上家庭;城鄉(xiāng)分為城市、鎮(zhèn)和農(nóng)村,所以共有3*10=30個組別。個人問卷數(shù)據(jù)庫主要使用城鄉(xiāng)、和教育變量進(jìn)行事后分層調(diào)整。分為1619,2024、2529,其中,城鄉(xiāng)分為城市、鎮(zhèn)和農(nóng)村分為男和女3034、3539,4044、4549,5055、5559,6064等組別;教育分為無教育、小學(xué)、初中、高中、大專、本科和等組別。對于問卷中的教育和的極少量缺失,采用平均值進(jìn)行插補(bǔ)??紤]到某些組別的個案數(shù)過少(例如農(nóng)村在1619歲讀的組),采用合并的方法,將全部420個組別(3*2*7*10)歸并為274個組別。N
45、nNnwi其中, wi :總體第i組的總數(shù)ni :第i組n :全部成功的個案總數(shù)成功的個案總數(shù)Ni :總體中第i組的個案總數(shù)N :總體的總數(shù)計(jì)算權(quán)重使用的數(shù)據(jù)國第六次普查數(shù)據(jù)國家根據(jù) 2010 年 11 月 1 日零點(diǎn)完成的中的中國 2010 年普查資料(上中下)中的資料。 prun的事后調(diào)整概率: pp_/ wi因此,勞動力得到勞動力t的事后調(diào)整權(quán)數(shù)是勞動力的事后調(diào)整概率的倒數(shù)。(四)、勞動力的各類的效果對比:組別事后分層調(diào)整權(quán)數(shù)比例1.56%1.49%2.44%2.35%1.93%1.89%1.83%1.76%2.06%1.94%1.97%1.84%1.70%1.56%1.25%1.19%
46、1.13%1.13%0.77%0.78%1.22%1.12%1.20%1.17%抽樣設(shè)計(jì)權(quán)數(shù)比例無回答權(quán)數(shù)調(diào)整比例2010全國比例樣本比例城鄉(xiāng)城市城市城市城市城市城市城市城市城市城市城市城市城市城市城市城市城市城市城市城市鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)1619161920242024252925293034303435393539404440444549454950555055555955596064606416191619202420241.56%1.49%2.44%2.35%1.93%1.89%1.83%1.76%2.06%1.94%1.97%1.84%1.70%1.56%1.25%1.19%1.13%
47、1.13%0.77%0.78%1.22%1.12%1.20%1.17%1.14%0.87%1.44%1.57%1.74%2.01%1.67%1.86%1.70%2.10%1.99%2.41%1.67%2.47%1.59%1.85%1.66%2.04%1.43%1.64%0.73%0.55%0.74%0.86%1.33%0.89%1.57%1.77%2.03%2.10%1.70%1.76%1.63%1.93%2.02%2.39%1.63%2.37%1.58%1.68%1.64%1.74%1.32%1.53%0.71%0.51%0.86%0.91%0.98%0.72%1.12%1.34%1.54%
48、1.75%1.37%1.58%1.44%1.82%1.73%2.18%1.47%2.25%1.37%1.61%1.44%1.71%1.18%1.46%0.68%0.50%0.69%0.80%女性女性女性女性女性女性女性女性女性女性女性女性鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)鄉(xiāng)鎮(zhèn)農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村農(nóng)村2529252930343034353935394044404445494549505550555559555960646064161916192024202425292529303430343539353940444
49、044454945495055505555595559606460640.99%1.00%1.04%1.02%1.30%1.25%1.34%1.28%1.09%1.05%0.77%0.73%0.77%0.75%0.55%0.53%2.45%2.22%2.82%2.86%2.20%2.16%2.12%2.02%2.72%2.62%3.10%3.04%2.62%2.61%2.04%1.95%2.25%2.17%1.69%1.60%0.63%0.70%0.57%0.74%0.67%0.80%0.98%1.28%1.16%1.34%0.86%0.98%1.02%1.12%0.94%0.81%1.66%
50、1.71%1.46%1.66%1.21%1.52%1.39%1.70%1.81%2.21%2.91%3.45%3.14%3.29%2.07%2.52%2.65%2.91%2.60%2.33%0.60%0.66%0.55%0.70%0.67%0.75%0.99%1.26%1.14%1.21%0.84%0.85%0.96%1.04%0.94%0.75%1.87%1.80%1.91%1.95%1.40%1.69%1.56%1.81%1.98%2.29%3.26%3.42%3.39%3.57%2.33%2.57%2.92%3.21%3.01%2.54%0.54%0.64%0.53%0.71%0.65%
51、0.78%1.02%1.38%1.20%1.35%0.88%0.97%1.04%1.16%1.00%0.84%1.68%1.75%1.49%1.67%1.18%1.58%1.44%1.80%1.94%2.42%3.27%3.72%3.49%3.89%2.34%2.83%3.03%3.50%3.08%2.75%0.99%1.00%1.04%1.02%1.30%1.25%1.34%1.28%1.09%1.05%0.77%0.73%0.77%0.75%0.55%0.53%2.45%2.22%2.82%2.86%2.20%2.16%2.12%2.02%2.72%2.62%3.10%3.04%2.62%
52、2.61%2.04%1.95%2.25%2.17%1.69%1.60%女性女性女性女性女性女性女性女性女性女性女性女性女性女性女性女性女性女性城鄉(xiāng)教育2010比例樣本比例抽樣設(shè)計(jì)權(quán)數(shù)比例無回答權(quán)數(shù)調(diào)整比例事后分層調(diào)整權(quán)數(shù)比例城市無教育0.07%0.46%0.48%0.43%0.07%城市無教育女性0.19%1.44%1.29%1.29%0.19%城市小學(xué)1.17%1.46%1.33%1.28%1.17%城市小學(xué)女性1.59%2.71%2.43%2.42%1.59%城市初中6.48%5.55%5.51%4.80%6.48%城市初中女性6.08%5.97%5.85%5.42%6.08%城市高中4.
53、69%4.93%5.20%4.13%4.69%城市高中女性4.30%5.03%4.73%4.09%4.30%城市大專2.30%1.69%1.81%1.42%2.30%城市大專女性2.19%1.81%1.92%1.61%2.19%城市本科1.83%1.83%2.01%1.49%1.83%城市本科女性1.50%1.75%1.80%1.47%1.50%城市0.10%0.10%0.13%0.09%0.10%城市女性0.09%0.12%0.14%0.11%0.09%鄉(xiāng)鎮(zhèn)無教育0.08%0.42%0.44%0.49%0.08%鄉(xiāng)鎮(zhèn)無教育女性0.25%1.37%1.37%1.54%0.25%鄉(xiāng)鎮(zhèn)小學(xué)1.41
54、%1.88%1.94%1.96%1.41%鄉(xiāng)鎮(zhèn)小學(xué)女性2.03%2.78%2.62%2.85%2.03%鄉(xiāng)鎮(zhèn)初中5.09%3.73%3.67%3.75%5.09%鄉(xiāng)鎮(zhèn)初中女性4.66%3.14%2.98%3.13%4.66%鄉(xiāng)鎮(zhèn)高中3.12%1.89%1.85%1.71%3.12%鄉(xiāng)鎮(zhèn)高中女性2.40%1.40%1.18%1.18%2.40%鄉(xiāng)鎮(zhèn)大專0.36%0.18%0.19%0.15%0.36%鄉(xiāng)鎮(zhèn)大專女性0.38%0.30%0.28%0.27%0.38%鄉(xiāng)鎮(zhèn)本科0.19%0.18%0.18%0.15%0.19%鄉(xiāng)鎮(zhèn)本科女性0.18%0.20%0.20%0.16%0.18%農(nóng)村無教育0.4
55、9%2.51%2.70%2.84%0.49%農(nóng)村無教育女性1.31%6.93%7.28%8.04%1.31%農(nóng)村小學(xué)6.20%5.82%6.27%6.46%6.20%農(nóng)村小學(xué)女性8.27%6.87%6.88%7.49%8.27%農(nóng)村初中13.79%8.57%9.67%9.31%13.79%農(nóng)村初中女性11.35%6.76%7.28%7.41%11.35%農(nóng)村高中3.06%3.48%4.34%3.85%3.06%農(nóng)村高中女性1.91%2.31%2.84%2.53%1.91%農(nóng)村大專0.36%0.31%0.36%0.28%0.36%農(nóng)村大專女性0.31%0.22%0.31%0.25%0.31%農(nóng)村
56、本科0.11%0.21%0.29%0.21%0.11%農(nóng)村本科女性0.09%0.19%0.26%0.19%0.09%四、變量列表給出的每個權(quán)數(shù)都可以單獨(dú)使用,研究者可以根據(jù)自己的研究需要選擇合適的權(quán)數(shù)進(jìn)行研究。在資料量,分別為:時,每個個案均有 3 個權(quán)數(shù),以及其他關(guān)鍵變使用的關(guān)鍵變量表變量名描述家庭數(shù)據(jù)ncode初級抽樣(PSU)scode次級抽樣()rot樣本輪次strata分層的層變量wfd設(shè)計(jì)權(quán)數(shù)nncode層中包含的初級抽樣數(shù)量fpc_f有限總體校正wfr無回答調(diào)整權(quán)數(shù)tstrata_f事后分層的類別數(shù)wfp事后權(quán)數(shù)(多變量迭代法)勞動力數(shù)據(jù)ncode初級抽樣(PSU)scode次級
57、抽樣()rot樣本輪次strata分層的層變量fpc_p有限總體校正wpd設(shè)計(jì)權(quán)數(shù)nncode層中包含的初級抽樣數(shù)量wpr無回答調(diào)整權(quán)數(shù)tstrata_f事后分層的類別數(shù)wpp事后權(quán)數(shù)(事后分層法)五、使用的注意事項(xiàng)1、當(dāng)研究者希望進(jìn)行總體描述,或者進(jìn)行不同類別的交叉分析以便推論總體的狀況時,應(yīng)該使用估計(jì)值。提供的值來進(jìn)行分析和,這樣的結(jié)果才是無偏的2、本資料提供的值沒有經(jīng)過標(biāo)準(zhǔn)化處理,值之和等于勞動力總數(shù)(而非樣本總數(shù))。3、如果研究者希望分析使用標(biāo)準(zhǔn)化的系數(shù)(即權(quán)數(shù)加總之和等于樣本數(shù)),可自行完成。的但是在分析中如使用子樣本,往往會出現(xiàn)子樣本數(shù)小于樣本總數(shù),而相關(guān)統(tǒng)計(jì)并不會自動將值者需要將
58、值重新標(biāo)準(zhǔn)化后再進(jìn)行分析。因此,本數(shù)據(jù)的使用中,建議研究者使用復(fù)雜抽樣設(shè)計(jì)的分析專業(yè)。4、對復(fù)雜抽樣設(shè)計(jì)的分析專業(yè)很多,在運(yùn)算復(fù)雜抽樣設(shè)計(jì)的數(shù)據(jù)時,會自動修訂度、調(diào)整后的標(biāo)準(zhǔn)誤等用于計(jì)算公式之中。為了能夠做到這些,必須先將抽樣中重要的變量:層、初級抽樣單元和樣本權(quán)數(shù)實(shí)現(xiàn)定義和說明。在第六部分,給出使用 SA,進(jìn)行的說明。六、使用 SA進(jìn)行分析的說明第一步,對復(fù)雜抽樣設(shè)計(jì)的數(shù)據(jù)的設(shè)定說明在進(jìn)行復(fù)雜資料的抽樣分析時,SA 抽樣的模塊為“svy”。在一開始要先設(shè)定抽樣相關(guān)的抽樣設(shè)計(jì)變量,以后的分析中只要在分析命令前加上“svy:”,告知 SA 以復(fù)雜抽樣設(shè)計(jì)的分析方法處理即可。命令形式為: svys
59、et pweight=varname, strata (varname)psu (varname)在 pweight 后面放入樣本的權(quán)數(shù)變量名稱;在strata 后放入分層的變量名稱;在 psu 后面放入初級抽樣(PSU)的變量名稱即可。如想了解變量設(shè)定是否正確,可在SA中使用“svydes”來顯示描述內(nèi)容。例:svyset pweight=wpp, strata (strata ) psu (ncode) svydes也可對單一或多個變量進(jìn)行說明:svydes genderpweight: wppVCE: linearizedSurvey: Describing stage 1 sling
60、unitspweight: wppVCE: linearized Single unit: missingStrata 1: strataSU 1: ncodeFPC 1: #Obs per Unit Stratum#Units#Obsmeanmax1.92372162807116175.43013.03564182715101150.82185101907108190.7276610150341150.32236871460741167.9356以上是一般情況。具體到的數(shù)據(jù),有2個權(quán)數(shù)可供使用,一個是調(diào)查調(diào)整權(quán)數(shù),另外一個是事后調(diào)整權(quán)數(shù)。1、使用調(diào)整權(quán)數(shù)本研究是多階段抽樣。因此,需明最重要的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)殖出租轉(zhuǎn)讓合同范本
- 云南省監(jiān)理聘用合同范本
- 北碚區(qū)運(yùn)輸合同范本
- 興業(yè)快遞轉(zhuǎn)讓合同范本
- 北京入職合同范本
- 農(nóng)資農(nóng)藥購銷合同范本
- 農(nóng)莊合作期間轉(zhuǎn)讓合同范本
- 公司雇傭個人合同范本
- 出貨貨期合同范本
- 價稅分開合同范本
- PEP六年級上冊英語unit1
- 接納與承諾(ACT)療法課件
- 裝配式混凝土建筑技術(shù)標(biāo)準(zhǔn)
- 房地產(chǎn)公司銷售管理部賞罰制度
- 《方位介詞介紹》課件
- 甲狀腺術(shù)后出血搶救流程
- 個人購買家具合同
- 國際救生設(shè)備規(guī)則
- 第三方檢查應(yīng)對措施方案
- 2020年財(cái)產(chǎn)保險公司部門職責(zé)和崗位說明書
- 抽水臺班記錄表
評論
0/150
提交評論