




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、經(jīng)濟計量方法與Stata應用講義11. 描述性分析與不平等的度量方法孫志軍北京師范大學經(jīng)濟與工商管理學院本章使用數(shù)據(jù)文件為1. 教育與工資1.dta2. 2005年廣東省人口抽樣數(shù)據(jù).dta3. 農(nóng)村家庭收入數(shù)據(jù)(甘肅2004).dta4. CHNS數(shù)據(jù)2004、2006年成人調(diào)查問卷有關數(shù)據(jù)。經(jīng)濟學的經(jīng)驗分析(Empirical Analysis)方法通常分為描述性分析和回歸分析。描述性分析常用的方式是考察變量的分布特征,計算集中趨勢(如平均值、中位數(shù))和離散趨勢(如方差、變異系數(shù))等。它通常有兩個作用,一個是在統(tǒng)計推斷或因果分析之前,發(fā)現(xiàn)、界定或詳細討論要研究的問題;另一個是驗證假說?;貧w
2、分析即是計量經(jīng)濟學中核心內(nèi)容,可以說,回歸分析和經(jīng)濟理論的結(jié)合就構(gòu)成了計量經(jīng)濟學。它有兩個基本特征,第一,回歸模型(或稱為經(jīng)驗模型)的建立要依賴經(jīng)濟理論,考慮一個簡單回歸模型:yabxu,如果是單純的回歸分析,則我們只要搜集到自變量x和因變量y的一個樣本數(shù)據(jù),就可以估計出參數(shù)a和b來。在計量經(jīng)濟學中,則首先要對x和y之間的關系的邏輯關系給出經(jīng)濟理論的解釋,或者通過理論推導出上述回歸模型來,而不是單純的x和y之間的數(shù)據(jù)關系,這也就是我們在許多計量經(jīng)濟學文獻中看到的,將回歸模型稱為結(jié)構(gòu)模型(Structure Model)的原因。第二,上述特征決定了計量經(jīng)濟學中的回歸分析的作用是進行因果推斷,即考
3、察x和y之間的因果關系,這也正是經(jīng)濟理論的要求?;貧w分析在本書或其他計量經(jīng)濟學教材中是主要內(nèi)容,本章只通過幾個例子說明描述性分析的特征和用處。1.1 主要概念與簡單描述性分析 變量與數(shù)據(jù)所謂變量(variable)是指其值會變動、變化的量,與此相對的概念是常量或常數(shù)(constant)。變量的測量值或觀察值則稱為變量值,一個或多個變量及其測量值就構(gòu)成了數(shù)據(jù)。了解變量和數(shù)據(jù)是從事計量經(jīng)濟分析要做的初步工作。1. 變量的類型變量包括定性變量和定量變量兩類,在處理資料之前,首先要分清變量類型。觀察下表中列出的變量及其取值,看看有什么區(qū)別?表1.1 變量的層次變量變量的可能取值性別男;女風險厭惡程度非
4、常厭惡、一般、不厭惡子女數(shù)目1個;2個;3個收入100元;150元;200元;定性變量又包括類別變量和有序變量兩類。表1.1中“性別”這一變量,取值只有兩類:男或女。像這樣的變量就被稱為類別變量。它的取值只有類別屬性之分,而無大小、程度之分。根據(jù)變量值,只能知道研究對象是相同或是不同。如性別、婚姻、民族、專業(yè)、職業(yè)等等。從數(shù)學運算特性來看,類別變量只具有等于或不等于的性質(zhì)。表1.1中“風險厭惡程度”變量的取值有程度或大小之分,或者有等級、次序差別。像這樣的變量就稱為有序變量。當然,這類變量也有類別屬性,因而它的層次要高于類別變量。其數(shù)學運算性質(zhì)除具有等于或不等于外,還有大于或小于之分。常見的有
5、序變量還有教育程度(文盲、小學、初中、高中、大學)、社會經(jīng)濟地位(上等、中等、下等)、積極性(很積極、一般、不積極)等等。表1.1中“子女數(shù)目”和“收入”這兩個變量的值是有度量單位的數(shù)值,這些數(shù)值有大小之分,可以進行加減乘除,在進行加減乘除的數(shù)學運算后也具有實際的意義,比如200元除以100元等于2,表示前者是后者的2倍。像這樣的變量稱為定量變量、數(shù)值變量等。大多數(shù)數(shù)值變量都是連續(xù)性變量。在經(jīng)驗分析中,對于定性變量可以根據(jù)其類別或等級賦予數(shù)值,比如性別變量,可以賦予男性1,女性0;態(tài)度變量:非常厭惡0,一般1,不厭惡2。對這些變量賦予的數(shù)值,并沒有實際的含義,只是代表某種類別或等級。之所以這樣
6、做,是為了在分析中更為方便的緣故。這也是定性變量和定類變量在操作層面的主要區(qū)別。在回歸分析中,定性變量則已一個虛擬(dummy)變量系列表示(詳見后面的“基本線性模型”內(nèi)容)。2. 數(shù)據(jù)的層次、類型與結(jié)構(gòu)經(jīng)濟研究所用的數(shù)據(jù)包括了三個維度:層次、類型和結(jié)構(gòu)。(1)數(shù)據(jù)層次數(shù)據(jù)的層次分為兩類:微觀數(shù)據(jù)和宏觀數(shù)據(jù)(micro and macro data)。微觀數(shù)據(jù)是指個體層面的數(shù)據(jù),如本章下面所用的個體抽樣調(diào)查數(shù)據(jù)就是微觀層面的數(shù)據(jù)。宏觀數(shù)據(jù)是指由個體數(shù)據(jù)匯總而出的數(shù)據(jù),比如按照省份匯總每個人的教育水平、收入,就得到一個省級層面的宏觀數(shù)據(jù),像第一章的各省經(jīng)濟、投資等數(shù)據(jù)也是一個宏觀層面的數(shù)據(jù)。由于
7、微觀數(shù)據(jù)在經(jīng)濟研究中的應用越來越廣泛,計量經(jīng)濟學也出現(xiàn)一個以微觀計量經(jīng)濟分析命名的分支學科。(2)數(shù)據(jù)類型數(shù)據(jù)類型包括調(diào)查數(shù)據(jù)(survey data)、社會實驗數(shù)據(jù)(data from Social Experiments)和自然實驗數(shù)據(jù)(Data from Natural Experiments)。調(diào)查數(shù)據(jù)是指從總體中隨機抽取一個樣本進行調(diào)查而獲得的數(shù)據(jù),比如農(nóng)村家庭收入調(diào)查數(shù)據(jù)。大量的研究使用的即是這類數(shù)據(jù)。社會實驗數(shù)據(jù)是指采用實驗室實驗的設計思路,對經(jīng)濟或社會行為進行實驗而獲得的數(shù)據(jù)。比如,要研究小額信貸對農(nóng)村家庭收入的影響,可以隨機抽取一個農(nóng)村家庭樣本,隨機的給予一些家庭小額信貸,另
8、一部分不給予,最后觀察其收入,就構(gòu)成了一個社會實驗數(shù)據(jù)。自然實驗數(shù)據(jù)是指在調(diào)查數(shù)據(jù)中根據(jù)某個變量可以將數(shù)據(jù)構(gòu)造成類似社會隨機實驗的數(shù)據(jù)。這類數(shù)據(jù)在進行政策分析時特別有用。比如要考察我國的農(nóng)村稅費改革對農(nóng)村家庭收入的影響,由于一部分地區(qū)先進行改革,而另一部分地區(qū)后進行改革,這樣就類似于進行了一場實驗,通過搜集改革前和改革后的數(shù)據(jù),就構(gòu)成了自然實驗數(shù)據(jù),從而評估稅費改革的效果。(3)數(shù)據(jù)結(jié)構(gòu)不同層次、不同類型的數(shù)據(jù)在結(jié)構(gòu)上可以區(qū)分為以下四類:l 橫截面數(shù)據(jù)(Cross-sectional data set):就是在給定時點對個人、家庭、企業(yè)、城市、省、國家或其他單位采集的樣本所構(gòu)成的數(shù)據(jù)。像第一章
9、經(jīng)濟和投資數(shù)據(jù)就是2006年這個時點上的一個中國各省的橫截面數(shù)據(jù)。l 時間序列數(shù)據(jù)(Time series data set):由一個或幾個變量不同時間的觀測值所構(gòu)成的數(shù)據(jù)。如19802010年某省的經(jīng)濟和投資數(shù)據(jù)就構(gòu)成了一個時間序列數(shù)據(jù)。l 混合橫截面數(shù)據(jù)(Pooled cross sectional data set):由不同時點上對總體進行抽樣獲得的橫截面數(shù)據(jù)構(gòu)成的數(shù)據(jù)。如在2005年和2010年分別對家庭抽樣調(diào)查所獲得的數(shù)據(jù)。l 面板或縱列數(shù)據(jù)(Panel data or Longitudinal data):由不同時點上對同一單位觀測所獲得的數(shù)據(jù)。如19802010年中國各省的經(jīng)濟和
10、投資數(shù)據(jù)。計量經(jīng)濟分析包括了上述不同層次、類型和結(jié)構(gòu)的數(shù)據(jù),除去基本的分析方法相近外,對不同數(shù)據(jù)還分別有不同的分析方法,以后的部分將對此做詳細介紹。3. 描述性統(tǒng)計分析的基本內(nèi)容描述性統(tǒng)計分析主要分為對變量的集中趨勢和離散趨勢的分析。根據(jù)變量的類型,描述性統(tǒng)計分析主要可以分為一下幾類:(1)單變量描述統(tǒng)計是指對單一個變量的集中趨勢和離散趨勢的分析。根據(jù)變量的兩種類型,對單變量描述統(tǒng)計分析的方法有所不同,又分為單定性變量的和單定量變量的描述統(tǒng)計分析。(2)定性定性變量描述統(tǒng)計在對經(jīng)濟現(xiàn)象的研究中,我們更感興趣的探究兩個或兩個以上變量之間的關系。定性定性變量的描述統(tǒng)計分析即是,當兩個或兩個以上的變
11、量均為定性變量時,應用描述統(tǒng)計分析方法考察變量之間的關系。比如,我們想考察“風險態(tài)度是否存在性別差異”這個命題,就可以比較男性和女性在風險態(tài)度的頻次分布上是否存在差異來進行,這就是定性定性變量的描述統(tǒng)計分析。(3)定性定量變量描述統(tǒng)計當一個變量為定類變量,一個為定量變量時,考察兩者之間的關系就稱為定性定量變量描述統(tǒng)計分析。比如我們關心收入上是否存在性別差異,就可以比較男性和女性的收入的平均水平來進行。4. 本節(jié)所用數(shù)據(jù)本章所用數(shù)據(jù)是一個微觀個體抽樣調(diào)查數(shù)據(jù),數(shù)據(jù)總觀測數(shù)為894個(個體),變量包括個體的性別、教育、工作單位以及年工資。詳細內(nèi)容見數(shù)據(jù)文件“教育與工資1.dta”。這些變量的詳細定
12、義如下:表1.2 本節(jié)所用數(shù)據(jù)變量定義變量名含義值gender性別男性1;女性0schyear受教育年數(shù)(單位:年)016年schlevel受教育程度初中及以下1;高中2;大學3exp工作年數(shù)(單位:年)049年organise工作單位性質(zhì)國有部門0;集體企業(yè)1;私營企業(yè)2;其他3wage年工資(單位:元)84080000元根據(jù)這個數(shù)據(jù)集,下面我們依次來討論描述性統(tǒng)計分析的一些主要內(nèi)容。1.1.2 單變量描述統(tǒng)計分析在進行更深入的研究之前,往往首先要對各個變量的分布特征有一個大概的了解,這就是單變量描述統(tǒng)計分析主要完成的事情。此外,在經(jīng)濟學研究中,對于經(jīng)濟不平等或發(fā)展差異(如收入不平等、經(jīng)濟水
13、平差距)的分析是一個重要領域,在統(tǒng)計學中這屬于變量離散趨勢的分析,本節(jié)也對此做了初步介紹。我們主要選取以下衡量集中趨勢和離散趨勢的指標進行說明。對于這些指標的計算原理,這里并不進行描述,你可以查閱相關的統(tǒng)計方面的書籍及其他資料,這里只是給出Stata的操作命令。表2.3給出了這些指標(或統(tǒng)計量)與STATA基本命令。表1.3 描述統(tǒng)計分析指標(或統(tǒng)計量)與STATA基本命令統(tǒng)計量名稱含義STATA常用基本命令*頻次衡量類別或有序變量的集中趨勢。tabulate(tab)平均值與分位數(shù)衡量定量變量的集中趨勢summarize(su); centile方差與標準差衡量定量變量的離散趨勢summar
14、ize(su)不平等指標衡量定量變量的離散趨勢。常用的有:分組比例、變異系數(shù)(CV)、基尼系數(shù)(Gini)、廣義熵指數(shù)(GE)與泰爾系數(shù)(Theil Index)inequal7注:*括號內(nèi)為縮寫。 STATA中常用的這些基本命令在下面的內(nèi)容中也會用到。下面我們根據(jù)本章的數(shù)據(jù)“c2.1教育與工資1.dta”中的一些指標分別看看是如何操作的?;久枋鲂越y(tǒng)計分析任務1 頻次分析任務描述:總樣本中不同性別、教育程度、工作單位的頻次分布狀況(1)性別分布tab gender在上述結(jié)果中,第1列顯示的是變量的取值,第二列是頻次,第三列是頻率或百分比,第四列是累積頻率或累積百分比。結(jié)果顯示,在總樣本894
15、個體中,男性占了56.26。(2)教育程度分布tab schlevel結(jié)果顯示,在總樣本中,初中及以下教育水平的個體占了21.25,高中的占了40.49,大學的占了38.26。(3)工作單位分布tab organise結(jié)果顯示,樣本中工作單位在國有部門(0)、集體企業(yè)(1)、私營企業(yè)(2)和其他部門(3)分別占了25.39、61.19、7.16和6.26,還可以看出,樣本個體以來自國有部門和集體企業(yè)的為主,累積比例為86.58。任務2 平均值與方差任務描述:計算樣本個體的平均工資與標準差,以及分別計算男性和女性的工資。(1)全部樣本su wage(2)男性樣本su wage if gender
16、=1(3)女性樣本su wage if gender=0上述結(jié)果列出了各類個體的觀測數(shù)(Obs)、平均值(Mean)、標準差(Std.Dev.)、最小值(Min)和最大值(Max)等概要統(tǒng)計量??梢钥闯?,個體平均工資為9135.6元,其中男性9941.3元,女性8167.7元,從標準差來看,男性樣本的工資的離散程度(或差異)大于女性。任務3 分位數(shù)計算男性樣本10、20、90分位數(shù)。centile wage if gender=1,centile(10(10) 90)結(jié)果中第三列表示分位數(shù),第四列表示相應的分位數(shù)的值。最后兩列位95的置信區(qū)間。關于不平等的分析方法與命令參加本部分1.2節(jié)以后的
17、內(nèi)容。1.1.3 定性定性變量描述統(tǒng)計分析上面的單變量描述統(tǒng)計只是告訴了我們某個指標的單一的集中或離散趨勢,在研究中,我們更感興趣的是比較不同組別的某些變量的差異或分布特征,把組別稱為基準分類變量,如果要描述的變量是定性變量,就是定性定性變量描述性分析;如果是定量變量,則就是定性定量變量的描述性分析。這一節(jié)先來介紹前者的分析方法。不同性別的個體受教育程度的頻次分布這里的性別是基準分類變量,受教育程度是關注的變量。要描述不同性別受教育程度的頻次分布,可使用tabulate命令。其基本命令項為:tabulate varname1 varname2 if in weight , optionsvar
18、name1、varname2為兩個定性變量。通過添加選項,可以獲得想要的結(jié)果。比如,要想獲得男性和女性各自不同教育程度上的頻次分布,可以添加row選項,要進行卡方檢驗,則可以添加chi2選項等等,詳細可參見help文件。任務1:考察不同性別個體受教育程度的分布差異,并做卡方檢驗。tabulate gender schlevel,row chi2從上述結(jié)果可以看出,在女性樣本中,有45的為高中教育,35為大學教育;在男性樣本中,有37的為高中教育,41為大學教育??ǚ綑z驗顯示兩類個體的教育程度上在10的顯著性水平上差異顯著。還可以進行多維的頻次分布分析,如下:任務2 考察不同性別、不同教育程度在
19、工作單位性質(zhì)上的頻次分布by gender, sort: tabulate schlevel organise,row從上述結(jié)果可以看出不教育程度的男性和女性在就業(yè)單位性質(zhì)上的分布,比如,就受過高中教育的女性而言,有49在就業(yè)單位是集體企業(yè),32的是國有部門;同樣教育程度的男性樣本中,有61的在集體企業(yè),24的在國有部門。1.1.4 定性定量變量描述統(tǒng)計分析定性定量變量描述統(tǒng)計分析是指分組變量為定性變量、要描述的變量為定量變量,如不同性別的平均工資、不同教育程度的平均工資等等??梢允褂胻abstat命令,其基本命令項是:tabstat varlist if in weight , option
20、svarlist為要描述的定量變量,options有兩個常用選項,一個是by()選項,界定分組變量;另一個是statistics(),可以加上想要報告的統(tǒng)計量,如在括號內(nèi)加上mean,表示報告的結(jié)果是平均值,其他的如max為最大值,sd為標準差,p50為中位數(shù),等等,可參見help文件。任務1 考察不同性別的工資tabstat wage,by(gender) statistics(mean sd p50 max min)上述結(jié)果列出了男性和女性的平均工資、標準差、中位數(shù)、最大值、最小值??梢钥闯瞿行缘钠骄べY要高于比女性,以標準差衡量的男性內(nèi)部的工資差異要大于女性。任務2 不同教育程度的平均工
21、資差異tabstat wage,by( schlevel) statistics(mean sd)結(jié)果顯示,隨著受教育程度的提高,平均工資也提高,而且工資差異(標準差)也越來越大。1.2 不平等的度量Stata命令為inequal7表1.4 不平等的測量方法指標計算方法與特征極差率最大值與最小值之比,無法衡量兩者之間的觀測單位的差異分位數(shù)差異考察不同分布點上的差異相對平均離差對于位于平均水平同側(cè)的較低水平的到較高水平的轉(zhuǎn)移沒有敏感性Mcloone指數(shù)主要分析中位數(shù)以下的差異狀況,是中位數(shù)以下樣本均值與樣本中位數(shù)的比值。Verstegen指數(shù)主要考察中位數(shù)以上的差異狀況,是中位數(shù)以上樣本均值與樣
22、本中位數(shù)的比值。變異系數(shù)標準差除以均值;對任意x水平發(fā)生的x轉(zhuǎn)移都有很強的敏感性;不受通貨膨脹因素的影響。對數(shù)標準差對較低水平的x的發(fā)生的轉(zhuǎn)移賦予更大的重要性,突出了x較低水平上的差異。Gini系數(shù)對x差距的最直接衡量,考慮到了每兩個i在x之間的差距;不受通貨膨脹因素的影響。GE指數(shù)與Theil系數(shù)GE指數(shù)中根據(jù)參數(shù)的取值從小到大,從對低水平差異較敏感變化為對高水平差異較敏感;GE(a=0)和Theil系數(shù)(a=1)可以將差異分解為組內(nèi)與組間Atkinson指數(shù)與GE指數(shù)存在一一對應的單調(diào)轉(zhuǎn)換關系。以上這些方法對理解不平等程度有著不同的內(nèi)在意義。在這些方法中,Gini系數(shù)是一個常用的方法,它不
23、僅可以衡量不平等的程度,而且還可以進行按收入來源的分解,以及隨時間變化的分解,這樣可以分析總Gini系數(shù)主要由哪部分構(gòu)成,以及總Gini系數(shù)的變動影響因素是什么。當然,Gini系數(shù)的一個不足是它對特別富裕的階層的觀察值比較敏感,如果樣本中生均教育支出最高的階層數(shù)據(jù)誤差較大,那么Gini的估計值就不是很可靠(萬廣華,2006)。再如Mcloone指數(shù)可以幫助我們分析低支出水平的群體與中等群體之間的差距的變化,如果Mcloone指數(shù)越小,意味著低水平組與中位數(shù)的差距越大,也就是說越不不平等。Verstegen指數(shù)則可以考察中位數(shù)以上水平與中位數(shù)水平之間的差距,如果Verstegen指數(shù)越接近于1,
24、則意味著高水平組與中位數(shù)的差距越小,也就是說越不平等。通過這兩個指標,我們可以來考察政策對低支出組和高支出組的影響如何,不平等的變化主要是由哪兩個組群的變化引起的,從而考察政策是否起到了相應的作用。例如,如果Mcloone指數(shù)越小,說明政策對低水平組并沒有起到相應的作用,也就是“在最不需要補助的地方,卻得到的補助最多”。在用STATA計算上述不平等指標時需注意的一個問題是需要用人口數(shù)進行加權(quán)(aw=)。以Gini系數(shù)為例,假設有兩個縣,縣A人均收入為100元,人口數(shù)為100人;縣B的為1000元,人口數(shù)為1000人。如果計算Gini系數(shù)時不加權(quán),這時縣作為一個人來看待,計算出的Gini系數(shù)是0
25、.409;如果以人口數(shù)加權(quán),則是0.081。顯然,這是兩個差異較大的Gini系數(shù)。當然,進行加權(quán)主要是針對數(shù)據(jù)是分組數(shù)據(jù),如果是個體的數(shù)據(jù)(此時每個人即為一組)。此外,加權(quán)和不加權(quán)都有其現(xiàn)實含義,還要根據(jù)研究問題來確定。評價一個不平等指標在刻畫不平等時是否足夠好(或者能否提供足夠的信息)的一個一般方法是,不平等指標有四個準則:匿名準則、人口準則、相對收入準則、達爾頓準則。另外,不平等指標的一個基本的性質(zhì)是,如果給所有人的收入都增加同樣的數(shù)量,則不平等程度會降低,反之,則會提高。(?)1. Gini的計算在Gini系數(shù)的計算中,首先需要將個體(或人群組)按照收入從低到高進行排序,比較原始的計算方
26、法如下:該公式的實際運算較為繁瑣,一般手工計算難以完成。許多人提出了計算公式的其他形式,一種形式參見本章1.3節(jié)、1、(3)。這里介紹另外一種直觀簡便的計算基尼系數(shù)的方法。作為參考。假定樣本人口可以分成組,、和分別代表第i ( i=1,2,n )組的人均收入份額、平均人均收入和人口頻數(shù)。那么,對全部樣本按人均收入()由小到大排序后,基尼系數(shù)()可以用下式計算: 其中,為從1到i的累計收入比重;為洛倫茨曲線右下方面積的近似值;,。2. GE指數(shù)的計算方法GE指數(shù)(Generalized Entropy family of indices)的計算公式是: 其中,n為樣本數(shù),ni為當樣本分為i組時,
27、該組人口數(shù)占總?cè)丝跀?shù)的比重,如果每個個體即為一組,則ni1;a為常數(shù),代表厭惡不平等的程度,a值越小,它所代表的厭惡程度越高。GE(1)又稱為泰爾指數(shù)(Theil index);GE(0)又可稱為平均對數(shù)離差。當a2時,GE指數(shù)就等價于變異系數(shù)的平方的二分之一。顯然,選擇用變異系數(shù)來度量不平等,意味著對收入不平等持更加接納的態(tài)度。1.3 不平等的分解不均等(Gini系數(shù))的要素分解總收入由各分項收入構(gòu)成,將總收入的Gini系數(shù)分解到各分項收入,得到各分項收入對總不平等的貢獻。1. Gini系數(shù)要素分解方法的原理可參見部分。提出者為Fei, Ranis and Kuo(1978)、Pyatt,
28、Chen and Fei(1980)。Stata命令為descogini,注意:該命令無法進行加權(quán)。分解公式為:根據(jù)yi從低到高進行排序,稱為擬基尼系數(shù)(Pseudo-Gini),或者稱為分項收入k的集中率指數(shù)(concentration ratio),是按照總收入yi對個體進行排序,計算出的k項收入的Gini系數(shù)。即:的一個用處是,當>G(y),且樣本人均收入不變,k項收入來源在總收入中的比重的增加將導致基尼系數(shù)的擴大,即導致更大的收入不均等,反之亦然。所以通過計算和比較>G(y),可以判斷收入來源對基尼系數(shù)的貢獻趨勢。根據(jù)上述公式,分項收入對總不平等的貢獻率就是:,或者上述公式
29、等價于Fei(1978)的公式,即:corr()表示相關系數(shù),i為按照總收入y對個體從低到高進行排序所對應的順序,ik為按照第k項收入yk對個體從低到高進行的排序。特別注意的是,這里G(yk)為第k項收入的Gini系數(shù)(而不再是擬Gini系數(shù))!由上也可以看出,擬Gini系數(shù)或k項收入的集中率等價于。在STATA的用于Gini系數(shù)要素來源分解的命令descogini的結(jié)果中,給出的即是Fei(1978)公式的結(jié)果。下面給出一個實例。應用“農(nóng)村家庭收入數(shù)據(jù)(甘肅2004).dta”數(shù)據(jù)文件。總收入由農(nóng)業(yè)生產(chǎn)收入、非農(nóng)生產(chǎn)收入、工資性收入、財產(chǎn)性收入和轉(zhuǎn)移性收入構(gòu)成,對總收入不平等進行Gini系數(shù)
30、分解,過程如下:*use ":農(nóng)村家庭收入數(shù)據(jù)(甘肅2004).dta"*對總收入Gini系數(shù)按收入來源進行分解descogini pinc pagrinc pprinc pwage ptset ptraninc*得到結(jié)果:-Source Sk Gk Rk Share % Change-pagrinc 0.4791 0.4897 0.6727 0.3527 -0.1264pprinc 0.2165 0.9398 0.8469 0.3851 0.1686pwage 0.2296 0.6657 0.5547 0.1894 -0.0402ptset 0.0005 0.9910 0
31、.5209 0.0006 0.0001ptraninc 0.0742 0.8321 0.5228 0.0722 -0.0021Total income 0.4475-總收入(Total income)Gini系數(shù)為0.4475。Sk為分項收入占總收入的比例,Gk為分項收入的Gini系數(shù),Rk為公式中相關系數(shù)的比值部分,Share為分項收入對總Gini系數(shù)的貢獻率(即sk),% Change指各分項收入1的變化對不平等的影響。如農(nóng)業(yè)生產(chǎn)收入(pagrinc)均值(?)每提高1,總Gini系數(shù)就會降低0.1264。由上結(jié)果可以計算出分析收入的擬Gini系數(shù)或集中率,即用Rk*Gk。計算結(jié)果如下:表
32、各分項收入集中率指數(shù)pagrinc0.3294pprinc0.7959pwage0.3693ptset0.5162ptraninc0.4350比較各分項收入集中率指數(shù)與總Gini系數(shù),可以看出農(nóng)業(yè)收入(pagrinc)、工資性收入(pwage)、轉(zhuǎn)移性收入(ptraninc)的集中率均小于總Gini系數(shù),而其他兩項則大于,正好對應于%Change中給出的正負號的結(jié)果。即前三者的收入的增加會降低總不平等程度,而后二者會提高不平等程度。2. 隨時間變化對基尼系數(shù)進行分解的方法。以上介紹的基尼系數(shù)的分解固然有用,但某項收入對基尼系數(shù)的百分比貢獻也許不大,但有可能是導致居民收入差異或基尼系數(shù)變化的重要
33、因素。因此,我們對于基尼系數(shù)進行隨時間變化的分解,可幫助我們找出其變化的原因。因為集中指數(shù)的變化可以獨立于收入比重的變化,所以由基尼指數(shù)表示的收入差異的擴大或縮小可以純粹來源于單項收入在總收入中的比重的變動,而非單項收入集中程度的變動。 以和+下標代表時間,基尼系數(shù)的變化為 上式表明,差異的變化可以分解為三大部分第一部分代表由比重變化引起的基尼系數(shù)的上升或下降;第二部分代表由集中程度的變化引起的基尼系數(shù)的上升或下降。第三部分代表由比重與集中程度變化共同引起的基尼系數(shù)的上升或下降。因為比重的變化與經(jīng)濟結(jié)構(gòu)的調(diào)整密切相關,我們可以將稱為結(jié)構(gòu)性效應,而稱為集中效應,綜合效應。 不平等的子樣本組群分解
34、這里主要介紹Theil指數(shù)(a=1)的分解以及Gini系數(shù)的分解,其他不平等指標的分解原理同Theil指數(shù),如GE(-1)、GE(0)、 GE(2))、Atkinson指數(shù)等。1. Theil指數(shù)分解方法Stata命令為ineqdeco,該命令的結(jié)果同時提供了其他幾種GE指數(shù)與Atkinson指數(shù)的分解結(jié)果。將總不平等分解為不同子群體之間的不平等,如城市和農(nóng)村的差異、縣內(nèi)和縣之間的差異。從而得到各子群內(nèi)部不平等(within)和子群體之間(between)的不平等分別對總不平等的貢獻。根據(jù)Theil指數(shù)的基本計算公式:總體Theil系數(shù)可分解為組內(nèi)差異和組間差異。假定樣本中的最小觀測單位可分為
35、多個組,則組內(nèi)差異系數(shù)(Tw)為:這里nk是第k組的人數(shù),為第k組的平均收入,Tk為第k組的Theil指數(shù),即將k組單獨計算的Theil指數(shù)。組間不平等系數(shù)(Tb)即使總體不平等系數(shù)與組間不平等系數(shù)之差:Tb=TTw。用組內(nèi)差異和組間差異分別除以總差異,即得到各自對總差異的貢獻。這里同時給出其他幾個GE指數(shù)的分解公式,當,組內(nèi)差異為: GEk(a)為k組的Theil指數(shù)。 STATA的ineqdeco命令只提供了組內(nèi)差異的貢獻的和,如果要進一步分析每一組內(nèi)差異的貢獻,可以根據(jù)該命令執(zhí)行后提供的結(jié)果,運用上述公式進行計算。下面同樣利用“農(nóng)村家庭收入數(shù)據(jù)(甘肅2004).dta”的數(shù)據(jù)給出一個實例
36、。* use ":農(nóng)村家庭收入數(shù)據(jù)(甘肅2004).dta"*用Theil指數(shù)分解方法將總收入分解為村內(nèi)和村之間的不平等。Ineqdeco pinc, by(vcode) s*s選項指列出變量的描述性統(tǒng)計量。下面摘出部分結(jié)果。描述性統(tǒng)計量的結(jié)果為:家庭人均總收入- Percentiles Smallest 1% 280 127 5% 534 128.571410% 742 152.6667 Obs 191325% 1299 166.6667 Sum of Wgt. 191350% 2289.2 Mean 3080.41 Largest Std. Dev. 4279.4917
37、5% 3544 53006.6790% 5375 58100 Variance 1.83e+0795% 7037.5 60216 Skewness 7.94699399% 17665 60450 Kurtosis 86.86039結(jié)果列出了GE指數(shù)(Theil指數(shù)為GE(1)和Gini系數(shù):- All obs | GE(-1) GE(0) GE(1) GE(2) Gini-+- | 0.51970 0.36378 0.42792 0.96452 0.44752結(jié)果同時給出了各村的收入的描述性統(tǒng)計量,由于結(jié)果較多,這里略。村內(nèi)差異的貢獻為:within-group inequality, GE_
38、W(a)- All obs | GE(-1) GE(0) GE(1) GE(2)-+- | 0.39863 0.25353 0.31683 0.84210-如果要計算每個村內(nèi)的貢獻,可根據(jù)Theil指數(shù)分解公式計算出,你可以自己試著計算一下。 村之間差異的貢獻為:Between-group inequality, GE_B(a):- All obs | GE(-1) GE(0) GE(1) GE(2)-+- | 0.12108 0.11025 0.11109 0.12242-上述結(jié)果的一個經(jīng)濟含義是,影響農(nóng)村家庭收入不平等的因素中,村內(nèi)不平等起到了主要的作用(占到74)。2. Gini系數(shù)按照
39、子樣本組群的分解STATA命令為ginidecoGini子樣本的分解與Theil系數(shù)分解有所不同,在于除去有組內(nèi)不平等、組間不平等的貢獻之外,還包括組內(nèi)組間交叉(overlap)影響。交叉影響的含義是,某組中高收入的與另一組低收入的比較后,對總體不平等影響。例如,如果要將我國人均收入不平等用Gini系數(shù)分解為城鎮(zhèn)和農(nóng)村內(nèi)部、城鎮(zhèn)與農(nóng)村之間以及兩者交叉影響,交叉影響的含義是農(nóng)村中高收入的那些個體與城鎮(zhèn)中低收入個體相比較后的影響。這種方法的經(jīng)濟含義或現(xiàn)實含義還有待挖掘,文獻中用的也較少?;诨貧w分解收入均值的組間差異:Oaxaca-Blinder方法上述兩種方法只能將不平等分解為子要素或不同組群總
40、不平等的貢獻,但無法考察決定目標變量(如收入)的因素對收入不平等的貢獻?;诨貧w的不平等分解則能解決這一問題。較早基于回歸分解收入不平等的方法源自對組間收入均值差異的分解。以性別收入差異為例,通過建立收入決定函數(shù),可以將性別收入差異分解到各決定收入的因素對性別收入差異的貢獻以及不可解釋部分的貢獻,其中,不可解釋部分的貢獻常被看作是“市場歧視”(通常是對女性的歧視)。這里介紹以Oacaca-Blinder的分解方法發(fā)展起來的幾種方法。1.Oacaca-Blinder基本分解公式STATA命令為oaxaca或oaxaca9。通過ssc install oaxaca安裝。在oaxaca9中,同時給出
41、了估計的統(tǒng)計檢驗的結(jié)果。在性別工資差異的分解中,廣泛采用的基本方法是Oaxaca(1973)與Blinder(1973)提出的分解方法,被稱為Oaxaca-Blinder基本分解公式。這一分解公式基于Becker雇主歧視模型推導出來的。后來,許多學者對這一公式進行的修正。如Neumark(1988)、Cotton(1988)、Neuman & Oaxaca(2004)等人。根據(jù)Oaxaca(1973)、Oaxaca & Ransom(1994),總性別工資差異由下面公式定義: (1)這里和分別表示男性和女性的工資。在沒有勞動力市場歧視的條件下,男性與女性工資之比反映的是純粹的生
42、產(chǎn)率差異,以表示: (2)這里0表示勞動力市場上不存在歧視。市場歧視系數(shù),定義為 ()與()之間的差異的比例,即: (3)公式(1)-(3)意味著總工資差異可以以對數(shù)的形式表示如下: (4)由歧視部分造成的工資差異又進一步可以分解為給男性過高工資(或市場優(yōu)惠男性的部分)和給女性過低工資(或市場歧視女性部分)兩部分,如下: (5)這里, 為男性當前工資與沒有歧視情況下的工資差異, 為女性在沒有歧視情況下的工資與當前工資的差異。將式(5)代入(4),就會得到以對數(shù)形式表示的總工資差異的分解公式: (6)分別估計男性和女性的工資函數(shù)(OLS),得到工資的對數(shù): 這里,ln表示工資對數(shù)的均值,為以向量
43、形式表示的解釋變量的均值,為估計系數(shù)向量。由此得到對數(shù)形式表示的總工資差異就是:根據(jù)上式,公式(6)可進一步分解為: (7)公式中右邊部分的第一項即為市場優(yōu)惠男性的部分,第二項為市場歧視女性的部分,這兩項合稱為未被解釋的部分,可以看作是市場歧視部分造成的工資差異;第三項為個體生產(chǎn)率特征解釋的部分。這里為表示估計的非歧視的工資結(jié)構(gòu),也被成為權(quán)重。一般形式的的定義如下: (8)為加權(quán)矩陣。因而,或者的選取成為工資差異分解的關鍵之處。在基本的Oaxaca-Blinder分解公式中,權(quán)重的取值有兩個:男性工資方程的系數(shù)(1)或者女性工資方程的系數(shù)(0)。前者說明的是以男性工資結(jié)構(gòu)作為勞動力市場上普遍的
44、工資結(jié)構(gòu),而后者以女性工資結(jié)構(gòu)作為普遍的工資結(jié)構(gòu)。一些研究者(如Neumark,1988)指出,這樣的取值會造成分解結(jié)果的差異,甚至差距巨大,如在Ferber and Green(1982)對大學教授性別工資差異的研究中,用前者作為權(quán)重,歧視可以解釋工資差異的2,而用后者,可以解釋70。這也被許多學者稱為“指數(shù)基準(Index Benchmark)問題”。由于這一問題,Cotton(1988)、Neumark(1988)等人提出了修正的方法,對男性系數(shù)和女性系數(shù)作了一個加權(quán)平均后作為權(quán)重,也就是公式(8)所表示的形式。不過,兩者在權(quán)重的選取上有所不同。Cotton實際上是分別用男性或女性勞動力
45、市場參與率作為權(quán)數(shù)(即的取值,仍然存在指數(shù)基準問題),而Neumark則是以混合后的男女工資方程(表示不存在勞動力市場歧視)的系數(shù)作為的取值?;贐ecker的歧視模型,Oaxaca & Ransom(1994)分別對上述四種取值從理論上進行了解釋,并通過比較各取值分解的工資差異系數(shù)的標準誤的大小,在經(jīng)驗上指出以混合后的男女工資方程的系數(shù)作為的取值具有最小標準誤,因而效果最佳。Oaxaca基本分解方法在經(jīng)驗分析中的另一問題是樣本選擇。由于工資方程回歸分析中只有收入大于零、或參與勞動力市場的個體數(shù)據(jù),對于那些沒有進入勞動力市場的個體無法獲得其收入信息,因而傳統(tǒng)上的樣本選擇偏差問題也會影響
46、Oaxaca分解結(jié)果。對于這一問題,一些經(jīng)濟學家將Heckman二階段法運用到工資分解中,從而對這一問題進行了修正。但從結(jié)果來看,有的研究認為樣本選擇造成了較大的影響,而其他一些研究并未發(fā)現(xiàn)樣本選擇糾正后的結(jié)果與沒有糾正的結(jié)果有太大的區(qū)別。下面應用“2005年廣東省人口抽樣數(shù)據(jù).dta”數(shù)據(jù)給出一個實例。根據(jù)數(shù)據(jù),假設工資收入方程為:各變量的相應含義參見數(shù)據(jù)文件。*use ":2005年廣東省人口抽樣數(shù)據(jù).dta"g lnwage=ln(wage)*(1)以男性工資方程的系數(shù)為基準,即方程(8)中1*oaxaca lnwage sch_year age age2 marri
47、ed section,by(female) w(0) d(age=age*)*說明:by()選項指分組;w()為weight的所寫,指以哪組為基準,由于female變量值0時表示男性,故w(0);d()是將方程中含有多項式的變量,在結(jié)果中合并為一個,即age造成的差異。如果同時想要得到男性和女性工資方程的估計結(jié)果,則可加入選項命令noi,這里略。估計結(jié)果如下:Blinder-Oaxaca decomposition Number of obs = 37939 1: female = 0 2: female = 1- lnwage | Coef. Std. Err. z P>|z| 95%
48、 Conf. Interval-+-Differential |Prediction_1 | 7.242706 .0046748 1549.32 0.000 7.233544 7.251868Prediction_2 | 7.015698 .0053333 1315.45 0.000 7.005245 7.026151 Difference | .2270081 .0070921 32.01 0.000 .2131079 .2409084-+-Explained | sch_year | .0472707 .0043371 10.90 0.000 .0387701 .0557712 age |
49、 .016506 .0022268 7.41 0.000 .0121416 .0208704 married | -.0020037 .0005397 -3.71 0.000 -.0030614 -.0009459 section | .0006113 .00035 1.75 0.081 -.0000746 .0012973 Total | .0623843 .0048672 12.82 0.000 .0528449 .0719238-+-Unexplained | sch_year | -.259156 .0284742 -9.10 0.000 -.3149643 -.2033476 age
50、 | .2544667 .0970657 2.62 0.009 .0642215 .4447119 married | .0696424 .0139843 4.98 0.000 .0422337 .0970511 section | -.041163 .0097017 -4.24 0.000 -.060178 -.0221481 _cons | .1408337 .0912433 1.54 0.123 -.0379999 .3196673 Total | .1646238 .0063343 25.99 0.000 .1522088 .1770388-age: age age2結(jié)果中,1表示男性組,2表示女性組;prediction_1和_2分別表示男性與女性工資對數(shù)的均值;Difference表示男女工資差異,即(男性工資/女性工資)1。Explained部分表示了由各解釋變量解釋了的工資差異部分(又稱稟賦差異),對應于方程(7)中右邊第三項。簡單計算可知,性別工資差異可解釋的部分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 村健身場地管理制度
- 村衛(wèi)生保潔管理制度
- 村水利設備管理制度
- 村級圖書屋管理制度
- 村運轉(zhuǎn)經(jīng)費管理制度
- 校園園區(qū)化管理制度
- 油品類油漆管理制度
- 氧氣暫存室管理制度
- 水廠凈化室管理制度
- 水果店員工管理制度
- 部編人教版一年級下冊道德與法治復習計劃
- 新基建浪潮下臨沂市智慧交通管理的創(chuàng)新與突破
- 臨時用電施工方案技術交底
- 中國狼瘡腎炎診治和管理指南(2025版)解讀
- 廠房維修合同協(xié)議書模板
- 安徽省合肥四十五中學2025屆數(shù)學七下期末達標檢測試題含解析
- 2025年Z世代消費行為與品牌社群營銷研究報告
- 2025年春季《中華民族共同體概論》第二次平時作業(yè)-國開(XJ)-參考資料
- 變電站二次系統(tǒng)介紹(大唐)
- 《流行性感冒辨證論治》課件
- JJG(交通) 208-2024 車貨外廓尺寸動態(tài)現(xiàn)場檢測設備
評論
0/150
提交評論