伍德里奇《計量經(jīng)濟學導論》復習筆記和課后習題詳解-含有定性信息的多元回歸分析:二值變量_第1頁
伍德里奇《計量經(jīng)濟學導論》復習筆記和課后習題詳解-含有定性信息的多元回歸分析:二值變量_第2頁
伍德里奇《計量經(jīng)濟學導論》復習筆記和課后習題詳解-含有定性信息的多元回歸分析:二值變量_第3頁
伍德里奇《計量經(jīng)濟學導論》復習筆記和課后習題詳解-含有定性信息的多元回歸分析:二值變量_第4頁
伍德里奇《計量經(jīng)濟學導論》復習筆記和課后習題詳解-含有定性信息的多元回歸分析:二值變量_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

伍德里奇《計量經(jīng)濟學導論》復習筆記和課后習題詳解■含有定

性信息的多元回歸分析:二值變量

第7章含有定性信息的多元回歸分析:二值(或虛擬)變量

7.1復習筆記

考點一:帶有虛擬自變量的回歸*****

1.對定性信息的描述

定性信息是指通常以二值信息(0-1)的形式出現(xiàn)的信息,如性別、

是否結婚等。在計量經(jīng)濟學中,二值變量又稱為虛擬變量。

2.只有一個虛擬自變量

(1)只有一個虛擬自變量的簡單模型

考慮決定小時工資的簡單模型:wage=[30+60female+pleduc

根據(jù)多元回歸的解釋方式,表示控制不變時,

+uo60educfemale

變化1單位給wage帶來的變化。假定零條件均值假定E(u|female,

educ)=0成立,那么:50=E(wage|female=1,educ)-E

(wage|female=0,educ),其中female=1表示女性,female

=0表示男性??梢园l(fā)現(xiàn),在任意教育水平下,男性與女性的工資差異

是固定的,女性工資比男性工資多

60o

除了P0之外,模型中只需要引入一個虛擬變量。因為female+

所以引入兩個虛擬變量會導致完全多重共線性,即虛擬變

male=lz

量陷阱。

(2)當因變量為log(y)時,對虛擬解釋變量系數(shù)的解釋

當變量中有一個或多個虛擬變量,且因變量以對數(shù)的形式存在時,

虛擬變量的系數(shù)可以

理解為百分比的變化。將虛擬變量的系數(shù)乘以100,表示的是在

保持所有其他因素不變時y的百分數(shù)差異,精確的百分數(shù)差異為:

其中八

100-[exp(Api)-l]e

Pl是一個虛擬變量的系數(shù)。3.使用多類別虛擬變量

(1)在方程中包括虛擬變量的一般原則

如果回歸模型具有g組或g類不同截距,一種方法是在模型中包

含g-1個虛擬變量和一個截距?;M的截距是模型的總截距,某一組

的虛擬變量系數(shù)表示該組與基組在截距上的估計差異。如果在模型中

引入g個虛擬變量和一個截距,將會導致虛擬變量陷阱。

另一種方法是只包括g個虛擬變量,而沒有總截距。這種方法存

在兩個實際的缺陷:①對于相對基組差別的檢驗變得更繁瑣;②在模

型不包含總截距時,回歸軟件通常都會改變R2的計算方法。具體而

言,就是公式R2=1-SSR/SST中的總平方和SST,被一個沒有將y

i減去其均值的總平方和SST0取代,由此得到的R02=l-SSR/SST

0稱為未中心化的R2,從而有可能使得擬合優(yōu)度指標失效。SST0的

計算公式為:

2

01SSTn

iiy==1(2)通過虛擬變量來包含序數(shù)信息

假設要估計城市信用等級對市政債券利率(MBR)的影響。城市

信用等級是一個序數(shù)變量,范圍是0~4,稱這個變量為CR??梢詫?/p>

CR的每個值都定義一個虛擬變量。由于有5個類別,所以可包括4個

虛擬變量,將零信用等級定為基組并省略。若CR=1,則CR1=1,

否貝I」CR1=O;若CR=2,貝UCR2=1,否貝!JCR2=0,以止匕類推。

因止匕,可以轉化為估計模型:MBR=PO+61CR1+62CR2+

63CR3+64CR4+其他因素。

以61為例,系數(shù)的解釋為:61為信用等級為1級的城市和信用

等級為0級的城市之間在MBR上的差異(保持其他因素不變)。

考點二:涉及虛擬變量的交互作用★★★★

1.虛擬變量之間的交互作用

具有定量意義的變量在回歸模型中可以具有交互作用,類似的,

虛擬變量也能產(chǎn)生交互作用。虛擬變量的交互作用就是在模型中引入

虛擬變量的乘積形式。

2.容許出現(xiàn)不同的斜率

(1)不含交互項的模型

在多元回歸模型中存在任意幾個組之間的截距不同的情況。在有

些情況下,虛擬變量也可與非虛擬的解釋變量有交互作用,從而出現(xiàn)

不同的斜率。

考慮模型:log(wage)=(pO+SOfemale)+(01+

Slfemale)educ+u。當female=0時,模型可以寫成:log

(wage)=pO+pleduc+u;當female=1時,模型變?yōu)椋簂og

度量的是男性和女性

(wage)=(30+60+(pl+51)educ+uo60

在截距上的差異,而61度量男性和女性在斜率(即受教育回報)上的

差異。

(2)含有交互項的模型

考慮模型:log(wage)=p0+80female+pleduc+

一個重要的假設是,男性和女性受教育的回報是

81female-educ+uo

相同的,這可以表述成H0:81=0。這意味著log(wage)對educ

的斜率對男性和女性而言無差異。在這個虛擬假設之下,允許在不同

教育水平下,男性和女性的工資存在差異,但性別工資差異在各種相

同教育水平上必須相同。

若對受教育程度相同的男性和女性的平均工資相同這個假設感興

趣,則50和61都必須同時為零。必須使用F檢驗來檢驗虛擬假設H0:

80=0,81=0o

3.檢驗不同組之間回歸函數(shù)上的差別

在含有k個解釋變量和1個截距項的一般模型中,假設有兩組g二

和。對和將模型寫成:

1g=2g=lg=2y=Pg,O+pg,lxl+pg,

2x2+...+0g,kxk+uo

檢驗這兩組的截距和所有斜率都相同,就意味著產(chǎn)生了k+1個約

束。可以認為無約束模型除了截距和變量本身外,還有一組虛擬變量

和交互項,那么其自由度為n-2(k+1).無約束模型的殘差平方和

可通過兩個分離的回歸得到,這兩個不同回歸分別對應著兩個不同的

組,令SSR1(SSR2)表示針對第一組(第二組)估計式所得到的殘

差平方和,它涉及nl(n2)個觀測。而約束模型的殘差平方和就是將

兩組混合在一起并估計同一個方程時所得到的SSRp。

在此基礎上,就可以計算F統(tǒng)計量:F={[SSRp-(SSR1+

SSR2)]/(SSRl+SSR2)}-{[n-2(k-1)]/(k+1)}o其中,n為

總觀測次數(shù)。在計量經(jīng)濟學中,這也被稱為鄒至莊統(tǒng)計量。鄒至莊檢

驗的一個重要局限是原假設要求各組之間不存在任何差異。但在更多

情況下,允許組間的截距不同,然后再來檢驗斜率的差別會更有意義。

鄒至莊檢驗的步驟包括:

(1)分別對兩組數(shù)據(jù)進行回歸估計得到殘差平方和SSR1和SSR2,

兩者之和即為無約束模型的殘差平方和。

(2)將兩組數(shù)據(jù)混合進行估計得到殘差平方和SSRp,這就是為

受約束回歸殘差平方和。

(3)構造F統(tǒng)計量,并與給定顯著水平下F的臨界值進行比較。

若F值大于臨界值,

則拒絕原假設,即說明兩個回歸函數(shù)存在差異。

考點三:二值因變量:線性概率模型★★★★

1.線性概率模型

考慮模型:y=BO+Blxl+02x2+...+Bkxk+uo在零條件均

值假定MLR.4成立時,E(y|x)=po+plx1+p2x2+...+pkxke

當y是一個取值為0和1的二值變量時,P(y=l|x)=E(y|x)

總是成立的。因此有:P(y=1|x)=p0+plx1+p2x2+...+pkx

ko這意味著成功的概率p(x)=P(y=l|x)是所有x變量的一個

線性函數(shù)。

方程P(y=1|x)=p0+plx1+p2x2+...+0kxk是二值響應

模型的一個例子,P(y=l|x)被稱為響應概率。因為響應概率是所

有參數(shù)P的線性函數(shù),所以這類模型又被稱為線性概率模型(LPM)。

在LPM中,在保持其他因素不變時,印度量因xj的變化導致成功概

率的變化(j=1,2k):?P(y=l|x)=Pj?xje

2.線性概率預測

以二值變量為因變量進行預測時,預測的概率可能不會落在0~1

區(qū)間內。令八yi表示擬合值,定義預測值iy在八yi1.5時取值為1,

并在八

yi

<0.5時取值為0?,F(xiàn)在,便得到一組預測值iy,這些預測值和y

i一樣,取值不是。便是1。利用yi和iy

的數(shù)據(jù),就可以得到正確預測yi=1和yi=0的頻率以及全部正

確預測的比例。若用百分比表示全部正確預測的比例,便是二值因變

量擬合優(yōu)度的一個廣泛使用的指標。

3.線性概率模型可能存在異方差性

當y是二值變量時,以x為條件的方差為:Var(y|x)=p(x)

[1-p(x)]0其中,p(x)=pO+plxl+...+pkxko這意味著,除

非概率與任何一個自變量都不相關,否則,線性概率模型中就一定存

在著異方差性。因此,由于y的二值特性,線性概率模型違背了一個

高斯?馬爾可夫假定。

4.離散因變量的回歸結果解釋

一般地,在假設MLR.1和MLR.4下:E(y|xl,x2,xk)

=P0+plxl+p2x2+...+pkxkopj是指在其他條件不變時,xj的增

加對y的期望值的影響。給定一組xj值,擬合值

A

p0+Aplxl+Ap2x2+...+Apkxk就是E(y|xl,x2,,xk)

的一個估計。因此Mj是當?xj=1時,對y的平均變動的估計(保持

其他因素不變)。

7.2課后習題詳解

一、習題

1.利用SLEEP75中的數(shù)據(jù)(也可參見第3章習題3),我們得到

如下估計方程:

sleep=3840X3-0.1bytotwrk-11.7\educ-8.70砍c+().1+87.75mHc

(235.11)(0.018)(5.86)(11.21)(0.134)(34.33)

/i?706?R)?0/23.F-0.117

變量sleep是每周晚上睡眠的總分鐘數(shù),totwrk是每周花在工作

上的總分鐘數(shù),educ和age則以年為單位,而male是一個性別虛擬

變量。

(i)所有其他因素不變,有沒有男性比女性睡眠更多的證據(jù)?這

個證據(jù)有多強?

(ii)工作與睡眠之間有統(tǒng)計顯著的取舍關系嗎?所估計的取舍關

系是什么樣的?

(iii)為了檢驗年齡在其他因素不變的情況下對睡眠沒有影響這

個原假設,你還需要另外做什么回歸?

答:(i)變量male的回歸系數(shù)是87.75,根據(jù)估計結果可知,男

性每周的睡眠時間要比女性每周的睡眠時間多近一個半小時。又因為

tmale=87.75/34.33-2.56

其值接近于99%的置信水平下的雙側檢驗的臨界值(大約為

2.58),因此男性比女性睡眠更多的證據(jù)是相當強的。

(ii)變量totwrk的t統(tǒng)計量的值為:

ttotwrk=-0.163/0.018*-9.06

這是非常顯著的。這個系數(shù)表明每周平均多工作一個小時(60分

鐘),對應的平均每周晚上睡眠將減少0.163x60,9.8(分鐘)。

(iii)需要對不含變量age和age2的模型進行回歸,以便得到R

r2,即受約束模型的R2。當模型中含有變量age和age2時,當且僅

當兩個變量age和age2前的系數(shù)均為0時,才表明年齡在其他因素

不變的情況下對睡眠沒有影響這個原假設成立。

2BWGHT中的數(shù)據(jù),可估計出如下方程:

log(hwfiht)=4.66一0.0044c/g,v+0.0093log(^famine)+0.016parity

(0.22)(0.0009)(0.0059)(0.006)

+O.O27male+0.055white

(0.010)(0.013)

/1=I388.R2=0.0472

log(hwfiht)=4.65-O.OO52c7g.v+0.011Olog(famine)

(0.38)(0.0010)(0.0085)

+0.017parity+0.034/wa/e

(0.006)(0.011)

+0,045while-0.0030molheduc+0.0032fatheduc

(0.015)(0.0030)(0.0026)

^=1191./?2=0.0493

變量定義和例4.9中一樣,但我們增加了兩個虛擬變量:一個虛擬

變量表明孩子是不是男孩,另一個虛擬變量則表明這個孩子是不是白

人。

(i)在第一個方程中,解釋變量cigs的系數(shù)。具體而言,每天多

抽10根煙對出生體重有何影響?

(ii)在第一個方程中,保持其他因素不變,預計一個白人孩子的

出生體重比一個非白人孩子重多少?這個差異是統(tǒng)計顯著的嗎?

(iii)評價motheduc的估計影響和統(tǒng)計顯著性。

(iv)從這些給定信息中,為什么不能計算出檢驗motheduc和

fatheduc聯(lián)合顯著性的F統(tǒng)計量?為了計算這個統(tǒng)計量,還需要做些

什么?

答[(i:如果變量cigs每增加10根,即每天多抽10根煙,則:

Alog(6wg/?/)=-0.0044x10=-0.044

即嬰兒出生體重將減少大約4.4%。

(ii)在第一個方程中,保持其他因素不變,預計一個白人孩子比

一個非白人孩子的出生體重多5.5%。另外,twhite*4.23,在一般常

用的顯著性水平下都是顯著的。因此,一個白人孩子與一個非白人孩

子的出生體重在統(tǒng)計上是有顯著差異的。

(iii)如果母親的教育年限每增加1年,孩子的出生體重將增加

這個影響是很小的,其因此母親的受教育年

0.3%,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論