伍德里奇計(jì)量經(jīng)濟(jì)學(xué)中文答案_第1頁(yè)
伍德里奇計(jì)量經(jīng)濟(jì)學(xué)中文答案_第2頁(yè)
伍德里奇計(jì)量經(jīng)濟(jì)學(xué)中文答案_第3頁(yè)
伍德里奇計(jì)量經(jīng)濟(jì)學(xué)中文答案_第4頁(yè)
伍德里奇計(jì)量經(jīng)濟(jì)學(xué)中文答案_第5頁(yè)
已閱讀5頁(yè),還剩118頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章計(jì)量?濟(jì)學(xué)的性質(zhì)與經(jīng)濟(jì)數(shù)據(jù)

1.1復(fù)習(xí)筆記

一、計(jì)量經(jīng)濟(jì)學(xué)

由于計(jì)量經(jīng)濟(jì)學(xué)主要考慮在搜集和分析非實(shí)驗(yàn)經(jīng)濟(jì)數(shù)據(jù)時(shí)的固有問(wèn)題,計(jì)量經(jīng)濟(jì)學(xué)已從數(shù)理統(tǒng)計(jì)分離出來(lái)并

演化成一門(mén)獨(dú)立學(xué)科.

1.非實(shí)驗(yàn)數(shù)據(jù)是指并非從對(duì)個(gè)人、企業(yè)或經(jīng)濟(jì)系統(tǒng)中的某些部分的控制實(shí)驗(yàn)而得來(lái)的數(shù)據(jù)。非實(shí)驗(yàn)數(shù)據(jù)有

時(shí)被稱為觀測(cè)數(shù)據(jù)或回顧數(shù)據(jù),以強(qiáng)調(diào)研究者只是被動(dòng)的數(shù)據(jù)搜集者這一事實(shí)。

2.實(shí)驗(yàn)數(shù)據(jù)通常是在實(shí)驗(yàn)環(huán)境中獲得的,但在社會(huì)科學(xué)中要得到這些實(shí)驗(yàn)數(shù)據(jù)則困難得多。

二、經(jīng)驗(yàn)經(jīng)濟(jì)分析的步驟

經(jīng)驗(yàn)分析就是利用數(shù)據(jù)來(lái)檢驗(yàn)?zāi)硞€(gè)理論或估計(jì)某種關(guān)系.

1.對(duì)所關(guān)心問(wèn)題的詳細(xì)闡述

在某些情形下,特別是涉及到對(duì)經(jīng)濟(jì)理論的檢驗(yàn)時(shí),就要構(gòu)造一個(gè)規(guī)范的經(jīng)濟(jì)模型。經(jīng)濟(jì)模型總是由描述各

種關(guān)系的數(shù)理方程構(gòu)成.

2.經(jīng)濟(jì)模型變成計(jì)量模型

先了解一下計(jì)量模型和經(jīng)濟(jì)模型有何關(guān)系.與經(jīng)濟(jì)分析不同,在進(jìn)行計(jì)量經(jīng)濟(jì)分析之前,必須明確函數(shù)的形

式。

通過(guò)設(shè)定一個(gè)特定的計(jì)量經(jīng)濟(jì)模型,就解決了經(jīng)濟(jì)模型中內(nèi)在的不確定性。

在多數(shù)情況下,計(jì)量經(jīng)濟(jì)分析是從對(duì)一個(gè)計(jì)量經(jīng)濟(jì)模型的設(shè)定開(kāi)始的,而沒(méi)有考慮模型構(gòu)造的細(xì)節(jié)。一旦設(shè)

定了一個(gè)計(jì)量模型,所關(guān)心的各種假設(shè)便可用未知參數(shù)來(lái)表述。

3.搜集相關(guān)變量的數(shù)據(jù)

4.用計(jì)量方法來(lái)估計(jì)計(jì)量模型中的參數(shù),并規(guī)范地檢驗(yàn)所關(guān)心的假設(shè)

在某些情況下,計(jì)量模型還用于對(duì)理論的檢驗(yàn)或?qū)φ哂绊懙难芯俊?/p>

三、經(jīng)濟(jì)數(shù)據(jù)的結(jié)構(gòu)

1.橫截面數(shù)據(jù)

(1)橫截面數(shù)據(jù)集,就是在給定時(shí)點(diǎn)對(duì)個(gè)人、家庭、企業(yè)、城市、州、國(guó)家或一系列其他單位采集的樣本

所構(gòu)成的數(shù)據(jù)集。有時(shí),所有單位的數(shù)據(jù)并非完全對(duì)應(yīng)于同一時(shí)間段.在一個(gè)純粹的橫截而分析中,應(yīng)該忽略數(shù)

據(jù)搜集中細(xì)小的時(shí)間差別。

(2)橫截面數(shù)據(jù)的重要特征

①假定它們是從樣本背后的總體中通過(guò)隨機(jī)抽樣而得到的。

當(dāng)抽取的樣本(特別是地理上的樣本)相對(duì)總體而言太大時(shí),可能會(huì)導(dǎo)致另?種偏高隨機(jī)抽樣的情況.這種

情形中潛在的問(wèn)題是,總體不夠大,所以不能合理地假定觀測(cè)值是獨(dú)立抽取的.

②數(shù)據(jù)排序不影響計(jì)量分析這一事實(shí),是由隨機(jī)抽樣而得到橫截面數(shù)據(jù)集的一個(gè)重要特征.

2.時(shí)間序列數(shù)據(jù)

(1)時(shí)間序列數(shù)據(jù)集,是由對(duì)一個(gè)或幾個(gè)變量不同時(shí)間的觀測(cè)值所構(gòu)成.與橫截面數(shù)據(jù)的排序不同,時(shí)間

序列對(duì)觀測(cè)值按時(shí)間先后排序,這也傳遞了潛在的甌要信息.

(2)時(shí)間序列數(shù)據(jù)的特征

①很少(即使能夠)假設(shè)經(jīng)濟(jì)數(shù)據(jù)的觀測(cè)獨(dú)立于時(shí)間,使得對(duì)它的分析比對(duì)橫截面數(shù)據(jù)的分析更為困難。

②數(shù)據(jù)搜集時(shí)的數(shù)據(jù)頻率,最常見(jiàn)的頻率是每天、每周、每月、每個(gè)季度和每年。

3.混合橫截面數(shù)據(jù)

有些數(shù)據(jù)既有橫截而數(shù)據(jù)的特點(diǎn),又有時(shí)間序列的特點(diǎn).為了擴(kuò)大樣本容量,可以將數(shù)據(jù)合并成一個(gè)混合橫

截而數(shù)據(jù)。

對(duì)混介橫截面數(shù)據(jù)的分析與對(duì)標(biāo)準(zhǔn)橫截面數(shù)據(jù)的分析十分相似,不同之處在于,前者通常要對(duì)變量在不同時(shí)

間的長(zhǎng)期差異做出解釋。實(shí)際上,除了能擴(kuò)大樣本容量之外,混合橫截面分析通常是為了看出一個(gè)基本關(guān)系如何

隨時(shí)間而變化.

4.面板或縱列數(shù)據(jù)

(1)面板數(shù)據(jù)(或縱列數(shù)據(jù))集,是由數(shù)據(jù)集中每個(gè)橫截面單位的一個(gè)時(shí)間序列組成。

(2)面板數(shù)據(jù)與橫截面數(shù)據(jù)的比較

①面板數(shù)據(jù)有別于混合橫截面數(shù)據(jù)的關(guān)鍵特征是,同一橫截面數(shù)據(jù)的數(shù)據(jù)單位都被跟蹤了一段特定的時(shí)期。

②由于面板數(shù)據(jù)要求同一單位不同時(shí)期的重復(fù)觀測(cè),所以要得到面板數(shù)據(jù)(特別是那些個(gè)人、家庭和企業(yè)的

數(shù)據(jù)),比得到混合橫截而數(shù)據(jù)更加困難.

③對(duì)同一觀測(cè)單位觀測(cè)一段時(shí)間,應(yīng)該比橫截而數(shù)據(jù)甚至混合橫截面數(shù)據(jù)更有優(yōu)越性。對(duì)同一單位的多次觀

測(cè),能控制個(gè)人、企業(yè)等觀測(cè)單位的某些觀測(cè)不到的特征.

④面板數(shù)據(jù)的第二個(gè)優(yōu)點(diǎn)是,它通常能夠研究決策行為或結(jié)果中滯后的重要性.由于預(yù)期許多經(jīng)濟(jì)政策在一

段時(shí)間之后才產(chǎn)生影響,所以面板數(shù)據(jù)所反映的信息就更有意義.

四、計(jì)量經(jīng)濟(jì)分析中的因果關(guān)系和其他條件不變的概念

1.因果關(guān)系

在多數(shù)對(duì)經(jīng)濟(jì)理論的檢驗(yàn)中,經(jīng)濟(jì)學(xué)家的目標(biāo)就是要推定一個(gè)變量對(duì)另一個(gè)變量具有因果效應(yīng)。雖然簡(jiǎn)單地

發(fā)現(xiàn)兩個(gè)或多個(gè)變量之間有某種聯(lián)系很誘人,但除非能得到某種因果關(guān)系,否則這種聯(lián)系很難令人信服.

2.其他條件不變

“其他(相關(guān))因素保持不變”的概念在因果分析中有重要作用.在研究?jī)蓚€(gè)變量之間的關(guān)系時(shí),所有其他的

相關(guān)因素都必須固定不變。因?yàn)樯鐣?huì)科學(xué)中所搜集到的多數(shù)數(shù)據(jù)都具有非實(shí)驗(yàn)特征,所以發(fā)現(xiàn)其中的因果關(guān)系極

具挑戰(zhàn)性.

1.2課后習(xí)題詳解

一、習(xí)題

1.假設(shè)你所在的大學(xué)要求你“找出每周學(xué)習(xí)小時(shí)數(shù)(study)和每周工作小時(shí)數(shù)(work)之間的關(guān)系”。把這

個(gè)問(wèn)題說(shuō)成“推斷study是否,導(dǎo)致Mork或work是否得致'stud/的問(wèn)題是否講得通?請(qǐng)解釋.

答:把這個(gè)問(wèn)題描述為因果關(guān)系是無(wú)意義的。經(jīng)濟(jì)學(xué)家會(huì)假設(shè)學(xué)生理性的選擇學(xué)習(xí)時(shí)間和工作時(shí)間(以及其

他活動(dòng),如上課、娛樂(lè)和休息)的組合,使得他們?cè)诿恐芸偣?68小時(shí)的時(shí)間約束下獲得最大的效用.可以使用

統(tǒng)計(jì)方法如回歸分析方法去衡量學(xué)習(xí)和工作時(shí)間之間的關(guān)系,但是不能判斷哪一個(gè)變量“導(dǎo)致”另一個(gè)變量。他

們同屬于學(xué)生選擇的變量之一。

2.假設(shè)讓你進(jìn)行一項(xiàng)研究,以確定較小的班級(jí)規(guī)模是否會(huì)提高四年級(jí)學(xué)生的成績(jī)。

(i)如果你能設(shè)定你想做的任何實(shí)驗(yàn),你想做些什么?請(qǐng)具體說(shuō)明。

(ii)更現(xiàn)實(shí)地,假設(shè)你能搜集到某個(gè)州幾千名四年級(jí)學(xué)生的觀測(cè)數(shù)據(jù).你能得到他們四年級(jí)班級(jí)規(guī)模和四

年級(jí)末的標(biāo)準(zhǔn)化考試分?jǐn)?shù)。你為什么預(yù)計(jì)班級(jí)規(guī)模與考試成績(jī)存在負(fù)相關(guān)關(guān)系?

(iii)負(fù)相關(guān)關(guān)系一定意味著較小的班級(jí)規(guī)模會(huì)導(dǎo)致更好的成績(jī)嗎?請(qǐng)解釋.

答:(i)假定能夠魁機(jī)的分配學(xué)生們?nèi)ゲ煌?guī)模的班級(jí),也就是說(shuō),在不考慮學(xué)生諸如能力和家庭背景等特

征的前提下,每個(gè)學(xué)生被隨機(jī)的分配到不同的班級(jí).因此可以看到班級(jí)規(guī)模(在倫理考量和資源約束條件下的主

體)的顯著差異.

(ii)負(fù)相關(guān)關(guān)系意味著更大的班級(jí)規(guī)模與更差的考試成績(jī)是有宜接聯(lián)系的,因此可以發(fā)現(xiàn)班級(jí)規(guī)模越大,

導(dǎo)致考試成績(jī)?cè)讲睢?/p>

通過(guò)數(shù)據(jù)可知,兩者之間的負(fù)相關(guān)關(guān)系還有其他的原因。例如,富裕家庭的孩子在學(xué)??赡芨嗟募尤胄“?,

而且他們的成績(jī)優(yōu)于平均水平.

另外一個(gè)可能性是:學(xué)校的原則是將成績(jī)較好的學(xué)生分配到小班?;蛘卟糠指改缚赡軋?jiān)持讓自己的孩子進(jìn)入

更小的班級(jí),而同樣這些父母也更多的參與子女的教育。

(iii)鑒于潛在的其他混雜因素(如ii所列舉),負(fù)相關(guān)關(guān)系并不一定意味著較小的班級(jí)規(guī)模會(huì)導(dǎo)致更好的

成績(jī).控制混雜因素的方法是必要的,而這正是多重回歸分析的主題.

3.工作培訓(xùn)項(xiàng)目的理由之一是能提高工人的生產(chǎn)力。假設(shè)要求你評(píng)估更多的工作培訓(xùn)是否使工人更有生產(chǎn)

力。不過(guò),你沒(méi)有工人的個(gè)人數(shù)據(jù),而是有俄亥俄州制造企業(yè)的數(shù)據(jù)。具體而言,對(duì)每個(gè)企業(yè),你都有人均工作

培訓(xùn)小時(shí)數(shù)(training)和單位工時(shí)生產(chǎn)的合格產(chǎn)品數(shù)(output)方面的信息。

(i)仔細(xì)陳述這個(gè)政策問(wèn)題背后其他情況不變的思維試驗(yàn).

(ii)一個(gè)企業(yè)培訓(xùn)其員工的決策看起來(lái)有可能獨(dú)立于工人特征嗎?工人可觀測(cè)與不可觀測(cè)的特征各有哪

些?

(iii)除工人特征之外,再列出一個(gè)影響工人生產(chǎn)力的因素。

(iv)你若發(fā)現(xiàn)training和output之間有正相關(guān)關(guān)系,你令人信服地證明了工作培訓(xùn)能提高工人的生產(chǎn)力了

嗎?請(qǐng)解釋。

答:(i)其他情況不變的思維在本題可以假設(shè)兩個(gè)廠商A、B,廠商A除了對(duì)每個(gè)工人提供比廠商B更多的

職業(yè)培訓(xùn)外,其他條件與廠商B都是相同的,由此可以得出廠商A的產(chǎn)出與廠商B的產(chǎn)出的不同。

(ii)一個(gè)企業(yè)培訓(xùn)其員工的決策看起來(lái)依賴于工人特征。

可觀測(cè)的特征包括:工作年限、學(xué)歷、專業(yè)工作經(jīng)驗(yàn),甚至包括年齡、性別和種族。

不可觀測(cè)的特征包括:企業(yè)可能根據(jù)能力高低來(lái)為員工提供培訓(xùn),但是“能力”是難以量化的,經(jīng)理只能根

據(jù)不同員工能力相關(guān)的方面來(lái)作出判斷。另外,不同類型的員工可能被更高的平均培訓(xùn)時(shí)間所吸引,這對(duì)雇主而

言是不明顯的。

(iii)工人可獲得的資本和技術(shù)的數(shù)量也影響產(chǎn)出。如果兩個(gè)企業(yè)采用不同的資本或技術(shù),即使他們擁有相

同類型的員工,他們的產(chǎn)出也將會(huì)不同。經(jīng)理的質(zhì)量同樣也是影響產(chǎn)出的因素之一。

(iv)并沒(méi)有,除非培訓(xùn)量是隨機(jī)分配的。即使培訓(xùn)不能促進(jìn)工人的生產(chǎn)率提高,ii和iii所列的因素也能導(dǎo)

致培訓(xùn)和產(chǎn)出之間呈現(xiàn)正相關(guān)關(guān)系。

第1篇橫截面數(shù)據(jù)的回歸分析

第2章簡(jiǎn)單回歸模型

2.1復(fù)習(xí)筆記

一、簡(jiǎn)單回歸模型的定義

1.雙變最線性回歸模型

一個(gè)簡(jiǎn)單的方程是:

y=A+即+u

假定方程在所關(guān)注的總體中成立,它便定義了一個(gè)簡(jiǎn)單線性回歸模型。因?yàn)樗褍蓚€(gè)變最*和y聯(lián)系起來(lái),

所以乂把它稱為兩變成或者雙變成線性回歸模型.

2.回歸術(shù)語(yǔ)

表2-1簡(jiǎn)電回歸的術(shù)語(yǔ)

yX

因變量自變量

被解料變量解釋變量

響應(yīng)變量控制變量

被預(yù)測(cè)變量預(yù)測(cè)變量

回歸子回歸元

3.零條件均值假定

(1)零條件均值

”的平均值與x值無(wú)關(guān)??梢园阉鼘?xiě)作:

E(wIx)=£(?)

當(dāng)方程成立時(shí),就說(shuō)"的均值獨(dú)立于X。

(2)零條件均值假定的意義

①零條件均值假定給出四的另一種非常有用的解釋。以x為條件取期望值,并利用E(“l(fā)x)=O,便得到:

E(ylx)=4>+4x。方程表明,總體回歸函數(shù)(PRF)E(ylx)是x的一個(gè)線性函數(shù),線性意味著x變化一個(gè)單位,

將使y的期望值改變四。對(duì)任何給定的K值,y的分布都以E(ylx)為中心.4就是斜率參數(shù)。

②給定零條件均值假定E(ulx)=O,把方程中的y看成兩個(gè)部分是比較有用的。一部分是表示E(ylx)的

4+?/,被稱為y的系統(tǒng)部分,即由上解釋的那一部分,另一個(gè)部分是被稱為非系統(tǒng)部分的",即不能由x解釋

的那一部分.

二、普通最小二乘法的推導(dǎo)

1.最小二乘估計(jì)值

從總體中找一個(gè)樣本。令{&,%):i=l,?“,”}表示從總體中抽取的一個(gè)容量為”的隨機(jī)樣本.

%=4+4%+?.

在總體中,"與*不相關(guān)。因此

E(")=0和cov(x,?)=£(x,u)=0

用可觀測(cè)變量*和y以及未知參數(shù)4和4表示為:

E(y-4-知)=0

E[x(y-&-/V)]=。

得到

法卜,_凡_蹌)=0

,£毛(%-腐-配)=0

nt.i

這兩個(gè)方程可用來(lái)解出A和自,Q=則以,=歹-和f.

一旦得到斜率估計(jì)值丸,則有

彳心-(>一廂)-西卜0

整理后便得到

%(%-y)=&£七u-X)

i=1|>1

根據(jù)求和運(yùn)算的基本性質(zhì),有

次能-可=£&-可

/(%-,=£(%-云)(》-司

IH

因此,只要有

£&-x)1>0

估計(jì)的斜率就為

姐-積%7)

R廣口---------

£(怎-工)2

(?|

所給出的估計(jì)值稱為用和片的普通最小二乘(OLS)估計(jì)值。

2.普通最小二乘估計(jì)的合理性

已知力第i次觀測(cè)的殘差是》的實(shí)際值與其擬價(jià)值之差:

選擇凡和A最小化殘差平方和:

L^=Z(y1-A-M)

,?l3

“普通最小二乘法''之所以得名,就是因?yàn)檫@些估計(jì)值最小化了殘差平方和。

一旦確定了OLS截距和斜率估計(jì)值,就能夠建立OLS回歸線:

§=RQ+RIX

方程又被稱為樣本回歸函數(shù)(SRF),因?yàn)樗强傮w回歸函數(shù)E(>lx)=4+/V的一個(gè)樣本估計(jì)??傮w回歸函

數(shù)是固定而又未知的.因?yàn)闃颖净貧w函數(shù)來(lái)自一組給定的數(shù)據(jù)樣本,所以一個(gè)新的樣本將使得方程中產(chǎn)生不同的

斜率和截距.

三、OLS的操作技巧

1.擬合值和殘差

假定從給定數(shù)據(jù)樣本中得到截距和斜率的估計(jì)值,。和小給定A和A,能夠獲得每次觀測(cè)的擬合粉。根

據(jù)定義,yt的每個(gè)擬合值都在OLS回歸線上。

與新次觀測(cè)相聯(lián)系的OLS殘差可是%與其擬合值之差。若可為正,則回歸線低估了入;若可為負(fù),則回

歸線高估了小。第i次觀測(cè)最理想的情況是可=0,但在大部分情形中,并非每個(gè)殘差都等于零。換言之,實(shí)際

上沒(méi)有一個(gè)數(shù)據(jù)點(diǎn)必須在OLS線上。

2.OLS統(tǒng)計(jì)量的代數(shù)性質(zhì)

(1)OLS殘差和及其樣本均值都為零。數(shù)學(xué)表述為:

E?.=°

f=l

(2)回歸元和OLS殘差的樣本桃方差為零。

£玳=。

i=1

(3)點(diǎn)("刃總在OLS回歸線上。

3,定義總平方和(SST)、解釋平方和(SSE)和殘差平方和(SSR)

SST=S(y,-y)2

r=1

SSE=-

i=l

SSR=.;

1=1

SST度量了y,中的總樣本變異;這就是說(shuō),它度量了X在樣本中的分散程度。SSE度量了%的樣本變異,SSR

度量了%的樣本變異。),的總變異總能表示成解釋了的變異和未解釋的變異SSR之和。因此,

SST=SSE+SSR

不能把殘差平方稱為“誤差平方和“,因?yàn)檎`差和殘差是不同的兩個(gè)量。

4.擬合優(yōu)度

擬合優(yōu)度&2,有時(shí)又稱為判定系數(shù),被定義為

R2?SSE/SST=1-SSR/SST

正是解釋變異與總變異之比,因此被解釋成y的樣本變異中被X解釋的部分。因?yàn)镾SE不可能大于SST,所

以R2的值總介于。和1之間。

回歸方程中的川過(guò)低是很正常的,對(duì)于橫截面分析來(lái)說(shuō),一個(gè)看似很低的W值,并不意味著OLS回歸方

程沒(méi)有用。

四、度量單位和函數(shù)形式

1.改變度量單位對(duì)OLS統(tǒng)計(jì)我的影響

(1)當(dāng)因變量的度景單位改變時(shí),很容易計(jì)算出截距和斜率估計(jì)值的變化。若因變量乘以一個(gè)常數(shù)c(意

味著樣本中的每個(gè)數(shù)據(jù)都乘以c),則OLS截距和斜率的估計(jì)值都擴(kuò)大為原來(lái)的c倍。

(2)若自變量被除以或乘以一個(gè)非零常數(shù)c,則OLS斜率系數(shù)也會(huì)分別被乘以或者除以c。

(3)僅改變自變量的度量單位,不會(huì)影響截距估計(jì)值。

(4)模型的擬合優(yōu)度不依賴于變量的度量單位。利用&2的定義可知,*事實(shí)上不因),或*的單位變化而改

變。

2.在簡(jiǎn)單回歸中加入非線性因素

一個(gè)給出百分比影響(近似)為常數(shù)的模型是:

\ogx=/il+/ily+u

特別地,若Au=O,則

%Ag(100/jAy

自然對(duì)數(shù)的另一個(gè)應(yīng)用,是得到一個(gè)常彈性模型:

logx=/?0+/7,logy+M

定義因變量為y=logy,自變M為x=log*,這個(gè)模型就變成了簡(jiǎn)單回歸模型。

3.對(duì)數(shù)函數(shù)的幾種形式

表2-2含對(duì)數(shù)的函數(shù)形式總覽

模型因變邕自變量對(duì)儂]解釋

水平值一水平值XX

水平值一對(duì)數(shù)yiog(*)

對(duì)數(shù)一水平值l°g(7)x%Ay=(100A)Ax

對(duì)數(shù)一對(duì)數(shù)logCx)叫⑺

一般性模型同樣允許非線性關(guān)系的存在.關(guān)鍵是,方程中的參數(shù)片和四是線性的,至于被解釋變量和解釋

變量有何聯(lián)系,并沒(méi)有限制。

五、OLS估計(jì)量的期望值和方差

1.OLS的無(wú)偏性

(1)相關(guān)假定

假定SLR.1(線性于參數(shù))

在總體模型中,因變量y與自變量x和誤差(干擾)"的關(guān)系如下:

y=Pa+P\x+u

其中,兒和兒分別表示總體的截距和斜率參數(shù)。

假定SLR.2(隨機(jī)抽樣)

具有一個(gè)服從總體模型方程的隨機(jī)樣本{&,%):i=1,2,-,n},其樣本容量為n。

假定SLR.3(解釋變量的樣本有變異)

x的樣本結(jié)果即{4,1=1,…,n]不是完全相同的數(shù)值。

假定SLR.4(零條件均值)

給定解釋變量的任何值,誤差的期望值都為零,E(Ulx)=O.

(2)自與4的差異

斜率估計(jì)量為

£(芍-加

。'=弋-----

可轉(zhuǎn)換為

.力(—)%.?

P\=Px+----P\+E44

其中,4=占-7??梢钥吹?,區(qū)的估計(jì)量等于總體斜率4加上誤差{%,/,…,4}的一個(gè)線性組合。以X

的值為條件,原的隨機(jī)性完全來(lái)自于樣本中的誤差。這些誤差一般都不為零的事實(shí),正是"與四有差異的原因。

(3)定理2.1:OLS的無(wú)偏性

利用假定SLR.1?SLR.4,對(duì)兒和4的任何值,都有

E(A)=A>,E㈣=A

換言之,A對(duì)色、4對(duì)兒而言是無(wú)偏的。

(4)證明OLS的無(wú)偏性

E俱)"+E(應(yīng)燧為=川+島序(4必)

=4+(序冏")=4+島序,。=儀

根據(jù)假定SLR.2和SLR.4有E(i7)=0,于是以看的值為條件,有

E00)=A+E[(A-麗+E(?)=A+E[(A-A)S]

Eg=1,這就意味著E[佃-4)]=0。

因此,E(A)=40

2.OLS估計(jì)后的方差

(1)相關(guān)假定

假定SLR.5(同方差性)

給定解釋變量的任何值,誤差都具有相同的方差,Var(ulx)=a\

(2)定理2.2:OLS估計(jì)量的抽樣方差

在假定SLR.1?SLR.5下,以樣本值{不如…,三}為條件,有

Var伍)==£_-=^jr

<-l

Var(A)=

/aI

(3)證明

因?yàn)樗闹皇且粋€(gè)常數(shù),而且以為為條件,所以SST,和4=x,-x也是非陋機(jī)的.而且,“,在i上(根據(jù)旭機(jī)

抽樣)是獨(dú)立的隨機(jī)變量,故和的方差就是方差的和。,以:

3.誤差方差的估計(jì)

(1)誤差與殘差的區(qū)分

利用隨機(jī)樣本觀測(cè)把總體模型寫(xiě)成y,=4+4X,+“j其中“,是第i次觀測(cè)的誤差。還可以將其用其擬合值和

殘差表示出來(lái):%=編+立玉+自。比較這兩個(gè)方程,可以看出,誤差出現(xiàn)在包含總體參數(shù)為和片的方程中。另

一方面,殘差則出現(xiàn)在使用凡和?的估計(jì)方程中。誤差是無(wú)法觀測(cè)的,但殘差卻可以從數(shù)據(jù)中計(jì)算出來(lái)。

把殘差寫(xiě)成誤差的函數(shù):

Z-Ps-PlXl=(Po+Pixi+ui)~Po~P\Xl

或者

盡管風(fēng)的期望值等于用,。的期望值也等于用,而用卻不等于.。但二者之差的期望值倒確實(shí)為零。

(2)1的無(wú)偏估計(jì)量

對(duì)自由度進(jìn)行調(diào)整:

(3)定理2.3:i的無(wú)偏估計(jì)

在假定SLR.1?SLR.5下,有

E(ff2)=CT2

證明:如果把方程&=%-(A-4)_(a-4)x對(duì)所有,進(jìn)行平均,并利用OLS殘差均值為零的結(jié)論,便得

到0=記-體-4卜伍-月印從原方程中減去它,則得到:

?,=(%一—-一-)(瑪-7)

2+2

=(?/-?)(A-A)-5)-2(u(-u)(A-^,)(x(-x)

對(duì)所有,?求和,又得到:

I?:=Z(u(-?*)2+佃-A)£(%-對(duì)一伍-A)XU'-

i=li=lT'i=l

等式右邊第一項(xiàng)的期望值是第二項(xiàng)的期望值是。2,第三項(xiàng)的期望是2,,則有:

=+a2-2a2=(n-2)<r2

因此E[SSR/("-2)]=(T,

。的自然估計(jì)最為,

a=4^

并被稱為回歸標(biāo)準(zhǔn)誤差(SER).盡管才不是”的無(wú)偏估計(jì)看,可能夠證明它是“的一致估計(jì)成。

A的標(biāo)準(zhǔn)誤為;

噸卜福一,住人叫’

六、過(guò)原點(diǎn)回歸

規(guī)范地,選擇一個(gè)斜率估計(jì)量(稱之為自)和如下形式的一條線

2而

因?yàn)橹本€經(jīng)過(guò)點(diǎn)x=0,y=0,所以得到的方程又被稱為過(guò)原點(diǎn)回歸。

使用普通最小二乘法,此時(shí)最小化的殘差平方和為

£(一麗)'

|>|

利用一元微積分可以證明,衣必須滿足一階條件

£茗(乂-旅)=。

?*4

從而解出自為:

.右XX

A=三—

EMd

當(dāng)且僅當(dāng)工=0時(shí),這兩個(gè)估計(jì)值才是相同的。

2.2課后習(xí)題詳解

一、習(xí)題

I.在簡(jiǎn)單線性回歸模型y="0+/也+“中,假定E(“卜0。令/=£(叫,證明:這個(gè)模型總可以改寫(xiě)為另一

種形式:斜率與原來(lái)相同,但截距和誤差有所不同,并且新的誤差期望值為零。

證明:在方程右邊加上%=£(“),則

丫=[R+吁/

令新的誤差項(xiàng)為0=口-%,因此£(e)=0?

新的截距項(xiàng)為4+用,斜率不變?yōu)?。

2.下表包含了8個(gè)學(xué)生的ACT分?jǐn)?shù)和GPA(平均成績(jī)).平均成績(jī)以四分制計(jì)算,且保留一位小數(shù)。

studentGPAACT

12.821

23.424

33.026

43.527

53.629

63.025

72.725

83.730

(I)利用OLS估計(jì)GPA和4CT的關(guān)系;也就是說(shuō),求出如下方程中的截距和斜率估計(jì)值

GPA="+3\ACT

評(píng)價(jià)這個(gè)關(guān)系的方向.這里的截距有沒(méi)有一個(gè)有用的解擇?請(qǐng)說(shuō)明.如果ACT分?jǐn)?shù)提高5分,預(yù)期GE4會(huì)

提高多少?

(II)計(jì)算每次觀測(cè)的擬合值和殘差,并驗(yàn)證殘差和(近似)為零。

(III)當(dāng)ACT=20時(shí),GR4的預(yù)測(cè)值為多少?

(IV)對(duì)這8個(gè)學(xué)生來(lái)說(shuō),GR4的變異中,有多少能由ACT解彈?試說(shuō)明。

答:(I)變量的均值為:GPA=3.2125,ACT=25.875.

次(G必-GPA)(AC7;-ACT;)=5.8125

根據(jù)公式2.19可得:4=5.8125756.875=0.1022?

根據(jù)公式公17可知:/}0=3.2125-0.1022x25.875=0,5681.

因此GPA=0.5681+0.10224CT。此處截距沒(méi)有一個(gè)很好的解釋,因?yàn)閷?duì)樣本而言,ACT并不接近0。如果ACT

分?jǐn)?shù)提高5分,預(yù)期GE4會(huì)提高0.1022x5=0.511。

(II)每次觀測(cè)的擬合值和殘差表如表2-3所示:

表2-3

iGPAGPAu

12.82.71430.0857

23.43.02090.3791

33.03.2253-0.2253

43.5332750.1725

53.63.53190.0681

63.03.1231-0.1231

72.73.1231-0.4231

83.73.63410.0659

根據(jù)表可知,殘差和為9.002,忽略固有的舍入誤差,殘差和近似為零。

(111)當(dāng)ACT=20,貝(JGPA=0.5681+0.1022x20=2.61。

(IV)殘差平方和為:%:=0.4347,而力卜,-4=1.0288,則判定系數(shù)為:

/?2=1-SSR/SST=1-0.4377/1.0288?0.577

GPA的變異中,有57.7%能由ACT解釋。

3.令表示一名婦女生過(guò)的孩子數(shù)目,ed“c表示該婦女接受過(guò)教育的年數(shù)。生育率對(duì)受教育年數(shù)的簡(jiǎn)單

回歸模型為

kids=!\educ+u

其中,"是無(wú)法觀測(cè)到的誤差。

([)?中包含什么樣的因素?它們可能與受教育程度相關(guān)嗎?

(II)簡(jiǎn)單回歸分析能夠揭示教育對(duì)生育率在其他條件不變下的影響嗎?請(qǐng)解釋。

答:(I)收入、年齡和家庭背景(如兄弟姐妹的數(shù)量)都可能包含在誤差項(xiàng)中.它們可能是與受教育程度

相關(guān)的:收入和受教育程度是呈正相關(guān)的;年齡與受教育程度是呈負(fù)相關(guān)的:兄弟姐妹的數(shù)章與受教育程度是負(fù)

相關(guān)的。

(II)假定(I)中所列舉的因素固定不變,即以誤差項(xiàng)的形式呈現(xiàn)在回歸方程中,但是誤差項(xiàng)與解釋變鼠

是相關(guān)的,因此E("[educ)wO,經(jīng)典假定被推翻,因此簡(jiǎn)單回歸分析不能解釋教育對(duì)生育率在其他條件不變下的

影響.

4.假設(shè)你對(duì)估計(jì)花在SAT備考課程上的小時(shí)數(shù)(加g)對(duì)SAT總分(sar)的影響感興趣。

總體是某一年內(nèi)所有計(jì)劃上大學(xué)的中學(xué)高年級(jí)學(xué)生.

(I)假設(shè)你有權(quán)進(jìn)行一項(xiàng)控制實(shí)驗(yàn)。請(qǐng)說(shuō)明為了估計(jì)也s對(duì)s。的引致效應(yīng),你將如何構(gòu)建實(shí)驗(yàn)。

(II)考慮一個(gè)更加實(shí)際的情形,即由學(xué)生選擇在備考課程上花多少時(shí)間,而你只能隨機(jī)地從總體中抽出s”

和垢ws的樣本。將總體模型寫(xiě)作如下形式:

sat=鳳+(i,hours+u

其中,與通常帶截距的模型一樣,我們可以假設(shè)E(")=0。列舉出至少兩個(gè)"中包含的因素。這些因素與癡rs

可能呈正相關(guān)還是負(fù)相關(guān)?

(山)在(II)的方程中,如果備考課程有效,那么片的符號(hào)應(yīng)該是什么?

(IV)在(H)的方程中,為該如何解釋?

答:(1)構(gòu)建實(shí)驗(yàn)時(shí),首先隨機(jī)分配準(zhǔn)備課程的小時(shí)數(shù),以保證準(zhǔn)備課程的時(shí)間與其他影響SAT的因素是

獨(dú)立的。然后收集實(shí)驗(yàn)中每個(gè)學(xué)生SAT的數(shù)據(jù),建立樣本{“叫,6"):i=l,???,“},”表示試驗(yàn)中所包括的學(xué)

生的數(shù)量。根據(jù)方程2.7,應(yīng)該嘗試采用盡可能多的有差異的“小時(shí)數(shù)”。

(II)誤差項(xiàng)還可能包含以下三個(gè)因素:天賦能力、家庭收入以及考試當(dāng)天的健康狀況。如果學(xué)生擁有天賦

能力,那么他們不需要為考試花費(fèi)太多時(shí)間,能力與時(shí)間是負(fù)相關(guān)的。家庭收入與學(xué)習(xí)時(shí)間呈正相關(guān)關(guān)系,因?yàn)?/p>

家庭收入越高,就能負(fù)擔(dān)去越多的課時(shí)費(fèi)用。排除慢性的健康問(wèn)題,考試當(dāng)天的健康狀況與為準(zhǔn)備考試花費(fèi)的時(shí)

間是無(wú)關(guān)的。

(III)如果備考課程有效,兒的符號(hào)應(yīng)該為正,在其他因素相同的情況下,備考時(shí)間越多,越高.

(IV)截距有一個(gè)有用的解釋:因?yàn)镋(U)=O,4表示備考時(shí)間為0時(shí)學(xué)生獲得的平均sar總分。

5.考慮儲(chǔ)蓄函數(shù)

sav=鳳+與nc+u,u=4inc-e

其中,e是一個(gè)隨機(jī)變量,且有E(e)=O和Var(e)=b:,假設(shè)e獨(dú)立于加c。

(1)證明:若E("linc)=O,則滿足零條件均值的關(guān)犍假設(shè)(假定SLR.4)。偎示:若e獨(dú)立于山,則

E(uIme)=E(e)]

(II)證明:若Var(uli"c)=b;加c,則不滿足同方差假定SLR5。特別地,sav的方差隨著加c而增加.[提

示:若e和inc獨(dú)立,則Var?加c)=Var(e)。]

(IU)討論支持儲(chǔ)蓄方差隨著家庭收入遞增的證據(jù)。

證明:(I)計(jì)算而■的條件期望值時(shí),后?變?yōu)橐粋€(gè)常數(shù),因此E(ulinc)=E(而加c)=>/i£E(e[譏c)=0.

(II)i/ic的方差為:Var(ul加c)=Var(>/^?e:加Var(e|加c)=inc-rr;.

(Ill)低收入家庭支出的靈活性較低,因?yàn)榈褪杖爰彝ケ仨毷紫戎Ц兑率匙⌒械缺匦杵?。而高收入家庭具?/p>

較高的靈活性,部分選擇更多的消費(fèi),而另一部分家庭選擇更多的儲(chǔ)蓄.這種較高的靈活性暗示高收入家庭中儲(chǔ)

蓄的變動(dòng)幅度更大.

6.令/0和?分別為OLS截距和斜率估計(jì)量,并令;;為誤差(不是殘差)的樣本均值。

(I)證明:k可寫(xiě)成W=“,其中叫=d,/s訂和4=x,-x.

,T

(H)利用(I)及£叱=0,證明:自和i無(wú)關(guān).[提示,要求你證明E僅-%)£=0]

-I

(ID)證明瓦可寫(xiě)成A=A+1伍-4)。

(IV)利用(H)和(III)證明:Var(向)="2/n+,G)2/SSl;.

22

(V)(IV)中的表達(dá)式能簡(jiǎn)化成方程(2.58)嗎?[提示:SSTJ/n=n'i.r,-(x).]

1=1

證明:(I)該理論推導(dǎo)與公式2.52的推導(dǎo)本質(zhì)上是一樣的,區(qū)別只是將嗎=d,/SST;帶到求和的里面。

(II)因?yàn)閏ov(4=公式右邊等于0。從(1)可知,

~P\~^[^-iwtu1]=^-i"因?yàn)檎`差項(xiàng)兩兩互不相關(guān),則E(u,u.)=0,iw/i,

E(%力)=E(u]/〃)=,/〃。因此Zliw』E(M)=E3==0。

(山)最小二乘估計(jì)的截距公式為:盤(pán)=歹-而,代入》=4+4工+心則

A=(用+監(jiān)+*-麗=A+?-(A-A)XO

(IV)因?yàn)槿吆汀晔遣幌嚓P(guān)的,則有:

Var(4))=Var(H)+Var(4)x2=(T2/n+(ff2/SST)x2=(T2/n+/產(chǎn)/SST

(V)能。

根據(jù)SST/n=/5>,2-(T『,貝I]

之1

Var闊=,[(SS1;/")+鏟]/SST,

=叫(獷£片-針)+刃/SST,=/)/SS「

7.利用KielandMcClain(1995)有關(guān)1988年馬薩諸塞州安第沃市的房屋出售數(shù)據(jù),如下方程給出了房屋

價(jià)格(price)和距離一個(gè)新修垃圾焚化爐的距離(dist)之間的關(guān)系:

log(price)=9.40+0.312log(dist)

n=135,/?2=0.162

<1)解釋iog(&M的系數(shù)。它的符號(hào)是你所預(yù)期的嗎?

<11)你認(rèn)為簡(jiǎn)單回歸給出了對(duì)由w在其他條件不變下彈性的無(wú)偏估計(jì)量嗎?(考慮?個(gè)城市決定放

置焚化爐的地點(diǎn)的決策。)

(III)還有哪些其他因素影響房屋的售價(jià)?這些因素會(huì)與距離焚化爐的遠(yuǎn)近相關(guān)嗎?

答:(I)符號(hào)為正,與預(yù)期相符。log(小sr)的系數(shù)表示距離焚化爐的距離越遠(yuǎn),價(jià)格就越高,價(jià)格的距離

彈性是0.312,即距離遠(yuǎn)1%,價(jià)格上升0.312%。

(n)如果城市決定將焚化爐放置在遠(yuǎn)離較貴的居民區(qū)的地方,則iog(d,M與房?jī)r(jià)是正相關(guān)的。這將違背假

定4,而OLS估計(jì)是有偏的.

(1U)房屋的面積、洗手間的數(shù)成、占地面積大小、房齡社區(qū)質(zhì)僅(包括學(xué)校殖量)都會(huì)影響房屋的售價(jià)。

這些與距離焚化爐的遠(yuǎn)近是有關(guān)的。

8.(I)令凡和九為y對(duì)七進(jìn)行回歸的截距和斜率(有n次觀測(cè)):。和「2為常數(shù)且c/0:兒和A為

對(duì)c?Xj進(jìn)行回歸的截距和斜率。證明?=匕/6)&且力,=0%),從而驗(yàn)證了2.4節(jié)中關(guān)于度破單位的命題“提示:

為得到自,把改變了度量單位的X和y代入方程(2.19)。然后用方程(2.17)求瓦,確定代入的是進(jìn)行度量單

位變換后的x和y以及正確的斜率。

(H)現(xiàn)在令&和自得自(q+y,)對(duì)(G+玉)的回歸(對(duì)£和q不加任何限制)。

證明:?=衣且/O=A+G-C/]。

(III)令凡和4為log(y)對(duì)先回歸的OLS估計(jì)值,其中我們必須假定對(duì)所有3都有%>0。對(duì)G>0,令

A和自為log(qy)對(duì)、回歸的截距和斜率.證明:自=4且A=iog(q)+A。

(IV)現(xiàn)在假定對(duì)所有i,都有工>0。令A(yù)和?為角對(duì)log(c/J回歸的截距和斜率。。和?與此對(duì)log&)

回歸的截距和斜率相比如何?

答:(I)因?yàn)椴?c?,不=中,當(dāng)為qy,對(duì)02可進(jìn)行回歸時(shí),可以通過(guò)方程2.19得到方程的斜率:

次(。居-⑶-可(y-刃

A=----------------------=-------------------

£(訃-*)^CJ(AJ-X)2

I

cEU-5)(yi-y),

-------=斗、

J力a-尹Q

1=1

根據(jù)公式2.17可得截距項(xiàng)為:

A=(c?)-月(中)=(C?)-[(CJC2)6](常)=03-效)=4伍)

(II)使用與(1)相同的方法,可得(不仃)=q+y,(/)=G+f?因此

(t,i+^)-(ci+y)=(ci+x)-(ci+>)=z->??(c2+x/)-(c2+x)=^-10在"+y)對(duì)(Cz+G的回歸中,

q和q被完全排除在斜率公式以外,以及

截距為:A)=(G+y)-/"c2+x)=(q+刃一6&+7)=(歹一aj+q-c/i=a+c,-c/1。

(III)因?yàn)?08(5%)=108((:1)+咋(%),令q代替log(cj,其代替log(%),且。2=。,然后采用與(II)相

同的方法。

(IV)采用與(II)相同的方法,設(shè)q=0,q替代log(G),玉替代log(xj,如果凡和凡是原截距和斜率,

那么此時(shí)的截距和斜率為:儲(chǔ)=和8、=6.

9.在線性消費(fèi)函數(shù)caw=A+A讀中,收入的(估計(jì))邊際消費(fèi)傾向(MFC)無(wú)非就是斜率A,而平均消

費(fèi)傾向(APC)為cwW加°=僅"比+".利用對(duì)100個(gè)家庭的年收入和消費(fèi)觀測(cè)(均以美元計(jì)),便得到如下方

程:

cons=-124.84+0.853/nc

n=\OQ,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論