版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章經(jīng)典線(xiàn)性回歸模型
(ClassicalLinearRegressionModel)第一節(jié)線(xiàn)性回歸模型的概念第二節(jié)線(xiàn)性回歸模型的估計(jì)第三節(jié)擬合優(yōu)度第四節(jié)非線(xiàn)性關(guān)系的處理第五節(jié)假設(shè)檢驗(yàn)第六節(jié)預(yù)測(cè)第七節(jié)虛擬變量第一節(jié)線(xiàn)性回歸模型的概念
一.雙變量線(xiàn)性回歸模型
我們?cè)谏弦徽陆o出的需求函數(shù)的例子
Q=α+βP+u(2.1)是一個(gè)雙變量線(xiàn)性回歸模型,模型中只有兩個(gè)變量,一個(gè)因變量,一個(gè)解釋變量,由解釋變量的變動(dòng)來(lái)解釋因變量的變動(dòng),或者說(shuō)用因變量對(duì)解釋變量進(jìn)行線(xiàn)性回歸,因而稱(chēng)為雙變量線(xiàn)性回歸模型,亦稱(chēng)簡(jiǎn)單線(xiàn)性回歸模型。讓我們?cè)倏匆粋€(gè)例子。
C=α+βD+u(2.2)
這是凱恩斯消費(fèi)函數(shù),其中C為消費(fèi)支出,D為個(gè)人可支配收入,u為擾動(dòng)項(xiàng)(或誤差項(xiàng))。此模型中,方程左端的消費(fèi)支出(C)為因變量(或被解釋變量),方程右端的個(gè)人可支配收入(D)為解釋變量(或自變量)。α和β是未知參數(shù),由于雙變量線(xiàn)性回歸模型的圖形是一條直線(xiàn),因而α和β習(xí)慣上又分別稱(chēng)為截距和斜率。這里斜率β的含義是解釋變量增加一個(gè)單位所引起的因變量的變動(dòng)。例如在(2.2)式中,β的含義是個(gè)人可支配收入增加一個(gè)單位所引起的消費(fèi)的增加量,經(jīng)濟(jì)學(xué)中稱(chēng)之為邊際消費(fèi)傾向(MPC)。截距α的含義是解釋變量為0時(shí)α的值。截距α有時(shí)有經(jīng)濟(jì)含義,但大多數(shù)情況下沒(méi)有,因此,在計(jì)量經(jīng)濟(jì)分析中,通常不大關(guān)注α的取值如何。在教學(xué)中,我們習(xí)慣上采用Y表示因變量,X表示解釋變量,雙變量線(xiàn)性回歸模型的一般形式為:
Y=α+βX+u在實(shí)踐中,此模型被應(yīng)用于因變量和解釋變量的一組具體觀(guān)測(cè)值和(t=1,2,…,n),因而模型表示為:
=α+β+utt=1,2,…,n(2.3)它表明,對(duì)于n個(gè)時(shí)期t=1,2,…,n,該模型成立。更一般的形式為:
=α+β+ui,i=1,2,...,n(2.4)
即模型對(duì)X和Y的n對(duì)觀(guān)測(cè)值(i=1,2,…,n)成立。
(2.3)式一般用于觀(guān)測(cè)值為時(shí)間序列的情形,在橫截面數(shù)據(jù)的情形,通常采用(2.4)式。二、多元線(xiàn)性回歸模型
在許多實(shí)際問(wèn)題中,我們所研究的因變量的變動(dòng)可能不僅與一個(gè)解釋變量有關(guān)。因此,有必要考慮線(xiàn)性模型的更一般形式,即多元線(xiàn)性回歸模型:
t=1,2,…,n
在這個(gè)模型中,Y由X1、X2、X3、…XK所解釋?zhuān)蠯+1個(gè)未知參數(shù)β0、β1、β2、…βK。
這里,“斜率”βj的含義是其它變量不變的情況下,Xj改變一個(gè)單位對(duì)因變量所產(chǎn)生的影響。
例2.2食品需求方程
其中,Y=在食品上的總支出
X=個(gè)人可支配收入
P=食品價(jià)格指數(shù)用美國(guó)1959-1983年的數(shù)據(jù),得到如下回歸結(jié)果(括號(hào)中數(shù)字為標(biāo)準(zhǔn)誤差):Y和X的計(jì)量單位為10億美元(按1972不變價(jià)格計(jì)算).多元線(xiàn)性回歸模型中斜率系數(shù)的含義上例中斜率系數(shù)的含義說(shuō)明如下:價(jià)格不變的情況下,個(gè)人可支配收入每上升10億美元(1個(gè)billion),食品消費(fèi)支出增加1.12億元(0.112個(gè)billion)。
收入不變的情況下,價(jià)格指數(shù)每上升一個(gè)點(diǎn),食品消費(fèi)支出減少7.39億元(0.739個(gè)billion)回到一般模型
t=1,2,…,n即對(duì)于n組觀(guān)測(cè)值,有其矩陣形式為:
其中
第二節(jié)線(xiàn)性回歸模型的估計(jì)
一.經(jīng)典線(xiàn)性回歸模型的統(tǒng)計(jì)假設(shè)(1)E(ut)=0,t=1,2,…,n
即各期擾動(dòng)項(xiàng)的均值(期望值)均為0。均值為0的假設(shè)反映了這樣一個(gè)事實(shí):擾動(dòng)項(xiàng)被假定為對(duì)因變量的那些不能列為模型主要部分的微小影響。沒(méi)有理由相信這樣一些影響會(huì)以一種系統(tǒng)的方式使因變量增加或減小。因此擾動(dòng)項(xiàng)均值為0的假設(shè)是合理的。
(2)E(ui
uj)=0,i≠j
即各期擾動(dòng)項(xiàng)互不相關(guān)。也就是假定它們之間無(wú)自相關(guān)或無(wú)序列相關(guān)。實(shí)際上該假設(shè)等同于:
cov(ui,uj)=0,i≠j這是因?yàn)椋?/p>
cov(ui,uj)=E{[ui-E(ui)][uj-E(uj)]}=E(uiuj)——根據(jù)假設(shè)(1)
(3)E(ut2)=σ2,t=1,2,…,n
即各期擾動(dòng)項(xiàng)的方差是一常數(shù),也就是假定各擾動(dòng)項(xiàng)具有同方差性。這是因?yàn)椋?/p>
Var(ut)=E{[ut-E(ut)]2}=E(ut2)——根據(jù)假設(shè)(1)
(4)Xjt是非隨機(jī)量,j=1,2,…kt=1,2,…n(5)(K+1)<n;
即觀(guān)測(cè)值的數(shù)目要大于待估計(jì)的參數(shù)的個(gè)數(shù)(要有足夠數(shù)量的數(shù)據(jù)來(lái)擬合回歸線(xiàn))。(6)各解釋變量之間不存在嚴(yán)格的線(xiàn)性關(guān)系。上述假設(shè)條件可用矩陣表示為以下四個(gè)條件:A1.E(u)=0
A2.由于顯然,僅當(dāng)
E(ui
uj)=0,i≠jE(ut2)=σ2,t=1,2,…,n
這兩個(gè)條件成立時(shí)才成立,因此,此條件相當(dāng)前面條件(2),(3)兩條,即各期擾動(dòng)項(xiàng)互不相關(guān),并具有常數(shù)方差。
A3.X是一個(gè)非隨機(jī)元素矩陣。
A4.Rank(X)=(K+1)<n.
------相當(dāng)于前面(5)(6)兩條即矩陣X的秩=(K+1)<n
滿(mǎn)足條件(A1)—(A4)的線(xiàn)性回歸模型稱(chēng)為經(jīng)典線(xiàn)性回歸模型或古典線(xiàn)性回歸模型(CLR模型)。
當(dāng)然,為了后面區(qū)間估計(jì)和假設(shè)檢驗(yàn)的需要,還要加上一條:
A5.各期擾動(dòng)項(xiàng)服從正態(tài)分布。
~,t=1,2,…n二、最小二乘估計(jì)1.最小二乘原理
為了便于理解最小二乘法的原理,我們用雙變量線(xiàn)性回歸模型作出說(shuō)明。對(duì)于雙變量線(xiàn)性回歸模型Y=α+βX+u,
我們的任務(wù)是,在給定X和Y的一組觀(guān)測(cè)值
(X1,Y1),(X2,Y2),...,(Xn
,Yn)的情況下,如何求出
Yt=α+βXt+ut
中α和β的估計(jì)值和,
使得擬合的直線(xiàn)為“最佳”。直觀(guān)上看,也就是要求在X和Y的散點(diǎn)圖上穿過(guò)各觀(guān)測(cè)點(diǎn)畫(huà)出一條“最佳”直線(xiàn),如下圖所示。*****
et************
YXXt圖
2.2
Yt殘差
擬合的直線(xiàn)
稱(chēng)為擬合的回歸線(xiàn).對(duì)于任何數(shù)據(jù)點(diǎn)
(Xt,Yt),此直線(xiàn)將Yt的總值
分成兩部分。
第一部分是Yt的擬合值或預(yù)測(cè)值:
,t=1,2,……,n第二部分,et,代表觀(guān)測(cè)點(diǎn)對(duì)于回歸線(xiàn)的誤差,稱(chēng)為擬合或預(yù)測(cè)的殘差(residuals):
t=1,2,……,n
即t=1,2,……,n殘差平方和我們的目標(biāo)是使擬合出來(lái)的直線(xiàn)在某種意義上是最佳的,直觀(guān)地看,也就是要求估計(jì)直線(xiàn)盡可能地靠近各觀(guān)測(cè)點(diǎn),這意味著應(yīng)使殘差總體上盡可能地小。要做到這一點(diǎn),就必須用某種方法將每個(gè)點(diǎn)相應(yīng)的殘差加在一起,使其達(dá)到最小。理想的測(cè)度是殘差平方和,即最小二乘法最小二乘法就是選擇一條直線(xiàn),使其殘差平方和達(dá)到最小值的方法。即選擇和,使得達(dá)到最小值。
運(yùn)用微積分知識(shí),使上式達(dá)到最小值的必要條件為:即整理,得:此二式稱(chēng)為正規(guī)方程。解此二方程,得:其中:樣本均值離差2.多元線(xiàn)性回歸模型的最小二乘估計(jì)在多元線(xiàn)性回歸模型的情況下,我們的模型是:
問(wèn)題是選擇,使得殘差平方和最小。
殘差為:要使殘差平方和
為最小,則應(yīng)有:我們得到如下K+1個(gè)方程(即正規(guī)方程):
按矩陣形式,上述方程組可表示為:=即三.最小二乘估計(jì)量的性質(zhì)我們的模型為估計(jì)式為
1.的均值(由假設(shè)3)
(由假設(shè)1)即這表明,OLS估計(jì)量是無(wú)偏估計(jì)量。2.的方差為求Var(),我們考慮
不難看出,這是的方差-協(xié)方差矩陣,它是一個(gè)(K+1)×(K+1)矩陣,其主對(duì)角線(xiàn)上元素為各系數(shù)估計(jì)量的方差,非主對(duì)角線(xiàn)上元素為各系數(shù)估計(jì)量的協(xié)方差。由上一段的(2.19)式,我們有因此
請(qǐng)注意,我們得到的實(shí)際上不僅是的方差,而且是一個(gè)方差-協(xié)方差矩陣,為了反映這一事實(shí),我們用下面的符號(hào)表示之:為方便起見(jiàn),我們也常用
表示的方差-協(xié)方差矩陣,因此上式亦可寫(xiě)作:需要注意的是,這里不表示方差向量,而是方差-協(xié)方差矩陣。4.高斯-馬爾科夫定理對(duì)于以及標(biāo)準(zhǔn)假設(shè)條件A1-A4,普通最小二乘估計(jì)量(OLS估計(jì)量)是最佳線(xiàn)性無(wú)偏估計(jì)量(BLUE)。我們已在上一段中證明了無(wú)偏性,下面證明線(xiàn)性和最小方差性。由OLS估計(jì)量的公式
可知,可表示為一個(gè)矩陣和因變量觀(guān)測(cè)值向量的乘積:其中是一個(gè)(K+1)*n非隨機(jī)元素矩陣。因而是線(xiàn)性估計(jì)量。現(xiàn)設(shè)為的任意一個(gè)線(xiàn)性無(wú)偏估計(jì)量,即其中是一個(gè)(K+1)*n非隨機(jī)元素矩陣。則
顯然,若要為無(wú)偏估計(jì)量,即,只有,為(K+1)階單位矩陣。的方差為:
我們可將寫(xiě)成
從而將的任意線(xiàn)性無(wú)偏估計(jì)量與OLS估計(jì)量聯(lián)系起來(lái)。由可推出:即
因而有由從而,因此上式中間兩項(xiàng)為0,我們有因此
最后的不等號(hào)成立是因?yàn)闉榘胝ň仃嚒_@就證明了OLS估計(jì)量是的所有線(xiàn)性無(wú)偏估計(jì)量中方差最小的。至此,我們證明了高斯-馬爾科夫定理。4.的分布我們?cè)谇懊媪谐龅募僭O(shè)條件(A5)表明,
~N(0,),t=1,2,…,n即各期擾動(dòng)項(xiàng)服從均值為0、方差為的正態(tài)分布。考慮到假設(shè)條件(A3),即是一個(gè)非隨機(jī)元素矩陣,則由前面(2.20)式:
我們有:這表明,是N個(gè)正態(tài)分布變量的線(xiàn)性函數(shù),因而亦為正態(tài)分布變量,即(2.22)由此可知,系數(shù)估計(jì)量向量的每個(gè)元素都是正態(tài)分布的,即
j=0,1…,k(2.23)其中cjj為矩陣中的(j+1,j+1)元素(主對(duì)角線(xiàn)上第j+1個(gè)元素)。第三節(jié)擬合優(yōu)度一.決定系數(shù)R2
在估計(jì)了線(xiàn)性回歸模型之后,一個(gè)很自然的問(wèn)題是,估計(jì)出的回歸線(xiàn)與觀(guān)測(cè)值擬合得好不好?這就是擬合優(yōu)度要解決的問(wèn)題。擬合優(yōu)度的一個(gè)通行的測(cè)度是因變量Y的(樣本)變差被模型所解釋的比例,也就是因變量Y的變差被諸解釋變量所解釋的比例。這個(gè)統(tǒng)計(jì)量稱(chēng)為決定系數(shù)(coefficientofdetermination),記做,定義為:
其中,=殘差平方和
ESS為ExplainedSumofSquares的縮寫(xiě);
RSS為ResidualSumofSquares的縮寫(xiě);
TSS為T(mén)otalSumofSquares的縮寫(xiě)。決定系數(shù)R2
計(jì)量了Y的總變差中可以歸因于X和Y之間關(guān)系的比例,或者說(shuō)Y的變動(dòng)中可以由X的變動(dòng)來(lái)解釋的比例。它是回歸線(xiàn)對(duì)各觀(guān)測(cè)點(diǎn)擬合緊密程度的測(cè)度。我們有::完全擬合,:X與Y完全不存在線(xiàn)性關(guān)系,
的值越高,擬合得越好。但什么是高?并沒(méi)有絕對(duì)的標(biāo)準(zhǔn),要根據(jù)具體問(wèn)題而定。此外,回歸中使用時(shí)間序列數(shù)據(jù)還是橫截面數(shù)據(jù)也有不同的標(biāo)準(zhǔn)。對(duì)時(shí)間序列數(shù)據(jù)來(lái)說(shuō),的值在0.8、0.9以上是很常見(jiàn)的事,而在橫截面數(shù)據(jù)的情況下,0.4、0.5的值也不能算低。為方便計(jì)算,我們也可以用矩陣形式表示。
我們有:殘差其中,殘差平方和:而
將上述結(jié)果代入R2的公式,得到:這就是決定系數(shù)R2的矩陣形式。二.修正決定系數(shù):
殘差平方和的一個(gè)特點(diǎn)是,每當(dāng)模型增加一個(gè)解釋變量,并用改變后的模型重新進(jìn)行估計(jì),殘差平方和的值會(huì)減小。由此可以推論,決定系數(shù)是一個(gè)與解釋變量的個(gè)數(shù)有關(guān)的量:解釋變量個(gè)數(shù)增加減小R2
增大也就是說(shuō),人們總是可以通過(guò)增加模型中解釋變量的方法來(lái)增大R2
的值。因此,用R2
來(lái)作為擬合優(yōu)度的測(cè)度,不是十分令人滿(mǎn)意的。
為此,我們定義修正決定系數(shù)(Adjusted)如下:是經(jīng)過(guò)自由度調(diào)整的決定系數(shù),稱(chēng)為修正決定系數(shù)。我們有:(1)(2)僅當(dāng)K=0時(shí),等號(hào)成立。即
(3)當(dāng)K增大時(shí),二者的差異也隨之增大。
(4)可能出現(xiàn)負(fù)值。三.例子下面我們給出兩個(gè)簡(jiǎn)單的數(shù)值例子,以幫助理解這兩節(jié)的內(nèi)容.
例2.3 Yt
=1+2X2t+3X3t+ut
設(shè)觀(guān)測(cè)數(shù)據(jù)為:Y:31835X2:31524X3:54646
試求各參數(shù)的OLS估計(jì)值,以及。解:我們有
例2.4
設(shè)n=20,k=3,R2=0.70,求。解:下面改變n的值,看一看的值如何變化。我們有若n=10,則=0.55
若n=5,則=-0.20
由本例可看出,有可能為負(fù)值。這與R2不同()。
第四節(jié)非線(xiàn)性關(guān)系的處理
迄今為止,我們已解決了線(xiàn)性模型的估計(jì)問(wèn)題。但在實(shí)際問(wèn)題中,變量間的關(guān)系并非總是線(xiàn)性關(guān)系,經(jīng)濟(jì)變量間的非線(xiàn)性關(guān)系比比皆是。如大家所熟悉的柯布-道格拉斯生產(chǎn)函數(shù):
就是一例。在這樣一些非線(xiàn)性關(guān)系中,有些可以通過(guò)代數(shù)變換變?yōu)榫€(xiàn)性關(guān)系處理,另一些則不能。下面我們通過(guò)一些例子來(lái)討論這個(gè)問(wèn)題。一.線(xiàn)性模型的含義
線(xiàn)性模型的基本形式是:
其特點(diǎn)是可以寫(xiě)成每一個(gè)解釋變量和一個(gè)系數(shù)相乘的形式。線(xiàn)性模型的線(xiàn)性包含兩重含義:(1)變量的線(xiàn)性變量以其原型出現(xiàn)在模型之中,而不是以X2或Xβ之類(lèi)的函數(shù)形式出現(xiàn)在模型中。(2)參數(shù)的線(xiàn)性
因變量Y是各參數(shù)的線(xiàn)性函數(shù)。二.線(xiàn)性化方法
對(duì)于線(xiàn)性回歸分析,只有第二種類(lèi)型的線(xiàn)性才是重要的,因?yàn)樽兞康姆蔷€(xiàn)性可通過(guò)適當(dāng)?shù)闹匦露x來(lái)解決。例如,對(duì)于
此方程的變量和參數(shù)都是線(xiàn)性的。
參數(shù)的非線(xiàn)性是一個(gè)嚴(yán)重得多的問(wèn)題,因?yàn)樗荒軆H憑重定義來(lái)處理??墒牵绻P偷挠叶擞梢幌盗械腦β或eβX項(xiàng)相乘,并且擾動(dòng)項(xiàng)也是乘積形式的,則該模型可通過(guò)兩邊取對(duì)數(shù)線(xiàn)性化。例如,需求函數(shù)
其中,Y=對(duì)某商品的需求
X=收入
P=相對(duì)價(jià)格指數(shù)
ν=擾動(dòng)項(xiàng)可轉(zhuǎn)換為:
用X,Y,P的數(shù)據(jù),我們可得到logY,logX和logP,從而可以用OLS法估計(jì)上式。
logX的系數(shù)是β的估計(jì)值,經(jīng)濟(jì)含義是需求的收入彈性,logP的系數(shù)將是γ的估計(jì)值,即需求的價(jià)格彈性。彈性(elasticity)是一變量變動(dòng)1%所引起的另一變量變動(dòng)的百分比。其定義為本例中,需求的收入彈性是收入變化1%,價(jià)格不變時(shí)所引起的商品需求量變動(dòng)的百分比。需求的價(jià)格彈性是價(jià)格變化1%,收入不變時(shí)所引起的商品需求量變動(dòng)的百分比。三.例子例2.5需求函數(shù)本章§1中,我們?cè)o出一個(gè)食品支出為因變量,個(gè)人可支配收入和食品價(jià)格指數(shù)為解釋變量的線(xiàn)性回歸模型例子(例2.2)?,F(xiàn)用這三個(gè)變量的對(duì)數(shù)重新估計(jì)(采用同樣的數(shù)據(jù)),得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差):回歸結(jié)果表明,需求的收入彈性是0.64,需求的價(jià)格彈性是-0.48,這兩個(gè)系數(shù)都顯著異于0。
例2.6柯布-道格拉斯生產(chǎn)函數(shù)
用柯布和道格拉斯最初使用的數(shù)據(jù)(美國(guó)1899-1922年制造業(yè)數(shù)據(jù))估計(jì)經(jīng)過(guò)線(xiàn)性化變換的模型得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差):
從上述結(jié)果可以看出,產(chǎn)出的資本彈性是0.23,產(chǎn)出的勞動(dòng)彈性為0.81。例2.7貨幣需求量與利率之間的關(guān)系
M=a(r-2)b這里,變量非線(xiàn)性和參數(shù)非線(xiàn)性并存。對(duì)此方程采用對(duì)數(shù)變換
logM=loga+blog(r-2)令Y=logM,X=log(r-2),β1=loga,β2=b
則變換后的模型為:
Yt=β1+β2Xt+ut
將OLS法應(yīng)用于此模型,可求得β1和β2的估計(jì)值,從而可通過(guò)下列兩式求出a和b估計(jì)值:
應(yīng)當(dāng)指出,在這種情況下,線(xiàn)性模型估計(jì)量的性質(zhì)(如BLUE,正態(tài)性等)只適用于變換后的參數(shù)估計(jì)量,而不一定適用于原模型參數(shù)的估計(jì)量和。例2.8上例在確定貨幣需求量的關(guān)系式時(shí),我們實(shí)際上給模型加進(jìn)了一個(gè)結(jié)束條件。根據(jù)理論假設(shè),在某一利率水平上,貨幣需求量在理論上是無(wú)窮大。我們假定這個(gè)利率水平為2%。假如不給這一約束條件,而是從給定的數(shù)據(jù)中估計(jì)該利率水平的值,則模型變?yōu)椋?/p>
M=a(r-c)b
式中a,b,c均為參數(shù)。仍采用對(duì)數(shù)變換,得到
log(Mt)=loga+blog(rt
-c)+ut
t=1,2,…,n
我們無(wú)法將log(rt-c)定義為一個(gè)可觀(guān)測(cè)的變量X,因?yàn)檫@里有一個(gè)未知量c。也就是說(shuō),此模型無(wú)法線(xiàn)性化。在這種情況下,只能用估計(jì)非線(xiàn)性模型參數(shù)值的方法。四.非線(xiàn)性回歸
模型
Y=a(X-c)b是一個(gè)非線(xiàn)性模型,a、b和c是要估計(jì)的參數(shù)。此模型無(wú)法用取對(duì)數(shù)的方法線(xiàn)性化,只能用非線(xiàn)性回歸技術(shù)進(jìn)行估計(jì),如非線(xiàn)性最小二乘法(NLS)。該方法的原則仍然是殘差平方和最小。計(jì)量經(jīng)濟(jì)軟件包通常提供這類(lèi)方法,本書(shū)第五章將對(duì)非線(xiàn)性回歸方法作較深入的介紹,這里僅給出有關(guān)非線(xiàn)性最小二乘法的大致步驟如下:非線(xiàn)性回歸方法的步驟1. 首先給出各參數(shù)的初始估計(jì)值(合理猜測(cè)值);2. 用這些參數(shù)值和X觀(guān)測(cè)值數(shù)據(jù)計(jì)算Y的各期預(yù)測(cè)值(擬合值);3.計(jì)算各期殘差,然后計(jì)算殘差平方和∑e2;4.對(duì)一個(gè)或多個(gè)參數(shù)的估計(jì)值作微小變動(dòng);
5.計(jì)算新的Y預(yù)測(cè)值、殘差平方和∑e2;
6.若新的∑e2小于老的∑e2,說(shuō)明新參數(shù)估計(jì)值優(yōu)于老估計(jì)值,則以它們作為新起點(diǎn);
7.重復(fù)步驟4,5,6,直至無(wú)法減小∑e2為止。
8.最后的參數(shù)估計(jì)值即為最小二乘估計(jì)值。第五節(jié)假設(shè)檢驗(yàn)本節(jié)討論經(jīng)典線(xiàn)性回歸模型的區(qū)間估計(jì)和假設(shè)檢驗(yàn)問(wèn)題。我們的模型是:
在第二節(jié)中我們證明了在擾動(dòng)項(xiàng)服從正態(tài)分布的假設(shè)(A5)下,
~j=0,1…,k
其中cjj
為矩陣中的(j+1,j+1)元素(主對(duì)角線(xiàn)上第j+1個(gè)元素)。這一結(jié)果為基于OLS估計(jì)量的假設(shè)檢驗(yàn)提供了堅(jiān)實(shí)的基礎(chǔ)。一、β的置信區(qū)間我們可構(gòu)造一個(gè)檢驗(yàn)統(tǒng)計(jì)量
該變量服從均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。與估計(jì)量相聯(lián)系的概率分布的標(biāo)準(zhǔn)差,通常稱(chēng)為標(biāo)準(zhǔn)誤差(standarderror),用Se表示。的標(biāo)準(zhǔn)誤差為:
如果σ為已知,則由于檢驗(yàn)統(tǒng)計(jì)量z服從標(biāo)準(zhǔn)正態(tài)分布,因而我們可以立即給出總體參數(shù)的95%的置信區(qū)間為:但實(shí)際上,我們一般無(wú)法知道擾動(dòng)項(xiàng)分布的方差,而必須根據(jù)觀(guān)測(cè)值數(shù)據(jù)估計(jì)出,然后再來(lái)考慮的置信區(qū)間的計(jì)算問(wèn)題。
1.2
的估計(jì)可以證明,2的無(wú)偏估計(jì)量是
式中是殘差平方和,分母是的自由度,這是因?yàn)槲覀冊(cè)诠烙?jì)的過(guò)程中,失去了(K+1)個(gè)自由度。2.的置信區(qū)間我們重新定義的標(biāo)準(zhǔn)誤差為:則檢驗(yàn)統(tǒng)計(jì)量
不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從自由度為(n-k-1)的t分布,即這里n和k分別為觀(guān)測(cè)值和解釋變量的數(shù)目。故的(1-α)%置信區(qū)間為:其中α為顯著性水平,通常取α=0.05。例2.9回到食品需求的例子(例2.2):
其中,Y=在食品上的總支出,X=個(gè)人可支配收入,P=食品價(jià)格指數(shù)用美國(guó)1959-1983年的數(shù)據(jù),得到如下回歸結(jié)果(括號(hào)中數(shù)字為標(biāo)準(zhǔn)誤差):
求的95%置信區(qū)間。由回歸結(jié)果可知,,我們不難得到的95%置信區(qū)間為:即為0.1058~0.1182。二、假設(shè)檢驗(yàn)的邏輯和步驟假設(shè)檢驗(yàn)始于一個(gè)給定的假設(shè),即所謂“原假設(shè)”,亦稱(chēng)“零假設(shè)”,然后計(jì)算檢驗(yàn)統(tǒng)計(jì)量,這個(gè)檢驗(yàn)統(tǒng)計(jì)量在原假設(shè)成立的假定下的概率分布是已知的。下一步是判斷計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的值是否不大可能來(lái)自此分布,如果判斷是不大可能,則表明原假設(shè)不大可能成立。我們用一個(gè)例子來(lái)說(shuō)明上述有關(guān)假設(shè)檢驗(yàn)的思路。設(shè)有一個(gè)原假設(shè)規(guī)定的值為,這里是研究人員選擇的一個(gè)值,如果這個(gè)原假設(shè)(H0:=)成立,我們知道統(tǒng)計(jì)量
應(yīng)服從自由度為(n-k-1)的t分布,即如果原假設(shè)不成立,則備擇假設(shè)H1:成立。用于計(jì)算t的所有的量都是已知的,可以用估計(jì)值及其標(biāo)準(zhǔn)誤差Se()算出t的值,因此t可作為檢驗(yàn)統(tǒng)計(jì)量用于假設(shè)檢驗(yàn),如果算出的t值絕對(duì)值過(guò)大,落入t分布的尾部,意味著原假設(shè)不大可能成立,因?yàn)樵谠僭O(shè)成立的情況下,得到這樣一個(gè)t值的概率很小。由上面的說(shuō)明不難看出,假設(shè)檢驗(yàn)可以說(shuō)就是檢驗(yàn)是否出現(xiàn)了小概率事件,如果出現(xiàn)小概率事件,則拒絕原來(lái)關(guān)于總體參數(shù)的假設(shè);如果檢驗(yàn)表明得到的樣本值并不屬于小概率事件,即若我們的假設(shè)成立,得到該樣本值的概率不算小,則我們不能拒絕原來(lái)的假設(shè),或者說(shuō),我們“接受”原假設(shè)。問(wèn)題是,我們上面提到的概率究竟應(yīng)該小到什么程度才算小。一般說(shuō)來(lái),這取決于我們?cè)敢獬袚?dān)的拒絕一個(gè)正確的假設(shè)和接受一個(gè)錯(cuò)誤的假設(shè)這兩方面的風(fēng)險(xiǎn)。在實(shí)踐中,一般習(xí)慣于取5%作為拒絕假設(shè)的臨界水平,稱(chēng)為5%的顯著性水平。假設(shè)檢驗(yàn)的具體步驟是:(1)建立關(guān)于總體參數(shù)的原假設(shè)和備擇假設(shè);(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)原假設(shè)(是否出現(xiàn)小概率事件);(3)得出關(guān)于原假設(shè)是否合理的結(jié)論。例2.10仍用食品需求的例子(例2.2)試檢驗(yàn)原假設(shè):。原假設(shè):H0:β1=0.12備擇假設(shè):H1:β1≠0.12我們有:
用υ=n-k-1=25-2-1=22查t表,截?cái)鄡蓚?cè)5%面積的t臨界值tc
=2.074∵
故拒絕原假設(shè)H0:。三、系數(shù)的顯著性檢驗(yàn)在假設(shè)檢驗(yàn)中,有關(guān)斜率系數(shù)是否為0的假設(shè)檢驗(yàn)特別重要。如果通過(guò)檢驗(yàn),接受的原假設(shè),則表明Xj和Y沒(méi)有關(guān)系,即Xj對(duì)Y的變動(dòng)沒(méi)有影響。在這種情況下,可考慮從模型中剔除Xj。這類(lèi)檢驗(yàn)稱(chēng)為系數(shù)的顯著性檢驗(yàn)。1. 單個(gè)系數(shù)顯著性檢驗(yàn)?zāi)康氖菣z驗(yàn)?zāi)硞€(gè)解釋變量的系數(shù)βj是否為0,即該解釋變量是否對(duì)因變量有影響。原假設(shè)H0:
βj=0
備擇假設(shè)H1:
βj≠0單個(gè)系數(shù)顯著性檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量是自由度為n-k-1的t統(tǒng)計(jì)量:~t(n-k-1)其中,為矩陣主對(duì)角線(xiàn)上第j+1個(gè)元素。而
例2.11仍用食品需求的例子(例2.2),回歸結(jié)果如下(括號(hào)中數(shù)字為標(biāo)準(zhǔn)誤差):
試檢驗(yàn)價(jià)格的系數(shù)的顯著性。解:原假設(shè)H0:備擇假設(shè)H1:
查t表,
故拒絕原假設(shè)H0。結(jié)論:顯著異于0,P對(duì)Y有影響。2.若干個(gè)系數(shù)的顯著性檢驗(yàn)(聯(lián)合假設(shè)檢驗(yàn))
有時(shí)需要同時(shí)檢驗(yàn)若干個(gè)系數(shù)是否為0,這可以通過(guò)建立單一的原假設(shè)來(lái)進(jìn)行。設(shè)要檢驗(yàn)g個(gè)系數(shù)是否為0,即與之相對(duì)應(yīng)的g個(gè)解釋變量對(duì)因變量是否有影響。不失一般性,可設(shè)原假設(shè)和備擇假設(shè)為:
H0:β1=β2=…=βg
=0H1:
H0不成立
(即X1,…Xg中某些變量對(duì)Y有影響)分析:這實(shí)際上相當(dāng)于檢驗(yàn)g個(gè)約束條件
β1=0,β2=0,…,βg
=0是否同時(shí)成立。若H0為真,則正確的模型是:
據(jù)此進(jìn)行回歸(有約束回歸),得到殘差平方和
SR是H0為真時(shí)的殘差平方和。
若H1為真,正確的模型即原模型:據(jù)此進(jìn)行無(wú)約束回歸(全回歸),得到殘差平方和S是H1為真時(shí)的殘差平方和。
如果H0為真,則不管X1,…Xg這g個(gè)變量是否包括在模型中,所得到的結(jié)果不會(huì)有顯著差別,因此應(yīng)該有:
S≈SR如果H1為真,則由上一節(jié)中所討論的殘差平方和∑e2的特點(diǎn),無(wú)約束回歸增加了變量的個(gè)數(shù),應(yīng)有
S<SR
通過(guò)檢驗(yàn)二者差異是否顯著地大,就能檢驗(yàn)原假設(shè)是否成立。所使用的檢驗(yàn)統(tǒng)計(jì)量是:
~F(g,n-k-1)其中,g為分子自由度,n-k-1為分母自由度。使用的作用是消除具體問(wèn)題中度量單位的影響,使計(jì)算出的F值是一個(gè)與度量單位無(wú)關(guān)的量。例2.12給定20組Y,X1,X2,X3的觀(guān)測(cè)值,試檢驗(yàn)?zāi)P椭蠿1和X3對(duì)Y是否有影響?解:(1)全回歸估計(jì)得到:S=∑e2=25
(2)有約束回歸
估計(jì)得到:SR=∑e2=30原假設(shè)H0:β1=
β3=0
備擇假設(shè)H1:
H0不成立我們有:n=20,g=2,k=3用自由度(2,16)查F分布表,5%顯著性水平下,
∵F=1.6<FC=3.63,故接受H0。結(jié)論:X1和X3對(duì)Y無(wú)顯著影響3.全部斜率系數(shù)為0的檢驗(yàn)
上一段結(jié)果的一個(gè)特例是所有斜率系數(shù)均為0的檢驗(yàn),即回歸方程的顯著性檢驗(yàn):
H0:
β1=β2=…=βK=0
也就是說(shuō),所有解釋變量對(duì)Y均無(wú)影響。注意到g=K,
則該檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量為:
分子分母均除以,有
從上式不難看出,全部斜率為0的檢驗(yàn)實(shí)際是檢驗(yàn)R2的值是否顯著異于0,如果接受原假設(shè),則表明因變量的行為完全歸因于隨機(jī)變化。若拒絕原假設(shè),則表明所選擇模型對(duì)因變量的行為能夠提供某種程度的解釋。四.檢驗(yàn)其他形式的系數(shù)約束條件
上面所介紹的檢驗(yàn)若干個(gè)系數(shù)顯著性的方法,也可以應(yīng)用于檢驗(yàn)施加于系數(shù)的其他形式的約束條件,如
檢驗(yàn)的方法仍是分別進(jìn)行有約束回歸和無(wú)約束回歸,求出各自的殘差平方和SR和S,然后用F統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。當(dāng)然,單個(gè)系數(shù)的假設(shè)檢驗(yàn),如H0:3=1.0,亦可用t檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。例2.13Cobb-Douglas生產(chǎn)函數(shù)
Y=AKαLβν
試根據(jù)美國(guó)制造業(yè)1899-1922年數(shù)據(jù)檢驗(yàn)規(guī)模效益不變的約束:α+β=1解:(1)全回歸
(2)有約束回歸:將約束條件代入,要回歸的模型變?yōu)椋?/p>
Y=AKαL1-αν
為避免回歸系數(shù)的不一致問(wèn)題,兩邊除以L(fǎng),模型變換為:
Y/L=A(K/L)αν
回歸,得:
由回歸結(jié)果得到的約束回歸和全回歸的殘差平方和分別為
SR=0.0716S=0.0710
(3)檢驗(yàn)原假設(shè)H0:α+β=1
備擇假設(shè)H1:α+β≠1
本例中,g=1,K=2,n=24
用自由度(1,21)查F表,5%顯著性水平下,F(xiàn)c=4.32∵F=0.18<Fc=4.32
故接受原假設(shè)H0:α+β=1
(4)結(jié)論我們的數(shù)據(jù)支持規(guī)模收益不變的假設(shè)。五、回歸結(jié)果的提供和分析1.回歸結(jié)果提供的格式在論文、專(zhuān)著或報(bào)告中提供回歸分析結(jié)果時(shí)一般應(yīng)采用簡(jiǎn)潔而通行的格式,以便于交流。通行的格式有以下兩種:(1)
這里116.7、0.112和-0.739分別為常數(shù)項(xiàng)和兩個(gè)斜率系數(shù)的估計(jì)值,括號(hào)中提供的是的標(biāo)準(zhǔn)誤差。(2)括號(hào)中數(shù)字分別是原假設(shè)、和成立時(shí)的t值。由此可見(jiàn),這兩種格式的唯一區(qū)別就在于括號(hào)中數(shù)字的含義不同。正因?yàn)槿绱?,人們?cè)谡撐幕蛑髦刑峁┗貧w結(jié)果時(shí),必須在適當(dāng)?shù)胤秸f(shuō)明括號(hào)中數(shù)字是標(biāo)準(zhǔn)誤差還是t值。需要說(shuō)明的是,提供回歸結(jié)果的標(biāo)準(zhǔn)格式中一般還包括檢驗(yàn)一階自相關(guān)的DW檢驗(yàn)值,我們將在下一章“自相關(guān)”一節(jié)中介紹。2.回歸結(jié)果的分析結(jié)果的分析主要包括以下內(nèi)容:(1)系數(shù)估計(jì)值。首先是分析系數(shù)的符號(hào)是否正確,系數(shù)值的大小是否恰當(dāng),是否符合理論預(yù)期和常識(shí)。上一段例中斜率系數(shù)一正一負(fù),符合經(jīng)濟(jì)理論,數(shù)值大小也大致合理。(2)擬合情況。例中很高,擬合較理想。(3)系數(shù)的顯著性。例中斜率系數(shù)的t值分別為37.33和-6.48,表明這些系數(shù)顯著異于0,X和P對(duì)Y有影響。(4)根據(jù)DW檢驗(yàn)值說(shuō)明是否存在擾動(dòng)項(xiàng)的自相關(guān)。如何說(shuō)明,將在下一章中介紹。第六節(jié)
預(yù)測(cè)
我們用OLS法對(duì)多元回歸模型的參數(shù)進(jìn)行了估計(jì)之后,如果結(jié)果理想,則可用估計(jì)好的模型進(jìn)行預(yù)測(cè)。預(yù)測(cè)指的是對(duì)諸自變量的某一組具體值
來(lái)預(yù)測(cè)與之相對(duì)應(yīng)的因變量值。當(dāng)然,要進(jìn)行預(yù)測(cè),有一個(gè)假設(shè)前提應(yīng)當(dāng)滿(mǎn)足,即擬合的模型在預(yù)測(cè)期也成立。
點(diǎn)預(yù)測(cè)值由與給定的諸X值對(duì)應(yīng)的回歸值給出,即
而預(yù)測(cè)期的實(shí)際Y值由下式給出:
其中u0是從預(yù)測(cè)期的擾動(dòng)項(xiàng)分布中所取的值。預(yù)測(cè)誤差可定義為:兩邊取期望值,得因此,OLS預(yù)測(cè)量是一個(gè)無(wú)偏預(yù)測(cè)量。
預(yù)測(cè)誤差的方差為:從e0
的定義可看出,e0
為正態(tài)變量的線(xiàn)性函數(shù),因此,它本身也服從正態(tài)分布。故由于為未知,我們用其估計(jì)值代替它,有
則的95%置信區(qū)間為:即
例2.14用例2.4的數(shù)據(jù),預(yù)測(cè)X2=10,X3=10的Y值。
解:
由例2.4我們已得到:
因此
的95%置信區(qū)間為:或3.66至24.34之間.
第七節(jié)虛擬變量(Dummyvariables)一.虛擬變量的概念
在回歸分析中,常常碰到這樣一種情況,即因變量的波動(dòng)不僅依賴(lài)于那種能夠很容易按某種尺度定量化的變量(如收入、產(chǎn)出、價(jià)格、身高、體重等),而且依賴(lài)于某些定性的變量(如性別、地區(qū)、季節(jié)等)。在經(jīng)濟(jì)系統(tǒng)中,許多變動(dòng)是不能定量的。如政府的更迭(工黨-保守黨)、經(jīng)濟(jì)體制的改革、固定匯率變?yōu)楦?dòng)匯率、從戰(zhàn)時(shí)經(jīng)濟(jì)轉(zhuǎn)為和平時(shí)期經(jīng)濟(jì)等。
這樣一些變動(dòng)都可以用0-1變量來(lái)表示,用1表示具有某一“品質(zhì)”或?qū)傩裕?表示不具有該“品質(zhì)”或?qū)傩?。這種變量在計(jì)量經(jīng)濟(jì)學(xué)中稱(chēng)為“虛擬變量”。虛擬變量使得我們可以將那些無(wú)法定量化的變量引入回歸模型中。下面給出幾個(gè)可以引入虛擬變量的例子。例1:你在研究學(xué)歷和收入之間的關(guān)系,在你的樣本中,既有女性又有男性,你打算研究在此關(guān)系中,性別是否會(huì)導(dǎo)致差別。例2:你在研究某省家庭收入和支出的關(guān)系,采集的樣本中既包括農(nóng)村家庭,又包括城鎮(zhèn)家庭,你打算研究二者的差別。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/IEC 15416:2025 EN Automatic identification and data capture techniques - Bar code print quality test specification - Linear symbols
- 2025建筑工程施工合同的
- 2025年度文化創(chuàng)意商鋪?zhàn)赓U合同范本(含知識(shí)產(chǎn)權(quán)保護(hù)協(xié)議)3篇
- 2025年度文化創(chuàng)意園區(qū)物業(yè)用房移交與知識(shí)產(chǎn)權(quán)保護(hù)合同3篇
- 二零二五年度全款購(gòu)新能源汽車(chē)及充電站建設(shè)合同模板3篇
- 二零二五年度農(nóng)機(jī)作業(yè)與農(nóng)業(yè)產(chǎn)業(yè)扶貧合作合同3篇
- 2025年度高新技術(shù)園區(qū)融資合同范文匯編3篇
- 二零二五年度公司汽車(chē)轉(zhuǎn)讓協(xié)議:適用于汽車(chē)租賃公司車(chē)輛更新3篇
- 2025年度新能源公司合并投資協(xié)議2篇
- 二零二五年度全日制勞務(wù)合同書(shū)(高新技術(shù)企業(yè)研發(fā))2篇
- (八省聯(lián)考)河南省2025年高考綜合改革適應(yīng)性演練 化學(xué)試卷(含答案)
- 2025中國(guó)電信山東青島分公司校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年八省聯(lián)考高考語(yǔ)文作文真題及參考范文
- 新課標(biāo)(水平三)體育與健康《籃球》大單元教學(xué)計(jì)劃及配套教案(18課時(shí))
- 開(kāi)題報(bào)告-鑄牢中華民族共同體意識(shí)的學(xué)校教育研究
- 計(jì)件工勞務(wù)合同范例
- 2024年公交車(chē)開(kāi)通儀式講話(huà)例文(4篇)
- 科研倫理與學(xué)術(shù)規(guī)范(研究生)期末試題庫(kù)及答案
- 修復(fù)學(xué)全口義齒
- 機(jī)械設(shè)備租賃合同范本簡(jiǎn)單版(9篇)
- 美甲顧客檔案表Excel模板
評(píng)論
0/150
提交評(píng)論