




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1,多元線性回歸模型,簡(jiǎn)單線性回歸模型的推廣,2,第一節(jié) 多元線性回歸模型的概念 在許多實(shí)際問題中,我們所研究的因變量的變動(dòng)可能不僅與一個(gè)解釋變量有關(guān)。因此,有必要考慮線性模型的更一般形式,即多元線性回歸模型: t=1,2,n 在這個(gè)模型中,Y由X1,X2,X3, XK所解釋,有K+1個(gè)未知參數(shù)0、1、2、K 。 這里,“斜率”j的含義是其它變量不變的情況下,Xj改變一個(gè)單位對(duì)因變量所產(chǎn)生的影響。,3,例1: 其中,Y=在食品上的總支出 X=個(gè)人可支配收入 P=食品價(jià)格指數(shù) 用美國1959-1983年的數(shù)據(jù),得到如下回歸結(jié)果(括號(hào)中數(shù)字為標(biāo)準(zhǔn)誤差): Y和X的計(jì)量單位為10億美元 (按1972
2、不變價(jià)格計(jì)算).,4,多元線性回歸模型中斜率系數(shù)的含義 上例中斜率系數(shù)的含義說明如下: 價(jià)格不變的情況下,個(gè)人可支配收入每上升10億美元(1個(gè)billion),食品消費(fèi)支出增加1.12億元(0.112個(gè) billion)。 收入不變的情況下,價(jià)格指數(shù)每上升一個(gè)點(diǎn), 食品消費(fèi)支出減少7.39億元(0.739個(gè)billion),5,例2: 其中,Ct=消費(fèi),Dt=居民可支配收入 Lt=居民擁有的流動(dòng)資產(chǎn)水平 2的含義是,在流動(dòng)資產(chǎn)不變的情況下,可支配收入變動(dòng)一個(gè)單位對(duì)消費(fèi)額的影響。這是收入對(duì)消費(fèi)額的直接影響。 收入變動(dòng)對(duì)消費(fèi)額的總影響=直接影響+間接影響。 (間接影響:收入影響流動(dòng)資產(chǎn)擁有量影響消
3、費(fèi)額) 但在模型中這種間接影響應(yīng)歸因于流動(dòng)資產(chǎn),而不是收入,因而,2只包括收入的直接影響。 在下面的模型中: 這里,是可支配收入對(duì)消費(fèi)額的總影響,顯然和2的 含義是不同的。,6,回到一般模型 t=1,2, ,n 即對(duì)于n組觀測(cè)值,有,7,其矩陣形式為: 其中,8,第二節(jié) 多元線性回歸模型的估計(jì) 多元線性回歸模型的估計(jì)與雙變量線性模型類似,仍采用最小二乘法。當(dāng)然,計(jì)算要復(fù)雜得多,通常要借助計(jì)算機(jī)。理論推導(dǎo)需借助矩陣代數(shù)。下面給出最小二乘法應(yīng)用于多元線性回歸模型的假設(shè)條件、估計(jì)結(jié)果及所得到的估計(jì)量的性質(zhì)。 一假設(shè)條件 (1)E(ut)=0, t=1,2,n (2)E(ui uj)=0, ij (3
4、)E(ut2)=2, t=1,2,n (4)Xjt是非隨機(jī)量, j=1,2, k t=1,2, n,9,除上面4條外,在多個(gè)解釋變量的情況下,還有兩個(gè)條件需要滿足: (5)(K+1) n; 即觀測(cè)值的數(shù)目要大于待估計(jì)的參數(shù)的個(gè)數(shù) (要有足夠數(shù)量的數(shù)據(jù)來擬合回歸線)。 (6)各解釋變量之間不存在嚴(yán)格的線性關(guān)系。,10,上述假設(shè)條件可用矩陣表示為以下四個(gè)條件: (1) E(u)=0 (2) 由于 顯然, 僅當(dāng) E(ui uj)=0 , ij E(ut2) = 2, t=1,2,n 這兩個(gè)條件成立時(shí)才成立,因此, 此條件相當(dāng)前面條件(2), (3)兩條,即各期擾動(dòng)項(xiàng)互不相關(guān),并具有常數(shù)方差。,11,
5、(3) X 是是一個(gè)非隨機(jī)元素矩陣。 (4)Rank(X) = (K+1) n. -相當(dāng)于前面 (5)、 (6) 兩條 即矩陣X的秩 =(K+1) n 當(dāng)然,為了后面區(qū)間估計(jì)和假設(shè)檢驗(yàn)的需要,還要加 上一條: (5) ,t=1,2,n,12,二最小二乘估計(jì) 我們的模型是: t=1,2,n 問題是選擇 ,使得殘差平方和最小。 殘差為:,13,要使殘差平方和 為最小,則應(yīng)有: 我們得到如下K+1個(gè)方程(即正規(guī)方程):,14,按矩陣形式,上述方程組可表示為:,15,=,即,16,上述結(jié)果,亦可從矩陣表示的模型 出發(fā), 完全用矩陣代數(shù)推導(dǎo)出來。 殘差可用矩陣表示為: 其中:,17,殘差平方和,18,注
6、意到上式中所有項(xiàng)都是標(biāo)量,且 故 令 用矩陣微分法,我們可得到 與采用標(biāo)量式推導(dǎo)所得結(jié)果相同。由上述結(jié)果,我們有,19,三. 最小二乘估計(jì)量 的性質(zhì) 我們的模型為 估計(jì)式為 1 的均值,20,(由假設(shè)3) (由假設(shè)1),即 這表明,OLS估計(jì)量 是無偏估計(jì)量。,21,2 的方差 為求Var( ),我們考慮 這是一個(gè)(K+1)*(K+1)矩陣,其主對(duì)角線上元素即構(gòu)成 Var( ),非主對(duì)角線元素是相應(yīng)的協(xié)方差,如下所示:,22,下面推導(dǎo)此矩陣的計(jì)算公式.,23,由上一段的結(jié)果,我們有 因此,,24,如前所述,我們得到的實(shí)際上不僅是 的方差,而且是 一個(gè)方差-協(xié)方差矩陣,為了反映這一事實(shí),我們用下
7、面的符號(hào)表示之: 展開就是:,25,3 2 的估計(jì) 與雙變量線性模型相似, 2的無偏估計(jì)量是 這是因?yàn)槲覀冊(cè)诠烙?jì) 的過程中,失去了(K+1)個(gè)自由度。 4 高斯-馬爾科夫定理 對(duì)于 以及標(biāo)準(zhǔn)假設(shè)條件(1)-(4), 普通最小二乘估計(jì)量是最佳線性無偏估計(jì)量(BLUE),26,我們已在上一段中證明了無偏性,下面證明線性和最小方差性。證明的路子與雙變量模型中類似,只不過這里我們采用矩陣和向量的形式。 由OLS估計(jì)量 的公式 可知, 可表示為一個(gè)矩陣和應(yīng)變量觀測(cè)值向量 的乘積: 其中 是一個(gè) (K+1)*n 非隨機(jī)元素矩陣。 因而顯然有 是線性估計(jì)量。,27,現(xiàn)設(shè) 為 的任意一個(gè)線性無偏估計(jì)量,即 其
8、中 是一個(gè)(K+1)*n非隨機(jī)元素矩陣。則 顯然,若要 為無偏估計(jì)量,即 ,只有 , 為(K+1)階單位矩陣。,28,的方差為: 我們可將 寫成 從而將 的任意線性無偏估計(jì)量 與OLS估計(jì)量 聯(lián)系起來。,29,由 可推出: 即 因而有 由 從而 ,因此上式中間兩項(xiàng)為0,我們有,30,因此 最后的不等號(hào)成立是因?yàn)?為半正定矩陣。這就證明了OLS估計(jì)量 是 的所有線性無偏估計(jì)量中方差最小的。至此, 我們證明了高斯-馬爾科夫定理。,31,第三節(jié) 擬合優(yōu)度 一決定系數(shù)R2 對(duì)于雙變量線性模型 Y=+X + u 我們有 其中, =殘差平方和,32,對(duì)于多元線性模型 我們可用同樣的方法定義決定系數(shù): 為方
9、便計(jì)算,我們也可以用矩陣形式表示R2,33,我們有:殘差 ,其中, 殘差平方和:,34,而 將上述結(jié)果代入R2的公式,得到:,這就是決定系數(shù) R2 的矩陣形式。,35,二修正決定系數(shù): 殘差平方和的一個(gè)特點(diǎn)是,每當(dāng)模型增加一個(gè)解釋變量,并用改變后的模型重新進(jìn)行估計(jì),殘差平方和的值會(huì)減小。 由此可以推論,決定系數(shù)是一個(gè)與解釋變量的個(gè)數(shù)有關(guān)的量: 解釋變量個(gè)數(shù)增加 減小 R2 增大 也就是說,人們總是可以通過增加模型中解釋變量的方法來增大 R2 的值。因此,用 R2 來作為擬合優(yōu)度的測(cè)度,不是十分令人滿意的。 為此,我們定義修正決定系數(shù) (Adjusted )如下:,36,是經(jīng)過自由度調(diào)整的決定系
10、數(shù),稱為修正決定系數(shù)。 我們有:(1) (2)僅當(dāng)K=0時(shí),等號(hào)成立。即 (3)當(dāng)K增大時(shí),二者的差異也隨之增大。 (4) 可能出現(xiàn)負(fù)值。,37,三例子 下面我們給出兩個(gè)簡(jiǎn)單的數(shù)值例子,以幫助理解這兩節(jié)的內(nèi)容. 例1Yt = 1 + 2X2 t + 3X3 t + u t 設(shè)觀測(cè)數(shù)據(jù)為:Y: 3 1 8 3 5 X2:3 1 5 2 4 X3:5 4 6 4 6 試求各參數(shù)的OLS估計(jì)值,以及 。 解:我們有,38,39,40,41,42,例2. 設(shè) n = 20, k = 3, R2 = 0.70 求 。 解: 下面改變n的值,看一看 的值如何變化。我們有 若n = 10,則 = 0.55
11、若n = 5, 則 = - 0.20 由本例可看出, 有可能為負(fù)值。這與R2不同 ( )。,43,第四節(jié) 非線性關(guān)系的處理 迄今為止,我們已解決了線性模型的估計(jì)問題。但在實(shí)際問題中,變量間的關(guān)系并非總是線性關(guān)系,經(jīng)濟(jì)變量間的非線性關(guān)系比比皆是。如大家所熟悉的柯布-道格拉斯生產(chǎn)函數(shù): 就是一例。 在這樣一些非線性關(guān)系中,有些可以通過代數(shù)變換變?yōu)榫€性關(guān)系處理,另一些則不能。下面我們通過一些例子來討論這個(gè)問題。,44,一. 線性模型的含義 線性模型的基本形式是: 其特點(diǎn)是可以寫成每一個(gè)解釋變量和一個(gè)系數(shù)相乘的形式。 線性模型的線性包含兩重含義: (1)變量的線性 變量以其原型出現(xiàn)在模型之中,而不是以
12、X2或X之 類的函數(shù)形式出現(xiàn)在模型中。 (2)參數(shù)的線性 因變量Y是各參數(shù)的線性函數(shù)。,45,二線性化方法 對(duì)于線性回歸分析,只有第二種類型的線性才是重要的,因?yàn)樽兞康姆蔷€性可通過適當(dāng)?shù)闹匦露x來解決。例如,對(duì)于 此方程的變量和參數(shù)都是線性的。如果原方程的擾動(dòng)項(xiàng)滿足高斯馬爾可夫定理?xiàng)l件,重寫的方程的擾動(dòng)項(xiàng)也將滿足。,46,參數(shù)的非線性是一個(gè)嚴(yán)重得多的問題,因?yàn)樗荒軆H憑重定義來處理??墒?,如果模型的右端由一系列的X或eX項(xiàng)相乘,并且擾動(dòng)項(xiàng)也是乘積形式的,則該模型可通過兩邊取對(duì)數(shù)線性化。 例如,需求函數(shù) 其中,Y=對(duì)某商品的需求 X=收入 P=相對(duì)價(jià)格指數(shù) =擾動(dòng)項(xiàng) 可轉(zhuǎn)換為:,47,用X,Y,
13、P的數(shù)據(jù),我們可得到logY,logX和logP,從而可以用OLS法估計(jì)上式。 logX的系數(shù)是的估計(jì)值,經(jīng)濟(jì)含義是需求的收入彈性,logP的系數(shù)將是的估計(jì)值,即需求的價(jià)格彈性。 注釋 彈性(elasticity):一變量變動(dòng)1%所引起的另一變量變動(dòng)的百分比: 需求的收入彈性:收入變化1%,價(jià)格不變時(shí),所引起的商品需求量變動(dòng)的百分比。 需求的價(jià)格彈性:價(jià)格變化1%,收入不變時(shí),所引起的商品需求量變動(dòng)的百分比。,48,三例子 例1 需求函數(shù) 本章1中,我們?cè)o出一個(gè)食品支出為因變量,個(gè)人可支配收入和食品價(jià)格指數(shù)為解釋變量的線性回歸模型例子?,F(xiàn)用這三個(gè)變量的對(duì)數(shù)重新估計(jì)(采用同樣的數(shù)據(jù)),得到如下
14、結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差): 回歸結(jié)果表明,需求的收入彈性是0.64,需求的價(jià)格彈性是0.48,這兩個(gè)系數(shù)都顯著異于0。,49,例2柯布-道格拉斯生產(chǎn)函數(shù) 生產(chǎn)函數(shù)是一個(gè)生產(chǎn)過程中的投入及其產(chǎn)出之間的一種關(guān)系。著名的柯布-道格拉斯生產(chǎn)函數(shù)(C-D函數(shù))為 用柯布和道格拉斯最初使用的數(shù)據(jù)(美國1899-1922年制造業(yè)數(shù)據(jù))估計(jì)經(jīng)過線性變換的模型 得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差) : 從上述結(jié)果可以看出,產(chǎn)出的資本彈性是0.23,產(chǎn)出的勞動(dòng)彈性為0.81。,50,例3貨幣需求量與利率之間的關(guān)系,M = a(r - 2)b 這里,變量非線性和參數(shù)非線性并存。 對(duì)此方程采用對(duì)數(shù)變換 logM=
15、loga+blog(r-2),令Y=logM, X=log(r-2), 1= loga, 2=b 則變換后的模型為: Yt=1+2Xt + ut,51,將OLS法應(yīng)用于此模型,可求得1和2的估計(jì)值 從而可通過下列兩式求出a和b估計(jì)值: 應(yīng)當(dāng)指出,在這種情況下,線性模型估計(jì)量的性質(zhì)(如 BLUE,正態(tài)性等)只適用于變換后的參數(shù)估計(jì)量 ,而 不一定適用于原模型參數(shù)的估計(jì)量 和 。,52,例4上例在確定貨幣需求量的關(guān)系式時(shí),我們實(shí)際上給模型加進(jìn)了一個(gè)結(jié)束條件。根據(jù)理論假設(shè),在某一利率水平上,貨幣需求量在理論上是無窮大。我們假定這個(gè)利率水平為2%。假如不給這一約束條件,而是從給定的數(shù)據(jù)中估計(jì)該利率水平
16、的值,則模型變?yōu)椋?M = a(r - c)b 式中a,b,c均為參數(shù)。仍采用對(duì)數(shù)變換,得到 log(Mt) = loga + blog(rt - c) + ut t=1,2,n 我們無法將log(rt-c)定義為一個(gè)可觀測(cè)的變量X, 因?yàn)檫@里有一個(gè)未知量c。也就是說,此模型無法線性化。在這種情況下,只能用估計(jì)非線性模型參數(shù)值的方法。,53,四非線性回歸 模型 Y = a(X - c)b 是一個(gè)非線性模型,a、b和c是要估計(jì)的參數(shù)。此模型無法用取對(duì)數(shù)的方法線性化,只能用非線性回歸技術(shù)進(jìn)行估計(jì),如非線性最小二乘法(NLS)。該方法的原則仍然是殘差平方和最小。計(jì)量經(jīng)濟(jì)軟件包通常提供這類方法,這里給
17、出有關(guān)非線性回歸方法的大致步驟如下:,54,非線性回歸方法的步驟 1首先給出各參數(shù)的初始估計(jì)值(合理猜測(cè)值); 2用這些參數(shù)值和X觀測(cè)值數(shù)據(jù)計(jì)算Y的各期預(yù)測(cè)值 (擬合 值) ; 3計(jì)算各期殘差,然后計(jì)算殘差平方和e2; 4對(duì)一個(gè)或多個(gè)參數(shù)的估計(jì)值作微小變動(dòng); 5計(jì)算新的Y預(yù)測(cè)值 、殘差平方和e2; 6若新的e2小于老的e2,說明新參數(shù)估計(jì)值優(yōu)于老估 計(jì)值,則以它們作為新起點(diǎn); 7重復(fù)步驟4,5,6,直至無法減小e2為止。 8最后的參數(shù)估計(jì)值即為最小二乘估計(jì)值。,55,第五節(jié) 假設(shè)檢驗(yàn) 一系數(shù)的顯著性檢驗(yàn) 1單個(gè)系數(shù)顯著性檢驗(yàn) 目的是檢驗(yàn)?zāi)硞€(gè)解釋變量的系數(shù)j是否為0,即該解釋變量是否對(duì)因變量有影
18、響。 原假設(shè): H0: j=0 備擇假設(shè): H1: j0 檢驗(yàn)統(tǒng)計(jì)量是自由度為 n-K-1 的 t 統(tǒng)計(jì)量: t(n-K-1),56,單個(gè)系數(shù)顯著性檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量是自由度為 n-K-1 的 t 統(tǒng)計(jì)量: t(n-K-1) 其中, 為矩陣 主對(duì)角線上第 j+1個(gè)元素。而,57,例:柯布-道格拉斯生產(chǎn)函數(shù) 用柯布和道格拉斯最初使用的數(shù)據(jù)(美國1899-1922年制造業(yè)數(shù)據(jù))估計(jì)經(jīng)過線性變換的模型 得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差) :,請(qǐng)檢驗(yàn)“斜率”系數(shù)和的顯著性。 解:(1)檢驗(yàn)的顯著性 原假設(shè): H0: = 0 備擇假設(shè): H1: 0,58,由回歸結(jié)果,我們有:t0.23/0.06=3.8
19、3 用=24321查t表,5%顯著性水平下,tc 2.08. t3.83 tc 2.08, 故拒絕原假設(shè)H0 。 結(jié)論:顯著異于0。 (2)檢驗(yàn) 的顯著性 原假設(shè): H0: = 0 備擇假設(shè): H1: 0 由回歸結(jié)果,我們有:t0.81/0.15=5.4 t5.4 tc 2.08, 故拒絕原假設(shè)H0 。 結(jié)論:顯著異于0。,59,2若干個(gè)系數(shù)的顯著性檢驗(yàn)(聯(lián)合假設(shè)檢驗(yàn)) 有時(shí)需要同時(shí)檢驗(yàn)若干個(gè)系數(shù)是否為0,這可以通過建立單一的原假設(shè)來進(jìn)行。 設(shè)要檢驗(yàn)g個(gè)系數(shù)是否為0,即與之相對(duì)應(yīng)的g個(gè)解釋變量對(duì)因變量是否有影響。不失一般性,可設(shè)原假設(shè)和備擇假設(shè)為: H0: 1 =2 = =g =0 H1: H
20、0不成立 (即X1, Xg中某些變量對(duì)Y有 影響),60,分析: 這實(shí)際上相當(dāng)于檢驗(yàn)g個(gè)約束條件 1= 0,2 = 0, ,g = 0 是否同時(shí)成立。 若H0為真,則正確的模型是: 據(jù)此進(jìn)行回歸(有約束回歸),得到殘差平方和 SR是H0為真時(shí)的殘差平方和。 若H1為真,正確的模型即原模型:,61,據(jù)此進(jìn)行無約束回歸(全回歸),得到殘差平方和 S是H1為真時(shí)的殘差平方和。 如果H0為真,則不管X1, Xg這g個(gè)變量是否包括在模型中,所得到的結(jié)果不會(huì)有顯著差別,因此應(yīng)該有: S SR 如果H1為真,則由上一節(jié)中所討論的殘差平方和e2的特點(diǎn),無約束回歸增加了變量的個(gè)數(shù),應(yīng)有 S SR 通過檢驗(yàn)二者差
21、異是否顯著地大,就能檢驗(yàn)原假設(shè)是否成立。,62,所使用的檢驗(yàn)統(tǒng)計(jì)量是: F(g, n-K-1) 其中, g為分子自由度, n-K-1為分母自由度。 使用 的作用是消除具體問題中度量單位 的影響, 使計(jì)算出的 F 值是一個(gè)與度量單位無關(guān)的量。,63,例:給定20組Y, X1, X2, X3的觀測(cè)值,試檢驗(yàn)?zāi)P?中X1和X3對(duì)Y是否有影響? 解:(1)全回歸 估計(jì) 得到:S =e2 = 25 (2)有約束回歸 估計(jì) 得到:SR =e2 = 30,64,原假設(shè) H0: 1 = 3 = 0 備擇假設(shè) H1: H0不成立 我們有:n=20, g=2, K=3 用自由度(2,16)查F分布表,5%顯著性水
22、平下,F(xiàn)C=3.63 F=1.6 FC =3.63, 故接受H0。 結(jié)論:X1和X3對(duì)Y無顯著影響,65,3全部斜率系數(shù)為0的檢驗(yàn) 上一段結(jié)果的一個(gè)特例是所有斜率系數(shù)均為0的檢驗(yàn),即回歸方程的顯著性檢驗(yàn): H0: 1 =2 = = K = 0 也就是說,所有解釋變量對(duì)Y均無影響。 注意到 g=K, 則該檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量為:,66,分子分母均除以 ,有 從上式不難看出,全部斜率為0的檢驗(yàn)實(shí)際是檢驗(yàn)R2的值是否顯著異于0,如果接受原假設(shè),則表明因變量的行為完全歸因于隨機(jī)變化。若拒絕原假設(shè),則表明所選擇模型對(duì)因變量的行為能夠提供某種程度的解釋。,67,二檢驗(yàn)其他形式的系數(shù)約束條件 上面所介紹的檢驗(yàn)若
23、干個(gè)系數(shù)顯著性的方法,也可以應(yīng)用于檢驗(yàn)施加于系數(shù)的其他形式的約束條件,如 檢驗(yàn)的方法仍是分別進(jìn)行有約束回歸和無約束回歸,求出各自的殘差平方和 SR 和 S,然后用 F 統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。 當(dāng)然,單個(gè)系數(shù)的假設(shè)檢驗(yàn),如 H0: 3=1.0,亦可用t檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。,68,例:Cobb-Douglas生產(chǎn)函數(shù) Y=AKL 試根據(jù)美國制造業(yè)1899-1922年數(shù)據(jù)檢驗(yàn)規(guī)模效益不變的約束:+=1 解:(1)全回歸 (2)有約束回歸: 將約束條件代入,要回歸的模型變?yōu)椋?Y=AKL1- 為避免回歸系數(shù)的不一致問題, 兩邊除以L,模型變換為: Y/L=A(K/L),69,回歸,得: 由軟件包可得到約束回
24、歸和全回歸的殘差平方和分別為 SR=0.0716 S=0.0710 (3)檢驗(yàn) 原假設(shè) H0:+1 備擇假設(shè) H1:+1 本例中,g=1, K=2, n=24,70,用自由度(1,21)查F表,5%顯著性水平下, Fc=4.32 F=0.18 Fc=4.32 故接受原假設(shè)H0:+1 (4)結(jié)論 我們的數(shù)據(jù)支持規(guī)模收益不變的假設(shè)。,71,第六節(jié) 預(yù)測(cè) 我們用OLS法對(duì)多元回歸模型的參數(shù)進(jìn)行了估計(jì)之后,如果結(jié)果理想,則可用估計(jì)好的模型進(jìn)行預(yù)測(cè)。與雙變量模型的作法類似,預(yù)測(cè)指的是對(duì)各自變量的某一組具體值 來預(yù)測(cè)與之相對(duì)應(yīng)的因變量值 。當(dāng)然,要進(jìn)行預(yù)測(cè),有一個(gè)假設(shè)前提應(yīng)當(dāng)滿足,即擬合的模型在預(yù)測(cè)期也成
25、立。 點(diǎn)預(yù)測(cè)值由與給定的諸X值對(duì)應(yīng)的回歸值給出,即 而預(yù)測(cè)期的實(shí)際Y值由下式給出: 其中u0是從預(yù)測(cè)期的擾動(dòng)項(xiàng)分布中所取的值。,72,預(yù)測(cè)誤差可定義為: 兩邊取期望值,得 因此,OLS預(yù)測(cè)量 是一個(gè)無偏預(yù)測(cè)量。,73,預(yù)測(cè)誤差的方差為: 從 的定義可看出, 為正態(tài)變量的線性函數(shù),因此,它本身也服從正態(tài)分布。故,74,由于 為未知,我們用其估計(jì)值 代替它,有 則 的95%置信區(qū)間為: (其中, ),75,例 用書上P79例4.3的數(shù)據(jù),預(yù)測(cè)X2=10,X3=10的Y值。 解: 由例4.3我們已得到: 因此 的95%置信區(qū)間為: 或 3.66至23.65之間.,76,第七節(jié) 虛擬變量(Dummy
26、variables) 一虛擬變量的概念 在回歸分析中,常常碰到這樣一種情況,即因變量的波動(dòng)不僅依賴于那種能夠很容易按某種尺度定量化的變量(如收入、產(chǎn)出、價(jià)格、身高、體重等),而且依賴于某些定性的變量(如性別、地區(qū)、季節(jié))。 在經(jīng)濟(jì)系統(tǒng)中,許多變動(dòng)是不能定量的。如政府的更迭(工黨-保守黨)、經(jīng)濟(jì)體制的改革、固定匯率變?yōu)楦?dòng)匯率、從戰(zhàn)時(shí)經(jīng)濟(jì)轉(zhuǎn)為和平時(shí)期經(jīng)濟(jì)等。這樣一些變動(dòng)都可以用大家所熟悉的0-1變量來表示,用1表示具有某一“品質(zhì)”或?qū)傩?,?表示不具有該“品質(zhì)”或?qū)傩?。這種變量在計(jì)量經(jīng)濟(jì)學(xué)中稱為“虛擬變量”。虛擬變量使得我們可以將那些無法定量化的變量引入回歸模型中。下面給出幾個(gè)可以引入虛擬變量的
27、例子。,77,例1:你在研究學(xué)歷和收入之間的關(guān)系,在你的樣本中,既 有女性又有男性,你打算研究在此關(guān)系中,性別是否 會(huì)導(dǎo)致差別。 例2:你在研究某省家庭收入和支出的關(guān)系,采集的樣本中 既包括農(nóng)村家庭,又包括城鎮(zhèn)家庭,你打算研究二者 的差別。 例3:你在研究通貨膨脹的決定因素,在你的觀測(cè)期中,有 些年份政府實(shí)行了一項(xiàng)收入政策。你想檢驗(yàn)該政策是 否對(duì)通貨膨脹產(chǎn)生影響。 上述各例都可以用兩種方法來解決,一種解決方法是分別進(jìn)行兩類情況的回歸,然后看參數(shù)是否不同。另一種方法是用全部觀測(cè)值作單一回歸,將定性因素的影響用虛擬變量引入模型。,78,二虛擬變量的使用方法 1截距變動(dòng) 設(shè)Y表示消費(fèi),X表示收入,我
28、們有: 假定不變。 對(duì)于5年戰(zhàn)爭(zhēng)和5年和平時(shí)期的數(shù)據(jù),我們可分別估計(jì)上述兩個(gè)模型,一般將給出 的不同值。 現(xiàn)引入虛擬變量D, 將兩式并為一式: 其中,,79,此式等價(jià)于下列兩式: 截距變動(dòng),斜率不變 在包含虛擬變量的模型中,D的數(shù)據(jù)為0,0,0,0,0,1,1,1,1,1。 估計(jì)結(jié)果如下圖所示: 應(yīng)用t檢驗(yàn),2是否顯著 可以表明截距項(xiàng)在兩個(gè)時(shí) 期是否有變化。,80,2斜率變動(dòng) 如果我們認(rèn)為戰(zhàn)時(shí)和平時(shí)的消費(fèi)函數(shù)中,截距項(xiàng)不變,而斜率不同,即變動(dòng),則可用下面的模型來研究?jī)蓚€(gè)時(shí)期邊際消費(fèi)傾向的差異: 其中,D= 不難看出,上式相當(dāng)于下列兩式: 同樣,包括虛擬變量的模型中,2是否顯著可以表明斜率在兩個(gè)
29、時(shí)期是否變化。,81,3斜率和截距都變動(dòng) 在這種情況下,模型可設(shè)為: 其中,D= 此式等價(jià)于下列兩個(gè)單獨(dú)的回歸式:,引進(jìn)了虛擬變量的回歸模型對(duì)于檢驗(yàn)兩個(gè)時(shí)期中是否 發(fā)生結(jié)構(gòu)性變化很方便。 如上例中,相當(dāng)于檢驗(yàn) H0: 2=4=0,82,4季節(jié)虛擬變量的使用 許多變量展示出季節(jié)性的變異(如商品零售額、電和天然氣的消費(fèi)等),我們?cè)诮⒛P蜁r(shí)應(yīng)考慮這一點(diǎn),這有兩種方法: (1) 在估計(jì)前對(duì)數(shù)據(jù)進(jìn)行季節(jié)調(diào)整; (2) 采用虛擬變量將季節(jié)性差異反映在模型中。 例:設(shè)Y=購買汽車的實(shí)際支出額 X=實(shí)際總消費(fèi)支出 用美國1973(1)-1980(2)的季度數(shù)據(jù)(按1975年價(jià)格計(jì)算),得回歸結(jié)果如下:,83
30、,這一結(jié)果很不理想,低R2值,低t值,X的符號(hào)也不對(duì)??紤]到可能是季節(jié)性變異的問題,我們建立下面的模型: 其中,Q1= Q2= Q3= 請(qǐng)注意我們僅用了3個(gè)虛擬變量就可表示4個(gè)季度的情況。,各季度的截距分別為: 1季度:0 + 1 2季度: 0 + 2 3季度: 0 + 3 4季度: 0,84,估計(jì)結(jié)果如下: 結(jié)果仍不理想,但好多了。四個(gè)季度的截距項(xiàng)分別為: -1039.2,-1122.7,-1161.4,-1455.8。 所得到的實(shí)際總支出的參數(shù)估計(jì)值(0.1044)是一個(gè)不受季節(jié)變動(dòng)影響的估計(jì)值。,85,第四章 小結(jié) 本章將雙變量模型的結(jié)果推廣到了多元線性回歸模型的一般情形。 一、多元線性
31、回歸模型的估計(jì) 多元線性回歸模型的矩陣形式為 Y=X+ 若滿足以下四條假設(shè)條件: 1、E()=0 2、E()= 2 In 3、X是一個(gè)非隨機(jī)元素矩陣 4、Rank(X)=k+1n 則OLS估計(jì)量 =(XX)-1XY 為最佳線性無偏估計(jì)量(BLUE)。其方差-協(xié)方差矩陣為 Var-cov( )=(XX)-12 該矩陣主對(duì)角線元素為諸 的方差。,86,二、擬合優(yōu)度 多元線性回歸模型的決定系數(shù)為: R2 = 由于當(dāng)模型增加解釋變量后,殘差平方和的值會(huì)減小,為了使擬合優(yōu)度的測(cè)度反映這一特點(diǎn),可采用經(jīng)過自由度調(diào)整的決定系數(shù),即修正決定系數(shù) :,87,三、非線性關(guān)系的處理 線性模型的含義包括變量的線性和參數(shù)的線性。對(duì)于僅存在變量非線性的模型,可采用重新定義的方法將模型線性化。 存在參數(shù)非線性的模型,則僅有一部分可通過代數(shù)變換(主要是取對(duì)數(shù))的方法將模型線性化。對(duì)于那些無法線性化的模型,只能采用非線性估計(jì)技術(shù)(如NLS法)估計(jì)模 型。,88,四、假設(shè)檢驗(yàn) 檢驗(yàn)解釋變量的系數(shù)是否為0的假設(shè)檢驗(yàn)稱為系數(shù)的顯著性檢驗(yàn)。這種檢驗(yàn)實(shí)際上是檢驗(yàn)所涉及的解釋變量是否對(duì)因變量有影響。 檢驗(yàn)單個(gè)系數(shù)j是否為0的檢驗(yàn)統(tǒng)計(jì)量 t(n-k-1) 其中Var( )為矩陣 主對(duì)角線上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 健康皮膚中班課件下載
- 藥品gsp認(rèn)證管理辦法
- 葡萄酒常規(guī)發(fā)酵管理辦法
- 虹口區(qū)辦公用品管理辦法
- 融資擔(dān)保金管理辦法規(guī)定
- 衢江區(qū)臨時(shí)宿舍管理辦法
- 衡水市生產(chǎn)資料管理辦法
- 裕安區(qū)臨時(shí)攤位管理辦法
- 西海岸區(qū)宅基地管理辦法
- 計(jì)劃管理與合同管理辦法
- 大連海事大學(xué)畢業(yè)成績(jī)表
- 尾礦庫模施袋筑壩工藝在施工中的應(yīng)用
- 公路施工組織與概預(yù)算教學(xué)課件匯總整本書電子教案全套教學(xué)教程完整版電子教案(最新)
- 中國34個(gè)省級(jí)行政區(qū)輪廓圖
- 人教版三年級(jí)下冊(cè)數(shù)學(xué)(全冊(cè))同步隨堂練習(xí)一課一練
- 肺小結(jié)節(jié)定位和肺段切除規(guī)劃PPT學(xué)習(xí)課件
- 精品專題資料(2022-2023年收藏)國家電網(wǎng)公司智能電網(wǎng)知識(shí)競(jìng)賽題目
- 0上海市康復(fù)治療質(zhì)量控制中心推薦病史及記錄單
- (完整word版)sppb簡(jiǎn)易體能狀況量表
- 民用航空安全信息管理規(guī)定培訓(xùn)考試
- AHRI 的標(biāo)準(zhǔn)目錄
評(píng)論
0/150
提交評(píng)論