計量經(jīng)濟學ch4_第1頁
計量經(jīng)濟學ch4_第2頁
計量經(jīng)濟學ch4_第3頁
計量經(jīng)濟學ch4_第4頁
計量經(jīng)濟學ch4_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、多元回歸分析CH414.1 從一元到多元在一元回歸分析中,只有一個自變量。隱含的前提是,影響因變量的主要因素只有一個,其它影響都是隨機性的。經(jīng)濟變量之間的關系往往涉及到多種因素和多個變量。一個經(jīng)濟變量的影響因素往往不止一個。23三變量(二元)線性回歸模型 1、回歸模型、回歸模型q教科書需求量模型:教科書需求量模型:q總體回歸方程:總體回歸方程: E(Y|X)=B1+ B2X2+ B3X3q 總體回歸方程的隨機形式:總體回歸方程的隨機形式: Yi= B1+ B2X2i+ B3X3i+uiqY(因變量)因變量)=教科書需求量,教科書需求量,qX2(自變量)自變量)=教科書價格教科書價格qX3(自變

2、量)自變量)=可支配收入可支配收入qui =隨機誤差項隨機誤差項42、偏回歸系數(shù)、偏回歸系數(shù)B2、 B3稱為偏回歸系數(shù)稱為偏回歸系數(shù)B2表示當其他條件不變時,表示當其他條件不變時, X2變動一個單位變動一個單位Y的均值的改變量;的均值的改變量;B3表示當其他條件不變時,表示當其他條件不變時,X3變動一個單位變動一個單位Y的均值的改變量的均值的改變量。4.2 例子:消費的影響因素在第2章中的消費函數(shù)是這里我們默認工資是唯一重要的影響因素如果把非工資性收入 加入模型,則消費函數(shù)為這使得我們在研究工資收入對消費的影響時,可以剝離非工資性收入的影響。反之亦然。512ConsumWageu123Cons

3、umWageE-IncomeuE-Income4.3 多元回歸模型的OLS方法第2章總體回歸函數(shù)可以推廣到多元函數(shù) (PRF) 或變量分別記為 , 用來表示恒取1 的“變量”。 每次觀察實際上是維空間的一個點6122kkYXXu122( )kkE YXX2( ,)iikiY XX2,kXX1X4.3.1 殘差平方和尋找超平面,使散點與它的縱向距離最小如果超平面記為則殘差(散點到平面的縱向距離)為殘差平方和為7122kkYXX122iiiiikkiuYYYXX21221()niikkiiSRSSYXX4.3.2 正規(guī)方程殘差平方和最小的必要條件81221112221212212()( 1)02(

4、)()0 2()()0niikkiiniikkiiiniikkikiikSYXXSYXXXSYXXX4.3.3 正規(guī)方程有唯一解的條件矩陣 的秩為 ,其中912(,)kXXXXk2131122322231 1 1 kknnknXXXXXXXXXXi.e.| 0X X 4.3.4 正規(guī)方程的解當n=3時,正規(guī)方程的解為(小寫字母:離差)10122332233232222232323222332222323()()()()()()()()()()()()()()iiiiiiiiiiiiiiiiiiiiiiYXXy xxy xx xxxx xy xxy xx xxxx x4.4 多元CLRM的假設為

5、了保證多元回歸OLS估計量具有良好的性質(zhì),并利用樣本回歸函數(shù)(SPF)推測總體回歸函數(shù)(PRF)的性質(zhì),需要對多元回歸模型做適當?shù)募僭O。這些假設與一元回歸模型是類似的。但要增加一個假設:自變量之間不存在完全共線性。114.4.1 線性假設(參數(shù)線性)假設假設1 1:因變量:因變量 與自變量與自變量 具有具有線性關系線性關系即存在形如 的方程準確地描述了變量之間的關系。 這就是總體回歸函數(shù)(PRF)?;?qū)懗?2122kkYXXu122( )kkE YXX4.4.2 自變量不是隨機變量假設假設2 2:自變量:自變量 是非是非隨機的:在重復隨機的:在重復抽樣的過程中抽樣的過程中,每個自變量每個自變量

6、 的取值的取值保持保持不變不變。該假設幫助我們理解“重復抽樣”情形下OLS估計量的分布規(guī)律,判斷OLS估計量的“優(yōu)劣”。13X (2, )jXjk4.4.3 誤差項均值為零 假設假設3 3:給定自變量:給定自變量 , 隨機誤差項隨機誤差項 的的均值為均值為0 0,即即該假設與 等價,其直觀含義是,因變量在其均值的上下“波動”,均值是“波動”的中心。142,kXX2122(|,)kkkE Y XXXXiu2(|,)0ikE uXX4.4.4 同方差假設假設假設4 4:誤差項:誤差項 的的方差相等,即方差相等,即 的的條件方差是常數(shù)條件方差是常數(shù),亦亦即即該假設的含義是,對于不同自變量,擾動項的“

7、波動幅度”是相同的,對應的因變量有相同的“波動幅度”方差。1522var( )()iiuE uiuiuiY4.4.5 誤差項無自相關 假設假設5 5:各個誤差項之間無自相關。對任意:各個誤差項之間無自相關。對任意的的 , 和和 之間之間的相關系數(shù)的相關系數(shù)為為0 0,即,即 16ijiujucov( ,)0iju u4.4.6 無完全共線性假設假設6 6:解釋變量之間不存在完全共線性,:解釋變量之間不存在完全共線性,或者說,任何一個解釋變量不能表示成其或者說,任何一個解釋變量不能表示成其他解釋變量的線性函數(shù)他解釋變量的線性函數(shù)。等價的表述是 向量組 線性無關1712(,)kXXX4.5 高斯-

8、馬爾科夫定理如果如果以上假設(以上假設(1-61-6)成立成立,則則最小二乘最小二乘(OLSOLS)估計量估計量是最優(yōu)線性無偏估計量是最優(yōu)線性無偏估計量。最最優(yōu)的含義是,在所有線性無偏的估計中,優(yōu)的含義是,在所有線性無偏的估計中,最小二乘估計量的方差最小最小二乘估計量的方差最小。滿足假設(1-6)的回歸模型稱為經(jīng)典線性回歸模型,簡稱CLRM。184.6 OLS估計量的BULE性質(zhì)假設假設1-61-6滿足時,滿足時,OLSOLS估計量是估計量是1. 1. 線性的線性的(linearlinear):因變量:因變量的線性函數(shù)。的線性函數(shù)。2. 2. 無無偏的(偏的(unbiasedunbiased)

9、:估計量的均值或):估計量的均值或數(shù)學期望等于真實的數(shù)學期望等于真實的參數(shù)參數(shù)。即即3. 3. 最優(yōu)的或有效的(最優(yōu)的或有效的(Best or Best or efficientefficient):如果存在其它線性無偏的估):如果存在其它線性無偏的估計量,其方差必定大于計量,其方差必定大于OLSOLS估計量的方差。估計量的方差。19()iiE4.7 誤差項的正態(tài)性假設為了獲得OLS估計量的分布,還需要增加如下假設 假設假設 7 7 :誤差項服從正態(tài)分布誤差項服從正態(tài)分布該假設與一元回歸模型類似,其合理性由中心極限定理來保證。202(0,)iuN4.8 OLS估計量的抽樣分布在假設1-7下,O

10、LS估計量服從正態(tài)分布該結論是假設檢驗的基礎214.9 學生t-分布 如果假設(1-7)成立,則其中 是 的估計量:后者可用誤差項的標準差 來表示,但 是未知的,用其無偏估計量( 等于參數(shù)的個數(shù))來代替,則得到 。22()iin kitse2iunk2()se2()sek2()se t-分布(df較大)接近正態(tài)分布23-6-4-2024600.050.10.150.20.250.30.350.4 T.DIST NORM.DIST4.11 假設檢驗假設檢驗的原理:在零假設下計算統(tǒng)計量,如果統(tǒng)計量“異常異?!?,則拒絕零假設。零假設就是對我們關心的參數(shù)“賦值”,這也是統(tǒng)計量計算的前提。 由樣本數(shù)據(jù)得

11、到的統(tǒng)計值是一次實驗的結果,“異常異?!笔侵冈摻Y果是“小小概率概率”事件。244.12 由SRF推斷PRF利用26個家庭(Data2-1)的數(shù)據(jù),把非工資收入 和工資收入 同時作為解釋變量,得到消費的回歸方程: 為了驗證非工資收入對消費的影響,需要檢驗總體消費函數(shù)(PRF)中 E-Income 的系數(shù) 是否為零。2521490.668 Wage0.685 E-Income se= (0.0587) (0.119)Y 3X2X3 t統(tǒng)計量的計算 如果 成立,則當前的樣本262322322 (26323)()()tsese03H :0330.6855.760.119()tse23pr.(| 2.0

12、69)0.05t4.13 選取顯著性水平選取 ,則(查表)從而 是小概率事件,拒絕零假設犯第 類錯誤的概率小于事實上,拒絕原假設 幾乎不會犯錯誤。2723pr.(| 2.069)0.05t5%| | 5.76t 5%Ipr.(| | 5.76)7.236tE0H4.14 單邊檢驗若預期 ,我們對犯第 類錯誤的概率有新的評估。作雙邊檢驗時, 是拒絕區(qū)域。作單邊檢驗時如果 , 的估計量 是絕對值較大的負數(shù),從而判斷 ,接受零假設。拒絕區(qū)域變成單尾 。犯第 類錯誤的概率修正為雙邊檢驗的一半。 如果 ,拒絕 ,犯錯概率小于或等于2.5%。本例犯錯概率小于 28| |2.069t 30I3302.069

13、t I32.069t 0H3.626E 4.15 單邊檢驗的拒絕區(qū)域29拒絕域4.15 置信區(qū)間由 得到我們有 95%的把握斷言,區(qū)間 包含 ,稱它為 的置信區(qū)間。3023pr.(| 2.069)10.95t 333pr.2.0692.0690.95()se3pr. 0.440.930.950.44,0.93334.16 擬合優(yōu)度擬合優(yōu)度用于度量樣本回歸線擬合樣本點(散點)的好壞程度擬合優(yōu)度本質(zhì)上就是在多大程度上能用自變量解釋因變量的變化或者說因變量的變動有多大“比例”來源于自變量的變動314.17 因變量變異的分解恒等式即 的總變異中能用 解釋的比例是 32()()() 1,2,iiiiii

14、YYYYYYYYuin222111()()nnniiiiiiYYYYuTSSESSRSSY/ESS TSS4.18 擬合優(yōu)度的定義 很顯然,擬合優(yōu)度為0則表明自變量對因變量沒有任何解釋力,為1時則意味著樣本回歸線通過所有的樣本點。3321ESSRSSRTSSTSS 201R4.19 校正擬合優(yōu)度增加一個自變量,擬合優(yōu)度增加。增加一個自變量損失一個自由度(正規(guī)方程多一個方程),但這種“不利影響”沒有體現(xiàn)在擬合優(yōu)度中。我們需要一個指標,它能“權衡”增加自變量的“得失”。344.20 校正擬合優(yōu)度的定義擬合優(yōu)度的本質(zhì):被自變量解釋的比例?或多大的比例是誤差導致的? 的方差分別用無偏估計量來代替: 得

15、到 35var( ), var( )1RSSTSSuYnkn221111(1)RSSnnRRnkTSSnk 2var( )1var( )uRY & uY4.21 校正擬合優(yōu)度增加的條件上式中 是自變量的個數(shù)(含常數(shù)項)增加新變量導致校正擬合優(yōu)度增加的充要條件是:新變量對應的 t 統(tǒng)計量的絕對值大于1。36k4.22 擬合優(yōu)度與校正擬合優(yōu)度 如果 分別用有用其有偏估計量代替: 就得到先前的擬合優(yōu)度: 37 & uYvar( ), var( )RSSTSSuYnn21RSSESSRTSSTSS 4.23 聯(lián)合檢驗 -檢驗主要用于檢驗某個系數(shù)的顯著性,但有時需要檢驗一組條件是否成立,這就是聯(lián)合檢驗。

16、基本思路是比較受限模型和非受限模型的擬合優(yōu)度(或殘差平方和),如果擬合優(yōu)度(殘差平方和)“變化較大”,則約束“失當”,拒絕零假設(受限模型成立)。38t4.24 瓦爾德檢驗非受限和受限模型分別為限制條件是瓦爾德檢驗的步驟:計算兩個回歸方程的殘差平方和 與 ,再構造如下統(tǒng)計量:39111(U) mmmmkkYXXXu122(R) mmYXXu012H : 0mmkURSSRRSS (4.14)據(jù)假設,分子分母均服從卡方分布,故若統(tǒng)計量異常,拒絕 ,稱 聯(lián)合顯著。針對聯(lián)合假設的檢驗稱為瓦爾德檢驗。4022222() /()/()() /()(1) /()RUcUURURSSRSSkmFRSSnkR

17、RkmRnk,ck m n kFF1,mk0H4.25 瓦爾德檢驗的直觀解釋 由(4.14)可見瓦爾德檢驗的直觀含義: 如果加上約束條件(去掉一些自變量)后,擬合優(yōu)度變化不大,說明這些變量無關緊要,是聯(lián)合不顯著的; 如果擬合優(yōu)度變化較大,則它們作為一個“集體”對被解釋變量是有影響的,是聯(lián)合顯著的。414.26 F分布的拒絕區(qū)域42012345600.10.20.30.40.50.60.70.80.91 F density function 4.15%4.15%4.15% F Distribution df=(2,10)拒絕域4.27 瓦爾德檢驗的特殊情形 時,瓦爾德檢驗就是整體顯著性檢驗,原假

18、設 變?yōu)椋核凶宰兞肯禂?shù)為零。統(tǒng)計量變?yōu)榭傮w顯著性檢驗等價于擬合優(yōu)度為零的檢驗431m 0H22/(1)/(1)/()(1) /()UUcUUESSkRkFRSSnkRnk4.28 例子:房屋價格的影響因素利用DATA4.1,考慮回歸模型(4.16)其中3個自變量分別是面積、臥室數(shù)量、浴室數(shù)量。檢驗臥室和浴室數(shù)量的聯(lián)合顯著性。 零假設是 ,上述方程和受限方程的擬合優(yōu)度分別是 與 由(4.14) 計算得到統(tǒng)計量:441234PriceSqftBedroomsBaths+u034H :020.835976UR 20.820522RR 查表:由于 ,不能拒絕零假設。 即使選擇顯著性水平 ,也不能拒絕

19、零假設: 故 是聯(lián)合不顯著的。4.22中的F分布圖有助于理解聯(lián)合檢驗。45(0.8359760.820522) / 20.471(10.835976) /(144)cF*2,102,10(0.05)4.1 i.e. Pr(4.1)5%FF*cFF10%*2,10(0.10)2.92F23 & 4.29 聯(lián)合顯著與單個系數(shù)的顯著性回歸結果是:就臥室與浴室來說,單個系數(shù)也是不顯著的,這是必然的:如果一組系數(shù)中有一個顯著,則該組系數(shù)必定是聯(lián)合顯著的。反之不然。46Price129.0620.1548 Sqft21.588 Bedrooms (4.84) (0.79) 12.193 Baths (0.

20、28) tt房屋的影響因素 去掉臥室和浴室的數(shù)量,回歸結果是結論是: 房屋價格的主要影響因素是面積4722Price52.350.1388 Sqft (7.407) 0.82, 0.81 tRR4.30 檢驗線性組合工資收入與非工資收入對消費的影響相同?這等價于(4,2)中 ? 方法1:瓦爾德檢驗 考慮兩個方程(第2個是受限模型)利用DATA2-1計算得到:48023H :12312(U) ConsWageE-Income(R) Cons(WageE-Income)uu遠遠小于 對應的臨界值4.28。實際上它對應的 值約為0.91。 故接受受限方程(零假設) :49222() /()(1) /

21、()0.8872660.887198 23 0.013910.8872661URcURRkmFRnk5%p234.31:檢驗線性組合的代換法 令 ,代入非受限方程(U): 問題變?yōu)閷?的檢驗:Wage系數(shù)不顯著,接受 5013313Cons() WageE-Income (Wage+E-Income)Wage+uu230Cons2049.20.685(Wage+E-Income)0.016Wage (5.769) (0.118)t2204.32 綜合應用:公汽需求影響因素獲得美國40個城市的橫截面數(shù)據(jù)(DATA4-2)含義如下:bustraval=城市交通公車乘車需求,單位千乘客小時fare=

22、公共車費,單位美元gasprice=汽油價格,美元/加侖income=人均收入,美元pop=人口,單位千人514.32(1) 模型設定 模型初步設定為(模型1): 我們忽略了供給的影響,但我們沒有足夠的理由直接排除其他解釋變量。521234567BusTravlFareGasprice IncomePopDensity Landarea+u4.32(2)模型1的估計結果變量系數(shù)T-統(tǒng)計值Pr.(|t|T) C C2744.682744.681.0389941.0389940.30640.3064FareFare- -238.654238.654-0.528314-0.5283140.60080

23、.6008GaspriceGasprice522.113522.1130.1964140.1964140.84550.8455IncomeIncome- -0.194740.19474-3.001294-3.0012940.00510.0051PopPop1.711441.711447.3971767.3971760.00000.0000DensityDensity0.116410.116411.9542531.9542530.05920.0592LandareaLandarea- -1.155231.15523-0.640855-0.6408550.52600.5260R-R-squared

24、squared0.921020.92102AdAdj-j- R-squared R-squared 0.90660.9066534.32(3)刪除不顯著的變量校正擬合優(yōu)度0.907對橫截面數(shù)據(jù)來說是一個很好的結果。從p 值來說,我們有比較充分的理由將Fare、Gasprice、和Landarea從模型中刪除。54BusTravl2744.68238.65Fare522.11Gasprice (0.31) (0.60) (0.85) 0.1947Income1.71Pop0.1164Density (0.005) (0.0000)pp (0.059) 1.16Landarea (0.526)p4

25、.32(4) 刪除最不顯著的變量但同時刪除多個變量可能會去除那些處于顯著邊界的變量或具有理論重要性的變量一般情況下,優(yōu)先刪除回歸系數(shù)最不顯著的變量,即p值最大的變量,但不包括常數(shù)項。在模型1中,系數(shù)最不顯著的是Gasprice,把它去掉得到如下結果(模型2)554.32(5)模型256變量系數(shù)T-統(tǒng)計值P(|t|T) C C3215.83215.82.949052.949050.00570.0057FareFare-225.65-225.65-0.51228-0.512280.61180.6118IncomeIncome-0.1957-0.1957-3.06877-3.068770.00420

26、.0042PopPop1.71681.71687.580597.580590.00000.0000DensityDensity0.11820.11822.037402.037400.04950.0495LandareaLandarea-1.1952-1.1952-0.67701-0.677010.50300.5030R-squaredR-squared0.92090.9209Adj R-squaredAdj R-squared 0.909300.909304.32(6)繼續(xù)刪除不顯著的變量刪除Gasprice之后,系數(shù)最不顯著的變量是Fare,因為它的p值最大,高達61.1%,但據(jù)經(jīng)濟理論價格

27、一般來說對需求具有重要的作用,故將車費暫時保留。先刪除其它系數(shù)不顯著的變量。Landarea的系數(shù)其 值高達50%,從模型中去掉。574.32(7)模型358變量變量系數(shù)系數(shù)T-T-統(tǒng)計值統(tǒng)計值P(|t|T) P(|t|T) C C3111.183111.182.9047492.9047490.00630.0063FareFare-295.730-295.730-0.69610-0.696100.49100.4910IncomeIncome-0.20219-0.20219-3.23182-3.231820.00270.0027PopPop1.588331.5883312.9497312.949

28、730.00000.0000DensityDensity0.149020.149024.1729254.1729250.00020.0002R-squaredR-squared 0.9198680.919868 Adj Adj R-R-squaredsquared0.910710.910714.32(8)刪除 Fare剔除掉Landarea之后,剩余變量的顯著性水平進一步提高,特別是Density的顯著性提高幅度較大。但Fare的 值仍然高達49%,這顯然不是其它變量“分擔”其影響所致。乘車是生活或工作的基本需求有必要去掉Fare594.32(9)最終模型60變量變量系數(shù)系數(shù)標準差標準差T-T

29、-統(tǒng)計值統(tǒng)計值 Pr.(|t|T) Pr.(|t|T) C C2815.702815.70976.3007976.3007 2.8840532.884053 0.00660.0066IncomeIncome-0.2012-0.20120.0621010.062101 -3.241076-3.2410760.00260.0026PopPop1.576571.576570.1206120.120612 13.0714813.07148 0.00000.0000DensityDensity0.153420.153420.0348980.034898 4.3963114.396311 0.00010.0001R-squaredR-squared0.918750.91875Adjusted R-squared Adjusted R-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論