計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型教學(xué)文案_第1頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型教學(xué)文案_第2頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型教學(xué)文案_第3頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型教學(xué)文案_第4頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型教學(xué)文案_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)量經(jīng)濟(jì)學(xué)-2一元線性回歸模型例如,例如, 函數(shù)關(guān)系:函數(shù)關(guān)系:2,半徑半徑圓面積f施肥量陽(yáng)光降雨量氣溫農(nóng)作物產(chǎn)量,f統(tǒng)計(jì)依賴關(guān)系統(tǒng)計(jì)依賴關(guān)系/統(tǒng)計(jì)相關(guān)關(guān)系:統(tǒng)計(jì)相關(guān)關(guān)系:對(duì)變量間對(duì)變量間統(tǒng)計(jì)依賴關(guān)系統(tǒng)計(jì)依賴關(guān)系的考察主要是通過的考察主要是通過相關(guān)分析相關(guān)分析(correlation analysis)或或回歸分析回歸分析(regression analysis)來(lái)完成的:來(lái)完成的:相關(guān)系數(shù):相關(guān)系數(shù):統(tǒng)計(jì)依賴關(guān)系統(tǒng)計(jì)依賴關(guān)系 回歸分析回歸分析正相關(guān)正相關(guān)相關(guān)分析相關(guān)分析 不相關(guān)不相關(guān)負(fù)相關(guān)負(fù)相關(guān)正相關(guān)正相關(guān)線性相關(guān)線性相關(guān)不相關(guān)不相關(guān)負(fù)相關(guān)負(fù)相關(guān)有因果關(guān)系有因果關(guān)系無(wú)因果關(guān)系無(wú)因果關(guān)系非線性

2、相關(guān)非線性相關(guān)11XY 不線性相關(guān)并不意味著不相關(guān); 有相關(guān)關(guān)系并不意味著一定有因果關(guān)系; 回歸分析回歸分析/相關(guān)分析相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。 相關(guān)分析相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析回歸分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。注意:注意: 分析被解釋變量與解釋變量之間的統(tǒng)計(jì)依賴關(guān)系,目的在分析被解釋變量與解釋變量之間的統(tǒng)計(jì)依賴關(guān)系,目的在于通過后者的已知或設(shè)定值去估計(jì)或預(yù)測(cè)前者的均值。于通過后者的已知或設(shè)定值去估計(jì)或預(yù)測(cè)前者的

3、均值。 例,假定一個(gè)地區(qū)的所有家庭的收入(例,假定一個(gè)地區(qū)的所有家庭的收入(X)和消費(fèi)支出()和消費(fèi)支出(Y)統(tǒng)計(jì)如下,希望知道家庭消費(fèi)支出與家庭收入之間的關(guān)系:統(tǒng)計(jì)如下,希望知道家庭消費(fèi)支出與家庭收入之間的關(guān)系:Y=F(X)。)。 XY8010012014016018020022024026055657980102110120135137150607084931071151361371451526574909511012014014015517570809410311613014415216517875859810811813514515717518088113125140160189185

4、115162191戶數(shù)戶數(shù)5657665767總支出總支出32546244570767875068510439661211平均平均支出支出657789101113125137149161173YX55120 160200 24080 根據(jù)每個(gè)家庭的收入和支根據(jù)每個(gè)家庭的收入和支出繪出散點(diǎn)圖,大致可看出二出繪出散點(diǎn)圖,大致可看出二者間的關(guān)系:在統(tǒng)計(jì)意義上,者間的關(guān)系:在統(tǒng)計(jì)意義上,二者成正比。二者成正比。 由對(duì)全體居民的收入和支出的調(diào)查結(jié)果,我們知道處于不同收入階層由對(duì)全體居民的收入和支出的調(diào)查結(jié)果,我們知道處于不同收入階層的居民有一個(gè)平均的支出水平,這一支出水平與收入大致呈線性關(guān)系。的居民有一

5、個(gè)平均的支出水平,這一支出水平與收入大致呈線性關(guān)系。 圖中的這條通過各收入階圖中的這條通過各收入階層平均支出額的直線,描述了層平均支出額的直線,描述了這一依賴關(guān)系。我們把這條線這一依賴關(guān)系。我們把這條線稱為回歸直線。稱為回歸直線。二、回歸模型二、回歸模型 總體回歸模型:總體回歸模型: 樣本回歸模型:樣本回歸模型: iiiuXY10iiiiieXeYY10總體回歸模型總體回歸模型YX55120 160200 24080樣本回歸模型樣本回歸模型1、幾個(gè)概念、幾個(gè)概念條件分布條件分布(Conditional distribution):以以X取定值為條件的取定值為條件的Y的條件分布。的條件分布。條件

6、概率條件概率(Conditional probability):給定給定X的的Y的概率,記為的概率,記為P(Y|X)。例如,例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。條件期望(條件期望(conditional Expectation):給定):給定X的的Y的期望值,記為的期望值,記為E(Y|X)。例如,例如,E(Y|X=80)=551/5601/5651/5701/5751/565總體回歸曲線(總體回歸曲線(Popular Regression Curve)(總體回歸曲線的幾何意)(總體回歸曲線的幾何意義):當(dāng)解釋變量給定值時(shí)因變量的條件期望值的軌跡。義):

7、當(dāng)解釋變量給定值時(shí)因變量的條件期望值的軌跡。2、總體回歸函數(shù)(、總體回歸函數(shù)( Popular Regression Function,PRF)E(Y|Xi)=f(Xi)當(dāng)當(dāng)PRF的函數(shù)形式為線性函數(shù),則有,的函數(shù)形式為線性函數(shù),則有,E(Y|Xi)= 0+ 1Xi其中其中 0和和 1為未知而固定的參數(shù),稱為回歸系數(shù)。為未知而固定的參數(shù),稱為回歸系數(shù)。 0和和 1也分別稱為截也分別稱為截距和斜率系數(shù)。上述方程也稱為線性總體回歸函數(shù)。距和斜率系數(shù)。上述方程也稱為線性總體回歸函數(shù)。3、“線性線性”的含義的含義 “線性線性”可作兩種解釋:對(duì)變量為線性,對(duì)參數(shù)為線性。一般可作兩種解釋:對(duì)變量為線性,對(duì)

8、參數(shù)為線性。一般“線性回線性回歸歸”一詞總是指對(duì)參數(shù)一詞總是指對(duì)參數(shù) 為線性的一種回歸(即參數(shù)只以它的為線性的一種回歸(即參數(shù)只以它的1次方出次方出現(xiàn))?,F(xiàn))。 4、PRF的隨機(jī)設(shè)定的隨機(jī)設(shè)定 將個(gè)別的將個(gè)別的Yi圍繞其期望值的離差圍繞其期望值的離差(Deviation)表述如下:表述如下: ui=Yi-E(Y|Xi) 或或 Yi=E(Y|Xi)+ui其中其中ui為隨機(jī)誤差項(xiàng)(為隨機(jī)誤差項(xiàng)(Stochastic error)或隨機(jī)干擾項(xiàng)()或隨機(jī)干擾項(xiàng)(Stochastic disturbance)。線性總體回歸函數(shù):)。線性總體回歸函數(shù): PRF:Yi= 0 0+ 1 1Xi+ui=E(Y|

9、Xi)+ui5、隨機(jī)擾動(dòng)項(xiàng)的意義、隨機(jī)擾動(dòng)項(xiàng)的意義 隨機(jī)擾動(dòng)項(xiàng)是從模型中省略下來(lái)的而又集體地影響著隨機(jī)擾動(dòng)項(xiàng)是從模型中省略下來(lái)的而又集體地影響著Y的全部變量的的全部變量的替代物。顯然的問題是:為什么不把這些變量明顯地引進(jìn)到模型中來(lái),而替代物。顯然的問題是:為什么不把這些變量明顯地引進(jìn)到模型中來(lái),而以隨即擾動(dòng)項(xiàng)來(lái)替代?理由是多方面的:以隨即擾動(dòng)項(xiàng)來(lái)替代?理由是多方面的:(1)理論的含糊性:理論不能完全說明影響因變量的所有影響因素。)理論的含糊性:理論不能完全說明影響因變量的所有影響因素。(2)數(shù)據(jù)的欠缺:無(wú)法獲得有關(guān)數(shù)據(jù)。)數(shù)據(jù)的欠缺:無(wú)法獲得有關(guān)數(shù)據(jù)。(3)主要變量與次要變量:希望能找到與有較

10、大影響的核心變量的關(guān)系。)主要變量與次要變量:希望能找到與有較大影響的核心變量的關(guān)系。(4)內(nèi)在隨機(jī)性:因變量具有內(nèi)在的隨機(jī)性。)內(nèi)在隨機(jī)性:因變量具有內(nèi)在的隨機(jī)性。(5)替代變量差異:替代變量和被替代變量之間總是存在一定的差異。)替代變量差異:替代變量和被替代變量之間總是存在一定的差異。(6)簡(jiǎn)化原則:研究中盡可能使回歸式簡(jiǎn)單。)簡(jiǎn)化原則:研究中盡可能使回歸式簡(jiǎn)單。6、樣本回歸函數(shù)(、樣本回歸函數(shù)(SRF,Sample RegressionFunction) 由于在大多數(shù)情況下,我們不可能得到由于在大多數(shù)情況下,我們不可能得到X、Y的所有可能的數(shù)值,只的所有可能的數(shù)值,只能用抽樣的方法,取得

11、能用抽樣的方法,取得X、Y的樣本觀測(cè)值,用樣本回歸方程的樣本觀測(cè)值,用樣本回歸方程SRF去擬合去擬合總體回歸方程總體回歸方程PRF。 X(收入)(收入)80100120140160180200220240260Y(支出)(支出)55657980102110120135137150樣本樣本1 X(收入)(收入)80100120140160180200220240260Y(支出)(支出)708094103116130144152165178樣本樣本201iiYX樣本回歸函數(shù)樣本回歸函數(shù)SRF: 在回歸分析中,我們用在回歸分析中,我們用SRF估計(jì)估計(jì)PRF。的估計(jì)量為的估計(jì)量為的估計(jì)量為其中1100

12、,Xi)|E(YY,(一)基本假定(一)基本假定1、零均值。隨機(jī)擾動(dòng)項(xiàng)、零均值。隨機(jī)擾動(dòng)項(xiàng)ui的均值為零。即,的均值為零。即,E(ui|Xi)=02、同方差。隨機(jī)擾動(dòng)項(xiàng)、同方差。隨機(jī)擾動(dòng)項(xiàng)ui的方差相等。即的方差相等。即 Var(ui|Xi)=E(ui-E(ui)|Xi2 =E(ui2|Xi2 = 23、無(wú)自相關(guān)。各個(gè)擾動(dòng)項(xiàng)無(wú)自相關(guān)。即:、無(wú)自相關(guān)。各個(gè)擾動(dòng)項(xiàng)無(wú)自相關(guān)。即:三、參數(shù)的最小二乘估計(jì)三、參數(shù)的最小二乘估計(jì)(Least Squares Estimation ,LSE)iiiuXY10考慮回歸模型:考慮回歸模型:其中其中ui是除了是除了X以外的其它若干因素。以外的其它若干因素。ji 0

13、 )(),(jijjiijiuuEEuuEuuEuuCov4、隨機(jī)擾動(dòng)項(xiàng)、隨機(jī)擾動(dòng)項(xiàng)ui解釋變量解釋變量Xi不相關(guān)。即不相關(guān)。即Cov(ui,Xi)=Eui-EuiXi-EXi=0 i=1,2,n(二)普通最小二乘估計(jì)(二)普通最小二乘估計(jì)(Ordinary Least Squares,OLS) 基本思路:用樣本回歸函數(shù)估計(jì)總體回歸函數(shù)。以基本思路:用樣本回歸函數(shù)估計(jì)總體回歸函數(shù)。以01:iiiiiSRF YYeXeiiiuXYPRF10:估計(jì)估計(jì)iiiiieYeXY10)(10iiiiiXYYYe殘差估計(jì)出的參數(shù)估計(jì)出的參數(shù)10和使殘差的平方和最小使殘差的平方和最小。210221010)(

14、)(),(:,iiiiiXYYYeMinQ要求和即尋找真實(shí)值真實(shí)值5、ui服從正態(tài)分布,即服從正態(tài)分布,即uiN(0,2),),i=1,2,n求解這一最小化問題,根據(jù)最大化的一階條件:求解這一最小化問題,根據(jù)最大化的一階條件:201002011101201122220()2()( 1)0()2()()0()()()iiiiiiiiiiii ii iiiiiiiieQYXeQYXXnXYXXXYXYnXYXX YYx yXnXXXx整理得:()()()解得:1ii 11, Y , yniiiiYXXXYxXXYYn其中例例1,已知某商品的需求量,已知某商品的需求量Y(萬(wàn)噸)隨價(jià)格(萬(wàn)噸)隨價(jià)格X

15、(元)變化的統(tǒng)計(jì)資料如(元)變化的統(tǒng)計(jì)資料如下,求需求量下,求需求量Y隨價(jià)格隨價(jià)格X變化的回歸方程。變化的回歸方程。年份年份 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 需求量需求量 100 75 80 70 50 65 90 100 110 65價(jià)格價(jià)格 5 7 6 6 8 7 5 4 3 9.5 . 9,5 . 95 .137:5 .1376)5 . 9(5 .805 . 96103905 .8061045454545)9657755100(3909675X 5 .8010805658075100101Y 610609675101 0

16、2122222i10萬(wàn)噸需求量將平均下降表明價(jià)格每增加一元所求的回歸模型為)()()(解:設(shè)定模型iiiiiiXYYXXuXY幾個(gè)常用結(jié)果:幾個(gè)常用結(jié)果: 0111101111(1)(2)Y () ()n iiiiiiiiiXYYXYXXYYXXXYYYXYXXYXXY樣本回歸直線經(jīng)過點(diǎn)( , )。亦即:()故樣本回歸直線經(jīng)過點(diǎn)( , )的均值等于實(shí)測(cè)的 的均值:兩邊求和,并同除 ,得Y001i01001(3) 20 e0(4) 2(-)0 iiiiiiiiiieYXYXeXYXX殘差 的均值為零。由求的第一式:()()與不相關(guān)。由求的第二式:()01i e0iiiiYX XX()(三)最小二

17、乘估計(jì)(三)最小二乘估計(jì)OLS的性質(zhì)(高斯的性質(zhì)(高斯- 馬爾柯夫定理)馬爾柯夫定理) 在所有線性無(wú)偏估計(jì)量中,在所有線性無(wú)偏估計(jì)量中,OLS估計(jì)量有最小方差,即估計(jì)量有最小方差,即OLS是是BLUE(Best Linear Unbiased Estimator)。)。(1)線性性)線性性 :10和為為Yi的線性函數(shù)的線性函數(shù)122222222222201()()11, 0 ,11111 ()iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiix yx YYxYcYxxxxccxc xxxxxcxxxYYXYXcYXcYnXc Yd YdXcnn其中且. 其中,(2)無(wú)偏性

18、)無(wú)偏性:最小二乘估計(jì):最小二乘估計(jì) 10和的數(shù)學(xué)期望值分別等于總體回的數(shù)學(xué)期望值分別等于總體回10,歸系數(shù)的值歸系數(shù)的值1100EE,即,01100110110111110101)(1E )(1)(1 )()( )(iiiiiiiiiiiiiiiiiiiiiXXnnXuXnXYnXYuEcEucucXccuXcYc(3)最小方差性:)最小方差性:最小。和)()(10VarVar在所有線性無(wú)偏估計(jì)量中,具有最小方差。即在所有線性無(wú)偏估計(jì)量中,具有最小方差。即10和)()(),()(則:的任一線性無(wú)偏估計(jì)和分別是設(shè)00110101Var VarVarVarYwYkiiii222222222222

19、22222202222222222110 1 21 11 iiiiiiiiiiiiiiiiiiiixnXxnXnXXxXncXcXnncXndYdVarVarxxxccYVarcYcVarVar)()()()()()()()()(的方差,先計(jì)算OLS估計(jì)量估計(jì)量01i222222222 c1 iiii iiiii iiiiiiiiiiCovCovdYYd cCov YYxd cXcnxxX xxXnxxxx ( , )(,)( , )()()()()()()()()()()()(證:11222222222222222221 22 2 Var VarVarckcckcckcckcckcckcck

20、kYVarkYkVariiiiiiiiiiiiiiiiiiiiiiiii)()(同理可證:)(因而有:)()(因?yàn)橄伦C:0022222iii1101012iVarVar 1 k 1k 0k E k iiiiiiiiiiiiiiiiiiiiiiicxxXkxXXkxxkcXXkkuXkEYkEcc(四)最小二乘估計(jì)的方差(四)最小二乘估計(jì)的方差2221100221 iiiXNNxnx( ,)( ,) 1 NY 1 2 2 2Var E Y 222102222222222222222221021010102110)(,(即:)()(),()()()()()()()(且的線性組合,也是)(,對(duì)固定的

21、iiiiiiiiiinxXXnXxXXnxXXxXxnXxxXXxXxnXXCovXVarVarYYEXXEEYYYYXXX222222 22iiieYYSEnn一般是未知的,的無(wú)偏估計(jì)量為:()010111111111, ()()()()()()iiiiiiiiiiiiiiiiiYXuYXuuunYYXXuueYYYYXXXXuuXXuuXX證明:與其中,兩式相減有:2211221122222222221111()2()()() ()()(1)()(2)21 ()21 ( -1)(2)()(iiiiiiiiiijjkijjkiieuuXXuuXXEuuEuuuuE uuuu unnnnn n

22、nnncuEX 由于)()iiXuu222211212222()()()() )()(3) ()() )()()jjiijijjiijjijijijjjiiiiiiEc uXXuuEc uXX uEc uXX ucXXEXXXXVarxx2222222222()(1)-2( -2)(2) ()()22iiEennEenEE SEnnSE因此,稱為殘差標(biāo)準(zhǔn)差。四、模型檢驗(yàn)四、模型檢驗(yàn) (一)經(jīng)濟(jì)意義檢驗(yàn)(一)經(jīng)濟(jì)意義檢驗(yàn) 檢驗(yàn)所建的模型的是否符合經(jīng)濟(jì)理論,主要是檢驗(yàn)?zāi)P蛥?shù)的符號(hào)和檢驗(yàn)所建的模型的是否符合經(jīng)濟(jì)理論,主要是檢驗(yàn)?zāi)P蛥?shù)的符號(hào)和大小是否與經(jīng)濟(jì)理論以及人們的經(jīng)驗(yàn)一致。大小是否與經(jīng)濟(jì)理論

23、以及人們的經(jīng)驗(yàn)一致。 (二)統(tǒng)計(jì)檢驗(yàn)(二)統(tǒng)計(jì)檢驗(yàn) 1、擬合優(yōu)度檢驗(yàn)(判定系數(shù)檢驗(yàn))、擬合優(yōu)度檢驗(yàn)(判定系數(shù)檢驗(yàn)) 擬合優(yōu)度檢驗(yàn)是指對(duì)樣本回歸線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。擬合優(yōu)度檢驗(yàn)是指對(duì)樣本回歸線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。度量擬合程度的指標(biāo)是判定系數(shù)度量擬合程度的指標(biāo)是判定系數(shù)R2 。 基本思路:因變量基本思路:因變量Y的總變異,能夠被的總變異,能夠被X的變異解釋的比例越大,的變異解釋的比例越大,則說明則說明OLS回歸線對(duì)總體的解釋程度越好,反之就越差?;貧w線對(duì)總體的解釋程度越好,反之就越差。 總的離差平方和的分解:總的離差平方和的分解: 總平方和(總平方和(TSS):說明實(shí)際的

24、):說明實(shí)際的Y值圍繞其均值的總變異值圍繞其均值的總變異2222()iiiTSSyYYYnYESSRSSYYYYYYYYYYYYYYYYyYYTSSiiiiiiiiiiiiii )()( )(2)()( )()(2222222PRFiYiY Xi X SRFYY2)(YYTSSi總離差:2)(殘差和:iiYYRSS2)(YYESSi回歸和:RSSESSTSS估計(jì)的估計(jì)的Y值圍繞其均值的總變異值圍繞其均值的總變異 未被解釋的未被解釋的Y值圍繞回歸線的值圍繞回歸線的Y值的變異值的變異 2212)(iixYYESS0101001101 ()()()() () ()0iiiiiiiiiiiiiiiiY

25、Y YYYYXYYYYYY XYYXYX X交叉項(xiàng)()()()()22)(iiiYYeRSS R2 測(cè)度了在測(cè)度了在Y的總變異中,由回歸模型解釋的部分所占的比例。的總變異中,由回歸模型解釋的部分所占的比例。 R2 越越高,回歸模型擬合的程度就越好。高,回歸模型擬合的程度就越好。 R2 的性質(zhì):的性質(zhì): (1)非負(fù)。()非負(fù)。(2)0R2 1其它表達(dá)方式:其它表達(dá)方式:22212iixRy2222)(iiiiyxyxR定義擬合優(yōu)度定義擬合優(yōu)度R2:222()1()iiYYESSRSSRTSSYYTSS例例2:對(duì)例:對(duì)例1進(jìn)行擬合優(yōu)度檢驗(yàn),并說明其意義。進(jìn)行擬合優(yōu)度檢驗(yàn),并說明其意義。222222

26、21222221 TSS 68075-10 80.53272.5 ESS 9.5390 10 6 2707.5 RSSTSS-ESS565 iiiiiYYYnYYYXXXnX 解:()()()()() ()22707.5 R0.82733272.5 ,82.73%, 17.27%. .ESSTSS說明該商品需求量的總離差平方和中有可用商品價(jià)格的變化來(lái)解釋 另是非價(jià)格因素變化引起的 這表明回歸直線方程與樣本觀測(cè)值是擬合得較好的2、相關(guān)系數(shù)檢驗(yàn)、相關(guān)系數(shù)檢驗(yàn) 相關(guān)系數(shù):表示兩個(gè)隨機(jī)變量之間的相關(guān)程度。定義為:相關(guān)系數(shù):表示兩個(gè)隨機(jī)變量之間的相關(guān)程度。定義為:22221)(1)(1)(iiiiiii

27、iYXXYXYyxyxnYYnXXnYYXXSSSr以樣本方差和樣本協(xié)方差估計(jì)以樣本方差和樣本協(xié)方差估計(jì)X、Y的方差和協(xié)方差,樣本相關(guān)系數(shù)為的方差和協(xié)方差,樣本相關(guān)系數(shù)為: 樣本相關(guān)系數(shù)的平方與擬合優(yōu)度相等,但二者的意義不同。樣本相關(guān)系數(shù)的平方與擬合優(yōu)度相等,但二者的意義不同。(擬合優(yōu)度是回歸分析中提出的,而相關(guān)系數(shù)是相關(guān)分析中提出的。)(擬合優(yōu)度是回歸分析中提出的,而相關(guān)系數(shù)是相關(guān)分析中提出的。)YXXYXYYVarXVarYXCov)()(),(22RrXY相關(guān)系數(shù)檢驗(yàn)的步驟:相關(guān)系數(shù)檢驗(yàn)的步驟:例例3,對(duì)例,對(duì)例1進(jìn)行相關(guān)系數(shù)檢驗(yàn)。進(jìn)行相關(guān)系數(shù)檢驗(yàn)。無(wú)明顯的線性關(guān)系。與,則認(rèn)為若有明顯的

28、線性關(guān)系。與,則認(rèn)為,若和比較);(得臨界值的相關(guān)系數(shù)表,查自由度為給定顯著水平;的觀測(cè)值根據(jù)樣本值計(jì)算XYXYnnr|r | r|r |rr2r2rr*XY*XY*XYXY*XYXY )(XY 0.632,0.9096 ,632. 08r85% 9096. 0)5 .801068075)(610390(5 .806104545 r 0502222*XY。負(fù)相關(guān)顯的線性相關(guān)關(guān)系之間有明與價(jià)格需求量)(值的相關(guān)系數(shù)表,得臨界,查自由度為給定)()(解:。YYXXYXnYXiiii3、F檢驗(yàn)(總體回歸方程顯著性檢驗(yàn))檢驗(yàn)(總體回歸方程顯著性檢驗(yàn)),(相互獨(dú)立,則。,),(),(若)(相互獨(dú)立,則,

29、),(),(若)。(),則,(正態(tài)分布,準(zhǔn)相互獨(dú)立,且均服從標(biāo),若隨機(jī)變量mnFmXXXmXnXntnXXtXXnXNXnXXXXNXininXF 1 01 0XXX21212221212122122222212n21三大分布:三大分布:Ft、2t: 標(biāo)準(zhǔn)正態(tài)除以卡方開方的分布(注意自由度)標(biāo)準(zhǔn)正態(tài)除以卡方開方的分布(注意自由度)F: 兩個(gè)獨(dú)立的卡方變量之商的分布(注意自由度)兩個(gè)獨(dú)立的卡方變量之商的分布(注意自由度)2:若干個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)平方和的分布:若干個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)平方和的分布),()()(),(),(21221F 21122222222nFnRSSESSnRSSESSnRSSESS

30、nTSSF檢驗(yàn)的步驟:檢驗(yàn)的步驟:0111*00FF 1212()() HHnFFnFFFF or pFF or p提出原假設(shè):,備選假設(shè) :;根據(jù)樣本值計(jì)算 統(tǒng)計(jì)量的觀測(cè)值 ; 給定顯著水平 ,查第一自由度為,第二自由度為的 分布表,得臨界值 (,);比較和 ,若 ,則認(rèn)為回歸方程顯著成立。若 ,則認(rèn)為回歸方程不顯著成立。方差分析表離差平方和平方和SS自由度DF均方差MS F值 F臨界值 顯著性ESS1ESS/1 * * /RSSn-2RSS/n-2TSSn-1方差分析(方差分析(analysis of variance, ANOVA) 表表思路:若思路:若ESS / RSS 比較大,則比較

31、大,則X對(duì)對(duì)Y的解釋程度就比較高,的解釋程度就比較高,可以推測(cè)總體存在線性關(guān)系。可以推測(cè)總體存在線性關(guān)系。擬合優(yōu)度擬合優(yōu)度R2與與F檢驗(yàn)具有一致性:檢驗(yàn)具有一致性:2)(YYESSi2)(iiYYRSS2)(YYTSSi)2( nRSSESSFFRFRnRRnTSSRSSTSSESSnRSSESSF10021222222)()()(例例4,對(duì)例,對(duì)例1進(jìn)行進(jìn)行F檢驗(yàn)檢驗(yàn)解:解: TSS=3272.5 ESS=2707.5 RSS=565 F*=(2707.58)/565=38.33 38.33F0.05(1, 8)=5.32 因此因此,回歸方程顯著成立回歸方程顯著成立. 方差分析表方差分析表:

32、Analysis of VarianceAnalysis of Variance SOURCE DF SS MS F p SOURCE DF SS MS F p Regression 1 2707.5 2707.5 38.34 0.000 Regression 1 2707.5 2707.5 38.34 0.000 Error 8 565.0 70.6 Error 8 565.0 70.6 Total 9 3272.5 Total 9 3272.5四、四、t檢驗(yàn)(參數(shù)顯著性檢驗(yàn))檢驗(yàn)(參數(shù)顯著性檢驗(yàn)),(),()()(222002211222222n 1 22iiiixXNxNnSEnRSSe

33、)(同理:)()(),(),(則:2 t21221t1 0 1 01 2200211222112200211ntxnXSEntxSEnSEnxNxnXNxiiiiiiiT檢驗(yàn)的步驟:檢驗(yàn)的步驟:0111102*2*22*200 t21SE2 |t |() |() iHHHt nxttntttttor pXYttor pXY提出原假設(shè):,備選假設(shè):;若成立,則:()由樣本值計(jì)算統(tǒng)計(jì)量 的觀測(cè)值 ;給定顯著水平 ,查自由度為的 分布表,的臨界值 ;比較 和 :若 ,則認(rèn)為 對(duì) 有顯著影響;若 ,則認(rèn)為 對(duì) 無(wú)顯0 著影響。同理可檢驗(yàn)參數(shù)。例例5,對(duì)例,對(duì)例1進(jìn)行進(jìn)行t檢驗(yàn)。檢驗(yàn)。4 . 8625.

34、7085652nRSSSE.Y 14.35 )360390(103904 . 85 .137SE t |t |,306. 2%52 . 6)360390(14 . 85 . 91SE t220*02*221*1也有顯著的影響說明常數(shù)項(xiàng)對(duì)需求量同理,有顯著影響;對(duì)需求量,所以認(rèn)為價(jià)格因?yàn)?,iiixnXYXttx38.33F 8273. 0R (-6.2) (14.35) 5 . 95 .137Y 2iiX最終結(jié)果:五、預(yù)測(cè)(五、預(yù)測(cè)(Prediction Forecast)(一)點(diǎn)預(yù)測(cè)(一)點(diǎn)預(yù)測(cè)0100010Y XXXXYiii時(shí),當(dāng)點(diǎn)預(yù)測(cè)的兩種解釋:點(diǎn)預(yù)測(cè)的兩種解釋:)()(另一方面:)()

35、()(因?yàn)椋旱墓烙?jì)。作為總體個(gè)別值把)的估計(jì);(的均值作為把0010000100000100100000000E |E |YEXYuXYXYEXXEYYYXYEYYYX12區(qū)間估計(jì):為了判斷點(diǎn)估計(jì)與真值的接近程度,可以通過構(gòu)造以估計(jì)值為區(qū)間估計(jì):為了判斷點(diǎn)估計(jì)與真值的接近程度,可以通過構(gòu)造以估計(jì)值為中心的一個(gè)區(qū)間(隨機(jī)的),以該區(qū)間包括了真值的概率來(lái)確定估計(jì)值接中心的一個(gè)區(qū)間(隨機(jī)的),以該區(qū)間包括了真值的概率來(lái)確定估計(jì)值接近真值的把握程度:近真值的把握程度:1)(111P1111,;101;, 稱為置信區(qū)間)稱為置信系數(shù)( ( , )稱為顯著水平分別為置信下限和置信上限(二)區(qū)間預(yù)測(cè)(二)區(qū)

36、間預(yù)測(cè)(Interval Estimation) 1、總體均值、總體均值E(Y0|X0)的區(qū)間預(yù)測(cè))的區(qū)間預(yù)測(cè)001000200010012222200222E|2 2iiiiYXE YXVar YVarCovXX VarXXXXnxxx( )()( )( )(,)( )22222002222202 21 niiiiixXXXXnxxxXXx()()220000200020222221|0 11RSS22iiXXYN E YXnxYE YXUNXXnxnSEn()(),)()( , )()()()00020200022022200022202|1|2212|11iiiYE YXXXnxYE Y

37、Xtt nnSEXXnSEnxttYE YXPttXXSEnx()()()()()()給定,查 分布表,得臨界值,有()()()22000000222211 P| 1iiXXXXYSE tE Y XYSE tnxnx 即:()()()002200002222|11 iiE YXXXXXYSE tYSE tnxnx所以總體均值()的區(qū)間預(yù)測(cè)為:()()(,)2、總體個(gè)別值、總體個(gè)別值Y0的區(qū)間預(yù)測(cè)的區(qū)間預(yù)測(cè)00100010000100000001100000002000110022001100, Y E0,2 YXXuYXE YMYYXuE ME YYY YVar MVarXuEXEuE( )(

38、 )令:()()() ()均服從正態(tài)分布,且()()()()()(00110020X uVar Y)()( )20200022222002020022022110 111221122121iiiiXXnxYYNXXnxRSSnSEnYYXXnxYYtt nnSEXXnSEnx()( , )()()()()()()()-t/2t/2o/2/200222202220000022220220000222211111 P1 11111 1iiiiiYYttPttXXSEnxXXXXYSE tYYSE tnxnxYXXXXYSE tYSE tnxnx 給 定 , 查分 布 表 , 得 臨 界 值 , 有

39、()()()()即 :()所 以 總 體 個(gè) 別 值 的 區(qū) 間 預(yù) 測(cè) 為 :()()(, )例例6,在例,在例1中,若中,若X0=10,求,求Y0及及E(Y0|X0)的預(yù)測(cè)值和)的預(yù)測(cè)值和預(yù)測(cè)區(qū)間預(yù)測(cè)區(qū)間)(5 .42105 . 95 .1370萬(wàn)噸Y002i0.052220000222222|8.4, X 6, x30, t(8)2.30611: 1(10 6)1(10 6)42.5 8.4 2.306, 42.5 8.4 2.3061030103027.1, 57.9iiE Y XSEXXXXYSE tYSE tnxnx總體均值()的區(qū)間預(yù)測(cè)()()預(yù)測(cè)區(qū)間為(,)總022000022

40、2222:111 11(10 6)1(10 6)42.5 8.4 2.3061, 42.5 8.4 2.30611030103017.7, 67.3iiYXXXXYSE tYSE tnxnx體個(gè)別值 的區(qū)間預(yù)測(cè)()()(,) 六、案例分析六、案例分析小結(jié):一元線性回歸分析的主要步驟小結(jié):一元線性回歸分析的主要步驟1、建立回歸模型、建立回歸模型 研究某一經(jīng)濟(jì)現(xiàn)象,先根據(jù)經(jīng)濟(jì)理論,選擇具有因果關(guān)系的兩個(gè)變量研究某一經(jīng)濟(jì)現(xiàn)象,先根據(jù)經(jīng)濟(jì)理論,選擇具有因果關(guān)系的兩個(gè)變量(Y,X),建立線性回歸模型,確定解釋變量和被解釋變量。,建立線性回歸模型,確定解釋變量和被解釋變量。 如果不明確如果不明確兩個(gè)變量是否為線性關(guān)系,也可以根據(jù)散點(diǎn)圖來(lái)分析。兩個(gè)變量是否為線性關(guān)系,也可以根據(jù)散點(diǎn)圖來(lái)分析。 建立回歸模型可以是根據(jù)經(jīng)濟(jì)理論,也可以根據(jù)相同或相似經(jīng)濟(jì)現(xiàn)象建立回歸模型可以是根據(jù)經(jīng)濟(jì)理論,也可以根據(jù)相同或相似經(jīng)濟(jì)現(xiàn)象的歷史分析經(jīng)驗(yàn)來(lái)建立回歸模型。的歷史分析經(jīng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論