![第二章簡單線性回歸模型_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/27/bac2d1be-8c34-44db-9ab7-91dda343469e/bac2d1be-8c34-44db-9ab7-91dda343469e1.gif)
![第二章簡單線性回歸模型_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/27/bac2d1be-8c34-44db-9ab7-91dda343469e/bac2d1be-8c34-44db-9ab7-91dda343469e2.gif)
![第二章簡單線性回歸模型_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/27/bac2d1be-8c34-44db-9ab7-91dda343469e/bac2d1be-8c34-44db-9ab7-91dda343469e3.gif)
![第二章簡單線性回歸模型_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/27/bac2d1be-8c34-44db-9ab7-91dda343469e/bac2d1be-8c34-44db-9ab7-91dda343469e4.gif)
![第二章簡單線性回歸模型_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/27/bac2d1be-8c34-44db-9ab7-91dda343469e/bac2d1be-8c34-44db-9ab7-91dda343469e5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、y%r量經(jīng)濟學(xué)三第二章簡單線J性回歸模型曲慚:中國嵌游業(yè)總收入將越過3000億美元嗎?未來我國旅游需求將快速增長,根據(jù)中國政府所制定的遠景目標(biāo),到2020年,中國入境旅游人數(shù)將達到2.1億人次;國際旅游外匯收入580億美元,國內(nèi)旅游收入2500億 美元。到2020年,中國旅游業(yè)總收入將超過3000億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%至11%。(來源:2008年中國旅行社發(fā)展研究咨詢報告)(參考現(xiàn)狀:第一產(chǎn)業(yè)占GDP的15%,建筑業(yè)占GDP的7%)什么決定性因素能使中國旅游業(yè)總收入超過3000億美元?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?
2、嚴(yán)需要研黑經(jīng)濟變量之間數(shù)量關(guān)糸的方法顯然,對旅游起決定性影響作用的是“中國居民的收 入水平”以及“入境旅游人數(shù)”等因素?!奥糜螛I(yè)總收入”(Y)與“居民平均收入”(XI)或者“入境旅游人數(shù)” (X2)有怎樣的數(shù)量關(guān)系呢?能否用某種線性或非線性關(guān)系式Y(jié)=f(X)去表現(xiàn)這 種數(shù)量關(guān)系呢?具體該怎樣去表現(xiàn)和計量呢?為了不使問題復(fù)雜化,我們先在某些標(biāo)準(zhǔn)的(古典的) 假定條件下,用最簡單的模型,對最簡單的變量間數(shù) 量關(guān)系加以討論第一*節(jié) 回歸分析與回歸因教柏關(guān)分析與回歸分析(對統(tǒng)計學(xué)的回顧)1經(jīng)濟變量之間的相互關(guān)糸性質(zhì)上可能有三種情況:確定性的函數(shù)關(guān)系 Y=f (X)可用數(shù)學(xué)方法計算不確定的統(tǒng)計關(guān)系一相關(guān)
3、關(guān)系Y=f (X) +£(£為隨機變量)可用統(tǒng)計方法分析沒有關(guān)系不用分析嚴(yán) 2、相關(guān)關(guān)糸相關(guān)關(guān)系的描述最直觀的描述方式坐標(biāo)圖(散布圖、散點圖)函數(shù)關(guān)系相關(guān)關(guān)系(線性)相關(guān)關(guān)系(非線性)沒有關(guān)系7嚴(yán) 相關(guān)關(guān)糸的類型# 從莎及的變量教量看簡單相關(guān)多重相關(guān)(復(fù)相關(guān)) 從變量相關(guān)關(guān)糸的表現(xiàn)形式看線性相關(guān)一散布圖接近一條直線 非線性相關(guān)一散布圖接近一條曲線 從變量相關(guān)關(guān)糸變化的方向看正相關(guān)變量同方向變化,同增同減負相關(guān)變量反方向變化,一增一減l=i不相關(guān)9爐久相關(guān)程度的度量一相關(guān)糸數(shù)如果X和Y總體的全部數(shù)據(jù)都已知,X和Y的方差和協(xié)方差也已知,則X和Y的總體線性相關(guān)糸數(shù):Cov(X.Y
4、)p )JvMXMO其中:Var(X) “X的方差Var(Y) Y的方差Cov(X.Y) X和Y的協(xié)方差總體相關(guān)系數(shù)只反映總體兩個變量X和Y的線性相關(guān)程度對于特定的總體來說,X和Y的數(shù)值是既定的,總體相關(guān)系數(shù)p是客觀存在的特定數(shù)值??傮w的兩個變量X和丫的全部數(shù)值通常不可能直接觀測,所以總體相關(guān)系數(shù)一般是未知的。嚴(yán)塔X和Y的樣本線色相關(guān)糸數(shù):如果只知道X和Y的樣本觀測值,則X和Y的樣本線性相關(guān)系數(shù)為:.一工(X廠力a")rXY _ I 其中:X,和匕分別是變量X和Y的樣本觀測值,尢和0分別是變量X和Y樣本值的平均值注意:心丫是隨抽樣而變動的隨機變量。相關(guān)系數(shù)較為簡單,也可以在一定程度上
5、測定變量間的數(shù)量關(guān)系,但是對于具體研究變量間的數(shù)量規(guī)律性還有局限性。嚴(yán) 對相關(guān)糸數(shù)的正確理解和使用 X和Y都是相互對稱的隨機變量,小丫 =金線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于抽樣波動,樣本相關(guān)系數(shù)是隨抽樣而變動的隨機變量, 其統(tǒng)計顯著性還有待檢驗11嚴(yán) 4回歸分析回歸的古典意義:高爾頓遺傳學(xué)的回歸概念(父母身高與子女身高的關(guān)系)子女的身高有向人的平均身高”回歸"的趨勢回歸的現(xiàn)代意義:一個被解釋變量對若干個 解釋變量依存關(guān)系的研究回歸的目的(賣質(zhì)):由解釋變量去估計被解釋變量的平均值13#被解釋變量Y的條件分布和條
6、件概率:#X、對Y所形成的分布確定其期望或均值,稱 為Y的條件期望或條件均當(dāng)解釋變量X取某固定值時(條件),Y的值不確定,Y 的不同取值會形成一定的分布,這是Y的條件分布。X取某固定值時,Y取不同值的概率稱為條件概率。被解釋變量Y的條件期望:Y 對于X的每一個取值,劭)x值,用E(YX,)表示。注意:Y的條件期望是隨X的變動而變動的回歸線:對于每一個X的取值X,都有Y的條件期望 E(y|X;.)與之對應(yīng),代表Y的條件期望的點的軌跡形成 的直線或曲線稱為回歸線?;貧w函數(shù):被解釋變量YY的條件期望E(y|xz.)隨 解釋變量X的變化而有規(guī)律£(y|x,) 的變化,如果把Y的條件期 望表現(xiàn)
7、為X的某種函數(shù) E(YXi) = f(Xi)f 這個函數(shù)稱為回歸函數(shù)。X,X回歸由數(shù)分為:總體回歸曲數(shù)和樣本回歸曲數(shù)17嚴(yán)二、總體回歸因數(shù)(PRF)舉例:假如已知由100個家庭構(gòu)成的總體的數(shù)據(jù)(單位:元)每月家庭可支配收入X20002500300035004000450050005500600013121530 163118432037:2277 _24692924on丄n13401619 三172619742210 =2388 三288933383721 二14001713 二178屋200香2325 =2526 =3090 =3650 二386臺1548 _168817501814 =18
8、35188522652367=2419 2522 二2681 2887 =3156 33003802 40874026 4165=173818001985 二20411943 二20372485 二25152665 =2799305031893321 =36544298 二43124380=4580厶 ur jlr 7 jl J19022186 =2078 =2689=2887 =3353 三3842 =4413 =2200 二2179 二2713=2913 =35344074 二2312=2298 二2898 =3038 =3710 =4165 =2316=2923=3167 =3834 三
9、238730533310 3187=3510 26893286159119152092258627543039339638534036E(YX3521395441084345481265004148嚴(yán)請費支出的條件期望與收入關(guān)糸的圖形5000E(Y|XJ4000-3000-2000200 .,f.1000 2000 3000 4000 5000 6000 7000XXi對于本例的總體,家庭消費支出的條件期望E(Y|XJ 與家庭收入X.基本是線性關(guān)系,可以把家庭消費支 出的條件均值衰示為家庭收入的線性函數(shù):E(YXi) = a + )3Xi嚴(yán) 1.總體回歸函數(shù)的桃念前提:假如已知所研究的經(jīng)濟現(xiàn)象
10、的總體的被解釋變量Y 和解釋變量X的每個觀測值(通常這是不可能的?。?么,可以計算出總體被解釋變量Y的條件期望E(y|xz-), 并將其表現(xiàn)為解釋變量X的某種函數(shù)這個函數(shù)稱為總體回歸函數(shù)(PRF)本質(zhì):總體回歸函數(shù)實際上表現(xiàn)的是特定總體中被解釋變 量隨解釋變量的變動而變動的某種規(guī)律性O(shè) 計量經(jīng)濟學(xué)的根本目的是要探尋變量間數(shù)量關(guān)系的規(guī)律,也 就要努力去尋求總體回歸函數(shù)。即 2總體回歸函數(shù)的表現(xiàn)形式條件期望表現(xiàn)形式例如丫的條件期望E(YXJ是解釋變量X的線性函數(shù),可表示為: 放皿)PRF個別值表現(xiàn)形式(隨機設(shè)定形式)X, XE(引 XJ = /(X,) = ZV02X,乙#對于一定的X, ,
11、丫的各個別值Yi并不一定等于條件期望,而是分布在E(Y|XJ的周圍,若令各個乙與條件期望E(Y|XJ的則有偏差為妁,顯然妁是個隨機變量Ui=Yi_E(YjX) = Yj_0_02XiE = 0i + 乞嚴(yán) 3 如何理解總體回歸因數(shù)作為總體運行的客觀規(guī)律,總體回歸函數(shù)是客觀存在的,但在實際的經(jīng)濟研究中總體回歸函數(shù)通常是未知的,只能根據(jù)經(jīng)濟理論和實踐經(jīng)驗去設(shè)定。計量經(jīng)濟學(xué)研究中“計量”的根本目的就是要尋求總體回歸函數(shù)。我們所設(shè)定的計量模型實際就是在設(shè)定總體回歸函數(shù)的具體形式??傮w回歸函數(shù)中Y與X的關(guān)系可以是線性的,也可以是非線性的。25嚴(yán)“線性”的判靳計量經(jīng)濟學(xué)中,線性回歸模型的“銭性”有兩和*釋
12、:就變童而古是線性的Y的條件期望(均值)是X的線性函數(shù)就參數(shù)而吉是線性的Y的條件期望(均值)是參數(shù)P的線性函數(shù)例如,E(XXi)Px+f32Xi對變量、參數(shù)均為“線性”Ea|XJ=0+0flnX,EQ/J胡+伉乞?qū)?shù)“線性”,對變量“線性”,對變量”非線性”對參數(shù)”非線性”果的性質(zhì)和計量經(jīng)濟方法的選擇#果的性質(zhì)和計量經(jīng)濟方法的選擇#注意:在計量經(jīng)濟學(xué)中,線性回歸模型主要指就參數(shù)而言是“線 性”的,因為只要對參數(shù)而言是線性的,都可以用類似的方法去估計其參數(shù),都可以歸于線性回歸。18乙的值與其條件期望ui£(中)E(X|XJ的偏差妁有很重 要的意義。若只有X的影響, 乙與不應(yīng)有偏差。若
13、偏 差冷存在,說明還有其他影響因素。X, X",實際代表了排除在模型以外的所有因素對Y的影響。,性質(zhì) 冷是其期望為0有一定分布的隨機變量重要,性:隨機擾動項的性質(zhì)決定著計量經(jīng)濟分析結(jié)果的性質(zhì)和計量經(jīng)濟方法的選擇29嚴(yán) 引入隨機擾動項妁的慮因是未知影響因素的代表(理論的模糊性) 是無法取得數(shù)據(jù)的已知影響因素的代表(數(shù)據(jù)欠缺) 是眾多細小影響因素的綜合代表(非系統(tǒng)性影響) 模型可能存在設(shè)定誤差(變量、函數(shù)形式的設(shè)定) 模型中變量可能存在觀測誤差(變量數(shù)據(jù)不符合實際) 變量可能有內(nèi)在隨機性(人類經(jīng)濟行為的內(nèi)在隨機性)嚴(yán) 四、樣本回歸呼(SRF)樣本回歸線: 對于X的一定值,取得y的樣本觀測
14、值,可計算其條件均值, 樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數(shù): 如果把被解釋變量Y的樣本條件均值YSRFY.表示為解釋變量X的某種函數(shù), 這個函數(shù)稱為樣本回歸函數(shù)(SRF)XX、31悠樣本回歸因蚩L的因重L形式條件均值形式:樣本回歸函數(shù)如果為線性函數(shù),可表示為/V/Y嚴(yán)卩嚴(yán)卩2X.其中:Yt是與X相對應(yīng)的Y的樣本條件均值 B和A分別是樣本回歸函數(shù)的參數(shù) 個別值(實際值)形式:被解釋變量Y的實際觀測值乙不完全等于樣本條件均值二者之差用®表示,©稱為剩余項或殘差項:#悠樣本回歸因蚩L的因重L形式#悠樣本回歸因蚩L的因重L形式則 eYYi或 Yi =01+02
15、X,+弓#嚴(yán)樣本回歸函數(shù)的特點33嚴(yán)樣本回歸函數(shù)的特點樣本回歸線隨抽樣波動而變化:樣本回歸線只是樣本條件均值的軌跡,還不是總體 回歸線,它至多只是未知的總體回歸線的近似表現(xiàn)。每次抽樣都能獲得一個樣本,就可以擬合一條樣本回#U:PRF嚴(yán) 樣本回歸因數(shù)與總體回歸因數(shù)的關(guān)糸AY.I 砒區(qū))Xj嚴(yán) 對樣本回歸的理鮮樣本回歸函數(shù)對比:如果能夠通過某種方式獲得和的數(shù)值,顯然:37# 和 是對總體回歸函數(shù)參數(shù) 和 的估計是對總體條件期望I 的估計在概念上類似總體回歸函數(shù)中的為對的估計。#嚴(yán)回歸分析的目的計量經(jīng)濟分析的目標(biāo)是尋求總體回歸函數(shù)。即用樣本 回歸函數(shù)SRF去估計總體回歸函數(shù)PRF o由于樣本對總體總
16、是存在代表性誤差,SRF總會過高或過低估計PRF。要解決的問題:尋求一種規(guī)則和方法,使其得到的SRF的參數(shù)A 和怎盡可能"接近”總體回歸函數(shù)中的參數(shù)肉和毘 的真實值。這樣的“規(guī)則和方法”有多種,如矩估計、 二乘法。極大似然估計、最小二乘估計等。其中最常用的是最小=J嚴(yán)第二節(jié)簡單線性回歸模型的最小二乘估計用樣本去估計總體回歸函數(shù),總要使用特定的方法,而任何估計參數(shù)的方法都需要有一定的前提條件一假定條件一、簡草線性回歸的基本假走為什么要作基本假定?只有具備一定的假定條件,所作出的估計才具有良好的統(tǒng) 計性質(zhì)。模型中有隨機擾動項,估計的參數(shù)是隨機變量,顯然參數(shù) 估計值的分布與擾動項的分布有關(guān)
17、,只有對隨機擾動的分 布作出假定,才能比較方便地確定所估計參數(shù)的分布性質(zhì), 也才可能進行假設(shè)檢驗和區(qū)間估計等統(tǒng)計推斷O假定分為:對模型和變量的假定對隨機擾動項的假定爐°%2對隨機擾動項u的假災(zāi)例如對于E = 0i + f32Xt + ut假定模型設(shè)定是正確的(變量和模型無設(shè)定誤差)假定解釋變量X在重復(fù)抽樣中取固定值。假定解釋變量X是非隨機的,或者雖然X是隨機的,但與擾動項u是不相關(guān)的。(從變量X角度看是外生的)注意:解釋變量非隨機在自然科學(xué)的實驗研究中相對容易滿足,經(jīng)濟領(lǐng)域中變量的觀測是被動不可控的,X非隨機的假定并不一定都滿足。假定1:零均值假定:在給定X的條件下,的條件期望為零V
18、ag Xi) = Eui-E(ui X.)2 =cr2CCIcc45假定3:無自相關(guān)假定:隨機擾動項冷的逐次值互不相關(guān)Covui ,iij) = Eui E(終)匕E(Uj)(吧)=0(山 j)假定4:解釋變量X,是非隨機的,或者雖然X,是隨 機的但與擾動項 冷不相關(guān)(從隨機擾動 色角度看)Cov, XJ = Eg E(uf) Xz. - E(XJ = 0假定5:對隨機擾動項分布的正態(tài)性假定,即假定冷服從均值為零.方差為"2的正態(tài)分布ui N(oq2 )(說明:正態(tài)性假定并不影響對參數(shù)的點估計,所以有時不列入基本假定,但這對確定所估計參數(shù)的分布性質(zhì)是需要的。J根據(jù)中心極限定理,當(dāng)樣本
19、容量趨于無窮大時,妁的分布會趨 近于正態(tài)分布。所以正態(tài)性假定有合理性)嚴(yán) 在對色的基本假定下Y的分布性廣由于Yt =/?! +P2Xi +ut其中的0i,02和X,是非隨機的,冷是隨機變量,因此Y是隨機變量,叭的分布性質(zhì)決定了匕的分布性質(zhì)。對的一些假定可以等價地表示為對Y的假定:II假定1:零均值假定E(Z|XJ = 0i+02%7假定2:同方差假定Var(YiXi) = a2假定3:無自相關(guān)假定Cou(Z,E)= °假定5:正態(tài)性假定£N(A+02X,b2)嚴(yán)e%二、普通最小二乘法COLSJf fl1 aqu十 VciinrQV、1. OLS的基本思想對于y =31+32
20、 x,不同的估計方法可以得到不同的樣本回歸 參數(shù)/和久,所估計的Yi也就不同。理想的估計結(jié)果應(yīng)使估計的乞與真實的匕的差(即剩余S )總的來 說越小越好因可正可負,總有 工弓=0,所以可以取工診最小,即Imin2 =min(y:-1-32Xz)2在觀測值Y和X確定時,匕2的大小決定于E 和直2 。 要解決的問題::如何尋求能使工&最小的A 和P2 O嚴(yán) 2.正規(guī)方程和估計量取偏導(dǎo)數(shù)并令其為0,可得正規(guī)方程d(Yef)八,召口 一2 工也-A-/yQ = o)一2 工匕-B'-BqXJXE 呻工洛 = 0冊2汁敢牌擔(dān)工乙=必+介工X,或整理得l八L 7工X必=0工X,+02工X;良
21、=0 必-工EDp嚴(yán)工疋工£ -工x,工x必吃 X:_ (工 xj2心;-口)2用克萊姆法則求解得以觀測值表現(xiàn)的OLS估計量:即 用離差表現(xiàn)的O LS估計量為表達得更簡潔,或者用離差形式的OLS估計量:容易證明_B工x屛工x,工g 工(廠文)(匕一刃 工由正規(guī)方程:px=Y-P2X注意:其中:xi = Xf X=Yt Y本課程中:大寫的X,和Yi均表示觀測值;小寫的兀和兀均表示觀測值的離差/K/V而且由 丫尸0 +/32Xiy +介乂 樣本回歸函數(shù)可用離差形式寫為£=02兀嚴(yán) 3OLS回歸線的數(shù)學(xué)性質(zhì)剩余項e.的均值為零工勺二°51#OLS回歸線通過樣本均值(由O
22、LS第一個正規(guī)方程直接得到)估計值£的均值等于實際觀測 值匕的均值r=A+Ax(由OLS正規(guī)方程S-3i-A)= o兩邊同除n得到)/Y; .、 aaaA L -工(01 +02*)=01 +02* = Y n n#被解釋變量估計值£與剩余項S不相關(guān)Cov&£)= 0由OLS正規(guī)方程有:工勺=0工©Xj = 0Cov(g,弓)=1(£ 歹)(弓一臣)=0 因為n乞(£-P)他7)=乞車廠遼= 也工必=0解釋變量X,與剩余項©不相關(guān)Cov(Xz.,e ) = 0工(xT)(D 吃訂TZT嚴(yán) 4. OLS估計量的統(tǒng)計性質(zhì)
23、面臨的問題:參數(shù)估計值工參數(shù)真賣值對參數(shù)估計式的優(yōu)劣需要有評價的標(biāo)準(zhǔn)為什么呢?參數(shù)無法直接觀測,只能通過樣本去估計。樣本的獲得存在抽樣波動,不同樣本的估計結(jié)果不一致。估計參數(shù)的方法有多種,不同方法的估計結(jié)果可能不相同,通過樣本估計參數(shù)時,估計方法及所確定的估計量不一定 完備,不一定能得到理想的總體參數(shù)估計值。對各種估計方法優(yōu)劣的比較與選擇需要有評價標(biāo)準(zhǔn)。估計準(zhǔn)則的基本要求:參數(shù)估計值應(yīng)”盡可能地接近”總體參數(shù)真實值” O什么是“盡可能地接近”斥則呢?用統(tǒng)計語言表述就是:無偏性、有效性、一致性等嚴(yán)無偏性前提:重復(fù)抽樣中估計方法固定、樣本數(shù)不變、由重復(fù)抽樣得到的觀測值,可得一系列參數(shù)估計八八值P,
24、 0的分布稱為0的抽樣分布,其密度函數(shù)記為/(3)如果E(p) = 0 ,則稱P是參數(shù)0的無偏估計量, 如果E©壬0 ,則稱P是有偏的估計,其偏倚為E(p) 0(見下頁圖)#嚴(yán)40嚴(yán) (2)有敗性前提:樣本相同、用不同的方法估計參數(shù),可以找到若 干個不同的無偏估計式目標(biāo):努力尋求其抽樣分布具有最小方差的估計量(見下頁圖)既是無偏的同時又具有最小方差特性的估計量,稱為 最佳(有效)估計量。/(概率密度00估計值42嚴(yán)篤 3、漸近性質(zhì)(大樣本性質(zhì))思想:當(dāng)樣本容量較小時,有時很難找到方差最小的無偏估計, 需要考慮樣本擴大后的性質(zhì)(估計方法不變,樣本數(shù)逐步增大) 一致性:或Plimp) =
25、 0當(dāng)樣本容量n趨于無窮大時,如果估計式B依概率收斂于總體參數(shù)的 真實值,就稱這個估計式是0的一致估計式。即limP(l p- /3 | < ) = 1(漸近無確估計式是當(dāng)樣本容量變得足夠大奇箕偏倚趨于零的估計式)(見下頁圖)漸近有效性:當(dāng)樣本容量n趨于無窮大時,在所有的一致估計 式中,具有最小的漸近方差。嚴(yán)概率密度圖40估計值045嚴(yán) 4.分析OLS估計量的統(tǒng)計性質(zhì)OLS估計是否符合“盡可能地接近總體參數(shù)真實值”的要求呢?先明確幾點:由OLS估計式可以看出入吃疋-(工X,)A都由可觀測的樣本值x.和y.唯一表示。B _XjY廠工xYj 入 yx2Vr-yxVxy 工X;-(工XJ卩因存
26、在抽樣波動,OLS估計A是隨機變量 OLS估計式是點估計量嚴(yán) OLS估計式的統(tǒng)計性質(zhì)翕斯走理1>線性特征 A是Y的線性函數(shù)#2、無偏特性可以證明(證明見教材P38)/(注意:卩k無偏性的證明中用到了基本假定中零均值等假定)3、 最小方差特性(有效性)(證明見教材P68附錄21) 可以證明:在所有的線性無偏估計中,OLS估計E具 有最小方差(注意:最小方差性的證明中用到了基本假定中的同方差、無自相關(guān)等假 定J孝結(jié)論C富斯走理丿:在古典假定條件下,OLS估計量是最佳線性無偏估計量(BLUE)47嚴(yán)第三節(jié)擬合優(yōu)度的度量Y概念:樣本回歸線是對樣本數(shù)據(jù)的一種擬合。不同的模型(不同函數(shù)形式)可擬合出
27、不同的樣本回歸線相同的模型用不同方法去估計參數(shù),也可以擬合出不同的回歸線擬合的回歸線與樣本觀測值總是有偏離。樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度,可稱為擬合優(yōu)度。如何度量擬合優(yōu)度呢?擬合優(yōu)度的度量建立在對Y的總變差分解的基礎(chǔ)上嚴(yán)總變蓋的分解49嚴(yán)總變蓋的分解分析Y的觀測值乙、估計值直與平均僭有以下關(guān)系I / / / /E_Y=(z_Y)+E_E=a_y)+a_z) 將上式兩邊平方加總,可證得(提示:交叉項 工(£_卩比=0)#嚴(yán)總變蓋的分解E +工才或者表示為工才1 =|=總變差工才(JSS):被解釋變量Y的觀測值與其平均值的離差平方和(總平方和)(說明Y的總變動程度)解釋了的變差
28、 Ex"(ESS):被解釋變量Y的估計值與其平均值的離差平方和(回歸平方和)剩余平方和 工才(RSS):被解釋變量觀測值與估計值之差的平方和(未解釋的平方和)#嚴(yán)塔 變差分解的圖示(以禁個觀測值為例)乙m(匕一£)=©二來自殘差Yi-Y = (Y-Y) + eiEx2=工 $;+ 工才嚴(yán) 二、可決糸數(shù)以TSS同除總變差等式Y(jié)疋_巧2 + £)兩邊:工匕-竅丄&-巧myH廠 “_y)2 “_門2Z X2 :工分:定義:回歸平方和(解釋了的變差ESS)工芳在總變 差(TSS)工才中所占的比重稱為可決系數(shù),用廠2或尺2表示:R2 =嚴(yán)可決糸數(shù)的作用可決
29、系數(shù)越大,說明在總變差中由模型作出了解釋的 部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)越小,說明模型對樣本觀測值的擬合程度越差??蓻Q糸數(shù)的特點:可決系數(shù)取值范圍:0<R2<l隨抽樣波動,樣本可決系數(shù)尺2是隨抽樣而變 動的隨機變量可決系數(shù)是非負的統(tǒng)計量55嚴(yán)可決糸數(shù)與相關(guān)糸數(shù)的關(guān)糸聯(lián)系:數(shù)值上可決系數(shù)是相關(guān)系數(shù)的平方尺丄工刃L工(A羽$ = £兀Pl為匚(工切廠ZWc>= (工兀y)工?!?二UY彳)(滬小任彳)(工”2 ”=r2區(qū)別:可決系數(shù)是就模型而言說明解釋變量對被解釋變量的解釋程度度量不對稱的因果關(guān)系取值0三 三1有非負性R2相關(guān)系數(shù)是就兩個變量而言說明
30、兩變量線性依存程度度量對稱的相關(guān)關(guān)系取值1三三1可正可負55穆跑節(jié)回歸糸數(shù)的區(qū)間估計和假設(shè)檢臉為什么要作區(qū)間估計?運用OLS法可以估計出參數(shù)的一個估計值,但OLS估計只是通過樣本得到的點估計,它不一定等于真實參數(shù),還需要尋求真實參數(shù)的可能范圍,并說明其可靠性。為什么要作假設(shè)檢臉?OLS估計只是用樣本估計的結(jié)果,是否可靠?是否抽樣的偶然結(jié)果呢?還有待統(tǒng)計檢驗。區(qū)間估計和假設(shè)檢臉都是建立虛確走參數(shù)估計 值A(chǔ)概率分布性質(zhì)的基礎(chǔ)上。57爐0%OLS#的分布性質(zhì)/V線性特征02二工ky基本®*A是隨機變量,必須確定其分布性質(zhì)才可能進行區(qū)間估計和假設(shè)檢驗怎樣確定幾的分布性質(zhì)呢? 冷是服從正態(tài)分布
31、的隨機變量,決定 T Yi也是服從正態(tài)分布的隨機變量;丿&是乙的線性函數(shù),決定了 A也服從正態(tài)分布冷正態(tài)一 匕正態(tài)一 A正態(tài)(線性估計的重要性)只要確定介的期望和方差,即可確定E的分布性質(zhì)嚴(yán) A的期望和方差 Bk的期望:e(4)=a(已證明是無偏估計) 4的方差和標(biāo)準(zhǔn)誤差(證明見P39、P40)(標(biāo)準(zhǔn)誤差是方差的平方根)=0-2SE(da2 = Var(ui)Var“j Var() = er2工X:FOs八f八SE(0J = b注意:以上各式中cP均未知,但是個常數(shù),其余均是已知的樣本觀測值,這時Var“k)和$鳳介)都不是隨機變量。嚴(yán)對隨機擾動項方蓋/的估計基本思想:慶 是始的方差,
32、而冷不能直接觀測,只能從由樣本得 到的匕 去獲得有關(guān)弘的某些信息,去對”2作出估計。2ZI可以證明(見附錄22)其無偏估計為E送Q = (n - 2)a2a2 =HQE (&2) = a2n 1ei=Yi-fi-fi2Xi(這里的m2為自由度,即可自由變化的樣本觀測值個數(shù))注意區(qū)別:是未知的確定的常數(shù);$2是由樣本信息估計的,是個隨機變量59嚴(yán) 對A作標(biāo)準(zhǔn)化變換為什么要對A作標(biāo)準(zhǔn)化變換?在妁正齊性假定下,由四面的分析已知Bk Nl0k,VariBk"/但在對一般正態(tài)變量A作實際分析時,要具體確定A的取值及對應(yīng)的概率,要通過正態(tài)分布密度函數(shù)或分布函數(shù)去計算是很麻煩的,為了便于直
33、接利用“標(biāo)/準(zhǔn)化正態(tài)分布的臨界值”,需要對0k作標(biāo)準(zhǔn)化變換。標(biāo)準(zhǔn)化的方式:以=炕-砂)/SEW標(biāo)準(zhǔn)正態(tài)分布函數(shù)(Q =17X-e 2 dxoo嚴(yán)1,己知時,對&作標(biāo)準(zhǔn)化變換EJ蠱”2己知對對&作標(biāo)準(zhǔn)化變換,所得Z統(tǒng)計量為標(biāo) 準(zhǔn)正態(tài)變量。/X/X0" -0"N(O,1)CTA-A _ A-A n(o,i)S002 )”工X:/ /注意:這時SE(B)和SE(Bj都不是隨機變量(X、6 n都是非隨機的)嚴(yán) 2.長未知對,對僅作標(biāo)準(zhǔn)化變換條件:當(dāng)未知時,可用 刖(隨機變量)代替去估計 參數(shù)的標(biāo)準(zhǔn)誤差。這時參數(shù)估計的標(biāo)準(zhǔn)誤差是個隨機變量。樣本為大樣本時,作標(biāo)準(zhǔn)化變換
34、所得的統(tǒng)計量Zk,也可以 視為標(biāo)準(zhǔn)正態(tài)變量(根據(jù)中心極限定理)。樣本為小樣本時,用估計的參數(shù)標(biāo)準(zhǔn)誤差對幾作標(biāo)準(zhǔn)化變換,所得的統(tǒng)計量用t表示,這時t將不再服從正態(tài)分布,而是服從t分布(注意這時分母是隨機變量)心4_0匕心_2)5£( A)嚴(yán)二、回歸糸數(shù)的區(qū)間估計基本思想:對參數(shù)作出的點估計是隨機變量,雖然是無偏估計,但還不能說明這種估計的可靠性和精確性。如果能找到包含真實參數(shù) 的一個范圍,并確定這樣的范圍包含參數(shù)真實值的可靠程度, 將是對真實參數(shù)更深刻的認識。方出:如果在確定參數(shù)估計式概率分布性質(zhì)的基礎(chǔ)上,可找到兩個正數(shù)込和a(O<a<l)能使得這樣的區(qū)間(應(yīng)亠久+5)包含
35、真實幾的概率為1 a、即這樣的區(qū)間稱為所估計參數(shù)的置信區(qū)間。討論:“如果已經(jīng)得出了)的特定估計值,并確定了某個置信區(qū)間,這說明真實參數(shù)落入這個區(qū)間的概率為o這種說法對嗎?63置信區(qū)間:P( -8<f3k<Pk+8) = -a基本思想:利用Bk標(biāo)準(zhǔn)化后統(tǒng)計量的分布性質(zhì)去尋求總體方差2CF已知2 02N(O,1) 標(biāo)準(zhǔn)正態(tài)分布種情況Z* =_ 02一 SER)樣本容量較小樣本容量充分大總體方差CF未知Z將接近標(biāo)準(zhǔn)正態(tài)分布服從t分布回歸糸數(shù)的區(qū)i可估計(分三種情況尋找合適的5)(1)當(dāng)總體方差b $已知時(Z服從正態(tài)分布) 取定4(例如0=0.05),査標(biāo)準(zhǔn)正態(tài)分布表得與 舷 應(yīng)的臨界值
36、N (例如N為1.96),則標(biāo)準(zhǔn)化變量才(統(tǒng)計量)#Z* A - 02 A - 02八一/N(OJ)因為#65即 pA-沁+z5e(A)i=1&6nSE(02)n-嚴(yán)2當(dāng)總體方差/未知,且樣本容量充分大時方法:可用無偏估計"2去代替未知的b2,由于樣本容量充分大,標(biāo)準(zhǔn)化變量Z* (統(tǒng)計量)將 接近標(biāo)準(zhǔn)正態(tài)分布_ A - 02 _ A - 02/CFN(O,1)注意:這里的“ A S表示“估計的”,這時區(qū)間估計的方式也可利用標(biāo)準(zhǔn)正態(tài)分布只是這時A-67#嚴(yán)3、當(dāng)總體方差”2未知,且樣本容量較小時方法:用無偏估計6去代替未知的 e2由于樣本容量較 小,“標(biāo)準(zhǔn)化變量” t (統(tǒng)計量
37、)不再服從正態(tài)分布,而服從t分布。/Xt -里一色心- 2)這時可用t分布去建立參數(shù)估計的置信區(qū)間。選定6查t分 布表得顯著性水平為*/2,自由度為n2的臨界值a/2 (n-2) 9#例力研究某市城鎮(zhèn)居民人均鮮蛋需求量Y(公斤)與人均可支配收入X(元,1980年不變價計)的關(guān)系設(shè)定旗型:Z=1+02X/+均1995-2005年樣木數(shù)據(jù):1995199619971998199920002001200220032004200514.414.414.414.717.016.318.018.518.219.317.1847.3821.0884.2903.7984.11035.31200.91289.8
38、1432.91539.0估計參數(shù):y =16.57,X= 1142.89,- V xtyt 4489.94 久= 0.0052 工 x; 858661.8B =Y-P2X= 16.57 - 0.005 x 1142.89 = 10.60嚴(yán) 估計結(jié)果:Yt 二 10.60 + 0.005X,計算可決糸數(shù)例僉由前面的估計結(jié)果可計算出 工才=10.56 由數(shù)據(jù)Y可計算出:工匕-7)2 =工疋=34.031610.5634.03167?2 =1-0.3103 = 0.689710.56SElBi = / b = 0.001 JO; 858661.8給定* = 0.05查df=n-2=9的t分布臨界值
39、心025二2.262A參數(shù)區(qū)間估計:p©2-咕2 SE©) 5 02 也+:/2 SE2) = l-aP0.005- 2.262x 0.001< A < 0.005+ 2.262x 0.001 = 1 一 0.05P(0.0027 <p.< 0.0073) = 0.95若給定* = 0.10查df=9的t分希臨界值心05(9) = 1.833貝 UP(0.0032 <f32< 0.0068) = 0.90若給定比=0.20 則 P(0.0036 < /32< 0.0064) = 0.80 若給定 a = 0.50 則 P(0.
40、0043 < /32< 0.0057) = 0.50嚴(yán)三.回歸糸數(shù)的假段檢殮目的:簡單線性回歸中,檢驗X對Y是否真有顯著影響基本概念回顧:臨界值與概率、大概率事件與小概率事件相對于顯著性水平a的臨界值為:(單側(cè))或ta/2 (雙側(cè)) 計算的統(tǒng)計量為:ffa/20 fta/2統(tǒng)計量 t嚴(yán) 回歸糸數(shù)的檢驗方肉確立假設(shè):原假設(shè)為H。: 02=0備擇假設(shè)為日1 :角工0(本質(zhì):檢驗02是否為0,即檢驗£是否對Y有顯著影響)(1)當(dāng)已知E或樣本容量足夠大時可利用正態(tài)分布作Z檢驗zzZ"=血02 =N(0.1)seiBj seiBj給定G,查正態(tài)分布表得臨界值Z如果-z&l
41、t;Z*<乙則不拒絕原假設(shè)Ho如果Z*<-z或Z*>z則拒絕原假設(shè)日。71嚴(yán) (2)當(dāng)”2未知,且樣本容量較小時只能用a2去代替"2,可利用t分布作t檢驗:TV* 二"2 "2 - 02 A At(n_2)SE(02)SE(02)給定Q,查t分布表得弦(2)如果f 5兮2)或者t >(n 2)則拒絕原假設(shè)Ho : 02 = 0而不拒絕備擇假設(shè)刃:02工0如果-2) W 廠(-2)則不拒絕原假設(shè)H。:禹=073嚴(yán) 用P值判斷參數(shù)的顯著性假役檢臉的P值:P值是基于既定的樣本數(shù)據(jù)所計算的統(tǒng)計量,拒絕 原假設(shè)的最低顯著性水平。統(tǒng)計分析軟件中通常都給
42、出了檢驗的P值相對于顯著性水平Q的臨界值:或ta/2計算的統(tǒng)計量:t匚/2與°相對應(yīng) 廣與P相對應(yīng)注意:P值檢驗是比較Q和Pap*統(tǒng)計量tt檢盛是比較廣和ta/2嚴(yán)用P值判斷參數(shù)顯著性的方法方出:將給定的顯著性水平4與P值比較:a若 a> p值,必有f > ta/2 ,則在顯著性水平a 下拒絕原假設(shè):僅=0,即認為X對Y有顯著影響A若|a< p 必有|<|/2|,則在顯著性水平Q下不拒絕原假設(shè)鳳:0農(nóng)=0 ,即認為X對Y沒有顯著影響規(guī)則:當(dāng)p<a時,P值越小,越能拒絕原假設(shè)/J。給定況= 0.05查df=9的t分布臨界值 匕把9) = 2.262計算統(tǒng)計
43、量*_良-02_ Pi 0.005AA= 5.00SE(02)SE(02)°-001判斷:因 r=5.OO>o(x)25= 2.262拒絕 H°:02=O說明角顯著不為0, X對Y確有顯著影響用P值檢臉:(需要確定與f = 5.00對應(yīng)的P值)由廠=5.00, df=9,查 t 分布表知道P<0.0005(t= 4.781 時) 因t=5.00時的P值 v 0.0005(t=4.78i) <<a =0.05則在顯著性水平a = 0.05下更應(yīng)拒絕原假設(shè)H。:角=0即認為X對Y有顯著影響75回歸分析結(jié)果的掖告經(jīng)過模型的估計、檢驗,得到一系列重要的數(shù)據(jù),
44、為 了簡明、清晰、規(guī)范地表述這些數(shù)據(jù),計量經(jīng)濟學(xué)通常 采用以下規(guī)范化的方式:例如:回歸結(jié)果為八Yi = 244545 + 0-5091 %.(6-4138) (00357)標(biāo)準(zhǔn)誤差 SEt= (3-8128) (14-2605) t 統(tǒng)計量R2= 0-9621 df = 8可決系數(shù)和自由度F = 202-87 DW = 2.3F統(tǒng)計量 DW統(tǒng)計量嚴(yán)二、菠解釋麥量平均值領(lǐng)測1基本思想經(jīng)估計的計量經(jīng)濟模型可用于:經(jīng)濟結(jié)構(gòu)分析經(jīng)濟預(yù)測 政策評價驗證理論運用計量經(jīng)濟模型作預(yù)測:指利用所估計的樣本回歸函數(shù) 作預(yù)測工具,用解釋變量的已知值或預(yù)測值,對預(yù)測期或樣 本以外的被解釋變量的數(shù)值作出定量的估計。計量
45、經(jīng)濟預(yù)測是一種條件預(yù)測:條件:模型設(shè)定的關(guān)系式不變所估計的參數(shù)不變解釋變量在預(yù)測期的取值已作出預(yù)測77嚴(yán)預(yù)測值、平均值、個別值的相互關(guān)糸Y真實平均值E(YfXf)個別值Yf/V點預(yù)測值YfXfX幾是對真實平均值的點估計,也是對個別值的點估計嚴(yán) 2、Y平均值的色預(yù)測 點預(yù)測:用樣本估計的總體參數(shù)值所計算的Y的估計值直接作為Y的預(yù)測值將解釋變量預(yù)測值直接代入估計的方程這樣計算的%是一個點估計值嚴(yán) 3. 丫平均值的區(qū)間預(yù)測基本思想:預(yù)測的目標(biāo)值是真實平均值,由于存在抽樣波動,預(yù) 測的平均值*不一定等于真實平均值e(yfxf),還 需要對E(緯|XJ作區(qū)間估計為對Y作區(qū)間預(yù)測,必須確定平均值點預(yù)測值巳
46、的抽 樣分布必須找出點預(yù)測值丘與預(yù)測目標(biāo)值E(YFXFJ關(guān)系,r即找出與二者都有關(guān)的統(tǒng)計量已知E(YF) = E(YfXf) = a +fi2XF可以證明(較復(fù)雜不具體證明)SE(Yf) =(t +1 . (XfX)2片服從正態(tài)分布(為什么?),將其標(biāo)準(zhǔn)化,當(dāng)/未知時,只得用a2=/(n-2)代替,這時有t(n 2)嚴(yán)構(gòu)建平均值的瀕測區(qū)間顯然這樣的t統(tǒng)計量與Yf和e(yfxf)都有關(guān)。 給定顯著性水平6查t分布表,得自由度n 2的臨 界值tap-2),則有 P(-ta/2 <t<ta/2) = l-a 即宀東E(緯禺)_、- 一戶(一'劉2 ° 一X_;-匚/2
47、) 1 一 &SEgAApYf- ta/2 SE(Yf )<E(YfXf)<Yf+ta/2 SE©F ) = l-a 丫平均值的置信度為1-況的預(yù)測區(qū)間為嚴(yán)三、菠解釋變量個別值預(yù)測基本思想: Yf既是對Y平均值的點預(yù)測,也是對Y個別值的點預(yù)測。由于存在隨機擾動給的影響,Y的平均值 并不等于Y的個別值為了對Y的個別值緯作區(qū)間預(yù)測,需要尋找與點預(yù)測值記和預(yù)測目標(biāo)個別值緯有關(guān)的 統(tǒng)計量,并要明確其概率分布嚴(yán) 具體作肉:已知剩余項eF=YF-YF是與預(yù)測您 及個別值.都有關(guān)的變量,并且已知幺尸服從正態(tài)分布,且可證明EeF) =0Var(eF) = E(YF-Y f)2 =
48、 a2l + - + n (較復(fù)雜不具體證明)(Xf-X)2y X,2當(dāng)用&2=工£/_2)代替/時,對勺標(biāo)準(zhǔn)化的變量t為yf-yf#給定顯著性水平?jīng)r,查t分布表得自由度為N2 的臨界值滋-2),則有AAP Yf- ta/2 se2f )<yf<yf+ta/2 SE£) = 1 f因此,一元回歸時Y的個別值的置信度為1-喲預(yù)測區(qū)間上下限為嚴(yán)菽解釋變量Y區(qū)間預(yù)測的特點(1)Y平均值的預(yù)測值與真實平均值有誤差,主要是受抽樣波動影響預(yù)測區(qū)間Y個別值的預(yù)測值與真實個別值的差異,不僅受抽樣波動影響,而且還受隨機擾動項的影響預(yù)測區(qū)間昇+丄+"勸嚴(yán)(2) 平均值和個別值預(yù)測區(qū)間都不是常數(shù),是隨X” 的變化而變化的,當(dāng)Xp=壬時,預(yù)測區(qū)間最小。預(yù)測區(qū)間上下限與樣本容量有關(guān),當(dāng)樣本容量 I1T00時,個別值的預(yù)測區(qū)間只決定于隨機擾動的方差。87#
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 希望工程申請書
- 公積金申請書范文
- 退學(xué)申請書 職校
- 消費者行為分析大數(shù)據(jù)在服裝店的戰(zhàn)略價值
- 股權(quán)保全申請書
- 2024-2025學(xué)年高中語文第二單元置身詩境緣景明情第9課登岳陽樓學(xué)案新人教版選修中國古代詩歌散文欣賞
- 2024-2025學(xué)年高中政治第2單元生產(chǎn)勞動與經(jīng)營框題能力提升八練習(xí)含解析新人教版必修1
- 2024年高考物理一輪復(fù)習(xí)專題4.2平拋運動精講含解析
- 未來商業(yè)戰(zhàn)場的AR、VR與AI技術(shù)探索
- 生產(chǎn)線調(diào)整與節(jié)能減排的雙重目標(biāo)
- 城市綠化與生態(tài)環(huán)境改善
- 2024-2025學(xué)年中小學(xué)校第二學(xué)期師德師風(fēng)工作計劃:必看!新學(xué)期師德師風(fēng)建設(shè)秘籍大公開(附2月-7月工作安排表)
- 《急性心力衰竭的急救處理》課件
- 小學(xué)六年級數(shù)學(xué)上冊《簡便計算》練習(xí)題(310題-附答案)
- 青海省西寧市海湖中學(xué)2025屆中考生物仿真試卷含解析
- 2024年河南省《輔警招聘考試必刷500題》考試題庫及答案【全優(yōu)】
- 2024年中國養(yǎng)老產(chǎn)業(yè)商學(xué)研究報告-銀發(fā)經(jīng)濟專題
- 高教版2023年中職教科書《語文》(基礎(chǔ)模塊)下冊教案全冊
- 人教版英語七年級上冊閱讀理解專項訓(xùn)練16篇(含答案)
- Join-in-六年級下冊教案-Starter-unit-Join-in-us
- 建設(shè)工程檢測試驗收費標(biāo)準(zhǔn)
評論
0/150
提交評論