二、(簡單)古典假定下的計(jì)量經(jīng)濟(jì)方法(備用)_第1頁
二、(簡單)古典假定下的計(jì)量經(jīng)濟(jì)方法(備用)_第2頁
二、(簡單)古典假定下的計(jì)量經(jīng)濟(jì)方法(備用)_第3頁
二、(簡單)古典假定下的計(jì)量經(jīng)濟(jì)方法(備用)_第4頁
二、(簡單)古典假定下的計(jì)量經(jīng)濟(jì)方法(備用)_第5頁
已閱讀5頁,還剩112頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1引子引子: :中國出境旅游人數(shù)中國出境旅游人數(shù)20202020年將達(dá)一億人次年將達(dá)一億人次? ?中新社北京中新社北京4 4月月3 3日電日電 : :從中國出境旅游交易會上獲悉,中國從中國出境旅游交易會上獲悉,中國每年出境游人次以每年出境游人次以25%25%的速度持續(xù)增長,預(yù)計(jì)到的速度持續(xù)增長,預(yù)計(jì)到20202020年將達(dá)年將達(dá)一億人次。如今中國是世界上旅游消費(fèi)第二高的國家,在出一億人次。如今中國是世界上旅游消費(fèi)第二高的國家,在出國旅游的人群中,中國人平均每人每天的消費(fèi)達(dá)國旅游的人群中,中國人平均每人每天的消費(fèi)達(dá)175175美元。美元。另據(jù)報(bào)道另據(jù)報(bào)道: :到到20202020年,中國旅游業(yè)總

2、收入將超過年,中國旅游業(yè)總收入將超過30003000億美億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%8%至至11%11%。(國際金融報(bào)2004年11月25日) (參考現(xiàn)狀:第一產(chǎn)業(yè)占(參考現(xiàn)狀:第一產(chǎn)業(yè)占GDP15%,建筑業(yè)占,建筑業(yè)占GDP7%)什么決定性因素能使中國出境旅游達(dá)一億人次什么決定性因素能使中國出境旅游達(dá)一億人次?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?2 顯然,對旅游起決定性影響作用的是中國居民的收入顯然,對旅

3、游起決定性影響作用的是中國居民的收入水平水平. . “出境旅游人次出境旅游人次”或或“旅游業(yè)總收入旅游業(yè)總收入”(Y Y)與)與“居民居民平均收入平均收入”(X X)有怎樣的數(shù)量關(guān)系呢?)有怎樣的數(shù)量關(guān)系呢? 能否用某種線性或非線性關(guān)系式能否用某種線性或非線性關(guān)系式 Y= f ( X ) Y= f ( X ) 去表現(xiàn)這去表現(xiàn)這 種數(shù)量關(guān)系呢種數(shù)量關(guān)系呢? ?怎樣去表現(xiàn)呢怎樣去表現(xiàn)呢? ?具體分析變量間這樣的數(shù)量關(guān)系將涉及哪些理論和方具體分析變量間這樣的數(shù)量關(guān)系將涉及哪些理論和方法呢法呢? ?需要研究經(jīng)濟(jì)變量之間數(shù)量關(guān)系的方法需要研究經(jīng)濟(jì)變量之間數(shù)量關(guān)系的方法為了不使問題復(fù)雜化為了不使問題復(fù)雜化

4、, , 先從在某些標(biāo)準(zhǔn)的先從在某些標(biāo)準(zhǔn)的( (或古典或古典) )假假定條件下的最簡單的模型去討論定條件下的最簡單的模型去討論為什么先討論古典假定下的模型為什么先討論古典假定下的模型? ?比喻:比喻:學(xué)習(xí)經(jīng)濟(jì)學(xué)時學(xué)習(xí)經(jīng)濟(jì)學(xué)時, ,總先熟悉總先熟悉“完全競爭理論完全競爭理論”,然,然后再接觸后再接觸“壟斷和寡頭等非完全競爭理論壟斷和寡頭等非完全競爭理論”。但。但是是, ,并不是說并不是說“完全競爭理論完全競爭理論”就總是真實(shí)的。就總是真實(shí)的。4研究方式:研究方式:由簡單到復(fù)雜由簡單到復(fù)雜 !在簡單的情況下某些復(fù)雜的理論問!在簡單的情況下某些復(fù)雜的理論問題才更容易被闡述,也才最容易被接受,所以從最題

5、才更容易被闡述,也才最容易被接受,所以從最簡單的情況入手。簡單的情況入手。 一、簡單線性回歸模型一、簡單線性回歸模型在計(jì)量經(jīng)濟(jì)模型中,只有兩個變量的線性回歸模型最簡單,在計(jì)量經(jīng)濟(jì)模型中,只有兩個變量的線性回歸模型最簡單,稱為簡單線性回歸模型。簡單線性回歸原理也最直觀。稱為簡單線性回歸模型。簡單線性回歸原理也最直觀。本講先討論本講先討論 簡單線性回歸模型的研究方式,然后拓展到多簡單線性回歸模型的研究方式,然后拓展到多元的情況。元的情況。主要討論主要討論: 回歸分析的基本概念回歸分析的基本概念 線性回歸模型參數(shù)的估計(jì)線性回歸模型參數(shù)的估計(jì) 參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn) 回歸方程

6、的擬合優(yōu)度回歸方程的擬合優(yōu)度 回歸模型預(yù)測回歸模型預(yù)測6 (一)一) 回歸分析與回歸函數(shù)回歸分析與回歸函數(shù) 相關(guān)分析與回歸分析 (對統(tǒng)計(jì)學(xué)的回顧)(對統(tǒng)計(jì)學(xué)的回顧)1 1、經(jīng)濟(jì)變量間的相互關(guān)系、經(jīng)濟(jì)變量間的相互關(guān)系 性質(zhì)上可分為性質(zhì)上可分為 確定性的函數(shù)關(guān)系確定性的函數(shù)關(guān)系 Y=f (X) 用數(shù)學(xué)方法計(jì)算用數(shù)學(xué)方法計(jì)算 不確定性的統(tǒng)計(jì)關(guān)系不確定性的統(tǒng)計(jì)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系 Y= f(X)+ (為隨機(jī)變量為隨機(jī)變量) 用統(tǒng)計(jì)方法分析用統(tǒng)計(jì)方法分析 沒有關(guān)系沒有關(guān)系 不用分析不用分析 2、相關(guān)關(guān)系 相關(guān)關(guān)系的描述相關(guān)關(guān)系的描述 最直觀的描述方式最直觀的描述方式坐標(biāo)圖(散布圖、散點(diǎn)圖)坐標(biāo)圖(散布圖

7、、散點(diǎn)圖) 7函數(shù)關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系(線性線性)沒有關(guān)系沒有關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系(非線性非線性)8 8 相關(guān)關(guān)系的類型類型 從涉及的變量數(shù)量看從涉及的變量數(shù)量看 簡單相關(guān)簡單相關(guān) 多重相關(guān)(復(fù)相關(guān))多重相關(guān)(復(fù)相關(guān)) 從變量相關(guān)關(guān)系的表現(xiàn)形式看從變量相關(guān)關(guān)系的表現(xiàn)形式看 線性相關(guān)線性相關(guān)散布圖接近一條直線散布圖接近一條直線 非線性相關(guān)非線性相關(guān)散布圖接近一條曲線散布圖接近一條曲線 從變量相關(guān)關(guān)系變化的方向看從變量相關(guān)關(guān)系變化的方向看 正相關(guān)正相關(guān)變量同方向變化,同增同減變量同方向變化,同增同減 負(fù)相關(guān)負(fù)相關(guān)變量反方向變化,一增一減變量反方向變化,一增一減 不相關(guān)不相關(guān)9 3、相關(guān)程度

8、的度量相關(guān)系數(shù) 如果如果 和和 總體的全部數(shù)據(jù)都已知,總體的全部數(shù)據(jù)都已知, 和和 的方差和的方差和協(xié)方差也已知,則協(xié)方差也已知,則 X和和Y的的總體線性相關(guān)系數(shù)總體線性相關(guān)系數(shù): 其中:其中: -X 的方差的方差 -Y的方差的方差 -X和和Y的協(xié)方差的協(xié)方差總體相關(guān)系數(shù)總體相關(guān)系數(shù) 反映了總體兩個變量反映了總體兩個變量 和和 的線性相關(guān)程度,的線性相關(guān)程度,對于特定的總體來說,對于特定的總體來說, 和和 的數(shù)值是既定的,總體相關(guān)系的數(shù)值是既定的,總體相關(guān)系數(shù)數(shù) 是客觀存在的特定數(shù)值。然而,總體的兩個變量是客觀存在的特定數(shù)值。然而,總體的兩個變量 和和的全部數(shù)值通常不可能直接觀測,所以總體相關(guān)

9、系數(shù)一般的全部數(shù)值通常不可能直接觀測,所以總體相關(guān)系數(shù)一般是未知的。是未知的。 (, )()( )Cov X YVar X Var Y(, )Cov X Y()Var X( )Var YXXXXYYYYYX10X和和Y的的樣本線性相關(guān)系數(shù)樣本線性相關(guān)系數(shù):如果只知道如果只知道 X 和和 Y 的樣本觀測值,則的樣本觀測值,則X和和Y的的樣本線性樣本線性相關(guān)系數(shù)為:相關(guān)系數(shù)為: 其中:其中: 和和 分別是變量分別是變量X和和Y的樣本觀測值,的樣本觀測值, 和和 分別是變量分別是變量 X 和和Y 樣本值的平均值樣本值的平均值注意注意: 是隨抽樣而變動的隨機(jī)變量。是隨抽樣而變動的隨機(jī)變量。iY_X_Y

10、_22()()()()iiXYiiXXYYrXXYYiXXYr對相關(guān)系數(shù)的正確理解和使用對相關(guān)系數(shù)的正確理解和使用 X X和和Y Y 都是相互都是相互對稱對稱的隨機(jī)變量,的隨機(jī)變量, 線性相關(guān)系數(shù)只反映變量間的線性相關(guān)系數(shù)只反映變量間的線性相關(guān)線性相關(guān)程度,不能說明程度,不能說明非線性相關(guān)關(guān)系非線性相關(guān)關(guān)系 樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由于樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由于抽樣抽樣波動波動,樣本相關(guān)系數(shù)是隨抽樣而變動的,樣本相關(guān)系數(shù)是隨抽樣而變動的隨機(jī)變量隨機(jī)變量,其統(tǒng)計(jì)顯,其統(tǒng)計(jì)顯著性有待檢驗(yàn)著性有待檢驗(yàn) 相關(guān)系數(shù)只能反映變量間線性相關(guān)程度,相關(guān)系數(shù)只能反映變量間線性相

11、關(guān)程度,不能確定變量不能確定變量間的因果關(guān)系間的因果關(guān)系,也不能說明相關(guān)關(guān)系具體接近哪條直線。,也不能說明相關(guān)關(guān)系具體接近哪條直線。 只作變量間的相關(guān)分析還不能達(dá)到經(jīng)濟(jì)計(jì)量分析的目的。只作變量間的相關(guān)分析還不能達(dá)到經(jīng)濟(jì)計(jì)量分析的目的。 計(jì)量經(jīng)濟(jì)學(xué)關(guān)心的問題:計(jì)量經(jīng)濟(jì)學(xué)關(guān)心的問題:是是經(jīng)濟(jì)變量間的因果關(guān)系及隱經(jīng)濟(jì)變量間的因果關(guān)系及隱藏在隨機(jī)性后面的具體統(tǒng)計(jì)規(guī)律性,在這方面回歸分析方法藏在隨機(jī)性后面的具體統(tǒng)計(jì)規(guī)律性,在這方面回歸分析方法可以發(fā)揮更加重要的作用??梢园l(fā)揮更加重要的作用。11XYYXrr124 4、回歸分析、回歸分析回歸的古典意義古典意義: 高爾頓遺傳學(xué)的回歸概念高爾頓遺傳學(xué)的回歸概念

12、 ( ( 父母身高與子女身高的關(guān)系父母身高與子女身高的關(guān)系) )子女的身高有向人的平均身高子女的身高有向人的平均身高 回歸回歸 的趨勢的趨勢回歸的現(xiàn)代意義現(xiàn)代意義:一個被解釋變量對若干個一個被解釋變量對若干個解釋變量依存關(guān)系的研究解釋變量依存關(guān)系的研究回歸的目的目的(實(shí)質(zhì)實(shí)質(zhì)):由固定的解釋變量去估計(jì)由固定的解釋變量去估計(jì)被解釋變量的平均值被解釋變量的平均值13(1)注意明確幾個概念)注意明確幾個概念(為深刻理解“回歸”) 被解釋變量被解釋變量Y的的條件分布和條件概率條件分布和條件概率: 當(dāng)解釋變量當(dāng)解釋變量X取某固定值時(條件),取某固定值時(條件),Y的值不確定,的值不確定,Y的不同取值形

13、成一定的分布,這是的不同取值形成一定的分布,這是Y的的條件分布條件分布。 X取某取某固定值時,固定值時,Y取不同值的概率稱為取不同值的概率稱為條件概率條件概率。 被解釋變量被解釋變量Y的的條件期望條件期望: 對于對于X 的每一個取值,的每一個取值, 對對Y所形成的分布確所形成的分布確 定其期望或均值,稱定其期望或均值,稱 為為Y的的條件期望或條件均條件期望或條件均 值值用用 表示。表示。 注意注意:Y:Y的條件期望是隨的條件期望是隨X X的變動而變動的的變動而變動的 iX)(iXYE)(iXYEYX14回歸線回歸線:對于每一個:對于每一個X的取值的取值 ,都有,都有Y的條件期望的條件期望 與之

14、對應(yīng),代表與之對應(yīng),代表Y的條件期望的點(diǎn)的軌跡形成的條件期望的點(diǎn)的軌跡形成的直線或曲線稱為回歸線。的直線或曲線稱為回歸線?;貧w函數(shù)回歸函數(shù):被解釋變量:被解釋變量Y的條件期望的條件期望 隨隨解釋變量解釋變量X的變化而有規(guī)律的變化而有規(guī)律的變化,如果把的變化,如果把Y的條件期的條件期望表現(xiàn)為望表現(xiàn)為X的某種函數(shù)的某種函數(shù) ,這個函數(shù)稱為回歸函數(shù)。這個函數(shù)稱為回歸函數(shù)?;貧w函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù)回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù) iXX YiX()iE Y X()iE Y X()iE Y XE()()iiY Xf X15每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X

15、X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520662321258729003288家家132414001615194321852365265030213399庭庭144816502037221023982789

16、3064消消1489171220782289248728533142費(fèi)費(fèi)1538177821792313251329343274支支160018412298239825383110出出17021886231624232567 Y1900238724532610201224982487271025892586900115014001650190021502400265029003150E()iY X舉例舉例: 假如已知由假如已知由100100個家庭構(gòu)成的總體的數(shù)據(jù)個家庭構(gòu)成的總體的數(shù)據(jù) (單位單位:元元)(2)總體回歸函數(shù))總體回歸函數(shù)(PRF)16家庭消費(fèi)支出的條件期望與家庭收入的關(guān)系的圖形家

17、庭消費(fèi)支出的條件期望與家庭收入的關(guān)系的圖形:對于本例的總體,家庭消費(fèi)支出的條件期望對于本例的總體,家庭消費(fèi)支出的條件期望與家庭收入與家庭收入 基本是線性關(guān)系基本是線性關(guān)系, , 可以把家庭消費(fèi)可以把家庭消費(fèi)支出的條件均值表示為家庭收入的線性函數(shù):支出的條件均值表示為家庭收入的線性函數(shù):iiXXYE)()(iXYE)(iXYEiXiX17 總體回歸函數(shù)的概念總體回歸函數(shù)的概念 前提:前提:假如已知假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體的被解釋變量所研究的經(jīng)濟(jì)現(xiàn)象的總體的被解釋變量Y和解釋變量和解釋變量X的每個觀測值的每個觀測值(通常這是不可能的?。ㄍǔ_@是不可能的?。?,那么,可以計(jì)算出總體被解釋變

18、量么,可以計(jì)算出總體被解釋變量Y的條件期望的條件期望 ,并將其表現(xiàn)為解釋變量并將其表現(xiàn)為解釋變量X的某種函數(shù)的某種函數(shù) 這個函數(shù)稱為總體回歸函數(shù)(這個函數(shù)稱為總體回歸函數(shù)(PRF) 總體回歸函數(shù)表現(xiàn)的是特定總體中被解釋變量隨解釋總體回歸函數(shù)表現(xiàn)的是特定總體中被解釋變量隨解釋變量變動而變動的某種規(guī)律性。變量變動而變動的某種規(guī)律性。)()(iiXfXYE)(iXYE18 iuiXXY)(iXYEiY條件期望條件期望表現(xiàn)形式表現(xiàn)形式例如例如Y的條件期望的條件期望 是解是解 釋變量釋變量X的線性函數(shù),可表示為:的線性函數(shù),可表示為: 個別值個別值表現(xiàn)形式表現(xiàn)形式(隨機(jī)設(shè)定形式)(隨機(jī)設(shè)定形式) 對于一

19、定的對于一定的 ,Y的各個別值的各個別值 分布分布 在在 的周圍,若令各個的周圍,若令各個 與條件與條件 期望期望 的偏差為的偏差為 ,顯然,顯然 是個隨機(jī)變量是個隨機(jī)變量 則有則有 iYiYiX)(iXYE12()()iiiiE Y Xf XX)(iXYE)(iXYEiuiuiiiiiiXYXYEYu21)(12iiiYXu總體回歸函數(shù)的表現(xiàn)形式總體回歸函數(shù)的表現(xiàn)形式PRF如何理解總體回歸函數(shù)如何理解總體回歸函數(shù)作為總體運(yùn)行的客觀規(guī)律,總體回歸函數(shù)是客觀存在作為總體運(yùn)行的客觀規(guī)律,總體回歸函數(shù)是客觀存在的,但在的,但在實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知未

20、知的,的,只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去設(shè)定設(shè)定。計(jì)量經(jīng)濟(jì)學(xué)研究中計(jì)量經(jīng)濟(jì)學(xué)研究中“計(jì)量計(jì)量”的根本目的就是要尋求總體的根本目的就是要尋求總體回歸函數(shù)。我們所設(shè)定的計(jì)量模型實(shí)際就是在設(shè)定總體回歸函數(shù)。我們所設(shè)定的計(jì)量模型實(shí)際就是在設(shè)定總體回歸函數(shù)的具體形式?;貧w函數(shù)的具體形式??傮w回歸函數(shù)中總體回歸函數(shù)中Y Y與與X X的關(guān)系可以是的關(guān)系可以是線性線性的,也可以的,也可以是是非線性非線性的。的。1920注意:注意:在計(jì)量經(jīng)濟(jì)學(xué)中,線性回歸模型主要指在計(jì)量經(jīng)濟(jì)學(xué)中,線性回歸模型主要指就參數(shù)就參數(shù)而言而言是是“線性線性”的的,因?yàn)橹灰獙?shù)而言是線性的因?yàn)橹灰獙?shù)而言是

21、線性的,都都可以用類似的方法去估計(jì)其參數(shù),都可以歸于線性回可以用類似的方法去估計(jì)其參數(shù),都可以歸于線性回歸。歸。iiiXXYE21)(12()lniiiE Y XXiiiXXYE21)(“線性線性”的判斷的判斷 (3 3)隨機(jī)擾動項(xiàng))隨機(jī)擾動項(xiàng)u概念概念 在總體回歸函數(shù)中,各在總體回歸函數(shù)中,各 個個 的值與其條件期望的值與其條件期望 的偏差的偏差 有很重有很重要的意義。若只有要的意義。若只有 影響影響Y 與與 不應(yīng)有偏差。不應(yīng)有偏差。若偏差若偏差 存在,說明有其他影響因素,存在,說明有其他影響因素, 實(shí)際代表了排除在模型以外的所有因素對實(shí)際代表了排除在模型以外的所有因素對Y的影響。的影響。性

22、質(zhì)性質(zhì) 是其期望為是其期望為0有一定分布的隨機(jī)變量有一定分布的隨機(jī)變量重要性:重要性:隨機(jī)擾動項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)分析結(jié)隨機(jī)擾動項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)分析結(jié) 果的性質(zhì)和計(jì)量經(jīng)濟(jì)方法的選擇果的性質(zhì)和計(jì)量經(jīng)濟(jì)方法的選擇21iuiuiY)(iiXYEiuiXXY()iE Y XiYiuiY)(iiXYEXiu 引入隨機(jī)擾動項(xiàng)引入隨機(jī)擾動項(xiàng) 的原因的原因是是未知未知影響因素影響因素的代表的代表( (理論的模糊性理論的模糊性) ) 是是無法取得數(shù)據(jù)無法取得數(shù)據(jù)的已知影響因素的代表的已知影響因素的代表( (數(shù)據(jù)欠缺數(shù)據(jù)欠缺) ) 是是眾多細(xì)小影響因素眾多細(xì)小影響因素的綜合代表的綜合代表( (非系統(tǒng)性影響

23、非系統(tǒng)性影響) ) 模型可能存在模型可能存在設(shè)定誤差設(shè)定誤差( (變量、函數(shù)形式的設(shè)定)變量、函數(shù)形式的設(shè)定) 模型中變量可能存在模型中變量可能存在觀測誤差觀測誤差( (變量數(shù)據(jù)不符合實(shí)際變量數(shù)據(jù)不符合實(shí)際) ) 變量可能有內(nèi)在變量可能有內(nèi)在隨機(jī)性隨機(jī)性( (人類行為的內(nèi)在隨機(jī)性人類行為的內(nèi)在隨機(jī)性) )22iu(4)樣本回歸函數(shù))樣本回歸函數(shù)(SRF)樣本回歸線:樣本回歸線: 對于對于X的一定值,取得的一定值,取得Y 的樣本觀測值,可計(jì)算其條件的樣本觀測值,可計(jì)算其條件 均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數(shù):樣本回歸函數(shù)

24、:如果把被解釋變量如果把被解釋變量Y的樣本條件的樣本條件均值均值 表示為解釋變量表示為解釋變量X的某種的某種函數(shù),這個函數(shù)稱為樣本回歸函函數(shù),這個函數(shù)稱為樣本回歸函數(shù)(數(shù)(SRF)。)。 23XYiYiYiXSRF24 樣本回歸函數(shù)如果為線性函數(shù),可表示為樣本回歸函數(shù)如果為線性函數(shù),可表示為 其中:其中: 是與是與 相對應(yīng)的相對應(yīng)的 Y 的樣本條件均值的樣本條件均值 和和 分別是樣本回歸函數(shù)的參數(shù)分別是樣本回歸函數(shù)的參數(shù) 個別值(實(shí)際值)形式:個別值(實(shí)際值)形式: 被解釋變量被解釋變量Y的實(shí)際觀測值的實(shí)際觀測值 不完全等于樣本條件均值不完全等于樣本條件均值 ,二者之差用二者之差用 表示,表示

25、, 稱為稱為剩余項(xiàng)剩余項(xiàng)或或殘差項(xiàng)殘差項(xiàng): 則則 或或 12iiYXiY12iYieiiieYY12iiiYXeiXie樣本回歸函數(shù)的函數(shù)形式樣本回歸函數(shù)的函數(shù)形式iY條件均值形式:條件均值形式:樣本回歸函數(shù)樣本回歸函數(shù)的特點(diǎn)的特點(diǎn)樣本回歸線隨抽樣波動而變化樣本回歸線隨抽樣波動而變化:每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,線,(SRF不唯一不唯一) Y SRF1 SRF2 樣本回歸函數(shù)的函數(shù)形式樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致。函數(shù)形式一致。 X 樣本回歸線只是樣本條件均值的軌跡,還

26、不是總體回歸樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸 線,它至多只是未知的總體回歸線的近似表現(xiàn)。線,它至多只是未知的總體回歸線的近似表現(xiàn)。25樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系 SRF PRF A X 26iYYiYiY()iiE Y XieiuiX對樣本回歸的理解對樣本回歸的理解 如果能夠通過某種方式獲得如果能夠通過某種方式獲得 和和 的數(shù)值,顯然的數(shù)值,顯然: 和和 是對總體回歸函數(shù)參數(shù)是對總體回歸函數(shù)參數(shù) 和和 的估計(jì)的估計(jì) 是對總體條件期望是對總體條件期望 的估計(jì)的估計(jì) 在概念上類似總體回歸函數(shù)中的在概念上類似總體回歸函數(shù)中的 ,可視,可視 為對為

27、對 的估計(jì)。的估計(jì)。27對比:對比: 總體回歸函數(shù)總體回歸函數(shù) 樣本回歸函數(shù)樣本回歸函數(shù)12iYieiuiu12()iiE Y X1212()iiiE Y XX12iiiYXu12iiYX12iiiYXe28 目的: 計(jì)量經(jīng)濟(jì)分析的目標(biāo)是尋求總體回歸函數(shù)計(jì)量經(jīng)濟(jì)分析的目標(biāo)是尋求總體回歸函數(shù)。即用樣本即用樣本回歸函數(shù)回歸函數(shù)SRF去估計(jì)總體回歸函數(shù)去估計(jì)總體回歸函數(shù)PRF。 由于樣本對總體總是存在代表性誤差,由于樣本對總體總是存在代表性誤差,SRF 總會總會過高或過低估計(jì)過高或過低估計(jì)PRF。要解決的問題:要解決的問題: 尋求一種規(guī)則和方法,使其得到的尋求一種規(guī)則和方法,使其得到的SRF的參數(shù)的

28、參數(shù) 和和 盡可能盡可能“接近接近”總體回歸函數(shù)中的參數(shù)總體回歸函數(shù)中的參數(shù) 和和 的真實(shí)值。的真實(shí)值。這樣的這樣的“規(guī)則和方法規(guī)則和方法”有多種,最常用的是最小二乘法有多種,最常用的是最小二乘法11212回歸分析的目的回歸分析的目的(二)(二) 簡單線性回歸模型的最小二乘估計(jì)簡單線性回歸模型的最小二乘估計(jì)用樣本去估計(jì)總體回歸函數(shù),除了樣本以外,針對特定的用樣本去估計(jì)總體回歸函數(shù),除了樣本以外,針對特定的估計(jì)方法,還需要有一些前提條件估計(jì)方法,還需要有一些前提條件假定條件假定條件 1 1、簡單線性回歸的基本假定簡單線性回歸的基本假定 為什么要作基本假定?為什么要作基本假定? 只有具備一定的假定

29、條件,所作出的估計(jì)才具有良好只有具備一定的假定條件,所作出的估計(jì)才具有良好的的統(tǒng)計(jì)性質(zhì)統(tǒng)計(jì)性質(zhì)。 因?yàn)槟P椭杏须S機(jī)擾動項(xiàng),估計(jì)的參數(shù)是隨機(jī)變量,因?yàn)槟P椭杏须S機(jī)擾動項(xiàng),估計(jì)的參數(shù)是隨機(jī)變量,顯然參數(shù)估計(jì)值的分布與擾動項(xiàng)的分布有關(guān),只有對顯然參數(shù)估計(jì)值的分布與擾動項(xiàng)的分布有關(guān),只有對隨機(jī)擾動的分布作出假定,才能比較方便地隨機(jī)擾動的分布作出假定,才能比較方便地確定所估確定所估計(jì)參數(shù)的分布性質(zhì)計(jì)參數(shù)的分布性質(zhì),也才可能進(jìn)行,也才可能進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估假設(shè)檢驗(yàn)和區(qū)間估計(jì)。計(jì)。假定分為:假定分為:對模型和變量的假定對模型和變量的假定對隨機(jī)擾動項(xiàng)的假定對隨機(jī)擾動項(xiàng)的假定 29(1 1)對模型和變量的假定

30、)對模型和變量的假定如如 假定模型設(shè)定是正確的(變量和模型假定模型設(shè)定是正確的(變量和模型無設(shè)定誤差)無設(shè)定誤差)假定解釋變量假定解釋變量X在重復(fù)抽樣中取固定值在重復(fù)抽樣中取固定值。 假定解釋變量假定解釋變量X是非隨機(jī)是非隨機(jī)的,或者雖然是隨機(jī)的,的,或者雖然是隨機(jī)的, 但但與擾動項(xiàng)與擾動項(xiàng)u是不相關(guān)是不相關(guān)的。的。(從變量從變量X角度看角度看)有時還假定有時還假定: (通常是不言而喻的通常是不言而喻的)回歸模型對參數(shù)而言是線性的回歸模型對參數(shù)而言是線性的解釋變量解釋變量X的值有變異性的值有變異性觀測次數(shù)觀測次數(shù)n必須大于待估計(jì)參數(shù)個數(shù)必須大于待估計(jì)參數(shù)個數(shù)(解釋變量個數(shù)解釋變量個數(shù))3012

31、iiiYXu(2 2)對隨機(jī)擾動項(xiàng))對隨機(jī)擾動項(xiàng)u u的假定的假定 假定假定1 1:零均值假定零均值假定: 在給定在給定X的條件下,的條件下, 的條件期望為零的條件期望為零 假定假定2 2:同方差假定同方差假定: 在給定在給定X的條件下,的條件方差為某個常數(shù)的條件下,的條件方差為某個常數(shù) 31iu22)()(iiiiiXuEuEXuVariu()0iiE u X2 假定假定3 3:無自相關(guān)假定無自相關(guān)假定: 隨機(jī)擾動項(xiàng)隨機(jī)擾動項(xiàng) 的逐次值互不相關(guān)的逐次值互不相關(guān) 假定假定4 4:隨機(jī)擾動隨機(jī)擾動 與解釋變量與解釋變量 不相關(guān)不相關(guān) (從隨機(jī)擾動從隨機(jī)擾動 角度看角度看) iuiuiXiu( ,

32、)( )()()0()ijiijjijCov u uE uE uuE uE uuij( ,)( )()0iiiiiiCov u XE uE uXE X233假定假定5:注意注意: :并不是參數(shù)估計(jì)的每一具體步驟都要用到所有的假定并不是參數(shù)估計(jì)的每一具體步驟都要用到所有的假定, ,但對全部假定有完整的認(rèn)識但對全部假定有完整的認(rèn)識, ,對學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)的原理對學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)的原理是有益的。是有益的。iuiu2( ,)iuN o在對在對 的基本假定下的基本假定下 Y Y 的分布性質(zhì)的分布性質(zhì)由于由于其中的其中的 和和 是非隨機(jī)的,因此是非隨機(jī)的,因此 的分布性質(zhì)決定了的分布性質(zhì)決定了 的分布性質(zhì)。的

33、分布性質(zhì)。 對對 的一些假定可以等價(jià)地表示為對的一些假定可以等價(jià)地表示為對 的假定:的假定: 假定假定1:零均值假定:零均值假定 假定假定2:同方差假定:同方差假定 假定假定3:無自相關(guān)假定:無自相關(guān)假定 假定假定5:正態(tài)性假定:正態(tài)性假定 34iuiiiuXY21iuiuiYiY212(,)iiYNXiiiXXYE21)(12, iX2()iiVar Y X( ,)0ijCov Y Y 2、普通最小二乘法普通最小二乘法(OLS) (rdinary Least Squaresrdinary Least Squares)(1)OLS的基本思想:的基本思想: 對于對于 不同的估計(jì)方法可以得到不同的

34、樣不同的估計(jì)方法可以得到不同的樣本回歸參數(shù)本回歸參數(shù) 和和 ,所估計(jì)的,所估計(jì)的 也就不同。也就不同。 理想的估計(jì)方法應(yīng)使理想的估計(jì)方法應(yīng)使 與與 的差的差(即剩余即剩余 )總總的來說越小越好的來說越小越好 因因 可正可負(fù),總有可正可負(fù),總有 ,所以可以取,所以可以取 最最小,即小,即在觀測值在觀測值Y和和X確定時,確定時, 的大小決定于的大小決定于 和和 。3512iYiYieie2ie2212minmin()iiieYXiY2ie1212iiYX0ie (2) 正規(guī)方程和估計(jì)式正規(guī)方程和估計(jì)式用克萊姆法則求解得以觀測值表現(xiàn)的用克萊姆法則求解得以觀測值表現(xiàn)的OLS估計(jì)式:估計(jì)式: 36212

35、2()iiiiiiiXYXX YnXX222()iiiiiinX YXYnXX取偏導(dǎo)數(shù)并令其為取偏導(dǎo)數(shù)并令其為0,得正規(guī)方程,得正規(guī)方程12212iiiiiiYnXX YXX21212122()2()0()2()0iiiiiiieYXeYXX 或或00iiiee X即即37 為表達(dá)得更簡潔,或者用離差形式為表達(dá)得更簡潔,或者用離差形式OLS估計(jì)式估計(jì)式: 容易證明容易證明由正規(guī)方程:由正規(guī)方程: 注意:注意:其中:其中: 本課程中大寫的本課程中大寫的 和和 均表示觀測值;均表示觀測值; 小寫的小寫的 和和 均表示觀測值的離差均表示觀測值的離差而且由而且由樣本回歸函數(shù)可用離差形式寫為樣本回歸函數(shù)

36、可用離差形式寫為 _12YXXXxiiYYyii用離差表現(xiàn)的用離差表現(xiàn)的OLSOLS估計(jì)式估計(jì)式iiiyxiiXY2112YXixiyiXiY_22_222()()()()iiiiiiiiiiiinX YXYXX YYx yxnXXXX (3) OLSOLS回歸線的數(shù)學(xué)性質(zhì)回歸線的數(shù)學(xué)性質(zhì) 可以證明可以證明:(見教材:(見教材P33P34證明)證明) (證明過程用到證明過程用到OLS的結(jié)論,但與基本假定無關(guān)的結(jié)論,但與基本假定無關(guān)) 回歸線通過樣本均值回歸線通過樣本均值 估計(jì)值估計(jì)值 的均值等于實(shí)的均值等于實(shí) 際觀測值際觀測值 的均值的均值 剩余項(xiàng)剩余項(xiàng) 的均值為零的均值為零 38ie0iee

37、nYXXYiY12YXiY12121()iiXXYYnn(由OLS第一個正規(guī)方程直接得到)(由OLS正規(guī)方程 兩邊同除n得到)12()0iiYX 被解釋變量估計(jì)值被解釋變量估計(jì)值 與剩余項(xiàng)與剩余項(xiàng) 不相關(guān)不相關(guān) Cov(,)0iiY eiYie 解釋變量解釋變量 與剩余項(xiàng)與剩余項(xiàng) 不相關(guān)不相關(guān) ieiXCov(,)0iiX e由OLS正規(guī)方程有:1Cov(, )()()0iiiiiiieX eeeXneXXX12121Cov( , )()()()()()0iiiiiii iiiiiiiY eYYeenYYeYeYeeeeeXX00iiiee X(注意注意:紅色的項(xiàng)為紅色的項(xiàng)為0)(4 4)OL

38、SOLS估計(jì)式的統(tǒng)計(jì)性質(zhì)估計(jì)式的統(tǒng)計(jì)性質(zhì)參數(shù)估計(jì)式的優(yōu)劣需要有評價(jià)的標(biāo)準(zhǔn)參數(shù)估計(jì)式的優(yōu)劣需要有評價(jià)的標(biāo)準(zhǔn) 參數(shù)無法通過觀測直接確定,只能通過樣本估計(jì),但因參數(shù)無法通過觀測直接確定,只能通過樣本估計(jì),但因存在抽樣波動存在抽樣波動,參數(shù)估計(jì)值不一定等于總體參數(shù)的真實(shí)值參數(shù)估計(jì)值不一定等于總體參數(shù)的真實(shí)值。 參數(shù)估計(jì)方法及所確定的估計(jì)式不一定完備,不一定參數(shù)估計(jì)方法及所確定的估計(jì)式不一定完備,不一定能得到總體參數(shù)的真實(shí)值,需要對估計(jì)方法作評價(jià)與選擇。能得到總體參數(shù)的真實(shí)值,需要對估計(jì)方法作評價(jià)與選擇。比較不同估計(jì)方法的估計(jì)結(jié)果時,需要有一定的評價(jià)標(biāo)準(zhǔn)比較不同估計(jì)方法的估計(jì)結(jié)果時,需要有一定的評價(jià)標(biāo)準(zhǔn)

39、 基本要求:基本要求:參數(shù)估計(jì)值應(yīng)盡可能地接近總體參數(shù)的真實(shí)值參數(shù)估計(jì)值應(yīng)盡可能地接近總體參數(shù)的真實(shí)值估計(jì)準(zhǔn)則:估計(jì)準(zhǔn)則:“盡可能地接近盡可能地接近” 原則原則理論計(jì)量經(jīng)濟(jì)學(xué)主要討論參數(shù)估計(jì)式是否符合一定的準(zhǔn)則,理論計(jì)量經(jīng)濟(jì)學(xué)主要討論參數(shù)估計(jì)式是否符合一定的準(zhǔn)則,怎樣才算怎樣才算“盡可能地接近盡可能地接近”總體參數(shù)的真實(shí)值呢?這決定于總體參數(shù)的真實(shí)值呢?這決定于參數(shù)估計(jì)式的統(tǒng)計(jì)性質(zhì):無偏性、最小方差性、一致性等。參數(shù)估計(jì)式的統(tǒng)計(jì)性質(zhì):無偏性、最小方差性、一致性等。 4041 無偏性 前提:前提:重復(fù)抽樣重復(fù)抽樣中中估計(jì)方法固定估計(jì)方法固定、樣本數(shù)不變樣本數(shù)不變、經(jīng)、經(jīng) 重復(fù)抽樣的觀測值重復(fù)抽樣

40、的觀測值, ,可得一系列參數(shù)估計(jì)值可得一系列參數(shù)估計(jì)值 , ,的分布稱為的分布稱為 的抽樣分布,其密度函數(shù)記為的抽樣分布,其密度函數(shù)記為如果如果 稱稱 是參數(shù)是參數(shù)的無偏估計(jì)式,否則的無偏估計(jì)式,否則 則稱則稱 是有偏的估計(jì),其偏倚為是有偏的估計(jì),其偏倚為 (見圖2)( )f( )E( )E( )E42 概 率 密 度 估計(jì)值 偏倚偏倚)(*E( )f)(*f圖243 最小方差最小方差( (有效有效) )性性前提:前提:樣本相同樣本相同、用、用不同的方法不同的方法估計(jì)參數(shù),可以找到若干估計(jì)參數(shù),可以找到若干 個不同的估計(jì)式個不同的估計(jì)式 目標(biāo)目標(biāo): 努力尋求其抽樣分布具有最小方差的估計(jì)式努力尋

41、求其抽樣分布具有最小方差的估計(jì)式 最小方差準(zhǔn)則最小方差準(zhǔn)則 (見圖(見圖3 3) 既是無偏的同時又具有最小方差特性的估計(jì)式,稱為既是無偏的同時又具有最小方差特性的估計(jì)式,稱為最佳最佳 (有效)估計(jì)式。(有效)估計(jì)式。44概概 率率 密密 度度圖 3*()f( )f估計(jì)值估計(jì)值( )f 漸近性質(zhì)漸近性質(zhì)(大樣本性質(zhì))(大樣本性質(zhì))思想思想:當(dāng)樣本容量較小時,有時很難找到方差最小的無偏估計(jì),當(dāng)樣本容量較小時,有時很難找到方差最小的無偏估計(jì),需要考慮樣本擴(kuò)大后的性質(zhì)(需要考慮樣本擴(kuò)大后的性質(zhì)(估計(jì)方法不變估計(jì)方法不變,樣本數(shù)逐步增大樣本數(shù)逐步增大)一致性:一致性: 當(dāng)樣本容量當(dāng)樣本容量 n 趨于無窮

42、大時,如果估計(jì)式趨于無窮大時,如果估計(jì)式 依概率收斂于總體依概率收斂于總體參數(shù)的真實(shí)值,就稱這個估計(jì)式參數(shù)的真實(shí)值,就稱這個估計(jì)式 是是 的一致估計(jì)式。即的一致估計(jì)式。即 或或 (漸近無偏估計(jì)式是當(dāng)樣本容量變得足夠大時其偏倚趨于零的(漸近無偏估計(jì)式是當(dāng)樣本容量變得足夠大時其偏倚趨于零的估計(jì)式)估計(jì)式) (見圖4)漸近有效性:漸近有效性:當(dāng)樣本容量當(dāng)樣本容量 n 趨于無窮大時,在所有的一致估計(jì)趨于無窮大時,在所有的一致估計(jì)式中,具有最小的漸近方差。式中,具有最小的漸近方差。451)(limPnP)lim(46概率密度估計(jì)值圖 4100()f80( )f40()f20()f 分析OLSOLS估計(jì)式

43、的統(tǒng)計(jì)性質(zhì)估計(jì)式的統(tǒng)計(jì)性質(zhì)先明確幾點(diǎn)先明確幾點(diǎn): :由由OLS估計(jì)式可以看出估計(jì)式可以看出 都都由可觀測的樣本值由可觀測的樣本值 和和 唯一表示。唯一表示。 因存在抽樣波動,因存在抽樣波動,OLS估計(jì)估計(jì) 是隨機(jī)變量是隨機(jī)變量 OLS估計(jì)式是估計(jì)式是點(diǎn)估計(jì)式點(diǎn)估計(jì)式 2122()iiiiiiiXYXX YnXX47iYiX222()iiiiiinX YXYnXXkk1、 線性特征線性特征 是是Y的線性函數(shù)的線性函數(shù) 2、 無偏特性無偏特性 (證明見教材證明見教材P37) 48kkE)(222()()()iiiiiiiiXXYYx yk yXXxOLSOLS估計(jì)式的統(tǒng)計(jì)性質(zhì)估計(jì)式的統(tǒng)計(jì)性質(zhì)高斯定

44、理高斯定理2iiixkxk12YXiiYXkY1()iiXk Yn3、 最小方差特性最小方差特性 (證明見教材證明見教材P68附錄附錄21) 在所有的線性無偏估計(jì)中,在所有的線性無偏估計(jì)中,OLS估計(jì)估計(jì) 具有最小方差具有最小方差(注意(注意:無偏性和最小方差性的證明中用到基本假定無偏性和最小方差性的證明中用到基本假定 1-假定假定4)結(jié)論結(jié)論(高斯定理)(高斯定理):在古典假定條件下,在古典假定條件下,OLSOLS估計(jì)式是最佳線性無偏估計(jì)估計(jì)式是最佳線性無偏估計(jì)式(式(BLUEBLUE)49k (三(三) ) 擬合優(yōu)度的度量擬合優(yōu)度的度量概念概念:樣本回歸線是對樣本數(shù)據(jù)樣本回歸線是對樣本數(shù)據(jù)

45、的一種擬合,不同的模型的一種擬合,不同的模型(如不同函數(shù)形式(如不同函數(shù)形式)或不同或不同的估計(jì)方法可以擬合出不同的估計(jì)方法可以擬合出不同的回歸線,擬合的回歸線與的回歸線,擬合的回歸線與樣本觀測值總是有偏離。樣本觀測值總是有偏離。樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度稱稱為為擬合優(yōu)度擬合優(yōu)度如何度量擬合優(yōu)度呢?如何度量擬合優(yōu)度呢?擬合優(yōu)度的度量建立在對擬合優(yōu)度的度量建立在對Y的總變差分解的基礎(chǔ)上的總變差分解的基礎(chǔ)上50XY 1、總變差的分解、總變差的分解 分析分析Y的觀測值的觀測值 、估計(jì)值、估計(jì)值 與平均值與平均值 的關(guān)系的關(guān)系 將上式兩邊平方加總,可證

46、得將上式兩邊平方加總,可證得(提示有交叉項(xiàng)(提示有交叉項(xiàng) ) (TSS) (ESS) (RSS) 或者或者 總變差總變差 (TSS):被解釋變量:被解釋變量Y的觀測值與其平均值的離差平的觀測值與其平均值的離差平 方和方和(總平方和)(總平方和)(說明說明 Y 的變動程度)的變動程度) 解釋了的變差解釋了的變差 (ESS):被解釋變量:被解釋變量Y的估計(jì)值與其平均值的的估計(jì)值與其平均值的 離差平方和離差平方和(回歸平方和)(回歸平方和) 剩余平方和剩余平方和 (RSS):被解釋變量觀測值與估計(jì)值之差的平方:被解釋變量觀測值與估計(jì)值之差的平方 和和(未解釋的平方和)(未解釋的平方和)51()()i

47、iiiYYYYYY222()()()iiiiYYYYYY2iy222iiiyye2ie()0iiYY e2iyiYiYY Y X 52iYYiX來自殘差SRF變差分解的圖示變差分解的圖示()iYY 來自回歸ie()iYY 變差iYiY 2、可決系數(shù)、可決系數(shù) 以以TSS同除總變差等式兩邊:同除總變差等式兩邊: 或或 定義:定義:回歸平方和(解釋了的變差回歸平方和(解釋了的變差ESS) 在總變在總變 差(差(TSS) 中所占的比重稱為可決系數(shù),用中所占的比重稱為可決系數(shù),用 或或 表示表示: 532iy2r2iy222iyRy2221iieRy 22221iiiyyey或或2R222222()(

48、)()()()()iiiiiiiYYYYYYYYYYYY可決系數(shù)的作用可決系數(shù)的作用 可決系數(shù)越大,說明在總變差中由模型作出了解可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)越小,說明模型對樣本觀測值的擬合之可決系數(shù)越小,說明模型對樣本觀測值的擬合程度越差。程度越差。 可決系數(shù)的特點(diǎn)可決系數(shù)的特點(diǎn): 可決系數(shù)取值范圍:可決系數(shù)取值范圍: 隨抽樣波動,樣本可決系數(shù)隨抽樣波動,樣本可決系數(shù) 是隨抽樣而變是隨抽樣而變 動的隨機(jī)變量動的隨機(jī)變量 可決系數(shù)是非負(fù)的統(tǒng)計(jì)量可決系數(shù)是非負(fù)的統(tǒng)計(jì)量54201R2R可決系數(shù)

49、與相關(guān)系數(shù)的關(guān)系可決系數(shù)與相關(guān)系數(shù)的關(guān)系聯(lián)系:聯(lián)系:數(shù)值上可決系數(shù)是相關(guān)系數(shù)的平方數(shù)值上可決系數(shù)是相關(guān)系數(shù)的平方552222222222222222222222()()()()()()()iiiiiiiiiiiiiiiiiiiyxRyyxxyyx yx yxyxyrx yx可決系數(shù)與相關(guān)系數(shù)的關(guān)系可決系數(shù)與相關(guān)系數(shù)的關(guān)系區(qū)別:區(qū)別: 可決系數(shù)可決系數(shù) 相關(guān)系數(shù)相關(guān)系數(shù) 就模型而言就模型而言 就兩個變量而言就兩個變量而言 說明解釋變量對應(yīng)變說明解釋變量對應(yīng)變 說明兩變量線性依存程度說明兩變量線性依存程度 量的解釋程度量的解釋程度 度量的不對稱的因果關(guān)系度量的不對稱的因果關(guān)系 度量的對稱的相關(guān)關(guān)系

50、度量的對稱的相關(guān)關(guān)系 取值取值 0 1 取值取值 -1r1 有非負(fù)性有非負(fù)性 可正可負(fù)可正可負(fù)562R運(yùn)用可決系數(shù)時應(yīng)注意:運(yùn)用可決系數(shù)時應(yīng)注意: 可決系數(shù)只是說明列入模型的所有解釋變量對可決系數(shù)只是說明列入模型的所有解釋變量對 被解釋變量的被解釋變量的聯(lián)合聯(lián)合的影響程度,不說明模型中每個解的影響程度,不說明模型中每個解 釋變量的影響程度(在多元中)釋變量的影響程度(在多元中) 如果回歸的主要目的是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追如果回歸的主要目的是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追 求高的可決系數(shù),而是要得到總體回歸系數(shù)可信的求高的可決系數(shù),而是要得到總體回歸系數(shù)可信的 估計(jì)量??蓻Q系數(shù)高并不一定每個回歸系數(shù)都可

51、信任。估計(jì)量??蓻Q系數(shù)高并不一定每個回歸系數(shù)都可信任。 如果研究的主要目的只是為了預(yù)測被解釋變量值,如果研究的主要目的只是為了預(yù)測被解釋變量值, 不是為了正確估計(jì)回歸系數(shù),一般可考慮有較高的可不是為了正確估計(jì)回歸系數(shù),一般可考慮有較高的可 決系數(shù)。決系數(shù)。57(四(四) ) 回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)為什么要作區(qū)間估計(jì)?為什么要作區(qū)間估計(jì)? OLS估計(jì)只是通過樣本得到的點(diǎn)估計(jì),不一定等估計(jì)只是通過樣本得到的點(diǎn)估計(jì),不一定等于真實(shí)參數(shù),還需要找到真實(shí)參數(shù)的可能范圍,并說于真實(shí)參數(shù),還需要找到真實(shí)參數(shù)的可能范圍,并說明其可靠性明其可靠性為什么要作假設(shè)檢驗(yàn)?為什么要作假

52、設(shè)檢驗(yàn)?OLS 估計(jì)只是用樣本估計(jì)的結(jié)果,是否可靠?估計(jì)只是用樣本估計(jì)的結(jié)果,是否可靠? 是否抽樣的偶然結(jié)果?還有待統(tǒng)計(jì)檢驗(yàn)。是否抽樣的偶然結(jié)果?還有待統(tǒng)計(jì)檢驗(yàn)。區(qū)間估計(jì)和假設(shè)檢驗(yàn)都是建立在確定參數(shù)估區(qū)間估計(jì)和假設(shè)檢驗(yàn)都是建立在確定參數(shù)估計(jì)值計(jì)值 概率分布性質(zhì)的基礎(chǔ)上。概率分布性質(zhì)的基礎(chǔ)上。k59 1 1、OLSOLS估計(jì)的分布性質(zhì)估計(jì)的分布性質(zhì) 基本思想基本思想 是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)間估計(jì)和假設(shè)檢驗(yàn)間估計(jì)和假設(shè)檢驗(yàn) 怎樣確定怎樣確定 的分布性質(zhì)呢的分布性質(zhì)呢? 是服從正態(tài)分布的隨機(jī)變量,決定了是服從正態(tài)分布的隨機(jī)變量,決定了 也

53、是服從正也是服從正態(tài)分布的隨機(jī)變量,態(tài)分布的隨機(jī)變量, 是是 的線性函數(shù),決定了的線性函數(shù),決定了 也是服從正態(tài)分布的隨機(jī)變量也是服從正態(tài)分布的隨機(jī)變量 正態(tài)正態(tài) 正態(tài)正態(tài) 正態(tài)正態(tài) 只要確定只要確定 的期望和方差,即可確定的期望和方差,即可確定 的分布性質(zhì)的分布性質(zhì) kkiuiYiYiuiYkkkkk60 的期望:的期望: (已證明是無偏估計(jì))已證明是無偏估計(jì)) 的方差和標(biāo)準(zhǔn)誤差的方差和標(biāo)準(zhǔn)誤差 (證明見證明見P38,要求看懂!要求看懂!) (標(biāo)準(zhǔn)誤差是方差的平方根標(biāo)準(zhǔn)誤差是方差的平方根) 注意:注意:以上各式中以上各式中 未知但是個常數(shù),其余均是已知的未知但是個常數(shù),其余均是已知的樣本觀測

54、值,這時樣本觀測值,這時 和和 都不是隨機(jī)變量。都不是隨機(jī)變量。 ()kkE22()iSEx 的期望和方差222()iVarx2212()iiXVarnx212SE()iiXnx2kkk)(kVar)(kSE61 基本思想:基本思想: 是是 的方差,而的方差,而 不能直接觀測,只能從由樣本得不能直接觀測,只能從由樣本得到的到的 去獲得有關(guān)去獲得有關(guān) 的某些信息,去對的某些信息,去對 作出估計(jì)。作出估計(jì)。 可以證明可以證明(見附錄(見附錄2.2)其無偏估計(jì)為其無偏估計(jì)為 (n-2為自由度為自由度, 即可自由變化的樣本觀測值個數(shù)即可自由變化的樣本觀測值個數(shù))注意區(qū)別:注意區(qū)別: 是未知的確定的常數(shù)

55、;是未知的確定的常數(shù); 是由樣本信息估計(jì)的,是個隨機(jī)變量是由樣本信息估計(jì)的,是個隨機(jī)變量2222nei對隨機(jī)擾動項(xiàng)方差對隨機(jī)擾動項(xiàng)方差 的估計(jì)的估計(jì)iuiuiuie222222()E22()(2)iEen62對對 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換為什么要對為什么要對 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換?在在 正態(tài)性假定下,由前面的分析已知正態(tài)性假定下,由前面的分析已知但在對一般正態(tài)變量但在對一般正態(tài)變量 作實(shí)際分析時,要具體確定作實(shí)際分析時,要具體確定 的取值及對應(yīng)的概率,要通過正態(tài)分布密度函數(shù)去的取值及對應(yīng)的概率,要通過正態(tài)分布密度函數(shù)去計(jì)算是很麻煩的,為了便于直接利用計(jì)算是很麻煩的,為了便于直接利用“標(biāo)準(zhǔn)化

56、正態(tài)分標(biāo)準(zhǔn)化正態(tài)分布的臨界值布的臨界值”,需要對,需要對 作標(biāo)準(zhǔn)化變換。作標(biāo)準(zhǔn)化變換。標(biāo)準(zhǔn)化的方式:標(biāo)準(zhǔn)化的方式:kkkkk()()kkkkEzSEiu)(,kkkVarN22()21()2xfxe221( )2zze63在在 已知時已知時對對 作標(biāo)準(zhǔn)化變換,所得作標(biāo)準(zhǔn)化變換,所得Z統(tǒng)計(jì)量為標(biāo)統(tǒng)計(jì)量為標(biāo)準(zhǔn)正態(tài)變量。準(zhǔn)正態(tài)變量。11111212(0,1)()iizNSEXnx2222222(0,1)()izNSEx (1 1) 已知時,對已知時,對 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換k注意注意:這時這時 和和 都不是隨機(jī)變量都不是隨機(jī)變量(X、 、 都是非隨機(jī)的)都是非隨機(jī)的))(2SE)(1SE2k2n

57、64條件:條件: 當(dāng)當(dāng) 未知時未知時,可用,可用 (隨機(jī)變量)代替(隨機(jī)變量)代替 去估計(jì)去估計(jì)參數(shù)的標(biāo)準(zhǔn)誤差參數(shù)的標(biāo)準(zhǔn)誤差。這時參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差是個這時參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差是個隨機(jī)變量。隨機(jī)變量。 樣本為大樣本時樣本為大樣本時, ,作標(biāo)準(zhǔn)化變換所得的統(tǒng)計(jì)量作標(biāo)準(zhǔn)化變換所得的統(tǒng)計(jì)量Z Zk k,也可以也可以 視為標(biāo)準(zhǔn)正態(tài)變量視為標(biāo)準(zhǔn)正態(tài)變量(根據(jù)中心極限定理)。(根據(jù)中心極限定理)。 樣本為小樣本時樣本為小樣本時, 用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對 作標(biāo)準(zhǔn)化變換,所得的統(tǒng)作標(biāo)準(zhǔn)化變換,所得的統(tǒng) 計(jì)量用計(jì)量用t表示,這時表示,這時t將不再服從正態(tài)分布,而是服從將不再服從正態(tài)分布,而是

58、服從 t 分布分布(注意這時分母是隨機(jī)變量) : 22 (2)()kkktt nSE(2 2) 未知時,對未知時,對 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換k2k2 2、回歸系數(shù)的區(qū)間估計(jì)基本思想基本思想: 對參數(shù)作出的點(diǎn)估計(jì)是隨機(jī)變量,雖然是無偏估對參數(shù)作出的點(diǎn)估計(jì)是隨機(jī)變量,雖然是無偏估計(jì),但還不能說明這種估計(jì)的可靠性和精確性。計(jì),但還不能說明這種估計(jì)的可靠性和精確性。 需要找到包含真實(shí)參數(shù)的一個范圍,并確定這樣需要找到包含真實(shí)參數(shù)的一個范圍,并確定這樣的范圍包含參數(shù)真實(shí)值的可靠程度的范圍包含參數(shù)真實(shí)值的可靠程度。方法:方法:如果在確定參數(shù)估計(jì)式概率分布性質(zhì)的基礎(chǔ)上,可如果在確定參數(shù)估計(jì)式概率分布性質(zhì)的

59、基礎(chǔ)上,可 找到兩個正數(shù)找到兩個正數(shù)和和 ,能使得,能使得 這樣的區(qū)間包含真實(shí)這樣的區(qū)間包含真實(shí) 的概率為的概率為 ,即,即 這樣的區(qū)間稱為所估計(jì)參數(shù)的置信區(qū)間。這樣的區(qū)間稱為所估計(jì)參數(shù)的置信區(qū)間。 討論:討論:“如果已經(jīng)得出了如果已經(jīng)得出了 的特定估計(jì)值的特定估計(jì)值, ,并確定了某個置信區(qū)間,這說并確定了某個置信區(qū)間,這說明真實(shí)參數(shù)落入這個區(qū)間的概率為明真實(shí)參數(shù)落入這個區(qū)間的概率為1- 1- 。這種說法對嗎。這種說法對嗎? ?65),(kkk) 10(1k1)(kkkP怎樣正確理解置信區(qū)間怎樣正確理解置信區(qū)間?注意:注意: 是未知但是未知但確定確定的數(shù),的數(shù), 是隨抽樣而是隨抽樣而變化的變化

60、的隨機(jī)區(qū)間隨機(jī)區(qū)間。 從重復(fù)抽樣的觀點(diǎn)看,每次抽樣都可構(gòu)造一個區(qū)間,象這從重復(fù)抽樣的觀點(diǎn)看,每次抽樣都可構(gòu)造一個區(qū)間,象這樣構(gòu)造的區(qū)間,平均來說有(樣構(gòu)造的區(qū)間,平均來說有( )比例的次數(shù)包含)比例的次數(shù)包含 的真實(shí)值。的真實(shí)值。但對特定樣本但對特定樣本,一但估計(jì)出特定的,一但估計(jì)出特定的 ,區(qū)間,區(qū)間 就不再是隨機(jī)的,而是特定的,這時它或者就不再是隨機(jī)的,而是特定的,這時它或者包含包含 (包含的概率為(包含的概率為1),或者不包含),或者不包含 (包含的概率(包含的概率為為0)。 kkk(,)kk (,)kk k1kk問題:問題: 是給定的,如何去尋找合適的是給定的,如何去尋找合適的 呢呢?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論