




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型:
一元線性回歸模型
回歸分析概述一元線性回歸模型的參數(shù)估計(jì)一元線性回歸模型檢驗(yàn)一元線性回歸模型預(yù)測(cè)實(shí)例第二章經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型:
一元線性回歸模型回歸分§2.1回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)(PRF)三、隨機(jī)擾動(dòng)項(xiàng)四、樣本回歸函數(shù)(SRF)§2.1回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念一、變量間的關(guān)系及回歸分析的基本概念1.變量間的關(guān)系(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。一、變量間的關(guān)系及回歸分析的基本概念1.變量間的關(guān)系(2)對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correla注意①不線性相關(guān)并不意味著不相關(guān)。②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系。③回歸分析/相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。④相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。注意2.回歸分析的基本概念回歸分析(regressionanalysis)是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。其目的在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測(cè)前者的(總體)均值。被解釋變量(ExplainedVariable)或應(yīng)變量(DependentVariable)。解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。2.回歸分析的基本概念回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:(1)根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得回歸方程;(2)對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn);(3)利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)?;貧w分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:二、總體回歸函數(shù)回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。二、總體回歸函數(shù)回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,例2.1:一個(gè)假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測(cè)該社區(qū)家庭的平均月消費(fèi)支出水平。為達(dá)到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出。例2.1:一個(gè)假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月計(jì)量經(jīng)濟(jì)學(xué)之一元線性回歸模型課件由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不完全相同;但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,例如:P(Y=561|X=800)=1/4。由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):E(Y|X=Xi)。該例中:E(Y|X=800)=561描出散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(cond05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)050010001500200025003000350050在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。稱為(雙變量)總體回歸函數(shù)(populationregressionfunction,PRF)。
相應(yīng)的函數(shù):在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸含義:回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。
函數(shù)形式:可以是線性或非線性的。
例2.1中,將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí):
為一線性函數(shù)。其中,
0,
1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。含義:回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件三、隨機(jī)擾動(dòng)項(xiàng)總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。稱為觀察值圍繞它的期望值的離差(deviation),是一個(gè)不可觀測(cè)的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(stochasticdisturbance)或隨機(jī)誤差項(xiàng)(stochasticerror)。三、隨機(jī)擾動(dòng)項(xiàng)總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)例2.1中,給定收入水平Xi,個(gè)別家庭的支出可表示為兩部分之和:(1)該收入水平下所有家庭的平均消費(fèi)支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分;(2)其他隨機(jī)或非確定性(nonsystematic)部分
i。例2.1中,給定收入水平Xi,個(gè)別家庭的支出可表示為兩部分稱為總體回歸函數(shù)(PRF)的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型。稱為總體回歸函數(shù)(PRF)的隨機(jī)設(shè)定形式。表明被解釋變量除了隨機(jī)誤差項(xiàng)主要包括下列因素:在解釋變量中被忽略的因素的影響;變量觀測(cè)值的觀測(cè)誤差的影響;模型關(guān)系的設(shè)定誤差的影響;其他隨機(jī)因素的影響。產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因:理論的含糊性;數(shù)據(jù)的欠缺;節(jié)省原則。隨機(jī)誤差項(xiàng)主要包括下列因素:四、樣本回歸函數(shù)(SRF)問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?例2.2:在例2.1的總體中有如下一個(gè)樣本,能否從該樣本估計(jì)總體回歸函數(shù)PRF?
回答:能四、樣本回歸函數(shù)(SRF)問題:能從一次抽樣中獲得總體的近似
該樣本的散點(diǎn)圖(scatterdiagram):
畫一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sampleregressionlines)。該樣本的散點(diǎn)圖(scatterdiagram):畫一條
記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)。記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sample
注意:這里將樣本回歸線看成總體回歸線的近似替代則注意:這里將樣本回歸線看成總體回歸線的近似替代則樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式:
由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型(sampleregressionmodel)。
樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也
▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。即,根據(jù)
估計(jì)▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸注意:這里PRF可能永遠(yuǎn)無法知道。注意:這里PRF可能永遠(yuǎn)無法知道。§2.2一元線性回歸模型的參數(shù)估計(jì)
一、一元線性回歸模型的基本假設(shè)二、參數(shù)的普通最小二乘估計(jì)(OLS)三、參數(shù)估計(jì)的最大或然法(ML)四、最小二乘估計(jì)量的性質(zhì)五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)
§2.2一元線性回歸模型的參數(shù)估計(jì)一、一元線性回歸模型說明單方程計(jì)量經(jīng)濟(jì)學(xué)模型分為兩大類:線性模型和非線性模型線性模型中,變量之間的關(guān)系呈線性關(guān)系非線性模型中,變量之間的關(guān)系呈非線性關(guān)系一元線性回歸模型:只有一個(gè)解釋變量i=1,2,…,nY為被解釋變量,X為解釋變量,
0與
1為待估參數(shù),
為隨機(jī)干擾項(xiàng)說明單方程計(jì)量經(jīng)濟(jì)學(xué)模型分為兩大類:線性模型和非線性模型回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)確地估計(jì)總體回歸函數(shù)(模型)PRF。估計(jì)方法有多種,其中最廣泛使用的是普通最小二乘法(ordinaryleastsquares,OLS)。為保證參數(shù)估計(jì)量具有良好的性質(zhì),通常對(duì)模型提出若干基本假設(shè)。實(shí)際這些假設(shè)與所采用的估計(jì)方法緊密相關(guān)?;貧w分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)
一、線性回歸模型的基本假設(shè)
假設(shè)1.解釋變量X是確定性變量,不是隨機(jī)變量;
假設(shè)2.隨機(jī)誤差項(xiàng)
具有零均值、同方差和不序列相關(guān)性:
E(
i)=0i=1,2,…,nVar(
i)=
2i=1,2,…,nCov(
i,
j)=0i≠ji,j=1,2,…,n
一、線性回歸模型的基本假設(shè)假設(shè)1.解釋變量X是確定假設(shè)3.隨機(jī)誤差項(xiàng)
與解釋變量X之間不相關(guān):
Cov(Xi,
i)=0i=1,2,…,n假設(shè)4.
服從零均值、同方差、零協(xié)方差的正態(tài)分布
i~N(0,
2)i=1,2,…,n假設(shè)3.隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān):
如果假設(shè)1、2滿足,則假設(shè)3也滿足;
如果假設(shè)4滿足,則假設(shè)2也滿足。注意:
以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(ClassicalLinearRegressionModel,CLRM)。
如果假設(shè)1、2滿足,則假設(shè)3也滿足;注意:
另外,在進(jìn)行模型回歸時(shí),還有兩個(gè)暗含的假設(shè):
假設(shè)5.隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。即
假設(shè)6.回歸模型是正確設(shè)定的
另外,在進(jìn)行模型回歸時(shí),還有兩個(gè)暗含的假設(shè):假設(shè)5旨在排除時(shí)間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量,因?yàn)檫@類數(shù)據(jù)不僅使大樣本統(tǒng)計(jì)推斷變得無效,而且往往產(chǎn)生所謂的偽回歸問題(spuriousregressionproblem)。假設(shè)6也被稱為模型沒有設(shè)定偏誤(specificationerror)假設(shè)5旨在排除時(shí)間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變二、參數(shù)的普通最小二乘估計(jì)(OLS)
給定一組樣本觀測(cè)值(Xi,Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地?cái)M合這組值.
普通最小二乘法(Ordinaryleastsquares,OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和最小。二、參數(shù)的普通最小二乘估計(jì)(OLS)給定一組樣本觀方程組(*)稱為正規(guī)方程組(normalequations)。
方程組(*)稱為正規(guī)方程組(normalequations記上述參數(shù)估計(jì)量可以寫成:
稱為OLS估計(jì)量的離差形式(deviationform)。由于參數(shù)的估計(jì)結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計(jì)量(ordinaryleastsquaresestimators)。
記上述參數(shù)估計(jì)量可以寫成:稱為OLS估計(jì)量的離差形式(d順便指出,記
則有
可得
(**)式也稱為樣本回歸函數(shù)的離差形式。(**)注意:在計(jì)量經(jīng)濟(jì)學(xué)中,往往以小寫字母表示對(duì)均值的離差。
順便指出,記則有可得(**)式也稱為樣本回歸函數(shù)的離
三、參數(shù)估計(jì)的最大或然法(ML)
最大或然法(MaximumLikelihood,簡(jiǎn)稱ML),也稱最大似然法,是不同于最小二乘法的另一種參數(shù)估計(jì)方法,是從最大或然原理出發(fā)發(fā)展起來的其他估計(jì)方法的基礎(chǔ)。
基本原理:對(duì)于最大或然法,當(dāng)從模型總體隨機(jī)抽取n組樣本觀測(cè)值后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測(cè)值的概率最大。三、參數(shù)估計(jì)的最大或然法(ML)最大或然法(
在滿足基本假設(shè)條件下,對(duì)一元線性回歸模型:
隨機(jī)抽取n組樣本觀測(cè)值(Xi,Yi)(i=1,2,…n)。
那么Yi服從如下的正態(tài)分布:于是,Y的概率函數(shù)為(i=1,2,…n)假如模型的參數(shù)估計(jì)量已經(jīng)求得,為在滿足基本假設(shè)條件下,對(duì)一元線性回歸模型:隨機(jī)抽因?yàn)閅i是相互獨(dú)立的,所以的所有樣本觀測(cè)值的聯(lián)合概率,也即或然函數(shù)(likelihoodfunction)為:
將該或然函數(shù)極大化,即可求得到模型參數(shù)的極大或然估計(jì)量。因?yàn)閅i是相互獨(dú)立的,所以的所有樣本觀測(cè)值的聯(lián)合概率,也即或
由于或然函數(shù)的極大化與或然函數(shù)的對(duì)數(shù)的極大化是等價(jià)的,所以,取對(duì)數(shù)或然函數(shù)如下:由于或然函數(shù)的極大化與或然函數(shù)的對(duì)數(shù)的極大化是解得模型的參數(shù)估計(jì)量為:
可見,在滿足一系列基本假設(shè)的情況下,模型結(jié)構(gòu)參數(shù)的最大或然估計(jì)量與普通最小二乘估計(jì)量是相同的。解得模型的參數(shù)估計(jì)量為:可見,在滿足一系列基本
例2.2.1:在上述家庭可支配收入-消費(fèi)支出例中,對(duì)于所抽出的一組樣本數(shù),參數(shù)估計(jì)的計(jì)算可通過下面的表2.2.1進(jìn)行。
例2.2.1:在上述家庭可支配收入-消費(fèi)支出例中,對(duì)于因此,由該樣本估計(jì)的回歸方程為:
因此,由該樣本估計(jì)的回歸方程為:
四、最小二乘估計(jì)量的性質(zhì)
當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。
一個(gè)用于考察總體的估計(jì)量,可從如下幾個(gè)方面考察其優(yōu)劣性:
(1)線性性,即它是否是另一隨機(jī)變量的線性函數(shù);四、最小二乘估計(jì)量的性質(zhì)當(dāng)模型參數(shù)估(2)無偏性,即它的均值或期望值是否等于總體的真實(shí)值;(3)有效性,即它是否在所有線性無偏估計(jì)量中具有最小方差。
這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。擁有這類性質(zhì)的估計(jì)量稱為最佳線性無偏估計(jì)量(bestlinerunbiasedestimator,BLUE)。
(2)無偏性,即它的均值或期望值是否等于總體的真實(shí)值;(4)漸近無偏性,即樣本容量趨于無窮大時(shí),是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時(shí),它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時(shí),是否它在所有的一致估計(jì)量中具有最小的漸近方差。
當(dāng)不滿足小樣本性質(zhì)時(shí),需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì):(4)漸近無偏性,即樣本容量趨于無窮大時(shí),是否它的均值序列趨高斯—馬爾可夫定理(Gauss-Markovtheorem)
在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。高斯—馬爾可夫定理(Gauss-Markovtheorem計(jì)量經(jīng)濟(jì)學(xué)之一元線性回歸模型課件證:易知故同樣地,容易得出
證:易知故同樣地,容易得出計(jì)量經(jīng)濟(jì)學(xué)之一元線性回歸模型課件(2)證明最小方差性其中,ci=ki+di,di為不全為零的常數(shù)則容易證明
普通最小二乘估計(jì)量(ordinaryleastSquaresEstimators)稱為最佳線性無偏估計(jì)量(bestlinearunbiasedestimator,BLUE)(2)證明最小方差性其中,ci=ki+di,di為不全為零的
由于最小二乘估計(jì)量擁有一個(gè)“好”的估計(jì)量所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性。
由于最小二乘估計(jì)量擁有一個(gè)“好”的估計(jì)量所應(yīng)具備的
五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)
五、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)計(jì)量經(jīng)濟(jì)學(xué)之一元線性回歸模型課件2.隨機(jī)誤差項(xiàng)
的方差
2的估計(jì)
2又稱為總體方差。
2.隨機(jī)誤差項(xiàng)的方差2的估計(jì)2又稱為總體方差。由于隨機(jī)項(xiàng)
i不可觀測(cè),只能從
i的估計(jì)——?dú)埐頴i出發(fā),對(duì)總體方差進(jìn)行估計(jì)??梢宰C明,
2的最小二乘估計(jì)量為它是關(guān)于
2的無偏估計(jì)量。
由于隨機(jī)項(xiàng)i不可觀測(cè),只能從i的估計(jì)——?dú)埐頴i出發(fā),對(duì)
在最大或然估計(jì)法中,
因此,
2的最大或然估計(jì)量不具無偏性,但卻具有一致性。
在最大或然估計(jì)法中,因此,2的最大或然估計(jì)計(jì)量經(jīng)濟(jì)學(xué)之一元線性回歸模型課件§2.3一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)
一、擬合優(yōu)度檢驗(yàn)
二、變量的顯著性檢驗(yàn)
三、參數(shù)的置信區(qū)間
§2.3一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)一、擬合優(yōu)度檢驗(yàn)說明回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。說明回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù)那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著
一、擬合優(yōu)度檢驗(yàn)
擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值,為什么還要檢驗(yàn)擬合程度?一、擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與1、總離差平方和的分解
已知由一組樣本觀測(cè)值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
1、總離差平方和的分解已知由一組樣本觀測(cè)值(Xi計(jì)量經(jīng)濟(jì)學(xué)之一元線性回歸模型課件
如果Yi=?i
即實(shí)際觀測(cè)值落在樣本回歸“線”上,則擬合最好??烧J(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。如果Yi=?i即實(shí)際觀測(cè)值落在樣本
對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的TSS=ESS+RSS記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)TSS=ESS+RSS記總體平方和(TotalSumof
Y的觀測(cè)值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢(shì)力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此擬合優(yōu)度:回歸平方和ESS/Y的總離差TSSY的觀測(cè)值圍繞其均值的總離差(totalva2、可決系數(shù)R2統(tǒng)計(jì)量
稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
可決系數(shù)的取值范圍:[0,1]R2越接近1,說明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。2、可決系數(shù)R2統(tǒng)計(jì)量稱R2為(樣本)可決系數(shù)/判定系
在例2.1.1的收入-消費(fèi)支出例中,
注:可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第3章中進(jìn)行。
在例2.1.1的收入-消費(fèi)支出例中,注:可決
二、變量的顯著性檢驗(yàn)
回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。在一元線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。
變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。
計(jì)量經(jīng)濟(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。
二、變量的顯著性檢驗(yàn)回歸分析是要判斷
1、假設(shè)檢驗(yàn)
所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。1、假設(shè)檢驗(yàn)所謂假設(shè)檢驗(yàn),就是事先對(duì)總假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法2、變量的顯著性檢驗(yàn)
2、變量的顯著性檢驗(yàn)
檢驗(yàn)步驟:
(1)對(duì)總體參數(shù)提出假設(shè)
H0:
1=0,H1:
1
0(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平
,查t分布表得臨界值t
/2(n-2)檢驗(yàn)步驟:(1)對(duì)總體參數(shù)提出假設(shè)(2)以原假設(shè)
(4)比較,判斷若|t|>t
/2(n-2),則拒絕H0
,接受H1
;若|t|
t
/2(n-2),則拒絕H1
,接受H0
;對(duì)于一元線性回歸方程中的
0,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn):
(4)比較,判斷在上述收入—消費(fèi)支出例中,首先計(jì)算
2的估計(jì)值在上述收入—消費(fèi)支出例中,首先計(jì)算2的估計(jì)值t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為:
給定顯著性水平
=0.05,查t分布表得臨界值
t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;
|t2|<2.306,表明在95%的置信度下,無法拒絕截距項(xiàng)為零的假設(shè)。
t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為:給定顯著性水平=0.0
假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。
三、參數(shù)的置信區(qū)間
假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)
要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近
如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-
稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點(diǎn)稱為置信限(confidencelimit)或臨界值(criticalvalues)。如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)一元線性模型中,
i(i=1,2)的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道:
意味著,如果給定置信度(1-
),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t
/2,t
/2)的概率是(1-
)。表示為:
即一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著于是得到:(1-
)的置信度下,
i的置信區(qū)間是
在上述收入-消費(fèi)支出例中,如果給定
=0.01,查表得:
由于于是,
1、
0的置信區(qū)間分別為:(0.6345,0.9195)
(-433.32,226.98)
于是得到:(1-)的置信度下,i的置信區(qū)間是在上述收由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。要縮小置信區(qū)間,需要(1)增大樣本容量n。因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越??;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小;由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“
(2)提高模型的擬合優(yōu)度。因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。
(2)提高模型的擬合優(yōu)度。因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與要縮小置信區(qū)間,需
(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较拢琻越大,t分布表中的臨界值越小;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??;
(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。要縮小置信區(qū)間,需§2.4一元線性回歸分析的應(yīng)用:預(yù)測(cè)問題
一、?0是條件均值E(Y|X=X0)或個(gè)值Y0的一個(gè)無偏估計(jì)二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間§2.4一元線性回歸分析的應(yīng)用:預(yù)測(cè)問題一、?0是條件
對(duì)于一元線性回歸模型
給定樣本以外的解釋變量的觀測(cè)值X0,可以得到被解釋變量的預(yù)測(cè)值?0
,可以此作為其條件均值E(Y|X=X0)或個(gè)別值Y0的一個(gè)近似估計(jì)。
嚴(yán)格地說,這只是被解釋變量的預(yù)測(cè)值的估計(jì)值,而不是預(yù)測(cè)值。原因:
(1)參數(shù)估計(jì)量不確定;(2)隨機(jī)項(xiàng)的影響說明對(duì)于一元線性回歸模型給定樣本以外的解釋變量的觀測(cè)值X
一、?0是條件均值E(Y|X=X0)或個(gè)值Y0的一個(gè)無偏估計(jì)對(duì)總體回歸函數(shù)E(Y|X=X0)=
0+
1X,X=X0時(shí)
E(Y|X=X0)=
0+
1X0于是可見,?0是條件均值E(Y|X=X0)的無偏估計(jì)。一、?0是條件均值E(Y|X=X0)或個(gè)值Y0的一個(gè)對(duì)總體回歸模型Y=
0+
1X+
,當(dāng)X=X0時(shí)于是對(duì)總體回歸模型Y=0+1X+,當(dāng)X=X0時(shí)于是
二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間
1、總體均值預(yù)測(cè)值的置信區(qū)間
由于
于是可以證明
二、總體條件均值與個(gè)值預(yù)測(cè)值的置信區(qū)間1因此
故
因此故于是,在1-
的置信度下,總體均值E(Y|X0)的置信區(qū)間為
其中于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為2、總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間
由Y0=
0+
1X0+
知:
于是
式中
:從而在1-
的置信度下,Y0的置信區(qū)間為
2、總體個(gè)值預(yù)測(cè)值的預(yù)測(cè)區(qū)間由Y0=0+1X0+在上述收入—消費(fèi)支出例中,得到的樣本回歸函數(shù)為:
則在X0=1000處,
?0=–103.172+0.777×1000=673.84
而在上述收入—消費(fèi)支出例中,得到的樣本回歸函數(shù)為:則在X
因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:
673.84-2.306
61.05<E(Y|X=1000)<673.84+2.306
61.05或(533.05,814.62)同樣地,對(duì)于Y在X=1000的個(gè)體值,其95%的置信區(qū)間為:
673.84-2.306
61.05<Yx=1000<673.84+2.306
61.05或
(372.03,975.65)因此,總體均值E(Y|X=1000)的95%的置
總體回歸函數(shù)的置信帶(域)(confidenceband)個(gè)體的置信帶(域)
總體回歸函數(shù)的置信帶(域)(confidenceband
對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測(cè)精度越高,反之預(yù)測(cè)精度越低;(2)樣本容量一定時(shí),置信帶的寬度當(dāng)在X均值處最小,其附近進(jìn)行預(yù)測(cè)(插值預(yù)測(cè))精度越大;X越遠(yuǎn)離其均值,置信帶越寬,預(yù)測(cè)可信度下降。對(duì)于Y的總體均值E(Y|X)與個(gè)體值的預(yù)測(cè)區(qū)間(置信區(qū)間§2.5實(shí)例:時(shí)間序列問題
一、中國(guó)居民人均消費(fèi)模型
二、時(shí)間序列問題
§2.5實(shí)例:時(shí)間序列問題一、中國(guó)居民人均消費(fèi)模型
一、中國(guó)居民人均消費(fèi)模型
例2.5.1
考察中國(guó)居民收入與消費(fèi)支出的關(guān)系。GDPP:
人均國(guó)內(nèi)生產(chǎn)總值(1990年不變價(jià))CONSP:人均居民消費(fèi)(以居民消費(fèi)價(jià)格指數(shù)(1990=100)縮減)。一、中國(guó)居民人均消費(fèi)模型例2.5.1考察中國(guó)計(jì)量經(jīng)濟(jì)學(xué)之一元線性回歸模型課件
1.建立模型
擬建立如下一元回歸模型
采用Eviews
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編版小學(xué)語文三年級(jí)下冊(cè)第八單元試卷1
- 2023-2024學(xué)年廣東省清遠(yuǎn)市四校高二下學(xué)期期中聯(lián)考語文試題(解析版)
- 探究春分的奧秘
- 塑造品格小戰(zhàn)士
- 碩士研究生生存指南
- 梅里斯達(dá)斡爾族區(qū)2025屆小升初數(shù)學(xué)檢測(cè)卷含解析
- 山西省臨晉中學(xué)2025屆高三下學(xué)期大聯(lián)考卷Ⅰ生物試題試卷含解析
- 泰山學(xué)院《可靠性技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 內(nèi)蒙古翁牛特旗2024-2025學(xué)年初三下學(xué)期第一次教學(xué)質(zhì)量診斷性考試生物試題試卷含解析
- 山東省臨沂市臨沭縣一中2025屆高三一輪復(fù)習(xí)階段性考試(歷史試題理)試題含解析
- GB/T 2828.1-2012計(jì)數(shù)抽樣檢驗(yàn)程序第1部分:按接收質(zhì)量限(AQL)檢索的逐批檢驗(yàn)抽樣計(jì)劃
- GB/T 18760-2002消費(fèi)品售后服務(wù)方法與要求
- GB/T 1443-1996機(jī)床和工具柄用自夾圓錐
- 影像診斷與手術(shù)后符合率統(tǒng)計(jì)表
- 中考語文作文專題復(fù)習(xí):以小見大的寫作技巧
- 高三主題班會(huì)三輪復(fù)習(xí)動(dòng)員 沖刺高考課件
- 機(jī)械廠降壓變電所的電氣設(shè)計(jì)概述
- 歷史小劇場(chǎng)《萬隆會(huì)議》劇本
- 國(guó)家開放大學(xué)《社區(qū)護(hù)理學(xué)(本)》形考任務(wù)1-5參考答案
- 施工進(jìn)度計(jì)劃網(wǎng)絡(luò)圖及橫道圖
- 《中國(guó)文化概論》課程教學(xué)大綱.docx
評(píng)論
0/150
提交評(píng)論