計(jì)量經(jīng)濟(jì)學(xué)2.1一元回歸模型_第1頁
計(jì)量經(jīng)濟(jì)學(xué)2.1一元回歸模型_第2頁
計(jì)量經(jīng)濟(jì)學(xué)2.1一元回歸模型_第3頁
計(jì)量經(jīng)濟(jì)學(xué)2.1一元回歸模型_第4頁
計(jì)量經(jīng)濟(jì)學(xué)2.1一元回歸模型_第5頁
已閱讀5頁,還剩125頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)量經(jīng)濟(jì)學(xué)

Econometrics李盈1理論研究或經(jīng)驗(yàn)總結(jié)收集統(tǒng)計(jì)資料設(shè)計(jì)理論模型模型的參數(shù)估計(jì),建立具體模型檢驗(yàn)估計(jì)的模型,驗(yàn)證理論是否符合標(biāo)準(zhǔn)修改模型或重新選擇估計(jì)方法應(yīng)用模型計(jì)量經(jīng)濟(jì)方法從模型的建立到模型的應(yīng)用是一個(gè)復(fù)雜的過程否是結(jié)構(gòu)分析預(yù)測政策評價(jià)第二章經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型:

一元線性回歸模型

TheClassicalSingleEquationEconometricModel:SimpleLinearRegressionModel

3本章內(nèi)容

回歸分析概述一元線性回歸模型的基本假設(shè)一元線性回歸模型的參數(shù)估計(jì)一元線性回歸模型的檢驗(yàn)一元線性回歸模型的預(yù)測實(shí)例及時(shí)間序列問題4§2.1回歸分析概述

(RegressionAnalysis)一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)三、隨機(jī)擾動項(xiàng)四、樣本回歸函數(shù)5一、變量間的關(guān)系及回歸分析的基本概念61、變量間的關(guān)系確定性關(guān)系或函數(shù)關(guān)系:研究的是確定性現(xiàn)象非隨機(jī)變量間的關(guān)系。

統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定性現(xiàn)象隨機(jī)變量間的關(guān)系。比如說,農(nóng)作物產(chǎn)量Y和施肥量X之間的關(guān)系7對變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的。相關(guān)分析適用于所有統(tǒng)計(jì)關(guān)系。相關(guān)系數(shù)(correlationcoefficient)正相關(guān)(positivecorrelation)/負(fù)相關(guān)(negativecorrelation)/不相關(guān)(non-correlation)回歸分析僅對存在因果關(guān)系而言。89總體相關(guān)系數(shù)樣本相關(guān)系數(shù)2、回歸分析的基本概念回歸分析(regressionanalysis)是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。其目的在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測前者的(總體)均值。兩類變量;被解釋變量(ExplainedVariable)或應(yīng)變量(DependentVariable)。解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。10關(guān)于變量的術(shù)語ExplainedVariable~ExplanatoryVariableDependentVariable~IndependentVariableEndogenousVariable~ExogenousVariableResponseVariable~ControlVariablePredictedVariable~PredictorVariableRegress~Regressor11回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:根據(jù)樣本觀察值對經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得回歸方程;對回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn);利用回歸方程進(jìn)行分析、評價(jià)及預(yù)測。12

相關(guān)分析、回歸分析和因果分析

相關(guān)關(guān)系與因果關(guān)系相關(guān)關(guān)系,是指兩個(gè)以上的變量的樣本觀測值序列之間表現(xiàn)出來的隨機(jī)數(shù)學(xué)關(guān)系,用相關(guān)系數(shù)來衡量。因果關(guān)系,是指兩個(gè)或兩個(gè)以上變量在行為機(jī)制上的依賴性,作為結(jié)果的變量是由作為原因的變量所決定的,原因變量的變化引起結(jié)果變量的變化。因果關(guān)系有單向因果關(guān)系和互為因果關(guān)系之分。具有因果關(guān)系的變量之間一定具有數(shù)學(xué)上的相關(guān)關(guān)系。而具有相關(guān)關(guān)系的變量之間并不一定具有因果關(guān)系。

相關(guān)分析和回歸分析相關(guān)分析是判斷變量之間是否具有相關(guān)關(guān)系的數(shù)學(xué)分析方法,通過計(jì)算變量之間的相關(guān)系數(shù)來實(shí)現(xiàn)?;貧w分析也是判斷變量之間是否具有相關(guān)關(guān)系的一種數(shù)學(xué)分析方法,它著重判斷一個(gè)隨機(jī)變量與一個(gè)或幾個(gè)可控變量之間是否具有相關(guān)關(guān)系。

①不線性相關(guān)并不意味著不相關(guān);

②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個(gè)變量對另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。

④相關(guān)分析對稱地對待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對變量的處理方法存在不對稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。▲注意:二、總體回歸函數(shù)

PopulationRegressionFunction,PRF161、條件均值(conditionalmean)例2.1.1:一個(gè)假想的社區(qū)有99戶家庭組成,欲研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測該社區(qū)家庭的平均月消費(fèi)支出水平。為達(dá)到此目的,將該99戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出。1718由于不確定因素的影響,對同一收入水平X,不同家庭的消費(fèi)支出不完全相同;但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,例如:P(Y=561|X=800)=1/4。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):E(Y|X=Xi)。該例中:E(Y|X=800)=60519描出散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)20總體回歸線2、總體回歸函數(shù)在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。相應(yīng)的函數(shù)稱為(雙變量)總體回歸函數(shù)(populationregressionfunction,PRF)。21含義:回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。函數(shù)形式:可以是線性或非線性的。例2.1.1中,將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí):為線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。22注意:在經(jīng)典計(jì)量經(jīng)濟(jì)方法中所指的線性函數(shù),是指回歸系數(shù)是線性的,只以它的一次方出現(xiàn),對解釋變量可以不是線性的。三、隨機(jī)擾動項(xiàng)

StochasticDisturbance

23總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。稱為觀察值Yi圍繞它的期望值E(Y|Xi)的離差i(deviation),是一個(gè)不可觀測的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(stochasticdisturbance)或隨機(jī)誤差項(xiàng)(stochasticerror)。24例2.1.1中,給定收入水平Xi,個(gè)別家庭的支出可表示為兩部分之和:該收入水平下所有家庭的平均消費(fèi)支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分;其他隨機(jī)或非確定性(nonsystematic)部分i。

稱為總體回歸函數(shù)(PRF)的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸模型(PRM)。2505001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)隨機(jī)誤差項(xiàng)主要包括下列因素:在解釋變量中被忽略的因素的影響;影響不顯著的因素(比如:一次性收入)未知的影響因素(認(rèn)知局限性)無法獲得數(shù)據(jù)的因素(比如:財(cái)富擁有量)變量觀測值的觀測誤差的影響(比如:尺子;被調(diào)查者謊報(bào)或沒弄清標(biāo)準(zhǔn);問問題的方式等);模型關(guān)系的設(shè)定誤差的影響(線性VS非線性);其它隨機(jī)因素的影響(不隨機(jī)的因素:椅子的高度;隨機(jī)的因素:可能變化的因素)。26

四、樣本回歸函數(shù)

SampleRegressionFunction,SRF

27

總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測中得到總體的一個(gè)樣本。1、樣本回歸函數(shù)問題:能否從一次抽樣中獲得總體的近似信息?如果可以,如何從抽樣中獲得總體的近似信息?在例2.1.1的總體中有如下一個(gè)樣本,能否從該樣本估計(jì)總體回歸函數(shù)?

回答:能28

該樣本的散點(diǎn)圖(scatterdiagram):

畫一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sampleregressionlines)。

樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)。29

注意:這里將樣本回歸線看成總體回歸線的近似替代則302、樣本回歸模型樣本回歸函數(shù)的隨機(jī)形式:

由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型(sampleregressionmodel)。

31回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。32注意:這里PRF可能永遠(yuǎn)無法知道?!?.2一元線性回歸模型的基本假設(shè)

(AssumptionsofSimpleLinearRegressionModel)

一、關(guān)于模型設(shè)定的假設(shè)二、關(guān)于解釋變量的假設(shè)三、關(guān)于隨機(jī)項(xiàng)的假設(shè)33說明為保證參數(shù)估計(jì)量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。實(shí)際上這些假設(shè)與所采用的估計(jì)方法緊密相關(guān)。下面的假設(shè)主要是針對采用普通最小二乘法(OrdinaryLeastSquares,OLS)估計(jì)而提出的。所以,在有些教科書中稱為“TheAssumptionUnderlyingtheMethodofLeastSquares”。在不同的教科書上關(guān)于基本假設(shè)的陳述略有不同,下面進(jìn)行了重新歸納。341、關(guān)于模型關(guān)系的假設(shè)模型設(shè)定正確假設(shè)。Theregressionmodeliscorrectlyspecified.線性回歸假設(shè)。Theregressionmodelislinearintheparameters。

注意:“l(fā)inearintheparameters”的含義是什么?352、關(guān)于解釋變量的假設(shè)確定性假設(shè)。Xvaluesarefixedinrepeatedsampling.Moretechnically,Xisassumedtobenonstochastic.

注意:“inrepeatedsampling”的含義是什么?與隨機(jī)項(xiàng)不相關(guān)假設(shè)。ThecovariancesbetweenXiandμiarezero.由確定性假設(shè)可以推斷。36觀測值變化假設(shè)。Xvaluesinagivensamplemustnotallbethesame.無完全共線性假設(shè)。Thereisnoperfectmulticollinearityamongtheexplanatoryvariables.

適用于多元線性回歸模型。樣本方差假設(shè)。隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。排除時(shí)間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量373、關(guān)于隨機(jī)項(xiàng)的假設(shè)條件0均值假設(shè)。Theconditionalmeanvalueofμiiszero.

同方差假設(shè)。Theconditionalvariancesofμiareidentical.(Homoscedasticity)由模型設(shè)定正確假設(shè)推斷。是否滿足需要檢驗(yàn)。38序列不相關(guān)假設(shè)。Thecorrelationbetweenanytwoμiandμjiszero.是否滿足需要檢驗(yàn)。394、隨機(jī)項(xiàng)的正態(tài)性假設(shè)在采用OLS進(jìn)行參數(shù)估計(jì)時(shí),不需要正態(tài)性假設(shè)。在利用參數(shù)估計(jì)量進(jìn)行統(tǒng)計(jì)推斷時(shí),需要假設(shè)隨機(jī)項(xiàng)的概率分布。一般假設(shè)隨機(jī)項(xiàng)服從正態(tài)分布??梢岳弥行臉O限定理(centrallimittheorem,CLT)進(jìn)行證明。正態(tài)性假設(shè)。Theμ’sfollowthenormaldistribution.405、CLRM和CNLRM以上假設(shè)(正態(tài)性假設(shè)除外)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(ClassicalLinearRegressionModel,CLRM)。同時(shí)滿足正態(tài)性假設(shè)的線性回歸模型,稱為經(jīng)典正態(tài)線性回歸模型(ClassicalNormalLinearRegressionModel,CNLRM)。41§2.3一元線性回歸模型的參數(shù)估計(jì)

(EstimationofSimpleLinearRegressionModel)

一、參數(shù)的普通最小二乘估計(jì)(OLS)二、參數(shù)估計(jì)的最大或然法(ML)三、最小二乘估計(jì)量的性質(zhì)四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)

42一、參數(shù)的普通最小二乘估計(jì)(OLS)431、最小二乘原理根據(jù)被解釋變量的所有觀測值與估計(jì)值之差的平方和最小的原則求得參數(shù)估計(jì)量。

為什么取平方和?442、正規(guī)方程組該關(guān)于參數(shù)估計(jì)量的線性方程組稱為正規(guī)方程組(normalequations)。45可將第一個(gè)條件寫為46473、參數(shù)估計(jì)量求解正規(guī)方程組得到結(jié)構(gòu)參數(shù)的普通最小二乘估計(jì)量(ordinaryleastsquaresestimators)及其離差形式:

分布參數(shù)的普通最小二乘估計(jì)量484、“估計(jì)量”(estimator)和“估計(jì)值”

(estimate)的區(qū)別

如果給出的參數(shù)估計(jì)結(jié)果是由一個(gè)具體樣本資料計(jì)算出來的,它是一個(gè)“估計(jì)值”,或者“點(diǎn)估計(jì)”,是參數(shù)估計(jì)量的一個(gè)具體數(shù)值;如果把上式看成參數(shù)估計(jì)的一個(gè)表達(dá)式,那么,則是Yi的函數(shù),而Yi是隨機(jī)變量,所以參數(shù)估計(jì)也是隨機(jī)變量,在這個(gè)角度上,稱之為“估計(jì)量”。

49二、參數(shù)估計(jì)的最大似然法(ML)501、最大似然法最大似然法(MaximumLikelihood,ML),也稱最大或然法,是不同于最小二乘法的另一種參數(shù)估計(jì)方法,是從最大或然原理出發(fā)發(fā)展起來的其它估計(jì)方法的基礎(chǔ)。普通最小二乘法:當(dāng)從模型總體隨機(jī)抽取n組樣本觀測值后,最合理的參數(shù)估計(jì)量應(yīng)該使得模型最好的擬合樣本數(shù)據(jù)?;驹恚寒?dāng)從模型總體隨機(jī)抽取n組樣本觀測值后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測值的概率最大。ML必須已知隨機(jī)項(xiàng)的分布。512、估計(jì)步驟Yi的分布Yi的概率函數(shù)

Y的所有樣本觀測值的聯(lián)合概率—似然函數(shù)

52對數(shù)似然函數(shù)

對數(shù)似然函數(shù)極大化的一階條件結(jié)構(gòu)參數(shù)的ML估計(jì)量533、討論在滿足一系列基本假設(shè)的情況下,模型結(jié)構(gòu)參數(shù)的最大似然估計(jì)量與普通最小二乘估計(jì)量是相同的。但是,分布參數(shù)的估計(jì)結(jié)果不同。54三、最小二乘估計(jì)量的性質(zhì)551、概述當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。準(zhǔn)則:線性性(linear),即它是否是另一隨機(jī)變量的線性函數(shù);無偏性(unbiased),即它的均值或期望值是否等于總體的真實(shí)值;有效性(efficient),即它是否在所有線性無偏估計(jì)量中具有最小方差。這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。擁有這類性質(zhì)的估計(jì)量稱為最佳線性無偏估計(jì)量(bestlinerunbiasedestimator,BLUE)。56當(dāng)不滿足小樣本性質(zhì)時(shí),需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì)(asymptoticproperties):漸近無偏性,即樣本容量趨于無窮大時(shí),是否它的均值序列趨于總體真值;一致性,即樣本容量趨于無窮大時(shí),它是否依概率收斂于總體的真值;漸近有效性,即樣本容量趨于無窮大時(shí),是否它在所有的一致估計(jì)量中具有最小的漸近方差。572、高斯—馬爾可夫定理(Gauss-Markovtheorem)在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。下面分別對最小二乘估計(jì)量的線性性、無偏性和有效性進(jìn)行證明,作為不熟悉的同學(xué)的自學(xué)內(nèi)容。★5859證:易知故同樣地,容易得出

60IntroductoryEconometrics61of99參數(shù)無偏性的詳細(xì)證法(需要掌握)

Inordertothinkaboutunbiasedness,weneedtorewriteourestimatorintermsofthepopulationparameter為了思考無偏性,我們需要用總體的參數(shù)重新寫出估計(jì)量Startwithasimplerewriteoftheformulaas

把公式簡單地改寫為IntroductoryEconometrics62of99UnbiasednessofOLS(cont)

OLS的無偏性(繼續(xù))IntroductoryEconometrics63of99UnbiasednessofOLS(cont)

OLS的無偏性(繼續(xù))IntroductoryEconometrics64of99UnbiasednessofOLS(cont)

OLS的無偏性(繼續(xù))IntroductoryEconometrics65of99UnbiasednessofOLS(cont)

OLS的無偏性(繼續(xù))66(2)證明最小方差性其中,ci=ki+di,di為不全為零的常數(shù)則容易證明67由于最小二乘估計(jì)量擁有一個(gè)“好”的估計(jì)量所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性。

68四、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)691、參數(shù)估計(jì)量的概率分布

702、隨機(jī)誤差項(xiàng)的方差2的估計(jì)

2又稱為總體方差。

由于隨機(jī)項(xiàng)i不可觀測,只能從i的估計(jì)——?dú)埐頴i出發(fā),對總體方差進(jìn)行估計(jì)。

可以證明,2的最小二乘估計(jì)量為:它是關(guān)于2的無偏估計(jì)量。

71

在最大或然估計(jì)法中,求解似然方程:

2的最大或然估計(jì)量不具無偏性,但卻具有一致性。

7273§2.4一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)

StatisticalTestofSimpleLinearRegressionModel

74說明回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。75§2.4一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)

StatisticalTestofSimpleLinearRegressionModel

一、擬合優(yōu)度檢驗(yàn)

二、變量的顯著性檢驗(yàn)

三、參數(shù)的置信區(qū)間

76一、擬合優(yōu)度檢驗(yàn)

GoodnessofFit,CoefficientofDetermination771、回答一個(gè)問題擬合優(yōu)度檢驗(yàn):對樣本回歸直線與樣本觀測值之間擬合程度的檢驗(yàn)。問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測值,為什么還要檢驗(yàn)擬合程度?782、總離差平方和的分解Y的i個(gè)觀測值與樣本均值的離差由回歸直線解釋的部分

回歸直線不能解釋的部分

離差分解為兩部分之和

7980對于所有樣本點(diǎn),則需考慮離差的平方和:記總體平方和(TotalSumofSquares)解釋平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares

)81TSS=ESS+RSS

Y的觀測值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢力(RSS)。

在給定樣本中,TSS不變,如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此

擬合優(yōu)度:解釋平方和ESS/Y的總離差TSS823、可決系數(shù)R2統(tǒng)計(jì)量是一個(gè)非負(fù)的統(tǒng)計(jì)量。取值范圍:[0,1]越接近1,說明實(shí)際觀測點(diǎn)離回歸線越近,擬合優(yōu)度越高。隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第3章中進(jìn)行。83二、變量的顯著性檢驗(yàn)

Testing

SignificanceofVariable84說明在一元線性模型中,變量的顯著性檢驗(yàn)就是判斷X是否對Y具有顯著的線性性影響。變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。通過檢驗(yàn)變量的參數(shù)真值是否為零來實(shí)現(xiàn)顯著性檢驗(yàn)。851、假設(shè)檢驗(yàn)(HypothesisTesting)所謂假設(shè)檢驗(yàn),就是事先對總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的。862、變量的顯著性檢驗(yàn)—t檢驗(yàn)用σ2的估計(jì)量代替,構(gòu)造t統(tǒng)計(jì)量對總體參數(shù)提出假設(shè):H0:1=0,H1:1087由樣本計(jì)算t統(tǒng)計(jì)量值;給定顯著性水平(levelofsignificance),查t分布表得臨界值(criticalvalue)t/2(n-2);比較,判斷:若|t|>t/2(n-2),則以(1-α)的置信度(confidencecoefficient)拒絕H0

,接受H1

;若|t|

t/2(n-2),則以(1-α)的置信度不拒絕H0

。自學(xué)教材p48例題,學(xué)會檢驗(yàn)的全過程。8889of94yi=b0+b1xi1

+…

+bkxik+uiH0:bj=0H1:bj>0c0a(1-a)One-SidedAlternatives(cont)單邊備擇假設(shè)Failtorejectreject90yi=b0+b1Xi1

+…

+bkXik+uiH0:bj=0H1:bj

≠0c0a/2(1-a)-ca/2Two-SidedAlternativesrejectrejectfailtoreject3、關(guān)于常數(shù)項(xiàng)的顯著性檢驗(yàn)T檢驗(yàn)同樣可以進(jìn)行。一般不以t檢驗(yàn)決定常數(shù)項(xiàng)是否保留在模型中,而是從經(jīng)濟(jì)意義方面分析回歸線是否應(yīng)該通過原點(diǎn)。9192Computingp-valuesfortTests

計(jì)算t檢驗(yàn)的p值Thestepsinclassicalhypothesistesting:

經(jīng)典假設(shè)檢驗(yàn)的步驟Statethenullandthealternativehypothesis

表述零假設(shè)和備擇假設(shè)Decideasignificancelevelandfindtherelatedcriticalvalue

決定顯著水平,找到臨界值Calculatethetstatisticbasedonthesampledata

根據(jù)樣本數(shù)據(jù)計(jì)算

t統(tǒng)計(jì)量Comparethetstatisticwiththecriticalvaluetodecidewhethertorejectthenull比較

t

值與臨界值,決定是否拒絕零假設(shè)。93Computingp-valuesfortTests

計(jì)算t檢驗(yàn)的p值Supposeat40degreesoffreedom,acalculatedtratiois2.423,therelated5%

and1%criticalvaluesare2.021and2.704,respectively.

Shouldwerejectornottorejectthenull?

假設(shè)自由度為40,算得

t

值為2.423,對應(yīng)5%和1%的臨界值分別為2.021和2.704。我們是否應(yīng)當(dāng)拒絕零假設(shè)?Committingtoasignificancelevelaheadoftimecanhideusefulinformationabouttheoutcomeofahypothesistest.

提前確定顯著水平可能會隱藏關(guān)于假設(shè)檢驗(yàn)的一些有用信息。94Computingp-valuesfortTests

計(jì)算t檢驗(yàn)的p值A(chǔ)nalternativetotheclassicalapproach:Ifthecalculatedtstatisticisusedascriticalvalue,whatisthesmallestsignificancelevelatwhichthenullhypothesiswouldberejected?

另一種想法:如果將算得的t

統(tǒng)計(jì)量作為臨界值,那么使得零假設(shè)被拒絕的最小顯著水平是多少?Thislevelisknownasthep-value.Foratwo-sidedalternative,

這個(gè)水平稱為p值。對于雙邊檢驗(yàn)

p-value=P(|T|>|t|).

95Computingp-valuesfortTests

計(jì)算t檢驗(yàn)的p值C0.025C0.025C0.005C0.005C0.01C0.01pα/2pα/2Intheaboveexample,itmustbetruethat1%<p<5%.p-value=P(|T|>2.423)=2P(T>2.423)=0.02.96Usefulinformationaboutp-values

一些關(guān)于p值的信息Becauseitisaprobability,itsrangeisbetween0and1.

由于這是一個(gè)概率,其取值范圍在0,1之間Smallpvaluesareevidenceagainstthenull,largepvaluesprovidelittleevidenceagainstthenull.

小p值提供了拒絕零假設(shè)的證據(jù),大p值不能提供證據(jù)拒絕零假設(shè)。三、參數(shù)的置信區(qū)間

ConfidenceIntervalofParameter971、概念回歸分析希望通過樣本得到的參數(shù)估計(jì)量能夠代替總體參數(shù)。假設(shè)檢驗(yàn)可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(例如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。要判斷樣本參數(shù)的估計(jì)值在多大程度上“近似”地替代總體參數(shù)的真值,需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。98

如果存在這樣一個(gè)區(qū)間,稱之為置信區(qū)間;1-稱為置信系數(shù)(置信度)(confidencecoefficient),稱為顯著性水平;置信區(qū)間的端點(diǎn)稱為置信限(confidencelimit)。992、一元線性模型中i

的置信區(qū)間T分布為雙尾分布(1-)的置信度下,i的置信區(qū)間是100

在上述收入-消費(fèi)支出例題中,如果給定

=0.01,查表得:

由于于是,1、0的置信區(qū)間分別為:(0.6056,0.7344)

(-6.719,291.52)

101顯然,在該例題中,我們對結(jié)果的正確陳述應(yīng)該是:邊際消費(fèi)傾向β1是以99%的置信度處于以0.670為中心的區(qū)間(0.6056,0.7344)

中?;卮穑哼呺H消費(fèi)傾向等于0.670的置信度是多少?邊際消費(fèi)傾向以100%的置信度處于什么區(qū)間?102由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。要縮小置信區(qū)間,需要增大樣本容量n。因?yàn)樵谕瑯拥闹眯潘较拢琻越大,t分布表中的臨界值越?。煌瑫r(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減?。惶岣吣P偷臄M合優(yōu)度。因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和越小。103§2.5一元線性回歸分析的應(yīng)用:

預(yù)測問題一、預(yù)測值條件均值或個(gè)值的一個(gè)無偏估計(jì)二、總體條件均值與個(gè)值預(yù)測值的置信區(qū)間104

對于一元線性回歸模型

給定樣本以外的解釋變量的觀測值X0,可以得到被解釋變量的預(yù)測值?0

,可以此作為其條件均值E(Y|X=X0)或個(gè)別值Y0的一個(gè)近似估計(jì)。

嚴(yán)格地說,這只是被解釋變量的預(yù)測值的估計(jì)值,而不是預(yù)測值。原因:

參數(shù)估計(jì)量不確定;隨機(jī)項(xiàng)的影響。說明105一、預(yù)測值是條件均值或個(gè)值的一個(gè)無偏估計(jì)1061、?0是條件均值E(Y|X=X0)的無偏估計(jì)對總體回歸函數(shù)E(Y|X=X0)=0+1X,X=X0時(shí)

E(Y|X=X0)=0+1X0可見,?0是條件均值E(Y|X=X0)的無偏估計(jì)。1072、?0是個(gè)值Y0的無偏估計(jì)對總體回歸模型Y=0+1X+,當(dāng)X=X0時(shí)可見,?0是個(gè)值Y0的無偏估計(jì)。108二、總體條件均值與個(gè)值預(yù)測值的置信區(qū)間1091、總體均值預(yù)測值的置信區(qū)間

110111于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為

1122、總體個(gè)值預(yù)測值的預(yù)測區(qū)間

從而在1-的置信度下,Y0的置信區(qū)間為

1133、例題—收入-消費(fèi)支出樣本回歸函數(shù)為則在X0=1000處,?0=142.4+0.670×1000=812.4

因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:(812.4-2.30627.6,812.4+2.30627.6)(748.8,875.9)

114

同樣地,對于Y在X=1000的個(gè)體值,其95%的置信區(qū)間為:(812.4-2.30659.1,812.4+2.30659.1)

(676.1,948.7)115§2.6實(shí)例及時(shí)間序列問題

116說明本節(jié)列舉了兩個(gè)一元線性回歸模型實(shí)例,完成了建立模型、估計(jì)參數(shù)、統(tǒng)計(jì)檢驗(yàn)和預(yù)測的過程。適合于課堂演示或者由學(xué)生在計(jì)算機(jī)上完成。從理論上講,經(jīng)典線性回歸模型理論是以隨機(jī)抽樣的截面數(shù)據(jù)或者平穩(wěn)的時(shí)間序列數(shù)據(jù)為基礎(chǔ)的。對于非平穩(wěn)時(shí)間序列數(shù)據(jù),存在理論方法方面的障礙。如何處理?本書第8章將專門討論。在2—7章中大量采用非平穩(wěn)時(shí)間序列數(shù)據(jù)作為實(shí)例,暫時(shí)不考慮理論方法方面的障礙。117IntroductoryEconometrics118of99In

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論