![第二章 一元線性回歸分析_第1頁](http://file4.renrendoc.com/view/3a9de2c9b47f43c47b0969ac082cd845/3a9de2c9b47f43c47b0969ac082cd8451.gif)
![第二章 一元線性回歸分析_第2頁](http://file4.renrendoc.com/view/3a9de2c9b47f43c47b0969ac082cd845/3a9de2c9b47f43c47b0969ac082cd8452.gif)
![第二章 一元線性回歸分析_第3頁](http://file4.renrendoc.com/view/3a9de2c9b47f43c47b0969ac082cd845/3a9de2c9b47f43c47b0969ac082cd8453.gif)
![第二章 一元線性回歸分析_第4頁](http://file4.renrendoc.com/view/3a9de2c9b47f43c47b0969ac082cd845/3a9de2c9b47f43c47b0969ac082cd8454.gif)
![第二章 一元線性回歸分析_第5頁](http://file4.renrendoc.com/view/3a9de2c9b47f43c47b0969ac082cd845/3a9de2c9b47f43c47b0969ac082cd8455.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二章一元線性回歸分析第一頁,共八十八頁,編輯于2023年,星期四第二章經(jīng)典單方程計量經(jīng)濟學模型:
一元線性回歸模型
回歸分析概述一元線性回歸模型的參數(shù)估計一元線性回歸模型檢驗一元線性回歸模型預測實例第二頁,共八十八頁,編輯于2023年,星期四§2.1回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù)三、隨機擾動項四、樣本回歸函數(shù)(SRF)第三頁,共八十八頁,編輯于2023年,星期四§2.1回歸分析概述(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機變量間的關(guān)系。(2)統(tǒng)計依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機變量間的關(guān)系。一、變量間的關(guān)系及回歸分析的基本概念
1、變量間的關(guān)系經(jīng)濟變量之間的關(guān)系,大體可分為兩類:第四頁,共八十八頁,編輯于2023年,星期四對變量間統(tǒng)計依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:例如:
函數(shù)關(guān)系:統(tǒng)計依賴關(guān)系/統(tǒng)計相關(guān)關(guān)系:第五頁,共八十八頁,編輯于2023年,星期四
①不線性相關(guān)并不意味著不相關(guān);
②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個變量對另一個(些)變量的統(tǒng)計依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。
④相關(guān)分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的?;貧w分析對變量的處理方法存在不對稱性,即區(qū)分應變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是?!⒁猓旱诹?,共八十八頁,編輯于2023年,星期四
回歸分析(regressionanalysis)是研究一個變量關(guān)于另一個(些)變量的具體依賴關(guān)系的計算方法和理論。
其用意:在于通過后者的已知或設(shè)定值,去估計和(或)預測前者的(總體)均值。這里:前一個變量被稱為被解釋變量(ExplainedVariable)或應變量(DependentVariable),后一個(些)變量被稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。2、回歸分析的基本概念
回歸分析構(gòu)成計量經(jīng)濟學的方法論基礎(chǔ),其主要內(nèi)容包括:
(1)根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)利用回歸方程進行分析、評價及預測。第七頁,共八十八頁,編輯于2023年,星期四
由于變量間關(guān)系的隨機性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當解釋變量取某個確定值時,與之統(tǒng)計相關(guān)的被解釋變量所有可能出現(xiàn)的對應值的平均值。例2.1:一個假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預測該社區(qū)家庭的平均月消費支出水平。二、總體回歸函數(shù)
為達到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費支出。第八頁,共八十八頁,編輯于2023年,星期四第九頁,共八十八頁,編輯于2023年,星期四(1)由于不確定因素的影響,對同一收入水平X,不同家庭的消費支出不完全相同;(2)但由于調(diào)查的完備性,給定收入水平X的消費支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,如:P(Y=561|X=800)=1/4。因此,給定收入X的值Xi,可得消費支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):E(Y|X=Xi)該例中:E(Y|X=800)=605分析:第十頁,共八十八頁,編輯于2023年,星期四描出散點圖發(fā)現(xiàn):隨著收入的增加,消費“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費支出Y(元)
第十一頁,共八十八頁,編輯于2023年,星期四概念:
在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。稱為(雙變量)總體回歸函數(shù)(populationregressionfunction,PRF)。
相應的函數(shù):第十二頁,共八十八頁,編輯于2023年,星期四
回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。含義:
函數(shù)形式:可以是線性或非線性的。例2.1中,將居民消費支出看成是其可支配收入的線性函數(shù)時:
為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。
。第十三頁,共八十八頁,編輯于2023年,星期四
三、隨機擾動項總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費支出水平。但對某一個別的家庭,其消費支出可能與該平均水平有偏差。稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。記第十四頁,共八十八頁,編輯于2023年,星期四例2.1中,個別家庭的消費支出為:
(*)式稱為總體回歸函數(shù)(方程)PRF的隨機設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。(1)該收入水平下所有家庭的平均消費支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分。(2)其他隨機或非確定性(nonsystematic)部分i。即,給定收入水平Xi,個別家庭的支出可表示為兩部分之和:(*)由于方程中引入了隨機項,成為計量經(jīng)濟學模型,因此也稱為總體回歸模型。第十五頁,共八十八頁,編輯于2023年,星期四隨機誤差項主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測值的觀測誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機因素的影響。產(chǎn)生并設(shè)計隨機誤差項的主要原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則。第十六頁,共八十八頁,編輯于2023年,星期四
四、樣本回歸函數(shù)(SRF)
問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?問:能否從該樣本估計總體回歸函數(shù)PRF?回答:能例2.2:在例2.1的總體中有如下一個樣本,
總體的信息往往無法掌握,現(xiàn)實的情況只能是在一次觀測中得到總體的一個樣本。第十七頁,共八十八頁,編輯于2023年,星期四核樣本的散點圖(scatterdiagram):
樣本散點圖近似于一條直線,畫一條直線以盡好地擬合該散點圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sampleregressionlines)。記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)。
第十八頁,共八十八頁,編輯于2023年,星期四
這里將樣本回歸線看成總體回歸線的近似替代則
注意:第十九頁,共八十八頁,編輯于2023年,星期四
樣本回歸函數(shù)的隨機形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機形式:
由于方程中引入了隨機項,成為計量經(jīng)濟模型,因此也稱為樣本回歸模型(sampleregressionmodel)。
第二十頁,共八十八頁,編輯于2023年,星期四
▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。注意:這里PRF可能永遠無法知道。即,根據(jù)
估計第二十一頁,共八十八頁,編輯于2023年,星期四§2.2一元線性回歸模型的參數(shù)估計
一、一元線性回歸模型的基本假設(shè)二、參數(shù)的普通最小二乘估計(OLS)三、參數(shù)估計的最大或然法(ML)四、最小二乘估計量的性質(zhì)五、參數(shù)估計量的概率分布及隨機干擾項方差的估計
第二十二頁,共八十八頁,編輯于2023年,星期四單方程計量經(jīng)濟學模型分為兩大類:
線性模型和非線性模型線性模型中,變量之間的關(guān)系呈線性關(guān)系非線性模型中,變量之間的關(guān)系呈非線性關(guān)系
一元線性回歸模型:只有一個解釋變量
i=1,2,…,nY為被解釋變量,X為解釋變量,0與1為待估參數(shù),為隨機干擾項第二十三頁,共八十八頁,編輯于2023年,星期四
回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準確地估計總體回歸函數(shù)(模型)PRF。
估計方法有多種,其種最廣泛使用的是普通最小二乘法(ordinaryleastsquares,OLS)。
為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。
注:實際這些假設(shè)與所采用的估計方法緊密相關(guān)。
第二十四頁,共八十八頁,編輯于2023年,星期四
一、線性回歸模型的基本假設(shè)
假設(shè)1、解釋變量X是確定性變量,不是隨機變量;
假設(shè)2、隨機誤差項具有零均值、同方差和不序列相關(guān)性:E(i)=0i=1,2,…,nVar(i)=2i=1,2,…,nCov(i,j)=0i≠ji,j=1,2,…,n
假設(shè)3、隨機誤差項與解釋變量X之間不相關(guān):Cov(Xi,i)=0i=1,2,…,n
假設(shè)4、服從零均值、同方差、零協(xié)方差的正態(tài)分布i~N(0,2)i=1,2,…,n第二十五頁,共八十八頁,編輯于2023年,星期四1、如果假設(shè)1、2滿足,則假設(shè)3也滿足;
2、如果假設(shè)4滿足,則假設(shè)2也滿足。注意:
以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(ClassicalLinearRegressionModel,CLRM)。
第二十六頁,共八十八頁,編輯于2023年,星期四
另外,在進行模型回歸時,還有兩個暗含的假設(shè):
假設(shè)5:隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。即
假設(shè)6:回歸模型是正確設(shè)定的
假設(shè)5旨在排除時間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量,因為這類數(shù)據(jù)不僅使大樣本統(tǒng)計推斷變得無效,而且往往產(chǎn)生所謂的偽回歸問題(spuriousregressionproblem)。假設(shè)6也被稱為模型沒有設(shè)定偏誤(specificationerror)第二十七頁,共八十八頁,編輯于2023年,星期四二、參數(shù)的普通最小二乘估計(OLS)
給定一組樣本觀測值(Xi,Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地擬合這組值.
普通最小二乘法(Ordinaryleastsquares,OLS)給出的判斷標準是:二者之差的平方和最小。第二十八頁,共八十八頁,編輯于2023年,星期四方程組(*)稱為正規(guī)方程組(normalequations)。
第二十九頁,共八十八頁,編輯于2023年,星期四記上述參數(shù)估計量可以寫成:
稱為OLS估計量的離差形式(deviationform)。由于參數(shù)的估計結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計量(ordinaryleastsquaresestimators)。
第三十頁,共八十八頁,編輯于2023年,星期四順便指出,記則有
可得
(**)式也稱為樣本回歸函數(shù)的離差形式。(**)注意:在計量經(jīng)濟學中,往往以小寫字母表示對均值的離差。
第三十一頁,共八十八頁,編輯于2023年,星期四
三、參數(shù)估計的最大或然法(ML)
最大或然法(MaximumLikelihood,簡稱ML),也稱最大似然法,是不同于最小二乘法的另一種參數(shù)估計方法,是從最大或然原理出發(fā)發(fā)展起來的其它估計方法的基礎(chǔ)。
基本原理:對于最大或然法,當從模型總體隨機抽取n組樣本觀測值后,最合理的參數(shù)估計量應該使得從模型中抽取該n組樣本觀測值的概率最大。第三十二頁,共八十八頁,編輯于2023年,星期四在滿足基本假設(shè)條件下,對一元線性回歸模型:
隨機抽取n組樣本觀測值(Xi,Yi)(i=1,2,…n)。那么Yi服從如下的正態(tài)分布:于是,Y的概率函數(shù)為(i=1,2,…n)假如模型的參數(shù)估計量已經(jīng)求得,為第三十三頁,共八十八頁,編輯于2023年,星期四因為Yi是相互獨立的,所以的所有樣本觀測值的聯(lián)合概率,也即或然函數(shù)(likelihoodfunction)為:
將該或然函數(shù)極大化,即可求得到模型參數(shù)的極大或然估計量。第三十四頁,共八十八頁,編輯于2023年,星期四
由于或然函數(shù)的極大化與或然函數(shù)的對數(shù)的極大化是等價的,所以,取對數(shù)或然函數(shù)如下:第三十五頁,共八十八頁,編輯于2023年,星期四解得模型的參數(shù)估計量為:
可見,在滿足一系列基本假設(shè)的情況下,模型結(jié)構(gòu)參數(shù)的最大或然估計量與普通最小二乘估計量是相同的。第三十六頁,共八十八頁,編輯于2023年,星期四例2.2.1:在上述家庭可支配收入-消費支出例中,對于所抽出的一組樣本數(shù),參數(shù)估計的計算可通過下面的表2.2.1進行。
第三十七頁,共八十八頁,編輯于2023年,星期四因此,由該樣本估計的回歸方程為:
第三十八頁,共八十八頁,編輯于2023年,星期四
四、最小二乘估計量的性質(zhì)當模型參數(shù)估計出后,需考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質(zhì)。一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性:
(1)線性性,即它是否是另一隨機變量的線性函數(shù);
(2)無偏性,即它的均值或期望值是否等于總體的真實值;
(3)有效性,即它是否在所有線性無偏估計量中具有最小方差。第三十九頁,共八十八頁,編輯于2023年,星期四(4)漸近無偏性,即樣本容量趨于無窮大時,是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。
這三個準則也稱作估計量的小樣本性質(zhì)。擁有這類性質(zhì)的估計量稱為最佳線性無偏估計量(bestlinerunbiasedestimator,BLUE)。
當不滿足小樣本性質(zhì)時,需進一步考察估計量的大樣本或漸近性質(zhì):第四十頁,共八十八頁,編輯于2023年,星期四高斯—馬爾可夫定理(Gauss-Markovtheorem)
在給定經(jīng)典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。第四十一頁,共八十八頁,編輯于2023年,星期四證:易知故同樣地,容易得出
第四十二頁,共八十八頁,編輯于2023年,星期四第四十三頁,共八十八頁,編輯于2023年,星期四(2)證明最小方差性其中,ci=ki+di,di為不全為零的常數(shù)則容易證明普通最小二乘估計量(ordinaryleastSquaresEstimators)稱為最佳線性無偏估計量(bestlinearunbiasedestimator,BLUE)
第四十四頁,共八十八頁,編輯于2023年,星期四
由于最小二乘估計量擁有一個“好”的估計量所應具備的小樣本特性,它自然也擁有大樣本特性。
第四十五頁,共八十八頁,編輯于2023年,星期四
五、參數(shù)估計量的概率分布及隨機干擾項方差的估計
第四十六頁,共八十八頁,編輯于2023年,星期四第四十七頁,共八十八頁,編輯于2023年,星期四2、隨機誤差項的方差2的估計由于隨機項i不可觀測,只能從i的估計——殘差ei出發(fā),對總體方差進行估計。
2又稱為總體方差。
可以證明,2的最小二乘估計量為它是關(guān)于2的無偏估計量。
第四十八頁,共八十八頁,編輯于2023年,星期四在最大或然估計法中,因此,2的最大或然估計量不具無偏性,但卻具有一致性。
第四十九頁,共八十八頁,編輯于2023年,星期四第五十頁,共八十八頁,編輯于2023年,星期四§2.3一元線性回歸模型的統(tǒng)計檢驗
一、擬合優(yōu)度檢驗
二、變量的顯著性檢驗
三、參數(shù)的置信區(qū)間
第五十一頁,共八十八頁,編輯于2023年,星期四回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計性質(zhì)上已知,如果有足夠多的重復抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗。主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及參數(shù)的區(qū)間估計。第五十二頁,共八十八頁,編輯于2023年,星期四
一、擬合優(yōu)度檢驗
擬合優(yōu)度檢驗:對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。
度量擬合優(yōu)度的指標:判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計方法,已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度?第五十三頁,共八十八頁,編輯于2023年,星期四1、總離差平方和的分解
已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
第五十四頁,共八十八頁,編輯于2023年,星期四如果Yi=?i即實際觀測值落在樣本回歸“線”上,則擬合最好??烧J為,“離差”全部來自回歸線,而與“殘差”無關(guān)。第五十五頁,共八十八頁,編輯于2023年,星期四
對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)第五十六頁,共八十八頁,編輯于2023年,星期四TSS=ESS+RSS
Y的觀測值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變,如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此
擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS第五十七頁,共八十八頁,編輯于2023年,星期四2、可決系數(shù)R2統(tǒng)計量
稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
可決系數(shù)的取值范圍:[0,1]R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。第五十八頁,共八十八頁,編輯于2023年,星期四在例2.1.1的收入-消費支出例中,
注:可決系數(shù)是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計可靠性也應進行檢驗,這將在第3章中進行。
第五十九頁,共八十八頁,編輯于2023年,星期四
二、變量的顯著性檢驗
回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。在一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行變量的顯著性檢驗。
變量的顯著性檢驗所應用的方法是數(shù)理統(tǒng)計學中的假設(shè)檢驗。
計量經(jīng)計學中,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。
第六十頁,共八十八頁,編輯于2023年,星期四
1、假設(shè)檢驗
所謂假設(shè)檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。假設(shè)檢驗采用的邏輯推理方法是反證法。先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的第六十一頁,共八十八頁,編輯于2023年,星期四2、變量的顯著性檢驗
第六十二頁,共八十八頁,編輯于2023年,星期四
檢驗步驟:
(1)對總體參數(shù)提出假設(shè)H0:1=0,H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計量,并由樣本計算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若|t|>t/2(n-2),則拒絕H0,接受H1;若|t|
t/2(n-2),則拒絕H1,接受H0;第六十三頁,共八十八頁,編輯于2023年,星期四
對于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗:
在上述收入-消費支出例中,首先計算2的估計值
第六十四頁,共八十八頁,編輯于2023年,星期四t統(tǒng)計量的計算結(jié)果分別為:
給定顯著性水平=0.05,查t分布表得臨界值
t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費支出的主要解釋變量;
|t2|<2.306,表明在95%的置信度下,無法拒絕截距項為零的假設(shè)。
第六十五頁,共八十八頁,編輯于2023年,星期四
假設(shè)檢驗可以通過一次抽樣的結(jié)果檢驗總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)檢驗的置信區(qū)間估計。
三、參數(shù)的置信區(qū)間
第六十六頁,共八十八頁,編輯于2023年,星期四如果存在這樣一個區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點稱為置信限(confidencelimit)或臨界值(criticalvalues)。第六十七頁,共八十八頁,編輯于2023年,星期四一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著性檢驗中已經(jīng)知道:
意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。表示為:
即第六十八頁,共八十八頁,編輯于2023年,星期四于是得到:(1-)的置信度下,i的置信區(qū)間是
在上述收入-消費支出例中,如果給定=0.01,查表得:
由于于是,1、0的置信區(qū)間分別為:(0.6345,0.9195)
(-433.32,226.98)
第六十九頁,共八十八頁,編輯于2023年,星期四
由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。
要縮小置信區(qū)間,需
(1)增大樣本容量n,因為在同樣的置信水平下,n越大,t分布表中的臨界值越??;同時,增大樣本容量,還可使樣本參數(shù)估計量的標準差減小;
(2)提高模型的擬合優(yōu)度,因為樣本參數(shù)估計量的標準差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應越小。第七十頁,共八十八頁,編輯于2023年,星期四§2.4一元線性回歸分析的應用:預測問題
一、?0是條件均值E(Y|X=X0)或個值Y0的一個無偏估計二、總體條件均值與個值預測值的置信區(qū)間
第七十一頁,共八十八頁,編輯于2023年,星期四
對于一元線性回歸模型
給定樣本以外的解釋變量的觀測值X0,可以得到被解釋變量的預測值?0,可以此作為其條件均值E(Y|X=X0)或個別值Y0的一個近似估計。
注意:嚴格地說,這只是被解釋變量的預測值的估計值,而不是預測值。原因:(1)參數(shù)估計量不確定;(2)隨機項的影響第七十二頁,共八十八頁,編輯于2023年,星期四一、?0是條件均值E(Y|X=X0)或個值Y0的一個無偏估計對總體回歸函數(shù)E(Y|X=X0)=0+1X,X=X0時
E(Y|X=X0)=0+1X0于是可見,?0是條件均值E(Y|X=X0)的無偏估計。第七十三頁,共八十八頁,編輯于2023年,星期四對總體回歸模型Y=0+1X+,當X=X0時于是第七十四頁,共八十八頁,編輯于2023年,星期四
二、總體條件均值與個值預測值的置信區(qū)間
1、總體均值預測值的置信區(qū)間
由于
于是可以證明
第七十五頁,共八十八頁,編輯于2023年,星期四因此
故
其中于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為
第七十六頁,共八十八頁,編輯于2023年,星期四2、總體個值預測值的預測區(qū)間
由Y0=0+1X0+知:
于是
式中:從而在1-的置信度下,Y0的置信區(qū)間為
第七十七頁,共八十八頁,編輯于2023年,星期四在上述收入-消費支出例中,得到的樣本回歸函數(shù)為
則在X0=1000處,?0=–103.172+0.777×1000=673.84
而因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:673.84-2.30661.05<E(Y|X=1000)<673.84+2.30661.05或
(533.05,814.62)
第七十八頁,共八十八頁,編輯于2023年,星期四同樣地,對于Y在X=1000的個體值,其95%的置信區(qū)間為:673.84-2.30661.05<Yx=1000<673.84+2.30661.05或(372.03,975.65)總體回歸函數(shù)的置信帶(域)(confidenceband)個體的置信帶(域)
第七十九頁,共八十八頁,編輯于2023年,星期四對于Y的總體均值E(Y|X)與個體值的預測區(qū)間(置信區(qū)間):(1)樣本容量n越大,預測精度越高,反之預測精度越低;(2)樣本容量一定時,置信帶的寬度當在X均值處最小,其附近進行預測(插值預測)精度越大;X越遠離其均值,置信帶越寬,預測可信度下降。第八十頁,共八十八頁,編輯于2023年,星期四§2.5實例:時間序列問題
一、中國居民人均消費模型
二、時間序列問題
第八十一頁,共八十八頁,編輯于2023年,星期四一、中國居民人均消費模型
例2.5.1考察中國居民收入與消費支出的關(guān)系。GDPP:
人均國內(nèi)生產(chǎn)總值(199
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- cfg樁施工合同范本
- 個人合資協(xié)議合同范本
- 傳媒公司獨家合同范本
- 2025年度國家重點建設(shè)項目拆遷補償協(xié)議執(zhí)行細則
- 2025年度智能家居與智能家居裝飾合同
- 中國交通警示燈項目投資可行性研究報告
- 2024-2030年中國合成維生素E行業(yè)市場全景監(jiān)測及投資策略研究報告
- 2025年度酒店會議室場地租賃與茶藝表演服務合同
- 2025年中國注射級山梨醇行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2025年度古建筑木工修復與保護工程合同
- 課題申報參考:生活服務數(shù)字化轉(zhuǎn)型下社區(qū)生活圈建設(shè)理念、模式與路徑研究
- 甘肅省民航機場集團招聘筆試沖刺題2025
- 心理學基礎(chǔ)知識考試參考題庫500題(含答案)
- 北師大版小學三年級數(shù)學下冊全冊教案
- DCMM練習題練習試題
- 《工業(yè)化建筑施工階段碳排放計算標準》
- 四級人工智能訓練師(中級)職業(yè)技能等級認定考試題及答案
- GB/T 33761-2024綠色產(chǎn)品評價通則
- 地下停車場充電樁技術(shù)方案建議書
- 幼兒園設(shè)施設(shè)備安全教育
- 廢舊保溫棉處置合同范例
評論
0/150
提交評論