普通最小二乘法.ppt

上傳人：燈*** IP屬地：河北上傳時間：2020-01-14 格式：PPT 頁數(shù)：112 大?。?.08MB 積分：12 舉報 版權申訴

已閱讀5頁，還剩107頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

第二章經典單方程計量經濟學模型一元線性回歸模型回歸分析概述一元線性回歸模型的參數(shù)估計一元線性回歸模型檢驗一元線性回歸模型預測實例 2 1回歸分析概述一變量間的關系及回歸分析的基本概念二總體回歸函數(shù) PRF 三隨機擾動項四樣本回歸函數(shù) SRF 一變量間的關系及回歸分析的基本概念 1 變量間的關系 1 確定性關系或函數(shù)關系研究的是確定現(xiàn)象非隨機變量間的關系 2 統(tǒng)計依賴或相關關系研究的是非確定現(xiàn)象隨機變量間的關系對變量間統(tǒng)計依賴關系的考察主要是通過相關分析 correlationanalysis 或回歸分析 regressionanalysis 來完成的注意不線性相關并不意味著不相關有相關關系并不意味著一定有因果關系回歸分析相關分析研究一個變量對另一個些變量的統(tǒng)計依賴關系但它們并不意味著一定有因果關系相關分析對稱地對待任何兩個變量兩個變量都被看作是隨機的回歸分析對變量的處理方法存在不對稱性即區(qū)分應變量被解釋變量和自變量解釋變量前者是隨機變量后者不是 2 回歸分析的基本概念回歸分析 regressionanalysis 是研究一個變量關于另一個些變量的具體依賴關系的計算方法和理論其目的在于通過后者的已知或設定值去估計和或預測前者的總體均值被解釋變量 ExplainedVariable 或應變量 DependentVariable 解釋變量 ExplanatoryVariable 或自變量 IndependentVariable 回歸分析構成計量經濟學的方法論基礎其主要內容包括 1 根據(jù)樣本觀察值對經濟計量模型參數(shù)進行估計求得回歸方程 2 對回歸方程參數(shù)估計值進行顯著性檢驗 3 利用回歸方程進行分析評價及預測二總體回歸函數(shù) 回歸分析關心的是根據(jù)解釋變量的已知或給定值考察被解釋變量的總體均值即當解釋變量取某個確定值時與之統(tǒng)計相關的被解釋變量所有可能出現(xiàn)的對應值的平均值例2 1 一個假想的社區(qū)有100戶家庭組成要研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關系即如果知道了家庭的月收入能否預測該社區(qū)家庭的平均月消費支出水平為達到此目的將該100戶家庭劃分為組內收入差不多的10組以分析每一收入組的家庭消費支出由于不確定因素的影響對同一收入水平X 不同家庭的消費支出不完全相同但由于調查的完備性給定收入水平X的消費支出Y的分布是確定的即以X的給定值為條件的Y的條件分布 Conditionaldistribution 是已知的例如 P Y 561 X 800 1 4 因此給定收入X的值Xi 可得消費支出Y的條件均值 conditionalmean 或條件期望 conditionalexpectation E Y X Xi 該例中 E Y X 800 561描出散點圖發(fā)現(xiàn) 隨著收入的增加消費平均地說也在增加且Y的條件均值均落在一根正斜率的直線上這條直線稱為總體回歸線在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線 populationregressionline 或更一般地稱為總體回歸曲線 populationregressioncurve 稱為雙變量總體回歸函數(shù) populationregressionfunction PRF 相應的函數(shù) 含義回歸函數(shù) PRF 說明被解釋變量Y的平均狀態(tài) 總體條件期望隨解釋變量X變化的規(guī)律函數(shù)形式可以是線性或非線性的例2 1中將居民消費支出看成是其可支配收入的線性函數(shù)時為一線性函數(shù) 其中 0 1是未知參數(shù) 稱為回歸系數(shù) regressioncoefficients 三隨機擾動項總體回歸函數(shù)說明在給定的收入水平Xi下該社區(qū)家庭平均的消費支出水平但對某一個別的家庭其消費支出可能與該平均水平有偏差稱為觀察值圍繞它的期望值的離差 deviation 是一個不可觀測的隨機變量又稱為隨機干擾項 stochasticdisturbance 或隨機誤差項 stochasticerror 例2 1中給定收入水平Xi 個別家庭的支出可表示為兩部分之和 1 該收入水平下所有家庭的平均消費支出E Y Xi 稱為系統(tǒng)性 systematic 或確定性 deterministic 部分 2 其他隨機或非確定性 nonsystematic 部分 i 稱為總體回歸函數(shù) PRF 的隨機設定形式表明被解釋變量除了受解釋變量的系統(tǒng)性影響外還受其他因素的隨機性影響由于方程中引入了隨機項成為計量經濟學模型因此也稱為總體回歸模型隨機誤差項主要包括下列因素在解釋變量中被忽略的因素的影響變量觀測值的觀測誤差的影響模型關系的設定誤差的影響其他隨機因素的影響產生并設計隨機誤差項的主要原因理論的含糊性數(shù)據(jù)的欠缺節(jié)省原則四樣本回歸函數(shù) SRF 問題能從一次抽樣中獲得總體的近似的信息嗎如果可以如何從抽樣中獲得總體的近似信息例2 2 在例2 1的總體中有如下一個樣本能否從該樣本估計總體回歸函數(shù)PRF 回答能該樣本的散點圖 scatterdiagram 畫一條直線以盡好地擬合該散點圖由于樣本取自總體可以該直線近似地代表總體回歸線該直線稱為樣本回歸線 sampleregressionlines 記樣本回歸線的函數(shù)形式為稱為樣本回歸函數(shù) sampleregressionfunction SRF 注意這里將樣本回歸線看成總體回歸線的近似替代則樣本回歸函數(shù)的隨機形式樣本回歸模型同樣地樣本回歸函數(shù)也有如下的隨機形式由于方程中引入了隨機項成為計量經濟模型因此也稱為樣本回歸模型 sampleregressionmodel 回歸分析的主要目的根據(jù)樣本回歸函數(shù)SRF 估計總體回歸函數(shù)PRF 即根據(jù) 估計注意這里PRF可能永遠無法知道 2 2一元線性回歸模型的參數(shù)估計一一元線性回歸模型的基本假設二參數(shù)的普通最小二乘估計 OLS 三參數(shù)估計的最大或然法 ML 四最小二乘估計量的性質五參數(shù)估計量的概率分布及隨機干擾項方差的估計說明單方程計量經濟學模型分為兩大類線性模型和非線性模型線性模型中變量之間的關系呈線性關系非線性模型中變量之間的關系呈非線性關系一元線性回歸模型只有一個解釋變量 i 1 2 n Y為被解釋變量 X為解釋變量 0與 1為待估參數(shù) 為隨機干擾項回歸分析的主要目的是要通過樣本回歸函數(shù) 模型 SRF盡可能準確地估計總體回歸函數(shù) 模型 PRF 估計方法有多種其中最廣泛使用的是普通最小二乘法 ordinaryleastsquares OLS 為保證參數(shù)估計量具有良好的性質通常對模型提出若干基本假設實際這些假設與所采用的估計方法緊密相關一線性回歸模型的基本假設假設1 解釋變量X是確定性變量不是隨機變量假設2 隨機誤差項具有零均值同方差和不序列相關性 E i 0i 1 2 nVar i 2i 1 2 nCov i j 0i ji j 1 2 n 假設3 隨機誤差項與解釋變量X之間不相關 Cov Xi i 0i 1 2 n假設4 服從零均值同方差零協(xié)方差的正態(tài)分布 i N 0 2 i 1 2 n 如果假設1 2滿足則假設3也滿足如果假設4滿足則假設2也滿足注意以上假設也稱為線性回歸模型的經典假設或高斯 Gauss 假設滿足該假設的線性回歸模型也稱為經典線性回歸模型 ClassicalLinearRegressionModel CLRM 另外在進行模型回歸時還有兩個暗含的假設假設5 隨著樣本容量的無限增加解釋變量X的樣本方差趨于一有限常數(shù) 即假設6 回歸模型是正確設定的假設5旨在排除時間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量因為這類數(shù)據(jù)不僅使大樣本統(tǒng)計推斷變得無效而且往往產生所謂的偽回歸問題 spuriousregressionproblem 假設6也被稱為模型沒有設定偏誤 specificationerror 二參數(shù)的普通最小二乘估計 OLS 給定一組樣本觀測值 Xi Yi i 1 2 n 要求樣本回歸函數(shù)盡可能好地擬合這組值普通最小二乘法 Ordinaryleastsquares OLS 給出的判斷標準是二者之差的平方和最小方程組稱為正規(guī)方程組 normalequations 記上述參數(shù)估計量可以寫成稱為OLS估計量的離差形式 deviationform 由于參數(shù)的估計結果是通過最小二乘法得到的故稱為普通最小二乘估計量 ordinaryleastsquaresestimators 順便指出記則有可得式也稱為樣本回歸函數(shù)的離差形式注意在計量經濟學中往往以小寫字母表示對均值的離差三參數(shù)估計的最大或然法 ML 最大或然法 MaximumLikelihood 簡稱ML 也稱最大似然法是不同于最小二乘法的另一種參數(shù)估計方法是從最大或然原理出發(fā)發(fā)展起來的其他估計方法的基礎基本原理對于最大或然法當從模型總體隨機抽取n組樣本觀測值后最合理的參數(shù)估計量應該使得從模型中抽取該n組樣本觀測值的概率最大在滿足基本假設條件下對一元線性回歸模型隨機抽取n組樣本觀測值 Xi Yi i 1 2 n 那么Yi服從如下的正態(tài)分布于是 Y的概率函數(shù)為 i 1 2 n 假如模型的參數(shù)估計量已經求得為因為Yi是相互獨立的所以的所有樣本觀測值的聯(lián)合概率也即或然函數(shù) likelihoodfunction 為將該或然函數(shù)極大化即可求得到模型參數(shù)的極大或然估計量由于或然函數(shù)的極大化與或然函數(shù)的對數(shù)的極大化是等價的所以取對數(shù)或然函數(shù)如下解得模型的參數(shù)估計量為可見在滿足一系列基本假設的情況下模型結構參數(shù)的最大或然估計量與普通最小二乘估計量是相同的例2 2 1 在上述家庭可支配收入消費支出例中對于所抽出的一組樣本數(shù) 參數(shù)估計的計算可通過下面的表2 2 1進行因此由該樣本估計的回歸方程為四最小二乘估計量的性質當模型參數(shù)估計出后需考慮參數(shù)估計值的精度即是否能代表總體參數(shù)的真值或者說需考察參數(shù)估計量的統(tǒng)計性質一個用于考察總體的估計量可從如下幾個方面考察其優(yōu)劣性 1 線性性即它是否是另一隨機變量的線性函數(shù) 2 無偏性即它的均值或期望值是否等于總體的真實值 3 有效性即它是否在所有線性無偏估計量中具有最小方差這三個準則也稱作估計量的小樣本性質擁有這類性質的估計量稱為最佳線性無偏估計量 bestlinerunbiasedestimator BLUE 4 漸近無偏性即樣本容量趨于無窮大時是否它的均值序列趨于總體真值 5 一致性即樣本容量趨于無窮大時它是否依概率收斂于總體的真值 6 漸近有效性即樣本容量趨于無窮大時是否它在所有的一致估計量中具有最小的漸近方差當不滿足小樣本性質時需進一步考察估計量的大樣本或漸近性質高斯馬爾可夫定理 Gauss Markovtheorem 在給定經典線性回歸的假定下最小二乘估計量是具有最小方差的線性無偏估計量證易知故同樣地容易得出 2 證明最小方差性其中 ci ki di di為不全為零的常數(shù)則容易證明普通最小二乘估計量 ordinaryleastSquaresEstimators 稱為最佳線性無偏估計量 bestlinearunbiasedestimator BLUE 由于最小二乘估計量擁有一個好的估計量所應具備的小樣本特性它自然也擁有大樣本特性五參數(shù)估計量的概率分布及隨機干擾項方差的估計 2 隨機誤差項的方差 2的估計 2又稱為總體方差由于隨機項 i不可觀測只能從 i的估計殘差ei出發(fā) 對總體方差進行估計可以證明 2的最小二乘估計量為它是關于 2的無偏估計量在最大或然估計法中因此 2的最大或然估計量不具無偏性但卻具有一致性 2 3一元線性回歸模型的統(tǒng)計檢驗一擬合優(yōu)度檢驗二變量的顯著性檢驗三參數(shù)的置信區(qū)間說明回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù) 或者說是用樣本回歸線代替總體回歸線盡管從統(tǒng)計性質上已知如果有足夠多的重復抽樣參數(shù)的估計值的期望均值就等于其總體的參數(shù)真值但在一次抽樣中估計值不一定就等于該真值那么在一次抽樣中參數(shù)的估計值與真值的差異有多大是否顯著這就需要進一步進行統(tǒng)計檢驗主要包括擬合優(yōu)度檢驗變量的顯著性檢驗及參數(shù)的區(qū)間估計一擬合優(yōu)度檢驗擬合優(yōu)度檢驗對樣本回歸直線與樣本觀測值之間擬合程度的檢驗度量擬合優(yōu)度的指標判定系數(shù) 可決系數(shù) R2 問題采用普通最小二乘估計方法已經保證了模型最好地擬合了樣本觀測值為什么還要檢驗擬合程度 1 總離差平方和的分解已知由一組樣本觀測值 Xi Yi i 1 2 n得到如下樣本回歸直線如果Yi i即實際觀測值落在樣本回歸線上則擬合最好可認為離差全部來自回歸線而與殘差無關對于所有樣本點則需考慮這些點與樣本均值離差的平方和可以證明 TSS ESS RSS 記總體平方和 TotalSumofSquares 回歸平方和 ExplainedSumofSquares 殘差平方和 ResidualSumofSquares Y的觀測值圍繞其均值的總離差 totalvariation 可分解為兩部分一部分來自回歸線 ESS 另一部分則來自隨機勢力 RSS 在給定樣本中 TSS不變如果實際觀測點離樣本回歸線越近則ESS在TSS中占的比重越大因此擬合優(yōu)度回歸平方和ESS 總離差TSS 2 可決系數(shù)R2統(tǒng)計量稱R2為樣本可決系數(shù) 判定系數(shù) coefficientofdetermination 可決系數(shù)的取值范圍 0 1 R2越接近1 說明實際觀測點離樣本線越近擬合優(yōu)度越高在例2 1 1的收入消費支出例中注可決系數(shù)是一個非負的統(tǒng)計量它也是隨著抽樣的不同而不同為此對可決系數(shù)的統(tǒng)計可靠性也應進行檢驗這將在第3章中進行二變量的顯著性檢驗回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素在一元線性模型中就是要判斷X是否對Y具有顯著的線性性影響這就需要進行變量的顯著性檢驗變量的顯著性檢驗所應用的方法是數(shù)理統(tǒng)計學中的假設檢驗計量經濟學中主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的 1 假設檢驗所謂假設檢驗就是事先對總體參數(shù)或總體分布形式作出一個假設然后利用樣本信息來判斷原假設是否合理即判斷樣本信息與原假設是否有顯著差異從而決定是否接受或否定原假設假設檢驗采用的邏輯推理方法是反證法先假定原假設正確然后根據(jù)樣本信息觀察由此假設而導致的結果是否合理從而判斷是否接受原假設判斷結果合理與否是基于小概率事件不易發(fā)生這一原理的 2 變量的顯著性檢驗檢驗步驟 1 對總體參數(shù)提出假設H0 1 0 H1 1 0 2 以原假設H0構造t統(tǒng)計量并由樣本計算其值 3 給定顯著性水平查t分布表得臨界值t 2 n 2 4 比較判斷若 t t 2 n 2 則拒絕H0 接受H1 若 t t 2 n 2 則拒絕H1 接受H0 對于一元線性回歸方程中的 0 可構造t統(tǒng)計量進行顯著性檢驗在上述收入消費支出例中首先計算 2的估計值 t統(tǒng)計量的計算結果分別為給定顯著性水平 0 05 查t分布表得臨界值t0 05 2 8 2 306 t1 2 306 說明家庭可支配收入在95 的置信度下顯著即是消費支出的主要解釋變量 t2 2 306 表明在95 的置信度下無法拒絕截距項為零的假設假設檢驗可以通過一次抽樣的結果檢驗總體參數(shù)可能的假設值的范圍如是否為零但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多近三參數(shù)的置信區(qū)間要判斷樣本參數(shù)的估計值在多大程度上可以近似地替代總體參數(shù)的真值往往需要通過構造一個以樣本參數(shù)的估計值為中心的區(qū)間來考察它以多大的可能性概率包含著真實的參數(shù)值這種方法就是參數(shù)檢驗的置信區(qū)間估計如果存在這樣一個區(qū)間稱之為置信區(qū)間 confidenceinterval 1 稱為置信系數(shù) 置信度 confidencecoefficient 稱為顯著性水平 levelofsignificance 置信區(qū)間的端點稱為置信限 confidencelimit 或臨界值 criticalvalues 一元線性模型中 i i 1 2 的置信區(qū)間在變量的顯著性檢驗中已經知道意味著如果給定置信度 1 從分布表中查得自由度為 n 2 的臨界值那么t值處在 t 2 t 2 的概率是 1 表示為即于是得到 1 的置信度下 i的置信區(qū)間是在上述收入消費支出例中如果給定 0 01 查表得由于于是 1 0的置信區(qū)間分別為 0 6345 0 9195 433 32 226 98 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的接近程度因此置信區(qū)間越小越好要縮小置信區(qū)間需要 1 增大樣本容量n 因為在同樣的置信水平下 n越大 t分布表中的臨界值越小同時增大樣本容量還可使樣本參數(shù)估計量的標準差減小 2 提高模型的擬合優(yōu)度因為樣本參數(shù)估計量的標準差與殘差平方和呈正比模型擬合優(yōu)度越高殘差平方和應越小由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的接近程度因此置信區(qū)間越小越好要縮小置信區(qū)間需 1 增大樣本容量n 因為在同樣的置信水平下 n越大 t分布表中的臨界值越小同時增大樣本容量還可使樣本參數(shù)估計量的標準差減小 2 提高模型的擬合優(yōu)度因為樣本參數(shù)估計量的標準差與殘差平方和呈正比模型擬合優(yōu)度越高殘差平方和應越小 2 4一元線性回歸分析的應用預測問題一 0是條件均值E Y X X0 或個值Y0的一個無偏估計二總體條件均值與個值預測值的置信區(qū)間對于一元線性回歸模型給定樣本以外的解釋變量的觀測值X0 可以得到被解釋變量的預測值 0 可以此作為其條件均值E Y X X0 或個別值Y0的一個近似估計嚴格地說這只是被解釋變量的預測值的估計值而不是預測值原因 1 參數(shù)估計量不確定 2 隨機項的影響說明一 0是條件均值E Y X X0 或個值Y0的一個無偏估計對總體回歸函數(shù)E Y X X0 0 1X X X0時E Y X X0 0 1X0 于是可見 0是條件均值E Y X X0 的無偏估計對總體回歸模型Y 0 1X 當X X0時于是二總體條件均值與個值預測值的置信區(qū)間 1 總體均值預測值的置信區(qū)間由于于是可以證明因此故于是在1 的置信度下總體均值E Y X0 的置信區(qū)間為其中 2 總體個值預測值的預測區(qū)間由Y0 0 1X0 知于是式中從而在1 的置信度下 Y0的置信區(qū)間為在上述收入消費支出例中得到的樣本回歸函數(shù)為則在X0 1000處 0 103 172 0 777 1000 673 84 而因此總體均值E Y X 1000 的95 的置信區(qū)間為 673 84 2 306 61 05 E Y X 1000 673 84 2 306 61 05或 533 05 814 62 同樣地對于Y在X 1000的個體值其95 的置信區(qū)間為 673 84 2 306 61 05 Yx 1000 673 84 2 306 61 05或 372 03 975 65 總體回歸函數(shù)的置信帶域 confidenceband 個體的置信帶域對于Y的總體均值E Y X 與個體值的預測區(qū)間置信區(qū)間 1 樣本容量n越大預測精度越高反之預測精度越低 2 樣本容量一定時置信帶的寬度當在X均值處最小其附近進行預測插值預測精度越大 X越遠離其均值置信帶越寬預測可信度下降 2 5實例時間序列問題一中國居民人均消費模型二時間序列問題一中國居民人均消費模型例2 5 1考察中國居民

人人文庫> 全部分類> 教育資料 > 中學教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

普通最小二乘法.ppt

文檔簡介

溫馨提示

最新文檔

評論

普通最小二乘法.ppt

文檔簡介

溫馨提示

最新文檔

評論

相關文檔