模型選擇標(biāo)準(zhǔn)與檢驗新_第1頁
模型選擇標(biāo)準(zhǔn)與檢驗新_第2頁
模型選擇標(biāo)準(zhǔn)與檢驗新_第3頁
模型選擇標(biāo)準(zhǔn)與檢驗新_第4頁
模型選擇標(biāo)準(zhǔn)與檢驗新_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

模型選擇標(biāo)準(zhǔn)與檢驗新7/14/2023第1頁,課件共32頁,創(chuàng)作于2023年2月虛擬變量的常見應(yīng)用描述不同類型(如:不同“性別”的人食品消費支出是否存在差異)的數(shù)量規(guī)律定性因素間的交互作用如例:“黑人女性”是否受到雙重歧視多種類別的定性變量(如:美國不同地區(qū)研究生接受率差異)控制時間特征季節(jié)虛擬變量年份虛擬變量,長期的序列分為二、三段制度效應(yīng):“國八條”房地產(chǎn)調(diào)控政策影響效應(yīng)7/14/2023第2頁,課件共32頁,創(chuàng)作于2023年2月第六章復(fù)習(xí)要點多分類定性變量引入虛擬變量的一般原則差別截距系數(shù)(加法引入虛擬變量參數(shù)估計值)、差別斜率系數(shù)(乘法引入虛擬變量參數(shù)估計值)的含義回歸結(jié)果分析:具體參見書后練習(xí)題重點6.6,6.7,6.11,6.13,6.16,6.20,6.21,6.22,6.27,6.287/14/2023第3頁,課件共32頁,創(chuàng)作于2023年2月基本假定違背:不滿足基本假定的情況。(1)模型設(shè)定有偏誤;所選模型是正確設(shè)定的(2)解釋變量之間存在多重共線性;(3)隨機誤差項序列存在異方差性;(4)隨機誤差項序列存在序列相關(guān)性。所選模型是正確設(shè)定的解釋變量之間不存在完全線性關(guān)系誤差項方差為常數(shù)誤差項之間不相關(guān)基本假定基本假定基本假定基本假定第4頁,課件共32頁,創(chuàng)作于2023年2月第七章模型選擇:標(biāo)準(zhǔn)與檢驗7.1"好的"模型具有的性質(zhì)7.2設(shè)定誤差的類型7.3遺漏相關(guān)解釋變量的模型:過低擬合模型7.4引入不相關(guān)解釋變量模型:過度擬合模型7.5不正確的函數(shù)形式7.6變量的度量誤差7.7模型設(shè)定誤差的檢驗第5頁,課件共32頁,創(chuàng)作于2023年2月7.1“好的”模型具有的性質(zhì)簡約性可識別性擬合優(yōu)度理論一致性預(yù)測能力模型是對現(xiàn)實的抽象,模型應(yīng)盡可能簡潔即能夠用少數(shù)解釋變量能夠說明一個被解釋變量就不要用多個解釋變量每個參數(shù)只有一個估計值對樣本數(shù)據(jù)的擬合程度較好參數(shù)估計值的符號與經(jīng)濟(jì)理論相符預(yù)測值與經(jīng)驗值檢驗?zāi)P偷挠行?,即具有良好的預(yù)測能力第6頁,課件共32頁,創(chuàng)作于2023年2月7.2設(shè)定誤差的類型:四個遺漏相關(guān)變量采用了錯誤的函數(shù)形式變量的度量誤差引入無關(guān)變量請注意:實踐中的模型設(shè)定誤差可能源于上述一個或多個原因。第7頁,課件共32頁,創(chuàng)作于2023年2月對所研究問題的相關(guān)理論了解不深未關(guān)注本領(lǐng)域前期的研究成果在研究中缺乏相關(guān)數(shù)據(jù)數(shù)據(jù)測量時有誤差設(shè)定誤差產(chǎn)生的原因第8頁,課件共32頁,創(chuàng)作于2023年2月

采用遺漏相關(guān)變量的模型進(jìn)行估計而帶來的誤差稱為遺漏相關(guān)變量誤差

設(shè)正確的模型為

Y=B1+B2X1+B3X2+卻錯誤設(shè)定為:

Y=A1+A2X1+v7.3遺漏相關(guān)變量第9頁,課件共32頁,創(chuàng)作于2023年2月遺漏解釋變量將產(chǎn)生如下后果:

(1)如果漏掉的X2與X1相關(guān),使得遺漏變量的模型的最小二乘估計量是有偏的。即不僅代表了x1對被解釋變量的直接影響,還代表了對被解釋變量的間接影響(經(jīng)由x2)。簡言之,本應(yīng)由x2對被解釋變量的影響確體現(xiàn)在x1上。第四章之4.9設(shè)定誤差,分析了古鐘拍賣價格與鐘表年代、競標(biāo)人數(shù)的回歸,(見P83)(2)錯誤模型的參數(shù)估計量也是不一致的,即參數(shù)估計值的均值與其理論值不相等。(3)如果X2與X1不相關(guān),則遺漏變量的模型的估計量滿足無偏性與一致性。(4)錯誤模型的隨機誤差項方差是真實隨機誤差方差的有偏估計第10頁,課件共32頁,創(chuàng)作于2023年2月(5)錯誤模型的斜率系數(shù)方差也是有偏估計。

(6)通常的置信區(qū)間和假設(shè)檢驗過程不再可靠,置信區(qū)間會變寬,會更頻繁接受零假設(shè)。7/14/2023第11頁,課件共32頁,創(chuàng)作于2023年2月舉例:嬰兒死亡率的決定因素被解釋變量:嬰兒死亡率(CM)解釋變量:人均國民收入PGNP;女性識字率FLR正確模型:上述三個變量模型(CM對PGNP、FLR回歸)錯誤模型:遺漏FLR變量的兩個變量模型(CM對PGNP回歸)結(jié)論:不包含女性識字率的雙變量模型,錯誤之處:不僅忽略了遺漏變量“女性識字率”對嬰兒死亡率的影響,而且,也忽略了女性識字率對人均國民收入的影響。因此,錯誤模型中的解釋變量PGNP,就擔(dān)負(fù)起遺漏變量“女性識字率”對被解釋變量(CM)的影響,從而無法表現(xiàn)出PGNP對CM的真實的影響。提示:在建立計量經(jīng)濟(jì)模型時,需要對所研究現(xiàn)象所蘊含的經(jīng)濟(jì)理論做深入了解,目的是把相關(guān)變量都引入模型中。7/14/2023第12頁,課件共32頁,創(chuàng)作于2023年2月包含無關(guān)變量偏誤:采用包含無關(guān)解釋變量的模型進(jìn)行估計帶來的偏誤。

設(shè)Y=0+1X1+v

(*)

為正確模型,但卻估計了錯誤的模型:

Y=0+1X1+2X2+(**)

如果2=0,則(**)與(*)相同,因此,可將(**)式視為以2=0為約束的(*)式的特殊形式。即P86,第四章所介紹的“受限最小二乘”7.4包含無關(guān)變量:過度擬合模型第13頁,課件共32頁,創(chuàng)作于2023年2月用OLS法估計模型Y=0+1X1+2X2+由于所有的經(jīng)典假設(shè)都滿足,因此

:(1)OLS估計量無偏的,也是一致的(4)但是,引入多余解釋變量的模型的OLS估計量無效,不具有最小方差性(2)從錯誤的回歸方程中,得到的方差估計量是正確的(3)置信區(qū)間和假設(shè)檢驗仍然是有效的OLS估計量是線性無偏估計量,但非最優(yōu),不再有效。小結(jié):第14頁,課件共32頁,創(chuàng)作于2023年2月例7-2:舉例說明第六章中的6.5:食品支出模型被解釋變量:食品支出解釋變量:稅后收入(x),“性別”(采用加法引入和乘法引入兩個變量(D、DX)模型:回歸結(jié)果:Y=1432.577+0.0616X-67.893D-0.0063DXt=(5.765)(7.376)(-0.194)(-0.485)7/14/2023第15頁,課件共32頁,創(chuàng)作于2023年2月結(jié)論前面的模型中引入了差別截距、差別斜率變量的虛擬變量模型,由于D、DX參數(shù)估計值都不顯著,而引入虛擬變量D的差別截距模型(6-9)的虛擬變量系數(shù)顯著,表明,差別斜率虛擬變量DX很可能屬于多余的。也就是說,食品支出模型中,正確的引入解釋變量,應(yīng)該是定量變量:稅后收入X,虛擬變量D食品支出模型引入虛擬變量D,表明:男女食品支出的平均水平(截距)存在差異,但男女食品支出的變化率(斜率)無差異。7/14/2023第16頁,課件共32頁,創(chuàng)作于2023年2月

當(dāng)選取了錯誤函數(shù)形式并對其進(jìn)行估計時,帶來的偏誤稱錯誤函數(shù)形式偏誤

容易判斷,這種偏誤所估計的模型參數(shù)估計量是有偏估計。

例如,如果“真實”的回歸函數(shù)為生產(chǎn)函數(shù)卻估計線性式:

顯然,兩者的參數(shù)具有完全不同的經(jīng)濟(jì)含義,且估計結(jié)果一般也是不相同的。

7.5錯誤函數(shù)形式第17頁,課件共32頁,創(chuàng)作于2023年2月例7-3:舉例說明被解釋變量:美國進(jìn)出口商品支出解釋變量:個人可支配收入(PDI)、年份(Year)線性回歸模型與對數(shù)回歸模型所得到的參數(shù)估計值含義是完全不同的,(詳細(xì)解釋見教材第170頁)7/14/2023第18頁,課件共32頁,創(chuàng)作于2023年2月7.6度量誤差應(yīng)變量中的度量誤差引起的后果不太嚴(yán)重。解釋變量中的度量誤差引起的后果非常嚴(yán)重。建議使用工具變量或替代變量:與原始變量X高度相關(guān),但與回歸誤差項無關(guān),且不存在度量誤差。若不同時期變量的定義不同,則需要確保數(shù)據(jù)的可比性。實踐中的建議:確保解釋變量(X)的數(shù)據(jù)盡可能準(zhǔn)確,不免除記錄、舍入和遺漏誤差。第19頁,課件共32頁,創(chuàng)作于2023年2月模型設(shè)定偏誤的后果

模型設(shè)定出現(xiàn)誤差時,模型估計結(jié)果會與“實際”有偏差。這種偏差的性質(zhì)與程度與模型設(shè)定誤差的類型密切相關(guān)。第20頁,課件共32頁,創(chuàng)作于2023年2月7.7模型設(shè)定誤差的檢驗

7.7.1檢驗是否含有無關(guān)變量

可用t檢驗與F檢驗完成。檢驗的基本思想:如果模型中誤選了無關(guān)變量,則其系數(shù)的真值應(yīng)為零。因此,只須對無關(guān)變量系數(shù)的顯著性進(jìn)行檢驗。

t檢驗:檢驗?zāi)?個變量是否應(yīng)包括在模型中;

F檢驗:檢驗若干個變量是否應(yīng)同時包括在模型中(建議:F檢驗可以采用受限最小二乘,可以回答多個變量是否包含在模型中)。第21頁,課件共32頁,創(chuàng)作于2023年2月

7.7.2對遺漏相關(guān)變量或函數(shù)形式設(shè)定偏誤的檢驗

(1)殘差圖示法第22頁,課件共32頁,創(chuàng)作于2023年2月

殘差序列變化圖(a)趨勢變化:模型設(shè)定時可能遺漏了一隨著時間的推移而持續(xù)上升的變量

(b)循環(huán)變化:模型設(shè)定時可能遺漏了一隨著時間的推移而呈現(xiàn)循環(huán)變化的變量

第23頁,課件共32頁,創(chuàng)作于2023年2月(c)

模型函數(shù)形式設(shè)定偏誤時殘差序列呈現(xiàn)正負(fù)交替變化

圖示:一元回歸模型中,真實模型呈冪函數(shù)形式,但卻選取了線性函數(shù)進(jìn)行回歸。

第24頁,課件共32頁,創(chuàng)作于2023年2月7.7.3在線性模型和對數(shù)模型之間選擇:MWD檢驗H0:線性模型:Y是X的線性函數(shù)H1:對數(shù)線性模型:Y是X(或LnX)的線性函數(shù)估計線性模型,得到Y(jié)的擬合值估計對數(shù)線性模型,得到LnY的擬合值做Y對X和Z1的回歸做LnY對X(或LnX)和Z2的回歸對Z1的系數(shù)進(jìn)行變量的顯著性檢驗,若顯著,則拒絕H0對Z2的系數(shù)進(jìn)行變量的顯著性檢驗,若顯著,則拒絕H1第25頁,課件共32頁,創(chuàng)作于2023年2月例P176:因為Z1的系數(shù)顯著,則拒絕H0:假設(shè)真實的進(jìn)口支出函數(shù)是線性的。因為Z2的系數(shù)顯著,則拒絕H1:假設(shè)真實的進(jìn)口支出函數(shù)是對數(shù)線性的。根據(jù)上述結(jié)果,本例中兩個模型都是合理的。第26頁,課件共32頁,創(chuàng)作于2023年2月

7.7.4一般性設(shè)定偏誤檢驗

但更準(zhǔn)確更常用的判定方法是拉姆齊(Ramsey)于1969年提出的所謂RESET檢驗(regressionerrorspecificationtest)。

基本思想:

如果事先知道遺漏了哪個變量,只需將此變量引入模型,估計并檢驗其參數(shù)是否顯著不為零即可;問題是不知道遺漏了哪個變量,需尋找一個替代變量Z,來進(jìn)行上述檢驗。

RESET檢驗中,采用所設(shè)定模型中被解釋變量Y的估計值?的若干次冪來充當(dāng)該“替代”變量。

第27頁,課件共32頁,創(chuàng)作于2023年2月(1)估計。先估計原始模型得到擬合值。(4)檢驗和判斷。若僅增加一個“替代”變量,可采用t檢驗;若增加多個“替代”變量,可采用“受限最小二乘”的F檢驗。(2)觀察殘差與擬合值的關(guān)系,決定引入擬合值的若干次冪進(jìn)入模型作為“替代變量”。(3)再估計。估計引入了“替代變量”的新模型。拉齊姆檢驗(RESET檢驗)第28頁,課件共32頁,創(chuàng)作于2023年2月RESET檢驗評價優(yōu)點:簡單易行。缺陷:可用于判斷模型設(shè)定是否錯誤,卻不能幫助我們選擇正確模型。因此,該檢驗主要是診斷工具。第29頁,課件共32頁,創(chuàng)作于2023年2月

例:對商品進(jìn)口進(jìn)行研究,估計了中國商品進(jìn)口M與GDP的關(guān)系,然而,由于僅用GDP來解釋商品進(jìn)口的變化,明顯地遺漏了諸如商品進(jìn)口價格、匯率等其他影響因素。在此,采用RESET檢驗考察建模時是否遺漏了重要的相關(guān)變量。(1)用原回歸模型估計出商品進(jìn)口序列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論