《線性回歸模型2》教學(xué)課件_第1頁(yè)
《線性回歸模型2》教學(xué)課件_第2頁(yè)
《線性回歸模型2》教學(xué)課件_第3頁(yè)
《線性回歸模型2》教學(xué)課件_第4頁(yè)
《線性回歸模型2》教學(xué)課件_第5頁(yè)
已閱讀5頁(yè),還剩149頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章一元線性回歸模型(2)思考題:1、CLRM關(guān)于隨機(jī)誤差項(xiàng)的五個(gè)假設(shè)是什么?2、影響SRF中斜率估計(jì)量方差的兩個(gè)因素是什么?3、OLS估計(jì)量具有哪兩個(gè)優(yōu)良性質(zhì)?4、假設(shè)檢驗(yàn)的根本原理是什么?5、顯著性水平和第一類錯(cuò)誤指的是什么?第2章一元線性回歸模型(2)思考題:1思考題:6、對(duì)稻草人假設(shè)進(jìn)展檢驗(yàn)的標(biāo)準(zhǔn)是什么?7、擬合優(yōu)度的含義和度量指標(biāo)是什么?8、正態(tài)性檢驗(yàn)的目的是什么?思考題:2復(fù)習(xí)第2章(1)思考題:1、回歸分析中的變量有何特點(diǎn)?2、被解釋變量的兩個(gè)組成局部的含義是什么?3、刻劃被解釋變量的兩個(gè)參數(shù)分別是什么?4、樣本回歸模型與總體回歸模型有何區(qū)別?5、最小二乘估計(jì)法的核心思想是什么?6、回歸模型參數(shù)的估計(jì)量是什么?復(fù)習(xí)第2章(1)思考題:3復(fù)習(xí)第2章(1)思考題:7、一元線性回歸具有哪三個(gè)性質(zhì)?8、如何解釋回歸模型參數(shù)的含義?復(fù)習(xí)第2章(1)思考題:4假設(shè)1、隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān)問題:回歸分析的根本原理是什么?2.1古典線性回歸模型〔CLRM〕假設(shè)1、隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān)2.1古典線5假設(shè)2、隨機(jī)誤差項(xiàng)具有零均值E(i)=0i=1,2,…,n如果假設(shè)2不成立:0

假設(shè)2、隨機(jī)誤差項(xiàng)具有零均值6假設(shè)3、隨機(jī)誤差項(xiàng)具有同方差Var(i)=2i=1,2,…,n

假設(shè)3、隨機(jī)誤差項(xiàng)具有同方差7假設(shè)4、各個(gè)隨機(jī)誤差項(xiàng)之間無(wú)自相關(guān)Cov(i,j)=0i≠ji,j=1,2,…,n

假設(shè)4、各個(gè)隨機(jī)誤差項(xiàng)之間無(wú)自相關(guān)8假設(shè)5、服從正態(tài)分布i~N(0,2)i=1,2,…,n如果假設(shè)5不成立:樣本容量n>30中心極限定理被解釋變量服從正態(tài)分布假設(shè)5、服從正態(tài)分布9Y=f(X)+μμ被稱為隨機(jī)誤差項(xiàng),代表所有其他影響因素的總和因此,Y是一個(gè)隨機(jī)變量刻劃隨機(jī)變量的兩個(gè)參數(shù):①期望值②方差2.2普通最小二乘估計(jì)量的方差Y=f(X)+μ210計(jì)量研究目標(biāo)1、X對(duì)Y的具體影響:2、其他因素對(duì)Y的平均影響幅度:Var〔Y〕=Var〔μ〕=σ2Y的標(biāo)準(zhǔn)差:σ計(jì)量研究目標(biāo)1、X對(duì)Y的具體影響:111、隨機(jī)誤差項(xiàng)的方差2的估計(jì)2稱為總體方差,反映了隨機(jī)變量Y圍繞其均值波動(dòng)的平均幅度。Y的方差:Var〔Y〕=Var〔μ〕=σ21、隨機(jī)誤差項(xiàng)的方差2的估計(jì)2稱為總體方差,反映了隨機(jī)12由于隨機(jī)誤差項(xiàng)i不可觀測(cè),只能從i的估計(jì)——?dú)埐頴i出發(fā),對(duì)總體方差進(jìn)展估計(jì)。由于隨機(jī)誤差項(xiàng)i不可觀測(cè),只能從i的估計(jì)——?dú)埐頴13理想但未知的總體回歸模型近似但的樣本回歸模型理想但未知的總體回歸模型近似但的樣本回歸模型14

可以證明,雙變量模型中2的無(wú)偏估計(jì)量為可以證明,雙變量模型中2的無(wú)偏估計(jì)量為15回歸標(biāo)準(zhǔn)誤:SER:SER=RSSn-2回歸標(biāo)準(zhǔn)誤:SER:SER=RSSn-216Eviews估計(jì)Salary的標(biāo)準(zhǔn)誤Eviews估計(jì)Salary的標(biāo)準(zhǔn)誤172、OLS估計(jì)量的方差2、OLS估計(jì)量的方差182、OLS估計(jì)量的方差2、OLS估計(jì)量的方差19斜率和截距估計(jì)量的方差斜率和截距估計(jì)量的方差20斜率和截距估計(jì)量的方差請(qǐng)解釋斜率方差的決定因素斜率和截距估計(jì)量的方差請(qǐng)解釋斜率方差的決定因素21斜率方差的決定因素1、解釋變量的變化程度解釋變量的變化程度越大,對(duì)斜率的估計(jì)越準(zhǔn)確斜率方差的決定因素1、解釋變量的變化程度22010123010124斜率方差的決定因素2、總體方差總體方差越小,對(duì)斜率的估計(jì)越準(zhǔn)確斜率方差的決定因素2、總體方差25010126XYXY27斜率估計(jì)量的標(biāo)準(zhǔn)差斜率估計(jì)量的標(biāo)準(zhǔn)差28斜率估計(jì)量的標(biāo)準(zhǔn)誤斜率估計(jì)量的標(biāo)準(zhǔn)誤29

2.3OLS估計(jì)量的性質(zhì)當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值??蓮娜缦聨讉€(gè)方面考察估計(jì)量的優(yōu)劣性:〔1〕無(wú)偏性,即它的均值或期望值是否等于總體的真實(shí)值;〔2〕有效性,即它是否在所有線性無(wú)偏估計(jì)量中具有最小方差。說明:線性指估計(jì)量為隨機(jī)變量Y的線性函數(shù)2.3OLS估計(jì)量的性質(zhì)當(dāng)模型參數(shù)估30估計(jì)量估計(jì)總體的公式總體均值的估計(jì)量:樣本均值估計(jì)量估計(jì)總體的公式31估計(jì)量估計(jì)總體的公式總體均值的估計(jì)量:樣本均值估計(jì)量估計(jì)總體的公式32估計(jì)量與估計(jì)值隨機(jī)樣本:無(wú)數(shù)個(gè)樣本一個(gè)具體的樣本:1、樣本中每個(gè)隨機(jī)變量都取定一個(gè)觀察值2、根據(jù)估計(jì)量的公式計(jì)算估計(jì)值估計(jì)量與估計(jì)值隨機(jī)樣本:無(wú)數(shù)個(gè)樣本33高斯—馬爾可夫定理

給定CLRM的假設(shè)1-4,最小二乘估計(jì)量是具有最小方差的線性無(wú)偏估計(jì)量。高斯—馬爾可夫定34《線性回歸模型2》教學(xué)課件35無(wú)偏性成立的關(guān)鍵條件CLRM的假設(shè)1:μ

和Xi不相關(guān)無(wú)偏性成立的關(guān)鍵條件CLRM的假設(shè)1:μ和Xi不相關(guān)36案例分析學(xué)生的數(shù)學(xué)考試成績(jī)被解釋變量:在一次高中10年級(jí)標(biāo)準(zhǔn)化數(shù)學(xué)考試中通過學(xué)生的百分比解釋變量:有資格承受聯(lián)邦政府午餐補(bǔ)助學(xué)生的百分比math10=0+1lnchprg+1的含義1>0案例分析學(xué)生的數(shù)學(xué)考試成績(jī)37EviewsMATH10=32.14-0.319*LNCHPRG請(qǐng)解釋-0.319的含義其他影響因素:例如學(xué)生的貧窮率學(xué)生的貧窮率與受補(bǔ)助學(xué)生比例正相關(guān),學(xué)生的貧窮率與數(shù)學(xué)考試通過率負(fù)相關(guān)EviewsMATH10=32.14-0.319*38線性:β帽是Y的線性函數(shù)線性:β帽是Y的線性函數(shù)391的正態(tài)分布2.4OLS估計(jì)量的概率分布1的正態(tài)分布2.4OLS估402.5假設(shè)檢驗(yàn)不同的樣本,得到不同的估計(jì)值,根據(jù)某一個(gè)具體樣本得到的估計(jì)值質(zhì)量如何?可以通過特定的檢驗(yàn)指標(biāo)來(lái)衡量2.5假設(shè)檢驗(yàn)不同的樣本,得到不同的估計(jì)值,41x(收入)y〔支出〕8010012014016018020022024026050100150200第一個(gè)樣本回歸直線第一個(gè)樣本第二個(gè)樣本第二個(gè)樣本回歸直線x(收入)y〔支出〕8010012014016018020042

顯著性檢驗(yàn)法

回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。

計(jì)量經(jīng)計(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來(lái)進(jìn)展顯著性檢驗(yàn)的。稻草人假設(shè):斜率參數(shù)為零顯著性檢驗(yàn)法回歸分析是要判斷解釋變量X是43解釋變量的顯著性如果1等于零,那么X對(duì)Y沒有影響1的估計(jì)值不等于零但是1真的不等于零嗎?問題:如何說服我們相信你高考的數(shù)學(xué)成績(jī)不是零分?解釋變量的顯著性如果1等于零,那么X對(duì)Y沒有影響44

1、假設(shè)檢驗(yàn)概述

假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否承受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生〞這一原理的。如果結(jié)果是個(gè)小概率事件,那我們認(rèn)為這是不可能發(fā)生的。會(huì)發(fā)生不可能發(fā)生的事情,一定是假設(shè)前提錯(cuò)了。上述“小概率事件〞的概率被稱為檢驗(yàn)的“顯著性水平〞,或者“犯第一類錯(cuò)誤的概率〞〔拒絕了正確的虛擬假設(shè)〕1、假設(shè)檢驗(yàn)概述假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法45問題顯著性水平或犯錯(cuò)誤概率在反證法推理中應(yīng)當(dāng)設(shè)定得越小越好,還是越大越好?問題顯著性水平46t分布t分布47t分布t分布的均值為0t分布的方差為n/(n-2);n=30,1.07nnnt分布t分布的均值為0nnn48

2a(1-a)t分布t落在紅色區(qū)域中的概率為5%|t|>2被認(rèn)為是一個(gè)小概率事件02.5%-22.5%

2a(1-a)t分布t落在紅色區(qū)域中的概率為5%|t|49假設(shè)檢驗(yàn)的根本思想1、設(shè)計(jì)一個(gè)服從特定分布的隨機(jī)變量,例如t2、選擇一個(gè)取值范圍,上述隨機(jī)變量落在該取值范圍內(nèi)的概率很小,例如5%3、根據(jù)樣本數(shù)據(jù)計(jì)算上述隨機(jī)變量的數(shù)值4、判斷該數(shù)值是否落在上述取值范圍之內(nèi)5、如果是,那么認(rèn)為發(fā)生了不可能發(fā)生的事情。因此得出結(jié)論:假設(shè)前提錯(cuò)了假設(shè)檢驗(yàn)的根本思想1、設(shè)計(jì)一個(gè)服從特定分布的隨機(jī)變量,例如t50

2、解釋變量的顯著性檢驗(yàn)

2、解釋變量的顯著性檢驗(yàn)51斜率1的顯著性檢驗(yàn)在上述t統(tǒng)計(jì)量中假設(shè)1等于零,得到

t

=

斜率1的顯著性檢驗(yàn)在上述t統(tǒng)計(jì)量中假設(shè)1等于零,得到t52統(tǒng)計(jì)量t的解釋t是一個(gè)隨機(jī)變量,對(duì)應(yīng)于不同的樣本,t取不同的值給定一個(gè)具體樣本,t是斜率的估計(jì)值和斜率的樣本標(biāo)準(zhǔn)差的比率。被稱為t比率

t

=

統(tǒng)計(jì)量t的解釋t是一個(gè)隨機(jī)變量,對(duì)應(yīng)于不同的樣本,t取不同的53

ca(1-a)t分布臨界值c|t|>c的概率?在實(shí)踐中,一般取α=5%,確定一個(gè)小概率事件t~t(n-2)給定樣本容量n和顯著性水平α,就可以計(jì)算c0a/2(1-a)-ca/2

ca(1-a)t分布臨界值c|t|>c的概率?在實(shí)踐54yi=b0+b1xiμiH0:b1=0H1:b1

0c0a/2(1-a)-ca/2雙側(cè)檢驗(yàn)拒絕域拒絕域+yi=b0+b1xiμiH0:b1=055雙邊檢驗(yàn)的步驟〔1〕對(duì)總體參數(shù)提出假設(shè)H0:1=0,H1:10〔2〕以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值〔3〕給定顯著性水平,查t分布表,得臨界值c=t/2(n-2)(4)比較,判斷假設(shè)|t|>t/2(n-2),那么拒絕H0,承受H1;假設(shè)|t|t/2(n-2),那么拒絕H1,承受H0;雙邊檢驗(yàn)的步驟〔1〕對(duì)總體參數(shù)提出假設(shè)〔2〕以原56簡(jiǎn)易判斷法那么當(dāng)n>30時(shí),t分布近似于正態(tài)分布給定顯著性水平為5%,臨界值c約為2如果t的絕對(duì)值大于2,就可以拒絕稻草人假設(shè),說明斜率b1顯著地不等于零因此,解釋變量X對(duì)被解釋變量Y具有影響簡(jiǎn)易判斷法那么當(dāng)n>30時(shí),t分布近似于正態(tài)分布57案例分析工資被解釋變量:工資〔1976年每小時(shí)美元數(shù)〕解釋變量:教育〔年數(shù)〕計(jì)量模型:wage=0+1educ+t=10.17問題:如何對(duì)待稻草人假設(shè)?案例分析工資58關(guān)于5%202.5%95%-22.5%拒絕域拒絕域關(guān)于5%202.5%9559p值p值是給定t比率后,能拒絕稻草人假設(shè)的最小顯著性水平(犯錯(cuò)誤水平〕即給定顯著性水平為p,根據(jù)樣本計(jì)算的t比率剛好可以拒絕稻草人假設(shè)如果顯著性水平大于p,那么仍然可以拒絕如果顯著性水平小于p,那么不可以拒絕問題:對(duì)于計(jì)量研究而言,p值越大還是越小好?p值p值是給定t比率后,能拒絕稻草人假設(shè)的最小顯著性水平(犯60案例分析工資被解釋變量:工資〔1976年每小時(shí)美元數(shù)〕解釋變量:教育〔年數(shù)〕計(jì)量模型:wage=0+1educ+p=0.0000

案例分析工資61思考題假設(shè)p值為0.01,如果研究者采用的顯著性水平為5%,我們能否拒絕虛擬假設(shè)?如果研究者采用的顯著性水平為0.5%,我們能否拒絕虛擬假設(shè)思考題假設(shè)p值為0.01,62

2.6判定系數(shù)

擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。

度量擬合優(yōu)度的指標(biāo):判定系數(shù)R2

問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值,為什么還要檢驗(yàn)擬合程度?2.6判定系數(shù)擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與63計(jì)算判定系數(shù)1.總離差平方和的分解我們知道:樣本觀測(cè)值〔xi,yi〕,i=1,2,…,n,的回歸直線為:而觀測(cè)值Yi可分解為:eYY計(jì)算判定系數(shù)1.總離差平方和的分解而觀測(cè)值Yi可分解為:64x(收入)y〔支出〕eeeex(收入)y〔支出〕eeee65eeYYYYYY被解釋變量圍繞其均值的波動(dòng)波動(dòng)中被回歸線所解釋的局部波動(dòng)中沒有被回歸線所解釋的局部eeYYYYYY被解釋變量波動(dòng)中被波動(dòng)中沒有被66可以證明:其中總平方和〔TotalSumofSquares〕解釋平方和〔ExplainedSumofSquares〕殘差平方和〔ResidualSumofSquares〕TSS=ESS+RSS可以證明:其中總平方和〔TotalSumofSquar67TSS=ESS+RSSY的觀測(cè)值圍繞其均值波動(dòng)的總平方和可分解為兩局部:一局部來(lái)自回歸線(ESS),另一局部那么來(lái)自隨機(jī)勢(shì)力(RSS)。從解釋平方和RSS與殘差平方和ESS的意義可知,在TSS中ESS所占的比重越大,那么樣本回歸直線與樣本觀測(cè)值擬合程度就越好。TSS=ESS+RSSY的觀測(cè)值圍繞其均值波動(dòng)682、判定系數(shù)R2稱R2為〔樣本〕判定系數(shù)/可決系數(shù)2、判定系數(shù)R2稱R2為〔樣本〕判定系數(shù)/可決系數(shù)69R2的解釋:反映變量間的線性關(guān)系1、R2=0Y和X沒有線性關(guān)系2、R2=1Y和X具有完全的線性關(guān)系含義:Y=b0+b1X1

R2的解釋:反映變量間的線性關(guān)系1、R2=070案例分析CEO的薪水被解釋變量:CEO的薪水〔千美元〕解釋變量:凈資產(chǎn)回報(bào)率〔百分?jǐn)?shù)〕樣本回歸函數(shù):Salary=963.191+18.501roeEviewsR2=0.013 因此,凈資產(chǎn)回報(bào)率僅解釋了薪水變化的1.3%案例分析CEO的薪水71案例分析選舉結(jié)果兩位候選人A和B被解釋變量:選舉結(jié)果〔得票百分?jǐn)?shù)〕解釋變量:競(jìng)選支出〔支出百分比〕樣本回歸函數(shù):voteA=26.81+0.46shareAEviewsR2=0.86 因此,競(jìng)選支出的比例解釋了競(jìng)選結(jié)果變化的86%案例分析選舉結(jié)果722.7正態(tài)性檢驗(yàn):JB檢驗(yàn)根本原理:JB統(tǒng)計(jì)量服從卡方分布2.7正態(tài)性檢驗(yàn):JB檢驗(yàn)根本原理:JB統(tǒng)計(jì)量服從卡方分布73JB檢驗(yàn)的步驟1、虛擬假設(shè):隨機(jī)誤差項(xiàng)服從正態(tài)分布2、設(shè)定檢驗(yàn)的顯著性水平:5%3、計(jì)算p值4、拒絕標(biāo)準(zhǔn):p<5%JB檢驗(yàn)的步驟1、虛擬假設(shè):隨機(jī)誤差項(xiàng)服從正態(tài)分布74Eviews1、完成模型的估計(jì)2、view\residualtests\normalitytestEviews1、完成模型的估計(jì)75案例分析CEO的薪水被解釋變量:CEO的薪水〔千美元〕解釋變量:凈資產(chǎn)回報(bào)率〔百分?jǐn)?shù)〕樣本回歸函數(shù):Salary=963.191+18.501roeEviewsP=0.00案例分析CEO的薪水762.8預(yù)測(cè)移至第3章2.8預(yù)測(cè)移至第3章77第2章一元線性回歸模型(2)思考題:1、CLRM關(guān)于隨機(jī)誤差項(xiàng)的五個(gè)假設(shè)是什么?2、影響SRF中斜率估計(jì)量方差的兩個(gè)因素是什么?3、OLS估計(jì)量具有哪兩個(gè)優(yōu)良性質(zhì)?4、假設(shè)檢驗(yàn)的根本原理是什么?5、顯著性水平和第一類錯(cuò)誤指的是什么?第2章一元線性回歸模型(2)思考題:78思考題:6、對(duì)稻草人假設(shè)進(jìn)展檢驗(yàn)的標(biāo)準(zhǔn)是什么?7、擬合優(yōu)度的含義和度量指標(biāo)是什么?8、正態(tài)性檢驗(yàn)的目的是什么?思考題:79復(fù)習(xí)第2章(1)思考題:1、回歸分析中的變量有何特點(diǎn)?2、被解釋變量的兩個(gè)組成局部的含義是什么?3、刻劃被解釋變量的兩個(gè)參數(shù)分別是什么?4、樣本回歸模型與總體回歸模型有何區(qū)別?5、最小二乘估計(jì)法的核心思想是什么?6、回歸模型參數(shù)的估計(jì)量是什么?復(fù)習(xí)第2章(1)思考題:80復(fù)習(xí)第2章(1)思考題:7、一元線性回歸具有哪三個(gè)性質(zhì)?8、如何解釋回歸模型參數(shù)的含義?復(fù)習(xí)第2章(1)思考題:81假設(shè)1、隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān)問題:回歸分析的根本原理是什么?2.1古典線性回歸模型〔CLRM〕假設(shè)1、隨機(jī)誤差項(xiàng)與解釋變量X之間不相關(guān)2.1古典線82假設(shè)2、隨機(jī)誤差項(xiàng)具有零均值E(i)=0i=1,2,…,n如果假設(shè)2不成立:0

假設(shè)2、隨機(jī)誤差項(xiàng)具有零均值83假設(shè)3、隨機(jī)誤差項(xiàng)具有同方差Var(i)=2i=1,2,…,n

假設(shè)3、隨機(jī)誤差項(xiàng)具有同方差84假設(shè)4、各個(gè)隨機(jī)誤差項(xiàng)之間無(wú)自相關(guān)Cov(i,j)=0i≠ji,j=1,2,…,n

假設(shè)4、各個(gè)隨機(jī)誤差項(xiàng)之間無(wú)自相關(guān)85假設(shè)5、服從正態(tài)分布i~N(0,2)i=1,2,…,n如果假設(shè)5不成立:樣本容量n>30中心極限定理被解釋變量服從正態(tài)分布假設(shè)5、服從正態(tài)分布86Y=f(X)+μμ被稱為隨機(jī)誤差項(xiàng),代表所有其他影響因素的總和因此,Y是一個(gè)隨機(jī)變量刻劃隨機(jī)變量的兩個(gè)參數(shù):①期望值②方差2.2普通最小二乘估計(jì)量的方差Y=f(X)+μ287計(jì)量研究目標(biāo)1、X對(duì)Y的具體影響:2、其他因素對(duì)Y的平均影響幅度:Var〔Y〕=Var〔μ〕=σ2Y的標(biāo)準(zhǔn)差:σ計(jì)量研究目標(biāo)1、X對(duì)Y的具體影響:881、隨機(jī)誤差項(xiàng)的方差2的估計(jì)2稱為總體方差,反映了隨機(jī)變量Y圍繞其均值波動(dòng)的平均幅度。Y的方差:Var〔Y〕=Var〔μ〕=σ21、隨機(jī)誤差項(xiàng)的方差2的估計(jì)2稱為總體方差,反映了隨機(jī)89由于隨機(jī)誤差項(xiàng)i不可觀測(cè),只能從i的估計(jì)——?dú)埐頴i出發(fā),對(duì)總體方差進(jìn)展估計(jì)。由于隨機(jī)誤差項(xiàng)i不可觀測(cè),只能從i的估計(jì)——?dú)埐頴90理想但未知的總體回歸模型近似但的樣本回歸模型理想但未知的總體回歸模型近似但的樣本回歸模型91

可以證明,雙變量模型中2的無(wú)偏估計(jì)量為可以證明,雙變量模型中2的無(wú)偏估計(jì)量為92回歸標(biāo)準(zhǔn)誤:SER:SER=RSSn-2回歸標(biāo)準(zhǔn)誤:SER:SER=RSSn-293Eviews估計(jì)Salary的標(biāo)準(zhǔn)誤Eviews估計(jì)Salary的標(biāo)準(zhǔn)誤942、OLS估計(jì)量的方差2、OLS估計(jì)量的方差952、OLS估計(jì)量的方差2、OLS估計(jì)量的方差96斜率和截距估計(jì)量的方差斜率和截距估計(jì)量的方差97斜率和截距估計(jì)量的方差請(qǐng)解釋斜率方差的決定因素斜率和截距估計(jì)量的方差請(qǐng)解釋斜率方差的決定因素98斜率方差的決定因素1、解釋變量的變化程度解釋變量的變化程度越大,對(duì)斜率的估計(jì)越準(zhǔn)確斜率方差的決定因素1、解釋變量的變化程度9901011000101101斜率方差的決定因素2、總體方差總體方差越小,對(duì)斜率的估計(jì)越準(zhǔn)確斜率方差的決定因素2、總體方差1020101103XYXY104斜率估計(jì)量的標(biāo)準(zhǔn)差斜率估計(jì)量的標(biāo)準(zhǔn)差105斜率估計(jì)量的標(biāo)準(zhǔn)誤斜率估計(jì)量的標(biāo)準(zhǔn)誤106

2.3OLS估計(jì)量的性質(zhì)當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值??蓮娜缦聨讉€(gè)方面考察估計(jì)量的優(yōu)劣性:〔1〕無(wú)偏性,即它的均值或期望值是否等于總體的真實(shí)值;〔2〕有效性,即它是否在所有線性無(wú)偏估計(jì)量中具有最小方差。說明:線性指估計(jì)量為隨機(jī)變量Y的線性函數(shù)2.3OLS估計(jì)量的性質(zhì)當(dāng)模型參數(shù)估107估計(jì)量估計(jì)總體的公式總體均值的估計(jì)量:樣本均值估計(jì)量估計(jì)總體的公式108估計(jì)量估計(jì)總體的公式總體均值的估計(jì)量:樣本均值估計(jì)量估計(jì)總體的公式109估計(jì)量與估計(jì)值隨機(jī)樣本:無(wú)數(shù)個(gè)樣本一個(gè)具體的樣本:1、樣本中每個(gè)隨機(jī)變量都取定一個(gè)觀察值2、根據(jù)估計(jì)量的公式計(jì)算估計(jì)值估計(jì)量與估計(jì)值隨機(jī)樣本:無(wú)數(shù)個(gè)樣本110高斯—馬爾可夫定理

給定CLRM的假設(shè)1-4,最小二乘估計(jì)量是具有最小方差的線性無(wú)偏估計(jì)量。高斯—馬爾可夫定111《線性回歸模型2》教學(xué)課件112無(wú)偏性成立的關(guān)鍵條件CLRM的假設(shè)1:μ

和Xi不相關(guān)無(wú)偏性成立的關(guān)鍵條件CLRM的假設(shè)1:μ和Xi不相關(guān)113案例分析學(xué)生的數(shù)學(xué)考試成績(jī)被解釋變量:在一次高中10年級(jí)標(biāo)準(zhǔn)化數(shù)學(xué)考試中通過學(xué)生的百分比解釋變量:有資格承受聯(lián)邦政府午餐補(bǔ)助學(xué)生的百分比math10=0+1lnchprg+1的含義1>0案例分析學(xué)生的數(shù)學(xué)考試成績(jī)114EviewsMATH10=32.14-0.319*LNCHPRG請(qǐng)解釋-0.319的含義其他影響因素:例如學(xué)生的貧窮率學(xué)生的貧窮率與受補(bǔ)助學(xué)生比例正相關(guān),學(xué)生的貧窮率與數(shù)學(xué)考試通過率負(fù)相關(guān)EviewsMATH10=32.14-0.319*115線性:β帽是Y的線性函數(shù)線性:β帽是Y的線性函數(shù)1161的正態(tài)分布2.4OLS估計(jì)量的概率分布1的正態(tài)分布2.4OLS估1172.5假設(shè)檢驗(yàn)不同的樣本,得到不同的估計(jì)值,根據(jù)某一個(gè)具體樣本得到的估計(jì)值質(zhì)量如何?可以通過特定的檢驗(yàn)指標(biāo)來(lái)衡量2.5假設(shè)檢驗(yàn)不同的樣本,得到不同的估計(jì)值,118x(收入)y〔支出〕8010012014016018020022024026050100150200第一個(gè)樣本回歸直線第一個(gè)樣本第二個(gè)樣本第二個(gè)樣本回歸直線x(收入)y〔支出〕80100120140160180200119

顯著性檢驗(yàn)法

回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。

計(jì)量經(jīng)計(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來(lái)進(jìn)展顯著性檢驗(yàn)的。稻草人假設(shè):斜率參數(shù)為零顯著性檢驗(yàn)法回歸分析是要判斷解釋變量X是120解釋變量的顯著性如果1等于零,那么X對(duì)Y沒有影響1的估計(jì)值不等于零但是1真的不等于零嗎?問題:如何說服我們相信你高考的數(shù)學(xué)成績(jī)不是零分?解釋變量的顯著性如果1等于零,那么X對(duì)Y沒有影響121

1、假設(shè)檢驗(yàn)概述

假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否承受原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生〞這一原理的。如果結(jié)果是個(gè)小概率事件,那我們認(rèn)為這是不可能發(fā)生的。會(huì)發(fā)生不可能發(fā)生的事情,一定是假設(shè)前提錯(cuò)了。上述“小概率事件〞的概率被稱為檢驗(yàn)的“顯著性水平〞,或者“犯第一類錯(cuò)誤的概率〞〔拒絕了正確的虛擬假設(shè)〕1、假設(shè)檢驗(yàn)概述假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法122問題顯著性水平或犯錯(cuò)誤概率在反證法推理中應(yīng)當(dāng)設(shè)定得越小越好,還是越大越好?問題顯著性水平123t分布t分布124t分布t分布的均值為0t分布的方差為n/(n-2);n=30,1.07nnnt分布t分布的均值為0nnn125

2a(1-a)t分布t落在紅色區(qū)域中的概率為5%|t|>2被認(rèn)為是一個(gè)小概率事件02.5%-22.5%

2a(1-a)t分布t落在紅色區(qū)域中的概率為5%|t|126假設(shè)檢驗(yàn)的根本思想1、設(shè)計(jì)一個(gè)服從特定分布的隨機(jī)變量,例如t2、選擇一個(gè)取值范圍,上述隨機(jī)變量落在該取值范圍內(nèi)的概率很小,例如5%3、根據(jù)樣本數(shù)據(jù)計(jì)算上述隨機(jī)變量的數(shù)值4、判斷該數(shù)值是否落在上述取值范圍之內(nèi)5、如果是,那么認(rèn)為發(fā)生了不可能發(fā)生的事情。因此得出結(jié)論:假設(shè)前提錯(cuò)了假設(shè)檢驗(yàn)的根本思想1、設(shè)計(jì)一個(gè)服從特定分布的隨機(jī)變量,例如t127

2、解釋變量的顯著性檢驗(yàn)

2、解釋變量的顯著性檢驗(yàn)128斜率1的顯著性檢驗(yàn)在上述t統(tǒng)計(jì)量中假設(shè)1等于零,得到

t

=

斜率1的顯著性檢驗(yàn)在上述t統(tǒng)計(jì)量中假設(shè)1等于零,得到t129統(tǒng)計(jì)量t的解釋t是一個(gè)隨機(jī)變量,對(duì)應(yīng)于不同的樣本,t取不同的值給定一個(gè)具體樣本,t是斜率的估計(jì)值和斜率的樣本標(biāo)準(zhǔn)差的比率。被稱為t比率

t

=

統(tǒng)計(jì)量t的解釋t是一個(gè)隨機(jī)變量,對(duì)應(yīng)于不同的樣本,t取不同的130

ca(1-a)t分布臨界值c|t|>c的概率?在實(shí)踐中,一般取α=5%,確定一個(gè)小概率事件t~t(n-2)給定樣本容量n和顯著性水平α,就可以計(jì)算c0a/2(1-a)-ca/2

ca(1-a)t分布臨界值c|t|>c的概率?在實(shí)踐131yi=b0+b1xiμiH0:b1=0H1:b1

0c0a/2(1-a)-ca/2雙側(cè)檢驗(yàn)拒絕域拒絕域+yi=b0+b1xiμiH0:b1=0132雙邊檢驗(yàn)的步驟〔1〕對(duì)總體參數(shù)提出假設(shè)H0:1=0,H1:10〔2〕以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值〔3〕給定顯著性水平,查t分布表,得臨界值c=t/2(n-2)(4)比較,判斷假設(shè)|t|>t/2(n-2),那么拒絕H0,承受H1;假設(shè)|t|t/2(n-2),那么拒絕H1,承受H0;雙邊檢驗(yàn)的步驟〔1〕對(duì)總體參數(shù)提出假設(shè)〔2〕以原133簡(jiǎn)易判斷法那么當(dāng)n>30時(shí),t分布近似于正態(tài)分布給定顯著性水平為5%,臨界值c約為2如果t的絕對(duì)值大于2,就可以拒絕稻草人假設(shè),說明斜率b1顯著地不等于零因此,解釋變量X對(duì)被解釋變量Y具有影響簡(jiǎn)易判斷法那么當(dāng)n>30時(shí),t分布近似于正態(tài)分布134案例分析工資被解釋變量:工資〔1976年每小時(shí)美元數(shù)〕解釋變量:教育〔年數(shù)〕計(jì)量模型:wage=0+1educ+t=10.17問題:如何對(duì)待稻草人假設(shè)?案例分析工資135關(guān)于5%202.5%95%-22.5%拒絕域拒絕域關(guān)于5%202.5%95136p值p值是給定t比率后,能拒絕稻草人假設(shè)的最小顯著性水平(犯錯(cuò)誤水平〕即給定顯著性水平為p,根據(jù)樣本計(jì)算的t比率剛好可以拒絕稻草人假設(shè)如果顯著性水平大于p,那么仍然可以拒絕如果顯著性水平小于p,那么不可以拒絕問題:對(duì)于計(jì)量研究而言,p值越大還是越小好?p值p值是給定t比率后,能拒絕稻草人假設(shè)的最小顯著性水平(犯137案例分析工資被解釋變量:工資〔1976年每小時(shí)美元數(shù)〕解釋變量:教育〔年數(shù)〕計(jì)量模型:wage=0+1educ+p=0.0000

案例分析工資138思考題假設(shè)p值為0.01,如果研究者采用的顯著性水平為5%,我們能否拒絕虛擬假設(shè)?如果研究者采用的顯著性水平為0.5%,我們能否拒絕虛擬假設(shè)思考題假設(shè)p值為0.01,139

2.6判定系數(shù)

擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。

度量擬合優(yōu)度的指標(biāo):判定系數(shù)R2

問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論