第二章 一元線性回歸模型.ppt_第1頁
第二章 一元線性回歸模型.ppt_第2頁
第二章 一元線性回歸模型.ppt_第3頁
第二章 一元線性回歸模型.ppt_第4頁
第二章 一元線性回歸模型.ppt_第5頁
已閱讀5頁,還剩158頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、計量經濟學理論方法EViews應用 郭存芝 杜延軍 李春吉 編著,電子教案,第二章 一元線性回歸模型, 學習目的,理解回歸模型的概念,學會對一元線性回歸模型進行參數(shù)估計、檢驗和預測,為多元線性回歸模型的學習打下基礎。, 基本要求,1) 理解樣本回歸模型、總體回歸模型的概念; 2) 掌握一元線性回歸模型的普通最小二乘參數(shù)估計方法,了解一元線性回歸模型的基本假設、一元線性回歸模型的最大似然參數(shù)估計方法、一元線性回歸模型的普通最小二乘參數(shù)估計量與樣本回歸線的性質、一元線性回歸模型隨機誤差項方差的估計; 3) 學會對一元線性回歸模型進行擬合優(yōu)度檢驗,對一元線性回歸模型的參數(shù)進行區(qū)間估計和假設檢驗; 4

2、) 學會進行一元線性回歸模型被解釋變量的總體均值和個別值預測;,第二章 一元線性回歸模型,第二章 一元線性回歸模型 回歸模型概述 一元線性回歸模型的參數(shù)估計 一元線性回歸模型的擬合優(yōu)度檢驗 一元線性回歸模型的統(tǒng)計推斷 一元線性回歸模型的預測 案例分析, 相關分析與回歸分析,第一節(jié) 回歸模型概述, 隨機誤差項, 總體回歸模型, 樣本回歸模型,1. 經濟變量之間的關系,計量經濟研究是對經濟變量之間關系的研究,針對某一具體 經濟問題展開研究時,首先需要考察的就是相關經濟變量之間有 沒有關系、有什么樣的關系。,確定的函數(shù)關系,不確定的相關關系,經濟變量之間的關系,一、相關分析與回歸分析,函數(shù)關系,指某

3、一經濟變量可直接表示為其他經濟變量的確定的函數(shù), 函數(shù)表達式中沒有未知參數(shù),不存在參數(shù)估計的問題。,1) 某一商品的銷售收入Y與單價P、銷售數(shù)量Q之間的關系Y = PQ 2) 某一農作物的產量Q與單位面積產量q 、種植面積S之間的關系Q = q S,例如:,一、相關分析與回歸分析,相關關系,指不同經濟變量的變化趨勢之間存在某種不確定的聯(lián)系,某一或 某幾個經濟變量的取值確定后,對應的另一經濟變量的取值雖不能唯 一確定,但按某種規(guī)律有一定的取值范圍。,居民消費C與可支配收入Y之間的關系,可支配收入的取值確定后,消費的取值雖不能唯一確定,但有一定的取值范圍,0 C Y ,遵循邊際消費傾向遞減的規(guī)律。

4、居民消費C與可支配收入Y之間的關系可表示為C = + Y, 、為待估參數(shù)。,例如:,相關關系的表達式一般表示為含有未知參數(shù)的函數(shù)形式,需要進行參數(shù)估計。,一、相關分析與回歸分析,相關關系的分類,a)按照涉及的變量的數(shù)量,單相關(一元相關),復相關(多元相關),- 指兩個經濟變量之間存在的相關關系,- 指多個經濟變量之間存在的相關關系,可能是幾個 經濟變量的某種綜合效果與一個經濟變量有趨勢方面的聯(lián)系。,一、相關分析與回歸分析,相關關系的分類,b)按照相關的程度,完全相關,不完全相關,不相關,一、相關分析與回歸分析,相關關系的分類,c)按照相關的性質,正相關,負相關,一、相關分析與回歸分析,相關關

5、系的分類,c)按照相關的性質,線性相關,非線性相關,一、相關分析與回歸分析,函數(shù)關系與相關關系的區(qū)別,確定的函數(shù)關系可以直接用于經濟活動,無需分析。,不確定的相關關系,隱含著某種經濟規(guī)律,是有關研究的重點,一、相關分析與回歸分析,2. 相關分析,研究變量之間的相關關系的形式和程度的一種統(tǒng)計分析方法,主要 通過繪制變量之間關系的散點圖和計算變量之間的相關系數(shù)進行。,繪制變量之間關系的散點圖,例如:,計算變量之間的相關系數(shù),一、相關分析與回歸分析,相關系數(shù),十九世紀末英國著名統(tǒng)計學家卡爾皮爾遜(Karl Pearson) 度量兩個變量之間的線性相關程度的簡單相關系數(shù)(簡稱相關系數(shù)),一、相關分析與

6、回歸分析,(2-2),(2-3),或,相關系數(shù)的取值介于11之間, 取值為負表示兩變量之間存在負相關關系; 取值為正表示兩變量之間存在正相關關系; 取值為1表示兩變量之間存在完全負相關關系; 取值為0表示兩變量不相關; 取值為1表示兩變量之間存在完全正相關關系。,一、相關分析與回歸分析,對變量間統(tǒng)計依賴關系的考察主要是通過相關分析(correlation analysis)或回歸分析(regression analysis)來完成的:,例如: 函數(shù)關系:,統(tǒng)計依賴關系/統(tǒng)計相關關系:,3. 回歸分析,研究不僅存在相關關系而且存在因果關系的變量之間的依存關系的 一種分析理論與方法,是計量經濟學的

7、方法論基礎,,主要內容,1)設定理論模型,描述變量之間的因果關系;,2)根據樣本觀察數(shù)據利用適當方法對模型參數(shù)進行估計, 得到回歸方程;,3)對回歸方程中的變量、方程進行顯著性檢驗,推求參數(shù) 的置信區(qū)間、模型的預測置信區(qū)間;,4)利用回歸模型解決實際經濟問題。,一、相關分析與回歸分析,4. 相關分析與回歸分析之間的關系,聯(lián)系:,1)都是對存在相關關系的變量的統(tǒng)計相關關系的研究; 2)都能測度線性相關程度的大?。?3)都能判斷線性相關關系是正相關還是負相關。,4. 相關分析與回歸分析之間的關系,區(qū)別:,1)相關分析僅僅是從統(tǒng)計數(shù)據上測度變量之間的相關程度, 不考慮兩者之間是否存在因果關系,因而變

8、量的地位在相 關分析中是對等的; 回歸分析是對變量之間的因果關系的分析,變量的地位是 不對等的,有被解釋變量和解釋變量之分。,2)相關分析主要關注變量之間的相關程度和性質,不關注變 量之間的具體依賴關系。 回歸分析在關注變量之間的相關程度和性質的同時,更關注變量 之間的具體依賴關系,因而可以深入分析變量間的依存關系,有 可能達到掌握其內在規(guī)律的目的,具有更重要的實踐意義。,習 題,下表列出若干對自變量與因變量。對每一對變量,你認為它們之間的關系如何?是正的、負的、還是無法確定?并說明理由。,含有隨機誤差項是計量經濟學模型與數(shù)理經濟模型的一大區(qū)別。,例如:,對于供給不足下的生產活動,可以認為產出

9、是由資本、勞動、技術等投入要素決定的,并且,一般情況下,產出隨著投入要素的增加而增加,但要素的邊際產出遞減。,二、隨機誤差項,例如:,對于供給不足下的生產活動,可以認為產出是由資本、勞動、技術等投入要素決定的,并且,一般情況下,產出隨著投入要素的增加而增加,但要素的邊際產出遞減。,二、隨機誤差項,存在原因,第一,人類的經濟行為本身帶有隨機性;,第二,通常一個變量總是受眾多因素的影響;,第三,任何函數(shù)反映經濟變量之間的關系都只是一種簡化反映;,第四,經濟數(shù)據來源于調查統(tǒng)計,而非嚴格的控制實驗;,二、隨機誤差項,結論,一個經濟變量通常不能被另一個經濟變量完全精確地決定,需要 引入隨機誤差項來反映各

10、種誤差的綜合影響,主要包括:,1)變量的內在隨機性的影響;,2)解釋變量中被忽略的因素的影響;,3)模型關系設定誤差的影響;,4)變量觀察值的觀察誤差的影響;,5)其他隨機因素的影響。,二、隨機誤差項,有何特性?,眾多因素對被解釋變量Y的影響代表的綜合體 對Y的影響方向有正有負 由于是次要因素代表,對Y的總平均影響可能是0 對Y的影響是非趨勢性的,而是隨機擾動。,二、隨機誤差項,習 題,例1、令kids表示一名婦女生育孩子的數(shù)目,educ表示該婦女接受過教育的年數(shù)。生育率對教育年數(shù)的簡單回歸模型為 (1)隨機擾動項包含什么樣的因素?它們可能與教育水平相關嗎? (2)上述簡單回歸分析能夠揭示教育

11、對生育率在其他條件不變下的影響嗎?請解釋。,習題答案,(1)收入、年齡、家庭狀況、政府的相關政策等也是影響生育率的重要的因素,在上述簡單回歸模型中,它們被包含在了隨機擾動項之中。有些因素可能與增長率水平相關,如收入水平與教育水平往往呈正相關、年齡大小與教育水平呈負相關等。 (2)當歸結在隨機擾動項中的重要影響因素與模型中的教育水平educ相關時,上述回歸模型不能夠揭示教育對生育率在其他條件不變下的影響,因為這時出現(xiàn)解釋變量與隨機擾動項相關的情形,基本假設4不滿足。,1總體回歸曲線與總體回歸函數(shù),給定解釋變量條件下被解釋變量的期望軌跡稱為總體回歸曲線 (population regression

12、 curve),或總體回歸線(population regression line)。,描述總體回歸曲線的函數(shù)稱為總體回歸函數(shù)(population regression function)。,三、總體回歸模型,三、總體回歸模型,例2-1,假設一個由100個家庭構成的總體,并假設這100個家庭的 月可支配收入水平只限于1300元、1800元、2300元、2800 元、3300元、3800元、4300元、4800元、5300元、5800元10 種情況,每個家庭的月可支配收入與消費數(shù)據如表2-1所示, 要研究這一總體的家庭月消費支出Y與家庭月可支配收入X之 間的關系,以便根據已知的家庭月可支配收入

13、水平測算該總 體的家庭月消費支出平均水平。,表2-1 100個家庭的月可支配收入與消費數(shù)據 單位:元,家庭消費支出主要取決于家庭可支配收入,但不是唯一取決于家庭可支配收入,還會受到其他各種不確定性因素的影響,因而可支配收入相同的不同家庭的消費支出各不相同。,由此可求得對應于家庭可支配收入X的各個水平的家庭消費支出Y的條件 均值(conditional mean)或稱為條件期望(conditional expectation), 如表2-2所示。,析:,表2-2 100個家庭的月可支配收入與消費數(shù)據 單位:元,由表2-1、表2-2中的數(shù)據繪制不同可支配收入家庭的消費支出散 點圖、家庭消費支出與可

14、支配收入關系的總體回歸曲線,如圖2-1所示。,從散點圖可以清晰地看出,不同家庭的消費支出雖然存在差異,但總體 趨勢隨可支配收入的增加而增加,總體回歸曲線反映了這一趨勢。,回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。,含義:,函數(shù)形式: 可以是線性或非線性的。,將居民消費支出看成是其可支配收入的線性函數(shù)時:,為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regression coefficients)。,三、總體回歸模型,事實上,經濟活動中的總體包含的個體的數(shù)量往往非常多,一般不 大可能像例2-1假設的那樣得到總體中所有個體的觀察數(shù)據,因此也就不 大

15、可能依據總體的所有觀察數(shù)據計算得到被解釋變量Y的條件期望,無 法畫出精確的總體回歸曲線,相應地,總體回歸函數(shù)的具體形式也無法 精確確定。 所以,對于總體回歸函數(shù),通常只能根據經濟理論或實踐經驗進行 設定,也就是說,通常需要對總體回歸函數(shù)作出合理的假設。,三、總體回歸模型,2總體回歸模型,三、總體回歸模型,的離差(deviation),,三、總體回歸模型,例:個別家庭的消費支出為:,(*)式稱為總體回歸函數(shù)(方程)PRF的隨機設定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。,(1)該收入水平下所有家庭的平均消費支出E(Y|Xi),稱為系統(tǒng)性(systematic)

16、或確定性(deterministic)部分。 (2)其他隨機或非確定性(nonsystematic)部分i。,即,給定收入水平Xi ,個別家庭的支出可表示為兩部分之和:,(*),由于方程中引入了隨機項,成為計量經濟學模型,因此也稱為總體回歸模型。,三、總體回歸模型,3線性總體回歸模型,確定性部分為線性函數(shù)的總體回歸模型稱為線性總體回歸模型。,線性總體回歸模型是計量經濟學中最常見的總體回歸模型。,只含有一個解釋變量的線性總體回歸模型稱為一元線性總體回歸模型, 簡稱一元線性回歸模型或簡單線性回歸模型(simple linear regression model),其一般形式是,(2-8),三、總體

17、回歸模型,3線性總體回歸模型,三、總體回歸模型,注意:,這里所說的線性函數(shù)和通常意義下的線性函數(shù)不同,這里的線性函數(shù)指 參數(shù)是線性的,即待估參數(shù)都只以一次方出現(xiàn),解釋變量可以是線性的,也 可以不是線性的。,例如:,都是線性回歸模型。,三、總體回歸模型,注意:,例如:,都不是線性回歸模型。,三、總體回歸模型,對于參數(shù)線性、解釋變量非線性的回歸模型,只要稍作變換,就可 化為線性回歸模型的一般形式。,例如:,模型,三、總體回歸模型,4線性回歸模型的普遍性,例如,著名的Cobb-Dauglas生產函數(shù)表現(xiàn)為冪函數(shù)形式, 著名的菲利普斯曲線(Phillips curves)表現(xiàn)為雙曲線形式。,三、總體回

18、歸模型,對于其他復雜的函數(shù)形式,可通過級數(shù)展開化為線性形式,三、總體回歸模型,+余項,令,,,,,余項,原模型可化為,三、總體回歸模型,總體的信息往往無法掌握,現(xiàn)實的情況只能是在一次觀測中得到總體的一個樣本。,問題1:能從一次抽樣中獲得總體的近似的信息嗎?,回答:能,四、樣本回歸模型,問題2:如果可以,如何從抽樣中獲得總體的近似信息?,1樣本回歸函數(shù)與樣本回歸曲線,根據樣本數(shù)據對總體回歸函數(shù)作出的估計稱為樣本回歸函數(shù)。,由樣本回歸函數(shù)繪制的曲線稱為樣本回歸曲線(樣本回歸線)。,四、樣本回歸模型,例2-2,假設沒有取得總體中所有家庭的可支配收入與消費支出數(shù)據,而是按可支配收入水平的不同水平調查取

19、得了一組有代表性的樣本,如表2-3所示。,表2-3 家庭月可支配收入與消費支出的一個樣本 單位:元,以例2-1為例(假設一個由100個家庭構成的總體,并假設這100個家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10種情況,每個家庭的月可支配收入與消費數(shù)據如表2-1所示,要研究這一總體的家庭月消費支出Y與家庭月可支配收入X之間的關系,以便根據已知的家庭月可支配收入水平測算該總體的家庭月消費支出平均水平。),若將家庭月可支配收入X與消費支出Y的總體回歸函數(shù)設定為一元 線性回歸函數(shù)的形式,四、樣本回歸

20、模型,根據樣本數(shù)據和樣本回歸方程可繪制不同可支配收入家庭的消費支出散點圖、家庭消費支出與可支配收入關系的樣本回歸線,如圖2-2所示。,從圖中可以清晰地看出,樣本回歸線是通過對樣本數(shù)據的較好的擬合對總 體回歸線作出的一種估計。,這里將樣本回歸線看成總體回歸線的近似替代,則,注意:,回歸分析的主要目的:根據樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。,注意:這里PRF可能永遠無法知道。,即,根據,估計,2樣本回歸模型,在樣本回歸函數(shù)中引入殘差項后,得到的是隨機方程,成為 了計量經濟學模型,稱為樣本回歸模型。,對于例2-2中的樣本回歸函數(shù),例如:,四、樣本回歸模型,3線性樣本回歸模型,確定性部分是線

21、性函數(shù)的樣本回歸模型稱為線性樣本回歸模型。,四、樣本回歸模型,3線性樣本回歸模型,四、樣本回歸模型,習 題,判斷正誤并說明理由: 1、隨機誤差項ui和殘差項ei是一回事 2、總體回歸函數(shù)給出了對應于每一個自變量的因變量的值 3、線性回歸模型意味著變量是線性的 4、在線性回歸模型中,解釋變量是原因,被解釋變量是結果 回答下列問題: 隨機誤差項ui和殘差項ei的區(qū)別與聯(lián)系。,習 題,下列方程哪些是正確的?哪些是錯誤的?為什么? , 一元線性回歸模型的基本假設,第二節(jié) 一元線性回歸模型的參數(shù)估計, 參數(shù)的普通最小二乘估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函

22、數(shù)的性質, 隨機誤差項方差的估計, 一元線性回歸模型的基本假設, 參數(shù)的普通最小二乘估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函數(shù)的性質, 隨機誤差項方差的估計,講課內容,一、一元線性回歸模型的基本假設,一元線性回歸模型的基本假設包括對解釋變量的假設、對 隨機誤差項的假設、對模型設定的假設幾個方面,主要如下:,1)解釋變量是確定性變量,不是隨機變量。,2)隨機誤差項具有0均值、同方差,且在不同樣本點之間是獨立的,不存在序列相關,即,3)隨機誤差項與解釋變量不相關。即,4)隨機誤差項服從正態(tài)分布,即,5)回歸模型是正確設定的。,假設:線性回歸模型就參數(shù)而言

23、是線性的 對變量為線性: 對參數(shù)為線性:,E(Y|Xi)=+xi E(Y|Xi)=+x2i,E(Y|Xi)=+x2i E(Y|Xi)=xi,變量非線性函數(shù)有多種形式,其中一些可以通過適當?shù)姆绞阶儞Q為參數(shù)線性函數(shù),一、一元線性回歸模型的基本假設,這5條假設中的前4條是線性回歸模型的古典假設,也稱為高斯假設,滿足古典假設的線性回歸模型稱為古典線性回歸模型(classical linear regression model)。,在這5條假設中,若前兩條假設滿足,第3條自然滿足,因為前兩條假設成立時有,且由第2條假設有,因為,習 題,例1、令kids表示一名婦女生育孩子的數(shù)目,educ表示該婦女接受過

24、教育的年數(shù)。生育率對教育年數(shù)的簡單回歸模型為 (1)隨機擾動項包含什么樣的因素?它們可能與教育水平相關嗎? (2)上述簡單回歸分析能夠揭示教育對生育率在其他條件不變下的影響嗎?請解釋。,習題答案,(1)收入、年齡、家庭狀況、政府的相關政策等也是影響生育率的重要的因素,在上述簡單回歸模型中,它們被包含在了隨機擾動項之中。有些因素可能與增長率水平相關,如收入水平與教育水平往往呈正相關、年齡大小與教育水平呈負相關等。 (2)當歸結在隨機擾動項中的重要影響因素與模型中的教育水平educ相關時,上述回歸模型不能夠揭示教育對生育率在其他條件不變下的影響,因為這時出現(xiàn)解釋變量與隨機擾動項相關的情形,基本假設

25、4不滿足。, 一元線性回歸模型的基本假設, 參數(shù)的普通最小二乘估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函數(shù)的性質, 隨機誤差項方差的估計,講課內容,二、參數(shù)的普通最小二乘估計,普通最小二乘法(ordinary least squares,OLS)的基本思想 使樣本回歸函數(shù)盡可能好地擬合樣本數(shù)據,表現(xiàn)在圖上就是要使樣 本散點偏離樣本回歸線的距離最小,表示被解釋變量的估計值與實際觀察值的偏差總體上最小, 稱為最小二乘準則。,對于一元線性回歸模型,(2-14),整理得,(2-15),解得,(2-16),方程組(2-14)或(2-15)稱為正規(guī)方程組。,式(2

26、-16)可改寫為,(2-17),若一元線性回歸模型中沒有常數(shù)項,即模型為,可得普通最小二乘參數(shù)估計量為,(2-18),例:在上述家庭可支配收入-消費支出例中,對于所抽出的一組樣本數(shù),參數(shù)估計的計算可通過下面的表2.2.1進行。,因此,由該樣本估計的回歸方程為:,例2-3,以例2-2為例(假設一個由100個家庭構成的總體,并假設這100個家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10種情況,每個家庭的月可支配收入與消費數(shù)據如表2-1所示,要研究這一總體的家庭月消費支出Y與家庭月可支配收入X之間的

27、關系,以便根據已知的家庭月可支配收入水平測算該總體的家庭月消費支出平均水平。),注意小數(shù)點取值,大樣本時影響較大,答 疑,為什么要設定古典假定? 回歸分析的目的不僅是獲得 ,而且要對真實值做出推斷。 即用樣本對總體進行推斷,統(tǒng)計學中稱為統(tǒng)計推斷。 要想利用樣本對總體做出推斷,不僅要知道代表總體的對應函數(shù)形式,還需要對Yi的產生方式做出某些假定。 如果不知道Xi和 是怎樣產生的,即不對它們做出某些假定,就無法得出Yi的統(tǒng)計推斷。也無法根據 對其真實值做出推斷。,(2-8),習 題,線性回歸模型 隨機誤差項的0均值假設是否可以表示為 ? 為什么?, 一元線性回歸模型的基本假設, 參數(shù)的普通最小二乘

28、估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函數(shù)的性質, 隨機誤差項方差的估計,講課內容,三、參數(shù)的最大似然估計,最大或然法(Maximum Likelihood,簡稱ML),也稱最大似然法,是不同于最小二乘法的另一種參數(shù)估計方法,是從最大或然原理出發(fā)發(fā)展起來的其它估計方法的基礎。 基本原理: 對于最大或然法,當從模型總體隨機抽取n組樣本觀測值后,最合理的參數(shù)估計量應該使得從模型中抽取該n組樣本觀測值的概率最大。,三、參數(shù)的最大似然估計,對于一元線性回歸模型,若滿足基本假設,則,那么Yi服從如下的正態(tài)分布:,于是,Y的概率密度函數(shù)為,(i=1,2,n),假

29、如模型的參數(shù)估計量已經求得,為,正態(tài)分布:概率密度函數(shù),回 顧,f(x) = 隨機變量 X 的頻數(shù) = 總體方差 =3.14159; e = 2.71828 x = 隨機變量的取值 (- x ) = 總體均值,的聯(lián)合概率密度函數(shù)是,(2-19),由于似然函數(shù)極大化等價于似然函數(shù)的對數(shù),(2-21),的極大化。,所以,根據微積分中求極限的原理,分別求式(2-21)對,的一階偏導數(shù),并令求偏導的結果等于0,可得正規(guī)方程組,(2-22),解得,(2-23),可見,在滿足一系列基本假設的情況下,模型結構參數(shù)的最大或然估計量與普通最小二乘估計量是相同的。 習題:P72.15, 一元線性回歸模型的基本假設

30、, 參數(shù)的普通最小二乘估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函數(shù)的性質, 隨機誤差項方差的估計,講課內容,當模型參數(shù)估計出后,需考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質。,四、普通最小二乘參數(shù)估計量的性質,漸近無偏性,估計量 優(yōu)劣性,漸近有效性,一致性,無偏性,有效性,線性性,線性性,無偏性,有效性 (最小方差性),漸近無偏性,一致性,漸近有效性,小樣本性質,大樣本性質 (漸進性質),指參數(shù)估計量的數(shù)學期望等于參數(shù)的真實值,指在所有的線性、無偏估計量中該參數(shù)估計量的方差最小,指樣本容量趨于無窮大時,參數(shù)估計量

31、的數(shù)學期望 趨于參數(shù)的真實值,樣本容量趨于無窮大時,參數(shù)估計量依概率收斂于 參數(shù)的真實值,指樣本容量趨于無窮大時,在所有的一致估計量中 該參數(shù)估計量具有最小的漸近方差。,四、普通最小二乘參數(shù)估計量的性質,1.線性性 - 估計參數(shù) 和 均是樣本觀測值(Xi和Yi)的 線性函數(shù)。,OLS,四、普通最小二乘參數(shù)估計量的性質,證:,令,則,同理,四、普通最小二乘參數(shù)估計量的性質,2.無偏性 - 估計參數(shù) 和 的均值等于總體參數(shù)真值,證:,易知,故,同樣地,容易得出,?,四、普通最小二乘參數(shù)估計量的性質,四、普通最小二乘參數(shù)估計量的性質,3.有效性:利用OLS估計的參數(shù) 和 的方差最小,四、普通最小二乘

32、參數(shù)估計量的性質,3.有效性,(2)證明最小方差性,其中,ci=vi+di,di為不全為零的常數(shù) 則容易證明,四、普通最小二乘參數(shù)估計量的性質,1)滿足線性性、無偏性、有效性三個小樣本性質的參數(shù)估計量稱為最佳 線性無偏估計量(best linear unbiased estimator,BLUE)。,2)滿足小樣本性質的參數(shù)估計量自然也滿足大樣本性質。,3)在小樣本性質不滿足的情況下,應擴大樣本容量,考察大樣本性質。,4)在滿足基本假設情況下,一元線性回歸模型的普通最小二乘參數(shù)估計 量是最佳線性無偏估計量。(why?),幾點說明:,四、普通最小二乘參數(shù)估計量的性質,4.一致性,由于最小二乘估計

33、量擁有一個“好”的估計量所應具備的小樣本特性,它自然也擁有大樣本特性。,四、普通最小二乘參數(shù)估計量的性質,P41 (2-29),習 題,假定有如下的回歸結果: ,其中,Y表示美國的咖啡的消費量(每天每人消費的杯數(shù)),X表示咖啡的零售價格(美元/杯),t表示時間。 要求: (1)這是一個時間序列回歸還是橫截面序列回歸? (2)如何解釋截距的意義,它有經濟含義嗎?如何解釋斜率? (3)能否求出真實的總體回歸函數(shù)? (4)根據需求的價格彈性定義:彈性=斜率(X/Y),依據上述回歸結果,你能求出對咖啡需求的價格彈性嗎?如果不能,計算此彈性還需要其他什么信息?,習 題 答 案,截距2.6911表示咖啡零

34、售價在時刻為每磅0美元時,美國平均消費量為每天每人2.6911杯,這個數(shù)字沒有經濟意義;斜率-0.4795表示咖啡零售價與消費量負相關,在時刻t,價格上升1美元/磅,則平均每天每人消費量減少0.4795杯; 不能; 不能;在同一條需求曲線上不同點的價格彈性不同,若要求出,須給出具體的值及與之對應的值。,習 題,令 和 分別為Y對X回歸和X對Y回歸中的斜率,試證明: 其中r為X和Y之間的線性相關系數(shù) p24 (2-2), 一元線性回歸模型的基本假設, 參數(shù)的普通最小二乘估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函數(shù)的性質, 隨機誤差項方差的估計,講課內容,

35、五、普通最小二乘樣本回歸函數(shù)的性質,2被解釋變量的估計的均值等于實際值的均值,即,3殘差和為零,即,4解釋變量與殘差的乘積之和為零,即,5被解釋變量的估計與殘差的乘積之和為零,即,習 題,對于經濟計量模型: ,其OLS估計參數(shù)的特性在下列情況下會受到什么影響: (1)觀測值數(shù)目n增加; (2)Xi各觀測值差額增加; (3)Xi各觀測值近似相等,答 案,(1)根據大樣本特性,更接近真實值 (2)更接近真實值 (3)使得 變得不穩(wěn)定,甚至無法計算, 一元線性回歸模型的基本假設, 參數(shù)的普通最小二乘估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函數(shù)的性質, 隨機誤

36、差項方差的估計,講課內容,六、參數(shù)估計量的概率分布及隨機干擾項方差的估計,六、參數(shù)估計量的概率分布及隨機干擾項方差的估計,2、隨機誤差項的方差2的估計,由于隨機項i不可觀測,只能從i的估計殘差ei出發(fā),對總體方差進行估計。,2又稱為總體方差。,可以證明,2的最小二乘估計量為,它是關于2的無偏估計量。,2的最大似然估計量,即,2、隨機誤差項的方差2的估計,2的最大或然估計量不具無偏性,但卻具有一致性。,最大似然法與最小二乘法,結構參數(shù)估計結果 隨機誤差項的方差的估計結果 應用范圍,習 題1,線性回歸模型有哪些基本假設?違背基本假設的計量經濟學模型是否就不可估計?,習 題2,p18,習 題,線性回

37、歸模型的基本假設(實際是針對普通最小二乘法的基本假設)是:解釋變量是確定性變量,而且解釋變量之間互不相關;隨機誤差項具有0均值和同方差;隨機誤差項在不同樣本點之間是獨立的,不存在序列相關;隨機誤差項與解釋變量之間不相關;隨機誤差項服從0均值、同方差的正態(tài)分布。 違背基本假設的計量經濟學模型還是可以估計的,只是不能使用普通最小二乘法進行估計。,第二節(jié) 結束, 一元線性回歸模型的基本假設, 參數(shù)的普通最小二乘估計, 參數(shù)的最大似然估計, 普通最小二乘參數(shù)估計量的性質, 普通最小二乘樣本回歸函數(shù)的性質, 隨機誤差項方差的估計,內容回顧,回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用

38、樣本回歸線代替總體回歸線。,盡管從統(tǒng)計性質上已知,如果有足夠多的重復 抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。 那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗。 主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及參數(shù)的區(qū)間估計。,第三節(jié) 一元線性回歸模型的擬合優(yōu)度檢驗,問題: 采用普通最小二乘估計方法,已經保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度?,要考慮: 殘差平方和會隨樣本容量增大而增大 樣本數(shù)據的整體數(shù)值大小會影響殘差平方和。 因此,殘差平方和不具有橫向可比性。,第三節(jié) 一元線性回歸

39、模型的擬合優(yōu)度檢驗,擬合優(yōu)度指樣本回歸線對樣本數(shù)據擬合的精確程度,擬合優(yōu)度檢驗,擬合優(yōu)度檢驗方法通過構造表征擬合優(yōu)度的統(tǒng)計量,對模型的擬合 效果作出評價,擬合優(yōu)度檢驗實質通過殘差平方和構造了擬合優(yōu)度的度量指標一一 決定系數(shù),其基礎是被解釋變量的離差分解。,講課內容,1、離差分解 2、決定系數(shù) 3、決定系數(shù)與相關系數(shù)的關系,如果Yi=i 即實際觀測值落在樣本回歸“線”上,則擬合最好。 可認為,“離差”全部來自回歸線,而與“殘差”無關。,能夠由回歸直線解釋,不能由回歸直線解釋,(2-37),記,=,總體平方和或總離差平方和 反映樣本觀察值的總體離差的大小,回歸平方和 反映模型中由解釋變量解釋的那部

40、分離差的大小,殘差平方和 反映模型中解釋變量未解釋的那部分離差的大小,這樣,式(2-37)可表示為,(2-38),講課內容,1、離差分解 2、決定系數(shù) 3、決定系數(shù)與相關系數(shù)的關系,二、決定系數(shù),(2-38),(2-39),(2-40),是模型中由解釋變量解釋的那部分離差占總離差的比重,(2-41),是模型中解釋變量未解釋的那部分離差占總離差的比重,決定系數(shù)( ),(2-42),TSS=ESS+RSS,Y的觀測值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。,在給定樣本中,TSS不變, 如果實際觀測點離樣本回歸

41、線越近,則ESS在TSS中占的比重越大。,擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS,可決系數(shù)的取值范圍:0,1 R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。 可決系數(shù)依賴于所給出的回歸方程的數(shù)學形式,同樣的因果關系采用不同的表達式將得到不同的R2。 不要將R2高低作為評價模型優(yōu)劣的唯一標準,估計方程的目的是得到可靠的參數(shù)估計。,例2-4,以例2-3為例(假設一個由100個家庭構成的總體,并假設這100個家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10種情況,每個家庭的月可支配收入

42、與消費數(shù)據如表2-1所示,要研究這一總體的家庭月消費支出Y與家庭月可支配收入X之間的關系,以便根據已知的家庭月可支配收入水平測算該總體的家庭月消費支出平均水平。),求關于家庭消費支出與可支配收入關系的一元線性回歸模型的擬合優(yōu)度。,模型的擬合效果較好,或,講課內容,1、離差分解 2、決定系數(shù) 3、決定系數(shù)與相關系數(shù)的關系,三、決定系數(shù)與相關系數(shù)的關系,三、決定系數(shù)與相關系數(shù)的關系,相關系數(shù):度量變量X、Y之間線性相關程度。不涉及變量間的因果關系。 決定系數(shù):度量變量X、Y之間線性因果關系的程度。告訴我們在因變量的變異中由解釋變量能夠解釋的部分占多大比例。度量變量X、Y之間的單向因果關系的程度。,

43、在例2.1.1的收入-消費支出例中,,注:可決系數(shù)是一個非負的統(tǒng)計量。,第四節(jié) 一元線性回歸模型的參數(shù)的統(tǒng)計推斷,參數(shù)的假設檢驗,參數(shù)估計與檢驗結果的表述,參數(shù)的區(qū)間估計,參數(shù)估計量的分布,一、參數(shù)估計量的分布,服從正態(tài)分布,進行標準化變換可得,的樣本方差,的樣本標準差,服從自由度為n-2的t 分布,二、參數(shù)的區(qū)間估計,區(qū)間,由此可得,所以,在 顯著性水平下,參數(shù) 的置信區(qū)間分別為,例2-5,以例2-3為例(假設一個由100個家庭構成的總體,并假設這100個家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、58

44、00元10種情況,每個家庭的月可支配收入與消費數(shù)據如表2-1所示,要研究這一總體的家庭月消費支出Y與家庭月可支配收入X之間的關系,以便根據已知的家庭月可支配收入水平測算該總體的家庭月消費支出平均水平。),答案,的95%的置信區(qū)間為,的95%的置信區(qū)間為,三、參數(shù)的假設檢驗,參數(shù)的假設檢驗檢驗對模型參數(shù)所作的某一個假設是否成立,基礎是參數(shù)估計量的分布性質,采用的方法是統(tǒng)計學中的假設檢驗,對模型參數(shù)所作的假設,可以是參數(shù)等于某一特定的數(shù)值,可以是參數(shù)大于或小于某一特定的數(shù)值,針對參數(shù)的某一假設,檢驗的基本思想是由原假設和參數(shù)估計量構 造一個小概率事件,判斷在給定顯著性水平下這一小概率事件是否發(fā) 生

45、,如果小概率事件發(fā)生了,則拒絕原假設,接受備擇假設;如果小概 率事件沒有發(fā)生,則接受原假設,拒絕備擇假設。因為小概率事件是一 次抽樣中幾乎不可能發(fā)生的事件,小概率事件發(fā)生,說明原假設不真。,由式(2-45)、式(2-46),可利用 t 分布進行參數(shù)的假設檢驗,稱為 t 檢驗。,,,接受原假設,,,如果,接受原假設,例2-6,以例2-3為例(假設一個由100個家庭構成的總體,并假設這100個家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10種情況,每個家庭的月可支配收入與消費數(shù)據如表2-1所示,要研

46、究這一總體的家庭月消費支出Y與家庭月可支配收入X之間的關系,以便根據已知的家庭月可支配收入水平測算該總體的家庭月消費支出平均水平。),析:,查t分布表可得,影響顯著,P54 P值,四、參數(shù)估計與檢驗結果的表述,以例2-3例2-6對消費函數(shù)模型的分析為例,,可按規(guī)范格式將分析結果表述為,第一行是樣本回歸函數(shù);,第二行是對應參數(shù)估計值的t 統(tǒng)計值,第三行是模型的擬合優(yōu)度,習題p26、25、18,第五節(jié) 一元線性回歸模型的預測,在樣本數(shù)據反映的經濟變量之間的關系基本上沒有變化的情況下, 可利用經過參數(shù)估計和檢驗的模型,由已知或事先測定的解釋變量的數(shù) 值,預測被解釋變量的數(shù)值。,被解釋變量的總體均值的點預測,被解釋變量的總體均值的區(qū)間預測,被解釋變量的個別值的區(qū)間預測,(2-49),( Why? ),例2-7,以例2-3為例(假設一個由100個家庭構成的總體,并假設這100個家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論