一元線性回歸模型_第1頁
一元線性回歸模型_第2頁
一元線性回歸模型_第3頁
一元線性回歸模型_第4頁
一元線性回歸模型_第5頁
已閱讀5頁,還剩265頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

經濟計量分析

第四章一元線性回歸模型本文檔共270頁;當前第1頁;編輯于星期一\10點46分本章介紹一元線性回歸模型的概念及一元線性回歸模型所依據(jù)的理論與應用。一元線性回歸模型只包含一個解釋變量和一個被解釋變量,是最簡單的線性回歸模型。通過一元線性回歸模型的學習,可較容易地理解回歸分析的基本理論與應用。本文檔共270頁;當前第2頁;編輯于星期一\10點46分第一節(jié)回歸分析的相關概念

一、回歸的含義

回歸一詞最早由F·高爾頓(FrancisGalton)提出。在一篇研究父母身高與子女身高相互關系的論文中,高爾頓發(fā)現(xiàn),雖然有一個趨勢,父母高,子女也高;父母矮,子女也矮,但給定父母的身高,子女的平均身高卻趨向于或者回歸到全體人口的平均身高。本文檔共270頁;當前第3頁;編輯于星期一\10點46分也就是說,當父母雙親都異常高或異常矮,則子女的身高有趨向于人口總體平均身高的趨勢。這種現(xiàn)象被稱為高爾頓普遍回歸定律。這就是回歸一詞的原始含義。本文檔共270頁;當前第4頁;編輯于星期一\10點46分在現(xiàn)代,回歸一詞已演變?yōu)橐环N新的概念?;貧w分析就是研究被解釋變量對解釋變量的依賴關系,其目的就是通過解釋變量的已知或設定值,去估計或預測被解釋變量的總體均值。在下面的幾個例子中,我們可以清晰地看到回歸分析的實際意義。本文檔共270頁;當前第5頁;編輯于星期一\10點46分1.高爾頓普遍回歸定律。高爾頓的目的在于發(fā)現(xiàn)為什么人口的身高分布有一種穩(wěn)定性。在現(xiàn)代,我們并不關心這種解釋,我們關心的是:在給定父輩身高的情形下,找到兒輩平均身高的變化規(guī)律。本文檔共270頁;當前第6頁;編輯于星期一\10點46分就是說,我們如果知道了父輩的身高,就可預測兒輩的平均身高。假設我們得到了一組父親、兒子身高的數(shù)據(jù),制成如下的散點圖。圖中按統(tǒng)計分組的方法將父親身高分為若干組。本文檔共270頁;當前第7頁;編輯于星期一\10點46分××××××××××××××××××××父親身高(cm)兒子身高(cm)

圖4.1

給定父親身高兒子身高的分布

本文檔共270頁;當前第8頁;編輯于星期一\10點46分圖4.1中對應于設定的父親身高,兒子身高有一個分布范圍。隨著父親身高的增加,兒子的平均身高也在增加,畫一條通過兒子平均身高的線,說明兒子的平均身高是如何隨著父親身高的增加而增加的,這條線就是回歸線。

本文檔共270頁;當前第9頁;編輯于星期一\10點46分2.在經濟學中,經濟學家要研究個人消費支出與個人可支配收入的依賴關系。這種分析有助于估計邊際消費傾向,就是可支配收入每增加一元引起消費支出的平均變化。本文檔共270頁;當前第10頁;編輯于星期一\10點46分

3.在企業(yè)中,我們很想知道人們對企業(yè)產品的需求與廣告費開支的關系。這種研究有助于估計出相對于廣告費支出的需求彈性,即廣告費支出每變化百分之一的需求變化百分比,這有助于制定最優(yōu)廣告策略。

本文檔共270頁;當前第11頁;編輯于星期一\10點46分4.農業(yè)工作需要預計糧食產量,需要研究糧食產量與播種面積、施肥量、降雨量之間的依賴關系。這種一個變量依賴于另一個或多個變量的事例在經濟系統(tǒng)中普遍存在?;貧w分析就是要研究這種變量之間的依存關系。本文檔共270頁;當前第12頁;編輯于星期一\10點46分二、統(tǒng)計關系與確定性關系如果給定一個變量X的結果值就可確定另一個變量Y的結果值,則稱變量Y是變量X的函數(shù),即X、Y之間是函數(shù)關系。本文檔共270頁;當前第13頁;編輯于星期一\10點46分在經典物理學中,給定電阻Ω,電流I和電壓V

之間的關系即為函數(shù)關系,即。這種典型的變量關系就是確定性關系。本文檔共270頁;當前第14頁;編輯于星期一\10點46分在經濟系統(tǒng)中,這種變量之間的函數(shù)關系或確定性關系就很少見。常見的是變量之間是一種不確定的關系,既使變量X是變量Y

的原因,給定變量X

的值也不能具體確定變量Y的值,而只能確定變量Y

的統(tǒng)計特征,通常稱變量X與Y之間的這種關系為統(tǒng)計關系。本文檔共270頁;當前第15頁;編輯于星期一\10點46分

例如,企業(yè)總產出Y

與企業(yè)的資本投入K

、勞動力投入L

之間的關系就是統(tǒng)計關系。雖然資本K和勞動力L

是影響產出Y的兩大核心要素,但是給定K、L

的值并不能確定產出Y

的值。因為,總產出Y除了受資本投入K、勞動力投入L

的影響外,還要受到技術進步、自然條件等其它因素的影響。本文檔共270頁;當前第16頁;編輯于星期一\10點46分三、回歸分析與相關分析

與回歸分析密切相聯(lián)的是相關分析。相關分析主要測度兩個變量之間的線性關聯(lián)度,相關系數(shù)就是用來測度兩個變量之間的線性關聯(lián)程度的。例如,吸煙與肺癌、統(tǒng)計學成績與數(shù)學成績、身高與體重等等之間的相關程度,就可用相關系數(shù)來測度。本文檔共270頁;當前第17頁;編輯于星期一\10點46分而在回歸分析中,我們的主要目的在于根據(jù)其它變量的給定值來估計或預測某一變量的平均值。例如,我們想知道能否從一個學生的數(shù)學成績去預測他的統(tǒng)計學平均成績。本文檔共270頁;當前第18頁;編輯于星期一\10點46分在回歸分析中,被解釋變量Y被當作是隨機變量,而解釋變量X則被看作非隨機變量。而在相關分析中,我們把兩個變量都看作是隨機變量。本文檔共270頁;當前第19頁;編輯于星期一\10點46分例如,在學生的數(shù)學成績與統(tǒng)計學成績的分析中,如為回歸分析,則統(tǒng)計學成績是隨機變量,數(shù)學成績是非隨機變量,即數(shù)學成績被固定在給定的水平上,以此求得統(tǒng)計學的平均成績。而在相關分析中,兩者處于平等地位,不存在誰為解釋變量,誰為被解釋變量的問題,兩者均為隨機變量。本文檔共270頁;當前第20頁;編輯于星期一\10點46分第二節(jié)一元線性回歸模型

一、引例假定我們要研究一個局部區(qū)域的居民消費問題,該區(qū)域共有80戶家庭組成,將這80戶家庭視為一個統(tǒng)計總體。本文檔共270頁;當前第21頁;編輯于星期一\10點46分我們研究每月家庭消費支出Y

與每月可支配收入X

的關系。就是說,已知家庭每月可支配收入,要預測家庭每月消費支出的總體平均水平。為此,將80戶家庭分為10組。表4.1給出了人為數(shù)據(jù)。本文檔共270頁;當前第22頁;編輯于星期一\10點46分XY每月家庭可支配收入(元)1000150020002500300035004000450050005500每月家庭消費支出(元)7007407808208609009401050107011201170122012701320137014201380144015001560162016801740180018601780184019001960202020802140220022602180224023002360242024802540260026602620268027402820290029803160290029803060314032203300338034603540332034203520362037203820392037103810391040204130423043304090420043104420453046404750合計5740109801458018180217801974022540253402814030940表4.1居民收入、消費數(shù)據(jù)本文檔共270頁;當前第23頁;編輯于星期一\10點46分

從表4.1中可以看出,對于每月1000元收入的7戶家庭,每月消費支出為700元到940元不等。同樣,當X=3000元時,9戶家庭的每月消費支出在2180元到2660元之間。表4.1給出了以X的給定值為條件的Y

的條件分布。

本文檔共270頁;當前第24頁;編輯于星期一\10點46分對于Y的每一條件分布,我們能計算出它的條件期望,記為E(Y/X=Xi),即在X取特定Xi

值時Y的期望值。例如,X=1000時,Y的期望值為:本文檔共270頁;當前第25頁;編輯于星期一\10點46分

將表4.1中的數(shù)據(jù)在直角坐標系中描出,則得到圖4.2的散點圖。本文檔共270頁;當前第26頁;編輯于星期一\10點46分XY1000200030004000500010001500200025003000

3500

4000

4500

5000

5500

收入、消費散點圖

圖4.2本文檔共270頁;當前第27頁;編輯于星期一\10點46分該圖表明了對應于各X

值的Y的條件分布。雖然每個個別家庭的消費支出都有異,但圖4.2清楚地表明隨著收入的增加,消費支出平均地說也在增加。就是說,散點圖啟示我們,Y的條件均值隨X

的增加而增加。本文檔共270頁;當前第28頁;編輯于星期一\10點46分如果我們觀察圖4.2中那些代表Y的各個條件均值的粗圓點,則表明這些條件平均值落在一根有正斜率的直線上。我們稱這根直線叫做總體回歸線,它是Y對X的回歸。本文檔共270頁;當前第29頁;編輯于星期一\10點46分總體回歸線就是當解釋變量取給定值時,被解釋變量的條件均值或期望值的軌跡。

圖4.2表明,對每一Xi都有Y值的一個總體和一個相應的均值。而回歸線是穿過這些條件均值的線。本文檔共270頁;當前第30頁;編輯于星期一\10點46分二、總體回歸函數(shù)從圖4.2我們可以看出,條件均值E(Y/Xi)是Xi的函數(shù),即:E(Y/Xi)=f(Xi)

(4.1)

其中,f(Xi)表示解釋變量Xi

的某個函數(shù)。在我們的引例中,E(Y/Xi)是Xi的一個線性函數(shù)。本文檔共270頁;當前第31頁;編輯于星期一\10點46分式(4.1)就是總體回歸函數(shù),簡稱總體回歸。它表明在給定Xi下Y的分布的總體均值與Xi有函數(shù)關系,就是說它給出了Y的均值是怎樣隨X值的變化而變化的。本文檔共270頁;當前第32頁;編輯于星期一\10點46分函數(shù)f(Xi)采取什么函數(shù)形式,是一個需要解決的重要問題。在實際經濟系統(tǒng)中,我們不會得到總體的全部數(shù)據(jù),因而就無法據(jù)已知數(shù)據(jù)確定總體回歸函數(shù)的函數(shù)形式。同時,對總體回歸函數(shù)的形式只能據(jù)經濟理論與經驗去推斷。本文檔共270頁;當前第33頁;編輯于星期一\10點46分

例如,我們可以假定消費支出與收入有線性關系。則總體回歸函數(shù)為(4.2)

其中,和為未知而固定的參數(shù),稱為回歸系數(shù);為截距系數(shù),為斜率系數(shù)。式(4.2)為線性總體回歸函數(shù)。本文檔共270頁;當前第34頁;編輯于星期一\10點46分三、線性的含義1.對變量為線性對線性的第一種解釋是指Y

的條件期望是Xi的線性函數(shù),例如式(4.2)就是線性回歸函數(shù),該回歸線是一條直線。 本文檔共270頁;當前第35頁;編輯于星期一\10點46分

按這種解釋就不是線性的,因為對的一階導數(shù)不是常數(shù)。本文檔共270頁;當前第36頁;編輯于星期一\10點46分2.對參數(shù)為線性對線性的第二種解釋是指Y的條件期望 是參數(shù)的一個線性函數(shù)。它可以是也可以不是變量的X

的線性函數(shù)。本文檔共270頁;當前第37頁;編輯于星期一\10點46分此時, 就是線性回歸函數(shù)。但 則不是線性回歸函數(shù),而是非線性回歸函數(shù)。本文檔共270頁;當前第38頁;編輯于星期一\10點46分在本書中,主要考慮的是對參數(shù)為線性的回歸模型,線性回歸是指對參數(shù)β為線性的一種回歸(即參數(shù)只以它的1次方出現(xiàn));對解釋變量X則可以不是線性的。本文檔共270頁;當前第39頁;編輯于星期一\10點46分從圖4.2可清楚地看到,隨著家庭收入Xi的增加,家庭平均消費支出E(Y/Xi)也在增加,這表明了Xi與Y的平均水平的關系。我們想知道對于具體家庭而言,消費支出Y與它的收入水平Xi的關系。四、總體回歸函數(shù)的隨機設定本文檔共270頁;當前第40頁;編輯于星期一\10點46分

就個別家庭而言,收入水平增加,消費支出不一定會增加。本文檔共270頁;當前第41頁;編輯于星期一\10點46分

例如從表4.1可以看到,對于每月3000元的收入水平,有一戶家庭的消費支出為2180元,少于每月收入為2500元的兩戶家庭的消費支出(2200元和2260元)。但應看到,每月收入為3000元的家庭的平均消費支出大于每月收入2500元的家庭的平均消費支出(2420元大于2020元)。本文檔共270頁;當前第42頁;編輯于星期一\10點46分從圖4.2可以看到,給定收入水平Xi的個別家庭的消費支出處于在該收入水平的家庭平均消費支出左右,也就是圍繞著它的條件均值。我們把個別的Yi圍繞它的期望值的離差表示如下:本文檔共270頁;當前第43頁;編輯于星期一\10點46分或(4.3)

其中,離差ui是一個不可觀測的可正可負的隨機變量,在專業(yè)術語中,把ui稱為隨機干擾項或隨機誤差項。

本文檔共270頁;當前第44頁;編輯于星期一\10點46分

在式(4.3)中,給定收入X的水平,個別家庭的消費支出,可表示為兩個成份之和。本文檔共270頁;當前第45頁;編輯于星期一\10點46分(1)代表相同收入水平的所有家庭的平均消費支出。這是系統(tǒng)性或確定性成份。(2)ui為隨機或非系統(tǒng)性成份,代表所有可能影響Y,但又未能包括到回歸模型中來的被忽略變量的代理變量。本文檔共270頁;當前第46頁;編輯于星期一\10點46分假設對Xi

為線性的,則:(4.4)

本文檔共270頁;當前第47頁;編輯于星期一\10點46分式(4.4)表示一個家庭的消費支出線性地依賴于它的收入加干擾項。本文檔共270頁;當前第48頁;編輯于星期一\10點46分例如,給定X=1000,各家庭的消費支出可表達為本文檔共270頁;當前第49頁;編輯于星期一\10點46分五、隨機誤差項u的意義

1.理論的欠缺。

雖然有決定Y的行為的理論,但常常是不能完全確定的,理論常常有一定的含糊性。我們可以肯定每月收入X影響每月消費支出Y。但不能確定是否有其它變量影響Y,只好用ui作為模型所忽略的全部變量的替代變量。

本文檔共270頁;當前第50頁;編輯于星期一\10點46分2.數(shù)據(jù)的欠缺。

即使能確定某些變量對Y

有顯著影響,但由于不能得到這些變量的數(shù)據(jù)信息而不能引入該變量。例如,從經濟理論分析,家庭財富量是影響家庭消費的重要因素,應該引入該變量作為解釋變量。但是,通常我們得不到有關家庭財富的信息。因此,我們只得把這個很重要的解釋變量舍棄掉。本文檔共270頁;當前第51頁;編輯于星期一\10點46分

3.核心變量與非核心變量。

例如,在引例的居民消費模型中,除了收入X1外,家庭的人口數(shù)X2

、戶主宗教信仰X3、戶主受教育水平X4也影響家庭消費支出。但很可能X2、X3、X4合起來的影響也是很微弱的,是一種非系統(tǒng)的或隨機的影響。從效果與成本角度來看,引入它們是不合算的。所以,人們把它們的聯(lián)合效用當作一個隨機變量來看待。本文檔共270頁;當前第52頁;編輯于星期一\10點46分

4.人類行為的內在隨機性。

即使我們成功地把所有有關的變量都引進到模型中來,在個別的Y中仍不免有一些“內在”的隨機性,無論我們花了多少力氣都解釋不了的。隨機誤差項ui能很好地反映這種隨機性。

本文檔共270頁;當前第53頁;編輯于星期一\10點46分5.節(jié)省原則,我們想保持一個盡可能簡單的回歸模型。

如果我們能用兩個或三個變量就基本上解釋了Y

的行為,就沒有必要引進更多的變量。讓ui

代表所有其它變量是一種很好的選擇。本文檔共270頁;當前第54頁;編輯于星期一\10點46分在實際回歸分析中,我們無法獲得像引例中的總體數(shù)據(jù),而只能獲得對應于某些固定X的Y值的一個樣本。我們只能根據(jù)抽樣信息估計總體回歸函數(shù)。六、樣本回歸函數(shù)本文檔共270頁;當前第55頁;編輯于星期一\10點46分

我們從表4.1隨機抽取對應于固定X值的Y值的一個樣本如表4.2所示,對應于給定的每個Xi值只有一個Y值。為了對比分析,按同樣的方法再抽取另一個樣本,如表4.3所示。本文檔共270頁;當前第56頁;編輯于星期一\10點46分XY1000150020002500300035004000450050005500900132016202140248027403300352040204310表4.2總體的一個隨機樣本本文檔共270頁;當前第57頁;編輯于星期一\10點46分XY1000150020002500300035004000450050005500700132016201840242028203380342038104640表4.3總體的另一個隨機樣本本文檔共270頁;當前第58頁;編輯于星期一\10點46分將表4.2和表4.3的數(shù)據(jù)描點,得到圖4.3。在這個散點圖中畫兩根樣本回歸線以盡好地擬合這些散點。我們可以看出,兩個樣本存在著差異,這是由于抽樣的隨機性而造成的波動。

本文檔共270頁;當前第59頁;編輯于星期一\10點46分XY1000200030004000500010001500200025003000

3500

4000

4500

5000

5500×●

●×

●×

●×

●×

●×

●×

●×

×

×

S2S1×第一個樣本(表4.2)●第二個樣本(表4.3)圖4.3兩個不同樣本的回歸線本文檔共270頁;當前第60頁;編輯于星期一\10點46分S1是根據(jù)第1個樣本畫的;S2是根據(jù)第2個樣本畫的。那么,兩條樣本回歸線中哪一條代表“真實”的總體回歸線呢?在未知總體數(shù)據(jù)的情況下,我們就不可能知道哪一條代表真實的總體回歸線。本文檔共270頁;當前第61頁;編輯于星期一\10點46分圖4.3中的回歸線稱為樣本回歸線,因抽樣波動,它們都是總體回歸線的一個近似。一般地講,由幾個不同的樣本會得到幾個不同的樣本回歸線,通常這些樣本回歸線會彼此不同。本文檔共270頁;當前第62頁;編輯于星期一\10點46分據(jù)任一樣本,我們可得樣本回歸線,其函數(shù)形式為(4.5)

其中,

本文檔共270頁;當前第63頁;編輯于星期一\10點46分正如總體回歸函數(shù),樣本回歸函數(shù)也存在隨機形式。(4.6)

其中,ei為殘差項,概念上,ei類似于ui,并可把它當作ui的估計量。將ei引入樣本回歸函數(shù)中,其理由與總體回歸函數(shù)中引入ui是一樣的。本文檔共270頁;當前第64頁;編輯于星期一\10點46分回歸分析中的主要目的就是根據(jù)樣本回歸函數(shù):來估計總體回歸函數(shù)(4.7)

(4.8)

本文檔共270頁;當前第65頁;編輯于星期一\10點46分由于抽樣的波動,我們根據(jù)樣本回歸函數(shù)估計出來的總體回歸函數(shù)只能是一個近似結果。因此,怎樣構造樣本回歸函數(shù)能使盡可能接近真實的就成為回歸分析的核心。

本文檔共270頁;當前第66頁;編輯于星期一\10點46分第三節(jié)最小二乘估計

在回歸分析中有很多種構造樣本回歸函數(shù)的方法,而最廣泛使用的一種是普通最小二乘法(methodofordinaryleastsquares,簡記OLS)

本文檔共270頁;當前第67頁;編輯于星期一\10點46分一、普通最小二乘法(OLS)

普通最小二乘法是由德國數(shù)學家高斯(C.F.Gauss)最早提出和使用的。在一定的假設條件下,最小二乘估計量有著非常好的統(tǒng)計性質,從而使它成為回歸分析中最有功效和最為流行的方法之一。本文檔共270頁;當前第68頁;編輯于星期一\10點46分我們首先從最小二乘原理談起。對于一元線性回歸模型(總體)(4.9)

這是一個不可觀測的模型。因為通常得不到總體的全部觀測值,我們只能通過總體的一個樣本去推測它。即,只能通過樣本回歸模型去估計總體回歸模型。本文檔共270頁;當前第69頁;編輯于星期一\10點46分其中,是Yi

的估計值。樣本回歸模型為(4.10)

本文檔共270頁;當前第70頁;編輯于星期一\10點46分

那么,樣本回歸模型又是怎樣確定呢?將式(4.10)寫成:(4.11)

殘差ei是實際值Yi與其估計值之差。對于給定的Y和X

的n

對觀測值,我們希望樣本回歸模型的估計值盡可能地靠近觀測值Yi。本文檔共270頁;當前第71頁;編輯于星期一\10點46分為了達到此目的,我們就必須使用最小二乘準則,使:(4.12)

盡可能地小,其中,是殘差的平方。本文檔共270頁;當前第72頁;編輯于星期一\10點46分由式(4.12)可以看出:(4.13)

就是說,殘差平方和是估計量的函數(shù),對任意給定的一組數(shù)據(jù)(樣本),選擇不同的和值將得到不同的ei,從而有不同的值。本文檔共270頁;當前第73頁;編輯于星期一\10點46分

微積分知識告訴我們對和的偏導數(shù)為0時,將使最小。本文檔共270頁;當前第74頁;編輯于星期一\10點46分(4.14)

(4.15)

本文檔共270頁;當前第75頁;編輯于星期一\10點46分令得到:(4.16)

(4.17)

本文檔共270頁;當前第76頁;編輯于星期一\10點46分n是樣本容量。求解該聯(lián)立方程,可得(4.18)

(4.19)

本文檔共270頁;當前第77頁;編輯于星期一\10點46分其中,,分別為X和Y的樣本均值。

上面得到的估計量,是從最小二乘原理演算而得的。因此,稱其為最小二乘估計量。本文檔共270頁;當前第78頁;編輯于星期一\10點46分二、經典線性回歸模型如果我們的目的僅僅是估計和,那么普通最小二乘法就足夠用了。但在回歸分析中,我們的目的不僅僅是獲得,的估計值,,而是要對真實和做出推斷。

本文檔共270頁;當前第79頁;編輯于星期一\10點46分例如,我們想知道和離它們的總體真值和有多近,或者靠其期望值E(Y/Xi)有多近。本文檔共270頁;當前第80頁;編輯于星期一\10點46分

為達這一目的,我們不僅要確定模型的函數(shù)形式,還要對Yi的產生方式做出某些假定。本文檔共270頁;當前第81頁;編輯于星期一\10點46分在總體回歸模型中,,Yi依賴于Xi

和ui

。因此,除非我們明確Xi

和ui

是怎樣產生的,否則,我們將無法對Yi做出任何統(tǒng)計推斷,同時,也無法對用和推斷其真實值,的效果進行判斷。本文檔共270頁;當前第82頁;編輯于星期一\10點46分

為了回歸估計的有效解釋,對Xi變量和誤差項ui做出假設是極其重要的。本文檔共270頁;當前第83頁;編輯于星期一\10點46分假定1誤差項ui的均值為零。對于給定的X

值,隨機誤差項ui的均值或期望值為零,即ui的條件均值為零,記為E(ui/Xi)=0

(4.20)

本文檔共270頁;當前第84頁;編輯于星期一\10點46分

這一假定的實際意義為:凡是模型中不顯含的并因而歸屬于ui的因素,對Y

的均值都沒有系統(tǒng)的影響,正的ui

值抵消了負的ui

值,它們對Y

的平均影響為零。本文檔共270頁;當前第85頁;編輯于星期一\10點46分假定2同方差性或ui的方差相等。對所有給定的Xi,ui的方差都是相同的。就是說,ui

的條件方差是恒定的,即:本文檔共270頁;當前第86頁;編輯于星期一\10點46分該假定表示對應于不同Xi

值,ui的方差都是某個等于的正的常數(shù)。其中,Var表示方差。

(4.21)

本文檔共270頁;當前第87頁;編輯于星期一\10點46分假定3

各個誤差項之間無自相關,ui和uj(i≠j)之間的相關為零。本文檔共270頁;當前第88頁;編輯于星期一\10點46分(4.22)

其中,i和j為兩次不同的觀測,而Cov表示協(xié)方差,該假定還可以稱為無序列相關或無自相關假定。本文檔共270頁;當前第89頁;編輯于星期一\10點46分假定4

ui和Xi的協(xié)方差為零或E(uiXi)=0

本文檔共270頁;當前第90頁;編輯于星期一\10點46分該假定表示誤差項u

和解釋變量X

是不相關的。也就是說在總體回歸模型中,X

和u

對Y

有各自的影響。但是,如果X

和u

是相關的,就不可能評估他們各自對Y

的影響。本文檔共270頁;當前第91頁;編輯于星期一\10點46分假定5正確地設定了回歸模型,即在經驗分析中所用的模型沒有設定偏誤。

本文檔共270頁;當前第92頁;編輯于星期一\10點46分正確設定回歸模型是至關重要的。如果模型遺漏了重要變量或選擇了錯誤的函數(shù)形式,那么,要對所估計的回歸模型做出有效的解釋是靠不住的?;貧w分析以及由此而得到的結果,是以所選模型為條件的。因此,在建立經濟計量模型時,必須謹慎而小心。本文檔共270頁;當前第93頁;編輯于星期一\10點46分假定6對于多元線性回歸模型,沒有完全的多重共線性。就是說解釋變量之間沒有完全的線性關系。本文檔共270頁;當前第94頁;編輯于星期一\10點46分

至此,我們完成了關于經典線性回歸模型的基本假定的討論。上述所有假定都是針對總體回歸模型而言的,而不是關于樣本回歸模型的。

本文檔共270頁;當前第95頁;編輯于星期一\10點46分三、最小二乘估計量的性質高斯—馬爾可夫定理

在經典線性回歸模型的假定條件下,最小二乘估計量具有較好的統(tǒng)計性質,這些性質包含在高斯—馬爾可夫定理之中。

本文檔共270頁;當前第96頁;編輯于星期一\10點46分

高斯—馬爾可夫定理:在給定經典線性回歸模型的假定下,最小二乘估計量是最佳線性無偏估計量。本文檔共270頁;當前第97頁;編輯于星期一\10點46分該定理說明最小二乘估計量是的最佳線性無偏估計量。即:第一,它是線性的,即它是回歸模型中的被解釋變量Y

的線性函數(shù)。本文檔共270頁;當前第98頁;編輯于星期一\10點46分第二,它是無偏的,即它的均值或期望值等于其真值,即。本文檔共270頁;當前第99頁;編輯于星期一\10點46分第三,它在所有這樣的線性無偏估計量中具有最小方差。具有最小方差的無偏估計量叫做有效估計量。

本文檔共270頁;當前第100頁;編輯于星期一\10點46分

下面,就普通最小二乘估計量的性質給予說明。本文檔共270頁;當前第101頁;編輯于星期一\10點46分1線性性

(4.23)

本文檔共270頁;當前第102頁;編輯于星期一\10點46分(4.24)

(4.25)令則本文檔共270頁;當前第103頁;編輯于星期一\10點46分這說明是Yi的一個線性函數(shù),它是以ki為權的一個加權平均數(shù),從而它是一個線性估計量。同理,也是一個線性估計量。本文檔共270頁;當前第104頁;編輯于星期一\10點46分2無偏性,,即是無偏的,是無偏的。就是說,雖然由不同的樣本得到的可能大于或小于它們的真實值,但平均起來等于它們的真實值。本文檔共270頁;當前第105頁;編輯于星期一\10點46分由式(4.25)可知:(4.26)

因為,則(4.27)

本文檔共270頁;當前第106頁;編輯于星期一\10點46分據(jù)經典假定,ki非隨機,E(ui)=0,則

(4.28)

因此,的一個無偏估計量。同理,可證明的一個無偏估計量。本文檔共270頁;當前第107頁;編輯于星期一\10點46分

在此要特別注意,無偏性是的抽樣分布的性質,并沒有告訴我們從特定樣本中得到的估計值是什么,我們希望得到較好的樣本,那樣就會得到接近于總體參數(shù)的估計值。但由于是隨機獲得樣本,就有可能得到遠離總體參數(shù)的估計值的較差樣本。并且,我們無法判定所得到的樣本是哪一種。

本文檔共270頁;當前第108頁;編輯于星期一\10點46分

當X

是非隨機變量、E(u)=0

這些經典假定不滿足時,那么無偏性也就不成立了。本文檔共270頁;當前第109頁;編輯于星期一\10點46分3方差最小

(1)最小二乘估計的方差與標準誤普通最小二乘估計量的方差 代表了估計參數(shù)的估計精度。本文檔共270頁;當前第110頁;編輯于星期一\10點46分[據(jù)式(4.27)]據(jù)方差定義,可知:(4.29)

本文檔共270頁;當前第111頁;編輯于星期一\10點46分據(jù)經典假定,且E(uiuj)=0,i≠j故(4.30)

本文檔共270頁;當前第112頁;編輯于星期一\10點46分式(4.30)是依賴于同方差和無序列相關假定的。同理,的方差為:(4.31)

本文檔共270頁;當前第113頁;編輯于星期一\10點46分影響估計精度的因素為隨機誤差項的方差和Xi的總變異。本文檔共270頁;當前第114頁;編輯于星期一\10點46分隨機誤差項的方差越大, 越大。因為,影響Y的不可觀測的因素變異越大,要準確地估計就越難。本文檔共270頁;當前第115頁;編輯于星期一\10點46分另一方面,自變量的變異越大,估計的精度就越高。因為Xi

的變異性增時,的方差就會減小,就是說,解釋變量的樣本分布越分散,就越容易找出E(Y/Xi)

和Xi

間的關系,即越容易準確估計。本文檔共270頁;當前第116頁;編輯于星期一\10點46分如果Xi沒有什么變化,就難以準確地確定E(Y/Xi)是如何隨著Xi

的變化而變化的。當樣本容量擴大時,Xi

的總變異也增加。因此,較大的樣本容量會產生較小的的方差。本文檔共270頁;當前第117頁;編輯于星期一\10點46分最小二乘估計的標準誤為(4.32)

(4.33)本文檔共270頁;當前第118頁;編輯于星期一\10點46分式中,表示的標準誤,表示的標準誤。除外,上述方程中的數(shù)據(jù)都是已知的。本文檔共270頁;當前第119頁;編輯于星期一\10點46分(2)的最小二乘估計量從式(4.30)、式(4.31)可以看到,影響 和的因素除外,均為已知數(shù)。通常誤差項的方差是未知的,只能通過觀測數(shù)據(jù)去估計,從而估計出和。本文檔共270頁;當前第120頁;編輯于星期一\10點46分

我們要區(qū)分誤差與殘差的概念。誤差ui出現(xiàn)在總體回歸模型中,ui

是第i次觀測的誤差,由于未知,ui無法觀測到。殘差ei出現(xiàn)在樣本回歸模型m中, 是估計參數(shù),通過觀測值Yi,Xi可得到殘差ei。

本文檔共270頁;當前第121頁;編輯于星期一\10點46分已知。由于ui不可觀,無法計算。我們可通過最小二乘法的殘差ei估計。用殘差ei代替ui就得到的一個估計量,但這是一個有偏估計量。本文檔共270頁;當前第122頁;編輯于星期一\10點46分這是使用殘差代替誤差的緣故,調整自由度后,我們就得到的無偏估計量(4.35)

本文檔共270頁;當前第123頁;編輯于星期一\10點46分

在經典假定條件下,可以證明。 的估計量為(4.36)

我們稱其為回歸的標準誤。估計量是對影響Y的不可觀測因素的標準誤的估計。就是說,它估計了把X的影響排除之后Y的標準誤。本文檔共270頁;當前第124頁;編輯于星期一\10點46分至此,用代替,我們可利用式(4.32)、(4.33)估計的標準誤。(4.37)(4.38)本文檔共270頁;當前第125頁;編輯于星期一\10點46分當對Y

的不同樣本使用普通最小二乘法時,我們要注意將看作一個隨機變量,這是因為是隨著樣本的不同而變化的。對于一個給定的樣本,是一個數(shù)字,就像我們用給定的數(shù)據(jù)計算時一樣,它也只是一個數(shù)字。

本文檔共270頁;當前第126頁;編輯于星期一\10點46分(3)可以證明,在滿足經典假定條件下,普通最小二乘估計量是所有線性無偏估計量中方差最小的。本文檔共270頁;當前第127頁;編輯于星期一\10點46分四、判定系數(shù)R2—擬合優(yōu)度的度量

為了評價一個回歸方程的優(yōu)劣,我們引入擬合優(yōu)度的概念。即考查對一組數(shù)據(jù)所擬合的回歸線的擬合優(yōu)度,表示出樣本回歸線對數(shù)據(jù)擬合的有多么好。本文檔共270頁;當前第128頁;編輯于星期一\10點46分如果全部觀測點都落在樣本回歸線上,我們就得到一個完美的擬合,但這種情況很少發(fā)生。一般情況下,總有一些正的ei和一些負的ei

,我們只能希望這些圍繞著回歸線的殘差盡可能小。判定系數(shù)R2

就是表示這種擬合優(yōu)劣的一個度量。本文檔共270頁;當前第129頁;編輯于星期一\10點46分計算R2的步驟如下?lián)颖净貧w模型可得:(4.39)

(4.40)

為被解釋變量的樣本均值。本文檔共270頁;當前第130頁;編輯于星期一\10點46分式(4.39)可表示為(4.41)本文檔共270頁;當前第131頁;編輯于星期一\10點46分式(4.41)兩邊取平方得(4.42)

對所有觀測值求和,得(4.43)本文檔共270頁;當前第132頁;編輯于星期一\10點46分其中,,因此(4.44)本文檔共270頁;當前第133頁;編輯于星期一\10點46分式(4.44)中,表示實測的Y值圍繞其均值的總變異,稱為總平方和(TSS)。為來自解釋變量的回歸平方和,稱為解釋平方和(ESS)。是圍繞回歸線的Y值的變異,稱為殘差平方和(RSS)。

本文檔共270頁;當前第134頁;編輯于星期一\10點46分式(4.44)可表示為TSS=ESS+RSS(4.45)這說明Y的觀測值圍繞其均值的總變異可分解為兩部分,一部分來自回歸線,而另一部分則來自擾動項ui。從幾何意義上可畫出圖4.4。本文檔共270頁;當前第135頁;編輯于星期一\10點46分YXXiYi圖4.4Yi的變異分解為兩個部分

本文檔共270頁;當前第136頁;編輯于星期一\10點46分用TSS除式(4.45)的兩邊,得(4.46)

本文檔共270頁;當前第137頁;編輯于星期一\10點46分定義R2為:(4.47)(4.48)

或本文檔共270頁;當前第138頁;編輯于星期一\10點46分上述定義的R2稱為判定系數(shù),它是對回歸線擬合優(yōu)度的度量。就是說,R2測度了在Y的總變異中由回歸模型解釋的那個部分所占的比例或百分比。本文檔共270頁;當前第139頁;編輯于星期一\10點46分

據(jù)判定系數(shù)的定義可知:0≤R2≤1。等于1的R2意味著一個完美的擬合,即對每個i都有 。另一方面,等于0的R2意味著被解釋變量與解釋變量之間無任何關系(即),這時,,就是說,對任一Y值的最優(yōu)預測值都是它的均值,從而回歸線平行于X

軸。本文檔共270頁;當前第140頁;編輯于星期一\10點46分

與R2關系緊密但概念上與R2差異較大的一個參數(shù)是相關系數(shù),它測度了兩個變量之間的關聯(lián)度。也可據(jù)R

的定義計算(4.49)

本文檔共270頁;當前第141頁;編輯于星期一\10點46分從定義可以看出-1≤R≤1

。在回歸分析中,R2是一個比R更有意義的度量,因為R2告訴我們在被解釋變量的變異中,由解釋變量解釋的部分占怎樣一個比例,因而對一個變量的變異在多大程度上決定另一個變量的變異,提供了一個總的度量,而R則沒有這種作用。本文檔共270頁;當前第142頁;編輯于星期一\10點46分五、案例【例4.1】

根據(jù)凱恩斯理論,我們可建立消費與可支配收入的線性回歸模型,模型形式如下(4.50)

其中,Y=消費,X=可支配收入,u=隨機誤差項。本文檔共270頁;當前第143頁;編輯于星期一\10點46分XYXY1000150020002500300090013201620214024803500400045005000550027403300352040204310表4.4每月家庭消費支出Y

和每月家庭收入X本文檔共270頁;當前第144頁;編輯于星期一\10點46分調用回歸分析軟件EViews3.1進行最小二乘估計可得:本文檔共270頁;當前第145頁;編輯于星期一\10點46分DependentVariable:YMethod:LeastSquaresDate:12/25/04Time:01:40Sample:110Includedobservations:10VariableCoefficientStd.Errort-StatisticProb.CX159.878852.918443.0212300.01650.7615760.01489351.135410.0000R-squared0.996950Meandependentvar2635.000AdjustedR-squared0.996569S.D.dependentvar1154.655S.E.ofregression67.63763Akaikeinfocriterion11.44306Sumsquaredresid36598.79Schwarzcriterion11.50358Loglikelihood-55.21531F-statistic2614.830Durbin-Watsonstat3.391406Prob(F-statistic)0.000000EViews報告結果為本文檔共270頁;當前第146頁;編輯于星期一\10點46分159.87881Y圖4.5樣本回歸線

X本文檔共270頁;當前第147頁;編輯于星期一\10點46分樣本回歸線定義:回歸線上的點是給定X值相對應的Yi的期望值或均值的一個估計值。得到的樣本回歸線為:本文檔共270頁;當前第148頁;編輯于星期一\10點46分回歸線的斜率 表示,在X的樣本區(qū)間(1000,5500)內X每增加1元,平均每月消費支出增加0.7616元。本文檔共270頁;當前第149頁;編輯于星期一\10點46分

回歸線的截距為159.8788,直觀解釋是當每月收入X值為零時,每月消費支出的平均水平,但這種解釋是不恰當?shù)摹R驗閄值的變化范圍并不包括零這樣一個觀測值。截距項的解釋只能借助于經濟理論或其它知識來解釋。通??衫斫鉃槭撬形窗ㄔ诨貧w模型的變量對Y的綜合影響。本文檔共270頁;當前第150頁;編輯于星期一\10點46分

R2=0.9970,說明有99.70%的每月消費支出的變異,可以由收入來解釋。本文檔共270頁;當前第151頁;編輯于星期一\10點46分【例4.2】

中國城鎮(zhèn)居民消費函數(shù)(1985~2003年)

本文檔共270頁;當前第152頁;編輯于星期一\10點46分年份人均可支配收入人均消費支出年份人均可支配收入人均消費支出1985198619871988198919901991199219931994739.10840.71861.05841.08842.24912.92978.231073.281175.691275.67673.20746.70759.84785.98741.41773.10836.26885.33962.851040.371995199619971998199920002001200220031337.941389.351437.051519.931661.611768.311918.232175.792370.061105.091125.371165.611213.571310.211407.331484.621703.281821.46表4.5中國城鎮(zhèn)居民家庭人均收入與支出單位:元

本文檔共270頁;當前第153頁;編輯于星期一\10點46分EViews報告結果為:DependentVariable:YMethod:LeastSquaresDate:12/25/04Time:02:32Sample:19852003Includedobservations:19VariableCoefficientStd.Errort-StatisticProb.C149.205910.8588713.740470.0000X0.7049330.00774291.052450.0000R-squared0.997954Meandependentvar1081.136AdjustedR-squared0.997833S.D.dependentvar339.6804S.E.ofregression15.81140Akaikeinfocriterion8.458640Sumsquaredresid4250.005Schwarzcriterion8.558054Loglikelihood-78.35708F-statistic8290.549Durbin-Watsonstat2.016588Prob(F-statistic)0.000000本文檔共270頁;當前第154頁;編輯于星期一\10點46分據(jù)表4.5的數(shù)據(jù),使用普通最小二乘法,得到中國城鎮(zhèn)居民消費函數(shù)。R2=0.9980

模型中,Yt=城鎮(zhèn)居民人均消費性支出,Xt=城鎮(zhèn)居民人均可支配收入。本文檔共270頁;當前第155頁;編輯于星期一\10點46分模型表明,在1985~2003年期間,中國城鎮(zhèn)居民可支配收入每增加1元,平均消費支出增加0.70元,邊際消費傾向為0.70。本文檔共270頁;當前第156頁;編輯于星期一\10點46分

截距項,從表面上看是當居民可支配收入為0時的消費支出水平,但這是一種毫無意義的解釋。因為在樣本中,并不存在居民可支配收入為0的樣本。本文檔共270頁;當前第157頁;編輯于星期一\10點46分

判定系數(shù)R2=0.9980。說明城鎮(zhèn)居民可支配收入解釋了城鎮(zhèn)居民消費支出變異的99.80%,這是一個非常好的擬合。本文檔共270頁;當前第158頁;編輯于星期一\10點46分第四節(jié)置信區(qū)間與假設檢驗一、置信區(qū)間的基本概念

例4.1消費模型中,邊際消費傾向的估計值為0.7616,這是對未知的總體邊際消費傾向的一個點估計。由于是點估計,我們無法判斷這種估計的可靠性有多大。我們只能保證在重復抽樣中估計值的均值等于其真值。本文檔共270頁;當前第159頁;編輯于星期一\10點46分為了衡量這一估計的可靠性,我們可圍繞點估計量構造一個區(qū)間。要判斷對估計的可靠性,可設定區(qū)間,使其包含的概率為。即:(4.51)本文檔共270頁;當前第160頁;編輯于星期一\10點46分其中,,。如果存在這樣一個區(qū)間,就稱設定的區(qū)間為的置信區(qū)間。 稱為置信系數(shù)或置信水平,而稱為顯著性水平,稱為置信上限,稱為置信下限。本文檔共270頁;當前第161頁;編輯于星期一\10點46分如果或5%,則式(4.51)的意義即為隨機區(qū)間包含真實的概率為0.95或95%??梢钥闯?,置信區(qū)間給出了對估計的可靠程度。為了正確理解式(4.51),說明如下:本文檔共270頁;當前第162頁;編輯于星期一\10點46分1.式(4.51)并不是說落入該界限內的概率是。因為雖然未知,但它是總體回歸函數(shù)中的邊際消費傾向,是個定數(shù),要么落在該區(qū)間內,要么落在該區(qū)間外。式(4.51)的意義為:用隨機樣本估計參數(shù)構造的區(qū)間包含的概率為。本文檔共270頁;當前第163頁;編輯于星期一\10點46分

2.式(4.51)中的區(qū)間是一個隨機區(qū)間,它隨著樣本的不同而不同。本文檔共270頁;當前第164頁;編輯于星期一\10點46分

3.式(4.51)的意義為,對于多次抽樣,平均地說,這些區(qū)間有包含真實參數(shù)。本文檔共270頁;當前第165頁;編輯于星期一\10點46分4.式(4.51)中,當是一個隨機變量時,代表多種可能結果。如果選定了一個樣本,就獲得的一個結果值,式(4.51)的區(qū)間就不再是隨機區(qū)間,而是特定區(qū)間。本文檔共270頁;當前第166頁;編輯于星期一\10點46分此時,我們就不能說這個給定的區(qū)間包含真實參數(shù)的概率是 。此時,要么在該區(qū)間內,要么在該區(qū)間外,概率只能是1或0。如果我們得到了的95%置信區(qū)間為,就不能說這個區(qū)間包含真實值的概率是95%。這個概率不是1就是0。本文檔共270頁;當前第167頁;編輯于星期一\10點46分二、ui正態(tài)性假定及普通最小二乘估計量 ,和的性質

(一)ui正態(tài)性假定

在回歸分析中,我們的目的不僅僅是得到,而是要用推斷。因此,我們需要得到的置信區(qū)間,通過置信區(qū)間去判斷這種推斷的可靠性。本文檔共270頁;當前第168頁;編輯于星期一\10點46分在最小二乘估計式中,是Yi

的線性函數(shù),從而也就是ui的線性函數(shù)。要推斷的置信區(qū)間,我們就必須獲得ui

的概率分布。在回歸分析中,人們常常假定ui

服從正態(tài)分布,即每個ui

都是正態(tài)分布的。本文檔共270頁;當前第169頁;編輯于星期一\10點46分期望值:

E(ui)=0

(4.52)

方差:

(4.53)

協(xié)方差:(4.54)

本文檔共270頁;當前第170頁;編輯于星期一\10點46分用符號表示,則為(4.55)

其中,~表示“其分布為”,N表示“正態(tài)分布”,括號中的數(shù)字為正態(tài)分布的兩個參數(shù):期望值與方差。本文檔共270頁;當前第171頁;編輯于星期一\10點46分正態(tài)假定理由如下:1.ui代表回歸模型中未包含的變量的集合。這些未引入的變量的影響是微弱的和隨機的。根據(jù)中心極限定理,如果存在大量獨立且同分布的隨機變量,隨著這些變量個數(shù)的增大,它們的總和將趨向正態(tài)分布。

本文檔共270頁;當前第172頁;編輯于星期一\10點46分

2.即使變量個數(shù)不是很大或這些變量不是嚴格獨立的,它們的總和仍可視同正態(tài)分布。本文檔共270頁;當前第173頁;編輯于星期一\10點46分(二)ui正態(tài)假定下普通最小二乘估計量,和的性質1.它們是無偏的。2.它們有最小方差。3.它們是一致估計量。就是說,隨著樣本容量無限地增大,估計量將收斂到它們的真值。本文檔共270頁;當前第174頁;編輯于星期一\10點46分4.服從正態(tài)分布

期望值:方差

:(4.56)

(4.57)

即:(4.58)

本文檔共270頁;當前第175頁;編輯于星期一\10點46分5.服從正態(tài)分布期望值:

方差

:(4.59)(4.60)即:(4.61)本文檔共270頁;當前第176頁;編輯于星期一\10點46分6.服從χ2(n-2)分布。

7.

Yi服從正態(tài)分布期望值:

方差:

即:(4.62)(4.63)(4.64)本文檔共270頁;當前第177頁;編輯于星期一\10點46分三、回歸系數(shù)和的置信區(qū)間

在ui正態(tài)假定下,和均服從正態(tài)分布,將轉化為標準正態(tài)分布,則為:(4.65)本文檔共270頁;當前第178頁;編輯于星期一\10點46分Z為期望值為0、方差為1的標準正態(tài)分布,即:Z~N(0,1)

(4.66)本文檔共270頁;當前第179頁;編輯于星期一\10點46分

當已知時,我們就可得到β2的置信度為(1-α)的置信區(qū)間為本文檔共270頁;當前第180頁;編輯于星期一\10點46分但是,由于ui的不可觀測,我們無法獲知。我們只能用的無偏估計量來測定,如果我們用代替,則式(4.65)可寫為本文檔共270頁;當前第181頁;編輯于星期一\10點46分(4.67)

本文檔共270頁;當前第182頁;編輯于星期一\10點46分

可以證明,這樣定義的t變量服從自由度為n-2的t分布,據(jù)t分布可得

(4.68)

式(4.68)中,是顯著性水平為,自由度為n-2的t分布的t值,通常稱為顯著水平的臨界值。本文檔共270頁;當前第183頁;編輯于星期一\10點46分(4.69)

(4.70)

將式(4.67)代入式(4.68)得本文檔共270頁;當前第184頁;編輯于星期一\10點46分

式(4.70)給出了的一個100%(1-)置信區(qū)間。同理我們可得到的置信區(qū)間:(4.71)

本文檔共270頁;當前第185頁;編輯于星期一\10點46分從式(4.70)、(4.71)可以看出,,的置信區(qū)間的寬度與估計量,的標準誤 成正比例。標準誤越大,置信區(qū)間越寬。就是說,估計量的標準誤越大,對未知參數(shù)的真值進行估計的可靠性越差。因此,估計量的標準誤也被用于測度估計量的精度,就是說用估計量去測定真實的總體值有多精確。本文檔共270頁;當前第186頁;編輯于星期一\10點46分例如,在我們的引例中,上一節(jié)中我們得到斜率系數(shù)的估計值,,自由度為8,當顯著性水平為5%,即置信系數(shù)為95%時,查t分布表可知,,則的95%置信區(qū)間為0.7272≤≤0.7960

(4.72)本文檔共270頁;當前第187頁;編輯于星期一\10點46分

式(4.72)的意義為:給定置信系數(shù)為95%,從長遠看,類似于(0.7272,0.7960)的區(qū)間,100個區(qū)間中,將有95個包含著真實的值。

本文檔共270頁;當前第188頁;編輯于星期一\10點46分

我們不能說這個固定的區(qū)間有95%的概率包含真實的值,因為這個區(qū)間是固定不變的,要么在該區(qū)間內,要么在該區(qū)間外。這個固定的區(qū)間包含的概率要么為1,要么為0。

本文檔共270頁;當前第189頁;編輯于星期一\10點46分同理,我們可構建的置信區(qū)間為37.8500≤≤281.9080(4.73)

式(4.73)表示,從長遠看,該區(qū)間100個中將有95個包含真實的;但這個固定的區(qū)間包含真實的的概率是1或0。本文檔共270頁;當前第190頁;編輯于星期一\10點46分四、假設檢驗

1檢驗回歸系數(shù)的顯著性——t檢驗

統(tǒng)計假設檢驗的中心思想就是判斷某一特定觀測或發(fā)現(xiàn)是否與某一聲稱的假設相符。如果相符就不拒絕這一假設,如不相符就拒絕這一假設。本文檔共270頁;當前第191頁;編輯于星期一\10點46分例如,在引例的回歸分析中,如果事先我們已有一些研究成果認定邊際消費傾向為0.90,那么=0.90就是我們所說的聲稱的假設。本文檔共270頁;當前第192頁;編輯于星期一\10點46分如果我們的觀測(估計)結果在一定的統(tǒng)計原則下與0.90并不矛盾,我們就接受假設,即邊際消費傾向的真值為0.90。如果 與在一定的統(tǒng)計原則下相互矛盾,我們就拒絕假設,即邊際消費傾向的真實值不是0.90。本文檔共270頁;當前第193頁;編輯于星期一\10點46分

我們稱這一聲稱的假設為虛擬假設或原假設,用符號H0表示,與之相對應就稱為備擇假設,用符號H1表示。本文檔共270頁;當前第194頁;編輯于星期一\10點46分一般地,可假設為原假設H0:

備擇假設H1:

本文檔共270頁;當前第195頁;編輯于星期一\10點46分已知:(4.74)即t服從自由度為n-2的t分布。如原假設成立,即,則

:(4.75)

本文檔共270頁;當前第196頁;編輯于星期一\10點46分該t值是一個統(tǒng)計量,服從t分布,據(jù)此可得到t統(tǒng)計量的置信區(qū)間(4.76)本文檔共270頁;當前第197頁;編輯于星期一\10點46分

式(4.76)建立的100()%置信區(qū)間為原假設H0:的接受域,置信區(qū)間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論