第二章簡(jiǎn)單線性回歸課件_第1頁(yè)
第二章簡(jiǎn)單線性回歸課件_第2頁(yè)
第二章簡(jiǎn)單線性回歸課件_第3頁(yè)
第二章簡(jiǎn)單線性回歸課件_第4頁(yè)
第二章簡(jiǎn)單線性回歸課件_第5頁(yè)
已閱讀5頁(yè),還剩110頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 簡(jiǎn)單線性回歸模型本章主要介紹:回歸分析和回歸方程簡(jiǎn)單線性回歸模型的最小二乘估計(jì)回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)擬合優(yōu)度的度量回歸預(yù)測(cè) 何謂簡(jiǎn)單線性回歸模型只有兩個(gè)變量的線性回歸模型,稱為簡(jiǎn)單線性回歸模型,也叫做雙變量模型,或者一元線性回歸模型。模型形式為:第一節(jié) 回歸分析和回歸方程本節(jié)主要介紹:1.1 經(jīng)濟(jì)變量之間的關(guān)系。1.2 相關(guān)關(guān)系:分類、度量。1.3 回歸分析:概念、回歸線、回歸函數(shù)1.4 總體回歸函數(shù)1.5 隨機(jī)擾動(dòng)項(xiàng)1.6 樣本回歸函數(shù)1.1 經(jīng)濟(jì)變量之間的關(guān)系確定的函數(shù)關(guān)系:yf(x)不確定性的統(tǒng)計(jì)關(guān)系相關(guān)關(guān)系 yf(x)u (u為隨機(jī)變量)沒(méi)有關(guān)系 變量間的函數(shù)關(guān)系和相關(guān)關(guān)

2、系在一定條件下可以互相轉(zhuǎn)化。1.2 相關(guān)關(guān)系1.2.1 分類: 只有兩個(gè)變量:簡(jiǎn)單相關(guān);三個(gè)及三個(gè)以上:多重相關(guān)(復(fù)相關(guān)); 線性相關(guān)、非線性相關(guān); 正相關(guān)、負(fù)相關(guān)、不相關(guān)正相關(guān)(我國(guó)人均消費(fèi)函數(shù))Y為我國(guó)人均消費(fèi)X為我國(guó)人均國(guó)民收入相關(guān)系數(shù):0.982004006008001000120005001000150020002500YX負(fù)相關(guān)Y與X的相關(guān)系數(shù): -0.9220304050607080010203040YX不相關(guān)(不排除存在曲線相關(guān))相關(guān)系數(shù)為:4.24E-18-60-40-200204060-60-40-200204060YX1.2.2 線性相關(guān)程度的度量 線性相關(guān)系數(shù)總體相關(guān)系

3、數(shù):樣本相關(guān)系數(shù):使用相關(guān)系數(shù)要注意:簡(jiǎn)單線性相關(guān)包含了其他變量的影響。X,Y都是隨機(jī)變量,相關(guān)系數(shù)只說(shuō)明其線性相關(guān)程度,不說(shuō)明其非線性關(guān)系,也不反映他們之間的因果關(guān)系;樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)量;相關(guān)系數(shù)具有對(duì)稱性,即 ;相關(guān)系數(shù)取值區(qū)間-1,1。1.3 回歸分析和相關(guān)分析1.3.1 回歸分析是對(duì)一個(gè)應(yīng)變量對(duì)若干解釋變量依存關(guān)系的研究;其目的是:由固定的解釋變量去估計(jì)和預(yù)測(cè)應(yīng)變量的平均值等。1.3.2 回歸函數(shù)、回歸線應(yīng)變量Y的條件期望 隨著解釋變量X的變化而有規(guī)律地變化。把這種變化關(guān)系用函數(shù)表示出來(lái),就是回歸函數(shù):回歸函數(shù)在坐標(biāo)系中用圖形表示出來(lái)就是回歸線。它表示了應(yīng)變量和解釋

4、變量之間的平均關(guān)系?;貧w線圖示YX概率密度函數(shù)f(Yi)PRFx1xiXk注意:一般地,在重復(fù)抽樣中解釋變量被假定為固定的。所以回歸分析中,解釋變量一般當(dāng)作非隨機(jī)變量處理。 由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。 例2.1:一個(gè)假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。 即如果知道了家庭的月收入,能否預(yù)測(cè)該社區(qū)家庭的平均月消費(fèi)支出水平。1.4 總體回歸函數(shù) 為達(dá)到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的1

5、0組,以分析每一收入組的家庭消費(fèi)支出。 (1)由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不完全相同; (2)但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditional distribution)是已知的, 如: P(Y=561|X=800)=1/4。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditional mean)或條件期望(conditional expectation): E(Y|X=Xi)該例中:E(Y | X=800)=561分析: 描出散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說(shuō)”也在增加

6、,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元) 概念: 在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(population regression line),或更一般地稱為總體回歸曲線(population regression curve)。稱為(雙變量)總體回歸函數(shù)(population regression function, PRF)。 相應(yīng)的函數(shù): 回歸函數(shù)(PRF)說(shuō)明被解釋變量Y的平均

7、狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。含義: 函數(shù)形式: 可以是線性或非線性的。 例2.1中,將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí): 為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regression coefficients)。 。1.4.2 總體回歸函數(shù)的表現(xiàn)形式條件均值形式,如隨機(jī)設(shè)定形式。 對(duì)于一定的 ,Y的各個(gè)個(gè)別值 分布在 的周圍,其差令為 ,則: 對(duì)上例,有 也即:1.5 隨機(jī)擾動(dòng)項(xiàng)1、引入隨機(jī)擾動(dòng)項(xiàng)的目的2、隨機(jī)擾動(dòng)項(xiàng)代表模型中省略了的所有次要因素的綜合作用3、根據(jù)中心極限定理隨機(jī)擾動(dòng)項(xiàng)服從正態(tài)分布4、通常模型由隨機(jī)方程組成5、隨機(jī)擾動(dòng)項(xiàng)產(chǎn)生的原因?yàn)槭裁匆?/p>

8、入隨機(jī)擾動(dòng)項(xiàng)模型中引入反映不確定因素影響的隨機(jī)擾動(dòng)項(xiàng)的目的在于使模型更符合客觀經(jīng)濟(jì)活動(dòng)實(shí)際。干擾項(xiàng)是從模型中省略下來(lái)而又集體地影響著Y地全部變量地替代物簡(jiǎn)單線性需求函數(shù)不可能包羅萬(wàn)象地引入全部影響變量我們以最簡(jiǎn)單的線性需求函數(shù)為例進(jìn)行分析。Qd=b0+b1X1理論分析和實(shí)踐經(jīng)驗(yàn)表明,某種商品需求量不僅趨近于價(jià)格,而且趨近于替代商品的價(jià)格X2,消費(fèi)者收入X3和消費(fèi)者偏好X4等等。將所有對(duì)需求量有影響的個(gè)變量引入方程:Qd=b0+b1X1+b2X2+b3X3+b4X4+bkXk即使如此也還可能有其他次要因素影響需求量,譬如社會(huì)風(fēng)尚,心理變化甚至天氣等等。總之,不可能巨細(xì)無(wú)遺地全部都引入。次要因素的

9、綜合效應(yīng)是不能忽視的未引入的這些隨機(jī)變量有的可以度量,有些不可以度量,在實(shí)際觀測(cè)中,有時(shí)發(fā)生影響有時(shí)又不發(fā)生影響,記為隨機(jī)變量Zi(i=1,2,m)。從個(gè)別意義上,這些次要因素可能是不重要的,但所有這些的綜合效應(yīng)是不能忽視的。否則,模型將與實(shí)際不符。于是將它們也引入模型。必須另外尋找解決問(wèn)題的思路全部變量引入顯然是不必要的。計(jì)量經(jīng)濟(jì)學(xué)將這些或者次要,或者偶然的,或者不可測(cè)度的變量用一個(gè)隨機(jī)擾動(dòng)項(xiàng)來(lái)概括,需求函數(shù):這是一個(gè)隨機(jī)方程。是隨機(jī)變量Zj的線性組合,也是一個(gè)隨機(jī)變量。它代表所有未列入模型的那些次要因素的綜合影響。由中心極限定理服從正態(tài)分布 進(jìn)一步分析相當(dāng)于諸隨機(jī)變量Zj的均值因此,由中心

10、極限定理,無(wú)論Zj原來(lái)的分布形式如何,只要它們相互獨(dú)立,m足夠大,就會(huì)有趨于正態(tài)分布。而且正態(tài)分布簡(jiǎn)單易用,且數(shù)理統(tǒng)計(jì)學(xué)中研究的成果很多,可以借鑒。隨機(jī)擾動(dòng)項(xiàng)產(chǎn)生的原因(1)人類行為和客觀現(xiàn)象的隨機(jī)性。引入的根本原因,乃是經(jīng)濟(jì)活動(dòng)是人類參與的,而人類行為的內(nèi)在隨機(jī)性決定了不可能像科學(xué)實(shí)驗(yàn)?zāi)菢泳_。此外還有社會(huì)環(huán)境和自然環(huán)境的隨機(jī)性。(2)模型省略了變量。被省略的變量包含在隨機(jī)擾動(dòng)項(xiàng)中。核心變量與周邊變量(3)測(cè)量與歸并誤差。測(cè)量誤差致使觀察值不等于實(shí)際值,匯總也存在誤差。(4)數(shù)學(xué)模型形式設(shè)定造成的誤差。比如由于認(rèn)識(shí)不足或者簡(jiǎn)化,將非線性設(shè)定成線性模型。(5)數(shù)據(jù)的欠缺(6)糟糕的替代變量(7

11、)理論的含糊性隨機(jī)擾動(dòng)項(xiàng)產(chǎn)生的原因1.6 樣本回歸函數(shù)(SRF) 問(wèn)題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息? 問(wèn):能否從該樣本估計(jì)總體回歸函數(shù)PRF?回答:能 例2.2:在例2.1的總體中有如下一個(gè)樣本, 總體的信息往往無(wú)法掌握,現(xiàn)實(shí)的情況只能是在一次觀測(cè)中得到總體的一個(gè)樣本。核樣本的散點(diǎn)圖(scatter diagram): 樣本散點(diǎn)圖近似于一條直線,畫(huà)一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sample regression lines)。 記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sa

12、mple regression function,SRF)。 這里將樣本回歸線看成總體回歸線的近似替代則 注意: 樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式: 由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型(sample regression model)。 回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。注意:這里PRF可能永遠(yuǎn)無(wú)法知道。即,根據(jù) 估計(jì)1.6.2 對(duì)樣本回歸函數(shù)的說(shuō)明每次抽樣都能夠獲得一個(gè)樣本,就可以擬合一條樣本回歸線,所以樣本回歸線隨抽樣波動(dòng)而變化,可以有多條。樣本回歸線不是總體回歸線,只是未知總體回歸

13、線的近似。SRF1SRF2XY1.6.3 殘差定義: 那么有:對(duì)上例,有:回歸分析的思路 樣本 樣本回歸函數(shù)的參數(shù) 一定方法得出總體回歸函數(shù)的參數(shù)近似看成是SRF1:PRF2:(觀察參數(shù)的對(duì)應(yīng)估計(jì)關(guān)系)第二節(jié) 簡(jiǎn)單線性回歸模型的最小二乘估計(jì)(OLS)本節(jié)主要介紹: 2.1 簡(jiǎn)單線性回歸模型的基本假定 2.2 普通最小二乘法(OLS) 2.3 OLS回歸線的性質(zhì) 2.4 最小二乘估計(jì)的統(tǒng)計(jì)性質(zhì) 2.1 簡(jiǎn)單線性回歸的基本假定2.1.1 為什么要做基本假定參數(shù)估計(jì)量是隨機(jī)變量,只有在一定的假設(shè)條件下,所作出的估計(jì)才具較好的統(tǒng)計(jì)性質(zhì)。只有對(duì)隨機(jī)擾動(dòng)項(xiàng)的分布作出假定,才能確定所估計(jì)參數(shù)的分布的性質(zhì),也

14、才可能進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估計(jì)。2.1.2 假定的兩個(gè)方面:(1)關(guān)于變量和模型的基本假定 是非隨機(jī)的,或者雖然 是隨機(jī)的,但是與 是不相關(guān)的; 無(wú)測(cè)量誤差; 變量和函數(shù)形式設(shè)定正確。假定的兩個(gè)方面:(2)關(guān)于隨機(jī)擾動(dòng)項(xiàng)也稱高斯假定、古典假定假定1 零均值:假定2 同方差:假定3 無(wú)自相關(guān):假定4 隨機(jī)擾動(dòng)項(xiàng) 與 不相關(guān)。 即:假定5 服從正態(tài)分布, 即:注意:正態(tài)性假定(5)不影響對(duì)參數(shù)的點(diǎn)估計(jì),所以可不列入基本假定,且根據(jù)中心極限定理,當(dāng)樣本容量無(wú)窮大時(shí), 的分布趨近于正態(tài)分布。但此假定對(duì)確定所估計(jì)參數(shù)的分布性質(zhì)是需要的,2.1.3 Y的分布性質(zhì)由于 ,所以 的分布性質(zhì)就決定了 的分布性質(zhì)。

15、對(duì) 的一些假定可以等價(jià)地表示為對(duì) 的假定:零均值:同方差:無(wú)自相關(guān):正態(tài)性:2.2 普通最小二乘法(OLS)基本思想數(shù)學(xué)過(guò)程估計(jì)結(jié)果2.2.1 最小二乘法的基本思想縱向距離是Y的實(shí)際值與擬合值之差,稱為擬合誤差或殘差。差異大擬合不好,差異小擬合好。殘差可正可負(fù),為克服加總時(shí)正負(fù)相消,將其平方后相加,得殘差平方和,“最好”直線就是使誤差平方和最小的直線。于是求最好擬合直線問(wèn)題轉(zhuǎn)換為求殘差平方和最小,可以運(yùn)用求極值的原理求解。三種距離YX縱向距離橫向距離距離A為實(shí)際點(diǎn),B為擬合直線上與之對(duì)應(yīng)的點(diǎn)SRF返回YX0*Y7Y9Min數(shù)學(xué)形式2.2.2 最小二乘法的數(shù)學(xué)過(guò)程詳見(jiàn)課本2.2.3 OLS估計(jì)結(jié)

16、果的離差形式離差形式:OLS估計(jì)結(jié)果的離差形式:(樣本回歸函數(shù)的離差形式: )2.2.4 幾個(gè)有用的結(jié)果可以用到以后計(jì)算、證明過(guò)程中:2.3 OLS 回歸線的性質(zhì)1. 回歸線過(guò)樣本均值點(diǎn) 2殘差和為零3Y的真實(shí)值 和擬合值 有共同均值4殘差 與自變量 不相關(guān)5殘差 與擬合值 不相關(guān)2.3.1 回歸線過(guò)樣本均值由 ,知: 即樣本均值點(diǎn) 滿足回歸線方程SRFYX2.3.2 殘差和為零由 OLS數(shù)學(xué)過(guò)程直接可得。且易推出殘差的平均數(shù)也等于零。2.3.3 Y的真實(shí)值和擬合值有共同的均值性質(zhì)4、52.3.4 殘差與自變量不相關(guān)(Residuals are unrelated with independe

17、nt variable)2.3.5 估計(jì)殘差與擬合值不相關(guān)(Residuals are unrelated with fitted value of ) 樣本回歸直線性質(zhì)總結(jié) 殘差和=0 均值相等擬合值與殘差不相關(guān)自變量與殘差不相關(guān)過(guò)樣本均值2.4最小二乘估計(jì)量的性質(zhì) 當(dāng)模型參數(shù)估計(jì)出后,需考慮參數(shù)估計(jì)值的精度,即是否能代表總體參數(shù)的真值,或者說(shuō)需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。 一個(gè)用于考察總體的估計(jì)量,可從如下幾個(gè)方面考察其優(yōu)劣性: (1)線性性,即它是否是另一隨機(jī)變量的線性函數(shù); (2)無(wú)偏性,即它的均值或期望值是否等于總體的真實(shí)值; (3)有效性,即它是否在所有線性無(wú)偏估計(jì)量中具有最小方差。

18、(4)漸近無(wú)偏性,即樣本容量趨于無(wú)窮大時(shí),是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無(wú)窮大時(shí),它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無(wú)窮大時(shí),是否它在所有的一致估計(jì)量中具有最小的漸近方差。 這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)。 擁有這類性質(zhì)的估計(jì)量稱為最佳線性無(wú)偏估計(jì)量(best liner unbiased estimator, BLUE)。 當(dāng)不滿足小樣本性質(zhì)時(shí),需進(jìn)一步考察估計(jì)量的大樣本或漸近性質(zhì):2.4.1 線性:最小二乘估計(jì)量是關(guān)于Yi的線性函數(shù)注意同2.2.42.4.2 無(wú)偏性由2.2.4,知:2.4.3 有效性證明太繁雜,略。以下只給出其方

19、差:2.4.4 參數(shù)的分布、殘差方差的估計(jì)由上,知:擾動(dòng)項(xiàng) 的方差通過(guò)樣本估計(jì)為: 其中,n為樣本容量。OLS參數(shù)估計(jì)量的有效性指的是:在一切線性、無(wú)偏估計(jì)量中,OLS參數(shù)估計(jì)量的方差最小。所有參數(shù)估計(jì)量線性參數(shù)估計(jì)量無(wú)偏參數(shù)估計(jì)量最小二乘參數(shù)估計(jì)量3、最大似然法最大似然法(Maximum Likelihood,ML),也稱最大或然法,是不同于最小二乘法的另一種參數(shù)估計(jì)方法,是從最大或然原理出發(fā)發(fā)展起來(lái)的其它估計(jì)方法的基礎(chǔ)。基本原理:當(dāng)從模型總體隨機(jī)抽取n組樣本觀測(cè)值后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測(cè)值的概率最大。ML必須已知隨機(jī)項(xiàng)的分布。3.1、估計(jì)步驟Yi的分布Yi的

20、概率函數(shù) Y的所有樣本觀測(cè)值的聯(lián)合概率似然函數(shù) 對(duì)數(shù)似然函數(shù) 對(duì)數(shù)似然函數(shù)極大化的一階條件結(jié)構(gòu)參數(shù)的ML估計(jì)量3.2、討論在滿足一系列基本假設(shè)的情況下,模型結(jié)構(gòu)參數(shù)的最大似然估計(jì)量與普通最小二乘估計(jì)量是相同的。但是,分布參數(shù)的估計(jì)結(jié)果不同。第四節(jié) 回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)本節(jié)主要介紹:簡(jiǎn)單線性回歸系數(shù)的分布及其標(biāo)準(zhǔn)化?;貧w系數(shù)的區(qū)間估計(jì)回歸系數(shù)的假設(shè)檢驗(yàn)擾動(dòng)項(xiàng)方差的區(qū)間估計(jì)。4.1 回歸系數(shù)的標(biāo)準(zhǔn)化4.2 回歸系數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)區(qū)間估計(jì)的概念、步驟應(yīng)用: 1、已知擾動(dòng)項(xiàng)方差,對(duì) 進(jìn)行區(qū)間估計(jì) 2、擾動(dòng)項(xiàng)方差未知,對(duì) 進(jìn)行區(qū)間估計(jì)大樣本下/小樣本下4.2.1 區(qū)間估計(jì)的概念所謂區(qū)間估計(jì)就

21、是以一定的可靠性給出被估計(jì)參數(shù)的一個(gè)可能的取值范圍。具體作法是找出兩個(gè)統(tǒng)計(jì)量 1(x1,xn)與2 (x1,xn), 使 P(1 2 )=1-(1 , 2)稱為置信區(qū)間, 1-稱為置信系數(shù)(置信度), 稱為冒險(xiǎn)率(測(cè)不準(zhǔn)的概率)或者顯著水平,一般取5%或1%。對(duì)區(qū)間估計(jì)的形象比喻我們經(jīng)常說(shuō)某甲的成績(jī)“大概80分左右”,可以看成一個(gè)區(qū)間估計(jì)。(某甲的成績(jī)?yōu)楸还烙?jì)的參數(shù)) P(1 2 )=大概的準(zhǔn)確程度( 1-) 如:P(75 85 )=95%=1-5%“大概80分左右”冒險(xiǎn)率(也叫顯著水平 )下限上限置信系數(shù)1 4.2.2 區(qū)間估計(jì)的步驟: 1)找一個(gè)含有該參數(shù)的統(tǒng)計(jì)量; 要求該統(tǒng)計(jì)量: 分布已

22、知 含待估參數(shù) 除了待估參數(shù)外,其余為已知量。 2)構(gòu)造一個(gè)概率為 的事件; 3)通過(guò)該事件解出該參數(shù)的區(qū)間估計(jì).4.2.3 已知擾動(dòng)項(xiàng)方差,對(duì)的區(qū)間估計(jì)4.2.4 未知擾動(dòng)項(xiàng)方差,對(duì)的區(qū)間估計(jì)(1)大樣本下 可以用 代替 ,有 所以仍按已知方差作區(qū)間估計(jì),只不過(guò)把區(qū)間估計(jì)中的隨機(jī)擾動(dòng)的方差 換成其估計(jì)值 。(2)小樣本下 區(qū)間估計(jì),統(tǒng)計(jì)量選擇小結(jié)4.2.5 擾動(dòng)項(xiàng)方差的區(qū)間估計(jì)對(duì)擾動(dòng)項(xiàng)的區(qū)間估計(jì)使用的統(tǒng)計(jì)量為:其余步驟相同4.3 回歸系數(shù)的假設(shè)檢驗(yàn)基本概念:假設(shè)檢驗(yàn),原假設(shè)/備擇假設(shè) 置信水平假設(shè)檢驗(yàn)的步驟應(yīng)用: 的假設(shè)檢驗(yàn)(方差已知/方差未知)方差的假設(shè)檢驗(yàn)4.3.1 假設(shè)檢驗(yàn)的概念定義:

23、稱對(duì)任何一個(gè)隨機(jī)變量未知的分布類型或參數(shù)的假設(shè)為統(tǒng)計(jì)假設(shè),簡(jiǎn)稱假設(shè)。檢驗(yàn)該假設(shè)是否正確稱為假設(shè)檢驗(yàn)。在統(tǒng)計(jì)假設(shè),如 H0: p=0.5 (稱為原假設(shè)) H1: p 0.5 (稱為備擇假設(shè)) 是假設(shè)檢驗(yàn)中小概率事件發(fā)生的概率,也稱為置信水平。 4.3.2 假設(shè)檢驗(yàn)的步驟:Step1:分析問(wèn)題,提出原假設(shè)和備擇假設(shè);Step2:選擇和計(jì)算統(tǒng)計(jì)量U:在原假設(shè)成立時(shí),U的分布已知;含有要檢驗(yàn)的參數(shù);各個(gè)參數(shù)應(yīng)該都是已知的、可求的。Step3:構(gòu)造小概率事件:Step4:判斷小概率事件是否發(fā)生:Step5:下結(jié)論:若小概率事件發(fā)生,拒絕原假設(shè)H0;選擇備擇假設(shè)H1。否則,原假設(shè)成立。假設(shè)檢驗(yàn)的具體操作步

24、驟(已知方差 ,檢驗(yàn) 為例)1、提出零假設(shè) H0: H1 :3、確定顯著水平,如=0.05,查表得相應(yīng)的臨界值/24、判斷和下結(jié)論:若|U| /2 ,拒絕H0;若|U| /2 , 接受H0;(判斷區(qū)域圖示)5、依據(jù)結(jié)論,作出經(jīng)濟(jì)學(xué)上的解釋。4.3.3 假設(shè)檢驗(yàn)中統(tǒng)計(jì)量的選擇4.3.4 回歸系數(shù)假設(shè)檢驗(yàn)及意義回歸系數(shù)的假設(shè)檢驗(yàn),往往是檢驗(yàn) 檢驗(yàn)的意義:檢驗(yàn)該系數(shù)是否顯著,進(jìn)而檢驗(yàn)對(duì)應(yīng)的解釋變量是否對(duì)應(yīng)變量有解釋作用。第五節(jié) 擬合優(yōu)度的度量本節(jié)主要內(nèi)容:4.1 總變差(總平方和)的分解4.2 可決系數(shù)4.3 可決系數(shù)和相關(guān)系數(shù)的關(guān)系4.4 自由度的分解問(wèn)題的提出由最小二乘法所得直線確實(shí)能夠?qū)@些點(diǎn)

25、之間的關(guān)系加以反映嗎?對(duì)這些點(diǎn)之間的關(guān)系或趨勢(shì)反映到了何種程度?于是必須經(jīng)過(guò)某種檢驗(yàn)或者找出一個(gè)指標(biāo),在一定可靠程度下,根據(jù)指標(biāo)值的大小,對(duì)擬合的優(yōu)度進(jìn)行評(píng)價(jià)。 5.1 總離差1、總平方和、回歸平方和、殘差平方和2、總平方和的分解5.1.1 總平方和(總變差)、回歸平方和、殘差平方和的定義TSS度量Y自身的差異程度;ESS度量因變量Y的擬合值自身的差異程度,是總變差中由模型解釋了的變差;RSS度量實(shí)際值與擬合值之間的差異程度,是總變差中沒(méi)有得到解釋的變差。5.1.2 平方和分解:TSSESSRSS正交分解平方和分解的意義TSS=ESS+RSS被解釋變量Y總的變動(dòng)(差異)= 解釋變量X引起的變動(dòng)

26、(差異) +除X以外的因素引起的變動(dòng)(差異)如果X引起的變動(dòng)在Y的總變動(dòng)中占很大比例,那么X可以很好地解釋了Y;否則,X不能很好地解釋Y。5.2 可決系數(shù)(或稱判定系數(shù))目的:企圖構(gòu)造一個(gè)不含單位,可以相互進(jìn)行比較,而且能直觀判斷擬合優(yōu)劣的指標(biāo)。可決系數(shù)的定義:指標(biāo)含義:可決系數(shù)越大,自變量對(duì)因變量的解釋程度越高,自變量引起的變動(dòng)占總變動(dòng)的百分比高。觀察點(diǎn)在回歸直線附近越密集??蓻Q系數(shù)(續(xù))可決系數(shù)只是說(shuō)明列入模型的所有解釋變量對(duì)應(yīng)變量的聯(lián)合的影響程度,不說(shuō)明模型中單個(gè)解釋變量的影響程度。可決系數(shù)取值范圍:0,1對(duì)時(shí)間序列數(shù)據(jù),可決系數(shù)達(dá)到0.9以上是很平常的;但是,對(duì)截面數(shù)據(jù)而言,能夠有0.

27、5就不錯(cuò)了??蓻Q系數(shù)達(dá)到多少為宜?沒(méi)有一個(gè)統(tǒng)一的明確界限值;若建模的目的是預(yù)測(cè)應(yīng)變量值,一般需考慮有較高的可決系數(shù)。若建模的目的是結(jié)構(gòu)分析,就不能只追求高的可決系數(shù),而是要得到總體回歸系數(shù)的可信任的估計(jì)量??蓻Q系數(shù)高并不一定每個(gè)回歸系數(shù)都可信任;5.3 可決系數(shù)和相關(guān)系數(shù)的聯(lián)系數(shù)值上,可決系數(shù)等于應(yīng)變量與解釋變量之間簡(jiǎn)單相關(guān)系數(shù)的平方:可決系數(shù)和相關(guān)系數(shù)的區(qū)別可決系數(shù)相關(guān)系數(shù)就模型而言就兩個(gè)變量而言說(shuō)明解釋變量對(duì)應(yīng)變量的解釋程度度量?jī)蓚€(gè)變量線性依存程度。度量不對(duì)稱的因果關(guān)系度量不含因果關(guān)系的對(duì)稱相關(guān)關(guān)系取值:0,1取值:1,15.4 自由度的分解(1)什么是自由度(2)對(duì)應(yīng)于平方和分解的自由度

28、的分解自由度是指變量可以自由取值得個(gè)數(shù),例如我們要測(cè)量學(xué)生的身高X,隨機(jī)抽取10名學(xué)生,如果沒(méi)有任何限制,則X可以自由取值10個(gè)值,自由度為10;但是如果我們限定10各同學(xué)的平均身高,那么隨機(jī)抽取9名后,最后一名的身高則不能隨意取值了,此時(shí)自由度減少一個(gè),為10-1=9。這也是為什么我們?cè)诮y(tǒng)計(jì)學(xué)里說(shuō)修正的樣本方差(除以n-1)為總體方差的無(wú)偏估計(jì)量。4.4.1 什么是自由度模型中樣本值可以自由變動(dòng)的個(gè)數(shù),稱為自由度自由度 = 樣本個(gè)數(shù) 樣本數(shù)據(jù)受約束條件(方程)的個(gè)數(shù)例如,樣本數(shù)據(jù)個(gè)數(shù)為n,它們受k個(gè)方程的約束(系數(shù)矩陣秩為k),那么,自由度df = n-k在計(jì)量經(jīng)濟(jì)學(xué)中,對(duì)于一個(gè)包含k個(gè)解釋變量的回歸方程而言,待估計(jì)的參數(shù)個(gè)數(shù)為k+1(包括常數(shù)項(xiàng)),在我們根據(jù)最小殘差平方和求偏導(dǎo)的過(guò)程中,會(huì)得到(k+1)個(gè)方程構(gòu)成的方程組,這k+1個(gè)方程實(shí)際上構(gòu)成了對(duì)殘差的k+1個(gè)限制條件,所以凡是涉及到殘差構(gòu)成的統(tǒng)計(jì)量,自由度就會(huì)減少k+1個(gè),例如顯著性檢驗(yàn)中的t檢驗(yàn)和f檢驗(yàn)的自由度等。例:TSS、RSS、ESS的自由度4.4.2 對(duì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論