第五講 統(tǒng)計(jì)檢驗(yàn)與預(yù)測_第1頁
第五講 統(tǒng)計(jì)檢驗(yàn)與預(yù)測_第2頁
第五講 統(tǒng)計(jì)檢驗(yàn)與預(yù)測_第3頁
第五講 統(tǒng)計(jì)檢驗(yàn)與預(yù)測_第4頁
第五講 統(tǒng)計(jì)檢驗(yàn)與預(yù)測_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、5、參數(shù)估計(jì)的最大似然法和矩法、參數(shù)估計(jì)的最大似然法和矩法 2 ?4、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì) 1 0.5091 0.0823 思考:在思考:在5%5%的顯著性水平下,若通過樣本得到了的顯著性水平下,若通過樣本得到了 置信區(qū)間置信區(qū)間 一個(gè)一個(gè) ,如何解釋?,如何解釋? 1 答:給定置信系數(shù)95%,從長遠(yuǎn)看,在類似于 的固定區(qū)間含有真實(shí)值的概率不是1就是0。 區(qū)間中,將有95個(gè)包含著真實(shí)的每100個(gè)的值;但這個(gè)特殊 0823. 05091. 0 一、參數(shù)的區(qū)間估計(jì) 二、擬合優(yōu)度檢驗(yàn) 三、變量的顯著性檢驗(yàn) 一、擬合優(yōu)度檢驗(yàn)一、擬合優(yōu)度

2、檢驗(yàn) 二、變量的顯著性檢驗(yàn)二、變量的顯著性檢驗(yàn) 三、條件均值與個(gè)別值的預(yù)測三、條件均值與個(gè)別值的預(yù)測 對樣本回歸直線與樣本觀測對樣本回歸直線與樣本觀測 值之間擬合程度的檢驗(yàn)值之間擬合程度的檢驗(yàn)。 回答回答樣本回歸直線對樣本觀測點(diǎn)擬合的多樣本回歸直線對樣本觀測點(diǎn)擬合的多 么好的度量么好的度量 :判定系數(shù)判定系數(shù)(可決系數(shù)可決系數(shù))R2 2 1 1、總離差平方和的分解、總離差平方和的分解 已知由一組樣本觀測值(Xi,Yi),i=1,2,n 得到如下樣本回歸直線 ii XY 10 iiiiiii yeYYYYYYy) () ( Y的第的第i個(gè)觀測值可表述為個(gè)觀測值可表述為 Y 01 iiiii YX

3、eYe 如果如果Yi=i 即實(shí)際觀測值落在樣本回歸即實(shí)際觀測值落在樣本回歸“線線”上,則上,則擬合最好擬合最好。 可認(rèn)為,可認(rèn)為,“離差離差”全部來自回歸線,而與全部來自回歸線,而與“殘差殘差”無關(guān)。無關(guān)。 對于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的 平方和(兩邊取平方后求和)平方和(兩邊取平方后求和),可以證明(P34頁結(jié)論): 記 22 )(YYyTSS ii 總離差平方和總離差平方和(Total Sum of Squares) 22 ) (YYyESS ii 回歸平方和回歸平方和(Explained Sum of Squares) 22 ) ( iii YYeRSS殘差平方和殘差平方

4、和(Residual Sum of Squares ) TSS=ESS+RSS Y的觀測值圍繞其均值的的觀測值圍繞其均值的總離差總離差(total variation) 可分解為兩部分:可分解為兩部分:一部分來自回歸線一部分來自回歸線(ESS),另一部,另一部 分則來自隨機(jī)勢力分則來自隨機(jī)勢力(RSS)。 在給定樣本中,TSS不變, 如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則ESS在 TSS中占的比重越大,因此 擬合優(yōu)度擬合優(yōu)度:回歸平方和:回歸平方和ESS/YESS/Y的總離差的總離差TSSTSS TSS RSS TSS ESS R1記 2 2、可決系數(shù)、可決系數(shù)R2 2統(tǒng)計(jì)量統(tǒng)計(jì)量 稱 R2 為(

5、樣本)(樣本)可決系數(shù)可決系數(shù)/判定系數(shù)判定系數(shù)(coefficient of determination)。 可決系數(shù)可決系數(shù)的取值范圍:取值范圍:0,1 。 R2 2越接近越接近1 1,說明實(shí)際觀測點(diǎn)離樣本線越近,擬,說明實(shí)際觀測點(diǎn)離樣本線越近,擬 合優(yōu)度越高合優(yōu)度越高。 在實(shí)際計(jì)算可決系數(shù)時(shí),在 1 已經(jīng)估計(jì)出后: 2 2 2 1 2 i i y x R 在例2.1.1的收入收入-消費(fèi)支出消費(fèi)支出例中, 9935. 0 3354955 7425000)670. 0( 2 2 2 2 1 2 i i y x R 注:可決系數(shù)注:可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是

6、隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng) 計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第3章中進(jìn)行。章中進(jìn)行。 擬合優(yōu)度擬合優(yōu)度0.9935說明說明X的變化可以解釋的變化可以解釋Y的的99.35%的變化。的變化。 可決系數(shù)只是說明列入模型的可決系數(shù)只是說明列入模型的所有解釋變量對被解釋變所有解釋變量對被解釋變 量的量的聯(lián)合聯(lián)合的影響程度,的影響程度,不說明模型中各解釋變量的單獨(dú)不說明模型中各解釋變量的單獨(dú) 的影響程度(在多元中)的影響程度(在多元中) 回歸分析的回歸分析的主要目的如果是經(jīng)濟(jì)結(jié)構(gòu)分析主要目的如果是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追求,

7、不能只追求 高的可決系數(shù),而是要得到總體回歸系數(shù)可信的估計(jì)量。高的可決系數(shù),而是要得到總體回歸系數(shù)可信的估計(jì)量。 可決系數(shù)高并不一定每個(gè)系數(shù)都可信任??蓻Q系數(shù)高并不一定每個(gè)系數(shù)都可信任。 如果建模的目的只是為了如果建模的目的只是為了預(yù)測被解釋變量的值預(yù)測被解釋變量的值,不是為,不是為 了正確估計(jì)回歸系數(shù),一般可考慮有較高的可決系數(shù)。了正確估計(jì)回歸系數(shù),一般可考慮有較高的可決系數(shù)。 從擬合優(yōu)度中看出,擬合優(yōu)度越高,就說明樣本 回歸線對觀測值的擬合就越好,但這只是推測,解解 釋變量對被解釋變量是否有顯著的線性影響釋變量對被解釋變量是否有顯著的線性影響需要我 們?nèi)パ芯浚@就是變量的顯著性檢驗(yàn)。 回歸

8、分析中,主要是回歸分析中,主要是針對變量前的參數(shù)真值是否針對變量前的參數(shù)真值是否 為零來檢驗(yàn)。為零來檢驗(yàn)。 I.先根據(jù)實(shí)際問題的要求提出一個(gè)論斷, 稱為原假設(shè), II.然后根據(jù)樣本信息,看能得到什么結(jié) 果,如果導(dǎo)致一個(gè)不合理的結(jié)果,拒 絕原假設(shè)。 III. 判斷結(jié)果合理與否,是基于判斷結(jié)果合理與否,是基于“小概小概 率事件不易發(fā)生率事件不易發(fā)生”這一原理的。這一原理的。 注意這里的注意這里的“接受和拒絕接受和拒絕” 2、變量的顯著性檢驗(yàn)、變量的顯著性檢驗(yàn) ),( 2 2 11 i x N )2( 1 11 22 11 nt S x t i 如果變量如果變量X是顯著的,那么參數(shù)是顯著的,那么參數(shù)

9、 應(yīng)該顯著的不為應(yīng)該顯著的不為0 1 檢驗(yàn)步驟:檢驗(yàn)步驟: (1)對總體參數(shù)提出假設(shè) H0: 1=0, H1:10 (2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值 1 1 S t (3)給定顯著性水平,查t分布表,得臨界值t /2(n-2) (4) 比較,判斷 若給定顯著性水平 ,則雙側(cè)檢驗(yàn)的臨界值為 0 ) 2( 2 n t ) 2( 2 n t t 2 t 若|t| t /2(n-2),則拒絕H0,接受H1;(小概率事件發(fā)生)(小概率事件發(fā)生) 若|t| t /2(n-2),則接受H0 ; 對于一元線性回歸方程中的0,可構(gòu)造如下t 統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn): )2( 0 0 222 00 n

10、t S xnX t ii 在上述收入-消費(fèi)支出例中,首先計(jì)算2的估計(jì)值 2734 210 7425000670. 03354955 2 2 2 22 1 22 2 n xy n e iii 019. 00004. 07425000/2734 22 1 i xS 45.44742500010/536500002734 222 0 ii xnXS t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為: 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t1|2.306,說明家庭可支配收入在家庭可支配收入在95%95%的置信的置信 度下顯著,即是消費(fèi)支出的主要解釋變量;度下顯著,即是消費(fèi)支出的

11、主要解釋變量; |t0|2.306,表明在95%的置信度下,拒絕截距 項(xiàng)為零的假設(shè)。 92.34019 . 0 670 . 0 1 11 St 20. 345.4440.142 0 00 St 一個(gè)一個(gè)“大大”的的 是與虛擬假設(shè)相抵觸的跡象。是與虛擬假設(shè)相抵觸的跡象。t 觀察觀察t分布表,當(dāng)自由度為分布表,當(dāng)自由度為20或更大時(shí),計(jì)算的或更大時(shí),計(jì)算的t值如果值如果 是是2.5或或3或更大,則我們就不需要再查閱或更大,則我們就不需要再查閱t分布表以評分布表以評 定所估的參數(shù)的顯著性,它必定是要拒絕原假設(shè),即定所估的參數(shù)的顯著性,它必定是要拒絕原假設(shè),即 該變量通過了顯著性檢驗(yàn)。該變量通過了顯著

12、性檢驗(yàn)。 當(dāng)自由度小于當(dāng)自由度小于20時(shí),我們要查閱時(shí),我們要查閱t分布表。分布表。 注意注意1: 注意注意2: 顯著性水平顯著性水平 犯第一類錯(cuò)誤的概率犯第一類錯(cuò)誤的概率拒絕了真值的假設(shè)的概率拒絕了真值的假設(shè)的概率 經(jīng)典假設(shè)檢驗(yàn)方法的痛處經(jīng)典假設(shè)檢驗(yàn)方法的痛處 選擇選擇 的武斷的武斷 P值是根據(jù)既定的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量與相應(yīng)自由度下查值是根據(jù)既定的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量與相應(yīng)自由度下查 到的臨界值比較,得到的臨界值和計(jì)算的統(tǒng)計(jì)量一樣大或者更到的臨界值比較,得到的臨界值和計(jì)算的統(tǒng)計(jì)量一樣大或者更 大的概率大的概率 拒絕原假設(shè)的最小顯著性水平拒絕原假設(shè)的最小顯著性水平 規(guī)則:規(guī)則: pp時(shí),

13、時(shí),值越小,越能拒絕原假設(shè)。值越小,越能拒絕原假設(shè)。 如果數(shù)據(jù)不支持原假設(shè),則在原假設(shè)下得到的如果數(shù)據(jù)不支持原假設(shè),則在原假設(shè)下得到的 值將會很值將會很 t “大大”,得到這樣一個(gè)的,得到這樣一個(gè)的 值的值的p值就很值就很 “小小”。 t 固定在一定的水平上固定在一定的水平上將將 111 1P 11 1 2 tt n se : 給定顯著性水平給定顯著性水平 11 22 1 1 Ptt se 1 1 整理可以得到整理可以得到的置信度下的置信度下的置信區(qū)間是的置信區(qū)間是 11 11 22 ,t St S 通過變量的顯著性通過變量的顯著性 檢驗(yàn),我們知道檢驗(yàn),我們知道 由于置信區(qū)間一定程度地給出了樣

14、本參數(shù)估計(jì)由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì) 值與總體參數(shù)真值的值與總體參數(shù)真值的“接近接近”程度,因此置信區(qū)間程度,因此置信區(qū)間 越小越好。越小越好。 要縮小置信區(qū)間,需 (1 1)增大樣本容量)增大樣本容量n n,因?yàn)樵谕瑯拥闹眯潘?下,n越大,t分布表中的臨界值越小 (2 2)提高模型的擬合優(yōu)度)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì) 量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越 高,殘差平方和應(yīng)越小。 11 11 22 ,t St S 2 103.1720.777 98.410.0425 1.04818.29 0.97668 28591.85 ii YX t Rdf FDW 回歸

15、分析結(jié)果的報(bào)告回歸分析結(jié)果的報(bào)告 經(jīng)過模型的估計(jì)、檢驗(yàn),得到一系列重要的數(shù)經(jīng)過模型的估計(jì)、檢驗(yàn),得到一系列重要的數(shù) 據(jù),為了簡明、清晰、規(guī)范的表述這些數(shù)據(jù),計(jì)量據(jù),為了簡明、清晰、規(guī)范的表述這些數(shù)據(jù),計(jì)量 經(jīng)濟(jì)學(xué)通常采用以下規(guī)范化的方式:經(jīng)濟(jì)學(xué)通常采用以下規(guī)范化的方式: 標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差SE 估計(jì)的估計(jì)的t統(tǒng)計(jì)量統(tǒng)計(jì)量 可決系數(shù)和自由度可決系數(shù)和自由度 F統(tǒng)計(jì)量統(tǒng)計(jì)量 DW統(tǒng)計(jì)量統(tǒng)計(jì)量 估計(jì)的樣本回歸函數(shù)估計(jì)的樣本回歸函數(shù) 模型設(shè)定的關(guān)系式不變模型設(shè)定的關(guān)系式不變 所估計(jì)的參數(shù)不變所估計(jì)的參數(shù)不變 解釋變量在預(yù)測期的取值已作出預(yù)測解釋變量在預(yù)測期的取值已作出預(yù)測 PRF SRF F X 點(diǎn)預(yù)測

16、值點(diǎn)預(yù)測值 真實(shí)平均值真實(shí)平均值 FF E YX 個(gè)別值個(gè)別值 F Y F F e F Y 是真實(shí)平均值預(yù)測值的點(diǎn)估計(jì),也是個(gè)別值預(yù)測是真實(shí)平均值預(yù)測值的點(diǎn)估計(jì),也是個(gè)別值預(yù)測 值的點(diǎn)估計(jì)。值的點(diǎn)估計(jì)。 u必須找出與必須找出與 和和 都有關(guān)的統(tǒng)計(jì)量都有關(guān)的統(tǒng)計(jì)量 F Y FF E YX u由于存在抽樣波動(dòng),預(yù)測的由于存在抽樣波動(dòng),預(yù)測的 值不一定等于真實(shí)總值不一定等于真實(shí)總 體條件均值體條件均值 。 FF E YX F Y 基本思想:基本思想: 010101 ()()()() FFFF E YEXEX EX 01 FF YX 2 2 2 1 F F i XX Var Y nx 具體做法:從具體

17、做法:從 的分布分析的分布分析 F Y ) )(1 (,( 2 2 02 F10F i x XX n XNY F E Y 01 2 2 2 1 FF F i YX tt n XX nx 22 FF FFF YY Yt SE Y XYt S 于是,在1-的置信度下,總體均值總體均值 的置信區(qū)間為的置信區(qū)間為 F E Y X 個(gè)別預(yù)測值的置信區(qū)間個(gè)別預(yù)測值的置信區(qū)間 基本思想:基本思想: 0 Y 是真實(shí)平均值的點(diǎn)估計(jì),也是個(gè)別值的點(diǎn)估計(jì)。是真實(shí)平均值的點(diǎn)估計(jì),也是個(gè)別值的點(diǎn)估計(jì)。 由于存在隨機(jī)擾動(dòng)項(xiàng)的影響,由于存在隨機(jī)擾動(dòng)項(xiàng)的影響,Y的條件均值并不等于的條件均值并不等于Y 的個(gè)別值。的個(gè)別值。 為

18、了對為了對Y的個(gè)別值的個(gè)別值 做區(qū)間預(yù)測,需要尋找與預(yù)測做區(qū)間預(yù)測,需要尋找與預(yù)測 值值 和個(gè)別值和個(gè)別值 有關(guān)的統(tǒng)計(jì)量,并要明確其概率有關(guān)的統(tǒng)計(jì)量,并要明確其概率 分布。分布。 0 Y 0 Y 0 Y ),( 2 0100 XNY 于是于是 ) )(1 (,( 2 2 02 0100 i x XX n XNY 2 0 22 0000 1 xx XX Var YYVar YVar Y nL 具體做法:具體做法: 已知?dú)埐铐?xiàng)已知?dú)埐铐?xiàng) 是與預(yù)測值是與預(yù)測值 和個(gè)別值和個(gè)別值 都都 有關(guān)的變量,并且已知有關(guān)的變量,并且已知 服從正態(tài)分布服從正態(tài)分布 000 eYY 0 Y 0 Y 0 e ) )(

19、1 1 (, 0( 2 2 02 00 i x XX n NYY 0 e )2( 00 00 nt S YY t YY 式中 : ) )(1 1 ( 2 2 02 00 i YY x XX n S 從而在1-的置信度下, 個(gè)別值Y0的置信區(qū)間的置信區(qū)間為 00 2 0 2 00 0 0 YYYY StYYStY 1.Y的總體條件均值的預(yù)測值與真實(shí)的總體條件均值有誤差,主的總體條件均值的預(yù)測值與真實(shí)的總體條件均值有誤差,主 要是受抽樣波動(dòng)影響。要是受抽樣波動(dòng)影響。 Y個(gè)別值的預(yù)測值與真實(shí)個(gè)別值的差異,不僅受抽樣波動(dòng)影響,個(gè)別值的預(yù)測值與真實(shí)個(gè)別值的差異,不僅受抽樣波動(dòng)影響, 而且還受隨機(jī)擾動(dòng)項(xiàng)的影響。而且還受隨機(jī)擾動(dòng)項(xiàng)的影響。 2.總體條件均值和個(gè)別值的預(yù)測區(qū)間都不是常數(shù),是隨總體條件均值和個(gè)別值的預(yù)測區(qū)間都不是常數(shù),是隨XF的變的變 化而變化。化而變化。 3.預(yù)測區(qū)間上下限與樣本容量有關(guān),樣本容量預(yù)測區(qū)間上下限與樣本容量有關(guān),樣本容量n越大,預(yù)測精度越大,預(yù)測精度 越高,反之預(yù)測精度越低;當(dāng)樣本容量越高,反之預(yù)測精度越低;當(dāng)樣本容量n趨近于無窮時(shí),個(gè)別趨近于無窮時(shí),個(gè)別 值的預(yù)測誤差只決

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論