




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一節(jié)概念第二節(jié)回歸模型第三節(jié)參數(shù)的最小二乘估計第四節(jié)模型檢驗第五節(jié)預(yù)測小結(jié)第2章一元線性回歸模型第一節(jié)基本概念
1.確定性關(guān)系若一個變量能夠被一個或若干個其它變量的數(shù)值按某一規(guī)律唯一地確定。函數(shù)關(guān)系
2.非確定性關(guān)系(相關(guān)關(guān)系或回歸關(guān)系)若一個變量不能根據(jù)其它有關(guān)變量的數(shù)值精確地求出其數(shù)值,但可以通過大量的統(tǒng)計資料得出它們之間的數(shù)量變化規(guī)律。
3.相關(guān)分析主要研究變量之間的相互關(guān)聯(lián)程度,用相關(guān)系數(shù)表示。包括簡單相關(guān)和多重相關(guān)(復(fù)相關(guān))。
4.回歸分析(RegressionAnalysis)研究一個變量(因變量)對于一個或多個其他變量(解釋變量)的數(shù)量依存關(guān)系。其目的在于根據(jù)已知的解釋變量的數(shù)值來估計或預(yù)測因變量的總體平均值。
分析被解釋變量與解釋變量之間的統(tǒng)計依賴關(guān)系,目的在于通過后者的已知或設(shè)定值去估計或預(yù)測前者的均值。這里:前一個變量被稱為被解釋變量(ExplainedVariable)或因變量(DependentVariable),后一個(些)變量被稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。回歸分析構(gòu)成計量經(jīng)濟學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:
(1)根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)利用回歸方程進行分析、評價及預(yù)測。例如,
函數(shù)關(guān)系:統(tǒng)計依賴關(guān)系/統(tǒng)計相關(guān)關(guān)系:對變量間統(tǒng)計依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的.相關(guān)系數(shù):統(tǒng)計依賴關(guān)系
回歸分析正相關(guān)相關(guān)分析
不相關(guān)負相關(guān)正相關(guān)線性相關(guān)不相關(guān)負相關(guān)有因果關(guān)系無因果關(guān)系非線性相關(guān)①不線性相關(guān)并不意味著不相關(guān);
②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個變量對另一個(些)變量的統(tǒng)計依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。
④相關(guān)分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的?;貧w分析對變量的處理方法存在不對稱性,即區(qū)分因變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是。▲注意:某社區(qū)家庭可支配收入(X)和消費支出(Y)統(tǒng)計X800110014001700200023002600290032003500Y5616388691023125414081650196920902299594748913110013091452173819912134232162781492411441364155117492046217825306388479791155139715951804206822662629
93510121210140816501848210123542860
96810451243147416721881218924862871
1078125414961683192522332552
1122129814961716196922442585
1155133115621749201322992640
118813641573177120352310
12101408160618042101
1430165018702112
1485171619472200
2002
共計242049501149516445193052387025025214502128515510平均60582510451265148517051925214523652585
根據(jù)每個家庭的收入和支出繪出散點圖,大致可看出二者間的關(guān)系:在統(tǒng)計意義上,二者成正比。
通過對收入和支出的調(diào)查結(jié)果,處于不同收入階層的居民有一個平均的支出水平,這一支出水平Y(jié)與收入X大致呈線性關(guān)系。
圖中的這條通過各收入階層平均支出額的直線,描述了這一依賴關(guān)系。我們把這條線稱為回歸直線。YX60514002000260035008003200總體回歸模型:
樣本回歸模型:總體回歸模型第二節(jié)回歸模型:
YX140020003200800樣本回歸模型2600一、幾個概念1.條件分布(Conditionaldistribution):以X取定值為條件的Y的條件分布。2.條件概率(Conditionalprobability):給定X的Y的概率,記為P(Y|X)。例如,P(Y=594|X=800)=1/4;P(Y=1551|X=2300)=1/14。3.條件期望(conditionalExpectation):給定X的Y的期望值,記為E(Y|X)。例如,E(Y|X=800)=561×1/4+594×1/4+627×1/4+638×1/4=6054.總體回歸曲線(PopularRegressionCurve)(總體回歸曲線的幾何意義):當(dāng)解釋變量給定值時因變量的條件期望值的軌跡。二、總體回歸函數(shù)(PopularRegressionFunction,PRF)
E(Y|Xi)=f(Xi)當(dāng)PRF的函數(shù)形式為線性函數(shù),則有,E(Y|Xi)=0+1Xi其中0和1為未知而固定的參數(shù),稱為回歸系數(shù)。0和1
分別稱為截距和斜率系數(shù)。上述方程也稱為線性總體回歸函數(shù)。三、“線性”的含義“線性”可作兩種解釋:對變量為線性,對參數(shù)為線性。一般“線性回歸”一詞總是指對參數(shù)為線性的一種回歸(即參數(shù)只以它的1次方出現(xiàn))。四、PRF的隨機設(shè)定將個別的Yi圍繞其期望值的離差(Deviation)表述如下:
ui=Yi-E(Y|Xi)或Yi=E(Y|Xi)+ui其中ui為隨機誤差項(Stochasticerror)或隨機干擾項(Stochasticdisturbance)。線性總體回歸函數(shù):
PRF:Yi=0+1Xi+ui=E(Y|Xi)+ui隨機誤差項主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測值的觀測誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機因素的影響。產(chǎn)生并設(shè)計隨機誤差項的主要原因:1)理論的含糊性;理論不能完全說明影響因變量的所有影響因素。2)數(shù)據(jù)的欠缺;無法獲得有關(guān)數(shù)據(jù)。3)簡化原則。盡可能使回歸模型簡單。五、隨機擾動項的意義
六、樣本回歸函數(shù)(SRF,SampleRegression
Function)由于在大多數(shù)情況下,我們不可能得到X、Y的所有可能的數(shù)值,只能用抽樣的方法,取得X、Y的樣本觀測值,用樣本回歸方程SRF去擬合總體回歸方程PRF。X(收入)800110014001700200023002600290032003500Y(支出)59463811221155140815951969207825852530樣本1樣本2樣本回歸函數(shù)SRF:
在回歸分析中,我們用SRF估計PRF。X(收入)800110014001700200023002600290032003500Y(支出)62781411221298156217162013229925852860第三節(jié)參數(shù)的最小二乘估計(LeastSquaresEstimation,LSE)考慮回歸模型:其中ui是除了X以外的其它若干隨機因素。一、最小二乘估計的基本假定1、零均值。隨機擾動項ui的均值為零。即,E(ui|Xi)=02、同方差。隨機擾動項ui的方差相等。即
Var(ui|Xi)=E[(ui-E(ui))|Xi]2
=E(ui2|Xi)2=23、無自相關(guān)。各個擾動項無自相關(guān)。即:4、隨機擾動項ui解釋變量Xi不相關(guān)。即Cov(ui,Xi)=E[ui-Eui][Xi-EXi]=0i=1,2,…,n5、ui服從正態(tài)分布,即ui~N(0,δ2),i=1,2,…,n二、普通最小二乘估計(OrdinaryLeastSquares,OLS)基本思路:用樣本回歸函數(shù)估計總體回歸函數(shù)。估計估計出的參數(shù)使殘差的平方和最小。真實值用根據(jù)最大化的一階條件:例1,已知某商品的需求量Y(萬噸)隨價格X(元)變化的統(tǒng)計資料如下,求需求量Y隨價格X變化的回歸方程。年份1991199219931994199519961997199819992000需求量10075807050659010011065價格5766875439幾個常用結(jié)果:三、最小二乘估計OLS的性質(zhì)(高斯-馬爾柯夫定理)
在所有線性無偏估計量中,OLS估計量有最小方差,即OLS是BLUE(BestLinearUnbiasedEstimator)。
1.線性性
2.無偏性
3.最小方差性(1)線性性:為Yi的線性函數(shù)
2、無偏性:最小二乘估計
的數(shù)學(xué)期望值分別等于總體回歸系數(shù)的值
3、最小方差性:
OLS估計量
在所有線性無偏估計量中,具有最小方差。即四、最小二乘估計的方差第四節(jié)模型檢驗一、經(jīng)濟意義檢驗檢驗所建的模型的是否符合經(jīng)濟理論,主要是檢驗?zāi)P蛥?shù)的符號和大小是否與經(jīng)濟理論以及人們的經(jīng)驗一致二、統(tǒng)計檢驗
1、擬合優(yōu)度檢驗(判定系數(shù))
擬合優(yōu)度檢驗是指對樣本回歸線與樣本觀測值之間擬合程度的檢驗。度量擬合程度的指標(biāo)是判定系數(shù)R2
?;舅悸罚阂蜃兞縔的總變異,能夠被X的變異解釋的比例越大,則說明OLS回歸線對總體的解釋程度越好,反之就越差??偟碾x差平方和的分解:PRFXiXSRFY估計的Y值圍繞其均值的總變異。
未被解釋的Y值圍繞回歸線的Y值的變異。
總離差平方和(TSS):說明實際的Y值圍繞其均值的總變異。
R2測度了在Y的總變異中,由回歸模型解釋的部分所占的比例。R2越高,回歸模型擬合的程度就越好。
R2的性質(zhì):(1)非負。(2)0≤R2≤1其它表達方式:定義擬合優(yōu)度R2:例2:對例1進行擬合優(yōu)度檢驗,并說明其意義。82.73%2、相關(guān)系數(shù)檢驗
相關(guān)系數(shù):表示兩個隨機變量之間的相關(guān)程度。定義為:以樣本方差和樣本協(xié)方差估計X、Y的方差和協(xié)方差,樣本相關(guān)系數(shù)為:
樣本相關(guān)系數(shù)的平方與擬合優(yōu)度相等,但二者的意義不同。(擬合優(yōu)度是回歸分析中提出的,而相關(guān)系數(shù)是相關(guān)分析中提出的。)相關(guān)系數(shù)檢驗的步驟:例3,對例1進行相關(guān)系數(shù)檢驗。3、F檢驗(總體回歸方程顯著性檢驗)三大分布:t:標(biāo)準(zhǔn)正態(tài)除以卡方開方的分布(注意自由度)F:兩個獨立的卡方變量之商的分布(注意自由度):若干個獨立的標(biāo)準(zhǔn)正態(tài)平方和的分布F檢驗的步驟:離差平方和平方和SS自由度DF均方差MSF值F臨界值顯著性ESS1ESS/1******/RSSn-2RSS/n-2TSSn-1方差分析(analysisofvariance,ANOVA)
表思路:若ESS/RSS比較大,則X對Y的解釋程度就比較高,可以推測總體存在線性關(guān)系。一般情況下,擬合優(yōu)度R2與F檢驗具有一致性:例4,對例1進行F檢驗解:TSS=3272.5ESS=2707.5RSS=565F*=(2707.5×8)/565=38.3338.33>F0.05(1,8)=5.32
因此,回歸方程顯著成立.
方差分析表:AnalysisofVarianceSOURCEDFSSMSFpRegression12707.52707.538.340.000Error8565.070.6Total93272.54、t檢驗(參數(shù)顯著性檢驗)T檢驗的步驟:例5,對例1進行t檢驗。三、預(yù)測(PredictionForecast)(一)點預(yù)測點預(yù)測的兩種解釋:X0YX12(二)區(qū)間預(yù)測(IntervalEstimation)
1、總體均值E(Y0|X0)的區(qū)間預(yù)測區(qū)間估計(預(yù)測):為了判斷點估計與真值的接近程度,可以通過構(gòu)造以估計值為中心的一個區(qū)間(隨機的),以該區(qū)間包括了真值的概率來確定估計值接近真值的程度。-t/2t/2o/2/22、總體個別值Y0的區(qū)間預(yù)測各種預(yù)測值的關(guān)系XY0Y的均值的區(qū)間預(yù)測Y的個別值的區(qū)間預(yù)測例6,在例1中,若X0=10,求Y0及E(Y0|X0)的預(yù)測值和預(yù)測區(qū)間
六、案例分析小結(jié):一元線性回歸分析的主要步驟1、建立回歸模型研究某一經(jīng)濟現(xiàn)象,先根據(jù)經(jīng)濟理論,選擇具有因果關(guān)系的兩個變量(Y,X),建立線性回歸模型,確定解釋變量和被解釋變量。如果不明確兩個變量是否為線性關(guān)系,也可以根據(jù)散點圖來分析。建立回歸模型可以是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024河南省三門峽中等專業(yè)學(xué)校工作人員招聘考試及答案
- 2024洞口縣鳳凰職業(yè)技術(shù)學(xué)校工作人員招聘考試及答案
- 護理工作計劃2025
- 租賃合同范本-鏟車租賃專用
- 網(wǎng)絡(luò)安全保障協(xié)議:企業(yè)信息安全防護合同
- 軟件開發(fā)與維護合同模板
- 數(shù)控加工工藝與編程試題(含參考答案)
- 農(nóng)業(yè)與財務(wù)管理的結(jié)合
- 研學(xué)基地參加創(chuàng)業(yè)比賽全程紀(jì)實
- 維保安全培訓(xùn)
- 北京2025年北京市農(nóng)林科學(xué)院招聘43人筆試歷年參考題庫附帶答案詳解
- 2025年廣州市勞動合同范本下載
- 2025-2030氣體檢測儀器行業(yè)市場深度調(diào)研及前景趨勢與投資研究報告
- 2025年北大荒黑龍江建三江水利投資有限公司招聘筆試參考題庫附帶答案詳解
- 靈活運用知識的2024年ESG考試試題及答案
- 國家藥品監(jiān)督管理局直屬單位招聘考試真題2024
- 受限空間作業(yè)施工方案
- 黃金卷(江蘇蘇州專用)-【贏在中考·黃金預(yù)測卷】2025年中考數(shù)學(xué)模擬卷
- (一模)2025年廣州市普通高中畢業(yè)班綜合測試(一)政治試卷(含答案)
- 視力防控健康教育
- 太乙課堂游戲最終版
評論
0/150
提交評論