SPSS實驗報告線性回歸曲線估計_第1頁
SPSS實驗報告線性回歸曲線估計_第2頁
SPSS實驗報告線性回歸曲線估計_第3頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)分析實務(wù)與案例實驗報告曲線估計學(xué)號:2614班級:2013應(yīng)用統(tǒng)計姓名:日期:2014T2-7數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院一、實驗?zāi)康臏蚀_理解曲線回歸分析的方法原理。1. 了解如何將本質(zhì)線性關(guān)系模型轉(zhuǎn)化為線性關(guān)系模型進行回歸分析。2. 熟練掌握曲線估計的SPSS操作。3. 掌握建立合適曲線模型的判斷依據(jù)。4. 掌握如何利用曲線回歸方程進行預(yù)測。5. 培養(yǎng)運用多曲線估計解決身邊實際問題的能力。二、準備知識非線性模型的基本內(nèi)容變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。所謂本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然呈非線性關(guān)系,但可以通過變量轉(zhuǎn)化為線性關(guān)系,并可最終進行線性回歸分析,建立線性模型。

2、本質(zhì)非線性關(guān)系是指變量之間不僅形式上呈現(xiàn)非線性關(guān)系,而且也無法通過變量轉(zhuǎn)化為線性關(guān)系,最終無法進行線性回歸分析,建立線性模型。本實驗針對本質(zhì)線性模型進行。下面介紹本次實驗涉及到的可線性化的非線性模型,所用的變換既有自變量的變換,也有因變量的變換。乘法模型:yXX2X3其中,都是未知參數(shù),是乘積隨機誤差。對上式兩邊取自然對數(shù)得到InyInInInx2Inx3In上式具有一般線性回歸方程的形式,因而用多元線性回歸的方法來處理。然而,必須強調(diào)指出的是,在求置信區(qū)間和做有關(guān)試驗時,必須是In:N(0,2ln),而不是:(0,2ln),因此檢驗之前,要先檢驗In是否滿足這個假設(shè)三、實驗內(nèi)容已有很多學(xué)者驗

3、證了能源消費與經(jīng)濟增長的因果關(guān)系,證明了能源消費是促進經(jīng)濟增長的原因之一。也有眾多學(xué)者利用C-D生產(chǎn)函數(shù)驗證了勞動和資本對經(jīng)濟增長的影響機理。所有這些研究都極少將勞動、資本、和能源建立在一個模型中來研究三個因素對經(jīng)濟增長的作用方向和作用大小?,F(xiàn)從我國能源消費、全社會固定資產(chǎn)投資和就業(yè)人員的實際出發(fā),假定生產(chǎn)技術(shù)水平在短期能不會發(fā)生較大變化,經(jīng)濟增長、全社會固定資產(chǎn)投資、就業(yè)人員、能源消費可以分別采用國內(nèi)生產(chǎn)總值、全社會固定資產(chǎn)投資總量、就業(yè)總?cè)藬?shù)、能源消費總量進行衡量,并假定經(jīng)濟增長與能源消費、資本和勞動力的關(guān)系均滿足C-D生產(chǎn)函數(shù)。問題中的C-D生產(chǎn)函數(shù)為:YAKLE式中:丫為GDP,衡量總

4、產(chǎn)出;K為全社會固定資產(chǎn)投資,衡量資本投入量;L為就業(yè)人數(shù),衡量勞動投入量;E為能源消費總量,衡量能源投入量;A,,為未知參數(shù)。根據(jù)C-D函數(shù)的假定,一般情形,均在0和1之間,但當,中有負數(shù)時,說明這種投入量的增長,反而會引起GDP的下降,當,中出現(xiàn)大于1的值時,說明這種投入量的增加會引起GDP成倍增加,這在經(jīng)濟學(xué)現(xiàn)象中都是存在的。以我國19852004年的有關(guān)數(shù)據(jù)建立了SPSS數(shù)據(jù)集,參見“data16-2.sa”請以此數(shù)據(jù)集為基礎(chǔ)估計生產(chǎn)函數(shù)中的未知參數(shù)。四、實驗步驟及結(jié)果分析1. 確定非線性回歸模型的類型有上述分析過程確定要建立的回歸模型為:YAKLE式中,丫為自變量,K,L,E為解釋變

5、量,A為常數(shù)項。2. 通過變換將非線性方程轉(zhuǎn)化為線性方程將原回歸模型兩遍同時取對數(shù):InYlnAInKInLInE得:ycx-ix2x3式中,yInY,cInA,x-iInK,x2InL,x3InE。選擇【轉(zhuǎn)換】一【計算變量】,對所有數(shù)據(jù)取對數(shù)完成數(shù)據(jù)的處理,過程及結(jié)果如下圖:=ja;F.*1CBa)LIt:電誕軟/a£H丄tSZ>.丄(.h,i-*e“鬥賽冋jfFRWi的mme<r(n楓rumtdii.fiftKlDKf-fMtlXH-3. 進行初步線性回歸分析(選入所有變量)用最小二乘法建立回歸方程由非線性模型轉(zhuǎn)化為線性模型后,即可按照建立多元線性回歸模型的步驟進行操

6、作,求得回歸方程表達式。(1) 選擇【分析】-【回歸】-【線性】,彈出“線性回歸”對話框。將lnY選入“因變量”框,Ink到InE選入“自變量”框。注意,可以通過點擊“上一張”與“下一張”按鈕切換,選擇不同的自變量構(gòu)建模型,每個模型中可以對不同的自變量采用不同的方法進行回歸?!胺椒ā毕吕蛑杏?個選項,此處先選擇“進入”,即所選變量全部強行進入回歸模型。(2) 點擊“統(tǒng)計量”按鈕,選擇輸出各種常用判別統(tǒng)計量,本案例選擇“估計”、“模型擬合度”、“描述性”、“共線性診斷”,以及殘差中的“Durbin-Watson”檢驗和“個案診斷”。得到如下結(jié)果:得到如下結(jié)果:如線性回歸國帀旳(75A>l

7、|U【廣陽雀劇測量卜怏1旳1t;FS自宸呈,):上掙tKkiL/淀Z;£CU;r迓入'瞬JItADSKij1模型兀總b棋型R調(diào)整R打標準估計的謀urbln*Watson1.9953.991.989.05796763乩預(yù)測S;InE.InL,InK-b囪孌星IrfYAmouab謨型平有和df均店FSig.1回歸5.9651.S&9594.101P,000a贛差.05717X03總計6.02320atsmfiInEJnL,inK*bglt:lnY菲標準化象數(shù)標準卷敎共毀性嬌計星模型B標準詣羞試用版1Sig容差VIF1偉對-4.5301.971-2.422.027bKess

8、074.3288.360.DOO.os4Qs.ggghIriL782.223.1913.507003.1635327InE,21&.00002.0440匚4遲1a.醫(yī)1蠱墾:InY由模型匯總表,R20.991,R20.989,擬合優(yōu)度很強。統(tǒng)計量DW=0.763,該檢驗用于判斷相鄰殘差序列的相關(guān)性,其判斷標準如下:DWvdL,認為殘差序列存在正的一階自相關(guān);du<DW<4-du,認為殘差序列間不存在一階自相關(guān);DW>4-dL,認為殘差序列間存在負的一階自相關(guān);dLvDWvdu或4-du<DW<4-dL時,無法確定殘差序列是否存在自相關(guān)。本例中,k=4,n=

9、21(k為解釋變量的數(shù)目,包括常數(shù)項,n是觀察值的數(shù)目)時,5%的上下界:dL=1.03,dU=1.670有DWdi,認為殘差序列存在一階自相關(guān)。由方差分析表,統(tǒng)計量F=594.101,p值小于0.05,認為方程在95%的置信水平下是顯著的。但是,t0.025(2131)2.110變量lnK、InL、常量lnA的t值均大于2.110,所以這幾個變量對方程的影響都很顯著,而變量lnE的t值很小且p值明顯大于0.05且回歸系數(shù)為零,說明該變量對方程影響不顯著,回歸模型是無效的。4. 消除模型中變量的共線性(逐步回歸)“共線性統(tǒng)計量”中,容忍度Toleranee越接近于0,表示復(fù)共線性越強,越接近于

10、1,復(fù)共線性越弱。而方差膨脹因子VIF的值越接近于1,解釋變量間的多重共線性越弱,如果VIF的值大于或等于10,說明一個解釋變量與其他解釋變量之間有嚴重的多重共線性。本例中,變量InK和InE的VIF值都大于10,說明它們與其他解釋變量之間有嚴重的多重共線性,不符合經(jīng)典假設(shè),需要修正。通過以上結(jié)果分析,采用逐步回歸的方法來消除變量之間的多重共線性。重復(fù)以上步驟從新建立回歸方程,將【進入】替換為【逐步】如下圖所示:得到如下結(jié)果:螟型匯RR方調(diào)整尺方Durbin-Watson12.S90J.991.991.979>.07891.05E23b'WlSS-St)JnKJnLc,InYa.

11、因索量:InY拽型非標準化角褻r蘭找性扯計雖H標;吐逞罐試用版VIF1InK3.U15.7832230251J.5D30.914.uUI-IU1.OUO10002國星)inkInL-4.620,b66.7S21.732UJ6170.101-2.&151H694,375(.0noXooq.2/6*.2?e從上表可以看出通過逐步回歸剔除掉了變量InE,整個模型的擬合優(yōu)度上升,調(diào)整R方從0.989上升至0.990。方差膨脹因子VIF值均小于10,多重共線性已消除。T檢驗的概率明顯小于0.05說明變量對模型的影響顯著。而此時DW值并未有明顯改變,殘差序列仍然存在一階自相關(guān)。此時采用數(shù)據(jù)變換的方

12、法來消除殘差的自相關(guān)。5. 消除殘差的自相關(guān)對于自相關(guān)的處理方法,其基本思想是通過一些數(shù)學(xué)轉(zhuǎn)化,對數(shù)據(jù)進行處理,消除數(shù)據(jù)的自相關(guān)性,在對參數(shù)進行估計。當誤差序列的自相關(guān)系數(shù)已知,且1時,采用差分法,即利用增量數(shù)據(jù)來代替原有的樣本數(shù)據(jù)建立方程。當誤差序列的自相關(guān)系數(shù)未知時,先求處自相關(guān)系數(shù),再通過反復(fù)迭代法消除來自相關(guān)。我們知道DW與之間的近似關(guān)系:DW2(1卩)其中:我們考慮相鄰觀測間存在的一種毎簡單的相關(guān)悄形階自相關(guān).設(shè)6與E屮有如下抉乘*=聲+昭i"'«1茶中旳,嗎叫相互獨立,為卩時"稱匚間存在i階自相關(guān)。此時檢驗渓差的獨立性問題變成了下列假設(shè)槍驗問題

13、,0(4.13)進一步假定碼(0,八并旦丹不太大時,我們叮以引入D-W檢驗,即QW=(4,14J由于是不可觀測的隨機變lb所以等察町間的相關(guān)性常用殘建,來進行,將応|山紂,1)和爲.看成兩個序列英相關(guān)系數(shù)稱為一階自相關(guān)系數(shù)亍因為DW=0.764,代入上式很明顯得出不為1,所以此處不能用差分而采用迭代的方法消除自相關(guān)性。這里先求出lny的一元線性回歸方程:中的殘差e,i=1,,n,將殘差代入如下公式:(eiei,nI)(ei1e2.,n)i1n1el,n1)(ei1i1其中e,n1e,1e2,n1殘差序列代入上式求的一階自相關(guān)系數(shù)r0.60966再令:yyi1ryi,Xi1rXi,i1,.,n1

14、用EXCEL完成數(shù)據(jù)的迭代得到新的數(shù)據(jù),這里用丫1代表原先的lnY,K1代表原先的lnK,L1代表原先的InL。并導(dǎo)入到SPSS中,重復(fù)以上步驟對新的數(shù)據(jù)進行回歸分析。lnYLnKInLnL19.117.3410.829.177.翎10.853.0159993.2002674.2534=80905268+1110.873.669423.2449154.2551SOI119.318,1610.93.&64553.2156594.2729979149.2?人站10.923.5M0672.9451764.274708129.33匚9111.083.6784543.0814944.422511

15、9249.45S.M11.093.76137432675914.334&65355958.111.13.8387153.4678524-3388T27579.748.7411.118.3872663.6188584.3427761599838.7911.123.8919133.4615734-3466795619.91Q.811.133.9170443.4410943505829639.99S.8511.143.948271S.484994£35448636510,06&9111.153.9&94S93.5145114.3583876710.149.0511.

16、174.0068223.617931£37229316910.219.1111.134.023053.5925734.37009397310.319.211.194.0853733.64宛994.37400337510.49.3211.24.1144073.711134-37790&77710,59.4811.214.15953837979714.38181017910.619.7211.224.2085723.9404254.38571358110.743.211.234.2715093.9941074.38961698310.6510+1311.244.3022544.0

17、821754.393520385得出結(jié)果的:蟆輕彳匚總b已預(yù)測變星:L1,K1-模型RRS調(diào)整R污標準怙計的諜Durbln-Watsop-1.964.0441&741.570Jb系數(shù)a因麥量:門複型標準系數(shù)tSig.建線性生魁愜B試用皈VIF1囲)-2,215-2.017.05CK1.B10043.84214111.ODC.5901.6BSL1.920.273.2013.3SB.0041.860數(shù)據(jù)經(jīng)過一次迭代以后DW的值有明顯增加,查表k=3,n=20(k為解釋變量的數(shù)目,包括常數(shù)項,n是觀察值的數(shù)目)時,5%的上下界:dL=1.10,dU=1.54<有du<DW<

18、4-du,認為殘差序列間不存在一階自相關(guān)。此時得到新的回歸方程:丫16. 殘差正態(tài)性檢驗點擊“繪制”按鈕,將“ZRESID”選入丫軸,“ZPRED”選入X軸,繪制散點圖,并在“標準化殘差圖”中選擇“直方圖”,輸出帶有正態(tài)曲線的標準化殘差的直方圖。'框中框中選擇點擊“保存”按鈕,在對話框中保存一些統(tǒng)計量的值,此案例在“預(yù)測值選擇“未標準化”,在“殘差”框中選擇“未標準化”,在“預(yù)測區(qū)間”“均值”和“單值”。其他不變,點擊【繼續(xù)】-【確定】。輸出結(jié)果如下圖:因變童:Y1上寸伯jkSqm.=a歸紐N=2D上面操作已輸出殘差的直方圖,還可以通過【分析】T【描述統(tǒng)計】T【P-P圖】和【分析】-【

19、描述統(tǒng)計】-【Q-Q圖】輸出正態(tài)分布的P-P圖、Q-Q圖,若散點圍繞圖中所給斜線有規(guī)律的分布,則可以認為所檢測變量服從正態(tài)分布。H.飛穿用齢1SL.".1flkb”慶E吃.麹T*二毆股:*島府®.3'U乂曳嘉CJr冥謝蝎金>Z出現(xiàn)1Bm*b(pl*a剤©>gciF'C:P-P圖P-P圖Q-Q圖UnstandardizedResidual止態(tài)QQ圈D1Q305'305'曲望正態(tài)何300-3JQS-規(guī)測值從以上圖形可以初步認為該模型的殘差服從正態(tài)分布。進一步進行K-S檢驗。選擇【分析】-【非參數(shù)檢驗】-【舊對話框】-【1-樣

20、本K-S檢驗】,彈出“單樣本Kolmogorov-Smirnov檢驗”窗口,將未標準化殘差選入變量框,K-S檢驗輸出結(jié)果單樣本KDlrnogorov-Smirnov檢艇IJnslandardizsdResidualN20正態(tài)簽數(shù)"卜均值.0000000標準建.04177618最極端差別絕刪豆.151正094-.151Kolmogorov-SmirnovZ676.751a檢臉分布對正iS分布QB根據(jù)隸據(jù)計算得到。K-S檢驗統(tǒng)計量為0.676,檢驗概率p值為0.751,大于0.05,可以認為在95%的置信水平下,該模型的殘差服從正態(tài)分布。7. 殘差的其他檢驗(1)異方差檢驗:根據(jù)回歸分析輸出的標準化殘差的散點圖,初步判斷是否存在異方差,但此種判斷方法較主觀,且不容易判斷。進一步用Spearman等級相關(guān)檢驗分析是否存在異方差。首先對未標準化殘差取

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論