統(tǒng)計回歸模型舉例_第1頁
統(tǒng)計回歸模型舉例_第2頁
統(tǒng)計回歸模型舉例_第3頁
統(tǒng)計回歸模型舉例_第4頁
統(tǒng)計回歸模型舉例_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計回歸模型舉例 統(tǒng)計回歸模型舉例統(tǒng)計回歸模型舉例 1 1、用、用plot(x,yplot(x,y,* *)作出散點(diǎn)圖,與曲作出散點(diǎn)圖,與曲 線作比較,確定回歸模型曲線;線作比較,確定回歸模型曲線; 2 2、用、用MATLABMATLAB求出相關(guān)參數(shù),得到回歸曲線;求出相關(guān)參數(shù),得到回歸曲線; 3 3、討論回歸曲線模型的顯著性。、討論回歸曲線模型的顯著性。 幾個常見回歸命令幾個常見回歸命令 統(tǒng)計回歸模型舉例 1 1、多元線性回歸命令:、多元線性回歸命令: b,bint,r,rint,stats=regress(y,x,alpha)b,bint,r,rint,stats=regress(y,x,

2、alpha) 2 2、一元多項式回歸命令:、一元多項式回歸命令: p,s=polyfit(x,y,m)p,s=polyfit(x,y,m) 3 3、多元二項式回歸命令:、多元二項式回歸命令: rstool(x,y,model,alpha)rstool(x,y,model,alpha) 線性(線性(linearlinear),完全二次(),完全二次(quadratic),quadratic), 純二次(純二次(purequadratic),purequadratic),交叉(交叉(interaction)interaction) 4 4、非線性回歸命令:、非線性回歸命令: beta,r,j=nl

3、infit(x,y,model,beta0)beta,r,j=nlinfit(x,y,model,beta0) 幾個常見回歸命令幾個常見回歸命令 統(tǒng)計回歸模型舉例 例例1 1 牙膏的銷售量牙膏的銷售量 問問 題題 建立牙膏銷售量與價格、廣告投入之間的模型建立牙膏銷售量與價格、廣告投入之間的模型 預(yù)測在不同價格和廣告費(fèi)用下的牙膏銷售量預(yù)測在不同價格和廣告費(fèi)用下的牙膏銷售量 收集了收集了3030個銷售周期本公司牙膏銷售量、價格、個銷售周期本公司牙膏銷售量、價格、 廣告費(fèi)用,及同期其它廠家同類牙膏的平均售價廣告費(fèi)用,及同期其它廠家同類牙膏的平均售價 9.260.556.804.253.7030 7.

4、930.055.803.853.8029 8.510.256.754.003.752 7.38-0.055.503.803.851 銷售量銷售量 ( (百萬支百萬支) ) 價格差價格差 (元)(元) 廣告費(fèi)用廣告費(fèi)用 ( (百萬元百萬元) ) 其它廠家其它廠家 價格價格( (元元) ) 本公司價本公司價 格格( (元元) ) 銷售銷售 周期周期 統(tǒng)計回歸模型舉例 令令y y表示公司牙膏的銷售量,表示公司牙膏的銷售量, x1表示表示其它廠家與本公司價格差,其它廠家與本公司價格差, x2 表示表示公司廣告費(fèi)用,則數(shù)據(jù)如下:公司廣告費(fèi)用,則數(shù)據(jù)如下: x1=-0.05 0.25 0.6 0 0.25

5、 0.2 0.15 0.05 x1=-0.05 0.25 0.6 0 0.25 0.2 0.15 0.05 -0.15 0.15 0.2 0.1 0.4 0.45 0.35 0.3 0.5 -0.15 0.15 0.2 0.1 0.4 0.45 0.35 0.3 0.5 0.5 0.4 -0.05 -0.05 -0.1 0.2 0.1 0.5 0.6 -0.5 0.4 -0.05 -0.05 -0.1 0.2 0.1 0.5 0.6 - 0.05 0 0.05 0.55;0.05 0 0.05 0.55; x2=5.5 6.75 7.25 5.5 7 6.5 6.75 5.25 5.25 x2

6、=5.5 6.75 7.25 5.5 7 6.5 6.75 5.25 5.25 6 6.5 6.25 7 6.9 6.8 6.8 7.1 7 6.8 6.5 6 6.5 6.25 7 6.9 6.8 6.8 7.1 7 6.8 6.5 6.25 6 6.5 7 6.8 6.8 6.5 5.75 5.8 6.8;6.25 6 6.5 7 6.8 6.8 6.5 5.75 5.8 6.8; y=7.38 8.51 9.52 7.5 9.33 8.28 8.75 y=7.38 8.51 9.52 7.5 9.33 8.28 8.75 7.87 7.1 8 7.89 8.15 9.1 8.86 8.9

7、 8.87 7.87 7.1 8 7.89 8.15 9.1 8.86 8.9 8.87 9.26 9 8.75 7.95 7.65 7.27 8 8.5 8.75 9.21 9.26 9 8.75 7.95 7.65 7.27 8 8.5 8.75 9.21 8.27 7.67 7.93 9.26;8.27 7.67 7.93 9.26; 統(tǒng)計回歸模型舉例 下面探討下面探討y y與與x x1 1、x x2 2的關(guān)的關(guān) 系:系: 用用matlabmatlab軟件作圖:軟件作圖: plot(xplot(x1 1,y,y,* *);); plot(xplot(x2 2,y,y,* *) 運(yùn)行得如下

8、圖形:運(yùn)行得如下圖形: 110 xy -0.200.20.40.6 7 7.5 8 8.5 9 9.5 10 x1 y 從右圖看出,從右圖看出,y y與與x x1 1成線成線 性關(guān)系,性關(guān)系,y y與與x x2 2成二次曲成二次曲 線關(guān)系。線關(guān)系。 55.566.577.5 7 7.5 8 8.5 9 9.5 10 x2 y 2 22210 xxy 2 2322110 xxxy 統(tǒng)計回歸模型舉例 x3=x2.2; x3=x2.2; x=ones(30,1) x1 x2 x3; x=ones(30,1) x1 x2 x3; b,bint,r,rint,stats=regress(y,x) b,b

9、int,r,rint,stats=regress(y,x) 運(yùn)行結(jié)果:運(yùn)行結(jié)果: 0.6829 1.9311 0.6829 1.9311 -7.4989 0.1077 -7.4989 0.1077 , 模型求解模型求解 MATLAB 統(tǒng)計工具箱統(tǒng)計工具箱 2 221 3486. 06956. 37 . 3 . 13244.17xxxy 統(tǒng)計回歸模型舉例 結(jié)果分析結(jié)果分析 y的的90.54%可由模型確定可由模型確定 參數(shù)參數(shù)參數(shù)估計值參數(shù)估計值置信區(qū)間置信區(qū)間 17.32445.7282 28.9206 1.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34

10、860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3 2 2322110 xxxy F遠(yuǎn)超過遠(yuǎn)超過F檢驗的臨界值檢驗的臨界值 P x=ones(30,1) x1,x2 (x2.2) (x1. x=ones(30,1) x1,x2 (x2.2) (x1.* *x2);x2); b,bint,r,rint,stats=regress(y,x) b,bint,r,rint,stats=regress(y,x) , 統(tǒng)計回歸模型舉例 模型比較模型比較 x1和和x2對對y 的的影響?yīng)毩⒂绊應(yīng)毩?2 2322110 xxxy 214 2 2322110

11、xxxxxy 參數(shù)參數(shù)參數(shù)估計值參數(shù)估計值置信區(qū)間置信區(qū)間 17.32445.7282 28.9206 1.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3 參數(shù)參數(shù)參數(shù)估計值參數(shù)估計值置信區(qū)間置信區(qū)間 29.113313.7013 44.5252 11.13421.9778 20.2906 -7.6080-12.6932 -2.5228 0.67120.2538 1.0887 -1.4777-2.8518 -0.1037 R2=0.9209 F=72

12、.7771 p=0.0000 3 0 1 2 4 x1和和x2對對y 的影響有的影響有 交互作用交互作用 統(tǒng)計回歸模型舉例 由于由于R R2 2有所提高,所以模型有所提高,所以模型( (* * *) )比模型(比模型(* *) 有所改進(jìn),并且參數(shù)的置信區(qū)間不再包含有所改進(jìn),并且參數(shù)的置信區(qū)間不再包含0 0 點(diǎn),所以有理由認(rèn)為模型(點(diǎn),所以有理由認(rèn)為模型(* * *)比模型()比模型(* *) 更符合實際。更符合實際。 預(yù)測比較:預(yù)測比較: x1=0.2;x2=6.5;x1=0.2;x2=6.5; Y=b(1)+b(2)Y=b(1)+b(2)* *x1+b(3)x1+b(3)* *x2+b(4)

13、x2+b(4)* *(x2.2)+b(x2.2)+b (5)(5)* *(x1.(x1.* *x2)x2) 統(tǒng)計回歸模型舉例 兩模型銷售量預(yù)測兩模型銷售量預(yù)測比較比較 214 2 2322110 xxxxxy 2 2322110 xxxy 2933. 8 y(百萬支百萬支) 區(qū)間區(qū)間 7.8230,8.7636 區(qū)間區(qū)間 7.8953,8.7592 3272. 8 y(百萬支百萬支) 控制價格差控制價格差x1=0.2元,投入廣告費(fèi)元,投入廣告費(fèi)x2 預(yù)測區(qū)間長度更短預(yù)測區(qū)間長度更短 略有增加略有增加 y 統(tǒng)計回歸模型舉例 完全二次多項式模型完全二次多項式模型 2 25 2 1421322110

14、 xxxxxxy x=x1 x2;x=x1 x2; rstool(x,y,quadratic) rstool(x,y,quadratic) 運(yùn)行結(jié)果:運(yùn)行結(jié)果: 剩余標(biāo)準(zhǔn)差為剩余標(biāo)準(zhǔn)差為0.2.830.2.83較較 小,說明回歸模型的顯小,說明回歸模型的顯 著性比較好。著性比較好。 統(tǒng)計回歸模型舉例 問題:一家高技術(shù)公司人事部門為研究軟件開發(fā)問題:一家高技術(shù)公司人事部門為研究軟件開發(fā) 人員的薪金與他們的資歷、管理責(zé)任、教育程度人員的薪金與他們的資歷、管理責(zé)任、教育程度 等因素之間的關(guān)系,要建立一個數(shù)學(xué)模型,以便等因素之間的關(guān)系,要建立一個數(shù)學(xué)模型,以便 分析公司人事策略的合理性,并作為新聘人員

15、的分析公司人事策略的合理性,并作為新聘人員的 薪金的參考。他們認(rèn)為目前公司人員的薪金總體薪金的參考。他們認(rèn)為目前公司人員的薪金總體 上是合理的,可以作為建模的依據(jù)。于是調(diào)查了上是合理的,可以作為建模的依據(jù)。于是調(diào)查了 4646名軟件開發(fā)人員的檔案資料,如下表,其中資名軟件開發(fā)人員的檔案資料,如下表,其中資 歷一列指從事專業(yè)工作的年數(shù),管理一列中:歷一列指從事專業(yè)工作的年數(shù),管理一列中:1 1 表示管理人員,表示管理人員,0 0表示非管理人員,教育一列中:表示非管理人員,教育一列中: 1 1表示中學(xué)程度,表示中學(xué)程度,2 2表示大學(xué)程度,表示大學(xué)程度,3 3表示更高程表示更高程 度(研究生)。度

16、(研究生)。 例例2 2 軟件開發(fā)人員的薪金軟件開發(fā)人員的薪金 統(tǒng)計回歸模型舉例 編號編號薪金薪金資歷資歷管理管理教育教育編號編號薪金薪金資歷資歷管理管理教育教育 1 113876138761 11 11 1131319800198003 31 13 3 2 211608116081 10 03 3141411417114174 40 01 1 3 318701187011 11 13 3151520263202634 41 13 3 4 411283112831 10 02 2161613231132314 40 03 3 5 511767117671 10 03 3171712884128

17、844 40 02 2 6 620872208722 21 12 2181813245132455 50 02 2 7 711772117722 20 02 2191913677136775 50 03 3 8 810535105352 20 01 1202015965159655 51 11 1 9 912195121952 20 03 3212112366123666 60 01 1 101012313123133 30 02 2222221352213526 61 13 3 111114975149753 31 11 1232313839138396 60 02 2 1212213712

18、13713 31 12 2242422884228846 61 12 2 統(tǒng)計回歸模型舉例 編號編號薪金薪金資歷資歷管理管理教育教育編號編號薪金薪金資歷資歷管理管理教育教育 252516978169787 71 11 13636168821688212120 02 2 262614803148038 80 02 23737241702417012121 13 3 272717404174048 81 11 13838159901599013130 01 1 282822184221848 81 13 33939263302633013131 12 2 292913548135488 80 01

19、 14040179491794914140 02 2 3030144671446710100 01 14141256852568515151 13 3 3131159421594210100 02 24242278372783716161 12 2 3232231742317410101 13 34343188381883816160 02 2 3333237802378010101 12 24444174831748316160 01 1 3434254102541011111 12 24545192071920717170 02 2 3535148611486111110 01 14646

20、193461934620200 01 1 統(tǒng)計回歸模型舉例 分析與假設(shè)分析與假設(shè)按照常識,薪金自然隨按照常識,薪金自然隨 著資歷(年)的增長而增加,管理人員著資歷(年)的增長而增加,管理人員 的薪金應(yīng)高于非管理人員,教育程度越的薪金應(yīng)高于非管理人員,教育程度越 高薪金也越高。高薪金也越高。 令令y y表示薪金,表示薪金,x1x1表示資歷,表示資歷,x2x2表示是否表示是否 管理人員,管理人員,x3x3表示學(xué)歷表示學(xué)歷 ,研研究究生生 ,大大學(xué)學(xué) ,中中學(xué)學(xué) , ,非非管管理理人人員員 ,管管理理人人員員 3 2 1 0 1 32 xx 統(tǒng)計回歸模型舉例 基本模型基本模型假設(shè)薪金假設(shè)薪金y y與

21、資歷與資歷x x1 1、管理、管理x x2 2、學(xué)、學(xué) 歷歷x x3 3成線性關(guān)系成線性關(guān)系: : 機(jī)誤差。機(jī)誤差。 是隨是隨是待估計的回歸系數(shù),是待估計的回歸系數(shù),其中其中 3210 3322110 , xxxy 統(tǒng)計回歸模型舉例 y=13876 11608 18701 11283 11767 y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 21371 19800

22、 11417 20263 13231 12884 13245 13677 15965 12366 21352 13839 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 16882 24170 15990 26330

23、 17949 25685 27837 18838 17483 19207 19346;27837 18838 17483 19207 19346; x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20;12 13 13 14 15 16 16 16 17 20; 統(tǒng)

24、計回歸模型舉例 x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0;0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0; x3=1 3 3 2 3 2 2 1 3 2 1 2 3 1 3 3 2 2 3 1 1 3 2 x3=1 3 3 2 3 2 2 1 3 2 1 2 3 1 3 3 2 2 3 1 1 3 2 2 1

25、 2 1 3 1 1 2 3 2 3 1 2 3 1 2 2 3 2 2 1 2 1;2 1 2 1 3 1 1 2 3 2 3 1 2 3 1 2 2 3 2 2 1 2 1; x=ones(46,1),x1,x2,x3;x=ones(46,1),x1,x2,x3; b,bint,r,rint,stats=regress(y,x) b,bint,r,rint,stats=regress(y,x) b = 1.0e+003 b = 1.0e+003 * * bint = 1.0e+003 bint = 1.0e+003 * * 統(tǒng)計回歸模型舉例 由于由于R R2 2=0.9327=0.9327

26、接近于接近于1 1,F(xiàn)= F= 大于臨界值,大于臨界值, p0.05 p b,bint,r,rint,stats=regress(y,x) b,bint,r,rint,stats=regress(y,x) 統(tǒng)計回歸模型舉例 323 21 748.1019139.1077 249.4525366.538915.8135 xxx xxy 回回歸歸方方程程為為 R R2 2=0.93870.9327,=0.93870.9327,所以,該模型較好。所以,該模型較好。 統(tǒng)計回歸模型舉例 ,其它,其它 ,大學(xué),大學(xué) ,其它,其它 ,中學(xué),中學(xué) 0 1 0 1 43 xx 表表示示研研究究生生用用 表表示示

27、大大學(xué)學(xué)用用 表表示示這這樣樣中中學(xué)學(xué)用用 0 1, 0 0, 1 43 53 43 xx xx xx 為了表示三種教育程度,也可引進(jìn)兩個為了表示三種教育程度,也可引進(jìn)兩個0101 變量來表示:變量來表示: 隨機(jī)誤差。隨機(jī)誤差。 是是是待估計的回歸系數(shù),是待估計的回歸系數(shù),其中其中 43210 443322110 , xxxxy 統(tǒng)計回歸模型舉例 y=13876 11608 18701 11283 11767 20872 11772 y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 1

28、1417 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 15965 12366 20263 13231 12884 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 13548 14467 15942 23174 23780 25410 14861 1

29、6882 24170 15990 26330 17949 25685 27837 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19346;18838 17483 19207 19346; x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 6 6 6 7 8 8 8 8 10 10 10 10 11 1

30、1 12 12 13 13 14 15 16 16 16 17 20;14 15 16 16 16 17 20; x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0;0 0; 統(tǒng)計回歸模型舉例 X3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 X3

31、=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1;0 0 0 1 0 1; X4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 X4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 0 1 1 0 0 0 1 1 0 1 0 0 0 0 1 0 1

32、1 0 1 0 0 1 1 0 1 1 0 1 0;0 1 1 0 1 0; x=ones(46,1),x1,x2,x3,x4;x=ones(46,1),x1,x2,x3,x4; b,bint,r,rint,stats=regress(y,x)b,bint,r,rint,stats=regress(y,x) 統(tǒng)計回歸模型舉例 stats = 0.956691811962102 stats = 0.956691811962102 226.425798835777 226.425798835777 0 0 統(tǒng)計回歸模型舉例 4321 7 .1472 .29945 .68821 .5467 .110

33、32xxxxy R R2 2=0.956691811962102 =0.956691811962102 F=226.425798835777 F=226.425798835777 p0.05 p b,bint,r,rint,stats=regress(y,X) b,bint,r,rint,stats=regress(y,X) 統(tǒng)計回歸模型舉例 stats =0.998829102890402 , stats =0.998829102890402 , 5544.79903960134 , 0 5544.79903960134 , 0 統(tǒng)計回歸模型舉例 R R2 2 所以,該模型較好。所以,該模型

34、較好。 42324 321 0 .18366 .30704 .348 5 .17260 .70488 .968 .11203 xxxxx xxxy 統(tǒng)計回歸模型舉例 例例3 3 投資額與國民生產(chǎn)總值和物價指數(shù)投資額與國民生產(chǎn)總值和物價指數(shù) 問問 題題 建立投資額模型,研究某地區(qū)實際投資額與國民建立投資額模型,研究某地區(qū)實際投資額與國民 生產(chǎn)總值生產(chǎn)總值 ( GNP ) ( GNP ) 及物價指數(shù)及物價指數(shù) ( PI ) ( PI ) 的關(guān)系的關(guān)系 2010 199 188 177 166 155 144 133 122 111 物價物價 指數(shù)指數(shù) 國民生國民生 產(chǎn)總值產(chǎn)總值 投資額投資額年份年

35、份 序號序號 物價物價 指數(shù)指數(shù) 國民生產(chǎn)國民生產(chǎn) 總值總值 投資額投資額年份年份 序號序號 根據(jù)對未來根據(jù)對未來GNPGNP及及PIPI的估計,預(yù)測未來投資額的估計,預(yù)測未來投資額 該地區(qū)連續(xù)該地區(qū)連續(xù)2020年的統(tǒng)計數(shù)據(jù)年的統(tǒng)計數(shù)據(jù) 統(tǒng)計回歸模型舉例 時間序列中同一變量的順序觀測值之間存在自相關(guān)時間序列中同一變量的順序觀測值之間存在自相關(guān) 以時間為序的數(shù)據(jù),稱為時間序列以時間為序的數(shù)據(jù),稱為時間序列 分分 析析 許多經(jīng)濟(jì)數(shù)據(jù)在時間上有一定的滯后性許多經(jīng)濟(jì)數(shù)據(jù)在時間上有一定的滯后性 需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型 若采用普通回歸模型直接處

36、理,將會出現(xiàn)不良后果若采用普通回歸模型直接處理,將會出現(xiàn)不良后果 投資額與國民生產(chǎn)總值和物價指數(shù)投資額與國民生產(chǎn)總值和物價指數(shù) 1.32341718.0257.9140.7676 756.0125.74 1.25791549.2206.1130.7436 691.1113.53 1.15081434.2228.7120.7277 637.797.42 1.05751326.4 229.8110.7167 596.7 90.91 物價物價 指數(shù)指數(shù) 國民生國民生 產(chǎn)總值產(chǎn)總值 投資額投資額年份年份 序號序號 物價物價 指數(shù)指數(shù) 國民生產(chǎn)國民生產(chǎn) 總值總值 投資額投資額年份年份 序號序號 統(tǒng)計回歸

37、模型舉例 y=90.9 97.4 113.5 125.7 122.8 133.3 149.3 y=90.9 97.4 113.5 125.7 122.8 133.3 149.3 144.2 166.4 195.0 229.8 228.7 206.1 257.9 144.2 166.4 195.0 229.8 228.7 206.1 257.9 324.1 386.6 423.0 401.9 474.9 424.5;324.1 386.6 423.0 401.9 474.9 424.5; x1=596.7 637.7 691.1 756.0 799.0 873.4 x1=596.7 637.7

38、691.1 756.0 799.0 873.4 944.0 992.7 1077.6 1185.9 1326.4 1434.2 944.0 992.7 1077.6 1185.9 1326.4 1434.2 1549.2 1718.0 1918.3 2163.9 2417.8 2631.7 1549.2 1718.0 1918.3 2163.9 2417.8 2631.7 2954.7 3073.0;2954.7 3073.0; x2=0.7167 0.7277 0.7436 0.7676 0.7906 x2=0.7167 0.7277 0.7436 0.7676 0.7906 0.8254

39、0.8679 0.9145 0.9601 1.0 1.0575 0.8254 0.8679 0.9145 0.9601 1.0 1.0575 1.1508 1.2579 1.3234 1.4005 1.5042 1.6342 1.1508 1.2579 1.3234 1.4005 1.5042 1.6342 1.7842 1.9514 2.0688;1.7842 1.9514 2.0688; t 年份,年份, yt 投資額,投資額,x1t GNPGNP, x2t 物價指數(shù)物價指數(shù) 統(tǒng)計回歸模型舉例 畫出散點(diǎn)圖畫出散點(diǎn)圖 投資額與投資額與 GNPGNP及物價指數(shù)間均有很強(qiáng)的線性關(guān)系及物價指數(shù)間均

40、有很強(qiáng)的線性關(guān)系 tttt xxy 22110 0, 1, 2 回歸系數(shù)回歸系數(shù) x1t yt x2t yt t 對對t t相互相互獨(dú)立的零均值正態(tài)隨機(jī)變量獨(dú)立的零均值正態(tài)隨機(jī)變量 Plot(x1,y,Plot(x1,y, * *) Plot(x2,y,Plot(x2,y, * *) 統(tǒng)計回歸模型舉例 x=ones(20,1) x1 x2x=ones(20,1) x1 x2; b,bint,r,rint,stats=regress(y,x)b,bint,r,rint,stats=regress(y,x) ; ; ; ; stats =0.9999 stats =0.9999 0 0 統(tǒng)計回歸模

41、型舉例 基本回歸模型的結(jié)果與分析基本回歸模型的結(jié)果與分析 ttt xxy 21 479.8596185. 0725.322 MATLAB 統(tǒng)計工具箱統(tǒng)計工具箱 參數(shù)參數(shù)參數(shù)估計值參數(shù)估計值置信區(qū)間置信區(qū)間 0322.7250322.7250224.3386 421.1114224.3386 421.1114 10.61850.61850.4773 0.75960.4773 0.7596 2-859.4790-859.4790-1121.48,-597.48-1121.48,-597.48 R R2 2= 0.9908 = 0.9908 F F = 919.8529 = 919.8529 p p

42、=0.0000=0.0000 剩余標(biāo)準(zhǔn)差剩余標(biāo)準(zhǔn)差 s s 沒有考慮時間序列數(shù)據(jù)的滯后性影響沒有考慮時間序列數(shù)據(jù)的滯后性影響 R2,擬合度高,擬合度高模型優(yōu)點(diǎn)模型優(yōu)點(diǎn) 模型缺點(diǎn)模型缺點(diǎn) 可能忽視了隨機(jī)誤差存在自相關(guān);如果可能忽視了隨機(jī)誤差存在自相關(guān);如果 存在自相關(guān)性,用此模型會有不良后果存在自相關(guān)性,用此模型會有不良后果 統(tǒng)計回歸模型舉例 例例4 4、教學(xué)評估、教學(xué)評估 問題:為了考評教師的教學(xué)質(zhì)量,教學(xué)研究部門設(shè)計了問題:為了考評教師的教學(xué)質(zhì)量,教學(xué)研究部門設(shè)計了 一個教學(xué)評估表,對學(xué)生進(jìn)行一次問卷調(diào)查,要求學(xué)生一個教學(xué)評估表,對學(xué)生進(jìn)行一次問卷調(diào)查,要求學(xué)生 對對1212名教師的名教師的

43、1515門課程(其中門課程(其中3 3位教師有位教師有2 2門課)按以下門課)按以下 7 7項內(nèi)容打分,分值為項內(nèi)容打分,分值為1515分(分(5 5分最好,分最好,1 1分最差)。分最差)。 X1X1課程內(nèi)容的合理性;課程內(nèi)容的合理性;x2x2主要問題展開的邏輯性;主要問題展開的邏輯性; X3X3回答學(xué)生問題的有效性;回答學(xué)生問題的有效性;x4x4課下交流的有助性;課下交流的有助性; X5X5教科書的幫助性;教科書的幫助性;x6x6考試平分的公平性;考試平分的公平性; yy對教師的總體評價。對教師的總體評價。 統(tǒng)計回歸模型舉例 收回問卷調(diào)查后,得到了學(xué)生對收回問卷調(diào)查后,得到了學(xué)生對1212

44、位教師位教師1515 門課的各項評分的平均值,見下表:門課的各項評分的平均值,見下表: 教師編號教師編號課程編號課程編號x1x1x2x2x3x3x4x4x5x5x6x6y y 1 12012014.464.464.424.424.234.234.14.14.564.564.374.374.114.11 2 22242244.114.113.823.823.293.293.63.63.993.993.823.823.383.38 3 33013013.583.583.313.313.243.243.763.764.394.393.753.753.173.17 4 43013014.424.424

45、.374.374.344.344.44.43.633.634.274.274.394.39 5 53013014.624.624.474.474.534.534.674.674.634.634.574.574.694.69 6 63093093.183.183.823.823.923.923.623.623.53.54.144.143.253.25 7 73113112.472.472.792.793.583.583.53.52.842.843.843.842.842.84 8 83113114.294.293.923.924.054.053.763.762.762.764.114.113.9

46、53.95 9 93123124.414.414.364.364.274.274.754.754.594.594.114.114.184.18 10103123124.594.594.344.344.244.244.394.392.642.644.384.384.444.44 11113333334.554.554.454.454.434.434.574.574.454.454.44.44.474.47 12124244244.674.674.644.644.524.524.394.393.483.484.214.214.614.61 3 33513513.713.713.413.413.39

47、3.394.184.184.084.084.064.063.173.17 4 44114114.284.284.454.454.14.14.074.073.763.764.434.434.154.15 9 94244244.244.244.384.384.354.354.484.484.154.154.54.54.334.33 統(tǒng)計回歸模型舉例 教學(xué)研究部門認(rèn)為,所列各項具體內(nèi)容教學(xué)研究部門認(rèn)為,所列各項具體內(nèi)容x1x6x1x6不一定不一定 每項都對教師總體評價每項都對教師總體評價y y有顯著影響,并且各項內(nèi)容之間有顯著影響,并且各項內(nèi)容之間 也可能存在很強(qiáng)的相關(guān)性,他們希望得到一個總體評價也

48、可能存在很強(qiáng)的相關(guān)性,他們希望得到一個總體評價 與各項具體內(nèi)容之間的模型,這個模型應(yīng)與各項具體內(nèi)容之間的模型,這個模型應(yīng) 盡量簡單和有盡量簡單和有 效,并且由由此能給教師一個合理的建議,以提高總體效,并且由由此能給教師一個合理的建議,以提高總體 評價。評價。 逐步回歸的基本思想逐步回歸的基本思想先確定一個包含若干自變量的初先確定一個包含若干自變量的初 始集合,然后每次從集合外的變量中引入一個對因變量影始集合,然后每次從集合外的變量中引入一個對因變量影 響最大的,再對集合中的變量進(jìn)行檢驗,從變得不顯著的響最大的,再對集合中的變量進(jìn)行檢驗,從變得不顯著的 變量中移出一個影響最小的。依次進(jìn)行,直到不

49、能引入和變量中移出一個影響最小的。依次進(jìn)行,直到不能引入和 移出為止。引入和移出都以給定的顯著性水平為標(biāo)準(zhǔn)。移出為止。引入和移出都以給定的顯著性水平為標(biāo)準(zhǔn)。 雖然給出了雖然給出了6 6個變量,但是我們希望從中挑選出對因變個變量,但是我們希望從中挑選出對因變 量量y y有顯著影響的哪些來建立回歸模型。為此我們采用有顯著影響的哪些來建立回歸模型。為此我們采用 逐步回歸方法。逐步回歸方法。 統(tǒng)計回歸模型舉例 MATLABMATLAB統(tǒng)計工具箱中逐步回歸命令為:統(tǒng)計工具箱中逐步回歸命令為:stepwisestepwise 通常的用法為:通常的用法為: Stepwise(x,y,inmdel,pente

50、r,premove)Stepwise(x,y,inmdel,penter,premove) x x:自變量數(shù)據(jù)矩陣;:自變量數(shù)據(jù)矩陣;y y:因變量數(shù)據(jù);:因變量數(shù)據(jù); InmodelInmodel:自變量初始集合的指標(biāo)(即矩陣:自變量初始集合的指標(biāo)(即矩陣x x中哪些列進(jìn)入中哪些列進(jìn)入 初始集合),缺省時設(shè)定為沒有選取任何初始集合),缺省時設(shè)定為沒有選取任何x x的列向量;的列向量; PenterPenter:引入變量時設(shè)定的最大:引入變量時設(shè)定的最大p p值,缺省時為值,缺省時為0.050.05; PremovePremove:移出變量時設(shè)定的最?。阂瞥鲎兞繒r設(shè)定的最小p p值,缺省時為值

51、,缺省時為0.100.10。 注意:注意: Premove Premove 的值不能小于的值不能小于PenterPenter的值。的值。 統(tǒng)計回歸模型舉例 x1=4.46 4.11 3.58 4.42 4.62 3.18 2.47 4.29 4.41 x1=4.46 4.11 3.58 4.42 4.62 3.18 2.47 4.29 4.41 4.59 4.55 4.67 3.71 4.28 4.24;4.59 4.55 4.67 3.71 4.28 4.24; x2=4.42 3.82 3.31 4.37 4.47 3.82 2.79 3.92 4.36 x2=4.42 3.82 3.31

52、 4.37 4.47 3.82 2.79 3.92 4.36 4.34 4.45 4.64 3.41 4.45 4.38;4.34 4.45 4.64 3.41 4.45 4.38; x3=4.23 3.29 3.24 4.34 4.53 3.92 3.58 4.05 4.27 x3=4.23 3.29 3.24 4.34 4.53 3.92 3.58 4.05 4.27 4.24 4.43 4.52 3.39 4.10 4.35;4.24 4.43 4.52 3.39 4.10 4.35; x4=4.10 3.60 3.76 4.40 4.67 3.62 3.50 3.76 4.75 x4=

53、4.10 3.60 3.76 4.40 4.67 3.62 3.50 3.76 4.75 4.39 4.57 4.39 4.18 4.07 4.48;4.39 4.57 4.39 4.18 4.07 4.48; x5=4.56 3.99 4.39 3.63 4.63 3.50 2.84 2.76 4.59 x5=4.56 3.99 4.39 3.63 4.63 3.50 2.84 2.76 4.59 2.64 4.45 3.48 4.06 3.76 4.15;2.64 4.45 3.48 4.06 3.76 4.15; x6=4.37 3.82 3.75 4.27 4.57 4.14 3.84

54、 4.11 4.11 x6=4.37 3.82 3.75 4.27 4.57 4.14 3.84 4.11 4.11 4.38 4.40 4.21 4.06 4.43 4.50;4.38 4.40 4.21 4.06 4.43 4.50; y=4.11 3.38 3.17 4.39 4.69 3.25 2.84 3.95 4.18 y=4.11 3.38 3.17 4.39 4.69 3.25 2.84 3.95 4.18 4.44 4.47 4.61 3.17 4.15 4.33;4.44 4.47 4.61 3.17 4.15 4.33; x=x1 x2 x3 x4 x5 x6;x=x1

55、x2 x3 x4 x5 x6; 統(tǒng)計回歸模型舉例 0123 X1 X2 X3 X4 X5 X6 Coefficients with Error Bars Coeff. t-stat p-val 0.883349 7.3312 0.0000 1.06389 9.6132 0.0000 1.24575 7.9951 0.0000 1.20803 5.2029 0.0002 0.160365 0.6535 0.5248 1.98247 5.2554 0.0002 1 -1 0 1 2 Model History RMSE 統(tǒng)計回歸模型舉例 -0.500.51 X1 X2 X3 X4 X5 X6 Co

56、efficients with Error Bars Coeff. t-stat p-val 0.509906 8.7241 0.0000 -0.113718 -0.6330 0.5397 0.767794 9.4627 0.0000 0.0832997 0.7409 0.4743 -0.0179976 -0.4162 0.6853 0.110896 0.5298 0.6068 12345 0 0.5 1 Model History RMSE 統(tǒng)計回歸模型舉例 2471. 17678. 05099. 0 21 xxy 模型解釋:在最終模型里回歸變量只有模型解釋:在最終模型里回歸變量只有x1,x

57、2x1,x2, 是一個簡單易用的模型。據(jù)此可把課程內(nèi)容組是一個簡單易用的模型。據(jù)此可把課程內(nèi)容組 織的合理性(織的合理性(x1x1)和回答學(xué)生問題的有效性)和回答學(xué)生問題的有效性 (x3)(x3),列入考評的重點(diǎn),模型(,列入考評的重點(diǎn),模型(* *)表明,)表明,x1x1 的分值每增加一分,對教師的總體評價就增加的分值每增加一分,對教師的總體評價就增加 0.50.5分;分;x3x3的每增加的每增加1 1分,對教師的總體評價就分,對教師的總體評價就 增加增加0.770.77分,應(yīng)建議教師注重這兩方面的工作。分,應(yīng)建議教師注重這兩方面的工作。 為了分析其他自變量沒有最終進(jìn)入模型的原因,為了分析其

58、他自變量沒有最終進(jìn)入模型的原因, 可以計算可以計算x1x1x6,yx6,y的相關(guān)系數(shù)。的相關(guān)系數(shù)。 統(tǒng)計回歸模型舉例 A=x y;A=x y; corrcoef(A) corrcoef(A) ans =ans = , , , , , , ,1.0000 1.0000 一般認(rèn)為,兩個變量的相關(guān)系數(shù)超過一般認(rèn)為,兩個變量的相關(guān)系數(shù)超過0.850.85時才具有顯著時才具有顯著 的相關(guān)性。由上面結(jié)果知道,與的相關(guān)性。由上面結(jié)果知道,與y y相關(guān)性顯著的只有相關(guān)性顯著的只有 x1,x2,x3x1,x2,x3,而,而X2X2未進(jìn)入最終模型,是由于它與未進(jìn)入最終模型,是由于它與x1,x3x1,x3的的 相關(guān)

59、性顯著(相關(guān)性顯著(r12=0.9008r12=0.9008,r23=0.8504r23=0.8504),可以說,模),可以說,模 型中有了型中有了x1,x3x1,x3之后,變量之后,變量X2X2是多余的,應(yīng)該去掉。是多余的,應(yīng)該去掉。 統(tǒng)計回歸模型舉例 例例6 6 冠心病與年齡冠心病與年齡 問題:冠心病簡稱問題:冠心病簡稱CHDCHD,是一種常見的心臟疾病,是一種常見的心臟疾病, 嚴(yán)重地危害著人類的健康。到目前為止,其疾病尚嚴(yán)重地危害著人類的健康。到目前為止,其疾病尚 未完全研究清楚,醫(yī)學(xué)界普遍認(rèn)同的、重要的易患未完全研究清楚,醫(yī)學(xué)界普遍認(rèn)同的、重要的易患 因素是高領(lǐng)、高血壓、糖尿病、動脈粥

60、樣硬化及家因素是高領(lǐng)、高血壓、糖尿病、動脈粥樣硬化及家 族史等。多項研究表明,冠心病發(fā)病率隨著年齡的族史等。多項研究表明,冠心病發(fā)病率隨著年齡的 增加而上升,在冠心病的流行病學(xué)研究中,年齡也增加而上升,在冠心病的流行病學(xué)研究中,年齡也 最常見的混雜因素之一。最常見的混雜因素之一。 為了更好地說明冠心病發(fā)病率與年齡的關(guān)系,醫(yī)學(xué)為了更好地說明冠心病發(fā)病率與年齡的關(guān)系,醫(yī)學(xué) 界對界對100100名不同年齡的人進(jìn)行觀察,名不同年齡的人進(jìn)行觀察,表表1 1給出了這給出了這 100100名被觀察者的年齡及是否患冠心病的數(shù)據(jù)。名被觀察者的年齡及是否患冠心病的數(shù)據(jù)。 統(tǒng)計回歸模型舉例 表表1 1001 100

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論