數(shù)學建?;貧w分析PPT演示課件_第1頁
數(shù)學建?;貧w分析PPT演示課件_第2頁
數(shù)學建?;貧w分析PPT演示課件_第3頁
數(shù)學建模回歸分析PPT演示課件_第4頁
數(shù)學建?;貧w分析PPT演示課件_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2020/7/7,.,1,數(shù)學建模與數(shù)學實驗,回歸分析,2020/7/7,.,2,實驗目的,實驗內(nèi)容,1回歸分析的基本理論.,3實驗作業(yè).,2用數(shù)學軟件求解回歸分析問題.,2020/7/7,.,3,一元線性回歸,多元線性回歸,回歸分析,數(shù)學模型及定義,*模型參數(shù)估計,*檢驗、預測與控制,可線性化的一元非線 性回歸(曲線回歸),數(shù)學模型及定義,*模型參數(shù)估計,逐步回歸分析,* 多元線性回歸中的 檢驗與預測,2020/7/7,.,4,一、數(shù)學模型,例1 測16名成年女子的身高與腿長所得數(shù)據(jù)如下:,以身高x為橫坐標,以腿長y為縱坐標將這些數(shù)據(jù)點(xi,yi)在平面直角坐標系上標出.,散點圖,解答,2

2、020/7/7,.,5,一元線性回歸分析的主要任務是:,返回,2020/7/7,.,6,二、模型參數(shù)估計,1回歸系數(shù)的最小二乘估計,2020/7/7,.,7,2020/7/7,.,8,返回,2020/7/7,.,9,三、檢驗、預測與控制,1回歸方程的顯著性檢驗,2020/7/7,.,10,()F檢驗法,()t 檢驗法,2020/7/7,.,11,()r 檢驗法,2020/7/7,.,12,2回歸系數(shù)的置信區(qū)間,2020/7/7,.,13,3預測與控制,(1)預測,2020/7/7,.,14,(2)控制,返回,2020/7/7,.,15,四、可線性化的一元非線性回歸 (曲線回歸),例2 出鋼時所

3、用的盛鋼水的鋼包,由于鋼水對耐火材料的侵蝕, 容積不斷增大.我們希望知道使用次數(shù)與增大的容積之間的關(guān) 系.對一鋼包作試驗,測得的數(shù)據(jù)列于下表:,解答,2020/7/7,.,16,散 點 圖,此即非線性回歸或曲線回歸,問題(需要配曲線),配曲線的一般方法是:,2020/7/7,.,17,通常選擇的六類曲線如下:,返回,2020/7/7,.,18,一、數(shù)學模型及定義,返回,2020/7/7,.,19,二、模型參數(shù)估計,2020/7/7,.,20,返回,2020/7/7,.,21,三、多元線性回歸中的檢驗與預測,()F 檢驗法,()r 檢驗法,(殘差平方和),2020/7/7,.,22,2預測,(1

4、)點預測,(2)區(qū)間預測,返回,2020/7/7,.,23,四、逐步回歸分析,(4)“有進有出”的逐步回歸分析.,(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;,(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;,(3)從一個變量開始,把變量逐個引入方程;,選擇“最優(yōu)”的回歸方程有以下幾種方法:,“最優(yōu)”的回歸方程就是包含所有對Y有影響的變量, 而不包含對Y影響不顯著的變量回歸方程.,以第四種方法,即逐步回歸分析法在篩選變量方面較為理想.,2020/7/7,.,24,這個過程反復進行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止.,逐步回歸分析法的思想:

5、,從一個自變量開始,視自變量Y對作用的顯著程度,從大到小地依次逐個引入回歸方程.,當引入的自變量由于后面變量的引入而變得不顯著時,要將其剔除掉.,引入一個自變量或從回歸方程中剔除一個自變量,為逐步回歸的一步.,對于每一步都要進行Y值檢驗,以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量.,返回,2020/7/7,.,25,統(tǒng)計工具箱中的回歸分析命令,1多元線性回歸,2多項式回歸,3非線性回歸,4逐步回歸,返回,2020/7/7,.,26,多元線性回歸,b=regress( Y, X ),1確定回歸系數(shù)的點估計值:,2020/7/7,.,27,3畫出殘差及其置信區(qū)間: rcopl

6、ot(r,rint),2求回歸系數(shù)的點估計和區(qū)間估計、并檢驗回歸模型: b, bint,r,rint,stats=regress(Y,X,alpha),2020/7/7,.,28,例1,解:,1輸入數(shù)據(jù): x=143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164; X=ones(16,1) x; Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;,2回歸分析及檢驗: b,bint,r,rint,stats=regress(Y,X) b,bint,stats,To MA

7、TLAB(liti11),題目,2020/7/7,.,29,3殘差分析,作殘差圖: rcoplot(r,rint),從殘差圖可以看出,除第二個數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點均較近,且殘差的置信區(qū)間均包含零點,這說明回歸模型 y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個數(shù)據(jù)可視為異常點.,4預測及作圖: z=b(1)+b(2)* plot(x,Y,k+,x,z,r),返回,To MATLAB(liti12),2020/7/7,.,30,多 項 式 回 歸,(一)一元多項式回歸,y=a1xm+a2xm-1+amx+am+1,2020/7/7,.,31,法一,直接作二次多項式回歸:

8、 t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; p,S=polyfit(t,s,2),To MATLAB(liti21),得回歸模型為 :,2020/7/7,.,32,法二,化為多元線性回歸: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; T=ones(1

9、4,1) t (t.2); b,bint,r,rint,stats=regress(s,T); b,stats,To MATLAB(liti22),得回歸模型為 :,Y=polyconf(p,t,S) plot(t,s,k+,t,Y,r),預測及作圖,To MATLAB(liti23),2020/7/7,.,33,(二)多元二項式回歸,命令:rstool(x,y,model, alpha),2020/7/7,.,34,例3 設某商品的需求量與消費者的平均收入、商品價格的統(tǒng)計數(shù) 據(jù)如下,建立回歸模型,預測平均收入為1000、價格為6時 的商品需求量.,法一,直接用多元二項式回歸: x1=1000

10、 600 1200 500 300 400 1300 1100 1300 300; x2=5 7 6 6 8 7 5 4 3 9; y=100 75 80 70 50 65 90 100 110 60; x=x1 x2; rstool(x,y,purequadratic),2020/7/7,.,35,在畫面左下方的下拉式菜單中選”all”, 則betarmse和residuals都傳送到MATLAB工作區(qū)中.,將左邊圖形下方方框中的“800”改成1000,右邊圖形下方的方框中仍輸入6.則畫面左邊的“Predicted Y”下方的數(shù)據(jù)由原來的“86.3791”變?yōu)?8.4791,即預測出平均收入

11、為1000價格為6時的商品需求量為88.4791.,2020/7/7,.,36,在MATLAB工作區(qū)中輸入命令: beta, rmse,To MATLAB(liti31),2020/7/7,.,37,結(jié)果為: b = 110.5313 0.1464 -26.5709 -0.0001 1.8475 stats = 0.9702 40.6656 0.0005,法二,To MATLAB(liti32),返回,2020/7/7,.,38,非線性回 歸,(1)確定回歸系數(shù)的命令: beta,r,J=nlinfit(x,y,model,beta0),(2)非線性回歸命令:nlintool(x,y,mode

12、l, beta0,alpha),1回歸:,2020/7/7,.,39,例 4 對第一節(jié)例2,求解如下:,2輸入數(shù)據(jù): x=2:16; y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76; beta0=8 2;,3求回歸系數(shù): beta,r ,J=nlinfit(x,y,volum,beta0); beta,得結(jié)果:beta = 11.6036 -1.0641,即得回歸模型為:,To MATLAB(liti41),題目,2020/7/7,.,40,4預測及作圖: YY,delta=nlpr

13、edci(volum,x,beta,r ,J); plot(x,y,k+,x,YY,r),To MATLAB(liti42),2020/7/7,.,41,例5 財政收入預測問題:財政收入與國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資等因素有關(guān).表中列出了19521981年的原始數(shù)據(jù),試構(gòu)造預測模型.,解 設國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資分別為x1、x2、x3、x4、x5、x6,財政收入為y,設變量之間的關(guān)系為: y= ax1+bx2+cx3+dx4+ex5+fx6 使用非線性回歸方法求解.,2020/7/7,.,42,1 對回歸模型建立M文

14、件model.m如下: function yy=model(beta0,X) a=beta0(1); b=beta0(2); c=beta0(3); d=beta0(4); e=beta0(5); f=beta0(6); x1=X(:,1); x2=X(:,2); x3=X(:,3); x4=X(:,4); x5=X(:,5); x6=X(:,6); yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6;,2020/7/7,.,43,2. 主程序liti6.m如下:,X=598.00 349.00 461.00 57482.00 20729.00 44.00 . 2927.00 6

15、862.00 1273.00 100072.0 43280.00 496.00; y=184.00 216.00 248.00 254.00 268.00 286.00 357.00 444.00 506.00 . 271.00 230.00 266.00 323.00 393.00 466.00 352.00 303.00 447.00 . 564.00 638.00 658.00 691.00 655.00 692.00 657.00 723.00 922.00 . 890.00 826.00 810.0; beta0=0.50 -0.03 -0.60 0.01 -0.02 0.35; b

16、etafit = nlinfit(X,y,model,beta0),To MATLAB(liti6),2020/7/7,.,44,betafit = 0.5243 -0.0294 -0.6304 0.0112 -0.0230 0.3658 即y= 0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230 x5+0.3658x6,結(jié)果為:,返 回,2020/7/7,.,45,逐 步 回 歸,逐步回歸的命令是: stepwise(x,y,inmodel,alpha),運行stepwise命令時產(chǎn)生三個圖形窗口:Stepwise Plot,Stepwise Table,S

17、tepwise History.,在Stepwise Plot窗口,顯示出各項的回歸系數(shù)及其置信區(qū)間.,Stepwise Table 窗口中列出了一個統(tǒng)計表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計量剩余標準差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對應的概率P.,2020/7/7,.,46,例6 水泥凝固時放出的熱量y與水泥中4種化學成分x1、x2、x3、 x4 有關(guān),今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一個 線性模 型.,1數(shù)據(jù)輸入: x1=7 1 11 11 7 11 3 1 2 21 1 11 10; x2=26 29 56 31 52 55 71 31 54 47 4

18、0 66 68; x3=6 15 8 8 6 9 17 22 18 4 23 9 8; x4=60 52 20 47 33 22 6 44 22 26 34 12 12; y=78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4; x=x1 x2 x3 x4;,2020/7/7,.,47,2逐步回歸: (1)先在初始模型中取全部自變量: stepwise(x,y) 得圖Stepwise Plot 和表Stepwise Table,圖Stepwise Plot中四條直線都是虛線,說明模型的顯著性不好,從表Stepwise Table中看出變量x3和x4的顯著性最差.,2020/7/7,.,48,(2)在圖Stepwise Plot中點擊直線3和直線4,移去變量x3和x4,移去變量x3和x4后模型具有顯著性.,雖然剩余標準差(RMSE)沒有太大的變化,但是統(tǒng)計量F的 值明顯增大,因此新的回歸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論