第10講 回歸分析.ppt_第1頁
第10講 回歸分析.ppt_第2頁
第10講 回歸分析.ppt_第3頁
第10講 回歸分析.ppt_第4頁
第10講 回歸分析.ppt_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

2020 2 4 1 數(shù)學建模與數(shù)學實驗 回歸分析 實驗目的 實驗內(nèi)容 1 回歸分析的基本理論 3 實驗作業(yè) 2 用數(shù)學軟件求解回歸分析問題 2020 2 4 3 一元線性回歸 多元線性回歸 回歸分析 數(shù)學模型及定義 模型參數(shù)估計 檢驗 預測與控制 可線性化的一元非線性回歸 曲線回歸 數(shù)學模型及定義 模型參數(shù)估計 多元線性回歸中的檢驗與預測 逐步回歸分析 2020 2 4 4 一 數(shù)學模型 例1測16名成年女子的身高與腿長所得數(shù)據(jù)如下 以身高x為橫坐標 以腿長y為縱坐標將這些數(shù)據(jù)點 xI yi 在平面直角坐標系上標出 散點圖 解答 2020 2 4 5 一元線性回歸分析的主要任務是 返回 2020 2 4 6 二 模型參數(shù)估計 1 回歸系數(shù)的最小二乘估計 2020 2 4 7 其中 2020 2 4 8 返回 2020 2 4 9 三 檢驗 預測與控制 1 回歸方程的顯著性檢驗 2020 2 4 10 F檢驗法 t檢驗法 2020 2 4 11 r檢驗法 2020 2 4 12 2 回歸系數(shù)的置信區(qū)間 2020 2 4 13 3 預測與控制 1 預測 2020 2 4 14 2 控制 返回 2020 2 4 15 四 可線性化的一元非線性回歸 曲線回歸 例2出鋼時所用的盛鋼水的鋼包 由于鋼水對耐火材料的侵蝕 容積不斷增大 我們希望知道使用次數(shù)與增大的容積之間的關系 對一鋼包作試驗 測得的數(shù)據(jù)列于下表 解答 2020 2 4 16 散點圖 此即非線性回歸或曲線回歸 問題 需要配曲線 配曲線的一般方法是 2020 2 4 17 通常選擇的六類曲線如下 返回 2020 2 4 18 一 數(shù)學模型及定義 返回 2020 2 4 19 二 模型參數(shù)估計 解得估計值 2020 2 4 20 返回 2020 2 4 21 三 多元線性回歸中的檢驗與預測 F檢驗法 r檢驗法 殘差平方和 2020 2 4 22 2 預測 1 點預測 2 區(qū)間預測 返回 2020 2 4 23 四 逐步回歸分析 4 有進有出 的逐步回歸分析 1 從所有可能的因子 變量 組合的回歸方程中選擇最優(yōu)者 2 從包含全部變量的回歸方程中逐次剔除不顯著因子 3 從一個變量開始 把變量逐個引入方程 選擇 最優(yōu) 的回歸方程有以下幾種方法 最優(yōu) 的回歸方程就是包含所有對Y有影響的變量 而不包含對Y影響不顯著的變量回歸方程 以第四種方法 即逐步回歸分析法在篩選變量方面較為理想 2020 2 4 24 這個過程反復進行 直至既無不顯著的變量從回歸方程中剔除 又無顯著變量可引入回歸方程時為止 逐步回歸分析法的思想 從一個自變量開始 視自變量Y作用的顯著程度 從大到地依次逐個引入回歸方程 當引入的自變量由于后面變量的引入而變得不顯著時 要將其剔除掉 引入一個自變量或從回歸方程中剔除一個自變量 為逐步回歸的一步 對于每一步都要進行Y值檢驗 以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量 返回 2020 2 4 25 統(tǒng)計工具箱中的回歸分析命令 1 多元線性回歸 2 多項式回歸 3 非線性回歸 4 逐步回歸 返回 2020 2 4 26 多元線性回歸 b regress Y X 1 確定回歸系數(shù)的點估計值 2020 2 4 27 3 畫出殘差及其置信區(qū)間 rcoplot r rint 2 求回歸系數(shù)的點估計和區(qū)間估計 并檢驗回歸模型 b bint r rint stats regress Y X alpha 2020 2 4 28 例1 解 1 輸入數(shù)據(jù) x 143145146147149150153154155156157158159160162164 X ones 16 1 x Y 8885889192939395969897969899100102 2 回歸分析及檢驗 b bint r rint stats regress Y X b bint stats ToMATLAB liti11 題目 2020 2 4 29 3 殘差分析 作殘差圖 rcoplot r rint 從殘差圖可以看出 除第二個數(shù)據(jù)外 其余數(shù)據(jù)的殘差離零點均較近 且殘差的置信區(qū)間均包含零點 這說明回歸模型y 16 073 0 7194x能較好的符合原始數(shù)據(jù) 而第二個數(shù)據(jù)可視為異常點 4 預測及作圖 z b 1 b 2 xplot x Y k x z r 返回 ToMATLAB liti12 2020 2 4 30 多項式回歸 一 一元多項式回歸 y a1xm a2xm 1 amx am 1 2020 2 4 31 法一 直接作二次多項式回歸 t 1 30 1 30 14 30 s 11 8615 6720 6026 6933 7141 9351 1361 4972 9085 4499 08113 77129 54146 48 p S polyfit t s 2 ToMATLAB liti21 得回歸模型為 2020 2 4 32 法二 化為多元線性回歸 t 1 30 1 30 14 30 s 11 8615 6720 6026 6933 7141 9351 1361 4972 9085 4499 08113 77129 54146 48 T ones 14 1 t t 2 b bint r rint stats regress s T b stats ToMATLAB liti22 得回歸模型為 Y polyconf p t S plot t s k t Y r 預測及作圖 ToMATLAB liti23 2020 2 4 33 二 多元二項式回歸 命令 rstool x y model alpha 2020 2 4 34 例3設某商品的需求量與消費者的平均收入 商品價格的統(tǒng)計數(shù)據(jù)如下 建立回歸模型 預測平均收入為1000 價格為6時的商品需求量 法一 直接用多元二項式回歸 x1 10006001200500300400130011001300300 x2 5766875439 y 10075807050659010011060 x x1 x2 rstool x y purequadratic 2020 2 4 35 在畫面左下方的下拉式菜單中選 all 則beta rmse和residuals都傳送到Matlab工作區(qū)中 在左邊圖形下方的方框中輸入1000 右邊圖形下方的方框中輸入6 則畫面左邊的 PredictedY 下方的數(shù)據(jù)變?yōu)?8 47981 即預測出平均收入為1000 價格為6時的商品需求量為88 4791 2020 2 4 36 在Matlab工作區(qū)中輸入命令 beta rmse ToMATLAB liti31 2020 2 4 37 結果為 b 110 53130 1464 26 5709 0 00011 8475stats 0 970240 66560 0005 法二 ToMATLAB liti32 返回 2020 2 4 38 非線性回歸 1 確定回歸系數(shù)的命令 beta r J nlinfit x y model beta0 2 非線性回歸命令 nlintool x y model beta0 alpha 1 回歸 2020 2 4 39 例4對第一節(jié)例2 求解如下 2 輸入數(shù)據(jù) x 2 16 y 6 428 209 589 59 7109 939 9910 4910 5910 6010 8010 6010 9010 76 beta0 82 3 求回歸系數(shù) beta r J nlinfit x y volum beta0 beta 得結果 beta 11 6036 1 0641 即得回歸模型為 ToMATLAB liti41 題目 2020 2 4 40 4 預測及作圖 YY delta nlpredci volum x beta r J plot x y k x YY r ToMATLAB liti42 2020 2 4 41 例5財政收入預測問題 財政收入與國民收入 工業(yè)總產(chǎn)值 農(nóng)業(yè)總產(chǎn)值 總?cè)丝?就業(yè)人口 固定資產(chǎn)投資等因素有關 下表列出了1952 1981年的原始數(shù)據(jù) 試構造預測模型 解設國民收入 工業(yè)總產(chǎn)值 農(nóng)業(yè)總產(chǎn)值 總?cè)丝?就業(yè)人口 固定資產(chǎn)投資分別為x1 x2 x3 x4 x5 x6 財政收入為y 設變量之間的關系為 y ax1 bx2 cx3 dx4 ex5 fx6使用非線性回歸方法求解 2020 2 4 42 1 對回歸模型建立M文件model m如下 functionyy model beta0 X a beta0 1 b beta0 2 c beta0 3 d beta0 4 e beta0 5 f beta0 6 x1 X 1 x2 X 2 x3 X 3 x4 X 4 x5 X 5 x6 X 6 yy a x1 b x2 c x3 d x4 e x5 f x6 2020 2 4 43 2 主程序liti6 m如下 X 598 00349 00461 0057482 0020729 0044 00 2927 006862 001273 00100072 043280 00496 00 y 184 00216 00248 00254 00268 00286 00357 00444 00506 00 271 00230 00266 00323 00393 00466 00352 00303 00447 00 564 00638 00658 00691 00655 00692 00657 00723 00922 00 890 00826 00810 0 beta0 0 50 0 03 0 600 01 0 020 35 betafit nlinfit X y model beta0 ToMATLAB liti6 2020 2 4 44 betafit 0 5243 0 0294 0 63040 0112 0 02300 3658即y 0 5243x1 0 0294x2 0 6304x3 0 0112x4 0 0230 x5 0 3658x6 結果為 返回 2020 2 4 45 逐步回歸 逐步回歸的命令是 stepwise x y inmodel alpha 運行stepwise命令時產(chǎn)生三個圖形窗口 StepwisePlot StepwiseTable StepwiseHistory 在StepwisePlot窗口 顯示出各項的回歸系數(shù)及其置信區(qū)間 StepwiseTable窗口中列出了一個統(tǒng)計表 包括回歸系數(shù)及其置信區(qū)間 以及模型的統(tǒng)計量剩余標準差 RMSE 相關系數(shù) R square F值 與F對應的概率P 2020 2 4 46 例6水泥凝固時放出的熱量y與水泥中4種化學成分x1 x2 x3 x4有關 今測得一組數(shù)據(jù)如下 試用逐步回歸法確定一個線性模型 1 數(shù)據(jù)輸入 x1 7111117113122111110 x2 26295631525571315447406668 x3 615886917221842398 x4 6052204733226442226341212 y 78 574 3104 387 695 9109 2102 772 593 1115 983 8113 3109 4 x x1x2x3x4 2020 2 4 47 2 逐步回歸 1 先在初始模型中取全部自變量 stepwise x y 得圖StepwisePlot和表StepwiseTable 圖StepwisePlot中四條直線都是虛線 說明模型的顯著性不好 從表StepwiseTable中看出變量x3和x4的顯著性最差 2020 2 4 48 2 在圖StepwisePlot中點擊直線3和直線4 移去變量x3和x4 移去變量x3和x4后模型具有顯著性 雖然剩余標準差 RMSE 沒有太大的變化 但是統(tǒng)計量F的值明顯增大 因此新的回歸模型更好 ToMAT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論