統(tǒng)計(jì)回歸歸模型《數(shù)學(xué)模型》第三版電子課件姜_第1頁
統(tǒng)計(jì)回歸歸模型《數(shù)學(xué)模型》第三版電子課件姜_第2頁
統(tǒng)計(jì)回歸歸模型《數(shù)學(xué)模型》第三版電子課件姜_第3頁
統(tǒng)計(jì)回歸歸模型《數(shù)學(xué)模型》第三版電子課件姜_第4頁
統(tǒng)計(jì)回歸歸模型《數(shù)學(xué)模型》第三版電子課件姜_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第十章 統(tǒng)計(jì)回歸模型,10.1 牙膏的銷售量 10.2 軟件開發(fā)人員的薪金 10.4 投資額與國民生產(chǎn)總值和 物價(jià)指數(shù),回歸模型是用統(tǒng)計(jì)分析方法建立的最常用的一類模型,數(shù)學(xué)建模的基本方法,機(jī)理分析,測試分析,通過對數(shù)據(jù)的統(tǒng)計(jì)分析,找出與數(shù)據(jù)擬合最好的模型,不涉及回歸分析的數(shù)學(xué)原理和方法,通過實(shí)例討論如何選擇不同類型的模型,對軟件得到的結(jié)果進(jìn)行分析,對模型進(jìn)行改進(jìn),由于客觀事物內(nèi)部規(guī)律的復(fù)雜及人們認(rèn)識程度的限制,無法分析實(shí)際對象內(nèi)在的因果關(guān)系,建立合乎機(jī)理規(guī)律的數(shù)學(xué)模型。,10.1 牙膏的銷售量,問題,建立牙膏銷售量與價(jià)格、廣告投入之間的模型,預(yù)測在不同價(jià)格和廣告費(fèi)用下的牙膏銷售量,收集了30個

2、銷售周期本公司牙膏銷售量、價(jià)格、廣告費(fèi)用,及同期其它廠家同類牙膏的平均售價(jià),基本模型,y 公司牙膏銷售量,x1其它廠家與本公司價(jià)格差,x2公司廣告費(fèi)用,x1, x2解釋變量(回歸變量, 自變量),y被解釋變量(因變量),0, 1 , 2 , 3 回歸系數(shù),隨機(jī)誤差(均值為零的正態(tài)分布隨機(jī)變量),MATLAB 統(tǒng)計(jì)工具箱,模型求解,b,bint,r,rint,stats=regress(y,x,alpha),輸入,x= n4數(shù)據(jù)矩陣, 第1列為全1向量,alpha(置信水平,0.05),b的估計(jì)值,bintb的置信區(qū)間,r 殘差向量y-xb,rintr的置信區(qū)間,Stats 檢驗(yàn)統(tǒng)計(jì)量 R2,F

3、, p,yn維數(shù)據(jù)向量,輸出,由數(shù)據(jù) y,x1,x2估計(jì),結(jié)果分析,y的90.54%可由模型確定,F遠(yuǎn)超過F檢驗(yàn)的臨界值,p遠(yuǎn)小于=0.05,2的置信區(qū)間包含零點(diǎn)(右端點(diǎn)距零點(diǎn)很近),x2對因變量y 的影響不太顯著,x22項(xiàng)顯著,可將x2保留在模型中,模型從整體上看成立,銷售量預(yù)測,價(jià)格差x1=其它廠家價(jià)格x3-本公司價(jià)格x4,估計(jì)x3,調(diào)整x4,控制價(jià)格差x1=0.2元,投入廣告費(fèi)x2=650萬元,銷售量預(yù)測區(qū)間為 7.8230,8.7636(置信度95%),上限用作庫存管理的目標(biāo)值,下限用來把握公司的現(xiàn)金流,若估計(jì)x3=3.9,設(shè)定x4=3.7,則可以95%的把握知道銷售額在 7.8320

4、3.7 29(百萬元)以上,(百萬支),模型改進(jìn),x1和x2對y的影響?yīng)毩?兩模型銷售量預(yù)測比較,(百萬支),區(qū)間 7.8230,8.7636,區(qū)間 7.8953,8.7592,(百萬支),控制價(jià)格差x1=0.2元,投入廣告費(fèi)x2=6.5百萬元,預(yù)測區(qū)間長度更短,略有增加,x2=6.5,x1=0.2,x1,x1,x2,x2,兩模型 與x1,x2關(guān)系的比較,交互作用影響的討論,價(jià)格差 x1=0.1,價(jià)格差 x1=0.3,加大廣告投入使銷售量增加 ( x2大于6百萬元),價(jià)格差較小時增加的速率更大,x2,完全二次多項(xiàng)式模型,MATLAB中有命令rstool直接求解,從輸出 Export 可得,10

5、.2 軟件開發(fā)人員的薪金,資歷 從事專業(yè)工作的年數(shù);管理 1=管理人員,0=非管理人員;教育 1=中學(xué),2=大學(xué),3=更高程度,建立模型研究薪金與資歷、管理責(zé)任、教育程度的關(guān)系,分析人事策略的合理性,作為新聘用人員薪金的參考,分析與假設(shè),y 薪金,x1 資歷(年),x2 = 1 管理人員,x2 = 0 非管理人員,1=中學(xué)2=大學(xué)3=更高,資歷每加一年薪金的增長是常數(shù); 管理、教育、資歷之間無交互作用,教育,線性回歸模型,a0, a1, , a4是待估計(jì)的回歸系數(shù),是隨機(jī)誤差,模型求解,R2,F, p 模型整體上可用,資歷增加1年薪金增長546,管理人員薪金多6883,中學(xué)程度薪金比更高的少2

6、994,大學(xué)程度薪金比更高的多148,a4置信區(qū)間包含零點(diǎn),解釋不可靠!,殘差分析方法,結(jié)果分析,殘差,e 與資歷x1的關(guān)系,e與管理教育組合的關(guān)系,殘差全為正,或全為負(fù),管理教育組合處理不當(dāng),殘差大概分成3個水平, 6種管理教育組合混在一起,未正確反映 。,應(yīng)在模型中增加管理x2與教育x3, x4的交互項(xiàng),進(jìn)一步的模型,增加管理x2與教育x3, x4的交互項(xiàng),R2,F有改進(jìn),所有回歸系數(shù)置信區(qū)間都不含零點(diǎn),模型完全可用,消除了不正常現(xiàn)象,異常數(shù)據(jù)(33號)應(yīng)去掉,e x1,e 組合,去掉異常數(shù)據(jù)后的結(jié)果,e x1,e 組合,R2: 0.957 0.999 0.9998 F: 226 554

7、36701 置信區(qū)間長度更短,殘差圖十分正常,最終模型的結(jié)果可以應(yīng)用,模型應(yīng)用,制訂6種管理教育組合人員的“基礎(chǔ)”薪金(資歷為0),中學(xué):x3=1, x4=0 ;大學(xué):x3=0, x4=1; 更高:x3=0, x4=0,x1= 0; x2 = 1 管理,x2 = 0 非管理,大學(xué)程度管理人員比更高程度管理人員的薪金高,大學(xué)程度非管理人員比更高程度非管理人員的薪金略低,對定性因素(如管理、教育),可以引入0-1變量處理,0-1變量的個數(shù)應(yīng)比定性因素的水平少1,軟件開發(fā)人員的薪金,殘差分析方法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項(xiàng)常常能夠改善模型,剔除異常數(shù)據(jù),有助于得到更好的結(jié)果,注:可以直接對6種

8、管理教育組合引入5個0-1變量,10.4 投資額與國民生產(chǎn)總值和物價(jià)指數(shù),問題,建立投資額模型,研究某地區(qū)實(shí)際投資額與國民生產(chǎn)總值 ( GNP ) 及物價(jià)指數(shù) ( PI ) 的關(guān)系,2.0688,3073.0,424.5,20,1.0000,1185.9,195.0,10,1.9514,2954.7,474.9,19,0.9601,1077.6,166.4,9,1.7842,2631.7,401.9,18,0.9145,992.7,144.2,8,1.6342,2417.8,423.0,17,0.8679,944.0,149.3,7,1.5042,2163.9,386.6,16,0.8254,

9、873.4,133.3,6,1.4005,1918.3,324.1,15,0.7906,799.0,122.8,5,1.3234,1718.0,257.9,14,0.7676,756.0,125.7,4,1.2579,1549.2,206.1,13,0.7436,691.1,113.5,3,1.1508,1434.2,228.7,12,0.7277,637.7,97.4,2,1.0575,1326.4,229.8,11,0.7167,596.7,90.9,1,物價(jià) 指數(shù),國民生產(chǎn)總值,投資額,年份 序號,物價(jià) 指數(shù),國民生產(chǎn)總值,投資額,年份序號,根據(jù)對未來GNP及PI的估計(jì),預(yù)測未來投資額,

10、該地區(qū)連續(xù)20年的統(tǒng)計(jì)數(shù)據(jù),時間序列中同一變量的順序觀測值之間存在自相關(guān),以時間為序的數(shù)據(jù),稱為時間序列,分析,許多經(jīng)濟(jì)數(shù)據(jù)在時間上有一定的滯后性,需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型,若采用普通回歸模型直接處理,將會出現(xiàn)不良后果,投資額與國民生產(chǎn)總值和物價(jià)指數(shù),基本回歸模型,投資額與 GNP及物價(jià)指數(shù)間均有很強(qiáng)的線性關(guān)系,t 年份, yt 投資額,x1t GNP, x2t 物價(jià)指數(shù),0, 1, 2 回歸系數(shù),t 對t相互獨(dú)立的零均值正態(tài)隨機(jī)變量,基本回歸模型的結(jié)果與分析,MATLAB 統(tǒng)計(jì)工具箱,剩余標(biāo)準(zhǔn)差 s=12.7164,沒有考慮時間序列數(shù)據(jù)的滯后性影響,R20.9908,擬合度

11、高,模型優(yōu)點(diǎn),模型缺點(diǎn),可能忽視了隨機(jī)誤差存在自相關(guān);如果存在自相關(guān)性,用此模型會有不良后果,自相關(guān)性的定性診斷,殘差診斷法,模型殘差,作殘差 etet-1 散點(diǎn)圖,大部分點(diǎn)落在第1, 3象限,大部分點(diǎn)落在第2, 4象限,自相關(guān)性直觀判斷,在MATLAB工作區(qū)中輸出,et為隨機(jī)誤差t 的估計(jì)值,自回歸性的定量診斷,自回歸模型,自相關(guān)系數(shù),0, 1, 2 回歸系數(shù),= 0, 0, 0,如何估計(jì),如何消除自相關(guān)性,D-W檢驗(yàn),ut 對t相互獨(dú)立的零均值正態(tài)隨機(jī)變量,D-W統(tǒng)計(jì)量與D-W檢驗(yàn),檢驗(yàn)水平,樣本容量,回歸變量數(shù)目,檢驗(yàn)臨界值dL和dU,由DW值的大小確定自相關(guān)性,廣義差分變換,以*0, 1 , 2 為回歸系數(shù)的普通回歸模型,原模型 DW值,無自相關(guān),有自相關(guān),新模型,新模型,步驟,原模型,變換,不能確定,投資額新模型的建立,DWold dL,作變換,原模型殘差et,樣本容量n=20,回歸變量數(shù)目k=3,=0.05,臨界值dL=1.10, dU=1.54,總體效果良好,剩余標(biāo)準(zhǔn)差 snew= 9.8277 sold=12.7164,投資額新模型的建立,新模型的自相關(guān)性檢驗(yàn),dU DWnew 4-dU,新模型殘差et,樣本容量n=19,回歸變量數(shù)目k=3,=0.05,臨界值dL=1.08, d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論