ARIMA模型預測與GM(1,1)模型預測_第1頁
ARIMA模型預測與GM(1,1)模型預測_第2頁
ARIMA模型預測與GM(1,1)模型預測_第3頁
ARIMA模型預測與GM(1,1)模型預測_第4頁
ARIMA模型預測與GM(1,1)模型預測_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

...wd......wd......wd...ARIMA模型預測與GM(1,1)模型預測一、模型選擇預測是重要的統計技術,對于領導層進展科學決策具有不可替代的支撐作用。常用的預測方法包括定性預測法、傳統時間序列預測〔如移動平均預測、指數平滑預測〕、現代時間序列預測〔如ARIMA模型〕、灰色預測〔GM〕、線性回歸預測、非線性曲線預測、馬爾可夫預測等方法。綜合考量方法簡捷性、科學性原則,我選擇ARIMA模型預測、GM(1,1)模型預測兩種方法進展預測,并將結果相互比對,權衡取舍,從而選擇最正確的預測結果。二ARIMA模型預測〔一〕預測軟件選擇----R軟件ARIMA模型預測,可實現的軟件較多,如SPSS、SAS、Eviews、R等。使用R軟件建模預測的優(yōu)點是:第一,R是世最強大、最有前景的軟件,已經成為美國的主流。第二,R是免費軟件。而SPSS、SAS、Eviews正版軟件極為昂貴,盜版存在侵權問題,可以引起法律糾紛。第三、R軟件可以將程序保存為一個程序文件,略加修改便可用于其它數據的建模預測,便于方法的推廣?!捕持笜撕蛿祿笜耸卿N售量(x),樣本區(qū)間是1964-2013年,保存文本文件data.txt中?!踩愁A測的具體步驟1、準備工作〔1〕下載安裝R軟件目前最新版本是R3.1.2,發(fā)布日期是2014-10-31,下載地址是:///。我使用的是R3.1.1。〔2〕把數據文件data.txt文件復制“我的文檔〞我的文檔是默認的工作目錄,也可以修改自定義工作目錄。。我的文檔是默認的工作目錄,也可以修改自定義工作目錄?!?〕把data.txt文件讀入R軟件,并起個名字。具體操作是:翻開R軟件,輸入〔輸入每一行后,回車〕:data=read.table("data.txt",header=T)data#查看數據#后的提示語句是給自己看的,并不影響R運行回車表示執(zhí)行。完成上面操作后,R窗口會顯示:〔4〕把銷售額〔x〕轉化為時間序列格式x=ts(x,start=1964)x結果:2、對x進展平穩(wěn)性檢驗ARMA模型的一個前提條件是,要求數列是平穩(wěn)時間序列。所以,要先對數列x進展平穩(wěn)性檢驗。先做時間序列圖:從時間序列圖可以看出,銷售量x不具有上升的趨勢,也不具有起降的趨勢,初步判斷,銷售量x是平穩(wěn)時間序列。但觀察時間序列圖是不準確的,更嚴格的方法是進展單位根檢驗。單位根檢驗是通行的檢驗數列平穩(wěn)性的工具,常用的有ADF單位根檢驗、PP單位根檢驗和KPSS單位根檢驗三種方法。單位根檢驗的準備工作是,安裝tseries程序包。安裝方法:在聯網狀態(tài)下,點菜單“Packages—Installpackages〞,在彈出的對話框中,選擇一個鏡像,如China(Beijing1),確定。然后彈出附加包列表,選擇tseries,確定即可。安裝完附加包后,執(zhí)行下面操作:library(tseries)#加載tseries包adf.test(x)#ADF檢驗pp.test(x)#PP檢驗kpss.test(x)#KPSS檢驗結果:上面分別給出了ADF檢驗、PP檢驗和KPSS檢驗的結果。其中,ADF檢驗顯示x是不平穩(wěn)的〔P值=0.99>0.05〕,而PP檢驗PP檢驗的原假設是不平穩(wěn),P值=0.01,小于0.05,拒絕原假設,說明序列是平穩(wěn)的。和KPSS檢驗PP檢驗的原假設是不平穩(wěn),P值=0.01,小于0.05,拒絕原假設,說明序列是平穩(wěn)的。KPSS檢驗與PP檢驗和ADF檢驗不同,它的原假設是平穩(wěn)的。P值=0.1,大于0.05,承受原假設,說明序列是平穩(wěn)序列。3、選擇模型做x的自相關圖〔左圖〕和偏自相關圖〔右圖〕:acf(x)#做自相關圖pacf(x)#做偏自相關圖無論是自相關系數圖〔左〕,還是偏自相關系數圖〔右〕,都顯著第4階的系數突破了虛線,說明相關性顯著。因此,我們建立4階AR模型,寫作AR(4)。4、估計模型參數fit=arima(xse,order=c(4,0,0))#把估計結果取名為fitfit#查看fit上面給出了AR模型的回歸系數的估計值,其中,截距為44079.31,1到4階自回歸系數分別是0.0344,-0.0174,-0.2002和0.4560。5、模型效果的檢驗模型效果的檢驗非常重要,因為只有通過檢驗,才證明是可靠、有效的模型,才能進展后續(xù)的預測分析。主要的檢驗工具有兩個,一是對回歸系數的顯著性檢驗。四個自回歸系數中,第4個回歸系數的T統計值=0.4560/0.1241=3.67,大于2,因此,通過了顯著性檢驗,說明確實存在四階自相關。這與前面看自相關圖和偏自相關系數圖的結論相吻合。第二個檢驗是殘差的白噪聲檢驗〔Ljung-Box檢驗〕,這個最主要、最關鍵。一般來說,只要通過了殘差的白噪聲檢驗,則說明模型是有效的。殘差白噪聲檢驗的R代碼:tsdiag(fit)結果:上邊是殘差的自相關圖,圖形顯示,除了0階以外,各階自相關系數都很小,基本在0左右。說明殘差中已經沒有多少有用的信息,殘差是純隨機序列,即白噪聲。換個角度說,時間序列的有價值信息絕大局部都已經被模型提取了,建模獲得了成功。下邊是更為準確的Ljung-Box檢驗結果,所有小圈都在虛線之上〔虛線值為0.05〕,說明在0.05的顯著性水平上,各階自相關系數和零的差異不顯著,殘差為白噪聲序列,模型效果優(yōu)良。這與上面的殘差的自相關圖相吻合。6、ARIMA模型預測R軟件代碼:predict(fit,n.ahead=3)#預測下三年〔2014-2016〕的數值假設想預測后五年,就把3改成5,依此類推。結果:pred即predict(預測)的前四個字母,下面是時間2014-2016,說明要預測2014-2016年三年的。結果在最后一行,2014年銷售額預測值為61768.02,2015年為36563.83,2016年為45464.87?!菜摹衬P偷脑贆z驗—用AIC準則尋找更優(yōu)上面建模預測,通過的顯著性檢驗和殘差的白噪聲檢驗,證明模型優(yōu)良,可以進展預測。一般的預測報告就到此完畢了。但考慮到預測對于企業(yè)家的決策重要,而決策的失誤將會產生很大的不良后果。因此,更嚴謹起見,我們建立了24個可能的ARMA模型,一個一個比較,想看一看還有沒有比前面我們建立的模型擬合效果更好的。挑選標準是國際通行的AIC準則。AIC是日本統計學家Akaike于1973年提出的。其基本思想是,變量越多,一般來說模型的擬合優(yōu)度會越高。但是我們又不能單純地以擬合的準確度的衡量模型的好壞,因為自變量的增多會導致未知參數的增多,而參數越多,參數估計的難度就越大,估計的精度也越差。因此,應該尋求在擬合優(yōu)度和參數個數之間的一個平衡,AIC到達最小時的模型被認為是最優(yōu)的模型。這就是說,我們所建立的預測模型,經過Ljung-Box檢驗,說明是優(yōu)良的模型。但是,如果有好多模型通過檢驗,證明優(yōu)良呢這時,就可以比較AIC的大小,到達優(yōu)中選優(yōu)的目的。統計界的經歷說明,ARMA模型最常見的4階之內。這樣會產生24個ARMA模型。分別是AR(1)、AR(2)、AR(3)、AR(4)、MA(1)、MA(2)、MA(3)、MA(4)、ARMA(1,1)、ARMA(2,1)、ARMA3,1)、ARMA(4,1)、ARMA(1,2)、ARMA(2,2)、ARMA(3,2)、ARMA(4,2)、ARMA(1,3)、ARMA(2,3)、ARMA(3,3)、ARMA(4,3)、ARMA(1,4)、ARMA(2,4)、ARMA(3,4)、ARMA(4,4)。R代碼:fit=arima(x,c(1,0,0));fit#ar(1)fit=arima(x,c(2,0,0));fit#ar(2)fit=arima(x,c(3,0,0));fit#ar(3)fit=arima(x,c(4,0,0));fit#ar(4)fit=arima(x,c(0,0,1));fit#ma(1)fit=arima(x,c(0,0,2));fit#ma(2)fit=arima(x,c(0,0,3));fit#ma(3)fit=arima(x,c(0,0,4));fit#ma(4)fit=arima(x,c(1,0,1));fit#arma(1,1)fit=arima(x,c(2,0,1));fit#arma(2,1)fit=arima(x,c(3,0,1));fit#arma(3,1)fit=arima(x,c(4,0,1));fit#arma(4,1)fit=arima(x,c(1,0,2));fit#arma(1,2)fit=arima(x,c(2,0,2));fit#arma(2,2)fit=arima(x,c(3,0,2));fit#arma(3,2)fit=arima(x,c(4,0,2));fit#arma(4,2)fit=arima(x,c(1,0,3));fit#arma(1,3)fit=arima(x,c(2,0,3));fit#arma(2,3)fit=arima(x,c(3,0,3));fit#arma(3,3)fit=arima(x,c(4,0,3));fit#arma(4,3)fit=arima(x,c(1,0,4));fit#arma(1,4)fit=arima(x,c(2,0,4));fit#arma(2,4)fit=arima(x,c(3,0,4));fit#arma(3,4)fit=arima(x,c(4,0,4));fit#arma(4,4)結果計算出每個模型的AIC值,如下:AR(4):aic=1151.31AR〔1〕:aic=1159.14AR〔2〕:aic=1161.08AR〔3〕:aic=1160.73MA(1):aic=1159.13MA(2):aic=1161.05MA(3):aic=1160.06MA(4):aic=1151.49ARMA(1,1):aic=1155.99ARMA(2,1):aic=1157.59ARMA(3,1):aic=1154.97ARMA(4,1):aic=1152.97ARMA(1,2):aic=1156.66ARMA(2,2):aic=1156.67ARMA(3,2):aic=1155.4ARMA(4,2):aic=1154.38ARMA(1,3):aic=1155.68ARMA(2,3):aic=1157.67ARMA(3,3):aic=1156.19ARMA(4,3):aic=1153.55ARMA(1,4):aic=1153.09ARMA(2,4):aic=1155.29ARMA(3,4):aic=1152.25ARMA(4,4):aic=1153.63第一行是我們前面建立的四階自回歸模型AR(4)的AIC值,為1151.31。經一一比照可以發(fā)現,所有其它模型的AIC值都大于115.31。就是說,我們前面建立的模型是所有可能模型中的最優(yōu)模型。三、GM(1,1)預測〔一〕方法簡介灰色系統理論是由華中理工大學鄧聚龍教授于1982年提出并加以開展的。二十幾年來,引起了不少國內外學者的關注,得到了長足的開展。目前,在我國已經成為社會、經濟、科學技術在等諸多領域進展預測、決策、評估、規(guī)劃控制、系統分析與建模的重要方法之一。而其精華在于GM(1,1)模型,GM(1,1)被廣泛應用于預測,并且預測效果很好,其使用限制條件是:原始數據單調,預測背景呈現穩(wěn)定開展趨勢;其優(yōu)勢是:適用于觀測數據較少的預測問題,算法簡單易行,預測精度相對較高。鑒于GM(1,1)預測適合于數據較少情況,我們選擇2008-2013年的近期數據,進展預測嘗試?!捕砇軟件操作1、把腳本文件GM11.R和data2.txt復制到“我的文檔〞;2、R窗口輸入命令:source("GM11.R")data2=read.table("data2.txt",header=T)x=data2$xxGM11(x,length(x)+1)#預測后1期值預測結果:2014年銷售量分別為28385.3。在R顯示結果中,是x(0)的模擬值的最后1個數。(三)模型檢驗利用R軟件進展操作處理結果顯示如下:平均相對誤差=22.11903%相對精度=77.88097%可見,GM(1,1)模型預測的誤差較大,相對精度不高。再進展后驗差比值檢驗。原始序列的方差:殘差序列e的方差:后驗差比值為:C值=S2/S1=0.7108341按照灰色預測理論,C值大于0.65,說明GM(1,1)預測精度等級為:不合格〔標準見下表〕。說明該模型的預測結果不太可靠。小誤差概率檢驗:R軟件給出了小誤差概率值,p=4/6=0.6666667。屬于(0.7,0.8],GM(1,1)模型預測精度等級為:勉強合格〔標準見上表〕。綜合來看,對于我公司的數據,GM(1,1)模型效果并不理想。四簡要結論前面用ARIMA模型和GM(1,1)模型,對我公司的銷售量進展了預測。檢驗說明,GM(1,1)模型的精度較低,而ARIMA模型則通過Ljung-Box檢驗,說明模型優(yōu)良。而且,我們進展了全方位的24個模型的一一比對,發(fā)現我們建立的模型在所有可能模型中最優(yōu)。因而,建立重點參照ARIMA模型的預測結果。作為統計人員,基于對統計工作的經歷認識,明白任何預測,都是根據過往的歷史信息進展的。如果歷史條件不變,預測結果可靠。一旦歷史條件改變,則預測結果不一定準確。而且,只要是預測,無論方法多么科學,分析多么嚴謹,都沒有百分百的準確,都會有預測誤差。五進一步建議單變量時間預測,是依據單一變量—銷售量的歷史信息進展預測,并沒有考慮其它因素。結果僅具有參考意義。建議領導層根據自己的經歷、銷售部門根據其經歷,尤其是對未來經濟形勢的變化特點,修正前面的預測結果,使預測結果更加完善。附錄:GM〔1,1〕基本理論G表示Grey(灰),M表示Model(模型),前一個“1”表示一階,后一個“1”表示一個變量,GM(1,1)則是一階,一個變量的微分方程模型。給定等時間間隔的數據列,且設數據列單調:k表示時刻,表示t=k時刻某量的觀測值,不妨設,,將數據列記成:表示原始數據序列。比方:。對原始數據作一次累加生成:即令得一次累加生成數序列為:在此,={2.874,6.152,9.489,12.879,16.558}給定的原始數據序列已經是單增序列,經一次累加后生成的累加數序列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論