時間序列分析_第1頁
時間序列分析_第2頁
時間序列分析_第3頁
時間序列分析_第4頁
時間序列分析_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于時間序列分析的日本人口分析與預(yù)測摘要本文基于R語言和時間序列分析,對日本1960年至2010年的總?cè)丝跀?shù)量進(jìn)行了時間序列分析與預(yù)測。揭示了這一期間的日本人口符合ARIMA(1,2,2)模型,更新至最新數(shù)據(jù)后依此預(yù)測了未來10年的人口數(shù)據(jù)。關(guān)鍵字:時間序列,日本人口,R語言原始數(shù)據(jù):數(shù)據(jù)來源:日本総務(wù)省統(tǒng)計(jì)局目錄目錄摘要 21.數(shù)據(jù)預(yù)處理 41.1平穩(wěn)性檢驗(yàn) 41.2平穩(wěn)化 51.3白噪聲檢驗(yàn) 62.模型識別 73.模型檢驗(yàn) 83.1對于ARIMA(1,2,1) 83.2對于ARIMA(1,2,2) 94.參數(shù)估計(jì) 105.預(yù)測 105.1模型更新 116.異常值檢驗(yàn) 127.結(jié)論 131.數(shù)據(jù)預(yù)處理1.1平穩(wěn)性檢驗(yàn)通過繪制時間序列的時序圖,自相關(guān)圖和偏相關(guān)圖判斷序列的平穩(wěn)性。dat=read.csv('file.csv')ts<-ts(dat,start=1960)plot(ts)acf(ts)adf.test(ts)1.通過觀察時序圖可知,序列有明顯上升趨勢2.自相關(guān)圖未快速下降為零3.單位根檢驗(yàn),p值=0.8879>0.05因此接受原假設(shè),即序列非平穩(wěn)1.2平穩(wěn)化對原序列進(jìn)行一階差分進(jìn)行單位根檢驗(yàn),p值為0.3171>0.05tsdiff1<-diff(ts,diff=1)plot(tsdiff1)acf(tsdiff1)adf.test(tsdiff1)一階差分序列趨于平穩(wěn)但自相關(guān)圖下降依然緩慢,p值改善不明顯,仍非平穩(wěn),因此繼續(xù)進(jìn)行二階差分時序圖基本在零均值附近震蕩自相關(guān)圖迅速衰減為零進(jìn)行單位根檢驗(yàn),p值=0.02608<0.05因此拒絕原假設(shè),即判斷序列平穩(wěn)。Tsdiff2<-diff(ts,diff=2)plot(tsdiff2)adf.test(tsdiff2)1.3白噪聲檢驗(yàn)由acf圖像可知,2階自相關(guān)依然顯著。Box.test(tsdiff2,type="Ljung-Box")shapiro.test(tsdiff2)Shapiro-Wilk檢驗(yàn)說明序列是非正態(tài)的。Box-Ljung檢驗(yàn)說明序列非純隨機(jī),因此有充分理由認(rèn)為該序列不是白噪聲。2.模型識別eacf(tsdiff2)畫出二階差分序列的自相關(guān)函數(shù)圖和偏自相關(guān)函數(shù)圖自相關(guān)函數(shù)圖中1階顯著,q取1偏自相關(guān)函數(shù)圖1階顯著,p取1拓展的自相關(guān)函數(shù)圖零三角的左上角處于p=0,q=1處,與acf,pacf圖相矛盾,(p,q)的可能取值包括(0,1),(1,1)。模型ARIMA(0,2,1)的AIC為667.62,ARIMA(1,2,1)的AIC為669.62其中ARIMA(1,2,1)的AR系數(shù)不顯著,為此選擇偏差較小的模型IMA(2,1)并分別進(jìn)一步檢驗(yàn)。ml.ts;ml.ts23.模型檢驗(yàn)3.1自相關(guān)檢驗(yàn)殘差基本是均勻分布在0值上下的,但包含一個超出臨界值的異常值。殘差A(yù)CF全部落在虛線內(nèi),Ljung-Box檢驗(yàn)p值也全大于0.05。ml.ts=arima(ts,order=c(0,2,1))tsdiag(ml.ts)3.2正態(tài)檢驗(yàn)qqnorm(residuals(ml.ts));qqline(residuals(ml.ts))shapiro.test(residuals(ml.ts))4.參數(shù)估計(jì)ml.ts即模型為:?5.預(yù)測利用ARIMA(1,2,2)模型對未來10年的數(shù)據(jù)進(jìn)行預(yù)測,得到2階差分的未來10年數(shù)據(jù)。plot(ml.ts,n.ahead=10)predict(ml.ts,10)將預(yù)測值與2011年至2015年的實(shí)際值進(jìn)行比較,可知第一年誤差僅為千分之2,隨時間增長,由于2011年日本剛好人口首次出現(xiàn)負(fù)增長并持續(xù)至2014年,誤差增長較快,但仍不超過百分之一。綜合考慮認(rèn)為模型預(yù)測精度還是很高的。5.1模型更新將之前預(yù)留的最近5年即2011年至2015的數(shù)據(jù)更新加入模型,并刪除序列最前面的5年即1960至1964年的數(shù)據(jù),再次進(jìn)行預(yù)測。重復(fù)之前的步驟,得到新的未來10年的預(yù)測,更新后的模型預(yù)測值如上圖所示。對本月,即2016年5月1日的預(yù)測為127081,與日本總務(wù)省統(tǒng)計(jì)局公布的預(yù)測126960相比相差了120(千人),相差約千分之一,比更新前的數(shù)據(jù)預(yù)測的精度更準(zhǔn)確。6.異常值檢驗(yàn)在前面的分析中,序列中含有明顯的異常值,為此我們對異常值進(jìn)行處理。[,1][,2]ind13.00000014.000000lambda25.093549-3.900442detectAO(ml.ts)[,1][,2]ind13.00000014.000000lambda16.910984-3.415474detectIO(ml.ts)從上面的AO,IO檢驗(yàn)可知,序列在T=13時有一個IO,即新息異常。T=14,有一個AO,即可加異常值。因此擬合一個在t=13時有一個IO,t=14,有一個AO的IMA模型m3=arima(ts,order=c(0,2,1),xreg=data.frame(AO=seq(ts)==14),io=c(13))新模型的AIC明顯變好,但模型參數(shù)非顯著。因此,考慮擬合只在t=13有一個IO的模型新模型的模型參數(shù)顯著,AIC明顯變好,且與上面的模型相差不多。因此認(rèn)為在t=13時有一個IO的IMA(2,1)模型更適合原時間序列。m4=arima(ts,order=c(0,2,1),io=c(13))7.結(jié)論本文對日本1960年至2010年的總?cè)丝跀?shù)量進(jìn)行了時間序列分析與預(yù)測。經(jīng)過分析對比確定這一期間的日本人口符合IMA(2,1)模型,模型通過檢驗(yàn)。模型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論