數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第1頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第2頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第3頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第4頁
數(shù)據(jù)挖掘?qū)嶒瀳蟾?參考)_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、時間序列的模型法和數(shù)據(jù)挖掘兩種方法比較分析研究實驗?zāi)康?: 通過實驗?zāi)軐r間序列的模型法和數(shù)據(jù)挖掘兩種方法的原理和優(yōu)缺點有更清楚的認識和比較 .實驗內(nèi)容 : 選用 1952-2006 年的中國 gdp ,分別對之用自回歸移動平均模型(arima) 和時序模型的數(shù)據(jù)挖掘方法進行分析和預(yù)測,并對兩種方法的趨勢和預(yù)測結(jié)果進行比較并給出解釋 .實驗數(shù)據(jù) : 本文研究選用1952-2006 年的中國gdp,其資料如下日期國內(nèi)生產(chǎn)總值(億元 )日期國內(nèi)生產(chǎn)總值(億元 )2006-12-312094071997-12-31747722005-12-311830851996-12-312004-12-3113

2、65151995-12-312003-12-311994-12-312002-12-311993-12-312001-12-311992-12-312000-12-31894041991-12-311999-12-31820541990-12-311998-12-31795531989-12-311988-12-311969-12-311987-12-311968-12-311986-12-311967-12-311985-12-311966-12-3118681984-12-3171711965-12-311983-12-311964-12-3114541982-12-311963-12-3

3、11981-12-311962-12-311980-12-311961-12-3112201979-12-311960-12-3114571978-12-311959-12-3114391977-12-311958-12-3113071976-12-311957-12-3110681975-12-311956-12-3110281974-12-311955-12-319101973-12-311954-12-318591972-12-311953-12-318241971-12-311952-12-316791970-12-31表一國內(nèi)生產(chǎn)總值 (gdp) 是指一個國家或地區(qū)所有常住單位在一定

4、時期內(nèi)生產(chǎn)活動的最終成果。這個指標把國民經(jīng)濟全部活動的產(chǎn)出成果概括在一個極為簡明的統(tǒng)計數(shù)字之中為評價和衡量國家經(jīng)濟狀況、 經(jīng)濟增長趨勢及社會財富的經(jīng)濟表現(xiàn)提供了一個最為綜合的尺度,可以說,它是影響經(jīng)濟生活乃至社會生活的最重要的經(jīng)濟指標。對其進行的分析預(yù)測具有重要的理論與現(xiàn)實意義。實驗步驟 : 1. 選用 1952 年到 2001 年這 50 個數(shù)據(jù)參與自回歸移動平均模型(arima)建模 (所用的工具是eviews). 根據(jù)博克斯 -詹金斯提出的建模思想,具體步驟為 : (1) 對原序列進行平穩(wěn)性檢驗。在以年份為橫軸,以山東省gdp為縱軸的坐標系中作曲線圖如圖 1 所示。圖一從圖 1 中可以看

5、出全國的gdp 不具有明顯的周期變化和季節(jié)波動,但呈現(xiàn)出明顯的增長趨勢,他的相關(guān)系數(shù)和偏相關(guān)系數(shù)如圖二所示圖二從圖二中可以看到,他的自相關(guān)系數(shù)是拖尾的,而偏相關(guān)系數(shù)是截尾的。對樣本數(shù)據(jù)用adf進行單位根檢驗的到結(jié)果如圖三圖三這里 adf值大于三個不同檢驗水平下的臨界值,故而可以判斷出,我國gdp序列是非平穩(wěn)的。這就需要對gdp序列進行差分以使序列變得平穩(wěn)。由圖一可以看出,gdp序列明顯帶有指數(shù)性質(zhì),因此現(xiàn)對該序列進行對數(shù)變換在eviews 中輸入 genr lngdp=ln(gdp) 生成新的序列 lngdp,并對新序列進行平穩(wěn)性檢驗。lngdp 的相關(guān)系數(shù)和偏相關(guān)系數(shù)如圖四所示,圖四對 ln

6、gdp 用 adf進行單位根檢驗的結(jié)果如圖五圖五這里 lngdp 的 adf變成了, 依然大于三種不同檢驗水平下的臨界值。從中可以看出, 對 gdp序列進行對數(shù)處理后,序列l(wèi)ngdp 序列依然不平穩(wěn)。需要再對lngdp 序列進行差分處理。在eviews 中輸入 genr dlngdp=d(lngdp) 生成新序列dlngdp。并對 dlngdp 進行平穩(wěn)性分析。其自相關(guān)系數(shù)和偏自相關(guān)系數(shù)如圖六所示圖六其 adf檢驗如圖六圖六這是 adf值為小于在1%校驗水平下的臨界值,即可以得出dlngdp 序列為平穩(wěn)序列的結(jié)論。(2) 通過計算能夠描述序列特征的一些統(tǒng)計量(如自相關(guān)系數(shù)或非自相關(guān)系數(shù)),來確

7、定arma 模型的結(jié)束p 和 q,并初始計算時選擇盡可能少的參數(shù)。從 dlngdp 序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)圖中可以看出,該序列可以用arma 模型來表示,且由于自相關(guān)系數(shù)與偏自相關(guān)系數(shù)都是一階截尾的,故取p=1,q=1,采用 arima( 1,1)模型。第三步,估計模型的未知參數(shù),并檢驗參數(shù)的顯著性,以及模型本身的合理性。在eviews中輸入 ls dlngdp c ar(1) ma(1)得到結(jié)構(gòu)如圖七所示圖七從圖中可以看出,估計出的方程模型c 值, ar(1)值的可信度較高,而ma(1)的估計值可信度相對低一些??傮w方程具有很高的可信度。對模型進行殘差序列分析得到如圖八所示圖八最右側(cè)

8、probe 列中的數(shù)字表示相應(yīng)自由度條件下卡方統(tǒng)計量取值大于相應(yīng)q 值的概率。因為這一列概率值都大于,說明模型的隨機誤差序列是一個白噪聲序列。模型均值及自相關(guān)系數(shù)的估計都通過顯著性檢驗,模型本身也通過了殘差自相關(guān)檢驗。因此模型可以用來預(yù)測。則,該方程的表達式為:110.3580.1030.324ttttrraa2 用時序算法的數(shù)據(jù)挖掘方法對數(shù)據(jù)進行挖掘(選取1952-2001 年的數(shù)據(jù) ),得到趨勢圖 .具體步驟為 :(1) 創(chuàng)建數(shù)據(jù)倉庫(2)創(chuàng)建數(shù)據(jù)源和數(shù)據(jù)視圖,搭建挖掘環(huán)境(3) 對已經(jīng)建立的數(shù)據(jù)倉庫進行數(shù)據(jù)挖掘.在” 選擇數(shù)據(jù)挖掘技術(shù)” 選擇時序模型,在定型數(shù)據(jù)時,輸入和可預(yù)測都選擇gd

9、p(4) 得到挖掘結(jié)果.切換到 ” 挖掘模型查看器” 選項卡 ,得到挖掘結(jié)果 .圖九4.用兩種方法的結(jié)論進行預(yù)測根據(jù) arima 估算出的方程進行預(yù)測2000-2008 得到年度實際 gdp預(yù)測 gdp誤差20002001200220032004200517.20063.2007na 表二其預(yù)測值與實際值的擬合曲線如圖十圖十數(shù)據(jù)挖掘的方法只能預(yù)測到緊接著一年即2002 年的 gdp ,值為 :實驗結(jié)果 : 從圖十的擬合曲線來看,隨著預(yù)測期的延長,模型法的到誤差可能會出現(xiàn)逐漸增大的情況。用數(shù)據(jù)挖掘的方法預(yù)測到2002 年 gdp 值為 ,比較表二 ,可知數(shù)據(jù)挖掘的方法較模型法更準確一些.實驗結(jié)論 :(1) 兩種方法的思路和操作程序有很大不同.前者是一種傳統(tǒng)的建模方法,理論基礎(chǔ)很強;后者更多的是一種模式識別,操作更簡單(2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論