![基于Clementine軟件的時(shí)間序列分析以浦發(fā)銀行股票為例_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d1.gif)
![基于Clementine軟件的時(shí)間序列分析以浦發(fā)銀行股票為例_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d2.gif)
![基于Clementine軟件的時(shí)間序列分析以浦發(fā)銀行股票為例_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d3.gif)
![基于Clementine軟件的時(shí)間序列分析以浦發(fā)銀行股票為例_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d4.gif)
![基于Clementine軟件的時(shí)間序列分析以浦發(fā)銀行股票為例_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/2/ffac5c01-83d7-4183-8ed1-1e754ce8c69d/ffac5c01-83d7-4183-8ed1-1e754ce8c69d5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、基于Clementine軟件的時(shí)間序列分析以A股浦發(fā)銀行(600000)股票為例摘 要本文的主要內(nèi)容是借助SPSS Clementine 軟件研究A股浦發(fā)銀行(600000)股票價(jià)格隨時(shí)間的變化規(guī)律,并用時(shí)間序列分析的有關(guān)知識對其進(jìn)行建模預(yù)測。本文首先對Clementine軟件作簡要介紹,說明其在數(shù)據(jù)挖掘領(lǐng)域的廣泛應(yīng)用;然后介紹了3種時(shí)間序列分析預(yù)測的模型,分別為專家模型、Holt指數(shù)平滑模型和ARIMA模型;最后借助Clementine 軟件對浦發(fā)銀行股價(jià)分別進(jìn)行專家建模、指數(shù)平滑建模和ARIMA建模,并對股價(jià)進(jìn)行短期預(yù)測,通過模型參數(shù)比較及預(yù)測值誤差對比,找出最佳模型。在建模的同時(shí),也給出
2、了使用Clementine軟件建立數(shù)據(jù)流的具體過程。關(guān)鍵詞:Clementine軟件 時(shí)間序列 浦發(fā)銀行股票一、 引言數(shù)據(jù)挖掘是一個(gè)利用各種方法,從海量數(shù)據(jù)中提取隱含和潛在的對決策有用的信息和模式的過程。通過數(shù)據(jù)挖掘提取的信息可應(yīng)用于很多領(lǐng)域,如決策支持、預(yù)測、預(yù)報(bào)和估計(jì)等。當(dāng)今我們正面臨這樣一個(gè)問題,一邊是對知識的饑渴,另一邊卻是大量數(shù)據(jù)的閑置未被利用,“我們被淹沒在信息里,但卻感受到知識的饑餓”。因此,我們迫切需要借助數(shù)據(jù)挖掘技術(shù)對這些數(shù)據(jù)進(jìn)行及時(shí)有效的處理,從這些海量的、有噪音的、隨機(jī)的數(shù)據(jù)中提取有效的、潛在有用的而又新穎事先未知的信息 1。數(shù)據(jù)挖掘的工具有很多,本文選用SPSS Cle
3、mentine軟件。二、 Clementine軟件簡介Clementine是由SPSS公司開發(fā)的一款著名且非常實(shí)用的數(shù)據(jù)挖掘軟件,也是目前眾多軟件中最成熟和最受歡迎的一款數(shù)據(jù)挖掘產(chǎn)品。Clementine擁有豐富的數(shù)據(jù)挖掘算法,操作簡單易用,分析結(jié)果直觀易懂,圖形功能強(qiáng)大,支持與數(shù)據(jù)庫之間的數(shù)據(jù)和模型交換,可以使用戶方便快捷地實(shí)現(xiàn)數(shù)據(jù)挖掘。Clementine形象地將數(shù)據(jù)分析的各個(gè)環(huán)節(jié)表示成若干個(gè)節(jié)點(diǎn),將數(shù)據(jù)分析過程看作數(shù)據(jù)在各個(gè)節(jié)點(diǎn)之間的流動(dòng),并通過圖形化的數(shù)據(jù)流方式直觀表示整個(gè)數(shù)據(jù)挖掘的各個(gè)環(huán)節(jié)。Clementine在數(shù)據(jù)挖掘分析中被應(yīng)用于分類預(yù)測問題方面非常多,但是它的其他功能也十分強(qiáng)大
4、,如可以把Clementine軟件運(yùn)用在探索內(nèi)部結(jié)構(gòu)、多元統(tǒng)計(jì)分析、時(shí)間序列預(yù)測等領(lǐng)域。由于利用Clementine做分類預(yù)測(決策樹)問題比較常見,因此本文強(qiáng)調(diào)它的另一功能,即利用Clementine做時(shí)間序列分析。三、 數(shù)據(jù)來源及研究方法1. 數(shù)據(jù)來源 本文所用數(shù)據(jù)為A股浦發(fā)銀行 (600000) 股票2012年2月13日到2012年11月23日股價(jià)數(shù)據(jù),來自大智慧軟件。數(shù)據(jù)見附件1(Excel文件)。2. 研究方法本文利用時(shí)間序列分析知識并結(jié)合Clementine軟件對A股浦發(fā)銀行 (600000) 股票每日行情數(shù)據(jù)進(jìn)行建模分析,與原始數(shù)據(jù)比較擬合并根據(jù)參數(shù)選擇最佳模型。本文所用到的模型
5、有:專家建模模型、Holt指數(shù)平滑模型和ARIMA(求和自回歸移動(dòng)平均)模型。(1)專家模型Clementine軟件里一種可以自動(dòng)預(yù)測的建模方法,自動(dòng)進(jìn)行最優(yōu)模型的選擇、參數(shù)估計(jì)和預(yù)測。(2) Holt指數(shù)平滑模型Holt指數(shù)平滑法是一種線性指數(shù)平滑方法,它是一種較高級形式的指數(shù)平滑方法。這種方法最突出的優(yōu)點(diǎn)是對具有趨勢變動(dòng)的時(shí)間數(shù)列,不用二次指數(shù)平滑,而是對趨勢數(shù)據(jù)直接進(jìn)行平滑并對原時(shí)間序列進(jìn)行預(yù)測。這種方法因具有很大的靈活性而被廣泛地使用著。Holt指數(shù)平滑適用于對含有線性趨勢的序列進(jìn)行修勻。它的基本思想是假定序列有一個(gè)比較固定的線性趨勢:。其平滑公式為:式中,為兩個(gè)平滑系數(shù),滿足條件。假
6、定最后一期的修勻值為,那么使用Holt指數(shù)平滑法向前期的預(yù)測值為:.(3) ARIMA模型ARIMA模型全稱為求和自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model,簡記ARIMA),是由Box和Jenkins于70年代初提出的一種著名時(shí)間序列預(yù)測方法。其中在ARIMA()中,AR是自回歸,為自回歸項(xiàng)數(shù);MA是移動(dòng)平均,為移動(dòng)平均項(xiàng)數(shù);為時(shí)間序列成為平穩(wěn)時(shí)所做的差分次數(shù)。 ARIMA模型是將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量僅對它的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型。其公式為:式中,;,為平穩(wěn)可逆AR
7、MA()模型的自回歸系數(shù)多項(xiàng)式;,為平穩(wěn)可逆ARMA()模型的移動(dòng)平滑系數(shù)多項(xiàng)式。四、 實(shí)證分析以浦發(fā)銀行股票為例以浦發(fā)銀行2012年2月13日至2012年11月23日每日收盤價(jià)作為數(shù)據(jù)源,利用Clementine軟件對這些數(shù)據(jù)進(jìn)行分析。建立的數(shù)據(jù)流如圖1所示。圖1 浦發(fā)銀行股票股價(jià)數(shù)據(jù)流簡要步驟如下:1. 數(shù)據(jù)過濾:建模過程中考慮到數(shù)據(jù)源中除了“日期”、“收盤價(jià)”字段外,還包含了“開盤價(jià)”、“最高”、“最低”、“成交量”、“成交額”等無關(guān)字段,所以需要先對字段進(jìn)行過濾,利用Filter節(jié)點(diǎn)可得到我們想要的結(jié)果。2. 在Type節(jié)點(diǎn)中,將“日期”的類型改為Typeless,將“收盤價(jià)”的方向改
8、為Out。3. 通過Derive節(jié)點(diǎn)計(jì)算出浦發(fā)銀行每日收盤價(jià)的對數(shù),并連接Time Plot節(jié)點(diǎn),得到收盤價(jià)和log(收盤價(jià))的時(shí)間序列散點(diǎn)圖,如圖2所示。圖2 收盤價(jià)及l(fā)og(收盤價(jià))的時(shí)序圖在圖2所示的時(shí)間序列圖中,浦發(fā)銀行每日收盤價(jià)是均值非平穩(wěn)且方差非平穩(wěn)的,且log(收盤價(jià))有不變方差的向下趨勢,故可以選擇對數(shù)變換。4. 由于股票市場雙休日及節(jié)假日不開市的特殊性,收集到的數(shù)據(jù)在時(shí)間段上是分段的,也就是說,在不開市的時(shí)間點(diǎn),數(shù)據(jù)缺失。為了方便利用模型來分析,我們通過填充的辦法使得數(shù)據(jù)(收盤價(jià))在以天為時(shí)間單位上能夠連續(xù)。具體操作為添加Time Interval節(jié)點(diǎn),連接到數(shù)據(jù)流合適的位置
9、,在Build選項(xiàng)卡中選擇Specify fields and functions,選中“收盤價(jià)”并在Padding Function(填充函數(shù))選項(xiàng)卡選擇Mean of recent points(最近點(diǎn)的平均值),如圖3所示。圖3 Time Interval節(jié)點(diǎn)選項(xiàng)的設(shè)置對股票研究的意義在于能夠在一定時(shí)間段內(nèi)對股價(jià)進(jìn)行較為準(zhǔn)確地預(yù)測,而預(yù)測時(shí)間越長誤差越大,尤其是對股票這類數(shù)據(jù)的預(yù)測,無法長時(shí)間較準(zhǔn)確地預(yù)測,故我們只進(jìn)行短期預(yù)測。因此在Forecast選項(xiàng)卡中,選擇預(yù)測天數(shù)為14天。5. 模型的建立(1)專家模型 在節(jié)點(diǎn)工具箱窗口中選擇Modeling選項(xiàng),找到Time Series節(jié)點(diǎn),
10、添加到數(shù)據(jù)流合適的位置。Model選項(xiàng)卡中Method(方法)選擇Expert Modeler(專家模型),Criteria選項(xiàng)卡中選擇All models,確定執(zhí)行即可得到專家模型,如圖4所示。圖4 專家模型參數(shù)設(shè)置(2) Holt指數(shù)平滑模型同上添加Time Series節(jié)點(diǎn),Model選項(xiàng)卡中Method(方法)選擇Exponential Smoothing(指數(shù)平滑模型),Criteria選項(xiàng)卡中選擇Holts linear trend,確定執(zhí)行即可得到Holt指數(shù)平滑模型,如圖5所示。圖5 Holt指數(shù)平滑模型參數(shù)設(shè)置(3)ARIMA()模型 同上添加Time Series節(jié)點(diǎn),Mo
11、del選項(xiàng)卡中Method(方法)選擇ARIMA(求和自回歸移動(dòng)平均),Criteria選項(xiàng)卡中對自回歸(),差(),移動(dòng)平均()進(jìn)行賦值,確定執(zhí)行即可得到ARIMA模型。在此,我們通過對模型的觀察及其他各方面考慮,對()賦值為(2,1,2),如圖6所示。圖6 ARIMA模型參數(shù)設(shè)置最終得到的三個(gè)模型的數(shù)據(jù)流如圖7(a)、圖7(b)、圖7(c)所示。圖7(a) 專家模型數(shù)據(jù)流圖7(b) Holt指數(shù)平滑模型數(shù)據(jù)流圖7(c) ARIMA(2,1,2)模型數(shù)據(jù)流6. 模型分析及比較 在數(shù)據(jù)流上雙擊模型,打開模型參數(shù)界面,可以看到關(guān)于模型的一系列參數(shù)?,F(xiàn)將三個(gè)模型的部分參數(shù)匯總?cè)绫?所示。表1 浦發(fā)
12、銀行股票股價(jià)收盤價(jià)模型比較固定QDfSigRMSEMAPEMAEHolt指數(shù)平滑0.5840.98619.46816.00.2450.0890.6770.055專家模型0.030.98620.09617.00.2690.0790.6720.054ARIMA(2, 1, 2)0.0560.98615.28414.00.3590.0780.6750.055其中,固定R2用于比較模型的平穩(wěn)部分及簡單均值模型的度量值。當(dāng)存在趨勢或季節(jié)模式時(shí),該度量值對普通 R 平方更具優(yōu)勢。R2為判定系數(shù),是序列中由模型解釋的總變異所占比例的估計(jì)值,該值越高表示模型的擬合越好。Q、Df分別代表模型的檢驗(yàn)統(tǒng)計(jì)量和自由度
13、。Sig表示殘差自相關(guān)檢驗(yàn)結(jié)果的值,若<005,則認(rèn)為殘差存在自相關(guān)性,模型擬合不足,需改進(jìn);若>005,則認(rèn)為殘差為白噪聲序列,即表明所建模型已包含了原序列的所有趨勢。RMSE指均方根誤差,是一種測量序列實(shí)際值與模型預(yù)測值之間差異的度量方法,該誤差越低越好。MAPE表示均值絕對百分比誤差,用于度量目標(biāo)序列與其模型預(yù)測水平的差異度,用百分比表示。通過審查所有模型中的均值和最大值,可以大概知道預(yù)測的不確定性程度。MAE表示絕對平均誤差,用于顯示預(yù)測誤差絕對值的均值。接下來再考慮殘差的自相關(guān)性和偏自相關(guān)性,可通過殘差自相關(guān)圖(ACF)及偏自相關(guān)圖(PACF)得出結(jié)果。殘差是指觀測值與預(yù)
14、測值(擬合值)之間的差,即是實(shí)際觀察值與回歸估計(jì)值的差。三個(gè)模型建模所得的殘差自相關(guān)圖(ACF)及偏自相關(guān)圖(PACF)分別如圖8(a)、8(b)、8(c)所示,可以看出三個(gè)模型殘差的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)幾乎都在兩倍(2)標(biāo)準(zhǔn)差范圍內(nèi),說明對殘差序列的信息提取充分,不存在欠擬合的問題。圖8(a) 專家模型的殘差A(yù)CF和PACF圖8(b) Holt指數(shù)平滑模型的殘差A(yù)CF和PACF圖8(c) ARIMA模型的殘差A(yù)CF和PACF最后考察分別用3個(gè)模型做預(yù)測所得的結(jié)果和真實(shí)值的擬合效果圖,所得結(jié)果如圖9(a)、9(b)、9(c)所示。圖9(a) 專家模型擬合預(yù)測圖圖9(b) Holt指數(shù)平滑模
15、型擬合預(yù)測圖圖9(c) ARIMA模型擬合預(yù)測圖其中,藍(lán)線為真實(shí)值,紅線為預(yù)測值。由圖9可知,三個(gè)模型的擬合效果都是很好的。將用3個(gè)模型建模所得的浦發(fā)銀行股票收盤價(jià)的預(yù)測值分別與真實(shí)值進(jìn)行比較,結(jié)果如表2所示。表2 3個(gè)模型預(yù)測值與真實(shí)值的比較日期指數(shù)平滑模型差值專家模型差值A(chǔ)RIMA模型差值真實(shí)值2012-11-267.4744 0.0044 7.4959 0.0259 7.4891 0.0191 7.472012-11-277.4680 0.0080 7.4959 0.0359 7.4859 0.0259 7.462012-11-287.4616 0.0216 7.4959 0.0559
16、7.4778 0.0378 7.442012-11-297.4553 0.0453 7.4959 0.0859 7.4707 0.0607 7.412012-11-307.4489 -0.0111 7.4959 0.0359 7.4665 0.0065 7.462012-12-37.4298 0.0798 7.4959 0.1459 7.4518 0.1018 7.352012-12-47.4234 -0.0066 7.4959 0.0659 7.4464 0.0164 7.432012-12-57.4171 -0.4629 7.4959 -0.3841 7.4416 -0.4384 7.88
17、2012-12-67.4107 -0.4793 7.4959 -0.3941 7.4367 -0.4533 7.892012-12-77.4044 -0.8556 7.4959 -0.7641 7.4315 -0.8285 8.26五、 結(jié)論通過對以上結(jié)果的分析,我們可以得到下述結(jié)論:首先,從對數(shù)散點(diǎn)圖得知浦發(fā)銀行股票股價(jià)有不變方差變化的趨勢,則固定R2更有參考價(jià)值。固定R2用于比較模型的平穩(wěn)部分及簡單均值模型的度量值,當(dāng)存在趨勢或季節(jié)模式時(shí),該度量值比普通R2更具優(yōu)勢。其中專家模型擬合程度(固定R2值)為0.03,Holt指數(shù)平滑模型擬合程度為0.584,ARIMA(2,1,2)模型擬合程度
18、為0.056,所以Holts指數(shù)平滑模型擬合程度更好。其次,對R2,RMSE,MAPE,MAE這幾個(gè)指標(biāo)進(jìn)行對比,三個(gè)模型的R2都是相等的,均為0.986,其余三個(gè)指標(biāo)相差不大(如表1所示)。再次,三個(gè)模型的Sig值(即值)均大于0.05,均為顯著可行,即三個(gè)模型的殘差均為白噪聲序列,表明所建模型已包含了原序列的所有趨勢,也即模型診斷得以通過。最后,對比A股浦發(fā)銀行股票股價(jià)的真實(shí)值與預(yù)測值之間的差異發(fā)現(xiàn),專家模型在本例中的預(yù)測值沒有變化,沒能體現(xiàn)出浦發(fā)銀行股價(jià)的趨勢。而Holt指數(shù)平滑模型比ARIMA(2,1,2)模型的預(yù)測精度要高,特別體現(xiàn)在短期預(yù)測方面,Holt指數(shù)平滑模型的預(yù)測值和真實(shí)值之差要比其他兩個(gè)模型小得多。故綜合以上幾個(gè)方面,我們可以得出結(jié)論,對于本例預(yù)測A股浦發(fā)銀行 (600000)股票股價(jià)來說,Holt指數(shù)平滑模型是三個(gè)模型中最可行的。Clementine軟件在數(shù)據(jù)挖掘方面有很大的使用空間,并在很大程度上簡化了時(shí)間序列建模的過程。Clementine軟件在金
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年單元式幕墻設(shè)計(jì)與施工合同模板
- 2025年住宅建筑工程合同協(xié)議書范例
- 2025年醫(yī)療設(shè)備維修服務(wù)合同協(xié)議書范本
- 2025年通信運(yùn)營商策劃策略與業(yè)務(wù)增長合作協(xié)議書
- 2025年企業(yè)集團(tuán)統(tǒng)一采購生產(chǎn)設(shè)備的策劃協(xié)議
- 2025年房屋貸款償還策劃協(xié)議
- 2025年信用保證協(xié)議示例
- 2025年代理出口業(yè)務(wù)協(xié)議書樣本
- 2025年農(nóng)業(yè)開發(fā)工程項(xiàng)目合作框架協(xié)議
- 2025年企業(yè)股權(quán)增值收益權(quán)分享策劃協(xié)議范本
- GB 18030-2022信息技術(shù)中文編碼字符集
- SB/T 10977-2013倉儲作業(yè)規(guī)范
- GB/T 854-1988單耳止動(dòng)墊圈
- GB/T 2520-2017冷軋電鍍錫鋼板及鋼帶
- 化工裝置安全試車工作規(guī)范附件解讀教材課件
- 【QC成果】提高地下室抗浮錨桿一次驗(yàn)收合格率
- 篆刻學(xué)ppt精品課件
- 中厚板軋制規(guī)程
- 貴州煤炭資源有償使用意見
- 智慧教育 云平臺建設(shè)方案
- 模具試模通知單
評論
0/150
提交評論