降水時間序列挖掘模型的建立和應(yīng)用_第1頁
降水時間序列挖掘模型的建立和應(yīng)用_第2頁
降水時間序列挖掘模型的建立和應(yīng)用_第3頁
降水時間序列挖掘模型的建立和應(yīng)用_第4頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、降水時間序列挖掘模型的建立和應(yīng)用羅耀軍(柳州鐵道職業(yè)技術(shù)學(xué)院,廣西柳州545007 )【摘要 】在廣西柳州水文水資源分局收集有關(guān)的水文數(shù)據(jù)并進行相應(yīng)的預(yù)處理基礎(chǔ)上,根據(jù)時間序列分析所涉及的主要內(nèi)容,將水文時間序列分解為趨勢項、周期項、突發(fā)項、隨機項,然后分別按照各個組成項的變化規(guī)律對這些項進行研究,找出其變化規(guī)律,并分別建立各個組成項的數(shù)學(xué)模型,最后將這些分解模型合成為水文時間序列的預(yù)測模型,并使用此模型對水文時間序列的未來值進行預(yù)測和分析?!娟P(guān)鍵詞 】時間序列。水文數(shù)據(jù)。模型。建立。預(yù)測【收稿日期】 2018-3-5【作者簡介 】羅耀軍 (1961-) ,男,廣西全州人,柳州鐵道職業(yè)技術(shù)學(xué)院

2、信息工程系副教授,主要從事計算機應(yīng)用技術(shù)研究?!局袌D分類號】 TP301 【文章標(biāo)識碼 】 BEstablishment and Application of Time-series Mining ModelLuo Yao-jun(Liuzhou Railway Vocational Technical College , Liuzhou Guangxi 545007)Abstract: on thebasisofdatacollectedbyLiuzhou, GuangxiHydrologyandWater Resources Branch and the corresponding pre

3、-treatment ,the hydrology timeseriesisbrokenupintotrendterm,periodicityterm,outbursttermandrandomnesstermaccordingtothemain contentsrelatedtothetimeseriesanalysis.Accordingtothechangelawofeach compositionterm,thesecompositiontermareanalysedand researchedrespectively,theirrulesofvariance can be disco

4、vered. A mathematic model to each composition term is alsobuilt up. Finally, these decomposition models are synthesized for hydrologicaltime seriespredictionmodelandusethismodelto forecastandanalyzethefuture of hydrological time series.Key words : time series。 hydrology data。 model 。 establish。 fore

5、cast近年來,國內(nèi)外科研人員和工程技術(shù)人員在水文時間序列數(shù)據(jù)挖掘方面取得了一定的研究成果,主要有傳統(tǒng)的時間序列分析技術(shù)、隨機水文理論、模糊分析方法、灰色系統(tǒng)方法、信息嫡分析方法、混沌理論分析方法、小波分析方法、人工神經(jīng)網(wǎng)絡(luò)方法等。丁晶與鄧育仁兩人,比較系統(tǒng)地綜合了隨機水文學(xué)領(lǐng)域的基本理論和方法以及研究成果,指出隨機性、模糊性和灰色性往往共存于所研究的對象和問題中,在不確定性分析和計算時,不1/10宜獨立地采取單一方法,應(yīng)將各種方法有機地結(jié)合起來1 。陳南祥等將相空間重構(gòu)理論與神經(jīng)網(wǎng)絡(luò)理論相結(jié)合,提出了徑流時間序列預(yù)測模型2 ,該模型在漢江石泉水庫逐月平均入庫徑流序列預(yù)測中有較高的預(yù)測精度。楊

6、建平等應(yīng)用Meyer 小波對長江黃河源區(qū)水文和氣象序列周期變化進行分析,發(fā)現(xiàn)天體運動直接影響降水量和氣溫的周期變化,進而在一定的條件下影響徑流的周期變化3 。王紅瑞等應(yīng)用混沌理論對水文時間序列進行研究,提出分形上的混沌動力系統(tǒng)以及混沌與神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法4 ,這樣可以為水科學(xué)問題的研究提供一些新的思路。本文主要采用時間序列分析技術(shù)對廣西柳州水文水資源分局下屬的柳州水文站所收集和記錄的水文數(shù)據(jù)進行挖掘分析,并期望從這些數(shù)據(jù)中找出隱藏于其中的關(guān)系和規(guī)則,然后對未來的發(fā)展趨勢做出預(yù)測和評估,這樣可以為有關(guān)的職能部門的決策提供參考和服務(wù)。在現(xiàn)實中,時間序列的變化受許多因素的影響,有些因素起著長期的、

7、決定性的作用,使時間序列的變化呈現(xiàn)出某種趨勢和一定的規(guī)律性,有些因素則起著短期的、非決定性的作用,使時間序列的變化呈現(xiàn)出某種不規(guī)則性。廣西柳州水文水資源分局收集有關(guān)的水文數(shù)據(jù)是對水文過程的離散記錄,由于水文過程本身的復(fù)雜性和不確定性,某些外在因素對水文過程的影響途徑不清、機制不明,因此水文數(shù)據(jù)具有高度的非線性特點,如果僅從線性或近似為線性問題的角度去研究水文數(shù)據(jù),則必然具有一定的局限性。因此應(yīng)將多種方法結(jié)合起來,才能開發(fā)出一種精度較高的預(yù)測模型。根據(jù)時間序列的特點和特征,在對時間序列進行分析時,其所涉及的內(nèi)容一般有趨勢變化、周期性、隨機性和突發(fā)性。趨勢項反映的是時間序列的季節(jié)性趨勢或多年變化趨

8、勢;周期項反映的是時間序列的周期性變化;突發(fā)項是表示時間序列受到外部突發(fā)因素的影響而形成的變化。趨勢項、周期項、突發(fā)項反映了時間序列中的確定性成分,把這三項分離出去,剩下的就是隨機項。設(shè) X 為時間序列, T 為趨勢項, P 為周期項, R 為隨機項, B 為突發(fā)項,則 X 可以表示為5 ,6:XTPRB或XTPRB(1)(2)將時間序列分解為上述四個部分后,則可以分別對各個組成項進行研究,找出其變化規(guī)律,然后對未來的時刻進行外推,最后將各項合成且將其作為時間序列的預(yù)測值。1 數(shù)學(xué)模型分析1.1水文時間序列的趨勢項分析水文時間序列的趨勢項分析可以采用移動平均法、加權(quán)移動平均法、指數(shù)平滑法、最小

9、二乘法等方法進行分析。本文采用指數(shù)平滑法進行分析。指數(shù)平滑法來源于移動平均法,是移動平均法的延伸。移動平均法可以對時間序列進行修勻,并測定其長期變化趨勢,當(dāng)然這樣的預(yù)測比較粗糙,常用的方法是將其改造為更適當(dāng)?shù)男问街笖?shù)平滑法。2/10指數(shù)平滑法的原理6 :設(shè) Xt 為時間t時的觀測值,X t 為時間 t時的簡單移動平均數(shù), n 為移動平均時期數(shù),一般取3 或者5,為消除年周期影響,對月份資料可以取12,對季節(jié)資料可以取 4,為消除日周期影響,對小時資料可以取24,其余類似。于是有:t 時的簡單移動平均數(shù):-=( X+X+X+ +X)/ nXtt-1t-2t-3t-nt +1 時的簡單移動平均數(shù):

10、-X t+1 =( X t +X t-1 +X t-2 +X t-n+1 ) / n=(X t +X t-1+X t-2 + +X t-n+1 +X t-n - X t-n ) / n=-Xt-n /nXt + Xt /n-在歷史資料不足的情況下,遠期的Xt-n值可能沒有,可用X t 作為其最佳估計值,再用-預(yù)測值 X t 代替X t ,上式可以寫為:+X/ n-/ nXt+1= XXttt以 代替 1/ n,則得:=(3)X t+1 Xt + ( 1- ) X t(4)X t+1= Xt + ( Xt - X t )上兩個式子是指數(shù)平滑預(yù)測常用的兩個基本公式,式中的是平滑系數(shù)。式3 的意義是

11、:新預(yù)測值 = (t 時觀測值) +( 1- ) t 時預(yù)測值即新預(yù)測值是t 時觀測值與 t 時預(yù)測值的加權(quán)平均數(shù),權(quán)數(shù)分別為 和 1- , 是小于 1 的系數(shù)。式 4 是誤差校正式,其意義是:新預(yù)測值 = t 時預(yù)測值 + ( t 時觀測值 -t 時預(yù)測值)=t 時預(yù)測值 +( t 時預(yù)測誤差)其中: t 時預(yù)測誤差 = t 時觀測值 - t 時預(yù)測值 = X -Xtt從式 3和式 4可以看出指數(shù)平滑法的遞推性質(zhì),因為這種預(yù)測可以永遠地循環(huán)下去。將式 3 進行分解即可看出此方法的指數(shù)加權(quán)性質(zhì):Xt+1= Xt + ( 1- ) X t= X+ ( 1- ) X+( 1- )2Xt-1tt-1

12、= Xt + ( 1- ) Xt-1 + ( 1- ) 2Xt-2 + ( 1- ) 3Xt-3 +( 1- )t-1X1+( 1- )tX 1使用指數(shù)平滑法進行預(yù)測,必須預(yù)先解決平滑系數(shù) 的取值問題。如果原數(shù)列波動不大, 可以取較小值(例如0.10.3 ),以加重舊預(yù)測值的權(quán)數(shù);反之,如果原數(shù)列波動較大,則 宜取較大值(例如0.60.8),以加重新觀測值的權(quán)數(shù)。在無法做出判斷時,可以分別用幾個不同的 值進行計算,然后進行比較,最后采用預(yù)測值誤差最小的方案。1.2 水文時間序列的周期項分析從水文時間序列 Xt 分離出趨勢項可得到新序列Zt ,此時可對新序列 Zt 進行周期分析。3/10在自然界

13、中存在著各種不同時間長度的周期和準周期現(xiàn)象,例如一年中的季節(jié)交替,一天中的日出日落等現(xiàn)象,就是我們熟知的周期現(xiàn)象。如果某現(xiàn)象的某一事件出現(xiàn)以后,經(jīng)過一定的時間長度,該事件一定重現(xiàn),則稱該現(xiàn)象具有嚴格的周期性。具有嚴格周期性的現(xiàn)象可以表示為:Z (i) Z (ijT )(=123, )(5)j,其中 T 稱為該現(xiàn)象的周期。例如正弦波和余弦波就具有嚴格的周期性。在現(xiàn)實世界中,還存在一種概率統(tǒng)計意義上的周期。例如廣西柳州水文數(shù)據(jù)描述年4月份的降水量具有 11 年的周期,其僅僅表示該地在4 月份的降水量每隔11 年左右出現(xiàn)一個高值或低值的可能性比較大,而不是說該地每隔11 年 4 月份的降水量一定會出

14、現(xiàn)一個高值或低值。這類周期性通常稱為準周期性。自然界中存在的周期現(xiàn)象,絕大多數(shù)都屬于準周期現(xiàn)象。準周期一般都隱含在時間序列的變化中,如果把一個時間序列看成是由幾個確定的諧波疊加而成的復(fù)雜波動,那么只要分析出構(gòu)成時間序列的這些諧波,即可將這些諧波疊加,然后使用其進行外推,這樣可對時間序列的未來值做出預(yù)測。對時間序列進行周期分析,首先要判斷時間序列中是否存在顯著周期,如果存在顯著周期,則將其從時間序列中濾除,直到無顯著周期為止。時間序列的周期分析是現(xiàn)代統(tǒng)計預(yù)測學(xué)的一個重要分支,其中最常用的方法是方差分析。判斷時間序列中是否存在顯著周期在分析周期之前,事先并不知道這一序列的周期是多少,所以要根據(jù)序列

15、長度,列出可能存在的周期。如果時間序列總長度為n,則可能存在的周期為T( T=2, 3, , n/2 )7 。將周期為 T 的時間序列進行分組,對應(yīng)可以分為T 組數(shù)據(jù),根據(jù)式5 可知第 i組的平均值為:ni 1Zi1jT )(6)niZ (ij 0式中i 的值為 1, 2, 3, TT周期ni 不大于n/ T 的最大整數(shù),即一組內(nèi)的數(shù)據(jù)個數(shù)將時間序列分別按每一個可能的周期(T=2, 3, , n/2 )進行分組,計算相應(yīng)的組內(nèi)離差平方和SE及組間離差平方和SA :TniSE T(ZijZi )2= -(7)(自由度 f 1 n T)i 1j 1Z )2(= -1)(8)SAni (Zi自由度

16、f 2 T式中i 1ni 第 i 組中數(shù)據(jù)的個數(shù)Z i 第 i 組的平均值Z 總平均值可以證明 F =( S / f )/(S / f) 服從自由度為( f, f1)的 F 分布。給定顯著水平 (例TA2E12如 =0.05 )查 F 分布表可以得到F ( f2 ,f1 )的值,如果FT>F ,則此周期為顯著周期。4/10選擇最大的顯著周期為第一周期,并將其周期成份從序列中濾去,再把剩余序列重復(fù)上述步聚,直至無顯著周期。最后將提取出的各個諧波疊加即可求出周期項。從時間序列中提取周期成份t周期確定后 , 周期成份 P 可用如下形式描述:d(ai cos 2t bi sin 2 t )Pt(

17、9)i1TiTi式中 d有效諧波數(shù)Ti 第 i 個諧波對應(yīng)的周期ai 和 bi 為參數(shù) , 計算式為:nai2(Z t cos 2t )(10)bin tn1Tit )2(Zt sin 2(11)n t 1Ti1.3水文時間序列的突發(fā)項分析突發(fā)項分析主要是從原始的資料進行詳細考查,以斷定有無突發(fā)項存在。如果時間序列中不含有突發(fā)項,此時就可以免去分離突發(fā)項的工作。1.4水文時間序列的隨機項分析從時間序列分離出趨勢項、周期項和突發(fā)項之后,剩余的序列具有平穩(wěn)隨機過程的性質(zhì)。隨機項可以采用自回歸模型進行分析。設(shè)Zt 為剩余時間序列在t 時的值,則回歸方程為:Ztp ,1Z t 1p,2 Z t2p,

18、p Z tp(12)式中Zt 時刻 t 的時間序列值 常數(shù)項 p,j (j =1, 2, , p)自回歸系數(shù)p模型階數(shù)。自回歸系數(shù)可以根據(jù)實測的水文時間序列數(shù)據(jù),利用最小二乘法建立Yule-Walker 方程組,運用遞推公式求解自回歸系數(shù)5 , 6, 8, 9 ,模型階數(shù) p 可以通過AIC 準則來確定, AIC準則是由 Akaike 在 1973 年提出的。2 模型的檢驗完成上述趨勢項、周期項和隨機項的分析并建立相應(yīng)的模型后,使用相應(yīng)的模型進行外推,即可分別求出趨勢項、周期項和隨機項的未來值,然后按式1 或式 2 將這些項進行合成,即可預(yù)測時間序列的未來值。廣西柳州水文時間序列預(yù)測模型軟件,

19、前臺使用Microsoft公司的 Visual C+6.0,后臺使用Microsoft公司的 SQL Server 2000數(shù)據(jù)庫管理系統(tǒng),使用年降水量和年降水日數(shù)時間序列來檢驗該模型。2.1數(shù)據(jù)的選擇依據(jù)柳州市地處廣西中部,屬于典型的亞熱帶氣候,該市的水文數(shù)據(jù)能較好地反映亞熱帶5/10地區(qū)的特點,通過分析該市的水文數(shù)據(jù)并找出有關(guān)的規(guī)律和特點,不僅可以為本地的有關(guān)職能部門提供參考和服務(wù),還可以為相鄰或相似地區(qū)的水文數(shù)據(jù)分析提供參考。因此本文選擇廣西柳州市的水文數(shù)據(jù)進行分析,其中主要是分析降水量,因為降水量是水文數(shù)據(jù)中的基礎(chǔ)數(shù)據(jù),降水量的大小和降水的時空分布直接決定了水位的高低以及流量、含沙量和

20、蒸發(fā)量的大小,對降水量的研究具有重要的應(yīng)用價值和實際意義。2.2數(shù)據(jù)的來源本文的研究得到了廣西柳州水文水資源分局的大力支持和幫助,所使用的數(shù)據(jù)全部由廣西柳州水文水資源分局資料室提供,這些水文數(shù)據(jù)由該分局下屬的柳州水文站進行測量和記錄,這些數(shù)據(jù)都是實際應(yīng)用中的第一手資料,因此這些數(shù)據(jù)是可靠的、具有實用價值的數(shù)據(jù)。2.3模型檢驗對年降水量進行預(yù)測使用本軟件對廣西柳州的年降水量進行分析,首先從年降水量時間序列中分離出趨勢項,再從剩余序列中分離出周期項,然后分離出隨機項,最后將這三項合成,并使用此模型對年降水量進行預(yù)測。有關(guān)的數(shù)據(jù)如表1 所示。表中第1 列為年份,第2 列為該年的總降水量,第3 列為使

21、用趨勢項模型計算得到的趨勢項,第4 列為剩余序列中求出的周期項,第5 列為剩余序列中求出的隨機項,第6 列為預(yù)測值,第7 列為誤差,其中:誤差=(年降水量 - 預(yù)測值) / 年降水量。表 1年降水量預(yù)測Tab.1 annual precipitation forecast年年降水量趨勢項周期項隨機項預(yù)測值誤差19461659.41489.685-55.5795-1434.1060.135819471688.61506.657140.2454-1646.9020.024719481811.01524.851-84.6659-1440.1850.204819491525.31553.466-55.

22、5795-1497.8870.01819501439.61550.649140.2454-1690.895-0.174619511757.81539.545-84.6659-1454.8790.172319521678.41561.37-55.5795-1505.7910.102819531652.01573.073140.2454-1713.318-0.037119541357.31580.966-84.6659-1496.3-0.102419551319.61558.599-55.5795-1503.02-031534.699140.2454-1674.945-0

23、.093119571689.61534.459-84.6659-1449.7930.141919581528.81549.973-55.5796-1494.3940.02256/1019591915.21547.856140.2454-1688.1010.118619601515.11584.59-84.6659-1499.9250.0119611851.51577.641-55.5796-1522.0620.177919621305.01605.027140.2454-1745.273-0.337419631022.21575.025-84.6659-1490.359-0.458196411

24、12.81519.742-55.5796-1464.163-0.315719651835.31479.048140.2454138.07121757.3650.042519661399.61514.673-84.6658102.10241532.11-0.094719671292.11503.166-55.5796-1.75761445.829-0.11919681731.11482.059140.245417.76211640.0670.052619691596.61506.963-84.6658146.43831568.7360.017519701406.61515.927-55.5796

25、-37.19851423.149-0.0118197114811504.994140.2454-205.9051439.3350.028119721286.11502.595-84.6658-135.1861282.7430.002619731217.31480.945-55.5796-100.7751324.59-0.088119741708.11454.581140.245441.02831635.8550.042319751362.41479.933-84.6658-38.47871356.7880.004119761410.91468.18-55.5796-150.9961261.60

26、40.105819771663.61462.452140.2454-74.80381527.8930.081619781275.21482.566-84.665857.07491454.976-071461.83-55.5796-74.58971331.660.029919801376.81452.917140.2454-234.4741358.6890.013219811490.61445.305-84.66585.83411366.4730.083319821424.71449.835-55.5797102.98671497.242-0.050919831928.

27、21447.321140.2454143.38261730.9490.10231984935.01495.409-84.6658-177.0541233.69-0.319519851120.51439.368-55.5797-63.65831320.13-0.178219861401.21407.481140.2454-106.4751441.252-0.0286通過軟件的運行和分析可知,柳州年降水量的自回歸模型階數(shù)p=19,且年降水量存在一個 3 年的周期,即每隔3 年降水量一般會出現(xiàn)一個高值,相應(yīng)的年份屬于豐水年,一般不會出現(xiàn)干旱現(xiàn)象,但應(yīng)做好防洪的準備工作。由表1 的數(shù)據(jù)可知,使用這種模

28、型對年降水量進行預(yù)測,對于普通的數(shù)據(jù)具有較高的精度,但對于離群數(shù)據(jù)的預(yù)測誤差偏大。對年降水日數(shù)進行預(yù)測對柳州的年降水日數(shù)進行預(yù)測,有關(guān)的數(shù)據(jù)如表2 所示。7/10表 2年降水日數(shù)預(yù)測Tab. 2 annual precipitation date number forecast年年降水日趨勢項周期項隨機項預(yù)測值誤差數(shù)1946113158.8780-158.878-0.4061947153154.29020-154.2902-0.00841948183154.16120-154.16120.15761949162157.04510-157.04510.03061950156157.54060-1

29、57.5406-0.00991951172157.38650-157.38650.0851952168158.84790-158.84790.05451953199159.76310-159.76310.19721954150163.68680-163.6868-0.09121955130162.31810-162.3181-0.24861956155159.08630-159.0863-0.02641957186158.67770-158.67770.14691958143161.40990-161.4099-0.12871959181159.56890-159.56890.11841960

30、148161.7120-150.5378-0.017111.17421961170160.340802.6683163.00910.04111962158161.306709.8623171.169-0.08331963135160.97610-147.1264-0.089813.84971964154158.37850-146.35570.049612.02281965158157.940606.311164.2516-0.03961966165157.94650-0.4538157.49270.04551967174158.651904.037162.68890.0651968159160

31、.186702.0012162.1879-0.021969139160.0680-10.403149.665-0.07671970173157.961207.9286165.88980.04111971150159.46510-7.8816151.5835-0.01061972174158.518600.5367159.05530.08598/101973174160.066701.5989161.66560.07091974152161.46010-2.1233159.3368-0.04831975166160.514103.6085164.12260.01131976165161.0627

32、04.6502165.7129-0.00431977150161.45640-7.9773153.4791-0.02321978145160.310701.1752161.4859-0.11371979157158.77970-3.2997155.480.00971980161158.60170-5.2038153.39790.04721981164158.8415012.3201171.1616-0.04371982170159.35740-5.6529153.70450.09591983162160.42160-2.9457157.47590.02791984160160.579500.7815161.361-0.00851985152160.52150-2.041158.4805-0.04261986128159.66940-4.1282155.5412-0.2152通過軟件的運行和分析可知,柳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論