基于數(shù)據(jù)挖掘的風(fēng)力發(fā)電機(jī)輸出預(yù)測研究_第1頁
基于數(shù)據(jù)挖掘的風(fēng)力發(fā)電機(jī)輸出預(yù)測研究_第2頁
基于數(shù)據(jù)挖掘的風(fēng)力發(fā)電機(jī)輸出預(yù)測研究_第3頁
基于數(shù)據(jù)挖掘的風(fēng)力發(fā)電機(jī)輸出預(yù)測研究_第4頁
基于數(shù)據(jù)挖掘的風(fēng)力發(fā)電機(jī)輸出預(yù)測研究_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于數(shù)據(jù)挖掘的風(fēng)力發(fā)電機(jī)輸出預(yù)測研究

能源能源是指從太陽和地球上收集的天然資源,如能、能、能、熱、太陽能等。利用太陽能和地球上的自然能源,并將廢物轉(zhuǎn)化為能源產(chǎn)品的產(chǎn)物,如廢物沼氣和能源產(chǎn)量。其中,風(fēng)力發(fā)電的成本與傳統(tǒng)能源相似。在幾種新興能源中,風(fēng)發(fā)電被列為發(fā)展趨勢最具前景的領(lǐng)域之一,能夠提供清潔、無害的能源。風(fēng)是目前科學(xué)研究最成熟、規(guī)模和應(yīng)用前景最為預(yù)測的可支配能源。近年來,風(fēng)發(fā)電的蓬勃發(fā)展,風(fēng)裝置的安裝不斷增加。2012年底,中國介電氣裝置總安裝功率為65.73gw。然而,風(fēng)裝置的輸出具有間歇性和不確定性。大規(guī)模通風(fēng)和網(wǎng)絡(luò)分離增加了電氣系統(tǒng)的運(yùn)營風(fēng)險,這對風(fēng)裝置的輸出提出了更高、更精確的要求。本文通過對常規(guī)的風(fēng)電風(fēng)機(jī)輸出功率預(yù)測方法的研究,提出了基于分類算法的風(fēng)機(jī)輸出功率預(yù)測算法.利用某風(fēng)電場一年的風(fēng)機(jī)輸出功率預(yù)測數(shù)據(jù),對算法進(jìn)行了分析和比較,驗(yàn)證了改進(jìn)的算法在大規(guī)模風(fēng)電場的風(fēng)機(jī)輸出功率預(yù)測中的有效性和準(zhǔn)確性.1風(fēng)電場風(fēng)機(jī)功率預(yù)測的研究國內(nèi)外對電力風(fēng)機(jī)輸出功率預(yù)測的研究工作已經(jīng)開展了很長時間,形成了許多比較成熟的預(yù)測理論和方法.其中,傳統(tǒng)的預(yù)測方法包括自身外推法、時間序列法、相關(guān)分析法等.隨著新理論而產(chǎn)生的新方法包括基于模糊理論的預(yù)測、專家系統(tǒng)預(yù)測、灰色預(yù)測、人工神經(jīng)網(wǎng)絡(luò)預(yù)測、基于小波理論的預(yù)測方法等.文獻(xiàn)和文獻(xiàn)通過設(shè)立一個數(shù)學(xué)模型,用該模型來描述風(fēng)機(jī)輸出功率變化過程的統(tǒng)計(jì)規(guī)律,并在這一模型的基礎(chǔ)上確立風(fēng)機(jī)輸出功率預(yù)測的數(shù)學(xué)表達(dá)式,對未來的負(fù)荷進(jìn)行預(yù)報(bào).文獻(xiàn)和文獻(xiàn)采用誤差反向傳播算法對權(quán)值進(jìn)行了調(diào)整.文獻(xiàn)是在統(tǒng)計(jì)學(xué)中的VC維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以獲得最好的風(fēng)機(jī)輸出功率預(yù)測效果.文獻(xiàn)充分利用了風(fēng)場地區(qū)的歷史風(fēng)機(jī)輸出功率數(shù)據(jù),采用聚類分析方法、模糊算法、粗糙集理論等總結(jié)出歷史數(shù)據(jù)的規(guī)律性.以上文獻(xiàn)在改善風(fēng)電場風(fēng)機(jī)輸出功率預(yù)測的精確度,以及風(fēng)電場并網(wǎng)后的功率方面,效果顯著.但由于風(fēng)機(jī)輸出功率的波動性和間歇性特點(diǎn),這些方法均難以靈活有效地滿足風(fēng)電場風(fēng)機(jī)輸出功率預(yù)測的特性以及大規(guī)模型風(fēng)電場風(fēng)機(jī)輸出功率預(yù)測.2預(yù)測輸出輸出的分類算法2.1基于mtp的方法挖掘算法模型樹是一種在葉節(jié)點(diǎn)采用線性回歸函數(shù)的決策樹,在預(yù)測連續(xù)值方面效果很好,它采用一個將分類問題轉(zhuǎn)換為函數(shù)優(yōu)化問題的標(biāo)準(zhǔn)方法來實(shí)現(xiàn)分類.模型樹表示一種分段線性函數(shù),它通過一系列的獨(dú)立變量(稱為屬性)來預(yù)測一個變量的值(稱為類).以表的形式表示的訓(xùn)練數(shù)據(jù)可以直接用來構(gòu)造決策樹.經(jīng)典的M5P模型樹將輸入與輸出參數(shù)之間的非線性關(guān)系轉(zhuǎn)換成一個分段式線性關(guān)系,其劈分思想與決策樹基本相同,但是劈分原則不同.決策樹的劈分標(biāo)準(zhǔn)是信息增益原則,而經(jīng)典M5P算法的劈分標(biāo)準(zhǔn)是樣本屬性差異化原則(StandardDeviationReduction,SDR),可以表示為:式中:T——總樣本空間,其樣本數(shù)是|T|;T1,T2——T被劈分后形成的兩個子空間,樣本數(shù)分別為|T1|,|T2|;d8(T)——總目標(biāo)屬性(ClassAttribute)標(biāo)準(zhǔn)差;d5(T1),ds(T2)——劈分后兩個子空間的目標(biāo)屬性標(biāo)準(zhǔn)差.M5P算法的挖掘流程,也可稱為挖掘的生命周期(LifeCycle),其具體步驟如下.步驟1定義問題,了解影響數(shù)據(jù)來源的因素.對問題作出正確的分類,并找出相應(yīng)的解決方法;分析問題是否可以通過數(shù)據(jù)挖掘來解決,并對解決后的實(shí)際意義作出總結(jié).步驟2搜集和選擇定義所需要的數(shù)據(jù).步驟3對數(shù)據(jù)進(jìn)行刪選和優(yōu)化,此階段為挖掘過程中最費(fèi)時間的步驟,通常占總流程的50%~80%.步驟4選擇數(shù)據(jù)挖掘的方法,并確定數(shù)據(jù)的格式,如決策樹、規(guī)則、圖形等.步驟5對數(shù)據(jù)進(jìn)行訓(xùn)練或預(yù)測,并在此過程中,進(jìn)行參數(shù)的設(shè)置和變化,得到有意義的結(jié)果.步驟6評估和整合已完成挖掘的任務(wù),最后對結(jié)果進(jìn)行歸納和總結(jié).經(jīng)典的M5P模型樹是一階線性模型,構(gòu)建的樹結(jié)構(gòu)更小,預(yù)測精度更高,真正意義上實(shí)現(xiàn)了樹結(jié)構(gòu)的回歸預(yù)測.其特點(diǎn)是訓(xùn)練規(guī)則簡單有效、訓(xùn)練時間短、透明化程度高,以及具有較好的泛化能力.但對于現(xiàn)代的電力數(shù)據(jù)而言,特別是風(fēng)機(jī)輸出功率的數(shù)據(jù)更為復(fù)雜而龐大,經(jīng)典的M5P算法已經(jīng)無法滿足對數(shù)據(jù)精度和處理效率的要求.2.2剪枝剪切建模在經(jīng)典M5P算法的基礎(chǔ)上,增加葉子節(jié)點(diǎn)數(shù),并在葉子節(jié)點(diǎn)數(shù)公式中加入A值,代表影響風(fēng)機(jī)輸出功率的一切外界因素,這樣可以有效提高M(jìn)5P算法的效率,更能精確反映數(shù)據(jù)的高效性.改進(jìn)的M5P算法通過改變?nèi)~子的數(shù)值和點(diǎn)集值,可以便于測試特定屬性的值,并在每個葉節(jié)點(diǎn)預(yù)測類值.給定一個新的樣本來預(yù)測其類值,樹從根節(jié)點(diǎn)開始解釋.在每個內(nèi)部節(jié)點(diǎn)處,根據(jù)樣本的某一特定屬性值來選擇左枝或右枝,當(dāng)選擇的節(jié)點(diǎn)是葉節(jié)點(diǎn)時,則由葉節(jié)點(diǎn)的模型預(yù)測輸出.改進(jìn)的M5P算法的劈分標(biāo)準(zhǔn)可以表示為:式中:A——葉子節(jié)點(diǎn)數(shù)量的改變.樹的結(jié)構(gòu)并不是越大越好,劈分太細(xì)可能會造成過擬合現(xiàn)象.剪枝就是對某些子樹進(jìn)行歸并,而以葉子結(jié)點(diǎn)取代,以提高整個模型的簡潔性和效率.在剪切之前,首先利用線性回歸方法遍歷樹的各個結(jié)點(diǎn),擬合出每個結(jié)點(diǎn)的多元線性方程.剪切的原則為預(yù)測誤差減少量(Errorreduction):式中:ERMS——該結(jié)點(diǎn)(包括其下屬分支和葉子的所有樣本)處擬合方程預(yù)測的均方根誤差;ERMSL,ERMSR——該結(jié)點(diǎn)劈分后的左、右葉子節(jié)點(diǎn)預(yù)測的均方根誤差.以上均方根誤差檢驗(yàn)樣本為自身結(jié)點(diǎn)處的樣本.當(dāng)RE>0時,該子樹保留;否則,將該子樹轉(zhuǎn)變?yōu)橐粋€葉子結(jié)點(diǎn).剪切過程也是一個遞歸的過程.剪切后,樹的相鄰葉子結(jié)點(diǎn)處可能會出現(xiàn)一定程度的不連續(xù)性,因此熊浩等人提出樹葉子結(jié)點(diǎn)的平滑方法.每個結(jié)點(diǎn)都存在一個按線性回歸方法擬合的多元線性方程,并且具有相同的參數(shù),將子結(jié)點(diǎn)與其父結(jié)點(diǎn)的兩個方程合并為一個新的線性方程,則該方程可以有效地彌補(bǔ)兩個相鄰子結(jié)點(diǎn)的不連續(xù)性.合并公式為:式中:fparent——葉子上級父結(jié)點(diǎn)擬合方程;fchild——葉子結(jié)點(diǎn)擬合方程;n——到達(dá)本葉子結(jié)點(diǎn)的訓(xùn)練樣本數(shù)目;k——常數(shù),通常取值為15;fnew——合并后的方程,將取代葉子結(jié)點(diǎn)的線性方程.改進(jìn)的M5P算法是用一系列分段線性模型組合起來的全局模型,從而為處理問題帶來了所需的非線性.它與單純的線性回歸的區(qū)別在于,對輸入空間的分割是由算法自動進(jìn)行的.該算法具有效率高、魯棒性好的優(yōu)點(diǎn),可以進(jìn)行有效的學(xué)習(xí),能夠處理輸入屬性高達(dá)幾百維的問題.改進(jìn)的M5P算法的結(jié)果簡單易懂,是一種具有廣闊應(yīng)用前景的數(shù)值預(yù)測算法.3結(jié)果與分析3.1風(fēng)電場風(fēng)機(jī)功率預(yù)測結(jié)果本文采用某沿海風(fēng)力發(fā)電場一年的真實(shí)負(fù)荷數(shù)據(jù)進(jìn)行分析與研究.影響負(fù)荷的因素有很多,如時間、季節(jié)、風(fēng)速、天氣,以及是否節(jié)假日等,本文選取風(fēng)速和運(yùn)行臺數(shù)兩個因素.將實(shí)際數(shù)據(jù)導(dǎo)入WEKA2.0中,結(jié)果如圖1所示.從圖1a中可以直觀地發(fā)現(xiàn),運(yùn)行臺數(shù)少于122臺時,輸出功率與運(yùn)行臺數(shù)成線性關(guān)系,運(yùn)行臺數(shù)越多,輸出功率越大.在圖1b中,風(fēng)速低于8.08m/s時,風(fēng)速與輸出功率成線性關(guān)系,風(fēng)速越大,輸出功率越大.在圖1c中,風(fēng)速低于3.3m/s時,風(fēng)速與運(yùn)行臺數(shù)成線性關(guān)系,風(fēng)速越大,開啟的運(yùn)行臺數(shù)越多.在圖1a中,當(dāng)運(yùn)行臺數(shù)維持在一定量時,如122臺時,輸出功率直線上升,導(dǎo)致這個結(jié)果的原因是風(fēng)速的變化.因此,由圖1可以得出,風(fēng)速越大,運(yùn)行臺數(shù)越多,輸出功率也就越大.針對這些數(shù)據(jù)特點(diǎn),本文將采用分類算法來進(jìn)行簡單的風(fēng)電場風(fēng)機(jī)輸出功率預(yù)測.3.2可視化分類結(jié)果M5P模型算法組合了樹結(jié)構(gòu)和線性回歸模型,每個葉子節(jié)點(diǎn)是一個線性回歸模型,因而可用于連續(xù)數(shù)據(jù)的回歸.由于沿海風(fēng)場風(fēng)機(jī)輸出功率預(yù)測大多指短期或極短期風(fēng)機(jī)輸出功率預(yù)測,得到的數(shù)據(jù)連續(xù),且單位時間內(nèi)的數(shù)據(jù)量并不龐大,非常符合經(jīng)典的M5P模型算法的特征.其可視化分類結(jié)果如圖2所示.從圖2中可以看到數(shù)據(jù)通過經(jīng)典的M5P模型后的具體分類情況.通過分類后,模型會根據(jù)數(shù)據(jù)的特點(diǎn)和規(guī)律性,擬定出每一類的算法公式,即數(shù)據(jù)預(yù)測公式.通過計(jì)算,得出M5P算法的誤差率大約為9.5%,精確度較高,在數(shù)據(jù)項(xiàng)較少的情況下,此算法較為可靠,但當(dāng)數(shù)據(jù)項(xiàng)很多時,其誤差率較大.從圖2中還可以發(fā)現(xiàn),沿海風(fēng)速大多低于8m/s,在此范圍內(nèi),運(yùn)行臺數(shù)和風(fēng)速成明顯線性關(guān)系,即風(fēng)速越大,運(yùn)行臺數(shù)越多.3.3風(fēng)機(jī)功率預(yù)測算法的確定改進(jìn)的M5P算法構(gòu)建了一個決策/回歸樹模型,通過設(shè)置各參數(shù)使信息增益或減少,修改參數(shù)使誤差率提高或降低.改進(jìn)的M5P算法的交叉驗(yàn)證結(jié)果如表1所示.表1中數(shù)據(jù)是采用改進(jìn)的M5P算法,以風(fēng)速和運(yùn)行臺數(shù)兩者屬性進(jìn)行分類,分類的結(jié)果為在某一固定值的情況下,統(tǒng)計(jì)平均值,以便對下一結(jié)果進(jìn)行預(yù)測.由表1也可以得出,在一定范圍內(nèi),風(fēng)速和運(yùn)行臺數(shù)成線性關(guān)系,即風(fēng)速越大,運(yùn)行臺數(shù)越多.根據(jù)上述兩種算法的實(shí)驗(yàn)結(jié)果,能夠直觀地了解到智能優(yōu)化技術(shù)雖然尚不完善,但從效率和精確度上,風(fēng)機(jī)輸出功率的預(yù)測技術(shù)已經(jīng)得到很大的改善和進(jìn)步.兩種算法對風(fēng)機(jī)輸出功率的預(yù)測結(jié)果如表2所示.由表2可以得出,經(jīng)典的M5P算法對于風(fēng)機(jī)輸出功率預(yù)測的正確率為89.461%,改進(jìn)的M5P算法的預(yù)測正確率為93.373%.兩種算法得出了相同的風(fēng)機(jī)輸出功率預(yù)測規(guī)律結(jié)果:在特定值范圍內(nèi),風(fēng)速、運(yùn)行臺數(shù)和輸出功率相互成線性關(guān)系;當(dāng)風(fēng)速值和運(yùn)行臺數(shù)值超過一定范圍后,3者的線性關(guān)系不明顯,但仍然存在互增互減規(guī)律.通過比較可以發(fā)現(xiàn),若要進(jìn)行精確的風(fēng)機(jī)輸出功率預(yù)測,應(yīng)當(dāng)選用改進(jìn)的M5P算法,可以大大提高預(yù)測的精確性;在對風(fēng)機(jī)輸出功率預(yù)測概念大致了解、并對下一時間段的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論