《基于多模型的辦公建筑電力能耗實時異常診斷研究》14000字(論文)_第1頁
《基于多模型的辦公建筑電力能耗實時異常診斷研究》14000字(論文)_第2頁
《基于多模型的辦公建筑電力能耗實時異常診斷研究》14000字(論文)_第3頁
《基于多模型的辦公建筑電力能耗實時異常診斷研究》14000字(論文)_第4頁
《基于多模型的辦公建筑電力能耗實時異常診斷研究》14000字(論文)_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于多模型的辦公建筑電力能耗實時異常診斷研究目錄TOC\o"1-2"\h\u40641多模型方法選擇及異常診斷標(biāo)準(zhǔn)建立 2252961.1基于3-sigma準(zhǔn)則的異常診斷 290811.2基于XGBoost算法的異常診斷 3312201.3基于條件推理樹的異常診斷 8222361.4基于恒定閾值的異常診斷 10132441.5基于相似日算法的異常診斷 10201622基于多模型的實時電力能耗異常診斷策略 11219923數(shù)據(jù)準(zhǔn)備 1451823.1數(shù)據(jù)來源 14287323.2數(shù)據(jù)異常值處理 145684案例分析 15229304.1Ⅰ類線路異常診斷 15281694.1.1數(shù)據(jù)說明 15229754.1.2典型日能耗基準(zhǔn)及其上下限 16289854.1.3在線異常診斷 17228304.2.1數(shù)據(jù)說明 1770614.2.2離線模型建立 1754324.2.3在線異常診斷實例 2058184.3.1數(shù)據(jù)說明 22297364.3.2模式識別 22282764.3.3在線異常診斷實例 23241904.4Ⅴ類線路異常診斷策略 231多模型方法選擇及異常診斷標(biāo)準(zhǔn)建立1.1基于3-sigma準(zhǔn)則的異常診斷1.1.13-sigma準(zhǔn)則基本原理3-sigma準(zhǔn)則又稱為拉依達(dá)準(zhǔn)則,該算法假設(shè)有一組被檢測數(shù)據(jù)只含有隨機(jī)誤差,計算得到其標(biāo)準(zhǔn)偏差,按一定概率確定一個區(qū)間,則認(rèn)為超過該區(qū)間誤差為異常值(粗大誤差)而不是數(shù)據(jù)隨機(jī)誤差,需要對該數(shù)據(jù)進(jìn)一步處理。3-sigma準(zhǔn)則適用于具有正態(tài)分布或近似正態(tài)分布的數(shù)據(jù)序列,假設(shè)正態(tài)分布中標(biāo)準(zhǔn)差為σ,平均值為μ,則該正態(tài)分布數(shù)據(jù)的對稱軸x=μ。3-sigma準(zhǔn)則對于數(shù)值分布在(μ?σ,μ+σ)中的概率為0.6826;數(shù)值分布在(μ?3-sigma準(zhǔn)則是建立在正態(tài)分布的等精度重復(fù)測量基礎(chǔ)上而造成奇異數(shù)據(jù)的干擾或噪聲難以滿足正態(tài)分布。如果一組測量數(shù)據(jù)中某個測量值的殘余誤差的絕對值γi>3σ,則該測量值為壞值應(yīng)剔除。通常把等于±3σ的誤差作為極限誤差,對于正態(tài)分布的隨機(jī)誤差,落在±3σ以外的概率只有0.27%,它在有限次測量中發(fā)生的可能性很小,故存在假設(shè)待檢測序列X,對每個獨立測量值xi,計算該值的算數(shù)平均值x和數(shù)據(jù)偏差γi=xi(4-1)則認(rèn)為xa1.1.2異常診斷標(biāo)準(zhǔn)3-sigma準(zhǔn)則的異常診斷是一種無監(jiān)督異常檢測方法,適用于正態(tài)分布或類正態(tài)分布的獨立數(shù)據(jù)集。利用3-sigma準(zhǔn)則進(jìn)行異常診斷時,利用歷史數(shù)據(jù)建立異常診斷置信區(qū)間上下限。該診斷方法可以描述為異常點,由式(4-2)可得:(4-2)若絕對值大于3σ則認(rèn)為該點異常;若絕對值小于3σ認(rèn)為該點正常。1.2基于XGBoost算法的異常診斷1.2.1XGBoost算法的基本原理XGBoost算法(eXtremeGradientBoosting)即極端梯度提升算法,是一種基于梯度提升樹的一種有監(jiān)督學(xué)習(xí)算法,該模型通過組合多個簡單、精確度降低的模型形成高精確度模型實現(xiàn)對于目標(biāo)的準(zhǔn)確預(yù)測。XGBoost算法中每顆弱學(xué)習(xí)樹皆為嚴(yán)格二叉回歸樹,通過回歸數(shù)據(jù)將輸入進(jìn)行迭代映射,實現(xiàn)梯度的逐漸提升。XGBoost算法損失函數(shù)采用最小化凸損耗函數(shù)(基于預(yù)測輸出和目標(biāo)輸出之間的差異)和模型復(fù)雜性(正則化L1和L2)的組合目標(biāo)函數(shù),該組合函數(shù)具可擴(kuò)展性、高精確度、擬合效果好等特點。通過不斷迭代的方式,添加新的樹來預(yù)測前樹的殘差或誤差,并與前樹進(jìn)行組合得到預(yù)測最終結(jié)果。XGBoost算法適用于結(jié)構(gòu)化特征數(shù)據(jù)、對于多維數(shù)據(jù)具有較好的處理速度和精度且算法的魯棒性和泛化性較強(qiáng)。XGBoost算法的優(yōu)點主要有:(1)可以有效處理稀疏、缺失數(shù)據(jù);(2)以結(jié)構(gòu)分?jǐn)?shù)為標(biāo)準(zhǔn);(3)可以使用多線程的方式提升算法速度;(4)可以通過特征的列采樣防止過擬合。XGBoost算法將樹結(jié)構(gòu)分為葉子節(jié)點的權(quán)值向量ω和不同樣本點分配到對應(yīng)葉子節(jié)點的函數(shù)q兩部分,其中q可以將數(shù)據(jù)映射到相應(yīng)的葉子結(jié)點。決策樹復(fù)雜度Ω(f)計算方法如式(4-3)所示:(4-3)其中,f為當(dāng)前樹的預(yù)測函數(shù);T為葉子節(jié)點數(shù)目;γ為控制葉子數(shù)量權(quán)重的參數(shù);λ為正則化系數(shù)。XGBoost算法復(fù)雜度越低,泛化能力越強(qiáng)。其中boosting(提升樹)部份如式(4-4)所示(4-4)其中,L為損失函數(shù);φ為整個樹群;l為計算誤差設(shè)定指標(biāo),該指標(biāo)可以根據(jù)需求選擇絕對誤差或者平方誤差;為預(yù)測值;為實際值;表示第k顆決策樹。則多棵樹組合樹的boosting模型組合函數(shù)如式(4-5)所示。(4-5)其中,為目標(biāo)函數(shù);為第k棵決策樹的預(yù)測函數(shù);constant為常數(shù)項部分。為尋找合適的子樹,XGBoost算法通過二階泰勒展開對損失函數(shù)進(jìn)行求解[69]損失函數(shù)二階泰勒展開如式(4-6)所示。(4-6) 假設(shè)如式(4-7)所示2個變量(4-7)其中,,分別為第i個樣本損失函數(shù)的一階導(dǎo)和二階導(dǎo)。將式(4-7)帶入式(4-6)可得到新的目標(biāo)函數(shù)如式(4-8)所示。同時,假設(shè)候選特征集合如式(4-13)所示。(4-8)(4-9)其中,為對應(yīng)的子節(jié)點,j為該分裂節(jié)點表示的特征。在XGBoost模型使用和訓(xùn)練的過程中,根據(jù)式(4-8)和(4-9)可得目標(biāo)函數(shù)(4-10)對目標(biāo)函數(shù)最優(yōu)解進(jìn)行求解得到式(4-11)和式(4-12)。(4-11)(4-12)1.2.2異常診斷標(biāo)準(zhǔn) 基于XGBoost算法的異常診斷標(biāo)準(zhǔn)需要構(gòu)建高精度的預(yù)測模型,其模型建立流程和診斷步驟如圖4-1所示。步驟1:特征選擇在XGBoost算法預(yù)測模型中,輸入的樣本特征與輸出的目標(biāo)值之間具有強(qiáng)相關(guān)因素,因此科學(xué)合理的選擇樣本特征對提升算法準(zhǔn)確度十分重要。(1)特征分析1.時間周期性因素根據(jù)2.3.1節(jié)辦公建筑人員行為分析可知,辦公建筑人員活動具有時間上的周期性且影響設(shè)備的運行方式,進(jìn)而對建筑用能情況產(chǎn)生影響。因此,在逐日能耗上辦公建筑具有工作日和非工作日的能耗差異,能耗在工作日較為平穩(wěn)而非工作日則呈現(xiàn)低谷狀;對于工作日工況(非工作日工況)中逐時能耗跟隨人員上下班呈現(xiàn)“幾”字形,下班時間設(shè)備關(guān)閉,建筑能耗出現(xiàn)當(dāng)日低谷,而工作時間能耗成規(guī)律變化。因此,日類型和小時對于能耗都屬于重要特征。2.氣候因素對于Ⅲ類線路根據(jù)分類標(biāo)準(zhǔn)與室外氣候尤其是室外溫度和室外濕度強(qiáng)相關(guān)。室外溫度和濕度的變化影響設(shè)備的整體運行狀態(tài)和設(shè)備運行內(nèi)部參數(shù),進(jìn)而影響設(shè)備的能耗,尤其是在設(shè)備運行階段能耗隨室外溫度和濕度變化相關(guān)性更加強(qiáng)烈。3.歷史數(shù)據(jù)建筑未來的能耗水平可以從某種程度上視作當(dāng)前建筑能耗水平的延續(xù),歷史同期的建筑能耗是預(yù)測建筑能耗的重要依據(jù)。在預(yù)測建筑能耗時,被預(yù)測日的建筑能耗與其前幾日的建筑能耗水平有著強(qiáng)烈的相關(guān)性,可以以預(yù)測日前幾日的建筑能耗作為預(yù)測的依據(jù),因此建筑歷史能耗時間序列是輸入樣本必選的特征。(2)特征構(gòu)造1.時間細(xì)粒度特征構(gòu)造本章對辦公建筑實時能耗進(jìn)行診斷,因此在日逐時能耗的基礎(chǔ)上對時間因素進(jìn)行進(jìn)一步的構(gòu)造,得到7個相關(guān)參數(shù),分別為:1.“dow”:一周的第幾天;2.“doy”:一年的第幾天;3.“day”:一月的第幾天;4.“woy”:一年的第幾周;5.“month”:一年的第幾月;6.“hour”:一天的第幾個小時;7.“minute”:一天的第多少分鐘。2.歷史運行負(fù)載構(gòu)造辦公建筑能耗具有明顯的周期性,在運行沒有發(fā)生異常的情況下,實時負(fù)載對前24小時和前48小時負(fù)載具有較強(qiáng)的依賴性。因此構(gòu)造同工況下的前24小時和前48小時運行負(fù)載特征:1.“t_m24”:前24小時的負(fù)載;2.“t_m48”:前48小時的負(fù)載。綜合特征分析和特征構(gòu)造兩小節(jié)內(nèi)容,本文選取辦公建筑Ⅲ類線路的樣本特征為建筑歷史能耗時間序列、日逐時室外溫度、日逐時室外濕度、小時、日類型、前24小時負(fù)載等屬性。(3)特征選擇特征選擇一般有兩個目的:一方面,選擇出重要的特征可以緩解維數(shù)災(zāi)難問題;二、去除不相關(guān)特征可以降低學(xué)習(xí)任務(wù)的難度,提升準(zhǔn)確度和計算速度。本文主要目的為第二個,合適的輸入特征子集選取對提升算法預(yù)測精度有重要意義。本文采用協(xié)方差法對特征進(jìn)行選取。本文選擇可解釋總變異95%的子集作為輸入子集。利用相關(guān)性進(jìn)行特征選擇步驟如下:(1)為每個變量引入連續(xù)時刻的測量值構(gòu)成增廣型數(shù)據(jù)矩陣Xa(2)針對第i(i=1,2,…,m)個測量變量xi,計算Xi與Xa中各個變量xj(3)對Ci,j∈R(4)對所得到m個變量子集選取特征變量,構(gòu)建最優(yōu)特征子集。步驟2:參數(shù)調(diào)節(jié)算法自身參數(shù)的調(diào)整決定了模型預(yù)測的運行效率和準(zhǔn)確度并且對于不同的數(shù)據(jù)集模型參數(shù)具有一定的特異性,因此參數(shù)調(diào)節(jié)是模型構(gòu)建的重要一環(huán)。目前,常見的模型參數(shù)選取方法有枚舉法、網(wǎng)格搜索法、遺傳算法、粒子群算法[70],其優(yōu)缺點如表4-1所示。本文從效率和效果的角度出發(fā)選用網(wǎng)格搜索法進(jìn)行參數(shù)尋優(yōu),有效避免了遺傳算法和粒子群網(wǎng)絡(luò)的局部最優(yōu)陷阱。XGBoost算法參數(shù)眾多,本文針對樹模型(booster)參數(shù)中eta、min_child_weight、max_depth等重要參數(shù)和學(xué)習(xí)任務(wù)參數(shù)中objective、seed等參數(shù),利用網(wǎng)格搜索和交叉驗證進(jìn)行參數(shù)尋優(yōu)和結(jié)果驗證。表4-1參數(shù)選取方法優(yōu)缺點對比參數(shù)選取方法優(yōu)點缺點枚舉法對于參數(shù)不敏感的樣本集,能夠簡單快速尋得最優(yōu)參數(shù)對于參數(shù)敏感的樣本集,尋優(yōu)耗時長且不易尋得最優(yōu)參數(shù)網(wǎng)格搜素法一定能獲得全局最優(yōu)解需要足夠大的搜索區(qū)間與小的搜索步距,遍歷所有網(wǎng)格耗費時間長遺傳算法不必遍歷區(qū)間內(nèi)所有的參數(shù)組即可找到全局最優(yōu)解,尋優(yōu)時間短尋優(yōu)結(jié)果不穩(wěn)定,易得到局部最優(yōu)解粒子群算法不必遍歷區(qū)間內(nèi)所有的參數(shù)組即可找到全局最優(yōu)解;尋優(yōu)效果略優(yōu)于遺傳算法尋優(yōu)時間較遺傳算法時間長;易得到局部最優(yōu)解學(xué)習(xí)模型的泛化能力是指利用該方法建立學(xué)習(xí)建立的模型對未知數(shù)據(jù)的預(yù)測能力,其表示方法如圖4-2所示,可以通過比較學(xué)習(xí)算法的經(jīng)驗風(fēng)險與期望風(fēng)險之間偏差和收斂速度獲得。以上參數(shù)選擇都是針對訓(xùn)練集數(shù)據(jù)進(jìn)行,為更好提升模型的代表性和適用性,在參數(shù)選擇的同時考慮式(4-13)通過學(xué)習(xí)曲線進(jìn)一步對參數(shù)進(jìn)行優(yōu)化。其中,為學(xué)習(xí)得到的模型。(4-13)步驟3:預(yù)測結(jié)果評價XGBoost算法的性能評價方法一般有決定系數(shù)(R2)、平均絕對誤差(MAE)、平均相對誤差(MAPE)和均方根誤差(RMSE)。(1)決定系數(shù)(4-14)(2)平均絕對誤差(4-15)觀測值與真實值的誤差絕對值的平均值。(3)平均相對誤差(4-16)(4)均方根誤差均方根誤差即標(biāo)準(zhǔn)誤差,能夠綜合衡量預(yù)測值與實測值之間的偏差。誤差越大,該值越大。(4-17)其中,上式中n為預(yù)測總數(shù),yi為待預(yù)測數(shù)據(jù)的實測值,yi表示利用XGBoost算法得到的回歸預(yù)測值,為待預(yù)測數(shù)據(jù)的均值。對于以上性能指標(biāo)越大擬合優(yōu)度越好,而對于MAE、MAPE和RMSE越小模型擬合越優(yōu)。步驟4:異常診斷標(biāo)準(zhǔn)在預(yù)測模型中存在訓(xùn)練誤差與測試誤差兩類誤差,誤差有多種評價方式,只有將訓(xùn)練后的模型測試誤差控制在一定范圍內(nèi),模型才被認(rèn)為有效。在利用測試集進(jìn)行測試的過程中會產(chǎn)生新的誤差,在理想狀態(tài)下測試集產(chǎn)生的誤差應(yīng)該與既有的測試誤差持平。假如預(yù)測誤差出現(xiàn)突然劇烈增大的情況,一方面,模型本身的可能存在異常;另一方面,則可以認(rèn)為被預(yù)測目標(biāo)值的實際值存在問題。在利用已完成訓(xùn)練的XGBoost算法進(jìn)行能耗預(yù)測時,同樣存在著上述誤差,記測試集的平均相對誤差為MAPE,測試集相對誤差取絕對值后最大值為。預(yù)測被預(yù)測日能耗時,記該日第n時的相對誤差絕對值為,其判斷標(biāo)準(zhǔn)如表4-2所示。表4-2異常判定標(biāo)準(zhǔn)正常(0)異常等級(1)異常等級(2)σ(n)≤MAPEMAPE≤σ(n)≤σ(max)σ(max)≤σ(n)1.3基于條件推理樹的異常診斷1.3.1條件推理樹基本原理決策樹算法作為一種常見的數(shù)據(jù)挖掘算法,通過對實例自上而下的遞歸實現(xiàn)對其的分類和預(yù)測。決策樹算法呈現(xiàn)樹型結(jié)構(gòu),利用類似邏輯思考的方式根據(jù)數(shù)據(jù)屬性逐層進(jìn)行選擇。每一個非葉子節(jié)點根據(jù)數(shù)據(jù)的屬性選擇度量,利用貪心(非回溯)方法選擇最佳屬性進(jìn)一步分裂,不斷迭代直至葉子節(jié)點生成。決策樹算法的構(gòu)建思路是不斷選擇分類結(jié)果中最“純”的屬性作為當(dāng)前決策依據(jù),使當(dāng)前子數(shù)據(jù)集的相似度最高并與其他子數(shù)據(jù)集差異度較大,理想最終目標(biāo)每個子數(shù)據(jù)集都是“純”的,即該子數(shù)據(jù)集中的所有數(shù)據(jù)都屬于相同類。與其他常見的黑箱數(shù)據(jù)挖掘算法如ANN算法、SVM算法等相比,決策樹算法通過屬性選擇度量的分裂遞歸方法使其具備模仿性,進(jìn)而實現(xiàn)了其挖掘過程的可解釋性。因此,決策樹算法往往可以幫助使用者更好的對數(shù)據(jù)挖掘過程進(jìn)行理解并對規(guī)則進(jìn)行歸納和模仿。常見的決策樹算法有ID3算法、C4.5算法、CHAID算法以及CART算法等,其中C4.5算法和CART算法最為常見。以上算法都采用貪心方法選擇屬性選擇度量極值作為分裂依據(jù),實現(xiàn)自上而下的分裂。最先出現(xiàn)的ID3算法使用信息增益作為屬性選擇度量和分裂的劃分依據(jù)[71]。C4.5算法作為ID3算法的擴(kuò)展,使用增益率進(jìn)行屬性評價,并解決了ID3算法只適用離散型數(shù)據(jù)的缺點,可以同時處理離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)[72]。CART算法是一種嚴(yán)格的二叉樹算法,使用基尼系數(shù)最小作為節(jié)點屬性劃分依據(jù)[73]。同時,CART算法也可以作為基學(xué)習(xí)器參與構(gòu)建樹集成算法。CHAID算法的分裂標(biāo)準(zhǔn)為卡方自動交互檢測法,可以實現(xiàn)多叉樹結(jié)構(gòu),但是其輸入變量只能為離散型變量,而連續(xù)型變量需要進(jìn)行離散化后才可輸入[74]。以上四種算法它們都對所有可能的分裂執(zhí)行詳盡搜索,以最大化節(jié)點雜質(zhì)的信息度量,選擇顯示最佳分裂的變量這些算法有三個基本的問題:(1)數(shù)據(jù)使用類型受限;(2)結(jié)果依賴主觀調(diào)參和剪枝,易過擬合;(3)傾向于選擇更具有分割可能的變量[134]。Hothorn等人[75]于2006年針對以上問題提出CIT算法,該算法是一種采用顯著性作為屬性選擇度量的嚴(yán)格二叉樹算法。一方面,CIT算法通過提前定義顯著性p進(jìn)行參數(shù)選擇和調(diào)節(jié)有效減少了過擬合,且保證了屬性選擇的無偏性;另一方面,CIT算法同時適用于離散型和連續(xù)性數(shù)據(jù)回歸的情景。CIT算法利用樹結(jié)構(gòu)遞歸分區(qū)給出m個協(xié)變量X狀態(tài)下響應(yīng)變量Y的條件分布。響應(yīng)變量Y為樣本空間y的一元或多元響應(yīng)變量。CIT算法假定協(xié)變量函數(shù)f對給定X和Y的條件分布D(YX)有重要影響如式(4-18),且通過訓(xùn)練集樣本Ln(即n個獨立且分布均勻的觀測值的隨機(jī)樣本)可以得到X和Y的回歸擬合模型。訓(xùn)練集樣本L(4-18)(4-19)可以使用非負(fù)整數(shù)值案例權(quán)重W=(w1,(1)對于案例權(quán)重W,檢驗m個協(xié)變量中的任何一個與響應(yīng)之間的獨立性的全局零假設(shè)。如果無法拒絕該假設(shè),則停止。否則選擇與Y關(guān)聯(lián)最強(qiáng)的第j?個協(xié)變量X(2)選擇一個集合A??Xj?,以便將Xj?分為兩個不相交的集合A?和Xj??A?。案例權(quán)重wleft和wrig(3)利用修改后的案例權(quán)重wleft和w其中,步驟1是實現(xiàn)無偏差特征選擇的關(guān)鍵。步驟1假設(shè)全局獨立性假設(shè)是根據(jù)m個部分假設(shè)和全局零假設(shè)組成的。為保證分裂的無偏差性CIT樹利用式(4-20)衡量Y與每個協(xié)變量Xj的線性關(guān)系(4-20)其中,h為影響函數(shù),基于置換對稱方式與響應(yīng)相關(guān);gi為協(xié)變量xi的非隨機(jī)變換。在零假設(shè)條件下,通過固定協(xié)變量并調(diào)節(jié)所有可能的相應(yīng)變量的組合方式解決下的分布未知的問題。(4-21)(4-22)其中,w為權(quán)重和,為克羅內(nèi)克積。通過式(4-21)和式(4-22)對給定相應(yīng)的所有組合的期望和方差進(jìn)行計算,進(jìn)而根據(jù)每個部分假設(shè)的測試結(jié)果進(jìn)行無偏差的變量選擇和特征提取。1.3.2異常診斷標(biāo)準(zhǔn) 根據(jù)條件推理樹的結(jié)果驗證,可以據(jù)此確定線路用能模式,在該模式內(nèi)可以利用3-sigma準(zhǔn)則對能耗范圍進(jìn)行異常識別。1.4基于恒定閾值的異常診斷對于具有無趨勢性,近似平穩(wěn)特點得數(shù)據(jù)可配置簡單的恒定閾值。時刻T配置的恒定閾值是對歷史數(shù)據(jù)的恒定,在T+1時刻,這個閾值會被新加入的數(shù)據(jù)更新。超過預(yù)先設(shè)定的恒定閾值則數(shù)據(jù)存在異常。1.5基于相似日算法的異常診斷本節(jié)基于相似日算法的異常診斷原理及診斷標(biāo)準(zhǔn)與第三章相似日算法一致。2基于多模型的實時電力能耗異常診斷策略2.1基于多模型的實時電力能耗異常診斷流程本文基于歷史數(shù)據(jù)特征的能耗分類提出了一種多模型的實時電力能耗異常診斷方法,如圖4-3所示和圖4-4所示。該方法可有效結(jié)合線路歷史數(shù)據(jù)特征,根據(jù)特征特點自適應(yīng)的選擇診斷模型,實現(xiàn)多種類型線路異常檢測。與單一模型能耗異常診斷方法相比有兩個主要優(yōu)點:一方面,拓展了能耗異常診斷的應(yīng)用范圍;另一方面,充分挖掘辦公建筑實際運行能耗特征提升了數(shù)據(jù)實時診斷的準(zhǔn)確性。如圖4-3所示,多模型實時電力能耗診斷可分為離線和在線2部份,圖4-3左側(cè)為離線診斷基準(zhǔn)分類生成部份,右側(cè)為在線診斷部份。離線能耗診斷基準(zhǔn)分類生成部份流程為:首先,對歷史數(shù)據(jù)進(jìn)行預(yù)處理,分類對數(shù)據(jù)的異常值和缺失值進(jìn)行處理的無錯數(shù)據(jù);其次,根據(jù)2.4節(jié)辦公建筑電力能耗線路分類的原則對能耗線路進(jìn)行分類;再次,根據(jù)圖4-4所示,針對不同類型的線路則特征選擇對應(yīng)的診斷模型;最后,計算被診斷日的逐時能耗基準(zhǔn)或建立能耗診斷規(guī)則,具體方法將在下文進(jìn)行分析。能耗在線診斷部份流程為:對實時數(shù)據(jù)所處的線路類型進(jìn)行確定,與離線建立被診斷日的逐時能耗基準(zhǔn)或建立能耗診斷規(guī)則進(jìn)行比較,根據(jù)判斷結(jié)果預(yù)警線路能耗異常。2.2Ⅰ類線路異常診斷策略Ⅰ類線路特征如圖4-4所示,同工況下全年逐日能耗為平穩(wěn)序列且能耗序列離散度較小,該序列逐日能耗具有無趨勢無周期性的特征,根據(jù)辦公建筑電力能耗特征可知,該類線路設(shè)備運行策略穩(wěn)定逐日電力能耗不隨時間變化,同工況下每日設(shè)備運行狀態(tài)一致。因此,采用3-Sigma方法對逐時能耗進(jìn)行診斷。其逐時異常診斷流程為:(1)基于同工況歷史數(shù)據(jù)建立逐時電力能耗集;(2)計算逐時電力能耗的平均值和標(biāo)準(zhǔn)差;(3)在線數(shù)據(jù)值與計算歷史平均值的偏差進(jìn)行比較,若超過3倍,則為異常值,反之,則為正常數(shù)據(jù);(4)對異常數(shù)據(jù)進(jìn)行報警,并返回步驟(3)。2.3Ⅱ類線路異常診斷策略Ⅱ類線路特征如圖4-4所示,同工況下全年逐日能耗不平穩(wěn),但運行工況逐時能耗穩(wěn)定。該序列逐日能耗具有無趨勢無周期性的特征,但運行逐時能耗穩(wěn)定,線路設(shè)備組合可能為單定頻(組合定頻設(shè)備)設(shè)備運行策略隨季度或周期性改變。因此,在同運行策略中采用3-Sigma方法進(jìn)行診斷,診斷步驟如Ⅰ類線路所示。2.4Ⅲ類線路異常診斷策略Ⅲ類線路特征如圖4-4所示,在運行工況下與室外氣候尤其是溫度和濕度具有強(qiáng)相關(guān)性,且設(shè)備運行具有周期性,辦公建筑內(nèi)典型的Ⅲ類線路有:冷水機(jī)組能耗線路、冷泵線路或冷泵組合線路等。Ⅲ類線路典型設(shè)備運行能耗變化分布如圖4-5所示,根據(jù)能耗線路分類的原則,其工作日工況下逐時運行能耗與室外溫、濕度和建筑內(nèi)人員作息規(guī)律顯著相關(guān)??梢詫⒃擃惥€路逐時運行能耗依據(jù)其變化規(guī)律進(jìn)行進(jìn)一步的劃分,得到3個典型階段:(1)持續(xù)待機(jī)階段:辦公建筑內(nèi)沒有或很少有人員活動,設(shè)備處于關(guān)閉狀態(tài),此時線路能耗為線路待機(jī)能耗,一般為恒值常數(shù)。(2)開機(jī)階段:根據(jù)辦公建筑內(nèi)人員上班時間和室外溫、濕度情況,確定設(shè)備開啟狀態(tài)和參數(shù)設(shè)置,能耗隨室外溫濕度和時間進(jìn)行變化。開機(jī)階段具有兩方面特征:一方面,由于現(xiàn)階段實際運行的限制,大部分設(shè)備開啟時間主要由運維人員確定易受主觀因素影響具有不確定性。另一方面,與關(guān)機(jī)操作不同開機(jī)階段容易出現(xiàn)能耗震蕩波動,難以直接預(yù)測。(3)持續(xù)運行階段:辦公建筑內(nèi)人員活動穩(wěn)定,設(shè)備根據(jù)室外溫度、濕度依據(jù)控制策略進(jìn)行調(diào)整,當(dāng)室外溫度達(dá)到關(guān)閉閾值或達(dá)到運維人員設(shè)置設(shè)備關(guān)閉時間時設(shè)備關(guān)閉,持續(xù)運行階段結(jié)束。因此,本節(jié)提出一種多模式的Ⅲ類線路能耗異常診斷策略,如圖4-6所示。該策略有效結(jié)合線路逐時能耗分布特征,對線路運行模式進(jìn)行劃分,結(jié)合XGboost算法、相似日算法和閾值法三種方法,建立能耗基準(zhǔn)并根據(jù)給定標(biāo)準(zhǔn)進(jìn)行實時能耗異常診斷。如圖4-6所示,該診斷策略分為離線模型生成和在線異常診斷兩部分。左側(cè)為離線模型生成模塊,右側(cè)為在線異常診斷模塊。離線模型利用多模式方法生成診斷日24h逐時能耗異常診斷基準(zhǔn),其流程如下:首先,基于XGBoost的多維數(shù)據(jù)的時間預(yù)測為基礎(chǔ)對被診斷日進(jìn)行逐時能耗預(yù)測獲得被診斷日24h線路能耗數(shù)據(jù);其次,結(jié)合辦公建筑人員上下班時間對該線路進(jìn)行典型階段劃分,獲得持續(xù)待機(jī)階段、開機(jī)階段、持續(xù)運行階段3個典型階段;再次,結(jié)合相似日方法以開機(jī)階段總體能耗為目標(biāo)尋找該時間段內(nèi)最相似日;最后,根據(jù)歷史數(shù)據(jù)確定持續(xù)待機(jī)能耗閾值,形成被診斷日離線模型。在線異常診斷部份其算法流程為:1)將逐時在線數(shù)據(jù)根據(jù)時刻信息進(jìn)行典型階段劃分;2)若為持續(xù)待機(jī)階段。將在線數(shù)據(jù)與固定閾值進(jìn)行比較,超過閾值進(jìn)行異常報警;3)若為持續(xù)運行階段。采用XGBoost多維時間序列預(yù)測構(gòu)建該階段能耗基準(zhǔn),計算相對誤差MAE,依據(jù)表4-2的異常判定標(biāo)準(zhǔn)對在線數(shù)據(jù)進(jìn)行診斷,異常等級(1)進(jìn)行異常提醒,異常等級(2)進(jìn)行異常報警;4)若為開機(jī)階段。持續(xù)累計直至開機(jī)階段結(jié)束對該階段總能耗值進(jìn)行基于相似日算法的異常診斷;5)輸出診斷結(jié)果,并返回步驟1) 2.5Ⅳ類線路異常診斷策略根據(jù)圖4-4所示Ⅳ類線路具有逐日能耗非平穩(wěn)、與室外天氣弱相關(guān)且日逐時運行能耗平穩(wěn)的特點。若該類線路已知設(shè)備運行策略則仿照Ⅱ類線路進(jìn)行分析,若該類線路設(shè)備運行策略不宜確定,采用基于決策樹的用能模式與分類。診斷策略如圖4-7所示:(1)以日期、時間、月份作為輸入變量,采用CIT樹對待識別能耗線路進(jìn)行模式劃分,通過計算顯著性差異確定各模式間的相互獨立性,構(gòu)建離線能耗基準(zhǔn);(2)對輸入數(shù)據(jù)進(jìn)行模式識別,確定所在模式;(3)利用3-sigma準(zhǔn)則對能耗異常值進(jìn)行識別。2.6Ⅴ類線路異常診斷策略根據(jù)圖4-4所示Ⅴ類線路具有逐日能耗非平穩(wěn)、與室外天氣弱相關(guān)且日逐時運行能耗非平穩(wěn)的特點,如3.2節(jié)所述,采用相似日算法進(jìn)行能耗異常診斷。由于需要對實時能耗進(jìn)行診斷,因此,如圖4-8所示,需要采用分段相似算法逐段尋優(yōu),最終得到最優(yōu)實時能耗基準(zhǔn)。3數(shù)據(jù)準(zhǔn)備3.1數(shù)據(jù)來源本章電力能耗數(shù)據(jù)和天氣能耗數(shù)據(jù)來源與分類與上節(jié)相同。3.2數(shù)據(jù)異常值處理逐時能耗與逐日能耗相比具有數(shù)量大、變化復(fù)雜的特點,且本文采用建筑實際能耗數(shù)據(jù),數(shù)據(jù)質(zhì)量參差不齊。為提高歷史數(shù)據(jù)的準(zhǔn)確性和模型的精度,因此對能耗進(jìn)行進(jìn)一步的預(yù)處理,數(shù)據(jù)處理流程如下:1)利用過濾的手段對電力能耗平臺數(shù)據(jù)庫中的缺失值、異常值和死值進(jìn)行初步處理。由于本文使用的兩辦公建筑電力平臺監(jiān)測數(shù)據(jù)較為穩(wěn)定,歷史數(shù)據(jù)庫中不存在缺失值和死值。因此,本文不考慮以上2類數(shù)據(jù)。2)對于運行中的異常一般有兩種。一種異常值產(chǎn)生于系統(tǒng)的開機(jī)過程中,這種非穩(wěn)態(tài)過程回導(dǎo)致能耗采集系統(tǒng)數(shù)據(jù)劇烈波動,因此對這些異常數(shù)據(jù)進(jìn)行認(rèn)為剔除。3)對于另一種數(shù)據(jù)為持續(xù)運行或者持續(xù)待機(jī)中的異常值。該類異常值對于單變量數(shù)據(jù)采用上文所示的箱線圖法進(jìn)行異常值發(fā)現(xiàn)。異常值處理結(jié)果如圖4-9和圖4-10所示。4)對于多變量數(shù)據(jù)采用孤立森林(iForest)剔除非平穩(wěn)運行數(shù)據(jù)和噪聲數(shù)據(jù)。iForest算法適用于連續(xù)數(shù)據(jù)的異常檢測,可以實現(xiàn)高維的數(shù)據(jù)輸入。它將異常定義為“容易被孤立的離群點”,也可以理解為分布稀疏且離密度高的群體較遠(yuǎn)的點。iForest算法與傳統(tǒng)基于密度或者距離的異常檢測算法不同,它們的閾值全部是全局的閾值,所以在異常點局部密度較大時會失效,而iTree在每次對二叉樹進(jìn)行劃分時,都是在局部的最大值和最小值之間隨機(jī)選值,也就是說每次劃分的取值區(qū)間是根據(jù)局部自適應(yīng)的,這讓iForest算法的魯棒性得到了提升。因此,采用iForest算法對多變量數(shù)據(jù)進(jìn)行異常檢測。以冷水機(jī)組供冷季逐時運行數(shù)據(jù)為例進(jìn)項說明,逐時能耗異常檢測結(jié)果如圖4-11和圖4-12所示。對基于iForest算法的異常點進(jìn)行整理可以得到表4-3過iForest算法可以對持續(xù)運行和持續(xù)待機(jī)狀態(tài)下的異常值進(jìn)行有效的檢測。表4-3iForest異常點展示NumDateyearmonthdaydoydowHourTemThrPower122019/5/6201956126019:00:009.262191.92132019/5/6201956126020:00:008.377240.18142019/5/6201956126021:00:007.48113.37272019/5/7201957127120:00:0011.558147.61702019/5/102019510130421:00:0015.96722.9842019/5/12201951213268:00:001490106.89922019/5/122019512132616:00:0011231517942019/5/122019512132618:00:0012.922147.33952019/5/122019512132619:00:0010.838148.23962019/5/122019512132620:00:009.14416.81772019/5/20201952014007:00:0026.31323.321892019/5/202019520140019:00:0011.27439.062132019/5/23201952314336:00:0036.91525.592692019/5/272019527147019:00:0012.67030.952702019/5/28201952814816:00:0032.61513.964282019/6/11201961116218:00:0037.614724.566872019/6/30201963018166:00:0037.32076.8510082019/7/22201972220303:00:0037.24310.3510972019/7/28201972820963:00:0036.52831.5216642019/9/420199424724:00:0035.13014.6418232019/9/152019915258617:00:00138213.944案例分析4.1Ⅰ類線路異常診斷4.1.1數(shù)據(jù)說明本節(jié)以第二章中的辦公建筑為例,由表2-12可知該建筑內(nèi)公區(qū)照明(低區(qū)干線)屬于Ⅰ類線路,選擇2018年12月-2019年12月工作日逐時能耗數(shù)據(jù)作為訓(xùn)練集樣本,對歷史數(shù)據(jù)集進(jìn)異常數(shù)據(jù)處理,經(jīng)異常處理后該訓(xùn)練集一共包含5728組數(shù)據(jù),每組數(shù)據(jù)包含2個參數(shù),即小時變量和能耗變量。采集2020年9月14日-2020年9月18日逐時能耗數(shù)據(jù)作為測試集樣本。4.1.2典型日能耗基準(zhǔn)及其上下限公區(qū)照明(低區(qū)干線)屬于Ⅰ類線路。公區(qū)照明(低區(qū)干線)工作日全年逐時能耗分布情況如圖4-13所示,為更直觀對該線路能耗進(jìn)行定量診斷和分析取逐時能耗中位數(shù)構(gòu)成典型日用能基準(zhǔn)。通過對工作日全年逐時能耗分布情況的分析,基于3-Sigma準(zhǔn)則構(gòu)建該線路的逐時能耗上下限閾值該閾值和基準(zhǔn)值數(shù)值如表4-4所示。通過對于基準(zhǔn)值的構(gòu)建實現(xiàn)了對于數(shù)據(jù)的定量診斷和分析。表4-4基于3-Sigma準(zhǔn)則的能耗上下限閾值時刻能耗上限用能基準(zhǔn)限能耗下限0h89.8178.8669.691h88.6777.0165.682h87.1076.086333h84.8375.636314h83.4271963.565h83.7273563.556h89.0676.5063.217h109.5597.0682.568h148.17135.72120.499h186.13169.68151.6210h216.69205.18192.1511h221.26209.53195.6812h2117203.30191.0713h216.80203.59188.7014h221.30205.89186.9515h216.63202.54182.3716h216.22203.85187.6617h219.20205.75193.6118h207.14195.41182.7719h192.80182.05171.0320h171.36158.63145.4621h153.37140.88126.4322h125.82113.3099.2823h95.7485.1374.874.1.3在線異常診斷 取2020年9月14日-2020年9月18日5個工作日的公區(qū)照明(低區(qū)干線)能耗數(shù)據(jù),共計120組數(shù)據(jù)。使用此數(shù)據(jù),驗證所提在線異常診斷方法的有效性。其中以9月17日逐時能耗為例,該線路逐時能耗診斷結(jié)果如圖4-15,在9月17日11時該線路能耗異常,異常值為185.08kWh,超過閾值下限10.6kWh。經(jīng)翻看2020年9月17日建筑物業(yè)人員異常運行記錄發(fā)現(xiàn),B1層部份公區(qū)照明設(shè)置為手動模式,沒有通過樓宇自控系統(tǒng)自動開啟。 由于Ⅱ類線路診斷方法與Ⅰ類線路一致,因此本節(jié)不在贅述。4.2Ⅲ類線路異常診斷4.2.1數(shù)據(jù)說明本節(jié)以第二章中的辦公建筑為例,由表2-12可知該冷水機(jī)組線路(供冷季)和冷泵組合(供冷季)屬于Ⅲ類線路。根據(jù)其線路定義和1.3節(jié)所示,樣本中應(yīng)包含時間構(gòu)造特征、工作日非工作日屬性、室外氣候參數(shù)和歷史數(shù)據(jù)共4類參數(shù),其中,根據(jù)能耗周期性特征對時間構(gòu)造特征進(jìn)行選擇,選擇參數(shù)包括:一周的第幾天、一年的第幾天、一月的第幾天、一年的第幾周、一年的第幾月、一天的第幾個小時,6個參數(shù)。工作日/非公日屬性通過一周第幾天進(jìn)行判斷。室外氣候參數(shù)包括室外平均氣溫、室外最高氣溫、室外最低氣溫、室外濕度,4個參數(shù)。歷史數(shù)據(jù)參數(shù)則包括前24h歷史數(shù)據(jù)和前48h歷史數(shù)據(jù),2個參數(shù)。該模型建立采用的數(shù)據(jù)集自2019年5月6日開始-2020年9月13日冷機(jī)運行階段能耗數(shù)據(jù)共計5413組數(shù)據(jù),每組數(shù)據(jù)包含以上4類12個參數(shù),其中利用XGBoost算法建立模型時對數(shù)據(jù)集進(jìn)行隨機(jī)分割:訓(xùn)練集0.7,測試集0.3。該線路工作日每日典型工況劃分為:持續(xù)待機(jī)狀態(tài)時間段為0:00-6:00和21:00-0:00;開機(jī)時間段為7:00-9:00;持續(xù)運行時間段為10:00-20:00。4.2.2離線模型建立(1)特征選擇1)24h歷史溫度對模型建立的影響分析根據(jù)Ⅲ類線路診斷方法,需要對被預(yù)測日(0:00-23:00)能耗進(jìn)行逐時預(yù)測。除添加傳統(tǒng)歷史數(shù)據(jù)外,還額外選擇添加前24h歷史數(shù)據(jù)和前48h歷史數(shù)據(jù),2個參數(shù)作為輸入。通過添加刪減前24h和前48h歷史數(shù)據(jù)其預(yù)測結(jié)果如圖4-16所示。根據(jù)圖4-16所示,紅色折線為輸入?yún)?shù)含有前24h(t-m24)和前48h(t-m48)歷史數(shù)據(jù)的XGBoost算法預(yù)測結(jié)果,橙色折線為輸入?yún)?shù)不含有前24h(t-m24)和前48h(t-m48)歷史數(shù)據(jù)的XGBoost算法預(yù)測結(jié)果。在同算法參數(shù),其他輸入也相同的情況下,含有前24小時和前48小時歷史數(shù)據(jù)的預(yù)測結(jié)果從趨勢上和更加貼近實際能耗折線,且紅色折線MAE的值為10.23而橙色折線MAE的值為28.66,可以看出紅色折線的預(yù)測效果更好。此外,紅色折線通過前24h和前48h對能耗的認(rèn)為運行策略進(jìn)行了學(xué)習(xí),對于冷機(jī)關(guān)閉時刻的預(yù)測更加準(zhǔn)確。2)特征選擇對模型建立的影響利用XGBoost算法中特征重要性函數(shù)對預(yù)測模型的輸入特征的重要性進(jìn)行排序,如圖4-17所示,可以得到輸入特征的最重要的前4項為:室外溫度(Tem)、前24h歷史數(shù)據(jù)(t-m24)、前48h歷史數(shù)據(jù)(t-m48)和室外濕度(Thr)。圖4-5表示所有輸入的累計方差,根據(jù)結(jié)果表明選取包含總變異系數(shù)的95%的特征集,特征集特征數(shù)k設(shè)置為8。因此,選擇XGBoost算法前8個特征:Tem、t_m24、t_m48、Thr、doy、hour、Tem_max、day作為構(gòu)建模型的主要參數(shù)。為進(jìn)一步驗證特征選擇的重要性,針對同XGBoost算法參數(shù),全部12個參數(shù)輸入情況和經(jīng)選取的8個參數(shù)輸入情況的R2進(jìn)行比較,同參數(shù)條件下特征選擇前后的預(yù)測結(jié)果如表4-5所示,根據(jù)結(jié)果可以看出經(jīng)過選擇后預(yù)測結(jié)果得到了提升準(zhǔn)確度由0.93提升到了0.94,起到了優(yōu)化算法模型的作用。表4-5同參數(shù)條件下特征選擇前后的預(yù)測結(jié)果模型參數(shù)參數(shù)數(shù)量決定系數(shù)R2base_score=0.5,booster='gbtree',colsample_bylevel=1,colsample_bynode=1,colsample_bytree=1,gamma=0,importance_type='gain'120.9380.94(2)參數(shù)調(diào)節(jié)按照0.7/0.3的比例對經(jīng)過數(shù)據(jù)異常處理的歷史數(shù)據(jù)進(jìn)行分割,獲得訓(xùn)練集和測試集用于構(gòu)建模型。通過5折交叉驗證、網(wǎng)格搜索和學(xué)習(xí)曲線等方法對算法關(guān)鍵參數(shù)進(jìn)行自動尋優(yōu)。其中,n_estimators設(shè)定參數(shù)范圍為[100,300]、min_child_weight設(shè)定參數(shù)范圍為[1,5]、max_depth設(shè)定參數(shù)范圍為[3-10]、subsample設(shè)定參數(shù)范圍為[0.5-1]、colsample_bytree設(shè)定參數(shù)范圍為[0.5-1]、reg_alpha設(shè)定參數(shù)范圍為[0.01-1]、reg_lambda設(shè)定參數(shù)范圍為[0.1-1]、learning_rate設(shè)定參數(shù)范圍為[0.01-0.3]。以n_estimators為例參數(shù)尋優(yōu)過程如圖4-2所示,紅色虛線為模型泛化誤差曲線,黑色為實際學(xué)習(xí)曲線,尋找峰值作為最佳值,n_estimators最佳值為135。表4-6XGBoost算法最優(yōu)參數(shù)參數(shù)名稱最優(yōu)值參數(shù)名稱最優(yōu)值n_estimators135colsample_bytree0.6min_child_weight3reg_alpha0.5max_depth5reg_lambda0.3subsample0.7learning_rate0.06最終,得到XGBoost算法最優(yōu)參數(shù)組合如表4-6所示。將該參數(shù)組作為該離線模型XGBoost算法的參數(shù),將獲得數(shù)據(jù)集下的最優(yōu)模型。下文XGBoost算法模型構(gòu)建將采用該參數(shù)組。(3)XGBoost算法預(yù)測結(jié)果分析 采用上述方法構(gòu)建 XGBoost算法預(yù)測模型,對逐時能耗進(jìn)行訓(xùn)練,其模型訓(xùn)練效果如表4-7所示。表4-7不同條件下XGBoost算法模型訓(xùn)練集效果模式R-scoreRMSEMAPE原始參數(shù)92.78%49.56107.00%調(diào)參后95.08%40.93218%調(diào)參且特征選擇96.23%2617.01%如表4-7所示模型訓(xùn)練結(jié)果的準(zhǔn)確率隨著參數(shù)和特征的選擇不斷優(yōu)化,在經(jīng)過上文調(diào)參和參數(shù)選擇后準(zhǔn)確率從92.78%提升至96.23%,同時模型的RMSE也有了明顯的下降,由49.56下降至26。MAPE較大。根據(jù)定義可知,MAPE是一個相對值,根據(jù)公式影響MAPE的因素主要由兩個方面:一個方面,MAPE容易受到數(shù)據(jù)實際值得影響,殘差一定的情況下實際值越小,MAPE的值越大,因此當(dāng)殘差出現(xiàn)在冷水機(jī)組的持續(xù)待機(jī)時間時,實際值和預(yù)測值極易出現(xiàn)較大的差距導(dǎo)致MAPE過大。另一方面,由于為平均相對誤差,易受極值影響,冷水機(jī)組開機(jī)時能耗常有劇烈波動且與人員操作相關(guān),難以預(yù)測易產(chǎn)生較大的誤差。單獨對經(jīng)過調(diào)參和特征選擇的持續(xù)運行階段訓(xùn)練集的MAPE進(jìn)行計算,其MAPE值為7.8%。(4)持續(xù)待機(jī)狀態(tài)固定閾值確定持續(xù)待機(jī)狀態(tài)下能耗分布和概率密度如圖4-20和圖4-21所示,該線路待機(jī)狀態(tài)下冷機(jī)能耗具有正態(tài)分布性。為更好獲得固定閾值,利用箱線圖去除持續(xù)待機(jī)時間的能耗極值,取能耗上限作為固定閾值。根據(jù)圖4-20所示,本文冷水機(jī)組線路持續(xù)待機(jī)能耗固定閾值設(shè)置為4kWh。(5)開機(jī)階段相似日能耗基準(zhǔn)構(gòu)建 采用相似日診斷時對根據(jù)氣象數(shù)據(jù)網(wǎng)獲得當(dāng)日7:00-9:00時間段氣象數(shù)據(jù),根據(jù)第3章和2.4節(jié)所述相似日構(gòu)建開機(jī)階段相似日能耗基準(zhǔn)和能耗異常閾值。4.2.3在線異常診斷實例取2020年9月14日星期一工作日的冷水機(jī)組能耗數(shù)據(jù),使用此數(shù)據(jù)驗證所提在線異常診斷方法的有效性。根據(jù)4.3.2節(jié)構(gòu)建的離線模型可知,該線路XGBoost算法離線模型僅持續(xù)運行階段的MAPE為7.8%,相對誤差取絕對值后的最大值δmax為9.3%,預(yù)測誤差處于可接受水平,可以進(jìn)一步用于實時能耗異常診斷。得到基于XGB表4-89月14日基于XGBoost算法的異常診斷結(jié)果日期實際能耗/kWh預(yù)測能耗/kWh相對誤差診斷結(jié)果2020-09-1400:00:001.722.4743.39%22020-09-1401:00:002.212.8127.18%22020-09-1402:00:002.232.386.51%02020-09-1403:00:002.342.129.60%22020-09-1404:00:002.432.492.32%02020-09-1405:00:002.282.5712.85%22020-09-1406:00:002.262.8927.98%22020-09-1407:00:00210.34235.0111.73%22020-09-1408:00:00372.8444719.23%22020-09-1409:00:00366.21443.4921.10%22020-09-1410:00:00392.97423.447.75%02020-09-1411:00:00408.51398.672.41%02020-09-1412:00:00377.83397.185.12%02020-09-1413:00:00369.26395.907.21%02020-09-1414:00:00373.56395.035.75%02020-09-1415:00:00373.47395.035.77%02020-09-1416:00:00365.35393.787.78%02020-09-1417:00:00360.79370.522.70%02020-09-1418:00:00313.1340.428.72%12020-09-1419:00:00238.49246.373.31%02020-09-1420:00:00143.99175.5321.91%22020-09-1421:00:001.858.90381.32%22020-09-1422:00:001.842.7147.40%22020-09-1423:00:001.772.4035.82%2利用2.4節(jié)Ⅲ類線路實時能耗診斷策略對其進(jìn)行能耗基準(zhǔn)重新構(gòu)建。對于持續(xù)待機(jī)時間異?;鶞?zhǔn)進(jìn)行重構(gòu),其固定閾值為4kWh,即持續(xù)待機(jī)階段(21:00-23:00/0:00-6:00)當(dāng)逐時實際能耗大于4kWh,能耗異常;若小于4kWh,能耗正常。對于開機(jī)階段(7:00-9:00)取5日最優(yōu)相似日該時段平均值,作為能耗基準(zhǔn),與實際能耗比較,若相對誤差大于10%則認(rèn)為異常。圖4-22為僅利用XGBoost算法進(jìn)行診斷得結(jié)果,可以看出在開機(jī)階段(7:00-9:00)線路誤差較大,分別為24.67kWh、71.67kWh和77.28kWh,誤差占比為11.73%、19.22%和21.10%,不能作為該線路實時異常診斷指標(biāo)。該時段最相似5日為8月31、9月11日、8月24日、9月02日和9月03日。5日7:00-9:00平均開機(jī)總能耗為1012.89kWh,9月14日7:00-9:00開機(jī)總能耗為949.35kWh,誤差百分比為6.27%,滿足作為線路能耗基準(zhǔn)的要求。因此,開機(jī)階段采用相似日方法構(gòu)建能耗基準(zhǔn)比直接采用XGBoost算法預(yù)測構(gòu)建能耗基準(zhǔn)更加準(zhǔn)確。綜上所述,9月14日能耗基準(zhǔn)及診斷結(jié)果應(yīng)如表4-9和圖4-23所示。如表4-9所示,修正后的能耗基準(zhǔn)較僅基于XGBoost算法建立的能耗基準(zhǔn)可以有效降低持續(xù)待機(jī)階段和開機(jī)階段的異常誤報率。進(jìn)一步說明了Ⅲ類線路能耗異常診斷的正確性。表4-9基于Ⅲ類線路實時能耗診斷策略的診斷結(jié)果日期逐時能耗基準(zhǔn)/kWh實際能耗/kWh診斷結(jié)果2020-09-1400:00:004.001.72正常2020-09-1401:00:004.002.21正常2020-09-1402:00:004.002.23正常2020-09-1403:00:004.002.34正常2020-09-1404:00:004.002.43正常2020-09-1405:00:004.002.28正常2020-09-1406:00:004.002.26正常開機(jī)階段1012.89949.35正常2020-09-1410:00:00423.44392.97正常2020-09-1411:00:00398.67408.51正常2020-09-1412:00:00397.18377.83正常2020-09-1413:00:00395.90369.26正常2020-09-1414:00:00395.03373.56正常2020-09-1415:00:00395.03373.47正常2020-09-1416:00:00393.78365.35正常2020-09-1417:00:00370.52360.79正常2020-09-1418:00

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論