基于分類算法的供水管網(wǎng)泄漏定位方法的研究_第1頁
基于分類算法的供水管網(wǎng)泄漏定位方法的研究_第2頁
基于分類算法的供水管網(wǎng)泄漏定位方法的研究_第3頁
基于分類算法的供水管網(wǎng)泄漏定位方法的研究_第4頁
基于分類算法的供水管網(wǎng)泄漏定位方法的研究_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第一章緒論1.1研究背景六十年代末,錯誤診斷技術(shù)成為一種新的機器學(xué)習(xí)技術(shù)。根據(jù)發(fā)展的來源,美國是歷史上第一個研究錯誤診斷技術(shù)的國家。在美國宇航局于1967年主張和在美國海軍研究服務(wù)(ONR)的領(lǐng)導(dǎo)下,在研究和開發(fā)方面處于領(lǐng)先地位。在工程工業(yè)故障檢測和機器設(shè)備損傷診斷技術(shù)上,取得了很多突破性的研究成果和進步,如故障原因探究、故障檢測、故障預(yù)測和故障診斷等方面。在航空方面,波音747、DC9等大型客機上的故障診斷系統(tǒng),能夠利用當(dāng)前獲取的信息分析飛行故障原因并報錯,這有利于提高乘客的人身安全。隨著故障診斷技術(shù)的興起,在仿真階段取得了顯著的研究成果,并發(fā)表了大量的學(xué)術(shù)論文。20世紀(jì)70年代,美國發(fā)展了基于分析冗余的故障檢測和診斷方法。1971年,麻省理工學(xué)院的比爾德在他的博士論文中首次提出用分析冗余取代硬件冗余。在自組織系統(tǒng)的幫助下,通過比較觀察者的輸出來穩(wěn)定封閉系統(tǒng)并檢測系統(tǒng)誤差[1]?;诜治鰩齑娴纳晒收显\斷技術(shù)。1971年,Mehra和Peshona[2]關(guān)于自動化的文章也被廣泛認(rèn)為是故障診斷技術(shù)的基礎(chǔ)之一。與外國不同的是,故障診斷技術(shù)的開發(fā)和發(fā)展相對較遲,只是在1970年代初才開始發(fā)展[3]。我國在1986年成功舉辦了首次國際技術(shù)會議,對機械設(shè)備故障進行診斷。在未來的幾年里,在政府的指導(dǎo)下,一些理論研究與國外的比較。目前,一些具體的檢測技術(shù)工程故障有其特點,并成功地開發(fā)了自己的監(jiān)測和診斷工具。設(shè)備故障檢測系統(tǒng)逐漸成為全國關(guān)注的焦點,尤其是專家智能檢測系統(tǒng),核電站,航空部門和空間項目中居住的能源系統(tǒng),石油系統(tǒng),冶金系統(tǒng)和高科技產(chǎn)業(yè)[4-9]。特別是在20世紀(jì)90年代以后,國民經(jīng)濟的各個領(lǐng)域都依賴于故障診斷技術(shù)并且正在全面展開。沒有故障樣本是故障診斷瓶頸之一,而不是診斷方法本身。在實際應(yīng)用中,例如大型單元的故障診斷,可用樣品的數(shù)量通常是有限的。大型機組系統(tǒng)非常昂貴,其運行狀態(tài)與公司的整個生產(chǎn)密切相關(guān)。在大多數(shù)情況下,信號和缺陷之間的對應(yīng)關(guān)系非常模糊,并且信號也可能對應(yīng)于幾個缺陷。1990年代中期,隨著統(tǒng)計學(xué)習(xí)理論的發(fā)展,支持向量機(SVM)作為一種機器學(xué)習(xí)技術(shù)在小型樣本中得到發(fā)展[10-12]。同樣地,我們支持在向量機和超能力學(xué)習(xí)中適用最大限度地減少結(jié)構(gòu)性風(fēng)險的原則,因為設(shè)備故障本身就是一個小的樣品事故,所以SVM對故障的診斷非常合適。在樣本量較小的情況下,SVM通過限制結(jié)構(gòu)風(fēng)險的最小化來展示強大的分類能力。小樣本的解決方案是其在故障排除中使用的最大優(yōu)勢。在具有有限功能集的信息的情況下,訓(xùn)練方法的本質(zhì)是能夠最大化隱藏在數(shù)據(jù)中的分類知識,這對于故障的診斷具有重要的實際意義。1.2研究意義隨著中國城市規(guī)模的擴大和居民生活水平的提高,城市供水網(wǎng)絡(luò)的發(fā)展和農(nóng)村供水的擴大對安全可靠的供水系統(tǒng)的需求。管理和服務(wù)系統(tǒng)也變得越來越重要。一方面,為了滿足用戶的需求另一方面,在水和壓力下,必須確保用戶在一段時間內(nèi)不間斷地使用水,更重要的是,管道的破壞不應(yīng)導(dǎo)致管道的損壞。這意味著管道周圍的設(shè)施的破壞和損失。城市水管網(wǎng)運行中的漏水現(xiàn)象不僅造成水源的浪費,還減少管道安全和損壞基礎(chǔ)甚至附近公共設(shè)施,如建筑物和結(jié)構(gòu)構(gòu)成潛在的威脅。因此,如果不能及時發(fā)現(xiàn)和修復(fù)泄漏地區(qū),將造成大量水資源的損失,并對國家乃至世界造成重大經(jīng)濟損失。城市供水也是一項公共事業(yè),供水公司提供的服務(wù)質(zhì)量不僅是衡量城市供水管理水平的指標(biāo),也體現(xiàn)了黨和政府的形象。在一定程度上的人口。隨著社會的發(fā)展和市民對權(quán)利的敏感化。對供水公司的需求不斷增加,水質(zhì),水壓,環(huán)境的連續(xù)性和安全性等問題都是環(huán)境問題。如果路面坍塌,將影響交通安全,長期的水泄漏將導(dǎo)致建筑物,防空洞,地下室以及用于測試井中水的各種電纜的質(zhì)量問題。一些嚴(yán)重干擾公民正常生產(chǎn)和生活的問題和情況的出現(xiàn)常常受到政府和媒體的干擾。如果供水公司得不到妥善處理,將對社會產(chǎn)生嚴(yán)重的負面影響。簡而言之,對供水管網(wǎng)中的泄漏進行成本有效的控制一直是國內(nèi)和國際供水行業(yè)的一個重要問題。自來水公司加強泄漏檢測,謹(jǐn)慎控制管網(wǎng)泄漏,可以顯著提高供水的有效容量,這對節(jié)約用水,營造救助社會至關(guān)重要,并提高企業(yè)的社會和經(jīng)濟效益。統(tǒng)計學(xué)習(xí)理論(SLT)的出現(xiàn)和神經(jīng)網(wǎng)絡(luò)等新機器學(xué)習(xí)方法的發(fā)展遇到了一些重要的困難[13,14]。然而由于支持向量機具有良好的多維數(shù)據(jù)處理能力,并且相對難以從時域中的信號中提取故障信號,因此直接使用時域中的信號來診斷SVM中的問題也是一個重要的研究方向。許多學(xué)者分析了泄漏引起的現(xiàn)象,并對它們進行建模,以改善管道分配系統(tǒng)中的檢測和定位性能[15,16]。然而,這些研究只把壓力的變化作為一個模型參數(shù),而流體管道耦合振動的彈性波模型沒有考慮,因為大量的參數(shù)取決于泄漏類型和介質(zhì)特性。在相關(guān)文獻[17,18]中提到,如果可以應(yīng)用機器學(xué)習(xí)的方法,則可以通過采集小樣本數(shù)據(jù)或數(shù)據(jù)驅(qū)動的增強來增加數(shù)據(jù)集,并且可以糾正錯誤,以幫助提高性能。1.3論文研究內(nèi)容及其組織結(jié)構(gòu)論文主要研究基于支持向量機的方法判別供水管網(wǎng)中的泄漏,通過學(xué)習(xí)的方式加以訓(xùn)練以達到能夠識別供水管網(wǎng)是否泄漏的目的。判斷是否泄漏后,還需要判別是管網(wǎng)中哪一號節(jié)點發(fā)生的泄漏,并對其進行定位。第一章為緒論,首先闡述了錯誤診斷技術(shù)的起源和發(fā)展,闡述了基于支持向量機的錯誤診斷技術(shù),最后闡明了本文的研究內(nèi)容。第二章主要講述了供水管網(wǎng)泄漏定位的理論方法。第三章研究svm的基礎(chǔ)理論以及核函數(shù)和組合核函數(shù),通過組合算法改善分類的精度。第四章為漏點定位算法分析與仿真研究,主要講述了如何進行實驗以及對實驗結(jié)果的分析。第五章為總結(jié)與期望,通過仿真實驗和實驗結(jié)果分析得出一些結(jié)論。

第二章供水管道泄漏定位理論方法本章介紹供水管網(wǎng)泄漏檢測定位的各種目前使用的方法及本文所提到的方法,并突出一些方面的優(yōu)越性。然后討論一下強泄漏與弱泄漏不同情況以及供水管網(wǎng)參數(shù)對實驗正確率的影響。2.1簡單泄漏估計技術(shù)主動觀察是最常見和最簡單的評估:當(dāng)泄漏量已經(jīng)很大并且可以被人們察覺時,例如,當(dāng)大量的水滲透到表面或當(dāng)人們擔(dān)心水的壓力會降低,泄漏就會被識別出來。主動觀察適用于泄漏很重要的情況。在大多數(shù)系統(tǒng)中,水審計[19]或連續(xù)流量測量[20]與主動觀測結(jié)合使用。水審計將一些子網(wǎng)與整個管網(wǎng)分開,并測量每個子網(wǎng)的輸入和輸出,大約24小時一個周期。流入和流出之間的差異是未考慮的水量。未經(jīng)授權(quán)使用水、流量計不準(zhǔn)確、測量錯誤以及失竊或漏水可能是未經(jīng)授權(quán)使用水的原因。據(jù)估計,在大多數(shù)系統(tǒng)中,大約三分之一的未被識別的流量是由于泄漏造成的。水壓試驗需要單獨選擇管道并隨后在一段時間內(nèi)持續(xù)增加水壓。如果無法保持水壓,則會發(fā)生泄漏。由于水系統(tǒng)可能存在干擾,零消耗和水壓試驗的使用受到嚴(yán)重限制。2.2專用定位技術(shù)特殊的漏泄定位法能準(zhǔn)確確定管道恢復(fù)時的漏泄點。目前有很多特殊的方法可以確定泄漏點??煞譃閮蓚€部分的定位系統(tǒng):非聲信號泄漏定位方法和聲信號泄漏定位方法1非基于聲信號分析的檢測定位方法1)氣體跟蹤:這種方法設(shè)計用于注入無毒,不溶于水的氣體,將氦氣和氫氣等空氣排入水管的一部分[21]。當(dāng)管道泄漏發(fā)生時,充入氣體將會從泄漏處溢出,并且由于該氣體密度小于空氣,因此它會滲透地面和路面而上升??梢酝ㄟ^用高靈敏度氣體檢測器掃描管道上表面來定位泄漏的位置。氣體跟蹤法花銷十分巨大,并且在供水系統(tǒng)中通常不是非常有效。紅外熱成像:使用紅外熱成像補充泄漏檢測的原理是,當(dāng)?shù)叵鹿艿缆┧畷r,相鄰?fù)寥赖臒嵝再|(zhì)會發(fā)生變化[22]。例如,相鄰的土壤比周圍的干燥土壤冷卻得更快。通過紅外線掃描儀探測管道中的熱異常,可以探測管道滲漏情況。紅外線熱成像技術(shù)也很昂貴,需要專門的操作人員,在許多地方并不實際。2)探地雷達方法:采用這種方法時,傳輸和記錄設(shè)備預(yù)先放置在管道上方的表面上,電磁波傳輸?shù)降孛娌⒀舆t透射波和反射波用于確定反射表面與表面的距離[23]探地雷達方法使用兩種方法來確定漏水:(a)通過識別漏水湍流產(chǎn)生的地面空隙:(b)通過區(qū)分由于泄漏引起的飽和土壤的介電常數(shù)的增加,形成比正常更深的管段。2基于聲信號分析的檢測定位方法聽音技術(shù):聽音裝置包括聽音棒和地面麥克風(fēng),無論是機械還是電子[24]。檢查員沿管網(wǎng)進行泄漏檢測檢查,并使用接力棒監(jiān)聽相應(yīng)管道部分泄漏的特征嘶嘶聲。聽力檢測的有效性取決于泄漏的大小,管道交通和水牽引引起的背景噪聲以及檢測到的細節(jié)水平。群體普查僅監(jiān)聽易于監(jiān)控的管道組件,例如消防栓和閥門。它主要檢測大泄漏;詳細檢查使您可以收聽管道的所有組件并檢測小泄漏。地面麥克風(fēng)直接偵聽管道上表面的不可靠聲音。這個過程需要很長時間,其成功取決于員工的經(jīng)驗。2)噪聲記錄技術(shù):噪聲記錄器是裝有振動傳感器(水下聽音)的壓縮裝置和可編程的數(shù)據(jù)記錄器,可用于探測大規(guī)模泄漏,但設(shè)備不適合用于跟蹤泄漏情況,記錄器可組合成鄰近的管道組件,一組大約六個或更多,通常在整個晚上放置,記錄器通常使用程序控制在凌晨2點到4點之間收集管道噪音。數(shù)據(jù),第二天收集它們,然后將收集的數(shù)據(jù)從前一天下載到PC,然后將收集的錄像機放在下一個位置。通過數(shù)據(jù)的統(tǒng)計并分析泄漏是否存在。3)泄漏噪聲相關(guān)檢測:使用加速度計,水聽器或地震檢波器在管道的兩個點處收集泄漏噪聲(噪聲或振動),并使用兩個泄漏信號的最大相關(guān)事件偏移量泄漏,通過無線或有線連接將信號收集到相關(guān)器。泄漏位置由信號傳播速度和兩個測點之間的距離決定[25]。相關(guān)器包括BCC和PHAT等等多種相關(guān)器,不同的相關(guān)器對噪聲的敏感程度和魯棒性有所差異,這將直接導(dǎo)致泄漏定位的精確程度。相關(guān)器在檢測和定位方面比聽音裝置更有效,并且更少依賴于檢查員的經(jīng)驗。然而,現(xiàn)有的相關(guān)儀器對于鑄鐵和球墨鑄鐵以及大多數(shù)塑料管的無噪聲泄漏是不可靠的。相關(guān)器也非常昂貴。2.3本文采用的泄漏定位方法本文描述的泄漏定位方法是基于壓力傳感器獲取數(shù)據(jù),通過統(tǒng)計泄漏前和泄漏后的壓力數(shù)據(jù)值進行分辨是否存在泄漏,使泄漏前和泄漏后的壓力數(shù)據(jù)作為訓(xùn)練集訓(xùn)練支持向量機。每當(dāng)有泄漏到來時,通過機器學(xué)習(xí)(支持向量機)的方法將采集到的壓力數(shù)據(jù)進行分類,從而判斷是否發(fā)生了泄漏。然后又采用多分類的方式定位泄漏節(jié)點,選取幾個易漏點,分別采集每個易漏點泄漏時所有節(jié)點的壓力數(shù)據(jù)作為訓(xùn)練集,再通過支持向量機多分類方法判斷是哪一號節(jié)點發(fā)生了泄漏,從而實現(xiàn)節(jié)點上的定位。該方法相比上述方法操作簡單且易實現(xiàn),準(zhǔn)確度相對來說很客觀,實驗環(huán)境廉價并且支持向量機主要是軟件上的實現(xiàn),可在算法上進行改進和優(yōu)化。與其它方法相比,支持向量機有以下優(yōu)點:①結(jié)構(gòu)相對簡單②泛化能力與性能相比之前的機器學(xué)習(xí)方法有所提高③對高維數(shù)據(jù)仍然適用④克服了維數(shù)災(zāi)難的發(fā)生⑤在求解最優(yōu)化問題時,存在唯一最小值點⑥高效的學(xué)習(xí)速度⑦根據(jù)不同的和函數(shù)可以得到不同的超平面以實現(xiàn)更精確的分類x支持向量機具有良好的推廣能力,因此支持向量機在設(shè)備故障模式識別方面具有廣闊的應(yīng)用前景。在有關(guān)SVM的水系統(tǒng)檢漏文獻中[26],已經(jīng)分析了使用SVM進行供水管網(wǎng)泄漏定位檢測的可行性,在本文將進一步把泄漏分為強泄漏和弱泄漏兩種情況,并分析SVM對兩種情況的分類性能。在使用SVM進行供水管網(wǎng)泄漏定位分類時,采用不同種核函數(shù)進行實驗,從而觀測不同核函數(shù)在供水管網(wǎng)泄漏定位的不同結(jié)果,并選取最優(yōu)的核函數(shù)進行實驗。2.4泄漏標(biāo)準(zhǔn)分析在使用支持向量機SVM時,為了使精度更加精確,通常將泄漏分為兩個等級,即強泄漏和弱泄漏。本文給出的強泄漏與弱泄漏的流量閾值指標(biāo)是10GPM,如果泄漏流量的值小于10GPM則認(rèn)為是弱泄漏,如果泄漏的流量大于10GPM,則認(rèn)為是強泄漏。強泄漏情況下,泄漏前后的壓力差比較大,并且泄漏的水流量也相對較大。因為SVM是一種機器學(xué)習(xí)的分類算法,因此對于不同精度的壓力數(shù)據(jù)分類的準(zhǔn)確度也是不同的。在強泄漏的情況下分類的精度要高一些。在EPANET中保證泄漏流量等于10GPM,并通過合理計算得到擴散器系數(shù)的值作為閾值。在EPANET的仿真環(huán)境下設(shè)定了擴散器系數(shù)值的節(jié)點即為泄漏點,通過設(shè)定不同的擴散器系數(shù)代表泄漏程度不同,從而分成了強泄漏和弱泄漏兩種情況。弱泄漏代表泄漏量很小的情況,主要表現(xiàn)在泄漏的水流量相對較小而不易檢測。但是SVM算法具有高分辨率,可以將兩組偏差較小的數(shù)據(jù)進行訓(xùn)練并學(xué)習(xí),即便是弱泄漏正確率也比較客觀。弱泄漏情況表示的是泄漏流量小于10GPM,但是針對弱泄漏情況下的SVM分類算法正確率卻不如強泄漏,這是因為弱泄漏的壓力差非常小不善于分類,而強泄漏卻有相對較大的壓力差,因此強泄漏情況下分類的正確率相對較高一些。2.5管道參數(shù)對仿真壓力數(shù)據(jù)的影響在實際測量中,管道的參數(shù)對壓力值的測量有很大的影響。主要參數(shù)包括管道的材質(zhì)、管道直徑、粗糙系數(shù)、損失系數(shù)等等。因此,在實際測量數(shù)據(jù)時,需要考慮參數(shù)對實驗結(jié)果的影響。EPANET仿真環(huán)境下可以設(shè)置管道的直徑、粗糙系數(shù)和損失系數(shù)等指標(biāo),并且在每個節(jié)點的標(biāo)高和需水量也有相應(yīng)的設(shè)定。對于模擬一個城市的供水管網(wǎng)的實際模型,EPANET具有良好的功能。通過仿真軟件的測試可以發(fā)現(xiàn),當(dāng)供水管道的直徑越小,管道的水流量就越小,與此同時相鄰節(jié)點的水壓力值也會降低。增加管道的粗糙系數(shù)越大,管道的水流量會下降,與此相連接的節(jié)點壓力值略微有所下降。增加損失系數(shù),管段的水流量值也會發(fā)生下降。以上分析可以看出,管道的參數(shù)對壓力數(shù)據(jù)是具有影響的,因此需要在實際中精確地測量管段及其節(jié)點的參數(shù)值并錄入EPANET仿真環(huán)境當(dāng)中,盡量減少SVM的誤分次數(shù),得到正確率相對較高的分類結(jié)果。

第三章支持向量機的理論基礎(chǔ)自1960年代以來,Vapnik等人根據(jù)統(tǒng)計學(xué)習(xí)理論從事機器學(xué)習(xí)研究,并成功地在1992年至1995年期間采用了以統(tǒng)計學(xué)習(xí)理論為基礎(chǔ)的SVM[27]。目前,通過訓(xùn)練學(xué)習(xí)數(shù)據(jù)的模式已經(jīng)成為機器學(xué)習(xí)領(lǐng)域最受歡迎的研究領(lǐng)域之一。相比神經(jīng)網(wǎng)絡(luò)和其他方法,SVM具有更強大的理論基礎(chǔ),該方法具有全局優(yōu)化,泛化能力和對測量不敏感的優(yōu)點。與線性模型相比,線性學(xué)習(xí)機不僅增加了計算復(fù)雜度,而且在一定程度上避免了“維度災(zāi)難”。所有這些都與內(nèi)核函數(shù)的擴展和計算理論有關(guān)。SVM算法包括諸如VC測量理論,最小化結(jié)構(gòu)風(fēng)險的可能性以及概括的能力等概念。主要思想是基于學(xué)習(xí)統(tǒng)計理論中的VC測量理論,接受了最小化結(jié)構(gòu)風(fēng)險的標(biāo)準(zhǔn),并且他的推廣能力很強,尤其在處理小樣本數(shù)據(jù)和高維數(shù)據(jù)的情況下,由于核函數(shù)的種類和組合的多樣性,使得SVM能夠構(gòu)建不同類型的超平面來滿足符合訓(xùn)練集數(shù)據(jù)的分布模式,因此,支持向量機是機器學(xué)習(xí)領(lǐng)域的一個重要的突破和進程。在了解支持向量機之前,統(tǒng)計理論的基礎(chǔ)知識必不可少,因此統(tǒng)計理論的基本概念和知識如下所述。3.1支持向量機基本理論3.1.1支持向量線性分類支持向量機的線性分類問題等價于一個二分類問題,x表示數(shù)據(jù)點,x是n維向量,中的T為向量轉(zhuǎn)置,y來表示類別,同時也表示標(biāo)簽,y的值為1或者-1,這兩個值分別代表兩個不同的種類。線性分類器的學(xué)習(xí)目標(biāo)是找到被分類到多維數(shù)據(jù)空間的超平面,其方程可以表示為:

(3.1)

圖3.1線性分類從上面的圖片可以看出,紅線將紅點和藍點分開,紅線是上面提到的超級藍線,換言之,超平面將所有的數(shù)據(jù)點分為兩類,分別用不同顏色表示,即紅色與藍色,超平面其中一測的數(shù)據(jù)點為y=-1,而另一測的數(shù)據(jù)點為y=1,則分類函數(shù)可以寫為:(3.2)如果f(x)=0,那么數(shù)據(jù)點x剛好在超平面上。對所有滿足f(x)<0的數(shù)據(jù)點,其對應(yīng)的y等于-1,而f(x)>0則對應(yīng)的數(shù)據(jù)點y=1。圖3.2分類函數(shù)將-1與+1分為兩類有時,或大多數(shù)情況下,數(shù)據(jù)不是線性可分的。此時,根本不存在滿足這些條件的超平面。當(dāng)SVM被分類時,數(shù)據(jù)點x被代入f(x),并且如果獲得的結(jié)果小于0,則分配類-1,并且如果它大于0,則分配類1。如果f(x)=0,那么哪個類別不是。函數(shù)間隔定義為:(3.3)上式,x是特征,y是結(jié)果標(biāo)簽(-1和+1),i表示第i個樣本,定義最小函數(shù)間隔如下式:(3.4)將向量w進行約束,使其規(guī)范化。引出幾何間隔的定義,該參數(shù)表示數(shù)據(jù)點到超平面的歐氏距離。將w和b歸一化,使用w/||w||和b/||w||分別替換原來的w和b,那么間隔就可以寫成(3.5)式(3.5)就被定義為幾何間隔,它是點到直線的距離公式。其中是w的范數(shù)。圖3.3和到達H的距離即為集合距離幾何間隔與樣本的誤分次數(shù)滿足如下不等式:誤分次數(shù)(3.6)這里,R是所有樣本中向量的最大值。這種錯誤分類是由于分類器的分類誤差所導(dǎo)致的。如式(3.6)所示,誤分次數(shù)的上限與幾何間隔成反比。幾何間隔越大,誤分次數(shù)越少,因此訓(xùn)練階段的目標(biāo)是最大限度地擴大幾何間隔。3.1.2分類函數(shù)的參數(shù)確定通過式(3.5)和(3.6)可知,當(dāng)幾何距離越大,誤分次數(shù)的上限越小,分類越精確,而幾何距離越大意味著去的最小值,所以只需要找出最小的即可,這也是一個優(yōu)化問題。但實際上對于這個目標(biāo),常常使用另一個完全等價的目標(biāo)函數(shù)來代替,那就是在約束條件內(nèi)取得最小值即為支持向量機所尋求的最優(yōu)化目標(biāo)。約束條件可分為等式約束與不等式約束,在有約束條件的最優(yōu)化求解過程中,得到的最優(yōu)解一定滿足約束條件等式或不等式。這表明樣本點必須在超平面H1或H2的某一側(cè)(或者至少在H1和H2上),而不能存在于兩者中間。在這里將固定為1,這表明在所有的樣本點中,最小間隔為1。同時也說明了其他點間隔都大于1,根據(jù)間隔的定義,滿足這些條件就相當(dāng)于讓下面的式子總是成立:(3.7)因此,該問題等價于如下最優(yōu)化問題,即不等式約束的最小化問題:(3.8)很顯然確定了w(也就求出了b),那么中間的直線H就是已知的,那么和也就明確了。通過拉格朗日數(shù)乘法的解,w可以表示為樣本的某種組合:(3.9)其中被稱為拉格朗日乘子,是樣本點,是標(biāo)簽(-1和+1),上式也可以通過求和符號被寫為:(3.10)則g(x)表達式可以被寫為:(3.11)(3.12)這里,將求解w的問題轉(zhuǎn)化為求解。3.2核函數(shù)3.2.1常用核函數(shù)核函數(shù)[28,29]用小空間的核函數(shù)代替大空間中的內(nèi)積運算,它在非線性映射能力中起著決定性的作用。矢量支持回歸模型并解決了“維度災(zāi)難”的問題。為了建立一個具有良好預(yù)測效果的回歸模型,我們必須選擇合適的核函數(shù)。核函數(shù)的選擇也是支持向量中搜索的熱點,但它不存在有效選擇細胞核功能的原理或方法。通常,為了為SVM模型選擇合適的核函數(shù),可以根據(jù)專家的先驗知識選擇,或者可以逐個使用實驗方法。就模型內(nèi)核函數(shù)的選擇而言,現(xiàn)在有四種核函數(shù)可供使用:線性核函數(shù)(3.13)多項式核函數(shù)(3.14)多層感知機核函數(shù)(3.15)徑向基核函數(shù)(3.16)這些核函數(shù)大致分為大域核函數(shù)和局部核函數(shù),大域核函數(shù)通化能力強,但是學(xué)習(xí)能力弱。線性和多項式核函數(shù)屬于此類。散射基函數(shù)(RBF)和多層感測器核函數(shù)屬于此類。這四種類型的內(nèi)核函數(shù)各有優(yōu)缺點,它們相互補充,因此混合內(nèi)核函數(shù)在某些情況下十分重要。核函數(shù)的作用是將兩個低維空間的向量經(jīng)過某種變換,投影到高維空間并計算其向量的內(nèi)積值。根據(jù)前文所述的線性分類器,它的形式是:(3.17)現(xiàn)在這是高維空間中的線性函數(shù)(在低維和高維空間中區(qū)分函數(shù)和向量,更改函數(shù)的名稱并用x’替換x),可以在低維空間中使用函數(shù)代替,(3.18)f()和g(x)里的,y,b全都是一樣的。也就是說,雖然給定的問題是線性不可分的,但很難將其解決為線性問題,但在求解過程中,當(dāng)需要內(nèi)部產(chǎn)品時,使用您選擇的核函數(shù)。由此獲得的α與你選擇的核函數(shù)組合以獲得分類器。3.2.2組合核函數(shù)設(shè)與是上的核函數(shù),則下面核函數(shù)的組合為核函數(shù):(3.19)(3.20)(3.21),其中是任意的正實數(shù)(3.22)根據(jù)核的基本性質(zhì),當(dāng)核用于簡單的線性組合運算時,會出現(xiàn)新的復(fù)合核。此外,如果內(nèi)核被正確轉(zhuǎn)換,也可以生成滿足應(yīng)用程序要求的新內(nèi)核。因此,可以得到兩種簡單的核函數(shù)造方法[30]。修改基本核函數(shù)的核參數(shù)構(gòu)造核函數(shù)每個基本核功能都有自己的參數(shù),代表著不同的物理意義,在實際遇到的問題中,常常有不符合要求的參數(shù),例如,在文本分類中,高斯核功能的恒定核寬度無法將其區(qū)分開來。為應(yīng)對這一問題,建議對不同樣品的屬性特性進行調(diào)整,以增強高斯核功能:(3.23)類似的改進型高斯核函數(shù):(3.24)上述構(gòu)建核函數(shù)的方法是分析樣本數(shù)據(jù)的特征,根據(jù)自己的經(jīng)驗增加或改變反映樣本間信息的核參數(shù),并采取適當(dāng)?shù)恼{(diào)整間隔,使新核函數(shù)可用于實際任務(wù)。更改參數(shù)以匹配樣本的特征,以提高廣義核函數(shù)的性能。然而,這只是一個微觀和局部的調(diào)整,并沒有改變原核功能的原始性質(zhì),如(3.23)和(3.24),雖然它可以更好地反映樣本之間的信息,但它仍然屬于本地核心不會增加內(nèi)核函數(shù)的整體性能。利用若干基本核函數(shù)的簡單組合構(gòu)造核函數(shù)對于某些基本內(nèi)核函數(shù),內(nèi)核函數(shù)具有閉合動作規(guī)則,因此可操作性能更高的結(jié)合內(nèi)核函數(shù)來構(gòu)成,可組合多項式核函數(shù)和高斯核函數(shù)來制作新的核函數(shù)。(3.25)對高斯核功能的研究表明,高斯核功能結(jié)構(gòu)復(fù)雜,不利于應(yīng)用其快速分類特性和低誤差率。此外,由于高斯核功能有兩個缺陷,它通過改進高斯核心的功能并有效地克服高斯核心功能的兩個缺點,同時保持其四個原始特征,進一步提高了核心功能的性能。高斯核函數(shù)表達式:(3.26)其中高斯核帶寬是唯一一個參數(shù),傳統(tǒng)的高斯核函數(shù)支持向量機是通過控制懲罰系數(shù)C和高斯核帶寬來調(diào)整SVM的性能與分類能力。根據(jù)先前的研究,調(diào)節(jié)這兩個參數(shù)是無效的,這不能改善高斯核心功能中固有的缺陷。因此,他的想法可以提供滿足第一和第二條件的核函數(shù)。他試圖將距離方程放在指數(shù)函數(shù)的分母中。這允許核心功能保持遠離控制點的某個衰減速率。因此,內(nèi)核函數(shù)最初構(gòu)造為:(3.27)其中為核函數(shù)的帶寬,該參數(shù)的值可以通過交叉驗證法逐步迭代求取最優(yōu)解而獲得。以核函數(shù)為基礎(chǔ)的定性曲線可以同時滿足這兩個條件,因為當(dāng)樣品的價值往往是無限的時,該函數(shù)的降解可能相對緩慢。將核心偏移參數(shù)和校正值分別列出,以適用偏轉(zhuǎn)調(diào)整,并調(diào)整核心功能的限度。(3.28)另外,通過乘以系數(shù)G來控制核函數(shù)的幅度變化,通過調(diào)整幅值G的大小來觀察核函數(shù)的復(fù)制對分類的影響。因此,式(3.28)可以進一步的被寫為下式:(3.29)其中,為新核函數(shù)的帶寬變量、為位移參數(shù),而則是函數(shù)的微調(diào)變量。參數(shù)和參數(shù)可以通過交叉驗證求得其最優(yōu)解。當(dāng)核函數(shù)遠離測試點時,公式(3.29)的構(gòu)造不能保持一定的衰減速度,數(shù)據(jù)測試的精度不理想。3.2.3本文的組合核函數(shù)本文用自定義的核函數(shù)進行SVM的分類識別,使用了一個線性核linear和一個多項式核polynoial的組合形式,二者權(quán)系數(shù)之和為1。參照式(3.13)和(3.14)。推導(dǎo)出自定義核函數(shù)為:(3.30)第四章給出使用該自定義核函數(shù)做泄漏檢測與定位的仿真實驗的實驗精確度的效果,通過合理的討論選取的值來調(diào)整泄漏檢測的精確度。組合核函數(shù)的組合方式以及組合類別有很多種,本文使用的是式(3.30)自定義和函數(shù)。組合核函數(shù)相當(dāng)于對核函數(shù)的一種改進,通過改進核函數(shù)的方式提高分類精度是本文主要研究的內(nèi)容。3.3損失與懲罰因子C現(xiàn)在有另一個訓(xùn)練集,只有一個樣本大于原始訓(xùn)練集。在與多維空間匹配(當(dāng)然,使用相同的核心函數(shù))后,還有另一個樣本點,但此樣本的位置是:圖3.4帶有噪聲的分類圖中陰影的點是負類的一個樣本例子,這一獨特的樣品使線性分界線問題具有線性和不可分割性,類似的問題(只有幾個不可分割的線性分界線)被描述為“近似線性分界線”問題。由于噪聲的存在,該樣本點的分類結(jié)果出現(xiàn)了誤差。因此,人們只是忽略這個采樣點并仍然使用原始分類器,這不會以任何方式影響效果。但這種對噪聲的容錯是由人類思維造成的,而且程序沒有這種思維。由于原始的優(yōu)化問題,我們必須考慮所有的示例點,基于此我們尋找正類和負類之間的最大幾何距離。幾何區(qū)間本身表示非負的距離,如上所述。嘈雜的情況使整個問題無法解決。但解決方案也非常明顯,就是要遵循人類的思想,允許某些點對不符合原始要求的距離平面進行分類。最接近分類表面的點采樣函數(shù)的間隔也大于1.如果需要輸入容錯,設(shè)置松弛變量在閾值范圍之內(nèi),即允許(3.31)因為松弛變量是非負的,所以最終結(jié)果是所需的間隔可能會小于1。然而,如果某些點似乎小于1(也被稱為異常值),這意味著你已經(jīng)具體說明了這些點的確切分類,這對分類來說是一種損失。然而,具體說明這些點的好處是,分類圖不必沿著這些點的方向移動??梢缘贸龈蟮膸缀尉嚯x(在一個較低的空間中,分配的限度較低),顯然必須平衡這些損失和利益,其好處顯而易見,分類間隔越長,效率越高。由式(3.8)可以看出,為我們所尋找的目標(biāo)函數(shù),通過之前的分析,我們希望該值越小越好,因為損失與其成反比例關(guān)系,其損失定義為。其中l(wèi)是樣本數(shù),若目標(biāo)能夠允許一定的損失存在,則需要添加懲罰因子作為損失的系數(shù)(cost為libSVM的參數(shù)中的C),原始優(yōu)化問題變?yōu)橐韵拢海?.32)3.4支持向量機的多類分類有許多不同的方法可以解決分類幾個類的問題。以下是兩種基本方法:一對一的多分類算法該算法確定了兩種可能的N級分離器,每一類分離器只訓(xùn)練了兩個N級培訓(xùn)樣品,可在試驗數(shù)據(jù)樣品分類中建立一個N(N-1)/2子類,將這些分類器結(jié)合起來,采用“投票法”。測試樣本x被輸入到由m類樣本和n類樣本構(gòu)成的兩個分類器中,如果分類函數(shù)(3.33)如果x的輸出結(jié)果屬于m類別,則會向m類別添加一個投票;如果屬于n類別,則會向n類別添加一個投票。在所有n(n-1)/2分類器對測試樣本x進行分類之后,n個類中的哪一個獲得最多的投票(max-wins),我們就可以決定測試樣本x屬于哪個類別。這種多分類算法的主要缺點是:子分類器太多,需要在測試中對這兩個類進行比較,結(jié)果導(dǎo)致訓(xùn)練和測試中的分類時間較長,訓(xùn)練速度隨類數(shù)的增加呈指數(shù)級下降;在測試分類中,由于子分類器數(shù)量多,訓(xùn)練速度隨類數(shù)的增加呈指數(shù)級下降。當(dāng)一個或兩個類別的得票數(shù)相同時,不可能確定屬于哪個類別,這可能導(dǎo)致分類錯誤。根據(jù)前面幾節(jié)介紹的二分類算法,優(yōu)化后可建立第m個分類器的分類輸出函數(shù)為(3.34)通過將N類數(shù)據(jù)中每一類數(shù)據(jù)與除了自己本身之外的所有類別總和視為一次二分類實驗,這樣一來,通過對每一個類別進行二分類最后達成對N類數(shù)據(jù)的多分類實現(xiàn)。這種算法在計算復(fù)雜度上相對較高,運算速度較慢,但是分類有效,且分類精度可靠。這種多分類算法的主要缺點是:1)當(dāng)構(gòu)造兩種類型的分類器中的每一種時,所有類型的訓(xùn)練樣本N必須參與操作。訓(xùn)練樣本的數(shù)量大并且訓(xùn)練困難。為了確定測試樣品的類型。因此,當(dāng)訓(xùn)練樣本數(shù)量l和類別數(shù)量N較大時,訓(xùn)練和測試的分類較慢,并且對計算資源的要求仍然很高,特別是對于實時應(yīng)用。2)當(dāng)測試樣本不屬于N類和其他類別中的任何一類時,會發(fā)生分類錯誤。因為,根據(jù)“比較方法”,N個分類器之一的輸出是最大的,并且不屬于任何N個類的測試樣本被錯誤地認(rèn)為是與分類器對應(yīng)的類。最大的出口。他的晉升錯誤是無限的。3.5本章小結(jié)本章簡單介紹了SVM的基本原理與數(shù)學(xué)推導(dǎo),講述了如何確定分類函數(shù)及懲罰因子,并給出了四種核函數(shù)以及多種組合核函數(shù)供參考,同時由于SVM是二分類器,在有些場合需要的是多分類,因此介紹了多分類器。接下來的章節(jié)主要介紹基于SVM的水系統(tǒng)泄漏及定位的仿真環(huán)境及實驗結(jié)果。

漏點定位算法分析與仿真研究4.1EPANET仿真軟件EPANAT在模擬供水管網(wǎng)的供水模式,時間推移模式,漏損情況以及水質(zhì)和管道老化程度上具有相對較高的可靠性,在EPANET中,只需輸入各個節(jié)點與管道的實際參數(shù),便能模擬出與實際相符的隨時間變化的壓力數(shù)據(jù)和流量數(shù)據(jù),這些數(shù)據(jù)對支持向量機的泄漏定位判斷至關(guān)重要,因此,EPANET在研究供水管網(wǎng)泄漏定位具有十分重要的意義。EPANET的發(fā)展目的是提高對配水系統(tǒng)中遷移和物質(zhì)轉(zhuǎn)換規(guī)律的理解。它可以實施多種不同類型的配水系統(tǒng)分析,開發(fā)取樣程序,驗證水力模型,分析余氯,評估用戶影響,例如EPANET。有助于評估系統(tǒng)水質(zhì)整體改善的各種控制策略可能包括。1.改變多水源供水系統(tǒng)的水源配置;2.更改提升泵和注入/排出池水的時間表;3.水處理的的方案與措施;4.保持管道的清潔并方便更換。在Windows環(huán)境中,EPANET可以顯示管道內(nèi)壓力與流量的輸入數(shù)據(jù),提供水力、水質(zhì)模擬及計算結(jié)果的功能。結(jié)果以管線網(wǎng)絡(luò)圖、數(shù)據(jù)表、時間序列的形式精確的給出相關(guān)模擬數(shù)據(jù)。4.2對EPANET的仿真應(yīng)用及數(shù)據(jù)提取通過實際測量的數(shù)據(jù),比如說水庫、水泵、節(jié)點、管道、閥門、水池,可以在EPANET中繪制出模擬的供水管網(wǎng)的仿真圖。各個管段以及節(jié)點的參數(shù)隨著時間的變化而變化,可以自行調(diào)整時間與水分配的時間比例,還可以控制水泵的射程來提供供水量,在每個節(jié)點處可以是用戶,也可能是泄漏,這取決于用戶在節(jié)點處是否設(shè)置擴散器系數(shù)。對于數(shù)據(jù)的提取,可以獲得某一時刻的任意節(jié)點的數(shù)據(jù)。不僅如此,還可以獲得任意時間某一節(jié)點的數(shù)據(jù)。除此之外,還可以觀測到想得到的數(shù)據(jù)關(guān)于時間的波形圖,這有助于支持向量機對數(shù)據(jù)的依賴。4.3擴散器擴散器與管道中的節(jié)點相連接,通過噴嘴以及其他形式將流量排出。經(jīng)過擴散器的液體與氣體的流量與壓力之間的關(guān)系如下:(4.1)式中q為流量,p為壓強,C為流量系數(shù),γ為壓強指數(shù)。對于噴嘴,γ采用0.5。廠家常常提供了流量系數(shù)的數(shù)值。放大器用于模擬噴嘴系統(tǒng)和灌溉網(wǎng)絡(luò)的水流,也可以模擬連接已連接節(jié)點的管道滲漏,或計算連接節(jié)點的火災(zāi)流量(在確定的最低殘留壓力下可得)。對于壓力目標(biāo)等效的水,將使用非常高的通量系數(shù)(例如,預(yù)計最高流率為100次),并將改變連接點的得分。EPANET將放大器作為連接點的一個屬性,而不是作為管道網(wǎng)絡(luò)的一個單獨組成部分。通常在模擬泄漏時,往往需要調(diào)整擴散器系數(shù)的值。4.4仿真實驗4.4.1強泄漏分析該仿真實驗結(jié)合EPANET和MATLAB共同實現(xiàn),通過EPANET獲取數(shù)據(jù),并通過MATLAB程序?qū)崿F(xiàn)SVM分類別判斷是否殘生泄漏以及泄漏的節(jié)點位置。先對于強泄漏情況進行分析,在第二章提到,泄漏流量閾值設(shè)為10GPM,在泄漏節(jié)點3處的壓力值為118.55pa。由式(4.1)可計算出閾值擴散器系數(shù)C為0.9184,本文在強泄漏情況下設(shè)置擴散器系數(shù)為3(大于0.9184),用EPANET搭建下圖管網(wǎng):圖4.1仿真管網(wǎng)圖中菱形節(jié)點3是仿真模擬的泄漏節(jié)點,首先制造訓(xùn)練集。分別采集泄漏前與泄漏后的10個節(jié)點的壓力數(shù)據(jù)作為訓(xùn)練集,其中每組數(shù)據(jù)的壓力數(shù)據(jù)隨著時間的變化而變化。這樣就得到20組訓(xùn)練數(shù)據(jù)作為訓(xùn)練集。緊接著,繼續(xù)選取泄漏前與泄漏后的8個節(jié)點的壓力數(shù)據(jù)作為測試集(測試集數(shù)據(jù)考慮誤差),這樣就擁有了16組測試集數(shù)據(jù)。分別給出它們的標(biāo)簽:未泄漏的標(biāo)簽為1,泄漏的標(biāo)簽為0。接下來利用MATLAB編寫程序通過SVM實現(xiàn)二分類,即泄漏與未泄漏兩種情況,實驗結(jié)果如下:圖4.2polynomial核函數(shù)分類結(jié)果圖4.2可以看到,對于強泄漏而言,利用SVM進行分類識別的有效性是較高的,正確率達到了100%,不過這也取決于所采用的核函數(shù)的類別,這里采用的是多項式核函數(shù)(polynomial,式(3.14))。然而其他核函數(shù)的分類結(jié)果卻不像多項式核函數(shù)那樣擁有完美的結(jié)果。圖4.3linear核函數(shù)分類結(jié)果從圖4.3中明顯看到linear核函數(shù)的分類效果遠不如polynomial核函數(shù)的性能,其正確率僅僅只有62.5%。這在實際應(yīng)用中是完全缺乏可信度的。圖4.4quadratic核函數(shù)的分類結(jié)果從圖4.4可以看出quadratic核函數(shù)的分類結(jié)果,相比linear核函數(shù)已經(jīng)改善了很多,可信度大大提高,正確率達到了81.25%??梢源笾屡袛嗍欠癞a(chǎn)生泄漏。不過還需要有待改善。圖4.5mlp核函數(shù)分類結(jié)果從圖4.5中可以看出,mlp核函數(shù)的分類效果不是很理想。幾乎不能分辨出任何泄漏。綜上,可以發(fā)現(xiàn)強泄漏情況下mlp和linear核函數(shù)不適合判斷供水管網(wǎng)是否存在泄漏的應(yīng)用當(dāng)中。不過發(fā)現(xiàn)polynomial核函數(shù)的分類效果最佳,因此,在弱泄漏的分析中,優(yōu)先考慮polynomial核函數(shù)。這里沒有分析組合核函數(shù)的性能,是因為polynomial核函數(shù)的分類效果已經(jīng)接近理想。接下來討論的弱泄漏情況需要考慮組合核函數(shù)的效果。4.4.2弱泄漏分析相比強泄漏來說,若泄漏擁有更小的擴散器系數(shù)。在仿真實驗中,設(shè)擴散器系數(shù)為0.7(小于0.9184)。仍然從EPANET中獲取泄漏與未泄漏的壓力數(shù)據(jù)各10組并組成訓(xùn)練集,然后再獲取泄漏與未泄漏的壓力數(shù)據(jù)各8組作為測試集(測試集數(shù)據(jù)考慮誤差)。然后利用MATLAB實現(xiàn)SVM分類并觀測實驗結(jié)果。圖4.6polynomial核函數(shù)分類結(jié)果圖4.6可以發(fā)現(xiàn),polynomial核函數(shù)對若泄漏情況下的分類效果比強泄漏的分類效果要差一些,正確率僅有81.25%,具有相對來說較好的可信度,不過實際應(yīng)用中,需要更加完善算法并進行優(yōu)化,提高真確率進而提高可信度。圖4.7linear核函數(shù)的分類結(jié)果圖4.7表明了linear核函數(shù)對若泄漏的分類效果正確率很低,僅為56.25%,沒有可信度,相比polynomial核函數(shù)相差甚多。圖4.8quadratic核函數(shù)分類結(jié)果圖4.8表明quadratic核函數(shù)的分類效果依然不是很好,正確率為62.5%,不予采納。圖4.9mlp核函數(shù)分類結(jié)果圖4.9顯示了mlp核函數(shù)的分類效果。正確率50%,分類效果很差,遠不如polynomial核函數(shù)的效果。綜上,弱信號泄漏檢測時,polynomial核函數(shù)的分類效果優(yōu)越性最明顯,但是正確率也不是非常接近100%。這不難理解,因為處于弱泄漏的情況下,壓力大小變化的不是很明顯,因此受到分類誤差的影響分類效果有所下降,這就需要更進一步的完善SVM的算法。為此,采用本文的組合核函數(shù)可以提高分類的準(zhǔn)確率,甚至可以達到100%。圖4.10組合核函數(shù)不同參數(shù)值圖4.10可以看出,通過調(diào)整參數(shù)la的值,可以得到相應(yīng)的分類正確率,也就是說即便是弱泄漏情況,調(diào)整參數(shù)也可以達到100%的分類正確率。從以上分析得出,強泄漏的情況下分類效果更加明顯,而弱泄漏的情況下分類的正確率有所下降。通過分析也發(fā)現(xiàn)polynomial核函數(shù)對供水管網(wǎng)泄漏的判斷更有優(yōu)勢,盡管polynomial核函數(shù)優(yōu)勢明顯,但正確率依然不夠好,但是使用組合核函數(shù)可以提升分類的可靠性,精確度可以達到100%,這對于在供水管網(wǎng)的弱泄漏判別方面有著很大的提升。4.5泄漏定位在EPANET中設(shè)置了3號節(jié)點為泄漏點,并給定相應(yīng)的擴散器系數(shù)。但是,在收集訓(xùn)練集數(shù)據(jù)的時候,將選取幾點可能的泄漏點并且分別依次給定擴散器系數(shù),把每一個節(jié)點泄漏時所有節(jié)點的壓力數(shù)據(jù)都記錄下來,這樣得到一個數(shù)據(jù)量龐大的訓(xùn)練集,其中包含每一個選取節(jié)點泄漏時所有節(jié)點的壓力數(shù)據(jù)。然后選取3號節(jié)點為泄漏點,然后再次采集所有節(jié)點的的壓力數(shù)據(jù)作為測試集。由于SVM機器學(xué)習(xí)是二分類的分類器。而要做到泄漏定位必須定位到節(jié)點上,由于選取可能泄漏的節(jié)點個數(shù)遠大于2,所以要采用多分類的方法去定位泄漏的節(jié)點。選取好訓(xùn)練集和測試集之后,通過MATLAB實現(xiàn)SVM多分類,將泄漏節(jié)點標(biāo)注出來,實驗結(jié)果如下:(a)11號節(jié)點分類結(jié)果(b)13號節(jié)點分類結(jié)果(c)22號節(jié)點分類結(jié)果(d)31號節(jié)點分類結(jié)果(e)3號節(jié)點分類結(jié)果圖4.10泄漏節(jié)點定位結(jié)從圖4.10可以看出,利用SVM多分類方式準(zhǔn)確定位出了3號節(jié)點發(fā)生了泄漏。注意對22號節(jié)點壓力數(shù)據(jù)進行分類的時候產(chǎn)生了誤判,正確率為11%,最后使用最優(yōu)選取算法,將每一號節(jié)點分類正確的樣本點設(shè)為1,分類錯誤的樣本點設(shè)為0,構(gòu)成了5個向量,每個向量9個元素,分別取5個向量的范數(shù),范數(shù)最大的的向量組所對應(yīng)的節(jié)點號即為泄漏點標(biāo)號。該實驗驗證了利用SVM進行泄漏節(jié)點定位的有效性。4.6本章小結(jié)本章主要講述了基于EPANET和MATLAB的仿真實驗步驟及其結(jié)果分析。利用SVM方法先判斷泄漏是否發(fā)生,并討論了不同程度泄漏對實驗結(jié)果的影響。接下來又考慮了使用不同種核函數(shù)對實驗結(jié)果的影響。發(fā)現(xiàn)使用polynomial核函數(shù)的性能要更好一些,對于強泄漏判斷的正確率比較理想。對于弱泄漏正確率也達到了81.25%,大致上可信度可以接受。造成這種差別的原因是由于弱泄漏與未泄漏壓力值差距不大,導(dǎo)致SVM的誤判增多。不過使用組合核函數(shù)可以改善弱泄漏的判別正確率偏低的問題。最后又講述了對泄漏節(jié)點的定位實驗步驟以及實驗結(jié)果分析,發(fā)現(xiàn)基于SVM的供水管網(wǎng)節(jié)點泄漏定位是有效的,能準(zhǔn)確地定位出模擬的泄漏點。

第五章總結(jié)與展望支持向量機的研究從上個世紀(jì)90年代開始,發(fā)展到現(xiàn)在已經(jīng)有了三十多年的研究。其研究從理論方面的逐步轉(zhuǎn)向了工程應(yīng)用方向,支持向量機在小樣本的情況下,具有非常優(yōu)秀的學(xué)習(xí)性能。而城市供水管網(wǎng)的故障發(fā)生是小樣本事件,為了找出設(shè)備故障的發(fā)生情況,故SVM可以適用于該領(lǐng)域研究。本文主要研究的是將支持向量機機器學(xué)習(xí)方法應(yīng)用到供水管網(wǎng)泄漏判斷及其定位之中,并且利用EPANET和MATLAB等工具進行了仿真實驗。針對不同程度的泄漏做出詳細的分析與解釋,并對核函數(shù)以及組合核函數(shù)的性能進行分析。最后選用分類效果最佳的核函數(shù)應(yīng)用于供水管網(wǎng)泄漏檢測與定位中。通過以上實驗結(jié)果可以看出,將泄漏程度分成強泄漏和弱泄漏,然后進一步的檢測,強泄漏時采用polynomial核函數(shù)進行分類,精確度很理想;在弱泄漏的情況下,可以通過調(diào)整組合核函數(shù)的參數(shù)值來提高分類的精確度,最后利用SVM的多分類算法進行泄漏節(jié)點定位。遺憾的是,對實驗結(jié)果誤差的改善以及數(shù)據(jù)處理方面的能力有所欠缺。并且算法的準(zhǔn)確度仍有不足,在日后的研究當(dāng)中將重點關(guān)注算法的改進與優(yōu)化??杉尤脒z傳算法或粒子群算法優(yōu)化支持向量機,以及在數(shù)據(jù)采集方面,采用高效精準(zhǔn)的數(shù)據(jù)作為訓(xùn)練集,這樣也可以提高SVM的分類誤差以及運算速度。從而使機器學(xué)習(xí)在供水管網(wǎng)泄漏檢測定位的應(yīng)用中實用性更強。

參考文獻周東華,紀(jì)洪泉,何蕭.高速列車信息控制系統(tǒng)[J].自動化學(xué)報,2018,44:1-12.MEHRARK,PESCHON,J.INNOVATIONSAPPROACHTOFAULTDETECTIONANDDIAGNOSISINDYNAMICSYSTEMS[J].AUTOMATICA,1971,Vol7(5):637-&.周東華,葉銀忠.現(xiàn)代故障診斷與容錯控制[M].北京:清華大學(xué)出版社,2000.HuilingC,BoY,GangW,SujingW,JieLiu,Dayou.SupportVectorMachineBasedDiagnosticSystemforBreastCancerUsingSwarmIntelligence[J].Jouralofmachinesystem,2012,36:2505-2519.LIXiaodong,ZENGGuangming.FaultDiagnosisofWWTPBasedonImprovedSupportVectorMachines[J].JournalofHunanUniversityNatureSciences,2007,12:68-71.鄧乃揚,田英杰.數(shù)據(jù)挖掘中的新方法—支持向量機[M].北京:科學(xué)出版社,2004,10:30-31.楊世鳳,高相銘,胡瑜.給水管網(wǎng)實時故障診斷的支持向量機模型[J].震動、測量與診斷,2011,31:11-14.韓陽,王威.給水管網(wǎng)實時故障診斷的支持向量機模型[J].計算機技術(shù),2007,33:109-112.Linannan,Qiezhihong.PSO-SVMmodelforpipeburstingdiagnosisofwatersupplynetwork[J].SystemEngineeringTheoryandPractice,2012,33:2104-2110.卿宇博,莫學(xué)芳,吳上海.故障診斷技術(shù)綜述及其發(fā)展趨勢[R].軍事物流,2012,11:122-124.張曦,閆威武,劉振亞,邵惠鶴.基于核主元分析和鄰近支持向量機的汽輪機凝氣器過程監(jiān)控和故障診斷[J].中國電機工程學(xué)報,2007,14:56-61.袁勝發(fā),褚福磊.支持向量機及其在機械故障診斷中的應(yīng)用[J].振動與沖擊,2007,11:29-35+58+181.CHENyanlong,ZHANGpeilin.BearingFaultDiagnosisBasedOnDCTandGA-SVM[J].Computerengineering,2012,38:247-250.LianJunqiang,JiaoZiping,RenTing.ResearchonFaultDiagnosisofServoSystemofNavalGunBasedonSVM-ANNHybridModel[J].ShipElectronicEngineering,2008,9:77-80.胡清,王榮杰,詹宜巨.基于支持向量機的電力電子電路故障診斷技術(shù)[J].中國電機工程學(xué)報,2008,12:107-111.鄭蕊蕊,趙繼印,趙婷婷,李敏.基于遺傳支持向量機和灰色人工免疫算法的電力變壓器故障診斷[J].中國電機工程學(xué)報,2011,07:56-63.V.Vapnik.ThenatureofstatisticallearningTheory[M].NY:Spring-Verlag,1995.CortesC,VapnikV.Support-vectornetworks[J].MachineLearning,1995,20(3):27-297.AmericanWaterWorksAssociation.WaterAuditsandLeakDetection[J].ManualofWaterSupplyPracticesM36,AmericanWaterWorksAssociationDenver,CO,1999.UKWaterIndustryResearch,ManualofDMAPractice,UKWaterIndustryResearchLimited,LondonU.K1999.Hunaidi,O,Chu,W,Wang,A,andGuan,W.DetectingleaksinPlasticWaterDistributionPipes[J].2000.徐新旋.相關(guān)儀的運用[J].地下管線管理[M].1998,3:37-40.雷林源.城市地下管線探測與泄漏[M].北京:冶金工業(yè)出版社,2003.王繼明,楊昌彬.淺淡漏水聽音原理及在實驗中的應(yīng)用[J].地下管線管理,2002,3:38-39.李立光,李文建.相關(guān)檢漏儀的原理及應(yīng)用[J].地下管線管理,1998,3:37-40.Thisarticlehasbeenacceptedforpublicationinafutureissueofthisjournal,buthasnotbeenfullyedited.Contentmaychangepriortofinalpublication.Citationinformation:DOI10.1109/TIE.2017.2764861,IEEETransactionsonIndustrialElectronics.CortesC,VapnikV.Support-vectornetworks[J].MachineLearning,1995,20(3):27-297.郭麗娟,孫世宇,段修生.支持向量機及核函數(shù)研究[J].科學(xué)技術(shù)與工程,2008,8(2):487-489.李盼池,許少華.支持向量機在模式識別中的核函數(shù)特性分析[J].計算機工程與設(shè)計,2005,26(2):302-306.鄭艷秋,江濤.混合核函數(shù)SVM在融資風(fēng)險評估中的應(yīng)用[J].統(tǒng)計與決策期刊,2018,5:74-77.

附錄%泄漏檢測clc;clear;X=xlsread('訓(xùn)練集.xlsx','B1:Z20');label=xlsread('01.xlsx','A1:A20');T=xlsread('測試集.xlsx','A1:Y16');traindata=X(1:20,:);testdata=T(1:16,:)%1type1=ones(10,1);type2=zeros(10,1);groups1=[type1;type2];test_label1=label(3:18,1);svmModel1=svmtrain(traindata,groups1,'kernel_function','polynomial');predict1=svmclassify(svmModel1,testdata);figureplot(1:length(test_label1),test_label1,'r-*')holdonplot(1:length(test_label1),predict1,'b:o')gridonlegend('真實類別','預(yù)測類別')xlabel('測試集樣本編號')ylabel('測試集樣本類別')title(string)fprintf('使用svmclassify,正確率:%f\n',sum(predict1==test_label1)/size(test_label1,1));%泄漏定位clc;clear;X=xlsread('44.xlsx','A2:I46');label=xlsread('label.xlsx','A1:B9');T=xlsread('55.xlsx','A1:I9');traindata=X(1:45,:);testdata=T(1:9,:);%1type1=zeros(9,1);type2=ones(36,1);groups1=[type1;type2];test_label1=label(1:9,1);svmModel1=svmtrain(traindata,groups1,'kernel_function','polynomial');predict1=svmclassify(svmModel1,testdata);%2type1=ones(9,1);type2=zeros(9,1);type3=ones(27,1);groups2=[type1;type2;type3];test_label2=label(1:9,1);svmModel2=svmtrain(traindata,groups2,'kernel_function','polynomial');predict2=svmclassify(svmModel2,testdata);%3type1=ones(18,1);type2=zeros(9,1);type3=ones(18,1);groups3=[type1;type2;type3];test_label3=label(1:9,1);svmModel3=svmtrain(traindata,groups3,'kernel_function','polynomial');predict3=svmclassify(svmModel3,testdata);%4type1=ones(27,1);type2=zeros(9,1);type3=ones(9,1);groups4=[type1;type2;type3];test_label4=label(1:9,1);svmModel4=svmtrain(traindata,groups4,'kernel_function','polynomial');predict4=svmclassify(svmModel4,testdata);%5type1=ones(36,1);type2=zeros(9,1);groups5=[type1;type2];test_label5=label(1:9,1);svmModel5=svmtrain(traindata,groups5,'kernel_function','polynomial');predict5=svmclassify(svmModel5,testdata);Y1=sqrt(dot(predict1,predict1));Y2=sqrt(dot(predict2,predict2));Y3=sqrt(dot(predict3,predict3));Y4=sqrt(dot(predict4,predict4));Y5=sqrt(dot(predict5,predict5));M=[Y1;Y2;Y3;Y4;Y5];[reselt,number]=min(M);fprintf('使用svmclassify,泄漏點標(biāo)號:%d\n',number);figureplot(1:length(test_label1),test_label1,'r-*')holdonplot(1:length(test_label1),predict1,'b:o')gridonlegend('真實類別','預(yù)測類別')xlabel('測試集樣本編號')ylabel('測試集樣本類別')title(string)fprintf('使用svmclassify,11號節(jié)點泄漏正確率:%f\n',sum(predict1==test_label1)/size(test_label1,1));figureplot(1:length(test_label2),test_label2,'r-*')holdon

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論