支持向量機在輸電線路故障識別中的應(yīng)用研究_第1頁
支持向量機在輸電線路故障識別中的應(yīng)用研究_第2頁
支持向量機在輸電線路故障識別中的應(yīng)用研究_第3頁
支持向量機在輸電線路故障識別中的應(yīng)用研究_第4頁
支持向量機在輸電線路故障識別中的應(yīng)用研究_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

密級 分類號密級 UDC 碩士學(xué)位論文支持向量機在輸電線路故障識別中的應(yīng)用研究學(xué)位申請人:馬新明學(xué)科專業(yè):電力系統(tǒng)及其自動化指導(dǎo)教師:王成江副教授ADissertationSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceinEngineeringResearchonApplicationofSupportVectorMachineinFault

IdentificationforTransmissionlinesGraduateStudent:MaxinmingMajor:PowerSystemanditsAutomationSupervisor:Associateprof.WangchengjiangChinaThreeGorgesUniversityYichang,443002,P.R.China

May,2010#引言電力輸電線路發(fā)生各種故障后,要求能夠準確、快速地識別出所發(fā)生故障的類型,通常的做法是依據(jù)相應(yīng)的邏輯關(guān)系設(shè)置門檻值來實現(xiàn)。然而發(fā)生故障時所獲取的電壓、電流信息一般都是受運行方式、故障位置和故障時刻等各種因素的影響,從而使整個故障數(shù)據(jù)類型一般是非線性可分的,各種故障數(shù)據(jù)之間通常不具有顯著的線性劃分界限。并且這些方法在數(shù)據(jù)預(yù)處理方面步驟較多,一旦其中某一環(huán)節(jié)出錯,則對最后的分類帶來很大的誤差,而且前期數(shù)據(jù)處理過程多則意味著到最終分類的速度會變慢,這對輸電線路發(fā)生故障后準確、迅速地識別故障類型是不利的,所以基于門檻值的邏輯判別方法就存在一定的缺陷。本文在充分研究支持向量機(SVM二叉樹多分類的基礎(chǔ)上,結(jié)合輸電線路故障的特點,考慮不同故障發(fā)生的優(yōu)先級后,設(shè)計基于 SVM勺改進二叉樹輸電線路故障分類器,借助它可以利用歸一化后的短路電流數(shù)據(jù)和短路電壓數(shù)據(jù)直接進行輸電線路故障分類。通過仿真和編程驗證,該方法處理過程簡單、分類步驟少和分類正確率高等優(yōu)點。1緒論課題研究的目的和意義隨著現(xiàn)代電力網(wǎng)絡(luò)規(guī)模的不斷擴大,確保供電的可靠性和連續(xù)性是電力系統(tǒng)安全穩(wěn)定運行的關(guān)健問題。輸電線路作為輸電系統(tǒng)中的樞紐干線,在電力系統(tǒng)中起著重要作用,其故障直接威脅著現(xiàn)代電力系統(tǒng)的安全運行,且引起的經(jīng)濟損失也越來越大。在電力系統(tǒng)發(fā)生事故的情況下,正確而快速的故障診斷,對于電力系統(tǒng)的恢復(fù)決策,提高供電可靠性具有重要意義[1,2],這也是國內(nèi)外對電力系統(tǒng)故障診斷課題廣泛研究的原因。社會的發(fā)展推動著電力工業(yè)和輸電線路的不斷發(fā)展,隨著電力負荷的不斷增大,現(xiàn)代電力系統(tǒng)需要將大容量的電能輸送到負荷中心。輸配電系統(tǒng)是電力系統(tǒng)的重要組成部分,是發(fā)電廠與電力用戶之間輸送電能與分配電能的中間環(huán)節(jié),包括各電壓等級的輸電線路和變電所,它們擔(dān)負著輸送電力的重要任務(wù)。隨著社會的進步,用戶對電能的可靠性特別是連續(xù)性的要求越來越高,然而電力系統(tǒng)的故障卻是不可避免的,為了快速監(jiān)測及消除故障確保系統(tǒng)安全穩(wěn)定運行、增強供電的可靠性和連續(xù)性,就需要一個優(yōu)質(zhì)的故障診斷系統(tǒng)快速實現(xiàn)輸電線路的故障定位和故障類型識別,以便于檢修和事故后的快速恢復(fù)。電力系統(tǒng)的任何地方都可能發(fā)生故障,而高壓和超高壓輸電線是經(jīng)常會發(fā)生故障的重要環(huán)節(jié)。高壓輸電線路是電力系統(tǒng)的命脈,其故障直接著威脅電力系統(tǒng)的安全運行。由運行經(jīng)驗統(tǒng)計表明,它是系統(tǒng)中故障率較高的設(shè)備,這是由它們所處的運行環(huán)境決定的。因為高壓和超高壓輸電線路輸電距離長,所穿越地區(qū)的地形往往比較復(fù)雜,運行環(huán)境較為惡劣,輸電線路有時還會因雷電等過電壓引起閃絡(luò),或者樹木及鳥類以及人類活動等造成導(dǎo)體與導(dǎo)體之間、導(dǎo)體與地之間的短時接觸,形成瞬時性故障。在高壓輸電線路發(fā)生故障后,為了減少停電帶來的損失,要求電力維修人員能夠迅速到達現(xiàn)場,檢修電路,恢復(fù)供電,而進行恢復(fù)處理的前提是準確而快速的檢測出故障原因、故障設(shè)備、故障類型以及故障位置。在輸電線路的故障診斷中,專業(yè)人員的經(jīng)驗和所掌握的專業(yè)知識對快速診斷故障起著決定性的作用,但是隨著現(xiàn)代電力系統(tǒng)的復(fù)雜化和自動化程度的不斷提高,一旦發(fā)生故障,在很短的時間內(nèi)會有大量的報警信息傳入控制中心[3,4],僅靠一、二位專家的經(jīng)驗往往難以進行快速、準確的故障診斷,并盡快解決。其次,單純依靠人工全線檢查故障有時是極其困難并且是非常費時的,所以必須要求在輸電線路發(fā)生故障時,采取有效的方法,準確而迅速地判斷故障類型。本論文在充分研究支持向量機多分類的基礎(chǔ)上,結(jié)合輸電線路故障的特點,考慮不同故障的優(yōu)先級后,設(shè)計基于SVM勺輸電線路故障分類器,借助它可以利用歸一化后的短路電流數(shù)據(jù)和短路電壓數(shù)據(jù)直接進行輸電線路故障分類。該分類器的數(shù)據(jù)預(yù)處理過程簡單,分類步驟少,而且故障類型的識別不受故障過渡電阻、故障位置的影響,可以實現(xiàn)輸電線路故障的快速分類。因此該課題研究具有重要的科學(xué)意義和應(yīng)用前景。國內(nèi)外研究現(xiàn)狀目前傳統(tǒng)的輸電線路的故障類型識別主要有兩種方法[5,6,7]:一種是采用相電流差突變量選相,另外一種是穩(wěn)態(tài)故障量選相。相電流差突變量選相突變量選相中,利用相電流差突變量的選相原理有兩種:其中一種是采用正、負序故障電流序分量相對相位的關(guān)系來選相,這種選相原理是先假設(shè)正、負序電流分支系數(shù)相等,然后使得其推導(dǎo)過程簡化。該選相原理在選相過程中裕度角比較小,選相精度不是很夠,因此其可靠性比較低;而另一種是相電流差突變量選相元件,這種是利用單相接地故障時另外兩相的相電流差突變量為零這一特點而進行選相的。但前提是這只在正序和負序分支系數(shù)相等的情況下才能成立,如果正、負序分支系數(shù)不同則會對選相結(jié)果的影響比較大。目前普遍采用的相電流差突變量選相是在各種的不同故障時兩相工頻電流差的變化量幅值特征進行選相,再結(jié)合有無零序分量來區(qū)分是否兩相短路或者兩相短路接地。該方法在故障的初期靈敏度比較高,且不受負荷電流和過渡電阻的影響。但當(dāng)保護位置在弱電源側(cè)或者發(fā)生轉(zhuǎn)換性故障時,則其靈敏度就會不足甚至?xí)?dǎo)致誤選相。為了克服此類缺陷,可以采用相間電壓突變量選相,該方法具有相電流差突變量選相的部分特點,又彌補了其自身的不足,但是在較長的線路末端故障時會可能存在其靈敏度不足的問題。補償電壓(相補償電壓和相間補償電壓)突變量選相同時具有相電流差突變量的優(yōu)點和相間電壓突變量選相的優(yōu)點,其選相性能比較優(yōu)越,近年來也獲得了比較廣泛的應(yīng)用。穩(wěn)態(tài)故障量選相穩(wěn)態(tài)故障量選相又包括兩類,一類為阻抗選相,其方法主要依據(jù)阻抗測量元件的測量結(jié)果來確認不同故障相的,其在多數(shù)比較簡單的故障類型情況下能正確地進行故障類型的識別,但是卻會受到系統(tǒng)運行方式、故障點的過渡電阻的影響比較大。另一類方法是故障序分量選相,其實依據(jù)正序、負序及零序故障時的序分量電流相對于相位關(guān)系原理來進行故障類型的識別。這種方法受故障點過渡電阻的影響比較小,但是正序故障電流時的提取將會受到負荷電流的影響。目前在國內(nèi)數(shù)字式高壓線路保護中則主要采用突變量選相和穩(wěn)態(tài)量選相相結(jié)合的方法,其是利用突變量元件來作為保護啟動后的第一次選相元件,并且利用序電流的分區(qū)與阻抗比較的方法來作為振蕩閉鎖期間的故障選相元件。無論是穩(wěn)態(tài)故障量選相還是相電流差突變量選相,在原理上其都是設(shè)置基于門檻值方法,依據(jù)一定的邏輯關(guān)系去實現(xiàn)的。但是故障后所獲得的電壓、電流等信息會隨著系統(tǒng)的運行方式、故障的位置、故障點的阻抗和故障時刻等因素而發(fā)生變化,這將會導(dǎo)致整個故障模式識別空間一般都是非線性可分的。因此在基于門檻值的方法有可能不會適應(yīng)故障后的電流、電壓的信息的變化,亦可以說如果依據(jù)故障后電壓、電流或相位角等的信息來區(qū)分故障模式,則各種故障模式之間一般不具有明顯的線性分界線,由于其相關(guān)的因素比較復(fù)雜,不易用數(shù)學(xué)模型來進行理論的描述,所以設(shè)置基于門檻值的方法存在著一定的缺陷。隨著人工智能理論與技術(shù)的發(fā)展,人工智能為輸電線路的故障類型識別提供了一些新的方法。基于智能高新技術(shù)研發(fā)的各種高壓輸電線路故障分類器已經(jīng)有了不少的研究,在基于模糊理論輸電線路故障類型的識別方法中,將故障類型識別中的大量電氣信息量進行模糊處理,從而在一定的程度上改進了線性劃分方法中存在的局限性。支持向量機(SupportVectorMachine)是基于統(tǒng)計學(xué)習(xí)理論的基礎(chǔ)上提出的一種模式識別方法。它采用結(jié)構(gòu)風(fēng)險最小化原理(StructuralRiskMinimization)簡稱SRMM則,兼顧訓(xùn)練誤差和泛化能力,在解決非線性、小樣本等的模式識別問題中展現(xiàn)出一定的優(yōu)勢。文獻[7]用模糊邏輯規(guī)則對輸電線路故障先進行了分層歸類的處理,然后再利用它們之間的故障相別與相位角等的關(guān)系,設(shè)計出表示不同故障相別的樣本數(shù),最后利用SVM算法對樣本數(shù)據(jù)進行訓(xùn)練,得到可以識別出不同輸電線路故障類型的最優(yōu)分類面。文獻[8]是對發(fā)生短路后的三相短路電流信號進行分析計算,計算出每相的小波熵權(quán),然后對故障類型進行識別。因此基于支持向量機的輸電線路故障類型得識別方法,可以充分利用SVM在解決模式識別問題中的優(yōu)勢,并且故障類型的識別不會受到系統(tǒng)的運行方式、故障的過渡電阻、故障位置的影響,具有極高的可靠性。所以基于智能理論的故障識別方法,能夠有效地處理故障模式與不同的影響因素之間的非線性關(guān)系,達到較高的識別率。在神經(jīng)網(wǎng)絡(luò)方法中,由于其依靠于給定的輸電線路的系統(tǒng)結(jié)構(gòu),用涵蓋整個故障模式空間的典型模式對網(wǎng)絡(luò)進行訓(xùn)練實現(xiàn)的,所以在一定程度上受到輸電線路的系統(tǒng)結(jié)構(gòu)的制約,限制了該方法的通用性。此外,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法是采用的經(jīng)驗風(fēng)險最小化(EmpiricalRiskMinimization-ERM)原理,它并沒有使期望風(fēng)險值達到最小,即在有限的小樣本上得到的小誤差并不能保證其在測試集上的小誤差,而且會影響到對所有故障類型識別的準確性。文獻[9]運用了模糊神經(jīng)網(wǎng)絡(luò)、征映射神經(jīng)網(wǎng)絡(luò)和概率神經(jīng)網(wǎng)絡(luò)來進行故障類型的識別,取得了比較理想的結(jié)果,但其算法都是針對雙端電源網(wǎng)絡(luò)中的簡單輸電線路進行故障識別,在此簡單網(wǎng)絡(luò)上選取訓(xùn)練和測試樣本,訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后用于測試該簡單網(wǎng)絡(luò)的故障類型,但神經(jīng)網(wǎng)絡(luò)方法在訓(xùn)練時結(jié)果也不太穩(wěn)定。綜上所述,不管是那種方法,都存在著數(shù)據(jù)預(yù)處理方面步驟較多,一旦其中某一環(huán)節(jié)出錯,則會對最后的分類帶來很大的誤差,而且前期數(shù)據(jù)處理過程多則意味著到最終分類的速度會變慢,這對輸電線路發(fā)生故障后準確、迅速地識別故障類型是不利的。本論文就是在這樣的情況下,提出一種簡單而有效的輸電線路故障診斷分類的方法,即基于SVM的改進二叉樹輸電線路故障診斷分類的方法。在輸電線路發(fā)生故障時,能夠快速的診斷出線路的故障類型,從而對運行維護人員起到智能助手作用。本文工作1)廣泛閱讀了輸電線路故障診斷與識別相關(guān)著作和文獻,了解了線路故障識別的國內(nèi)外研究現(xiàn)狀,進行了分析研究,找出問題所在;2)研究支持向量機在電力系統(tǒng)輸電線路故障識別中的應(yīng)用,分別從基本概念、支持向量機算法、算法選擇等方面進行了闡述,以及結(jié)合輸電線路的故障特點對支持向量機的算法進行了改進;3)利用電力系統(tǒng)分析綜合程序(PSASP)軟件模擬仿真了7-BUS和36-BUS輸電線路的所有類型的短路電流故障數(shù)據(jù)和短路電壓故障數(shù)據(jù),并且選取合適的歸一化方法對故障數(shù)據(jù)進行了歸一化處理;4) 對SVM算法中的二叉樹算法進行改進,結(jié)合輸電線路故障類型發(fā)生的優(yōu)先級建立故障分類模型;5) 以MATLAB7.0為編程工具,利用仿真得到的一部分故障數(shù)據(jù)對模型進行訓(xùn)練,最后得到輸電線路的短路電流故障分類器和短路電壓故障分類器,再利用剩余的一部分故障數(shù)據(jù)對兩個故障分類器進行測試與驗證,并且在每個故障分類器中得出九個二分類SVM的判別函數(shù)的系數(shù)矩陣;6)利用得到的九個判別函數(shù)的系數(shù)矩陣重新編寫SVM故障分類器程序,且將改進的SVM故障分類器的分類結(jié)果與利用BP神經(jīng)網(wǎng)路和其他SVM算法建立的故障分類器的分類結(jié)果進行比較分析;7) 最后將在MATLAB7.0環(huán)境下的故障分類程序文件轉(zhuǎn)換為動態(tài)鏈接庫文件類型,即DLL文件,從而使故障分類程序脫離MATLAB7.0環(huán)境,以供下級程序的調(diào)用。2支持向量機理論支持向量機方法[8,9](SupportVectorMachine, 簡稱SVM是基于統(tǒng)計學(xué)習(xí)理論的機器學(xué)習(xí)方法,它是建立在基于統(tǒng)計學(xué)習(xí)理論上的VC維理論和結(jié)構(gòu)風(fēng)險最小化原理(StructuralRiskMinimization 簡稱SRM原貝U)基礎(chǔ)上,到目前為止,對于支持向量機還沒有一個確定的定義。其基本思想[10]可以概括為:首先通過非線性變換將輸入空間變換到一個線性高維空間,然后在這個新空間中求取最優(yōu)線性分類面。SVM是由vapnik在20世紀70年代提出的并且在90年代逐步完善的針對小樣本數(shù)據(jù)的機器學(xué)習(xí)理論,目前已經(jīng)在許多的智能信息的獲取與處理的領(lǐng)域都取得了較為成功的應(yīng)用。vapnik提出的SVM算法是基于統(tǒng)計學(xué)學(xué)習(xí)理論的一種模式識別方式,這種算法不僅是在于訓(xùn)練樣本上追求準確性,而且在訓(xùn)練樣本的準確性的基礎(chǔ)上還考慮了基于學(xué)習(xí)空間的復(fù)雜性,即在訓(xùn)練樣本學(xué)習(xí)的精度和學(xué)習(xí)空間的復(fù)雜性之間采取了一種折中,從而使所訓(xùn)練得到的分類模型對于未知的測試樣本具有較好的推廣或泛化能力。傳統(tǒng)的學(xué)習(xí)理論是基于經(jīng)驗風(fēng)險最小化( ERM準則)原則,并且是以大量的訓(xùn)練樣本進行訓(xùn)練, 然后找到一個能夠準確的逼近這些訓(xùn)練樣本的函數(shù),該函數(shù)能夠?qū)ξ粗臏y試樣本做出良好的預(yù)測。并且當(dāng)學(xué)習(xí)能力過強,即會產(chǎn)生過學(xué)習(xí)情況,而此時訓(xùn)練得到的函數(shù)模型的復(fù)雜性就會很高,函數(shù)把訓(xùn)練樣本數(shù)據(jù)中的噪聲也全部的作為實際中的訓(xùn)練樣本數(shù)據(jù)進行學(xué)習(xí),因此推廣或泛化能力極差。vapnik則提出了基于結(jié)構(gòu)風(fēng)險最小化(SRM準則)原則的算法,在函數(shù)集的復(fù)雜性和樣本的復(fù)雜性之間采取了一種折中,并且在理論上給出了其推廣誤差的界,其推廣誤差的界可分為兩部分:經(jīng)驗風(fēng)險和置信范圍。經(jīng)驗風(fēng)險 [11]即為傳統(tǒng)學(xué)習(xí)機在訓(xùn)練樣本數(shù)據(jù)上的誤差;置信范圍的度量則是以vapnik等提出的VC維理論為參數(shù)進行的,這種參數(shù)度量了函數(shù)集的復(fù)雜性。一個良好的學(xué)習(xí)機器需要在這二者之間做出一定的權(quán)衡,繼而達到總的推廣誤差最小,此即為結(jié)構(gòu)風(fēng)險最小化原則。SVM具有直觀的幾何意義,對于線性可分 [12,13]情況:在給定的訓(xùn)練樣本如:(x「%),&2丫2),(Xn,yn)中且y€{+1,-1},在尋找一個超平面w*x-b=0將其能夠正確的分開,這樣的超平面將不止一個,且往往很多,但其中與兩類樣本點的距離中最大的分類超平面將只會有一個,其將會獲得最佳的推廣能力:即最優(yōu)分離超平面。這種最優(yōu)分類超平面僅僅只由離它最近的樣本數(shù)據(jù)點來決定,而與其它樣本數(shù)據(jù)點無關(guān),這些樣本數(shù)據(jù)點即是所謂的支持向量,這也正是支持向量機名稱的來源。如圖2.1所示,其中位于H1線上的樣本數(shù)據(jù)點和位于H2線上的樣本數(shù)據(jù)點即為支持向量,而其他樣本數(shù)據(jù)點為非支持向量,在分類過程中這些非支持向量可以被完全剔除掉,并且對分類器的分類結(jié)果沒有直接的影響。

圖2.1支持向量機圖2.1支持向量機00H12.1統(tǒng)計學(xué)習(xí)理論概要2.1.1機器學(xué)習(xí)問題的表示依據(jù)某些給定的訓(xùn)練樣本數(shù)據(jù)來求出對某一個系統(tǒng)的輸入與輸出之間的特殊關(guān)系,并使這種關(guān)系能夠做出極為準確的預(yù)測對未知的輸出,這就是機器學(xué)習(xí)問題的目的所在。由訓(xùn)練器、產(chǎn)生器和學(xué)習(xí)機器三部分組成樣本數(shù)據(jù)學(xué)習(xí)的機器學(xué)習(xí)模型。圖2.2是一個從樣本數(shù)據(jù)學(xué)習(xí)的模型示意圖:圖2.2從樣本數(shù)據(jù)學(xué)習(xí)的模型圖在圖2.2中的訓(xùn)練器S可以對輸入的每個向量x返回一個比較明確的輸出值y,固定而卻未知的條件分布函數(shù)F(yx)是其產(chǎn)生輸出的依據(jù)據(jù)。樣本數(shù)據(jù)產(chǎn)生器G是能夠從同樣確定而未知的概率分布函數(shù)F(x)中可以單獨產(chǎn)生隨機的向量Rn。依據(jù)聯(lián)合分布函數(shù)(2.1)(2.1)取樣得到的L個數(shù)據(jù)對(Xi,yj,(x2,y2),(Xi,yj (2.2)從而構(gòu)成訓(xùn)練函數(shù)集。學(xué)習(xí)機器LM能在一組函數(shù)集f(x,a),a?上(其中上是參數(shù)集合)中選擇出使輸出值y能夠最好的接近訓(xùn)練響應(yīng)值y的函數(shù)f(x,a。)。必須對于任意輸入的值x給出輸出值y在訓(xùn)練之后的學(xué)習(xí)機器上,從而使得期望風(fēng)險R(a)值最小,其表示為:R(a)二L(y,f(x,a))dF(x,y) (2.3)L(y,f(x,a))為其給定的輸入值x下訓(xùn)練器的輸出值y與學(xué)習(xí)器所給出的函數(shù)f(x,a)之間的損失的期望值。此處的f(x,a),a?上稱作為預(yù)測函數(shù)集或者稱作為學(xué)習(xí)函數(shù)集,在函數(shù)集中a為廣義參數(shù)。亦可將預(yù)測函數(shù)稱作為學(xué)習(xí)機器、學(xué)習(xí)模型或者學(xué)習(xí)函數(shù)等。有不同的損失函數(shù)在不同類型的學(xué)習(xí)問題中。 在構(gòu)成三種最基本的機器學(xué)習(xí)的問題中:即函數(shù)逼近問題、概率密度估計問題和模式識別問題,可以通過定義不同的損失函數(shù)。在兩類情況下y={0,1}(或者y{-l,1}),輸出的y是類別標號,預(yù)測函數(shù)稱作為指示函數(shù),損失函數(shù)可以定義作L(y,f(x,a))=<QyL(y,f(x,a))=<(2.4)yM(2.4)損失函數(shù)通??梢远x為使風(fēng)險最小,也就是在貝葉斯決策函數(shù)中所得到的錯誤率為最小,在函數(shù)逼近問題中,輸出的y是連續(xù)的變量。(2.5)L(y,f(x,a))=(y-f(x,a))(2.5)依據(jù)訓(xùn)練樣本數(shù)據(jù)來確定x的概率密度是概率密度估計問題中學(xué)習(xí)的目的。如果估計密度函數(shù)為p(x,a),那么其損失函數(shù)可以表示作:(2.6)L(p(x,a))二(2.6)2.1.2.經(jīng)驗風(fēng)險最小化原則使其期望風(fēng)險最小化是機器學(xué)習(xí)問題的學(xué)習(xí)目標。而傳統(tǒng)的機器學(xué)習(xí)方法采用

的是基于經(jīng)驗風(fēng)險最小化原理[16,17,18](EmpiricalRiskMinimization ,ERM準貝U),即是依據(jù)大數(shù)定律思想在概率論中,前提是假設(shè)概率都是均勻分布的,則用樣本數(shù)據(jù)來定義的經(jīng)驗風(fēng)險最小化為:、L(y,f(人,a))RempQ)二亠 (2.7)n來作為對式(2.3)的估算。實際上用經(jīng)驗風(fēng)險最小化原理來替代 EMP是沒有經(jīng)過一些充分的理論的論證,而只是從直觀上進行的合理的推算。但卻在樣本有限的情況下仍然有較好的識別效果,在沒有經(jīng)過理論保證的樣本無窮大條件下所得到的學(xué)習(xí)機器。另外,大數(shù)定律只是一種說明在概率論中,在某些情況下,當(dāng)樣本數(shù)據(jù)趨于無窮大時,Remp(a)在概率意義上將會趨近于R(a),并且不能保證Remp(a)和R(a)將會取得最小值在同一個點上。2.1.3.結(jié)構(gòu)風(fēng)險最小化原理在機器學(xué)習(xí)的過程中,對經(jīng)驗風(fēng)險最小化原理以及其推廣能力的相對分析的結(jié)論中得出,如果要得到良好的實際風(fēng)險[19,20],依次可對未來樣本產(chǎn)生較好的預(yù)測性,不僅要使其經(jīng)驗風(fēng)險達到最小,而且還要使其 VC維也要盡可能的小,從而來縮小置信范圍。事實上,經(jīng)驗風(fēng)險最小化原理在當(dāng)樣本數(shù)據(jù)有限時是不合理的。在一些傳統(tǒng)的學(xué)習(xí)方法當(dāng)中,存在一些理論上的指導(dǎo),普遍的做法都是根據(jù)經(jīng)驗和先驗知識,采取人為的方法一次次的修改其算法和學(xué)習(xí)模型,從而來調(diào)整其置信范圍,這種人為的方法一般比較適合于離線性訓(xùn)練在現(xiàn)有樣本數(shù)據(jù)的情況下。如果當(dāng)樣本改變并且當(dāng)樣本數(shù)據(jù)更新了以后,繼而出現(xiàn)所選擇的模型將會出現(xiàn)了很大的偏差的問題,從而需要進一步的修改,于是就出現(xiàn)了一些自適應(yīng)算法與其他算法等的修正算法,雖然出現(xiàn)了很多的算法但卻從根本上沒有解決問題。如果存在一個比較復(fù)雜的,其置信范圍較大的機器,即便是把經(jīng)驗風(fēng)險最小化到零,其錯誤數(shù)目仍然有可能比較大在測試集上,這就是上文中所提到的過學(xué)習(xí)問題。所以為了防止出現(xiàn)過學(xué)習(xí)現(xiàn)象,就要構(gòu)造一種在學(xué)習(xí)機器中 VC維較小的方法,還要考慮的是如果函數(shù)集的VC維很小,則逼近真實的訓(xùn)練數(shù)據(jù)比較困難,這樣就會出現(xiàn)了矛盾。隨即又出現(xiàn)一個新的問題就是怎樣能使這二者達到非常好的同一問題。針對這兩種矛盾,當(dāng)構(gòu)造學(xué)習(xí)機器的時候,可以采取兩種不同的處理方法依據(jù)不同的側(cè)重點:首先制定一個確定復(fù)雜度的函數(shù)集合,并且實施經(jīng)驗風(fēng)險最小化準則在此函數(shù)集合上。在神經(jīng)網(wǎng)絡(luò)算法中,選擇不同的網(wǎng)絡(luò)算法結(jié)構(gòu)依據(jù)需解決的問題和樣本數(shù)據(jù)間的具體情況。網(wǎng)絡(luò)結(jié)構(gòu)的容量隨著結(jié)構(gòu)算法模型的制定后亦為之確定,也就是明確了算法的置信范圍,接著求出實際最小風(fēng)險根據(jù)經(jīng)驗風(fēng)險最小化準則。確定一個經(jīng)驗誤差最低底線,接著選擇出 VC維最小的函數(shù)集使其能夠滿足這個誤差最低底線。結(jié)構(gòu)風(fēng)險最小化原理的思路就是通過上述方法得到的。而支持向量機就是這種思路的具體實現(xiàn),而且SVM只要清楚不同函數(shù)集的VC維的相對大小即可,不需要計算出VC維的具體大小的數(shù)值,神經(jīng)網(wǎng)路采取了保持置信范圍恒定,并采取了使經(jīng)驗風(fēng)險最小化的方法,支持向量機采取的是保持經(jīng)驗風(fēng)險恒定不變或等于零,并采取了使置信范圍最小化的策略。由此可以看出,支持向量機更側(cè)重于對推廣能力的良好獲得。對于SVM方法,在運用結(jié)構(gòu)風(fēng)險最小化準則時,為了使函數(shù)集 VC維的大小方便比較,在文獻[13]中提出了一種新的方法策略,即把函數(shù)集構(gòu)造成一個函數(shù)的子集序列,并且讓各個子集進行排列依據(jù) VC維的大小,這樣置信范圍就會在同一個子集中一樣;并且尋找最小經(jīng)驗風(fēng)險在每一個子集當(dāng)中,一般其會隨著子集復(fù)雜度的提高而隨之減小。在子集當(dāng)中選取經(jīng)驗風(fēng)險最小 Remp(a)與置信范圍"n/h)的之和最小的子集,將此作為期望風(fēng)險最小化的模型。這種思想就是結(jié)構(gòu)風(fēng)險最小化原則(StructuralRiskMinimization) ,簡稱SRM準則,其基本的思路[21,22]可以用下圖2.3來表示:圖2.3 結(jié)構(gòu)風(fēng)險最小化示意圖從圖2.3中可以看出結(jié)構(gòu)風(fēng)險最小化準則既是要選取合適的 h,使經(jīng)驗風(fēng)險和置信區(qū)間的和取得最小值。有兩個思路可以實現(xiàn)結(jié)構(gòu)風(fēng)險最小化準則:1) 求取最小經(jīng)驗風(fēng)險值在每個子集當(dāng)中,接著選取使置信范圍和最小經(jīng)驗風(fēng)險的和最小的子集。在對于子集數(shù)目不是很大的情況下,這種方法還可以行得通,但當(dāng)子集數(shù)目趨向于無窮大情況時,這種方法就不可行了。2) 設(shè)計出函數(shù)集的某些模型使其在每個子集當(dāng)中都能獲得最小的經(jīng)驗風(fēng)險,接著只需要采取適當(dāng)?shù)淖蛹怪眯欧秶_到最小,那么這個子集將使得置信范圍和經(jīng)驗風(fēng)險會同時達到最小。支持向量機就是利用了第2個的思路實現(xiàn)了上述思想。支持向量機2.2.1SVM的理論基礎(chǔ)1) 在傳統(tǒng)的統(tǒng)計模式識別方法當(dāng)中,只有在樣本數(shù)據(jù)趨向于無窮大時,其識別性能才有理論上的保證。統(tǒng)計學(xué)習(xí)理論(STL)是研究在有限樣本數(shù)據(jù)情況下的機器學(xué)習(xí)方法。支持向量機的理論基礎(chǔ)就是基于統(tǒng)計學(xué)習(xí)理論;2) 傳統(tǒng)的統(tǒng)計學(xué)習(xí)模式識別方法在進行學(xué)習(xí)時,是強調(diào)經(jīng)驗風(fēng)險最小化準則??墒菃我坏慕?jīng)驗風(fēng)險最小化會產(chǎn)生“過學(xué)習(xí)問題”,導(dǎo)致其推廣能力變得很差。推廣能力也可以說是泛化能力[23,24,25],是學(xué)習(xí)機器(即預(yù)測函數(shù),或稱作學(xué)習(xí)函數(shù)、學(xué)習(xí)模型)對即將輸出結(jié)果而進行正確的預(yù)測的能力,就是對未知測試樣本數(shù)據(jù)進行預(yù)測時的精確度。“過學(xué)習(xí)問題”是在某些情況下,如果訓(xùn)練誤差過小將反而會使其推廣能力導(dǎo)致下降;3) 根據(jù)統(tǒng)計學(xué)習(xí)理論,由置信范圍值和經(jīng)驗風(fēng)險值兩個部分組成學(xué)習(xí)機器的實際風(fēng)險。而基于經(jīng)驗風(fēng)險最小化準則的學(xué)習(xí)方法其推廣能力會比較差是因為沒有最小化置信范圍值,而是只是注重了訓(xùn)練樣本數(shù)據(jù)的經(jīng)驗風(fēng)險最小誤差;4) 而Vapnik所提出的支持向量機(SupportVectorMachine--SVM)以置信范圍值最小化作為其優(yōu)化目標且以訓(xùn)練誤差作為其優(yōu)化問題的約束條件,即支持向量機是一種基于結(jié)構(gòu)風(fēng)險最小化準則的學(xué)習(xí)方法,從而使它的推廣能力要明顯的優(yōu)于一些傳統(tǒng)的機器學(xué)習(xí)方法;5) 由于SVM的解將是全局唯一的最優(yōu)解,它的求解是最后轉(zhuǎn)化為求解二次規(guī)劃問題;6)SVM可以使其推廣運用到函數(shù)擬合等的其他機器學(xué)習(xí)問題當(dāng)中, 并在解決小樣本情況、非線性情況及其高維模式識別問題中表現(xiàn)出了許多其獨特的優(yōu)勢。SVM方法的特點

支持向量機的最終判別函數(shù)只是由少數(shù)的支持向量來確定的,計算的復(fù)雜性完全取決于其支持向量的數(shù)目,而不是樣本數(shù)據(jù)空間的維數(shù),因此,這在某種意義上避免了“維數(shù)災(zāi)難”問題。SVM的最終的結(jié)果將由少數(shù)的支持向量來決定,這不僅可以讓我們“剔除”掉大量的冗余非支持向量樣本、抓住關(guān)鍵樣本數(shù)據(jù),而且注定了此方法不僅是算法簡單,而且是具有很好的“魯棒”性,主要體現(xiàn)在:1)增加和刪除非支持向量樣本數(shù)據(jù)對建立的模型沒有直接的影響;支持向量樣本集具有一定的魯棒性;在一些相對成功的應(yīng)用中,支持向量機方法對核函數(shù)參數(shù)的選取不敏感。SVM基本原理SVM是最新發(fā)展起來在統(tǒng)計學(xué)習(xí)理論的部分中,是Vapnik等人提出來的依據(jù)統(tǒng)計學(xué)學(xué)習(xí)理論中的結(jié)構(gòu)風(fēng)險最小化準則。Vapnik等在有限樣本數(shù)據(jù)條件下機器學(xué)習(xí)當(dāng)中的的部分根本性的問題進行了系統(tǒng)的理論研究,在支持向量機理論中取得了很好的解決,而且支持向量機還充分考慮到了其算法的推廣性,因而統(tǒng)計學(xué)習(xí)理論和支持向量機被許多的人都認為是研究機器學(xué)習(xí)問題的一個框架。線性判別函數(shù)和判別面線性判別函數(shù)(DiscriminantFunction)是指由x的各個分量的線性組合而成的函數(shù)。(2.8)g(x)=wxw(2.8)對于兩類問題情況的決策規(guī)則為:如果g(x)>0,貝U判定x屬于C1,如果g(x)<0,貝U判定x屬于C2,如果g(x)=0,則可以將x任意分到某一類或者拒絕判定。如圖 2.4所示支持向量機分類原理圖圖2.4支持向量機分類原理圖圖2.4下圖2.5表示的是一個較簡單的線性分類器,其具有 d個輸入單元,其中每個輸入單元對應(yīng)于一個輸入向量在各維上的分量值。該圖類似于神經(jīng)網(wǎng)絡(luò)中的一個神經(jīng)元。g(x)g(x)圖2.5SVM線性分類器其中方程g(x)定義了一個線性判定面,它把其中歸類于 C1中的點與歸類于C2中的點分開來。當(dāng)g(x)是線性函數(shù)時,這個平面被稱為“超平面” (hyperplane)。但當(dāng)x1和x2都在判定面上時即:wTwT% w0=wTx2 w0(2.9)或者(2.10)這表示w和超平面上的任意向量正交,并且把w稱作為超平面的法向量。其中:x1-x2表示超平面上的其中一個向量判別函數(shù)g(x)是一種代數(shù)度量,是其在特征空間中某點x到超平面距離。總之:線性判別函數(shù)是利用一個超平面把特征空間分隔成不同的兩個區(qū)域空間,其中由法向量w確定超平面的方向,其位置是由閾值w0來確定。判別函數(shù)g(x)與x點到超平面的代數(shù)距離(帶正負號)是一種正比的關(guān)系。那么,如果 x點在超平面的正側(cè)時,則g(x)>0;如果x點在超平面的負側(cè)時,則g(x)<0。最優(yōu)分類面最優(yōu)分類線(或最優(yōu)分類面)就是要求分類線不但能將兩類情況正確的分開(即訓(xùn)練錯誤率為0),而且使分類的間隔最大。將此推廣到高維空間中時[26,27,28],最優(yōu)分類線就變?yōu)樽顑?yōu)分類面。距離最優(yōu)分類超平面最近的向量稱為支持向量。最優(yōu)超平面可以分為線性可分的和線性不可分的兩種情況,而支持向量機方法在最初就是在線性可分的情況下提出來的。為了不失普遍性地得出支持向量機中的最優(yōu)分類超平面,在此我們討論支持向量機的基本內(nèi)容只是限定在二分類的范圍內(nèi)。我們所要獲得的目標是將要確定一個判別函數(shù),是由訓(xùn)練樣本來確定此函數(shù)的,它可以完全的分開將兩類訓(xùn)練樣本數(shù)據(jù),并且可以將未知的樣本數(shù)據(jù)也能夠正確的進行分類在訓(xùn)練后得到的分類器,即其具有良好的泛化性能或推廣能力。圖2.6最佳分類超平面如上圖2.6所示,如果要將兩類樣本數(shù)據(jù)分開,那么會存在有很多的線性分類器都可以將這兩組數(shù)據(jù)正確的分開,可是卻只有一條線性分類器可以使得兩類點與他的距離(Margin)達到最大值,那么我們所要求的最佳分類超平面就是這個線性分類器。很顯然,我們可以看出該分類超平面的邊界與其它的亦可能正確分類的邊界相比卻具有更好的泛化能力或推廣能力,這就是為什么SVMt匕其它分類方法優(yōu)越的所在,即支持向量機不但尋求能夠?qū)颖緮?shù)據(jù)能夠正確的分開,而且還尋求一種最優(yōu)的分類線或分類面。從線性可分的情況下的最優(yōu)分類面發(fā)展所得來的支持向量機 ,其基本思想可用圖2.7中的兩維和兩類樣本數(shù)據(jù)的情況來加以說明的。在圖中,方形點和圓形點代表這兩類不同的樣本數(shù)據(jù)點,H為分類線(當(dāng)然亦是唯一的一條最優(yōu)分類線),H1和H2是分別為過各類樣本數(shù)據(jù)點中的離分類線(最優(yōu)分類線)最近的樣本數(shù)據(jù)點,并且是平行于分類線(最優(yōu)分類線)的兩條直線,兩條線之間的距離叫做分類間隔(margin)。如下圖2.7所示:

H1wH1w設(shè)線性可分情況下的樣本數(shù)據(jù)集為(x,yi),i=1,…,n,xRd,y{1,-1}。d維空間中的線性判別函數(shù)為:g(x)=wx+b,而分類面的方程為wx+b=Q首先我們可以對其進行歸一化處理,使得所有樣本數(shù)據(jù)都滿足 g(x)=1,那么這樣分類間隔就將等于2/w。如果要求其分類間隔為最大,那么其實就是需要 w值最小,而如果要求所得的分類面對所有樣本能夠正確的分類,那么就是要求要滿足:yiyiWxib丨一1_0,i ,n,(2.11)因此在滿足上式公式中的且使 w值最小的分類面就是我們所要求取的最優(yōu)分類面。在這兩類樣本數(shù)據(jù)點中距離最優(yōu)分類面最近的數(shù)據(jù)點,且在 H1和H2兩類線上的訓(xùn)練樣本數(shù)據(jù)點,就是使公式等號成立的那些樣本數(shù)據(jù)點我們就稱作為支持向量。求取最優(yōu)分類面問題可以轉(zhuǎn)化為如下式(2.12)的約束優(yōu)化問題:minise —M2 £im (2.12)subjectto yi“Xjb丨-1i_0i=1,2,,l公式(2.12)是一個二次凸規(guī)劃的問題,由于其目標函數(shù)和約束條件都是凸

的,依據(jù)最優(yōu)化的理論,那么這一問題將會存在唯一的全局最小解。應(yīng)用 Lagrange12L(w,b,a)=2啊乘子法且滿足12L(w,b,a)=2啊l(2.13)-、ai(yi((wX」b)-1)(2.13)i=1這里的ai-0是拉格朗日乘子。

應(yīng)用拉格朗日乘子法對其求極值,對其相應(yīng)的w和b求偏導(dǎo)數(shù),則可找到相應(yīng)的對偶形式:將得到的關(guān)系式:iL(w,b,a)cw::L(w,b,a)dwi八yiai=0i4lw=為 Yia將得到的關(guān)系式:iL(w,b,a)cw::L(w,b,a)dwi八yiai=0i4lw=為 YiaiXii-1lyiai二0i4(2.14)(2.15)(2.16)代入到原始的拉格朗日函數(shù)中,可得到:1L(w,b,a)=22Iw-\ai(yi((wXi)b)-1)111yiyjaiaj(XiXj)-'yyjaiaj(^2i,j1 i,jm1Xj) 'ai(2.17)1 11二 a: ;yiyja:aj(XiXj)i1 2i,jd在這里考慮Karush-Kuhn-Tucker互補條件,條件要求最優(yōu)解a*,(w*,b*)必須滿足:a*[yi(wXi b*)-1]=0,^1,2/,1(2.18)這表明僅僅是函數(shù)間隔為1的輸入點Xi,也即最靠近超平面的點所對應(yīng)的a*為零,所有其它的點所對應(yīng)的參數(shù)a*為零。因此當(dāng)要轉(zhuǎn)換表達式到權(quán)重向量中時,只包括哪些最靠近于超平面的樣本點在內(nèi),這也就是為什么要將這些樣本數(shù)據(jù)點稱作為支持向量的原因(支持向量機的由來也緣于此)。支持向量機決策的依據(jù)就是從訓(xùn)練樣本數(shù)據(jù)中得到最后的支持向量,從而求取最優(yōu)分類超平面的決策函數(shù)。最后可得到解上述問題的最優(yōu)分類函數(shù)為:k****f(x)二sgn{wxb}二sgn{二aiyi(Xi*x)b} (2.19)i=1上式(2.19)中a*與b*是確定最后最優(yōu)分類超平面的參數(shù), (x^x)為其兩個向量的點積。由上式可知:非支持向量所對應(yīng)的ai都全部為零,所以求和只是對于少數(shù)支持向量而進行。在線性不可分的情況下,可以在條件yi[wxib]-1_0 (2.20)中增加一個松弛項i_0使其成為(2.21)(2.22)yJwXjb]-1 (2.21)(2.22)將目標改為求12“

wCCi)2 i4使公式(2.22)最小,即折中考慮最小錯分樣本數(shù)和最大分類間隔,由此就可以得到廣義的最優(yōu)分類面。其中,C>0是一個常數(shù),它是控制對錯分樣本數(shù)據(jù)的懲罰程度。2.2.4支持向量機上節(jié)所得到的最優(yōu)分類函數(shù)為:kf(x)=sgn{wxb}=sgn{'aiyi(x^x)b} (2.23)im該式只是包含有需待分類樣本數(shù)據(jù)點和訓(xùn)練樣本數(shù)據(jù)點中的支持向量的內(nèi)積運算,由此可見如要解決一個特征空間中的最優(yōu)線性分類問題時,我們只是需要知道在這個特征空間中的內(nèi)積運算便可。對于在非線性問題中,我們可以進行將非線性變換轉(zhuǎn)化為在某個高維空間中的線性問題來解決,在變換空間求取最優(yōu)分類面。但是這種變換相對是比較復(fù)雜的,所以在一般情況下是不容易實現(xiàn)這種思路的。依據(jù)泛函的相關(guān)理論基礎(chǔ),只要存在一種核函數(shù) K(Xi,Yj)在滿足Mercer條件時,它就會對應(yīng)于某一變換空間中的內(nèi)積。因此若要實現(xiàn)某一非線性變換后的線性分類時,只要在最優(yōu)分類面中采取適當(dāng)?shù)膬?nèi)積核函數(shù) K(Xi,Yj)即可,而其計算的復(fù)雜度也不會增加的。相對應(yīng)的分類函數(shù)也變?yōu)榱耍簁f(x)二sgn{'aiyiK(x「x)b} (2.24)i=i

這就是支持向量機X2__,K(Xi,x)K(X2,x) 這就是支持向量機X2__,K(Xi,x)K(X2,x) ?Sgn()K(Xm,X)圖2.8 支持向量機網(wǎng)絡(luò)示意圖由圖2.8中可以看出,SVM所求得的決策函數(shù)在形式上與一個神經(jīng)網(wǎng)絡(luò)比較類似,其輸出是由若干個中間層的節(jié)點依據(jù)線性而組合的,而在其中的每一個中間層的節(jié)點對應(yīng)輸入樣本數(shù)據(jù)點與一個支持向量的內(nèi)積運算,因此它也被稱作為支持向量網(wǎng)絡(luò)。225SVM核函數(shù)采用不同的核函數(shù)k(x,xj可以構(gòu)造出實現(xiàn)輸入空間中不同類型的非線性決策面的學(xué)習(xí)機,從而形成不同的SVM算法。在解決實際問題當(dāng)中,通常是直接給出核函數(shù)[29,30]。常用的核函數(shù)有線性核函數(shù)(linearkernel )(2.25)k(x,xj=(2.25)得到的是線性分類器多項式核函數(shù)(polynomialkernel)k(x,x)=(s(xxjc)d (2.26)其中s,c,d為參數(shù)。線性核函數(shù)可以看做是多項式核函數(shù)的一種特殊情況。得到的是q階多項式分類器徑向基核函數(shù)(radicalbasisfunction,rbf )2x~xk(x,xj二exp{2 } (2.27)CT其中二為參數(shù),這種得到的是一種徑向基函數(shù)分類器。Sigmoid核函數(shù)(Sigmoidtanh)k(x,xj=tanh(s(xxi)c) (2.28)其中s和c為參數(shù)。這里支持向量機實現(xiàn)的就是包含有一個隱含層的多層感知器,隱含層的節(jié)點數(shù)是由算法本身自動確定的,而且其算法并不存在會困擾神經(jīng)網(wǎng)絡(luò)方法的局部極小點問題。SVM多類分類方法SVM最初是針對于二分類問題提出來的,但如何將二分類擴展到多類分類是SVM研究的一個非常重要的內(nèi)容。利用二分類的svM解決多類分類問題的方法大致有兩種:一種方法是將多分類看作是二分類的組合,即基于 SVM的二分類,用二分類來運用各種不同的方法組合成一個多類別的分類器,最終將多分類問題轉(zhuǎn)化為二分類問題來解決;第二種方法是通過修改SVM勺目標函數(shù),從根本上解決支持向量機的多類別分類問題。由于后者所花的代價很高,因此只適合于解決小規(guī)模的問題,所以在解決多類別分類時通常多采用第一種方法。假定多分類問題有k個類別S={1,2,3,,,k},訓(xùn)練樣本為{xi,yi},i={1,2,3, ,,1},其中yi€S。有以下傳統(tǒng)方法實現(xiàn)SVM的多類別分類。一對多SVM“一對多”方法(one-against-rest method)針對不同的k類分類,需要構(gòu)造k個SVM分類器,其中第一個SVM二分類將第一類別分開出來,第二個SVM二分類將第二類分開出來,依次類推則第m個分類器是將第m類與其余的類別分開,即將第m類重新標號為1,其它類重新標號為-1。完成整個分類過程則需要計算k個判別函數(shù),這個方法的不足之處在于在改變其中的一類類別的不同識別順序后容易使其類別的樣本被歸于其他的類別中去,降低分類的準確率,而且訓(xùn)練樣本數(shù)據(jù)過大,訓(xùn)練困難,耗時多,所以其推廣性較差。一對一SVM“一對一”方法(one-against-onemethod)是從眾多的樣本中任意分別選取2個不同的類別構(gòu)成一個單獨的SVM子分類器,這樣經(jīng)過排列組合后將共有k(k-1)/2個SVMf分類器。在構(gòu)成識別類別i和識別類別j的SVh分類器時,在樣本數(shù)據(jù)集中選取屬于類別i和屬于類別j的樣本數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),并且將屬于類別i的樣本數(shù)據(jù)標記為正,將屬于類別j的樣本數(shù)據(jù)標記為負,其它的每個二分類SVM的做法與此相同進行。在進行測試時,將測試樣本數(shù)據(jù)對 k(k-1)/2個SVM子分類器都分別進行樣本數(shù)據(jù)的測試,并且累計相加各類別測試結(jié)果的得分,最后選擇得分最高者所對應(yīng)的類別為需測試樣本數(shù)據(jù)的類別。但此法的不足之處是如果單個SVMT分類器不規(guī)范化,則會導(dǎo)致整個N類分類器將會趨向于過學(xué)習(xí)狀態(tài),推廣誤差無界,分類器在數(shù)目K隨需分類類別急劇增加時,將會導(dǎo)致在決策時速度很慢。本章小結(jié)本章首先介紹了統(tǒng)計學(xué)習(xí)理論的概念,指出統(tǒng)計學(xué)習(xí)理論是針對有限樣本的機器學(xué)習(xí)理論,具有比較堅實的理論基礎(chǔ)。然后介紹了SVM勺理論基礎(chǔ)、特點、基本原理及其核函數(shù)等內(nèi)容,并且介紹了SVM勺多類分類方法,說明了SVMS于統(tǒng)計學(xué)習(xí)理論中的結(jié)構(gòu)風(fēng)險最小化原則,在小樣本數(shù)據(jù)情況下具有很好的推廣性能和泛化能力,尤其適合于電力系統(tǒng)這種要求高穩(wěn)定性、不易得到大量的故障樣本數(shù)據(jù)的系統(tǒng)中。輸電線路的故障模擬電力一般是從遠離市區(qū)的火力或水力等發(fā)電廠通過架空輸電線或者電纜送給用戶或負荷端,中間又以變電站為中樞點對電壓進行升壓和降壓處理,其中也聯(lián)接著其它許多的輸電線路系統(tǒng)。并且其電力的傳輸是包含有大地的電路,但是與電纜不同,輸電線路是裸露在自然環(huán)境當(dāng)中的,其隨時可能會遭遇到雷擊等的突發(fā)事故。特別是在遠距離的高壓和超高壓的輸電線路系統(tǒng)中,當(dāng)發(fā)生各種類型故障的時候,可能會給用電用戶或負荷端造成大面積的停電和造成各種事故的發(fā)生,將會給人民生活和工業(yè)生產(chǎn)帶來非常大的不便[31,32]。因此,必須找到一種合適而有效的事故識別方法,能夠快速的發(fā)現(xiàn)故障,進而判斷出故障類型,為最后確定其故障位置進而采用合適的故障處理手段提供一種依據(jù),能在最短的時間內(nèi)能夠快速的解決線路上所發(fā)生的故障,并且把由于故障所帶來的損失能夠盡量降低到最低點。為了解決上述的這些問題,首先我們要必須要對電力系統(tǒng)的遠距離輸電線路的結(jié)構(gòu)和特點,及其可能會發(fā)生故障的原因和類型都要有所了解,在了解了輸電線路的所有這些實際的情況后,我們才能對癥下藥,找到一個合理而有效地針對這些突發(fā)事故的處理方法。電力的傳輸方式現(xiàn)代電力的傳輸方式主要有兩種[33,34]:交流輸電方式和直流輸電方式。而在我國直流輸電方式采用的相對較少,大多采用的都是交流輸電方式。交流輸電方式交流輸電方式是通過升壓變壓器和降壓變壓器對電壓進行有效的升、降壓,現(xiàn)在是廣泛地應(yīng)用于電力系統(tǒng)的電力傳輸中。在交流輸電方式中現(xiàn)有單相2線制、單相3線制、三相3線制、三相4線制四種方式,這些方式中其各有其自己的適用場合。一般的對于家用電器比如照明燈或空調(diào)系統(tǒng)等的具有小功能電器的用電設(shè)備,大多都采用單相2線制或者單相3線制方式,而對于電動機,汽輪機等大型負荷或者更大一些的負荷,則應(yīng)用三相3線制或者三相4線制方式。但是其中三相3線制交流輸電方式被廣泛地運用在各種場合,它有以下幾個優(yōu)點:1)其可以很方便的從三相交流電中得到單相交流電;2)當(dāng)具有相同的電壓等級和功率時,在1條線路上所送出的功率將是單相2線制的1.15倍;3)其是產(chǎn)生動力源的主要旋轉(zhuǎn)磁場;4)在相同的電壓等級、損耗和距離等條件下時,其所需要電力線路的電線重量是單相2線制的3/4。

基于以上的優(yōu)點,普遍應(yīng)用三相3線制作為電力的輸電方式。在高壓輸電線路方面的配電線路及動力用的低壓線路等當(dāng)中,都采用三相3線制的方式。在本論文中也是采用三相3線制的交流輸電方式。直流輸電方式直流輸電方式也是一種比較適合于電力的輸送,但其電壓的升降不容易實現(xiàn),在我國也有部分地區(qū)采用這種方式,其特點有:l)直流輸電方式不存在無功功率,而且其損耗??;2)在相同的有效電壓情況下時,與交流輸電方式相比直流輸電方式的振幅小,有利于絕緣;3)沒有電容電流,而且不會產(chǎn)生介質(zhì)損耗,更有利于電纜的送電;4)在送電端與受電端之間不會象交流輸電時存在的相位差,其穩(wěn)定輸電的容量不會受限制,而且輸電的穩(wěn)定性更高。輸電線路的故障類型、現(xiàn)象、原因及特點輸電線路的故障類型在電力系統(tǒng)的電力傳輸中,輸電線路上常見的故障類型有短路、斷路和接地等幾種故障類型,而其中最為常見的和對電力系統(tǒng)的影響和危害最大的是各種短路故障類型[35,36,37]障類型[35,36,37]l)短路故障類型輸電線路中在其中不同電位的兩個點被導(dǎo)體連接或短接起來,從而造成了輸電線路的非正常運行的故障。2)斷路故障類型輸電線路斷路故障是指輸電線路中的某一個回路在非正常情況下斷開,使電流不能夠在回路當(dāng)中繼續(xù)流通的故障,稱為斷路故障。如斷線、接觸不良等。3)接地故障類型輸電線路中的某點在非正常接地情況下所形成的故障,稱為接地故障。接地故障類型有單相接地故障、兩相接地故障和三相接地故障三種類型。對于在中性點直接接地系統(tǒng)中的單相接地情況,實質(zhì)是構(gòu)成了單相短路故障。對于在中性點不接地中的單相接地情況,將使三相對地電壓發(fā)生較大的變化,進而會造成電氣絕緣擊穿故障等。比較典型的斷線故障和接地故障如圖3.1所示。發(fā)電廠升壓變壓器輸電線路降壓變壓器負荷發(fā)電廠升壓變壓器輸電線路降壓變壓器負荷(b)接地故障

圖3.1斷線故障和接地故障3.2.2輸電線路的故障現(xiàn)象、原因及特點短路故障的現(xiàn)象及其原因短路故障的現(xiàn)象短路是指電力系統(tǒng)在正常運行情況以外的所有一切相與相之間或者相與地之間的短接情況。其中在三相系統(tǒng)中,ABC三相同時一起短接的情況稱為三相短路,由于三相各阻抗相同,三相都對稱,所以又稱作為對稱短路。在電力系統(tǒng)中發(fā)生在同一位置的不對稱短路有:單相接地短路、兩相接地短路以及兩相短路,當(dāng)在發(fā)生此類各種短路的故障中,三相系統(tǒng)是處于不對稱狀態(tài)的昭o在電力系統(tǒng)運行中,各種短路故障所發(fā)生的幾率都是不相同的,其中單相接地短路故障發(fā)生的幾率最高,約占65%左右,兩相接地短路故障發(fā)生的幾率約占 20%左右,兩相短路故障約占10%左右,三相短路故障發(fā)生的幾率最小約占5%左右。短路故障的原因電力系統(tǒng)短路故障發(fā)生的原因很多,既有客觀的,也有主觀的,而且由于設(shè)備的結(jié)構(gòu)和安裝地點的不同,弓I發(fā)短路故障的原因也不相同。但是,根本原因是電氣設(shè)備載流部分相與相之間或相與地之間的絕緣遭到破壞。例如,架空線路的絕緣子可能由于受到雷擊過電壓而發(fā)生閃絡(luò),或者由于絕緣子表面的污穢而在正常工作電壓下放電。再如發(fā)電機、變壓器、電纜等設(shè)備中載流部分的絕緣材料在運行中損壞。有時因鳥獸跨接在裸露的載流部分,或者因為大風(fēng)或在導(dǎo)線上浮冰,引發(fā)架空線路桿塔倒塌而造成短路。此外,線路檢修后,在未拆地線的情況下運行人員就對線路送電而發(fā)生的誤操作,也會引起短路故障。總之,短路故障產(chǎn)生的根本原因則是在不同的電位導(dǎo)體之間的絕緣被擊穿或者是相互的短接而形成的。三相輸電線路的短路故障通常是由如下原因造成的:l)線路受到外力的破壞;2)桿塔倒塌造成的三相接地短路故障;3)三相線路帶地線合閘;4)輸電線路長時間的運行,造成其絕緣性能下降等原因。兩相短路故障的原因:1)收到外力的作用,如導(dǎo)電物體搭在兩根線上造成的兩相短路;2)線路的弧垂過大,當(dāng)遇到刮大風(fēng)時造成導(dǎo)線的擺動,從而導(dǎo)致兩根導(dǎo)線相碰或者線路發(fā)生絞線形成的兩相短路;3)受到雷擊導(dǎo)致兩相短路等。斷路故障的現(xiàn)象及原因(l)斷路故障的現(xiàn)象斷路故障是輸電線路故障中最常見的故障類型,發(fā)生斷路故障時較為基本的形式就是電路回路無電流,即回路不通。在一定的情況下,斷路故障還有可能會引起過電壓現(xiàn)象[39,40],而斷路點所產(chǎn)生的電弧還有可能會引發(fā)火災(zāi)或爆炸事故等。l)斷路點電弧故障。輸電線路的電路發(fā)生斷線,特別是在線路上的那些似斷非斷或接觸不良的位置點即那些有時通有時斷開的斷路點上,在斷路點處斷開的瞬間通常會產(chǎn)生電弧或者在斷路點處產(chǎn)生高溫,而這些有可能會導(dǎo)致一些重大的火災(zāi),造成一定的經(jīng)濟損失。2)三相電路中的斷路故障。在輸電線路的三相電路中如果發(fā)生了其中一相斷路故障,則會出現(xiàn)使三相電路不對稱和有可能會使電動機由于缺相運行而被損壞;在三相電路當(dāng)中,如果零線發(fā)生了斷路故障,那么其對負荷的影響將會很大。(2)斷路故障的原因輸電線路發(fā)生斷路故障通常有以下的原因:l)線路的導(dǎo)線連接頭處可能存在接觸不良或者已被燒斷;2)由于外力的作用從而導(dǎo)致了其中一相的斷線;3)在配電低壓側(cè)處,可能其中一相的保險絲被燒斷;4)線路中的其中一相導(dǎo)線因故而斷開。線路接地故障原因輸電線路的接地故障通常有以下的原因:1)輸電線路的導(dǎo)線接頭處由于氧化腐蝕等原因而脫落,從而導(dǎo)致了導(dǎo)線的斷開而落地;2)在輸電線路附近存在的樹枝等物體碰及線路的導(dǎo)線導(dǎo)致線路接地;3) 由于輸電線路的電氣元件長期運行而導(dǎo)致絕緣能力的下降,從而對附近物體的放電;4) 線路被外部原因或自然因素等破壞從而導(dǎo)致導(dǎo)線的斷開而落地。3.224輸電線路故障的特點輸電線路的短路有單相接地、兩相接地、兩相不接地短路和三相短路4種類型。而單相接地又可以分為A相對地短路(AG),B相對地短路(BG)和C相對地短路(CG);同樣地,兩相短路又分AB,BCCA三種類型;兩相接地又有ABGBCGCAGE種類型,因此,輸電線路故障分類是一個多層多分類問題。統(tǒng)計分析表明,電力系統(tǒng)中不同類型故障的發(fā)生概率是不相同的,其中單相接地短路最多,占到總故障的80流右,兩相短路次之,三相短路出現(xiàn)的概率最小;然而,不同故障的危害程度及其出現(xiàn)的概率剛好相反,三相短路的后果最為嚴重,單相接地短路的后果相對較輕。這就要求我們對不同類型的故障設(shè)置不同的分類優(yōu)先級。兩相短路和兩相短路接地的識別是常規(guī)方法的一個難點, 通常是靠實測或分解電流中的零序分量,利用有無零序電流,判別是接地還是非接地故障,這樣做的結(jié)果是增加了硬件投資或者計算步驟,實際上,短路相電流里就包含有零序電流的信息,如果能夠不通過零序分量,而直接用短路相電流進行兩相短路的識別,必將提高計算速度,為此,本設(shè)計中將考慮兩相短路的直接識別問題。3.3本論文采用的輸電線路模型及仿真網(wǎng)絡(luò)圖3.3.1本論文采用的輸電線路模型本論文是針對一個較為典型的輸電線路模型而進行設(shè)計的。下圖 3.2為該輸電線路模型的結(jié)構(gòu)圖。本模型是采用的三相 3線制的交流輸電方式,供電的額定電壓為500kV。母#1 #2 線路段1 #n母線路段2線:: X/ :II ? 1線X/:! ZK :-A::▽:B側(cè);; 八 !側(cè)圖3.2 輸電線路模型結(jié)構(gòu)圖在圖3.2中選取母線A側(cè)到母線B側(cè)的線路1段作為數(shù)據(jù)模擬段,并且從線路的0雅U100%t隨機選取幾個模擬點,模擬單相接地故障、兩相短路故障、兩相短路接地故障和三相短路故障。并且模擬所有故障類型的短路電流故障數(shù)據(jù)和短路電壓故障數(shù)據(jù)。最后將一部分樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩余樣本數(shù)據(jù)作為測試數(shù)據(jù),以驗證故障分類器的合理性和正確率。輸電線路故障類型判別方法在上幾節(jié)中敘述了輸電線路的基本結(jié)構(gòu)和輸電線路的各種故障類型等的基本信息后,本節(jié)描述本故障分類器進行故障識別的幾個基本前提。1)輸電系統(tǒng)是線性電路;2)在輸電線路發(fā)生事故前的瞬間,系統(tǒng)是三相平衡的或者是基本平衡的;3)所要識別的故障均為線路故障,不存在其他的輸電設(shè)備故障形式?;谝陨?個前提,輸電線路故障識別的推理將會變的條理有序。下面是輸電線路上的故障數(shù)據(jù)信息與故障識別之間的的關(guān)系問題。故障類型的判別:本論文故障分類器是通過仿真輸電線路其中一條線路上的短路電壓和短路電流的所有故障類型數(shù)據(jù),而所仿真得到的故障數(shù)據(jù)包含了關(guān)于線路故障的全部信息,下面是他們之間的具體關(guān)系,而此關(guān)系亦是故障識別的準則所在。(1)單相接地故障的確定結(jié)合上幾節(jié)中的輸電線路模型內(nèi)容,當(dāng)在輸電線路的某一相線路上中的某一點發(fā)生了單相接地故障時,其所產(chǎn)生的故障特征是該故障相的短路電流將會遠遠大于非故障相得正常電流數(shù)據(jù),而且其對地電壓數(shù)據(jù)將遠遠小于正常相的對地電壓數(shù)據(jù)。則可判斷出該相是否發(fā)生了單相接地故障。(2)相間故障的確定當(dāng)發(fā)生了相間故障時所產(chǎn)生的特征是非故障相電流數(shù)據(jù)遠遠小于故障相的電流數(shù)據(jù)。因為非故障相電流是該相的對地電容電流,而故障相的電流則是發(fā)生相間故障時由電源提供的短路電流。則可判斷出是哪兩相發(fā)生了相間故障。(3)三相接地故障的確定當(dāng)輸電線路發(fā)生三相故障時,其所產(chǎn)生的故障特征是在故障點的同一側(cè)的三相電壓數(shù)據(jù)和電流數(shù)據(jù)為相同的數(shù)據(jù),依據(jù)此原則,即可判斷出是否發(fā)生了三相故障。(4)斷路故障的確定當(dāng)在輸電線路上某一相的某一點發(fā)生了單相斷路故障時,其所產(chǎn)生的故障特征是故障相的電流很小,幾乎趨近于零,故障點兩邊的電壓為額定供電電壓。依據(jù)此原則,即可判斷出是否發(fā)生了斷路故障。在本論文中因為斷線故障數(shù)據(jù)在PSASP軟件中無法仿真得到,故本論文中只考慮單相接地、兩相短路、兩相短路接地、三相短路故障一共十種故障類型的識別分類問題。333利用PSASF實際仿真網(wǎng)絡(luò)模型圖本論文采用的網(wǎng)絡(luò)模型圖是PSASF自帶的7-BUS和36-BUS的算例。網(wǎng)絡(luò)模型圖如下圖3.3所示,其中輸電線路母線電壓均為500kV。(a)7-BUS網(wǎng)絡(luò)圖EUS25 EUSSt5Q呂竝1E0S2SBUS308BllSf-BUSS?._EUS59BU£^1(a)7-BUS網(wǎng)絡(luò)圖EUS25 EUSSt5Q呂竝1E0S2SBUS308BllSf-BUSS?._EUS59BU£^1J—LBUS33■mE(jS14EosirEUS5BUS16BUS3(b)36-BUS網(wǎng)絡(luò)圖圖3.3系統(tǒng)仿真圖對圖3.3所示的7-BUS和36-BUS網(wǎng)絡(luò)的短路,分別在圖(a)的B3和B4母線之間的500kV的線路以及圖(b)的B22和B23母線之間的500kV的線路上模擬短路故障,利用PSASP軟件計算和記錄故障線路的故障點處的兩端的短路電流和短路電壓標么值。為了保證所設(shè)計的故障分類器在不同節(jié)點的系統(tǒng)中和同一系統(tǒng)中的不同位置發(fā)生短路時的故障分類器的應(yīng)用通用性,在同一系統(tǒng)中分別改變線路參數(shù),改變各發(fā)電機的出力和選用不同節(jié)點算例進行模擬短路測試,分別記錄測試線路長度從0%到100%的隨機不同的地方作為短路點分別記錄不同點的短路電流和短路電壓故障數(shù)據(jù),并將其中的一部分數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),剩余的部分數(shù)據(jù)作為測試樣本數(shù)據(jù),以驗證所得分類器的合理性和正確性。在分類器通用性方面,本論文選用7-BUS網(wǎng)絡(luò)圖的部分故障數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),再利用 36-BUS網(wǎng)絡(luò)圖的所有故障數(shù)據(jù)作為測試樣本數(shù)據(jù),依次驗證故障分類器的通用性。仿真軟件和程序語言介紹運行環(huán)境本論文運行環(huán)境采用的是WindowsXP開發(fā)平臺。MicrosoftWindowsXP秉承了Windows2000的安全性和可靠性,并且集成了Windows2000的易用性,為各個行業(yè)的用戶提供了一種簡單有效而且強大的計算平臺。是一個適合于多任務(wù)和環(huán)境的桌面操作系統(tǒng)。WindowsXP具有如下的特點。1) 穩(wěn)定性更強;2) 安全性更強;3) 更好的應(yīng)用程序恢復(fù)功能??傊?,windowsXP具有功能強大,使用和維護比較簡便,系統(tǒng)更加穩(wěn)定等優(yōu)點。其不但提供了數(shù)據(jù)庫、服務(wù)器和通信平臺的光鏈集成,與當(dāng)前絕大多數(shù)的網(wǎng)絡(luò)協(xié)議相兼容,與客戶機可以協(xié)同工作。并且它也支持網(wǎng)絡(luò)并行軟件 PVM和MPI,具有更加強大的網(wǎng)絡(luò)功能。PSASP6.2仿真軟件電力系統(tǒng)分析綜合程序(PowerSystemAnalysisSoftwarePackage)簡稱PSASP由中國電力科學(xué)研究院設(shè)計開發(fā)的一套功能強大、使用方便的電力系統(tǒng)分析程序軟件,它具有我國的自主知識產(chǎn)權(quán),是資源共享、高度集成、使用方便和開放的大型電力系統(tǒng)分析軟件包。PSASP包括有固定模型庫、電網(wǎng)基礎(chǔ)數(shù)據(jù)庫以及用戶自定義模型庫等部分,可以進行電力系統(tǒng)的輸電、配電和供電系統(tǒng)的各種短路計算和分析。PSASP的結(jié)構(gòu)、功能及特點:(1)PSAS唄有三層的體系結(jié)構(gòu)1)第一層是模型和公用數(shù)據(jù)的資源庫;2)第二層是基于第一層的資源庫的應(yīng)用程序包;3)第三層是分析工具和最后的計算結(jié)果庫。(2)PSASP各種計算的公用數(shù)據(jù)是由文本和圖形兩種數(shù)據(jù)輸入編輯方式的電網(wǎng)基礎(chǔ)數(shù)據(jù)庫來支持的,其中包含有變壓器、發(fā)電機、負荷、交流線、直流線等電網(wǎng)結(jié)構(gòu)的一些基本元件。有文本和圖形兩種輸入編輯方式, PSASP提供了各種用于計算和分析的基本數(shù)據(jù)支持,可以從中抽取計算基本的數(shù)據(jù),直觀方便,而且還提供了功能強大的用戶自定義模型方法。PSASP提供了功能非常強大的用戶自定義(UD)建模方法,為研究電力系統(tǒng)新設(shè)備、新裝置的自行建模提供了很好的工具。近些年來在國內(nèi)許多大學(xué)和科研單位都應(yīng)用PSASP的UD建模方法做出了大量的研究工作。用戶自定義建模方法是在可以不用了解程序內(nèi)部結(jié)構(gòu)和編程設(shè)計的條件下,用戶可以按照自己所需計算和分析的要求,設(shè)計各種所需的電網(wǎng)模型,并且可以靈活模擬大量的系統(tǒng)元件、自動裝置和控制功能。為PSASPT充其功能,為用戶開放提供了強有力的工具。PSASP可使用戶建立任何元件的模型(負荷、電源、各種控制保護裝置元件等)作為各種計算的模型庫,直觀方便的文本和圖形兩種模型編輯方式調(diào)用簡單,計算快速,基于公用資源的交直流電力系統(tǒng)分析程序包,有以下應(yīng)用功能:潮流計算、網(wǎng)損分析、暫態(tài)穩(wěn)定、電壓穩(wěn)定、短路電流、短路電壓、靜態(tài)安全分析、靜態(tài)和動態(tài)等值、小干擾穩(wěn)定、直接法暫態(tài)穩(wěn)定、參數(shù)優(yōu)化協(xié)調(diào)、最優(yōu)潮流和無功優(yōu)化、繼電保護整定與仿真等。PSASP的主要特點:1) PSASP提供了實用的用戶程序接口(UPI)環(huán)境,使的可以讓PSASP莫塊聯(lián)合用戶程序模塊共同運行,共同完成用戶所需的計算任務(wù);2) 交直流混合電力系統(tǒng)、固定模型庫和用戶自定義模型庫支持、提供用戶程序接口,實現(xiàn)與用戶程序聯(lián)合運行、文本和圖形兩種運行模式及多種形式的結(jié)果輸出、開放友好的用戶程序接口環(huán)境;3) 用戶程序接口(UPI)為用戶提供了進一步自由,進一步開放的環(huán)境進行聯(lián)合編程;4) 利用Windows操作系統(tǒng)提供的動態(tài)連接庫(DLL)支持,在計算精度和時間上可以使用戶程序接口(UPI)方式與PSAS吶部的固定模型方式達到同樣的效果。下圖3.4和圖3.5是PSAS仿真短路數(shù)據(jù)的部分截圖

圖3.4 短路計算信息圖3.5 填寫故障信息與數(shù)據(jù)MATLAB7.0工具箱程序語言MATLAB?序語言是矩陣實驗室(MatrixLaboratory)的簡稱,是美國MathWorks公司研制的商業(yè)數(shù)學(xué)軟件,可用于算法開發(fā)、數(shù)據(jù)的分析、數(shù)據(jù)可視化以及數(shù)值計算的一種高級計算語言和交互式環(huán)境,主要包括MATLA編程環(huán)境和Simulink仿真兩大部分。MATLA在數(shù)學(xué)方面的科技應(yīng)用軟件中,其數(shù)值計算可謂是首屈一指。MATLA可以進行矩陣運算、實現(xiàn)算法、創(chuàng)建用戶自己的界面、繪制函數(shù)和數(shù)據(jù)、連接其他編程語言的程序等,主要應(yīng)用于圖像處理、工程計算、信號檢測、信號處理與通訊、控制設(shè)計、金融建模設(shè)計與分析等領(lǐng)域。MATLA程序語言有以下特點:1) 可運用于工程技術(shù)的計算;2) 其開發(fā)環(huán)境可對程序代碼、文件和數(shù)據(jù)進行管理;3) 交互式工具可以按迭代的方式探查、設(shè)計及求解問題;4) 提供的各種工具可用于構(gòu)建自定義的圖形用戶界面;5) 二維和三維的圖形函數(shù)可用于可視化數(shù)據(jù);6) 內(nèi)核僅僅支持小寫,不支持大寫輸入;7) 數(shù)學(xué)函數(shù)可運用于統(tǒng)計、線性代數(shù)、傅立葉分析、篩選、優(yōu)化以及數(shù)值積分等;8) 各種函數(shù)可將基于MATLA的算法與外部應(yīng)用程序和語言(如C、C++Fortran、Java、COM以及MicrosoftExcel)集成。MATLA相比與其他程序語言其優(yōu)勢:1) 友好的工作平臺和編程環(huán)境;2) 簡單易用的程序語言;3) 強大的科學(xué)計算機數(shù)據(jù)處理能力;4) 出色的圖形處理功能;5) 應(yīng)用廣泛的模塊集合工具箱;6) 實用的程序接口和發(fā)布平臺;7) 應(yīng)用軟件開發(fā)(包括用戶界面)。本章小結(jié)本章主要分析了電力系統(tǒng)的兩種輸電方式、輸電線路的故障類型、故障現(xiàn)象、原因及其特點,給出了本論文所研究的輸電線路的模型和實際要仿真的網(wǎng)絡(luò)圖,并對該模型進行了分析,介紹了PSASF軟件和MATLAB軟件。最后根據(jù)輸電線路的故障數(shù)據(jù)的特點,總結(jié)了簡單有效的輸電線路故障判別方法。

SVM在輸電線路中的具體應(yīng)用LS-SVM原理及LS-SVMMATLAB具箱從上世紀九十年代以來,在支持向量機的算法研究、設(shè)計和實現(xiàn)等方面已經(jīng)取得了大量的成果。1)對SVM的最優(yōu)化技術(shù)進行了改進或改造SVM的形式,對SVM的計算過程進行簡化,例如線性SVM最小二乘支持向量機[41,42,43](LS-SVM等;2)為便于SVM處理大規(guī)模的問題,對SVM勺計算速度進行了進一步的提高,例如序列最小化算法;3)利用SVM的結(jié)構(gòu)風(fēng)險最小化原理(SRM原則)、核函數(shù)思想等對傳統(tǒng)的線性算法進行了改造,設(shè)計出其對應(yīng)的核形式,例如核主成份分析等; 4)依據(jù)結(jié)構(gòu)風(fēng)險最小化原理(SRM?則)和SVM的—些核心思想提出了的新的算法,例如廣義支持向量機算法、v-SVM算法等。由于支持向量機具有很好的泛化能力[44],并且在其訓(xùn)練時所得到的解是其全局最優(yōu)解,因而SVM在許多模式識別領(lǐng)域得到了廣泛的應(yīng)用。但其在訓(xùn)練時是一個具有約束條件的二次規(guī)劃問題,而且其約束數(shù)目等于樣本容量,這就使得 SVM在訓(xùn)練時將消耗大量的時間,特別是在當(dāng)樣本容量比較大的時候其訓(xùn)練時間有時會過長而被難以接受。為了解決這個問題,提高支持向量機的訓(xùn)練效率, suykcn等人改變了標準支持向量機的風(fēng)險函數(shù)和約束條件,推導(dǎo)設(shè)計出了一種新的支持向量機算法:最小二乘支持向機(LeastSquaresSupportVectorMachine,即LS-SVM算法)。LS-SVM在訓(xùn)練時只需要求解一個線性的方程組從而使 SVM便于實現(xiàn),并且在很大程度上提高了SVM勺訓(xùn)練效率,因而其在非線性建模和模式識別等領(lǐng)域得到了進一步0圖4.1LS-SVM的故障識別框圖廣泛的應(yīng)用。圖4.1為具體的LS-SVM的故障識別框圖0圖4.1LS-SVM的故障識別框圖最小二乘支持向量機LS-SVM(LeastSquareSupportVectorMachines) 是SVM的其中一種改進的算法,LS-SVM將SVM中的二次規(guī)劃問題利用二次損失函數(shù)轉(zhuǎn)化為求解線性方程組問題,在確保其計算精度的同時有效地降低了其計算的復(fù)雜性,有效地提高了其求解速度。4.1.1LS-SVM原理最小二乘支持向量機(LS-SVM是SVM的一種改進算法,它是將傳統(tǒng)SVM中的不等式約束條件修改為等式約束最小二乘支持向量機LS-SVM(LeastSquareSupportVectorMachines) 是SVM的其中一種改進的算法,LS-SVM將SVM中的二次規(guī)劃問題利用二次損失函數(shù)轉(zhuǎn)化為求解線性方程組問題,在確保其計算精度的同時有效地降低了其計算的復(fù)雜性,有效地提高了其求解速度。4.1.1LS-SVM原理最小二乘支持向量機(LS-SVM是SVM的一種改進算法,它是將傳統(tǒng)SVM中的不等式約束條件修改為等式約束[45,46,47],并且將誤差平方和損失函數(shù)作為訓(xùn)練集的經(jīng)驗損失,將SVM中的二次規(guī)劃問題轉(zhuǎn)化為線性方程組求解,有效地提高了求解速度和計算的收斂精度。1)兩類LS-SVM分類器在兩類分類問題中,設(shè)有訓(xùn)練樣本集Sv:{xi,yi),^1,2/,l其中xrR'為模式向量,I為樣本的容量,另yj?{1-1}為目標的類別標號,則將支持向量機中的優(yōu)化問題的不等式約束條件改為等式約束,并將其經(jīng)驗風(fēng)險函數(shù)改為二次函數(shù),利用LS-SVM算法構(gòu)造出二分類的SVMLS-SVM選擇了誤差/乍為二次項,則其優(yōu)化問題為:minQ(‘,)=1 ‘丁‘ 1Jj2 2 i=1(4.1)上式(4.1)的等式約束條件為yi@J*(Xi)+b)=1-? ,21,2,…,1(4.2)通過上式(4.2)的對偶形式可求得其最優(yōu)解,依據(jù)目標函數(shù)和約束條件可對對偶形式建立拉格朗日函數(shù):L(,b,"22心iI-、ai(yiC-T(xjb)-1jid(4.3)上式(4.3)中a為拉格朗日乘子,根據(jù)庫恩-塔克(Kuhn-Tucker)條件:(4.4)可得:(4.5)[0 (巧呷=;01(4.5)巴Q+cP一[a一[Y一在上式(4.5)中,

(4.6)kW(Xk)]f(Xi)」丫=[%』2,…,y」Ti「[1,1,….1]T(4.6)a=[aHa2, ,ai]上式(4.6)為一線性方程組,可用最小二乘法求解出a和b的值,由此可得到分類決策的判別函數(shù)為:y(x)二signCai((x))T(x)b) (4.7)上式(4.7)中Sv為支持向量的集合。對每一個二分類的 SVM訓(xùn)練后找出其對應(yīng)的支持向量,建立最優(yōu)分類面。多類LS-SVM分類器顯然上述LS-SVM方法只能應(yīng)用到兩類模式的分類問題當(dāng)中,卻不能解決多類分類問題。當(dāng)LS-SVM應(yīng)用于解決多類分類問題時,假設(shè)在I類分類問題中,其訓(xùn)練樣本數(shù)據(jù)Sv:")」=1,2,,l,其中yi為l維的由-1和+1組成的l維向量,當(dāng)x為第j類別時,yi的第j個目標元素為-1,其余目標元素的皆為+1。為了下述方便,將訓(xùn)練樣本數(shù)據(jù)存儲到兩個數(shù)據(jù)矩陣X和丫中,他們的第i行分別為Xi和y。根據(jù)SRM原則可得到式(4.8)所示的約束優(yōu)化問題[48,49]:1 T 1 門 1 .minQ(■i,6, =才、■■i■■i 二二匚:i (4.8)i 2 k=1i=1而通過與兩類SVM^類類似的變換,上式(4.8)的解由下式給出:I0TyiI0Tyi'1(i)■C4-I_a(i)=1,2,,1(4.9)上式(4.9)中,yi.為丫的第i列,0⑴則由元素0:=丫⑴%訃(為,xQ組成,a⑴是對應(yīng)于yh的Lagrange乘子向量,bi是對應(yīng)于y.的常數(shù)項。上式(4.9)的求解是求解上式(4.5)的問題。在求解出了a(i)和bi之后,則可以建立下述LS-SVM函數(shù):(4.10)(4.10)yj(x)=為ajyjk(x,Xi)bj,i,j=1,2, ,1而測試向量x的所屬類別則由最后所得的判別函數(shù)y(x)二si働心)),j=1,2/,1輸出組成的向量y決定。LS-SVMIab工具箱基于MATLAB^最小二乘支持向量機工具箱,包括回歸、分類、時間序列預(yù)測和無監(jiān)督的學(xué)習(xí)等內(nèi)容。該工具箱的代碼都是采用 C語言程序進行編寫的。LS-SVM工具箱根據(jù)不同的計算機系統(tǒng)可以運用在 Windows版本和Linux版本,目前LS-SVM工具箱有3個版本,其中包括有基本的和高級的,另外一個是在 C語言環(huán)境下運行的版本,每個不同的算法包含不同的函數(shù)。在 LS-SVM工具箱呦外有一個C程序的編譯器,它會自動把Matlab程序編譯成C程序,然后在C程序下進行計算,這樣就大大提高了LS-SVM的運算效率。MATLA可以根據(jù)數(shù)據(jù)的多少和數(shù)據(jù)文件的格式不同,而采用對應(yīng)的方法獲取數(shù)據(jù)。1)用元素列表的方法直接輸入數(shù)據(jù);2)創(chuàng)建數(shù)據(jù)文件,通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論