改進的模糊C均值法在負荷特性統(tǒng)計數據聚類中的應用畢業(yè)設計論文_第1頁
改進的模糊C均值法在負荷特性統(tǒng)計數據聚類中的應用畢業(yè)設計論文_第2頁
改進的模糊C均值法在負荷特性統(tǒng)計數據聚類中的應用畢業(yè)設計論文_第3頁
改進的模糊C均值法在負荷特性統(tǒng)計數據聚類中的應用畢業(yè)設計論文_第4頁
改進的模糊C均值法在負荷特性統(tǒng)計數據聚類中的應用畢業(yè)設計論文_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、改進的模糊c均值法在負荷特性統(tǒng)計數據聚類中的應用摘要電力負荷是整個電力系統(tǒng)的安全穩(wěn)定運行中較活躍的一部分。建立符合實際的動態(tài)負荷模型對電力系統(tǒng)規(guī)劃、設計和運行等諸方面均有十分重要現實意義。本文采用實用化負荷建模思想 ,對負荷特性進行聚類,從而為變電站建立合適的負荷模型打下基礎?;谀壳柏摵山7矫娲嬖诘膯栴},使用模糊c均值法,對同一地域不同地點變電站的負荷統(tǒng)計數據進行聚類分析。針對湖南電網48個變電站,對模糊c均值法實施改進后對其進行聚類,并與未改進的模糊c均值法的聚類結果進行比較,以說明改進方案的有效性。關鍵字:電力負荷;負荷特性;聚類;模糊c均值法application of improv

2、ed fcm to electric load characteristics of statistical data clusteringabstractthe power load is an active part in the security and stable operation of the entire electrical power system. it is significantly important to make suitable load model for the power system planning, design and operation. in

3、 this paper the practical load modeling method is employed, and the load characteristics is clustered to establish the actual load model for substations. based on the current problems, fcm with hierarchical clustering is used to perform the clustering of the load characteristics data of the differen

4、t substations on the same area, the improved method is applied for the clustering of hunan grid substation. the clustering result shows that the improved method is effective comparing with the unimproved method.key words: power load; load characteristic; cluster,fcm目 錄第一章 緒論.11.1 研究背景.11.2發(fā)展及研究現狀.2

5、1.2.1 發(fā)展.2 1.2.2 研究現狀.4 1.2.2.1 電力負荷建模的總體原則.4 1.2.2.2 電力負荷建模的基本概念.4 1.2.2.3 分類.5 1.2.3 實用化負荷建模思想.6 1.2.3.1 統(tǒng)計綜合法.6 1.2.3.2 總體測辨法.71.3 聚類分析在負荷特性分析中的應用現狀.81.4 本文主要研究內容.9第二章 聚類分析.102.1 聚類分析的基本概念.102.2 聚類方法.112.3 系統(tǒng)聚類法.15 2.3.1 最小張樹聚類法.16 2.3.2 基于密度的聚類算法.16 2.3.3 基于網絡的聚類方法.16 2.3.4 基于模型的聚類算法.16 2.3.5 基于

6、劃分的聚類算法.162.4 各算法優(yōu)缺點比較.17第三章 模糊c均值在負荷特性聚類中的應用實例.193.1 聚類在電力系統(tǒng)中的應用綜述.193.2 模糊c均值聚類算法.20 3.2.1 硬c均值聚類算法(hcm).20 3.2.2 模糊c均值聚類.22 3.2.3 程序流程圖.233.3對模糊c均值法的改進.25 3.3.1 改進的各方案比較.25 3.3.2 最終改進方案的選定.263.4 聚類實例.27 3.4.1 原始數據聚類數據.27 3.4.2 未改進的模糊c均值法在實例中的應用.27 3.4.3 改進的模糊c均值法在實例中的應用.28 3.4.4 兩種算法的比較.293.5 結果分

7、析.31第四章 結語.33參考文獻 .34致謝.35附錄.36附錄a 原始聚類數據.36附錄b 系統(tǒng)聚類法所得的聚類中心生成的隸屬度矩陣.38附錄c 改進的模糊c均值法源程序.41附錄d 類間距離計算源程序.47附錄e 類內距離計算源程序.48 第一章 緒 論1.1 研究背景目前電力系統(tǒng)的數字仿真已成為電力系統(tǒng)設計、規(guī)劃、運行的主要工具, 相應的決策無不是以數字仿真的結果為依據。但數字仿真畢竟是仿真, 其與實際系統(tǒng)有著或大、或小的誤差, 誤差的大小及性質對該決策的正確性具有決定作用。如果決策基于悲觀的仿真分析結果,則在規(guī)劃設計方面將會因不必要的加強系統(tǒng)結構和反事故措施而投入過多的資金,造成浪費

8、;在運行方面采取過分保守的策略而限制了功率傳輸的極限,使設備得不到充分的利用。如果決策基于樂觀的仿真分析結果,則在規(guī)劃設計方面將會導致系統(tǒng)結構、反事故措施方面投入資金不足,從而產生不合理的系統(tǒng)規(guī)劃方案,給以后的系統(tǒng)運行造成不便,帶來許多運行限制;在運行方面將導致系統(tǒng)運行于危險的臨界狀態(tài)或疏于防范而造成事故。仿真結果的誤差是由仿真所用模型的準確性決定,目前發(fā)電機組和輸電網絡的模型已相當成熟,比較而言,電力負荷模型仍相當簡單,往往從基本物理概念出發(fā),采用理想化的模型,如: 恒功率、恒阻抗、恒電流或三者的組合。負荷模型的過分粗糙已成為制約電力系統(tǒng)仿真計算精度的關鍵因素。當今,在電力市場化的趨勢沖擊下

9、,人們對系統(tǒng)分析軟件的精度要求將越來越高,負荷模型的研究的重要性也將更加凸現7。電力負荷作為能量的消耗者,在電力系統(tǒng)的設計、分析與控制中有著重要影響。在進行電力系統(tǒng)分析時,不恰當地考慮負荷的模型,會使所得結果與系統(tǒng)實際情況不相一致,或偏樂觀,或偏保守,從而構成系統(tǒng)的潛在危險或造成不必要的投資。目前,數字模擬計算已成為電力系統(tǒng)設計、運行與控制中不可缺少的輔助手段。人們不但要求模擬計算結果是定性正確的,而且要求模擬計算結果是定量精確的。大量的計算與實驗結果表明:負荷模型對電力系統(tǒng)動態(tài)行為的定量模擬結果影響很大,對潮流計算、短路計算、安全分析、電壓穩(wěn)定性等也有一定影響。在臨界情況下,還有可能從根本上

10、改變定性的結論。例如,在澳大利亞queensland系統(tǒng)將理論計算與實測結果作了比較,發(fā)現用恒定阻抗表示負荷時兩者相差較大,而當負荷的有功電壓指數改為1.4,無功電壓指數改為3.0時,兩者基本吻合。另一計算表明,當某負荷的頻率相關成分提高到40%時,原來穩(wěn)定的系統(tǒng)變成不穩(wěn)定。因此,負荷的頻率特性對系統(tǒng)穩(wěn)定性也有顯著影響。還有的研究報導,感應電動機對穩(wěn)定極限的影響相當大,其誤差有時可高達30%。此外,負荷特性對低頻振蕩也有很大影響。通過這些例子,對改進負荷模型的必要性便可見一斑。在過去的幾十年間,發(fā)電機及輸電網絡的建模已取得很大的發(fā)展。與之相比,負荷建模則發(fā)展較慢,顯得有些不相匹配。顯然,電力系

11、統(tǒng)模擬計算精度的提高與發(fā)電機、輸電網絡及電力負荷三大部分的建模都有密切的關系。負荷模型的粗糙阻礙了整個系統(tǒng)模擬精度的進一步提高,并降低了改善發(fā)電機及輸電網絡模型的價值。因此,改進負荷模型具有一定的迫切性?,F代電力系統(tǒng)穩(wěn)定分析常需把仿真的時間跨度增大,人們對低頻率振蕩、頻率穩(wěn)定、中長期穩(wěn)定性等問題的興趣日增。為此,更需要研究相應的模型和算法,負荷模型當然也應考慮在內。隨著計算機技術的迅速發(fā)展,計算機的容量不斷擴大,計算速度也不斷提高。這就為采用更加精確、詳細的負荷模型創(chuàng)造了條件??傊?,電力負荷是電力系統(tǒng)的重要組成部分,電力系統(tǒng)運行與控制中的大多數內容都與負荷問題有關。因此,負荷建模研究是電力系統(tǒng)

12、運行與控制中的基礎性課題,既具有非常重要的理論意義,又具有十分顯著的工程實用價值19。1.2發(fā)展及研究現狀1.2.1 發(fā)展 人們較早就認識到負荷模型對系統(tǒng)穩(wěn)定研究的重要性, 并對此進行了初步研究, 這可算是負荷模型研究的萌芽階段。 到了60 70年代,由于數字電子計算機及控制理論的引入,電力系統(tǒng)這門工程學科煥發(fā)了新的活力。在這樣的背景下, 人們可以采用數字電子計算機對復雜的電力系統(tǒng)進行精確的仿真研究。而精確的仿真的基礎便是精確的模型, 同其他系統(tǒng)元件模型一樣, 負荷建模工作有了相當的進展, 除提出了最常用的恒阻抗、恒電流、恒功率模型以外,還在計算中采用了感應電動機負荷模型和多項式、冪函數靜態(tài)負

13、荷模型。 到了70年代末80年代初統(tǒng)計綜合法 (componen t- basedmethod)的提出是負荷建模在這一時期的最重大的成果。從1976年開始美國epr i 主持了一項龐大的研究計劃。根據該計劃,研究工作在美國和加拿大同時展開。整個工作經過了嚴密的計劃和組織,從理論、現場實驗上以及數據收集系統(tǒng)的軟、硬件開發(fā)和數據處理程序等幾個方面全面鋪開。美國的texas 大學與ge及其他一些電力公司合作致力于統(tǒng)計綜合法負荷建模的研究。該方法是在實驗室內確定每種典型負荷 (如工業(yè)電動機、電冰箱、熒光燈等)的平均特性方程,然后在一個負荷點上統(tǒng)計一些特殊時刻的負荷 (如冬季峰值負荷、夏季峰值負荷)的組

14、成,即每種典型負荷所占的百分比,以及配電線路和變壓器的數據,最后綜合這些數據得出該負荷點的負荷模型。經過多年的努力,到了1987年完成的el25003計劃, 一個在統(tǒng)計綜合法負荷建模中最具影響的軟件包epr i 的load syn開發(fā)完成了 17 。該軟件包使用時雖然需要三種數據: 負荷組成, 即各類負荷(民用、商業(yè)、工業(yè)等)所占的比例; 各類負荷中各用電設備(熒光燈、電動機、空調等) 所占的比例; 各用電設備的平均特性。但對于使用者來說,必須提供的只有第一種數據,后兩種數據可以利用該軟件包所給的典型值,這給該軟件包的使用者提供了一定的方便。 60年代開始迅速發(fā)展起來的系統(tǒng)辨識理論到了80年代

15、前后已取得了許多令人矚目的成就,加之計算機數據采集與處理技術的發(fā)展,為另一種新的負荷建模方法-總體測辨法的產生奠定了基礎。該方法的基本思想是將負荷群作為一個整體, 先在現場進行人為擾動實驗或捕捉自然擾動,采集并記錄該擾動數據,然后由現場采集的數據辨識負荷模型的結構和參數,最后再由大量的實測數據驗證所建模型的有效性。中國、美國、日本、加拿大和澳大利亞等國在實際系統(tǒng)研制和投運了一大批電力負荷特性數據在線記錄裝置,記錄了大量數據,借此開展了大量的基于總體測辨法的研究 。 gigre和ieee都設有負荷建模工作組,其不定期的發(fā)表一些專題報告,以指導負荷建模方面的研究和及時總結負荷建模方面的進展。199

16、0年gigre發(fā)表的專題報告,結合荷蘭fgo電網對各種負荷模型的暫態(tài)穩(wěn)定計算效果為例論證了負荷模型的重要性,并對建立實際負荷模型的方法及負荷測試的有關問題進行了論證。ieee在1993年發(fā)表的報告統(tǒng)一了負荷建模中的許多術語和定義, 總結了負荷模型從建立、驗證到應用的有關問題。ieee在1995年2月的報告列出了國際上學者在負荷建模研究中提出的許多有價值的負荷模型以及他們的文獻和著作,以期推動負荷建模的進一步研究和實際應用。在1995年8月的報告中推薦了用于電力系統(tǒng)潮流計算和動態(tài)仿真的標準化負荷模型,為各種仿真程序的使用者指明了方向7。1.2.2 研究現狀1.2.2.1 電力負荷建模的總體原則

17、(1)可用性原則 電力負荷建模具有時變性、隨機性、分布性、多樣性、非連續(xù)性等特點,多年來雖然人們做了大量努力,但要對所有負荷點、所有時間點建立“精確”的模型是不現實的。雖然不能做到定量完全精確,但至少要做到定性正確。所以,在目前只能考慮建立“可用”的負荷模型,對該模型的最基本的要求是能夠反映負荷的實際本質特征。 (2)實用性原則 電力負荷建模的目的當然是為了應用。這就要求模型在能夠反映負荷本質的前提下要盡量簡單,最好與現有電力系統(tǒng)計算程序能夠銜接。同時要求方法也要盡量簡單,最好少做全系統(tǒng)性的大規(guī)模試驗尤其是穩(wěn)定試驗。 (3)針對性原則 國外對電力負荷建模已有大量研究,美國等國家進行了大量實際負

18、荷參數的研究,給出了推薦參數。但不同國家的管理體制和負荷情況具有明顯差異,國外的做法不一一定就能夠照搬,國外的數據也不一定能夠照用。我國開展負荷建模工作,一方面要借鑒國外的經驗,但另一方面要針對我國的實際,立足國內,走1條 有中國特色的負荷建模之路8。1.2.2.2 電力負荷建模的基本概念電力系統(tǒng)是由發(fā)電廠、電力網及電力負荷三大部分組成的能量生產、傳輸和使用系統(tǒng)。發(fā)電廠是電能的發(fā)出者,這些電能經高壓輸電網及低壓配電網被傳送到各個用戶,并由安裝在用戶處的用電設備所消耗。電力負荷就是這些用電設備的總稱,其中有時也包括配電網絡,并簡稱為負荷。電力系統(tǒng)中有各式各樣的負荷,可以從不同的角度進行分類。從用

19、電部門來看,可以分為城市民用負荷、商業(yè)負荷、農業(yè)負荷、工業(yè)負荷及其它負荷。城市民用負荷主要是城市居民的家用電器負荷。商業(yè)和工業(yè)負荷是為商業(yè)與工業(yè)服務的負荷。農業(yè)負荷是農村所有負荷的統(tǒng)稱,包括農村民用電、生產與排灌用電及農村商業(yè)用電等。其它負荷包括市政用電、公用事業(yè)用電、政府辦公用電、鐵路與電車用電等等。家用電器大致有如下幾類。1) 照明電器:熒光燈、白熾燈;2) 備餐電器:電爐、電飯鍋、電烤箱、烤爐等等;3) 洗熨電器:洗衣機、電熨斗、烘干機等;4) 食品儲存電器:電冰箱及其它冷凍設備;5) 調溫電器:電風扇、空調等;6) 電視音響電器:收錄機、電視機、錄像機等。 工業(yè)負荷中電力設備種類更多,

20、最主要的是感應電動機和同步電動機,其它還有整流型負荷、電弧爐、阻抗型負荷(如工廠照明)等等。配電網主要有配電線路、變壓器和補償電容等。 負荷吸收的有功功率(p)及無功功率(q)是隨著負荷母線的電壓(u)和頻率(f)的變動而變化的,這就是負荷的電壓、頻率特性,用于描述負荷特性的數學方程稱為負荷模型。建立負荷模型就是要確定描述負荷特性的數學方程的形式及其中的參數,簡稱為負荷建模19。1.2.2.3 分類按照是否反映負荷的動態(tài)特性,負荷模型一般可分為靜態(tài)模型和動態(tài)模型兩類,前者通常用代數方程來描述,后者通常用微分方程或差分方程描述。每一類都有多種結構。 (1) 靜態(tài)模型在穩(wěn)態(tài)條件下,負荷功率與端電壓

21、及頻率之間的非線性函數關系稱為負荷的靜態(tài)模型19 ?;镜撵o態(tài)負荷模型的結構為:冪函數模型;多項式模型。通常一個冪函數在電壓變化范圍比較大的情況下仍能較好地描述許多負荷的靜態(tài)特性。多項式模型由恒功率、恒電流、恒阻抗三部分組成,它可以看作是三個冪函數相加的特例,這三個冪函數的冪指數分別為0,1,2。靜態(tài)的負荷模型主要適用于潮流計算和以潮流計算為基礎的穩(wěn)態(tài)分析中。在電力系統(tǒng)動態(tài)分析中,靜態(tài)負荷模型一般適用于計算結果對負荷模型不太敏感的負荷點。目前國內電力系統(tǒng)潮流計算所采用的負荷模型多是恒功率模型,暫態(tài)計算所采用的負荷模型也多是多項式模型(多為40% 的恒功率+60%的恒阻抗)。與有些文獻所述不同的

22、是,由于大部分的計算程序采用的多項式負荷模型, 在低電壓下(0.6pu) 多相應的轉化為恒阻抗模型,所以對多項式的負荷模型并不存在電壓為零時功率不過零點的問題4。 (2) 動態(tài)模型動態(tài)負荷模型又可進一步分為機理模型和非機理模型。其中機理模型通常就是感應電動機模型。相應的還有采用一臺等值感應電動機, 兩臺或更多的等值感應電動機 , 以及將感應電動機并聯上有關的靜態(tài)模型等幾種形式。非機理模型則是在系統(tǒng)辨識理論發(fā)展過程中,從大量的具體動態(tài)系統(tǒng)建模中概括出來的,對一大類動態(tài)系統(tǒng)具有很強的描述能力。每一種非機理模型模型都有其普遍適用的范圍, 也正是由于其普遍適用性也掩蓋了它作為具體系統(tǒng)的具體物理機理。目

23、前常用的非機理動態(tài)負荷模型的形式有:常微分方程模型, 傳遞函數模型 , 狀態(tài)空間模型 ,時域離散模型 。此外還有考慮描述負荷模型非線性而提出的人工神經網絡模型4。負荷模型的評判是困難的,因為不同的應用目的對負荷的要求不同,不同的研究人員看問題的出發(fā)點可能也不一樣。一般來說,需要考慮以下幾個方面:(1)精確度;(2)計算量;(3)物理背景;(4)參數獲??;(5)應用方便??梢哉f,目前沒有一種統(tǒng)一的負荷模型在各方面都可以適用。事實上,上述幾個方面有的有時甚至是互相矛盾的。因此,往往要根據應用者關心的主要方瑤,選擇一種折中的負荷模型。1.2.3 實用化負荷建模思想 負荷建模:兩大方法、特點、不足時至

24、今日,人們已提出了不少負荷建模方法,這些方法可以歸納為兩大類:一類是“統(tǒng)計綜合法”,另一類是“總體測辨法”。 1.2.3.1 統(tǒng)計綜合法 統(tǒng)計綜合法的基本思想是將負荷看成個別用戶的集合,先將這些用戶的電器分類,并確定各種類型電器的平均特性,然后統(tǒng)計出各類電器所占的比重,最后綜合得出總的負荷模型,其典型成果體現在epri聯合研究集團開發(fā)研制的loadsyn軟件中。這套軟件的理論部分是由美國texas大學的arlington分校負責的,ge和其他電力公司負責在電網上進行實驗驗證。現在許多國家的電力部門都采用這類辦法。在采用這類方法時,需要3種數據資料:負荷組成及各類負荷所占的比重;配電網絡的參數;

25、各類負荷的平均特性。一般來說,后兩種數據變化較小,而第一種數據變化較大。據文獻報導:有功功率的電壓特性系數隨運行條件的變化較小,從而使綜合得到的有功電壓特性與實際的比較吻合;而無功功率的電壓特性系數則變化較大,使綜合得到的無功電壓特性與其試驗結果相差較大;綜合得到的頻率特性與試驗結果相差較大;對負荷動態(tài)特性也不能很好地模擬。統(tǒng)計綜合法是一種傳統(tǒng)的做法,比定性估計負荷參數前進一大步。它不依賴現場試驗,花費的代價較小。但這種方法存在著下列問題:(1) 需事先統(tǒng)計成千上萬個用戶的負荷組成及參數。這種統(tǒng)計工作不但耗時費力,而且難以統(tǒng)計準確。(2) 各類電器的“平均特性”難以確定。(3) 統(tǒng)計綜合工作不

26、可能隨時進行,甚至不能經常進行。而負荷特性是經常變化的,甚至變化很大。因此,這種方法不能適應負荷特性的時變性。(4) 對無功電壓特性、頻率特性及動態(tài)特性難以模擬準確。(5) 負荷成分往往比較復雜,包含的用電設備可達數十種,如電動機、電阻負荷、電壓器、熒光燈等等。若將所有這些類型的負荷都考慮進去,則因各類用電設備的模型不同,從而導致總的模型難以應用。隨著負荷成分的日益復雜化,這個問題將更加突出。1.2.3.2 總體測辨法 總體測辨法的基本思想是將負荷群看作一個整體,先從現場采集測量數據,然后確定負荷模型的結構,最后根據現場采集的數據辨識出模型參數,其典型成果體現在加拿大quebec及ontari

27、o水電研究所開發(fā)的在線監(jiān)測裝置上。他們設計了一套微機控制的實時數據采集系統(tǒng),收集了大量的現場實測數據資料。在此基礎上,離線或在線辨識出負荷特性系數??傮w測辨法是一種比較新穎的方法,目前正處于開發(fā)研究中。這種方法所必需的現場測量工作比較復雜,甚至會受到實際條件的限制,例如電壓波動難以做到超過10%。但與統(tǒng)計綜合法相比,它具有如下優(yōu)點:(1) 無需知道各個用戶的負荷組成及參數,不依賴于用戶統(tǒng)計資料。(2) 在負荷母線處長期裝設測量裝置,可以根據各個時刻的測量數據得到相應的負荷特性參數,從而解決了負荷特性的時變性問題。(3) 有希望獲得較好的參數估計值。(4) 當負荷組成比較復雜時,仍可以用簡單的輸

28、入/輸出模型來描述。這種模型的參數易于辨識,模型結構統(tǒng)一,便于處理。(5) 總體測辨法實質上是將負荷看作“灰色系統(tǒng)”或“黑色系統(tǒng)”,而現代系統(tǒng)理論為總體測辨法提供了有力的理論依據和分析工具19 。1.3 聚類分析在負荷特性分析中的應用現狀 聚類分析是一種新興的多元統(tǒng)計方法,是當代分類學與多元分析的結合。聚類分析是將分類對象置于一個多維空間中,按照它們空間關系的親疏程度進行分類。也就是說,對彼此不同屬性的事物進行辨認,將具有相似屬性的事物聚為一類,使得同一類的事物具有高度的相似性8。 聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。它是一種重要的人類行為。聚類與分類的

29、不同在于,聚類所要求劃分的類是未知的。聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析的目標就是在相似的基礎上收集數據來分類。聚類源于很多領域,包括數學,計算機科學,統(tǒng)計學,生物學和經濟學。在不同的應用領域,很多聚類技術都得到了發(fā)展,這些技術方法被用作描述數據,衡量不同數據源間的相似性,以及把數據源分類到不同的簇中。從統(tǒng)計學的觀點看,聚類分析是通過數據建模簡化數據的一種方法。傳統(tǒng)的統(tǒng)計聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。采用k-均值、k-中心點等算法的聚類分析工

30、具已被加入到許多著名的統(tǒng)計分析軟件包中,如spss、sas等。從機器學習的角度講,簇相當于隱藏模式。聚類是搜索簇的無監(jiān)督學習過程。與分類不同,無監(jiān)督學習不依賴預先定義的類或帶類標記的訓練實例,需要由聚類學習算法自動確定標記,而分類學習的實例或數據對象有類別標記。聚類是觀察式學習,而不是示例式的學習從實際應用的角度看,聚類分析是數據挖掘的主要任務之一。而且聚類能夠作為一個獨立的工具獲得數據的分布狀況,觀察每一簇數據的特征,集中對特定的聚簇集合作進一步地分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預處理步驟。1.4 本文主要研究內容 負荷建模領域的研究目前大多仍以理論研究為主,尚未很

31、好地推廣到工程應用。隨著當前電網規(guī)模的日益增大,對于一個廣域電力系統(tǒng)分析人員而言,如果該區(qū)域的所有負荷站點均采用同一種負荷模型,該負荷模型必定是非常保守和粗糙的。而如果將每個負荷站點均根據總體測辨法建立起相當精確的負荷模型,這將需要大量的設備和資金的投入,無論是從人力、財力和物力上考慮都是不可取的。這一問題是近來負荷建模工作一直不斷探討的熱點,目前正在逐步形成一類基于統(tǒng)計與基于量測相結合的負荷建模新方法。在初步探討了聚類分析技術在負荷建模中的應用現狀的基礎上,重點研究了模糊c-均值法的基本原理和實現過程,并將其用于統(tǒng)計負荷特性數據的分類,從而驗證了聚類技術在負荷特性分類中應用的工程實用性,為統(tǒng)

32、計綜合法和總體測辨法的融合提供了有效的途徑。第2章 聚類分析聚類分析就是如何對樣品(或變量)進行量化分類的問題。通常聚類分析分為q型聚類和r型聚類。q型聚類是對樣品進行分類處理,r型聚類是對變量進行分類處理。2.1 聚類分析的基本概念 在實際研究中,既可以對樣本個體進行聚類,也可以對研究變量進行聚類,對樣本個體進行的聚類通常稱為q型聚類,對研究變量進行的聚類稱為r型聚類。本文采用的是對樣本個體進行聚類分析。所謂樣本,就是指待分類的對象全體。每個樣本都由一系列指標表示,這些指標形成樣本矢量,全體樣本矢量構成的集合稱為樣本矢量集,這里設樣本矢量集合為x=,每一個對象(i=1、2、m)都由一組n個指

33、標刻畫:。定義為樣本與的距離,常用的距離有:1 閔氏距離 如 當q=l時,稱為絕對值距離。 當q=2時,稱為歐氏距離 當q=時,稱為切比雪夫距離2馬氏距離 其中為樣本的p個指標組成的向量,為協(xié)方差矩陣3. 蘭氏距離 ()在眾多的距離中,用的較多的是歐氏距離和絕對值距離。4. 距離選擇的原則一般說來,同一批數據采用不同的距離公式,會得到不同的分類結果。產生不同結果的原因,主要是由于不同的距離公式的側重點和實際意義都有不同。因此我們在進行聚類分析時,應注意距離公式的選擇。通常選擇距離公式應注意遵循以下的基本原則:(1) 要考慮所選擇的距離公式在實際應用中有明確的意義。如歐氏距離就有非常明確的空間距

34、離概念,馬氏距離有消除量綱影響的作用。(2) 要綜合考慮對樣本觀測數據的預處理和將要采用的聚類分析方法。如在進行聚類分析之前已經對變量作了標準化處理,則通常就可采用歐氏距離。(3) 要考慮研究對象的特點和計算量的大小。樣品間距離公式的選擇是一個比較復雜且?guī)в幸欢ㄖ饔^性的問題,我們應根據研究對象的特點不同做出具體分析。實際中,聚類分析前不妨試探地多選擇幾個距離公式分別進行聚類,然后對聚類分析的結果進行對比分析,以確定最合適的距離測度方法。 在量綱取定的條件下,兩個樣本越相似,它們之間的距離d就越小,反之亦然,值得注意的是量綱的選取不同會改變某特征的判斷依據性。因此當樣本的不同特征值的量綱差別很大

35、時,會對聚類結果造成很大的影響。這就需要將各種特征值進行標準化。標準化的方法有很多種,他們可以保證比例的不變性或至少可以試圖使距離度量方法在各種特征下的貢獻達到一個最佳的平衡8。2.2 聚類方法 聚類分析的方法有很多種,經典的聚類方法有譜系數聚類分析法,動態(tài)聚類分析法,由于新的理論不斷提出,現在又有了模糊聚類分析法和灰色聚類分析法。這些方法各有優(yōu)缺點,分別適用于不同的場合。相比而言,譜系數聚類分析法和動態(tài)聚類分析法在理論上相對比較成熟。下面對這幾種方法做出介紹:1 譜系數聚類分析法 這種方法又稱為系統(tǒng)聚類分析法,設樣本矢量集合為,每個樣本有n個特征量表示,表示第k次合并時的第i類。首先,視m個

36、樣本各自成為一類,后計算類與類之間距離,選擇距離最小的一對合并成一個新類,計算在新的類別劃分下各類之間的距離,再將距離最近兩類合并,直至所有樣本聚成一類為止。將所有樣本聚成一類結果是沒有意義的,再根據一定的原則確定最終的種類個數。算法的具體步驟如下:1) 數據的標準化處理。由原樣本矢量集形成新的樣本矢量集,其中: 式中:,即各列數據平均值; 即各列數據標準方差;i=1,2,m, j=1,2,n。2) 初始分類。令k=0,每個樣本自成一類,即3) 計算各類間的距離,由此生成一個對稱的距離矩陣,其中m為類的個數(初始時,m=n)。4) 找出前一步求得的矩陣中最小元素,設它是和間的距離,將和兩類合并

37、成一類,于是產生新的聚類令k=k+1,n=n-1;5) 查聚類后的個數,如果類數n大于2,則轉至3),否則,停止。 譜系數聚類法除了要定義事物之間的親疏程度指標,還要定義類與類之間親疏程度指標并且要導出求取類間親疏指標值的遞推公式。類與類之間親疏程度指標不同,則求取類間親疏指標值的遞推公式也就不同。這樣就有很多種不同的譜系數聚類法,其中幾種介紹如下: 1)重心距離法 從物理觀點看,若一個類空間位置要用一個點表示,那就用重心來表示。設類、重心分別為、,它們分別有、個,將和合 并為,則有個樣本,易知的重心 設另一類的重心為則它與的距離平方是2) 平均距離法兩類和之間距離平方也可定義為這兩類元素兩兩

38、之間平均平方距離,即 設,類平均距離遞推公式為 3) 最短距離法定義類和之間的距離為兩類最近樣品的距離,即為 設類和合并成一個新類記為,則任一類與的距離為 4) 最長距離法定義類和之間的距離為兩類最遠樣品的距離,即為 最長距離法與最短距離法的并類步驟完全一樣,也是將各樣品先自成一類,然后將距離最小的兩類合并。將類和合并成一個新類記為,則任一類與的距離為 再找距離最小兩類并類,直至所有的樣品全歸為一類為止??梢钥闯鲎铋L距離法與最短距離法只有兩點不同:一是類與類之間的距離定義不同;另一是計算新類與其他類的距離所用的公式不同。2動態(tài)聚類分析法 動態(tài)聚類的原理是先對分類事物做一個初始的粗糙的分類,然后

39、再根據某種原則對初始分類進行修改,直至準則函數取得極值或者是分類被認為比較合理為止。其基本步驟為:1)建立初始聚類中心,進行初始聚類。2)計算模式和類的距離,調整模式的類別。3)計算各聚類的參數,刪除合并或分裂一些聚類。4)從初始聚類開始,運用迭代算法動態(tài)地改變模式的類別和聚類中心 使準則函數取得極值或設定的參數達到設計要求時停止。在眾多的動態(tài)聚類分析方法中,c均值聚類算法是最常用的一種,這里簡要介紹一下,假設樣本特征矢量集為,事先取定類的數目為c類,并確定c個初始聚類中心,按最小距離原則將各樣本分配到c類中某一類,之后不斷計算類心和調整各樣本的類別,最終使各樣本到其判屬類別中心的距離平方之和

40、最小。c均值聚類分析法是以確定的類數及選定的初始聚類中心為前提,使各樣本到其所判屬類別中心距離平方之和最小的最佳聚類,受這一前提的影響,其結果很容易陷入局部最優(yōu)。3 灰色聚類分析法 灰色聚類分析法屬于灰色系統(tǒng)理論中灰色評估范疇,灰色系統(tǒng)理論是一種新的分析系統(tǒng)的理論,它以“部分信息已知,部分信息未知”的“小樣本”、“貧信息”不確定系統(tǒng)為研究對象,主要通過對“部分”已知信息的生成、開發(fā),提取有價值的信息,實現對系統(tǒng)運行行為的正確認識和有效控制,有很多系統(tǒng)可以看成是貧信息不確定系統(tǒng),因此,這一新的理論具有十分廣闊的應用前景。4 模糊聚類分析法人類在社會實踐中,常常要把所處理的事物按其特征分為若干類,

41、所謂“物以類聚,人以群分”。由于實際對象之間在很多方面,其差異的變化表現為一種連續(xù)性,差異對象之間并沒有一個截然區(qū)別的界限,所以事物分類的本身具有模糊性的特點。模糊聚類方法是通過建立模糊相似關系而將客觀事物予以分類的方法。在普通聚類分析中,類別之間是清晰的,分類集合中的任意兩個對象要么等價,要么不等價。而模糊聚類的結論并不表征對象絕對地屬于某一類或絕對地不屬于某一類,而是表征對象在什么程度上相對地屬于某一類,在什么程度上相對地屬于另一類。模糊聚類分析的數學基礎是模糊集合論。自模糊集合論建立以來,聚類分析很快地運用了這一新的數學方法。ehruspinid 1969年在聚類分析中引入了模糊劃分的概

42、念。jcbezdek和jcdunn在1974年給出了模糊isodata聚類方法。此后國外一些學者提出了許多模糊聚類方法,更多的學者還將這些方法應用于實河海大學碩士學位論文踐,目前這種聚類分析法正在不斷改進中,有待于進一步開展研究。2.3. 系統(tǒng)聚類法系統(tǒng)聚類算法5,又稱為等級聚類法,層次聚類法。它將給定數據集合進行層次的分解。根據聚類過程方向的不同,系統(tǒng)聚類算法可以分為分解法(divisive,自頂而下)和聚類法(agglomerative,自底而上)兩類。分解法把整個集合看作一個整體(類),再逐步劃分為更小的類,直到每個數據對象分別隸屬于一個類,或者達到某個終止條件。聚合法則剛好相反,它先是

43、把每一個數據對象都看成一個單獨的類,然后合并相似的數據對象成為一個新類,直到所有數據對象置于一個類中,或者達到某個終止條件。實際中的絕大多數層次聚類算法屬于聚合法。一個純粹的層次聚類算法最大的問題是一旦一個合并或者分裂被執(zhí)行,就不可修正。目前的研究集中于凝聚層次聚類和迭代重定位方法的集成。2.3.1 最小張樹聚類法 在圖論聚類法中,將各個模式視為加權圖g的頂點,加權圖的權定義為模式之間的距離,當取類間最近距離為類間距離時,聚類過程所表示成的樹就是最小張樹7,第j步合并的兩類正是kruskal法中第j步取出的je所連結的兩類,此時每類各自的最小張樹是g的最小張樹的子集。當兩個距離較近的密聚點集之

44、間有少量孤立的模式特征時,使用前述的方法將會錯分。2.3.2 基于密度的聚類算法基于密度的聚類算法比較有代表性的有:包括基于高密度連接區(qū)域的dbscan聚類方法,通過對象排序識別聚類結構的optics聚類方法;基于密度分布函數的denclue聚類方法。其主要思想是只要臨近區(qū)域的密度(樣本的數目)超過某個閥值則繼續(xù)聚類。即對于給定簇中的每個樣本,在一個給定范圍的區(qū)域中必須至少包含某個數目的樣本,但它只能發(fā)現球狀的簇,而基于密度的方法可用來過濾“噪聲”孤立點數據,以發(fā)現任意形狀的簇。2.3.3基于網絡的聚類方法 這種方法首先將數據空間劃分成為有限個單元(cell)的網絡結構,所有的處理都是以單個的

45、單元為對象的。其突出的優(yōu)點就是處理速度快,通常與目標數據庫中記錄的個數無關的,而只與數據空間的單元有關。代表算法有:sting它利用存儲在網絡單元中的統(tǒng)計信息;clique算法,它是在高維數據空間中基于網絡和密度的聚類算法;wave-cluster算法,它通過小波變換來轉換原始的特征空間能很好的處理高維數據和大數據集的數據表格。2.3.4 基于模型的聚類算法基于模型的方法首先是基于這樣一個假定:目標數據集是由一系列的概率分布所決定的。那么,可以在空間中尋找諸如密度分布函數這樣的模型來實現聚類。統(tǒng)計的方案和神經網絡的方案是近些年兩種不同的嘗試方向。神經網絡方法將每個簇描述為一個標本。標本作為聚類

46、的“原型”,不一定對應一個特定的數據實例或對象。根據某些距離度量,新的對象可以被分配給標本與其最相似的簇。被分配給一個簇的對象的屬性可以根據該簇的標本的屬性來預測。2.3.5 基于劃分的聚類算法基于劃分的聚類方法,又稱動態(tài)聚類法。逐步聚類法,是實際中受到普遍歡迎的一種方法。這種方法把聚類分析歸結成一個帶約束的非線性規(guī)劃問題,通過優(yōu)化求解獲得數據集的最優(yōu)劃分和歸類。其基本思想是,在一個平面層次上對所有的樣本點先做出某種較為粗略的劃分,然后按照某種最優(yōu)的準則進行修正,通過算法的迭代執(zhí)行,得到一個較為合理的聚類結果?;趧澐值木垲惙椒ㄔO計簡單、解決問題的范圍廣,還可以轉化為優(yōu)化問題而借助經典數學的非

47、線性規(guī)劃理論求解,非易于計算機實現。因此,隨著計算機的應用和發(fā)展,基于劃分的聚類算法成為新的研究熱點?;趧澐值木垲惙椒ㄖ凶钣写硇缘乃惴ㄊ莄均值算法(c均值算法有時又稱為k均值算法,c或者k是聚類類別的個數),和k中心點算法,c均值算法又可分為硬c均值算法和模糊c均值算法。2.4 各算法優(yōu)缺點比較表2-1 幾種算法的比較算法名稱優(yōu)點缺點系統(tǒng)聚類法對初值不敏感一旦一個合并或者分裂被執(zhí)行,就不可修正,當兩個距離較近的密聚點集之間有少量孤立的模式特征點時容易出錯。最小張樹法理論上完備實際中運用效率低下基于密度的聚類算法可以發(fā)現任意形狀的簇,對噪聲不敏感對于空間數據分布不均勻的情況聚類效果不佳基于網

48、絡的聚類算法速度快,可以高效處理低維的海量數據對于維數較高的數據集,生成的單元數過多,導致算法的效率較低基于劃分的聚類算法設計簡單、解決問題的范圍廣,還可以轉化為優(yōu)化問題而借助經典數學的非線性規(guī)劃理論求解,并易于計算機實現對初值敏感,初值選取不當可能造成聚類失敗。 由表可以看出,基于劃分的聚類算法設計簡單,解決問題的范圍廣,以及易于計算機實現的突出優(yōu)點十分合適本文的設計,因為隨著計算機技術的發(fā)展,電力負荷聚類,更多地要求計算機實現。雖然,它對初值要求較高,但對這一不足的改進與克服也正是本文的核心所在。第三章 模糊c均值在負荷特性聚類中的應用實例3.1 聚類在電力系統(tǒng)中的應用綜述目前,聚類分析在

49、電力系統(tǒng)中的應用一般在以下方面,電力系統(tǒng)的故障診斷,電力系統(tǒng)同調機群,電力負荷預測以及電力負荷建模等。文獻8結合新英格蘭10機39節(jié)點系統(tǒng)和ieee50機145節(jié)點系統(tǒng)為例,將聚類和矢量量化方法相結合,將故障后系統(tǒng)的能量裕度作為特征變量之一,發(fā)展了電力系統(tǒng)暫態(tài)穩(wěn)定故障篩選方法,對電力系統(tǒng)故障分類的新的探索。文獻17中給出了一種利用模糊劃分的迭代自組織數據分析技術(iterative self-organizing data analysis techniquesalgorithm,isodata)識別電力系統(tǒng)同調機群的算法。該方法原理簡單,計算量小,適用于快速的電力系統(tǒng)分析。國內外關于電力系統(tǒng)短期負荷預測的文獻很多,采用的預測方法和預測精度也各不相同,但由于影響負荷的諸多因素和負荷的不確定性,各種預測方法都存在著一定的局限性。傳統(tǒng)的短期負荷預測方法有回歸模型,時間序列等,隨著人工智能的興起和發(fā)展,模糊聚類辨識方法也引入到短期負荷預測中,并取得了較好的結果。文獻18中依據模糊聚類理論,提出一種短期負荷預測新方法。應用隸屬度來描述負荷與影響負荷因素之間的相關關系,又可以考

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論