版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
模糊聚類分析的理論、方法與應(yīng)用研究摘要:在科學(xué)技術(shù)、經(jīng)濟(jì)管理中常常要按一定的標(biāo)準(zhǔn)進(jìn)行分類。對(duì)所研究的事物按一定標(biāo)準(zhǔn)進(jìn)行分類的數(shù)學(xué)方法稱為聚類分析,它是多元統(tǒng)計(jì)“物以類聚”的一種分類方法。由于科學(xué)技術(shù)、經(jīng)濟(jì)管理中的分類界限往往不分明,因此采用模糊聚類方法通常比較符合實(shí)際。本文旨在運(yùn)用模糊聚類分析的方法,貫徹其理論,對(duì)具體的例子進(jìn)行分析和研究。關(guān)鍵詞:聚類分析,模糊,應(yīng)用,方法。前言:聚類就是把具有相似性質(zhì)的事物區(qū)分開(kāi)加以分類。聚類分析就是用數(shù)學(xué)方法研究和處理給定對(duì)象的分類,“人以群分,物以類聚”,聚類問(wèn)題是一個(gè)古老的問(wèn)題,是伴隨著人類產(chǎn)生和發(fā)展不斷深化的一個(gè)問(wèn)題。人類要認(rèn)識(shí)世界就必須要區(qū)分不同的事物并認(rèn)識(shí)事物間的,聚類就是把具有相似性質(zhì)的事物區(qū)分開(kāi)加以分類。經(jīng)典分類學(xué)往往是從單因素或有限的幾個(gè)因素出發(fā),憑經(jīng)驗(yàn)和專業(yè)對(duì)事物分類。這種分類具有非此即彼的特性,同一事物歸屬且僅歸屬所劃定類別中的一類,這種分類的類別界限是清晰的。隨著著人們認(rèn)識(shí)的深入,發(fā)現(xiàn)這種分類越來(lái)越不適用于具有模糊性的分類間題,如把人按身高分為“高個(gè)子的人’,“矮個(gè)子的人”,“不高不矮的人”。如何判別特定的一個(gè)人的類別便產(chǎn)生了經(jīng)典分類學(xué)解決不了的困難。模糊數(shù)學(xué)的產(chǎn)生為上述軟分類提供了數(shù)學(xué)基礎(chǔ),由此產(chǎn)生了模糊聚類分析。我們把應(yīng)用普通數(shù)學(xué)方法進(jìn)行分類的聚類方法稱為普通聚類分析,而把應(yīng)用模糊數(shù)學(xué)方法進(jìn)行分析的聚類分析稱為模糊聚類分析。隨著模糊數(shù)學(xué)傳人我國(guó),模糊聚類分析也傳人了我國(guó)。其應(yīng)用領(lǐng)域已包括了天氣預(yù)報(bào)、氣象分析、模式識(shí)別、生物、醫(yī)學(xué)、化學(xué)等諸多領(lǐng)域。聚類分析和模糊聚類分析聚類分析是將事物根據(jù)一定的特征,并按某種特定要求或規(guī)律分類的方法。由于聚類分析的對(duì)象必定是尚未分類的群體,而且現(xiàn)實(shí)的分類問(wèn)題往往帶有模糊性,對(duì)帶有模糊特征的事物進(jìn)行聚類分析,分類過(guò)程中不是僅僅考慮事物之間有無(wú)關(guān)系,而是考慮事物之間關(guān)系的深淺程度,顯然用模糊數(shù)學(xué)的方法處理更為自然,因此稱為模糊聚類分析。模糊聚類分析的一般步驟1、第一步:數(shù)據(jù)標(biāo)準(zhǔn)化(1)數(shù)據(jù)矩陣設(shè)論域?yàn)楸环诸悓?duì)象,每個(gè)對(duì)象又有個(gè)指標(biāo)表示其性狀,即,于是,得到原始數(shù)據(jù)矩陣為。其中表示第個(gè)分類對(duì)象的第個(gè)指標(biāo)的原始數(shù)據(jù)。(2)數(shù)據(jù)標(biāo)準(zhǔn)化在實(shí)際問(wèn)題中,不同的數(shù)據(jù)一般有不同的量綱,為了使不同的量綱也能進(jìn)行比較,通常需要對(duì)數(shù)據(jù)做適當(dāng)?shù)淖儞Q。但是,即使這樣,得到的數(shù)據(jù)也不一定在區(qū)間上。因此,這里說(shuō)的數(shù)據(jù)標(biāo)準(zhǔn)化,就是要根據(jù)模糊矩陣的要求,將數(shù)據(jù)壓縮到區(qū)間上。通常有以下幾種變換:①平移·標(biāo)準(zhǔn)差變換其中,。經(jīng)過(guò)變換后,每個(gè)變量的均值為0,標(biāo)準(zhǔn)差為1,且消除了量綱的影響。但是,再用得到的還不一定在區(qū)間上。②平移·極差變換,顯然有,而且也消除了量綱的影響。③對(duì)數(shù)變換取對(duì)數(shù)以縮小變量間的數(shù)量級(jí)。2、第二步:標(biāo)定(建立模糊相似矩陣)設(shè)論域,,依照傳統(tǒng)聚類方法確定相似系數(shù),建立模糊相似矩陣,與的相似程度。確定的方法主要借用傳統(tǒng)聚類的相似系數(shù)法、距離法以及其他方法。具體用什么方法,可根據(jù)問(wèn)題的性質(zhì),選取下列公式之一計(jì)算。(1)相似系數(shù)法①夾角余弦法。②最大最小法。③算術(shù)平均最小法。④幾何平均最小法。以上3種方法中要求,否則也要做適當(dāng)變換。⑤數(shù)量積法,其中。⑥相關(guān)系數(shù)法,其中,。⑦指數(shù)相似系數(shù)法,其中,而。(2)距離法①直接距離法,其中為適當(dāng)選取的參數(shù),使得,表示他們之間的距離。經(jīng)常用的距離有●海明距離?!駳W幾里得距離?!袂斜妊┓蚓嚯x。②倒數(shù)距離法。其中為適當(dāng)選取的參數(shù),使得。③指數(shù)距離法。3、第三步:聚類(求動(dòng)態(tài)聚類圖)(1)基于模糊等價(jià)矩陣聚類方法①傳遞閉包法根據(jù)標(biāo)定所得的模糊矩陣還要將其改造稱模糊等價(jià)矩陣。用二次方法求的傳遞閉包,即=。再讓由大變小,就可形成動(dòng)態(tài)聚類圖。②布爾矩陣法[10]布爾矩陣法的理論依據(jù)是下面的定理:定理2.2.1設(shè)是上的一個(gè)相似的布爾矩陣,則具有傳遞性(當(dāng)是等價(jià)布爾矩陣時(shí))矩陣在任一排列下的矩陣都沒(méi)有形如的特殊子矩陣。布爾矩陣法的具體步驟如下:①求模糊相似矩陣的截矩陣.②若按定理2.2.1判定為等價(jià)的,則由可得在水平上的分類,若判定為不等價(jià),則在某一排列下有上述形式的特殊子矩陣,此時(shí)只要將其中特殊子矩陣的0一律改成1直到不再產(chǎn)生上述形式的子矩陣即可。如此得到的為等價(jià)矩陣。因此,由可得水平上的分類(2)直接聚類法所謂直接聚類法,是指在建立模糊相似矩陣之后,不去求傳遞閉包,也不用布爾矩陣法,而是直接從模糊相似矩陣出發(fā)求得聚類圖。其步驟如下:①取(最大值),對(duì)每個(gè)作相似類,且=,即將滿足的與放在一類,構(gòu)成相似類。相似類與等價(jià)類的不同之處是,不同的相似類可能有公共元素,即可出現(xiàn),,.此時(shí)只要將有公共元素的相似類合并,即可得水平上的等價(jià)分類。②取為次大值,從中直接找出相似度為的元素對(duì)(即),將對(duì)應(yīng)于的等價(jià)分類中所在的類與所在的類合并,將所有的這些情況合并后,即得到對(duì)應(yīng)于的等價(jià)分類。③取為第三大值,從中直接找出相似度為的元素對(duì)(即),將對(duì)應(yīng)于的等價(jià)分類中所在的類與所在的類合并,將所有的這些情況合并后,即得到對(duì)應(yīng)于的等價(jià)分類。④以此類推,直到合并到成為一類為止。二、最佳閾值的確定在模糊聚類分析中對(duì)于各個(gè)不同的,可得到不同的分類,許多實(shí)際問(wèn)題需要選擇某個(gè)閾值,確定樣本的一個(gè)具體分類,這就提出了如何確定閾值的問(wèn)題。一般有以下兩個(gè)方法:=1\*GB3①按實(shí)際需要,在動(dòng)態(tài)聚類圖中,調(diào)整的值以得到適當(dāng)?shù)姆诸?,而不需要事先?zhǔn)確地估計(jì)好樣本應(yīng)分成幾類。當(dāng)然,也可由具有豐富經(jīng)驗(yàn)的專家結(jié)合專業(yè)知識(shí)確定閾值,從而得出在水平上的等價(jià)分類=2\*GB3②用F統(tǒng)計(jì)量確定最佳值。[11]設(shè)論域?yàn)闃颖究臻g(樣本總數(shù)為),而每個(gè)樣本有個(gè)特征:,。于是得到原始數(shù)據(jù)矩陣,如下表所示,其中,稱為總體樣本的中心向量。樣本指標(biāo)12km設(shè)對(duì)應(yīng)于值的分類數(shù)為,第類的樣本數(shù)為,第類的樣本記為:,第類的聚類中心為向量,其中為第個(gè)特征的平均值,即,,作統(tǒng)計(jì)量,其中為與間的距離,為第類中第個(gè)樣本與其中心間的距離。稱為統(tǒng)計(jì)量,它是遵從自由度為,的分布。它的分子表征類與類之間的距離,分母表征類內(nèi)樣本間的距離。因此,值越大,說(shuō)明類與類之間的距離越大;類與類間的差異越大,分類就越好。三、基于模糊聚類分析的實(shí)際應(yīng)用成績(jī)?cè)u(píng)價(jià)問(wèn)題一、問(wèn)題的提出某高中高二有7個(gè)班級(jí),學(xué)生成績(jī)的好與差,沒(méi)有明確的評(píng)定界限,并且班級(jí)間成績(jī)好壞的表現(xiàn)具有一定的模糊不確定性。二、問(wèn)題的分析解決上述問(wèn)題可運(yùn)用模糊聚類分析方法?,F(xiàn)以7個(gè)班級(jí)某次其中考試的四門(mén)主課成績(jī)?yōu)橐罁?jù),對(duì)7個(gè)班級(jí)成績(jī)好壞的相關(guān)程度分類。設(shè)7個(gè)班級(jí)組成一個(gè)分類集合:分別代表1班到7班。每個(gè)班級(jí)成績(jī)均是四門(mén)基礎(chǔ)課(語(yǔ)文、數(shù)學(xué)、英語(yǔ)、綜合)作為四項(xiàng)統(tǒng)計(jì)指標(biāo),即有這里表示為第個(gè)班級(jí)的第門(mén)基礎(chǔ)課指標(biāo)。這四項(xiàng)成績(jī)指標(biāo)為:語(yǔ)文平均成績(jī),數(shù)學(xué)平均成績(jī),英語(yǔ)平均成績(jī),綜合平均成績(jī)。各班級(jí)成績(jī)指標(biāo)值見(jiàn)表1。表17個(gè)班4門(mén)基礎(chǔ)課的成績(jī)指標(biāo)三、問(wèn)題的解決1、數(shù)據(jù)標(biāo)準(zhǔn)化采用極差變換,(1)式中是第i個(gè)班級(jí)第門(mén)基礎(chǔ)課平均成績(jī)的原始數(shù)據(jù),和分別為不同班級(jí)的同一門(mén)基礎(chǔ)課平均成績(jī)的最大值和最小值。為第個(gè)班級(jí)第門(mén)基礎(chǔ)課平均成績(jī)指標(biāo)的標(biāo)準(zhǔn)化數(shù)值。當(dāng)時(shí),,當(dāng)時(shí),。表2平均成績(jī)指標(biāo)值的標(biāo)準(zhǔn)化數(shù)值2、用最大最小法建立相似矩陣計(jì)算模糊相似矩陣R,根據(jù)標(biāo)準(zhǔn)化數(shù)值建立各班級(jí)之間四門(mén)基礎(chǔ)課成績(jī)指標(biāo)的相似關(guān)系矩陣,采用最大最小法來(lái)計(jì)算:其中是表示第個(gè)班級(jí)與第個(gè)班級(jí)在四門(mén)基礎(chǔ)課成績(jī)指標(biāo)上的相似程度的量。取,=0,其余運(yùn)算量可以通過(guò)MATLAB編程運(yùn)算。得相似矩陣:3、改造相似關(guān)系為等價(jià)關(guān)系進(jìn)行聚類分析矩陣滿足自反性和對(duì)稱性,但不具有傳遞性,為求等價(jià)矩陣,要對(duì)進(jìn)行改造,只需求其傳遞閉包。由平方法可得最后可得到。故傳遞閉包為,它就是模糊等價(jià)矩陣。用其可對(duì)7個(gè)班級(jí)進(jìn)行聚類分析。令由1降至0,寫(xiě)出,按分類元素和歸同一類的條件是取=1,則有U可分7類,,,,,,。降低置信水平,對(duì)不同的作同樣分析,得到取=0.77,U可分6類,,,,,。取=0.73,U可分5類,,,,。取=0.69,U可分4類,,,。取=0.61,U可分3類,,。取=0.36,U可分2類,。取=0.15,U可分1類。按不同的置信水平對(duì)7個(gè)班級(jí)進(jìn)行模糊聚類,將會(huì)得到不同的分類結(jié)果雨量站問(wèn)題一、問(wèn)題的提出某地區(qū)設(shè)置有11個(gè)雨量站,其分布圖見(jiàn)圖1,10年來(lái)各雨量站所測(cè)得的年降雨量列入表1中?,F(xiàn)因經(jīng)費(fèi)問(wèn)題,希望撤銷幾個(gè)雨量站,問(wèn)撤銷那些雨量站,而不會(huì)太多的減少降雨信息?圖1雨量站分布圖表1各雨量站10年間測(cè)得的降雨量年序號(hào)12763241594132922583113031752433202251287349344310454285451402307470319243329056347950222122032041123242462322432812673102733152853273525291311502388330410352267603290292646615822417816420350232024027835072583274324013613813014134021994218453365357452384420482228360316252915827141030828341020117943034218510324406235520442520358343251282371二、問(wèn)題的分析應(yīng)該撤銷那些雨量站,涉及雨量站的分布,地形,地貌,人員,設(shè)備等眾多因素。我們僅考慮盡可能地減少降雨信息問(wèn)題。一個(gè)自然的想法是就10年來(lái)各雨量站所獲得的降雨信息之間的相似性,對(duì)全部雨量站進(jìn)行分類,撤去“同類”(所獲降雨信息十分相似)的雨量站中“多余”的站。問(wèn)題求解假設(shè)為使問(wèn)題簡(jiǎn)化,特作如下假設(shè)①每個(gè)觀測(cè)站具有同等規(guī)模及儀器設(shè)備;②每個(gè)觀測(cè)站的經(jīng)費(fèi)開(kāi)支均等;具有相同的被裁可能性。分析:對(duì)上述撤銷觀測(cè)站的問(wèn)題用基于模糊等價(jià)矩陣的模糊聚類方法進(jìn)行分析,原始數(shù)據(jù)如上。三、問(wèn)題的解決求解步驟:1、數(shù)據(jù)的收集原始數(shù)據(jù)如表1所示。2、建立模糊相似矩陣?yán)孟嚓P(guān)系數(shù)法,構(gòu)造模糊相似關(guān)系矩陣,其中=其中=,=1,2,…,11。=,=1,2,…,11。取,代入公式得=0.839,得到模糊相似矩陣1.0000.8390.5280.8440.8280.7020.9950.6710.4310.5730.7120.8391.0000.5420.9960.9890.8990.8550.5100.4750.6170.5720.5280.5421.0000.5620.5850.6970.5710.5510.9620.6420.5680.8440.9960.5621.0000.9920.9080.8610.5420.4990.6390.6070.8280.9890.5850.9921.0000.9220.8430.5260.5120.6860.5840.7020.8990.6970.9080.9221.0000.7260.4550.6670.5960.5110.9950.8550.5710.8610.8430.7261.0000.6760.4890.5870.7190.6710.5100.5510.5420.5260.4550.6761.0000.4670.6780.9940.4310.4750.9620.4990.5120.6670.4890.4671.0000.4870.4850.5730.6170.6420.6390.6860.5960.5870.6780.4871.0000.6880.7120.5720.5680.6070.5840.5110.7190.9940.4850.6881.000對(duì)這個(gè)模糊相似矩陣用平方法作傳遞閉包運(yùn)算,求即。3、聚類注:是對(duì)稱矩陣,故只寫(xiě)出它的下三角矩陣取=0.996,則在置信水平為0.996的閾值下相似度為1,故同屬一類,所以此時(shí)可以將觀測(cè)站分為9類{,},{},{},{},{},{},{},{},{}。降低置信水平,對(duì)不同的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度新型城鎮(zhèn)化建設(shè)渣土處理承包協(xié)議3篇
- 二零二五年度高空監(jiān)測(cè)設(shè)備搭設(shè)鋼管腳手架安裝合同3篇
- 2025版高端美甲店經(jīng)營(yíng)管理權(quán)轉(zhuǎn)讓合同樣本4篇
- 2025年度個(gè)人汽車租賃售后服務(wù)合同范本7篇
- 二零二五年度模具設(shè)計(jì)與制造一體化服務(wù)合同2篇
- 2025年度餐飲廚房承包項(xiàng)目合同范本(含廚師團(tuán)隊(duì))4篇
- 二零二五年度特色美食街廚師技能承包合作協(xié)議3篇
- 個(gè)人電子煙零售店加盟合同(2024年度)3篇
- 二零二五年度城市綠化用地承包合同范本4篇
- 2025年度個(gè)人房產(chǎn)抵押借款合同修訂版8篇
- 2024年全國(guó)甲卷高考化學(xué)試卷(真題+答案)
- 汽車修理廠管理方案
- 人教版小學(xué)數(shù)學(xué)一年級(jí)上冊(cè)小學(xué)生口算天天練
- 三年級(jí)數(shù)學(xué)添括號(hào)去括號(hào)加減簡(jiǎn)便計(jì)算練習(xí)400道及答案
- 蘇教版五年級(jí)上冊(cè)數(shù)學(xué)簡(jiǎn)便計(jì)算300題及答案
- 澳洲牛肉行業(yè)分析
- 老客戶的開(kāi)發(fā)與技巧課件
- 計(jì)算機(jī)江蘇對(duì)口單招文化綜合理論試卷
- 成人學(xué)士學(xué)位英語(yǔ)單詞(史上全面)
- KAPPA-實(shí)施方法課件
- GB/T 13813-2023煤礦用金屬材料摩擦火花安全性試驗(yàn)方法和判定規(guī)則
評(píng)論
0/150
提交評(píng)論