




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)學(xué)建模-聚類(lèi)分析數(shù)學(xué)建模-聚類(lèi)分析數(shù)學(xué)建模-聚類(lèi)分析資料僅供參考文件編號(hào):2022年4月數(shù)學(xué)建模-聚類(lèi)分析版本號(hào):A修改號(hào):1頁(yè)次:1.0審核:批準(zhǔn):發(fā)布日期:聚類(lèi)模型聚類(lèi),或稱(chēng)分集,即所謂“物以類(lèi)聚”,它是按某種相似規(guī)則對(duì)給定樣本集、指標(biāo)簇進(jìn)行某種性質(zhì)的劃分,使之成為不同的類(lèi).將數(shù)據(jù)抽象化為樣本矩陣,表示第個(gè)樣本的第個(gè)變量的值.聚類(lèi)目的,就是從數(shù)據(jù)出發(fā),將樣本或變量分成類(lèi).其方法大致有如下幾個(gè).(1)聚類(lèi)法.即譜系聚類(lèi)法.將個(gè)樣本看成類(lèi),將性質(zhì)最接近的兩類(lèi)并為一新類(lèi),得類(lèi);再?gòu)念?lèi)中找出最接近的兩類(lèi)加以合并,得類(lèi);繼之,最后所有樣本都成一類(lèi),得一聚類(lèi)譜系,從譜系中可確定劃分多少類(lèi),每類(lèi)含有哪些樣本.(2)分解法.它是系統(tǒng)聚類(lèi)的逆過(guò)程,將所有樣本視為一類(lèi),按某種最優(yōu)準(zhǔn)則將它分成兩類(lèi),繼之,每一類(lèi)都分到只含一個(gè)樣本為止.(3)動(dòng)態(tài)聚類(lèi).即快速聚類(lèi)法.將個(gè)樣本粗糙地分成若干類(lèi),然后用某中最優(yōu)準(zhǔn)則進(jìn)行調(diào)整,直至不能調(diào)整為止.(4)有序樣本聚類(lèi).按時(shí)間順序,聚在一類(lèi)的樣本必須是次序相鄰的樣本.(5)模糊聚類(lèi).它是將模糊數(shù)學(xué)用于樣本聚類(lèi).(6)運(yùn)籌學(xué)聚類(lèi).它是將聚類(lèi)問(wèn)題化為線(xiàn)性規(guī)劃、動(dòng)態(tài)規(guī)劃、整數(shù)規(guī)劃模型的聚類(lèi).(7)神經(jīng)網(wǎng)絡(luò)聚類(lèi).它是將樣本按自組織特征映射的方法進(jìn)行,也是我們要加以敘述的一個(gè)重點(diǎn).(8)預(yù)測(cè)中聚類(lèi).它是聚類(lèi)在預(yù)測(cè)中的應(yīng)用,以彌補(bǔ)非穩(wěn)定信號(hào)回歸的預(yù)測(cè)與分析.這里主要介紹譜系聚類(lèi)法和快速聚類(lèi)法.一、距離定義樣本矩陣,是維空間中個(gè)點(diǎn),以距離量度樣本之間的貼近度,就是距離聚類(lèi)方法.最常用的第個(gè)與第個(gè)樣本的明考斯基距離為式中為一正整數(shù).當(dāng),就是歐幾里德距離;當(dāng),就是絕對(duì)距離,或稱(chēng)“城市街道”距離.而切比雪夫距離為設(shè)是變量的協(xié)方差矩陣,,為第行與第行個(gè)變量構(gòu)成的向量,則馬哈蘭羅比斯距離定義為根據(jù)距離的定義,就獲得距離矩陣由距離性質(zhì)可知,為實(shí)對(duì)稱(chēng)矩陣,越小,兩樣本就越相似,其中,根據(jù)的個(gè)點(diǎn)分類(lèi),依聚類(lèi)準(zhǔn)則分為不同的類(lèi).對(duì)常用的系統(tǒng)聚類(lèi)準(zhǔn)則有:最短距離;最長(zhǎng)距離;質(zhì)心距離;平均距離;平方距離.根據(jù)我們講述的多彈頭導(dǎo)彈要求,這里以最短距離為例加以簡(jiǎn)要分析.其它幾種距離的分析可見(jiàn)參考文獻(xiàn)REF_Ref5\r\h[10].令與中分別有與個(gè)樣本,其均值分別為與,則最短距離定義為:二、譜系聚類(lèi)法例題假如抽取5個(gè)樣本,每個(gè)樣本只測(cè)一個(gè)指標(biāo),即數(shù)據(jù)為=[1,0;2,0;,0;6,0;8,0]試以最短距離準(zhǔn)則進(jìn)行距離聚類(lèi)說(shuō)明.解這時(shí),樣本間的絕對(duì)距離、歐幾里德距離或切比雪夫距離均一致,見(jiàn)表.以最短距離準(zhǔn)則聚類(lèi).對(duì)于某步,假定具有樣本為的第集合與樣本為的第集合,聚成為具有樣本為的第集合,則第集合與第集合的最短距離,可寫(xiě)為表絕對(duì)距離數(shù)據(jù)1268102006080表中數(shù)據(jù)1、2、、6、8視為二叉數(shù)葉子,編號(hào)為1、2、3、4、5.當(dāng)每一個(gè)樣本看成一類(lèi)時(shí),則式子變?yōu)?,最小距離為1,即1與2合聚于6號(hào),得表.表中表一次合聚{1,2}68{1,2}006080表中最小距離為,即與6合聚于7,得表.表中.表二次合聚{1,2}{4,5,6}8{1,2}0{,6}080表中最小距離為2,即{,6}元素(為7號(hào))與8(為5號(hào))合聚于8號(hào),得表.表中表三次合聚{1,2}{,6,8}{1,2}0{,6,8}0最后集合{1,2}與{,6,8}聚成一集叢.于是,由繪得最短距離聚類(lèi)譜系如圖所示,由圖看出分兩類(lèi)比較合適.1號(hào)、2號(hào)數(shù)據(jù)合聚于6號(hào),最小聚距為1;3號(hào)、4號(hào)數(shù)據(jù)合聚于7號(hào),最小聚距為;7號(hào)于5號(hào)數(shù)據(jù)合聚于8號(hào),最小聚距為2;最后6號(hào)和8號(hào)合聚,最小聚距為.于是linkage返回矩陣28最6短1聚距012345聚類(lèi)譜號(hào)圖最短距離聚類(lèi)譜系依上述方法聚類(lèi)獲得的譜系的樹(shù)葉是獨(dú)立樣本類(lèi)的編號(hào),為1,2,…,;是的矩陣,第1列、第2列的樹(shù)是二叉樹(shù)合聚的一對(duì)編號(hào),該編號(hào)或?yàn)闃颖揪幪?hào)或?yàn)榍懊娴暮暇劬幪?hào);第3列的數(shù)是對(duì)應(yīng)于該對(duì)合聚時(shí)的距離.合聚編號(hào)按順序編,即第1合聚于、第2合聚于、第3合聚于,依此順序編之.同時(shí),按上述聚類(lèi)準(zhǔn)則獲得的矩陣,第3列距離值由首值到最后值是單調(diào)遞增的.三、快速聚類(lèi)法上面,我們重點(diǎn)介紹了譜系聚類(lèi)法.譜系聚類(lèi)法的特點(diǎn)是樣品一旦被歸到某個(gè)類(lèi)后就不變了,這就要求分類(lèi)方法要比較準(zhǔn)確.又樣品容量較大時(shí),譜系聚類(lèi)法的計(jì)算量過(guò)大.為了彌補(bǔ)譜系聚類(lèi)法的不足,產(chǎn)生了快速聚類(lèi)法,又稱(chēng)為動(dòng)態(tài)聚類(lèi)法.快速聚類(lèi)法先將樣品粗略地分一下類(lèi),然后再按照某種原則進(jìn)行修正,直至分類(lèi)比較合理為止.快速聚類(lèi)的過(guò)程大致可由圖表示.理論研究及計(jì)算實(shí)踐都表明,快速聚類(lèi)法是快速有效的聚類(lèi)方法.合理選擇聚點(diǎn)初始分類(lèi)分類(lèi)是否合理最終分類(lèi)修改分類(lèi)不合理圖快速聚類(lèi)的過(guò)程圖下面來(lái)介紹一下快速聚類(lèi)法的步驟:1.選擇聚點(diǎn)聚點(diǎn)(種子)是一批有代表性的樣品,它的選擇決定了初始分類(lèi),對(duì)最終分類(lèi)有較大影響.在進(jìn)行快速聚類(lèi)法前,要根據(jù)研究問(wèn)題的要求及了解程度先定下分類(lèi)數(shù),這樣就可以在每一類(lèi)中選擇一個(gè)有代表性的樣品作為聚點(diǎn)(初始聚點(diǎn)).選擇聚點(diǎn)有下列方法:1)經(jīng)驗(yàn)選擇.如果對(duì)研究對(duì)象比較了解,根據(jù)以往經(jīng)驗(yàn)定下個(gè)樣品作為聚點(diǎn).2)將個(gè)樣品人為地(或隨機(jī)地)分成類(lèi),以每類(lèi)的中心作為聚點(diǎn).3)最小最大原則.設(shè)要將個(gè)樣品分成類(lèi),先選擇所有樣品中相距最遠(yuǎn)的兩個(gè)樣本為前兩個(gè)聚點(diǎn),即選擇,使然后,選擇第3個(gè)聚點(diǎn),使得與前兩個(gè)聚點(diǎn)的距離最小者等于所有其余的與兩個(gè)樣品的較小距離中最大的,用公式表示為.然后按相同的原則選取,依次下去,直至選定個(gè)聚點(diǎn).選取過(guò)程可以用遞推公式表達(dá).若已選了個(gè)聚點(diǎn),則第個(gè)聚點(diǎn)選取原則為.利用SPSS軟件中Classify→K-MeansCluster過(guò)程進(jìn)行分析時(shí),分類(lèi)數(shù)是事先給定的.2.快速聚類(lèi)法的計(jì)算步驟.1)設(shè)個(gè)初始聚點(diǎn)的集合是.用下列原則實(shí)現(xiàn)初始分類(lèi).記.這樣,將樣品分成不相交的類(lèi).以上初始分類(lèi)的原則是每個(gè)樣品以最靠近的初始聚點(diǎn)歸類(lèi).依照以上計(jì)算,得到一個(gè)初始分類(lèi).2)從出發(fā),計(jì)算新的聚點(diǎn)集合.以的重心作為新的聚點(diǎn):.其中是中的樣品數(shù).這樣,得到新的聚點(diǎn)聚合:.從出發(fā),將樣品作新的分類(lèi).記.得到分類(lèi),這樣,依次重復(fù)計(jì)算下去.3)設(shè)在第步得到分類(lèi).在以上遞推計(jì)算過(guò)程中,是類(lèi)的重心.不一定是樣品,又一般不是的重心.當(dāng)逐漸增大時(shí),分類(lèi)趨于穩(wěn)定.此時(shí),就會(huì)近似為的重心,從而,算法即可結(jié)束.實(shí)際計(jì)算時(shí),從某一步開(kāi)始,分類(lèi)與完全相同,計(jì)算即告結(jié)束.記,.理論上可以證明:當(dāng)增加時(shí),為單調(diào)減少有下界序列,故存在,即會(huì)逐步趨于穩(wěn)定.依此分類(lèi),分類(lèi)結(jié)果也將逐步穩(wěn)定,即上述快速聚類(lèi)法具有收斂性.設(shè),.給定,若,則遞推計(jì)算過(guò)程結(jié)束.根據(jù)第2章模擬的隨機(jī)數(shù),以點(diǎn)處的模擬數(shù)據(jù)(見(jiàn)表)為例,利
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 戶(hù)表施工合同5篇
- Unit 5 Dinner's ready Part C Story time 大單元整體教學(xué)設(shè)計(jì)表格式-2024-2025學(xué)年人教PEP版英語(yǔ)四年級(jí)上冊(cè)
- Module 7 Unit 3 教學(xué)設(shè)計(jì) 海南省??谑?2024-2025學(xué)年外研版九年級(jí)英語(yǔ)上冊(cè)
- 第5單元 習(xí)作:生活萬(wàn)花筒 教學(xué)設(shè)計(jì)2024-2025學(xué)年四年級(jí)語(yǔ)文上冊(cè)同步作文
- 2025年激光照排設(shè)備及系統(tǒng)合作協(xié)議書(shū)
- 粵教版 信息技術(shù) 必修1 1.2.1 信息技術(shù)及其發(fā)展 教學(xué)設(shè)計(jì)
- 房屋出租免責(zé)協(xié)議書(shū)7篇
- Unit7 Vacation(教學(xué)設(shè)計(jì))-2023-2024學(xué)年北師大版(三起)英語(yǔ)六年級(jí)下冊(cè)
- 2025至2031年中國(guó)精鍛刀具坯料行業(yè)投資前景及策略咨詢(xún)研究報(bào)告
- 2025至2031年中國(guó)研磨橡皮墊行業(yè)投資前景及策略咨詢(xún)研究報(bào)告
- 特殊學(xué)生心理健康檔案表
- 文山-硯山天然氣支線(xiàn)管道工程項(xiàng)目環(huán)境影響報(bào)告書(shū)
- 新選供應(yīng)商初期考察表模板
- 工人工資結(jié)清證明范本
- 《煤礦安全規(guī)程》安全生產(chǎn)月考試題庫(kù)
- 2023春下冊(cè)五年級(jí)語(yǔ)文《每課生字預(yù)習(xí)表》
- 腹腔引流管的護(hù)理常見(jiàn)并發(fā)癥的預(yù)防與處理規(guī)范
- 工地試驗(yàn)室質(zhì)量手冊(cè)
- 車(chē)間領(lǐng)班求職簡(jiǎn)歷
- 江蘇省船舶行業(yè)智能化改造數(shù)字化轉(zhuǎn)型實(shí)施指南(第二版)
- 高一寒假學(xué)習(xí)計(jì)劃表格
評(píng)論
0/150
提交評(píng)論