下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
條件系統(tǒng)聚類方法的研究
對(duì)事物的類別研究比對(duì)混合和不斷變化的組合更清晰、更清晰、更詳細(xì)。通常,人們可以根據(jù)經(jīng)驗(yàn)和專業(yè)知識(shí)來實(shí)現(xiàn)分類。本世紀(jì)中葉,數(shù)值分類學(xué)的發(fā)展使得數(shù)學(xué)這個(gè)有用的工具被引入到分類學(xué)中,并逐步形成了聚類分析方法。隨著科學(xué)技術(shù)的突飛猛進(jìn),人們對(duì)分類的要求也越來越高,聚類分析方法的研究也越來越細(xì)致,系統(tǒng)聚類、動(dòng)態(tài)聚類、模糊聚類等眾多的聚類方法,使得人們可以根據(jù)自己的研究目的、處理要求和數(shù)據(jù)類型進(jìn)行選擇,而且希望聚類結(jié)果更符合實(shí)際。比如在小兒的生長(zhǎng)發(fā)育過程中,我們希望把整個(gè)發(fā)育過程人為地分成幾個(gè)階段,其次序不能打亂,這是因?yàn)樾喊l(fā)育是一個(gè)連續(xù)的過程,聚類時(shí)不僅要考慮小兒的生長(zhǎng)發(fā)育速率,還要考慮時(shí)間上的連續(xù)性,這就是一種樣品有序的問題。本文討論一維有序樣品的條件系統(tǒng)聚類法(conditionalhierarchicalclustering)。帶約束的系統(tǒng)聚類一般的樣品聚類,不必考慮它們之間的排列次序。但在有些問題中樣品是有序的,分類時(shí)不能打亂原有次序,而只能按序?qū)⑷繕悠方爻蓭捉?同類樣品次序互相銜接,這就是有序樣品的聚類。有序樣品的概念由Fisher在1958年提出,他把這種問題稱為帶約束(restricted)的聚類問題,這種聚類是在聚類過程中加入某種約束條件,而這種約束是來自于已有的知識(shí)、理論,或客觀存在,或?qū)嶋H要求,目的是使聚類結(jié)果更貼近實(shí)際,解釋更合理。有序樣品的聚類,已有一些方法。在這里,我們借用目前實(shí)際工作中用得最多,研究也最為深入的系統(tǒng)聚類法之思想,在聚類時(shí)加入樣品有序這個(gè)條件,這是一種帶約束的系統(tǒng)聚類,可稱為一維有序樣品的條件系統(tǒng)聚類。其聚類過程與一般的系統(tǒng)聚類法相似,只不過在聚類時(shí)加入了樣品有序這個(gè)條件,所以聚類步驟稍有不同。(1)樣品參數(shù)的選取一維有序樣品的條件系統(tǒng)聚類的關(guān)鍵是根據(jù)實(shí)際要求構(gòu)造條件矩陣。我們舉一個(gè)簡(jiǎn)單的例子來說明這個(gè)問題。設(shè)有5個(gè)有序樣品a,b,c,d,e,只有一個(gè)指標(biāo)x,取值為{10,12,8,9,5}。因?yàn)橛行?故聚類條件是前后銜接記為1(條件滿足),否則記為0(條件不滿足),得條件矩陣,如下:可見,一維有序樣品聚類時(shí),其條件矩陣的次對(duì)角線上的元素均為1,其余各元素均為0。(2)計(jì)算距離矩陣:樣品之間的距離可以采用歐氏距離。距離矩陣如下所示把距離矩陣和條件矩陣合并,把距離矩陣中滿足條件者用方框標(biāo)出,并稱其為條件距離矩陣。(3)次結(jié)論條件距離矩陣的計(jì)算對(duì)條件距離矩陣進(jìn)行系統(tǒng)聚類。與一般系統(tǒng)聚類不同的是,只考慮滿足條件的樣品間的聚類,其余步驟相同。我們采用系統(tǒng)聚類法中最簡(jiǎn)單的最短距離法,考察次對(duì)角線上的元素,c和d之間的距離為1,最短,所以,第一步把c和d合并,形成一個(gè)新的類,記為c+d。然后,計(jì)算新類與其余各類的距離,并重新審核各類間條件,得條件距離矩陣如下:不難看出,此時(shí)的條件矩陣仍然是次對(duì)角線上的元素為1,其余均為0。繼續(xù)考察次對(duì)角線上的元素,發(fā)現(xiàn)a和b的距離為2,最短,將a和b合并,形成新類,記作a+b;同樣,計(jì)算新類與各類之間的距離,得條件距離矩陣:如果我們還要繼續(xù)合并,就繼續(xù)比較次對(duì)角線上的距離,把距離最小的兩類進(jìn)行合并,如上,我們可以把a(bǔ)+b、c+d兩類合并,形成兩類{a,b,c,d}和{e}。最后,把這兩類合并為一類{a,b,c,d,e}。(4)多個(gè)一維有序樣品的條件矩陣和距離矩陣在這個(gè)例子中,我們可以一目了然地看到分成四類、三類、兩類時(shí)的分類結(jié)果。由上可見,n個(gè)一維有序樣品的條件矩陣是一個(gè)次對(duì)角線上的元素為1,而其余所有元素均為0的n×n矩陣。n個(gè)一維有序樣品的距離矩陣也是一個(gè)n×n矩陣。聚類時(shí),我們首先合并條件矩陣和距離矩陣為條件距離矩陣,然后對(duì)該矩陣采用系統(tǒng)聚類法分析,只需比較滿足條件的樣品間距離即可。機(jī)數(shù)隨機(jī)聚類分析對(duì)某地區(qū)1253名男孩身長(zhǎng)的逐月平均增長(zhǎng)率采用上述條件系統(tǒng)聚類法進(jìn)行分析。樣品間的距離采用歐氏距離,聚類方法采用類平均法。結(jié)果如表1:假設(shè)上述實(shí)例為一組正態(tài)總體,每一年齡組對(duì)應(yīng)于一個(gè)總體。每個(gè)總體,根據(jù)其均數(shù)和標(biāo)準(zhǔn)差各產(chǎn)生1個(gè)隨機(jī)數(shù),則每個(gè)樣本都包括20個(gè)年齡組,對(duì)每個(gè)隨機(jī)樣本采用一維有序樣品條件系統(tǒng)聚類法進(jìn)行聚類,如此重復(fù)100次。比較分成兩類、三類、四類時(shí)各種分類結(jié)果所占的比例,如表2:由表2可見,分成兩類時(shí),與總體分類相同的分類結(jié)果占93次。分成三類時(shí),第一、二、三類相同的分別有93次、61次、67次,與總體分類完全相同的有61次。分成四類,第一、二、三類相同的分別有93次、47次、38次、50次,與總體分類完全相同的有38次??紤]±1個(gè)樣品的誤差時(shí),分成兩類與總體相同的有100次;分成三類與總體相同的有82次,第一、二、三類相同的分別有100次、82次、82次;分成四類與總體相同的有56次,第一、二、三、四類相同的分別有100次、72次、54次、57次。模擬試驗(yàn)說明,這種聚類方法具有一定的穩(wěn)定性。系統(tǒng)聚類分析一維有序樣品的條件系統(tǒng)聚類方法,與一般的聚類分析方法之差別在于樣品有序,聚類時(shí)不能打亂固有的次序。因此,在聚類中必須加入條件約束。有序樣品的條件矩陣很容易構(gòu)造,它就是一個(gè)次對(duì)角線為1,其他元素全為0的下三角矩陣。距離計(jì)算可采用系統(tǒng)聚類法中的各種距離的計(jì)算方法,如絕對(duì)值距離、歐氏距離、蘭氏距離和馬氏距離等。系統(tǒng)聚類中類間距離的定義亦可直接運(yùn)用。模擬試驗(yàn)結(jié)果表明,這種聚類方法的聚類結(jié)果比較穩(wěn)定。Fisher在1958年曾提出了一種有序樣品的聚類方法。該法可以求得有序數(shù)據(jù)的精確最優(yōu)解,所以被稱之為最優(yōu)分割法或最小目標(biāo)函數(shù)法。目標(biāo)函數(shù)是按某種方案將n個(gè)有序樣品分成k類時(shí),各類直徑之和。如果目標(biāo)函數(shù)越小,表示同類間直徑越小,即類內(nèi)方差越小,這種分類方法也就越合理。這就是Fisher的最優(yōu)分割法(theleast-squarespartition)。將上述模擬結(jié)果與最優(yōu)分割聚類結(jié)果進(jìn)行比較,分兩類時(shí)分類結(jié)果完全相同的有7次。分成三類時(shí),第一、二、三、四類相同的分別有93次、61次、67次,與最優(yōu)分割法分類完全相同的有61次。分四類時(shí),第一、二、三、四類相同的分別有94次、26次、7次、8次,分類完全相同的有5次。考慮±1個(gè)樣品的誤差時(shí),分成兩類與總體相同的有100
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)學(xué)創(chuàng)新研究探索
- 大學(xué)生就業(yè)協(xié)議書(2篇)
- 2024年跨境電子商務(wù)平臺(tái)建設(shè)與運(yùn)營合同
- 2025年電子POS機(jī)租賃及系統(tǒng)維護(hù)一體化合同3篇
- 電梯維保承包合同
- 簡(jiǎn)單的股份轉(zhuǎn)讓協(xié)議書范本
- 2024年麻石欄桿工程監(jiān)理合同
- 1 我們愛整潔 ( 說課稿)-2023-2024學(xué)年道德與法治一年級(jí)下冊(cè)統(tǒng)編版
- 2024年版物業(yè)管理服務(wù)合同詳細(xì)條款
- 《勞動(dòng)合同法》87條
- 小學(xué)語文教研組期末考試質(zhì)量分析
- 《五年級(jí)奧數(shù)總復(fù)習(xí)》精編課件
- TS2011-16 帶式輸送機(jī)封閉棧橋圖集
- 校園安全存在問題及對(duì)策
- 多聯(lián)機(jī)的施工方案與技術(shù)措施
- 鉆井作業(yè)常見安全隱患
- 新型肥料配方設(shè)計(jì)與加工PPT課件
- 國際色卡四色模擬專色CMYK色值對(duì)照表
- 裝飾施工階段安全檢查表
- 輥壓成型在汽車輕量化中應(yīng)用的關(guān)鍵技術(shù)及發(fā)展-北方工業(yè)大學(xué)
- 地理信息系統(tǒng)原理全冊(cè)配套完整課件
評(píng)論
0/150
提交評(píng)論