![聚類(lèi)分析原理介紹和預(yù)測(cè)_第1頁(yè)](http://file4.renrendoc.com/view/a9c0ac88417fb4aeae6b9a58d417a463/a9c0ac88417fb4aeae6b9a58d417a4631.gif)
![聚類(lèi)分析原理介紹和預(yù)測(cè)_第2頁(yè)](http://file4.renrendoc.com/view/a9c0ac88417fb4aeae6b9a58d417a463/a9c0ac88417fb4aeae6b9a58d417a4632.gif)
![聚類(lèi)分析原理介紹和預(yù)測(cè)_第3頁(yè)](http://file4.renrendoc.com/view/a9c0ac88417fb4aeae6b9a58d417a463/a9c0ac88417fb4aeae6b9a58d417a4633.gif)
![聚類(lèi)分析原理介紹和預(yù)測(cè)_第4頁(yè)](http://file4.renrendoc.com/view/a9c0ac88417fb4aeae6b9a58d417a463/a9c0ac88417fb4aeae6b9a58d417a4634.gif)
![聚類(lèi)分析原理介紹和預(yù)測(cè)_第5頁(yè)](http://file4.renrendoc.com/view/a9c0ac88417fb4aeae6b9a58d417a463/a9c0ac88417fb4aeae6b9a58d417a4635.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、聚類(lèi)分析原理介紹和預(yù)測(cè)什么是自然分組結(jié)構(gòu)Natural grouping ?我們看看以下的例子:有16如何將他們分為 一組一組的牌呢?AKQJ聚類(lèi)分析原理介紹分成四組每組里花色相同組與組之間花色相異AKQJ花色相同的牌為一副Individual suits聚類(lèi)分析原理介紹分成四組符號(hào)相同的牌為一組AKQJ符號(hào)相同的的牌Like face cards聚類(lèi)分析原理介紹分成兩組顏色相同的牌為一組AKQJ顏色相同的配對(duì)Black and red suits聚類(lèi)分析原理介紹分成兩組大小程度相近的牌分到一組AKQJ大配對(duì)和小配對(duì)Major and minor suits聚類(lèi)分析原理介紹這個(gè)例子告訴我們,分
2、組的意義在于我們?cè)趺炊x并度量“相似性”Similar因此衍生出一系列度量相似性的算法AKQJ大配對(duì)和小配對(duì)Major and minor suitsYOUR SITE HERE第一節(jié) 引言第二節(jié) 聚類(lèi)統(tǒng)計(jì)量第三節(jié) 系統(tǒng)聚類(lèi)法第四節(jié) 動(dòng)態(tài)聚類(lèi)法主要內(nèi)容YOUR SITE HERE第一節(jié) 引言YOUR SITE HERE人類(lèi)認(rèn)識(shí)事物、認(rèn)識(shí)世界,往往從分類(lèi)開(kāi)始。聚類(lèi)分析和判別分析是研究事物分類(lèi)的基本方法。在數(shù)學(xué)分類(lèi)和模式識(shí)別中,有兩類(lèi)問(wèn)題:第一類(lèi)問(wèn)題:研究對(duì)象存在一個(gè)事前分類(lèi),將未知個(gè)體歸屬于其中的一類(lèi)判別分析(有監(jiān)督或稱(chēng)有導(dǎo)師的Supervised,樣品的類(lèi)別屬性是“被標(biāo)記了”的labeled)
3、另一類(lèi)問(wèn)題:不存在一個(gè)事前分類(lèi),對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行分類(lèi)(分組) 聚類(lèi)分析(無(wú)監(jiān)督或稱(chēng)無(wú)導(dǎo)師的Unsupervised)YOUR SITE HERE 判別分析數(shù)據(jù)格式Y(jié)OUR SITE HERE聚類(lèi)分析數(shù)據(jù)格式Y(jié)OUR SITE HERE 在地學(xué)領(lǐng)域中,經(jīng)常面臨著大量的分類(lèi)問(wèn)題,即對(duì)一定量的事物(如地質(zhì)體、樣品或變量)按其屬性進(jìn)行歸類(lèi)。由于地質(zhì)對(duì)象的復(fù)雜性,單靠定性標(biāo)志或少數(shù)定量標(biāo)志進(jìn)行分類(lèi),常常不能揭示客觀事物內(nèi)在本質(zhì)的差別和聯(lián)系,難以確定地質(zhì)體本質(zhì)屬性的歸屬。同時(shí)也造成很多分類(lèi)計(jì)算具有很大的主觀性和任意性,而且所得的結(jié)果因人而異,常不能反映客觀實(shí)際情況。地學(xué)研究中的分類(lèi)問(wèn)題較多,如巖石分類(lèi)、礦物
4、分類(lèi)、構(gòu)造期次研究、古氣候古環(huán)境劃分等,這些都有可能需要利用聚類(lèi)分析來(lái)研究。YOUR SITE HERE聚類(lèi)分析是一種研究分類(lèi)問(wèn)題的多元統(tǒng)計(jì)方法。聚類(lèi)分析的職能是建立一種分類(lèi)方法,它將一批樣品或變量,按照它們?cè)谛再|(zhì)上的親疏、相似程度進(jìn)行分類(lèi)。聚類(lèi)分析的出發(fā)點(diǎn)是研究對(duì)象之間可能存在的相似性和親疏關(guān)系。所以,根據(jù)研究對(duì)象之間各種特征標(biāo)志的相似程度或相關(guān)程度的大小,可將它們進(jìn)行分類(lèi)歸組。物以類(lèi)聚,人以群分YOUR SITE HERE聚類(lèi)分析的分類(lèi)原則是同一類(lèi)中的分類(lèi)對(duì)象在某種意義上趨于彼此相似(有較大的相似性);不同類(lèi)中的分類(lèi)對(duì)象趨于不相似(有很大的差異)。聚類(lèi)分析的目的是把分類(lèi)對(duì)象按一定規(guī)則分成若
5、干類(lèi),這些類(lèi)不是事先給定的,而是根據(jù)數(shù)據(jù)的特征而確定。YOUR SITE HERE 根據(jù)已知數(shù)據(jù),計(jì)算各觀察個(gè)體或變量之間親疏關(guān)系的統(tǒng)計(jì)量(距離、相關(guān)系數(shù)等),根據(jù)某種準(zhǔn)則(最短距離法、最長(zhǎng)距離法、中間距離法、重心法等),使同一類(lèi)內(nèi)的差別較小,而類(lèi)與類(lèi)之間的差別較大,最終將觀察個(gè)體或變量分為若干類(lèi)。聚類(lèi)分析基本思想YOUR SITE HERE兩個(gè)“距離”概念按照遠(yuǎn)近程度來(lái)聚類(lèi)需要明確兩個(gè)概念:一個(gè)是點(diǎn)和點(diǎn)之間的距離,一個(gè)是類(lèi)和類(lèi)之間的距離。點(diǎn)間距離有很多定義方式。最簡(jiǎn)單的是歐氏距離,還有其他的距離。當(dāng)然還有一些和距離相反但起同樣作用的概念,比如相似性等,兩點(diǎn)越相似度越大,就相當(dāng)于距離越短。由一
6、個(gè)點(diǎn)組成的類(lèi)是最基本的類(lèi);如果每一類(lèi)都由一個(gè)點(diǎn)組成,那么點(diǎn)間的距離就是類(lèi)間距離。但是如果某一類(lèi)包含不止一個(gè)點(diǎn),那么就要確定類(lèi)間距離,YOUR SITE HERE類(lèi)間距離是基于點(diǎn)間距離定義的:比如兩類(lèi)之間最近點(diǎn)之間的距離可以作為這兩類(lèi)之間的距離,也可以用兩類(lèi)中最遠(yuǎn)點(diǎn)之間的距離作為這兩類(lèi)之間的距離;當(dāng)然也可以用各類(lèi)的中心之間的距離來(lái)作為類(lèi)間距離。在計(jì)算時(shí),各種點(diǎn)間距離和類(lèi)間距離的不同選擇,其結(jié)果會(huì)有所不同,但一般不會(huì)差太多。 YOUR SITE HERE聚類(lèi)分析的分類(lèi)按聚類(lèi)方法分系統(tǒng)聚類(lèi)法,也叫分層聚類(lèi)法,hierarchical cluster動(dòng)態(tài)聚類(lèi)法,也叫快速聚類(lèi)法quick cluster
7、逐步聚類(lèi)、迭代聚類(lèi)k-均值聚類(lèi) k-means cluster最優(yōu)分割法(有序樣品聚類(lèi)法)模糊聚類(lèi)法圖論聚類(lèi)法聚類(lèi)預(yù)報(bào)法等YOUR SITE HERE按聚合方式分聚合法: 分類(lèi)開(kāi)始時(shí)每個(gè)樣品自成一類(lèi)。最常用,分類(lèi)結(jié)果常用分類(lèi)譜系圖表達(dá)。分裂法: 分類(lèi)開(kāi)始將全部樣品看成一類(lèi)。通常只能是求局部最優(yōu)解的方法。調(diào)優(yōu)法: 首先對(duì)樣品進(jìn)行粗糙的分個(gè)類(lèi)。動(dòng)態(tài)聚類(lèi)法就是其中最典型的方法。加入法: 業(yè)已存在一個(gè)分類(lèi)結(jié)果,確定每個(gè)新加入樣品在分類(lèi)結(jié)構(gòu)中最合適的位置。等聚類(lèi)分析的分類(lèi)YOUR SITE HERE聚類(lèi)分析的分類(lèi)按聚類(lèi)對(duì)象Q型聚類(lèi):對(duì)樣品的聚類(lèi) (cases)R型聚類(lèi):對(duì)變量的聚類(lèi) (variables
8、)R型聚類(lèi)和Q型聚類(lèi)這兩種聚類(lèi)在數(shù)學(xué)處理上是對(duì)稱(chēng)的,沒(méi)有什么不同。 YOUR SITE HERER型聚類(lèi)分析和Q型聚類(lèi)分析研究變量之間的相似程度,對(duì)變量進(jìn)行分組。從幾何意義上說(shuō),是以N個(gè)樣品為坐標(biāo)軸,每個(gè)變量視為坐標(biāo)空間的一點(diǎn)或一個(gè)向量,研究樣本空間變量點(diǎn)之間的關(guān)系。 1. R型聚類(lèi)分析(對(duì)變量的聚類(lèi))如研究控礦地質(zhì)因素及礦化標(biāo)志間的相關(guān)關(guān)系,多用于礦物,化學(xué)元素等方面的分組,以助于礦床成因問(wèn)題的研究。樣品2樣品3樣品1變量1變量2變量3是一種降維的方法YOUR SITE HERER型聚類(lèi)分析和Q型聚類(lèi)分析研究樣品之間的相似程度,對(duì)樣品進(jìn)行分類(lèi)。從幾何意義上說(shuō),是以P個(gè)變量為坐標(biāo)軸,每個(gè)樣品視
9、為p維空間中一點(diǎn)或一個(gè)向量,研究樣本空間樣品點(diǎn)之間的關(guān)系。 2. Q型聚類(lèi)分析(對(duì)樣品的聚類(lèi))變量2變量3變量1樣品1樣品2樣品3YOUR SITE HERE對(duì)礦床統(tǒng)計(jì)預(yù)測(cè)來(lái)說(shuō),主要是進(jìn)行Q型聚類(lèi)。(1)對(duì)研究區(qū)所劃分的單元,可視為樣品,各單元所測(cè)定的各種地質(zhì)特征作為變量構(gòu)成原始數(shù)據(jù)組。(2)各單元成礦遠(yuǎn)景的好壞,決定于單元內(nèi)有利成礦地質(zhì)因素及礦化標(biāo)志的發(fā)育程度,根據(jù)這些地質(zhì)因素和標(biāo)志的相似程度對(duì)單元進(jìn)行歸類(lèi)分組。這實(shí)際上是一種對(duì)地質(zhì)環(huán)境的分類(lèi)。(3)然后,據(jù)分類(lèi)中已知有礦和已知無(wú)礦單元的分類(lèi)歸組,結(jié)合地質(zhì)條件分析,相對(duì)地評(píng)價(jià)各未知單元的成礦遠(yuǎn)景。YOUR SITE HERE第二節(jié) 聚類(lèi)統(tǒng)計(jì)量
10、樣品Case變量VariableYOUR SITE HERE絕對(duì)值距離歐氏距離閔可夫斯基距離切比雪夫距離方差加權(quán)距離蘭氏距離馬哈拉諾比斯距離夾角余弦相似系數(shù)距離系數(shù) 聚類(lèi)統(tǒng)計(jì)量(也稱(chēng)相似性統(tǒng)計(jì)量)dij|Cij|, |rij|越接近于1,相似程度越高Cij|dij|越小,相似程度越高Q型聚類(lèi)統(tǒng)計(jì)量R型聚類(lèi)統(tǒng)計(jì)量相關(guān)系數(shù)rijYOUR SITE HERE樣品xi = (xi1, xi2,xip)樣品xj = (xi1, xi2,xip)間的距離絕對(duì)值距離歐氏距離閔可夫斯基距離切比雪夫距離YOUR SITE HERE樣品xi = (xi1, xi2,xip)樣品xj = (xi1, xi2,xip
11、)間的距離方差加權(quán)距離蘭氏距離馬氏距離(要求xij0)YOUR SITE HERE變量xi = (x1i, x2i,xni)T變量xj = (x1i, x2i,xnj)T間的相似系數(shù)夾角余弦相關(guān)系數(shù)YOUR SITE HERE樣品2樣品3樣品1變量1變量2變量3變量2變量3變量1樣品1樣品2樣品3距離系數(shù)夾角余弦 距離系數(shù)是一個(gè)衡量空間兩點(diǎn)之間相似程度的統(tǒng)計(jì)量,距離系數(shù)越小,兩點(diǎn)越相似。條件:直角坐標(biāo)系,要求變量是獨(dú)立的。距離系數(shù)在二維情況下N個(gè)樣品,P個(gè)指標(biāo)R型:變量P個(gè)指標(biāo)Q型:樣品N個(gè)指標(biāo)將N個(gè)樣品的兩兩間的距離系數(shù)求出來(lái),可排一個(gè)距離系數(shù)矩陣 相似系數(shù)是衡量空間兩個(gè)向量相似性的一個(gè)指標(biāo)
12、,相似系數(shù)越大,兩個(gè)向量越相似。相似系數(shù)將N個(gè)樣品相似系數(shù)求出來(lái),排成一個(gè)相似系數(shù)矩陣 相關(guān)系數(shù) 相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個(gè)指標(biāo),變量xi與xj的相關(guān)系數(shù)定義為: YOUR SITE HERE距離和相似系數(shù)之間的轉(zhuǎn)換一般說(shuō)來(lái),距離越小,兩樣品之間關(guān)系越密切,而相似系數(shù)越大,兩變量之間關(guān)系越密切。 為了聚類(lèi)方便起見(jiàn),可以用下面的公式從相關(guān)系數(shù)得到變量間的距離。dij2 = 1-rij2 YOUR SITE HERE第三節(jié) 系統(tǒng)聚類(lèi)法hierarchical clustering method系統(tǒng)聚類(lèi)方式:聚合法:先視每個(gè)為一類(lèi),再合并為幾大類(lèi)分裂法:先視為一大類(lèi),再分成幾類(lèi)可用于Q型聚
13、類(lèi)和 R型聚類(lèi)YOUR SITE HERE開(kāi)始時(shí)將每個(gè)樣品(或變量)都視為一類(lèi),然后將各樣品(或變量)相互之間兩兩加以比較,根據(jù)聚類(lèi)統(tǒng)計(jì)量逐步歸類(lèi),關(guān)系密切的聚合到一個(gè)小的分類(lèi)單位,關(guān)系疏遠(yuǎn)的聚合到一個(gè)較大的分類(lèi)單位,直到把所有樣品(或變量)都聚合并為一大類(lèi)完畢為止,形成一個(gè)由小到大的分類(lèi)系統(tǒng),并繪制聚類(lèi)譜系圖,把樣品之間的親疏關(guān)系簡(jiǎn)明直觀地展示出來(lái)。一、系統(tǒng)聚類(lèi)的特點(diǎn)YOUR SITE HERE二、系統(tǒng)聚類(lèi)的基本思路和做法(1)先將待聚類(lèi)的n個(gè)樣品(或者變量)各作為一類(lèi);(2)選定聚類(lèi)統(tǒng)計(jì)量,計(jì)算每?jī)蓚€(gè)類(lèi)之間的聚類(lèi)統(tǒng)計(jì)量,將關(guān)系最密切的兩類(lèi)并為一類(lèi),其余不變,即得n-1類(lèi)。再按前面的計(jì)算方法
14、,計(jì)算新類(lèi)與其它類(lèi)之間的距離(或者相似系數(shù)),再將關(guān)系最密切的兩類(lèi)并為一類(lèi),其余不變,即得n-2類(lèi);(3)如此繼續(xù)下去,每次重復(fù)都減少一類(lèi),直到最后所有所有樣品(或變量)歸為一類(lèi)為止。 YOUR SITE HEREX =x1x2相似性標(biāo)尺k=1k=2k=3k=40 1 2 3 4 50 1 2 3 4 5YOUR SITE HERE任給兩類(lèi),Gk,Gl ,規(guī)定其類(lèi)間距離為兩類(lèi)樣品間的最短距離,若類(lèi)Gk與Gl合并成一個(gè)新類(lèi)Gm,則Gm與任一類(lèi)Gr的距離為多少?GkGlGrGm記類(lèi)Gk與類(lèi)Gl之間的距離為Dkld(xi,xj)表示點(diǎn)xi Gk和xj Gl之間的距離最短距離三、類(lèi)間距離問(wèn)題:當(dāng)最親近
15、的兩個(gè)樣品合并為一個(gè)類(lèi)時(shí),則形成一個(gè)樣品集團(tuán),即p維空間中的一個(gè)點(diǎn)群。 如何度量類(lèi)與類(lèi)之間的距離?YOUR SITE HERE1.最短距離法(single linkage) 2.最長(zhǎng)距離法(complete linkage) 3.中間距離法(median linkage)4.重心法(centroid method)5.類(lèi)平均法(average linkage)6.可變類(lèi)平均法(flexible-beta method)7. 可變法8. 離差平方和法(亦稱(chēng)Ward法,Wards minimum-variance method)等 以上聚類(lèi)方法的計(jì)算步驟完全相同,僅類(lèi)與類(lèi)之間的定義不同。四、系統(tǒng)聚
16、類(lèi)方法YOUR SITE HERE四、譜系圖的形成和應(yīng)用聚類(lèi)的原則(譜系圖的形成過(guò)程)一步形成法多步形成法YOUR SITE HERE若選出的一對(duì)樣品在已經(jīng)分好的組中都未出現(xiàn)過(guò),則把它們形成一個(gè)新組。 (形成新類(lèi))若選出的一對(duì)樣品中,有一個(gè)出現(xiàn)在已經(jīng)分好的組里,則把另一個(gè)也加入到該組。 (加入類(lèi)中)若選出的兩個(gè)樣品,它們分別出現(xiàn)在已經(jīng)分好的兩組中,則把這兩個(gè)組連在一起。 (合并兩類(lèi))若選出的兩個(gè)樣品都出現(xiàn)在同一組中,則不須再分組。 (不再分類(lèi))聚合歸類(lèi)時(shí)一般應(yīng)遵從以下四條原則:按上述四條原則反復(fù)進(jìn)行,直到將所有的樣品(或變量)都聚合完畢為止。最終可形成譜系圖,也稱(chēng)樹(shù)狀圖。1.聚類(lèi)的原則(譜系圖
17、的形成過(guò)程)YOUR SITE HERE2. 一步形成法(一次計(jì)算分類(lèi)法)一步形成法是一種最簡(jiǎn)單的聚類(lèi)方法,計(jì)算量不大。它由距離矩陣或相似性系數(shù)矩陣出發(fā)得到最終的分類(lèi)結(jié)果。方法原理:根據(jù)距離或相似系數(shù)的大小,依次將諸樣品(或變量)歸類(lèi)連接起來(lái),形成一個(gè)從小類(lèi)到大類(lèi)的分類(lèi)系統(tǒng)。在連接過(guò)程中,要遵循前述四條原則。YOUR SITE HERE例:對(duì)鄂東7個(gè)矽卡巖體的化探資料的Q型聚類(lèi)分析。距離矩陣連接表123456YOUR SITE HERE根據(jù)相似性水平的地質(zhì)意義對(duì)譜系圖進(jìn)行分組,并對(duì)每組作出地質(zhì)解釋。相似性水平的不同反映了要求精度的差別,其結(jié)果表現(xiàn)為分組的粗細(xì)不同。587956808398102
18、Cu/W/Mo型Cu型Cu礦化Cu一次形成法(相似系數(shù))1)對(duì)原始數(shù)據(jù)進(jìn)行變換2)計(jì)算相似系數(shù) 3)用一次形成法形成分群圖 1 X1 X4 劃去4行4列X1 X 2 X3 X4 X5 X6X1 X2 X3 X4 X5 X62 X5 X6 劃去6行6列X1 X 2 X3 X4 X5 X6X1 X2 X3 X4 X5 X6劃去3行3列X1 X 2 X3 X4 X5 X6X1 X2 X3 X4 X5 X6 X5 X6 劃去5行5列X1 X 2 X3 X4 X5 X6X1 X 2 X3 X4 X5 X6 X5 X6 劃去2行2列X1 X 2 X3 X4 X5 X6X1 X 2 X3 X4 X5 X6
19、X5 X6 聚類(lèi)譜系圖 X5 X6 優(yōu)點(diǎn):方法簡(jiǎn)單,易于操作,工作量小。缺點(diǎn):一次形成法有缺點(diǎn),很可能把不相似的樣品歸入一類(lèi),如上例中第四次挑了X2和X5,按分類(lèi)原則就把X2 、X3和X5、X6劃為了一類(lèi),但X6是否與X2相似,X3是否與X5相似就沒(méi)有定量標(biāo)準(zhǔn) X5 X6 YOUR SITE HERE2. 多步形成法(逐步計(jì)算成群法)與一步形成法基本步驟相似,唯一的區(qū)別是每一步分類(lèi)后,要把分過(guò)類(lèi)變量合并成為一個(gè)新的變量,即在相關(guān)系數(shù)矩陣中劃出最大的元素,將相應(yīng)的變量合并,賦予新的記號(hào),把合并的變量的數(shù)據(jù)加權(quán)平均作為新的變量的數(shù)據(jù),再計(jì)算合并后新變量與其余各變量的相關(guān)系數(shù),建立新的相關(guān)矩陣,再進(jìn)
20、行下一步分類(lèi),重復(fù)這一過(guò)程直到把所有變量都合并為一類(lèi)。最后按歸類(lèi)作譜系圖。以距離作為聚類(lèi)統(tǒng)計(jì)量(Q型聚類(lèi))情形:見(jiàn)前關(guān)于類(lèi)間距離的系統(tǒng)聚類(lèi)方法以相關(guān)系數(shù)作為聚類(lèi)統(tǒng)計(jì)量(R型聚類(lèi))情形:(1) 轉(zhuǎn)換成距離來(lái)處理(2) 連續(xù)計(jì)算相關(guān)系數(shù)矩陣(1)計(jì)算樣品(或變量)間的相似性系數(shù)矩陣,挑出關(guān)系最密切的樣品對(duì)(或變量對(duì))(2)把挑出的成對(duì)樣品或樣品組(變量或變量組)的值做加權(quán)平均,形成一個(gè)新的樣品(或變量)數(shù)據(jù)(3)把原有兩個(gè)樣品或代表樣品組(變量或代表變量組)的數(shù)據(jù)刪除掉,一般習(xí)慣把新數(shù)據(jù)放在序號(hào)小的樣品數(shù)據(jù)上(4)對(duì)新形成的樣品(變量)數(shù)據(jù)與剩余樣品(變量)數(shù)據(jù)重新計(jì)算相似性系數(shù),再?gòu)闹刑舫鲫P(guān)系最
21、密切的樣品。重復(fù)(2)(3)(4)步驟,直到把所有樣品(變量)歸類(lèi)完為止。選擇滲透率、孔隙度、平均孔隙半徑、分選系數(shù)、特征結(jié)構(gòu)參數(shù)、排驅(qū)壓力、飽和度中值壓力7個(gè)參數(shù),儲(chǔ)層分成3類(lèi)依據(jù)樣品間歐式距離系數(shù)相似性YOUR SITE HERE第四節(jié) 動(dòng)態(tài)聚類(lèi)法也叫快速聚類(lèi)法、逐步聚類(lèi)、迭代聚類(lèi)quick cluster method, k-means model樣本量很大,用系統(tǒng)聚類(lèi)法計(jì)算的工作量極大,作出的樹(shù)狀圖也十分復(fù)雜, 不便于分析 YOUR SITE HERE(1)選取若干樣品作為初始凝聚點(diǎn)(給出允許分類(lèi)的最大個(gè)數(shù)k);(2)計(jì)算各樣品與各凝聚點(diǎn)的距離,并作初始分類(lèi);(3)根據(jù)初始分類(lèi),計(jì)算各
22、類(lèi)重心,用重心代替初始凝聚點(diǎn),進(jìn)行第二次分類(lèi);(4)重復(fù)(2)步,直至所有樣品都不再調(diào)整,分類(lèi)達(dá)到穩(wěn)定為止(稱(chēng)為聚類(lèi)過(guò)程收斂)動(dòng)態(tài)聚類(lèi)的基本思想首先將樣品粗略地分為若干類(lèi),然后在按照某種原則逐步修改直到合理的分類(lèi)為止。計(jì)算步驟:選凝聚點(diǎn),作初始分類(lèi)調(diào)整不適合點(diǎn)修改分類(lèi)YOUR SITE HERE小 結(jié)YOUR SITE HERE與多元分析的其他方法相比,盡管聚類(lèi)分析較為粗糙,沒(méi)有明顯的理論性,但應(yīng)用方面取得了很大成功,確實(shí)是模式識(shí)別研究中非常有用的一類(lèi)技術(shù)。(1)綜合性:Q型聚類(lèi)分析可以利用多個(gè)變量的信息對(duì)樣本進(jìn)行分類(lèi),克服單一指標(biāo)分類(lèi)的弊端。 (2)形象性:聚類(lèi)分析可以利用聚類(lèi)圖直觀地表現(xiàn)其分類(lèi)形態(tài),及類(lèi)與類(lèi)之間的內(nèi)在關(guān)系。 (3)客觀性:聚類(lèi)分析結(jié)果克服主觀因素,比傳統(tǒng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 車(chē)輛抵押合同借款范本年
- 商品采購(gòu)合同范本年
- 合同協(xié)議補(bǔ)充模板
- 鋼鐵項(xiàng)目擔(dān)保合同
- 攝影師勞動(dòng)合同范本
- 商品混凝土合同書(shū)范本
- 草坪種植合同協(xié)議書(shū)模板范本
- 租賃合同申請(qǐng)書(shū)年
- 空置房屋轉(zhuǎn)讓合同模板
- 部編版道德與法治九年級(jí)上冊(cè)《我們的夢(mèng)想》聽(tīng)課評(píng)課記錄1
- DL-T+5196-2016火力發(fā)電廠石灰石-石膏濕法煙氣脫硫系統(tǒng)設(shè)計(jì)規(guī)程
- 2024-2030年中國(guó)產(chǎn)教融合行業(yè)市場(chǎng)運(yùn)營(yíng)態(tài)勢(shì)及發(fā)展前景研判報(bào)告
- 2024年微生物檢測(cè)試劑行業(yè)商業(yè)計(jì)劃書(shū)
- 高中英語(yǔ)選擇性必修一單詞表
- 物業(yè)公司介紹
- (正式版)SHT 3551-2024 石油化工儀表工程施工及驗(yàn)收規(guī)范
- JTGT H21-2011 公路橋梁技術(shù)狀況評(píng)定標(biāo)準(zhǔn)
- 【永輝超市公司員工招聘問(wèn)題及優(yōu)化(12000字論文)】
- 中國(guó)直銷(xiāo)發(fā)展四個(gè)階段解析
- 2024屆浙江省寧波市鎮(zhèn)海區(qū)鎮(zhèn)海中學(xué)高一物理第一學(xué)期期末質(zhì)量檢測(cè)試題含解析
- 部編版語(yǔ)文四年級(jí)下冊(cè) 教材解讀
評(píng)論
0/150
提交評(píng)論