




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ClusterAnalysis
第五章聚類(lèi)分析多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第1頁(yè)!節(jié)什么是聚類(lèi)分析多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第2頁(yè)!
聚類(lèi)分析也是一種分類(lèi)技術(shù)。是研究“物以類(lèi)聚”的一種方法。與多元分析的其他方法相比,該方法理論上還不完善,但由于它能解決許多實(shí)際問(wèn)題,很受人們的重視,應(yīng)用方面取得了很大成功。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第3頁(yè)!舉例
對(duì)10位應(yīng)聘者做智能檢驗(yàn)。3項(xiàng)指標(biāo)X,Y和Z分別表示數(shù)學(xué)推理能力,空間想象能力和語(yǔ)言理解能力。其得分如下,選擇合適的統(tǒng)計(jì)方法對(duì)應(yīng)聘者進(jìn)行分類(lèi)。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第4頁(yè)!多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第5頁(yè)!聚類(lèi)分析內(nèi)容
系統(tǒng)聚類(lèi)動(dòng)態(tài)聚類(lèi)模糊聚類(lèi)圖論聚類(lèi)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第6頁(yè)!描述親疏程度有兩個(gè)途徑:
1、把每個(gè)樣品看成p維(變量的個(gè)數(shù)為p個(gè))空間的一個(gè)點(diǎn),在p維坐標(biāo)中,定義點(diǎn)與點(diǎn)之間的距離。
2、用某種相似系數(shù)來(lái)描述樣品之間的親疏程度。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第7頁(yè)!聚類(lèi)的種類(lèi)根據(jù)分類(lèi)的對(duì)象可將聚類(lèi)分析分為:(1)Q型(即樣品的聚類(lèi)clusteringforindividuals)(2)R型(即變量或指標(biāo)的聚類(lèi)clusteringforvariables)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第8頁(yè)!樣本資料矩陣樣本資料矩陣多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第9頁(yè)!定義距離的準(zhǔn)則
定義第i個(gè)和第j個(gè)樣品間的距離要求滿足如下四個(gè)條件(距離可以自己定義,只要滿足距離的條件):多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第10頁(yè)!明氏(Minkowski
)距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第11頁(yè)!絕對(duì)值距離實(shí)例多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第12頁(yè)!二維空間歐式距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第13頁(yè)!切比雪夫距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第14頁(yè)!標(biāo)準(zhǔn)化歐式距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第15頁(yè)!Mahalanobis
距離實(shí)例多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第16頁(yè)!距離矩陣樣品間距離矩陣多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第17頁(yè)!(2)相似系數(shù)
研究樣品間的關(guān)系常用距離,研究指標(biāo)(變量)間的關(guān)系常用相似系數(shù)。相似系數(shù)常用的有:夾角余弦與相關(guān)系數(shù)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第18頁(yè)!相似系數(shù)的定義多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第19頁(yè)!相似矩陣變量間相似矩陣多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第20頁(yè)!相似矩陣多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第21頁(yè)!將n個(gè)樣品各作為一類(lèi)
系統(tǒng)聚類(lèi)法是諸聚類(lèi)分析方法中使用最多的一種,按下列步驟進(jìn)行:
計(jì)算n個(gè)樣品兩兩之間的距離,構(gòu)成距離矩陣
合并距離最近的兩類(lèi)為一新類(lèi)
計(jì)算新類(lèi)與當(dāng)前各類(lèi)的距離。再合并、計(jì)算,直至只有一類(lèi)為止
畫(huà)聚類(lèi)圖,解釋
多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第22頁(yè)!(一)最短距離法
(singlelinkage,nearestneighbor)
類(lèi)類(lèi)間:兩類(lèi)間兩兩樣品距離最短
x21?x12?x22?x11?多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第23頁(yè)!例1
設(shè)抽取五個(gè)樣品,每個(gè)樣品只側(cè)一個(gè)指標(biāo),他們是1,2,3.5,7,9,試用最短距離法對(duì)五個(gè)樣品進(jìn)行分類(lèi)。(樣品間用絕對(duì)值距離)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第24頁(yè)!D(1)
表2D(1)G6
G3
G4
G5G6={G1,G2}0G3={X3}1.50G4={X4}53.50G5={X5}75.520多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第25頁(yè)!D(3)
表4D(3)G7
G8G70G8={G4,G5}3.50多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第26頁(yè)!最短距離法聚類(lèi)的步驟1、定義樣品之間的距離,計(jì)算初始距離矩陣D(0)2、找出D(0)中非對(duì)角線上的最小值,設(shè)為Dpq,將對(duì)應(yīng)的兩類(lèi)Gp和Gq合并成一個(gè)新類(lèi),記為Gr,即Gr=(Gp,Gq)3、計(jì)算新類(lèi)與其它類(lèi)之間的距離,得距離矩陣D(1)。4、用D(1)代替D(0),重復(fù)2、3的過(guò)程得D(2),如此下去直到所有樣品合并成一類(lèi)為止。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第27頁(yè)!遞推公式多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第28頁(yè)!D(1)
表2D(1)G6
G3
G4
G5
G6={G1,G2}0G3={X3}2.50G4={X4}63.50G5={X5}85.520多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第29頁(yè)!D(3)
表4D(3)G7
G8
G70G8={G3,G6}80多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第30頁(yè)!(三)中間距離法Medianmethod最短距離最長(zhǎng)距離中間距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第31頁(yè)!D2(0)G1
G2
G3
G4
G5G1={X1}0G2={X2}10G3={X3}6.252.250G4={X4}362512.250G5={X5}644930.2540多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第32頁(yè)!D2(2)
G7
G4
G5G70G420.250G542.2540多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第33頁(yè)!(四)重心法(Centroidclustering):??類(lèi)類(lèi)間:兩類(lèi)重心之間的距離即均值點(diǎn)間的距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第34頁(yè)!D2(0)G1
G2
G3
G4
G5G1={X1}0G2={X2}10G3={X3}6.252.250G4={X4}362512.250G5={X5}644930.2540多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第35頁(yè)!D
2(2)
G7
G4
G5G7={X1,X2X3}0G4={X4}23.360G5={X3}46.6940多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第36頁(yè)!(五)類(lèi)平均法
(Between-groupLinkage)??????類(lèi)類(lèi)間:兩類(lèi)之間的距離為兩類(lèi)樣品兩兩之間的平均距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第37頁(yè)!D2(0)G1
G2
G3
G4
G5G1={X1}0G2={X2}10G3={X3}6.252.250G4={X4}362512.250G5={X5}644930.2540多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第38頁(yè)!D
2(2)
G6
G7
G3G6={X1,X2}0G7={X4X5}43.50G3={X3}4.2521.250多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第39頁(yè)!(六)可變類(lèi)平均法
類(lèi)平均法的遞推公式中,沒(méi)有反映Gp類(lèi)和Gq類(lèi)的距離有多大,進(jìn)一步將其改進(jìn),加入D2Pq,并給定系數(shù)<1,則類(lèi)平均法的遞推公式改為:一般取多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第40頁(yè)!(八)離差平方和法(ward法)
可以證明離差平方和的聚類(lèi)公式為多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第41頁(yè)!D2(1)
G6
G3
G4
G5G6={X1,X2}0G3={X3}2.6670G4={X4}20.1676.1250G5={X5}37.515.12520多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第42頁(yè)!D2(3)
G7
G8
G7={X4,X5}0G8={X1,X2,X3}40.8330多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第43頁(yè)!離差平方和法(ward法)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第44頁(yè)!例1:為了更深入了解我國(guó)人口的文化程度狀況,現(xiàn)利用1990年全國(guó)人口普查數(shù)據(jù)對(duì)全國(guó)30個(gè)省、直轄市、自治區(qū)進(jìn)行聚類(lèi)分析。分析選用了三個(gè)指標(biāo):(1)大學(xué)以上文化程度人口占全部人口的比例(DXBZ);(2)初中文化程度的人口占全部人口的比(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ)、用來(lái)反映較高、中等、較低文化程度人口的狀況,原始數(shù)據(jù)如下表:多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第45頁(yè)!多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第46頁(yè)!例2:根據(jù)美國(guó)等20個(gè)國(guó)家和地區(qū)的信息基礎(chǔ)設(shè)施的發(fā)展?fàn)顩r進(jìn)行分類(lèi)。Call—每千人擁有的電話線數(shù);movel—每千人戶居民擁有的蜂窩移動(dòng)電話數(shù);fee—高峰時(shí)期每三分鐘國(guó)際電話的成本;p—每千人擁有的計(jì)算機(jī)數(shù);mips—每千人計(jì)算機(jī)功率(每秒百萬(wàn)指令);net—每千人互聯(lián)網(wǎng)絡(luò)戶主數(shù)。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第47頁(yè)!多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第48頁(yè)!第四節(jié)系統(tǒng)聚類(lèi)的基本性質(zhì)1、單調(diào)性設(shè)Dk是系統(tǒng)聚類(lèi)法中第K次并類(lèi)時(shí)的距離,如果D1<D2<…
,則稱(chēng)并類(lèi)距離具有單調(diào)性??梢宰C明除了中間距離法和重心法之外,其他的系統(tǒng)聚類(lèi)法均滿足單調(diào)性的條件。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第49頁(yè)!
D(0)G1G2G3G4G5G1={X1}0G2={X2}30G3={X3}410G4={X4}6320G5={X5}107620最短距離法最長(zhǎng)距離法多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第50頁(yè)!最長(zhǎng)距離法最短距離法D(2)G7
G4
G5G70G430G54100D(2)G6
G7
G3G60G760G37100多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第51頁(yè)!D(短)D(平),D(重)D(平);D(長(zhǎng))D(平);當(dāng),D(變平)D(平);當(dāng),D(變平)D(平)。D(離)D(平)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第52頁(yè)!總離差平方和的分解(準(zhǔn)備知識(shí))多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第53頁(yè)!可以證明:總離差平方和=組內(nèi)離差平方和+組間離差平方和令T為總離差平方和令PG為分為G類(lèi)的組內(nèi)離差平方和多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第54頁(yè)!3、偽F統(tǒng)計(jì)量的定義為
偽F統(tǒng)計(jì)量用于評(píng)價(jià)聚為G類(lèi)的效果。如果聚類(lèi)的效果好,類(lèi)間的離差平方和相對(duì)于類(lèi)內(nèi)的離差平方和大,所以應(yīng)該取偽F統(tǒng)計(jì)量較大而類(lèi)數(shù)較小的聚類(lèi)水平。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第55頁(yè)!應(yīng)聘者得分如下應(yīng)聘者12345678910X28181121262016142422Y29232223292322232927Z28181622262222242424多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第56頁(yè)!例如,對(duì)上市公司的經(jīng)營(yíng)業(yè)績(jī)進(jìn)行分類(lèi);例如,根據(jù)經(jīng)濟(jì)信息和市場(chǎng)行情,客觀地對(duì)不同商品、不同用戶及時(shí)地進(jìn)行分類(lèi)。例如,當(dāng)我們對(duì)企業(yè)的經(jīng)濟(jì)效益進(jìn)行評(píng)價(jià)時(shí),建立了一個(gè)由多個(gè)指標(biāo)組成的指標(biāo)體系,由于信息的重疊,一些指標(biāo)之間存在很強(qiáng)的相關(guān)性,所以需要將相似的指標(biāo)聚為一類(lèi),從而達(dá)到簡(jiǎn)化指標(biāo)體系的目的。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第57頁(yè)!第二節(jié)距離和相似系數(shù)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第58頁(yè)!變量的類(lèi)型變量按測(cè)量尺度的不同可以分為以下三類(lèi):
1、間隔尺度變量(數(shù)值型變量)用連續(xù)的數(shù)量來(lái)度量,如長(zhǎng)度、重量、產(chǎn)值、成本
2、有序尺度變量(有序變量)如一、二、三等品不能用明確的數(shù)量度量,用等級(jí)表示,有次序關(guān)系。
3、名義尺度變量用一些類(lèi)來(lái)表示。性別中的男與女,職業(yè)的分類(lèi)。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第59頁(yè)!1、對(duì)樣品分類(lèi)(Q型)
常用的距離與相似系數(shù)的定義多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第60頁(yè)!(1)距離假使每個(gè)樣品有p個(gè)變量,則每個(gè)樣品都可以看成p維空間中的一個(gè)點(diǎn),n個(gè)樣品就是p維空間中的n個(gè)點(diǎn),則第i樣品與第j樣品之間的距離記為dij多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第61頁(yè)!距離矩陣樣品間距離矩陣多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第62頁(yè)!絕對(duì)值距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第63頁(yè)!歐式(Euclidian
)距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第64頁(yè)!歐氏Euclidian距離實(shí)例多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第65頁(yè)!變量標(biāo)準(zhǔn)化多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第66頁(yè)!馬氏Mahalanobis
距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第67頁(yè)!蘭氏Canberra距離多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第68頁(yè)!例題學(xué)生的身高與體重資料樣品123456789身高X1160159160157169162165154160體重X2494653414950484345多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第69頁(yè)!2、對(duì)指標(biāo)(變量)分類(lèi)(R型)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第70頁(yè)!
夾角余弦(Cosine)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第71頁(yè)!
相關(guān)系數(shù)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第72頁(yè)!第三節(jié)八種系統(tǒng)聚類(lèi)方法
(hierarchicalclusteringmethod)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第73頁(yè)!
類(lèi)與類(lèi)之間的距離
1.最短距離法(singlelinkage)2.最長(zhǎng)距離法(pletelinkage)3.中間距離法(medianmethod)4.重心法(centroidmethod)5.類(lèi)平均法(averagelinkage)6.可變類(lèi)平均法(flexible-betamethod)7.可變法8.離差平方和法(Ward'sminimum-variancemethod)多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第74頁(yè)!遞推公式多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第75頁(yè)!D(0)表1
D(0)G1={X1}G2={X2}G3={X3}G4={X4}G5={X5}G1={X1}0G2={X2}10G3={X3}2.51.50G4={X4}653.50G5={X5}875.520多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第76頁(yè)!D(2)
表3D(2)G7
G4
G5G7={G3,G6}0G4={X4}3.50G5={X5}5.520多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第77頁(yè)!聚類(lèi)譜系圖多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第78頁(yè)!(二)最長(zhǎng)距離法(Furthest
Neighbor
)類(lèi)類(lèi)間:兩類(lèi)間兩兩樣品距離最長(zhǎng)的???x11?x21???????x11?x21????多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第79頁(yè)!D(0)
表1D(0)G1
G2
G3
G4
G5G1={X1}0G2={X2}10G3={X3}2.51.50G4={X4}653.50G5={X5}875.520多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第80頁(yè)!D(2)
表3D(2)G6
G7
G3G60G7={G4,G5}80G3={X3}2.55.50多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第81頁(yè)!多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第82頁(yè)!如果在某一步將類(lèi)Gp與Gq類(lèi)合并為Gr,任一類(lèi)Gk和新Gr的距離公式為:
當(dāng)時(shí),由初等幾何知就是上面三角形的中線。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第83頁(yè)!D2(1)
G6
G3
G4
G5G6={X1,X2}0G3={X3}40G4={X4}30.2512.250G5={X5}56.2530.2540多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第84頁(yè)!D2(3)
G7
G8
G7={X1,X2,X3}0G8={X4,X5}30.250多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第85頁(yè)!
遞推公式注意:初始距離用歐式距離則有下列多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第86頁(yè)!D2(1)
G6
G3
G4
G5G6={X1,X2}0G3={X3}40G4={X4}30.2512.250G5={X5}56.2530.2540多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第87頁(yè)!D2(3)
G7
G8
G7={X1,X2,X3}0G8={X4,X5}34.030多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第88頁(yè)!遞推公式多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第89頁(yè)!D2(1)
G6
G3
G4
G5G6={X1,X2}0G3={X3}4.250G4={X4}30.2512.250G5={X5}56.2530.2540多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第90頁(yè)!D2(3)
G7
G8
G7={X4,X5}0G8={X1,X2,X3}36.080多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第91頁(yè)!(七)可變法如果讓中間距離法的遞推公式前兩項(xiàng)的系數(shù)也依賴(lài)于,則遞推公式為:多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第92頁(yè)!D2(0)G1
G2
G3
G4
G5G1={X1}0G2={X2}0.50G3={X3}3.1251.1250G4={X4}1812.56.1250G5={X5}3224.515.12520多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第93頁(yè)!D
2(2)
G6
G7
G3G6={X1,X2}0G7={X4X5}42.250G3={X3}2.66713.50多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第94頁(yè)!多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第95頁(yè)!方法最短距離法最長(zhǎng)距離法中間距離法重心法類(lèi)平均法可變類(lèi)平均法可變法離差平方和法???np/nrnp/nr(1-β)np/nr(1-β)/2ni+np/ni+nr???nq/nrnq/nr(1-β)nq/nr(1-β)/2ni+nq/ni+nr00-1/4≧β≧0-αp
αq0<1<1-ni/ni+nr-??000000多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第96頁(yè)!1990年全國(guó)人口普查文化程度人口比例(%)地區(qū)序號(hào)DXBZCZBZWMBZ北京天津河北山西內(nèi)蒙遼寧吉林黑龍江上海江蘇浙江安徽福建江西山東河南湖北湖南廣東廣西海南四川貴州云南西藏陜西甘肅青海寧夏新疆1234567891011121314151617181920212223242526272829309.304.67.961.381.482.602.152.146.531.471.17.881.23.99.98.851.571.141.34.791.24.96.78.81.571.671.101.491.611.8530.5529.3824.6929.2425.4732.3226.3128.4631.5926.4323.7419.9716.8718.8425.1826.5523.1622.5723.0419.1422.5321.6514.6513.853.8524.3616.8517.7620.2720.668.708.9215.2111.3015.398.8110.4910.8711.0417.2317.4624.4315.6316.2216.8716.1515.7912.1010.4510.6113.9716.2424.2725.4444.4319.6227.9327.7022.0612.75多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第97頁(yè)!類(lèi):北京、天津、山西、遼寧、吉林、黑龍江、上海。其中大多是東部經(jīng)濟(jì)、文化較發(fā)達(dá)的地區(qū)。第二類(lèi):安徽、寧夏、青海、甘肅、云南、貴州其中大多數(shù)是西部經(jīng)濟(jì)、文化發(fā)展較慢的地區(qū)。第三類(lèi):西藏。經(jīng)濟(jì)、文化較落后的地區(qū)。第四類(lèi):其它省、直轄市、自治區(qū)。經(jīng)濟(jì)、文化在全國(guó)處于中等水平。根據(jù)聚類(lèi)圖把30個(gè)樣品分為四類(lèi)能更好地反映我國(guó)實(shí)際情況。多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第98頁(yè)!表3-420個(gè)國(guó)家信息基礎(chǔ)設(shè)施指標(biāo)資料序號(hào)國(guó)家CallMovecallFeeComputerMipsNet1234567891011121314151617181920美國(guó)日本德國(guó)瑞典瑞士丹麥新加坡中國(guó)臺(tái)灣韓國(guó)巴西智利墨西哥俄羅斯波蘭匈牙利馬來(lái)西亞泰國(guó)印度法國(guó)英國(guó)631.60498.40557.60684.10644.00620.30498.40469.40434.5081.90138.6092.20174.90169.00262.20195.5078.6013.60559.10521.10161.90143.2070.60281.8093.50248.60147.5056.1073.0016.308.209.805.006.5049.4088.4027.80.3042.90122.500.363.572.181.401.982.562.503.683.363.021.402.615.123.682.664.194.956.281.270.98403.00176.00199.00286.00234.00296.00284.00119.0099.0019.0031.0031.0024.0040.0068.0053.0022.002.00201.00248.0026073.0010223.0011571.0016660.0013621.0017210.0013578.006911.005795.00876.001411.001751.001101.001796.003067.002734.001662.00101.0011702.0014461.0035.346.269.4829.3922.6821.8413.491.721.660.521.280.350.481.453.091.250.110.014.7611.91多元統(tǒng)計(jì)分析課件(聚類(lèi)分析)共107頁(yè),您現(xiàn)在瀏覽的是第99頁(yè)!本例聚為2類(lèi):類(lèi):巴西、墨西哥
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度餐飲單位市場(chǎng)拓展合作合同
- 二零二五年度房屋出租中介服務(wù)合同(含租賃合同解除條件)
- 二零二五年度果園果樹(shù)種植與農(nóng)業(yè)科技創(chuàng)新合作承包經(jīng)營(yíng)合同
- 二零二五年度國(guó)際文化交流項(xiàng)目合作協(xié)議
- 二零二五年度個(gè)人新能源汽車(chē)貸款合同
- 二零二五年度商業(yè)用房物業(yè)服務(wù)與智慧安防系統(tǒng)建設(shè)合同
- 二零二五年度數(shù)據(jù)中心UPS電源維護(hù)合同
- 二零二五年度跨境電商平臺(tái)運(yùn)營(yíng)合同免責(zé)協(xié)議書(shū)
- 2025年度消費(fèi)者權(quán)益保護(hù)法民事糾紛調(diào)解協(xié)議
- 二零二五年度幼兒園幼兒保育員服務(wù)合同
- 豐田車(chē)系卡羅拉(雙擎)轎車(chē)用戶使用手冊(cè)【含書(shū)簽】
- 商品價(jià)格表(全)
- 管理系統(tǒng)中計(jì)算機(jī)應(yīng)用詳細(xì)課件
- 《多維度兒童智力診斷量表》MIDSC的編制
- 慢阻肺從急性加重期到穩(wěn)定期的全程管理
- 2023年上海市普陀區(qū)高考?xì)v史二模試卷及答案解析
- 瑞達(dá)峰環(huán)境友好型高附加值關(guān)鍵醫(yī)藥中間體、特色原料藥及 GMP 成品藥(仿制藥與創(chuàng)新藥)規(guī)?;a(chǎn)項(xiàng)目(一期)環(huán)評(píng)報(bào)告書(shū)
- 嚴(yán)重創(chuàng)傷的急救處理
- GB/T 1228-2006鋼結(jié)構(gòu)用高強(qiáng)度大六角頭螺栓
- 國(guó)際商法 吳建斌課件 思考題答案
- 高等儀器分析第1章-緒論課件
評(píng)論
0/150
提交評(píng)論