聚類分析與判別分析課堂案例_第1頁
聚類分析與判別分析課堂案例_第2頁
聚類分析與判別分析課堂案例_第3頁
聚類分析與判別分析課堂案例_第4頁
聚類分析與判別分析課堂案例_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、聚類分析和判別分析聚類分析和判別分析班級+姓名二階聚類&定義:二階聚類是數據集內部的而不是外觀上的分類,是一種新型的分層聚類算法,主要利用距離變量(歐氏距離),適用于任何尺度的變量。以本表為例做二階聚類的分析確定分類變量和連續(xù)變量選項一般采用默認值輸出值選擇要輸出的形式由圖得出結論:聚類質量的指標大于0.5,聚類效果好。最后分類情況K-均值聚類&由用戶制定類別書的大樣本資料的逐步聚類分析方法。&1.指定聚類數目k&2.確定k個初始類中心&3.根據距離最近原則進行聚類&4.重新確定k個類中心&5.迭代計算確定分類變量和個案迭代選項保存選項選

2、項為默認值初始聚類中心表,由于沒有指定初始聚類中心,故列出了由系統(tǒng)指定的聚類中心,和原始數據比較,可見分別是1號和9號。由圖可見,第一類有6個樣本,第二類有6個樣本。查看數據文件,可以看出多出兩個變量,分別表示每個個案的具體分類歸宿和與類中心的距離。系統(tǒng)聚類&效果最好且經常使用方法之一,聚類按一定層次進行。&Q型聚類是對樣本(個案)進行的分類,它將具有共同特點的個案聚集在一起,以便對不同類的樣本進行分析。&R型聚類和Q型聚類類似,只不過是對變量的分析。確定相關變量系統(tǒng)默認選項,輸出一張概述聚類進程的表格,反映聚類過程中每一個變量合并情況。輸出圖的樣式和內容由于不同的類聚

3、方法所使用的聚類模型不一樣,選用不同用的聚類方法,所使用的聚類模型可能會有很大的區(qū)別。數據化標準為二元變量提供的二值數據的不相似性測度,默認為平方歐氏距離。分析結果此表為聚類順序表,第一步是4個變量與5個變量進行聚類,變量間的距離系數為36.34,這個結果將在第二步中用到,第二步是經過第一步聚類后的變量4和5與變量6進行聚類,變量間的系數為3026.561,這個結果將在第三步用到,以此類推,這些變量經過5步聚類最終聚為一個大類。系統(tǒng)聚類冰柱圖系統(tǒng)聚類樹狀圖判別分析&判別分析是多元統(tǒng)計中用于判別樣品所屬類型的一種統(tǒng)計分析方法,是一種在已知研究對象用某種方法已經分成若干類的情況下,確定新的樣品屬于哪一類的多元統(tǒng)計分析方法。&判別分析方法處理問題時,通常要給出用來衡量新樣品與各已知組別的接近程度的指標,即判別函數,同時也指定一種判別準則,借以判定新樣品的歸屬。所謂判別準則是用于衡量新樣品與各已知組別接近程度的理論依據和方法準則。常用的有,距離準則、Fisher準則、貝葉斯準則等。判別準則可以是統(tǒng)計性的,如決定新樣品所屬類別時用到數理統(tǒng)計的顯著性檢驗,也可以是確定性的,如決定樣品歸屬時,只考慮判別函數值的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論