2022年聚類分析、判別分析、主成分分析、因子分析_第1頁
2022年聚類分析、判別分析、主成分分析、因子分析_第2頁
2022年聚類分析、判別分析、主成分分析、因子分析_第3頁
2022年聚類分析、判別分析、主成分分析、因子分析_第4頁
2022年聚類分析、判別分析、主成分分析、因子分析_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、聚類分析、判別分析、主成分分析、因子分析主成分分析與因子分析的區(qū)分1. 目的不同: 因子分析把諸多變量看成由對每一個變量都有作用的一些公共因子和僅對某一個變量有作用的特殊因子線性組合而 成,因此就是要從數(shù)據(jù)中控查出對變量起說明作用的公共因子和特殊因子以及其組合系數(shù);主成分分析只是從空間生成的角度查找能說明諸多變量變異的絕大部分的幾組彼此不相關(guān)的新變量(主成 分);2. 線性表示方向不同: 因子分析是把變量表示成各公因子的線性組合;而主成分分析中就是把主成分表示成各變量的線性組合;3. 假設(shè)條件不同:主成分分析中不需要有假設(shè);因子分析的假設(shè)包括:各個公共因子之間不相關(guān),特殊因子之間不相關(guān),公共因

2、子和特殊因子之間不相關(guān);4. 提取主因子的方法不同:因子分析抽取主因子不僅有主成分 法,仍有極大似然法,主軸因子法,基于這些方法得到的結(jié)果也不同;主成分只能用主成分法抽?。?. 主成分與因子的變化:當給定的協(xié)方差矩陣或者相關(guān)矩陣的特點值唯獨時,主成分一般是固定的;而因子分析中因子不是固定的,可以旋轉(zhuǎn)得到不同的因子;6. 因子數(shù)量與主成分的數(shù)量:在因子分析中,因子個數(shù)需要分析者指定( spss依據(jù)肯定的條件自動設(shè)定,只要是特點值大于1 的因子主可進入分析),指定的因子數(shù)量不同而結(jié)果也不同;在主成分分析中,成分的數(shù)量是肯定的,一般有幾個變量就有幾個主成分(只是主成分所說明的信息量不等);7. 功能

3、:和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫忙說明因子,在說明方面更加有優(yōu)勢;而假如想把現(xiàn)有的變量變成少數(shù)幾個新的變量(新的變量幾乎帶有原先全部變量的信息)來進入后續(xù)的分析,就可以使用主成分分析;當然,這種情形也可以使用因子得分做到,所以這種區(qū)分不是肯定的;6 / 6 下載文檔可編輯1 、聚類分析基本原理:將個體(樣品)或者對象(變量)按相像程度(距離遠近)劃分類別,使得同一類中的元素之間的相像性比其他類的元素的相像性更強;目的在于使類間元素的同質(zhì)性最大化和類與類間元素的異質(zhì)性最大化;常用聚類方法:系統(tǒng)聚類法, k- 均值法,模糊聚類法,有序樣品的聚類,分解法,加入法;留意事項: 1.系

4、統(tǒng)聚類法可對變量或者記錄進行分類,k-均值法只能對記錄進行分類;2. k-均值法要求分析人員事先知道樣品分為多少類;3. 對變量的多元正態(tài)性,方差齊性等要求較高;應(yīng)用領(lǐng)域:細分市場,消費行為劃分,設(shè)計抽樣方案等2、判別分析基本原理:從已知的各種分類情形中總結(jié)規(guī)律(訓(xùn)練出判別函數(shù)),當新樣品進入時,判定其與判別函數(shù)之間的相像程度(概率最大,距離最近,離差最小等判別準就);常用判別方法:最大似然法,距離判別法,fisher判別法, bayes判別法,逐步判別法等;留意事項: 1.判別分析的基本條件:分組類型在兩組以上,說明變量必需是可測的;2. 每個說明變量不能是其它說明變量的線性組合(比如顯現(xiàn)多

5、重共線性情形時,判別權(quán)重會顯現(xiàn)問題);3. 各說明變量之間聽從多元正態(tài)分布(不符合時,可使用 logistic回來替代),且各組說明變量的協(xié)方差矩陣相等(各組協(xié)方方差矩陣有顯著差異時,判別函數(shù)不相同);相對而言,即使判別函數(shù)違反上述適用條件,也很穩(wěn)健,對結(jié)果影響不大;應(yīng)用領(lǐng)域:對客戶進行信用猜測,查找潛在客戶(是否為消費者, 公司是否勝利,同學(xué)是否被錄用等等),臨床上用于鑒別診斷;3、 主成分分析 /因子分析主成分分析基本原理:利用降維(線性變換 的思想,在缺失很少信息的前提下把多個指標轉(zhuǎn)化為幾個綜合指標(主成分 , 即每個主成分都是原始變量的線性組合 , 且各個主成分之間互不相關(guān) , 使得主

6、成分比原始變量具有某些更優(yōu)越的性能(主成分必需保留原始變量90%以上的信息),從而達到簡化系統(tǒng)結(jié)構(gòu),抓住問題實質(zhì)的目的;因子分析基本原理:利用降維的思想,由討論原始變量相關(guān)矩陣內(nèi)部的依靠關(guān)系動身,把一些具有錯綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個綜合因子;(因子分析是主成分的推廣,相對于主成分分析,更傾向于描述原始變量之間的相關(guān)關(guān)系)求解主成分的方法:從協(xié)方差陣動身(協(xié)方差陣已知),從相關(guān)陣動身(相關(guān)陣 r已知);(實際討論中,總體協(xié)方差陣與相關(guān)陣是未知的,必需通過樣本數(shù)據(jù)來估量)求解因子載荷的方法:主成分法,主軸因子法,極大似然法,最小二乘法, a 因子提取法;留意事項: 1.由協(xié)方差陣動身與由相關(guān)

7、陣動身求解主成分所得結(jié)果不一樣時,要恰當?shù)倪x取某一種方法;2. 對于度量單位或是取值范疇在同量級的數(shù)據(jù),可直接求協(xié)方差陣;對于度量單位不同的指標或是取值范疇彼此差異特別大的指標,應(yīng)考慮將數(shù)據(jù)標準化,再由協(xié)方差陣求主成分;3. 主成分分析不要求數(shù)據(jù)來源于正態(tài)分布;4. 在選取初始變量進入分析時應(yīng)當特殊留意原始變量是否存在多重共線性的問題(最小特點根接近于零,說明存在多重共線性問題);5. 因子分析中各個公共因子之間不相關(guān),特殊因子之間不相關(guān),公共因子和特殊因子之間不相關(guān);應(yīng)用領(lǐng)域:解決共線性問題,評判問卷的結(jié)構(gòu)效度,查找變量間潛在的結(jié)構(gòu),內(nèi)在結(jié)構(gòu)證明;4、對應(yīng)分析 / 最優(yōu)尺度分析基本原理:利用降維的思想以達到簡化數(shù)據(jù)結(jié)構(gòu)的目的,同時對數(shù)據(jù)表中的行與列進行處理,尋求以低維圖形表示數(shù)據(jù)表中行與列之間的關(guān)系;對應(yīng)分析:用于展現(xiàn)變量(兩個 / 多個分類)間的關(guān)系(變量的分類數(shù)較多時較佳);最優(yōu)尺度分析:可同時分析多個變量間的關(guān)系,變量的類型可以是 無序多分類,有序多分類或連續(xù)性變量,并對多項題的分析供應(yīng)了支持;5、典型相關(guān)分析基本原理:借用主成分分析降維的思想,分別對兩組變量提取主成分,且使從兩組變量提取的主成分之間的相關(guān)程度達到最大,而從同一組內(nèi)部提取的各主成分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論