




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
分類預(yù)測:判別分析判別分析的一般內(nèi)容判別分析是一種實現(xiàn)統(tǒng)計分類的分析方法例如:不同類型客戶的預(yù)測應(yīng)用特點:數(shù)據(jù)中包含用于預(yù)測的判別變量(自變量),其類型可以為定距,也可以為定類數(shù)據(jù)中包含所屬類別的類別變量(因變量),為定類型判別分析可以根據(jù)已有數(shù)據(jù),確定分類與判別變量之間的數(shù)量關(guān)系,建立判別函數(shù),并可通過判別函數(shù)實現(xiàn)對未知數(shù)據(jù)類別的判定和預(yù)測判別分析的一般內(nèi)容判別分析與聚類分析的不同點:聚類分析中的類別是未知的,完全通過數(shù)據(jù)來確定判別分析,通過對類別的“訓(xùn)練樣本〞的學(xué)習(xí),建立判別準(zhǔn)那么,具有“預(yù)測〞意義判別分析方法的劃分:根據(jù)類數(shù):兩組判別分析、多組判別分析根據(jù)數(shù)學(xué)模型:線性判別、非線性判別根據(jù)判別準(zhǔn)那么:距離判別法、Fisher判別法、Bayes判別法距離判別設(shè)有來自k2個總體的k組樣本,每組樣本有ni(i=1,2,..k)個關(guān)于X1,X2,…,Xp個輸入(判別)變量的觀察值(p>k)將n個樣本數(shù)據(jù)看成p維空間中的點,計算出每個類別的中心(分類均值)分別計算任一樣本點到各個類別中心的馬氏距離根據(jù)距離最近的原那么,距離哪個中心近,那么屬于哪個類距離判別假設(shè)有兩個總體G1和G2,從第一個總體中抽取n個樣本,從第二個總體中抽取m個樣本,每個樣本有p個判別變量(1),(2),(1),(2)分別為G1和G2的均值向量和協(xié)差陣,那么點X到Gi的馬氏距離定義為:為什么用馬氏距離?距離判別根據(jù)D(X,G1)、D(X,G2)判斷:如果D(X,G1)<D(X,G2),那么:X∈G1如果D(X,G2)<D(X,G1),那么:X∈G2如果D(X,G1)=D(X,G2),那么待判判別函數(shù):W(X)=D(X,G2)-D(X,G1),判斷:如果W(X)>0,那么:X∈G1如果W(X)<0,那么:X∈G2如果W(X)=0,那么待判距離判別的目的:求D2(X,G2)=D2(X,G1),即判別函數(shù)等于0時X的解。解集形成的軌跡是一條分隔線或平面或超平面分隔線與兩類的中心連線垂直且垂足為連線的中點可見:只有當(dāng)兩個總體的均值存在顯著差異時,判別分析才有意義距離判別距離判別計算時:(i)未知時,可用樣本估計如果各組協(xié)方差陣相等,采用(pooledwithin-groupscovariance),記為:那么判別函數(shù)(線性):距離判別計算時:如果各組協(xié)方差陣不相等(separated-groupscovariance),那么判別函數(shù)(非線性):Fisher判別Fisher判別也稱典型判別根本思想是投影,即將原來p維空間的樣本點投影到低維y空間中,以簡化問題和提高判別精度Fisher判別---根本模型Fisher判別的根本模型即是Fisher判別函數(shù),是判別變量的線性函數(shù)形式:系數(shù)ai稱為判別系數(shù),表示各判別變量對于判別函數(shù)的影響Y反映的是樣本在低維空間中某個維度上的坐標(biāo)判別函數(shù)通常為多個,于是得到在低維空間中多個維度上的坐標(biāo),進(jìn)而決定了樣本點在低空間中的位置尋找最正確的投影方向:能夠?qū)⒖傮w盡可能分開的方向Fisher判別---根本計算假設(shè)有兩個總體G1和G2,從第一個總體中抽取n個樣本,從第二個總體中抽取m個樣本,每個樣本有p個判別變量假設(shè)所建立的判別函數(shù)為將屬于不同兩類的樣本觀測值代入判別函數(shù)中,那么:為使判別函數(shù)很好地區(qū)分來自兩個不同總體的樣本,希望:相差越大越好,且組內(nèi)的離差平方和越小越好Fisher判別---根本計算即下式越大越好。利用求極值原理,可以求出使I到達(dá)最大時的系數(shù)bFisher判別---根本計算首先,在判別變量的p維空間中,找到某個線性組合,使各類別的平均值差異最大,作為判別的第一維度,代表判別變量組間方差中的最大局部,得到第一判別函數(shù)然后,按照同樣規(guī)那么依次找到第二判別函數(shù)、第三判別函數(shù)等,這些判別函數(shù)之間完全獨立得到的每個函數(shù)都可以反映判別變量組間方差的一局部,各判別函數(shù)所代表的組間方差比例之和為100%。前面的判別函數(shù)相對重要,后面的判別函數(shù)只代表很少一局部方差,可以被忽略Fisher判別---根本思想點x在以a為法方向的投影為a’x,那么各組數(shù)據(jù)的投影為:將Gm組中數(shù)據(jù)投影的均值記為有:記k組數(shù)據(jù)投影的總均值為有:
Fisher判別---根本計算組間離差平方和為:組內(nèi)離差平方和為:Fisher判別---根本計算希望尋找a使得SSG盡可能大而SSE盡可能小,即記方程|B-lE|=0的全部特征根為l1≥…≥lr>0,相應(yīng)的特征向量為v1,…,vr.那么判別函數(shù)為:yi(x)=vi’x(=a’x)記pi為第I個判別函數(shù)的判別能力(效率),有:m個判別函數(shù)的判別能力為:最大的值為方程|B-lE|=0的最大特征根l1使Fisher判別---根本計算如果y空間是一維的,那么只需要計算判別閾值y0,并將新樣本的判別得分與閾值進(jìn)行比較即可得到判別結(jié)果通常y空間不是一維的,需要在y維空間中建立基于距離判別的判別函數(shù)對新樣本,求出它們離各個類別中心的距離,依據(jù)判別函數(shù),判別屬于哪個類別Bayes判別在先驗概率的根底上,利用判別函數(shù)所提供的信息對先驗概率進(jìn)行調(diào)整,最后得到某個樣本屬于哪個類別的概率估計首先,計算樣本點X屬于總體Gi〔i=1,2,…,k〕的概率然后,根據(jù)k個概率值的大小決策,樣本點X應(yīng)屬于概率最大的類別〔總體〕Bayes判別第一,計算先驗概率,設(shè)k個總體G1,G2…,Gk的先驗概率分別為q1,q2,…qk第二,計算樣本似然,即在總體Gi〔i=1,2,…,k〕中抽到樣本X的概率例如:輸入變量服從多元正態(tài)分布,且各總體協(xié)差陣相等,那么在總體G1中抽到樣本X的概率為Bayes判別第三,計算樣本屬于總體Gi〔i=1,2,…,k〕的概率判別分析的應(yīng)用例如采用一份某商學(xué)院招收MBA學(xué)生的數(shù)據(jù):大學(xué)平均學(xué)分績〔X1〕、管理才能得分〔X2〕以及錄取結(jié)果〔Y,1表示錄取,2不錄取,3待定〕判別分析的應(yīng)用例如--準(zhǔn)備工作均值檢驗原假設(shè):某輸入變量各總體的均值無顯著差異操作:Means:輸出輸入變量的均值、方差等根本描述統(tǒng)計量;UnivariateANOVAS,進(jìn)行Wilks均值檢驗判別分析的應(yīng)用例如--準(zhǔn)備工作方差齊性檢驗:直接觀測Matrix框下:Within-groupscorrelation;Within-groupscovariance;Separate-group
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療領(lǐng)域中區(qū)塊鏈技術(shù)的性能優(yōu)化探討
- 辦公領(lǐng)域的數(shù)字化轉(zhuǎn)型與大數(shù)據(jù)分析
- 醫(yī)療倫理教育培養(yǎng)醫(yī)生的責(zé)任與擔(dān)當(dāng)
- 農(nóng)科教辦總結(jié)模版
- 變電站值班員年個人工作總結(jié)模版
- 醫(yī)療信息化進(jìn)程中患者信息安全的保障策略
- 借款合同范例微信
- 保溫材料供貨合同范例
- 二年級班主任第一學(xué)期工作總結(jié)模版
- G220安防工程監(jiān)理工作總結(jié)模版
- 二手車經(jīng)銷企業(yè)經(jīng)營管理等級評價規(guī)范
- 中國軍力報告2023全文
- 提香-西方美術(shù)史-
- 深圳市南山區(qū)教育系統(tǒng)招聘公辦幼兒園園長考試題庫2023
- 貧困家訪記錄表
- 明亞保險經(jīng)紀(jì)人考試題庫答案
- 干部選拔任用程序
- 機械制造技術(shù)-機械加工工藝
- 設(shè)卡堵截示范作業(yè)教案
- 供貨組織措施及供貨方案
- 浙教版-信息技術(shù)-必修1-32-python-語言的程序設(shè)計-課件(教學(xué)課件)
評論
0/150
提交評論