




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、分類(lèi)預(yù)測(cè):判別分析判別分析的一般內(nèi)容 判別分析是一種實(shí)現(xiàn)統(tǒng)計(jì)分類(lèi)的分析方法 例如:不同類(lèi)型客戶(hù)的預(yù)測(cè)應(yīng)用 特點(diǎn): 數(shù)據(jù)中包含用于預(yù)測(cè)的判別變量(自變量),其類(lèi)型可以為定距,也可以為定類(lèi) 數(shù)據(jù)中包含已知所屬類(lèi)別的類(lèi)別變量(因變量),為定類(lèi)型 判別分析可以根據(jù)已有數(shù)據(jù),確定分類(lèi)與判別變量之間的數(shù)量關(guān)系,建立判別函數(shù),并可通過(guò)判別函數(shù)實(shí)現(xiàn)對(duì)未知數(shù)據(jù)類(lèi)別的判定和預(yù)測(cè)判別分析的一般內(nèi)容 判別分析與聚類(lèi)分析的不同點(diǎn): 聚類(lèi)分析中的類(lèi)別是未知的,完全通過(guò)數(shù)據(jù)來(lái)確定 判別分析,通過(guò)對(duì)已知類(lèi)別的“訓(xùn)練樣本”的學(xué)習(xí),建立判別準(zhǔn)則,具有“預(yù)測(cè)”意義 判別分析方法的劃分: 根據(jù)類(lèi)數(shù):兩組判別分析、多組判別分析 根據(jù)數(shù)
2、學(xué)模型:線(xiàn)性判別、非線(xiàn)性判別 根據(jù)判別準(zhǔn)則:距離判別法、Fisher判別法、Bayes判別法距離判別 設(shè)有來(lái)自k2個(gè)總體的k組樣本,每組樣本有ni(i=1,2,.k)個(gè)關(guān)于X1,X2,Xp個(gè)輸入(判別)變量的觀察值(p k) 將n個(gè)樣本數(shù)據(jù)看成p維空間中的點(diǎn),計(jì)算出每個(gè)類(lèi)別的中心(分類(lèi)均值) 分別計(jì)算任一樣本點(diǎn)到各個(gè)類(lèi)別中心的馬氏距離 根據(jù)距離最近的原則,距離哪個(gè)中心近,則屬于哪個(gè)類(lèi)距離判別 假設(shè)有兩個(gè)總體G1和G2,從第一個(gè)總體中抽取n個(gè)樣本,從第二個(gè)總體中抽取m個(gè)樣本,每個(gè)樣本有p個(gè)判別變量 (1), (2), (1), (2)分別為G1和G2的均值向量和協(xié)差陣,則點(diǎn)X到Gi的馬氏距離定義
3、為:21 )()()(),()(1)()(2,iXXGXDiiii為什么用馬氏距離?距離判別 根據(jù)D(X,G1)、D(X,G2)判斷: 如果D(X,G1)D(X,G2),則:XG1 如果D(X,G2)0,則:XG1 如果W(X)0, 相應(yīng)的特征向量為v1,vr. 則判別函數(shù)為:yi(x)=vix (= ax)記pi為第I個(gè)判別函數(shù)的判別能力(效率), 有:m個(gè)判別函數(shù)的判別能力為:最大的值為方程|B-l lE|=0的最大特征根l l11iirhhpll使a Baa Ea111mimiirihhpllFisher判別-基本計(jì)算 如果y空間是一維的,則只需要計(jì)算判別閾值y0,并將新樣本的判別得分與
4、閾值進(jìn)行比較即可得到判別結(jié)果 通常y空間不是一維的,需要在y維空間中建立基于距離判別的判別函數(shù) 對(duì)新樣本,求出它們離各個(gè)類(lèi)別中心的距離,依據(jù)判別函數(shù),判別屬于哪個(gè)類(lèi)別-4-20246-4-3-2-101232122110nnynynyBayes判別 在先驗(yàn)概率的基礎(chǔ)上,利用判別函數(shù)所提供的信息對(duì)先驗(yàn)概率進(jìn)行調(diào)整,最后得到某個(gè)樣本屬于哪個(gè)類(lèi)別的概率估計(jì) 首先,計(jì)算樣本點(diǎn)X屬于總體Gi(i=1,2,k)的概率 然后,根據(jù)k個(gè)概率值的大小決策,樣本點(diǎn)X應(yīng)屬于概率最大的類(lèi)別(總體))|(XGpiBayes判別 第一,計(jì)算先驗(yàn)概率 ,設(shè)k個(gè)總體G1,G2,Gk的先驗(yàn)概率分別為q1,q2,qk 第二,計(jì)算
5、樣本似然,即在總體Gi(i=1,2,k)中抽到樣本X的概率 例如: 輸入變量服從多元正態(tài)分布,且各總體協(xié)差陣相等,則在總體G1中抽到樣本X的概率為)(iGp)|(iGXp)()()(21exp2|1)|()1(1)1(1XXGXp21exp2|1)|(211DGXp21exp2|1)|(222DGXpBayes判別 第三,計(jì)算樣本屬于總體Gi(i=1,2,k)的概率)|(XGpikiGXpqGXpqXGpkjjjiii,.2 , 1,)|()|()|(1kiDqDqXGpkjjjiii,.2 , 1,)2/exp()2/exp()|(12222/1ln)|(iiiDqxGp21 )()()()
6、,()(1)()(2,iXXGXDiiii判別分析的應(yīng)用示例 采用一份某商學(xué)院招收MBA學(xué)生的數(shù)據(jù):大學(xué)平均學(xué)分績(jī)(X1)、管理才能得分(X2)以及錄取結(jié)果(Y,1表示錄取,2不錄取,3待定)判別分析的應(yīng)用示例-準(zhǔn)備工作 均值檢驗(yàn) 原假設(shè):某輸入變量各總體的均值無(wú)顯著差異 操作:Means:輸出輸入變量的均值、方差等基本描述統(tǒng)計(jì)量;Univariate ANOVAS,進(jìn)行Wilks均值檢驗(yàn)SSTSSEWilksl 判別分析的應(yīng)用示例-準(zhǔn)備工作 方差齊性檢驗(yàn):直接觀測(cè) Matrix框下:Within-groups correlation;Within-groups covariance;Sepa
7、rate-groups covariance判別分析的應(yīng)用示例-結(jié)果解讀 Fisher判別函數(shù) 判別函數(shù)(選擇Fishers選項(xiàng)) 原始變量對(duì)新空間中樣本點(diǎn)位置確定的貢獻(xiàn)程度Canonical Discriminant Function Coefficients4.086-1.831.007.014-15.595-1.470大學(xué)平均成績(jī)管理才能評(píng)分(Constant)12FunctionUnstandardized coefficientsStandardized Canonical DiscriminantFunction Coefficients.913-.409.449.895大學(xué)平均成
8、績(jī)管理才能評(píng)分12Function212211014. 0831. 1470. 1007. 0086. 4595.15xxyxxyFunctions at Group Centroids2.368.241-2.403.321-.236-.633錄取結(jié)果錄取不錄取待定12FunctionUnstandardized canonical discriminantfunctions evaluated at group means判別分析的應(yīng)用示例-結(jié)果解讀 判別能力檢驗(yàn) 哪個(gè)判別函數(shù)更重要iieigenvalueWilks11lWilks Lambda.165146.7104.000.84513.
9、7731.000Test of Function(s)1 through 22Wilks LambdaChi-squaredfSig.Eigenvalues4.110a95.795.7.897.184a4.3100.0.394Function12Eigenvalue% of VarianceCumulative %CanonicalCorrelationFirst 2 canonical discriminant functions were used in theanalysis.a. kiGXpqGXpqXGpkjjjiii,.2 , 1,)|()|()|(1 Bayes判別Classification Function Coefficients70.25550.61661.215.152.120.121-163.901-89.717-119.397大學(xué)平均成績(jī)管理才能評(píng)分(Constant)錄取不錄取待定錄取結(jié)果Fishers linear discriminant functionsPrior Probab
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國(guó)鉬合金行業(yè)發(fā)展戰(zhàn)略及前景趨勢(shì)分析報(bào)告
- 2025-2030年中國(guó)透明聚丙烯行業(yè)運(yùn)行狀況及發(fā)展規(guī)劃分析報(bào)告
- 2025-2030年中國(guó)過(guò)氧化二異丙苯行業(yè)運(yùn)行現(xiàn)狀及發(fā)展前景分析報(bào)告
- 2025-2030年中國(guó)苗圃產(chǎn)業(yè)市場(chǎng)十三五規(guī)劃及發(fā)展建議分析報(bào)告
- 2025-2030年中國(guó)納米銀市場(chǎng)運(yùn)行態(tài)勢(shì)及投資戰(zhàn)略研究報(bào)告
- 2025-2030年中國(guó)紫菜市場(chǎng)競(jìng)爭(zhēng)格局與發(fā)展策略分析報(bào)告
- 2025-2030年中國(guó)管殼式換熱器行業(yè)運(yùn)行態(tài)勢(shì)與未來(lái)發(fā)展戰(zhàn)略研究報(bào)告
- 2025-2030年中國(guó)硬質(zhì)纖維板行業(yè)運(yùn)行態(tài)勢(shì)及投資戰(zhàn)略研究報(bào)告
- 天津師范大學(xué)津沽學(xué)院《半導(dǎo)體器件》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西交通職業(yè)技術(shù)學(xué)院《測(cè)量學(xué)基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 施工作業(yè)申請(qǐng)表
- 浸出液的凈化與沉積
- 銀行間本幣市場(chǎng)交易員資格考試真題模擬匯編(共586題)
- 苯乙酸安全技術(shù)說(shuō)明書(shū)(msds)
- 幼兒園大班《防欺凌》教案5篇,幼兒園大班防欺凌活動(dòng)教案
- 衛(wèi)生管理初中級(jí)職稱(chēng)大綱
- 《當(dāng)代網(wǎng)絡(luò)文學(xué)作品發(fā)展研究6300字(論文)》
- 孟氏骨折與蓋氏骨折講解學(xué)習(xí)
- GB/T 9386-2008計(jì)算機(jī)軟件測(cè)試文檔編制規(guī)范
- GB/T 25137-2010鈦及鈦合金鍛件
- 第2課《說(shuō)和做》課件(共30張ppt) 部編版語(yǔ)文七年級(jí)下冊(cè)
評(píng)論
0/150
提交評(píng)論