版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、會計學(xué)1判別分析案例判別分析案例(n l)第一頁,共50頁。機妙算”n“像泰山那么穩(wěn)固”n“像鉆石那么堅硬”n一些判別標準都是有原型的,雖然(surn)這些判別的標準并不那么精確或嚴格,但大都是根據(jù)一些現(xiàn)有的模型得到的。第1頁/共49頁第二頁,共50頁。sher判別(pnbi)法Bayes判別(pnbi)法逐步判別(pnbi)法第2頁/共49頁第三頁,共50頁。第3頁/共49頁第四頁,共50頁。第4頁/共49頁第五頁,共50頁。一類。第5頁/共49頁第六頁,共50頁。n主要(zhyo)利用一些檢驗來判斷變量的判別能力。第6頁/共49頁第七頁,共50頁。數(shù)據(jù)數(shù)據(jù)介紹介紹SPSS實現(xiàn)實現(xiàn)結(jié)果結(jié)果分
2、析分析R語言語言實現(xiàn)實現(xiàn)disc.sav, disc.txt第7頁/共49頁第八頁,共50頁。找出分類標準,并對沒分類的企業(yè)進行分類。第8頁/共49頁第九頁,共50頁。變量名稱變量名稱涵義描述涵義描述group表示類別。group-1代表上升,group-2代表穩(wěn)定,group-3代表下降。is表示企業(yè)規(guī)模。se表示服務(wù)。sa表示雇員工資比例。prr表示利潤增長。ms表示市場份額。msr表示市場份額增長。cp表示流動資金比例。cs表示資金周轉(zhuǎn)速度。第9頁/共49頁第十頁,共50頁。該數(shù)據(jù)disc.sav共有90個樣本,其中30個屬于上升型,30個屬于穩(wěn)定性,30屬于下降型。這個已知類別的數(shù)據(jù)稱
3、為(chn wi)一個“訓(xùn)練樣本”。group表示(biosh)類別8個用來建立判別標準的變量第10頁/共49頁第十一頁,共50頁。File Open Data “Disc.sav”第11頁/共49頁第十二頁,共50頁。第12頁/共49頁第十三頁,共50頁。第13頁/共49頁第十四頁,共50頁。第14頁/共49頁第十五頁,共50頁。兩種變量選擇兩種變量選擇(xunz)方法方法自變量同時自變量同時進入方程進入方程逐步逐步判別法判別法第15頁/共49頁第十六頁,共50頁。group選入分組變量(binling)is-cs選入自變量選擇(xunz)自變量同時進入方程的方法第16頁/共49頁第十七頁,
4、共50頁。第17頁/共49頁第十八頁,共50頁。選擇(xunz)Means進行均數(shù)估計選擇(xunz)Boxs M進行各組協(xié)方差陣相等檢驗生成Bayes判別方程系數(shù)和Fisher判別方程系數(shù)。選擇ANOVAs進行各組均值相等檢驗第18頁/共49頁第十九頁,共50頁。第19頁/共49頁第二十頁,共50頁。選擇(xunz)以樣本量百分比為先驗概率顯示每個單位判別分析后所屬類別顯示判別符合率表類別顯示在同一散點圖中以剔出某觀察單位所建立的判別函數(shù)判別該觀察單位所屬類別第20頁/共49頁第二十一頁,共50頁。在數(shù)據(jù)中保存判別(pnbi)后數(shù)據(jù)所屬類別在數(shù)據(jù)中保存數(shù)據(jù)的判別分第21頁/共49頁第二十二頁
5、,共50頁。90個變量100%讀入,沒有(mi yu)缺失值第22頁/共49頁第二十三頁,共50頁。各自(gz)變量的方差分析及統(tǒng)計量說明在3類企業(yè)間,各變量均有顯著(xinzh)差異統(tǒng)計量在0-1之間。越接近0組間差異越顯著;越接近1組間差異越不顯著。第23頁/共49頁第二十四頁,共50頁。各組協(xié)方差陣相等(xingdng)的檢驗說明拒絕協(xié)方差矩陣相等(xingdng)的假設(shè),即不能認為各組間協(xié)方差矩陣相等(xingdng)。從一些統(tǒng)計實踐的結(jié)果來看,很少有碰到檢驗不顯著的情況。而在一些實踐中,比如線性判別分析,即使方差協(xié)方差結(jié)構(gòu)不相等,對于結(jié)果的影響也不會有非常大的影響。第24頁/共49頁
6、第二十五頁,共50頁。標準化典型(dinxng)判別函數(shù)系數(shù)876543211435. 0019. 0355. 0457. 0334. 0365. 0433. 0415. 0 xxxxxxxxy得到2個標準化典型(dinxng)判別方程:876543212193. 0285. 0634. 0369. 0541. 0426. 0127. 0065. 0 xxxxxxxxy需要注意的是:這是標準化后的判別函數(shù),若要將變量帶入計算判別分,必須將變量進行標準化處理(即減均值除以標準差)。第25頁/共49頁第二十六頁,共50頁。結(jié)構(gòu)(jigu)系數(shù)矩陣用來說明判別變量對標準化典型判別方程的相關(guān)程度結(jié)果說
7、明,前6個變量(binling)(*)對方程1貢獻比較大,后兩個變量(binling)對方程2貢獻較大。第26頁/共49頁第二十七頁,共50頁。未標準化典型判別函數(shù)系數(shù)(xsh)Fisher判別法876543211384. 0004. 0023. 0068. 0007. 0037. 0257. 3035. 0088. 3xxxxxxxxy得到2個未標準化典型(dinxng)判別方程:876543212171. 0058. 0041. 0054. 0011. 0043. 0953. 0005. 0392. 5xxxxxxxxy可以將原變量值直接代入計算判別分進行分類。第27頁/共49頁第二十八頁
8、,共50頁。生成(shn chn)3個新的變量dis_1表示判別(pnbi)后所屬組別的值dis1_1表示樣本代入第1個判別函數(shù)所得的判別分dis2_1表示樣本代入第2個判別函數(shù)所得的判別分第28頁/共49頁第二十九頁,共50頁。Fisher判別(pnbi)法得到的分組圖各組重心描述在判別空間每一組的中心(zhngxn)位置第29頁/共49頁第三十頁,共50頁。判別(pnbi)力指數(shù)兩個判別(pnbi)函數(shù)的作用并不是平等的,判別(pnbi)力指數(shù)給出了判別(pnbi)函數(shù)的重要程度。說明(shumng)第一個判別函數(shù)的貢獻率高達98.8%,第二個判別函數(shù)的貢獻率僅為1.1%。第30頁/共49
9、頁第三十一頁,共50頁。殘余判別力指數(shù)殘余判別力的含義(hny)是:在以前計算的函數(shù)已經(jīng)提取過原始信息之后,殘余的變量信息對于判別分組的能力。值越小表示越高的判別力。說明方程1提取了很大的信息量,而殘余變量(binling)信息對于判別分組的能力很小了。第31頁/共49頁第三十二頁,共50頁。分類(fn li)結(jié)果從表上看,我們的分類函數(shù)(hnsh)能夠100%的把訓(xùn)練數(shù)據(jù)的每一個觀測值分到其本來的類。該表分成兩部分:上面一半是用從全部數(shù)據(jù)得到的判別函數(shù)(hnsh)來判斷每一個點的結(jié)果;下面一半是對每一個觀測值,都用僅缺少該觀測值的全部數(shù)據(jù)得到的判別函數(shù)(hnsh)來進行判斷的結(jié)果。第32頁/
10、共49頁第三十三頁,共50頁。各分類(fn li)的先驗概率先驗概率是根據(jù)樣本出現(xiàn)(chxin)概率確定的,本例3類企業(yè)各有30個,因此先驗概率相等都為33.3%。第33頁/共49頁第三十四頁,共50頁。Bayes判別(pnbi)法得到的判別(pnbi)函數(shù)系數(shù)得到(d do)3個判別方程:87654321273. 7942. 0362. 0481. 0900 . 0401. 0068. 7122. 0355.67(1)xxxxxxxx原分類87654321985. 4853. 0167. 0857. 0320 . 0593. 0030. 72342. 0765.61(2)xxxxxxxx原分
11、類87654321496. 2895. 00.074323. 1020 . 0864. 0601. 74558. 0964.104(3)xxxxxxxx原分類將觀察單位的各個變量分別代入3個判別函數(shù)中,可求出3個判別函數(shù)值,哪一個最大就屬于哪一類。第34頁/共49頁第三十五頁,共50頁。結(jié)果就不一樣了。第35頁/共49頁第三十六頁,共50頁。使用企業(yè)規(guī)模(ie)、服務(wù)(se)和雇員工資比例(bl)(sa)三個變量進行判別,得到的分類圖。與8個變量進行判別相對(xingdu)比,明顯的三類點分的就不那么開了。第36頁/共49頁第三十七頁,共50頁?;?個變量的分類(fn li)結(jié)果表結(jié)果顯示,
12、對于(duy)全部數(shù)據(jù)的判別,有85個點(94.4%)得到正確劃分,5個點錯判;其中第二類有3個被誤判到第一類;有2個被誤判到第三類。對于(duy)交叉驗證的判別,有83個點(92.2%)得到正確劃分,有7個點被錯判;其中第二類有3個被誤判為第一類,4個被誤判為第三類。第37頁/共49頁第三十八頁,共50頁。選擇(xunz)逐步判別法Method模塊(m kui)被激活第38頁/共49頁第三十九頁,共50頁。第39頁/共49頁第四十頁,共50頁。選擇(xunz)Wilks 統(tǒng)計量最小化法選擇輸出每一步統(tǒng)計量當F3.84時選入;當F 2.71時剔出。第40頁/共49頁第四十一頁,共50頁。經(jīng)過(
13、jnggu)分析,淘汰了不顯著的資金流動比例(cp)變量,當然判別系數(shù)也發(fā)生相應(yīng)變化。第41頁/共49頁第四十二頁,共50頁。C C l la a s ss si if fi ic c a a t ti io on n R Re es su ul lt ts sb b, ,c c300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0組別上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)上升
14、企業(yè)穩(wěn)定企業(yè)下降企業(yè)Count%Count%OriginalCross-validateda上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)Predicted Group MembershipTotalCross validation is done only for those cases in the analysis. In crossvalidation, each case is classified by the functions derived from all casesother than that case.a. 100.0% of original grouped cases correctl
15、y classified.b. 100.0% of cross-validated grouped cases correctly classified.c. 雖然判別系數(shù)(xsh)改變,但結(jié)果并未改變。第42頁/共49頁第四十三頁,共50頁。V1代表(dibio)Group。 V1=factor(V1) #把分組變量(binling)變成定性變量(binling)。第43頁/共49頁第四十四頁,共50頁。 train=sample(1:90,45) #隨即抽取一般樣本作訓(xùn)練樣本。 table(V1train) #顯示訓(xùn)練樣本中各類的比例。 library(MASS); z=lda(V1.,d
16、ata=w,prior=c(1,1,1)/3,subset=train)#用V1作分組變量,V2-V9作判別變量,使用(shyng)訓(xùn)練樣本生成判別函數(shù),先驗概率各為33.3%。第44頁/共49頁第四十五頁,共50頁。先驗概率各為33.3%。判別(pnbi)系數(shù)第1個判別函數(shù)貢獻率為98.7%;第2個判別函數(shù)貢獻率為1.3%。第45頁/共49頁第四十六頁,共50頁。練樣本外的點 a2=predict(z,w) #對z的結(jié)果預(yù)測所有樣本點 a2$class #給出分類(fn li)結(jié)果 a2$x #給出每個點的二維坐標 y=cbind(a2$x,a2$class); y1=yy,3=1,-3; y2=yy,3=2,-3; y3=yy,3=3,-3; plot(y1,1,y1,2,pch=0,xlim=c(-10,8.5),ylim=c(-4,3),ylab=,xlab=) points(y2,1,y2,2,pch=1) points(y3,1,y2,2,pch=2)第46頁/共49頁第四十七頁,共50頁。第一類第二類第三類第47頁/共
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國冰箱行業(yè)商業(yè)模式創(chuàng)新戰(zhàn)略制定與實施研究報告
- 2025-2030年中國美容培訓(xùn)行業(yè)資本規(guī)劃與股權(quán)融資戰(zhàn)略制定與實施研究報告
- 建設(shè)施工過程職業(yè)病危害防治總結(jié)報告
- 肇慶市中小學(xué)教學(xué)質(zhì)量評估2012屆高中畢業(yè)班第二次模擬試題數(shù)學(xué)(理)
- 浙江中乾計量校準有限公司介紹企業(yè)發(fā)展分析報告
- 軟件評估報告范例怎么寫
- 一年級數(shù)學(xué)(上)計算題專項練習(xí)集錦
- 年產(chǎn)毛竹纖維粉生物基可降解材料項目可行性研究報告模板-立項備案
- 年產(chǎn)15萬噸(折百)稀硝酸及10萬噸濃硝酸項目可行性研究報告模板-立項備案
- 二零二五年度技術(shù)服務(wù)合同標的和技術(shù)要求
- DL∕T 2138-2020 電力專利價值評估規(guī)范
- NB-T10859-2021水電工程金屬結(jié)構(gòu)設(shè)備狀態(tài)在線監(jiān)測系統(tǒng)技術(shù)條件
- GJB9001C產(chǎn)品風(fēng)險評估報告
- 2024年天津三源電力集團限公司社會招聘33人【重點基礎(chǔ)提升】模擬試題(共500題)附帶答案詳解
- 水利工程施工單位竣工資料目錄
- 技術(shù)經(jīng)濟學(xué)(中國石油大學(xué)(華東))-知到答案、智慧樹答案
- 《中國高鐵作業(yè)設(shè)計方案-2023-2024學(xué)年科學(xué)冀人版》
- 招標代理服務(wù)服務(wù)方案
- 工地生活垃圾處理方案
- 初一數(shù)學(xué)上冊有理數(shù)加減混合運算練習(xí)題及答案(共100題)
- 論蘇軾詩詞中的曠達風(fēng)格
評論
0/150
提交評論