版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心1多元統(tǒng)計(jì)分析中國人民大學(xué)出版社1優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心2§4.1判別分析的基本理論
§4.2距離判別§4.3Bayes判別
§4.4Fisher判別
§4.5逐步判別
§4.6判別分析方法步驟及框圖
§4.7判別分析的上機(jī)實(shí)現(xiàn)
§4.8判別分析應(yīng)用的幾個例子
第四章判別分析
2優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心3目錄上頁下頁返回結(jié)束第四章判別分析
回歸模型普及性的基礎(chǔ)在于用它去預(yù)測和解釋度量(metric)變量。但是對于非度量(nonmetric)變量,多元回歸不適合解決此類問題。本章介紹的判別分析來解決被解釋變量是非度量變量的情形。在這種情況下,人們對于預(yù)測和解釋影響一個對象所屬類別的關(guān)系感興趣,比如為什么某人是或者不是消費(fèi)者,一家公司成功還是破產(chǎn)等。判別分析在主要目的是識別一個個體所屬類別的情況下有著廣泛的應(yīng)用。潛在的應(yīng)用包括預(yù)測新產(chǎn)品的成功或失敗、決定一個學(xué)生是否被錄取、按職業(yè)興趣對學(xué)生分組、確定某人信用風(fēng)險(xiǎn)的種類、或者預(yù)測一個公司是否成功。在每種情況下,將對象進(jìn)行分組,并且要求使用這兩種方法中的一種可以通過人們選擇的解釋變量來預(yù)測或者解釋每個對象的所屬類別。
3優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心4目錄上頁下頁返回結(jié)束§4.1判別分析的基本理論
有時會遇到包含屬性被解釋變量和幾個度量解釋變量的問題,這時需要選擇一種合適的分析方法。比如,我們希望區(qū)分好和差的信用風(fēng)險(xiǎn)。如果有信用風(fēng)險(xiǎn)的度量指標(biāo),就可以使用多元回歸。但我們可能僅能判斷某人是在好的或者差的一類,這就不是多元回歸分析所要求的度量類型。當(dāng)被解釋變量是屬性變量而解釋變量是度量變量時,判別分析是合適的統(tǒng)計(jì)分析方法。判別分析能夠解決兩組或者更多組的情況。當(dāng)包含兩組時,稱作兩組判別分析。當(dāng)包含三組或者三組以上時,稱作多組判別分析(Multiplediscriminantanalysis)。判別分析的假設(shè)條件判別分析最基本的要求是,分組類型在兩組以上;在第一階段工作是每組案例的規(guī)模必須至少在一個以上。解釋變量必須是可測量的,才能夠計(jì)算其平均值和方差,使其能合理地應(yīng)用于統(tǒng)計(jì)函數(shù)。4優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心5目錄上頁下頁返回結(jié)束§4.1判別分析的基本理論判別分析的假設(shè)之一,是每一個判別變量(解釋變量)不能是其他判別變量的線性組合。即不存在多重共線性問題。判別分析的假設(shè)之二,是各組變量的協(xié)方差矩陣相等。判別分析最簡單和最常用的形式是采用線性判別函數(shù),它們是判別變量的簡單線性組合。在各組協(xié)方差矩陣相等的假設(shè)條件下,可以使用很簡單的公式來計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)。
判別分析的假設(shè)之三,是各判別變量之間具有多元正態(tài)分布,即每個變量對于所有其他變量的固定值有正態(tài)分布。在這種條件下可以精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。當(dāng)違背該假設(shè)時,計(jì)算的概率將非常不準(zhǔn)確。5優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心6§4.2距離判別
目錄上頁下頁返回結(jié)束4.2.1兩總體情況
6優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心7§4.2距離判別
目錄上頁下頁返回結(jié)束7優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心8§4.2距離判別
目錄上頁下頁返回結(jié)束8優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心9§4.2距離判別
目錄上頁下頁返回結(jié)束9優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心10§4.2距離判別
目錄上頁下頁返回結(jié)束10優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心11§4.2距離判別
目錄上頁下頁返回結(jié)束4.2.2多總體情況1.協(xié)差陣相同。
11優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心12§4.2距離判別
目錄上頁下頁返回結(jié)束2.協(xié)差陣不相同。12優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心13§4.2距離判別
目錄上頁下頁返回結(jié)束13優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心14§4.2距離判別
目錄上頁下頁返回結(jié)束14優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心15§4.3Bayes判別
目錄上頁下頁返回結(jié)束貝葉斯(Bayes)統(tǒng)計(jì)的思想是:假定對研究的對象已有一定的認(rèn)識,常用先驗(yàn)概率分布來描述這種認(rèn)識,然后我們?nèi)〉靡粋€樣本,用樣本來修正已有的認(rèn)識(先驗(yàn)概率分布),得到后驗(yàn)概率分布,各種統(tǒng)計(jì)推斷都通過后驗(yàn)概率分布來進(jìn)行。將貝葉斯思想用于判別分析,就得到貝葉斯判別。15優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心16§4.3Bayes判別
目錄上頁下頁返回結(jié)束16優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心17§4.4Fisher判別
目錄上頁下頁返回結(jié)束17優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心18§4.4Fisher判別
目錄上頁下頁返回結(jié)束18優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心19§4.4Fisher判別
目錄上頁下頁返回結(jié)束19優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心20§4.4Fisher判別
目錄上頁下頁返回結(jié)束20優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心21§4.4Fisher判別
目錄上頁下頁返回結(jié)束21優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心22§4.5逐步判別
目錄上頁下頁返回結(jié)束在多元回歸中熟知,變量選擇的好壞直接影響回歸的效果,而在判別分析中也有類似的問題。如果在某個判別問題中,將其中最主要的指標(biāo)忽略了,由此建立的判別函數(shù)其效果一定不好。但是在許多問題中,事先并不十分清楚哪些指標(biāo)是主要的,這時,是否將有關(guān)的指標(biāo)盡量收集加入計(jì)算才好呢?理論和實(shí)踐證明,指標(biāo)太多了,不僅帶來大量的計(jì)算,同時許多對判別無作用的指標(biāo)反而會干擾了我們的視線。因此適當(dāng)篩選變量的問題就成為一個很重要的事情。凡具有篩選變量能力的判別方法統(tǒng)稱為逐步判別法。和通常的判別分析一樣,逐步判別也有許多不同的原則,從而產(chǎn)生各種方法。有關(guān)逐步判別法的理論基礎(chǔ)詳見[1]所討論指標(biāo)的附加信息檢驗(yàn)。22優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心23§4.5逐步判別
目錄上頁下頁返回結(jié)束逐步判別的原則23優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心24§4.5逐步判別
目錄上頁下頁返回結(jié)束24優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心25§4.5逐步判別
目錄上頁下頁返回結(jié)束(ⅳ)這時既不能選進(jìn)新變量,又不能剔除已選進(jìn)的變量,將已選中的變量建立判別函數(shù)。25優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心26§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束使用判別分析可以看作是下面6個步驟的過程:第1步:判別分析的對象判別分析的研究目的:1.確定在兩個或者更多事先定義的組上的一組變量的平均得分剖面是否存在顯著性差異。2.確定哪些變量在兩個或更多組的平均得分剖面的差異中解釋最多。3.在一組變量得分的基礎(chǔ)上,建立將對象(個體、公司、產(chǎn)品等等)分類的步驟。4.建立由這組變量形成的組與組之間判別函數(shù)的數(shù)目及構(gòu)成。26優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心27§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束第2步:判別分析的研究設(shè)計(jì)判別分析的成功應(yīng)用需要考慮到幾個要點(diǎn)。這些要點(diǎn)包括解釋變量和被解釋變量的選擇、估計(jì)判別函數(shù)所需的樣本量和為了驗(yàn)證目的對樣本的分割。(一)解釋變量和被解釋變量的選擇要應(yīng)用判別分析,研究者必須首先指定解釋變量與被解釋變量。這里,解釋變量為定量變量,而被解釋變量為定性變量。27優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心28§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束研究者首先應(yīng)該關(guān)注被解釋變量。被解釋變量的組數(shù)可以是兩個或更多,但這些組必須具有相互排斥性和完全性。被解釋變量有時確實(shí)是定性的變量。然而也有一些情況,即使被解釋變量不是真的定性變量,判別分析也是適用的。我們可能有一個被解釋變量是順序或者間隔尺度的變量,而要作為定性變量使用。這種情況下我們可以創(chuàng)建一個定性變量。當(dāng)確定了被解釋變量后,研究者必須確定分析中應(yīng)包括的解釋變量。解釋變量的選擇通常有兩種方法。第一種是從以前的研究中或者從該研究問題根本的理論模型中確定變量。第二種方法是直覺——運(yùn)用研究者的知識,直觀地選擇沒有以前研究或理論存在但是邏輯上與預(yù)測解釋變量的組相關(guān)的變量。28優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心29§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束(二)樣本容量判別分析對樣本量與預(yù)測變量個數(shù)的比率很敏感。許多研究建議比率為每個預(yù)測變量20個觀測。盡管這個比率在實(shí)際中難以保持,但研究者應(yīng)注意,當(dāng)樣本量相對于解釋變量個數(shù)在減少時,結(jié)果是不穩(wěn)定的。建議最小的樣本量是每個變量有5個觀測。除總的樣本量以外,研究者還必須考慮每組的樣本容量。至少,最小的組的大小必須超過解釋變量的個數(shù)。作為實(shí)際的指導(dǎo),每組應(yīng)至少有20個觀測。但即使所有的組大小都超過了20,研究者還應(yīng)注意組的相對大小。如果組的大小相差很大,這可能影響到判別函數(shù)的估計(jì)和觀測的分類。在分類階段,大的組有不相稱的高的分類機(jī)會。29優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心30§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束(三)樣本的分割很多時候樣本需要分割為兩個子樣本,一個用于估計(jì)判別函數(shù),另一個用于驗(yàn)證。每個子樣本都有適當(dāng)?shù)拇笮碇С纸Y(jié)論是很重要的。分割樣本有很多種方法,最常用的一種是通過一個子樣本來估計(jì)判別函數(shù),而用另一個子樣本來驗(yàn)證。常用的過程是將整個樣本隨機(jī)地分為兩組。其中的一組,分析樣本是用來估計(jì)判別函數(shù)的。另一組保留樣本,是用來驗(yàn)證結(jié)論的。這種驗(yàn)證方法稱為分割樣本或者交叉驗(yàn)證方法。30優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心31§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束如果劃分分析樣本和保留樣本沒有固定的原則。最常用的程序是分為兩半。當(dāng)選擇分析組和保留組的個體時,通常遵循比例分層抽樣。也就是分析組和保留組的各組大小比率應(yīng)與整個樣本的各組大小比率相同。如果研究者要劃分樣本,這個樣本應(yīng)該充分的大。一般來講,研究者需要整個樣本至少為100,將它分為兩組。31優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心32§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束第3步:判別分析的假定推導(dǎo)判別函數(shù)的關(guān)鍵假定是解釋變量的多元正態(tài)性和由被解釋變量定義的各組的未知但相等的協(xié)方差結(jié)構(gòu)。不滿足多元正態(tài)性假定在估計(jì)判別方程時可能會出現(xiàn)問題。因此,如果可能的話,建議使用Logistic回歸作為一種替代方法。不等的協(xié)方差矩陣可能會負(fù)面影響分類過程。如果樣本量小而協(xié)方差陣不等,那么估計(jì)過程的統(tǒng)計(jì)顯著性會受到負(fù)面影響。最可能的情況是在適當(dāng)?shù)臉颖玖康慕M之間存在不等的協(xié)方差陣,那么觀測會被“過度歸類”到大的協(xié)方差陣的組中??梢酝ㄟ^增加樣本量和使用各組特定的協(xié)方差陣減小這種影響。32優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心33§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束最后,如果組間的協(xié)方差陣存在大的差異,沒有方法可以減小這種影響時,在許多統(tǒng)計(jì)問題中可以使用二次判別技術(shù)。另一個可能影響結(jié)果的是解釋變量的多重共線性。當(dāng)使用逐步判別時這種考慮尤為重要。研究者在解釋判別方程時必須注意多重共線性的程度和它對哪些變量進(jìn)入逐步解的影響。33優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心34§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束第4步:估計(jì)判別模型和評估整體擬合為了推導(dǎo)判別函數(shù),研究者必須確定估計(jì)的方法,然后確定保留的函數(shù)個數(shù)。隨著估計(jì)的函數(shù),可以用多種方法來評估模型擬合。首先,判別Z得分,可以為每一個觀測計(jì)算。基于Z得分的各組均值的比較提供了組與組之間判別的一種測量。通過分到正確類中的觀測來測量預(yù)測精度。一系列準(zhǔn)則可以用來評價(jià)判別過程是否達(dá)到了實(shí)際的或者統(tǒng)計(jì)的顯著性。最后,個體診斷可以分析每個觀測的分類精度和它對于整個模型估計(jì)的相對影響。34優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心35§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束(一)計(jì)算方法推導(dǎo)判別函數(shù)時可以使用兩種計(jì)算方法:聯(lián)立(直接)法和逐步法。聯(lián)立估計(jì)在計(jì)算判別函數(shù)時同時考慮所有的解釋變量。這樣,判別函數(shù)是基于解釋變量的整個集合來計(jì)算的,而不管每個解釋變量的判別力。逐步估計(jì)是另一種估計(jì)方法。它以解釋變量的判別力為基礎(chǔ),每次進(jìn)入一個變量到判別函數(shù)中。逐步估計(jì)開始是選取一個最有判別力的變量。然后這個變量與其他的解釋變量一一配對,那么與第一個變量一起最能夠提高判別力的變量被選中。第三個及以后的用類似的方式選取。增加新的變量時,如果一些前面選中的變量所包含的關(guān)于組差異信息可由后面選中的變量所包含,它們將被剔除。最后,既不能選進(jìn)新的變量,又不能剔除已有變量。35優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心36§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束(二)評估整體擬合一旦判別方程通過了顯著性檢驗(yàn),注意力轉(zhuǎn)向確定保留的判別函數(shù)的整體擬合。這個評估包括三個任務(wù):計(jì)算每個觀測的判別Z得分,檢驗(yàn)各組在判別Z得分上的差異和評估組的關(guān)系的預(yù)測精度。1.計(jì)算判別Z得分
36優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心37§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束這個得分是定量變量,提供了在每個函數(shù)上比較對象的直接手段。有類似的Z得分的觀測被認(rèn)為在構(gòu)成函數(shù)的變量上比得分懸殊的觀測更相似。判別函數(shù)既有用標(biāo)準(zhǔn)化的權(quán)重和值,也有用非標(biāo)準(zhǔn)化的權(quán)重和值。標(biāo)準(zhǔn)化形式更易于解釋,而非標(biāo)準(zhǔn)化形式更易于計(jì)算判別Z得分。
37優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心38§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束應(yīng)當(dāng)注意判別函數(shù)不同于分類函數(shù),也稱為費(fèi)歇線性判別函數(shù)。分類函數(shù),可用于對觀測進(jìn)行分類。在這種分類方法中,一個觀測的解釋變量的值代入分類函數(shù)中,這個觀測針對每組可以計(jì)算一個分類得分。然后這個觀測被分到分類得分最高的組中。我們使用判別函數(shù)作為分類手段,是因?yàn)樗峁┝嗣總€判別函數(shù)的一個簡潔表示,簡化了解釋過程和對解釋變量貢獻(xiàn)的評估。
38優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心39§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束2.檢驗(yàn)組的差異一種評估整體擬合的方法是根據(jù)判別Z得分,確定各組個體的差異大小。組差異的一種綜合測量是比較組的重心,即組中所有個體的平均判別Z得分。重心的差異是用馬氏距離來測量的,這樣檢驗(yàn)可用來確定差異是否在統(tǒng)計(jì)上顯著。研究者應(yīng)保證即使有顯著的判別函數(shù),組間應(yīng)存在顯著的差異。在每個判別函數(shù)上組的重心可以從球面的角度來繪圖顯示結(jié)果。通常用前兩個或者三個判別函數(shù)來作圖。每組的值顯示了它在降維的空間中的值(并非畫出所有的函數(shù))。39優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心40§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束3.評價(jià)組關(guān)系預(yù)測的精度判別分析中每個觀測是通過它是否被正確歸類來評價(jià)的。要這樣做,應(yīng)當(dāng)解決一些主要的考慮:利用分類矩陣的統(tǒng)計(jì)和實(shí)際的基本原理、分割點(diǎn)的確定、分類矩陣的構(gòu)造和評價(jià)分類精度的標(biāo)準(zhǔn)。判別函數(shù)的顯著性檢驗(yàn)并沒有說明函數(shù)擬合有多好。比如,假定兩個組在0.01的水平上有顯著性差異,如果樣本量足夠大,組的均值(重心)可能實(shí)際上相等。因此顯著性水平可能并不是反映判別函數(shù)判別能力的很好的指標(biāo)。為了確定一個判別函數(shù)的預(yù)測能力,研究者必須構(gòu)造分類矩陣。
40優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心41§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束如果統(tǒng)計(jì)檢驗(yàn)顯示判別函數(shù)顯著,通常構(gòu)造分類矩陣來提供函數(shù)的判別效力的更精確的估計(jì)。然而,在分類矩陣構(gòu)造之前,研究者必須確定臨界得分。每個觀測的判別得分與臨界得分比較來確定個體應(yīng)分到哪一類中。在構(gòu)造分類矩陣時,研究者希望確定最優(yōu)臨界得分(也稱臨界Z值)。最優(yōu)臨界得分會因各組大小是否相等而不同。如果兩組是相同的大小,最優(yōu)臨界得分是兩組重心的中點(diǎn)。
41優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心42§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束42優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心43§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束所有計(jì)算最優(yōu)臨界得分的公式都假定正態(tài)分布和已知組的協(xié)方差結(jié)構(gòu)。為了用分類矩陣來驗(yàn)證判別分析的結(jié)果,樣本必須隨機(jī)地分割為分析樣本和保留樣本。保留樣本的每個觀測的判別得分可與臨界得分相比較,進(jìn)行分類。分類的結(jié)果用矩陣的形式表示出來。
43優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心44§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束44優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心45§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束評估模型擬合的最后一個方法就是在每個觀測的基礎(chǔ)上研究預(yù)測結(jié)果。與回歸分析的殘差分析相似,目的是為了理解被錯判的觀測和不是該組代表的觀測。研究者可以通過馬氏距離來評估一個觀測與該組其他個體的相似性。靠近重心的觀測被認(rèn)為比遠(yuǎn)離重心的觀測更加代表該組。用圖形的方式表示觀測是研究觀測特征的另一種方法。尤其是錯判的觀測。一種常用的方法是將觀測點(diǎn)根據(jù)判別Z得分繪圖,并且畫出各組重疊部分和錯判的觀測。如果保留了兩個或兩個以上的判別函數(shù),可以用區(qū)域圖來表示各組所對應(yīng)的區(qū)域和最優(yōu)臨界點(diǎn)。將每個觀測與組的重心畫在一起,不僅可以用組的重心反映一般特征,還可以反映組中成員的變動。
45優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心46§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束第5步:結(jié)果的解釋46優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心47§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束解釋判別函數(shù)傳統(tǒng)的方法是觀察計(jì)算判別函數(shù)時賦予每個變量的標(biāo)準(zhǔn)化判別權(quán)重(有時也稱為判別系數(shù))的符號和大小。忽略符號時,較大權(quán)重的解釋變量意味著對判別函數(shù)的判別力貢獻(xiàn)更多。符號只是代表那個變量有正的還是負(fù)的貢獻(xiàn)。對判別權(quán)重的解釋也有一些批評。比如解釋變量存在多重共線性情況時,判別權(quán)重可能會出現(xiàn)問題。另一個問題是判別權(quán)重被認(rèn)為不穩(wěn)定。近年來,由于判別權(quán)重的缺陷,判別載荷逐漸作為解釋的基礎(chǔ)。判別載荷,有時也稱為結(jié)構(gòu)相關(guān)系數(shù),是每個解釋變量與判別函數(shù)的簡單相關(guān)系數(shù)。判別載荷反映的是每個解釋變量對判別函數(shù)的相對貢獻(xiàn)。判別載荷也可能存在不穩(wěn)定性。
47優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心48§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束當(dāng)存在兩個或以上的判別函數(shù)的時候,我們面臨著其他的解釋問題。首先,我們能簡化判別權(quán)重或載荷以利于刻畫判別函數(shù)嗎?再者,我們?nèi)绾伪硎窘忉屪兞繉ε袆e函數(shù)的影響?我們介紹函數(shù)旋轉(zhuǎn)和能力指數(shù)的概念來解決這兩個問題。48優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心49§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束在推導(dǎo)出判別函數(shù)以后,它們可以旋轉(zhuǎn)來重新分配方差。旋轉(zhuǎn)保持了原始結(jié)構(gòu)和判別解的穩(wěn)定性,而且使方程更易于解釋。當(dāng)保留兩個或兩個以上的判別函數(shù)時,需要一個綜合的量來描述一個變量對所有顯著函數(shù)的貢獻(xiàn)。能力指數(shù)(potencyindex)是反映每個變量判別能力的相對指標(biāo)。它既包含一個變量對判別函數(shù)的貢獻(xiàn)(判別載荷),又包含一個方程對整個解的相對貢獻(xiàn)(對方程特征值的相對測量)。49優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心50§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束綜合指數(shù)只是在所有顯著的判別函數(shù)上的個體能力指數(shù)之和。綜合指數(shù)僅當(dāng)描述每個變量的相對重要性時是有用的,其絕對數(shù)值沒有實(shí)際意義。能力指數(shù)通過兩步計(jì)算:50優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心51§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束(2):計(jì)算在所有顯著的函數(shù)上的綜合能力指數(shù)。當(dāng)每個函數(shù)都計(jì)算了能力值后,綜合指數(shù)為每個顯著的判別函數(shù)上的能力值之和。這個能力指數(shù)表示該變量在所有顯著的判別函數(shù)上的全部判別效果。第6步:結(jié)果的驗(yàn)證判別分析的最后一個階段就是驗(yàn)證判別分析的結(jié)果,通常采用分割樣本或者交叉驗(yàn)證法。兩種廣泛使用的方法是法和小刀法。這兩種方法都是以“留一個觀測在外”的原則為基礎(chǔ)。(“留一個觀測在外”的原則是指在交叉驗(yàn)證時,某個觀測不參與估計(jì)判別函數(shù),但是根據(jù)除這個觀測以外的其他觀測估計(jì)的判別函數(shù)來預(yù)測該觀測的所屬類,從而使每個觀測得到驗(yàn)證。)進(jìn)行兩者的主要區(qū)別在于法主要關(guān)注分類精度,而小刀法強(qiáng)調(diào)判別系數(shù)的穩(wěn)定性。兩種方法都對小樣本量非常敏感。
51優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心52§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束判別分析的邏輯框圖如下:
52優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心53§4.6判別分析方法步驟及框圖
目錄上頁下頁返回結(jié)束圖4.1判別分析步驟框圖
53優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心54§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束這里舉兩個例子,一個例子是分兩組的情況,一個是分多組的情況。我們分別用SPSS軟件中的Discriminant模塊來實(shí)現(xiàn)判別分析。
54優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心55§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束55優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心56§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束(一)二元變量的判別分析計(jì)算
56優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心57§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束另外,如果需要更深入的分析,可以選擇其他項(xiàng)。統(tǒng)計(jì)量(Statistics)選項(xiàng)中可以選擇描述統(tǒng)計(jì)量Mean,ANVOA,Box’M,函數(shù)可以選擇Fisher和非標(biāo)準(zhǔn)化函數(shù),同時還可以使用哪種矩陣。由于只有兩個自變量,我們不需要使用逐步判別法。分類(Classify)選項(xiàng)中可以選擇先驗(yàn)概率(所有組相等或根據(jù)組的大小計(jì)算概率),子選項(xiàng)顯示(display)中可以選擇每個個體的結(jié)果(Casewiseresults),綜合表(SummeryTable)和“留一個在外”的驗(yàn)證原則,還可以選擇使用哪種協(xié)方差矩陣以及作圖。保存(Save)選項(xiàng)中可以選擇預(yù)測的分類、判別得分以及所屬類別的概率。如果采用逐步判別法,我們還可以選擇判別的方法(Method)。得到分析結(jié)果如下:57優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心58§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束58優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心59§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束59優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心60§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束60優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心61§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束61優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心62§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束輸出結(jié)果4.3分析的是典型判別函數(shù)。第1張表反映判別函數(shù)的特征值、解釋方差的比例和典型相關(guān)系數(shù)。(注意我們僅選取了兩個解釋變量,所以判別函數(shù)解釋了全部的方差)第2張表是對第一個判別函數(shù)的顯著性檢驗(yàn)。由Wilks’Lambda檢驗(yàn),認(rèn)為判別函數(shù)在0.01的顯著性水平上是極顯著的。
62優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心63§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束輸出結(jié)果4.4顯示的是判別函數(shù)、判別載荷和各組的重心。63優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心64§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束第2張表是結(jié)構(gòu)矩陣,即判別載荷。由判別權(quán)重和判別載荷可以看出兩個解釋變量對判別函數(shù)的貢獻(xiàn)較大。64優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心65§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束65優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心66§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束66優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心67§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束輸出結(jié)果4.5是分類的統(tǒng)計(jì)結(jié)果。第1張表概括了分類過程,說明24個觀測都參與分類。第2張表說明各組的先驗(yàn)概率,我們在Classify選項(xiàng)中選擇的是所有組的先驗(yàn)概率相等。第3張表是每組的分類函數(shù)(區(qū)別于判別函數(shù)),也稱費(fèi)歇線性判別函數(shù),
67優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心68§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束第4張表是分類矩陣表。PredictedGroupMembership表示預(yù)測的所屬組關(guān)系,Original表示原始數(shù)據(jù)的所屬組關(guān)系,Cross-validated表示交叉驗(yàn)證的所屬組關(guān)系,這里交叉驗(yàn)證是采用“留一個在外”的原則,即每個觀測是通過除了這個觀測以外的其他觀測推導(dǎo)出來的判別函數(shù)來分類的。
68優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心69§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束我們還可以通過保存(Save)選項(xiàng)選擇預(yù)測的類別關(guān)系和判別得分等,對觀測進(jìn)行診斷。下面我們看一個三總體判別的例子。【例4.2】研究者希望能夠根據(jù)氣候、經(jīng)濟(jì)因素、人口等信息來判斷某國家或地區(qū)屬于哪一類型。這里國家country(因變量)有3種類別,OECD表示經(jīng)合組織的國家(包括美國、加拿大和西歐等發(fā)達(dá)國家),Pacific/Asia表示亞太地區(qū)的國家,Africa表示非洲地區(qū)的國家。考慮了以下幾個自變量,climate(氣候因素,包括沙漠氣候、干旱氣候、地中海氣候、海洋氣候、溫帶氣候和極地氣候等),urban(城市居民的比例),population(人口數(shù)),gdp_cap(人均GDP)。數(shù)據(jù)集來自SPSS10.0自帶的數(shù)據(jù)集World95.sav。
69優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心70§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束進(jìn)入判別分析對話框以后,我們使用逐步判別分析,Method選擇馬氏距離。得到如下輸出結(jié)果:首先顯示有類的輸出結(jié)果4.1的3張表,第1張表是分析的樣本及其缺失情況。第2張表是各組變量的描述統(tǒng)計(jì)分析。第3張表是各組變量均值是否相等的統(tǒng)計(jì)檢驗(yàn),結(jié)果說明四個自變量各組的均值在0.05的顯著性水平上是不相等的。此處從略。
70優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心71§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束輸出結(jié)果4.6是對協(xié)方差陣是否相等的檢驗(yàn)。由第2張表可以看出,原假設(shè)被拒絕,即認(rèn)為各組的協(xié)方差陣不等。(注意這里違反了原假設(shè))71優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心72§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束72優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心73§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束73優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心74§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束輸出結(jié)果4.7是說明逐步回歸的結(jié)果。第1,2張表說明變量進(jìn)入判別函數(shù)的情況。第3張表說明不在判別函數(shù)的變量,結(jié)果反映城市居民的比例(urban)對判別函數(shù)的貢獻(xiàn)不顯著,其他三個自變量被選入判別方程。第4張表說明判別函數(shù)的顯著性,由Step3的結(jié)果說明判別函數(shù)在0.05的顯著性水平上是顯著的,模型擬合較好。74優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心75§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束75優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心76§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束輸出結(jié)果4.8分析的是典型判別函數(shù)。第1張表說明選取了兩個典型判別函數(shù),它們可以解釋全部的方差。第2張表是對兩個判別函數(shù)的Wilks’Lamada檢驗(yàn),檢驗(yàn)結(jié)果說明兩個判別函數(shù)在0.05的顯著性水平上是顯著的。第3張表是標(biāo)準(zhǔn)化判別函數(shù),第4張表是結(jié)構(gòu)矩陣(即判別載荷矩陣),第5張表是非標(biāo)準(zhǔn)化判別函數(shù),由這幾張表可以說明,第一判別函數(shù)主要反映一國的氣候和經(jīng)濟(jì)因素,第二判別函數(shù)主要反映人口因素。第6張表反映各組的重心,我們由此可以計(jì)算出臨界點(diǎn),從而根據(jù)判別函數(shù)計(jì)算出判別Z得分,對各個觀測進(jìn)行歸類。76優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心77§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束77優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心78§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束輸出結(jié)果4-9的第1張表是對觀測分類的總體概括,有一個觀測至少有1個自變量缺失。第2張表是各組的先驗(yàn)概率,由于我們選擇先驗(yàn)概率按各組大小計(jì)算,所以各組的先驗(yàn)概率是與各組大小成比例的。第3張表說明分類函數(shù),也就是費(fèi)歇線性判別函數(shù),我們可以根據(jù)這三組的函數(shù)計(jì)算每個觀測在各組的分類得分,然后將該觀測歸到得分最高的組中。第4張圖是根據(jù)典型判別函數(shù)作的所有組的散點(diǎn)圖,比較直觀地反映了各組觀測的分類情況和各組的重心。78優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心79§4.7判別分析的上機(jī)實(shí)現(xiàn)
目錄上頁下頁返回結(jié)束第5張表是分類結(jié)果的矩陣,這里我們也使用了“留一個在外”的原則進(jìn)行交叉驗(yàn)證,驗(yàn)證的結(jié)果還是可以接受的,表明模型擬合還是不錯的。由分類矩陣可以看出,OECD國家和非洲國家的個體誤判概率很小,而亞太國家誤判概率很大。這說明了OECD國家經(jīng)濟(jì)比較發(fā)達(dá),城市化水平較高,而且各成員國發(fā)展水平相差不大;非洲國家經(jīng)濟(jì)水平較低,城市化水平也較低,其成員國發(fā)展水平相差也不大;因此這兩類國家比較容易判別,而亞太國家和地區(qū)發(fā)展水平不均衡,沒有太多的共同點(diǎn),導(dǎo)致其成員國不易判別。(根據(jù)輸出結(jié)果4.8第2張表的均值和協(xié)差陣可以說明)我們還可以在對話框中選擇Classify→Display→Casewiseresults,對每個觀測進(jìn)行診斷分析。79優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心80§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束下面用SPSS軟件中的Discriminant模塊來實(shí)現(xiàn)判別分析。例4.3為了研究2005年全國各地區(qū)農(nóng)村居民家庭人均消費(fèi)支出情況,按標(biāo)準(zhǔn)化歐氏平方距離、離差平方和聚類方法將29個省、市、自治區(qū)(除廣東和西藏以外)分為三種類型,設(shè)置group變量取值分別為1、2、3。試建立判別函數(shù),判定廣東、西藏分別屬于哪個消費(fèi)水平類型。判別指標(biāo)及原始數(shù)據(jù)見表4-2。
80優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心81§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束81優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心82§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束82優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心83§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束將原29個樣品的回報(bào)結(jié)果列于表4-3,兩個待判樣品的判別結(jié)果列于表4-4。廣東省應(yīng)判歸第二類消費(fèi)水平,西藏自治區(qū)歸入第三類消費(fèi)水平為宜。本例的回報(bào)準(zhǔn)確率高,說明各地區(qū)農(nóng)村居民的消費(fèi)水平劃分為三種類型是合適的。由于SPSS中的判別分析沒有距離判別這一方法,因此距離判別法無法在SPSS中直接實(shí)現(xiàn),但可以通過Excel等軟件來進(jìn)行手工計(jì)算。83優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心84§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束這里順便指出,回報(bào)的誤判率并不是“誤判概率”,而且前者通常要小些,回判情況僅供使用時參考。
84優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心85§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束例4.4為了研究2005年全國各地區(qū)國有及國有控股工業(yè)企業(yè)的經(jīng)營狀況,按標(biāo)準(zhǔn)化歐氏平方距離、離差平方和聚類方法將29個省、市、自治區(qū)(除廣東和西藏以外)分為三種類型,設(shè)置group變量取值分別為1、2、3。試建立判別函數(shù),判定廣東、西藏分別屬于哪個發(fā)展類型。判別指標(biāo)及原始數(shù)據(jù)見表4-5。
85優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心86§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束86優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心87§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束87優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心88§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束將原29個樣品的回報(bào)結(jié)果列于表4-6,兩個待判樣品的判別結(jié)果列于表4-7。廣東省應(yīng)判歸第一類,西藏自治區(qū)歸入第三類為宜。本例的回報(bào)準(zhǔn)確率高,說明各地區(qū)國有及控股工業(yè)企業(yè)經(jīng)濟(jì)效益劃分為三種類型是合適的。這也可看成聚類分析與判別分析的結(jié)合應(yīng)用。
88優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心89§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束例4.52005年全國城鎮(zhèn)居民月平均消費(fèi)狀況可劃分為兩類,分類后的數(shù)據(jù)見表4-8。試建立費(fèi)歇爾線性判別函數(shù),并將廣東、西藏兩個待判省區(qū)歸類。89優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心90§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束90優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心91§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束91優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心92§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束92優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心93§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束6.回判及待判樣品的歸類。93優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心94§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束94優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心95§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束95優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心96§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束SPSS中進(jìn)行費(fèi)歇爾判別分析是十分快捷的。首先按照表4-16把數(shù)據(jù)輸入SPSS數(shù)據(jù)表中,然后依次點(diǎn)擊“Analyze”→“Classify”→“Discriminant”,打開DiscriminantAnalysis對話框,將對話框左側(cè)變量列表中的group選入GroupingVariable框,并點(diǎn)擊“DefineRange”鈕,在彈出的DiscriminantAnalysis:DefineRange對話框中,定義判別原始數(shù)據(jù)的類別區(qū)間,本例為兩類,故在Minimum處輸入1、在Maximum處輸入2,點(diǎn)擊Continue鈕返回DiscriminantAnalysis對話框。
96優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心97§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束再從對話框左側(cè)的變量列表中選將八個變量選Independents框,作為判別分析的基礎(chǔ)數(shù)據(jù)變量。點(diǎn)擊“Statistics”鈕,彈出DiscriminantAnalysis:Statistics對話框,在Descriptive欄中選Means項(xiàng),要求對各組的各變量作均數(shù)與標(biāo)準(zhǔn)差的描述;在FunctionCoefficients欄中選Unstandardized項(xiàng)(注意,不是Fisher’s項(xiàng)!),要求顯示費(fèi)歇爾判別法建立的非標(biāo)準(zhǔn)化系數(shù)。97優(yōu)秀課件,精彩無限!2023/6/30中國人民大學(xué)六西格瑪質(zhì)量管理研究中心98§4.8判別分析應(yīng)用的幾個例子
目錄上頁下頁返回結(jié)束之后,點(diǎn)擊“Continue”鈕返回DiscriminantAnalysis對話框。點(diǎn)擊“Save”鈕,彈出DiscriminantAna
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年細(xì)胞學(xué)診斷項(xiàng)目籌資方案
- 青島黃海學(xué)院《數(shù)值計(jì)算與實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 青島恒星科技學(xué)院《體育一啦啦操》2023-2024學(xué)年第一學(xué)期期末試卷
- 青島工程職業(yè)學(xué)院《室內(nèi)專題項(xiàng)目社會綜合課題實(shí)踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 體育產(chǎn)業(yè)發(fā)展趨勢匯報(bào)
- 興業(yè)銀行互聯(lián)網(wǎng)金融業(yè)務(wù)探索
- 國際貿(mào)易談判技巧培訓(xùn)匯報(bào)
- 中醫(yī)針灸在養(yǎng)生館的運(yùn)用案例
- 幼兒園法國禮儀課程設(shè)計(jì)
- 打造冠軍團(tuán)隊(duì)課程設(shè)計(jì)
- 設(shè)備(IQ、OQ、PQ)驗(yàn)證文件模板
- 成績單模板 (2)
- 排洪溝工程設(shè)計(jì)說明
- 藥業(yè)發(fā)展工作規(guī)劃.doc
- 21世紀(jì)學(xué)生核心素養(yǎng)研究PPT精品文檔
- 材料熱力學(xué)1-7
- 鋼筋加工廠龍門吊的安裝與拆除專項(xiàng)施工方案
- 2019-2020沈陽市四年級語文統(tǒng)考
- 中國建設(shè)銀行信貸業(yè)務(wù)手冊III8 信貸檔案管理
- 分戶驗(yàn)收評估報(bào)告1[小編整理] (3)
- 最新系統(tǒng)FMEA—(SFMEA)
評論
0/150
提交評論