spss學(xué)習(xí)第9章

上傳人：q*** IP屬地：湖北上傳時(shí)間：2022-06-27 格式：PPT 頁(yè)數(shù)：90 大?。?.72MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩85頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第9章 SPSS的多元統(tǒng)計(jì)分析9.1.1 因子分析的基本原理通常針對(duì)變量作因子分析，稱為R型因子分析；另一種對(duì)樣品作因子分析，稱為Q型因子分析，這兩種分析方法有許多相似之處。R型因子分析數(shù)學(xué)模型是：設(shè)原有p個(gè)變量且每個(gè)變量（或經(jīng)標(biāo)準(zhǔn)化處理后）的均值為0，標(biāo)準(zhǔn)差為1。現(xiàn)將每個(gè)原有變量用k( )個(gè)因子的線性組合來(lái)表示，即有：上式就是因子分析的的數(shù)學(xué)模型，也可以用矩陣的形式表示為 1,.,pxx kp111 112 211221 122 2221 12 2kkkkppppkkpxa fa fa fxa fa fa fxa fa fa fXAF12,kf ff9.1 SPSS在因子分析中的應(yīng)用其中

2、，X是可實(shí)測(cè)的隨機(jī)向量。F稱為因子，由于它們出現(xiàn)在每個(gè)原有變量的線性表達(dá)式中，因此又稱為公共因子。A稱為因子載荷矩陣，稱為因子載荷。稱為特殊因子，表示了原有變量不能被因子解釋的部分，其均值為0 因子分析的基本思想是通過(guò)對(duì)變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的分析，從中找出少數(shù)幾個(gè)能控制原始變量的隨機(jī)變量選取公共因子的原則是使其盡可能多的包含原始變量中的信息，建立模型，忽略 , 以F代替X，用它再現(xiàn)原始變量X的信息，達(dá)到簡(jiǎn)化變量降低維數(shù)的目的。(1,2, ;1,2, )ija ip jk(1,2, )if ikXA F9.1 SPSS在因子分析中的應(yīng)用具體步驟：將原始數(shù)據(jù)標(biāo)準(zhǔn)化，以消除變量間在數(shù)

3、量級(jí)和量綱上的不同；求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)矩陣；求相關(guān)矩陣的特征值和特征向量；計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率；確定因子：設(shè)F1，F(xiàn)2， Fp為p個(gè)因子，其中前m個(gè)因子包含的數(shù)據(jù)信息總量（即其累積貢獻(xiàn)率）不低于85%時(shí)，可取前m個(gè)因子來(lái)反映原評(píng)價(jià)指標(biāo)；因子旋轉(zhuǎn)：若所得的m個(gè)因子無(wú)法確定或其實(shí)際意義不是很明顯，這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義；用原指標(biāo)的線性組合來(lái)求各因子得分；綜合得分：通常以各因子的方差貢獻(xiàn)率為權(quán)，由各因子的線性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù)。9.1 SPSS在因子分析中的應(yīng)用9.1.2 因子分析的SPSS操作詳解Step01：打開(kāi)主菜單選擇主菜單中的【分析】【降維】【因子

4、】命令，彈出【因子分析】對(duì)話框，如圖所示，這是因子分析的主操作窗口。9.1 SPSS在因子分析中的應(yīng)用 Step02：選擇因子分析變量在【因子分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行因子分析的變量將其添加至【變量】列表框中。如果要選擇參與因子分析的樣本，則需要將條件變量添加至【選擇變量】框中，并單擊變量值按鈕輸入變量值，只有滿足條件的樣本數(shù)據(jù)才能進(jìn)行后續(xù)的因子分析。Step03：選擇描述性統(tǒng)計(jì)量單擊【描述】按鈕，彈出對(duì)話框圖所示。這里可以選擇輸出描述性統(tǒng)計(jì)量及相關(guān)矩陣等內(nèi)容。9.1 SPSS在因子分析中的應(yīng)用Step04：選擇因子提取方法單擊【抽取】按鈕，彈出對(duì)話框圖9-3所示。這里可

5、以選擇提取因子的方法及相關(guān)選項(xiàng)。具體選項(xiàng)含義如下：單擊【方法】框中的箭頭按鈕，展開(kāi)下拉列表，從中可以選擇因子提取方法：主成份分析法：該方法假設(shè)變量是因子的純線性組合。第一成分有最大的方差，后續(xù)的成分其可解釋的方差逐個(gè)遞減；不加權(quán)最小二乘法：加權(quán)最小二乘法；極大似然法：主軸因子提取法：因子提取法：映象因子提取法：9.1 SPSS在因子分析中的應(yīng)用【分析】欄輸出分析矩陣：相關(guān)系數(shù)矩陣，系統(tǒng)默認(rèn)項(xiàng)：協(xié)方差矩陣：【輸出】欄輸出與因子提取有關(guān)的選項(xiàng)：輸出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。此項(xiàng)為系統(tǒng)默認(rèn)的輸出方式；輸出因子的碎石圖：它顯示了按特征值大小排列的因子序號(hào)。它有助于確定保留多少個(gè)因

6、子。典型的碎石圖會(huì)有一個(gè)明顯的拐點(diǎn)，在該點(diǎn)之前是與大因子連接的陡峭的折線，之后是與小因子相連的緩坡折線。9.1 SPSS在因子分析中的應(yīng)用【抽取】欄輸出與提取結(jié)果有關(guān)的選擇項(xiàng)。由于理論上因子數(shù)目與原始變量數(shù)目相等，但因子分析的目的是用少量因子代替多個(gè)原始變量，選擇提取多少個(gè)因子是由本欄來(lái)決定。指定提取公因子的數(shù)目：用鼠標(biāo)單擊選擇此項(xiàng)后，將指定其數(shù)目。指定因子分析收斂的最大迭代次數(shù) 在對(duì)應(yīng)的參數(shù)框中指定因子分析收斂的最大迭代次數(shù)：系統(tǒng)默認(rèn)的最大迭代次數(shù)為25。9.1 SPSS在因子分析中的應(yīng)用Step05：選擇因子旋轉(zhuǎn)方法單擊【旋轉(zhuǎn)】按鈕，彈出下圖所示。這里可以選擇因子旋轉(zhuǎn)方法及相關(guān)選

7、項(xiàng)。具體選項(xiàng)含義如下： 9.1 SPSS在因子分析中的應(yīng)用Step06：選擇因子得分單擊【得分】按鈕，彈出對(duì)話框如下圖所示。這里可以選擇因子得分方法及相關(guān)選項(xiàng)。具體選項(xiàng)含義如下：9.1 SPSS在因子分析中的應(yīng)用Step07：其他選擇輸出單擊【選項(xiàng)】按鈕，彈出對(duì)話框圖9-6所示。這里可以選擇一些附加輸出項(xiàng)。具體選項(xiàng)含義如下：9.1 SPSS在因子分析中的應(yīng)用9.1.3 實(shí)例分析：居民消費(fèi)結(jié)構(gòu)的變動(dòng)1 實(shí)例內(nèi)容消費(fèi)結(jié)構(gòu)是指在消費(fèi)過(guò)程中各項(xiàng)消費(fèi)支出占居民總支出的比重。它是反映居民生活消費(fèi)水平、生活質(zhì)量變化狀況以及內(nèi)在過(guò)程合理化程度的重要標(biāo)志。而消費(fèi)結(jié)構(gòu)的變動(dòng)不僅是消費(fèi)領(lǐng)域的重要問(wèn)題, 而且也關(guān)系

8、到整個(gè)國(guó)民經(jīng)濟(jì)的發(fā)展。因?yàn)楹侠淼南M(fèi)結(jié)構(gòu)及消費(fèi)結(jié)構(gòu)的升級(jí)和優(yōu)化不僅反映了消費(fèi)的層次和質(zhì)量的提高, 而且也為建立合理的產(chǎn)業(yè)結(jié)構(gòu)和產(chǎn)品結(jié)構(gòu)提供了重要的依據(jù)。表9-1是某市居民生活費(fèi)支出費(fèi)用，具體分為食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通通訊、文教娛樂(lè)及服務(wù)、居住和雜項(xiàng)商品與服務(wù)等8個(gè)部分。請(qǐng)利用因子分析探討該市居民消費(fèi)結(jié)構(gòu)，為產(chǎn)業(yè)政策的制定和宏觀經(jīng)濟(jì)的調(diào)控提供參考。9.1 SPSS在因子分析中的應(yīng)用2 實(shí)例操作表9-1是某市居民在食品、衣著、醫(yī)療保健等八個(gè)方面的消費(fèi)數(shù)據(jù)，這些指標(biāo)之間存在著不同強(qiáng)弱的相關(guān)性。如果單獨(dú)分析這些指標(biāo)，無(wú)法能夠分析居民消費(fèi)結(jié)構(gòu)的特點(diǎn)。因此，可以考慮采用因子分析

9、，將這八個(gè)指標(biāo)綜合為少數(shù)幾個(gè)因子，通過(guò)這些公共因子來(lái)反映居民消費(fèi)結(jié)構(gòu)的變動(dòng)情況。9.1 SPSS在因子分析中的應(yīng)用3 實(shí)例結(jié)果及分析（1）描述性統(tǒng)計(jì)表表9-2顯示了食品、衣著等這八個(gè)消費(fèi)支出指標(biāo)的描述統(tǒng)計(jì)量，例如均值、標(biāo)準(zhǔn)差等。這為后續(xù)的因子分析提供了一個(gè)直觀的分析結(jié)果?？梢钥吹?，食品支出消費(fèi)所占的比重最大，其均值等于39.4750%，其次是文化娛樂(lè)服務(wù)支出消費(fèi)和交通通信支出消費(fèi)。所有的消費(fèi)支出中，醫(yī)療保健消費(fèi)支出占的比重最低。9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析中的應(yīng)用（2）因子分析共同度表是因子分析的共同度，顯示了所有變量的共同度數(shù)據(jù)。第一列是因子分析初始解下的

10、變量共同度。它表明，對(duì)原有八個(gè)變量如果采用主成分分析法提取所有八個(gè)特征根，那么原有變量的所有方差都可被解釋?zhuān)兞康墓餐染鶠?（原有變量標(biāo)準(zhǔn)化后的方差為1）。事實(shí)上，因子個(gè)數(shù)小于原有變量的個(gè)數(shù)才是因子分析的目的，所以不可能提取全部特征根。于是，第二列列出了按指定提取條件（這里為特征根大于1）提取特征根時(shí)的共同度。可以看到，所有變量的絕大部分信息（全部都大于83）可被因子解釋?zhuān)@些變量信息丟失較少。因此本次因子提取的總體效果理想。9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析中的應(yīng)用（3）因子分析的總方差解釋接著Spss軟件計(jì)算得到相關(guān)系數(shù)矩陣的特征值、方差貢獻(xiàn)率及累計(jì)方差貢

11、獻(xiàn)率結(jié)果如表9-4所示。在表9-4中，第一列是因子編號(hào)，以后三列組成一組，組中數(shù)據(jù)項(xiàng)的含義依次是特征根、方差貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。第一組數(shù)據(jù)項(xiàng)（第二至第四列）描述了初始因子解的情況?？梢钥吹?，第一個(gè)因子的特征根值為4.316，解釋了原有8個(gè)變量總方差的53.947。前三個(gè)因子的累計(jì)方差貢獻(xiàn)率為94.196，并且只有它們的取值大于1。說(shuō)明前3個(gè)公因子基本包含了全部變量的主要信息，因此選前3個(gè)因子為主因子即可。同時(shí)，提取后的因子方差和旋轉(zhuǎn)后的因子方差部分列出了因子提取后和旋轉(zhuǎn)后的因子方差解釋情況。從表中看到，它們都支持選擇3個(gè)公共因子。9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析

12、中的應(yīng)用（4）因子碎石圖圖9-15是因子分析的碎石圖。橫坐標(biāo)為因子數(shù)目，縱坐標(biāo)為特征根?？梢钥吹?，第一個(gè)因子的特征值很高，對(duì)解釋原有變量的貢獻(xiàn)最大；第三個(gè)以后的因子特征根都較小，取值都小于1，說(shuō)明它們對(duì)解釋原有變量的貢獻(xiàn)很小，稱為可被忽略的“高山腳下的碎石”，因此提取前三個(gè)因子是合適的。9.1 SPSS在因子分析中的應(yīng)用（5）旋轉(zhuǎn)前的因子載荷矩陣表9-5顯示了因子載荷矩陣，它是因子分析的核心內(nèi)容。通過(guò)載荷系數(shù)大小可以分析不同公共因子所反映的主要指標(biāo)的區(qū)別。從結(jié)果看，大部分因子解釋性較好，但是仍有少部分指標(biāo)解釋能力較差，例如“食品”指標(biāo)在三個(gè)因子的載荷系數(shù)區(qū)別不大。因此接著采用因子旋轉(zhuǎn)方法

13、使得因子載荷系數(shù)向0或1兩極分化，使大的載荷更大，小的載荷更小。這樣結(jié)果更具可解釋性。9.1 SPSS在因子分析中的應(yīng)用（6）旋轉(zhuǎn)后的因子載荷矩陣表9-6顯示了實(shí)施因子旋轉(zhuǎn)后的載荷矩陣?？梢钥吹?，第一主因子在“交通和通信”和“醫(yī)療保健”等五個(gè)指標(biāo)上具有較大的載荷系數(shù)，第二主因子在“居住”和“衣著”指標(biāo)上系數(shù)較大，而第三主因子在“雜項(xiàng)商品與服務(wù)”上的系數(shù)最大。此時(shí)，各個(gè)因子的含義更加突出。9.1 SPSS在因子分析中的應(yīng)用可以看出第一個(gè)公因子主要反映了交通和通信、醫(yī)療保健、文化娛樂(lè)服務(wù)、家庭設(shè)備用品及服務(wù)和食品上有較大載荷，說(shuō)明第一個(gè)公因子綜合反映這幾個(gè)方面的變動(dòng)情況，可以將其命名為第一基本

14、生活消費(fèi)因子，即享受性消費(fèi)因子。第二個(gè)公因子在居住、衣著上的載荷系數(shù)較大，代表了這兩個(gè)方面的變動(dòng)趨勢(shì)，可以將其命名為第二基本生活消費(fèi)因子，即發(fā)展性消費(fèi)因子。第三個(gè)公因子在雜項(xiàng)商品與服務(wù)上的消費(fèi)變動(dòng)較大，因此可以將第三個(gè)公因子命名為第三基本生活消費(fèi)因子，即其他類(lèi)型消費(fèi)因子。 9.1 SPSS在因子分析中的應(yīng)用（7）因子得分系數(shù) 表9-7列出了采用回歸法估計(jì)的因子得分系數(shù)。根據(jù)表中內(nèi)容可寫(xiě)出以下因子得分函數(shù)：因子F1=-0.198X1+0.058X2-0.226X3+0.212X4+0.221X5+0.211X6+0.079X7+0.015X8；因子F2=0.123X1+0.425X2+0

15、.200X3+0.094X4+0.008X5+0.096X6-0.498X7+0.015X8；因子F3=0.365X1-0.059X2-0.174X3+0.069X4+0.119X5-0.077X6-0.088X7+0.779X8；9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析中的應(yīng)用9.2.1 聚類(lèi)分析的基本原理1、方法概述聚類(lèi)分析又稱群分析，它是研究（樣品或指標(biāo)）分類(lèi)問(wèn)題的一種多元統(tǒng)計(jì)方法，所謂類(lèi)，通俗地說(shuō)，就是指相似元素的集合。 2、聚類(lèi)分析的分類(lèi)根據(jù)分類(lèi)對(duì)象的不同可分為樣品聚類(lèi)和變量聚類(lèi)。（1）樣品聚類(lèi) 樣品聚類(lèi)在統(tǒng)計(jì)學(xué)中又稱為Q 型聚類(lèi)。用SPSS 的術(shù)語(yǔ)來(lái)說(shuō)就是對(duì)

16、事件進(jìn)行聚類(lèi)，或是說(shuō)對(duì)觀測(cè)量進(jìn)行聚類(lèi)。它是根據(jù)被觀測(cè)的對(duì)象的各種特征，即反映被觀測(cè)對(duì)象的特征的各變量值進(jìn)行分類(lèi)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用（2）變量聚類(lèi) 變量聚類(lèi)在統(tǒng)計(jì)學(xué)又稱為R 型聚類(lèi)。反映同一事物特點(diǎn)的變量有很多，我們往往根據(jù)所研究的問(wèn)題選擇部分變量對(duì)事物的某一方面進(jìn)行研究。由于人類(lèi)對(duì)客觀事物的認(rèn)識(shí)是有限的，往往難以找出彼此獨(dú)立的有代表性的變量，而影響對(duì)問(wèn)題的進(jìn)一步認(rèn)識(shí)和研究。例如在回歸分析中，由于自變量的共線性導(dǎo)致偏回歸系數(shù)不能真正反映自變量對(duì)因變量的影響等。因此往往先要進(jìn)行變量聚類(lèi)，找出彼此獨(dú)立且有代表性的自變量，而又不丟失大部分信息。值得提出的是將聚類(lèi)分析和其它方法聯(lián)合起

17、來(lái)使用，如判別分析、主成分分析、回歸分析等往往效果更好。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用3、距離和相似系數(shù) 為了將樣品（或指標(biāo)）進(jìn)行分類(lèi)，就需要研究樣品之間關(guān)系。目前用得最多的方法有兩個(gè)：一種方法是用相似系數(shù)，性質(zhì)越接近的樣品，它們的相似系數(shù)的絕對(duì)值越接近1，而彼此無(wú)關(guān)的樣品，它們的相似系數(shù)的絕對(duì)值越接近于零。比較相似的樣品歸為一類(lèi)，不怎么相似的樣品歸為不同的類(lèi)。另一種方法是將一個(gè)樣品看作P維空間的一個(gè)點(diǎn)，并在空間定義距離，距離越近的點(diǎn)歸為一類(lèi)，距離較遠(yuǎn)的點(diǎn)歸為不同的類(lèi)。但相似系數(shù)和距離有各種各樣的定義，而這些定義與變量的類(lèi)型關(guān)系極大。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 K-均值聚類(lèi)法又

18、叫快速聚類(lèi)法，可以用于大量數(shù)據(jù)進(jìn)行聚類(lèi)分析的情形。它是一種非分層的聚類(lèi)方法。這種方法占用內(nèi)存少、計(jì)算量、處理速度快，特別適合大樣本的聚類(lèi)分析。它的基本操作步驟如下： 1、指定聚類(lèi)數(shù)目k，應(yīng)由用戶指定需要聚成多少類(lèi)，最終也只能輸出關(guān)于它的唯一解。這點(diǎn)不同于層次聚類(lèi)。 2、確定k個(gè)初始類(lèi)的中心。兩種方式：一種是用戶指定方式，二是根據(jù)數(shù)據(jù)本身結(jié)構(gòu)的中心初步確定每個(gè)類(lèi)別的原始中心點(diǎn)。 3、根據(jù)距離最近原則進(jìn)行分類(lèi)。逐一計(jì)算每一記錄到各個(gè)中心點(diǎn)的距離，把各個(gè)記錄按照距離最近的原則歸入各個(gè)類(lèi)別，并計(jì)算新形成類(lèi)別的中心點(diǎn) 4、按照新的中心位置，重新計(jì)算每一記錄距離新的類(lèi)別中心點(diǎn)的距離，并重新進(jìn)行歸類(lèi)。 5、

19、重復(fù)步驟4，直到達(dá)到一定的收斂標(biāo)準(zhǔn)。這種方法也常稱為逐步聚類(lèi)分析，即先把被聚對(duì)象進(jìn)行初始分類(lèi)，然后逐步調(diào)整，得到最終分類(lèi)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2.2 快速聚類(lèi)SPSS操作詳解Step01：打開(kāi)主菜單選擇主菜單中的【分析】【分類(lèi)】【K均值聚類(lèi)】命令，彈出【K均值聚類(lèi)分析】對(duì)話框，如圖所示，這是快速聚類(lèi)分析的主操作窗口。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 Step02：選擇聚類(lèi)分析變量在【K均值聚類(lèi)分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行聚類(lèi)分析的變量將其添加至【變量】列表框中。同時(shí)可以選擇一個(gè)標(biāo)識(shí)變量移入【個(gè)案標(biāo)記依據(jù)】框中。Step03：確定分類(lèi)個(gè)數(shù) 【聚類(lèi)數(shù)】框中，可

20、以輸入確定的聚類(lèi)分析數(shù)目，用戶可以根據(jù)需要自行修改調(diào)整。系統(tǒng)默認(rèn)的聚類(lèi)數(shù)為2.Step04：選擇聚類(lèi)方法主對(duì)話框中的【方法】欄中可以選擇聚類(lèi)方法。系統(tǒng)默認(rèn)值是【迭代與分類(lèi)】項(xiàng)。選擇初始類(lèi)中心：在迭代過(guò)程中不斷更新聚類(lèi)中心。把觀測(cè)量分派到與之最近的以類(lèi)中心為標(biāo)志的類(lèi)中去。只使用初始類(lèi)中心對(duì)觀測(cè)量進(jìn)行分類(lèi)，聚類(lèi)中心始終不變。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step05：聚類(lèi)中心的輸入與輸出在主對(duì)話框圖中，【聚類(lèi)中心】欄表示輸入和輸出聚類(lèi)中心的對(duì)話框。用戶可以指定外部文件或數(shù)據(jù)集作為初始聚類(lèi)中心點(diǎn)，也可以將聚類(lèi)分析的聚類(lèi)中心結(jié)果輸出到指定文件或數(shù)據(jù)集中。要求使用指定數(shù)據(jù)文件中的觀測(cè)量或

21、建立數(shù)據(jù)集作為初始類(lèi)中心。要求把聚類(lèi)結(jié)果中的各類(lèi)中心數(shù)據(jù)保存到指定的文件或數(shù)據(jù)集中。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用在主對(duì)話框中單擊【迭代】按鈕，打開(kāi)設(shè)置迭代參數(shù)的對(duì)話框圖，這里可以進(jìn)一步選擇迭代參數(shù)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step07：輸出聚類(lèi)結(jié)果在主對(duì)話框中單擊【保存】按鈕，彈出【保存新變量】對(duì)話框，它用于選擇保存新變量，見(jiàn)圖聚類(lèi)成員：在當(dāng)前數(shù)據(jù)文件中建立一個(gè)名為“qcl_1”新變量。其值表示聚類(lèi)結(jié)果，即各觀測(cè)量被分配到哪一類(lèi)。它的取值為1、2、3的序號(hào)。與聚類(lèi)中心的距離：在當(dāng)前數(shù)據(jù)文件中建立一個(gè)名為“qcl_2”新變量。其值為各觀測(cè)量與所屬類(lèi)中心之間的歐氏距離。9

22、.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step08：其他選項(xiàng)輸出在主對(duì)話框中單擊【選項(xiàng)】按鈕，彈出【選項(xiàng)】對(duì)話框，它用于指定要計(jì)算的統(tǒng)計(jì)量和對(duì)帶有缺失值的觀測(cè)量的處理方式。具體見(jiàn)圖：【統(tǒng)計(jì)量】欄選擇輸出統(tǒng)計(jì)量初始聚類(lèi)中心：方差分析表：顯示每個(gè)觀測(cè)量的聚類(lèi)信息：【缺失值】欄中選擇處理缺失值方法按列表排除個(gè)案：分析變量中帶有缺失值的觀測(cè)量都不參與后續(xù)分析；按對(duì)排除個(gè)案：成對(duì)剔除帶有缺失值的觀測(cè)量。Step09：?jiǎn)螕舸_定按鈕，結(jié)束操作，SPSS軟件自動(dòng)輸出結(jié)果。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2.4 系統(tǒng)聚類(lèi)法的SPSS操作詳解SPSS具體操作步驟如下：Step01：打開(kāi)主菜單選擇主

23、菜單中的【分析】【分類(lèi)】【系統(tǒng)聚類(lèi)】命令，彈出【系統(tǒng)聚類(lèi)分析】對(duì)話框，如圖所示，這是系統(tǒng)聚類(lèi)分析的主操作窗口。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 Step02：選擇聚類(lèi)分析變量在【系統(tǒng)聚類(lèi)分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行系統(tǒng)聚類(lèi)分析的變量將其添加至【變量】列表框中。同時(shí)可以選擇一個(gè)標(biāo)識(shí)變量移入【標(biāo)注個(gè)案】框中。Step03：選擇聚類(lèi)類(lèi)型主對(duì)話框中的【分群】欄中可以選擇聚類(lèi)類(lèi)型。系統(tǒng)默認(rèn)值是【個(gè)案】項(xiàng)。個(gè)案：對(duì)觀測(cè)量（樣品）進(jìn)行聚類(lèi)，即Q型聚類(lèi)。變量：對(duì)變量進(jìn)行聚類(lèi)，即R型聚類(lèi)。Step04：選擇輸出類(lèi)型主對(duì)話框中的【輸出】欄中可以選擇輸出類(lèi)型。系統(tǒng)默認(rèn)值是【統(tǒng)計(jì)量）】歐諾供給量和

24、【圖】項(xiàng)。統(tǒng)計(jì)量：輸出主對(duì)話框統(tǒng)計(jì)量按鈕中設(shè)置的的統(tǒng)計(jì)量。圖：輸出主對(duì)話框中圖按鈕中聚類(lèi)圖形。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step05：基本統(tǒng)計(jì)量輸出選擇單擊【統(tǒng)計(jì)量】按鈕，彈出對(duì)話框圖示。這里可以選擇進(jìn)行系統(tǒng)聚類(lèi)分析的基本統(tǒng)計(jì)量。具體選項(xiàng)含義如下：9.2 SPSS 在聚類(lèi)分析中的應(yīng)用【合并進(jìn)程表】：輸出聚類(lèi)過(guò)程表，系統(tǒng)默認(rèn)選項(xiàng)。顯示聚類(lèi)過(guò)程中每一步合并的類(lèi)或觀測(cè)量，反映聚類(lèi)過(guò)程中每一步樣品或類(lèi)的合并過(guò)程?！鞠嗨菩跃仃嚒浚狠敵龈黝?lèi)之間的距離矩陣。以矩陣形式給出各項(xiàng)之間的距離或相似性測(cè)度值。產(chǎn)生什么類(lèi)型的矩陣（相似性矩陣或不相似性矩陣）取決于在【方法】菜單中【度量標(biāo)準(zhǔn)】欄中的選擇?！?/p>

25、聚類(lèi)成員】欄可以選擇聚類(lèi)數(shù)目相關(guān)的輸出項(xiàng)：【無(wú)】：不顯示類(lèi)成員表，它是系統(tǒng)默認(rèn)選項(xiàng)。【單一方案】：選擇此項(xiàng)并在對(duì)應(yīng)的【聚類(lèi)數(shù)】參數(shù)框中指定分類(lèi)數(shù)，這里要求分類(lèi)數(shù)是一個(gè)大于1的整數(shù)。例如指輸入數(shù)字“4”，則會(huì)在輸出窗中顯示聚為4類(lèi)的分析結(jié)果。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用【方案范圍】：選擇此選項(xiàng)并在下邊的【最小聚類(lèi)數(shù)】和【最大聚類(lèi)數(shù)】參數(shù)框中輸入最小聚類(lèi)數(shù)目和最大聚類(lèi)數(shù)目。它表示分別輸出樣品或變量的分類(lèi)數(shù)從最小值到最大值的各種分類(lèi)聚類(lèi)表。輸入的兩個(gè)數(shù)值必須是不等于l 的正整數(shù)，最大類(lèi)數(shù)值不能大于參與聚類(lèi)的樣品數(shù)或變量總數(shù)。Step06：聚類(lèi)統(tǒng)計(jì)圖形輸出選擇單擊【繪制】按鈕，彈出對(duì)話

26、框圖所示。這里可以選擇進(jìn)行系統(tǒng)聚類(lèi)分析的統(tǒng)計(jì)圖形?？蛇x擇輸出的統(tǒng)計(jì)圖表有兩種，一個(gè)是樹(shù)形圖，一個(gè)是冰柱圖。具體選項(xiàng)含義如下：9.2 SPSS 在聚類(lèi)分析中的應(yīng)用【樹(shù)狀圖】：顯示樹(shù)形圖；【冰柱】：顯示冰柱圖形。對(duì)于冰柱圖的具體選項(xiàng)還可以進(jìn)一步用以下選擇項(xiàng)來(lái)確定：所有聚類(lèi)：顯示全部聚類(lèi)結(jié)果的冰柱圖?？捎么朔N圖查看聚類(lèi)的全過(guò)程。但如果參與聚類(lèi)的個(gè)體很多會(huì)造成圖形過(guò)大。聚類(lèi)的指定全距：限定顯示的聚類(lèi)范圍。當(dāng)選擇此項(xiàng)時(shí)，在下面的【開(kāi)始聚類(lèi)】、【停止聚類(lèi)】和【排序標(biāo)準(zhǔn)】后的參數(shù)框中輸入要求顯示聚類(lèi)過(guò)程的開(kāi)始聚類(lèi)數(shù)、終止聚類(lèi)數(shù)及步長(zhǎng)。輸入到參數(shù)框中的數(shù)字必須是正整數(shù)。例如，輸入的結(jié)果是：3，9，2，生成

27、的冰柱圖從第三步開(kāi)始，顯示第三、五、七、九步聚類(lèi)的情況。無(wú)：不輸出冰校圖。同時(shí)，冰柱圖顯示方向可以在【方向】欄中確定：垂直：縱向顯示的冰柱圖。水平：橫向顯示的冰柱圖。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step07：聚類(lèi)方法選擇單擊【方法】按鈕，彈出對(duì)話框圖所示。在對(duì)話框中可以設(shè)定聚類(lèi)方法、距離測(cè)度的方法、數(shù)值變換方法等內(nèi)容。具體選項(xiàng)含義如下：9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step08：聚類(lèi)結(jié)果保存選擇單擊【保存】按鈕，彈出對(duì)話框圖所示。在該對(duì)話框中可以將聚類(lèi)結(jié)果用新變量保存在當(dāng)前工作數(shù)據(jù)文件中。具體選項(xiàng)含義如下：9.2 SPSS 在聚類(lèi)分析中的應(yīng)用無(wú)：不建立新變量。單一方案：

28、單個(gè)結(jié)果輸出。生成一個(gè)新變量，表明每個(gè)樣品在聚類(lèi)之后所屬的類(lèi)。在【聚類(lèi)數(shù)】的矩形框中指定類(lèi)數(shù)。方案范圍：選擇此選項(xiàng)并在下邊的【最小聚類(lèi)數(shù)】和【最大聚類(lèi)數(shù)】參數(shù)框中輸入最小聚類(lèi)數(shù)目和最大聚類(lèi)數(shù)目。它表示分別生成樣品或變量的分類(lèi)數(shù)從最小值到最大值的各種分類(lèi)聚類(lèi)變量。例如輸入結(jié)果是“4”和“6”時(shí)，它表示在聚類(lèi)結(jié)束后在原變量后面增加了3 個(gè)新變量分別表明分為4 類(lèi)時(shí)、分為5 類(lèi)時(shí)和分為6 類(lèi)時(shí)的聚類(lèi)結(jié)果。即聚為4、5、6 類(lèi)時(shí)各樣品分別屬于哪一類(lèi)。Step09：?jiǎn)螕簟敬_定】按鈕，結(jié)束操作，SPSS軟件自動(dòng)輸出結(jié)果。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2.5 實(shí)例分析：商業(yè)銀行綜合競(jìng)爭(zhēng)力的評(píng)價(jià)1

29、實(shí)例內(nèi)容要研究我國(guó)主要商業(yè)銀行的綜合競(jìng)爭(zhēng)力，收集的數(shù)據(jù)如表9-16所示。這里不僅選取了中國(guó)工商銀行、中國(guó)建設(shè)銀行等大型國(guó)有商業(yè)銀行，也包括了招商銀行、民生銀行等股份制商業(yè)銀行。描述這些商業(yè)銀行的綜合競(jìng)爭(zhēng)力指標(biāo)主要有以下10個(gè)。X1：人均凈利潤(rùn)，人均創(chuàng)造的凈利潤(rùn)。X2：凈利潤(rùn)率，反映公司獲取利潤(rùn)能力的一項(xiàng)關(guān)鍵指標(biāo)。X3：資產(chǎn)回報(bào)率，用來(lái)衡量每單位資產(chǎn)創(chuàng)造多少凈利潤(rùn)的指標(biāo)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2 SPSS 在聚類(lèi)分析中的應(yīng)用X4：核心資本充足率，核心資本與加權(quán)風(fēng)險(xiǎn)資產(chǎn)總額的比率。X5：人均費(fèi)用額，人均消耗的管理費(fèi)用。X6：資產(chǎn)負(fù)債率，公司年末的負(fù)債總額同資產(chǎn)總額的比率。X7

30、：股東權(quán)益乘數(shù)，資產(chǎn)總額相當(dāng)于股東權(quán)益的倍數(shù)。X8：不良貸款比率，金融機(jī)構(gòu)不良貸款占總貸款余額的比重。X9：存款市場(chǎng)份額，存款業(yè)務(wù)量在全部銀行存款業(yè)務(wù)量中所占的比重。X10：貸款市場(chǎng)份額，貸款業(yè)務(wù)量在全部銀行貸款業(yè)務(wù)量中所占的比重。2 實(shí)例操作現(xiàn)在要分析我國(guó)主要商業(yè)銀行的綜合競(jìng)爭(zhēng)力，案例中選擇了“人均凈利潤(rùn)”、“凈利潤(rùn)率”、“資產(chǎn)回報(bào)率”等十個(gè)指標(biāo)來(lái)反映這些銀行的綜合發(fā)展能力。這個(gè)問(wèn)題也屬于典型的多元分析問(wèn)題，需要利用多個(gè)指標(biāo)來(lái)分析不同國(guó)商業(yè)銀行之間綜合競(jìng)爭(zhēng)發(fā)展能力的差異，因此可以利用系統(tǒng)聚類(lèi)法，具體操作步驟如下。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Ste

31、p01:打開(kāi)隨書(shū)光盤(pán)中的數(shù)據(jù)文件9-3.sav，選擇菜單欄中的【分析】【分類(lèi)】【系統(tǒng)聚類(lèi)】命令，彈出【系統(tǒng)聚類(lèi)分析】對(duì)話框。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step02:在左側(cè)的候選變量列表框中將X1、X2、X10變量設(shè)定為聚類(lèi)分析變量，將其添加至【變量】列表框中，將Y變量設(shè)定為指示變量，將其添加至【標(biāo)注個(gè)案】列表框中，如圖9-28所示。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step03:單擊【統(tǒng)計(jì)量】按鈕，彈出【系統(tǒng)聚類(lèi)分析：統(tǒng)計(jì)量】對(duì)話框；點(diǎn)選【單一方案】單選鈕，并在對(duì)應(yīng)的【聚類(lèi)數(shù)】文本框中輸入數(shù)字“3”，表示輸出窗中顯示聚為三類(lèi)分析結(jié)果，其他選項(xiàng)保持系統(tǒng)默認(rèn)設(shè)置，如圖9-29所示，單擊

32、【繼續(xù)】按鈕，返回【系統(tǒng)聚類(lèi)分析】對(duì)話框。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step04:擊【繪制】按鈕，彈出【系統(tǒng)聚類(lèi)分析：圖】對(duì)話框；勾選【樹(shù)狀圖】復(fù)選框，表示輸出樣品的聚類(lèi)樹(shù)形圖，如圖9-30所示；其他選項(xiàng)保持系統(tǒng)默認(rèn)設(shè)置，單擊【繼續(xù)】按鈕返回【系統(tǒng)聚類(lèi)分析】對(duì)話框。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step05:單擊【方法】按鈕，彈出【系統(tǒng)聚類(lèi)分析：方法】對(duì)話框；在【轉(zhuǎn)換值】選項(xiàng)組的【標(biāo)準(zhǔn)】下拉列表框中選擇【Z得分】標(biāo)準(zhǔn)化方法，其他選項(xiàng)保持系統(tǒng)默認(rèn)設(shè)置，如圖9-31所示，單擊【繼續(xù)】按鈕返回【系統(tǒng)聚類(lèi)分析】對(duì)話框，單擊【確定】按鈕完成操作。3 實(shí)例結(jié)果及分析（1）聚類(lèi)過(guò)程表 SPS

33、S軟件首先給出了進(jìn)行系統(tǒng)聚類(lèi)分析過(guò)程表，如表9-17所示。第一列列出了聚類(lèi)過(guò)程的步驟號(hào)，第二列和第三列列出了某一步驟中哪些國(guó)家和地區(qū)參與了合并。例如從結(jié)果中看出，在第一步中，第九個(gè)樣品（民生銀行）和第十個(gè)樣品（招商銀行）首先被合并在一起。第四列列出了每一步驟的聚類(lèi)系數(shù)，這一數(shù)值表示被合并的兩個(gè)類(lèi)別之間的距離大?。坏谖辶泻偷诹斜硎緟⑴c合并的國(guó)家和地區(qū)（類(lèi)別）是在第幾步中第一次出現(xiàn)，0代表該記錄是第一次出現(xiàn)在聚類(lèi)過(guò)程中；第七列表示在這一步驟中合并的類(lèi)別，下一次將在第幾步中與其他類(lèi)再進(jìn)行合并。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2 SPSS 在聚類(lèi)分析中的應(yīng)用（2）聚類(lèi)分析結(jié)果表表9-18顯

34、示了系統(tǒng)聚類(lèi)法的聚類(lèi)結(jié)果?？梢钥吹骄垲?lèi)結(jié)果分為兩大類(lèi)：第類(lèi)：民生銀行、招商銀行、中信銀行。第類(lèi)：交通銀行、深發(fā)銀行、光大銀行、浦發(fā)銀行。第類(lèi)：工商銀行、建設(shè)銀行、中國(guó)銀行。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用（3）樹(shù)形圖表9-18已給出了相關(guān)聚類(lèi)結(jié)果，最后用樹(shù)形圖直觀反映整個(gè)聚類(lèi)過(guò)程和結(jié)果，如圖9-32所示。從圖中可以明顯看到每個(gè)樣品從單獨(dú)一類(lèi)逐次合并，一直到全部合并成一大類(lèi)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.3.1 判別分析的基本原理1、方法概述判別分析是判別樣品所屬類(lèi)型的一種統(tǒng)計(jì)方法，其應(yīng)用之廣可與回歸分析媲美。判別分析與聚類(lèi)分析不同。判別分析是在已知研究對(duì)象分成若干類(lèi)型（或

35、組別）并已取得各種類(lèi)型的一批已知樣品的觀測(cè)數(shù)據(jù)，在此基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式，然后對(duì)未知類(lèi)型的樣品進(jìn)行判別分類(lèi)。2、基本原理判別分析內(nèi)容很豐富，方法很多。判別分析按判別的組數(shù)來(lái)區(qū)分，有兩組判別分析和多組判別分析；按區(qū)分不同總體的所用的數(shù)學(xué)模型來(lái)分，有線性判別和非線性判別；按判別時(shí)所處理的變量方法不同，有逐步判別和序貫判別等。其中，距離判別分析是一種常見(jiàn)的判別分析方法。它的基本思想是：首先根據(jù)已知分類(lèi)的數(shù)據(jù)，分別計(jì)算各類(lèi)的重心即分組（類(lèi)）的均值，判別準(zhǔn)則是對(duì)任給的一次觀測(cè)，若它與第i類(lèi)的重心距離最近，就認(rèn)為它來(lái)自第i類(lèi)。9.3 SPSS 在判別分析中的應(yīng)用例如兩個(gè)總體的距離判別法中，設(shè)有

36、兩個(gè)總體（或稱兩類(lèi)）G1、G2，從第一個(gè)總體中抽取n1個(gè)樣品，從第二個(gè)總體中抽取n2個(gè)樣品，每個(gè)樣品測(cè)量p個(gè)指標(biāo)如下頁(yè)表。今任取一個(gè)樣品，實(shí)測(cè)指標(biāo)值為，問(wèn)X應(yīng)判歸為哪一類(lèi)？首先計(jì)算X到G1、G2總體的距離，分別記為和，按距離最近準(zhǔn)則判別歸類(lèi)，則可寫(xiě)成：然后比較和大小，按距離最近準(zhǔn)則判別歸類(lèi) 1( ,)pXxx 1(,)D X G1(,)D X G2(,)D X G2(,)DXG11221212,(,)(,),(,)(,), (,)(,)XGD X GD X GXGD X GD X GD X GD X G當(dāng)當(dāng)待判當(dāng)9.3 SPSS 在判別分析中的應(yīng)用9.3.2 判別分析的SPSS操作詳

37、解Step01：打開(kāi)主菜單選擇主菜單中的【分析】【分類(lèi)】【辨別】命令，彈出【辨別分析】對(duì)話框，如圖所示，這是判別分析的主操作窗口。9.3 SPSS 在判別分析中的應(yīng)用 Step02：選擇判別分析變量在【辨別分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行判別分析的變量將其添加至【自變量】列表框中，將其作為自變量。Step03：指定分類(lèi)變量及范圍在主對(duì)話框的候選變量中選擇分類(lèi)變量（離散型變量）移入【分組變量】框中。此時(shí)它下面的【定義范圍】按鈕加亮，按該按鈕，屏幕彈出一個(gè)小對(duì)話框，提供指定該分類(lèi)變量的數(shù)值范圍，如圖所示。其中，輸入最小值：輸入最大值：9.3 SPSS 在判別分析中的應(yīng)用Step04

38、：選擇判別分析方法在主對(duì)話框【自變量】列表框下面有兩個(gè)按鈕，它們提供了判別分析方法選擇：一起輸入自變量：建立所選擇的所有變量的判別式。當(dāng)認(rèn)為所有自變量都能對(duì)觀測(cè)量特性提供豐富的信息時(shí)使用該選擇項(xiàng)。系統(tǒng)默認(rèn)設(shè)置。使用步進(jìn)式方法：采用逐步判別法作判別分析。點(diǎn)選該項(xiàng)后，主菜單中的【方法】按鈕加亮?？梢赃M(jìn)一步選擇判別分析方法（見(jiàn)第步）。如果希望使用一部分觀測(cè)量進(jìn)行判別函數(shù)的推導(dǎo)，選擇一個(gè)能夠標(biāo)記需選擇的這部分觀測(cè)量的變量將其移入【選擇變量】框中；再單擊其右側(cè)的Valve按鈕，展開(kāi)【設(shè)置值】對(duì)話框，鍵入能標(biāo)記的變量值，如圖所示。9.3 SPSS 在判別分析中的應(yīng)用Step05：基本統(tǒng)計(jì)量輸出選擇

39、單擊【統(tǒng)計(jì)量】按鈕，彈出對(duì)話框圖所示。這里可以選擇進(jìn)行判別分析的基本統(tǒng)計(jì)量輸出。具體選項(xiàng)含義如下：9.3 SPSS 在判別分析中的應(yīng)用【描述性】欄選擇輸出描述統(tǒng)計(jì)量:均值：輸出各類(lèi)中各自變量的均值、標(biāo)準(zhǔn)差和各自變量總樣本的均值、標(biāo)準(zhǔn)差。單變量 ANOVAs：?jiǎn)我蛩胤讲罘治?。?duì)各類(lèi)中同一自變量進(jìn)行均值檢驗(yàn)，輸出單因素方差分析結(jié)果。 Boxs M：對(duì)各類(lèi)協(xié)方差矩陣相等的假設(shè)進(jìn)行檢驗(yàn)?！竞瘮?shù)系數(shù)】欄選擇輸出判別函數(shù)的系數(shù)Fishers：輸出Fisher函數(shù)系數(shù)。對(duì)每一類(lèi)給出一組系數(shù)，并給出該組中判別分?jǐn)?shù)最大的觀測(cè)量。未標(biāo)準(zhǔn)化：未經(jīng)標(biāo)準(zhǔn)化處理的判別函數(shù)系數(shù)?！揪仃嚒繖谶x擇輸出自變量的系數(shù)矩陣類(lèi)內(nèi)相

40、關(guān)矩陣：類(lèi)內(nèi)協(xié)方差矩陣：對(duì)每一類(lèi)分別輸出協(xié)方差矩陣：總樣本的協(xié)方差矩陣：9.3 SPSS 在判別分析中的應(yīng)用Step06：設(shè)置逐步判別分析選項(xiàng) 點(diǎn)選【使用步進(jìn)式方法】后，就表示采用逐步判別法進(jìn)行分析。接著單擊主菜單中的【統(tǒng)計(jì)量】按鈕，彈出對(duì)話框圖所示。這里可以選擇逐步判別分析的選項(xiàng)。具體選項(xiàng)含義如下：9.3 SPSS 在判別分析中的應(yīng)用【方法】欄選擇變量進(jìn)入判別函數(shù)的方式： Wilks lambda：每步都選擇Wilk 的統(tǒng)計(jì)量最小的變量進(jìn)入判別函數(shù)。未解釋方案：每步都選擇使類(lèi)間不可解釋的方差和最小的變量進(jìn)入判別函數(shù)。 Mahalanobis 距離：每步都選擇使靠得最近的兩類(lèi)間的Maha

41、lanobis 距離最大的變量進(jìn)入判別函數(shù)。最小 F 值：每步都選擇使任何兩類(lèi)間的“最小F 值”達(dá)到最大的變量進(jìn)入判別函數(shù)。 Raos V：每步都選擇使Raos V 統(tǒng)計(jì)量產(chǎn)生最大增量的變量進(jìn)入判別函數(shù)。選擇此種方法后，應(yīng)該在該項(xiàng)下面的V-to-enter 后的參數(shù)框中輸入這個(gè)增量的指定值。當(dāng)某變量導(dǎo)致的V 值增量大于指定值的變量時(shí)，該變量進(jìn)入判別函數(shù)。9.3 SPSS 在判別分析中的應(yīng)用【標(biāo)準(zhǔn)】欄選擇逐步判別停止的條件：使用 F 值：使用F 值，系統(tǒng)默認(rèn)選項(xiàng)，當(dāng)加入一個(gè)變量（或剔除一個(gè)變量）后，對(duì)在判別函數(shù)中的變量進(jìn)行方差分析。當(dāng)計(jì)算的F 值大于指定的Entry 值時(shí)，該變量保留在函數(shù)中。

42、默認(rèn)值是Entry 為3.84。當(dāng)該變量使計(jì)算的F 值小于指定的Removal 值時(shí)，該變量從函數(shù)中剔除。默認(rèn)值是Removal 為2.71。設(shè)置這兩個(gè)值時(shí)應(yīng)該要求Entry 值大于Removal 值。使用F的概率：使用F 檢驗(yàn)的概率決定變量是否加入函數(shù)或被剔除。當(dāng)計(jì)算的F 檢驗(yàn)的概率小于指定的Entry 值時(shí)，該變量加入函數(shù)中。當(dāng)該變量使計(jì)算的F 值的概率大于指定的Removal 值時(shí)，該變量從函數(shù)中剔除。【輸出】欄選擇逐步選擇變量的過(guò)程和最后結(jié)果的顯示：步進(jìn)摘要：顯示每步選擇變量之后各變量的統(tǒng)計(jì)量結(jié)果。兩兩組間距離的F值：顯示兩類(lèi)之間的F 比值矩陣。9.3 SPSS 在判別分析中的應(yīng)用S

43、tep07：設(shè)置分類(lèi)參數(shù)與判別結(jié)果單擊【分類(lèi)】按鈕，彈出對(duì)話框圖所示。這里可以設(shè)置判別分析的分類(lèi)參數(shù)及結(jié)果。具體選項(xiàng)含義如下：9.3 SPSS 在判別分析中的應(yīng)用【先驗(yàn)概率】欄選擇先驗(yàn)概率：各類(lèi)先驗(yàn)概率相等：系統(tǒng)默認(rèn)選項(xiàng)。若分為m 類(lèi)，則各類(lèi)先驗(yàn)概率均為lm。基于各類(lèi)樣本量占總樣本量的比例計(jì)算先驗(yàn)概率?！臼褂脜f(xié)方差矩陣】欄選擇分類(lèi)使用的協(xié)方差矩陣：使用合并組內(nèi)協(xié)方差矩陣進(jìn)行分類(lèi)。使用各組協(xié)方差矩陣進(jìn)行分類(lèi)?！据敵觥繖谶x擇輸出分類(lèi)結(jié)果：輸出每個(gè)觀測(cè)量的判別分?jǐn)?shù)、實(shí)際類(lèi)、預(yù)測(cè)類(lèi)（根據(jù)判別函數(shù)求得的分類(lèi)結(jié)果）和后驗(yàn)概率等。選擇此項(xiàng)后，下面的【將個(gè)案限制在前】項(xiàng)被激活，可以在它后面的文本框中輸入

44、觀測(cè)量數(shù)n。選擇此項(xiàng)則僅輸出前n 個(gè)觀測(cè)量。輸出分類(lèi)的小結(jié)表：輸出對(duì)每一個(gè)觀測(cè)量進(jìn)行分類(lèi)的結(jié)果，所依據(jù)的判別函數(shù)是由除該觀測(cè)量以外的其他觀測(cè)量導(dǎo)出的。9.3 SPSS 在判別分析中的應(yīng)用【圖】欄選擇輸出統(tǒng)計(jì)圖：生成全部類(lèi)的散點(diǎn)圖:該圖是根據(jù)前兩個(gè)判別函數(shù)值作的散點(diǎn)圖。如果只有一個(gè)判別函數(shù)，就輸出直方圖。對(duì)每一類(lèi)生成一張散點(diǎn)圖:如果只有一個(gè)判別函數(shù)，就輸出直方圖。生成根據(jù)判別函數(shù)值將觀測(cè)量分到各類(lèi)去的邊界圖:每一類(lèi)占據(jù)一個(gè)區(qū)域。各類(lèi)均值在各區(qū)中用星號(hào)標(biāo)出。如果僅有一個(gè)判別函數(shù)，則不作此圖。缺失值處理方式：用該變量的均值代替缺失值:9.3 SPSS 在判別分析中的應(yīng)用Step08：結(jié)果保存設(shè)置

45、單擊【保存】按鈕，彈出對(duì)話框圖所示。這里可以設(shè)置判別分析的結(jié)果輸出。具體選項(xiàng)含義如下：9.3 SPSS 在判別分析中的應(yīng)用建立新變量（系統(tǒng)默認(rèn)變量名是dis_1）保存預(yù)測(cè)觀測(cè)量所屬類(lèi)的值。建立新變量保持判別分?jǐn)?shù)：建立新變量保存各個(gè)觀測(cè)量屬于各類(lèi)的概率值。有m 類(lèi)，對(duì)一個(gè)觀測(cè)量就會(huì)給出m 個(gè)概率值，因此建立m 個(gè)新變量。9.3 SPSS 在判別分析中的應(yīng)用Step09 相關(guān)統(tǒng)計(jì)量的Bootstrap估計(jì) 單擊【Bootstrap】按鈕，彈出如圖9-45所示對(duì)話框，在此可以進(jìn)行如下統(tǒng)計(jì)量的Bootstrap估計(jì)。標(biāo)準(zhǔn)化典則判別函數(shù)系數(shù)表支持標(biāo)準(zhǔn)化系數(shù)的bootstrap 估計(jì)。典則判別函

46、數(shù)系數(shù)表支持非標(biāo)準(zhǔn)化系數(shù)的bootstrap 估計(jì)。分類(lèi)函數(shù)系數(shù)表支持系數(shù)的bootstrap 估計(jì)。Step10：?jiǎn)螕舸_定按鈕，結(jié)束操作，SPSS軟件自動(dòng)輸出結(jié)果。9.3 SPSS 在判別分析中的應(yīng)用9.3.3 實(shí)例分析：全國(guó)30個(gè)省市經(jīng)濟(jì)增長(zhǎng)差異研究1 實(shí)例內(nèi)容現(xiàn)要研究全國(guó)30個(gè)省市地區(qū)經(jīng)濟(jì)增長(zhǎng)差異性，收集相關(guān)數(shù)據(jù)見(jiàn)表9-19所示。表中相關(guān)變量的含義分別是：x1經(jīng)濟(jì)增長(zhǎng)率（%）、x2非國(guó)有化水平（%）、x3開(kāi)放度（%）、x4市場(chǎng)化程度（%）。其中，遼寧、河北等省市歸為一類(lèi)，而黑龍江、吉林等省市歸為另一類(lèi)。請(qǐng)分析江蘇、安徽和浙江的類(lèi)別 9.3 SPSS 在判別分析中的應(yīng)用2 實(shí)例操作由

47、于案例中已經(jīng)將北京、上海、四川等省市按照經(jīng)濟(jì)增長(zhǎng)特點(diǎn)分類(lèi)，現(xiàn)在需要將另外三個(gè)待估省市：江蘇、安徽和陜西分類(lèi)。因此，可以利用判別分析來(lái)判別它們的歸屬。9.3 SPSS 在判別分析中的應(yīng)用3 實(shí)例結(jié)果及分析（1）判別分析概述表SPSS軟件首先給出了進(jìn)行判別分析的概述表9-20?？梢钥吹?，參加分析的變量總數(shù)為30，有效觀測(cè)量數(shù)為27，占90%；包含缺失值或分類(lèi)變量范圍之外的觀測(cè)量數(shù)為3，占10%。9.3 SPSS 在判別分析中的應(yīng)用（2）分組統(tǒng)計(jì)表表9-21給出了觀測(cè)量按照類(lèi)別不同進(jìn)行的基本描述性統(tǒng)計(jì)量輸出，其中包括均值、均方差和有效觀測(cè)量的個(gè)數(shù)等?？梢詮慕Y(jié)果初步看到，不同類(lèi)之間省市經(jīng)濟(jì)指標(biāo)的差異比較明顯，例如第一類(lèi)省份的“非國(guó)有化水平”指標(biāo)均值等于65.0282，而第

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

spss學(xué)習(xí)第9章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

spss學(xué)習(xí)第9章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔