spss學(xué)習(xí)第9章_第1頁(yè)
spss學(xué)習(xí)第9章_第2頁(yè)
spss學(xué)習(xí)第9章_第3頁(yè)
spss學(xué)習(xí)第9章_第4頁(yè)
spss學(xué)習(xí)第9章_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第9章 SPSS的多元統(tǒng)計(jì)分析9.1.1 因子分析的基本原理通常針對(duì)變量作因子分析,稱為R型因子分析;另一種對(duì)樣品作因子分析,稱為Q型因子分析,這兩種分析方法有許多相似之處。R型因子分析數(shù)學(xué)模型是:設(shè)原有p個(gè)變量 且每個(gè)變量(或經(jīng)標(biāo)準(zhǔn)化處理后)的均值為0,標(biāo)準(zhǔn)差為1。現(xiàn)將每個(gè)原有變量用k( )個(gè)因子 的線性組合來(lái)表示,即有:上式就是因子分析的的數(shù)學(xué)模型,也可以用矩陣的形式表示為 1,.,pxx kp111 112 211221 122 2221 12 2kkkkppppkkpxa fa fa fxa fa fa fxa fa fa fXAF12,kf ff9.1 SPSS在因子分析中的應(yīng)用其中

2、,X是可實(shí)測(cè)的隨機(jī)向量。F稱為因子,由于它們出現(xiàn)在每個(gè)原有變量的線性表達(dá)式中,因此又稱為公共因子。A稱為因子載荷矩陣, 稱為因子載荷。 稱為特殊因子,表示了原有變量不能被因子解釋的部分,其均值為0 因子分析的基本思想是通過(guò)對(duì)變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的分析,從中找出少數(shù)幾個(gè)能控制原始變量的隨機(jī)變量 選取公共因子的原則是使其盡可能多的包含原始變量中的信息,建立模型 ,忽略 , 以F代替X,用它再現(xiàn)原始變量X的信息,達(dá)到簡(jiǎn)化變量降低維數(shù)的目的。(1,2, ;1,2, )ija ip jk(1,2, )if ikXA F9.1 SPSS在因子分析中的應(yīng)用 具體步驟:將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)

3、量級(jí)和量綱上的不同;求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)矩陣;求相關(guān)矩陣的特征值和特征向量;計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率;確定因子:設(shè)F1,F(xiàn)2, Fp為p個(gè)因子,其中前m個(gè)因子包含的 數(shù)據(jù)信息總量(即其累積貢獻(xiàn)率)不低于85%時(shí),可取前m個(gè)因子來(lái)反映原評(píng)價(jià)指標(biāo);因子旋轉(zhuǎn):若所得的m個(gè)因子無(wú)法確定或其實(shí)際意義不是很明顯, 這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義;用原指標(biāo)的線性組合來(lái)求各因子得分;綜合得分:通常以各因子的方差貢獻(xiàn)率為權(quán),由各因子的線性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù)。9.1 SPSS在因子分析中的應(yīng)用9.1.2 因子分析的SPSS操作詳解Step01:打開(kāi)主菜單選擇主菜單中的【分析】【降維】【因子

4、】命令,彈出【 因子分析】對(duì)話框,如圖所示,這是因子分析的主操作窗口。9.1 SPSS在因子分析中的應(yīng)用 Step02:選擇因子分析變量 在【因子分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行因子分析的變量將其添加至【變量】列表框中。如果要選擇參與因子分析的樣本,則需要將條件變量添加至【選擇變量】框中,并單擊變量值按鈕輸入變量值,只有滿足條件的樣本數(shù)據(jù)才能進(jìn)行后續(xù)的因子分析。Step03:選擇描述性統(tǒng)計(jì)量 單擊【描述】按鈕,彈出對(duì)話框圖所示。這里可以選擇輸出描述性統(tǒng)計(jì)量及相關(guān)矩陣等內(nèi)容 。9.1 SPSS在因子分析中的應(yīng)用Step04:選擇因子提取方法 單擊【 抽取】按鈕,彈出對(duì)話框圖9-3所示。這里可

5、以選擇提取因子的方法及相關(guān)選項(xiàng)。具體選項(xiàng)含義如下: 單擊【方法】框中的箭頭按鈕,展開(kāi)下拉列表,從中可以選擇因子提取方法: 主成份分析法:該方法假設(shè)變量是因子的純線性組合。第一成分有最大的方差,后續(xù)的成分其可解釋的方差逐個(gè)遞減;不加權(quán)最小二乘法: 加權(quán)最小二乘法; 極大似然法: 主軸因子提取法: 因子提取法: 映象因子提取法:9.1 SPSS在因子分析中的應(yīng)用 【分析】欄輸出分析矩陣: 相關(guān)系數(shù)矩陣,系統(tǒng)默認(rèn)項(xiàng): 協(xié)方差矩陣: 【輸出】欄輸出與因子提取有關(guān)的選項(xiàng): 輸出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。此項(xiàng)為系統(tǒng)默認(rèn)的輸出方式;輸出因子的碎石圖:它顯示了按特征值大小排列的因子序號(hào)。它有助于確定保留多少個(gè)因

6、子。典型的碎石圖會(huì)有一個(gè)明顯的拐點(diǎn),在該點(diǎn)之前是與大因子連接的陡峭的折線,之后是與小因子相連的緩坡折線。9.1 SPSS在因子分析中的應(yīng)用 【抽取】 欄輸出與提取結(jié)果有關(guān)的選擇項(xiàng)。由于理論上因子數(shù)目與原始變量數(shù)目相等,但因子分析的目的是用少量因子代替多個(gè)原始變量,選擇提取多少個(gè)因子是由本欄來(lái)決定。 指定提取公因子的數(shù)目:用鼠標(biāo)單擊選擇此項(xiàng)后,將指定其數(shù)目。 指定因子分析收斂的最大迭代次數(shù) 在對(duì)應(yīng)的參數(shù)框中指定因子分析收斂的最大迭代次數(shù):系統(tǒng)默認(rèn)的最大迭代次數(shù)為25。9.1 SPSS在因子分析中的應(yīng)用Step05:選擇因子旋轉(zhuǎn)方法 單擊【旋轉(zhuǎn)】按鈕,彈出下圖所示。這里可以選擇因子旋轉(zhuǎn)方法及相關(guān)選

7、項(xiàng)。具體選項(xiàng)含義如下: 9.1 SPSS在因子分析中的應(yīng)用Step06:選擇因子得分單擊【得分】按鈕,彈出對(duì)話框如下圖所示。這里可以選擇因子得分方法及相關(guān)選項(xiàng)。具體選項(xiàng)含義如下:9.1 SPSS在因子分析中的應(yīng)用Step07:其他選擇輸出單擊【選項(xiàng)】按鈕,彈出對(duì)話框圖9-6所示。這里可以選擇一些附加輸出項(xiàng)。具體選項(xiàng)含義如下:9.1 SPSS在因子分析中的應(yīng)用9.1.3 實(shí)例分析:居民消費(fèi)結(jié)構(gòu)的變動(dòng)1 實(shí)例內(nèi)容 消費(fèi)結(jié)構(gòu)是指在消費(fèi)過(guò)程中各項(xiàng)消費(fèi)支出占居民總支出的比重。它是反映居民生活消費(fèi)水平、生活質(zhì)量變化狀況以及內(nèi)在過(guò)程合理化程度的重要標(biāo)志。而消費(fèi)結(jié)構(gòu)的變動(dòng)不僅是消費(fèi)領(lǐng)域的重要問(wèn)題, 而且也關(guān)系

8、到整個(gè)國(guó)民經(jīng)濟(jì)的發(fā)展。因?yàn)楹侠淼南M(fèi)結(jié)構(gòu)及消費(fèi)結(jié)構(gòu)的升級(jí)和優(yōu)化不僅反映了消費(fèi)的層次和質(zhì)量的提高, 而且也為建立合理的產(chǎn)業(yè)結(jié)構(gòu)和產(chǎn)品結(jié)構(gòu)提供了重要的依據(jù)。 表9-1是某市居民生活費(fèi)支出費(fèi)用,具體分為食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通通訊、文教娛樂(lè)及服務(wù)、居住和雜項(xiàng)商品與服務(wù)等8個(gè)部分。請(qǐng)利用因子分析探討該市居民消費(fèi)結(jié)構(gòu),為產(chǎn)業(yè)政策的制定和宏觀經(jīng)濟(jì)的調(diào)控提供參考。9.1 SPSS在因子分析中的應(yīng)用2 實(shí)例操作 表9-1是某市居民在食品、衣著、醫(yī)療保健等八個(gè)方面的消費(fèi)數(shù)據(jù),這些指標(biāo)之間存在著不同強(qiáng)弱的相關(guān)性。如果單獨(dú)分析這些指標(biāo),無(wú)法能夠分析居民消費(fèi)結(jié)構(gòu)的特點(diǎn)。因此,可以考慮采用因子分析

9、,將這八個(gè)指標(biāo)綜合為少數(shù)幾個(gè)因子,通過(guò)這些公共因子來(lái)反映居民消費(fèi)結(jié)構(gòu)的變動(dòng)情況。9.1 SPSS在因子分析中的應(yīng)用3 實(shí)例結(jié)果及分析(1)描述性統(tǒng)計(jì)表 表9-2顯示了食品、衣著等這八個(gè)消費(fèi)支出指標(biāo)的描述統(tǒng)計(jì)量,例如均值、標(biāo)準(zhǔn)差等。這為后續(xù)的因子分析提供了一個(gè)直觀的分析結(jié)果??梢钥吹?,食品支出消費(fèi)所占的比重最大,其均值等于39.4750%,其次是文化娛樂(lè)服務(wù)支出消費(fèi)和交通通信支出消費(fèi)。所有的消費(fèi)支出中,醫(yī)療保健消費(fèi)支出占的比重最低。9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析中的應(yīng)用(2)因子分析共同度 表是因子分析的共同度,顯示了所有變量的共同度數(shù)據(jù)。第一列是因子分析初始解下的

10、變量共同度。它表明,對(duì)原有八個(gè)變量如果采用主成分分析法提取所有八個(gè)特征根,那么原有變量的所有方差都可被解釋?zhuān)兞康墓餐染鶠?(原有變量標(biāo)準(zhǔn)化后的方差為1)。 事實(shí)上,因子個(gè)數(shù)小于原有變量的個(gè)數(shù)才是因子分析的目的,所以不可能提取全部特征根。于是,第二列列出了按指定提取條件(這里為特征根大于1)提取特征根時(shí)的共同度。可以看到,所有變量的絕大部分信息(全部都大于83)可被因子解釋?zhuān)@些變量信息丟失較少。因此本次因子提取的總體效果理想。9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析中的應(yīng)用 (3)因子分析的總方差解釋 接著Spss軟件計(jì)算得到相關(guān)系數(shù)矩陣的特征值、方差貢獻(xiàn)率及累計(jì)方差貢

11、獻(xiàn)率結(jié)果如表9-4所示。在表9-4中,第一列是因子編號(hào),以后三列組成一組,組中數(shù)據(jù)項(xiàng)的含義依次是特征根、方差貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。 第一組數(shù)據(jù)項(xiàng)(第二至第四列)描述了初始因子解的情況??梢钥吹?,第一個(gè)因子的特征根值為4.316,解釋了原有8個(gè)變量總方差的53.947。前三個(gè)因子的累計(jì)方差貢獻(xiàn)率為94.196,并且只有它們的取值大于1。說(shuō)明前3個(gè)公因子基本包含了全部變量的主要信息,因此選前3個(gè)因子為主因子即可。 同時(shí),提取后的因子方差和旋轉(zhuǎn)后的因子方差部分列出了因子提取后和旋轉(zhuǎn)后的因子方差解釋情況。從表中看到,它們都支持選擇3個(gè)公共因子。9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析

12、中的應(yīng)用(4)因子碎石圖 圖9-15是因子分析的碎石圖。橫坐標(biāo)為因子數(shù)目,縱坐標(biāo)為特征根??梢钥吹?,第一個(gè)因子的特征值很高,對(duì)解釋原有變量的貢獻(xiàn)最大;第三個(gè)以后的因子特征根都較小,取值都小于1,說(shuō)明它們對(duì)解釋原有變量的貢獻(xiàn)很小,稱為可被忽略的“高山腳下的碎石”,因此提取前三個(gè)因子是合適的。9.1 SPSS在因子分析中的應(yīng)用 (5)旋轉(zhuǎn)前的因子載荷矩陣 表9-5顯示了因子載荷矩陣,它是因子分析的核心內(nèi)容。通過(guò)載荷系數(shù)大小可以分析不同公共因子所反映的主要指標(biāo)的區(qū)別。從結(jié)果看,大部分因子解釋性較好,但是仍有少部分指標(biāo)解釋能力較差,例如“食品”指標(biāo)在三個(gè)因子的載荷系數(shù)區(qū)別不大。因此接著采用因子旋轉(zhuǎn)方法

13、使得因子載荷系數(shù)向0或1兩極分化,使大的載荷更大,小的載荷更小。這樣結(jié)果更具可解釋性。9.1 SPSS在因子分析中的應(yīng)用(6)旋轉(zhuǎn)后的因子載荷矩陣 表9-6顯示了實(shí)施因子旋轉(zhuǎn)后的載荷矩陣??梢钥吹?,第一主因子在“交通和通信”和“醫(yī)療保健”等五個(gè)指標(biāo)上具有較大的載荷系數(shù),第二主因子在“居住”和“衣著”指標(biāo)上系數(shù)較大,而第三主因子在“雜項(xiàng)商品與服務(wù)”上的系數(shù)最大。此時(shí),各個(gè)因子的含義更加突出。9.1 SPSS在因子分析中的應(yīng)用 可以看出第一個(gè)公因子主要反映了交通和通信、醫(yī)療保健、文化娛樂(lè)服務(wù)、家庭設(shè)備用品及服務(wù)和食品上有較大載荷,說(shuō)明第一個(gè)公因子綜合反映這幾個(gè)方面的變動(dòng)情況,可以將其命名為第一基本

14、生活消費(fèi)因子,即享受性消費(fèi)因子。 第二個(gè)公因子在居住、衣著上的載荷系數(shù)較大,代表了這兩個(gè)方面的變動(dòng)趨勢(shì),可以將其命名為第二基本生活消費(fèi)因子,即發(fā)展性消費(fèi)因子。 第三個(gè)公因子在雜項(xiàng)商品與服務(wù)上的消費(fèi)變動(dòng)較大,因此可以將第三個(gè)公因子命名為第三基本生活消費(fèi)因子,即其他類(lèi)型消費(fèi)因子。 9.1 SPSS在因子分析中的應(yīng)用(7)因子得分系數(shù) 表9-7列出了采用回歸法估計(jì)的因子得分系數(shù)。根據(jù)表中內(nèi)容可寫(xiě)出以下因子得分函數(shù): 因子F1=-0.198X1+0.058X2-0.226X3+0.212X4+0.221X5+0.211X6+0.079X7+0.015X8; 因子F2=0.123X1+0.425X2+0

15、.200X3+0.094X4+0.008X5+0.096X6-0.498X7+0.015X8; 因子F3=0.365X1-0.059X2-0.174X3+0.069X4+0.119X5-0.077X6-0.088X7+0.779X8;9.1 SPSS在因子分析中的應(yīng)用9.1 SPSS在因子分析中的應(yīng)用9.2.1 聚類(lèi)分析的基本原理1、方法概述 聚類(lèi)分析又稱群分析,它是研究(樣品或指標(biāo))分類(lèi)問(wèn)題的一種多元統(tǒng)計(jì)方法,所謂類(lèi),通俗地說(shuō),就是指相似元素的集合。 2、聚類(lèi)分析的分類(lèi)根據(jù)分類(lèi)對(duì)象的不同可分為樣品聚類(lèi)和變量聚類(lèi)。(1)樣品聚類(lèi) 樣品聚類(lèi)在統(tǒng)計(jì)學(xué)中又稱為Q 型聚類(lèi)。用SPSS 的術(shù)語(yǔ)來(lái)說(shuō)就是對(duì)

16、事件進(jìn)行聚類(lèi),或是說(shuō)對(duì)觀測(cè)量進(jìn)行聚類(lèi)。它是根據(jù)被觀測(cè)的對(duì)象的各種特征,即反映被觀測(cè)對(duì)象的特征的各變量值進(jìn)行分類(lèi)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用(2)變量聚類(lèi) 變量聚類(lèi)在統(tǒng)計(jì)學(xué)又稱為R 型聚類(lèi)。反映同一事物特點(diǎn)的變量有很多,我們往往根據(jù)所研究的問(wèn)題選擇部分變量對(duì)事物的某一方面進(jìn)行研究。由于人類(lèi)對(duì)客觀事物的認(rèn)識(shí)是有限的,往往難以找出彼此獨(dú)立的有代表性的變量,而影響對(duì)問(wèn)題的進(jìn)一步認(rèn)識(shí)和研究。例如在回歸分析中,由于自變量的共線性導(dǎo)致偏回歸系數(shù)不能真正反映自變量對(duì)因變量的影響等。因此往往先要進(jìn)行變量聚類(lèi),找出彼此獨(dú)立且有代表性的自變量,而又不丟失大部分信息。 值得提出的是將聚類(lèi)分析和其它方法聯(lián)合起

17、來(lái)使用,如判別分析、主成分分析、回歸分析等往往效果更好。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用3、距離和相似系數(shù) 為了將樣品(或指標(biāo))進(jìn)行分類(lèi),就需要研究樣品之間關(guān)系。目前用得最多的方法有兩個(gè):一種方法是用相似系數(shù),性質(zhì)越接近的樣品,它們的相似系數(shù)的絕對(duì)值越接近1,而彼此無(wú)關(guān)的樣品,它們的相似系數(shù)的絕對(duì)值越接近于零。比較相似的樣品歸為一類(lèi),不怎么相似的樣品歸為不同的類(lèi)。另一種方法是將一個(gè)樣品看作P維空間的一個(gè)點(diǎn),并在空間定義距離,距離越近的點(diǎn)歸為一類(lèi),距離較遠(yuǎn)的點(diǎn)歸為不同的類(lèi)。但相似系數(shù)和距離有各種各樣的定義,而這些定義與變量的類(lèi)型關(guān)系極大。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 K-均值聚類(lèi)法又

18、叫快速聚類(lèi)法,可以用于大量數(shù)據(jù)進(jìn)行聚類(lèi)分析的情形。它是一種非分層的聚類(lèi)方法。這種方法占用內(nèi)存少、計(jì)算量、處理速度快,特別適合大樣本的聚類(lèi)分析。它的基本操作步驟如下: 1、指定聚類(lèi)數(shù)目k,應(yīng)由用戶指定需要聚成多少類(lèi),最終也只能輸出關(guān)于它的唯一解。這點(diǎn)不同于層次聚類(lèi)。 2、確定k個(gè)初始類(lèi)的中心。兩種方式:一種是用戶指定方式,二是根據(jù)數(shù)據(jù)本身結(jié)構(gòu)的中心初步確定每個(gè)類(lèi)別的原始中心點(diǎn)。 3、根據(jù)距離最近原則進(jìn)行分類(lèi)。逐一計(jì)算每一記錄到各個(gè)中心點(diǎn)的距離,把各個(gè)記錄按照距離最近的原則歸入各個(gè)類(lèi)別,并計(jì)算新形成類(lèi)別的中心點(diǎn) 4、按照新的中心位置,重新計(jì)算每一記錄距離新的類(lèi)別中心點(diǎn)的距離,并重新進(jìn)行歸類(lèi)。 5、

19、重復(fù)步驟4,直到達(dá)到一定的收斂標(biāo)準(zhǔn)。 這種方法也常稱為逐步聚類(lèi)分析,即先把被聚對(duì)象進(jìn)行初始分類(lèi),然后逐步調(diào)整,得到最終分類(lèi)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2.2 快速聚類(lèi)SPSS操作詳解Step01:打開(kāi)主菜單 選擇主菜單中的【分析】【分類(lèi)】【K均值聚類(lèi)】命令,彈出【K均值聚類(lèi)分析】對(duì)話框,如圖所示,這是快速聚類(lèi)分析的主操作窗口。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 Step02:選擇聚類(lèi)分析變量 在【K均值聚類(lèi)分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行聚類(lèi)分析的變量將其添加至【變量】列表框中。同時(shí)可以選擇一個(gè)標(biāo)識(shí)變量移入【個(gè)案標(biāo)記依據(jù)】框中。Step03:確定分類(lèi)個(gè)數(shù) 【聚類(lèi)數(shù)】框中,可

20、以輸入確定的聚類(lèi)分析數(shù)目,用戶可以根據(jù)需要自行修改調(diào)整。系統(tǒng)默認(rèn)的聚類(lèi)數(shù)為2.Step04:選擇聚類(lèi)方法 主對(duì)話框中的【方法】欄中可以選擇聚類(lèi)方法。系統(tǒng)默認(rèn)值是【迭代與分類(lèi)】項(xiàng)。 選擇初始類(lèi)中心:在迭代過(guò)程中不斷更新聚類(lèi)中心。把觀測(cè)量分派到與之最近的以類(lèi)中心為標(biāo)志的類(lèi)中去。 只使用初始類(lèi)中心對(duì)觀測(cè)量進(jìn)行分類(lèi),聚類(lèi)中心始終不變。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step05:聚類(lèi)中心的輸入與輸出 在主對(duì)話框圖中,【聚類(lèi)中心】欄表示輸入和輸出聚類(lèi)中心的對(duì)話框。用戶可以指定外部文件或數(shù)據(jù)集作為初始聚類(lèi)中心點(diǎn),也可以將聚類(lèi)分析的聚類(lèi)中心結(jié)果輸出到指定文件或數(shù)據(jù)集中。 要求使用指定數(shù)據(jù)文件中的觀測(cè)量或

21、建立數(shù)據(jù)集作為初始類(lèi)中心。 要求把聚類(lèi)結(jié)果中的各類(lèi)中心數(shù)據(jù)保存到指定的文件或數(shù)據(jù)集中。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用在主對(duì)話框中單擊【迭代】按鈕,打開(kāi)設(shè)置迭代參數(shù)的對(duì)話框圖,這里可以進(jìn)一步選擇迭代參數(shù)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step07:輸出聚類(lèi)結(jié)果在主對(duì)話框中單擊【保存】按鈕,彈出【保存新變量】對(duì)話框,它用于選擇保存新變量,見(jiàn)圖 聚類(lèi)成員:在當(dāng)前數(shù)據(jù)文件中建立一個(gè)名為“qcl_1”新變量。其值表示聚類(lèi)結(jié)果,即各觀測(cè)量被分配到哪一類(lèi)。它的取值為1、2、3的序號(hào)。 與聚類(lèi)中心的距離:在當(dāng)前數(shù)據(jù)文件中建立一個(gè)名為“qcl_2”新變量。其值為各觀測(cè)量與所屬類(lèi)中心之間的歐氏距離。9

22、.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step08:其他選項(xiàng)輸出在主對(duì)話框中單擊【選項(xiàng)】按鈕,彈出【選項(xiàng)】對(duì)話框,它用于指定要計(jì)算的統(tǒng)計(jì)量和對(duì)帶有缺失值的觀測(cè)量的處理方式。具體見(jiàn)圖 :【統(tǒng)計(jì)量】欄選擇輸出統(tǒng)計(jì)量 初始聚類(lèi)中心: 方差分析表:顯示每個(gè)觀測(cè)量的聚類(lèi)信息:【缺失值】欄中選擇處理缺失值方法 按列表排除個(gè)案:分析變量中帶有缺失值的觀測(cè)量都不參與后續(xù)分析; 按對(duì)排除個(gè)案:成對(duì)剔除帶有缺失值的觀測(cè)量。Step09:?jiǎn)螕舸_定按鈕,結(jié)束操作,SPSS軟件自動(dòng)輸出結(jié)果。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2.4 系統(tǒng)聚類(lèi)法的SPSS操作詳解SPSS具體操作步驟如下:Step01:打開(kāi)主菜單 選擇主

23、菜單中的【分析】【分類(lèi)】【系統(tǒng)聚類(lèi)】命令,彈出【系統(tǒng)聚類(lèi)分析】對(duì)話框,如圖所示,這是系統(tǒng)聚類(lèi)分析的主操作窗口。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 Step02:選擇聚類(lèi)分析變量在【系統(tǒng)聚類(lèi)分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行系統(tǒng)聚類(lèi)分析的變量將其添加至【變量】列表框中。同時(shí)可以選擇一個(gè)標(biāo)識(shí)變量移入【標(biāo)注個(gè)案】框中。Step03:選擇聚類(lèi)類(lèi)型 主對(duì)話框中的【分群】欄中可以選擇聚類(lèi)類(lèi)型。系統(tǒng)默認(rèn)值是【個(gè)案】項(xiàng)。 個(gè)案:對(duì)觀測(cè)量(樣品)進(jìn)行聚類(lèi),即Q型聚類(lèi)。 變量:對(duì)變量進(jìn)行聚類(lèi),即R型聚類(lèi)。Step04:選擇輸出類(lèi)型 主對(duì)話框中的【輸出】欄中可以選擇輸出類(lèi)型。系統(tǒng)默認(rèn)值是【統(tǒng)計(jì)量)】歐諾供給量和

24、【圖】項(xiàng)。 統(tǒng)計(jì)量:輸出主對(duì)話框統(tǒng)計(jì)量按鈕中設(shè)置的的統(tǒng)計(jì)量。圖:輸出主對(duì)話框中圖按鈕中聚類(lèi)圖形。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step05:基本統(tǒng)計(jì)量輸出選擇 單擊【統(tǒng)計(jì)量】按鈕,彈出對(duì)話框圖示。這里可以選擇進(jìn)行系統(tǒng)聚類(lèi)分析的基本統(tǒng)計(jì)量。具體選項(xiàng)含義如下:9.2 SPSS 在聚類(lèi)分析中的應(yīng)用【合并進(jìn)程表】:輸出聚類(lèi)過(guò)程表,系統(tǒng)默認(rèn)選項(xiàng)。顯示聚類(lèi)過(guò)程中每一步合并的類(lèi)或觀測(cè)量,反映聚類(lèi)過(guò)程中每一步樣品或類(lèi)的合并過(guò)程?!鞠嗨菩跃仃嚒浚狠敵龈黝?lèi)之間的距離矩陣。以矩陣形式給出各項(xiàng)之間的距離或相似性測(cè)度值。產(chǎn)生什么類(lèi)型的矩陣(相似性矩陣或不相似性矩陣)取決于在【方法】菜單中【度量標(biāo)準(zhǔn)】欄中的選擇?!?/p>

25、聚類(lèi)成員】欄可以選擇聚類(lèi)數(shù)目相關(guān)的輸出項(xiàng): 【無(wú)】:不顯示類(lèi)成員表,它是系統(tǒng)默認(rèn)選項(xiàng)。 【單一方案】:選擇此項(xiàng)并在對(duì)應(yīng)的【聚類(lèi)數(shù)】參數(shù)框中指定分類(lèi)數(shù),這里要求分類(lèi)數(shù)是一個(gè)大于1的整數(shù)。例如指輸入數(shù)字“4”,則會(huì)在輸出窗中顯示聚為4類(lèi)的分析結(jié)果。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 【方案范圍】:選擇此選項(xiàng)并在下邊的【最小聚類(lèi)數(shù)】和【最大聚類(lèi)數(shù)】參數(shù)框中輸入最小聚類(lèi)數(shù)目和最大聚類(lèi)數(shù)目。它表示分別輸出樣品或變量的分類(lèi)數(shù)從最小值到最大值的各種分類(lèi)聚類(lèi)表。輸入的兩個(gè)數(shù)值必須是不等于l 的正整數(shù),最大類(lèi)數(shù)值不能大于參與聚類(lèi)的樣品數(shù)或變量總數(shù)。Step06:聚類(lèi)統(tǒng)計(jì)圖形輸出選擇 單擊【繪制】按鈕,彈出對(duì)話

26、框圖所示。這里可以選擇進(jìn)行系統(tǒng)聚類(lèi)分析的統(tǒng)計(jì)圖形??蛇x擇輸出的統(tǒng)計(jì)圖表有兩種,一個(gè)是樹(shù)形圖,一個(gè)是冰柱圖。具體選項(xiàng)含義如下:9.2 SPSS 在聚類(lèi)分析中的應(yīng)用【樹(shù)狀圖】:顯示樹(shù)形圖;【冰柱】:顯示冰柱圖形。對(duì)于冰柱圖的具體選項(xiàng)還可以進(jìn)一步用以下選擇項(xiàng)來(lái)確定: 所有聚類(lèi):顯示全部聚類(lèi)結(jié)果的冰柱圖??捎么朔N圖查看聚類(lèi)的全過(guò)程。但如果參與聚類(lèi)的個(gè)體很多會(huì)造成圖形過(guò)大。 聚類(lèi)的指定全距:限定顯示的聚類(lèi)范圍。當(dāng)選擇此項(xiàng)時(shí),在下面的【開(kāi)始聚類(lèi)】、【停止聚類(lèi)】和【排序標(biāo)準(zhǔn)】后的參數(shù)框中輸入要求顯示聚類(lèi)過(guò)程的開(kāi)始聚類(lèi)數(shù)、終止聚類(lèi)數(shù)及步長(zhǎng)。輸入到參數(shù)框中的數(shù)字必須是正整數(shù)。例如,輸入的結(jié)果是:3,9,2,生成

27、的冰柱圖從第三步開(kāi)始,顯示第三、五、七、九步聚類(lèi)的情況。 無(wú):不輸出冰校圖。同時(shí),冰柱圖顯示方向可以在【方向】欄中確定:垂直:縱向顯示的冰柱圖。 水平:橫向顯示的冰柱圖。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step07:聚類(lèi)方法選擇單擊【方法】按鈕,彈出對(duì)話框圖所示。在對(duì)話框中可以設(shè)定聚類(lèi)方法、距離測(cè)度的方法、數(shù)值變換方法等內(nèi)容。具體選項(xiàng)含義如下:9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step08:聚類(lèi)結(jié)果保存選擇 單擊【保存】按鈕,彈出對(duì)話框圖所示。在該對(duì)話框中可以將聚類(lèi)結(jié)果用新變量保存在當(dāng)前工作數(shù)據(jù)文件中。具體選項(xiàng)含義如下:9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 無(wú):不建立新變量。 單一方案:

28、單個(gè)結(jié)果輸出。生成一個(gè)新變量,表明每個(gè)樣品在聚類(lèi)之后所屬的類(lèi)。在【聚類(lèi)數(shù)】的矩形框中指定類(lèi)數(shù)。 方案范圍:選擇此選項(xiàng)并在下邊的【最小聚類(lèi)數(shù)】和【最大聚類(lèi)數(shù)】參數(shù)框中輸入最小聚類(lèi)數(shù)目和最大聚類(lèi)數(shù)目。它表示分別生成樣品或變量的分類(lèi)數(shù)從最小值到最大值的各種分類(lèi)聚類(lèi)變量。例如輸入結(jié)果是“4”和“6”時(shí),它表示在聚類(lèi)結(jié)束后在原變量后面增加了3 個(gè)新變量分別表明分為4 類(lèi)時(shí)、分為5 類(lèi)時(shí)和分為6 類(lèi)時(shí)的聚類(lèi)結(jié)果。即聚為4、5、6 類(lèi)時(shí)各樣品分別屬于哪一類(lèi)。Step09:?jiǎn)螕簟敬_定】按鈕,結(jié)束操作,SPSS軟件自動(dòng)輸出結(jié)果。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2.5 實(shí)例分析:商業(yè)銀行綜合競(jìng)爭(zhēng)力的評(píng)價(jià)1

29、 實(shí)例內(nèi)容 要研究我國(guó)主要商業(yè)銀行的綜合競(jìng)爭(zhēng)力,收集的數(shù)據(jù)如表9-16所示。這里不僅選取了中國(guó)工商銀行、中國(guó)建設(shè)銀行等大型國(guó)有商業(yè)銀行,也包括了招商銀行、民生銀行等股份制商業(yè)銀行。描述這些商業(yè)銀行的綜合競(jìng)爭(zhēng)力指標(biāo)主要有以下10個(gè)。X1:人均凈利潤(rùn),人均創(chuàng)造的凈利潤(rùn)。X2:凈利潤(rùn)率,反映公司獲取利潤(rùn)能力的一項(xiàng)關(guān)鍵指標(biāo)。X3:資產(chǎn)回報(bào)率,用來(lái)衡量每單位資產(chǎn)創(chuàng)造多少凈利潤(rùn)的指標(biāo)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2 SPSS 在聚類(lèi)分析中的應(yīng)用X4:核心資本充足率,核心資本與加權(quán)風(fēng)險(xiǎn)資產(chǎn)總額的比率。X5:人均費(fèi)用額,人均消耗的管理費(fèi)用。X6:資產(chǎn)負(fù)債率,公司年末的負(fù)債總額同資產(chǎn)總額的比率。X7

30、:股東權(quán)益乘數(shù),資產(chǎn)總額相當(dāng)于股東權(quán)益的倍數(shù)。X8:不良貸款比率,金融機(jī)構(gòu)不良貸款占總貸款余額的比重。X9:存款市場(chǎng)份額,存款業(yè)務(wù)量在全部銀行存款業(yè)務(wù)量中所占的比重。X10:貸款市場(chǎng)份額,貸款業(yè)務(wù)量在全部銀行貸款業(yè)務(wù)量中所占的比重。2 實(shí)例操作 現(xiàn)在要分析我國(guó)主要商業(yè)銀行的綜合競(jìng)爭(zhēng)力,案例中選擇了“人均凈利潤(rùn)”、“凈利潤(rùn)率”、“資產(chǎn)回報(bào)率”等十個(gè)指標(biāo)來(lái)反映這些銀行的綜合發(fā)展能力。這個(gè)問(wèn)題也屬于典型的多元分析問(wèn)題,需要利用多個(gè)指標(biāo)來(lái)分析不同國(guó)商業(yè)銀行之間綜合競(jìng)爭(zhēng)發(fā)展能力的差異,因此可以利用系統(tǒng)聚類(lèi)法,具體操作步驟如下。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Ste

31、p01:打開(kāi)隨書(shū)光盤(pán)中的數(shù)據(jù)文件9-3.sav,選擇菜單欄中的【分析】【分類(lèi)】【系統(tǒng)聚類(lèi)】命令,彈出【系統(tǒng)聚類(lèi)分析】對(duì)話框。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step02:在左側(cè)的候選變量列表框中將X1、X2、X10變量設(shè)定為聚類(lèi)分析變量,將其添加至【變量】列表框中,將Y變量設(shè)定為指示變量,將其添加至【標(biāo)注個(gè)案】列表框中,如圖9-28所示。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step03:單擊【統(tǒng)計(jì)量】按鈕,彈出【系統(tǒng)聚類(lèi)分析:統(tǒng)計(jì)量】對(duì)話框;點(diǎn)選【單一方案】單選鈕,并在對(duì)應(yīng)的【聚類(lèi)數(shù)】文本框中輸入數(shù)字“3”,表示輸出窗中顯示聚為三類(lèi)分析結(jié)果,其他選項(xiàng)保持系統(tǒng)默認(rèn)設(shè)置,如圖9-29所示,單擊

32、【繼續(xù)】按鈕,返回【系統(tǒng)聚類(lèi)分析】對(duì)話框。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step04:擊【繪制】按鈕,彈出【系統(tǒng)聚類(lèi)分析:圖】對(duì)話框;勾選【樹(shù)狀圖】復(fù)選框,表示輸出樣品的聚類(lèi)樹(shù)形圖,如圖9-30所示;其他選項(xiàng)保持系統(tǒng)默認(rèn)設(shè)置,單擊【繼續(xù)】按鈕返回【系統(tǒng)聚類(lèi)分析】對(duì)話框。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用Step05:單擊【方法】按鈕,彈出【系統(tǒng)聚類(lèi)分析:方法】對(duì)話框;在【轉(zhuǎn)換值】選項(xiàng)組的【標(biāo)準(zhǔn)】下拉列表框中選擇【Z得分】標(biāo)準(zhǔn)化方法,其他選項(xiàng)保持系統(tǒng)默認(rèn)設(shè)置,如圖9-31所示,單擊【繼續(xù)】按鈕返回【系統(tǒng)聚類(lèi)分析】對(duì)話框,單擊【確定】按鈕完成操作。3 實(shí)例結(jié)果及分析(1)聚類(lèi)過(guò)程表 SPS

33、S軟件首先給出了進(jìn)行系統(tǒng)聚類(lèi)分析過(guò)程表,如表9-17所示。第一列列出了聚類(lèi)過(guò)程的步驟號(hào),第二列和第三列列出了某一步驟中哪些國(guó)家和地區(qū)參與了合并。例如從結(jié)果中看出,在第一步中,第九個(gè)樣品(民生銀行)和第十個(gè)樣品(招商銀行)首先被合并在一起。第四列列出了每一步驟的聚類(lèi)系數(shù),這一數(shù)值表示被合并的兩個(gè)類(lèi)別之間的距離大?。坏谖辶泻偷诹斜硎緟⑴c合并的國(guó)家和地區(qū)(類(lèi)別)是在第幾步中第一次出現(xiàn),0代表該記錄是第一次出現(xiàn)在聚類(lèi)過(guò)程中;第七列表示在這一步驟中合并的類(lèi)別,下一次將在第幾步中與其他類(lèi)再進(jìn)行合并。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.2 SPSS 在聚類(lèi)分析中的應(yīng)用(2)聚類(lèi)分析結(jié)果表 表9-18顯

34、示了系統(tǒng)聚類(lèi)法的聚類(lèi)結(jié)果??梢钥吹骄垲?lèi)結(jié)果分為兩大類(lèi):第類(lèi):民生銀行、招商銀行、中信銀行。第類(lèi):交通銀行、深發(fā)銀行、光大銀行、浦發(fā)銀行。第類(lèi):工商銀行、建設(shè)銀行、中國(guó)銀行。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用 (3)樹(shù)形圖 表9-18已給出了相關(guān)聚類(lèi)結(jié)果,最后用樹(shù)形圖直觀反映整個(gè)聚類(lèi)過(guò)程和結(jié)果,如圖9-32所示。從圖中可以明顯看到每個(gè)樣品從單獨(dú)一類(lèi)逐次合并,一直到全部合并成一大類(lèi)。9.2 SPSS 在聚類(lèi)分析中的應(yīng)用9.3.1 判別分析的基本原理1、方法概述 判別分析是判別樣品所屬類(lèi)型的一種統(tǒng)計(jì)方法,其應(yīng)用之廣可與回歸分析媲美。 判別分析與聚類(lèi)分析不同。判別分析是在已知研究對(duì)象分成若干類(lèi)型(或

35、組別)并已取得各種類(lèi)型的一批已知樣品的觀測(cè)數(shù)據(jù),在此基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式,然后對(duì)未知類(lèi)型的樣品進(jìn)行判別分類(lèi)。2、基本原理 判別分析內(nèi)容很豐富,方法很多。判別分析按判別的組數(shù)來(lái)區(qū)分,有兩組判別分析和多組判別分析;按區(qū)分不同總體的所用的數(shù)學(xué)模型來(lái)分,有線性判別和非線性判別;按判別時(shí)所處理的變量方法不同,有逐步判別和序貫判別等。 其中,距離判別分析是一種常見(jiàn)的判別分析方法。它的基本思想是:首先根據(jù)已知分類(lèi)的數(shù)據(jù),分別計(jì)算各類(lèi)的重心即分組(類(lèi))的均值,判別準(zhǔn)則是對(duì)任給的一次觀測(cè),若它與第i類(lèi)的重心距離最近,就認(rèn)為它來(lái)自第i類(lèi)。9.3 SPSS 在判別分析中的應(yīng)用例如兩個(gè)總體的距離判別法中,設(shè)有

36、兩個(gè)總體(或稱兩類(lèi))G1、G2,從第一個(gè)總體中抽取n1個(gè)樣品,從第二個(gè)總體中抽取n2個(gè)樣品,每個(gè)樣品測(cè)量p個(gè)指標(biāo)如下頁(yè)表。今任取一個(gè)樣品,實(shí)測(cè)指標(biāo)值為 ,問(wèn)X應(yīng)判歸為哪一類(lèi)?首先計(jì)算X到G1、G2總體的距離,分別記為 和 ,按距離最近準(zhǔn)則判別歸類(lèi),則可寫(xiě)成:然后比較 和 大小,按距離最近準(zhǔn)則判別歸類(lèi) 1( ,)pXxx 1(,)D X G1(,)D X G2(,)D X G2(,)DXG11221212,(,)(,),(,)(,), (,)(,)XGD X GD X GXGD X GD X GD X GD X G當(dāng)當(dāng)待判當(dāng)9.3 SPSS 在判別分析中的應(yīng)用9.3.2 判別分析的SPSS操作詳

37、解Step01:打開(kāi)主菜單選擇主菜單中的【分析】【分類(lèi)】【辨別】命令,彈出【 辨別分析】對(duì)話框,如圖所示,這是判別分析的主操作窗口。9.3 SPSS 在判別分析中的應(yīng)用 Step02:選擇判別分析變量 在【辨別分析】對(duì)話框左側(cè)的候選變量中選擇進(jìn)行判別分析的變量將其添加至【自變量】列表框中,將其作為自變量。Step03:指定分類(lèi)變量及范圍在主對(duì)話框的候選變量中選擇分類(lèi)變量(離散型變量)移入【分組變量】框中。此時(shí)它下面的【定義范圍】按鈕加亮,按該按鈕,屏幕彈出一個(gè)小對(duì)話框,提供指定該分類(lèi)變量的數(shù)值范圍,如圖所示。 其中, 輸入最小值: 輸入最大值 :9.3 SPSS 在判別分析中的應(yīng)用Step04

38、:選擇判別分析方法 在主對(duì)話框【自變量】列表框下面有兩個(gè)按鈕,它們提供了判別分析方法選擇: 一起輸入自變量:建立所選擇的所有變量的判別式。當(dāng)認(rèn)為所有自變量都能對(duì)觀測(cè)量特性提供豐富的信息時(shí)使用該選擇項(xiàng)。系統(tǒng)默認(rèn)設(shè)置。 使用步進(jìn)式方法:采用逐步判別法作判別分析。點(diǎn)選該項(xiàng)后,主菜單中的【方法】按鈕加亮??梢赃M(jìn)一步選擇判別分析方法(見(jiàn)第 步)。如果希望使用一部分觀測(cè)量進(jìn)行判別函數(shù)的推導(dǎo),選擇一個(gè)能夠標(biāo)記需選擇的這部分觀測(cè)量的變量將其移入【選擇變量】框中;再單擊其右側(cè)的Valve按鈕,展開(kāi)【設(shè)置值】對(duì)話框,鍵入能標(biāo)記的變量值,如圖所示。9.3 SPSS 在判別分析中的應(yīng)用Step05:基本統(tǒng)計(jì)量輸出選擇

39、 單擊【統(tǒng)計(jì)量】按鈕,彈出對(duì)話框圖所示。這里可以選擇進(jìn)行判別分析的基本統(tǒng)計(jì)量輸出。具體選項(xiàng)含義如下:9.3 SPSS 在判別分析中的應(yīng)用【描述性】欄選擇輸出描述統(tǒng)計(jì)量:均值:輸出各類(lèi)中各自變量的均值、標(biāo)準(zhǔn)差和各自變量總樣本的均值、標(biāo)準(zhǔn)差。 單變量 ANOVAs:?jiǎn)我蛩胤讲罘治?。?duì)各類(lèi)中同一自變量進(jìn)行均值檢驗(yàn),輸出單因素方差分析結(jié)果。 Boxs M:對(duì)各類(lèi)協(xié)方差矩陣相等的假設(shè)進(jìn)行檢驗(yàn)?!竞瘮?shù)系數(shù)】欄選擇輸出判別函數(shù)的系數(shù)Fishers:輸出Fisher函數(shù)系數(shù)。對(duì)每一類(lèi)給出一組系數(shù),并給出該組中判別分?jǐn)?shù)最大的觀測(cè)量。未標(biāo)準(zhǔn)化:未經(jīng)標(biāo)準(zhǔn)化處理的判別函數(shù)系數(shù)?!揪仃嚒繖谶x擇輸出自變量的系數(shù)矩陣類(lèi)內(nèi)相

40、關(guān)矩陣: 類(lèi)內(nèi)協(xié)方差矩陣: 對(duì)每一類(lèi)分別輸出協(xié)方差矩陣:總樣本的協(xié)方差矩陣:9.3 SPSS 在判別分析中的應(yīng)用Step06:設(shè)置逐步判別分析選項(xiàng) 點(diǎn)選【使用步進(jìn)式方法】后,就表示采用逐步判別法進(jìn)行分析。接著單擊主菜單中的【統(tǒng)計(jì)量】按鈕,彈出對(duì)話框圖所示。這里可以選擇逐步判別分析的選項(xiàng)。具體選項(xiàng)含義如下:9.3 SPSS 在判別分析中的應(yīng)用【方法】欄選擇變量進(jìn)入判別函數(shù)的方式: Wilks lambda:每步都選擇Wilk 的統(tǒng)計(jì)量最小的變量進(jìn)入判別函數(shù)。 未解釋方案:每步都選擇使類(lèi)間不可解釋的方差和最小的變量進(jìn)入判別函數(shù)。 Mahalanobis 距離:每步都選擇使靠得最近的兩類(lèi)間的Maha

41、lanobis 距離最大的變量進(jìn)入判別函數(shù)。 最小 F 值:每步都選擇使任何兩類(lèi)間的“最小F 值”達(dá)到最大的變量進(jìn)入判別函數(shù)。 Raos V:每步都選擇使Raos V 統(tǒng)計(jì)量產(chǎn)生最大增量的變量進(jìn)入判別函數(shù)。選擇此種方法后,應(yīng)該在該項(xiàng)下面的V-to-enter 后的參數(shù)框中輸入這個(gè)增量的指定值。當(dāng)某變量導(dǎo)致的V 值增量大于指定值的變量時(shí),該變量進(jìn)入判別函數(shù)。9.3 SPSS 在判別分析中的應(yīng)用【標(biāo)準(zhǔn)】欄選擇逐步判別停止的條件:使用 F 值:使用F 值,系統(tǒng)默認(rèn)選項(xiàng),當(dāng)加入一個(gè)變量(或剔除一個(gè)變量)后,對(duì)在判別函數(shù)中的變量進(jìn)行方差分析。當(dāng)計(jì)算的F 值大于指定的Entry 值時(shí),該變量保留在函數(shù)中。

42、默認(rèn)值是Entry 為3.84。當(dāng)該變量使計(jì)算的F 值小于指定的Removal 值時(shí),該變量從函數(shù)中剔除。默認(rèn)值是Removal 為2.71。設(shè)置這兩個(gè)值時(shí)應(yīng)該要求Entry 值大于Removal 值。使用F的概率:使用F 檢驗(yàn)的概率決定變量是否加入函數(shù)或被剔除。當(dāng)計(jì)算的F 檢驗(yàn)的概率小于指定的Entry 值時(shí),該變量加入函數(shù)中。當(dāng)該變量使計(jì)算的F 值的概率大于指定的Removal 值時(shí),該變量從函數(shù)中剔除。【輸出】欄選擇逐步選擇變量的過(guò)程和最后結(jié)果的顯示:步進(jìn)摘要:顯示每步選擇變量之后各變量的統(tǒng)計(jì)量結(jié)果。 兩兩組間距離的F值:顯示兩類(lèi)之間的F 比值矩陣。9.3 SPSS 在判別分析中的應(yīng)用S

43、tep07:設(shè)置分類(lèi)參數(shù)與判別結(jié)果 單擊【分類(lèi)】按鈕,彈出對(duì)話框圖所示。這里可以設(shè)置判別分析的分類(lèi)參數(shù)及結(jié)果。具體選項(xiàng)含義如下:9.3 SPSS 在判別分析中的應(yīng)用【先驗(yàn)概率】欄選擇先驗(yàn)概率: 各類(lèi)先驗(yàn)概率相等:系統(tǒng)默認(rèn)選項(xiàng)。若分為m 類(lèi),則各類(lèi)先驗(yàn)概率均為lm。 基于各類(lèi)樣本量占總樣本量的比例計(jì)算先驗(yàn)概率?!臼褂脜f(xié)方差矩陣】欄選擇分類(lèi)使用的協(xié)方差矩陣:使用合并組內(nèi)協(xié)方差矩陣進(jìn)行分類(lèi)。使用各組協(xié)方差矩陣進(jìn)行分類(lèi)?!据敵觥繖谶x擇輸出分類(lèi)結(jié)果:輸出每個(gè)觀測(cè)量的判別分?jǐn)?shù)、實(shí)際類(lèi)、預(yù)測(cè)類(lèi)(根據(jù)判別函數(shù)求得的分類(lèi)結(jié)果)和后驗(yàn)概率等。選擇此項(xiàng)后,下面的【將個(gè)案限制在前】項(xiàng)被激活,可以在它后面的文本框中輸入

44、觀測(cè)量數(shù)n。選擇此項(xiàng)則僅輸出前n 個(gè)觀測(cè)量。輸出分類(lèi)的小結(jié)表:輸出對(duì)每一個(gè)觀測(cè)量進(jìn)行分類(lèi)的結(jié)果,所依據(jù)的判別函數(shù)是由除該觀測(cè)量以外的其他觀測(cè)量導(dǎo)出的。9.3 SPSS 在判別分析中的應(yīng)用【圖】欄選擇輸出統(tǒng)計(jì)圖:生成全部類(lèi)的散點(diǎn)圖:該圖是根據(jù)前兩個(gè)判別函數(shù)值作的散點(diǎn)圖。如果只有一個(gè)判別函數(shù),就輸出直方圖。對(duì)每一類(lèi)生成一張散點(diǎn)圖:如果只有一個(gè)判別函數(shù),就輸出直方圖。生成根據(jù)判別函數(shù)值將觀測(cè)量分到各類(lèi)去的邊界圖:每一類(lèi)占據(jù)一個(gè)區(qū)域。各類(lèi)均值在各區(qū)中用星號(hào)標(biāo)出。如果僅有一個(gè)判別函數(shù),則不作此圖。 缺失值處理方式: 用該變量的均值代替缺失值:9.3 SPSS 在判別分析中的應(yīng)用Step08:結(jié)果保存設(shè)置

45、 單擊【保存】按鈕,彈出對(duì)話框圖所示。這里可以設(shè)置判別分析的結(jié)果輸出。具體選項(xiàng)含義如下:9.3 SPSS 在判別分析中的應(yīng)用 建立新變量(系統(tǒng)默認(rèn)變量名是dis_1)保存預(yù)測(cè)觀測(cè)量所屬類(lèi)的值。 建立新變量保持判別分?jǐn)?shù):建立新變量保存各個(gè)觀測(cè)量屬于各類(lèi)的概率值。有m 類(lèi),對(duì)一個(gè)觀測(cè)量就會(huì)給出m 個(gè)概率值,因此建立m 個(gè)新變量。9.3 SPSS 在判別分析中的應(yīng)用Step09 相關(guān)統(tǒng)計(jì)量的Bootstrap估計(jì) 單擊【Bootstrap】按鈕,彈出如圖9-45所示對(duì)話框,在此可以進(jìn)行如下統(tǒng)計(jì)量的Bootstrap估計(jì)。 標(biāo)準(zhǔn)化典則判別函數(shù)系數(shù)表支持標(biāo)準(zhǔn)化系數(shù)的bootstrap 估計(jì)。 典則判別函

46、數(shù)系數(shù)表支持非標(biāo)準(zhǔn)化系數(shù)的bootstrap 估計(jì)。 分類(lèi)函數(shù)系數(shù)表支持系數(shù)的bootstrap 估計(jì)。Step10:?jiǎn)螕舸_定按鈕,結(jié)束操作,SPSS軟件自動(dòng)輸出結(jié)果。9.3 SPSS 在判別分析中的應(yīng)用9.3.3 實(shí)例分析:全國(guó)30個(gè)省市經(jīng)濟(jì)增長(zhǎng)差異研究1 實(shí)例內(nèi)容 現(xiàn)要研究全國(guó)30個(gè)省市地區(qū)經(jīng)濟(jì)增長(zhǎng)差異性,收集相關(guān)數(shù)據(jù)見(jiàn)表9-19所示。表中相關(guān)變量的含義分別是:x1經(jīng)濟(jì)增長(zhǎng)率(%)、x2非國(guó)有化水平(%)、x3開(kāi)放度(%)、x4市場(chǎng)化程度(%)。其中,遼寧、河北等省市歸為一類(lèi),而黑龍江、吉林等省市歸為另一類(lèi)。請(qǐng)分析江蘇、安徽和浙江的類(lèi)別 9.3 SPSS 在判別分析中的應(yīng)用2 實(shí)例操作 由

47、于案例中已經(jīng)將北京、上海、四川等省市按照經(jīng)濟(jì)增長(zhǎng)特點(diǎn)分類(lèi),現(xiàn)在需要將另外三個(gè)待估省市:江蘇、安徽和陜西分類(lèi)。因此,可以利用判別分析來(lái)判別它們的歸屬。9.3 SPSS 在判別分析中的應(yīng)用3 實(shí)例結(jié)果及分析(1)判別分析概述表SPSS軟件首先給出了進(jìn)行判別分析的概述表9-20??梢钥吹?,參加分析的變量總數(shù)為30,有效觀測(cè)量數(shù)為27,占90%;包含缺失值或分類(lèi)變量范圍之外的觀測(cè)量數(shù)為3,占10%。9.3 SPSS 在判別分析中的應(yīng)用 (2)分組統(tǒng)計(jì)表 表9-21給出了觀測(cè)量按照類(lèi)別不同進(jìn)行的基本描述性統(tǒng)計(jì)量輸出,其中包括均值、均方差和有效觀測(cè)量的個(gè)數(shù)等??梢詮慕Y(jié)果初步看到,不同類(lèi)之間省市經(jīng)濟(jì)指標(biāo)的差異比較明顯,例如第一類(lèi)省份的“非國(guó)有化水平”指標(biāo)均值等于65.0282,而第

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論