地理數(shù)學(xué)方法判別分析_第1頁(yè)
地理數(shù)學(xué)方法判別分析_第2頁(yè)
地理數(shù)學(xué)方法判別分析_第3頁(yè)
地理數(shù)學(xué)方法判別分析_第4頁(yè)
地理數(shù)學(xué)方法判別分析_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

地理數(shù)學(xué)方法判別分析第1頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月判別分析§1.基本原理§2.基本操作§3.選項(xiàng)設(shè)置§4.實(shí)例分析第2頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月§1.基本原理

定義:判別分析是先根據(jù)已知類(lèi)別的事物的性質(zhì)(自變量),建立函數(shù)式(自變量的線(xiàn)性組合,即判別函數(shù)),然后對(duì)未知類(lèi)別的新事物進(jìn)行判斷以將之歸入已知的類(lèi)別中。第3頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月判別分析有如下的假定:預(yù)測(cè)變量服從正態(tài)分布。預(yù)測(cè)變量之間沒(méi)有顯著的相關(guān)。預(yù)測(cè)變量的平均值和方差不相關(guān)。預(yù)測(cè)變量應(yīng)是連續(xù)變量,因變量(類(lèi)別或組別)是間斷變量。兩個(gè)預(yù)測(cè)變量之間的相關(guān)性在不同類(lèi)中是一樣的。第4頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

在分析的各個(gè)階段應(yīng)把握如下的原則:事前組別(類(lèi))的分類(lèi)標(biāo)準(zhǔn)(作為判別分析的因變量)要盡可能準(zhǔn)確和可靠,否則會(huì)影響判別函數(shù)的準(zhǔn)確性,從而影響判別分析的效果。所分析的自變量應(yīng)是因變量的重要影響因素,應(yīng)該挑選既有重要特性又有區(qū)別能力的變量,達(dá)到以最少變量而有高辨別能力的目標(biāo)。初始分析的數(shù)目不能太少。第5頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月判別分析是一種有效的對(duì)個(gè)案進(jìn)行分類(lèi)分析的方法,組別的特征已知。如銀行為了對(duì)貸款進(jìn)行管理,需要預(yù)測(cè)哪些類(lèi)型的客戶(hù)可能不會(huì)按時(shí)歸還貸款。已知過(guò)去幾年中,900個(gè)客戶(hù)的貸款歸還信譽(yù)度,據(jù)此可以將客戶(hù)分成兩組:可靠客戶(hù)和不可靠客戶(hù)。第6頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

再通過(guò)收集客戶(hù)的一些資料,如年齡、工資收入、教育程度、存款等,將這些資料作為自變量。通過(guò)判別分析,建立判別函數(shù)。那么,如果有150個(gè)新的客戶(hù)提交貸款請(qǐng)求,就可以利用創(chuàng)建好的判別函數(shù),對(duì)新的客戶(hù)進(jìn)行分析,從而判斷新的客戶(hù)是屬于可靠客戶(hù)類(lèi),還是不可靠客戶(hù)類(lèi)。第7頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月判別分析的目的是得到體現(xiàn)分類(lèi)的函數(shù)關(guān)系式,即判別函數(shù)?;舅枷胧窃谝阎^測(cè)對(duì)象的分類(lèi)和特征變量值的前提下,從中篩選出能提供較多信息的變量,并建立判別函數(shù);目標(biāo)是使得到的判別函數(shù)在對(duì)觀測(cè)量進(jìn)行判別其所屬類(lèi)別時(shí)的錯(cuò)判率最小。判別函數(shù)的一般形式是:其中,為判別函數(shù)判別值;為反映研究對(duì)象特征的變量;為各變量的系數(shù),即判別系數(shù)。

常用的判別法有距離判別法、Fisher(費(fèi)歇爾)判別法和Bayes(貝葉斯)判別法。第8頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月例1人文發(fā)展指數(shù)是聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署于1990年5月發(fā)表的第一份《人類(lèi)發(fā)展報(bào)告》中公布的。該報(bào)告建議,目前對(duì)人文發(fā)展的衡量應(yīng)當(dāng)以人生的三大要素為重點(diǎn),衡量人生三大要素的指示分別采用出生時(shí)的預(yù)期壽命、成人識(shí)字率和實(shí)際人均GDP,將以上三個(gè)指示指標(biāo)的數(shù)值合成為一個(gè)復(fù)合指數(shù),即為人文發(fā)展指數(shù)。資料來(lái)源UNDP《人類(lèi)發(fā)展報(bào)告》1995年。今從1995年世界各國(guó)人文發(fā)展指數(shù)的排序中,選取高發(fā)展水平、中等發(fā)展水平的國(guó)家各五個(gè)作為兩組樣品,另選四個(gè)國(guó)家作為待判樣品作判別分析。使用三種判別方法進(jìn)行判別,并進(jìn)行研究三者之間的關(guān)系。第9頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月第10頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月本例中變量個(gè)數(shù)p=3,兩類(lèi)總體各有5個(gè)樣品,即n1=n2=5,有4個(gè)待判樣品,假定兩總體協(xié)差陣相等。兩組線(xiàn)性判別的計(jì)算過(guò)程如下:(1)計(jì)算兩類(lèi)樣本均值(2)計(jì)算樣本協(xié)差陣,從而求出第11頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月類(lèi)似地經(jīng)計(jì)算第12頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月(3)求線(xiàn)性判別函數(shù)W(X)解線(xiàn)性方程組得第13頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月(4)對(duì)已知類(lèi)別的樣品判別分類(lèi)對(duì)已知類(lèi)別的樣品(通常稱(chēng)為訓(xùn)練樣品)用線(xiàn)性判別函數(shù)進(jìn)行判別歸類(lèi),結(jié)果如下表,全部判對(duì)。第14頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月(5)對(duì)判別效果作檢驗(yàn)判別分析是假設(shè)兩組樣品取自不同總體,如果兩個(gè)總體的均值向量在統(tǒng)計(jì)上差異不顯著,作判別分析意義就不大:所謂判別效果的檢驗(yàn)就是檢驗(yàn)兩個(gè)正態(tài)總體的均值向量是否相等,取檢驗(yàn)的統(tǒng)計(jì)量為:其中將上邊計(jì)算結(jié)果代人統(tǒng)計(jì)量后可得:第15頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月函數(shù)有效。故在檢驗(yàn)水平下,兩總體間差異顯著,即判別(6)對(duì)待判樣品判別歸類(lèi)結(jié)果如下表:第16頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

2、繼續(xù)用前面距離判別法例1的人文發(fā)展指數(shù)的數(shù)據(jù)作Bayes判別分析。貝葉斯準(zhǔn)則:一種概率方法把已知的地理數(shù)據(jù)分成幾類(lèi),計(jì)算出未知地理類(lèi)型或者區(qū)域歸屬于各已知類(lèi)型的概率值,它歸屬于哪一類(lèi)的概率值最大,就把它劃歸為該類(lèi)。第17頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月這里組數(shù)k=2,指標(biāo)數(shù)p=3,n1=n2=5代人判別函數(shù):第18頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月得兩組的判別函數(shù)分別為:將原各組樣品進(jìn)行回判結(jié)果如下一燈片表:待判樣品判別結(jié)果如下:第19頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月3、利用距離判別法中例l的人文發(fā)展指數(shù)的數(shù)據(jù)作Fisher判別分析:

費(fèi)歇爾準(zhǔn)則較優(yōu)的判別函數(shù)應(yīng)該能根據(jù)待判斷對(duì)的n個(gè)指標(biāo)最大限度地將它所屬的類(lèi)與其它類(lèi)區(qū)分開(kāi)來(lái)一般采用線(xiàn)性判別函數(shù)基本方法:首先假定判別函數(shù)(線(xiàn)性函數(shù)),然后根據(jù)已知信息對(duì)判別函數(shù)進(jìn)行訓(xùn)練,得到函數(shù)關(guān)系式中的關(guān)系值,從而最終確定判別函數(shù)第20頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

(1)建立判別函數(shù)利用前例計(jì)算的結(jié)果,可得Fisher判別函數(shù)的系數(shù)第21頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月所以判別函數(shù)為(2)計(jì)算判別臨界值y0。由于所以第22頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

(3)判別準(zhǔn)則(4)對(duì)已知類(lèi)別的樣品判別歸類(lèi)第23頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月第24頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月上述回判結(jié)果表明:總的回代判對(duì)率為100%,這與統(tǒng)計(jì)資料的結(jié)果相符,而且與前面用距離判別法的結(jié)果也一致。(5)對(duì)判別效果作檢驗(yàn)由于所以在檢驗(yàn)水平下判別有效。(6)待判樣品判別結(jié)果如下:判別結(jié)果與實(shí)際情況吻合。第25頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月§2.基本操作

SPSS利用“Discriminate”過(guò)程進(jìn)行判別分析操作,下面給出基本操作步驟。Step1:打開(kāi)主對(duì)話(huà)框。選擇“Analyze”→“Classify”→“Discriminate”命令,打開(kāi)“DiscriminateAnalysis”對(duì)話(huà)框,如圖1.1所示圖1.1“DiscriminateAnalysis”對(duì)話(huà)框,第26頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月Step2:選擇分組變量和自變量在變量列表中選擇指定分組變量,單擊右向箭頭按鈕,將其移動(dòng)至右側(cè)的“GroupingVariable”(分組)文本框中,并單擊“DefineRange”(定義范圍)按鈕,出現(xiàn)圖1.2所示的“DiscriminantAnalysis:DefineRange”(判別分析定義范圍)對(duì)話(huà)框,在“Minimum”文本框中輸入該分組變量的最小值,在“Maximum”文本框中輸入該分組變量的最大值,單擊“Continue”按鈕,返回主對(duì)話(huà)框。圖1.2“DiscriminateAnalysis:DefineRange”對(duì)話(huà)框第27頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月在變量列表中選擇判別分析的變量,單擊右向箭頭按鈕,將其移動(dòng)至“Independents”(自變量)列表框中。Step3:選擇判別分析方法。在主對(duì)話(huà)框中,自變量列表框下側(cè)顯示兩個(gè)單選框,用于指定選擇判別分析的方法。

Enterindependentstogether默認(rèn)選項(xiàng)。當(dāng)認(rèn)為所有自變量都能對(duì)觀測(cè)特性提供豐富的信息時(shí),使用該選項(xiàng),選擇該項(xiàng)將不加uanz地使用所有自變量進(jìn)行判別分析,建立全模型,且不需要進(jìn)一步選擇。

Usestepwisemethod逐步分析方法。當(dāng)認(rèn)為不是所有自變量都能對(duì)觀測(cè)量特性提供豐的信息時(shí),選擇該項(xiàng),因此需要判別貢獻(xiàn)的大小再進(jìn)行選擇。選中該單選按鈕時(shí),“Method”按鈕被激活,可以進(jìn)一步選擇判別分析方法。第28頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月Step4:選擇變量值標(biāo)識(shí)。如果需要使用一部分個(gè)案參與判別函數(shù)的推導(dǎo),而且有一個(gè)變量的某個(gè)值可以作為這些觀測(cè)量的標(biāo)識(shí),則用SelectVariable功能進(jìn)行選擇。方法為在變量列表中選擇變量,單擊右向箭頭按鈕,將其移動(dòng)至“Selection”(選擇變量)文本框;然后單擊“Selection”文本框右側(cè)的“Value”按鈕,顯示“DiscriminantAnalysis:SetValue”(判別分析:設(shè)定值)子對(duì)話(huà)框,如圖1.3所示,輸入選擇變量的標(biāo)識(shí)。單擊“Continue”按鈕,返回主對(duì)話(huà)框。圖1.3“DiscriminantAnalysis:SetValue”第29頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月Step5:執(zhí)行操作。選擇完畢后,單擊“OK”按鈕,執(zhí)行判別分析操作。第30頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月§3.選項(xiàng)設(shè)置§3.1Method選項(xiàng)選擇“Usestepwisemethod”方法進(jìn)行判別分析時(shí),“Method”(方法)按鈕將被激活,單擊“Method”按鈕,打開(kāi)“DiscriminantAnalysis:StepwiseMethod”(判別分析:逐步分析方法)對(duì)話(huà)框,如圖1.4所示第31頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月在“Method”選項(xiàng)組中選擇進(jìn)行逐步判別分析的方法,可供選擇的判別分析方法有5種:

1.Wilks’lambdaWilks’lambda方法。默認(rèn)選項(xiàng),每步都是Wilk的概計(jì)量最小的進(jìn)入判別函數(shù)。

2.Unexplainedvariance不可解釋方差方法。選擇該項(xiàng),表示每步都是使各類(lèi)不可解釋的方差和最小變量進(jìn)入判別函數(shù)。

3.Mahalanobis’distanceMahalanobis距離方法。選擇該項(xiàng),表示每步都使靠的最近的兩類(lèi)間Mahalanobis距離最大的變量進(jìn)入判別函數(shù)。

4.SmallestFratio最小F值方法。選擇該項(xiàng),表示每步都使任何兩類(lèi)間的最小的F值最大變量進(jìn)入判別函數(shù)。第32頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

5.Rao’sVRaoV統(tǒng)計(jì)量。選擇該項(xiàng),表示每步都使RaoV統(tǒng)計(jì)量產(chǎn)生最大增量的變量進(jìn)入判別函數(shù),可以對(duì)一個(gè)要加入到模型中的變量的V值指定一個(gè)最小增量。選擇該方法時(shí)需要在該項(xiàng)下面的“V-to-enter”(輸入V值)文本框中輸入這個(gè)增量的指定值,當(dāng)某變量導(dǎo)致的V值增量大于指定值的變量進(jìn)入判別函數(shù)?!癈riteria”(準(zhǔn)則)選項(xiàng)組用于選擇逐步判別停止的判據(jù),可供選擇的判據(jù)包括以下幾項(xiàng):第33頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

UseFvalue默認(rèn)選項(xiàng)。使用F值是系統(tǒng)默認(rèn)的判據(jù),當(dāng)加入一個(gè)變量(或剔除一個(gè)變量)后,對(duì)判別分析的變量進(jìn)行方差分析。當(dāng)計(jì)算的F值大于指定的Entry值時(shí),該變量保存在函數(shù)中,默認(rèn)Entry值是3.84;當(dāng)該變量使計(jì)算的F值小于指定的Removal值時(shí),該變量從函數(shù)中剔除,默認(rèn)Removal值是2.71。即當(dāng)被加入的變量F值為3.84時(shí),才把該變量加入到模型中,否則變量不能進(jìn)入模型;或者當(dāng)要從模型中移出的變量F值為2.71時(shí),該變量才被移出模型,否則模型中的變量不會(huì)被移出。設(shè)置這兩個(gè)值時(shí)應(yīng)該注意Entry值和Removal值。

UseprobabilityofF選擇該項(xiàng),表示用F檢驗(yàn)的概率決定變量是否被加入函數(shù)或被剔除,而不是用F值加入變量的,F(xiàn)值概率的默認(rèn)值是0.05,移出變量的F值概率是0.10。Removal值是移出變量的F值概率;Entry值是加入變量的F值概率。第34頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月“Display”(顯示)選項(xiàng)組的選項(xiàng)用于顯示逐步變量判別法的過(guò)程設(shè)置。有以下兩個(gè)復(fù)選項(xiàng):

Summaryofstep要求在逐步選擇變量過(guò)程中的每一步之后顯示每個(gè)變量的統(tǒng)計(jì)量。

Fforpairwisedistances要求顯示兩兩類(lèi)之間的兩兩F值矩陣。第35頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月§3.2Statistics選項(xiàng)在主對(duì)話(huà)框中單擊“statistics”按鈕,打開(kāi)“DiscriminantAnlysis:statistics”(判別分析:統(tǒng)計(jì)量)對(duì)話(huà)框,如圖1.5所示。圖1.5“DiscriminantAnlysis:statistics”對(duì)話(huà)框第36頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月該對(duì)話(huà)框中給出了輸出結(jié)果中顯示的統(tǒng)計(jì)量,包括如下選項(xiàng)。在“descriptive”(描述性)選項(xiàng)組中選擇對(duì)原始數(shù)據(jù)的描述統(tǒng)計(jì)量的輸出。

Means均值。選擇該項(xiàng),可以輸出各類(lèi)中各自變量的均值、標(biāo)準(zhǔn)差以及各自變量總樣本的均值和標(biāo)準(zhǔn)差。

UnivariateANOVA單變量方差分析。選擇該項(xiàng),表示對(duì)每一類(lèi)同一自變量均值都相等的假設(shè)進(jìn)行檢驗(yàn),輸出單變量的方差分析結(jié)果。

Box’sM選擇該項(xiàng),表示對(duì)各類(lèi)的協(xié)方差矩陣相等的假設(shè)進(jìn)行檢驗(yàn)。第37頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月“FunctionCoefficients”(判別分析的系數(shù))選項(xiàng)組中給出選擇判別函數(shù)系數(shù)的輸出形式的選項(xiàng),有兩個(gè)復(fù)選項(xiàng):

Fisher’s選擇該項(xiàng),表示可以用于對(duì)新樣本進(jìn)行判別分類(lèi)的fisher系數(shù),對(duì)每一類(lèi)給出一組系數(shù),并給出該組中判別分?jǐn)?shù)最大的觀測(cè)量。

Unstandardized選擇該項(xiàng),表示未經(jīng)標(biāo)準(zhǔn)化處理的判別系數(shù)。在“matrices”(矩陣)選項(xiàng)組中選擇自變量的系數(shù)矩陣,有4個(gè)復(fù)選項(xiàng):

Within-groupcorrelation類(lèi)內(nèi)相關(guān)矩陣。它計(jì)算相關(guān)矩陣之前將各組協(xié)方差矩陣平均后,計(jì)算類(lèi)內(nèi)相關(guān)矩陣。

Within-groupcovariance合并類(lèi)內(nèi)協(xié)方差矩陣,是將各組(類(lèi))協(xié)方差矩陣平均后計(jì)算的,區(qū)別與總協(xié)方差矩陣。

Separate-groupscovariance協(xié)方差矩陣。

Totalcovariance總樣本的協(xié)方差矩陣。第38頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月§3.3Classification選項(xiàng)在主對(duì)話(huà)框中單擊“classify”按鈕,顯示“DiscriminantAnalysis:Classification”(判別分析:分類(lèi))子對(duì)話(huà)框,如圖1.6所示。圖1.6“DiscriminantAnalysis:Classification”對(duì)話(huà)框第39頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月該對(duì)話(huà)框用于指定分類(lèi)參數(shù)和判別結(jié)果。分別介紹各個(gè)選項(xiàng)組的選項(xiàng)。在“priorprobabilities”選項(xiàng)組中選擇先驗(yàn)概率,有兩個(gè)單選項(xiàng)供選擇:

Allgroupsequal表示各類(lèi)先驗(yàn)概率相等。

Computefromgroupssizes表示由各類(lèi)的樣本量計(jì)算決定,即各類(lèi)的先驗(yàn)概率與其樣本量成正比。在“usecovariancematrix”(利用協(xié)方差矩陣)選項(xiàng)組中選擇分類(lèi)使用的協(xié)方差矩陣,有兩個(gè)單選項(xiàng):

Within-groups選擇該項(xiàng),表示指定使用合并組內(nèi)協(xié)方差矩陣進(jìn)行分類(lèi)。

Separate-groups選擇該項(xiàng),表示指定使用各組協(xié)方差矩陣進(jìn)行分類(lèi),由于分類(lèi)是根據(jù)判別函數(shù)而不是根據(jù)原始變量,因此該選擇項(xiàng)不是總等價(jià)于二次判別。第40頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月在“plots”選項(xiàng)組中選擇要求輸入的統(tǒng)計(jì)圖形,給出3個(gè)復(fù)選項(xiàng):

Combined-groups選擇該項(xiàng),生成一張包括各類(lèi)的散點(diǎn)圖,該散點(diǎn)圖是根據(jù)前兩個(gè)判別函數(shù)值做的散點(diǎn)圖;如果只有一個(gè)判別函數(shù),就輸出直方圖。

Separate-groups選擇該項(xiàng),根據(jù)前兩個(gè)判別函數(shù)值對(duì)每一類(lèi)生成一張散點(diǎn)圖,共分為幾類(lèi)就生成幾張散點(diǎn)圖;如果只有一個(gè)判別函數(shù)就生成一張直方圖。

Territorialmap選擇該項(xiàng),生成用于根據(jù)函數(shù)值把觀測(cè)量分到各組中去的邊界圖,此種統(tǒng)計(jì)圖把一張圖的平面劃分出與類(lèi)數(shù)相同的區(qū)域,每一類(lèi)占據(jù)一個(gè)區(qū),各類(lèi)的均值在各區(qū)中用*號(hào)標(biāo)出;如果僅有一個(gè)判別函數(shù)則不作此圖。第41頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月在“display”選項(xiàng)組中選擇生成到輸出窗中的分類(lèi)結(jié)果,其中包括3個(gè)復(fù)選框:

Casewiseresults要求輸出每個(gè)管測(cè)量,包括判別分?jǐn)?shù)實(shí)際類(lèi)預(yù)測(cè)類(lèi)(根據(jù)判別函數(shù)求得的分類(lèi)結(jié)果)和后驗(yàn)概率等,選擇此項(xiàng)還可以選擇其附屬選擇項(xiàng),選擇“Limitcasesto”(個(gè)案限制)選項(xiàng),并在后面的文本框中輸入觀測(cè)量數(shù)n,選擇此項(xiàng)則僅對(duì)前n個(gè)觀測(cè)量輸出分類(lèi)結(jié)果,觀測(cè)數(shù)量大時(shí)可以選擇此項(xiàng)。

Summarytable要求輸出分類(lèi)的綜述表,給出正確分類(lèi)觀測(cè)數(shù)(原始類(lèi)和根據(jù)判別函數(shù)計(jì)算的預(yù)測(cè)類(lèi)相同)和錯(cuò)分觀測(cè)量數(shù)即錯(cuò)分率。

Leave-one-outclassification輸出對(duì)每個(gè)觀測(cè)量進(jìn)行分類(lèi)的結(jié)果,所依據(jù)的判別時(shí)由除該觀測(cè)量以外的其他觀測(cè)量導(dǎo)出的,也稱(chēng)為交互校驗(yàn)結(jié)果。該對(duì)話(huà)框給出選擇缺失值的處理方法,即“Replacemissingvalueswithmean”,表示用該變量的均值代替缺失值。第42頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月§3.4Save選項(xiàng)在主對(duì)話(huà)框單擊“save”按鈕,打開(kāi)“DiscriminantAnalysis:Save”(判別分析:保存)對(duì)話(huà)框,如圖1.7所示。該對(duì)話(huà)框用于指定生成并保存在數(shù)據(jù)文件中的新變量,其中包括如下選項(xiàng):圖1.7“DiscriminantAnalysis:Save”對(duì)話(huà)框第43頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

Predictedgroupsmembership選擇該項(xiàng),要求建立一個(gè)新變量預(yù)測(cè)觀測(cè)量的分類(lèi),是根據(jù)判別分?jǐn)?shù)把觀測(cè)量按后驗(yàn)概率最大指派所屬的類(lèi),每運(yùn)行一次“Discriminant”過(guò)程就建立一個(gè),表民使用判別函數(shù)預(yù)測(cè)各觀測(cè)量屬于哪一類(lèi)的新變量。第一次運(yùn)行建立新變量的變量名為dis_1,如果在工作數(shù)據(jù)文件中不把前一次建立的新變量刪除,第n次運(yùn)行建立的新變量名為dis_n。

Discriminantscores選擇該項(xiàng),要求建立表明判別分?jǐn)?shù)的新變量,該分?jǐn)?shù)是由未標(biāo)準(zhǔn)化的判別系數(shù)乘自變量的值,將這些乘積求和后加上常數(shù)得來(lái)的。每次運(yùn)行“Discriminant”過(guò)程就給出一組表明判別分?jǐn)?shù)的新變量,建立幾個(gè)判別函數(shù)就有幾個(gè)判別分?jǐn)?shù)變量參與分析的觀測(cè)量,共分為m類(lèi),則建立m個(gè)點(diǎn)則判別函數(shù)指定該選擇項(xiàng)就可以生成m-1個(gè)表明判別分?jǐn)?shù)的新變量。

Probabilitiesofgroupsmembership選擇該項(xiàng),要求建立新變量表明觀測(cè)量屬于某一類(lèi)的概率。如果有m類(lèi),對(duì)一個(gè)觀測(cè)量就會(huì)給出m個(gè)概率值,因此建立m個(gè)新變量。第44頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月§4.實(shí)例分析例1、為研究舒張期血壓和血漿膽固醇對(duì)冠心病的作用,某醫(yī)師測(cè)定了50—59歲冠心病人15例和正常人16例的舒張壓和膽固醇指標(biāo),結(jié)果如下表所示。試做判別分析,建立判別函數(shù)以便在臨床中用于篩選在臨床中用于篩選冠心病人(數(shù)據(jù)文件:discriminant.sav)第45頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月冠心病人組正常人組編號(hào)舒張壓膽固醇編號(hào)舒張壓膽固醇19.865.18110.662.07213.333.73212.534.45314.663.89313.333.0649.337.1049.333.94512.805.49510.664.45610.664.09610.664.92710.664.4579.333.68813.333.63810.662.77913.335.96910.663.211013.335.701010.665.021112.006.191110.403.941214.664.01129.334.921313.334.011310.662.691412.803.631410.662.431513.335.961511.203.42169.333.63第46頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月操作步驟:Step1:讀取數(shù)據(jù)文件discriminant.sav。其中,變量名“舒張壓”、“膽固醇”代表兩項(xiàng)指標(biāo)值。病人資料和正常人資料合并一同輸入,定義變量名為“組別”的變量用于區(qū)分冠心病人資料和正常人資料,即冠心病人資料的“組別”值均為1,正常人資料的“組別”值均為2.Step2:選擇“Analysis”→“Classify”→“Discriminant”命令,在“DiscriminantAnalysis”對(duì)話(huà)框中,選擇“組別”變量進(jìn)入“GroupingVariable”文本框;單擊“DefineRange”按鈕,在“Minimum”文本框中輸入1,在“Maximum”文本框中輸入2,單擊“Continue”按鈕,返回主對(duì)話(huà)框。Step3:選擇變量“舒張壓”和“膽固醇”移動(dòng)到“Independents”列表框中,本例選擇“Enterindependentstogether”判別方式作為判別分析的方法。第47頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月

Step4:?jiǎn)螕簟癝tatistics”按鈕,在“Descriptive”選項(xiàng)中選擇“Mean”;在“FunctionCoefficients”選擇“Unstandardized”。單擊“Continue”按鈕,返回主對(duì)話(huà)框。

Step5:?jiǎn)螕簟癈lassify”按鈕,在“Plot”選項(xiàng)組中選擇“Combined-groups”選項(xiàng),在“Display”選項(xiàng)組中選擇“Casewiseresult”和“Summmarytable”選項(xiàng);單擊“Continue”按鈕,返回主對(duì)話(huà)框。

Step6:?jiǎn)螕簟癝ave”按鈕,在彈出的對(duì)話(huà)框中選擇“Predictedgroupmembership”選項(xiàng),單擊“Continue”按鈕,返回主對(duì)話(huà)框。

Step7:?jiǎn)螕簟癘K”按鈕,執(zhí)行判別分析操作。第48頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月判別分析的結(jié)果1、分析個(gè)案綜合統(tǒng)計(jì)量表1.2和表1.3所示為系統(tǒng)處理的數(shù)據(jù)簡(jiǎn)明表明中的數(shù)據(jù),按變量“組別”分組共有31個(gè)樣本為判別基礎(chǔ)數(shù)據(jù)進(jìn)入分析,其中第一組十五例,第二組十六例。AnalysisCaseProcessingSummaryUnweightedCasesNPercentValid31100.0ExcludedMissingorout-of-rangegroupcodes0.0

Atleastonemissingdiscriminatingvariable0.0

Bothmissingorout-of-rangegroupcodesandatleastonemissingdiscriminatingvariable0.0

Total0.0Total31100.0表1.2分析個(gè)案綜合統(tǒng)計(jì)量第49頁(yè),課件共57頁(yè),創(chuàng)作于2023年2月2、分組統(tǒng)計(jì)量表1.3所示為分組統(tǒng)計(jì)量列表。表中給出分組變量和合計(jì)的均數(shù)(means)、標(biāo)準(zhǔn)差(standarddeviation)和有效個(gè)案的例數(shù)。GroupStatistics表1.3分組

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論