版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
我國(guó)區(qū)域經(jīng)濟(jì)類型的聚類分析和判別分析應(yīng)用數(shù)理統(tǒng)計(jì)課程論文屆材料科學(xué)與工程學(xué)院學(xué)號(hào)姓名年月日摘要我國(guó)幅員遼闊,省市眾多,各地區(qū)經(jīng)濟(jì)社會(huì)發(fā)展不平衡。針對(duì)這種不平衡的現(xiàn)狀,從定量化的角度綜合評(píng)價(jià)地區(qū)經(jīng)濟(jì)發(fā)展水平,本文選取了8項(xiàng)經(jīng)濟(jì)指標(biāo)作為決定經(jīng)濟(jì)類型的影響因素,利用數(shù)理統(tǒng)計(jì)軟件SPSS對(duì)全國(guó)2010年31個(gè)省和直轄市(不包括港澳臺(tái))的經(jīng)濟(jì)類型進(jìn)行聚類分析,得到樹狀譜系圖,將其強(qiáng)制分為四類,并給出了各類發(fā)展區(qū)域的優(yōu)勢(shì)和特點(diǎn),最后對(duì)所得的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行了判別分析。關(guān)鍵詞:經(jīng)濟(jì)類型聚類分析判別分析SPSS目錄1.引言 11.1研究意義 11.2研究?jī)?nèi)容及方法 12.數(shù)據(jù)預(yù)處理 22.1數(shù)據(jù)的收集 22.2數(shù)據(jù)標(biāo)識(shí) 32.3數(shù)據(jù)標(biāo)準(zhǔn)化處理 33.聚類分析 53.1概述 53.2數(shù)據(jù)處理 53.3討論 84.判別分析 104.1概述 104.2數(shù)據(jù)處理 105.結(jié)論與討論 145.1結(jié)論 145.2討論 14參考文獻(xiàn) 15北京航空航天大學(xué)數(shù)理統(tǒng)計(jì)論文ZY1201203馬勝東-PAGE15-1.引言在多元統(tǒng)計(jì)分析中,常常使用聚類分析(ClusterAnalysis)和判別分析(DiscriminateAnalysis)來解決樣本的分類問題。在事先并不知道應(yīng)將樣品或指標(biāo)分為幾類的情況下,可以使用聚類分析根據(jù)樣本或指標(biāo)的相似程度,將樣本或指標(biāo)歸組分類;而在事先已經(jīng)建立了樣品分類,需要將新樣本歸入到已知分類的樣本組中時(shí),就可以使用判別分析。1.1研究意義由于歷史和現(xiàn)實(shí)的原因,中國(guó)經(jīng)濟(jì)的發(fā)展呈現(xiàn)出明顯的不均衡性,并以東西部的發(fā)展水平不平衡為最大特點(diǎn),東部地區(qū)較為發(fā)達(dá),西部地區(qū)發(fā)展滯后。區(qū)域經(jīng)濟(jì)差異作為經(jīng)濟(jì)發(fā)展過程中出現(xiàn)的一個(gè)普遍性問題具有明顯的負(fù)面效應(yīng),直接影響著社會(huì)的安定和人民的生活水平的提高。在這一前提下,明確當(dāng)前我國(guó)發(fā)達(dá)地區(qū)和落后地區(qū)的區(qū)間格局,有助于對(duì)不同地區(qū)經(jīng)濟(jì)發(fā)展存在的差異進(jìn)行宏觀調(diào)控,從而因地制宜出臺(tái)相應(yīng)的經(jīng)濟(jì)政策,促進(jìn)各地區(qū)經(jīng)濟(jì)的協(xié)調(diào)發(fā)展,為國(guó)民經(jīng)濟(jì)持續(xù)協(xié)調(diào)健康發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。同時(shí),對(duì)于進(jìn)一步的研究和分析我國(guó)各區(qū)域間經(jīng)濟(jì)發(fā)展的狀況,并探求切實(shí)可行的區(qū)域協(xié)調(diào)發(fā)展政策以實(shí)現(xiàn)我國(guó)經(jīng)濟(jì)的可持續(xù)發(fā)展有著極為重要的現(xiàn)實(shí)意義。1.2研究?jī)?nèi)容及方法各地區(qū)經(jīng)濟(jì)狀況評(píng)價(jià)的難點(diǎn)在于反映經(jīng)濟(jì)發(fā)展的指標(biāo)眾多,每項(xiàng)指標(biāo)又會(huì)從不同角度反映經(jīng)濟(jì)發(fā)展?fàn)顩r。所以,依據(jù)它們作綜合評(píng)價(jià)有一定難度。但我們可以看到,多元統(tǒng)計(jì)分析正是將多維因子納入同一體系加以綜合研究的定量化方法,從而很好解決了這一問題。本文采用多元統(tǒng)計(jì)分析方法,對(duì)我國(guó)2010年31個(gè)省和直轄市(不包括港澳臺(tái))的經(jīng)濟(jì)發(fā)展指標(biāo)進(jìn)行分析,客觀地反映了當(dāng)前各地區(qū)的經(jīng)濟(jì)類型。
2.數(shù)據(jù)預(yù)處理2.1數(shù)據(jù)的收集本文從《中國(guó)統(tǒng)計(jì)年鑒2011》中選取了2010年全國(guó)31個(gè)省及直轄市(不包括港澳臺(tái))的8項(xiàng)具有代表性的經(jīng)濟(jì)指標(biāo)作為分類的自變量,分別是財(cái)政收入、農(nóng)林牧漁業(yè)總產(chǎn)值、工業(yè)總產(chǎn)值、建筑業(yè)總產(chǎn)值、社會(huì)消費(fèi)品總額、教育經(jīng)費(fèi)、餐飲業(yè)營(yíng)業(yè)額和就業(yè)人員工作總額。數(shù)據(jù)整理結(jié)果如表2-1所示。表2-12010年全國(guó)31個(gè)省及直轄市(不包括港澳臺(tái))主要經(jīng)濟(jì)指標(biāo)(單位:億元)地區(qū)農(nóng)林牧漁業(yè)總產(chǎn)值建筑業(yè)總產(chǎn)值北京2353.93328.013699.845196.026229.3528.94394.74136.1天津1068.81317.316751.822424.492902.6238.1776.21051.2河北1331.854309.431143.293231.466821.8614.5336.41629.6山西969.671047.812471.332143.463318.2380.9168.31286.5內(nèi)蒙古1069.981843.613406.111125.583384.0318.7746.5888.2遼寧2004.843106.536219.424690.316887.6534.92103.81787.2吉林602.411850.313098.351348.783504.9300.7019.7776.3黑龍江755.582536.39535.151769.704039.2348.6234.31277.6上海2873.58287.030114.414300.196070.5493.73337.12611.2江蘇4079.864297.192056.4812405.913606.81105.49237.12998.8浙江2608.472172.951394.2012007.910245.4891.15211.53517.5安徽1149.402955.418732.002864.964197.7487.3352.01225.1福建1151.492307.121901.232935.945310.0447.91103.51602.3江西778.091900.613883.061690.022956.2377.6534.4836.7山東2749.386650.983851.405496.5914620.3839.74315.83166.7河南1381.325734.234995.534400.618004.2763.35100.32213.6湖北1011.233502.021623.124345.207013.9519.45105.61601.7湖南1081.693787.519008.833161.735839.5566.0773.11479.9廣東4517.043754.985824.644715.4617458.41284.31445.64484.3廣西771.992721.09644.131222.313312.0387.3320.4952.7海南270.99821.31381.25199.48639.3117.5512.0250.0重慶952.071021.19143.552534.362938.6331.0083.1897.7四川1561.674081.823147.384163.076810.1808.85121.51840.5貴州533.73997.84206.37622.961482.7309.4111.6669.1云南871.191810.56464.631510.962500.1440.8123.1930.5西藏36.65100.862.22122.07185.359.740.5108.95陜西958.211666.111199.843063.613195.7463.7587.31215.0甘肅353.581057.04882.68751.991394.5276.1117.9568.9青海110.22201.31481.99279.61350.878.583.6189.6寧夏153.55305.91924.39342.69403.681.3110.3225.9新疆500.581846.25341.90963.721375.1295.938.0850.82.2數(shù)據(jù)標(biāo)識(shí)為了便于數(shù)據(jù)處理,將收集到的2010年全國(guó)31個(gè)省及直轄市(不包括港澳臺(tái))的8項(xiàng)具有代表性的經(jīng)濟(jì)指標(biāo)作為自變量進(jìn)行符號(hào)標(biāo)識(shí),符號(hào)說明如表2-2所示:表2-2符號(hào)說明自變量符號(hào)財(cái)政收入X1農(nóng)林牧漁業(yè)總產(chǎn)值X2工業(yè)總產(chǎn)值X3建筑業(yè)總產(chǎn)值X4社會(huì)消費(fèi)品總額X5教育經(jīng)費(fèi)X6餐飲業(yè)營(yíng)業(yè)額X7就業(yè)人員工資總額X82.3數(shù)據(jù)標(biāo)準(zhǔn)化處理無論是應(yīng)用聚類分析還是判別分析,都要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。如果不同變量的變量值數(shù)值相差太大,會(huì)導(dǎo)致計(jì)算個(gè)案間距離時(shí),由于絕對(duì)值較小的數(shù)值權(quán)數(shù)較小,個(gè)案距離的大小幾乎由大數(shù)值決定,標(biāo)準(zhǔn)化過程可以解決此類問題,使不同變量的數(shù)值具有同等的重要性。本文采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化對(duì)數(shù)據(jù)進(jìn)行處理。標(biāo)準(zhǔn)化計(jì)算公式為:,式中:--個(gè)案的樣本均值;--樣本標(biāo)準(zhǔn)差。這樣就把個(gè)案轉(zhuǎn)換為樣本均值為0、標(biāo)準(zhǔn)差為1的樣本。標(biāo)準(zhǔn)化輸出結(jié)果見表2-3。表2-3標(biāo)準(zhǔn)化后各省及直轄市的經(jīng)濟(jì)指標(biāo)地區(qū)財(cái)政收入農(nóng)林牧漁業(yè)總產(chǎn)值工業(yè)總產(chǎn)值建筑業(yè)總產(chǎn)值社會(huì)消費(fèi)品總額教育經(jīng)費(fèi)餐飲業(yè)營(yíng)業(yè)額就業(yè)人員工資總額北京0.96-1.14-0.360.950.280.192.412.30天津-0.22-1.15-0.24-0.13-0.51-0.82-0.22-0.42河北0.021.240.350.190.420.49-0.550.09山西-0.31-0.71-0.41-0.23-0.41-0.32-0.29-0.21內(nèi)蒙古-0.22-0.23-0.37-0.63-0.40-0.54-0.47-0.56遼寧0.640.520.560.750.430.210.010.23吉林-0.65-0.23-0.38-0.54-0.37-0.60-0.69-0.66黑龍江-0.510.18-0.53-0.38-0.24-0.44-0.57-0.22上海1.43-1.160.310.600.240.071.940.96續(xù)表2-3標(biāo)準(zhǔn)化后各省及直轄市的經(jīng)濟(jì)指標(biāo)地區(qū)財(cái)政收入農(nóng)林牧漁業(yè)總產(chǎn)值工業(yè)總產(chǎn)值建筑業(yè)總產(chǎn)值社會(huì)消費(fèi)品總額教育經(jīng)費(fèi)餐飲業(yè)營(yíng)業(yè)額就業(yè)人員工資總額江蘇2.541.232.833.752.032.201.111.30浙江1.19-0.041.183.591.231.450.901.76安徽-0.150.43-0.160.05-0.210.05-0.42-0.26福建-0.150.04-0.030.070.06-0.090.000.07江西-0.49-0.20-0.35-0.41-0.50-0.34-0.57-0.61山東1.322.642.501.072.271.271.761.45河南0.072.090.510.640.701.01-0.020.61湖北-0.270.76-0.040.620.460.160.020.07湖南-0.210.93-0.140.160.180.32-0.25-0.04廣東2.940.912.580.762.942.822.842.61廣西-0.490.29-0.53-0.59-0.42-0.30-0.68-0.51海南-0.95-0.85-0.86-0.99-1.05-1.24-0.75-1.13重慶-0.33-0.73-0.55-0.08-0.50-0.50-0.17-0.55四川0.231.100.020.550.411.170.150.28貴州-0.71-0.74-0.75-0.82-0.85-0.57-0.76-0.76云南-0.40-0.25-0.66-0.48-0.61-0.12-0.66-0.52西藏-1.17-1.28-0.92-1.02-1.16-1.44-0.85-1.25陜西-0.32-0.34-0.460.12-0.44-0.04-0.13-0.27甘肅-0.88-0.70-0.72-0.77-0.87-0.69-0.71-0.84青海-1.10-1.22-0.86-0.96-1.12-1.38-0.82-1.18寧夏-1.06-1.15-0.84-0.93-1.10-1.37-0.77-1.15新疆-0.74-0.23-0.70-0.69-0.87-0.62-0.79-0.59
3.聚類分析3.1概述聚類分析又稱為群分析,是多元統(tǒng)計(jì)分析中研究樣本或指標(biāo)的一種主要的分類方法,其基本思想是在樣品之間定義距離,在變量之間定義相似系數(shù),距離或相似系數(shù)代表樣品或者變量之間的相似程度。按相似程度的大小,將樣品逐一歸類。聚合分析的優(yōu)點(diǎn)在于它確定的類別是基于對(duì)樣本的觀察指標(biāo)的分析,分類的結(jié)果能客觀地顯示出樣本間的本質(zhì)判別與聯(lián)系,尤其是內(nèi)在的結(jié)構(gòu)關(guān)系,且分類結(jié)果較直觀。聚類分析中常用的研究樣本之間的關(guān)系指標(biāo)有2種:(1)距離。根據(jù)不同的距離定義方法可以測(cè)算出定義在P維空間上樣本之間的距離,并根據(jù)此距離來度量樣本之間的相似程度。常用的距離指標(biāo)有:①歐氏距離:②馬氏距離:(2)相似系數(shù)。根據(jù)描敘樣本之間相似程度的量——相似系數(shù)來確定樣本的類關(guān)系,常用的相似系數(shù)為夾角余弦和相關(guān)系數(shù)。聚類分析分為兩種類型:Q型聚類(個(gè)案聚類)和R型聚類(變量聚類)。本文屬于Q型聚類。文中先使用系統(tǒng)聚類的Ward’sMethod(Ward法即最小離差平方和法),并采用SquaredEuclideandistance(歐氏距離的平方,即兩觀察樣本間的距離為其差值的平方和,該技術(shù)用于Q型聚類)量來對(duì)2010年全國(guó)31個(gè)省及直轄市(不包括港澳臺(tái))的主要經(jīng)濟(jì)指標(biāo)進(jìn)行聚類分析,得到樹狀譜系圖,并最終劃分為4類經(jīng)濟(jì)區(qū)域。3.2數(shù)據(jù)處理使用專業(yè)統(tǒng)計(jì)分析軟件IBMSPSSStatistics19對(duì)2010年31個(gè)省及直轄市(不包括港澳臺(tái))的主要經(jīng)濟(jì)指標(biāo)(標(biāo)準(zhǔn)化)進(jìn)行聚類分析,聚類方法使用Ward’sMethod,距離測(cè)量技術(shù)選擇SquaredEuclideandistance(歐氏距離的平方),處理結(jié)果如下表所示。表3-1案例處理匯總案例a有效缺失總計(jì)N百分比N百分比N百分比31100.00.031100.0注:a.Ward聯(lián)結(jié)由表3-1可知,選取的數(shù)據(jù)均為有效數(shù)據(jù)。分層聚類分析的聚類過程如表3-2所示:表3-2群組成員聚類過程表階群集組合系數(shù)首次出現(xiàn)階群集下一階群集1群集2群集1群集212930.00600322428.03500932629.0640184714.1370075820.24000146422.3460012757.469041082126.618032692431.8202021105251.03170141117181.2530015124271.50660161312131.779001914582.17610521153172.6590111816243.164012221716233.914002318364.96515019193126.27018132320197.6830028215249.24514922222511.6521621262331614.94319172824101118.764002725151924.30500272622133.3842282927101545.649242530281367.0372023292912113.73628263030110248.45929270表中第一列表示聚類分析的步驟。第二列和第三列表示該步聚類分析中,哪兩個(gè)樣本聚成了一類;如:第一步顯示第26和29兩個(gè)樣本聚成了一類,第六步顯示第8個(gè)樣本和第四步聚類形成的新類進(jìn)行了聚類,依次類推,聚類過程共進(jìn)行了30步,所有的樣本聚成了一大類。第四列表示兩個(gè)樣本間的距離,從表中可以看出,距離小的樣本之間先聚類;第五和第六列表示某步聚類分析中,參與聚類的是樣本還是類,0則表示樣本,數(shù)字n(非零)表示第n步聚類產(chǎn)生的類參與了本步聚類;第七列表示本步聚類結(jié)果在下面聚類的第幾步中用到。由此得到聚類樹狀圖譜如圖3-1所示,該圖較好的反映了31個(gè)省及直轄市(不包括港澳臺(tái))經(jīng)濟(jì)類型的關(guān)聯(lián)。圖3-1使用Ward連接的樹狀圖從樹狀圖中可以清晰地看到聚類的全過程。它將實(shí)際的距離按比例調(diào)整到0至25的范圍內(nèi),用逐級(jí)連線的方式連接性質(zhì)相近的個(gè)案和新類,直至并為一類。經(jīng)反復(fù)試驗(yàn),將群組成員強(qiáng)制分為四類,結(jié)果比較令人滿意,分組結(jié)果如表3-3所示。表3-3群聚成員案例4群集案例4群集1:北京117:湖北32:天津218:湖南33:河北319:廣東44:山西220:廣西25:內(nèi)蒙古221:海南26:遼寧322:重慶27:吉林223:四川38:黑龍江224:貴州29:上海125:云南210:江蘇426:西藏211:浙江427:陜西212:安徽328:甘肅213:福建329:青海214:江西230:寧夏215:山東431:新疆216:河南3由上表可以看出,全國(guó)31個(gè)省及直轄市(不包括港澳臺(tái))被強(qiáng)制分為四個(gè)經(jīng)濟(jì)區(qū)域,按其經(jīng)濟(jì)發(fā)展程度,定義為經(jīng)濟(jì)最發(fā)達(dá)地區(qū)、經(jīng)濟(jì)發(fā)達(dá)地區(qū)、經(jīng)濟(jì)較發(fā)達(dá)地區(qū)、經(jīng)濟(jì)不發(fā)達(dá)地區(qū)。整理的表3-4。表3-4聚類分析分類結(jié)果類別性質(zhì)省份1經(jīng)濟(jì)最發(fā)達(dá)地區(qū)北京、上海2經(jīng)濟(jì)不發(fā)達(dá)地區(qū)山西、廣西、內(nèi)蒙古、吉林、天津、黑龍江、江西、海南、重慶、貴州、云南、西藏、陜西、新疆、甘肅、寧夏、青海3經(jīng)濟(jì)較發(fā)達(dá)地區(qū)河北、湖南、湖北、福建、遼寧、安徽、河南、四川4經(jīng)濟(jì)發(fā)達(dá)地區(qū)江蘇、廣東、浙江、山東3.3討論北京是全國(guó)政治、經(jīng)濟(jì)、科學(xué)文化與國(guó)際交往中心,是中國(guó)重要的金融中心和商業(yè)中心之一,其綜合經(jīng)濟(jì)實(shí)力保持在全國(guó)前列。上海是中國(guó)第一大城市,交通便利,腹地廣闊,地理位置優(yōu)越,是一個(gè)良好的江海港口,有著眾多的國(guó)際商業(yè)組織和跨國(guó)公司,諸此種種都帶動(dòng)著上海的建設(shè)發(fā)展和居民收入的普遍提高。這兩個(gè)直轄市的綜合實(shí)力發(fā)展情況在全國(guó)屬于最高水平,屬于經(jīng)濟(jì)最發(fā)達(dá)地區(qū)。江蘇是中國(guó)的經(jīng)濟(jì)大省,全省綜合經(jīng)濟(jì)實(shí)力在全國(guó)一直處于前列。浙江是我國(guó)高產(chǎn)綜合性農(nóng)業(yè)區(qū),旅游資源亦非常豐富。廣東改革開放以來創(chuàng)新發(fā)展觀念,轉(zhuǎn)變發(fā)展方式,發(fā)展迅速,省內(nèi)有許多規(guī)模和效益較好的大型工業(yè)企業(yè)。這類省份的綜合實(shí)力水平較高,屬于經(jīng)濟(jì)發(fā)達(dá)地區(qū)。相比之下,福建、遼寧作為沿海省份,經(jīng)濟(jì)要更差一些,但遼寧作為我國(guó)的重工業(yè)發(fā)展基地,福建緊靠臺(tái)灣,近兩年沿海交流加深,經(jīng)濟(jì)實(shí)力不容低估,屬于經(jīng)濟(jì)較發(fā)達(dá)地區(qū)。經(jīng)濟(jì)不發(fā)達(dá)地區(qū),這些主要集中于我國(guó)的西部和中部。
4.判別分析4.1概述判別分析是另一種處理分類問題的統(tǒng)計(jì)方法,是在已知分類數(shù)目的情況下,根據(jù)一定的指標(biāo)對(duì)不知類別的數(shù)據(jù)進(jìn)行歸類。其主要原理是先根據(jù)已知類別的事物的性質(zhì)(自變量),建立函數(shù)關(guān)系式(自變量的線性組合,即判別函數(shù)),然后對(duì)未知類別的新事物進(jìn)行判斷以將之歸入已知的類別中。常用的判別分析方法有:距離判別法、Bayes判別法以及Fisher判別法等。本文采用的是Fisher判別法,這種方法是以Fisher準(zhǔn)則為標(biāo)準(zhǔn)來評(píng)選判別函數(shù)的。所謂Fisher準(zhǔn)則,指的是較優(yōu)的判別函數(shù)應(yīng)該能根據(jù)待判對(duì)象的n個(gè)指標(biāo)最大限度地將它所屬的類與其他類區(qū)分開來。4.2數(shù)據(jù)處理利用使用專業(yè)統(tǒng)計(jì)分析軟件IBMSPSSStatistics19,定義分類結(jié)果為變量“分組類別”,采用自變量全進(jìn)入模型來進(jìn)行判別分析,由于在聚類分析中將全國(guó)各省、直轄市的經(jīng)濟(jì)類型分為四類,因此該變量取值范圍為1~4。輸出結(jié)果如下:表4-1分析案例處理摘要未加權(quán)案例N百分比有效31100.0排除的缺失或越界組代碼0.0至少一個(gè)缺失判別變量0.0缺失或越界組代碼有至少一個(gè)缺失判別變量0.0合計(jì)0.0合計(jì)31100.0從上表中可以看出,案例均是有效的。表4-2分組統(tǒng)計(jì)量分類有效的N(列表狀態(tài))未加權(quán)的已加權(quán)的1.00X122.000X222.000X322.000X422.000X522.000X622.000X722.000X822.000續(xù)表4-2分組統(tǒng)計(jì)量分類有效的N(列表狀態(tài))未加權(quán)的已加權(quán)的2.00X11717.000X21717.000X31717.000X41717.000X51717.000X61717.000X71717.000X81717.0003.00X188.000X288.000X388.000X488.000X588.000X688.000X788.000X888.0004.00X144.000X244.000X344.000X444.000X544.000X644.000X744.000X844.000合計(jì)X13131.000X23131.000X33131.000X43131.000X53131.000X63131.000X73131.000X83131.000從表中可以得出分組變量和合計(jì)的均數(shù)、標(biāo)準(zhǔn)差和有效個(gè)案的例數(shù)。表4-3典型判別函數(shù)的特征值表函數(shù)特征值方差的%累積%正則相關(guān)性120.722a63.963.9.977210.621a32.796.6.95631.108a3.4100.0.725注:a.分析中使用了前3個(gè)典型判別式函數(shù)特征值為組間平方和與組內(nèi)平方和之比,從表中可以讀出三個(gè)判別函數(shù)的特征值分別為20.711、10.621、1.108,對(duì)應(yīng)的典型相關(guān)系數(shù)為0.977、0.956、0.725。表4-4Willks檢驗(yàn)函數(shù)檢驗(yàn)Wilks的Lambda卡方dfSig.1到3.002150.64624.0002到3.04176.76614.0003.47417.8986.006從表4-4中可知,此次判別是合理的。表4-5標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)自變量函數(shù)123X1-1.4402.0181.174X2-.6401.5551.397X31.652-.894-1.774X4.590.295.543X5-.142-2.098.912X6.390-1.402-.667X7.5941.408.059X8.433.423-.474從上表中可知,標(biāo)準(zhǔn)化函數(shù)為:Z1=-1.44X1-0.64X2+1.652X3+0.59X4-0.142X5+0.39X6+0.594X7+0.433X8Z2=2.018X1-1.555X2-0.894X3+0.395X4-2.098X5-1.402X6+1.408X7+0.423X8Z3=1.174X1+1.397X2-1.774X3+0.543X4+0.912X5-0.667X6+0.059X7-0.474X8表4-6Fisher的線性判別式函數(shù)自變量分類1.002.003.004.00X146.4696.367-1.347-46.804X226.920.967.867-16.987X3-18.300-9.963-5.82157.192X49.178-2.5981.6078.930X5-65.4691.90611.6995.834X6-32.052-.858.95714.716X748.564-4.693-3.3589.832X814.174-3.413-4.0339.261(常量)-72.583-4.210-3.587-57.239由表4-6可以得出Fisher判別準(zhǔn)則的四個(gè)判別函數(shù)如下:F1=-72.583+46.469X1+26.92X2-18.3X3+9.178X4-65.469X5-32.052X6+48.564X7+14.174X8F2=-4.21+6.367X1+0.967X2-9.963X3-2.598X4+1.906X5-0.858X6-4.693X7-3.413X8F3=-3.587-1.347X1+0.867X2-5.821X3+1.607X4+11.699X5+0.957X6-3.358X7-4.033X8F4=-57.239-46.804X1-16.987X2+57.192X3+8.93X4+5.834X5+14.716X6+9.832X7+9.261X8判別函數(shù)用于對(duì)觀測(cè)值分類,即將各觀測(cè)值代入這四個(gè)判別函數(shù)中計(jì)算,哪一個(gè)判別函數(shù)值最大,就判為那一類。表4-7分類結(jié)果分類預(yù)測(cè)組成員合計(jì)1.002.003.004.00初始計(jì)數(shù)1.00200022.0001700173.00017084.0000044%1.00100.0.0.0.0100.02.00.0100.0.0.0100.03.00.012.587.5.0100.04.00.0.0.0100.0100.0交叉驗(yàn)證a計(jì)數(shù)1.00200022.0001700173.00017084.0000134%1.00100.0.0.0.0100.02.00.0100.0.0.0100.03.00.012.587.5.0100.04.00.0.025.075.0100.0注:a.僅對(duì)分析中的案例進(jìn)行交叉驗(yàn)證。在交叉驗(yàn)證中,每個(gè)案例都是按照從該案例以外的所有其他案例派生的函數(shù)來分類的。b.已對(duì)初始分組案例中的96.8%個(gè)進(jìn)行了正確分類。c.已對(duì)交叉驗(yàn)證分組案例中的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年上海市房屋買賣居間合同模板(2篇)
- 2025年個(gè)人借款協(xié)議結(jié)婚(三篇)
- 2025年上半年公路管理段工作總結(jié)(三篇)
- 2025年上半年設(shè)備維修員工工作總結(jié)范文(二篇)
- 2025年12月試用期工作總結(jié)(2篇)
- 二零二五年度公司股東間無息借款及風(fēng)險(xiǎn)控制合同
- 2025年度美容行業(yè)員工勞動(dòng)合同范本解讀與適用
- 二零二五年度游艇碼頭租賃及水上安全培訓(xùn)合同
- 2025年度親子早教中心輔導(dǎo)班轉(zhuǎn)讓合同協(xié)議書
- 2025合同模板文藝巡回演出合同范本
- 2025福建新華發(fā)行(集團(tuán))限責(zé)任公司校園招聘30人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 山東鐵投集團(tuán)招聘筆試沖刺題2025
- 圖像敘事的跨學(xué)科視野-洞察分析
- 2025年中考英語總復(fù)習(xí):閱讀理解練習(xí)題30篇(含答案解析)
- 陜西省英語中考試卷與參考答案(2024年)
- 基于OBE理念的世界現(xiàn)代史教學(xué)與學(xué)生歷史思維培養(yǎng)探究
- 施工現(xiàn)場(chǎng)揚(yáng)塵污染治理巡查記錄
- 2024年列車員技能競(jìng)賽理論考試題庫500題(含答案)
- 中南大學(xué)《藥理學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 《無人機(jī)測(cè)繪技術(shù)》項(xiàng)目3任務(wù)2無人機(jī)正射影像數(shù)據(jù)處理
- 《ISO 55013-2024 資產(chǎn)管理-數(shù)據(jù)資產(chǎn)管理指南》專業(yè)解讀和應(yīng)用指導(dǎo)材料(雷澤佳編制-2024B0)-121-240
評(píng)論
0/150
提交評(píng)論