數(shù)理統(tǒng)計 作業(yè)四_第1頁
數(shù)理統(tǒng)計 作業(yè)四_第2頁
數(shù)理統(tǒng)計 作業(yè)四_第3頁
數(shù)理統(tǒng)計 作業(yè)四_第4頁
數(shù)理統(tǒng)計 作業(yè)四_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1.用主成分分析方法探討城市工業(yè)主體結(jié)構(gòu)。表1是某市工業(yè)部門13個行業(yè)8項指標(biāo)的數(shù)據(jù)。表1某市工業(yè)部門13個行業(yè)8項指標(biāo)的數(shù)據(jù)年末固定資產(chǎn)凈值(萬元)職工人數(shù)(人)工業(yè)總產(chǎn)值(萬元)全員勞動產(chǎn)率(元/人年)百元固定原資產(chǎn)值實現(xiàn)產(chǎn)值(元)資金利稅率(%)標(biāo)準(zhǔn)燃料消費(fèi)量(噸)能源利用效果(萬元/噸)1(冶金)90342524551010911927282.00016.1001974350.1722(電力)4903197320351031334.2007.1005920770.0033(煤炭)6735211393767178036.1008.2007263960.0034(化學(xué))4945436241815572250498.10025.9003482260.9855(機(jī)械)1391902035052158981060993.20012.6001395720.6286(建材)122151621910351638262.5008.7001458180.0667(森工)23726572810312329184.40022.200209210.1528(食品)11062230785493523804370.40041.000654860.2639(紡織)17111239075210821796221.50021.500638060.27610(縫紉)12063930612615586330.40029.50018400.43711(皮革)21505704620010870184.20012.00089130.27412(造紙)525161551038316875146.40027.500787960.15113(文教藝術(shù)用品)1434113203193961469194.60017.80063541.5741)試用主成分分析方法確定8項指標(biāo)的樣本主成分(綜合變量);若要求損失信息不超過15%,應(yīng)取幾個主成分;并對這幾個主成分進(jìn)行解釋;2)利用主成分得分對13個行業(yè)進(jìn)行排序和分類。解:先將給出的的數(shù)據(jù)導(dǎo)入到Spass軟件對導(dǎo)入的數(shù)據(jù)進(jìn)行因子分析得到

KMO與Bartlett檢定Kaiser-Meyer-Olkin測量取樣適當(dāng)性。.463Bartlett的球形檢定大約卡方96.957df28顯著性.000首先進(jìn)行KMO檢驗和巴特利球體檢驗,KMO檢驗系數(shù)=0.96957>0.5P值<0.05,所以能進(jìn)行因子分析。說明的變異數(shù)總計元件起始特徵值擷取平方和載入循環(huán)平方和載入總計變異的%累加%總計變異的%累加%總計變異的%累加%13.10538.81138.8113.10538.81138.8113.03237.90337.90322.89736.21875.0292.89736.21875.0292.97037.12775.02930.93011.62886.6570.93011.62886.6570.93011.62886.65740.6428.02794.68450.3043.80198.48560.0871.08299.56770.0320.40299.96980.0020.031100.000擷取方法:主體元件分析。循環(huán)平方和載入,累加達(dá)到85%,所以取三個指標(biāo),即累加達(dá)到86.657%旋轉(zhuǎn)元件矩陣a元件123年末固定資產(chǎn)凈值.975-.084.108職工人數(shù).965-.093.044工業(yè)總產(chǎn)值.989.090.093全員勞動產(chǎn)率.121.822.204百元固定原資產(chǎn)值實現(xiàn)產(chǎn)值-.169.906-.181資金利稅率-.088.931.021標(biāo)準(zhǔn)燃料消費(fèi)量-.020-.700-.289能源利用效果.141.139.961擷取方法:主體元件分析。轉(zhuǎn)軸方法:具有Kaiser正規(guī)化的最大變異法。a.在4疊代中收斂循環(huán)。由旋轉(zhuǎn)矩陣分析可知,八個指標(biāo)分為三類第一類:年末固定資產(chǎn)凈值,職工人數(shù),工業(yè)總產(chǎn)值第二類:全員勞動產(chǎn)率,百元固定原資產(chǎn)值實現(xiàn)產(chǎn)值,資金利稅率,標(biāo)準(zhǔn)燃料消費(fèi)量第三類:能源利用效果(2)對原始數(shù)據(jù)進(jìn)行歸一化處理,計算相應(yīng)的得分,結(jié)果如下:最后的結(jié)果如上表最后一列所示,根據(jù)數(shù)值的正負(fù)號分成兩類,利用主成分得分對13個行業(yè)進(jìn)行排序和分類如下:第一類:1(冶金)4(化學(xué))5(機(jī)械)8(食品)13(文教)第二類:9(紡織)6(建材)7(森工)10(縫紉)11(皮革)12(造紙)2(電力)3(煤炭)

2.下表是某年美國50州每10萬人中各種類型犯罪的犯罪率數(shù)據(jù),分析找出主要的犯罪類型、列出主成分與原始變量的線性關(guān)系式,分析解釋主成分及其特征,排序說明每州主要的犯罪類型。州名殺人罪汽車犯罪ALABAMA14.225.296.8278.33017.4280.7ALASKA10.851.696.82844701.5753.3ARIZONA9.534.2138.2312.36813.5439.5ARKANSAS8.827.683.2203.42834.7183.4CALIFORNIA11.549.42873585639.2663.5COLORADO6.342170.7292.95838.4477.1CONNECTICUT4.216.8129.5131.83966.7593.2DELAWARE624.9157194.25361467FLORIDA10.239.6187.9449.15700.4351.4GEORGIA11.731.1140.5256.53521.3297.9HAWAII7.225.512864.15831.9489.4IDAHO5.519.439.6172.53650.4237.6ILLINOIS9.921.8211.32093913.5528.6INDIANA7.426.5123.2153.53584.9377.4IOWA2.310.641.289.83497.6219.9KANSAS6.622100.7180.54009.7244.3KENTUCKY123.32534.3245.4LOUISIANA15.530.9142.9335.53635.4337.7MAINE2.413.538.71703603.8246.9MARYLAND834.8292.1358.94577.7428.5MASSACHUSETTS3.120.8169.1231.63843.51140.1MICHIGAN9.338.9261.9274.64681.7545.5MINNESOTA2.719.585.985.83694343.1MISSISSIPPI14.319.665.7189.12155.5144.4MISSOURI9.628.3189233.53742.5378.4MONTANA5.416.739.2156.83578.1309.2NEBRASKA3.918.164.7112.73076.1249.1NEVADA15.849.1323.13556665.7559.2NEWHAMPSHIRE3.210.723.2763385.6293.4NEWJERSEY5.621180.4185.14210.3511.5NEWMEXICO8.839.1109.6343.44427.3259.5NEWYORK10.729.4472.6319.14510745.8NORTHAROLINA10.61761.3318.33191.9192.1NORTHDAKOTA0.9913.343.82289.1144.7OHIO7.827.3190.5181.13912.8400.4OKLAHOMA8.629.273.82053516.3326.8OREGON4.939.9124.1286.95142.5388.9PENNSYLVANIA5.619130.31282501.6333.2RHODEISLAND3.610.586.52014333.6791.4SOUTHCAROLINA11.933105.9485.33956245.1SOUTHDAKOTA213.517.9155.72274.9147.5TENNESSEE10.129.7145.8203.93036.2314TEXAS13.333.8152.4208.24591.8397.6UTAH3.520.368.8147.34176.2334.5VERMONT1.415.930.8101.23549.2265.2VIRGINIA923.392.1165.73507.4226.7WASHINGTON4.339.6106.2224.84992.5360.3WESTVIRGINIA613.242.290.91939.1163.3WISCONSIN2.812.952.263.73461.1220.7WYOMING5.421.939.7173.93583.8282解:將上表中各項數(shù)據(jù)導(dǎo)入到SPSS,進(jìn)行因子分析。KMO檢驗和巴特利球體檢驗,KMO檢驗系數(shù)=0.763>0.5P值<0.05,所以能進(jìn)行因子分析。元件矩陣a元件123殺人罪.666-.619.279強(qiáng)奸罪.885-.156-.261搶劫罪.822.185.369斗毆罪.833-.321-.079偷盜罪.764.344-.471汽車犯罪.580.694.290擷取方法:主體元件分析。a.擷取3個元件。分析元件矩陣可以知道主要的犯罪類型為:強(qiáng)奸罪,搶劫罪,斗毆罪。主成分與原始變量的線性關(guān)系式:F1=0.666X1+0.885X2+0.822X3+0.833X4+0.764X5+0.580X6F2=-0.619X1-0.156X2+0.185X3-0.321X4+0.344X5+0.694X6F3=0.279X1-0.261X2+0.369X3-0.079X4-0.471X5+0.290X6循環(huán)平方和累加三項后達(dá)87.62%達(dá)到要求,分析主成分分為三類。旋轉(zhuǎn)元件矩陣a元件123殺人罪.948.058.060強(qiáng)奸罪.593.699.190搶劫罪.505.235.732斗毆罪.732.494.150偷盜罪.097.888.356汽車犯罪-.033.251.915擷取方法:主體元件分析。轉(zhuǎn)軸方法:具有Kaiser正規(guī)化的最大變異法。a分為三類,第一類:殺人罪,偷盜罪第二類:強(qiáng)奸罪,斗毆罪第三類:搶劫罪,汽車犯罪(3)經(jīng)過歸一化處理,并與相應(yīng)的系數(shù)相乘,得到如下結(jié)果:

3.采用因子分析法對美國50州的六種犯罪率數(shù)據(jù)進(jìn)行分析,找出公共因子(假定2個),列出六種犯罪與公共因子的關(guān)系式,推導(dǎo)公共因子與六種犯罪的關(guān)系式,計算因子得分與綜合得分,并對各州犯罪率按綜合得分排序解釋。解:對于第二題采用因子分析法得出以下結(jié)論:

X1=0.805C1+0.036C2X2=0744C1+0.478C2X3=0.472C1+0.633C2X4=0.789C1+0.324C2X5=0.345C1+0.633C2X6=0.026C1+0.803C2C1=0.805X1+0.744X2+0.472X3+0.789X4+0.345X5+0.026X6C2=0.036X1+0.478X2+0.633X3+0.324X4+0.663X5+0.803X64.某汽車組織欲根據(jù)一系列指標(biāo)來預(yù)測汽車的銷售情況,為了避免有些指標(biāo)間的相關(guān)關(guān)系影響預(yù)測結(jié)果,需首先進(jìn)行因子分析來簡化指標(biāo)系統(tǒng)。下表是抽查歐洲某汽車市場7個品牌不同型號的汽車的各種指標(biāo)數(shù)據(jù),試用因子分析法找出其簡化的指標(biāo)系統(tǒng)。品牌價格發(fā)動機(jī)功率軸距寬長軸距燃料容量燃料效率A215001.8140101.267.3172.42.63913.228A284003.2225108.170.3192.93.51717.225A420003.5210114.671.4196.63.85018.022B239901.8150102.668.2178.02.99816.427B339502.8200108.776.1192.03.56118.522B620004.2310113.074.0198.23.90223.721C269902.5170107.368.4176.03.17916.626C334002.8193107.368.5176.03.19716.624C389002.8193111.470.9188.03.47218.525D219753.1175109.072.7194.63.36817.525D253003.8240109.072.7196.23.54317.523D319653.8205113.874.7206.83.77818.524D278853.8205112.273.5200.03.59117.525E398954.6275115.374.5207.23.97818.522E396654.6275108.075.5200.63.84319.022E310103.0200107.470.3194.83.77018.022E462255.7255117.577.0201.25.57230.015F132602.2115104.167.9180.92.67614.327F165353.1170107.069.4190.43.05115.025F188903.1175107.572.5200.93.33016.625F193903.4180110.572.7197.93.34017.027F243403.8200101.174.1193.23.50016.825F457055.7345104.573.6179.73.21019.122F139601.812097.166.7174.32.39813.233F92351.05593.162.6149.41.89510.345F188903.4180110.573.0200.03.38917.027G198402.5163103.769.7190.92.96715.924G244952.5168106.069.2193.03.33216.024G222452.7200113.074.4209.13.45217.026G164802.0132108.071.0186.02.91116.027G283403.5253113.074.4207.73.56417.023G291853.5253113.074.4197.83.56717.023解:將上述數(shù)據(jù)輸入到SPSS軟件,用因子分析法找出其簡化的指標(biāo)系統(tǒng)。

因子1由價格、發(fā)動機(jī)、功率和燃料容量相關(guān)性較大,主要表征發(fā)動機(jī)及其相關(guān)性能。因子2有軸距1、軸距2、寬、長、燃料效率表征車的物理特征以及燃料的化學(xué)性質(zhì)。

5.根據(jù)某年我國31個省市自治區(qū)的6項主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),進(jìn)行因子分析,找出公因子并進(jìn)行適當(dāng)?shù)慕忉?,計算各地區(qū)的因子得分并進(jìn)行排序。解:31個省市自治區(qū)的6項主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),進(jìn)行因子分析。KMO檢驗和巴特利球體檢驗,KMO檢驗系數(shù)=0.763>0.5P值<0.05,所以能進(jìn)行因子分析。

分析結(jié)果如下圖所示:因子1主要由財政收入、固定資產(chǎn)投資、年末人口數(shù)及社會消費(fèi)品零售總額。主要表征宏觀的經(jīng)濟(jì)指標(biāo);因子2由人均GDP和居民消費(fèi)水平,主要表征微觀的指標(biāo)回歸到居民層面生活水平。地區(qū)的因子得分并進(jìn)行排序:廣東江蘇山東上海浙江北京河南遼寧河北四川福建天津湖北湖南安徽內(nèi)蒙古5.124.384.324.143.743.352.532.452.282.101.881.871.831.751.521.39黑龍江山西吉林廣西江西陜西重慶云南新疆貴州甘肅海南寧夏青海西藏1.351.360.770.630.550.390.360.280.10

6.以第5題數(shù)據(jù)為例,采用分層聚類法分析聚類過程,并對結(jié)果詳細(xì)解釋。解:對于第五題給出的數(shù)據(jù)進(jìn)行聚類分析表(1)

表(2)表(3)表(4)結(jié)果分析如下表(1)、表(2)、表(3)、表(4)顯示共31個省市自治區(qū)進(jìn)入聚類分析采用相關(guān)系數(shù)測量技術(shù),先顯示各變量間的相關(guān)系數(shù)這對于后面選擇典型變量是十分有用的然后顯示類間平均鏈鎖法的合并進(jìn)程即第一步7與22被合并它們之間的相關(guān)系數(shù)最大為202098.45第二步21與30合并其間相關(guān)系數(shù)為212741.530第三步20與25合并其間相關(guān)系數(shù)為290480.620第四步14與第三步合并其間相關(guān)系數(shù)為373585.330第五步4與8合并其間相關(guān)系數(shù)為437582.580第六步21與29合并其間相關(guān)系數(shù)為573991.825第七步28與31合并第八步17與18合并第九步14與27合并。。。。。。。。。。。。。。。。具體結(jié)果看樹狀圖.圖(4)顯示按類間平均鏈鎖法變量合并過程的冰柱圖如上所示

7.以第5題數(shù)據(jù)為例,采用K均值聚類法計算聚類中心,將每個省級單元?dú)w入相應(yīng)類別。解:將第五題做K均值聚類法計算。首先將數(shù)據(jù)輸入到spss軟件,設(shè)置相關(guān)分析。得出以下結(jié)論:表(1)表(2)表(3)表(4)表(5)數(shù)據(jù)輸出如上圖所示,表(1)到表(3)顯示首先系統(tǒng)根據(jù)要求的按4類聚合確定初始聚類的各變量中心點(diǎn)未經(jīng)K-means算法疊代其類別間距離并非最優(yōu)經(jīng)疊代運(yùn)算后類別間各變量中心值得到修正。表4,表5顯示對聚類結(jié)果的類別間距離進(jìn)行方差分析方差分析表明類別間距離差異的概率值均人均GDP,財政收入,固定資產(chǎn)投資,居民消費(fèi)水平,社會消費(fèi)品零售總額均<0.001,年末總?cè)丝?0.004在0.001——0.005之間即聚類效果好,這樣原有31個省市自治區(qū)聚合成4類第一類含原有10類第二類含原有5類第三類含原有1類第四類含原有15類具體結(jié)果系統(tǒng)以變量名QCL_1存于原始數(shù)據(jù)文件中如下圖所示:北京天津河北山西內(nèi)蒙古遼寧吉林黑龍江上海江蘇浙江安徽福建江西山東河南湖北湖南廣東廣西海南重慶四川貴州云南西藏陜西甘肅青海寧夏新疆2111414422211421113444144444444貴州云南西藏陜西甘肅青海寧夏新疆44444444

在原始數(shù)據(jù)文件中我們可清楚地看到聚類結(jié)果參照各項指標(biāo)將每個省級單元?dú)w入相應(yīng)類別:第一類:天津,河北,山西,遼寧,安徽,福建,河南,湖北,湖南。第二類:北京,上海,江蘇,浙江,山東。第三類:廣東第四類:內(nèi)蒙古,吉林,黑龍江,江西,廣西,海南,重慶,貴州,云南,西藏,陜西,甘肅,青海,寧夏,新疆。

8某體育訓(xùn)練項目采用6個指標(biāo)(x1-x6)評價運(yùn)動員的競技水平,分成兩個級別,數(shù)據(jù)記錄如下表。NoLevelx1x2x3x4x5x6113.64.382.3709018.528010018.48313.34.287.78511518.5647510019.1513.14.4909512020.14613.24.989.18510519.44713.34.289758519.17813.54.584.28010018.8913.74.682.1708517.681013.44.490.27510019.141113.64.382.1709018.11213.64.582557017.41313.64.282.2709018.121413.44.285.48510018.661513.34.390.18010019.861613.14.28985100201713.14.290.28511520.81813.64.282658017.21913.74.4818095172013.34.3908011019.82113.84.180608016.892213.74.383.98510018.762313.54.285.48510018.7248511018.525758518.9626709518.72713.64.382709018.42813.24.289.28511519.882923.441039511024.83023.34.51189012025.73123.14.51058511025.13223.84.1104.58010024.9833234.21129512525.353423.93.798.2859021.8359012022.783623.13.998.2609021.983723.33.910910012025.33823.1498.49511525.23923.13.995.39011021.424023.64.393.6758520.844123.13.995.88010521.842233.993.8859021.084323.43.996.311012021.984423.63.898.68512022.364523.3497.48510022.344623.34.41127511025.14723.54.1107.78811025.14823.44.292.18012022.16498512023.15023.14.41167511025.35123.14102.78011024.685223.64.11158511523.75323.54.397.87510024.1分別采用距離判別法、Fisher判別法和逐步判別法,試建立一個合理的判別標(biāo)準(zhǔn),然后利用這一標(biāo)準(zhǔn)對未知類別的新運(yùn)動員進(jìn)行分類。解:(1)Fisher判別法群組平均值的等式檢定Wilks'Lambda(λ)Fdf1df2顯著性X1.9671.751151.192X2.80112.647151.001X3.321107.974151.000X4.8449.462151.003X5.79613.079151.001X6.228172.766151.000聯(lián)合組內(nèi)矩陣X1X2X3X4X5X6相關(guān)X11.000-.064-.317-.301-.386-.386X2-.0641.000.337-.109.070.326X3-.317.3371.000.243.454.806X4-.301-.109.2431.000.738.355X5-.386.070.454.7381.000.546X6-.386.326.806.355.5461.000變數(shù)已輸入/已移除a,b,c,d步驟已輸入Wilks'Lambda(λ)統(tǒng)計資料df1df2df3確切F統(tǒng)計資料df1df2顯著性1X6.2281151.000172.766151.000.0002X2.1742151.000118.467250.000.0003X5.1583151.00086.800349.000.000在每一個步驟中,輸入最小化整體Wilks'Lambda的變數(shù)。a.步驟的數(shù)目上限為12。b.要輸入的局部F下限為3.84。c.要移除的局部F上限為2.71。d.F層次、容差或VIN不足,無法進(jìn)行進(jìn)一步計算。

Wilks'Lambda(λ)步驟變數(shù)數(shù)目Lambda(λ)df1df2df3確切F統(tǒng)計資料df1df2顯著性11.2281151172.766151.000.00022.1742151118.467250.000.00033.158315186.800349.000.000分類函數(shù)係數(shù)LEVEL12X297.94384.673X5.321.168X64.3728.499常數(shù)-267.004-282.903費(fèi)雪(Fisher)線性區(qū)別函數(shù)

9.某品牌家電在兩個城市銷售,其中A城市有6個商場、B城市有8個商場銷售,下表是各商場一年的銷售量,試分析該品牌家電在這兩個城市的銷售量是否有顯著差異?(a=0.05)商場序號A城商場序號B城1545156024892551

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論