版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
多元統(tǒng)計分析課程論文我國農村居民收入與支出多元統(tǒng)計分析班級:統(tǒng)計1203姓名:李犁學號:13041207242015年7月目錄TOC\o"1-5"\h\z\o"CurrentDocument"引言 3\o"CurrentDocument"1.1研究問題的背景 3\o"CurrentDocument"1.2研究問題的目的 3\o"CurrentDocument"分析方法的簡單介紹 4\o"CurrentDocument"2.1主成分分析 42.1.1主成分分析的思想 4\o"CurrentDocument"2.1.2主成分分析的幾何意義 4\o"CurrentDocument"2.2聚類分析 52.2.1聚類分析的思想 5\o"CurrentDocument"2.2.2聚類分析的過程 5\o"CurrentDocument"農村居民收入的多元統(tǒng)計分析 5\o"CurrentDocument"3.1主成分分析 5\o"CurrentDocument"3.2聚類分析 7\o"CurrentDocument"農村居民支出的多元統(tǒng)計分析 9\o"CurrentDocument"4.1主成份分析 9\o"CurrentDocument"4.2聚類分析 11\o"CurrentDocument"結論 13【摘要】本文主要研究農村居民收入與支出的相關問題,利用spss軟件,首先對農村居民收入進行了數(shù)據(jù)的收集和整理,數(shù)據(jù)取自中國統(tǒng)計年鑒網(wǎng)絡實時數(shù)據(jù),利用多元統(tǒng)計分析中的主成分分析,分析影響農村居民收入的幾個重要因素。再對其進行聚類分析,按照農村居民不同的收入對30個省、自治區(qū)、直轄市進行聚類,分出幾個不同的收入等級。然后對農村居民支出情況的數(shù)據(jù)進行主成分分析,分析影響收入的因素,再對其進行聚類分析,分析不同的支出等級,最后將收入與支出綜合分析,大致得出結論,我國實際的居民收入與消費結構還存在一定的不合理。【關鍵詞】農村居民收入農村居民支出主成分分析聚類分析1.引言1.1研究問題的背景我國是發(fā)展中的農業(yè)人口大國,農業(yè)的基礎地位和作用比任何國家都重要,小康目標能否全面實現(xiàn),重點、難點在提高人民收入,要實現(xiàn)農村穩(wěn)定,農民小康和農業(yè)現(xiàn)代化,前提條件就是要保持農民收入的持續(xù)穩(wěn)定的快速發(fā)展。2000年,在國家連續(xù)三年擴大內需的宏觀政策作用下,我國居民消費保持了穩(wěn)中有旺的運行態(tài)勢。但是從城鄉(xiāng)消費結構來看,農村消費明顯不如城市消費活躍。農村消費之所以增長緩慢,主要是因為農村居民收入停滯不前以及受到農村傳統(tǒng)消費觀念的主導1.2研究問題的目的勞動者報酬收入和家庭主營收入已成為農民收入的主要來源,但是由于我國經濟發(fā)展的不平衡,各地區(qū)的農民收入有著很大不同,另一方面,經濟改革使得地區(qū)之間、農民內部之間的富裕家庭和貧窮家庭之間的收入差距越來越大。“二元思維”造就了經濟發(fā)展層面上的“兩個中國”-----“城市中國”和“農村中國”,“三農”問題日益突出,“三農”問題的核心是農民問題,即農民利益和平等待遇問題,“三農”是我國的根本問題,建設現(xiàn)代化農業(yè)、發(fā)展農村經濟、增加農民收入,始終是中國政府面臨的重大問題如何客觀準確的分析這些差異,具有重要的理論和實際意義,因此,本文試圖用多元統(tǒng)計分析對我國各地區(qū)農民收入來源及消費支出問題進行全面深入的分析。
分析方法的簡單介紹2.1主成分分析2.1.1主成分分析的思想主成分分析也稱主分量分析,由于多個變量之間往往存在著一定程度的相關性。人們自然希望通過線性組合的方式,從這些指標中盡可能快地提取信息。當?shù)谝粋€線性組合不能提取更多的信息時,再考慮用第二個線性組合繼續(xù)這個快速提取的過程,直到所提取的信息與原指標相差不多時為止。這就是主成分分析的思想。一般說來,在主成分分析適用的場合,用較少的主成分就可以得到較多的信息量。以各個主成分為分量,就得到一個更低維的隨機向量;因此,通過主成分既可以降低數(shù)據(jù)“維數(shù)”又保留了原數(shù)據(jù)的大部分信息。2.1.2主成分分析的幾何意義主成分分析數(shù)學模型中的正交變換,在幾何上就是作一個坐標旋轉。因此,主成分分析在二維空間中有明顯的幾何意義。假設共有n個樣品,每個樣品都測量了兩個指標(XI,X2),它們大致分布在一個橢圓內如圖1所示。事實上,散點的分布總有可能沿著某一個方向略顯擴張,這個方向就把它看作橢圓的長軸方向。顯然,在坐標系x1Ox2中,單獨看這n個點的分量X1和X2,它們沿著x1方向和x2方向都具有較大的離散性,其離散的程度可以分別用的X1方差和X2的方差測定。如果僅考慮X1或X2中的任何一個分量,那么包含在另一分量中的信息將會損失,因此,直接舍棄某個分量不是'降維”的有效辦法。,這里
,這里的長軸方向,%是橢圓的短軸方向。旋轉公式為Y=X.cos0+Xsin0Y=-X.sin0+Xcos0我們看到新變量Y和Y是原變量%和%的線性組合,它的矩陣表示形式為:Y2」=T'Xcos0sin0)「XY2」=T'X?A AV1一sin0cos0)X其中,T'為旋轉變換矩陣它是正交矩陣,即有其中,T'為旋轉變換矩陣它是正交矩陣,即有T,=T-1或T,T=I2.2聚類分析2.2.1聚類分析的思想根據(jù)距離相近的樣品(或變量)先聚成類,距離相遠的后聚成類,過程一直進行下去,每個根據(jù)距離相近的樣品(或變量)樣品(或變量)總能聚到合適的類中。2.2.2聚類分析的過程假設總共有n個樣品(或變量),第一步將每個樣品(或變量)獨自聚成一類,共有n類;第二步根據(jù)所確定的樣品(或變量)“距離”公式,把距離較近的兩個樣品(或變量)聚合為一類,其它的樣品(或變量)仍各自聚為一類,共聚成n-1類;第三步將“距離”最近的兩個類進一步聚成一類,共聚成n-2類;……以上步驟一直進行下去,最后將所有的樣品(或變量)全聚成一類。為了直觀地反映以上的系統(tǒng)聚類過程,可以把整個分類系統(tǒng)畫成一張譜系圖。所以有時系統(tǒng)聚類也稱為譜系分析。農村居民收入的多元統(tǒng)計分析3.1主成分分析利用Spss軟件,對農村居民收入情況的數(shù)據(jù)進行主成分分析,分析結果如圖一:相關矩陣a
純收入工資性收入家庭經營純收入財產性收入轉移性收入相關 純收入1.000.932-.094.881.768工資性收入.9321.000-.398.865.738家庭經營純收入-.094-.3981.000-.342-.435財產性收入.881.865-.3421.000.817轉移性收入.768.738-.435.8171.000a.此矩陣不是正定矩陣。解釋的總方差成份初始特征值提取平方和載入合計方差的%累積%合計方差的%累積%13.65473.08273.0823.65473.08273.0822.94518.89791.9793.2775.53397.5124.1242.488100.0005-3.088E-16-6.177E-15100.000提取方法:主成份分析。公因子方差初始提取純收入1.000.853工資性收入1.000.901家庭經營純收入1.000.197財產性收入1.000.901轉移性收入1.000.803提取方法:主成份分析。成份矩陣a成份1純收入.924工資性收入.949家庭經營純收入-.444財產性收入.949轉移性收入.896提取方法:主成份。成份矩陣a成份1純收入.924工資性收入.949家庭經營純收入-.444財產性收入.949轉移性收入.896提取方法:主成份。a.已提取了1個成份。第一個主成分中的4個變量在0.05水平上都是顯著的,相關系數(shù)越大,說明該主成分受該指標的影響也越大,因此,決定第一個主成分prinl大小的主要是x1、x2、x3、x4第一個主成分即可反映農村居民收入情況。3?2聚類分析通過以上主成分分析可得出:第一主成分得分prinl=0.484576X+0.519507X+0.506076X+0.489065X;12 3 4第二主成分得分prin2=0.690316X+0.212978X—0.260739X—0.640406X;12 3 4綜合得分E=0.8080prin1+0.1133prin2;其中,0.8080為第一主成分貢獻率,0.1133為第二主成分貢獻率。對數(shù)據(jù)進行聚類分析,可得出結果如圖四:圖四聚類分析結果1
NCL --Clu^ter^Joined—-H-87654321o9876543210987654321222222222211111111113G86-UUNCL --Clu^ter^Joined—-H-87654321o9876543210987654321222222222211111111113G86-UU91O496533-uuO52671_uu1222241112121118-H-7542BBBBBBBnDLLLBLBBLLLLLLLBLLLLLLoooooooocccocoocccccccoccccccOB2510.00001.00.22S80.0521OB2820.00001.00■21340.0577OB29■i.:0.00001.0010110.0710B1520.00001.0017220.07130B21■L:0.00011.0014110.0876OB2020.00011.0012710.1001CL2E30.00011.0010253:60J17&OB22冬0.00011.009220.1337CL274o.oooa'.999641iz:00.160B3030.000258612.50.16U30B2450.0002^.9995511.90.1735OBIO20.0002.999&340.192CL2Z50.0005.9884564:40.2004OBI220.0003.9984510.2242CL2430.0005.9974193:40.2553OB2760.0008.987■■&715.50.2896CL1770.0015.995?罰47.00.-S259CL1550.0018.9837458.備0/8794CL1413o.oosa.98815815.00.4098OBS40.0014.987165.21:g0.4120B1830.002^.98516710.Z0.5341CL1290.0070.97813712.30.575Z0B11Z0.0035.9741440.7770Bt3-100.0070.967,871-.541415:10.8467CL11:瀏0.0654.90Z.960-3J57.S'50.7i.oauCL950.0229.879.瑚-2.9眼811.81.3備160B17240.0335.845.89g-1.673;88.01.7496CL3.餐0.4359.409.756-4.019.476.13.04310B9300.408a.000.0000.0019.46.0761FREQSPRSQRSQERS0CCC P野 PST2D'ist由聚類分析結果1可以看出:當NCL為2時,半偏R2(SPRSQ)較大,0.4359,說明RSQ在從NCL為3到2的過程中減少了0.4359,說明NCL為3時為最優(yōu),再看CCC值,由于CCC無正數(shù),所以忽略,再看PSF,當PSF在NCL=3時達到峰值73.8,最后看PST2,在NCL=3時增加到NCL=2的增加量最多,因此,將其分為3類。圖五聚類分析結果20B10B110B206100B190B30B60B150B50E210B140B180B200B13OB250B3C0B16OB250B3C0B160K22OB23-I0B23-H0B26-ij0B24——0B27——0B17 咿——0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 45 5.0 5.5 6.0 6.5第一類為高收入地區(qū):上海第二類為中等收入地區(qū):北京、浙江、天津、江蘇、廣東第三類為低收入地區(qū):河北、遼寧、山東、黑龍江、吉林、海南、江西、湖南、廣西、福建、山西、安徽、內蒙、西藏、新疆、河南、四川、貴州、青海、陜西、寧夏、云南、甘肅、湖農村居民支出的多元統(tǒng)計分析4.1主成份分析對數(shù)據(jù)中的農村居民支出數(shù)據(jù)進行spss主成分分析結果如下:圖六相關矩陣的特征值公因子方差初始提取合計1.000.992食品1.000.830衣著1.000.781居住1.000.717家庭設備1.000.773交通通信1.000.829文教娛樂1.000.888醫(yī)療保健1.000.678其他1.000.909提取方法:主成份分析。圖七主成分分析特征向量解釋的總方差成份初始特征值提取平方和載入合計方差的%累積%合計方差的%累積%17.39682.18282.1827.39682.18282.1822.4905.44087.6233.3674.07391.6964.2753.05094.7465.2152.39397.1396.1251.38798.5267.075.83899.3648.057.636100.0009I3.008E-16I3.342E-15I100.000提取方法:主成份分析。prinl=0.352914X+0.346487X+0.351498X+0.369305X+12 3 40.344809X+0.354944X+0.363822X+0.343825X5 6 7 8X1-x8與prin1-prin8之間的相關系數(shù)如圖所示:圖八相關系數(shù)矩陣成份矩陣a成份1合計.996食品.911衣著.884居住.847家庭設備.879交通通信.910文教娛樂.942醫(yī)療保健.823其他.953提取方法:主成份。a.已提取了1個成份。相關瓶陣合計4. □氏口口衣著居住家庭設備交通通信交教娛樂醫(yī)療保健其他相關 舍計1.000.936.843.855.367.906.931.324.945^2-. □氏□□.9361.000.695.713.348.306.335.632.393衣著.040.6951.000.672776.044.048.679.037居住.055.713.6721.000.701709785759731家庭設備.367.843.776.7011.000717.315.607.325密通通信.906.806.8447097171.000.340701.002交教螟樂.931.835.843.785.015.0401.000728.004醫(yī)療保健.324.682.679.759.6077017281.000759其他.945.893.837.731.325.382.3847591.000弛.(單側)合計.000.000.000.000.000.000.000.000氏□□.000.000.000.000.000.000.000.000衣著.000.000.000.000.000.000.000.000居住.000.000.000.000.000.000.000.000家底設備.000.000.000.000.000.000.000.000密通通信.000.000.000.000.000.000.000.000交教娛樂.000.000.000.000.000.000.000.000醫(yī)療保健.000.000.000.000.000.000.000.000其他.000.000.000.000.000.000.000.000第一個主成分中的8個變量在0.05水平上都是顯著的,相關系數(shù)越大,說明該主成分受該指標的影響也越大,因此,決定第一個主成分prinl大小的主要是x1、x2、x3、x4、x5、x6、x7、x8第一個主成分即可反映農村居民收入情況。由于只抽取了一個變量,所以無法旋轉此解。4.2聚類分析通過以上主成分分析可得出:第一主成分得分prinl=0.352914X+0.346487X+0.351498X+0.369305X+第一主成分得分12 3 40.344809X+0.354944X+0.363822X+0.343825X綜合得分E=0.8955prin1;其中,0.8955為第一主成分貢獻率。對數(shù)據(jù)進行聚類分析,可得出結果:圖九聚類分析結果1
NUL—UlustErsJoined-u-HHbUaw?H!SUtHKUUUU附西1蕓Dist29OB26OB27■20.00001.0048E40.003網(wǎng)0B4OBI60.0000T.00初E40.00S627CL29OB280.00001.00■23E44:00.005226CL280B2S30.0000T.0016E44.30.006525OBE0B8■20.00001.0057E30.017724081^.OB29'20.0000T.00'麗E30.01923OBI4OBI7■20.00001.00酒E30.0241四0B3OB2220.0000T.0022E30.026121CL26OB3040.00001.0016E334J0.02S220CL240B2130.0000T.0012E34.70.085619OB25CLZ740.00001.0093711160.041918CL250B730.0000T.00766010.00.04S417CL21CL1980.00011.00406819.00.0558160B5OB2020.0000T.0040420.060115CL22CL2050.00011.00撇411:30.065414OBI5OBI820.0001T.00物90.077218OBI0B11■20.00011.00⑶940.0918住CL16g40.0004.999:204019:80.144111CL170B2490.0003.999166516.70.1485100B2CL1840.0003.9991506^2.60.16009CL130B18點、0.0007.98812208.30.24218CL1?CL1460.002468321.80,32547OHIO0Bf3■20.0011.9846720.15536CL15CL11140.0080.986:猴0^803461淋L勰此5CLIOCL8100.01S2.973.9730.01■226'35.70.56584CL5CL6*40.085i.888.953冏.674.70.92073CL9CL750.0261.862.907-1.784.242.61.12212CL3CL4290.4301.432.769-4.821.S84.0恚45531CL20B9<300.4317.000.0000.00■^1.35.0891由聚類分析結果1可以看出:當NCL為2時,半偏R2(SPRSQ)較大,0.4301,說明RSQ在從NCL為3到2的過程中減少了0.4301,說明NCL為3時為最優(yōu),再看PSF,當PSF在NCL=3時達到峰值84.2,最后看PST2,在NCL=3時增加到NCL=2的增加量最多,因此,將其分為3類。圖十聚類分析結果20B1—.QB11—I I0019 0B10 0013 0B2——□B6-1 —ass-n—007」005-10020-T~l001<3-i_|~0017J~0B15—|0B18—1~一0B3-10022-*10012-I002940021」00410316I0023%00-30」0025-032610027L0023」0B2J——009 0.00.51.03.05.00.00.51.03.05.0第一類為高消費地區(qū):上海第二類為中等消費地區(qū):北京、浙江、廣東、江蘇、福建第三類為低消費地區(qū):天津、遼寧、黑龍江、吉林、內蒙、廣西、江西、湖北、山東、湖南、河北、四川、安徽、寧夏、海南、山西、河南、貴州、新疆、陜西、甘肅、青海、云南5.結論本次研究主要研究分析了我國各地區(qū)農村居民家庭人均收入與消費支出的統(tǒng)計特性。通過大量的統(tǒng)計數(shù)據(jù),我們不難發(fā)現(xiàn),我國實際的居民收入與消費結構還存在一定的不合理。通過對我國居民收入水平聚類分析以及主成分分析發(fā)現(xiàn),我國居民收入差距并沒有得到明顯的改善;同時對比消費支出統(tǒng)計分析結果發(fā)現(xiàn)高收入地區(qū)不一定對應高消費水平,例如福建省為低收入地區(qū),而其消費水平為高水平,天津市為高收入水平地區(qū),其消費水平卻為低水平。盡管各省份存在貧富差距是市場經濟的結果,但是對于經濟增長起到了一定的促進作用.不過貧富差距必須維持在一個適當?shù)摹岸取鄙?,差距過大會引發(fā)諸多的危害,尤其是不合理因素造成的貧富差距過大,不僅使得社會心理被扭曲,產生諸多的社會安全問題。另外,我們要著重分析一下調整中低收入分配的重要性.基于本文的統(tǒng)計分析,我們知道,我國大多數(shù)省市還處于中低收入水平,從分析結果中可以看出,收入水平低的居民消費量與收入量的比例要遠遠大于高收入群體,消費差距再通過乘數(shù)效應對經濟拉動作用的差距是巨大的。所以應該在保證人民收入穩(wěn)定的基礎上,還要進一步的提高各個階段的消費能力,縮小貧富差距。附錄1參考文獻張九軍.中國農村居民家庭收入來源和燒沸支出的多元統(tǒng)計分析二十一世紀的中國城鎮(zhèn)居民收入與支出的多元統(tǒng)計分析報告何曉群.多元統(tǒng)計分析黃燕,吳萍.SAS統(tǒng)計分析及應用
附錄26-28分地區(qū)農村居民人均消費支出(2013年)單位:元消費支出地區(qū)合計食品衣著居住家庭設備及用品交通通信文教娛樂醫(yī)療保健其他全國6625.52495.5438.31233.6387.1796.0485.9614.2174.9北京13553.24695.91172.92387.0898.21452.21330.91167.1449.1天津10155.03539.7927.61403.4599.11816.2750.4732.6386.0河北6134.11963.3458.01266.8382.6792.3399.0696.0176.1山西5812.71920.7471.81206.0288.2699.1502.5559.0165.4內蒙古7268.32583.5564.71111.6302.31106.5555.2831.2213.3遼寧7159.02518.9584.21279.3299.4850.3632.9789.5204.4吉林7379.72438.5535.21288.4273.1961.2691.4968.6223.4黑龍江6813.62397.7551.11120.9288.7809.3601.4839.2205.2上海14234.75334.6770.72260.4693.71718.7963.71990.9501.9江蘇9909.83283.2685.11788.7556.41420.81022.3809.9343.4浙江11760.24190.9848.11933.8564.91891.11048.0943.9339.5安徽5724.52269.7335.21138.9390.4540.9376.7551.7121.0福建8151.23600.8483.61418.4483.4806.3592.8481.7284.3江西5653.62389.1308.61163.1323.9587.6356.4401.3123.8山東7392.72553.7493.41409.6438.11040.5571.7738.8146.8河南5627.71938.5481.81043.9416.0616.0408.1603.7119.7湖北6279.52308.5347.71415.7425.0605.9407.4624.4144.9湖南6609.52537.0342.31438.3420.3640.0426.3638.3167.1廣東8343.53736.6309.21337.9474.11041.0685.3502.0257.5廣西5205.62084.7170.91360.5281.1516.3276.2413.4102.5海南5465.62625.0181.0937.7291.5589.2354.5362.2124.4
重慶5796.42539.0411.0674.4474.3581.8443.3535.9136.7四川6308.52665.0467.3986.8446.6665.0385.8557.4134.5貴州4740.22036.2254.2980.8272.4489.7301.4302.3103.2云南4743.62097.6211.4906.3258.8589.9241.1352.985.5西藏3574.01938.9370.6189.7273.1522.863.671.5143.9陜西5724.21821.3385.11206.2344.1581.0463.8776.4146.5甘肅4849.617
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 總經理聘用合同簽訂與授權
- 休閑度假房產打印身心放松
- 商業(yè)建筑砌墻施工合同
- 農村宅基地租賃協(xié)議模板
- 航空客服招聘合同模板
- 農業(yè)園區(qū)機耕道修建協(xié)議
- 防噪音卷簾門安裝合同樣本
- JJJ景區(qū)餐飲店投標方案
- 服裝設計教師招聘協(xié)議
- 教育機構加班安排細則
- 土木工程CAD-終結性考核-國開(SC)-參考資料
- 2024年行政執(zhí)法考試題庫及答案(題)
- 軍事理論(上海財經大學版)學習通超星期末考試答案章節(jié)答案2024年
- 2024年《形勢與政策》知識考試題庫(含答案)
- 廣東省學位英語歷年真題及答案
- 針灸推拿題庫及參考答案
- 會計專業(yè)工作簡歷表(中級)
- 護士工作量統(tǒng)計表
- 中價協(xié)[2013]35號造價取費
- 藏文格與英語介詞功能對比研究
- [群口相聲劇本5人搞笑]學生搞笑群口相聲劇本
評論
0/150
提交評論