北航數(shù)理統(tǒng)計回歸分析大作業(yè)._第1頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)._第2頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)._第3頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)._第4頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)._第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、應用數(shù)理統(tǒng)計第一次大作業(yè)學號: 姓名: 班級: 2013年12月國家財政收入的多元線性回歸模型摘 要本文以多元線性回歸為出發(fā)點,選取我國自1990至2008年連續(xù)19年的財政收入為因變量,初步選取了7個影響因素,并利用統(tǒng)計軟件pasw statistics 17.0對各影響因素進行了篩選,最終確定了能反映財政收入與各因素之間關系的“最優(yōu)”回歸方程:從而得出了結論,最后我們用2009年的數(shù)據(jù)進行了驗證,得出的結果在誤差范圍內,表明這個模型可以正確反映影響財政收入的各因素的情況。關鍵詞:多元線性回歸,逐步回歸法,財政收入,spss 0符號說明變 量符號財政收入y工 業(yè)x1農 業(yè)x2受災面積x3建

2、筑 業(yè)x4人 口x5商品銷售額x6進出口總額x7 1 引言中國作為世界第一大發(fā)展中國家,要實現(xiàn)中華民族的偉大復興,必須把發(fā)展放在第一位。近年來,隨著國家經(jīng)濟水平的飛速進步,人民生活水平日益提高,綜合國力日漸強大。經(jīng)濟上的飛速發(fā)展并帶動了國家財政收入的飛速增加,國家財政的狀況對整個社會的發(fā)展影響巨大。政府有了強有力的財政保證才能夠對全局進行把握和調控,對于整個國家和社會的健康快速發(fā)展有著重要的意義。所以對國家財政的收入狀況進行研究是十分必要的。國家財政收入的增長,宏觀上必然與整個國家的經(jīng)濟有著必然的關系,但是具體到各個方面的影響因素又有著十分復雜的相關原因。為了研究影響國家財政收入的因素,我們就

3、很有必要對其財政收入和影響財政收入的因素作必要的認識,如果能對他們之間的關系作一下回歸,并利用我們所知道的數(shù)據(jù)建立起回歸模型這對我們很有作用。而影響財政收入的因素有很多,如人口狀況、引進的外資總額,第一產業(yè)的發(fā)展情況,第二產業(yè)的發(fā)展情況,第三產業(yè)的發(fā)展情況等等。本文從國家統(tǒng)計信息網(wǎng)上選取了1990-2009年這20年間的年度財政收入及主要影響因素的數(shù)據(jù),包括工業(yè),農業(yè),建筑業(yè),批發(fā)和零售貿易餐飲業(yè),人口總數(shù)等。文中主要應用逐步回歸的統(tǒng)計方法,對數(shù)據(jù)進行分析處理,最終得出能夠反映各個因素對財政收入影響的最“優(yōu)”模型。2解決問題的方法和計算結果2.1 樣本數(shù)據(jù)的選取與整理本文在進行統(tǒng)計時,查閱中國

4、統(tǒng)計年鑒2010中收錄的1990年至2009年連續(xù)20年的全國財政收入為因變量,考慮一些與能源消耗關系密切并且直觀上有線性關系的因素,初步選取這十九年的國內總產值、工業(yè)總產值、人口總數(shù)、建筑業(yè)、農業(yè)、受災面積和商品零售總額等因素為自變量,分析它們之間的聯(lián)系。根據(jù)選擇的指標,從中國統(tǒng)計年鑒2010查選數(shù)據(jù),整理如表2-1所示。表2-1 1990-2009年財政收入及其影響因素統(tǒng)計表工業(yè)(億元)農業(yè)(億元)受災面積(千公頃)建筑業(yè)(億元)人口(萬人)社會商品零售總額(億元)財政收入(億元)國民生產總值(億元)199018689.227662.13847413451143338300.12937.1

5、18718.3199122088.688157554721564.31158239415.63149.4821826.2199227724.219084.7513332174.411717110993.73483.3726937.319933969310995.5488293253.511851714270.44348.9535260.0199451353.0315750.5550434653.311985018622.95218.148108.5199554946.8620340.9458215793.812112123613.86242.259810.5199662740.1622353.

6、7469898282.212238928360.27407.9970142.5199768352.6823788.4534299126.512362631252.98651.1478060.8199867737.1424541.9501451006212476133378.19875.9583024.3199972707.0424519912578635647.911444.0888479.2200085673.6624915.85468812497.612674339105.713395.2398000.5200195448.9826179.65221515361.

7、512762743055.416386.04108068.22002110776.4827390.847119.118527.112845348135.918903.64119095.72003142271.2229691.854506.323083.812922752516.321715.25135174.02004201722.193623937106.25627745.31299885950126396.47159586.72005251619.539450.938818.22534552.013075667176.631649.29185808.62006316588.9640810.

8、841091.4141557.11314487641038760.2217522.72007405177.1348892.935972.2351043.71321298921051321.78267763.72008130260.233702.056234.2618743.213280211603261330.35316228.82009135239.935226.050223.5122398.81334741489468518.30343464.72.2 模型的建立與分析將數(shù)據(jù)錄入統(tǒng)計軟件excel,建立統(tǒng)計數(shù)據(jù)庫,先建立財政收入與各變量的散點圖,如圖2-1至圖2-7所示。圖2-1 財政收入

9、與工業(yè)總產值的散點圖圖2-2 財政收入與農業(yè)總產值的散點圖圖2-3 財政收入與受災面積的散點圖圖2-4 財政收入與建筑業(yè)的散點圖圖2-5 財政收入與人口總數(shù)的散點圖圖2-6 財政收入與商品零售總額的散點圖 圖2-7 財政收入與國內總產值的散點圖從散點圖中看出,國內生產總值、工業(yè)生產總值、農業(yè)、建筑業(yè)、商品零售總額這四個變量與財政收入總量基本呈線性分布;而人口總數(shù)雖然也與財政收入存在正比的關系,但是從直觀上看線性關系不顯著,并且人口因素呈現(xiàn)指數(shù)關系。受災面積與財政收入總量的關系不明顯。因此為使得到的模型有顯著的線性關系,在選取進入回歸模型的自變量時,就要進行篩選。下面給出篩選過程。(1)將國內生

10、產總值、農業(yè)、工業(yè)生產總值、建筑業(yè)和商品零售總額納入自變量,逐步回歸法,輸出結果如圖2-8(a)(b)所示。從結果可以看出,該回歸的f值為1600.595,查表得,顯而易見,回歸的顯著性很好;但是由于在這里我們要分析的是影響財政收入的具體產業(yè),而該結果只說明了財政收入與國民生產總值的相關性很好,并不能說明問題的根本所在。所以在下面的分析中我們將剔除國民生產總值這個因素做進一步的分析。anovab模型平方和df均方fsig.1回歸7.506e917.506e91600.595.000a殘差8.441e7184689341.382總計7.590e919a. 預測變量: (常量), 國民生產總值b.

11、 因變量: 財政收入模型匯總b模型rr 方調整 r 方標準估計的誤差更改統(tǒng)計量durbin-watsonr 方更改f 更改df1df2sig. f 更改1.994a.989.9882165.489.9891600.595118.000.200a. 預測變量: (常量), 國民生產總值b. 因變量: 財政收入圖2-8(a)(b) 輸出結果(2)將工業(yè)生產總值、農工、建筑業(yè)和商品零售總額納入自變量,逐步回歸法,輸出結果如圖2-9(a)(b)(c)所示。anovab模型平方和df均方fsig.1回歸4.757e914.757e930.215.000a殘差2.834e9181.574e8總計7.590

12、e919a. 預測變量: (常量), 農業(yè)b. 因變量: 財政收入模型匯總b模型rr 方調整r 方標準估計的誤差更改統(tǒng)計量durbin-watsonr 方更改f 更改df1df2sig. f 更改1.792a.627.60612546.807.62730.215118.000.390a. 預測變量: (常量), 農業(yè)b. 因變量: 財政收入 圖2-9(a)(b)(c) 輸出結果從結果可以看出,該回歸的f值為30.215,查表得,顯而易見,回歸的顯著性很好;但是對回歸系數(shù)的顯著性來說,從直方圖中可以看出,采用以上三個變量作為自變量得到的線性模型仍不是很好。這個模型也不是理想中的模型,所以下面我們

13、試圖根據(jù)我們的判斷對樣本數(shù)據(jù)進行篩選,力求得出比較理想的模型。(3)下面我將農業(yè)這個變量暫且剔除,只采用工業(yè)、建筑業(yè)和商品零售總額作為自變量,采用逐步回歸法,輸出結果如圖2-10(a)(b)所示。從結果可以看出,該回歸的f值為20.219,查表得,顯而易見,回歸的顯著性很好;但是對回歸系數(shù)的顯著性來說,建筑業(yè)的t檢驗值為0.0002,查表得,顯然回歸系數(shù)的顯著性不好。以上檢驗得到的與利用p值法(圖中的sig值)得到的檢驗結果相符。因此,采用以上三個變量作為自變量得到的線性模型仍不是很好。同時可以看出,只對建筑業(yè)做回歸分析時,f值為20.19,查表得到,這證明一元回歸模型和回歸系數(shù)的顯著性都很好

14、。anovab模型平方和df均方fsig.1回歸4.015e914.015e920.219.000a殘差3.575e9181.986e8總計7.590e919a. 預測變量: (常量), 建筑業(yè)b. 因變量: 財政收入模型匯總b模型rr 方調整r 方標準估計的誤差更改統(tǒng)計量durbin-watsonr 方更改f 更改df1df2sig. f 更改1.727a.529.50314092.439.52920.219118.000.546a. 預測變量: (常量), 建筑業(yè)b. 因變量: 財政收入圖2-10(a)(b) 輸出結果(4)只將工業(yè)和商品零售總額納入自變量,輸出結果如圖2-11(a)(b)

15、所示。anovab模型平方和df均方fsig.1回歸3.498e913.498e915.390.001a殘差4.092e9182.273e8總計7.590e919a. 預測變量: (常量), 工業(yè)。b. 因變量: 財政收入系數(shù)a模型非標準化系數(shù)標準系數(shù)tsig.共線性統(tǒng)計量b標準 誤差試用版容差vif1(常量)4994.3655206.020.959.350工業(yè).132.034.6793.923.0011.0001.000a. 因變量: 財政收入圖2-11(a)(b) 輸出結果從上圖結果中可以看出,對這兩個變量做回歸分析時,f值為15.39,證明一元回歸模型和回歸系數(shù)的顯著性都很好。2.3 分

16、析結果由以上篩選和分析過程可以看出,財政收入y分別對x7國內總產值、x1工業(yè)總產值、x4建筑業(yè)及商品零售總額x6進行一元回歸分析時,其回歸的顯著性都很好,但是綜合為一個多元回歸模型時,則出現(xiàn)了某些系數(shù)不顯著的現(xiàn)象。綜合比較選取的幾個多元模型,將x4建筑業(yè)和x6商品零售總額納入自變量時得到的模型效果最為顯著,回歸方程如下:其中,。3 結論本次大作業(yè),根據(jù)查閱中國統(tǒng)計年鑒,列舉了影響財政收入的7個因素。從直觀上考慮,人口總量與受災面積與財政收入存在線性關系,所以特意把這兩個變量列到其中,但是散點圖和回歸效果顯示這2個因素并沒有進入逐步回歸模型中,由此看來,這兩項因素與財政收入存在的關系可能不是嚴格

17、線性的,或者這種線性關系是長期的線性關系。另外,在對進入模型的5個因素進行回歸時發(fā)現(xiàn),因變量對單獨變量的回歸性很顯著,但是整合成多元回歸出現(xiàn)了某些回歸系數(shù)不顯著的現(xiàn)象,具體原因可能是由于數(shù)據(jù)選取的太少,未能體現(xiàn)出長期線性這一特點。雖然得到的幾個模型系數(shù)都不是很顯著,但經(jīng)綜合比較,選取了一個較為顯著的模型作為最“優(yōu)”解。對得到的最“優(yōu)”回歸模型做預測,置信度為95%。查閱中國統(tǒng)計年鑒,得到2009年的x4建筑業(yè)為22398.8(億元),x6商品零售總額為14894(億元),y財政收入為68518.30(億元),將自變量帶入回歸方程:預測區(qū)間為,其中。代入數(shù)值得到置信度為95%的預測區(qū)間為,與查得

18、的2009年能源消耗總量68518.30(億元)比較接近。得到的數(shù)據(jù)模型顯示財政收入與建筑業(yè)、商品零售額有著密切的關系,這也很符合目前國家的經(jīng)濟狀況。不過由于調研時間有限,上述回歸模型存在一些不足,還需要不斷查閱資料加以改進。但在一定程度上體現(xiàn)了與選取的自變量之間的線性關系,并能對因變量做出近似的預測。綜合來看,數(shù)據(jù)模型基本達到了預期的目的。參考文獻1 孫海燕,周夢,李衛(wèi)國,馮偉. 應用數(shù)理統(tǒng)計m. 北京:北京航空航天大學數(shù)學系, 1999.2 張建同,孫昌言. 以excel和spss為工具的管理統(tǒng)計m. 北京:清華大學出版社,2002.3 國家統(tǒng)計局.2010年中國統(tǒng)計年鑒m. 中國統(tǒng)計出版社,20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論