版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、應(yīng)用數(shù)理統(tǒng)計(jì)多元線性回歸分析(第一次作業(yè))學(xué)院: 姓名: 學(xué)號(hào): 2013年12月交通運(yùn)輸業(yè)產(chǎn)值的多元線性回歸分析摘 要:本文基于中國統(tǒng)計(jì)年鑒(2012年版)統(tǒng)計(jì)數(shù)據(jù),尋找影響交通運(yùn)輸業(yè)發(fā)展的因素,包括工農(nóng)業(yè)發(fā)展水平、能源生產(chǎn)水平、進(jìn)出口貿(mào)易交流以及居民消費(fèi)水平等,利用統(tǒng)計(jì)軟件spss對(duì)各因素進(jìn)行了篩選分析,采用逐步回歸法得到最優(yōu)多元線性回歸模型,并對(duì)模型的回歸顯著性、擬合度以及隨機(jī)誤差的正態(tài)性進(jìn)行了檢驗(yàn),最后可以利用有效的最優(yōu)回歸模型對(duì)將來進(jìn)行預(yù)測。關(guān) 鍵 字:多元線性回歸,逐步回歸,交通運(yùn)輸產(chǎn)值,工業(yè)產(chǎn)值,進(jìn)出口總額1, 引言交通運(yùn)輸業(yè)指國民經(jīng)濟(jì)中專門從事運(yùn)送貨物和旅客的社會(huì)生產(chǎn)部門,包括
2、鐵路、公路、水運(yùn)、航空等運(yùn)輸部門。它是國民經(jīng)濟(jì)的重要組成部分,是保證人們?cè)谡?、?jīng)濟(jì)、文化、軍事等方面聯(lián)系交往的手段,也是銜接生產(chǎn)和消費(fèi)的一個(gè)重要環(huán)節(jié)。交通運(yùn)輸業(yè)在現(xiàn)代社會(huì)的各個(gè)方面起著十分重要的作用,因此研究交通運(yùn)輸業(yè)發(fā)展水平與各個(gè)影響因素間的關(guān)系顯得十分重要,建立有效的數(shù)學(xué)相關(guān)模型對(duì)于預(yù)測交通運(yùn)輸業(yè)的發(fā)展,制定相關(guān)政策方案提供依據(jù)。根據(jù)經(jīng)驗(yàn)交通運(yùn)輸業(yè)的發(fā)展受到工農(nóng)業(yè)發(fā)展、能源生產(chǎn)、進(jìn)出口貿(mào)易以及居民消費(fèi)水平等眾因素的影響,故建立一個(gè)完整精確的數(shù)學(xué)模型在理論上基本無法實(shí)現(xiàn),并且在實(shí)際運(yùn)用中也沒有必要,一種簡單有效的方式就是尋找主要影響因素,分析其與指標(biāo)變量的相關(guān)性,建立多元線性回歸模型就是一
3、種有效的方式。變量與變量之間的關(guān)系分為確定性關(guān)系和非確定性關(guān)系,函數(shù)表達(dá)確定性關(guān)系。研究變量間的非確定性關(guān)系,構(gòu)造變量間經(jīng)驗(yàn)公式的數(shù)理統(tǒng)計(jì)方法稱為回歸分析?;貧w分析是指通過提供變量之間的數(shù)學(xué)表達(dá)式來定量描述變量間相關(guān)關(guān)系的數(shù)學(xué)過程,這一數(shù)學(xué)表達(dá)式通常稱為經(jīng)驗(yàn)公式。一方面,研究者可以利用概率統(tǒng)計(jì)知識(shí),對(duì)這個(gè)經(jīng)驗(yàn)公式的有效性進(jìn)行判定;另一方面,研究者可以利用經(jīng)驗(yàn)公式,根據(jù)自變量的取值預(yù)測因變量的取值。如果是多個(gè)因素作為自變量的時(shí)候,還可以通過因素分析,找出哪些自變量對(duì)因變量的影響是顯著的,哪些是不顯著的?;貧w分析目前在生物統(tǒng)計(jì)、醫(yī)學(xué)統(tǒng)計(jì)、經(jīng)濟(jì)分析、數(shù)據(jù)挖掘中得到了廣泛的應(yīng)用。通過對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行回歸
4、分析得出經(jīng)驗(yàn)公式,利用經(jīng)驗(yàn)公式就可以在已知自變量的情況下預(yù)測因變量的取值。實(shí)際問題的控制中往往是根據(jù)預(yù)測結(jié)果來進(jìn)行的,如在商品流通領(lǐng)域,通常用回歸分析商品價(jià)和與商品需求之間的關(guān)系,以便對(duì)商品的價(jià)格和需求量進(jìn)行控制。本文查找2012年中國統(tǒng)計(jì)年鑒取1996年-2011年共16年間的數(shù)據(jù),利用spss軟件對(duì)影響交通運(yùn)輸業(yè)發(fā)展的因素進(jìn)行討論構(gòu)造多元線性線性回歸模型。以探求影響交通運(yùn)輸業(yè)發(fā)展水平的各個(gè)因素,得到最優(yōu)線性回歸模型。隨后,我們對(duì)模型的回歸顯著性、擬合度、正態(tài)分布等分別進(jìn)行檢驗(yàn),以考察線性回歸模型的可信度。2,基礎(chǔ)知識(shí)及相關(guān)理論2.1 回歸分析回歸分析研究的主要對(duì)象是客觀事物變量間的統(tǒng)計(jì)關(guān)系
5、,它是建立在對(duì)客觀事物進(jìn)行大量試驗(yàn)和觀察的基礎(chǔ)上,用來尋找隱藏在那些看上去是不確定的現(xiàn)象中的統(tǒng)計(jì)規(guī)律性的統(tǒng)計(jì)方法?;貧w分析方法是通過建立統(tǒng)計(jì)模型研究變量間相互關(guān)系的密切程度、結(jié)構(gòu)狀態(tài)及進(jìn)行模型預(yù)測的一種有效的工具。在實(shí)際問題回歸分析模型的建立和分析中有幾個(gè)重要的階段:l 根據(jù)研究的目的設(shè)置指標(biāo)變量回歸分析模型主要是揭示事物間相關(guān)變量的數(shù)量聯(lián)系。首先要根據(jù)所研究問題的目的設(shè)置因變量y,然后再選取與y有統(tǒng)計(jì)關(guān)系的一些變量作為自變量。l 收集、整理統(tǒng)計(jì)數(shù)據(jù)回歸分析模型的建立是基于回歸變量的樣本統(tǒng)計(jì)數(shù)據(jù)。當(dāng)確定好回歸模型的變量之后,就要對(duì)這些變量收集、整理統(tǒng)計(jì)數(shù)據(jù)。l 確定理論回歸模型的數(shù)學(xué)形式當(dāng)收集
6、到所設(shè)置的變量的數(shù)據(jù)之后,就要確定適當(dāng)?shù)臄?shù)學(xué)形式來描述這些變量之間的關(guān)系。如果因變量與自變量的散點(diǎn)圖近似一條直線,可考慮用線性回歸模型去擬合這條直線,如果二者之間無線性關(guān)系,則需要使用非線性模型構(gòu)造回歸模型。l 模型參數(shù)的估計(jì)回歸理論模型確定之后,便可以利用收集、整理的樣本數(shù)據(jù)對(duì)模型的未知參數(shù)給出估計(jì)。位置參數(shù)的估計(jì)方法最常用的是普通最小二乘法,它是經(jīng)典的估計(jì)方法。l 模型的檢驗(yàn)當(dāng)模型的位置參數(shù)估計(jì)出來后,需要通過對(duì)模型的檢驗(yàn)才能決定參數(shù)估計(jì)是否合適。模型的檢驗(yàn)一般需要進(jìn)行統(tǒng)計(jì)檢驗(yàn)和模型經(jīng)濟(jì)意義的檢驗(yàn)。統(tǒng)計(jì)檢驗(yàn)是對(duì)回歸方程的顯著性檢驗(yàn)、以及回歸系數(shù)的顯著性檢驗(yàn),還有擬合優(yōu)度的檢驗(yàn),殘差的獨(dú)立性
7、檢驗(yàn)等。l 回歸模型的運(yùn)用當(dāng)一個(gè)問題的回歸模型通過了各種統(tǒng)計(jì)檢驗(yàn),且模型具有合理的經(jīng)濟(jì)意義時(shí),就可以運(yùn)用這個(gè)模型來進(jìn)一步研究此問題。在客觀問題的研究中,我們需要參數(shù)估計(jì)的結(jié)果和具體經(jīng)濟(jì)問題以及現(xiàn)實(shí)情況緊密結(jié)合,這樣才能保證回歸模型在客觀問題研究中得到正確運(yùn)用。2.2 多元回歸分析一元線性回歸模型研究的是某一個(gè)因變量和一個(gè)自變量之間的關(guān)系問題,但在實(shí)際中,因變量的變化常常受到不止一個(gè)自變量的影響,可能同時(shí)有兩個(gè)或兩個(gè)以上的自變量對(duì)因變量的變化產(chǎn)生影響。這種研究某一個(gè)因變量和多個(gè)自變量之間的相互關(guān)系的理論和方法就是多元線性回歸分析方法,它是一元線性模型的拓展。設(shè)隨機(jī)變量y與p(p2)個(gè)一般變量x1
8、,x2,xp的線性回歸模型可表示為:y=0+1x1+2x2+pxp+0稱為回歸常數(shù),1,p稱為偏回歸系數(shù),他們決定了因變量y與自變量x1,x2,xp的線性關(guān)系的具體形式;是隨機(jī)誤差,滿足n(0,2)。如果獲得滿足條件=12nn1 y=x+e=0,d=2in q22(n-p-1)的n組觀測數(shù)據(jù)(xi1,xi2,xip;yi),其中i=1,2,n,則線性回歸模型可表示為yi=0+1xi1+2xi2+pxip+i其中i=1,2,n。上式寫成方程組形式為y1=0+1x11+2x12+px1p+1y2=0+1x21+2x22+px2p+2yn=0+1xn1+2xn2+pxnp+n記y=y1y2ynn1,
9、x=1x11x12x1p1x21x22x2p1xn1xn2xnp,=01p(p+1)1,=12nn1則回歸模型成為y=x+e=0,d=2in。2.3 逐步回歸法在實(shí)際問題中, 人們總是希望從對(duì)因變量 y有影響的諸多變量中選擇一些變量作為自變量, 應(yīng)用多元回歸分析的方法建立“最優(yōu)”回歸方程以便對(duì)因變量進(jìn)行預(yù)報(bào)或控制。所謂“最優(yōu)”回歸方程, 主要是指希望在回歸方程中包含所有對(duì)因變量y影響顯著的自變量而不包含對(duì)y影響不顯著的自變量的回歸方程。逐步回歸分析正是根據(jù)這種原則提出來的一種回歸分析方法。它的主要思路是在考慮的全部自變量中按其對(duì)y的作用大小, 顯著程度大小或者說貢獻(xiàn)大小, 由大到小地逐個(gè)引入回
10、歸方程, 而對(duì)那些對(duì)y作用不顯著的變量可能始終不被引人回歸方程。另外, 己被引人回歸方程的變量在引入新變量后也可能失去重要性, 而需要從回歸方程中剔除出去。引人一個(gè)變量或者從回歸方程中剔除一個(gè)變量都稱為逐步回歸的一步, 每一步都要進(jìn)行f檢驗(yàn), 以保證在引人新變量前回歸方程中只含有對(duì)y影響顯著的變量, 而不顯著的變量已被剔除。由此可見,逐步回歸法是一種向前法和向后法的一種結(jié)合,具體步驟是(預(yù)先給定一個(gè)出和進(jìn)或出和進(jìn),為避免死循環(huán),要求出 進(jìn)):1)逐步回歸法的前兩部與向前法的前兩步相同,并假定已建立了不完全的相關(guān)模型;2)當(dāng)引入變量x2(xl2)后,對(duì)x1(xl1)做偏f檢驗(yàn),看x1是否需要剔除
11、(即為向后法): 如果 l1出,則不剔除xl1,并繼續(xù)引入下一個(gè)變量; 如果 l10.8時(shí)認(rèn)為高度相關(guān),0.5|r|0.8中度相關(guān),0.3|r|0.5低度相關(guān),|r|f(n-p-1)時(shí)拒絕原假設(shè),認(rèn)為回歸方程顯著;或p=pffn-p-1時(shí),拒絕原假設(shè),回歸方程顯著。選定顯著性水平,利用spss軟件計(jì)算出的方差分析表如表5所示。表 5 方差分析表模型平方和df均方fsig.1回歸489709393.9841489709393.9841280.449.000b殘差5354318.86214382451.347總計(jì)495063712.846152回歸491594380.4462245797190.2
12、23921.031.000c殘差3469332.40013266871.723總計(jì)495063712.84615a. 因變量: yb. 預(yù)測變量: (常量), x2。c. 預(yù)測變量: (常量), x2, x4。從表5可知,顯著性p值(即表中sig值)均小于0.05,因此拒接原假設(shè),回歸方程線性回歸效果顯著。4.3.2 擬合度檢驗(yàn)擬合度用于檢驗(yàn)回歸方程對(duì)樣本觀測值的擬合程度,其值越大說明隨機(jī)誤差所占的比重越小,回歸的效果越顯著??蓻Q系數(shù)也稱擬合優(yōu)度定義為:通產(chǎn)定義r為相關(guān)系數(shù):它描述了指標(biāo)變量與解釋變量之間的線性相關(guān)程度。與值越接近1,說明回歸方程對(duì)樣本觀測值擬合得很好,表6所示為模型相關(guān)系數(shù)值
13、。表 6 模型相關(guān)系數(shù)表模型rr 方調(diào)整 r 方標(biāo)準(zhǔn) 估計(jì)的誤差更改統(tǒng)計(jì)量r 方更改f 更改df1df2sig. f 更改1.995a.989.988618.427.9891280.449114.0002.996b.993.992516.596.0047.063113.020a. 預(yù)測變量: (常量), x2。b. 預(yù)測變量: (常量), x2, x4。c. 因變量: y由表6可知,模型2相關(guān)系數(shù)和比模型的相關(guān)系數(shù)大,表明模型2擬合效果最好,模型2得到的回歸方程是最優(yōu)方程。4.3.3 殘差檢驗(yàn)如圖3和圖4分別是殘差分布直方圖和觀測量累計(jì)概率p-p圖。在回歸分析中,總是假定殘差服從正態(tài)分布,這兩
14、個(gè)圖就是根據(jù)樣本數(shù)據(jù)的計(jì)算結(jié)果顯示殘差分析的實(shí)際情況。從圖3殘差分布的直方圖與附于其上的正態(tài)分布曲線的比較,可以觀察出殘差分析的正態(tài)性。觀測量累計(jì)概率p-p圖也是用來比較殘差分布與正態(tài)分布差異的圖形,圖4的縱坐標(biāo)為期望累計(jì)概率分布,橫坐標(biāo)為觀測累計(jì)概率分布,圖中的斜線對(duì)應(yīng)著一個(gè)均值為0的正態(tài)分布,從而證明樣本確實(shí)是來自正態(tài)總體。否則應(yīng)懷疑隨機(jī)變量殘差的正態(tài)性。圖 3 殘差分布直方圖圖 4 觀測量累計(jì)概率p-p圖4.4 結(jié)果分析由以上多元回歸模型建立過程可知,對(duì)影響指標(biāo)變量交通運(yùn)輸業(yè)產(chǎn)值y的各個(gè)因素進(jìn)行了樣本線性相關(guān)篩選與逐步回歸f檢驗(yàn)篩選,最終確定影響交通運(yùn)輸發(fā)展的兩個(gè)主要因素:工業(yè)發(fā)展水平x
15、2與進(jìn)出口貿(mào)易水平x4。得到回歸方程:其中相關(guān)系數(shù)。正如前面篩選變量分析一樣,交通運(yùn)輸業(yè)的發(fā)展離不開一個(gè)國家的工業(yè)發(fā)展,工業(yè)的發(fā)展一方面為交通運(yùn)輸業(yè)提供了流通的產(chǎn)品與資源,使得交通運(yùn)輸業(yè)得以生存發(fā)展;另一反面工業(yè)的發(fā)展為交通運(yùn)輸業(yè)提供了大量先進(jìn)快速的交通工具,加速了交通運(yùn)輸業(yè)的發(fā)展。近年來我國與國外市場貿(mào)易交流得到大力發(fā)展,進(jìn)出口貿(mào)易額大幅提升,國內(nèi)大量產(chǎn)品外銷海外,這極大的刺激了交通運(yùn)輸業(yè)的發(fā)展,可以預(yù)見這一因素在將來將越來越重要的影響到交通運(yùn)輸業(yè)的發(fā)展。同時(shí)回歸模型也揭示了交通運(yùn)輸業(yè)的發(fā)展一定程度上與能源生產(chǎn)總量沒有顯著性關(guān)系。從這一個(gè)層面說明能源的發(fā)展水平并沒有限制交通運(yùn)輸?shù)陌l(fā)展,從市場供求關(guān)系而言國內(nèi)交通運(yùn)輸業(yè)的發(fā)展需求大于現(xiàn)有運(yùn)力的供給。模型經(jīng)檢驗(yàn),符合理論上的有效性,可以嘗試使用該回歸模型預(yù)測將來交通運(yùn)輸業(yè)的發(fā)展水平,為制定相關(guān)政策方案提供一定的參考。5,總結(jié)本文通過查閱資料,獲取了比較完整全面的數(shù)據(jù),根據(jù)經(jīng)驗(yàn)選取影響交通運(yùn)輸業(yè)發(fā)展的一些因素,并通過相關(guān)性分析進(jìn)行篩選得到主要因素,逐步回歸法建立得到的最優(yōu)模型經(jīng)檢驗(yàn)相關(guān)性顯著,可以嘗試用于預(yù)測2012年交通運(yùn)輸業(yè)產(chǎn)值,進(jìn)一步驗(yàn)證模型的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 物業(yè)財(cái)務(wù)知識(shí)培訓(xùn)課件下載
- 2024招標(biāo)公司實(shí)習(xí)生項(xiàng)目運(yùn)營管理實(shí)習(xí)報(bào)告書3篇
- 專業(yè)展廳租賃服務(wù)協(xié)議范本版B版
- 中國戲曲學(xué)院《中小學(xué)心理健康與道德教育》2023-2024學(xué)年第一學(xué)期期末試卷
- 鄭州工程技術(shù)學(xué)院《3維建模技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年進(jìn)口燕窩分銷協(xié)議3篇
- `2024年專用`0fOc電力設(shè)施建設(shè)施工合同3篇
- 《電纜直埋技術(shù)》課件
- 讀書活動(dòng)在幼兒園的創(chuàng)新方式計(jì)劃
- 雙十一旅游購物攻略模板
- 2025年度愛讀書學(xué)長定制化閱讀計(jì)劃合同2篇
- 2025年首都機(jī)場集團(tuán)公司招聘筆試參考題庫含答案解析
- 保健品購銷合同2025年
- 2024版光伏發(fā)電項(xiàng)目承包經(jīng)營權(quán)轉(zhuǎn)讓合同范本3篇
- 實(shí)習(xí)終止及解除協(xié)議書
- 河南省信陽市浉河區(qū)9校聯(lián)考2024-2025學(xué)年八年級(jí)上學(xué)期12月月考地理試題(含答案)
- 中國冠心病康復(fù)循證實(shí)踐指南(2024版)解讀
- 2024-2030年中國再生水行業(yè)發(fā)展前景預(yù)測規(guī)劃分析報(bào)告
- 城市公益性公墓建設(shè)項(xiàng)目施工組織設(shè)計(jì)
- 2022-2024年江蘇中考語文試題匯編:名著閱讀(教師版)
- 2024年秋季新人教版七年級(jí)上冊(cè)數(shù)學(xué)全冊(cè)教案
評(píng)論
0/150
提交評(píng)論