spss終期考核作業(yè)電子版本_第1頁
spss終期考核作業(yè)電子版本_第2頁
spss終期考核作業(yè)電子版本_第3頁
spss終期考核作業(yè)電子版本_第4頁
spss終期考核作業(yè)電子版本_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Good is good, but better carries it.精益求精,善益求善。spss終期考核作業(yè)-第六章線性回歸分析2010級研究生:嚴(yán)飛學(xué)號:201011080122.多元線性回歸的顯著性檢驗(yàn)包括哪些內(nèi)容?如何進(jìn)行?答:經(jīng)過查找資料并總結(jié)得出多元線性回歸的顯著性檢驗(yàn)主要包括:擬合優(yōu)度檢驗(yàn)、方程顯著性檢驗(yàn)和變量顯著性檢驗(yàn)三種。(一)擬合優(yōu)度檢驗(yàn)(R2檢驗(yàn))擬合優(yōu)度檢驗(yàn)是檢驗(yàn)回歸方程對樣本觀測值的擬合程度,即檢驗(yàn)所有解釋變量與被解釋變量之間的相關(guān)程度。檢驗(yàn)的方法是構(gòu)造一個可以表征擬合程度的指標(biāo),這個指標(biāo)是通過對總變差(總離差)的分解而得到。總變差平方和S總是各個觀察值與樣本均值之

2、差的平方和,反映了全部數(shù)據(jù)之間的差異;殘差平方和S殘是總變差平方和中未被回歸方程解釋的部分,由解釋變量xl、x2xk中未包含的一切因素對被解釋變量y的影響而造成的;回歸平方和S回是總變差平方和中由回歸方程解釋的部分。一個擬合得好的回歸模型,體現(xiàn)在總體平方和與回歸平方和的接近程度,即S總中S殘?jiān)叫≡胶?。于是采用:對回歸方程的擬合優(yōu)度進(jìn)行檢驗(yàn)。如果所有樣本觀測值都位于回歸方程上,即:此時回歸方程完全擬合了樣本觀測值,R等于1。如果R越接近1,則說明回歸方程的擬合優(yōu)度越高。(二)方程顯著性檢驗(yàn)(F檢驗(yàn))方程顯著性檢驗(yàn)就是對模型中解釋變量與被解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。即檢驗(yàn)被

3、解釋變量y與所有解釋變量xl、x2xk之間的線性關(guān)系是否顯著,方程顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)。檢驗(yàn)的原假設(shè)H0與對立假設(shè)H1分別為:H0:0=1=k=0H1:至少有一個1不為零應(yīng)用數(shù)理統(tǒng)計(jì)理論可以證明:S回與S殘相互獨(dú)立,且當(dāng):H0:0=1=k=0為真時,S回與S殘分別服從自由度為k、n-k-1的X2分布,故有:即:F統(tǒng)計(jì)量服從以(k、n-k-1)為自由度的F分布。首先根據(jù)樣本觀測值及回歸值計(jì)算出統(tǒng)計(jì)量F,于是在給定的顯著性水平下,若FF(K、n-k-1),則拒絕H0,判定被解釋變量y與所有解釋變量xl、x2xk之間的回歸效果顯著,即確實(shí)存在線性關(guān)系;反之,則不顯著。(三)變

4、量顯著性檢驗(yàn)(t檢驗(yàn))R2檢驗(yàn)和F檢驗(yàn)都是將所有的解釋變量作為一個整體來檢驗(yàn)它們與被解釋變量y的相關(guān)程度以及回歸效果,但對于多元回歸模型,方程的總體顯著性并不意味每個解釋變量對被解釋變量y的影響都是顯著的。如果某個解釋變量并不顯著,則應(yīng)該從方程中把它剔除,重新建立更為簡單的方程。所以必須對每個解釋變量進(jìn)行顯著性檢驗(yàn)。等價(jià)于對每個解釋變量檢驗(yàn)假設(shè):H0:j=0H1:j0其中j=0,1,2k。應(yīng)用數(shù)理統(tǒng)計(jì)理論可以證明:當(dāng):H0:j=0為真時,統(tǒng)計(jì)量tj服從自由度為(n-k-1)的t分布,即:在給定的顯著性水平下:若tjt/2(n-k-1),則拒絕H0,說明解釋變量xj對被解釋變量y有顯著影響,即x

5、j是影響Y的主要因素;反之,接受,說明解釋變量xj對被解釋變量y無顯著影響,則應(yīng)刪除該因素。當(dāng)影響Y的主要因素只有一個變量x時,問題變成了元回歸分析,此時t檢驗(yàn)和F檢驗(yàn)的作用是一樣的,因此可以不用再做F檢驗(yàn)。3.如何建立多元線性回歸方程?偏相關(guān)系數(shù)有何意義?答:(一)建立多元線性回歸方程的步驟可總結(jié)如下:1)確定研究目標(biāo),即明確建立回歸方程的自變量變量和因變量,然后在一定樣本中取得自變量與因變量所對應(yīng)的觀測值。通常,預(yù)測變量是現(xiàn)實(shí)中容易測量的,被預(yù)測變量則是現(xiàn)實(shí)中較難測量或是指未來發(fā)展的結(jié)果。2)利用散點(diǎn)圖或相關(guān)分析確定自變量與因變量之間是否存在線性關(guān)系。3)利用確定的計(jì)算方法或計(jì)算機(jī)軟件計(jì)算

6、回歸方程的回歸常數(shù)和回歸系數(shù),得到回歸方程。4)進(jìn)行擬合優(yōu)度檢驗(yàn)。就是檢驗(yàn)樣本數(shù)據(jù)聚集在樣本回歸線周圍的密集程度,從而判斷回歸方程對樣本數(shù)據(jù)的代表程度。多元線性回歸方程中由于引入的自變量不同,所以比較不同回歸方程的擬合度時需要使用調(diào)整后的擬合度判定系數(shù)。5)回歸方程的顯著性檢驗(yàn)。回歸方程顯著性檢驗(yàn)是對因變量與自變量之間線性關(guān)系是否顯著的一種檢驗(yàn)。檢驗(yàn)方法采用方差分析:F值等于平均的回歸平方和與平均的殘差平方和之比。6)對回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))。回歸方程顯著性檢驗(yàn)是從總體上顯示回歸系數(shù)顯著,多元線性回歸,還需分別檢驗(yàn)各回歸系數(shù)的顯著性。(二)偏相關(guān)系數(shù)的意義在多個相關(guān)變量中,其他變量保持

7、固定不變,所研究的兩個變量間的線性相關(guān)稱為偏相關(guān)。用來表示兩個相關(guān)變量偏相關(guān)的性質(zhì)與程度的統(tǒng)計(jì)量叫偏相關(guān)系數(shù),絕對值越大,偏相關(guān)程度越大。根據(jù)被固定的變量個數(shù)可將偏相關(guān)系數(shù)分級,偏相關(guān)系數(shù)的級數(shù)等于被固定的變量的個數(shù)。1)當(dāng)研究2個相關(guān)變量x1、x2的關(guān)系時,用直線相關(guān)系數(shù)r12表示x1與x2線性相關(guān)的性質(zhì)與程度。此時固定的變量個數(shù)為0,所以直線相關(guān)系數(shù)r12又叫做零級偏相關(guān)系數(shù)。2)當(dāng)研究3個相關(guān)變量x1、x2、x3的相關(guān)時,我們把x3保持固定不變,x1與x2的相關(guān)系數(shù)稱為x1與x2的偏相關(guān)系數(shù),記為r12-3,類似地,還有偏相關(guān)系數(shù)r13-2、r23-1。這3個偏相關(guān)系數(shù)固定的變量個數(shù)為1

8、,所以都叫做一級偏相關(guān)系數(shù)。3)當(dāng)研究4個相關(guān)變量x1、x2、x3、x4的相關(guān)時,須將其中的2個變量固定不變,研究另外兩個變量間的相關(guān)。即此時只有二級偏相關(guān)系數(shù)才真實(shí)地反映兩個相關(guān)變量間線性相關(guān)的性質(zhì)與程度。二級偏相關(guān)系數(shù)共有個:r12-34,r13-24,r14-23,r23-14,r24-13,r34-12。一般,當(dāng)研究m個相關(guān)變量x1、x2、xm的相關(guān)時,只有將其中的m-2個變量保持固定不變,研究另外兩個變量的相關(guān)才能真實(shí)地反映這兩個相關(guān)變量間的相關(guān),即此時只有m-2級偏相關(guān)系數(shù)才真實(shí)地反映了這兩個相關(guān)變量間線性相關(guān)的性質(zhì)與程度。m-2級偏相關(guān)系數(shù)共有個。xi與xj的m-2級偏相關(guān)系數(shù)記

9、為rij.(i,j=1,2,m,ij)。偏相關(guān)系數(shù)的取值范圍為-1,1,即:-1rij.1。5.如何將多項(xiàng)式回歸轉(zhuǎn)化為多元線性回歸?多項(xiàng)式回歸問題可以通過變量轉(zhuǎn)換化為多元線性回歸問題來解決。對于一元m次多項(xiàng)式回歸方程(9-35),令、=、=,則(9-35)就轉(zhuǎn)化為m元線性回歸方程:因此用本章第一節(jié)的方法就可解決多項(xiàng)式回歸問題。需要指出的是,在多項(xiàng)式回歸分析中,檢驗(yàn)回歸系數(shù)bi是否顯著,實(shí)質(zhì)上就是判斷自變量x的i次方項(xiàng)xi對依變量y的影響是否顯著。對于二元二次多項(xiàng)式回歸方程(9-36),令,則(9-36)就轉(zhuǎn)化為五元線性回歸方程:但隨著自變量個數(shù)的增加,多元多項(xiàng)式回歸分析的計(jì)算量急劇增加,于是就

10、需要轉(zhuǎn)化為多元線性回歸方程進(jìn)行分析了。下面是我找的一具體實(shí)例對一元二次多項(xiàng)式回歸作詳細(xì)介紹:(大體上了解了多項(xiàng)式回歸轉(zhuǎn)化為多元回歸的具體過程,不過其中數(shù)學(xué)水平要求高,還是有些地方不是很清楚,會繼續(xù)努力看明白的)【例9.3】給動物口服某種藥物A1000mg,每間隔1小時測定血藥濃度(g/ml),得到表9-5的數(shù)據(jù)(血藥濃度為5頭供試動物的平均值)。試建立血藥濃度(依變量y)對服藥時間(自變量x)的回歸方程。表9-5血藥濃度與服藥時間測定結(jié)果表服藥時間x(小時)123456789血藥濃度y(g/ml)21.8947.1361.8670.7872.8166.3650.3425.313.1722.71

11、8246.256362.268470.754571.714665.148751.056829.43890.2950y-0.82820.8737-0.40840.02551.09541.2113-0.7168-4.12982.8750(一)根據(jù)表9-5的數(shù)據(jù)資料繪制x與y的散點(diǎn)圖(見下圖)。由散點(diǎn)圖我們看到:血藥濃度最大值出現(xiàn)在服藥后5小時,在5小時之前血藥濃度隨時間的增加而增加,在5小時之后隨著時間的增加而減少,散點(diǎn)圖呈拋物線形狀,因此我們可以選用一元二次多項(xiàng)式來描述血藥濃度與服藥時間的關(guān)系,即進(jìn)行一元二次多項(xiàng)式回歸或拋物線回歸。圖1表9-5資料的散點(diǎn)圖(二)進(jìn)行變量轉(zhuǎn)換設(shè)一元二次多項(xiàng)式回歸方

12、程為:令、,則得二元線性回歸方程(三)進(jìn)行二元線性回歸分析先計(jì)算得:再計(jì)算得:于是得到關(guān)于求出上述正規(guī)方程組系數(shù)矩陣的逆矩陣為:關(guān)于即:而于是得到二元線性回歸方程為:現(xiàn)在對二元線性回歸方程或二元線性回歸關(guān)系進(jìn)行顯著性檢驗(yàn)。列出方差分析表,進(jìn)行F檢驗(yàn)。表9-6二元線性回歸關(guān)系方差分析表變異來源SSdfMSF回歸4830.916222415.4581511.750*離回歸28.320264.7200總變異4859.23648由查F值表得,因?yàn)镕F0.01(2,6),P0.01,表明二元線性回歸關(guān)系是極顯著的。偏回歸系數(shù)的顯著檢驗(yàn),應(yīng)用F檢驗(yàn)法:由查F值表得,因?yàn)椤?,表明偏回歸系數(shù)都是極顯著的。(四

13、)建立一元二次多項(xiàng)式回歸方程將還原為,還原為x2,即得一元二次多項(xiàng)式回歸方程為:(五)計(jì)算相關(guān)指數(shù)R2因?yàn)椋嚓P(guān)指數(shù)R2為:表明y對x的一元二次多項(xiàng)式回歸方程的擬合度是比較高的,或者說該回歸方程估測的可靠程度是比較高的。6.某地區(qū)的人均收入與同期某種耐用消費(fèi)品的銷售額之間的統(tǒng)計(jì)資料如下表所示?,F(xiàn)要求確定兩者之間是否存在相關(guān)關(guān)系。年份1987198819891990199119921993199419951996人均收入1.61.82.33.03.43.84.54.85.25.4銷售額(百萬元)4.75.97.08.210.5121313.51415具體操作步驟:1)輸入數(shù)據(jù)(圖1)圖12)分析

14、(圖2)圖23)變量選擇(圖3)圖34)結(jié)果(圖4)通過以上步驟獲得結(jié)果顯示,人均收入與同期某種耐用消費(fèi)品的銷售額之間存在顯著相關(guān)關(guān)系。7.一家商場20032005年個季度的銷售額數(shù)據(jù)如下表所示。試建立一個多元回歸模型預(yù)測2006,、2007年每季度的銷售額。季度/年銷售額2003年2004年2005年13890384041252250021903146319891765143444365421345311.數(shù)據(jù)輸入2.分析:點(diǎn)擊分析回歸線性(L)設(shè)置統(tǒng)計(jì)量點(diǎn)擊“統(tǒng)計(jì)量”進(jìn)入統(tǒng)計(jì)量設(shè)置菜單設(shè)置完成點(diǎn)擊繼續(xù)回到主界面繪圖設(shè)置點(diǎn)擊“繪制”進(jìn)入并設(shè)置,設(shè)置完成點(diǎn)擊繼續(xù)回到主界面。選項(xiàng)攝體保存設(shè)置點(diǎn)擊

15、“保存”,并設(shè)置,設(shè)置完成點(diǎn)擊繼續(xù)返回。點(diǎn)擊“選項(xiàng)”,并設(shè)置,再點(diǎn)擊繼續(xù)回到主界面設(shè)置完成上述參數(shù),點(diǎn)擊主界面“確定”,得到如下結(jié)果:REGRESSION/MISSINGLISTWISE/STATISTICSCOEFFOUTSBCOVRANOVACOLLINTOL/CRITERIA=PIN(.05)POUT(.10)CIN(95)/NOORIGIN/DEPENDENT銷售額/METHOD=ENTER年份季度/SCATTERPLOT=(*SDRESID,*ZPRED)(*ZRESID,*ZPRED)/RESIDUALSHIST(ZRESID)/CASEWISEPLOT(ZRESID)OUTLIE

16、RS(3)/SAVECOOKLEVERMCINICIN.回歸附注創(chuàng)建的輸出22-十一月-201116時20分18秒注釋輸入活動的數(shù)據(jù)集數(shù)據(jù)集0過濾器權(quán)重拆分文件工作數(shù)據(jù)文件中的N行12缺失值處理對缺失的定義用戶定義的缺失值作為缺失數(shù)據(jù)對待。使用的案例統(tǒng)計(jì)是在所使用的變量不帶有缺失值的案例基礎(chǔ)上進(jìn)行的。語法REGRESSION/MISSINGLISTWISE/STATISTICSCOEFFOUTSBCOVRANOVACOLLINTOL/CRITERIA=PIN(.05)POUT(.10)CIN(95)/NOORIGIN/DEPENDENT銷售額/METHOD=ENTER年份季度/SCATTERP

17、LOT=(*SDRESID,*ZPRED)(*ZRESID,*ZPRED)/RESIDUALSHIST(ZRESID)/CASEWISEPLOT(ZRESID)OUTLIERS(3)/SAVECOOKLEVERMCINICIN.資源處理器時間0:00:01.922已用時間0:00:02.250所需內(nèi)存1644個字節(jié)殘差圖需要額外內(nèi)存832個字節(jié)創(chuàng)建或修改的變量COO_1CooksDistanceLEV_1CenteredLeverageValueLMCI_1銷售額的95%平均置信區(qū)間下限UMCI_1銷售額的95%平均置信區(qū)間上限LICI_1銷售額的95%單個置信區(qū)間下限UICI_1銷售額的95

18、%單個置信區(qū)間上限數(shù)據(jù)集0輸入移去的變量b模型輸入的變量移去的變量方法1季度,年份a.輸入a.已輸入所有請求的變量。b.因變量:銷售額模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差1.175a.031-.1851112.5668a.預(yù)測變量:(常量),季度,年份。b.因變量:銷售額Anovab模型平方和df均方FSig.1回歸352741.2672176370.633.142.869a殘差1.114E791237804.970總計(jì)1.149E711a.預(yù)測變量:(常量),季度,年份。b.因變量:銷售額系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計(jì)量B標(biāo)準(zhǔn)誤差試用版容差VIF1(常量)-3706

19、73.167788277.356-.470.649年份186.500393.352.156.474.6471.0001.000季度70.467287.264.081.245.8121.0001.000a.因變量:銷售額系數(shù)相關(guān)a模型季度年份1相關(guān)性季度1.000.000年份.0001.000協(xié)方差季度82520.331.000年份.000154725.621a.因變量:銷售額共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)年份季度112.8841.000.00.00.022.1164.996.00.00.9838.300E-85895.0701.001.00.00a.因變量:銷售額殘差統(tǒng)計(jì)量a極小值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論