SPSS的線性回歸分析ppt課件_第1頁
SPSS的線性回歸分析ppt課件_第2頁
SPSS的線性回歸分析ppt課件_第3頁
SPSS的線性回歸分析ppt課件_第4頁
SPSS的線性回歸分析ppt課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計分析與統(tǒng)計分析與SPSS的運用的運用 SPSS的線性回歸分析的線性回歸分析回歸分析概述回歸分析概述(一一)回歸分析了解回歸分析了解(1)“回歸的含義回歸的含義galton研討研討父親身高和兒子身高的關(guān)系時的獨特研討研討父親身高和兒子身高的關(guān)系時的獨特發(fā)現(xiàn)發(fā)現(xiàn). (2)回歸線的獲得方式一回歸線的獲得方式一:部分平均部分平均 回歸曲線上的點給出了相應于每一個回歸曲線上的點給出了相應于每一個x(父親父親)值的值的y(兒子兒子)平均數(shù)的估計平均數(shù)的估計 (3)回歸線的獲得方式二回歸線的獲得方式二:擬和函數(shù)擬和函數(shù)使數(shù)據(jù)擬和于某條曲線使數(shù)據(jù)擬和于某條曲線;經(jīng)過假設(shè)干參數(shù)描畫該曲線經(jīng)過假設(shè)干參數(shù)描畫該

2、曲線;利用知數(shù)據(jù)在一定的統(tǒng)計準那么下找出參數(shù)的估計利用知數(shù)據(jù)在一定的統(tǒng)計準那么下找出參數(shù)的估計值值(得到回歸曲線的近似得到回歸曲線的近似);回歸分析概述回歸分析概述(二二)回歸分析的根本步驟回歸分析的根本步驟(1)確定自變量和因變量確定自變量和因變量(父親身高關(guān)于兒子身高的回父親身高關(guān)于兒子身高的回歸與兒子身高關(guān)于父親身高的回歸是不同的歸與兒子身高關(guān)于父親身高的回歸是不同的).(2)從樣本數(shù)據(jù)出發(fā)確定變量之間的數(shù)學關(guān)系式從樣本數(shù)據(jù)出發(fā)確定變量之間的數(shù)學關(guān)系式,并對并對回歸方程的各個參數(shù)進展估計回歸方程的各個參數(shù)進展估計.(3)對回歸方程進展各種統(tǒng)計檢驗對回歸方程進展各種統(tǒng)計檢驗.(4)利用回歸

3、方程進展預測利用回歸方程進展預測.線性回歸分析概述線性回歸分析概述(三三)參數(shù)估計的準那么參數(shù)估計的準那么目的目的:回歸線上的察看值與預測值之間的間隔總和到達最小回歸線上的察看值與預測值之間的間隔總和到達最小最小二乘法最小二乘法(利用最小二乘法擬和的回歸直線與樣本數(shù)據(jù)點利用最小二乘法擬和的回歸直線與樣本數(shù)據(jù)點在垂直方向上的偏離程度最低在垂直方向上的偏離程度最低)一元線性回歸分析一元線性回歸分析(一一)一元回歸方程一元回歸方程: y=0+1x0為常數(shù)項;為常數(shù)項;1為為y對對x回歸系數(shù),即回歸系數(shù),即:x每變動一個單位每變動一個單位所引起的所引起的y的平均變動的平均變動(二二)一元回歸分析的步驟

4、一元回歸分析的步驟利用樣本數(shù)據(jù)建立回歸方程利用樣本數(shù)據(jù)建立回歸方程回歸方程的擬和優(yōu)度檢驗回歸方程的擬和優(yōu)度檢驗回歸方程的顯著性檢驗回歸方程的顯著性檢驗(t檢驗和檢驗和F檢驗檢驗)殘差分析殘差分析預測預測一元線性回歸方程的檢驗一元線性回歸方程的檢驗(一一)擬和優(yōu)度檢驗擬和優(yōu)度檢驗:(1)目的目的:檢驗樣本察看點聚集在回歸直線周圍的檢驗樣本察看點聚集在回歸直線周圍的密集程度,評價回歸方程對樣本數(shù)據(jù)點的擬和密集程度,評價回歸方程對樣本數(shù)據(jù)點的擬和程度。程度。(2)思緒思緒:由于由于: 因變量取值的變化受兩個要素的影響因變量取值的變化受兩個要素的影響自變量不同取值的影響自變量不同取值的影響其他要素的影

5、響其他要素的影響于是于是: 因變量總變差因變量總變差=自變量引起的自變量引起的+其他要素引其他要素引起的起的即即: 因變量總變差因變量總變差=回歸方程可解釋的回歸方程可解釋的+不可解不可解釋的釋的可證明可證明:因變量總離差平方和因變量總離差平方和=回歸平方和回歸平方和+剩余剩余平方和平方和一元線性回歸方程的檢驗一元線性回歸方程的檢驗(一一)擬和優(yōu)度檢驗擬和優(yōu)度檢驗: (3)統(tǒng)計量:斷定系數(shù)統(tǒng)計量:斷定系數(shù)R2=SSR/SST=1-SSE/SST.R2表達了回歸方程所能解釋的因變量變差的比表達了回歸方程所能解釋的因變量變差的比例例;1-R2那么表達了因變量總變差中,回歸方那么表達了因變量總變差中

6、,回歸方程所無法解釋的比例。程所無法解釋的比例。R2越接近于越接近于1,那么闡明回歸平方和占了因變量,那么闡明回歸平方和占了因變量總變差平方和的絕大部分比例,因變量的變差總變差平方和的絕大部分比例,因變量的變差主要由自變量的不同取值呵斥,回歸方程對樣主要由自變量的不同取值呵斥,回歸方程對樣本數(shù)據(jù)點擬合得好本數(shù)據(jù)點擬合得好在一元回歸中在一元回歸中R2=r2; 因此,從這個意義上講,因此,從這個意義上講,斷定系數(shù)可以比較好地反映回歸直線對樣本數(shù)斷定系數(shù)可以比較好地反映回歸直線對樣本數(shù)據(jù)的代表程度和線性相關(guān)性。據(jù)的代表程度和線性相關(guān)性。niiniiniiniiyyyyyyyyR121212122)(

7、) (1)()(一元線性回歸方程的檢驗一元線性回歸方程的檢驗(二二)回歸方程的顯著性檢驗:回歸方程的顯著性檢驗:F檢驗檢驗(1)目的目的:檢驗自變量與因變量之間的線性關(guān)系能否顯著檢驗自變量與因變量之間的線性關(guān)系能否顯著,能否可用線性模型來表能否可用線性模型來表示示.(2)H0: =0 即即:回歸系數(shù)與回歸系數(shù)與0無顯著差別無顯著差別(3)利用利用F檢驗檢驗,構(gòu)造構(gòu)造F統(tǒng)計量統(tǒng)計量:F=平均的回歸平方和平均的回歸平方和/平均的剩余平方和平均的剩余平方和F(1,n-1-1)假設(shè)假設(shè)F值較大,那么闡明自變量呵斥的因變量的線性變動遠大于隨機要素對因值較大,那么闡明自變量呵斥的因變量的線性變動遠大于隨機

8、要素對因變量的影響變量的影響,自變量于因變量之間的線性關(guān)系較顯著自變量于因變量之間的線性關(guān)系較顯著(4)計算計算F統(tǒng)計量的值和相伴概率統(tǒng)計量的值和相伴概率p(5)判別判別pregression-linear(2)選擇一個變量為因變量進入選擇一個變量為因變量進入dependent框框(3)選擇一個變量為自變量進入選擇一個變量為自變量進入independent框框(4)enter:所選變量全部進入回歸方程所選變量全部進入回歸方程(默許方法默許方法)(5)對樣本進展挑選對樣本進展挑選(selection variable)利用滿足一定條件的樣本數(shù)據(jù)進展回歸分析利用滿足一定條件的樣本數(shù)據(jù)進展回歸分析(

9、6)指定作圖時各數(shù)據(jù)點的標志變量指定作圖時各數(shù)據(jù)點的標志變量(case labels)一元線性回歸分析操作一元線性回歸分析操作(二二) statistics選項選項(1)根本統(tǒng)計量輸出根本統(tǒng)計量輸出Estimates:默許默許.顯示回歸系數(shù)相關(guān)統(tǒng)計量顯示回歸系數(shù)相關(guān)統(tǒng)計量.confidence intervals:每個非規(guī)范化的回歸系數(shù)每個非規(guī)范化的回歸系數(shù)95%的置的置信區(qū)間信區(qū)間.Descriptive:各變量均值、規(guī)范差和相關(guān)系數(shù)單側(cè)檢驗概率各變量均值、規(guī)范差和相關(guān)系數(shù)單側(cè)檢驗概率.Model fit:默許默許.斷定系數(shù)、估計規(guī)范誤差、方差分析表、斷定系數(shù)、估計規(guī)范誤差、方差分析表、容忍

10、度容忍度(2)Residual框中的殘差分析框中的殘差分析Durbin-waston:D-W值值casewise diagnostic:異常值異常值(奇特值奇特值)檢測檢測 (輸出預測值及輸出預測值及殘差和規(guī)范化殘差殘差和規(guī)范化殘差)一元線性回歸分析操作一元線性回歸分析操作(三三)plot選項選項:圖形分析圖形分析.Standardize residual plots:繪制殘差序列直方繪制殘差序列直方圖和累計概率圖圖和累計概率圖,檢測殘差的正態(tài)性檢測殘差的正態(tài)性繪制指定序列的散點圖繪制指定序列的散點圖,檢測殘差的隨機性、異方檢測殘差的隨機性、異方差性差性ZPRED:規(guī)范化預測值規(guī)范化預測值 Z

11、RESID:規(guī)范化殘差規(guī)范化殘差SRESID:學生化殘差學生化殘差produce all partial plot:繪制因變量和一切自繪制因變量和一切自變量之間的散點圖變量之間的散點圖線性回歸方程的殘差分析線性回歸方程的殘差分析(一一)殘差序列的正態(tài)性檢驗殘差序列的正態(tài)性檢驗:繪制規(guī)范化殘差的直方圖或累計概率圖繪制規(guī)范化殘差的直方圖或累計概率圖(二二)殘差序列的隨機性檢驗殘差序列的隨機性檢驗繪制殘差和預測值的散點圖繪制殘差和預測值的散點圖,應隨機分布在經(jīng)過零的一應隨機分布在經(jīng)過零的一條直線上下條直線上下 ( (三三) )殘差序列獨立性檢驗殘差序列獨立性檢驗: :殘差序列能否存在后期值與前期值相

12、關(guān)的景象殘差序列能否存在后期值與前期值相關(guān)的景象, ,利用利用D.W(Durbin-Watson)D.W(Durbin-Watson)檢驗檢驗d-w=0:d-w=0:殘差序列存在完全正自相關(guān)殘差序列存在完全正自相關(guān);d-w=4:;d-w=4:殘差序列存在完殘差序列存在完全負自相關(guān)全負自相關(guān);0d-w2:;0d-w2:殘差序列存在某種程度的正自相殘差序列存在某種程度的正自相關(guān)關(guān);2d-w4:;2d-w4:殘差序列存在某種程度的負自相關(guān)殘差序列存在某種程度的負自相關(guān);d-w=2:;d-w=2:殘差序列不存在自相關(guān)殘差序列不存在自相關(guān). .殘差序列不存在自相關(guān)殘差序列不存在自相關(guān), ,可以以為回歸方

13、程根本概括了因變可以以為回歸方程根本概括了因變量的變化量的變化; ;否那么否那么, ,以為能夠一些與因變量相關(guān)的要素沒以為能夠一些與因變量相關(guān)的要素沒有引入回歸方程或回歸模型不適宜或滯后性周期性的影有引入回歸方程或回歸模型不適宜或滯后性周期性的影響響. . 線性回歸方程的殘差分析線性回歸方程的殘差分析(四四)異常值異常值(casewise或或outliers)診斷診斷利用規(guī)范化殘差不僅可以知道察看值比預測值大或小利用規(guī)范化殘差不僅可以知道察看值比預測值大或小,并并且還知道在絕對值上它比大多數(shù)殘差是大還是小且還知道在絕對值上它比大多數(shù)殘差是大還是小.普普通規(guī)范化殘差的絕對值大于通規(guī)范化殘差的絕對

14、值大于3,那么可以為對應的樣本那么可以為對應的樣本點為奇特值點為奇特值異常值并不總表現(xiàn)出上述特征異常值并不總表現(xiàn)出上述特征.當剔除某察看值后,回歸當剔除某察看值后,回歸方程的規(guī)范差顯著減小方程的規(guī)范差顯著減小,也可以斷定該察看值為異常也可以斷定該察看值為異常值值線性回歸方程的預測線性回歸方程的預測(一一)點估計點估計y0(二二)區(qū)間估計區(qū)間估計 x0為xi的均值時,預測區(qū)間最小,精度最高.x0越遠離均值,預測區(qū)間越大,精度越低.普通職工數(shù)(x)18001600140012001000800600400200領(lǐng)導(管理)人數(shù)(y)3002001000多元線性回歸分析多元線性回歸分析(一一)多元線

15、性回歸方程多元線性回歸方程多元回歸方程多元回歸方程: y= 0 +1x1+2x2+.+kxk1、2、k為偏回歸系數(shù)。為偏回歸系數(shù)。1表示在其他自變量堅持不變的情況下,自變量表示在其他自變量堅持不變的情況下,自變量x1變動變動一個單位所引起的因變量一個單位所引起的因變量y的平均變動的平均變動(二二)多元線性回歸分析的主要問題多元線性回歸分析的主要問題回歸方程的檢驗回歸方程的檢驗自變量挑選自變量挑選多重共線性問題多重共線性問題多元線性回歸方程的檢驗多元線性回歸方程的檢驗(一一)擬和優(yōu)度檢驗擬和優(yōu)度檢驗:(1)斷定系數(shù)斷定系數(shù)R2: R是是y和和xi的復相關(guān)系數(shù)的復相關(guān)系數(shù)(或察看值與預測值的相或察

16、看值與預測值的相關(guān)系數(shù)關(guān)系數(shù)),測定了因變量測定了因變量y與一切自變量全體之與一切自變量全體之間線性相關(guān)程度間線性相關(guān)程度 (2)調(diào)整的調(diào)整的R2:思索的是平均的剩余平方和思索的是平均的剩余平方和,抑制了因自變量添抑制了因自變量添加而呵斥加而呵斥R2也增大的弱點也增大的弱點在某個自變量引入回歸方程后,假設(shè)該自變量是在某個自變量引入回歸方程后,假設(shè)該自變量是理想的且對因變量變差的解釋闡明是有意義的,理想的且對因變量變差的解釋闡明是有意義的,那么必然使得均方誤差減少,從而使調(diào)整的那么必然使得均方誤差減少,從而使調(diào)整的R2得到提高;反之,假設(shè)某個自變量對因變得到提高;反之,假設(shè)某個自變量對因變量的解

17、釋闡明沒有意義,那么引入它不會呵斥量的解釋闡明沒有意義,那么引入它不會呵斥均方誤差減少,從而調(diào)整的均方誤差減少,從而調(diào)整的R2也不會提高。也不會提高。SSTSSEknnR1112因變量的樣本方差均方誤差12R多元線性回歸方程的檢驗多元線性回歸方程的檢驗(二二)回歸方程的顯著性檢驗:回歸方程的顯著性檢驗:(1)目的目的:檢驗一切自變量與因變量之間的線性關(guān)系能否顯著,能檢驗一切自變量與因變量之間的線性關(guān)系能否顯著,能否可用線性模型來表示否可用線性模型來表示.(2)H0: 1 = 2 = k =0 即即:一切回歸系數(shù)同時與一切回歸系數(shù)同時與0無顯著差無顯著差別別(3)利用利用F檢驗檢驗,構(gòu)造構(gòu)造F統(tǒng)

18、計量統(tǒng)計量:F=平均的回歸平方和平均的回歸平方和/平均的剩余平方和平均的剩余平方和F(k,n-k-1)假設(shè)假設(shè)F值較大,那么闡明自變量呵斥的因變量的線性變動大于隨值較大,那么闡明自變量呵斥的因變量的線性變動大于隨機要素對因變量的影響機要素對因變量的影響,自變量于因變量之間的線性關(guān)系較顯自變量于因變量之間的線性關(guān)系較顯著著(4)計算計算F統(tǒng)計量的值和相伴概率統(tǒng)計量的值和相伴概率p(5)判別判別p=a:回絕回絕H0,即即:一切回歸系數(shù)與一切回歸系數(shù)與0有顯著差別,自變量與因變有顯著差別,自變量與因變量之間存在顯著的線性關(guān)系。反之,不能回絕量之間存在顯著的線性關(guān)系。反之,不能回絕H0) 1/()(/

19、)(22knyykyyFiii多元線性回歸方程的檢驗多元線性回歸方程的檢驗(三三)回歸系數(shù)的顯著性檢驗回歸系數(shù)的顯著性檢驗(1)目的目的:檢驗每個自變量對因變量的線性影響能否顯著檢驗每個自變量對因變量的線性影響能否顯著.(2)H0:i=0 即即:第第i個回歸系數(shù)與個回歸系數(shù)與0無顯著差別無顯著差別(3)利用利用t檢驗檢驗,構(gòu)造構(gòu)造t統(tǒng)計量:統(tǒng)計量:其中其中:Sy是回歸方程規(guī)范誤差是回歸方程規(guī)范誤差(Standard Error)的估計值,的估計值,由均方誤差開方后得到,反映了回歸方程無法解釋樣本由均方誤差開方后得到,反映了回歸方程無法解釋樣本數(shù)據(jù)點的程度或偏離樣本數(shù)據(jù)點的程度數(shù)據(jù)點的程度或偏離

20、樣本數(shù)據(jù)點的程度假設(shè)某個回歸系數(shù)的規(guī)范誤差較小,必然得到一個相對較假設(shè)某個回歸系數(shù)的規(guī)范誤差較小,必然得到一個相對較大的大的t值,闡明該自變量值,闡明該自變量xi解釋因變量線性變化的才干較解釋因變量線性變化的才干較強。強。(4)逐個計算逐個計算t統(tǒng)計量的值和相伴概率統(tǒng)計量的值和相伴概率p (5)判別判別iiiSt22)(iiyixxSS多元線性回歸方程的檢驗多元線性回歸方程的檢驗(四四)t統(tǒng)計量與統(tǒng)計量與F統(tǒng)計量統(tǒng)計量一元回歸中一元回歸中,F檢驗與檢驗與t檢驗一致檢驗一致,即即: F=t2,可以相互替代可以相互替代在多元回歸中,在多元回歸中,F(xiàn)檢驗與檢驗與t檢驗不能相互替代檢驗不能相互替代Fc

21、hange =ti2從從Fchange 角度上講,假設(shè)由于某個自變量角度上講,假設(shè)由于某個自變量xi的引入,的引入,使得使得Fchange是顯著的是顯著的(經(jīng)過察看經(jīng)過察看Fchange 的相伴概的相伴概率值率值),那么就可以以為該自變量對方程的奉獻是顯著,那么就可以以為該自變量對方程的奉獻是顯著的,它應保管在回歸方程中,起到與回歸系數(shù)的,它應保管在回歸方程中,起到與回歸系數(shù)t檢驗檢驗同等的作用。同等的作用。221) 1(RknRFchchange222ichRRR多元線性回歸分析中的自變量挑選多元線性回歸分析中的自變量挑選(一一)自變量挑選的目的自變量挑選的目的多元回歸分析引入多個自變量多元

22、回歸分析引入多個自變量. 假設(shè)引入的自變量個數(shù)較少假設(shè)引入的自變量個數(shù)較少,那么那么不能很好的闡明因變量的變化不能很好的闡明因變量的變化;并非自變量引入越多越好并非自變量引入越多越好.緣由緣由:有些自變量能夠?qū)σ蜃兞康慕忉寷]有奉獻有些自變量能夠?qū)σ蜃兞康慕忉寷]有奉獻自變量間能夠存在較強的線性關(guān)系自變量間能夠存在較強的線性關(guān)系,即即:多重共線性多重共線性. 因此不能全因此不能全部引入回歸方程部引入回歸方程.多元線性回歸分析中的自變量挑選多元線性回歸分析中的自變量挑選(二二)自變量向前挑選法自變量向前挑選法(forward):即即:自變量不斷進入回歸方程的過程自變量不斷進入回歸方程的過程.首先首先

23、,選擇與因變量具有最高相關(guān)系數(shù)的自變量進入方程選擇與因變量具有最高相關(guān)系數(shù)的自變量進入方程,并并進展各種檢驗進展各種檢驗;其次其次,在剩余的自變量中尋覓偏相關(guān)系數(shù)最高的變量進入回在剩余的自變量中尋覓偏相關(guān)系數(shù)最高的變量進入回歸方程歸方程,并進展檢驗并進展檢驗;默許默許:回歸系數(shù)檢驗的概率值小于回歸系數(shù)檢驗的概率值小于PIN(0.05)才可以進入方才可以進入方程程.反復上述步驟反復上述步驟,直到?jīng)]有可進入方程的自變量為止直到?jīng)]有可進入方程的自變量為止.多元線性回歸分析中的自變量挑選多元線性回歸分析中的自變量挑選(三三)自變量向后挑選法自變量向后挑選法(backward):即即:自變量不斷剔除出回

24、歸方程的過程自變量不斷剔除出回歸方程的過程.首先首先,將一切自變量全部引入回歸方程;將一切自變量全部引入回歸方程;其次其次,在一個或多個在一個或多個t值不顯著的自變量中將值不顯著的自變量中將t值最小的那值最小的那個變量剔除出去個變量剔除出去,并重新擬和方程和進展檢驗并重新擬和方程和進展檢驗;默許默許:回歸系數(shù)檢驗值大于回歸系數(shù)檢驗值大于POUT(0.10),那么剔除出方那么剔除出方程程假設(shè)新方程中一切變量的回歸系數(shù)假設(shè)新方程中一切變量的回歸系數(shù)t值都是顯著的值都是顯著的,那么那么變量挑選過程終了變量挑選過程終了.否那么否那么,反復上述過程反復上述過程,直到無變量可剔除為止直到無變量可剔除為止.

25、多元線性回歸分析中的自變量挑選多元線性回歸分析中的自變量挑選(四四)自變量逐漸挑選法自變量逐漸挑選法(stepwise):即即:是是“向前法和向前法和“向后法的結(jié)合。向后法的結(jié)合。向前法只對進入方程的變量的回歸系數(shù)進展顯著性檢驗,向前法只對進入方程的變量的回歸系數(shù)進展顯著性檢驗,而對曾經(jīng)進入方程的其他變量的回歸系數(shù)不再進展顯而對曾經(jīng)進入方程的其他變量的回歸系數(shù)不再進展顯著性檢驗,即:變量一旦進入方程就不回被剔除著性檢驗,即:變量一旦進入方程就不回被剔除隨著變量的逐個引進,由于變量之間存在著一定程度的隨著變量的逐個引進,由于變量之間存在著一定程度的相關(guān)性,使得曾經(jīng)進入方程的變量其回歸系數(shù)不再顯相

26、關(guān)性,使得曾經(jīng)進入方程的變量其回歸系數(shù)不再顯著,因此會呵斥最后的回歸方程能夠包含不顯著的變著,因此會呵斥最后的回歸方程能夠包含不顯著的變量。量。逐漸挑選法那么在變量的每一個階段都思索的剔除一個逐漸挑選法那么在變量的每一個階段都思索的剔除一個變量的能夠性。變量的能夠性。線性回歸分析中的共線性檢測線性回歸分析中的共線性檢測(一一)共線性帶來的主要問題共線性帶來的主要問題高度的多重共線會使回歸系數(shù)的規(guī)范差隨自變量高度的多重共線會使回歸系數(shù)的規(guī)范差隨自變量相關(guān)性的增大而不斷增大相關(guān)性的增大而不斷增大,以致使回歸系數(shù)的以致使回歸系數(shù)的置信區(qū)間不斷增大置信區(qū)間不斷增大,呵斥估計值精度減低呵斥估計值精度減低

27、.(二二)共線性診斷共線性診斷自變量的容忍度自變量的容忍度(tolerance)和方差膨脹因子和方差膨脹因子容忍度容忍度:Toli=1-Ri2. 其中其中: Ri2是自變量是自變量xi與方與方程中其他自變量間的復相關(guān)系數(shù)的平方程中其他自變量間的復相關(guān)系數(shù)的平方.容忍度越大那么與方程中其他自變量的共線性越容忍度越大那么與方程中其他自變量的共線性越低低,應進入方程應進入方程. (具有太小容忍度的變量不應具有太小容忍度的變量不應進入方程進入方程,spss會給出警會給出警)(T0.1普通以為具普通以為具有多重共線性有多重共線性)方差膨脹因子方差膨脹因子(VIF):容忍度的倒數(shù)容忍度的倒數(shù)SPSS在回歸

28、方程建立過程中不斷計算待進入方在回歸方程建立過程中不斷計算待進入方程自變量的容忍度程自變量的容忍度,并顯示目前的最小容忍度并顯示目前的最小容忍度線性回歸分析中的共線性檢測線性回歸分析中的共線性檢測(二二)共線性診斷共線性診斷用特征根描寫自變量的方差用特征根描寫自變量的方差假設(shè)自變量間確實存在較強的相關(guān)關(guān)系,那么它們之間假設(shè)自變量間確實存在較強的相關(guān)關(guān)系,那么它們之間必然存在信息重疊,于是可從這些自變量中提取出既必然存在信息重疊,于是可從這些自變量中提取出既能反映自變量信息能反映自變量信息(方差方差)又相互獨立的要素又相互獨立的要素(成分成分)來來.從自變量的相關(guān)系數(shù)矩陣出發(fā),計算相關(guān)系數(shù)矩陣的

29、特從自變量的相關(guān)系數(shù)矩陣出發(fā),計算相關(guān)系數(shù)矩陣的特征根,得到相應的假設(shè)干成分征根,得到相應的假設(shè)干成分.假設(shè)某個特征根既可以描寫某個自變量方差的較大部分假設(shè)某個特征根既可以描寫某個自變量方差的較大部分比例比例(如大于如大于0.7),同時又可以描寫另一個自變量方差同時又可以描寫另一個自變量方差的較大部分比例,那么闡明這兩個自變量間存在較強的較大部分比例,那么闡明這兩個自變量間存在較強的多重共線性。的多重共線性。條件目的條件目的0k10 無多重共線性無多重共線性; 10=k=100 嚴重嚴重imik線性回歸分析中的異方差問題線性回歸分析中的異方差問題(一一)什么是差別方差什么是差別方差回歸模型要求

30、殘差序列服從均值為回歸模型要求殘差序列服從均值為0并具有一樣方差的正態(tài)分布并具有一樣方差的正態(tài)分布,即即:殘差分布幅度不應隨自變量或因變量的變化而變化殘差分布幅度不應隨自變量或因變量的變化而變化.否那么以為否那么以為出現(xiàn)了異方差景象出現(xiàn)了異方差景象(二二)差別方差診斷差別方差診斷可以經(jīng)過繪制規(guī)范化殘差序列和因變量預測值可以經(jīng)過繪制規(guī)范化殘差序列和因變量預測值(或每個自變量或每個自變量)的散的散點圖來識別能否存在異方差點圖來識別能否存在異方差(三三)異方差處置異方差處置實施方差穩(wěn)定性變換實施方差穩(wěn)定性變換殘差與殘差與yi(預測值預測值)的平方根呈正比:對的平方根呈正比:對yi開平方開平方殘差與殘

31、差與yi(預測值預測值)呈正比呈正比:對對yi取對數(shù)取對數(shù).殘差與殘差與yi(預測值預測值)的平方呈正比的平方呈正比,那么那么1/yi多元線性回歸分析操作多元線性回歸分析操作(一一)根本操作步驟根本操作步驟(1)菜單項選擇項菜單項選擇項: analyze-regression-linear(2)選擇一個變量為因變量進入選擇一個變量為因變量進入dependent框框(3)選擇一個或多個變量為自變量進入選擇一個或多個變量為自變量進入independent框框(4)選擇多元回歸分析的自變量挑選方法選擇多元回歸分析的自變量挑選方法:enter:所選變量全部進入回歸方程所選變量全部進入回歸方程(默許方法

32、默許方法)remove:從回歸方程中剔除變量從回歸方程中剔除變量stepwise:逐漸挑選;逐漸挑選;backward:向后挑選;向后挑選;forward:向前挑選向前挑選(5)對樣本進展挑選對樣本進展挑選(selection variable)利用滿足一定條件的樣本數(shù)據(jù)進展回歸分析利用滿足一定條件的樣本數(shù)據(jù)進展回歸分析(6)指定作圖時各數(shù)據(jù)點的標志變量指定作圖時各數(shù)據(jù)點的標志變量(case labels)多元線性回歸分析操作多元線性回歸分析操作(二二) statistics選項選項(1)根本統(tǒng)計量輸出根本統(tǒng)計量輸出Part and partial correlation:與與Y的簡單相關(guān)、的

33、簡單相關(guān)、偏相關(guān)和部分相關(guān)偏相關(guān)和部分相關(guān)R square change:每個自變量進入方程后每個自變量進入方程后R2及及F值的變化量值的變化量Collinearity dignostics:共線性診斷共線性診斷.多元線性回歸分析操作多元線性回歸分析操作(三三)options選項選項:stepping method criteria:逐漸挑選法參數(shù)設(shè)置逐漸挑選法參數(shù)設(shè)置.use probability of F:以以F值相伴概率作為變量進入和剔除方值相伴概率作為變量進入和剔除方程的規(guī)范程的規(guī)范.一個變量的一個變量的F值顯著性程度小于值顯著性程度小于entry(0.05)那么那么進入方程進入方程

34、;大于大于removal(0.1)那么剔除出方程那么剔除出方程.因因此此:Entryregression-curve estimation(3) 選擇因變量到選擇因變量到dependent框框(4) 選擇自變量到選擇自變量到independent框或選框或選time以時以時間作自變量間作自變量(5)選擇模型選擇模型 (R2最高擬和效果最好最高擬和效果最好)曲線估計曲線估計(curve estimate)(四四)其他選項其他選項(1)display ANOVA table:方差分析表方差分析表(2)plot models:繪制察看值和預測值的對比圖繪制察看值和預測值的對比圖.(3)save選項選

35、項:predicted values:保管預測值保管預測值.Residual:保管殘差值保管殘差值.prediction interval:保管預測值的默許保管預測值的默許95%的可置信區(qū)間的可置信區(qū)間.Predict case:以以time作自變量進展預測作自變量進展預測.Predict from estimation period through last case:計算保計算保管一切預測值管一切預測值.Predict through :假設(shè)預測周期超越了數(shù)據(jù)文件的最后一個觀測假設(shè)預測周期超越了數(shù)據(jù)文件的最后一個觀測期期,選擇此項選擇此項,并輸入預測期數(shù)并輸入預測期數(shù). 線性回歸分析的內(nèi)容

36、線性回歸分析的內(nèi)容 能否找到一個線性組合來闡明一組自變量和因變量的能否找到一個線性組合來闡明一組自變量和因變量的關(guān)系關(guān)系 假設(shè)能的話,這種關(guān)系的強度有多大,也就是利用自假設(shè)能的話,這種關(guān)系的強度有多大,也就是利用自變量的線性組合來預測因變量的才干有多強變量的線性組合來預測因變量的才干有多強 整體解釋才干能否具有統(tǒng)計上的顯著性意義整體解釋才干能否具有統(tǒng)計上的顯著性意義 在整體解釋才干顯著的情況下,哪些自變量有顯著意在整體解釋才干顯著的情況下,哪些自變量有顯著意義義 回歸分析的普通步驟回歸分析的普通步驟 確定回歸方程中的解釋變量自變量和被解釋變量確定回歸方程中的解釋變量自變量和被解釋變量因變量因變

37、量 確定回歸方程確定回歸方程 對回歸方程進展各種檢驗對回歸方程進展各種檢驗 利用回歸方程進展預測利用回歸方程進展預測9.1 線性回歸分析概述線性回歸分析概述8.4.2 線性回歸模型 一元線性回歸模型的數(shù)學模型: 其中x為自變量;y為因變量; 為截距,即常量; 為回歸系數(shù),闡明自變量對因變量的影響程度。xy1001 用最小二乘法求解方程中的兩個參數(shù),得到:21)()(xxyyxxiiixby 0多元線性回歸模型多元線性回歸模型 多元線性回歸方程:多元線性回歸方程: y=0+1x1+2x2+.+kxk 1、2、k為偏回歸系數(shù)。為偏回歸系數(shù)。 1表示在其他自變量堅持不變的情況下,表示在其他自變量堅持

38、不變的情況下,自變量自變量x1變動一個單位所引起的因變量變動一個單位所引起的因變量y的平均變動。的平均變動。 8.4.3 線性回歸方程的統(tǒng)計檢驗線性回歸方程的統(tǒng)計檢驗8.4.3.1回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度 回歸直線與各觀測點的接近程度稱為回歸方程的擬合優(yōu)度,回歸直線與各觀測點的接近程度稱為回歸方程的擬合優(yōu)度,也就是樣本觀測值聚集在回歸線周圍的嚴密程度也就是樣本觀測值聚集在回歸線周圍的嚴密程度 。1、離差平方和的分解:、離差平方和的分解: 建立直線回歸方程可知:建立直線回歸方程可知:y的觀測值的總變動的觀測值的總變動可由可由 來反映,稱為總變差。引起總變差的來反映,稱為總變差。引起總

39、變差的緣由有兩個:緣由有兩個:由于由于x的取值不同,使得與的取值不同,使得與x有線性關(guān)系的有線性關(guān)系的y值不同;值不同;隨機要素的影響。隨機要素的影響。2)( yybxayxyy)(0yy )(0yy )(yy總離差平方和可分解為總離差平方和可分解為222yyyyyy 即:總離差平方和即:總離差平方和SST)=SST)=剩余離差平方和剩余離差平方和(SST) +(SST) +回歸回歸離差平方和離差平方和SSR)SSR) 其中;其中;SSRSSR是由是由x x和和y y的直線回歸關(guān)系引起的,可以由回歸的直線回歸關(guān)系引起的,可以由回歸直線做出解釋;直線做出解釋;SSESSE是除了是除了x x對對y

40、 y的線性影響之外的隨機要素所的線性影響之外的隨機要素所引起的引起的Y Y的變動,是回歸直線所不能解釋的。的變動,是回歸直線所不能解釋的。2、可決系數(shù)斷定系數(shù)、決議系數(shù) 回歸平方和在總離差平方和中所占的比例可以作為一個統(tǒng)計目的,用來衡量X與Y 的關(guān)系親密程度以及回歸直線的代表性好壞,稱為可決系數(shù)。對于一元線性回歸方程:22222211yyyyyyyyRSSTSSESSTSSESSTSSTSSRRn對于多元線性回歸方程:對于多元線性回歸方程:n 在多元線性回歸分析中,引起斷定系數(shù)添加的緣由有兩在多元線性回歸分析中,引起斷定系數(shù)添加的緣由有兩個:一個是方程中的解釋變量個數(shù)增多,另一個是方程中引入個

41、:一個是方程中的解釋變量個數(shù)增多,另一個是方程中引入了對被解釋變量有重要影響的解釋變量。假設(shè)某個自變量引入了對被解釋變量有重要影響的解釋變量。假設(shè)某個自變量引入方程后對因變量的線性解釋有重要奉獻,那么必然會使誤差平方程后對因變量的線性解釋有重要奉獻,那么必然會使誤差平方和顯著減小,并使平均的誤差平方和也顯著減小,從而使調(diào)方和顯著減小,并使平均的誤差平方和也顯著減小,從而使調(diào)整的斷定系數(shù)提高。所以在多元線性回歸分析中,調(diào)整的斷定整的斷定系數(shù)提高。所以在多元線性回歸分析中,調(diào)整的斷定系數(shù)比斷定系數(shù)更能準確的反映回歸方程的擬合優(yōu)度。系數(shù)比斷定系數(shù)更能準確的反映回歸方程的擬合優(yōu)度。1/1/1122nS

42、STpnSSERSSTSSER 8.4.3.2回歸方程的顯著性檢驗方差分析F檢驗 回歸方程的顯著性檢驗是要檢驗被解釋變量與一切的解釋變量之間的線性關(guān)系能否顯著。 對于一元線性回歸方程,檢驗統(tǒng)計量為: 對于多元線性回歸方程,檢驗統(tǒng)計量為:),(21)2/()(1/)()2/(1/22nFnyyyynSSESSRF),(1p)1/()(/)()1/(/22pnFpnyypyypnSSEpSSRF 8.4.3.3回歸系數(shù)的顯著性檢驗t檢驗 回歸系數(shù)的顯著性檢驗是要檢驗回歸方程中被解釋變量與每一個解釋變量之間的線性關(guān)系能否顯著。 對于一元線性回歸方程,檢驗統(tǒng)計量為: 2)()2()(221nyySnt

43、xxtiiyi其中,n 對于多元線性回歸方程,檢驗統(tǒng)計量為:1)()1()(22pnyySpntxxtiiyiijii其中, 8.4.3.4殘差分析 殘差是指由回歸方程計算得到的預測值與實踐樣本值之間的差距,定義為: 對于線性回歸分析來講,假設(shè)方程可以較好的反映被解釋變量的特征和規(guī)律性,那么殘差序列中應不包含明顯的規(guī)律性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。 ).(22110ppiiiixxxyyye1、對于殘差均值和方差齊性檢驗可以利用殘差圖進展分析。假設(shè)殘差均值為零,殘差圖的點應該在縱坐標為0的中心的帶狀區(qū)域中隨機

44、散落。假設(shè)殘差的方差隨著解釋變量值或被解釋變量值的添加呈有規(guī)律的變化趨勢,那么出現(xiàn)了異方差景象。2、DW檢驗。 DW檢驗用來檢驗殘差的自相關(guān)。檢驗統(tǒng)計量為: DW=2表示無自相關(guān),在0-2之間闡明存在正自相關(guān),在2-4之間闡明存在負的自相關(guān)。普通情況下,DW值在1.5-2.5之間即可闡明無自相關(guān)景象。)1(2)(22221nttnttteeeDW 8.4.3.5多重共線性分析 多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的景象。測度多重共線性普通有以下方式: 1、容忍度: 其中, 是第i個解釋變量與方程中其他解釋變量間的復相關(guān)系數(shù)的平方,表示解釋變量之間的線性相關(guān)程度。容忍度的取值范圍在0-1之

45、間,越接近0表示多重共線性越強,越接近1表示多重共線性越弱。 2、方差膨脹因子VIF。方差膨脹因子是容忍度的倒數(shù)。VIF越大多重共線性越強,當VIF大于等于10時,闡明存在嚴重的多重共線性。 21iiRTol2iR3、特征根和方差比。根據(jù)解釋變量的相關(guān)系數(shù)矩陣求得的特征根中,假設(shè)最大的特征根遠遠大于其他特征根,那么闡明這些解釋變量間具有相當多的反復信息。假設(shè)某個特征根既可以描寫某解釋變量方差的較大部分比例0.7以上,又能描寫另一解釋變量方差的較大部分比例,那么闡明這兩個解釋變量間存在較強的線性相關(guān)關(guān)系。4、條件指數(shù)。指最大特征根與第i個特征根比的平方根。通常,當條件指數(shù)在0-10之間時闡明多重

46、共線性較弱;當條件指數(shù)在10-100之間闡明多重共線性較強;當條件指數(shù)大于100時闡明存在嚴重的多重共線性。 imik8.4.3 線性回歸分析的根本操作線性回歸分析的根本操作1選擇菜單選擇菜單AnalyzeRegressionLinear,出現(xiàn)窗口:,出現(xiàn)窗口:2選擇被解釋變量進入選擇被解釋變量進入Dependent框???。3選擇一個或多個解釋變量進入選擇一個或多個解釋變量進入Independent(s)框???。4在在Method框中選擇回歸分析中解釋變框中選擇回歸分析中解釋變量的挑選戰(zhàn)略。其中量的挑選戰(zhàn)略。其中Enter表示所選變量強表示所選變量強行進入回歸方程,是行進入回歸方程,是SPSS

47、默許的戰(zhàn)略,通默許的戰(zhàn)略,通常用在一元線性回歸分析中;常用在一元線性回歸分析中;Remove表示表示從回歸方程中剔除所選變量;從回歸方程中剔除所選變量;Stepwise表表示逐漸挑選戰(zhàn)略;示逐漸挑選戰(zhàn)略;Backward表示向后挑選表示向后挑選戰(zhàn)略;戰(zhàn)略;Forward表示向前挑選戰(zhàn)略。表示向前挑選戰(zhàn)略。注:多元回歸分析中,變量的挑選普通有向前挑選、向后挑選、逐漸挑選三種根本戰(zhàn)略。向前挑選 Forward 戰(zhàn)略:解釋變量不斷進入回歸方程的過程。首先,選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進入方程,并進展回歸方程的各種檢驗;然后,在剩余的變量中尋覓與被解釋變量偏相關(guān)系數(shù)最高且經(jīng)過檢驗的變量進

48、入回歸方程,并對新建立的回歸方程進展各種檢驗;這個過程不斷反復,直到再也沒有可進入方程的變量為止。向后挑選 Backward 戰(zhàn)略:變量不斷剔除出回歸方程的過程。首先,一切變量全部引入回歸方程,并對回歸方程進展各種檢驗;然后,在回歸系數(shù)顯著性檢驗不顯著的一個或多個變量中,剔除t檢驗值最小的變量,并重新建立 回歸方程和進展各種檢驗;假設(shè)新建回歸方程中回歸方程和進展各種檢驗;假設(shè)新建回歸方程中一切變量的回歸系數(shù)檢驗都顯著,那么回歸方程建一切變量的回歸系數(shù)檢驗都顯著,那么回歸方程建立終了。否那么按上述方法再一次剔除最不顯著的立終了。否那么按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為

49、止。變量,直到再也沒有可剔除的變量為止。逐漸挑選逐漸挑選 Stepwise 戰(zhàn)略:在向前挑選戰(zhàn)略的戰(zhàn)略:在向前挑選戰(zhàn)略的根底上結(jié)合向后挑選戰(zhàn)略,在每個變量進入方程后根底上結(jié)合向后挑選戰(zhàn)略,在每個變量進入方程后再次判別能否存在應該剔除出方程的變量。因此,再次判別能否存在應該剔除出方程的變量。因此,逐漸挑選戰(zhàn)略在引入變量的每一個階段都提供了再逐漸挑選戰(zhàn)略在引入變量的每一個階段都提供了再剔除不顯著變量的時機。剔除不顯著變量的時機。5第三和第四步中確定的解釋變量及變量挑選第三和第四步中確定的解釋變量及變量挑選戰(zhàn)略可放置在不同的塊戰(zhàn)略可放置在不同的塊Block中。通常在回歸中。通常在回歸分析中不止一組待

50、進入方程的解釋變量和相應的分析中不止一組待進入方程的解釋變量和相應的挑選戰(zhàn)略,可以單擊挑選戰(zhàn)略,可以單擊Next和和Previous按鈕設(shè)置多按鈕設(shè)置多組解釋變量和變量挑選戰(zhàn)略并放置在不同的塊中。組解釋變量和變量挑選戰(zhàn)略并放置在不同的塊中。6選擇一個變量作為條件變量放到選擇一個變量作為條件變量放到Selection Variable框中,并單擊框中,并單擊Rule按鈕給定一個判別條按鈕給定一個判別條件。只需變量值滿足斷定條件的樣本才參與線性件。只需變量值滿足斷定條件的樣本才參與線性回歸分析?;貧w分析。7在在Case Labels框中指定哪個變量作為樣本數(shù)框中指定哪個變量作為樣本數(shù)據(jù)點的標志變量

51、,該變量的值將標在回歸分析的據(jù)點的標志變量,該變量的值將標在回歸分析的輸出圖形中。輸出圖形中。8.4.4 線性回歸分析的其他操作線性回歸分析的其他操作1、Statistics按鈕,出現(xiàn)的窗口可供用戶選按鈕,出現(xiàn)的窗口可供用戶選擇更多的輸出統(tǒng)計量。擇更多的輸出統(tǒng)計量。1Estimates:SPSS默許輸出項,輸出默許輸出項,輸出與回歸系數(shù)相關(guān)的統(tǒng)計量。包括回歸系數(shù)與回歸系數(shù)相關(guān)的統(tǒng)計量。包括回歸系數(shù)偏回歸系數(shù)、回歸系數(shù)規(guī)范誤差、規(guī)偏回歸系數(shù)、回歸系數(shù)規(guī)范誤差、規(guī)范化回歸系數(shù)、回歸系數(shù)顯著性檢驗的范化回歸系數(shù)、回歸系數(shù)顯著性檢驗的t統(tǒng)統(tǒng)計量和概率計量和概率p值,各解釋變量的容忍度。值,各解釋變量的

52、容忍度。2Confidence Intervals:輸出每個非規(guī):輸出每個非規(guī)范化回歸系數(shù)范化回歸系數(shù)95的置信區(qū)間。的置信區(qū)間。3Descriptive:輸出各解釋變量和被解:輸出各解釋變量和被解釋變量的均值、規(guī)范差、相關(guān)系數(shù)矩陣及釋變量的均值、規(guī)范差、相關(guān)系數(shù)矩陣及單側(cè)檢驗概率單側(cè)檢驗概率p值。值。4Model fit:SPSS默許輸出項,輸出默許輸出項,輸出斷定系數(shù)、調(diào)整的斷定系數(shù)、回歸方程的斷定系數(shù)、調(diào)整的斷定系數(shù)、回歸方程的規(guī)范誤差、回歸方程顯著規(guī)范誤差、回歸方程顯著F檢驗的方程分析檢驗的方程分析表。表。5R squared change:輸出每個解釋變:輸出每個解釋變量進入方程后引

53、起的斷定系數(shù)的變化量和量進入方程后引起的斷定系數(shù)的變化量和F值的變化量。值的變化量。6Part and partial correlation:輸出:輸出方程中各解釋變量與被解釋變量之間的簡方程中各解釋變量與被解釋變量之間的簡單相關(guān)、偏相關(guān)系數(shù)。單相關(guān)、偏相關(guān)系數(shù)。7Covariance matrix:輸出方程中各解釋:輸出方程中各解釋變量間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù)變量間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù)的方差。的方差。8Collinearity Diagnostics:多重共線性:多重共線性分析,輸出各個解釋變量的容忍度、方差膨分析,輸出各個解釋變量的容忍度、方差膨脹因子、特征值、條件

54、目的、方差比例等。脹因子、特征值、條件目的、方差比例等。9在在Residual框中:框中:Durbin-waston表示表示輸出輸出DW檢驗值;檢驗值;Casewise Diagnostic表示表示輸出規(guī)范化殘差絕對值大于等于輸出規(guī)范化殘差絕對值大于等于3SPSS默默許值的樣本數(shù)據(jù)的相關(guān)信息,包括預測值、許值的樣本數(shù)據(jù)的相關(guān)信息,包括預測值、殘差、杠桿值等。殘差、杠桿值等。2、Options選項,出現(xiàn)的窗口可供用戶設(shè)置選項,出現(xiàn)的窗口可供用戶設(shè)置多元線性回歸分析中解釋變量挑選的規(guī)范多元線性回歸分析中解釋變量挑選的規(guī)范以及缺失值的處置方式。以及缺失值的處置方式。3、Plot選項,出現(xiàn)的窗口用于對

55、殘差序列的選項,出現(xiàn)的窗口用于對殘差序列的分析。分析。1窗口左邊框中各變量名的含義是:窗口左邊框中各變量名的含義是:DEPENDNT表示被解釋變量,表示被解釋變量,*ZPRED表示規(guī)范表示規(guī)范化預測值,化預測值,*ZRESID表示規(guī)范化殘差,表示規(guī)范化殘差,*DRESID表示剔除殘差,表示剔除殘差,*ADJPRED表示調(diào)整表示調(diào)整的預測值,的預測值,*SRESID表示學生化殘差,表示學生化殘差,*SDRESID表示剔除學生化殘差。表示剔除學生化殘差。2繪制多對變量的散點圖,可根據(jù)需求在繪制多對變量的散點圖,可根據(jù)需求在scatter框中定義散點圖的縱坐標和橫坐標變量。框中定義散點圖的縱坐標和橫

56、坐標變量。3在在Standardized Residual Plots框中選擇框中選擇Histogram選項繪制規(guī)范化殘差序列的直方圖;選項繪制規(guī)范化殘差序列的直方圖;選擇選擇Normal probability plot繪制規(guī)范化殘差序繪制規(guī)范化殘差序列的正態(tài)分布累計概率圖。選擇列的正態(tài)分布累計概率圖。選擇Produce all partial plots選項表示依次繪制被解釋變量和各選項表示依次繪制被解釋變量和各個解釋變量的散點圖。個解釋變量的散點圖。4、Save選項,該窗口將回歸分析的某些結(jié)果以選項,該窗口將回歸分析的某些結(jié)果以SPSS變量的方式保管到數(shù)據(jù)編輯窗口中,并可同變量的方式保管

57、到數(shù)據(jù)編輯窗口中,并可同時生成時生成XML格式的文件,便于分析結(jié)果的網(wǎng)絡發(fā)布。格式的文件,便于分析結(jié)果的網(wǎng)絡發(fā)布。1Predicted Values框中:保管非規(guī)范化預測值、框中:保管非規(guī)范化預測值、規(guī)范化預測值、調(diào)整的預測值和預測值的均值規(guī)范規(guī)范化預測值、調(diào)整的預測值和預測值的均值規(guī)范誤差。誤差。2Distance框中:保管均值或個體預測值框中:保管均值或個體預測值95默許置信區(qū)間的下限值和上限值。默許置信區(qū)間的下限值和上限值。3Residual框中:保管非規(guī)范化殘差、規(guī)范化殘框中:保管非規(guī)范化殘差、規(guī)范化殘差等。差等。4Influence Statistics框中:保管剔除第框中:保管剔除

58、第i個樣個樣本后統(tǒng)計量的變化量。本后統(tǒng)計量的變化量。5、WSL選項,采用加權(quán)最小二乘法替代普通最小二選項,采用加權(quán)最小二乘法替代普通最小二乘法估計回歸參數(shù),并指定一個變量作為權(quán)重變量。乘法估計回歸參數(shù),并指定一個變量作為權(quán)重變量。 以高??蒲醒杏憯?shù)據(jù)為例,建立回歸方程研討以高校科研研討數(shù)據(jù)為例,建立回歸方程研討 1、課題總數(shù)受論文數(shù)的影響、課題總數(shù)受論文數(shù)的影響 2、以課題總數(shù)為被解釋變量,解釋變量為投入人、以課題總數(shù)為被解釋變量,解釋變量為投入人年數(shù)年數(shù)X2、受投入高級職稱的人年數(shù)、受投入高級職稱的人年數(shù)X3、投、投入科研事業(yè)費入科研事業(yè)費X4、專著數(shù)、專著數(shù)X6、論文數(shù)、論文數(shù)X7、獲獎數(shù)

59、、獲獎數(shù)X8。 1解釋變量采用強迫進入戰(zhàn)略解釋變量采用強迫進入戰(zhàn)略Enter,并做,并做多重共線性檢測。多重共線性檢測。 2解釋變量采用向后挑選戰(zhàn)略讓解釋變量采用向后挑選戰(zhàn)略讓SPSS自動完成自動完成解釋變量的選擇。解釋變量的選擇。 3解釋變量采用逐漸挑選戰(zhàn)略讓解釋變量采用逐漸挑選戰(zhàn)略讓SPSS自動完成自動完成解釋變量的選擇。解釋變量的選擇。 8.4.5 運用舉例運用舉例1、為研討收入和支出的關(guān)系,搜集、為研討收入和支出的關(guān)系,搜集1978-2002年我國的年人均可支配收入和年人均年我國的年人均可支配收入和年人均消費性支出數(shù)據(jù),研討收入與支出之間能消費性支出數(shù)據(jù),研討收入與支出之間能否具有較強

60、的線性關(guān)系。否具有較強的線性關(guān)系。2、以年人均支出和教育數(shù)據(jù)為例,建立回歸、以年人均支出和教育數(shù)據(jù)為例,建立回歸方程研討年人均消費支出、恩格爾系數(shù)、方程研討年人均消費支出、恩格爾系數(shù)、在外就餐、教育支出、住房人均運用面積在外就餐、教育支出、住房人均運用面積受年人均可支配收入的影響。受年人均可支配收入的影響。練習9.7 曲線估計曲線估計 9.7.1 曲線估計概述曲線估計概述 變量間的相關(guān)關(guān)系中,并不總是表變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也是極為常見的。現(xiàn)出線性關(guān)系,非線性關(guān)系也是極為常見的。變量之間的非線性關(guān)系可以劃分為本質(zhì)線性變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論