




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 第十一章第十一章 線性相關(guān)與回歸分析線性相關(guān)與回歸分析第一節(jié)第一節(jié) 線性相關(guān)與偏相關(guān)分析線性相關(guān)與偏相關(guān)分析第二節(jié)第二節(jié) 簡單線性回歸分析簡單線性回歸分析第三節(jié)第三節(jié) 二項二項logisticlogistic回歸分析回歸分析第一節(jié)第一節(jié) 線性相關(guān)分析與偏相關(guān)分析線性相關(guān)分析與偏相關(guān)分析線性相關(guān)分析通過圖形和數(shù)值兩種方式,能線性相關(guān)分析通過圖形和數(shù)值兩種方式,能夠有效揭示事物之間的統(tǒng)計關(guān)系的強弱程度夠有效揭示事物之間的統(tǒng)計關(guān)系的強弱程度。一、散點圖一、散點圖 繪制散點圖是相關(guān)分析中極為直觀的分析方繪制散點圖是相關(guān)分析中極為直觀的分析方式。它將數(shù)據(jù)以點的形式畫在直角平面上。式。它將數(shù)據(jù)以點的形式
2、畫在直角平面上。通過觀察散點圖能夠直觀地發(fā)現(xiàn)變量間的統(tǒng)通過觀察散點圖能夠直觀地發(fā)現(xiàn)變量間的統(tǒng)計關(guān)系以及它們的強弱程度和數(shù)據(jù)的可能走計關(guān)系以及它們的強弱程度和數(shù)據(jù)的可能走向。向。Graphs-Legacy Dialogs-Scatter/DotGraphs-Legacy Dialogs-Scatter/Dot例題例題根據(jù)根據(jù)3131個省市自治區(qū)部分高校有關(guān)社科研究個省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研究立項課題數(shù)(當(dāng)年)與投方面的數(shù)據(jù),研究立項課題數(shù)(當(dāng)年)與投入的具有高級職稱的人年數(shù)(上年),發(fā)表入的具有高級職稱的人年數(shù)(上年),發(fā)表的論文數(shù)(上年)之間是否具有較強的線性的論文數(shù)(上年
3、)之間是否具有較強的線性關(guān)系。關(guān)系。(一)簡單散點圖(一)簡單散點圖simple scatterplotsimple scatterplot表示一對變量間統(tǒng)計關(guān)系的散點圖。表示一對變量間統(tǒng)計關(guān)系的散點圖。指定某個變量為散點圖的縱軸變量,選入指定某個變量為散點圖的縱軸變量,選入Y Axis Y Axis 框中;框中;指定某個變量為散點圖的橫軸變量,選入指定某個變量為散點圖的橫軸變量,選入X Axis X Axis 框中;框中;可把分組變量指定到可把分組變量指定到Set Markers bySet Markers by框中,樣本數(shù)據(jù)被分框中,樣本數(shù)據(jù)被分成若干組,并在一張圖上分別以不同顏色繪制散點
4、圖。成若干組,并在一張圖上分別以不同顏色繪制散點圖。該項可省略;該項可省略;把標(biāo)記變量指定到把標(biāo)記變量指定到Label Cases byLabel Cases by框中,表示將標(biāo)記變量框中,表示將標(biāo)記變量的各變量值標(biāo)記在散點圖相應(yīng)點的旁邊。該項可省略。的各變量值標(biāo)記在散點圖相應(yīng)點的旁邊。該項可省略。( (二二) )重疊散點圖重疊散點圖overlay scatterplotoverlay scatterplot表示多對變量間統(tǒng)計關(guān)系的散點圖。表示多對變量間統(tǒng)計關(guān)系的散點圖。兩個變量為一對,指定繪制哪些變量間的散兩個變量為一對,指定繪制哪些變量間的散點圖。其中前一個作為圖的縱軸變量,后一點圖。其中
5、前一個作為圖的縱軸變量,后一個變量作為圖的橫軸變量,并可單擊個變量作為圖的橫軸變量,并可單擊 按鈕進行橫縱軸的調(diào)換。按鈕進行橫縱軸的調(diào)換。把標(biāo)記變量指定到把標(biāo)記變量指定到Label Cases byLabel Cases by框中。涵義框中。涵義同簡單散點圖。同簡單散點圖。(三)矩陣散點圖(三)矩陣散點圖(matrixmatrix)以方形矩陣的形式在多個坐標(biāo)軸上分別顯示多對以方形矩陣的形式在多個坐標(biāo)軸上分別顯示多對變量間的統(tǒng)計關(guān)系。矩陣散點圖的關(guān)鍵是弄清各變量間的統(tǒng)計關(guān)系。矩陣散點圖的關(guān)鍵是弄清各矩陣單元中的橫縱變量。矩陣單元中的橫縱變量。把參與繪圖的若干個變量指定到把參與繪圖的若干個變量指定
6、到Matrix VariablesMatrix Variables框中。選擇變量的先后順序決定了矩陣對角線上框中。選擇變量的先后順序決定了矩陣對角線上變量的排列順序。變量的排列順序??砂逊纸M變量指定到可把分組變量指定到Set Markers bySet Markers by框中,同簡框中,同簡單散點圖;單散點圖;把標(biāo)記變量指定到把標(biāo)記變量指定到Label Cases byLabel Cases by框中,同簡單框中,同簡單散點圖。散點圖。(四)三維散點圖(四)三維散點圖(3-D3-D)以立體圖的形式展現(xiàn)三對變量間的統(tǒng)計關(guān)系以立體圖的形式展現(xiàn)三對變量間的統(tǒng)計關(guān)系。指定三個變量為散點圖各軸的變量,
7、分別選指定三個變量為散點圖各軸的變量,分別選入入X AxisX Axis、Y AxisY Axis、C AxisC Axis框中??蛑???砂逊纸M變量指定到可把分組變量指定到Set Markers bySet Markers by框中,同框中,同簡單散點圖;簡單散點圖;把標(biāo)記變量指定到把標(biāo)記變量指定到Label Cases byLabel Cases by框中,同簡框中,同簡單散點圖。單散點圖。4050607080男性平均預(yù)期壽命22.533.544.5log(人均gdp)4050607080男性平均預(yù)期壽命22.533.544.5log(人均gdp)bandwidth = .8Lowess s
8、moother二、相關(guān)系數(shù)二、相關(guān)系數(shù)雖然散點圖能夠直觀地展現(xiàn)變量之間的統(tǒng)計雖然散點圖能夠直觀地展現(xiàn)變量之間的統(tǒng)計關(guān)系,但并不精確。相關(guān)系數(shù)以數(shù)值的方式關(guān)系,但并不精確。相關(guān)系數(shù)以數(shù)值的方式精確地反映了兩個變量之間的線性相關(guān)的強精確地反映了兩個變量之間的線性相關(guān)的強弱程度。弱程度。利用相關(guān)系數(shù)進行變量間線性關(guān)系的分析通利用相關(guān)系數(shù)進行變量間線性關(guān)系的分析通常需要完成以下兩大步驟:常需要完成以下兩大步驟:第一,計算樣本相關(guān)系數(shù)第一,計算樣本相關(guān)系數(shù)r r第二,對樣本來自的兩總體是否存在顯著的第二,對樣本來自的兩總體是否存在顯著的線性關(guān)系進行推斷。線性關(guān)系進行推斷。PearsonPearson相關(guān)
9、系數(shù)相關(guān)系數(shù)r r度量兩個定距變量間的線度量兩個定距變量間的線性相關(guān)關(guān)系;性相關(guān)關(guān)系; SPSS SPSS提供的提供的PearsonPearson相關(guān)系數(shù)相關(guān)系數(shù)r r的檢驗統(tǒng)計量為的檢驗統(tǒng)計量為t t統(tǒng)計量,其數(shù)學(xué)定義為:統(tǒng)計量,其數(shù)學(xué)定義為:PearsonPearson相關(guān)系數(shù)相關(guān)系數(shù)r r -1r+1-1r+1R=1R=1R=-1R=-1R=0R=0|r|r|0.80.8表示兩變量之間具有較強線性相關(guān)。表示兩變量之間具有較強線性相關(guān)。|r|r|0.30.3表示兩變量之間線性相關(guān)關(guān)系較弱。表示兩變量之間線性相關(guān)關(guān)系較弱。Pearson Pearson 簡單相關(guān)系數(shù)特點:簡單相關(guān)系數(shù)特點:(
10、1 1)對稱性)對稱性【x x與與y y的相關(guān)系數(shù)等同于的相關(guān)系數(shù)等同于y y與與x x的相的相關(guān)系數(shù)關(guān)系數(shù)】(2 2)是標(biāo)準(zhǔn)化處理后的值,所以無量綱。)是標(biāo)準(zhǔn)化處理后的值,所以無量綱。(3 3)對)對x x與與y y作線性變換后可能會改變它們之間作線性變換后可能會改變它們之間的相關(guān)系數(shù)的符號(相關(guān)的方向),但不會改變的相關(guān)系數(shù)的符號(相關(guān)的方向),但不會改變相關(guān)系數(shù)的值。相關(guān)系數(shù)的值。(4 4)不適用度量非線性關(guān)系變量間的相關(guān)系數(shù))不適用度量非線性關(guān)系變量間的相關(guān)系數(shù)計算計算PearsonPearson相關(guān)系數(shù)的操作相關(guān)系數(shù)的操作Analyze-Correlate-BivariateAnal
11、yze-Correlate-Bivariate把參加計算相關(guān)系數(shù)的變量選到把參加計算相關(guān)系數(shù)的變量選到VariablesVariables框??颉T谠贑orrelation Coefficients Correlation Coefficients 框中選擇計算哪種相關(guān)框中選擇計算哪種相關(guān)系數(shù),系數(shù),在在Test of SignificanceTest of Significance框中選擇輸出相關(guān)系數(shù)檢驗的框中選擇輸出相關(guān)系數(shù)檢驗的雙尾(雙尾(Two TailedTwo Tailed)或單尾()或單尾(One TailedOne Tailed)概率)概率P P值。值。選中選中Flag sig
12、nificance correlationsFlag significance correlations表示在輸出統(tǒng)計表示在輸出統(tǒng)計檢驗的概率檢驗的概率P P值外,還輸出星號,表明變量間相關(guān)性是值外,還輸出星號,表明變量間相關(guān)性是否顯著。不選中則不輸出星號。否顯著。不選中則不輸出星號。在在OptionOption按鈕中的按鈕中的 Statistics Statistics選項中,選中選項中,選中 Cross- Cross-product deviations and covariancesproduct deviations and covariances表示輸出各變量表示輸出各變量的離差平方
13、和、樣本方差、協(xié)方差等。的離差平方和、樣本方差、協(xié)方差等?!吧暾堈n題數(shù)申請課題數(shù)”與與“投入科研事業(yè)費投入科研事業(yè)費”的相的相關(guān)性及推斷也可以在我們以前介紹的交互分關(guān)性及推斷也可以在我們以前介紹的交互分類表中進行。類表中進行。相關(guān)分析應(yīng)用舉例相關(guān)分析應(yīng)用舉例根據(jù)根據(jù)3131個省市自治區(qū)部分高校有關(guān)社科研究個省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研究立項課題數(shù)(當(dāng)年)與投方面的數(shù)據(jù),研究立項課題數(shù)(當(dāng)年)與投入的具有高級職稱的人年數(shù)(上年),發(fā)表入的具有高級職稱的人年數(shù)(上年),發(fā)表的論文數(shù)(上年)之間是否具有較強的線性的論文數(shù)(上年)之間是否具有較強的線性關(guān)系。關(guān)系。該課題數(shù)、投入高級該課
14、題數(shù)、投入高級職稱的人年數(shù)以及論職稱的人年數(shù)以及論文之間圖表明,立項文之間圖表明,立項都有較強的線性關(guān)系都有較強的線性關(guān)系,且投入高級職稱的,且投入高級職稱的人年數(shù)以及論文數(shù)之人年數(shù)以及論文數(shù)之間的線性關(guān)系最強。間的線性關(guān)系最強。因此粗略地看,立項因此粗略地看,立項課題數(shù)將會受到這些課題數(shù)將會受到這些因素的影響。下面利因素的影響。下面利用計算相關(guān)系數(shù)的方用計算相關(guān)系數(shù)的方法對它們之間的關(guān)系法對它們之間的關(guān)系作進一步分析。作進一步分析。由上表可知,立項課題總數(shù)與投入高級職稱由上表可知,立項課題總數(shù)與投入高級職稱的人年數(shù)間的簡單相關(guān)系數(shù)為的人年數(shù)間的簡單相關(guān)系數(shù)為0.9940.994,與論文,與論
15、文間的相關(guān)系數(shù)為間的相關(guān)系數(shù)為0.8870.887,它們的相關(guān)系數(shù)檢驗,它們的相關(guān)系數(shù)檢驗的概率的概率P P值都近似為值都近似為0.0.因此,當(dāng)顯著性水平為因此,當(dāng)顯著性水平為0.050.05或或0.010.01時,都應(yīng)拒絕相關(guān)系數(shù)檢驗的零時,都應(yīng)拒絕相關(guān)系數(shù)檢驗的零假設(shè),認為兩總體存在線性關(guān)系。表中相關(guān)假設(shè),認為兩總體存在線性關(guān)系。表中相關(guān)系數(shù)旁邊的兩個星號系數(shù)旁邊的兩個星號( () )即表示顯著性水即表示顯著性水平為平為0.010.01時可拒絕零假設(shè)。一個星號時可拒絕零假設(shè)。一個星號( () )表表示顯著性水平為示顯著性水平為0.050.05時可拒絕零假設(shè)。因此時可拒絕零假設(shè)。因此,兩個星
16、號比一個星號拒絕零假設(shè)犯錯誤的,兩個星號比一個星號拒絕零假設(shè)犯錯誤的可能性更小??傊㈨椪n題總數(shù)將受投入可能性更小??傊?,立項課題總數(shù)將受投入高級職稱的人年數(shù)和論文數(shù)的正向影響。高級職稱的人年數(shù)和論文數(shù)的正向影響。三、偏相關(guān)分析三、偏相關(guān)分析在多數(shù)情況下,單純利用相關(guān)系數(shù)來評價變在多數(shù)情況下,單純利用相關(guān)系數(shù)來評價變量之間的相關(guān)性顯然是不準(zhǔn)確的,需要剔除量之間的相關(guān)性顯然是不準(zhǔn)確的,需要剔除其他因素的影響,再計算變量之間的相關(guān)系其他因素的影響,再計算變量之間的相關(guān)系數(shù)。這個過程就是偏相關(guān)分析,又叫凈相關(guān)數(shù)。這個過程就是偏相關(guān)分析,又叫凈相關(guān)分析??刂谱兞總€數(shù)為一個時稱為一階偏相分析??刂谱兞?/p>
17、個數(shù)為一個時稱為一階偏相關(guān)。兩個時為二階偏相關(guān);控制變量個數(shù)為關(guān)。兩個時為二階偏相關(guān);控制變量個數(shù)為零個時稱為零階偏相關(guān),也就是相關(guān)系數(shù)。零個時稱為零階偏相關(guān),也就是相關(guān)系數(shù)。研究商品需求量和價格、消費者收入之間的研究商品需求量和價格、消費者收入之間的線性關(guān)系。線性關(guān)系。利用偏相關(guān)系數(shù)進行變量之間的凈相關(guān)關(guān)系分利用偏相關(guān)系數(shù)進行變量之間的凈相關(guān)關(guān)系分析通常需要完成以下兩大步驟。析通常需要完成以下兩大步驟。第一,計算樣本的偏相關(guān)系數(shù),第一,計算樣本的偏相關(guān)系數(shù),第二,對樣本來自的兩總體是否存在顯著的凈第二,對樣本來自的兩總體是否存在顯著的凈相關(guān)進行推斷。相關(guān)進行推斷。偏相關(guān)分析的檢驗統(tǒng)計量為偏相
18、關(guān)分析的檢驗統(tǒng)計量為t t統(tǒng)計量,它的數(shù)學(xué)統(tǒng)計量,它的數(shù)學(xué)定義為:定義為:r r為偏相關(guān)系數(shù),為偏相關(guān)系數(shù),n n為樣本數(shù),為樣本數(shù),q q為階數(shù),為階數(shù),t t統(tǒng)計統(tǒng)計量服從量服從n-q-2n-q-2個自由度的個自由度的t t分布。分布。偏相關(guān)分析的基本操作偏相關(guān)分析的基本操作Analyze-correlate-partial根據(jù)根據(jù)3131個省市自治區(qū)部分高校有關(guān)社科研究個省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),控制投入的具有高級職稱的人方面的數(shù)據(jù),控制投入的具有高級職稱的人年數(shù)(上年),分析研究立項課題數(shù)(當(dāng)年)年數(shù)(上年),分析研究立項課題數(shù)(當(dāng)年)與發(fā)表的論文數(shù)(上年)之間是否具有
19、較強與發(fā)表的論文數(shù)(上年)之間是否具有較強的線性關(guān)系。的線性關(guān)系。把參與分析的變量選到把參與分析的變量選到VariablesVariables框???。選擇一個或多個控制變量到選擇一個或多個控制變量到Controlling for Controlling for 框中框中; ;在在Test of SignificanceTest of Significance框中選擇輸出偏相關(guān)框中選擇輸出偏相關(guān)檢驗的雙尾(檢驗的雙尾(Two TailedTwo Tailed)或單尾()或單尾(One One TailedTailed)概率)概率P P值。值。在在OptionOption按鈕中的按鈕中的 Stat
20、istics Statistics選項中,選中選項中,選中 Zero-order CorrelationsZero-order Correlations表示輸出零階偏相關(guān)表示輸出零階偏相關(guān)系數(shù)。系數(shù)。在上表中,在把投入高級職稱的人年數(shù)作為控在上表中,在把投入高級職稱的人年數(shù)作為控制變量的條件下,課題總數(shù)與論文數(shù)間的偏制變量的條件下,課題總數(shù)與論文數(shù)間的偏相關(guān)系數(shù)為相關(guān)系數(shù)為-0.140-0.140,呈極弱的負相關(guān)關(guān)系,呈極弱的負相關(guān)關(guān)系,說明上年發(fā)表的論文數(shù)對當(dāng)年立項課題數(shù)的說明上年發(fā)表的論文數(shù)對當(dāng)年立項課題數(shù)的線性影響非常弱。該結(jié)論與相關(guān)分析的結(jié)論線性影響非常弱。該結(jié)論與相關(guān)分析的結(jié)論(簡單
21、相關(guān)系數(shù)為(簡單相關(guān)系數(shù)為0.8870.887)差距甚遠。分析原)差距甚遠。分析原因發(fā)現(xiàn),上年投入高級職稱人年數(shù)對立項課因發(fā)現(xiàn),上年投入高級職稱人年數(shù)對立項課題數(shù)有很大的影響,該因素也充分地作用在題數(shù)有很大的影響,該因素也充分地作用在發(fā)表論文數(shù)上,并對發(fā)表論文數(shù)起了決定性發(fā)表論文數(shù)上,并對發(fā)表論文數(shù)起了決定性作用。因此,當(dāng)控制投入高級職稱的人年數(shù)作用。因此,當(dāng)控制投入高級職稱的人年數(shù)后,發(fā)表論文數(shù)就不再對立項課題數(shù)有顯著后,發(fā)表論文數(shù)就不再對立項課題數(shù)有顯著的線性作用了??梢?,偏相關(guān)分析對辨別變的線性作用了??梢?,偏相關(guān)分析對辨別變量間的虛假相關(guān)有極為重要的影響。量間的虛假相關(guān)有極為重要的影響
22、。第二節(jié)第二節(jié) 簡單線性回歸分析簡單線性回歸分析回歸分析是一種極為廣泛的數(shù)量分析方法。回歸分析是一種極為廣泛的數(shù)量分析方法。它用于分析事物之間的統(tǒng)計關(guān)系,側(cè)重考察它用于分析事物之間的統(tǒng)計關(guān)系,側(cè)重考察變量之間的數(shù)量變化規(guī)律,并通過回歸方程變量之間的數(shù)量變化規(guī)律,并通過回歸方程的形式描述和反映這種關(guān)系,幫助人們準(zhǔn)確的形式描述和反映這種關(guān)系,幫助人們準(zhǔn)確把握變量受其他一個或多個變量影響的程度,把握變量受其他一個或多個變量影響的程度,進而為控制和預(yù)測提供科學(xué)依據(jù)。進而為控制和預(yù)測提供科學(xué)依據(jù)?;貧w分析的核心目的是找到回歸線,涉及如回歸分析的核心目的是找到回歸線,涉及如何找到回歸線?如何描述回歸線?回
23、歸線是何找到回歸線?如何描述回歸線?回歸線是否可用于預(yù)測?等問題。否可用于預(yù)測?等問題。要找出一個錯誤最小的方法來預(yù)測依變量的要找出一個錯誤最小的方法來預(yù)測依變量的數(shù)值數(shù)值. .一、獲得回歸線有兩種辦法:一、獲得回歸線有兩種辦法:局部平均法局部平均法和和函數(shù)擬合法函數(shù)擬合法(一)局部平均法(一)局部平均法收集到收集到n n對父親和兒子的身高數(shù)據(jù)對父親和兒子的身高數(shù)據(jù)(xi,yixi,yi)(i=1,2,n)(i=1,2,n),可以對它們進行散點圖繪制、計算基本描述統(tǒng)計可以對它們進行散點圖繪制、計算基本描述統(tǒng)計量等基本分析。現(xiàn)在得到一個父親身高數(shù)據(jù)量等基本分析?,F(xiàn)在得到一個父親身高數(shù)據(jù)X X0
24、0 ,其兒子身高預(yù)測值可以是:第一,子輩身高的平其兒子身高預(yù)測值可以是:第一,子輩身高的平均值。顯然這個預(yù)測是不準(zhǔn)確的,因為沒有考慮均值。顯然這個預(yù)測是不準(zhǔn)確的,因為沒有考慮父親身高父親身高X X0 0的作用;第二,父親身高為的作用;第二,父親身高為X X0 0的所有兒的所有兒子身高的平均值。該預(yù)測較第一種方法顯然要準(zhǔn)子身高的平均值。該預(yù)測較第一種方法顯然要準(zhǔn)確的多。第三,如果在所得數(shù)據(jù)中沒有父親身高確的多。第三,如果在所得數(shù)據(jù)中沒有父親身高為為X X0 0的樣本數(shù)據(jù),可考慮計算父親身高的樣本數(shù)據(jù),可考慮計算父親身高X X0 0左右的一左右的一個較小區(qū)間內(nèi)的兒子的平均值。按照這種思路在個較小區(qū)
25、間內(nèi)的兒子的平均值。按照這種思路在散點圖上不難得到一系列對應(yīng)的數(shù)據(jù)點,如果這散點圖上不難得到一系列對應(yīng)的數(shù)據(jù)點,如果這些點足夠多,則可以光滑出一條曲線,即回歸線些點足夠多,則可以光滑出一條曲線,即回歸線的近似線??梢娀貧w線是局部平均的結(jié)果。的近似線??梢娀貧w線是局部平均的結(jié)果。(二)函數(shù)擬合(二)函數(shù)擬合利用局部平均得到的回歸線應(yīng)在樣本量足夠大時才可實利用局部平均得到的回歸線應(yīng)在樣本量足夠大時才可實現(xiàn)。通常樣本量可能無法達到預(yù)期的數(shù)量,此時多采用現(xiàn)。通常樣本量可能無法達到預(yù)期的數(shù)量,此時多采用函數(shù)擬合的方法得到回歸線。函數(shù)擬合的基本思路:函數(shù)擬合的方法得到回歸線。函數(shù)擬合的基本思路:首先,首先
26、,通過散點圖觀察變量之間的統(tǒng)計關(guān)系,得到回歸通過散點圖觀察變量之間的統(tǒng)計關(guān)系,得到回歸線形狀的感性認識(線性或非線性),并確定一個能夠線形狀的感性認識(線性或非線性),并確定一個能夠反映和擬合這種認知的最簡捷的數(shù)學(xué)函數(shù),即回歸模型。反映和擬合這種認知的最簡捷的數(shù)學(xué)函數(shù),即回歸模型。其次,其次,利用樣本數(shù)據(jù)在一定的統(tǒng)計擬合準(zhǔn)則下,估計出利用樣本數(shù)據(jù)在一定的統(tǒng)計擬合準(zhǔn)則下,估計出回歸模型中的各個參數(shù),得到一個確定的回歸方程。回歸模型中的各個參數(shù),得到一個確定的回歸方程。最后,最后,對回歸方程的參數(shù)進行各種檢驗,判斷該方程是對回歸方程的參數(shù)進行各種檢驗,判斷該方程是否真實反映事物總體間的統(tǒng)計關(guān)系,能
27、否用于預(yù)測,并否真實反映事物總體間的統(tǒng)計關(guān)系,能否用于預(yù)測,并最終得到回歸線的近似線。最終得到回歸線的近似線。函數(shù)擬合方法應(yīng)用廣泛。函數(shù)擬合方法應(yīng)用廣泛。回歸分析的一般步驟回歸分析的一般步驟(一)確定回歸方程中的解釋變量和被解釋變量。(一)確定回歸方程中的解釋變量和被解釋變量。(二)確定回歸模型:根據(jù)散點圖確定應(yīng)通過哪種數(shù)(二)確定回歸模型:根據(jù)散點圖確定應(yīng)通過哪種數(shù)學(xué)模型來描述回歸線(線性回歸模型還是非線性回學(xué)模型來描述回歸線(線性回歸模型還是非線性回歸模型)。歸模型)。(三)建立回歸方程。根據(jù)收集到的樣本數(shù)據(jù)以及前(三)建立回歸方程。根據(jù)收集到的樣本數(shù)據(jù)以及前步所確定的回歸模型,在一定的統(tǒng)
28、計擬合準(zhǔn)則下估步所確定的回歸模型,在一定的統(tǒng)計擬合準(zhǔn)則下估計出模型的各個參數(shù),得到一個回歸方程。計出模型的各個參數(shù),得到一個回歸方程。(四)對回歸方程進行各種檢驗。(四)對回歸方程進行各種檢驗。(五)利用回歸方程進行預(yù)測。(五)利用回歸方程進行預(yù)測。利用利用SPSSSPSS進行回歸分析時,應(yīng)重點關(guān)注上述過程中第進行回歸分析時,應(yīng)重點關(guān)注上述過程中第一步和最后一步,至于中間各個步驟,一步和最后一步,至于中間各個步驟,SPSSSPSS會自動會自動完成,并給出最合理的模型。完成,并給出最合理的模型。首先根據(jù)散點圖,觀察被解釋變量與解釋變首先根據(jù)散點圖,觀察被解釋變量與解釋變量之間是否呈現(xiàn)顯著的直線關(guān)
29、系,若是,則量之間是否呈現(xiàn)顯著的直線關(guān)系,若是,則用采用線性回歸分析的方法,建立線性回歸用采用線性回歸分析的方法,建立線性回歸模型。根據(jù)模型中解釋變量的個數(shù),可將線模型。根據(jù)模型中解釋變量的個數(shù),可將線性回歸模型分為一元線性回歸模型和多元線性回歸模型分為一元線性回歸模型和多元線性回歸模型,相應(yīng)的分析稱為一元線性回歸性回歸模型,相應(yīng)的分析稱為一元線性回歸分析和多元線性回歸分析。分析和多元線性回歸分析。二、一元線性回歸分析二、一元線性回歸分析Simple linear regressionSimple linear regression現(xiàn)實社會經(jīng)濟現(xiàn)象中,某一事物(被解釋變現(xiàn)實社會經(jīng)濟現(xiàn)象中,某一
30、事物(被解釋變量)總會受到多方面因素(多個解釋變量)量)總會受到多方面因素(多個解釋變量)的影響。一元線性回歸分析是在不考慮其他的影響。一元線性回歸分析是在不考慮其他影響因素或在認為其他影響因素確定的條件影響因素或在認為其他影響因素確定的條件下,分析一個解釋變量是如何線性影響被解下,分析一個解釋變量是如何線性影響被解釋變量的,因而是比較理想化的分析。釋變量的,因而是比較理想化的分析。(一)回歸參數(shù)的普通最小二乘估計(一)回歸參數(shù)的普通最小二乘估計一元線性回歸方程的數(shù)學(xué)模型一元線性回歸方程的數(shù)學(xué)模型:Y=A+BX+ Y :因變量(因變量(dependent variabledependent v
31、ariable)X X:自變量(:自變量(independent variableindependent variable)B B :斜率(:斜率(slopeslope)(回歸系數(shù))(回歸系數(shù))A A:截距:截距ercept. (回歸常數(shù))(回歸常數(shù)):隨機誤差。應(yīng)當(dāng)滿足兩個前提條件:隨機誤差。應(yīng)當(dāng)滿足兩個前提條件: E(E()=0)=0 var( var()=)=2 2殘差的圖示殘差的圖示yi = a + bxi + ei -4 -2 0 2 4 42-2-4y=2+0.5xConstant (a) = 2a = 2bx = 3(0.5) = 1.5Case 7:
32、x=3, y=5e = 1.5一元線性回歸方程的最優(yōu)擬合數(shù)學(xué)模型:一元線性回歸方程的最優(yōu)擬合數(shù)學(xué)模型:bxay用最小二乘法求出用最小二乘法求出b和和a普通普通最小二乘估計(最小二乘估計(OLSEOLSE): :應(yīng)使每個樣本點與回歸線上的對應(yīng)點在垂直方應(yīng)使每個樣本點與回歸線上的對應(yīng)點在垂直方向上的偏差距離的總和最小。向上的偏差距離的總和最小。直接的方法是找出直接的方法是找出 a a and and b b 使得使得 the sum of the sum of squared residuals squared residuals 最小。最小。22() ,YYe即統(tǒng)計學(xué)家根據(jù)最小平方準(zhǔn)則,推算出回
33、歸直統(tǒng)計學(xué)家根據(jù)最小平方準(zhǔn)則,推算出回歸直線的位置。其斜率(線的位置。其斜率(b b )與截距()與截距(a a)的數(shù)值)的數(shù)值計算公式如下:計算公式如下:nxbyxbya)(222)()()()()()( )(xxnyxxynxxyyxxb練習(xí)一練習(xí)一以女青年的學(xué)校教育年期(以女青年的學(xué)校教育年期(x x)預(yù)測他們每天)預(yù)測他們每天參與家務(wù)勞動的小時數(shù)(參與家務(wù)勞動的小時數(shù)(y y)。)。婦女婦女教育年期教育年期x勞動小時勞動小時yxyx2y2A2510425B248416C3412916D33999E414161F414161G400160H600360I800640總數(shù)總數(shù)3618471
34、7468簡單線性回歸應(yīng)注意的兩點:簡單線性回歸應(yīng)注意的兩點:1.1.要求要求x x與與y y的關(guān)系是直線的,即兩者在坐標(biāo)的關(guān)系是直線的,即兩者在坐標(biāo)圖上的散點分布有直線的趨勢;否則(呈圖上的散點分布有直線的趨勢;否則(呈曲線趨勢或無規(guī)律)不適用;曲線趨勢或無規(guī)律)不適用;2.2.x x與與y y的關(guān)系是非對稱的,只能用的關(guān)系是非對稱的,只能用x x來預(yù)測來預(yù)測y y,而不能而不能y y用來預(yù)測用來預(yù)測x;x;回歸系數(shù)回歸系數(shù)b b的含義的含義: :b b值表示自變量對因變量的影響的大小與方值表示自變量對因變量的影響的大小與方向;向;它是一個分析不對稱關(guān)系的統(tǒng)計法;它是一個分析不對稱關(guān)系的統(tǒng)計法
35、;xyb注意注意: :b b值的大小沒有限制,不僅限于值的大小沒有限制,不僅限于1 1到到1 1,其大小要視變量的衡量單位而定。其大小要視變量的衡量單位而定。b b值沒有上限,社會學(xué)應(yīng)用中,很少用值沒有上限,社會學(xué)應(yīng)用中,很少用b b值來值來表示兩變量間的相關(guān)程度。表示兩變量間的相關(guān)程度。r r 系數(shù)系數(shù) 與與 b b 系數(shù)不同的地方,是系數(shù)不同的地方,是r r 系數(shù)假系數(shù)假定定X X與與Y Y的關(guān)系是對稱的,而且的關(guān)系是對稱的,而且r r的統(tǒng)計值是由的統(tǒng)計值是由-1-1至至+1+1,同時,同時r r的平方值具有消減誤差的意義的平方值具有消減誤差的意義。這個。這個 r r2 2 值,稱為值,稱
36、為決定系數(shù)決定系數(shù)。注意:注意:在社會學(xué)研究中,通常是先計算在社會學(xué)研究中,通常是先計算r r系數(shù)值,然后才系數(shù)值,然后才決定是否運用簡單線性回歸分析法來預(yù)測數(shù)值。決定是否運用簡單線性回歸分析法來預(yù)測數(shù)值。如果如果r r系數(shù)值很小,就不要用線性回歸方程來作預(yù)系數(shù)值很小,就不要用線性回歸方程來作預(yù)測,因為那樣做所犯的錯誤會很大。測,因為那樣做所犯的錯誤會很大。r r系數(shù)與簡單線性回歸分析都是假定系數(shù)與簡單線性回歸分析都是假定X X與與Y Y的關(guān)系具的關(guān)系具有直線的性質(zhì)。如果這個假定不符合實際情況,有直線的性質(zhì)。如果這個假定不符合實際情況,就會犯錯誤。就會犯錯誤。r r系數(shù)基本上是一種對稱相關(guān)測量
37、法,但很多社會系數(shù)基本上是一種對稱相關(guān)測量法,但很多社會學(xué)研究人員不愿意吹毛求疵,只要兩個變量都是學(xué)研究人員不愿意吹毛求疵,只要兩個變量都是定距變量,則無論關(guān)系是否對稱都應(yīng)用定距變量,則無論關(guān)系是否對稱都應(yīng)用r r系數(shù)。這系數(shù)。這種做法類似種做法類似GammaGamma系數(shù)的用法,不夠嚴謹,但可以系數(shù)的用法,不夠嚴謹,但可以接受。接受。(二)回歸方程的統(tǒng)計檢驗(二)回歸方程的統(tǒng)計檢驗 通過樣本數(shù)據(jù)建立回歸方程后一般不能立通過樣本數(shù)據(jù)建立回歸方程后一般不能立即用于對實際問題的分析和預(yù)測,通常即用于對實際問題的分析和預(yù)測,通常要進行各種統(tǒng)計檢驗。包括:要進行各種統(tǒng)計檢驗。包括:A A、回歸方程的擬
38、合優(yōu)度檢驗:、回歸方程的擬合優(yōu)度檢驗:B B、回歸方程的顯著性檢驗:、回歸方程的顯著性檢驗:C C、回歸系數(shù)的顯著性檢驗:、回歸系數(shù)的顯著性檢驗:D D、殘差分析:、殘差分析:bxay1 1、擬合優(yōu)度檢驗、擬合優(yōu)度檢驗擬合優(yōu)度檢驗:檢驗樣本點數(shù)據(jù)聚集在回歸線擬合優(yōu)度檢驗:檢驗樣本點數(shù)據(jù)聚集在回歸線周圍的密集程度,從而評價回歸方程對樣本周圍的密集程度,從而評價回歸方程對樣本數(shù)據(jù)的代表程度。數(shù)據(jù)的代表程度。4681012468101214group1_xFitted valuesgroup1_y5678910468101214xFitted valuesy擬合優(yōu)度檢驗從對被解釋變量擬合優(yōu)度檢驗從對
39、被解釋變量y y取值變化的成取值變化的成因分析入手。因分析入手。Y Y各觀察值之間的差異主要由兩各觀察值之間的差異主要由兩方面原因造成:一是由于解釋變量方面原因造成:一是由于解釋變量x x取值的不取值的不同造成的;二是由于其他隨機因素造成的。同造成的;二是由于其他隨機因素造成的。例如,在研究父親身高和兒子身高的關(guān)系時例如,在研究父親身高和兒子身高的關(guān)系時發(fā)現(xiàn),成年兒子身高的差異會受到兩個因素發(fā)現(xiàn),成年兒子身高的差異會受到兩個因素的影響:第一父親身高的影響;第二,即使的影響:第一父親身高的影響;第二,即使父親身高相同,他們成年兒子的身高也不盡父親身高相同,他們成年兒子的身高也不盡相同,還會受到其
40、他隨機因素的影響。相同,還會受到其他隨機因素的影響。假定不知道假定不知道X X的任何信息的任何信息, , 我們會用平均數(shù)我們會用平均數(shù) 來預(yù)測來預(yù)測y yi i,發(fā)生的預(yù)測誤差是,發(fā)生的預(yù)測誤差是(y- )(y- )。 估估計誤差的平方和稱為總離差平方和計誤差的平方和稱為總離差平方和 (SST). (SST). 當(dāng)當(dāng)Y Y與與X X 有線性決定關(guān)系,有線性決定關(guān)系, 我們知道了有關(guān)我們知道了有關(guān)X X的信息的信息, , 就會提供對就會提供對Y Y的一個更好的預(yù)測值。的一個更好的預(yù)測值。發(fā)生的誤差是發(fā)生的誤差是 。估計誤差的平方和。估計誤差的平方和稱為稱為SSESSE,即由隨機因素引起的,即由隨
41、機因素引起的y y的變差平方的變差平方和和. .由由x x取值不同引起的取值不同引起的y y的變差平方和為的變差平方和為SSASSA。SST = SSA + SSESST = SSA + SSE決定系數(shù)決定系數(shù)Coefficient of determination Coefficient of determination (Goodness of Fit)(Goodness of Fit)R R2 2反映了回歸方程所能解釋的變差的比例。反映了回歸方程所能解釋的變差的比例。R R2 2取值在取值在0 0與與1 1之間,越接近于之間,越接近于1 1,說明回歸,說明回歸方程對樣本數(shù)據(jù)點的擬合優(yōu)度越
42、高。在一方程對樣本數(shù)據(jù)點的擬合優(yōu)度越高。在一元線性回歸方程中,擬合優(yōu)度值元線性回歸方程中,擬合優(yōu)度值 R R2 2也就是也就是簡單相關(guān)系數(shù)簡單相關(guān)系數(shù) r r 的平方。的平方??梢?,在可見,在y y的的SSTSST中,如果中,如果SSASSA的比例遠大于的比例遠大于SSESSE的比例,回歸方程能夠解釋的變差所占的比例,回歸方程能夠解釋的變差所占比例較大,那么回歸方程的擬合優(yōu)度比例較大,那么回歸方程的擬合優(yōu)度R R2 2 就就會較高。會較高。2 2、回歸方程的顯著性檢、回歸方程的顯著性檢線性回歸方程能夠較好地反映被解釋變量和線性回歸方程能夠較好地反映被解釋變量和解釋變量之間統(tǒng)計關(guān)系的前提應(yīng)是,被
43、解釋解釋變量之間統(tǒng)計關(guān)系的前提應(yīng)是,被解釋變量和解釋變量之間確實存在顯著的線性關(guān)變量和解釋變量之間確實存在顯著的線性關(guān)系。回歸方程的顯著性檢驗正是檢驗被解釋系?;貧w方程的顯著性檢驗正是檢驗被解釋變量與所有解釋變量之間的線性關(guān)系是否顯變量與所有解釋變量之間的線性關(guān)系是否顯著,用線性模型來描述它們之間的著,用線性模型來描述它們之間的 關(guān)系是否關(guān)系是否恰當(dāng)。恰當(dāng)。回歸方程顯著性檢驗的基本出發(fā)點類似擬合優(yōu)度回歸方程顯著性檢驗的基本出發(fā)點類似擬合優(yōu)度檢驗。前面討論檢驗。前面討論SST=SSA+SSE.SST=SSA+SSE.回歸方程的顯著性回歸方程的顯著性檢驗采用檢驗采用F F檢定法。檢定法。SSASS
44、A表示表示y y的變差中能被的變差中能被x x線性線性解釋的部分。解釋的部分。一元線性回歸方程顯著性檢驗的零假設(shè)是:回歸系數(shù)與一元線性回歸方程顯著性檢驗的零假設(shè)是:回歸系數(shù)與零無顯著差異。即它們之間不存在線性關(guān)系。如果零無顯著差異。即它們之間不存在線性關(guān)系。如果F F檢檢驗概率驗概率P P值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認為回歸系數(shù)與零存在顯著差異,被解釋變量與解釋變認為回歸系數(shù)與零存在顯著差異,被解釋變量與解釋變量線性關(guān)系顯著。量線性關(guān)系顯著。3 3、回歸系數(shù)的顯著性檢驗、回歸系數(shù)的顯著性檢驗回歸系數(shù)顯著性檢驗的主要目的是研究回歸方程回歸系數(shù)顯
45、著性檢驗的主要目的是研究回歸方程中每個解釋變量與被解釋變量之間是否存在顯著中每個解釋變量與被解釋變量之間是否存在顯著的線性關(guān)系,也就是研究解釋變量能否有效地解的線性關(guān)系,也就是研究解釋變量能否有效地解釋被解釋變量的線性變化,看它們能否保留在線釋被解釋變量的線性變化,看它們能否保留在線性回歸方程中。用性回歸方程中。用t t統(tǒng)計量檢驗。統(tǒng)計量檢驗。在一元線性回歸分析中,回歸方程顯著性檢驗和在一元線性回歸分析中,回歸方程顯著性檢驗和回歸系數(shù)顯著性檢驗的作用是相同的,兩者可以回歸系數(shù)顯著性檢驗的作用是相同的,兩者可以互相替代。同時,回歸方程顯著性檢驗中的互相替代。同時,回歸方程顯著性檢驗中的F F統(tǒng)統(tǒng)
46、計量恰好等于回歸系數(shù)顯著性檢驗中計量恰好等于回歸系數(shù)顯著性檢驗中t t統(tǒng)計量的統(tǒng)計量的平方。平方。4 4、殘差分析、殘差分析殘差是指由回歸方程計算所得的預(yù)測值與實際值之間的殘差是指由回歸方程計算所得的預(yù)測值與實際值之間的差距。定義為:差距。定義為:它是回歸模型中它是回歸模型中 的估計值,由多個的估計值,由多個 形成的序列形成的序列稱為殘差序列。殘差分析是回歸方程檢驗中的重要組成稱為殘差序列。殘差分析是回歸方程檢驗中的重要組成部分,其出發(fā)點是:部分,其出發(fā)點是:如果回歸方程能較好地反映被解釋如果回歸方程能較好地反映被解釋變量的特征和變化規(guī)律,那么殘差序列中應(yīng)不包含明顯變量的特征和變化規(guī)律,那么殘
47、差序列中應(yīng)不包含明顯的規(guī)律性和趨勢性。的規(guī)律性和趨勢性。殘差分析正是基于這種考慮展開的,主要任務(wù)包括:殘差分析正是基于這種考慮展開的,主要任務(wù)包括:1,分析殘差是否服從均值為,分析殘差是否服從均值為0的正態(tài)分布;的正態(tài)分布;2,分析殘,分析殘差是否為等方差的正態(tài)分布;差是否為等方差的正態(tài)分布;3,分析殘差序列是否獨,分析殘差序列是否獨立;立;4,借助殘差探測樣本中的,借助殘差探測樣本中的 異常值等。異常值等。圖形分析與數(shù)值分析是殘差分析的有效工具。圖形分析與數(shù)值分析是殘差分析的有效工具。 (1)殘差均值為)殘差均值為0的正態(tài)性分析的正態(tài)性分析殘差總體上應(yīng)服從以殘差總體上應(yīng)服從以0 0為均值的正
48、態(tài)分布。為均值的正態(tài)分布。殘差的獨立性分析殘差的獨立性分析(2)殘差的獨立性分析:)殘差的獨立性分析:殘差序列不應(yīng)存在自相殘差序列不應(yīng)存在自相關(guān)性。殘差獨立分析可以通過以下三種方式實現(xiàn)。關(guān)性。殘差獨立分析可以通過以下三種方式實現(xiàn)。 A:繪制殘差序列圖:殘差隨著時間推移不應(yīng):繪制殘差序列圖:殘差隨著時間推移不應(yīng)呈現(xiàn)有規(guī)律性的變化。呈現(xiàn)有規(guī)律性的變化。 B:計算殘差的自相關(guān)系數(shù):取值在:計算殘差的自相關(guān)系數(shù):取值在1之間。之間。 C:DW檢驗:推斷小樣本序列是否存在一階相檢驗:推斷小樣本序列是否存在一階相關(guān)的統(tǒng)計檢驗方法。關(guān)的統(tǒng)計檢驗方法。DW取值在取值在0-4之間。之間。 DW=4,殘差序列完全
49、負自相關(guān)殘差序列完全負自相關(guān) DW=(2,4)負自相關(guān))負自相關(guān) DW=2:無自相關(guān):無自相關(guān) DW=(0,2)正自相關(guān))正自相關(guān) DW=0 完全自相關(guān)完全自相關(guān)(3)異方差分析)異方差分析回歸分析中,同方差性(Homoskedasticity)要求殘差的方差是一個常數(shù),或者說,不受自變量取值水平的影響。如果殘差的方差隨著x的變化而變化,我們就稱這一現(xiàn)象為“異方差性”(Heteroskedasticity)。繪制殘差圖繪制殘差圖等級相關(guān)分析等級相關(guān)分析異方差性異方差性.F(Y|X) xY xYf(Y|X).(4)利用殘差探測樣本中的異常值和強影響點)利用殘差探測樣本中的異常值和強影響點解釋變量
50、與被解釋變量都會出現(xiàn)異常值和強影響點,應(yīng)解釋變量與被解釋變量都會出現(xiàn)異常值和強影響點,應(yīng)盡量找出它們并加以排除。盡量找出它們并加以排除。對被解釋變量對被解釋變量y中的殘差,探測方法有以下幾種:中的殘差,探測方法有以下幾種:A、標(biāo)準(zhǔn)化殘差、標(biāo)準(zhǔn)化殘差:絕對值大于絕對值大于3對應(yīng)的觀察值為異常值對應(yīng)的觀察值為異常值B、學(xué)生化殘差、學(xué)生化殘差:絕對值大于絕對值大于3對應(yīng)的觀察值為異常值對應(yīng)的觀察值為異常值剔除殘差剔除殘差對解釋變量對解釋變量x中的殘差,探測方法有以下幾種:中的殘差,探測方法有以下幾種:A、杠桿值、杠桿值B、庫克距離:一般庫克距離大于、庫克距離:一般庫克距離大于1,就可認為對應(yīng)的,就可
51、認為對應(yīng)的觀測值為強影響點。觀測值為強影響點。一元線性回歸分析的基本操作一元線性回歸分析的基本操作Analyze-Regression-LinearAnalyze-Regression-Linear1 1,選擇被解釋變量進入,選擇被解釋變量進入DependentDependent框框2 2,選擇一個解釋變量進入,選擇一個解釋變量進入IndependentIndependent框框3 3,在,在MethodMethod框中選擇回歸分析的解釋策略。其中框中選擇回歸分析的解釋策略。其中 Enter Enter表示所選變量強行進入回歸方程,是表示所選變量強行進入回歸方程,是SPSSSPSS默認的策略,
52、通默認的策略,通常用在一元線性回歸分析中。常用在一元線性回歸分析中。Remove Remove 表示從回歸方程中表示從回歸方程中剔除所選變量;剔除所選變量;stepwisestepwise表示逐步篩選策略;表示逐步篩選策略;backwardbackward表表示向后篩選策略;示向后篩選策略;forwardforward表示向前篩選策略。表示向前篩選策略。4 4,如果需要,選擇一個變量作為條件變量放到,如果需要,選擇一個變量作為條件變量放到Select Select VariableVariable框中,并單擊框中,并單擊RuleRule按鈕給定一個判斷條件。只有按鈕給定一個判斷條件。只有滿足條
53、件的樣本才進入分析。滿足條件的樣本才進入分析。擬合優(yōu)度檢驗:擬合優(yōu)度檢驗:表中個列數(shù)據(jù)項的含義依次為:被解釋變量和解表中個列數(shù)據(jù)項的含義依次為:被解釋變量和解釋變量的相關(guān)系數(shù)、決定系數(shù)、調(diào)整的決定系數(shù)釋變量的相關(guān)系數(shù)、決定系數(shù)、調(diào)整的決定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤差。該題判定系數(shù)為、回歸方程的標(biāo)準(zhǔn)誤差。該題判定系數(shù)為0.7430.743,認為該模型擬合優(yōu)度較好。,認為該模型擬合優(yōu)度較好。顯著性檢驗:顯著性檢驗:表中各列數(shù)據(jù)項的含義依次為:被解釋變量的變差來源表中各列數(shù)據(jù)項的含義依次為:被解釋變量的變差來源,離差平方和、自由度、均方、回歸方程顯著性檢驗中,離差平方和、自由度、均方、回歸方程顯著性檢驗
54、中F F檢驗統(tǒng)計量的觀測值和概率檢驗統(tǒng)計量的觀測值和概率P P值??梢姡唤忉屪兞康目傊???梢?,被解釋變量的總離差平方和為離差平方和為2.108E72.108E7,回歸平方和及均方都是,回歸平方和及均方都是1.565E71.565E7,剩余平方和及均方分別為,剩余平方和及均方分別為5425955.5175425955.517和和187101.914.F187101.914.F檢驗概率檢驗概率P P值近似為值近似為0 0,認為解釋變量與被解釋變量的線,認為解釋變量與被解釋變量的線性關(guān)系是顯著的,可建立線性模型。性關(guān)系是顯著的,可建立線性模型?;貧w系數(shù)顯著性檢驗:回歸系數(shù)顯著性檢驗:表中各列數(shù)據(jù)項
55、的含義依次為:回歸系數(shù)、回歸系數(shù)的標(biāo)準(zhǔn)誤差表中各列數(shù)據(jù)項的含義依次為:回歸系數(shù)、回歸系數(shù)的標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)顯著性檢驗中、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)顯著性檢驗中t t檢驗統(tǒng)計量的觀測檢驗統(tǒng)計量的觀測值、對應(yīng)的概率值、對應(yīng)的概率P P值?;貧w系數(shù)顯著性檢驗的概率值?;貧w系數(shù)顯著性檢驗的概率P P值小于顯著性值小于顯著性水平,因此投入科研事業(yè)費(百元)與被解釋變量間的線性關(guān)系水平,因此投入科研事業(yè)費(百元)與被解釋變量間的線性關(guān)系顯著,該模型是合理的,回歸方程為:顯著,該模型是合理的,回歸方程為:y=363.480+0.011x因為回歸系數(shù)只有因為回歸系數(shù)只有0.0110.011,很
56、小,需要看其他變量對申請課題數(shù),很小,需要看其他變量對申請課題數(shù)的影響。的影響。當(dāng)因變量當(dāng)因變量y與自變量與自變量x是非線性關(guān)系時,可通過變量變換使經(jīng)過是非線性關(guān)系時,可通過變量變換使經(jīng)過變換的新變量對于參數(shù)是線性的。變換后的線性模型,求出未變換的新變量對于參數(shù)是線性的。變換后的線性模型,求出未知參數(shù)后,可以再變回曲線形式。知參數(shù)后,可以再變回曲線形式。函數(shù)名稱函數(shù)名稱函數(shù)表達式函數(shù)表達式變量變換變量變換變換后的變換后的形式形式對數(shù)函數(shù)對數(shù)函數(shù)y=a+by=a+b(x)x x= = (x)y=a+bxy=a+bx冪函數(shù)冪函數(shù)y=axy=axb by y= (y) ,a= (a), x x= =
57、 (x)y y=a=a+bx+bx指數(shù)函數(shù)指數(shù)函數(shù)y=aey=aebxbxy y= (y) ,a= (a)y y=a=a+bx+bxS S型函數(shù)型函數(shù)y=1/(y=1/(a+bea+be-x-x) ) y y= 1/y ,x= e e-x-xy y= =a+bxa+bx第二節(jié)多元線性回歸分析第二節(jié)多元線性回歸分析例題:用例題:用19881988年世界若干國家的粗死亡率(年世界若干國家的粗死亡率(y y)對其)對其6565歲以上人口占總?cè)丝诘谋壤q以上人口占總?cè)丝诘谋壤▁ x1 1)和人均國民生)和人均國民生產(chǎn)總值(產(chǎn)總值(x x2 2)做回歸,得到)做回歸,得到若僅用老年人口比例若僅用老年
58、人口比例 x x1 1 與粗死亡率與粗死亡率 y y 做回歸,則做回歸,則有:有:第二節(jié)多元線性回歸分析第二節(jié)多元線性回歸分析多元線性回歸的數(shù)學(xué)模型:多元線性回歸的數(shù)學(xué)模型:Y=A+BY=A+B1 1x x1 1+B+B2 2x x2 2+B+Bp px xp p+多元線性經(jīng)驗回歸方程:多元線性經(jīng)驗回歸方程:ppippixbxbxbayexbxbxbay22112211多元線性回歸方程的擬合優(yōu)度檢驗多元線性回歸方程的擬合優(yōu)度檢驗隨著自變量個數(shù)的增加,殘差平方和逐漸減少隨著自變量個數(shù)的增加,殘差平方和逐漸減少,R R2 2隨之增大,盡管有的自變量與隨之增大,盡管有的自變量與y y線性關(guān)系不線性關(guān)
59、系不顯著,將其引入方程后,也會使顯著,將其引入方程后,也會使R R2 2增加。所以增加。所以, R R2 2是一個受自變量個數(shù)與樣本規(guī)模之比(是一個受自變量個數(shù)與樣本規(guī)模之比(k:nk:n)影響的系數(shù),一般常規(guī)是)影響的系數(shù),一般常規(guī)是1 1:1010以上為好以上為好。當(dāng)這個比值小于。當(dāng)這個比值小于1 1:5 5時,時, R R2 2傾向于高估實際傾向于高估實際的擬合優(yōu)度。為了避免這種情況,常用調(diào)整的的擬合優(yōu)度。為了避免這種情況,常用調(diào)整的R R2 2adjadj代替代替R R2 2 。多元線性回歸方程的擬合優(yōu)度檢驗多元線性回歸方程的擬合優(yōu)度檢驗調(diào)整的決定系數(shù):調(diào)整的決定系數(shù):n-p-1 ,n
60、-1n-p-1 ,n-1分別是分別是SSESSE和和SSTSST的自由度。的自由度。調(diào)整的決定系數(shù)的取值范圍和數(shù)值大小調(diào)整的決定系數(shù)的取值范圍和數(shù)值大小的意義與決定系數(shù)的意義與決定系數(shù)R R2 2完全相同。完全相同。1112nSSTpnSSER在多元線性回歸分析中,仍可以計算在多元線性回歸分析中,仍可以計算R R2 2, ,它是它是被解釋變量被解釋變量y y與諸多解釋變量與諸多解釋變量x x的復(fù)相關(guān)系數(shù)的復(fù)相關(guān)系數(shù)的平方,實質(zhì)測度了的平方,實質(zhì)測度了y y與與x x全體之間線性相關(guān)全體之間線性相關(guān)程度,也測度了樣本數(shù)據(jù)與擬合數(shù)據(jù)間的相程度,也測度了樣本數(shù)據(jù)與擬合數(shù)據(jù)間的相關(guān)程度。關(guān)程度。在多元
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 供銷結(jié)算合同范本
- 萬科杭州地塊天空之城項目(現(xiàn)代高層+疊墅+辦公)總體規(guī)劃
- 壓力管道安裝監(jiān)檢合同范本
- 醫(yī)院配送服務(wù)合同范本
- 充電寶項目合同范本
- grg油漆合同范本
- 保溫鋼管采購合同范本
- 古鎮(zhèn)提升方案合同范本
- 中外貿(mào)易英文合同范本
- 醫(yī)療廢物處置意向合同范本
- 借哪吒精神燃開學(xué)斗志 開學(xué)主題班會課件
- 2025年初中主題班會課件:好習(xí)慣成就好人生
- 學(xué)校教職工代表大會全套會議會務(wù)資料匯編
- 中華人民共和國監(jiān)察法宣貫培訓(xùn)
- 2025年山東傳媒職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年春新教科版物理八年級下冊課件 第10章 流體的力現(xiàn)象 1 在流體中運動
- 2025年新人教PEP版英語三年級下冊全冊課時練習(xí)
- 《愛耳日課件》課件
- 《中醫(yī)基礎(chǔ)理論》課件-中醫(yī)學(xué)理論體系的基本特點-整體觀念
- 全國職業(yè)院校技能大賽高職組(商務(wù)數(shù)據(jù)分析賽項)備賽試題及答案
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
評論
0/150
提交評論