第7章回歸(壓縮)_第1頁
第7章回歸(壓縮)_第2頁
第7章回歸(壓縮)_第3頁
第7章回歸(壓縮)_第4頁
第7章回歸(壓縮)_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SPSS16實(shí)用教程第7章回歸分析回歸分析基本概念7.1一元線性回歸分析7.2多元線性回歸分析7.3非線性回歸分析7.47.1回歸分析基本概念

相關(guān)分析和回歸分析都是研究變量間關(guān)系的統(tǒng)計(jì)學(xué)課題。在應(yīng)用中,兩種分析方法經(jīng)常相互結(jié)合和滲透,但它們研究的側(cè)重點(diǎn)和應(yīng)用面不同。在回歸分析中,變量y稱為因變量,處于被解釋的特殊地位;而在相關(guān)分析中,變量y與變量x處于平等的地位,研究變量y與變量x的密切程度和研究變量x與變量y的密切程度是一樣的。

在回歸分析中,因變量y是隨機(jī)變量,自變量x可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量;而在相關(guān)分析中,變量x和變量y都是隨機(jī)變量。相關(guān)分析是測(cè)定變量之間的關(guān)系密切程度,所使用的工具是相關(guān)系數(shù);而回歸分析則是側(cè)重于考察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式來描述變量之間的關(guān)系,進(jìn)而確定一個(gè)或者幾個(gè)變量的變化對(duì)另一個(gè)特定變量的影響程度。

具體地說,回歸分析主要解決以下幾方面的問題。通過分析大量的樣本數(shù)據(jù),確定變量之間的數(shù)學(xué)關(guān)系式。對(duì)所確定的數(shù)學(xué)關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并區(qū)分出對(duì)某一特定變量影響較為顯著的變量和影響不顯著的變量。利用所確定的數(shù)學(xué)關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確度。

在實(shí)際中,根據(jù)變量的個(gè)數(shù)、變量的類型以及變量之間的相關(guān)關(guān)系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、含虛擬自變量的回歸分析和邏輯回歸分析等類型。7.2一元線性回歸分析7.2.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式

定義:一元線性回歸分析是在排除其他影響因素或假定其他影響因素確定的條件下,分析某一個(gè)因素(自變量)是如何影響另一事物(因變量)的過程,所進(jìn)行的分析是比較理想化的。其實(shí),在現(xiàn)實(shí)社會(huì)生活中,任何一個(gè)事物(因變量)總是受到其他多種事物(多個(gè)自變量)的影響。

通過樣本數(shù)據(jù)建立一個(gè)回歸方程后,不能立即就用于對(duì)某個(gè)實(shí)際問題的預(yù)測(cè)。必須對(duì)其作各種統(tǒng)計(jì)檢驗(yàn)。一般經(jīng)常作以下的統(tǒng)計(jì)檢驗(yàn)。

(1)擬合優(yōu)度檢驗(yàn)回歸方程的擬合優(yōu)度檢驗(yàn)就是要檢驗(yàn)樣本數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從而判斷回歸方程對(duì)樣本數(shù)據(jù)的代表程度?;貧w方程的擬合優(yōu)度檢驗(yàn)一般用判定系數(shù)R2實(shí)現(xiàn)。該指標(biāo)是建立在對(duì)總離差平方和進(jìn)行分解的基礎(chǔ)之上。

(2)回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))回歸方程的顯著性檢驗(yàn)是對(duì)因變量與所有自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢驗(yàn)?;貧w方程的顯著性檢驗(yàn)一般采用F檢驗(yàn),利用方差分析的方法進(jìn)行。

(3)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣本估計(jì)的結(jié)果對(duì)總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行檢驗(yàn)。

研究問題合成纖維的強(qiáng)度與其拉伸倍數(shù)有關(guān),測(cè)得試驗(yàn)數(shù)據(jù)如表7-1所示。求合成纖維的強(qiáng)度與拉伸倍數(shù)之間是否存在顯著的線性相關(guān)關(guān)系。7.2.2SPSS中實(shí)現(xiàn)過程表7-1 強(qiáng)度與拉伸倍數(shù)的試驗(yàn)數(shù)據(jù)序號(hào)拉伸倍數(shù)強(qiáng)度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.1

實(shí)現(xiàn)步驟圖7-1在菜單中選擇“Linear”命令圖7-2“LinearRegression”對(duì)話框(一)圖7-3“LinearRegression:Statistics”對(duì)話框

圖7-4“LinearRegression:Plots”對(duì)話框圖7-5“LinearRegression:Save”對(duì)話框圖7-6“LinearRegression:Options”對(duì)話框

(1)輸出結(jié)果文件中的第一個(gè)表格如下表所示。7.2.3結(jié)果和討論

(2)輸出的結(jié)果文件中第二個(gè)表格如下表所示。

(3)輸出的結(jié)果文件中第三個(gè)表格如下表所示。

(4)輸出的結(jié)果文件中第四個(gè)表格如下表所示。7.3多元線性回歸分析7.3.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式

定義:在上一節(jié)中討論的回歸問題只涉及了一個(gè)自變量,但在實(shí)際問題中,影響因變量的因素往往有多個(gè)。例如,商品的需求除了受自身價(jià)格的影響外,還要受到消費(fèi)者收入、其他商品的價(jià)格、消費(fèi)者偏好等因素的影響;影響水果產(chǎn)量的外界因素有平均氣溫、平均日照時(shí)數(shù)、平均濕度等。

因此,在許多場(chǎng)合,僅僅考慮單個(gè)變量是不夠的,還需要就一個(gè)因變量與多個(gè)自變量的聯(lián)系來進(jìn)行考察,才能獲得比較滿意的結(jié)果。這就產(chǎn)生了測(cè)定多因素之間相關(guān)關(guān)系的問題。

研究在線性相關(guān)條件下,兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公式,稱為多元線性回歸模型。多元線性回歸模型是一元線性回歸模型的擴(kuò)展,其基本原理與一元線性回歸模型類似,只是在計(jì)算上更為復(fù)雜,一般需借助計(jì)算機(jī)來完成。

研究問題用多元回歸分析來分析36個(gè)員工多個(gè)心理變量值(z1~z8)對(duì)員工滿意度my的預(yù)測(cè)效果,測(cè)得試驗(yàn)數(shù)據(jù)如表7-2所示。7.3.2SPSS中實(shí)現(xiàn)過程表7-2 員工多個(gè)心理變量值和員工滿意度數(shù)據(jù)z1z2z3z4z5z6z7Z8滿意度66.0064.0062.0050.0058.0056.001.081.0025.0055.0050.0059.0059.0053.0051.001.001.1122.0050.0047.0049.0045.0046.0046.001.311.2020.0055.0059.0050.0054.0052.0069.001.001.0020.0055.0059.0048.0056.0047.0050.001.001.0024.0062.0054.0068.0046.0046.0051.001.081.0023.0060.0060.0056.0053.0052.0051.001.081.0021.0052.0052.0069.0058.0057.0062.001.001.0023.0056.0055.0057.0039.0044.0046.001.691.0015.0050.0050.0068.0046.0045.0056.001.081.1425.0058.0054.0060.0059.0052.0051.001.001.0025.0053.0052.0055.0057.0065.0064.001.081.0022.0052.0056.0053.0057.0063.0051.001.461.4320.0056.0065.0052.0051.0062.0047.001.001.0022.0050.0063.0059.0053.0055.0048.001.001.0020.0063.0057.0060.0066.0051.0056.001.001.0026.0056.0046.0058.0050.0045.0052.002.231.2921.0047.0050.0057.0049.0050.0048.002.081.1420.0053.0066.0053.0059.0055.0045.001.001.0025.00z1z2z3z4z5z6z7z8滿意度61.0055.0058.0061.0058.0061.001.151.1423.0059.0064.0060.0052.0054.0056.001.081.0026.0055.0060.0072.0060.0055.0067.001.081.0026.0056.0052.0068.0040.0051.0055.001.851.7130.0059.0051.0061.0056.0052.0056.001.001.0025.0060.0053.0062.0055.0047.0063.001.311.1427.0052.0051.0057.0045.0055.0059.001.231.1420.0056.0057.0057.0052.0059.0055.001.001.1426.0068.0058.0071.0068.0053.0061.001.001.0030.0060.0053.0061.0060.0056.0051.001.001.0027.0064.0056.0074.0050.0059.0057.001.851.1418.0067.0053.0060.0053.0053.0051.001.001.0024.0056.0056.0067.0067.0056.0052.001.001.0024.0053.0046.0049.0043.0050.0048.001.311.1419.0053.0057.0065.0052.0067.0059.001.771.4317.0060.0040.0071.0057.0056.0058.001.081.0024.0054.0045.0044.0049.0042.0046.001.001.0023.00

實(shí)現(xiàn)步驟圖7-7“LinearRegression”對(duì)話框(二)

(1)輸出結(jié)果文件中的第一個(gè)表格如下表所示。7.3.3結(jié)果和討論2)輸出的結(jié)果文件中第二個(gè)表格如下表所示。

(3)輸出的結(jié)果文件中第三個(gè)表格如下表所示。

(4)輸出的結(jié)果文件中第四個(gè)表格如下表所示。

(5)輸出的結(jié)果文件中第五個(gè)表格如下表所示。

(6)輸出的結(jié)果文件中第六個(gè)表格為回歸系數(shù)分析,如下表所示

(7)輸出的結(jié)果文件中第七個(gè)表格如下表所示。

(8)輸出的結(jié)果文件中第八部分為圖形,為回歸因變量和每個(gè)自變量之間的關(guān)系點(diǎn)圖。圖7-8為自變量z1和my之間的關(guān)系點(diǎn)圖。7.4.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式7.4非線性回歸分析

定義:研究在非線性相關(guān)條件下,自變量對(duì)因變量的數(shù)量變化關(guān)系,稱為非線性回歸分析。在實(shí)際問題中,變量之間的相關(guān)關(guān)系往往不是線性的,而是非線性的,因而不能用線性回歸方程來描述它們之間的相關(guān)關(guān)系,而要采用適當(dāng)?shù)姆蔷€性回歸分析。

非線性回歸問題大多數(shù)可以化為線性回歸問題來求解,也就是通過對(duì)非線性回歸模型進(jìn)行適當(dāng)?shù)淖兞孔儞Q,使其化為線性模型來求解。一般步驟為:

根據(jù)經(jīng)驗(yàn)或者繪制散點(diǎn)圖,選擇適當(dāng)?shù)姆蔷€性回歸方程;通過變量置換,把非線性回歸方程化為線性回歸;用線性回歸分析中采用的方法來確定各回歸系數(shù)的值;對(duì)各系數(shù)進(jìn)行顯著性檢驗(yàn)。

計(jì)算公式如下。在本節(jié)中介紹幾種常見的非線性回歸模型,并分別給出其線性化方法及圖形。

研究問題研究民用汽車總量與國內(nèi)生產(chǎn)總值的關(guān)系。數(shù)據(jù)如表7-3所示。(資料來源:《中國統(tǒng)計(jì)年鑒2007》,中國統(tǒng)計(jì)出版社,2007年)7.4.2SPSS中實(shí)現(xiàn)過程

實(shí)現(xiàn)步驟圖7-9“SimpleScatterplot”對(duì)話框圖7-10散點(diǎn)圖圖7-11“CurveEstimation”對(duì)話框(一)7.4.3結(jié)果和討論

(1)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的值,如下表所示。

(2)第二部分輸出的是觀察值和Cubic,Power兩種曲線預(yù)測(cè)值的對(duì)比圖,如圖7-12所示。小結(jié)

回歸分析是研究變量與變量之間聯(lián)系的最為廣泛的模型。在實(shí)際中,根據(jù)變量的個(gè)數(shù)、類型,以及變量之間的相關(guān)關(guān)系。小結(jié)

一元線性回歸只涉及一個(gè)自變量的回歸問題;多元線性回歸用于解決兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系問題;非線性回歸主要解決在非線性相關(guān)條件下,自變量對(duì)因變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論