簡(jiǎn)單線性回歸分析(研ppt課件_第1頁
簡(jiǎn)單線性回歸分析(研ppt課件_第2頁
簡(jiǎn)單線性回歸分析(研ppt課件_第3頁
簡(jiǎn)單線性回歸分析(研ppt課件_第4頁
簡(jiǎn)單線性回歸分析(研ppt課件_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、10 10 簡(jiǎn)單線性回歸分析簡(jiǎn)單線性回歸分析主主 講:講: 盧盧 潔潔 Ph.D : hanyaa800 yahoo辦公室:鄭大公衛(wèi)學(xué)院辦公室:鄭大公衛(wèi)學(xué)院 A510室室統(tǒng)計(jì)學(xué)研討特點(diǎn):統(tǒng)計(jì)學(xué)研討特點(diǎn):n研討的是樣本,要對(duì)總體作出推斷研討的是樣本,要對(duì)總體作出推斷n得到的是頻率,要對(duì)概率作出推斷得到的是頻率,要對(duì)概率作出推斷n需進(jìn)展參數(shù)估計(jì)和假設(shè)檢驗(yàn)需進(jìn)展參數(shù)估計(jì)和假設(shè)檢驗(yàn) 抽樣研討抽樣研討 抽樣誤差抽樣誤差n利用利用“小概率原那么進(jìn)展統(tǒng)計(jì)推小概率原那么進(jìn)展統(tǒng)計(jì)推斷斷 準(zhǔn)確的搜集數(shù)據(jù);準(zhǔn)確的搜集數(shù)據(jù); 準(zhǔn)確的錄入數(shù)據(jù);準(zhǔn)確的錄入數(shù)據(jù); 正確的選用統(tǒng)計(jì)分析方法、調(diào)用統(tǒng)計(jì)分析程序;正確的選用統(tǒng)計(jì)分

2、析方法、調(diào)用統(tǒng)計(jì)分析程序; 對(duì)輸出的結(jié)果作出合理的解釋。對(duì)輸出的結(jié)果作出合理的解釋。統(tǒng)計(jì)學(xué)學(xué)習(xí)的重點(diǎn)是掌握如何:統(tǒng)計(jì)學(xué)學(xué)習(xí)的重點(diǎn)是掌握如何:統(tǒng)計(jì)統(tǒng)計(jì)描畫描畫參數(shù)估計(jì):點(diǎn)估計(jì)、區(qū)間估計(jì)參數(shù)估計(jì):點(diǎn)估計(jì)、區(qū)間估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)定量資料定量資料離散趨勢(shì):離散趨勢(shì):算術(shù)均數(shù)、算術(shù)均數(shù)、 中位數(shù)等中位數(shù)等集中趨勢(shì):集中趨勢(shì):極差、極差、 四分位數(shù)間距、四分位數(shù)間距、方差、規(guī)范差、變異系數(shù)方差、規(guī)范差、變異系數(shù)定性資料:頻率型目的、強(qiáng)度型目的、比定性資料:頻率型目的、強(qiáng)度型目的、比 統(tǒng)計(jì)表和統(tǒng)計(jì)圖統(tǒng)計(jì)表和統(tǒng)計(jì)圖統(tǒng)計(jì)統(tǒng)計(jì)推斷推斷統(tǒng)計(jì)學(xué)的主要內(nèi)容:統(tǒng)計(jì)學(xué)的主要內(nèi)容:變量變量對(duì)于單變量對(duì)于單變量對(duì)于多變量:對(duì)

3、于多變量:多重線性回歸、多重線性回歸、logistic分析分析非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)定量資料定量資料定性資料定性資料實(shí)驗(yàn)設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)對(duì)于兩變量:對(duì)于兩變量:簡(jiǎn)單線性相關(guān)和回歸分析簡(jiǎn)單線性相關(guān)和回歸分析數(shù)據(jù)資料數(shù)據(jù)資料定量資料定量資料數(shù)據(jù)數(shù)據(jù)類型類型設(shè)計(jì)設(shè)計(jì)類型類型單單樣樣本本定性資料定性資料設(shè)計(jì)設(shè)計(jì)類型類型兩兩獨(dú)獨(dú)立立樣樣本本配配對(duì)對(duì)樣樣本本多多獨(dú)獨(dú)立立樣樣本本隨隨機(jī)機(jī)區(qū)區(qū)組組t / Z檢驗(yàn)檢驗(yàn)方差分析方差分析單單樣樣本本兩、兩、多多獨(dú)獨(dú)立立樣樣本本配配對(duì)對(duì)樣樣本本等等級(jí)級(jí)資資料料進(jìn)入進(jìn)入條件條件不滿足進(jìn)不滿足進(jìn)入條件入條件秩和檢驗(yàn)秩和檢驗(yàn)四四格格表表RC列列聯(lián)聯(lián)表表配配對(duì)對(duì)RC

4、x2檢驗(yàn)檢驗(yàn)設(shè)計(jì)設(shè)計(jì)類型類型配配對(duì)對(duì)四四格格表表假設(shè)他知道某一個(gè)人的身高和體重,他能知道這假設(shè)他知道某一個(gè)人的身高和體重,他能知道這個(gè)人的手指有多粗嗎?個(gè)人的手指有多粗嗎?假設(shè)他知道患兒的月齡,他能換算出他體重是多假設(shè)他知道患兒的月齡,他能換算出他體重是多少嗎?少嗎?調(diào)查父親身高與子女身高之間的關(guān)系。調(diào)查父親身高與子女身高之間的關(guān)系。調(diào)查收入程度與受教育程度之間的關(guān)系。調(diào)查收入程度與受教育程度之間的關(guān)系?;貧w分析:是研討一個(gè)隨機(jī)變量如何隨另一個(gè)變量回歸分析:是研討一個(gè)隨機(jī)變量如何隨另一個(gè)變量可固定,也可隨機(jī)變化的??晒潭ǎ部呻S機(jī)變化的。從一組樣本數(shù)據(jù)出發(fā),確定變量之間的回歸關(guān)系式;從一組樣本

5、數(shù)據(jù)出發(fā),確定變量之間的回歸關(guān)系式;對(duì)這些關(guān)系式的可信程度進(jìn)展各種統(tǒng)計(jì)檢驗(yàn),并從影對(duì)這些關(guān)系式的可信程度進(jìn)展各種統(tǒng)計(jì)檢驗(yàn),并從影 響因變量的諸多變量中找出具有統(tǒng)計(jì)學(xué)意義的變量;響因變量的諸多變量中找出具有統(tǒng)計(jì)學(xué)意義的變量;利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù) 測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或或 控制的準(zhǔn)確程度??刂频臏?zhǔn)確程度?;貧w分析的主要目的:回歸分析的主要目的: 就是研討固定自變量就是研討固定自變量X的情況下,因變量的情況下,因變量Y的總體均數(shù)與的總體均數(shù)與X之間的回歸關(guān)系;即

6、:之間的回歸關(guān)系;即:簡(jiǎn)單線性回歸分析簡(jiǎn)單線性回歸分析線性回歸方程的建立線性回歸方程的建立回歸方程的解釋回歸方程的解釋線性回歸的前提條件線性回歸的前提條件回歸方程的假設(shè)檢驗(yàn)回歸方程的假設(shè)檢驗(yàn)回歸方程的統(tǒng)計(jì)運(yùn)用回歸方程的統(tǒng)計(jì)運(yùn)用10.1 10.1 什么是回歸?什么是回歸? 。 10.2 10.2 簡(jiǎn)單線性回歸模型簡(jiǎn)單線性回歸模型 。 10.1 10.1 什么是回歸?什么是回歸?1. 線性回歸分析線性回歸分析 linear regression analysis:研討一個(gè)變量和另外一些變量間線性數(shù)量關(guān)系的:研討一個(gè)變量和另外一些變量間線性數(shù)量關(guān)系的統(tǒng)計(jì)分析方法。統(tǒng)計(jì)分析方法。簡(jiǎn)單線性回歸簡(jiǎn)單線性回

7、歸 simple linear regression多重線性回歸多重線性回歸 muptiple linear regression:涉及多個(gè)變量自變量、解釋變量時(shí)稱:涉及多個(gè)變量自變量、解釋變量時(shí)稱。:模型中只包含兩個(gè)有:模型中只包含兩個(gè)有“依存關(guān)系的變量,一個(gè)依存關(guān)系的變量,一個(gè)變量隨另一個(gè)變量的變化而變化,且呈直線變化變量隨另一個(gè)變量的變化而變化,且呈直線變化趨勢(shì),叫趨勢(shì),叫。分分類類矮個(gè)子的父代:矮個(gè)子的父代:64英寸英寸而它子代:而它子代:67英寸英寸父親和他兒子的身高:父親和他兒子的身高:1.父代的總均數(shù)父代的總均數(shù)=68英寸英寸 子代的總均數(shù)子代的總均數(shù)=69英寸英寸2.高個(gè)子的父

8、代:高個(gè)子的父代:72英寸英寸 而它子代:而它子代:71英寸英寸調(diào)查了調(diào)查了1087對(duì)父子:對(duì)父子:例例10.1 為研討大氣污染一氧化氮為研討大氣污染一氧化氮NO的濃度能否遭到汽車流量、的濃度能否遭到汽車流量、氣候情況等要素的影響,選擇氣候情況等要素的影響,選擇24個(gè)工個(gè)工業(yè)程度相近的一個(gè)交通點(diǎn),統(tǒng)計(jì)單位業(yè)程度相近的一個(gè)交通點(diǎn),統(tǒng)計(jì)單位時(shí)間過往的汽車數(shù)千輛,同時(shí)在時(shí)間過往的汽車數(shù)千輛,同時(shí)在低空一樣高度測(cè)定了該時(shí)間段平均氣低空一樣高度測(cè)定了該時(shí)間段平均氣溫溫、空氣濕度、風(fēng)速、空氣濕度、風(fēng)速m/s以及空氣中一氧化氮以及空氣中一氧化氮NO的濃度的濃度10-6,數(shù)據(jù)如下表。,數(shù)據(jù)如下表。 2. 2.

9、 簡(jiǎn)單線性回歸的兩個(gè)變量:簡(jiǎn)單線性回歸的兩個(gè)變量:反響變量反響變量 response variable或或 因變量因變量dependent variable :是按某種規(guī)律變化的隨機(jī)變量,是被估計(jì):是按某種規(guī)律變化的隨機(jī)變量,是被估計(jì)的被預(yù)測(cè)的變量。用的被預(yù)測(cè)的變量。用“Y表示。表示。解釋變量解釋變量explanatory variable或自變量或自變量 independent variable 或預(yù)測(cè)因子或預(yù)測(cè)因子 predictor :可看作影響要素,是能獨(dú)立自在變化的變量,是:可看作影響要素,是能獨(dú)立自在變化的變量,是“Y所依存的變量,常用所依存的變量,常用“X表示,可是隨機(jī)變量,表示

10、,可是隨機(jī)變量,也可是人為控制或選擇的變量。也可是人為控制或選擇的變量。假設(shè)假設(shè) Y 隨隨X1、X2、Xm的改動(dòng)而改動(dòng)的改動(dòng)而改動(dòng):資料類型:定量資料資料類型:定量資料目的:了解一氧化氮濃度與汽車流量、氣候目的:了解一氧化氮濃度與汽車流量、氣候情況等單變量之間的依存關(guān)系。情況等單變量之間的依存關(guān)系?!景咐馕觥亢?jiǎn)單線性回歸簡(jiǎn)單線性回歸線性回歸的分類:線性回歸的分類:I I 型回歸型回歸 :因變量:因變量Y Y是隨機(jī)變化的,但自是隨機(jī)變化的,但自變量變量X X可以不隨機(jī)可以不隨機(jī) ,當(dāng)它是可以準(zhǔn)確丈量和,當(dāng)它是可以準(zhǔn)確丈量和嚴(yán)密控制的量時(shí),叫嚴(yán)密控制的量時(shí),叫Y Y 關(guān)于關(guān)于X X 的的I I型

11、回歸。型回歸。IIII型回歸型回歸 :因變量:因變量Y Y和自變量和自變量X X都是隨都是隨機(jī)變化的,叫機(jī)變化的,叫Y Y 關(guān)于關(guān)于X X 的的IIII型回歸。型回歸。表表12-1 不同不同IgG濃度下的沉淀環(huán)數(shù)據(jù)濃度下的沉淀環(huán)數(shù)據(jù)IgG濃度(濃度(IU/ml)X12345沉淀環(huán)直徑(沉淀環(huán)直徑(mm)Y4.05.56.27.78.5 線性回歸關(guān)系的特點(diǎn):線性回歸關(guān)系的特點(diǎn):u各觀測(cè)點(diǎn)分布在直線周圍的束狀帶內(nèi);各觀測(cè)點(diǎn)分布在直線周圍的束狀帶內(nèi);u當(dāng)變量當(dāng)變量 X 取某個(gè)值時(shí),變量取某個(gè)值時(shí),變量Y取值能夠有幾個(gè)。取值能夠有幾個(gè)。u變量間關(guān)系不能用函數(shù)關(guān)系準(zhǔn)確表達(dá)變量間關(guān)系不能用函數(shù)關(guān)系準(zhǔn)確表達(dá)

12、Ya bx 自然景象之間存在著大量相互聯(lián)絡(luò)、相互依賴自然景象之間存在著大量相互聯(lián)絡(luò)、相互依賴、相互制約的數(shù)量關(guān)系。、相互制約的數(shù)量關(guān)系。描畫確定性景象的描畫確定性景象的確定性依存關(guān)系確定性依存關(guān)系描畫不確定性景象描畫不確定性景象隨機(jī)隨機(jī)景象的依存關(guān)系景象的依存關(guān)系函數(shù)關(guān)系函數(shù)關(guān)系回歸關(guān)系回歸關(guān)系舉例:正方形面積舉例:正方形面積Y=X2舉例:年齡與身高舉例:年齡與身高Y=+ Y X10.2 10.2 簡(jiǎn)單線性回歸模型的建立簡(jiǎn)單線性回歸模型的建立 只思索只思索NO濃度和車流量的關(guān)系,濃度和車流量的關(guān)系,問之間能否存在數(shù)量依存關(guān)系?問之間能否存在數(shù)量依存關(guān)系?10.1.1 解析:解析:回歸分析的要到

13、達(dá)下面三個(gè)目的:回歸分析的要到達(dá)下面三個(gè)目的:n NO濃度與車流量之間是有聯(lián)絡(luò)?濃度與車流量之間是有聯(lián)絡(luò)?n 是直線趨勢(shì),還是曲線趨勢(shì)?是直線趨勢(shì),還是曲線趨勢(shì)?n 如何采用回歸方程定量地描畫這種趨勢(shì)?如何采用回歸方程定量地描畫這種趨勢(shì)?n 車流量每添加車流量每添加100輛,輛,NO濃度平均會(huì)添加多少?濃度平均會(huì)添加多少? 統(tǒng)計(jì)描畫統(tǒng)計(jì)描畫n X和和Y間的回歸聯(lián)絡(luò)能否有統(tǒng)計(jì)學(xué)意義?間的回歸聯(lián)絡(luò)能否有統(tǒng)計(jì)學(xué)意義?n車流量對(duì)車流量對(duì)NO濃度的影響奉獻(xiàn)有多大?濃度的影響奉獻(xiàn)有多大? 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷n 如何由車流量預(yù)測(cè)大氣中如何由車流量預(yù)測(cè)大氣中NO的平均濃度?的平均濃度?n 如何經(jīng)過控制車流量到達(dá)

14、控制如何經(jīng)過控制車流量到達(dá)控制NO濃度的目的?濃度的目的? 統(tǒng)計(jì)運(yùn)用統(tǒng)計(jì)運(yùn)用10.1.2 如何定量地描畫兩者的關(guān)系:如何定量地描畫兩者的關(guān)系:繪制散點(diǎn)圖繪制散點(diǎn)圖回歸方程:求回歸系數(shù)回歸方程:求回歸系數(shù)和常數(shù)項(xiàng)和常數(shù)項(xiàng)回歸方程和回歸系數(shù)回歸方程和回歸系數(shù) 的假設(shè)檢驗(yàn)的假設(shè)檢驗(yàn)總體回歸系數(shù)總體回歸系數(shù)的區(qū)間估計(jì)的區(qū)間估計(jì)回歸方程的統(tǒng)計(jì)運(yùn)用回歸方程的統(tǒng)計(jì)運(yùn)用一繪制散點(diǎn)圖一繪制散點(diǎn)圖 從散點(diǎn)圖可見:車從散點(diǎn)圖可見:車流量與空氣中流量與空氣中NO濃濃度所對(duì)應(yīng)的點(diǎn)分布度所對(duì)應(yīng)的點(diǎn)分布在一個(gè)線性束狀帶在一個(gè)線性束狀帶內(nèi),有線性的趨向,內(nèi),有線性的趨向,所以可以思索做線所以可以思索做線性回歸分析。性回歸分析

15、。 通常情況下,研討者只能獲得一定數(shù)量的樣本數(shù)通常情況下,研討者只能獲得一定數(shù)量的樣本數(shù)據(jù),用樣本數(shù)據(jù)建立的有關(guān)據(jù),用樣本數(shù)據(jù)建立的有關(guān)Y依從依從X變化的線性表達(dá)變化的線性表達(dá)式稱為回歸方程式稱為回歸方程regression equation,記為:,記為:Ya bx YX= +X 那么在總體中,能夠存在對(duì)應(yīng)的方程模型:回歸直線的截距參數(shù)回歸直線的截距參數(shù)intercept 回歸直線的斜率參數(shù)回歸直線的斜率參數(shù)slope又稱回歸系數(shù)又稱回歸系數(shù)regression coefficientiiiYY讓一切點(diǎn)的讓一切點(diǎn)的 的平方和最小的平方和最小iiYYv用最小二乘法擬合直線,選擇用最小二乘法擬合

16、直線,選擇a和和b使其殘差樣本點(diǎn)使其殘差樣本點(diǎn)到直線的垂直間隔到直線的垂直間隔)平方和到達(dá)最小。平方和到達(dá)最小。三回歸參數(shù)的估計(jì):最小二乘估計(jì)三回歸參數(shù)的估計(jì):最小二乘估計(jì)least square estimation回歸參數(shù)的估計(jì)方法:回歸參數(shù)的估計(jì)方法:),.,2 , 1( ,)()(21niLLXXYYXXbxxxyiniii()XbYa()Ya bx 回歸方程:回歸方程:22() (- -) iiiiSSEyyy a bx 用最小二乘法擬合直線,選擇a和b使其殘差樣本點(diǎn)到直線的垂直間隔)平方和到達(dá)最小。即:使以下的SSE到達(dá)最小值。求:求:NO濃度和車流量間的簡(jiǎn)單線性回歸方程?濃度和車

17、流量間的簡(jiǎn)單線性回歸方程?解:由樣本數(shù)據(jù)了解計(jì)算統(tǒng)計(jì)量,帶入下公式,解:由樣本數(shù)據(jù)了解計(jì)算統(tǒng)計(jì)量,帶入下公式,求出回歸系數(shù)求出回歸系數(shù)b1584. 0)()(21XXYYXXbiniii1353. 0XbYaXY1584. 01353. 0作回歸直線圖作回歸直線圖帶入下公式,求出回歸截矩帶入下公式,求出回歸截矩a最小二乘法原那么下的回歸方程為:最小二乘法原那么下的回歸方程為:三建立回歸方程,作回歸直線圖三建立回歸方程,作回歸直線圖回歸方程的解釋回歸方程的解釋 b b 的意義?的意義? a a 的意義?的意義? 的意義的意義 的意義?的意義?y yyYa bx XY1584. 01353. 0y

18、回歸系數(shù)回歸系數(shù)的意義:的意義:1.由總體回歸方程可知由總體回歸方程可知 Y X= + x,參數(shù)參數(shù) 的意義:假設(shè)自變量的意義:假設(shè)自變量X添加添加1個(gè)單位,反響變量個(gè)單位,反響變量Y的的 平均值便添加平均值便添加 個(gè)單位。個(gè)單位。 。2.由于由于 是是 Y X= +X 的估計(jì)表達(dá)式,的估計(jì)表達(dá)式,所以樣本回歸系數(shù)所以樣本回歸系數(shù)b 表示表示 X 添加一個(gè)單位,樣本添加一個(gè)單位,樣本察看值察看值Y 平均添加平均添加 b 個(gè)單位。個(gè)單位。Ya bx 總體回歸系數(shù)總體回歸系數(shù) regression coefficient 的統(tǒng)計(jì)學(xué)意義:的統(tǒng)計(jì)學(xué)意義:X每添加或減少一個(gè)單位,每添加或減少一個(gè)單位,Y

19、 平平均改動(dòng)了個(gè)均改動(dòng)了個(gè) 單位;單位; 越大,表示越大,表示Y 隨隨X 增減變化的增減變化的趨勢(shì)越陡。趨勢(shì)越陡。n 0, 闡明闡明Y與與X呈同向線性變化趨勢(shì)呈同向線性變化趨勢(shì)n =0, 闡明闡明Y與與X無線性回歸關(guān)系,但能夠有其它關(guān)系無線性回歸關(guān)系,但能夠有其它關(guān)系n 0, 闡明闡明Y與與X呈反向線性變化趨勢(shì)呈反向線性變化趨勢(shì)3. 線性回歸分析的前題條件:線性回歸分析的前題條件: 線性線性linear) 獨(dú)立性獨(dú)立性independent) 正態(tài)性正態(tài)性 (normal) 等方差性等方差性equal variance) 3X1Y2Y3YYX2X1X YX= +XiN(+Xi,2)圖圖12-3

20、線性回歸模型的適用條件表示圖線性回歸模型的適用條件表示圖3. 線性回歸分析的前題條件線性回歸分析的前題條件l i n enormal正態(tài)性正態(tài)性equal variance等方差性等方差性反響變量反響變量Y 的的總體平均值總體平均值與自變量與自變量X呈呈線性關(guān)系線性關(guān)系在一定范圍內(nèi)恣在一定范圍內(nèi)恣意給定值,那意給定值,那么對(duì)應(yīng)的隨機(jī)變么對(duì)應(yīng)的隨機(jī)變量服從正態(tài)分量服從正態(tài)分布布在一定范圍內(nèi),在一定范圍內(nèi),對(duì)應(yīng)于不同對(duì)應(yīng)于不同X值,值,Y總體變異程度總體變異程度一樣一樣linear線性線性independent獨(dú)立性獨(dú)立性指恣意兩指恣意兩個(gè)察看值個(gè)察看值相互獨(dú)立相互獨(dú)立四回歸方程有統(tǒng)計(jì)學(xué)意義嗎?四

21、回歸方程有統(tǒng)計(jì)學(xué)意義嗎? 總體回歸系數(shù)總體回歸系數(shù)的統(tǒng)計(jì)推斷:的統(tǒng)計(jì)推斷:i樣 本樣 本Ya bx 樣本回歸方程樣本回歸方程就總體而言,這種回歸關(guān)系能否存在?就總體而言,這種回歸關(guān)系能否存在?即總體回歸方程能否成立?即總體回歸方程能否成立?由于樣本回歸系數(shù)由于樣本回歸系數(shù)b與總體回歸系數(shù)與總體回歸系數(shù)存在抽樣存在抽樣誤差,即:普通情況下,誤差,即:普通情況下, b ,因此需求思索,因此需求思索抽樣誤差對(duì)統(tǒng)計(jì)推斷能否存在艱苦影響?抽樣誤差對(duì)統(tǒng)計(jì)推斷能否存在艱苦影響?假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)回歸模型的假設(shè)檢驗(yàn)回歸模型的假設(shè)檢驗(yàn)model test:回歸系數(shù)的假設(shè)檢驗(yàn):回歸系數(shù)的假設(shè)檢驗(yàn):目的:檢驗(yàn)求得的回

22、歸方程在總體中能目的:檢驗(yàn)求得的回歸方程在總體中能否成立;否成立;方法:?jiǎn)我胤讲罘治?。方法:?jiǎn)我胤讲罘治觥D康模杭礄z驗(yàn)總體回歸體系數(shù)目的:即檢驗(yàn)總體回歸體系數(shù)能否能否為為0=0;方法:方法:t 檢驗(yàn)。檢驗(yàn)。1. 回歸模型的假設(shè)檢驗(yàn)回歸模型的假設(shè)檢驗(yàn)方差分析方差分析 YYYYYY222YYYYYY變異的分解:變異的分解:變異的種類變異的種類 產(chǎn)生原因產(chǎn)生原因解釋解釋SS總總:Y的離均差平方和的離均差平方和 沒有利用沒有利用X的信息的信息時(shí),時(shí),Y 觀察值的變異觀察值的變異 反映因變量反映因變量Y的總變異的總變異SS回歸回歸: (回歸平方和)(回歸平方和) 當(dāng)自變量當(dāng)自變量X引入引入 模型后所

23、引起的變模型后所引起的變異異反映在反映在Y的總變異中,的總變異中,可可用用Y與與X的線性關(guān)系解釋的的線性關(guān)系解釋的那部分變異那部分變異。SS回歸回歸越大,越大,說明回歸效果越好。說明回歸效果越好。SS殘差殘差: (殘差平方和)(殘差平方和) 總變異中無法用總變異中無法用X和和Y的回歸關(guān)系解釋的回歸關(guān)系解釋的那部分變異的那部分變異反應(yīng)自變量反應(yīng)自變量X以外因素對(duì)以外因素對(duì)Y的變異的影響的變異的影響。表示考慮。表示考慮回歸之后,回歸之后,Y的隨機(jī)誤差。的隨機(jī)誤差。2YY2YY2YY回歸方程假設(shè)檢驗(yàn)的根本思想:回歸方程假設(shè)檢驗(yàn)的根本思想:假設(shè)總體中自變量假設(shè)總體中自變量X對(duì)因變量對(duì)因變量Y沒有奉獻(xiàn),

24、那么沒有奉獻(xiàn),那么由樣本所得的回歸均方與殘差均方應(yīng)相近;由樣本所得的回歸均方與殘差均方應(yīng)相近;反之,假設(shè)總體中自變量反之,假設(shè)總體中自變量X對(duì)因變量對(duì)因變量Y有奉獻(xiàn),有奉獻(xiàn),回歸平方和反響的就不僅僅是隨機(jī)誤差,即回回歸平方和反響的就不僅僅是隨機(jī)誤差,即回歸均方必然要遠(yuǎn)大于殘差均方;歸均方必然要遠(yuǎn)大于殘差均方;依此,可計(jì)算檢驗(yàn)統(tǒng)計(jì)量依此,可計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值作出判別。值作出判別。問:所求得的回歸方程在總體中能否成立?問:所求得的回歸方程在總體中能否成立?均方:均方:MS=SS/v回歸均方:回歸均方:MS回歸回歸=SS回歸回歸/v回歸回歸殘差均方:殘差均方: MS殘差殘差=SS殘差殘差/v殘差殘差

25、2nSSSSSSSSMSMSF殘差回歸殘差殘差回歸回歸殘差回歸檢驗(yàn)統(tǒng)計(jì)量:檢驗(yàn)統(tǒng)計(jì)量:查查F界值表界值表P572,確定單側(cè)臨界值,確定單側(cè)臨界值Fa(v回歸回歸, v殘殘差差),求概率值求概率值 P,下結(jié)論,下結(jié)論1. 建立假設(shè),確定檢驗(yàn)水準(zhǔn)建立假設(shè),確定檢驗(yàn)水準(zhǔn) H0 :總體回歸方程不成立,:總體回歸方程不成立, 即總體中自變量即總體中自變量X對(duì)因變量對(duì)因變量Y沒有奉沒有奉獻(xiàn);獻(xiàn); H1 :總體回歸方程成立,:總體回歸方程成立, 即總體中自變量即總體中自變量X對(duì);因變時(shí)對(duì);因變時(shí)Y有奉有奉獻(xiàn)。獻(xiàn)。 =0.05 單側(cè)單側(cè) 查查F 界值表界值表P572:a =0.05,v回歸回歸=1、 v殘差殘

26、差=n-2=22得:得:F(k-1, n-k)= F(1,22) =4.303. 確定確定P值,作出推斷結(jié)論:值,作出推斷結(jié)論: 由于由于F=41.3764.30,那么,那么P0.05,故回絕,故回絕H0,接受,接受H1,可以為在,可以為在a =0.05 的顯著程度上,的顯著程度上,NO濃度與車流量濃度與車流量之間的回歸方程具有統(tǒng)計(jì)學(xué)意義。之間的回歸方程具有統(tǒng)計(jì)學(xué)意義。2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值:值:2. 回歸系數(shù)的假設(shè)檢驗(yàn)回歸系數(shù)的假設(shè)檢驗(yàn) t 檢驗(yàn)檢驗(yàn) =0,闡明,闡明Y與與X之間并不存在線性關(guān)系之間并不存在線性關(guān)系 0,闡明,闡明Y與與X之間存在線性關(guān)系之間存在線性關(guān)系由總體

27、回歸方程由總體回歸方程 YX= + YX= + x x 當(dāng)當(dāng)=0=0時(shí),時(shí), YX= YX= 即:對(duì)于即:對(duì)于X X 的任何值,總體均數(shù)的任何值,總體均數(shù) YX YX 沒有任何改沒有任何改動(dòng),故建立動(dòng),故建立Y Y與的直線回歸方程就沒有任何意義了與的直線回歸方程就沒有任何意義了故故 能否為能否為0,涉及到所建立的回歸方程能否有意義的問,涉及到所建立的回歸方程能否有意義的問題。然而從題。然而從=0的總體抽得樣本,計(jì)算出的回歸系數(shù)的總體抽得樣本,計(jì)算出的回歸系數(shù)b很很能夠不為零,需求對(duì)能夠不為零,需求對(duì) 能否等于能否等于0進(jìn)展假設(shè)檢驗(yàn)進(jìn)展假設(shè)檢驗(yàn)t檢驗(yàn)檢驗(yàn)t 檢驗(yàn):檢驗(yàn):22,2XXnSSXXSS

28、XYb殘差bbSbt02 n檢驗(yàn)過程:檢驗(yàn)過程:留意:留意:1.在簡(jiǎn)單線性回歸模型中,對(duì)回歸模型的方在簡(jiǎn)單線性回歸模型中,對(duì)回歸模型的方差分析等價(jià)于對(duì)回歸系數(shù)的差分析等價(jià)于對(duì)回歸系數(shù)的t 檢驗(yàn),即有:檢驗(yàn),即有:2.對(duì)于服從雙變量正態(tài)分布的同樣一組資料,對(duì)于服從雙變量正態(tài)分布的同樣一組資料,同時(shí)作相關(guān)分析和回歸分析,那么相關(guān)系數(shù)同時(shí)作相關(guān)分析和回歸分析,那么相關(guān)系數(shù)的的 t檢驗(yàn)與回歸系數(shù)數(shù)的檢驗(yàn)與回歸系數(shù)數(shù)的t 檢驗(yàn)等價(jià),即有:檢驗(yàn)等價(jià),即有:Ft brtt 五總體回歸系數(shù)五總體回歸系數(shù)的區(qū)間估計(jì):的區(qū)間估計(jì):知知b為回歸系數(shù)的樣本估計(jì)值,為回歸系數(shù)的樣本估計(jì)值,Sb為樣本回歸為樣本回歸系數(shù)的

29、規(guī)范誤,系數(shù)的規(guī)范誤, 那么總那么總體回歸系數(shù)體回歸系數(shù)的雙側(cè)的雙側(cè)1-置信區(qū)間為:置信區(qū)間為:上例題中上例題中b=0.1584,Sb=0.0246,v=22,查查t 界值界值表得:表得:t0.05/2,22=2.074;那么其總體回歸系數(shù);那么其總體回歸系數(shù)的雙的雙側(cè)側(cè)95置信區(qū)間為:置信區(qū)間為:b t/2,v Sb0.1584 2.074 0.0246=(0.1074,0.2095)22,2XXnSSXXSSXYb殘差【電腦實(shí)現(xiàn)】【電腦實(shí)現(xiàn)】SPSSSPSS線性回歸分析:線性回歸分析: 1. 數(shù)據(jù)錄入數(shù)據(jù)錄入2.線性回歸分析的步驟線性回歸分析的步驟:CoefficientsCoeffici

30、entsa a-.135.035-3.829.001.158.025.8086.432.000(Constant)車流量Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: NOa. A AN NO OV VA Ab b.0531.05341.376.000a.02822.001.08123RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 車

31、流量a. Dependent Variable: NOb. 3. 結(jié)果及結(jié)果輸出:結(jié)果及結(jié)果輸出: 六回歸方程的解釋:六回歸方程的解釋: 車流量對(duì)車流量對(duì)NO濃度的影響有多大?濃度的影響有多大?決議系數(shù):回歸平方和與總平方和之比。決議系數(shù):回歸平方和與總平方和之比。 0R21反映了自變量反映了自變量X對(duì)回歸效果的奉獻(xiàn),即對(duì)回歸效果的奉獻(xiàn),即Y的總的總變異中回歸關(guān)系所能解釋的百分比變異中回歸關(guān)系所能解釋的百分比variance account formula,VAF;反映了回歸模型的擬合效果,可作為反響擬反映了回歸模型的擬合效果,可作為反響擬合優(yōu)度合優(yōu)度goodness of fit的目的。的目

32、的。2R1SSSSSSSS 回歸殘差總總上例題:上例題:SS總總=0.0812, SS回歸回歸=0.0530 R2= SS回歸回歸/ SS總總=0.0530/0.0812=0.6527=65.27% 解釋:解釋: 闡明空氣中闡明空氣中NO濃度總變異的濃度總變異的65.27%與車流量與車流量有關(guān)。有關(guān)。七回歸方程的統(tǒng)計(jì)運(yùn)用:七回歸方程的統(tǒng)計(jì)運(yùn)用:u定量描畫兩變量之間的依存關(guān)系。定量描畫兩變量之間的依存關(guān)系。u利用回歸方程進(jìn)展統(tǒng)計(jì)預(yù)測(cè)。利用回歸方程進(jìn)展統(tǒng)計(jì)預(yù)測(cè)。u利用回歸方程進(jìn)展統(tǒng)計(jì)控制。利用回歸方程進(jìn)展統(tǒng)計(jì)控制。1. 統(tǒng)計(jì)預(yù)測(cè):將統(tǒng)計(jì)預(yù)測(cè):將X值作預(yù)告因子,固定總體值作預(yù)告因子,固定總體中中X為

33、某定值為某定值Xi時(shí),時(shí), 估計(jì)個(gè)體估計(jì)個(gè)體Y值的允許區(qū)值的允許區(qū)間,即間,即Y值的動(dòng)搖范圍。值的動(dòng)搖范圍。YnStY2, 2/2211XXXXnSSiY,Y例:當(dāng)車流量為例:當(dāng)車流量為1300輛,求空氣中一氧化氮輛,求空氣中一氧化氮95%的允許區(qū)間。的允許區(qū)間。答:答:XY1584. 01353. 0知回歸方程知回歸方程0707. 03 . 11584. 01353. 0YX=1.300時(shí)時(shí):故空氣中故空氣中NO的的98%允許區(qū)間為允許區(qū)間為:62101467. 00000. 01124. 24035. 13 . 124110358. 0074. 20707. 02. 均數(shù)置信區(qū)間:當(dāng)均數(shù)置

34、信區(qū)間:當(dāng)X值為某定值,并給定置信度值為某定值,并給定置信度1- ,調(diào)查,調(diào)查Y的總體均數(shù)的分布時(shí),可估計(jì)的總體均數(shù)的分布時(shí),可估計(jì)Y的總的總體均數(shù)體均數(shù) Y X的的1-置信區(qū)間。置信區(qū)間。YnStY2, 2/221XXXXnSSiY,Y例:當(dāng)車流量為例:當(dāng)車流量為1300輛,求空氣中一氧化氮輛,求空氣中一氧化氮95%的置信區(qū)間。的置信區(qū)間。答:答:XY1584. 01353. 0知回歸方程知回歸方程0707. 03 . 11584. 01353. 0YX=1.300時(shí)時(shí):故空氣中故空氣中NO的的95%置信區(qū)間為置信區(qū)間為:621008675. 005465. 01124. 24035. 13

35、 . 12410358. 0074. 20707. 0均數(shù)的置信區(qū)間和個(gè)體允許區(qū)間的不同:均數(shù)的置信區(qū)間和個(gè)體允許區(qū)間的不同:2. 統(tǒng)計(jì)控制:統(tǒng)計(jì)控制:例:例: 該城市為降低空氣中該城市為降低空氣中NO的含量,擬對(duì)的含量,擬對(duì)車流量進(jìn)展適當(dāng)?shù)目刂?,根?jù)空氣污染指車流量進(jìn)展適當(dāng)?shù)目刂疲鶕?jù)空氣污染指數(shù)分級(jí),要求空氣中氮氧化合物含量不超數(shù)分級(jí),要求空氣中氮氧化合物含量不超越越0.1000.15010-6 。XY1584. 01353. 0知回歸方程知回歸方程答:答:千輛時(shí)當(dāng)千輛時(shí)當(dāng)801. 11584. 0/135. 0150. 010150. 0485. 11584. 0/135. 0100.

36、010100. 0162161,XY,XY故該城市單位時(shí)間內(nèi)車流量應(yīng)控制在故該城市單位時(shí)間內(nèi)車流量應(yīng)控制在1500輛以內(nèi),輛以內(nèi),最多不超越最多不超越1800輛,否那么會(huì)導(dǎo)致輕度污染的發(fā)生。輛,否那么會(huì)導(dǎo)致輕度污染的發(fā)生。簡(jiǎn)單線性回歸分析的本卷須知:簡(jiǎn)單線性回歸分析的本卷須知: 1. 要留意實(shí)踐意義;要留意實(shí)踐意義;2. 繪制散點(diǎn)圖察看兩變量的關(guān)系以及找繪制散點(diǎn)圖察看兩變量的關(guān)系以及找出異常點(diǎn);出異常點(diǎn);3. 留意自變量和因變量的變化范圍。留意自變量和因變量的變化范圍。小小 結(jié)結(jié)簡(jiǎn)單線性回歸是指只包含一個(gè)自變量,且呈線性變化趨勢(shì)的回歸模型,用于描畫因變量的總體均數(shù)與自變量之間的線性關(guān)系,即兩變

37、量間的依存變化關(guān)系。簡(jiǎn)單線性回歸的根本步驟: 繪制散點(diǎn)圖, 在最小二乘法原那么下建立線性回歸方程,即估計(jì)回歸系數(shù)與截距; 對(duì)回歸方程或回歸系數(shù)進(jìn)展假設(shè)檢驗(yàn); 列出回歸方程,繪制回歸直線; 統(tǒng)計(jì)解釋及運(yùn)用。線性回歸模型的適用條件為:線性、獨(dú)立、正態(tài)和等方差,簡(jiǎn)稱LINE。決議系數(shù)反映了回歸平方和在總平方和中所占的比例,常用來反映回歸的實(shí)踐效果。線性回歸常用于統(tǒng)計(jì)預(yù)測(cè)和統(tǒng)計(jì)控制。當(dāng)兩變量變化趨勢(shì)為非線性時(shí),可思索擬合非線性回歸議程,常用的曲線類型包括指數(shù)曲線,多項(xiàng)式曲線、雙典線和logistic曲線等。留意線性相關(guān)與線性回歸的區(qū)別與聯(lián)絡(luò)。相關(guān)分析是用來描畫兩變量的相關(guān)關(guān)系,當(dāng)兩變相關(guān)分析是用來描畫

38、兩變量的相關(guān)關(guān)系,當(dāng)兩變量滿足雙變量正態(tài)分布時(shí),可以計(jì)算量滿足雙變量正態(tài)分布時(shí),可以計(jì)算Pearson積差相積差相關(guān)系數(shù),假設(shè)有任何一個(gè)變量不滿足正態(tài)分布或?yàn)榈汝P(guān)系數(shù),假設(shè)有任何一個(gè)變量不滿足正態(tài)分布或?yàn)榈燃?jí)資料,需計(jì)算級(jí)資料,需計(jì)算Spearman秩相關(guān)系數(shù)。秩相關(guān)系數(shù)?;貧w分析是用來描寫兩變量的依存關(guān)系,它要求回歸分析是用來描寫兩變量的依存關(guān)系,它要求資料滿足資料滿足LINE線性、獨(dú)立、正態(tài)和等方差,二線性、獨(dú)立、正態(tài)和等方差,二者之間既有聯(lián)絡(luò)又有區(qū)別。者之間既有聯(lián)絡(luò)又有區(qū)別。 案 例 討 論案 例 討 論案例10-1:年齡與身高預(yù)測(cè)研討。 某地調(diào)查了418歲男孩與女孩身高,數(shù)據(jù)見下表,試

39、描畫男孩與女孩身高與年齡間的關(guān)系,并預(yù)測(cè)10.5歲、16.5歲、19歲與20歲男孩與女孩的身高。表10-5 男孩身高對(duì)年齡的簡(jiǎn)單線性回歸分析結(jié)果%5 .98990.98,2RF估計(jì)值估計(jì)值標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤tPconstant83.73631.882444.48390.0000age5.27480.167631.47980.0000采用SPSS對(duì)身高與年齡進(jìn)展回歸分析,結(jié)果如下表所示。估計(jì)值估計(jì)值標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤tPconstant88.43263.280026.96110.0000age4.53400.292015.52900.0000表表12-6 女孩身高對(duì)年齡的簡(jiǎn)單線性回歸分析結(jié)果女孩身高對(duì)年齡的簡(jiǎn)單線性回歸分析結(jié)果%1 .94,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論