(統(tǒng)計學(xué) 第九周)簡單回歸分析—李琳琳老師_第1頁
(統(tǒng)計學(xué) 第九周)簡單回歸分析—李琳琳老師_第2頁
(統(tǒng)計學(xué) 第九周)簡單回歸分析—李琳琳老師_第3頁
(統(tǒng)計學(xué) 第九周)簡單回歸分析—李琳琳老師_第4頁
(統(tǒng)計學(xué) 第九周)簡單回歸分析—李琳琳老師_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章第第 十十 章章簡簡 單單 回回 歸歸 分分 析析生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章w 第一節(jié)第一節(jié) 簡單線形回歸簡單線形回歸w 第二節(jié)第二節(jié) 線形回歸的應(yīng)用線形回歸的應(yīng)用 主要內(nèi)容主要內(nèi)容生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章學(xué)習(xí)目標(biāo) 了解回歸分析的基本思想。熟悉線性回歸的基本步驟;求解回歸方程中參數(shù)估計量a和b值所遵循的策略最小二乘原則。掌握簡單線性回歸的基本概念;回歸模型的前提假設(shè);回歸系數(shù)的含義、計算方法及假設(shè)檢驗。生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章教 學(xué) 重 點線性回歸模型的前提假設(shè)線性回歸分析的基本步驟回歸方程的解釋生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章第第 一節(jié)一

2、節(jié)簡簡 單單 線線 性性 回回 歸歸 Linear Regression Analysis生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 為研究大氣污染一氧化氮(NO)的濃度是否受到汽車流量、氣候狀況等因素的影響,選擇24個工業(yè)水平相近的一個交通點,統(tǒng)計單位時間過往的汽車數(shù)(千輛),同時在低空相同高度測定了該時間段平均氣溫()、空氣濕度() 、風(fēng)速(m/s)以及空氣中一氧化氮(NO)的濃度( ),數(shù)據(jù)如表10-1所示。 【例例10.1】610生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章表10-1 24個城市交通點空氣中NO濃度監(jiān)測數(shù)據(jù)生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章資料類型:定量資料;研究目的:了解一氧化氮濃度與汽車流

3、量、氣候狀況等因素之間的依存關(guān)系?!景咐馕觥可镝t(yī)學(xué)研究的統(tǒng)計方法 第10章 函數(shù)關(guān)系:它反映著現(xiàn)象之間嚴(yán)格的數(shù)量化依存關(guān)系,也稱確定性的依存關(guān)系。如正方形的面積和邊長的關(guān)系。 回歸關(guān)系:變量之間存在著不確定、不嚴(yán)格的依存關(guān)系,即對于一個變量的某個數(shù)值,可以有另一變量的若干數(shù)值與之相對應(yīng) bxaybxay2XY 在這種關(guān)系中,對于變量的每一個數(shù)值,都有一個或幾個確定的值與之嚴(yán)格對應(yīng)。 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章回歸關(guān)系的幾個例子生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章一、回歸分析的基本概念一、回歸分析的基本概念回歸(Regression)變量間關(guān)系不能用函數(shù)關(guān)系精確表達一個變量的取值不能由另一

4、個變量唯一確定當(dāng)變量 x 取某個值時,變量 y 的取值可能有幾個各觀測點分布在直線周圍 X1.31.21.11.0.9.8.7.6.5Y201918171615141312生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章回歸分析(回歸分析(Regression analysisRegression analysis)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式;對這些關(guān)系式的可信程度進行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出具有統(tǒng)計學(xué)意義的變量;1.利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確程度。生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章w自變量與

5、因變量自變量與因變量自變量(自變量(independent variable) : 能獨立自由變化的變量能獨立自由變化的變量 一般用一般用X表示表示因變量(因變量(dependent variable): 非獨立的、受其它變量影響的變量非獨立的、受其它變量影響的變量 一般用一般用Y表示表示c)x與與y確定原則確定原則 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章w回歸模型分類回歸模型分類 a) 按變化趨勢:按變化趨勢: 線性回歸模型線性回歸模型 非線性回歸模型非線性回歸模型按自變量個數(shù):按自變量個數(shù): 簡單線性回歸模型簡單線性回歸模型 多重線性回歸模型多重線性回歸模型 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章一元

6、線性回歸模型一元線性回歸模型描述y 如何依賴于x 和誤差項 的方程稱為回歸模型一元線性回歸模型可表示為y 是 x 的線性函數(shù)(部分)加上誤差項線性部分反映了由于 x 的變化而引起的 y 的變化誤差項 是隨機變量,反映了除 x 和 y 之間的線性關(guān)系之外的隨機因素對 y 的影響,是不能由 x 和 y 之間的線性關(guān)系所解釋的變異性0 和 1 稱為模型的參數(shù)XY10生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章二、簡單線性回歸分析回歸模型的基本假設(shè)1.線性(linear)2.獨立(independent)3.正態(tài) (normal)4.等方差(equal variance)生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章線性(線性

7、(linear)指反應(yīng)變量Y的總體平均值與自變量X呈線性關(guān)系。獨立(獨立(independent)指任意兩個觀察值互相獨立。正態(tài)正態(tài) (normal)假定線性模型的誤差項服從正態(tài)分布 。等方差(等方差(equal variance)是指在自變量X取值范圍內(nèi),不論X取什么值,Y都具有相同的方差。 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 3X1Y2Y3YYX2X1X圖1 回歸模型前提假設(shè)示意圖生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章u回歸分析的方法步驟回歸分析的方法步驟繪制散點圖繪制散點圖求回歸系數(shù)和常數(shù)項求回歸系數(shù)和常數(shù)項回歸系數(shù)和常數(shù)項的假設(shè)檢驗回歸系數(shù)和常數(shù)項的假設(shè)檢驗列出回歸方程,并進行假設(shè)檢驗列出回歸

8、方程,并進行假設(shè)檢驗回歸方程的解釋回歸方程的解釋生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章(一)繪制散點圖(一)繪制散點圖圖2 車流量與空氣中NO濃度關(guān)系散點圖 從散點圖可見:從散點圖可見:車流量與空氣中車流量與空氣中NO濃度有線性濃度有線性關(guān)系,可以考慮關(guān)系,可以考慮做線性回歸分析。做線性回歸分析。生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章(二)求回歸系數(shù)和常數(shù)項(二)求回歸系數(shù)和常數(shù)項生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章xxxyLLXXYYXXb2)()(XbYabXaY系數(shù)估計公式:系數(shù)估計公式: 回歸方程:回歸方程:生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章xy1584. 01353.

9、0回歸方程本例中b=0.1584; a=-0.1353生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章參數(shù)參數(shù)的意義:若自變量的意義:若自變量X增加增加1個單位,反應(yīng)變個單位,反應(yīng)變量量Y的平均值便增加的平均值便增加個單位。個單位。 =0,說明,說明Y與與X之間并不存在線性關(guān)系;之間并不存在線性關(guān)系; 0,說明,說明Y與與X之間存在線性關(guān)系。之間存在線性關(guān)系。理由:從理由:從=0的總體抽得樣本,計算出的回歸系的總體抽得樣本,計算出的回歸系數(shù)數(shù)b很可能不為零。很可能不為零。方法:回歸系數(shù)的假設(shè)檢驗可通過方法:回歸系數(shù)的假設(shè)檢驗可通過t檢驗實現(xiàn)。檢驗實現(xiàn)。(三)回歸系數(shù)和常數(shù)項的假設(shè)檢驗(三)回歸系數(shù)和常數(shù)項的假

10、設(shè)檢驗生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章t檢驗檢驗生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章。于可以認(rèn)為回歸系數(shù)不等,所以00001. 0,222432. 60246. 01584. 0005. 00:0:22,0001. 010PttnsbtHHbb生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章(四)回歸方程的假設(shè)檢驗(四)回歸方程的假設(shè)檢驗?zāi)康模簷z驗求得的回歸方程在總體中是目的:檢驗求得的回歸方程在總體中是否成立;否成立;方法:單因素方差分析。方法:單因素方差分析。生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章因變量 y 的取值是不同的,y 取值的這種波動稱為變異。變異來源:n因自變量 x 的取值不同造成的n除 x 以外的其他因

11、素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變異的大小可以通過該實際觀測值與其均值之差 來表示u變異(變差)及其分解變異(變差)及其分解yy 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章yxy10yyyyyy),(iiyx生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章niiniiniiyyyyyy121212生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章SST是指沒有利用X的信息時,Y觀察值的變異;SSE反應(yīng)回歸方程未能解釋的那部分變異;SSR反應(yīng)回歸方程解釋的那部分變異。決定系數(shù)(R2)= SSR/ SST,反應(yīng)了Y的總變異中回歸關(guān)系所能解釋的百分比, R2越大,說明構(gòu)建的回歸方程越好。 生物醫(yī)學(xué)研究的統(tǒng)計

12、方法 第10章表3 簡單線性回歸模型方差分析表 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 查查F界值表,得界值表,得P0.05,說明構(gòu)建的說明構(gòu)建的回歸方程具有統(tǒng)計學(xué)意義。回歸方程具有統(tǒng)計學(xué)意義。 研究表明,研究表明, 車流量和空氣中車流量和空氣中NO濃度濃度存在著線性依存關(guān)系:車流量每增加存在著線性依存關(guān)系:車流量每增加100輛(輛(0.1千輛)千輛),空氣中空氣中NO濃度平均濃度平均可能增加可能增加0.01584(五)回歸方程的解釋(五)回歸方程的解釋610生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章線性回歸分析的線性回歸分析的SPSS過程:過程:Analyze Regression LinearDepend

13、ent list框 YIndependent list框 X1OK生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章【電腦實現(xiàn)】SPSS線性回歸分析:線性回歸分析: 1. 數(shù)據(jù)錄入數(shù)據(jù)錄入生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章2.線性回歸分析的步驟線性回歸分析的步驟:生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章C Co oe ef ff fi ic ci ie en nt ts sa a-.135.035-3.829.001.158.025.8086.432.000(Constant)車流量Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficient

14、stSig.Dependent Variable: NOa. A AN NO OV VA Ab b.0531.05341.376.000a.02822.001.08123RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 車流量a. Dependent Variable: NOb. 3. 結(jié)果及結(jié)果輸出:結(jié)果及結(jié)果輸出: 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章第第 二二 節(jié)節(jié) 線線 形形 回回 歸歸 的的 應(yīng)應(yīng) 用用生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章直線回歸方程的應(yīng)用(一)定量描述兩變量

15、之間的依存關(guān)系。(一)定量描述兩變量之間的依存關(guān)系。(二)利用回歸方程進行預(yù)測。(二)利用回歸方程進行預(yù)測。(三)利用回歸方程進行統(tǒng)計控制。(三)利用回歸方程進行統(tǒng)計控制。生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 一、一、 總體回歸線的總體回歸線的95% 置信帶置信帶的總體均數(shù)的點估計為時,給定YXpX 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章二、個體二、個體Y預(yù)測值的區(qū)間估計預(yù)測值的區(qū)間估計 總體中,當(dāng)XP為某一固定值時,個體Y值圍繞著對應(yīng)于XP值的總體均數(shù)波動,其分布的標(biāo)準(zhǔn)差按下式估計:生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章即即 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 圖5 空氣中N

16、O濃度(Y)與車流量(X)回歸 線的95%置信帶與Y個體值的95%預(yù)測帶生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章三、三、 統(tǒng)計控制統(tǒng)計控制:例例: 該城市為降低空氣中該城市為降低空氣中NO的含量,擬對車流量的含量,擬對車流量進行適當(dāng)?shù)目刂?,根?jù)空氣污染指數(shù)分級,要進行適當(dāng)?shù)目刂疲鶕?jù)空氣污染指數(shù)分級,要求空氣中氮氧化合物含量不超過求空氣中氮氧化合物含量不超過0.1000.15010-6 。XY1584. 01353. 0已知回歸方程已知回歸方程答答:千輛時當(dāng)千輛時當(dāng)801. 11584. 0/135. 0150. 010150. 0485. 11584. 0/135. 0100. 010100. 01

17、62161,XY,XY故該城市單位時間內(nèi)車流量應(yīng)控制在故該城市單位時間內(nèi)車流量應(yīng)控制在1500輛以內(nèi),輛以內(nèi),最多不超過最多不超過1800輛,否則會導(dǎo)致輕度污染的發(fā)生。輛,否則會導(dǎo)致輕度污染的發(fā)生。生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章簡單線性回歸分析的注意事項簡單線性回歸分析的注意事項 1.要注意實際意義;要注意實際意義;2.繪制散點圖觀察兩變量的關(guān)系以及繪制散點圖觀察兩變量的關(guān)系以及找出異常點;找出異常點;3.注意自變量和因變量的變化范圍。注意自變量和因變量的變化范圍。生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章小結(jié) 相關(guān)分析是用來描述兩變量的相關(guān)關(guān)系,當(dāng)兩變量滿足雙變量正態(tài)分布時,可以計算Pearson積

18、差相關(guān)系數(shù),如果有任何一個變量不滿足正態(tài)分布或為等級資料,需計算Spearman等級相關(guān)系數(shù)。而回歸分析是用來刻畫兩變量的依存關(guān)系,它要求資料滿足LINE(線性、獨立、正態(tài)和等方差),二者之間既有聯(lián)系又有區(qū)別。 生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章【案例討論】年齡與身高預(yù)測研究。某地調(diào)查了年齡與身高預(yù)測研究。某地調(diào)查了418歲男孩歲男孩與女孩身高,數(shù)據(jù)見下表,試描述男孩與女孩身與女孩身高,數(shù)據(jù)見下表,試描述男孩與女孩身高與年齡間的關(guān)系,并預(yù)測高與年齡間的關(guān)系,并預(yù)測10.5歲、歲、16.5歲、歲、19歲與歲與20歲男孩與女孩的身高。歲

19、男孩與女孩的身高。 表表10-4 10-4 某地男孩與女孩平均身高與年齡的調(diào)查數(shù)據(jù)某地男孩與女孩平均身高與年齡的調(diào)查數(shù)據(jù)生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章采用采用SPSS對身高與年齡進行回歸分析,結(jié)果如表對身高與年齡進行回歸分析,結(jié)果如表10-5和和表表10-6所示。所示。 表10-5 男孩身高對年齡的簡單線性回歸分析結(jié)果%5 .98R990.98,F2估計值標(biāo)準(zhǔn)誤tPconstant83.73631.882444.48390.0000age5.27480.167631.47980.0000生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章估計值標(biāo)準(zhǔn)誤tPconstant88.43263.280026.96110

20、.0000age4.53400.292015.52900.0000表12-6 女孩身高對年齡的簡單線性回歸分析結(jié)果%1 .94,15.2412RF生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 經(jīng)擬合簡單線性回歸模型,t檢驗結(jié)果提示回歸方程有非常顯著的統(tǒng)計學(xué)意義。 結(jié)果提示,擬合效果非常好,故可認(rèn)為: (1)男孩與女孩的平均身高隨年齡線性遞增,年齡每增長1歲,男孩與女孩身高分別平均增加5.27,4.53,男孩生長速度快于女孩的生長速度。 (2)依照回歸方程預(yù)測該地男孩10.5、16.5、19和20歲的平均身高依次為139.12、170.77、183.96和189.23,該地女孩10.5、16.5、19和20歲的平均身高依次為136.04、163.24、174.58和179.11. 2R生物醫(yī)學(xué)研究的統(tǒng)計方法 第10章 針對以上分析結(jié)果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論