7直線回歸分析_第1頁
7直線回歸分析_第2頁
7直線回歸分析_第3頁
7直線回歸分析_第4頁
7直線回歸分析_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、直線回歸分析linear regression兩變量之間的關(guān)系無關(guān)系確定性關(guān)系(函數(shù)關(guān)系)有關(guān)系非確定性關(guān)系(回歸關(guān)系)醫(yī)學(xué)領(lǐng)域里常常需要研究兩個變量之間的關(guān)系,例如:人的身高與體重,體溫與脈搏次數(shù),年齡與血壓,藥劑量與療效,體表面積與肺活量, 身高與臂長兩變量關(guān)系的密切程度可以用直線相關(guān)衡量;兩變量的數(shù)量變化關(guān)系可以用直線回歸衡量。函數(shù)關(guān)系與回歸關(guān)系函數(shù)關(guān)系:自變量X取某一數(shù)值時,應(yīng)變量Y有一個完全確定的數(shù)值與之對應(yīng)。如: y = 2p x回歸關(guān)系:兩個變量間的取值并非完全的一一對應(yīng), 而是具有某一種隨機(jī)性的“趨勢”?;貧w問題的研究起源于生物學(xué)界。1886年英國生物學(xué)家兼統(tǒng)計學(xué)家FGalto

2、n 在他的一篇著名論文中提出。Regression 釋義主要內(nèi)容 直線回歸方程的建立 直線回歸的統(tǒng)計推斷 直線回歸的應(yīng)用 直線回歸需注意的問題 直線回歸與直線相關(guān)的聯(lián)系與區(qū)別直線回歸概念直線回歸(linearregression)用來研究兩個連續(xù)型變量之間數(shù)量上的線性依存關(guān)系。因變量(dependent variable) 常用y表示自變量(independent variable) 常用x表示例14.1某研究欲探討男性腰圍與腹腔內(nèi)脂肪面積的關(guān)系,對20名男性志愿受試者測量其腰圍(cm),并采用磁共振成像法測量其腹腔內(nèi)脂肪面積(cm2),結(jié)果如表14.1所示。試建立腹腔內(nèi)脂肪面積和腰圍的直線回

3、歸方程。表 14.120 名男性志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量值腹腔內(nèi)脂肪面積(cm2)腰圍(cm)編號123456789101181.385.685.987.879.082.595.296.194.490.693.569.861.280.375.575.785.4102.599.697.8100.9108.2130120110100908070607580859095100105腰圍 (cm)圖14.1 兩變量直線回歸關(guān)系散點圖腹腔內(nèi)脂肪面積 (cm2)直線回歸方程: y = a + bx x為自變量的取值y 為當(dāng)x取某一值時應(yīng)變量y的平均估計值 a 為截距(intercept),即當(dāng)

4、 x = 0時y的平均估計值 b 為回歸系數(shù)(regression coefficient),表示改變一個單位 x 時y的平均改變量。y = a + bx直線方程:估計值 YY= 2.5211 + 0.2358 X的意義 X=11時,Y =5.145,即體重為 11 kg 的三歲女童, 其平均體表面積之估計為 5.145 (103cm2); X=15時,Y =6.099,即體重為 15 kg 的三歲女童, 其平均體表面積之估計為 6.099 (103cm2). 給定X時,Y的平均估計值。 時,Y = Y 當(dāng)X = X由體重(kg)估計體表面積(103cm2 )Y(Y 的估計值)5.1455.3

5、365.3835.4555.6465.7895.9566.0756.1466.337X(體重,kg)11.011.812.012.313.113.714.414.915.216.0Y(體表面積)5.2835.2995.3585.2925.6026.0145.8306.1026.0756.411Y - Y的意義Y - Y 為殘差 (residual) :由回歸方程y = b0+ b x知,當(dāng)自變量取某值x時,因變量為 y ,而實際觀察值卻時y,兩者之差為殘差(residual),即點到直線的縱向距離。6.56.05.55.0111213141516ya 0a = 0a 00xb0:x 每增加(減

6、少)一個觀測單位,y 增加(減少)b個單位。b0b0:x每增加(減少)一個觀測單位,y|b|個單位。減少(增加)b=0b=0:x與 y 沒有直線回歸關(guān)系?;貧w方程的估計原理:最小二乘法(least square method)各實測點到直線的縱向距離平方之和達(dá)到最小計算公式b = lxy= (x - x )( y - y)(x - x )2lxxa = y - bx其中= x2 -( x)2 / n= y2 - ( y)2 / n= xy -( x y) / nlxxlyylxy本例= x2 - ( x)2 / n = 950.778= y2 - ( y)2 / n = 7293.650= x

7、y - ( x y) / n = 2006.649lxxlyylxyb = lxy= 2006.649 = 2.11053lxx950.778a = y - bx = 95.645 - 2.11053 90.990 = -96.39212故所求回歸方程為:y = -96.39212 + 2.11053x腰圍每增加1cm,腹腔內(nèi)脂肪面積平均增加2.11053cm2。直線回歸的統(tǒng)計推斷 樣本回歸系數(shù)b 總體回歸系數(shù) 對的兩種假設(shè)檢驗方法: 方差分析法 t檢驗法11.5因變量總變異的分解YP(X,Y) (Y - Y)(Y - Y)Y (Y - Y)YYX總變異的分解( y - y)2 = ( y -

8、 y)2 + ( y - y)2即:SS總 = SS回 + SS殘SS總:總離均差平方和 (不考慮回歸關(guān)系的總變異)SS回:回歸平方和(總變異中可以用回歸關(guān)系所解釋的部分。值越大,說明回歸效果越好。)SS殘 :殘差平方和(總平方和中無法用回歸關(guān)系解釋的部分隨機(jī)誤差)自由度的分解n總=n回+n 殘n總 = n -1,n回 = 1,n 殘 = n - 2,構(gòu)造F統(tǒng)計量=SS回 /n回F = MS 回SS殘 /n 殘MS殘方差分析表自由度n平方和SS均方MS來源統(tǒng)計量FSS總 = S(y - y)2n總=n-1總n回=1SS= S(y - y)2回歸MS回=SS回/1MS回/MS殘回MS殘=SS殘/

9、(n-2)SS殘 = S(y - y)n殘差2=n-2殘本例1.建立檢驗假設(shè),確定檢驗水準(zhǔn)H0 : b = 0 ,即腹腔內(nèi)脂肪面積與腰圍之間無直線回歸關(guān)系H1 : b 0 ,即腹腔內(nèi)脂肪面積與腰圍之間有直線回歸關(guān)系a =0.052.計算檢驗統(tǒng)計量= ( y - y)2 = l= 7293.650SSyy總= b2l= 4235.086- SS回 = 3058.564SSxx回SS殘 = SS總SS回 /n回SS殘 /n殘MS回= 4235.086 /1F = 24.924MS殘3058.564 /18直線回歸的方差分析表n變異來源SSMSFP 0.01回歸4235.0863058.564729

10、3.650118194235.086169.92024.924殘差總變異3.確定P值,作出統(tǒng)計推斷P0.01,按照0.05檢驗水準(zhǔn)拒絕H0?;貧w方程有統(tǒng)計學(xué)意義,可以認(rèn)為腹腔內(nèi)脂肪面積與腰圍之間有直線回歸關(guān)系。t檢驗法b -0n =n -2公式:t=bSbSy xSS殘其中: S=Sy xn - 2blxx本例SS殘3058.564 = 13.03535=Syx n - 220 - 2Syx = 13.03535S= 0.42275bl950.778xxb= 2.11053 = 4.9924t=bS0.42275b 查t界值表 ,得P0.001,結(jié)論與方差分析法一致 實際上:對同一資料作總體回

11、歸系數(shù)是否為0 的假設(shè)檢驗,方差分析和t 檢驗是一致的。tb=F總體回歸系數(shù)的區(qū)間估計b ta / 2,(n-2) Sb本例:(2.11053 - 2.1010.42275, 2.11053 + 2.1010.42275) = (1.222, 2.999)決定系數(shù)(coefficient of determination)= SS 回R2SS總R2反映了回歸貢獻(xiàn)的相對程度,即在因變量 y的總變異中用y與x回歸關(guān)系所能解釋的比例。在實際應(yīng)用中,常用決定系數(shù)來反映回歸的實際效果。本例決定系數(shù)為0.581直線回歸分析的應(yīng)用 因變量總體條件均數(shù)的置信區(qū)間估計 應(yīng)變量個體y值的預(yù)測區(qū)間總體條件均數(shù)的置信區(qū)間估計 點估計:yp 是在給定x=xp下的條件平均值的點估計yp 的1-的置信區(qū)間估計公式為: ta / 2,(n-2) S yy pp其中:( x- x )21np= S+Sy xy plxx應(yīng)變量個體y值的預(yù)測區(qū)間對于給定的x=xp,y值的預(yù)測區(qū)間 ta / 2,n Sy|xpyp計算公式為:( x- x )2其中:1np= S1 +Sy xy| xplxx二者的區(qū)別(置信帶和預(yù)測帶)130120110100908

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論