回歸直線方程—最小二乘法_第1頁
回歸直線方程—最小二乘法_第2頁
回歸直線方程—最小二乘法_第3頁
回歸直線方程—最小二乘法_第4頁
回歸直線方程—最小二乘法_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、問題問題:在一次對人體脂肪含量與年齡關(guān)系的研究中,在一次對人體脂肪含量與年齡關(guān)系的研究中, 研究人員獲得了一組樣本數(shù)據(jù):研究人員獲得了一組樣本數(shù)據(jù):年年齡齡2327394145495053545657586061脂脂肪肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6散點圖散點圖回回歸歸直直線線回歸直線概念:散點圖中心的分布從整體上看回歸直線概念:散點圖中心的分布從整體上看大致是一條直線附近,該直線稱為回歸直線大致是一條直線附近,該直線稱為回歸直線 求出回歸直線的方程求出回歸直線的方程我們就可以比較清楚地了解年齡與體我們就可以比較清

2、楚地了解年齡與體內(nèi)脂肪含量之間的相關(guān)性內(nèi)脂肪含量之間的相關(guān)性由此可以預(yù)測相應(yīng)年齡段的脂肪含量由此可以預(yù)測相應(yīng)年齡段的脂肪含量那我們又該如何具體求這個回歸方程呢?那我們又該如何具體求這個回歸方程呢?方法匯總方法匯總?1.畫一條直線畫一條直線2.測量出各點測量出各點與它的距離與它的距離3.移動直線,移動直線,到達(dá)某一位置到達(dá)某一位置使距離的和最使距離的和最小,測量出此小,測量出此時直線的斜率時直線的斜率與截距,得到與截距,得到回歸方程?;貧w方程。1.選取兩點作選取兩點作直線直線ps:使直線兩:使直線兩側(cè)側(cè) 的點的個的點的個數(shù)基本相同。數(shù)基本相同。1.在散點圖中在散點圖中多取幾組點,多取幾組點,確定

3、出幾條直確定出幾條直線的方程線的方程2.分別求出各分別求出各條直線的斜率、條直線的斜率、截距的平均數(shù)截距的平均數(shù)3.將這兩個平將這兩個平均數(shù)當(dāng)成回歸均數(shù)當(dāng)成回歸方程的斜率與方程的斜率與截距。截距。法一法一法四法四法二法二法三法三? 上面三種方法都有一定的道理,但總讓人感到上面三種方法都有一定的道理,但總讓人感到可靠性不強可靠性不強. . 回歸直線與散點圖中各點的位置用數(shù)學(xué)的方法回歸直線與散點圖中各點的位置用數(shù)學(xué)的方法來刻畫應(yīng)具有怎樣的關(guān)系?來刻畫應(yīng)具有怎樣的關(guān)系? 方法匯總方法匯總1.畫一條直線畫一條直線2.測量出各點測量出各點與它的距離與它的距離3.移動直線,移動直線,到達(dá)某一位置到達(dá)某一位

4、置使距離的和最使距離的和最小,測量出此小,測量出此時直線的斜率時直線的斜率與截距,得到與截距,得到回歸方程。回歸方程。1.選取兩點作選取兩點作直線直線ps:使直線兩:使直線兩側(cè)側(cè) 的點的個的點的個數(shù)基本相同。數(shù)基本相同。1.在散點圖中在散點圖中多取幾組點,多取幾組點,確定出幾條直確定出幾條直線的方程線的方程2.分別求出各分別求出各條直線的斜率、條直線的斜率、截距的平均數(shù)截距的平均數(shù)3.將這兩個平將這兩個平均數(shù)當(dāng)成回歸均數(shù)當(dāng)成回歸方程的斜率與方程的斜率與截距。截距。最最小小二二乘乘法法法一法一法四法四法二法二法三法三求回歸方程的關(guān)鍵求回歸方程的關(guān)鍵如何使用如何使用數(shù)學(xué)方法數(shù)學(xué)方法來刻畫來刻畫“從

5、整體上看,從整體上看,各點到此直線的距離最小各點到此直線的距離最小”。假設(shè)兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)假設(shè)兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)據(jù):(x1, y1),(x2, y2),. (xn, yn)下面討論如何表達(dá)這些點與一條直線下面討論如何表達(dá)這些點與一條直線y=bx+a之間的距離。之間的距離。1.設(shè)已經(jīng)得到具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):設(shè)已經(jīng)得到具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù): (x1,y1),(),(x2,y2),),(,(xn,yn)2.設(shè)所求的回歸直線方程為設(shè)所求的回歸直線方程為Y=bx+a,其中其中a,b是是待定的系數(shù)。當(dāng)變量待定的系數(shù)。當(dāng)變量x取取x1,x2,xn

6、時,可以得時,可以得到到 Yi=bxi+a(i=1,2,n)3.它與實際收集得到的它與實際收集得到的yi之間偏差是之間偏差是 yi-Yi=yi-(bxi+a)(i=1,2,n)(x1,y1)(x2,y2)(xi ,yi )yi-Yiy x這樣,用這這樣,用這n個偏差的和來刻畫個偏差的和來刻畫“各點與此直線的整體偏差各點與此直線的整體偏差”是比較合適的。是比較合適的。因此用因此用 表示各點到直線表示各點到直線y=bx+a的的“整體距離整體距離” (x1 ,y1)(x2 ,y2)(xi ,yi)yi-(bxi+a)(x(x1 1,y,y1 1) )(x(x2 2,y y2 2) )(x(xi i,

7、y yi i) )(x(xn n,y yn n) )abxyii 由于絕對值使得計算不方便,在實際應(yīng)用由于絕對值使得計算不方便,在實際應(yīng)用中人們更喜歡用中人們更喜歡用2222211abxyabxyabxyQnn(x(x1 1,y,y1 1) )(x(x2 2,y y2 2) )(x(xi i,y yi i) )(x(xn n,y yn n) )abxyii2222211abxyabxyabxyQnn這樣,問題就歸結(jié)為:當(dāng)這樣,問題就歸結(jié)為:當(dāng)a a,b b取什么值時取什么值時Q Q最???即最???即點到直線點到直線 的的“整體距離整體距離”最小最小. .abxy這樣通過求此式的最小值而得到回這樣

8、通過求此式的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的歸直線的方法,即使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小點到回歸直線的距離的平方和最小的方法叫做的方法叫做最小二乘法最小二乘法. .2222211abxyabxyabxyQnn根據(jù)有關(guān)數(shù)學(xué)原理推導(dǎo),根據(jù)有關(guān)數(shù)學(xué)原理推導(dǎo),a a,b b的值由下列公式給出的值由下列公式給出niiniiiniiniiixnxyxnyxxxyyxxb1221121xbya(yi-Yi)的最小值的最小值ni=1|yi-Yi|的最小值的最小值ni=1(yi-Yi)2的最小值的最小值ni=1Q=(y1-bx1-a) 2+(y2-bx2-a) 2+(yn-bxn-a

9、) 2當(dāng)當(dāng)a,b取什么值時,取什么值時,Q的值最小,即總體偏差最小的值最小,即總體偏差最小1221,niiiniixyn x ybxn xayb x121()()()niinixxyybxxayb x13求線性回歸方程的步驟:求線性回歸方程的步驟:(1)求平均數(shù)求平均數(shù) ;(2)計算計算 與與 yi 的乘積的乘積,再求再求 ;(3)計算計算 ;(4)將上述有關(guān)結(jié)果代入公式,寫出回歸將上述有關(guān)結(jié)果代入公式,寫出回歸 直線方程直線方程.xi年年齡齡2327394145495053545657586061脂脂肪肪9.517.821.225.927.526.328.229.630.231.430.83

10、3.535.234.6根據(jù)最小二乘法公式,根據(jù)最小二乘法公式,利用計算機可以求出利用計算機可以求出其回歸直線方程其回歸直線方程散點圖散點圖回回歸歸直直線線0.5770.48yx思考:將表中的年齡作為思考:將表中的年齡作為x代入回歸方程,看看代入回歸方程,看看得出的數(shù)值與真實數(shù)值之間的關(guān)系,從中你體會得出的數(shù)值與真實數(shù)值之間的關(guān)系,從中你體會到了什么?到了什么? 0.5770.48yxx=27時,時,y=15.099%x=37時,時,y=20.901%可利用回歸方程可利用回歸方程預(yù)測不同年齡段預(yù)測不同年齡段的體內(nèi)脂肪含量的體內(nèi)脂肪含量的百分比。的百分比。存在樣本存在樣本點不在直線上點不在直線上年

11、年齡齡2327394145495053545657586061脂脂肪肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6(2012山東臨沂二模,山東臨沂二模,20,12)假設(shè)關(guān)于某設(shè)備的)假設(shè)關(guān)于某設(shè)備的使用年限使用年限x和所有支出的維修費用和所有支出的維修費用y(萬元),有如(萬元),有如下表的統(tǒng)計資料:下表的統(tǒng)計資料:使用年使用年限限x23456維修費維修費用用y2.23.85.56.57.0若由資料可知若由資料可知y對對x呈線性相關(guān)關(guān)系,試求:呈線性相關(guān)關(guān)系,試求:(1)線性回歸直線方程)線性回歸直線方程(2)估計使用年限為)估計使用年限為10年時,維修費用是多少?年時,維修費用是多少?y=1.23x+0.08 ;y=12.38 回歸直線回歸直線方程特點方程特點存在樣本點存在樣本點不在直線上不在直線上的樣本點的樣本點只能表示線只能表示線性相關(guān)關(guān)系性相關(guān)關(guān)系回歸直線方程的特回歸直線方程的特點點過定點過定點(樣本中心)(樣本中心), x y練習(xí)練習(xí)1 (2010湖南高考)某商品銷售量 y(件)與銷售價格x(元/件)負(fù)相關(guān),則其回歸方程可能是()Ay10 x20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論