一元線性回歸模型參數(shù)的最小二乘估計高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修3_第1頁
一元線性回歸模型參數(shù)的最小二乘估計高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修3_第2頁
一元線性回歸模型參數(shù)的最小二乘估計高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修3_第3頁
一元線性回歸模型參數(shù)的最小二乘估計高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修3_第4頁
一元線性回歸模型參數(shù)的最小二乘估計高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修3_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

8.2一元線性回歸模型及其應(yīng)用

第3課8.2.2一元線性回歸模型參數(shù)的最小二乘估計(2)課程目標學(xué)科素養(yǎng)1.能通過具體實例說明一元線性回歸模型修改的依據(jù)與方法.2.通過對具體問題的進一步分析,能將某些非線性回歸問題轉(zhuǎn)化為線性回歸問題并加以解決,提高數(shù)學(xué)運算能力.3.能通過實例說明決定系數(shù)R2的意義和作用,提高數(shù)據(jù)分析能力。1.數(shù)學(xué)抽象:一元線性回歸模型2.邏輯推理:最小二乘法與回歸方程3.數(shù)學(xué)運算:求決定系數(shù)4.數(shù)學(xué)建模:模型化思想

1.樣本相關(guān)系數(shù)r

性質(zhì):(1)當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,稱成對樣本數(shù)據(jù)負相關(guān).(2)r的取值范圍為[-1,1]

(3)當(dāng)|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;當(dāng)|r|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.

獲得總體中所有的成對數(shù)據(jù)往往是不容易的,因此,我們還是要用樣本估計總體的思想來解決問題,也就是說,我們先要通過抽樣獲取兩個變量的一些成對樣本數(shù)據(jù),再計算出樣本相關(guān)系數(shù),通過樣本相關(guān)系數(shù)去估計總體相關(guān)系數(shù),從而了解兩個變量之間的相關(guān)程度,對于簡單隨機樣本而言,樣本具有隨機性,因此樣本相關(guān)系數(shù)r也具有隨機性,一般地,樣本容量越大,用樣本相關(guān)系數(shù)估計兩個變量的相關(guān)系數(shù)的效果越好。溫故知新2.我們將稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線,這種求經(jīng)驗回歸方程的方法叫最小二乘法.注意:(1)經(jīng)驗回歸必過

(2)

都是估計值

(3)

與r符號相同.

(3)殘差作用:判斷回歸模型刻畫數(shù)據(jù)的效果;發(fā)現(xiàn)原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),對模型進行改進,使我們能根據(jù)改進模型作出更符合實際的預(yù)測與決策.

(2)分析殘差圖:

若殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適.這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報精度越高.4.回歸分析的流程

5.經(jīng)驗回歸方程的理解①只有在散點圖大致呈線性相關(guān)關(guān)系時,求出的經(jīng)驗回歸方程才有實際意義,否則求出的經(jīng)驗回歸方程毫無意義.②經(jīng)驗回歸方程一般都有時效性.③解釋變量的取值不能離樣本數(shù)據(jù)的范圍太遠.一般解釋變量的取值在樣本數(shù)據(jù)范圍內(nèi),經(jīng)驗回歸方程的預(yù)報效果會比較好④不能期望經(jīng)驗回歸方程得到的預(yù)報值就是響應(yīng)變量的精確值.它是響應(yīng)變量的可能取值的平均值.例1.人們常將男子短跑100m的高水平運動員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀錄產(chǎn)生的年份和世界紀錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀錄關(guān)于紀錄產(chǎn)生年份的經(jīng)驗回歸方程編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95以成對數(shù)據(jù)中的世界紀錄產(chǎn)生年份為橫坐標,世界紀錄為縱坐標作散點圖,得到下圖從散點看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經(jīng)驗回歸方程.根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為:思考1:從圖中可以看到,經(jīng)驗回歸方程較好地刻畫了散點的變化趨勢,請再仔細觀察圖形,你能看出其中存在的問題嗎?觀察:

第一個世界紀錄所對應(yīng)的散點遠離經(jīng)驗回歸直線,并且前后兩時間段中的散點都在經(jīng)驗回歸直線的上方,中間時間段的散點都在經(jīng)驗回歸直線的下方.說明散點并不是隨機分布在經(jīng)驗回歸直線的周圍,而是圍繞著經(jīng)驗回歸直線有一定的變化規(guī)律,即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.新知探究

一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相關(guān).P116思考:你能對模型進行修改,以使其更好地反映散點的分布特征嗎?

回顧已有的函數(shù)知識,可以發(fā)現(xiàn)函數(shù)y=-lnx的圖象具有類似的形狀特征.

注意到100m短跑的第一個世界紀錄產(chǎn)生于1896年,因此可以認為散點是集中在曲線y=f(t)=c1+c2ln(t-1895)的周圍,其中c1、c2為未知參數(shù),且c2<0.

思考3:用上述函數(shù)刻畫數(shù)據(jù)變化的趨勢,這是一個非線性經(jīng)驗回歸函數(shù),其中c1,c2是待定參數(shù),現(xiàn)在問題轉(zhuǎn)化為如何利用成對數(shù)據(jù)估計參數(shù)c1和c2。新知探究1:非線性關(guān)系的回歸模型思考2:散點更趨向于落在中間下凸且遞減的某條曲線附近.令x=ln(t-1895),則Y=c2x+c1對數(shù)據(jù)進行變化可得下表:編號12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄Y/s11.8010.6010.4010.3010.2010.1010.009.95得到散點圖由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為:上圖表明,經(jīng)驗回歸方程對于成對數(shù)據(jù)具有非常好的擬合精度.將經(jīng)驗回歸直線疊加到散點圖,得到下圖:將x=ln(t-1895)代入:

思考4:對于通過創(chuàng)紀錄時間預(yù)報世界紀錄的問題,我們建立了兩個回歸模型,得到了兩個回歸方程,你能判斷哪個回歸方程擬合的精度更好嗎?

思考4:對于通過創(chuàng)紀錄時間預(yù)報世界紀錄的問題,我們建立了兩個回歸模型,得到了兩個回歸方程,你能判斷哪個回歸方程擬合的精度更好嗎?①②(1)觀察法.在同一坐標系中畫出成對數(shù)據(jù)散點圖、非線性經(jīng)驗回歸方程②的圖象(藍色)以及經(jīng)驗回歸方程①的圖象(紅色).觀察發(fā)現(xiàn),散點圖中各散點都非??拷诘膱D象,表明非線性經(jīng)驗回歸方程②對于原始數(shù)據(jù)的擬合效果遠遠好于經(jīng)驗回歸方程①.(2)殘差分析法:殘差平方和越小,模型擬合效果越好.①②Q2明顯小于Q1,說明非線性回歸方程的擬合效果要優(yōu)于線性回歸方程.(3)利用決定系數(shù)R2刻畫回歸效果.R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型擬合效果越差.例1中:①和②的R2分別為0.7325和0.9983說明非線性回歸方程的擬合效果要優(yōu)于線性回歸方程探究:通過比較決定系數(shù)R2來比較兩個模型的效果.殘差平方和總偏差平方和(與回歸方程無關(guān))(與回歸方程有關(guān))深度理解——決定系數(shù)R2①R2越大,殘差平方和越小,模型擬合效果越好.②樣本相關(guān)系數(shù)r刻畫線性相關(guān)關(guān)系的正負和強弱;

決定系數(shù)R2刻畫模型擬合效果的好壞.③在含有1個解釋變量的線性模型中,R2=r2.另外,還可以用相關(guān)指數(shù)R2來刻畫回歸的效果計算公式為(2)R2取值越大,意味著殘差平方和越小,表示回歸的效果越好。R2越小,表示殘差平方和越大,即模型擬合效果越差.(事實上,R2越接近于1,表示解釋變量和預(yù)報變量的線性相關(guān)性越強,故效果越好).

(1)R2表示解釋變量對預(yù)報變量變化的貢獻率;

體重與身高例子中,R2=0.64,這表明“女大學(xué)生的體重差異有64%是由身高引起的”(其余0.36為殘差變量引起的)(3)樣本相關(guān)系數(shù)r刻畫線性相關(guān)關(guān)系的正負和強弱;決定系數(shù)R2刻畫模型擬合效果的好壞.在含有1個解釋變量的線性模型中,R2=r2.故選D.例2.某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費x;和年銷售量數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.(1)根據(jù)散點圖判斷,

哪一個適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型?(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為

.根據(jù)(2)的結(jié)果回答下列問題:年宣傳費

時,年銷售量及年利潤的預(yù)測值是多少?年宣傳費x為何值時,年利潤的預(yù)測值最大?【解】(1)根據(jù)散點圖可以看出這些點在曲線上,所以

宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型;所以立y關(guān)于x的回歸方程為選變量

解:年宣傳費x(單位:千元)對年銷售量y(單位:t)畫(分析)散點圖假設(shè)線性回歸方程為:

選模型還原回歸方程分析和預(yù)測估計參數(shù)由換元法變?yōu)榫€性關(guān)系

探索新知一元非線性回歸模型非線性回歸問題的處理方法(1)兩個變量不呈線性關(guān)系,不能直接利用線性回歸方程建立兩個變量的關(guān)系,可以通過變換的方法轉(zhuǎn)化為線性回歸模型,如y=,我們可以通過對數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系.令z=lny,則變換后樣本點應(yīng)該分布在直線z=bx+a(a=lnc1,b=c2)的周圍.方法技巧總結(jié)(2)非線性回歸方程的求法①根據(jù)原始數(shù)據(jù)(x,y)作出散點圖;②根據(jù)散點圖,選擇恰當(dāng)?shù)臄M合函數(shù);③作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程;④在③的基礎(chǔ)上通過相應(yīng)的變換,即可得非線性回歸方程.(3)非線性相關(guān)問題中常見的幾種線性變換在實際問題中,常常要根據(jù)一批實驗數(shù)據(jù)繪出曲線,當(dāng)曲線類型不具備線性相關(guān)關(guān)系時,可以根據(jù)散點分布的形狀與已知函數(shù)的圖象進行比較,確定曲線的類型,再作變量替換,將曲線改為直線.探究:非線性關(guān)系的回歸模型(1)y=a+,令t=,則有y=a+bt;(2)y=axb,令z=lny,t=lnx,m=lna,則有z=m+bt;(3)y=aebx,令z=lny,m=lna,則有z=m+bt;(4)y=,令z=lny,t=

,m=lna,則有z=m+bt;(5)y=a+blnx,令t=lnx,則有z=a+bt;(6)y=bx2+a,令t=x2,則有y=bt+a.下面是幾種容易通過變量替換轉(zhuǎn)化為直線的函數(shù)模型:思想:變換為線性回歸模型x24568y3040605070x24568y3040605070-0.5-3.510-6.50.5-20-1010020解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論