版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.2一元線性回歸模型及其應(yīng)用8.2.2一元線性回歸模型參數(shù)的最小二乘估計復習回顧1、經(jīng)驗回歸方程:
我們將稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.
這種求經(jīng)驗回歸方程的方法叫做最小二乘法.2、最小二乘估計:經(jīng)驗回歸方程中的參數(shù)
計算公式為:例題解析1、經(jīng)驗表明,對于同一樹種,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預測樹高.在研究樹高與胸徑之間的關(guān)系時,某林場收集了某種樹的一些數(shù)據(jù)如下表所示,試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗回歸方程.編號123456789101112胸徑/cm18.120.122.224.426.028.329.632.433.735.738.340.2樹高/m18.819.221.021.022.122.122.422.623.024.323.924.7解:以胸徑為橫坐標,樹高為縱坐標作散點圖
在右圖中,散點大致分布在一條從左下角到右上角的直線附近,表明兩個變量線性相關(guān),并且是正相關(guān),因此可以用一元線性回歸模型刻畫樹高與胸徑之間的關(guān)系.一元線性回歸模型的應(yīng)用例題解析1、經(jīng)驗表明,對于同一樹種,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預測樹高.在研究樹高與胸徑之間的關(guān)系時,某林場收集了某種樹的一些數(shù)據(jù)如下表所示,試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗回歸方程.編號123456789101112胸徑/cm18.120.122.224.426.028.329.632.433.735.738.340.2樹高/m18.819.221.021.022.122.122.422.623.024.323.924.7解:用d表示胸徑,h表示樹高,根據(jù)據(jù)最小二乘法,計算可得經(jīng)驗回歸方程為:相應(yīng)的經(jīng)驗回歸直線如圖所示.一元線性回歸模型的應(yīng)用例題解析殘差分析:根據(jù)經(jīng)驗回歸方程,由胸徑的數(shù)據(jù)可以計算出樹高的預測值(精確到0.1)以及相應(yīng)的殘差,如下表所示.一元線性回歸模型的應(yīng)用編號胸徑/cm樹高觀測值/m樹高預測值/m殘差/m118.118.819.4-0.6220.119.219.9-0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9-0.3933.723.023.2-0.21035.724.323.70.61138.323.924.4-0.51240.224.724.9-0.2例題解析以胸徑為橫坐標,殘差為縱坐標,作殘差圖,得到下圖.一元線性回歸模型的應(yīng)用30252015-1.0-0.50.00.51.0·······殘差/m·····354045胸徑/cm觀察殘差表和殘差圖,可以看到殘差的絕對值最大是0.8,所有殘差分布在以橫軸為對稱軸、寬度小于2的帶狀區(qū)域內(nèi).可見經(jīng)驗回歸方程較好地刻畫了樹高與胸徑的關(guān)系,我們可以根據(jù)經(jīng)驗回歸方程由胸徑預測樹高.例題解析2、人們常將男子短跑100m的高水平運動員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀錄產(chǎn)生的年份和世界紀錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀錄關(guān)于紀錄產(chǎn)生年份的經(jīng)驗回歸方程一元線性回歸模型的應(yīng)用編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95解:以成對數(shù)據(jù)中的世界紀錄產(chǎn)生年份為橫坐標,世界紀錄為縱坐標作散點圖,得到下圖
在左圖中,散點看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經(jīng)驗回歸方程.例題解析2、人們常將男子短跑100m的高水平運動員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀錄產(chǎn)生的年份和世界紀錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀錄關(guān)于紀錄產(chǎn)生年份的經(jīng)驗回歸方程一元線性回歸模型的應(yīng)用編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95解:用Y表示男子短跑100m的世界紀錄,t表示紀錄產(chǎn)生的年份,利用一元線性回歸模型來刻畫世界紀錄和世界紀錄產(chǎn)生年份之間的關(guān)系.根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為:
將經(jīng)驗回歸直線疊加到散點圖,得到下圖:從圖中可以看到,經(jīng)驗回歸方程較好地刻畫了散點的變化趨勢,請再仔細觀察圖形,你能看出其中存在的問題嗎自主探究思考1:從圖中可以看到,經(jīng)驗回歸方程較好地刻畫了散點的變化趨勢,請再仔細觀察圖形,你能看出其中存在的問題嗎
第一個世界紀錄所對應(yīng)的散點遠離經(jīng)驗回歸直線,并且前后兩時間段中的散點都在經(jīng)驗回歸直線的上方,中間時間段的散點都在經(jīng)驗回歸直線的下方.
這說明散點并不是隨機分布在經(jīng)驗回歸直線的周圍,而是圍繞著經(jīng)驗回歸直線有一定的變化規(guī)律,即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.自主探究思考2:你能對模型進行修改,以使其更好地反映散點的分布特征嗎?仔細觀察右圖,可以發(fā)現(xiàn)散點更趨向于落在中間下凸且遞減的某條曲線附近.回顧已有的函數(shù)知識,可以發(fā)現(xiàn)函數(shù)y=-lnx的圖象具有類似的形狀特征
注意到100m短跑的第一個世界紀錄產(chǎn)生于1896年,因此可以認為散點是集中在曲線y=f(t)=c1+c2ln(t-1895)的周圍,其中c1、c2為未知參數(shù),且c2<0.自主探究思考3:這是一個非線性經(jīng)驗回歸函數(shù),如何利用成對數(shù)據(jù)估計參數(shù)c1、c2y=f(t)=c1+c2ln(t-1895)為了利用一元線性回歸模型估計參數(shù)參數(shù)c1、c2,引進一個中間變量x,令x=ln(t-1895),則Y=c2x+c1.編號12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95通過x=ln(t-1895),將年份變量數(shù)據(jù)進行變換,得到新的成對數(shù)據(jù),如下表.自主探究得到散點圖如下:編號12345678x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為:在上圖中畫出經(jīng)驗回歸直線,如圖所示.上圖表明,經(jīng)驗回歸方程對于成對數(shù)據(jù)具有非常好的擬合精度.將x=ln(t-1895)代入:自主探究思考4:對于通過創(chuàng)紀錄時間預報世界紀錄的問題,我們建立了兩個回歸模型,得到了兩個回歸方程,你能判斷哪個回歸方程擬合的精度更好嗎?(1)直接觀察法:在同一坐標系中畫出成對數(shù)據(jù)散點圖、非線性經(jīng)驗回歸方程②的圖象(藍色)以及經(jīng)驗回歸方程①的圖象(紅色).我們發(fā)現(xiàn),散點圖中各散點都非??拷诘膱D象,表明非線性經(jīng)驗回歸方程②對于原始數(shù)據(jù)的擬合效果遠遠好于經(jīng)驗回歸方程①.自主探究思考4:對于通過創(chuàng)紀錄時間預報世界紀錄的問題,我們建立了兩個回歸模型,得到了兩個回歸方程,你能判斷哪個回歸方程擬合的精度更好嗎?(2)殘差分析:殘差平方和越小,模型擬合效果越好.殘差平方和:Q2明顯小于Q1,說明非線性回歸方程的擬合效果要優(yōu)于線性回歸方程.自主探究思考4:對于通過創(chuàng)紀錄時間預報世界紀錄的問題,我們建立了兩個回歸模型,得到了兩個回歸方程,你能判斷哪個回歸方程擬合的精度更好嗎?(3)利用決定系數(shù)R2刻畫回歸效果..R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型的擬合效果越差.①和②的R2分別為0.7325和0.9983顯然0≤R2≤1,R2越接近1,則線性回歸刻畫的效果越好.在一元線性回歸模型中R2=r2,即決定系數(shù)R2等于響應(yīng)變量與解釋變量的樣本相關(guān)系數(shù)r的平方.概念講解分析模型的回歸效果方法:(2)殘差平方和(1)殘差分析好的回歸方程對應(yīng)的殘差散點圖應(yīng)是均勻地分布在橫軸兩側(cè)的帶狀區(qū)域內(nèi).且?guī)顓^(qū)域越窄,說明模型擬合效果越好.列殘差表畫殘差圖(3)決定系數(shù)R2法殘差平方和越小,說明模型擬合效果越好.R2越大,說明模型擬合效果越好.概念講解建立線性回歸模型的基本步驟(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是響應(yīng)變量.(2)畫出解釋變量與響應(yīng)變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗確定回歸方程的類型.(4)按一定規(guī)則(如最小二乘法)估計經(jīng)驗回歸方程中的參數(shù).(5)得出結(jié)果后需進行線性回歸分析.①殘差平方和越小,模型的擬合效果越好.②決定系數(shù)R2取值越大,說明模型的擬合效果越好.注意:若題中給出了檢驗回歸方程是否理想的條件,則根據(jù)題意進行分析檢驗即可.概念講解解決非線性回歸問題的方法及步驟(1)確定變量:確定解釋變量為x,響應(yīng)變量為y;(2)畫散點圖:通過觀察散點圖并與學過的函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、二次函數(shù)、反比例函數(shù)等)作比較,選取擬合效果好的函數(shù)模型;(3)變量置換:通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題;(4)分析擬合效果:通過計算決定系數(shù)來判斷擬合效果;(5)寫出非線性經(jīng)驗回歸方程.隨堂練習1、一只藥用昆蟲的產(chǎn)卵數(shù)y與一定范圍內(nèi)的溫度x有關(guān),現(xiàn)收集了6組觀測數(shù)據(jù)列于表中:溫度x/℃212324272932產(chǎn)卵數(shù)y/個61120275777經(jīng)計算得:線性回歸殘差的平方和:其中xi、yi分別為觀測數(shù)據(jù)中的溫度和產(chǎn)卵數(shù),i=1,2,3,4,5,6.e8.0605≈3167(1)若用線性回歸模型擬合,求y關(guān)于x的回歸方程
(精確到0.1);(2)若用非線性回歸模型擬合,求得y關(guān)于x回歸方程為
,且決定系數(shù)R2=0.9522.②用擬合效果好的模型預測溫度為35℃時該種藥用昆蟲的產(chǎn)卵數(shù).(結(jié)果取整數(shù)).①試與(1)中的線性回歸模型相比較,用R2說明哪種模型的擬合效果更好隨堂練習解:(1)由題意得,n=6,所以y關(guān)于x的經(jīng)驗回歸方程為(2)①對于線性回歸模型,相關(guān)系數(shù)∵0.9398<0.9522∴非線性回歸模型的回歸方程比線性回歸方程為
擬合的擬合效果更好
隨堂練習(2)②由①知擬合效果好的模型為所以當x=35時,所以預測溫度為35℃時該種藥用昆蟲的產(chǎn)卵數(shù)為190個.概念講解在使用經(jīng)驗回歸方程進行預測時,需注意以下問題1、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有時效性;3、解釋變量的取值范圍不能離開樣本數(shù)據(jù)的范圍太遠.樣本采集的范圍會影響回歸方程的適用范圍;4、不能期望回歸方程得到的預報值就是預報變量的精確值.事實上,它是預報變量的可取值的平均值.課堂小結(jié)1、殘差平方和:2、最小二乘法將稱為Y關(guān)于x的經(jīng)驗回歸方程.3、判斷模型擬合的效果:①殘差分析②決定系數(shù)R2法R2越大,表示
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《行政職業(yè)能力測驗》2024年公務(wù)員考試阿克陶縣預測試卷含解析
- Unitech數(shù)據(jù)采集器PA690產(chǎn)品介紹
- 第16課 毛澤東開辟井岡山道路(解析版)
- 2024年體育個人工作總結(jié)
- 《特斯拉電動汽車》課件
- 新聞業(yè)的變革與挑戰(zhàn)
- 保險公司人事工作總結(jié)
- 《水利工程質(zhì)量管理》課件
- 2023-2024年項目部安全管理人員安全培訓考試題及參考答案【A卷】
- 保護瀕危動物宣傳方案萬能2022
- 八年級歷史期末考試試卷質(zhì)量分析試卷分析
- 煙草專業(yè)個人簡歷模板
- 【機械手】-YAMAHA機械手手持編程說明
- 體育集體備課記錄
- 五年級語文備課組工作總結(jié)三篇
- 三年級道德與法治下冊第一單元我和我的同伴教材解讀新人教版
- 社區(qū)工作者考試考前必背300題
- GB/T 6478-2015冷鐓和冷擠壓用鋼
- QC成果降低AS系統(tǒng)的故障次數(shù)
- GB/T 22528-2008文物保護單位開放服務(wù)規(guī)范
- GB/T 20078-2006銅和銅合金鍛件
評論
0/150
提交評論