




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
8.2.1一元線性回歸模型及其參數(shù)的最小二乘估計人教A版2019必修第三冊1.樣本相關(guān)系數(shù):2.相關(guān)系數(shù)的性質(zhì):①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).②|r|≤1;③當(dāng)|r|越接近1時,成對數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)|r|越接近0時,成對數(shù)據(jù)的線性相關(guān)程度越弱;特別地,當(dāng)|r|=0時,成對數(shù)據(jù)的沒有線性相關(guān)關(guān)系;當(dāng)|r|=1時,成對數(shù)據(jù)都落在一條直線上.通過前面的學(xué)習(xí)我們已經(jīng)了解到,根據(jù)成對樣本數(shù)據(jù)的散點(diǎn)圖和樣本相關(guān)系數(shù),可以推斷兩個變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān),以及線性相關(guān)程度的強(qiáng)弱等.進(jìn)一步地,如果能像建立函數(shù)模型刻畫兩個變量之間的確定性關(guān)系那樣,通過建立適當(dāng)?shù)慕y(tǒng)計模型刻畫兩個隨機(jī)變量的相關(guān)關(guān)系,那么我們就可以利用這個模型研究兩個變量之間的隨機(jī)關(guān)系,并通過模型進(jìn)行預(yù)測.下面我們研究當(dāng)兩個變量線性相關(guān)時,如何利用成對樣本數(shù)據(jù)建立統(tǒng)計模型,并利用模型進(jìn)行預(yù)測的問題.問題1:生活經(jīng)驗告訴我們,兒子的身高與父親的身高相關(guān).一般來說,父親的身高較高時,兒子的身高通常也較高.為了進(jìn)一步研究兩者之間的關(guān)系,有人調(diào)查了14名男大學(xué)生的身高及其父親的身高,得到的數(shù)據(jù)如表1所示.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182可以發(fā)現(xiàn),散點(diǎn)大致分布在一條從左下角到右上角的直線附近,表明兒子身高和父親身高線性相關(guān).利用統(tǒng)計軟件,求得樣本相關(guān)系數(shù)為r≈0.886,表明兒子身高和父親身高正線性相關(guān),且相關(guān)程度較高。
問題2:根據(jù)表中的數(shù)據(jù),兒子身高和父親身高這兩個變量之間的關(guān)系可以用函數(shù)模型刻畫嗎?列表法是函數(shù)的一種表示方法,但并不是所有列表表示的數(shù)據(jù)都是函數(shù)關(guān)系,要成為函數(shù)關(guān)系必須滿足函數(shù)的定義,即應(yīng)滿足“集合A中的任意一個數(shù),在集合B中都存在唯一的數(shù)與它對應(yīng)”.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182表中的數(shù)據(jù),存在父親身高相同而兒子身高不同的情況.例如,第6個和第8個觀測父親的身高均為172cm,而對應(yīng)的兒子的身高為176cm和174cm;同樣在第3,4個觀測中,兒子的身高都是170cm,而父親的身高分別為173cm,169cm.可見兒子的身高不是父親身高的函數(shù)同樣父親的身高也不是兒子身高的函數(shù),所以不能用函數(shù)模型來刻畫.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182問題3:從成對樣本數(shù)據(jù)的散點(diǎn)圖和樣本相關(guān)系數(shù)可以發(fā)現(xiàn),散點(diǎn)大致分布在一條直線附近表明兒子身高和父親身高有較強(qiáng)的線性關(guān)系.我們可以這樣理解,由于有其他因素的存在,使兒子身高和父親身高有關(guān)系但不是函數(shù)關(guān)系.那么影響兒子身高的其他因素是什么?影響兒子身高的因素除父親的身外,還有母親的身高、生活的環(huán)境、飲食習(xí)慣、營養(yǎng)水平、體育鍛煉等隨機(jī)的因素,兒子身高是父親身高的函數(shù)的原因是存在這些隨機(jī)的因素.
問題4:由問題3我們知道,正是因為存在這些隨機(jī)的因素,使得兒子的身高呈現(xiàn)出隨機(jī)性各種隨機(jī)因素都是獨(dú)立的,有些因素又無法量化.你能否考慮到這些隨機(jī)因素的作用,用類似于函數(shù)的表達(dá)式,表示兒子身高與父親身高的關(guān)系嗎?如果用x表示父親身高,Y表示兒子的身高,用e表示各種其他隨機(jī)因素影響之和,稱e為隨機(jī)誤差,由于兒子身高與父親身高線性相關(guān),所以Y=bx+a.Y=bx+a+e.
追問1:為什么要假設(shè)E(e)=0,而不假設(shè)其為某個不為0的常數(shù)?因為誤差是隨機(jī)的,即取各種正負(fù)誤差的可能性一樣,所以它們均值的理想狀態(tài)應(yīng)該為0.
若用x表示父親身高,Y表示兒子身高,e表示隨機(jī)誤差.假定隨機(jī)誤差e的均值為0,方差為與父親身高無關(guān)的定值σ2,則它們之間的關(guān)系可以表示為我們稱(1)式為Y關(guān)于x的一元線性回歸模型.其中,Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.模型中的Y也是隨機(jī)變量,其值雖不能由變量x的值確定,但卻能表示為bx+a與e的和,前一部分由x所確定,后一部分是隨機(jī)的.如果e=0,那么Y與x之間的關(guān)系就可用一元線性函數(shù)模型來描述.你能結(jié)合父親與兒子身高的實例,說明回歸模型(1)的意義?
對于父親身高為xi的某一名男大學(xué)生,他的身高yi一定是bxi+a嗎?課堂練習(xí)(課本P107)解:不能.一是父親的身高與兒子的身高之間是隨機(jī)關(guān)系,不是函數(shù)關(guān)系;二是這組數(shù)據(jù)僅是總體的一個樣本,不一定能很好地描述兩個變量之間的關(guān)系.3.將圖8.2-1中的點(diǎn)按父親身高的大小次序用折線連起來,所得到的圖象是一個折線圖,可以用這條折線表示兒子身高和父親身高之間的關(guān)系嗎?在一元線性回歸模型中,表達(dá)式Y(jié)=bx+a+e刻畫的是變量Y與變量x之間的線性相關(guān)關(guān)系,其中參數(shù)a和b未知,需要根據(jù)成對樣本數(shù)據(jù)進(jìn)行估計.由模型的建立過程可知,參數(shù)a和b刻畫了變量Y與變量x的線性關(guān)系,因此通過成對樣本數(shù)據(jù)估計這兩個參數(shù),相當(dāng)于尋找一條適當(dāng)?shù)闹本€,使表示成對樣本數(shù)據(jù)的這些散點(diǎn)在整體上與這條直線最接近.探究利用散點(diǎn)圖找出一條直線,使各散點(diǎn)在整體上與此直線盡可能接近.方法一:采用測量的方法,先畫出一條直線,測量出各點(diǎn)與它的距離,然后移動直線,到達(dá)一個使距離的和最小的位置.然后測量出此時的斜率和截距,就可得到一條直線,如圖(1)所示.方法二:在圖中選擇這樣的兩點(diǎn)畫直線,使得直線兩側(cè)的點(diǎn)的個數(shù)基本相同,把這條直線作為所求直線,如圖(2)所示.方法三:在散點(diǎn)圖中多取幾對點(diǎn),確定出幾條直線的方程,再分別求出這些直線的斜率、截距的平均數(shù),將這兩個平均數(shù)作為所求直線的斜率和截距,如圖(3)所示.上面這些方法雖然有一定的道理,但比較難操作,我們需要另辟蹊徑.先進(jìn)一步明確我們面臨的任務(wù):從成對樣本數(shù)據(jù)出發(fā),用數(shù)學(xué)的方法刻畫“從整體上看,各散點(diǎn)與直線最接近”.通常,我們會想到利用點(diǎn)到直線y=bx+a的“距離”來刻畫散點(diǎn)與該直線的接近程度,然后用所有“距離”之和刻畫所有樣本觀測數(shù)據(jù)與該直線的接近程度.設(shè)滿足一元線性回歸模型的兩個變量的n對樣本數(shù)據(jù)為(x1,
y1),(x2,
y2),???,(xn,
yn),由yi=bxi+a+ei(i=1,2,???,n),得顯然|ei|越小,表示點(diǎn)(xi,
yi)與點(diǎn)(xi,
bxi+a)的“距離”越小,即樣本數(shù)據(jù)點(diǎn)離直線y=bx+a的豎直距離越小,如右圖所示.特別地,當(dāng)ei=0時,表示點(diǎn)(xi,
yi)在這條直線上.因此,可以用這n個豎直距離之和來刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”.在實際應(yīng)用中,因為絕對值使得計算不方便,所以人們通常用各散點(diǎn)到直線的豎直距離的平方之和來刻畫“整體接近程度”.求a,b的值,使Q(a,b)最小殘差平方和:殘差:實際值與估計值之間的差值,即思考:如何求a,b的值,使
最小?記注意到所以當(dāng)取最小值時,取最小值0,即.此時上式是關(guān)于b的二次函數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)b的取值為綜上,當(dāng)a,b的取值為
時,Q達(dá)到最小.易得:(1)經(jīng)驗回歸直線必過樣本中心;(2)與相關(guān)系數(shù)r符號相同.我們將稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線,這種求經(jīng)驗回歸方程的方法叫最小二乘法,求得的,叫做b,a的最小二乘估計.經(jīng)驗回歸方程與最小二乘估計:編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182對于上表中的數(shù)據(jù),利用公式(2)可以計算出
得到兒子身高Y關(guān)于父親身高x的經(jīng)驗回歸方程為
相應(yīng)的經(jīng)驗回歸直線如下圖所示.商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345
例1
某連鎖經(jīng)營公司所屬5個零售店某月的銷售額和利潤額資料如下表:(1)畫出銷售額和利潤額的散點(diǎn)圖;(2)計算利潤額y對銷售額x的經(jīng)驗回歸直線方程.解:(1)散點(diǎn)圖如下:∴所求經(jīng)驗回歸方程為解1:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345∴所求經(jīng)驗回歸方程為解2:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345求經(jīng)驗回歸方程的步驟:思考1
已知兒子身高關(guān)于父親身高x的經(jīng)驗回歸方程為
如果一位父親的身高為176cm,他兒子長大成人后的身高一定是177cm嗎?為什么?顯然不一定,因為還有其他影響兒子身高的因素,父親身高不能完全決定兒子身高.不過,我們可以作出推測,當(dāng)父親身高為176cm時,兒子身高一般在177cm左右.實際上,如果把這所學(xué)校父親身高為176cm的所有兒子身高作為一個子總體,那么177cm是這個子總體的均值的估計值.這里的經(jīng)驗回歸方程其斜率可以解釋為父親身高每增加1cm,其兒子身高平均增加0.839cm.分析模型還可以發(fā)現(xiàn),高個子父親有生高個子兒子的趨勢,但一群高個子父親的兒子們的平均身高要低于父親們的平均身高,例如x=185(cm),則
=184.172(cm).矮個子父親有生矮個子兒子的趨勢,但一群矮個子父親的兒子們的平均身高要高于父親們的平均身高,例如x=170(cm),則
=171.587(cm).對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗回歸方程得到的)稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.殘差是隨機(jī)誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.殘差分析:例如,對于下表中的第6個觀測,父親身高為172cm,其兒子身高的觀測值為y6=176(cm),預(yù)測值為殘差為176-173.265=2.735(cm).編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182類似地,我們還可以得到其他的殘差,如下表所示.編號父親身高/cm兒子身高觀測值/cm兒子身高預(yù)測值/cm殘差/cm1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.1041316416566.553-1.55314180182179.9772.023為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標(biāo),殘差作為縱坐標(biāo),可以畫出殘差圖,如圖下所示.殘差圖:012345-1-2-3-4-5160165170175180185殘差/cm父親身高/cm??????????????觀察殘差的散點(diǎn)圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,是均值為0、方差為σ2的隨機(jī)變量的觀測值.可見,通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型的假設(shè).思考2觀察下列四幅殘差圖,你認(rèn)為哪一個殘差滿足一元線性回歸模型中對隨機(jī)誤差的假定?通過觀察發(fā)現(xiàn),圖(4)的殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi).所以在四幅殘差圖中,只有圖(4)滿足一元線性回歸模型對隨機(jī)誤差的假設(shè).課堂小結(jié):1.經(jīng)驗回歸方程:我們將
稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法.2.最小二乘估計:經(jīng)驗回歸方程中的參數(shù)計算公式為:
課堂練習(xí)(課本P113)∴估計女兒的身高為168cm左右.2.假如女兒身高y(單位:cm)關(guān)于父親身高x(單位:cm)的經(jīng)驗回歸方程為
已知父親身高為175cm,請估計女兒的身高.解:解:5.假設(shè)變量x與變量Y的n對觀測數(shù)據(jù)為(x1,
y1),(x2,
y2),???,(xn,yn),兩個變量滿足一元線性回歸模型請寫出參數(shù)b的最小二乘估計.則Q是關(guān)于b的二次函數(shù).要使Q小值,當(dāng)且僅當(dāng)b的取值為THANKS“”大本習(xí)題講解A.變量x,y之間呈負(fù)相關(guān)關(guān)系B.m=4C.可以預(yù)測,當(dāng)x=11時,y約為2.6D.由表格數(shù)據(jù)知,該經(jīng)驗回歸直線必過點(diǎn)(9,4)ACDx681012y6M32故x,y呈負(fù)相關(guān)關(guān)系,則A正確.解得m=5,B錯誤.當(dāng)x=11時,y的預(yù)測值為2.6,故C正確.例2
某地隨著經(jīng)濟(jì)的發(fā)展,居民收入逐年增長,該地一銀行連續(xù)五年年底的儲蓄存款情況如下表所示.題型二求經(jīng)驗回歸方程年份x20182019202020212022儲蓄存款額y/千億元567810為了計算方便,工作人員將上表的數(shù)據(jù)進(jìn)行了處理,令t=x-2017,z=y(tǒng)-5,得到下表.t12345z01235(1)作z關(guān)于t的散點(diǎn)圖,求z關(guān)于t的經(jīng)驗回歸方程;解作散點(diǎn)圖,直觀看z與t具有線性相關(guān)關(guān)系.根據(jù)z關(guān)于t的表格數(shù)據(jù),得(2)通過(1)中的方程,求出y關(guān)于x的回歸方程.習(xí)題講解
——分層精練A.勞動生產(chǎn)率為1000元時,工人工資為130元B.勞動生產(chǎn)率提高1000元時,工人工資平均提高80元C.勞動生產(chǎn)率提高1000元時,工人工資平均提高130元D.當(dāng)月工資為250元時,勞動生產(chǎn)率為2000元B解析因為經(jīng)驗回歸直線的斜率為80,所以x每增加1,y平均增加80,即勞動生產(chǎn)率提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人保險理賠授權(quán)委托書
- 單次包車合同范本
- 口罩委托采購合同范本
- 獸藥代理合同范本
- 世界水日活動策劃方案
- 下學(xué)期幼兒教師的個人總結(jié)
- 推拿治療學(xué)模擬題+答案
- 別墅建設(shè)合同范本
- 勞務(wù)合同補(bǔ)充合同范本
- 發(fā)光字安裝合同范本
- 履約專項檢查表
- 人教版數(shù)學(xué)四年級下冊第一單元測試卷
- 模具保養(yǎng)記錄表
- 2023國家自然科學(xué)基金申請書
- 蜂膠表彰會中宏全國通用版模板課件
- 原始狩獵圖 (2)
- 《色彩構(gòu)成——色彩基礎(chǔ)知識》PPT課件
- 綠色建筑及材料分析及案列
- 鍍層的結(jié)合力
- 霍尼韋爾DDC編程軟件(CARE)簡介
- 實用中西醫(yī)結(jié)合診斷治療學(xué)
評論
0/150
提交評論