




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
3.1回歸分析的基本(jīběn)思想及其初步應(yīng)用高二數(shù)學(xué)(shùxué)選修2-3第一頁,共25頁。問題1:正方形的面積y與正方形的邊長x之間的函數(shù)(hánshù)關(guān)系是y=x2確定性關(guān)系問題2:某水田(shuǐtián)水稻產(chǎn)量y與施肥量x之間是否有一個確定性的關(guān)系?例如:在7塊并排、形狀大小相同的試驗田上進(jìn)行施肥量對水稻產(chǎn)量影響(yǐngxiǎng)的試驗,得到如下所示的一組數(shù)據(jù):施化肥量x15202530354045水稻產(chǎn)量y330345365405445450455復(fù)習(xí)變量之間的兩種關(guān)系第二頁,共25頁。1020304050500450400350300·······施化肥量x15202530354045水稻產(chǎn)量y330345365405445450455xy施化肥(huàféi)量水稻(shuǐdào)產(chǎn)量第三頁,共25頁。自變量取值一定(yīdìng)時,因變量的取值帶有一定(yīdìng)隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系。1、定義(dìngyì):1):相關(guān)關(guān)系(guānxì)是一種不確定性關(guān)系(guānxì);注對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法叫回歸分析。2):第四頁,共25頁?,F(xiàn)實生活中存在著大量的相關(guān)(xiāngguān)關(guān)系。如:人的身高與年齡;產(chǎn)品的成本與生產(chǎn)數(shù)量;商品的銷售額與廣告費;家庭的支出與收入。等等探索:水稻產(chǎn)量y與施肥量x之間大致(dàzhì)有何規(guī)律?第五頁,共25頁。1020304050500450400350300·······發(fā)現(xiàn):圖中各點,大致分布(fēnbù)在某條直線附近。探索2:在這些點附近可畫直線不止一條(yītiáo),哪條直線最能代表x與y之間的關(guān)系呢?施化肥量x15202530354045水稻產(chǎn)量y330345365405445450455xy散點圖施化肥(huàféi)量水稻產(chǎn)量第六頁,共25頁。探究(tànjiū)對于一組具有(jùyǒu)線性相關(guān)關(guān)系的數(shù)據(jù)我們知道其回歸方程的截距和斜率的最小二乘估計公式(gōngshì)分別為:稱為樣本點的中心。第七頁,共25頁。1、所求直線(zhíxiàn)方程叫做回歸直線(zhíxiàn)方程;相應(yīng)的直線(zhíxiàn)叫做回歸直線(zhíxiàn)。2、對兩個變量(biànliàng)進(jìn)行的線性分析叫做線性回歸分析。1、回歸(huíguī)直線方程第八頁,共25頁。2、求回歸直線(zhíxiàn)方程的步驟:(3)代入公式(4)寫出直線方程為y=bx+a,即為所求的回歸直線方程。^第九頁,共25頁。例1、觀察兩相關(guān)(xiāngguān)量得如下數(shù)據(jù):x-1-2-3-4-553421y-9-7-5-3-115379求兩變量(biànliàng)間的回歸方程.解:列表(lièbiǎo):i12345678910xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi9141512551512149第十頁,共25頁。所求回歸直線(zhíxiàn)方程為第十一頁,共25頁。假設(shè)隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上。但是,在圖中,數(shù)據(jù)點并沒有完全落在回歸直線上。這些(zhèxiē)點散布在回歸直線附近。那么,數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異
是隨機誤差的效應(yīng),稱為殘差。第十二頁,共25頁。表3-2列出了女大學(xué)生身高(shēnɡāo)和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我們(wǒmen)可以利用圖形來分析殘差特性,作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖。3、殘差分析(fēnxī):第十三頁,共25頁。殘差圖的制作及作用1、坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;2、若模型選擇的正確,殘差圖中的點應(yīng)該(yīnggāi)分布在以橫軸為心的帶形區(qū)域;3、對于遠(yuǎn)離橫軸的點,要特別注意。身高與體重殘差圖異常點錯誤數(shù)據(jù)模型問題第十四頁,共25頁。表3-2列出了女大學(xué)生身高(shēnɡāo)和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382(一)我們可以利用(lìyòng)圖形來分析殘差特性,作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖。3、殘差分析(fēnxī):(二)第十五頁,共25頁。例2在一段時間內(nèi),某中商品(shāngpǐn)的價格x元和需求量Y件之間的一組數(shù)據(jù)為:求出Y對的回歸直線(zhíxiàn)方程,并說明擬合效果的好壞。價格x1416182022需求量Y1210753列出殘差表為0.994因而(yīnér),擬合效果較好。00.3-0.4-0.10.24.62.6-0.4-2.4-4.4第十六頁,共25頁。例3關(guān)于x與y有如下數(shù)據(jù):
有如下的兩個線性模型:(1);(2)試比較哪一個(yīɡè)擬合效果更好。x24568y3040605070第十七頁,共25頁。7、一般地,建立(jiànlì)回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解析變量,哪個變量是預(yù)報變量。(2)畫出確定好的解析變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等)。(3)由經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程y=bx+a).(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法)。(5)得出結(jié)果后分析殘差圖是否有異常(個別數(shù)據(jù)對應(yīng)殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性,等等),過存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。第十八頁,共25頁。什么是回歸(huíguī)分析?
(內(nèi)容)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測(yùcè)或控制另一個特定變量的取值,并給出這種預(yù)測(yùcè)或控制的精確程度第十九頁,共25頁?;貧w分析(fēnxī)與相關(guān)分析(fēnxī)的區(qū)別相關(guān)分析中,變量x變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機變量;回歸分析中,因變量y是隨機變量,自變量x可以是隨機變量,也可以是非(shìfēi)隨機的確定變量相關(guān)分析主要是描述兩個變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測和控制第二十頁,共25頁。例3、煉鋼是一個氧化降碳的過程,鋼水含碳量的多少直接影響冶煉時間的長短,必須掌握鋼水含碳量和冶煉時間的關(guān)系。如果已測得爐料(lúliào)熔化完畢時,鋼水的含碳量x與冶煉時間y(從爐料(lúliào)熔化完畢到出剛的時間)的一列數(shù)據(jù),如下表所示:x(0.01%)104180190177147134150191204121y(min)100200210185155135170205235125(1)y與x是否具有線性相關(guān)關(guān)系;(2)如果具有線性相關(guān)關(guān)系,求回歸直線方程;(3)預(yù)測(yùcè)當(dāng)鋼水含碳量為160個0.01%時,應(yīng)冶煉多少分鐘?第二十一頁,共25頁。如何描述兩個變量之間線性相關(guān)關(guān)系(guānxì)的強弱?在《數(shù)學(xué)(shùxué)3》中,我們學(xué)習(xí)了用相關(guān)系數(shù)r來衡量兩個變量之間線性相關(guān)關(guān)系的方法。相關(guān)系數(shù)rr>0正相關(guān);r<0負(fù)相關(guān)。通常,r>0.75或r<-0.75認(rèn)為兩個(liǎnɡɡè)變量有很強的相關(guān)性.第二十二頁,共25頁。相關(guān)關(guān)系(guānxì)的測度
(相關(guān)系(guānxì)數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加第二十三頁,共25頁。(1)列出下表,并計算(jìsuàn)i12345678910xi104180190177147134150191204121y
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人支出月度計劃表
- 大健康產(chǎn)業(yè)創(chuàng)新發(fā)展模式研究與實踐
- 鋼平臺安全施工方案
- 跨部門協(xié)作事務(wù)處理指南與文書流程
- 汽車后市場智能化服務(wù)解決方案
- 三農(nóng)村電子商務(wù)發(fā)展模式研究方案
- 初級母嬰護(hù)理師考試復(fù)習(xí)測試卷
- 婦產(chǎn)科護(hù)理練習(xí)試題及答案(一)
- 法律實務(wù)案例解析知識題
- 城市綠化與生態(tài)保護(hù)方案
- 基于單片機的電子廣告牌設(shè)計
- 應(yīng)用PDCA管理工具提高病案歸檔率
- 果蔬自發(fā)氣調(diào)包裝原理與應(yīng)用演示文稿
- DB43T 2428-2022 水利工程管理與保護(hù)范圍劃定技術(shù)規(guī)范
- SB/T 11016-2013足部保健按摩服務(wù)規(guī)范
- GB/T 4062-2013三氧化二銻
- 神經(jīng)系統(tǒng)的結(jié)構(gòu)與神經(jīng)調(diào)節(jié)的基本方式 【知識精講+高效備課】 高考生物一輪復(fù)習(xí) (新教材)
- GB/T 15328-2019普通V帶疲勞試驗方法無扭矩法
- 馬克思主義基本原理(完整版)
- 涉密人員脫密期管理制度
- 企業(yè)風(fēng)險管理-戰(zhàn)略與績效整合(中文版)
評論
0/150
提交評論