2025版一輪高考總復習數(shù)學第十章 第三節(jié)第1課時 變量間的相關(guān)關(guān)系及回歸模型_第1頁
2025版一輪高考總復習數(shù)學第十章 第三節(jié)第1課時 變量間的相關(guān)關(guān)系及回歸模型_第2頁
2025版一輪高考總復習數(shù)學第十章 第三節(jié)第1課時 變量間的相關(guān)關(guān)系及回歸模型_第3頁
2025版一輪高考總復習數(shù)學第十章 第三節(jié)第1課時 變量間的相關(guān)關(guān)系及回歸模型_第4頁
2025版一輪高考總復習數(shù)學第十章 第三節(jié)第1課時 變量間的相關(guān)關(guān)系及回歸模型_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三節(jié)成對數(shù)據(jù)的統(tǒng)計分析第1課時變量間的相關(guān)關(guān)系及回歸模型1.結(jié)合實例,了解樣本相關(guān)系數(shù)的統(tǒng)計含義,了解樣本相關(guān)系數(shù)與標準化數(shù)據(jù)向量夾角的關(guān)系.2.結(jié)合實例,會通過相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)性.3.結(jié)合具體實例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法.4.針對實際問題,會用一元線性回歸模型進行預測.1.變量的相關(guān)關(guān)系(1)相關(guān)關(guān)系:若兩個變量之間有關(guān)系,但又不是函數(shù)關(guān)系,這種關(guān)系稱為相關(guān)關(guān)系;(2)相關(guān)關(guān)系的分類:①從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)增加的趨勢,就稱這兩個變量;②當一個變量的值增加時,另一個變量的相應值呈現(xiàn)減小的趨勢,則稱這兩個變量;提醒注意相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別:函數(shù)關(guān)系是一種確定的關(guān)系,而相關(guān)關(guān)系是一種非確定的關(guān)系.(3)線性相關(guān):如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在附近,就稱這兩個變量線性相關(guān).2.樣本相關(guān)系數(shù)對于變量x和變量y,設經(jīng)過隨機抽樣獲得的成對樣本數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn),若x與y存在線性相關(guān)關(guān)系,可用樣本相關(guān)系數(shù)r定量分析它們的相關(guān)程度的強弱.(1)樣本相關(guān)系數(shù)r=∑i(2)樣本相關(guān)系數(shù)r的性質(zhì)①當r>0時,稱成對樣本數(shù)據(jù)相關(guān);當r<0時,稱成對樣本數(shù)據(jù)相關(guān);當r=0時,稱成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系;②樣本相關(guān)系數(shù)r的取值范圍為.當|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越;當|r|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越.3.一元線性回歸模型(1)經(jīng)驗回歸直線:從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做經(jīng)驗回歸直線;(2)經(jīng)驗回歸方程為y=bx+a,其中b=∑i=1n(xi-x)((3)通過求Q=∑i=1n(yi-bxi-a)2的最小值而得到經(jīng)驗回歸直線的方法,即使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小4.判斷回歸模型的擬合效果由成對樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n)按照最小二乘法得到經(jīng)驗回歸方程y=bx+a,其中y叫做觀測值,y叫做預測值,殘差e=y(tǒng)-y.相對于樣本點(xi,yi)的隨機誤差ei=y(tǒng)i-yi=y(tǒng)i-(bxi+a(1)殘差分析法①作殘差圖:作圖時縱坐標為,橫坐標可以選為樣本編號,或xi數(shù)據(jù),或yi數(shù)據(jù),這樣作出的圖形稱為殘差圖;②殘差分析:殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,經(jīng)驗回歸方程的預報精度越高.(2)決定系數(shù)(R2)法:R2=1-∑i=1n(yi-y1.判斷正誤.(正確的畫“√”,錯誤的畫“×”)(1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關(guān)關(guān)系.()(2)散點圖是判斷兩個變量相關(guān)關(guān)系的一種重要方法和手段.()(3)經(jīng)驗回歸直線y=bx+a至少經(jīng)過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點.()(4)樣本相關(guān)系數(shù)的絕對值越接近1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強.()2.兩個變量的相關(guān)關(guān)系有①正相關(guān),②負相關(guān),③不相關(guān),則下列散點圖從左到右分別反映的變量間的相關(guān)關(guān)系是()A.①②③ B.②③①C.②①③ D.①③②3.對于x,y兩變量,有四組成對樣本數(shù)據(jù),分別算出它們的樣本相關(guān)系數(shù)r如下,則線性相關(guān)性最強的是()A.-0.82 B.0.78C.-0.69 D.-0.874.在對兩個變量x,y進行回歸分析時有下列步驟:①對所求出的經(jīng)驗回歸方程作出解釋;②收集數(shù)據(jù)(xi,yi),i=1,2,…,n;③求經(jīng)驗回歸方程;④根據(jù)所收集的數(shù)據(jù)繪制散點圖.則下列操作順序正確的是()A.①②④③ B.③②④①C.②③①④ D.②④③①5.已知x,y的取值如下表,已知y與x具有線性相關(guān)關(guān)系,且經(jīng)驗回歸方程為y=0.95x+a,則a=.x0134y2.24.34.86.7變量間相關(guān)關(guān)系的判斷【例1】(1)某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統(tǒng)計表如下:月份123456人均銷售額658347利潤率(%)12.610.418.53.08.116.3根據(jù)表中數(shù)據(jù),下列說法正確的是()A.利潤率與人均銷售額成正比例函數(shù)關(guān)系 B.利潤率與人均銷售額成反比例函數(shù)關(guān)系C.利潤率與人均銷售額成正相關(guān)關(guān)系 D.利潤率與人均銷售額成負相關(guān)關(guān)系(2)已知變量x和y滿足關(guān)系y=-0.1x+1,變量y與z正相關(guān).下列結(jié)論中正確的是()A.x與y正相關(guān),x與z負相關(guān) B.x與y正相關(guān),x與z正相關(guān)C.x與y負相關(guān),x與z負相關(guān) D.x與y負相關(guān),x與z正相關(guān)聽課記錄解題技法判定兩個變量相關(guān)性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,兩個變量負相關(guān);(2)樣本相關(guān)系數(shù):當r>0時,正相關(guān);當r<0時,負相關(guān);|r|越接近于1,相關(guān)性越強;(3)經(jīng)驗回歸方程:當b>0時,正相關(guān);當b<0時,負相關(guān).1.下列關(guān)系不屬于相關(guān)關(guān)系的是()A.森林中的同一類樹木,其橫截面直徑與高度之間的關(guān)系B.球的體積與表面積的關(guān)系C.父母的身高與子女身高的關(guān)系D.人的身高與體重的關(guān)系2.對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3樣本相關(guān)系數(shù)【例2】(2022·全國乙卷19題)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數(shù)據(jù):樣本號i12345678910總和根部橫截面積xi0.040.060.040.080.080.050.050.070.070.060.6材積量yi0.250.400.220.540.510.340.360.460.420.403.9并計算得∑i=110xi2=0.038,∑i=1(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186m2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.附:相關(guān)系數(shù)r=∑i=1n解題技法樣本相關(guān)系數(shù)r的統(tǒng)計含義及應用(1)由r的正、負可判斷成對樣本數(shù)據(jù)中兩相關(guān)變量是正相關(guān)還是負相關(guān);(2)可根據(jù)|r|的大小從量的角度判斷成對樣本數(shù)據(jù)是否具有線性相關(guān)性,進而可知能否用經(jīng)驗回歸方程進行分析和預測;(3)當|r|≤0.25時,即便求得了經(jīng)驗回歸方程也沒有任何統(tǒng)計意義.某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得∑i=120xi=60,∑i=120yi=1200,∑i=120(xi-x)2=80,∑i=120(yi-y)2=9000,∑(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關(guān)系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:r=∑i=1n經(jīng)驗回歸模型考向1線性經(jīng)驗回歸問題【例3】某研究機構(gòu)為調(diào)查人的最大可視距離y(單位:米)和年齡x(單位:歲)之間的關(guān)系,對不同年齡的志愿者進行了研究,收集數(shù)據(jù)得到下表:x2025303540y167160150143130(1)根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的經(jīng)驗回歸方程;(2)根據(jù)(1)中求出的經(jīng)驗回歸方程,估計年齡為50歲的人的最大可視距離.參考公式:經(jīng)驗回歸方程y=bx+a中斜率和截距的最小二乘估計公式分別為b=∑i=1n(xi-x)(解題技法線性回歸分析問題的解題策略(1)利用公式,求出回歸系數(shù)b;(2)利用經(jīng)驗回歸直線過樣本點的中心求系數(shù)a;(3)利用經(jīng)驗回歸方程進行預測,把回歸方程看作一次函數(shù),將解釋變量x的值代入,得到預測變量y的值.考向2非線性經(jīng)驗回歸問題【例4】“綠水青山就是金山銀山”的理念推動了新能源汽車產(chǎn)業(yè)的迅速發(fā)展.以下表格和散點圖反映了近幾年某新能源汽車的年銷售量情況.年份20192020202120222023年份代碼x12345某新能源汽車年銷售量y/萬輛1.55.917.732.955.6(1)請根據(jù)散點圖判斷,y=bx+a與y=cx2+d中哪一個更適宜作為年銷售量y關(guān)于年份代碼x的回歸方程類型;(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的經(jīng)驗回歸方程,并預測2024年該新能源汽車的年銷售量.(精確到0.1)參考數(shù)據(jù):y=22.72,∑i=15(wi-w)2=374,∑i=15(wi-w)(yi-y)=851.2(其中解題技法有些非線性回歸分析問題并不給出經(jīng)驗公式,這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與學過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)的圖象進行比較,挑選一種跟這些散點擬合得最好的函數(shù),用適當?shù)淖兞窟M行變換,如通過換元或取對數(shù)等方法,把問題化為線性回歸分析問題,使之得到解決.1.已知變量x與y,且觀測數(shù)據(jù)如下表(其中6.5>a>4>b>1,a+b=6),則由該觀測數(shù)據(jù)算得的經(jīng)驗回歸方程可能是()x12345y6.5a4b1A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+0.442.數(shù)獨是源自18世紀瑞士的一種數(shù)學游戲,玩家需要根據(jù)9×9盤面上的已知數(shù)字,推理出所有剩余空格的數(shù)字,并滿足每一行、每一列、每一個粗線宮(3×3)內(nèi)的數(shù)字均含1~9,且不重復.數(shù)獨愛好者小明打算報名參加“絲路杯”全國數(shù)獨大賽初級組的比賽,賽前小明在某數(shù)獨APP上進行一段時間的訓練,每天的解題平均速度y(秒)與訓練天數(shù)x(天)有關(guān),經(jīng)統(tǒng)計得到如表的數(shù)據(jù):x(天)1234567y(秒)990990450320300240210(1)現(xiàn)用y=a+bx作為經(jīng)驗回歸模型,請利用表中數(shù)據(jù),求出該經(jīng)驗回歸方程(2)請用第(1)題的結(jié)論預測,小明經(jīng)過100天訓練后,每天解題的平均速度約為多少秒?參考數(shù)據(jù)其中ti=1xi:∑i=17tiyi參考公式:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其經(jīng)驗回歸直線v=α+βu的斜率和截距的最小二乘估計公式分別為β=∑i=1nuivi-n刻畫擬合效果【例5】假定小麥基本苗數(shù)x與成熟期有效穗y之間存在相關(guān)關(guān)系,今測得5組數(shù)據(jù)如下:x15.025.830.036.644.4y39.442.942.943.149.2若由最小二乘法計算得經(jīng)驗回歸方程為y=0.29x+34.7.(1)計算各組殘差,并計算殘差平方和;(2)求R2,并說明回歸模型擬合效果的好壞.參考數(shù)據(jù):∑i=15(yi-y解題技法刻畫擬合效果的三種方法(1)殘差圖法:殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適;(2)殘差平方和法:殘差平方和∑i=1n(yi-yi)2(3)決定系數(shù)法:R2=1-∑i=1n(y1.在一元線性回歸模型Y=bx+a+e中,下列說法正確的是()A.Y=bx+a+e是一次函數(shù)B.響應變量Y是由解釋變量x唯一確定的C.響應變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,這些因素會導致隨機誤差e的產(chǎn)生D.隨機誤差e是由于計算不準確造成的,可通過精確計算避免隨機誤差e的產(chǎn)生2.現(xiàn)代物流成為繼勞動力、自然資源外影響企業(yè)生產(chǎn)成本及利潤的重要因素.某企業(yè)去年前八個月的物流成本和企業(yè)利潤的數(shù)據(jù)(單位:萬元)如下表所示:月份1234物流成本x8383.58086.5利潤y114116106122殘差ei=y(tǒng)i-0.20.61.8-3月份5678物流成本x8984.57986.5利潤y132114m132殘差ei=y(tǒng)i--1-4.6-1根據(jù)最小二乘法求得經(jīng)驗回歸方程為y=3.2x-151.8.(1)求m的值,并利用已知的經(jīng)驗回歸方程求出8月份對應的殘差值e8(2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論