版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第十一章
算法、統(tǒng)計與統(tǒng)計案例§11.4
回歸分析考試要求1.會作兩個相關(guān)變量的數(shù)據(jù)的散點圖,會利用散點圖認(rèn)識變量間的相關(guān)關(guān)系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.3.了解回歸分析的基本思想、方法及其簡單應(yīng)用.
內(nèi)容索引第一部分第二部分第三部分落實主干知識探究核心題型課時精練落實主干知識第一部分相關(guān)關(guān)系與回歸方程(1)相關(guān)關(guān)系的分類①正相關(guān)在散點圖中,點散布在從_______到______的區(qū)域,兩個變量的這種相關(guān)關(guān)系稱為正相關(guān).②負(fù)相關(guān)在散點圖中,點散布在從______到______的區(qū)域,兩個變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān).左下角右上角左上角右下角(2)線性相關(guān)關(guān)系如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做_________.(3)回歸方程①最小二乘法求回歸直線,使得樣本數(shù)據(jù)的點到它的_________________的方法叫做最小二乘法.回歸直線距離的平方和最小(4)回歸分析①定義:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法.②樣本點的中心對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其中________稱為樣本點的中心.③相關(guān)系數(shù)當(dāng)r>0時,表明兩個變量_______;當(dāng)r<0時,表明兩個變量_______.r的絕對值越接近于1,表明兩個變量的線性相關(guān)性_____.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常|r|大于____時,認(rèn)為兩個變量有很強(qiáng)的線性相關(guān)性.正相關(guān)負(fù)相關(guān)越強(qiáng)0.753.回歸分析是基于樣本觀測數(shù)據(jù)進(jìn)行估計或推斷的,得出的結(jié)論可能犯錯誤.判斷下列結(jié)論是否正確(請在括號中打“√”或“×”)(1)相關(guān)關(guān)系是一種非確定性關(guān)系.(
)(2)散點圖是判斷兩個變量相關(guān)關(guān)系的一種重要方法和手段.(
)(3)回歸直線
至少經(jīng)過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點.(
)(4)相關(guān)系數(shù)的絕對值越接近1,兩個變量的線性相關(guān)程度越強(qiáng).(
)√√×√1.在對兩個變量x,y進(jìn)行回歸分析時有下列步驟:①對所求出的回歸方程作出解釋;②收集數(shù)據(jù)(xi,yi),i=1,2,…,n;③求回歸方程;④根據(jù)所收集的數(shù)據(jù)繪制散點圖.則下列操作順序正確的是A.①②④③
B.③②④①C.②③①④
D.②④③①√根據(jù)回歸分析的思想,可知對兩個變量x,y進(jìn)行回歸分析時,應(yīng)先收集數(shù)據(jù)(xi,yi),然后繪制散點圖,再求回歸方程,最后對所求的回歸方程作出解釋.2.對于x,y兩個變量,有四組樣本數(shù)據(jù),分別算出它們的相關(guān)系數(shù)r如下,則線性相關(guān)性最強(qiáng)的是A.-0.82 B.0.78C.-0.69 D.0.87√由相關(guān)系數(shù)的絕對值|r|越大,變量間的線性相關(guān)性越強(qiáng)知,各選項中r=0.87的絕對值最大,故線性相關(guān)性最強(qiáng).3.某單位為了了解辦公樓用電量y(度)與氣溫x(℃)之間的關(guān)系,隨機(jī)統(tǒng)計了四個工作日的用電量與當(dāng)天平均氣溫,并制作了對照表:氣溫(℃)181310-1用電量(度)24343864√氣溫(℃)181310-1用電量(度)24343864探究核心題型第二部分例1
(1)(2023·保定模擬)已知兩個變量x和y之間有線性相關(guān)關(guān)系,經(jīng)調(diào)查得到如下樣本數(shù)據(jù):題型一數(shù)據(jù)的相關(guān)性x34567y3.52.41.1-0.2-1.3√A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0√根據(jù)相關(guān)變量x,y的散點圖知,變量x,y具有負(fù)線性相關(guān)關(guān)系,剔除點(10,21)后,剩下的數(shù)據(jù)線性相關(guān)性更強(qiáng);所以樣本相關(guān)系數(shù)-1<r2<r1<0.判定兩個變量相關(guān)性的方法(1)畫散點圖:若點的分布從左下角到右上角,則兩個變量正相關(guān);若點的分布從左上角到右下角,則兩個變量負(fù)相關(guān).(2)相關(guān)系數(shù):當(dāng)r>0時,正相關(guān);當(dāng)r<0時,負(fù)相關(guān);|r|越接近1,線性相關(guān)性越強(qiáng).思維升華跟蹤訓(xùn)練1
(1)某公司2017~2022年的年利潤x(單位:百萬元)與年廣告支出y(單位:百萬元)的統(tǒng)計數(shù)據(jù)如表所示:根據(jù)統(tǒng)計數(shù)據(jù),則利潤中位數(shù)A.是16,x與y有正相關(guān)關(guān)系B.是17,x與y有正相關(guān)關(guān)系C.是17,x與y有負(fù)相關(guān)關(guān)系D.是18,x與y有負(fù)相關(guān)關(guān)系√年份201720182019202020212022年利潤x12.214.6161820.422.3年廣告支出y0.620.740.810.8911.11(2)已知相關(guān)變量x和y的散點圖如圖所示,若用y=b1·ln(k1x)與y=k2x+b2擬合時的相關(guān)系數(shù)分別為r1,r2,則比較r1,r2的大小結(jié)果為A.r1>r2
B.r1=r2C.r1<r2
D.不確定√由散點圖可知,用y=b1·ln(k1x)擬合比用y=k2x+b2擬合的效果更好,故|r1|>|r2|;又因為x,y負(fù)相關(guān),所以-r1>-r2,即r1<r2.題型二回歸分析例2
(2023·蚌埠模擬)某商業(yè)銀行對存款利率與日存款總量的關(guān)系進(jìn)行調(diào)研,發(fā)現(xiàn)存款利率每上升一定的百分點,日均存款總額就會發(fā)生一定的變化,經(jīng)過統(tǒng)計得到下表:命題點1線性回歸模型利率上升百分點x0.10.20.30.40.5日均存款總額y(億元)0.20.350.50.650.8(1)在給出的坐標(biāo)系中畫出上表數(shù)據(jù)的散點圖;利率上升百分點x0.10.20.30.40.5日均存款總額y(億元)0.20.350.50.650.8如圖所示.利率上升百分點x0.10.20.30.40.5日均存款總額y(億元)0.20.350.50.650.8利率上升百分點x0.10.20.30.40.5日均存款總額y(億元)0.20.350.50.650.8(3)已知現(xiàn)行利率下的日均存款總額為0.625億元,試根據(jù)(2)中的線性回歸方程,預(yù)測日均存款總額為現(xiàn)行利率下的2倍時,利率需上升多少個百分點?設(shè)利率需上升x個百分點,由(2)得,0.625×2=1.5x+0.05,解得x=0.8,所以預(yù)測利率需上升0.8個百分點.命題點2非線性回歸模型例3
(2023·保山模擬)某縣為了解鄉(xiāng)村經(jīng)濟(jì)發(fā)展情況,對全縣鄉(xiāng)村經(jīng)濟(jì)發(fā)展情況進(jìn)行調(diào)研,現(xiàn)對2013年以來的鄉(xiāng)村經(jīng)濟(jì)收入y(單位:億元)進(jìn)行了統(tǒng)計分析,制成如圖所示的散點圖,其中年份代碼x的值1—10分別對應(yīng)2013年至2022年.(2)根據(jù)(1)中相關(guān)程度更強(qiáng)的模型,求y關(guān)于x的回歸方程(系數(shù)精確到0.01),并估計該縣2026年的鄉(xiāng)村經(jīng)濟(jì)收入(精確到0.01).2026年的年份代碼為14,所以估計該縣2026年的鄉(xiāng)村經(jīng)濟(jì)收入為88.88億元.求線性回歸方程的步驟思維升華跟蹤訓(xùn)練2
(2022·南充模擬)某特色餐館開通了某APP的外賣服務(wù),在一周內(nèi)的某特色菜外賣份數(shù)x(單位:份)與收入y(單位:元)之間有如下的對應(yīng)數(shù)據(jù):(1)在給出的坐標(biāo)系中畫出數(shù)據(jù)散點圖;外賣份數(shù)x(份)24568收入y(元)3040605070作出散點圖如圖所示.(2)請根據(jù)以上數(shù)據(jù)用最小二乘法求出收入y關(guān)于外賣份數(shù)x的線性回歸方程;外賣份數(shù)x(份)24568收入y(元)3040605070外賣份數(shù)x(份)24568收入y(元)3040605070外賣份數(shù)x(份)24568收入y(元)3040605070(3)據(jù)此估計外賣份數(shù)為12時,收入為多少元.外賣份數(shù)x(份)24568收入y(元)3040605070即外賣份數(shù)為12時,預(yù)測收入為95.5元.殘差分析例4
(1)下列說法中正確的是題型三③在殘差圖中,殘差分布的水平帶狀區(qū)域的寬度越窄,其模型的擬合效果越好;④若兩個變量的相關(guān)指數(shù)R2越大,表示殘差平方和越小,即模型的擬合效果越好.A.①③
B.①②④ C.①④
D.②③④√對于③,在殘差圖中,殘差分布的水平帶狀區(qū)域的寬度越窄,說明擬合精度越高,即擬合效果越好,故③正確;對于④,由相關(guān)指數(shù)R2的意義可知,R2越大,表示殘差平方和越小,即模型的擬合效果越好,故④正確.(2)新能源汽車的核心部件是動力電池,電池占了新能源整車成本的很大一部分,而其中的原材料碳酸鋰又是電池的主要成分.從2020年底開始,碳酸鋰的價格不斷升高,如表是2022年某企業(yè)的前5個月碳酸鋰的價格與月份的統(tǒng)計數(shù)據(jù):月份代碼x12345碳酸鋰價格y(萬元/kg)0.50.61m1.51.4可得m=1.4.檢驗回歸模型的擬合效果的兩種方法(1)殘差分析:通過殘差分析發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù),判斷所建立模型的擬合效果.(2)R2分析:通過公式計算R2,R2越大,殘差平方和越小,模型的擬合效果越好;R2越小,殘差平方和越大,模型的擬合效果越差.思維升華跟蹤訓(xùn)練3
(1)下列命題是真命題的為B.可以用相關(guān)系數(shù)r來刻畫兩個變量x和y線性相關(guān)程度的強(qiáng)弱,r的值越
小,說明兩個變量的線性相關(guān)程度越弱C.在回歸分析中,相關(guān)指數(shù)R2=0.80的模型比相關(guān)指數(shù)R2=0.98的模型
擬合的效果要好D.殘差平方和越小的模型,擬合的效果越好√對于B,由相關(guān)系數(shù)的意義知,當(dāng)|r|越接近0時,表示變量y與x之間的線性相關(guān)程度越弱,所以B是假命題;對于C,用相關(guān)指數(shù)R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越好,所以C是假命題;對于D,由殘差的統(tǒng)計學(xué)意義知,D是真命題.(2)兩個線性相關(guān)變量x與y的統(tǒng)計數(shù)據(jù)如表:x99.51010.511y1110865-0.2所以殘差為11-11.2=-0.2.課時精練第三部分基礎(chǔ)保分練1.下列說法中不正確的是A.具有相關(guān)關(guān)系的兩個變量不是因果關(guān)系B.散點圖能直觀地反映數(shù)據(jù)的相關(guān)程度C.回歸直線最能代表線性相關(guān)的兩個變量之間的關(guān)系D.任一組數(shù)據(jù)都有回歸方程√12345678910111213141234567891011121314根據(jù)兩個變量具有相關(guān)關(guān)系的概念,可知A正確;散點圖能直觀地描述具有相關(guān)關(guān)系的兩個變量的相關(guān)程度,所以B正確;回歸直線最能代表線性相關(guān)的兩個變量之間的相關(guān)關(guān)系,所以C正確;具有相關(guān)關(guān)系的樣本數(shù)據(jù)才有回歸方程,所以D不正確.2.對于相關(guān)系數(shù),下列說法錯誤的是A.相關(guān)系數(shù)可以用來判斷樣本數(shù)據(jù)相關(guān)關(guān)系的正負(fù)性B.相關(guān)系數(shù)可以是正的,也可以是負(fù)的C.相關(guān)系數(shù)r∈[-1,1]D.相關(guān)系數(shù)越大,樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng)√1234567891011121314相關(guān)系數(shù)的絕對值越大,樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng),故D錯誤.3.(2023·運城模擬)在線性回歸模型中,變量x與y的一組樣本數(shù)據(jù)對應(yīng)的點均在直線y=
則R2等于1234567891011121314因為樣本數(shù)據(jù)對應(yīng)的點均在一條直線上,所以R2=1.√12345678910111213144.某工廠研究某種產(chǎn)品的產(chǎn)量x(單位:噸)與所需某種材料y(單位:噸)之間的相關(guān)關(guān)系,在生產(chǎn)過程中收集了4組數(shù)據(jù)如表所示.根據(jù)表中數(shù)據(jù)可得線性回歸方程為
,則下列四個說法中不正確的為A.變量x與y正相關(guān)B.y與x的相關(guān)系數(shù)r>0C.=0.45D.當(dāng)產(chǎn)量為8噸時,預(yù)測所需材料為5.95噸x3467y2.5345.9√1234567891011121314所以變量x與y呈正相關(guān),所以相關(guān)系數(shù)r>0,故A正確,B正確;即產(chǎn)量為8噸時,預(yù)測所需材料為5.95噸,故D正確.x3467y2.5345.95.(2023·成都模擬)某制衣品牌為使成衣尺寸更精準(zhǔn),選擇了10名志愿者,對其身高(單位:cm)和臂展(單位:cm)進(jìn)行了測量,這10名志愿者身高和臂展的折線圖如圖所示.已知這10名志愿者身高的平均值為176cm,根據(jù)這10名志愿者的數(shù)據(jù)求得臂展u關(guān)于身高v的線性回歸方程為
=1.2v-34,則下列結(jié)論正確的是1234567891011121314①這10名志愿者身高的極差小于臂展的極差;②這10名志愿者的身高和臂展負(fù)相關(guān);③這10名志愿者臂展的平均值為176.2cm;④根據(jù)線性回歸方程可估計身高為160cm的人的臂展為158cm.A.①②
B.①④C.②③
D.②④√12345678910111213141234567891011121314對于①,因為這10名志愿者臂展的最大值大于身高的最大值,而臂展的最小值小于身高的最小值,所以這10名志愿者身高的極差小于臂展的極差,故①正確;對于②,因為1.2>0,所以這10名志愿者的身高和臂展正相關(guān),故②錯誤;對于③,因為這10名志愿者身高的平均值為176cm,所以這10名志愿者臂展的平均值為1.2×176-34=177.2(cm),故③錯誤;1234567891011121314對于④,若一個人的身高為160cm,則由線性回歸方程
=1.2v-34,可得這個人的臂展的估計值為158cm,故④正確.12345678910111213146.色差和色度是衡量毛絨玩具質(zhì)量優(yōu)劣的重要指標(biāo),現(xiàn)抽檢一批產(chǎn)品測得數(shù)據(jù)列于表中.已知該產(chǎn)品的色度y和色差x之間滿足線性相關(guān)關(guān)系,且
,現(xiàn)有一對測量數(shù)據(jù)為(30,23.6),則該數(shù)據(jù)的殘差為A.-0.96 B.-0.8C.0.8 D.0.96√色差x21232527色度y151819201234567891011121314所以該數(shù)據(jù)的殘差為23.6-22.8=0.8.12345678910111213147.某智能機(jī)器人的廣告費用x(萬元)與銷售額y(萬元)的統(tǒng)計數(shù)據(jù)如表所示:廣告費用x(萬元)2356銷售額y(萬元)28314148571234567891011121314所以預(yù)測當(dāng)廣告費用為8萬元時,銷售額為5×8+17=57(萬元).廣告費用x(萬元)2356銷售額y(萬元)2831414812345678910111213148.已知具有相關(guān)關(guān)系的兩個隨機(jī)變量的一組觀測數(shù)據(jù)的散點圖分布在函數(shù)y=2e2x+1的圖象附近,設(shè)z=lny,將其變換后得到線性回歸方程________.2ln2+29.假設(shè)關(guān)于某種設(shè)備的使用年限x(單位:年)與所支出的維修費用y(單位:萬元)線性相關(guān),統(tǒng)計資料如右.1234567891011121314x23456y2.23.85.56.57.0(2)計算y與x的相關(guān)系數(shù)r(精確到0.001),并判斷該設(shè)備的使用年限與所支出的維修費用的線性相關(guān)程度.123456789101112131412345678910111213141234567891011121314r接近1,說明該設(shè)備的使用年限與所支出的維修費用之間的線性相關(guān)程度很強(qiáng).123456789101112131410.(2022·全國乙卷)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機(jī)選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數(shù)據(jù):樣本號i12345678910總和根部橫截面積xi0.040.060.040.080.080.050.050.070.070.060.6材積量yi0.250.400.220.540.510.340.360.460.420.403.91234567891011121314(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;樣本號i12345678910總和根部橫截面積xi0.040.060.040.080.080.050.050.070.070.060.6材積量yi0.250.400.220.540.510.340.360.460.420.403.91234567891011121314樣本中10棵這種樹木的材積量的平均值據(jù)此可估計該林區(qū)這種樹木平均一棵的根部橫截面積為0.06m2,平均一棵的材積量為0.39m3.1234567891011121314(2)求該林區(qū)這種樹木的根部橫截面積與材積量的相關(guān)系數(shù)(精確到0.01);樣本號i12345678910總和根部橫截面積xi0.040.060.040.080.080.050.050.070.070.060.6材積量yi0.250.400.220.540.510.340.360.460.420.403.912345678910111213141234567891011121314(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186m2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.1234567891011121314設(shè)該林區(qū)這種樹木的總材積量的估計值為Ym3,又已知樹木的材積量與其根部橫截面積近似成正比,可得
,解得Y=1209.則該林區(qū)這種樹木的總材積量的估計值為1209m3.123456789101112131411.針對某疾病,各地醫(yī)療機(jī)構(gòu)采取了各種有針對性的治療方法,取得了不錯的成效,某地開始使用中西醫(yī)結(jié)合方法后,每周治愈的患者人數(shù)如表所示,由表格可得y關(guān)于x的非線性回歸方程為
,則下列說法正確的是綜合提升練周數(shù)(x)12345治愈人數(shù)(y)21736931421234567891011121314①=4;②=-8;③此非線性回歸模型第4周的殘差為5;④估計第6周的治愈人數(shù)為220.A.①③
B.①④C.②③
D.②④√周數(shù)(x)12345治愈人數(shù)(y)217369314212345678910111213141234567891011121314123456789101112131412.2020年,全球開展了某疫苗研發(fā)競賽,我國處于領(lǐng)先地位,為了研究疫苗的有效率,在某地進(jìn)行臨床試驗,對符合一定條件的10000名試驗者注射了該疫苗,一周后有20人感染,為了驗證疫苗的有效率,同期,從相同條件下未注射疫苗的人群中抽取了250
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度龐寒離婚協(xié)議書:情感糾葛與財產(chǎn)分配協(xié)議4篇
- 二零二五版戶外用品銷售代理及品牌合作合同2篇
- 2025年度幕墻施工勞務(wù)分包合同施工資料管理與歸檔范本4篇
- 臨時場地租賃協(xié)議2024版3篇
- 二零二五年度農(nóng)家樂餐飲承包合作協(xié)議3篇
- 二零二五年度年薪制員工聘用合同書:行業(yè)特定版
- 二零二五年度居民供水用水節(jié)能減排合同范本3篇
- 2025年度生物制藥研發(fā)人員聘用勞動合同范本3篇
- 2025年度個人小戶型房產(chǎn)買賣合同附帶房產(chǎn)過戶手續(xù)指導(dǎo)3篇
- 2025年食品生產(chǎn)HACCP體系審核與認(rèn)證協(xié)議2篇
- 大疆80分鐘在線測評題
- 2023年成都市青白江區(qū)村(社區(qū))“兩委”后備人才考試真題
- 2024中考復(fù)習(xí)必背初中英語單詞詞匯表(蘇教譯林版)
- 海員的營養(yǎng)-1315醫(yī)學(xué)營養(yǎng)霍建穎等講解
- 《現(xiàn)代根管治療術(shù)》課件
- 肩袖損傷的護(hù)理查房課件
- 2023屆北京市順義區(qū)高三二模數(shù)學(xué)試卷
- 公司差旅費報銷單
- 我國全科醫(yī)生培訓(xùn)模式
- 2021年上海市楊浦區(qū)初三一模語文試卷及參考答案(精校word打印版)
- 八年級上冊英語完形填空、閱讀理解100題含參考答案
評論
0/150
提交評論