第3講 變量間相關(guān)關(guān)系與統(tǒng)計案例_第1頁
第3講 變量間相關(guān)關(guān)系與統(tǒng)計案例_第2頁
第3講 變量間相關(guān)關(guān)系與統(tǒng)計案例_第3頁
第3講 變量間相關(guān)關(guān)系與統(tǒng)計案例_第4頁
第3講 變量間相關(guān)關(guān)系與統(tǒng)計案例_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本文格式為Word版,下載可任意編輯——第3講變量間相關(guān)關(guān)系與統(tǒng)計案例

第第3講

變量間的相關(guān)關(guān)系與統(tǒng)計案例

[考綱解讀]1.會作兩個相關(guān)變量的數(shù)據(jù)的散點圖,會利用散點圖熟悉變量間的相關(guān)關(guān)系;根據(jù)最小二乘法求出回歸直線方程.(重點)2.了解獨立性檢驗(只要求22列聯(lián)表)的根本思想、方法及其初步應(yīng)用.

[考向預(yù)料]從近三年高考處境來看,本講是高考中的一個熱點測驗內(nèi)容.預(yù)料2021年將會測驗:①回歸直線方程的判斷、求解及相關(guān)系數(shù)的意義,并用其解決實際問題;②獨立性檢驗思想在實際問題中的應(yīng)用.試題以解答題的形式呈現(xiàn),難度為中等.此外,也可能展現(xiàn)在客觀題中,此時試題難度不大,屬中、低檔題型.

1.相關(guān)關(guān)系與回歸方程(1)相關(guān)關(guān)系的分類①正相關(guān):從散點圖上看,點散布在從01左下角到02右上角的區(qū)域內(nèi),如圖1;②負相關(guān):從散點圖上看,點散布在從03左上角到04右下角的區(qū)域內(nèi),如圖2.

(2)線性相關(guān)關(guān)系:從散點圖上看,假設(shè)這些點從整體上看大致分布在05一條直線鄰近,那么稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做06回歸直線.

(3)回歸方程①最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的07距離的平方和最小的方法叫做最小二乘法.②回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),,(xn,yn),其回歸方程為y^=b^x+a^,那么b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y(tǒng)--b^x-.其中,b^是回歸方程的08斜率,a^是在y軸上的09截距,x-=1nni=1xi,y-=1nni=1yi,10(x-,y-)稱為樣本點的中心.說明:回歸直線y^=b^x+a^必過樣本點的中心(x-,y-),這個結(jié)論既是檢驗所求回歸直線方程是否切實的依據(jù),也是求參數(shù)的一個依據(jù).(4)樣本相關(guān)系數(shù)r=i=1nxi-x-yi-y-i=1nxi-x-2i=1nyi-y-2,用它來衡量兩個變量間的線性相關(guān)關(guān)系.①當(dāng)r0時,說明兩個變量11正相關(guān);②當(dāng)r0時,說明兩個變量12負相關(guān);③r的十足值越接近1,說明兩個變量的線性相關(guān)性13越強;r的十足值接近于0,說明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常當(dāng)|r|0.75時,認為兩個變量有很強的線性相關(guān)關(guān)系.2.殘差分析(1)殘差:對于樣本點(x1,y1),(x2,y2),,(xn,yn),它們的隨機誤差為ei=y(tǒng)i-bxi-a,i=1,2,,n,其估計值為e^i=y(tǒng)i-y^i=y(tǒng)i-b^xi-a^,i=1,2,,n,

e^i稱為相應(yīng)于點(xi,yi)的殘差.(2)殘差平方和為ni=1

(yi-y^i)2.(3)相關(guān)指數(shù):R2=1-01ni=1

yi-y^i2ni=1

yi-y-2.3.獨立性檢驗(1)分類變量:變量的不同"值'表示個體所屬的01不同類別,像這類變量稱為分類變量.(2)列聯(lián)表:列出兩個分類變量的02頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為

22列聯(lián)表

y1

y2

總計x1

aba+bx2

cdc+d總計a+cB+da+b+c+d構(gòu)造一個隨機變量K2=03nad-bc2a+bc+da+cb+d,其中n=04a+b+c+d為樣本容量.(3)獨立性檢驗利用隨機變量05K2來判斷"兩個分類變量06有關(guān)系'的方法稱為獨立性檢驗.

1.概念辨析(1)相關(guān)關(guān)系與函數(shù)關(guān)系都是一種確定性的關(guān)系,也是一種因果關(guān)系.(

)(2)"名師出高徒'可以解釋為教師的教學(xué)水平與學(xué)生水平成正相關(guān)關(guān)系.(

)(3)只有兩個變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)料價值.(

)(4)事情X,Y關(guān)系越緊密,那么由觀測數(shù)據(jù)計算得到的K2的觀測值越大.(

)(5)由獨立性檢驗可知,有99%的把握認為物理勞績優(yōu)秀與數(shù)學(xué)勞績有關(guān),某人數(shù)學(xué)勞績優(yōu)秀,那么他有99%的可能物理優(yōu)秀.(

)答案(1)(2)(3)(4)(5)2.小題熱身(1)設(shè)回歸方程為y^=3-5x,那么變量x增加一個單位時(

)A.y平均增加3個單位

B.y平均裁減5個單位C.y平均增加5個單位

D.y平均裁減3個單位答案B解析由于-5是斜率的估計值,說明x每增加一個單位,y平均裁減5個單

位.應(yīng)選B.(2)在以下各圖中,兩個變量具有相關(guān)關(guān)系的圖是(

)

A.①②

B.①③

C.②④

D.②③答案D解析①為函數(shù)關(guān)系;②鮮明成正相關(guān);③鮮明成負相關(guān);④沒有明顯相關(guān)性.(3)隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機構(gòu)用簡樸隨機抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如表.

非一線一線總計愿生452065不愿生132235總計5842100算得K2=1004522-20222584235659.616.附表:

P(K2k0)0.0500.0100.001k0

3.8416.63510.828參照附表,得到的正確結(jié)論是(

)A.在犯錯誤的概率不超過0.1%的前提下,認為"生育意愿與城市級別有關(guān)'B.在犯錯誤的概率不超過0.1%的前提下,認為"生育意愿與城市級別無關(guān)'C.有99%以上的把握認為"生育意愿與城市級別有關(guān)'D.有99%以上的把握認為"生育意愿與城市級別無關(guān)'答案C

解析由于K29.6166.635,所以有99%以上的把握認為"生育意愿與城市級別有關(guān)'.(4)已知變量x,y具有線性相關(guān)關(guān)系,它們之間的一組數(shù)據(jù)如下表所示,若y關(guān)于x的回歸方程為y^=1.3x-1,那么m=________.x1234y0.11.8m4答案3.1解析由已知得x-=14(1+2+3+4)=2.5,y-=14(0.1+1.8+m+4)=14(5.9+m).由于(x-,y-)在直線y^=1.3x-1上,所以y-=1.32.5-1=2.25,所以14(5.9+m)=2.25,解得m=3.1.

題型一相關(guān)關(guān)系的判斷

1.以下兩變量中不存在相關(guān)關(guān)系的是(

)①人的身高與視力;②曲線上的點與該點的坐標之間的關(guān)系;③某農(nóng)田的水稻產(chǎn)量與施肥量;④某同學(xué)考試勞績與復(fù)習(xí)時間的投入量;⑤勻速行駛的汽車的行駛距離與時間;⑥商品的銷售額與廣告費.A.①②⑤

B.①③⑥

C.④⑤⑥

D.②⑥答案A解析根據(jù)相關(guān)關(guān)系的定義知,①②⑤中兩個變量不存在相關(guān)關(guān)系.2.以下命題中正確的為(

)

A.線性相關(guān)系數(shù)r越大,兩個變量的線性相關(guān)性越強B.線性相關(guān)系數(shù)r越小,兩個變量的線性相關(guān)性越弱C.殘差平方和越小的模型,模型擬合的效果越好D.用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好答案C解析線性相關(guān)系數(shù)r的十足值越接近于1,兩個變量的線性相關(guān)性越強,故A,B錯誤;殘差平方和越小,相關(guān)指數(shù)R2越大,越接近于1,擬合效果越好,故C正確,D錯誤.3.對四組數(shù)據(jù)舉行統(tǒng)計,獲得如下圖的散點圖,關(guān)于其相關(guān)系數(shù)的對比,正確的是(

)

A.r2r40r3r1

B.r4r20r1r3

C.r4r20r3r1

D.r2r40r1r3

答案A解析易知題中圖①與圖③是正相關(guān),圖②與圖④是負相關(guān),且圖①與圖②中的樣本點集中分布在一條直線鄰近,那么r2r40r3r1.應(yīng)選A.

1.判定兩個變量正、負相關(guān)性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,兩個變量負相關(guān).(2)相關(guān)系數(shù):r0時,正相關(guān);r0時,負相關(guān).|r|越趨近于1相關(guān)性越強.見

舉例說明3.(3)線性回歸直線方程中:b^0時,正相關(guān);b^0時,負相關(guān).2.判斷擬合效果的兩個方法(1)殘差平方和越小,擬合效果越好.見舉例說明2.(2)相關(guān)指數(shù)R2越大,越接近于1,擬合效果越好.

1.在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),,(xn,yn)(n2,x1,x2,,xn不全相等)的散點圖中,若全體樣本點(xi,yi)(i=1,2,,n)都在直線y=12x+1上,那么這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為(

)A.-1

B.0

C.12

D.1答案D解析全體點均在直線上,那么樣本相關(guān)系數(shù)最大即為1,應(yīng)選D.2.四名同學(xué)根據(jù)各自的樣本數(shù)據(jù)研究變量x,y之間的相關(guān)關(guān)系,并求得線性回歸方程,分別得到以下四個結(jié)論:

①y與x負相關(guān)且y^=2.347x-6.423;②y與x負相關(guān)且y^=-3.476x+5.648;③y與x正相關(guān)且y^=5.437x+8.493;④y與x正相關(guān)且y^=-4.326x-4.578.其中確定不正確的結(jié)論的序號是(

)A.①②

B.②③

C.③④

D.①④答案D解析由回歸方程y^=b^x+a^知當(dāng)b^0時,y與x正相關(guān),當(dāng)b^0時,y與x負相關(guān),①④確定錯誤.題型二回歸分析

角度1線性回歸方程及應(yīng)用1.某汽車的使用年數(shù)x與所支出的修理總費用y的統(tǒng)計數(shù)據(jù)如表:

使用年數(shù)x/年12345修理總費用y/萬元0.51.22.23.34.5根據(jù)上表可得y關(guān)于x的線性回歸方程y^=b^x-0.69,若該汽車修理總費用超過10萬元就不再修理,直接報廢,據(jù)此模型預(yù)料該汽車最多可使用(缺乏1年按1年計算)(

)A.8年

B.9年

C.10年

D.11年答案D解析由y關(guān)于x的線性回歸直線y^=b^x-0.69過樣本點的中心(3,2.34),得b^=1.01,即線性回歸方程為y^=1.01x-0.69,令y^=1.01x-0.69=10,得x10.6,所以預(yù)料該汽車最多可使用11年.應(yīng)選D.2.(2022東北三省三校三模)現(xiàn)代社會,"鼠標手'已成為常見?。淮螠y驗中,10名測驗對象舉行160分鐘的連續(xù)鼠標點擊嬉戲,每位測驗對象完成的嬉戲關(guān)卡一樣,鼠標點擊頻率平均為180次/分鐘,測驗研究人員測試了測驗對象使用鼠標前后的握力變化,前臂外觀肌電頻率(sEMG)等指標.(1)10名測驗對象測驗前、后握力(單位:N)測試結(jié)果如下:

測驗前:346,357,358,360,362,362,364,372,373,376.測驗后:313,321,322,324,330,332,334,343,350,361.完成莖葉圖,并計算測驗后握力平均值比測驗前握力的平均值下降了多少N?

(2)測驗過程中測得時間t(分)與10名測驗對象前臂外觀肌電頻率(sEMG)的中位數(shù)y(Hz)的九組對應(yīng)數(shù)據(jù)(t,y)為(0,87),(20,84),(40,86),(60,79),(80,78),(100,78),

(120,76),(140,77),(160,75).建立y關(guān)于時間t的線性回歸方程;(3)若肌肉肌電水平顯著下降,提示肌肉明顯進入疲乏狀態(tài),根據(jù)(2)中九組數(shù)據(jù)分析,使用鼠標多少分鐘就該舉行休息了?參考數(shù)據(jù):9i=1

(ti-t)(yi-y-)=-1800;參考公式:回歸方程y^=b^t+a^中斜率和截距的最小二乘估計公式分別為:b^=ni=1

ti-tyi-y-ni=1

ti-t2,a^=y(tǒng)--b^t.解(1)根據(jù)題意得到莖葉圖如右圖所示:

由圖中數(shù)據(jù)可得x-1=110(346+357+358+360+362+362+364+372+373+376)=363,x-2=110(313+321+322+324+330+332+334+343+350+361)=333,x-1-x-2=363-333=30(N),故測驗前后握力的平均值下降了30N.(2)由題意得t=19(0+20+40+60+80+100+120+140+160)=80,y-=19(87+84+86+79+78+78+76+77+75)=80,9i=1

(ti-t)2=(0-80)2+(20-80)2+(40-80)2+(60-80)2+(80-80)2+(100-80)2+(120-80)2+(140-80)2+(160-80)2=24000,又9i=1

(ti-t)(yi-y-)=-1800,

b^=9i=1

ti-tyi-y-9i=1

ti-t2=-180024000=-0.075,a^=y(tǒng)--b^t=80-(-0.075)80=86,y關(guān)于時間t的線性回歸方程為y^=-0.075t+86.(3)九組數(shù)據(jù)中40分鐘到60分鐘y的下降幅度最大,提示60分鐘時肌肉已經(jīng)進入疲乏狀態(tài),故使用鼠標60分鐘就該休息了.角度2非線性回歸模型的應(yīng)用3.(2022莆田二模)某芯片公司為制定下一年的研發(fā)投入籌劃,需了解年研發(fā)資金投入量xi(單位:億元)對年銷售額yi(單位:億元)的影響.該公司對歷史數(shù)據(jù)舉行比較分析,建立了兩個函數(shù)模型:①y=+x2,②y=ex+t,其中,,,t均為常數(shù),e為自然對數(shù)的底數(shù).現(xiàn)該公司收集了近12年的年研發(fā)資金投入量xi和年銷售額yi的數(shù)據(jù),i=1,2,,12,并對這些數(shù)據(jù)作了初步處理,得到了如下的散點圖及一些統(tǒng)計量的值.

令ui=x2,vi=lnyi(i=1,2,,12),經(jīng)計算得如下數(shù)據(jù):

x-

y-

i=112(xi-x-)2

i=112(yi-y-)2

u-

v-

20667702004604.20

i=112(ui-u-)2

i=112(ui-u-)i=112(vi-v-)2

i=112(xi-x-)

(yi-y-)(vi-v-)3125000215000.30814(1)設(shè){ui}和{yi}的相關(guān)系數(shù)為r1,{xi}和{vi}的相關(guān)系數(shù)為r2,請從相關(guān)系數(shù)的角度,選擇一個擬合程度更好的模型;(2)①根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)精確到0.01);②若下一年銷售額y需達成90億元,預(yù)料下一年的研發(fā)資金投入量x是多少億元?附:相關(guān)系數(shù)r=i=1nxi-x-yi-y-i=1nxi-x-2i=1nyi-y-2,回歸直線y^=a^+b^x中斜率和截距的最小二乘估計公式分別為b^=i=1nxi-x-yi-y-i=1nxi-x-2,a^=y(tǒng)--b^x-;參考數(shù)據(jù):308=477,909.4868,e4.499890.解(1)由題意,r1=i=112ui-u-yi-y-i=112ui-u-2i=112yi-y-2=215003125000200=2150025000=4350=0.86,r2=i=112xi-x-vi-v-i=112xi-x-2i=112vi-v-2=147700.308

=14770.2=10110.91,那么|r1||r2|,因此從相關(guān)系數(shù)的角度,模型y=ex+t的擬合程度更好.(2)①先建立v關(guān)于x的線性回歸方程,由y=ex+t,得lny=t+x,即v=t+x;由于=i=112xi-x-vi-v-i=112xi-x-2=147700.018,t=v--x-=4.20-0.01820=3.84,所以v關(guān)于x的線性回歸方程為v^=0.02x+3.84,所以lny^=0.02x+3.84,那么y^=e0.02x+3.84.②下一年銷售額y需達成90億元,即y=90,代入y^=e0.02x+3.84,得90=e0.02x+3.84,又e4.499890,所以4.49980.02x+3.84,所以x4.4998-3.840.02=32.99,所以預(yù)料下一年的研發(fā)資金投入量約是32.99億元.

1.利用線性回歸方程時的關(guān)注點(1)正確理解計算b^,a^的公式和切實的計算是求線性回歸方程的關(guān)鍵.(2)回歸直線方程y^=b^x+a^必過樣本點中心(x-,y-).見舉例說明1.(3)在分析兩個變量的相關(guān)關(guān)系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來確定兩個變量之間是否具有相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,那么可通過線性回歸方程來估計和預(yù)料.2.非線性回歸方程的求法

(1)根據(jù)原始數(shù)據(jù)(x,y)作出散點圖.(2)根據(jù)散點圖選擇恰當(dāng)?shù)臄M合函數(shù).(3)作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程.(4)在(3)的根基上通過相應(yīng)變換,即可得非線性回歸方程.見舉例說明3.

1.(2022南寧二模)一汽車銷售公司對開業(yè)4年來某種型號的汽車"五一'優(yōu)待金額與銷售量之間的關(guān)系舉行分析研究并做了記錄,得到如下資料.日期第1年第2年第3年第4年優(yōu)待金額x(千元)10111312銷售量y(輛)22243127經(jīng)過統(tǒng)計分析(利用散點圖)可知x,y線性相關(guān).(1)用最小二乘法求出y關(guān)于x的線性回歸方程y^=b^x+a^;(2)若第5年優(yōu)待金額為8.5千元,估計第5年的銷售量y(輛)的值.參考公式:b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y(tǒng)--b^x-.解(1)由題意,得x-=11.5,y-=26,i=14xiyi=1211,i=14x2i=534,b^=i=14xiyi-4x-y-i=14x2i-4x-2=1211-411.526534-411.52=155=3,那么a^=y(tǒng)--b^x-=26-311.5=-8.5.y^=3x-8.5.(2)當(dāng)x=8.5時,y^=17,第5年優(yōu)待金額為8.5千元時,銷售量估計為17輛.

2.對某地區(qū)兒童的身高與體重的一組數(shù)據(jù),我們用兩種模型:①y=bx+a,②y=cedx擬合,得到回歸方程分別為y^(1)=0.24x-8.81,y^(2)=1.70e0.022x,作殘差分析,如下表:

身高x(cm)60708090100110體重y(kg)6810141518e^(1)

0.410.01

1.21-0.190.41e^(2)

-0.360.070.121.69-0.34-1.12(1)求表中空格內(nèi)的值;(2)根據(jù)殘差對比模型①②的擬合效果,抉擇選擇哪個模型;(3)若殘差大于1kg的樣本點被認為是奇怪數(shù)據(jù),應(yīng)剔除,剔除后對(2)所選擇的模型重新建立回歸方程.(結(jié)果留存到小數(shù)點后兩位)附:對于一組數(shù)據(jù)(x1,y1),(x2,y2),,(xn,yn),其回歸直線y^=b^x+a^的斜率和截距的最小二乘估計分別為b^=ni=1

xi-x-yi-y-ni=1

xi-x-2,a^=y(tǒng)--b^x-.解(1)根據(jù)殘差分析,把x=80代入y^(1)=0.24x-8.81中,得y^(1)=10.39.∵10-10.39=-0.39,表中空格內(nèi)的值為-0.39.(2)模型①殘差的十足值的和為0.41+0.01+0.39+1.21+0.19+0.41=2.62,模型②殘差的十足值的和為0.36+0.07+0.12+1.69+0.34+1.12=3.7.∵2.623.7,模型①的擬合效果對比好,選擇模型①.(3)殘差大于1kg的樣本點被剔除后,剩余的數(shù)據(jù)如下表:

身高x(cm)607080100110體重y(kg)68101518e^(1)

0.410.01-0.39-0.190.41

那么x-=84,y-=11.4,i=15(xi-x-)(yi-y-)=412,i=15(xi-x-)2=1720,由公式b^=ni=1

xi-x-yi-y-ni=1

xi-x-2,a^=y(tǒng)--b^x-,得b^0.24,a^=-8.76,得回歸方程為y^=0.24x-8.76.題型三獨立性檢驗

1.假設(shè)有兩個分類變量X和Y的22列聯(lián)表如下:

YX

y1

y2

總計x1

a10a+10x2

c30c+30總計6040100對同一樣本,以下數(shù)據(jù)能說明X與Y有關(guān)系的可能性最大的一組為(

)A.a(chǎn)=45,c=15

B.a(chǎn)=40,c=20C.a(chǎn)=35,c=25

D.a(chǎn)=30,c=30答案A解析根據(jù)22列聯(lián)表與獨立性檢驗可知,當(dāng)aa+10與cc+30相差越大時,X與Y有關(guān)系的可能性越大,即a,c相差越大,aa+10與cc+30相差越大.應(yīng)選A.2.(2022南昌三模)某校高三文科(1)班共有學(xué)生45人,其中男生15人,女生30人.在一次地理考試后,對勞績作了數(shù)據(jù)分析(總分值100分),勞績?yōu)?5分以上的同學(xué)稱為"地理之星',得到了如以下聯(lián)表和條形圖:

地理之星非地理之星合計男生

女生

合計

假設(shè)從全班45人中任意抽取1人,抽到"地理之星'的概率為13.

(1)完成"地理之星'與性別的22列聯(lián)表,并回復(fù)是否有90%以上的把握認為獲得"地理之星'與"性別'有關(guān)?(2)若已知此次考試中獲得"地理之星'的同學(xué)的勞績平均值為90,方差為7.2,請你判斷這些同學(xué)中是否有得到總分值的同學(xué),并說明理由.(得分均為整數(shù)分)參考公式:K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.臨界值表:

P(K2k0)0.100.050.0100.0050.001k0

2.7063.8416.6357.87910.828解(1)根據(jù)題意知"地理之星'總?cè)藬?shù)為4513=15,填寫列聯(lián)表如下:

地理之星非地理之星合計男生7815女生82230合計153045根據(jù)表中數(shù)據(jù),計算K2=45722-88215301530=1.82.706,所以沒有90%的把握認為獲得"地理之星'與性別有關(guān).(2)沒有得總分值的同學(xué).記各個分值由高到低分別為x1,x2,,x15.

①若有2個以上的總分值,那么s2=115[(100-90)2+(100-90)2++(x15-90)2]4037.2,不符合題意.②若恰有1個總分值,為使方差最小,那么其他分值需集中分布在平均數(shù)90的鄰近,且為保證平均值為90,那么有10個得分為89,其余4個得分為90,此時方差取得最小值,s2min=115[(100-90)2+4(90-90)2+10(89-90)2]=2237.2,與題意方差為7.2不符合,所以這些同學(xué)中沒有得總分值的同學(xué).

獨立性檢驗的一般步驟(1)根據(jù)樣本數(shù)據(jù)列出22列聯(lián)表;(2)計算隨機變量K2的觀測值k,查表確定臨界值k0;(3)假設(shè)kk0,就推斷"X與Y有關(guān)系',這種推斷犯錯誤的概率不超過P(K2k0);否那么,就認為在犯錯誤的概率不超過P(K2k0)的前提下不能推斷"X與Y有關(guān)系'.

1.學(xué)生會為了調(diào)查學(xué)生對2022年俄羅斯世界杯的關(guān)注是否與性別有關(guān),抽樣調(diào)查100人,得到如下數(shù)據(jù):

不關(guān)注關(guān)注總計男生301545女生451055總計7525100根據(jù)表中數(shù)據(jù),通過計算統(tǒng)計量K2=nad-bc2a+bc+da+cb+d,并參考以下臨界數(shù)據(jù):

P(K2

k0)0.500.400.250.150.100.050.0250.0100.0050.001

k0

0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828若由此認為"學(xué)生對2022年俄羅斯世界杯的關(guān)注與性別有關(guān)',那么此結(jié)論出錯的概率不超過(

)A.0.10

B.0.05

C.0.025

D.0.01答案A解析由題意可得K2=1003010-15452455575253.0302.706,由此認為"學(xué)生對2022年俄羅斯世界杯的關(guān)注與性別有關(guān)'出錯的概率不超過0.10.應(yīng)選A.2.(2022全國卷Ⅲ)某工廠為提高生產(chǎn)效率,開展技術(shù)創(chuàng)新活動,提出了完成某項生產(chǎn)任務(wù)的兩種新的生產(chǎn)方式.為對比兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用第一種生產(chǎn)方式,其次組工人用其次種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務(wù)的工作時間(單位:min)繪制了如下莖葉圖:

(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由;(2)求40名工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表:

超過m不超過m第一種生產(chǎn)方式

其次種生產(chǎn)方式

(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異?附:K2=nad-bc2a+bc+da+cb+d,

P(K2k0)0.0500.0100.001k0

3.8416.63510.828解(1)其次種生產(chǎn)方式的效率更高.理由如下:

①由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間超過80分鐘,用其次種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間不超過79分鐘.因此其次種生產(chǎn)方式的效率更高.②由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為85.5分鐘,用其次種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為73.5分鐘.因此其次種生產(chǎn)方式的效率更高.③由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間高于80分鐘;用其次種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間低于80分鐘,因此其次種生產(chǎn)方式的效率更高.④由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在莖8上的最多,關(guān)于莖8大致呈對稱分布;用其次種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布在莖7上的最多,關(guān)于莖7大致呈對稱分布,又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間分布的區(qū)間一致,故可以認為用其次種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務(wù)所需的時間更少,因此其次種生產(chǎn)方式的效率更高.(以上給出了4種理由,考生答出其中任意一種或其他合理理由均可)(2)由莖葉圖知m=79+812=80.列聯(lián)表如下:

超過m不超過m第一種生產(chǎn)方式155其次種生產(chǎn)方式515

(3)由于K2的觀測值k=401515-55220222022=106.635,所以有99%的把握認為兩種生產(chǎn)方式的效率有差異.

課時作業(yè)

組根基關(guān)1.查看以下各圖形:

其中兩個變量x,y具有相關(guān)關(guān)系的圖是(

)A.①②

B.①④

C.③④

D.②③答案C解析查看散點圖可知,兩個變量x,y具有相關(guān)關(guān)系的圖是③④.2.甲、乙、丙、丁四位同學(xué)各自對A,B兩變量的線性相關(guān)性做試驗,并用回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表:

甲乙丙丁r0.820.780.690.85m106115124103那么哪位同學(xué)的試驗結(jié)果表達A,B兩變量有更強的線性相關(guān)性(

)A.甲

B.乙

C.丙

D.丁答案D解析在驗證兩個變量之間的線性相關(guān)關(guān)系時,相關(guān)系數(shù)的十足值越接近1,相關(guān)性越強,在四個選項中只有丁的相關(guān)系數(shù)最大;殘差平方和越小,相關(guān)性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結(jié)果表達了A,B兩個變量有更強的線性相關(guān)性.應(yīng)選D.3.(2022湖北省七市(州)教科研協(xié)作體聯(lián)考)為了規(guī)定工時定額,需要確定加

工零件所花費的時間,為此舉行了5次試驗,得到5組數(shù)據(jù):(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).根據(jù)收集到的數(shù)據(jù)可知x1+x2+x3+x4+x5=100,用最小二乘法求得回歸直線方程為y^=0.67x+54.8,那么y1+y2+y3+y4+y5的值為(

)A.68.2

B.341

C.355

D.366.2答案B解析由題意,得x-=1005=20,將其代入回歸直線方程y^=0.67x+54.8中,得y-=0.6720+54.8=68.2,所以y1+y2+y3+y4+y5=5y-=341.應(yīng)選B.4.(2022蘭州模擬)根據(jù)如下樣本數(shù)據(jù):

x12345ya-1-10.5b+12.5得到的回歸方程為y^=bx+a.樣本點的中心為(3,0.1),當(dāng)x增加1個單位,那么y近似(

)A.增加0.8個單位

B.裁減0.8個單位C.增加2.3個單位

D.裁減2.3個單位答案A解析由題意,知x-=15(1+2+3+4+5)=3,y-=15[(a-1)+(-1)+0.5+(b+1)+2.5]=a+b+25=0.1,①又回歸直線方程過樣本中心點(3,0.1),得3b+a=0.1,②由①②聯(lián)立,解得a=-2.3,b=0.8,所以回歸直線方程為y^=0.8x-2.3,所以當(dāng)x增加1個單位時,y近似增加0.8個單位.5.已知兩個隨機變量x,y之間的相關(guān)關(guān)系如下表所示:

x-4-2124

y-5-3-1-0.51根據(jù)上述數(shù)據(jù)得到的回歸方程為y^=b^x+a^,那么大致可以判斷(

)參考公式:b^=ni=1xiyi-nx-y-ni=1x2i-nx-2,a^=y(tǒng)--b^x-A.a^0,b^0

B.a^0,b^0C.a^0,b^0

D.a^0,b^0答案C解析由已知得,x-=0.2,y-=-1.7,b^=20+6-1-1+4-50.2-1.716+4+1+4+16-50.22=991360,a^=-1.7-991360.20,或利用散點圖,易判斷b^0,a^0.應(yīng)選C.6.(2022湛江二模)有人認為在機動車駕駛技術(shù)上,男性優(yōu)于女性.這是真的么?某社會調(diào)查機構(gòu)與交警合作隨機統(tǒng)計了經(jīng)常開車的100名駕駛員最近三個月內(nèi)是否有交通事故或交通違法事情發(fā)生,得到下面的列聯(lián)表:

男女合計無403575有151025合計5545100

附:K2=nad-bc2a+bc+da+cb+d

P(K2k0)0.500.400.250.150.10k0

0.4550.7081.3232.0722.706據(jù)此表,可得(

)A.認為機動車駕駛技術(shù)與性別有關(guān)的穩(wěn)當(dāng)性缺乏50%

B.認為機動車駕駛技術(shù)與性別有關(guān)的穩(wěn)當(dāng)性超過50%C.認為機動車駕駛技術(shù)與性別有關(guān)的穩(wěn)當(dāng)性缺乏60%D.認為機動車駕駛技術(shù)與性別有關(guān)的穩(wěn)當(dāng)性超過60%答案A解析由表中數(shù)據(jù),計算K2=1004010-35152554575250.33670.455,認為機動車駕駛技術(shù)與性別有關(guān)的穩(wěn)當(dāng)性缺乏50%.應(yīng)選A.7.在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),,(x6,y6)的散點圖中,若全體樣本點(xi,yi)(i=1,2,,6)都在曲線y=bx2-13鄰近波動.經(jīng)計算6i=1xi=11,6i=1yi=13,6i=1x2i=21,那么實數(shù)b的值為________.答案57

解析令t=x2,那么曲線的回歸方程變?yōu)榫€性的回歸方程,即y=bt-13,此時t=6i=1x2i6=72,y-=6i=1yi6=136,代入y=bt-13,得136=b72-13,解得b=57.8.(2022廈門二模)某種細胞的存活率y(%)與存放溫度x(℃)之間具有線性相關(guān)關(guān)系,其樣本數(shù)據(jù)如表所示:

存放溫度x(℃)20151050-5-10存活率y(%)6142633436063計算得x-=5,y-=35,i=17xiyi=-175,i=17x2i=875,并求得回歸直線為y^=-2x+45.但測驗人員察覺表中數(shù)據(jù)x=-5的對應(yīng)值y=60錄入有誤,更正為y=53.那么更正后的回歸直線方程為________.參考公式:回歸方程y^=b^x+a^中斜率和截距的最小二乘估計公式分別為b^=

i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y(tǒng)--b^x-.答案y^=-1.9x+43.5解析由題意,更正后,x-=5,y-=17(357-60+53)=34,i=17xiyi=-175+560-553=-140,i=17x2i=875,b^=i=1nxiyi-nx-y-i=1nx2i-nx-2=-140-7534875-725=-1.9,a^=y(tǒng)--b^x-=34-(-1.9)5=43.5.更正后的回歸直線方程為y^=-1.9x+43.5.

組才能關(guān)1.變量X與Y相對應(yīng)的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應(yīng)的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的線性相關(guān)系數(shù),r2表示變量V與U之間的線性相關(guān)系數(shù),那么(

)A.r2r10

B.0r2r1

C.r20r1

D.r2=r1

答案C解析對于變量Y與X而言,Y隨X的增大而增大,故Y與X正相關(guān),即r10;對于變量V與U而言,V隨U的增大而減小,故V與U負相關(guān),即r20,應(yīng)選C.

2.某人研究中學(xué)生的性別與勞績、視力、智商、閱讀量這4個變量的關(guān)系,隨機抽查了52名中學(xué)生,得到統(tǒng)計數(shù)據(jù)如表1至表4,那么與性別有關(guān)聯(lián)的可能性最大的變量是(

)表1

勞績性別

不及格及格總計男61420女102232總計163652表2

視力性別

好差總計男41620女122032總計163652表3

智商性別

偏高正常總計男81220女82432總計163652表4

閱讀量性別

豐富不豐富總計男14620女23032總計163652

A.勞績

B.視力

C.智商

D.閱讀量答案D解析K21=52622-1014216362032,令5216362032=m,那么K21=82m,同理,K22=m(420-1216)2=1122m,K23=m(824-812)2=962m,K24=m(1430-62)2=4082m,K24>K22>K23>K21,那么與性別有關(guān)聯(lián)的可能性最大的變量是閱讀量.應(yīng)選D.3.(多項選擇)某商品的銷售量y(件)與銷售價格x(元/件)存在線性相關(guān)關(guān)系.根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,,n),用最小二乘法建立的回歸方程為y^=-5x+150,那么以下結(jié)論正確的是(

)A.y與x具有負的線性相關(guān)關(guān)系B.若r表示y與x之間的線性相關(guān)系數(shù),那么r=-5C.當(dāng)銷售價格為10元時,銷售量為100件D.當(dāng)銷售價格為10元時,銷售量為100件左右答案AD解析由回歸直線方程知,y與x具有負的線性相關(guān)關(guān)系,A正確,若r表示y與x之間的線性相關(guān)系數(shù),那么|r|1,B錯誤.當(dāng)銷售價格為10元時,y^=-510+150=100,即銷售量為100件左右,C錯誤,D正確,應(yīng)選AD.4.針對時下的"韓劇熱',某校團委對"學(xué)生性別和熱愛韓劇是否有關(guān)'作了一次調(diào)查,其中女生人數(shù)是男生人數(shù)的12,男生熱愛韓劇的人數(shù)占男生人數(shù)的16,女生熱愛韓劇的人數(shù)占女生人數(shù)的23.若有95%的把握認為是否熱愛韓劇和性別有關(guān),那么男生至少有________人.

P(K2k0)0.0500.0100.001

k0

3.8416.63510.828答案12解析設(shè)男生人數(shù)為x,由題意可得列聯(lián)表如下:

熱愛韓劇不熱愛韓劇總計男生x6

5x6x女生x3

x6

x2

總計x2

x3x2若有95%的把握認為是否熱愛韓劇和性別有關(guān),那么k3.841,即k=3x2x6x6-5x6x32xx2x2x=3x83.841,解得x10.243.由于x6,x3,x2為整數(shù),所以若有95%的把握認為是否熱愛韓劇和性別有關(guān),那么男生至少有12人.5.(2022惠州市其次次調(diào)研)某商場為了了解毛衣的月銷量y(件)與月平均氣溫x(℃)之間的關(guān)系,隨機統(tǒng)計了某4個月的月銷售量與當(dāng)月平均氣溫,其數(shù)據(jù)如下表:

月平均氣溫x/℃171382月銷售量y/件24334055由表中數(shù)據(jù)算出線性回歸方程y^=b^x+a^中的b^=-2,那么a^=________;氣象部門預(yù)料下個月的平均氣溫約為6℃,據(jù)此估計該商場下個月毛衣銷售量約為________件.答案5846解析由題中數(shù)據(jù),得x-=10,y-=38,回歸直線y^=b^x+a^過點(x-,y-),且b^=-2,代入得a^=58,那么回歸方程y^=-2x+58,所以當(dāng)x=6時,y=46.

6.(2022全國卷Ⅱ)下圖是某地區(qū)2000年至2022年環(huán)境根基設(shè)施投資額y(單位:億元)的折線圖.為了預(yù)料該地區(qū)2022年的環(huán)境根基設(shè)施投資額,建立了y與時間變量t的兩個線性回歸模型.根據(jù)2000年至2022年的數(shù)據(jù)(時間變量t的值依次為1,2,,17)建立模型①:y^=-30.4+13.5t;根據(jù)2022年至2022年的數(shù)據(jù)(時間變量t的值依次為1,2,,7)建立模型②:y^=99+17.5t.(1)分別利用這兩個模型,求該地區(qū)2022年的環(huán)境根基設(shè)施投資額的預(yù)料值;(2)你認為用哪個模型得到的預(yù)料值更穩(wěn)當(dāng)?并說明理由.

解(1)利用模型①,該地區(qū)2022年的環(huán)境根基設(shè)施投資額的預(yù)料值為y^=-30.4+13.519=226.1(億元).利用模型②,該地區(qū)2022年的環(huán)境根基設(shè)施投資額的預(yù)料值為y^=99+17.59=256.5(億元).(2)利用模型②得到的預(yù)料值更穩(wěn)當(dāng).理由如下:

(ⅰ)從折線圖可以看出,2000年至2022年的數(shù)據(jù)對應(yīng)的點沒有隨機散布在直線y=-30.4+13.5t上下,這說明利用2000年至2022年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境根基設(shè)施投資額的變化趨勢.2022年相對2022年的環(huán)境根基設(shè)施投資額有明顯增加,2022年至2022年的數(shù)據(jù)對應(yīng)的點位于一條直線的鄰近,這說明從2022年開頭環(huán)境根基設(shè)施投資額的變化規(guī)律呈線性增長趨勢,利用2022年至2022年的數(shù)據(jù)建立的線性模型y^=99+17.5t可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論