成對數(shù)據(jù)的統(tǒng)計(jì)分析-2025年高考數(shù)學(xué)備考復(fù)習(xí)_第1頁
成對數(shù)據(jù)的統(tǒng)計(jì)分析-2025年高考數(shù)學(xué)備考復(fù)習(xí)_第2頁
成對數(shù)據(jù)的統(tǒng)計(jì)分析-2025年高考數(shù)學(xué)備考復(fù)習(xí)_第3頁
成對數(shù)據(jù)的統(tǒng)計(jì)分析-2025年高考數(shù)學(xué)備考復(fù)習(xí)_第4頁
成對數(shù)據(jù)的統(tǒng)計(jì)分析-2025年高考數(shù)學(xué)備考復(fù)習(xí)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第九章統(tǒng)計(jì)與成對數(shù)據(jù)的統(tǒng)計(jì)分析

第3講成對數(shù)據(jù)的統(tǒng)計(jì)分析

課標(biāo)要求命題點(diǎn)五年考情命題分析預(yù)測

1.了解樣本相關(guān)系數(shù)的統(tǒng)2023天津T7,

計(jì)含義,了解樣本相關(guān)關(guān)成對數(shù)據(jù)的2022全國卷乙

系與標(biāo)準(zhǔn)化數(shù)據(jù)向量夾角相關(guān)性T19;2020全國本講是高考命題熱點(diǎn).對于

的關(guān)系;會通過相關(guān)系數(shù)卷UT18回歸分析,主要考查散點(diǎn)

比較多組成對數(shù)據(jù)的相關(guān)回歸模型及圖,回歸方程類型的識

2020全國卷IT5

性.其應(yīng)用另IJ,求相關(guān)系數(shù)和回歸方

2.了解一元線性回歸模型程,利用回歸方程進(jìn)行預(yù)

的含義,了解模型參數(shù)的測等;對于獨(dú)立性檢驗(yàn),

2023全國卷甲

統(tǒng)計(jì)意義,了解最小二乘主要考查列聯(lián)表和依據(jù)小

T19;2022新高

原理,掌握一元線性回歸概率值的獨(dú)立性檢驗(yàn),常

考卷IT20;2022

模型參數(shù)的最小二乘估計(jì)與概率綜合命題.題型以解

列聯(lián)表與獨(dú)全國卷甲T17;

方法;針對實(shí)際問題,會答題為主,難度中等.預(yù)計(jì)

立性檢驗(yàn)2021全國卷甲

用一元線性回歸模型進(jìn)行2025年高考會以創(chuàng)新生產(chǎn)

T17;2020新高

預(yù)測.生活實(shí)踐情境為載體考查

考卷IT19;2020

3.理解2X2列聯(lián)表的統(tǒng)回歸分析和獨(dú)立性檢驗(yàn).

全國卷niT18

計(jì)意義;了解2X2列聯(lián)

表獨(dú)立性檢驗(yàn)及其應(yīng)用.

a學(xué)生用書P217

1.變量的相關(guān)關(guān)系

(1)正相關(guān)和負(fù)相關(guān):從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)

①增加的趨勢,我們就稱這兩個(gè)變量②正相關(guān);當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)

變量的相應(yīng)值呈現(xiàn)③減小的趨勢,則稱這兩個(gè)變量⑷負(fù)相關(guān).

(2)線性相關(guān):一般地,如果兩個(gè)變量的取值呈現(xiàn)⑤正相關(guān)或⑥負(fù)相關(guān),而且散

點(diǎn)落在⑦一條直線附近,我們就稱這兩個(gè)變量線性相關(guān).

(3)非線性相關(guān)或曲線相關(guān):一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么

我們就稱這兩個(gè)變量非線性相關(guān)或曲線相關(guān).

2.樣本相關(guān)系數(shù)

(1)樣本相關(guān)系數(shù)r=?二?.

n2n2

X)£(-y)

/=i^i-x/=iyi

(2)樣本相關(guān)系數(shù)r的性質(zhì)

①當(dāng)r>0時(shí),稱成對樣本數(shù)據(jù)⑧正相關(guān);當(dāng)r<0時(shí),稱成對樣本數(shù)據(jù)⑨負(fù)相

關(guān);當(dāng)廠=0時(shí),只表明成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系,但不排除它們之間有其他相

關(guān)關(guān)系.

②IrIWL當(dāng)IrI越接近于1,成對樣本數(shù)據(jù)的線性相關(guān)性越⑩強(qiáng);IrI越接近于

0,成對樣本數(shù)據(jù)線性相關(guān)性越?弱.

3.一元線性回歸模型

(1)一元線性回歸模型

Y—bx+a+e,

我們稱,為y關(guān)于x的一元線性回歸模型.其中,y稱為因變量或響

E(e)=0,D(e)=OA

應(yīng)變量,X稱為自變量或解釋變量;。和6為模型的未知參數(shù),。稱為截距參數(shù),b稱為斜

率參數(shù);e是丫與6x+a之間的隨機(jī)誤差.

(2)經(jīng)驗(yàn)回歸方程與最小二乘估計(jì)

經(jīng)驗(yàn)回歸方程:y=bx+a.

n

A2(%i一盼Oi一夕)…yx^—nxy_

最小二乘估計(jì):b='z---------2-=?.i=l.-_,a—y—bx.

■z;

i=li=L

說明經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線.經(jīng)驗(yàn)

回歸直線過點(diǎn)(X,歹).

(3)殘差

對于響應(yīng)變量匕通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的9稱為預(yù)測

值,觀測值減去?預(yù)測值稱為殘差.

(4)決定系數(shù)

n2

S(%一%)n

決定系數(shù)尺2用來比較兩個(gè)模型的擬合效果,尺2=1—平------T其中Z(%一攵)2是殘差平

i=1

方和,R2越大(越接近I),表示殘差平方和越小,即模型的擬合效果越好;相越小,表

示殘差平方和越大,即模型的擬合效果越差.

4.列聯(lián)表與獨(dú)立性檢驗(yàn)

(1)2X2列聯(lián)表

一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值為{0,1},其樣本頻數(shù)列聯(lián)表(稱為

2X2列聯(lián)表)為:

XY合計(jì)

y=oY=1

x=oaba~\~b

X=1cdc~\~d

合計(jì)a+cb~\~d

(2)獨(dú)立性檢驗(yàn)

2

/2=一::工丫、,…“、.利用/的取值推斷分類變量x和y是否獨(dú)立的方法稱為%2獨(dú)立

(a十b)(c十d)(a十c)(b十d)

性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).

(3)臨界值

對于任何小概率值a,可以找到相應(yīng)的正實(shí)數(shù)%,使得P(f2Xa)=a成立,我們稱Xa為a

的臨界值,這個(gè)臨界值可作為判斷/大小的標(biāo)準(zhǔn).概率值a越小,臨界值x“?越大.

下表給出了2獨(dú)立性檢驗(yàn)中5個(gè)常用的小概率值和相應(yīng)的臨界值.

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

(4)基于小概率值a的檢驗(yàn)規(guī)則

當(dāng),22Xa時(shí),我們就推斷二?不成立,即認(rèn)為X和燉不獨(dú)立,該推斷犯錯(cuò)誤的

概率不超過a;

當(dāng)公<Xa時(shí),我們沒有充分證據(jù)推斷M不成立,可以認(rèn)為X和y?獨(dú)立.

說明若2越大,則兩個(gè)分類變量有關(guān)的把握越大.

1.下列四個(gè)散點(diǎn)圖中,變量X與y之間具有負(fù)的線性相關(guān)關(guān)系的是(D)

2.下列說法正確的是(D)

A.在經(jīng)驗(yàn)回歸方程?=—0.85x+2.3中,當(dāng)解釋變量x每增加1個(gè)單位時(shí),響應(yīng)變量平均減

少2.3個(gè)單位

B.若兩個(gè)變量的相關(guān)性越強(qiáng),則廠越接近于1

C.在回歸分析中,決定系數(shù)R2=O.8O的模型比決定系數(shù)相=0.98的模型擬合的效果要好

D.殘差平方和越小的模型,擬合的效果越好

解析對于A,根據(jù)經(jīng)驗(yàn)回歸方程,當(dāng)解釋變量x每增加1個(gè)單位時(shí),響應(yīng)變量,平均減少

0.85個(gè)單位,故A錯(cuò)誤;對于B,若兩個(gè)變量的相關(guān)性越強(qiáng),則Irl越接近于1,故B錯(cuò)

誤;對于C,用決定系數(shù)尺2的值判斷模型的擬合效果,尺2越大,模型的擬合效果越好,所

以C錯(cuò)誤;對于D,由殘差的統(tǒng)計(jì)學(xué)意義知,D正確.

3.為考查某種營養(yǎng)品對兒童身高增長的影響,選取部分兒童進(jìn)行試驗(yàn),根據(jù)100個(gè)有放回

簡單隨機(jī)樣本的數(shù)據(jù),得到如下列聯(lián)表,由表可知下列說法正確的是(D)

身高

營養(yǎng)品合計(jì)

有明顯增長無明顯增長

食用a1050

未食用b3050

合計(jì)6040100

A.a=6=30

B.廣仁12.667

C.從樣本中隨機(jī)抽取1名兒童,抽到食用該營養(yǎng)品且身高有明顯增長的兒童的概率是q

D.根據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),可以認(rèn)為該營養(yǎng)品對兒童身高增長有影響

解析由題可知a=50—10=40,6=50—30=20,所以A錯(cuò)誤;%2=

2

looxyso-D26.667>1O.828=XOOOI,所以根據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),

可以認(rèn)為該營養(yǎng)品對兒童身高增長有影響,所以B錯(cuò)誤,D正確;從樣本中隨機(jī)抽取1名

兒童,抽到食用該營養(yǎng)品且身高有明顯增長的兒童的概率是孤=|,所以C錯(cuò)誤.

4.[2023福州5月質(zhì)檢]已知變量x和y的統(tǒng)計(jì)數(shù)據(jù)如下表:

X678910

y3.54566.5

若由表中數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為9=0.8x+6,則x=10時(shí)的殘差為一0.1.(注:觀測

值減去預(yù)測值稱為殘差)

解析易知元=8,y=5,.*.a=5—0.8X8=—1.4,.?.x=10時(shí),夕=811.4=6.6,/.x=10

時(shí)的殘差為6.5-6.6=-0.1.

h學(xué)生用書P219

命題點(diǎn)1成對數(shù)據(jù)的相關(guān)性

角度1判斷兩個(gè)變量的相關(guān)性

例1(1)已知變量x和歹近似滿足關(guān)系式y(tǒng)=-O.lx+1,變量〉與z正相關(guān).下列結(jié)論中正

確的是(C)

A.x與y正相關(guān),x與z負(fù)相關(guān)

B.x與歹正相關(guān),x與2正相關(guān)

C.%與y負(fù)相關(guān),x與z負(fù)相關(guān)

D.x與y負(fù)相關(guān),x與z正相關(guān)

解析由y=-O.lx+l,知x與y負(fù)相關(guān),即y隨x的增大而減小,又y與z正相關(guān),所以

z隨y的增大而增大,隨丁的減小而減小,所以z隨x的增大而減小,x與z負(fù)相關(guān).

(2)[2023湖北仙桃中學(xué)模擬]對四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì)后,獲得了如圖所示的散點(diǎn)圖,四組

數(shù)據(jù)的相關(guān)系數(shù)分別為小03%,對各組的相關(guān)系數(shù)進(jìn)行比較,正確的是(C)

第一組第二組

1

;_J

n'?n1

第三組第四組

A.r3<r2<0<n<r4B.r4<n<0<r2<n

C.r2<n<0<r4<nD.?"i<r4<0<r3<r2

解析由題圖可知,第一、四組數(shù)據(jù)均正相關(guān),第二、三組數(shù)據(jù)均負(fù)相關(guān),當(dāng)相關(guān)系數(shù)的

絕對值越大時(shí),數(shù)據(jù)的線性相關(guān)性越強(qiáng).第一組數(shù)據(jù)的線性相關(guān)性較第四組強(qiáng),則>7-4>

0,第二組數(shù)據(jù)的線性相關(guān)性較第三組強(qiáng),則I/2I>I廠3I,且廠2<0,廠3<0,則廠2<『3<

0.

因此,廠2<廠3<0<7'4<,1.故選C.

方法技巧

判斷兩個(gè)變量相關(guān)性的3種方法

若點(diǎn)的分布從左下角到右上角,則兩個(gè)變量正相關(guān);若點(diǎn)的分布從左上角到

畫散點(diǎn)圖

右下角,則兩個(gè)變量負(fù)相關(guān).

利用樣本相

廠>0時(shí),正相關(guān);廠<0時(shí),負(fù)相關(guān);1川越接近于1,線性相關(guān)性越強(qiáng).

關(guān)系數(shù)

利用經(jīng)驗(yàn)回AA

b>0時(shí),正相關(guān);6<0時(shí),負(fù)相關(guān).

歸方程

角度2相關(guān)系數(shù)的計(jì)算

例2[2022全國卷乙]某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計(jì)一林區(qū)

某種樹木的總材積量,隨機(jī)選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:

m2)和材積量(單位:n?),得到如下數(shù)據(jù):

樣本號i12345678910總和

根部橫截

0.040.060.040.080.080.050.050.070.070.060.6

面積Xi

材積量yi0.250.400.220.540.510.340.360.460.420.403.9

101010

并計(jì)算得Z蠟=0.038,Z*=L6158,ZX%?=0.2474.

i=li=li=l

(1)估計(jì)該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量.

(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01).

(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積

總和為186nl2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)

這種樹木的總材積量的估計(jì)值.

n

X(石一盼(力一歹)y_______

附:相關(guān)系數(shù)r=-曰,VL896^1.377.

n2n2

x(%廠%)i(乃一歹)

小=1i=l

10

2%inr

解析(1)估計(jì)該林區(qū)這種樹木平均一棵的根部橫截面積±=濡-=.=0.06,估計(jì)該林區(qū)

10

XOQ

這種樹木平均一棵的材積量歹=用-=而=0.39.

1010

(2)£(汨一無)(%一歹)=2孫,-1°雙=°?°134,

i=l1=1

10

2107

Z(%i-%)=Sx?-10x=0.002,

i=li=l

210

=ZyHioy?-0-0948,

i=l

102102________________________________________________________

JX(%i一元)z(%一歹)=V0.002x0.0948=70.0001x1.896^0.01X1.377=

i=li=l

io

0.01377,所以樣本相關(guān)系數(shù)尸=??=]名"0.97.

1021020?01377

Z(xj—x)2(yj—y)

?Ji=li=l

(3)設(shè)該林區(qū)這種樹木的總材積量的估計(jì)值為Km*3,由題意可知,該種樹木的材積量與

其根部橫截面積近似成正比,所以生=與,所以¥=吟譽(yù)=1209,

0.061860.06

即該林區(qū)這種樹木的總材積量的估計(jì)值為12091n3.

訓(xùn)練1變量X與Y相對應(yīng)的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,

4),(13,5);變量U與k相對應(yīng)的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,

3),(12,5,2),(13,1)刀表示變量丫與X之間的線性相關(guān)系數(shù),廠2表示變量廠與U

之間的線性相關(guān)系數(shù),則(C)

A.;"2<n<0B.0<r2<n

C.r2<0</*iD/2=,I

解析由題中的數(shù)據(jù)可知,變量y與x正相關(guān),相關(guān)系數(shù)n>0,變量%與u負(fù)相關(guān),相

關(guān)系數(shù)r2c0,即『2<001.故選C.

命題點(diǎn)2回歸模型及其應(yīng)用

角度1一元線性回歸模型

例3[2023廣西聯(lián)考]某省為調(diào)查北部城鎮(zhèn)2022年GDP,抽取了20個(gè)城鎮(zhèn)進(jìn)行分析,得到

樣本數(shù)據(jù)(X;,yt')(z=l,2,???,20),其中方和川分別表示第,個(gè)城鎮(zhèn)的人口(單位:

202020

萬人)和該城鎮(zhèn)2022年GDP(單位:億元),計(jì)算得ZM=100,1^=800,2(x,—x)

i=li=li=l

2020

2=70,Z(%一歹)2=280,Z(XL元)(“一歹)=120.

i=l'i=l

(1)請用相關(guān)系數(shù)r判斷該組數(shù)據(jù)中/與x之間線性相關(guān)關(guān)系的強(qiáng)弱(若"I£[0.75,

1],相關(guān)性較強(qiáng);若“I£[0.30,0.75),相關(guān)性一般;若re[—0.25,0.25],相關(guān)性較

弱).

(2)求y關(guān)于x的線性回歸方程.

(3)若該省北部某城鎮(zhèn)2024年的人口約為5萬人,根據(jù)(2)中的線性回歸方程估計(jì)該城

鎮(zhèn)2024年的GDP.

n

Z(占一元)(%一歹)

參考公式:相關(guān)系數(shù)>=一力=,對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(如

n2n2

E(Xi-x)£(7i-y)

[i=li=l

yt)M=l,2,n),其回歸直線5>=bx+a的斜率和截距的最小二乘估計(jì)分別為6=

n

Z(Xi-X)(yj—y)A

0f---------2-,a=y—bx.

Z(%「遇

i=l

20

Z(xj—x)(yi—y)-inn12n

解析(1)由題意知,相關(guān)系數(shù)曰=穿赤=搭-0.857,

202202V70X280140

2(xj-x)Z(%一歹)

、i=li=l

因?yàn)椤放cX的相關(guān)系數(shù)尸滿足I尸I£[0.75,1],所以歹與X之間具有較強(qiáng)的線性相關(guān)關(guān)系.

20

AE(石一盼(力一歹)12nI?

(2)----------=^11,

弋/_、2707

Z(Xj—X)

i=l

八—-80012、/100220匚匚[、[人12,220

7所以

a=,y—bx=—20—7X—20=7—,)y=7f+—7.

(3)由(2)可估計(jì)該城鎮(zhèn)2024年的GDP尸與X5+竽=40(億元).

方法技巧

回歸模型問題的類型及解題方法

(1)求經(jīng)驗(yàn)回歸方程:

①利用數(shù)據(jù),求出匕y;

②利用公式,求出回歸系數(shù)b;

③利用經(jīng)驗(yàn)回歸直線過樣本點(diǎn)的中心(焉歹),求a.

(2)利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測:直接將已知的自變量的某個(gè)數(shù)值代入經(jīng)驗(yàn)回歸方程求得

特定要求下的預(yù)測值.

(3)判斷回歸模型的擬合效果:利用殘差平方和或決定系數(shù)R2判斷,R2越大,表示殘差

平方和越小,即模型的擬合效果越好.

角度2非線性回歸模型

例4:2023重慶市三檢]已知變量y關(guān)于x的經(jīng)驗(yàn)回歸方程為y=e^-06,若對y=e"-"兩

邊取自然對數(shù),可以發(fā)現(xiàn)Iny與x線性相關(guān),現(xiàn)有一組數(shù)據(jù)如表所示:

X12345

yee3e4e6e7

則當(dāng)x=6時(shí),預(yù)測y的值為(C)

A.9B.8C.e9D.e8

解析對丫=於*—。6兩邊取自然對數(shù),得lny=bx—0.6,令z=lny,則z=bx—0.6,數(shù)據(jù)為

X12345

yee3e,e6e7

z13467

由表格數(shù)據(jù),得無=3,2=1+3+:+。+/=42將(3,4.2)代入z=bx—0.6,得

4.2=36-0.6,(方法技巧:經(jīng)驗(yàn)回歸方程只含一個(gè)未知數(shù)問題主要是依據(jù)經(jīng)驗(yàn)回歸直線

y=bx+a必過樣本點(diǎn)的中心(元,歹)求解)

16x

解得6=1.6,所以z=1.6x—0.6,即曠=e16x-o.6,當(dāng)x=6時(shí),y—e6-o.6_e9^故選c.

方法技巧

1.解決非線性回歸模型問題的思路:根據(jù)數(shù)據(jù)的散點(diǎn)圖,選擇恰當(dāng)?shù)臄M合函數(shù),用適當(dāng)?shù)?/p>

變量進(jìn)行轉(zhuǎn)換,如通過換元或取對數(shù)等方法,把問題化為線性回歸模型問題,使之得到解

決.

2.常見的非線性回歸模型及轉(zhuǎn)換技巧

(1)y-a+~,令v=L則丫=(2+加;

XX

(2)y=a+blnx(b0),令k=lnx,則y=a+6/;

(3)y=axb(a>0,6W0),令c=lna,i^lnx,u=lny,則〃=c+6/;

(4)y—aebx(a>0,6/0),令c=lna,z/=lny,則〃=c+6x.

訓(xùn)練2[2023合肥市質(zhì)檢]研究表明,溫度的突然變化會引起機(jī)體產(chǎn)生呼吸道上皮組織的生

理不良反應(yīng),從而導(dǎo)致呼吸系統(tǒng)疾病的發(fā)生或惡化.某中學(xué)數(shù)學(xué)建模社團(tuán)成員欲研究晝夜溫

差大小與該校高三學(xué)生患感冒人數(shù)多少之間的關(guān)系,他們記錄了某周連續(xù)六天的晝夜溫

差,并到校醫(yī)務(wù)室查閱了這六天中每天高三學(xué)生新增患感冒而就診的人數(shù)(假設(shè)患感冒必

到校醫(yī)務(wù)室就診),得到資料如下:

日期第一天第二天第三天第四天第五天第六天

晝夜溫差x/°C47891412

新增就診人數(shù)y/位必

66

參考數(shù)據(jù):2淄=3160,25一歹)2=256.

i=li=l

(1)已知第一天新增患感冒而就診的學(xué)生中有7位女生,從第一天新增患感冒而就診的學(xué)

生中隨機(jī)抽取3位,若抽取的3人中至少有一位男生的概率為?,求力的值;

(2)已知兩個(gè)變量x與y之間的樣本相關(guān)系數(shù)廠=荒,試用最小二乘法求出y關(guān)于x的經(jīng)驗(yàn)

回歸方程9=區(qū)+6,據(jù)此估計(jì)晝夜溫差為15。(2時(shí),該校高三新增患感冒而就診的學(xué)生數(shù)

(結(jié)果保留整數(shù)).

n

AZy)

參考公式:un2

£(Xj—X)

i=l

7x6x5_7

yi(yi-i)(yi-2)24’

Ayi(8一1)(刃一2)=720=10X9X8,:.yi=10.

66

(2)*.*Z?=54,?,?元=9,X(Xz—%)2=64.

i=li=l

6_6

=]=izl___________________=_,y(丫一歹)(%一歹)

[~6―2328X1616'1g(,=8X15,

'z(%i-x)?X(yi-y)

i=l、|i=l

6

.;_苕⑸一盼5—歹)_8xi5_i5

??bL——z-一T,

(Xj—x)

i=l

6666AA

又£(〃?一歹)2=£*—2歹?£功+6歹92=£*—6歹92=256,解得歹=22,:.a=y—bx=22—

i=li=li=li=l

—X9=—

88

AA

.41?15*D_L41,15'.[二?”

當(dāng)時(shí),

.-y——88x=158y=8—+—X15^33,

故可以估計(jì)晝夜溫差為15。(3時(shí),該校高三新增患感冒而就診的學(xué)生數(shù)為33.

命題點(diǎn)3列聯(lián)表與獨(dú)立性檢驗(yàn)

例5[2022全國卷甲改編]甲、乙兩城之間的長途客車均由4和8兩家公司運(yùn)營.為了解這兩

家公司長途客車的運(yùn)行情況,隨機(jī)調(diào)查了甲、乙兩城之間的500個(gè)班次,得到下面列聯(lián)

表:

準(zhǔn)點(diǎn)班次數(shù)未準(zhǔn)點(diǎn)班次數(shù)

A24020

B21030

(1)根據(jù)上表,分別估計(jì)這兩家公司甲、乙兩城之間的長途客車準(zhǔn)點(diǎn)的概率;

(2)依據(jù)小概率值a=0.1的獨(dú)立性檢驗(yàn),分析甲、乙兩城之間的長途客車是否準(zhǔn)點(diǎn)與客車

所屬公司有關(guān).

2

nCad—be).,..

附:Z2-;-------;--------;------;~-,n=a~rb~rC~ru.y

(a+b)(c+d)(a+c)(b+d)

a0.10.0500.0100.001

Xa2.7063.8416.63510.828

解析(1)由題表可得/公司甲、乙兩城之間的長途客車準(zhǔn)點(diǎn)的概率為

240+2013

8公司甲、乙兩城之間的長途客車準(zhǔn)點(diǎn)的概率為三+=£

210+308

(2)零假設(shè)為H):甲、乙兩城之間的長途客車是否準(zhǔn)點(diǎn)與客車所屬公司無關(guān).根據(jù)2X2列

聯(lián)表,

500x(240x30—20x210)

可得/==3.205>2.706=xo.i,

(240+20)x(210+30)x(240+210)x(20+30)

根據(jù)小概率值Q=0.1的獨(dú)立性檢驗(yàn),我們推斷H)不成立,

即認(rèn)為甲、乙兩城之間的長途客車是否準(zhǔn)點(diǎn)與客車所屬公司有關(guān).

方法技巧

獨(dú)立性檢驗(yàn)的一般步驟

(1)提出零假設(shè)員;

(2)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表;

n(ad-be)

(3)根據(jù)公式*2=計(jì)算

(a+b)(c+d)(a+c)(b+d)

(4)比較22與臨界值超的大小關(guān)系,根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.

訓(xùn)練3某市針對電動自行車騎乘人員是否佩戴安全頭盔問題進(jìn)行調(diào)查,在隨機(jī)調(diào)查的1000

名騎行人員中,記錄其年齡(單位:歲)和是否佩戴頭盔情況,得到如圖所示的統(tǒng)計(jì)圖:

(1)估算該市電動自行車騎乘人員的平均年齡.

(2)根據(jù)所給的數(shù)據(jù),完成下面的列聯(lián)表:

單位:名

是否佩戴頭盔

年齡/歲合計(jì)

是否

[20,40)

[40,70]

合計(jì)

(3)根據(jù)(2)中的列聯(lián)表,依據(jù)a=0.010的獨(dú)立性檢驗(yàn),能否認(rèn)為遵守佩戴安全頭盔規(guī)

則與年齡有關(guān)?

2

附._____n

Sdic>_______〃=a+b+c+".

'"(a+b)(c+d)(a+c)(b+d)

a0.0500.0100.001

3.8416.63510.828

解析(1)該市電動自行車騎乘人員的平均年齡為25X0.25+35X0.35+45X0.2+

55X0.15+65X0.05=39(歲).

(2)依題意,完成列聯(lián)表如下:

單位:名

是否佩戴頭盔

年齡/歲合計(jì)

是否

[20,40)54060600

[40,70]34060400

合計(jì)8801201000

(3)零假設(shè)為/To:遵守佩戴安全頭盔規(guī)則與年齡無關(guān).

由表得/=1000X(540x60340x60)125

600x400x880x120—^5.682<6.635=xo.oio,

根據(jù)小概率值a=0.010的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷M不成立,

因此可以認(rèn)為為成立,即認(rèn)為遵守佩戴安全頭盔規(guī)則與年齡無關(guān).

1.[命題點(diǎn)1角度1〃023天津高考]調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示.其

中相關(guān)系數(shù)r=0.8245,下列說法正確的是(C)

A.花瓣長度和花萼長度沒有相關(guān)性

B.花瓣長度和花萼長度呈負(fù)相關(guān)

C.花瓣長度和花萼長度呈正相關(guān)

D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245

解析因?yàn)橄嚓P(guān)系數(shù)r=0.8245>0.75,所以花瓣長度和花萼長度的相關(guān)性較強(qiáng),并且呈正

相關(guān),所以選項(xiàng)A,B錯(cuò)誤,選項(xiàng)C正確;因?yàn)橄嚓P(guān)系數(shù)與樣本的數(shù)據(jù)有關(guān),所以當(dāng)樣本

發(fā)生變化時(shí),相關(guān)系數(shù)也會發(fā)生變化,所以選項(xiàng)D錯(cuò)誤.故選C.

2.[命題點(diǎn)1,2/2024濟(jì)南市摸底考試]隨著科技的發(fā)展,網(wǎng)購成了人們購物的重要選擇,

并對實(shí)體經(jīng)濟(jì)產(chǎn)生了一定影響.為了解實(shí)體經(jīng)濟(jì)的現(xiàn)狀,某研究機(jī)構(gòu)統(tǒng)計(jì)了一個(gè)大商場

2018—2022年的線下銷售額,如下表:

年份編號X12345

年份20182019202020212022

銷售額4萬元1513146512021060860

(1)由表中數(shù)據(jù)可以看出,可用經(jīng)驗(yàn)回歸模型擬合銷售額y與年份編號x的關(guān)系,請用相

關(guān)系數(shù)加以說明;

(2)建立y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測2024年該商場的線下銷售額.

參考公式及數(shù)據(jù):

^xiyi-nxy

相關(guān)系數(shù)廠=i=l

i=li=l

對于一組數(shù)據(jù)(制,歹1),(%2,J2)(羽,力),其經(jīng)驗(yàn)回歸直線$=2+八的斜率

n

A

Az—TIXyA55

=

和截距的最小二乘估計(jì)公式分別為b=2a=y—bx.X^6100,£汨%=16589,

Xx^—nxi=li=l

i=l

5959

(2靖—5/)(乞*一592)736.

、i=li=l

5

解析(1)由已知數(shù)據(jù)可得,元=I+2+”+5=3,歹=用=等£=1220,

5

所以1>"一51歹=16589—5X3X1220=—1711,

i=l

5

2片力一5元歹

—1711

所以相關(guān)系數(shù)ri=l~一^^一0.9856.

(£x?-5z2)(Ey?-5y2)1736

i=li=f

因?yàn)椤癐非常接近1,

所以可用經(jīng)驗(yàn)回歸模型擬合銷售額》與年份編號X的關(guān)系.

5cAYxiyi-Sxy

22222711

(2)由已知數(shù)據(jù)可得,1%?=1+2+3+4+5=55,所以力=胃------=2=~

i=lz蠟—5元255—5x3

i=l

171.1,

AA

a—y—bx—1220—(—171.1)X3=l733.3,

所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為$=—171.1x+l733.3.

令x=7,貝.=一171.1X7+1733.3=535.6(萬元),

所以預(yù)測2024年該商場的線下銷售額為535.6萬元.

3.[命題點(diǎn)3,021全國卷甲改編]甲、乙兩臺機(jī)床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級品和

二級品,為了比較兩臺機(jī)床產(chǎn)品的質(zhì)量,分別用兩臺機(jī)床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)

量情況統(tǒng)計(jì)如下表:

單位:件

一級品二級品合計(jì)

甲機(jī)床15050200

乙機(jī)床12080200

合計(jì)270130400

(1)甲機(jī)床、乙機(jī)床生產(chǎn)的產(chǎn)品中一*級品的吃頃率分別是多少?

(2)依據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),分析甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量是

否有差異.

2

a0.0500.0100.001

Xa3.8416.63510.828

解析(1)由題意,可得甲機(jī)床、乙機(jī)床生產(chǎn)的產(chǎn)品總數(shù)均為200件,

因?yàn)榧讬C(jī)床生產(chǎn)的產(chǎn)品中一級品的頻數(shù)為150,所以甲機(jī)床生產(chǎn)的產(chǎn)品中一級品的頻率為

黑=。-75,

因?yàn)橐覚C(jī)床生產(chǎn)的產(chǎn)品中一級品的頻數(shù)為120,所以乙機(jī)床生產(chǎn)的產(chǎn)品中一級品的頻率為

黑=。6

(2)零假設(shè)為灰:甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量無差異.

2

則根據(jù)列聯(lián)表中的數(shù)據(jù)計(jì)算得/=4。。;;:黑黑黑。)?10.256>6.635=x0.01.

所以依據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),推斷M不成立,

即認(rèn)為甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量有差異,此推斷犯錯(cuò)誤的概率不大于0.01.

F練習(xí)幫,練透好題精準(zhǔn)分層

c學(xué)生用書?練習(xí)幫P378

■礎(chǔ)博知F0關(guān)〕

1.在用經(jīng)驗(yàn)回歸方程研究四組數(shù)據(jù)的擬合效果時(shí),分別作出下列四個(gè)關(guān)于四組數(shù)據(jù)的殘差

圖,則用線性回歸模型擬合效果最佳的是(A)

CD

解析用殘差圖判斷模型的擬合效果時(shí),殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明

這樣的模型比較合適,帶狀區(qū)域的寬度越窄,說明模型的擬合效果越好.故選A.

2.[全國卷I]某校一個(gè)課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單位:℃)的

關(guān)系,在20個(gè)不同的溫度條件下進(jìn)行種子發(fā)芽實(shí)驗(yàn),由實(shí)驗(yàn)數(shù)據(jù)(x”■?)(/=1,

2,20)得到如圖所示的散點(diǎn)圖.

由此散點(diǎn)圖,在10。(2至40P之間,下面四個(gè)回歸方程類型中最適宜作為發(fā)芽率y和溫度

x的回歸方程類型的是(D)

A.y—a+bxB.y—a-\-bx2

C.y=a+be*D.y=a+61nx

解析由散點(diǎn)圖可以看出,隨著溫度x的增加,發(fā)芽率y增加到一定程度后,變化率越來

越慢,符合對數(shù)型函數(shù)的圖象特征.

3.[2024江蘇徐州模擬]如圖,在一組樣本數(shù)據(jù)/(2,2),B(4,

3),C(6,4),。(8,7),E(10,6)的散點(diǎn)圖中,若去掉。

()則下列說法正確的為()

8,7,D?I

A.樣本相關(guān)系數(shù)r變小

B.殘差平方和變大

C.決定系數(shù)R2變小

D.自變量x與因變量了的相關(guān)程度變強(qiáng)

解析由散點(diǎn)圖分析可知,只有。點(diǎn)偏離直線較遠(yuǎn),去掉。點(diǎn)后,X與y的線性相關(guān)程度

變強(qiáng),且為正相關(guān),所以樣本相關(guān)系數(shù)7?變大,決定系數(shù)尺2變大,殘差平方和變小,故選

D.

4.[2024青島市檢測]已知某設(shè)備的使用年限x(年)與年維護(hù)費(fèi)用y(千元)的對應(yīng)數(shù)據(jù)

如下表:

X24568

y34.56.57.59

由所給數(shù)據(jù)分析可知:x與y之間具有線性相關(guān)關(guān)系,且y關(guān)于x的經(jīng)驗(yàn)回歸方程為y=

1.05x+a,貝愴=(B)

A.0.75B.0.85C.0.95D.1.05

2+4+;+6+83+4,5+6^5+7.5+9

解析由題意可知元==5,-==6貝|6.1=1.05X5+2,所以

6.1-1.05X5=0.85,故選B.

5.[多選〃024九江模擬]根據(jù)最小二乘法,由一組樣本點(diǎn)(注,%)(其中i=l,2,…,

A

300)求得的經(jīng)驗(yàn)回歸方程是夕=云+篦則下列說法正確的是(BD)

A

A.至少有一個(gè)樣本點(diǎn)落在經(jīng)驗(yàn)回歸直線夕=bx+2上

B.若所有樣本點(diǎn)都在經(jīng)驗(yàn)回歸直線y=£+6上,則變量間的相關(guān)系數(shù)為土1

A

C.對所有的解釋變量羽(i=l,2,300),的值一定與M有誤差

AA

D.若經(jīng)驗(yàn)回歸直線夕=取+4的斜率b>0,則變量x與y正相關(guān)

解析經(jīng)驗(yàn)回歸直線必過樣本點(diǎn)的中心,但樣本點(diǎn)可能都不在經(jīng)驗(yàn)回歸直線上,故A錯(cuò)

誤;若所有樣本點(diǎn)都在經(jīng)驗(yàn)回歸直線9=取+4上,則變量間的相關(guān)系數(shù)為土1,故B正

確;若所有的樣本點(diǎn)都在經(jīng)驗(yàn)回歸直線尸£+今上,則短+a的值與%相等,故c錯(cuò)誤;

相關(guān)系數(shù)廠與‘符號相同,若經(jīng)驗(yàn)回歸直線9=£+a的斜率則r>0,樣本點(diǎn)散布在

從左下角到右上角的區(qū)域,則變量x與y正相關(guān),故D正確.故選BD.

6.[多選2024貴州統(tǒng)考]某學(xué)校高三年級甲、乙兩班共105人進(jìn)行了一次數(shù)學(xué)測試.按照成

績大于或等于120分(滿分150分)的同學(xué)評價(jià)為“優(yōu)秀生”,其他分?jǐn)?shù)的同學(xué)評價(jià)為

“潛力生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論