統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析_第1頁
統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析_第2頁
統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析_第3頁
統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析_第4頁
統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二十二講:統(tǒng)計初步及成對數(shù)據(jù)的統(tǒng)計分析

【考點梳理】

1.統(tǒng)計初步

(1)隨機抽樣:簡單隨機抽樣,分層抽樣

(2)用樣本估計總體:頻率分布直方圖,樣本數(shù)字特征(百分位數(shù)、平均數(shù)、眾數(shù)、中位數(shù)、方差、

標準差)

特征數(shù)具體數(shù)字算法頻率分布直方圖(表)

眾數(shù)次數(shù)出現(xiàn)最多的數(shù)字頻率最大或最高組的中間值

中位數(shù)樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間

的數(shù)據(jù).如果數(shù)據(jù)的個數(shù)為偶數(shù),就取當中兩

個數(shù)據(jù)的平均數(shù)作為中位數(shù)

平均數(shù)所有數(shù)字之和除以總個數(shù)每個小矩形面積乘以小矩形底邊中點的橫坐

標之和

方差2++(—]

平均數(shù)反映了數(shù)據(jù)取值的平均水平,標準差、方差描述了一組數(shù)據(jù)波動的大小.標準差、方差越大,數(shù)據(jù)

的離散程度越大,越不穩(wěn)定;標準差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定

2.成對數(shù)據(jù)的統(tǒng)計分析

(1)相關關系,(2)回歸分析,(3)獨立性檢驗

【典型題型講解】

考點一:抽樣:簡單隨機抽樣分層抽樣

【典例例題】

例1.某工廠利用隨機數(shù)表對生產(chǎn)的700個零件進行抽樣測試,先將700個零件進行編號,001,002,.........

699,700.從中抽取70個樣本,下圖提供隨機數(shù)表的第4行到第6行,若從表中第5行第6列開始向右讀取

數(shù)據(jù),則得到的第6個樣本編號是()

32211834297864540732524206443812234356773578905642

84421253313457860736253007328623457889072368960804

32567808436789535577348994837522535578324577892345

A.623B.328C.253D.007

【答案】A

【解析】從第5行第6列開始向又讀取數(shù)據(jù),

第一個數(shù)為253,第二個數(shù)是313,第三個數(shù)是457,

下一個數(shù)是860,不符合要求,下一個數(shù)是736,不符合要求,下一個是253,重復,

第四個是007,第五個是328,第六個是623.

故選:A.

例2.2022年7月24日,搭載問天實驗艙的長征五號B1000人,高二學生800人,高三學生1200人,為了調

查該校學生對我國航天事業(yè)的了解程度,現(xiàn)從三個年級中采用分層抽樣的方式抽取60人填寫問卷調查,則

高三年級有多少人被抽中()

A.16B.18C.20D.24

【答案】D

【解析】由分層抽樣原則可知:高三年級應抽取曾,”c=24人.

1000+800+1200

故選:D.

【方法技巧與總結】

根據(jù)樣本數(shù)據(jù)的特點要判定采用隨機簡單抽樣和分層抽樣

【變式訓練】

1.某個年級有男生180人,女生160人,用分層抽樣的方法從該年級全體學生中抽取一個容量為68的樣本,

則此樣本中女生人數(shù)為()

A.40B.36C.34D.32

【答案】D

【解析】由題意得:樣本中女生人數(shù)為68x32.

故選:D

2.某中學為了掌握學校員工身體狀況,偶爾會采用抽檢的方式來收集各部門員工的健康情況.為了讓樣本更

具有代表性,學校對各部門采用分層抽樣的方法進行抽檢.已知該校部門A、部門8、部門C分別有40、

60、80人,各部門員工不存在交叉任職情況,若共抽檢了90人,則部門A抽檢人數(shù)為.

【答案】20

【解析】由題意得從部「JA抽檢人數(shù)為90xk^^=20(人),

故答案為:20

3.某市甲、乙、丙三所學校的高三學生共有800名,其中男、女生人數(shù)如下表:

甲校乙校丙校

9790X

女生153160y

(1)現(xiàn)用分層隨機抽樣的方法從這三所學校的所有高三學生中抽取48人,則應從丙校抽取多少人?

(2)該市??己?,市教研室準備從這三所學校的所有高三學生中利用隨機數(shù)法抽取100人進行成績統(tǒng)計分析,

將800人按001,002,800進行編號,如果從第8行第7列的數(shù)開始向右讀,請你依次寫出最先抽取

的4個人的編號.(下面摘取了隨機數(shù)表第7行至第9行)

84421753315724550688770474476721763350268392

63015316591692753816582170717512867358074439

13263321134278641607825207443815032442997931

【解析】⑴根據(jù)題意可得丙校共有“k8(刈-(97+153+90+160)=300人,

根據(jù)分層抽樣規(guī)則可得,應從丙校抽取4就8x3OO=18人.

oOu

(2)第8行第7列的數(shù)為1,從數(shù)1開始向右讀,則最先抽取的4個人的編號為165,538,707,175.

考點二:樣本數(shù)字特征

【典例例題】

例1.(2022?廣東中山?高三期末)甲、乙兩支田徑隊的體檢結果為:甲隊體重的平均數(shù)為60kg,方差為200,

乙隊體重的平均數(shù)為70kg,方差為300,又已知甲、乙兩隊的隊員人數(shù)之比為1:4,那么甲、乙兩隊全部

隊員的平均體重和方差分別是()

A.65,280B.68,280C.65,296D.68,296

【答案】B

【解析】設甲隊有a人,甲、乙兩隊的隊員人數(shù)之比為1:4,則乙隊有4a人,

因為甲隊體重的平均數(shù)為60,乙隊體重的平均數(shù)為70,

則甲、乙兩隊全部隊員的平均體重為

-60-a+70-4o

x=-----------=68,

5a

甲隊體重的方差

.d=-[(x,-60)2+(x-60)2+-+(x-60)2]=200

a2a

=—[(x;+x:++x;)+。?6()2—2x60x(x+占++X)]

a-(a

=_[(x:+x;++x;)+a-602-2x60x(60-a)]=200

a

則x;+x;++x;=200a+〃6。2

乙隊體重的方差為

s;=;[(乂-70)2+(%-70)2++(加?70)2]=300

=;[(犬+貨++>i)+4a.702-2x70x(y+%++%)]

=L(y;+4++犬,)+44.7()2-2X70X(70-4a)]=300

4。

2

貝+++y^a=300-4a+4^-70

甲、乙兩隊全部隊員體重的方差為

_[(X,-68)2+(X-68)2++(/-632_2+(%一68)2++(y-68)2]

s2一2]+[(y)68)4fl

5a

——[(x;+x;++芍)+Q?68?—2x68x(%+/++4)]+

5a

41(犬+£++yl,)+4a-682-2x68x(y,+y,++%)]

ja

=—[(200a+a602)+a-682-2x68x(60-a)]+—[(300.4a+4a-702)+4?-682-2x68x(70.4a)]

5a5a

故選:B.

例2.(2022?廣東深圳?高三期末)為了分析某次考試的情況,隨機抽取了若干學生,將其考試成績分組為:

[60,70),[70,80),[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],并繪制

成如下圖所示的頻率分布直方圖,據(jù)此可估計該次考試成績的中位數(shù)小€化歡+1),則整數(shù)k的值為()

A.99B.100C.101D.102

【答案】B

【詳解】考試成績在[90,100)內的頻率為:

P=1-(0.004+0.008+0.015+0.025+0.015+0.006+0.004+0.002)x10=0.21,

則前4組考試成績頻率分別為:

[60,70),0.04

[70,80),0.08

[80,90),0.15

[90,100),0.21

考試成績的中位數(shù)為機,

則().04+0.08+0.15+0.21+(加-100)x0.025=0.5,

.?./n=100.8e(l(X),101)

.?"=100

故選:B.

例3.(2021?廣東汕頭?高三期末)某中學為了解學生數(shù)學史知識的積累情況,隨機抽取150名同學參加數(shù)學

史知識測試,測試題共5道,每答對一題得20分,答錯得0分.得分不少于60分記為及格,不少于80分

記為優(yōu)秀,測試成績百分比分布圖如圖所示,則()

A.該次數(shù)學史知識測試及格率超過90%

B.該次數(shù)學史知識測試得滿分的同學有15名

C.該次測試成績的中位數(shù)大于測試成績的平均數(shù)

D.若該校共有1500名學生,則數(shù)學史知識測試成績能得優(yōu)秀的同學大約有720名

【答案】AC

【詳解】由圖知,及格率為1-8%=92%>90%,故A正確.

該測試滿分同學的百分比為1—8%-32%-48%=12%,即有12%xl50=18名,B錯誤.

由圖知,中位數(shù)為80分,平均數(shù)為40x8%+60x32%+80x48%+100xl2%=72.8分,故C正確.

由題意,1500名學生成績能得優(yōu)秀的同學有1500x(48%+12%)=900,故D錯誤.

故選:AC

例4.2021年7月至2022年7月,我國居民消費價格保持平穩(wěn),居民消費價格漲跌幅如圖所示,則()

全國居民消費價格漲跌幅

夕*當月消費價格-去年同期消費價格,4小.上.令

備汪:同比增長率=------去年同期消費補格-------環(huán)比AA增0長,率=

當月消費價格-上月同期消費價格1m。/

上月同期消費價格,0,

A.2022年1月全國居民消費價格比2021年1月全國居民消費價格有所下降

B.2022年5月全國居民消費價格比2022年4月全國居民消費價格有所上升

C.2021年7月至2022年7月全國居民消費價格同比增長率的40%分位數(shù)為1.0%

D.2021年10月至2022年7月全國居民消費價格環(huán)比增長率的平均數(shù)為0.25%

【答案】D

【解析】*jA,從圖中可以看出2022年1月全國居民消費價格的同比增長率為0.9%>0,

所以2022年1月全國居民消費價格有所上升,故A錯誤;

對B,由圖2022年5月全國居民消費價格環(huán)比增長率為-0.2%<0,

所以2022年5月全國居民消費價格有所下降,故B錯誤;

對C,將C選項中的數(shù)據(jù)由小到大排列得,

0.7%,0.8%,0.9%0.9%,1%,1.5%,1.5%,1.5%,2.1%,2.1%,2.3%,2.5%,2.7%,

因為13x40%=5.2,則同比增長率的40%分位數(shù)為第6個數(shù)1.5%,故C錯誤;

對D,環(huán)比增長率的平均數(shù)為

-----------------------------------------------=0.25%,故D正確.

故選:D

【方法技巧與總結】

1、頻率分布直方圖

(1)利用頻率分布直方圖求頻率、頻數(shù);

(2)利用頻率分布直方圖估計總體.

(3)頻率分布直方圖的縱坐標是頻率除以組距,而不是頻率.

2、百分位數(shù)

計算一組,,個數(shù)據(jù)的的第〃百分位數(shù)的步驟

①按從小到大排列原始數(shù)據(jù).

②計算p%.

③若i不是整數(shù)而大于i的比鄰整數(shù)則第“百分位數(shù)為第./項數(shù)據(jù);若,是整數(shù),則第〃百分位數(shù)

為第j項與第j+1項數(shù)據(jù)的平均數(shù).

【變式訓練】

1.(2022?廣東東莞?高三期末)氣象意義上從春季進入夏季的標志為“當且僅當連續(xù)5天每天日平均溫度不低

于22C”.現(xiàn)有甲、乙、丙三地連續(xù)5天日平均溫度的記錄數(shù)據(jù)(數(shù)據(jù)均為正整數(shù),單位C)且滿足以下條

件:

甲地:5個數(shù)據(jù)的中位數(shù)是24,眾數(shù)是22;

乙地:5個數(shù)據(jù)的中位數(shù)是27,平均數(shù)是24;

丙地:5個數(shù)據(jù)有1個是30,平均數(shù)是24,方差是9.6;

根據(jù)以上數(shù)據(jù),下列統(tǒng)計結論正確的是()

A.甲地進入了夏季B.乙地進入了夏季

C.不能確定丙地進入了夏季D.恰有2地確定進入了夏季

【答案】AC

【詳解】甲地:5個數(shù)據(jù)由小到大排,則22,22,24,。,b,其中24<。<6,滿足進入夏季的標志;

乙地:將5個數(shù)據(jù)由小到大排,則。,b,27,c,d,其中,

貝IJ27+C+4281,而a+6+27+c+d=120,

故。+。439,其中必有一個小于22,故不滿足一定進入夏季的標志;

丙地:設5個數(shù)據(jù)為。,b,c,d,30,且。力,c,dwZ,

由方差公式可知:(a-24)2+e_24)2+?_24)2+①_24y+(3。_24y=9.6X5=48,

貝ij(a-24)2+0-24)2+(c-24)2+("-24『=12=9+1+1+1,

不妨設|。-24|=3,|。_26|=1,卜_26|=._26|=1,

則匕,%d均大于22,但。不確定是否大于22,故不能確定丙地進入夏天.

故選:AC.

2.如圖1為某省2019年17月份快遞業(yè)務量統(tǒng)計圖,圖2為該省2019年17月份快遞業(yè)務收入統(tǒng)計圖,對

統(tǒng)計圖理解不正確的是()

口快遞、業(yè)務量(萬件)?同比增長率(%)口快遞業(yè)務收入(萬元)?同比增長率(%)

圖1圖2

A.2019年1?4月份快遞業(yè)務量3月份最高,2月份最低,差值接近2000萬件

B.從1?4月份來看,業(yè)務量與業(yè)務收入有波動,但整體保持高速增長

C.從兩圖中看,增量與增長速度并不完全一致,但業(yè)務量與業(yè)務收入變化高度一致

D.2019年1?4月份快遞業(yè)務量同比增長率均超過50%,在3月份最高,和春節(jié)后網(wǎng)購迎來噴漲有關

【答案】B

【解析】從圖(1)的柱形圖可得2019年1-4月份快遞業(yè)務量3月份最高,2月份最低,

3月份比2月份高4397-2411=1986,差值接近2000萬件,故A正確.

從1?4月份來看,業(yè)務量與業(yè)務收入有波動,結合圖(1)(2)中的柱形圖可得業(yè)務量與業(yè)務收入在2月份

和4月份均下降,故B錯誤.

從兩圖中柱狀圖可得業(yè)務量與業(yè)務收入變化高度一致,但業(yè)務量2月份同比增長53%,而業(yè)務收入2月份

同比增長30%,因此增量與增長速度并不完全一致,故C正確.

從圖(I)中可得2019年1?4月份快遞業(yè)務量同比增長率均超過50%,在3月份最高,這的確和春節(jié)后網(wǎng)

購迎來噴漲有關,故D正確.

故選:B.

3.(2022?廣東清遠?高三期末)某學校組織了一次勞動技能大賽,共有100名學生參賽,經(jīng)過評判,這100

名參賽者的得分都在[40,90]內,得分60分以下為不及格,其得分的頻率分布直方圖如圖所示(按得分分成

[40,50),[50,60),[60,70),[70,80),[80,90]這五組),則下列結論正確的是()

B.此次比賽得分不及格的共有40人

C.以頻率為概率,從這100名參賽者中隨機選取1人,其得分在[60,80)

D.這100名參賽者得分的中位數(shù)為65

【答案】ABC

【詳解】因為3+0.01+0.02+0.03+0.035)*10=1,所以。=0.005,所以A正確;

因為不及格的人數(shù)為100x(0.005+0.035)x10=40,所以B正確;

因為得分在[60,80)的頻率為(0.03+0.02)x10=0.5,所以從這100名參賽者中隨機選取1人,其得分在[60,80)

的概率為0.5,所以C正確;

這100名參賽者得分的中位數(shù)為60+蕊R65,所以D錯誤.

故選:ABC.

4.(2022?廣東汕頭?一模)在黨史學習教育動員大會上,習近平總書記強調全黨同志要做到學史明理、學史

增信、學史崇德,學史力行.某單位對200名黨員進行黨史知識測試,將成績分成6組:[70,75),[75,80),

[80,85),[85,90),[90,95),[95,100],得到如圖所示的頻率分布直方圖,則。=.

【詳解】由(0.020+0.025+0.030+0.035+0.040+4)x5=1,

解得a=0.050.

5.(2022?廣東廣東?一模)(多選)為了解某地農(nóng)村經(jīng)濟情況,對該地農(nóng)戶家庭年收入進行抽樣調查,將農(nóng)

戶家庭年收入調查數(shù)據(jù)整理得到如下頻率分布直方圖(如圖):

根據(jù)此頻率分布直方圖,下面結論中正確的是()

A.該地農(nóng)戶家庭年收入低于4.5萬元的農(nóng)戶比率估計為6%

【答案】.ABC

0.02+0.04=0.06=6%,所以比率估計為6%,故A正確;

對于B,因為0.02+0.04+0.10+014+0.20=0.5,所以該地農(nóng)戶家庭年收入的中位數(shù)約為7.5萬元,故B正

確;

0.10+0.14+0.20+0.20=0.64>0.5,所以估計該地有一半以上的農(nóng)戶,其家庭年收入介于4.5萬元至8.5萬

元之間,故c正確;

對于D,該地農(nóng)戶家庭年收入的平均值為3x0.02+4x0.04+5x0.1+6x0.14+7x0.2+8x0.2+9x0.1

+10x0.1+11X0.04+12X0.02+13X0.02+14X0.02=7.68>6,5,

所以估計該地農(nóng)戶家庭年收入的平均值超過6.5萬元,故D錯誤.

故選:ABC.

6.(2022?廣東韶關?一模)(多選)在一次演講比賽中,以下表格數(shù)據(jù)是5位評委給甲、乙兩名選手評出的成

績,則下列說法正確的是()

甲乙

86909592879188938895

A.甲選手成績的極差大于乙選手成績的極差

B.甲選手成績的中位數(shù)小于乙選手成績的中位數(shù)

C.甲選手成績的方差小于乙選手成績的方差

D.甲選手成績的平均數(shù)小于乙選手成績的平均數(shù)

【答案】ABD

【詳解】對于A:根據(jù)極差的概念,可知甲選手成績的極差為9,乙選手成績的極差為7.故A正確;

對于B:易知甲成績的中位數(shù)是90,乙成績的中位數(shù)是91.故B正確;

對于C:甲選手成績的平均數(shù)為386+87+90+92+95)=90,方差為

22

1[(86-90)+(90-90)2+(95-90尸+(92一加尸+(87-90)]=y

乙選手成績的平均數(shù)為(88+88+91+93+95)x[=91,方差為

2

g[(88-9T+(88-91>+(91-91)2+(93-91>+(95-91)]=yC錯誤;

對于D:由于甲選手成績的平均數(shù)為90,乙選手成績的為91.故D正確.

故選:ABD.

7.某市政府為了節(jié)約生活用水,實施居民生活用水定額管理政策,即確定一個居民月用水量標準x(單位:

噸),用水量不超過x的部分按平價收費,超出x的部分按議價收費,并隨機抽取部分居民進行調查,抽取

的居民月均用水量的頻率分布直方圖如圖所示.(同一組中的數(shù)據(jù)以該組區(qū)間的中點值為代表)

(2)試估計該市居民月均用水量的眾數(shù)、平均數(shù);

(3)如果希望85%的居民月均用水量不超過標準x,那么標準x定為多少比較合理?

【解析】(I)山頻率分布直方圖中所有矩形的面積之和為1,可得

(0.08x2+0.16+2a+0.4+0.52+0.12+0.04)x0.5=l解得.々=0.3

3=225

(2)由頻率分布直方圖可知,該市居民月均用水量的眾數(shù)約為2(噸),

山頻率分布直方圖可知,平均數(shù)約為0.25x0.()4+().75x0.08+1.25x().15

+1.75x0.2+2.25x0.26+2.75x0.15+3.25x0.06+3.75x0.04+4.25x0.02=2.035(噸).

0.5x(0.08+0.16+0.3+0.4+0.52)x100%=73%;月均用水量低于3噸的居民人數(shù)所占的百分比為

73%+0.5x0.3x100%-88%,

所以xe(2.5,3),由題意可得0.73+(x—2.5)x0.3=0.85,解得x=2.9.

所以如果希望85%的居民月均用水量不超過標準x,那么x定為2.9噸比較合理.

8.隨著新冠肺炎疫情的穩(wěn)定,各地的經(jīng)濟均呈現(xiàn)緩慢的恢復趨勢,為了更進一步做好疫情的防控工作,避免

疫情的再度爆發(fā),/地區(qū)規(guī)定居民出行或者出席公共場合均需佩戴口罩,現(xiàn)將力地區(qū)20000個居民一周的口

罩使用個數(shù)統(tǒng)計如下表所示,其中每周的口罩使用個數(shù)在6以上(含6)的有14000人.

口罩使用數(shù)量[2,4)[4,6)[6,8)18,10)[10,12]

頻率mn

t頻率

0.3

0.2

0.1

O24681012z/口罩使用個數(shù)

(1)求機,n的值;

Q)根據(jù)表中數(shù)據(jù),完善上面的頻率分布直方圖;

(3)計算A地區(qū)居民一周口罩使用個數(shù)的平均數(shù)以及方差.

140006000

n=-0.3-0.1=0.3m—-0.2=0.1

【解析】(1)由已知2000020000

(2)頻率分布直方圖如卜:

(3)由頻率分布直方圖得

一周內使用口罩的平均數(shù)為

x=3x0.2+5x0,l+7x0.3+9x0.3+11x0.1=7>

方差為S2=0.2x(3-7)2+0.1,(5-7)2+03x(7-7>+0.3x(9-7)2+0.1x(11-7)2=64.

考點二:回歸分析

【典例例題】

例1.(2022?廣東汕尾?高三期末)"綠水青山就是金山銀山”的生態(tài)文明發(fā)展理念已經(jīng)深入人心,這將推動新

能源汽車產(chǎn)業(yè)的迅速發(fā)展,下表是近幾年我國某地區(qū)新能源汽車的年銷售量與年價的統(tǒng)計表

年份20162017201820192020

年銷售量(萬臺)812152025

根據(jù)上表,利用最小二乘法,新能源汽車的年銷售量y萬臺關于年份x的線性回歸方程為.

5

參考數(shù)據(jù):Z(x「君(,-9)=(-2)X(-8)+(-l)x(-4)+lx4+2x9=42,

i=l

5

2

^(x;-x)=4+1+1+4=10,42x2017=84714,42x2018=84756.

i=l

附:對于一組數(shù)據(jù)(4必),(%,%),,區(qū)》“),其回歸直線Rbx+d的斜率和截距的最小二乘估計分別為:

2(x;-x)(?-y)

b=-------,a=y-bx.

:(占3

;=1

【答案】."4.2x—8459.6

2016+2017+2018+2019+2020

【詳解】元=-----------------------------=2(Jlo,

5

8+12+15+20+25

5=----------------=lo

5

A£(玉-可(%-9)42

故b=上J-----------=—=4.2,

210

Z(x;-x)

<=1

/一宸=16-4.2x2018=-8459.6,

所以線性回歸方程為f=4.2x-8459.6

故答案為:y=4.2x-8459.6

例2.(2022?廣東?鐵一中學高三期末)2020年11月23日至29日累計確診人數(shù)如下表:

日期(1月)23日24日25日26日27日28日29日

人數(shù)(人)611213466101196

由上述表格得到如散點圖(1月23日為封城第一天).

>>(累計確診人數(shù))

(I)根據(jù)散點圖判斷>=〃+區(qū)與y=c.,(c,d均為大于0的常數(shù))哪一個適宜作為累計確診人數(shù)》與封

城后的天數(shù)X的回歸方程類型(給出判斷即可,不必說明理由);并根據(jù)上表中的數(shù)據(jù)求出回歸方程;

(2)隨著更多的醫(yī)護人員投入疫情的研究,2月20日武漢影像科醫(yī)生提出存在大量核酸檢測呈陰性(陽性

則確診),但觀其CT肺片具有明顯病變,這一提議引起了廣泛的關注,2月20日武漢疾控中心接收了1000

份血液樣本,假設每份樣本的檢驗結果是陽性還是陰性都是相互獨立的,且每份樣本是陽性樣本的概率為

0.7,核酸試劑能把陽性樣本檢測出陽性結果的概率是0.99(核酸檢測存在陽性樣本檢測不出來的情況,但

不會把陰性檢測呈陽性),求這1000份樣本中檢測呈陽性的份數(shù)的期望.

參考數(shù)據(jù):

77

1嚴

yw

i=\?=1

62.141.54253550.123.47

_I7

其中叱=lgy,卬=弓2嗎,參考公式:對于一組數(shù)據(jù)(4,叫),(%%),…,(”",叱),其回歸直線卬=a+£〃

/f=l

”__

Z%叱-nuw

的斜率和截距的最小二乘估計公式分別為夕=弓------,a=w-/3u.

2-2

),%—nu

/=1

【答案】(1)由散點圖可知選擇y=

由丫=八,兩邊同時取常用對數(shù)得lgy=lgc+lg〃x,

設igy=w,w=igc+igi/x.

7

計算%=4,w=1.54,Zx;=140,

/=1

7____

〉2毛叱一7xw

50.12-7x4x1.547八“

-----------------1----=—=0.25,

lgd=2

-7?140-7X4---28

i=\

把樣本中心點(4,1.54)代入?yún)n=尼。+愴小*得吠=0.54.

w=0.54+0.25%,丫關于x的回歸方程為y=3.47xIO025";

(2)這1000份樣本中檢測呈陽性的份數(shù)為X,

則每份檢測出陽性的概率尸=0.7x0.99=0.693,

由題意可知X?8(1000,0.693),.?.£(%)=1000x0.693=693(人),

故這1000份樣本中檢測呈陽性份數(shù)的期望為693人.

【方法技巧與總結】

1.線性回歸方程的求法;

2.非線性回歸方程要通過換元換成線性回歸方程.

【變式訓練】

1.(2022?廣東深圳?一模)某人工智能公司近5年的利潤情況如下表所示:

第X年12345

利潤y/億元23457

已知變量y與x之間具有線性相關關系,設用最小二乘法建立的回歸直線方程為y=1.2x+a,則下列說法正

確的是()A.a=0.6

B.變量y與x之間的線性相關系數(shù)r<0

D.該人工智能公司這5年的利潤的方差小于2

【答案】.AC

【詳解】解:依題意還:(1+2+3+4+5)=3,亍=:(2+3+4+5+7)=Z,

因為回歸直線方程為y=1.2x+a必過樣本中心點「可,即£=1.2x3+。,解得“=0.6,

故A正確;則回歸直線方程為y=1.2x+0.6,則%與V成正相關,即相關系數(shù)/?>(),故B錯誤,

當x=6時=12x6+0.6=7.8,即該人工智能公司第6年的利潤約為7.8億元,故C正確,

該人工智能公司這5年的利潤的方差為((2-,)+,-弓)

故D錯誤;

故選:AC

2.(2022?廣東惠州?二模)某地建立了農(nóng)業(yè)科技圖書館,供農(nóng)民免費借閱,收集了近5年的借閱數(shù)據(jù)如下表:

年份20162017201820192020

年份代碼X12345

年借閱量W萬冊

根據(jù)上表,可得y關于x的線性回歸方程為?=0.24x+&,則()A.5=4.68

C.y與x的樣本相關系數(shù)r>0

26.(2022?廣東汕頭?二模)如圖所示,5個(x,y)數(shù)據(jù),去掉。(3,10)后,下列說法正確的是()

y?E(\0,l2)

,D(3,10)

O|*

A.相關系數(shù)r變大B.殘差平方和變大

C.相關指數(shù)R2變小D.解釋變量x與預報變量y的相關性變強

【答案】AD

【詳解】由散點圖知,去掉離群點D后,x與y的相關性變強,且為正相關,

所以相關系數(shù)r的值變大,相關指數(shù)網(wǎng)的值變大,殘差平方和變小.

故選:AD.

3.(2022?廣東?金山中學高三期末)2021年,我國脫貧攻堅戰(zhàn)取得了全面勝利.為了鞏固拓展脫貧攻堅成果,

不斷提高群眾的幸福感,某縣繼續(xù)推進山羊養(yǎng)殖項目.為了建設相應的配套項目,該縣主管部門對該縣近年

來山羊養(yǎng)殖業(yè)的規(guī)模進行了跟蹤調查,得到了該縣每年售賣山羊數(shù)量y(單位:萬只)與相應年份代碼x的

數(shù)據(jù)如下表:

年份201520162017201820192020

年份代碼X123456

售賣山羊數(shù)量》(萬只)111316152021

(1)由表可知y與x有較強的線性相關關系,求y關于x的線性回歸方程;

(2)已知該縣養(yǎng)殖的山羊品種只有甲、乙兩種,且甲品種山羊與乙品種山羊的數(shù)量之比為2:3,甲品種山

羊達到售賣標準后的出售價為2500元/只,乙品種山羊達到售賣標準后的出售價為2700元/只.為了解養(yǎng)殖

山羊所需要的時間,該縣主管部門隨機抽取了甲品種山羊和乙品種山羊各100只進行調查,得到要達到售

賣標準所需的養(yǎng)殖時間如下表:

養(yǎng)殖時間(月數(shù))6789

甲品種山羊(只)20353510

乙品種山羊(只)10304020

以上述樣本統(tǒng)計的養(yǎng)殖山羊所需時間情況估計全縣養(yǎng)殖山羊所需時間(即以各養(yǎng)殖時間的頻率作為各養(yǎng)殖

時間的概率),且每月每只山羊的養(yǎng)殖成本為300元,結合(1)中所求回歸方程,試求2022年該縣養(yǎng)殖山

羊所獲利潤的期望(假設山羊達到售賣標準后全部及時賣完).(利潤=賣山羊的收入一山羊的養(yǎng)殖成本)

參考公式及數(shù)據(jù):回歸直線方程為¥=隊+隊其中坂=『--------,a=y-bx.

2

可2ZX:-rix

/=!;=i

【答案】?(1)>2工+9;(2)8800萬元.

1+2+3+4+5+611+13+16+15+20+21

【詳解】(1)因為了==3.5,y=-------------------=16,

66

-2.5x(-5)+(-1.5)x(-3)+(-0.5)x0+0.5x(-l)4-1.5x44-2.5x5_35

所以,==777=2,

(-2.5)2+(_]+(?5)2+0.52+1.52+2.5217.5

可得&=16—2x3.5=9.

所以丫與x之間的線性回歸方程為y=2x+9.

(2)由(1)可知,當x=8時,可得夕=25,

23

其中甲品種山羊有25、1=10萬只,乙品種山羊有25xg=15力只.

由頻率估計概率,可得甲品種山羊達到售賣標準需要的養(yǎng)殖時間為6個月,7個月,8個月和9個月的概率

分別為0.2,0.35,0.35和0.1,

所以甲品種山羊要達到售賣標準需要養(yǎng)殖時間的期望為6x0.2+7x0.35+8x0.35+9x0.1=7.35(月).

由頻率估計概率,可得乙品種山羊達到售賣標準需要的養(yǎng)殖時間為6個月,7個月,8個月和9個月的概率

分別為0.1,0.3,0.4和0.2,

所以乙品種山羊要達到售賣標準需要養(yǎng)殖時間的期望為6X0.1+7X0.3+8X0.4+9X0.2=7.7(月).

養(yǎng)殖每只甲品種山羊利潤的期望為2500-7.35x300=2500-2205=295(元),

養(yǎng)殖每只乙品種山羊利潤的期望為2700-7.7x300=2700-2310=390(元),

故2022年該縣售賣的山羊所獲利潤的期望為10x295+15x390=8800(萬元).

4.(2022?廣東廣州?一模)人們用大數(shù)據(jù)來描述和定義信息時代產(chǎn)生的海量數(shù)據(jù),并利用這些數(shù)據(jù)處理事務

和做出決策,某公司通過大數(shù)據(jù)收集到該公司銷售的某電子產(chǎn)品1月至5月的銷售量如下表.

月份X12345

銷售量y(萬件)

該公司為了預測未來幾個月的銷售量,建立了y關于x的回歸模型:y=ux2+v.

⑴根據(jù)所給數(shù)據(jù)與回歸模型,求y關于x的回歸方程(力的值精確到0.1);

⑵已知該公司的月利潤z(單位:萬元)與x,y的關系為z=244-&7,根據(jù)(1)的結果,問該公司

哪一個月的月利潤預報值最大?

參考公式:對于一組數(shù)據(jù)(七,乂),(9,%),,(%,%),其回歸直線?=以+4的斜率和截距的最小二乘估計公

£(一)(%-刃

式分別為b=J-----------,a=y-bx.

;=1

【答案】.(1)?=0.2/+5;(2)第9個月的月利潤預報值最大

(1)

.,1+4+9+16+25,,-4.9+5.8+6.8+8.3+10.2好

》卬=/,則n卬=-------------=11,y=---------------------=7.2,

g(叱一卬)(%一歹)__10X(_2.3)+(-7)X(-1.4)+(-2)X(-Q.4)+5X1.1+14x3_81,1

-22222

(1-11)+(4-11)+(9-11)+(16-11)+(25-11)-374

/=1'

v=y一加=7.2—0.2x11=5,所以y關于x的回歸方程為y=0.2丁+5:

(2)

由(1)知:y=0.2x2+5,

z=244=24.-5(°.2*:5)+2=246_%_令g)=244_£_年(x>0),

\lxylx\lx7x

"詈2/=一3八2尸「3(…尸])(,>o)

,x22Ixsjx2x\Jx

令廳(犬)>0得:0<x<9,令〃'(x)<0得:x>9,令〃(x)=0得:x=9,所以〃(力=244一/一?^?(x>0)

在x=9處取得極大值,也是最大值,/7(XL=M9)=72-27-9=36

所以第9個月的月利潤預報值最大.

5.(2022?廣東肇慶?二模)下表是我國從2016年到2020年能源消費總量近似值y(單位:千萬噸標準煤)

的數(shù)據(jù)表格:

年份20162017201820192020

年份代號X12345

能源消費總量近似值y(單位:

442456472488498

千萬噸標準煤)

以x為解釋變量,y為預報變量,若以夕=幻:+4為回歸方程,則相關指數(shù)用。0.9946,若以》=%+alnx

為回歸方程,則相關指數(shù)周=09568.

⑴判斷$與?=。2+8Inx哪一個更適宜作為能源消費總量近似值y關于年份代號x的回歸方程,并

說明理由;

⑵根據(jù)(1)的判斷結果及表中數(shù)據(jù),求出y關于年份代號x的回歸方程.

參考數(shù)據(jù):之必=2356,次x,?=7212.

1=1/=|

參考公式:回歸方程9=派+6中斜率和截距的最小二乘估計公式分別為:

?=毛-----------=號---------,a=y-bx.

i=li=l

【答案】.(l)£=4x+q更適宜作為y關于x的回歸方程,答案見解析;

(2)y=14.4^+428.

(1)

因為R;>后,

所以£=b^x+a,更適宜作為y關于x的回歸方程.

(2)

I=1+2+3+4+5=3,%=l2+22+32+42+52=55.

5/=|

£X/-5郎7212-5x3x2356

b.=々--------=-----------3一=14.4,等*4x3=428,

十2<—255—5x9

i=l

所以以x為解釋變量,y為預報變量的回歸方程為5>=14.4X+428.

6.(2022?廣東潮州?二模)我國在芯片領域的短板有光刻機和光刻膠,某風險投資公司準備投資芯片領域,

若投資光刻機項目,據(jù)預期,每年的收益率為30%的概率為P,收益率為-10%的概率為1-P;若投資光

刻膠項目,據(jù)預期,每年的收益率為30%的概率為0.4,收益率為-20%的概率為0.1,收益率為零的概率

為0.5.

⑴已知投資以上兩個項目,獲利的期望是一樣的,請你從風險角度考慮為該公司選擇一個較穩(wěn)妥的項目;

⑵若該風險投資公司準備對以上你認為較穩(wěn)妥的項目進行投資,4年累計投資數(shù)據(jù)如下表:

年份X2018201920202021

1234

累計投資金額y(單位:億元)2356

請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關于〃的線性回歸方程》=&,+4,并預測到哪一年年末,該

公司在芯片領域的投資收益預期能達到0.75億元.

2(再-五)(%-刃

附:收益=投入的資金x獲利的期望;線性回歸夕=應+&中,?=『-----------=嚀---------,a=y-bx.

f(七-村成2

i=l

【答案】.⑴該風投公司投資光刻膠項目:(2戶=14〃+0.5;2022年年末.

(1)

若投資光刻機項目,設收益率為四,則%的分布列為

?|

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論