第八章《成對數(shù)據(jù)的統(tǒng)計分析》章末復習提升與檢測(原卷版)_第1頁
第八章《成對數(shù)據(jù)的統(tǒng)計分析》章末復習提升與檢測(原卷版)_第2頁
第八章《成對數(shù)據(jù)的統(tǒng)計分析》章末復習提升與檢測(原卷版)_第3頁
第八章《成對數(shù)據(jù)的統(tǒng)計分析》章末復習提升與檢測(原卷版)_第4頁
第八章《成對數(shù)據(jù)的統(tǒng)計分析》章末復習提升與檢測(原卷版)_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八章《成對數(shù)據(jù)的統(tǒng)計分析》章末復習提升與檢測

知識體系

E(x,-x)(y,-y)

樣本相關(guān)系數(shù)口;E-

成對數(shù)據(jù)的變量的相關(guān)關(guān)系:

,統(tǒng)計相關(guān)性

一元線性網(wǎng)歸模型

一元線性回歸模型參數(shù)的最小二乘估it:

數(shù)

X4據(jù)

,

A殘差分析

統(tǒng)

的一元線性回歸_b=------------------

2

Z(x-X)2

計「模型及其應用ZO-y.)

和1建立回歸模型決定系數(shù)-中------

斗?!溉?

1=1

2x2列聯(lián)表

圖形注,頻率分析

q獨立性檢驗)一

研究兩個分類變「、匕行高堆積條形圖

量之間的關(guān)系

算2=Mad-bcy

(fl+Z>)(c+J)(fl+c)(6+6/)

、能力整合

一、線性回歸分析

1.回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法.其基本步驟為通過散點圖和經(jīng)

驗選擇經(jīng)驗回歸方程的類型,然后通過一定的規(guī)則確定出相應的經(jīng)驗回歸方程,通過一定的方法進行檢驗,

最后應用于實際或?qū)憫兞窟M行預測.

2.主要培養(yǎng)數(shù)學建模和數(shù)據(jù)分析的素養(yǎng).

【例1】某村在推進鄉(xiāng)村振興的過程中,把做活鄉(xiāng)村產(chǎn)業(yè)作為強村富民的重要抓手,因地制宜推進茶葉種

植,成立了茶葉合作社.為了對茶葉在銷售旺季進行合理定價,合作社進行了市場調(diào)研,得到了銷售旺季

時銷量)‘(噸)關(guān)于售價x(元/公斤)的散點圖.

60

40

20

(x)

80

60

40

2()

。

⑴求)'關(guān)于X的線性回歸方程;

⑵該合作社2023年茶葉總產(chǎn)量為150噸,如果在銷售旺季時售價為250元/公斤,在銷售旺季沒能售出的,

年底以每公斤10。元的價格賣給批發(fā)商,則該合作社2023年的總銷售額為多少萬元?

公式及參考數(shù)據(jù):了關(guān)于x的線性回歸方程為》=八+3其中J-----------,a^y-6x,滅=250,

£(若-才

/=!

3=110,XU-x)(x-y)=-56OO,^(A;-J)2=7000.

I;-l

【解題技法】解決回歸分析問題的一般步驟

(1)畫散點圖.根據(jù)已知數(shù)據(jù)畫出散點圖.

(2/I斷變量的相關(guān)性并求經(jīng)臉回歸方程.通過觀察散點圖,直觀感知兩個變量是否具有相關(guān)關(guān)系.在此基

礎(chǔ)上,利用最小二乘法求3,a,然后寫出經(jīng)驗回歸方程.

⑶回歸分析.畫殘差圖或計算代,進行殘差分析.

(4)實際應用.依據(jù)求得的經(jīng)驗回歸方程解決實際問題.

【跟蹤訓練】

如組是某機構(gòu)統(tǒng)計的某地區(qū)2016年至2022年生活垃圾無害化處理量),(單位:萬噸)的折線圖.

、

g

z1

y.810

魏n

,60

陽n

宏n

也2n0

應.0O0

切).80a....■

防234567

年份代碼f

注:年份代碼1-7分別對應年份2016-2022.

求),關(guān)于,的回歸直線方程(系數(shù)精確到0.01),并預測2024年該地區(qū)生活垃圾無害化處理量.

參考數(shù)據(jù):i>=9.32,=40.17,力(5據(jù)2=28,

/-??=|r=l

參考公式:回歸方程戶命+G中斜率和截距的最小乘估計公式分別為。=『-----------,a=y-bT.

2(—)2

r-1

二、獨立性檢驗

1.獨立性檢驗研究的問題是有多大把握認為兩個分類變量之間有關(guān)系.為此需先列出2X2列聯(lián)表,從表

格中可以直觀地得到兩個分類變量是否有關(guān)系.另外等高堆積條形圖能更直觀地反映兩個分類變量之間的

情況.獨立性檢驗的思想是可以先假設(shè)二者無關(guān)系,求隨機變量爐的值,若下大于臨界值,則拒絕假設(shè),

否則,接受假設(shè).

2.通過計算好的值,進而分析相關(guān)性結(jié)論的可信程度,提升數(shù)學運算、數(shù)據(jù)分析的素養(yǎng).

【例2】(2023?甲卷(文))一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中

20只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠

飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).試驗結(jié)果如下:

對照組的小白鼠體重的增加量從小到大排序為

25,218.820.221.322.523.225.826.527.530.1

26.634.334.835.635.635.836.237.340.543.2

試驗組的小白鼠體重的增加量從小到大排序為

27.89.211.412.413.215.516.518.018.819.2

28.820.221.622.823.623.925.128.232.336.5

(1)計算試驗組的樣本平均數(shù);

(2)(i)求40只小白鼠體重的增加量的中位數(shù)加,再分別統(tǒng)計兩樣本中小于〃,與不小于機的數(shù)據(jù)的個

數(shù),完成如下列聯(lián)表;

<m..in

對照組

試驗組

(ii)根據(jù)⑺中的列聯(lián)表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增

加量有差異?

*n(ad-bc)2

(a+/?)(<?+d)(a+c)(b+d)

P(K\,k)0.1000.0500.010

k2.7063.8416.635

【解題技法】獨立性檢驗的一般步驟

(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表.

⑵根據(jù)公式/=(“+方Xc+"a+c)3+Q計算”的值?

(3)查表比較了與臨界值的大小關(guān)系,作出統(tǒng)計判斷.

【跟蹤訓練】

(2022?甲卷)甲、乙兩城之間的長途客車均由A和8兩家公司運營.為了解這兩家公司長途客車的運行

情況,隨機調(diào)查了甲、乙兩城之間的500個班次,得到下面列聯(lián)表:

準點班次數(shù)未準點班次

數(shù)

424020

B21030

(I)根據(jù)上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;

(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關(guān)?

/In(ad-be)2

(a+b)(c+d)(a+c)(b+d)

P(K2..k)0.1000.050().010

k2.7063.8416.635

三,數(shù)形結(jié)合思想在獨立性檢驗中的應用

1.數(shù)形結(jié)合思想就是在解決與幾何圖形有關(guān)的問題時,將圖形信息轉(zhuǎn)換成代數(shù)信息,利用數(shù)量特征,將

其轉(zhuǎn)化為代數(shù)問題;在進行回歸分析時,常利用散點圖、殘差圖等說明線性相關(guān)情況或模型的擬合效果.在

獨立性檢驗中,我們常用等高堆積條形圖直觀地反映數(shù)據(jù)的情況,從而可以粗略地判斷兩個分類變量是否

有關(guān)系.

2.主要培養(yǎng)數(shù)學抽象和數(shù)學運算的素養(yǎng).

【例3】某機構(gòu)為了了解患色盲是否與性別有關(guān),隨機抽取了1000名成年人進行調(diào)查,在調(diào)查的480名

男性中有38名患色盲,520名女性中有6名患色盲,分別利用圖形和獨立性檢驗(〃=0.001)的方法來判斷

患色盲與性別是否有關(guān).

【解題技法】解獨立性檢驗的應用問題的關(guān)注點

(1)兩個明確:①明確兩類主體;②明確研究的兩個問題.

(2)兩個準確:①準確畫出2X2列聯(lián)表;②準確理解爐.

【跟蹤訓練】

某電視傳媒公司為了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調(diào)查.如

圖所示的是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖.將日均收看該體育節(jié)目

時間不低于40分鐘的觀眾稱為“體育迷”.

(1根據(jù)已知條件完成下面的2X2列聯(lián)表,依據(jù)小概率值〃=0.05的獨立性檢驗,能否據(jù)此認為“體育迷”

與性別有關(guān)?

“體育迷”情況

性別合計

非體育迷體育迷

女1055

合計

(2雇上述調(diào)查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機抽樣方法每次抽取1名觀

眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為X,若每次抽取的結(jié)果是相互獨立的,求*的

分布列,均值E(X)和方差O(X).

a0.050.01

Xa3.8416.635

四、轉(zhuǎn)化與化歸思想在非線性回歸分析中的應用

1.轉(zhuǎn)化與化歸思想主要體現(xiàn)在非線性回歸分析中.在實際問題中,并非所有的變量關(guān)系均滿足線性關(guān)系,

故要選擇適當?shù)暮瘮?shù)模型去擬合樣本數(shù)據(jù),再通過代數(shù)變換,把非線性問題線性化.

2.主要培養(yǎng)數(shù)學建模和數(shù)學運算的素養(yǎng).

【例4】數(shù)獨是源自18世紀瑞士的一種數(shù)學游戲,玩家需要根據(jù)9x9盤面上的己知數(shù)字,推理出所有剩

余空格的數(shù)字,并滿足每一行、每一列、每一個粗線宮(3x3)內(nèi)的數(shù)字均含1-9,不重復.數(shù)獨愛好者小明打

算報名參加“絲路杯〃全國數(shù)獨大賽初級組的比賽,賽前小明在某數(shù)獨4Pp上進行一段時間的訓練,每天的

解題平均速度八秒)與訓練天數(shù)天)有關(guān),經(jīng)統(tǒng)計得到如表的數(shù)據(jù):

打天)1234567

八秒)990990450320300240210

(1)現(xiàn)用方舊作為回歸方程模型,請利用表中數(shù)據(jù),求出該回歸方科

(2)請用第(1)題的結(jié)論預測,小明經(jīng)過100天訓練后,每天解題的平均速度)’約為多少秒?

參考數(shù)據(jù)(其中4=一)

t士.7x7

?1.(1

18450.370.55

參考公式:對于一組數(shù)據(jù)(小匕),(〃2,匕),…,(〃“,匕),其回歸直線y=a+4"的斜率和截距的最小二乘

〃——

2%匕-mt-v

估計公式分別為:0=個-------1,a^v-Btr

2--―

I?”一〃〃

r-1

【解題技法】非線性化的回歸分析問題,畫出已知數(shù)據(jù)的散點圖,選擇跟散點圖擬合得酸好的函數(shù)模型

進行變量代換,作出變換后樣本點的散點圖,用線性回歸模型擬合.

【跟蹤訓練】

中國茶文化博大精深,已知茶水的口感與茶葉類型以及水溫有關(guān).經(jīng)驗表明,某種綠茶用85c的水泡制,

再等到茶水溫度降至60℃時飲用,可以產(chǎn)生最佳口感.某學習研究小組通過測量,得到了下面表格中的數(shù)

據(jù)(室溫是2?!妫?

泡制時間x!min01234

水溫)/c8579747165

ln(y-20)4.24.14.03.93.8

(1)小組成員根據(jù)上面表格中的數(shù)據(jù)繪制散點圖,并根據(jù)散點圖分布情況,考慮到茶水溫度降到室溫(即

20C)就不能再降的事實,決定選擇函數(shù)模型),=履,+203之0)來刻畫.

①令z=ln(),-2O),求出z關(guān)于,的線性回歸方程;

②利用①的結(jié)論,求出y=kcx+20(x>O,c>0)中的Z:與。.

(2)你認為該品種綠茶用85℃的水大約泡制多久后飲用,可以產(chǎn)生最佳口感?

參考數(shù)據(jù):log。,,。6=4.8,e如h09/2=66.7,竺^=0.6.參考公式:

667

AA£(內(nèi)-可(馬-可a

z=bx+a,b=------------,ci=z-bx.

XUE

1=1

章末檢測

(時間:120分鐘,滿分:150分)

一、單項選擇題(本大題共8小題,每小題5分,共40分.在每小題給出的四個選項中,只有一項是符合

題目要求的)

1.為調(diào)查中學生近視情況,隨機抽取某校男生150名,女生140名,其中,男生中有80名近視,女生中

有70名近視.在檢驗這些中學生眼睛近視是否與性別有關(guān)時,最有說服力的方法是()

A.均值與方差B.排列與組合

C.概率D.獨立性檢驗

2.觀察下列散點圖,則①正相關(guān),②負相關(guān),③不相關(guān),圖中的甲、乙、丙三個散點圖按順序相對應

的是().

???

????????:?????????

■:??:?三二三

OxoXOX

甲乙丙

A.①②③B.②①③C.①③②D.③①②

3.對兩個變量MN進行線性相關(guān)性檢驗,得線性相關(guān)系數(shù),i=-09872,對兩個變量進行線性相關(guān)性檢

驗,得線性相關(guān)系數(shù)弓=09384,則下列判斷正確的是()

A.變量x與變量》正相關(guān),變量”與變量I,負相關(guān),變量x與變量的線性相關(guān)性更強

B.變量上與變量)負相關(guān),變量”與變量V正相關(guān),變量V與變量〉的線性相關(guān)性更強

C.變量x與變量)'正相關(guān),變量〃與變量-負相關(guān),變量〃與變量V的線性相關(guān)性更強

D.變量X與變量)'負相關(guān),變量〃與變量,正相關(guān),變量〃與變量V的線性相關(guān)性更強

4.獨立性檢驗中,假設(shè):變量x與變量丫沒有關(guān)系,則在上述假設(shè)成立的情況下,估算概率

P(/C2>6.635)?0.01,表示的意義是

A.變量X與變量丫有關(guān)系的概率為1%

B.變量X與變量V沒有關(guān)系的概率為99.9%

C.變量X與變量y沒有關(guān)系的概率為99%

D.變量X與變量y有關(guān)系的概率為99%

5.某考察團對全國10大城市進行職工人均工資水平X(千元)與居民人均消費水平y(tǒng)(千元)統(tǒng)計調(diào)查

發(fā)現(xiàn),y與x具有相關(guān)關(guān)系,回歸方程為S,=0.66x+1.562.若某城市居民人均消費水平為7.675(千元),估

計該城市人均消費額占人均工資收入的百分比約為()

A.83%B.72%C.67%D.66%

6.某科研機構(gòu)為了研究中年人禿頭是否與患有心臟病有關(guān),隨機調(diào)查了一些中年人的情況,具體數(shù)據(jù)如

下表所示:

有心臟病無心臟病

禿發(fā)20300

不禿發(fā)5450

根據(jù)表中數(shù)據(jù)得叱=衛(wèi)巴吧竺士幽^15.968,由K210.828斷定禿發(fā)與患有心臟病有關(guān),那么

25x750x320x455

這種判斷出錯的可能性為

附表:

P心))0.100.050.0250.0100.0050.001

2.7063.8415.0246.6357.87910.828

A.0.1B.0.05

C.0.01D.0.001

7.相關(guān)變量X)’的散點圖如圖所示,現(xiàn)對這兩個變量進行線性相關(guān)分析,方案一:根據(jù)圖中所有數(shù)據(jù),

得到線性回歸方程.V=〃x+q,相關(guān)系數(shù)為、方案二:剔除點(1。,21),根據(jù)剩下數(shù)據(jù)得到線性回歸直線

方程:y=相關(guān)系數(shù)為弓.則()

51015x

A.B.Ov&vqvl

C.-1<彳<4<。D.-1</;</j<0

8.用模型>'=。*擬合一組數(shù)據(jù)組(4yj(,=l,2,3,?,,7),其中百+9++七=7,設(shè)z=ln),,得變換后

的線性回歸方程為2=%+4,則),2??=()

A.e70B.e3sC.70D.35

二、多項選擇題(本大題共3小題,每小題6分,共18分.在每小題給出的四個選項中,有多個選項是符

合題目要求的,全部選對的得6分,選對但不全的得3分,有選錯的得U分)

9.下列說法正確的是()

A.在兩個變量、與y的列聯(lián)表中,當1。以一尻I越大,兩個變量有關(guān)聯(lián)的可能性越大

B.若所有樣本點都在經(jīng)驗回歸方程;,=去+G上,則變量間的相關(guān)系數(shù)是-1

C.決定系數(shù)后越接近1,擬合效果越好

D.獨立性檢驗一定能給出明確的結(jié)論

10.已知在最小二乘法原理下,具有相關(guān)關(guān)系的變量X,),之間的線性回歸方程為k-0九+10.3,且變量

x,y之間的相關(guān)數(shù)據(jù)如表所示,則下列說法錯誤的是()

X681012

y6m32

A.變量X,)’之間呈正相關(guān)關(guān)系

B.可以預測,當x=20時,y=3.7

C.可求得表中,〃=4.7

D.由表格數(shù)據(jù)知,該回歸直線必過點(9,4)

11.某大學為了解學生對學校食堂服務的滿意度,隨機調(diào)查了50名男生和50名女生,每名學生對食堂的

服務給出滿意或不滿意的評價,得到如下列聯(lián)表.經(jīng)計算/=4.762,則可以推斷出().

、3

A.該學校男生對食堂服務滿意的概率的估計值為:

B.該學校男生比女生對食堂服務更滿意

C.依據(jù)a=0.05的獨立性檢驗,可以認為男、女生對該食堂服務的評價有差異

D.依據(jù)a=0.01的獨立性檢驗,可以認為男、女生對該食堂服務的評價有差異

三、填空題(本大題共3小題,每小題5分,共15分.把答案填在題中橫線上)

12.某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了5次試驗.根據(jù)收集到的數(shù)

據(jù)?如表),由最小二乘法求得經(jīng)驗回歸方程j=0.67x+54.9.

零件數(shù)”個1020304050

加工時間62■758189

j/min

現(xiàn)發(fā)現(xiàn)表中有一個數(shù)據(jù)看不清,請你推斷出該數(shù)據(jù)的值為.

13.對某臺機器購置后的運營年限x(x=1,2,3,…)與當年利潤y的統(tǒng)計分析知具備線性相關(guān)關(guān)系,經(jīng)驗回歸

方程為;=10.47—1.3x,估計該臺機器使用年最合算.

14.某部門通過隨機調(diào)查89名工作人員的休閑方式是讀書還是健身,得到的數(shù)據(jù)如下表:

單位:人

休閑方式

性別合

讀書健身

女243155

男82634

合計325789

在犯錯誤的概率不超過________的前提下認為性別與休閑方式有關(guān)系.

四、解答題(本大題共5小題,共77分.解答時應寫出必要的文字說明、證明過程或演算步驟)

15.(本小題滿分13分)冶煉某種金屬可以用舊設(shè)備或新設(shè)名,為了檢驗用這兩種設(shè)備生產(chǎn)的產(chǎn)品中所含

雜質(zhì)的關(guān)系,調(diào)查結(jié)果如表所示.

所含雜質(zhì)

設(shè)備雜質(zhì)

雜質(zhì)高

舊設(shè)備37121

新設(shè)備22202

16.(本小題滿分15分)在改革開放40年成就展上某地區(qū)某農(nóng)產(chǎn)品近幾年的產(chǎn)量統(tǒng)計表:

年份201420152016201720182019

年份代碼工123456

年產(chǎn)量(萬噸)6.66.777.17.27.4

(1)根據(jù)表中數(shù)據(jù),建立)‘關(guān)于x的線性回歸方程$,=去+6.

(2)根據(jù)線性回歸方程預測2020年該地區(qū)該農(nóng)產(chǎn)品的年產(chǎn)量.

17.(本小題滿分15分)電視傳媒公司為了了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了

1皿名觀眾進行調(diào)查,其中女性有55名.下面是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時間的頻

率分布直方圖:

頻率

將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”,已知“體育迷”中有10名女性.

單位:人

是否為體育迷

性別合計

非體育迷體育迷

合計

⑴根據(jù)已知條件完成2X2列聯(lián)表,并據(jù)此資料你是否認為“體育迷”與性別有關(guān)?

⑵將日均收看該體育項目不低于50分鐘的觀眾稱為“超級體育迷”,己知“超級體育迷”中有2名女性,

若從“超級體育迷”中任意選取2人,求至少有1名女性觀眾的概率.

______n(ad-bc)2______

附:參考公式:/=〃》+

(a+b)(c+d)(a+c)(b+d)'=a+c+d.

a0.050.01

Xa3.8416.635

18.(本小題滿分17分)互聯(lián)網(wǎng)使我們的生活日益便捷,網(wǎng)絡(luò)外賣也開始成為不少人日常生活中不可或缺

的一部分,某市一調(diào)查機構(gòu)針對該市市場占有率較高的甲,乙兩家網(wǎng)絡(luò)外賣企業(yè)(以下稱外賣甲、外賣乙)

的經(jīng)營情況進行了調(diào)查,調(diào)查結(jié)果如下表:

1日2日3日4日5日

外賣甲日接單x(百單)529811

外賣乙日接單(百單)2310515

(1)試根據(jù)表格中這五天的日接單量情況,從統(tǒng)計的角度說明這兩家外賣企業(yè)的經(jīng)營狀況;

(2)據(jù)統(tǒng)計表明,》與X之間具有線性相關(guān)關(guān)系.

①請用相關(guān)系數(shù),?對與工之間的相關(guān)性強弱進行判斷;(若1川〉0.75,則可認為y與1有較強的線性相

關(guān)關(guān)系,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論