第02講 成對數(shù)據(jù)的統(tǒng)計分析(練習(xí))(解析版)_第1頁
第02講 成對數(shù)據(jù)的統(tǒng)計分析(練習(xí))(解析版)_第2頁
第02講 成對數(shù)據(jù)的統(tǒng)計分析(練習(xí))(解析版)_第3頁
第02講 成對數(shù)據(jù)的統(tǒng)計分析(練習(xí))(解析版)_第4頁
第02講 成對數(shù)據(jù)的統(tǒng)計分析(練習(xí))(解析版)_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第02講成對數(shù)據(jù)的統(tǒng)計分析(模擬精練+真題演練)1.(2022·甘肅蘭州·統(tǒng)考一模)下面是一個列聯(lián)表,其中a、b處填的值分別為(

)總計a217322527總計b46100

A.52、54 B.54、52C.94、146 D.146、94【答案】A【解析】由題意可得,解得,所以a、b值分別為52、54.故選:A.2.(2023·海南??凇ずD先A僑中學(xué)??寄M預(yù)測)為客觀反映建設(shè)創(chuàng)新型國家進(jìn)程中我國創(chuàng)新能力的發(fā)展情況,國家統(tǒng)計局社科文司《中國創(chuàng)新指數(shù)(CII)研究》課題組研究設(shè)計了評價我國創(chuàng)新能力的指標(biāo)體系和指數(shù)編制方法.中國創(chuàng)新指數(shù)(ChinaInnovationIndex,CII)中有4個分指數(shù)(創(chuàng)新環(huán)境指數(shù)、創(chuàng)新投入指數(shù)、創(chuàng)新產(chǎn)出指數(shù)、創(chuàng)新成效指數(shù)),下面是2005—2021年中國創(chuàng)新指數(shù)及分領(lǐng)域指數(shù)圖,由圖可知指數(shù)與年份正相關(guān),則對4個分領(lǐng)域指數(shù),在建立年份值與指數(shù)值的回歸模型中,相關(guān)系數(shù)最大的指數(shù)類型是(

A.創(chuàng)新環(huán)境指數(shù) B.創(chuàng)新投入指數(shù) C.創(chuàng)新產(chǎn)出指數(shù) D.創(chuàng)新成效指數(shù)【答案】D【解析】由題圖易知4個分領(lǐng)域指數(shù)的起始位置相同,其中創(chuàng)新投入指數(shù)、創(chuàng)新產(chǎn)出指數(shù)從2014年起,指數(shù)增幅大,變化趨勢明顯大于另兩類指數(shù);從2011年起,創(chuàng)新環(huán)境指數(shù)的波動幅度比創(chuàng)新成效指數(shù)的波動幅度大,創(chuàng)新成效指數(shù)對應(yīng)的散點(diǎn)更趨近于某一條直線,故其對應(yīng)的相關(guān)系數(shù)最大.故選:D.3.(2023·安徽六安·六安一中??寄M預(yù)測)某學(xué)校一同學(xué)研究溫差(℃)與本校當(dāng)天新增感冒人數(shù)(人)的關(guān)系,該同學(xué)記錄了5天的數(shù)據(jù):x568912y1720252835經(jīng)過擬合,發(fā)現(xiàn)基本符合經(jīng)驗(yàn)回歸方程,則下列結(jié)論錯誤的是(

)A.樣本中心點(diǎn)為B.C.時,殘差為D.若去掉樣本點(diǎn),則樣本的相關(guān)系數(shù)增大【答案】D【解析】對于A項(xiàng),因?yàn)椋?,所以樣本中心點(diǎn)為,故A項(xiàng)正確;對于B項(xiàng),由回歸直線必過樣本中心可得:,解得:,故B項(xiàng)正確;對于C項(xiàng),由B項(xiàng)知,,令,則,所以殘差為,故C項(xiàng)正確;對于D項(xiàng),由相關(guān)系數(shù)公式可知,去掉樣本點(diǎn)后,x與y的樣本相關(guān)系數(shù)r不變,故D項(xiàng)錯誤.故選:D.4.(2023·江西南昌·江西師大附中校考三模)下列說法:(1)分類變量與的隨機(jī)變量越大,說明與相關(guān)的把握性越大;(2)以模型去擬合一組數(shù)據(jù)時,為了求出回歸方程,設(shè),將其變換后得到線性方程,則的值分別是和0.7;(3)若隨機(jī)變量,且,則.以上正確的個數(shù)是(

)A.0 B.1 C.2 D.3【答案】D【解析】根據(jù)獨(dú)立性檢驗(yàn)原理,分類變量與的隨機(jī)變量越大,說明與相關(guān)的把握性越大,故(1)正確;由,兩邊取對數(shù)得,即,設(shè),可得,又,∴,即,故(2)正確;若隨機(jī)變量,則正態(tài)曲線關(guān)于對稱,則,故(3)正確,所以正確的個數(shù)是3.故選:D.5.(2023·重慶·統(tǒng)考二模)設(shè)兩個相關(guān)變量和分別滿足下表:若相關(guān)變量和可擬合為非線性回歸方程,則當(dāng)時,的估計值為(

)(參考公式:對于一組數(shù)據(jù),,,,其回歸直線的斜率和截距的最小二乘估計公式分別為:,;)A. B. C. D.【答案】B【解析】因?yàn)榉蔷€性回歸方程為:,則有,令,即,列出相關(guān)變量關(guān)系如下:01334所以,,,,所以,所以,所以,即,即,因?yàn)?,所以,?dāng)時,.故選:B6.(2023·陜西商洛·校考三模)用模型擬合一組數(shù),若,,設(shè),得變換后的線性回歸方程為,則(

)A.12 B. C. D.7【答案】B【解析】由已知,,所以,,,所以,由題意,滿足線性回歸方程為,所以,所以,此時線性回歸方程為,即,可將此式子化為指數(shù)形式,即為,因?yàn)槟P蜑槟P停?,,所?故選:B.7.(2022·四川成都·成都七中??寄M預(yù)測)根據(jù)一組樣本數(shù)據(jù),,…,,求得經(jīng)驗(yàn)回歸方程為,且.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個樣本點(diǎn)(1.2,2.2)和(4.8,7.8)誤差較大,去除后重新求得的經(jīng)驗(yàn)回歸直線l的斜率為1.2,則(

)A.變量x與y具有正相關(guān)關(guān)系B.去除兩個誤差較大的樣本點(diǎn)后,重新求得的經(jīng)驗(yàn)回歸方程為C.去除兩個誤差較大的樣本點(diǎn)后,y的估計值增加速度變快D.去除兩個誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)(2,3.75)的殘差為0.05【答案】A【解析】對A:經(jīng)驗(yàn)回歸方程為,,變量與具有正相關(guān)關(guān)系,故選項(xiàng)A正確;對B:當(dāng)時,,所以樣本中心為,去掉兩個樣本點(diǎn)為和,,,樣本中心不變,去除后重新求得的經(jīng)驗(yàn)回歸直線的斜率為1.2,,解得,故去除兩個誤差較大的樣本點(diǎn)后,重新求得的回歸方程為,故選項(xiàng)B錯誤;對C:,去除兩個誤差較大的樣本點(diǎn)后,的估計值增加速度變慢,故選項(xiàng)C錯誤;對D:,,去除兩個誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)(2,3.75)的殘差為,故選項(xiàng)D錯誤.故選:A.8.(2021·江西南昌·南昌市八一中學(xué)校考三模)已知變量關(guān)于的回歸方程為,其一組數(shù)據(jù)如表所示:若,則預(yù)測值可能為(

)A. B. C. D.【答案】D【解析】由得:,,解得:,回歸方程為,若,則.故選:D.9.(2021·山西·統(tǒng)考三模)某公交公司推出掃碼支付乘車優(yōu)惠活動,活動為期兩周,活動的前五天數(shù)據(jù)如下表:第天12345使用人數(shù)()151734578421333由表中數(shù)據(jù)可得y關(guān)于x的回歸方程為,則據(jù)此回歸模型相應(yīng)于點(diǎn)(2,173)的殘差為(

)A. B. C.3 D.2【答案】B【解析】令,則,1491625使用人數(shù)()151734578421333,,所以,所以,當(dāng)時,,所以殘差為.故選:B10.(多選題)(2023·廣東廣州·統(tǒng)考模擬預(yù)測)總和生育率有時也簡稱生育率,是指一個人口群體的各年齡別婦女生育率的總和.它反映的是一名婦女在每年都按照該年齡別現(xiàn)有生育率生育的假設(shè)下,在育齡期間生育的子女總數(shù).為了了解中國人均GDPx(單位:萬元)和總和生育率y以及女性平均受教育年限z(單位:年)的關(guān)系,采用2012~2022近十年來的數(shù)據(jù)繪制了散點(diǎn)圖,并得到經(jīng)驗(yàn)回歸方程,,對應(yīng)的決定系數(shù)分別為,,則(

A.人均GDP和女性平均受教育年限正相關(guān).B.女性平均受教育年限和總和生育率負(fù)相關(guān)C.D.未來三年總和生育率一定繼續(xù)降低【答案】AB【解析】由回歸方程知人均GDP和女性平均受教育年限正相關(guān),故A正確;因?yàn)?,,可得女性平均受教育年限z和總和生育率y的關(guān)系式為,所以女性平均受教育年限z和總和生育率y負(fù)相關(guān),故B正確;由散點(diǎn)圖可知,回歸方程相對擬合效果更好,所以,故C錯誤;根據(jù)回歸方程預(yù)測,未來總和生育率預(yù)測值有可能降低,但實(shí)際值不一定會降低,故D錯誤.故選:AB11.(多選題)(2023·江蘇鹽城·鹽城市伍佑中學(xué)??寄M預(yù)測)下列命題正確的是(

)A.對于事件A,B,若,且,,則B.若隨機(jī)變量,,則C.相關(guān)系數(shù)r的絕對值越接近1,兩個隨機(jī)變量的線性相關(guān)程度越強(qiáng)D.在做回歸分析時,殘差圖中殘差點(diǎn)分布的帶狀區(qū)域的寬度越寬表示回歸效果越差【答案】ACD【解析】對于A,由于,即A發(fā)生必定有B發(fā)生,根據(jù)條件概率的定義,正確;對于B,根據(jù)正態(tài)分布密度函數(shù)的性質(zhì)知,,錯誤;對于C,根據(jù)相關(guān)系數(shù)的性質(zhì)知:約接近于1,表示線性相關(guān)程度越強(qiáng),正確;對于D,殘差點(diǎn)分布的帶狀區(qū)域越寬說明線性回歸時的誤差越大,即回歸效果越差,正確;故選:ACD.12.(多選題)(2023·吉林長春·長春吉大附中實(shí)驗(yàn)學(xué)校??寄M預(yù)測)年月日,工業(yè)和信息化部成功舉辦第十七屆“中國芯”集成電路產(chǎn)業(yè)大會.此次大會以“強(qiáng)芯固基以質(zhì)為本”為主題,旨在培育壯大我國集成電路產(chǎn)業(yè),夯實(shí)產(chǎn)業(yè)基礎(chǔ)、營造良好產(chǎn)業(yè)生態(tài).某芯片研發(fā)單位用在“A芯片”上研發(fā)費(fèi)用占本單位總研發(fā)費(fèi)用的百分比如表所示.已知,于是分別用p=和p=得到了兩條回歸直線方程:,,對應(yīng)的相關(guān)系數(shù)分別為、,百分比y對應(yīng)的方差分別為、,則下列結(jié)論正確的是(

)(附:,)年份年份代碼xpqA. B. C. D.【答案】ABC【解析】時,,變量、呈線性正相關(guān),故,故A正確;方差反映數(shù)據(jù)的穩(wěn)定性,顯然時更穩(wěn)定,故此時方差更小,即,故B正確;由于,當(dāng)時,,當(dāng)時,,所以,故C正確;因?yàn)?,所以時,,故D錯誤.故選:ABC13.(多選題)(2023·福建廈門·統(tǒng)考模擬預(yù)測)為了有針對性地提高學(xué)生體育鍛煉的積極性,某中學(xué)需要了解性別因素是否對本校學(xué)生體育鍛的經(jīng)常性有影響,隨機(jī)抽取了300名學(xué)生,對他們是否經(jīng)常鍛煉的情況進(jìn)行了調(diào)查,調(diào)查發(fā)現(xiàn)經(jīng)常鍛煉人數(shù)是不經(jīng)常鍛煉人數(shù)的2倍,繪制其等高堆積條形圖,如圖所示,則(

)A.參與調(diào)查的男生中經(jīng)常鍛煉的人數(shù)比不經(jīng)常鍛煉的人數(shù)多B.從參與調(diào)查的學(xué)生中任取一人,已知該生為女生,則該生經(jīng)常鍛煉的概率為C.依據(jù)的獨(dú)立性檢驗(yàn),認(rèn)為性別因素影響學(xué)生體育鍛煉的經(jīng)常性,該推斷犯錯誤的概率不超過0.1D.假設(shè)調(diào)查人數(shù)為600人,經(jīng)常鍛煉人數(shù)與不經(jīng)常鍛煉人數(shù)的比例不變,統(tǒng)計得到的等高堆積條形圖也不變,依據(jù)的獨(dú)立性檢驗(yàn),認(rèn)為性別因素影響學(xué)生體育鍛煉的經(jīng)常性,該推斷犯錯誤的概率不超過0.05附:,0.10.050.010.0050.0012.7063.8416.6357.87910.828【答案】ABD【解析】對于A,由題意知經(jīng)常鍛煉人數(shù)是不經(jīng)常鍛煉人數(shù)的2倍,故經(jīng)常鍛煉人數(shù)為200人,不經(jīng)常鍛煉人數(shù)為100人,故男生中經(jīng)常鍛煉的人數(shù)為人,不經(jīng)常鍛煉的人數(shù)為人,故男生中經(jīng)常鍛煉的人數(shù)比不經(jīng)常鍛煉的人數(shù)多,A正確;對于B,經(jīng)常鍛煉的女生人數(shù)為人,不經(jīng)常鍛煉的人數(shù)為人,故從參與調(diào)查的學(xué)生中任取一人,已知該生為女生,則該生經(jīng)常鍛煉的概率為,B正確;對于C,由題意結(jié)合男女生中經(jīng)常鍛煉和不經(jīng)常鍛煉的人數(shù),可得列聯(lián)表:經(jīng)常鍛煉不經(jīng)常鍛煉合計男10060160女10040140合計200100300則,故依據(jù)的獨(dú)立性檢驗(yàn),不能認(rèn)為性別因素影響學(xué)生體育鍛煉的經(jīng)常性,該推斷犯錯誤的概率不超過0.1,C錯誤;對于D,由題意可得:經(jīng)常鍛煉不經(jīng)常鍛煉合計男200120320女20080280合計400200600則此時,故依據(jù)的獨(dú)立性檢驗(yàn),認(rèn)為性別因素影響學(xué)生體育鍛煉的經(jīng)常性,該推斷犯錯誤的概率不超過0.05,D正確,故選:ABD14.(2023·全國·鎮(zhèn)海中學(xué)校聯(lián)考模擬預(yù)測)害蟲防控對于提高農(nóng)作物產(chǎn)量具有重要意義.已知某種害蟲產(chǎn)卵數(shù)(單位:個)與溫度(單位:)有關(guān),測得一組數(shù)據(jù),可用模型進(jìn)行擬合,利用變換得到的線性回歸方程為.若,則的值為.【答案】【解析】對兩邊同時取對數(shù)可得;即,可得由可得,代入可得,即,所以.故答案為:15.(2023·上?!そy(tǒng)考模擬預(yù)測)某校團(tuán)委對“學(xué)生性別和喜歡網(wǎng)絡(luò)游戲是否有關(guān)”作了一次調(diào)查,其中被調(diào)查的男女生人數(shù)相同,男生喜歡網(wǎng)絡(luò)游戲的人數(shù)占男生人數(shù)的,女生喜歡網(wǎng)絡(luò)游戲的人數(shù)占女生人數(shù)的.若根據(jù)獨(dú)立性檢驗(yàn)認(rèn)為喜歡網(wǎng)絡(luò)游戲和性別有關(guān),且此推斷犯錯誤的概率超過0.01但不超過0.05,則被調(diào)查的學(xué)生中男生可能有人.(請將所有可能的結(jié)果都填在橫線上)附表:,其中.0.0500.0103.8416.635【答案】45,50,55,60,65【解析】設(shè)男生有x人,由題意可得列聯(lián)表如下,喜歡不喜歡合計男生x女生x合計若認(rèn)為喜歡網(wǎng)絡(luò)游戲和性別有關(guān),且該推斷犯錯誤的概率超過0.01但不超過0.05,則.∵,∴,解得,又x為5的整數(shù)倍,∴被調(diào)查的學(xué)生中男生可能人數(shù)為45,50,55,60,65.故答案為:45,50,55,60,65.16.(2023·廣西桂林·校聯(lián)考模擬預(yù)測)一只紅鈴蟲產(chǎn)卵數(shù)和溫度有關(guān),現(xiàn)測得一組數(shù)據(jù),可用模型擬合,設(shè),其變換后的線性回歸方程為,若,,為自然常數(shù),則.【答案】【解析】經(jīng)過變換后,得到,根據(jù)題意,故,又,故,,故,于是回歸方程為一定經(jīng)過,故,解得,即,于是.故答案為:.17.(2022·北京·人大附中??寄M預(yù)測)某班在一次考試后分析學(xué)生在語文?數(shù)學(xué)?英語三個學(xué)科的表現(xiàn),繪制了各科年級排名的散點(diǎn)圖(如下圖所示).關(guān)于該班級學(xué)生這三個學(xué)科本次考試的情況,給出下列四個結(jié)論:①三科中,數(shù)學(xué)年級排名的平均數(shù)及方差均最??;②語文、數(shù)學(xué)、英語年級排名均在150名以外的學(xué)生為1人;③本次考試該班語文第一名、數(shù)學(xué)第一名、英語第一名可能為三名不同的同學(xué);④從該班學(xué)生中隨機(jī)抽取1人,若其語文排名大于200,則其英語和數(shù)學(xué)排名均在150以內(nèi)的概率為.其中所有正確結(jié)論的序號是.【答案】①②④【解析】①:三科中,數(shù)學(xué)對應(yīng)的點(diǎn)比英語對應(yīng)的點(diǎn)到橫軸的距離近且較為密集,數(shù)學(xué)對應(yīng)的點(diǎn)到橫軸的距離比語文對應(yīng)的點(diǎn)到縱軸距離近且較為密集,所以數(shù)學(xué)年級排名的平均數(shù)及方差均最小.判斷正確;②:語文、數(shù)學(xué)、英語年級排名均在150名以外的學(xué)生為1人.判斷正確;③:本次考試該班語文第一名、數(shù)學(xué)第一名、英語第一名為同一名同學(xué).判斷錯誤;④:由圖表可知語文排名大于200的有3位同學(xué),語文排名大于200且英語和數(shù)學(xué)排名均在150以內(nèi)的同學(xué)僅有1位同學(xué).故從該班學(xué)生中隨機(jī)抽取1人,若其語文排名大于200,則其英語和數(shù)學(xué)排名均在150以內(nèi)的概率為.判斷正確.故答案為①②④18.(2022·安徽安慶·安慶一中??既#┰诠こ碳夹g(shù)和科學(xué)實(shí)驗(yàn)中,經(jīng)常利用最小二乘法原理求曲線的函數(shù)關(guān)系式:設(shè)有一組實(shí)驗(yàn)數(shù)據(jù),它們大體分布在某條曲線上,通過偏差平方和最小求該曲線的方法稱為最小二乘法,當(dāng)該曲線為一條直線時,由方程組來確定,的值,此時偏差平方和表示為.為了測定某種刀具的磨損速度,每隔1小時測一次刀具的厚度,得到一組實(shí)驗(yàn)數(shù)據(jù),如下表:順序編號i01234567時間01234567刀具厚度作出刀具厚度關(guān)于時間散點(diǎn)圖,發(fā)現(xiàn)這些點(diǎn)分布在一條直線附近.(1)求實(shí)數(shù),的值,并估計時刀具厚度(所有結(jié)果均精確到);(2)求偏差平方和.(參考數(shù)據(jù):,)【解析】(1)由條件可得,應(yīng)滿足,其中,可由得到,且,,,即,解得,所以該直線方程為,當(dāng)時,則所以,刀具的厚度為.(2)由題意可得,偏差平方和為.19.(2023·湖北武漢·華中師大一附中校考模擬預(yù)測)2021年春節(jié)前,受疫情影響,各地鼓勵外來務(wù)工人員選擇就地過年.某市統(tǒng)計了該市4個地區(qū)的外來務(wù)工人數(shù)與就地過年人數(shù)(單位:萬),得到如下表格:區(qū)區(qū)區(qū)區(qū)外來務(wù)工人數(shù)萬3456就地過年人數(shù)萬2.5344.5(1)請用相關(guān)系數(shù)說明與之間的關(guān)系可用線性回歸模型擬合,并求關(guān)于的線性回歸方程和A區(qū)的殘差(2)假設(shè)該市政府對外來務(wù)工人員中選擇就地過年的每人發(fā)放1000元補(bǔ)貼.①若該市區(qū)有2萬名外來務(wù)工人員,根據(jù)(1)的結(jié)論估計該市政府需要給區(qū)就地過年的人員發(fā)放的補(bǔ)貼總金額;②若區(qū)的外來務(wù)工人員中甲、乙選擇就地過年的概率分別為,其中,該市政府對甲、乙兩人的補(bǔ)貼總金額的期望不超過1400元,求的取值范圍.參考公式:相關(guān)系數(shù),回歸方程中斜率和截距的最小二乘估計公式分別為.【解析】(1)由題,,,,,所以相關(guān)系數(shù),因?yàn)榕c之間的相關(guān)系數(shù)近似為0.99,說明與之間的線性相關(guān)程度非常強(qiáng),所以可用線性回歸模型擬合與之間的關(guān)系.,故關(guān)于的線性回歸方程為.∵,∴,故A區(qū)的殘差為0.05.(2)(2)①將代入,得,故估計該市政府需要給區(qū)就地過年的人員發(fā)放的補(bǔ)貼總金額為(萬元).②設(shè)甲、乙兩人中選擇就地過年的人數(shù)為,則的所有可能取值為0,1,2,,,.所以,所以,由,得,又,所以,故的取值范圍為.20.(2023·江西南昌·南昌市八一中學(xué)校考三模)為了解某一地區(qū)電動汽車銷售情況,某機(jī)構(gòu)根據(jù)統(tǒng)計數(shù)據(jù),用最小二乘法得到電動汽車銷量單位:萬臺關(guān)于年份的線性回歸方程為,且銷量的方差,年份的方差為.(1)求與的相關(guān)系數(shù),并據(jù)此判斷電動汽車銷量與年份的相關(guān)性強(qiáng)弱;(2)該機(jī)構(gòu)還調(diào)查了該地區(qū)位購車車主性別與購車種類情況,得到的數(shù)據(jù)如下表:購買非電動汽車購買電動汽車總計男性女性總計能否有的把握認(rèn)為購買電動汽車與性別有關(guān)(3)在購買電動汽車的車主中按照性別進(jìn)行分層抽樣抽取人,再從這人中隨機(jī)抽取人,記這人中,男性的人數(shù)為,求的分布列和數(shù)學(xué)期望.參考公式:線性回歸方程:,其中,;相關(guān)系數(shù):,若,則可判斷與線性相關(guān)較強(qiáng);,其中.附表:【解析】(1)相關(guān)系數(shù)為所以,故與線性相關(guān)較強(qiáng).(2)零假設(shè)為:購買電動汽車與車主性別相互獨(dú)立,即購買電動汽車與車主性別無關(guān).,

所以依據(jù)小概率值的獨(dú)立性檢驗(yàn),我們推斷不成立.由此推斷犯錯誤的概率不大于,故有的把握認(rèn)為購買電動汽車與性別有關(guān).(3)人中,男性車主人,女性車主人,則的可能取值為,,,,,故故的分布列為:0123421.(2023·福建南平·統(tǒng)考模擬預(yù)測)五一小長假期間,文旅部門在某地區(qū)推出A,B,C,D,E,F(xiàn)六款不同價位的旅游套票,每款套票的價格(單位:元;)與購買該款套票的人數(shù)(單位:千人)的數(shù)據(jù)如下表:套票類別ABCDEF套票價格(元)405060657288購買人數(shù)(千人)16.918.720.622.524.125.2(注:A,B,C,D,E,F(xiàn)對應(yīng)i的值為1,2,3,4,5,6)為了分析數(shù)據(jù),令,,發(fā)現(xiàn)點(diǎn)集中在一條直線附近.(1)根據(jù)所給數(shù)據(jù),建立購買人數(shù)y關(guān)于套票價格x的回歸方程;(2)規(guī)定:當(dāng)購買某款套票的人數(shù)y與該款套票價格x的比值在區(qū)間上時,該套票為“熱門套票”.現(xiàn)有甲、乙、丙三人分別從以上六款旅游套票中購買一款.假設(shè)他們買到的套票的款式互不相同,且購買到“熱門套票”的人數(shù)為X,求隨機(jī)變量X的分布列和期望.附:①參考數(shù)據(jù):,,,.②對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計分別為,.【解析】(1)由已知點(diǎn)集中在一條直線附近,設(shè)回歸直線方程為,由,,,得,,因此變量關(guān)于的回歸方程為,令,則,即,所以關(guān)于的回歸方程為.(2)由,解得,所以,于是為“熱門套票”,則三人中購買“熱門套票”的人數(shù)服從超幾何分布,的可能取值為1,2,3,,所以的分布列為:123期望.22.(2023·上海浦東新·華師大二附中校考模擬預(yù)測)為幫助鄉(xiāng)村脫貧,某勘探隊(duì)計劃了解當(dāng)?shù)氐V脈某金屬的分布情況,測得了平均金屬含量(單位:)與樣本對原點(diǎn)的距離(單位:)的數(shù)據(jù),并作了初步處理,得到了下面的一些統(tǒng)計量的值.(表中)660(1)利用樣本相關(guān)系數(shù)的知識,判斷與哪一個更適宜作為平均金屬含量關(guān)于樣本對原點(diǎn)的距離的回歸方程類型?(2)根據(jù)(1)的結(jié)果回答下列問題:(i)建立關(guān)于的回歸方程;(ii)樣本對原點(diǎn)的距離時,金屬含量的預(yù)報值是多少?(3)已知該金屬在距離原點(diǎn)米時的平均開采成本(單位:元)與關(guān)系為,根據(jù)(2)的結(jié)果回答,為何值時,開采成本最大?【解析】(1)因?yàn)榈木€性相關(guān)系數(shù),的線性相關(guān)系數(shù),,更適宜作為平均金屬含量關(guān)于樣本對原點(diǎn)的距離的回歸方程類型.(2)(i)依題意,可得,,,關(guān)于的回歸方程為.(ii)當(dāng)時,金屬含量的預(yù)報值為.(3)因?yàn)?,令,則,當(dāng)時,,在上單調(diào)遞增;當(dāng)時,,在上單調(diào)遞減,在處取得極大值,也是最大值,此時取得最大值,故為10時,開采成本最大.1.(2023?天津)調(diào)查某種花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示,其中相關(guān)系數(shù),下列說法正確的是A.花瓣長度和花萼長度沒有相關(guān)性 B.花瓣長度和花萼長度呈現(xiàn)負(fù)相關(guān) C.花瓣長度和花萼長度呈現(xiàn)正相關(guān) D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245【答案】【解析】相關(guān)系數(shù),且散點(diǎn)圖呈左下角到右上角的帶狀分布,花瓣長度和花萼長度呈正相關(guān).若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)不一定是0.8245.故選:.2.(2023?甲卷)一項(xiàng)試驗(yàn)旨在研究臭氧效應(yīng),試驗(yàn)方案如下:選40只小白鼠,隨機(jī)地將其中20只分配到試驗(yàn)組,另外20只分配到對照組,試驗(yàn)組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:.試驗(yàn)結(jié)果如下:對照組的小白鼠體重的增加量從小到大排序?yàn)?5.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2試驗(yàn)組的小白鼠體重的增加量從小到大排序?yàn)?.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)計算試驗(yàn)組的樣本平均數(shù);(2)(?。┣?0只小白鼠體重的增加量的中位數(shù),再分別統(tǒng)計兩樣本中小于與不小于的數(shù)據(jù)的個數(shù),完成如下列聯(lián)表;對照組試驗(yàn)組(ⅱ)根據(jù)中的列聯(lián)表,能否有的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異?附:,0.1000.0500.0102.7063.8416.635【解析】(1)根據(jù)題意,計算試驗(yàn)組樣本平均數(shù)為.(2)由題意知,這40只小鼠體重的中位數(shù)是將兩組數(shù)據(jù)合在一起,從小到大排列后第20位與第21位數(shù)據(jù)的平均數(shù),因?yàn)樵瓟?shù)據(jù)的第11位數(shù)據(jù)是18.8,后續(xù)依次為19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,,所以第20位為23.2,第21位數(shù)據(jù)為23.6,所以這組數(shù)據(jù)的中位數(shù)是;填寫列聯(lián)表如下:合計對照組61420試驗(yàn)組14620合計202040根據(jù)列聯(lián)表中數(shù)據(jù),計算,所以有的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異.3.(2022?新高考Ⅰ)一醫(yī)療團(tuán)隊(duì)為研究某地的一種地方性疾病與當(dāng)?shù)鼐用竦男l(wèi)生習(xí)慣(衛(wèi)生習(xí)慣分為良好和不夠良好兩類)的關(guān)系,在已患該疾病的病例中隨機(jī)調(diào)查了100例(稱為病例組),同時在未患該疾病的人群中隨機(jī)調(diào)查了100人(稱為對照組),得到如下數(shù)據(jù):不夠良好良好病例組4060對照組1090(1)能否有的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異?(2)從該地的人群中任選一人,表示事件“選到的人衛(wèi)生習(xí)慣不夠良好”,表示事件“選到的人患有該疾病”,與的比值是衛(wèi)生習(xí)慣不夠良好對患該疾病風(fēng)險程度的一項(xiàng)度量指標(biāo),記該指標(biāo)為.(?。┳C明:;(ⅱ)利用該調(diào)查數(shù)據(jù),給出,的估計值,并利用(?。┑慕Y(jié)果給出的估計值.附:.0.0500.0100.0013.8416.63510.828【解析】(1)補(bǔ)充列聯(lián)表為:不夠良好良好合計病例組4060100對照組1090100合計50150200計算,所以有的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異.(2)證明:;(ⅱ)利用調(diào)查數(shù)據(jù),,,,,所以.4.(2021?甲卷)甲、乙兩臺機(jī)床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級品和二級品,為了比較兩臺機(jī)床產(chǎn)品的質(zhì)量,分別用兩臺機(jī)床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)量情況統(tǒng)計如下表:一級品二級品合計甲機(jī)床15050200乙機(jī)床12080200合計270130400(1)甲機(jī)床、乙機(jī)床生產(chǎn)的產(chǎn)品中一級品的頻率分別是多少?(2)能否有的把握認(rèn)為甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量有差異?附:.0.0500.0100.0013.8416.63510.828【解析】(1)由題意可得,甲機(jī)床、乙機(jī)床生產(chǎn)總數(shù)均為200件,因?yàn)榧椎囊患壠返念l數(shù)為150,所以甲的一級品的頻率為;因?yàn)橐业囊患壠返念l數(shù)為120,所以乙的一級品的頻率為;(2)根據(jù)列聯(lián)表,可得.所以有的把握認(rèn)為甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量有差異.5.(2020?新課標(biāo)Ⅱ)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機(jī)抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù),,2,,,其中和分別表示第個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得,,,,.(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本,,2,,的相關(guān)系數(shù)(精確到;(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)量更準(zhǔn)確地估計,請給出一種你認(rèn)為更合理的抽樣方法,并說明理由.附:相關(guān)系數(shù),.【解析】(1)由已知,,個樣區(qū)野生動物數(shù)量的平均數(shù)為,該地區(qū)這種野生動物數(shù)量的估計值為;(2),,,;(3)更合理的抽樣方法是分層抽樣,根據(jù)植物覆蓋面積的大小對地塊分層,再對200個地塊進(jìn)行分層抽樣.理由如下:由(2)知各樣區(qū)的這種野生動物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān).由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動物數(shù)量差異也很大,采用分層抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動物數(shù)量更準(zhǔn)確地估計.6.(2020?新課標(biāo)Ⅲ)某學(xué)生興趣小組隨機(jī)調(diào)查了某市100天中每天的空氣質(zhì)量等級和當(dāng)天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天)鍛煉人次空氣質(zhì)量等級,,,1(優(yōu)216252(良510123(輕度污染)6784(中度污染)720(1)分別估計該市一天的空氣質(zhì)量等級為1,2,3,4的概率;(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表);(3)若某天的空氣質(zhì)量等級為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)量等級為3或4,則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否有的把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān)?人次人次空氣質(zhì)量好空氣質(zhì)量不好附:0.0500.0100.0013.8416.63510.828【解析】(1)該市一天的空氣質(zhì)量等級為1的概率為:;該市一天的空氣質(zhì)量等級為2的概率為:;該市一天的空氣質(zhì)量等級為3的概率為:;該市一天的空氣質(zhì)量等級為4的概率為:;(2)由題意可得:一天中到該公園鍛煉的平均人次的估計值為:,(3)根據(jù)所給數(shù)據(jù),可得下面的列聯(lián)表,人次人次總計空氣質(zhì)量好333770空氣質(zhì)量不好22830總計5545100由表中數(shù)據(jù)可得:,所以有的把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān).7.(2020?山東)為加強(qiáng)環(huán)境保護(hù),治理空氣污染,環(huán)境監(jiān)測部門對某市空氣質(zhì)量進(jìn)行調(diào)研,隨機(jī)抽查了100天空氣中的和濃度(單位:,得下表:,,,,32184,6812,3710(1)估計事件“該市一天空氣中濃度不超過75,且濃度不超過150”的概率;(2)根據(jù)所給數(shù)據(jù),完成下面的列聯(lián)表:,,,,(3)根據(jù)(2)中的列聯(lián)表,判斷是否有的把握認(rèn)為該市一天空氣中濃度與濃度有關(guān)?附:0.0500.0100.0013.8416.63510.828【解析】(1)用頻率估計概率,從而得到“該市一天空氣中濃度不超過75,且濃度不超過150”的概率;(2)根據(jù)所給數(shù)據(jù),可得下面的列聯(lián)表:(3)根據(jù)(2)中的列聯(lián)表,由,;故有的把握認(rèn)為該市一天空氣中濃度與濃度有關(guān),8.(2019?新課標(biāo)Ⅰ)某商場為提高服務(wù)質(zhì)量,隨機(jī)調(diào)查了50名男顧客和50名女顧客,每位顧客對該商場的服務(wù)給出滿意或不滿意的評價,得到下面列聯(lián)表:滿意不滿意男顧客4010女顧客3020(1)分別估計男、女顧客對該商場服務(wù)滿意的概率;(2)能否有的把握認(rèn)為男、女顧客對該商場服務(wù)的評價有差異?附:.0.0500.0100.0013.8416.63510.828【解析】(1)由題中數(shù)據(jù)可知,男顧客對該商場服務(wù)滿意的概率,女顧客對該商場服務(wù)滿意的概率;(2)由題意可知,,故有的把握認(rèn)為男、女顧客對該商場服務(wù)的評價有差異.9.(2018?新課標(biāo)Ⅱ)如圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額(單位:億元)的折線圖.為了預(yù)測該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了與時間變量的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量的值依次為1,2,,建立模型①:;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量的值依次為1,2,,建立模型②:.(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值;(2)你認(rèn)為用哪個模型得到的預(yù)測值更可靠?并說明理由.【解析】(1)根據(jù)模型①:,計算時,;利用這個模型,求出該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值是226.1億元;根據(jù)模型②:,計算時,;利用這個模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值是256.5億元;(2)解法1:模型②得到的預(yù)測值更可靠,因?yàn)閺目傮w數(shù)據(jù)看,該地區(qū)從2000年到2016年的環(huán)境基礎(chǔ)設(shè)施投資額是逐年上升的,從2000年到2009年間遞增的幅度較小些,從2010年到2016年間遞增的幅度較大些,所以利用模型②的預(yù)測值更可靠些.解法2,模型②對應(yīng)的7個點(diǎn)分布寬度小于模型①對應(yīng)的17個點(diǎn)的分布寬度,則,所以模型②較好;解法3,選擇與2018鄰近的三個年份,2015,計算模型②對應(yīng)的殘差絕對值之和,模型①對應(yīng)的殘差絕對值之和;且,所以模型②較好;所以利用模型②的預(yù)測值更可靠些.10.(2017?新課標(biāo)Ⅱ)海水養(yǎng)殖場進(jìn)行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機(jī)抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:,其頻率分布直方圖如圖:(1)設(shè)兩種養(yǎng)殖方法的箱產(chǎn)量相互獨(dú)立,記表示事件“舊養(yǎng)殖法的箱

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論