版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第=page1212頁(yè),總=sectionpages3131頁(yè)專(zhuān)題10.1統(tǒng)計(jì)與統(tǒng)計(jì)案例【考綱要求】1.抽樣(1)簡(jiǎn)單隨機(jī)抽樣通過(guò)實(shí)例,了解簡(jiǎn)單隨機(jī)抽樣的含義及其解決問(wèn)題的過(guò)程,掌握兩種簡(jiǎn)單隨機(jī)抽樣方法:抽簽法和隨機(jī)數(shù)法.會(huì)計(jì)算樣本均值和樣本方差,了解樣本與總體的關(guān)系.(2)分層隨機(jī)抽樣通過(guò)實(shí)例,了解分層隨機(jī)抽樣的特點(diǎn)和適用范圍,了解分層隨機(jī)抽樣的必要性,掌握各層樣本量比例分配的方法.結(jié)合具體實(shí)例,掌握分層隨機(jī)抽樣的樣本均值和樣本方差.(3)抽樣方法的選擇在簡(jiǎn)單的實(shí)際情境中,能根據(jù)實(shí)際問(wèn)題的特點(diǎn),設(shè)計(jì)恰當(dāng)?shù)某闃臃椒ń鉀Q問(wèn)題.2.統(tǒng)計(jì)圖表能根據(jù)實(shí)際問(wèn)題的特點(diǎn),選擇恰當(dāng)?shù)慕y(tǒng)計(jì)圖表對(duì)數(shù)據(jù)進(jìn)行可視化描述,體會(huì)合理使用統(tǒng)計(jì)圖表的重要性.3.用樣本估計(jì)總體(1)結(jié)合實(shí)例,能用樣本估計(jì)總體的集中趨勢(shì)參數(shù)(平均數(shù)、中位數(shù)、眾數(shù)),理解集中趨勢(shì)參數(shù)的統(tǒng)計(jì)含義.(2)結(jié)合實(shí)例,能用樣本估計(jì)總體的離散程度參數(shù)(標(biāo)準(zhǔn)差、方差、極差),理解離散程度參數(shù)的統(tǒng)計(jì)含義.(3)結(jié)合實(shí)例,能用樣本估計(jì)總體的取值規(guī)律.4.成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性(1)結(jié)合實(shí)例,了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.(2)結(jié)合實(shí)例,會(huì)通過(guò)相關(guān)系數(shù)比較多組成對(duì)數(shù)據(jù)的相關(guān)性.5.一元線(xiàn)性回歸模型(1)結(jié)合具體實(shí)例,了解一元線(xiàn)性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義,了解最小二乘原理,掌握一元線(xiàn)性回歸模型參數(shù)的最小二乘估計(jì)方法.(2)針對(duì)實(shí)際問(wèn)題,會(huì)用一元線(xiàn)性回歸模型進(jìn)行預(yù)測(cè).6.2×2列聯(lián)表(1)通過(guò)實(shí)例,理解2×2列聯(lián)表的統(tǒng)計(jì)意義.(2)通過(guò)實(shí)例,了解2×2列聯(lián)表獨(dú)立性檢驗(yàn)及其應(yīng)用.【知識(shí)清單】知識(shí)點(diǎn)一.隨機(jī)抽樣與用樣本估計(jì)總體1.簡(jiǎn)單隨機(jī)抽樣(1)定義:一般地,設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體作為樣本(n≤N),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.這樣抽取的樣本,叫做簡(jiǎn)單隨機(jī)樣本.(2)常用方法:抽簽法和隨機(jī)數(shù)法.2.分層抽樣(1)在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法是一種分層抽樣.(2)分層抽樣的應(yīng)用范圍當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層抽樣.3.頻率分布直方圖(1)縱軸表示eq\f(頻率,組距),即小長(zhǎng)方形的高=eq\f(頻率,組距);(2)小長(zhǎng)方形的面積=組距×eq\f(頻率,組距)=頻率;(3)各個(gè)小方形的面積總和等于1.4.頻率分布表的畫(huà)法第一步:求極差,決定組數(shù)和組距,組距=eq\f(極差,組數(shù));第二步:分組,通常對(duì)組內(nèi)數(shù)值所在區(qū)間取左閉右開(kāi)區(qū)間,最后一組取閉區(qū)間;第三步:登記頻數(shù),計(jì)算頻率,列出頻率分布表.5.條形圖、折線(xiàn)圖及扇形圖(1)條形圖:建立直角坐標(biāo)系,用橫軸(橫軸上的數(shù)字)表示樣本數(shù)據(jù)類(lèi)型,用縱軸上的單位長(zhǎng)度表示一定的數(shù)量,根據(jù)每個(gè)樣本(或某個(gè)范圍內(nèi)的樣本)的數(shù)量多少畫(huà)出長(zhǎng)短不同的等寬矩形,然后把這些矩形按照一定的順序排列起來(lái),這樣一種表達(dá)和分析數(shù)據(jù)的統(tǒng)計(jì)圖稱(chēng)為條形圖.(2)折線(xiàn)圖:建立直角坐標(biāo)系,用橫軸上的數(shù)字表示樣本值,用縱軸上的單位長(zhǎng)度表示一定的數(shù)量,根據(jù)樣本值和數(shù)量的多少描出相應(yīng)各點(diǎn),然后把各點(diǎn)用線(xiàn)段順次連接,得到一條折線(xiàn),用這種折線(xiàn)表示出樣本數(shù)據(jù)的情況,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計(jì)圖稱(chēng)為折線(xiàn)圖.(3)扇形圖:用一個(gè)圓表示總體,圓中各扇形分別代表總體中的不同部分,每個(gè)扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計(jì)圖稱(chēng)為扇形圖.6.中位數(shù)、眾數(shù)、平均數(shù)的定義(1)中位數(shù)將一組數(shù)據(jù)按大小依次排列,處于最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).(2)眾數(shù)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).(3)平均數(shù)一組數(shù)據(jù)的算術(shù)平均數(shù)即為這組數(shù)據(jù)的平均數(shù),n個(gè)數(shù)據(jù)x1,x2,…,xn的平均數(shù)eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).7.樣本的數(shù)字特征如果有n個(gè)數(shù)據(jù)x1,x2,…,xn,那么這n個(gè)數(shù)的(1)標(biāo)準(zhǔn)差.(2)方差.[常用結(jié)論]1.頻率分布直方圖中的常見(jiàn)結(jié)論(1)眾數(shù)的估計(jì)值為最高矩形的中點(diǎn)對(duì)應(yīng)的橫坐標(biāo).(2)平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.(3)中位數(shù)的估計(jì)值的左邊和右邊的小矩形的面積和是相等的.2.平均數(shù)、方差的公式推廣(1)若數(shù)據(jù)x1,x2,…,xn的平均數(shù)為eq\x\to(x),則mx1+a,mx2+a,mx3+a,…,mxn+a的平均數(shù)是meq\x\to(x)+a.(2)若數(shù)據(jù)x1,x2,…,xn的方差為s2,則數(shù)據(jù)ax1+b,ax2+b,…,axn+b的方差為a2s2.知識(shí)點(diǎn)二.變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例1.變量間的相關(guān)關(guān)系(1)常見(jiàn)的兩變量之間的關(guān)系有兩類(lèi):一類(lèi)是函數(shù)關(guān)系,另一類(lèi)是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.eq\x(體現(xiàn)的不一定是因果關(guān)系.)(2)從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱(chēng)為正相關(guān);點(diǎn)散布在左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系為負(fù)相關(guān).2.兩個(gè)變量的線(xiàn)性相關(guān)(1)從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在通過(guò)散點(diǎn)圖中心的一條直線(xiàn)附近,稱(chēng)兩個(gè)變量之間具有線(xiàn)性相關(guān)關(guān)系,這條直線(xiàn)叫做回歸直線(xiàn).(2)回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中,(3)通過(guò)求eq\a\vs4\al(Q=\i\su(i=1,n,)yi-bxi-a2)的最小值而得到回歸直線(xiàn)的方法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線(xiàn)的距離的平方和最小,這一方法叫做最小二乘法.(4)相關(guān)系數(shù):當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān).r的絕對(duì)值越接近于1,表明兩個(gè)變量的線(xiàn)性相關(guān)性越強(qiáng).r的絕對(duì)值越接近于0,表明兩個(gè)變量之間幾乎不存在線(xiàn)性相關(guān)關(guān)系.通常|r|大于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線(xiàn)性相關(guān)性.3.獨(dú)立性檢驗(yàn)(1)2×2列聯(lián)表設(shè)X,Y為兩個(gè)變量,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2列聯(lián)表)如下:y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d(2)獨(dú)立性檢驗(yàn)利用隨機(jī)變量K2(也可表示為χ2)的觀(guān)測(cè)值(其中n=a+b+c+d為樣本容量)來(lái)判斷“兩個(gè)變量有關(guān)系”的方法稱(chēng)為獨(dú)立性檢驗(yàn).獨(dú)立性檢驗(yàn)是對(duì)兩個(gè)變量有關(guān)系的可信程度的判斷,而不是對(duì)其是否有關(guān)系的判斷.[常用結(jié)論]1.求解回歸方程的關(guān)鍵是確定回歸系數(shù)eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),應(yīng)充分利用回歸直線(xiàn)過(guò)樣本中心點(diǎn)(eq\x\to(x),eq\x\to(y)).2.根據(jù)K2的值可以判斷兩個(gè)分類(lèi)變量有關(guān)的可信程度,若K2越大,則兩分類(lèi)變量有關(guān)的把握越大.3.根據(jù)回歸方程計(jì)算的eq\o(y,\s\up6(^))值,僅是一個(gè)預(yù)報(bào)值,不是真實(shí)發(fā)生的值.【考點(diǎn)梳理】考點(diǎn)一統(tǒng)計(jì)數(shù)據(jù)與圖表在實(shí)際問(wèn)題中的應(yīng)用【典例1】(2017·全國(guó)高考真題(理))某城市為了解游客人數(shù)的變化規(guī)律,提高旅游服務(wù)質(zhì)量,收集并整理了2014年1月至2016年12月期間月接待游客量(單位:萬(wàn)人)的數(shù)據(jù),繪制了如圖所示的折線(xiàn)圖.根據(jù)該折線(xiàn)圖,下列結(jié)論錯(cuò)誤的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相對(duì)于7月至12月,波動(dòng)性更小,變化比較平穩(wěn)【答案】A【解析】對(duì)于選項(xiàng)A,由圖易知月接待游客量每年7,8月份明顯高于12月份,故A錯(cuò);對(duì)于選項(xiàng)B,觀(guān)察折線(xiàn)圖的變化趨勢(shì)可知年接待游客量逐年增加,故B正確;對(duì)于選項(xiàng)C,D,由圖可知顯然正確.故選A.【典例2】(2018·全國(guó)高考真題(文))某地區(qū)經(jīng)過(guò)一年的新農(nóng)村建設(shè),農(nóng)村的經(jīng)濟(jì)收入增加了一倍.實(shí)現(xiàn)翻番.為更好地了解該地區(qū)農(nóng)村的經(jīng)濟(jì)收入變化情況,統(tǒng)計(jì)了該地區(qū)新農(nóng)村建設(shè)前后農(nóng)村的經(jīng)濟(jì)收入構(gòu)成比例.得到如下餅圖:則下面結(jié)論中不正確的是A.新農(nóng)村建設(shè)后,種植收入減少B.新農(nóng)村建設(shè)后,其他收入增加了一倍以上C.新農(nóng)村建設(shè)后,養(yǎng)殖收入增加了一倍D.新農(nóng)村建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過(guò)了經(jīng)濟(jì)收入的一半【答案】A【解析】首先設(shè)出新農(nóng)村建設(shè)前的經(jīng)濟(jì)收入為M,根據(jù)題意,得到新農(nóng)村建設(shè)后的經(jīng)濟(jì)收入為2M,之后從圖中各項(xiàng)收入所占的比例,得到其對(duì)應(yīng)的收入是多少,從而可以比較其大小,并且得到其相應(yīng)的關(guān)系,從而得出正確的選項(xiàng).詳解:設(shè)新農(nóng)村建設(shè)前的收入為M,而新農(nóng)村建設(shè)后的收入為2M,則新農(nóng)村建設(shè)前種植收入為0.6M,而新農(nóng)村建設(shè)后的種植收入為0.74M,所以種植收入增加了,所以A項(xiàng)不正確;新農(nóng)村建設(shè)前其他收入我0.04M,新農(nóng)村建設(shè)后其他收入為0.1M,故增加了一倍以上,所以B項(xiàng)正確;新農(nóng)村建設(shè)前,養(yǎng)殖收入為0.3M,新農(nóng)村建設(shè)后為0.6M,所以增加了一倍,所以C項(xiàng)正確;新農(nóng)村建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的綜合占經(jīng)濟(jì)收入的,所以超過(guò)了經(jīng)濟(jì)收入的一半,所以D正確;故選A.【規(guī)律方法】條形圖、折線(xiàn)圖及扇形圖(1)條形圖:建立直角坐標(biāo)系,用橫軸(橫軸上的數(shù)字)表示樣本數(shù)據(jù)類(lèi)型,用縱軸上的單位長(zhǎng)度表示一定的數(shù)量,根據(jù)每個(gè)樣本(或某個(gè)范圍內(nèi)的樣本)的數(shù)量多少畫(huà)出長(zhǎng)短不同的等寬矩形,然后把這些矩形按照一定的順序排列起來(lái),這樣一種表達(dá)和分析數(shù)據(jù)的統(tǒng)計(jì)圖稱(chēng)為條形圖.(2)折線(xiàn)圖:建立直角坐標(biāo)系,用橫軸上的數(shù)字表示樣本值,用縱軸上的單位長(zhǎng)度表示一定的數(shù)量,根據(jù)樣本值和數(shù)量的多少描出相應(yīng)各點(diǎn),然后把各點(diǎn)用線(xiàn)段順次連接,得到一條折線(xiàn),用這種折線(xiàn)表示出樣本數(shù)據(jù)的情況,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計(jì)圖稱(chēng)為折線(xiàn)圖.(3)扇形圖:用一個(gè)圓表示總體,圓中各扇形分別代表總體中的不同部分,每個(gè)扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數(shù)據(jù)的統(tǒng)計(jì)圖稱(chēng)為扇形圖.【變式探究】1.(2020·西城·北京鐵路二中高三期中)我國(guó)新冠肺炎疫情進(jìn)入常態(tài)化,各地有序推進(jìn)復(fù)工復(fù)產(chǎn),下面是某地連續(xù)11天復(fù)工復(fù)產(chǎn)指數(shù)折線(xiàn)圖,給出下列四個(gè)結(jié)論:①第3天至第11天復(fù)工復(fù)產(chǎn)指數(shù)均超過(guò)80%;②這11天期間,復(fù)產(chǎn)指數(shù)增量大于復(fù)工指數(shù)的增量;③第9天至第11天復(fù)產(chǎn)指數(shù)增量大于復(fù)工指數(shù)的增量;④第1天至第3天復(fù)工指數(shù)的方差大于第2天至第4天復(fù)工指數(shù)的方差.其中所有正確結(jié)論的序號(hào)是____________________.【答案】①③【解析】由圖像可得,第3天至第11天復(fù)工復(fù)產(chǎn)指數(shù)均超過(guò)80%,故①正確;由圖像可得,第1天復(fù)產(chǎn)指數(shù)與復(fù)工指數(shù)的差大于第11天復(fù)產(chǎn)指數(shù)與復(fù)工指數(shù)的差,所以這11天期間,復(fù)產(chǎn)指數(shù)增量小于復(fù)工指數(shù)的增量,故②錯(cuò)誤;由圖像可得,第9天至第11天復(fù)產(chǎn)指數(shù)增量大于復(fù)工指數(shù)的增量;故③正確;由圖像可得,第1天至第3天復(fù)工指數(shù)波動(dòng)較小,第2天至第4天復(fù)工指數(shù)波動(dòng)較大,所以第1天至第3天復(fù)工指數(shù)的方差小于第2天至第4天復(fù)工指數(shù)的方差,故④錯(cuò)誤.故答案為:①③2.(多選)(2019·貴州省適應(yīng)性考試)2018年12月1日,貴陽(yáng)市地鐵1號(hào)線(xiàn)全線(xiàn)開(kāi)通,在一定程度上緩解了市內(nèi)交通的擁堵?tīng)顩r.為了了解市民對(duì)地鐵1號(hào)線(xiàn)開(kāi)通的關(guān)注情況,某調(diào)查機(jī)構(gòu)在地鐵開(kāi)通后的某兩天抽取了部分乘坐地鐵的市民作為樣本,分析其年齡和性別結(jié)構(gòu),并制作出如下等高條形圖:根據(jù)圖中(35歲以上含35歲)的信息,下列結(jié)論中一定正確的是()A.樣本中男性比女性更關(guān)注地鐵1號(hào)線(xiàn)全線(xiàn)開(kāi)通B.樣本中多數(shù)女性是35歲以上C.樣本中35歲以下的男性人數(shù)比35歲以上的女性人數(shù)多D.樣本中35歲以上的人對(duì)地鐵1號(hào)線(xiàn)的開(kāi)通關(guān)注度更高【答案】ABD【解析】設(shè)等高條形圖對(duì)應(yīng)2×2列聯(lián)表如下:35歲以上35歲以下總計(jì)男性aca+c女性bdb+d總計(jì)a+bc+da+b+c+d根據(jù)第1個(gè)等高條形圖可知,35歲以上男性比35歲以上女性多,即a>b;35歲以下男性比35歲以下女性多,即c>d.根據(jù)第2個(gè)等高條形圖可知,男性中35歲以上的比35歲以下的多,即a>c;女性中35歲以下的比35歲以下的多,即b>d.對(duì)于A(yíng),男性人數(shù)為a+c,女性人數(shù)為b+d,因?yàn)閍>b,c>d,所以a+c>b+d,所以A正確;對(duì)于B,35歲以上女性人數(shù)為b,35歲以下女性人數(shù)為d,因?yàn)閎>d,所以B正確;對(duì)于C,35歲以下男性人數(shù)為c,35歲以上女性人數(shù)為b,無(wú)法從圖中直接判斷b與c的大小關(guān)系,所以C不一定正確;對(duì)于D,35歲以上的人數(shù)為a+b,35歲以下的人數(shù)為c+d,因?yàn)閍>c,b>d,所以a+b>c+d,所以D正確.故選A、B、D.考點(diǎn)二抽樣方法【典例3】(2020·橫峰中學(xué)高三其他(理))某中學(xué)高二年級(jí)共有學(xué)生2400人,為了解他們的身體狀況,用分層抽樣的方法從中抽取一個(gè)容量為80的樣本,若樣本中共有男生42人,則該校高二年級(jí)共有女生()A.1260 B.1230 C.1200 D.1140【答案】D【解析】設(shè)女生總?cè)藬?shù)為:人,由分層抽樣的方法可得:抽取女生人數(shù)為:人,所以,解得:故選:D【典例4】(2019·山東省泰安實(shí)驗(yàn)中學(xué)高一開(kāi)學(xué)考試)總體由編號(hào)為01,02,,29,30的30個(gè)個(gè)體組成,現(xiàn)從中9抽取一個(gè)容量為6的樣本,請(qǐng)以隨機(jī)數(shù)表第1行第3列開(kāi)始,向右讀取,則選出來(lái)的第6個(gè)個(gè)體的編號(hào)為()70291712134033123826138951035662183735968350877597125593A.12 B.13 C.03 D.40【答案】C【解析】從隨機(jī)數(shù)表第行第列開(kāi)始由左到右依次選取兩個(gè)數(shù)字中小于30的編號(hào)依次為29,17,12,13,26,03,則第6個(gè)個(gè)體的編號(hào)為26.故選C.【總結(jié)提升】1.不論哪種抽樣方法,總體中的每一個(gè)個(gè)體入樣的概率都是相同的.2.分層抽樣的前提和遵循的兩條原則(1)前提:分層抽樣使用的前提是總體可以分層,層與層之間有明顯區(qū)別,而層內(nèi)個(gè)體間差異較小,每層中所抽取的個(gè)體數(shù)可按各層個(gè)體數(shù)在總體的個(gè)體數(shù)中所占比例抽取.(2)遵循的兩條原則:①將相似的個(gè)體歸入一類(lèi),即為一層,分層要求每層的各個(gè)個(gè)體互不交叉,即遵循不重復(fù)、不遺漏的原則;②分層抽樣為保證每個(gè)個(gè)體等可能入樣,需遵循在各層中進(jìn)行簡(jiǎn)單隨機(jī)抽樣,每層樣本數(shù)量與每層個(gè)體數(shù)量的比等于抽樣比.3.兩種抽樣方法的特點(diǎn)、聯(lián)系及適用范圍類(lèi)別共同點(diǎn)各自特點(diǎn)聯(lián)系適用范圍簡(jiǎn)單隨機(jī)抽樣①抽樣過(guò)程中每個(gè)個(gè)體被抽到的可能性相等;②每次抽出個(gè)體后不再將它放回,即不放回抽樣從總體中逐個(gè)抽取總體個(gè)數(shù)較少分層抽樣將總體分成幾層,分層進(jìn)行抽取各層抽樣時(shí),采用簡(jiǎn)單隨機(jī)抽樣總體由差異明顯的幾部分組成【變式探究】1.(2019·綏德中學(xué)高二月考(文))高二年級(jí)有男生560人,女生420人,為了解學(xué)生職業(yè)規(guī)劃,現(xiàn)用分層抽樣的方法從該年級(jí)全體學(xué)生中抽取一個(gè)容量為280人的樣本,則此樣本中男生人數(shù)為()A.120 B.160 C.280 D.400【答案】B【解析】有男生560人,女生420人,年級(jí)共有,用分層抽樣的方法從該年級(jí)全體學(xué)生中抽取一個(gè)容量為280的樣本,每個(gè)個(gè)體被抽到的概率是,要從男生中抽取,故選:B.2.下列抽取樣本的方式屬于簡(jiǎn)單隨機(jī)抽樣的個(gè)數(shù)為()①?gòu)臒o(wú)限多個(gè)個(gè)體中抽取100個(gè)個(gè)體作為樣本.②盒子里共有80個(gè)零件,從中選出5個(gè)零件進(jìn)行質(zhì)量檢驗(yàn).在抽樣操作時(shí),從中任意拿出一個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)后再把它放回盒子里.③從20件玩具中一次性抽取3件進(jìn)行質(zhì)量檢驗(yàn).④某班有56名同學(xué),指定個(gè)子最高的5名同學(xué)參加學(xué)校組織的籃球賽.A.0B.1C.2 D.3【答案】A【解析】①不是簡(jiǎn)單隨機(jī)抽樣,因?yàn)楸怀槿颖镜目傮w的個(gè)數(shù)是無(wú)限的,而不是有限的;②不是簡(jiǎn)單隨機(jī)抽樣.因?yàn)樗怯蟹呕爻闃樱虎鄄皇呛?jiǎn)單隨機(jī)抽樣.因?yàn)檫@是“一次性”抽取,而不是“逐個(gè)”抽??;④不是簡(jiǎn)單隨機(jī)抽樣.因?yàn)椴皇堑瓤赡艹闃樱蔬xA.【易錯(cuò)提醒】1.應(yīng)用簡(jiǎn)單隨機(jī)抽樣應(yīng)注意的問(wèn)題(1)一個(gè)抽樣試驗(yàn)?zāi)芊裼贸楹灧?,關(guān)鍵看兩點(diǎn):一是抽簽是否方便;二是號(hào)簽是否易攪勻.一般地,當(dāng)總體容量和樣本容量都較小時(shí)可用抽簽法.(2)在使用隨機(jī)數(shù)法時(shí),如遇到三位數(shù)或四位數(shù),可從選擇的隨機(jī)數(shù)表中的某行某列的數(shù)字計(jì)起,每三個(gè)或四個(gè)作為一個(gè)單位,自左向右選取,有超過(guò)總體號(hào)碼或出現(xiàn)重復(fù)號(hào)碼的數(shù)字舍去.2.分層抽樣問(wèn)題的類(lèi)型及解題思路(1)求某層應(yīng)抽個(gè)體數(shù)量:按該層所占總體的比例計(jì)算.(2)已知某層個(gè)體數(shù)量,求總體容量或反之求解:根據(jù)分層抽樣就是按比例抽樣,列比例式進(jìn)行計(jì)算.(3)分層抽樣的計(jì)算應(yīng)根據(jù)抽樣比構(gòu)造方程求解,其中“抽樣比=eq\f(樣本容量,總體容量)=eq\f(各層樣本數(shù)量,各層個(gè)體數(shù)量)”.考點(diǎn)三頻率分布直方圖的應(yīng)用【典例5】(2020·天津高考真題)從一批零件中抽取80個(gè),測(cè)量其直徑(單位:),將所得數(shù)據(jù)分為9組:,并整理得到如下頻率分布直方圖,則在被抽取的零件中,直徑落在區(qū)間內(nèi)的個(gè)數(shù)為()
A.10 B.18 C.20 D.36【答案】B【解析】根據(jù)直方圖,直徑落在區(qū)間之間的零件頻率為:,則區(qū)間內(nèi)零件的個(gè)數(shù)為:.故選:B.【典例6】(2019·全國(guó)高考真題(理))為了解甲、乙兩種離子在小鼠體內(nèi)的殘留程度,進(jìn)行如下試驗(yàn):將200只小鼠隨機(jī)分成兩組,每組100只,其中組小鼠給服甲離子溶液,組小鼠給服乙離子溶液.每只小鼠給服的溶液體積相同、摩爾濃度相同.經(jīng)過(guò)一段時(shí)間后用某種科學(xué)方法測(cè)算出殘留在小鼠體內(nèi)離子的百分比.根據(jù)試驗(yàn)數(shù)據(jù)分別得到如下直方圖:
記為事件:“乙離子殘留在體內(nèi)的百分比不低于”,根據(jù)直方圖得到的估計(jì)值為.(1)求乙離子殘留百分比直方圖中的值;(2)分別估計(jì)甲、乙離子殘留百分比的平均值(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表).【答案】(1),;(2),.【解析】(1)由題得,解得,由,解得.(2)由甲離子的直方圖可得,甲離子殘留百分比的平均值為,乙離子殘留百分比的平均值為【規(guī)律方法】(1)在頻率分布直方圖中,各小長(zhǎng)方形的面積表示相應(yīng)各組的頻率,所有小長(zhǎng)方形的面積的和等于1;(2)eq\f(頻率,組距)×組距=頻率;(3)eq\f(頻數(shù),樣本容量)=頻率,此關(guān)系式的變形為eq\f(頻數(shù),頻率)=樣本容量,樣本容量×頻率=頻數(shù)【變式探究】1.(2020·海南高三期中)為了評(píng)估某家快遞公司的服務(wù)質(zhì)量,某評(píng)估小組進(jìn)行了客戶(hù)滿(mǎn)意度調(diào)查,從該公司參與調(diào)查的客戶(hù)中隨機(jī)抽取500名客戶(hù)的評(píng)分,評(píng)分均在區(qū)間上,分組為,,,,,其頻率分布直方圖如圖所示.規(guī)定評(píng)分在60分以下表示對(duì)該公司的服務(wù)質(zhì)量不滿(mǎn)意,則這500名客戶(hù)中對(duì)該公司的服務(wù)質(zhì)量不滿(mǎn)意的客戶(hù)的人數(shù)為()
A.15 B.16 C.17 D.18【答案】A【解析】由頻率分布直方圖可知,評(píng)分在區(qū)間上的頻率為,所以評(píng)分在區(qū)間上的客戶(hù)有(人),即對(duì)該公司的服務(wù)質(zhì)量不滿(mǎn)意的客戶(hù)有15人.故選:A2.(2017北京,文17)某大學(xué)藝術(shù)專(zhuān)業(yè)400名學(xué)生參加某次測(cè)評(píng),根據(jù)男女學(xué)生人數(shù)比例,使用分層抽樣的方法從中隨機(jī)抽取了100名學(xué)生,記錄他們的分?jǐn)?shù),將數(shù)據(jù)分成7組:[20,30),[30,40),┄,[80,90],并整理得到如下頻率分布直方圖:(Ⅰ)從總體的400名學(xué)生中隨機(jī)抽取一人,估計(jì)其分?jǐn)?shù)小于70的概率;(Ⅱ)已知樣本中分?jǐn)?shù)小于40的學(xué)生有5人,試估計(jì)總體中分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù);(Ⅲ)已知樣本中有一半男生的分?jǐn)?shù)學(xué).科網(wǎng)不小于70,且樣本中分?jǐn)?shù)不小于70的男女生人數(shù)相等.試估計(jì)總體中男生和女生人數(shù)的比例.【答案】(Ⅰ)0.4;(Ⅱ)5人;(Ⅲ).【解析】(Ⅰ)根據(jù)頻率分布直方圖可知,樣本中分?jǐn)?shù)不小于70的頻率為,所以樣本中分?jǐn)?shù)小于70的頻率為.所以從總體的400名學(xué)生中隨機(jī)抽取一人,其分?jǐn)?shù)小于70的概率估計(jì)為0.4.(Ⅱ)根據(jù)題意,樣本中分?jǐn)?shù)不小于50的頻率為,分?jǐn)?shù)在區(qū)間內(nèi)的人數(shù)為.學(xué)科%網(wǎng)所以總體中分?jǐn)?shù)在區(qū)間內(nèi)的人數(shù)估計(jì)為.【易錯(cuò)提醒】頻率分布直方圖的縱坐標(biāo)是eq\f(頻率,組距),而不是頻率考點(diǎn)四用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征【典例7】(2020·全國(guó)高考真題(理))在一組樣本數(shù)據(jù)中,1,2,3,4出現(xiàn)的頻率分別為,且,則下面四種情形中,對(duì)應(yīng)樣本的標(biāo)準(zhǔn)差最大的一組是()A. B.C. D.【答案】B【解析】對(duì)于A(yíng)選項(xiàng),該組數(shù)據(jù)的平均數(shù)為,方差為;對(duì)于B選項(xiàng),該組數(shù)據(jù)的平均數(shù)為,方差為;對(duì)于C選項(xiàng),該組數(shù)據(jù)的平均數(shù)為,方差為;對(duì)于D選項(xiàng),該組數(shù)據(jù)的平均數(shù)為,方差為.因此,B選項(xiàng)這一組的標(biāo)準(zhǔn)差最大.故選:B.【典例8】(2019年高考全國(guó)Ⅱ卷文)某行業(yè)主管部門(mén)為了解本行業(yè)中小企業(yè)的生產(chǎn)情況,隨機(jī)調(diào)查了100個(gè)企業(yè),得到這些企業(yè)第一季度相對(duì)于前一年第一季度產(chǎn)值增長(zhǎng)率y的頻數(shù)分布表.的分組企業(yè)數(shù)22453147(1)分別估計(jì)這類(lèi)企業(yè)中產(chǎn)值增長(zhǎng)率不低于40%的企業(yè)比例、產(chǎn)值負(fù)增長(zhǎng)的企業(yè)比例;(2)求這類(lèi)企業(yè)產(chǎn)值增長(zhǎng)率的平均數(shù)與標(biāo)準(zhǔn)差的估計(jì)值(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值為代表).(精確到0.01)附:.【答案】(1)產(chǎn)值增長(zhǎng)率不低于40%的企業(yè)比例為21%,產(chǎn)值負(fù)增長(zhǎng)的企業(yè)比例為2%;(2)這類(lèi)企業(yè)產(chǎn)值增長(zhǎng)率的平均數(shù)與標(biāo)準(zhǔn)差的估計(jì)值分別為30%,17%.【解析】(1)根據(jù)產(chǎn)值增長(zhǎng)率頻數(shù)分布表得,所調(diào)查的100個(gè)企業(yè)中產(chǎn)值增長(zhǎng)率不低于40%的企業(yè)頻率為.產(chǎn)值負(fù)增長(zhǎng)的企業(yè)頻率為.用樣本頻率分布估計(jì)總體分布得這類(lèi)企業(yè)中產(chǎn)值增長(zhǎng)率不低于40%的企業(yè)比例為21%,產(chǎn)值負(fù)增長(zhǎng)的企業(yè)比例為2%.(2),,,所以,這類(lèi)企業(yè)產(chǎn)值增長(zhǎng)率的平均數(shù)與標(biāo)準(zhǔn)差的估計(jì)值分別為30%,17%.【總結(jié)提升】(1)平均數(shù)反映了數(shù)據(jù)取值的平均水平;標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大?。畼?biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.(2)用樣本估計(jì)總體就是利用樣本的數(shù)字特征來(lái)描述總體的數(shù)字特征.【變式探究】1.(2019·全國(guó)高考真題(理))演講比賽共有9位評(píng)委分別給出某選手的原始評(píng)分,評(píng)定該選手的成績(jī)時(shí),從9個(gè)原始評(píng)分中去掉1個(gè)最高分、1個(gè)最低分,得到7個(gè)有效評(píng)分.7個(gè)有效評(píng)分與9個(gè)原始評(píng)分相比,不變的數(shù)字特征是A.中位數(shù) B.平均數(shù)C.方差 D.極差【答案】A【解析】設(shè)9位評(píng)委評(píng)分按從小到大排列為.則①原始中位數(shù)為,去掉最低分,最高分,后剩余,中位數(shù)仍為,A正確.②原始平均數(shù),后來(lái)平均數(shù)平均數(shù)受極端值影響較大,與不一定相同,B不正確③由②易知,C不正確.④原極差,后來(lái)極差可能相等可能變小,D不正確.2.(2020·全國(guó)高考真題(文))設(shè)一組樣本數(shù)據(jù)x1,x2,…,xn的方差為0.01,則數(shù)據(jù)10x1,10x2,…,10xn的方差為()A.0.01 B.0.1 C.1 D.10【答案】C【解析】因?yàn)閿?shù)據(jù)的方差是數(shù)據(jù)的方差的倍,所以所求數(shù)據(jù)方差為故選:C【總結(jié)提升】1.眾數(shù)、中位數(shù)、平均數(shù)、方差的意義及常用結(jié)論(1)平均數(shù)與方差都是重要的數(shù)字特征,是對(duì)總體的一種簡(jiǎn)明的描述,它們所反映的情況有著重要的實(shí)際意義,平均數(shù)、中位數(shù)、眾數(shù)描述其集中趨勢(shì),方差和標(biāo)準(zhǔn)差描述波動(dòng)大?。?2)方差的簡(jiǎn)化計(jì)算公式:s2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\x\to(x)2]或?qū)懗蓅2=eq\f(1,n)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-eq\x\to(x)2,即方差等于原數(shù)據(jù)平方的平均數(shù)減去平均數(shù)的平方.2.主要命題角度:(1)樣本的數(shù)字特征與頻率分布直方圖交匯(2)樣本的數(shù)字特征與莖葉圖交匯=1\*GB3①在使用莖葉圖時(shí),一定要觀(guān)察所有的樣本數(shù)據(jù),弄清楚這個(gè)圖中數(shù)字的特點(diǎn),不要漏掉了數(shù)據(jù),也不要混淆莖葉圖中莖與葉的含義.=2\*GB3②莖葉圖既可以表示兩組數(shù)據(jù),也可以表示一組數(shù)據(jù),用它表示的數(shù)據(jù)是完整的數(shù)據(jù),因此可以從莖葉圖中看出數(shù)據(jù)的眾數(shù)(數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù))、中位數(shù)(中間位置的一個(gè)數(shù),或中間兩個(gè)數(shù)的平均數(shù))等.(3)樣本的數(shù)字特征與優(yōu)化決策問(wèn)題交匯:利用樣本的數(shù)字特征解決優(yōu)化決策問(wèn)題的依據(jù)=1\*GB3①平均數(shù)反映了數(shù)據(jù)取值的平均水平;標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小.標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.=2\*GB3②用樣本估計(jì)總體就是利用樣本的數(shù)字特征來(lái)描述總體的數(shù)字特征.考點(diǎn)五相關(guān)關(guān)系的判斷【典例9】對(duì)變量x,y有觀(guān)測(cè)數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點(diǎn)圖如圖①,對(duì)變量u,v有觀(guān)測(cè)數(shù)據(jù)(ui,vi)(i=1,2,…,10),得散點(diǎn)圖如圖②.由這兩個(gè)散點(diǎn)圖可以判斷()A.變量x與y正相關(guān),u與v正相關(guān)B.變量x與y正相關(guān),u與v負(fù)相關(guān)C.變量x與y負(fù)相關(guān),u與v正相關(guān)D.變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)【答案】C【解析】由散點(diǎn)圖可得兩組數(shù)據(jù)均線(xiàn)性相關(guān),且圖①的線(xiàn)性回歸方程斜率為負(fù),圖②的線(xiàn)性回歸方程斜率為正,則由散點(diǎn)圖可判斷變量x與y負(fù)相關(guān),u與v正相關(guān).【典例10】(2020·云南師大附中高二期中)已知變量和滿(mǎn)足關(guān)系,變量與負(fù)相關(guān).下列結(jié)論正確的是()A.與負(fù)相關(guān),與負(fù)相關(guān) B.與負(fù)相關(guān),與正相關(guān)C.與正相關(guān),與負(fù)相關(guān) D.與正相關(guān),與正相關(guān)【答案】C【解析】因?yàn)樽兞亢蜐M(mǎn)足關(guān)系,,所以和正相關(guān),又因?yàn)榕c負(fù)相關(guān),設(shè),所以,可得,,所以與負(fù)相關(guān),所以與正相關(guān),與負(fù)相關(guān),故選:C【總結(jié)提升】判斷相關(guān)關(guān)系的2種方法(1)散點(diǎn)圖法:如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線(xiàn)附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點(diǎn)都落在某一直線(xiàn)附近,變量之間就有線(xiàn)性相關(guān)關(guān)系.(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,當(dāng)|r|越趨近于1相關(guān)性越強(qiáng).【變式探究】(2019·鄭州市第一次質(zhì)量預(yù)測(cè))某商家今年上半年各月的人均銷(xiāo)售額(單位:千元)與利潤(rùn)率統(tǒng)計(jì)表如下:月份123456人均銷(xiāo)售額658347利潤(rùn)率(%)12.610.418.53.08.116.3根據(jù)表中數(shù)據(jù),下列說(shuō)法正確的是()A.利潤(rùn)率與人均銷(xiāo)售額成正相關(guān)關(guān)系B.利潤(rùn)率與人均銷(xiāo)售額成負(fù)相關(guān)關(guān)系C.利潤(rùn)率與人均銷(xiāo)售額成正比例函數(shù)關(guān)系D.利潤(rùn)率與人均銷(xiāo)售額成反比例函數(shù)關(guān)系【答案】A【解析】畫(huà)出利潤(rùn)率與人均銷(xiāo)售額的散點(diǎn)圖,如圖.由圖可知利潤(rùn)率與人均銷(xiāo)售額成正相關(guān)關(guān)系,故選A.考點(diǎn)六線(xiàn)性回歸方程、回歸分析【典例11】(2018·全國(guó)高考真題(文))下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額(單位:億元)的折線(xiàn)圖.為了預(yù)測(cè)該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了與時(shí)間變量的兩個(gè)線(xiàn)性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時(shí)間變量的值依次為)建立模型①:;根據(jù)2010年至2016年的數(shù)據(jù)(時(shí)間變量的值依次為)建立模型②:.(1)分別利用這兩個(gè)模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值;(2)你認(rèn)為用哪個(gè)模型得到的預(yù)測(cè)值更可靠?并說(shuō)明理由.【答案】(1)利用模型①預(yù)測(cè)值為226.1,利用模型②預(yù)測(cè)值為256.5,(2)利用模型②得到的預(yù)測(cè)值更可靠.【解析】(1)利用模型①,該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為=–30.4+13.5×19=226.1(億元).利用模型②,該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為=99+17.5×9=256.5(億元).(2)利用模型②得到的預(yù)測(cè)值更可靠.理由如下:(i)從折線(xiàn)圖可以看出,2000年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)沒(méi)有隨機(jī)散布在直線(xiàn)y=–30.4+13.5t上下,這說(shuō)明利用2000年至2016年的數(shù)據(jù)建立的線(xiàn)性模型①不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì).2010年相對(duì)2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)位于一條直線(xiàn)的附近,這說(shuō)明從2010年開(kāi)始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線(xiàn)性增長(zhǎng)趨勢(shì),利用2010年至2016年的數(shù)據(jù)建立的線(xiàn)性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì),因此利用模型②得到的預(yù)測(cè)值更可靠.(ii)從計(jì)算結(jié)果看,相對(duì)于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型①得到的預(yù)測(cè)值226.1億元的增幅明顯偏低,而利用模型②得到的預(yù)測(cè)值的增幅比較合理,說(shuō)明利用模型②得到的預(yù)測(cè)值更可靠.【典例12】(2020·全國(guó)高考真題(理))某沙漠地區(qū)經(jīng)過(guò)治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地塊,從這些地塊中用簡(jiǎn)單隨機(jī)抽樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個(gè)樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動(dòng)物的數(shù)量,并計(jì)算得,,,,.(1)求該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值(這種野生動(dòng)物數(shù)量的估計(jì)值等于樣區(qū)這種野生動(dòng)物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關(guān)系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計(jì)資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì),請(qǐng)給出一種你認(rèn)為更合理的抽樣方法,并說(shuō)明理由.附:相關(guān)系數(shù)r=,≈1.414.【答案】(1);(2);(3)詳見(jiàn)解析【解析】(1)樣區(qū)野生動(dòng)物平均數(shù)為,地塊數(shù)為200,該地區(qū)這種野生動(dòng)物的估計(jì)值為(2)樣本(i=1,2,…,20)的相關(guān)系數(shù)為(3)由(2)知各樣區(qū)的這種野生動(dòng)物的數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān)性,由于各地塊間植物覆蓋面積差異很大,從俄各地塊間這種野生動(dòng)物的數(shù)量差異很大,采用分層抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)得以執(zhí)行,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì).【總結(jié)提升】一、線(xiàn)性回歸分析問(wèn)題的類(lèi)型及解題方法1.求線(xiàn)性回歸方程(1)利用公式,求出回歸系數(shù)eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^)).(2)待定系數(shù)法:利用回歸直線(xiàn)過(guò)樣本點(diǎn)的中心求系數(shù).2.利用回歸方程進(jìn)行預(yù)測(cè),把線(xiàn)性回歸方程看作一次函數(shù),求函數(shù)值.3.利用回歸直線(xiàn)判斷正、負(fù)相關(guān),決定正相關(guān)還是負(fù)相關(guān)的是系數(shù)eq\o(b,\s\up6(^)).二、模型擬合效果的判斷(1)殘差平方和越小,模型的擬合效果越好.(2)相關(guān)指數(shù)R2越大,模型的擬合效果越好.(3)回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)|r|越趨近于1時(shí),兩變量的線(xiàn)性相關(guān)性越強(qiáng).【變式探究】1.(2017·山東高考真題(理))為了研究某班學(xué)生的腳長(zhǎng)(單位厘米)和身高(單位厘米)的關(guān)系,從該班隨機(jī)抽取名學(xué)生,根據(jù)測(cè)量數(shù)據(jù)的散點(diǎn)圖可以看出與之間有線(xiàn)性相關(guān)關(guān)系,設(shè)其回歸直線(xiàn)方程為.已知,,.該班某學(xué)生的腳長(zhǎng)為,據(jù)此估計(jì)其身高為()A. B. C. D.【答案】C【解析】由已知,,故選C.2.(2020·河南鄭州一中高三期中(文))新型冠狀病毒肺炎COVID-19疫情發(fā)生以來(lái),在世界各地逐漸蔓延.在全國(guó)人民的共同努力和各級(jí)部門(mén)的嚴(yán)格管控下,我國(guó)的疫情已經(jīng)得到了很好的控制.然而,小王同學(xué)發(fā)現(xiàn),每個(gè)國(guó)家在疫情發(fā)生的初期,由于認(rèn)識(shí)不足和措施不到位,感染人數(shù)都會(huì)出現(xiàn)快速的增長(zhǎng).下表是小王同學(xué)記錄的某國(guó)連續(xù)8天每日新型冠狀病毒感染確診的累計(jì)人數(shù).日期代碼x12345678累計(jì)確診人數(shù)y.481631517197122為了分析該國(guó)累計(jì)感染人數(shù)的變化趨勢(shì),小王同學(xué)分別用兩桿模型:①,②對(duì)變量x和y的關(guān)系進(jìn)行擬合,得到相應(yīng)的回歸方程并進(jìn)行殘差分析,殘差圖如下(注:殘差):經(jīng)過(guò)計(jì)算得,,,,其中,.(1)根據(jù)殘差圖,比較模型①,②的擬合效果,應(yīng)該選擇哪個(gè)模型?并簡(jiǎn)要說(shuō)明理由;(2)根據(jù)(1)問(wèn)選定的模型求出相應(yīng)的回歸方程(系數(shù)均保留兩位小數(shù));(3)由于時(shí)差,該國(guó)截止第9天新型冠狀病毒感染確診的累計(jì)人數(shù)尚未公布.小王同學(xué)認(rèn)為,如果防疫形勢(shì)沒(méi)有得到明顯改善,在數(shù)據(jù)公布之前可以根據(jù)他在(2)問(wèn)求出的回歸方程來(lái)對(duì)感染人數(shù)做出預(yù)測(cè),那么估計(jì)該地區(qū)第9天新型冠狀病毒感染確診的累計(jì)人數(shù)是多少?附:回歸直線(xiàn)的斜率和截距的最小二乘估計(jì)公式分別為:,【答案】(1)選擇模型①,理由見(jiàn)解析;(2);(3)157人.【解析】(1)選擇模型①.理由如下:根據(jù)殘差圖可以看出,模型①的估計(jì)值和真實(shí)值相對(duì)比較接近,模型②的殘差相對(duì)較大一些,所以模型①的擬合效果相對(duì)較好(2)由(1),知y關(guān)于x的回歸方程為,令,則.由所給數(shù)據(jù)得:,.,∴y關(guān)于x的回歸方程為(3)將代入上式,得(人)所以預(yù)測(cè)該地區(qū)第9天新型冠狀病毒感染確診的累計(jì)人數(shù)為157人.【總結(jié)提升】一般地,建立回歸模型的基本步驟為:(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量.(2)畫(huà)出解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀(guān)察它們之間的關(guān)系(如是否存在線(xiàn)性關(guān)系等).(3)由經(jīng)驗(yàn)確定回歸方程的類(lèi)型(如我們觀(guān)察到數(shù)據(jù)呈線(xiàn)性關(guān)系,則選用線(xiàn)性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計(jì)回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,殘差呈現(xiàn)不隨機(jī)的規(guī)律性等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.考點(diǎn)七獨(dú)立性檢驗(yàn)【典例13】(2019·全國(guó)高考真題(文))某商場(chǎng)為提高服務(wù)質(zhì)量,隨機(jī)調(diào)查了50名男顧客和50名女顧客,每位顧客對(duì)該商場(chǎng)的服務(wù)給出滿(mǎn)意或不滿(mǎn)意的評(píng)價(jià),得到下面列聯(lián)表:滿(mǎn)意不滿(mǎn)意男顧客4010女顧客3020(1)分別估計(jì)男、女顧客對(duì)該商場(chǎng)服務(wù)滿(mǎn)意的概率;(2)能否有95%的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)服務(wù)的評(píng)價(jià)有差異?附:.P(K2≥k)0.0500.0100.001k3.8416.63510.828【答案】(1);(2)能有的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)服務(wù)的評(píng)價(jià)有差異.【解析】(1)由題中表格可知,50名男顧客對(duì)商場(chǎng)服務(wù)滿(mǎn)意的有40人,所以男顧客對(duì)商場(chǎng)服務(wù)滿(mǎn)意率估計(jì)為,50名女顧客對(duì)商場(chǎng)滿(mǎn)意的有30人,所以女顧客對(duì)商場(chǎng)服務(wù)滿(mǎn)意率估計(jì)為,(2)由列聯(lián)表可知,所以能有的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)服務(wù)的評(píng)價(jià)有差異.【典例14】(2017·全國(guó)高考真題(文))海水養(yǎng)殖場(chǎng)進(jìn)行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對(duì)比,收獲時(shí)各隨機(jī)抽取了100個(gè)網(wǎng)箱,測(cè)量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:(1)記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,估計(jì)A的概率;(2)填寫(xiě)下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認(rèn)為箱產(chǎn)量與養(yǎng)殖方法有關(guān):箱產(chǎn)量<50kg箱產(chǎn)量≥50kg舊養(yǎng)殖法新養(yǎng)殖法(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,對(duì)兩種養(yǎng)殖方法的優(yōu)劣進(jìn)行較.附:P(K2≥k)0.0500.0100.001k3.8416.63510.828【答案】(1)0.62(2)有99%的把握(3)新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法【解析】(1)舊養(yǎng)殖法的箱產(chǎn)量低于50kg的頻率為(0.012+0.014+0.024+0.034+0.04
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度5G通信產(chǎn)品技術(shù)服務(wù)合同范本4篇
- 二零二五年度酒店用品采購(gòu)合同范本4篇
- 二零二五版旅行社游客脫團(tuán)責(zé)任承擔(dān)及權(quán)益保護(hù)合同4篇
- 2025年智能包裝印刷品設(shè)計(jì)與生產(chǎn)合同3篇
- 二零二五版密封膠產(chǎn)品用戶(hù)滿(mǎn)意度調(diào)查與提升合同3篇
- 二零二五版高新技術(shù)企業(yè)研發(fā)項(xiàng)目保函擔(dān)保合同2篇
- 二零二五年度高端物業(yè)租賃代理戰(zhàn)略合作協(xié)議合同3篇
- 2025年度茶葉綠色有機(jī)種植與購(gòu)銷(xiāo)合作合同協(xié)議3篇
- 2025年新能源汽車(chē)充電停車(chē)位買(mǎi)賣(mài)合同范本3篇
- 2025年度爐窯拆除工程環(huán)保驗(yàn)收與咨詢(xún)服務(wù)合同4篇
- 割接方案的要點(diǎn)、難點(diǎn)及采取的相應(yīng)措施
- 2025年副護(hù)士長(zhǎng)競(jìng)聘演講稿(3篇)
- 2025至2031年中國(guó)臺(tái)式燃?xì)庠钚袠I(yè)投資前景及策略咨詢(xún)研究報(bào)告
- 原發(fā)性腎病綜合征護(hù)理
- 第三章第一節(jié)《多變的天氣》說(shuō)課稿2023-2024學(xué)年人教版地理七年級(jí)上冊(cè)
- 2025年中國(guó)電科集團(tuán)春季招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年度建筑施工現(xiàn)場(chǎng)安全管理合同2篇
- 建筑垃圾回收利用標(biāo)準(zhǔn)方案
- 2024年考研英語(yǔ)一閱讀理解80篇解析
- 樣板間合作協(xié)議
- 福建省廈門(mén)市2023-2024學(xué)年高二上學(xué)期期末考試語(yǔ)文試題(解析版)
評(píng)論
0/150
提交評(píng)論