第一節(jié) 隨機抽樣與用樣本估計總體_第1頁
第一節(jié) 隨機抽樣與用樣本估計總體_第2頁
第一節(jié) 隨機抽樣與用樣本估計總體_第3頁
第一節(jié) 隨機抽樣與用樣本估計總體_第4頁
第一節(jié) 隨機抽樣與用樣本估計總體_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第九章|

統(tǒng)計與成對數據的統(tǒng)計分析第一節(jié)隨機抽樣與用樣本估計總體1.了解總體、樣本、樣本量的概念及數據的隨機性.2.掌握簡單隨機抽樣及分層隨機抽樣,能根據實際問題的特點,設計恰當的抽樣方法,解決實際問題.3.能根據實際問題的特點,選擇恰當的統(tǒng)計圖表對數據進行可視化描述.4.理解集中趨勢參數、離散程度參數的統(tǒng)計含義;能用樣本估計總體的取值規(guī)律;理解百分位數的統(tǒng)計含義.1.簡單隨機抽樣放回簡單隨機抽樣和不放回簡單隨機抽樣統(tǒng)稱為簡單隨機抽樣.除非特殊聲明,所稱的簡單隨機抽樣指不放回簡單隨機抽樣.(1)抽取方式:逐個不放回抽??;(2)特點:每個個體被抽到的概率相等;(3)常用方法:抽簽法和

.隨機數法2.分層隨機抽樣(1)定義:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行_________抽樣,再把所有子總體中抽取的樣本_________作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.(2)比例分配:在分層隨機抽樣中,如果每層_______都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配.簡單隨機合在一起樣本量3.作頻率分布直方圖的步驟(1)求_____

(即一組數據中最大值與最小值的差);(2)決定組距與組數;(3)將_____分組;(4)列頻率分布表;(5)畫頻率分布直方圖.極差數據4.其他統(tǒng)計圖表統(tǒng)計圖表主要應用扇形圖直觀描述各類數據占總數的_____條形圖和直方圖直觀描述不同類別或分組數據的頻數和頻率折線圖描述數據隨_____的變化趨勢比例時間5.樣本的數字特征(1)簡單隨機抽樣和分層隨機抽樣在抽樣過程中每個個體被抽取的機會相等,分層隨機抽樣中各層抽樣時采用簡單隨機抽樣.(2)利用分層隨機抽樣要注意按比例抽取,若各層應抽取的個體數不都是整數,則應當調整各層容量,即先剔除各層中“多余”的個體.1.已知一組數據為20,30,40,50,50,60,70,80,則該組數據的平均數、中位數和眾數的大小關系是

(

)A.平均數>中位數>眾數B.平均數<中位數<眾數C.中位數<眾數<平均數D.平均數=中位數=眾數答案:D2.(人教A版必修第二冊P197·T1改編)如圖是60名學生參加數學競賽的成績(均為整數)的頻率分布直方圖,估計這次數學競賽的及格率是

(

)A.75% B.25%C.15% D.40%答案:A3.某款具有社交屬性的健身APP,致力于提供健身教學、跑步、騎行、交友及健身飲食指導、裝備購買等一站式運動解決方案.可以讓你隨時隨地進行鍛煉,記錄你每天的訓練進程.不僅如此,它還可以根據不同人的體質,制定不同的健身計劃.小明根據該APP記錄的2021年1月至2021年11月期間每月跑步的里程(單位:十公里)數據整理并繪制了下面的折線圖.根據該折線圖,下列結論錯誤的是

(

)A.月跑步里程的最小值出現在2月B.月跑步里程逐月增加C.月跑步里程的中位數為5月份對應的里程數D.1月至5月的月跑步里程相對于6月至11月波動性更小解析:由折線圖可知,月跑步里程的最小值出現在2月,故A正確;月跑步里程不是逐月增加的,故B不正確;月跑步里程數從小到大排列分別是:2月,8月,3月,4月,1月,5月,7月,6月,11月,9月,10月對應的里程數,故5月份對應的里程數為中位數,故C正確;由圖可知,1月至5月的月跑步里程相對于6月至11月波動性更小,變化比較平穩(wěn),故D正確.答案:B4.(蘇教版必修第二冊P220·T2改編)某校高一年級有900名學生,其中女生400名.按男女比例用分層隨機抽樣的方法,從該年級學生中抽取一個容量為45的樣本,則應抽取的男生人數為________.答案:255.(人教A版必修第二冊P202·例2改編)一個容量為20的樣本,其數據按從小到大的順序排列為:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,則該組數據的第75百分位數為__________,第86百分位數為________.6.(人教A版必修第二冊P184·T3改編)某班級有50名同學,一次數學測試平均成績是92分,如果30名男生的平均成績?yōu)?0分,那么20名女生的平均成績?yōu)開_______分.層級一/基礎點——自練通關(省時間)基礎點(一)抽樣方法

[題點全訓]1.某班有男生36人,女生18人,用分層隨機抽樣的方法從該班全體學生中抽取一個容量為9的樣本,則抽取的女生人數為

(

)A.6 B.4C.3 D.22.(2022·廣州綜合測試)某公司生產A,B,C三種不同型號的轎車,其產量之比為2∶3∶4,為檢驗該公司的產品質量,用分層隨機抽樣的方法抽取一個容量為n的樣本,若樣本中A種型號的轎車比B種型號的轎車少8輛,則n=

(

)A.96 B.72

C.48 D.363.總體由編號為1,2,…,99,100的100個個體組成.現用隨機數法選取60個個體,利用電子表格軟件產生的若干個1~100范圍內的整數隨機數的開始部分數據如下,則選出來的第5個個體的編號為______.8

44

2

17

8

31

57

4

55

688

77

74

47

7

21

76

33

50

63解析:生成的隨機數中落在編號1~100范圍內的有8,44,2,17,8(重復,舍棄),31……故選中的第5個個體的編號為31.答案:314.某企業(yè)三個分廠生產同一種電子產品,三個分廠的產量分布如圖所示.現在用分層隨機抽樣的方法從三個分廠生產的產品中共抽取100件進行使用壽命的測試,則第一分廠應抽取的件數為________;測試結果為第一、二、三分廠取出的產品的平均使用壽命分別為1020小時,980小時,1030小時,估計這個企業(yè)生產的這批電子產品的平均使用壽命為________小時.解析:由分層隨機抽樣可知,第一分廠應抽取100×50%=50(件).由樣本的平均數估計總體的平均數,可知這批電子產品的平均使用壽命約為1020×50%+980×20%+1030×30%=1015(小時).答案:50

10152.已知一組樣本數據由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且樣本的中位數為10.5,若使該樣本的方差最小,則a,b的值分別為

(

)A.10,11 B.9.5,10.5C.10.4,10.6 D.10.5,10.53.(2021·新高考Ⅰ卷改編)有一組樣本數據x1,x2,…,xn,由這組數據得到新樣本數據y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c為非零常數,有以下結論:①兩組樣本數據的樣本平均數相同;②兩組樣本數據的樣本中位數相同;③兩組樣本數據的樣本標準差相同;④兩組樣本數據的樣本極差相同.其中正確結論的序號為________.基礎點(三)統(tǒng)計圖表的直觀應用

[題點全訓]1.某企業(yè)2021年12個月的收入與支出數據的折線圖如下:已知:利潤=收入-支出,根據該折線圖,下列說法不正確的是

(

)A.該企業(yè)2021年1月至6月的總利潤低于2021年7月至12月的總利潤B.該企業(yè)2021年1月至6月的平均收入低于2021年7月至12月的平均收入C.該企業(yè)2021年8月至12月的支出持續(xù)增長D.該企業(yè)2021年11月份的月利潤最大解析:因為圖中的實線與虛線的相對高度表示當月利潤.由折線統(tǒng)計圖可知1月至6月的相對高度的總量要比7月至12月的相對高度總量少,故A正確;由折線統(tǒng)計圖可知1月至6月的收入都普遍低于7月至12月的收入,故B正確;由折線統(tǒng)計圖可知2021年8月至12月支出的圖象是上升的,所以支出持續(xù)增長,故C正確;由折線統(tǒng)計圖可知11月的相對高度比7月、8月都要小,故D錯誤.答案:D

2.某學校為了了解本校學生的上學方式,在全校范圍內隨機抽查部分學生,了解到上學方式主要有:A—結伴步行,B—自行乘車,C—家人接送,D—其他方式.并將收集的數據整理繪制成如圖所示的兩幅不完整的統(tǒng)計圖.根據圖中信息,下列說法不正確的是

(

)A.扇形圖中D的占比最小B.條形圖中A和C一樣高C.無法計算扇形圖中A的占比D.估計該校一半的學生選擇結伴步行或家人接送答案:

C

3.某地區(qū)經過一年的新農村建設,農村的經濟收入增加了一倍,實現翻番.為更好地了解該地區(qū)農村的經濟收入變化情況,統(tǒng)計了該地區(qū)新農村建設前后農村的經濟收入構成比例,得到如下餅圖:則下面結論中不正確的是

(

)A.新農村建設后,種植收入減少B.新農村建設后,其他收入增加了一倍以上C.新農村建設后,養(yǎng)殖收入增加了一倍D.新農村建設后,養(yǎng)殖收入與第三產業(yè)收入的總和超過了經濟收入的一半解析:設新農村建設前的收入為M,則新農村建設后的收入為2M,新農村建設前種植收入為0.6M,新農村建設后種植收入為0.74M,所以種植收入增加了,所以A不正確;新農村建設前其他收入為0.04M,新農村建設后其他收入為0.1M,故增加了一倍以上,所以B正確;新農村建設前,養(yǎng)殖收入為0.3M,新農村建設后為0.6M,增加了一倍,所以C正確;新農村建設后,養(yǎng)殖收入與第三產業(yè)收入的總和占經濟收入的30%+28%=58%>50%,所以超過了經濟收入的一半,所以D正確.故選A.答案:A

[方法技巧]常見的能夠反映實際情況的統(tǒng)計圖有條形圖、折線圖、扇形圖等.扇形圖中每一個扇形的圓心角以及弧長,都與這一部分表示的數據大小成正比;折線圖能夠很直觀地體現數據隨時間的變化情況;條形圖可以直觀地體現各數據之間的數量關系;莖葉圖可以直觀展現各個數據,而且能夠通過計算和分布情況體現各個數字特征.具體的應用中要能夠準確掌握各個統(tǒng)計圖的功能,同時要能夠準確理解試題的環(huán)境含義.

層級二/重難點——逐一精研(補欠缺)重難點(一)統(tǒng)計圖表中的數字特征的計算

[典例]統(tǒng)計局就某地居民的月收入(單位:元)情況調查了10000人,并根據所得數據畫出了樣本頻率分布直方圖(如圖),每個分組包括左端點,不包括右端點,如第一組表示月收入在[2500,3000)內.(1)為了分析居民的收入與年齡、職業(yè)等方面的關系,必須按月收入再從這10000人中用分層隨機抽樣的方法抽出100人做進一步分析,則月收入在[4000,4500)內的應抽取多少人?(2)估計該地居民月收入的中位數和眾數;(3)假設同組中的數據用該組區(qū)間的中點值為代表,估計該地居民月收入的平均數.[解]

(1)因為(0.0002+0.0004+0.0003+0.0001)×500=0.5,所以2a×500=0.5,所以a=0.0005.又0.0005×500=0.25,所以月收入在[4000,4500)內的頻率為0.25,所以月收入在[4000,4500)內的應抽取的人數為0.25×100=25.[針對訓練]某小區(qū)為了提高小區(qū)內人員的讀書興趣,準備舉辦讀書活動,并購買一定數量的書籍豐富小區(qū)圖書站.由于不同年齡段的人看不同類型的書籍,為了合理配備資源,現對小區(qū)內看書人員進行年齡調查,隨機抽取了40名讀書者進行調查,將他們的年齡(單位:歲)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如圖所示的頻率分布直方圖.(1)求在這40名讀書者中年齡分布在[40,70)的人數;(2)求這40名讀書者的年齡的平均數和中位數.解:(1)由頻率分布直方圖知,年齡在[40,70)的頻率為(0.020+0.030+0.025)×10=0.75.故這40名讀書者中年齡分布在[40,70)的人數為40×0.75=30.(2)這40名讀書者年齡的平均數為25×0.05+35×0.10+45×0.20+55×0.30+65×0.25+75×0.10=54.設中位數為x,則0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,解得x=55.故這40名讀書者年齡的中位數為55.重難點(二)用樣本估計總體

[典例]

(2019·全國卷Ⅱ)某行業(yè)主管部門為了解本行業(yè)中小企業(yè)的生產情況,隨機調查了100個企業(yè),得到這些企業(yè)第一季度相對于前一年第一季度產值增長率y的頻率分布表.(1)分別估計這類企業(yè)中產值增長率不低于40%的企業(yè)比例、產值負增長的企業(yè)比例;(2)求這類企業(yè)產值增長率的平均數與標準差的估計值(同一組中的數據用該組區(qū)間的中點值為代表).(精確到0.01)y的分組[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企業(yè)數22453147[方法技巧]利用樣本的數字特征解決優(yōu)化決策問題的依據(1)平均數反映了數據取值的平均水平;標準差、方差描述了一組數據圍繞平均數波動的大?。畼藴什睢⒎讲钤酱?,數據的離散程度越大,越不穩(wěn)定;標準差、方差越小,數據的離散程度越小,越穩(wěn)定.(2)用樣本估計總體就是利用樣本的數字特征來描述總體的數字特征.

[針對訓練]某校開展了線上教學活動.數學組積極研討網上教學策略:先采取甲、乙兩套方案教學,并對分別采取兩套方案教學的班級的7次線上測試成績進行統(tǒng)計,如圖所示.(1)請?zhí)顚懴卤?要求寫出計算過程).(2)從下列不同的角度對這次方案選擇的結果進行分析:①從平均數和方差相結合看(分析哪種方案的成績更好);②從折線圖上兩種方案的走勢看(分析哪種方案更有潛力).

平均數方差甲

2.(樣本數字特征意義不清)為評估一種農作物的種植效果,選了n塊地作試驗田.這n塊地的畝產量(單位:kg)分別為x1,x2,…,xn,下面給出的指標中可以用來評估這種農作物畝產量穩(wěn)定程度的是

(

)A.x1,x2,…,xn的平均數B.x1,x2,…,xn的標準差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位數解析:評估這種農作物畝產量穩(wěn)定程度的指標是標準差.答案:B

解析:假設每月新增一組人,將其編號為1,2,3,4,…,則每個月接受調查的情況為:1月:1;2月:1,2;3月:2,3;4月:3,4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論