版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2講統(tǒng)計(jì)與統(tǒng)計(jì)案例
考綱展示命題探究
考點(diǎn)展示考綱要求高考命題探究
(1)隨機(jī)抽樣
[理解隨機(jī)油樣的必要性和重要性.2會(huì)用簡(jiǎn)單隨機(jī)抽樣方法從總體中抽取樣本;了解
分層抽樣和系統(tǒng)曲樣方法.
(2)用樣本估計(jì)總體1.內(nèi)容探究:系統(tǒng)抽樣、
抽樣方法與總體分①了解分布的意義和作用,會(huì)列頻率分布表,會(huì)畫(huà)頻率分布直方圖、頻率折線圖、莖葉分層抽樣的方法,解決
布的估計(jì)圖,理解它們各自的特點(diǎn).②理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,會(huì)計(jì)算數(shù)據(jù)標(biāo)準(zhǔn)差.抽取樣本的相關(guān)系數(shù)問(wèn)
難從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并給出合理的解釋.題,頻率分布直方圖的
④會(huì)用樣本的頻率分布估計(jì)總體分布,會(huì)用樣本的基本數(shù)字特征估計(jì)總體的基本數(shù)字相關(guān)計(jì)算(求頻率、頻
特征,理解用樣本估計(jì)總體的思想.⑤會(huì)用隨機(jī)油樣的基本方法和樣本估計(jì)總體的思想數(shù)等),樣本數(shù)據(jù)的數(shù)
解決一些簡(jiǎn)單的實(shí)際問(wèn)題.字特征(平均數(shù)、方差、
標(biāo)準(zhǔn)差),散點(diǎn)圖與相
(1)變量間的相關(guān)關(guān)系
關(guān)關(guān)系,線性回歸方程
D會(huì)作兩個(gè)有關(guān)聯(lián)變量的數(shù)據(jù)的散點(diǎn)圖,會(huì)利用散點(diǎn)圖認(rèn)識(shí)變量間的相關(guān)關(guān)系.②了解
與獨(dú)立性檢驗(yàn)在實(shí)際生
最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.
活中的應(yīng)用.
(2)統(tǒng)計(jì)案例
.形式探究:本講內(nèi)容
變量間的相關(guān)關(guān)系、了解下列一些常見(jiàn)的統(tǒng)計(jì)方法,并能應(yīng)用這些方法解決一些實(shí)際問(wèn)題.2
統(tǒng)計(jì)案例高考中以選擇題或解答
£獨(dú)立性檢驗(yàn)
題形式出現(xiàn).
了解獨(dú)立性檢驗(yàn)(只要求2x2列聯(lián)表)的基本思想、方法及其簡(jiǎn)單應(yīng)用.
刎歸分析
了解回歸分析的基本思想、方法及其筒單應(yīng)用.
。劇考點(diǎn)一抽樣方法與總體分布的估計(jì)
避房基礎(chǔ)點(diǎn)重難點(diǎn)
1抽樣方法
(1)簡(jiǎn)單隨機(jī)抽樣的概念
設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取〃(八WN)個(gè)個(gè)
體作為樣本,如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相
笠,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.
(2)特點(diǎn)與方法
抽取的個(gè)體數(shù)較小
簡(jiǎn)單隨機(jī)抽逐個(gè)抽取
簡(jiǎn)樣的特點(diǎn)
單是不放回抽取
隨
機(jī)
抽是等可能抽取
樣
簡(jiǎn)單隨機(jī)抽抽簽法
樣的方法
隨機(jī)數(shù)法
(3)系統(tǒng)抽樣的概念
當(dāng)總體中的個(gè)體數(shù)較多時(shí),可將總體分成均衡的幾個(gè)部分,然后
按照預(yù)先定出的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需要的樣本,
這種抽樣方法叫做系統(tǒng)抽樣(也稱(chēng)為機(jī)械抽樣或等距抽樣).
(4)系統(tǒng)抽樣的特點(diǎn)
①適用于元素個(gè)數(shù)很多且均衡的總體.
②各個(gè)個(gè)體被抽到的機(jī)會(huì)均等.
③總體分組后,在起始部分采用的是簡(jiǎn)單隨機(jī)抽樣.
④如果總體容量N能被樣本容量n整除,則抽樣間隔為左=,
如果總體容量N不能被樣本容量n整除,可隨機(jī)地從總體中剔除余
數(shù),然后再按系統(tǒng)抽樣的方法抽樣.
(5)分層抽樣的概念
在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從
各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣
本,這種抽樣方法就叫做分層抽樣.
(6)分層抽樣的步驟
①分層:按某種特征將總體分成若干部分.
②按比例確定每層抽取個(gè)體的個(gè)數(shù).
③各層分別按簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的方法抽取個(gè)體.
④綜合每層抽樣,組成樣本.
2用樣本估計(jì)總體
(1)頻率分布表與頻率分布直方圖
頻率分布表與頻率分布直方圖的繪制步驟如下:
①求極差,即求一組數(shù)據(jù)中最大值與最小值的差.
②決定組距與組數(shù).
③將數(shù)據(jù)分組.
④列頻率分布表.落在各小組內(nèi)的數(shù)據(jù)的個(gè)數(shù)叫做頻數(shù),每小組
的頻數(shù)與數(shù)據(jù)總數(shù)的比值叫做這一小組的頻率.計(jì)算各小組的頻率,
列出頻率分布表.
⑤畫(huà)頻率分布直方圖.依據(jù)頻率分布表畫(huà)頻率分布直方圖,其中
縱坐標(biāo)(小長(zhǎng)方形的高)表示頻率與組距的比值,其相應(yīng)組距上的頻率
頻率
等于該組上的小長(zhǎng)方形的面積,即每個(gè)小長(zhǎng)方形的面積=組距X篇
=頻率.
這樣,頻率分布直方圖就以面積的形式反映了數(shù)據(jù)落在各個(gè)小組
的頻率的大小,各個(gè)小長(zhǎng)方形面積的總和等于1.
(2)頻率分布折線圖和總體密度曲線
①頻率分布折線圖:連接頻率分布直方圖中各小長(zhǎng)方形上端的史
點(diǎn),就得到頻率分布折線圖.
②總體密度曲線:隨著樣本容量的增加,作頻率分布直方圖時(shí)所
分的組數(shù)也在增加,相應(yīng)的頻率分布折線圖會(huì)越來(lái)越接近于一條光滑
曲線,統(tǒng)計(jì)中稱(chēng)這條光滑曲線為總體密度曲線.
(3)莖葉圖
莖葉圖是統(tǒng)計(jì)中用來(lái)表示數(shù)據(jù)的一種圖,莖是指中間的一列數(shù),
葉就是從莖的旁邊生長(zhǎng)出來(lái)的數(shù).
對(duì)于樣本數(shù)據(jù)較少,且分布較為集中的一組數(shù)據(jù):若數(shù)據(jù)是兩位
整數(shù),則將十位數(shù)字作莖,個(gè)位數(shù)字作葉;若數(shù)據(jù)是三位整數(shù),則將
百位、十位數(shù)字作莖,個(gè)位數(shù)字作葉.樣本數(shù)據(jù)為小數(shù)時(shí)做類(lèi)似處理.
對(duì)于樣本數(shù)據(jù)較少,且分布較為集中的兩組數(shù)據(jù),關(guān)鍵是找到兩
組數(shù)據(jù)共有的莖.
(4)眾數(shù)、中位數(shù)、平均數(shù)
定義特點(diǎn)
體現(xiàn)了樣本數(shù)據(jù)的最大集中
在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多
眾數(shù)點(diǎn),不受極端值的影響,而且
的數(shù)據(jù)
不唯一
將一組數(shù)據(jù)按大小順序依次
中位數(shù)不受極端值的影響,僅
中位排列,處在最中間位置的一個(gè)
利用了排在中間數(shù)據(jù)的信息,
數(shù)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平
只有一個(gè)
均數(shù))
平均與每一個(gè)樣本數(shù)據(jù)有關(guān),只有
樣本數(shù)據(jù)的算術(shù)平均數(shù)
數(shù)一個(gè)
(5)極差、標(biāo)準(zhǔn)差與方差
定義特點(diǎn)
反映一組數(shù)據(jù)的波動(dòng)
情況,一般情況下,
極差大,則數(shù)據(jù)波動(dòng)
極差一組數(shù)據(jù)中最大值與最小值的差性大;極差小,則數(shù)
據(jù)波動(dòng)性小,但極差
只考慮兩個(gè)極端值,
可靠性較差
反映了各個(gè)樣本數(shù)據(jù)
標(biāo)準(zhǔn)差是樣本數(shù)據(jù)到平均數(shù)的一種平均
聚集于樣本平均數(shù)周
是巨離,即5=
標(biāo)準(zhǔn)差圍的程度.標(biāo)準(zhǔn)差越
-X)2+(%2-%)2+…+(%"-X)2小,表明各個(gè)樣本數(shù)
據(jù)在樣本平均數(shù)周?chē)?/p>
越集中;標(biāo)準(zhǔn)差越大,
表明各個(gè)樣本數(shù)據(jù)在
樣本平均數(shù)的兩邊越
分散
同標(biāo)準(zhǔn)差一樣用來(lái)衡
標(biāo)準(zhǔn)差的平方,即=
?量樣本數(shù)據(jù)的離散程
方差1————
-[(xi—x)2+(%2-x)2H------x)2]度,但是平方后夸大
了偏差程度
市》注意點(diǎn)眾數(shù)、平均數(shù)、中位數(shù)的關(guān)系
(1)眾數(shù)、中位數(shù)與平均數(shù)都是描述一組數(shù)據(jù)集中趨勢(shì)的量,平
均數(shù)是最重要的量.
(2)平均數(shù)反映的是樣本個(gè)體的平均水平,眾數(shù)和中位數(shù)則反映
樣本中個(gè)體的“重心”.
(3)實(shí)際問(wèn)題中求得的平均數(shù)、眾數(shù)和中位數(shù)應(yīng)帶上單位.
SB小題快做:
1.思維辨析
(1)系統(tǒng)抽樣在第1段抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣.()
(2)若為了適合分段或分層而剔除幾個(gè)個(gè)體后再抽樣,則對(duì)剔除
的個(gè)體來(lái)說(shuō)是不公平的.()
(3)一組數(shù)據(jù)的平均數(shù)一定大于這組數(shù)據(jù)中的每個(gè)數(shù)據(jù).()
(4)一組數(shù)據(jù)的方差越大,說(shuō)明這組數(shù)據(jù)的波動(dòng)越大.()
(5)頻率分布直方圖中,小矩形的面積越大,表示樣本數(shù)據(jù)落在
該區(qū)間內(nèi)的頻率越[Wj.()
(6)莖葉圖中的數(shù)據(jù)要按從小到大的順序?qū)懀嗤臄?shù)據(jù)可以只
記一次.()
答案(1)V(2)X(3)X(4)V(5)V(6)X
2.如圖是容量為150的樣本的頻率分布直方圖,則樣本數(shù)據(jù)落
在[6,10)內(nèi)的頻數(shù)為()
C.60D.80
答案B
解析XX150=48.
3.為了檢查某超市貨架上的飲料是否含有塑化劑,要從編號(hào)依
次為1到50的塑料瓶裝飲料中抽取5瓶進(jìn)行檢驗(yàn),用每部分選取的
號(hào)碼間隔一樣的系統(tǒng)抽樣方法確定所選取的5瓶飲料的編號(hào)可能是
()
A.5,10,15,20,25B.2,4,8,16,32
C.1,2,3,4,5D.7,17,27,37,47
答案D
解析利用系統(tǒng)抽樣,把編號(hào)分為5段,每段10個(gè),每段抽取
一個(gè),號(hào)碼間隔為10.
播法命題法解題法
於[考法綜述]高考對(duì)隨機(jī)抽樣的考查常以實(shí)際應(yīng)用為背景考
查樣本的抽取,特別是分層抽樣與系統(tǒng)抽樣的理解與計(jì)算.利用樣本
頻率分布估計(jì)總體分布是高考熱點(diǎn),會(huì)列頻率分布表,會(huì)畫(huà)頻率分布
直方圖,小題一般較容易,大題往往結(jié)合概率考查,難度中等.
命題法1抽樣方法
典例1(1)已知某單位有40名職工,現(xiàn)要從中抽取5名職工,
將全體職工隨機(jī)按1?40編號(hào),并按編號(hào)順序平均分成5組.按系統(tǒng)
抽樣方法在各組內(nèi)抽取一個(gè)號(hào)碼.若第1組抽出的號(hào)碼為2,則所有
被抽出職工的號(hào)碼為.
(2)某個(gè)年級(jí)有男生560人,女生420人,用分層抽樣的方法從
該年級(jí)全體學(xué)生中抽取一個(gè)容量為280的樣本,則此樣本中男生人數(shù)
為.
[解析](1)由系統(tǒng)抽樣知識(shí)知,第一組1?8號(hào);第二組為9?16
號(hào);第三組為17?24號(hào);第四組為25?32號(hào);第五組為33?40號(hào).
第一組抽出號(hào)碼為2,則依次為10,18,26,34.
()抽取比例為=郎所以樣本中男生人數(shù)為
25"6在0+4鼠20=9oU/
560x1=160.
[答案](1)2,10,18,26,34(2)160
9【解題法】三種抽樣方法的比較
類(lèi)別共同點(diǎn)各自特點(diǎn)相互聯(lián)系適用范圍
從總體中逐個(gè)總體中的個(gè)
簡(jiǎn)單隨機(jī)抽樣—
抽取數(shù)較少
是不放回將總體均分成
抽樣,抽樣幾部分,按事在起始部分抽
總體中的個(gè)
系統(tǒng)抽樣過(guò)程中,每先確定的規(guī)樣時(shí),采用簡(jiǎn)
數(shù)比較多
個(gè)個(gè)體被則,在各部分單隨機(jī)抽樣
抽到的機(jī)抽取
會(huì)(概率)相各層抽樣時(shí),
將總體分成幾總體由差異
等采用簡(jiǎn)單隨機(jī)
分層抽樣層,分層進(jìn)行明顯的幾部
抽樣或者系統(tǒng)
抽取分組成
抽樣
命題法2用樣本估計(jì)總體
典例2(1)某校100名學(xué)生期中考試語(yǔ)文成績(jī)的頻率分布直方
圖如圖所示,其中成績(jī)分組區(qū)間是:[50,60),[60,70),[70,80),[80,90),
[90,100].
①求圖中。的值;
②根據(jù)頻率分布直方圖,估計(jì)這100名學(xué)生語(yǔ)文成績(jī)的平均分;
③若這100名學(xué)生語(yǔ)文成績(jī)某些分?jǐn)?shù)段的人數(shù)⑴與數(shù)學(xué)成績(jī)相
應(yīng)分?jǐn)?shù)段的人數(shù)(y)之比如下表所示,求數(shù)學(xué)成績(jī)?cè)冢?0,90)之外的人
數(shù).
分?jǐn)?shù)段[50,60)[60,70)[70,80)[80,90)
%:y1:12:13:44:5
(2)為了比較兩種治療失眠癥的藥(分別稱(chēng)為A藥,5藥)的療效,
隨機(jī)地選取20位患者服用4藥,20位患者服用5藥,這40位患者
在服用一段時(shí)間后,記錄他們?nèi)掌骄黾拥乃邥r(shí)間(單位:h).試
驗(yàn)的觀測(cè)結(jié)果如下:
服用A藥的20位患者日平均增加的睡眠時(shí)間:
服用B藥的20位患者日平均增加的睡眠時(shí)間:
①分別計(jì)算兩組數(shù)據(jù)的平均數(shù),從計(jì)算結(jié)果看,哪種藥的療效更
好?
②根據(jù)兩組數(shù)據(jù)完成下面莖葉圖,從莖葉圖看,哪種藥的療效更
好?
_____________
0.
1.
2.
3.
[解](1)①由頻率分布直方圖可知:
(2^+0.04+0.03+0.02)X10=1,所以a=0.005.
②根據(jù)頻率分布直方圖,估計(jì)這100名學(xué)生語(yǔ)文成績(jī)的平均分為
55X0.05+65X0.4+75X0.3+85X0.2+95X0.05=2.75+26+22.5
+17+4.75=73(分).
③根據(jù)頻率分布直方圖及表中數(shù)據(jù)得:
分?jǐn)?shù)段Xy
[50,60)55
[60,70)4020
[70,80)3040
[80,90)2025
二?數(shù)學(xué)成績(jī)?cè)冢?0,90)之外的人數(shù)為100—5—20—40—25=10.
(2)①設(shè)A藥觀測(cè)數(shù)據(jù)的平均數(shù)為x,B藥觀測(cè)數(shù)據(jù)的平均數(shù)為
y,
由觀測(cè)結(jié)果可得
x=/(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5
+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
y=^(0.5+0.5+0.6+0.8+0.9+l.l+1.2+1.2+1.3+1.4+1.6
+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上計(jì)算結(jié)果可知:%>y,由此可看出A藥的療效更好.
②由觀測(cè)結(jié)果可繪制如下莖葉圖:
A藥B藥
60.55689
855221.122346789
98776543322.14567
52103.2
7
從以上莖葉圖可以看出,A藥療效的試驗(yàn)結(jié)果有右的葉集中在
7
“2.”,“3.”上,而5藥療效的試驗(yàn)結(jié)果有正的葉集中在“0.”,“1.”上,
由此可看出A藥的療效更好.
Q【解題法】用樣本估計(jì)總體的解題策略
(1)用樣本估計(jì)總體時(shí),樣本的平均數(shù)、標(biāo)準(zhǔn)差只是總體的平均
數(shù)、標(biāo)準(zhǔn)差的近似.實(shí)際應(yīng)用中,當(dāng)所得數(shù)據(jù)平均數(shù)不相等時(shí),需先
分析平均水平,再計(jì)算標(biāo)準(zhǔn)差(方差)分析穩(wěn)定情況.
(2)若給出圖形,一方面可以由圖形得到相應(yīng)的樣本數(shù)據(jù),再計(jì)
算平均數(shù)、方差(標(biāo)準(zhǔn)差);另一方面,可以從圖形直觀分析樣本數(shù)據(jù)
的分布情況,大致判斷平均數(shù)的范圍,并利用數(shù)據(jù)的波動(dòng)性大小反映
方差(標(biāo)準(zhǔn)差)的大小.
健題對(duì)點(diǎn)題必刷題
1.根據(jù)下面給出的2004年至2013年我國(guó)二氧化硫年排放量(單
位:萬(wàn)噸)柱形圖,以下結(jié)論中不正確的是()
2700--------------------------------------------------------------------------------------------------
2600..........................pq................................................................................................
2500......................................=...................................................................................
2400..........................'.....................................................................................................
2300..................................................尸..............................
2200...................................................—…r77]…一■—[?…廠.............
2100.........................s..........................................................................尸|.......
2000
19?!?004年2005年2006年2007年2008年2009年2010年2011年2012年2013年
A.逐年比較,2008年減少二氧化硫排放量的效果最顯著
B.2007年我國(guó)治理二氧化硫排放顯現(xiàn)成效
C.2006年以來(lái)我國(guó)二氧化硫年排放量呈減少趨勢(shì)
D.2006年以來(lái)我國(guó)二氧化硫年排放量與年份正相關(guān)
答案D
解析根據(jù)柱形圖可觀察兩個(gè)變量的相關(guān)性,易知A、B、C正
確,2006年以來(lái)我國(guó)二氧化硫年排放量與年份負(fù)相關(guān),選項(xiàng)D錯(cuò)誤.故
選D.
2.若樣本數(shù)據(jù)內(nèi),%2,…,X10的標(biāo)準(zhǔn)差為8,則數(shù)據(jù)2%1—1,2%2
—1,…,2xio-1的標(biāo)準(zhǔn)差為()
A.8B.15
C.16D.32
答案C
解析由標(biāo)準(zhǔn)差的性質(zhì)知,2用一1,2%2—1,…2%i()—1的標(biāo)準(zhǔn)差為
2X8=16,故選C.
3.重慶市2013年各月的平均氣溫(℃)數(shù)據(jù)的莖葉圖如下:
338
則這組數(shù)據(jù)的中位數(shù)是(
19
21.5
答案B
解析根據(jù)莖葉圖及中位數(shù)的概念,由莖葉圖知,該組數(shù)據(jù)的中
20+20
位數(shù)為=20.故選B.
4.我國(guó)古代數(shù)學(xué)名著《數(shù)書(shū)九章》有“米谷粒分”題:糧倉(cāng)開(kāi)倉(cāng)
收糧,有人送來(lái)米1534石,驗(yàn)得米內(nèi)夾谷,抽樣取米一把,數(shù)得254
粒內(nèi)夾谷28粒,則這批米內(nèi)夾谷約為()
A.134石B.169石
C.338石D.1365石
答案B
解析根據(jù)樣本估計(jì)總體,可得這批米內(nèi)夾谷約為急
乙JI
X1534七169石.故選B.
5.某中學(xué)初中部共有110名教師,高中部共有150名教師,其
性別比例如圖所示,則該校女教師的人數(shù)為()
A.167B.137
C.123D.93
答案B
解析初中部女教師的人數(shù)為110X70%=77,高中部女教師的
人數(shù)為150X(1—60%)=60,則該校女教師的人數(shù)為77+60=137,
故選B.
6.對(duì)一個(gè)容量為N的總體抽取容量為〃的樣本,當(dāng)選取簡(jiǎn)單隨
機(jī)抽樣、系統(tǒng)抽樣和分層抽樣三種不同方法抽取樣本時(shí),總體中每個(gè)
個(gè)體被抽中的概率分別為Pl,P2,P3,則()
A.pi=p2Vp3B.P2=P3<〃1
C.P1=P3<P2D.P1=P2=P3
答案D
解析由隨機(jī)抽樣定義可知,每個(gè)個(gè)體成為樣本的概率相等,故
選D.
7.為了研究某藥品的療效,選取若干名志愿者進(jìn)行臨床試驗(yàn).所
有志愿者的舒張壓數(shù)據(jù)(單位:kPa)的分組區(qū)間為[12,13),[13,14),
[14,15),[15,16),[16,17],將其按從左到右的順序分別編號(hào)為第一組,
第二組,……,第五組.如圖是根據(jù)試驗(yàn)數(shù)據(jù)制成的頻率分布直方
圖.已知第一組與第二組共有20人,第三組中沒(méi)有療效的有6人,
則第三組中有療效的人數(shù)為()
0.36
C.12D.18
答案C
解析設(shè)樣本容量為m
由題意,得(0.24+0.16)義1義”=20,解得〃=50.
X1X5O=18.
因?yàn)榈谌M中沒(méi)有療效的有6人,所以第三組中有療效的人數(shù)為
18-6=12.
8.在一次馬拉松比賽中,35名運(yùn)動(dòng)員的成績(jī)(單位:分鐘)的莖
葉圖如圖所示.
1300345668889
1411122233445556678
150122333
若將運(yùn)動(dòng)員按成績(jī)由好到差編為1?35號(hào),再用系統(tǒng)抽樣方法從
中抽取7人,則其中成績(jī)?cè)趨^(qū)間[139,151]上的運(yùn)動(dòng)員人數(shù)是
答案4
解析由系統(tǒng)抽樣方法知,應(yīng)把35人分成7組,每組5人,每
組按規(guī)則抽取1人,因?yàn)槌煽?jī)?cè)趨^(qū)間[139,151]上的共有4組,故成績(jī)
在區(qū)間[139,151]上的運(yùn)動(dòng)員人數(shù)是4
9.為了了解一片經(jīng)濟(jì)林的生長(zhǎng)情況,隨機(jī)抽測(cè)了其中60株樹(shù)木
的底部周長(zhǎng)(單位:cm),所得數(shù)據(jù)均在區(qū)間[80,130]上,其頻率分布
直方圖如圖所示,則在抽測(cè)的60株樹(shù)木中,有株樹(shù)木的底
部周長(zhǎng)小于100cm.
八頻率/組距
0.030.................................
0.025..........................
0.020.......................................
0.015..............—
0.010.............................................
08090100110120130底部周長(zhǎng)/cm
答案24
角星析60X(0.015+0.025)X10=24.
10.某公司為了解用戶對(duì)其產(chǎn)品的滿意度,從A,B兩地區(qū)分別
隨機(jī)調(diào)查了40個(gè)用戶,根據(jù)用戶對(duì)產(chǎn)品的滿意度評(píng)分,得到A地區(qū)
用戶滿意度評(píng)分的頻率分布直方圖和B地區(qū)用戶滿意度評(píng)分的頻數(shù)
分布表.
A地區(qū)用戶滿意度評(píng)分的頻率分布直方圖
頻率/組距
0.040-
0.035-
().03()..................................
0.025-
0.020.........................……-------
0.015...........................................——
0.010................
0.005.........——I
LA/\------------------------------------1-----?
oY405()607()8()9()10()滿意度評(píng)分
B地區(qū)用戶滿意度評(píng)分的頻數(shù)分布表
滿意度
[50,60)[60,70)[70,80)[80,90)[90,100]
評(píng)分分組
頻數(shù)2814106
(1)在圖中作出B地區(qū)用戶滿意度評(píng)分的頻率分布直方圖,并通
過(guò)直方圖比較兩地區(qū)滿意度評(píng)分的平均值及分散程度(不要求計(jì)算出
具體值,給出結(jié)論即可);
B地區(qū)用戶滿意度評(píng)分的頻率分布直方圖
⑵根據(jù)用戶滿意度評(píng)分,將用戶的滿意度分為三個(gè)等級(jí):
滿意度評(píng)分低于70分70分到89分不低于90分
滿意度等級(jí)不滿意滿意非常滿意
估計(jì)哪個(gè)地區(qū)用戶的滿意度等級(jí)為不滿意的概率大?說(shuō)明理由.
解(1)
通過(guò)兩地區(qū)用戶滿意度評(píng)分的頻率分布直方圖可以看出,B地區(qū)
用戶滿意度評(píng)分的平均值高于A地區(qū)用戶滿意度評(píng)分的平均值;B
地區(qū)用戶滿意度評(píng)分比較集中,而A地區(qū)用戶滿意度評(píng)分比較分散.
(2)A地區(qū)用戶的滿意度等級(jí)為不滿意的概率大.
記CA表示事件:“A地區(qū)用戶的滿意度等級(jí)為不滿意”;CB表
示事件:“B地區(qū)用戶的滿意度等級(jí)為不滿意”.
由頻率分布直方圖得尸(CA)的估計(jì)值為(0.01+0.02+0.03)X10=
0.6,
P(CB)的估計(jì)值為(0.005+0.02)X10=0.25.
所以A地區(qū)用戶的滿意度等級(jí)為不滿意的概率大.
11.某工廠36名工人的年齡數(shù)據(jù)如下表:
工人編號(hào)年齡工人編號(hào)年齡工人編號(hào)年齡工人編號(hào)年齡
140103619272834
244113120432939
340123821413043
441133922373138
533144323343242
640154524423353
745163925373437
842173826443549
943183627423639
(1)用系統(tǒng)抽樣法從36名工人中抽取容量為9的樣本,且在第一
分段里用隨機(jī)抽樣法抽到的年齡數(shù)據(jù)為44,列出樣本的年齡數(shù)據(jù);
(2)計(jì)算⑴中樣本的均值三和方差
(3)36名工人中年齡在以一s與1+s之間有多少人?所占的百分
比是多少(精確到0.01%)?
解(1)由系統(tǒng)抽樣的知識(shí)可知,36人分成9組,每組4人,其
中第一組的工人年齡為44,所以其編號(hào)為2,故所有樣本數(shù)據(jù)的編號(hào)
為4八一2,九=1,2,…,9.其數(shù)據(jù)為:44,40,36,43,36,37,44,43,37.
44+40H——P37
=40.
(2)x=9
由方差公式知,$2=|[(44-40)2+(40-40)2H——P(37—40)2]=
y
100
~9~-
(3)因?yàn)?2=竽,所以S=¥〃(3,4),
所以36名工人中年齡在%—s和%+s之間的人數(shù)等于在區(qū)間
[37,43]內(nèi)的人數(shù),
即40,40,41,…,39,共23人.
所以36名工人中年齡在三一s和1+s之間的人數(shù)所占的百分比
為宏763.89%.
12.某城市100戶居民的月平均用電量(單位:度),以[160,180),
[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分
組的頻率分布直方圖如圖所示.
頻率
痂
(1)求直方圖中%的值;
(2)求月平均用電量的眾數(shù)和中位數(shù);
(3)在月平均用電量為[220,240),[240,260),[260,280),[280,300]
的四組用戶中,用分層抽樣的方法抽取11戶居民,則月平均用電量
在[220,240)的用戶中應(yīng)抽取多少戶?
解(1)依題意,20X(0.002+0.0095+0.011+0.0125+%+0.005
+0.0025)=1,解得%=0.0075.
(2)由題圖可知,最高矩形的數(shù)據(jù)組為[220,240),
220+240
眾數(shù)為
2=230.
'.'[160,220)的頻率之和為(0.002+0,0095+0,011)X20=0.45,
.??依題意,設(shè)中位數(shù)為y,
廠.0.45+(y-220)X0.0125=0.5.
解得y=224,
.?.中位數(shù)為224.
(3)月平均用電量在[220,240)的用戶在四組用戶中所占比例為
,0.0125+0,0075+0.005+0.0025)=1j-,
月平均用電量在[220,240)的用戶中應(yīng)抽取11X亮=5(戶).
13.某校高三共有900名學(xué)生,高三模擬考之后,為了了解學(xué)生
學(xué)習(xí)情況,用分層抽樣方法從中抽出若干學(xué)生此次數(shù)學(xué)成績(jī),按成績(jī)
分組,制成如下的頻率分布表:
第一第二第三第四第五第六第七第八
組號(hào)
組組組組組組組組
合計(jì)
[70,8[80,9[90,1[100,[110,[120,[130,[140,
分組
0)0)00)110)120)130)140)150)
頻數(shù)64222018a105C
頻率b1
(1)確定表中a,b,c的值;
(2)為了了解數(shù)學(xué)成績(jī)?cè)?20分以上的學(xué)生的心理狀態(tài),現(xiàn)決定
在第六、七、八組中用分層抽樣方法抽取6名學(xué)生,在這6名學(xué)生中
又再隨機(jī)抽取2名與心理老師面談,求第七組中至少有一名學(xué)生被抽
到與心理老師面談的概率;
(3)估計(jì)該校本次考試的數(shù)學(xué)平均分.
解⑴因?yàn)轭l率和為1,所以辦=0.18,
因?yàn)轭l率=頻數(shù)/樣本容量,所以c=100,?=15.
(2)第六、七、八組共有30個(gè)樣本,用分層抽樣方法抽取6名學(xué)
生,每個(gè)被抽取的概率均為點(diǎn),第七組被抽取的樣本數(shù)為1X10=2,
將第六組、第八組抽取的樣本分別用A,B,C,Z)表示,第七組抽出
的樣本用E,尸表示.
抽取2個(gè)的方法有A3、AC.AD.AE、A尸、BC、BD、BE、BF、
CD、CE、CF、DE、DF、EF,共15種.
3
其中至少含E或尸的取法有9種,則所求概率為
(3)估計(jì)平均分為75X0.06+85X0.04+95X0.22+105X0.2+
115X0.18+125X0.15+135X0.1+145X0.05=110.
附3考點(diǎn)二變量間的相關(guān)關(guān)系、統(tǒng)計(jì)案例
算"基礎(chǔ)點(diǎn)重難點(diǎn)
1回歸分析
(1)變量間的相關(guān)關(guān)系
當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩
個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系.即相關(guān)關(guān)系是一種非確定性關(guān)系.
當(dāng)一個(gè)變量的值由小變大時(shí),另一個(gè)變量的值也由小變大,則這
兩個(gè)變量正相關(guān);
當(dāng)一個(gè)變量的值由小變大時(shí),而另一個(gè)變量的值由大變小,則這
兩個(gè)變量負(fù)相關(guān).
(2)散點(diǎn)圖
將樣本中的〃個(gè)數(shù)據(jù)點(diǎn)(為,M)?=1,2,…,”)描在平面直角坐標(biāo)
系中,所得圖形叫做散點(diǎn)圖.
具有正相關(guān)關(guān)系的兩個(gè)變量的散點(diǎn)圖如圖⑴所示,
具有負(fù)相關(guān)關(guān)系的兩個(gè)變量的散點(diǎn)圖如圖(2)所示.
(3)兩個(gè)變量的線性相關(guān)
如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,則這兩
個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.回歸直線對(duì)
應(yīng)的方程叫做回歸直線方程(簡(jiǎn)稱(chēng)回歸方程).
(4)回歸方程的求解
求回歸方程的方法是最小二乘法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直
線的距離的平方和最小.
若變量為與y具有線性相關(guān)關(guān)系,有n個(gè)樣本數(shù)據(jù)?,W(i=
n
L%)8—y)
AAAA£(%
1,2,…,n),則回歸方程y=》%+。中Z?==
2
E(x;-x)
i=l
n___
£孫——yA?
i=l———1—1————、
—,Q=y-8%.其中%y(%,y)稱(chēng)為
£x?—2i=1;=1
(=1
樣本點(diǎn)的中心.
(5)相關(guān)系數(shù)
我們可以利用相關(guān)系數(shù)來(lái)定量地衡量?jī)蓚€(gè)變量之間的線性相關(guān)
n
£(汨一%)8—y)
關(guān)系,計(jì)算公式為r=-j:〃,Ir|<l.
'”(筋-x)2£⑴-y)2
\]i=li=l
當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)-0時(shí),表明兩個(gè)變量負(fù)相
關(guān).
仍越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);
用越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.
通常,當(dāng)上時(shí),我們認(rèn)為兩個(gè)變量之間存在著很強(qiáng)的線性相關(guān)關(guān)
系.
2獨(dú)立性檢驗(yàn)
⑴2X2列聯(lián)表
設(shè)x,y為兩個(gè)變量,它們的取值分別為{?,迫}和{9,”},其
樣本頻數(shù)列聯(lián)表(2X2列聯(lián)表)如下:
V以總計(jì)
X1aba-\-b
X2Cdc~\~d
總計(jì)a-\~cb~\~do+b+c+d
⑵獨(dú)立性檢驗(yàn)
利用隨機(jī)變量蜉(也可表示為.)=-啜”、一八
(。十。)(。十d)(。十c)(。十d)
(其中〃=a+b+c+d為樣本容量)來(lái)判斷“兩個(gè)變量有關(guān)系”的
方法稱(chēng)為獨(dú)立性檢驗(yàn).
(3)獨(dú)立性檢驗(yàn)的一般步驟
①根據(jù)樣本數(shù)據(jù)列出2X2列聯(lián)表;
②計(jì)算隨機(jī)變量蜉的觀測(cè)值匕查下表確定臨界值自:
PH?ko)
ko
p(蜉三公)
ko
③如果左2公,就推斷“x與y有關(guān)系”,這種推斷犯錯(cuò)誤的概
率不超過(guò)P(心三左0);否則,就認(rèn)為在犯錯(cuò)誤的概率不超過(guò)P(群2左0)
的前提下不能推斷“X與y有關(guān)系”.
市》注意點(diǎn)對(duì)獨(dú)立性檢驗(yàn)的理解
(1)通常認(rèn)為左W2.706時(shí),樣本數(shù)據(jù)就沒(méi)有充分的證據(jù)顯示“X
與y有關(guān)系”.
(2)獨(dú)立性檢驗(yàn)得出的結(jié)論是帶有概率性質(zhì)的,只能說(shuō)結(jié)論成立
的概率有多大,而不能完全肯定一個(gè)結(jié)論,因此才出現(xiàn)了臨界值表.在
分析問(wèn)題時(shí)一定要注意這點(diǎn),不可對(duì)某個(gè)問(wèn)題下確定性結(jié)論,否則就
可能對(duì)統(tǒng)計(jì)計(jì)算的結(jié)果作出錯(cuò)誤的解釋.
京0小題快做;
1.思維辨析
(1)相關(guān)關(guān)系的兩個(gè)變量是非確定關(guān)系.()
(2)散點(diǎn)圖中的點(diǎn)越集中,兩個(gè)變量的線性相關(guān)性越強(qiáng).()
(3)對(duì)于分類(lèi)變量X與匕它們的隨機(jī)變量K2的觀測(cè)值越小.“X
與y有關(guān)聯(lián)”的把握程度越大.()
(4)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成
正相關(guān)關(guān)系.()
(5)只有兩個(gè)變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測(cè)價(jià)
值.()
答案(1)V(2)X(3)X(4)V(5)V
2.已知回歸直線的斜率的估計(jì)值為1.23,樣本點(diǎn)的中心為(4,5),
則回歸直線方程為()
AA
A.yx+4B.yx+5
AA
C.yx+0.08D.yX
答案C
解析因?yàn)榛貧w直線方程必過(guò)樣本點(diǎn)的中心(%,y),將點(diǎn)(4,5)
代入A,B,C,D檢驗(yàn)可知,選項(xiàng)C正確.
3.某高校教“統(tǒng)計(jì)初步”課程的教師隨機(jī)調(diào)查了選該課程的一
些學(xué)生的情況,具體數(shù)據(jù)如下表:
專(zhuān)業(yè)
非統(tǒng)計(jì)專(zhuān)業(yè)統(tǒng)計(jì)專(zhuān)業(yè)
性另
男1310
女720
為了判斷主修統(tǒng)計(jì)專(zhuān)業(yè)是否與性別有關(guān)系,根據(jù)表中的數(shù)據(jù),得
50X(13X20—10X7)2
到蜉的觀測(cè)值k=~23X27X20X30^4.844.
因?yàn)榕?.841,所以判定主修統(tǒng)計(jì)專(zhuān)業(yè)與性別有關(guān)系,那么這種
判斷出錯(cuò)的可能性為.
答案5%
解析?.次>3.841,查臨界值表,得P(蜉23.841)=0.05,故這種
判斷出錯(cuò)的可能性為5%.
活命題法解題法
命題法1回歸分析
典例1假設(shè)關(guān)于某設(shè)備的使用年限%(年)和所支出的維修費(fèi)
用y(萬(wàn)元),有如下表的統(tǒng)計(jì)資料:
使用年限工(年)23456
維修費(fèi)用y(萬(wàn)元)
若由資料可知y對(duì)次呈線性相關(guān)關(guān)系,試求:
(1)線性回歸直線方程;
(2)根據(jù)回歸直線方程,估計(jì)使用年限為12年時(shí),維修費(fèi)用是多
少?
[解]⑴列表
i12345合計(jì)
Xi2345620
yt25
Xiyt
x?4916253690
%=4,y=5;
55
Ex?=90;E孫
Z-lZ-l
5______
Yxiyi—5xy
_i=i___________112.3-5X4X5
b=F-90—5X42~=L23,
Ex?—5x2
A一A一
于是a=y—bxX4=0.08.
A
所以線性回歸直線方程為好+0.08.
A
(2)當(dāng)%=12時(shí),yX12+0.08=14.84(萬(wàn)元),
即估計(jì)使用12年時(shí),維修費(fèi)用是14.84萬(wàn)元.
Q【解題法】求線性回歸直線方程的步驟
(1)用散點(diǎn)圖或進(jìn)行相關(guān)性檢驗(yàn)判斷兩個(gè)變量是否具有線性相關(guān)
關(guān)系.
____nnn
(2)列表求出x,y,ExhEyh(可用計(jì)算器進(jìn)行計(jì)算)?
i=li=\i=l
n_____
A^Xiyi-nxyA_A_
i=1_
(3)利用公式。=----二一,a=y—Z?%求得回歸系數(shù).
£/一nx2
i=l
(4)寫(xiě)出回歸直線方程.
命題法2獨(dú)立性檢驗(yàn)
典例2某工廠有25周歲以上(含25周歲)工人300名,25周歲
以下工人200名.為研究工人的日平均生產(chǎn)量是否與年齡有關(guān),現(xiàn)采
用分層抽樣的方法,從中抽取了100名工人,先統(tǒng)計(jì)了他們某月的日
平均生產(chǎn)件數(shù),然后按工人年齡在“25周歲以上(含25周歲)”和“25
周歲以下”分為兩組,再將兩組工人的日平均生產(chǎn)件數(shù)分成5組:
[50,60),[60,70),[70,80),[80,90),[90,100]分別加以統(tǒng)計(jì),得到如圖
所示的頻率分布直方圖.
25周歲以上組
頻率t
組距
0.0325.......................————
0.0250................——
0.0050……-1——..................................................................
——
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版木材采購(gòu)合同與木材質(zhì)量保證協(xié)議4篇
- 2025八年級(jí)上學(xué)期期末歷史試卷
- 2025年度二零二五年度智能交通管理系統(tǒng)設(shè)計(jì)與實(shí)施合同4篇
- 二零二五年度木制品表面處理合同樣本4篇
- 2025版學(xué)校教室租賃合同示范文本2篇
- 2025年度個(gè)人毛坯房租賃與租金支付方式合同4篇
- 公共基礎(chǔ)-2020年試驗(yàn)檢驗(yàn)師助理《公共基礎(chǔ)》真題
- 寶石礦物學(xué)在寶石加工中的應(yīng)用研究考核試卷
- 2025版土地居間業(yè)務(wù)規(guī)范合同樣本(2025版)6篇
- 2025版圖書(shū)銷(xiāo)售代理居間服務(wù)合同模板
- 加強(qiáng)教師隊(duì)伍建設(shè)教師領(lǐng)域?qū)W習(xí)二十屆三中全會(huì)精神專(zhuān)題課
- 2024-2025學(xué)年人教版數(shù)學(xué)七年級(jí)上冊(cè)期末復(fù)習(xí)卷(含答案)
- 2024年決戰(zhàn)行測(cè)5000題言語(yǔ)理解與表達(dá)(培優(yōu)b卷)
- 四年級(jí)數(shù)學(xué)上冊(cè)人教版24秋《小學(xué)學(xué)霸單元期末標(biāo)準(zhǔn)卷》考前專(zhuān)項(xiàng)沖刺訓(xùn)練
- 2025年慢性阻塞性肺疾病全球創(chuàng)議GOLD指南修訂解讀課件
- (完整版)減數(shù)分裂課件
- 銀行辦公大樓物業(yè)服務(wù)投標(biāo)方案投標(biāo)文件(技術(shù)方案)
- 第01講 直線的方程(九大題型)(練習(xí))
- 飯店管理基礎(chǔ)知識(shí)(第三版)中職PPT完整全套教學(xué)課件
- 2023年重慶市中考物理A卷試卷【含答案】
- 【打印版】意大利斜體英文字帖(2022年-2023年)
評(píng)論
0/150
提交評(píng)論