教案《用樣本的數(shù)字特征估計(jì)總體》_第1頁
教案《用樣本的數(shù)字特征估計(jì)總體》_第2頁
教案《用樣本的數(shù)字特征估計(jì)總體》_第3頁
教案《用樣本的數(shù)字特征估計(jì)總體》_第4頁
教案《用樣本的數(shù)字特征估計(jì)總體》_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2.2.2 用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征整體設(shè)計(jì)三維目標(biāo)1.能利用頻率分布直方圖估計(jì)總體的眾數(shù)、中位數(shù)、平均數(shù);2.能用樣本的眾數(shù)、中位數(shù)、平均數(shù)估計(jì)總體的眾數(shù)、中位數(shù)、平均數(shù),并結(jié)合實(shí)際,對(duì)問題作出合理判斷,制定解決問題的有效方法;3.初步體會(huì)、領(lǐng)悟“用數(shù)據(jù)說話”的統(tǒng)計(jì)思想方法;通過對(duì)有關(guān)數(shù)據(jù)的搜集、整理、分析、判斷,培養(yǎng)學(xué)生“實(shí)事求是”的科學(xué)態(tài)度和嚴(yán)謹(jǐn)?shù)墓ぷ髯黠L(fēng).4.正確理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,學(xué)會(huì)計(jì)算數(shù)據(jù)的標(biāo)準(zhǔn)差;5.能根據(jù)實(shí)際問題的需要合理地選取樣本,從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋;6會(huì)用樣本的基本數(shù)字特征估計(jì)總體的基本數(shù)字特征,形成

2、對(duì)數(shù)據(jù)處理過程進(jìn)行初步評(píng)價(jià)的意識(shí).3.在解決統(tǒng)計(jì)問題的過程中,進(jìn)一步體會(huì)用樣本估計(jì)總體的思想,理解數(shù)形結(jié)合的數(shù)學(xué)思想和邏輯推理的數(shù)學(xué)方法;會(huì)用隨機(jī)抽樣的方法和樣本估計(jì)總體的思想解決一些簡單的實(shí)際問題,認(rèn)識(shí)統(tǒng)計(jì)的作用,能夠辨證地理解數(shù)學(xué)知識(shí)與現(xiàn)實(shí)世界的聯(lián)系.重點(diǎn)難點(diǎn)教學(xué)重點(diǎn):根據(jù)實(shí)際問題對(duì)樣本數(shù)據(jù)中提取基本的數(shù)據(jù)特征并作出合理解釋,估計(jì)總體的基本數(shù)字特征;體會(huì)樣本數(shù)字特征具有隨機(jī)性.教學(xué)難點(diǎn):用樣本平均數(shù)和標(biāo)準(zhǔn)差估計(jì)總體的平均數(shù)與標(biāo)準(zhǔn)差;能應(yīng)用相關(guān)知識(shí)解決簡單的實(shí)際問題.課時(shí)安排 2課時(shí)教學(xué)過程第1課時(shí) 眾數(shù)、中位數(shù)、平均數(shù)導(dǎo)入新課 在日常生活中,我們往往并不需要了解總體的分布形態(tài),而是更關(guān)心總

3、體的某一數(shù)字特征,例如:買燈泡時(shí),我們希望知道燈泡的平均使用壽命,我們?cè)鯓恿私鉄襞莸氖褂脡勖兀慨?dāng)然不能把所有燈泡一一測試,因?yàn)闇y試后燈泡則報(bào)廢了.于是,需要通過隨機(jī)抽樣,把這批燈泡的壽命看作總體,從中隨機(jī)取出若干個(gè)個(gè)體作為樣本,算出樣本的數(shù)字特征,用樣本的數(shù)字特征來估計(jì)總體的數(shù)字特征.推進(jìn)新課新知探究提出問題(1)什么是眾數(shù)、中位數(shù)、平均數(shù)?(1)如何繪制頻率分布直方圖?(3)如何從頻率分布直方圖中估計(jì)眾數(shù)、中位數(shù)、平均數(shù)?活動(dòng):那么學(xué)生回憶初中所學(xué)的一些統(tǒng)計(jì)知識(shí),思考后展開討論,教師提示引導(dǎo).討論結(jié)果:(1)初中我們?cè)?jīng)學(xué)過眾數(shù)(在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)稱為眾數(shù))、中位數(shù)(在按大小順

4、序排列的一組數(shù)據(jù)中,居于中間的數(shù)稱為中位數(shù))、平均數(shù)(一般是一組數(shù)據(jù)和的算術(shù)平均數(shù))等各種數(shù)字特征,應(yīng)當(dāng)說,這些數(shù)字都能夠?yàn)槲覀兲峁╆P(guān)于樣本數(shù)據(jù)的特征信息.(2)畫頻率分布直方圖的一般步驟為:計(jì)算一組數(shù)據(jù)中最大值與最小值的差,即求極差;決定組距與組數(shù);將數(shù)據(jù)分組;列頻率分布表;畫頻率分布直方圖.(3)教材前面一節(jié)在調(diào)查100位居民的月均用水量的問題中,從這些樣本數(shù)據(jù)的頻率分布直方圖可以看出,月均用水量的眾數(shù)是2.25 t(最高的矩形的中點(diǎn)),它告訴我們,該市的月均用水量為2.25 t的居民數(shù)比月均用水量為其他值的居民數(shù)多,但它并沒有告訴我們到底多多少. 請(qǐng)大家翻回到課本看看原來抽樣的數(shù)據(jù),有沒

5、有2.25 這個(gè)數(shù)值呢?根據(jù)眾數(shù)的定義,2.25怎么會(huì)是眾數(shù)呢?為什么?(請(qǐng)大家思考作答)分析:這是因?yàn)闃颖緮?shù)據(jù)的頻率分布直方圖把原始的一些數(shù)據(jù)給遺失了,而2.25是由樣本數(shù)據(jù)的頻率分布直方圖得來的,所以存在一些偏差. 提問:那么如何從頻率分布直方圖中估計(jì)中位數(shù)呢?分析:在樣本數(shù)據(jù)中,有50%的個(gè)體小于或等于中位數(shù),也有50%的個(gè)體大于或等于中位數(shù).因此,在頻率分布直方圖中,矩形的面積大小正好表示頻率的大小,即中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等.由此可以估計(jì)出中位數(shù)的值為2.02.思考:2.02這個(gè)中位數(shù)的估計(jì)值,與樣本的中位數(shù)值2.0不一樣,你能解釋其中的原因嗎?(原因同上:樣本數(shù)據(jù)的頻

6、率分布直方圖把原始的一些數(shù)據(jù)給遺失了) 課本顯示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少數(shù)居民的月均用水量特別高,顯然,對(duì)這部分居民的用水量作出限制是非常合理的.思考:中位數(shù)不受少數(shù)幾個(gè)極端值的影響,這在某些情況下是一個(gè)優(yōu)點(diǎn),但是它對(duì)極端值的不敏感有時(shí)也會(huì)成為缺點(diǎn),你能舉例說明嗎?(讓學(xué)生討論,并舉例) 對(duì)極端值不敏感有利的例子:考察課本中表21中的數(shù)據(jù),如果把最后一個(gè)數(shù)據(jù)錯(cuò)寫成22,并不會(huì)對(duì)樣本中位數(shù)產(chǎn)生影響.也就是說對(duì)極端數(shù)據(jù)不敏感的方法能夠有效地預(yù)防錯(cuò)誤數(shù)據(jù)的影響,而在實(shí)際應(yīng)用中,人為操作的失誤經(jīng)常造成錯(cuò)誤數(shù)據(jù). 對(duì)極端值不敏感有弊的例子:某人具有初級(jí)計(jì)算機(jī)專業(yè)技術(shù)

7、水平,想找一份收入好的工作,這時(shí)如果采用各個(gè)公司計(jì)算機(jī)專業(yè)技術(shù)人員收入的中位數(shù)作為選擇工作的參考指標(biāo)就會(huì)冒這樣的風(fēng)險(xiǎn):很可能所選擇公司的初級(jí)計(jì)算機(jī)專業(yè)技術(shù)水平人員的收入很低,其原因是中位數(shù)對(duì)極小的數(shù)據(jù)不敏感.這里更好的方法是同時(shí)用平均工資和中位數(shù)來作為參考指標(biāo),選擇平均工資較高且中位數(shù)較大的公司就業(yè).對(duì)極端值不敏感的方法,不能反映數(shù)據(jù)中的極端情況. 同樣的,可以從頻率分布直方圖中估計(jì)平均數(shù),上圖就顯示了居民用水的平均數(shù),它等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.由估計(jì)可知,居民的月均用水量的平均值為2.02 t. 顯示了居民月均用水量的平均數(shù),它是頻率分布直方圖的“

8、重心”.由于平均數(shù)與每一個(gè)樣本數(shù)據(jù)有關(guān),所以,任何一個(gè)樣本數(shù)據(jù)的改變都會(huì)引起平均數(shù)的改變.這是中位數(shù)、眾數(shù)都不具有的性質(zhì).也正因?yàn)檫@個(gè)原因,與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息.從圖上可以看出,用水量最多的幾個(gè)居民對(duì)平均數(shù)影響較大,這是因?yàn)樗麄兊脑戮盟颗c平均數(shù)相差太多了. 利用頻率分布直方圖估計(jì)眾數(shù)、中位數(shù)、平均數(shù):估計(jì)眾數(shù):頻率分布直方圖面積最大的方條的橫軸中點(diǎn)數(shù)字.(最高矩形的中點(diǎn))估計(jì)中位數(shù):中位數(shù)把頻率分布直方圖分成左右兩邊面積相等.估計(jì)平均數(shù):頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.總之,眾數(shù)、中位數(shù)、平均數(shù)都是對(duì)數(shù)據(jù)中心位

9、置的描述,可以作為總體相應(yīng)特征的估計(jì).樣本眾數(shù)易計(jì)算,但只能表達(dá)樣本數(shù)據(jù)中的很少一部分信息,不一定唯一;中位數(shù)僅利用了數(shù)據(jù)中排在中間數(shù)據(jù)的信息,與數(shù)據(jù)的排列位置有關(guān);平均數(shù)受樣本中的每一個(gè)數(shù)據(jù)的影響,絕對(duì)值越大的數(shù)據(jù),對(duì)平均數(shù)的影響也越大三者相比,平均數(shù)代表了數(shù)據(jù)更多的信息,描述了數(shù)據(jù)的平均水平,是一組數(shù)據(jù)的“重心”.應(yīng)用示例例1 下面是某校學(xué)生日睡眠時(shí)間抽樣頻率分布表(單位:h),試估計(jì)該校學(xué)生的日平均睡眠時(shí)間睡眠時(shí)間人數(shù)頻率6,6.5)50056.5,7)170177,7.5)330337.5,8)370378,8.5)60068.5,9)2002合計(jì)1001分析:要確定這100名學(xué)生的平

10、均睡眠時(shí)間,就必須計(jì)算其總睡眠時(shí)間,由于每組中的個(gè)體睡眠時(shí)間只是一個(gè)范圍,可以用各組區(qū)間的組中值近似地表示解法一:總睡眠時(shí)間約為6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠時(shí)間約為7.39 h解法二:求組中值與對(duì)應(yīng)頻率之積的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).答:估計(jì)該校學(xué)生的日平均睡眠時(shí)間約為7.39 h

11、例2 某單位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之間的職工所占的比分別為10%,15%,20%,25%,15%,10%和5%,試估計(jì)該單位職工的平均年收入分析:上述百分比就是各組的頻率解:估計(jì)該單位職工的平均年收入為12 500×10%+17 500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×

12、5%=26 125(元).答:估計(jì)該單位人均年收入約為26 125元知能訓(xùn)練從甲、乙兩個(gè)公司各隨機(jī)抽取50名員工月工資:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 500 2

13、 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 00

14、0 8 000 10 000試計(jì)算這兩個(gè)公司50名員工月工資平均數(shù)、眾數(shù)、中位數(shù),并估計(jì)這兩個(gè)企業(yè)員工平均工資.答案:甲公司:員工月工資平均數(shù)1 240,眾數(shù)1 200,中位數(shù)1 200;乙公司:員工月工資平均數(shù)1 330,眾數(shù)1 000,中位數(shù)1 000;從總體上看乙公司員工月工資比甲公司少,原因是乙公司有幾個(gè)收入特高的員工影響了工資平均數(shù).拓展提升 “用數(shù)據(jù)說話”, 這是我們經(jīng)常可以聽到的一句話.但是,數(shù)據(jù)有時(shí)也會(huì)被利用,從而產(chǎn)生誤導(dǎo).例如,一個(gè)企業(yè)中,絕大多數(shù)是一線工人,他們的年收入可能是一萬元左右,另有一些經(jīng)理層次的人,年收入可以達(dá)到幾十萬元.這時(shí),年收入的平均數(shù)會(huì)比中位數(shù)大得多.盡管

15、這時(shí)中位數(shù)比平均數(shù)更合理些,但是這個(gè)企業(yè)的老板到人力市場去招聘工人時(shí),也許更可能用平均數(shù)來回答有關(guān)工資待遇方面的提問. 你認(rèn)為“我們單位的收入水平比別的單位高”這句話應(yīng)當(dāng)怎么解釋? 這句話的目的是謹(jǐn)防利用人們對(duì)統(tǒng)計(jì)術(shù)語的模糊認(rèn)識(shí)進(jìn)行誤導(dǎo)(蒙騙).使學(xué)生能夠正確理解在日常生活中像“我們單位的收入水平比別的單位高”這類話的模糊性,這里的“收入水平”是指員工收入數(shù)據(jù)的某個(gè)中心點(diǎn),即可以是中位數(shù)、平均數(shù)或眾數(shù),不同的解釋有不同的含義. 在這里應(yīng)該注意以下幾點(diǎn):1.樣本眾數(shù)通常用來表示分類變量的中心值,容易計(jì)算,但是它只能表達(dá)樣本數(shù)據(jù)中的很少一部分信息,通常用于描述分類變量的中心位置.2.中位數(shù)不受少數(shù)

16、幾個(gè)極端數(shù)據(jù)(即排序靠前或排序靠后的數(shù)據(jù))的影響,容易計(jì)算,它僅利用了數(shù)據(jù)中排在中間數(shù)據(jù)的信息.當(dāng)樣本數(shù)據(jù)質(zhì)量比較差,即存在一些錯(cuò)誤數(shù)據(jù)(如數(shù)據(jù)的錄入錯(cuò)誤、測量錯(cuò)誤等)時(shí),應(yīng)該用抗極端數(shù)據(jù)強(qiáng)的中位數(shù)表示數(shù)據(jù)的中心值,可以利用計(jì)算機(jī)模擬樣本,向?qū)W生展示錯(cuò)誤數(shù)據(jù)對(duì)樣本中位數(shù)的影響程度.3.平均數(shù)受樣本中的每一個(gè)數(shù)據(jù)的影響,“越離群”的數(shù)據(jù),對(duì)平均數(shù)的影響也越大.與眾數(shù)和中位數(shù)相比,平均數(shù)代表了數(shù)據(jù)更多的信息.當(dāng)樣本數(shù)據(jù)質(zhì)量比較差時(shí),使用平均數(shù)描述數(shù)據(jù)的中心位置可能與實(shí)際情況產(chǎn)生較大的誤差.可以利用計(jì)算機(jī)模擬樣本,向?qū)W生展示錯(cuò)誤數(shù)據(jù)對(duì)樣本平均數(shù)的影響程度.在體育、文藝等各種比賽的評(píng)分中,使用的是平均

17、數(shù).計(jì)分過程中采用“去掉一個(gè)最高分,去掉一個(gè)最低分”的方法,就是為了防止個(gè)別裁判的人為因素而給出過高或過低的分?jǐn)?shù)對(duì)選手的得分造成較大的影響,從而降低誤差,盡量保證公平性.4.如果樣本平均數(shù)大于樣本中位數(shù),說明數(shù)據(jù)中存在許多較大的極端值;反之,說明數(shù)據(jù)中存在許多較小的極端值.在實(shí)際應(yīng)用中,如果同時(shí)知道樣本中位數(shù)和樣本平均數(shù),可以使我們了解樣本數(shù)據(jù)中極端數(shù)據(jù)的信息,幫助我們作出決策.5.使用者常根據(jù)自己的利益去選取使用中位數(shù)或平均數(shù)來描述數(shù)據(jù)的中心位置,從而產(chǎn)生一些誤導(dǎo)作用.課堂小結(jié)1能根據(jù)實(shí)際問題的需要合理地選取樣本,從樣本數(shù)據(jù)中提取基本的數(shù)字特征(平均數(shù)),會(huì)用樣本的基本數(shù)字特征估計(jì)總體的基本

18、數(shù)字特征;2平均數(shù)對(duì)數(shù)據(jù)有“取齊”的作用,代表一組數(shù)據(jù)的平均水平;3形成對(duì)數(shù)據(jù)處理過程進(jìn)行初步評(píng)價(jià)的意識(shí)作業(yè) 習(xí)題2.2A組3.設(shè)計(jì)感想 本堂課在初中學(xué)習(xí)的眾數(shù)、中位數(shù)、平均數(shù)的基礎(chǔ)上,學(xué)習(xí)了利用頻率分布直方圖估計(jì)眾數(shù)、中位數(shù)、平均數(shù),這是一種近似估計(jì),但都能說明總體的分布特征,各有優(yōu)缺點(diǎn),講解時(shí)緊扣課本內(nèi)容,講清講透,使學(xué)生活學(xué)活用,會(huì)畫頻率分布直方圖,會(huì)利用頻率分布直方圖估計(jì)眾數(shù)、中位數(shù)、平均數(shù),對(duì)總體作出正確的估計(jì).(設(shè)計(jì)者:路 波)第2課時(shí) 標(biāo)準(zhǔn)差導(dǎo)入新課 在一次射擊選拔比賽中,甲、乙兩名運(yùn)動(dòng)員各射擊10次,命中環(huán)數(shù)如下 甲運(yùn)動(dòng)員:7,8,7,9,5,4,9,10,7,4; 乙運(yùn)動(dòng)員:

19、9,5,7,8,7,6,8,6,7,7. 觀察上述樣本數(shù)據(jù),你能判斷哪個(gè)運(yùn)動(dòng)員發(fā)揮得更穩(wěn)定些嗎?如果你是教練,選哪位選手去參加正式比賽? 我們知道,x甲=7,x乙=7.兩個(gè)人射擊的平均成績是一樣的.那么,是否兩個(gè)人就沒有水平差距呢? 從上圖直觀上看,還是有差異的.很明顯,甲的成績比較分散,乙的成績相對(duì)集中,因此我們從另外的角度來考察這兩組數(shù)據(jù)標(biāo)準(zhǔn)差.推進(jìn)新課新知探究提出問題(1)如何通過頻率分布直方圖估計(jì)數(shù)字特征(中位數(shù)、眾數(shù)、平均數(shù))?(2)有甲、乙兩種鋼筋,現(xiàn)從中各抽取一個(gè)標(biāo)本(如下表)檢查它們的抗拉強(qiáng)度(單位:kg/mm2),通過計(jì)算發(fā)現(xiàn),兩個(gè)樣本的平均數(shù)均為125.甲110120130

20、125120125135125135125乙115100125130115125125145125145 哪種鋼筋的質(zhì)量較好?(3)某種子公司為了在當(dāng)?shù)赝菩袃煞N新水稻品種,對(duì)甲、乙兩種水稻進(jìn)行了連續(xù)7年的種植對(duì)比實(shí)驗(yàn),年畝產(chǎn)量分別如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)請(qǐng)你用所學(xué)統(tǒng)計(jì)學(xué)的知識(shí),說明選擇哪種品種推廣更好?(4)全面建設(shè)小康社會(huì)是我們黨和政府的工作重心,某市按當(dāng)?shù)匚飪r(jià)水平計(jì)算,人均年收入達(dá)到1.5萬元的家庭即達(dá)到小康生活水平.民政局對(duì)該市10

21、0戶家庭進(jìn)行調(diào)查統(tǒng)計(jì),它們的人均收入達(dá)到了1.6萬元,民政局即宣布該市民生活水平已達(dá)到小康水平,你認(rèn)為這樣的結(jié)論是否符合實(shí)際?(5)如何考查樣本數(shù)據(jù)的分散程度的大小呢?把數(shù)據(jù)在坐標(biāo)系中刻畫出來,是否能直觀地判斷數(shù)據(jù)的離散程度?討論結(jié)果:(1)利用頻率分布直方圖估計(jì)眾數(shù)、中位數(shù)、平均數(shù):估計(jì)眾數(shù):頻率分布直方圖面積最大的方條的橫軸中點(diǎn)數(shù)字.(最高矩形的中點(diǎn))估計(jì)中位數(shù):中位數(shù)把頻率分布直方圖分成左右兩邊面積相等.估計(jì)平均數(shù):頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和.(2) 由上圖可以看出,乙樣本的最小值100低于甲樣本的最小值110,乙樣本的最大值145高于甲樣本的最大值1

22、35,這說明乙種鋼筋沒有甲種鋼筋的抗拉強(qiáng)度穩(wěn)定. 我們把一組數(shù)據(jù)的最大值與最小值的差稱為極差(range).由上圖可以看出,乙的極差較大,數(shù)據(jù)點(diǎn)較分散;甲的極差小,數(shù)據(jù)點(diǎn)較集中,這說明甲比乙穩(wěn)定.運(yùn)用極差對(duì)兩組數(shù)據(jù)進(jìn)行比較,操作簡單方便,但如果兩組數(shù)據(jù)的集中程度差異不大時(shí),就不容易得出結(jié)論.(3)選擇的依據(jù)應(yīng)該是,產(chǎn)量高且穩(wěn)產(chǎn)的品種,所以選擇乙更為合理.(4)不符合實(shí)際. 樣本太小,沒有代表性.若樣本里有個(gè)別高收入者與多數(shù)低收入者差別太大.在統(tǒng)計(jì)學(xué)里,對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析,需要結(jié)合實(shí)際,側(cè)重于考察總體的相關(guān)數(shù)據(jù)特征.比如,市民平均收入問題,都是考察數(shù)據(jù)的分散程度.(5)把問題(3)中的數(shù)據(jù)在坐標(biāo)系

23、中刻畫出來.我們可以很直觀地知道,乙組數(shù)據(jù)比甲組數(shù)據(jù)更集中在平均數(shù)的附近,即乙的分散程度小, 如何用數(shù)字去刻畫這種分散程度呢? 考察樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計(jì)量是方差和標(biāo)準(zhǔn)差. 標(biāo)準(zhǔn)差: 考察樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計(jì)量是標(biāo)準(zhǔn)差(standard deviation).標(biāo)準(zhǔn)差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用s表示. 所謂“平均距離”,其含義可作如下理解: 假設(shè)樣本數(shù)據(jù)是x1,x2,xn,表示這組數(shù)據(jù)的平均數(shù).xi到的距離是|xi-|(i=1,2,n).于是,樣本數(shù)據(jù)x1,x2,xn到的“平均距離”是S=.由于上式含有絕對(duì)值,運(yùn)算不太方便,因此,通常改用如下公式來

24、計(jì)算標(biāo)準(zhǔn)差:s=.意義:標(biāo)準(zhǔn)差用來表示穩(wěn)定性,標(biāo)準(zhǔn)差越大,數(shù)據(jù)的離散程度就越大,也就越不穩(wěn)定.標(biāo)準(zhǔn)差越小,數(shù)據(jù)的離散程度就越小,也就越穩(wěn)定.從標(biāo)準(zhǔn)差的定義可以看出,標(biāo)準(zhǔn)差s0,當(dāng)s=0時(shí),意味著所有的樣本數(shù)據(jù)都等于樣本平均數(shù).標(biāo)準(zhǔn)差還可以用于對(duì)樣本數(shù)據(jù)的另外一種解釋.例如,在關(guān)于居民月均用水量的例子中,平均數(shù)=1.973,標(biāo)準(zhǔn)差s=0.868,所以+s=2.841,+2s=3.709;-s=1.105,-2s=0.237. 這100個(gè)數(shù)據(jù)中,在區(qū)間-2s,+2s=0.237,3.709外的只有4個(gè),也就是說,-2s, +2s幾乎包含了所有樣本數(shù)據(jù). 從數(shù)學(xué)的角度考慮,人們有時(shí)用標(biāo)準(zhǔn)差的平方s2

25、方差來代替標(biāo)準(zhǔn)差,作為測量樣本數(shù)據(jù)分散程度的工具:s2=(x1-)2+(x2-)2+(xn-)2.顯然,在刻畫樣本數(shù)據(jù)的離散程度上,方差與標(biāo)準(zhǔn)差是一樣的.但在解決實(shí)際問題時(shí),一般多采用標(biāo)準(zhǔn)差. 需要指出的是,現(xiàn)實(shí)中的總體所包含的個(gè)體數(shù)往往是很多的,總體的平均數(shù)與標(biāo)準(zhǔn)差是不知道的.如何求得總體的平均數(shù)和標(biāo)準(zhǔn)差呢?通常的做法是用樣本的平均數(shù)和標(biāo)準(zhǔn)差去估計(jì)總體的平均數(shù)與標(biāo)準(zhǔn)差.這與前面用樣本的頻率分布來近似地代替總體分布是類似的.只要樣本的代表性好,這樣做就是合理的,也是可以接受的. 兩者都是描述一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小,實(shí)際應(yīng)用中比較廣泛的是標(biāo)準(zhǔn)差.如導(dǎo)入中的運(yùn)動(dòng)員成績的標(biāo)準(zhǔn)差的計(jì)算器計(jì)算.

26、即s甲=2.用類似的方法,可得s乙1.095.由s甲>s乙可以知道,甲的成績離散程度大,乙的成績離散程度小.由此可以估計(jì),乙比甲的射擊成績穩(wěn)定.應(yīng)用示例例1 畫出下列四組樣本數(shù)據(jù)的條形圖,說明它們的異同點(diǎn).(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先畫出數(shù)據(jù)的條形圖,根據(jù)樣本數(shù)據(jù)算出樣本數(shù)據(jù)的平均數(shù),利用標(biāo)準(zhǔn)差的計(jì)算公式即可算出每一組數(shù)據(jù)的標(biāo)準(zhǔn)差.解:四組樣本數(shù)據(jù)的條形圖如下: 四組數(shù)據(jù)的平均數(shù)都是5.0,標(biāo)準(zhǔn)差分別是:0.00,0.82,1.49,2.83

27、.它們有相同的平均數(shù),但它們有不同的標(biāo)準(zhǔn)差,說明數(shù)據(jù)的分散程度是不一樣的.例2 甲、乙兩人同時(shí)生產(chǎn)內(nèi)徑為25.40 mm的一種零件.為了對(duì)兩人的生產(chǎn)質(zhì)量進(jìn)行評(píng)比,從他們生產(chǎn)的零件中各抽出20件,量得其內(nèi)徑尺寸如下(單位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.4

28、3 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48從生產(chǎn)的零件內(nèi)徑的尺寸看,誰生產(chǎn)的質(zhì)量較高?分析:每一個(gè)工人生產(chǎn)的所有零件的內(nèi)徑尺寸組成一個(gè)總體.由于零件的生產(chǎn)標(biāo)準(zhǔn)已經(jīng)給出(內(nèi)徑25.40 mm),生產(chǎn)質(zhì)量可以從總體的平均數(shù)與標(biāo)準(zhǔn)差兩個(gè)角度來衡量.總體的平均數(shù)與內(nèi)徑標(biāo)準(zhǔn)尺寸25.40 mm的差異大時(shí)質(zhì)量低,差異小時(shí)質(zhì)量高;當(dāng)總體的平均數(shù)與標(biāo)準(zhǔn)尺寸很接近時(shí),總體的標(biāo)準(zhǔn)差小的時(shí)候質(zhì)量高,標(biāo)準(zhǔn)差大的時(shí)候質(zhì)量低.這樣,比較兩人的生產(chǎn)質(zhì)量,只要比較他們所生產(chǎn)的零件內(nèi)徑尺寸所組成的兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差的大小即可.但是,這兩個(gè)總體的平均數(shù)與標(biāo)準(zhǔn)差都是不知道

29、的,根據(jù)用樣本估計(jì)總體的思想,我們可以通過抽樣分別獲得相應(yīng)的樣本數(shù)據(jù),然后比較這兩個(gè)樣本的平均數(shù)、標(biāo)準(zhǔn)差,以此作為兩個(gè)總體之間差異的估計(jì)值.解:用計(jì)算器計(jì)算可得25.401,25.406;s甲0.037,s乙0.068.從樣本平均數(shù)看,甲生產(chǎn)的零件內(nèi)徑比乙的更接近內(nèi)徑標(biāo)準(zhǔn)(25.40 mm),但是差異很小;從樣本標(biāo)準(zhǔn)差看,由于s甲<s乙,因此甲生產(chǎn)的零件內(nèi)徑比乙的穩(wěn)定程度高得多.于是,可以作出判斷,甲生產(chǎn)的零件的質(zhì)量比乙的高一些.點(diǎn)評(píng):從上述例子我們可以看到,對(duì)一名工人生產(chǎn)的零件內(nèi)徑(總體)的質(zhì)量判斷,與所抽取的零件內(nèi)徑(樣本數(shù)據(jù))直接相關(guān).顯然,我們可以從這名工人生產(chǎn)的零件中獲取許多樣

30、本.這樣,盡管總體是同一個(gè),但由于樣本不同,相應(yīng)的樣本頻率分布與平均數(shù)、標(biāo)準(zhǔn)差等都會(huì)發(fā)生改變,這就會(huì)影響到我們對(duì)總體情況的估計(jì).如果樣本的代表性差,那么對(duì)總體所作出的估計(jì)就會(huì)產(chǎn)生偏差;樣本沒有代表性時(shí),對(duì)總體作出錯(cuò)誤估計(jì)的可能性就非常大.這也正是我們?cè)谇懊嬷v隨機(jī)抽樣時(shí)反復(fù)強(qiáng)調(diào)樣本代表性的理由.在實(shí)際操作中,為了減少錯(cuò)誤的發(fā)生,條件許可時(shí),通常采取適當(dāng)增加樣本容量的方法.當(dāng)然,關(guān)鍵還是要改進(jìn)抽樣方法,提高樣本的代表性.變式訓(xùn)練 某地區(qū)全體九年級(jí)的3 000名學(xué)生參加了一次科學(xué)測試,為了估計(jì)學(xué)生的成績,從不同學(xué)校的不同程度的學(xué)生中抽取了100名學(xué)生的成績?nèi)缦拢?00分12人,90分30人,80分1

31、8人,70分24人,60分12人,50分4人.請(qǐng)根據(jù)以上數(shù)據(jù)估計(jì)該地區(qū)3 000名學(xué)生的平均分、合格率(60或60分以上均屬合格).解:運(yùn)用計(jì)算器計(jì)算得:=79.40,(12+30+18+24+12)÷100=96%,所以樣本的平均分是79.40分,合格率是96%,由此來估計(jì)總體3 000名學(xué)生的平均分是79.40分,合格率是96%.知能訓(xùn)練(1)在一次歌手大獎(jiǎng)賽上,七位評(píng)委為歌手打出的分?jǐn)?shù)如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一個(gè)最高分和一個(gè)最低分后,所剩數(shù)據(jù)的平均值和方差分別為_.(2)若給定一組數(shù)據(jù)x1,x2,xn,方差為s2,則ax1,ax2,axn的方差是_.(3)在相同條件下對(duì)自行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論