用樣本頻率分布估計總體分布_第1頁
用樣本頻率分布估計總體分布_第2頁
用樣本頻率分布估計總體分布_第3頁
用樣本頻率分布估計總體分布_第4頁
用樣本頻率分布估計總體分布_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于用樣本頻率分布估計總體分布第1頁,講稿共50頁,2023年5月2日,星期三

我們用簡單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣的方法收集樣本數(shù)據(jù)后,就可以通過樣本研究總體。

用樣本估計總體的兩種情況:①用樣本的頻率分布估計總體分布②用樣本的數(shù)字特征(平均數(shù)、標(biāo)準(zhǔn)差等)估計總體的數(shù)字特征

第2頁,講稿共50頁,2023年5月2日,星期三復(fù)習(xí)回顧頻數(shù):不分組時,數(shù)據(jù)中某個數(shù)據(jù)出現(xiàn)的次數(shù)分組時,一個組內(nèi)的數(shù)據(jù)的個數(shù)頻率:極差:最大數(shù)-最小數(shù)分組頻數(shù)頻率頻率/組距頻率分布表:第3頁,講稿共50頁,2023年5月2日,星期三知識探究(一):頻率分布表

某市政府為了節(jié)約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標(biāo)準(zhǔn)a,用水量不超過a的部分按平價收費(fèi),超出a的部分按議價收費(fèi).問題1:如果希望大部分居民的日常生活不受影響,那么標(biāo)準(zhǔn)a定為多少比較合理?問題2:為了較為合理的確定標(biāo)準(zhǔn)a,需要做哪些工作?第4頁,講稿共50頁,2023年5月2日,星期三通過抽樣調(diào)查,獲得100位居民2007年的月均用水量如下表(單位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2問題3:這些數(shù)字告訴了我們什么信息?第5頁,講稿共50頁,2023年5月2日,星期三我們可以看出,樣本數(shù)據(jù)中的最大值4.3和最小值,其他數(shù)據(jù)在0.2~4.3之間分析數(shù)據(jù)的基本方法:用圖畫出來用表格重新排列第6頁,講稿共50頁,2023年5月2日,星期三1、借助于圖:頻率分布直方圖、頻率分布折線圖、莖葉圖兩個目的①從數(shù)據(jù)中提取信息②利用圖形傳遞信息2、借助于表格:

頻率分布表兩個目的①改變數(shù)據(jù)的排列方式②提供解釋數(shù)據(jù)的新方式第7頁,講稿共50頁,2023年5月2日,星期三第二步:確定組距,組數(shù)組距=每個小組兩個端點的差.組數(shù)=極差÷組距(取整數(shù))探究一頻率分布表(4.1÷0.5=8.2將8.2取整,組數(shù)=9,組距=0.5思考1:上述100個數(shù)據(jù)的最小值和最大值分別是多少?第一步:求極差思考2:分成多少組合適?如果將上述100個數(shù)據(jù)按組距為0.5進(jìn)行分組,那么這些數(shù)據(jù)共分為多少組?極差:4.3-0.2=4.15~12組第8頁,講稿共50頁,2023年5月2日,星期三第四步:列頻率分布表探究一頻率分布表思考3:各組數(shù)據(jù)的取值范圍如何設(shè)定?第三步:確定端點,將數(shù)據(jù)分組

各組均為左開右閉區(qū)間,最后一個閉區(qū)間思考4:如何統(tǒng)計各族中的頻數(shù)、頻率?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].第9頁,講稿共50頁,2023年5月2日,星期三

分組頻數(shù)頻率頻率/組距[0,0.5)40.040.08[0.5,1)80.080.16[1,1.5)150.150.30[1.5,2)220.220.44[2,2.5)250.250.50[2.5,3)140.140.28[3,3.5)60.060.12[3.5,4)40.040.08[4,4.5]20.020.04合計1001.002第10頁,講稿共50頁,2023年5月2日,星期三探究(二):畫頻率分布直方圖月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第一步:畫直角坐標(biāo)系:x軸為數(shù)據(jù)單位,y軸為頻率/組距第二步:在x軸上均勻標(biāo)出各組分點,在y軸上標(biāo)出單位長度第三步:以組距為寬,各組的頻率/組距為高,分別畫出各組對應(yīng)的長方形第11頁,講稿共50頁,2023年5月2日,星期三

問題1:頻率分布直方圖中各小長方形的寬度和高度在數(shù)量上有何特點?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距2頻率分布直方圖的意義第12頁,講稿共50頁,2023年5月2日,星期三問題2:頻率分布直方圖中各小長方形的面積表示什么?各小長方形的面積之和為多少?各小長方形的面積=各小組的頻率各小長方形的面積之和=1月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距第13頁,講稿共50頁,2023年5月2日,星期三3分析例題:頻率分布直方圖非常直觀地表明了樣本數(shù)據(jù)的分布情況,使我們能夠看到頻率分布表中看不太清楚的數(shù)據(jù)模式,但原始數(shù)據(jù)不能在圖中表示出來.你能根據(jù)上述頻率分布直方圖指出居民月均用水量的一些數(shù)據(jù)特點嗎?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第14頁,講稿共50頁,2023年5月2日,星期三(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數(shù)居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第15頁,講稿共50頁,2023年5月2日,星期三思考:對一組給定的樣本數(shù)據(jù),頻率分布直方圖的外觀形狀與哪些因素有關(guān)?在居民月均用水量樣本中,你能以1為組距畫頻率分布直方圖嗎?

與分組數(shù)(或組距)及坐標(biāo)系的單位長度有關(guān).月均用水量/t頻率組距0.40.30.20.112345

O第16頁,講稿共50頁,2023年5月2日,星期三1、求極差(即一組數(shù)據(jù)中最大值與最小值的差)知道這組數(shù)據(jù)的變動范圍4.3-0.2=4.12、決定組距與組數(shù)(將數(shù)據(jù)分組)3、將數(shù)據(jù)分組(8.2取整,分為9組)畫頻率分布直方圖的步驟4、列出頻率分布表.(填寫頻率/組距一欄)5、畫出頻率分布直方圖。組距:指每個小組的兩個端點的距離,組距組數(shù):將數(shù)據(jù)分組,當(dāng)數(shù)據(jù)在100個以內(nèi)時,按數(shù)據(jù)多少常分5-12組。

小結(jié)第17頁,講稿共50頁,2023年5月2日,星期三理論遷移

例1

某地區(qū)為了了解知識分子的年齡結(jié)構(gòu),隨機(jī)抽樣50名,其年齡分別如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出樣本頻率分布表;(2)畫出頻率分布直方圖;(3)估計年齡在32~52歲的知識分子所占的比例約是多少.第18頁,講稿共50頁,2023年5月2日,星期三(1)極差為67-28=39,取組距為5,分為8組.

分組頻數(shù)頻率頻率/組距[27,32)30.060.012[32,37)30.060.012[37,42)90.180.036[42,47)160.320.064[47,52)70.140.028[52,57)50.100.020[57,62)40.080.016[62,67)30.060.012合計501.000.200樣本頻率分布表:第19頁,講稿共50頁,2023年5月2日,星期三(2)樣本頻率分布直方圖:年齡0.060.050.040.030.020.01273237424752576267頻率組距O(3)因為0.06+0.18+0.32+0.14=0.7,故年齡在32~52歲的知識分子約占70%.第20頁,講稿共50頁,2023年5月2日,星期三90100110120130140150次數(shù)o0.0040.0080.0120.0160.0200.0240.028頻率/組距0.0320.036〖例2〗:為了了解高一學(xué)生的體能情況,某校抽取部分學(xué)生進(jìn)行一分鐘跳繩次數(shù)次測試,將所得數(shù)據(jù)整理后,畫出頻率分布直方圖(如圖),圖中從左到右各小長方形面積之比為2:4:17:15:9:3,第二小組頻數(shù)為12.第二小組的頻率是多少?樣本容量是多少?若次數(shù)在110以上(含110次)為達(dá)標(biāo),試估計該學(xué)校全體高一學(xué)生的達(dá)標(biāo)率是多少?第21頁,講稿共50頁,2023年5月2日,星期三練習(xí)鞏固

1.有一個容量為50的樣本數(shù)據(jù)的分組及各組的頻數(shù)如下:[12.5,15.5)3[24.5,27.5)10[15.5,18.5)8[27.5,30.5)5[18.5,21.5)9[30.5,33.5)4[21.5,24.5)11⑴列出樣本的頻率分布表和畫出頻率分布直方圖;⑵根據(jù)樣本的頻率分布估計,小于30.5的數(shù)據(jù)約占多少?第22頁,講稿共50頁,2023年5月2日,星期三解:組距為3

分組頻數(shù)頻率頻率/組距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第23頁,講稿共50頁,2023年5月2日,星期三頻率分布直方圖如下:頻率組距0.0100.0200.0300.0400.05012.515.50.0600.070第24頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)2.(2006年全國卷II)一個社會調(diào)查機(jī)構(gòu)就某地居民的月收入調(diào)查了10000人,并根據(jù)所得數(shù)據(jù)畫了樣本的頻率分布直方圖(如下圖).為了分析居民的收入與年齡、學(xué)歷、職業(yè)等方面的關(guān)系,要從這10000人中再用分層抽樣方法抽出100人作進(jìn)一步調(diào)查,則在[2500,3000](元)月收入段應(yīng)抽出_______人.0.00010.00020.00030.00040.00051000150020002500300035004000月收入(元)頻率/組距第25頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)2.一個社會調(diào)查機(jī)構(gòu)就某地居民的月收入調(diào)查了10000人,并根據(jù)所得數(shù)據(jù)畫了樣本的頻率分布直方圖(如下圖).為了分析居民的收入與年齡、學(xué)歷、職業(yè)等方面的關(guān)系,要從這10000人中再用分層抽樣方法抽出100人作進(jìn)一步調(diào)查,則在[2500,3000](元)月收入段應(yīng)抽出_______人.0.00010.00020.00030.00040.0005月收入(元)頻率/組距251000150020002500300035004000第26頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)3.某班50名學(xué)生在一次百米測試中,成績?nèi)拷橛?3秒與19秒之間,將測試結(jié)果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;……第六組,成績大于等于18秒且小于等于19秒.右圖是按上述分組方法得到的頻率分布直方圖.設(shè)成績小于17秒的學(xué)生人數(shù)占全班總?cè)藬?shù)的百分比為x,成績大于等于15秒且小于17秒的學(xué)生人數(shù)為y,則從頻率分布直方圖中可分析出x和y分別為()A.0.9,35 B.0.9,45C.0.1,35 D.0.1,45O13141516171819秒頻率/組距0.360.340.180.060.040.02第27頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)3.某班50名學(xué)生在一次百米測試中,成績?nèi)拷橛?3秒與19秒之間,將測試結(jié)果按如下方式分成六組:第一組,成績大于等于13秒且小于14秒;第二組,成績大于等于14秒且小于15秒;……第六組,成績大于等于18秒且小于等于19秒.右圖是按上述分組方法得到的頻率分布直方圖.設(shè)成績小于17秒的學(xué)生人數(shù)占全班總?cè)藬?shù)的百分比為x,成績大于等于15秒且小于17秒的學(xué)生人數(shù)為y,則從頻率分布直方圖中可分析出x和y分別為()A.0.9,35 B.0.9,45C.0.1,35 D.0.1,45O13141516171819秒頻率/組距0.360.340.180.060.040.02A第28頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)4.為了了解某地區(qū)高三學(xué)生的身體發(fā)育情況,抽查了該地區(qū)100名年齡為17.5歲-18歲的男生體重(kg),得到頻率分布直方圖如下:根據(jù)上圖可得這100名學(xué)生中體重在[56.5,64.5]的學(xué)生人數(shù)是()A.20B.30C.40D.500.030.050.07體重(kg)頻率/組距54.558.562.566.570.574.5第29頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)4.為了了解某地區(qū)高三學(xué)生的身體發(fā)育情況,抽查了該地區(qū)100名年齡為17.5歲-18歲的男生體重(kg),得到頻率分布直方圖如下:C0.030.050.07體重(kg)頻率/組距54.558.562.566.570.574.5根據(jù)上圖可得這100名學(xué)生中體重在[56.5,64.5]的學(xué)生人數(shù)是(

)A.20B.30C.40D.50第30頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)身高/cm人數(shù)/人14515516517518550150250350450550195輸入A1,A2,…,Ana=0i=4輸出s是否開始結(jié)束第31頁,講稿共50頁,2023年5月2日,星期三課堂練習(xí)B身高/cm人數(shù)/人14515516517518550150250350450550195輸入A1,A2,…,Ana=0i=4輸出s是否開始結(jié)束第32頁,講稿共50頁,2023年5月2日,星期三小結(jié):

畫頻率分布直方圖的步驟:

第一步:求極差:(數(shù)據(jù)組中最大值與最小值的差距)

第二步:決定組距與組數(shù):(強(qiáng)調(diào)取整)

第三步:將數(shù)據(jù)分組

(給出組的界限)

第四步:列頻率分布表.

(包括分組、頻數(shù)、頻率、頻率/組距)

第五步:畫頻率分布直方圖(在頻率分布表的基礎(chǔ)上繪制,橫坐標(biāo)為樣本數(shù)據(jù)尺寸,縱坐標(biāo)為頻率/組距.)

組距:指每個小組的兩個端點的距離,組距組數(shù):將數(shù)據(jù)分組,當(dāng)數(shù)據(jù)在100個以內(nèi)時,按數(shù)據(jù)多少常分5-12組。第33頁,講稿共50頁,2023年5月2日,星期三注意(2)縱坐標(biāo)為:第34頁,講稿共50頁,2023年5月2日,星期三第二節(jié)第35頁,講稿共50頁,2023年5月2日,星期三3分析例題:頻率分布直方圖非常直觀地表明了樣本數(shù)據(jù)的分布情況,使我們能夠看到頻率分布表中看不太清楚的數(shù)據(jù)模式,但原始數(shù)據(jù)不能在圖中表示出來.你能根據(jù)上述頻率分布直方圖指出居民月均用水量的一些數(shù)據(jù)特點嗎?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第36頁,講稿共50頁,2023年5月2日,星期三(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數(shù)居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第37頁,講稿共50頁,2023年5月2日,星期三頻率分布直方圖如下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5在頻率分布直方圖中①取各小長方形上端的中點②用折線依次連接各中點得到頻率分布折線圖第38頁,講稿共50頁,2023年5月2日,星期三用樣本頻分布估計總體分布

上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會有什么變化?假如增至10000呢?第39頁,講稿共50頁,2023年5月2日,星期三總體密度曲線頻率組距月均用水量/tab(圖中陰影部分的面積,表示總體在某個區(qū)間(a,b)內(nèi)取值的百分比)。當(dāng)樣本容量無限增大,分組的組距無限縮小,那么頻率分布折線圖就會無限接近一條光滑曲線——總體密度曲線.總體密度曲線第40頁,講稿共50頁,2023年5月2日,星期三用樣本分布直方圖去估計相應(yīng)的總體分布時,一般樣本容量越大,頻率分布直方圖就會無限接近總體密度曲線,就越精確地反映了總體的分布規(guī)律,即越精確地反映了總體在各個范圍內(nèi)取值百分比。

總體密度曲線反映了總體在各個范圍內(nèi)取值的百分比,精確地反映了總體的分布規(guī)律。是研究總體分布的工具.總體密度曲線第41頁,講稿共50頁,2023年5月2日,星期三莖葉圖某賽季甲、乙兩名籃球運(yùn)動員每場比賽得分的原始記錄如下:(1)甲運(yùn)動員得分:13,51,23,8,26,38,16,33,14,28,39(2)乙運(yùn)動員得分:

49,24,12,31,50,31,44,36,15,37,25,36,39第42頁,講稿共50頁,2023年5月2日,星期三

甲乙

80

463125

368254

3893161679449

150

(1)甲:8,13,16,14,23,26,28,38,33,39,51。(2)乙:

12,15,24,25,31,36,31,36,37,39,44,49,50,第43頁,講稿共50頁,2023年5月2日,星期三莖葉圖當(dāng)樣本數(shù)據(jù)較少時,用莖葉圖表示數(shù)據(jù)的效果較好,它不但可以保留所有的信息,而且

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論