統(tǒng)計(jì)學(xué)第2章數(shù)據(jù)的描述_第1頁
統(tǒng)計(jì)學(xué)第2章數(shù)據(jù)的描述_第2頁
統(tǒng)計(jì)學(xué)第2章數(shù)據(jù)的描述_第3頁
統(tǒng)計(jì)學(xué)第2章數(shù)據(jù)的描述_第4頁
統(tǒng)計(jì)學(xué)第2章數(shù)據(jù)的描述_第5頁
已閱讀5頁,還剩92頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第第 2 2 章章 統(tǒng)計(jì)數(shù)據(jù)的描述統(tǒng)計(jì)數(shù)據(jù)的描述統(tǒng)計(jì)學(xué)2.1 數(shù)據(jù)的整理統(tǒng)計(jì)整理的步驟統(tǒng)計(jì)整理的步驟2.1.1 統(tǒng)計(jì)數(shù)據(jù)的分組統(tǒng)計(jì)數(shù)據(jù)的分組o 1 1、統(tǒng)計(jì)分組含義、統(tǒng)計(jì)分組含義n 按某個(gè)標(biāo)志把總體劃分為若干組,稱為統(tǒng)計(jì)分按某個(gè)標(biāo)志把總體劃分為若干組,稱為統(tǒng)計(jì)分組。組。分組標(biāo)志是劃分?jǐn)?shù)據(jù)的標(biāo)準(zhǔn)或依據(jù)分組標(biāo)志是劃分?jǐn)?shù)據(jù)的標(biāo)準(zhǔn)或依據(jù)n 分組的性質(zhì)來:兼有分和合雙重含義。分組的性質(zhì)來:兼有分和合雙重含義。o 2 2、統(tǒng)計(jì)分組的原則、統(tǒng)計(jì)分組的原則 窮盡原則窮盡原則 互斥原則互斥原則o 3 3、統(tǒng)計(jì)分組方法、統(tǒng)計(jì)分組方法 品質(zhì)標(biāo)志分組品質(zhì)標(biāo)志分組 數(shù)量標(biāo)志分組數(shù)量標(biāo)志分組o 品質(zhì)分組品質(zhì)分組品質(zhì)標(biāo)志:

2、性別、職業(yè)、所有制等。n 分組標(biāo)志一經(jīng)確定,組名和組數(shù)也隨之確定分組標(biāo)志一經(jīng)確定,組名和組數(shù)也隨之確定 n 品質(zhì)分組所形成的數(shù)列稱為品質(zhì)數(shù)列品質(zhì)分組所形成的數(shù)列稱為品質(zhì)數(shù)列如不同品牌飲料市場(chǎng)占有率如不同品牌飲料市場(chǎng)占有率飲料品牌飲料品牌人數(shù)人數(shù)百分比百分比(%)(%)可口可樂可口可樂旭日升冰茶旭日升冰茶百事可樂百事可樂匯源果汁匯源果汁露露露露15151111 9 9 6 6 9 930302222181812121818合計(jì)合計(jì)5050100100o 數(shù)量標(biāo)志分組數(shù)量標(biāo)志分組 首先,各組數(shù)量界限的確定必須能反映事物質(zhì)的首先,各組數(shù)量界限的確定必須能反映事物質(zhì)的差別。差別。其次,應(yīng)根據(jù)總體的數(shù)量

3、特征,采用適當(dāng)?shù)姆纸M其次,應(yīng)根據(jù)總體的數(shù)量特征,采用適當(dāng)?shù)姆纸M形式。形式。 數(shù)量標(biāo)志:年齡、產(chǎn)量、利潤等。 o變量(數(shù)量標(biāo)志)分組單變量值分單變量值分組組組距分組單變量值分組(要點(diǎn))o 1. 將一個(gè)變量值作為一組將一個(gè)變量值作為一組o2.2.適合于變量值較少的適合于變量值較少的 離散變量離散變量組距分組 (要點(diǎn))1.將變量值的一個(gè)區(qū)間作為一組將變量值的一個(gè)區(qū)間作為一組2.適合于連續(xù)變量和變量值較多適合于連續(xù)變量和變量值較多的離散變量。的離散變量。3.需要遵循需要遵循“不重不漏不重不漏”的原則的原則4.有等距分組和不等距分組有等距分組和不等距分組組距分組組距分組(幾個(gè)概念幾個(gè)概念)1. 1. 下

4、限下限(low limit)(low limit) :2. 2. 上限上限(upper limit) (upper limit) :3. 3. 組距組距(class width) (class width) :4. 4. 組中值組中值(class midpoint) (class midpoint) :n 開口組的組距:以相鄰組的組距代替。開口組的組距:以相鄰組的組距代替。n 常以組中值來代表各組平均水平。常以組中值來代表各組平均水平。組距分組(步驟)1. 確定組數(shù):確定組數(shù):o斯特杰斯經(jīng)驗(yàn)公式:斯特杰斯經(jīng)驗(yàn)公式:組數(shù)組數(shù)=1+3.3 Lg=1+3.3 Lg N N 2.1.2 次數(shù)分配次數(shù)分

5、配 P17o 在分組的基礎(chǔ)上,將所有單位歸類并列出每一在分組的基礎(chǔ)上,將所有單位歸類并列出每一組組的次數(shù)的次數(shù),稱為次數(shù)分布或頻數(shù)分布。,稱為次數(shù)分布或頻數(shù)分布。o 次數(shù)分布數(shù)列的兩個(gè)要素次數(shù)分布數(shù)列的兩個(gè)要素n 1 1)按某標(biāo)志所分的組。)按某標(biāo)志所分的組。n 2 2)各組所出現(xiàn)的單位數(shù),即頻數(shù),亦稱次數(shù)。)各組所出現(xiàn)的單位數(shù),即頻數(shù),亦稱次數(shù)。n 一般用一般用x x表示變量;用表示變量;用f f表示頻數(shù)(次數(shù))。表示頻數(shù)(次數(shù))。 2.1.3 次數(shù)分配圖次數(shù)分配圖o用直方形的寬度和高度來表示次數(shù)分用直方形的寬度和高度來表示次數(shù)分布的圖形。布的圖形。o繪制直方圖時(shí),橫軸表示各組組限,繪制直方

6、圖時(shí),橫軸表示各組組限,縱軸表示次數(shù)(一般標(biāo)在左方)和比縱軸表示次數(shù)(一般標(biāo)在左方)和比率(或頻率,一般標(biāo)在右方)。率(或頻率,一般標(biāo)在右方)。分組數(shù)據(jù)的圖示直方圖下的面積之和等于1o折線圖:折線圖可以在直方圖的基礎(chǔ)上,用折線將各組次數(shù)高度的坐標(biāo)連接而成,也可以用組中值與次數(shù)求坐標(biāo)點(diǎn)連接而成分組數(shù)據(jù)的圖示(折線圖的繪制)折線圖與直方圖下的面積相等!o 曲線圖:用平滑曲線連接各組次數(shù)坐標(biāo)點(diǎn)即曲線圖:用平滑曲線連接各組次數(shù)坐標(biāo)點(diǎn)即得分布曲線。得分布曲線。頻數(shù)分布的類型頻數(shù)分布的類型2.1.4 洛倫茨曲線與基尼系數(shù)洛倫茨曲線與基尼系數(shù)洛倫茨曲線洛倫茨曲線1.1. 2020世紀(jì)初美國經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家

7、洛倫茨世紀(jì)初美國經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茨(M.E. (M.E. LorentzLorentz) )根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特(V. Pareto)(V. Pareto)提出的收入分配公式繪制而成提出的收入分配公式繪制而成2.2. 描述收入和財(cái)富分配性質(zhì)的曲線描述收入和財(cái)富分配性質(zhì)的曲線3.3. 分析該國家或地區(qū)分配的平均程度分析該國家或地區(qū)分配的平均程度 AB基尼系數(shù)基尼系數(shù) 1.1. 2020世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(G. Gini(G. Gini) )根據(jù)洛根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標(biāo)倫茨曲線給出了衡收入分配平均程度的指標(biāo)2.

8、A A表示實(shí)際收入曲線與絕對(duì)平均線之間的面積表示實(shí)際收入曲線與絕對(duì)平均線之間的面積3.3. B B表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積AB如果如果A=0A=0,則基尼系數(shù),則基尼系數(shù)=0=0,表示收入絕對(duì)平,表示收入絕對(duì)平均均如果如果B=0B=0,則基尼系數(shù),則基尼系數(shù)=1=1,表示收入絕對(duì)不,表示收入絕對(duì)不平均平均基尼系數(shù)在基尼系數(shù)在0 0 和和1 1之間取值之間取值一般認(rèn)為,基尼系數(shù)若小于一般認(rèn)為,基尼系數(shù)若小于0.20.2,表明分配,表明分配平均;基尼系數(shù)在平均;基尼系數(shù)在0.20.2至至0.40.4之間是比較適當(dāng)之間是比較適當(dāng)?shù)模匆粋€(gè)社會(huì)既

9、有效率又沒有造成極大的的,即一個(gè)社會(huì)既有效率又沒有造成極大的分配不公;基尼系數(shù)在分配不公;基尼系數(shù)在0.40.4被認(rèn)為是收入分被認(rèn)為是收入分配不公平的警戒線,超過了配不公平的警戒線,超過了0.40.4應(yīng)該采取措應(yīng)該采取措施縮小這一差距。施縮小這一差距。 2.2 2.2 集中趨勢(shì)的測(cè)度集中趨勢(shì)的測(cè)度一一. . 眾數(shù)眾數(shù)二二. . 中位數(shù)和分位數(shù)中位數(shù)和分位數(shù)三三. . 均值均值四四. .眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的比較集中趨勢(shì)集中趨勢(shì)(central tendency)(central tendency)2.2.1 眾數(shù) (mode)1.集中趨勢(shì)的測(cè)度值之一集中趨勢(shì)的測(cè)度值之一2

10、.出現(xiàn)次數(shù)最多的變量值出現(xiàn)次數(shù)最多的變量值3.不受極端值的影響不受極端值的影響4.可能沒有眾數(shù)或有幾個(gè)眾數(shù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)眾數(shù)(不唯一性)o無眾數(shù)無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 81 1、由單項(xiàng)數(shù)列求眾數(shù)、由單項(xiàng)數(shù)列求眾數(shù) 某某 車車 間間 工工 人人 日日 產(chǎn)產(chǎn) 情情 日產(chǎn)量(件)日產(chǎn)量(件)人數(shù)(人)人數(shù)(人)11501260139014251515合計(jì)合計(jì)2402.2.由組距數(shù)列計(jì)算由組距數(shù)列計(jì)算 首先確定次數(shù)最多的組,即眾數(shù)組,然首先確定次數(shù)最多的組,即眾數(shù)組,然后,用公式計(jì)算。后,用公式計(jì)算。dLM2110dUM2120下限公式:下限公式: 上限公式:上限公式:2.

11、2.2 2.2.2 中位數(shù)中位數(shù) (median)(median)1.排序后處于中間位置上的值1 1、由未分組資料計(jì)算中位數(shù)、由未分組資料計(jì)算中位數(shù) 件)(5.122)1312(Me 設(shè)有六個(gè)工人的日產(chǎn)量設(shè)有六個(gè)工人的日產(chǎn)量(件件)依次排列為依次排列為10、11、12,13、14、15、則:、則: 中位數(shù)位次(中位數(shù)位次(n+1)2 6+123.5(1 1)由由單項(xiàng)數(shù)列單項(xiàng)數(shù)列求中位數(shù)求中位數(shù)2 2、由分組資料計(jì)算中位數(shù)、由分組資料計(jì)算中位數(shù): :例例10:某生產(chǎn)車間:某生產(chǎn)車間120名工人生產(chǎn)某種零件的日產(chǎn)名工人生產(chǎn)某種零件的日產(chǎn)量如下表所示,計(jì)算該車間工人日產(chǎn)量的中位數(shù)。量如下表所示,計(jì)算

12、該車間工人日產(chǎn)量的中位數(shù)。按日產(chǎn)量分組(件)按日產(chǎn)量分組(件)工人數(shù)(人)工人數(shù)(人)累計(jì)次數(shù)(向上)累計(jì)次數(shù)(向上)2020222224242626303032323333101012122525303018181515101010102222474777779595110110120120合計(jì)合計(jì)120120fmmfLMes122.2.由組距數(shù)列求中位數(shù),由組距數(shù)列求中位數(shù),下限公式:下限公式:L為中位數(shù)所在組下限為中位數(shù)所在組下限sm1為中位數(shù)所在組以前各組的累計(jì)次數(shù)為中位數(shù)所在組以前各組的累計(jì)次數(shù)fm為中位數(shù)所在組的次數(shù)為中位數(shù)所在組的次數(shù)從某單位抽查從某單位抽查800戶,取得人均收入

13、資料如下表,戶,取得人均收入資料如下表,計(jì)算該單位人均收入的中位數(shù)。計(jì)算該單位人均收入的中位數(shù)。人均收入(元)人均收入(元)戶數(shù)(戶)戶數(shù)(戶)累計(jì)次數(shù)累計(jì)次數(shù)400-500500-600600-700700-800800-900900-10001000以上以上5451004301684210550150580748790800合計(jì)合計(jì)800中位數(shù)位次中位數(shù)位次f28002400,中位數(shù)組,中位數(shù)組在在700-800這一組中。由下限公式這一組中。由下限公式元)(14.75810043015040070012dfmSmfLMeo中位數(shù)的性質(zhì)中位數(shù)的性質(zhì): :數(shù)據(jù)值與中位數(shù)之差的絕對(duì)值最小數(shù)據(jù)值與

14、中位數(shù)之差的絕對(duì)值最小. .2.2.3 四分位數(shù) (quartile)1.排序后處于25%和75%位置上的值四分位數(shù)2.2.4 2.2.4 均值均值 (mean)(mean)1. 集中趨勢(shì)的最常用的測(cè)度值簡單算術(shù)平均數(shù)簡單算術(shù)平均數(shù)(simple mean)(simple mean)加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)(weighted mean)(weighted mean) (例題分析)o ffxfxfx(權(quán)數(shù)對(duì)均值的影響權(quán)數(shù)對(duì)均值的影響)P34o 甲組:甲組: 考試成績(考試成績(x ): 0 20 100o 人數(shù)分布(人數(shù)分布(f ):):1 1 8o 乙組:乙組: 考試成績(考試成績(x):

15、 0 20 100o 人數(shù)分布(人數(shù)分布(f ):):8 1 1算術(shù)平均數(shù)算術(shù)平均數(shù)(數(shù)學(xué)性質(zhì)數(shù)學(xué)性質(zhì))o1.1.各變量值與均值的離差之和等于零各變量值與均值的離差之和等于零調(diào)和平均數(shù)(harmonic mean)1.1. 均值的另一種表現(xiàn)形式均值的另一種表現(xiàn)形式調(diào)和平均數(shù)某日三種蔬菜的批發(fā)成交數(shù)據(jù)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜蔬菜名稱名稱批發(fā)價(jià)格批發(fā)價(jià)格( (元元) ) X X成交額成交額( (元元) ) X X f f成交量成交量( (公公斤斤) )f f甲甲乙乙丙丙1.201.200.500.500.800.8018000180001250012500640064001500015000

16、250002500080008000合計(jì)合計(jì)36900369004800048000幾何平均數(shù)(geometric mean)1. n 個(gè)變量值乘積的 n 次方根2. 適用于對(duì)比率數(shù)據(jù)的平均3. 主要用于計(jì)算平均增長率【例】一位投資者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計(jì)算該投資者在這四年內(nèi)的平均收益率。眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的比較o 眾數(shù)是分布最高峰的位置眾數(shù)是分布最高峰的位置o 中位數(shù)從面積上將分布分成兩等份中位數(shù)從面積上將分布分成兩等份o 均值由于受極端值的影響,偏向極端值。均值由于受極端值的

17、影響,偏向極端值。眾數(shù)、中位數(shù)和均值的關(guān)系眾數(shù)、中位數(shù)和均值的關(guān)系眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用1. 眾數(shù)眾數(shù)n 不受極端值影響不受極端值影響n 具有不唯一性具有不唯一性n 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用2. 中位數(shù)中位數(shù)n 不受極端值影響不受極端值影響n 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用3. 平均數(shù)平均數(shù)n 易受極端值影響易受極端值影響n 數(shù)學(xué)性質(zhì)優(yōu)良數(shù)學(xué)性質(zhì)優(yōu)良n 數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用2.3 分布離散程度的測(cè)度分布離散程度的測(cè)度一、極差一、極差二、內(nèi)距二、內(nèi)距三、方差和標(biāo)準(zhǔn)差

18、三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)四、離散系數(shù)極差(range)1. 一組數(shù)據(jù)的最大值與最小值之差2. 離散程度的最簡單測(cè)度值3. 易受極端值影響4. 未考慮數(shù)據(jù)的分布內(nèi)距內(nèi)距(Inter-Quartile Range,IQR)(Inter-Quartile Range,IQR) 1.1. 也稱四分位差也稱四分位差2.2. 上四分位數(shù)與下四分位數(shù)之差上四分位數(shù)與下四分位數(shù)之差o 內(nèi)內(nèi) 距距= = Q Q3 3 Q Q1 13.3. 反映了中間反映了中間50%50%數(shù)據(jù)的離散程度數(shù)據(jù)的離散程度4.4. 不受極端值的影響不受極端值的影響5.5. 可用于衡量中位數(shù)的代表性可用于衡量中位數(shù)的代表性方差和標(biāo)準(zhǔn)

19、差方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差(Variance and Standard deviation)1.離散程度最常用的測(cè)度值2.反映了各變量值與均值的平均差異總體方差和標(biāo)準(zhǔn)差 (Population variance and Standard deviation)樣本方差和標(biāo)準(zhǔn)差樣本方差和標(biāo)準(zhǔn)差 (simple variance and standard deviation)(simple variance and standard deviation)樣本方差P34 自由度(degree of freedom)1. 一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)2. 當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n n 時(shí),若樣本均值

20、x x 確定后,只有n n-1-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值3. 例如,樣本有3個(gè)數(shù)值,即x x1 1=2=2,x x2 2=4=4,x x3 3=9=9,則 x x = 5= 5。當(dāng) x x = 5 = 5 確定后,x x1 1,x x2 2和x x3 3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x x1 1=6=6,x x2 2=7=7,那么x x3 3則必然取2 2,而不能取其他離散系數(shù)離散系數(shù)(coefficient of variation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比2.對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度3.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4. 用于對(duì)不同

21、組別數(shù)據(jù)離散程度的比較某管理局所屬某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號(hào)企業(yè)編號(hào)產(chǎn)品銷售額(萬元)產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.02.5 2.5 統(tǒng)計(jì)表與統(tǒng)計(jì)圖統(tǒng)計(jì)表與統(tǒng)計(jì)圖2.5.1 2.5.1 統(tǒng)計(jì)表統(tǒng)計(jì)表o把統(tǒng)計(jì)數(shù)據(jù)按一定的順序排列在表格把統(tǒng)計(jì)數(shù)據(jù)按一定的順序排列在表格上,就形成了統(tǒng)計(jì)表。上,就形成了統(tǒng)計(jì)表。統(tǒng)計(jì)表的結(jié)構(gòu)19992000年城鎮(zhèn)居民家庭抽樣調(diào)查資料年城鎮(zhèn)居民家庭抽樣調(diào)查資料項(xiàng)目項(xiàng)目單位單位1999年

22、年 2000年年 調(diào)查戶數(shù)調(diào)查戶數(shù) 平均每戶家庭人口平均每戶家庭人口 平均每戶就業(yè)人口平均每戶就業(yè)人口 平均每戶就業(yè)面平均每戶就業(yè)面 平均一就業(yè)者負(fù)擔(dān)人數(shù)平均一就業(yè)者負(fù)擔(dān)人數(shù) 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消費(fèi)性支出平均每人消費(fèi)性支出戶戶人人人人%元元元元元元元元 400443.141.7756.431.775888.775854.024615.91 4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00資料來源:中國統(tǒng)計(jì)年鑒2001,中國統(tǒng)計(jì)出版社,2001,第305頁。注:本表為城市和縣城的城鎮(zhèn)居民家庭抽

23、樣調(diào)查材料。 統(tǒng)計(jì)表的設(shè)計(jì)(比較與選用)2.5.2 2.5.2 統(tǒng)計(jì)圖統(tǒng)計(jì)圖數(shù)值型數(shù)據(jù)的圖示 未分組數(shù)據(jù)莖葉圖(stem-and-leaf display)1. 顯示顯示未分組未分組的原始數(shù)據(jù)的分布的原始數(shù)據(jù)的分布2. 由由“莖莖”和和“葉葉”兩部分?jǐn)?shù)字組成兩部分?jǐn)?shù)字組成.3. 以高位數(shù)作樹莖,低位數(shù)作樹葉以高位數(shù)作樹莖,低位數(shù)作樹葉4. 樹葉上只保留一位數(shù)字樹葉上只保留一位數(shù)字5. 5. 莖葉圖類似于橫置的直方圖,但莖葉圖類似于橫置的直方圖,但又有區(qū)別又有區(qū)別 直方圖可觀察一組數(shù)據(jù)的分布狀況,直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值但沒有給出具體的數(shù)值 莖葉圖既能給出數(shù)據(jù)的分布狀

24、況,又莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息數(shù)據(jù)的信息未分組數(shù)據(jù)莖葉圖(例題分析)未分組數(shù)據(jù)莖葉圖(擴(kuò)展的莖葉圖)未分組數(shù)據(jù)箱線圖(box plot)1.1. 用于顯示未分組的原始數(shù)據(jù)的分布用于顯示未分組的原始數(shù)據(jù)的分布2.2. 箱線圖由一組數(shù)據(jù)的箱線圖由一組數(shù)據(jù)的5 5個(gè)特征值繪制而個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成成,它由一個(gè)箱子和兩條線段組成3.3. 其繪制方法是:其繪制方法是:n 首先找出一組數(shù)據(jù)的首先找出一組數(shù)據(jù)的5 5個(gè)特征值,即個(gè)特征值,即最最大值、最小值、中位數(shù)大值、最小值、中位數(shù)M Me e 和兩個(gè)

25、和兩個(gè)四分四分位數(shù)位數(shù)( (下四分位數(shù)下四分位數(shù)Q QL L和上四分位數(shù)和上四分位數(shù)Q QU U)n 連接兩個(gè)四分(位)數(shù)畫出箱子,再將連接兩個(gè)四分(位)數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接兩個(gè)極值點(diǎn)與箱子相連接 未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題分析)分布的形狀與箱線圖未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)P43頻數(shù)分布的類型計(jì)算分析題1.1.某廠某廠400400名職工工資如下名職工工資如下按月工資分組(元)按月工資分組(元)職工人數(shù)(人)職工人數(shù)(人)450-550550-650650-750750-850850-950601001406040合計(jì)合計(jì)

26、400根據(jù)上述資料計(jì)算該廠職工平均工資和標(biāo)準(zhǔn)差。解:職工人數(shù)職工人數(shù)f組中值組中值xxf60100140604050060070080090030000600009800048000360001944000640005600086400019360004002720005440000fxx2)((元)標(biāo)準(zhǔn)差平均工資62.1164005440000ffxx680400272000fxfx22.某縣去年年糧食產(chǎn)量資料如下:按單位面積產(chǎn)量分組(千克公頃)播種面積比重3000以下3000-37503750-60006000以上0.050.350.400.20根據(jù)上表資料計(jì)算該縣糧食作物平均單位面積產(chǎn)量

27、。解:x26253375487571250.050.350.40.2131.251181.251950.001425.001.004687.5ffffx5 .468720. 0712540. 0487535. 0337505. 02625ffxx3.某地甲、乙兩個(gè)農(nóng)貿(mào)市場(chǎng)三種主要蔬菜價(jià)格及銷售資料如下:品種價(jià)格(元千克)甲銷售額(萬元)乙銷售額(萬元)ABC0.300.320.3675.040.045.037.580.045.0比較該地區(qū)哪個(gè)農(nóng)貿(mào)市場(chǎng)蔬菜平均價(jià)格高?并說明原因。解:325.05005.163xmm32.0500160 xmm乙甲HH4. .某工廠生產(chǎn)一批零件共某工廠生產(chǎn)一批零件共1010萬件,為了解這批產(chǎn)品的萬件,為了解這批產(chǎn)品的質(zhì)量,采取不重復(fù)抽樣的方法抽取質(zhì)量,采取不重復(fù)抽樣的方法抽取10001000件進(jìn)行檢查,件進(jìn)行檢查,其結(jié)果如下,根據(jù)質(zhì)量標(biāo)準(zhǔn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論