版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、統(tǒng)計(jì)學(xué)教程盧小廣 編著第4章 數(shù)據(jù)分布特征的度量 10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 集中趨勢(shì)的度量 4.2.5 方差和標(biāo)準(zhǔn)差 4.1.1 眾數(shù) 4.2.6 離散系數(shù) 4.1.2 中位數(shù) 4.2.7 標(biāo)準(zhǔn)化值 4.1.3 均值 4.1.4 調(diào)和平均數(shù) 4.1.5 幾何平均數(shù) 4.3 偏態(tài)和峰度的度量 4.1.6 均值、眾數(shù)和中位數(shù)的比較 4.3.1 偏態(tài)系數(shù) 4.1.7 均值、眾數(shù)和中位數(shù)的比較 4.3.2 峰度系數(shù)4.2 離散程度的度量 4.2.1 異眾比率 4.2.3 取值范圍 4.2.4 平均差第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量
2、統(tǒng)計(jì)學(xué)教程盧小廣10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 原始數(shù)據(jù)經(jīng)過(guò)分組整理所形成的頻數(shù)分布,直觀和概略地反映出數(shù)據(jù)分布的基本特征。頻數(shù)分布屬于對(duì)數(shù)據(jù)分布特征的初步描述,缺乏對(duì)數(shù)據(jù)分布特征的綜合度量,若需要深入地表述數(shù)據(jù)分布特征的具體特征和內(nèi)在聯(lián)系,還應(yīng)對(duì)數(shù)據(jù)分布特征進(jìn)行綜合性的度量。 數(shù)據(jù)分布特征的度量包括三個(gè)方面的內(nèi)容,一是數(shù)據(jù)分布的集中趨勢(shì),反映總體中各個(gè)單位的數(shù)值水平向其聚集,或者集中的中心數(shù)值;二是數(shù)據(jù)分布的離散趨勢(shì),反映總體中各個(gè)單位的數(shù)值水平偏離中心數(shù)值的綜合程度;三是數(shù)據(jù)分布的偏態(tài)和峰度,反映各個(gè)總體單位的數(shù)值水平的分布形
3、態(tài)是對(duì)稱或偏倚,平坦或尖聳的具體數(shù)值。 集中趨勢(shì)(central tendency)是指一組數(shù)據(jù)所趨向的中心數(shù)值。對(duì)集中趨勢(shì)的度量就是采用具體的統(tǒng)計(jì)方法和統(tǒng)計(jì)測(cè)度對(duì)這一中心數(shù)值的測(cè)量和計(jì)量,以一綜合數(shù)值來(lái)表述數(shù)據(jù)所趨向的這一中心數(shù)值的一般水平。10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.1眾數(shù) 眾數(shù)(眾數(shù)(modemode)是一組數(shù)據(jù)中)是一組數(shù)據(jù)中頻數(shù)最大頻數(shù)最大的變量值,直觀地反映了數(shù)據(jù)的的變量值,直觀地反映了數(shù)據(jù)的集中趨勢(shì)。集中趨勢(shì)。眾數(shù)是度量定類數(shù)據(jù)定類數(shù)據(jù)集中趨勢(shì)的測(cè)度,一般用 表示。 例例4.1 4.1 某品牌運(yùn)動(dòng)服裝專賣
4、店一批新品球衣銷售情況如下表 4.1 某專賣店新品球衣銷售情況 件球衣貨號(hào)前日售出數(shù)量當(dāng)日出售數(shù)量 as01-9064 as02-951821 ab09-102533 sp09-058893 ss12-101523 pp89-1586合 計(jì)160180om10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.1眾數(shù) 眾數(shù)(眾數(shù)(modemode)是一組數(shù)據(jù)中頻數(shù)最大的變量值,直觀地反映了數(shù)據(jù)的)是一組數(shù)據(jù)中頻數(shù)最大的變量值,直觀地反映了數(shù)據(jù)的集中趨勢(shì)。集中趨勢(shì)。眾數(shù)是度量定類數(shù)據(jù)定類數(shù)據(jù)集中趨勢(shì)的測(cè)度,一般用 表示。 例例4.1 4.1 某品牌
5、運(yùn)動(dòng)服裝專賣店一批新品球衣銷售情況如下表 4.1 某專賣店新品球衣銷售情況 件球衣貨號(hào)前日售出數(shù)量當(dāng)日出售數(shù)量 as01-9064 as02-951821 ab09-102533 sp09-058893 ss12-101523 pp89-1586合 計(jì)160180om10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.2 4.2 利用第三章中例3.1中某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。 要求要求 試計(jì)算計(jì)算該班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的眾數(shù)。 解解 將該原始數(shù)據(jù)排序之后,得到有序數(shù)據(jù)如下 52,56,62,64,65,69,70,
6、74,75,75,76,78,78,79,79, 81,82,82,83,84,84,84,84,86,87,87,88,89,89,90, 91,91,92,96,98 10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.2 4.2 利用第三章中例3.1中某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。 要求要求 試計(jì)算計(jì)算該班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的眾數(shù)。 解解 將該原始數(shù)據(jù)排序之后,得到有序數(shù)據(jù)如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79, 81,82,82,83,84,84,84,84
7、,86,87,87,88,89,89,90, 91,91,92,96,98 84分在這35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)中出現(xiàn)了4次,屬于出現(xiàn)次數(shù)最多的變量值,根據(jù)眾數(shù)定義,可以確定眾數(shù)為84分,即(分)84om10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 利用已經(jīng)分組的數(shù)值型數(shù)據(jù)計(jì)算眾數(shù)的場(chǎng)合,需要運(yùn)用插值公式來(lái)計(jì)算眾數(shù)的近似數(shù)值。眾數(shù)的插值公式有下限公式和上限公式。其下限公式從眾數(shù)所在組的上限出發(fā),有 (4.1)上限公式則從眾數(shù)所在組的上限出發(fā),有 (4.2) oooomumlmlmodfffffflm)()(oooomumlmumodf
8、fffffum)()(10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.3 4.3 表4.2為第三章中表3.7“某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)”中的部分?jǐn)?shù)據(jù)。根據(jù)表4.2的已經(jīng)分組的數(shù)值型數(shù)據(jù),計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)眾數(shù)的近似數(shù)值。表4.2 某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)考 分 /分人 數(shù) /人 60 以下26070470809809014 901006合 計(jì)3510:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 通過(guò)上限公式或下限公式的計(jì)算眾數(shù)所得到的計(jì)算結(jié)果是一致的。
9、眾數(shù)是一個(gè)通過(guò)數(shù)據(jù)中頻數(shù)最大的數(shù)據(jù)的數(shù)值來(lái)反映集中趨勢(shì)的測(cè)度,為一位置型的代表數(shù)值,所以眾數(shù)的取值不受極端數(shù)值的影響,也不受組距分組中開口組設(shè)置的影響。當(dāng)數(shù)值型數(shù)據(jù)中含有極小值和極大值時(shí),使用眾數(shù)來(lái)度量數(shù)據(jù)的集中趨勢(shì),可以作為其它集中趨勢(shì)測(cè)度的補(bǔ)充。 眾數(shù)是一個(gè)適用于最低層次的定類數(shù)據(jù)的測(cè)度,因此可以用于各種量表數(shù)據(jù)的集中趨勢(shì)分析,有效使用眾數(shù)的前提是數(shù)據(jù)的頻數(shù)分布存在明顯的集中態(tài)勢(shì)。10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 通過(guò)上限公式或下限公式的計(jì)算眾數(shù)所得到的計(jì)算結(jié)果是一致的。 眾數(shù)是一個(gè)通過(guò)數(shù)據(jù)中頻數(shù)最大的數(shù)據(jù)的數(shù)值來(lái)反映集中趨勢(shì)的
10、測(cè)度,為一位置型的代表數(shù)值,所以眾數(shù)的取值不受極端數(shù)值的影響,也不受組距分組中開口組設(shè)置的影響。當(dāng)數(shù)值型數(shù)據(jù)中含有極小值和極大值時(shí),使用眾數(shù)來(lái)度量數(shù)據(jù)的集中趨勢(shì),可以作為其它集中趨勢(shì)測(cè)度的補(bǔ)充。 眾數(shù)是一個(gè)適用于最低層次的定類數(shù)據(jù)的測(cè)度,因此可以用于各種量表數(shù)據(jù)的集中趨勢(shì)分析,有效使用眾數(shù)的前提是數(shù)據(jù)的頻數(shù)分布存在明顯的集中態(tài)勢(shì)。 討論題:你認(rèn)為那些現(xiàn)象不適宜采用眾數(shù)來(lái)描述其集中趨勢(shì)?10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.2 中位數(shù) 中位數(shù)(中位數(shù)(medianmedian)是位于)是位于有序數(shù)據(jù)正中間位置有序數(shù)據(jù)正中間位置上的
11、變量值,中位數(shù)用上的變量值,中位數(shù)用其特殊的位置屬性直接地體現(xiàn)了集中趨勢(shì)的中心數(shù)值特征。其特殊的位置屬性直接地體現(xiàn)了集中趨勢(shì)的中心數(shù)值特征。中位數(shù)是度量定序數(shù)據(jù)定序數(shù)據(jù)集中趨勢(shì)的測(cè)度,一般用 表示。 中位數(shù)也是一種位置型的代表數(shù)值,同時(shí)中位數(shù)還是一種順序統(tǒng)計(jì)量,因此,計(jì)算中位數(shù)要求數(shù)值至少具備定序數(shù)據(jù)的性質(zhì)。中位數(shù)一旦確定,就可以根據(jù)中位數(shù)的具體取值,將全部數(shù)據(jù)分成數(shù)量相等的兩個(gè)部分,一半數(shù)據(jù)的數(shù)值小于或等于中位數(shù);另一半數(shù)據(jù)的數(shù)值大于或等于中位數(shù)。由此可得出中位數(shù)的計(jì)算公式。當(dāng)數(shù)據(jù)的個(gè)數(shù)為奇數(shù)時(shí),有 (4.3)當(dāng)數(shù)據(jù)的個(gè)數(shù)為偶數(shù)時(shí),有 (4.4) me21nxme2122nnxxme10:1
12、7 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.44.4 仍然采用第三章中例3.1 某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。 要求要求 試計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的中位數(shù)。 解解 將原始數(shù)據(jù)排序之后,得到以下有序數(shù)據(jù)52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,98 該組數(shù)據(jù)的個(gè)數(shù)為35,因此采用式(4.3)計(jì)算,排列在該組有序數(shù)據(jù)第18位上的變量值為82分,該班35名學(xué)生的統(tǒng)計(jì)
13、學(xué)考試成績(jī)的中位數(shù)為82分。即(分)821821xxmen10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 利用已經(jīng)分組的數(shù)值型數(shù)據(jù)計(jì)算中位數(shù)時(shí),需要運(yùn)用插值公式計(jì)算中位數(shù)的近似數(shù)值。中位數(shù)的插值公式也有下限公式和上限公式。其下限公式從中位數(shù)所在組的下限出發(fā),為 (4.5) 上限公式從中位數(shù)所在組的上限出發(fā),為 (4.6)4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 mememedfsflme12mememedfsfume1210:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.54.5 表4.3為第三章“表3.7 某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)
14、考試成績(jī)”中的部分資料,為已經(jīng)分組的數(shù)值型數(shù)據(jù)。 要求要求 根據(jù)表4.3數(shù)據(jù),計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的中位數(shù)。 解解 運(yùn)用插值公式計(jì)算該班學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)中位數(shù)的近似數(shù)值。表4.3 某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)考 分 /分人 數(shù) /人 向上累計(jì)人數(shù) /人 向下累計(jì)人數(shù) /人60以下2235607046337080915298090142920901006356合 計(jì)3510:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 顯然,我們可以任選上限公式或下限公式來(lái)計(jì)算中位數(shù),得到結(jié)果是相同的。 中位數(shù)是一個(gè)順序統(tǒng)計(jì)量,其取值不受極端數(shù)值的影響,也不受組距分組中開口組設(shè)置的影響。當(dāng)
15、數(shù)值型數(shù)據(jù)中含有極小值和極大值時(shí),可以使用中位數(shù)來(lái)度量數(shù)據(jù)的集中趨勢(shì)。 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 顯然,我們可以任選上限公式或下限公式來(lái)計(jì)算中位數(shù),得到結(jié)果是相同的。 中位數(shù)是一個(gè)順序統(tǒng)計(jì)量,其取值不受極端數(shù)值的影響,也不受組距分組中開口組設(shè)置的影響。當(dāng)數(shù)值型數(shù)據(jù)中含有極小值和極大值時(shí),可以使用中位數(shù)來(lái)度量數(shù)據(jù)的集中趨勢(shì)。 討論題:你認(rèn)為中位數(shù)的主要局限是什么? 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.3 均值 均值
16、(mean)為一組數(shù)值型數(shù)據(jù)之和除以該組數(shù)據(jù)總數(shù)的商,即同一組數(shù)據(jù)的總值與其頻數(shù)的商。 在大多數(shù)場(chǎng)合,均值采用算術(shù)平均方法計(jì)算,所以人們經(jīng)常將均值稱為算術(shù)平均數(shù)(arithmetical average)。 計(jì)算均值的數(shù)據(jù)需要具備數(shù)值型數(shù)據(jù)的屬性,均值是一個(gè)數(shù)值型的集中趨勢(shì)測(cè)度。通過(guò)計(jì)算均值的運(yùn)算過(guò)程,首先將各個(gè)數(shù)據(jù)之間的數(shù)量差異抽象掉了,以一個(gè)抽象性的綜合測(cè)度概括地反映事物的集中趨勢(shì)。其次將不同總體的總量規(guī)模抽象掉了,表現(xiàn)出來(lái)的只是一個(gè)一般性的代表水平,有利于不同規(guī)模的同類總體在不同空間和時(shí)間上的廣泛比較。10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨
17、勢(shì)的度量 1簡(jiǎn)單均值 簡(jiǎn)單均值(simple mean)是根據(jù)未分組的原始數(shù)據(jù)計(jì)算出來(lái)的均值。有 (4.7) 例例4.6 4.6 仍采用第三章中例3.1某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù) 要求要求 試計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的均值。 解解 采用式(4.7)計(jì)算,有 nxx分80352800nxx10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 2加權(quán)均值 加權(quán)均值(weighted mean)是運(yùn)用各組頻數(shù)作為權(quán)數(shù)對(duì)各組數(shù)值水平進(jìn)行加權(quán)計(jì)算出來(lái)的均值。根據(jù)是單變量值分組還是組距分組,以及組距分組的各組數(shù)值水平代表數(shù)據(jù)是組均值還
18、是組中值,加權(quán)均值的計(jì)算分為以下三種類型。(1)單變量值分組加權(quán)均值 在單變量值分組場(chǎng)合,加權(quán)均值的計(jì)算公式為 (4.8)fxfx10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.7 4.7 某機(jī)床總裝車間10個(gè)裝配小組日完成產(chǎn)品臺(tái)數(shù)情況,計(jì)算單變量值分組加權(quán)均值。表4.4 某機(jī)床總裝車間10個(gè)裝配小組日完成產(chǎn)品臺(tái)數(shù)情況 要求要求 試計(jì)算單變量值分組加權(quán)均值。 解解 采用式(4.8)計(jì)算,可得臺(tái)8 . 61068fxfx日完成產(chǎn)品量 /臺(tái)裝配小組 /個(gè)小計(jì) /臺(tái)515621275358216合 計(jì)106810:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分
19、布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 (2)采用組均值計(jì)算加權(quán)均值 在組距分組中,采用組均值計(jì)算加權(quán)均值時(shí),計(jì)算公式為 (4.9) 式(4.9)中 表示第j 組的組均值。 hjjhjjjffxx11jx10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.84.8 采用第三章中例3.1 的各組均值數(shù)據(jù)。要求要求 試計(jì)算組距分組的該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的加權(quán)均值。解解 依據(jù)各組中的數(shù)據(jù)數(shù)值和數(shù)據(jù)個(gè)數(shù),按照式(4.7)的均值計(jì)算公式,計(jì)算出各組的組均值,填入表4.5中。表4.5 某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的組均
20、值和頻數(shù)考分 /分組均值 /分 人 數(shù) /人 組總分 /分60以下54210860706542607080769684809085141190 90100936558合 計(jì)352800(分)8035280064269346525411hjjhjjjffxx10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 (3)采用組中值計(jì)算加權(quán)均值 在不占有原始數(shù)據(jù)和組均值數(shù)值,只擁有已分組的數(shù)據(jù)時(shí),只有利用各組組中值采用加權(quán)的方式計(jì)算均值的近似數(shù)值。利用組中值計(jì)算均值近似值的公式為 (4.10) 式(4.10)中 表示第j組的組中值。 hjjhjjjffxx11
21、jx10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.94.9 根據(jù)第三章中表3.7中“某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)”的各組組中值和頻數(shù)數(shù)據(jù)。 要求要求 試采用組中值計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的加權(quán)均值。 解解 采用式(4.10)計(jì)算。表4.6 某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的組中值和頻數(shù)考分 /分組中值 /分 人 數(shù) /人 組總分 /分60以下55211060706542607080759675809085141190 90100956570合 計(jì)352805分14.8035280564269546525511hjjh
22、jjjffxx10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 3權(quán)數(shù)與加權(quán)結(jié)構(gòu) 對(duì)于加權(quán)均值而言,有兩個(gè)因素決定著均值數(shù)值的大小,一個(gè)因素是各組的數(shù)值水平;另一個(gè)因素是各組的頻數(shù)。頻數(shù)對(duì)各組的數(shù)值水平數(shù)值起著權(quán)衡輕重的作用,所以將加權(quán)均值的計(jì)算公式中頻數(shù)稱為“權(quán)數(shù)”。 在均值的計(jì)算中又將頻數(shù)分布稱為“加權(quán)結(jié)構(gòu)”,“加權(quán)結(jié)構(gòu)” 更加清晰地反映了數(shù)據(jù)在各組中的分布與集中趨勢(shì)之間的聯(lián)系,及其對(duì)均值數(shù)值水平形成的影響。 將式(4.8)略加變形,有 (4.11) xffxfxfx10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度
23、量集中趨勢(shì)的度量 均值的數(shù)學(xué)性質(zhì): (1)各個(gè)變量值與其均值的離差和為零,即(2)各個(gè)變量值與其均值平均數(shù)的離差平方和為最小,即 當(dāng)取均值作為集中趨勢(shì)的測(cè)度時(shí),各個(gè)數(shù)據(jù)的取值與集中趨勢(shì)測(cè)度的離差平方和為最小值。均值的這一數(shù)學(xué)性質(zhì)是度量離散程度,進(jìn)行誤差分析和最小二乘估計(jì)等統(tǒng)計(jì)方法的基礎(chǔ)。0)(xxminxx2)(10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 均值的數(shù)學(xué)性質(zhì): (1)各個(gè)變量值與其均值的離差和為零,即(2)各個(gè)變量值與其均值平均數(shù)的離差平方和為最小,即 當(dāng)取均值作為集中趨勢(shì)的測(cè)度時(shí),各個(gè)數(shù)據(jù)的取值與集中趨勢(shì)測(cè)度的離差平方和為最小值
24、。均值的這一數(shù)學(xué)性質(zhì)是度量離散程度,進(jìn)行誤差分析和最小二乘估計(jì)等統(tǒng)計(jì)方法的基礎(chǔ)。 討論題:試比較均值、眾數(shù)和中位數(shù)在數(shù)值型數(shù)據(jù)的集中趨勢(shì)分析中的作用?0)(xxminxx2)(10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.4 調(diào)和平均數(shù) 調(diào)和平均數(shù)(harmonic mean)是各個(gè)變量數(shù)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。因此又稱之為“倒數(shù)平均數(shù)”。1. 簡(jiǎn)單調(diào)和平均數(shù) 設(shè)有個(gè)變量值為, 則有簡(jiǎn)單調(diào)和平均數(shù)的計(jì)算公式為 (4.12) xnxxxnhn1111112110:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量
25、集中趨勢(shì)的度量 例例4.104.10 設(shè)有12批a產(chǎn)品當(dāng)日在某海關(guān)進(jìn)口時(shí)報(bào)關(guān)的單價(jià)分別為每件25,24,25,27,26,25,24,28,26,25,26,28美元。要求要求 試用調(diào)和平均數(shù)方法計(jì)算其平均價(jià)格。 解解 由式(4.12)美元68.25467184. 0122812412511211h10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 2加權(quán)調(diào)和平均數(shù)(1)單變量值分組的加權(quán)調(diào)和平均數(shù) 在單變量值分組場(chǎng)合,加權(quán)均值的計(jì)算公式為 (4.13)(2)組距分組的加權(quán)調(diào)和平均數(shù) 在組距分組場(chǎng)合,仍然根據(jù)是否擁有各組組均值數(shù)據(jù),加權(quán)調(diào)和平均數(shù)的計(jì)
26、算分為兩種不同的方式。擁有各組組均值數(shù)據(jù)時(shí),采用各組組均值計(jì)算加權(quán)調(diào)和平均數(shù);不具有各組組均值數(shù)據(jù)時(shí),則需要采用各組組中值來(lái)計(jì)算加權(quán)調(diào)和平均數(shù)的近似數(shù)值。 在現(xiàn)實(shí)生活中,實(shí)際使用到的僅是一種形式上類似調(diào)和平均數(shù)的“加權(quán)調(diào)和平均數(shù)”,它是均值的一種變形。xffh10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 3均值的變形 在擁有各組總值數(shù)據(jù)和各組變量值水平,缺少各組頻數(shù)數(shù)據(jù)時(shí),往往采用形式上類似加權(quán)調(diào)和平均數(shù)的公式,來(lái)計(jì)算加權(quán)均值。用表示各組總值,用表示這一形式上類似加權(quán)調(diào)和平均數(shù)的集中趨勢(shì)測(cè)度,有 (4.14) 由式(4.14)可知,這一所謂的形
27、式上類似加權(quán)調(diào)和平均數(shù)的集中趨勢(shì)測(cè)度實(shí)際上就是均值,而不是調(diào)和平均數(shù)。xfxfxfxxfxmmxh110:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 例例4.124.12 已知某商店商品按照優(yōu)惠價(jià)、折扣價(jià)和原價(jià)的單價(jià)和銷售總額。 要求要求 試求銷售價(jià)格的均值。 解解 由式(4.16)表4.8 某商店w商品銷售情況 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 原價(jià)20040000200折扣價(jià)16048000300優(yōu)惠計(jì)110500650價(jià)格單價(jià) /元總額 /元數(shù)量 /件xmxf fxm/元170650110500 xxh10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量
28、 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.5 幾何平均數(shù) 幾何平均數(shù)(geometric mean)是指各項(xiàng)數(shù)據(jù)的連乘積開其項(xiàng)數(shù)次方的算術(shù)根,一般用g表示。當(dāng)對(duì)象為某種連乘積的關(guān)系,例如總比率或總速度時(shí),則需要采用幾何平均數(shù)方法,計(jì)算其平均比率或平均速度。幾何平均數(shù)的計(jì)算公式也有簡(jiǎn)單幾何平均數(shù)加權(quán)幾何平均數(shù)和兩種形式: 簡(jiǎn)單幾何平均數(shù)。計(jì)算公式為: (4.15)、加權(quán)幾何平均數(shù)。加權(quán)幾何平均數(shù)計(jì)算公式為: (4.16)ffffffhffxxxxghh212121nnnxxxxg2110:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例
29、4.134.13 某廠有四個(gè)連續(xù)作業(yè)車間,其產(chǎn)品的合格率分別為95%、96%、94%和90%。 要求要求 試計(jì)算該產(chǎn)品的平均合格率。 解解 顯然,本題不能采用算術(shù)平均法或調(diào)和平均法,因?yàn)楦鬈囬g的合格率之積全廠的總合格率,應(yīng)采用幾何平均法來(lái)計(jì)算其平均合格率。由式(4.15),有%72.93%90%94%96%954g10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.144.14 設(shè)某項(xiàng)每年分紅一次的投資項(xiàng)目,10年來(lái)各年的實(shí)際收益率分別為10%,9%,8%,8%,9%,8%,9%,7%,11%,10%。 要求要求 試求該項(xiàng)投資10年來(lái)的平均年
30、收益率。 解解 平均年收益率是一項(xiàng)平均增長(zhǎng)速度,需要由平均發(fā)展速度間接計(jì)算。因此需要將例4.14中的各年收益率數(shù)據(jù)(年增長(zhǎng)速度),換算成年本利和(年發(fā)展速度),利用式(4.15)計(jì)算出該項(xiàng)投資10年來(lái)的平均年本利率,最后將平均年本利率扣除本金后,計(jì)算出平均年收益率。即 也可以根據(jù)式(4.16)計(jì)算,有08894. 134446. 21 . 109. 11 . 11010g%894. 8108894. 1平均年收益率08894. 134446. 210ffxg10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 3對(duì)數(shù)均值 將幾何平均數(shù)計(jì)算公式等號(hào)兩端同
31、時(shí)取對(duì)數(shù),幾何平均數(shù)計(jì)算公式表現(xiàn)出類似均值計(jì)算公式的形式。所以,幾何平均數(shù)又被稱為對(duì)數(shù)均值,或?qū)?shù)平均數(shù)。 由式(4.15) 等號(hào)兩端同時(shí)取對(duì)數(shù),可得對(duì)數(shù)形式的簡(jiǎn)單幾何平均數(shù)計(jì)算公式。有 (4.17) 由式(4.16) 等號(hào)兩端同時(shí)取對(duì)數(shù),可得對(duì)數(shù)形式的,具有類似加權(quán)均值計(jì)算公式形式的加權(quán)幾何平均數(shù)計(jì)算公式。有 (4.18)nxglnlnfxfglnln10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.6 均值、調(diào)和平均數(shù)和幾何平均數(shù)的比較 對(duì)于同一組數(shù)據(jù),僅從數(shù)值比較的角度,有均值大于等于幾何平均數(shù),幾何平均數(shù)大于等于調(diào)和平均數(shù),即 。
32、例例4.16 4.16 有一組數(shù)據(jù)為4,5,6,7,8,6,7,8,9,8 ,請(qǐng)分別計(jì)算均值、調(diào)和平均數(shù)和幾何平均數(shù)。 解解:分別計(jì)算如下: xgh8 . 61068nxx43. 6555159. 1101xnh62. 616257024010nxg10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 4.1.7 均值、眾數(shù)和中位數(shù)的比較 在均值、眾數(shù)和中位數(shù)這三個(gè)測(cè)度中,均值是唯一的數(shù)值型測(cè)度。均值一般采用算術(shù)平均方法計(jì)算的集中趨勢(shì)測(cè)度,對(duì)極端數(shù)值的反應(yīng)比較敏感,在數(shù)據(jù)的分布出現(xiàn)偏倚時(shí),均值受到的影響最大。眾數(shù)和中位數(shù)都是位置型的集中趨勢(shì)測(cè)度,其具體
33、取值不受極端數(shù)值的影響。其中眾數(shù)是對(duì)應(yīng)于最大頻數(shù)的數(shù)值,中位數(shù)是居于有序數(shù)據(jù)中間位置上的數(shù)值。 因此,若數(shù)據(jù)的分布是對(duì)稱的,有均值、眾數(shù)和中位數(shù)三個(gè)集中趨勢(shì)測(cè)度的取值相等。 當(dāng)數(shù)據(jù)分布呈左偏態(tài)時(shí),一般有均值的取值最小,其次是中位數(shù),眾數(shù)的取值最大。在頻數(shù)分布圖上,眾數(shù)始終對(duì)應(yīng)于峰頂,均值和中位數(shù)偏在峰頂?shù)淖筮?,均值又在中位?shù)左邊; 當(dāng)數(shù)據(jù)分布呈右偏態(tài)時(shí),一般有均值的取值最大,其次是中位數(shù),眾數(shù)的取值最小。在頻數(shù)分布圖上,眾數(shù)還是處在對(duì)應(yīng)于峰頂?shù)奈恢?,均值和中位?shù)偏在峰頂?shù)挠疫?,并且均值偏在最右邊?0:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 圖
34、4.1 對(duì)稱分布 圖4.2 左偏分布 圖4.3 右偏分布 10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.1 4.1 集中趨勢(shì)的度量集中趨勢(shì)的度量 例例4.174.17 根據(jù)第三章中例3.1 某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。 要求要求 計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的均值、眾數(shù)和中位數(shù),簡(jiǎn)要分析數(shù)據(jù)的分布狀況。 解解 由該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)均值、眾數(shù)和中位數(shù)的具體取值,可得出三者之間的數(shù)值比較關(guān)系,有 則認(rèn)為該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)呈左偏態(tài),偏倚的程度不是很大,從均值角度來(lái)說(shuō),該班高分(超過(guò)均值80分)的同學(xué)較多,超過(guò)了半數(shù)。因?yàn)榘捶謹(jǐn)?shù)排序處在正中間位
35、置上同學(xué)的分?jǐn)?shù)為中位數(shù)82分,高于均值80分的水平。分分分848280ommex第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量統(tǒng)計(jì)學(xué)教程盧小廣10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 4.2.1 異眾比率 異眾比率(異眾比率(variation ratiovariation ratio)是非眾數(shù)所在組的頻數(shù)之和占總頻數(shù))是非眾數(shù)所在組的頻數(shù)之和占總頻數(shù)的比率,的比率,一般用 表示。 (4.19) 異眾比率是用于評(píng)價(jià)眾數(shù)的代表性的測(cè)度異眾比率是用于評(píng)價(jià)眾數(shù)的代表性的測(cè)度。異眾比率取值在1到0之間,一般用百分?jǐn)?shù)表示。異
36、眾比率數(shù)值越大,越趨近于1,說(shuō)明眾數(shù)所在組的頻數(shù)占總頻數(shù)的比率越低,眾數(shù)的代表性越弱,反映數(shù)據(jù)的頻數(shù)分布不存在顯著集中的態(tài)勢(shì),無(wú)法借助眾數(shù)來(lái)反映數(shù)據(jù)的集中趨勢(shì);異眾比率數(shù)值越小,越趨近于0,說(shuō)明眾數(shù)所在組的頻數(shù)占總頻數(shù)的比率越高,眾數(shù)作為集中趨勢(shì)測(cè)度的代表性越強(qiáng)。fffffvroomm1vr10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 例例4.184.18 根據(jù)例4.1某品牌運(yùn)動(dòng)服裝專賣店一批新品球衣的銷售情況的頻數(shù)分布數(shù)據(jù)。 要求要求 試計(jì)算眾數(shù)“sp09-05”球衣的異眾比率。 解解 由式(4.19),有該新品球衣的前日和當(dāng)日銷售情況眾數(shù)的
37、“sp09-05”球衣的異眾比率分別為 前日銷售情況的異眾比率為45%,當(dāng)日銷售情況的異眾比率為48.33%,說(shuō)明這兩天眾數(shù)“sp09-05”球衣的銷售量都超過(guò)50%,表明在此場(chǎng)合使用眾數(shù)“sp09-05”球衣作為該批新款球衣集中趨勢(shì)的測(cè)度是比較有效的。%451607216088160vr%33.481808718093180vr10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 4.2.2 四分位差 四分位差(quartile deviation)為上四分位數(shù)與下四分位數(shù)的絕對(duì)上四分位數(shù)與下四分位數(shù)的絕對(duì)離差離差,也稱為四分間距(inter-qua
38、rtile range),用表示。計(jì)算公式為 (4.20) 式(4.20)中的 和 分別為上四分位數(shù)與下四分位數(shù)。將原始數(shù)據(jù)按照由小到大,由低到高排序后得到的有序數(shù)據(jù)中,上四分位數(shù)是處在后四分之一位置上數(shù)據(jù)的數(shù)值;下四分位數(shù)是處在前四分之一位置上數(shù)據(jù)的數(shù)值。 所以,也可以將上四分位數(shù)與下四分位數(shù)理解為是在計(jì)算了中位數(shù)的基礎(chǔ)上,將排序后的有序數(shù)據(jù)分為了大于和小于中位數(shù)的兩個(gè)部分,然后再在這兩個(gè)部分中分別計(jì)算出來(lái)的中位數(shù)。四分位差反映了處在有序數(shù)據(jù)中間位置上的50%的數(shù)據(jù)的絕對(duì)離差。因此,四分位差是與中位數(shù)四分位差是與中位數(shù)相聯(lián)系的離散程度測(cè)度。相聯(lián)系的離散程度測(cè)度。ludqqquqlq10:17
39、 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 例例4.194.19 仍采用例4.4中某學(xué)期某班35名學(xué)生考試成績(jī)的原始數(shù)據(jù)。 要求要求 試計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的四分位差。 解解 有上四分位數(shù)與下四分位數(shù)的計(jì)算公式為 解得 52,56,62,64,65,69,70,74,7575,75,76,78,78,79,79,81,82,8282,83,84,84,84,84,86,87,87,8888,89,89,90,91,91,92,96,98 即可計(jì)算出考試成績(jī)的四分位差為 該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的四分位差為13分,說(shuō)明處在中間位置上的
40、一半該班同學(xué)的分?jǐn)?shù)最大差距為13分,這一差異數(shù)值較小,表明82分的中位數(shù)對(duì)于集中趨勢(shì)的代表性較好。413nuxq41nlxq分88uq分75lq分137588dq10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 4.2.3 取值范圍 取值范圍(value area)為全體數(shù)據(jù)中最大數(shù)值與最小數(shù)值之差,反映了數(shù)值變量取值的變動(dòng)幅度。取值范圍也稱為全距,一般用 r 表示,有 (4.20) 當(dāng)使用樣本數(shù)據(jù)的最大數(shù)值與最小數(shù)值之差,來(lái)計(jì)算該組樣本數(shù)值變量取值區(qū)間,以反映總體變量取值的變動(dòng)幅度時(shí),一般稱之為極差(range),用表示。即 (4.21) xmi
41、nxmaxr xminxmaxr10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 例例4.204.20 某企業(yè)一車間甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量件數(shù)數(shù)據(jù)如下 甲組:50,55,60,70,80,85,90 乙組:67,68,69,70,71,72,73 要求要求 試計(jì)算該車間甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量的取值范圍。 解解 甲乙兩個(gè)生產(chǎn)小組的均值都為70件,采用式(4.20),有 甲組: 乙組: 甲組的取值范圍為40件,乙組的取值范圍為6件,表明70件的均值對(duì)于乙組個(gè)人日產(chǎn)量的集中趨勢(shì)更具有代表性,或者說(shuō)乙組個(gè)人日產(chǎn)量的離散程度小,集中趨勢(shì)更為顯著。
42、 取值范圍的計(jì)算只使用了數(shù)值變量中的最大與最小兩個(gè)數(shù)值,具有計(jì)算簡(jiǎn)潔,意義明確,易于理解的特點(diǎn),但是沒(méi)有充分利用數(shù)據(jù)的全部信息,是一個(gè)粗略的,簡(jiǎn)單的,尤其是容易受到極端數(shù)值影響的測(cè)度。(件)405090r(件)66773r10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 4.2.4 平均差 平均差(mean deviation)是指全部變量值與其均值的離差的絕對(duì)值的均值,也稱為平均離差,用a.d.表示。 簡(jiǎn)單平均差計(jì)算公式為: (4.22) 加權(quán)平均差計(jì)算公式為: (4.23) nxxda.ffxxda.10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的
43、度量 4.2 4.2 離散程度的度量離散程度的度量 例例4.21 4.21 仍然采用例4.20中甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量件數(shù)數(shù)據(jù)。 要求要求 試計(jì)算該該車間甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量的平均差。 解解 已知均值為70件,由式(4.22) 表4.10 甲乙小組的個(gè)人日產(chǎn)量的平均差計(jì)算表 件 甲組: 乙組: 平均差測(cè)度同樣表明乙組個(gè)人日產(chǎn)量的離散程度小,70件的個(gè)人日產(chǎn)量均值對(duì)于乙組的集中趨勢(shì)更具有代表性。甲組乙組甲組乙組506720355681526069101707000807110185721529073203 9012個(gè)人日產(chǎn)量 xx 件86.12790.da件71. 1712.da1
44、0:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 4.2.5 方差和標(biāo)準(zhǔn)差 方差(variance)是指全部變量值與其均值的離差的平方的均值。 方差以數(shù)據(jù)的重心均值作為基準(zhǔn)數(shù)值來(lái)度量數(shù)據(jù)分布的離散程度,同時(shí)用平方的方式消除了變量值與均值離差數(shù)值正負(fù)相抵的問(wèn)題,便于數(shù)學(xué)上的處理,方差是正態(tài)分布等概率分布的重要參數(shù),是度量數(shù)值變量離散程度的基本測(cè)度。方差一般用 或 表示。 根據(jù)所擁有的數(shù)值變量數(shù)據(jù)的形式不同,方差的計(jì)算可以分為以下幾種方式。1簡(jiǎn)單方差計(jì)算公式 當(dāng)擁有未分組的數(shù)據(jù)時(shí),采用簡(jiǎn)單方差公式計(jì)算方差。 (4.24)nxx22)(2 xv10:17
45、pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 例例4.234.23 再次仍然采用例4.20中某企業(yè)一車間甲乙兩個(gè)生產(chǎn)小組的個(gè) 人日產(chǎn)量件數(shù)數(shù)據(jù),并已知均值為70件。 要求要求 試計(jì)算該甲乙兩個(gè)生產(chǎn)小組個(gè)人日產(chǎn)量的方差。 解解 由式(4.24)有 表4.12 甲乙小組的個(gè)人日產(chǎn)量的方差計(jì)算表 件甲組: 乙組: 甲組乙組甲組乙組506740095568225460691001707000807110018572225490734009490490145028個(gè)人日產(chǎn)量 2xx 2214.20771450件224728件10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征
46、的度量 4.2 4.2 離散程度的度量離散程度的度量 2加權(quán)方差計(jì)算公式 當(dāng)只具備已分組數(shù)據(jù)時(shí),需要采用加權(quán)方差公式計(jì)算方差。(1)當(dāng)擁有單變量值分組數(shù)據(jù)時(shí),加權(quán)方差計(jì)算公式為: (4.25) 例例4.244.24 根據(jù)例4.7中某機(jī)床總裝車間10個(gè)裝配小組日完成產(chǎn)品臺(tái)數(shù)數(shù)據(jù),并已知均值為6.8臺(tái)。 要求要求 計(jì)算該機(jī)床總裝車間裝配小組日完成產(chǎn)品臺(tái)數(shù)的方差。 解解 由式(4.25) ffxx22)(2276. 0106 . 7臺(tái)10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 (2)當(dāng)擁有的數(shù)據(jù)為具有組均值的組距分組時(shí),加權(quán)方差計(jì)算公式為: (4.26) 式(4.26)中是采用各組的組均值與總
47、體均值的離差的加權(quán)均值來(lái)反映數(shù)據(jù)分布的離散程度。存在著一個(gè)各組的組均值與各組中各個(gè)變量的實(shí)際取值之間的差異,只有在各個(gè)變量的實(shí)際取值等于各組的組均值時(shí),式(4.26)才等于式(4.25);當(dāng)這兩者的差距越大,式(4.26)與式(4.25)之間的差距也就越大,并且有式(4.26)計(jì)算的數(shù)值小于式(4.25) 計(jì)算的數(shù)值。式(4.25)是與方差的定義一致的測(cè)度,而式(4.26)只是式(4.25)近似計(jì)算。4.2 4.2 離散程度的度量離散程度的度量 hjjhjjjffxx112210:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 (3) 當(dāng)擁有的數(shù)據(jù)為不
48、具有組均值的組距分組時(shí),需要采用組中值近似地替代組均值計(jì)算加權(quán)方差,這時(shí)計(jì)算公式為 (4.27) 式(4.27)不僅存在式(4.26) 以各組的組均值近似替代各組中各個(gè)變量的實(shí)際取值所產(chǎn)生的誤差,而且還存在以各組的組中值近似替代各組的組均值所產(chǎn)生的誤差。所以式(4.27)也只能是對(duì)式(4.25)近似計(jì)算。hjjhjjjffxx112210:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 3標(biāo)準(zhǔn)差 由于方差的量綱是變量原有量綱的平方,在實(shí)際使用時(shí)有所不便。因此,人們常常采用具有與變量一致的量綱的測(cè)度,方差的算術(shù)平方根標(biāo)準(zhǔn)差。 標(biāo)準(zhǔn)差(standard d
49、eviation)為方差的算術(shù)平方根,即全部變量值與其均值的離差的平方的均值的算術(shù)平方根。有簡(jiǎn)單標(biāo)準(zhǔn)差計(jì)算公式和加權(quán)標(biāo)準(zhǔn)差計(jì)算公式。 (4.28) (4.29)nxx2)(ffxx2)(10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 4.2.6 離散系數(shù) 離散系數(shù)(coefficient of variation)為同一總體的標(biāo)準(zhǔn)差與均值的比值。 通過(guò)采用標(biāo)準(zhǔn)差除以同一數(shù)據(jù)的均值,不僅將分子分母量綱相同相互約去,同時(shí)還剔除了均值數(shù)值水平,得到了一個(gè)沒(méi)有量綱的相對(duì)數(shù)測(cè)度,這就是離散系數(shù)。計(jì)算離散系數(shù)的主要目的就是消除標(biāo)準(zhǔn)差的量綱和數(shù)值水平上的差異,
50、使其成為一個(gè)抽象的,純粹反映數(shù)據(jù)分布離散程度的測(cè)度,一個(gè)具有廣泛的直接的可比性的離散程度測(cè)度。從形式上看,離散系數(shù)是一個(gè)相對(duì)的比值,一個(gè)相對(duì)數(shù)。 離散系數(shù)的計(jì)算公式為: (4.30) 離散系數(shù)一般用百分?jǐn)?shù)表示。xv10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 例例4.264.26 已知某公司a、b兩種產(chǎn)品2005年的日產(chǎn)量及其標(biāo)準(zhǔn)差數(shù)據(jù)。 要求要求 試計(jì)算a、b兩種產(chǎn)品2005年的日產(chǎn)量的離散系數(shù),對(duì)該公司a、b兩種產(chǎn)品生產(chǎn)過(guò)程的均衡性進(jìn)行比較分析。 解解 采用式(4.30),有表4.15 2005年某公司產(chǎn)品的日產(chǎn)量的離散系數(shù)計(jì)算表 由此例可
51、以看出,標(biāo)準(zhǔn)差的數(shù)值水平是由純粹的數(shù)據(jù)分布離散程度(可用離散系數(shù)表示),和數(shù)據(jù)分布集中趨勢(shì)的中心數(shù)值(一般用均值表示),這兩者共同作用的結(jié)果。例如,a產(chǎn)品日產(chǎn)量的標(biāo)準(zhǔn)差3噸,等于離散系數(shù)60%,乘上均值5噸。 產(chǎn)品均值 /噸標(biāo)準(zhǔn)差 /噸 離散系數(shù) /%a5360b8002403010:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 4.2.7 標(biāo)準(zhǔn)化值 標(biāo)準(zhǔn)化值(standard score)是以變量值與其均值的差除以同一數(shù)據(jù)的標(biāo)準(zhǔn)差的比值,也稱為標(biāo)準(zhǔn)分?jǐn)?shù),或z分?jǐn)?shù)。其計(jì)算公式為: (4.31) 標(biāo)準(zhǔn)化值的分子為第i個(gè)變量值與其均值的差,一般稱為數(shù)據(jù)的
52、中心化,表現(xiàn)為變量值與其均值的絕對(duì)距離。標(biāo)準(zhǔn)化值的分母為標(biāo)準(zhǔn)差,通過(guò)用標(biāo)準(zhǔn)差除以中心化后的數(shù)據(jù),來(lái)消除標(biāo)準(zhǔn)化值的量綱和絕對(duì)水平,剔除不同的數(shù)據(jù)分布離散程度在量綱和數(shù)值水平上的差異,使離散程度不同的數(shù)據(jù)之間具備了廣泛的可比性。使數(shù)據(jù)具有了普遍的可加性和直接的可比性。xxzii10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.2 4.2 離散程度的度量離散程度的度量 例例4.27 4.27 某中學(xué)有a、b兩位同學(xué)期末考試5門功課的考試成績(jī)?nèi)绫?.16所示。 要求要求 采用標(biāo)準(zhǔn)化值,對(duì)某中學(xué)a、b兩位同學(xué)考試成績(jī)進(jìn)行評(píng)價(jià)。 解解 根據(jù)式(4.31),計(jì)算出a、b兩位同學(xué)考試成績(jī)的標(biāo)準(zhǔn)化值總分。表
53、4.16 某中學(xué)a、b兩位同學(xué)期末考試成績(jī)的標(biāo)準(zhǔn)化值總分計(jì)算表均值 標(biāo)準(zhǔn)差ab/分/分abab數(shù)學(xué)908485105-10.50-0.10物理887882206-40.30-0.20化學(xué)668460306240.200.80語(yǔ)文7678652511130.440.52英語(yǔ)80807525550.200.20總分40040436733371.641.22考試科目原始成績(jī) /分離差 /分標(biāo)準(zhǔn)化值第4章 數(shù)據(jù)分布特征的度量 4.3 4.3 偏態(tài)和峰度的度量偏態(tài)和峰度的度量統(tǒng)計(jì)學(xué)教程盧小廣10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.3 4.3 偏態(tài)和峰度的度量偏態(tài)和峰度的度量 4.3.1 偏
54、態(tài)系數(shù) 偏態(tài)(skewness)是指數(shù)據(jù)分布偏倚的方向和程度。偏態(tài)系數(shù)是度量數(shù)據(jù)分布偏離對(duì)稱分布的方向和程度的測(cè)度。 偏態(tài)系數(shù)一般采用三階中心矩與標(biāo)準(zhǔn)差三次方的比值來(lái)度量數(shù)據(jù)分布三階中心矩與標(biāo)準(zhǔn)差三次方的比值來(lái)度量數(shù)據(jù)分布的偏倚的偏倚。有簡(jiǎn)單偏態(tài)系數(shù)計(jì)算公式為 (4.32) 加權(quán)偏態(tài)系數(shù)計(jì)算公式為 (4.33)nxxsk33ffxxsk3310:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.3 4.3 偏態(tài)和峰度的度量偏態(tài)和峰度的度量 偏態(tài)系數(shù)采用標(biāo)準(zhǔn)差的三次方數(shù)值去除三階中心矩,消除三階中心矩在具體量綱和均值水平上的不可比性質(zhì),構(gòu)造出一個(gè)具有廣泛可比性質(zhì)的度量數(shù)據(jù)分布的偏倚的方向和程度的綜合測(cè)度。 圖4.4 數(shù)據(jù)分布偏態(tài)的示意圖 偏態(tài)系數(shù)的取值為0時(shí),表示數(shù)據(jù)為完全的對(duì)稱分布;為負(fù)數(shù)時(shí),表示數(shù)據(jù)為負(fù)偏態(tài),或左偏態(tài);偏態(tài)系數(shù)的取值為正數(shù)數(shù)時(shí),表示數(shù)據(jù)為正偏態(tài),或右偏態(tài)。偏態(tài)系數(shù)的絕對(duì)數(shù)值越小,表示數(shù)據(jù)偏倚的程度越小,絕對(duì)數(shù)值越大,表示數(shù)據(jù)偏倚的程度越大。10:17 pm統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的度量 4.3 4.3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024蘋果產(chǎn)業(yè)鏈金融風(fēng)險(xiǎn)防控合作協(xié)議3篇
- 2025年度林地林木種植與生態(tài)修復(fù)合同2篇
- 2024食堂食材的采購(gòu)合同協(xié)議
- 2025賓館客房銷售數(shù)據(jù)共享與處理合同模板3篇
- 2025年度特色美食研發(fā)與酒店合作合同3篇
- 2025年度豬欄工程總承包及生態(tài)環(huán)保合同4篇
- 2025年度智能家居與安防系統(tǒng)一體化合同2篇
- 2025年4-甲基咪唑項(xiàng)目可行性研究報(bào)告
- 2025個(gè)人收藏品交易合同參考樣本4篇
- 電線電纜加工質(zhì)量控制流程
- 山東省淄博市張店區(qū)祥瑞園小學(xué)?-2024-2025年第一學(xué)期一年級(jí)班主任經(jīng)驗(yàn)分享(著眼于愛(ài) 著手于細(xì))【課件】
- 提優(yōu)精練08-2023-2024學(xué)年九年級(jí)英語(yǔ)上學(xué)期完形填空與閱讀理解提優(yōu)精練(原卷版)
- DB4511T 0002-2023 瓶裝液化石油氣充裝、配送安全管理規(guī)范
- 企業(yè)內(nèi)部客供物料管理辦法
- 婦科臨床葡萄胎課件
- 三基三嚴(yán)練習(xí)題庫(kù)與答案
- 傳媒行業(yè)突發(fā)事件應(yīng)急預(yù)案
- 債務(wù)抵租金協(xié)議書范文范本
- 藥學(xué)技能競(jìng)賽標(biāo)準(zhǔn)答案與評(píng)分細(xì)則處方
- 2025屆高考英語(yǔ) 716個(gè)閱讀理解高頻詞清單
評(píng)論
0/150
提交評(píng)論