




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)學(xué)原理第四章第1頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量4.2.5方差和標(biāo)準(zhǔn)差
4.1.1眾數(shù)4.2.6離散系數(shù)
4.1.2中位數(shù)4.2.7標(biāo)準(zhǔn)化值
4.1.3均值
4.1.4調(diào)和平均數(shù)
4.1.5幾何平均數(shù)4.3偏態(tài)和峰度的度量
4.1.6均值、眾數(shù)和中位數(shù)的比較4.3.1偏態(tài)系數(shù)
4.1.7均值、眾數(shù)和中位數(shù)的比較4.3.2峰度系數(shù)4.2離散程度的度量
4.2.1異眾比率
4.2.3取值范圍
4.2.4平均差第2頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
原始數(shù)據(jù)經(jīng)過(guò)分組整理所形成的頻數(shù)分布,直觀和概略地反映出數(shù)據(jù)分布的基本特征。頻數(shù)分布屬于對(duì)數(shù)據(jù)分布特征的初步描述,缺乏對(duì)數(shù)據(jù)分布特征的綜合度量,若需要深入地表述數(shù)據(jù)分布特征的具體特征和內(nèi)在聯(lián)系,還應(yīng)對(duì)數(shù)據(jù)分布特征進(jìn)行綜合性的度量。數(shù)據(jù)分布特征的度量包括三個(gè)方面的內(nèi)容,一是數(shù)據(jù)分布的集中趨勢(shì),反映總體中各個(gè)單位的數(shù)值水平向其聚集,或者集中的中心數(shù)值;二是數(shù)據(jù)分布的離散趨勢(shì),反映總體中各個(gè)單位的數(shù)值水平偏離中心數(shù)值的綜合程度;三是數(shù)據(jù)分布的偏態(tài)和峰度,反映各個(gè)總體單位的數(shù)值水平的分布形態(tài)是對(duì)稱或偏倚,平坦或尖聳的具體數(shù)值。
第3頁(yè),共132頁(yè),2023年,2月20日,星期六4.1集中趨勢(shì)的度量第4頁(yè),共132頁(yè),2023年,2月20日,星期六集中趨勢(shì)(CentralTendency)是指一組數(shù)據(jù)所趨向的中心數(shù)值。對(duì)集中趨勢(shì)的度量就是采用具體的統(tǒng)計(jì)方法和統(tǒng)計(jì)測(cè)度對(duì)這一中心數(shù)值的測(cè)量和計(jì)量,以一綜合數(shù)值來(lái)表述數(shù)據(jù)所趨向的這一中心數(shù)值的一般水平。第5頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量4.1.1眾數(shù)
眾數(shù)(Mode)是一組數(shù)據(jù)中頻數(shù)最大的變量值,直觀地反映了數(shù)據(jù)的集中趨勢(shì)。眾數(shù)是度量定類數(shù)據(jù)集中趨勢(shì)的測(cè)度,一般用表示。例4.1某品牌運(yùn)動(dòng)服裝專賣店一批新品球衣銷售情況如下表4.1某專賣店新品球衣銷售情況件第6頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量4.1.1眾數(shù)
眾數(shù)(Mode)是一組數(shù)據(jù)中頻數(shù)最大的變量值,直觀地反映了數(shù)據(jù)的集中趨勢(shì)。眾數(shù)是度量定類數(shù)據(jù)集中趨勢(shì)的測(cè)度,一般用表示。
例4.1某品牌運(yùn)動(dòng)服裝專賣店一批新品球衣銷售情況如下表4.1某專賣店新品球衣銷售情況件第7頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.2利用第三章中例3.1中某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。要求試計(jì)算計(jì)算該班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的眾數(shù)。解將該原始數(shù)據(jù)排序之后,得到有序數(shù)據(jù)如下52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,98
第8頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.2利用第三章中例3.1中某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。要求試計(jì)算計(jì)算該班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的眾數(shù)。解將該原始數(shù)據(jù)排序之后,得到有序數(shù)據(jù)如下52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,9884分在這35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)中出現(xiàn)了4次,屬于出現(xiàn)次數(shù)最多的變量值,根據(jù)眾數(shù)定義,可以確定眾數(shù)為84分,即第9頁(yè),共132頁(yè),2023年,2月20日,星期六2012-03-16(ZhouwuShangwuJDC)第10頁(yè),共132頁(yè),2023年,2月20日,星期六2012-03-16(ZhouwuWanJDC)第11頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
利用已經(jīng)分組的數(shù)值型數(shù)據(jù)計(jì)算眾數(shù)的場(chǎng)合,需要運(yùn)用插值公式來(lái)計(jì)算眾數(shù)的近似數(shù)值。眾數(shù)的插值公式有下限公式和上限公式。其下限公式從眾數(shù)所在組的下限出發(fā),有
(4.1)上限公式則從眾數(shù)所在組的上限出發(fā),有(4.2)
第12頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
第13頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
第14頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
第15頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
第16頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
第17頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
第18頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
例4.3表4.2為第三章中表3.7“某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)”中的部分?jǐn)?shù)據(jù)。根據(jù)表4.2的已經(jīng)分組的數(shù)值型數(shù)據(jù),計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)眾數(shù)的近似數(shù)值。表4.2某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)第19頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量通過(guò)上限公式或下限公式的計(jì)算眾數(shù)所得到的計(jì)算結(jié)果是一致的。眾數(shù)是一個(gè)通過(guò)數(shù)據(jù)中頻數(shù)最大的數(shù)據(jù)的數(shù)值來(lái)反映集中趨勢(shì)的測(cè)度,為一位置型的代表數(shù)值,所以眾數(shù)的取值不受極端數(shù)值的影響,也不受組距分組中開(kāi)口組設(shè)置的影響。當(dāng)數(shù)值型數(shù)據(jù)中含有極小值和極大值時(shí),使用眾數(shù)來(lái)度量數(shù)據(jù)的集中趨勢(shì),可以作為其它集中趨勢(shì)測(cè)度的補(bǔ)充。眾數(shù)是一個(gè)適用于最低層次的定類數(shù)據(jù)的測(cè)度,因此可以用于各種量表數(shù)據(jù)的集中趨勢(shì)分析,有效使用眾數(shù)的前提是數(shù)據(jù)的頻數(shù)分布存在明顯的集中態(tài)勢(shì)。
第20頁(yè),共132頁(yè),2023年,2月20日,星期六眾數(shù)主要適合于作為分類數(shù)據(jù)的集中趨勢(shì)測(cè)度值。也可運(yùn)用于定序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)??赡懿晃ㄒ?。第21頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
4.1.2中位數(shù)
中位數(shù)(Median)是位于有序數(shù)據(jù)正中間位置上的變量值,中位數(shù)用其特殊的位置屬性直接地體現(xiàn)了集中趨勢(shì)的中心數(shù)值特征。中位數(shù)是度量定序數(shù)據(jù)集中趨勢(shì)的測(cè)度,一般用表示。中位數(shù)也是一種位置型的代表數(shù)值,同時(shí)中位數(shù)還是一種順序統(tǒng)計(jì)量,因此,計(jì)算中位數(shù)要求數(shù)值至少具備定序數(shù)據(jù)的性質(zhì)。中位數(shù)一旦確定,就可以根據(jù)中位數(shù)的具體取值,將全部數(shù)據(jù)分成數(shù)量相等的兩個(gè)部分,一半數(shù)據(jù)的數(shù)值小于或等于中位數(shù);另一半數(shù)據(jù)的數(shù)值大于或等于中位數(shù)。由此可得出中位數(shù)的計(jì)算公式。當(dāng)數(shù)據(jù)的個(gè)數(shù)為奇數(shù)時(shí),有(4.3)當(dāng)數(shù)據(jù)的個(gè)數(shù)為偶數(shù)時(shí),有
(4.4)
第22頁(yè),共132頁(yè),2023年,2月20日,星期六中位數(shù)的性質(zhì)第23頁(yè),共132頁(yè),2023年,2月20日,星期六【課后作業(yè)】證明:中位數(shù)的性質(zhì)第24頁(yè),共132頁(yè),2023年,2月20日,星期六中位數(shù)是度量定序數(shù)據(jù)集中趨勢(shì)的測(cè)度,根據(jù)計(jì)量尺度的向上兼容性質(zhì),中位數(shù)也可以用于度量比它量表層次更高的數(shù)值型數(shù)據(jù)的集中趨勢(shì)。但不能度量定類數(shù)據(jù)的集中趨勢(shì)。第25頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.4仍然采用第三章中例3.1某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。要求試計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的中位數(shù)。解將原始數(shù)據(jù)排序之后,得到以下有序數(shù)據(jù)52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,98該組數(shù)據(jù)的個(gè)數(shù)為35,因此采用式(4.3)計(jì)算,排列在該組有序數(shù)據(jù)第18位上的變量值為82分,該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的中位數(shù)為82分。即第26頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
利用已經(jīng)分組的數(shù)值型數(shù)據(jù)計(jì)算中位數(shù)時(shí),需要運(yùn)用插值公式計(jì)算中位數(shù)的近似數(shù)值。中位數(shù)的插值公式也有下限公式和上限公式。其下限公式從中位數(shù)所在組的下限出發(fā),為
上限公式從中位數(shù)所在組的上限出發(fā),為
4.1集中趨勢(shì)的度量第27頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.5表4.3為第三章“表3.7某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)”中的部分資料,為已經(jīng)分組的數(shù)值型數(shù)據(jù)。要求根據(jù)表4.3數(shù)據(jù),計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的中位數(shù)。解運(yùn)用插值公式計(jì)算該班學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)中位數(shù)的近似數(shù)值。表4.3某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)第28頁(yè),共132頁(yè),2023年,2月20日,星期六顯然,我們可以任選上限公式或下限公式來(lái)計(jì)算中位數(shù),得到結(jié)果是相同的。中位數(shù)是一個(gè)順序統(tǒng)計(jì)量,其取值不受極端數(shù)值的影響,也不受組距分組中開(kāi)口組設(shè)置的影響。當(dāng)數(shù)值型數(shù)據(jù)中含有極小值和極大值時(shí),可以使用中位數(shù)來(lái)度量數(shù)據(jù)的集中趨勢(shì)。中位數(shù)一般適用于定序數(shù)據(jù)。不太適用于偏態(tài)的數(shù)據(jù)。第29頁(yè),共132頁(yè),2023年,2月20日,星期六4.1.3均值
均值(Mean)為一組數(shù)值型數(shù)據(jù)之和除以該組數(shù)據(jù)總數(shù)的商,即同一組數(shù)據(jù)的總值與其頻數(shù)的商。在大多數(shù)場(chǎng)合,均值采用算術(shù)平均方法計(jì)算,所以人們經(jīng)常將均值稱為算術(shù)平均數(shù)(ArithmeticalAverage)。第30頁(yè),共132頁(yè),2023年,2月20日,星期六計(jì)算均值的數(shù)據(jù)需要具備數(shù)值型數(shù)據(jù)的屬性,均值是一個(gè)數(shù)值型的集中趨勢(shì)測(cè)度。通過(guò)計(jì)算均值的運(yùn)算過(guò)程,首先將各個(gè)數(shù)據(jù)之間的數(shù)量差異抽象掉了,以一個(gè)抽象性的綜合測(cè)度概括地反映事物的集中趨勢(shì)。其次將不同總體的總量規(guī)模抽象掉了,表現(xiàn)出來(lái)的只是一個(gè)一般性的代表水平,有利于不同規(guī)模的同類總體在不同空間和時(shí)間上的廣泛比較。第31頁(yè),共132頁(yè),2023年,2月20日,星期六均值在各個(gè)方面得到廣泛應(yīng)用。均值屬于參數(shù)統(tǒng)計(jì)的內(nèi)容,只能用做數(shù)值型數(shù)據(jù)集中趨勢(shì)的測(cè)度,不能度量非數(shù)值型數(shù)據(jù)的集中趨勢(shì)。第32頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量1.簡(jiǎn)單均值
簡(jiǎn)單均值(SimpleMean)是根據(jù)未分組的原始數(shù)據(jù)計(jì)算出來(lái)的均值。有
(4.7)
例4.6仍采用第三章中例3.1某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)要求試計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的均值。解采用式(4.7)計(jì)算,有
第33頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量2.加權(quán)均值
加權(quán)均值(WeightedMean)是運(yùn)用各組頻數(shù)作為權(quán)數(shù)對(duì)各組數(shù)值水平進(jìn)行加權(quán)計(jì)算出來(lái)的均值。根據(jù)是單變量值分組還是組距分組,以及組距分組的各組數(shù)值水平代表數(shù)據(jù)是組均值還是組中值,加權(quán)均值的計(jì)算分為以下三種類型。(1)單變量值分組加權(quán)均值在單變量值分組場(chǎng)合,加權(quán)均值的計(jì)算公式為(4.8)第34頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
例4.7某機(jī)床總裝車間10個(gè)裝配小組日完成產(chǎn)品臺(tái)數(shù)情況,計(jì)算單變量值分組加權(quán)均值。表4.4某機(jī)床總裝車間10個(gè)裝配小組日完成產(chǎn)品臺(tái)數(shù)情況要求試計(jì)算單變量值分組加權(quán)均值。解采用式(4.8)計(jì)算,可得第35頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量(2)采用組均值計(jì)算加權(quán)均值在組距分組中,采用組均值計(jì)算加權(quán)均值時(shí),計(jì)算公式為(4.9)式(4.9)中表示第j組的組均值。
第36頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.8
采用第三章中例3.1的各組均值數(shù)據(jù)。要求試計(jì)算組距分組的該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的加權(quán)均值。解依據(jù)各組中的數(shù)據(jù)數(shù)值和數(shù)據(jù)個(gè)數(shù),按照式(4.7)的均值計(jì)算公式,計(jì)算出各組的組均值,填入表4.5中。表4.5某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的組均值和頻數(shù)第37頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量(3)采用組中值計(jì)算加權(quán)均值在不占有原始數(shù)據(jù)和組均值數(shù)值,只擁有已分組的數(shù)據(jù)時(shí),只有利用各組組中值采用加權(quán)的方式計(jì)算均值的近似數(shù)值。利用組中值計(jì)算均值近似值的公式為(4.10)式(4.10)中表示第j組的組中值。
第38頁(yè),共132頁(yè),2023年,2月20日,星期六采用組中值計(jì)算加權(quán)均值的前提條件:各組數(shù)據(jù)近似地趨于均勻分布或?qū)ΨQ分布,各組的組中值近似于各組的組均值。當(dāng)各組數(shù)據(jù)顯著地不趨于均勻分布或?qū)ΨQ分布時(shí),各組的組中值與各組的組均值就會(huì)存在較大差異,兩者數(shù)值水平相差越大,采用組中值替代組均值的誤差就越大。第39頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
例4.9
根據(jù)第三章中表3.7中“某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)”的各組組中值和頻數(shù)數(shù)據(jù)。要求試采用組中值計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的加權(quán)均值。解采用式(4.10)計(jì)算。表4.6某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的組中值和頻數(shù)第40頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量3.權(quán)數(shù)【權(quán)重】與加權(quán)結(jié)構(gòu)對(duì)于加權(quán)均值而言,有兩個(gè)因素決定著均值數(shù)值的大小,一個(gè)因素是各組的數(shù)值水平,在不同場(chǎng)合,可以是單變量值、組均值或組中值;另一個(gè)因素是各組的頻數(shù)。頻數(shù)對(duì)各組的數(shù)值水平數(shù)值起著權(quán)衡輕重的作用,所以將加權(quán)均值的計(jì)算公式中頻數(shù)稱為“權(quán)數(shù)”。在均值的計(jì)算中又將頻數(shù)分布稱為“加權(quán)結(jié)構(gòu)”,“加權(quán)結(jié)構(gòu)”更加清晰地反映了數(shù)據(jù)在各組中的分布與集中趨勢(shì)之間的聯(lián)系,及其對(duì)均值數(shù)值水平形成的影響。將式(4.8)略加變形,有(4.11)第41頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量根據(jù)第三章中表3.7中“某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)”的各組組中值和頻數(shù)數(shù)據(jù),計(jì)算“加權(quán)結(jié)構(gòu)”和“組貢獻(xiàn)值”。某班35名學(xué)生統(tǒng)計(jì)學(xué)考試平均成績(jī)的“加權(quán)結(jié)構(gòu)”和“組貢獻(xiàn)值”考分/分組均值/分人數(shù)/人比例【頻率】【權(quán)重】/%組貢獻(xiàn)值/分60以下5425.7143.0960—7065411.4297.4370—8076925.71419.5480—90851440.00034.0090—10093617.14315.94合計(jì)—35100.00080.00第42頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量
均值的數(shù)學(xué)性質(zhì):(1)各個(gè)變量值與其均值的離差和為零,即(2)各個(gè)變量值與其均值平均數(shù)的離差平方和為最小,即當(dāng)取均值作為集中趨勢(shì)的測(cè)度時(shí),各個(gè)數(shù)據(jù)的取值與集中趨勢(shì)測(cè)度的離差平方和為最小值。均值的這一數(shù)學(xué)性質(zhì)是度量離散程度,進(jìn)行誤差分析和最小二乘估計(jì)等統(tǒng)計(jì)方法的基礎(chǔ)。第43頁(yè),共132頁(yè),2023年,2月20日,星期六第44頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量4.1.4調(diào)和平均數(shù)調(diào)和平均數(shù)(HarmonicMean)是各個(gè)變量數(shù)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。因此又稱之為“倒數(shù)平均數(shù)”。1.簡(jiǎn)單調(diào)和平均數(shù)設(shè)有個(gè)變量值為,則有簡(jiǎn)單調(diào)和平均數(shù)的計(jì)算公式為
(4.12)
第45頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.10設(shè)有12批A產(chǎn)品當(dāng)日在某海關(guān)進(jìn)口時(shí)報(bào)關(guān)的單價(jià)分別為每件25,24,25,27,26,25,24,28,26,25,26,28美元。要求試用調(diào)和平均數(shù)方法計(jì)算其平均價(jià)格。解由式(4.12)第46頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量2.加權(quán)調(diào)和平均數(shù)(1)單變量值分組的加權(quán)調(diào)和平均數(shù)在單變量值分組場(chǎng)合,加權(quán)均值的計(jì)算公式為(4.13)第47頁(yè),共132頁(yè),2023年,2月20日,星期六加權(quán)調(diào)和平均數(shù)第48頁(yè),共132頁(yè),2023年,2月20日,星期六(2)組距分組的加權(quán)調(diào)和平均數(shù)在組距分組場(chǎng)合,仍然根據(jù)是否擁有各組組均值數(shù)據(jù),加權(quán)調(diào)和平均數(shù)的計(jì)算分為兩種不同的方式。擁有各組組均值數(shù)據(jù)時(shí),采用各組組均值計(jì)算加權(quán)調(diào)和平均數(shù);不具有各組組均值數(shù)據(jù)時(shí),則需要采用各組組中值來(lái)計(jì)算加權(quán)調(diào)和平均數(shù)的近似數(shù)值。在現(xiàn)實(shí)生活中,實(shí)際使用到的僅是一種形式上類似調(diào)和平均數(shù)的“加權(quán)調(diào)和平均數(shù)”,它是均值的一種變形。第49頁(yè),共132頁(yè),2023年,2月20日,星期六組距分組的加權(quán)調(diào)和平均數(shù)(1)已知各組均值數(shù)據(jù)(2)已知各組組中值數(shù)據(jù)第50頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量3.均值的變形在擁有各組總值數(shù)據(jù)和各組變量值水平,缺少各組頻數(shù)數(shù)據(jù)時(shí),往往采用形式上類似加權(quán)調(diào)和平均數(shù)的公式,來(lái)計(jì)算加權(quán)均值。用M表示各組總值,用表示這一形式上類似加權(quán)調(diào)和平均數(shù)的集中趨勢(shì)測(cè)度,有
(4.14)由式(4.14)可知,這一所謂的形式上類似加權(quán)調(diào)和平均數(shù)的集中趨勢(shì)測(cè)度實(shí)際上就是均值,而不是調(diào)和平均數(shù)。第51頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
例4.12
已知某商店商品按照優(yōu)惠價(jià)、折扣價(jià)和原價(jià)的單價(jià)和銷售總額。要求試求銷售價(jià)格的均值。解由式(4.14)表4.8某商店W商品銷售情況
4.1集中趨勢(shì)的度量第52頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量4.1.5幾何平均數(shù)幾何平均數(shù)(GeometricMean)是指各項(xiàng)數(shù)據(jù)的連乘積開(kāi)其項(xiàng)數(shù)次方的算術(shù)根,一般用G表示。當(dāng)對(duì)象為某種連乘積的關(guān)系,例如總比率或總速度時(shí),則需要采用幾何平均數(shù)方法,計(jì)算其平均比率或平均速度。幾何平均數(shù)的計(jì)算公式也有簡(jiǎn)單幾何平均數(shù)加權(quán)幾何平均數(shù)和兩種形式:1.簡(jiǎn)單幾何平均數(shù)。計(jì)算公式為:(4.15)
第53頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.13某廠有四個(gè)連續(xù)作業(yè)車間,其產(chǎn)品的合格率分別為95%、96%、94%和90%。要求試計(jì)算該產(chǎn)品的平均合格率。解顯然,本題不能采用算術(shù)平均法或調(diào)和平均法,因?yàn)楦鬈囬g的合格率之積=全廠的總合格率,應(yīng)采用幾何平均法來(lái)計(jì)算其平均合格率。由式(4.15),有第54頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量2、加權(quán)幾何平均數(shù)。加權(quán)幾何平均數(shù)計(jì)算公式為:
(4.16)第55頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.14設(shè)某項(xiàng)每年分紅一次的投資項(xiàng)目,10年來(lái)各年的實(shí)際收益率分別為10%,9%,8%,8%,9%,8%,9%,7%,11%,10%。要求試求該項(xiàng)投資10年來(lái)的平均年收益率。解平均年收益率是一項(xiàng)平均增長(zhǎng)速度,需要由平均發(fā)展速度間接計(jì)算。因此需要將例4.14中的各年收益率數(shù)據(jù)(年增長(zhǎng)速度),換算成年本利和(年發(fā)展速度),利用式(4.15)計(jì)算出該項(xiàng)投資10年來(lái)的平均年本利率,最后將平均年本利率扣除本金后,計(jì)算出平均年收益率。即
第56頁(yè),共132頁(yè),2023年,2月20日,星期六例4.15將例4.14中該企業(yè)某項(xiàng)投資10年間收益率整理為單變量值分組數(shù)據(jù),試求該項(xiàng)投資10年間平均年收益率。按年收益率分組/%年本利率/%頻數(shù)/次X^F1111111.110001011021.21000910931.29503810831.25971710711.07000合計(jì)-102.34446第57頁(yè),共132頁(yè),2023年,2月20日,星期六根據(jù)式(4.16)計(jì)算,有第58頁(yè),共132頁(yè),2023年,2月20日,星期六2012-03-21(ZhousanShangwu)第59頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量3.對(duì)數(shù)均值將幾何平均數(shù)計(jì)算公式等號(hào)兩端同時(shí)取對(duì)數(shù),幾何平均數(shù)計(jì)算公式表現(xiàn)出類似均值計(jì)算公式的形式。所以,幾何平均數(shù)又被稱為對(duì)數(shù)均值,或?qū)?shù)平均數(shù)。由式(4.15)等號(hào)兩端同時(shí)取對(duì)數(shù),可得對(duì)數(shù)形式的簡(jiǎn)單幾何平均數(shù)計(jì)算公式。有(4.17)由式(4.16)等號(hào)兩端同時(shí)取對(duì)數(shù),可得對(duì)數(shù)形式的,具有類似加權(quán)均值計(jì)算公式形式的加權(quán)幾何平均數(shù)計(jì)算公式。有(4.18)第60頁(yè),共132頁(yè),2023年,2月20日,星期六4.1.6均值、調(diào)和平均數(shù)和幾何平均數(shù)的比較對(duì)于同一組數(shù)據(jù),僅從數(shù)值比較的角度,有均值大于等于幾何平均數(shù),幾何平均數(shù)大于等于調(diào)和平均數(shù),即第61頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.16有一組數(shù)據(jù)為4,5,6,7,8,6,7,8,9,8,請(qǐng)分別計(jì)算均值、調(diào)和平均數(shù)和幾何平均數(shù)。解:分別計(jì)算如下:
第62頁(yè),共132頁(yè),2023年,2月20日,星期六【課后作業(yè)】考慮對(duì)任意的自然數(shù)n,三個(gè)平均數(shù)之間的關(guān)系的證明。第63頁(yè),共132頁(yè),2023年,2月20日,星期六4.1.7均值、眾數(shù)和中位數(shù)的比較在均值、眾數(shù)和中位數(shù)這三個(gè)測(cè)度中,均值是唯一的數(shù)值型測(cè)度。均值一般采用算術(shù)平均方法計(jì)算的集中趨勢(shì)測(cè)度,對(duì)極端數(shù)值的反應(yīng)比較敏感,在數(shù)據(jù)的分布出現(xiàn)偏倚時(shí),均值受到的影響最大。眾數(shù)和中位數(shù)都是位置型的集中趨勢(shì)測(cè)度,其具體取值不受極端數(shù)值的影響。其中眾數(shù)是對(duì)應(yīng)于最大頻數(shù)的數(shù)值,中位數(shù)是居于有序數(shù)據(jù)中間位置上的數(shù)值。第64頁(yè),共132頁(yè),2023年,2月20日,星期六若數(shù)據(jù)的分布是對(duì)稱的,有均值、眾數(shù)和中位數(shù)三個(gè)集中趨勢(shì)測(cè)度的取值相等。第65頁(yè),共132頁(yè),2023年,2月20日,星期六圖4.1對(duì)稱分布第66頁(yè),共132頁(yè),2023年,2月20日,星期六一般而言,若數(shù)據(jù)的分布是非對(duì)稱的,眾數(shù)仍然處在數(shù)據(jù)分布的峰頂?shù)奈恢蒙?,均值和中位?shù)則偏向數(shù)據(jù)分布偏倚的一方,其中均值偏倚程度往往要大于中位數(shù)。第67頁(yè),共132頁(yè),2023年,2月20日,星期六當(dāng)數(shù)據(jù)分布呈左偏態(tài)時(shí),一般有均值的取值最小,其次是中位數(shù),眾數(shù)的取值最大。在頻數(shù)分布圖上,眾數(shù)始終對(duì)應(yīng)于峰頂,均值和中位數(shù)偏在峰頂?shù)淖筮?,均值又在中位?shù)左邊。第68頁(yè),共132頁(yè),2023年,2月20日,星期六圖4.2左偏分布第69頁(yè),共132頁(yè),2023年,2月20日,星期六當(dāng)數(shù)據(jù)分布呈右偏態(tài)時(shí),一般有均值的取值最大,其次是中位數(shù),眾數(shù)的取值最小。在頻數(shù)分布圖上,眾數(shù)還是處在對(duì)應(yīng)于峰頂?shù)奈恢?,均值和中位?shù)偏在峰頂?shù)挠疫?,并且均值偏在最右邊。?0頁(yè),共132頁(yè),2023年,2月20日,星期六圖4.3右偏分布第71頁(yè),共132頁(yè),2023年,2月20日,星期六根據(jù)均值、眾數(shù)和中位數(shù)之間的這種關(guān)系,通過(guò)比較這三個(gè)集中趨勢(shì)測(cè)度的具體取值,可以反映數(shù)據(jù)的分布狀態(tài),是否存在偏態(tài),是左偏態(tài)還是右偏態(tài),進(jìn)而粗略地把握偏態(tài)的大致程度。第72頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.1集中趨勢(shì)的度量例4.17根據(jù)第三章中例3.1某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)。要求計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的均值、眾數(shù)和中位數(shù),簡(jiǎn)要分析數(shù)據(jù)的分布狀況。解由該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)均值、眾數(shù)和中位數(shù)的具體取值,可得出三者之間的數(shù)值比較關(guān)系,有則認(rèn)為該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)呈左偏態(tài),偏倚的程度不是很大,從均值角度來(lái)說(shuō),該班高分(超過(guò)均值80分)的同學(xué)較多,超過(guò)了半數(shù)。因?yàn)榘捶謹(jǐn)?shù)排序處在正中間位置上同學(xué)的分?jǐn)?shù)為中位數(shù)82分,高于均值80分的水平。
第73頁(yè),共132頁(yè),2023年,2月20日,星期六2012-03-19(ZhouyiShangwu)第74頁(yè),共132頁(yè),2023年,2月20日,星期六4.2離散程度的度量第75頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量4.2.1異眾比率
異眾比率(VariationRatio)是非眾數(shù)所在組的頻數(shù)之和占總頻數(shù)的比率,一般用表示。(4.19)
異眾比率是用于評(píng)價(jià)眾數(shù)的代表性的測(cè)度。異眾比率取值在1到0之間,一般用百分?jǐn)?shù)表示。異眾比率數(shù)值越大,越趨近于1,說(shuō)明眾數(shù)所在組的頻數(shù)占總頻數(shù)的比率越低,眾數(shù)的代表性越弱,反映數(shù)據(jù)的頻數(shù)分布不存在顯著集中的態(tài)勢(shì),無(wú)法借助眾數(shù)來(lái)反映數(shù)據(jù)的集中趨勢(shì);異眾比率數(shù)值越小,越趨近于0,說(shuō)明眾數(shù)所在組的頻數(shù)占總頻數(shù)的比率越高,眾數(shù)作為集中趨勢(shì)測(cè)度的代表性越強(qiáng)。第76頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量
例4.18根據(jù)例4.1某品牌運(yùn)動(dòng)服裝專賣店一批新品球衣的銷售情況的頻數(shù)分布數(shù)據(jù)。要求試計(jì)算眾數(shù)“SP09-05”球衣的異眾比率。解由式(4.19),有該新品球衣的前日和當(dāng)日銷售情況眾數(shù)的“SP09-05”球衣的異眾比率分別為
前日銷售情況的異眾比率為45%,當(dāng)日銷售情況的異眾比率為48.33%,說(shuō)明這兩天眾數(shù)“SP09-05”球衣的銷售量都超過(guò)50%,表明在此場(chǎng)合使用眾數(shù)“SP09-05”球衣作為該批新款球衣集中趨勢(shì)的測(cè)度是比較有效的。第77頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量4.2.2四分位差四分位差(QuartileDeviation)為上四分位數(shù)與下四分位數(shù)的絕對(duì)離差,也稱為四分間距(Inter-QuartileRange),用表示。計(jì)算公式為(4.20)式(4.20)中的和分別為上四分位數(shù)與下四分位數(shù)。將原始數(shù)據(jù)按照由小到大,由低到高排序后得到的有序數(shù)據(jù)中,上四分位數(shù)是處在后四分之一位置上數(shù)據(jù)的數(shù)值;下四分位數(shù)是處在前四分之一位置上數(shù)據(jù)的數(shù)值。所以,也可以將上四分位數(shù)與下四分位數(shù)理解為是在計(jì)算了中位數(shù)的基礎(chǔ)上,將排序后的有序數(shù)據(jù)分為了大于和小于中位數(shù)的兩個(gè)部分,然后再在這兩個(gè)部分中分別計(jì)算出來(lái)的中位數(shù)。四分位差反映了處在有序數(shù)據(jù)中間位置上的50%的數(shù)據(jù)的絕對(duì)離差。因此,四分位差是與中位數(shù)相聯(lián)系的離散程度測(cè)度。第78頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.19仍采用例4.4中某學(xué)期某班35名學(xué)生考試成績(jī)的原始數(shù)據(jù)。要求試計(jì)算該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的四分位差。解有上四分位數(shù)與下四分位數(shù)的計(jì)算公式為
解得
52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,98即可計(jì)算出考試成績(jī)的四分位差為該班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的四分位差為13分,說(shuō)明處在中間位置上的一半該班同學(xué)的分?jǐn)?shù)最大差距為13分,這一差異數(shù)值較小,表明82分的中位數(shù)對(duì)于集中趨勢(shì)的代表性較好。第79頁(yè),共132頁(yè),2023年,2月20日,星期六四分位間距組距分組數(shù)據(jù)(1)全部數(shù)據(jù)的中位數(shù)ME1(2)數(shù)值較大部分的中位數(shù)ME2(3)數(shù)值較小部分的中位數(shù)ME3(4)四分位間距第80頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量4.2.3取值范圍【極差】【全距】取值范圍(ValueArea)為全體數(shù)據(jù)中最大數(shù)值與最小數(shù)值之差,反映了數(shù)值變量取值的變動(dòng)幅度。取值范圍也稱為全距,一般用R表示,有(4.20)當(dāng)使用樣本數(shù)據(jù)的最大數(shù)值與最小數(shù)值之差,來(lái)計(jì)算該組樣本數(shù)值變量取值區(qū)間,以反映總體變量取值的變動(dòng)幅度時(shí),一般稱之為極差(Range),用表示。即(4.21)
【修正極差】第81頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.20某企業(yè)一車間甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量件數(shù)數(shù)據(jù)如下甲組:50,55,60,70,80,85,90乙組:67,68,69,70,71,72,73要求試計(jì)算該車間甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量的取值范圍。解
甲乙兩個(gè)生產(chǎn)小組的均值都為70件,采用式(4.20),有甲組:乙組:甲組的取值范圍為40件,乙組的取值范圍為6件,表明70件的均值對(duì)于乙組個(gè)人日產(chǎn)量的集中趨勢(shì)更具有代表性,或者說(shuō)乙組個(gè)人日產(chǎn)量的離散程度小,集中趨勢(shì)更為顯著。取值范圍的計(jì)算只使用了數(shù)值變量中的最大與最小兩個(gè)數(shù)值,具有計(jì)算簡(jiǎn)潔,意義明確,易于理解的特點(diǎn),但是沒(méi)有充分利用數(shù)據(jù)的全部信息,是一個(gè)粗略的,簡(jiǎn)單的,尤其是容易受到極端數(shù)值影響的測(cè)度。第82頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量4.2.4平均差【平均偏差】【平均離差】
平均差(MeanDeviation)是指全部變量值與其均值的離差的絕對(duì)值的均值,也稱為平均離差,用A.D.表示。簡(jiǎn)單平均差計(jì)算公式為:
(4.22)加權(quán)平均差計(jì)算公式為:(4.23)
第83頁(yè),共132頁(yè),2023年,2月20日,星期六平均差(MeanDifference)第84頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.21仍然采用例4.20中的數(shù)據(jù)。要求試計(jì)算該該車間甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量的平均差。解已知均值為70件,由式(4.22)
表4.10甲乙小組的個(gè)人日產(chǎn)量的平均差計(jì)算表件甲組:乙組:平均差測(cè)度同樣表明乙組個(gè)人日產(chǎn)量的離散程度小,70件的個(gè)人日產(chǎn)量均值對(duì)于乙組的集中趨勢(shì)更具有代表性。第85頁(yè),共132頁(yè),2023年,2月20日,星期六例4.22采用例4.8中某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)成績(jī)的組均值和頻數(shù)數(shù)據(jù),并已知均值為80分。第86頁(yè),共132頁(yè),2023年,2月20日,星期六考分/分組均值/分人數(shù)/人60分以下5425260-706546070-807693680-9085147090-10093678合計(jì)—35296第87頁(yè),共132頁(yè),2023年,2月20日,星期六第88頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量4.2.5方差和標(biāo)準(zhǔn)差方差(Variance)是指全部變量值與其均值的離差的平方的均值。方差以數(shù)據(jù)的重心——均值作為基準(zhǔn)數(shù)值來(lái)度量數(shù)據(jù)分布的離散程度,同時(shí)用平方的方式消除了變量值與均值離差數(shù)值正負(fù)相抵的問(wèn)題,便于數(shù)學(xué)上的處理,方差是正態(tài)分布等概率分布的重要參數(shù),是度量數(shù)值變量離散程度的基本測(cè)度。方差一般用或表示。根據(jù)所擁有的數(shù)值變量數(shù)據(jù)的形式不同,方差的計(jì)算可以分為以下幾種方式。
1.簡(jiǎn)單方差計(jì)算公式當(dāng)擁有未分組的數(shù)據(jù)時(shí),采用簡(jiǎn)單方差公式計(jì)算方差。(4.24)第89頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.23再次仍然采用例4.20中某企業(yè)一車間甲乙兩個(gè)生產(chǎn)小組的個(gè)人日產(chǎn)量件數(shù)數(shù)據(jù),并已知均值為70件。要求試計(jì)算該甲乙兩個(gè)生產(chǎn)小組個(gè)人日產(chǎn)量的方差。解由式(4.24)有
表4.12甲乙小組的個(gè)人日產(chǎn)量的方差計(jì)算表件
甲組:乙組:
第90頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量2.加權(quán)方差計(jì)算公式當(dāng)只具備已分組數(shù)據(jù)時(shí),需要采用加權(quán)方差公式計(jì)算方差。(1)當(dāng)擁有單變量值分組數(shù)據(jù)時(shí),加權(quán)方差計(jì)算公式為:(4.25)
例4.24
根據(jù)例4.7中某機(jī)床總裝車間10個(gè)裝配小組日完成產(chǎn)品臺(tái)數(shù)數(shù)據(jù),并已知均值為6.8臺(tái)。要求計(jì)算該機(jī)床總裝車間裝配小組日完成產(chǎn)品臺(tái)數(shù)的方差。解由式(4.25)
第91頁(yè),共132頁(yè),2023年,2月20日,星期六日完成產(chǎn)品量/臺(tái)裝配小組/個(gè)513.24621.28750.2822.88合計(jì)107.6
/臺(tái)2第92頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
(2)當(dāng)擁有的數(shù)據(jù)為具有組均值的組距分組時(shí),加權(quán)方差計(jì)算公式為:
(4.26)式(4.26)中是采用各組的組均值與總體均值的離差的加權(quán)均值來(lái)反映數(shù)據(jù)分布的離散程度。存在著一個(gè)各組的組均值與各組中各個(gè)變量的實(shí)際取值之間的差異,只有在各個(gè)變量的實(shí)際取值等于各組的組均值時(shí),式(4.26)才等于式(4.25);當(dāng)這兩者的差距越大,式(4.26)與式(4.25)之間的差距也就越大,并且有式(4.26)計(jì)算的數(shù)值小于式(4.25)計(jì)算的數(shù)值。式(4.25)是與方差的定義一致的測(cè)度,而式(4.26)只是式(4.25)近似計(jì)算。
4.2離散程度的度量第93頁(yè),共132頁(yè),2023年,2月20日,星期六式(4.27)所計(jì)算的實(shí)質(zhì)是組間方差,或者稱為層間方差,它反映的只是各組(層)的組均值與總均值之間離差平方的均值,缺失了對(duì)于各組(層)內(nèi)部各個(gè)數(shù)據(jù)與其組均值之間離差平方的均值的度量。各組(層)內(nèi)部各個(gè)數(shù)據(jù)與其組均值之間離差平方稱為組內(nèi)方差,或者稱為層內(nèi)方差,它是對(duì)各組組內(nèi)變量離散程度的測(cè)度。因此式(4.27)僅為方差所定義的全部變量值與其均值的離差平方均值的一部分。第94頁(yè),共132頁(yè),2023年,2月20日,星期六例4.25采用例4.8的表4.5中某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的組均值和頻數(shù)數(shù)據(jù),并已知均值為80分。要求:計(jì)算該班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的加權(quán)方差。第95頁(yè),共132頁(yè),2023年,2月20日,星期六例4.25考分/分組均值/分人數(shù)/人60以下542135260—7065490070—8076914480—90851435090—1009361014合計(jì)—353760
第96頁(yè),共132頁(yè),2023年,2月20日,星期六第97頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量(3)當(dāng)擁有的數(shù)據(jù)為不具有組均值的組距分組時(shí),需要采用組中值近似地替代組均值計(jì)算加權(quán)方差,這時(shí)計(jì)算公式為
(4.27)式(4.27)不僅存在式(4.26)以各組的組均值近似替代各組中各個(gè)變量的實(shí)際取值所產(chǎn)生的誤差,而且還存在以各組的組中值近似替代各組的組均值所產(chǎn)生的誤差。所以式(4.27)也只能是對(duì)式(4.25)近似計(jì)算。第98頁(yè),共132頁(yè),2023年,2月20日,星期六【課后作業(yè)】利用例4.8的表4.5的數(shù)據(jù)以及式(4.28)計(jì)算某學(xué)期某班35名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的加權(quán)方差。第99頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量3.標(biāo)準(zhǔn)差由于方差的量綱是變量原有量綱的平方,在實(shí)際使用時(shí)有所不便。因此,人們常常采用具有與變量一致的量綱的測(cè)度,方差的算術(shù)平方根——標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差(StandardDeviation)為方差的算術(shù)平方根,即全部變量值與其均值的離差的平方的均值的算術(shù)平方根。有簡(jiǎn)單標(biāo)準(zhǔn)差計(jì)算公式和加權(quán)標(biāo)準(zhǔn)差計(jì)算公式。(4.28)(4.29)第100頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量4.2.6離散系數(shù)離散系數(shù)(CoefficientofVariation)為同一總體的標(biāo)準(zhǔn)差與均值的比值。通過(guò)采用標(biāo)準(zhǔn)差除以同一數(shù)據(jù)的均值,不僅將分子分母量綱相同相互約去,同時(shí)還剔除了均值數(shù)值水平,得到了一個(gè)沒(méi)有量綱的相對(duì)數(shù)測(cè)度,這就是離散系數(shù)。計(jì)算離散系數(shù)的主要目的就是消除標(biāo)準(zhǔn)差的量綱和數(shù)值水平上的差異,使其成為一個(gè)抽象的,純粹反映數(shù)據(jù)分布離散程度的測(cè)度,一個(gè)具有廣泛的直接的可比性的離散程度測(cè)度。從形式上看,離散系數(shù)是一個(gè)相對(duì)的比值,一個(gè)相對(duì)數(shù)。離散系數(shù)的計(jì)算公式為:
(4.30)離散系數(shù)一般用百分?jǐn)?shù)表示。第101頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.26已知某公司A、B兩種產(chǎn)品2005年的日產(chǎn)量及其標(biāo)準(zhǔn)差數(shù)據(jù)。要求試計(jì)算A、B兩種產(chǎn)品2005年的日產(chǎn)量的離散系數(shù),對(duì)該公司A、B兩種產(chǎn)品生產(chǎn)過(guò)程的均衡性進(jìn)行比較分析。解采用式(4.30),有表4.152005年某公司產(chǎn)品的日產(chǎn)量的離散系數(shù)計(jì)算表
由此例可以看出,標(biāo)準(zhǔn)差的數(shù)值水平是由純粹的數(shù)據(jù)分布離散程度(可用離散系數(shù)表示),和數(shù)據(jù)分布集中趨勢(shì)的中心數(shù)值(一般用均值表示),這兩者共同作用的結(jié)果。例如,A產(chǎn)品日產(chǎn)量的標(biāo)準(zhǔn)差3噸,等于離散系數(shù)60%,乘上均值5噸。
第102頁(yè),共132頁(yè),2023年,2月20日,星期六基于離散系數(shù),可以將兩個(gè)總體離散程度的比較分解為兩個(gè)總體標(biāo)準(zhǔn)差之比與兩個(gè)總體的均值之比的商。例如本例中A產(chǎn)品的離散程度為B產(chǎn)品離散程度的2倍,可以視為是由A產(chǎn)品的標(biāo)準(zhǔn)差為B產(chǎn)品標(biāo)準(zhǔn)差的1/80和A產(chǎn)品的均值為B產(chǎn)品均值的1/160,這兩個(gè)因素共同作用的結(jié)果。第103頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量4.2.7標(biāo)準(zhǔn)化值
標(biāo)準(zhǔn)化值(StandardScore)是以變量值與其均值的差除以同一數(shù)據(jù)的標(biāo)準(zhǔn)差的比值,也稱為標(biāo)準(zhǔn)分?jǐn)?shù),或Z分?jǐn)?shù)。其計(jì)算公式為:(4.31)標(biāo)準(zhǔn)化值的分子為第i個(gè)變量值與其均值的差,一般稱為數(shù)據(jù)的中心化,表現(xiàn)為變量值與其均值的絕對(duì)距離。標(biāo)準(zhǔn)化值的分母為標(biāo)準(zhǔn)差,通過(guò)用標(biāo)準(zhǔn)差除以中心化后的數(shù)據(jù),來(lái)消除標(biāo)準(zhǔn)化值的量綱和絕對(duì)水平,剔除不同的數(shù)據(jù)分布離散程度在量綱和數(shù)值水平上的差異,使離散程度不同的數(shù)據(jù)之間具備了廣泛的可比性。使數(shù)據(jù)具有了普遍的可加性和直接的可比性。第104頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.27某中學(xué)有A、B兩位同學(xué)期末考試5門功課的考試成績(jī)?nèi)绫?.16所示。要求采用標(biāo)準(zhǔn)化值,對(duì)某中學(xué)A、B兩位同學(xué)考試成績(jī)進(jìn)行評(píng)價(jià)。解根據(jù)式(4.31),計(jì)算出A、B兩位同學(xué)考試成績(jī)的標(biāo)準(zhǔn)化值總分。表4.16某中學(xué)A、B兩位同學(xué)期末考試成績(jī)的標(biāo)準(zhǔn)化值總分計(jì)算表第105頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.27某中學(xué)有A、B兩位同學(xué)期末考試5門功課的考試成績(jī)?nèi)绫?.16所示。要求采用標(biāo)準(zhǔn)化值,對(duì)某中學(xué)A、B兩位同學(xué)考試成績(jī)進(jìn)行評(píng)價(jià)。解根據(jù)式(4.31),計(jì)算出A、B兩位同學(xué)考試成績(jī)的標(biāo)準(zhǔn)化值總分。表4.16某中學(xué)A、B兩位同學(xué)期末考試成績(jī)的標(biāo)準(zhǔn)化值總分計(jì)算表第106頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.27某中學(xué)有A、B兩位同學(xué)期末考試5門功課的考試成績(jī)?nèi)绫?.16所示。要求采用標(biāo)準(zhǔn)化值,對(duì)某中學(xué)A、B兩位同學(xué)考試成績(jī)進(jìn)行評(píng)價(jià)。解根據(jù)式(4.31),計(jì)算出A、B兩位同學(xué)考試成績(jī)的標(biāo)準(zhǔn)化值總分。表4.16某中學(xué)A、B兩位同學(xué)期末考試成績(jī)的標(biāo)準(zhǔn)化值總分計(jì)算表第107頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.27某中學(xué)有A、B兩位同學(xué)期末考試5門功課的考試成績(jī)?nèi)绫?.16所示。要求采用標(biāo)準(zhǔn)化值,對(duì)某中學(xué)A、B兩位同學(xué)考試成績(jī)進(jìn)行評(píng)價(jià)。解根據(jù)式(4.31),計(jì)算出A、B兩位同學(xué)考試成績(jī)的標(biāo)準(zhǔn)化值總分。表4.16某中學(xué)A、B兩位同學(xué)期末考試成績(jī)的標(biāo)準(zhǔn)化值總分計(jì)算表第108頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.2離散程度的度量例4.27某中學(xué)有A、B兩位同學(xué)期末考試5門功課的考試成績(jī)?nèi)绫?.16所示。要求采用標(biāo)準(zhǔn)化值,對(duì)某中學(xué)A、B兩位同學(xué)考試成績(jī)進(jìn)行評(píng)價(jià)。解根據(jù)式(4.31),計(jì)算出A、B兩位同學(xué)考試成績(jī)的標(biāo)準(zhǔn)化值總分。表4.16某中學(xué)A、B兩位同學(xué)期末考試成績(jī)的標(biāo)準(zhǔn)化值總分計(jì)算表第109頁(yè),共132頁(yè),2023年,2月20日,星期六【標(biāo)準(zhǔn)分】語(yǔ)文高考原始分成績(jī)比較集中,標(biāo)準(zhǔn)差在11——15之間而數(shù)學(xué)、外語(yǔ)的標(biāo)準(zhǔn)差一般是在20——30之間,也就是說(shuō)如果考生的語(yǔ)文原始分能多得11——15分,標(biāo)準(zhǔn)分就要增加100分,而外語(yǔ)或數(shù)學(xué)的原始分要多得20——30分,標(biāo)準(zhǔn)分才能增加100分。顯然,語(yǔ)文原始分更“值錢”,適當(dāng)重視語(yǔ)文科的學(xué)習(xí),對(duì)于提高高考成績(jī)是相當(dāng)有效的。第110頁(yè),共132頁(yè),2023年,2月20日,星期六【課后作業(yè)】搜集關(guān)于高考分?jǐn)?shù)由原始分到標(biāo)準(zhǔn)分的操作過(guò)程第111頁(yè),共132頁(yè),2023年,2月20日,星期六4.3偏態(tài)和峰度的度量第112頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.3偏態(tài)和峰度的度量4.3.1偏態(tài)系數(shù)偏態(tài)(Skewness)是指數(shù)據(jù)分布偏倚的方向和程度。偏態(tài)系數(shù)是度量數(shù)據(jù)分布偏離對(duì)稱分布的方向和程度的測(cè)度。偏態(tài)系數(shù)一般采用三階中心矩與標(biāo)準(zhǔn)差三次方的比值來(lái)度量數(shù)據(jù)分布的偏倚。有簡(jiǎn)單偏態(tài)系數(shù)計(jì)算公式為(4.33)加權(quán)偏態(tài)系數(shù)計(jì)算公式為(4.34)第113頁(yè),共132頁(yè),2023年,2月20日,星期六《統(tǒng)計(jì)學(xué)教程》
第4章數(shù)據(jù)分布特征的度量
4.3偏態(tài)和峰度的度量偏態(tài)系數(shù)采用標(biāo)準(zhǔn)差的三次方數(shù)值去除三階中心矩,消除三階中心矩在具體量綱和均值水平上的不可比性質(zhì),構(gòu)造出一個(gè)具有廣泛可比性質(zhì)的度量數(shù)據(jù)分布的偏倚的方向和程度的綜合測(cè)度。圖4.4數(shù)據(jù)分布偏態(tài)的示意圖偏態(tài)系數(shù)的取值為0時(shí),表示數(shù)據(jù)為完全的對(duì)稱分布;為負(fù)數(shù)時(shí),表示數(shù)據(jù)為負(fù)偏態(tài),或左偏態(tài);偏態(tài)系數(shù)的取值為正數(shù)數(shù)時(shí),表示數(shù)據(jù)為正偏態(tài),或右偏態(tài)。偏態(tài)系數(shù)的絕對(duì)數(shù)值越小,表示數(shù)據(jù)偏倚的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 物聯(lián)網(wǎng)在推廣科學(xué)飲食中的作用展望
- 生產(chǎn)數(shù)據(jù)的采集、處理與價(jià)值挖掘研究
- 酒店應(yīng)急預(yù)案處理流程制度
- 裝潢承攬合同范本
- 煤礦掘進(jìn)班組長(zhǎng)職業(yè)技能理論考試題庫(kù)150題(含答案)
- 2025至2030年中國(guó)肛腸熏洗儀數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年度酒店安全免責(zé)協(xié)議書(shū)范本解析與操作指南
- 2025年度跨境電商平臺(tái)委托招商與市場(chǎng)拓展合同
- 二零二五年度綠色雞棚租賃協(xié)議書(shū)(含環(huán)保補(bǔ)貼)
- 2025年度綠色建筑租賃管理標(biāo)準(zhǔn)合同
- 《多樣的中國(guó)民間美術(shù)》課件 2024-2025學(xué)年人美版(2024)初中美術(shù)七年級(jí)下冊(cè)
- 家政講師培訓(xùn)課件
- 勞務(wù)合同協(xié)議書(shū)書(shū)
- 白城2025年吉林大安市事業(yè)單位面向上半年應(yīng)征入伍高校畢業(yè)生招聘5人筆試歷年參考題庫(kù)附帶答案詳解
- 全球人工智能產(chǎn)業(yè)發(fā)展現(xiàn)狀和趨勢(shì)
- 2025年市婦聯(lián)執(zhí)委會(huì)議上的工作報(bào)告
- 2025年內(nèi)蒙古化工職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 民法典解讀之婚姻家庭編
- 2025年菏澤醫(yī)學(xué)??茖W(xué)校高職單招數(shù)學(xué)歷年(2016-2024)頻考點(diǎn)試題含答案解析
- 口服降糖藥物分類詳解
- 2024年濰坊工程職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)完美版
評(píng)論
0/150
提交評(píng)論