數(shù)據(jù)分布特性描述_第1頁(yè)
數(shù)據(jù)分布特性描述_第2頁(yè)
數(shù)據(jù)分布特性描述_第3頁(yè)
數(shù)據(jù)分布特性描述_第4頁(yè)
數(shù)據(jù)分布特性描述_第5頁(yè)
已閱讀5頁(yè),還剩87頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)分布特性描述2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2本章重點(diǎn)與難點(diǎn)重點(diǎn):

了解和掌握算術(shù)平均數(shù)、眾數(shù)、中位數(shù)、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)分?jǐn)?shù)的含義及其計(jì)算方法;正確使用離散系數(shù)比較不同均值的代表性。難點(diǎn):

是偏度和峰度的含義及其計(jì)算方法。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組3學(xué)習(xí)目標(biāo)

正確理解平均指標(biāo)與變異指標(biāo)的概念的、意義與作用,明確其種類(lèi)和區(qū)別;掌握平均指標(biāo)和變異指標(biāo)的計(jì)算方法,以及應(yīng)用的原則和條件;掌握偏度和峰度的含義及其計(jì)算方法;了解各種分位數(shù)的概念與意義。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組4數(shù)據(jù)分布的特征:一、集中趨勢(shì):反映數(shù)據(jù)向其中心靠攏或聚集程度;二、離中趨勢(shì);數(shù)據(jù)遠(yuǎn)離中心的趨勢(shì)(又稱(chēng)離散程度);三、偏態(tài)和峰態(tài);偏態(tài)是對(duì)數(shù)據(jù)分布對(duì)稱(chēng)性的度量;峰度是指數(shù)據(jù)分布的平峰或尖峰程度(形狀)。2023/1/295數(shù)據(jù)分布的特征集中趨勢(shì):反映數(shù)據(jù)向其中心靠攏或聚集程度(位置)偏態(tài)和峰態(tài);偏態(tài):反映數(shù)據(jù)偏斜程度;峰度:數(shù)據(jù)分布的平峰或尖峰程度(形狀)離中趨勢(shì);數(shù)據(jù)遠(yuǎn)離中心的趨勢(shì)

(分散程度)2023/1/296數(shù)據(jù)分布特征的測(cè)度1.集中趨勢(shì)算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、眾數(shù)和中位數(shù)。2.離散程度全距、異眾比率、四分位差、平均差、方差和標(biāo)準(zhǔn)差、離散系數(shù)、標(biāo)準(zhǔn)分?jǐn)?shù)。3.分布的形狀偏態(tài)系數(shù)、峰態(tài)系數(shù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組7第一節(jié)集中趨勢(shì)——數(shù)值平均數(shù)

p75

一、算術(shù)平均數(shù)二、調(diào)和平均數(shù)三、幾何平均數(shù)數(shù)值型數(shù)據(jù)的平均數(shù)2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組8集中趨勢(shì)

(centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值不同類(lèi)型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值注意:低層次數(shù)據(jù)的測(cè)度方法也適用于高層次的數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度方法往往不適用于低層次的數(shù)據(jù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組9一、算術(shù)平均數(shù)

均值(算術(shù)平均數(shù))定義:將一組數(shù)據(jù)相加后除以數(shù)據(jù)的個(gè)數(shù)所得到的一個(gè)數(shù)值,稱(chēng)為算術(shù)平均數(shù)(average)或均值(mean)。算術(shù)平均數(shù),又有簡(jiǎn)單算術(shù)平均數(shù)和加權(quán)平均數(shù)之分。算術(shù)平均數(shù)公式的應(yīng)用條件(1)各變量值相互獨(dú)立;(2)變量名稱(chēng)和計(jì)量單位相同;(3)截面數(shù)據(jù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組10

一、算術(shù)平均數(shù)

設(shè)一組數(shù)據(jù)為:x1,x2,…,xn未分組數(shù)據(jù)各組的組中值為:x1,x2,…,xk

組距分組數(shù)據(jù)

相應(yīng)的頻數(shù)為:f1,f2,…,fk簡(jiǎn)單算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組11【例3.1】根據(jù)表3-1中的數(shù)據(jù),計(jì)算職工通信費(fèi)用支出額平均水平。p72解:2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12

身高組中值人數(shù)比重(cm)xi(cm)fi(人)(%)

150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25

總計(jì)-83100.00

例3.2分組資料均值的計(jì)算:某年級(jí)83名女生身高資料組距數(shù)據(jù)次數(shù)f頻率f/∑f變量值x加權(quán)算術(shù)平均數(shù)2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組13【例3.3】依據(jù)整理得表3-4中的數(shù)據(jù),計(jì)算職工通信費(fèi)用支出額平均水平。p74解:或2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組14

計(jì)算算術(shù)平均數(shù),注意:用各組的組中值代表其實(shí)際數(shù)據(jù)計(jì)算算術(shù)平均數(shù)時(shí),通常假定各組數(shù)據(jù)在組內(nèi)是均勻分布的,相應(yīng)的組中值近似等于各組的平均數(shù)。權(quán)數(shù):衡量變量值相對(duì)重要性的數(shù)值。各個(gè)變量值的權(quán)數(shù)要起作用必須具備兩個(gè)條件:一是各個(gè)變量值之間有差異;二是各個(gè)變量值的權(quán)數(shù)有差異。簡(jiǎn)單算術(shù)平均數(shù)是加權(quán)算術(shù)平均數(shù)在權(quán)數(shù)相等時(shí)的特例。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組15

算術(shù)平均數(shù)的性質(zhì)p75-761.各變量值與其算術(shù)平均數(shù)的離差之和等于零,即

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組16算術(shù)平均數(shù)的性質(zhì)2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組17集中趨勢(shì)的最常用測(cè)度值;一組數(shù)據(jù)的均衡點(diǎn)所在;易受極端值的影響;由組距分組資料計(jì)算的均值有近似值性質(zhì);5、用于數(shù)值型數(shù)據(jù),不能用于分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)算術(shù)平均數(shù)(均值)特征:2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組18

二、調(diào)和平均數(shù)

調(diào)和平均數(shù)也稱(chēng)“倒數(shù)平均數(shù)”,它是對(duì)變量的倒數(shù)求平均,然后再取倒數(shù)而得到的平均數(shù),以表示。根據(jù)掌握的資料不同,調(diào)和平均數(shù)也有簡(jiǎn)單調(diào)和平均數(shù)和加權(quán)平均數(shù)兩種形式。其計(jì)算公式為:

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組19

例題分析【例3.4]假設(shè)甲、乙、丙三種蘋(píng)果的價(jià)格分別為每斤2.4元、1.8元及1.5元(1)若三種蘋(píng)果各買(mǎi)1元,試問(wèn)所購(gòu)蘋(píng)果的平均價(jià)格又為多少?(2)如果甲、乙、丙三種蘋(píng)果分別購(gòu)買(mǎi)5元、8元和10元,試問(wèn)其平均價(jià)格為多少?解:計(jì)算平均價(jià)格的是用所付金額除以所購(gòu)數(shù)量。(1)(2)2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組20

計(jì)算調(diào)和平均數(shù),注意:

從數(shù)學(xué)定義角度看算術(shù)平均數(shù)與調(diào)和平均數(shù)是不一樣的,但在社會(huì)經(jīng)濟(jì)應(yīng)用領(lǐng)域,調(diào)和平均數(shù)實(shí)際上只是算術(shù)平均數(shù)的另一種表現(xiàn)形式,二者本質(zhì)上是一致的,唯一的區(qū)別是計(jì)算時(shí)使用了不同的數(shù)據(jù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組21三、幾何平均數(shù)(geometricmean)p78幾何平均數(shù)也稱(chēng)幾何均值,它是n個(gè)變量值乘積的n次方根。幾何平均法是計(jì)算平均比率或平均發(fā)展速度最適用的一種方法。如果分布數(shù)列中各變量值呈幾何級(jí)數(shù)變化或頻率分布極不對(duì)稱(chēng),也常采用幾何平均法來(lái)計(jì)算平均數(shù)。根據(jù)統(tǒng)計(jì)資料的不同,幾何平均數(shù)也有簡(jiǎn)單幾何平均數(shù)和加權(quán)幾何平均數(shù)之分。

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組22幾何平均數(shù)的計(jì)算公式

用途:適用于對(duì)比率數(shù)據(jù)的平均。主要用于計(jì)算平均發(fā)展速度、平均增長(zhǎng)率、平均比率對(duì)于未分組的資料,幾何平均數(shù)的計(jì)算公式為2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組23例題分析【例3.7】已知某市2008~2012年國(guó)內(nèi)生產(chǎn)總值的發(fā)展速度(以上年為100)依次分別為112%、108%、114%、116%和113%。試計(jì)算這5年國(guó)內(nèi)生產(chǎn)總值的平均發(fā)展速度。

如果已知的是各年的增長(zhǎng)速度,要計(jì)算若干年的平均增長(zhǎng)速度,則需要先將增長(zhǎng)率加上100%得到發(fā)展速度,再根據(jù)上述方法計(jì)算平均發(fā)展速度,最后用平均發(fā)展速度減100%則得到平均增長(zhǎng)速度。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組24例題分析【例3.8】甲投資銀行某項(xiàng)投資的年利率是按復(fù)利計(jì)算的,若將過(guò)去20年的年利率資料如表3-8所示.要求:試計(jì)算20年的平均年利率。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組25應(yīng)用幾何平均數(shù)時(shí)注意幾何平均數(shù)在實(shí)際應(yīng)用中受到很多限制;如果被平均的變量值中有一個(gè)為零,則不能計(jì)算幾何平均數(shù);如果變量值為負(fù)數(shù),開(kāi)偶次根會(huì)形成虛根,失去意義;幾何平均數(shù)在實(shí)際應(yīng)用中的范圍比算術(shù)平均數(shù)要窄。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組26第二節(jié)集中趨勢(shì)—位置平均數(shù)p80一、眾數(shù)Mo二、中位數(shù)Me三、四分位數(shù)QU、QL2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組27集中趨勢(shì)—位置平均數(shù)位置平均數(shù):根據(jù)總體中處于特殊位置上的個(gè)別單位或部分單位的標(biāo)志值來(lái)確定的代表值;對(duì)于整個(gè)總體來(lái)說(shuō),具有非常直觀的代表性,常用來(lái)反映分布的集中趨勢(shì);常用的位置平均數(shù)有眾數(shù)和中位數(shù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組28一、眾數(shù)p80(一)眾數(shù)的含義眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用表示。眾數(shù)直觀地說(shuō)明分布的集中趨勢(shì),并用它作為反映變量值一般水平的代表值。在某些場(chǎng)合只有眾數(shù)才適合作為總體的代表值。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組29(二)眾數(shù)的計(jì)算方法1.觀察法求眾數(shù)如果數(shù)據(jù)已按單個(gè)變量值整理成頻率分布表或者是分類(lèi)數(shù)據(jù)表,則次數(shù)出現(xiàn)最多或頻率最大的那個(gè)變量值即為眾數(shù)?!纠?.9】某制鞋廠要了解消費(fèi)者最需要哪種型號(hào)的男皮鞋,調(diào)查了某百貨商場(chǎng)2009年3月男皮鞋的銷(xiāo)售情況,得到資料如表3-9所示。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組30眾數(shù)的計(jì)算--例題分析要求:試根據(jù)上表資料計(jì)算男皮鞋銷(xiāo)售量的眾數(shù)。解:銷(xiāo)售量最多的是規(guī)格為25.5厘米的鞋號(hào),銷(xiāo)售量320雙,占32%,故眾數(shù)為25.5公分。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組31眾數(shù)的計(jì)算--例題分析p81【例3.10】某高校電影院在安排2010年影片放映計(jì)劃時(shí),分別按性別隨機(jī)抽取200名男女學(xué)生,登記其對(duì)影片類(lèi)型的取向。統(tǒng)計(jì)結(jié)果如表3-10所示。要求:試分析學(xué)生對(duì)影片取向的集中趨勢(shì)。解:

7種類(lèi)型的影片中,男生最喜歡看動(dòng)作片,人數(shù)為48人,占24%,眾數(shù)即為動(dòng)作片這種影片類(lèi)型;女生最喜歡看言情片,人數(shù)為46人,占23%,眾數(shù)即為言情片這種影片類(lèi)型;男女生對(duì)影片類(lèi)型的取向,綜合而言是動(dòng)作片,眾數(shù)為動(dòng)作片這種影片類(lèi)型。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組32數(shù)值型數(shù)據(jù)眾數(shù)的確定方法單變量值分組資料某年級(jí)83名女生身高資料

身高人數(shù)(CM)(人)

152115421552156415711582159216012161716281634

身高人數(shù)(CM)(人)

1643165816651673168716911705171217231741總計(jì)

83

STAT眾數(shù)2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組33

注意:

眾數(shù)不僅適用于測(cè)度順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的集中趨勢(shì),而且適用于測(cè)度不能計(jì)算平均數(shù)的分類(lèi)數(shù)據(jù)的集中趨勢(shì)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組34眾數(shù)的計(jì)算方法2.插值法求眾數(shù)對(duì)于組距分組形成的分布數(shù)列,當(dāng)頻率分布屬于完全對(duì)稱(chēng)分布,而眾數(shù)所在組的變量值分布比較均勻時(shí),可用觀察法求眾數(shù),即以眾數(shù)組的組中值作為所求的眾數(shù)。完全對(duì)稱(chēng)分布不存在,眾數(shù)組前后各組的次數(shù)不一定相等,眾數(shù)就不等于組中值,因此需要采用插值法求眾數(shù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組35組距分組數(shù)據(jù),眾數(shù)的計(jì)算步驟1、先找到眾數(shù)所在的組;2、按該組次數(shù)與前后相鄰兩組分布次數(shù)之差所占的比重來(lái)推算眾數(shù)值。如果眾數(shù)組前一組的次數(shù)大于后一組的次數(shù),則眾數(shù)值小于其所在組的組中值;反之,眾數(shù)值則大于其所在組的組中值;若眾數(shù)組前后相鄰組的次數(shù)相等,則眾數(shù)值等于其所在組的組中值。3、計(jì)算眾數(shù)有上限和下限公式之分。

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組36眾數(shù)的計(jì)算方法2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組37

身高人數(shù)比重(CM)(人)(%)

150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25

總計(jì)83100某年級(jí)83名女生身高資料③數(shù)值型數(shù)據(jù)眾數(shù)的確定方法組距分組資料STAT眾數(shù)組2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組38

眾數(shù)的特點(diǎn)1.眾數(shù)不受分布數(shù)列的極大或極小值的影響,眾數(shù)對(duì)分布數(shù)列有好的代表性。2.?dāng)?shù)據(jù)的分布沒(méi)有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)可能不存在;3.有兩個(gè)或多個(gè)高峰點(diǎn),可以有兩個(gè)或多個(gè)眾數(shù)。眾數(shù)不具有唯一性。4.眾數(shù)缺乏敏感性。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組39二、中位數(shù)Mep83(一)中位數(shù)的含義中位數(shù)是將數(shù)據(jù)按大小順序排列起來(lái),形成一個(gè)數(shù)列,居于數(shù)列中間位置的那個(gè)變量值稱(chēng)為中位數(shù)。中位數(shù)用Me表示。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組40中位數(shù)的計(jì)算中位數(shù)概念:排序后處于中間位置上的值1.根據(jù)未分組數(shù)據(jù)計(jì)算中位數(shù)。Me50%50%2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組41例題分析【例3.12】某班第一、二兩個(gè)小組統(tǒng)計(jì)學(xué)期末考試成績(jī)排序結(jié)果如表3-12所示。要求:分別計(jì)算兩小組成績(jī)的中位數(shù)解:兩個(gè)學(xué)習(xí)小組的考試成績(jī)已經(jīng)分別按由低到高排列。第一小組有7個(gè)學(xué)生,第4位為中位數(shù)的位置,Me=75.

第二小組有8個(gè)學(xué)生,中位數(shù)的位置處于第四和第五個(gè)學(xué)生之間。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組42中位數(shù)的計(jì)算2.由分組資料確定中位數(shù)

如果由組距數(shù)列確定中位數(shù),應(yīng)先按的公式求出中位數(shù)所在組的位置,然后再按下限公式或上限公式確定中位數(shù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組43組距分組數(shù)據(jù)中位數(shù)的確定方法

身高fi人數(shù)累計(jì)(CM)(人)人數(shù)

150-15533155-1601114160-1653448165-1702472170以上1183

總計(jì)83某年級(jí)83名女生身高資料STAT中位數(shù)組2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組44

中位數(shù)的特點(diǎn)1.不受分布數(shù)列的極大或極小值影響。2.有些離散型變量的單項(xiàng)式數(shù)列,當(dāng)次數(shù)分布偏態(tài)時(shí),中位數(shù)的代表性會(huì)受到影響。3.中位數(shù)缺乏敏感性。

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組45三、四分位數(shù)p85

中位數(shù)是根據(jù)其在數(shù)列中所處的位置來(lái)確定的一個(gè)平均數(shù),作為各變量值的一個(gè)代表值,以反映分布數(shù)列的集中趨勢(shì)。為了進(jìn)一步了解一組數(shù)據(jù)分布的內(nèi)部結(jié)構(gòu),觀察變量值在各個(gè)區(qū)間的一般水平,還可以計(jì)算四分位數(shù)、十分位數(shù)和百分位數(shù)。

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組46

四分位數(shù)四分位數(shù)是通過(guò)3個(gè)點(diǎn)將全部數(shù)據(jù)等分為四個(gè)部分,其中每部分包含25%的數(shù)據(jù)。

QLMeQU25%25%25%25%處于25%和75%位置上的值即四分位數(shù)特點(diǎn):不受極端值的影響要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類(lèi)數(shù)據(jù)(各種分位數(shù)可由spss計(jì)算)2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組47四分位數(shù)的計(jì)算1.根據(jù)未分組數(shù)據(jù)計(jì)算四分位數(shù)時(shí),先對(duì)數(shù)據(jù)進(jìn)行排序,然后再確定四分位數(shù)所在的位置當(dāng)四分位數(shù)的位置不是整數(shù)時(shí),可根據(jù)四分位數(shù)的位置,按比例分?jǐn)偹姆治粩?shù)所在位置兩側(cè)變量值之差的數(shù)值。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組48四分位數(shù)的計(jì)算—例題分析【例3.14】將例3.12中兩個(gè)學(xué)習(xí)小組的統(tǒng)計(jì)學(xué)考試成績(jī)合并如下:

要求:

(1)計(jì)算前15個(gè)學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的四分位數(shù);(2)如果增加一個(gè)學(xué)生的成績(jī)95分,試計(jì)算16個(gè)學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)的四分位數(shù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組49四分位數(shù)的計(jì)算—例題分析2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組50四分位數(shù)的計(jì)算2.根據(jù)組距數(shù)列計(jì)算四分位數(shù)

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組51四分位數(shù)的計(jì)算2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組52

算術(shù)平均數(shù)簡(jiǎn)評(píng)算術(shù)平均數(shù):算術(shù)平均數(shù)符合上述六個(gè)條件,應(yīng)用范圍最廣。易受極端值的影響。當(dāng)分布數(shù)列中存在開(kāi)口組時(shí),會(huì)影響平均數(shù)的準(zhǔn)確性。算術(shù)平均數(shù)適用于數(shù)值型數(shù)據(jù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組53(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系

在數(shù)據(jù)分布呈完全對(duì)稱(chēng)的正態(tài)分布時(shí),算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者相等。在次數(shù)分布非對(duì)稱(chēng)時(shí),算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者不相等,但具有相對(duì)固定的關(guān)系。在尾巴拖在右邊的正偏態(tài)(或右偏態(tài))分布中,眾數(shù)最小,中位數(shù)適中,算術(shù)平均數(shù)最大。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組54

眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系

左偏分布均值

中位數(shù)

眾數(shù)對(duì)稱(chēng)分布

均值=中位數(shù)=眾數(shù)右偏分布眾數(shù)

中位數(shù)均值對(duì)何種數(shù)據(jù)而言的?2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組55第三節(jié)離中趨勢(shì)的測(cè)度

p85數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表性注意:數(shù)據(jù)的離散程度越大,集中趨勢(shì)的測(cè)度對(duì)該組數(shù)據(jù)的代表性越差;數(shù)據(jù)的離散程度越小,集中趨勢(shì)的測(cè)度值對(duì)該組數(shù)據(jù)的代表性越好。不同類(lèi)型的數(shù)據(jù)有不同的離散程度測(cè)度值2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組56下面是兩個(gè)總體關(guān)于年齡分布的數(shù)據(jù),相對(duì)而言,那個(gè)總體的年齡分布分散,差異大些?46、47、48、49、50、51、52、53、548、15、20、30、5070、80、85、92總體1總體22023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組57離中趨勢(shì);數(shù)據(jù)遠(yuǎn)離中心的趨勢(shì)

(分散程度)總體2總體12023/1/2958數(shù)值型數(shù)據(jù):①全距(或稱(chēng)極差)(range)②平均差(meandeviation)③方差和標(biāo)準(zhǔn)差(Varianceandstandarddeviation)④相對(duì)離散程度:離散系數(shù)(CoefficientofVariation)分類(lèi)數(shù)據(jù):異眾比率(variationratio)順序數(shù)據(jù):四分位差(quartilerange)離散程度的測(cè)度2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組59一、全距(Range)

全距也稱(chēng)為極差,是指一組數(shù)據(jù)的最大值與最小值之差,用R表示。即:R=最大變量值-最小變量值沒(méi)有開(kāi)口組的組距分布數(shù)列計(jì)算全距,可以用最大組的上限值減去最小組的下限值,得到全距的近似值。全距可以反映一組數(shù)據(jù)的差異范圍。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組60全距的計(jì)算【例3.16】表3-14是兩組人口關(guān)于年齡分布的數(shù)據(jù),要求計(jì)算全距。解:第一組全距第二組全距

注意:如果組距分布數(shù)列中有開(kāi)口組,則不能計(jì)算全距。全距計(jì)算簡(jiǎn)單,易理解,易受極端值的影響;不能反映中間數(shù)據(jù)分散狀況,不能準(zhǔn)確描述數(shù)據(jù)的分散程度。2023/1/2961

二、異眾比率(variationratio)① 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率②計(jì)算公式為③用于對(duì)分類(lèi)數(shù)據(jù)離散程度的測(cè)度

④用于衡量眾數(shù)的代表性2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組62異眾比率

異眾比率主要用于衡量眾數(shù)對(duì)一組數(shù)據(jù)的代表程度。異眾比率越大,說(shuō)明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說(shuō)明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性越好。異眾比率適合測(cè)度分類(lèi)數(shù)據(jù)、測(cè)度順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的離散程度。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組63異眾比率的應(yīng)用p89【例3.17】根據(jù)例3.10的數(shù)據(jù)計(jì)算學(xué)生對(duì)影片取向的異眾比率?!窘狻扛鶕?jù)公式得說(shuō)明:比較上面的三個(gè)異眾比率,全部樣本學(xué)生的異眾比率最大,說(shuō)明其眾數(shù)的代表性最差;男生的異眾比率略小于女生的異眾比率,說(shuō)明男生對(duì)影片取向的眾數(shù)的代表性略好于女生對(duì)影片取向的眾數(shù)的代表性。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組64三、四分位差p89

注意:①上四分位數(shù)與下四分位數(shù)之差

Qd=QU

–QL反映了中間50%數(shù)據(jù)的離散程度②對(duì)順序數(shù)據(jù)離散程度的測(cè)度③不受極端值的影響④用于衡量中位數(shù)的代表性2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組65四分位差的應(yīng)用注意:四分位差不易受極端值的影響,可以測(cè)量含有開(kāi)口組的數(shù)據(jù)分布的差異程度,但不能反映所有變量值的差異程度。【例】依據(jù)前面例3.16中兩組人口年齡的四分位差:

結(jié)論:第一、第二組的中位數(shù)均為50歲,但其代表性不同。第一小組的中位數(shù)代表性相對(duì)高些,因?yàn)橄鄬?duì)而言,四分位差小,數(shù)據(jù)分布集中。第二組年齡中位數(shù)代表性低些,因?yàn)樵摻M年齡差異大,年齡分布相對(duì)分散。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組66四、平均差(AverageDeviation)平均差就是各個(gè)變量值與其算術(shù)平均數(shù)離差的絕對(duì)值的平均數(shù),以AD表示。它綜合反映了各變量值的變動(dòng)程度,是各個(gè)離差的代表值。平均差越大,則表示變量值的離散程度越大,說(shuō)明平均數(shù)的代表性越小;平均差越小,則表示變量值的離散程度越小,說(shuō)明平均數(shù)的代表性越大。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組67

平均差的計(jì)算①各變量值與其均值離差絕對(duì)值的平均數(shù)計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)諸變量值與均值的偏差②能全面反映一組數(shù)據(jù)的離散程度③數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組68

平均差的計(jì)算【例3.18】

要求:根據(jù)例3.16所給的資料分別計(jì)算第一、第二組人口年齡的平均差,并比較其平均年齡的代表性。解:結(jié)論:

比較兩個(gè)平均差可知,兩組人口年齡平均數(shù)均為50歲,第一組平均差小,人口年齡分布的差異小,平均年齡的代表性好;第二組平均差大,年齡分布的離散水平大,平均年齡的代表性差些。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組69

平均差的計(jì)算【例3.19】根據(jù)表的資料計(jì)算120名職工通信費(fèi)用支出額的平均差。解:2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組70平均差的含義:每名職工通信費(fèi)用支出額有高有低,與平均數(shù)165元相比,差異有大有小。平均差表明:以平均通信費(fèi)用165元為中心,每名職工通信費(fèi)用支出額與平均水平的平均差距為42.42元。注意:平均差易理解、計(jì)算簡(jiǎn)便,可以說(shuō)明數(shù)據(jù)分布的離中趨勢(shì);但由于有絕對(duì)值及數(shù)理統(tǒng)計(jì)學(xué)的廣泛應(yīng)用,故其應(yīng)用范圍受到限制。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組71五、方差與標(biāo)準(zhǔn)差p92方差是各個(gè)數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的平均數(shù),通常以表示總體方差,s2表示樣本方差。標(biāo)準(zhǔn)差又稱(chēng)均方差,是方差的平方根,一般用表示總體標(biāo)準(zhǔn)差,以S表示樣本標(biāo)準(zhǔn)差。方差和標(biāo)準(zhǔn)差的計(jì)算也分為簡(jiǎn)單平均法和加權(quán)平均法。對(duì)于總體數(shù)據(jù)和樣本數(shù)據(jù),公式略有不同。

2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組72方差與標(biāo)準(zhǔn)差注意:方差和標(biāo)準(zhǔn)差是根據(jù)全部數(shù)據(jù)計(jì)算的,它反映了每個(gè)數(shù)據(jù)與其均值相比平均相差的數(shù)值;它能準(zhǔn)確地反映出數(shù)據(jù)的離散程度;方差和標(biāo)準(zhǔn)差是應(yīng)用最廣泛的離散程度測(cè)度值。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組73總體方差與標(biāo)準(zhǔn)差的計(jì)算公式總體標(biāo)準(zhǔn)差2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組74樣本方差和標(biāo)準(zhǔn)差(記?。﹑92

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組75方差與標(biāo)準(zhǔn)差的應(yīng)用【例3.20】要求:根據(jù)表中的數(shù)據(jù)計(jì)算120名職工通信費(fèi)用支出額的方差和標(biāo)準(zhǔn)差。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組76方差與標(biāo)準(zhǔn)差的計(jì)算【解】已知平均數(shù)為165元,因是隨機(jī)抽取的樣本資料,故依據(jù)樣本方差及標(biāo)準(zhǔn)差的公式計(jì)算。計(jì)算結(jié)果表明,樣本中每名職工月通信費(fèi)用支出額與月平均通信費(fèi)用支出額165元的水平相比,差異有大有小,但平均偏差是51.4元。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組77方差與標(biāo)準(zhǔn)差的應(yīng)用【例3.21】考察一臺(tái)機(jī)器的生產(chǎn)狀況,利用抽樣程序來(lái)檢驗(yàn)其生產(chǎn)出來(lái)的產(chǎn)品質(zhì)量是否穩(wěn)定。據(jù)行業(yè)標(biāo)準(zhǔn),如果樣本零件尺寸的標(biāo)準(zhǔn)差大于0.3公分,則表明該零件的質(zhì)量不穩(wěn)定,需要對(duì)該機(jī)器進(jìn)行停工檢修。數(shù)據(jù)如下:要求:根據(jù)資料,判斷該機(jī)器是否需要停工修。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組78方差與標(biāo)準(zhǔn)差的應(yīng)用解:計(jì)算的樣本標(biāo)準(zhǔn)差0.2126公分,小于0.3分,表明該臺(tái)機(jī)器不需要停工檢修。注意:標(biāo)準(zhǔn)差是一個(gè)重要的偏差,描述了各觀察值與均值的平均距離。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組79六、離散系數(shù)p94離散系數(shù)(標(biāo)準(zhǔn)差系數(shù)或變異系數(shù))通常是用標(biāo)準(zhǔn)差來(lái)計(jì)算的,它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo),其計(jì)算公式為:式中:Vσ和Vs分別表示總體離散系數(shù)和樣本離散系數(shù)。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組80離散系數(shù)的應(yīng)用平均水平或計(jì)量單位不同的不同組別的變量值,不能直接用離散程度的測(cè)度值比較。平均水平或計(jì)量單位不同的不同組別進(jìn)行比較,需計(jì)算離散系數(shù)。離散系數(shù)大的說(shuō)明該組數(shù)據(jù)的離散程度也就大,離散系數(shù)小的說(shuō)明該組數(shù)據(jù)的離散程度小。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組81離散系數(shù)的應(yīng)用【例3.22】從某管理局所屬的兩家企業(yè)中各隨機(jī)抽取10名職工,調(diào)查獲得他們的年收入數(shù)據(jù)如表所示:要求:根據(jù)上表數(shù)據(jù)計(jì)算甲乙兩企業(yè)抽樣職工的平均收入以及離散系數(shù),說(shuō)明兩組數(shù)據(jù)的離散程度及平均數(shù)的代表性。2023/1/29版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論