第4章統(tǒng)計學數(shù)據(jù)的概括性度量_第1頁
第4章統(tǒng)計學數(shù)據(jù)的概括性度量_第2頁
第4章統(tǒng)計學數(shù)據(jù)的概括性度量_第3頁
第4章統(tǒng)計學數(shù)據(jù)的概括性度量_第4頁
第4章統(tǒng)計學數(shù)據(jù)的概括性度量_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第4章 數(shù)據(jù)(shj)的概括性度量共六十八頁數(shù)據(jù)分布特征(tzhng)的測度集中(jzhng)趨勢的度量 反映數(shù)據(jù)向其中心值靠攏或聚集的程度離散程度的度量 反映數(shù)據(jù)遠離其中心值的趨勢分布的形狀 反映數(shù)據(jù)分布的偏態(tài)和峰態(tài)共六十八頁4.1 集中(jzhng)趨勢的度量一組數(shù)據(jù)(shj)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值 分類數(shù)據(jù) 眾數(shù) 順序數(shù)據(jù) 中位數(shù)和分位數(shù) 數(shù)值型數(shù)據(jù) 平均數(shù)共六十八頁眾 數(shù) 眾數(shù)(MODE):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用Mo表示; 主要用于測度分類數(shù)據(jù)的集中(jzhng)趨勢,也 可用于順序數(shù)據(jù)

2、和數(shù)值型數(shù)據(jù); 眾數(shù)是位置代表值,不受極端值影響; 可能沒有眾數(shù)、有一個眾數(shù)或幾個眾數(shù)共六十八頁眾數(shù)(zhn sh)的不唯一性無眾數(shù)(zhn sh)原始數(shù)據(jù): 10 5 9 12 6 8一個眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5多于一個眾數(shù)原始數(shù)據(jù): 25 28 28 36 42 42共六十八頁 分類數(shù)據(jù)(shj)的眾數(shù)表3-4 某城市居民關注廣告類型的頻數(shù)分布 廣告類型人數(shù)(人)比例頻率(%) 商品廣告 服務廣告 金融廣告 房地產廣告 招生招聘廣告 其他廣告472299850.470.220.090.090.080.0547229985合計1001100解:這里的變量為“廣告類型”,不同類型

3、的廣告就是變量值。關注商品廣告的人數(shù)最多,為47人,占總被調查人數(shù)(rn sh)的47%,因此眾數(shù)為“商品廣告”這一類別,即 Mo商品廣告【例4.1 】某城市居民關注廣告類型的眾數(shù)共六十八頁 順序(shnx)數(shù)據(jù)的眾數(shù)表3-5 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)百分比 (%) 非常不滿意 不滿意 一般 滿意 非常滿意24108934530836311510合計300100.0解:這里的數(shù)據(jù)為順序(shnx)數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意【例4.2 】求甲城市家庭對住房狀況評價的眾數(shù)

4、共六十八頁數(shù)值型數(shù)據(jù)(shj)的眾數(shù) (未分組)【例4.3 】在某城市中隨機抽取9個家庭,調查得到每個家庭的人均月收入數(shù)據(jù)(shj)如下(單位:元)。要求計算人均月收入的眾數(shù)。 1080 750 1080 1080 850 960 2000 1250 1630 解:人均月收入出現(xiàn)次數(shù)最多的是1080,因此, Mo 1080元共六十八頁數(shù)值(shz)型分組數(shù)據(jù)的眾數(shù)2. 相鄰兩組的頻數(shù)相等(xingdng)時,眾數(shù)組的組中值即為眾數(shù)1. 眾數(shù)的值與相鄰兩組頻數(shù)的分布有關Mo3. 相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMoL為眾數(shù)組的下限值,i為眾數(shù)組的組距,f為眾數(shù)組的頻數(shù),f-1

5、為眾數(shù)組前一組的頻數(shù),f+1為眾數(shù)組后一組的頻數(shù)。共六十八頁表3-6 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50【例4.4】根據(jù)第三章表3-6中的數(shù)據(jù),計算50名工人日加工(ji gng)零件數(shù)的眾數(shù)共六十八頁順序(shnx)數(shù)據(jù):中位數(shù)和分位數(shù)共六十八頁中位數(shù)Me50%50% 不受極端(jdun)值的影響 主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù) 排序后處于中間(zhngjin)位置上的變量值共六十八頁計算(j sun)中位

6、數(shù)的步驟 1. 排序 2. 確定中位數(shù)的位置(wi zhi)(按公式)N為數(shù)據(jù)的個數(shù)共六十八頁順序(shnx)數(shù)據(jù)的中位數(shù)(算例)表3-2 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300合計300解:順序數(shù)據(jù)本身就是排序的,根據(jù)中位數(shù)位置的確定公式(gngsh):從累積頻數(shù)看,中位數(shù)在“一般”這一類中,即Me = 一般共六十八頁數(shù)值(shz)型未分組數(shù)據(jù)的中位數(shù)奇數(shù)個數(shù)據(jù)的算例 原始數(shù)據(jù): 24 22 21 26 20 排 序: 20 21 22 24 26 位 置: 1 2 3

7、4 5中位數(shù) = 22共六十八頁偶數(shù)(u sh)個數(shù)據(jù)的算例 原始數(shù)據(jù): 10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6位置N+126+123.5中位數(shù)8 + 928.5共六十八頁數(shù)值(shz)型分組數(shù)據(jù)的中位數(shù) 1. 計算累積頻數(shù) 2. 確定(qudng)中位數(shù)所在組 3. 采用下列近似公式計算:L為中位數(shù)所在組的下限值,N為數(shù)據(jù)的個數(shù)Sm-1為中位數(shù)所在組以前各組的累積頻數(shù),fm為中位數(shù)所在組的頻數(shù),i為中位數(shù)所在組的組距共六十八頁【例4.5】根據(jù)(gnj)第三章表3-5中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的中位數(shù)表3-5 某車間50名

8、工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50共六十八頁四分(s fn)位數(shù) 排序后處于(chy)25%和75%位置上的值QLQMQU25%25%25%25% 不受極端值的影響 主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)共六十八頁四分(s fn)位數(shù)的計算1. 排序2. 確定四分(s fn)位數(shù)的位置 下四分位數(shù)為QL,上四分位數(shù)為QU,公式為:QL位置 =QU位置 =共六十八頁 如果位置是整數(shù),四分位數(shù)就是該位置上的值; 如果是在0.5位置

9、上,則取該位置兩側值的平均數(shù); 如果是在0.25或0.75位置上,則四分位數(shù)等于(dngy)該位置的下側值加上按比例分攤位置兩側數(shù)值的差值。共六十八頁 【例4.6】由一組10個學生的月支出的調查數(shù)據(jù),要求(yoqi)計算該組數(shù)據(jù)的四分位數(shù)。 1500 750 780 1080 850 960 2000 1250 1630 2500 共六十八頁數(shù)值型分組數(shù)據(jù)(shj)的四分位數(shù) 1. 計算累積頻數(shù) 2. 確定四分(s fn)位數(shù)所在組 3. 采用下列近似公式計算:LL和LU為QL和QU所在組的下限值;SL和SU為QL和QU所在組以前各組的累積頻數(shù)fL和fU為QL和QU所在組的頻數(shù),iL和iU為Q

10、L和QU所在組的組距共六十八頁表3-5 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50【例4.7】計算50 名工人日加工(ji gng)零件數(shù)的四分位數(shù)共六十八頁燈泡的使用壽命(小時)頻數(shù)650 6602660 6705670 6806680 69014690 70026700 71018710 72013720 73010730 7403740 7503共六十八頁數(shù)值型數(shù)據(jù)(shj):平均數(shù)(均值) 1. 平均數(shù)是一組數(shù)據(jù)相加后除以數(shù)據(jù)個數(shù)

11、得到的結果。 2. 集中趨勢的最主要測度值 3. 易受極端值的影響(yngxing) 4. 用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和 順序數(shù)據(jù)。共六十八頁簡單平均數(shù) 對未分組數(shù)據(jù)(shj)計算的平均數(shù)公式為:加權平均數(shù) 對分組數(shù)據(jù)計算的平均數(shù)設原始數(shù)據(jù)被分成k組,各組的組中值為M1,M2, ,Mk,各組頻數(shù)為f1,f2, ,fk,則加權平均數(shù)為,X共六十八頁簡單(jindn)平均數(shù)算例【例4.8】計算第三章中50個工人日加工(ji gng)零件數(shù)的均值x= (117+122+121)/50 = 6149/50 = 122.98(個)共六十八頁【例4.9】根據(jù)第三章表3-5中的數(shù)據(jù),計算50 名工人日

12、加工(ji gng)零件數(shù)的均值表4-1 某車間50名工人日加工零件均值計算表按零件數(shù)分組組中值(Mi)頻數(shù)(Fi)MiFi105110110115115120120125125130130135135140358141064合計50共六十八頁表4-1 某車間50名工人日加工零件均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計506160.

13、0(個)共六十八頁 簡單平均數(shù),其數(shù)值的大小只與變量值的大小有關; 加權平均數(shù),其數(shù)值的大小不僅受各組變量值大小的影響,而且受各組變量值出現(xiàn)的頻數(shù)(pn sh)即權數(shù)(fi)大小的影響。 如果某一組的權數(shù)較大,說明該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對均值的影響就越大,反之則越小。共六十八頁幾何(j h)平均數(shù)1. 幾何平均數(shù): N 個變量值乘積的 N 次方根,用GM表示 其計算公式為2. 主要(zhyo)用于計算平均比率和平均發(fā)展速度GEOMEAN共六十八頁【例4.10】一位投資者持有一種(y zhn)股票,2001-2004年的收益率分別為4.5%,2.1%,25.5%,1.9%要求計算該投

14、資者在這4年內的平均收益率。 解:設平均收益率為G= 108.0787%則G = GM 1 = 108.0787%1 = 8.0787%_共六十八頁【例4.11】某水泥生產(shngchn)企業(yè)2001年的水泥產量為100萬噸,2002年的產量比2001增長了9%,2003年比2002年增長了16%,2004年比2003增長20%。求該企業(yè)2002年、2003年、2004年這三年的平均增長率。解:= 114.91%則年平均(pngjn)增長率為114.91%100% = 14.91%共六十八頁眾數(shù)(zhn sh)、中位數(shù)和平均數(shù)的比較共六十八頁眾數(shù)(zhn sh)、中位數(shù)和平均數(shù)的關系1. 如

15、果數(shù)據(jù)分布是對稱(duchn)的,則 2. 如果數(shù)據(jù)是左偏分布,則3. 如果數(shù)據(jù)是右偏分布,則 Mo = Me = xx Me MoMo Me x共六十八頁4.2 離散(lsn)程度的測度 離散程度:反映個體遠離其中心值的程度。 離散程度越大,表示集中趨勢的測度值對數(shù)據(jù)的代表性越差; 離散程度越小,表示集中趨勢的測度值對數(shù)據(jù)的代表性越好。 分類數(shù)據(jù) 異眾比率(bl) 順序數(shù)據(jù) 四分位差 數(shù)值型數(shù)據(jù) 方差和標準差共六十八頁分類數(shù)據(jù)(shj):異眾比率1. 離散程度的測度(c du)值之一2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 計算公式為 4. 用于衡量眾數(shù)的代表性共六十八頁異眾比率(bl)(算例

16、)表3-1 不同類型飲料的頻數(shù)分布 廣告類型人數(shù)(人)頻率(%)果汁礦泉水綠茶碳酸飲料其他610111581220223016合計50100解: 在調查的50人當中,購買其他類型飲料的人數(shù)占70%,異眾比率比較大,用“碳酸飲料”來代表消費者購飲料類型的狀況,其代表性不是很好。 Vr = 50 - 1550 = 1 - 15 50 = 0.70 = 70%共六十八頁順序數(shù)據(jù)(shj):四分位差1.離散程度的測度值之一2.也稱為內距或四分間距3.上四分位數(shù)與下四分位數(shù)之差 QD = QU - QL4.反映(fnyng)了中間50%數(shù)據(jù)的離散程度5. 不受極端值的影響6. 用于衡量中位數(shù)的代表性共六

17、十八頁順序數(shù)據(jù)(shj)的四分位差計算甲城市家庭對住房滿意狀況(zhungkung)評價的四分位差表3-2 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300合計300解:設非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 QL = 不滿意 = 2, QU = 一般 = 3四分位差: QD = QU QL = 3 2 = 1共六十八頁例:為調查我校大學生對趣味玩具的偏好情況,搜及200位同學對趣味玩具的態(tài)度,得到(d do)以下數(shù)據(jù),計算這組數(shù)據(jù)的四分位差?回答類別

18、甲城市人數(shù) (人)累計頻數(shù) 非常喜歡(買的多) 喜歡(會買一些) 一般(偶爾買) 不在意(不會買) 不喜歡 (不買不玩)2255653028合計200共六十八頁數(shù)值型數(shù)據(jù)的離散(lsn)程度 極差 平均差 方差(fn ch) 標準差共六十八頁極 差(range)1.一組數(shù)據(jù)的最大值與最小值之差,用R表示2.計算公式3.離散(lsn)程度的最簡單測度值4.易受極端值影響5.未考慮數(shù)據(jù)的分布未分組數(shù)據(jù)(shj) R = max(Xi) - min(Xi).=組距分組數(shù)據(jù) R 最高組上限 - 最低組下限7891078910共六十八頁平均差(Md)1.各變量值與其(yq)平均數(shù)離差絕對值的平均數(shù)2.以

19、平均數(shù)為中心,反映每個數(shù)據(jù)與平均數(shù)的平均差異程度,能全面準確地反映一組數(shù)據(jù)的離散程度。3. 計算公式為未分組數(shù)據(jù)(shj)組距分組數(shù)據(jù)共六十八頁【例4.13】為調查大學生對課外培訓班所愿意(yun y)付出的最高費用的離散程度,計算以下數(shù)據(jù)的平均差。表4-13 課外培訓班費用調查按零件數(shù)分組組中值(Mi)頻數(shù)(fi)| Mi- X |Mi-X |Fi500以下50080080011001100140014001700170020002000以上101215381492合計100共六十八頁表4-13 培訓班費用調查按零件數(shù)分組組中值(Mi)頻數(shù)(Fi)| Mi- X |Mi-X |Fi500以下

20、50080080011001100140014001700170020002000以上3506509501250155018502150101215381492807507207933936939938070608431053534550262371986合計10034518共六十八頁方差(fn ch)和標準差方差:各變量值與其均值(jn zh)離差平方的平均數(shù)。標準差:方差的平方根1. 反映了各變量值與均值的平均差異2. 反映出數(shù)據(jù)的離散程度3. 最常用的離散程度測度值4. 根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差; 根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差共六十八頁總體(zngt)方差和標

21、準差方差(fn ch)的計算公式標準差的計算公式未分組數(shù)據(jù)分組數(shù)據(jù)未分組數(shù)據(jù)分組數(shù)據(jù)共六十八頁樣本(yngbn)方差和標準差方差(fn ch)的計算公式標準差的計算公式未分組數(shù)據(jù)分組數(shù)據(jù)分組數(shù)據(jù)未分組數(shù)據(jù)注意:樣本方差用自由度n-1去除!共六十八頁自由度(degree of freedom)1. 一組數(shù)據(jù)(shj)中可以自由取值的數(shù)據(jù)(shj)的個數(shù)2. 當樣本數(shù)據(jù)的個數(shù)為 n 時,若樣本均值x 確定后,則附加給n個觀測值1個約束條件,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)不能自由取值。共六十八頁標準分數(shù)1. 含義:變量值與其平均數(shù)的離差除以標準差后的值,也稱標準化值或z分數(shù)。2. 計

22、算公式為3. 給出某一個值在一組數(shù)據(jù)中的相對位置4. 可用于判斷一組數(shù)據(jù)是否有離群(l qn)點5. 用于對變量的標準化處理共六十八頁【例】一家(y ji)公司在招聘時,要對應聘者進行兩項能力測試。在A項測試中,平均分數(shù)為100分,標準差是15分;在B項測試中,平均分數(shù)是400分,標準差是50分。一位應試者在A項測試中得了115分,在B項測試中得了425分,與平均分數(shù)相比,該應試者哪一項測試更為理想?共六十八頁經(jīng)驗(jngyn)法則:當一組數(shù)據(jù)對稱(duchn)分布時,約有68%的數(shù)據(jù)在平均數(shù)1個標準差的范圍之內約有95%的數(shù)據(jù)在平均數(shù)2個標準差的范圍之內約有99%的數(shù)據(jù)在平均數(shù)3個標準差的范

23、圍之內在3個標準差范圍之外的數(shù)據(jù)稱為離群點共六十八頁切比雪夫不等式 適用于任何分布形狀(xngzhun)的數(shù)據(jù) 根據(jù)切比雪夫不等式,至少有(1-1/k2)的數(shù)據(jù)落在k個標準差之內,k是大于1的任意值。至少(zhsho)有75%的數(shù)據(jù)在平均數(shù)2個標準差的范圍之內至少有89%的數(shù)據(jù)在平均數(shù)3個標準差的范圍之內至少有94%的數(shù)據(jù)在平均數(shù)4個標準差的范圍之內共六十八頁離散(lsn)系數(shù)(變異系數(shù)) 離散系數(shù):標準差與其相應(xingyng)的平均數(shù)之比計算公式為 測度數(shù)據(jù)離散程度的相對統(tǒng)計量 用于比較不同樣本數(shù)據(jù)離散程度共六十八頁【例】某管理局抽查了所屬的8家企業(yè),其產品銷售數(shù)據(jù)(shj)如下,試比較產品銷售額與銷售利潤的離散程度表4-7 某管理局所屬8家企業(yè)的產品銷售數(shù)據(jù)企業(yè)編號產品銷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論