




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
大家好1第4章數(shù)據(jù)的概括性度量1集中趨勢的度量2離散程度的度量3偏態(tài)與峰態(tài)的度量2甲、乙兩個班的統(tǒng)計學成績請對兩個班的成績進行對比分析,你會從哪幾個方面著手?3兩班成績的對比分析甲班成績的描述性指標乙班成績的描述性指標4學習目的和重難點提示
本章學習目的領會數(shù)據(jù)分布的各種特征:集中趨勢、離散趨勢、偏斜程度和峰度。掌握數(shù)據(jù)分布特征各測定值的計算方法、特點及其應用場合。本章重難點提示數(shù)據(jù)分布特征的描述方法,如何使用一些統(tǒng)計量來對數(shù)據(jù)進行概括性測定。數(shù)據(jù)分布特征各測定值的計算方法、特點及其應用場合。5數(shù)據(jù)分布的特征和測度峰度偏度數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)離散系數(shù)方差和標準差四分位差異眾比率位置平均數(shù)數(shù)值平均數(shù)算術平均數(shù)調和平均數(shù)幾何平均數(shù)64.1集中趨勢的度量一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的集中趨勢測度值適用于高層次的測量數(shù)據(jù),反過來,高層次數(shù)據(jù)的集中趨勢測度值并不適用于低層次的測量數(shù)據(jù)選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定集中趨勢(位置)7集中趨勢指標的種類從總體各單位變量值中抽象出具有一般水平的量,這個量是根據(jù)各個單位的具體標志值計算出來的,有算術平均數(shù)、調和平均數(shù)、幾何平均數(shù)等形式。數(shù)值平均數(shù)取得集中趨勢代表值方法的不同,可分為數(shù)值平均數(shù)和位置平均數(shù)。先將總體各單位的變量值按一定順序排列,然后取某一位置的變量值來反映總體各單位的一般水平。位置平均數(shù)有眾數(shù)、中位數(shù)、四分位數(shù)等形式。位置平均數(shù)84.1.1眾數(shù)
1.定義:出現(xiàn)次數(shù)最多的變量值。是集中趨勢的測度值之一,不受極端值的影響。因而在實際工作中有時有它特殊的用途。諸如,要說明一個企業(yè)中工人最普遍的技術等級,說明消費者需要的內(nèi)衣、鞋襪、帽子等最普遍的號碼,說明農(nóng)貿(mào)市場上某種農(nóng)副產(chǎn)品最普遍的成交價格等,都需要利用眾數(shù)適用:主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)注意:有些數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)9眾數(shù)
(眾數(shù)的不唯一性)無眾數(shù)
原始數(shù)據(jù):10591268一個眾數(shù)
原始數(shù)據(jù):659855多于一個眾數(shù)
原始數(shù)據(jù):25282836424210眾數(shù)的計算方法**品質變量的眾數(shù)——觀察次數(shù),出現(xiàn)次數(shù)最多的變量值就是眾數(shù)。
例如:企業(yè)的所有制結構分布、人口的城鄉(xiāng)分布。**數(shù)值變量的眾數(shù)未分組資料——觀察次數(shù),出現(xiàn)次數(shù)最多的數(shù)據(jù)就是眾數(shù)。分組資料(1)單項式數(shù)列——直接觀察,次數(shù)最多的組的變量值即為眾數(shù)。
11定類數(shù)據(jù)的眾數(shù)
【例】根據(jù)表4-1中的數(shù)據(jù),計算眾數(shù)解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調查的200人當中,關注商品廣告的人數(shù)最多,為112人,占總被調查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即
Mo=商品廣告12定序數(shù)據(jù)的眾數(shù)
【例】根據(jù)表4-2中的數(shù)據(jù),計算眾數(shù)解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即
Mo=不滿意13[例]單項式變量數(shù)列確定眾數(shù)實例
表4-3某市居民家庭按家庭人口數(shù)分組
由上表可以看出,家庭人口數(shù)為3人的家庭數(shù)最多,因此本例中家庭人口數(shù)的眾數(shù)為3人。14數(shù)值型分組數(shù)據(jù)的眾數(shù)
1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2.相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo3.相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo15算例164.1.2順序數(shù)據(jù):中位數(shù)和分位數(shù)1.中位數(shù)me集中趨勢的測度值之一排序后處于中間位置上的值不受極端值的影響主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即Me50%50%17原始數(shù)據(jù):
2422212620位
置: 12345中位數(shù)的計算排序: 2021222426原始數(shù)據(jù):
10591268位
置:123456 排序: 56891012中位數(shù)=(8+9)/2=8.518計算公式未分組數(shù)據(jù)的中位數(shù)數(shù)值型分組數(shù)據(jù)的中位數(shù)19
例:某企業(yè)50名工人加工零件中位數(shù)計算表,計算50名工人日加工零件數(shù)的中位數(shù)Sm-1Sm+1202.四分位數(shù) 人們經(jīng)常會將數(shù)據(jù)劃分為4個部分,每一個部分大約包含有1/4即25%的數(shù)據(jù)項。QLQMQU25%25%25%25%1.集中趨勢的測度值之一2.排序后處于25%和75%位置上的值3.不受極端值的影響4.主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)21四分位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N422計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:下四分位數(shù)(QL)的位置為:
QL位置=(300)/4=75
上四分位數(shù)(QL)的位置為:
QU位置=(3×300)/4=225從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此
QL
=不滿意
QU
=一般23原始數(shù)據(jù):23213032282526排序:21232526283032位置:1 23 4567QL=23N+17+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30數(shù)值型未分組數(shù)據(jù)的四分位數(shù)24原始數(shù)據(jù):232130282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)
=28.525數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計算公式)上四分位數(shù):
下四分位數(shù):
26計算50名工人日加工零件數(shù)的四分位數(shù)QL位置=50/4=12.5QU位置=3×50/4=37.5274.1.3數(shù)值型數(shù)據(jù):均值1.集中趨勢的測度值之一2.最常用的測度值3.一組數(shù)據(jù)的均衡點所在4.易受極端值的影響5.用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)28均值的種類及計算
1.算術平均數(shù)**
(1)概念
算術平均數(shù)又稱平均值,是用一組數(shù)據(jù)中所有值之和除以該組數(shù)據(jù)的個數(shù)。
(2)基本公式29平均數(shù)計算公式設一組數(shù)據(jù)為:X1,X2,…,XN簡單均值的計算公式為設分組后的數(shù)據(jù)為:X1,X2,…,XK
相應的頻數(shù)為:F1,F(xiàn)2,…,F(xiàn)K加權均值的計算公式為30簡單均值(算例)原始數(shù)據(jù): 10 5 9 13 6 8加權均值(算例4.7)31(1)算術平均數(shù)的大小,不僅取決于研究對象的變量值(x),而且受各變量值重復出現(xiàn)的頻數(shù)(f)或頻率(f/∑f)大小的影響,頻數(shù)或頻率較大,該組數(shù)據(jù)的大小對算術平均數(shù)的影響就大,反之則小。(2)權數(shù)的表現(xiàn)形式問題:絕對權數(shù)與相對權數(shù)注意事項32是非標志的平均數(shù)是非標志:如果按照某種標志把總體只能分為具有某種特征的單位和不具有該種特征的單位兩部分,這個標志就是是非標志。平均數(shù)的計算:把具有某種特征的用“1”表示,不具有該種特征的用“0”表示。
33加權平均數(shù)(權數(shù)對平均數(shù)的影響)甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據(jù)如下甲組:考試成績(X):020100人數(shù)分布(F):118乙組:考試成績(X):020100人數(shù)分布(F):811X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi12(分)34平均數(shù)(數(shù)學性質)1. 各變量值與均值的離差之和等于零
2.各變量值與均值的離差平方和最小35性質(3、4)3、給每個變量值增加或減少一個任意數(shù)A,則算術平均數(shù)也相應增增加或減少這個任意數(shù)A。4、給每個變量值乘以或除以一個任意數(shù)A,則算術平均數(shù)也相應擴大或縮小A倍。362.調和平均數(shù)(1)概念:
調和平均數(shù)又稱倒數(shù)平均數(shù),是各個變量值倒數(shù)的算術平均數(shù)的倒數(shù)。
(2)計算簡單調和平均數(shù):針對未分組資料。計算公式為:372.調和平均數(shù)
加權調和平均數(shù):針對分組資料。
計算公式為:
其中:
是一種特殊權數(shù),它不是各組變量值出現(xiàn)的次數(shù),表示各組標志總量。即38[例]根據(jù)某商場職工月工資資料計算月平均工資。
某商場職工月工資資料393.幾何平均數(shù)(1)概念:幾何平均數(shù)(geometricmean)又稱對稱平均數(shù),它是各變量值乘積的n次方根。(2)計算基本公式:
對數(shù)公式:在實際工作中,由于變量個數(shù)較多,通常要應用對數(shù)來進行計算。即
40(3)幾何平均數(shù)的應用及特點
①應用條件現(xiàn)象的總比率是若干項變量的乘積,或現(xiàn)象的總發(fā)展速度是各時期發(fā)展速度的連乘積時,計算平均比率或平均發(fā)展速度。②特點a.如果數(shù)列中有一個標志值等于零或負值,則無法計算。b.受極端值影響較小,故較穩(wěn)健。41幾何平均數(shù)(算例)【例4.10】一位投資者持有一種股票,2001-2004年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率。平均收益率=108.0787%-1=8.0787%42例1:某企業(yè)的一條生產(chǎn)流水線有四道工序,每一道工序完成的產(chǎn)品都要作一次質量檢查,只有合格的中間件才進入下一道工序。工序C工序A工序B工序D合格率98%合格率97%合格率94%合格率95%請問:平均合格率=?適用于連續(xù)作業(yè)的情況:43例2:據(jù)網(wǎng)上報到,成都溫江的蘭花節(jié)(2006年2月27日)上,一盆蘭花賣價是1100萬元,這背后是迅速壯大的10萬戶成都養(yǎng)蘭、炒蘭戶,不少人是在借高利貸炒蘭,圖謀暴利。紅荷黃金海岸龍女彩蝶設某炒蘭投資者從朋友處借得一筆高利貸,以季度為結算單位,每個季度生成的利息到期自動轉為本金,一年連本帶利付清。各季利率根據(jù)蘭花價格變化適當調整。實際一年下來,第一季度的利率是3%,第二季度的利率是3.2%,第三季度的利率是3.6%,第四季度的利率是2.8%。問:平均利率是多少?44
解答:本題需要注意的是,不能夠直接對利率進行幾何平均,而應該通過連本帶利計算,即若借款總額為L萬元,則一年之后的付款額(本息和)為:如果平均利率為G,則應該有:451.算術平均數(shù)易受極端值影響;2.調和平均數(shù)也受極端值影響,但受極小值影響較大;3.幾何平均數(shù)受極端值影響較小。對同一資料來說:幾何平均數(shù)大于調和平均數(shù)而小于算術平均數(shù),即有:一般來說:46各種平均數(shù)的比較(一)各種平均數(shù)的特點及應用場合是就全部數(shù)據(jù)計算的,具有優(yōu)良的數(shù)學性質,實際中應用最為廣泛。其主要缺點是易受極端值的影響,對偏態(tài)分布其代表性較差。H主要用于不能直接計算的數(shù)據(jù)易受極端值的影響。G主要用于計算比率數(shù)據(jù)的平均數(shù),易受極端值的影響。不受極端值大小的影響,對偏態(tài)分布其代表性較好。但不是根據(jù)所有的變量值計算的.不受極端值的影響,對偏態(tài)分布其代表性較好.但不是根據(jù)所有的變量值計算的.47左偏分布均值
中位數(shù)
眾數(shù)對稱分布
均值=中位數(shù)=
眾數(shù)右偏分布眾數(shù)
中位數(shù)均值中位數(shù)、眾數(shù)和算術平均數(shù)的關系48494.2離散程度的度量數(shù)據(jù)分布的另一個重要特征離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述反映各變量值遠離其中心值的程度,因此也稱為離中趨勢從另一個側面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值504.2.1分類數(shù)據(jù):異眾比率1. 離散程度的測度值之一2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 計算公式為
4.用于衡量眾數(shù)的代表性51異眾比率(算例)根據(jù)表中的數(shù)據(jù),計算異眾比率解:在所調查的200人當中,關注非商品廣告的人數(shù)占44%,異眾比率還是比較大。因此,用“商品廣告”來反映城市居民對廣告關注的一般趨勢,其代表性不是很好
Vr=200-112200
=1-112200
=0.44=44%524.2.2順序數(shù)據(jù):四分位差1. 離散程度的測度值之一2. 也稱為內(nèi)距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差QD=QU-QL4. 反映了中間50%數(shù)據(jù)的離散程度5.不受極端值的影響6.用于衡量中位數(shù)的代表性53四分位差(定序數(shù)據(jù)的算例)根據(jù)表中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位差解:設非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知QL=不滿意=2,
QU=一般=3四分位差:
QD=QU-QL =3–2=1544.2.3數(shù)值型數(shù)據(jù):方差和標準差1.極差1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù)R
=max(Xi)-min(Xi).=組距分組數(shù)據(jù)R
最高組上限-最低組下限5.計算公式為55第一組:60,70,80,90,100第二組:78,79,80,81,82很明顯,兩個小組的考試成績平均分都是80分,但是哪一組的分數(shù)比較集中呢?如果用全距指標來衡量,則有R甲=100-60=40(分)R乙=82-78=4(分)這說明第一組資料的標志變動度或離中趨勢遠大于第二組資料的標志變動度。例:有兩個學習小組的統(tǒng)計學開始成績分別為:562.平均差1.離散程度的測度值之一2.各變量值與其均值離差絕對值的平均數(shù)3.能全面反映一組數(shù)據(jù)的離散程度4.數(shù)學性質較差,實際中應用較少5.計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)57平均差(計算過程及結果)某廠按月收入水平分組的組距數(shù)列如表中前兩列,計算平均差。583.方差和標準差離散程度的測度值之一最常用的測度值反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4681012X=8.359總體方差和標準差(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式60總體標準差(計算過程及結果)根據(jù)表中的數(shù)據(jù),計算工人日加工零件數(shù)的標準差61樣本方差和標準差(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!62樣本方差自由度一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當樣本數(shù)據(jù)的個數(shù)為n
時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當x=5確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 11856.1-2025烈性酒質量要求第1部分:威士忌
- GB 19081-2025飼料加工系統(tǒng)粉塵防爆安全規(guī)范
- 勞動合同范本 派遣
- 養(yǎng)殖場清糞車購銷合同范本
- 區(qū)域銷售協(xié)議合同范本醫(yī)藥
- 包裝印刷公司采購合同范本
- 買宅地合同范例
- 上海住房合同范本
- 個人與團隊提成合同范本
- 線上按摩技師合同范本
- 部編版小學(2024版)小學道德與法治一年級下冊《有個新目標》-第一課時教學課件
- 稅法(第5版) 課件 第13章 印花稅
- 2024-2025學年廣州市高二語文上學期期末考試卷附答案解析
- 咖啡店合同咖啡店合作經(jīng)營協(xié)議
- 2025年山東鋁業(yè)職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 全套電子課件:技能成就夢想
- 2024年教育公共基礎知識筆記
- 2025年江蘇農(nóng)林職業(yè)技術學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 異構數(shù)據(jù)融合技術-深度研究
- 北京市朝陽區(qū)2024-2025學年七年級上學期期末考試數(shù)學試卷(含答案)
- 2024年湖南汽車工程職業(yè)學院單招職業(yè)技能測試題庫標準卷
評論
0/150
提交評論