




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2023/2/41同濟大學(xué)經(jīng)濟與管理學(xué)院
柯華應(yīng)用統(tǒng)計學(xué)2023/2/42本章教學(xué)目標:度量中心(集中)趨勢的指標度量離散程度(變異性)的指標度量偏斜程度的指標度量兩種數(shù)值變量關(guān)系的指標掌握利用Office軟件計算各種統(tǒng)計指標第3章統(tǒng)計數(shù)據(jù)的描述度量2023/2/43§3.1度量集中趨勢的平均指標平均指標是說明社會經(jīng)濟現(xiàn)象一般水平
的統(tǒng)計指標,反映標志值分布的集中趨勢
平均指標按計算方式可分為數(shù)值平均數(shù)和位置平均數(shù)兩大類2023/2/44——是根據(jù)總體各單位所有標志值計算出的平均數(shù)。包括算術(shù)平均數(shù)、幾何平均數(shù)。(一)算術(shù)平均數(shù)(ArithmeticMean)算術(shù)平均數(shù)的基本公式一.數(shù)值平均數(shù)
2023/2/45
(1)簡單算術(shù)平均數(shù)算術(shù)平均數(shù)的計算
n—總體單位總數(shù);xi—第i
個單位的標志值。
xi
—第i組的代表值(組中值或該組變量值);
fi—第i組的頻數(shù)。(2)加權(quán)算術(shù)平均數(shù)
2023/2/46單項數(shù)列分組數(shù)列2023/2/47使用Excel函數(shù)求加權(quán)算術(shù)平均數(shù)利用Excel“數(shù)學(xué)和三角函數(shù)”中的SUMPRODUCT函數(shù)可以方便地計算出分組數(shù)據(jù)的加權(quán)算術(shù)平均數(shù)。語法規(guī)則:格式:SUMPRODUCT(<區(qū)域1>,<區(qū)域2>,…)功能:返回兩個或多個區(qū)域中對應(yīng)元素乘積之和。
例:利用比特啤酒公司各銷售點分組頻數(shù)分布數(shù)據(jù),求各銷售點的平均銷售量。
2023/2/48(二)幾何平均數(shù)(GeometricMean)當統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩環(huán)比數(shù)據(jù),要求每時期的平均發(fā)展速度時,就需要使用幾何平均數(shù)。幾何平均數(shù)是n個數(shù)連續(xù)乘積的n次方根。1.簡單幾何平均數(shù)
2.加權(quán)幾何平均數(shù)fi—各比率出現(xiàn)的頻數(shù)
2023/2/49例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增長率。解一:解二:
年平均增長率=1.0688-1=6.88%
2023/2/41050%decrease100%increase算術(shù)平均數(shù):幾何平均數(shù):2023/2/411使用Excel求幾何平均數(shù)可以使用Excel統(tǒng)計函數(shù)中的GEOMEAN函數(shù)返回幾何平均數(shù)語法規(guī)則:格式:GEOMEAN(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的幾何平均數(shù)。
2023/2/412位置平均數(shù)是根據(jù)總體標志值所處的特殊位置確定的一類平均指標。包括中位數(shù)和眾數(shù)兩種。(一)中位數(shù)(Median)——將總體各單位標志值按由小到大的順序排列后處于中間位置的標志值稱為中位數(shù),記為Me
。中位數(shù)是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。當統(tǒng)計資料中含有異常的或極端的數(shù)據(jù)時,中位數(shù)比算術(shù)平均數(shù)更具有代表性。比如有5筆付款:9元,10元,10元,11元,60元付款的均值為20元,顯然這并不是一個很好的代表值,而中位數(shù)
Me
=10元則更能代表平均每筆的付款數(shù)。二.位置平均數(shù)2023/2/413使用Excel的統(tǒng)計函數(shù)返回未分組數(shù)據(jù)的中位數(shù)可以使用Excel統(tǒng)計函數(shù)中的MEDIAN函數(shù)返回未分組數(shù)據(jù)的中位數(shù)。格式:MEDIAN(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的中位數(shù)。
0123456789100123456789101214Median=5Median=52023/2/414分組數(shù)據(jù)中位數(shù)的確定
對于分組數(shù)據(jù)的統(tǒng)計資料,中位數(shù)要用插值法來估算。
(1)計算各組的累計頻數(shù);
(2)確定中位數(shù)所在的組
——是累計頻數(shù)首次包含中位數(shù)位次Σf/2的組。其中:L—中位數(shù)所在組的下限;
Sm-1—中位數(shù)所在組前一組的累計頻數(shù);
fm—中位數(shù)所在組的頻數(shù);
d—中位數(shù)所在組的組距。
2023/2/415例:計算下表數(shù)據(jù)的中位數(shù)解:Σf/2=27.5,中位數(shù)在“15-25”的組中,
2023/2/416(二)眾數(shù)(Mode)——是總體中出現(xiàn)次數(shù)最多的標志值,記為M
0。眾數(shù)明確反映了數(shù)據(jù)分布的集中趨勢,也是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。但并非所有數(shù)據(jù)集合都有眾數(shù),也可能存在多個眾數(shù)。在某些情況下,眾數(shù)是一個較好的代表值。例如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在進行生產(chǎn)和存貨決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。又如,當要了解大多數(shù)家庭的收入狀況時,也要用到眾數(shù)。
2023/2/417未分組數(shù)據(jù)眾數(shù)的確定在數(shù)據(jù)量很大的時候,可以使用Excel統(tǒng)計函數(shù)中的MODE函數(shù)返回眾數(shù)。格式:MODE(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的眾數(shù)。
01234567891011121314Mode=92023/2/418分組數(shù)據(jù)眾數(shù)的確定對于分組數(shù)據(jù)的統(tǒng)計資料,眾數(shù)也要用插值法來估算。(1)確定眾數(shù)所在的組對于等距分組,眾數(shù)組是頻數(shù)最高的組;(2)使用以下插值公式計算其中:L—眾數(shù)組的下限Δ1—眾數(shù)組與前一組的頻數(shù)之差Δ2—眾數(shù)組與后一組的頻數(shù)之差
d—眾數(shù)組的組距Δ1Δ2眾數(shù)Ld2023/2/419例:計算下表數(shù)據(jù)的眾數(shù)解:眾數(shù)組是“15-25”的組,則
2023/2/420三.算術(shù)平均數(shù)和位置平均數(shù)間的關(guān)系1.頻數(shù)分布呈完全對稱的單峰分布,算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相同0xf(Me,M0)0xfMeM00xfMeM02.頻數(shù)分布為右偏態(tài)時,眾數(shù)小于中位數(shù),算術(shù)平均數(shù)大于中位數(shù)3.頻數(shù)分布為左偏態(tài)時,眾數(shù)大于中位數(shù),算術(shù)平均數(shù)小于中位數(shù)2023/2/421補充習(xí)題補充題:某地區(qū)私營企業(yè)注冊資金分組資料如下,求該地區(qū)私營企業(yè)注冊資金的平均數(shù)、中位數(shù)和眾數(shù)。2023/2/422
答案Σf/2=143/2=71.5,中位數(shù)所在“100~150”的組,眾數(shù)組為“100~150”的組,2023/2/423四分位數(shù)(Quartile)(概念要點)1.
集中趨勢的測度值之一2. 排序后處于25%和75%位置上的值
3.不受極端值的影響
4.可用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%2023/2/424未分組數(shù)據(jù)四分位數(shù)的確定規(guī)則1
如果結(jié)果是整數(shù),四分位數(shù)等于那個整數(shù)位置的數(shù)據(jù)。規(guī)則2
如果結(jié)果是半數(shù)(如2.5,3.5等),四分位數(shù)等于相鄰有序數(shù)據(jù)的平均數(shù)。規(guī)則3
如果結(jié)果既不是整數(shù)又不是半數(shù),結(jié)果取最接近的整數(shù),并選數(shù)據(jù)。下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)42023/2/425數(shù)值型未分組數(shù)據(jù)的四分位數(shù)
(7個數(shù)據(jù)的算例)原始數(shù)據(jù):
2321 3032 282526排序:2123
2526283032位置:1 23 4567QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=302023/2/426數(shù)值型未分組數(shù)據(jù)的四分位數(shù)
(6個數(shù)據(jù)的算例)原始數(shù)據(jù):
2321 30 282526排序:212325262830位置:1 2 3 4 56QL=23QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=282023/2/427
Excel中四分位數(shù)的計算過程
2023/2/428原始數(shù)據(jù):
2321 30 282526排序:212325262830位置:1 2 3 4 56QL=23+0.25*(25-23)=23.5QL位置=N-14=QU位置=3(N-1)4=4.75QU=26+0.75(28-26)=27.51+數(shù)值型未分組數(shù)據(jù)的四分位數(shù)
(6個數(shù)據(jù)的算例)2.251+2023/2/429數(shù)值型分組數(shù)據(jù)的四分位數(shù)
上四分位數(shù):
下四分位數(shù):
2023/2/430QL位置=50/4=12.5QU位置=3×50/4=37.5表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—數(shù)值型分組數(shù)據(jù)的四分位數(shù)
【例】根據(jù)第三章表中的數(shù)據(jù),計算50名工人日加工零件數(shù)的四分位數(shù)2023/2/431五數(shù)匯總和箱線圖Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%12304557702023/2/432右偏Right-Skewed左偏Left-SkewedSymmetric五數(shù)匯總和箱線圖2023/2/433上次課簡要回顧頻數(shù)分布表及其他圖表類型集中趨勢的度量指標加權(quán)算術(shù)平均數(shù)中位數(shù)眾數(shù)四分位數(shù)五數(shù)匯總2023/2/434x頻數(shù)要分析總體的分布規(guī)律,僅了解中心趨勢指標是不夠的,還需要了解數(shù)據(jù)的離散程度或差異狀況。幾個總體可以有相同的均值,但取值情況卻可以相差很大。
變異指標就是用來表示數(shù)據(jù)離散程度特征的。變異指標主要有:極差、平均差、標準差、變異系數(shù)和Z值。
§3.2度量離散程度的指標2023/2/435【案例】道格拉斯公司應(yīng)如何選擇供應(yīng)商道森公司和克拉克公司是道格拉斯公司的兩家供貨商。兩家供貨商都表示大約需要10個工作日交付定貨。下表是兩家供應(yīng)商定貨交付時間的歷史數(shù)據(jù)。今后道格拉斯公司應(yīng)選擇哪家供應(yīng)商供貨?2023/2/436一.極差(Range)極差也稱全距,是一組數(shù)據(jù)的最大值和最小值之差,通常記為R。顯然,一組數(shù)據(jù)的差異越大,其極差也越大。極差是最簡單的變異指標,它廣泛應(yīng)用于產(chǎn)品質(zhì)量管理中控制質(zhì)量的差異,一旦發(fā)現(xiàn)超過控制范圍,就采取措施加以糾正,以保證產(chǎn)品質(zhì)量的穩(wěn)定。但極差有很大的局限性,它僅考慮了兩個極端的數(shù)據(jù),沒有利用其余數(shù)據(jù)的信息,因而是一種比較粗糙的變異指標。
2023/2/438D4andD3arefromTable(n=5)2023/2/440UCL=8.232024681234567DayLCL=0R=3.894_Conclusion:Variationisincontrol2023/2/441二、四分位差
1. 離散程度的測度值之一2. 也稱為內(nèi)距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差
QD
=QU-QL4. 反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性2023/2/442二、四分位差Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%1230455770Interquartilerange=57–30=272023/2/443三.平均差平均差是各數(shù)據(jù)與其均值離差絕對值的算術(shù)平均數(shù),通常記為A·D。
平均差越大,反映數(shù)據(jù)間的差異越大。但由于使用了絕對值,其數(shù)學(xué)性質(zhì)很差,因而很少使用。
2023/2/444四.方差(Variance)和標準差(StandardDeviation)方差和標準差是應(yīng)用得最為廣泛的變異指標。標準差是方差的算術(shù)平方根,也稱均方差或根方差。
應(yīng)注意總體方差、標準差與樣本方差、標準差是有區(qū)別的。1.總體方差(PopulationVariance)和總體標準差(PopulationStandardDeviation)總體方差是各總體數(shù)據(jù)與其均值差平方的均值,記為
2,總體標準差記為。2023/2/4452.樣本方差與樣本標準差樣本方差記為
S
2,樣本標準差記為
S,在推斷統(tǒng)計中,它們分別是總體方差和標準差的優(yōu)良估計。其中:n為樣本容量,Xi為樣本觀察值為樣本均值。
2023/2/446未分組數(shù)據(jù)方差和標準差的計算方差和標準差的手工計算非常煩瑣,只要求掌握以下兩種方法。⑴使用計算器的統(tǒng)計功能(SD或STAT功能)⑵使用Excel的統(tǒng)計函數(shù) ①VARP(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)
功能:返回所有參數(shù)中數(shù)據(jù)的總體方差。 ②STDEVP(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)
功能:返回所有參數(shù)中數(shù)據(jù)的總體標準差。 ③VAR(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)
功能:返回所有參數(shù)中數(shù)據(jù)的樣本方差。 ④STDEV(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)
功能:返回所有參數(shù)中數(shù)據(jù)的樣本標準差。
2023/2/447分組數(shù)據(jù)的方差與標準差如果得到的是分組的頻數(shù)分布數(shù)據(jù),則方差與標準差的公式如下:其中Xi
是第i
組的組中值或標志值。
2023/2/448變異系數(shù)在對上海和南京兩地居民生活質(zhì)量調(diào)查發(fā)現(xiàn),上海居民平均月收入1800元,標準差為180元;南京居民平均月收入1200元,標準差為100元。問兩地居民收入差距哪個更大?2023/2/449Z值通常,Z值小于-3.0或大于+3.0時,認為數(shù)據(jù)中含有極端值2023/2/450是非標志的平均數(shù)和標準差在對社會經(jīng)濟現(xiàn)象進行分析時,經(jīng)常要將總體的所有單位按是否具有某種屬性劃分為兩組,即“是”與“非”的兩組。如將學(xué)生按性別分組,將產(chǎn)品按合格與否分組。又如在民意調(diào)查中,將被調(diào)查者按是否支持某位侯選人或是否贊成某項政策分為兩組等等。
2023/2/451(1)比例的概念——比例是指具有某種性質(zhì)或?qū)傩缘膯挝粩?shù)占總體全部單位數(shù)的比重(也稱成數(shù)),記為P。N1——總體中具有某一屬性的單位數(shù);N——總體單位總數(shù)。如產(chǎn)品中的次品率;全部人口或某單位職工中男、女的比率;某地區(qū)全部家庭中高(如月收入≥10000元)、中、低(月收入≤1000元)收入家庭各占的比重等。
2023/2/452(2)比例的平均數(shù)要計算比例的平均數(shù),需要將是非標志的標志表現(xiàn)進行量化處理。記1—代表具有某種屬性的標志表現(xiàn)0—代表不具有該屬性的標志表現(xiàn)N1——總體中具有該屬性的單位數(shù)N0——總體中不具有該屬性的單位數(shù)N——總體單位總數(shù)則由加權(quán)算術(shù)平均數(shù)的計算公式,比例的平均數(shù)為可知,比例的平均數(shù)就是其本身。
2023/2/453(3)比例的方差和標準差,由分組數(shù)據(jù)方差的計算公式:當P=0.5時,成數(shù)的標準差達到最大值,即
2023/2/454總體分布的特征不僅與均值和變異指標有關(guān),而且與分布的偏斜程度有關(guān),如對稱分布、右偏分布
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)購物合同范本
- 2025年新余貨運資格證模擬考試新題庫
- 上海賣房定金合同范本
- 儀器采購合同范本模板
- 農(nóng)業(yè)打藥合同范本
- 第五章 第二節(jié) 一 氣溫 世界氣溫的分布教學(xué)設(shè)計-2024-2025學(xué)年湘教版初中地理七年級上冊
- 業(yè)主安裝電梯合同范本
- 全國物業(yè)服務(wù)合同范本
- 代理經(jīng)銷產(chǎn)品合同范本
- 借款合同范本擔保人范本
- 變電站電網(wǎng)側(cè)儲能項目可行性研究報告
- 新版統(tǒng)編版一年級道德與法治下冊全冊教案(完整版)教學(xué)設(shè)計含教學(xué)反思
- 4.2 同學(xué)相伴 第二課時 課件 2024-2025學(xué)年三年級下冊道德與法治 統(tǒng)編版
- 城市開放空間-課件
- 2025年春季學(xué)期學(xué)校德育工作計劃安排表(完整版)
- 湖南2024年湖南省水利廳所屬事業(yè)單位招聘57人筆試歷年參考題庫附帶答案詳解
- 2025年全球及中國調(diào)頻儲能行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2024年加氫站技術(shù)規(guī)范
- 《幼兒教育政策與法規(guī)》教案-單元4 幼兒園的保育和教育
- 小學(xué)思政培訓(xùn)
- 《森林火災(zāi)預(yù)防與撲救技術(shù)課件教程》
評論
0/150
提交評論