版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第三章描述統(tǒng)計:數(shù)值方法3.1
集中趨勢的度量
3.2離中趨勢的度量
3.3分布形態(tài)的度量第三章描述統(tǒng)計:數(shù)值方法3.1集中趨勢的度量學(xué)習(xí)目標(biāo):學(xué)習(xí)本章后,應(yīng)該做到:1.了解數(shù)據(jù)分布特征主要應(yīng)從集中趨勢的度量、離散程度的度量、分布形態(tài)的度量三個方面進行測度;2.掌握反映數(shù)據(jù)集中趨勢和離散程度的測度方法;3.理解各種測度值的特點和應(yīng)用原則;4.掌握反映分布形態(tài)的偏態(tài)與峰態(tài)的含義及測度方法。學(xué)習(xí)目標(biāo):
數(shù)據(jù)分布的特征
集中趨勢(位置)離中趨勢
(分散程度)偏態(tài)和峰態(tài)(形狀)
數(shù)據(jù)分布的特征
集中趨勢離中趨勢偏態(tài)和峰態(tài)集中趨勢
(centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度(度量)集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值集中趨勢
(centraltendency)一組數(shù)據(jù)向其中3.1集中趨勢的度量均值眾數(shù)中位數(shù)分位數(shù)3.1集中趨勢的度量均值一、均值(mean)(一)均值的概念集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響3.1集中趨勢的度量一、均值(mean)3.1集中趨勢的度量(二)均值的算法1、簡單均值(simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn總體均值樣本均值3.1集中趨勢的度量(二)均值的算法總體均值樣本均值3.1集中趨勢的度量簡單均值
(例題分析)
【例】某班級40名同學(xué)統(tǒng)學(xué)的考試成績:該班40名同學(xué)統(tǒng)計學(xué)的平均成績?yōu)椋汉唵尉?/p>
(例題分析)
【例】某班級40名同學(xué)統(tǒng)學(xué)的考試成2、加權(quán)均值(weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xk相應(yīng)的頻數(shù)為:f1,f2,…,fk總體均值3.1集中趨勢的度量
簡寫為:2、加權(quán)均值(weightedmean)總體均值3.13.1集中趨勢的度量樣本均值簡寫為:3.1集中趨勢的度量樣本均值簡寫為:3.1集中趨勢的度量當(dāng):權(quán)數(shù)為頻率時:3.1集中趨勢的度量當(dāng):權(quán)數(shù)為頻率某班級40名同學(xué)統(tǒng)計學(xué)的考試成績:該班40名同學(xué)統(tǒng)計學(xué)的平均成績?yōu)椋?/p>
加權(quán)均值(權(quán)數(shù):f
)
(例題分析)某班級40名同學(xué)統(tǒng)計學(xué)的考試成績:該班40名同學(xué)統(tǒng)計學(xué)的平
加權(quán)均值(權(quán)數(shù):
)
(例題分析)
加權(quán)均值(權(quán)數(shù):)
(例題分析)
加權(quán)均值
(權(quán)數(shù)對均值的影響)甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下:甲組:
考試成績(x): 020100
人數(shù)分布(f):
118乙組:
考試成績(x): 020100
人數(shù)分布(f):
811加權(quán)均值
(權(quán)數(shù)對均值的影響)甲乙兩組各有10相對數(shù)的平均數(shù)【例】某公司所屬11個企業(yè)資金利潤率分組資料如下表,要求計算該公司11個企業(yè)的平均利潤率:
該公司11個企業(yè)的平均利潤率為:相對數(shù)的平均數(shù)【例】某公司所屬11個企業(yè)資金利潤率分組資料如均值的數(shù)學(xué)性質(zhì)1.數(shù)值觀測值與均值的離差之和等于0或2.數(shù)值觀測值與均值的離差平方和最小或3.均值易受極端值的影響均值的數(shù)學(xué)性質(zhì)1.數(shù)值觀測值與均值的離差之和等于0或2.關(guān)于均值的一個笑話“張家有財一千萬,九個鄰居窮光蛋,平均起來算一算,個個都是張百萬!”這個笑話,說明了什么問題?關(guān)于均值的一個笑話“張家有財一千萬,九個鄰居窮光蛋,平均起來二、眾數(shù)(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)3.1集中趨勢的度量二、眾數(shù)(mode)3.1集中趨勢的度量眾數(shù)
(不惟一性)無眾數(shù)
原始數(shù)據(jù):10591268一個眾數(shù)
原始數(shù)據(jù):659855多于一個眾數(shù)
原始數(shù)據(jù):252828
364242眾數(shù)
(不惟一性)無眾數(shù)
原始數(shù)據(jù):101.用于數(shù)值型分組數(shù)據(jù)2.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)3.相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)4.相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下面的計算公式:分組數(shù)據(jù)的眾數(shù)
(要點及計算公式)5.該公式假定眾數(shù)組的頻數(shù)在該眾數(shù)組內(nèi)均勻分布1.用于數(shù)值型分組數(shù)據(jù)分組數(shù)據(jù)的眾數(shù)
(要點及計算公式)分組數(shù)據(jù)的眾數(shù)計算解釋分組數(shù)據(jù)的眾數(shù)計算解釋
分組數(shù)據(jù)的眾數(shù)
(例題分析)【例】某地區(qū)120家企業(yè)按利潤額進行分組,結(jié)果如下:分組數(shù)據(jù)的眾數(shù)
(例題分析)【例】某地區(qū)121.排序后處于中間位置上的值Me50%50%2.不受極端值的影響3.各變量值與中位數(shù)的離差絕對值之和最小,即3.1集中趨勢的度量三、中位數(shù)(median)(一)中位數(shù)的概念1.排序后處于中間位置上的值Me50%50%2.不受極端值原始數(shù)據(jù):分組數(shù)據(jù):3.1集中趨勢的度量(二)中位數(shù)的位置原始數(shù)據(jù):分組數(shù)據(jù):3.1集中趨勢的度量(二)中位中位數(shù)的求法
(9個數(shù)據(jù)的算例)【例】
9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:7507808509601080
1250150016302000位置:1234
56789中位數(shù)1080中位數(shù)的求法
(9個數(shù)據(jù)的算例)【例】9個家庭的人中位數(shù)的求法
(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:1234
5678910
中位數(shù)的求法
(10個數(shù)據(jù)的算例)【例】:10個家庭的人均分組數(shù)據(jù)的中位數(shù)
(要點及計算公式)1.用于數(shù)值型分組數(shù)據(jù)2.根據(jù)位置公式確定中位數(shù)所在的組3.下限與上限計算公式分別為:4.該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布分組數(shù)據(jù)的中位數(shù)
(要點及計算公式)1.用于數(shù)值型分組數(shù)據(jù)分組數(shù)據(jù)的中位數(shù)
(例題分析)【例】某地區(qū)120家企業(yè)按利潤額進行分組,結(jié)果如下:分組數(shù)據(jù)的中位數(shù)
(例題分析)【例】某地區(qū)1四、分位數(shù)(quartile)(一)分位數(shù)的概念1.排序后處于25%和75%位置上的值不受極端值的影響QLQMQU25%25%25%25%3.1集中趨勢的度量四、分位數(shù)(quartile)不受極端值的影響QLQMQU2原始數(shù)據(jù):分組數(shù)據(jù):3.1集中趨勢的度量(二)分位數(shù)的位置原始數(shù)據(jù):分組數(shù)據(jù):3.1集中趨勢的度量(二)分位分位數(shù)的求法
(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789分位數(shù)的求法
(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收四分位數(shù)的求法
(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:1234
5678910
四分位數(shù)的求法
(10個數(shù)據(jù)的算例)【例】:10個家庭的人眾數(shù)、中位數(shù)和均值的關(guān)系左偏分布均值
中位數(shù)
眾數(shù)對稱分布
均值=中位數(shù)=
眾數(shù)右偏分布眾數(shù)
中位數(shù)均值3.1集中趨勢的度量眾數(shù)、中位數(shù)和均值的關(guān)系左偏分布均值中位數(shù)眾數(shù)對稱分同時經(jīng)驗表明,在適度偏斜的情況下,眾數(shù)與中位數(shù)的距離約為中位數(shù)與均值距離的2倍。即:則:3.1集中趨勢的度量同時經(jīng)驗表明,在適度偏斜的情況下,眾數(shù)與中位數(shù)的距離約為中位眾數(shù)、中位數(shù)、均值的特點和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應(yīng)用均值易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用眾數(shù)、中位數(shù)、均值的特點和應(yīng)用眾數(shù)3.2離散程度的度量一、全距二、內(nèi)距三、方差和標(biāo)準(zhǔn)差四、標(biāo)準(zhǔn)分?jǐn)?shù)五、離散系數(shù)3.2離散程度的度量一、全距離中程度測度的作用離散程度就是測度各變量值遠(yuǎn)離其中心值的程度,有以下的作用:1.判斷平均數(shù)對一組數(shù)據(jù)代表性的高低2.離散程度的測度值可以對社會經(jīng)濟活動過程的穩(wěn)定性和均衡性進行評價3.離散程度的測度值是統(tǒng)計推斷理論中一個很重要的基礎(chǔ)指標(biāo)4.離散程度的測度值是衡量風(fēng)險大小的重要指標(biāo)離中程度測度的作用離散程度就是測度各變量值遠(yuǎn)離其中心值的程度一、全距(rang)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910
R
=max(xi)-min(xi)計算公式為:3.2離散程度的度量一、全距(rang)7891078910二、內(nèi)距(Inter-QuartileRange,IQR)
也稱四分位差上四分位數(shù)與下四分位數(shù)之差內(nèi)距=QU
–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性3.2離散程度的度量二、內(nèi)距(Inter-QuartileRange,IQR)三、方差與標(biāo)準(zhǔn)差(VarianceandStandarddeviation)(一)方差與標(biāo)準(zhǔn)差的概念離散程度的測度值之一最常用的測度值反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差可用于衡量均值的代表性大小4681012x=8.33.2離散程度的度量三、方差與標(biāo)準(zhǔn)差(VarianceandStandard(二)總體方差和標(biāo)準(zhǔn)差方差的計算公式標(biāo)準(zhǔn)差的計算公式未分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):組距分組數(shù)據(jù):3.2離散程度的度量(二)總體方差和標(biāo)準(zhǔn)差方差的計算公式標(biāo)準(zhǔn)差的計算公式未分組數(shù)總體標(biāo)準(zhǔn)差
(例題分析)
含義:每個同學(xué)的成績與平均成績相比,平均相差10.14分【例】某班級40名同學(xué)統(tǒng)計學(xué)的考試成績:總體標(biāo)準(zhǔn)差
(例題分析)含義:每個同學(xué)的成績與平均成績相樣本方差和標(biāo)準(zhǔn)差方差的計算公式標(biāo)準(zhǔn)差的計算公式未分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):組距分組數(shù)據(jù):3.2離散程度的度量樣本方差和標(biāo)準(zhǔn)差方差的計算公式標(biāo)準(zhǔn)差的計算公式未分組數(shù)據(jù):未注解:樣本方差自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為
n時,若樣本均值x
確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x
=5。當(dāng)x
=5
確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋,從實際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量3.2離散程度的度量注解:樣本方差自由度(degreeoffreedom)一方差的數(shù)學(xué)性質(zhì)1.變量的方差等于變量平方的平均數(shù)減去變量平均數(shù)的平方
各變量值對算術(shù)平均數(shù)的方差,小于等于對任意常數(shù)的方差≤方差的數(shù)學(xué)性質(zhì)1.變量的方差等于變量平方的平均數(shù)減去變量平均四、標(biāo)準(zhǔn)分?jǐn)?shù)1.標(biāo)準(zhǔn)分也稱標(biāo)準(zhǔn)化值2.
對某一個值在一組數(shù)據(jù)中相對位置的度量3.
可用于判斷一組數(shù)據(jù)是否有離群點4.
用于對變量的標(biāo)準(zhǔn)化處理5.計算公式為3.2離散程度的度量四、標(biāo)準(zhǔn)分?jǐn)?shù)1.標(biāo)準(zhǔn)分也稱標(biāo)準(zhǔn)化值3.2離散程度的度量經(jīng)驗法則表明:當(dāng)一組數(shù)據(jù)對稱分布時約有68.27%的數(shù)據(jù)在平均數(shù)加減1個標(biāo)準(zhǔn)差的范圍之內(nèi)約有95.00%的數(shù)據(jù)在平均數(shù)加減1.96個標(biāo)準(zhǔn)差的范圍之內(nèi)約有95.45%的數(shù)據(jù)在平均數(shù)加減2個標(biāo)準(zhǔn)差的范圍之內(nèi)約有99.73%的數(shù)據(jù)在平均數(shù)加減3個標(biāo)準(zhǔn)差的范圍之內(nèi)
經(jīng)驗法則經(jīng)驗法則表明:當(dāng)一組數(shù)據(jù)對稱分布時經(jīng)驗法則3.2離散程度的度量三只大象:6990,7000,7010三只兔子:2,4,6
判斷:誰的體重差異大?平均體重的代表性強?
一個例子3.2離散程度的度量三只大象:6990,7000,701五、離散系數(shù)(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比2.對數(shù)據(jù)相對離散程度的測度3.消除了數(shù)據(jù)水平高低和計量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為3.2離散程度的度量五、離散系數(shù)(coefficientofvariatio離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企離散系數(shù)
(例題分析)結(jié)論:
計算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度
v1=536.25309.19=0.577v2=32.521523.09=0.710離散系數(shù)
(例題分析)結(jié)論:計算結(jié)果表明,v1<v2,說3.3分布形態(tài)的度量一、偏態(tài)-----偏度二、峰態(tài)-----峰度3.3分布形態(tài)的度量偏態(tài)與峰態(tài)分布的形狀左偏分布扁平分布右偏分布尖峰分布與標(biāo)準(zhǔn)正態(tài)分布比較!偏態(tài)峰態(tài)偏態(tài)與峰態(tài)分布的形狀左偏分布扁平分布右偏分布尖峰分布與標(biāo)準(zhǔn)正一、偏態(tài)及其測度(一)偏態(tài)的概念1.統(tǒng)計學(xué)家Pearson于1895年首次提出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)業(yè)機械智能化發(fā)展-深度研究
- 智能交通倫理挑戰(zhàn)-深度研究
- 企業(yè)文化與企業(yè)形象-深度研究
- 聲學(xué)層析成像技術(shù)-深度研究
- 時尚產(chǎn)業(yè)消費趨勢洞察-深度研究
- 2025年廣州華夏職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年??及鎱⒖碱}庫含答案解析
- 2025年天津生物工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年??及鎱⒖碱}庫含答案解析
- 2025年天津渤海職業(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 2025年天津廣播影視職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025至2030年中國多菌泥數(shù)據(jù)監(jiān)測研究報告
- 【探跡科技】2024知識產(chǎn)權(quán)行業(yè)發(fā)展趨勢報告-從工業(yè)轟鳴到數(shù)智浪潮知識產(chǎn)權(quán)成為競爭市場的“矛與盾”
- 《中國政法大學(xué)》課件
- GB/T 35270-2024嬰幼兒背帶(袋)
- 遼寧省沈陽名校2025屆高三第一次模擬考試英語試卷含解析
- 2024-2025學(xué)年高二上學(xué)期期末數(shù)學(xué)試卷(新題型:19題)(基礎(chǔ)篇)(含答案)
- 2022版藝術(shù)新課標(biāo)解讀心得(課件)小學(xué)美術(shù)
- Profinet(S523-FANUC)發(fā)那科通訊設(shè)置
- 醫(yī)學(xué)教程 常見化療藥物歸納
- 統(tǒng)編版九年級歷史下冊第一單元教案教學(xué)設(shè)計
- GB/T 25000.51-2016系統(tǒng)與軟件工程系統(tǒng)與軟件質(zhì)量要求和評價(SQuaRE)第51部分:就緒可用軟件產(chǎn)品(RUSP)的質(zhì)量要求和測試細(xì)則
- 外科學(xué)試題庫及答案(共1000題)
評論
0/150
提交評論