版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章數(shù)據(jù)的概括性度量PowerPoint統(tǒng)計(jì)學(xué)概述
圖表只能對(duì)數(shù)據(jù)分布的形狀和特征有大致的了解,要更準(zhǔn)確地把握數(shù)據(jù)分布的特征,還需要找到分布特征的各個(gè)代表值:數(shù)據(jù)集中趨勢(shì)的代表值、數(shù)據(jù)離散程度的代表值、分布形狀的代表值等。第4章數(shù)據(jù)的概括性度量4.1
集中趨勢(shì)的度量4.2離散程度的度量4.3偏態(tài)與峰態(tài)的度量學(xué)習(xí)目標(biāo)1. 集中趨勢(shì)各測(cè)度值的計(jì)算方法2. 集中趨勢(shì)各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合3. 離散程度各測(cè)度值的計(jì)算方法4. 離散程度各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合偏態(tài)與峰態(tài)的測(cè)度方法用Excel計(jì)算描述統(tǒng)計(jì)量并進(jìn)行分析4.1集中趨勢(shì)的度量4.1.1分類數(shù)據(jù):眾數(shù)4.1.2順序數(shù)據(jù):中位數(shù)和分位數(shù)4.1.3數(shù)值型數(shù)據(jù):平均數(shù)4.1.4眾數(shù)、中位數(shù)和平均數(shù)的比較集中趨勢(shì)
(centraltendency)數(shù)據(jù)的集中趨勢(shì)
—一組數(shù)據(jù)向其中心值靠攏的傾向和程度測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值不同類型(分類、順序、數(shù)值)的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)分類數(shù)據(jù):眾數(shù)眾數(shù)
(mode)眾數(shù)
—一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用Mo表示適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)
(不惟一性)無(wú)眾數(shù)
原始數(shù)據(jù):10591268一個(gè)眾數(shù)
原始數(shù)據(jù):65
9855多于一個(gè)眾數(shù)
原始數(shù)據(jù):252828
364242分類數(shù)據(jù)的眾數(shù)
(P86:例4.1)不同類型軟飲的頻數(shù)分布
飲料類型頻數(shù)比例百分比(%)
果汁礦泉水綠茶其他碳酸飲料610118150.120.200.220.160.301220221630合計(jì)501100【例4.1】計(jì)算“飲料類型”的眾數(shù)解:這里的變量為“飲料類型”,這是個(gè)分類變量,不同類型的飲料就是變量值所調(diào)查的50人中,購(gòu)買碳酸飲料的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30%,因此眾數(shù)為“可口可樂(lè)”這一品牌,即
Mo=碳酸飲料順序數(shù)據(jù)的眾數(shù)
(P86:例4.2)【例4.2】計(jì)算甲城市居民對(duì)住房狀況的滿意程度評(píng)價(jià)的眾數(shù)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別”甲城市中對(duì)住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即
Mo=不滿意甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510合計(jì)300100.0眾數(shù)要點(diǎn)眾數(shù)是一個(gè)位置代表值,不受數(shù)據(jù)中極端值的影響眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,一組數(shù)據(jù)分布的最高峰點(diǎn)所對(duì)應(yīng)的數(shù)值即為眾數(shù)如果數(shù)據(jù)的分布沒(méi)有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)可能不存在。如果有兩個(gè)或多個(gè)最高峰點(diǎn),則可能存在多個(gè)眾數(shù)。(見(jiàn)P75:圖4-1)順序數(shù)據(jù):中位數(shù)和分位數(shù)中位數(shù)和分位數(shù)找出一組數(shù)據(jù)經(jīng)過(guò)排序后,處于某個(gè)位置上的值中位數(shù)
(median)中位數(shù)
—一組數(shù)據(jù)排序后,處于中間位置上的值,用Me表示Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對(duì)值之和最小,即中位數(shù)
(位置和數(shù)值的確定)位置確定數(shù)值確定順序數(shù)據(jù)的中位數(shù)
(例題分析)【例4.4】根據(jù)左表的數(shù)據(jù)求出甲城市家庭對(duì)住房滿意程度的中位數(shù)。解:中位數(shù)的位置為
(300+1)/2=150.5
從累計(jì)頻數(shù)看,中位數(shù)在“一般”這一組別中中位數(shù)為
Me=一般甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計(jì)300—數(shù)值型數(shù)據(jù)的中位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例4.3】以下為9個(gè)家庭的人均月收入數(shù)據(jù),求這些家庭人均收入的中位數(shù)。原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位數(shù)1080數(shù)值型數(shù)據(jù)的中位數(shù)
(10個(gè)數(shù)據(jù)的算例)【例】:以下為10個(gè)家庭的人均月收入數(shù)據(jù),求其中位數(shù)排序:
660
75078085096010801250150016302000位置:1234
5678910四分位數(shù)
(quartile)四分位數(shù)
—排序后處于25%和75%位置上的值不受極端值的影響計(jì)算公式QLQMQU25%25%25%25%注意:(1)若QL(QU)為整數(shù),則取QL(QU)對(duì)應(yīng)位置上的數(shù)值為四分位數(shù);(2)如果QL(QU)小數(shù)點(diǎn)后為0.5,則取該位置兩側(cè)的值的平均數(shù);(3)如果QL或QU小數(shù)點(diǎn)后為0.25或0.75,則取該位置下側(cè)值加上按比例分?jǐn)們蓚?cè)數(shù)值的差值。順序數(shù)據(jù)的四分位數(shù)
(例題分析)【例】根據(jù)左表數(shù)據(jù)求甲城市家庭對(duì)住房滿意程度的四分位數(shù)。解:QL位置=(300)/4=75QU位置=(3×300)/4
=225
從累計(jì)頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中四分位數(shù)為
QL
=不滿意
QU
=一般甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計(jì)300—數(shù)值型數(shù)據(jù)的四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例4.6】:根據(jù)以下9個(gè)家庭的人均月收入數(shù)據(jù),計(jì)算人均月收入的四分位數(shù)。原始數(shù)據(jù):15007507801080850960200012501630排序:750780850960108012501500
16302000位置:123456
789數(shù)值型數(shù)據(jù):平均數(shù)平均數(shù)
(mean)平均數(shù)
—也稱為均值,是一組數(shù)據(jù)相加后除以數(shù)據(jù)的個(gè)數(shù)得到的結(jié)果。僅適合數(shù)值型數(shù)據(jù),不適用于分類和順序數(shù)據(jù)集中趨勢(shì)的最常用測(cè)度值一組數(shù)據(jù)的均衡點(diǎn)所在易受極端值的影響有簡(jiǎn)單平均數(shù)和加權(quán)平均數(shù)之分根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總總體平均數(shù),記為;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為xx簡(jiǎn)單平均數(shù)
(Simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn(總體數(shù)據(jù)xN)樣本平均數(shù)總體平均數(shù)簡(jiǎn)單平均數(shù)的若干數(shù)學(xué)性質(zhì)若每個(gè)變量值X加減一任意常數(shù),則平均數(shù)也增減一個(gè)若每個(gè)變量值X乘以一任意常數(shù),則平均數(shù)也乘以一個(gè)若每個(gè)變量值X除以一任意常數(shù),則平均數(shù)也除以一個(gè)各個(gè)變量值X與算術(shù)平均數(shù)的離差和為零各個(gè)變量值X與算術(shù)平均數(shù)的離差平方和為最小值加權(quán)平均數(shù)
(Weightedmean)加權(quán)平均數(shù)
—根據(jù)分組數(shù)據(jù)計(jì)算的平均數(shù)設(shè)各組的組中值為:M1,M2,…,Mk
相應(yīng)的頻數(shù)為:f1,f2,…,fk樣本加權(quán)平均總體加權(quán)平均加權(quán)平均數(shù)
(例題分析)【例4.7】根據(jù)左表數(shù)據(jù)計(jì)算電腦銷售量的平均數(shù)。解:某電腦公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(Mi)頻數(shù)(fi)Mifi
140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845580139526404725370033152050
合計(jì)—12022200平均數(shù)的統(tǒng)計(jì)意義
平均數(shù)是一組數(shù)據(jù)的重心所在,是數(shù)據(jù)誤差相互抵消后的結(jié)果。反映出事物必然性的數(shù)量特征。在統(tǒng)計(jì)學(xué)中具有重要地位。幾何平均數(shù)
(geometricmean)幾何平均數(shù)
—n個(gè)變量值乘積的
n次方根適用于對(duì)比率數(shù)據(jù)的平均主要用于計(jì)算平均增長(zhǎng)率計(jì)算公式為可看作是平均數(shù)的一種變形幾何平均數(shù)
(例題分析)
【例4.8】一位投資者購(gòu)持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率算術(shù)平均:
幾何平均:注意:當(dāng)所平均的各比率數(shù)值相差不大時(shí),算術(shù)平均和幾何平均的結(jié)果相差不大,如果各比率的數(shù)值相差較大時(shí),二者的差別就很明顯。眾數(shù)、中位數(shù)和平均數(shù)的比較眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用眾數(shù)不受極端值影響具有不唯一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)應(yīng)用主要適合于數(shù)據(jù)量較大的分類數(shù)據(jù)的集中趨勢(shì)測(cè)量中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用主要適用于順序數(shù)據(jù)的集中趨勢(shì)測(cè)量平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用適用于數(shù)值型數(shù)據(jù)均值、中位數(shù)與眾數(shù)的關(guān)系對(duì)稱分布Mo=Me=X—均值、中位數(shù)與眾數(shù)的關(guān)系右偏分布Mo<Me<X—正偏(右偏)左偏分布<Me<Mo—X負(fù)偏(左偏)下列關(guān)于眾數(shù)的說(shuō)法,錯(cuò)誤的是()A.一組數(shù)據(jù)可能存在多個(gè)眾數(shù)B.眾數(shù)主要適用于分類數(shù)據(jù)C.眾數(shù)不受極端值的影響D.主要在數(shù)據(jù)分布對(duì)稱的情況下,用于對(duì)數(shù)據(jù)集中程度的度量
某居民區(qū)準(zhǔn)備采取一項(xiàng)新的物業(yè)管理措施,為此,隨機(jī)抽取了100戶居民進(jìn)行調(diào)查,其中表示贊成的有69戶,表示中立的有22戶,表示反對(duì)的有9戶。描述該數(shù)據(jù)的集中趨勢(shì)最好采用()A.眾數(shù)B.中位數(shù)C.四分位數(shù)D.平均數(shù)在某行業(yè)中隨機(jī)抽取10家企業(yè),第一季度的利潤(rùn)額(單位:萬(wàn)元)分別是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。該組數(shù)據(jù)的中位數(shù)為()A.28.46B.30.2C.27.95D.39.19練習(xí)(1)DBC練習(xí)P94:4.1(1)(2)4.2(1)(2)4.2離散程度的度量4.2.1分類數(shù)據(jù):異眾比率4.2.2順序數(shù)據(jù):四分位差4.2.3數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差4.2.4相對(duì)離散程度:離散系數(shù)離散程度數(shù)據(jù)的離散程度
—反映各變量值遠(yuǎn)離其中心值的程度(離散程度)數(shù)據(jù)分布的另一個(gè)重要特征從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值分類數(shù)據(jù):異眾比率異眾比率
(variationratio)異眾比率
—非眾數(shù)組的頻數(shù)占總頻數(shù)的比例,用Vr表示用于衡量眾數(shù)的代表程度,主要適合測(cè)度分類數(shù)據(jù)的離散程度(也適用于順序和數(shù)值型數(shù)據(jù))計(jì)算公式為fi為變量值的總頻數(shù),fm為眾數(shù)組的頻數(shù)Vr越大,表明眾數(shù)的代表性越差,數(shù)據(jù)不集中Vr越小,表明眾數(shù)的代表性越好,數(shù)據(jù)集中異眾比率
(例題分析)【例4.9】根據(jù)左表數(shù)據(jù)計(jì)算異眾比率解:
在所調(diào)查的50人當(dāng)中,購(gòu)買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“碳酸飲料”代表消費(fèi)者購(gòu)買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布
飲料品牌頻數(shù)比例百分比(%)
果汁礦泉水綠茶其他碳酸飲料610118150.120.200.220.160.301220221630合計(jì)501100順序數(shù)據(jù):四分位差四分位差
(quartiledeviation)四分位差
—上四分位數(shù)與下四分位數(shù)之差,用Qd表示
Qd
=QU–QL也稱為內(nèi)距或四分間距,反映了中間50%數(shù)據(jù)的離散程度是對(duì)順序數(shù)據(jù)離散程度的測(cè)度(也適用于數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù))不受極端值的影響用于衡量中位數(shù)的代表性四分位差
(例題分析)【P97:例4.7】:9個(gè)家庭的人均月收入數(shù)據(jù)如下,請(qǐng)計(jì)算家庭人均月收入的四分位差。原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456
789解:Step1:先計(jì)算四分位數(shù):
Step2:再計(jì)算四分位差
QU-QL=1437.5-797.5=640數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差測(cè)度數(shù)值型數(shù)據(jù)離散程度的方法極差平均差方差和標(biāo)準(zhǔn)差(常用)極差
(range)極差
—一組數(shù)據(jù)的最大值與最小值之差,也稱為全距,用R表示離散程度的最簡(jiǎn)單測(cè)度值計(jì)算公式為:R=max(xi)-min(xi)max(xi)和min(xi)分別表示一組數(shù)據(jù)的最大值和最小值缺點(diǎn):易受極端值影響未考慮數(shù)據(jù)的分布不能反映出中間數(shù)據(jù)的分散狀況,因而不能準(zhǔn)確描述出數(shù)據(jù)的分散程度極差
(例題分析)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)如下,請(qǐng)計(jì)算家庭人均月收入的極差。原始數(shù)據(jù):15007507801080850960200012501630排序:750
78085096010801250150016302000解:計(jì)算極差:
Max(xi)
-Min(xi)L=2000-750=1250平均差
(meandeviation)平均差
—各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)計(jì)算公式未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差以平均數(shù)為中心,反映了每個(gè)數(shù)據(jù)與平均數(shù)的平均差異程度平均差越大,說(shuō)明數(shù)據(jù)的離散程度越大;平均差越小,說(shuō)明數(shù)據(jù)的離散程度越小。在實(shí)際中應(yīng)用較少(因?yàn)橛?jì)算中取絕對(duì)值給計(jì)算帶來(lái)不便)平均差
(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計(jì)—120—2040已計(jì)算出:x=185_平均差
(例題分析)
含義:每一天的銷售量平均數(shù)相比,平均相差17臺(tái)方差和標(biāo)準(zhǔn)差
(varianceandstandarddeviation)方差
—是各變量值與其平均數(shù)離差平方的平均數(shù)。標(biāo)準(zhǔn)差
—方差的平方根。數(shù)據(jù)離散程度的最常用測(cè)度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)差),記為2();根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s)樣本方差和標(biāo)準(zhǔn)差
(samplevarianceandstandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!自由度
(degreeoffreedom)自由度是指數(shù)據(jù)個(gè)數(shù)與附加給獨(dú)立的觀測(cè)值的約束或限制的個(gè)數(shù)之差從字面涵義來(lái)看,自由度是指一組數(shù)據(jù)中可以自由取值的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),若樣本平均數(shù)確定后,則附加給n個(gè)觀測(cè)值的約束個(gè)數(shù)就是1個(gè),因此只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)不能自由取值按著這一邏輯,如果對(duì)n個(gè)觀測(cè)值附加的約束個(gè)數(shù)為k個(gè),自由度則為n-k自由度
(degreeoffreedom)樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則
x
=5。當(dāng)
x
=5
確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值為什么樣本方差的自由度為什么是n-1呢?因?yàn)樵谟?jì)算離差平方和時(shí),必須先求出樣本均值x
,而x則是附件給離差平方和的一個(gè)約束,因此,計(jì)算離差平方和時(shí)只有n-1個(gè)獨(dú)立的觀測(cè)值,而不是n個(gè)樣本方差用自由度去除,其原因可從多方面解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差s2去估計(jì)總體方差σ2時(shí),它是σ2的無(wú)偏估計(jì)量樣本標(biāo)準(zhǔn)差
(P86:例4.12)某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845403020100102030405064008100640027000170040007200640012500合計(jì)—120—55400例4.12:根據(jù)下表數(shù)據(jù),計(jì)算電腦銷售量的標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差
(例題分析)
含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺(tái)總體方差和標(biāo)準(zhǔn)差
(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)總體方差的計(jì)算公式樣本標(biāo)準(zhǔn)差的計(jì)算公式練習(xí)P94:4.1(3)(4)4.2(3)相對(duì)位置的度量相對(duì)位置的度量(1)
標(biāo)準(zhǔn)分?jǐn)?shù)(2)經(jīng)驗(yàn)法則(3)切比雪夫不等式標(biāo)準(zhǔn)分?jǐn)?shù)
(standardscore)標(biāo)準(zhǔn)分?jǐn)?shù)
—變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值。也稱標(biāo)準(zhǔn)化值或z分?jǐn)?shù)。計(jì)算公式為給出了一個(gè)值在一組數(shù)據(jù)中的相對(duì)位置,可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)在對(duì)多個(gè)具有不同量綱的變量進(jìn)行處理時(shí),常常需要對(duì)變量作標(biāo)準(zhǔn)化處理標(biāo)準(zhǔn)分?jǐn)?shù)
(例題分析)9個(gè)家庭人均月收入標(biāo)準(zhǔn)化值計(jì)算表家庭編號(hào)人均月收入(元)標(biāo)準(zhǔn)化值z(mì)
123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996【例4.13】根據(jù)家庭人均月收入,計(jì)算每個(gè)家庭人均月收入的標(biāo)準(zhǔn)分?jǐn)?shù)。標(biāo)準(zhǔn)分?jǐn)?shù)
(性質(zhì))性質(zhì):z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒(méi)有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒(méi)有改變?cè)摻M數(shù)分布的形狀,而只是使該組數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1
例如:以下一組數(shù)據(jù)平均數(shù)為34,標(biāo)準(zhǔn)差為6,其標(biāo)準(zhǔn)分?jǐn)?shù)變換為:經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)在平均數(shù)左右3個(gè)標(biāo)準(zhǔn)差范圍內(nèi)幾乎包含了所有數(shù)據(jù),而在3個(gè)標(biāo)準(zhǔn)差以外的數(shù)據(jù),在統(tǒng)計(jì)上稱為離群點(diǎn)(outlier)(以上是數(shù)據(jù)是根據(jù)標(biāo)準(zhǔn)正態(tài)分布計(jì)算)見(jiàn)P88例題切比雪夫不等式
(Chebyshev’sinequality)【切比雪夫不等式】
對(duì)于任意分布形態(tài)的數(shù)據(jù),至少有1-1/k2的數(shù)據(jù)落在平均數(shù)加減k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)。如果一組數(shù)據(jù)不是對(duì)稱分布,經(jīng)驗(yàn)法則就不再適用,這時(shí)可使用切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式
(Chebyshev’sinequality)對(duì)于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)相對(duì)離散程度:離散系數(shù)離散系數(shù)
(coefficientofvariation)離散系數(shù)(變異系數(shù))—標(biāo)準(zhǔn)差與其相應(yīng)的均值之比計(jì)算公式為對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響用于對(duì)不同組別數(shù)據(jù)離散程度的比較離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號(hào)產(chǎn)品銷售額(萬(wàn)元)x1銷售利潤(rùn)(萬(wàn)元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度離散系數(shù)
(例題分析)結(jié)論:
計(jì)算結(jié)果表明,v1<v2,說(shuō)明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710銷售額:銷售利潤(rùn):小結(jié)1.不同類型的數(shù)據(jù),采用不同測(cè)度值測(cè)度其離散程度分類數(shù)據(jù):異眾比率(主要)順序數(shù)據(jù):四分位差(也可以使用異眾比率)數(shù)值數(shù)據(jù):方差和標(biāo)準(zhǔn)差(平均差、極差或其它方法)對(duì)比不同樣本數(shù)據(jù)的離散程度:離散系數(shù)2.實(shí)際應(yīng)用時(shí),要根據(jù)所掌握的數(shù)據(jù)類型和分析目的來(lái)確定使用哪種測(cè)度值。如果一個(gè)數(shù)據(jù)的標(biāo)準(zhǔn)分?jǐn)?shù)為2,表明該數(shù)據(jù)()A.比平均數(shù)高出2個(gè)標(biāo)準(zhǔn)差;B.比平均數(shù)低2個(gè)標(biāo)準(zhǔn)差;C.等于2倍平均數(shù);D.等于2倍標(biāo)準(zhǔn)差
某班學(xué)生的平均成績(jī)是80分,標(biāo)準(zhǔn)差是10分,如果已知該班學(xué)生的考試分?jǐn)?shù)為對(duì)稱分布,可以判斷成績(jī)?cè)?0~100分之間的學(xué)生大約占()A.95%B.89%C.68%D.99%某班學(xué)生的平均成績(jī)是80分,標(biāo)準(zhǔn)差是5分。如果已知該班學(xué)生的考試分?jǐn)?shù)是非對(duì)稱分布,可以判斷成績(jī)?cè)?0~90之間的學(xué)生至少占()A.95%B.89%C.68%D.75%(4)比較兩組數(shù)據(jù)的離散程度最適合用的統(tǒng)計(jì)量是()A.極差B.平均差C.標(biāo)準(zhǔn)差D.離散系數(shù)練習(xí)(2)AADD在離散程度的測(cè)度中,最容易受極端值影響的是()A.平均差;B.四分位差;C.標(biāo)準(zhǔn)差;D.極差
測(cè)度離散程度的相對(duì)統(tǒng)計(jì)量是()A.極差B.平均差C.標(biāo)準(zhǔn)差D.離散系數(shù)兩組數(shù)據(jù)的平均數(shù)不等,但標(biāo)準(zhǔn)差相等,則()A.平均數(shù)小的,離散程度大B.平均數(shù)大的,離散程度大C.平均數(shù)小的,離散程度小D.兩組數(shù)據(jù)離散程度相同。練習(xí)(3)DDA4.3偏態(tài)與峰態(tài)的度量4.3.1偏態(tài)及其測(cè)度4.3.2峰態(tài)及其測(cè)度偏態(tài)偏態(tài)
(skewness)偏態(tài)—由統(tǒng)計(jì)學(xué)家Pearson于1895年首次提出,用于測(cè)度數(shù)據(jù)分布偏斜程度。表征概率分布密度曲線相對(duì)于平均值不對(duì)稱程度的特征數(shù)。直觀看來(lái)就是密度函數(shù)曲線尾部的相對(duì)長(zhǎng)度。
測(cè)量偏態(tài)的統(tǒng)計(jì)量是偏態(tài)系數(shù)偏態(tài)分類負(fù)偏(negativeskew)
左側(cè)尾部更長(zhǎng),分布主體集中在右側(cè),又稱為左偏。正偏(posiriveskew)
右側(cè)尾部更長(zhǎng),分布主體集中在左側(cè),又稱為右偏。對(duì)稱
平均值=中位數(shù)。正偏(右偏)分布負(fù)偏(左偏)分布對(duì)稱分布對(duì)稱、左偏、右偏偏態(tài)系數(shù)
(coefficientofskewness)樣本偏態(tài)系數(shù):根據(jù)原始數(shù)據(jù)計(jì)算樣本偏度(計(jì)算方法有多種)根據(jù)分組數(shù)據(jù)計(jì)算偏態(tài)系數(shù)=0為對(duì)稱分布偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)大于1或小于-1,被稱為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-1~-0.5之間,被認(rèn)為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低
總體偏態(tài)系數(shù):SK=E(X-)3/3偏態(tài)系數(shù)
(例題分析)
某電腦公司銷售量偏態(tài)及峰度計(jì)算表按銷售量份組(臺(tái))組中值(Mi)頻數(shù)
fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計(jì)—120540000
70100000
P91:例4.15
根據(jù)下表,計(jì)算電腦銷售量的偏態(tài)系數(shù)偏態(tài)系數(shù)
(例題分析續(xù))結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說(shuō)明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)峰態(tài)峰態(tài)
(kurtosis
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024游樂(lè)場(chǎng)場(chǎng)地租賃合同-包括游樂(lè)園場(chǎng)地設(shè)施租賃及游樂(lè)項(xiàng)目市場(chǎng)運(yùn)營(yíng)3篇
- 2024版施工方安全生產(chǎn)合作合同版B版
- 2024年甲乙雙方關(guān)于知識(shí)產(chǎn)權(quán)許可合同
- 家庭教育對(duì)孩子時(shí)間管理能力的影響研究
- 家庭教育如何影響孩子的思維模式
- 小學(xué)體育與醫(yī)療保健的融合思考與實(shí)踐
- 2024版企業(yè)成立盛典合同樣本
- 2024校教職工子女教育資助計(jì)劃采購(gòu)合同3篇
- 2024消防整改工程施工現(xiàn)場(chǎng)安全管理及應(yīng)急預(yù)案合同2篇
- 汽車配件采購(gòu)協(xié)議書(shū)模板
- 2023-2024學(xué)年上海市普陀區(qū)三年級(jí)(上)期末數(shù)學(xué)試卷
- 小班班本課程《吃飯這件小事》
- 中國(guó)特色大國(guó)外交和推動(dòng)構(gòu)建人類命運(yùn)共同體
- 《風(fēng)電場(chǎng)項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)規(guī)范》(NB-T 31085-2016)
- 室內(nèi)裝飾裝修工程施工組織設(shè)計(jì)方案(完整版)
- 消防系統(tǒng)檢測(cè)方案(完整版)
- 關(guān)于童話故事的題目
- 工程竣工驗(yàn)收備案申請(qǐng)表1
- 巢湖地區(qū)地質(zhì)調(diào)查報(bào)告 最終版[沐風(fēng)文苑]
- 生產(chǎn)計(jì)劃流程內(nèi)容培訓(xùn)工廠生產(chǎn)線管理工作總結(jié)匯報(bào)PPT模板
- 印象東城區(qū)少年宮
評(píng)論
0/150
提交評(píng)論