




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1第三講
數(shù)據(jù)的描述性分析2教學(xué)目的和要求通過(guò)本講的學(xué)習(xí),學(xué)生應(yīng)該熟練掌握描述數(shù)據(jù)特征,即數(shù)據(jù)的集中趨勢(shì)、離散趨勢(shì)的分析方法,要求學(xué)生掌握各種測(cè)度指標(biāo)的含義和計(jì)算方法,并且能夠運(yùn)用這些指標(biāo)來(lái)研究事物或現(xiàn)象的總體特征和變化規(guī)律。3本講內(nèi)容描述數(shù)據(jù)特征的意義集中趨勢(shì)測(cè)度指標(biāo)種類計(jì)算適用情況離散趨勢(shì)測(cè)度指標(biāo)種類計(jì)算適用情況位置測(cè)度指標(biāo)種類計(jì)算適用情況箱索圖繪制方法作用4描述數(shù)據(jù)特征的意義1.集中趨勢(shì)指標(biāo)的最一般意義:作為總體的代表水平同其他同質(zhì)的總體進(jìn)行比較;反映的是同質(zhì)總體的共性、集中性。2.離散趨勢(shì)指標(biāo)反映的是個(gè)性和分散性,用來(lái)衡量集中趨勢(shì)指標(biāo)的代表性強(qiáng)弱。5集中趨勢(shì)測(cè)度指標(biāo)(平均數(shù)、中位數(shù)、眾數(shù))掌握計(jì)算方法掌握每種指標(biāo)的適用情況6
集中趨勢(shì)指標(biāo)----平均數(shù)衡量變量分布中心的指標(biāo)最常用的集中趨勢(shì)指標(biāo)容易受極端值的影響極端值:遠(yuǎn)離分布中心的數(shù)值7平均數(shù)的種類簡(jiǎn)單算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)幾何平均數(shù)8簡(jiǎn)單算術(shù)平均數(shù)公式:適用情況
?資料未分組
?每一個(gè)變量值的作用相同影響平均數(shù)大小的因素只有變量值9加權(quán)算術(shù)平均數(shù)定義:將各變量值分別乘以代表該變量值重要程度的權(quán)數(shù),然后用此乘積之和除以權(quán)數(shù)之和,所得的商為加權(quán)算術(shù)平均數(shù)。公式:加權(quán)平均數(shù)
(權(quán)數(shù)對(duì)均值的影響)
甲乙兩組各有10名學(xué)生,他們的考試成績(jī)及其分布數(shù)據(jù)如下甲組:考試成績(jī)(x): 020100
人數(shù)分布(f):118
乙組:考試成績(jī)(x): 020100
人數(shù)分布(f):81111幾何平均數(shù)公式:?幾何平均數(shù)適用于比例和速度等?相對(duì)數(shù)的平均計(jì)算12幾何平均數(shù)的應(yīng)用1132013年各月全國(guó)住宅價(jià)格環(huán)比指數(shù)為100.611月100.95月100.86月100.610月101.14月100.79月101.23月100.98月101.12月100.87月100.71月環(huán)比指數(shù)時(shí)間環(huán)比指數(shù)時(shí)間求2013年平均環(huán)比增長(zhǎng)速度幾何平均數(shù)的應(yīng)用2
12月100.414平均環(huán)比速度平均環(huán)比速度15集中趨勢(shì)指標(biāo)2--中位數(shù)(Median)16中位數(shù)計(jì)算方法對(duì)于未分組數(shù)據(jù)排序后處于中間位置上的值。不受極端值影響確定Me=Me50%50%17中位數(shù)計(jì)算舉例2(5個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):
2422212620排序: 2021222426位置: 123 45中位數(shù)=22?18中位數(shù)計(jì)算舉例(N=6)原始資料:10.34.98.911.76.37.7按順序排列:4.96.37.78.910.311.7位置:123456中位數(shù)所在的位置為:中位數(shù)=(7.7+8.9)/2=8.319中位數(shù)計(jì)算方法對(duì)于分組數(shù)據(jù)排序后處于中間位置上的值。不受極端值影響確定中位數(shù)項(xiàng)次(n+1)/2Me50%50%20集中趨勢(shì)指標(biāo)3--眾數(shù)(Mode)出現(xiàn)次數(shù)最多的那個(gè)變量值是一個(gè)常用的集中趨勢(shì)指標(biāo)它不受極端值的影響并非所有的數(shù)列都存在眾數(shù)mo21(眾數(shù)的不唯一性)無(wú)眾數(shù)原始數(shù)據(jù):10591268一個(gè)眾數(shù)
原始數(shù)據(jù):659855多于一個(gè)眾數(shù)
原始數(shù)據(jù):252828364242眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良,實(shí)際中最常用數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)代表性較好中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)代表性接好眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)代表性較好怎樣評(píng)價(jià)集中趨勢(shì)代表值?假定有兩個(gè)地區(qū)每人的平均收入數(shù)據(jù),其中甲地區(qū)的平均收入為5000元,乙地區(qū)的平均收入為3000元。你如何評(píng)價(jià)兩個(gè)地區(qū)的收入狀況?如果平均收入的多少代表了該地區(qū)的生活水平,你能否認(rèn)為甲地區(qū)的平均生活水平就高于乙地區(qū)呢?要回答這些問(wèn)題,首先需要搞清楚這里的平均收入是否能代表大多數(shù)人的收入水平。如果甲地區(qū)有少數(shù)幾個(gè)富翁,而大多數(shù)人的收入都很低,雖然平均收入很高,但多數(shù)人生活水平仍然很低。相反,乙地區(qū)多數(shù)人的收入水平都在3000元左右,雖然平均收入看上去不如甲地區(qū),但多數(shù)人的生活水平卻比甲地區(qū)高,原因是甲地區(qū)的收入差距大于乙地區(qū)怎樣評(píng)價(jià)集中趨勢(shì)代表值??jī)H僅知道數(shù)據(jù)的集中趨勢(shì)是遠(yuǎn)遠(yuǎn)不夠的,還必須考慮數(shù)據(jù)之間的差距有多大。數(shù)據(jù)之間的差距用統(tǒng)計(jì)語(yǔ)言來(lái)說(shuō)就是數(shù)據(jù)的離散程度。數(shù)據(jù)的離散程度越大,各描述統(tǒng)計(jì)量對(duì)該組數(shù)據(jù)的代表性就越差,離散程度越小,其代表性就越好。甲乙25離散趨勢(shì)測(cè)度指標(biāo)全距方差標(biāo)準(zhǔn)差變異系數(shù)反映數(shù)據(jù)分散程度的指標(biāo)26離散程度指標(biāo)掌握這些指標(biāo)的作用掌握計(jì)算它們的方法掌握每種指標(biāo)的適用情況掌握這些指標(biāo)的優(yōu)缺點(diǎn)27全距(Range)全距=最大值-最小值原始資料:1716211813161211順序排列:1112131616171821全距=21-11=10優(yōu)缺點(diǎn):離散程度的最簡(jiǎn)單測(cè)度值;未考慮數(shù)據(jù)的分布;易受極端值影響;
方差和標(biāo)準(zhǔn)差
(varianceandstandarddeviation)數(shù)據(jù)離散程度的最常用測(cè)度值反映各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)差),記為2();根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s)29方差30樣本方差計(jì)算1(未分組)原始數(shù)據(jù):171621181316121131樣本方差計(jì)算2續(xù)(已分組)問(wèn)題:?11.14說(shuō)明什么
?優(yōu)點(diǎn):離散程度可以量化
缺點(diǎn):方差計(jì)算結(jié)果會(huì)給人以夸大離散程度規(guī)模的效果,使人們不易達(dá)到直觀認(rèn)識(shí)離散程度的目的;方差的計(jì)量單位與原觀察值得計(jì)量單位不一致。32標(biāo)準(zhǔn)差(方差的平方根)?
計(jì)算公式?展示的信息:一組數(shù)據(jù)對(duì)其均值為代表的中心的某種偏離程度。?優(yōu)點(diǎn):反映的一組數(shù)據(jù)的離散程度。標(biāo)準(zhǔn)差(或方差)較小的分布一定是比較集中在均值附近的,反之則是比較分散的。
缺點(diǎn):計(jì)算起來(lái)比較麻煩。標(biāo)準(zhǔn)差也是根據(jù)全部數(shù)據(jù)來(lái)計(jì)算的,但是它也會(huì)受到極端值的影響。2008年8月樣本方差和標(biāo)準(zhǔn)差
(samplevarianceandstandarddeviation)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式(n-1為樣本的自由度)2008年8月總體方差和標(biāo)準(zhǔn)差
(PopulationvarianceandStandarddeviation)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式35標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)差度量投資風(fēng)險(xiǎn)標(biāo)準(zhǔn)差度量產(chǎn)品質(zhì)量的穩(wěn)定性標(biāo)準(zhǔn)差度量企業(yè)的生產(chǎn)及服務(wù)的質(zhì)量標(biāo)準(zhǔn)36集中趨勢(shì)指標(biāo)與離散程度指標(biāo)的關(guān)系離散程度指標(biāo)大,說(shuō)明總體分散或者說(shuō)總體中各標(biāo)志值離集中趨勢(shì)指標(biāo)遠(yuǎn),那么集中趨勢(shì)指標(biāo)代表性就小。離散程度指標(biāo)小,說(shuō)明總體集中或者說(shuō)總體中各標(biāo)志值離集中趨勢(shì)指標(biāo)近,那么集中趨勢(shì)指標(biāo)代表性就大。2008年8月數(shù)據(jù)分布的形狀—偏態(tài)與峰態(tài)扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布比較!偏態(tài)
(skewness)統(tǒng)計(jì)學(xué)家K.Pearson于1895年首次提出。是指數(shù)據(jù)分布的不對(duì)稱性測(cè)度統(tǒng)計(jì)量是偏態(tài)系數(shù)(coefficientofskewness)3.偏態(tài)系數(shù)=0為對(duì)稱分布;>0為右偏分布;<0為左偏分布偏態(tài)系數(shù)大于1或小于-1,為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-1~-0.5之間,為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低峰態(tài)
(kurtosis)統(tǒng)計(jì)學(xué)家K.Pearson于1905年首次提出。數(shù)據(jù)分布峰值的高低測(cè)度統(tǒng)計(jì)量是峰態(tài)系數(shù)(coefficientofkurtosis)峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布40原始數(shù)據(jù):1716211813161211
EXCEL輸出結(jié)果:平均15.5標(biāo)準(zhǔn)誤差1.180193689中位數(shù)16眾數(shù)16標(biāo)準(zhǔn)差3.338091842方差11.14285714峰度-0.596449704區(qū)域10最小值11最大值21求和124觀測(cè)數(shù)841SPSS描述性分析StatisticsN Valid 8 Missing0 Mean 15.5000 Std.ErrorofMean1.18019 Median 16.0000 Mode 16.00 Std.Deviation 3.33809 Variance11.143 Skewness .184 Kurtosis -.596Range10.00 Minimum 11.00 Maximum 21.00 Sum 124.00
42位置測(cè)度指標(biāo)●位次指標(biāo):根據(jù)觀察值在變量數(shù)列中的位置而確定的指標(biāo)●常用的位置測(cè)度指標(biāo)有:
四分位次指標(biāo)
十分位次指標(biāo)百分位次指標(biāo)四分位距
43
五大位次指標(biāo)
(三個(gè)四分位次指標(biāo)加上最大值及最小值)▼五大位次具體指:?最小值?第一四分位數(shù)?第二四分位數(shù)(中位數(shù))?第三四分位數(shù)?最大值
44五大位次指標(biāo)位置的圖示25%25%25%25%Q1Q3最小值最大值中位數(shù)把變量數(shù)列(從小到大排列)分成四等份45四分位數(shù)的確定1原始數(shù)據(jù):10.34.98.911.76.37.7按順序排列:4.96.37.78.910.311.7位置:123456第1四分位數(shù)的位置公式為:
Q1位置=1(n+1)/4
46Q1
位置=1(n+1)/4=1(6+1)/4=1.75Q1=6.3Q2位置=2(n+1)/4=2(6+1)/4=3.5Q2=(7.7+8.9)/2=8.3Q3位置=3(n+1)/4=3(6+1)/4=5.25Q3=10.3四分位距Qr=Q3-Q1用于說(shuō)明中間50%數(shù)據(jù)的離散程度四分位數(shù)的確定2四分位數(shù)把一組數(shù)據(jù)按從小到大(或從大到?。┑拇涡蚺懦梢粋€(gè)數(shù)列,將這個(gè)數(shù)列分成4個(gè)部分,每個(gè)部分包含數(shù)目相等的數(shù)據(jù),各部分?jǐn)?shù)據(jù)分界點(diǎn)上的數(shù)據(jù)值叫做四分位數(shù)。第一個(gè)四分位數(shù)Q1之前包括了25%的數(shù)據(jù),第二個(gè)四分位數(shù)Q2即中位數(shù),中位數(shù)之前包括了50%的數(shù)據(jù),第三個(gè)四分位數(shù)Q3之前包含了75%的數(shù)據(jù)。四分位差舍去數(shù)列中數(shù)值最高的25%數(shù)據(jù)和數(shù)值最低的25%的數(shù)據(jù),求出中間50%的數(shù)據(jù)中最大數(shù)據(jù)與最小數(shù)據(jù)的數(shù)值差,即四分位差。四分位差表明有50%的樣本值在分布在這一區(qū)間內(nèi),用Q代表四分位差,計(jì)算公式為:
Qr=Q3-Q149五大位次指標(biāo)的圖示:箱索圖箱索圖是一種將五個(gè)位次指標(biāo)顯示在一條橫軸上,以刻劃變量數(shù)列集中、離散和偏斜態(tài)勢(shì)的統(tǒng)計(jì)圖主要作用:用于對(duì)兩個(gè)或兩個(gè)以上數(shù)列的集中、離散和偏斜態(tài)勢(shì)作迅速而直觀的對(duì)比。識(shí)別數(shù)據(jù)中是否存在異常值50箱索圖的畫法首先確定第一四分位數(shù)、第二四分位數(shù)(中位數(shù))第三四分位數(shù)計(jì)算1.5倍的四分位距5162人智商分?jǐn)?shù)的箱索圖第一四分位數(shù)95.75第二四分位數(shù)(中位數(shù))107第三四分位數(shù)117.25四分位距21.5Q3+1.5*21.5=107.25+32.25=139.5最小值=78最大值=135Q1-1.5
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 成都職業(yè)技術(shù)學(xué)院《大學(xué)美術(shù)鑒賞》2023-2024學(xué)年第二學(xué)期期末試卷
- 云南商務(wù)職業(yè)學(xué)院《充填理論與技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 朔州師范高等專科學(xué)?!都本柔t(yī)學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣西藍(lán)天航空職業(yè)學(xué)院《酒店禮儀實(shí)訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海體育大學(xué)《土地科學(xué)基本問(wèn)題》2023-2024學(xué)年第二學(xué)期期末試卷
- 長(zhǎng)治職業(yè)技術(shù)學(xué)院《分析化學(xué)Ⅰ》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南醫(yī)藥學(xué)院《C語(yǔ)言課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 成都藝術(shù)職業(yè)大學(xué)《體內(nèi)藥物分析理論》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西工業(yè)工程職業(yè)技術(shù)學(xué)院《航空運(yùn)輸管理》2023-2024學(xué)年第二學(xué)期期末試卷
- 農(nóng)村衛(wèi)生安全生產(chǎn)培訓(xùn)
- 車間維修電工安全技術(shù)操作規(guī)程
- 第四章 聚合物基納米復(fù)合材料課件
- 教學(xué)課件 211和985工程大學(xué)簡(jiǎn)介
- 臥式水泵安裝
- 綜合交通運(yùn)輸體系課件
- 趣味經(jīng)濟(jì)學(xué)課件
- 實(shí)木家具生產(chǎn)標(biāo)準(zhǔn)工藝標(biāo)準(zhǔn)流程
- 小學(xué)生讀書卡模板
- 小學(xué)二年級(jí)體育課《團(tuán)身滾動(dòng)》教案
- 級(jí)本科診斷學(xué)緒論+問(wèn)診課件
- 熱導(dǎo)檢測(cè)器(TCD)原理與操作注意事項(xiàng)
評(píng)論
0/150
提交評(píng)論