第三章離散趨勢度量-理解變異性_第1頁
第三章離散趨勢度量-理解變異性_第2頁
第三章離散趨勢度量-理解變異性_第3頁
第三章離散趨勢度量-理解變異性_第4頁
第三章離散趨勢度量-理解變異性_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

案例:有兩組學(xué)生成績甲組:5060708090乙組:6065707580兩組平均數(shù)相同,都為70分,但各組成績的差異與分布不同。而由于差異情形不同,使得平均數(shù)的代表性不同??梢悦鞔_的看到,乙組平均成績的代表性更好些。因此,為了全面反映數(shù)據(jù)的分布特征,不僅要測度數(shù)據(jù)的集中趨勢,還必須對數(shù)據(jù)的離中趨勢進行測度。第三章離散趨勢量數(shù)——理解變異性第一節(jié)什么是離散趨勢量數(shù)第二節(jié)離散系數(shù)種類:異眾比率、四分位差、極差、標準差和方差、離散系數(shù)第三節(jié)偏態(tài)與峰態(tài)第四節(jié)標準化第一節(jié)什么是離散趨勢量數(shù)據(jù)分布的另一個重要特征反映各變量值遠離其中心值的程度(離散程度)從另一個側(cè)面說明了集中趨勢測度值的代表程度反映社會經(jīng)濟現(xiàn)象變動的均勻性和穩(wěn)定性不同類型的數(shù)據(jù)有不同的離散程度測度值一、定義

第一節(jié)什么是離散趨勢量數(shù)二、種類

異眾比率Vr四分位差Q.D.極差 R平均差 A.D.標準差 S.D.(σ)離散系數(shù) Vσ第二節(jié)離散系數(shù)種類異眾比率

(variationratio)1. 對分類數(shù)據(jù)離散程度的測度2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比例3. 計算公式為

4.用于衡量眾數(shù)的代表性異眾比率

(例題分析)解:

在所調(diào)查的50人當(dāng)中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費者購買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100四分位差

(quartiledeviation)1、對順序數(shù)據(jù)離散程度的測度2、也稱為內(nèi)距或四分間距3、上四分位數(shù)與下四分位數(shù)之差

Qd

=QU

–QL4、反映了中間50%數(shù)據(jù)的離散程度5、不受極端值的影響6、用于衡量中位數(shù)的代表性極差(range)1、一組數(shù)據(jù)的最大值與最小值之差2、離散程度的最簡單測度值,常用于數(shù)值型數(shù)據(jù)3、易受極端值影響4、未考慮數(shù)據(jù)的分布7891078910

R

=max(xi)-min(xi)計算公式為許多時候,平均掩蓋了數(shù)據(jù)的真實深度。好的決策不僅要考慮集中趨勢度量,還要考慮散步大小。所有的東西只為平均水平設(shè)計,我們的社會將會崩潰(高速公路、大壩、房屋建筑、溫度)“一個人在通過平均深度為1米的河流時淹死了”平均差

(meandeviation)1、各變量值與其平均數(shù)離差絕對值的平均數(shù)2、能全面反映一組數(shù)據(jù)的離散程度,受極值影響3、數(shù)學(xué)性質(zhì)較差,實際中應(yīng)用較少計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235

49162720171084540302010010203040501602703202700170200240160250合計—120—2040平均差

(例題分析)

含義:每一天的銷售量平均數(shù)相比,平均相差17臺

思考比較下列兩組數(shù)據(jù)的極差:A組:2,10,5,5,5,5,5,5,5,5.B組:4,6,3,7,2,8,1,9,5,5.試問:A組與B組,哪個組的數(shù)據(jù)離散程度較大?A組與B組的極差相等.這說明極差雖能反映這兩組數(shù)據(jù)的波動情況,但能判斷其離散程度的大小嗎?標準差(standarddeviation)和方差標準差各變量與其平均值的差平方的平均數(shù)的平方根。標準差表示一個數(shù)據(jù)組中變異性的平均數(shù)量。實際的含義是與均值的平均距離。標準差越大,每個數(shù)據(jù)點與數(shù)據(jù)分布的均值的平均距離越大。4681012

x=8.3案例姓名(A)財務(wù)管理姓名(B)財務(wù)管理史彬蓮71夏軍軍75史子俊84金夢雨81陳正輝47郁淼71劉洋68黃超62周曉晨97劉兆云78平均成績73.2平均成績73.2A組同學(xué)的得分散落在高點和低點B組同學(xué)的分數(shù)相當(dāng)接近思考,你認為A組和B組的標準差哪一個比較大呢?SA=18.7SB=7.3標準差最小值為0,而數(shù)據(jù)的離散程度越大,標準差的值就越大樣本方差和標準差未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!樣本方差

自由度(degreeoffreedom)1、一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)2、當(dāng)樣本數(shù)據(jù)的個數(shù)為

n

時,若樣本均值

x

確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值3、例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則

x=5。當(dāng)

x

=5

確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值4、樣本方差用自由度去除,其原因可從多方面解釋,從實際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量樣本標準差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140-150150-160160-170170-180180-190190-200200-210210-220220-230230-240145155165175185195205215225235

49162720171084540302010010203040501602703202700170200240160250合計—120—55400樣本標準差

(例題分析)

含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺

甲、乙兩學(xué)生某次考試成績列表語文數(shù)學(xué)物理化學(xué)政治英語甲

959065707585乙1107095508075

甲、乙兩學(xué)生的平均成績?yōu)?0分,集中趨勢一樣,但是他們偏離平均數(shù)的程度卻不一樣。乙組數(shù)據(jù)的離散程度大,數(shù)據(jù)分布越分散,平均數(shù)的代表性就越差;甲組數(shù)據(jù)的離散程度小,數(shù)據(jù)分布越集中,平均數(shù)的代表性越大。例甲、乙兩臺包裝機同時分裝質(zhì)量為400g的奶粉,從它們各自分裝的奶粉中隨機抽取了10袋,測得它們的實際質(zhì)量(單位:克)如下:甲:401400408406410409400393394394乙:403404396399402401405397402399試問:哪臺包裝機包裝的奶粉質(zhì)量比較穩(wěn)定?可用來反映社會生產(chǎn)和其他社會經(jīng)濟活動過程的均衡性或協(xié)調(diào)性,以及產(chǎn)品質(zhì)量的穩(wěn)定程度。

供貨計劃完成百分比(%)季度總供貨計劃執(zhí)行結(jié)果一月二月三月鋼廠甲100323434乙100203050案例:問該班男生是身高的變異性大還是體重變異性大?均值標準差身高(CM)1708體重(KG)657離散系數(shù)

(coefficientofvariation)1、 標準差與其相應(yīng)的均值之比2、對數(shù)據(jù)相對離散程度的測度3、消除了數(shù)據(jù)水平高低和計量單位的影響4、 用于對不同組別數(shù)據(jù)離散程度的比較5、計算公式為案例:問該班男生是身高的變異性大還是體重變異性大?均值標準差離散系數(shù)身高(CM)17084.53體重(KG)65711.67離散系數(shù)

(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)

(例題分析)結(jié)論:計算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710數(shù)據(jù)類型與離散程度測度值數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)類型分類數(shù)據(jù)順序數(shù)據(jù)數(shù)值型數(shù)據(jù)適用的測度值※異眾比率※四分位差

※方差或標準差—異眾比率

※離散系數(shù)(比較時用)——平均差——極差——四分位差——異眾比率第三節(jié)偏態(tài)和峰態(tài)及其度量偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標準正態(tài)分布比較!偏態(tài)

(skewness)統(tǒng)計學(xué)家Pearson于1895年首次提出數(shù)據(jù)分布偏斜程度的測度1. 偏態(tài)系數(shù)=0為對稱分布2. 偏態(tài)系數(shù)>0為右偏分布3. 偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)

(skewnesscoefficient)根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算偏態(tài)系數(shù)

(例題分析)

某電腦公司銷售量偏態(tài)及峰度計算表按銷售量份組(臺)組中值(Mi)頻數(shù)

fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235

491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000

70100000

偏態(tài)系數(shù)

(例題分析)結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)偏態(tài)與峰態(tài)

(從直方圖上觀察)按銷售量分組(臺)結(jié)論:1.為右偏分布

2.峰態(tài)適中140150210某電腦公司銷售量分布的直方圖190200180160170頻數(shù)(天)25201510530220230240峰態(tài)

(kurtosis)統(tǒng)計學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布峰態(tài)系數(shù)

(kurtosiscoefficient)根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算峰態(tài)系數(shù)

(例題分析)結(jié)論:峰態(tài)系數(shù)為負值,但與0的差異不大,說明電腦銷售量為輕微扁平分布第四節(jié)標準化標準化值

(例題分析)9個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準化值z

12345678915007507801080850960200012501630

0.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996標準分的特征無論作為變量的滿分是幾分,其標準分的平均數(shù)勢必為0,其標準差勢必為1.無論作為變量的單位是什么,其標準的平均數(shù)勢必為0,而其標準差勢必為1.這樣滿分為100分的考試和滿分為200分考試都可以比較。標準值(性質(zhì))1、均值等于02. 方差等于11、一組數(shù)據(jù)最大值與最小值之差稱為()A平均差b標準差c極差d四分位差2、各變量值與其均值離差平方的平均數(shù)稱為()A極差b平均差c方差d標準差3、如果一個數(shù)據(jù)的標準分數(shù)是-2,表面該數(shù)據(jù)()A比平均數(shù)高出2個標準差b比平均數(shù)低出2個標準差C等于2倍平均數(shù)D等于2倍標準差4、如果一個數(shù)據(jù)的標準分數(shù)是3,表明該數(shù)據(jù)()A比平均數(shù)高出3個標準差B比平均數(shù)高出3個標準差C等于3倍平均數(shù)D等于3倍標準差5、一組數(shù)據(jù)的標準分數(shù),其()A均值為1,方差為0B均值為0,方差為1C均值為1,方差為1D均值為0,方差為06、比較兩組數(shù)據(jù)的離散程度最適合的統(tǒng)計量是()A極差B平均差C標準差D離散系數(shù)7、用極差度量離散程度的缺陷是()A基于均值計算離散程度B基于絕對值計算,不宜使用C易于計算D沒有使用所有數(shù)據(jù)的信息8、兩組數(shù)據(jù)的均值不等,但標準差相等,則()A均值小的,離散程度大B均值大的,離散程度大C均值小的,離散程度小D兩組數(shù)據(jù)的離散程度相同實例分析:比較兩省市的經(jīng)濟水平城市蘇州南京無錫常州南通徐州泰州揚州鹽城鎮(zhèn)江淮安連云宿遷財政收入億元745434415215198164135128126101969063城市青島濟南煙臺淄博濰坊日照臨沂濟寧菏澤濱州東營威海萊蕪聊城泰安德州財政收入3422101891291584392135618081103335591551、一組數(shù)據(jù)中出現(xiàn)頻率最多的變量值稱為()A眾數(shù)b中位數(shù)c四分位數(shù)d均值2、下列關(guān)于眾數(shù)的敘述,不正確的是()A一組數(shù)據(jù)可能存在多個眾數(shù)B眾數(shù)主要適用于分類數(shù)據(jù)C一組數(shù)據(jù)的眾數(shù)是唯一的D眾數(shù)不受極端值的影響3、一組數(shù)據(jù)排序后處于中間位置上的變量值稱為()A眾數(shù)b中位數(shù)c四分位數(shù)d均值4、一組數(shù)據(jù)排序后處于25%和75%位置的值稱為()A眾數(shù)b中位數(shù)c四分位數(shù)d均值5、一組數(shù)據(jù)相加后除以數(shù)據(jù)的個數(shù)所得到的結(jié)果稱為()A眾數(shù)b中位數(shù)c四分位數(shù)d均值6、n個變量值乘積的n次方根稱為()A眾數(shù)b中位數(shù)c四分位數(shù)d幾何平均數(shù)7、某大學(xué)經(jīng)濟管理學(xué)院有1200名學(xué)生,法學(xué)院有800名學(xué)生,醫(yī)學(xué)院有320名學(xué)生,理學(xué)院有200名學(xué)生,上述描述中,眾數(shù)是()A1200b經(jīng)濟管理學(xué)院c200d理學(xué)院8、某大學(xué)經(jīng)濟管理學(xué)院有1200名學(xué)生,法學(xué)院有800名學(xué)生,醫(yī)學(xué)院有320名學(xué)生,理學(xué)院有200名學(xué)生,描述改組數(shù)據(jù)的集中趨勢宜采用()A眾數(shù)b中位數(shù)c四分位數(shù)d均值9、某居民小區(qū)準備采取一項新的物業(yè)管理措施,為此,隨機抽取100名居民進行調(diào)查,其中表示贊成的有69戶,表示中立有22戶,表示反對的有9戶。描述該組數(shù)據(jù)的集中趨勢宜采用()

A眾數(shù)b中位數(shù)c四分位數(shù)d均值10、某居民小區(qū)準備采取一項新的物業(yè)管理措施,為此,隨機抽取100名居民進行調(diào)查,其中表示贊成的有69戶,表示中立有22戶,表示反對的有9戶。該組數(shù)據(jù)的中位數(shù)是()

A贊成b69c中立d2211、某班共有25名學(xué)生,期末統(tǒng)計學(xué)課程考試分數(shù)分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數(shù)的眾數(shù)是()

A72b70c68d5612、某班共有25名學(xué)生,期末統(tǒng)計學(xué)課程考試分數(shù)分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數(shù)的中位數(shù)是()

A72b70c68d5613、某班共有25名學(xué)生,期末統(tǒng)計學(xué)課程考試分數(shù)分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數(shù)的均值是()

A72b70c68d5614、某班共有25名學(xué)生,期末統(tǒng)計學(xué)課程考試分數(shù)分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數(shù)的下四分位數(shù)和上四分位數(shù)是()

A64.5和78.5b67.5和71.5c64.5和71.5d64.5和67.515、在某行業(yè)中隨機抽取10家企業(yè),第一季度利潤額(單位:萬元)分別為72,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論