統(tǒng)計學數(shù)據(jù)分布特征描述(課堂PPT)_第1頁
統(tǒng)計學數(shù)據(jù)分布特征描述(課堂PPT)_第2頁
統(tǒng)計學數(shù)據(jù)分布特征描述(課堂PPT)_第3頁
統(tǒng)計學數(shù)據(jù)分布特征描述(課堂PPT)_第4頁
統(tǒng)計學數(shù)據(jù)分布特征描述(課堂PPT)_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、n以數(shù)值特征,對以數(shù)值特征,對統(tǒng)計數(shù)據(jù)分布統(tǒng)計數(shù)據(jù)分布進行進行量化描述量化描述。n主要包括三方面:主要包括三方面:集中趨勢集中趨勢 用用平均指標平均指標描述(位置特征);描述(位置特征);離中趨勢離中趨勢 用用變異指標變異指標描述(離散特征);描述(離散特征);偏斜程度偏斜程度 用用偏度偏度和和峰度峰度描述(偏斜特征、峰度特征)。描述(偏斜特征、峰度特征)。 本章學習任務(wù)本章學習任務(wù)# n學習要求:學習要求: 理解理解測度統(tǒng)計數(shù)據(jù)集中趨勢、離散程度的概念測度統(tǒng)計數(shù)據(jù)集中趨勢、離散程度的概念、指標、相互關(guān)系;、指標、相互關(guān)系; 掌握掌握主要分析指標主要分析指標的的計算方法計算方法和和應(yīng)用場合,應(yīng)

2、用場合,并能并能熟練熟練進行相關(guān)進行相關(guān)計算分析計算分析。# 數(shù)據(jù)分布特征與測度:概覽數(shù)據(jù)分布特征與測度:概覽# 數(shù)據(jù)分布特征測度數(shù)據(jù)分布特征測度分布形狀分布形狀集中趨勢集中趨勢離散程度離散程度冪平均數(shù)冪平均數(shù)中位數(shù)中位數(shù)眾眾 數(shù)數(shù)異眾比率異眾比率方差、標準差方差、標準差峰峰 度度平均差平均差極差極差偏偏 度度變異系數(shù)變異系數(shù)# 第一節(jié)第一節(jié) 統(tǒng)計變量集中趨勢測定統(tǒng)計變量集中趨勢測定一一 集中趨勢指標及作用集中趨勢指標及作用二二 數(shù)值平均數(shù)數(shù)值平均數(shù)三三 眾數(shù)與中位數(shù)(眾數(shù)與中位數(shù)(位置平均數(shù)位置平均數(shù))# 一、集中趨勢指標及作用一、集中趨勢指標及作用n集中趨勢集中趨勢(Central ten

3、dency)集中趨勢集中趨勢 即即一組數(shù)據(jù)一組數(shù)據(jù)向其向其中心值中心值聚集或靠聚集或靠攏攏的的傾向和程度傾向和程度。 用用平均指標平均指標表示,代表數(shù)據(jù)的表示,代表數(shù)據(jù)的一一般水平般水平。測定測定集中趨勢集中趨勢是認識數(shù)據(jù)分布特征的是認識數(shù)據(jù)分布特征的基本內(nèi)容基本內(nèi)容。# n集中趨勢指標有兩類:集中趨勢指標有兩類:數(shù)值平均數(shù)數(shù)值平均數(shù) 根據(jù)根據(jù)全部數(shù)據(jù)計算得到全部數(shù)據(jù)計算得到的代表值。的代表值。 優(yōu)點:優(yōu)點:數(shù)學性質(zhì)良好,可用于統(tǒng)計推斷數(shù)學性質(zhì)良好,可用于統(tǒng)計推斷 缺點:缺點:易受極端值影響易受極端值影響。 主要有主要有算術(shù)平均數(shù)、調(diào)和平均數(shù)算術(shù)平均數(shù)、調(diào)和平均數(shù)及及幾幾何平均數(shù)何平均數(shù),三者

4、均為,三者均為冪平均數(shù)冪平均數(shù)特例。特例。# 位置平均數(shù)位置平均數(shù) 根據(jù)根據(jù)對總體中處于特定位置的單個或部對總體中處于特定位置的單個或部分單位標志值直接觀察或推算確定分單位標志值直接觀察或推算確定的代表值。的代表值。 優(yōu)點:優(yōu)點:不易受極端值影響,具有較好穩(wěn)健性。不易受極端值影響,具有較好穩(wěn)健性。 缺點:缺點:不宜用作統(tǒng)計推斷不宜用作統(tǒng)計推斷。 主要包括主要包括眾數(shù)眾數(shù)和和中位數(shù)中位數(shù)。# n集中趨勢指標作用集中趨勢指標作用1反映變量分布的反映變量分布的集中趨勢集中趨勢和和一般水平一般水平。如用平均工資了解職工工資分布的中心,反映職工工資的一般水平。2比較同一現(xiàn)象在不同空間或不同階段的發(fā)比較同

5、一現(xiàn)象在不同空間或不同階段的發(fā)展水平,反映現(xiàn)象展水平,反映現(xiàn)象變化特征變化特征、趨勢趨勢和和規(guī)律性規(guī)律性。能消除總體規(guī)模差異造成的不利影響;在一定程度上減弱偶然因素的影響。一、集中趨勢指標及作用一、集中趨勢指標及作用# 3分析現(xiàn)象之間的分析現(xiàn)象之間的依存關(guān)系依存關(guān)系。如研究勞動者文化程度與收入的關(guān)系。4(數(shù)值)平均指標是推斷統(tǒng)計中的(數(shù)值)平均指標是推斷統(tǒng)計中的重要重要統(tǒng)計量統(tǒng)計量,是進行統(tǒng)計推斷的基礎(chǔ)。,是進行統(tǒng)計推斷的基礎(chǔ)。# 幾種常見的位置特征數(shù)幾種常見的位置特征數(shù)n數(shù)據(jù)分布的位置特征數(shù)實際上也是數(shù)據(jù)的代表值實際上也是數(shù)據(jù)的代表值,代表了數(shù)據(jù)的一般水平。n在不同場合,可以適當選用平均數(shù)、

6、中位數(shù)、眾數(shù)充當位置特征數(shù)(代表值)n其中平均數(shù)不同于中位數(shù)、眾數(shù)的特點在于:其中平均數(shù)不同于中位數(shù)、眾數(shù)的特點在于:平均數(shù)是由所研究的全體數(shù)據(jù)參加計算所得。n平均數(shù)的一般形式叫做冪平均數(shù)冪平均數(shù)。常見的有算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)。# 二、數(shù)值平均數(shù)二、數(shù)值平均數(shù)(一)冪平均數(shù)(一)冪平均數(shù)冪,power變量X取N個值: 。權(quán)數(shù)為一組正數(shù): 。加權(quán)冪平均數(shù)一般形式為: 其中,k 為任意實數(shù)。Nxxx,21Nwww,21kNiiNiikipwwxM11# 權(quán)數(shù)w均相等時,加權(quán)平均數(shù)退化為簡單平均數(shù): kNikipNxM1# n特例情況特例情況 冪平均數(shù)冪平均數(shù)算術(shù)平均數(shù)(冪指數(shù)算術(shù)平均

7、數(shù)(冪指數(shù) k=1) 調(diào)和平均數(shù)(冪指數(shù)調(diào)和平均數(shù)(冪指數(shù) k=-1)幾何平均數(shù)(冪指數(shù)幾何平均數(shù)(冪指數(shù) k0) 其他冪平均數(shù)其他冪平均數(shù)# nk=1:算術(shù)平均數(shù)算術(shù)平均數(shù) 加權(quán)加權(quán) 簡單簡單NiiNiiiwwxx11NxxNii1# nk=-1:調(diào)和平均數(shù)調(diào)和平均數(shù) 加權(quán)加權(quán) 簡單簡單NiiiNiiNiiiNiiHwxwwwxM1111111NiiNiiHxNNxM11111# nk0:幾何平均數(shù)幾何平均數(shù)加權(quán)加權(quán)簡單簡單NiiNwwNwwGxxxM12121NNGxxxM21# 關(guān)于加權(quán)問題關(guān)于加權(quán)問題n權(quán)數(shù)確定方式:客觀權(quán)數(shù): 權(quán)數(shù)由實際統(tǒng)計資料獲得獲得或推算推算。主觀權(quán)數(shù): 根據(jù)研究

8、問題,由研究者主觀賦值主觀賦值。n權(quán)數(shù)作用:權(quán)衡權(quán)衡變量的各種取值在計算平均數(shù)時的重重要性要性。權(quán)數(shù)作用,根本上是通過權(quán)數(shù)結(jié)構(gòu)權(quán)數(shù)結(jié)構(gòu)實現(xiàn)。# n權(quán)數(shù)作用:即使不改變被平均的數(shù)值,僅改變權(quán)數(shù)結(jié)構(gòu),即可改變平均數(shù)水平。 例如,改變教師職稱結(jié)構(gòu),而不改變各種職例如,改變教師職稱結(jié)構(gòu),而不改變各種職稱教師課時費標準,會改變平均課時費水平。稱教師課時費標準,會改變平均課時費水平。n權(quán)數(shù)實質(zhì)權(quán)數(shù)的實質(zhì)實質(zhì)在于其結(jié)構(gòu),即結(jié)構(gòu)比例形式(比重權(quán)數(shù))。其更能清晰表明權(quán)數(shù)之權(quán)衡輕重權(quán)衡輕重的作用。# n權(quán)數(shù)形式有2種:絕對數(shù)形式結(jié)構(gòu)比例形式 kNiNiiikikNiiNiikipwwxwwxM1111NiNiii

9、iNiiiNiiHwwxwwxM11111111NiwwiwwNwwGNiiiNiiNxxxxM1211121 NiNiiiiNiiNiiiwwxwwxx1111# (二)算術(shù)平均數(shù)(二)算術(shù)平均數(shù)算術(shù)平均數(shù)算術(shù)平均數(shù)(Arithmetic mean ),也稱均),也稱均值(值(mean)。)。由一組數(shù)據(jù)的總和(由一組數(shù)據(jù)的總和(總體標志總量總體標志總量)除以)除以該組數(shù)據(jù)的項數(shù)(該組數(shù)據(jù)的項數(shù)(總體單位總量總體單位總量)得到)得到;算術(shù)平均數(shù)算術(shù)平均數(shù)=總體標志總量總體標志總量/總體單位總量總體單位總量是最常用的數(shù)值平均數(shù);是最常用的數(shù)值平均數(shù);根據(jù)掌握資料不同,其有多種計算公式。根據(jù)掌握資

10、料不同,其有多種計算公式。 # 1簡單算術(shù)平均數(shù)簡單算術(shù)平均數(shù)對對未分組數(shù)據(jù)未分組數(shù)據(jù),采用簡單算術(shù)平均數(shù)公式。即,采用簡單算術(shù)平均數(shù)公式。即把各項數(shù)據(jù)直接加總,然后除以總項數(shù)。把各項數(shù)據(jù)直接加總,然后除以總項數(shù)。計算公式:計算公式:NxxNii1# 分組分組舉例舉例表表 3-2年齡年齡人數(shù)(人)人數(shù)(人)xf2242510305501合計合計20表表 3-1男性男性女性女性22222222252525252525252525253030303050309 .26205382030.2250303025252525252222n解解:采用簡單算術(shù)平均法計算,即全體隊員的采用簡單算術(shù)平均法計算,

11、即全體隊員的平均年齡為(單位:周歲)平均年齡為(單位:周歲)75.31450302522分組數(shù)據(jù)不能簡單平分組數(shù)據(jù)不能簡單平均均 !因為各組變量值!因為各組變量值的次數(shù)(權(quán)數(shù))不等!的次數(shù)(權(quán)數(shù))不等!若采用簡單平均:若采用簡單平均:應(yīng)采用加權(quán)平均。應(yīng)采用加權(quán)平均。兩種計算公式結(jié)果相同!兩種計算公式結(jié)果相同!# 2加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)對對單項式分組資料單項式分組資料,應(yīng)以各標志值出現(xiàn),應(yīng)以各標志值出現(xiàn)次數(shù)為權(quán)數(shù)次數(shù)為權(quán)數(shù)加權(quán)加權(quán)平均平均 。加權(quán)算術(shù)平均數(shù)計算公式:加權(quán)算術(shù)平均數(shù)計算公式:n例例3-1單項式單項式分組資料(表分組資料(表3-2)計算方法為:)計算方法為:fxfffxfff

12、fxfxfxxniiniiinnn11212211.22 425 1030 550 14 105 153826.920 x # 3由組距分組資料計算由組距分組資料計算組距分組組距分組資料中,資料中,各組變量值不唯一各組變量值不唯一,是一個,是一個區(qū)間區(qū)間;計算時,各組變量值通常用計算時,各組變量值通常用組中值(近似)代表組中值(近似)代表;用組中值代替實際值,其用組中值代替實際值,其假定條件假定條件是是各組內(nèi)數(shù)據(jù)呈均勻分各組內(nèi)數(shù)據(jù)呈均勻分布或?qū)ΨQ分布布或?qū)ΨQ分布。由于實際情況中該條件未必滿足,故計算。由于實際情況中該條件未必滿足,故計算結(jié)果是結(jié)果是近似值近似值;與單項式分組資料一樣,采用加權(quán)算

13、術(shù)平均數(shù)計算。與單項式分組資料一樣,采用加權(quán)算術(shù)平均數(shù)計算。fxfffxffffxfxfxxniiniiinnn11212211.ffxx# 舉例舉例表表3-3 3-3 節(jié)能燈泡使用壽命數(shù)據(jù)節(jié)能燈泡使用壽命數(shù)據(jù)使用壽命使用壽命(小時)(小時) 組中組中值值x數(shù)量數(shù)量fxf 頻率頻率f /fxf/f1000以下以下900218000.020 181000-12001100888000.080 881200-1400130016208000.160 2081400-1600150035525000.350 5251600-1800170023391000.230 3911800-200019001

14、2228000.120 2282000以上以上2100484000.040 84合合 計計10015420011542154210015420011niiniiiffxx解:平均使用壽命為解:平均使用壽命為154211niiiniiffxx# 4比率類型統(tǒng)計變量求平均數(shù)比率類型統(tǒng)計變量求平均數(shù)(1)比率類型統(tǒng)計變量,指)比率類型統(tǒng)計變量,指平均指標平均指標和和相對指標相對指標。(2)對比率類型變量求平均,涉及)對比率類型變量求平均,涉及個體比率個體比率 和和總總比率比率 兩個概念。兩個概念。(3)對比率類型變量計算平均數(shù),基本要求是:)對比率類型變量計算平均數(shù),基本要求是:比率類型比率類型變量

15、變量平均值平均值M,等于等于個體比率個體比率的的總比率總比率。簡言之:。簡言之:先求和,先求和,再對比再對比。(4)根據(jù)掌握資料不同,可采用)根據(jù)掌握資料不同,可采用三種等價形式三種等價形式: 總比率,加權(quán)算術(shù)平均,加權(quán)調(diào)和平均總比率,加權(quán)算術(shù)平均,加權(quán)調(diào)和平均NiiNiiba11/iiibax/)/(/111111NiiiNiiNiiNiiiNiiNiixaabbxbaM# 例如:對例如:對相對數(shù)相對數(shù)求算術(shù)平均數(shù)求算術(shù)平均數(shù)u對對相對數(shù)相對數(shù)而言,由于各個而言,由于各個相對數(shù)的對比基礎(chǔ)不同,相對數(shù)的對比基礎(chǔ)不同,采用簡單算術(shù)平均不合理,采用簡單算術(shù)平均不合理,必須加權(quán)平均。必須加權(quán)平均。權(quán)

16、數(shù)選擇必須符合該相對數(shù)權(quán)數(shù)選擇必須符合該相對數(shù)本身的計算公式,通常為該本身的計算公式,通常為該相對數(shù)的相對數(shù)的分母分母指標。指標。對表對表3-4的分組資料:的分組資料: 其中,分母其中,分母b為權(quán)數(shù)為權(quán)數(shù)f 表表 3-4企企 業(yè)業(yè)流通費用流通費用率()率()x=a/b商品商品銷售額銷售額(萬元)(萬元)b流通流通費用費用(萬元)(萬元)a甲甲161600256乙乙104750475丙丙124000480合合 計計103501211%7 .11%10010350121140004750160040001247501016001611niiniiiffxx# 又如:對又如:對平均數(shù)平均數(shù)求算術(shù)平均

17、數(shù)求算術(shù)平均數(shù)n某商貿(mào)公司購入一批水果,分等級收購價格和收購金額如下某商貿(mào)公司購入一批水果,分等級收購價格和收購金額如下表。試求這批水果的平均收購價格。表。試求這批水果的平均收購價格。 n解:解:376601.6268/23150qxqx元 千克# 5算術(shù)平均數(shù)主要數(shù)學性質(zhì)算術(shù)平均數(shù)主要數(shù)學性質(zhì)(1)算術(shù)平均數(shù)與變量值個數(shù)乘積,等于各變量值總和。)算術(shù)平均數(shù)與變量值個數(shù)乘積,等于各變量值總和。 (2)各變量值與算術(shù)平均數(shù)的離差之總和,等于零。)各變量值與算術(shù)平均數(shù)的離差之總和,等于零。(3)各變量值與算術(shù)平均數(shù)的離差平方之總和最小。)各變量值與算術(shù)平均數(shù)的離差平方之總和最小。 (從全(從全部數(shù)

18、據(jù)看,算術(shù)平均數(shù)最接近所有變量值)部數(shù)據(jù)看,算術(shù)平均數(shù)最接近所有變量值)niixxn10)1niixx(min)12niixx(# n性質(zhì)(性質(zhì)(3)證明:)證明:# (三)調(diào)和平均數(shù)(三)調(diào)和平均數(shù)(Harmonic mean)調(diào)和平均數(shù),也稱倒數(shù)平均數(shù)。調(diào)和平均數(shù),也稱倒數(shù)平均數(shù)。各變量值各變量值倒數(shù)倒數(shù)(1/xi)的)的算術(shù)平均數(shù)算術(shù)平均數(shù)的的倒數(shù)倒數(shù)。計算公式為:計算公式為:niiiniinnnnnnHxmmxmxmxmmmmmmmmxmxmxx11221121212211.1.111# n社會經(jīng)濟統(tǒng)計中所應(yīng)用的調(diào)和平均數(shù),通常是加權(quán)社會經(jīng)濟統(tǒng)計中所應(yīng)用的調(diào)和平均數(shù),通常是加權(quán)算術(shù)平均

19、數(shù)的算術(shù)平均數(shù)的變形變形。n已知各組變量值已知各組變量值 xi 和(和(xi fi)而缺乏)而缺乏 fi 時,加權(quán)算術(shù)時,加權(quán)算術(shù)平均數(shù)通??勺冃螢檎{(diào)和平均數(shù)形式來計算。平均數(shù)通??勺冃螢檎{(diào)和平均數(shù)形式來計算。n回憶回憶3-4求解:求解:7 .11100103501211124801047516256480475256)()(1111niiiiniiiniiniiixfxfxffxx# (四)幾何平均數(shù)(四)幾何平均數(shù)(Geometric mean)n簡單幾何平均數(shù)簡單幾何平均數(shù) n個變量值連乘積的個變量值連乘積的n次方根。次方根。n加權(quán)幾何平均數(shù)加權(quán)幾何平均數(shù)n適用于各個變量值之間存在連乘積

20、關(guān)系的場合。適用于各個變量值之間存在連乘積關(guān)系的場合。主要用于計算現(xiàn)象的主要用于計算現(xiàn)象的平均發(fā)展速度平均發(fā)展速度(第九章);(第九章);也適用于對某些具有環(huán)比性質(zhì)的也適用于對某些具有環(huán)比性質(zhì)的比率求平均比率求平均(下例)。(下例)。nniinnGxxxxx121.niiikkfnififfffkffGxxxxx121211).(21.# 舉例舉例n例例3-5。某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道。某企業(yè)產(chǎn)品的加工要順次經(jīng)過前后銜接的五道工序。本月該企業(yè)各加工工序的合格率分別為工序。本月該企業(yè)各加工工序的合格率分別為88、85、90、92、96,試求這五道工序的平均合,試求這五道工序的平均

21、合格率。格率。n解:本例中各工序的合格率具有環(huán)比的性質(zhì),企業(yè)產(chǎn)解:本例中各工序的合格率具有環(huán)比的性質(zhì),企業(yè)產(chǎn)品的總合格率等于各工序合格率之連乘積。所以,所品的總合格率等于各工序合格率之連乘積。所以,所求平均合格率應(yīng)為:求平均合格率應(yīng)為:%31.90%9692%90%85885Gx# (五)幾種平均數(shù)大小關(guān)系(五)幾種平均數(shù)大小關(guān)系 對同一批數(shù)據(jù)和權(quán)數(shù),三種平均數(shù)關(guān)系:對同一批數(shù)據(jù)和權(quán)數(shù),三種平均數(shù)關(guān)系: 調(diào)和平均調(diào)和平均 幾何平均幾何平均 算術(shù)平均算術(shù)平均當且僅當所有觀察值全部相等時,等號成立;否當且僅當所有觀察值全部相等時,等號成立;否則不等式嚴格成立。則不等式嚴格成立。 證明思路:證明思路

22、:首先證明冪平均數(shù)隨冪值首先證明冪平均數(shù)隨冪值 k 單調(diào)遞增變化(可由單調(diào)遞增變化(可由微分方法證明)。微分方法證明)。根據(jù)三類平均數(shù)根據(jù)三類平均數(shù) k 取值關(guān)系,調(diào)和平均數(shù)(取值關(guān)系,調(diào)和平均數(shù)(k=-1)、幾何平均數(shù)()、幾何平均數(shù)(k0)、算術(shù)平均數(shù)()、算術(shù)平均數(shù)(k=1)可得到以上結(jié)論??傻玫揭陨辖Y(jié)論。# 平均數(shù)的應(yīng)用場合平均數(shù)的應(yīng)用場合n常見的應(yīng)用場合有:常見的應(yīng)用場合有:作為統(tǒng)計指標的一種表現(xiàn)形式作為統(tǒng)計指標的一種表現(xiàn)形式作為統(tǒng)計總體分布的位置特征數(shù)作為統(tǒng)計總體分布的位置特征數(shù)反映一個統(tǒng)計變量所有觀察值的一般水平反映一個統(tǒng)計變量所有觀察值的一般水平抵消掉隨機試驗中的偶然因素影響,

23、顯示出試驗抵消掉隨機試驗中的偶然因素影響,顯示出試驗的規(guī)律性水平。的規(guī)律性水平。 # n數(shù)據(jù)是隨機試驗的結(jié)果。數(shù)據(jù)是隨機試驗的結(jié)果。n隨機試驗的個別結(jié)果會呈現(xiàn)出或高或低的起伏波動隨機試驗的個別結(jié)果會呈現(xiàn)出或高或低的起伏波動,實際上這是由偶然因素影響造成的。,實際上這是由偶然因素影響造成的。n在進行大量重復(fù)試驗,將試驗結(jié)果簡單算術(shù)平均,在進行大量重復(fù)試驗,將試驗結(jié)果簡單算術(shù)平均,那么隨著試驗次數(shù)的增加,算術(shù)平均值就會越來越那么隨著試驗次數(shù)的增加,算術(shù)平均值就會越來越逼近一個穩(wěn)定值,而這個穩(wěn)定值就是試驗的規(guī)律性逼近一個穩(wěn)定值,而這個穩(wěn)定值就是試驗的規(guī)律性水平(數(shù)學期望值)。水平(數(shù)學期望值)。n因

24、此,在統(tǒng)計分析中,常常采用算術(shù)平均的手法去因此,在統(tǒng)計分析中,常常采用算術(shù)平均的手法去抵消現(xiàn)象中的偶然影響,以期抵消現(xiàn)象中的偶然影響,以期近似地近似地認識現(xiàn)象的規(guī)認識現(xiàn)象的規(guī)律性水平。律性水平。# 三、眾數(shù)與中位數(shù)三、眾數(shù)與中位數(shù)(一)眾數(shù)(一)眾數(shù)(Mode)n眾數(shù)是一組數(shù)據(jù)中眾數(shù)是一組數(shù)據(jù)中出現(xiàn)出現(xiàn)頻數(shù)最多、頻率最高頻數(shù)最多、頻率最高的變量的變量值,常用值,常用 Mo 表示。表示。n眾數(shù)代表最常見、最普遍的狀況,可度量現(xiàn)象集中眾數(shù)代表最常見、最普遍的狀況,可度量現(xiàn)象集中趨勢。趨勢??蓽y度可測度定性變量定性變量集中趨勢,也可度量集中趨勢,也可度量定量變量定量變量集中趨勢。集中趨勢。 在社會經(jīng)

25、濟現(xiàn)象的管理決策中具有廣泛應(yīng)用。在社會經(jīng)濟現(xiàn)象的管理決策中具有廣泛應(yīng)用。# n對分布數(shù)列求眾數(shù),具有對分布數(shù)列求眾數(shù),具有條件性條件性。存在性存在性: 若分布數(shù)列沒有明顯集中趨勢,則若分布數(shù)列沒有明顯集中趨勢,則不存在不存在眾數(shù);眾數(shù);唯一性唯一性: 若分布數(shù)列有多個相對集中趨勢,則若分布數(shù)列有多個相對集中趨勢,則有多個有多個眾數(shù)。眾數(shù)。 從分布曲線上看,眾數(shù)就是一個變量分布曲線的最高峰所對應(yīng)的變量值。(見課本55頁圖3-1)n為確定眾數(shù),通常要編制分布數(shù)列。為確定眾數(shù),通常要編制分布數(shù)列。眾數(shù)是分布曲線眾數(shù)是分布曲線最高點最高點對應(yīng)的標志值。對應(yīng)的標志值。單項式單項式分布數(shù)列中,眾數(shù)是具有最

26、多次數(shù)的標志值,可分布數(shù)列中,眾數(shù)是具有最多次數(shù)的標志值,可觀觀察察得到。如表得到。如表3-2中,眾數(shù)值中,眾數(shù)值Mo25,組距式組距式分布數(shù)列中,眾數(shù)需要分布數(shù)列中,眾數(shù)需要推算推算。# n組距分布數(shù)列中,眾數(shù)推算方法:組距分布數(shù)列中,眾數(shù)推算方法:先找到眾數(shù)組。先找到眾數(shù)組。u等距數(shù)列中,眾數(shù)組是等距數(shù)列中,眾數(shù)組是頻數(shù)最多頻數(shù)最多的組;的組;u異距數(shù)列中,眾數(shù)組是異距數(shù)列中,眾數(shù)組是頻數(shù)密度頻數(shù)密度最大的組。最大的組。根據(jù)眾數(shù)組與其相鄰兩組的根據(jù)眾數(shù)組與其相鄰兩組的次數(shù)差次數(shù)差推算(假定性)推算(假定性)。其公式有其公式有2,結(jié)果完全一致:,結(jié)果完全一致:具體計算:見教材例具體計算:見教

27、材例3-7(P55)OOMMOdLM211OOMMOdUM212下限公式:下限公式: 上限公式:上限公式: # 表表3-3 3-3 節(jié)能燈泡使用壽命數(shù)據(jù)節(jié)能燈泡使用壽命數(shù)據(jù)使用壽命使用壽命(小時)(小時) 組中值組中值x數(shù)量數(shù)量fxf 頻率頻率f /fxf/f1000以下以下900218000.020 181000-12001100888000.080 881200-1400130016208000.160 2081400-1600150035525000.350 5251600-1800170023391000.230 3911800-2000190012228000.120 2282000

28、以上以上2100484000.040 84合合 計計10015420011542# 40 50 60 70 80 90 10050 40 30 20 10A G FBCED頻數(shù)頻數(shù)x y(L) (U)Mo=L+x=U-yO2121FDACODAOOEBOyxODFACOdyxBEFDAC相似于# (二)中位數(shù)(二)中位數(shù)(Median)n中位數(shù)是將數(shù)據(jù)由小到大排列后中位數(shù)是將數(shù)據(jù)由小到大排列后位置居中位置居中的數(shù)值。的數(shù)值。標志值標志值小于小于或等于或等于中位數(shù)的單位占一半;中位數(shù)的單位占一半;標志值標志值大于大于或等于或等于中位數(shù)的單位也占一半。中位數(shù)的單位也占一半。用中位數(shù)代表總體標志值的

29、一般水平,可以用中位數(shù)代表總體標志值的一般水平,可以避免極端值避免極端值影響影響,有時更具代表性。,有時更具代表性。# n未分組數(shù)據(jù)計算中位數(shù)未分組數(shù)據(jù)計算中位數(shù)若數(shù)據(jù)項數(shù)是若數(shù)據(jù)項數(shù)是奇數(shù)奇數(shù),則位于,則位于中間的數(shù)值中間的數(shù)值為為中位數(shù);如中位數(shù);如5人收入為人收入為: 1200,1450,1500,1600,2000元,則其收入中位元,則其收入中位數(shù)數(shù) Me =1500。若數(shù)據(jù)項數(shù)是若數(shù)據(jù)項數(shù)是偶數(shù)偶數(shù),則取,則取居中兩個數(shù)值的居中兩個數(shù)值的平均數(shù)平均數(shù)為中位數(shù)。如為中位數(shù)。如6人收入為人收入為: 1200,1450,1500,1600, 1800,2000元,則收入元,則收入中位數(shù)中位

30、數(shù) Me =1550。# n分組數(shù)據(jù)推算中位數(shù)分組數(shù)據(jù)推算中位數(shù)先確定先確定中位數(shù)組中位數(shù)組,即中間位置(,即中間位置(f / 2)所在的組。所在的組。對單項式分組,可對單項式分組,可直接得到直接得到中位數(shù)。中位數(shù)。對組距式分組,對組距式分組,假定假定中位數(shù)組內(nèi)次數(shù)中位數(shù)組內(nèi)次數(shù)均勻分布均勻分布,近似,近似推算推算中位數(shù)。中位數(shù)。計算公式有計算公式有2,結(jié)果完全一致:,結(jié)果完全一致:# n下限公式下限公式n上限公式上限公式MeMeMeMeedfSfLM12MeMeMeMeedfSfUM12# 成績分組成績分組頻數(shù)(人)頻數(shù)(人)50以下以下1050-602060-703070-805080-9

31、04090-10030合計合計180n分組數(shù)據(jù)推算中位數(shù)分組數(shù)據(jù)推算中位數(shù)先確定先確定中位數(shù)組中位數(shù)組,即中間位置(,即中間位置(f / 2)所在的組。)所在的組。對單項式分組,可對單項式分組,可直接得到直接得到中位數(shù)。中位數(shù)。對組距式分組,對組距式分組,假定假定中位數(shù)組內(nèi)次數(shù)中位數(shù)組內(nèi)次數(shù)均勻分布均勻分布,近似,近似推算推算中位數(shù)。計算公式有中位數(shù)。計算公式有2,結(jié)果完全一致。見下例:,結(jié)果完全一致。見下例:MeMeMeMeedfSfLM12MeMeMeMeedfSfUM12下限公式:下限公式: 上限公式:上限公式: # 可由可由累計分布數(shù)列累計分布數(shù)列或或累計分布圖累計分布圖確定中位數(shù)。確

32、定中位數(shù)。以累計頻率分布曲線圖為例以累計頻率分布曲線圖為例(該例與前面直方圖數(shù)據(jù)一致該例與前面直方圖數(shù)據(jù)一致)此例中,此例中,與累計頻率與累計頻率50%相對應(yīng)的成績相對應(yīng)的成績76分,即為中位數(shù)。分,即為中位數(shù)。向上累計圖:向上累計圖:60分以下有分以下有16.7%向下累計圖:向下累計圖:80分以上有分以上有38.9%# n中位數(shù)與分位數(shù)中位數(shù)與分位數(shù)四分位數(shù)、十分位數(shù)、百分位數(shù)分別是將數(shù)據(jù)由小到大排四分位數(shù)、十分位數(shù)、百分位數(shù)分別是將數(shù)據(jù)由小到大排序后,位于全部數(shù)據(jù)序后,位于全部數(shù)據(jù)1/4、 1/10、 1/100位置上的數(shù)值。位置上的數(shù)值。中位數(shù)實際上是第中位數(shù)實際上是第2個四分位數(shù)、第個

33、四分位數(shù)、第5個十分位數(shù)、第個十分位數(shù)、第50個個百分位數(shù)。百分位數(shù)。分位數(shù)與其它指標結(jié)合,可以更詳細地反映數(shù)據(jù)分布特征。分位數(shù)與其它指標結(jié)合,可以更詳細地反映數(shù)據(jù)分布特征。n中位數(shù)使用場合與作用中位數(shù)使用場合與作用在在較明顯的偏斜分布較明顯的偏斜分布情形下,用中位數(shù)來說明次數(shù)分布位情形下,用中位數(shù)來說明次數(shù)分布位置特征較為適中。因為眾數(shù)忽略了偏斜一側(cè)的大量數(shù)值,置特征較為適中。因為眾數(shù)忽略了偏斜一側(cè)的大量數(shù)值,而算術(shù)平均數(shù)又過分強調(diào)了這些數(shù)值。而算術(shù)平均數(shù)又過分強調(diào)了這些數(shù)值。算術(shù)平均數(shù)對特異值的反應(yīng)十分靈敏,而中位數(shù)對特異值算術(shù)平均數(shù)對特異值的反應(yīng)十分靈敏,而中位數(shù)對特異值反應(yīng)不靈敏。常常

34、把中位數(shù)(與算術(shù)平均數(shù)的差異大小)反應(yīng)不靈敏。常常把中位數(shù)(與算術(shù)平均數(shù)的差異大?。┳鳛樽鳛樘剿靼l(fā)現(xiàn)特異值探索發(fā)現(xiàn)特異值的標準。的標準。# n箱線圖(箱線圖(box plot)箱線圖由一組數(shù)據(jù)的最小值(箱線圖由一組數(shù)據(jù)的最小值(xmin)、第一四分位數(shù))、第一四分位數(shù)(Q1)、中位數(shù)()、中位數(shù)(Me)、第三四分位數(shù)()、第三四分位數(shù)(Q3)、最大值)、最大值(xmax)等五個數(shù)值來繪成。)等五個數(shù)值來繪成。利用箱線圖可以觀察數(shù)據(jù)分布的利用箱線圖可以觀察數(shù)據(jù)分布的范圍、中心位置和對稱性范圍、中心位置和對稱性等等特征,還可進行多組數(shù)據(jù)分布的比較。特征,還可進行多組數(shù)據(jù)分布的比較。xmin Q1

35、Me Q3 xmax# (三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)比較(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)比較 0. 三者均測度數(shù)據(jù)的集中趨勢和一般水平。三者均測度數(shù)據(jù)的集中趨勢和一般水平。 1. 算術(shù)平均數(shù)屬于算術(shù)平均數(shù)屬于數(shù)值平均數(shù)數(shù)值平均數(shù),其綜合利用全部數(shù)據(jù)信,其綜合利用全部數(shù)據(jù)信息;息; 眾數(shù)和中位數(shù)則由數(shù)據(jù)分布的特定眾數(shù)和中位數(shù)則由數(shù)據(jù)分布的特定位置位置確定。確定。 2. 算術(shù)平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都算術(shù)平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都存在存在,且具,且具有有惟一性惟一性; 眾數(shù)則不然,其計算和應(yīng)用有兩個前提條件:數(shù)據(jù)項眾數(shù)則不然,其計算和應(yīng)用有兩個前提條件:數(shù)據(jù)項數(shù)眾多,數(shù)眾多, 且具有明

36、顯的集中趨勢。且具有明顯的集中趨勢。 # 3.算術(shù)平均數(shù)只能用于算術(shù)平均數(shù)只能用于定量定量(數(shù)值型)數(shù)據(jù);(數(shù)值型)數(shù)據(jù); 中位數(shù)適用于中位數(shù)適用于定序定序數(shù)據(jù)和數(shù)據(jù)和定量定量數(shù)據(jù);數(shù)據(jù); 眾數(shù)適用于眾數(shù)適用于所有形式所有形式(各種類型及計量層次)的數(shù)據(jù)。(各種類型及計量層次)的數(shù)據(jù)。 4.算術(shù)平均數(shù)受數(shù)據(jù)極端值影響,而眾數(shù)和中位數(shù)都算術(shù)平均數(shù)受數(shù)據(jù)極端值影響,而眾數(shù)和中位數(shù)都不受極端值的影響。不受極端值的影響。為排除極端值干擾,可計算切尾均值,即去掉數(shù)據(jù)中最大為排除極端值干擾,可計算切尾均值,即去掉數(shù)據(jù)中最大和最小的若干數(shù)值后計算的均值。和最小的若干數(shù)值后計算的均值。該思路常用于某些比賽計分

37、規(guī)則中,如體操、跳水等。該思路常用于某些比賽計分規(guī)則中,如體操、跳水等。切尾均值是將算術(shù)平均數(shù)與中位數(shù)切尾均值是將算術(shù)平均數(shù)與中位數(shù)互相結(jié)合互相結(jié)合的結(jié)果。的結(jié)果。# 5. 算術(shù)平均數(shù)可用于推算總體的有關(guān)總量指標,而中算術(shù)平均數(shù)可用于推算總體的有關(guān)總量指標,而中位數(shù)和眾數(shù)則不宜用作此類推算。位數(shù)和眾數(shù)則不宜用作此類推算。 6. 算術(shù)平均數(shù)和眾數(shù)、中位數(shù)的算術(shù)平均數(shù)和眾數(shù)、中位數(shù)的數(shù)量關(guān)系數(shù)量關(guān)系,取決于數(shù),取決于數(shù)據(jù)分布的據(jù)分布的偏斜程度偏斜程度。對單峰鐘形分布而言,三者數(shù)。對單峰鐘形分布而言,三者數(shù)量大小有如下關(guān)系:量大小有如下關(guān)系:# 據(jù)例據(jù)例3-2,3-7,3-8結(jié)果,表結(jié)果,表3-3的

38、燈泡壽命數(shù)據(jù)的燈泡壽命數(shù)據(jù)服從右偏分布。服從右偏分布。)( 3)(MeXMoX皮爾遜(皮爾遜(K. Pearson)經(jīng)驗公式:)經(jīng)驗公式:在輕微偏態(tài)時,三者的近似關(guān)系為在輕微偏態(tài)時,三者的近似關(guān)系為0MMxe0MMxe0MeMx對稱分布對稱分布右偏分布右偏分布上上偏偏分布分布正偏分布正偏分布左偏分布左偏分布下偏分布下偏分布負偏分布負偏分布# 第二節(jié)第二節(jié) 統(tǒng)計變量離散程度測定統(tǒng)計變量離散程度測定n一、離散程度指標及其作用一、離散程度指標及其作用n二、極差、四分位差和平均差二、極差、四分位差和平均差n三、方差和標準差三、方差和標準差n四、離散系數(shù)四、離散系數(shù)n五、異眾比率五、異眾比率# 一、離散

39、程度指標及作用一、離散程度指標及作用n測度離散程度的指標,稱為測度離散程度的指標,稱為變異指標變異指標,分為兩類:,分為兩類:絕對數(shù)絕對數(shù):極差、四分位差、平均差、方差和標準差。:極差、四分位差、平均差、方差和標準差。相對數(shù)相對數(shù):離散系數(shù)、異眾比率。:離散系數(shù)、異眾比率。n離散程度指標作用:離散程度指標作用: 1.說明數(shù)據(jù)分散程度,反映變量的說明數(shù)據(jù)分散程度,反映變量的穩(wěn)定性、均衡性穩(wěn)定性、均衡性。 數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。數(shù)據(jù)之間差異越大,變量的穩(wěn)定性或均衡性越差。 2.衡量平均數(shù)的衡量平均數(shù)的代表性代表性。離散程度越大,平均數(shù)的代表性就越小。離散程度越大,平均數(shù)的代表

40、性就越小。 3. 統(tǒng)計推斷統(tǒng)計推斷的重要依據(jù)的重要依據(jù)判別統(tǒng)計推斷前提條件是否成立;判別統(tǒng)計推斷前提條件是否成立;衡量推斷效果好壞的重要尺度。衡量推斷效果好壞的重要尺度。 # 二、極差、四分位差和平均差二、極差、四分位差和平均差(一)極差(一)極差(Range)n極差極差( (極值之差極值之差) )是一組數(shù)據(jù)的最大值與最小值之差,是一組數(shù)據(jù)的最大值與最小值之差,常用常用 R 表示。表示。n對總體數(shù)據(jù)而言,極差能界定變量變化范圍與幅度對總體數(shù)據(jù)而言,極差能界定變量變化范圍與幅度大小,也稱大小,也稱全距全距。n組距數(shù)列中,極差組距數(shù)列中,極差最高組上限最高組上限-最低組下限。最低組下限。n優(yōu)缺點:

41、優(yōu)缺點:優(yōu)點:優(yōu)點:計算簡便、含義直觀、容易理解計算簡便、含義直觀、容易理解。缺點:缺點:代表性差、穩(wěn)健性差代表性差、穩(wěn)健性差(僅利用尾端信息,未考慮數(shù)(僅利用尾端信息,未考慮數(shù)據(jù)中間分布情況,不能充分說明全部數(shù)據(jù)的差異程度)。據(jù)中間分布情況,不能充分說明全部數(shù)據(jù)的差異程度)。minmaxxxR# (二)四分位差(二)四分位差n第第3四分位數(shù)(四分位數(shù)(Q3)與第)與第1四分位數(shù)(四分位數(shù)(Q1)之差,常)之差,常用用Qd表示。計算公式為:表示。計算公式為:n實質(zhì)是兩端各去掉實質(zhì)是兩端各去掉1/4數(shù)據(jù)以后的數(shù)據(jù)以后的極差極差,表示占全部,表示占全部數(shù)據(jù)一半的數(shù)據(jù)一半的中間數(shù)據(jù)中間數(shù)據(jù)的離散程度

42、。四分位差越大,的離散程度。四分位差越大,表示數(shù)據(jù)離散程度越大。表示數(shù)據(jù)離散程度越大。n在一定程度上在一定程度上改進改進極差,避免了極端值干擾。但對極差,避免了極端值干擾。但對數(shù)據(jù)差異的反映,仍然數(shù)據(jù)差異的反映,仍然不充分不充分。n使用場合:當用使用場合:當用中位數(shù)中位數(shù)測度數(shù)據(jù)集中趨勢時,使用測度數(shù)據(jù)集中趨勢時,使用四分位差反映離散程度效果最好(四分位差反映離散程度效果最好(匹配性匹配性) 。13QQQd# (三)平均差(三)平均差(Average Deviation)n定義:定義:平均差是各數(shù)據(jù)與其平均差是各數(shù)據(jù)與其均值(算術(shù)平均數(shù))均值(算術(shù)平均數(shù))的的離差絕對值離差絕對值的的算術(shù)平均數(shù)

43、算術(shù)平均數(shù)。反映反映全部全部數(shù)據(jù)與其數(shù)據(jù)與其均值均值的的平均差距平均差距,以,以A.D表示。表示。n計算公式:計算公式:n優(yōu)缺點:優(yōu)缺點:含義清晰,能含義清晰,能全面全面反映數(shù)據(jù)離散程度。反映數(shù)據(jù)離散程度。取離差取離差絕對值絕對值進行平均,數(shù)學處理進行平均,數(shù)學處理不方便不方便,數(shù)學性質(zhì)也,數(shù)學性質(zhì)也非最優(yōu)。非最優(yōu)。nxxDAnii1|.niiiniiffxxDA11|.分組數(shù)據(jù)分組數(shù)據(jù): xi為各組組中值為各組組中值未分組數(shù)據(jù)未分組數(shù)據(jù): xi為原始數(shù)據(jù)為原始數(shù)據(jù)# 三、方差和標準差三、方差和標準差(一)(一) 方差(方差(Variance)概念和計算)概念和計算n方差是全部數(shù)據(jù)與其方差是全

44、部數(shù)據(jù)與其均值均值的的離差平方離差平方的的算術(shù)平均數(shù)算術(shù)平均數(shù).n總體方差(總體方差( 2)計算公式:)計算公式:n樣本方差(常用樣本方差(常用 S2 表示)分母應(yīng)改為(表示)分母應(yīng)改為(n -1)。只)。只有如此,有如此, 才能保證才能保證s2是是2的的無偏估計量無偏估計量。nxxnii122)(niiiniiffxx1122)(分組數(shù)據(jù):分組數(shù)據(jù):未分組數(shù)據(jù):未分組數(shù)據(jù):# n標準差(標準差(standard Deviation):方差的算術(shù)平方根。):方差的算術(shù)平方根。n總體標準差一般用總體標準差一般用 表示。計算公式為:表示。計算公式為:未分組數(shù)據(jù):未分組數(shù)據(jù):n樣本標準差(樣本標準差

45、(S),分母應(yīng)為(),分母應(yīng)為(n-1)。)。n特點:特點:方差和標準差均方差和標準差均利用全部數(shù)據(jù)計算利用全部數(shù)據(jù)計算,能,能全面反映數(shù)據(jù)離全面反映數(shù)據(jù)離散程度散程度;且其;且其靈敏性靈敏性通常通常高高于平均差。于平均差。標準差比方差更容易理解標準差比方差更容易理解(計量單位與均值一致計量單位與均值一致)。在)。在社會經(jīng)濟現(xiàn)象的統(tǒng)計分析中,標準差比方差社會經(jīng)濟現(xiàn)象的統(tǒng)計分析中,標準差比方差應(yīng)用普遍應(yīng)用普遍,經(jīng)常被用作測度數(shù)據(jù)與均值差距的標準尺度。經(jīng)常被用作測度數(shù)據(jù)與均值差距的標準尺度。nxxnii12)(分組數(shù)據(jù):分組數(shù)據(jù):niiiniiffxx112)(# 例例3-9n計算平均差、方差、標

46、準差計算平均差、方差、標準差n由例由例3-2,已知該組數(shù)據(jù)算術(shù)平均數(shù)為,已知該組數(shù)據(jù)算術(shù)平均數(shù)為1542。使用壽命使用壽命(小時)(小時) 組中值組中值 (x)試驗數(shù)量試驗數(shù)量(只)(只)f 頻率頻率 (f/f)(x1542)|x1542|f(x1542)2*f1000以下以下90020.020 -64212848243281000-1200110080.080 -442353615629121200160 -24238729370241400-16001500350.350 -421470617401600230 1583634574172

47、1800-20001900120.120 358429615379682000以上以上210040.040 55822321245456合計合計1001.000 203246743600# 24.20310020324|.11niiiniiffxxDA6743610067436001122niiiniiffxx)(684.2591006743600112niiiniiffxx)(# (二)方差主要數(shù)學性質(zhì)(二)方差主要數(shù)學性質(zhì)常數(shù)方差等于零。如常數(shù)方差等于零。如a為常數(shù),則為常數(shù),則 變量線性函數(shù)的方差,等于變量系數(shù)的平方乘以變量的方變量線性函數(shù)的方差,等于變量系數(shù)的平方乘以變量的方差。設(shè)差。

48、設(shè)a,b為常數(shù),為常數(shù),y=a+bx,則有:,則有:分組條件下,總體方差可以分解為組間方差與各組方差平分組條件下,總體方差可以分解為組間方差與各組方差平均數(shù)之和。(該結(jié)論可用于第六章均數(shù)之和。(該結(jié)論可用于第六章方差分析方差分析)02a222xyb222Bniiniiiff1122niiniiiffxxB1122)(u組間方差組間方差u各組方差平均數(shù)各組方差平均數(shù)# (三)標準化值(三)標準化值(Z-score)對于兩組數(shù)據(jù),如果其均值和標準差均有明顯差異,則往對于兩組數(shù)據(jù),如果其均值和標準差均有明顯差異,則往往不能直接對比。需要首先將其轉(zhuǎn)化為可比的數(shù)據(jù)。往不能直接對比。需要首先將其轉(zhuǎn)化為可比

49、的數(shù)據(jù)。通常可以對其進行無量綱化處理,得到標準化值,也稱為通常可以對其進行無量綱化處理,得到標準化值,也稱為Z值。值。標準化值,實際是將不同均值和標準差的總體轉(zhuǎn)換為均值標準化值,實際是將不同均值和標準差的總體轉(zhuǎn)換為均值為為0、標準差為、標準差為1的總體,將原始數(shù)據(jù)轉(zhuǎn)換為其在總體中的的總體,將原始數(shù)據(jù)轉(zhuǎn)換為其在總體中的相對位置。相對位置。標準化值比較具有相對意義,沒有絕對意義。標準化值比較具有相對意義,沒有絕對意義。xxZi# 例例3-10n假定某班學生先后兩次進行難度不同的綜合考試。假定某班學生先后兩次進行難度不同的綜合考試。第一次考試成績的均值和標準差分別為第一次考試成績的均值和標準差分別為

50、80分和分和10分,分,第二次考試成績的均值和標準差分別為第二次考試成績的均值和標準差分別為70分和分和7分。分。某同學第一、二次考試的成績分別為某同學第一、二次考試的成績分別為92分和分和80分,分,那么全班相比較而言,他哪一次考試的成績更好呢?那么全班相比較而言,他哪一次考試的成績更好呢?n解:解:由于兩次考試成績的均值和標準差不同,該學由于兩次考試成績的均值和標準差不同,該學生兩次考試的成績不宜直接比較生兩次考試的成績不宜直接比較。直接比較,第一次成績更好;直接比較,第一次成績更好;利用標準化值比較,表明第二次考試成績更好一些。利用標準化值比較,表明第二次考試成績更好一些。20. 110

51、809243. 177080# (四)(四) 對稱鐘形分布的對稱鐘形分布的3 法則法則n3 法則法則關(guān)于對稱鐘形分布的近似經(jīng)驗法則:關(guān)于對稱鐘形分布的近似經(jīng)驗法則:變量值落在變量值落在 -3 ,+3 范圍以外的情況極為少見。范圍以外的情況極為少見。通常將落在區(qū)間通常將落在區(qū)間-3 ,+3 之外的數(shù)據(jù),稱為異常數(shù)據(jù)或之外的數(shù)據(jù),稱為異常數(shù)據(jù)或離群點。離群點。x99.73%68.27%95.45%2x3xxx2x3xx正態(tài)分布正態(tài)分布# 四、離散系數(shù)四、離散系數(shù)n絕對值變異指標有計量單位。其數(shù)值大小不僅取決絕對值變異指標有計量單位。其數(shù)值大小不僅取決于數(shù)據(jù)離散程度,還受數(shù)據(jù)本身水平高低和計量單于數(shù)

52、據(jù)離散程度,還受數(shù)據(jù)本身水平高低和計量單位的影響。位的影響。n對不同變量(或不同數(shù)據(jù)組)的離散程度進行比較對不同變量(或不同數(shù)據(jù)組)的離散程度進行比較時,只有當它們的時,只有當它們的平均水平平均水平和和計量單位計量單位都相同都相同時,時,才能利用絕對值變異指標分析;否則,須利用離散才能利用絕對值變異指標分析;否則,須利用離散系數(shù)比較其離散程度。系數(shù)比較其離散程度。例如,哪個變量差異較大:體重,還是身高?例如,哪個變量差異較大:體重,還是身高?例如,那組人群體重差異較大:成人,還是嬰兒?例如,那組人群體重差異較大:成人,還是嬰兒?u 成人:平均體重成人:平均體重=70 kg,標準差,標準差=5

53、kgu 嬰兒:嬰兒: 5 kg, 1 kg# 例:觀察例:觀察7個人的體重和身高如下:個人的體重和身高如下:n體重(公斤)體重(公斤)xi:62, 67, 65, 69, 70, 73, 74n身高(厘米)身高(厘米)yi:165, 166, 168, 170, 174, 178, 180n判斷體重與身高哪個離散較為嚴重。判斷體重與身高哪個離散較為嚴重。注:注: 兩組計量單位不同,不能用極差、平均差、標準兩組計量單位不同,不能用極差、平均差、標準差等絕對離散特征數(shù)直接進行比較。適合采用離散差等絕對離散特征數(shù)直接進行比較。適合采用離散系數(shù)比較。系數(shù)比較。# n離散系數(shù)是極差、四分位差、平均差或標

54、準差等變離散系數(shù)是極差、四分位差、平均差或標準差等變異指標與算術(shù)平均數(shù)的比率,以相對數(shù)形式表示變異指標與算術(shù)平均數(shù)的比率,以相對數(shù)形式表示變異程度。異程度。將極差與算術(shù)平均數(shù)對比得到極差系數(shù),將極差與算術(shù)平均數(shù)對比得到極差系數(shù),將平均差與算術(shù)平均數(shù)對比得到平均差系數(shù)。將平均差與算術(shù)平均數(shù)對比得到平均差系數(shù)。最常用的離散系數(shù)是以標準差計算的,稱為標準差系數(shù):最常用的離散系數(shù)是以標準差計算的,稱為標準差系數(shù):n離散系數(shù)大,說明數(shù)據(jù)的離散程度大,其平均數(shù)的離散系數(shù)大,說明數(shù)據(jù)的離散程度大,其平均數(shù)的代表性就差;反之亦反。代表性就差;反之亦反。xV# 五、異眾比率五、異眾比率 n異眾比率是指非眾數(shù)值的

55、次數(shù)之和在總次數(shù)中所占異眾比率是指非眾數(shù)值的次數(shù)之和在總次數(shù)中所占比重,其公式為:比重,其公式為:n主要用于衡量一組數(shù)據(jù)以眾數(shù)為分布中心的集中程主要用于衡量一組數(shù)據(jù)以眾數(shù)為分布中心的集中程度,即度,即衡量衡量眾數(shù)眾數(shù)對一組數(shù)據(jù)對一組數(shù)據(jù)一般水平一般水平的的代表性代表性。其值越小,數(shù)據(jù)集中程度越高,眾數(shù)代表性越大;反之,其值越小,數(shù)據(jù)集中程度越高,眾數(shù)代表性越大;反之,亦反。亦反。其既可用于其既可用于定量變量定量變量,也,也可用于可用于定性變量定性變量。iimiimiimfffffVOOO1# 第三節(jié)第三節(jié) 變量分布的偏度與峰度變量分布的偏度與峰度n一、矩(動差)一、矩(動差)n二、偏度二、偏度n三、峰度三、峰度 要全面了解數(shù)據(jù)的分布特點,還要知道數(shù)要全面了解數(shù)據(jù)的分布特點,還要知道數(shù)據(jù)偏斜狀況以及尖峭程度,分別由偏度和峰度據(jù)偏斜狀況以及尖峭程度,分別由偏度和峰度來反映。來反映。 與均值和方差一樣,均為矩的特例。與均值和方差一樣,均為矩的特例。# 一、矩(動差一、矩(動差 )n矩(動差矩(動差 ) 一系列刻畫數(shù)據(jù)分布特征的指標的一系列刻畫數(shù)據(jù)分布特征的指標的統(tǒng)稱(該概念引自物理學)。統(tǒng)稱(該概念引自物理學)。n變量值與數(shù)值變量值與數(shù)值 a 之離差的之離差的 k 次方的平均數(shù),稱為變次方的平均數(shù),稱為變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論