




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章 統(tǒng)計數(shù)據(jù)的描述,統(tǒng)計數(shù)據(jù)的描述有三個方面:集中趨勢、離散程度、分布形態(tài),第四章 統(tǒng)計數(shù)據(jù)的描述,第一節(jié) 集中趨勢的測度 第二節(jié) 離散程度的測度 第三節(jié) 偏態(tài)與峰度的測度,學(xué)習(xí)目標(biāo),1.集中趨勢各測度值的計算方法 2.集中趨勢不同測度值的特點(diǎn)和應(yīng)用場合 3.離散程度各測度值的計算方法 4.離散程度不同測度值的特點(diǎn)和應(yīng)用場合 5.偏態(tài)與峰度測度方法 6.用Excel、SPSS描述統(tǒng)計量并進(jìn)行分析,數(shù)據(jù)分布的特征,集中趨勢 (位置),離中趨勢 (分散程度),數(shù)據(jù)分布的特征和測度,方差,集中趨勢(Central tendency),一組數(shù)據(jù)向其中心值靠攏的傾向和程度 測度集中趨勢就是尋找數(shù)據(jù)一
2、般水平的代表值或中心值 不同類型的數(shù)據(jù)用不同的集中趨勢測度值 低層次數(shù)據(jù)的集中趨勢測度值適用于高層次的測量數(shù)據(jù),反過來,高層次數(shù)據(jù)的集中趨勢測度值并不適用于低層次的測量數(shù)據(jù) 選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定,均值,1.集中趨勢的測度值之一 2.最常用的測度值 3.一組數(shù)據(jù)的均衡點(diǎn)所在 4.易受極端值的影響 5. 用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù),一、算術(shù)平均數(shù),計算公式:變量值之和/變量值個數(shù) 計算方法 簡單算術(shù)平均數(shù): 加權(quán)算術(shù)平均數(shù): (請計算P63表4-1到4-8) 如果fi 都相等,那么加權(quán)平均和簡單平均相同,例題:,加權(quán)算術(shù)平均數(shù)公式轉(zhuǎn)化
3、: 先計算權(quán)重 計算P65表3與表4,算術(shù)平均數(shù)的幾何性質(zhì),如果 ,那么 如果 ,那么,交替標(biāo)志平均數(shù),1表示具有某種屬性的單位標(biāo)志值 0表示不具有某種屬性的單位標(biāo)志值 有某種屬性的單位數(shù)所占比重P=N1/N 不具有某種屬性的單位數(shù)所占比重P=N2/N 計算公式: 計算表5,P67,幾何平均數(shù),1. 集中趨勢的測度值之一 2. N 個變量值乘積的 N 次方根 3. 適用于特殊的數(shù)據(jù):變量值本身是比率的形式,且比率的連乘積等于末期除以基期 4. 主要用于計算平均發(fā)展速度,幾何平均數(shù),簡單幾何平均數(shù): 加權(quán)幾何平均數(shù): 兩邊取對數(shù): 請計算P68,表6,二、分類數(shù)據(jù):眾數(shù),眾數(shù)(概念要點(diǎn)),1.
4、集中趨勢的測度值之一 2. 出現(xiàn)次數(shù)最多的變量值 3. 不受極端值的影響 4. 可能沒有眾數(shù)或有幾個眾數(shù) 5. 主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),眾數(shù)(眾數(shù)的不唯一性),無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8,一個眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5,多于一個眾數(shù)原始數(shù)據(jù): 25 28 28 36 42 42,(一)分類數(shù)據(jù)的眾數(shù)(算例),【例】根據(jù)下表數(shù)據(jù),計算眾數(shù),解:這里的變量為“廣告類型”,這是個分類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即 Mo
5、商品廣告,(二)順序數(shù)據(jù)的眾數(shù) (算例),【例】根據(jù)下表的數(shù)據(jù),計算眾數(shù),解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意,(三)數(shù)值型分組數(shù)據(jù)的眾數(shù)(要點(diǎn)及計算公式),1. 眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān),4. 該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布,2. 相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù),3. 相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算,數(shù)值型分組數(shù)據(jù)的眾數(shù)(算例),【例4.1】根據(jù)下表數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù),8,14,-,三、順序數(shù)據(jù):中位數(shù)和分位數(shù),(一)中位
6、數(shù)(概念要點(diǎn)),1.集中趨勢的測度值之一 2.排序后處于中間位置上的值,不受極端值的影響 主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),中位數(shù)(位置的確定),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,1.未分組數(shù)據(jù)的中位數(shù)(計算公式),2.順序數(shù)據(jù)的中位數(shù)(算例),【例4.2】根據(jù)下表中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的中位數(shù),解:中位數(shù)的位置為: (300+1)/2150.5 從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此 Me一般,3.數(shù)值型未分組數(shù)據(jù)的中位數(shù) (5個數(shù)據(jù)的算例),原始數(shù)據(jù): 24 22 21 26 20 排 序: 20 21 22 24 26 位 置: 1 2 3
7、 4 5,中位數(shù) 22,a數(shù)值型未分組數(shù)據(jù)的中位數(shù) (6個數(shù)據(jù)的算例),原始數(shù)據(jù): 10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6,1.根據(jù)位置公式確定中位數(shù)所在的組 2.采用下列近似公式計算:,3.該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布,b數(shù)值型分組數(shù)據(jù)的中位數(shù)(要點(diǎn)及計算公式),N,數(shù)值型分組數(shù)據(jù)的中位數(shù)(算例),【例4.3】根據(jù)第三章表3-5中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的中位數(shù),14,50,(二)四分位數(shù)(概念要點(diǎn)),1.集中趨勢的測度值之一 2.排序后處于25%和75%位置上的值,3. 不受極端值的影響 4. 主要用于順序
8、數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),四分位數(shù)(位置的確定),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,1.順序數(shù)據(jù)的四分位數(shù)(算例),【例4.4】根據(jù)下表數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位數(shù),解:下四分位數(shù)(QL)的位置為: QL位置(300+1)/475.25 上四分位數(shù)(QL)的位置為: QU位置(3(300+1))/4225.75 從累計頻數(shù)看, QL在“不滿意”這一組別中; QU在“一般”這一組別中。因此 QL 不滿意 QU 滿意,2.數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (7個數(shù)據(jù)的算例),原始數(shù)據(jù): 23 21 30 32 28 25 26 排 序: 21 23 25 26 28
9、30 32 位 置: 1 2 3 4 5 6 7,N+1,QL= 23,QU = 30,數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (6個數(shù)據(jù)的算例),原始數(shù)據(jù): 23 21 30 28 25 26 排 序: 21 23 25 26 28 30 位 置: 1 2 34 5 6,QL= 21+0.75(23-21) = 22. 5,QU = 28+0.25(30-28) = 28.5,3.數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計算公式),數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計算示例),QL位置50/412.5,【例4.6】根據(jù)第三章表3-5中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的四分位數(shù),四、眾數(shù)、中位數(shù)和均值的比較,眾數(shù)、中位數(shù)和
10、均值的關(guān)系,數(shù)據(jù)類型與集中趨勢測度值,例題:,某百貨公司6月份各天的銷售數(shù)據(jù)如下(單位:萬元) 257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 (1)計算該百貨公司銷售額的均值、中位數(shù)和四分位數(shù); (2)計算日銷售額的標(biāo)準(zhǔn)差。,例:甲、乙兩個企業(yè)生產(chǎn)三種產(chǎn)品的單位和總成本資料如下:,產(chǎn)品名稱 單位成本 總成本 (元) 甲企業(yè) 乙企業(yè) A 15 2100 3255 B 20 3000 1500 C 30 1
11、500 1500 比較哪個企業(yè)的總平均成本高并分析其原因。,第二節(jié) 離散程度的測度,一. 分類數(shù)據(jù):異眾比率 二. 順序數(shù)據(jù):四分位差 三. 數(shù)值型數(shù)據(jù):方差及標(biāo)準(zhǔn)差 四. 相對離散程度:離散系數(shù),離中趨勢,數(shù)據(jù)分布的另一個重要特征 離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述 反映各變量值遠(yuǎn)離其中心值的程度,因此也稱為離中趨勢 從另一個側(cè)面說明了集中趨勢測度值的代表程度 不同類型的數(shù)據(jù)有不同的離散程度測度值,數(shù)據(jù)的特征和測度(本節(jié)位置),二、順序數(shù)據(jù):四分位差,四分位差(概念要點(diǎn)),1.離散程度的測度值之一 2.也稱為內(nèi)距或四分間距 3.上四分位數(shù)與下四分位數(shù)之差 QD = QU - QL
12、4.反映了中間50%數(shù)據(jù)的離散程度 5. 不受極端值的影響 6. 用于衡量中位數(shù)的代表性,四分位差(定序數(shù)據(jù)的算例),【例】根據(jù)下表數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位差,解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2, QU = 滿意 = 4 四分位差: QD = QU = QL = 4 2 = 2,三、數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差,(一)極差(概念要點(diǎn)及計算公式),1. 一組數(shù)據(jù)的最大值與最小值之差 2. 離散程度的最簡單測度值 3. 易受極端值影響 4. 未考慮數(shù)據(jù)的分布,未分組數(shù)據(jù) R = max(Xi) - min(X
13、i),5. 計算公式為,(二)平均差(概念要點(diǎn)及計算公式),1. 離散程度的測度值之一 2. 各變量值與其均值離差絕對值的平均數(shù) 3. 能全面反映一組數(shù)據(jù)的離散程度 4. 數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少,5. 計算公式為,未分組數(shù)據(jù),組距分組數(shù)據(jù),平均差(計算過程及結(jié)果),【例】根據(jù)下表數(shù)據(jù),計算工人日加工零件數(shù)的平均差,(三)方差和標(biāo)準(zhǔn)差(概念要點(diǎn)),1. 離散程度的測度值之一 2. 最常用的測度值 3. 反映了各變量值與均值的平均差異 4. 根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差,1.總體方差和標(biāo)準(zhǔn)差(計算公式),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,未分
14、組數(shù)據(jù):,組距分組數(shù)據(jù):,方差的計算公式,標(biāo)準(zhǔn)差的計算公式,總體標(biāo)準(zhǔn)差(計算過程及結(jié)果),【例4.14】根據(jù)下表數(shù)據(jù),計算工人日加工零件數(shù)的標(biāo)準(zhǔn)差,2.樣本方差和標(biāo)準(zhǔn)差(計算公式),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,未分組數(shù)據(jù):,組距分組數(shù)據(jù):,方差的計算公式,標(biāo)準(zhǔn)差的計算公式,樣本方差3.自由度(degree of freedom),1. 一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù) 2. 當(dāng)樣本數(shù)據(jù)的個數(shù)為 n 時,若樣本均值x 確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值 3. 例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,
15、x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值 4. 樣本方差用自由度去除,其原因可從多方面來解釋,從實(shí)際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差去估計總體方差2時,它是2的無偏估計量,樣本方差(算例),原始數(shù)據(jù): 10 5 9 13 6 8,樣本標(biāo)準(zhǔn)差(算例),樣本標(biāo)準(zhǔn)差,原始數(shù)據(jù): 10 5 9 13 6 8,方差(簡化計算公式),樣本方差,總體方差,4.方差的數(shù)學(xué)性質(zhì),各變量值對均值的方差小于對任意值的方差 設(shè)X0為不等于X 的任意數(shù),D2為對X0的方差,則,5.標(biāo)準(zhǔn)化值(standard score),1. 也稱標(biāo)準(zhǔn)分?jǐn)?shù)
16、,通常用于對變量的標(biāo)準(zhǔn)化處理 2. 給出某一個值在一組數(shù)據(jù)中的相對位置 3. 可用于判斷一組數(shù)據(jù)是否有離群點(diǎn):四分位差1.5倍的為離群點(diǎn),3倍為極端值 4. 計算公式為:,練習(xí):,一家公司在招收職員時,首先通過兩項(xiàng)能力測試。在A項(xiàng)測試中,其平均分?jǐn)?shù)是100分,標(biāo)準(zhǔn)差是15分;在B項(xiàng)測試中,其平均分?jǐn)?shù)是400分,標(biāo)準(zhǔn)差是50分。一位應(yīng)試者在A項(xiàng)測試中得了115分,在B項(xiàng)測試中得了425分。與平均分?jǐn)?shù)相比,該應(yīng)試者哪一項(xiàng)測試更為理想。,習(xí)題:,現(xiàn)場收集數(shù)據(jù)(不是網(wǎng)絡(luò),而是現(xiàn)場),要求如下: 1.收集分類數(shù)據(jù),計算異眾比率 2.收集順序數(shù)據(jù),計算異眾比率和四分位差 3.收集數(shù)值型數(shù)據(jù),計算極差、平均
17、差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)化值 4.指標(biāo)計算結(jié)果不是目的,要好好體會一下指標(biāo)所代表的含義,如果,代表性不好,你有沒有什么更好的建議? 5.計算離散指標(biāo)的同時,衡量一下相對應(yīng)的集中趨勢指標(biāo)的代表性? 6.計算完離散指標(biāo),與同桌的離散指標(biāo)比較一下,看誰的離散程度大?前提,要保證你們的離散指標(biāo)是可比較的!,四、相對離散程度:離散系數(shù),離散系數(shù)(coefficient of variation),1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比 2. 消除了數(shù)據(jù)水平高低和計量單位的影響 3. 測度了數(shù)據(jù)的相對離散程度 4. 用于對不同組別數(shù)據(jù)離散程度的比較 5. 計算 公式為:,離散系數(shù)(實(shí)例和計算過程),【例4.16】某管理局
18、抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表4.7。試比較產(chǎn)品銷售額與銷售利潤的離散程度,結(jié)論: 計算結(jié)果表明,V1V2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度,練習(xí):,如果投資項(xiàng)目A的預(yù)期回報率為7%,標(biāo)準(zhǔn)差為5%;而投資項(xiàng)目B的預(yù)期回報率為12%,標(biāo)準(zhǔn)差為7%,哪個投資項(xiàng)目風(fēng)險大?,交替指標(biāo)的標(biāo)準(zhǔn)差,數(shù)據(jù)類型與離散程度測度值,第三節(jié) 偏態(tài)與峰度的測度,一. 偏態(tài)及其測度 二. 峰度及其測度,數(shù)據(jù)的特征和測度(本節(jié)位置),一、偏 態(tài),偏態(tài)與峰度分布的形狀,偏態(tài),峰度,左偏分布,偏態(tài)(概念要點(diǎn)),1. 數(shù)據(jù)分布的不對稱性 2. 偏態(tài)系數(shù)=0為對稱分布 3. 偏態(tài)系數(shù) 0為右偏分布 4. 偏
19、態(tài)系數(shù) 0為左偏分布 5. 計算公式為,偏態(tài)(實(shí)例),【例4.17】已知1997年我國農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如表4.9。試計算偏態(tài)系數(shù),2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94,500以下 5001000 10001500 15002000 20002500 25003000 30003500 35004000 40004500 45005000 5000以上,戶數(shù)比重(%),按純收入分組(元),表4-10 1997年農(nóng)村居民家庭純收入數(shù)據(jù),農(nóng)村居民家庭村收入數(shù)據(jù)的直方圖,偏態(tài)與峰度(從直方圖上觀察),按純收入分組(元),結(jié)論:1. 為右偏分布 2. 峰度適中,偏態(tài)系數(shù)(計算過程),偏態(tài)系數(shù)(計算結(jié)果),根據(jù)上表數(shù)據(jù)計算得,將計算結(jié)果代入公式得,結(jié)論:偏態(tài)系數(shù)為正值,而且數(shù)值較大,說明農(nóng)村居民家庭純收入的分布為右偏分布,即收入較少的家庭占據(jù)多數(shù),而收入較高的家庭則占少數(shù),而且偏斜的程度較大,二、峰 度,峰度(kurtosis),1.數(shù)據(jù)分布扁平程度的測度 2.峰度系數(shù)=3為扁平程度適中 3.峰度系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車間職工管理方案模板
- 菜園農(nóng)場改造方案
- 鄭州幼教面試題及答案
- 南充日報面試題及答案
- 墓地整治工程方案
- 先鋒團(tuán)員面試題及答案
- 合作開發(fā)項(xiàng)目收益分配與知識產(chǎn)權(quán)保護(hù)協(xié)議
- 銷售公司檢查活動方案
- 西語財務(wù)面試題及答案
- 摩托機(jī)車考試題及答案
- 2025中國系統(tǒng)性紅斑狼瘡診療指南解讀課件
- 成人重癥患者顱內(nèi)壓增高防控護(hù)理專家共識
- 2025年網(wǎng)絡(luò)安全與信息保護(hù)基礎(chǔ)知識考試題及答案
- 2025至2030中國家用血壓計行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 吉林省長春市2023?2024學(xué)年高二下冊期末考試數(shù)學(xué)科試卷附解析
- 主管護(hù)師《相關(guān)專業(yè)知識》考試真題及答案(2025年)
- 綠化所倉庫管理制度
- 聘請美容學(xué)徒合同協(xié)議
- 2025年全國保密教育線上培訓(xùn)考試試題庫(含答案)含答案詳解
- 2025年江蘇省南京市鼓樓區(qū)中考一模英語試卷(含答案)
- 2023污泥協(xié)同處理廚余垃圾干式厭氧消化設(shè)備技術(shù)條件
評論
0/150
提交評論