應(yīng)用統(tǒng)計(jì)課件_第1頁(yè)
應(yīng)用統(tǒng)計(jì)課件_第2頁(yè)
應(yīng)用統(tǒng)計(jì)課件_第3頁(yè)
應(yīng)用統(tǒng)計(jì)課件_第4頁(yè)
應(yīng)用統(tǒng)計(jì)課件_第5頁(yè)
已閱讀5頁(yè),還剩86頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 4 講 數(shù)據(jù)的概括性度量4.1 集中趨勢(shì)的度量 4.2 離散程度的度量4.3 偏態(tài)與峰態(tài)的度量第 4 講 數(shù)據(jù)的概括性度量4.1 集中趨勢(shì)的度量 學(xué)習(xí)目標(biāo)1.集中趨勢(shì)各測(cè)度值的計(jì)算方法2.集中趨勢(shì)各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合3.離散程度各測(cè)度值的計(jì)算方法4.離散程度各測(cè)度值的特點(diǎn)及應(yīng)用場(chǎng)合偏態(tài)與峰態(tài)的測(cè)度方法學(xué)習(xí)目標(biāo)1.集中趨勢(shì)各測(cè)度值的計(jì)算方法數(shù)據(jù)分布的特征集中趨勢(shì) (位置)偏態(tài)和峰態(tài)(形狀)離中趨勢(shì) (分散程度)數(shù)據(jù)分布的特征集中趨勢(shì) 偏態(tài)和峰態(tài)離中趨勢(shì)數(shù)據(jù)分布特征的測(cè)度數(shù)據(jù)特征的測(cè)度眾 數(shù)中位數(shù)平均數(shù)離散系數(shù)方差和標(biāo)準(zhǔn)差峰 態(tài)四分位差異眾比率偏 態(tài)分布的形狀集中趨勢(shì)離散程度數(shù)據(jù)分布特征的

2、測(cè)度數(shù)據(jù)特征的測(cè)度眾 數(shù)中位數(shù)平均數(shù)離散系4.1 集中趨勢(shì)的度量4.1.1 分類數(shù)據(jù):眾數(shù)4.1.2 順序數(shù)據(jù):中位數(shù)和分位數(shù)4.1.3 數(shù)值型數(shù)據(jù):平均數(shù)4.1.4 眾數(shù)、中位數(shù)和平均數(shù)的比較4.1 集中趨勢(shì)的度量4.1.1 分類數(shù)據(jù):眾數(shù)集中趨勢(shì)(central tendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)集中趨勢(shì)(central tendency)一組數(shù)據(jù)向其中分類數(shù)據(jù):眾數(shù)分類數(shù)據(jù):眾數(shù)眾數(shù)(mode)一組數(shù)據(jù)中

3、出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值眾數(shù)(不唯一性)無(wú)眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8一個(gè)眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5多于一個(gè)眾數(shù)原始數(shù)據(jù): 25 28 28 36 42 42眾數(shù)(不唯一性)無(wú)眾數(shù)原始數(shù)據(jù): 10 分類數(shù)據(jù)的眾數(shù) (例題分析)不同品牌飲料的頻數(shù)分布 飲料品牌頻數(shù)比例百分比(%) 可口可樂(lè) 旭日升冰茶 百事可樂(lè) 匯源果汁 露露1511 9 6 90.300.220.180.120.183022181218合計(jì)501

4、100解:這里的變量為“飲料品牌”,這是個(gè)分類變量,不同類型的飲料就是變量值 所調(diào)查的50人中,購(gòu)買可口可樂(lè)的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30%,因此眾數(shù)為“可口可樂(lè)”這一品牌,即 Mo可口可樂(lè)分類數(shù)據(jù)的眾數(shù) (例題分析)不同品牌飲料的頻數(shù)分布 飲料品順序數(shù)據(jù)的眾數(shù) (例題分析)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別” 甲城市中對(duì)住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù) (戶)百分比 (%) 非常不滿意 不滿意 一般 滿意 非常滿意 24108 93 45 30 836311510合計(jì)30

5、0100.0順序數(shù)據(jù)的眾數(shù) (例題分析)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量數(shù)值型分組數(shù)據(jù)的眾數(shù)(要點(diǎn)及計(jì)算公式)1. 眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)4. 該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2. 相鄰兩組的頻數(shù)相等時(shí),眾數(shù)組的組中值即為眾數(shù)Mo3. 相鄰兩組的頻數(shù)不相等時(shí),眾數(shù)采用下列近似公式計(jì)算MoMo數(shù)值型分組數(shù)據(jù)的眾數(shù)(要點(diǎn)及計(jì)算公式)1. 眾數(shù)的值與相數(shù)值型分組數(shù)據(jù)的眾數(shù)(算例) 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計(jì)50數(shù)值型分

6、組數(shù)據(jù)的眾數(shù)(算例) 某車間50名工人日加工零件順序數(shù)據(jù):中位數(shù)和分位數(shù)順序數(shù)據(jù):中位數(shù)和分位數(shù)中位數(shù)(median)一組數(shù)據(jù)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對(duì)值之和最小,即中位數(shù)(median)一組數(shù)據(jù)排序后處于中間位置上的值Me中位數(shù)(位置的確定)原始數(shù)據(jù):組矩分組數(shù)據(jù):中位數(shù)(位置的確定)原始數(shù)據(jù):組矩分組數(shù)據(jù):未分組數(shù)據(jù)的中位數(shù)(計(jì)算公式)設(shè)一組數(shù)據(jù)為 x1,x2,xn,按從小到大順序排列為: x(1)x(2)x(n)未分組數(shù)據(jù)的中位數(shù)(計(jì)算公式)設(shè)一組數(shù)據(jù)為 x1,x2,順序數(shù)據(jù)的中

7、位數(shù) (例題分析)解:中位數(shù)的位置為 (300+1)/2150.5 從累計(jì)頻數(shù)看,中位數(shù)在“一般”這一組別中 中位數(shù)為 Me=一般甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計(jì)頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意 24108 93 45 30 24132225270300合計(jì)300順序數(shù)據(jù)的中位數(shù) (例題分析)解:中位數(shù)的位置為 數(shù)值型未分組數(shù)據(jù)的中位數(shù) (9個(gè)數(shù)據(jù)的算例)【例】 9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500

8、1630 2000位 置: 1 2 3 4 5 6 7 8 9中位數(shù) 1080數(shù)值型未分組數(shù)據(jù)的中位數(shù) (9個(gè)數(shù)據(jù)的算例)【例】 數(shù)值型未分組數(shù)據(jù)的中位數(shù) (10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排 序: 660 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10 數(shù)值型未分組數(shù)據(jù)的中位數(shù) (10個(gè)數(shù)據(jù)的算例)【例】:10根據(jù)位置公式確定中位數(shù)所在的組采用下列近似公式計(jì)算:4. 該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布數(shù)值型分組數(shù)據(jù)的中位數(shù)(要點(diǎn)及計(jì)算公式)根據(jù)位置公式確定中位數(shù)所在的組4. 該公式假

9、定中位數(shù)組的頻數(shù)值型分組數(shù)據(jù)的中位數(shù)(算例) 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計(jì)50【例】根據(jù)表中的數(shù)據(jù),計(jì)算50 名工人日加工零件數(shù)的中位數(shù)數(shù)值型分組數(shù)據(jù)的中位數(shù)(算例) 某車間50名工人日加工零件四分位數(shù)(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)(quartile)排序后處于25%和75%位置上四分位數(shù)(位

10、置的確定)原始數(shù)據(jù):組矩分組數(shù)據(jù):四分位數(shù)(位置的確定)原始數(shù)據(jù):組矩分組數(shù)據(jù):順序數(shù)據(jù)的四分位數(shù) (例題分析)解: QL位置=300/4 =75 QU位置 =(3300)/4 =225 從累計(jì)頻數(shù)看, QL在“不滿意”這一類別中; QU在“一般”這一類別中 四分位數(shù)為: QL = 不滿意 QU = 一般甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計(jì)頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意 24108 93 45 30 24132225270300合計(jì)300順序數(shù)據(jù)的四分位數(shù) (例題分析)解:甲城市家庭對(duì)住房狀況評(píng)數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (9個(gè)數(shù)據(jù)的算例)【例】:9

11、個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排 序: 660 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10 數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (10個(gè)數(shù)據(jù)的算例)【例】:1數(shù)值

12、型分組數(shù)據(jù)的四分位數(shù)(計(jì)算公式)上四分位數(shù): 下四分位數(shù): 數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計(jì)算公式)上四分位數(shù): 下四分位數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計(jì)算示例)QL位置50/412.5QU位置(350)/437.5 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計(jì)50【例】根據(jù)表中的數(shù)據(jù),計(jì)算50 名工人日加工零件數(shù)的四分位數(shù)數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計(jì)算示例)QL位置50/41數(shù)值型數(shù)據(jù):平均數(shù)數(shù)值型數(shù)據(jù):平均數(shù)平均數(shù)(mean)集中趨勢(shì)的最常用測(cè)度值一

13、組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)平均數(shù)(mean)集中趨勢(shì)的最常用測(cè)度值簡(jiǎn)單平均數(shù)與加權(quán)平均數(shù)(simple mean / weighted mean)原始數(shù)據(jù):設(shè)一組數(shù)據(jù)為: x1 ,x2 , ,xn簡(jiǎn)單平均數(shù)加權(quán)平均數(shù)分組數(shù)據(jù):各組的組中值為:M1 ,M2 , ,Mk 相應(yīng)的頻數(shù)為: f1 , f2 , ,fk簡(jiǎn)單平均數(shù)與加權(quán)平均數(shù)(simple mean / wei已改至此!某電腦公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(Mi)頻數(shù)(fi)Mi fi 1401501501601601701701801801901902002

14、00210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合計(jì)12022200加權(quán)平均數(shù) (例題分析)已改至此!某電腦公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(M加權(quán)平均數(shù)(權(quán)數(shù)對(duì)均值的影響) 甲乙兩組各有10名學(xué)生,他們的考試成績(jī)及其分布數(shù)據(jù)如下 甲組: 考試成績(jī)(x ): 0 20 100 人數(shù)分布(f ):1 1 8 乙組: 考試成績(jī)(x): 0 20 100 人數(shù)分布(f ):8 1 1加權(quán)平均數(shù)(權(quán)數(shù)對(duì)均值的影響) 甲乙

15、兩組各有10名學(xué)生平均數(shù)(數(shù)學(xué)性質(zhì))1.各變量值與平均數(shù)的離差之和等于零 2. 各變量值與平均數(shù)的離差平方和最小平均數(shù)(數(shù)學(xué)性質(zhì))1.各變量值與平均數(shù)的離差之和等于零 調(diào)和平均數(shù)(harmonic mean)平均數(shù)的另一種表現(xiàn)形式易受極端值的影響計(jì)算公式為原來(lái)只是計(jì)算時(shí)使用了不同的數(shù)據(jù)!調(diào)和平均數(shù)(harmonic mean)平均數(shù)的另一種表現(xiàn)調(diào)和平均數(shù) (例題分析)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價(jià)格(元) Mi成交額(元) Mi fi成交量(公斤)fi甲乙丙1.200.500.801800012500 64001500025000 8000合計(jì)3690048000【例】某蔬菜批發(fā)市場(chǎng)

16、三種蔬菜的日成交數(shù)據(jù)如表,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格調(diào)和平均數(shù) (例題分析)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜批發(fā)幾何平均數(shù)(geometric mean) n 個(gè)變量值乘積的 n 次方根適用于對(duì)比率數(shù)據(jù)的平均主要用于計(jì)算平均增長(zhǎng)率計(jì)算公式為5. 可看作是平均數(shù)的一種變形幾何平均數(shù)(geometric mean) n 個(gè)變量值乘幾何平均數(shù) (例題分析) 【例】某水泥生產(chǎn)企業(yè)1999年的水泥產(chǎn)量為100萬(wàn)噸,2000年與1999年相比增長(zhǎng)率為9%,2001年與2000年相比增長(zhǎng)率為16%,2002年與2001年相比增長(zhǎng)率為20%。求各年的年平均增長(zhǎng)率。年平均增長(zhǎng)率114.91%-1=14.91%

17、幾何平均數(shù) (例題分析) 【例】某水泥生產(chǎn)企業(yè)199幾何平均數(shù) (例題分析) 【例】一位投資者購(gòu)持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率 算術(shù)平均: 幾何平均:幾何平均數(shù) (例題分析) 【例】一位投資者購(gòu)持有一種眾數(shù)、中位數(shù)和平均數(shù)的比較眾數(shù)、中位數(shù)和平均數(shù)的比較眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系左偏分布均值 中位數(shù) 眾數(shù)對(duì)稱分布 均值= 中位數(shù)= 眾數(shù)右偏分布眾數(shù) 中位數(shù)均值眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系左偏分布均值 中位數(shù) 眾數(shù)對(duì)稱眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用眾數(shù)不受極端值影響具有不唯一性數(shù)據(jù)分

18、布偏斜程度較大時(shí)應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用眾數(shù)數(shù)據(jù)類型與集中趨勢(shì)測(cè)度值數(shù)據(jù)類型和所適用的集中趨勢(shì)測(cè)度值數(shù)據(jù)類型分類數(shù)據(jù) 順序數(shù)據(jù)數(shù)值型數(shù)據(jù)適用的測(cè)度值眾數(shù)中位數(shù)平均數(shù)四分位數(shù)調(diào)和平均數(shù)眾數(shù)幾何平均數(shù) 中位數(shù)四分位數(shù)眾數(shù)數(shù)據(jù)類型與集中趨勢(shì)測(cè)度值數(shù)據(jù)類型和所適用的集中趨勢(shì)測(cè)度值數(shù)據(jù)4.2 離散程度的度量4.2.1 分類數(shù)據(jù):異眾比率4.2.2 順序數(shù)據(jù):四分位差4.2.3 數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差4.2.4 相對(duì)位置的度量:標(biāo)準(zhǔn)分?jǐn)?shù)4.2.5 相對(duì)離散程度:離散系數(shù)4.2 離散程

19、度的度量4.2.1 分類數(shù)據(jù):異眾比率離中趨勢(shì)數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值離中趨勢(shì)數(shù)據(jù)分布的另一個(gè)重要特征分類數(shù)據(jù):異眾比率分類數(shù)據(jù):異眾比率異眾比率(variation ratio)1.對(duì)分類數(shù)據(jù)離散程度的測(cè)度2.非眾數(shù)組的頻數(shù)占總頻數(shù)的比例3.計(jì)算公式為 4. 用于衡量眾數(shù)的代表性異眾比率(variation ratio)1.對(duì)分類數(shù)據(jù)異眾比率 (例題分析)解: 在所調(diào)查的50人當(dāng)中,購(gòu)買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂(lè)”代表消費(fèi)者購(gòu)買飲料品牌的

20、狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布 飲料品牌頻數(shù)比例百分比(%) 可口可樂(lè) 旭日升冰茶 百事可樂(lè) 匯源果汁 露露1511 9 6 90.300.220.180.120.183022181218合計(jì)501100異眾比率 (例題分析)解:不同品牌飲料的頻數(shù)分布 飲料品牌順序數(shù)據(jù):四分位差順序數(shù)據(jù):四分位差四分位差(quartile deviation)對(duì)順序數(shù)據(jù)離散程度的測(cè)度也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差 Qd = QU QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性四分位差(quartile deviation)對(duì)順序數(shù)據(jù)四分位差 (例題分析)

21、解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 。 已知 QL = 不滿意 = 2 QU = 一般 = 3四分位差: Qd = QU - QL = 3 2 = 1甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計(jì)頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意 24108 93 45 30 24132225270300合計(jì)300四分位差 (例題分析)解:設(shè)非常不滿意為1,不滿意為2, 數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差極差(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910 未分

22、組數(shù)據(jù) R = max(xi) - min(xi)計(jì)算公式為.=組距分組數(shù)據(jù) R 最高組上限 - 最低組下限極差(range)一組數(shù)據(jù)的最大值與最小值之差789107平均差(mean deviation)各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差(mean deviation)各變量值與其平均數(shù)離平均差 (例題分析)某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表 按銷售量分組組中值(Mi)頻數(shù)(fi)140150150 160160 170170 180180 190190 200200 210210 220220 23

23、0230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合計(jì)1202040平均差 (例題分析)某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表 按銷平均差 (例題分析) 含義:每一天的銷售量與平均數(shù)相比, 平均相差17臺(tái)平均差 (例題分析)方差和標(biāo)準(zhǔn)差(variance and standard deviation)數(shù)據(jù)離散程度的最常用測(cè)度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差4

24、 6 8 10 12x = 8.3方差和標(biāo)準(zhǔn)差(variance and standard 總體方差和標(biāo)準(zhǔn)差(計(jì)算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式總體方差和標(biāo)準(zhǔn)差(計(jì)算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分樣本方差和標(biāo)準(zhǔn)差 (sample variance and standard deviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!樣本方差和標(biāo)準(zhǔn)差 (sample variance and樣本方差自由度(degree of freedom)一組數(shù)據(jù)中可以自

25、由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n 時(shí),若樣本均值x 確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差2時(shí),它是2的無(wú)偏估計(jì)量樣本方差自由度(degree of freedom)一組數(shù)樣本標(biāo)準(zhǔn)差 (例題分析)某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表 按銷售量分組組中

26、值(Mi)頻數(shù)(fi)140150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合計(jì)12055400樣本標(biāo)準(zhǔn)差 (例題分析)某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表 樣本標(biāo)準(zhǔn)差 (例題分析) 含義:每一天的銷售量與平均數(shù)相比, 平均相差21.58臺(tái)樣本標(biāo)準(zhǔn)差 (例題分析)相對(duì)位置的測(cè)量:標(biāo)準(zhǔn)分?jǐn)?shù)相對(duì)位置的測(cè)量:標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)(

27、standard score)1. 也稱標(biāo)準(zhǔn)化值2.對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量3.可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)4.用于對(duì)變量的標(biāo)準(zhǔn)化處理5. 計(jì)算公式為標(biāo)準(zhǔn)分?jǐn)?shù)(standard score)1. 也稱標(biāo)準(zhǔn)化標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì))均值等于02.方差等于1標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì))均值等于0標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì)) z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒(méi)有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。 標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì)) z分?jǐn)?shù)只是標(biāo)準(zhǔn)化值 (例題分析)9個(gè)家庭人均月收入標(biāo)準(zhǔn)化值計(jì)算表 家庭編號(hào)人均月收入(元) 標(biāo)準(zhǔn)化值 z 1234567891500 750 7801080 8

28、50 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.996標(biāo)準(zhǔn)化值 (例題分析)9個(gè)家庭人均月收入標(biāo)準(zhǔn)化值計(jì)算表 家經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)切比雪夫不等式(Chebyshevs inequality )如果一組數(shù)據(jù)不是對(duì)稱分布,經(jīng)驗(yàn)法則就不再適用,這時(shí)可使用切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用切比雪

29、夫不等式提供的是“下界”,也就是“所占比例至少為多少”對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有1-1/k2的數(shù)據(jù)落在k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)切比雪夫不等式(Chebyshevs inequalit切比雪夫不等式(Chebyshevs inequality )對(duì)于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)切比雪夫不等式(Chebyshevs inequalit相對(duì)離散程度:離散系數(shù)相對(duì)離散程度:離散系數(shù)離散系數(shù)(

30、coefficient of variation)1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較5. 計(jì)算公式為離散系數(shù)(coefficient of variation離散系數(shù) (例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號(hào)產(chǎn)品銷售額(萬(wàn)元)x1銷售利潤(rùn)(萬(wàn)元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【 例 】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度離散系數(shù) (例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企離散系數(shù) (例題分析)結(jié)論: 計(jì)算結(jié)果表明,v1v2,說(shuō)明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度 v1=536.25309.19=0.577v2=32.521523.09=0.710離散系數(shù) (例題分析)結(jié)論: 計(jì)算結(jié)果表明,v1 0為右偏分布4.偏態(tài)系數(shù) 0為左偏分布偏態(tài)(skewness)統(tǒng)計(jì)學(xué)家Pearson于1895年偏態(tài)系數(shù) (skewness coefficient)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算偏態(tài)系數(shù) (skewnes

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論