




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第四章數(shù)據(jù)分布特征的描述第1頁,共54頁,2023年,2月20日,星期三第一節(jié)
數(shù)據(jù)分布集中趨勢的測定第2頁,共54頁,2023年,2月20日,星期三一、均值/平均數(shù)/數(shù)值平均數(shù)(mean)(一)概念
是反映數(shù)據(jù)分布集中趨勢十分重要的數(shù)據(jù),代表總體單位某一標(biāo)志值的一般水平(二)特征
1.具有抽象性
2.具有代表性
3.反映總體分布的集中趨勢**舉例
1.某市中學(xué)生每周平均上網(wǎng)時間為2.8小時
2.某農(nóng)貿(mào)市場2月份牛肉的平均價格為16元/千克
3.某地區(qū)“十五”期間經(jīng)濟(jì)平均增長率為9.6%第3頁,共54頁,2023年,2月20日,星期三(三)均值的種類及計算
1.算術(shù)平均數(shù)**
(1)概念
算術(shù)平均數(shù)又稱平均值,是用一組數(shù)據(jù)中所有值之和除以該組數(shù)據(jù)的個數(shù)
(2)基本公式第4頁,共54頁,2023年,2月20日,星期三算術(shù)平均數(shù)的計算**簡單算術(shù)平均數(shù):針對未分組資料
總體平均數(shù)
樣本平均數(shù)第5頁,共54頁,2023年,2月20日,星期三算術(shù)平均數(shù)的計算
**加權(quán)算術(shù)平均數(shù)
概念:是對每個數(shù)據(jù)都根據(jù)其在全組中的重要程度賦予一定權(quán)重后得到的算術(shù)平均數(shù)
計算公式:
未分組數(shù)據(jù)
其中:w表示各組的標(biāo)志總量,而不是各組變量值出現(xiàn)的次數(shù),總體和樣本加權(quán)算術(shù)平均數(shù)的公式是相同
第6頁,共54頁,2023年,2月20日,星期三
[例4-2]根據(jù)某公司四個品牌數(shù)碼相機(jī)的銷售資料計算平均利潤率表4-1四個品牌數(shù)碼相機(jī)的利潤率和銷售額資料第7頁,共54頁,2023年,2月20日,星期三所以,四個品牌數(shù)碼相機(jī)的平均銷售利潤率為
因為:
第8頁,共54頁,2023年,2月20日,星期三**加權(quán)算術(shù)平均數(shù)⑵分組的加權(quán)平均數(shù):根據(jù)分組數(shù)據(jù)計算均值
樣本均值的計算公式:
總體均值的計算公式:表示各組的變量值(或組距式數(shù)列的組中值)表示各組變量值出現(xiàn)的頻數(shù)(即權(quán)數(shù))第9頁,共54頁,2023年,2月20日,星期三
[例4-3]根據(jù)某電腦公司在各市場上銷售量的分組數(shù)據(jù),計算電腦銷售量的均值。
按銷售量分組(臺)市場個數(shù)(fi)組中值(Mi)Mifi
140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240491627201710845145155165175185195205215225235
58013952640472537003315205017209001175合計∑fi=
120
—
∑Mifi
=22200第10頁,共54頁,2023年,2月20日,星期三2.調(diào)和平均數(shù)
1.問題的由來
思考題:三種蔬菜單價分別為2、3和4元/千克,(1)各買一千克平均單價是多少?(2)各買一元的平均單價是多少?
2.概念:
調(diào)和平均數(shù)又稱倒數(shù)平均數(shù),是各個變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)
3.計算
(1)簡單調(diào)和平均數(shù):針對未分組資料計算公式為:算術(shù)平均調(diào)和平均第11頁,共54頁,2023年,2月20日,星期三2.調(diào)和平均數(shù)2.加權(quán)調(diào)和平均數(shù):針對分組資料
計算公式為:
其中:
是一種特殊權(quán)數(shù),它不是各組變量值出現(xiàn)的次數(shù),表示各組標(biāo)志總量即第12頁,共54頁,2023年,2月20日,星期三
[例4-4]根據(jù)某商場職工月工資資料計算月平均工資第13頁,共54頁,2023年,2月20日,星期三
課堂練習(xí)
[資料]甲乙企業(yè)職工的工資如下表:[要求]分別計算甲乙企業(yè)職工月工資額的均值第14頁,共54頁,2023年,2月20日,星期三算術(shù)平均數(shù)和調(diào)和平均數(shù)的關(guān)系****聯(lián)系——實質(zhì)相同
調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形,兩者的基本公式均為:**區(qū)別——適用的情況不同
當(dāng)已知平均指標(biāo)的分母資料、未知分子資料時,采用加權(quán)算術(shù)平均法當(dāng)已知平均指標(biāo)的分子資料、未知分母資料時,采用加權(quán)調(diào)和平均法第15頁,共54頁,2023年,2月20日,星期三3.幾何平均數(shù)(1)概念:幾何平均數(shù)(geometricmean)又稱對稱平均數(shù),它是各變量值乘積的n次方根。(2)計算基本公式:
對數(shù)公式:
在實際工作中,由于變量個數(shù)較多,通常要應(yīng)用對數(shù)來進(jìn)行計算。即
第16頁,共54頁,2023年,2月20日,星期三(3)幾何平均數(shù)的應(yīng)用及特點
**應(yīng)用條件
a.變量值是相對數(shù)據(jù),如比率或發(fā)展速度
b.變量值的連乘積等于總比率或總發(fā)展速度**特點
a.如果數(shù)列中有一個標(biāo)志值等于零或負(fù)值,則無法計算
b.受極端值影響較小,故較穩(wěn)健第17頁,共54頁,2023年,2月20日,星期三
[例4-5]
某電器銷售公司2000~2005年銷售量的環(huán)比增長率分別為:7.6%、2.5%、0.6%、2.7%和2.2%。求這期間銷售量的平均增長速度?表4-4銷售量平均發(fā)展速度計算表幾何平均數(shù)的計算示例第18頁,共54頁,2023年,2月20日,星期三幾何平均數(shù)的計算示例
1.采用基本公式計算的銷售量平均發(fā)展速度為:2.采用對數(shù)公式計算的銷售量平均發(fā)展速度為:所以,銷售量的平均增長速度=103.1%-1=3.1%第19頁,共54頁,2023年,2月20日,星期三二、位置平均數(shù)(一)中位數(shù)(median)
1.概念中位數(shù)是將一組數(shù)據(jù)項按照數(shù)值大小升序或者降序排列后位于中間位置的那個數(shù)據(jù),符號為
2.中位數(shù)的計算方法
(1)未分組數(shù)據(jù)的中位數(shù)
將變量值按升序或降序排列,找中間位置的變量值
(2)單項數(shù)列的中位數(shù)計算各組的累計頻數(shù)(向上累計或向下累計);根據(jù)中位數(shù)位置確定中位數(shù)第20頁,共54頁,2023年,2月20日,星期三
[例4-6]
計算某公司銷售人員月銷售冰箱中位數(shù)
按月銷售冰箱分組
(臺)銷售人員數(shù)(人)向上累計頻數(shù)向下累計頻數(shù)25303234363931014271883132754728080776753268合計80--中位數(shù)的位置
即中位數(shù)在累計頻數(shù)為40的那一組內(nèi)(向上累計或向下累計均可得出),則
第21頁,共54頁,2023年,2月20日,星期三2.中位數(shù)的計算方法(3)組距數(shù)列的中位數(shù):由下列公式近似計算
下限公式其中:為總體單位總數(shù)為中位數(shù)組的下限為中位數(shù)組以下的累計頻數(shù)為中位數(shù)組的頻數(shù)為中位數(shù)組的組距第22頁,共54頁,2023年,2月20日,星期三[例4-7]求以下組距數(shù)列的中位數(shù)
按家庭收入分組(元)家庭數(shù)(戶)向上累計頻率5000以下5000~1000010000~1500015000~2000020000以上214514662166808692合計92-中位數(shù)的近似值為:某地區(qū)家庭收入分組表中位數(shù)的位置在第46(92/2)位,應(yīng)在第二組第23頁,共54頁,2023年,2月20日,星期三中位數(shù)的特點⑴是一種位置平均數(shù),不受極端值及開口組的影響
⑵對于分配不對稱的數(shù)據(jù),中位數(shù)比平均值更適合當(dāng)集中趨勢的代表值⑶
對某些不具有數(shù)字特征或不能用數(shù)字測定的現(xiàn)象,可用中位數(shù)表示其一般水平例如,對眾多的消費者購買數(shù)碼相機(jī)時,分別對價格、外觀、品質(zhì)的注重程度排序后,可以求出消費者在乎的中位數(shù)因素
第24頁,共54頁,2023年,2月20日,星期三二、位置平均數(shù)(二)眾數(shù)(mode)
1.概念
眾數(shù)(mode)是指在一組數(shù)中出現(xiàn)次數(shù)最多的那個數(shù)值,符號為
2.數(shù)據(jù)數(shù)列的眾數(shù)分布情況
無眾數(shù)如數(shù)據(jù)數(shù)列:13791268
一個眾數(shù)如數(shù)據(jù)數(shù)列:659866
多個眾數(shù)如數(shù)據(jù)數(shù)列:223527352736第25頁,共54頁,2023年,2月20日,星期三3.眾數(shù)的計算方法**品質(zhì)變量的眾數(shù)——觀察次數(shù),出現(xiàn)次數(shù)最多的變量值就是眾數(shù)
例如:企業(yè)的所有制結(jié)構(gòu)分布、人口的城鄉(xiāng)分布**數(shù)值變量的眾數(shù)未分組資料——觀察次數(shù),出現(xiàn)次數(shù)最多的數(shù)據(jù)就是眾數(shù)分組資料(1)單項式數(shù)列——直接觀察,次數(shù)最多的組的變量值即為眾數(shù)
第26頁,共54頁,2023年,2月20日,星期三[例4-8]單項式變量數(shù)列確定眾數(shù)實例
某市居民家庭按家庭人口數(shù)分組
由上表可以看出,家庭人口數(shù)為3人的家庭數(shù)最多,因此本例中家庭人口數(shù)的眾數(shù)為3人
第27頁,共54頁,2023年,2月20日,星期三3.眾數(shù)的計算方法
組距數(shù)列計算眾數(shù):由下列公式近似計算
下限公式其中:為眾數(shù)組與前一組頻數(shù)之差為眾數(shù)組的下限為眾數(shù)組與后一組頻數(shù)之差為眾數(shù)組的組距·第28頁,共54頁,2023年,2月20日,星期三[例4-10]組距式數(shù)列計算眾數(shù)示例收入組別人均收入(元)頻數(shù)(人)1234562000元以下2000~4000元4000~6000元6000~8000元8000~10000元10000以上234368322410合計-200其眾數(shù)的近似值為:某地區(qū)的人均月收入調(diào)查數(shù)據(jù)表第29頁,共54頁,2023年,2月20日,星期三三、均值、中位數(shù)和眾數(shù)的比較(一)均值、中位數(shù)和眾數(shù)的數(shù)量關(guān)系
1.當(dāng)數(shù)據(jù)呈對稱分布的,三者合而為一,如圖(a)
2.當(dāng)數(shù)據(jù)呈左偏分布時,說明數(shù)據(jù)存在極小值,必然拉動均值向極小值一方靠,則從左至右依次是均值、中位數(shù)和眾數(shù),如圖(b)
3.當(dāng)數(shù)據(jù)呈右偏分布時,說明數(shù)據(jù)存在極大值,必然拉動均值向極大值一方靠,則從左至右依次是眾數(shù)、中位數(shù)和均值,如圖(c)
第30頁,共54頁,2023年,2月20日,星期三均值、中位數(shù)和眾數(shù)的數(shù)量關(guān)系
1.當(dāng)數(shù)據(jù)呈對稱分布的,三者合而為一
第31頁,共54頁,2023年,2月20日,星期三均值、中位數(shù)和眾數(shù)的數(shù)量關(guān)系
2.當(dāng)數(shù)據(jù)呈左偏分布時,從左至右依次是均值、中位數(shù)和眾數(shù)
第32頁,共54頁,2023年,2月20日,星期三均值、中位數(shù)和眾數(shù)的數(shù)量關(guān)系
3.當(dāng)數(shù)據(jù)呈右偏分布時,從左至右依次是眾數(shù)、中位數(shù)和均值,如圖c
第33頁,共54頁,2023年,2月20日,星期三三、均值、中位數(shù)和眾數(shù)的比較(二)均值、眾數(shù)和中位數(shù)的特點及應(yīng)用場合
**均值是對數(shù)值型數(shù)據(jù)計算的,利用了全部數(shù)據(jù)信息,具有優(yōu)良的數(shù)學(xué)性質(zhì),是實際中應(yīng)用最廣泛的集中趨勢測度值
**中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,其特點是不受數(shù)據(jù)極端值的影響,主要適合于作為順序數(shù)據(jù)的集中趨勢測度值
**眾數(shù)是一組數(shù)據(jù)分布的峰值,它也是一種位置代表值,不受極端值的影響,主要適合于作為分類數(shù)據(jù)的集中趨勢測度值
第34頁,共54頁,2023年,2月20日,星期三第三節(jié)
數(shù)據(jù)分布離散程度的測定第35頁,共54頁,2023年,2月20日,星期三一、極差/全距(一)概念:又稱全距,是數(shù)據(jù)中最大值和最小值之差。記為(二)計算
1.未分組數(shù)據(jù)的極差為:表示數(shù)據(jù)的最大值表示數(shù)據(jù)的最小值
2.分組數(shù)據(jù)的極差
極差=最大組的上限-最小組的下限
若存在開口組,則:
最大組的上限=前一組的上限+組距最小組的下限=下一組的下限-組距其中:第36頁,共54頁,2023年,2月20日,星期三
[例4-11]對人均月收入分組如下:2000元以下、2000~4000元、……、8000~10000元、10000元以上,計算全距
[分析]:其最小組的下限為0
最大組的上限為:則全距為:極差/全距的計算示例第37頁,共54頁,2023年,2月20日,星期三(三)修正極差(modifiedrange)
1.概念:是去掉極端值后的極差,又稱四分位全距(IQR,interquartilerange),是中間50%的數(shù)據(jù)的間距,即數(shù)據(jù)分布中第25個和第75個百分位數(shù)的間距,也即第1個和第3個四分位數(shù)的間距
2.公式:
其中:Q3表示第3個四分位數(shù),即第75個百分位數(shù)
Q1表示第1個四分位數(shù),即第25百分位數(shù)
第38頁,共54頁,2023年,2月20日,星期三二、平均差(MAD)(一)概念:
平均差(meanabsolutedeviation)是各數(shù)據(jù)對平均數(shù)的離差絕對值的平均數(shù)
(二)樣本平均差的計算公式為:
1.未分組數(shù)據(jù):
2.分組數(shù)據(jù):
第39頁,共54頁,2023年,2月20日,星期三三、方差和標(biāo)準(zhǔn)差(一)概念方差(variance)是各變量值與其均值離差平方的平均數(shù)。標(biāo)準(zhǔn)差(standarddeviation)是方差的平方根,又稱“均方差”(二)比較與評價
1.其內(nèi)涵與平均差相似,均為各個數(shù)據(jù)對其平均數(shù)的平均離差。但平均差采用求絕對值消除正負(fù)離差,標(biāo)準(zhǔn)差采用平方法消除正負(fù)離差,在數(shù)學(xué)處理上標(biāo)準(zhǔn)差上比平均差更為科學(xué)合理
2.方差和標(biāo)準(zhǔn)差是測度數(shù)值型數(shù)據(jù)離散程度的最主要的指標(biāo)第40頁,共54頁,2023年,2月20日,星期三(三)方差和標(biāo)準(zhǔn)差的計算
1.總體方差和標(biāo)準(zhǔn)差
方差標(biāo)準(zhǔn)差未分組數(shù)據(jù)分組數(shù)據(jù)第41頁,共54頁,2023年,2月20日,星期三[例4-12]某電腦公司銷售量分組數(shù)據(jù)如下表,計算銷售量的方差和標(biāo)準(zhǔn)差
總體方差和標(biāo)準(zhǔn)差計算示例某電腦公司銷售量分組數(shù)據(jù)方差計算表第42頁,共54頁,2023年,2月20日,星期三總體方差和標(biāo)準(zhǔn)差計算示例
根據(jù)公式計算可知總體均值為:
總體方差為:
總體標(biāo)準(zhǔn)差為:
第43頁,共54頁,2023年,2月20日,星期三2.樣本方差和標(biāo)準(zhǔn)差
說明:在大多數(shù)統(tǒng)計應(yīng)用中,都針對樣本數(shù)據(jù)來分析總體數(shù)量特征。因此通常用樣本方差來估計總體方差,用樣本標(biāo)準(zhǔn)差來估計總體標(biāo)準(zhǔn)差符號:
樣本容量用n表示樣本方差用S2表示
樣本標(biāo)準(zhǔn)差用S表示
第44頁,共54頁,2023年,2月20日,星期三(三)方差和標(biāo)準(zhǔn)差的計算
2.樣本方差和標(biāo)準(zhǔn)差
方差標(biāo)準(zhǔn)差未分組數(shù)據(jù)分組數(shù)據(jù)··第45頁,共54頁,2023年,2月20日,星期三[例4-13]
根據(jù)以下樣本數(shù)據(jù),計算企業(yè)職工平均工資的標(biāo)準(zhǔn)差。(已知平均工資為=760元)
某企業(yè)職工工資分組數(shù)據(jù)表第46頁,共54頁,2023年,2月20日,星期三樣本方差和標(biāo)準(zhǔn)差計算示例
樣本方差為:
樣本標(biāo)準(zhǔn)差為:
第47頁,共54頁,2023年,2月20日,星期三四、離散系數(shù)/變異系數(shù)
(一)概念:離散系數(shù)(coefficientofvariation)是一組數(shù)據(jù)的離散指標(biāo)的絕對數(shù)與其相應(yīng)的均值之比。是離散指標(biāo)的相對數(shù)形式(二)表現(xiàn)形式有全距系數(shù)、平均差系數(shù)和標(biāo)準(zhǔn)差系數(shù)。最常用的是標(biāo)準(zhǔn)差系數(shù)(三)計算公式總體標(biāo)準(zhǔn)差系數(shù)
樣本標(biāo)準(zhǔn)差系數(shù)第48頁,共54頁,2023年,2月20日,星期三四、離散系數(shù)/變異系數(shù)
(四)應(yīng)用:用于比較不同總體數(shù)據(jù)分布的離散程度[例題4-13]
甲乙企業(yè)職工的年均收入分別為20000元和50000元,收入的標(biāo)準(zhǔn)差分別為3000元和5000元,問哪家企業(yè)職工
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高級經(jīng)濟(jì)師《人力資源管理》試題(網(wǎng)友回憶版)含答案
- 六年級上冊音樂教學(xué)計劃模板
- 餐飲企業(yè)員工勞動合同范本(含試用期工資調(diào)整規(guī)定)
- 病毒式用戶生成內(nèi)容營銷合同
- 成立分公司及區(qū)域市場拓展與維護(hù)協(xié)議
- 保險業(yè)保險科技市場趨勢分析合同
- 智能倉儲空間轉(zhuǎn)讓與物聯(lián)網(wǎng)技術(shù)應(yīng)用合同
- 老人健康預(yù)防課件
- 美術(shù)課件小學(xué)生
- 村居干部考試題目及答案
- 安徽青碩建設(shè)有限公司招聘筆試真題2024
- 公司適用法律法規(guī)標(biāo)準(zhǔn)清單2025年08月更新
- 2025年4月自考00077金融市場學(xué)試題
- 中意紙質(zhì)文物脫酸技術(shù)應(yīng)用與思考
- 國家開放大學(xué)機(jī)考答案 5個人與團(tuán)隊管理2025-06-21
- 2025年 中國南水北調(diào)集團(tuán)新能源投資公司第一批中層及考試筆試試卷附答案
- 敘事護(hù)理學(xué)智慧樹知到答案2024年中國人民解放軍海軍軍醫(yī)大學(xué)
- 火龍罐綜合灸技術(shù)課件
- 六年級主題班隊會記錄表(6個表)
- 卵巢惡性腫瘤臨床路徑
- 9忘了說我愛你
評論
0/150
提交評論