




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第第 1 章章 數(shù)據(jù)的特征數(shù)數(shù)據(jù)的特征數(shù) 本本章以及第章以及第 2、3 章的內(nèi)容來自推斷統(tǒng)計(jì)學(xué)。章的內(nèi)容來自推斷統(tǒng)計(jì)學(xué)。 在本書中在本書中經(jīng)濟(jì)經(jīng)濟(jì)觀測(cè)值觀測(cè)值對(duì)應(yīng)的變量對(duì)應(yīng)的變量稱稱為經(jīng)濟(jì)變量, 或簡(jiǎn)稱為變量為經(jīng)濟(jì)變量, 或簡(jiǎn)稱為變量, 通常通常是當(dāng)作隨機(jī)是當(dāng)作隨機(jī)變量處理的變量處理的。 但現(xiàn)實(shí)中經(jīng)濟(jì)變量能否滿足隨機(jī)變量的定義要求, 是我們?cè)趯?shí)際研究中但現(xiàn)實(shí)中經(jīng)濟(jì)變量能否滿足隨機(jī)變量的定義要求, 是我們?cè)趯?shí)際研究中始終應(yīng)關(guān)注的問題。始終應(yīng)關(guān)注的問題。 這一章把數(shù)據(jù)的特征這一章把數(shù)據(jù)的特征數(shù)數(shù)分為分為 4 大類, 即描述大類, 即描述集中位置的特征數(shù)、 分散程度的特征集中位置的特征數(shù)、 分散程度
2、的特征數(shù)、分布狀況的特征數(shù)和數(shù)、分布狀況的特征數(shù)和兩兩變量線性變量線性相關(guān)相關(guān)的特征數(shù)的特征數(shù)。本章共介紹本章共介紹 10 個(gè)特征數(shù),分別個(gè)特征數(shù),分別是是算術(shù)平均數(shù)、幾何平均數(shù)算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)、中位數(shù)、極極差、方差、標(biāo)準(zhǔn)差、差、方差、標(biāo)準(zhǔn)差、偏度、峰度、協(xié)方差和偏度、峰度、協(xié)方差和相關(guān)系數(shù)相關(guān)系數(shù)。在介紹特征數(shù)之前,先給出求和算子和畫圖的概念。在介紹特征數(shù)之前,先給出求和算子和畫圖的概念。 注意:注意:本章本章所說的所說的一組數(shù)據(jù)一組數(shù)據(jù)如果如果不不作作特別說特別說明明,則既可以,則既可以指指一個(gè)總體,也可以一個(gè)總體,也可以指指一個(gè)樣本。一個(gè)樣本。 第第 1 章章 數(shù)據(jù)的特征數(shù)
3、數(shù)據(jù)的特征數(shù) 1.1 累計(jì)累計(jì)求和算子的運(yùn)算規(guī)則求和算子的運(yùn)算規(guī)則 總體總體:研究對(duì)象的全體稱為總體:研究對(duì)象的全體稱為總體。常用。常用x1, x2, , xN或或y1, y2, , yN等表示。等表示。 個(gè)體個(gè)體:組成總體的每個(gè)基本單位稱為個(gè)體。:組成總體的每個(gè)基本單位稱為個(gè)體。常用常用 xi, 或或 yi等表示。等表示。 總體容量總體容量:總體中所含個(gè)體的個(gè)數(shù)??傮w中所含個(gè)體的個(gè)數(shù)??傮w總體x1, x2, , xN中的中的 N 表示表示總體容量總體容量。 樣本樣本: 總體中抽出若干個(gè)體而: 總體中抽出若干個(gè)體而組組成的集體稱為樣本。 常用成的集體稱為樣本。 常用x1, x2, , xn或或
4、y1, y2, , yn等等表示。表示。 樣本容量樣本容量:樣本中所含個(gè)體的個(gè)數(shù):樣本中所含個(gè)體的個(gè)數(shù)稱作稱作樣本容量樣本容量,樣本樣本x1, x2, , xn中的中的下標(biāo)下標(biāo) n 表示表示樣本容量樣本容量。 比如比如某某銀行分理處銀行分理處共有共有 20 486 個(gè)活期存款儲(chǔ)戶個(gè)活期存款儲(chǔ)戶。如果要。如果要研究研究這這 20 486 個(gè)儲(chǔ)戶在某個(gè)個(gè)儲(chǔ)戶在某個(gè)時(shí)點(diǎn)的存款額時(shí)點(diǎn)的存款額, 那么, 那么這這 20 486 個(gè)個(gè)存款額存款額就是一個(gè)總體,就是一個(gè)總體, 存款額存款額的的總體容量總體容量是是 20 486,而每一個(gè)而每一個(gè)存款額存款額是一個(gè)個(gè)體。是一個(gè)個(gè)體。 比如從中隨機(jī)抽取比如從中隨
5、機(jī)抽取 20 個(gè)個(gè)存款額數(shù)據(jù)存款額數(shù)據(jù), 則這, 則這 20 個(gè)個(gè)存款額存款額數(shù)據(jù)數(shù)據(jù)構(gòu)成一個(gè)構(gòu)成一個(gè)隨機(jī)隨機(jī)樣本。樣本。樣本容量樣本容量是是 20。 特征數(shù)特征數(shù):用于描述一組數(shù)據(jù):用于描述一組數(shù)據(jù)(總體總體或或樣本樣本)特征的數(shù)值稱作特征數(shù)。特征的數(shù)值稱作特征數(shù)。 本章本章介紹的平均數(shù)、中位數(shù)、方差、相關(guān)系數(shù)等都是一組數(shù)據(jù)的特征數(shù)。介紹的平均數(shù)、中位數(shù)、方差、相關(guān)系數(shù)等都是一組數(shù)據(jù)的特征數(shù)。 累計(jì)累計(jì)求和算子定義求和算子定義:對(duì)于:對(duì)于 T 個(gè)觀測(cè)值,個(gè)觀測(cè)值,x1, x2, , xT,累計(jì)累計(jì)求和可以簡(jiǎn)化地求和可以簡(jiǎn)化地表示為表示為 x1 + x2 + + xT = Tttx1。其中其中
6、)(稱作稱作累計(jì)累計(jì)求和算子求和算子,用大寫希臘,用大寫希臘字母字母 表示表示。 的上的上、下標(biāo)下標(biāo) t=1 和和 T 表示表示 xt從從 x1累加至累加至 xT。 累計(jì)累計(jì)求和算子的運(yùn)算規(guī)則如下求和算子的運(yùn)算規(guī)則如下: (1)觀測(cè)值倍數(shù)的觀測(cè)值倍數(shù)的累加累加和等于觀測(cè)值和等于觀測(cè)值累加累加和的倍數(shù)。和的倍數(shù)。 Tttkx1= kTttx1 其中其中 k 是常數(shù),是常數(shù),xt是觀測(cè)值。是觀測(cè)值。 (2)兩兩組組觀測(cè)值觀測(cè)值相應(yīng)求相應(yīng)求和和(或差)或差)的的累加累加和等于它們分別求和等于它們分別求累加累加和后再和后再相加相加(或相減)(或相減) 。 Ttttyx1)(= Tttx1 Ttty1
7、(3)T 個(gè)常數(shù)個(gè)常數(shù) k 求和等于該常數(shù)求和等于該常數(shù) k 與與 T 的乘積的乘積。Ttk1= kT。其中其中 k 是常數(shù)。是常數(shù)。 (4)用)用雙雙下標(biāo)表示的下標(biāo)表示的 T T 個(gè)個(gè)觀測(cè)值觀測(cè)值的的累加和累加和可以用雙可以用雙重重累加累加和和符號(hào)表示符號(hào)表示為為 (x11 + x12 + + x1T) + (x21 + x22 + + x2T) + + (xT1 + xT2 + + xTT) =Ti 1(xi1 + xi 2 + + xiT) =TjijTix11 (5)兩組觀測(cè)值相應(yīng)求和兩組觀測(cè)值相應(yīng)求和的雙重的雙重累加累加和等于它們各自雙重和等于它們各自雙重累加累加和的和。和的和。 T
8、jijijTiyx11)(= TjijTix11+TjijTiy11 (6) 兩兩組組不同單下標(biāo)不同單下標(biāo)觀測(cè)值觀測(cè)值積的雙重積的雙重累計(jì)累計(jì)求和等于它們各自求和等于它們各自累計(jì)累計(jì)求和的乘積。求和的乘積。 TjjiTiyx11= (Tiix1) (Tjjy1) 1.2.1 直方圖直方圖 直方圖分直方圖分頻數(shù)直方圖和頻率直方圖兩類。直方圖用橫軸表示觀測(cè)值,并把橫軸分頻數(shù)直方圖和頻率直方圖兩類。直方圖用橫軸表示觀測(cè)值,并把橫軸分成若干個(gè)區(qū)間(每個(gè)區(qū)間的寬度稱作組距) ;用縱軸表示落在相應(yīng)區(qū)間內(nèi)的觀測(cè)值成若干個(gè)區(qū)間(每個(gè)區(qū)間的寬度稱作組距) ;用縱軸表示落在相應(yīng)區(qū)間內(nèi)的觀測(cè)值頻數(shù)(個(gè)數(shù))頻數(shù)(個(gè)數(shù)
9、)或頻率,并用矩形(長(zhǎng)條形)表示組頻數(shù)或或頻率,并用矩形(長(zhǎng)條形)表示組頻數(shù)或組組頻率的圖形。頻率的圖形。 例例 1-1: 20 個(gè)新生兒體重值 (克) 數(shù)據(jù)見表個(gè)新生兒體重值 (克) 數(shù)據(jù)見表 1-1。 畫畫 20 個(gè)個(gè)新生兒體重值的新生兒體重值的頻數(shù) (頻頻數(shù) (頻率)率)直方圖。直方圖。 表表 1-1 新生兒體重值新生兒體重值 xi數(shù)據(jù)數(shù)據(jù) 單位:克單位:克 序序號(hào)號(hào) 體體重值重值 序序號(hào)號(hào) 體體重值重值 1 2440 11 3180 2 2620 12 3200 3 2700 13 3200 4 2880 14 3300 5 2900 15 3420 6 3000 16 3440 7
10、3020 17 3500 8 3040 18 3500 9 3080 19 3600 10 3100 20 3860 1.2.1 直方圖直方圖 例例 1-1:首先首先把這把這 20 個(gè)新生兒體重值按從小到大順序排列如下:個(gè)新生兒體重值按從小到大順序排列如下: 2440,2620,2700,2880,2900,3000,3020,3040,3080,3100,3180,3200,3200,3300,3420,3440,3500,3500,3600,3860。 知最小值是知最小值是 2440 克, 最大值是克, 最大值是 3860 克。 把觀測(cè)值的取值范圍按克。 把觀測(cè)值的取值范圍按 2400 2
11、700,2700 3000,3000 3300,3300 3600,3600 3900 分成分成 5 組。記錄這組。記錄這 20 個(gè)觀測(cè)值個(gè)觀測(cè)值分別落在這分別落在這 5 個(gè)組內(nèi)的頻數(shù)(個(gè)數(shù)) 。結(jié)果分別是個(gè)組內(nèi)的頻數(shù)(個(gè)數(shù)) 。結(jié)果分別是 2,3,8,5,2。用總觀測(cè)值個(gè)。用總觀測(cè)值個(gè)數(shù)數(shù) 20 除每個(gè)組頻數(shù)除每個(gè)組頻數(shù),得,得組頻率值分別組頻率值分別是是 0.10,0.15,0.40,0.25,0.10。用上面的。用上面的結(jié)果結(jié)果制成制成頻數(shù)(頻率)分布表頻數(shù)(頻率)分布表(見(見表表 1-2) 。 表表 1-2 20 個(gè)新生兒體重值分組數(shù)據(jù)頻數(shù)(頻率)分布表個(gè)新生兒體重值分組數(shù)據(jù)頻數(shù)(頻
12、率)分布表 體重體重值值(克)(克) 頻數(shù)頻數(shù) 頻頻率率 組中值組中值(克)(克) 24002700 以下以下 2 0.10 2550 27003000 以下以下 3 0.15 2850 30003300 以下以下 8 0.40 3150 33003600 以下以下 5 0.25 3450 36003900 以下以下 2 0.10 3750 合計(jì)合計(jì) 20 1.00 例例 1-1: 表表 1-2 20 個(gè)新生兒體重值分組數(shù)據(jù)頻數(shù)(頻率)分布表個(gè)新生兒體重值分組數(shù)據(jù)頻數(shù)(頻率)分布表 體重體重值值(克)(克) 頻數(shù)頻數(shù) 頻頻率率 組中值組中值(克)(克) 24002700 以下以下 2 0.10
13、 2550 27003000 以下以下 3 0.15 2850 30003300 以下以下 8 0.40 3150 33003600 以下以下 5 0.25 3450 36003900 以下以下 2 0.10 3750 合計(jì)合計(jì) 20 1.00 圖圖 1-1 新生兒體重值的頻數(shù)分布直方圖新生兒體重值的頻數(shù)分布直方圖 圖圖 1-2 新生兒體重值的頻率分布直方圖新生兒體重值的頻率分布直方圖 注意:注意: (1)頻數(shù)頻數(shù)、頻率、頻率直方圖所展示的數(shù)據(jù)分布特征是一樣的直方圖所展示的數(shù)據(jù)分布特征是一樣的,只不過前者的縱軸表示的是,只不過前者的縱軸表示的是頻數(shù),后者縱軸表示的是頻率。頻數(shù),后者縱軸表示的是
14、頻率。 (2)當(dāng)觀測(cè)值正巧等于組邊界值時(shí),注意不要當(dāng)觀測(cè)值正巧等于組邊界值時(shí),注意不要在相鄰兩組中重復(fù)記錄頻數(shù)在相鄰兩組中重復(fù)記錄頻數(shù)。以表。以表 1-2為例,記錄組頻數(shù)的規(guī)則是組下限值包括在本組內(nèi),組上限值不包括在本組內(nèi)。比如為例,記錄組頻數(shù)的規(guī)則是組下限值包括在本組內(nèi),組上限值不包括在本組內(nèi)。比如觀測(cè)值觀測(cè)值 2700 克正巧落在組邊界值上。觀測(cè)值克正巧落在組邊界值上。觀測(cè)值 2700 克應(yīng)該記錄在第克應(yīng)該記錄在第 2 組,而不是第組,而不是第 1組組中中。觀測(cè)值觀測(cè)值 3000 克也正巧落在組邊界值上。觀測(cè)值克也正巧落在組邊界值上。觀測(cè)值 3000 克應(yīng)該記錄在第克應(yīng)該記錄在第 3 組,
15、而組,而不是第不是第 2 組中。組中。 (3)同樣一組數(shù)據(jù)由于分組數(shù)不同,所畫頻數(shù)(頻率)直方圖的特征會(huì)不一樣同樣一組數(shù)據(jù)由于分組數(shù)不同,所畫頻數(shù)(頻率)直方圖的特征會(huì)不一樣。實(shí)際。實(shí)際中應(yīng)該選擇一個(gè)最合適的分組數(shù),以便充分展示數(shù)據(jù)的分布特征。一般分組數(shù)在中應(yīng)該選擇一個(gè)最合適的分組數(shù),以便充分展示數(shù)據(jù)的分布特征。一般分組數(shù)在 5 15之間。之間。 (4)很多專用軟件都有畫直方圖的功能,非常方便。)很多專用軟件都有畫直方圖的功能,非常方便。畫直方圖的畫直方圖的 EViews 步驟步驟是,打是,打開單數(shù)開單數(shù)據(jù)組據(jù)組窗口,點(diǎn)擊窗口,點(diǎn)擊 View/descriptive Statistics &a
16、mp; Tests/Histogram and Stats 功能。功能。 -20-100102000.020.040.060.080.10.12-20-100102000.020.040.060.080.10.12-20-100102000.020.040.060.080.10.121.2.2 折線圖折線圖 折線圖:把觀測(cè)點(diǎn)按折線圖:把觀測(cè)點(diǎn)按序號(hào)序號(hào)或或時(shí)間順序時(shí)間順序用直線連接起來的圖形。用直線連接起來的圖形。 對(duì)于截面數(shù)據(jù)對(duì)于截面數(shù)據(jù),橫軸表示觀測(cè)值的序號(hào),縱軸,橫軸表示觀測(cè)值的序號(hào),縱軸表示觀測(cè)值。對(duì)于時(shí)間序列數(shù)據(jù),橫軸表示觀測(cè)值。對(duì)于時(shí)間序列數(shù)據(jù),橫軸表示時(shí)間,縱軸表示觀測(cè)值。時(shí)間序
17、列折線圖也稱時(shí)間序列圖。表示時(shí)間,縱軸表示觀測(cè)值。時(shí)間序列折線圖也稱時(shí)間序列圖。 圖圖 1-3 給出的是給出的是 2005 年年 7 月月 22 日至日至 2007 年年 4 月月 30 日日 433 天的天的美美元兌元兌人民幣人民幣元匯率元匯率值值時(shí)間序列圖。時(shí)間序列圖。 通過這張圖可以清晰地通過這張圖可以清晰地看到在看到在該該期間期間人民幣一直處于升值的大趨勢(shì)中。人民幣一直處于升值的大趨勢(shì)中。 圖圖 1-3 2005 年年 7 月月 22 日至日至 2007 年年 4 月月 30 日日 433 天的天的人民幣元兌美元匯率值人民幣元兌美元匯率值時(shí)間序列圖時(shí)間序列圖 畫折線圖的畫折線圖的 EV
18、iews 步驟是,打開數(shù)據(jù)組窗口,點(diǎn)擊步驟是,打開數(shù)據(jù)組窗口,點(diǎn)擊 View/Graph 功能。在隨后打開的功能。在隨后打開的Graph Options(畫圖選擇)(畫圖選擇)窗口中的窗口中的 Specific(圖類設(shè)定)選項(xiàng)框中(圖類設(shè)定)選項(xiàng)框中選選 Line & Symbol(折線圖) ,點(diǎn)擊確定鍵。(折線圖) ,點(diǎn)擊確定鍵。 7707807908008108203000310032003300rate1.2.3 散點(diǎn)圖散點(diǎn)圖 散點(diǎn)圖:用兩個(gè)變量散點(diǎn)圖:用兩個(gè)變量的的成對(duì)觀測(cè)值畫成對(duì)觀測(cè)值畫出的觀測(cè)點(diǎn)圖。出的觀測(cè)點(diǎn)圖。 通過散點(diǎn)圖可以分析兩個(gè)變量之間是否存在某種關(guān)系。如果存在關(guān)系
19、,那么這種關(guān)系通過散點(diǎn)圖可以分析兩個(gè)變量之間是否存在某種關(guān)系。如果存在關(guān)系,那么這種關(guān)系是線性的,還是非線性的。是線性的,還是非線性的。 圖圖 1-4 給出的是給出的是 2002 年年中國(guó)各地區(qū)城中國(guó)各地區(qū)城鎮(zhèn)鎮(zhèn)居民家庭人均消費(fèi)性支出(居民家庭人均消費(fèi)性支出(Y2002,元)元)與可支配收入(與可支配收入(X2002,元)數(shù)據(jù)元)數(shù)據(jù)散點(diǎn)圖散點(diǎn)圖。右上方右上方 4 個(gè)觀測(cè)點(diǎn)分別代表北京、上海、個(gè)觀測(cè)點(diǎn)分別代表北京、上海、浙江省和廣東省。浙江省和廣東省。通過散點(diǎn)圖可以清楚地看到通過散點(diǎn)圖可以清楚地看到經(jīng)濟(jì)相對(duì)發(fā)達(dá)地區(qū)經(jīng)濟(jì)相對(duì)發(fā)達(dá)地區(qū)的的城鎮(zhèn)居民城鎮(zhèn)居民家庭人均家庭人均支出、可支配收入額都很高支出
20、、可支配收入額都很高;經(jīng)濟(jì)相對(duì)欠發(fā)達(dá)地區(qū),如甘肅、寧夏、青海、內(nèi)蒙古等經(jīng)濟(jì)相對(duì)欠發(fā)達(dá)地區(qū),如甘肅、寧夏、青海、內(nèi)蒙古等城鎮(zhèn)城鎮(zhèn)居民居民家庭人均支出、可支配收入額都家庭人均支出、可支配收入額都相對(duì)較相對(duì)較低。低。 圖圖 1-4 2002 年年中國(guó)城中國(guó)城鎮(zhèn)鎮(zhèn)居民家庭人均支出居民家庭人均支出(y2002)與可支配收入與可支配收入(x2002)散點(diǎn)圖散點(diǎn)圖 400060008000100001200060008000100001200014000X2002Y20021.3 算術(shù)平均數(shù)算術(shù)平均數(shù) 下面介紹的下面介紹的平均數(shù)平均數(shù),中位數(shù)等都是,中位數(shù)等都是描述一組數(shù)據(jù)集中位置的描述一組數(shù)據(jù)集中位置的特
21、征數(shù)。特征數(shù)。 對(duì)于不分組數(shù)據(jù)對(duì)于不分組數(shù)據(jù),均值和算術(shù)平均數(shù)分別均值和算術(shù)平均數(shù)分別定義定義如下。如下。 均值均值:一組數(shù)據(jù),如果是總體,用:一組數(shù)據(jù),如果是總體,用 x1, x2 , , xN 表示,容量為表示,容量為 N,則,則均值均值 定義為定義為 = NxxxN.21=NiixN11 (1-1) 其中其中 表示表示均值,均值,xi表示觀測(cè)值,表示觀測(cè)值,N 表示總體容量表示總體容量。 算術(shù)平均數(shù)算術(shù)平均數(shù):一組數(shù)據(jù),:一組數(shù)據(jù),如如果是果是樣本樣本, x1, x2 , , xn ,容量為,容量為 n,則算術(shù)平均數(shù),則算術(shù)平均數(shù)x定定義義為為 x= nxxxn.21=niixn11 (
22、1-2) 其中其中x表示表示算術(shù)平均數(shù)算術(shù)平均數(shù),xi表示觀測(cè)值,表示觀測(cè)值,n 表示表示樣本樣本容量容量。關(guān)于總體均值或數(shù)學(xué)期望的關(guān)于總體均值或數(shù)學(xué)期望的概率定義概率定義見見附錄附錄 B。 x=203860.26202440= 3149(克) 算術(shù)平均算術(shù)平均數(shù)的數(shù)的 EViews 操作:打開數(shù)據(jù)組窗口。點(diǎn)擊操作:打開數(shù)據(jù)組窗口。點(diǎn)擊 View 鍵,選鍵,選 Descriptive Statistics/ histogram and Stats 功能。計(jì)算結(jié)果中的功能。計(jì)算結(jié)果中的 mean 就是就是算術(shù)平均算術(shù)平均數(shù)的值。數(shù)的值。 1.3 算術(shù)平均數(shù)算術(shù)平均數(shù) 算術(shù)平均數(shù)算術(shù)平均數(shù)是一個(gè)常
23、用概念。算術(shù)平均數(shù)是一個(gè)常用概念。算術(shù)平均數(shù)的性質(zhì)的性質(zhì)如下。如下。 (1)觀測(cè)值的和等于其平均數(shù)與觀測(cè)值個(gè)數(shù)的乘積。觀測(cè)值的和等于其平均數(shù)與觀測(cè)值個(gè)數(shù)的乘積。niix1= nx 。 x對(duì)一組數(shù)據(jù)對(duì)一組數(shù)據(jù)有代表性。若不考慮有代表性。若不考慮 xt的差異。用的差異。用x代替代替全部全部 xt,則總和,則總和與與 xt的累計(jì)的累計(jì)和和相等。所以人們常用相等。所以人們常用算術(shù)平均數(shù)算術(shù)平均數(shù)描述數(shù)據(jù)。如平均年齡,平均工資描述數(shù)據(jù)。如平均年齡,平均工資,平均得分,平均得分等。等。 (2)一組觀測(cè)值與其一組觀測(cè)值與其算術(shù)算術(shù)平均數(shù)的離差平均數(shù)的離差之之和等于零和等于零,即即 niixx1)(= 0。
24、證證明明:利用利用累計(jì)累計(jì)求和算子的運(yùn)算規(guī)則(求和算子的運(yùn)算規(guī)則(2) 、 (、 (3)和和式式(1-3)結(jié)果,)結(jié)果, niixx1)(=niix1-nix1=niix1- nx= 0 此性質(zhì)以后常常用到。此性質(zhì)以后常常用到。 (3)一組觀測(cè)值)一組觀測(cè)值與某一定值與某一定值 A 的離差平方和的離差平方和niiAx1)(的值的值以以 A =x時(shí)為最小。時(shí)為最小。 1.4 幾何平均數(shù)幾何平均數(shù) 當(dāng)數(shù)據(jù)是以環(huán)比形式給出時(shí),當(dāng)數(shù)據(jù)是以環(huán)比形式給出時(shí), 用用算術(shù)算術(shù)平均平均值求平均值求平均數(shù)數(shù)是不合理的。是不合理的。 應(yīng)應(yīng)該用幾何平均數(shù)該用幾何平均數(shù)求該求該組組數(shù)據(jù)的平均數(shù)據(jù)的平均比值比值和和平均平
25、均增增長(zhǎng)長(zhǎng)率。率。 幾何平均數(shù)幾何平均數(shù)定義定義:一組環(huán)比數(shù)據(jù):一組環(huán)比數(shù)據(jù)r1, r2, , rk,個(gè)數(shù)(或稱容量)個(gè)數(shù)(或稱容量)為為 k,則幾何平均,則幾何平均數(shù)數(shù) r= kkrrr.21 (1-6) 例例 1-3:中國(guó)人口自然增長(zhǎng)中國(guó)人口自然增長(zhǎng)環(huán)比環(huán)比數(shù)據(jù)數(shù)據(jù)如如表表 1-3。按按式式(1-6)計(jì)算,)計(jì)算, r= 400587. 100601. 100645. 100695. 1= 1.00632 2000 2004 期間中國(guó)人口自然增長(zhǎng)期間中國(guó)人口自然增長(zhǎng)年平均年平均環(huán)比值是環(huán)比值是1.00632, 年平均增長(zhǎng)率為, 年平均增長(zhǎng)率為 6.32 。 表表 1-3 中國(guó)人口自然增長(zhǎng)環(huán)
26、比數(shù)據(jù)中國(guó)人口自然增長(zhǎng)環(huán)比數(shù)據(jù) 年份年份 自然增長(zhǎng)率(自然增長(zhǎng)率() 2000 2001 1.00695 2002 1.00645 2003 1.00601 2004 1.00587 資料來源: 中國(guó)統(tǒng)計(jì)年鑒資料來源: 中國(guó)統(tǒng)計(jì)年鑒2005,表,表 4-2(經(jīng)作者加工)(經(jīng)作者加工) ,中國(guó)統(tǒng)計(jì)出版社。,中國(guó)統(tǒng)計(jì)出版社。 注意:注意:求求幾何平均數(shù)時(shí),幾何平均數(shù)時(shí),開方數(shù)開方數(shù) k 不要用錯(cuò)。不要用錯(cuò)。 仍然是按不分組數(shù)據(jù)和分組數(shù)據(jù)兩種情況討論仍然是按不分組數(shù)據(jù)和分組數(shù)據(jù)兩種情況討論中位數(shù)中位數(shù)定義定義。 中位數(shù)中位數(shù)定義(定義(不分組數(shù)據(jù)情形不分組數(shù)據(jù)情形) :一組) :一組 n 個(gè)觀測(cè)值,
27、按數(shù)值大小排列如下個(gè)觀測(cè)值,按數(shù)值大小排列如下,x1, x2, , xn。處于中央位置的處于中央位置的觀測(cè)值觀測(cè)值稱稱作作中位數(shù)中位數(shù)。用。用 Md 表示表示。 為偶數(shù)為奇數(shù)nxxnxMdnnn,2,1)2/(2/21 例例 1-4: 5 名學(xué)生的考試分?jǐn)?shù)名學(xué)生的考試分?jǐn)?shù)是是 93,90,85,82,80 分。分。 因?yàn)橐驗(yàn)?n=5,是是奇數(shù),奇數(shù),所以所以中位數(shù)中位數(shù) Md = 85。 例例 1-5:以表以表 1-4 中數(shù)據(jù)為例,從小到大整理后中數(shù)據(jù)為例,從小到大整理后 的的數(shù)據(jù)如數(shù)據(jù)如表表 1-5。 Md =21( x12 / 2 + x (12 / 2) + 1) = 21( x6 +
28、x7) =27868. 57612. 5= 5.774 中位數(shù)中位數(shù) 5.774 比平均數(shù)比平均數(shù) 6.00745 的代表性要的代表性要好好。 表表1-5 表表1-4中中12個(gè)匯率值個(gè)匯率值的的從小到大排列從小到大排列 序序號(hào)號(hào) 人民幣元兌美元匯率值人民幣元兌美元匯率值 1 5.7084 2 5.7190 3 5.7290 4 5.7402 5 5.7612 6 5.7612 7 5.7868 8 5.7868 9 5.7918 10 5.8000 11 5.8050 12 8.7000 1.5 中位數(shù)中位數(shù) 例例 1-6:一組數(shù)據(jù)是:一組數(shù)據(jù)是 3,9,6,1,5。哪個(gè)是中位數(shù)?。哪個(gè)是中位
29、數(shù)? 解:把數(shù)據(jù)解:把數(shù)據(jù)按按從小到大從小到大排序,排序,得,得,1,3,5,6,9。n = 5 為奇數(shù)。則為奇數(shù)。則 Md = x(5+1) / 2 = x3 = 5 即中位數(shù)是即中位數(shù)是 5。 中位數(shù)中位數(shù)定義(分組數(shù)據(jù)情形)定義(分組數(shù)據(jù)情形) :對(duì)于分組數(shù)據(jù),:對(duì)于分組數(shù)據(jù),Md 的計(jì)算公式的計(jì)算公式定義定義如下:如下: Md = L +hnn21 (1-8) 其中:其中:L 為中位數(shù)所在組的下限值為中位數(shù)所在組的下限值。 n1為中位數(shù)所在組內(nèi)為中位數(shù)所在組內(nèi)達(dá)到中位數(shù)所需達(dá)到中位數(shù)所需觀測(cè)值個(gè)觀測(cè)值個(gè)數(shù)數(shù)(頻數(shù))(頻數(shù)) 。 n 2為中位數(shù)所在組內(nèi)為中位數(shù)所在組內(nèi)觀測(cè)值總觀測(cè)值總個(gè)數(shù)
30、(頻數(shù))個(gè)數(shù)(頻數(shù)) 。 h 為該中位數(shù)所在組為該中位數(shù)所在組的的組距。組距。 對(duì)于分組數(shù)據(jù),由于看不到原始數(shù)據(jù),定義中位數(shù)的原理是,先確定中位數(shù)落對(duì)于分組數(shù)據(jù),由于看不到原始數(shù)據(jù),定義中位數(shù)的原理是,先確定中位數(shù)落在哪個(gè)組,然后計(jì)算在哪個(gè)組,然后計(jì)算在該組中在該組中達(dá)到中位數(shù)所需的頻數(shù)與該組頻數(shù)的比值,用這達(dá)到中位數(shù)所需的頻數(shù)與該組頻數(shù)的比值,用這個(gè)比值在組距中確定中位數(shù)位置。個(gè)比值在組距中確定中位數(shù)位置。 1.5 中位數(shù)中位數(shù)例例1-8:1987年全國(guó)人口數(shù)年全國(guó)人口數(shù)1%抽樣調(diào)查分組數(shù)據(jù)見表抽樣調(diào)查分組數(shù)據(jù)見表1-6,分布圖如圖,分布圖如圖1-6。表表 1-6 1987 年年 1%抽樣調(diào)
31、查全國(guó)人口數(shù)抽樣調(diào)查全國(guó)人口數(shù) 資料來源: 中國(guó)統(tǒng)計(jì)年鑒資料來源: 中國(guó)統(tǒng)計(jì)年鑒1988,中國(guó)統(tǒng)計(jì)出版社,中國(guó)統(tǒng)計(jì)出版社 組序號(hào)組序號(hào) 年齡年齡分組分組(歲)(歲) 人數(shù)(人數(shù)(人)人) 累計(jì)人數(shù)累計(jì)人數(shù) 1 0 10 以下以下 1 952 781 1 952 781 2 10 20 以下以下 2 481 611 4 434 329 3 20 30 以下以下 1 958 780 6 393 172 4 30 40 以以下下 1 610 804 5 40 50 以下以下 996 183 6 50 60 以下以下 856 192 7 60 70 以下以下 561 877 8 70 80 以下以下
32、273 803 9 80 90 以下以下 65 584 10 90 100 以下以下 3 593 11 100 110 以下以下 99 合計(jì)合計(jì) 10 679 307 0501001502002503000102030405060708090100 110AGEPOPULATION數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)的特點(diǎn)是 0 60 歲之間人口歲之間人口分布不均分布不均勻勻。年輕人人數(shù)多,。年輕人人數(shù)多,中中老老年年人數(shù)人數(shù)相對(duì)較相對(duì)較少。少。人人口的這種年齡分布特征無論對(duì)口的這種年齡分布特征無論對(duì)中國(guó)的中國(guó)的勞動(dòng)力市場(chǎng),還是勞動(dòng)力市場(chǎng),還是已就業(yè)勞動(dòng)力數(shù)都會(huì)造成已就業(yè)勞動(dòng)力數(shù)都會(huì)造成多年多年的連續(xù)的連續(xù)沖擊。
33、經(jīng)計(jì)算沖擊。經(jīng)計(jì)算平均年齡是平均年齡是 28.8 歲。顯然這個(gè)特征數(shù)偏高,不能十分滿意地反映歲。顯然這個(gè)特征數(shù)偏高,不能十分滿意地反映數(shù)據(jù)的特征。數(shù)據(jù)的特征。 計(jì)算中位數(shù)如下。計(jì)算中位數(shù)如下。 中位數(shù)的序數(shù)是中位數(shù)的序數(shù)是 10 679 307/2 = 5 339 654。前兩組的總?cè)藬?shù)是。前兩組的總?cè)藬?shù)是 4 434 329,前前 3 組的總組的總?cè)藬?shù)是人數(shù)是 6 393 172,所以,中位數(shù),所以,中位數(shù) Md 應(yīng)該應(yīng)該落在第落在第 3 組。組。按按式式(1-8) ,下限值) ,下限值 L=20。中。中位數(shù)所在組內(nèi)達(dá)到中位數(shù)所需觀測(cè)位數(shù)所在組內(nèi)達(dá)到中位數(shù)所需觀測(cè)值個(gè)數(shù)值個(gè)數(shù) n1 =533
34、.96535-443.4329= 90.5262(萬人)(萬人) 中位數(shù)所在組內(nèi)觀測(cè)值總個(gè)數(shù)中位數(shù)所在組內(nèi)觀測(cè)值總個(gè)數(shù)n 2= 195.8780 (萬人)(萬人) 。 中位數(shù)所在組的組距中位數(shù)所在組的組距h = 30-20 =10。 Md = 第第 3 組下限組下限值值+(第第 3 組組內(nèi)內(nèi)達(dá)中位數(shù)所需頻數(shù)達(dá)中位數(shù)所需頻數(shù)/第第 3 組頻數(shù))組頻數(shù)) 第第 3 組組組組距距 = 20 +1958780905262 10 = 24.6(歲)(歲) 中位數(shù)中位數(shù) 24.6 (歲)(歲) 比平均數(shù)比平均數(shù) 28.8 (歲)(歲) 更有代表性。更有代表性。 中位數(shù)在本例中的實(shí)際意義是中位數(shù)在本例中的實(shí)際意義是 1987年全國(guó)年全國(guó) 1%抽樣人口中小于抽樣人口中小于 24.6 歲和大于歲和大于 24.6 歲的人口數(shù)各占一半。歲的人口數(shù)各占一半。 中位數(shù)性質(zhì)中位數(shù)性質(zhì)如下如下: (1) 當(dāng)觀測(cè)值出現(xiàn)重復(fù)的現(xiàn)象不很多時(shí), 中位數(shù)意味著比它小的觀測(cè)值個(gè)數(shù)有一半, 比當(dāng)觀測(cè)值出現(xiàn)重復(fù)的現(xiàn)象不很多時(shí), 中位數(shù)意味著比它小的觀測(cè)值個(gè)數(shù)有一半, 比它大的有一半。若有它大的有一半。若有 2 萬農(nóng)戶的年家庭收入萬農(nóng)戶的年家庭收入額額的中位數(shù)為的中位數(shù)為 2 000 元,則知有一萬戶收元,則知有一萬戶收入低于入低于 2 000 元,有一萬戶收入高于元,有一萬戶收入高于 2 000 元。元。 (2) 一組數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版代理記賬協(xié)議
- 二零二五版航空旅客運(yùn)輸合同
- 二零二五版人力資源聘用合同范例
- 會(huì)務(wù)服務(wù)合同模板
- 二零二五版酒店公司股權(quán)轉(zhuǎn)讓合同
- 紹興市直事業(yè)單位招聘真題2024
- 廠里安全培訓(xùn)試題(一套)
- 新入職工入職安全培訓(xùn)考試題(下載)
- 物流中心代建合同協(xié)議書模板
- 醫(yī)療衛(wèi)生監(jiān)督委員會(huì)工作職責(zé)
- 商戶外擺合作協(xié)議
- 中小學(xué)落實(shí)每天體育2小時(shí)開展情況校長(zhǎng)匯報(bào)發(fā)言:從政策到行動(dòng)如何讓學(xué)生體育兩小時(shí)落地生花
- 第6課-做個(gè)胸卡送老人-(課件)
- 2024年河北建投集團(tuán)招聘工作人員考試真題
- 公司文員面試試題及答案
- 大壩固結(jié)灌漿與帷幕灌漿施工方案
- 2024-2025學(xué)年江蘇省常州市高一上學(xué)期期末統(tǒng)考英語試卷
- 2025年湖北省八市高三(3月)聯(lián)考物理試卷(含答案詳解)
- 統(tǒng)編版語文四年級(jí)下冊(cè) 第四單元 習(xí)作:《我的動(dòng)物朋友》課件
- 對(duì)標(biāo)一流-2025年國(guó)央企風(fēng)控合規(guī)案例白皮書
- 中央2025年中央宣傳部直屬單位招聘78人筆試歷年參考題庫(kù)附帶答案詳解
評(píng)論
0/150
提交評(píng)論