《統(tǒng)計學(第二版)》電子課件-第2章-數(shù)據(jù)的描述_第1頁
《統(tǒng)計學(第二版)》電子課件-第2章-數(shù)據(jù)的描述_第2頁
《統(tǒng)計學(第二版)》電子課件-第2章-數(shù)據(jù)的描述_第3頁
《統(tǒng)計學(第二版)》電子課件-第2章-數(shù)據(jù)的描述_第4頁
《統(tǒng)計學(第二版)》電子課件-第2章-數(shù)據(jù)的描述_第5頁
已閱讀5頁,還剩149頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學主編:費宇,石磊(第二版)2/26/20251《統(tǒng)計學》第2章數(shù)據(jù)的描述第2章數(shù)據(jù)的描述2.1數(shù)據(jù)的計量與分類2.2數(shù)據(jù)的收集2.3數(shù)據(jù)的整理2.4集中趨勢的度量2.5離散程度的度量2.6分布偏態(tài)與峰度2.7統(tǒng)計表2/26/20252《統(tǒng)計學》第2章數(shù)據(jù)的描述【引例2.0】統(tǒng)計數(shù)據(jù)2009年7月9日隨機抽查了某大學50名任課教師的年齡,原始數(shù)據(jù)(周歲)如下:3339452724353044524745424046684847463960464751295947295043293530293433456446446730272944533155414347

這一大堆數(shù)據(jù)可能使你眼花繚亂,也許你并不能夠一下就記住所有數(shù)據(jù)。

假如我們感興趣的是教師年齡的分布,那么,你認為對上述數(shù)據(jù)應(yīng)該怎樣分組才能顯示教師年齡的分布特征?教師年齡的集中趨勢如何?離散程度怎樣?分布的偏態(tài)及峰度又應(yīng)該如何測定呢?

2/26/20253《統(tǒng)計學》第2章數(shù)據(jù)的描述

數(shù)據(jù)的計量與分類

數(shù)據(jù)的計量尺度數(shù)據(jù)的類型2/26/20254《統(tǒng)計學》第2章數(shù)據(jù)的描述按照對現(xiàn)象計量程度的不同,可以將數(shù)據(jù)計量尺度分為四種,即:定類尺度、定序尺度、定距尺度、定比尺度。定類尺度(nominalscale)也稱類別尺度或列名尺度,它是把事物按屬性或類別分組。其計量的結(jié)果只是表現(xiàn)為某種類別,而對各類間的其它差別卻無法測度。例如:人口按性別分為男、女兩組。數(shù)據(jù)的計量尺度

2/26/20255《統(tǒng)計學》第2章數(shù)據(jù)的描述定序尺度定序尺度(ordinalscale)也叫順序尺度,它是對事物之間等級差或順序差別的測度,具有定類尺度的所有性能。例如:學生的考試成績分為優(yōu)、良、中、及格、不及格五組。2/26/20256《統(tǒng)計學》第2章數(shù)據(jù)的描述定距尺度(intervalscale)(也叫間隔尺度),是對事物間的類別或次序間的間距的測度,其計量結(jié)果表現(xiàn)為數(shù)值。

例如:三名學生考試成績分別為60分、80分、90分。定距尺度2/26/20257《統(tǒng)計學》第2章數(shù)據(jù)的描述定比尺度定比尺度(ratioscale)(也叫比率尺度),它與定距尺度屬于同一層次,其計量結(jié)果也表現(xiàn)為數(shù)值。

例如:3個工人的月收入分別為2000元、3000元、4000元。2/26/20258《統(tǒng)計學》第2章數(shù)據(jù)的描述四種尺度計量結(jié)果,形成三種數(shù)據(jù):分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。分類數(shù)據(jù)(categoricaldata)——是定類尺度對現(xiàn)象計量的結(jié)果。例如人口按性別分類,則“男”、“女”即為分類數(shù)據(jù)。數(shù)據(jù)的類型2/26/20259《統(tǒng)計學》第2章數(shù)據(jù)的描述順序數(shù)據(jù)順序數(shù)據(jù)(rankdata)——是定序尺度對現(xiàn)象計量的結(jié)果。例如:人口按受教育程度分為“小學”、“初中”、“高中”、“大學及以上”組,則這里的“小學”、“初中”、“高中”、“大學及以上”即為順序數(shù)據(jù)。分類數(shù)據(jù)和順序數(shù)據(jù)合稱為定性數(shù)據(jù)。2/26/202510《統(tǒng)計學》第2章數(shù)據(jù)的描述數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù)(metricdata)——是定距尺度和定比尺度對現(xiàn)象計量結(jié)果。例如學生的考試成績70分、工人的月收入2000元均為數(shù)值型數(shù)據(jù)。數(shù)值型數(shù)據(jù)通常稱為定量數(shù)據(jù)。2/26/202511《統(tǒng)計學》第2章數(shù)據(jù)的描述問題討論前面例子中涉及的“性別”、“經(jīng)濟類型”、“受教育水平”、“考試成績”、“月收入”能看作數(shù)據(jù)嗎?如果它們不能看作數(shù)據(jù),那么應(yīng)該怎樣正確理解這些概念?2/26/202512《統(tǒng)計學》第2章數(shù)據(jù)的描述數(shù)據(jù)的收集2.2.1數(shù)據(jù)的間接來源2.2.2數(shù)據(jù)的直接來源2/26/202513《統(tǒng)計學》第2章數(shù)據(jù)的描述2.2.1數(shù)據(jù)的間接來源間接來源的數(shù)據(jù)我們稱之為第二手數(shù)據(jù)??蓮母鞣N公開出版物(如統(tǒng)計年鑒等)、報紙、雜志、圖書、網(wǎng)絡(luò)、新聞媒體等獲取。2/26/202514《統(tǒng)計學》第2章數(shù)據(jù)的描述2.2.2數(shù)據(jù)的直接來源直接來源的數(shù)據(jù)我們稱為第一手數(shù)據(jù),主要依賴統(tǒng)計調(diào)查得到。2/26/202515《統(tǒng)計學》第2章數(shù)據(jù)的描述統(tǒng)計調(diào)查的分類統(tǒng)計調(diào)查按調(diào)查對象所包括的范圍不同,分為全面調(diào)查與非全面調(diào)查。統(tǒng)計調(diào)查按登記事物的連續(xù)性不同,分為經(jīng)常性調(diào)查和一次性調(diào)查。統(tǒng)計調(diào)查還可按組織方式不同分為統(tǒng)計報表和專門調(diào)查(專門包括普查、抽樣調(diào)查、重點調(diào)查、典型調(diào)查)2/26/202516《統(tǒng)計學》第2章數(shù)據(jù)的描述常用的統(tǒng)計調(diào)查方式統(tǒng)計報表(statisticalreportforms)是按照國家有關(guān)法規(guī)的規(guī)定,自上而下地統(tǒng)一布置,自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)的一種調(diào)查方式。統(tǒng)計報表目前是一種搜集數(shù)據(jù)的重要方式,但已不是主要方式。2/26/202517《統(tǒng)計學》第2章數(shù)據(jù)的描述普查普查(census):是為特定目的而專門組織的一次性全面調(diào)查。普查所搜集的是那種經(jīng)常的、定期的統(tǒng)計報表所不能提供的更為詳細的資料,主要是表明現(xiàn)象在某一時點上的情況,時間性要求很強。2/26/202518《統(tǒng)計學》第2章數(shù)據(jù)的描述普查的特點(1)需要規(guī)定統(tǒng)一的標準時間(資料所屬時間),以避免調(diào)查數(shù)據(jù)的重復(fù)或遺漏;(2)通常是一次性或周期性的;(3)普查的數(shù)據(jù)一般較為準確,規(guī)范化程度較高;(4)普查適用的對象比較狹窄,只能調(diào)查一些最基本、最一般及特定的現(xiàn)象。2/26/202519《統(tǒng)計學》第2章數(shù)據(jù)的描述抽樣調(diào)查抽樣調(diào)查(samplingsurvey):是從研究對象的總體中隨機抽取一部分個體作為樣本進行調(diào)查,并根據(jù)調(diào)查結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查方法。抽樣調(diào)查的特點:經(jīng)濟性好、實效性強、適應(yīng)面廣、準確性高。2/26/202520《統(tǒng)計學》第2章數(shù)據(jù)的描述2.3數(shù)據(jù)的整理2.3.1分類數(shù)據(jù)和順序數(shù)據(jù)的整理2.3.2數(shù)值型數(shù)據(jù)的整理2/26/202521《統(tǒng)計學》第2章數(shù)據(jù)的描述分類數(shù)據(jù)和順序數(shù)據(jù)的整理對分類數(shù)據(jù)和順序數(shù)據(jù),我們可以計算出每一類別出現(xiàn)的頻數(shù)或頻率,通過頻數(shù)分布表和圖形來展示。2/26/202522《統(tǒng)計學》第2章數(shù)據(jù)的描述1.用頻數(shù)分布表展示分類數(shù)據(jù)

和順序數(shù)據(jù)用表格的形式將分類數(shù)據(jù)或順序數(shù)據(jù)各分組極其相應(yīng)的頻(次)數(shù)全部羅列出來,就是頻數(shù)分布表(或次數(shù)分布表)。分布在各組的單位數(shù)稱為頻數(shù)(frequency),也叫次數(shù),各組次數(shù)與總次數(shù)之比稱為頻率,也叫比重(例)(proportion)。一組資料中,各組頻率之和等于100%(或1)。2/26/202523《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.1】

——頻數(shù)分布表的編制(數(shù)據(jù)文件為)對某高校經(jīng)濟系30名教師性別及職稱登記結(jié)果,如表所示,試用SPSS分別編制教師性別及職稱的頻數(shù)分布表。2/26/202524《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.1】

——頻數(shù)分布表的編制表2.1某高校30名教師性別及職稱情況統(tǒng)計表序號性別職稱序號性別職稱序號性別職稱1男講師11男教授21男副教授2女助教12女副教授22女副教授3女副教授13女副教授23男講師4女副教授14男講師24女助教5男助教15男講師25男副教授6男教授16男副教授26男講師7女教授17女講師27女教授8男講師18男助教28男講師9女副教授19女副教授29男副教授10男教授20女副教授30女教授原始數(shù)據(jù):2/26/202525《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.1】

——頻數(shù)分布表的編制解:首先將教師性別用代碼0、1表示;將教師職稱用代碼2、3、4、5表示,然后在數(shù)據(jù)文件的“變量視圖”窗口“值”欄定義變量值標簽::0表示女性,1表示男性;2表示助教,3表示講師,4表示副教授,5表示教授。2/26/202526《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.1】

——頻數(shù)分布表的編制SPSS操作步驟:打開數(shù)據(jù)文件,點擊“分析”→“描述統(tǒng)計”→“頻率”→將“性別”與“職稱”選入“變量(V)”框→點擊“確定”,可得表及表。2/26/202527《統(tǒng)計學》第2章數(shù)據(jù)的描述2/26/2025《統(tǒng)計學實驗》第2章數(shù)據(jù)的描述2-28表某高校30名教師性別分組頻數(shù)分布表表2.3某高校30名教師職稱分組頻數(shù)分布表性別頻率百分比有效百分比累積百分比有效女1446.746.746.7男1653.353.3100.0合計30100.0100.0職稱頻率百分比有效百分比累積百分比有效助教413.313.313.3講師826.726.740.0副教授1240.040.080.0教授620.020.0100.0合計30100.0100.02/26/202528《統(tǒng)計學》第2章數(shù)據(jù)的描述2.用圖形展示分類數(shù)據(jù)

和順序數(shù)據(jù)適合分類數(shù)據(jù)和順序數(shù)據(jù)的圖形有條形圖、餅圖等。條形圖:是用條形高度來表示數(shù)據(jù)多少的圖形。餅圖:又稱圓圖,它是以整個圓代表總體,按總體各部分占總體比重的大小將圓面積分割成若干扇形,從而用圓內(nèi)扇形面積來直觀反映各部分在總體中的比例。2/26/202529《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.2】

——條形圖的繪制解:打開數(shù)據(jù)文件example2.1.sav;選擇“圖形”→點擊“舊對話框(L)”→“條形圖(B)”→“簡單箱圖”→在“圖表中的數(shù)據(jù)為”中選“個案組摘要(G)→點擊“定義”→在“條的表征”中選“個案數(shù)(N)”→將“職稱”選入“類別軸()”(即橫軸)→點擊“確定”,可得圖。(數(shù)據(jù)文件為)根據(jù)表資料,用SPSS繪制條形圖。

2/26/202530《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.2】

——條形圖的繪制圖2.130名教師職稱分布條形圖2/26/202531《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.3】

——餅圖的繪制(數(shù)據(jù)文件為)根據(jù)表資料,用SPSS繪制餅圖。解:打開數(shù)據(jù)文件example2.1.sav;選擇→“圖形”→點擊“舊對話框(L)”→“餅圖(E)”→在“圖表中的數(shù)據(jù)為”中選“個案組摘要(G)→點擊“定義”→在“分區(qū)的表征”中選中“個案數(shù)(N)”→將“職稱”選入“定義分區(qū)(B)”→點擊“確定”,可得圖。2/26/202532《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.3】

——餅圖的繪制

圖2.230名教師職稱分布餅圖2/26/202533《統(tǒng)計學》第2章數(shù)據(jù)的描述2.3.2數(shù)值型數(shù)據(jù)的整理用頻數(shù)分布表(變量數(shù)列)展示數(shù)值型數(shù)據(jù)用圖示展示數(shù)值型數(shù)據(jù)頻數(shù)分布的類型2/26/202534《統(tǒng)計學》第2章數(shù)據(jù)的描述(變量數(shù)列)展示

數(shù)值型數(shù)據(jù)將數(shù)值型數(shù)據(jù)進行統(tǒng)計分組,就可以形成頻數(shù)分布表(變量數(shù)列)。制作頻數(shù)分布表時可用單變量值分組,也可用組距分組。單變量值分組通常適用于離散變量,且變量值變動幅度不大時;組距分組通常適用于變量值較多、且變動范圍較大的離散型或連續(xù)型變量。2/26/202535《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.4】

——單變量值分組

某班學生按年齡(周歲)分組的結(jié)果如表所示:

表2.4某班學生按年齡(周歲)分組情況表按年齡分組(周歲)學生人數(shù)(人)比重(%)181920212236127210.0020.0040.0023.336.67合計30100.002/26/202536《統(tǒng)計學》第2章數(shù)據(jù)的描述組距分組中的幾個基本概念組限:每個組兩端的數(shù)值。分為上限和下限。組距:一個組的上限與下限兩端的距離。全距:所有變量值中最大值與最小值之差。組中值:每個組的上限與下限的中點值。2/26/202537《統(tǒng)計學》第2章數(shù)據(jù)的描述組距分組的步驟第一,確定組數(shù)。

可以按斯特格斯的經(jīng)驗公式確定組數(shù):

第二,確定各組的組距。

實際中先確定組數(shù)或先確定組距均可:

第三,整理成頻數(shù)分布表。2/26/202538《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.5】

——組距分組

2009年7月9日隨機抽查了某大學50名任課教師的年齡,原始數(shù)據(jù)(周歲)如下:3339452724353044524745424046684847463960464751295947295043293530293433456446446730272944533155414347試對數(shù)據(jù)進行組距分組。

2/26/202539《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.5】

——組距分組解:此處采用先確定組距的方式。根據(jù)本例的數(shù)據(jù)水平及全距大小,組距擬定為10。確定組數(shù):組數(shù)=全距/組距=(68-24)÷10=4.4

5(組)對原始數(shù)據(jù)分組,整理成頻數(shù)分布表如表所示:2/26/202540《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.5】

——組距分組分組結(jié)果:表2.550名教師年齡分組頻數(shù)分布表按年齡分組(周歲)人數(shù)(人)比重(%)20~3030~4040~5050~6060~708112164162242128合計501002/26/202541《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.5】

——組距分組本例還可采用間斷式組距形式分組,如表所示:表2.650名教師年齡分組頻數(shù)分布表按年齡分組(周歲)人數(shù)(人)比重(%)20~2930~3940~4950~5960~698112164162242128合計501002/26/202542《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.5】

——組距分組本例還可采用開口組形式分組,如表所示:表2.750名教師年齡分組頻數(shù)分布表按年齡分組(周歲)人數(shù)(人)比重(%)30以下30~4040~5050~6060以上8112164162242128合計501002/26/202543《統(tǒng)計學》第2章數(shù)據(jù)的描述累計次數(shù)與累計頻率有時為了研究次數(shù)分布的狀況,需要計算累計次數(shù)或累計頻率,方法有兩種:向上累計(積),也稱較小制累計(積)或以下累計(積),即把各組次數(shù)或頻率由變量值小的組向變量值大的組順序逐組累計(積),截至各組的累計(積)次數(shù)或累計(積)頻率表示小于該組變量值上限的次數(shù)或頻率合計有多少。2/26/202544《統(tǒng)計學》第2章數(shù)據(jù)的描述累計次數(shù)與累計頻率向下累計(積),也稱較大制累計(積)或以上累計(積),即把各組次數(shù)或頻率由變量值大的組向變量值小的組順序逐組累計(積),截至各組的累計(積)次數(shù)或累計(積)頻率表示大于該組變量值下限的次數(shù)或頻率合計有多少。2/26/202545《統(tǒng)計學》第2章數(shù)據(jù)的描述累計次數(shù)與累計頻率如對表計算累計次數(shù)或累計頻率,可得累計頻數(shù)(頻率)分布表如表所示:表2.850名教師年齡分組累計頻數(shù)(頻率)分布表按年齡分組(周歲)頻數(shù)(人)頻率(%)向上累計向下累計頻數(shù)(人)頻率(%)頻數(shù)(人)頻率(%)20~3030~4040~5050~6060~708112164162242128819404650163880921005042311041008462208合計50100————2/26/202546《統(tǒng)計學》第2章數(shù)據(jù)的描述【例】

——SPSS制作頻數(shù)分布表(數(shù)據(jù)文件為)2014年我國各地區(qū)農(nóng)村居民家庭人均純收入資料如表所示,試用SPSS制作頻數(shù)分布表。2/26/202547《統(tǒng)計學》第2章數(shù)據(jù)的描述【例】

——SPSS制作頻數(shù)分布表表2.92014年我國各地區(qū)農(nóng)村居民家庭人均純收入地區(qū)人均純收入(元)地區(qū)人均純收入(元)北京18867.3湖北10849.1天津17014.2湖南10060.2河北10186.1廣東12245.6山西8809.4廣西8683.2內(nèi)蒙古9976.3海南9912.6遼寧11191.5重慶9489.8吉林10780.1四川9347.7黑龍江10453.2貴州6671.2上海21191.6云南7456.1江蘇14958.4西藏2359.2浙江19373.3陜西7932.2安徽9916.4甘肅6276.6福建12650.2青海7282.7江西10116.6寧夏8410.0山東11882.3新疆8723.8河南9966.1——2/26/202548《統(tǒng)計學》第2章數(shù)據(jù)的描述【例】

——SPSS制作頻數(shù)分布表解:首先將農(nóng)村居民家庭人均純收入用代碼1、2、3、4、5表示,然后在數(shù)據(jù)文件的“變量視圖”窗口“值”欄定義變量值標簽,1表示人均純收入在3000元以下(不含3000元),2表示人均純收入在3000~4000元(不含4000元),3表示人均純收入在4000~5000元(不含5000元),4表示人均純收入在5000~6000元(不含6000元),5表示人均純收入在6000元以上(含6000元)。2/26/202549《統(tǒng)計學》第2章數(shù)據(jù)的描述2/26/2025《統(tǒng)計學實驗》第2章數(shù)據(jù)的描述2-50【菜單方式】打開數(shù)據(jù)文件example2.3.sav;選擇→“分析”→點擊“描述統(tǒng)計”→“頻率”→將“分組代碼”選入“變量(V)”框→點擊“確定”,可得表。2/26/202550《統(tǒng)計學》第2章數(shù)據(jù)的描述【例】

——SPSS制作頻數(shù)分布表表2.102014年我國各地區(qū)農(nóng)村居民家庭人均純收入的頻數(shù)分布表分組代碼頻率百分比有效百分比累積百分比有效5000元以下(不含5000)13.23.23.25000元-10000元(不含10000元)1548.448.451.610000元-15000元(不含15000元)1135.535.587.115000元-20000元(不含20000元)39.79.796.820000元以上(含20000元)13.23.2100.0合計31100.0100.02/26/202551《統(tǒng)計學》第2章數(shù)據(jù)的描述適合數(shù)值型數(shù)據(jù)的圖形有:直方圖(histogram)箱線圖(boxplots)線圖(linecharts)莖葉圖(stem-and-leafdisplay)…………2/26/202552《統(tǒng)計學》第2章數(shù)據(jù)的描述直方圖直方圖(histogram)是用矩形的寬度和高度來表示頻數(shù)分布的圖形。若是等距數(shù)列,一般用橫坐標表示數(shù)據(jù)分組,而縱坐標表示次數(shù)或頻數(shù);若是不等距數(shù)列,則應(yīng)按頻數(shù)密度繪制直方圖。2/26/202553《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.7】

——直方圖沿用【例2.5】教師年齡原始數(shù)據(jù),用SPSS繪制直方圖。2/26/2025《統(tǒng)計學實驗》第2章數(shù)據(jù)的描述2-54解:打開數(shù)據(jù)文件example2.0.sav;選擇“圖形”→點擊“舊對話框(L)”→“直方圖(I)”→將“教師年齡”選入“變量(V)”框→勾選“顯示正態(tài)曲線(D)”→點擊“確定”,可得圖。2/26/202554《統(tǒng)計學》第2章數(shù)據(jù)的描述圖2.3某大學50名教師年齡直方圖2/26/202555《統(tǒng)計學》第2章數(shù)據(jù)的描述箱線圖箱線圖(boxplots)是用一組數(shù)據(jù)的五個特征值即最大值、最小值、中位數(shù)、上四分位數(shù)、下四分位數(shù)來表示頻數(shù)分布狀況的圖形,它由一個箱子和兩條線段組成。每個箱子的中間橫線是數(shù)據(jù)的中位數(shù)。根據(jù)不同資料,可繪制簡單箱線圖或多批箱線圖。2/26/202556《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.8】

——簡單箱線圖沿用【例2.5】教師年齡原始數(shù)據(jù),用SPSS繪制簡單箱線圖。解:打開數(shù)據(jù)文件,點擊“圖形”→“舊對話框(L)”→“箱圖(X)”→在“箱圖”框中選中“簡單”→在“圖表中的數(shù)據(jù)為”框中選中“各個變量的摘要(V)”→點擊“定義”→將“教師年齡”選入“框的表征(B)→單擊“確定”,可得圖。2/26/202557《統(tǒng)計學》第2章數(shù)據(jù)的描述圖2.550位教師年齡箱線圖2/26/202558《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.9】

——多批箱線圖(數(shù)據(jù)文件為

.sav)現(xiàn)有某大學9名大一新生英語、語文、數(shù)學的考試成績?nèi)绫硭?,試繪制多批箱線圖,比較9名學生的各科成績。表2.119名大一新生英語、語文、數(shù)學考試成績學生編號考試成績(分)英語語文數(shù)學123456789706589346678809356568033698587625078675498787080698575合計———2/26/202559《統(tǒng)計學》第2章數(shù)據(jù)的描述解:打開數(shù)據(jù)文件

.sav;選擇“圖形”→點擊“舊對話框(L)”→“箱圖(X)”→在“箱圖”框中選“簡單”→在“圖表中的數(shù)據(jù)為”中選“各個變量的摘要(V)”→點擊“定義”→將“英語”、“語文”、“數(shù)學”選入“框的表征(B)→點擊“確定”,可得圖。

【例2.9】

——多批箱線圖2/26/202560《統(tǒng)計學》第2章數(shù)據(jù)的描述圖2.69名學生各科成績的箱線圖2/26/202561《統(tǒng)計學》第2章數(shù)據(jù)的描述線圖線圖(linecharts)是用線條的延伸和波動來表明現(xiàn)象變動情況的圖形,它主要用于表示現(xiàn)象在不同時間上的變化趨勢。2/26/202562《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.10】

——線圖

(數(shù)據(jù)文件為

.sav)2000~2014年我國農(nóng)村居民人均純收入及城鎮(zhèn)居民人均可支配收入資料如表所示,試用SPSS繪制線圖。表2.122000~2014年我國農(nóng)村居民人均純收入及城鎮(zhèn)居民人均可支配收入時間(年)農(nóng)村居民人均純收入(元)城鎮(zhèn)居民人均可支配收入(元)2000200120022003200420052006200720082009201020112012201320142253.42366.42475.62622.22936.43254.93587.04140.44760.65153.25919.06977.37916.68895.99892.06280.06859.67702.88472.29421.610493.011759.513785.815780.817174.719109.421809.824564.726955.129381.0合計——2/26/202563《統(tǒng)計學》第2章數(shù)據(jù)的描述2/26/2025《統(tǒng)計學實驗》第2章數(shù)據(jù)的描述2-64解:打開數(shù)據(jù)文件example2.5.sav,選擇“圖形”→單擊“舊對話框(L)”→“線圖(L)”→在“線圖”框中選中“多線線圖”→在“圖表中的數(shù)據(jù)為”框中選中“各個變量的摘要(V)”→點擊“定義”→將“農(nóng)村居民人均純收入”及“城鎮(zhèn)居民人均可支配收入”選入“線的表征(I)”框中→將“年份”選入“類別軸(X)“→點擊”確定“,可得圖?!纠?.10】

——線圖2/26/202564《統(tǒng)計學》第2章數(shù)據(jù)的描述圖2.72000~2014年我國農(nóng)村居民人均純收入及城鎮(zhèn)居民人均可支配收入線圖2/26/202565《統(tǒng)計學》第2章數(shù)據(jù)的描述莖葉圖莖葉圖(stem-and-leafdisplay)又稱“枝葉圖”,它是將數(shù)組中變化不大的高位數(shù)作為一個主干(莖),將變化大的低位數(shù)作為分枝(葉),列在主干的后面,來表示頻數(shù)分布的。莖葉圖與直方圖相類似,但又與直方圖不同。莖葉圖保留了原始資料的信息,而直方圖則無原始資料的信息。2/26/202566《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.11】

——莖葉圖根據(jù)【例2.5】某大學50名教師年齡原始數(shù)據(jù)繪制的莖葉圖如圖所示:樹莖樹葉數(shù)據(jù)個數(shù)23456477999990001334559901233444555666677777801235904788112164圖2.8某大學50名教師年齡莖葉圖2/26/202567《統(tǒng)計學》第2章數(shù)據(jù)的描述如果莖葉圖顯得過于擁擠,還可以把它擴展,將每個數(shù)莖分成兩段,尾數(shù)0~4的在數(shù)莖后以“*”表示;尾數(shù)5~9的在數(shù)莖后以“·”表示。如將圖擴展后,便形成如圖所示的擴展的莖葉圖:圖2.9某大學50名教師年齡擴展的莖葉圖樹莖樹葉數(shù)據(jù)個數(shù)2*2·3*3·4*4·5*5·6*6·47799999000133455990123344455566667777780123590478177481342222/26/202568《統(tǒng)計學》第2章數(shù)據(jù)的描述2/26/2025《統(tǒng)計學實驗》第2章數(shù)據(jù)的描述2-69SPSS繪制莖葉圖打開數(shù)據(jù)文件example2.0.sav,選擇“分析(A)”→點擊“描述統(tǒng)計”→“探索(E)”→將“教師年齡”選入“因變量列表(D)”→在“輸出”框中勾選“圖”→點擊“確定”,可得圖。2/26/202569《統(tǒng)計學》第2章數(shù)據(jù)的描述圖2.10某大學50名教師年齡的莖葉圖2/26/2025《統(tǒng)計學實驗》第2章數(shù)據(jù)的描述2-70教師年齡(周歲)Stem-and-LeafPlotFrequencyStem&Leaf1.002.47.002.77999997.003.00013344.003.55998.004.0123344413.004.55566667777784.005.01232.005.592.006.042.006.78Stemwidth:10Eachleaf:1case(s)2/26/202570《統(tǒng)計學》第2章數(shù)據(jù)的描述常見的頻數(shù)分布類型主要有鐘形分布、J形分布和U形分布,如圖所示:

圖2.11幾種常見的頻數(shù)分布(a)正態(tài)分布(b)右偏分布(c)左偏分布(d)正J形分布(e)反J形分布(f)U形分布2/26/202571《統(tǒng)計學》第2章數(shù)據(jù)的描述鐘形分布鐘形分布的特點是靠近中間的變量值分布的次數(shù)多,靠近兩端的變量值分布的次數(shù)少,即“兩頭小、中間大”。鐘形分布又分正態(tài)分布、右偏分布和左偏分布,如圖所示:圖2.12鐘形分布(a)正態(tài)分布(b)右偏分布(c)左偏分布2/26/202572《統(tǒng)計學》第2章數(shù)據(jù)的描述J形分布及U形分布J形分布其分布圖象像英文字母“J”字,包括正J形分布和反J形分布兩種類型。U形分布的特點是靠近中間的變量值分布的次數(shù)少,靠近兩端的變量值分布的次數(shù)多,即“兩頭大、中間小”。(d)正J形分布(e)反J形分布(f)U形分布圖2.13J形分布與U形分布2/26/202573《統(tǒng)計學》第2章數(shù)據(jù)的描述集中趨勢的度量均值幾何平均數(shù)調(diào)和平均數(shù)眾數(shù)中位數(shù)四分位數(shù)眾數(shù)、中位數(shù)和均值的比較2/26/202574《統(tǒng)計學》第2章數(shù)據(jù)的描述均值均值(mean)是全部數(shù)據(jù)的算術(shù)平均,也稱算術(shù)平均數(shù)。均值在統(tǒng)計分析中具有重要的地位,是集中趨勢的最主要測度值。根據(jù)掌握的資料不同,均值有簡單均值與加權(quán)均值兩種計算形式。

2/26/202575《統(tǒng)計學》第2章數(shù)據(jù)的描述簡單均值適用于未分組數(shù)據(jù)。計算公式:2/26/202576《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.12】

——簡單均值沿用【例2.5】中某大學50名任課教師年齡的原始數(shù)據(jù)(周歲):

3339452724353044524745424046684847463960464751295947295043293530293433456446446730272944533155414347

則教師的平均年齡為:2/26/202577《統(tǒng)計學》第2章數(shù)據(jù)的描述加權(quán)均值適用于分組數(shù)據(jù)。計算公式:2/26/202578《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.13】

——加權(quán)均值沿用“表2.5”教師年齡分組后的頻數(shù)分布表資料,求教師的平均年齡。解:首先列計算表如表所示:按年齡分(周歲)組中值人數(shù)(人)比重(%)組中值×人數(shù)20~3030~4040~5050~6060~7025354555658112164162242128200385945330260合計—501002120表2.1350名教師的平均年齡計算表2/26/202579《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.13】

——加權(quán)均值表中的數(shù)據(jù)代入公式,計算得教師的平均年齡為:2/26/202580《統(tǒng)計學》第2章數(shù)據(jù)的描述問題討論【例2.12】及【例2.13】的計算結(jié)果出現(xiàn)了偏差,哪一例計算結(jié)果是教師的實際平均年齡?加權(quán)均值大小受什么因素影響?加權(quán)均值中權(quán)數(shù)的實質(zhì)內(nèi)容是什么?2/26/202581《統(tǒng)計學》第2章數(shù)據(jù)的描述關(guān)于權(quán)數(shù)的進一步討論加權(quán)均值中的權(quán)數(shù)還可以表現(xiàn)為相對數(shù)的形式,從而均值計算公式可變形為:以表資料為例,教師的平均年齡為:2/26/202582《統(tǒng)計學》第2章數(shù)據(jù)的描述均值的數(shù)學性質(zhì)各變量值與均值的離差之和等于零各變量值與均值的離差平方和最小2/26/202583《統(tǒng)計學》第2章數(shù)據(jù)的描述幾何平均數(shù)幾何平均數(shù)(geometricmean)是個變量值乘積的次方根,記作。適用范圍:變量值本身是比率(速度),而且各比率(速度)的乘積等于總的比率(速度),需計算平均比率或平均速度時使用。根據(jù)資料不同,幾何平均數(shù)有簡單幾何平均數(shù)與加權(quán)幾何平均數(shù)兩種計算形式。2/26/202584《統(tǒng)計學》第2章數(shù)據(jù)的描述幾何平均數(shù)計算公式簡單幾何平均數(shù)加權(quán)幾何平均數(shù)式中:2/26/202585《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.14】

——簡單幾何平均數(shù)某企業(yè)某種產(chǎn)品須經(jīng)過4個車間的流水作業(yè)才能完成,如果第一車間的產(chǎn)品合格率為90%,第二車間的產(chǎn)品合格率為97%,第三車間的產(chǎn)品合格率為95%,第四車間的產(chǎn)品合格率為98%。求平均合格率。解:各車間平均合格率為:2/26/202586《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.15】

——加權(quán)幾何平均數(shù)某種產(chǎn)品的生產(chǎn)須經(jīng)過10道工序的流水作業(yè)才能完成,有2道工序的合格率都為90%,有3道工序的合格率都為92%,有4道工序的合格率都為94%,有1道工序的合格率為98%。求平均合格率。解:各工序平均合格率為:

2/26/202587《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.16】

——加權(quán)幾何平均數(shù)某筆投資的年利率資料如表所示:表2.14某筆投資的年利率資料年利率(%)年數(shù)2457813642已知年利率按復(fù)利計算。要求:求該筆投資的平均年利率。2/26/202588《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.16】

——加權(quán)幾何平均數(shù)解:平均年利率=平均年本利率-12/26/202589《統(tǒng)計學》第2章數(shù)據(jù)的描述調(diào)和平均數(shù)調(diào)和平均數(shù)也稱“倒數(shù)平均數(shù)”,它是對變量值的倒數(shù)求算術(shù)平均,然后再取倒數(shù)而得的平均數(shù),記作。根據(jù)資料不同,分為簡單調(diào)和平均與加加權(quán)調(diào)和平均兩種計算形式。

2/26/202590《統(tǒng)計學》第2章數(shù)據(jù)的描述簡單調(diào)和平均數(shù)計算公式:式中:2/26/202591《統(tǒng)計學》第2章數(shù)據(jù)的描述加權(quán)調(diào)和平均數(shù)計算公式式中:2/26/202592《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.17】

——簡單調(diào)和平均數(shù)菜場上有一種蔬菜,價格分別為:早市元/公斤;午市2元/公斤;晚市1元/公斤。若早、中、晚各花1元錢買蔬菜,則一天中買到蔬菜的平均價格為:2/26/202593《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.18】

——加權(quán)調(diào)和平均數(shù)沿用【例】資料,若早、中、晚分別花元、4元和1元錢買蔬菜,則一天中買到蔬菜的平均價格為:2/26/202594《統(tǒng)計學》第2章數(shù)據(jù)的描述問題討論簡單調(diào)和平均數(shù)是否有獨立應(yīng)用的意義?加權(quán)調(diào)和平均數(shù)與加權(quán)算術(shù)平均數(shù)之間有何聯(lián)系?2/26/202595《統(tǒng)計學》第2章數(shù)據(jù)的描述眾數(shù)眾數(shù)(mode)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個變量值。記為。對于未分組數(shù)據(jù)或單變量值分組數(shù)據(jù),可直接尋找眾數(shù)。對于組距分組數(shù)據(jù),則需推算眾數(shù)的近似值。2/26/202596《統(tǒng)計學》第2章數(shù)據(jù)的描述未分組數(shù)據(jù)求眾數(shù)例如數(shù)據(jù)集2,5,4,5,5,6,5,7,8,5中,眾數(shù)為5,5大體上可代表這組數(shù)據(jù)的平均水平。2/26/202597《統(tǒng)計學》第2章數(shù)據(jù)的描述組距數(shù)列求眾數(shù)對于組距分組數(shù)據(jù),可用比例插值法推算眾數(shù)的近似值:

式中:2/26/202598《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.19】

——組距數(shù)列求眾數(shù)沿用表教師年齡的分組資料,求教師年齡的眾數(shù)。解:教師年齡的眾數(shù)為:或:2/26/202599《統(tǒng)計學》第2章數(shù)據(jù)的描述眾數(shù)小結(jié)眾數(shù)是一個位置平均數(shù)。眾數(shù)的優(yōu)點是計算簡便、意義明顯,不受極端值的影響。眾數(shù)的缺點:未使用所有變量值計算,因而靈敏度比較低。眾數(shù)通常只適宜于變量數(shù)列的分布次數(shù)比較多,而且具有明顯集中趨勢的總體。2/26/2025100《統(tǒng)計學》第2章數(shù)據(jù)的描述中位數(shù)中位數(shù)(median)是將數(shù)據(jù)從小到大順序排列后,處在最中間位置的那個數(shù)值,記為。中位數(shù)把全部數(shù)據(jù)分成兩半,一半數(shù)據(jù)的值比中位數(shù)大,一半數(shù)據(jù)的值比中位數(shù)小,因此中位數(shù)也可以反映數(shù)據(jù)的平均水平。未分組數(shù)據(jù)和分組數(shù)據(jù)均可計算中位數(shù)。2/26/2025101《統(tǒng)計學》第2章數(shù)據(jù)的描述未分組數(shù)據(jù)求中位數(shù)在資料未分組的情況下,中位數(shù)的位置可由(n+1)/2來確定。例如有5個數(shù)值:4,6,9,10,13,則中位數(shù)的位置=(n+1/2=(5+1)/2=3,即為第3個數(shù)值,。若增加一個數(shù)值,變?yōu)?,6,9,10,13,16,則中位數(shù)的位置=(n+1)/2=(6+1),即為第3個數(shù)值與第4個數(shù)值中間,。2/26/2025102《統(tǒng)計學》第2章數(shù)據(jù)的描述組距數(shù)列求中位數(shù)在組距數(shù)列中求中位數(shù)時,先根據(jù)N/2確定中位數(shù)的位置,找出中位數(shù)所在組,然后用比例插值法計算中位數(shù)的近似值。計算公式:

2/26/2025103《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.20】

——組距數(shù)列求中位數(shù)沿用表教師年齡的分組資料,求教師年齡的中位數(shù)。解:教師年齡的中位數(shù)為:2/26/2025104《統(tǒng)計學》第2章數(shù)據(jù)的描述中位數(shù)小結(jié)中位數(shù)的優(yōu)點也是計算簡便、意義明顯,當數(shù)據(jù)的分布為偏態(tài)時,中位數(shù)不受極端值的影響,它是一個位置代表值(位置平均數(shù)),具有較高的穩(wěn)健性。局限性主要是中位數(shù)不是根據(jù)所有變量值計算出來的,因此它作為一般水平的代表值靈敏度也較差。2/26/2025105《統(tǒng)計學》第2章數(shù)據(jù)的描述四分位數(shù)四分位數(shù)(quartile):將一組數(shù)據(jù)由小到大(或由大到小)排序后,用三個點將全部數(shù)據(jù)分為四等分,每份有25%的數(shù)據(jù),每個點上的數(shù)值稱為四分位數(shù)。處于第50%位置的數(shù)值就是中位數(shù),處于第25%位置的數(shù)值稱為下四分位數(shù),記為,處于第75%位置的數(shù)值稱為上四分位數(shù),記為。未分組數(shù)據(jù)和分組數(shù)據(jù)均可計算四分位數(shù)。2/26/2025106《統(tǒng)計學》第2章數(shù)據(jù)的描述未分組數(shù)據(jù)求四分位數(shù)在資料未分組的情況下,下四分位數(shù)的位置可由(n+1)/4來確定,上四分位數(shù)的位置可由3(n+1)/4來確定。數(shù)據(jù)個數(shù)為奇數(shù)或偶數(shù)兩種情況下均可計算四分位數(shù)。2/26/2025107《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.21】

——未分組資料求四分位數(shù)有9個家庭的人均月收入分別為950、1080、1120、1350、1500、1550、1690、1830、2000元,則可求得下四分位數(shù)的位置在第2個與第3個數(shù)值之間,于是下四分位數(shù)為:上四分位數(shù)的位置在第7個與第8個數(shù)值之間,于是上四分位數(shù)為:

2/26/2025108《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.22】

——未分組資料求四分位數(shù)有10個家庭的人均月收入分別為875、950、1080、1120、1350、1500、1550、1690、1830、2000元,則下四分位數(shù)的位置為:(10+1),偏向第三個數(shù)值,這時下四分位數(shù)為:上四分位數(shù)的位置為:3(10+1),偏向第八個數(shù)值,這時上四分位數(shù)為:

2/26/2025109《統(tǒng)計學》第2章數(shù)據(jù)的描述組距數(shù)列求四分位數(shù)在組距數(shù)列中求四分位數(shù)時,可用以下公式求近似值:2/26/2025110《統(tǒng)計學》第2章數(shù)據(jù)的描述眾數(shù)、中位數(shù)和均值的比較(1)眾數(shù)、中位數(shù)和均值的關(guān)系如果數(shù)據(jù)具有單一眾數(shù),且分布是對稱的,則眾數(shù)、中位數(shù)和均值三者必定相等,三者之間的關(guān)系:2/26/2025111《統(tǒng)計學》第2章數(shù)據(jù)的描述眾數(shù)、中位數(shù)和均值的關(guān)系

如果數(shù)據(jù)是左偏分布,說明數(shù)據(jù)存在極端小值,使均值偏低,三者之間的關(guān)系:如果數(shù)據(jù)是右偏分布,說明數(shù)據(jù)存在極端大值,使均值偏高,三者之間的關(guān)系:需注意的是,如果數(shù)據(jù)具有雙眾數(shù)或多眾數(shù),上述關(guān)系不一定成立。2/26/2025112《統(tǒng)計學》第2章數(shù)據(jù)的描述(2)眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合均值由全部變量值計算而來,因此易受極端值的影響,數(shù)據(jù)出現(xiàn)偏態(tài)時,均值代表性差;眾數(shù)、中位數(shù)則不受極端值的影響。當數(shù)據(jù)呈對稱分布或接近對稱分布時,選擇用均值比較好;當數(shù)據(jù)為偏態(tài)分布時,特別是當偏斜的程度較大時,應(yīng)選擇眾數(shù)或中位數(shù);當數(shù)據(jù)為定距尺度時,如商品(服裝、鞋類)等的規(guī)格,用眾數(shù)是較好的選擇。2/26/2025113《統(tǒng)計學》第2章數(shù)據(jù)的描述離散程度的度量極差四分位差方差和標準差變異系數(shù)2/26/2025114《統(tǒng)計學》第2章數(shù)據(jù)的描述極差極差(rang)又稱極值或全距,它是一組數(shù)據(jù)中最大值減去最小值之差,反映數(shù)據(jù)的最大變動范圍。記為R。

極差的優(yōu)點是計算簡單,易于理解。極差的缺點是指標很粗略,未考慮數(shù)據(jù)分布,易受極端值的影響。2/26/2025115《統(tǒng)計學》第2章數(shù)據(jù)的描述四分位差

四分位差(inter-quartilerang):指一組數(shù)據(jù)中上四分位數(shù)與下四分位數(shù)之差,。計算公式:它反映了中間50%數(shù)據(jù)的離散程度。同時也可反映中位數(shù)對一組數(shù)據(jù)的代表性大小。2/26/2025116《統(tǒng)計學》第2章數(shù)據(jù)的描述四分位差在【例2.21】中:四分位差=1760-1100=660(元),表明有一半家庭的人均月收入在1100~1760之間,它們之間的最大差距為660元。2/26/2025117《統(tǒng)計學》第2章數(shù)據(jù)的描述方差和標準差方差(variance)和標準差(standarddeviation)是用于描述數(shù)值是如何在平均值周圍波動的。一個數(shù)據(jù)集的方差是用諸觀察值與它們平均值之間的偏差有多大來確定的,方差的平方根即是標準差。方差和標準差均可由總體數(shù)據(jù)或樣本數(shù)據(jù)求得。2/26/2025118《統(tǒng)計學》第2章數(shù)據(jù)的描述樣本方差樣本方差計算公式未分組數(shù)據(jù):

分組數(shù)據(jù):

式中:2/26/2025119《統(tǒng)計學》第2章數(shù)據(jù)的描述樣本標準差樣本標準差計算公式未分組數(shù)據(jù):

分組數(shù)據(jù):

式中:2/26/2025120《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.23】

——未分組數(shù)據(jù)求方差求樣本測量值3,7,2,1,8的方差。解:首先求出樣本均值:然后計算方差如下:2/26/2025121《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.24】

——未分組數(shù)據(jù)求標準差試對例中的數(shù)據(jù)求標準差。解:標準差標準差等于,表明數(shù)據(jù)集中的每個數(shù)值與它們的均值相比,平均相差。2/26/2025122《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.25】

——由分組數(shù)據(jù)求方差及標準差沿用表教師年齡資料,求教師年齡的方差和標準差。解:首先列計算表如表所示:表2.1550位教師年齡的方差和標準差計算表按年齡分組(周歲)組中值人數(shù)(人)20~3030~4040~5050~6060~7025354555658112164302.7654.766.76158.76510.762422.08602.36141.96952.562043.04合計—50—6162.002/26/2025123《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.25】

——由分組數(shù)據(jù)求方差及標準差解:根據(jù)表資料,教師年齡的方差和標準差計算如下:結(jié)果表明,每個教師的年齡與他們的平均年齡相比,平均相差歲。2/26/2025124《統(tǒng)計學》第2章數(shù)據(jù)的描述總體方差總體方差計算公式未分組數(shù)據(jù):

分組數(shù)據(jù):

式中:2/26/2025125《統(tǒng)計學》第2章數(shù)據(jù)的描述總體標準差總體標準差計算公式未分組數(shù)據(jù):

分組數(shù)據(jù):

式中:2/26/2025126《統(tǒng)計學》第2章數(shù)據(jù)的描述變異系數(shù)變異系數(shù)(coefficientofvariation)是用來度量數(shù)據(jù)離散程度大小的相對數(shù)。變異系數(shù)通常是就標準差來計算的,稱為標準差系數(shù)。計算公式如下:2/26/2025127《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.26】

——變異系數(shù)【例2.26】2/26/2025128《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.26】

——變異系數(shù)解:由于兩個班的平均成績不相同,所以應(yīng)該用各自的標準差系數(shù)進行比較。2/26/2025129《統(tǒng)計學》第2章數(shù)據(jù)的描述分布偏態(tài)與峰度偏態(tài)及其測定峰度及其測定2/26/2025130《統(tǒng)計學》第2章數(shù)據(jù)的描述偏態(tài)及其測定偏態(tài)(skewness)一詞是由統(tǒng)計學家皮爾遜于1895年首次提出的,它是對數(shù)據(jù)分布偏斜程度的測度。測度偏斜的程度需要計算偏態(tài)系數(shù),記為。判斷標準:2/26/2025131《統(tǒng)計學》第2章數(shù)據(jù)的描述由組距數(shù)列計算偏態(tài)系數(shù)計算公式:式中:2/26/2025132《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.27】

——偏態(tài)系數(shù)

已知2007年我國農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如表所示,試計算偏態(tài)系數(shù)。表2.162007年我國農(nóng)村居民家庭按純收入分組的數(shù)據(jù)按純收入分組(百元)戶數(shù)(戶)10以下10~2020~3030~4040~5050以上299396561337911940912421098合計68190注:本表為我國農(nóng)村居民家庭收入抽樣調(diào)查資料。資料來源:《中國統(tǒng)計年鑒2008》,本表對原始數(shù)據(jù)作了分組整理,抽樣戶數(shù)根據(jù)比重推算得。2/26/2025133《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.27】

——偏態(tài)系數(shù)首先列計算表如表所示:表2.172007年我國農(nóng)村居民家庭純收入偏態(tài)及峰度計算表按純收入分組(百元)組中值戶數(shù)(戶)10以下10~2020~3030~4040~5050以上51525354555299396561337911940912421098-92837889.49-94897693.41-19926084.39-34187.665762980.37135325118.782916966487.662032708592.32227555883.8448546.4849446371.562514340706.35合計—68190-66607755.807741066588.212/26/2025134《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.27】

——偏態(tài)系數(shù)根據(jù)表數(shù)據(jù)計算均值及標準差如下:將上述結(jié)果代入偏態(tài)系數(shù)公式,得2/26/2025135《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.27】

——偏態(tài)系數(shù)由計算結(jié)果可看出,偏態(tài)系數(shù)為負值,但與零的差距不大,說明2007年我國農(nóng)村居民家庭純收入分布為輕微左偏分布,收入較高的家庭占有一定的比例,但偏斜程度不大。2/26/2025136《統(tǒng)計學》第2章數(shù)據(jù)的描述峰度及其測定峰度(kurtosis)一詞是由統(tǒng)計學家皮爾遜于1905年首次提出的,它是對數(shù)據(jù)分布平峰或尖峰程度的測定。對峰度的測度需要計算峰度系數(shù),記為。判斷標準:2/26/2025137《統(tǒng)計學》第2章數(shù)據(jù)的描述由分組數(shù)據(jù)計算峰度系數(shù)計算公式:式中:2/26/2025138《統(tǒng)計學》第2章數(shù)據(jù)的描述【例2.28】

——峰度系數(shù)沿用【例2.27】數(shù)據(jù),計算峰度系數(shù)。解:將表相關(guān)數(shù)據(jù)代入峰度系數(shù)公式,得:峰度系數(shù)為負值,說明2007年我國農(nóng)村居民家庭純收入分布為平峰分布,高收入家庭占一定比例,但高收入?yún)^(qū)域的集中程度并不很高。2/26/2025139《統(tǒng)計學》第2章數(shù)據(jù)的描述2/26/2025《統(tǒng)計學實驗》第2章數(shù)據(jù)的描述2-140描述性統(tǒng)計分析【例2.29】(數(shù)據(jù)文件為example2.0.sav)沿用例某大學50名教師年齡原始數(shù)據(jù),試用SPSS描述統(tǒng)計功能,對這些年齡的特征進行描述性統(tǒng)計分析。2/26/2025140《統(tǒng)計學》第2章數(shù)據(jù)的描述解:打開數(shù)據(jù)文件example2.0.sav;選擇“分析(A)”→點擊“描述統(tǒng)計”→“描述(D)”→將“教師年齡”選入“變量(V)”框→單擊“選項(O)”→勾選“均值”、“標準差”、“最小值”、“最大值”、“方差”、“范圍”、“峰度”、“偏度”→在“顯示順序”中選默認項“變量列表(B)→單擊“繼續(xù)”→點擊“確定”,可得表。描述性統(tǒng)計分析

2/26/2025141《統(tǒng)計學》第2章數(shù)據(jù)的描述描述統(tǒng)計量N全距極小值極大值均值標準差方差偏度峰度統(tǒng)計量統(tǒng)計量統(tǒng)計量統(tǒng)計量統(tǒng)計量統(tǒng)計量統(tǒng)計量統(tǒng)計量標準誤統(tǒng)計量標準誤教師年齡(周歲)5044246842.2810.799116.614.405.337-.210.662有效的N(列表狀態(tài))50表2.1950位教師年齡的描述統(tǒng)計量2/26/2025142《統(tǒng)計學》第2章數(shù)據(jù)的描述統(tǒng)計表統(tǒng)計表的結(jié)構(gòu)設(shè)計統(tǒng)計表應(yīng)注意的事項2/26/2025143《統(tǒng)計學》第2章數(shù)據(jù)的描述統(tǒng)計表的結(jié)構(gòu)統(tǒng)計表通常由四個主要部分組成,即:表頭、行標題、列標題和數(shù)字資料。有的統(tǒng)計表下方還有表外附加。表頭是指表的名稱,它簡單扼要地反映表的主要內(nèi)容;行標題是指每一橫行內(nèi)數(shù)據(jù)的意義;列標題是指每一縱欄內(nèi)數(shù)據(jù)的意義;數(shù)字資料是指各空格內(nèi)按要求填寫的數(shù)字;表外附加是指一些必要的注釋、必要的說明等。2/26/2025144《統(tǒng)計學》第2章數(shù)據(jù)的描述行標題列標題數(shù)字資料表頭→表我國農(nóng)村居民家庭平均每人純收入單位:元平均每人純收入按收入來源分2005年2006年2007年工資性收入1174.531

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論