《統(tǒng)計(jì)學(xué)教程》課件(前四章內(nèi)容)_第1頁(yè)
《統(tǒng)計(jì)學(xué)教程》課件(前四章內(nèi)容)_第2頁(yè)
《統(tǒng)計(jì)學(xué)教程》課件(前四章內(nèi)容)_第3頁(yè)
《統(tǒng)計(jì)學(xué)教程》課件(前四章內(nèi)容)_第4頁(yè)
《統(tǒng)計(jì)學(xué)教程》課件(前四章內(nèi)容)_第5頁(yè)
已閱讀5頁(yè),還剩108頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章引論統(tǒng)計(jì)學(xué)第一章引論統(tǒng)計(jì)學(xué)

統(tǒng)計(jì)數(shù)據(jù)的類型

隨機(jī)性和規(guī)律性

概率

參數(shù)和統(tǒng)計(jì)量

隨機(jī)變量

本章知識(shí)點(diǎn):統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)是關(guān)于收集,處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。

統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)是一門有關(guān)數(shù)據(jù)的科學(xué),它研究如何收集數(shù)據(jù),如何進(jìn)行數(shù)據(jù)處理,如何分析數(shù)據(jù),并從數(shù)據(jù)中得出結(jié)論的方法論科學(xué)。

統(tǒng)計(jì)學(xué)應(yīng)用領(lǐng)域非常廣泛,只要有數(shù)據(jù)的地方,就需要統(tǒng)計(jì)學(xué)。統(tǒng)計(jì)數(shù)據(jù)的類型按照所采用計(jì)量尺度的不同數(shù)據(jù)可劃分為三種類型:數(shù)值型數(shù)據(jù)分類型數(shù)據(jù)順序型數(shù)據(jù)在這三類數(shù)據(jù)中,數(shù)值型數(shù)據(jù)由于說(shuō)明了事物的數(shù)量特征,因此可歸為定量數(shù)據(jù),分類型數(shù)據(jù)和順序型數(shù)據(jù)由于定義了事物所屬的類別,說(shuō)明了事物的品質(zhì)特征,因而可統(tǒng)稱為定性數(shù)據(jù);還可以從其它角度對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行劃分:按照收集方法的不同:觀測(cè)數(shù)據(jù)例如,對(duì)商品零售價(jià)格變動(dòng)水平的測(cè)量可以得到商品零售價(jià)格指數(shù)、對(duì)股票價(jià)格變動(dòng)水平的測(cè)量可以得到股票價(jià)格指數(shù)。實(shí)驗(yàn)數(shù)據(jù)比如某種新型電池的使用壽命、一種新型降壓藥療效的實(shí)驗(yàn)數(shù)據(jù)等。按照是否與時(shí)間相聯(lián)系,可以分為:截面數(shù)據(jù):在同一時(shí)間點(diǎn)上的橫截面數(shù)據(jù);時(shí)間序列數(shù)據(jù):同一現(xiàn)象在不同時(shí)間的縱向數(shù)據(jù);截面數(shù)據(jù):時(shí)間序列數(shù)據(jù)隨機(jī)性和規(guī)律性隨機(jī)性指,在每次試驗(yàn)前結(jié)果具有不確定性,可能這樣,也可能那樣,結(jié)果呈現(xiàn)出偶然性。規(guī)律性指,在一定條件下必然發(fā)生某個(gè)現(xiàn)象,結(jié)果帶有必然性。許多現(xiàn)象是隨機(jī)的,帶有不確定性;也有許多現(xiàn)象是有規(guī)律的;

現(xiàn)實(shí)中,隨機(jī)性與規(guī)律性并非完全對(duì)立,社會(huì)現(xiàn)象通常是隨機(jī)性和規(guī)律性的有機(jī)結(jié)合體,隨機(jī)之中帶有規(guī)律性。

新生兒的性比例,106:100是規(guī)律。拋硬幣的例子統(tǒng)計(jì)規(guī)律:隨機(jī)之中的規(guī)律。對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析:是利用數(shù)據(jù)產(chǎn)生的隨機(jī)性和統(tǒng)計(jì)規(guī)律進(jìn)行推斷和決策。概率概率是對(duì)機(jī)會(huì)的描述,度量了某件事情發(fā)生的可能性,其取值在0和1之間。概率為0:對(duì)應(yīng)絕對(duì)不可能發(fā)生的事情。概率為1:對(duì)應(yīng)一定會(huì)發(fā)生的事情。概率介于0和1之間:為隨機(jī)事件。隨機(jī)事件的例子:(1)隨意拋擲一顆骰子,出現(xiàn)的點(diǎn)數(shù)為6;(4)某對(duì)夫婦將要出生的是一名男孩;(5)某天出現(xiàn)雷雨天氣; ……參數(shù)和統(tǒng)計(jì)量總體:包含了所要研究的全部個(gè)體(數(shù)據(jù)的集合)。參數(shù):總體特征的一些概括性數(shù)字度量。參數(shù)是對(duì)總體而言的,常見(jiàn)的參數(shù):總體平均數(shù)、總體方差、總體比例,等。參數(shù)和統(tǒng)計(jì)量樣本:從總體中隨機(jī)抽取一小部分元素的集合。統(tǒng)計(jì)量:用來(lái)描述樣本特征的概括性數(shù)字度量。統(tǒng)計(jì)量是對(duì)樣本而言的,常用的統(tǒng)計(jì)量:樣本平均數(shù)、樣本方差、樣本比例,等。統(tǒng)計(jì)學(xué)研究的是,如何抽取樣本,如果構(gòu)造樣本統(tǒng)計(jì)量,如何用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)。隨機(jī)變量隨機(jī)變量是相對(duì)于常量(也叫常數(shù))而言的,是說(shuō)明隨機(jī)現(xiàn)象某種特征的概念。例如,商店銷售額,醫(yī)院嬰兒出生數(shù)都是隨機(jī)變量。變量的類型:定性變量,定量變量隨機(jī)變量按照變量所屬類型的不同組合,將變量之間的關(guān)系區(qū)分為:

定性變量之間的關(guān)系

定量變量之間的關(guān)系

定性與定量變量之間的關(guān)系研究定性變量之間關(guān)系的統(tǒng)計(jì)模型與方法主要有:

列聯(lián)分析

對(duì)數(shù)線性模型

……研究定量變量之間關(guān)系的統(tǒng)計(jì)模型與方法主要有:

線性回歸

非線性回歸

……研究定性變量與定量變量之間關(guān)系的統(tǒng)計(jì)模型與方法主要有:方差分析

logistic回歸

判別分析

……統(tǒng)計(jì)學(xué)第二章

數(shù)據(jù)的搜集第二章

數(shù)據(jù)的搜集本章知識(shí)點(diǎn):數(shù)據(jù)的間接接來(lái)源

數(shù)據(jù)的直接來(lái)源抽樣誤差

未相應(yīng)誤差響應(yīng)誤差

27數(shù)據(jù)的間接來(lái)源(二手?jǐn)?shù)據(jù))數(shù)據(jù)是由其他人調(diào)查或者實(shí)驗(yàn)得到的,我們或者拿來(lái)直接使用,或者進(jìn)行重新加工、整理,使之成為我們進(jìn)行統(tǒng)計(jì)分析可以使用的數(shù)據(jù)。我們把這些數(shù)據(jù)稱為二手?jǐn)?shù)據(jù)。28數(shù)據(jù)的間接來(lái)源(二手?jǐn)?shù)據(jù))如,統(tǒng)計(jì)年鑒,各種統(tǒng)計(jì)數(shù)據(jù)出版物,一些數(shù)據(jù)庫(kù)網(wǎng)站.聯(lián)合國(guó)統(tǒng)計(jì)司網(wǎng)站:等。

二手?jǐn)?shù)據(jù)的優(yōu)勢(shì):省時(shí),省力,采集數(shù)據(jù)成本低;需要數(shù)據(jù)時(shí)可以首先考慮。29二手?jǐn)?shù)據(jù)的局限數(shù)據(jù)的真實(shí)性,可靠性,時(shí)效性,及數(shù)據(jù)內(nèi)容是否恰好與需求一致。使用二手?jǐn)?shù)據(jù),要注意數(shù)據(jù)的定義、統(tǒng)計(jì)口徑和計(jì)算方法,避免數(shù)據(jù)的錯(cuò)用、誤用和濫用。在使用二手?jǐn)?shù)據(jù)時(shí),應(yīng)注明數(shù)據(jù)的來(lái)源,以尊重他人的勞動(dòng)成果。30數(shù)據(jù)的直接來(lái)源又稱一手?jǐn)?shù)據(jù),可以分為調(diào)查數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)。調(diào)查數(shù)據(jù):通過(guò)調(diào)查方式得到的數(shù)據(jù),主要的調(diào)查方式有:

普查,如人口普查,經(jīng)濟(jì)普查,農(nóng)業(yè)普查等;

抽樣調(diào)查,目前應(yīng)用極為廣泛;

統(tǒng)計(jì)報(bào)表,目前主體是聯(lián)網(wǎng)直報(bào),多見(jiàn)于政府部門;

其他采集數(shù)據(jù)方式,如網(wǎng)絡(luò)“爬蟲(chóng)”技術(shù),等。31實(shí)驗(yàn)數(shù)據(jù):指在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而搜集到的變量的數(shù)據(jù)。實(shí)驗(yàn)是檢驗(yàn)變量間因果關(guān)系的一種方法,在實(shí)驗(yàn)中,研究人員控制某一情形的所有相關(guān)方面,操縱少數(shù)感興趣的變量,然后觀察實(shí)驗(yàn)的結(jié)果。人文社會(huì)科學(xué)數(shù)據(jù),主要通過(guò)調(diào)查獲??;自然科學(xué)研究數(shù)據(jù),主要通過(guò)實(shí)驗(yàn)獲取。32是由抽樣的隨機(jī)性引起的樣本結(jié)果與總體真值之間的差異。只要采用概率抽樣,抽樣誤差就不可避免。抽樣誤差不是針對(duì)某個(gè)具體樣本的檢測(cè)結(jié)果與總體真實(shí)結(jié)果的差異而言,它描述的是所有樣本可能的結(jié)果與總體真值之間的平均性差異。抽樣誤差在統(tǒng)計(jì)學(xué)中占有重要地位。33抽樣誤差

樣本量的大小。樣本量越大,抽樣誤差越??;總體的變異性??傮w的變異性越大,即各單位之間的差異越大,抽樣誤差也就越大。34抽樣誤差大小的影響因素

非抽樣誤差中的一種,它是指由于種種原因,樣本中的一部分人未對(duì)調(diào)查結(jié)果做出反應(yīng)或回答而造成的誤差,也可以稱為無(wú)回答誤差。如果未響應(yīng)誤差是隨機(jī)的,可以通過(guò)增大樣本量的方式解決。

35未響應(yīng)誤差如果未響應(yīng)誤差是非隨機(jī)的,問(wèn)題就比較嚴(yán)重。調(diào)查時(shí)要有一些質(zhì)量保證措施,減少無(wú)回答;出現(xiàn)無(wú)回答要采取補(bǔ)救措施。36未響應(yīng)誤差也可以視為回答誤差。指在調(diào)查過(guò)程中,由于問(wèn)題的提問(wèn)方式、訪員的影響或受訪者自身的原因,而使受訪者在回答問(wèn)題時(shí)產(chǎn)生的誤差。相應(yīng)誤差也是非抽樣誤差中的一種。37響應(yīng)誤差統(tǒng)計(jì)學(xué)第三章數(shù)據(jù)的描述1--數(shù)據(jù)的直觀顯示第三章數(shù)據(jù)的描述1--數(shù)據(jù)的直觀顯示統(tǒng)計(jì)表

統(tǒng)計(jì)表的類型

統(tǒng)計(jì)圖

定性變量的圖示定量變量的圖示趨勢(shì)的圖示本章知識(shí)點(diǎn):統(tǒng)計(jì)表是描述數(shù)據(jù)的一種基本工具,由橫豎交叉線條繪制的表格表現(xiàn)數(shù)據(jù)所包含的信息。原本雜亂無(wú)章的數(shù)據(jù),經(jīng)過(guò)有目的的整理,有條理地在統(tǒng)計(jì)表中呈現(xiàn),反映數(shù)據(jù)的分布特征。統(tǒng)計(jì)表簡(jiǎn)明易懂,節(jié)省文字,反映數(shù)據(jù)分布特征,便于對(duì)數(shù)據(jù)進(jìn)行對(duì)比分析,是統(tǒng)計(jì)分析的重要工具。統(tǒng)計(jì)表統(tǒng)計(jì)表一般是由四個(gè)主要部分構(gòu)成:表頭,行標(biāo)題,列標(biāo)題,數(shù)據(jù)資料,必要時(shí)需要在統(tǒng)計(jì)表的下方加上表外附加。1.簡(jiǎn)單表

行標(biāo)題或列標(biāo)題中的變量指標(biāo)未經(jīng)過(guò)任何分類,只是反映各變量的名稱或按時(shí)間順序簡(jiǎn)單排列。也稱一覽表。

統(tǒng)計(jì)表的類型表3-22011年我國(guó)主要宏觀經(jīng)濟(jì)運(yùn)行指標(biāo)

主要宏觀經(jīng)濟(jì)指標(biāo)單位數(shù)值國(guó)內(nèi)生產(chǎn)總值億元472881.6就業(yè)人數(shù)萬(wàn)人76420居民消費(fèi)價(jià)格指數(shù)%105.4農(nóng)村居民家庭人均純收入元6977.3城鎮(zhèn)居民家庭人均可支配收入元21809.8資料來(lái)源:中國(guó)國(guó)家統(tǒng)計(jì)局網(wǎng)站《2012年統(tǒng)計(jì)年鑒》統(tǒng)計(jì)表的類型行標(biāo)題或列標(biāo)題中的變量指標(biāo)按照一定標(biāo)志進(jìn)行了分類,也稱簡(jiǎn)單分組表。它可以揭示出現(xiàn)象的不同類型的特征,研究現(xiàn)象的內(nèi)部結(jié)構(gòu)。

2.分組表表3-32003-2011年我國(guó)黃金和外匯儲(chǔ)備

年份黃金儲(chǔ)備(萬(wàn)盎司)外匯儲(chǔ)備(億美元)200319294032.51200419296099.32200519298188.722006192910663.42007192915282.492008192919460.32009338923991.522010338928473.382011338931811.48資料來(lái)源:《2012年中國(guó)統(tǒng)計(jì)年鑒》行標(biāo)題或列標(biāo)題中的變量指標(biāo)按照兩個(gè)或兩個(gè)以上的標(biāo)志層疊分類所形成的統(tǒng)計(jì)表。

3.復(fù)合表年份國(guó)內(nèi)生產(chǎn)總值

第一產(chǎn)業(yè)第二產(chǎn)業(yè)第二產(chǎn)業(yè)

第三產(chǎn)業(yè)工業(yè)建筑業(yè)2006216314.424040103719.591310.9412408.6188554.882007265810.328627125831.4110534.915296.48111351.92008314045.433702149003.4130260.218743.21313402009340902.835226157638.8135239.922398.831480382010401512.840533.6187383.2160722.226660.981735962011472881.647486.21220412.8188470.231942.66204982.5資料來(lái)源:《2012年中國(guó)統(tǒng)計(jì)年鑒》表3-42006-2011年主要年份國(guó)內(nèi)生產(chǎn)總值及其構(gòu)成

單位:億元行標(biāo)題和列標(biāo)題中的變量指標(biāo)同時(shí)采用分類的形式來(lái)表示,使得數(shù)據(jù)依據(jù)行或列變量分類結(jié)果在交叉的單元格中顯示。

4.交叉表表3-5某項(xiàng)調(diào)查被訪問(wèn)者受教育水平和性別分布交叉表

受教育水平性別合計(jì)人數(shù)(人)百分比(%)男女小學(xué)及以下1001402408初中50046096032高中600630123041大學(xué)及以上26031057019合計(jì)146015403000100用圖形的方式表現(xiàn)數(shù)據(jù)的一種方式。特點(diǎn)是鮮明醒目,易于理解。一張好的統(tǒng)計(jì)圖,往往勝過(guò)冗長(zhǎng)的文字表達(dá)。根據(jù)描述統(tǒng)計(jì)變量的性質(zhì),可以將統(tǒng)計(jì)圖進(jìn)行分類。定性變量圖示:條形圖、餅圖、環(huán)形圖等;定量變量圖示:直方圖、折線圖、箱線圖等。統(tǒng)計(jì)圖1.條形圖條形圖可用于顯示分類變量和順序變量取值的頻數(shù)或頻率分布。用寬度相同的條形高度或長(zhǎng)短來(lái)表示頻數(shù)的多少或頻率的大小。定性變量圖示單式條形圖圖3-12011年我國(guó)人口中男女比例圖復(fù)式條形圖圖3-21949年和2011年我國(guó)人口中男女比例圖餅圖可用于顯示分類變量和順序變量取值所對(duì)應(yīng)的頻數(shù)或頻率分布。用圓形及圓內(nèi)扇形的面積來(lái)表示數(shù)值的大小??捎糜诒硎痉诸愖兞恐懈鹘M頻數(shù)所占的比例,即相對(duì)大小,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用。2.餅圖圖3-32011年我國(guó)人口中男女比例圖環(huán)形圖以同時(shí)繪制多個(gè)總體或樣本的數(shù)據(jù)系列。每一個(gè)總體或樣本的數(shù)據(jù)系列為一個(gè)環(huán)。環(huán)形圖可顯示多個(gè)總體或樣本各部分所占的相應(yīng)比例。有利于進(jìn)行比較研究。3.環(huán)形圖圖3-41949年和2011年我國(guó)人口中男女比例圖定量變量也稱為數(shù)值型變量。按照數(shù)據(jù)的取值類型,分為:連續(xù)性變量和離散型變量用來(lái)描述定性變量取值的圖示法都能夠用來(lái)描述定性變量的數(shù)值。此外,還可以采用直方圖、折線圖、箱線圖等來(lái)進(jìn)行描述。定量變量的圖示直方圖是根據(jù)定量變量的取值范圍來(lái)顯示觀測(cè)頻數(shù)的圖。

常用于顯示連續(xù)型變量在取值區(qū)間內(nèi)的頻數(shù)分布。

用矩形的寬度和高度(即面積)來(lái)表示頻數(shù)的分布。1.直方圖圖3-5100名調(diào)查員的有效問(wèn)卷數(shù)分布直方圖折線圖也稱頻數(shù)多邊形圖,是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(即組中值)用直線連接起來(lái)形成的。將前面直方圖中點(diǎn)直線連接,就形成下面的折線圖。2.折線圖圖3-6100名調(diào)查員的有效問(wèn)卷數(shù)分布折線圖

當(dāng)數(shù)據(jù)所分的組數(shù)很多時(shí),組距會(huì)越來(lái)越小,這時(shí)所繪制的折線圖就會(huì)越來(lái)越光滑,逐漸形成一條平滑的曲線,即頻數(shù)分布曲線。常見(jiàn)的頻數(shù)分布曲線主要有:正態(tài)分布,偏態(tài)分布,J形分布,U形分布圖3.8偏態(tài)分布圖3.7正態(tài)分布圖3.9

J型分布圖3.10

U型分布3.箱線圖

箱線圖主要用來(lái)反映原始數(shù)據(jù)的分布特征。它由一組數(shù)據(jù)的最大值、最小值、中位數(shù)、上下四分位這五個(gè)特征數(shù)值組成。箱線圖不能夠反映出每一個(gè)原始數(shù)據(jù)的信息,但卻提供了簡(jiǎn)明有效的視圖。圖3-11按性別區(qū)分的男女學(xué)生外語(yǔ)成績(jī)箱線圖趨勢(shì)的圖示

當(dāng)我們需要考慮定量變量取值在不同時(shí)間截面上的分布特征、或者兩個(gè)定量變量的取值所表現(xiàn)出的相關(guān)趨勢(shì)時(shí),就需要借助趨勢(shì)圖進(jìn)行描述。1.線圖線圖在直角平面坐標(biāo)中主要用來(lái)描述定量變量取值隨時(shí)間變化的特征,即時(shí)間序列數(shù)據(jù)的趨勢(shì)特征,因此也可以稱為時(shí)間序列圖。我國(guó)2003年到2011年我國(guó)外匯儲(chǔ)備情況

圖3-122003年—2011年我國(guó)外匯儲(chǔ)備2.散點(diǎn)圖

散點(diǎn)圖是用二維直角平面坐標(biāo)展示兩個(gè)定量變量取值隨時(shí)間變化表現(xiàn)出的趨勢(shì),主要用來(lái)觀察變量間的相關(guān)關(guān)系。用坐標(biāo)橫軸代表變量,縱軸代表變量,兩個(gè)變量的每組數(shù)據(jù)在坐標(biāo)系中用一個(gè)點(diǎn)表示。圖3-131998-2007年國(guó)內(nèi)生產(chǎn)總值和貨運(yùn)周轉(zhuǎn)量散點(diǎn)圖統(tǒng)計(jì)學(xué)第四章

數(shù)據(jù)的描述2—重要的統(tǒng)計(jì)量

本章知識(shí)點(diǎn)集中趨勢(shì)及描述算數(shù)平均數(shù)

幾何平均數(shù)中位數(shù)眾數(shù)

均值、中位數(shù)、眾數(shù)之間的關(guān)系

本章知識(shí)點(diǎn)離散趨勢(shì)及描述異眾比率極差和四分位差平均差、方差、標(biāo)準(zhǔn)差離散系數(shù)數(shù)據(jù)的標(biāo)準(zhǔn)化處理

集中趨勢(shì)及描述集中趨勢(shì):是指一組數(shù)據(jù)向某中心值靠攏的傾向,是數(shù)據(jù)分布的一個(gè)重要特征。集中趨勢(shì)的描述:是對(duì)一組數(shù)據(jù)的一般水平代表值或中心值的測(cè)度。對(duì)集中趨勢(shì)進(jìn)行測(cè)度的統(tǒng)計(jì)量主要有:算數(shù)平均數(shù)(均值)、幾何平均數(shù)、中位數(shù)、眾數(shù)等。算數(shù)平均數(shù)也稱均值,是一組數(shù)據(jù)相加后除以數(shù)據(jù)個(gè)數(shù)得到的結(jié)果,它是一組數(shù)據(jù)大小相互抵消的結(jié)果,可以看作是數(shù)據(jù)集的重心。均值是最主要的集中趨勢(shì)測(cè)度統(tǒng)計(jì)量,本課程中用符號(hào)

表示。

實(shí)際計(jì)算中又可以分為簡(jiǎn)單平均數(shù)和加權(quán)平均數(shù)。簡(jiǎn)單算術(shù)平均數(shù)未經(jīng)分組整理的原始數(shù)據(jù),其平均值計(jì)算就是直接將一組數(shù)據(jù)的各個(gè)數(shù)值相加除以數(shù)值個(gè)數(shù)。設(shè)一組樣本數(shù)據(jù)為、、、則算術(shù)平均數(shù)的計(jì)算公式為:簡(jiǎn)單算術(shù)平均數(shù)加權(quán)算數(shù)平均數(shù)

根據(jù)分組整理的數(shù)據(jù)計(jì)算的算術(shù)平均數(shù),要以各組變量值出現(xiàn)的次數(shù)或頻數(shù)為權(quán)數(shù)計(jì)算加權(quán)算術(shù)平均數(shù)。

假設(shè)樣本數(shù)據(jù)被分成組,樣本數(shù)據(jù)各組變量的代表值用表示,各組變量值出現(xiàn)的頻數(shù)用表示,則加權(quán)算術(shù)平均數(shù)的計(jì)算公式為:加權(quán)算數(shù)平均數(shù)算術(shù)平均數(shù)二個(gè)數(shù)學(xué)性質(zhì)性質(zhì)1各變量值與其算術(shù)平均數(shù)的離差之和等于零,即:

性質(zhì)2各變量值與其算術(shù)平均數(shù)的離差平方和最小,即:

算術(shù)平均數(shù)二個(gè)數(shù)學(xué)性質(zhì)最小值或最小值幾何平均數(shù)幾何平均數(shù)是用于特殊數(shù)據(jù)或反映特定目標(biāo)的平均數(shù),通常用來(lái)計(jì)算平均比率或平均發(fā)展速度,計(jì)算公式為:【例4-1】某股票投資者長(zhǎng)期持有一只股票,2005-2008年每年的收益率分別是5.6%,7.2%,28.5%,-15.6%。計(jì)算該股票投資者4年內(nèi)的平均收益率。幾何平均數(shù)

解:根據(jù)股票四年的平均收益率可得到其四年的相對(duì)價(jià)格分別是105.6%,107.2%,128.5%,84.4%。計(jì)算四年平均相對(duì)價(jià)格

四年的平均收益率是105.26%-1=5.26%。幾何平均數(shù)

105.26%中位數(shù)是將變量取值按大小順序排列后,處于中間位置的那個(gè)變量值。中位數(shù)把變量的所有取值分成數(shù)目相同的兩組,一半的數(shù)值比中位數(shù)小,一半的數(shù)值比中位數(shù)大,所以中位數(shù)是位置平均數(shù)。中位數(shù)特點(diǎn)是穩(wěn)定性好,不會(huì)受到極端數(shù)值的影響。中位數(shù)并沒(méi)有利用所有數(shù)據(jù)的信息,其對(duì)原始數(shù)據(jù)信息的代表性不如均值。眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,主要用于測(cè)度分類數(shù)據(jù)的集中趨勢(shì)。

例如,3000名受訪者受教育水平分組形成下面統(tǒng)計(jì)表。

眾數(shù)可以看到受教育水平為高中的頻數(shù)最大,這里眾數(shù)就是高中學(xué)歷。均值、中位數(shù)、眾數(shù)的關(guān)系從分布的角度看:均值是一組數(shù)據(jù)全部數(shù)值的平均數(shù),中位數(shù)是處于一組數(shù)據(jù)中間位置上的數(shù)值,眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值。

均值、中位數(shù)、眾數(shù)的關(guān)系三者之間的關(guān)系表現(xiàn)在:

1.當(dāng)變量取值的頻數(shù)分布對(duì)稱時(shí),則均值()與中位數(shù)()、眾數(shù)()三者完全相等,即圖4-1正態(tài)分布

2.當(dāng)變量取值的頻數(shù)分布呈現(xiàn)右偏時(shí),說(shuō)明數(shù)據(jù)存在最大值,必然拉動(dòng)均值向極大值一方靠,而眾數(shù)和中位數(shù)由于不受極端值的影響,因此,三者之間的關(guān)系為圖4-2右偏分布

3.當(dāng)變量取值的頻數(shù)分布呈現(xiàn)左偏時(shí),說(shuō)明數(shù)據(jù)存在最小值,必然拉動(dòng)均值向極小值一方靠,而眾數(shù)和中位數(shù)由于不受極端值的影響,因此,三者之間的關(guān)系為。圖4-3左偏分布離散趨勢(shì)及描述離散趨勢(shì)反映的是各變量值偏離中心值的傾向,是描述數(shù)據(jù)分布的另一個(gè)重要特征。離散趨勢(shì)是從另一個(gè)側(cè)面說(shuō)明一組數(shù)據(jù)集中趨勢(shì)測(cè)度值的代表程度。離散趨勢(shì)越大,集中趨勢(shì)測(cè)度值的代表性越低。

離散趨勢(shì)及描述

描述離散趨勢(shì)的測(cè)度指標(biāo)主要有:異眾比率、極差、四分位差、平均差、方差、標(biāo)準(zhǔn)差、以及離散系數(shù)。

異眾比率是指一組數(shù)據(jù)中非眾數(shù)(組)的頻數(shù)占總頻數(shù)的比例。既適用于定性數(shù)據(jù),也適用于定量數(shù)據(jù),但主要用于測(cè)度分類數(shù)據(jù)的離散趨勢(shì)。用Vr表示。計(jì)算公式是:

異眾比率

異眾比率的作用是衡量眾數(shù)對(duì)一組數(shù)據(jù)的代表性程度的指標(biāo)。異眾比率越大,說(shuō)明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重就越大,眾數(shù)的代表性就越差;反之,異眾比率越小,眾數(shù)的代表性就越好。極差和四分位差1.極差級(jí)差是一組數(shù)據(jù)的最大值與最小值之差,也稱全距,可以用于測(cè)度順序數(shù)據(jù)和定量數(shù)據(jù)的離散趨勢(shì)。級(jí)差是最容易計(jì)算的離散趨勢(shì)的測(cè)度統(tǒng)計(jì)量。但它容易受極端值的影響。如果用R表示極差,其計(jì)算公式為:

2.四分位差四分位數(shù)是指一組數(shù)據(jù)按大小排序后處于75%和25%位置上的值,也稱四分位點(diǎn)。通常所說(shuō)的四分位數(shù)是指:

處在75%位置上的數(shù)值(上四分位數(shù))處在25%位置上的數(shù)值(下四分位數(shù))

2.四分位差

四分位差就是上四分位數(shù)與下四分位數(shù)之間的距離,記上四分位數(shù)為

,下四分位數(shù)為,四分位差用Qd表示,則:四分位差克服了級(jí)差容易受數(shù)據(jù)中兩端極值的影響這一缺陷。平均差、方差和標(biāo)準(zhǔn)差

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論