![統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理課件_第1頁(yè)](http://file4.renrendoc.com/view/579e13af6efca4745cfd920e03b48779/579e13af6efca4745cfd920e03b487791.gif)
![統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理課件_第2頁(yè)](http://file4.renrendoc.com/view/579e13af6efca4745cfd920e03b48779/579e13af6efca4745cfd920e03b487792.gif)
![統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理課件_第3頁(yè)](http://file4.renrendoc.com/view/579e13af6efca4745cfd920e03b48779/579e13af6efca4745cfd920e03b487793.gif)
![統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理課件_第4頁(yè)](http://file4.renrendoc.com/view/579e13af6efca4745cfd920e03b48779/579e13af6efca4745cfd920e03b487794.gif)
![統(tǒng)計(jì)學(xué)數(shù)據(jù)的收集與整理課件_第5頁(yè)](http://file4.renrendoc.com/view/579e13af6efca4745cfd920e03b48779/579e13af6efca4745cfd920e03b487795.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)的收集、整理1.理解數(shù)據(jù)的來(lái)源,理解五種統(tǒng)計(jì)調(diào)查方式,掌握五種概率抽樣方法的定義,理解五種統(tǒng)計(jì)調(diào)查方法.理解抽樣誤差的定義,了解非抽樣誤差. 會(huì)撰寫統(tǒng)計(jì)調(diào)查方案。2.了解統(tǒng)計(jì)整理的概念;了解統(tǒng)計(jì)分組的定義、作用,理解統(tǒng)計(jì)分組的原則、種類;掌握組距數(shù)列的編制步驟;掌握洛倫茲曲線和基尼系數(shù)的含義與用途.3.準(zhǔn)確應(yīng)用統(tǒng)計(jì)圖和統(tǒng)計(jì)表顯示統(tǒng)計(jì)數(shù)據(jù)的數(shù)量特征.學(xué)習(xí)目標(biāo)內(nèi)容安排一、 數(shù)據(jù)的收集二、 數(shù)據(jù)的整理三、 統(tǒng)計(jì)表與統(tǒng)計(jì)圖數(shù)據(jù)的收集 統(tǒng)計(jì)資料收集是根據(jù)統(tǒng)計(jì)研究的目的要求,采用一定組織形式與科學(xué)方法,進(jìn)行采集與研究問(wèn)題有關(guān)的各類信息資料的工作過(guò)程。 1.數(shù)據(jù)的來(lái)源(1)第一手?jǐn)?shù)據(jù) (2)第二手?jǐn)?shù)據(jù)第
2、一手?jǐn)?shù)據(jù)是反映被調(diào)查對(duì)象原始狀況的資料,如原始記錄、統(tǒng)計(jì)臺(tái)賬、調(diào)查問(wèn)卷答案、實(shí)驗(yàn)結(jié)果等.統(tǒng)計(jì)調(diào)查或進(jìn)行實(shí)驗(yàn)是數(shù)據(jù)的直接來(lái)源.原始數(shù)據(jù)是統(tǒng)計(jì)數(shù)據(jù)的最基本的來(lái)源.第二手?jǐn)?shù)據(jù)是已經(jīng)存在的經(jīng)他人整理分析過(guò)的資料.數(shù)據(jù)的間接來(lái)源常用的有以下一些:公開出版的統(tǒng)計(jì)數(shù)據(jù),主要來(lái)自官方的統(tǒng)計(jì)部門和政府、組織、學(xué)校和科研機(jī)構(gòu). 尚未公開發(fā)表的數(shù)據(jù),如各企業(yè)的經(jīng)營(yíng)報(bào)表數(shù)據(jù).使用第二手?jǐn)?shù)據(jù)需要注意的問(wèn)題 應(yīng)注意數(shù)據(jù)的含義、計(jì)算口徑和計(jì)算方法,避免誤用或?yàn)E用; 注意第二手?jǐn)?shù)據(jù)的時(shí)間性,不能用過(guò)時(shí)的數(shù)據(jù); 應(yīng)充分搞清這些數(shù)據(jù)的來(lái)源和可靠程度; 應(yīng)注明數(shù)據(jù)的出處,以尊重他人的勞動(dòng)成果. 2.統(tǒng)計(jì)調(diào)查(1)統(tǒng)計(jì)調(diào)查方案設(shè)計(jì)
3、(2)統(tǒng)計(jì)調(diào)查方法 (3)統(tǒng)計(jì)調(diào)查的組織方式確定調(diào)查目的與任務(wù)確定調(diào)查對(duì)象和調(diào)查單位確定調(diào)查項(xiàng)目和調(diào)查表確定調(diào)查時(shí)間和調(diào)查期限制定調(diào)查工作的組織實(shí)施計(jì)劃統(tǒng)計(jì)調(diào)查方案統(tǒng)計(jì)調(diào)查方法現(xiàn)場(chǎng)觀察法報(bào)告法問(wèn)卷法訪談法實(shí)驗(yàn)采集法統(tǒng)計(jì)調(diào)查組織方式統(tǒng)計(jì)報(bào)表普查抽樣調(diào)查重點(diǎn)調(diào)查典型調(diào)查統(tǒng)計(jì)報(bào)表 統(tǒng)計(jì)報(bào)表(Statistical Report Forms)是指依照國(guó)家統(tǒng)計(jì)局或國(guó)家各行政管理部門的規(guī)定,自上而下地統(tǒng)一布置,以一定的原始記錄為依據(jù),按照統(tǒng)一的表式,統(tǒng)一的指標(biāo)項(xiàng)目,統(tǒng)一的報(bào)送時(shí)間與報(bào)送程序,自下而上地逐級(jí)定期提供基本統(tǒng)計(jì)資料的一種調(diào)查方式。普查 普查(Census)是對(duì)調(diào)查對(duì)象的全部調(diào)查單位逐一進(jìn)行的調(diào)查
4、。其特點(diǎn):是一次性調(diào)查,是專門組織的全面調(diào)查,即普查主要用來(lái)調(diào)查屬于一定時(shí)點(diǎn)上的現(xiàn)象總量。關(guān)鍵詞:全面調(diào)查、一次性、時(shí)點(diǎn)資料 美國(guó)普查局 / 美國(guó)普查局抽樣調(diào)查 抽樣調(diào)查(Sampling Survey)是一種非全面調(diào)查,它是在全部調(diào)查單位中抽取一部分單位作為樣本進(jìn)行調(diào)查,再根據(jù)調(diào)查結(jié)果推斷總體的一種調(diào)查方法。概率抽樣和非概率抽樣 根據(jù)抽選樣本的方法,抽樣調(diào)查可以分為:概率抽樣:也稱隨機(jī)抽樣,是按照隨機(jī)原則抽選樣本的抽樣方式,抽樣時(shí)每個(gè)樣本單位被選中的概率是已知.概率抽樣中可以對(duì)抽樣誤差進(jìn)行控制.在我國(guó),習(xí)慣上將概率抽樣稱為抽樣調(diào)查.不滿足概率抽樣要求的抽樣都被歸為非概率抽樣.非概率抽樣單個(gè)單
5、位被選中的概率是不可知的,不能從概率意義上控制抽樣誤差.隨機(jī)原則:在抽選樣本時(shí)排除主觀因素的影響(不是有意識(shí)的抽選某些單位),使每個(gè)單位都有一定的機(jī)會(huì)被抽中.等概率抽樣:抽樣時(shí)每個(gè)單位被選中的概率都相等.不等概率抽樣:抽樣時(shí)不是每個(gè)單位被選中的概率都相等.抽樣調(diào)查非概率抽樣概率抽樣不等概率抽樣等概率抽樣概率抽樣中的隨機(jī)原則是實(shí)際中應(yīng)用最廣泛的一種調(diào)查方式.1992年我國(guó)的國(guó)家調(diào)查系統(tǒng)將抽樣調(diào)查列為統(tǒng)計(jì)調(diào)查的主體.與全面調(diào)查相比,它具有以下明顯的特點(diǎn):經(jīng)濟(jì)性.普查需要花費(fèi)大量人力、財(cái)力,而采用抽樣調(diào)查則可取得事半功倍的效果.時(shí)效性強(qiáng) .可以迅速及時(shí)地獲得信息.適應(yīng)面廣 .對(duì)于某些不可能進(jìn)行普查的
6、現(xiàn)象,只能通過(guò)抽樣調(diào)查獲取這些現(xiàn)象的部分?jǐn)?shù)據(jù).有可能獲得比普查更高的數(shù)據(jù)質(zhì)量.普查中工作量大、環(huán)節(jié)多,登記性誤差往往很大. 抽樣調(diào)查的特點(diǎn)抽樣調(diào)查方法的分類在抽樣調(diào)查中可以把總體分成若干個(gè)互不重疊又窮盡的有限個(gè)部分,每個(gè)部分稱為一個(gè)抽樣單位(抽樣單元,Sampling unit).抽樣單位可以是一個(gè)總體單位,也可以包含多個(gè)個(gè)體.所有抽樣單位的名單稱為抽樣框(Sampling Frame). 抽樣框應(yīng)盡可能與目標(biāo)總體相一致. 抽樣框有以下形式: 名單抽樣框,即以名冊(cè)或清單形式列出總體所有單位例如,學(xué)生名冊(cè)、企業(yè)名錄、職工名單、住戶名單、村莊名單、社區(qū)名單等等.抽樣單元和抽樣框區(qū)域抽樣框,按自然地
7、域劃分并排列出總體所有單位.例如,一片土地劃分為若干地塊并編號(hào)、一片森林劃分為若干林區(qū)并編號(hào)等.時(shí)間表抽樣框,按時(shí)間順序排列總體單位.例如,流水線生產(chǎn)的產(chǎn)品質(zhì)量檢驗(yàn),把一天劃分為若干時(shí)段并按順序排列.抽樣框的編制是抽樣調(diào)查的前提條件,要求不重不漏來(lái)保證樣本對(duì)總體的代表性.概率抽樣調(diào)查的方式主要有以下五種:()簡(jiǎn)單隨機(jī)抽樣(Simple Random Sampling)也稱純隨機(jī)抽樣.直接從總體單位中抽選樣本單位,每個(gè)個(gè)體被選入樣本的概率都相等.可分為有放回和無(wú)放回兩種方式.是最基本的抽樣方法,許多抽樣方法都是在它的基礎(chǔ)上發(fā)展起來(lái)的.其數(shù)學(xué)性質(zhì)簡(jiǎn)單,理論也最為成熟.有放回抽樣和無(wú)放回抽樣有放回抽
8、樣:也稱為重復(fù)抽樣,在一個(gè)單位被選入樣本后,記錄其編號(hào),然后又將其放回總體中繼續(xù)參與隨后的抽樣過(guò)程.無(wú)放回抽樣:也稱為不重復(fù)抽樣,在一個(gè)單位被選入樣本后,不再放回總體參與隨后的抽樣過(guò)程.重復(fù)抽樣的誤差也比不重復(fù)抽樣略大.實(shí)際應(yīng)用中一般采用不重復(fù)抽樣.從N個(gè)總體單位中抽選n個(gè)單位組成樣本,可以先將N個(gè)單位編號(hào),若抽到某個(gè)號(hào)則對(duì)應(yīng)的單位入樣.通常有抽簽法和隨機(jī)數(shù)法兩種抽選方法.抽簽法:用均勻同質(zhì)的材料制作N個(gè)簽并充分混合,然后一次抽取n個(gè)簽,或一次抽取一個(gè)簽但不放回,直至抽滿n個(gè)簽為止.隨機(jī)數(shù)法: 隨機(jī)數(shù)表隨機(jī)數(shù)骰子計(jì)算機(jī)產(chǎn)生的偽隨機(jī)數(shù)抽選樣本單位的方法39 65 76 45 45 19 90 6
9、9 64 61 20 26 36 31 62 73 71 23 70 90 65 97 60 12 11 98 40 07 17 66 72 20 47 33 84 51 67 47 97 19 98 40 07 17 66 75 17 25 69 17 17 95 21 78 58 24 33 45 77 48 37 48 79 88 74 63 52 06 34 30 01 31 60 10 27 02 89 08 16 94 85 53 83 29 95 56 27 09 24 43 隨機(jī)數(shù)表舉例當(dāng)總體內(nèi)樣本單位不多,且有完備名冊(cè),可用于編號(hào)時(shí)對(duì)研究的目的而言,總體內(nèi)樣本單位間的差異不大
10、時(shí).無(wú)法充分獲得總體信息時(shí)由于編制抽樣框及抽取的樣本可能過(guò)于分散等原因在實(shí)際實(shí)施中有一定困難,加之沒(méi)有利用其他輔助信息提高估計(jì)的效率,所以大規(guī)模調(diào)查中很少直接采用.簡(jiǎn)單隨機(jī)抽樣最適用的場(chǎng)合系統(tǒng)抽樣(也稱機(jī)械抽樣):將總體N個(gè)單位按某種順序排列,在規(guī)定的范圍內(nèi)隨機(jī)抽取起始單元,然后按一套規(guī)則確定其他樣本單元的一種抽樣方法.最簡(jiǎn)單的系統(tǒng)抽樣是等距抽樣.下面介紹直線等距抽樣:將總體分成n個(gè)組,每組有 k =N/n個(gè)單位.在第一組隨機(jī)選擇一個(gè)單位,之后每隔k個(gè)選擇一個(gè).N = 64n = 8k = 8第一組()系統(tǒng)抽樣 (Systematic Sampling)總體單位的順序可能影響抽樣結(jié)果:各單元的
11、排隊(duì)順序與所研究的內(nèi)容無(wú)關(guān);各單元的排隊(duì)順序與所研究的內(nèi)容有內(nèi)在聯(lián)系.優(yōu)點(diǎn):抽取樣本簡(jiǎn)便易行,易于監(jiān)控.主要適用場(chǎng)合:總體內(nèi)的樣本單位,對(duì)有興趣的指標(biāo)而言是隨機(jī)的或按大小排列的.總體內(nèi)單位數(shù)過(guò)多,而抽取的樣本又較多時(shí).總體內(nèi)的單位數(shù)不能確定時(shí)(例如抽取學(xué)號(hào)最后一位為8的學(xué)生進(jìn)行調(diào)查).系統(tǒng)抽樣的特點(diǎn)也稱類型抽樣.即先將總體所有單位按某種標(biāo)志劃分為若干層,然后從各層中隨機(jī)抽取一定數(shù)目的單位構(gòu)成樣本,根據(jù)各層樣本匯總對(duì)總體指標(biāo)作出估計(jì)的一種抽樣方式.男生女生樣本()分層抽樣 (Stratified Sampling)可以提高樣本的代表性,提高估計(jì)的精度.抽樣誤差只受層內(nèi)方差的影響,分層時(shí)應(yīng)使層間方
12、差大、層內(nèi)方差小.最適用的場(chǎng)合:當(dāng)總體內(nèi)樣本單位的差異較大時(shí);分層后能達(dá)到層間差異大,層內(nèi)差異小的原則時(shí).分層抽樣的特點(diǎn)按比例分層抽樣:按各層單元數(shù)占總體單元數(shù)的比例進(jìn)行分配.在有些情況下為了降低抽樣誤差或者對(duì)各層的參數(shù)進(jìn)行較好的估計(jì),需要采用不按比例分層抽樣.在不按比例的分層抽樣中如果要用樣本資料推斷總體,需要對(duì)各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理.按比例分層抽樣和不按比例分層抽樣 假設(shè)要從1000畝農(nóng)田中抽取100畝調(diào)查小麥的平均畝產(chǎn).1000畝耕地中有600畝為平原,400畝為丘陵;平原地區(qū)的畝產(chǎn)量相差不大(方差很小),而丘陵地區(qū)畝產(chǎn)量的差別很大(方差大).按比例抽樣:平原和丘陵各抽60畝和40畝
13、.不按比例抽樣:為了更準(zhǔn)確地估計(jì)丘陵地區(qū)的平均畝產(chǎn),在丘陵地區(qū)多抽一些農(nóng)田(例如70畝),從平原地區(qū)抽取30畝.這時(shí)總體平均畝產(chǎn)的估計(jì)值為不按比例分層抽樣(不等概率抽樣)的例子先將總體分為R個(gè)群(即次級(jí)單位或子總體),每個(gè)群包含若干總體單位.按某種方式從中隨機(jī)抽取r個(gè)群,然后對(duì)抽中的群的所有單位都進(jìn)行調(diào)查的抽樣方式.總體分成4個(gè)群隨機(jī)選擇2個(gè)群構(gòu)成樣本 () 整群抽樣 (Cluster Sampling)不需要所有總體單位的抽樣框.由于樣本單位不能均勻的分布在總體中,所以樣本的代表性要差一些(對(duì)策:增大樣本容量).抽樣誤差受群間方差的影響,不受群內(nèi)方差的影響.分群時(shí)應(yīng)使群間方差小.最適用的場(chǎng)合
14、:總體名單不易獲得時(shí)為節(jié)省調(diào)查成本時(shí)群內(nèi)差異大,而群間的變異小時(shí)整群抽樣的特點(diǎn)先從總體中隨機(jī)地抽取若干初級(jí)單位,再?gòu)某跫?jí)單位中抽取若干二級(jí)單位, ,如此下去直至抽取所要調(diào)查的基本單位的抽樣方法.例如: 統(tǒng)計(jì)年鑒2004指出 2003年人口變動(dòng)情況抽樣調(diào)查是以全國(guó)為總體,各省、自治區(qū)、直轄市為次總體,采用分層、等距、整群概率比例抽樣方法,在全國(guó)31個(gè)省、自治區(qū)、直轄市抽取了990個(gè)縣(市、區(qū))、3734個(gè)鄉(xiāng)(鎮(zhèn)、街道)、6544個(gè)調(diào)查小區(qū)的126萬(wàn)人.() 多階段抽樣(muti-stage Sampling)適用于總體分布很廣,不可能從總體中直接抽取樣本單位的情況.不需要全部低級(jí)單位的抽樣框,節(jié)
15、省了調(diào)查費(fèi)用.方法靈活多樣.抽樣調(diào)查的組織方式完全取決于調(diào)查研究的目的要求、調(diào)查對(duì)象的特點(diǎn)和客觀的條件.凡是能夠最經(jīng)濟(jì)、最省時(shí)而又能夠滿足預(yù)期精確度和可靠性的組織方式,便是一種好的組織方式,這也是抽樣設(shè)計(jì)的最根本的原則.多階段抽樣的特點(diǎn)非概率抽樣方便抽樣判斷抽樣配額抽樣雪球抽樣 不滿足概率抽樣要求的抽樣都被歸為非概率抽樣.非概率抽樣中單個(gè)單位被選中的概率是不可知的,無(wú)法根據(jù)樣本計(jì)算抽樣誤差.非概率抽樣純粹以方便為基本著眼點(diǎn)的抽樣方法,事先不預(yù)定樣本,碰到即問(wèn)或被調(diào)查者主動(dòng)回答問(wèn)題.也譯為便利抽樣、偶遇抽樣.例如:在街頭的攔截式訪問(wèn).登在報(bào)刊、網(wǎng)上的問(wèn)卷.方便抽樣(Convenience sam
16、pling)調(diào)查者根據(jù)主觀經(jīng)驗(yàn)和判斷從總體中選取有代表性的單位構(gòu)成樣本.精度取決于抽樣者的經(jīng)驗(yàn).不能獲得估計(jì)值的精度.適用于總體單位極不相同而樣本容量又很小的情況 判斷抽樣 (Judgment Sampling)是非隨機(jī)抽樣方法中最常用的一種抽樣方法.分為兩個(gè)步驟:根據(jù)研究人員認(rèn)為較重要的一些變量把總體單位分類,指定每一類中的定額;然后在每一類中使用方便抽樣或判斷抽樣的方法抽選指定數(shù)量的樣本單位.配額抽樣 (Quota sampling)也譯為滾雪球抽樣 .其原理是先找到最初的樣本單位,然后根據(jù)他們提供的信息去獲得新的樣本單位;這種過(guò)程不斷繼續(xù),直到完成規(guī)定的樣本容量為止.主要用于對(duì)稀少群體的
17、調(diào)查.例如某研究部門在調(diào)查保姆問(wèn)題時(shí),先訪問(wèn)了7名保姆,然后再請(qǐng)她們提供其他保姆名單,逐步擴(kuò)大到近百人.雪球抽樣 (Snowball Sampling)重點(diǎn)調(diào)查 重點(diǎn)調(diào)查(Key-point Survey)是指在調(diào)查對(duì)象中,選擇一部分重點(diǎn)調(diào)查單位收集統(tǒng)計(jì)資料的一種非全面調(diào)查。關(guān)鍵詞:重點(diǎn)調(diào)查單位,是指這些被調(diào)查的總體單位中數(shù)目不多,所占比重不大,但其調(diào)查的標(biāo)志值卻在總量中占有很大比重,在總體中具有舉足輕重的作用。 典型調(diào)查 典型調(diào)查(Model Survey)是指根據(jù)調(diào)查目的,在對(duì)所研究現(xiàn)象全面分析的基礎(chǔ)上,有意識(shí)地選擇有代表性的典型單位進(jìn)行深入細(xì)致地調(diào)查,以便認(rèn)識(shí)事物的本質(zhì)與發(fā)展變化規(guī)律的一
18、種非全面調(diào)查方法。關(guān)鍵詞:典型單位,是指那些能充分、集中地體現(xiàn)調(diào)查對(duì)象總體某些方面共性特征的最有代表性的單位。抽樣調(diào)查中的誤差抽樣誤差抽樣框誤差無(wú)回答誤差計(jì)量誤差非抽樣誤差抽樣調(diào)查中的誤差數(shù)據(jù)的質(zhì)量誤差與抽樣誤差誤差是指估計(jì)值與真實(shí)值之間的差異.抽樣誤差(Sampling error):由于抽選樣本的隨機(jī)性造成的誤差,也稱為代表性誤差.樣本只是總體的一部分,它對(duì)總體的代表性存在局限性,從而會(huì)造成誤差.在抽樣調(diào)查中,抽樣誤差就不可避免.在概率抽樣中抽樣誤差是能夠計(jì)量且可以得到控制的.影響抽樣誤差的主要因素包括:總體內(nèi)部的差異程度;樣本容量的大小;抽樣的方式方法等.非抽樣誤差:除抽樣誤差以外的所有
19、誤差.通常認(rèn)為是由于調(diào)查程序執(zhí)行中的錯(cuò)誤與不足引起的.主要包括抽樣框誤差、無(wú)回答誤差和計(jì)量誤差.國(guó)內(nèi)也稱為“工作誤差” 或“調(diào)查誤差” .非抽樣誤差(Nonsampling error)數(shù)據(jù)的整理(統(tǒng)計(jì)整理) 統(tǒng)計(jì)整理是統(tǒng)計(jì)工作的中間環(huán)節(jié),學(xué)習(xí)本部分內(nèi)容的目的在于掌握統(tǒng)計(jì)分組的方法,認(rèn)識(shí)分布數(shù)列是統(tǒng)計(jì)整理的重要表現(xiàn)形式,會(huì)編制變量數(shù)列,并且會(huì)用統(tǒng)計(jì)表表現(xiàn)統(tǒng)計(jì)資料。 數(shù)據(jù)的整理統(tǒng)計(jì)整理的基本概念與步驟統(tǒng)計(jì)分組分布數(shù)列統(tǒng)計(jì)圖表 數(shù)據(jù)的整理,是根據(jù)統(tǒng)計(jì)研究的目的,將統(tǒng)計(jì)調(diào)查所得到的原始資料進(jìn)行加工,為統(tǒng)計(jì)分析準(zhǔn)備系統(tǒng)化、調(diào)理化的綜合資料的工作過(guò)程。 1、數(shù)據(jù)的整理例如,某班50名學(xué)生,調(diào)查其考分資料
20、如下:77 65 83 56 68 70 99 65 73 72 88 66 74 63 71 84 62 52 80 78 84 79 81 64 58 82 76 62 73 75 89 79 61 65 54 92 86 73 68 51 69 64 78 63 76 68 72 77 81 76. . 按考分分組(分)學(xué)生人數(shù)(人) 60以下60 7070 8080 9090 100 5 15 18 10 2合 計(jì) 50 由表2-1可見(jiàn),整理后的學(xué)生考分資料,較整理前的考分資料明顯要條理、系統(tǒng)。表2-1 統(tǒng)計(jì)整理是統(tǒng)計(jì)調(diào)查的繼續(xù),是統(tǒng)計(jì)分析的前提,它實(shí)現(xiàn)了從個(gè)別單位的標(biāo)志表現(xiàn)(標(biāo)志值)
21、向總體綜合指標(biāo)的過(guò)渡,在統(tǒng)計(jì)研究中起著承前啟后重要的作用。數(shù)據(jù)整理從廣義上講,包括兩種整理.第一是對(duì)統(tǒng)計(jì)調(diào)查所收集到的各種數(shù)據(jù)進(jìn)行分類和匯總,稱為匯總性整理.第二種是對(duì)現(xiàn)成的綜合統(tǒng)計(jì)資料進(jìn)行整理. . 統(tǒng)計(jì)整理的程序: 1.制定整理方案 即根據(jù)研究任務(wù)的要求選擇應(yīng)整理的指標(biāo)并根據(jù)分析任務(wù)的需要,確定具體的分組。 2.審核統(tǒng)計(jì)數(shù)據(jù) 審核方法有邏輯檢查和技術(shù)檢查。見(jiàn)例 3.對(duì)數(shù)據(jù)進(jìn)行編碼和錄入4.統(tǒng)計(jì)分組和匯總5.編制統(tǒng)計(jì)表,繪制統(tǒng)計(jì)圖,顯示整理結(jié)果。 6.統(tǒng)計(jì)資料的積累和開發(fā)例:一次農(nóng)村調(diào)查中某村干部在反映總體情況時(shí):該村總勞力為776人在后面反映勞力的分布狀況時(shí):全村在鄉(xiāng)鎮(zhèn)企業(yè)當(dāng)職工的:187
22、人在村辦企業(yè)當(dāng)職工的:200人其余是種田的:95人482人武漢市居民生活質(zhì)量調(diào)查問(wèn)卷結(jié)果實(shí)例(節(jié)選)區(qū)漢陽(yáng)1武昌 2漢陽(yáng) 3江漢 4江岸5青山 6硚口 7洪山2編號(hào)03870387A1性別1.男 2.女2A2年齡39歲39A3文化程度1.小學(xué)及以下 2.初中 3.高中及中專 4.大專及以上3A4職業(yè)1.生產(chǎn)、運(yùn)輸工人和有關(guān)人員2.商業(yè)人員 3.黨政企事業(yè)單位負(fù)責(zé)人4.服務(wù)人員 5.黨政企事業(yè)單位工作人員6.個(gè)體經(jīng)營(yíng)者 7.各類專業(yè)技術(shù)人員8.離退休人員 9.其他(請(qǐng)寫明) 。2 2. 統(tǒng)計(jì)分組的定義、作用、原則、種類統(tǒng)計(jì)分組是根據(jù)統(tǒng)計(jì)研究的目的,選擇某一標(biāo)志作為分組的依據(jù),將總體分成若干個(gè)不同
23、的組.舉例從分組的性質(zhì)來(lái)看,分組兼有分和合雙重含義.對(duì)總體而言是“分”,即將總體分為性質(zhì)相異的若干組成部分;對(duì)個(gè)體而言是“合”,即將性質(zhì)相同的個(gè)體組合起來(lái).例如,企業(yè)按經(jīng)濟(jì)類型分組:國(guó)有企業(yè) 集體企業(yè) 個(gè)體企業(yè) 其它企業(yè)學(xué)生按考分分組:60分以下 (不及格)6070分 (及格)7080分 (中等)8090分 (良好)90100分(優(yōu)秀)分組的作用:劃分現(xiàn)象的類型;揭示現(xiàn)象內(nèi)部結(jié)構(gòu);分析現(xiàn)象之間的依存關(guān)系.分組的原則:窮盡原則:使總體中的每一個(gè)單位都應(yīng)有組可歸.互斥原則:在特定的分組標(biāo)志下,總體中的任何一個(gè)單位的只能歸屬于某一組,而不能同時(shí)或可能歸屬于幾個(gè)組.1)按分組標(biāo)志的多少簡(jiǎn)單分組:就是對(duì)
24、研究現(xiàn)象按一個(gè)標(biāo)志進(jìn)行分組. 復(fù)合分組:用兩個(gè)或兩個(gè)以上標(biāo)志分組,即先按一個(gè)標(biāo)志分組,在此基礎(chǔ)上再按第二個(gè)標(biāo)志分小組,又再層疊地按第三個(gè)標(biāo)志分成更小的組,這稱為復(fù)合分組.2)按分組標(biāo)志的性質(zhì)不同品質(zhì)分組:按品質(zhì)(或?qū)傩?標(biāo)志進(jìn)行分組.品質(zhì)分組所形成的數(shù)列稱為品質(zhì)數(shù)列.變量分組:按數(shù)量標(biāo)志分組,數(shù)量標(biāo)志的變異性體現(xiàn)在它不斷變動(dòng)自身的數(shù)量上,故也稱為變量分組.變量分組所形成的數(shù)列稱為變量數(shù)列. 分組的種類2)按任務(wù)與作用的不同類型分組:總體按主要的品質(zhì)標(biāo)志分組,多屬于類型分組.結(jié)構(gòu)分組:總體按主要的數(shù)量標(biāo)志分組,多屬于結(jié)構(gòu)分組分析分組:按照研究對(duì)象總體諸標(biāo)志依存關(guān)系。分組標(biāo)志的選取與分組體系 統(tǒng)計(jì)
25、分組的關(guān)鍵在于分組標(biāo)志的選擇。 必須根據(jù)現(xiàn)象所處的具體歷史條件(經(jīng)濟(jì)條件),按照統(tǒng)計(jì)研究的目的,選擇具有本質(zhì)性的標(biāo)志作為分組標(biāo)志。根據(jù)統(tǒng)計(jì)研究的目的選擇分組標(biāo)志。選擇能夠反映現(xiàn)象本質(zhì)的分組標(biāo)志。結(jié)合現(xiàn)象所處的具體歷史條件(經(jīng)濟(jì)條件)選擇分組標(biāo)志。- 簡(jiǎn)單分組:按單個(gè)標(biāo)志進(jìn)行分組。- 復(fù)合分組:按兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行分組。 - 分組體系:對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象需要從各方面進(jìn)行觀察和分析研究,需要采用一系列相互聯(lián)系、相互補(bǔ)充的標(biāo)志對(duì)現(xiàn)象進(jìn)行多種分組,這些分組結(jié)合起來(lái)構(gòu)成一個(gè)體系,叫做分組體系。 分組標(biāo)志的選取與分組體系分組體系對(duì)現(xiàn)象進(jìn)行多種分組、再排列起來(lái)的結(jié)果平行分組體系:按多個(gè)標(biāo)志進(jìn)行簡(jiǎn)單分組,再排
26、列層疊復(fù)合分組體系:先進(jìn)行多種復(fù)合分組,再排列分組體系對(duì)現(xiàn)象的認(rèn)識(shí)更加全面、深刻分組方法品質(zhì)分組法數(shù)量分組法. . 品質(zhì)分組(按品質(zhì)標(biāo)志分組)國(guó)民經(jīng)濟(jì)按產(chǎn)業(yè)分組: 第一產(chǎn)業(yè) 第二產(chǎn)業(yè) 第三產(chǎn)業(yè)人口按性別分組: 男性 女性 用文字來(lái)表示各組性質(zhì)上的差別 . . 數(shù)量分組(按數(shù)量標(biāo)志分組)單項(xiàng)式分組組距式分組用數(shù)量來(lái)表示各組性質(zhì)上的差別 . . (即一個(gè)組只有一個(gè)變量值)單項(xiàng)式分組 單項(xiàng)式分組適用于:變量值變化范圍不大、不同變量值個(gè)數(shù)較少的離散變量。居民家庭按子女?dāng)?shù)分組:0 1 2 3 (離散變量)例如:. . 將相鄰幾個(gè)變量值并為一組(形成一個(gè)區(qū)間),即一個(gè)組有一個(gè)變量值的變動(dòng)范圍。例如:企業(yè)按
27、人數(shù)分組 499及以下 500 999 1000 2999 3000及以上 工人按工資分組 600 700 700 800 800 1200 1200 1500 組距式分組適用于:變量值變化范圍較大、不同變量值個(gè)數(shù)較多的離散變量及連續(xù)變量。(離散變量)(連續(xù)變量) 注意:連續(xù)型變量的數(shù)值不能一一列舉,故其只能采用組距式分組。 組距式分組(應(yīng)注意). . 組限及劃分方法 組距與組數(shù) 組中值 . . 組距與組數(shù)組距=本組上限前組上限(通用公式)組距=本組上限本組下限(重疊組限)全距=最大變量值最小變量值 組距與組數(shù)一般是用整數(shù)表示。學(xué)生按考分分組(分) 50 60 60 70 70 80 80 9
28、0 90 100等距分組異距分組. . 即各組組距相同的分組。等距分組:(在變量值分布比較均勻時(shí)采用)異距分組:即各組組距不都相等的分組。(在變量值分布很不均勻時(shí)采用) 根據(jù)事物性質(zhì)變化的數(shù)量界限來(lái)確定組距。如人口按年齡分組,要注意不同年齡生理變化的特點(diǎn),可分為: 1歲以下; 16 歲; 712 歲; 1318 歲; 1959 歲; 60 歲以上。 499及以下 500 999 1000 2999 3000及以上 600 700 700 800 800 1200 1200 1500 . . 組限及劃分方法工人按工資分組:企業(yè)按人數(shù)分組:重疊組限不重疊組限組限的劃分(只適用于離散變量) 500及
29、以下 500 1000 1000 3000 3000及以上 當(dāng)某單位的變量值剛好等于相鄰兩組的上下限時(shí),一般把此值歸到作為下限的那一組中,即遵循“上限不在內(nèi)” 原則。. . 組中值指各組上限和下限之間的中點(diǎn)數(shù)值。(假定組內(nèi)標(biāo)志值均勻分布)(考分:52 54 57 58 59) 按考分分組 50 60 60 70 70 80 80 90 90 100 55 75 658595(考分:51 52 53 54 55)不均勻分布50 55 60 均勻分布 50 55 60 組中值封口組開口組. . 若第一組出現(xiàn)“以下”或最末組出現(xiàn)“以上”字樣的組叫做開口組。首組組中值=首組上限相鄰組組距的一半=末組下
30、限+相鄰組組距的一半末組組中值50 102100 + 102其組中值的確定:.首組:末組:按考分分組 組中值 50 60 55 60 70 65 70 80 75 80 90 85 90 100 9550以下45. . 統(tǒng)計(jì)分組的種類(一)按照分組標(biāo)志 的個(gè)數(shù)不同 .(二)按照分組標(biāo)志的性質(zhì)不同 .簡(jiǎn)單分組-平行分組體系 復(fù)合分組復(fù)合分組體系 品質(zhì)分組數(shù)量分組-變量數(shù)列單項(xiàng)式分組 組距式分組 離散變量 連續(xù)變量等距分組-異距分組開口組-閉口組組限、組距、組中值組距式分組(重疊組限)簡(jiǎn)單分組 復(fù)合分組 品質(zhì)數(shù)列 分組聯(lián)圖 3. 次數(shù)分布次數(shù)分布:在統(tǒng)計(jì)分組的基礎(chǔ)上,將總體的所有單位按組歸類整理,
31、并按一定順序排列,形成總體中各個(gè)單位在各組間的分布.頻數(shù)(次數(shù)):落在各組中的數(shù)據(jù)個(gè)數(shù).頻率:次數(shù)與總次數(shù)的比值.把各組的頻數(shù)或頻率按一定的順序排列而成的數(shù)列,稱為次數(shù)分布數(shù)列,簡(jiǎn)稱分布數(shù)列.按考分 分 組 人數(shù)(人)頻率()5060 6070 7080 8090 9010051518102103036204合 計(jì)50100次數(shù)(頻數(shù))頻率總體的分組標(biāo)志次數(shù)分布頻率分布注:正確理解比例與比率這兩個(gè)概念.比例(Proportion):也稱構(gòu)成比,它是一個(gè)樣本(或總體)中各個(gè)部分的數(shù)據(jù)與全部數(shù)據(jù)之比,通常用于反映樣本(或總體)的構(gòu)成或結(jié)構(gòu).比例100=百分比(Percentage),用%表示.顯然
32、比例的取值范圍是:0,1比率(Ratio)是樣本(或總體)中不同類別數(shù)據(jù)之間的比值.由于比率不是部分與整體之間的對(duì)比關(guān)系,因而比值可能大于1.綜上:頻率實(shí)際上是比例. 分布數(shù)列的種類(按分組標(biāo)志不同)品質(zhì)數(shù)列:按品質(zhì)標(biāo)志分組形成,有各組名稱和次數(shù)組成.變量數(shù)列:按數(shù)量標(biāo)志分組形成,可分為單項(xiàng)式和組距式 兩種.例 為研究廣告市場(chǎng)的狀況,一家廣告公司在某城市隨機(jī)抽取200人就廣告問(wèn)題做了郵寄問(wèn)卷調(diào)查,其中一個(gè)問(wèn)題是:“您比較關(guān)心下列哪一類廣告?”(1)商品廣告;(2)服務(wù)廣告;(3)金融廣告;(4)房地產(chǎn)廣告;(5)招生招聘廣告;(6)其他廣告.某城市居民關(guān)注廣告類型的頻數(shù)分布單項(xiàng)數(shù)列:總體按單項(xiàng)
33、式分組而形成的變量數(shù)列,每一組由一個(gè)變量值來(lái)表示.適用于組數(shù)不多和組值變動(dòng)幅度不大.組距數(shù)列:將全部變量值依次劃分為若干區(qū)間,每組有一個(gè)區(qū)間表示.適用于變量個(gè)數(shù)較多、變動(dòng)幅度較大. 變量數(shù)列的編制 確定變量數(shù)列的形式(1)若變量是連續(xù)型變量,只能采用組距數(shù)列表示.(2)若變量是離散型變量 (a)在變量值不多的情況下,可編制單項(xiàng)數(shù)列; (b)若變量值個(gè)數(shù)較多,編制組距數(shù)列. 組距數(shù)列的編制步驟 排序并求出全距(最大值-最小值); 確定組數(shù)和組距; 確定組限和組中值; 歸組并計(jì)算出各組的次數(shù); 顯示或打印出次數(shù)分布表.組數(shù): 一組數(shù)據(jù)所分成組的個(gè)數(shù).斯特杰斯經(jīng)驗(yàn)公式計(jì)算結(jié)果只要有小數(shù),就把小數(shù)舍去
34、,并在整數(shù)位上加1,不采用四舍五入.組限:在組距式分組中,一個(gè)組的最小值稱為下限,最大值稱為上限.組距:每個(gè)組上限和下限之間的距離. 等距分組:各組的組距相等(變量值變動(dòng)均勻). 異距分組:各組的組距不相等(現(xiàn)象變動(dòng)很不均衡,變量值 變動(dòng)幅度較大,宜采用).確定組限對(duì)于連續(xù)型變量,通常以一個(gè)數(shù)值作為相鄰兩組的上限和下限;遵循“上限不在內(nèi)原則”對(duì)于離散型變量,上下限可以重疊,也可以不重疊.注:最小組的下限低于或等于最小變量值,最大組的上限高于或等于最大變量值.閉口組:組距的上限、下限都齊全.開口組:在組距分組中,為避免出現(xiàn)空白組或個(gè)別極端值被漏掉,第一組和最后一組采取“以下”及“以上”的開口組.
35、例2在一批燈泡中隨機(jī)抽取100只進(jìn)行測(cè)試,測(cè)得燈泡的使用壽命(單位:小時(shí))數(shù)據(jù)如下,要求編制次數(shù)分布表. 4. 洛倫茲曲線和基尼系數(shù) 洛倫茲曲線1. 20世紀(jì)初美國(guó)經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茲(M.E. Lorentz)根據(jù)意大利經(jīng)濟(jì)學(xué)家帕累托(V. Pareto)提出的“二八原理” 和收入分配公式繪制而成.2. 描述收入和財(cái)富分配性質(zhì)的曲線.橫軸表示累積的人口百分比,縱軸表示累積的收入或財(cái)富百分比.3.45度直線是絕對(duì)平均線,表明收入分配絕對(duì)平均;橫軸與圖中最右邊的縱軸構(gòu)成絕對(duì)不平均線,表明收入分配絕對(duì)不平均.根據(jù)實(shí)際資料所作的反映實(shí)際收入分配狀況的曲線位于絕對(duì)平均線和絕對(duì)不平均線之間,稱為洛倫
36、茲曲線. 洛倫茲曲線與絕對(duì)平均線越接近,表示收入分配越平均,而 洛倫茲曲線向下彎曲越大,與絕對(duì)不平均線越接近,表示收 入分配越不平均.基尼系數(shù) 20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(G. Gini)根據(jù)洛倫茲曲線給出了衡量收入分配平均程度的指標(biāo),即基尼系數(shù),用公式表示為:式中: A表示實(shí)際收入曲線與絕對(duì)平均線之間的面積;B表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積.如果A=0,則基尼系數(shù)=0,表示收入分配絕對(duì)平均.如果B=0,則基尼系數(shù)=1,表示收入分配絕對(duì)不平均.基尼系數(shù)在0 和1之間取值. 一般認(rèn)為,基尼系數(shù)若小于0.2,表明分配平均但缺乏效率;基尼系數(shù)在0.2至0.4之間是比較適當(dāng)?shù)?即一個(gè)社會(huì)既有效率又沒(méi)有造成極大的分配不公;基尼系數(shù)在0.4時(shí)被認(rèn)為是收入分配不公平的警戒線.超過(guò)了0.6,則表示可能由于收入分配不公導(dǎo)致社會(huì)不穩(wěn)定.統(tǒng)計(jì)表統(tǒng)計(jì)表
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘇州2025年江蘇蘇州張家港市招聘?jìng)浒钢平處?7人筆試歷年參考題庫(kù)附帶答案詳解
- 秦皇島2025年河北秦皇島市第二醫(yī)院招聘人事代理人員115人筆試歷年參考題庫(kù)附帶答案詳解
- 梧州2025年廣西梧州市事業(yè)單位招聘中小學(xué)幼兒園教師507人筆試歷年參考題庫(kù)附帶答案詳解
- 2025年中國(guó)多流水表市場(chǎng)調(diào)查研究報(bào)告
- 德州2024年山東德州天衢新區(qū)第三批招聘教師60人筆試歷年參考題庫(kù)附帶答案詳解
- 2025至2031年中國(guó)高亮度充電式手筒行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年自動(dòng)補(bǔ)償式交流穩(wěn)壓器項(xiàng)目可行性研究報(bào)告
- 2025年粉碎自動(dòng)送料機(jī)項(xiàng)目可行性研究報(bào)告
- 2025年生物活能全效眼霜項(xiàng)目可行性研究報(bào)告
- 2025至2031年中國(guó)文丘里噴嘴行業(yè)投資前景及策略咨詢研究報(bào)告
- 香港及內(nèi)地傳真號(hào)碼
- 湖北中煙工業(yè)限責(zé)任公司2025年招聘(技術(shù)類和業(yè)務(wù)類崗位)【43人】高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024-2025學(xué)年成都市成華區(qū)七年級(jí)上英語(yǔ)期末考試題(含答案)
- 石家莊市長(zhǎng)安區(qū)學(xué)年三年級(jí)數(shù)學(xué)第一學(xué)期期末檢測(cè)試題含解析
- 2025年中國(guó)一汽招聘筆試參考題庫(kù)含答案解析
- 特殊家長(zhǎng)課后溝通技巧培訓(xùn)
- 超聲輸卵管造影護(hù)理配合
- 心內(nèi)科心衰一病一品護(hù)理成果匯報(bào)
- 2025檢驗(yàn)檢測(cè)中心年度工作總結(jié)及工作計(jì)劃
- 2024年總經(jīng)理助理年終工作總結(jié)(3篇)
- 2024年考研英語(yǔ)(二)真題及參考答案
評(píng)論
0/150
提交評(píng)論