第三章--統(tǒng)計(jì)數(shù)據(jù)處理課件_第1頁(yè)
第三章--統(tǒng)計(jì)數(shù)據(jù)處理課件_第2頁(yè)
第三章--統(tǒng)計(jì)數(shù)據(jù)處理課件_第3頁(yè)
第三章--統(tǒng)計(jì)數(shù)據(jù)處理課件_第4頁(yè)
第三章--統(tǒng)計(jì)數(shù)據(jù)處理課件_第5頁(yè)
已閱讀5頁(yè),還剩102頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、經(jīng)濟(jì)管理類專業(yè)應(yīng)用型本科教材統(tǒng) 計(jì) 學(xué) 電子工業(yè)出社出版 主編 杜家龍第三章 統(tǒng)計(jì)數(shù)據(jù)處理 教學(xué)目的 了解統(tǒng)計(jì)數(shù)據(jù)處理的意義、內(nèi)容和程序,掌握統(tǒng)計(jì)數(shù)據(jù)分組、編制變量數(shù)列、制作統(tǒng)計(jì)表、統(tǒng)計(jì)圖的方法和技術(shù)。能夠應(yīng)用數(shù)據(jù)處理技術(shù)對(duì)客觀現(xiàn)象的數(shù)量特征,作出基本的統(tǒng)計(jì)描述。 重點(diǎn)難點(diǎn) 統(tǒng)計(jì)數(shù)據(jù)預(yù)處理,統(tǒng)計(jì)分組、編制變量數(shù)列,制作統(tǒng)計(jì)表和統(tǒng)計(jì)圖。第一節(jié)統(tǒng)計(jì)數(shù)據(jù)處理概述 一、統(tǒng)計(jì)數(shù)據(jù)處理的概念和內(nèi)容(一)統(tǒng)計(jì)數(shù)據(jù)處理的意義統(tǒng)計(jì)數(shù)據(jù)處理就是對(duì)搜集得到的初始數(shù)據(jù)進(jìn)行審核、分組、匯總,使之條理化、系統(tǒng)化,變成能反映總體特征的綜合數(shù)據(jù)的工作過程。統(tǒng)計(jì)數(shù)據(jù)處理,是統(tǒng)計(jì)由對(duì)個(gè)別現(xiàn)象的認(rèn)識(shí)上升到對(duì)總體現(xiàn)象認(rèn)識(shí)的一個(gè)重要階

2、段,在統(tǒng)計(jì)研究工作中起著承先啟后的作用,它既是數(shù)據(jù)搜集的繼續(xù)和深化,又是數(shù)據(jù)分析的基礎(chǔ)和前提。 (二)數(shù)據(jù)處理的原則和內(nèi)容 1.數(shù)據(jù)處理的原則 統(tǒng)計(jì)數(shù)據(jù)處理必須遵循目的性、聯(lián)系性和簡(jiǎn)明性三原則。 統(tǒng)計(jì)數(shù)據(jù)處理原則目的性原則聯(lián)系性原則簡(jiǎn)明性原則2.統(tǒng)計(jì)數(shù)據(jù)處理的內(nèi)容確定指標(biāo)和分組原始數(shù)據(jù)預(yù)處理匯總計(jì)算各指標(biāo)編制統(tǒng)計(jì)表系統(tǒng)積累統(tǒng)計(jì)數(shù)據(jù)第一,根據(jù)統(tǒng)計(jì)研究的目的和要求,確定應(yīng)該計(jì)算的指標(biāo),并根據(jù)分析的需要確定具體的分組;第二,對(duì)大量的原始數(shù)據(jù)進(jìn)行預(yù)處理;第三,對(duì)各指標(biāo)進(jìn)行匯總,計(jì)算出各組單位數(shù)、總體單位數(shù)以及各組或總體的有關(guān)標(biāo)志值之和;第四,將匯總處理的數(shù)據(jù)編制成統(tǒng)計(jì)表;第五,對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行系統(tǒng)積累。

3、 (三)統(tǒng)計(jì)數(shù)據(jù)預(yù)處理 1.數(shù)據(jù)的審核與篩選 對(duì)于通過直接調(diào)查取得的原始數(shù)據(jù),應(yīng)主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。 完整性審核主要是檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全等。統(tǒng)計(jì)數(shù)據(jù)預(yù)處理篩選審核訂正排序 準(zhǔn)確性審核主要包括兩個(gè)方面:一是檢查數(shù)據(jù)資料是否真實(shí)地反映了客觀實(shí)際情況,內(nèi)容是否符合實(shí)際;二是檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等。審核數(shù)據(jù)準(zhǔn)確性的方法主要有邏輯檢查和計(jì)算檢查。 邏輯檢查主要是從定性角度審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項(xiàng)目或數(shù)字之間有無相互矛盾的現(xiàn)象。 計(jì)算檢查是檢查調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無錯(cuò)誤。 對(duì)于第二手?jǐn)?shù)據(jù),除了

4、對(duì)其完整性和準(zhǔn)確性進(jìn)行審核外,還應(yīng)著重審核數(shù)據(jù)的適用性和時(shí)效性。 首先應(yīng)弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料,以便確定這些數(shù)據(jù)是否符合分析研究的需要,是否需要重新加工處理等。 此外,還要對(duì)數(shù)據(jù)的時(shí)效性進(jìn)行審核,一般來說,應(yīng)盡可能使用最新的統(tǒng)計(jì)數(shù)據(jù)。 2.數(shù)據(jù)的訂正 第一,對(duì)可以肯定的一般錯(cuò)誤,即代為更正,并向有關(guān)單位核對(duì); 第二,對(duì)可疑之處或無法代為更正的錯(cuò)誤,通知原報(bào)單位復(fù)查更正; 第三,對(duì)在個(gè)別單位發(fā)現(xiàn)的有代表性的重大差錯(cuò),除通知原報(bào)單位更正外,還要通報(bào)尚未報(bào)送資料的單位,以防止類似錯(cuò)誤的發(fā)生; 第四,對(duì)于違反統(tǒng)計(jì)法規(guī)的,應(yīng)查明責(zé)任,予以適當(dāng)處理。 3.數(shù)據(jù)的排序 數(shù)據(jù)排序就是按

5、照一定的順序?qū)?shù)據(jù)排列,以便初步顯示數(shù)據(jù)的一些明顯特征和規(guī)律,為研究者找到解決問題的線索。此外,排序還有助于對(duì)數(shù)據(jù)的檢查糾錯(cuò),為分組、匯總提供依據(jù)。 第二節(jié) 統(tǒng)計(jì)分組 一、統(tǒng)計(jì)分組的概念和性質(zhì) 統(tǒng)計(jì)分組的概念 統(tǒng)計(jì)數(shù)據(jù)分組是指根據(jù)統(tǒng)計(jì)研究的目的和要求,將總體單位或全部數(shù)據(jù)按照一定的標(biāo)志劃分成若干類型(組),使組內(nèi)的差異盡可能小,組間的差別盡可能明顯,從而使大量無序的、混沌的數(shù)據(jù)變?yōu)橛行虻?、反映總體特征的資料。 統(tǒng)計(jì)分組的特性 首先,統(tǒng)計(jì)分組具有分與合的雙重功能,是分與合的對(duì)立統(tǒng)一; 其次,統(tǒng)計(jì)分組的目的是要在同質(zhì)性的基礎(chǔ)上研究總體的內(nèi)在差異性; 第三,統(tǒng)計(jì)分組在體現(xiàn)分組標(biāo)志的組間差異的同時(shí),卻

6、可能掩蓋了其他標(biāo)志的組間差異,因此,統(tǒng)計(jì)分組存在一定的局限性; 第四,統(tǒng)計(jì)分組的關(guān)鍵是選擇分組標(biāo)志和劃分各組界限。二、統(tǒng)計(jì)分組的主要作用 1.劃分現(xiàn)象的不同類型 統(tǒng)計(jì)分組的最基本作用,就是把復(fù)雜自然或社會(huì)現(xiàn)象劃分為各個(gè)性質(zhì)不同的組成部分,以認(rèn)識(shí)事物質(zhì)的差別。 例如,把社會(huì)產(chǎn)品劃分為生產(chǎn)資料和消費(fèi)資料;將國(guó)民經(jīng)濟(jì)劃分為第一產(chǎn)業(yè)、第二產(chǎn)業(yè)和第三產(chǎn)業(yè)等。 2.反映總體的內(nèi)部結(jié)構(gòu) 在統(tǒng)計(jì)分組基礎(chǔ)上,計(jì)算各部分占總體的比重可揭示總體內(nèi)部結(jié)構(gòu),表明總體中各部分與整體以及各部分之間存在的數(shù)量關(guān)系,從而反映事物的構(gòu)成特征和性質(zhì)。 通過比較總體內(nèi)部結(jié)構(gòu)的動(dòng)態(tài)變化還可以揭示現(xiàn)象發(fā)展變化過程和規(guī)律。 3.分析現(xiàn)象之

7、間的依存關(guān)系 客觀現(xiàn)象之間存在著廣泛的相互依存關(guān)系,根據(jù)研究目的,按照一定標(biāo)志對(duì)總體進(jìn)行分組,然后觀察與分組標(biāo)志相關(guān)標(biāo)志的其它標(biāo)志的數(shù)量變化,可揭示相關(guān)事物之間的數(shù)量依存關(guān)系。 如農(nóng)作物的耕作深度與收成率之間的關(guān)系、家庭收入與生活費(fèi)支出之間的關(guān)系、市場(chǎng)商品價(jià)格與其需求量之間的關(guān)系等等,都可以通過統(tǒng)計(jì)分組來研究。三、統(tǒng)計(jì)分組的類型 統(tǒng)計(jì)數(shù)據(jù)分組按反映研究對(duì)象的特點(diǎn)和分組的形式分類主要有以下類型。 (一)按照分組標(biāo)志的性質(zhì)不同,可將統(tǒng)計(jì)分組分為屬性分組與變量分組。 1.屬性分組 屬性分組是按照反映事物屬性的品質(zhì)標(biāo)志進(jìn)行的分組。例如,人口按性別、民族、文化程度、職業(yè)、婚姻狀況等標(biāo)志分組,工業(yè)企業(yè)按經(jīng)

8、濟(jì)類型、行業(yè)、地區(qū)等標(biāo)志分組。 2.變量分組 變量分組是指按照數(shù)量標(biāo)志進(jìn)行的分組。變量分組的組限是指各種不等的變量值。例如,把工業(yè)企業(yè)按生產(chǎn)能力分為:10億元以下、10100億元、100億元以上三個(gè)組,把學(xué)生總體按愛好學(xué)科數(shù)分為1個(gè)、2個(gè)、3個(gè)、3個(gè)以上等組。 (二)簡(jiǎn)單分組、復(fù)合分組與分組體系 按照分組標(biāo)志的多少和分組的形式不同,可將統(tǒng)計(jì)分組分為簡(jiǎn)單分組、復(fù)合分組與分組體系。 1.簡(jiǎn)單分組 所謂簡(jiǎn)單分組,就是將總體按一個(gè)標(biāo)志進(jìn)行的分組。這種分組只能從某一方面去說明總體特征。例如,某地工業(yè)企業(yè)按規(guī)模分組就是一個(gè)簡(jiǎn)單分組:國(guó)有企業(yè)集體企業(yè)股份合作企業(yè)聯(lián)營(yíng)企業(yè) 2.復(fù)合分組 復(fù)合分組是按照兩個(gè)或兩

9、個(gè)以上的標(biāo)志,重疊起來對(duì)總體進(jìn)行分組。這里所謂重疊,是指在前一次分組結(jié)果的內(nèi)部再進(jìn)行下一次分組。例如,某地工業(yè)企業(yè)先按規(guī)模標(biāo)志、再按所有制標(biāo)志所進(jìn)行的復(fù)合分組;某高校教師按職務(wù)、年齡和性別分組。 國(guó)營(yíng)經(jīng)濟(jì)大型企業(yè) 私營(yíng)經(jīng)濟(jì) 其他經(jīng)濟(jì) 國(guó)營(yíng)經(jīng)濟(jì)中型企業(yè) 私營(yíng)經(jīng)濟(jì) 其他經(jīng)濟(jì) 國(guó)營(yíng)經(jīng)濟(jì)小型企業(yè) 私營(yíng)經(jīng)濟(jì) 其他經(jīng)濟(jì) 高校教師的復(fù)合分組第一標(biāo)志(職務(wù))第二標(biāo)志(年齡)第三標(biāo)志(性別)高級(jí)職稱(教授、副教授)45歲以上男女45歲以下男女非高級(jí)職稱(講師、助教)45歲以上男女45歲以下男女 3.分組體系 分組體系是按照兩個(gè)或兩個(gè)以上相互聯(lián)系、相互補(bǔ)充的標(biāo)志,對(duì)被研究對(duì)象進(jìn)行平行分組所形成的體系。分組體系可以

10、從不同角度、不同方面對(duì)某一現(xiàn)象作出比較全面的說明。 例如,我國(guó)2009年國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)中的人口構(gòu)成統(tǒng)計(jì)表(公報(bào)表15),就是一個(gè)分組體系。表3.1 我國(guó)2009年人口數(shù)及其構(gòu)成指標(biāo)年末人數(shù)(萬人)比重(%)全國(guó)總?cè)丝谄渲校撼擎?zhèn) 鄉(xiāng)村其中:男性 女性其中:014 1459 60歲及以上 其中:65歲及以上133474621867128868652648222466392097167141130910046.653.451.448.618.569.012.58.5 四、統(tǒng)計(jì)分組方法等距分組不等距分組單項(xiàng)式分組組距式分組分組方法按品質(zhì)標(biāo)志分組按數(shù)量標(biāo)志分組 (一)按品質(zhì)標(biāo)志分組 按品質(zhì)標(biāo)

11、志分組又分簡(jiǎn)單品質(zhì)分組和復(fù)雜品質(zhì)分組兩種情況。 1.簡(jiǎn)單的品質(zhì)標(biāo)志分組 簡(jiǎn)單的品質(zhì)分組是指分組標(biāo)志一經(jīng)確定,組的名稱和組數(shù)也就隨之確定,而且各單位應(yīng)分在哪一組也比較明確,不存在組與組之間界限區(qū)分困難的分組。例如,人口按性別分為男、女兩組,具體到每一個(gè)人應(yīng)該分在哪一組是一目了然的。 2.復(fù)雜的品質(zhì)標(biāo)志分組 復(fù)雜的品質(zhì)分組是指分組標(biāo)志選定以后組間界限不易劃分,存在交叉過渡形態(tài),總體中的各單位歸并于何組比較困難的統(tǒng)計(jì)分組。 為保證各種統(tǒng)計(jì)分類的科學(xué)性、統(tǒng)一性和完整性,便于各部門掌握和使用,通常由國(guó)家統(tǒng)計(jì)局會(huì)同有關(guān)部門制定統(tǒng)一分類目錄,在全國(guó)范圍內(nèi)實(shí)行。如國(guó)民經(jīng)濟(jì)行業(yè)分類目錄、商品分類目錄等。 (二)

12、按數(shù)量標(biāo)志分組 1.數(shù)量標(biāo)志分組的意義 按數(shù)量標(biāo)志分組是指選擇反映事物數(shù)量差異的數(shù)量標(biāo)志,根據(jù)其變異范圍區(qū)分各組界限,將總體劃分為若干個(gè)性質(zhì)不同的組成部分。 例如,研究居民家庭貧富狀態(tài)時(shí),按恩格爾系數(shù)(即食品類支出占整個(gè)居民家庭消費(fèi)支出的比重)分組,將其在60以上的劃分為貧困家庭;5060的為溫飽家庭;4050為小康家庭;40以下的為富裕家庭。 2.數(shù)量標(biāo)志分組的方式 根據(jù)總體各單位某一數(shù)量標(biāo)志值的變動(dòng)特征,可供選擇的分組方式有單項(xiàng)式分組和組距式分組兩種。 (1)單項(xiàng)式分組 單項(xiàng)式分組是指按每一個(gè)具體變量值對(duì)現(xiàn)象總體所進(jìn)行的分組。如某班學(xué)生按年齡分組(見表3.2)。表3.2 某班學(xué)生按年齡分組

13、表按年齡分組(歲)人數(shù)(人)比例()1718192021510209610.0020.0040.0018.0012.00合計(jì)50100.00 單項(xiàng)式分組一般適用于離散型變量,且變量值不多、變動(dòng)范圍較小的情況。 (2)組距式分組 組距式分組是指按變量值的一定范圍對(duì)現(xiàn)象總體所進(jìn)行的分組。在現(xiàn)象總體的變動(dòng)范圍內(nèi),將其劃分為若干個(gè)區(qū)間,各區(qū)間內(nèi)的所有變量值作為一組,其性質(zhì)相同,組與組之間的性質(zhì)相異。例如,某校學(xué)生家庭收入分組情況統(tǒng)計(jì)表就是一個(gè)組距式分組表(見表3.3)。 組距式分組一般在變量值變動(dòng)幅度較大的條件下采用。在組距式分組中,涉及到組限、組距、組數(shù)、組中值等分組要素。表3.3(a)某校學(xué)生家庭

14、收入分組統(tǒng)計(jì)表按年收入分組(萬元)學(xué)生數(shù)(人)占總戶數(shù)比例()3以下34455667788以上90025104360289014406506306.718.832.621.610.84.94.7合計(jì)13380100.0表3.3(b)某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)110以下110115115120120125125130130135135以上358141064610162820128合計(jì)50100 組限組限是用來表示各組之間界限的變量值,是決定事物質(zhì)量的數(shù)量界限。其中,在每一組中最小的變量值為下組限,簡(jiǎn)稱為下限;最大的變量值為上組限,簡(jiǎn)稱為上限。組距式分組中有

15、重疊式組限和非重疊式組限兩種組限表示方法。 組距組距是指一組變量值的區(qū)間長(zhǎng)度,也就是每一組的上限與下限之間的距離。即: 組距上限下限。 組數(shù)組數(shù)即分組個(gè)數(shù)。 組中值組中值即組距的中點(diǎn)數(shù)值,它是各組變量值的代表水平。 重合式組限組的組中值非重合式組限組的組中值缺下限組的組中值鄰組組中值鄰組組距缺上限組的組中值鄰組組中值十鄰組組距 五、統(tǒng)計(jì)資料的再分組 統(tǒng)計(jì)資料的再分組是指把統(tǒng)計(jì)分組資料按某種要求重新劃定各組界限,再將資料中的單位數(shù)或比重分布做出相應(yīng)的調(diào)整。 例如,表3.4所示某工業(yè)部門勞動(dòng)生產(chǎn)率的分組資料與研究目的不一致,主要是組數(shù)多、組距小,不利于簡(jiǎn)明地觀察問題,需要進(jìn)行再分組。表3.4某工業(yè)

16、部門勞動(dòng)生產(chǎn)率分組表組號(hào)按勞動(dòng)生產(chǎn)率分組(千元/人)企業(yè)數(shù)比例(%)職工數(shù)比例(%)總產(chǎn)值比例(%)123456789106以下677889910101111121213131414以上11141015209124236.209.4810.7816.2620.0012.9311.545.402.694.729.6612.8313.0016.7819.1210.989.043.821.842.93合 計(jì)100100.00100.00 為了與相鄰地區(qū)同行業(yè)的同類指標(biāo)進(jìn)行比較,將企業(yè)的勞動(dòng)生產(chǎn)率重新劃分為四組,即:人均產(chǎn)值在12.5千元以上的為優(yōu)秀企業(yè);1012.5千元之間的為良好企業(yè);7.510千

17、元之間的為一般企業(yè);7.5千元以下的為后進(jìn)企業(yè)。其再分組的結(jié)果如表3.5所示:表3.5某工業(yè)部門勞動(dòng)生產(chǎn)率再分組表組別按勞動(dòng)生產(chǎn)率分組(千元/人)企業(yè)數(shù)比例(%)職工數(shù)比例(%)總產(chǎn)值比例(%)ABCD7.5以下7.5101012.512.5以上304023721.0741.6527.1710.1128.9942.4021.93 6.68合 計(jì)100100.00100.00 表3.5再分組的步驟如下: 第一步 確定再分組的各自范圍。 即A組包括原第1組、第2組的全部和第3組的一部分; B組包括原第3組的一部分和第4組、第5組的全部; C組包括原第6組、第7組的全部和第8組的一部分; D組包括原

18、第8組的一部分和第9組、第10組的全部。第二步 計(jì)算新組各自相連組的比例??捎孟噙B組的部分組距除以相連組的組距之和而求得。其具體計(jì)算過程為:如A組在相連組中所占比例B組在相連組中所占比例10.50.5同理C組在相連組中所占比例0.5,D組在相連組中所占比例0.50.5 第三步 確定再分組的對(duì)應(yīng)單位數(shù)。即計(jì)算各組變量值的區(qū)間范圍所對(duì)應(yīng)的單位數(shù)(此處為企業(yè)數(shù)比例、職工數(shù)比例和總產(chǎn)值比例)。 其具體計(jì)算過程為: A組企業(yè)數(shù)比例=1114100.5=30%,用同樣方法可得到B組為40,C組為23,D組企業(yè)數(shù)比例為7。 職工數(shù)比例和總產(chǎn)值比例的各組對(duì)應(yīng)數(shù)可按上述計(jì)算過程類推,其結(jié)果見表3.5。 第三節(jié)

19、頻數(shù)分布一、頻數(shù)分布的概念 在分組的基礎(chǔ)上,把所有數(shù)據(jù)或總體單位按組歸并、排列,形成所有數(shù)據(jù)或總體各單位在各組間的分布,稱為頻數(shù)分布,又稱為分布數(shù)列。例如表3.6是我國(guó)2009人口按城鄉(xiāng)分組形成的頻數(shù)分布。表3.6 2009年末我國(guó)大陸人口的城鄉(xiāng)分布按性別分組人口(萬人)f構(gòu)成(%)f/f總?cè)丝诔擎?zhèn)鄉(xiāng)村1334746218671288100.0 46.6 53.4二、頻數(shù)分布的種類頻數(shù)分布按分組標(biāo)志和分組形式的不同可分成如下類別:頻數(shù)分布變量分布單項(xiàng)式頻數(shù)分布組距式頻數(shù)分布 品質(zhì)分布等距式分布異距式分布圖3.1 頻數(shù)分布的種類 ()品質(zhì)頻數(shù)分布 品質(zhì)頻數(shù)分布,簡(jiǎn)稱為品質(zhì)數(shù)列,它是經(jīng)過屬性分組后

20、形成的頻數(shù)分布,其組別表現(xiàn)為一系列的概念或范疇,如表3.6所示。 (二)變量頻數(shù)分布 變量頻數(shù)分布,簡(jiǎn)稱為變量數(shù)列,它是經(jīng)過變量分組后形成的分布數(shù)列,其組別表現(xiàn)為不同的數(shù)值或數(shù)域。變量數(shù)列又分為單項(xiàng)數(shù)列和組距數(shù)列。 1.單項(xiàng)數(shù)列 單項(xiàng)數(shù)列是以一個(gè)變量值為一組編制的變量頻數(shù)分布,如表3.7就是一個(gè)單項(xiàng)數(shù)列。對(duì)離散型變量,且變量值項(xiàng)數(shù)較少、變動(dòng)范圍較小時(shí),可編制單項(xiàng)數(shù)列反映其分布狀況。表3.7某高校在校學(xué)生年齡分布按年齡分組(歲)學(xué)生人數(shù)(人)f比重(%)f/f171819202122235418922828313197245.418.822.728.113.0 9.6 2.4合 計(jì)1006100

21、.0 2.組距數(shù)列 組距數(shù)列是以表示一定變動(dòng)范圍的兩個(gè)變量值構(gòu)成的組所編制的變量頻數(shù)分布,如表3.8就是一個(gè)組距數(shù)列。對(duì)于連續(xù)型變量或項(xiàng)數(shù)較多、變動(dòng)范圍較大的離散型變量,需要用組距數(shù)列去反映其分布情況。表3.8某集團(tuán)公司職工分組表按月工資分組(元)職工人數(shù)(人)f比重(%)f/f2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.6合 計(jì)1262100.0三、累計(jì)頻數(shù)和累計(jì)頻率 累計(jì)頻數(shù)和累計(jì)頻率是將變量頻數(shù)分布中各組頻數(shù)或頻率依次累加而得到的各組累計(jì)頻數(shù)或累計(jì)頻

22、率。 累計(jì)的方法有兩種:一是向上累計(jì),即將各組頻數(shù)或頻率由變量值低的組依次向變量值高的組累計(jì),它表明從第一組下限開始到本組上限為止的累計(jì)頻數(shù)或累計(jì)頻率;二是向下累計(jì),即將各組頻數(shù)或頻率由變量值高的組依次向變量值低的組累計(jì),它表明從最末一組的上限開始到本組下限為止的累計(jì)頻數(shù)或頻率。如表3.9。表3.9某集團(tuán)公司職工基本工資分組表按月工資分組(元)職工人數(shù)(人)比重(%)向上累計(jì)向下累計(jì)人數(shù)比重%人數(shù)比重2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.650122

23、2277141082120312624.09.718.056.685.895.4100.0126212121140103554818059100.096.090.382.043.414.24.6合 計(jì)1262100.0四、組距式變量數(shù)列的編制 組距式變量數(shù)列的編制過程則比較麻煩,從外在形式上看,它要做確定分組標(biāo)志、確定組距和組數(shù)、確定組限等一系列工作。從本質(zhì)意義上看,它要通過科學(xué)分組(正確確定組數(shù)和組距)去反映總體各單位在某一數(shù)量標(biāo)志上的分布特點(diǎn)和規(guī)律,進(jìn)而認(rèn)識(shí)總體的特征、構(gòu)成和性質(zhì)。下面,我們通過實(shí)例說明組距式變量數(shù)列的編制程序和過程。 例3.1 某班學(xué)生高等數(shù)學(xué)考試成績(jī)資料如表3.10所示

24、,試據(jù)此數(shù)據(jù)編制適當(dāng)?shù)慕M距數(shù)列,以反映學(xué)生成績(jī)分布狀況。表3.10 某班學(xué)生高等數(shù)學(xué)考試成績(jī)(單位:分)97 55 84 63 57 52 74 76 56 5960 62 62 85 56 77 63 86 73 6799 94 53 78 92 97 64 86 62 6664 59 75 74 95 96 78 84 82 9681 96 95 64 97 92 68 82 77 71 考試成績(jī)屬于連續(xù)型變量,故應(yīng)編制組距數(shù)列。其編制過程為: (1)將原始數(shù)據(jù)按大小順序排列,并確定最大值、最小值和全距。其結(jié)果如下: 將數(shù)據(jù)從小到大排列表3.11 某班學(xué)生高等數(shù)學(xué)考試成績(jī)排序(單位:分)5

25、2 57 62 64 71 76 81 85 94 9653 59 62 64 73 77 82 86 95 9755 59 63 66 74 77 82 86 95 9756 60 63 67 74 78 84 92 96 9756 62 64 68 75 78 84 92 96 99 求最大值、最小值和全距 最大值99,最小值52, 全距最大值最小值995247 (2)確定組距數(shù)列類型。由于考試成績(jī)分布比較均勻,在近50分的變動(dòng)范圍內(nèi),平均來說是以1分為幅度逐漸變動(dòng)的,故可編制等距數(shù)列。 (3)確定組數(shù)和組距。 等距數(shù)列組距=全距組數(shù)。確定組數(shù)和組距時(shí),一般應(yīng)遵循以下幾條原則:考慮到組距內(nèi)

26、的同質(zhì)性。本例中必須將及格與不及格的質(zhì)的界限體現(xiàn)出來,不能分成4555、5565、。要能反映總體分布規(guī)律,即要體現(xiàn)原始數(shù)據(jù)分布的集中趨勢(shì)或離中趨勢(shì)。組距不能太大或太小。經(jīng)驗(yàn)表明,組數(shù)一般應(yīng)在515組內(nèi),組距最好是5的整數(shù)倍數(shù)。當(dāng)數(shù)據(jù)項(xiàng)數(shù)較多時(shí)分組可適當(dāng)多一些,數(shù)據(jù)項(xiàng)數(shù)較少時(shí)分組可以適當(dāng)少一些。本例數(shù)據(jù)項(xiàng)數(shù)較少,因此組數(shù)應(yīng)少一些,故可考慮分為5組。 在等距數(shù)列情況下,如果總體單位數(shù)不是很多,變量變動(dòng)范圍不是很大時(shí),可用斯特吉斯(HASturges)經(jīng)驗(yàn)公式計(jì)算出一個(gè)參考組距。公式為:將表3.11資料代入公式, (分)??紤]到組距一般為5的整數(shù)倍,可定組距為10分。 (4)確定組限和組限的表示法

27、確定組限應(yīng)遵循以下幾條原則: 最小組下限低于或等于最小變量值,最大組上限應(yīng)大于最大變量值; 如果有極端值,可用開口組; 組限應(yīng)有利于表現(xiàn)總體單位分布規(guī)律; 對(duì)于等距數(shù)列,如果組距是5的倍數(shù),則每組下限也最好是5的倍數(shù)。 此外,還應(yīng)確定組限用同限(重疊式)還是用異限(非重疊式)。因?yàn)榭荚嚦煽?jī)從本質(zhì)上說是連續(xù)變量,為避免遺漏,采用同限表示。但本例中考試成績(jī)?nèi)≌麛?shù),故既可用同限,也可用異限。選用同限,則組限可分為五個(gè)組 :60分以下60707080809090100 (5)從最小組起依次排列,并分別計(jì)算各組頻數(shù)和其他有關(guān)指標(biāo),形成分組統(tǒng)計(jì)表(見表3.12)。按考分分組(分)學(xué)生人數(shù)(人)比重()60

28、以下607070808090901008121081216.0024.0020.0016.0024.00合計(jì)50100.0表3.12 某班學(xué)生高等數(shù)學(xué)考試成績(jī)分組表 五、頻數(shù)(次數(shù))分布的類型 客觀現(xiàn)象的頻數(shù)(次數(shù))分布主要有鐘形分布、U形分布和J形分布三種類型。圖3.2 次數(shù)分布類型 ()鐘形分布 鐘形分布是指靠近兩端的變量值分配次數(shù)較少,中間變量值則分配次數(shù)較多,繪制成的曲線圖形狀宛如一口古鐘的次數(shù)分布(見圖3.1)。鐘形分布是最常見的分布,其突出特征是“中間大,兩頭小”。 如果鐘形分布的中間變量值次數(shù)最多,兩側(cè)變量值分配的次數(shù)隨著其與中間變量值距離的增大而漸次減少,并圍繞中心變量值兩側(cè)呈

29、完全對(duì)稱分布,則稱為對(duì)稱分布。 對(duì)稱分布中的正態(tài)分布是最重要的分布,許多客觀現(xiàn)象總體都趨近于正態(tài)分布。中心變量值兩側(cè)的變量值次數(shù)分布不對(duì)稱的稱為非對(duì)稱分布或偏態(tài)分布,通常有左偏態(tài)和右偏態(tài)兩種。 (二)U形分布 U形分布的特征與鐘形分布特征恰恰相反,靠近中間的變量值分布次數(shù)少,靠近兩端的變量值分布次數(shù)多,分布特征是“兩頭大,中間小”。繪成的曲線圖形如英文字母“U”。例如,人口在不同年齡上的死亡率一般近似地表現(xiàn)為U形分布。 (三)J形分布 J形分布有正反兩種情況:次數(shù)隨變量值增大而增多時(shí)所繪成的曲線圖形如英文字母“J”,稱為正J形分布;次數(shù)隨變量增大而減少時(shí)所繪成的曲線圖猶如反寫的英文字母“J”,

30、稱為反J分布。 例如,商品供給量隨著價(jià)格的提高而不斷增加,使供給曲線呈正J分布;人口總體按年齡大小的分布一般呈反J形分布。第四節(jié)統(tǒng)計(jì)表和統(tǒng)計(jì)圖一、統(tǒng)計(jì)表 (一)統(tǒng)計(jì)表的概念和構(gòu)成 所謂統(tǒng)計(jì)表,就是由縱橫交叉的線條所組成的用于顯示統(tǒng)計(jì)數(shù)據(jù)的表格。統(tǒng)計(jì)表由總標(biāo)題、橫標(biāo)目、縱標(biāo)目和統(tǒng)計(jì)數(shù)字四個(gè)要素構(gòu)成 總標(biāo)題中國(guó)國(guó)內(nèi)生產(chǎn)總值1992年1993年金 額(億元)比 重()金 額(億元)比 重()速度()(92為100)國(guó)內(nèi)生產(chǎn)總值24363100.031380100.0113.4第一產(chǎn)業(yè)580023.8665021.2104.0第二產(chǎn)業(yè)1170048.01624551.8120.4第三產(chǎn)業(yè)686328.

31、2848527.0109.3 總標(biāo)題是統(tǒng)計(jì)表的名稱,用以概括說明整個(gè)表的內(nèi)容,一般位于表的上方中央; 橫標(biāo)目是橫行內(nèi)容的名稱,代表統(tǒng)計(jì)所要說明的對(duì)象,也稱為主詞,一般列在表的左邊; 縱標(biāo)目是縱欄內(nèi)容的名稱,是用來說明主詞情況的統(tǒng)計(jì)指標(biāo),也稱為賓詞,一般列在表內(nèi)的上方; 統(tǒng)計(jì)數(shù)字是各項(xiàng)指標(biāo)的具體數(shù)值,內(nèi)容由橫標(biāo)目和縱標(biāo)目所限定。 填表說明,一般表下附有資料來源、指標(biāo)計(jì)算方法、填報(bào)單位、填表人、填表日期等說明。 (二)統(tǒng)計(jì)表的分類 在統(tǒng)計(jì)研究中通常按作用、反映對(duì)象的特點(diǎn)和分組情況對(duì)統(tǒng)計(jì)表進(jìn)行分類。 1.調(diào)查表、匯總表和分析表 統(tǒng)計(jì)表按作用不同可以分為調(diào)查表、匯總表和分析表。 調(diào)查表是在統(tǒng)計(jì)調(diào)查中用

32、于登記、搜集原始資料的表格; 匯總表是用于統(tǒng)計(jì)資料整理、匯總的表格; 分析表是用于統(tǒng)計(jì)分析的表格。 2.空間數(shù)列表和時(shí)間數(shù)列表 統(tǒng)計(jì)表按所反映統(tǒng)計(jì)數(shù)列的時(shí)空性質(zhì)不同,可以分為空間數(shù)列表和時(shí)間數(shù)列表。 空間數(shù)列表又稱靜態(tài)表,是反映同一時(shí)間條件下不同空間范圍內(nèi)的統(tǒng)計(jì)數(shù)列的表格,它可以說明現(xiàn)象在不同空間內(nèi)數(shù)量分布狀態(tài)。 時(shí)間數(shù)列表又稱動(dòng)態(tài)表,是反映同一空間條件下不同時(shí)間上的統(tǒng)計(jì)數(shù)列的表格,它可以說明在既定的空間范圍內(nèi)現(xiàn)象在不同時(shí)間上的變動(dòng)過程。 時(shí)空間數(shù)結(jié)合表,指將時(shí)間數(shù)列和空間數(shù)列結(jié)合起來編制的統(tǒng)計(jì)表。 3.簡(jiǎn)單表、分組表和復(fù)合表 統(tǒng)計(jì)表按對(duì)總體分組的情況不同,可以分為簡(jiǎn)單表、分組表和復(fù)合表。 簡(jiǎn)

33、單表是指對(duì)總體未做任何分組,僅按單位名稱或時(shí)間順序排列而成的統(tǒng)計(jì)表。 分組表又稱簡(jiǎn)單分組表,是對(duì)總體的統(tǒng)計(jì)單位按一個(gè)標(biāo)志進(jìn)行分組而形成的統(tǒng)計(jì)表。 復(fù)合表又稱復(fù)合分組表,是對(duì)總體的統(tǒng)計(jì)單位按兩個(gè)或兩個(gè)以上的標(biāo)志進(jìn)行交叉重疊分組,或按每一標(biāo)志單獨(dú)分組平行排列而形成的統(tǒng)計(jì)表。 (三)統(tǒng)計(jì)表的編制規(guī)范 設(shè)計(jì)和填寫統(tǒng)計(jì)表時(shí)必須遵循以下規(guī)范要求。 (1)統(tǒng)計(jì)表的標(biāo)題、項(xiàng)目、指標(biāo)要簡(jiǎn)明扼要,能準(zhǔn)確反映內(nèi)容,使人一目了然,便于分析。如果指標(biāo)的計(jì)量單位只有一個(gè),則通常列在表的右上角,如果計(jì)量單位較多,則列在相應(yīng)的指標(biāo)欄內(nèi)。 (2)統(tǒng)計(jì)表的縱欄、橫行的排列要盡量反映出內(nèi)容方面的邏輯關(guān)系。 (3)當(dāng)統(tǒng)計(jì)表的欄目較多

34、時(shí),可編號(hào)說明其相互關(guān)系。主詞欄和計(jì)量單位欄常用甲、乙、丙等文字編號(hào),賓詞欄常用1、2、3等數(shù)字編號(hào)。 (4)表中的合計(jì)欄可以排在前面,也可以排在最后,如果只列出其中部分項(xiàng)目,則合計(jì)欄必須排在前面。 (5)表中的統(tǒng)計(jì)數(shù)字要根據(jù)縱橫關(guān)系對(duì)位,數(shù)字為零時(shí)要寫出“0”來,不應(yīng)填寫數(shù)字的空格用“”線表示;未發(fā)生的數(shù)字空著不填;估算的數(shù)字應(yīng)在表下說明;無法取得的資料用“”號(hào)表示;如果某項(xiàng)數(shù)字與鄰項(xiàng)數(shù)字相同,則仍應(yīng)填寫數(shù)字,不得用“同上”、“同左”等字樣或符號(hào)代替。 (6)表的上下兩端用粗線,左右兩邊不封口,縱欄之間用細(xì)線分開,橫行之間可以不加線。如果橫行過多,也可以每五行加一細(xì)線。 (7)統(tǒng)計(jì)表的資料來

35、源及其他需要說明的問題可在表下加以注明。二、統(tǒng)計(jì)圖 用來表現(xiàn)統(tǒng)計(jì)數(shù)據(jù)的各種幾何圖形、具體事物的形象、符號(hào)等都叫統(tǒng)計(jì)圖。用統(tǒng)計(jì)圖來顯示統(tǒng)計(jì)數(shù)據(jù),具有直觀、生動(dòng)、形象、易懂的優(yōu)點(diǎn)。統(tǒng)計(jì)圖沒有冗長(zhǎng)的數(shù)據(jù)和呆板的表格形式,易為一般人接受和理解。不同的統(tǒng)計(jì)圖,繪制方法不同,但都必須遵守如實(shí)反映、便于比較、通俗易懂、鮮明醒目、靈活機(jī)動(dòng)原則。 常用統(tǒng)計(jì)圖可作如下分類:常用統(tǒng)計(jì)圖數(shù)據(jù)類型定性數(shù)據(jù)定量數(shù)據(jù)條形圖圓形圖折線圖雷達(dá)圖直方圖曲線圖 (一)直方圖和條形圖 1.直方圖 直方圖是用矩形的寬度和高度來表示頻數(shù)分布的圖形。在平面直角坐標(biāo)系中,橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,這樣各組與相應(yīng)的頻數(shù)就形成了一個(gè)

36、矩形,即直方圖。如根據(jù)表3.14可繪制成直方圖如圖3.3。 表3.14 我國(guó)2000年至2009年國(guó)內(nèi)生產(chǎn)總值 單位:萬元 年份20002001200220032004總產(chǎn)值89442109655120333135823159878年份20052006200720082009總產(chǎn)值184937216314265810314045335353圖3.3 直方圖例:某企業(yè)職工月生活費(fèi)支出表生活費(fèi)支出(元)職工數(shù)(人)比重(%)200以下 20 20200-400 50 50400-600 20 20600-800 10 10合計(jì) 100 100職工生活費(fèi)支出直方圖 2.條形圖 條形圖是用寬度相同的條

37、形的高度或長(zhǎng)度來表示數(shù)據(jù)變動(dòng)的圖形。條形圖可以橫置和縱置,縱置時(shí)也叫柱形圖。如根據(jù)表3.15資料繪制條形圖如下(見圖3.4):表3.15 2009年我國(guó)對(duì)主要國(guó)家和地區(qū)出口額統(tǒng)計(jì)表 單位:億美元國(guó)家/地區(qū)歐盟美國(guó)中國(guó)香港東盟日本出口金額 2363220816621063979國(guó)家/地區(qū)韓國(guó)印度中國(guó)臺(tái)灣俄羅斯出口金額 537297205175圖3.4 條形圖 (二)折線圖和曲線圖 1.折線圖 折線圖也稱頻數(shù)多邊圖,它是在直方圖的基礎(chǔ)上把相鄰直方形的頂邊中點(diǎn)連接成一條折線,再把拆線兩端與橫軸上直方形兩側(cè)延伸的假想組中點(diǎn)相連,就形成了頻數(shù)分布折線圖。 折線圖也可以用組中值與次數(shù)求坐標(biāo)點(diǎn)連接而成。例如

38、,根據(jù)表3.14可繪制如下折線圖(見圖3.5)。圖3.5 頻數(shù)分布折線圖 2.曲線圖 曲線圖是用曲線的升降起伏來表示被研究現(xiàn)象的變動(dòng)情況及其趨勢(shì)的圖形。曲線圖根據(jù)所示數(shù)據(jù)的性質(zhì)和作用不同,可分為頻數(shù)分布曲線圖、動(dòng)態(tài)曲線圖和依存關(guān)系曲線圖。 在頻數(shù)分布折線圖的基礎(chǔ)上,當(dāng)變量數(shù)列的組數(shù)無限增多時(shí),折線圖便近似地表現(xiàn)為一條平滑的曲線,折線圖就變成了頻數(shù)分布曲線圖。例如,根據(jù)表3.16資料,可繪制出圖3.6所示頻數(shù)分布曲線圖。圖3.6 頻數(shù)分布曲線圖 (三)圓形圖和環(huán)行圖 1.圓形圖 圓形圖是以圓的面積或圓內(nèi)各扇形的面積來表示數(shù)值大小或總體內(nèi)部結(jié)構(gòu)的一種圖形。根據(jù)作用不同,可分為圓形比較圖、圓形結(jié)構(gòu)圖

39、和圓形結(jié)構(gòu)比較圖。我們主要介紹圓形結(jié)構(gòu)圖。 圓形結(jié)構(gòu)圖通過圓內(nèi)各扇形的面積來反映總體中各組成部分所占的比例。 繪制圓形結(jié)構(gòu)圖的關(guān)鍵是正確計(jì)算各扇形的面積。由于在相同半徑條件下,扇形面積與圓心角成正比,且圓心角度數(shù)為360,故各扇形的中心角度為3600各組頻率。 例如,根據(jù)2003年公布的我國(guó)第二次基本單位普查統(tǒng)計(jì)資料(見表3.17),企業(yè)法人占 59.2,那么扇形的中心角度數(shù)應(yīng)為360o59.2213.120。依此類推,我們可繪制圓形結(jié)構(gòu)圖如圖3.7所示。表3.17我國(guó)法人單位按單位類別分組統(tǒng)計(jì)表按單位類別分組單位數(shù)(萬個(gè))比重(%)企業(yè)法人302.659.2機(jī)關(guān)、事業(yè)法人102.620.1社會(huì)團(tuán)體法人10.62.1居(村)委會(huì)79.215.6其他法人15.73.0合計(jì)510.7100.0圖3.7 圓形結(jié)構(gòu)圖 2.環(huán)形圖 環(huán)形圖中間有一個(gè)“空洞”,總體中的每一個(gè)部分?jǐn)?shù)據(jù)用環(huán)中的一段表示。環(huán)形圖可以同時(shí)繪

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論