




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、主要內(nèi)容,第二章 數(shù)據(jù)的初步整理,原始資料雜亂無章,需加整理,才能為人所用。統(tǒng)計資料的整理,其基礎(chǔ)是統(tǒng)計分組。所謂統(tǒng)計分組就是按統(tǒng)計研究的目的和要求,將總體單位或全部調(diào)查數(shù)據(jù)劃分成若干組,使組內(nèi)差異盡量小,而組與組之間則有明顯差異,從而使原本雜亂無章的資料有序化,以便為在統(tǒng)計分析中提煉各種有用信息打下基礎(chǔ)。,100名男性青年的身高表 單位:厘米,166 181 173 171 168 164 178 167 156 194 169 175 183 168 165 180 170 172 167 175 173 169 174 172 171 169 173 184 173 169 170 18
2、1 185 168 174 187 167 174 169 165 167 172 174 173 155 179 164 158 165 162 157 175 182 168 176 161 171 163 176 159 171 178 172 169 158 163 166 168 160 178 170 164 160 170 166 178 171 167 162 169 165 171 165 168 176 174 163 177 164 170 161 179 177 162 149 169 166 153 177 164,統(tǒng)計調(diào)查搜集來的資料往往是沒有次序的原始資料,使原始
3、資料有序化,是數(shù)據(jù)分析的第一步工作。,第一節(jié) 統(tǒng)計數(shù)據(jù)的整理,排序,就是把定量數(shù)據(jù)按從大到小或從小到大的順序排列,把定性數(shù)據(jù)按習(xí)慣的文字順序排列,便于我們研究其條理。,統(tǒng)計分組,1分組應(yīng)使各類別構(gòu)成之和等于總體,“窮舉”,“互斥”,2分組設(shè)計應(yīng)能反映統(tǒng)計總體的分布規(guī)律性 統(tǒng)計分組主要是為了能很好地反映統(tǒng)計總體的構(gòu)成狀況,即反映總體中各單位的分布特征。分組設(shè)計要適應(yīng)這一要求,必須在分組后使總體單位總數(shù)在各組的分配情況能夠反映總體的分布規(guī)律性。,“同質(zhì)”,“差異”,某社團(tuán)成員的構(gòu)成,性別,人數(shù),男 女,28 22,人數(shù),年齡,3 7 12 18 10,55-65,35-45,45-55,25-35
4、,15-25,在統(tǒng)計資料搜集的基礎(chǔ)上,按分組原則,將總體中所有單位依一定順序歸類整理,即可得到能夠表明總體單位總數(shù)在各組分配情況的頻數(shù)(或次數(shù))分布數(shù)列,簡稱數(shù)列。頻數(shù)分布數(shù)列是統(tǒng)計分組工作的產(chǎn)物。,頻數(shù)分布編制,分組的關(guān)鍵,選擇與研究的問題有關(guān)的變量。,組限的確定,應(yīng)遵循窮盡和互斥原則 。,定性數(shù)列編制:,組限的確定一般比較簡單。,如人口按性別分組、企業(yè)按所有制分組等。,定量變量編制:,分為單項數(shù)列和組距數(shù)列兩種形式。,單項數(shù)列:即變量的一個取值為一組,適用于離散型變量,并且變量的取值較少。,組距數(shù)列:即每一組有一個上限值和一個下限值所形成的區(qū)間,適用于連續(xù)性變量,或離散型變量且變量的取值較
5、多的情況。,頻數(shù)分布編制,統(tǒng)計表的結(jié)構(gòu)及其編制原則 統(tǒng)計表:描述統(tǒng)計資料數(shù)量關(guān)系的表格。 統(tǒng)計表一般由標(biāo)題、表號、標(biāo)目、線條、數(shù)字、表注等構(gòu)成。 在編制統(tǒng)計表時對各組成部分有一些具體的要求。,第二節(jié) 統(tǒng)計表,表2.1 2002年我國城鄉(xiāng)人口情況,按城鄉(xiāng)分,比重(%),人口數(shù)(萬人),128453,39.09,60.91,78241,50212,標(biāo)題,鄉(xiāng)村,城鎮(zhèn),100.00,合計,縱標(biāo)目,數(shù)字,橫標(biāo)目,表號,資料來源:2002中國統(tǒng)計年鑒。,統(tǒng)計表的種類,簡單表:只列出觀察對象的名稱、地點、時序或統(tǒng)計指標(biāo)名稱的統(tǒng)計表。 分組表:只按一個標(biāo)志分組的統(tǒng)計表。 復(fù)合表:按兩個或兩個以上標(biāo)志分組的統(tǒng)計
6、表。,表2.2 某年級各班學(xué)生人數(shù), 簡單表,表2.3 某校高三學(xué)生各年高考錄取人數(shù),表2.4 我國城市居民家庭基本情況(2002年), 分組表,表2.5 離婚案件構(gòu)成, 分組表,表2.6 中國人口年齡結(jié)構(gòu)狀況 單位:%,資料來源:2003中國統(tǒng)計年鑒第99頁。, 復(fù)合表(交互表),表2.7 我國社會福利主要費(fèi)用情況 單位:億元,資料來源:2003中國統(tǒng)計年鑒第838頁。, 復(fù)合表(交互表),表2.8 安全帶使用與性別的交互表,選擇行或列百分比描述數(shù)據(jù)。,標(biāo)題部分 標(biāo)題置于表格正上方。 標(biāo)題所示要點與表中項目一致,在需要時還應(yīng)表明資料所屬的時間和地區(qū)。 表號:左 ;單位:右 對分頁的同一表格,
7、在每頁上端都要寫標(biāo)題,加(續(xù)一)、(續(xù)二) 欄目部分 先局部后整體。 若欄目較多,可加以編號;統(tǒng)計數(shù)字間有計算關(guān)系的,可用計算式表達(dá)。,統(tǒng)計表的制作規(guī)則,線格部分 統(tǒng)計表上下兩端線應(yīng)以粗線或雙細(xì)線標(biāo)劃,表的左右兩側(cè)開口。 各欄間用直線標(biāo)劃,大項目間線條較粗,小欄目線條較細(xì);各行間不必劃線條。 數(shù)字部分 表中數(shù)字要對準(zhǔn)位數(shù)。 不存在某數(shù)字時,用“”表示;缺少某項數(shù)字時,用“”表示。 數(shù)字較大時,加分位點。 其他規(guī)則 資料來源寫在表格下方。 有說明解釋需要時,在表下方注釋。 單位有數(shù)種時而不能在表右上角劃一標(biāo)注時,分兩種情況處理。,統(tǒng)計表的制作規(guī)則,頻次分布:對一個變量所有觀察到的取值進(jìn)行分類組合
8、,并給出每一組的頻數(shù)。 相對頻次分布:比率 (pi ) = fi/N 百分比(%) = (fi /N)*100 累計頻次:小于(或者大于)某一個變量值(取值)的總頻數(shù)。 累計百分比:小于(或者大于)某一個變量值(取值)的頻數(shù)所占百分比。,頻次分布表,表2.8 全國六歲以上人口教育程度分布(2000年),資料來源:2000年全國人口 注:(1)高中包括普通高中、職業(yè)高中、中專(技校)等 (2),表2.9 全國六歲以上人口教育程度分布(2000年),資料來源:2000年全國人口 注:(1)高中包括普通高中、職業(yè)高中、中專(技校)等 (2),表2.10 全國人口年齡分布,關(guān)于頻次分布的幾個概念,全距
9、 組數(shù) 組距 組限 組中值,表2.11 某社區(qū)各戶人口數(shù)統(tǒng)計表,離散變量頻次分布 單項式頻次分布每一組的變量值只有一個。單項頻次分布用于離散變量整數(shù)值變動幅度較小時。,幾種常見的頻次分布,組中值(,離散變量頻次分布 組距式頻數(shù)分布離散變量的整數(shù)值如果變動幅度較大,而且總體單位數(shù)N又很大,則要編制組距式頻次分布。,表2.12 某地區(qū)小學(xué)班級數(shù),連續(xù)變量頻次分布 連續(xù)變量因其數(shù)學(xué)特征,在一個區(qū)間可以有無限多數(shù)值,無法按順序一一列舉,所以只能編制組距頻次分布。與離散變量組距頻次分布不同之處在于,根據(jù)連續(xù)變量的特征,此時組距頻次分布中相鄰兩組的上限和下限共有一個組限,即相鄰兩組交界處的組限重合。至于恰
10、等于某一組限的數(shù)據(jù)(如下表中身高164厘米)歸于哪一組,應(yīng)該按照“上限不包括在內(nèi)”的原則處理。這就是說,164應(yīng)歸于“164168”這一組,而不應(yīng)歸于“160l64”這一組。有了這一規(guī)定,就不會在編制連續(xù)變量的頻次分布時,發(fā)生違背“窮舉”與“互斥”這兩個基本原則的情況了。,表2.13 男青年身高按4厘米的間距分組時的頻數(shù)分布,連續(xù)變量頻次分布,累計頻次分布,向上累計以變量數(shù) 列首組的頻數(shù)為始點,逐 個累計各組的頻數(shù),展示 小于該組上限的頻數(shù)和。,向下累計以變量數(shù) 列末組的頻數(shù)為始點,逐 個累計各組的頻數(shù),展示 大于該組下限的頻數(shù)和。,頻數(shù)分布不但可以用統(tǒng)計表的形式表現(xiàn),也可以用統(tǒng)計圖的形式表現(xiàn)
11、。用統(tǒng)計圖表示頻數(shù)分布,較之用統(tǒng)計表,要直觀便捷得多。但缺點是不及統(tǒng)計表精確。統(tǒng)計圖的種類很多,本節(jié)僅就與頻數(shù)分布數(shù)列相銜接的統(tǒng)計圖加以介紹。 根據(jù)編制好的頻數(shù)分布數(shù)列,可以繪制出相應(yīng)的統(tǒng)計圖,最常用的有頻數(shù)分布直方圖、折線圖、曲線圖以及累計頻數(shù)分布曲線。具體方法是:先畫直角坐標(biāo)系,橫軸代表分組或各組組限,縱軸代表各組頻數(shù)或頻率,然后再根據(jù)相應(yīng)的分配數(shù)列作圖。,第三節(jié) 統(tǒng)計圖,餅圖是以整個圓的360度代表全部數(shù)據(jù)的總和,按照各類組所占的百分比(頻率),把一個“餅”切割為各個扇形。適用于定性數(shù)據(jù)。,50家門店按區(qū)域分組的餅圖,餅圖,餅圖,條形圖中,每一分類組表示成一個條,條的長度代表了這個組中所
12、含數(shù)據(jù)的頻數(shù)或頻率。適用于定性、定序數(shù)據(jù)。,條形圖,直方圖與條形圖相似,是在每個分組區(qū)間上繪制一個長條形而產(chǎn)生的圖形,它可以用來描述已表示成頻數(shù)或頻率的數(shù)據(jù)。適用于定量數(shù)據(jù)。,直方圖,對于異距數(shù)列,以組距為寬,以頻數(shù)密度為高來繪制直方圖。,頻數(shù)密度=,該組的組距,某組的頻數(shù),折線圖可以在直方圖基礎(chǔ)上,將每個長方形的頂端中點用折線連接而成,或用組中值與頻數(shù)(或頻率)求坐標(biāo)點連接而成 。,折線圖,曲線圖當(dāng)變量的取值非常多,變量數(shù)列的組數(shù)無限增多時,折線便趨于一條平滑的曲線,這是一種概括描述變量數(shù)列分布特征的理論曲線。,曲線圖,下表是諾貝爾獲獎?wù)叩哪挲g分布表。(1)請根據(jù)數(shù)據(jù)制作直方圖和折線圖;(2
13、)將折線圖修勻為一條曲線圖,并描述該曲線的特點。,常見曲線圖類型, 鐘形曲線: “中間大,兩頭小”,對稱分布 正態(tài)分布,非對稱分布: 偏態(tài)分布右偏、左偏,以橫軸為漸近線,與橫軸所圍的面積為1,代表變量X全部可能取值的概率。 婚齡、學(xué)生身高近似正態(tài)分布 收入分配、資源配置偏態(tài)分布, U形曲線:中間 小,兩頭大, J形曲線:正J分布,反J分布,邏輯斯蒂曲線:變量值分布的次數(shù)隨變 量值增大 而增多或相反,但有上限。,累計頻數(shù)分布曲線只有兩種形狀:或持續(xù)增長的或持續(xù)減少的。這分別取決于向上累計或向下累計。累計頻數(shù)分布曲線一般都呈邏輯斯諦曲線形,其斜率最大的地方對應(yīng)于頻數(shù)最大的組,其水平的地方對應(yīng)于空組。,累計頻數(shù)分布曲線,洛侖茲曲線和基尼系數(shù),基尼系數(shù) 意大利經(jīng)濟(jì)學(xué)家基尼(Gini)根據(jù)洛侖茲曲線提出了判斷收入分配平均程度的指標(biāo)。,合理界限0.20.3;警戒線0.4;紅線0.6。 (中國,2003,0.46),枝葉圖是對一批數(shù)據(jù)進(jìn)行組織整理的很有價值的一個工具,可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 銀行同業(yè)融資管理辦法
- 大城市公共場所管理辦法
- 縣以工代賑資金管理辦法
- 銀行清算資金管理辦法
- 北京市汽車指標(biāo)管理辦法
- 鄉(xiāng)鎮(zhèn)車輛管理辦法及制度
- 施工工地農(nóng)民工管理辦法
- 銷售存款行為管理辦法
- 于都縣建筑垃圾管理辦法
- 河南省開封十中2025屆高二物理第二學(xué)期期末統(tǒng)考模擬試題含解析
- 2024年上海市中考語文備考之150個文言實詞刷題表格及答案
- 2023-6新高考語文答題卡(全國甲卷兩欄)可以編輯
- 校本研修活動方案設(shè)計與實施
- 大學(xué)生心理健康教育(周莉第四版) 課件 第1-5章 主動掌控:打造健康生活-戀愛與性:理解親密關(guān)系
- 家庭教育學(xué)整套課件
- 營銷人員財務(wù)必備之財務(wù)與營銷結(jié)合
- 2024年風(fēng)機(jī)市場洞察報告
- 鍛壓設(shè)備安裝工程施工及驗收規(guī)范
- 磨煤機(jī)檢修培訓(xùn)課件
- 瑞安市工業(yè)固廢與污泥無害化處置及資源化利用項目階段性竣工環(huán)境保護(hù)驗收報告
- 檢驗科對急診凝血標(biāo)本質(zhì)量不合格原因分析品管圈魚骨圖柏拉圖
評論
0/150
提交評論