版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第三章數(shù)據(jù)整理
按照研究的目的,將搜集到的原始數(shù)據(jù)進行整理加工,從中提取有用的信息,并搜索其中的數(shù)量規(guī)律性。3.1數(shù)據(jù)分組3.2次數(shù)分配3.3統(tǒng)計指標(biāo)3.4統(tǒng)計表和統(tǒng)計圖第三章數(shù)據(jù)整理按照研究的目的,將搜集到的原13.1數(shù)據(jù)分組一、統(tǒng)計數(shù)據(jù)分組的目的及原則分組是將總體所有單位按一定的標(biāo)準(zhǔn)區(qū)分為若干部分分組前分組后25%33%42%分組的目的:概括數(shù)據(jù),清晰條理3.1數(shù)據(jù)分組一、統(tǒng)計數(shù)據(jù)分組的目的及原則分組是將總體所2分組時注意:
將具有共性的個體歸入同一組將總體內(nèi)部個體間的差異通過組別區(qū)分開來分組的原則:保證總體中的任何一個個體或原始數(shù)據(jù)都能歸于某一個組且僅能歸于某一個組,即保證不重、不漏。統(tǒng)計分組的關(guān)鍵是分組標(biāo)志的選擇分組時注意:分組的原則:保證總體中的任何一31、按分組標(biāo)志的多少不同分:簡單分組:分組僅按一個標(biāo)志來進行復(fù)合分組:分組按兩個或兩個以上的標(biāo)志進行,并且層疊在一起。二、統(tǒng)計分組的種類1、按分組標(biāo)志的多少不同分:二、統(tǒng)計分組的種類4例如:對全國的工業(yè)企業(yè)進行簡單分組:按經(jīng)濟類型分:全民所有制企業(yè)、集體所有制企業(yè)、城鄉(xiāng)個體企業(yè)按輕重工業(yè)分:重工業(yè)、輕工業(yè)按企業(yè)規(guī)模大小分:大型企業(yè)、中型企業(yè)、小型企業(yè)復(fù)合分組:全民所有制集體所有制重工業(yè)輕工業(yè)重工業(yè)輕工業(yè)大型企業(yè)中型企業(yè)小型企業(yè)例如:對全國的工業(yè)企業(yè)進行全民所有制集體所有制重工業(yè)輕工業(yè)重52、按分組標(biāo)志的性質(zhì)不同分:品質(zhì)分組:按品質(zhì)標(biāo)志進行的分組如人口總體按性別分組、高校教師按職稱分組。變量分組:按數(shù)量標(biāo)志進行的分組如企業(yè)按職工人數(shù)分------1000人以下、1000-5000人、5000人以上2、按分組標(biāo)志的性質(zhì)不同分:6三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計研究的目的,在對現(xiàn)象進行分析的基礎(chǔ)上,抓住具有本質(zhì)性的區(qū)別及反映現(xiàn)象內(nèi)在聯(lián)系的標(biāo)志來作為分組標(biāo)志。2、在統(tǒng)計整理中,為了全面認(rèn)識被研究現(xiàn)象總體,常常需要運用多個分組標(biāo)志對總體進行分組,形成一系列相互聯(lián)系、相互補充的分組體系。三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計研究的目的,在對現(xiàn)象7四、統(tǒng)計分組方法1、品質(zhì)分組的方法分組標(biāo)志一經(jīng)確定,組名稱和組數(shù)也就確定,不存在組與組之間界限區(qū)分的困難。復(fù)雜的情況下,各組界限不易劃分,從這一組到另一組存在各種過度狀態(tài),邊緣不清。2、變量分組的方法:變量分組的目的并不是單純確定各組在數(shù)量上的差別,而是要通過數(shù)量上變化來區(qū)分各組的不同類型和性質(zhì)。四、統(tǒng)計分組方法1、品質(zhì)分組的方法8單項式分組:是依次將每一個變量值作為一組。(適用于離散型變量且變量取值不多的情況)例如,居民家庭人口數(shù),其取值不可能很多,且每一個取值都可視為一種類型。按家庭人口數(shù)分組
1人
2人
3人
4人
5人
6人單項式分組:是依次將每一個變量值作為一組。按家庭人口數(shù)分組9組距式分組:把整個變量值依次劃分為幾個區(qū)間,各個變量值按其大小確定所歸并的區(qū)間,區(qū)間的距離稱組距。包括等距分組和不等距分組適用于連續(xù)型變量或雖為離散型變量但取值很多,不便一一列舉的情況。1)連續(xù)型變量的組距式分組如對商店按銷售額進行分組:按銷售額分組(萬元)50以下;50—200;200—400;400—600600—800;800以上組距式分組:把整個變量值依次劃分為幾個區(qū)間,各個變量102)離散型變量的組距式分組如對某企業(yè)的生產(chǎn)小組按人數(shù)分組:生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—1011—1617—222)離散型變量的組距式分組生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—111組距式分組中的有關(guān)問題:(1)組距和組中值組距兩端的數(shù)值稱為組限,其中:每組的起點數(shù)值稱下限、每組的終點數(shù)值稱上限。離散型變量分組:各組的上下限都可以用確定的數(shù)值(整數(shù))表示。
連續(xù)型變量分組:相鄰組的上限和下限無法用兩個確定的數(shù)值分別表示,因此上一組的上限同時也是下一組的下限。組距式分組中的有關(guān)問題:12例如:企業(yè)按工人工資對工人進行分組如下:
500—600元
600---700元
700---800元如果某工人工資為700元,應(yīng)將他歸并到哪一組?“上組限不計入”原則:遇到某單位的標(biāo)志值剛好等于相鄰兩組上下限時,一般把此值歸并到作為下限的那一組。注意EXCEL!例如:企業(yè)按工人工資對工人進行分組如下:注意EXCEL!13(2)全距:變量值中最大值與最小值的差數(shù)組數(shù)=全距/組距組距=上限—下限(3)組中值=(上限+下限)/2缺下限的開口組:組距數(shù)列的首組出現(xiàn)“***以下”缺上限的開口組:組距數(shù)列的末組出現(xiàn)“***以上”(2)全距:變量值中最大值與最小值的差數(shù)缺下限的開口組:組距14合理確定組中值例如:第一組:50人以下第二組:50—200人按公式應(yīng)定下限為0合理確定組中值例如:應(yīng)定下限為0153.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個數(shù)稱為次數(shù),各組間的次數(shù)稱為次數(shù)分配。次數(shù)分配描述了總體的結(jié)構(gòu)和特征。一、品質(zhì)次數(shù)分配的編制按品質(zhì)標(biāo)志進行分組,由總體各組的名稱及各組的單位數(shù)(次數(shù))組成。
某高校學(xué)生的性別分布
按性別分組人數(shù)比例(%)女生544841.2男生780458.8合計13262100.0Excel演示3.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個數(shù)稱為次數(shù),各組間的次16二、變量次數(shù)分配的編制1、將原始資料按順序排序2、確定組數(shù)與組距(1)當(dāng)n較大時,k取10~20;當(dāng)n<50時,k取5~6
;(2)如果數(shù)據(jù)分布比較均勻、對稱,即中間數(shù)值次數(shù)多,大小極端值次數(shù)少,考慮用以下公式來確定組數(shù):組數(shù)=1+3.322log
n式中,n
表示總次數(shù),log
表示以10為底的對數(shù)。組距=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)二、變量次數(shù)分配的編制1、將原始資料按順序排序(2)如果數(shù)173、確定組限每組區(qū)間的界限稱為組限。離散型變量,分組時相鄰組的組限必須間斷。
如某省企業(yè)按職工人數(shù)分組,可分為:0-99,100-199,200-299,300-399,…,900-1000等;連續(xù)型變量,相鄰組的上、下限采用重疊的方法分組界定。
如按職工工資分組,0-500,500-1000,1000-1500,1500-2000,…,等;4、將各個數(shù)據(jù)按其數(shù)值大小歸入相應(yīng)的組內(nèi)。3、確定組限18某企業(yè)非熟練工人的周工資額(元)單位:元人員編號周收入人員編號周收入人員編號周收入11061199218528412942210631111311923101491148724105510915118259669116972610571111710327107810718103281289121199529111101052010630101返回某企業(yè)非熟練工人的周工資額(元)單位:元人員編號周收入人員編19分組計算組數(shù)=1+3.322logn(n=30)=5.9分6組組距:每組區(qū)間的寬度=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)
=(128-84)/6=7.384-91,91-98,98-105,105-112,112-119,119-126;未包含最大值83-91,91-99,99-107,107-115,115-123,123-131;分組計算組數(shù)=1+3.322logn(n=30)20按5組,10元作為組距,計算次數(shù)。求次數(shù)分配表和直方圖結(jié)合實際數(shù)據(jù),組距為10比較好計算且方便,分組的組數(shù)相應(yīng)從6減少為5。最小值為83,下限從80開始,按5組,10元作為組距,計算次數(shù)。求次數(shù)分配表和直方圖21次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90390-1007100-11013110-1205120-1302合計30次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90322累計次數(shù)分布周工資上組限組次數(shù)小于上組限的累計次數(shù)小于上組限的累計百分比%80-9090-100100-110110-120120-1309010011012013037135231023283010337793100累計次數(shù)分布周工資上組限組次數(shù)小于上組限的累計次數(shù)小于上組限23作圖作圖24如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10513105-13017合計30反映不出觀察值分布特征Excel作直方圖如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10525分組太細(xì)會出現(xiàn)什么問題?反映不出觀察值的分布特征分組太細(xì)會出現(xiàn)什么問題?反映不出觀察值的分布特征26前面分組都是等距分組也有不等距分組在不等距分組情況下,要比較各組次數(shù)或分析總體結(jié)構(gòu),要消除由組距不等造成的影響。為此需計算單位組距的次數(shù),即頻數(shù)密度。每組單位組距次數(shù)=某組次數(shù)/該組組距前面分組都是等距分組也有不等距分組27次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的曲線,即次數(shù)曲線。常見的四種次數(shù)曲線:正態(tài)分布曲線,偏態(tài)曲線,J形曲線和U形曲線。次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的28正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實際中,許多社會現(xiàn)象的總體分布都趨向于正態(tài)分布,如農(nóng)作物單位面積產(chǎn)量的分布、零件公差的分布等。正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實際中,許多社會現(xiàn)象的總體29U
形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼兒和老年人死亡率高,而中青年死亡率低。自然界某一物種在理想條件下種群數(shù)量增長的形式,如果以時間做橫坐標(biāo),種群數(shù)量做縱坐標(biāo)畫出來的曲線表示,曲線大致成J型曲線。
U形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼30洛倫茨(Lorens)曲線洛倫茨曲線是美國經(jīng)濟學(xué)家洛倫茨在二十世紀(jì)初提出的,應(yīng)用累積次數(shù)分配曲線描述一個國家或一個地區(qū)收入分配平均程度的一種圖示方法.收入分配不平均的程度可以通過基尼系數(shù)來測算?;嵯禂?shù)=A/(A+B)洛倫茨(Lorens)曲線洛倫茨曲線是美國經(jīng)濟學(xué)家洛倫茨在二31G的值在0~1之間。聯(lián)合國有關(guān)組織規(guī)定:
G小于0.2可認(rèn)為收入絕對平等;G在0.2~0.3之間表示比較平等;G在0.3~0.4之間表示相對合理;G在0.4~0.5之間表示收入差距較大;G大于0.6表示收入差距懸殊?;嵯禂?shù)0.4為國際警戒線,超過0.4則應(yīng)采取措施縮小收入差距G的值在0~1之間。323.3統(tǒng)計指標(biāo)統(tǒng)計指標(biāo)是說明社會經(jīng)濟現(xiàn)象總體數(shù)量特征的名稱和數(shù)值,是統(tǒng)計活動對客觀存在的種種社會經(jīng)濟現(xiàn)象,按其具體名稱,在一定空間、時間條件下,進行科學(xué)計量的數(shù)字結(jié)果。兩個特征:可計量性(具體性)和總體性(綜合性)形成指標(biāo)的現(xiàn)象特征必須是可以用數(shù)量來表現(xiàn)的統(tǒng)計指標(biāo)是由個體數(shù)量特征匯總或整理加工后得到的數(shù)值3.3統(tǒng)計指標(biāo)統(tǒng)計指標(biāo)是說明社會經(jīng)濟現(xiàn)象總體數(shù)量特征的33一、統(tǒng)計指標(biāo)的種類1.總量指標(biāo):反映總體現(xiàn)象的規(guī)模水平,以絕對數(shù)形式表現(xiàn),故也稱為絕對指標(biāo)。如總?cè)丝?、國民生產(chǎn)總值等;總量指標(biāo)按其所說明的總體內(nèi)容的不同,分為總體單位總量和總體標(biāo)志總量總體單位總量反映總體單位的總量指標(biāo),如企業(yè)數(shù)目、職工人數(shù)等;總體標(biāo)志總量反映總體各單位某一數(shù)量標(biāo)志值總和的總量指標(biāo),如商品銷售額、總工資總額等;總量指標(biāo)按其所反映的不同時間狀況,分為時點總量和時期總量。一、統(tǒng)計指標(biāo)的種類1.總量指標(biāo):反映總體現(xiàn)象的規(guī)模水平,以絕342.平均指標(biāo):將總體標(biāo)志總量指標(biāo)除以總體單位總量,得到平均指標(biāo);平均指標(biāo)=總體標(biāo)志總量/總體單位總量3.相對指標(biāo):兩個有聯(lián)系的指標(biāo)對比所得到的指標(biāo)都可以叫做相對指標(biāo)。(1)結(jié)構(gòu)相對指標(biāo)將總體的部分標(biāo)志總量與總體的標(biāo)志總量相比較,或?qū)⒖傮w的部分單位總量與總體全部單位數(shù)相比較。2.平均指標(biāo):將總體標(biāo)志總量指標(biāo)除以總體單位總量,得到平均指35
(2)比例相對指標(biāo)將總體內(nèi)部的部分與部分對比所得到的指標(biāo)(3)動態(tài)相對指標(biāo)將同一內(nèi)容的指標(biāo)在不同時間上的數(shù)值進行對比。
說明現(xiàn)象在時間上的變化。
(4)強度相對指標(biāo)將同一時期內(nèi)容不同、但有一定聯(lián)系的兩個總量指標(biāo)對比。強度相對指標(biāo)常被用來說明現(xiàn)象的密度、普遍程度。(2)比例相對指標(biāo)36二、統(tǒng)計指標(biāo)體系由相互聯(lián)系的若干統(tǒng)計指標(biāo)組成的一個指標(biāo)系統(tǒng)稱為指標(biāo)體系。按指標(biāo)體系所反映的內(nèi)容分為基本統(tǒng)計指標(biāo)體系和專題統(tǒng)計指標(biāo)體系;基本統(tǒng)計指標(biāo)體系反映社會經(jīng)濟發(fā)展的基本情況,如人口統(tǒng)計指標(biāo)體系、科技統(tǒng)計指標(biāo)體系。專題統(tǒng)計指標(biāo)體系是就某一專門問題而設(shè)立的。如企業(yè)經(jīng)濟效益評價指標(biāo)體系。按統(tǒng)計指標(biāo)體系所實施的范圍分為國家統(tǒng)計指標(biāo)體系、地方統(tǒng)計指標(biāo)體系、部門統(tǒng)計指標(biāo)體系和基層統(tǒng)計指標(biāo)體系;二、統(tǒng)計指標(biāo)體系由相互聯(lián)系的若干統(tǒng)計指標(biāo)組成的一個指標(biāo)系統(tǒng)稱37三、統(tǒng)計指標(biāo)的應(yīng)用注意:1.統(tǒng)計指標(biāo)的內(nèi)涵和可比性2.多種指標(biāo)結(jié)合應(yīng)用三、統(tǒng)計指標(biāo)的應(yīng)用注意:383.4統(tǒng)計表和統(tǒng)計圖一個完整的統(tǒng)計表要求有:表號、表名、分組標(biāo)志或說明、指標(biāo)名稱及數(shù)值;p55統(tǒng)計圖有條形圖、線形圖、圓形圖、立體圖、枝葉圖等;3.4統(tǒng)計表和統(tǒng)計圖一個完整的統(tǒng)計表要求有:表號、表名、39樹莖樹葉
次數(shù)84853911947567106975366615571131101981512182
某研究所研究人員月工資收入的莖葉圖樹莖樹葉次數(shù)8485391194740第三章數(shù)據(jù)整理
按照研究的目的,將搜集到的原始數(shù)據(jù)進行整理加工,從中提取有用的信息,并搜索其中的數(shù)量規(guī)律性。3.1數(shù)據(jù)分組3.2次數(shù)分配3.3統(tǒng)計指標(biāo)3.4統(tǒng)計表和統(tǒng)計圖第三章數(shù)據(jù)整理按照研究的目的,將搜集到的原413.1數(shù)據(jù)分組一、統(tǒng)計數(shù)據(jù)分組的目的及原則分組是將總體所有單位按一定的標(biāo)準(zhǔn)區(qū)分為若干部分分組前分組后25%33%42%分組的目的:概括數(shù)據(jù),清晰條理3.1數(shù)據(jù)分組一、統(tǒng)計數(shù)據(jù)分組的目的及原則分組是將總體所42分組時注意:
將具有共性的個體歸入同一組將總體內(nèi)部個體間的差異通過組別區(qū)分開來分組的原則:保證總體中的任何一個個體或原始數(shù)據(jù)都能歸于某一個組且僅能歸于某一個組,即保證不重、不漏。統(tǒng)計分組的關(guān)鍵是分組標(biāo)志的選擇分組時注意:分組的原則:保證總體中的任何一431、按分組標(biāo)志的多少不同分:簡單分組:分組僅按一個標(biāo)志來進行復(fù)合分組:分組按兩個或兩個以上的標(biāo)志進行,并且層疊在一起。二、統(tǒng)計分組的種類1、按分組標(biāo)志的多少不同分:二、統(tǒng)計分組的種類44例如:對全國的工業(yè)企業(yè)進行簡單分組:按經(jīng)濟類型分:全民所有制企業(yè)、集體所有制企業(yè)、城鄉(xiāng)個體企業(yè)按輕重工業(yè)分:重工業(yè)、輕工業(yè)按企業(yè)規(guī)模大小分:大型企業(yè)、中型企業(yè)、小型企業(yè)復(fù)合分組:全民所有制集體所有制重工業(yè)輕工業(yè)重工業(yè)輕工業(yè)大型企業(yè)中型企業(yè)小型企業(yè)例如:對全國的工業(yè)企業(yè)進行全民所有制集體所有制重工業(yè)輕工業(yè)重452、按分組標(biāo)志的性質(zhì)不同分:品質(zhì)分組:按品質(zhì)標(biāo)志進行的分組如人口總體按性別分組、高校教師按職稱分組。變量分組:按數(shù)量標(biāo)志進行的分組如企業(yè)按職工人數(shù)分------1000人以下、1000-5000人、5000人以上2、按分組標(biāo)志的性質(zhì)不同分:46三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計研究的目的,在對現(xiàn)象進行分析的基礎(chǔ)上,抓住具有本質(zhì)性的區(qū)別及反映現(xiàn)象內(nèi)在聯(lián)系的標(biāo)志來作為分組標(biāo)志。2、在統(tǒng)計整理中,為了全面認(rèn)識被研究現(xiàn)象總體,常常需要運用多個分組標(biāo)志對總體進行分組,形成一系列相互聯(lián)系、相互補充的分組體系。三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計研究的目的,在對現(xiàn)象47四、統(tǒng)計分組方法1、品質(zhì)分組的方法分組標(biāo)志一經(jīng)確定,組名稱和組數(shù)也就確定,不存在組與組之間界限區(qū)分的困難。復(fù)雜的情況下,各組界限不易劃分,從這一組到另一組存在各種過度狀態(tài),邊緣不清。2、變量分組的方法:變量分組的目的并不是單純確定各組在數(shù)量上的差別,而是要通過數(shù)量上變化來區(qū)分各組的不同類型和性質(zhì)。四、統(tǒng)計分組方法1、品質(zhì)分組的方法48單項式分組:是依次將每一個變量值作為一組。(適用于離散型變量且變量取值不多的情況)例如,居民家庭人口數(shù),其取值不可能很多,且每一個取值都可視為一種類型。按家庭人口數(shù)分組
1人
2人
3人
4人
5人
6人單項式分組:是依次將每一個變量值作為一組。按家庭人口數(shù)分組49組距式分組:把整個變量值依次劃分為幾個區(qū)間,各個變量值按其大小確定所歸并的區(qū)間,區(qū)間的距離稱組距。包括等距分組和不等距分組適用于連續(xù)型變量或雖為離散型變量但取值很多,不便一一列舉的情況。1)連續(xù)型變量的組距式分組如對商店按銷售額進行分組:按銷售額分組(萬元)50以下;50—200;200—400;400—600600—800;800以上組距式分組:把整個變量值依次劃分為幾個區(qū)間,各個變量502)離散型變量的組距式分組如對某企業(yè)的生產(chǎn)小組按人數(shù)分組:生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—1011—1617—222)離散型變量的組距式分組生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—151組距式分組中的有關(guān)問題:(1)組距和組中值組距兩端的數(shù)值稱為組限,其中:每組的起點數(shù)值稱下限、每組的終點數(shù)值稱上限。離散型變量分組:各組的上下限都可以用確定的數(shù)值(整數(shù))表示。
連續(xù)型變量分組:相鄰組的上限和下限無法用兩個確定的數(shù)值分別表示,因此上一組的上限同時也是下一組的下限。組距式分組中的有關(guān)問題:52例如:企業(yè)按工人工資對工人進行分組如下:
500—600元
600---700元
700---800元如果某工人工資為700元,應(yīng)將他歸并到哪一組?“上組限不計入”原則:遇到某單位的標(biāo)志值剛好等于相鄰兩組上下限時,一般把此值歸并到作為下限的那一組。注意EXCEL!例如:企業(yè)按工人工資對工人進行分組如下:注意EXCEL!53(2)全距:變量值中最大值與最小值的差數(shù)組數(shù)=全距/組距組距=上限—下限(3)組中值=(上限+下限)/2缺下限的開口組:組距數(shù)列的首組出現(xiàn)“***以下”缺上限的開口組:組距數(shù)列的末組出現(xiàn)“***以上”(2)全距:變量值中最大值與最小值的差數(shù)缺下限的開口組:組距54合理確定組中值例如:第一組:50人以下第二組:50—200人按公式應(yīng)定下限為0合理確定組中值例如:應(yīng)定下限為0553.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個數(shù)稱為次數(shù),各組間的次數(shù)稱為次數(shù)分配。次數(shù)分配描述了總體的結(jié)構(gòu)和特征。一、品質(zhì)次數(shù)分配的編制按品質(zhì)標(biāo)志進行分組,由總體各組的名稱及各組的單位數(shù)(次數(shù))組成。
某高校學(xué)生的性別分布
按性別分組人數(shù)比例(%)女生544841.2男生780458.8合計13262100.0Excel演示3.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個數(shù)稱為次數(shù),各組間的次56二、變量次數(shù)分配的編制1、將原始資料按順序排序2、確定組數(shù)與組距(1)當(dāng)n較大時,k取10~20;當(dāng)n<50時,k取5~6
;(2)如果數(shù)據(jù)分布比較均勻、對稱,即中間數(shù)值次數(shù)多,大小極端值次數(shù)少,考慮用以下公式來確定組數(shù):組數(shù)=1+3.322log
n式中,n
表示總次數(shù),log
表示以10為底的對數(shù)。組距=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)二、變量次數(shù)分配的編制1、將原始資料按順序排序(2)如果數(shù)573、確定組限每組區(qū)間的界限稱為組限。離散型變量,分組時相鄰組的組限必須間斷。
如某省企業(yè)按職工人數(shù)分組,可分為:0-99,100-199,200-299,300-399,…,900-1000等;連續(xù)型變量,相鄰組的上、下限采用重疊的方法分組界定。
如按職工工資分組,0-500,500-1000,1000-1500,1500-2000,…,等;4、將各個數(shù)據(jù)按其數(shù)值大小歸入相應(yīng)的組內(nèi)。3、確定組限58某企業(yè)非熟練工人的周工資額(元)單位:元人員編號周收入人員編號周收入人員編號周收入11061199218528412942210631111311923101491148724105510915118259669116972610571111710327107810718103281289121199529111101052010630101返回某企業(yè)非熟練工人的周工資額(元)單位:元人員編號周收入人員編59分組計算組數(shù)=1+3.322logn(n=30)=5.9分6組組距:每組區(qū)間的寬度=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)
=(128-84)/6=7.384-91,91-98,98-105,105-112,112-119,119-126;未包含最大值83-91,91-99,99-107,107-115,115-123,123-131;分組計算組數(shù)=1+3.322logn(n=30)60按5組,10元作為組距,計算次數(shù)。求次數(shù)分配表和直方圖結(jié)合實際數(shù)據(jù),組距為10比較好計算且方便,分組的組數(shù)相應(yīng)從6減少為5。最小值為83,下限從80開始,按5組,10元作為組距,計算次數(shù)。求次數(shù)分配表和直方圖61次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90390-1007100-11013110-1205120-1302合計30次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90362累計次數(shù)分布周工資上組限組次數(shù)小于上組限的累計次數(shù)小于上組限的累計百分比%80-9090-100100-110110-120120-1309010011012013037135231023283010337793100累計次數(shù)分布周工資上組限組次數(shù)小于上組限的累計次數(shù)小于上組限63作圖作圖64如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10513105-13017合計30反映不出觀察值分布特征Excel作直方圖如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10565分組太細(xì)會出現(xiàn)什么問題?反映不出觀察值的分布特征分組太細(xì)會出現(xiàn)什么問題?反映不出觀察值的分布特征66前面分組都是等距分組也有不等距分組在不等距分組情況下,要比較各組次數(shù)或分析總體結(jié)構(gòu),要消除由組距不等造成的影響。為此需計算單位組距的次數(shù),即頻數(shù)密度。每組單位組距次數(shù)=某組次數(shù)/該組組距前面分組都是等距分組也有不等距分組67次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的曲線,即次數(shù)曲線。常見的四種次數(shù)曲線:正態(tài)分布曲線,偏態(tài)曲線,J形曲線和U形曲線。次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的68正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實際中,許多社會現(xiàn)象的總體分布都趨向于正態(tài)分布,如農(nóng)作物單位面積產(chǎn)量的分布、零件公差的分布等。正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實際中,許多社會現(xiàn)象的總體69U
形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼兒和老年人死亡率高,而中青年死亡率低。自然界某一物種在理想條件下種群數(shù)量增長的形式,如果以時間做橫坐標(biāo),種群數(shù)量做縱坐標(biāo)畫出來的曲線表示,曲線大致成J型曲線。
U形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼70洛倫茨(Lorens)曲線洛倫茨曲線是美國經(jīng)濟學(xué)家洛倫茨在二十世紀(jì)初提出的,應(yīng)用累積次數(shù)分配曲線描述一個國家或一個地區(qū)收入分配平均程度的一種圖示方法.收入分配不平均的程度可以通過基尼系數(shù)來測算?;嵯禂?shù)=A/(A+B)洛倫茨(Lorens)曲線洛倫茨曲線是美國經(jīng)濟學(xué)家洛倫茨在二71G的值在0~1之間。聯(lián)合國有關(guān)組織規(guī)定:
G小于0.2可認(rèn)為收入絕對平等;G在0.2~0.3之間表示比較平等;G在0.3~0.4之間表示相對合理;G在0.4~0.5之間表示收入差距較大;G大于0.6表示收入差距懸殊?;嵯禂?shù)0.4為國際警戒線,超過0.4則應(yīng)采取措施縮小收入差距G的值在0~1之間。723.3統(tǒng)計指標(biāo)統(tǒng)計指標(biāo)是說明社會經(jīng)濟現(xiàn)象總體數(shù)量特征的名稱和數(shù)值,是統(tǒng)計活動對客觀存在的種種社會經(jīng)濟現(xiàn)象,按其具體名稱,在一定空間、時間條件下,進行科學(xué)計量的數(shù)字結(jié)果。兩個特征:可計量性(具體性)和總體性(綜合性)形
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山西省山大附中高三9月月考語文試題(含答案)
- 智研咨詢發(fā)布-2024年中國可降解塑料行業(yè)產(chǎn)業(yè)鏈全景分析及發(fā)展趨勢預(yù)測報告
- 二零二五年度綠色能源項目委托投標(biāo)合作協(xié)議3篇
- 項目式學(xué)習(xí)在初中英語閱讀教學(xué)中的應(yīng)用研究
- 2025版物業(yè)管理企業(yè)清潔服務(wù)外包委托合同3篇
- 建筑市政工程質(zhì)量安全第三方巡查方案
- 高端餐飲銷售工作總結(jié)
- 二零二五年度個人信息保密與數(shù)據(jù)安全保障合同3篇
- 二零二五年度汽車制造廠行車維修保障協(xié)議2篇
- 物流行業(yè)運輸安全管理總結(jié)
- 2024版全文:中國2型糖尿病預(yù)防及治療指南
- 社會主義發(fā)展史(齊魯師范學(xué)院)知到智慧樹章節(jié)答案
- 課程思政融入高職院校應(yīng)用文寫作課程教學(xué)路徑探析
- 2024全新鋼結(jié)構(gòu)安全培訓(xùn)
- 2025屆高三數(shù)學(xué)一輪復(fù)習(xí)-分段函數(shù)專項訓(xùn)練【含答案】
- 《工程力學(xué)》課程教學(xué)大綱
- 7.1.2 直觀圖的畫法-【中職專用】高一數(shù)學(xué)教材配套課件(高教版2021·基礎(chǔ)模塊下冊)
- 皮膚癬菌病的分子診斷工具
- SL+575-2012水利水電工程水土保持技術(shù)規(guī)范
- 人美版初中美術(shù)知識點匯總八年級全冊
- 迅雷網(wǎng)盤最最最全影視資源-持續(xù)更新7.26
評論
0/150
提交評論