社會(huì)統(tǒng)計(jì)學(xué):第2章 單變量數(shù)據(jù)的分布、統(tǒng)計(jì)表、統(tǒng)計(jì)圖_第1頁(yè)
社會(huì)統(tǒng)計(jì)學(xué):第2章 單變量數(shù)據(jù)的分布、統(tǒng)計(jì)表、統(tǒng)計(jì)圖_第2頁(yè)
社會(huì)統(tǒng)計(jì)學(xué):第2章 單變量數(shù)據(jù)的分布、統(tǒng)計(jì)表、統(tǒng)計(jì)圖_第3頁(yè)
社會(huì)統(tǒng)計(jì)學(xué):第2章 單變量數(shù)據(jù)的分布、統(tǒng)計(jì)表、統(tǒng)計(jì)圖_第4頁(yè)
社會(huì)統(tǒng)計(jì)學(xué):第2章 單變量數(shù)據(jù)的分布、統(tǒng)計(jì)表、統(tǒng)計(jì)圖_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章單變量數(shù)據(jù)的

分布、統(tǒng)計(jì)表、統(tǒng)計(jì)圖2.1分布2.2定類(lèi)數(shù)據(jù)的統(tǒng)計(jì)表與統(tǒng)計(jì)圖2.3定序數(shù)據(jù)的統(tǒng)計(jì)表與統(tǒng)計(jì)圖2.4定距數(shù)據(jù)的統(tǒng)計(jì)表與統(tǒng)計(jì)圖2.5統(tǒng)計(jì)表、統(tǒng)計(jì)圖在Spss中的實(shí)現(xiàn)2.1分布

社會(huì)統(tǒng)計(jì)學(xué)中,分布指一個(gè)概念或變量的各個(gè)情況出現(xiàn)的次數(shù)。分布的一般形式為:

(X1,n1)其中,X1,X2,Xn是變量X的(X2,n2)一切可能取值,n1,n2,n3為其對(duì)

應(yīng)數(shù)值。(Xn,nn)

n代表不同的含義是表示不同的分布。當(dāng)n表示頻次時(shí)為頻次分布。當(dāng)n表示概率時(shí)為概率分布。當(dāng)n表示百分比時(shí)稱為百分比分布或頻率分布或相對(duì)頻次分布。統(tǒng)計(jì)表和統(tǒng)計(jì)圖是變量分布的不同表現(xiàn)形式。

變量取值要注意的問(wèn)題:1、完備性2、互斥性統(tǒng)計(jì)表與統(tǒng)計(jì)圖

(基本問(wèn)題)要弄清所面對(duì)的數(shù)據(jù)類(lèi)型,因?yàn)椴煌?lèi)型的數(shù)據(jù),所采取的整理方式和圖示方法是不完全相同的;對(duì)定類(lèi)數(shù)據(jù)和定序數(shù)據(jù)主要是作分類(lèi)整理;對(duì)定距數(shù)據(jù)則主要是作分組整理;適合于低層次數(shù)據(jù)的整理和圖示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和圖示方法并不適合于低層次的數(shù)據(jù)。2.2定類(lèi)數(shù)據(jù)的整理與圖示定類(lèi)數(shù)據(jù)的統(tǒng)計(jì)表

(基本過(guò)程)1. 列出各類(lèi)別2.計(jì)算各類(lèi)別的頻數(shù)3.制作頻數(shù)分布表分類(lèi)頻數(shù)比例百分比比率ABCDE

可計(jì)算的統(tǒng)計(jì)量頻數(shù)(frequency)

:數(shù)據(jù)個(gè)數(shù)比例(proportion)

:某一類(lèi)別數(shù)據(jù)占全部數(shù)據(jù)的比值百分比(percentage)

:將對(duì)比的基數(shù)作為100而計(jì)算的比值比率(ratio)

:不同類(lèi)別數(shù)值的比值定類(lèi)數(shù)據(jù)整理—頻數(shù)分布表

(例題分析)家庭結(jié)構(gòu)

頻次核心家庭直系家庭聯(lián)合家庭其它1050720110250總數(shù)2130家庭結(jié)構(gòu)

百分比核心家庭直系家庭聯(lián)合家庭其它49.333.85.211.7總和百分?jǐn)?shù)(統(tǒng)計(jì)總數(shù))100.0(2130)表2-1家庭結(jié)構(gòu)的頻次分布(××地,1985,6)表2-2家庭結(jié)構(gòu)的百分比分布(××地,1985,6)標(biāo)識(shí)行主體行主詞賓詞統(tǒng)計(jì)表的結(jié)構(gòu)表2-31999~2000年城鎮(zhèn)居民家庭抽樣調(diào)查資料項(xiàng)目單位1999年2000年

調(diào)查戶數(shù)平均每戶家庭人口平均每戶就業(yè)人口平均每戶就業(yè)面平均一名就業(yè)者負(fù)擔(dān)人數(shù)平均每人全部年收入??芍涫杖肫骄咳讼M(fèi)性支出戶人人%元元元元

400443.141.7756.431.775888.775854.024615.91

4222.03.131.6853.671.866316.816279.984998.00資料來(lái)源:《中國(guó)統(tǒng)計(jì)年鑒2001》,中國(guó)統(tǒng)計(jì)出版社,2001,第305頁(yè)。注:本表為城市和縣城的城鎮(zhèn)居民家庭抽樣調(diào)查材料。

行標(biāo)題列標(biāo)題數(shù)字資料表頭附加合理安排統(tǒng)計(jì)表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W

要求(when,where,what)數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對(duì)于沒(méi)有數(shù)字的表格單元,一般用“—”表示必要時(shí)可在表的下方加上注釋檢驗(yàn)統(tǒng)計(jì)表是否正確可根據(jù)統(tǒng)計(jì)表中的百分比總和來(lái)判斷統(tǒng)計(jì)表的設(shè)計(jì)定類(lèi)數(shù)據(jù)的圖示—條形圖

(barChart)用寬度相同的條形的高度或長(zhǎng)短來(lái)表示各類(lèi)別數(shù)據(jù)的圖形;在坐標(biāo)軸上,各條形可以分開(kāi),也可以連接在一起;長(zhǎng)條排列次序可以是任意的;主要用于反映定類(lèi)數(shù)據(jù)或定序數(shù)據(jù)的頻數(shù)分布。定類(lèi)數(shù)據(jù)的圖示—條形圖

(例題分析)定類(lèi)數(shù)據(jù)的圖示—餅圖

(pieChart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來(lái)表示數(shù)值大小的圖形主要用于表示總體或樣本中各組成部分所占的百分比繪制圓形圖時(shí),總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定的主要用于反映定類(lèi)數(shù)據(jù)或定序數(shù)據(jù)的頻數(shù)分布定類(lèi)數(shù)據(jù)的圖示—餅圖

(例題分析)定類(lèi)數(shù)據(jù)的圖示—環(huán)形圖

(annularchart)環(huán)形圖中間有一個(gè)“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與餅圖類(lèi)似,但又有區(qū)別餅圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán)環(huán)形圖可用于不同總體的比較研究環(huán)形圖主要用于展示定類(lèi)和定序數(shù)據(jù)環(huán)形圖

(例題分析)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià)2.3定序數(shù)據(jù)的整理與圖示定序數(shù)據(jù)的統(tǒng)計(jì)表

(可計(jì)算的統(tǒng)計(jì)量)1.累積頻數(shù)(cumulativefrequencies):各類(lèi)別頻數(shù)的逐級(jí)累加2.累積百分比(cumulativepercentages):各類(lèi)別百分比的逐級(jí)累加

定序數(shù)據(jù)的頻數(shù)分布表

(例題分析)【例】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意?

1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計(jì)300100.0————定序數(shù)據(jù)的頻數(shù)分布表

(例題分析)乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計(jì)300100.0————定序數(shù)據(jù)的圖示—累計(jì)頻數(shù)分布圖

(例題分析)243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布定序數(shù)據(jù)的圖示—條形圖、餅圖、環(huán)形圖定序數(shù)據(jù)的條形圖、餅圖和環(huán)形圖與定類(lèi)數(shù)據(jù)的基本相同。唯一的區(qū)別在于,在定序數(shù)據(jù)的圖形中,數(shù)據(jù)要按照等級(jí)次序依次排列。2.4定距數(shù)據(jù)的整理與圖示2.4.1數(shù)據(jù)分組2.4.2定距數(shù)據(jù)的圖示2.4.1數(shù)據(jù)分組分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

(要點(diǎn))1.將一個(gè)變量值作為一組。適合于離散變量。適合于變量值較少的情況。

家庭人口數(shù)(口)

頻次12345707201050110250總數(shù)2200表×--×某單位職工家庭人口分布表組距分組

(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組。適合于連續(xù)變量。適合于變量值較多的情況。需要遵循“不重不漏”的原則??刹捎玫染喾纸M,也可采用不等距分組。~~~~~組距分組

(幾個(gè)概念)1.下限(lowlimit)

:一個(gè)組的最小值2.上限(upperlimit)

:一個(gè)組的最大值3.組距(classwidth)

:上限與下限之差4.組中值(classmidpoint)

:下限與上限之間的中點(diǎn)值下限值+上限值2組中值=確定分組數(shù)

(經(jīng)驗(yàn)確定分組數(shù))

調(diào)查總數(shù)N

分組數(shù)K50~1006~10100~2507~12250以上10~20確定分組數(shù)

(公式計(jì)算分組數(shù))

確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按

Sturges

提出的經(jīng)驗(yàn)公式來(lái)確定組數(shù)K確定組距

組距(ClassWidth):是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即

組距=(最大值-最小值)÷組數(shù)

最后統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表頻數(shù)分布表的編制

(例題分析)【例】某電腦公司2002年前四個(gè)月各天的銷(xiāo)售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組。

頻數(shù)分布表的編制

(步驟)確定組數(shù):根據(jù)

Sturges提出的經(jīng)驗(yàn)公式得組數(shù)K為:確定各組的組距:

組距=(237-141)÷10=9.6

10等距分組表

(上下組限重疊)上限不在內(nèi)等距分組表

(上下組限間斷)等距分組表

(使用開(kāi)口組)定距數(shù)據(jù)的圖示Excel

分組數(shù)據(jù)—直方圖和折線圖分組數(shù)據(jù)—直方圖

(histogram)直方圖的寬度是有意義的,是用條形的面積來(lái)表示各組的頻次分布,寬度表示數(shù)據(jù)的分組,條形的長(zhǎng)度表示頻次密度(單位組距所含有的頻次)。在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻次密度。用密度作為條形高度的原因1、連續(xù)型定距變量可以采用不等距分組;2、對(duì)于等距分組,用頻次或密度作為長(zhǎng)條的高度,圖形的相對(duì)比例關(guān)系是不變的,因此仍可以用頻次作為條形的高度。3、但在不等距分組時(shí),如果用頻次作為條形高度,將會(huì)產(chǎn)生錯(cuò)誤。(見(jiàn)page35表2-13和圖2-5)分組數(shù)據(jù)的圖示

(直方圖的繪制)140150210某電腦公司銷(xiāo)售量分布的直方圖我一眼就看出來(lái)了,銷(xiāo)售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240不等距分組年齡組(歲)頻次(人)…26-27…40-50……30…35…頻數(shù)密度26274050頻數(shù)密度:

直方圖與條形圖的區(qū)別條形圖是用條形的長(zhǎng)度表示各類(lèi)別頻數(shù)的多少,其寬度(表示類(lèi)別)則是固定的,寬度的大小沒(méi)有意義。直方圖是用面積表示各組頻數(shù)的多少,條形的高度表示頻次密度,寬度則表示各組的組距,其高度與寬度均有意義。直方圖的各條形通常是連續(xù)排列,條形圖則是分開(kāi)排列或連續(xù)排列均可。條形圖主要用于展示定類(lèi)數(shù)據(jù)和定序數(shù)據(jù),直方圖則主要用于展示定距數(shù)據(jù)。分組數(shù)據(jù)—折線圖

(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示

(折線圖的繪制)140150210某電腦公司銷(xiāo)售量分布的折線圖190200180160170220230240頻數(shù)(天)252015105302.5統(tǒng)計(jì)表、統(tǒng)計(jì)圖

在Spss中的實(shí)現(xiàn)(一)SPSS簡(jiǎn)介SPSS原是StatisticalPackageforSocialSciences

的簡(jiǎn)稱,即社會(huì)科學(xué)統(tǒng)計(jì)軟件包,1968年在美國(guó)推出。SPSS公司于2002年將英文全稱改為StatisticalProductandServiceSolutions,意為統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案?,F(xiàn)與SAS被并稱為當(dāng)今最權(quán)威的兩大統(tǒng)計(jì)軟件。

2009年:SPSS公司將其重新定位為預(yù)測(cè)統(tǒng)計(jì)分析軟件(PredictiveAnalyticsSoftware)PASW。包括四個(gè)部分:統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、數(shù)據(jù)收集、企業(yè)應(yīng)用服務(wù)。

2010年:隨著SPSS公司被IBM公司并購(gòu),各子產(chǎn)品家族名稱前面不再以PASW為名,修改為統(tǒng)一加上IBMSPSS字樣。一、Spss基本知識(shí)(二)基本特點(diǎn)和功能1.使用簡(jiǎn)單.大部分統(tǒng)計(jì)分析過(guò)程可以借助鼠標(biāo),通過(guò)菜單命令的選擇、對(duì)話框參數(shù)設(shè)置,點(diǎn)擊功能按鈕來(lái)完成,不需要用戶記憶大量的操作命令。2.統(tǒng)計(jì)功能強(qiáng)既有簡(jiǎn)單的描述統(tǒng)計(jì),也包含各種推論統(tǒng)計(jì)。尤其大量的、多變量的統(tǒng)計(jì)分析實(shí)現(xiàn)起來(lái)很容易。3.具有強(qiáng)大的統(tǒng)計(jì)圖繪制和編輯功能。4.漢字操作中文版的WINDOWS可以很方便的在SPSS中使用漢字。(三)認(rèn)識(shí)SPSS打開(kāi)SPSS1.Runthetutorial:運(yùn)行指南2.Typeindata:數(shù)據(jù)錄入3.Runanexistingquery:運(yùn)行已存在的查詢4.CreatnewqueryusingDatabaseCaptureWizard:用數(shù)據(jù)庫(kù)捕獲向?qū)Ы⑿碌牟樵?。5.Opentheexistingfile:打開(kāi)現(xiàn)有的文件6.Openanothertypeoffile:打開(kāi)其他類(lèi)型的文件。

進(jìn)入數(shù)據(jù)編輯器l

標(biāo)題欄,顯示當(dāng)前工作文件名稱。l

主菜單欄,排列SPSS的所有菜單命令。l

工具欄,排列系統(tǒng)默認(rèn)的標(biāo)準(zhǔn)工具圖標(biāo)按鈕,此欄圖標(biāo)按鈕可以通過(guò)單擊View菜單的Toolbars命令選擇隱藏、顯示或更改。l

狀態(tài)欄,狀態(tài)欄位于SPSS窗口底部,它反映了工作狀態(tài)。當(dāng)用戶將光標(biāo)置于不同的區(qū)域時(shí)或者進(jìn)行不同的操作時(shí)其中將顯示不同的內(nèi)容。(四)數(shù)據(jù)文件的建立與數(shù)據(jù)的錄入

1、SPSS的變量屬性變量名NameSpss12版本之前,變量名限制在8個(gè)字符之內(nèi);12版本之后,該限制取消;變量名定義還有其它一些限制,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論