




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS基本統(tǒng)計(jì)分析SPSS的主要分析工具——Analyze菜單報(bào)告--Rports描述性統(tǒng)計(jì)分析--Descriptive
Statistics菜單表格--Tables均數(shù)間的比較--Compare
Means菜單一般線性模型――General
Linear
Model菜單相關(guān)分析――Correlate菜單多元線性回歸與曲線擬合――Regression菜單對(duì)數(shù)線性模型——Loglinear菜單聚類(lèi)分析與判別分析——Classify菜單因子分析與對(duì)應(yīng)分析——Data
Reduction菜單信度分析與多維尺度分析——Scale菜單非參數(shù)檢驗(yàn)――Nonparametric
Tests菜單時(shí)間序列分析--Time
series描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步,做好這第一步是下面進(jìn)行正確統(tǒng)計(jì)推斷的先決條件。SPSS的許多模塊均可完成描述性分析,但專(zhuān)門(mén)為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在【描述統(tǒng)計(jì)】菜單中,包括:【頻數(shù)】:頻數(shù)分析過(guò)程,特色是產(chǎn)生頻數(shù)表(主要針對(duì)分類(lèi)變量)【描述】:數(shù)據(jù)描述過(guò)程,進(jìn)行一般性的統(tǒng)計(jì)描述(主要針對(duì)數(shù)值型變量)【探索】:數(shù)據(jù)探察過(guò)程,用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析【交叉表】:多維頻數(shù)分布交叉表分析(列聯(lián)表分析)【比率】:比率分析4.1.1
頻數(shù)分析的目的和基本任務(wù)1、目的:基本統(tǒng)計(jì)分析往往從頻數(shù)分析開(kāi)始。通過(guò)頻數(shù)分析能夠了解變量取值的狀況,對(duì)把握數(shù)據(jù)的分布特征是非常有用的。2、基本任務(wù)(1)頻數(shù)分析的第一個(gè)基本任務(wù)是編制頻數(shù)分布表。頻數(shù)(Frequency):即變量值落在某個(gè)區(qū)間(或某個(gè)類(lèi)別)中的次數(shù)百分比(Percent):即各頻數(shù)占總樣本數(shù)的百分比
有效百分比(ValidPercent):即各頻數(shù)占有效樣本數(shù)的百分比,這里有效樣本數(shù)=總樣本-缺失樣本數(shù)累計(jì)百分比(Cumulative
Percent):即各百分比逐級(jí)累加起來(lái)的結(jié)果。最終取值為100。(2)頻數(shù)分析的第二個(gè)任務(wù)是繪制統(tǒng)計(jì)圖條形圖(BarChart):用寬度相同的條形的高度或長(zhǎng)短來(lái)表示頻數(shù)分布變化的圖形,適用于定序和定類(lèi)變量的分析。餅圖(PieChart):用圓形及圓內(nèi)扇形的面積來(lái)表示頻數(shù)百分比變化的圖形,以利于研究事物內(nèi)在結(jié)構(gòu)組成等問(wèn)題。直方圖(Histograms):用矩形的面積來(lái)表示頻數(shù)分布變化的圖形,適用于定距型變量的分析。注:變量的計(jì)量尺度:a
定類(lèi)(Category
Scale):只能計(jì)次b
定序(Ordinal
Scale):計(jì)次、排序c
定距(Interval
Scale):計(jì)次、排序、加減d定比(RatioScale):計(jì)次、排序、加減、乘除4.1.2
頻數(shù)分析的基本操作選擇菜單【分析】—【描述分析】—【頻率】。將若干頻數(shù)分析變量選擇到【變量】框中。單擊【圖表】按鈕選擇繪制統(tǒng)計(jì)圖形,在【圖表值】框中選擇條形圖中縱坐標(biāo)(或餅圖中扇形面積)的含義,有【頻數(shù)】;【百分比】。輸出百分位數(shù):輸出四分位數(shù),顯示
25%、50%、75%的百分位數(shù);將數(shù)據(jù)平均分為所設(shè)定的相等等份,可輸入2—100的整數(shù),如鍵入4則輸出第25、50、75百分位數(shù)自定義百分位數(shù),可輸入0—100
的整數(shù)。離散趨勢(shì)分布形態(tài)欄集中趨勢(shì)欄輸出統(tǒng)計(jì)量對(duì)話框4.1.3
SPSS頻數(shù)分析的擴(kuò)展功能1、計(jì)算分位數(shù)(Percentile
Values)分位數(shù)是變量在不同分位點(diǎn)上的取值。分位點(diǎn)在0-100之間。一般使用較多的是四分位點(diǎn)(Quartiles),即將所有數(shù)據(jù)按升序排序后平均等分成四份,各分位點(diǎn)依次是25%,50%,75%。于是四分位數(shù)便分別是25%,50%,75%點(diǎn)所對(duì)應(yīng)的變量值。此外,還有八分位數(shù)、十六分位數(shù)等。SPSS提供了計(jì)算任意分位數(shù)的功能,用戶(hù)可以指定將數(shù)據(jù)等分為n份(Cut
points
for
n
equal
groups)。還可以直接指定分位點(diǎn)(Percentile)。2、計(jì)算其他基本描述統(tǒng)計(jì)量SPSS頻數(shù)分析還能夠計(jì)算其他基本統(tǒng)計(jì)量,其中包括描述集中趨勢(shì)(CentralTendency)的基本統(tǒng)計(jì)量、描述離散程度(Dispersion)的基本統(tǒng)計(jì)量、描述分布形態(tài)(Distribution)的基本統(tǒng)計(jì)量等。Format
對(duì)話框控制頻數(shù)表輸出的分類(lèi)數(shù)量。默認(rèn)為10多變量框中可設(shè)定多變量表格輸出的格式設(shè)置頻數(shù)表輸出的格式選擇頻數(shù)表中排列順序按變量升序排列,此為默認(rèn)按變量降序排列按變量各種取值發(fā)生的頻數(shù)的升序排列按變量各種取值發(fā)生的頻數(shù)的降序排列3、頻數(shù)分布表格式(Format)的定義(1)調(diào)整頻數(shù)分布表中數(shù)據(jù)的輸出順序(Orderby):頻數(shù)分布表中的內(nèi)容的輸出順序可以按變量值的升序輸出(Ascendingvalues),按變量值的降序輸出(Descending
values),按頻數(shù)的升序輸出(
Ascending counts),按頻數(shù)的降序輸出(
Descending counts)。(2)【多個(gè)變量】單選框組:如果選擇了兩個(gè)以上變量作頻數(shù)表,則
compare
variables可以將所有變量的結(jié)果在同一個(gè)頻數(shù)表過(guò)程輸出結(jié)果中顯示,便于互相比較;organize
output
byvariables則將結(jié)果在不同的頻數(shù)表過(guò)程輸出結(jié)果中顯示,每一個(gè)變量一張表。(3)壓縮頻數(shù)分布表(Suppress
tableswith
more
than
n
categories)如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)太多,頻數(shù)分布表將很龐大,此時(shí)可以壓縮它。
SPSS默認(rèn),如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)大于10,則不輸出相應(yīng)的頻數(shù)分布表。應(yīng)用中可以修改該值。4.1.4
頻數(shù)分析的應(yīng)用舉例利用商品房購(gòu)買(mǎi)意向的調(diào)查數(shù)據(jù)進(jìn)行頻數(shù)分析,有以下兩個(gè)分析目標(biāo):目標(biāo)一:分析被調(diào)查者的戶(hù)籍狀況以及他們認(rèn)為房?jī)r(jià)的變化狀況。目標(biāo)二:分析月住房開(kāi)銷(xiāo)的分布,并對(duì)不同居住類(lèi)型進(jìn)行比較。4.2.1
基本描述統(tǒng)計(jì)量常見(jiàn)的基本描述統(tǒng)計(jì)量有三大類(lèi):刻畫(huà)集中趨勢(shì)的統(tǒng)計(jì)量刻畫(huà)離中趨勢(shì)的統(tǒng)計(jì)量刻畫(huà)分布形態(tài)的統(tǒng)計(jì)量1、刻畫(huà)集中趨勢(shì)的描述統(tǒng)計(jì)量集中趨勢(shì)是指一組數(shù)據(jù)向某一中心值靠攏的傾向。(1)均值(Mean):即算術(shù)平均數(shù),是反映某變量所有取值的集中趨勢(shì)或平均水平的指標(biāo)。如某企業(yè)職工的平均月收入。其計(jì)算公式為:ini
=1nx
=
1
x中位數(shù)(Median):即一組數(shù)據(jù)按升序排序后,處于中間位置上的數(shù)據(jù)值。如評(píng)價(jià)社會(huì)的老齡化程度時(shí),可用中位數(shù)。眾數(shù)(Mode):即一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值。如生產(chǎn)鞋的廠商在制定各種型號(hào)鞋的生產(chǎn)計(jì)劃時(shí)應(yīng)該運(yùn)用眾數(shù)。(4)均值標(biāo)準(zhǔn)誤差(Standard
Error
of
Mean):描述樣本均值與總體均值之間的平均差異程度的統(tǒng)計(jì)量。其計(jì)算公式為:為總體標(biāo)準(zhǔn)差,n為樣本單位數(shù)nn
snS
.E
.of
.M
ean
===
(
x
-
X
)
2
[
x
-
E
(
x
)]2其中:s2、刻畫(huà)離散程度的描述統(tǒng)計(jì)量離散程度是指一組數(shù)據(jù)遠(yuǎn)離其“中心值”的程度。如果數(shù)據(jù)都緊密地集中在“中心值”的周?chē)?,?shù)據(jù)的離散程度較小,說(shuō)明這個(gè)“中心值
”對(duì)數(shù)據(jù)的代表性好;相反,如果數(shù)據(jù)僅是比較松散地分布在“中心值”的周?chē)?,?shù)據(jù)的離散程度較大,則此“中心值”說(shuō)明數(shù)據(jù)特征是不具有代表性的。常見(jiàn)的刻畫(huà)離散程度的描述統(tǒng)計(jì)量如下:全距(Range):也稱(chēng)極差,是數(shù)據(jù)的最大值(Maximum)與最小值(Minimum)之間的絕對(duì)離差。方差(Variance):也是表示變量取值距均值的離散程度的統(tǒng)計(jì)量,是各變量值與算數(shù)平均數(shù)離差平方的算術(shù)平均數(shù)。其計(jì)算公式為:221nis
=(
x
-
x
)n
-
1i
=1(3)標(biāo)準(zhǔn)差(Standard
Deviation:StdDev):表示變量取值距離均值的平均離散程度的統(tǒng)計(jì)量。其計(jì)算公式為:標(biāo)準(zhǔn)差值越大,說(shuō)明變量值之間的差異越大,距均值這個(gè)“中心值”的離散趨勢(shì)越大。ii
=1s
=
(
x
-
x
)
2n
-
1n
1
3、刻畫(huà)分布形態(tài)的描述統(tǒng)計(jì)量數(shù)據(jù)的分布形態(tài)主要指數(shù)據(jù)分布是否對(duì)稱(chēng),偏斜程度如何,分布陡峭程度等??坍?huà)分布形態(tài)的統(tǒng)計(jì)量主要有兩種:(1)偏度(Skewness):描述變量取值分布形態(tài)對(duì)稱(chēng)性的統(tǒng)計(jì)量。其計(jì)算公式為:ii=1n
-1nSkewness
=
1
(x
-
x)3
/
s3當(dāng)分布為對(duì)稱(chēng)分布時(shí),正負(fù)總偏差相等,偏度值等于0;當(dāng)分布為不對(duì)稱(chēng)分布時(shí),正負(fù)總偏差不相等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,稱(chēng)為正偏或右偏;偏度值小于0表示負(fù)偏差值大,稱(chēng)為負(fù)偏或左偏。偏度絕對(duì)值越大,表示數(shù)據(jù)分布形態(tài)的偏斜程度越大。眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系圖示左偏分布均值中位數(shù)眾數(shù)對(duì)稱(chēng)分布均值中位數(shù)眾數(shù)右偏分布中位數(shù)眾數(shù)均值(2)峰度(Kurtosis):描述變量取值分布形態(tài)陡峭程度的統(tǒng)計(jì)量。其計(jì)算公式為:當(dāng)數(shù)據(jù)分布與標(biāo)準(zhǔn)正態(tài)分布的陡峭程度相同時(shí),峰度值等于0;峰度大于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭,為尖峰分布;峰度小于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布平緩,為平峰分布。4
41nini
=1Kurtosis
=(
x
-
x) /
s-
35.2.2
計(jì)算基本描述統(tǒng)計(jì)量的操作(1)選擇菜單【分析】-【描述統(tǒng)計(jì)】-【描述】,出現(xiàn)如下窗口:將需計(jì)算的數(shù)值型變量選擇到【變量】框中。單擊【選擇】按鈕指定計(jì)算哪些基本描述統(tǒng)計(jì)量,出現(xiàn)如下窗口:Options
對(duì)話框基本統(tǒng)計(jì)量當(dāng)Variables框中有多個(gè)變量時(shí),此框確定其輸出順序:按Variables框中的排列順序輸出按各變量的字母順序輸出按均值的升序排列按均值的降序排列分布在上面窗口中,用戶(hù)可以指定分析多變量時(shí)結(jié)果輸出的次序(DisplayOrder)。其中,Variablelist表示按變量在數(shù)據(jù)窗口中從左到右的次序輸出;Alphabetic表示按字母順序輸出;AscendingMeans表示按均值升序輸出;DescendingMeans表示按均值降序輸出。至此,SPSS便自動(dòng)計(jì)算所選變量的基本描述統(tǒng)計(jì)量并顯示到輸出窗口中。5.2.3
計(jì)算基本描述統(tǒng)計(jì)量的應(yīng)用舉例利用商品房購(gòu)買(mǎi)意向的調(diào)查數(shù)據(jù),對(duì)月住房開(kāi)銷(xiāo)變量計(jì)算基本描述統(tǒng)計(jì)量。有以下分析目標(biāo):計(jì)算月住房開(kāi)銷(xiāo)的基本描述統(tǒng)計(jì)量,并分別對(duì)不同居住類(lèi)型進(jìn)行比較分析:首先按居住類(lèi)型對(duì)數(shù)據(jù)進(jìn)行拆分(Splitfile),然后計(jì)算月住房開(kāi)銷(xiāo)的基本描述統(tǒng)計(jì)量。2.
分析月住房開(kāi)銷(xiāo)的數(shù)量是否存在不均衡現(xiàn)象。據(jù)的標(biāo)準(zhǔn)化處理來(lái)判斷。標(biāo)準(zhǔn)化的數(shù)學(xué)定義為:分析:假設(shè)月住房開(kāi)銷(xiāo)的分布服從正態(tài)分布,跟據(jù)3s
原則,異常值通常為3個(gè)標(biāo)準(zhǔn)差范圍之外的值,可通過(guò)對(duì)數(shù)xi
-
xzi
=s通過(guò)標(biāo)準(zhǔn)化可以得到一系列新變量值,通常稱(chēng)為標(biāo)準(zhǔn)化值或z分?jǐn)?shù)。計(jì)算標(biāo)準(zhǔn)化值可以通過(guò)對(duì)話框中的復(fù)選框【將標(biāo)準(zhǔn)化得分另存為變量(Z)】來(lái)實(shí)現(xiàn),并將結(jié)果保存在一個(gè)新變量中。該變量的命名規(guī)則為字母z+原變量名的前七個(gè)字符。接下來(lái)可對(duì)新變量進(jìn)行排序并瀏覽其標(biāo)準(zhǔn)化值的取值情況,可以發(fā)現(xiàn)z分?jǐn)?shù)值得絕對(duì)數(shù)大于3的樣本是存在的。對(duì)其分組為三組:zt10<-3,-3<zt10<3,zt10>3并進(jìn)行頻數(shù)分析可以發(fā)現(xiàn)月住房開(kāi)銷(xiāo)存在一定的不均衡現(xiàn)象。4.3.1
目的和基本任務(wù)1、目的:交叉分組下的頻數(shù)分析又稱(chēng)列聯(lián)表分析。通過(guò)前面的頻數(shù)分析能夠掌握單個(gè)變量的數(shù)據(jù)分布情況,在實(shí)際分析中,不僅要了解單個(gè)變量的分布特征,還要分析多個(gè)變量不同取值下的分布,進(jìn)而分析變量之間的相互影響和關(guān)系。對(duì)于這種涉及兩個(gè)或兩個(gè)以上變量分布情況的研究通常要利用交叉分組下的頻數(shù)分析來(lái)完成。2、基本任務(wù):根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表;在交叉列聯(lián)表的基礎(chǔ)上,對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。4.3.2
交叉列聯(lián)表的主要內(nèi)容編制交叉列聯(lián)表是交叉分組下頻數(shù)分析的第一個(gè)任務(wù)。交叉列聯(lián)表是兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表。例:職工基本情況數(shù)據(jù)按職稱(chēng)和文化程度編制的二維交叉列聯(lián)表(見(jiàn)下頁(yè)表):職職*
文文文文Crosstabulation文文文文Total本本專(zhuān)本高高初高職職高高高文高Count11103%within
職職33.3%33.3%33.3%.0%100.0%%within
文文文文25.0%25.0%20.0%.0%18.8%%
of
Total6.3%6.3%6.3%.0%18.8%高文高Count13004%within
職職25.0%75.0%.0%.0%100.0%%within
文文文文25.0%75.0%.0%.0%25.0%%
of
Total6.3%18.8%.0%.0%25.0%助助高文高Count20136%within
職職33.3%.0%16.7%50.0%100.0%%within
文文文文50.0%.0%20.0%100.0%37.5%%
of
Total12.5%.0%6.3%18.8%37.5%無(wú)無(wú)無(wú)職職Count00303%within
職職.0%.0%100.0%.0%100.0%%within
文文文文.0%.0%60.0%.0%18.8%%
of
Total.0%.0%18.8%.0%18.8%TotalCount445316%within
職職25.0%25.0%31.3%18.8%100.0%%within
文文文文100.0%100.0%100.0%100.0%100.0%%
of
Total25.0%25.0%31.3%18.8%100.0%上表中的職稱(chēng)變量稱(chēng)為行變量(Row),文化程度稱(chēng)為列變量(Column)。行標(biāo)題和列標(biāo)題分別是兩個(gè)變量的變量值(或分組值)。表格中間是觀測(cè)頻數(shù)(Observed
Counts)和各種百分比。16名職工中,本科、專(zhuān)科、高中、初中的人數(shù)分別為4,4,5,3,構(gòu)成的分布稱(chēng)為交叉列聯(lián)表的列邊緣分布;高級(jí)工程師、工程師、助理工程師、無(wú)技術(shù)職稱(chēng)的人數(shù)分別為3,4,6,3,構(gòu)成的分布稱(chēng)為交叉列聯(lián)表的行邊緣分布;4個(gè)本科學(xué)歷職工中各職稱(chēng)的人數(shù)分別是1,1,2等,這些頻數(shù)構(gòu)成的分布稱(chēng)為條件分布,即在行變量(列變量)取值條件下的列變量(行變量)的分布。在交叉列聯(lián)表中,除了頻數(shù)外還引進(jìn)了各種百分比。例如表中第一行中的33.3%,33.3%,33.3%分別是高級(jí)工程師3人中各學(xué)歷人數(shù)所占的比例,稱(chēng)為行百分比(Row
percentage),一行的百分比總和為100%;表中第一列的25.0%,25.0%,50.0%分別是本科學(xué)歷4人中各職稱(chēng)人數(shù)所占的比例,稱(chēng)為列百分比(Column
percentage),一列的列百分比總和為100%,表中的6.3%,6.3%,12.5%等分別是總?cè)藬?shù)16人中各交叉組中人數(shù)所占的百分比,稱(chēng)為總百分比(Totalpercentage),所有格子中的總百分比之和也為100%。4.3.3
交叉分組下的頻數(shù)分析的基本操作(1)菜單選【分析】-【描述統(tǒng)計(jì)】-【交叉表】,出現(xiàn)窗口如下:該框中的變量作為分布表中的行變量和列變量。該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個(gè)控制變量。顯示每一組中各變量的分類(lèi)條形圖。只輸出統(tǒng)計(jì)量,不輸出多維列聯(lián)表。(2)如果進(jìn)行二維列聯(lián)表分析,則將行變量選擇到Row(s)框中,將列變量選擇到Column(s)框中。如果Row(s)和Column(s)框中有多個(gè)變量名,SPSS會(huì)將行列變量一一配對(duì)后產(chǎn)生多張二維列聯(lián)表。如果進(jìn)行三維或多維列聯(lián)表分析,則將其他變量作為控制變量選到Layer框中。多控制變量間可以是同層次的,也可以是逐層疊加的,可通過(guò)Previous或Next按鈕確定控制變量間的層次關(guān)系。選擇【顯示復(fù)式條形圖】Display
clustered
barcharts選項(xiàng),指定繪制各變量交叉分組下頻數(shù)分布條形圖?!救∠砀瘛縎uppresstables表示不輸出列聯(lián)表,在僅分析行列變量間關(guān)系時(shí)可選擇該選項(xiàng)。單擊【單元格】Cells按鈕指定列聯(lián)表單元格中的輸出內(nèi)容,窗口如下:選擇在列聯(lián)表中輸出的統(tǒng)計(jì)量,包括觀測(cè)量數(shù)、百分比、殘差輸出觀測(cè)量的實(shí)際數(shù)量如果行和列變量在統(tǒng)計(jì)上是獨(dú)立的或不相關(guān)的,那么會(huì)在單元格中輸出期望的觀測(cè)值的數(shù)量。輸出單元格中觀測(cè)量的數(shù)目占整行全部觀測(cè)量數(shù)目的百分比輸出單元格中觀測(cè)值的數(shù)目占整列全部觀測(cè)量數(shù)目的百分比輸出單元格中觀測(cè)量的數(shù)目占全部觀測(cè)量數(shù)目的百分比計(jì)算非標(biāo)準(zhǔn)化殘差計(jì)算標(biāo)準(zhǔn)化殘差
計(jì)算調(diào)整后殘差feSPSS默認(rèn)列聯(lián)表單元格中只輸出觀測(cè)頻數(shù)(Observed)。為便于分析,通常還應(yīng)指定輸出
Percentage框中的行百分比(Row)、列百分比(Column)、總百分比(Total)。Counts框中的
Expected表示輸出期望頻數(shù);Residuals框中的各個(gè)選項(xiàng)表示在各個(gè)單元格中輸出剩余。其中,
Unstandardized為非標(biāo)準(zhǔn)化剩余,定義為觀測(cè)頻數(shù)-期望頻數(shù);Standardized為標(biāo)準(zhǔn)化剩余,又稱(chēng)Pearson剩余,定義為:Std.Re
siduals
=
f0
-
fe單擊【格式】Format按鈕指定列聯(lián)表各單元格的輸出排列順序。【升序】Ascending表示以行變量取值的升序排列,是SPSS默認(rèn)項(xiàng);【降序】
Descending表示以行變量取值的降序排列。單擊【統(tǒng)計(jì)量】Statistics按鈕指定用哪種方法分析行變量和列變量間的關(guān)系,窗口如下,其中,Chi-Square為卡方檢驗(yàn)。4.3.4
交叉列聯(lián)表行列變量間關(guān)系的分析對(duì)交叉列聯(lián)表中的行變量和列變量之間關(guān)系進(jìn)行分析是交叉分組下頻數(shù)分析的第二個(gè)任務(wù)。為了理解行、列變量之間的關(guān)系,可以從分析兩個(gè)極端的例子出發(fā):(1)年齡與工資收入的交叉列聯(lián)表(一)工資收入年齡段低中高青40000中05000老00600(2)年齡與工資收入交叉列聯(lián)表(二)表一中表示年齡與工資收入呈正相關(guān)關(guān)系,表二表示年齡與工資收入呈負(fù)相關(guān)關(guān)系。但大多數(shù)情況下,觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中,不容易直接發(fā)現(xiàn)行列變量之間的關(guān)系強(qiáng)弱程度,此時(shí)就要借助非參數(shù)檢驗(yàn)方法。通常用的方法是卡方檢驗(yàn)。工資收入年齡段低中高青00600中05000老40000卡方檢驗(yàn)屬假設(shè)檢驗(yàn)的范疇,步驟如下:建立原假設(shè)H0在列聯(lián)表分析中卡方檢驗(yàn)的原假設(shè)為行變量與列變量獨(dú)立選擇和計(jì)算檢驗(yàn)統(tǒng)計(jì)量列聯(lián)表分析卡方檢驗(yàn)統(tǒng)計(jì)量是Pearson卡方統(tǒng)計(jì)量,其數(shù)學(xué)定義為:其中,r為列聯(lián)表的行數(shù),c為列聯(lián)表的列數(shù);f
0
為觀察頻數(shù),f
e
為期望頻數(shù)(Expected
Count)。期望頻數(shù)的計(jì)算方法是:其中,RT是指定單元格所在行的觀測(cè)頻數(shù)合計(jì),CT是指定單元格所在列的觀測(cè)頻數(shù)合計(jì),n是觀測(cè)頻數(shù)的合計(jì)。期望頻數(shù)的分布反映的是行列變量互不相干下的分布。r
cijf
ei=1
j=1(
f
0
-
f
e
)2c2
=
ij
ij
ef=
R
T
·
C
T
·
n
=
R
T
·
C
Tn
n
n職職*
文文文文Crosstabulation文文文文Total本本專(zhuān)本高高初高職職高高高文高Count11103%within
職職33.3%33.3%33.3%.0%100.0%%within
文文文文25.0%25.0%20.0%.0%18.8%%
of
Total6.3%6.3%6.3%.0%18.8%高文高Count13004%within
職職25.0%75.0%.0%.0%100.0%%within
文文文文25.0%75.0%.0%.0%25.0%%
of
Total6.3%18.8%.0%.0%25.0%助助高文高Count20136%within
職職33.3%.0%16.7%50.0%100.0%%within
文文文文50.0%.0%20.0%100.0%37.5%%
of
Total12.5%.0%6.3%18.8%37.5%無(wú)無(wú)無(wú)職職Count00303%within
職職.0%.0%100.0%.0%100.0%%within
文文文文.0%.0%60.0%.0%18.8%%
of
Total.0%.0%18.8%.0%18.8%TotalCount445316%within
職職25.0%25.0%31.3%18.8%100.0%%within
文文文文100.0%100.0%100.0%100.0%100.0%%
of
Total25.0%25.0%31.3%18.8%100.0%例如,具有本科學(xué)歷的高級(jí)工程師的期望頻數(shù)是0.75的計(jì)算公式是3*4/16=0.75。這里,期望頻數(shù)可以理解為,總共16個(gè)職工的學(xué)歷分布是25%:25%:31.3%:18.8%,如果遵從這種學(xué)歷的總體比例關(guān)系,高級(jí)職稱(chēng)三人的學(xué)歷分布也應(yīng)為25%:25%:31.3%:18.8%,于是期望頻數(shù)為3*25%、3*25%、3*31.3%、3*18.8%。同理可以理解,總共16個(gè)職工的職稱(chēng)分布為18.8%:25%:37.5%:18.8%,本科學(xué)歷4人的期望頻數(shù)分別為4*18.8%、4*25%、4*37.5%、4*18.8%。卡方統(tǒng)計(jì)量觀測(cè)值的大小取決于兩個(gè)因素:第一:列聯(lián)表的單元格子數(shù);第二:觀測(cè)頻數(shù)與期望頻數(shù)的總差值。在列聯(lián)表確定的情況下,卡方統(tǒng)計(jì)量觀測(cè)值的大小取決于觀測(cè)頻數(shù)與期望頻數(shù)的總差值。當(dāng)總差值越大時(shí),卡方值也就越大,實(shí)際分布與期望分布的差距越大,表明行列變量之間越相關(guān);反之表明行列變量之間越獨(dú)立。那么,在統(tǒng)計(jì)上卡方統(tǒng)計(jì)量的觀測(cè)值究竟達(dá)到什么程度才能斷定行列變量不獨(dú)立呢?由于該檢驗(yàn)中的pearson卡方統(tǒng)計(jì)量近似服從卡方分布,因此可依據(jù)卡方理論找到某自由度和顯著性水平下的卡方值,即卡方臨界值。絕的風(fēng)險(xiǎn),即棄真的概率。通常設(shè)為0.05或0.01。在卡方檢驗(yàn)中,由于卡方統(tǒng)計(jì)量服從自由度為(行數(shù)-1)×(列數(shù)-1)的卡方分布,因此,在行列數(shù)目和顯著性水平確定時(shí),卡方臨界值是可唯一確定的。(3)確定顯著性水平(SignificantLevel)和臨界值顯著性水平a
是指原假設(shè)為真卻將其拒(4)結(jié)論和決策對(duì)統(tǒng)計(jì)推斷做決策通常有兩種方式:根據(jù)統(tǒng)計(jì)量觀測(cè)值和臨界值比較的結(jié)果進(jìn)行決策。如果卡方觀測(cè)值大于臨界值,則認(rèn)為實(shí)際分布與期望分布之間的差距顯著,可以拒絕原假設(shè),斷定列聯(lián)表的行列變量間不獨(dú)立,存在相關(guān)關(guān)系;反之,接受原假設(shè)。根據(jù)統(tǒng)計(jì)量觀測(cè)值的概率p值和顯著性水平a
比較的結(jié)果進(jìn)行決策。如果p值小于等于a
,則認(rèn)為卡方觀測(cè)值出現(xiàn)的概率是很小的,拒絕原假設(shè),斷定列聯(lián)表的行列變量間不獨(dú)立,存在依存關(guān)系;反之,接受原假設(shè)。是一個(gè)概率值;如果原假設(shè)為真,P-值是抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率;被稱(chēng)為觀察到的(或?qū)崪y(cè)的)顯著性水平。a/2a/2Z拒絕拒絕H0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2
P
值1/2
P
值H0值臨界值樣本統(tǒng)計(jì)量拒絕域a1
-
aP
值抽樣分布置信水平計(jì)算出的樣本統(tǒng)計(jì)量H0值拒絕域抽樣分布1
-
a置信水平臨界值計(jì)算出的樣本統(tǒng)計(jì)量aP
值(決策準(zhǔn)則)若p-值>a,不拒絕H0若p-值<a,拒絕H04.3.5
交叉分組下的頻數(shù)分析應(yīng)用舉例利用商品房購(gòu)買(mǎi)意向調(diào)查數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)以下目標(biāo):1、不同居住類(lèi)型的被訪者未來(lái)的購(gòu)房預(yù)期是否一致。分析:1、該問(wèn)題列聯(lián)表的行變量為居住類(lèi)型,列變量為購(gòu)房,在列聯(lián)表中輸出各種百分比、期望頻數(shù)、剩余、標(biāo)準(zhǔn)化剩余,顯示各交叉分組下頻數(shù)分布柱形圖,并利用卡方檢驗(yàn)方法,對(duì)不同居住類(lèi)型對(duì)購(gòu)房預(yù)期的態(tài)度是否一致進(jìn)行分析。戶(hù)戶(hù)*
未未未未未未Crosstabulation未未未未未未Total增增基本基基減減戶(hù)戶(hù)城城戶(hù)戶(hù)
Count%within
戶(hù)戶(hù)%within
未未未未未未%
of
Total651401822329.1%62.8%8.1%100.0%84.4%70.4%48.6%71.2%20.8%44.7%5.8%71.2%農(nóng)農(nóng)戶(hù)戶(hù)
Count%within
戶(hù)戶(hù)%within
未未未未未未%
of
Total1259199013.3%65.6%21.1%100.0%15.6%29.6%51.4%28.8%3.8%18.8%6.1%28.8%TotalCount7719937313%within
戶(hù)戶(hù)24.6%63.6%11.8%100.0%%within
未未未未未未100.0%100.0%100.0%100.0%%
of
Total24.6%63.6%11.8%100.0%未未未未未未*
戶(hù)戶(hù)Crosstabulation戶(hù)戶(hù)Total城城戶(hù)戶(hù)農(nóng)農(nóng)戶(hù)戶(hù)未未增增Count%within
未未未未未未%within
戶(hù)戶(hù)%
of
Total651277未未未未84.4%15.6%100.0%29.1%13.3%24.6%20.8%3.8%24.6%基本基基Count%within
未未未未未未%within
戶(hù)戶(hù)%
of
Total1405919970.4%29.6%100.0%62.8%65.6%63.6%44.7%18.8%63.6%減減Count%within
未未未未未未%within
戶(hù)戶(hù)%
of
Total18193748.6%51.4%100.0%8.1%21.1%11.8%5.8%6.1%11.8%TotalCount22390313%within
未未未未未未71.2%28.8%100.0%%within
戶(hù)戶(hù)100.0%100.0%100.0%%
of
Total71.2%28.8%100.0%Chi-Square
TestsValuedfAsymp.
Sig.(2-sided)Pearson
Chi-Square15.819a2.000Likelihood
Ratio15.7292.000Linear-by-LinearAssociation15.2961.000N
of
Valid
Cases313a.
0
cells
(.0%)
have
expected
count
less
than
5.
Theminimum
expected
count
is
10.64.5.3.6
SPSS中列聯(lián)表分析的其他方法對(duì)列聯(lián)表中行列變量的分析,除上述卡方檢驗(yàn)方法之外,SPSS還提供了其他測(cè)度變量間相關(guān)關(guān)系的檢驗(yàn)方法,包括:適用于兩定類(lèi)變量的方法:Nominal框中列出的方法屬該類(lèi)方法。適用于兩定序變量的方法:Ordinal框中列出的方法屬該類(lèi)方法。適用于一定類(lèi)變量、一定距變量的方法:Nominal
byinterval框中的Eta方法屬該類(lèi)方法。其他方法。多選項(xiàng)問(wèn)題的概念:多選項(xiàng)問(wèn)題是根據(jù)實(shí)際調(diào)查的需要,要求被調(diào)查者從問(wèn)卷給出的若干個(gè)可選答案中選擇一個(gè)以上的答案。目前,市場(chǎng)研究或許多領(lǐng)域?qū)δ呈挛镌u(píng)價(jià)的研究中常常遇到這樣的問(wèn)題??梢赃x多個(gè),分為限選和不限選:限選:如在11種工作種類(lèi)中,選你喜歡的,最多可選4種(Var1-Var4);求所有人喜歡各種工作的頻數(shù)或頻率。不限選:如在所列的20種電器中,你家所擁有的電器,不限選(Var1-Var20),求所有被調(diào)查家庭擁有各種電器的頻數(shù)或頻率。編號(hào)調(diào)查內(nèi)容選
項(xiàng)1您喜歡紅色嗎□是□否2您喜歡橙色嗎□是□否3您喜歡黃色嗎□是□否4您喜歡綠色嗎□是□否5您喜歡青色嗎□是□否6您喜歡藍(lán)色嗎□是□否7您喜歡紫色嗎□是□否8您喜歡黑色嗎□是□否9您喜歡白色嗎□是□否多選項(xiàng)二分法及其編碼(multiple
dichotomies
method):多選項(xiàng)二分法是將多選項(xiàng)問(wèn)題中的每一個(gè)答案設(shè)為一個(gè)SPSS變量,每個(gè)變量值有0或1兩個(gè)取值,分別表示選擇了該答案和不選擇該答案。如對(duì)下面問(wèn)題有9個(gè)可能的答案,每個(gè)可選擇的答案由一個(gè)變量表示,每個(gè)變量的值只能有表明“是”和“否”的兩個(gè)代碼0或者1。左邊的表格為向顧客發(fā)放的顏色調(diào)查,在選擇服裝時(shí),您喜歡什么顏色作為主體顏色,在答案的“□”中打“”(可多選)這是一組問(wèn)題,每個(gè)問(wèn)題均有兩
個(gè)答案,回答者只能選擇其中一種。
在建立數(shù)據(jù)文件時(shí),變量名使用相同
的變量主名,后面加以不同序號(hào)組成,本組問(wèn)題的9個(gè)變量名可以是color1-color9。而答案的編碼規(guī)則為:回答
“是”變量值為1,回答“否”變量值為0,其他值為缺失值。多選項(xiàng)分類(lèi)法及其編碼(multiple
categorymethod):多選項(xiàng)分類(lèi)法中,首先應(yīng)估計(jì)多選項(xiàng)問(wèn)題最多可能出現(xiàn)的答案?jìng)€(gè)數(shù);然后為每個(gè)答案設(shè)置一個(gè)SPSS變量,變量取值為多選項(xiàng)問(wèn)題中的所有可選答案。如上面有關(guān)選擇服裝的主體顏色,您可以選擇喜歡的三種,在提供的10種答案前上選擇。1、紅2、橙3、黃4、綠5、青6、藍(lán)7、紫8、黑9、白10說(shuō)不清這是一個(gè)問(wèn)題,可以有三個(gè)答案。在建立數(shù)據(jù)文件時(shí),要建立三個(gè)變量color1-color3表示回答者選擇的三個(gè)顏色。如選擇結(jié)果為1、紅、6、藍(lán)、8、黑,則變量color1的值為1,變量color2的值為6,變量color3的值為8。問(wèn)題1:您家中是否有下列物品:(可多選)
1
3
5
61、電話2、傳真機(jī)3、有線電視4、衛(wèi)星電視5、手機(jī)6、電腦如果采用多選二分法則有6個(gè)選項(xiàng),故應(yīng)設(shè)6個(gè)變量,運(yùn)用0-1編碼方法編碼,即:1,0,1,0,1,1。如果采用多選分類(lèi)法,則編碼為1,3,5,6,0,0。問(wèn)題2:擇業(yè)中考慮的主要因素(多選)1經(jīng)濟(jì)收入2專(zhuān)業(yè)對(duì)口4地理區(qū)位6風(fēng)險(xiǎn)大小8社會(huì)福利3發(fā)展前途5個(gè)人愛(ài)好7勞動(dòng)強(qiáng)度9其他編碼應(yīng)為:1,0,1,1,1,0,1,1,0。或1,3,4,5,7,8,0,0,0。問(wèn)題3:您擇業(yè)中考慮的主要因素有(限選三項(xiàng))1361經(jīng)濟(jì)收入3發(fā)展前途5個(gè)人愛(ài)好7勞動(dòng)強(qiáng)度9社會(huì)地位2
專(zhuān)業(yè)對(duì)口4地理區(qū)位6風(fēng)險(xiǎn)大小8社會(huì)福利10其他因?yàn)橄捱x三項(xiàng),故應(yīng)設(shè)三個(gè)變量,編碼依次為1,3,6。首先將每個(gè)題的若干答案組成一個(gè)綜合變量即變量集
(Set),然后對(duì)綜合變量的各種取值進(jìn)行分析。只有通過(guò)定義多選項(xiàng)變量集,spss才能確定應(yīng)對(duì)哪些變量取相同值的個(gè)案數(shù)進(jìn)行累加。多選項(xiàng)分析在SPSS中是通過(guò)Analyze-Multiple
Response中的各項(xiàng)功能實(shí)現(xiàn)的。1.Define
Sets:(1)從左邊的變量中將多選變量集的變量選擇到
variables
insets框中,建立多選二分變量集或多選分類(lèi)變量集。(2)在variables
are
coded
as框中指定多選變量集中的變量是按照那種方法編碼的。Dichotomies表示以多選二分法編碼,并在countedvalue中輸入用哪個(gè)數(shù)值來(lái)表示選中該選項(xiàng)。categories表示以多選分類(lèi)法編碼,并在
range框中輸入變量取值的最小值和最大值。(3)為多選項(xiàng)變量集命名,系統(tǒng)會(huì)自動(dòng)在該名字前加字符$。(4)單擊add按鈕將定義好的多選項(xiàng)變量集加到multresponse
sets框中。Spss可以定義多個(gè)多選項(xiàng)變量集。2.Frequencies:對(duì)多選變量集進(jìn)行頻數(shù)分析。從multresponsesets中把待分析的多選項(xiàng)變量集選擇到tables
for框中;3.Crosstabs:對(duì)多選變量集與其他變量集或與原基本變量進(jìn)行交叉表分析。(1)選擇列聯(lián)表的行變量并定義取值范圍;(2)選擇列聯(lián)表的列變量并定義取值范圍;(3)選擇列聯(lián)表的控制變量并定義取值范圍;(4)單擊option按鈕選擇列聯(lián)表的輸出內(nèi)容和計(jì)算方法。Match
variableacrossresponsesets選項(xiàng)表示,如果列聯(lián)表的行列變量均為多選項(xiàng)變量集時(shí),第一個(gè)變量集的第一個(gè)變量與第二個(gè)變量集的第一個(gè)變量作交叉分組,依次類(lèi)推。結(jié)果中:注意Pct
of
Responses(占總回答數(shù)的%)和Pct
of
Case(占總個(gè)案數(shù)%)的區(qū)別。利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)以下兩個(gè)分析目標(biāo):分析儲(chǔ)戶(hù)的儲(chǔ)蓄目的;分析不同年齡段儲(chǔ)戶(hù)的儲(chǔ)蓄目的。為進(jìn)行多選項(xiàng)分析,首先定義名為cxmd的多選項(xiàng)變量集,其中包括a7_1、a7_2、a7_3三個(gè)變量,然后對(duì)多選項(xiàng)變量集進(jìn)行頻數(shù)分析;對(duì)不同年齡段儲(chǔ)戶(hù)儲(chǔ)蓄目的進(jìn)行分析,采用多選項(xiàng)交叉分組下的頻數(shù)分析。1.
分析目的和方法奇異性:數(shù)據(jù)過(guò)大或過(guò)?。ㄕ页觥⒎治鲈?、是否剔除)分布特征:數(shù)據(jù)是否來(lái)自正態(tài)總體考察方法:統(tǒng)計(jì)量和統(tǒng)計(jì)圖形(箱式圖、莖葉圖、QQ圖)2.
一般是考察定距變量3.
Analyze
+
Descriptive
Statistics
+
Explore分析變量(Dependent
List):數(shù)值型變量分組變量(Factor
List):分類(lèi)變量標(biāo)識(shí)變量(Label
Cases
by):用某變量的值作為觀察值得標(biāo)識(shí)如id選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為分析變量,單擊OK可獲得分析變量的一系列基本統(tǒng)計(jì)量和圖形。此作為分組變量,可以是字符變量,對(duì)分析變量的分析將按該變量的觀測(cè)值進(jìn)行分組分析??捎卸鄠€(gè)分組變量,這時(shí)會(huì)按多個(gè)變量的交叉組合進(jìn)行分組。該框中的變量作為標(biāo)識(shí)
符,在輸出諸如異常值
時(shí),用該變量進(jìn)行標(biāo)識(shí),只允許有一個(gè)標(biāo)識(shí)符??赏瑫r(shí)輸出基本統(tǒng)計(jì)量和圖形只輸出基本統(tǒng)計(jì)量只輸出圖形輸出基本統(tǒng)計(jì)量均值的置信區(qū)間,可鍵入1—99%的任意值,根據(jù)該值算出置信區(qū)間的上下限。給出中心趨勢(shì)的最大似然比的穩(wěn)健估計(jì)量,當(dāng)數(shù)據(jù)分布均勻,且兩尾較長(zhǎng),或當(dāng)數(shù)據(jù)中存在極端值時(shí),可給出比均值或中位數(shù)更合理的估計(jì)。輸出最大和最小的5個(gè)數(shù),且在輸出窗口中加以標(biāo)明。輸出5%、10%、25%、50%、75%、90%和95%的百分位數(shù)。Statistics子對(duì)話框:用于選擇需要的描述統(tǒng)計(jì)量;
descriptives:輸出均值、中位數(shù)、眾數(shù)、5%修正均值、估計(jì)標(biāo)準(zhǔn)誤、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位差、峰度系數(shù)及其標(biāo)準(zhǔn)誤、偏度系數(shù)及其標(biāo)準(zhǔn)誤及指定的均值置信區(qū)間;m-estmators:做集中趨勢(shì)的最大穩(wěn)健估計(jì),該統(tǒng)計(jì)量是利用迭代方法計(jì)算出來(lái)的,受異常值的影響要小得多。如果該估計(jì)量離均值較遠(yuǎn),則說(shuō)明數(shù)據(jù)可能存在異常值,此時(shí)宜用該估計(jì)量替代均值以反映集中趨勢(shì)。一共會(huì)輸出四種m估計(jì)量,其中huber適用于數(shù)據(jù)接近正態(tài)分布時(shí),另三種則適用于數(shù)據(jù)中有許多異常值的情況;outliers:輸出五個(gè)最大值和五個(gè)最小值。percentiles:輸出第5%、10%、25%、50%、75%、90%、95%分位數(shù)。plots子對(duì)話框:用于選擇需要的統(tǒng)計(jì)圖;boxplots復(fù)選框:確定箱式圖的繪制方式,可以分組繪制(factorlevelstogether),也可以不分組繪制(dependentstogether),或者不繪制(none);descriptive復(fù)選框:可以選擇繪制莖葉圖(stem-and-leaf)和直方圖(histogram);normality
plot
with
test:繪制正態(tài)分布圖(QQ圖),并進(jìn)行變量是否符合正態(tài)分布的檢驗(yàn);1.用于顯示未分組的原始數(shù)據(jù)的分布2.由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的3.以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉4.樹(shù)葉上只保留一位數(shù)字5.莖葉圖類(lèi)似于橫置的直方圖,但又有區(qū)別:直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息6.圖的下方會(huì)標(biāo)示出莖寬和實(shí)際值的倍數(shù),每行的莖和葉組成的數(shù)字再乘以莖寬,即得到實(shí)際數(shù)據(jù)的近似值如莖寬為10,則圖中的2.3代表23,同樣在圖的下方也會(huì)標(biāo)示出每片葉子代表的記錄數(shù)。利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)一次存款金額變量進(jìn)行探索性分析。5.6.1
比率分析的目的和主要指標(biāo)比率分析用于對(duì)兩變量間變量值比率變化的描述分析,適用于數(shù)值型變量。例如根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況的數(shù)據(jù),分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例情況。通常的分析可以生成各個(gè)地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比率變量,然后對(duì)該比率變量計(jì)算基本描述統(tǒng)計(jì)量(如均值、中位數(shù)、標(biāo)準(zhǔn)差、全距等),進(jìn)而刻畫(huà)比率變量的集中趨勢(shì)和離散程度。SPSS的比率分析除能夠完成上述分析外,還提供了其他相對(duì)比描述指標(biāo),大致也屬于集中趨勢(shì)描述指標(biāo)和離散程度描述指標(biāo)的范疇,具體包括:其中,Ri
是比率數(shù),M是比率變量的中位數(shù),N為樣本數(shù)N加權(quán)比率均值(Weightedmean):兩變量均值的比,屬集中趨勢(shì)描述指標(biāo)。AAD(AverageAbsoluteDeviation)平均絕對(duì)離差:是對(duì)比率變量離散程度的描述,計(jì)算公式為:AAD
=
Ri
-
M相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù)的計(jì)算相對(duì)數(shù)(或平均數(shù))用Y
表示,有Y=a/b,a、b為總量指標(biāo)。求各期Y的平均一般不能采用簡(jiǎn)單算術(shù)平均法,即Y
?
Yn因?yàn)楦髌跀?shù)據(jù)Yi的對(duì)比基礎(chǔ)bi不同,它們對(duì)全期總平均水平的影響作用應(yīng)輕重有別.計(jì)算公式:1.分別計(jì)算其分子、分母的平均數(shù)2.對(duì)比得:b上式實(shí)質(zhì)上等于對(duì)各期Y加權(quán)算術(shù)平均。Y
=
a(3)COD(CoefficientofDispersion)離散系數(shù):也是對(duì)比率變量離散程度的描述,計(jì)算公式為:(
)M(4)PRD(Price-relatedDifferential)相關(guān)價(jià)格微分:是比率均值與加權(quán)比率均值的比,也是比率變量離散程度的描述。COD
=
N
Ri
-
R(5)COV變異系數(shù):用于對(duì)比率變量離散程度的描述,分為基于均值的變異系數(shù)(Meancentered
COV)和中位數(shù)的變異系數(shù)(MediancenteredCOV)。前者是通常意義下的變異系數(shù),是標(biāo)準(zhǔn)差除以均值;后者定義為:2(
)iM(
R
-
M
)COV
=
N
5.6.2
比率分析的基本步驟(1)選擇菜單Analyze-Descriptive
Statistics-Radio,出現(xiàn)窗口將比率變量的分子選擇到Numerator框中,將比率變量的分母選到Denominator框中。如果做不同組間的比率比較,則將分組變量選擇到Group
Variable框中。單擊Statistics按鈕指定輸出哪些關(guān)于比率的描述統(tǒng)計(jì)量,出現(xiàn)如下窗口:至此,SPSS將自動(dòng)計(jì)算比率變量,并將相關(guān)指標(biāo)輸出到輸出窗口中。(case
summaries)過(guò)程casesummaries過(guò)程用于按指定的分組變量的不同水平進(jìn)行交叉描述性統(tǒng)計(jì)分析。Analyze-report-case
summary進(jìn)入。
variables框:選擇需要進(jìn)行分析的變量,可多選;grouping
variables框:選擇用于分組的變量。如果選擇了多個(gè)分組變量,則系統(tǒng)會(huì)按各個(gè)變量的不同取值的交叉組合對(duì)匯總變量進(jìn)行分析。Display
case:用于確定是否輸出詳細(xì)的記錄列表,下面的三個(gè)復(fù)選框用于選擇具體的輸出方式。Statistics子對(duì)話框用于選擇一些常用的統(tǒng)計(jì)量。title子對(duì)話框:
title框:用于定義輸出表格的標(biāo)題,默認(rèn)標(biāo)題為case
summaries。caption框:用于給輸出表格加上注解文字。subheadingsfortotals:用于選擇是否給每個(gè)分組均顯示所計(jì)算統(tǒng)計(jì)量的名稱(chēng);exclude case
with
missing
valueslistwise:用于選擇是否在分析中刪除帶有缺失值的變量。missingstatisticsappearas:用于輸出一個(gè)字符串,用于在輸出結(jié)果中表示缺失值。1.對(duì)居民儲(chǔ)蓄調(diào)查數(shù)據(jù)中的居民存款金額按照戶(hù)口和職業(yè)進(jìn)行分類(lèi)匯總得到均值、中位數(shù)及標(biāo)準(zhǔn)差。分析:可以使用split
file過(guò)程,然后使用
descriptive過(guò)程來(lái)完成。但是我們用這里的
case
summary過(guò)程一步就能完成。(
Basic
tables過(guò)程)Basictables過(guò)程可對(duì)定類(lèi)資料或定量資料進(jìn)行各種復(fù)雜格式的描述。菜單操作:Analyze-
tables
-
Basic
tablessummaries框:選擇需要進(jìn)行匯總的變量,可以是定類(lèi)變量也可以是定距變量,可以選入多個(gè),但所有變量只能使用同樣的匯總指標(biāo)。subgroups框:用于定義分組匯總時(shí)的分組情況。(
Basic
tables過(guò)程)down框:選入分行匯總變量;表格中的匯總指標(biāo)按照該變量的不同取值分行輸出,可以選入多個(gè)。
across框:選入分列匯總變量;separate
table框:選入分層匯總變量;allcombination:默認(rèn)選項(xiàng),所有分組變量按照選入順序依次嵌套;eachseparately:所有分組變量分別輸出分組統(tǒng)計(jì)結(jié)果,只是放在同一個(gè)表格中。(
Basic
tables過(guò)程)statistics子對(duì)話框:percentilecutpoint框:選中percentile統(tǒng)計(jì)量時(shí)可用,用于選擇分界百分位點(diǎn)。format框:用于設(shè)置各種統(tǒng)計(jì)量的顯示格式。label框:用于設(shè)定各種統(tǒng)計(jì)量的顯示標(biāo)簽,默認(rèn)為統(tǒng)計(jì)量名稱(chēng),可以更改為中文。sortingbycellcount框:選擇是否按照表中的頻數(shù)順序輸出。(
Basic
tables過(guò)程)layout子對(duì)話框:用于設(shè)定各種標(biāo)題/標(biāo)簽的顯示方式。
summaryvariablelables框:用于選擇匯總變量標(biāo)簽的顯示方式,可以在左側(cè)、頂部和分不同表格輸出中選擇。statistics
lables框:用于選擇統(tǒng)計(jì)量標(biāo)簽的顯示方式。group
in
summary
variable
dimension框:如果在前面將匯總變量和分組變量選在了同一方向顯示,則可在此處選擇是將匯總變量是與各亞組之下還是將分則變量值與匯總變量之下。lable
groups
with
value
lables
only框:如果選中該框,則各分組的變量名標(biāo)簽將被省略,他們將用數(shù)值標(biāo)簽或數(shù)值本身來(lái)表示。(
Basic
tables過(guò)程)totals子對(duì)話框:選擇是否進(jìn)行匯總以及設(shè)定匯總標(biāo)簽。totals
over
each
group
variable框:要求給出每一分組的匯總結(jié)果,缺失值將不納入?yún)R總分析??稍谙路降膌able框中更改分組匯總標(biāo)簽。table-margintotals框:為表格的每一個(gè)維度生成匯總結(jié)果,缺失值將不納入?yún)R總分析。format子對(duì)話框:(
Basic
tables過(guò)程)format子對(duì)話框:emptycellappearance框:選擇無(wú)頻數(shù)單元格的表示方式,默認(rèn)為空,可改為用零表示。missingstatisticsappearas框:選擇對(duì)缺失值的表示方式,默認(rèn)為小數(shù)點(diǎn),可更改為十個(gè)字符長(zhǎng)度內(nèi)的任意字符串。(
Basic
tables過(guò)程)例如:將收入情況和未來(lái)收入情況按照戶(hù)口和職業(yè)進(jìn)行頻數(shù)統(tǒng)計(jì)。(general
tables過(guò)程)Basictables過(guò)程已經(jīng)為我們提供了非常強(qiáng)大的制表能力但它只能分別對(duì)定量資料或分類(lèi)資料進(jìn)行匯總而且對(duì)于多選題數(shù)據(jù)無(wú)能為力,
general
tables則可以解決以上問(wèn)題。菜單操作:Analyze-
tables
-
generaltablesstatisticslablesappear:選擇統(tǒng)計(jì)量標(biāo)簽的顯示方式。(
general
tables
過(guò)程)acrossthetop:每個(gè)統(tǒng)計(jì)量單獨(dú)占一列,標(biāo)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年南寧貨運(yùn)資格證答題竅門(mén)
- 重要會(huì)議紀(jì)要與決策事項(xiàng)跟蹤表
- 事務(wù)管理工作流程規(guī)定手冊(cè)
- 礦泉水中微量元素添加規(guī)則
- 2025年福建年貨運(yùn)從業(yè)資格證考試新規(guī)
- 部門(mén)年度業(yè)績(jī)分析
- 2025年安徽汽車(chē)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性考試題庫(kù)及答案一套
- 2025年昆明貨運(yùn)從業(yè)資格證模擬考試題庫(kù)及答案詳解
- 鄉(xiāng)村環(huán)境衛(wèi)生管理方案
- 船舶修造知識(shí)培訓(xùn)課件
- 2025年黑龍江生態(tài)工程職業(yè)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)1套
- 白介素6臨床意義
- 2025年充電樁場(chǎng)地租賃合同官方版模板
- DeepSeek的應(yīng)用與部署
- 《彰化縣樂(lè)樂(lè)棒球》課件
- 2025-2030年墻體裂縫檢測(cè)與修復(fù)機(jī)器人行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢(xún)報(bào)告
- JIT標(biāo)準(zhǔn)作業(yè)作業(yè)指導(dǎo)書(shū)
- 安徽省2020-2021學(xué)年七年級(jí)語(yǔ)文下學(xué)期期末測(cè)試卷[含答案]
- 人教版三年級(jí)數(shù)學(xué)下冊(cè)各單元教材分析(全冊(cè)共九個(gè)單元)
- 公司駕駛員承諾書(shū)
- 中國(guó)石油電子招標(biāo)投標(biāo)交易平臺(tái)投標(biāo)保證金操作指南V1.0
評(píng)論
0/150
提交評(píng)論