統(tǒng)計數(shù)據(jù)的來源、收集與整理課件_第1頁
統(tǒng)計數(shù)據(jù)的來源、收集與整理課件_第2頁
統(tǒng)計數(shù)據(jù)的來源、收集與整理課件_第3頁
統(tǒng)計數(shù)據(jù)的來源、收集與整理課件_第4頁
統(tǒng)計數(shù)據(jù)的來源、收集與整理課件_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

本資料來源本資料來源多元統(tǒng)計分析及SPSS應用天津大學rzhao@/~zhaoRuiqingZhao

趙瑞清

TianjinUniversity天津大學rzhao@.RuiqingZh

rzhao@.session3

聚類分析

應用多元統(tǒng)計分析及SPSS應用

Session3

統(tǒng)計數(shù)據(jù)的收集、整理與描述

rzhao@.SessionTopics統(tǒng)計數(shù)據(jù)的來源

統(tǒng)計數(shù)據(jù)的收集

統(tǒng)計數(shù)據(jù)的描述

統(tǒng)計數(shù)據(jù)的整理

SessionTopics統(tǒng)計數(shù)據(jù)的來源統(tǒng)計數(shù)據(jù)的收集統(tǒng)計統(tǒng)計數(shù)據(jù)的來源一、統(tǒng)計數(shù)據(jù)的直接來源來源于管理和研究需要而專門組織的調查來源于科學試驗的數(shù)據(jù)二、統(tǒng)計數(shù)據(jù)的間接來源

來源于公開出版物的數(shù)據(jù)來源于內部調查的數(shù)據(jù)統(tǒng)計數(shù)據(jù)的來源一、統(tǒng)計數(shù)據(jù)的直接來源來源于管理和研究需要而專

統(tǒng)計數(shù)據(jù)的收集數(shù)據(jù)的搜集方法詢問調查訪問調查觀察實驗電話調查郵寄調查觀察電腦輔助座談會個別深訪實驗統(tǒng)計數(shù)據(jù)的收集數(shù)據(jù)的搜集方法詢問調查訪問調查觀察實驗電話調訪問調查

1. 調查者與被調查者通過面對面地交談而獲得資料2. 有標準式訪問和非標準式訪問標準式訪問通常按事先設計好的問卷進行非標準式訪問事先一般不制作問卷訪問調查

1. 調查者與被調查者通過面對面地交談而獲得資料郵寄調查也稱郵寄問卷調查是一種標準化調查調查者與被調查者沒有直接的語言交流,信息的傳遞依賴于問卷通過某種方式將調查表或問卷送至某調查者手中,由被調查者填寫,然后將問卷寄回指定收集點問卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專門場所分發(fā)三種

郵寄調查也稱郵寄問卷調查電話調查調查者利用電話與被調查者進行語言交流以獲得信息時效快、成本低問題的數(shù)量不宜過多

您好!我是××調查公司的調查員…電話調查調查者利用電話與被調查者進行語言交流以獲得信息您好!電腦輔助調查又稱電腦輔助電話調查電腦與電話相結合完成調查的全過程一般需借助專門的軟件進行硬件設備要求較高

電腦輔助調查又稱電腦輔助電話調查座談會1. 也稱集體訪談2. 將一組被調查者集中在調查現(xiàn)場,讓他們對調查的主題發(fā)表意見以獲得資料3. 參加座談會的人數(shù)不宜過多,一般為6~10人4. 側重于定性研究座談會1. 也稱集體訪談個別深度訪問

一次只有一名受訪者參加、針對特殊問題的調查適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題側重于定性研究個別深度訪問

一次只有一名受訪者參加、針對特殊問題的調查觀察法1. 就調查對象的行動和意識,調查人員邊觀察邊記錄以收集所需信息

2. 調查人員不是強行介入

3. 能夠在被調查者不察覺的情況下獲得資料觀察法1. 就調查對象的行動和意識,調查人員邊觀察邊記實驗法

1. 在設定的特殊實驗場所、特殊狀態(tài)下,對調查對象進行實驗以獲得所需資料2. 有室內實驗法和市場實驗法實驗法

1. 在設定的特殊實驗場所、特殊狀態(tài)下,對調查對象進統(tǒng)計數(shù)據(jù)的間接來源1.公開出版物:《中國統(tǒng)計年鑒》、《中國統(tǒng)計摘要》、《中國社會統(tǒng)計年鑒》、《中國工業(yè)經(jīng)濟統(tǒng)計年鑒》、《中國農(nóng)村統(tǒng)計年鑒》、《中國人口統(tǒng)計年鑒》、《中國市場統(tǒng)計年鑒》、《世界經(jīng)濟年鑒》、《國外經(jīng)濟統(tǒng)計資料》、《世界發(fā)展報告》……Internet

2.

網(wǎng)絡中國統(tǒng)計年鑒2001中國人口統(tǒng)計年鑒中國市場統(tǒng)計年鑒世界發(fā)展報告世界經(jīng)濟年檢工業(yè)普查數(shù)據(jù)中國統(tǒng)計出版社統(tǒng)計數(shù)據(jù)的間接來源1.公開出版物:《中國統(tǒng)計數(shù)據(jù)的整理一、統(tǒng)計分組

根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內在特點,按某個標(或幾個標志)把被研究的總體劃分為若干個不同性質的組,稱為統(tǒng)計分組。

例:某班學生按考試成績分組統(tǒng)計數(shù)據(jù)的整理一、統(tǒng)計分組根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象二、頻數(shù)分布與頻率分布將數(shù)據(jù)按其分組標志進行分組的過程,就是頻數(shù)分布和頻率分布形成的過程。表示各組的單位的次數(shù)稱為頻數(shù),各組次數(shù)與總次數(shù)之比稱為頻率。二、頻數(shù)分布與頻率分布將數(shù)據(jù)按其分組標志進行分組的過程,就是二、頻數(shù)分布與頻率分布頻數(shù)分布就是觀察值按其分組標志分配在各組內的次數(shù),由分組標志序列和各組相對應的分布次數(shù)兩個要素構成。由分組標志序列和各組相應的頻率構成頻率分布。二、頻數(shù)分布與頻率分布頻數(shù)分布就是觀察值按其分組標志分配在各

當所觀察的次數(shù)很多,組距很小并且組數(shù)很多時,所繪出的折線圖就會越來越光滑,逐漸形成一條光滑的曲線,這種曲線即頻數(shù)分布曲線,反映了數(shù)據(jù)的分布規(guī)律。當所觀察的次數(shù)很多,組距很小并且組數(shù)很多時,所繪出的折線圖三、累積頻數(shù)分布與頻率分布

為了統(tǒng)計分析的需要,有時要觀察某一數(shù)值以上或某一數(shù)值以下頻數(shù)或頻率之和,這就需要繪出累積頻數(shù)或累計頻率。在SPSS中對下數(shù)據(jù)進行頻數(shù)(率)分析三、累積頻數(shù)分布與頻率分布為了統(tǒng)計分析的需要,有時要1.定義工人編號和加工零件數(shù)的變量名分別為NO和X,然后輸入變量NO和X的原始數(shù)據(jù)。1.定義工人編號和加工零件數(shù)的變量名分別為NO和X,然后輸2.選擇[Analyze]=>[DescriptiveStatistics]=>[Frequencies...],彈出[Frequencies]主對話框。2.選擇[Analyze]=>[DescriptiveSt

現(xiàn)欲X進行頻數(shù)分析,在對話框左側的變量列表中選X,單擊按鈕使之進入[Variable(s)]列表框,并選擇[DisplayFrequencyTables]顯示頻數(shù)分布表。現(xiàn)欲X進行頻數(shù)分析,在對話框左側的變量列表中選X,3.可單擊[Format...]按鈕彈出[Frequencies:Format]子對話框

根據(jù)數(shù)值大小按升序從小到大作頻數(shù)分布數(shù)值大小按降序從大到小作頻數(shù)分布頻數(shù)多少按升序從少到多作頻數(shù)分布頻數(shù)多少按降序從多到少作頻數(shù)分布3.可單擊[Format...]按鈕彈出[Frequenci4.可單擊[Statistics...]按鈕,彈出[Frequencies:Statistics]子對話框,并單擊相應項目,在作頻數(shù)表分析的基礎上,附帶作各種統(tǒng)計指標的描述,特別是可進行任何水平的百分位數(shù)計算。這里不選。5.可單擊[Charts...]鈕,彈出[Frequencies:Charts]子對話框,4.可單擊[Statistics...]按鈕,彈出[Freq

用戶可選三種圖形:直條圖(Barchart)、餅圖(PieCharts)和直方圖(Histogram)。這里選擇[Histogram]項,并選擇[WithNormalCurve]要求繪制正態(tài)曲線。單擊[Continue]按鈕返回[Frequencies]主對話框,再單擊[OK]鈕即可得到(累計)頻數(shù)(頻率)分布表和直方圖。用戶可選三種圖形:直條圖(Barchart)、餅圖輸出結果頻數(shù)(率)分布表輸出結果頻數(shù)(率)分布表加工零件數(shù)加工零件數(shù)應該注意的是,SPSS在未特別指定的情形下,直方圖或頻數(shù)分布表是按照原始數(shù)值逐一作頻數(shù)分布的,這與日常需要的等距分組、且組數(shù)保持在一定數(shù)目的要求不符。在調用[Frequencies]統(tǒng)計過程命令之前,可先對原始數(shù)據(jù)進行預處:已知最小值為84,最大值為128,全距為10,故可要求分成5組,起點為80,組距為10。選擇[Transform]=>[Recode]=>[IntoDifferentVariable...],在彈出的[RecodeIntoDifferentVariable]對話框中選定X,單擊按鈕使之進入[NumericVariable→OutputVariable]列表框,在[OutputVariable]欄的[Name]文本框中輸入x1,單擊[Change]按鈕表示新生成的變量名為x1。單擊[OldandNewValues]按鈕彈出[RecodeIntoDifferentVariable:OldandNewValues]子對話框,在[OldValue]選項中單擊[Range]項,輸入第一個分組的數(shù)值范圍:80~89,在[Newvalue]欄內輸入新值:80,單擊[Add]按鈕.

依此將各組的范圍及對應的新值逐一輸入,最后單擊[Continue]按鈕返回,再單擊[OK]按鈕即完成。系統(tǒng)在原數(shù)據(jù)庫中生成一新變量為x1,這時再調用[Frequencies]統(tǒng)計過程將輸出等距分組且組數(shù)為5的頻數(shù)分布表。應該注意的是,SPSS在未特別指定的情形下,直方圖或頻數(shù)分統(tǒng)計數(shù)據(jù)的描述

作為統(tǒng)計數(shù)據(jù)的代表值,一個是分布的中心,反映分布的集中趨勢,另一個是分布的形狀,反映分布的離散程度。這些代表性的數(shù)量特征值精確地描述出不同的統(tǒng)計數(shù)據(jù)分布。一、分布的中心眾數(shù)(mode)

在正態(tài)分布和一般的偏態(tài)分布中,分布曲線最高點所對應的數(shù)值即是眾數(shù)。如果沒有明顯的最高點,眾數(shù)可以不存在。當然,如果有兩個最高點,也可以有兩個眾數(shù)。統(tǒng)計數(shù)據(jù)的描述作為統(tǒng)計數(shù)據(jù)的代表值,一個是分布的中心,中位數(shù)(median)與分位數(shù)中位數(shù)是數(shù)據(jù)排序后,位置在最中間的數(shù)值。

與中位數(shù)相似的還有四分位數(shù)(quartiles)、十分位數(shù)(decile)和百分位數(shù)(percentile)。中位數(shù)是將統(tǒng)計分布從中間分成相等的兩部分,而四分位數(shù)就是將數(shù)據(jù)分布四等分的三個數(shù)值,其中中間的四分位數(shù)就是中位數(shù)。十分位數(shù)和百分位數(shù)分別是將數(shù)據(jù)分布十等分和一百等分的數(shù)值。平均數(shù)(均值)(mean)平均數(shù)是數(shù)據(jù)集中趨勢的最主要測度值中位數(shù)(median)與分位數(shù)中位數(shù)是數(shù)據(jù)排序后,位置在最中三個中心度量的比較三個中心度量的比較二、分布的形狀

用于描述數(shù)據(jù)分布形狀即分布關于其中心的波動程度的代表值有:極差、內距、方差和標準等,它們描述了分布的離散程度和差異程度。(一)極差(range)

極差也稱為全距,是最大值與最小值之間的距離,它是數(shù)據(jù)離散或差異程度的最簡單測度值,即例如,在前面的數(shù)據(jù)中,極差為128-84=44(件)。顯然,數(shù)據(jù)的離散程度大,極差就越大。極差雖然很容易計算,但它只告訴我們數(shù)據(jù)分布范圍,至于分布的中間部分是如何變化的則不得而知。而且它受極端值的影響可能是很大的。二、分布的形狀用于描述數(shù)據(jù)分布形狀即分布關于其中心的(二)內距(Inter-QuartileRange,IQR)

內距又稱為四分位差,是兩個四分位數(shù)之差,IQR=高四分位數(shù)—低四分位數(shù)。

若內距比較小,則說明數(shù)據(jù)比較集中在中位數(shù)附近;反之則比較分散。內距常和中位數(shù)一起用來描述一個定距特別是定序測量數(shù)據(jù)的分布。(三)方差(variance)和標準差(standarddeviation)方差是離差平方的平均數(shù),即或(二)內距(Inter-QuartileRange,IQ三、偏度與峰度(一)偏度(skewness)所謂偏度是指反映頻數(shù)分布偏態(tài)方向和程度的測度。在頻數(shù)分布中,最大集中點以上(頻數(shù)曲線圖橫軸上眾數(shù)的右邊)的頻數(shù)占總頻數(shù)的一半多,稱為右偏或正偏。最大集中點以下(頻數(shù)曲線圖橫軸上眾數(shù)的左邊)的頻數(shù)占總頻數(shù)的一半多,稱為左偏或負偏。偏度的計算公式為:三、偏度與峰度(一)偏度(skewness)所謂偏度是指反映(二)峰度(kurtosis)所謂峰度,是指頻數(shù)分布曲線高峰的形態(tài),即反映分布曲線的尖峭程度的測度。峰度的計算公式為

當β=0時,表示分布的峰度是正態(tài)分布的峰度;當β>0時,表示分布曲線的高峰是尖頂高峰;當β<0時,表示分布曲線的高峰是平頂高峰。(二)峰度(kurtosis)所謂峰度,是指頻數(shù)分布曲線高峰四、SPSS操作在SPSS中計算上例各種指標的步驟為:(一)定義加工零件數(shù)的變量名為X,并輸入原始數(shù)據(jù)。(二)選擇[Analyze]=>[DescriptiveStatistics]=>[Descriptives...],打開[Descriptives]主對話框。四、SPSS操作在SPSS中計算上例各種指標的步驟為:(打開[Descriptives]主對話框。在主對話框左邊列表中選定變量X,單擊按鈕使之進入[Variables(s)]列表框。打開[Descriptives]主對話框。在主對話框左邊列表(三)單擊[Options...]按鈕,打開[Descriptives:Options]子對話框。選擇均值(Mean)、總和(Sum)、標準差(Std.Deviation)、方差(Variance)、極差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),選好后單擊[Continue]按鈕返回[Descriptives]主對話框,再單擊[OK]按鈕即可得到各種統(tǒng)計量的計算結果。(三)單擊[Options...]按鈕,打開[Descrip輸出結果:

以上結果沒有給出中位數(shù)、眾數(shù)等統(tǒng)計量,可以在頻數(shù)(率)分析時增加選項計算相應的統(tǒng)計量,具體操作步驟如下:(一)定義工人編號和加工零件數(shù)的變量名分別為NO和X,然后輸入變量NO和X的原始數(shù)據(jù)。(二)選擇[Analyze]=>[DescriptiveStatistics]=>[Frequencies...],輸出結果:以上結果沒有給出中位數(shù)、眾數(shù)等統(tǒng)計量,可彈出[Frequencies]主對話框?,F(xiàn)欲X進行頻數(shù)分析,在對話框左側的變量列表中選X,單擊按鈕使之進入[Variable(s)]列表框,并選擇[DisplayFrequencyTables]顯示頻數(shù)分布表。彈出[Frequencies]主對話框?,F(xiàn)欲X進行頻數(shù)分析(三)單擊[Statistics...]按鈕,彈出[Frequencies:Statistics]子對話框,并單擊相應項目。本例中選擇均值(Mean)、中位數(shù)(Median)、眾數(shù)(Mode)、總和(Sum)、標準差(Std.Deviation)、方差(Variance)、極差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),選好后單擊[Continue]按鈕返回[Frequencies]主對話框,再單擊[OK]按鈕即可得到各種統(tǒng)計量的計算結果。(三)單擊[Statistics...]按鈕,彈出[Freq輸出結果:輸出結果:統(tǒng)計數(shù)據(jù)的來源、收集與整理本資料來源本資料來源多元統(tǒng)計分析及SPSS應用天津大學rzhao@/~zhaoRuiqingZhao

趙瑞清

TianjinUniversity天津大學rzhao@.RuiqingZh

rzhao@.session3

聚類分析

應用多元統(tǒng)計分析及SPSS應用

Session3

統(tǒng)計數(shù)據(jù)的收集、整理與描述

rzhao@.SessionTopics統(tǒng)計數(shù)據(jù)的來源

統(tǒng)計數(shù)據(jù)的收集

統(tǒng)計數(shù)據(jù)的描述

統(tǒng)計數(shù)據(jù)的整理

SessionTopics統(tǒng)計數(shù)據(jù)的來源統(tǒng)計數(shù)據(jù)的收集統(tǒng)計統(tǒng)計數(shù)據(jù)的來源一、統(tǒng)計數(shù)據(jù)的直接來源來源于管理和研究需要而專門組織的調查來源于科學試驗的數(shù)據(jù)二、統(tǒng)計數(shù)據(jù)的間接來源

來源于公開出版物的數(shù)據(jù)來源于內部調查的數(shù)據(jù)統(tǒng)計數(shù)據(jù)的來源一、統(tǒng)計數(shù)據(jù)的直接來源來源于管理和研究需要而專

統(tǒng)計數(shù)據(jù)的收集數(shù)據(jù)的搜集方法詢問調查訪問調查觀察實驗電話調查郵寄調查觀察電腦輔助座談會個別深訪實驗統(tǒng)計數(shù)據(jù)的收集數(shù)據(jù)的搜集方法詢問調查訪問調查觀察實驗電話調訪問調查

1. 調查者與被調查者通過面對面地交談而獲得資料2. 有標準式訪問和非標準式訪問標準式訪問通常按事先設計好的問卷進行非標準式訪問事先一般不制作問卷訪問調查

1. 調查者與被調查者通過面對面地交談而獲得資料郵寄調查也稱郵寄問卷調查是一種標準化調查調查者與被調查者沒有直接的語言交流,信息的傳遞依賴于問卷通過某種方式將調查表或問卷送至某調查者手中,由被調查者填寫,然后將問卷寄回指定收集點問卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專門場所分發(fā)三種

郵寄調查也稱郵寄問卷調查電話調查調查者利用電話與被調查者進行語言交流以獲得信息時效快、成本低問題的數(shù)量不宜過多

您好!我是××調查公司的調查員…電話調查調查者利用電話與被調查者進行語言交流以獲得信息您好!電腦輔助調查又稱電腦輔助電話調查電腦與電話相結合完成調查的全過程一般需借助專門的軟件進行硬件設備要求較高

電腦輔助調查又稱電腦輔助電話調查座談會1. 也稱集體訪談2. 將一組被調查者集中在調查現(xiàn)場,讓他們對調查的主題發(fā)表意見以獲得資料3. 參加座談會的人數(shù)不宜過多,一般為6~10人4. 側重于定性研究座談會1. 也稱集體訪談個別深度訪問

一次只有一名受訪者參加、針對特殊問題的調查適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題側重于定性研究個別深度訪問

一次只有一名受訪者參加、針對特殊問題的調查觀察法1. 就調查對象的行動和意識,調查人員邊觀察邊記錄以收集所需信息

2. 調查人員不是強行介入

3. 能夠在被調查者不察覺的情況下獲得資料觀察法1. 就調查對象的行動和意識,調查人員邊觀察邊記實驗法

1. 在設定的特殊實驗場所、特殊狀態(tài)下,對調查對象進行實驗以獲得所需資料2. 有室內實驗法和市場實驗法實驗法

1. 在設定的特殊實驗場所、特殊狀態(tài)下,對調查對象進統(tǒng)計數(shù)據(jù)的間接來源1.公開出版物:《中國統(tǒng)計年鑒》、《中國統(tǒng)計摘要》、《中國社會統(tǒng)計年鑒》、《中國工業(yè)經(jīng)濟統(tǒng)計年鑒》、《中國農(nóng)村統(tǒng)計年鑒》、《中國人口統(tǒng)計年鑒》、《中國市場統(tǒng)計年鑒》、《世界經(jīng)濟年鑒》、《國外經(jīng)濟統(tǒng)計資料》、《世界發(fā)展報告》……Internet

2.

網(wǎng)絡中國統(tǒng)計年鑒2001中國人口統(tǒng)計年鑒中國市場統(tǒng)計年鑒世界發(fā)展報告世界經(jīng)濟年檢工業(yè)普查數(shù)據(jù)中國統(tǒng)計出版社統(tǒng)計數(shù)據(jù)的間接來源1.公開出版物:《中國統(tǒng)計數(shù)據(jù)的整理一、統(tǒng)計分組

根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內在特點,按某個標(或幾個標志)把被研究的總體劃分為若干個不同性質的組,稱為統(tǒng)計分組。

例:某班學生按考試成績分組統(tǒng)計數(shù)據(jù)的整理一、統(tǒng)計分組根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象二、頻數(shù)分布與頻率分布將數(shù)據(jù)按其分組標志進行分組的過程,就是頻數(shù)分布和頻率分布形成的過程。表示各組的單位的次數(shù)稱為頻數(shù),各組次數(shù)與總次數(shù)之比稱為頻率。二、頻數(shù)分布與頻率分布將數(shù)據(jù)按其分組標志進行分組的過程,就是二、頻數(shù)分布與頻率分布頻數(shù)分布就是觀察值按其分組標志分配在各組內的次數(shù),由分組標志序列和各組相對應的分布次數(shù)兩個要素構成。由分組標志序列和各組相應的頻率構成頻率分布。二、頻數(shù)分布與頻率分布頻數(shù)分布就是觀察值按其分組標志分配在各

當所觀察的次數(shù)很多,組距很小并且組數(shù)很多時,所繪出的折線圖就會越來越光滑,逐漸形成一條光滑的曲線,這種曲線即頻數(shù)分布曲線,反映了數(shù)據(jù)的分布規(guī)律。當所觀察的次數(shù)很多,組距很小并且組數(shù)很多時,所繪出的折線圖三、累積頻數(shù)分布與頻率分布

為了統(tǒng)計分析的需要,有時要觀察某一數(shù)值以上或某一數(shù)值以下頻數(shù)或頻率之和,這就需要繪出累積頻數(shù)或累計頻率。在SPSS中對下數(shù)據(jù)進行頻數(shù)(率)分析三、累積頻數(shù)分布與頻率分布為了統(tǒng)計分析的需要,有時要1.定義工人編號和加工零件數(shù)的變量名分別為NO和X,然后輸入變量NO和X的原始數(shù)據(jù)。1.定義工人編號和加工零件數(shù)的變量名分別為NO和X,然后輸2.選擇[Analyze]=>[DescriptiveStatistics]=>[Frequencies...],彈出[Frequencies]主對話框。2.選擇[Analyze]=>[DescriptiveSt

現(xiàn)欲X進行頻數(shù)分析,在對話框左側的變量列表中選X,單擊按鈕使之進入[Variable(s)]列表框,并選擇[DisplayFrequencyTables]顯示頻數(shù)分布表?,F(xiàn)欲X進行頻數(shù)分析,在對話框左側的變量列表中選X,3.可單擊[Format...]按鈕彈出[Frequencies:Format]子對話框

根據(jù)數(shù)值大小按升序從小到大作頻數(shù)分布數(shù)值大小按降序從大到小作頻數(shù)分布頻數(shù)多少按升序從少到多作頻數(shù)分布頻數(shù)多少按降序從多到少作頻數(shù)分布3.可單擊[Format...]按鈕彈出[Frequenci4.可單擊[Statistics...]按鈕,彈出[Frequencies:Statistics]子對話框,并單擊相應項目,在作頻數(shù)表分析的基礎上,附帶作各種統(tǒng)計指標的描述,特別是可進行任何水平的百分位數(shù)計算。這里不選。5.可單擊[Charts...]鈕,彈出[Frequencies:Charts]子對話框,4.可單擊[Statistics...]按鈕,彈出[Freq

用戶可選三種圖形:直條圖(Barchart)、餅圖(PieCharts)和直方圖(Histogram)。這里選擇[Histogram]項,并選擇[WithNormalCurve]要求繪制正態(tài)曲線。單擊[Continue]按鈕返回[Frequencies]主對話框,再單擊[OK]鈕即可得到(累計)頻數(shù)(頻率)分布表和直方圖。用戶可選三種圖形:直條圖(Barchart)、餅圖輸出結果頻數(shù)(率)分布表輸出結果頻數(shù)(率)分布表加工零件數(shù)加工零件數(shù)應該注意的是,SPSS在未特別指定的情形下,直方圖或頻數(shù)分布表是按照原始數(shù)值逐一作頻數(shù)分布的,這與日常需要的等距分組、且組數(shù)保持在一定數(shù)目的要求不符。在調用[Frequencies]統(tǒng)計過程命令之前,可先對原始數(shù)據(jù)進行預處:已知最小值為84,最大值為128,全距為10,故可要求分成5組,起點為80,組距為10。選擇[Transform]=>[Recode]=>[IntoDifferentVariable...],在彈出的[RecodeIntoDifferentVariable]對話框中選定X,單擊按鈕使之進入[NumericVariable→OutputVariable]列表框,在[OutputVariable]欄的[Name]文本框中輸入x1,單擊[Change]按鈕表示新生成的變量名為x1。單擊[OldandNewValues]按鈕彈出[RecodeIntoDifferentVariable:OldandNewValues]子對話框,在[OldValue]選項中單擊[Range]項,輸入第一個分組的數(shù)值范圍:80~89,在[Newvalue]欄內輸入新值:80,單擊[Add]按鈕.

依此將各組的范圍及對應的新值逐一輸入,最后單擊[Continue]按鈕返回,再單擊[OK]按鈕即完成。系統(tǒng)在原數(shù)據(jù)庫中生成一新變量為x1,這時再調用[Frequencies]統(tǒng)計過程將輸出等距分組且組數(shù)為5的頻數(shù)分布表。應該注意的是,SPSS在未特別指定的情形下,直方圖或頻數(shù)分統(tǒng)計數(shù)據(jù)的描述

作為統(tǒng)計數(shù)據(jù)的代表值,一個是分布的中心,反映分布的集中趨勢,另一個是分布的形狀,反映分布的離散程度。這些代表性的數(shù)量特征值精確地描述出不同的統(tǒng)計數(shù)據(jù)分布。一、分布的中心眾數(shù)(mode)

在正態(tài)分布和一般的偏態(tài)分布中,分布曲線最高點所對應的數(shù)值即是眾數(shù)。如果沒有明顯的最高點,眾數(shù)可以不存在。當然,如果有兩個最高點,也可以有兩個眾數(shù)。統(tǒng)計數(shù)據(jù)的描述作為統(tǒng)計數(shù)據(jù)的代表值,一個是分布的中心,中位數(shù)(median)與分位數(shù)中位數(shù)是數(shù)據(jù)排序后,位置在最中間的數(shù)值。

與中位數(shù)相似的還有四分位數(shù)(quartiles)、十分位數(shù)(decile)和百分位數(shù)(percentile)。中位數(shù)是將統(tǒng)計分布從中間分成相等的兩部分,而四分位數(shù)就是將數(shù)據(jù)分布四等分的三個數(shù)值,其中中間的四分位數(shù)就是中位數(shù)。十分位數(shù)和百分位數(shù)分別是將數(shù)據(jù)分布十等分和一百等分的數(shù)值。平均數(shù)(均值)(mean)平均數(shù)是數(shù)據(jù)集中趨勢的最主要測度值中位數(shù)(median)與分位數(shù)中位數(shù)是數(shù)據(jù)排序后,位置在最中三個中心度量的比較三個中心度量的比較二、分布的形狀

用于描述數(shù)據(jù)分布形狀即分布關于其中心的波動程度的代表值有:極差、內距、方差和標準等,它們描述了分布的離散程度和差異程度。(一)極差(range)

極差也稱為全距,是最大值與最小值之間的距離,它是數(shù)據(jù)離散或差異程度的最簡單測度值,即例如,在前面的數(shù)據(jù)中,極差為128-84=44(件)。顯然,數(shù)據(jù)的離散程度大,極差就越大。極差雖然很容易計算,但它只告訴我們數(shù)據(jù)分布范圍,至于分布的中間部分是如何變化的則不得而知。而且它受極端值的影響可能是很大的。二、分布的形狀用于描述數(shù)據(jù)分布形狀即分布關于其中心的(二)內距(Inter-QuartileRange,IQR)

內距又稱為四分位差,是兩個四分位數(shù)之差,IQR=高四分位數(shù)—低四分位數(shù)。

若內距比較小,則說明數(shù)據(jù)比較集中在中位數(shù)附近;反之則比較分散。內距常和中位數(shù)一起用來描述一個定距特別是定序測量數(shù)據(jù)的分布。(三)方差(variance)和標準差(standarddeviation)方差是離差平方的平均數(shù),即或(二)內距(Inter-QuartileRange,IQ三、偏度與峰度(一)偏度(skewness)所謂偏度是指反映頻數(shù)分布偏態(tài)方向和程度的測度。在頻數(shù)分布中,最大集中點以上(頻數(shù)曲線圖橫軸上眾數(shù)的右邊)的頻數(shù)占總頻數(shù)的一半多,稱為右偏或正偏。最大集中點以下(頻數(shù)曲線圖橫軸上眾數(shù)的左邊)的頻數(shù)占總頻數(shù)的一半多,稱為左偏或負偏。偏度的計算公式為:三、偏度與峰度(一)偏度(skewness)所謂偏度是指反映(二)峰度(kurtosis)所謂峰度,是指頻數(shù)分布曲線高峰的形態(tài),即反映分布曲線的尖峭程度的測度。峰度的計算公式為

當β=0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論