spss第四章描述統(tǒng)計簡介_第1頁
spss第四章描述統(tǒng)計簡介_第2頁
spss第四章描述統(tǒng)計簡介_第3頁
spss第四章描述統(tǒng)計簡介_第4頁
spss第四章描述統(tǒng)計簡介_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2023/2/51

第四章描述統(tǒng)計量簡介2023/2/52第四章樣本統(tǒng)計量描述

一、樣本數(shù)據(jù)位置特征的統(tǒng)計量二、樣本分布特征的統(tǒng)計量三、樣本數(shù)據(jù)離散程度特征的統(tǒng)計量調(diào)查杭州市居民收入情況,得到100個樣本數(shù)據(jù),根據(jù)這些數(shù)據(jù),你最想得到哪些信息?統(tǒng)計量:用來描述樣本特征的概括性數(shù)字度量調(diào)查顧客對產(chǎn)品的滿意度情況,獲得100個樣本數(shù)據(jù),能分析出哪些信息?調(diào)查大學(xué)生群體中對手機(jī)品牌的偏好程度,你如何描述調(diào)查結(jié)果?2023/2/53一、樣本數(shù)據(jù)的位置特征

——對數(shù)據(jù)中心的描述

樣本眾數(shù)(SampleMode)——分類數(shù)據(jù)

樣本中位數(shù)(samplemedian)——定序數(shù)據(jù)

樣本均值(Samplemean)——定比數(shù)據(jù)2023/2/54(一)分類數(shù)據(jù)集中趨勢度量——眾數(shù)樣本眾數(shù)定義1:樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的那個樣本值為眾數(shù)。

眾數(shù)單一眾數(shù)復(fù)眾數(shù)2023/2/55眾數(shù)的計算

可以簡單地從頻次統(tǒng)計表中查出(頻次最大的樣本值就是該樣本數(shù)據(jù)集合的眾數(shù))。也可以從條形圖上看出(最高豎條所代表的樣本值就是該樣本數(shù)據(jù)集合的眾數(shù))。如:一次調(diào)查結(jié)果顯示,大學(xué)生對垃圾分類行為的認(rèn)識狀況如下:沒必要,沒必要,沒必要,有必要,有必要,有必要,有必要,有必要,有必要,無所謂2023/2/562023/2/57樣本眾數(shù)定義2

對于刻度級的樣本數(shù)據(jù)集合,在對數(shù)據(jù)等區(qū)間分組的直方圖中,最高的矩形所表示的數(shù)據(jù)區(qū)間,稱為該數(shù)據(jù)集合的眾數(shù)區(qū)間,簡稱眾數(shù)。眾數(shù)區(qū)間也有單一眾數(shù)與復(fù)眾數(shù)之分。如:10個樣本收入情況如下:2000,2200,2300,2400,3000,3400,3400,4000,4500,4500。

2023/2/582023/2/59頻次與頻率:描述樣本數(shù)據(jù)結(jié)構(gòu)的基本特征一、頻次與頻率的基本概念1.頻次(Frequency):在有限的樣本數(shù)據(jù)集合中,同樣的數(shù)據(jù)值出現(xiàn)的次數(shù)。2.頻率(PercentageorRelativeFrequency):如果樣本容量為n,那么,某個樣本值出現(xiàn)的頻率=該樣本值出現(xiàn)的頻次/n2023/2/510分類數(shù)據(jù)或順序數(shù)據(jù)描述頻次與頻率的圖形方法餅圖(PieChart)#條形圖#2023/2/5112023/2/512圖3.1.5調(diào)查中不同受教育程度出現(xiàn)的頻率2023/2/513樣本數(shù)據(jù)集合的基本特征的延伸:累積頻率(CumulativePercentage)

累積頻率的概念與表格表示:

設(shè)X1<X2<…<Xm,

m≤n,n是樣本數(shù)據(jù)集合中的樣本值的總個數(shù)。若把樣本值小于等于某個樣本數(shù)據(jù)Xi的頻率都累加起來,就得到“小于等于Xi”的累積頻率。

2023/2/514

累積頻率(CumulativePercentage)的計算

以例3.1.1為分析對象,按照上述原則,可以計算出小于等于各個Xi的累積頻率,見表3.1.8表3.1.8某品牌牙膏價格≤Xi的累積頻率

價格9.939.959.969.979.989.991010.0110.0210.0310.0410.0510.06頻次1112344423221頻率3.333.333.336.671013.3313.3313.336.67106.676.673.33累積頻率3.336.671016.6726.674053.3366.6773.3383.339096.67100注意:只有順序級以上的樣本數(shù)據(jù)才存在累積頻率的問題名義級樣本數(shù)據(jù)不存在累計頻率的問題2023/2/5152023/2/5162023/2/517頻數(shù)分析過程的spss操作(1)建立或打開一個數(shù)據(jù)文件,執(zhí)行Analyze—Descriptive—Statistics—Frequencies。打開Frequencies對話框頻數(shù)定類分析2023/2/518頻數(shù)分析過程(2)確定輸出選擇項單擊Statistics按鈕,打開統(tǒng)計量選擇對話框選擇PercentileValues欄中的選項,輸出所選變量的百分值Dispersion(離差)欄,用于指定輸出反映變量離散程度的統(tǒng)計量CentralTendency(集中趨勢)欄,用于指定輸出反映變量集中趨勢的統(tǒng)計量Distribution(分布特征)欄,用于指定輸出描述分布形狀和特征的統(tǒng)計量2023/2/519頻數(shù)分析過程(3)單擊chart按鈕。打開統(tǒng)計圖對話框,對圖形類型進(jìn)行設(shè)置。(4)單擊Format按鈕,打開格式對話框Orderby排序組欄,用于指定頻數(shù)表中變量的排序2023/2/520頻數(shù)實習(xí)1:打開數(shù)據(jù)文件:“規(guī)劃調(diào)查資料.sav”統(tǒng)計調(diào)查對象的基本信息,完成下表:基本信息頻數(shù)頻率性別男性女性地區(qū)農(nóng)村省會城市中小城市縣鎮(zhèn)所在年級大一大二大三大四2023/2/521頻率分析實習(xí)2一家電腦公司為了對比不同品牌的電腦在一季度和二季度的銷售情況,搜集到下列數(shù)據(jù),試?yán)L制圖表比較不同品牌電腦的銷售情況;不同季度電腦的銷售情況。電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾5636882023/2/522頻數(shù)實習(xí)3:某行業(yè)管理局所屬40個企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)見數(shù)據(jù)文件:40企業(yè)產(chǎn)品銷售收入.sav1.如果按照規(guī)定:銷售收入在125萬元以上為先進(jìn)企業(yè),115—125萬元為良好企業(yè),105-11萬元為一般企業(yè),105萬元以下為落后企業(yè),請按先進(jìn)企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進(jìn)行分組并統(tǒng)計頻率與累積頻率。并用餅狀圖表示。2023/2/523

(二)定序數(shù)據(jù)集中趨勢度量

——中位數(shù)

定義:設(shè),對樣本數(shù)據(jù)集合中的所有數(shù)據(jù)的排序結(jié)果為X1≤X2≤…≤Xn,n為樣本容量,則上述排序的序列中,處于“正中間位置”上的數(shù)據(jù),稱為樣本中位數(shù)。當(dāng)n為奇數(shù)時:正中間位置號碼=(n+1)/2

樣本中位數(shù)=X(n+1)/2當(dāng)n為偶數(shù)時:正中間位置號碼=(n+1)/2是小數(shù),處于n/2與(n/2)+1之間。樣本中位數(shù)=(Xn/2+X(n/2)+1)/2如5位同學(xué)的學(xué)習(xí)成績:3,3,3,4,5。中間位置是第三位,中位數(shù):3。如果六位同學(xué):3,3,4,5,5,5。中間位置是3與4位中間的位置,中位數(shù)為:(4+5)/2=4.52023/2/524頻數(shù)分析主對話框中點(diǎn)擊statistics功能按鈕2023/2/525Ststistic對話框2023/2/526(三)定比數(shù)據(jù)集中趨勢度量——均值

樣本均值僅適用于刻度級的數(shù)據(jù)計算公式為:式中,xi,i=1,2,…,n,是樣本觀察值(樣本數(shù)據(jù)),所以樣本均值是一個數(shù)值。2023/2/527均值計算的spss操作Analyze主菜單下—Descriptivestatistics—Descriptive。打開Descriptive對話框定比2023/2/528點(diǎn)擊options按鈕,定義統(tǒng)計量選項2023/2/529Savestandardizedvalueasvariables選項:將標(biāo)準(zhǔn)化值作為新變量保存。標(biāo)準(zhǔn)化值給出了一組數(shù)據(jù)中各數(shù)值的相對位置,比如,如果某個數(shù)值的標(biāo)準(zhǔn)分?jǐn)?shù)為1.5,表示該數(shù)值高于平均數(shù)的1.5倍的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變該組數(shù)據(jù)分布的形狀,而是將該組數(shù)據(jù)變?yōu)槠骄鶖?shù)為0,標(biāo)準(zhǔn)差為1。2023/2/530

2023/2/5312023/2/532二、描述樣本分布特征的統(tǒng)計量

1.峰度:描述某變量所有取值分布形態(tài)陡緩程度的統(tǒng)計量。峰度為0表示其數(shù)據(jù)分布與正態(tài)分布的陡緩程度相同;峰度大于0表示比正態(tài)分布高峰要更陡峭,為尖頂峰;峰度小于0表示比正態(tài)分布的高峰要平坦,為平頂峰。2023/2/533二、描述樣本分布特征的統(tǒng)計量

2.偏度:描述某變量所有取值分布形態(tài)的對稱性的統(tǒng)計量簡稱SK。偏度為0表示其數(shù)據(jù)分布形態(tài)與正態(tài)分布偏度相同,左右對稱;偏度大于0表示正偏差數(shù)值較大,為正偏和稱右偏,有一條長尾拖在右邊;偏度小于0則相反。SK的絕對值大于1時,被稱為高度偏態(tài)分布,當(dāng)SK的絕對值大于0.5小于1時被稱為中等偏態(tài)分布。2023/2/5342023/2/5352023/2/536三樣本數(shù)據(jù)的離散特征

本部分應(yīng)掌握的主要內(nèi)容(一)對樣本數(shù)據(jù)離散特征的點(diǎn)狀描述:極值、四分點(diǎn)與百分位點(diǎn)(二)對樣本數(shù)據(jù)離散特征的區(qū)間描述:極差、四分位距與離差(三)離散狀況的統(tǒng)計描述:樣本方差2023/2/537(一)樣本數(shù)據(jù)的離散特征

離散特征點(diǎn)狀描述區(qū)間描述極值四分點(diǎn)百分位點(diǎn)極差極差四分位距離差平方和樣本離差2023/2/5381.對樣本數(shù)據(jù)的離散特征點(diǎn)狀描述

1)極大值(Maximum)與極小值(Minmum):這兩個樣本值從一定視角反映了樣本數(shù)據(jù)集合中樣本值的離散狀況。2)下四分點(diǎn)(LowerQuartile)與上四分點(diǎn)(UpperQuartile)3)上下百分位點(diǎn)(Percentile)2023/2/539下四分點(diǎn)與上四分點(diǎn)

下四分位點(diǎn):把排序后的樣本數(shù)據(jù)集合分成左右兩部分,使左面部分包含25%的樣本總個數(shù),右邊部分包含75%的樣本總個數(shù)。下四分位點(diǎn)Q1的位置=(n+1)*0.25Q12023/2/540下四分點(diǎn)與上四分點(diǎn)

上四分位點(diǎn):把排序后的樣本數(shù)據(jù)集合分成左右兩部分,使左面部分包含75%的樣本總個數(shù),右邊部分包含25%的樣本總個數(shù)。上四分位點(diǎn)Q3的位置=(n+1)*0.75Q32023/2/541下四分點(diǎn)Q1的值與上四分點(diǎn)Q3的值

當(dāng)下四分位點(diǎn)與上四分位點(diǎn)的位置為整數(shù)時,相應(yīng)整數(shù)位置上的樣本值就是Q1,Q3的值。當(dāng)下四分位點(diǎn)的位置與上四分位點(diǎn)的位置不為整數(shù)時,Q1,Q3的計算公式:Q1=Q1位置左邊的樣本值+(Q1位置右邊的樣本值-Q1位置左邊的樣本值)*0.25Q3=Q3位置左邊的樣本值+(Q3位置右邊的樣本值-Q3位置左邊的樣本值)*0.752023/2/542(二)對樣本數(shù)據(jù)離散特征的區(qū)間描述:極差、四分位距與離差

1.極差(range):極大值與極小值之差。極差受到極端值的影響,只利用了一組數(shù)據(jù)兩端的信息,不能反映出中間數(shù)據(jù)的分散情況,所以有一定的局限性。2023/2/543順序數(shù)據(jù)離散程度的度量3.四分位距(InterquartileRange):樣本數(shù)據(jù)排序后的上四分位點(diǎn)與下四分位點(diǎn)之差。四分位距反映了中間50%數(shù)據(jù)的離散程度:其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位距不受極值的影響。2023/2/544Q3Q12023/2/545數(shù)值型數(shù)據(jù)離散程度的度量4.樣本離差與離差平方和(SampleDeviationsOrSumofSquaredDeviations)2023/2/546(三)離散狀況的統(tǒng)計值描述:樣本方差

樣本方差(SampleVariance):離差平方和與n-1的比值。樣本方差的含義:通過消除樣本個數(shù)對“偏離情況”的影響,以便較為客觀地反映樣本數(shù)據(jù)對樣本均值的平均偏離情況。樣本方差s2的計算公式:2023/2/547

2023/2/548(四)分類數(shù)據(jù)離散程度的度量異眾比率:非眾數(shù)組的頻數(shù)占總頻數(shù)的比率。用來衡量眾數(shù)對一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性就越大。2023/2/549異眾比率的計算如:一次調(diào)查結(jié)果顯示,大學(xué)生對垃圾分類行為的認(rèn)識狀況如下:沒有必要,沒有必要,沒有必要,有必要,有必要,有必要,有必要,有必要,有必要,無所謂頻數(shù):沒有必要(3),有必要(6),無所謂(1)眾數(shù)=6,非眾數(shù)=4,異眾比率=4/10=40%表示“有必要”選項這一眾數(shù)對垃圾分類行為的認(rèn)識狀況的代表性中有40%無法代表。僅

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論