SPSS第四章基本統(tǒng)計分析_第1頁
SPSS第四章基本統(tǒng)計分析_第2頁
SPSS第四章基本統(tǒng)計分析_第3頁
SPSS第四章基本統(tǒng)計分析_第4頁
SPSS第四章基本統(tǒng)計分析_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章SPSS的基本統(tǒng)計分析SPSS的基本統(tǒng)計分析頻數(shù)分析-對應圖表法計算描述統(tǒng)計量-對應數(shù)值法探索性描述分析-結合交叉分組下的頻數(shù)分析多選項分析統(tǒng)計圖-對應圖形法頻數(shù)分析目的 粗略把握變量的總體分布狀況。例:對某個問題的總體看法,如新業(yè)務的使用愿望、教學效果等對某事物的客觀描述,如通話的漫游類型、大客戶的行業(yè)分布采用的方法制作頻數(shù)分布表:包括計算

頻數(shù)、累計頻數(shù)、百分比、累計百分比繪制統(tǒng)計圖形:條形圖(品質數(shù)據(jù))、餅圖、直方圖(數(shù)量數(shù)據(jù))頻數(shù)分析基本操作步驟(1)菜單選項:Analyze->DescriptiveStatistics->Frequencies(2)選擇幾個待分析的變量到variables框.(3)chart選項,選擇所需要的圖形例:班級男女生頻數(shù)分布表、成績分布表頻數(shù)分析應用舉例移動通話的漫游類型分析特點:定類數(shù)據(jù)使用頻數(shù)、百分比、總數(shù)(不可缺少的)不使用頻數(shù)表中給出的累計頻數(shù)和累計百分比移動通話時間分析、移動客戶話費分析特點:定序數(shù)據(jù)、數(shù)量數(shù)據(jù)除使用頻數(shù)、百分比、總數(shù)外,還可以充分使用累計頻數(shù)和累計百分比頻數(shù)分析數(shù)據(jù)中存在缺失值使用有效百分比(分母為有效樣本數(shù))例:學生成績得優(yōu)率、得良率Frequencies->Format頻數(shù)分布表輸出按變量值、頻數(shù)升序、降序輸出頻數(shù)分析頻數(shù)分析中的其他分析計算中位數(shù)、分位數(shù):適用于定序、定距數(shù)據(jù)數(shù)據(jù)按升序排序后,找到若干個分位點上的變量值quartiles:計算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU)

cutpointsfornequalgroups:n等份percentile:自定義百分位點計算眾數(shù):適用于定類數(shù)據(jù)(但必須是數(shù)值型)頻數(shù)分析頻數(shù)分析中的其他分析分位數(shù)的應用從一個側面比較兩組樣本數(shù)據(jù)的集中趨勢例:(QL=50,QU=80)和(QL=70,QU=75)的比較在排除極端值影響的條件下,通過計算分位數(shù)差,比較兩組樣本數(shù)據(jù)的離散程度例:(QL=50,QU=80)和(QL=70,QU=75)的比較分位數(shù)、中位數(shù)、眾數(shù)的應用舉例不同類型的移動客戶月話費比較(數(shù)據(jù)拆分)利用分位數(shù)(不顯示頻數(shù)分布表),比較男女生成績集中程度計算描述統(tǒng)計量目的精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨勢、離散趨勢、對稱程度、陡峭程度?;痉椒ㄓ嬎慊久枋鼋y(tǒng)計量計算描述統(tǒng)計量描述集中趨勢的統(tǒng)計量均值(mean):表示某變量所有變量值集中趨勢或平均水平的統(tǒng)計量。適用于定距定比數(shù)據(jù)。特點:利用了全部數(shù)據(jù),易受極端值的影響。描述離散程度的統(tǒng)計量標準差(standarddeviation--StdDev):表示某變量的所有變量值離散趨勢的統(tǒng)計量。SPSS中計算的是樣本標準差。方差(variance):標準差的平方。SPSS中計算的是樣本方差。極差(range):最大值(minimum)-最小值(minimum)計算描述統(tǒng)計量描述對稱程度的統(tǒng)計量偏度(skewness):描述某變量所有變量值分布形態(tài)的偏斜程度和方向的統(tǒng)計量.偏度為0表示對稱;大于0表示正偏差大(右偏),眾數(shù)比均值小,極值大于均值;小于0表示負偏差大(左偏)。計算描述統(tǒng)計量描述陡峭程度的統(tǒng)計量峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計量。峭度為0表示與正態(tài)分布峭度相同。大于0表示比正態(tài)分布陡,尖峰。小于0表示比正態(tài)分布緩;平峰。計算描述統(tǒng)計量其他統(tǒng)計量均值標準誤差(S.Emeans)中心極限定理認為:樣本均值~N(u,

2/n)反映樣本均值與總體真值間的平均離散程度樣本數(shù)越大,樣本均值的離散程度越小,對真值的估計越準確計算描述統(tǒng)計量基本操作步驟(1)菜單選項:Analyze->DescriptiveStatistics->Descripive(2)選擇將參加計算的數(shù)值型變量名到Variables框。 ——僅適用于數(shù)值型變量分析比較男生和女生的學習成績比較集中趨勢比較離散趨勢比較偏斜程度比較陡峭程度實現(xiàn)方式:數(shù)據(jù)拆分其他功能數(shù)據(jù)標準化處理新變量的均值為0,標準差為1;小于0表示在平均水平下,大于0反之.正態(tài)分布的數(shù)據(jù)標準化后呈標準正態(tài)分布(68%,95%,99%)savestandardizedvaluesasvariables選項將變量作標準化后,結果存入名為“Z+原變量名”的新變量中.數(shù)據(jù)標準化處理應用舉例快速找到移動話費出眾的客戶網通集團企業(yè)效益評價計算描述統(tǒng)計量探索性描述分析目的:在未知數(shù)據(jù)分布特點情況下,通過計算詳盡描述統(tǒng)計量,輔助全面的統(tǒng)計圖,認識數(shù)據(jù)分布。基本操作步驟(1)菜單選項:analyze->descriptivestatistics->Explore(2)選擇將參加計算的數(shù)值型變量名到Dependentlist框(3)進行分組描述分析時,將分組變量選入Factlist框描述統(tǒng)計量:M統(tǒng)計量:集中趨勢的估計值,不受極端值影響。用于判斷有無異常值。探索性描述分析相關圖形箱線圖莖葉圖直方圖正態(tài)分布圖:檢驗變量是否符合正態(tài)分布方差齊性檢驗:各組離散程度是否相同H0:方差相等舉例:兩班學生成績分布情況,離散程度是否相同。購買數(shù)量已婚者單身者多31%52%少69%48%列總計100%100%個案數(shù)700300購買數(shù)量男性女性已婚者單身者已婚者單身者多35%40%25%60%少65%60%75%40%列總計100%100%100%100%個案數(shù)400120300180購買數(shù)量全部樣本多37.3%少62.7%列總計100%個案數(shù)1000購買流行服裝交叉分組下的頻數(shù)分析針對定類數(shù)據(jù)和定序數(shù)據(jù)的頻數(shù)分析(用于定類定序數(shù)據(jù)分析有customtable\logistic\loglinear)目的:通過了解不同變量在不同水平下的數(shù)據(jù)分布情況,判斷水平對變量是否有影響例:女生的學習成績比男生好嗎?(兩變量)不同專業(yè)的女生學習成績都比男生好嗎?(三變量)分析的主要步驟產生交叉列聯(lián)表分析列聯(lián)表中變量間的關系產生交叉列聯(lián)表什么是列聯(lián)表多個變量在不同取值下的數(shù)據(jù)分布頻數(shù)表列變量行變量工商管理控制變量頻數(shù)性別成績優(yōu)良差男女產生交叉列聯(lián)表基本操作步驟(1)菜單選項:analyze->descriptivestatistics->

crosstabs(2)選擇一個變量作為行變量到row框.(3)選擇一個變量作為列變量到column框.(4)可選一個或多個變量作為控制變量到layer框.(5)是否顯示各分組的條圖(displayclusteredbarcharts)產生交叉列聯(lián)表scale數(shù)據(jù)可做適當分組后再產生列聯(lián)表僅利用頻數(shù),信息利用不充分進一步計算

cells選項:選擇在頻數(shù)分析表中輸出各種百分比.row:行百分比(Rowpct);column:列百分比(Colpct);total:總百分比(Totpct);分析列聯(lián)表中變量間的關系目的:

通過列聯(lián)表分析,檢驗行列變量之間是否獨立。方法:

卡方檢驗:對品質數(shù)據(jù)的相關性進行度量(這里兩變量均為定類數(shù)據(jù)或定序數(shù)據(jù))分析列聯(lián)表中變量間的關系卡方檢驗基本步驟(1)H0:行列變量之間無關聯(lián)或相互獨立(2)構造卡方統(tǒng)計量統(tǒng)計量服從(r-1)*(c-1)個自由度的卡方分布count:觀察(實際)頻數(shù)expectedcount:期望頻數(shù)(期望頻數(shù)反映的是H0成立情況下的數(shù)據(jù)分布特征)分析列聯(lián)表中變量間的關系卡方檢驗基本步驟(3)計算卡方統(tǒng)計量的值,并得到該統(tǒng)計量值的概率P值(4)決策。概率P與顯著性水平比較,小于等于則拒絕H0,否則不能拒絕實現(xiàn)步驟statistics選項PearsonChi-Square:常用于行列變量獨立性檢驗LikelihoodRatio:可用于對數(shù)線性模型檢驗Fisher‘sExactTest:N<40,或Fe<5Linear-by-LinearAssociation:線性相關卡方檢驗卡方檢驗的要求:一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過20%,否則會夸大卡方值,容易得出拒絕結論,可以采用精確檢驗。N>=40,T>=5, Pearson卡方檢驗,若P≈α,改用確切概率法檢驗N<40,或T<5, 確切概率法檢驗分析列聯(lián)表中變量間的關系行列變量相關性的其他測度指標Nominal(定類變量):phi系數(shù):在2×2列聯(lián)表中,通常[-1,1],負號無實際意義列聯(lián)C系數(shù)(contingencycoefficient),通常為[0,1)V系數(shù)[0,1]值越大表示行列變量的相關性越大分析列聯(lián)表中變量間的關系Ordinal(定序變量)反映定序變量一致性指標行變量等級越高,列變量等級也越高或越低——一致性高行變量等級越高,列變量等級不定——不一致指標絕對值越大越相關,越接近0越無關定序變量一致性檢驗年齡與工資收入交叉列聯(lián)表 低中高 青 40000 中 05000 老 00 600 低中高 青 00 500 中 0600 0老 4000 0一致一致應用舉例受教育程度越

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論