第4章-SPSS基本統(tǒng)計(jì)分析[002].ppt_第1頁
第4章-SPSS基本統(tǒng)計(jì)分析[002].ppt_第2頁
第4章-SPSS基本統(tǒng)計(jì)分析[002].ppt_第3頁
第4章-SPSS基本統(tǒng)計(jì)分析[002].ppt_第4頁
第4章-SPSS基本統(tǒng)計(jì)分析[002].ppt_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第4章SPSS基本統(tǒng)計(jì)分析 4 1頻數(shù)分析4 2計(jì)算基本描述統(tǒng)計(jì)量4 3交叉分組下的頻數(shù)分析4 4多選項(xiàng)分析4 5比率分析 1 對數(shù)據(jù)的基本統(tǒng)計(jì)分析通常包括 編制單個(gè)變量的頻數(shù)分布表計(jì)算單個(gè)變量的描述統(tǒng)計(jì)量以及不同分組下的描述統(tǒng)計(jì)量編制多變量的交叉頻數(shù)分布表 并以此分析變量之間的關(guān)系數(shù)據(jù)的多選項(xiàng)分析其他探索性分析 2 采用兩種方式實(shí)現(xiàn)上述分析 第一 數(shù)值計(jì)算 即計(jì)算常見的基本統(tǒng)計(jì)量的值 通過數(shù)值來準(zhǔn)確反映數(shù)據(jù)的基本統(tǒng)計(jì)特征第二 圖形繪制 通過圖形來直觀展示數(shù)據(jù)的分布特點(diǎn) 3 4 1頻數(shù)分析表 目的頻數(shù)分析 對數(shù)據(jù)按組進(jìn)行歸類整理 形成變量不同水平的頻數(shù)分布表和圖形 對數(shù)據(jù)的分布趨勢進(jìn)行初步分析 通過頻數(shù)分析 了解變量取值的狀況 把握分布特征 通過頻數(shù)分析 能夠在一定程度上反映出樣本是否具有總體代表性 抽樣是否存在系統(tǒng)偏差等 并以此證明以后相關(guān)問題分析的代表性和可信性 4 某班學(xué)生按性別分組 5 某班學(xué)生按性別和年齡分組 交叉式復(fù)合分組 6 頻數(shù)分析的任務(wù) 編制頻數(shù)分布表各組的名稱頻數(shù) Frequency 百分比 Percent 有效百分比 ValidPercent 累計(jì)百分比 CumulativePercent 繪制統(tǒng)計(jì)圖柱形圖或條形圖 BarChart 餅圖 PieChart 直方圖 Histograms 頻數(shù)分析表 如果有缺省值 那么有效百分比能更加準(zhǔn)確地反映取值分布狀況 用寬度相同的條形的高度或長短來表示頻數(shù)分布變化的圖形 使用于定序和定類變量的分析 用圓形及圓內(nèi)扇形的面積來表示頻數(shù)百分比變化的圖形 用矩形的面積來表示頻數(shù)變化的圖形 使用于定距型變量的分析 7 頻數(shù)分析中的擴(kuò)展功能 計(jì)算分位數(shù) 分位數(shù)從一個(gè)側(cè)面刻畫了變量的取值分布形態(tài) 分位數(shù)差可描述離散程度 適用于定序 定距數(shù)據(jù) 數(shù)據(jù)按升序排序后 找到若干個(gè)分位點(diǎn)上的變量值quartiles 計(jì)算四分位數(shù)25 QL 50 中位數(shù) 75 QU cutpointsfornequalgroups n等份percentile 自定義百分位點(diǎn)計(jì)算其他基本描述統(tǒng)計(jì)量 描述集中趨勢 離散程度 分布形態(tài)的統(tǒng)計(jì)量 8 輸出百分位數(shù) 輸出四分位數(shù) 顯示25 50 75 的百分位數(shù) 將數(shù)據(jù)平均分為所設(shè)定的相等等份 可輸入2 100的整數(shù) 如鍵入4則輸出第25 50 75百分位數(shù)自定義百分位數(shù) 可輸入0 100的整數(shù) 輸入值后按Add添加百分位數(shù) 可反復(fù)操作鍵入多個(gè)百分位數(shù) 按Remove 刪除已鍵入的數(shù)值按Change 重新輸入新數(shù) 輸出統(tǒng)計(jì)量對話框 頻數(shù)分析表 9 頻數(shù)分析 頻數(shù)分析中的其他分析分位數(shù)的應(yīng)用從一個(gè)側(cè)面刻畫了變量的取值分布狀況例 QL 50 QU 75 在排除極端值影響的條件下 通過計(jì)算分位數(shù)差 比較兩組樣本數(shù)據(jù)的離散程度例 QL 50 QU 75 和 QL 70 QU 75 的比較分位數(shù) 中位數(shù) 眾數(shù)的應(yīng)用舉例不同類型的移動客戶月話費(fèi)比較 數(shù)據(jù)拆分 利用分位數(shù) 不顯示頻數(shù)分布表 10 Chart對話框 不輸出任何圖形 為默認(rèn)輸出柱形圖或條形圖 各條高度代表變量各分類的頻數(shù)或百分比 輸出餅圖 各塊的數(shù)值表示各分類變量的頻數(shù)或百分比輸出直方圖 此圖僅適用于區(qū)間型數(shù)值變量 選擇此項(xiàng)后 還可選擇Withnormalcurve 畫出的直方圖帶有正態(tài)曲線 只有選擇了條形圖和餅圖項(xiàng)才有效 決定縱軸表示的統(tǒng)計(jì)量縱軸或橫軸表示頻數(shù)縱軸或橫軸表示百分比 頻數(shù)分析表 11 Format對話框 控制頻數(shù)表輸出的分類數(shù)量 默認(rèn)為10 多變量框中可設(shè)定多變量表格輸出的格式 設(shè)置頻數(shù)表輸出的格式 選擇頻數(shù)表中排列順序按變量值升序排列 此為默認(rèn)按變量值降序排列按變量各種取值發(fā)生的頻數(shù)的升序排列按變量各種取值發(fā)生的頻數(shù)的降序排列 頻數(shù)分析表 12 案例 利用 大學(xué)生職業(yè)生涯規(guī)劃數(shù)據(jù) 進(jìn)行以下分析分析被調(diào)查者的專業(yè)分布狀況 以及學(xué)生對職業(yè)規(guī)劃相關(guān)知識的了解程度 分析專業(yè)和職業(yè)認(rèn)知得分的分布 并比較男女生的得分差異 13 頻數(shù)分析表 應(yīng)用舉例以 居民儲蓄調(diào)查數(shù)據(jù) 為例 進(jìn)行頻數(shù)分析 有兩個(gè)分析目標(biāo) 目標(biāo)一 分析儲戶的戶口和職業(yè)的基本情況 目標(biāo)二 分析儲戶一次存 取 款金額的分布 并對城鎮(zhèn)儲戶和農(nóng)村儲戶進(jìn)行比較 14 頻數(shù)分析表 目標(biāo)一 分析儲戶的戶口和職業(yè)的基本情況 分析特點(diǎn) 涉及的兩個(gè)變量都是分類變量 戶口 職業(yè) 分析方法 通過基本頻數(shù)分析實(shí)現(xiàn) 15 頻數(shù)分析表 目標(biāo)二 分析儲戶一次存 取 款金額的分布 并對城鎮(zhèn)儲戶和農(nóng)村儲戶進(jìn)行比較 分析特點(diǎn) 1 涉及的變量是定距型變量 2 需要分別對城鎮(zhèn)和農(nóng)村戶口的儲戶進(jìn)行分析 以便比較 分析方法 1 對定距變量不能直接采用頻數(shù)分析 2 應(yīng)對數(shù)據(jù)分組后 再編制頻數(shù)分布表 分析方法 1 進(jìn)行數(shù)據(jù)拆分 2 利用四分位數(shù)等標(biāo)志變異指標(biāo)比較城鎮(zhèn)和農(nóng)村儲戶的一次存款金額分布上的差異 16 操作 analyze descriptivestatistics frequencies 選擇待分析的變量到 variable s 框 按Chart按鈕 選擇所需要繪制的圖形 在 ChartValues 框中選擇柱形圖縱坐標(biāo)或條形圖橫坐標(biāo)的含義 按Format按鈕 調(diào)整頻數(shù)分布表中數(shù)據(jù)的輸出順序 按變量值的升 降 序排列 按頻數(shù)的升 降 序排列 17 Frequences主對話框 頻數(shù)分析表 按Statistics按鈕 打開Statistics對話框 18 4 2計(jì)算描述統(tǒng)計(jì)量 目的精確把握變量的總體分布狀況 了解數(shù)據(jù)的集中趨勢 離散趨勢 對稱程度 陡峭程度 基本方法計(jì)算基本描述統(tǒng)計(jì)量 19 基本描述統(tǒng)計(jì)量 描述集中趨勢的統(tǒng)計(jì)量均值 mean 表示某變量所有變量值集中趨勢或平均水平的統(tǒng)計(jì)量 適用于定距數(shù)據(jù) 利用了全部數(shù)據(jù) 易受極端值影響 中位數(shù) Median 排序后處于中間位置的那個(gè)變量值 不適用于定類數(shù)據(jù) 眾數(shù)一個(gè)統(tǒng)計(jì)總體或分布數(shù)列中出現(xiàn)的頻數(shù)最多 頻率最高的變量值 既適用于定距數(shù)據(jù) 也適用于定序和定類數(shù)據(jù) 20 2020 2 5 21 注意 對于定距數(shù)據(jù) 一般情況下都采用均值 當(dāng)數(shù)據(jù)中存在著較大的誤差或者有一些極端數(shù)值的話 就要使用中位數(shù) 當(dāng)變量的次數(shù)分布的偏斜程度十分嚴(yán)重時(shí) 就應(yīng)該使用眾數(shù)來說明總體的一般水平 21 基本描述統(tǒng)計(jì)量 描述離散程度的統(tǒng)計(jì)量離散程度 指一組數(shù)據(jù)遠(yuǎn)離 中心值 的程度 即考查所有數(shù)據(jù)相對于 中心值 分布的疏密程度 如果數(shù)據(jù)都緊密地集中在 中心值 的周圍 數(shù)據(jù)的離散程度較小 則說明 中心值 對數(shù)據(jù)的代表性就好 如果數(shù)據(jù)比較松散地分布在 中心值 的周圍 數(shù)據(jù)的離散程度較大 則 中心值 說明數(shù)據(jù)特征是不具有代表性的 22 標(biāo)準(zhǔn)差 standarddeviation StdDev 表示某變量的所有變量值離散趨勢的統(tǒng)計(jì)量 SPSS中計(jì)算的是樣本標(biāo)準(zhǔn)差 方差 variance 標(biāo)準(zhǔn)差的平方 SPSS中計(jì)算的是樣本方差 極差 range 最大值 maximum 最小值 minimum 基本描述統(tǒng)計(jì)量 23 描述對稱程度的統(tǒng)計(jì)量偏度 skewness 描述某變量所有變量值分布形態(tài)的偏斜程度和方向的統(tǒng)計(jì)量 偏度為0表示對稱 大于0表示正偏差大 稱為正偏或右偏 眾數(shù)小于均值 小于0表示負(fù)偏差大 稱為負(fù)偏或左偏 眾數(shù)大于均值 偏度的絕對值越大 表示數(shù)據(jù)分布形態(tài)的偏斜程度越大 基本描述統(tǒng)計(jì)量 24 25 描述陡峭程度的統(tǒng)計(jì)量峰度 kurtosis 描述某變量取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量 峰度為0表示與正態(tài)分布峭度相同 大于0表示比正態(tài)分布陡 為尖峰分布 小于0表示比正態(tài)分布緩 為平峰分布 基本描述統(tǒng)計(jì)量 26 這里所說的峰度高 低 都是與標(biāo)準(zhǔn)正態(tài)分布比較而言的 尖頂峰度 正態(tài)分布 平頂分布 27 離散形態(tài)的概念 非對稱的 偏斜的分布 對稱的 高度適中的分布 既偏斜又低平的分布 28 2020 2 5 29 68 27 95 45 99 73 異常值的檢測 29 其他統(tǒng)計(jì)量均值標(biāo)準(zhǔn)誤差 S Emeans 中心極限定理認(rèn)為 樣本均值 N u 2 n 反映樣本均值與總體真值間的平均離散程度樣本數(shù)越大 樣本均值的離散程度越小 對真值的估計(jì)越準(zhǔn)確 基本描述統(tǒng)計(jì)量 30 1 菜單選項(xiàng) Analyze Descriptivestatistics Descripive 2 選擇將參加計(jì)算的數(shù)值型變量名到Variables框 僅適用于數(shù)值型變量 3 單擊Options按鈕指定計(jì)算哪些基本描述統(tǒng)計(jì)量 計(jì)算描述統(tǒng)計(jì)量的基本操作 31 案例 利用 大學(xué)生職業(yè)生涯規(guī)劃數(shù)據(jù) 進(jìn)行以下分析 計(jì)算專業(yè)和職業(yè)認(rèn)知得分的基本描述統(tǒng)計(jì)量 并比較男女生的得分差異 分析是否存在專業(yè)和職業(yè)認(rèn)知得分的異常值 32 基本描述統(tǒng)計(jì) 應(yīng)用舉例以 居民儲蓄調(diào)查數(shù)據(jù) 為例 對一次存 取 款金額 有兩個(gè)分析目標(biāo) 目標(biāo)一 計(jì)算存 取 款金額的基本描述統(tǒng)計(jì)量 并對城鎮(zhèn)儲戶和農(nóng)村儲戶進(jìn)行比較 數(shù)據(jù)拆分 目標(biāo)二 分析儲戶一次存 取 款的數(shù)量是否存在不均衡現(xiàn)象 33 目標(biāo)二 分析儲戶一次存 取 款的數(shù)量是否存在不均衡現(xiàn)象 可以從分析金額是否有大量異常值入手 實(shí)現(xiàn)方法 數(shù)據(jù)標(biāo)準(zhǔn)化處理 標(biāo)準(zhǔn)化值 反映的是變量值與變量均值的差是幾個(gè)標(biāo)準(zhǔn)差單位新變量的均值為0 標(biāo)準(zhǔn)差為1 小于0表示在平均水平下 大于0反之 savestandardizedvaluesasvariables選項(xiàng)將變量作標(biāo)準(zhǔn)化后 結(jié)果存入名為 Z 原變量名 的新變量中 基本描述統(tǒng)計(jì) 34 選一個(gè)或多個(gè)變量移入 如選中此框 將對Variables框中選擇的變量進(jìn)行標(biāo)準(zhǔn)化產(chǎn)生相應(yīng)的Z分值 并作為新變量保存到數(shù)據(jù)窗口 其變量名在原變量名前加z Descriptive對話框 35 Options對話框 基本統(tǒng)計(jì)量 當(dāng)Variables框中有多個(gè)變量時(shí) 此框確定其輸出順序 按Variables框中的排列順序輸出按各變量的字母順序輸出按均值的升序排列按均值的降序排列 分布 36 對標(biāo)準(zhǔn)化的數(shù)據(jù)分析分為三組 低金額組 3 中金額組 3 3 高金額 3 異常組的總比例大于理論值0 3 則存在一定的不均衡現(xiàn)象數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例快速找到移動話費(fèi)出眾的客戶 基本描述統(tǒng)計(jì) 結(jié)果分析 37 4 3交叉分組下的頻數(shù)分析 交叉分組下的頻數(shù)分析的目的和基本任務(wù)交叉列聯(lián)表的主要內(nèi)容交叉列聯(lián)表行列變量間關(guān)系的分析 38 2020 2 5 39 交叉分組下的頻數(shù)分析 針對多變量的頻數(shù)分析 主要用于定類和定序數(shù)據(jù) 目的 通過了解多變量不同取值下的數(shù)據(jù)分布情況 掌握多變量的聯(lián)合分布特征 進(jìn)而分析變量之間的相互影響和關(guān)系 例如 女生的學(xué)習(xí)成績比男生好嗎 兩變量 對不同專業(yè) 女生學(xué)習(xí)成績都比男生好嗎 三變量 40 產(chǎn)生交叉列聯(lián)表 交叉列聯(lián)表 兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表 列變量 行變量 金融 控制變量 頻數(shù) 41 交叉分組下的頻數(shù)分析的基本任務(wù) 交叉分組下的頻數(shù)分析又稱列聯(lián)表分析兩大基本任務(wù) 第一 根據(jù)收集到的樣本數(shù)據(jù)編制交叉列聯(lián)表 第二 在交叉列聯(lián)表的基礎(chǔ)上 對兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析 42 交叉列聯(lián)表的主要內(nèi)容 交叉列聯(lián)表是兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表 以 大學(xué)生職業(yè)生涯規(guī)劃 sav 編制一張涉及兩變量的二維交叉列聯(lián)表 反映不同性別和影響高考志愿填報(bào)因素交叉分組下的學(xué)生頻數(shù)分布情況 任務(wù)一 43 產(chǎn)生交叉列聯(lián)表的操作 1 Analyze Descriptivestatistics Crosstabs 2 選擇變量作為行變量到Row s 框 選擇變量作為列變量到Column s 框 如果進(jìn)行三維或多維列聯(lián)表分析 選一個(gè)或多個(gè)變量作為控制變量到Layer框 3 選擇 Displayclusteredbarcharts 選項(xiàng) 指定是否繪制各交叉分組下的分布柱形圖 Suppresstables 表示不輸出列聯(lián)表 僅分析行列變量間的關(guān)系時(shí)可選此項(xiàng) 44 該框中的變量作為分布表中的行 列 變量 必須是數(shù)值型或字符型等分類變量 該框中的變量作為控制變量 決定頻數(shù)分布表中的層 可有多個(gè)控制變量 如要增加新的控制變量 按Next鍵 要修改以前的變量按Previous鍵 顯示各變量交叉分組下的頻數(shù)分布柱形圖 只輸出統(tǒng)計(jì)量 不輸出多維列聯(lián)表 Crosstabs對話框 45 Crosstabs的CellDisplay對話框 選擇在列聯(lián)表中輸出的統(tǒng)計(jì)量 包括頻數(shù) 百分比 殘差等 輸出每個(gè)單元格的實(shí)際觀測頻數(shù)輸出其期望的觀測頻數(shù) 在假設(shè) 行和列變量是獨(dú)立的或不相關(guān)的 條件下的頻數(shù) 輸出每個(gè)單元格中觀測的數(shù)目占整行全部觀測數(shù)目的百分比輸出每個(gè)單元格中觀測的數(shù)目占整列全部觀測數(shù)目的百分比輸出每個(gè)單元格中觀測的數(shù)目占全部觀測數(shù)目的百分比 計(jì)算非標(biāo)準(zhǔn)化殘差計(jì)算標(biāo)準(zhǔn)化殘差計(jì)算調(diào)整后殘差 46 TableFormat對話框 決定各行的排列順序 行變量的取值按升序排列行變量的取值按降序排列 47 產(chǎn)生交叉列聯(lián)表 定距數(shù)據(jù)可做適當(dāng)分組后再產(chǎn)生列聯(lián)表僅利用頻數(shù) 信息利用不充分進(jìn)一步計(jì)算cells選項(xiàng) 選擇在頻數(shù)分析表中輸出各種百分比 row 行百分比 Rowpct column 列百分比 Colpct total 總百分比 Totpct 48 性別變量 行變量 row 志愿決定因素 列變量 column 表格中間是觀測頻數(shù) observedcounts 和各種百分比 交叉列聯(lián)表的行 列 邊緣分布 性別 369 529 志愿決定因素 270 287 76 138 68 59 中間單元格中頻數(shù)數(shù)據(jù)構(gòu)成的分布稱為交叉列聯(lián)表的條件分布 即在行變量 列變量 取值條件下的列變量 行變量 的分布 行百分比 列百分比 行邊緣分布 列邊緣分布 49 三維交叉列聯(lián)表 反映了不同性別和不同職稱以及不同文化程度交叉分組下的職工頻數(shù)分布情況 層變量 Layer 50 分析列聯(lián)表中變量間的關(guān)系 目的 通過列聯(lián)表分析 檢驗(yàn)行列變量之間是否獨(dú)立 方法 卡方檢驗(yàn) 對分類數(shù)據(jù)的相關(guān)性進(jìn)行度量 任務(wù)二 51 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn)基本步驟 1 H0 行列變量之間無關(guān)聯(lián)或相互獨(dú)立 2 計(jì)算檢驗(yàn)統(tǒng)計(jì)量 卡方 r為行數(shù) c為列數(shù) 統(tǒng)計(jì)量服從 r 1 c 1 個(gè)自由度的卡方分布 count 觀察 實(shí)際 頻數(shù)f0expectedcount 期望頻數(shù)fe 期望頻數(shù)反映的是H0成立情況下的數(shù)據(jù)分布特征 期望頻數(shù)的分布反映的是行列變量互不相干下的分布 反映了行列變量間的相互獨(dú)立關(guān)系 當(dāng)觀測頻數(shù)與期望頻數(shù)的總差值越大時(shí) 卡方值也越大 實(shí)際分布與期望分布的差距越大 表明行列變量之間越相關(guān) 當(dāng)總差值越小時(shí) 卡方值也越小 實(shí)際分布與期望分布越接近 表明行列變量之間越獨(dú)立 52 期望頻數(shù)的計(jì)算方法 53 分析列聯(lián)表中變量間的關(guān)系 3 確定顯著性水平和臨界值或P 值 顯著性水平指棄真的概率 臨界值可在卡方分布表中根據(jù)自由度 r 1 c 1 和查得 P 值SPSS直接計(jì)算給出 4 決策 將卡方統(tǒng)計(jì)量的觀測值與臨界值對比 若大于臨界值則拒絕原假設(shè) 否則不能拒絕原假設(shè) 將卡方統(tǒng)計(jì)量觀測值的概率P 值與顯著性水平比較 若小于等于顯著性水平則拒絕H0 否則不能拒絕原假設(shè) 54 交叉列表卡方檢驗(yàn)的要求 列聯(lián)表各單元格中期望頻數(shù)大小的問題 一般要求列聯(lián)表中不應(yīng)有期望頻數(shù)小于1的單元格 或不應(yīng)有大量的期望頻數(shù)小于5的單元格 不超過20 否則會夸大卡方值 容易得出拒絕結(jié)論 不宜使用卡方檢驗(yàn) 對此SPSS會給出相應(yīng)提示 此時(shí)可適當(dāng)合并相鄰單元格 或采用似然率卡方檢驗(yàn)等方法修正 樣本量大小的問題 卡方值的大小會受到樣本量的影響 例如 若各個(gè)單元格中的樣本數(shù)均等比例擴(kuò)大10倍 卡方值也會隨之?dāng)U大10倍 但臨界值不變 進(jìn)而使拒絕零假設(shè)的可能性增高 55 交叉列聯(lián)表分析 案例 以 大學(xué)生職業(yè)生涯規(guī)劃數(shù)據(jù) 為例 分析 不同性別的學(xué)生在填報(bào)志愿時(shí)所考慮的因素是否存在差異 影響高考志愿填報(bào)的因素與性別是否有關(guān) 分析方法 利用交叉分組下頻數(shù)分析來實(shí)現(xiàn) 56 操作 1 Analyze Descriptivestatistics Crosstabs 2 選擇變量作為行變量到Row s 框 選擇變量作為列變量到Column s 框 如果進(jìn)行三維或多維列聯(lián)表分析 選一個(gè)或多個(gè)變量作為控制變量到Layer框 3 選擇 Displayclusteredbarcharts 選項(xiàng) 指定是否繪制各交叉分組下的分布柱形圖 Suppresstables 表示不輸出列聯(lián)表 僅分析行列變量間的關(guān)系時(shí)可選此項(xiàng) 4 按Cells按鈕 選擇列聯(lián)表單元格中的輸出內(nèi)容 5 按Format按鈕指定列聯(lián)表各單元格的輸出排列順序 6 按Statistics按鈕 選擇用哪種方法分析行列變量之間的關(guān)系 默認(rèn)為卡方檢驗(yàn) 57 卡方檢驗(yàn) 適用于變量值較多 樣本量較大的情況 相關(guān)系數(shù)檢驗(yàn) 適用于兩定距變量或兩定序變量 適用于兩定類變量的方法 列聯(lián)系數(shù) 值在0 1之間 接近1應(yīng)拒絕原假設(shè) 適用于2 2列聯(lián)表 排除了樣本量的影響在自變量預(yù)測中反映比例縮減誤差 接近1表明自變量預(yù)測應(yīng)變量好不確定系數(shù) 以熵為標(biāo)志的比例縮減誤差 適用于兩定序變量的方法 Gamma系數(shù) 1 1 接近0則相互獨(dú)立 常用于2 2列聯(lián)表 取值 1 1 取值 1 1 常用于方形列聯(lián)表 取值 1 1 常用于任意格數(shù)的列聯(lián)表 適用于一定類變量和一定距變量的方法 Eta系數(shù) 取值 0 1 Kappa用于內(nèi)部一致性檢驗(yàn) Risk用于計(jì)算比數(shù)比和相對危險(xiǎn)值 進(jìn)行兩個(gè)相關(guān)的二值變量的非參數(shù)檢驗(yàn)進(jìn)行一個(gè)二值因素變量和一個(gè)二值響應(yīng)變量的獨(dú)立性檢驗(yàn) Crosstabs的Statistics對話框 進(jìn)行行和列變量相互獨(dú)立的假設(shè)檢驗(yàn) 有多種檢驗(yàn)法 注 58 解釋分析結(jié)果的注意事項(xiàng) 卡方分布是連續(xù)分布 而列聯(lián)表中數(shù)據(jù)是分類非連續(xù)的 Pearson卡方統(tǒng)計(jì)量近似服從卡方分布 當(dāng)單元格 分類 較多樣本量較大時(shí) 分類數(shù)據(jù)的不連續(xù)分布與卡方分布之間的差異不顯著 反之 這種差異就不可忽視 SPSS會自動對其進(jìn)行Yates連續(xù)性校正 對單元格 分類 較少的列聯(lián)表 SPSS還將自動采用Fisher精確檢驗(yàn)法 小樣本時(shí)主要參考連續(xù)性校正和Fisher檢驗(yàn)的結(jié)果 59 4 4多選項(xiàng)分析 多選項(xiàng)問題 根據(jù)實(shí)際調(diào)查需要 要求被調(diào)查者從問卷給出的若干可選答案中選擇一個(gè)以上的答案 例如 請問您平時(shí)主要的休閑娛樂方式是 a 看電視 聽廣播b 玩游戲c 體育運(yùn)動d 逛街購物e 旅游f 看書學(xué)習(xí)g 喝酒聊天h 工作太忙 沒時(shí)間休閑娛樂又如 您經(jīng)常瀏覽的網(wǎng)站 在下列品牌中您信任哪些品牌 多選項(xiàng)問題不能直接處理 因?yàn)镾PSS中的一個(gè)變量雖然可存儲多個(gè)答案 但無法直接支持對問題的分析 60 多選項(xiàng)分析 多選項(xiàng)問題的處理方法 1 思路 先將多選項(xiàng)問題分解 將一個(gè)問題定義成幾個(gè)變量 用這幾個(gè)變量來描述該問題的幾個(gè)可能被選擇的答案 然后分別做頻數(shù)分析或交叉分組下的頻數(shù)分析 2 方法 分解方法 多選項(xiàng)二分法 Multipledichotomiesmethod 和多選項(xiàng)分類法 Multiplecategorymethod 頻數(shù)分析和交叉分組下的頻數(shù)分析 61 多選項(xiàng)二分法將多選項(xiàng)問題中的每個(gè)答案設(shè)為一個(gè)SPSS變量 每個(gè)變量只有0或1兩個(gè)取值 分別表示選擇該答案和不選擇該答案 例如 保險(xiǎn)市場調(diào)查中有一個(gè)問題 您購買商業(yè)養(yǎng)老保險(xiǎn)的最重要的三個(gè)原因是 1 使晚年生活有保障 2 一種安全的投資保值方式 3 報(bào)著試試看的態(tài)度購買 4 親戚朋友推薦 5 單位統(tǒng)一組織購買 6 保險(xiǎn)公司的宣傳 7 其他 多選項(xiàng)分解 62 按照二分法 設(shè)置7個(gè)變量 取值為1或0 其中1表示是 0表示不是 63 多選項(xiàng)分類法 預(yù)先估計(jì)多選項(xiàng)問題可能被選擇的最多答案數(shù) 為每個(gè)答案建立一個(gè)變量 取值為多選項(xiàng)問題的可選答案 例如 64 多選項(xiàng)分析的基本思路定義多選項(xiàng)變量集多選項(xiàng)頻數(shù)分析多選項(xiàng)交叉分組下的頻數(shù)分析 65 案例 根據(jù) 保險(xiǎn)市場調(diào)查 sav 分析不同工作單位性質(zhì)人員購買商業(yè)養(yǎng)老保險(xiǎn)的原因 66 多選項(xiàng)分析 定義多選項(xiàng)變量集目的 將已分解的變量定義為一個(gè)集合 便于進(jìn)行多選項(xiàng)分析操作 Analyze MultipleResponse DefineSets 從原變量中選取被分解的變量 數(shù)值型 到VariablesinSets框指定被分解的變量是按多選項(xiàng)二分法 Dichotomies 分解還是按多選項(xiàng)分類法 Categories 分解的 為變量集命名 系統(tǒng)自動在名字前加字符 67 多選項(xiàng)分析 多選項(xiàng)頻數(shù)分析 Analyze MultipleResponse Frequencies 選擇待分析的多選項(xiàng)變量集到Tablesfor框 缺失數(shù)據(jù)處理 SPSS規(guī)定 只要個(gè)案在多選項(xiàng)變量集中的某一個(gè)變量上有缺失值 就將該個(gè)案剔除 Excludecaseslistwisewithindichotomies 適用于二分變量多項(xiàng)選擇的分析 Excludecaseslistwisewithincategories 適用于分類變量多項(xiàng)選擇的分析 68 多選項(xiàng)分析下的交叉頻數(shù)分析 操作 Analyze MultipleResponse Crosstabs 選擇行變量并定義取值范圍選擇列變量并定義取值范圍選擇控制變量并定義取值范圍Option按鈕選擇列聯(lián)表的輸出內(nèi)容和計(jì)算方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論