




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章 SPSS的基本統(tǒng)計分析,SPSS的基本統(tǒng)計分析,頻數(shù)分析-對應(yīng)表格法,計算描述統(tǒng)計量-對應(yīng)數(shù)值法,探索性描述分析-結(jié)合,交叉分組下的頻數(shù)分析,多選項(xiàng)分析,統(tǒng)計圖-對應(yīng)圖形法,頻數(shù)分析,目的 粗略把握變量的總體分布狀況。 例: 對某個問題的總體看法,如新業(yè)務(wù)的使用愿望、教學(xué)效果等 對某事物的客觀描述,如通話的漫游類型、大客戶的行業(yè)分布 采用的方法 制作頻數(shù)分布表:包括計算 頻數(shù)、累計頻數(shù)、百分比、累計百分比 繪制統(tǒng)計圖形:條形圖(品質(zhì)數(shù)據(jù))、餅圖、 直方圖(數(shù)量數(shù)據(jù)),頻數(shù)分析,基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-frequenci
2、es (2)選擇幾個待分析的變量到variables框. (3)chart選項(xiàng),選擇所需要的圖形,頻數(shù)分析,應(yīng)用舉例 移動通話的漫游類型分析 特點(diǎn):定類數(shù)據(jù) 使用頻數(shù)、百分比、總數(shù)(不可缺少的) 不使用頻數(shù)表中給出的累計頻數(shù)和累計百分比 移動通話時間分析、移動客戶話費(fèi)分析 特點(diǎn):數(shù)量數(shù)據(jù) 除使用頻數(shù)、百分比、總數(shù)外,還可以充分使用累計頻數(shù)和累計百分比,頻數(shù)分析,數(shù)據(jù)中存在缺失值 使用有效百分比(分母為有效樣本數(shù)) 例:學(xué)生成績得優(yōu)率、得良率 frequencies-format 頻數(shù)分布表輸出按變量值、頻數(shù)升序、降序輸出,頻數(shù)分析,頻數(shù)分析中的其他分析 計算中位數(shù)、分位數(shù):適用于定序、定距數(shù)據(jù)
3、 數(shù)據(jù)按升序排序后,找到若干個分位點(diǎn)上的變量值 quartiles:計算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU) cut points for n equal groups: n等份 percentile: 自定義百分位點(diǎn) 計算眾數(shù):適用于定類數(shù)據(jù)(但必須是數(shù)值型),頻數(shù)分析,頻數(shù)分析中的其他分析 分位數(shù)的應(yīng)用 從一個側(cè)面比較兩組樣本數(shù)據(jù)的集中趨勢 例:( QL=50,QU=80) 和 (QL=70,QU=75) 的比較 在排除極端值影響的條件下,通過計算分位數(shù)差,比較兩組樣本數(shù)據(jù)的離散程度 例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比較 分位數(shù)、中
4、位數(shù)、眾數(shù)的應(yīng)用舉例 不同類型的移動客戶月話費(fèi)比較(數(shù)據(jù)拆分) 利用分位數(shù)(不顯示頻數(shù)分布表),計算描述統(tǒng)計量,目的 精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨勢、離散趨勢、對稱程度、陡峭程度。 基本方法 計算基本描述統(tǒng)計量,計算描述統(tǒng)計量,描述集中趨勢的統(tǒng)計量 均值(mean):表示某變量所有變量值集中趨勢或平均水平的統(tǒng)計量。 適用于定距數(shù)據(jù)。 特點(diǎn):利用了全部數(shù)據(jù),易受極端值的影響。 描述離散程度的統(tǒng)計量 標(biāo)準(zhǔn)差(standard deviation-Std Dev):表示某變量的所有變量值離散趨勢的統(tǒng)計量。 SPSS中計算的是樣本標(biāo)準(zhǔn)差。 方差(variance):標(biāo)準(zhǔn)差的平方。 SP
5、SS中計算的是樣本方差。 極差 (range):最大值(minimum)-最小值(minimum),計算描述統(tǒng)計量,描述對稱程度的統(tǒng)計量 偏度(skewness):描述某變量所有變量值分布形態(tài)的偏斜程度和方向的統(tǒng)計量. 偏度為0表示對稱; 大于0表示正偏差大(右偏),眾數(shù)比均值小,極值大于均值; 小于0表示負(fù)偏差大(左偏)。,計算描述統(tǒng)計量,描述陡峭程度的統(tǒng)計量 峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計量。 峭度為0表示與正態(tài)分布峭度相同。 大于0表示比正態(tài)分布陡,尖峰。 小于0表示比正態(tài)分布緩;平峰。,計算描述統(tǒng)計量,其他統(tǒng)計量 均值標(biāo)準(zhǔn)誤差(S.E means)
6、 中心極限定理認(rèn)為:樣本均值N(u,2/n) 反映樣本均值與總體真值間的平均離散程度 樣本數(shù)越大,樣本均值的離散程度越小,對真值的估計越準(zhǔn)確,計算描述統(tǒng)計量,基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-descripive (2)選擇將參加計算的數(shù)值型變量名到variables框。 僅適用于數(shù)值型變量 分析比較男生和女生的學(xué)習(xí)成績 比較集中趨勢 比較離散趨勢 比較偏斜程度 比較陡峭程度 實(shí)現(xiàn)方式:數(shù)據(jù)拆分,其他功能 數(shù)據(jù)標(biāo)準(zhǔn)化處理 新變量的均值為0,標(biāo)準(zhǔn)差為1; 小于0表示在平均水平下,大于0反之. 正態(tài)分布的數(shù)據(jù)標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布(68%,
7、95%,99%) save standardized values as variables選項(xiàng) 將變量作標(biāo)準(zhǔn)化后,結(jié)果存入名為“Z+原變量名”的新變量中. 數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例 快速找到移動話費(fèi)出眾的客戶 網(wǎng)通集團(tuán)企業(yè)效益評價,計算描述統(tǒng)計量,探索性描述分析,目的:在未知數(shù)據(jù)分布特點(diǎn)情況下,通過計算詳盡描述統(tǒng)計量,輔助全面的統(tǒng)計圖,認(rèn)識數(shù)據(jù)分布。 基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-Explore (2)選擇將參加計算的數(shù)值型變量名到Dependent list框。 (3)進(jìn)行分組描述分析時,將分組變量選入Fact list框 描述統(tǒng)
8、計量: M統(tǒng)計量:集中趨勢的估計值,不受極端值影響。用于判斷有無異常值。,探索性描述分析,相關(guān)圖形 箱線圖 莖葉圖 直方圖 正態(tài)分布圖:檢驗(yàn)變量是否符合正態(tài)分布 方差齊性檢驗(yàn):各組離散程度是否相同 H0:方差相等 舉例:兩班學(xué)生成績分布情況,離散程度是否相同。,交叉分組下的頻數(shù)分析,目的 通過了解不同變量在不同水平下的數(shù)據(jù)分布情況 ,判斷水平對變量是否有影響 例:女生的學(xué)習(xí)成績比男生好嗎?(兩變量) 不同專業(yè)的女生學(xué)習(xí)成績都比男生好嗎? (三變量) 分析的主要步驟 產(chǎn)生交叉列聯(lián)表 分析列聯(lián)表中變量間的關(guān)系 針對定類數(shù)據(jù)和定序數(shù)據(jù)的頻數(shù)分析,產(chǎn)生交叉列聯(lián)表,什么是列聯(lián)表 多個變量在不同取值下的數(shù)
9、據(jù)分布頻數(shù)表,列變量,行變量,工商管理,控制變量,頻數(shù),產(chǎn)生交叉列聯(lián)表,基本操作步驟 (1)菜單選項(xiàng): analyze-descriptive statistics- crosstabs (2)選擇一個變量作為行變量到row框. (3)選擇一個變量作為列變量到column框. (4)可選一個或多個變量作為控制變量到layer框. (5)是否顯示各分組的條圖(display clustered bar charts ),產(chǎn)生交叉列聯(lián)表,定距數(shù)據(jù)可做適當(dāng)分組后再產(chǎn)生列聯(lián)表 僅利用頻數(shù),信息利用不充分 進(jìn)一步計算 cells選項(xiàng):選擇在頻數(shù)分析表中輸出各種百分比. row:行百分比(Row pct)
10、; column:列百分比(Col pct); total:總百分比(Tot pct);,分析列聯(lián)表中變量間的關(guān)系,目的: 通過列聯(lián)表分析,檢驗(yàn)行列變量之間是否獨(dú)立。 方法: 卡方檢驗(yàn):對品質(zhì)數(shù)據(jù)的相關(guān)性進(jìn)行度量(這里兩變量均為定類數(shù)據(jù)或定序數(shù)據(jù)),分析列聯(lián)表中變量間的關(guān)系,卡方檢驗(yàn)基本步驟 (1)H0:行列變量之間無關(guān)聯(lián)或相互獨(dú)立 (2)構(gòu)造卡方統(tǒng)計量 統(tǒng)計量服從(r-1)*(c-1)個自由度的卡方分布 count:觀察(實(shí)際)頻數(shù) expected count:期望頻數(shù) (期望頻數(shù)反映的是H0成立情況下的數(shù)據(jù)分布特征),分析列聯(lián)表中變量間的關(guān)系,卡方檢驗(yàn)基本步驟 (3)計算卡方統(tǒng)計量的值,
11、并得到該統(tǒng)計量值的概率P值 (4)決策。概率P與顯著性水平比較,小于等于則拒絕H0,否則不能拒絕 實(shí)現(xiàn)步驟 statistics選項(xiàng) cells選項(xiàng),分析列聯(lián)表中變量間的關(guān)系,卡方檢驗(yàn)的要求: 一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過20%,否則會夸大卡方值,容易得出拒絕結(jié)論,可以采用精確檢驗(yàn)。 卡方值會受樣本數(shù)的影響 行列變量相關(guān)性的其他測度指標(biāo) Nominal: phi系數(shù):在22列聯(lián)表中 ,通常-1,1,負(fù)號無實(shí)際意義 列聯(lián)C系數(shù)(contingency coefficient), 通常為0,1) V系數(shù) 0,1 值越大表示行列變量的相關(guān)性越大,分析列聯(lián)表中變量間的關(guān)系,Ordina
12、l 反映定序變量一致性指標(biāo) 行變量等級越高,列變量等級也越高或越低一致性高 行變量等級越高,列變量等級不定不一致 指標(biāo)絕對值越大越相關(guān),越接近0越無關(guān),定序變量一致性檢驗(yàn),年齡與工資收入交叉列聯(lián)表 低 中 高 青 400 0 0 中 0 500 0 老0 0 600 低 中 高 青 0 0 500 中 0 6000 老 400 0 0,一致,一致,應(yīng)用舉例,不同行業(yè)大客戶的價值一致嗎? 受教育程度越高通信支出比例越高嗎? 離網(wǎng)客戶和在網(wǎng)客戶的通話類型結(jié)構(gòu)一致嗎?,多選項(xiàng)分析,什么是多選項(xiàng)問題? (1)即:在回答某些問題時,答案在兩個以上 例如:請問您平時主要的休閑娛樂方式是: a.看電視、聽廣
13、播b.玩游戲c.體育運(yùn)動d.逛街購物e.經(jīng)常去港澳游玩f.看書學(xué)習(xí) g.喝酒聊天h.工作太忙,沒時間休閑娛樂 又如:您經(jīng)常瀏覽的網(wǎng)站?在下列品牌中您信任哪些品牌? (2)多選項(xiàng)問題不能直接處理。因?yàn)镾PSS中的一個變量對每一個答案只能取一個值。,多選項(xiàng)分析,多選項(xiàng)問題的處理方法 (1)思路: 將一個問題定義成幾個變量,用這幾個變量來描述該問題的幾個可能被選擇的答案。 分別做頻數(shù)分析或交叉分組下的頻數(shù)分析 (2)方法: 多選項(xiàng)二分法(multiple dichotomies method)和多選項(xiàng)分類法(multiple category method) 普通頻數(shù)分析和交叉分組下的頻數(shù)分析,多選
14、項(xiàng)分析,多選項(xiàng)二分法 將每個答案作為一個變量,每個變量只有兩個取值(0或1)。 例如:,多選項(xiàng)分析,多選項(xiàng)分類法: 預(yù)先估計多選項(xiàng)問題可能被選擇的最多答案數(shù).為每個答案建立一個變量,取值為多選項(xiàng)問題的可選答案. 例如:最多可選三個學(xué)校,多選項(xiàng)分析,多選項(xiàng)分析的基本思路 定義多選項(xiàng)變量集 多選項(xiàng)頻數(shù)分析 多選項(xiàng)交叉分組下的頻數(shù)分析,多選項(xiàng)分析,定義多選項(xiàng)變量集 目的:將已分解的變量定義為一個集合,便于進(jìn)行多選項(xiàng)分析 菜單選項(xiàng):analyze-multiple response-define sets 從原變量中選取被分解的變量(數(shù)值型)到variables in sets框 指定被分解的變量是按
15、多選項(xiàng)二分法(dichotomies)分解還是按多選項(xiàng)分類法(categories)分解的. 為變量集命名。系統(tǒng)自動在名字前加字符$.,多選項(xiàng)分析,多選項(xiàng)頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-frequencies 選擇待分析的多選項(xiàng)變量集到tables for 框。 缺失數(shù)據(jù)處理:只要有一個變量含有缺失值就將該個案剔除 exclude cases list wise within dichotomies:只用于二分變量多項(xiàng)選擇的分析。 exclude cases list wise within categories:只用于分類變量多項(xiàng)選擇的分析。,多選項(xiàng)分
16、析,多選項(xiàng)交叉分析下的頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-crosstabs 選擇行變量并定義取值范圍 選擇列變量并定義取值范圍 選擇控制變量并定義取值范圍 其他選項(xiàng) 常用分析指標(biāo): 應(yīng)答人數(shù)百分比(percent of cases):選擇該項(xiàng)的人占總?cè)藬?shù)的比例(較大) 應(yīng)答次數(shù)百分比(percent of responses):選擇該項(xiàng)的次數(shù)占總應(yīng)答次數(shù)的比例(較?。?多選項(xiàng)分析,多選項(xiàng)分析實(shí)例 在某次市場調(diào)查中收集了北京、上海和廣州三個城市的受訪者對幾種常見飲料的喜好情況,可選的飲料有茶、牛奶、咖啡、果汁、礦泉水。(數(shù)據(jù)是從原始數(shù)據(jù)庫中抽出的一小部分資料
17、),作以下分析: 采用二分法組織數(shù)據(jù) 受訪人群中最受歡迎的飲料是哪種? 男、女喜愛的飲料有無差異? 三個城市的人群對飲料的喜好有無差異? 不同學(xué)歷的消費(fèi)者休閑方式有無差異?,統(tǒng)計圖形的種類及用途,用于顯示頻數(shù)分布: ( Line和Area也能作,但不很適合) Bar( 不僅僅用于) Pie: Histogram: Boxplot: Error Bar:顯示總體分布 用于判斷數(shù)據(jù)分布 P-P圖 Q-Q圖,統(tǒng)計圖形的種類及用途,用于時間序列 Line Area Bar: High-low:類似K線圖 用于觀察數(shù)量變量之間關(guān)系 scatter,統(tǒng)計圖形的種類及用途,用于數(shù)據(jù)分析 Pareto分析重要
18、因素 Control分析數(shù)據(jù)變異 統(tǒng)計圖形在SPSS中分為一般統(tǒng)計圖和交互式統(tǒng)計圖,條形圖,其他匯總方式的條圖:各科成績的均值、各省份移動收入比例 復(fù)式條圖和堆積條圖:兩班男女生成績均值,統(tǒng)計圖的編輯,雙擊圖形進(jìn)入編輯狀態(tài) 圖形的轉(zhuǎn)換:Gallery- 條圖、線圖、面積圖和餅圖之間可互相轉(zhuǎn)換 散點(diǎn)圖和直方圖之間可互相轉(zhuǎn)換 2、圖形的設(shè)置:Chart-options 適用于復(fù)式和堆積圖,統(tǒng)計圖的編輯,3、圖形坐標(biāo)設(shè)置Chart-Axis Scale Axis:條圖、線圖、面積圖中的縱軸,散點(diǎn)圖、直方圖中的縱軸和橫軸 Categeries:條圖、線圖、面積圖中的橫軸 4、圖形格式設(shè)置Fomat- 注:需選中相應(yīng)的元素,散點(diǎn)圖,1、簡單散點(diǎn)圖:用于觀察兩變量之間關(guān)系 收入增長率與業(yè)務(wù)滲透率、GDP之間關(guān)系 2、矩陣散點(diǎn)圖:用于觀察多變量之間的兩兩關(guān)系 n X n矩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030中國電腦清洗劑行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展報告
- 2025至2030中國電拋光鋼行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國電子游戲廣告行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國甲基丙烯酸二甲氨基乙酯行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國珠寶首飾行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2025至2030中國現(xiàn)場和非現(xiàn)場自動取款機(jī)行業(yè)市場占有率及投資前景評估規(guī)劃報告
- 2025至2030中國特種紙行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 2025至2030中國特殊砂漿行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 填充墻砌體培訓(xùn)課件
- 教育科技的研發(fā)與應(yīng)用評價研究
- 2025屆高考政治復(fù)習(xí)重點(diǎn)知識大全(全7冊)
- 電梯公告板制度
- 餐飲內(nèi)部考核管理制度
- 2024年山東滕州市屬國有企業(yè)第三批次招聘120人筆試參考題庫附帶答案詳解
- 中科曙光2025測評
- 酒吧股東合伙協(xié)議書
- 臥床病人康復(fù)鍛煉課件
- 兒科換錯藥護(hù)理不良事件
- 糖尿病管理工作制度
- 2025年初級等保測評試題及答案
- 05G525吊車軌道圖集05G525
評論
0/150
提交評論