SPSS數(shù)據(jù)的基本統(tǒng)計分析_第1頁
SPSS數(shù)據(jù)的基本統(tǒng)計分析_第2頁
SPSS數(shù)據(jù)的基本統(tǒng)計分析_第3頁
SPSS數(shù)據(jù)的基本統(tǒng)計分析_第4頁
SPSS數(shù)據(jù)的基本統(tǒng)計分析_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、SPSSSPSS基本統(tǒng)計分析基本統(tǒng)計分析單變量的頻數(shù)分析單變量的基本描述統(tǒng)計量的計算多變量的交叉頻數(shù)表的編制和分析探索性分析數(shù)據(jù)的多選項分析通過頻數(shù)分析能夠了解變量取值的狀況,把握數(shù)據(jù)的分布特征,能反映樣本是否具有總體代表性,抽樣是否存在系統(tǒng)偏差等。u(1)程序:分析(analyze)-描述統(tǒng)計(descriptive)-頻數(shù)(frequency)u(2)選擇一個或多個頻數(shù)分析變量放進變量框中u(3)選中右下角顯示頻數(shù)表格u(4)點擊統(tǒng)計量、圖表、格式依次進行設(shè)置源變量框源變量框待分析變量待分析變量要求輸出頻數(shù)分析表格要求輸出頻數(shù)分析表格選擇統(tǒng)計量選擇統(tǒng)計量選擇圖表選擇圖表選擇輸出格式選擇輸出

2、格式 制作頻數(shù)分布表(頻數(shù)、百分比):以表格形式呈現(xiàn)各個數(shù)據(jù)的次數(shù)分布情況,包括頻數(shù)、百分比,有效百分比、累計百分比。 百分位百分位數(shù)選項數(shù)選項第第2525、5050、7575個百分個百分位數(shù)點對位數(shù)點對應(yīng)的變量應(yīng)的變量值值把數(shù)值平均把數(shù)值平均分為分為n n份,每份,每個等分位點個等分位點對應(yīng)的變量對應(yīng)的變量值值(2n1002n100)指定輸出指定輸出多個百分多個百分位數(shù)位數(shù)數(shù)據(jù)分布形態(tài)的偏數(shù)據(jù)分布形態(tài)的偏斜度和方向斜度和方向數(shù)據(jù)分布形態(tài)的陡數(shù)據(jù)分布形態(tài)的陡緩程度緩程度離散離散趨勢趨勢測量測量集中趨勢測量集中趨勢測量對于分組數(shù)據(jù),計算百分位數(shù)值對于分組數(shù)據(jù),計算百分位數(shù)值和中位數(shù)時,用各組的組

3、中值代和中位數(shù)時,用各組的組中值代表各組數(shù)據(jù)。表各組數(shù)據(jù)。分位數(shù)是變量在不同分位點上的取值,從一個側(cè)面清楚地刻畫了變量的取值分布狀態(tài)。分位數(shù)差是一種描述數(shù)據(jù)離散程度的方式。分位數(shù)差越大,表示數(shù)據(jù)在相應(yīng)分位段上的離散程度越大。 是描述某變量所有取值的分布形態(tài)陡緩程度的統(tǒng)計量,是描述某變量所有取值的分布形態(tài)陡緩程度的統(tǒng)計量,而峰度對陡緩程度的度量是與正態(tài)分布進行比較的結(jié)果。如果峰度等于而峰度對陡緩程度的度量是與正態(tài)分布進行比較的結(jié)果。如果峰度等于0 0 ,其數(shù)據(jù)分布的陡緩程度與正態(tài)分布相同;峰度大于其數(shù)據(jù)分布的陡緩程度與正態(tài)分布相同;峰度大于0 0,其數(shù)據(jù)分布比正態(tài)分布,其數(shù)據(jù)分布比正態(tài)分布更陡峭

4、;峰度小于更陡峭;峰度小于0 0,其數(shù)據(jù)分布比正態(tài)分布更平坦,其數(shù)據(jù)分布比正態(tài)分布更平坦。是描述數(shù)據(jù)分布對稱性的統(tǒng)計量,而且也是與正態(tài)分布的是描述數(shù)據(jù)分布對稱性的統(tǒng)計量,而且也是與正態(tài)分布的對稱性相比較而得到的。如果分布的偏度等于對稱性相比較而得到的。如果分布的偏度等于0 0 ,則其數(shù)據(jù)分布的對稱性與,則其數(shù)據(jù)分布的對稱性與正態(tài)分布相同;如果偏度大于正態(tài)分布相同;如果偏度大于0 0,則其分布為正偏或右偏;如果偏度小于,則其分布為正偏或右偏;如果偏度小于0 0,則為負(fù)偏或左偏。則為負(fù)偏或左偏。集中趨勢Central tendency (一組數(shù)據(jù)向某一中心靠攏的傾向)離散趨勢Dispersion(

5、一組數(shù)據(jù)遠(yuǎn)離其中心值的程度)定類眾數(shù)Mode異眾比率V定序中位數(shù)Median四分位差Quartiles定距 定比均值Mean全距 Range方差 Variance標(biāo)準(zhǔn)差Std.deviant不同等級的變量描述性指標(biāo)不同等級的變量描述性指標(biāo)均值:均值:某變量所有取值的平均水平,其大小易受到數(shù)據(jù)中極端值的影響。眾數(shù)眾數(shù)Mode:是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)。中位數(shù)中位數(shù)Median:一組數(shù)據(jù)按升序排序后處于中間位置的數(shù)據(jù)。均值標(biāo)準(zhǔn)誤差:均值標(biāo)準(zhǔn)誤差:是描述樣本均值與總體均值之間差異程度的統(tǒng)計量。標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差:反映變量取值距離均值的平均離散程度。其值越大,變量間的差異越大。方差:方差:是標(biāo)準(zhǔn)差的

6、平方,反映變量取值離散程度。其值越大,變量間的差異越大。全距全距range:也稱為極差,是數(shù)據(jù)最大值與最小值之間的絕對差,也是反映變量取值的離散程度。是用矩形的面積來表示頻數(shù)分布變化的圖形。適用于連續(xù)性數(shù)據(jù),適用于連續(xù)性數(shù)據(jù),即:定距數(shù)據(jù)適用于離散型數(shù)據(jù),適用于離散型數(shù)據(jù),即定序、定類和分組后的定距數(shù)據(jù)。其中,條形圖(bar chart)是用寬度相同的條形的高度或長短來表示頻數(shù)分布變化的圖形;餅圖(pie chart)是用圓形或圓內(nèi)扇形的面積來表示頻數(shù)分布變化的圖形。不輸出任何圖形不輸出任何圖形輸出條形圖輸出條形圖輸出餅圖輸出餅圖直方圖直方圖輸出正態(tài)分布曲線輸出正態(tài)分布曲線居民儲蓄調(diào)查數(shù)據(jù)居民

7、儲蓄調(diào)查數(shù)據(jù)分析儲戶的戶口和職業(yè)的基本情況;分析儲戶一次存(?。┛罱痤~的分布,并對城鎮(zhèn)儲戶和農(nóng)村儲戶進行分析比較。目標(biāo)一:被調(diào)查者的戶口和職業(yè)情況的頻數(shù)分布表和統(tǒng)計圖目標(biāo)一:被調(diào)查者的戶口和職業(yè)情況的頻數(shù)分布表和統(tǒng)計圖分析儲戶一次存(取)款金額的分布,并對城鎮(zhèn)儲戶和農(nóng)村儲戶進行分析比較。分析思路:分析思路:由于存(?。┛罱痤~屬于定距型變量,直接采用頻數(shù)分析不利于對分布形態(tài)的把握。 運用數(shù)據(jù)預(yù)處理中的數(shù)據(jù)分組功能對數(shù)據(jù)分組后再編制頻數(shù)分布表。如:將(?。┛罱痤~重新分成5組:少于500元、500-2000、2000-3500、3500-5000、5000以上。對比城鎮(zhèn)儲戶和農(nóng)村儲戶情況,可采用數(shù)據(jù)

8、預(yù)處理中的數(shù)據(jù)拆分并計算樣本存(取)款金額的四分位數(shù)、峰度、偏度等。儲戶一次存(?。┛罱痤~的分布情況:儲戶一次存(?。┛罱痤~的分布情況:被調(diào)查者有近一半的儲戶一次存取款金額在500元以下,2000-3500元的最少。從圖形看來,儲戶的存(?。┛罱痤~呈明顯的右偏分布,即一次存取款金額偏低的占較大比例,也有少數(shù)金額偏高的儲戶。城鎮(zhèn)和農(nóng)村居民儲戶一次存(?。┛罱痤~的比較:城鎮(zhèn)和農(nóng)村居民儲戶一次存(取)款金額的比較:從均值以及四分位數(shù)差可以看出城鎮(zhèn)儲戶存取款金額的離散度大于農(nóng)村儲戶(尤其在高金額區(qū)),且城鎮(zhèn)儲戶的存取款金額高于農(nóng)村儲戶。一是刻畫集中趨勢的描述統(tǒng)計量;二是刻畫離散程度的描述統(tǒng)計量;三是刻

9、畫分布形態(tài)的描述統(tǒng)計量。通過以上三類統(tǒng)計量能較為準(zhǔn)確地把握數(shù)據(jù)的分布特點。 (1)程序:分析(analyze)-描述統(tǒng)計(descriptive statistics)-描述(descriptive) (2)選擇要描述的一個或多個數(shù)值型變量 (3)點擊選項按鈕,做二級對話框設(shè)置 (4)選中右下角標(biāo)準(zhǔn)化得分保存為變量可將數(shù)據(jù)標(biāo)準(zhǔn)化后的取值保存到數(shù)據(jù)文檔中。對數(shù)據(jù)標(biāo)準(zhǔn)化對數(shù)據(jù)標(biāo)準(zhǔn)化 ,并作,并作為新變量保存在文件中。為新變量保存在文件中。uxiiZ居民儲蓄調(diào)查數(shù)據(jù)居民儲蓄調(diào)查數(shù)據(jù)計算存(?。┛罱痤~的基本描述統(tǒng)計量,并分別對城鎮(zhèn)儲戶和農(nóng)村儲戶進行比較;分析儲戶一次存(?。┛罱痤~的數(shù)量是否存在不均衡現(xiàn)

10、象。城鎮(zhèn)儲戶的平均存取款金額(2687.2)高于農(nóng)村儲戶(1944.97);從標(biāo)準(zhǔn)差及全距可看出,城鎮(zhèn)儲戶存取款金額的離散程度低于農(nóng)村儲戶。從峰度和偏度看來,城鎮(zhèn)和農(nóng)村儲戶存取款金額的分布均呈現(xiàn)右偏和尖峰分布,只是農(nóng)村儲戶右偏斜程度及尖峰程度更大;總體而言,城鎮(zhèn)儲戶和農(nóng)村儲戶中的大部分人一次存取款金額都低于平均水平,且農(nóng)村儲戶表現(xiàn)得更為明顯。分析儲戶一次存(取)款金額的數(shù)量是否存在不均衡現(xiàn)象是否存在不均衡現(xiàn)象, 可以從分析金額是入手。一般而言,若儲戶存取款金額服從正態(tài)分布,那么根據(jù)3準(zhǔn)則(3個標(biāo)準(zhǔn)差準(zhǔn)則),異常值通常為3個標(biāo)準(zhǔn)差之外的變量值??赏ㄟ^數(shù)據(jù)的標(biāo)準(zhǔn)化處理來判斷。(先標(biāo)準(zhǔn)化,再依據(jù)標(biāo)準(zhǔn)

11、化值分組,后用頻數(shù)分析)從頻數(shù)分析可得,低異常組占比0%,高異常組占比2.6%。一般認(rèn)為異常組的總比例大于理論值0.3%,可以認(rèn)為存取款金額存在一定的不均衡現(xiàn)象。主要包括兩大基本任兩大基本任務(wù)務(wù):根據(jù)收集到樣本數(shù)據(jù)產(chǎn)生交叉列聯(lián)表;在交叉列聯(lián)表的基礎(chǔ)上,對兩兩變量間是否存在一定的相關(guān)性進行分析。是兩個或兩個以上的變量交叉分組后形成的頻數(shù)分布表。分析(analyze)-描述統(tǒng)計(descriptive statistics)-交叉表(cross table)行變量(自變量)的選取行變量(自變量)的選取列變量(因變量)的選取列變量(因變量)的選取顯示每組變量的條形分類圖顯示每組變量的條形分類圖相關(guān)統(tǒng)

12、計量的相關(guān)統(tǒng)計量的計算計算輸出表格的形式輸出表格的形式表格排列順序表格排列順序分層變量(控制變量)的選取分層變量(控制變量)的選取不輸出列聯(lián)表不輸出列聯(lián)表測量級別相關(guān)系數(shù)取值范圍PRE意義檢驗方法SPSS程序類-類(類-序)0.12 crosstabs序-序G/ rs-1.1G/rs2T檢驗Crosstabs/correlation類序-距(3)E/E20.1E2F檢驗crosstabs/Oneway/means距-距r-1.1r2T檢驗crosstabs/correlation/linear相關(guān)分析的概念相關(guān)分析的概念定類變量定類變量定序變量定序變量E E系數(shù)系數(shù)類距類距G相關(guān)相關(guān)進行分層卡

13、方檢驗進行分層卡方檢驗得到相對風(fēng)險測評的得到相對風(fēng)險測評的OROR值值選中進行配對卡方檢驗選中進行配對卡方檢驗一致性檢驗。(行列變量的數(shù)目相一致性檢驗。(行列變量的數(shù)目相同)同)當(dāng)KappaKappa0.750.75時,表明兩者一致性較好;0.750.75Kappa Kappa 0.40.4時,表明一致性一般;KappaKappa2000時,結(jié)果以kolmogorov-smimov 為準(zhǔn)。測量級別相關(guān)系數(shù)取值范圍PRE意義檢驗方法SPSS程序類-類(類-序)0.12 crosstabs序-序G/ rs-1.1G/rs2T檢驗Crosstabs/correlation類序-距(3)E/E20.1

14、E2F檢驗crosstabs/Oneway/means距-距r-1.1r2T檢驗crosstabs/correlation/linear相關(guān)分析的要點:相關(guān)方向、相關(guān)程度及線性與否PearsonPearson簡單相關(guān)系數(shù):用來度量簡單相關(guān)系數(shù):用來度量型變量間的線性相關(guān)關(guān)系。型變量間的線性相關(guān)關(guān)系。顯示相應(yīng)顯著度水平顯示相應(yīng)顯著度水平Kendall Kendall 相關(guān)系數(shù):采用非參數(shù)檢驗方相關(guān)系數(shù):采用非參數(shù)檢驗方法度量法度量型變量間的線性相關(guān)關(guān)系。型變量間的線性相關(guān)關(guān)系。SpearmanSpearman等級相關(guān)系數(shù):用來度量等級相關(guān)系數(shù):用來度量型變量間的線性相關(guān)關(guān)系。型變量間的線性相關(guān)關(guān)

15、系。6.1 6.1 兩個變量間的相關(guān)性分析兩個變量間的相關(guān)性分析程序:程序:分析(analyze)相關(guān)(correlate)雙變量(bivariate)剔除正在參與運算的2個變量值是缺失值的觀測量剔除所有參與運算變量中帶有缺失值的觀測量 高??蒲醒芯繑?shù)據(jù)資料搜集了1999年31個省市自治區(qū)部分高校有關(guān)社科研究的數(shù)據(jù)。研究立項課題數(shù)(當(dāng)年)、與投入的具有高級職稱的人數(shù)(上年) 、發(fā)表論文數(shù)(上年)是否有較強的線性關(guān)系;在5%的水平下,當(dāng)年的立項課題總數(shù)將受到上年投入高級職稱的人數(shù)、論文數(shù)的正向影響運用居民存取款數(shù)據(jù)分析不同年齡段與收入水平的相關(guān)關(guān)系。在5%的水平下,收入水平會隨著年齡的增長而增長(二者有較弱的正向相關(guān)關(guān)系)問題:相關(guān)系數(shù)本身未必是兩事物間線性相關(guān)強弱的正式體現(xiàn),往往有夸大的趨勢。6.2 6.2 兩個變量間的偏相關(guān)性分析兩個變量間的偏相關(guān)性分析又稱為凈相關(guān)分析凈相關(guān)分析,它是在控制其他

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論