社會(huì)調(diào)查方法(第2版)教學(xué)課件6_第1頁
社會(huì)調(diào)查方法(第2版)教學(xué)課件6_第2頁
社會(huì)調(diào)查方法(第2版)教學(xué)課件6_第3頁
社會(huì)調(diào)查方法(第2版)教學(xué)課件6_第4頁
社會(huì)調(diào)查方法(第2版)教學(xué)課件6_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

項(xiàng)目八調(diào)查資料統(tǒng)計(jì)與分析項(xiàng)目八調(diào)查資料統(tǒng)計(jì)與分析1目錄任務(wù)一單變量描述統(tǒng)計(jì)A任務(wù)二單變量推論統(tǒng)計(jì)B任務(wù)三雙變量相關(guān)分析C目錄任務(wù)一單變量描述統(tǒng)計(jì)A任務(wù)二單變量推論統(tǒng)計(jì)B任務(wù)三2任務(wù)一單變量描述統(tǒng)計(jì)單變量描述統(tǒng)計(jì)分析的目的在于用比較簡潔的數(shù)據(jù)反映大量數(shù)據(jù)資料中所包含的基本信息。其基本方法包括變量的頻次分布與頻率分布、集中趨勢與離散趨勢分析等。01任務(wù)一單變量描述統(tǒng)計(jì)單變量描述統(tǒng)計(jì)分析的目的在于用比較簡潔一、頻次分布與頻率分布統(tǒng)計(jì)表統(tǒng)計(jì)圖頻次分布反映的是變量每個(gè)取值出現(xiàn)的次數(shù)。適用于定類變量和定序變量的描述。頻次分布頻率分布反映的是變量每個(gè)取值的次數(shù)在全部個(gè)案數(shù)中所占的比例。頻率分布一、頻次分布與頻率分布統(tǒng)計(jì)表統(tǒng)計(jì)圖頻次分布反映的是變量每個(gè)取4統(tǒng)計(jì)表統(tǒng)計(jì)表5條形圖統(tǒng)計(jì)圖餅形圖條統(tǒng)計(jì)圖餅6集中趨勢分析是指用典型值或代表值來反映一組數(shù)據(jù)的一般水平,也即反映這組數(shù)據(jù)向這個(gè)典型值或代表值集中的情況。集中趨勢分析常用表示集中程度的統(tǒng)計(jì)量數(shù)(即集中量數(shù))來表示,這些集中量數(shù)主要有眾數(shù)、中位數(shù)和平均數(shù)(也稱均值)等。二、集中趨勢分析二、集中趨勢分析7眾數(shù)眾數(shù)是變量所有取值中出現(xiàn)次數(shù)最多的那個(gè)取值。從理論上講,眾數(shù)這一統(tǒng)計(jì)量數(shù)可應(yīng)用于所有測量尺度,但在實(shí)際操作中,一般只用于定類測量和定序測量。舉例:指出表8-4中的眾數(shù)眾數(shù)8中位數(shù)中位數(shù)是指把變量的取值按照大小或高低順序排列起來,位于中間位置上的那個(gè)取值。它可以應(yīng)用于定序尺度以上層次的測量。其基本含義是:在整個(gè)數(shù)據(jù)中,有一半個(gè)案的數(shù)據(jù)值在它之上,另一半個(gè)案的數(shù)據(jù)值在它之下。舉例一:指出表8-6中的中位數(shù)中位數(shù)9表8-5所給出的是組距分組資料。在組距分組資料中,首先需要計(jì)算出全部數(shù)據(jù)的中間位置,并找到中間位置所對(duì)應(yīng)的數(shù)據(jù)組,然后可以根據(jù)下限公式求中位數(shù)。L為中位數(shù)所在組的下限值,fm為中位數(shù)所在組的頻數(shù),i為中位數(shù)所在組的組距,為各組所對(duì)應(yīng)的頻數(shù),cf為比中位數(shù)所在組的數(shù)值小的所有組的累計(jì)頻數(shù),U代表上限值。舉例二:指出表8-5中的中位數(shù)表8-5所給出的是組距分組資料。舉例二:指出表8-5中的中位10社會(huì)調(diào)查方法(第2版)教學(xué)課件611平均數(shù)平均數(shù)是指各單位數(shù)值之和除以單位總數(shù)目所得的商,一般用表示樣本平均數(shù)。平均數(shù)用于反映一組定比測量數(shù)據(jù)的平均水平,與眾數(shù)、中位數(shù)這兩個(gè)集中量數(shù)相比,平均數(shù)的計(jì)算要用到變量的所有取值,因而,它對(duì)資料的利用率是最高的,但是平均數(shù)的大小往往容易受到極值的影響,而且,如果當(dāng)分組中存在開區(qū)間組時(shí),無法計(jì)算平均值。平均數(shù)12平均數(shù)的計(jì)算公式,因資料形式的不同而不同適用于原始數(shù)據(jù)適用于單值分組資料適用于組距分組資料平均數(shù)的計(jì)算公式,因資料形式的不同而不同適用于原始數(shù)據(jù)適用13舉例:求表8-5、8-6中的平均數(shù)舉例:求表8-5、8-6中的平均數(shù)14離散趨勢分析就是用表示離散程度的統(tǒng)計(jì)量(即離散量數(shù))來反映一組數(shù)據(jù)的各個(gè)數(shù)值距離它的代表值的差異程度。離散量數(shù)越大,說明典型值的代表性越差;離散量數(shù)越小,說明典型值的代表性越好。常用的離散趨勢統(tǒng)計(jì)量有異眾比率、四分位差、全距、標(biāo)準(zhǔn)差、離散系數(shù)等。三、離散趨勢分析三、離散趨勢分析15異眾比率異眾比率是指非眾數(shù)次數(shù)與總體全部次數(shù)之比。異眾比率適用于定類測量,用于補(bǔ)充說明眾數(shù)的代表性。異眾比率越小,說明眾數(shù)的代表性越好;異眾比率越大,說明眾數(shù)的代表性越差。異眾比率16四分位差四分位差Q是指舍去一組數(shù)據(jù)中最大和最小的1/4,只計(jì)算中央1/2的資料中的最大值與最小值之差。四分位差適用于定序尺度以上測量,用于補(bǔ)充說明中位數(shù)的代表性。四分位差越小,說明中位數(shù)的代表性越好;四分位差越大,說明中位數(shù)的代表性越差。四分位差的大小不受極值的影響,因而當(dāng)一組數(shù)據(jù)中出現(xiàn)極值比較小或比較大的情況時(shí),可以考慮用四分位差來衡量其離散程度。四分位差17舉例:求表8-8中的四分位數(shù)舉例:求表8-8中的四分位數(shù)18全距全距,也稱極差,是指一組數(shù)據(jù)中最大值與最小值之差。全距越小,表明集中量數(shù)的代表性越好;全距越大,表明集中量數(shù)的代表性越差。全距19標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是指一組數(shù)據(jù)中的各個(gè)數(shù)值與這組數(shù)據(jù)的平均值之差的平方和除以該組數(shù)據(jù)個(gè)數(shù)所得的值的平方根。標(biāo)準(zhǔn)差適用于定距和定比測量,用于補(bǔ)充說明均值的代表性。標(biāo)準(zhǔn)差越小,表明均值的代表性越好;標(biāo)準(zhǔn)差越大,表明均值的代表性越差。標(biāo)準(zhǔn)差20標(biāo)準(zhǔn)差的計(jì)算公式,因資料形式的不同而不同適用于原始數(shù)據(jù)適用于組距分組資料適用于單值分組資料標(biāo)準(zhǔn)差的計(jì)算公式,因資料形式的不同而不同適用于原始數(shù)據(jù)適用21離散系數(shù)離散系數(shù),又叫變差系數(shù),是指標(biāo)準(zhǔn)差與平均數(shù)的比值,常用百分比表示。這是一種不帶單位的表示離散程度的統(tǒng)計(jì)量,可用于對(duì)同一總體中兩種不同單位的離散量數(shù)或不同總體中同一離散量數(shù)進(jìn)行比較。離散系數(shù)22【實(shí)作訓(xùn)練】

利用《昆明市低保制度實(shí)施狀況調(diào)查》SPSS數(shù)據(jù)文件(截取了232個(gè)個(gè)案的信息),學(xué)習(xí)如何通過SPSS生成頻數(shù)分布和頻率分布表以及求集中量數(shù)和離散量數(shù)。【實(shí)作訓(xùn)練】23操作過程:依次單擊分析(A)→描述統(tǒng)計(jì)→123頻率(F)…,此時(shí)會(huì)出現(xiàn)“頻率(F)”對(duì)話框,將變量“性別”從左邊的變量名列表中選入右邊的“變量(V)”框中,點(diǎn)擊“確定”按鈕即可。操作一:利用SPSS作“性別”這一變量的頻數(shù)分布和頻率分布表操作過程:操作一:利用SPSS作“性別”這一變量的頻數(shù)分布和24操作過程:第一步:依次單擊分析(A)→描述統(tǒng)計(jì)→123頻率(F)…,此時(shí)會(huì)出現(xiàn)“頻率(F)”對(duì)話框,將變量“年齡”從左邊的變量名列表中選入右邊的“變量(V)”框中,并單擊“顯示頻率表格(D)”,取消該選項(xiàng)。操作二:利用SPSS求集中量數(shù)和離散量數(shù)操作過程:操作二:利用SPSS求集中量數(shù)和離散量數(shù)25第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)…”按鈕,打開“頻率:統(tǒng)計(jì)量”對(duì)話框,在“百分位值”選項(xiàng)框中選中“四分位(Q)”,在“集中趨勢”選項(xiàng)框中選中“均值(M)”和“中位數(shù)”,在“離散”選項(xiàng)框中選中“標(biāo)準(zhǔn)差(T)”,點(diǎn)擊“繼續(xù)”按鈕,再點(diǎn)擊“確定”按鈕即可。第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)…”按鈕,打開“頻率:統(tǒng)計(jì)量”對(duì)話26注意事項(xiàng):1.選擇統(tǒng)計(jì)量之前,應(yīng)當(dāng)分析待統(tǒng)計(jì)的變量用的是哪種測量尺度。因?yàn)椴煌慕y(tǒng)計(jì)量對(duì)測量尺度有不同的要求。2.一般只顯示定類測量和定序測量的頻數(shù)和頻率分布表,定距測量和定比測量一般不顯示頻數(shù)和頻率分布表。3.離散系數(shù)并不能在SPSS中直接求出,但可以利用SPSS求出均值和標(biāo)準(zhǔn)差,在此基礎(chǔ)上再計(jì)算離散系數(shù)就不難了。4.同樣的統(tǒng)計(jì)目標(biāo)有可能通過不同統(tǒng)計(jì)方法得到。比如,操作二(利用SPSS求集中量數(shù)和離散量數(shù)),也可依次點(diǎn)擊“分析(A)→描述統(tǒng)計(jì)→描述(D)…”,在“描述性”對(duì)話框中選擇相應(yīng)的統(tǒng)計(jì)量。注意事項(xiàng):27任務(wù)二單變量推論統(tǒng)計(jì)推論統(tǒng)計(jì)是指用樣本的統(tǒng)計(jì)值去推估總體相應(yīng)的參數(shù)值。單變量推論統(tǒng)計(jì)分析的目的在于通過對(duì)樣本資料的分析,去把握總體的特征。推論統(tǒng)計(jì)分為參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩大類。任務(wù)二單變量推論統(tǒng)計(jì)推論統(tǒng)計(jì)是指用樣本的統(tǒng)計(jì)值去推估總體28參數(shù)估計(jì)點(diǎn)估計(jì):用一個(gè)最適當(dāng)?shù)臉颖窘y(tǒng)計(jì)值代表總體的參數(shù)值。區(qū)間估計(jì):以兩個(gè)數(shù)值之間的間距去推估總體參數(shù)值的范圍(區(qū)間)。假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是指先對(duì)總體的某一參數(shù)作出某種假設(shè)(即虛無假設(shè)或原假設(shè)),再根據(jù)樣本觀察的數(shù)據(jù)去檢驗(yàn)原假設(shè)是否正確。參數(shù)估計(jì)點(diǎn)估計(jì):用一個(gè)最適當(dāng)?shù)臉颖窘y(tǒng)計(jì)值代表總體的參數(shù)值。假29區(qū)間估計(jì)是指以兩個(gè)數(shù)值之間的間距去推估總體參數(shù)值的范圍(區(qū)間)。區(qū)間的大小取決于研究者估計(jì)時(shí)所要求的置信度的高低,在其他條件不變的情況下,所要求的置信度越高,則區(qū)間越大;所要求的置信度越低,則區(qū)間越小。總體均值的置信區(qū)間和總體百分比的置信區(qū)間計(jì)算公式:一、區(qū)間估計(jì)一、區(qū)間估計(jì)30舉例:求總體均值和總體百分比的置信區(qū)間例一:一次調(diào)查所得到的樣本統(tǒng)計(jì)值如下:平均年齡為43.51歲,標(biāo)準(zhǔn)差為12.427歲,樣本量為232人。求置信度為95%時(shí)總體平均年齡的置信區(qū)間。請(qǐng)注意:要保證取兩位小數(shù)以后,置信水平不因此而降低,就只能擴(kuò)大而不是縮小取小數(shù)前的區(qū)間,因而這里不能采用四舍五入的方法,而應(yīng)當(dāng)采用下限直接截取兩位小數(shù),舍去后面的小數(shù);上限則只要第二位小數(shù)后的小數(shù)不為0,就進(jìn)1的取數(shù)方法。舉例:求總體均值和總體百分比的置信區(qū)間請(qǐng)注意:要保證取兩位小31例二:一次調(diào)查所得到的樣本統(tǒng)計(jì)值如下:男性占47.8%,樣本容量為232人。求置信度為99%時(shí)總體中男性所占百分比的置信區(qū)間。例二:一次調(diào)查所得到的樣本統(tǒng)計(jì)值如下:男性占47.8%,樣32假設(shè)檢驗(yàn)是指先對(duì)總體的某一參數(shù)作出某種假設(shè)(即虛無假設(shè)或原假設(shè)),再根據(jù)樣本觀察的數(shù)據(jù)去檢驗(yàn)原假設(shè)是否正確,以決定是接受還是拒絕原假設(shè)。如果檢驗(yàn)統(tǒng)計(jì)量大于等于臨界值(或檢驗(yàn)統(tǒng)計(jì)量的相伴概率小于等于給定的顯著水平),則拒絕原假設(shè)。其理論依據(jù)是概率論中的小概率原理,該原理認(rèn)為小概率事件在一次觀察中是不可能出現(xiàn)的。二、假設(shè)檢驗(yàn)二、假設(shè)檢驗(yàn)33總體均值和總體百分比的假設(shè)檢驗(yàn)一般步驟(以Z檢驗(yàn)法為例):總體均值和總體百分比的假設(shè)檢驗(yàn)34假設(shè)檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式適用于大樣本(n≥30)下的總體均值假設(shè)檢驗(yàn)適用于總體百分比假設(shè)檢驗(yàn)適用于小樣本(n<30)下的總體均值假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式適用于大樣本(n≥30)下的總體均值35舉例:總體均值和總體百分比的假設(shè)檢驗(yàn)

例一:2009年某校學(xué)生的月均生活費(fèi)支出為400元,2010年在該校抽取了100名學(xué)生進(jìn)行調(diào)查,得到這100名學(xué)生的月均生活費(fèi)支出為450元,標(biāo)準(zhǔn)差為60元。請(qǐng)問在0.05的顯著水平上,該校學(xué)生2010年的月均生活費(fèi)支出與2009年的有沒有變化?舉例:總體均值和總體百分比的假設(shè)檢驗(yàn)例一:2009年36

例二:某市市民2009年參加過慈善捐款的比例為65%,2010年該市社情民意調(diào)查中心電話訪問了2000個(gè)市民,發(fā)現(xiàn)其中70%在2010年參加過慈善捐款。請(qǐng)問:在0.05的顯著水平上,2010年該市有慈善捐款行為的市民的比例是否比2009年所有提高?例二:某市市民2009年參加過慈善捐款的比例為65%,237【實(shí)作訓(xùn)練】利用《昆明市低保制度實(shí)施狀況調(diào)查》SPSS數(shù)據(jù)文件(截取了232個(gè)個(gè)案的信息),學(xué)習(xí)如何通過SPSS進(jìn)行單變量的推論統(tǒng)計(jì)。【實(shí)作訓(xùn)練】38操作過程:第一步:依次點(diǎn)擊如下命令:“分析(A)→描述統(tǒng)計(jì)→探索(E)…”,出現(xiàn)“探索”對(duì)話框,從左邊的變量名列表中將“年齡”選入右邊的因變量列表(D)框中。操作一:利用SPSS求“年齡”這一變量的置信區(qū)間操作過程:操作一:利用SPSS求“年齡”這一變量的置信區(qū)間39第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)...”按鈕,出現(xiàn)“探索:統(tǒng)計(jì)量”對(duì)話框,系統(tǒng)默認(rèn)狀態(tài)是選擇描述性統(tǒng)計(jì)量,求95%置信度下的均值的置信區(qū)間。點(diǎn)擊“繼續(xù)”按鈕,返回“探索”對(duì)話框,點(diǎn)擊“確定”按鈕。第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)...”按鈕,出現(xiàn)“探索:統(tǒng)計(jì)量”40操作過程:第一步:依次點(diǎn)擊如下命令:“分析(A)→比較均值(M)→單樣本T檢驗(yàn)(S)…”,出現(xiàn)“單樣本T檢驗(yàn)”對(duì)話框,從左邊的變量名列表中將“年齡”選入右邊的檢驗(yàn)變量(T)框中,在檢驗(yàn)值(V)框中輸入“46”。操作二:利用SPSS對(duì)“年齡”這一變量進(jìn)行假設(shè)檢驗(yàn)

樣本統(tǒng)計(jì)數(shù)據(jù)顯示:年齡均值為43.51歲?,F(xiàn)在想知道的是,總體年齡均值會(huì)不會(huì)是46歲?操作過程:操作二:利用SPSS對(duì)“年齡”這一變量進(jìn)行假設(shè)檢驗(yàn)41第二步:點(diǎn)擊“選項(xiàng)(O)…”按鈕,在“單樣本T檢驗(yàn):選項(xiàng)”對(duì)話框的置信區(qū)間(C)中輸入置信度,系統(tǒng)默認(rèn)為95%。點(diǎn)擊“繼續(xù)”按鈕,返回“單樣本T檢驗(yàn)”對(duì)話框,點(diǎn)擊“確認(rèn)”,即可得到單個(gè)樣本檢驗(yàn)輸出結(jié)果。第二步:點(diǎn)擊“選項(xiàng)(O)…”按鈕,在“單樣本T檢驗(yàn):選項(xiàng)”對(duì)42結(jié)果解讀:由于t統(tǒng)計(jì)量的絕對(duì)值=3.048>臨界值=1.96,t統(tǒng)計(jì)量的相伴概率為0.003,小于所要求的顯著性水平0.05,所以拒絕原假設(shè),接受研究假設(shè),即總體年齡均值不會(huì)是46歲。結(jié)果解讀:由于t統(tǒng)計(jì)量的絕對(duì)值=3.048>臨界值=1.943三、注意事項(xiàng)1.判斷是接受還是拒絕原假設(shè)時(shí),利用Z、t等統(tǒng)計(jì)量與其臨界值進(jìn)行對(duì)比,與利用其相伴概率和研究者所要求的顯著性水平進(jìn)行對(duì)比,二者是等價(jià)的。2.SPSS已將一些常用值設(shè)定為了默認(rèn)值,如果研究者沒有特殊要求,可以直接使用系統(tǒng)默認(rèn)值。社會(huì)調(diào)查方法(第2版)教學(xué)課件644任務(wù)三雙變量相關(guān)分析要探索社會(huì)現(xiàn)象發(fā)生和發(fā)展變化的規(guī)律及其原因,就需要分析變量間的關(guān)系。雙變量間關(guān)系的分析是分析變量間關(guān)系的基礎(chǔ)。雙變量間的關(guān)系可分為兩大類:相關(guān)關(guān)系和因果關(guān)系。這里只介紹雙變量相關(guān)關(guān)系分析。任務(wù)三雙變量相關(guān)分析要探索社會(huì)現(xiàn)象發(fā)生和發(fā)展變化的規(guī)律及45兩變量間的相關(guān)關(guān)系通常是指當(dāng)其中一個(gè)變量的取值發(fā)生變化時(shí),另一個(gè)變量的取值也隨之發(fā)生變化。相關(guān)的種類線性相關(guān)和曲線相關(guān)在平面直角坐標(biāo)系中,如果由兩變量的不同取值所確定的點(diǎn)大致散布在一條直線的附近,則稱兩變量之間存在線性相關(guān)關(guān)系;如果這些點(diǎn)散布在一條曲線附近,則稱兩變量之間存在曲線關(guān)系。一、相關(guān)關(guān)系和種類兩變量間的相關(guān)關(guān)系通常是指當(dāng)其中一個(gè)變量的取值發(fā)生變化時(shí),另46正相關(guān)和負(fù)相關(guān)

正相關(guān)是指當(dāng)一個(gè)變量的數(shù)值由小變大時(shí),另一個(gè)變量的數(shù)值也由小變大。

負(fù)相關(guān)則是指當(dāng)一個(gè)變量的數(shù)值由小變大時(shí),另一個(gè)變量的數(shù)值卻由大變小。完全相關(guān)、不完全相關(guān)和零相關(guān)(不相關(guān))完全相關(guān)是指兩變量之間存在著一一對(duì)應(yīng)的關(guān)系,即函數(shù)關(guān)系。

不完全相關(guān)是指兩變量之間雖然存在著相互依賴、相互影響的關(guān)系,但這種關(guān)系不是嚴(yán)格的一一對(duì)應(yīng)的關(guān)系。

零相關(guān)即不相關(guān),是指兩變量彼此互不影響,其數(shù)量變化各自獨(dú)立。

通常所說的相關(guān)關(guān)系,是指介于完全相關(guān)與不相關(guān)之間的不完全相關(guān)。正相關(guān)和負(fù)相關(guān)47相關(guān)程度可以用相關(guān)統(tǒng)計(jì)量來表示。相關(guān)統(tǒng)計(jì)量的取值范圍在-1~1之間,正負(fù)號(hào)表示相關(guān)關(guān)系的方向,數(shù)值表示相關(guān)關(guān)系的強(qiáng)弱,其絕對(duì)值越大,表示相關(guān)性越強(qiáng)。相關(guān)統(tǒng)計(jì)量等于-1或1,表明兩變量完全相關(guān),即兩變量之間存在確定的函數(shù)關(guān)系;相關(guān)統(tǒng)計(jì)量等于0,表明兩變量之間是零相關(guān)。二、相關(guān)程度的表示二、相關(guān)程度的表示48對(duì)于不同測量尺度的變量,其相關(guān)統(tǒng)計(jì)量的計(jì)算方法是不同的。如果是兩個(gè)定距測量的變量,則可以根據(jù)兩變量數(shù)值上的共同變化來理解它們之間的相關(guān)。這種基于共變基礎(chǔ)上的相關(guān)統(tǒng)計(jì)量也就是一般數(shù)理統(tǒng)計(jì)上所說的相關(guān)系數(shù)。如果是兩個(gè)定類或定序測量的變量,則可以從連同發(fā)生的角度來理解其相關(guān)關(guān)系,即當(dāng)一個(gè)變量中的某種情況(類別)發(fā)生時(shí),另一變量中的某種情況(類別)會(huì)更可能發(fā)生。三、常用相關(guān)統(tǒng)計(jì)量的計(jì)算三、常用相關(guān)統(tǒng)計(jì)量的計(jì)算49消減誤差比例(PRE),是指當(dāng)兩個(gè)變量之間存在相關(guān)關(guān)系時(shí),用其中一個(gè)變量X的取值分布去預(yù)測另一變量Y的取值,比不利用變量X的取值分布而直接預(yù)測變量Y的取值時(shí)所能夠減少的誤差與總誤差之比。PRE數(shù)值表示用一個(gè)變量去預(yù)測或解釋另一個(gè)變量時(shí)能夠消除百分之幾的誤差。消減誤差比例越大,表明兩變量之間的相關(guān)關(guān)系越強(qiáng)。定類或定序變量之間的相關(guān)計(jì)算公式大多建立在消減誤差比例的基礎(chǔ)之上。消減誤差比例(PRE),是指當(dāng)兩個(gè)變量之間存在相關(guān)關(guān)系時(shí),50常用的相關(guān)統(tǒng)計(jì)量相關(guān)統(tǒng)計(jì)量Lambda適用于定類變量(或一個(gè)定類變量與一個(gè)定序變量)之間。其統(tǒng)計(jì)值介于0~1之間?;具壿嬍怯?jì)算以一個(gè)定類變量的值去預(yù)測另一個(gè)定類變量的值時(shí),如果以眾值作為預(yù)測的準(zhǔn)則,可以減少多少誤差。消減的誤差占全部誤差的比重越大,表示兩個(gè)變量的相關(guān)性越強(qiáng)。常用的相關(guān)統(tǒng)計(jì)量相關(guān)統(tǒng)計(jì)量Lambda51適用于不對(duì)稱相關(guān)測量,要求在兩個(gè)定類變量(或一個(gè)定類變量和一個(gè)定序變量)中能夠區(qū)分自變量與因變量。其統(tǒng)計(jì)值介于0~1之間。由于值計(jì)算中包括全部邊緣次數(shù)(即交互分類表中某個(gè)變量的某個(gè)取值的總次數(shù))和條件次數(shù)(即交互分類表中兩變量取值交叉項(xiàng)的次數(shù)),所以其敏感度高于Lambda相關(guān)測量法。適用于不對(duì)稱相關(guān)測量,要求在兩個(gè)定類變量(或一個(gè)定類變量和一52相關(guān)統(tǒng)計(jì)量Gamma適用于測量兩個(gè)具有對(duì)稱關(guān)系的定序變量之間的相關(guān)程度。其統(tǒng)計(jì)值介于-1~1之間,在表示相關(guān)程度的同時(shí)又指明相關(guān)的方向。其基本含義是:根據(jù)任何兩個(gè)個(gè)案在某一變量上的等級(jí)去預(yù)測他們?cè)诹硪蛔兞可系牡燃?jí)時(shí),可以消減多少誤差。相關(guān)統(tǒng)計(jì)量Gamma53適用于測量兩個(gè)具有對(duì)稱關(guān)系的定序變量之間的相關(guān)程度。在橫行與縱列數(shù)量相等的交互分類表中,系數(shù)的取值介于-1~1之間。與G系數(shù)不同的是,它在計(jì)算時(shí)既考慮了只在自變量X上同分(即兩個(gè)個(gè)案在自變量X上取值一樣,屬于同一等級(jí))的對(duì),也考慮了只在因變量Y上同分(即兩個(gè)個(gè)案在因變量Y上取值一樣,屬于同一等級(jí))的對(duì);而G系數(shù)在計(jì)算時(shí)則不考慮同分對(duì)。相關(guān)統(tǒng)計(jì)量適用于測量兩個(gè)具有對(duì)稱關(guān)系的定序變量之間的相關(guān)程度。相關(guān)統(tǒng)計(jì)54適用于測量兩個(gè)具有不對(duì)稱關(guān)系的定序變量之間的相關(guān)程度。其統(tǒng)計(jì)值介于-1~1之間。適用于以定類(或定序)變量為自變量,以定距(或定比)變量為因變量的兩變量間相關(guān)關(guān)系的測量。以均值作為預(yù)測準(zhǔn)則,其基本含義是:在知道自變量X取值分布的情況下,預(yù)測因變量Y的取值時(shí)能夠消減的誤差占總誤差的比例。其統(tǒng)計(jì)值介于0~1之間。適用于測量兩個(gè)具有不對(duì)稱關(guān)系的定序變量之間的相關(guān)程度。適用于55適用于測量兩個(gè)具有對(duì)稱關(guān)系的定距(或定比)變量之間的相關(guān)程度。其統(tǒng)計(jì)值介于-1~1之間,既表示相關(guān)的方向,又表示相關(guān)的程度。它是從兩個(gè)變量共變的角度來分析相關(guān)關(guān)系的,其基本含義是:兩個(gè)變量以其平均數(shù)為基準(zhǔn)的平均共變程度與其標(biāo)準(zhǔn)差之比。本身不具有消減誤差比例的意義,但其平方(被稱為決定系數(shù))具有消減誤差比例的意義。適用于測量兩個(gè)具有對(duì)稱關(guān)系的定距(或定比)變量之間的相關(guān)程度56四、相關(guān)關(guān)系的檢驗(yàn)

等相關(guān)統(tǒng)計(jì)量是根據(jù)樣本資料計(jì)算出來的,由于抽樣誤差的存在,所以即使樣本中兩個(gè)變量呈現(xiàn)出相關(guān)關(guān)系,在總體中,這兩個(gè)變量也未必就一定存在相關(guān)關(guān)系。因此,需要對(duì)樣本統(tǒng)計(jì)值所顯示的相關(guān)關(guān)系進(jìn)行檢驗(yàn),以確定在總體中兩個(gè)變量是否也存在相關(guān)關(guān)系。

四、相關(guān)關(guān)系的檢驗(yàn)等相關(guān)統(tǒng)計(jì)量是根據(jù)樣本資料計(jì)算出來的57(一)相關(guān)關(guān)系檢驗(yàn)的基本步驟(一)相關(guān)關(guān)系檢驗(yàn)的基本步驟58(二)常用相關(guān)關(guān)系檢驗(yàn)方法(二)常用相關(guān)關(guān)系檢驗(yàn)方法59【實(shí)作訓(xùn)練】

利用《昆明市低保制度實(shí)施狀況調(diào)查》SPSS數(shù)據(jù)文件(截取了232個(gè)個(gè)案的信息),學(xué)習(xí)如何通過SPSS求樣本資料中兩變量之間的相關(guān)系數(shù),并對(duì)相關(guān)關(guān)系進(jìn)行檢驗(yàn)?!緦?shí)作訓(xùn)練】60操作過程:第一步:依次點(diǎn)擊“分析(A)→描述統(tǒng)計(jì)→交叉表(C)…”,此時(shí)會(huì)出現(xiàn)“交叉表”對(duì)話框,將變量“性別”從左邊的變量名列表中選入右邊的“列(C)”框中,將變量“您認(rèn)為政府有必要規(guī)定最低工資標(biāo)準(zhǔn)嗎”選入右邊的“行(S)”框中。操作一:兩個(gè)定類變量之間相關(guān)關(guān)系的測量與檢驗(yàn)

以“性別”與“您認(rèn)為政府有必要規(guī)定最低工資標(biāo)準(zhǔn)嗎”為例,利用SPSS求兩個(gè)定類變量之間相的關(guān)關(guān)系并進(jìn)行檢驗(yàn)。操作過程:操作一:兩個(gè)定類變量之間相關(guān)關(guān)系的測量與檢驗(yàn)61第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)…”按鈕,在“交叉表:統(tǒng)計(jì)量”對(duì)話框中選中“卡方(H)”和“名義”虛框中的“Lambda”統(tǒng)計(jì)量,點(diǎn)擊“繼續(xù)”按鈕,在“交叉表”對(duì)話框中點(diǎn)擊“確定”按鈕,即可得到統(tǒng)計(jì)結(jié)果。第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)…”按鈕,在“交叉表:統(tǒng)計(jì)量”對(duì)話62結(jié)果解讀:對(duì)稱的和不對(duì)稱的、系數(shù)皆為0,表明對(duì)“政府有無必要規(guī)定最低工資標(biāo)準(zhǔn)”這一問題的看法與性別不相關(guān),即男性與女性對(duì)此問題的看法沒有區(qū)別。卡方檢驗(yàn)表明:=2,=0.06,小于顯著性水平為0.05時(shí)的臨界值5.991(查分布表即可得到不同自由度下的臨界值);也可直接比較值的相伴概率,此例中值的相伴概率為0.97,大于顯著性水平0.05,所以應(yīng)接受原假設(shè),即兩變量不相關(guān)。結(jié)果解讀:63操作二:兩個(gè)定序變量之間相關(guān)關(guān)系的測量與檢驗(yàn)

以“文化程度”和“對(duì)自家經(jīng)濟(jì)狀況的感受”為例,利用SPSS求兩個(gè)定序變量之間的相關(guān)關(guān)系并進(jìn)行檢驗(yàn)。操作過程:依次點(diǎn)擊“分析(A)→相關(guān)(C)→雙變量(B)…”,此時(shí)會(huì)出現(xiàn)“雙變量相關(guān)”對(duì)話框,將變量“文化程度”和“對(duì)自家經(jīng)濟(jì)狀況的感受”從左邊的變量名列表中選入右邊的“變量(V)”框中,并在“相關(guān)系數(shù)”虛框中選中“Kendall的tau-b(K)”,在“顯著性檢驗(yàn)”虛框中選中“雙側(cè)檢驗(yàn)”,同時(shí)點(diǎn)擊選中“標(biāo)記顯著性相關(guān)”選項(xiàng),擊“確定”按鈕,即可得到統(tǒng)計(jì)結(jié)果。操作二:兩個(gè)定序變量之間相關(guān)關(guān)系的測量與檢驗(yàn)操作過程:64社會(huì)調(diào)查方法(第2版)教學(xué)課件665操作三:定類(或定序)變量與定距變量之間相關(guān)關(guān)系的測量與檢驗(yàn)以“性別”與“您覺得您家平均每月要花多少錢才能維持一家人的基本生活”為例。操作過程:第一步:依次點(diǎn)擊“分析(A)→描述統(tǒng)計(jì)→交叉表(C)…”,在“交叉表”對(duì)話框中,將變量“性別”從左邊的變量名列表中選入右邊的“列(C)”框中,將變量“您覺得您家平均每月要花多少錢才能維持一家人的基本生活”選入右邊的“行(S)”框中。操作三:定類(或定序)變量與定距變量之間相關(guān)關(guān)系的測量與檢驗(yàn)66第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)…”按鈕,在“交叉表:統(tǒng)計(jì)量”對(duì)話框中選中“按區(qū)間標(biāo)定”虛框中的“Eta(E)”統(tǒng)計(jì)量,點(diǎn)擊“繼續(xù)”按鈕,在“交叉表”對(duì)話框中點(diǎn)擊“確定”按鈕,即可得到相關(guān)程度的統(tǒng)計(jì)結(jié)果。第二步:點(diǎn)擊“統(tǒng)計(jì)量(S)…”按鈕,在“交叉表:統(tǒng)計(jì)量”對(duì)話67第三步:依次點(diǎn)擊“分析(A)→比較均值(M)→單因素ANOVA…”,此時(shí)會(huì)出現(xiàn)“單因素方差分析”對(duì)話框,將變量“性別”從左邊的變量名列表中選入右邊的“因子(F)”框中,將變量“您覺得您家平均每月要花多少錢才能維持一家人的基本生活”選入“因變量列表(E)”框中,點(diǎn)擊“選項(xiàng)(O)…”按鈕,進(jìn)入“單因素ANOVA:選項(xiàng)”對(duì)話

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論