第七章SPSS的相關(guān)分析_第1頁
第七章SPSS的相關(guān)分析_第2頁
第七章SPSS的相關(guān)分析_第3頁
第七章SPSS的相關(guān)分析_第4頁
第七章SPSS的相關(guān)分析_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章

相關(guān)分析與檢驗主要內(nèi)容方差分析回顧相關(guān)分析的概念列聯(lián)分析簡單相關(guān)分析偏相關(guān)分析方差分析回顧概念:方差分析是從因變量的方差入手,研究諸多自變量中哪些變量是對因變量有顯著影響的變量,對因變量有顯著影響的各個自變量其不同水平以及各水平的交互搭配是如何影響因變量的。方差分析認(rèn)為因變量的變化受兩類因素的影響:第一,自變量不同水平所產(chǎn)生的影響;第二,隨機(jī)變量所產(chǎn)生的影響。這里的隨機(jī)變量指那些人為很難控制的因素,主要指試驗過程中的抽樣誤差。單因素方差分析當(dāng)一個變量為定類變量,另一變量為定距變量時,兩變量間是否有關(guān),通常以分組平均數(shù)比較的方法來考察。即按照定類變量的不同取值來分組,看每個分組的定距變量的平均數(shù)是否有差異。不同組間的平均數(shù)差異越小,兩個變量間的關(guān)系越弱;相反,平均數(shù)差異越大,變量間關(guān)系越強(qiáng)。單因素方差分析的基本步驟提出原假設(shè):自變量不同水平下因變量各總體的均值無顯著差異。選擇檢驗統(tǒng)計量:F統(tǒng)計量。計算檢驗統(tǒng)計量的觀測值和概率P值。給出顯著性水平,并作出決策。一、相關(guān)關(guān)系的概念(一)函數(shù)關(guān)系:指的是兩事物間的一種一一對應(yīng)的關(guān)系,即當(dāng)變量x取一定值時,另一變量y可以依確定的函數(shù)取唯一確定的值。例如:商品的銷售額與銷售量之間的關(guān)系,在單價確定時,給出銷售量可以唯一的確定銷售額。(二)相關(guān)關(guān)系:兩事物間非一一對應(yīng)的關(guān)系,即當(dāng)變量x取一定值時,另一變量y無法依確定的函數(shù)取唯一確定的值。例如:家庭收入和支出、子女身高和父母身高之間的關(guān)系。這些事物之間存在一定的關(guān)系,但這些關(guān)系不能像函數(shù)關(guān)系那樣用一個數(shù)學(xué)函數(shù)式描述。相關(guān)分析內(nèi)容相關(guān)分析是分析客觀事物之間關(guān)系的數(shù)量分析方法,是統(tǒng)計分析方法中最重要的內(nèi)容之一。主要內(nèi)容:對變量間的相關(guān)關(guān)系進(jìn)行分析,包括簡單相關(guān)分析和偏相關(guān)分析相關(guān)分析之一——有關(guān)與無關(guān)尋找變量間的關(guān)系是科學(xué)研究的首要目的。變量間的關(guān)系最簡單的劃分即:有關(guān)與無關(guān)。在統(tǒng)計學(xué)上,我們通常這樣判斷變量之間是否有關(guān):如果一個變量的取值發(fā)生變化,另外一個變量的取值也相應(yīng)發(fā)生變化,則這兩個變量有關(guān)。如果一個變量的變化不引起另一個變量的變化則二者無關(guān)。性別與四級英語考試通過率的相關(guān)統(tǒng)計表述:統(tǒng)計結(jié)果顯示,當(dāng)性別取值不同時,通過率變量的取值并未發(fā)生變化,因此性別與考試通過率無關(guān)。自變量的不同取值在因變量上無差異,兩變量無關(guān)。自變量的不同取值在因變量上有差異,兩變量有關(guān)。統(tǒng)計結(jié)果顯示,當(dāng)性別取值不同時,收入變量的取值發(fā)生了變化,因此性別與月收入有關(guān)。自變量因變量變量關(guān)系的統(tǒng)計類型相關(guān)分析之二——關(guān)系強(qiáng)度變量關(guān)系強(qiáng)度的含義:指兩個變量相關(guān)程度的高低。統(tǒng)計學(xué)中是以準(zhǔn)實驗的思想來分析變量相關(guān)的。通常從以下的角度分析:A)兩變量是否相互獨立。B)兩變量是否有共變趨勢。C)一變量的變化多大程度上能由另一變量的變化來解釋。變量關(guān)系強(qiáng)度測量的主要指標(biāo)相關(guān)分析之三——關(guān)系性質(zhì)直線相關(guān)與曲線相關(guān)正相關(guān)與負(fù)相關(guān)完全相關(guān)、不相關(guān)、不完全相關(guān)二、列聯(lián)相關(guān)(一)列聯(lián)分析的基本原理自變量發(fā)生變化,因變量取值是否也發(fā)生變化。比較邊緣百分比和條件百分比的差別??ǚ綔y量用來考察兩變量是否獨立(無關(guān))。其原理是根據(jù)這一概率定理:若兩變量無關(guān),則兩變量中聯(lián)合事件發(fā)生的概率應(yīng)等于各自獨立發(fā)生的概率乘積在列聯(lián)表中,這一定理就具體轉(zhuǎn)化為:若兩變量無關(guān),則兩變量中條件概率應(yīng)等于各自邊緣的概率乘積。反之,則兩變量有關(guān),或稱兩變量不獨立。由此可見,期望值(獨立模型)與觀察值的差距越大,說明兩變量越不獨立,也就越有相關(guān)。因此,卡方的表達(dá)式如下:卡方的取值在0~∞之間??ǚ街翟酱?,關(guān)聯(lián)性越強(qiáng)。在SPSS中,有PearsonX2和相似比卡方(LikelihoodRatioX2)兩種。

的改進(jìn)標(biāo)準(zhǔn)化系數(shù):為使值有一固定的區(qū)間,便于比較,采用了以下幾個修正:A、φ系數(shù)(Phi):(0~1),適用于2×2表。B、列聯(lián)系數(shù)(ContingencyCoefficient):(0~1),適用任意表。C、CramerV系數(shù):(0~1),適用任意表。D、λ系數(shù)(Lambda):(0~1),適用任意表。E、Goodman&Kruskal-tau系數(shù):(0~1),適用任意表。

(二)列聯(lián)表分析的功能根據(jù)收集到的樣本數(shù)據(jù)編制交叉列聯(lián)表;在交叉列聯(lián)表的基礎(chǔ)上,對兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。列聯(lián)表的格式(三)列聯(lián)表分析過程列聯(lián)表分析步驟:

按AnalyzeDescriptiveStatisticsCrosstabs順序打開Crosstabs主對話框。Crosstabs對話框TableFormat對話框決定各行的排列順序:升序降序(四)例1

為了探討吸煙與慢性支氣管炎有無關(guān)系,調(diào)查了339人,情況如下:吸煙和慢性支氣管炎調(diào)查表患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121錄入數(shù)據(jù)“Crosstab.sav”。變量h為頻次;變量x為是否吸煙:1為吸煙,2為不吸煙;變量n為是否患?。?為患病,2為不患病。選擇變量h進(jìn)行加權(quán)。按Analyze--DescriptiveStatistics--Crootabs順序打開Crootabs主對話框。將x變量選入Row框作為行變量,將n變量選入Column框作為列變量。打開Statistics對話框,選中Chi-square\Contingencycoefficient和PhiandCramer’sV復(fù)選框,單擊Continue返回。單擊Cell按鈕,打開Celldisplay對話框,選中observed和Expected復(fù)選框,單擊Continue返回;單擊OK。1.操作步驟統(tǒng)計摘要表,列出觀測量有效值個數(shù)、缺失值個數(shù)和總的個數(shù)。

2.輸出結(jié)果及分析

吸煙與患病統(tǒng)計摘要表吸煙與患病列聯(lián)表卡方檢驗

對稱性檢驗表例2:利用住房狀況問卷調(diào)查數(shù)據(jù),分析本市戶口和外地戶口家庭對“未來三年是否打算買房”是否持相同態(tài)度。首先,在所調(diào)查的2880個樣本中有113個樣本因缺失值而被剔除,2712戶為本市戶口,168戶為外地戶口,分別占樣本總量的94.2%和5.8%,可見,本市戶口占多數(shù);未來三年不打算買房、打算買房的樣本量分別為2161和719,各占總樣本的75%和25%,不打算買房的占較大比例。其次,對不同戶口進(jìn)行分析。在本市戶口中未來三年不打算買房和打算買房的樣本量分別為2052和660,各占總樣本的75.7%和24.3%,不打算買房的仍占較大比例,但打算買房的低于總體比例的25%;在外地戶口中,未來三年不打算買房和打算買房的樣本量分別為109和59,各占總樣本的64.9%和35.1%,未來三年不打算買房的仍占較大比例,但打算買房的比例高于總體比例25%。最后,對不同看法進(jìn)行分析。如果顯著性水平設(shè)為0.05,則概率值小于0.05,拒絕原假設(shè),認(rèn)為本市戶口和外地戶口對未來三年是否打算買房的看法是不一致的。三、相關(guān)分析(Correlate)(一)簡介相關(guān)分析用于描述兩個變量間聯(lián)系的密切程度,其特點是變量不分主次,被置于同等的地位。檢驗的假設(shè)為相關(guān)系數(shù)為0。可選擇是單尾檢驗還是雙尾檢驗。在Analyze的下拉菜單Correlate命令項中有三個相關(guān)分析功能子命令Bivariate過程、Partial過程、Distances過程,分別對應(yīng)著相關(guān)分析、偏相關(guān)分析和相似性測度的三個spss過程。(二)相關(guān)分析類型Bivariate(雙變量)過程用于進(jìn)行兩個或多個變量間的相關(guān)分析,如為多個變量,給出兩兩相關(guān)的分析結(jié)果。Partial(偏相關(guān))過程,當(dāng)進(jìn)行相關(guān)分析的兩個變量的取值都受到其他變量的影響時,就可以利用偏相關(guān)分析對其他變量進(jìn)行控制,輸出控制其他變量影響后的相關(guān)系數(shù)。Distances過程用于對同一變量各觀察單位間的數(shù)值或各個不同變量間進(jìn)行相似性或不相似性分析,一般不單獨使用,而作為因子分析等的預(yù)分析。(三)雙變量相關(guān)分析在進(jìn)行相關(guān)分析時,散點圖是重要的工具,分析前應(yīng)先做散點圖,以初步確定兩個變量間是否存在相關(guān)趨勢,該趨勢是否為直線趨勢,以及數(shù)據(jù)中是否存在異常點。否則可能的出錯誤結(jié)論。Bivariate相關(guān)分析的步驟:輸入數(shù)據(jù)后,依次單擊Analyze—Correlate—Bivariate,打開BivariateCorrelations對話框例1:利用住房狀況問卷調(diào)查數(shù)據(jù),分析家庭收入與打算購買的住房面積之間存在怎樣的統(tǒng)計關(guān)系。解題思路第一步:繪制散點圖第二步:計算相關(guān)系數(shù)散點圖類型簡單散點圖:表示一對變量間統(tǒng)計關(guān)系的散點圖。重疊散點圖:表示多對變量間統(tǒng)計關(guān)系的散點圖。矩陣散點圖:以矩陣形式分別顯示多對變量間的統(tǒng)計關(guān)系。三維散點圖:以立體圖的形式展現(xiàn)三對變量間的統(tǒng)計關(guān)系。計算相關(guān)系數(shù)一、相關(guān)系數(shù)的特點雖然散點圖能夠直觀地展現(xiàn)變量之間的統(tǒng)計關(guān)系,但是并不精確。相關(guān)系數(shù)以數(shù)值的方式精確地反映了兩個變量間線性相關(guān)的強(qiáng)弱程度。線性關(guān)系的分析步驟第一,計算樣本相關(guān)系數(shù)r。相關(guān)系數(shù)r的取值在-1~+1之間,r>0表示兩變量存在正的線性相關(guān);r<0表示兩變量存在負(fù)的線性相關(guān)關(guān)系;r=0表示兩變量存在完全正線性相關(guān);r=﹣1表示兩變量存在完全負(fù)相關(guān)關(guān)系;r=0表示兩變量不存在線性相關(guān)關(guān)系;|r|>0.8表示兩變量之間有較強(qiáng)的線性相關(guān)關(guān)系;|r|<0.3表示兩變量之間的線性相關(guān)關(guān)系較弱。第二,對樣本來自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推斷。具體步驟與假設(shè)檢驗相同。對于此案例,通過繪制散點圖得知家庭收入與計劃購買住房面積之間存在一定的正的弱相關(guān)關(guān)系,為更準(zhǔn)確地反映兩者之間線性關(guān)系的強(qiáng)弱,采用計算相關(guān)系數(shù)的方法。由于這兩個變量均為定距變量,因此采用簡單相關(guān)系數(shù)。由輸出結(jié)果可知,家庭收入與計劃購買的住房面積的簡單相關(guān)系數(shù)為0.323,說明兩者之間存在正的弱相關(guān)性,其相關(guān)系數(shù)的檢驗概率值近似為0。因此,當(dāng)顯著性水平為0.05時應(yīng)拒絕原假設(shè),認(rèn)為兩總體不是零相關(guān)。例2:定序變量的Spearman分析實例

為研究集團(tuán)迫使個人順從的效應(yīng),一些研究者用量表對12名大學(xué)生進(jìn)行了調(diào)查,數(shù)據(jù)如下。學(xué)生ABCDEFGHIJKL權(quán)威主義265110983412711地位欲342181110671259權(quán)威主義和地位欲評秩1)輸入數(shù)據(jù),依次單擊分析—相關(guān)分析—雙變量分析,打開雙變量分析對話框2)選擇power和position變量進(jìn)入Variables框中。3)在CorrelationCoefficients欄內(nèi)選擇Spearman。4)在TestofSignificance欄選擇Two-tailed。5)選擇Flagsignificantcorrelation。6)單擊Options按鈕,選擇Meanandstandarddeviations、Cross-productdeviationsandcovariances、Excludecasespairise選項。7)單擊OK。分析步驟:

從表中可看出,權(quán)威主義和地位欲的相關(guān)系數(shù)為0.818,這表明權(quán)威主義越高的人地位欲也越高。權(quán)威主義與地位欲不相關(guān)的假設(shè)檢驗值為0.001,否定假設(shè),即權(quán)威主義與地位欲是相關(guān)的。結(jié)果分析:例3:定序變量的Kendall分析實例

仍用前例中的數(shù)據(jù)(數(shù)據(jù)文件:權(quán)威(Spearman相關(guān)).sav)。操作過程相同,只是在第3)步在CorrelationCoefficients欄內(nèi)選擇Kendall’s選項。結(jié)果如下:權(quán)威主義和地位欲的相關(guān)系數(shù)為0.667,這表明權(quán)威主義越高的人地位欲也越高。權(quán)威主義與地位欲不相關(guān)的假設(shè)檢驗值為0.003,否定假設(shè),即權(quán)威主義與地位欲是相關(guān)的。結(jié)果類似于Spearman分析。簡單相關(guān)分析計算兩個變量間的相關(guān)系數(shù),分析兩個變量間線性關(guān)系的程度,往往因為第三個變量的作用,使相關(guān)系數(shù)不能真正反映兩個變量間的線性程度。例如:在研究商品的需求量和價格、消費者收入之間的關(guān)系時會發(fā)現(xiàn),需求量和價格之間的相關(guān)關(guān)系實際還包含了消費者收入對商品需求量的影響,同時,收入對價格也產(chǎn)生了影響,并通過價格變動傳遞到對商品需求量的影響中。偏相關(guān)分析的任務(wù)就是在研究兩個變量之間的線性相關(guān)關(guān)系時控制可能對其產(chǎn)生影響的變量。(四)偏相關(guān)分析Pearson偏相關(guān)系數(shù)假設(shè)檢驗的t統(tǒng)計量:其中,r是相應(yīng)的偏相關(guān)系數(shù),n是觀測量數(shù),k是控制變量的數(shù)目,n-k-2是自由度。當(dāng)t>t0.0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論