第10講散點圖、相關(guān)系數(shù)_第1頁
第10講散點圖、相關(guān)系數(shù)_第2頁
第10講散點圖、相關(guān)系數(shù)_第3頁
第10講散點圖、相關(guān)系數(shù)_第4頁
第10講散點圖、相關(guān)系數(shù)_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

假設(shè)檢驗假設(shè)檢驗就是事先對總體參數(shù)或總體分布形式做出一個假設(shè),然后利用樣本的實際資料來判斷原假設(shè)是否合理的一種統(tǒng)計分析方法。1.方差齊性原假設(shè)H0:認為兩總體方差之間不存在顯著性差異,方差齊性。2.K-S檢驗或S-W檢驗原假設(shè)H0是數(shù)據(jù)服從指定的分布(如正態(tài)分布)。3.卡方檢驗是以2分布為基礎(chǔ)的一種假設(shè)檢驗方法,主要用于分類變量,根據(jù)樣本數(shù)據(jù)推斷總體的分布與期望分布是否有顯著差異,或推斷兩個分類變量是否相關(guān)或相互獨立。其原假設(shè)H0為:兩個分類變量相互獨立1上節(jié)回顧均值比較單樣本T檢驗Analyze→CompareMeans→OneSampleTTest獨立樣本T檢驗Analyze→CompareMeans→Independent-SamplesTTest配對樣本T檢驗

Analyze→CompareMeans→Paired-SampleTTest上節(jié)回顧單樣本T檢驗概念是檢驗樣本均值與已知總體均值(檢驗值)之間是否存在差異。

統(tǒng)計的前提條件是:樣本總體服從正態(tài)分布。H0(單樣本T檢驗的零假設(shè)):樣本均值和總體均值之間不存在顯著差異。(即兩者差異不大,或沒有差異)檢驗結(jié)果的判斷

(1)如果相伴概率值(P值或Sig.值)小于或等于用戶假設(shè)的顯著性水平α=0.05,則拒絕H0,認為樣本均值和總體均值之間存在顯著性差異。

(2)相反,相伴概率值(P值或Sig.值)大于顯著性水平α=0.05,則接受H0,認為樣本均值和總體均值之間不存在顯著性差異

上節(jié)回顧獨立樣本T檢驗概念

就是檢驗獨立的正態(tài)總體下樣本均值之間是否存在顯著差異。前提條件

檢驗前,要求進行比較的兩個樣本相互獨立,并且服從正態(tài)分布,方差齊性。獨立樣本T檢驗的H0假設(shè):男女學(xué)生入學(xué)考試成績(兩個獨立樣本)之間不存在顯著差異。檢驗結(jié)果的判斷

(1)如果相伴概率值(P值或Sig.值)小于或等于用戶假設(shè)的顯著性水平α=0.05,則拒絕H0,認為2個樣本均值之間存在顯著性差異。

(2)相反,相伴概率值(P值或Sig.值)大于顯著性水平α=0.05,則接受H0,認為兩個樣本均值之間不存在顯著性差異

上節(jié)回顧配對樣本T檢驗概念

就是根據(jù)樣本數(shù)據(jù)對樣本來自的兩配對總體的均值是否有顯著差異進行判斷。前提條件(1)兩樣本必須是配對的,即配對要求兩組同質(zhì)受試樣本配成對子或同一受試樣本分別接受兩種不同的處理;(2)樣本來自的兩個總體必須服從正態(tài)分布。配對樣本T檢驗的零假設(shè)為H0:配對樣本的總體均值之間不存在顯著差異。解釋:如果相伴概率值小于或等于用戶設(shè)想的顯著性水平α=0.05,則拒絕H0,認為兩配對樣本總體均值之間存在顯著性差異。相反,相伴概率值大于顯著性水平α=0.05,則接受H0,認為兩配對樣本總體均值之間不存在顯著性差異。上節(jié)回顧均值比較T檢驗原假設(shè):xxxx的均值與yyyy的均值無顯著差異方法檢驗的目的方法的前題條件舉

例單樣本T檢驗檢驗樣本均值與已知總體均值之間是否存在差異樣本總體服從正態(tài)分布某地區(qū)高考數(shù)學(xué)成績與全國數(shù)學(xué)高考成績均值是否存在顯著差異獨立樣本T檢驗總體正態(tài)分布下,兩個獨立樣本均值之間是否存在顯著差異進行比較的兩個樣本是獨立的,并且服從正態(tài)分布1.F檢驗方差齊性2.T檢驗樣本順序可調(diào)換,樣本數(shù)量可不同某大學(xué)隨機抽取若干個大學(xué)一年級學(xué)生,分析他們的大學(xué)入學(xué)考試成績在性別上是否存在顯著差異。配對樣本T檢驗兩配對樣本總體的均值之間是否存在顯著差異1.配對要求兩組同質(zhì)受試對象配成對子或同一受試對象分別接受兩種不同的處理。2.樣本來自的兩個總體必須服從正態(tài)分布樣本順序不可調(diào)換,且樣本數(shù)必須相同。1.針對實驗前學(xué)習(xí)成績和智商相同的兩組學(xué)生,分別進行不同教學(xué)方法的訓(xùn)練,比較參與實驗的兩組學(xué)生的學(xué)習(xí)成績是否存在顯著差異。2.某班學(xué)生在接愛一種新的教學(xué)方法培訓(xùn)后,學(xué)習(xí)成績是否有顯著變化。上節(jié)回顧7上節(jié)回顧8第10講

散點圖、相關(guān)系數(shù)9

相關(guān)概念10一、相關(guān)的概念變量之間關(guān)系的概念

客觀世界中,事物之間存在相互依存、相互制約、相互影響的關(guān)系。用于描述事物數(shù)量特征的變量之間也存在一定的關(guān)系。

這些關(guān)系分為兩種:

(1)函數(shù)關(guān)系:變量之間的一一對應(yīng)的關(guān)系,當自變量x取一定值時,因變量y依據(jù)函數(shù)關(guān)系取唯一的值。如:在單價確定時,銷售量與銷售額之間的關(guān)系:y=f(x)

銷售額=價格*銷售量圓的面積與圓的半徑之間的關(guān)系:

圓面積=3.14*半徑^211一、相關(guān)的概念關(guān)系的概念(2)相關(guān)關(guān)系:如果變量之間存在密切的關(guān)系,但又不能由一個或幾個變量的值確定另一個變量的值,當自變量x取一定值時,因變量y的值可能有多個,這種變量之間的非一一對應(yīng)的、不確定的關(guān)系,稱之為相關(guān)關(guān)系。如:子女身高與父母身高之間的關(guān)系證券指數(shù)與利率之間的關(guān)系12一、相關(guān)的概念相關(guān)關(guān)系的分類

(1)按相關(guān)的程度分為:完全相關(guān):一個變量的取值完全取決于另一個變量,數(shù)據(jù)點落在一條直線(或曲線)上相關(guān):一個變量的取值部分取決于另一個變量,數(shù)據(jù)點圍繞分布在一條直線(或曲線)上不相關(guān):兩個變量的數(shù)據(jù)點分布很分散,無任何規(guī)律

就是函數(shù)關(guān)系13一、相關(guān)的概念相關(guān)關(guān)系的分類

(2)按相關(guān)的表現(xiàn)形式分為:線性相關(guān):兩個變量之間的關(guān)系近似地表現(xiàn)為一條直線非線性相關(guān):兩個變量之間的關(guān)系近似地表現(xiàn)為一條曲線14一、相關(guān)的概念相關(guān)關(guān)系的分類

(3)按相關(guān)的方向分為:

正相關(guān):一個變量增加(減少),導(dǎo)致另一個變量增加(減少)

負相關(guān):一個變量增加(減少),導(dǎo)致另一個變量減少(增加)15一、相關(guān)的概念線性相關(guān)的四種相關(guān)關(guān)系

強正線性相關(guān):

一個變量x增加,導(dǎo)致另一個變量y明顯增加,說明x是影響變量y的主要因素弱正線性相關(guān):一個變量x增加,導(dǎo)致另一個變量y增加,但不明顯,說明x是影響變量y的因素,但不是唯一的影響因素強負線性相關(guān):一個變量x增加,導(dǎo)致另一個變量y明顯減少,說明x是影響變量y的主要因素弱負線性相關(guān):一個變量x增加,導(dǎo)致另一個變量y減少,但不明顯,說明x是影響變量y的因素,但不是唯一的影響因素16一、相關(guān)的概念相關(guān)分析的概念

相關(guān)分析就是描述兩個或兩個以上變量間關(guān)系密切程度的統(tǒng)計方法,有效地揭示事物之間相關(guān)關(guān)系的強弱程度。相關(guān)分析的方法

圖形(散點圖):常用的一種直觀的分析方法,將樣本數(shù)據(jù)點繪制在二維平面或三維空間上,根據(jù)這些數(shù)據(jù)點的分布特征,能夠直觀地研究變量間的統(tǒng)計關(guān)系以及它們的強弱程度和數(shù)據(jù)對的可能走向。

數(shù)值(相關(guān)系數(shù)):變量間關(guān)系的密切程度常以一個數(shù)量性指標描述,這個指標稱相關(guān)系數(shù)r=0.817一、相關(guān)的概念SPSS提供了三種相關(guān)分析的方法二元變量分析(

Bivariate):偏相關(guān)分析(

Partial):距離相關(guān)分析(

Distances):18

相關(guān)分析的方法19二、相關(guān)分析的方法散點圖

散點圖是相關(guān)分析過程中常用的一種直觀的分析方法;將樣本數(shù)據(jù)點繪制在二維平面或三維空間上,根據(jù)數(shù)據(jù)點的分布特征,直觀的研究變量之間的統(tǒng)計關(guān)系以及強弱程度。就兩個變量而言,如果變量之間的關(guān)系近似地表現(xiàn)為一條直線,則稱為線性相關(guān),如圖(a)和(b);如果變量之間的關(guān)系近似地表現(xiàn)為一條曲線,則稱為非線性相關(guān)或曲線相關(guān),如圖(c);如果兩個變量的觀測點很分散,無任何規(guī)律,則表示變量之間沒有相關(guān)關(guān)系,如圖(d)。(a)(b)(c)(d)20二、相關(guān)分析的方法相關(guān)系數(shù)

散點圖能夠直觀地反映變量之間的關(guān)系,但不精確。相關(guān)系數(shù)以數(shù)值的方式精確地反映了變量之間線性關(guān)系的強弱程度。相關(guān)系數(shù)通過正、負表示相關(guān)的方向,相關(guān)系數(shù)r的取值在-1~+1之間:

下表中是通過相關(guān)系數(shù)來描述相關(guān)程度

不同類型的變量采用不同的相關(guān)系數(shù)指標,但取值范圍和含義都是相同的相關(guān)系數(shù)取值范圍r=0|r|<0.3|r|=0.3~0.5|r|=0.5~0.8|r|>0.8|r|=1相關(guān)程度無相關(guān)微弱相關(guān)低度相關(guān)顯著相關(guān)高度相關(guān)完全相關(guān)21二、相關(guān)分析的方法相關(guān)系數(shù)的分類

Pearson簡單相關(guān)系數(shù)(皮爾遜)用來度量正態(tài)分布的定距變量間的線性相關(guān)關(guān)系

Pearson簡單相關(guān)系數(shù)要求變量來自的總體分布正態(tài)Spearman秩相關(guān)系數(shù)(斯皮爾曼)采用非參數(shù)檢驗方法來度量定序變量間的線性相關(guān)關(guān)系不要求總體正態(tài)分布由于數(shù)據(jù)為非定距變量,因此不能直接采用原始數(shù)據(jù),而是利用數(shù)據(jù)的秩Kendallτ秩相關(guān)系數(shù)(肯德和諧系數(shù)、一致性系數(shù))

采用非參數(shù)檢驗方法來度量定序變量間的線性相關(guān)關(guān)系多用于計算評價者的評定一致性看備注頁變量的值之間可以比較大小,兩個值的差有實際意義,這樣的變量叫定距變量。在調(diào)查被訪者的“年齡”和“每月平均收入”,都是定距變量。定序變量區(qū)別同一類別個案中等級次序的變量。定序變量能決定次序,也即變量的值能把研究對象排列高低或大小,具有>與<的數(shù)學(xué)特質(zhì)。例如文化程度可以分為大學(xué)、高中、初中、小學(xué)、文盲22二、相關(guān)分析的方法利用相關(guān)系數(shù)進行變量之間線性關(guān)系的分析

利用相關(guān)系數(shù)進行變量之間線性關(guān)系的分析分兩步:

(1)利用樣本數(shù)據(jù)計算樣本相關(guān)系數(shù)r;

(2)對樣本的總體是否存在顯著的線性關(guān)系進行推測。

注:顯著的相關(guān)性并不能導(dǎo)出任何因果結(jié)論。23二、相關(guān)分析的方法對樣本的線性關(guān)系進行推測步驟由于存在抽樣的隨機性以及樣本數(shù)量較少等原因,通常樣本相關(guān)系數(shù)不能直接反映樣本是否存在顯著的線性相關(guān)關(guān)系,需要通過假設(shè)檢驗的方式對樣本的總體進行統(tǒng)計推測。推測步驟

(1)提出零假設(shè)H0:兩總體線性不相關(guān)(或相關(guān)系數(shù)與0無顯著性差異)(2)選擇檢驗統(tǒng)計量:對不同變量采用不同的相關(guān)系數(shù),同時也采用不同的檢驗統(tǒng)計量(3)計算統(tǒng)計量的觀測值和對應(yīng)的概率p值;

(4)對總體的相關(guān)性進行推斷24二、相關(guān)分析的方法根據(jù)概率P進行解釋

檢驗統(tǒng)計量的概率p值小于等于給定的顯著性水平α值(0.05),拒絕零假設(shè),認為總體相關(guān)。若檢驗統(tǒng)計量的概率p值大于給定的顯著性水平α值(0.05),接受零假設(shè),認為總體不相關(guān)。

25

二元變量分析26三、二元變量分析概念

二元變量分析(Bivariate)是研究和分析兩個變量之間相關(guān)程度的統(tǒng)計方法。應(yīng)用很多時候都是通過兩個變量進行相關(guān)分析,所以兩個變量之間相關(guān)程度的分析應(yīng)用十分廣泛。如:家庭收入與家庭消費支出之間關(guān)系是否相關(guān)商品銷售價格與商品銷售額之間關(guān)系是否相關(guān)客戶滿意度與商業(yè)企業(yè)綜合競爭力之間關(guān)系是否相關(guān)廣告投入和銷售額之間關(guān)系是否相關(guān)27三、二元變量分析SPSS操作及案例分析

例一:為了研究某項職業(yè)技能和員工年齡之間的關(guān)系,對員工進行職業(yè)技能測試,得到有關(guān)上述兩變量的數(shù)據(jù)表。現(xiàn)以年齡作為自變量x,職業(yè)技能測試得分為因變量y,以兩變量數(shù)據(jù)為依據(jù),繪制散點圖分析兩變量之間的相關(guān)關(guān)系。注意:通過散點圖只是初步分析兩變量之間的相關(guān)關(guān)系

通常用散點圖描述相關(guān)關(guān)系的表達方式:

完全相關(guān)較強(正/負)相關(guān)較弱(正/負)相關(guān)不相關(guān)

28三、二元變量分析SPSS操作及案例分析結(jié)果分析:

從散點圖中可以看出,點的分布比較分散,在擬合線上或周圍的點分布較少,說明兩變量之間相關(guān)程度較弱。從擬合線的趨勢來看,職業(yè)技能和員工年齡之間之間有一定的相關(guān)關(guān)系,而且是隨著年齡的增加,職業(yè)技能測試得分會隨之上升,但上升幅度較小。所以上述兩變量之間具有較弱正相關(guān)的關(guān)系。通過對散點圖的編輯,可以添加擬合線29三、二元變量分析SPSS操作及案例分析操作步驟

Graphs→LegacyDialogs→Scatter/Dot…數(shù)據(jù)文件:8-Bivariate_age.sav保存文件:8-Bivariate_age.spv常用的散點圖類型簡單散點圖重疊散點圖矩陣散點圖三維散點圖單點散點圖30三、二元變量分析SPSS操作及案例分析散點圖的其他應(yīng)用(1)在散點圖中設(shè)置散點標記。31三、二元變量分析SPSS操作及案例分析散點圖的其他應(yīng)用(2)在散點圖中設(shè)置散點標簽。SPSS操作及案例分析散點圖的其他應(yīng)用(3)在散點圖中添加擬合線。32三、二元變量分析1.雙擊該圖區(qū)SPSS操作及案例分析散點圖的其他應(yīng)用(4)計算相關(guān)系數(shù)。Analyze→Correlate→Bivariate...33三、二元變量分析解釋:1.Sig.=0.041<0.05,拒絕H0假設(shè),表明兩變量之間是相關(guān)的。2.由于r=0.229<0.3,為微弱正相關(guān)。34三、二元變量分析SPSS操作及案例分析

例二:在有氧訓(xùn)練中,人的耗氧量y(毫升/分*千克體重)是衡量人的身體狀況的重要指標,它與多項指標有關(guān)。為了研究人的耗氧量與多項指標之間的關(guān)系,對31名測試者進行測試?,F(xiàn)以人的耗氧量y為因變量,多項指標中之一1.5英里跑所用時間x3為自變量,通過散點圖和相關(guān)系數(shù),分析研究耗氧量y與1.5英里跑所用時間x3之間的相關(guān)關(guān)系。

35三、二元變量分析SPSS操作及案例分析結(jié)果分析:從散點圖中可以看出,耗氧量y與1.5英里跑所用時間x3之間存在較強負相關(guān)的關(guān)系,即1.5英里跑所用時間增加,耗氧量會隨之降低。伴隨概率P=0.000<0.01,說明兩變量之間是明顯相關(guān)關(guān)系;在相關(guān)系數(shù)表中,r=-0.832,說明兩變量之間高度負相關(guān)。36三、二元變量分析SPSS操作及案例分析結(jié)果分析:擬合線。37三、二元變量分析SPSS操作及案例分析例三:利用例二的數(shù)據(jù),分析因變量y(人的耗氧量),與自變量x1、x2、x3、x4、x5、x6之間的關(guān)系。與耗氧量有關(guān)的因素年齡x1(歲)體重x2(次/分)1.5英里跑所用時間x3(分)靜止時心跳速率x4(次/分)跑步時心跳速率x5(次/分)

跑步時最大心跳速率x6(次/分)38三、二元變量分析SPSS操作及案例分析結(jié)果圖:39三、二元變量分析SPSS操作及案例分析結(jié)果分析:

從相關(guān)系數(shù)計算結(jié)果來看:

(1)耗氧量y與1.5英里跑所用時間x3、靜止時心跳速率x4、跑步時心跳速率x5相關(guān)程度較高,其中耗氧量與1.5英里跑所用時間的r=-0.832,伴隨概率P=0.000<0.01,屬于高度負相關(guān);其他兩項r=-0.436,r=-0.420,伴隨概率P分別等于0.014和0.019大于0.01,但小于0.05屬于低度負相關(guān);(2)上述三個變量與耗氧量之間的關(guān)系都屬于負相關(guān)。結(jié)論:跑步速度快、靜止時心跳速率慢、跑步時心跳速率慢的人,耗氧量大;反之,耗氧量小。40三、二元變量分析SPSS操作及案例分析操作步驟:

操作步驟:Analyze→Correlate→Bivariate…數(shù)據(jù)文件:8-Bivariate.sav保存文件:8-Bivariate_all.spv41

偏相關(guān)分析42四、偏相關(guān)分析概念在多元相關(guān)分析中,由于受到其他變量的影響,在計算某兩個變量之間的相關(guān)系數(shù)時,得到的結(jié)果往往不能真實反映變量之間的相關(guān)關(guān)系所以在多元相關(guān)分析中,通常將其他變量固定(控制),而計算某兩個變量之間的相關(guān)系數(shù),稱為偏相關(guān)系數(shù)。偏相關(guān)分析用于計算變量之間的偏相關(guān)系數(shù),可以判斷自變量對因變量的影響程度,舍棄影響較小的自變量,保留影響較大的自變量,從而更準確地判斷變量之間的相關(guān)關(guān)系和相關(guān)程度。43四、偏相關(guān)分析SPSS操作及案例分析

例四:以數(shù)據(jù)文件“Cars.sav”為例,分析在油耗不變的情況下、汽車馬力(horse)和加速度(accel)的偏相關(guān)系數(shù)。44四、偏相關(guān)分析SPSS操作及案例分析結(jié)果分析

汽車馬力和加速度的偏相關(guān)系數(shù)為-0.622,有效樣本數(shù)為389,顯著性水平為0.000,這兩個變量的伴隨概率P=0.000小于0.01,屬于顯著負相關(guān)關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論