SPSS統(tǒng)計分析第7章 相關分析(教學課件)_第1頁
SPSS統(tǒng)計分析第7章 相關分析(教學課件)_第2頁
SPSS統(tǒng)計分析第7章 相關分析(教學課件)_第3頁
SPSS統(tǒng)計分析第7章 相關分析(教學課件)_第4頁
SPSS統(tǒng)計分析第7章 相關分析(教學課件)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章相關分析2021/8/231精品PPT模板主要內容7.1相關分析簡介7.2兩變量相關分析7.3偏相關分析7.4距離分析2021/8/232精品PPT模板7.1相關分析簡介(1)函數關系與相關關系

變量之間的關系可以分為兩種:一種是函數關系,另一種是相關關系。函數關系是一一對應的確定性關系,比較容易分析和測度??墒窃诂F實世界中,變量間的關系往往并不是簡單的確定性關系,也就是說,變量之間有著密切的關系,但又不能由一個或幾個變量的值確定另一個變量的值,即當自變量x取某一值時,因變量y的值可能會有多個。這種變量之間的非一一對應的、不確定性的關系,稱之為相關關系。

(2)相關分析基本概念衡量事物之間,或稱變量之間線性相關程度的強弱并用適當的統(tǒng)計指標表示出來,這個過程就是相關分析。相關系數是衡量變量之間相關程度的一個指標,總體的相關系數用ρ表示,樣本的相關系數用r表示。

2021/8/233精品PPT模板

相關關系的種類1按涉及的變量分:簡單相關和復相關2按表現形式分:線性相關和非線性相關3按變化方向分:正相關和負相關4按相關程度分:不相關、低度相關、顯著相關、高度相關和完全相關2021/8/234精品PPT模板主要內容7.1相關分析簡介7.2兩變量相關分析7.3偏相關分析7.4距離分析2021/8/235精品PPT模板7.1二元變量相關分析(1)基本概念

二元變量的相關分析是指通過計算變量間兩兩相關的相關系數,對兩個或兩個以上變量之間兩兩相關的程度進行分析。根據所研究的變量類型不同,又可以分為二元定距變量的相關分析和二元定序變量的相關分析。

(2)統(tǒng)計原理二元定距變量的相關分析:定距變量又稱為間隔(interval)變量(即連續(xù)屬性變量),變量值之間可以比較大小,可以用加減法計算出差異的大小。

Pearson簡單相關系數及t統(tǒng)計量

2021/8/236精品PPT模板7.1二元變量相關分析定序變量的相關性分析:定序變量又稱為有序(ordinal)變量、順序變量、等級變量,它取值的大小能夠表示觀測對象的某種順序關系(等級、方位或大小等)。定序變量的相關系數用斯皮爾曼(Spearman)相關系數和肯德爾(Kendall’s)相關系數來衡量。

Spearman相關系數及Z統(tǒng)計量Kendall’s等級相關系數及Z統(tǒng)計量2021/8/237精品PPT模板7.2二元變量相關分析(3)分析步驟第1步計算相關系數r:利用樣本數據計算樣本相關系數,樣本相關系數反映了兩變量間線性相關程度的強弱。相關系數的取值范圍界于-1與1之間,即-1≤r≤1當0<r≤

1,表明變量之間存在正相關關系;當-1≤

r<0,表明變量之間存在負相關關系;當|r|=1時,表示其中一個變量的取值完全取決于另一個變量,二者即為函數關系;當r=0時,說明變量之間不存在線性相關關系,但這并不排除變量之間存在其它非線性相關的可能。

根據經驗可將其相關程度分為幾種:當|r|≥0.8時視為高度相關;當0.5≤|r|<0.8時視為中度相關;當0.3≤|r|<0.5時視為低度相關;當|r|<0.3時說明變量之間的相關性很弱。2021/8/238精品PPT模板第2步對樣本來自的兩總體是否存在顯著的線性關系進行推斷:由于存在抽樣的隨機性和樣本數量較少等原因,通常樣本相關系數不能直接用來說明樣本來自的兩總體是否具有顯著的線性相關性,需要通過假設檢驗的方式對樣本的總體進行統(tǒng)計推斷。提出零假設H0:即兩總體無顯著的線性關系;構造檢驗統(tǒng)計量:由于不同的相關系數采用不同的檢驗統(tǒng)計量,因此在相關分析時,不同的過程需要構造不同的檢驗統(tǒng)計量;計算檢驗統(tǒng)計量的觀測值及對應的概率p值;對兩總體的相關性進行推斷:如果檢驗統(tǒng)計量的概率p值小于給定的顯著性水平,應拒絕零假設,即認為兩總體之間存在顯著性線性關系;反之,應接受零假設。7.2二元變量相關分析2021/8/239精品PPT模板(4)SPSS實現舉例【例7-1】為了分析父親與兒子身高之間的相關性,現抽樣了12對父子的身高,數據如下表。請對其進行相關性分析(顯著性水平取α=0.05)。

7.2二元變量相關分析父親身高656367646862706668676971兒子身高686668656966686571676870第1步分析:身高是定距變量,考慮用Pearson相關系數來衡量。第2步數據的組織:分成兩列,一列是父親的身高,另一列是兒子的身高。

2021/8/2310精品PPT模板7.2二元變量相關分析第3步選擇菜單“分析→相關→雙變量”,打開如圖7-1所示的對話框,將“father”和“son”兩變量移入“變量”框中;“相關系數”選擇Pearson;在“顯著性檢驗”中選擇“雙側檢驗”;2021/8/2311精品PPT模板7.2二元變量相關分析第4步主要結果及分析。其中包括了叉積離差矩陣、協(xié)方差矩陣、Pearson相關系數及相伴概率p值。從表中可看出,相關系數為0.703>0,說明呈正相關,而相伴概率值Sig.=0.005<0.05,因此應拒絕零假設(H0:兩變量之間不具相關性),即說明兒子身高是受父親身高顯著性正影響的。

父親身高兒子身高父親身高Pearson相關性1.703*顯著性(雙側)

.011平方與叉積的和84.66740.333協(xié)方差7.6973.667N1212兒子身高Pearson相關性.703*1顯著性(雙側).011

平方與叉積的和40.33338.917協(xié)方差3.6673.538N1212*.在

0.05水平(雙側)上顯著相關。2021/8/2312精品PPT模板主要內容7.1相關分析簡介7.2兩變量相關分析7.3偏相關分析7.4距離分析2021/8/2313精品PPT模板(1)基本概念

偏相關分析的任務就是在研究兩個變量之間的線性相關關系時控制可能對其產生影響的變量,這種相關系數稱為偏相關系數。偏相關系數的數值和簡單相關系數的數值常常是不同的,在計算簡單相關系數時,所有其他自變量不予考慮。

(2)統(tǒng)計原理控制一個變量和控制兩個變量的偏相關系數分別為:7.3偏相關分析2021/8/2314精品PPT模板檢驗的統(tǒng)計量為:(3)統(tǒng)計分析步驟第1步根據公式計算偏相關系數;第2步對樣本來自的兩總體是否存在顯著性相關進行推斷。提出零假設H0:即兩總體的偏相關系數與零無顯著性差異;選擇檢驗統(tǒng)計量:偏相關分析選擇的是t統(tǒng)計量;計算t值及對應的概率p值;決策:如果相伴概率p值小于給定的顯著性水平,則應拒絕零假設,認為兩總體的偏相關系數與零有顯著性差異;否則,接受原假設。

7.3偏相關分析2021/8/2315精品PPT模板(4)SPSS實現舉例【例7-3】下表是四川綿陽地區(qū)3年生中山柏的數據,分析月生長量與月平均氣溫、月降雨量、月平均日照時數、月平均濕度4個氣候因素中哪些因素有關。

7.3偏相關分析月份月生長量月平均氣溫月降雨量月平均日照時數月平均濕度月份月生長量月平均氣溫月降雨量月平均日照時數月平均濕度10.014.21754.58171824.796.9101.68320.57.410.873.879819.324.5269.5164.68631.51017.484.775914.822194.881.683410.816.119.7137751010.31858.1848251321.1248.7149.67711813.14.979.381616.323.972.2109.5791216.812.666.5822021/8/2316精品PPT模板7.3偏相關分析第1步分析:這4個氣候因素彼此均有影響,分析時應對生長量與4個氣候因素分別求偏相關,如在求生長量與氣候因素的相關時控制其他因素的影響。所以需進行偏相關分析;第2步數據組織:如上表定義4個變量,輸入數據即可;第3步進行偏相關分析:選擇菜單“分析→相關→雙變量”,指定分析變量和控制變量,分析變量“hgrow”和“temp”的偏相關系數,并將“rain”、“hsun”、“humi”設為控制變量。如下圖所示設置。2021/8/2317精品PPT模板第4步主要結果及分析。7.3偏相關分析從中可以看出,月降雨量、月平均日照時數和月平均濕度為控制變量,生長量與月平均氣溫關系密切,偏相關系數為0.977,雙尾檢測的相伴概率為0.000(表示趨近于0的正數),明顯小于顯著性水平0.05。故應拒絕原假設,說明中山柏的生長量與氣溫間存在顯著的相關性??刂谱兞可L量月平均氣溫月降雨量

&月平均日照時數

&月平均濕度生長量相關性1.000.977顯著性(雙側)..000df07月平均氣溫相關性.9771.000顯著性(雙側).000.df702021/8/2318精品PPT模板主要內容7.1相關分析簡介7.2兩變量相關分析7.3偏相關分析7.4距離分析2021/8/2319精品PPT模板(1)基本概念距離分析是對觀測量之間相似或不相似程度的一種測度,是計算一對觀測量之間的廣義距離。這些相似性或距離測度可以用于其他分析過程,例如因子分析、聚類分析或多維定標分析,有助于分析復雜的數據集。

(2)統(tǒng)計原理不相似性測度對定距數據的不相似性(距離)測度可以使用的統(tǒng)計量有:歐幾里得距離、平方歐氏距離、切比雪夫距離、Block距離、明可斯基距離等。對定序數據,主要使用卡方不相似測度和斐方測度。對二值(只有兩種取值)數據變量之間的距離描述,使用歐氏距離、平方歐氏距離、尺寸差異、模式差異、方差、形或蘭斯和威廉斯等距離統(tǒng)計量。7.4距離分析2021/8/2320精品PPT模板相似性測度對于定距數據主要使用皮爾遜相關系數和夾角余弦距離;對于二值數據的相似性測度主要包括簡單匹配系數、Jaccard相似性指數、Hamann相似性測度等20余種。7.4距離分析其中的距離又分為個案(觀測記錄)之間的距離和變量之間的距離兩種。(3)分析步驟

距離分析中不存在假設檢驗問題,主要是通過SPSS自動計算變量或個案之間的相似性或不相似性距離,根據其計算距離值的大小來確定變量或個案之間的相似性或不相似性的強弱。2021/8/2321精品PPT模板(4)SPSS實現舉例【例7-4】已知我國四城市2004年各月的日照時數如下表所示,請分析各城市日照數是否近似。7.4距離分析月份北京天津石家莊大連月份北京天津石家莊大連1194.7161.7193.8163.57203.2179.5185.4228.52213.5185.2219.2195.38187.4149.8152.11743243.6166.8220.9223.19198.9178.7203.4202.74248.2214.3240.9276.910225.2194.7220.7228.45253.3221277.9243.411201.4172.8197.5172.96202182.5213.419012144119.197.91672021/8/2322精品PPT模板第1步分析:這是考查4個城市的日照時數是否相似的問題,可用距離分析實現。既可以計算其相似性測度,亦可計算其不相似性測度;第2步數據組織:分別定義的變量:month”(月份)(用字符型變量)、“Beijing”(北京)、“Tianjin”(天津)、“ShiJZ”(石家莊)、“Dalian”(大連)。7.4距離分析2021/8/2323精品PPT模板7.4距離分析第3步進行距離分析:選擇菜單“分析→相關→距離”,彈出下圖所示的“距離”對話框,將4個變量(“北京”、“天津”、“石家莊”、“大連”)移入“變量”框中進行相似性度量計算;在“計算距離”組中選中“個案間”單選框,進行變量間的距離分析;在“度量標準”單選框組中選中不相似性,求解其不相似性度量。

2021/8/2324精品PPT模板第4步主要結果及分析。7.4距離分析表格的第一行(Euclidean距離)說明采用的是歐氏距離。這是一個對稱矩陣,當兩變量的歐氏距離越大,說明其差別越大,反之越小。從表中可看出“北京”和“大連”的日照數最接近,而“北京”和“天津”的日照數相差最大。

Euclidean距離北京天津石家莊大連北京.000122.93371.28070.542天津122.933.000111.350121.427石家莊71.280111.350.000110.928大連70.542121.427110.928.000這是一個不相似性矩陣。2021/8/2325精品PPT模板TheEnd2021/8/2326精品PPT模板9、人的價值,在招收誘惑的一瞬間被決定。03-2月-2303-2月-23Friday,February3,202310、低頭要有勇氣,抬頭要有低氣。***2/3/20234:38:43PM11、人總是珍惜為得到。03-2月-23**Feb-2303-Feb-2312、人亂于心,不寬余請。***Friday,Februar

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論