




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第八章相關(guān)分析1主要內(nèi)容8.0相關(guān)分析概述8.1二元變量相關(guān)分析8.2偏相關(guān)分析8.3距離分析28.0相關(guān)分析概述(1)函數(shù)關(guān)系與相關(guān)關(guān)系
變量之間的關(guān)系可以分為兩種:一種是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系。函數(shù)關(guān)系是一一對應(yīng)的確定性關(guān)系,比較容易分析和測度??墒窃诂F(xiàn)實世界中,變量間的關(guān)系往往并不是簡單的確定性關(guān)系,也就是說,變量之間有著密切的關(guān)系,但又不能由一個或幾個變量的值確定另一個變量的值,即當(dāng)自變量x取某一值時,因變量y的值可能會有多個。這種變量之間的非一一對應(yīng)的、不確定性的關(guān)系,稱之為相關(guān)關(guān)系。
(2)相關(guān)分析基本概念衡量事物之間,或稱變量之間線性相關(guān)程度的強弱并用適當(dāng)?shù)慕y(tǒng)計指標(biāo)表示出來,這個過程就是相關(guān)分析。相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個指標(biāo),總體的相關(guān)系數(shù)用ρ表示,樣本的相關(guān)系數(shù)用r表示。
38.1二元變量相關(guān)分析(1)基本概念
二元變量的相關(guān)分析是指通過計算變量間兩兩相關(guān)的相關(guān)系數(shù),對兩個或兩個以上變量之間兩兩相關(guān)的程度進行分析。根據(jù)所研究的變量類型不同,又可以分為二元定距變量的相關(guān)分析和二元定序變量的相關(guān)分析。
(2)統(tǒng)計原理二元定距變量的相關(guān)分析:定距變量又稱為間隔(interval)變量(即連續(xù)屬性變量),變量值之間可以比較大小,可以用加減法計算出差異的大小。
Pearson簡單相關(guān)系數(shù)及t統(tǒng)計量
58.1二元變量相關(guān)分析定序變量的相關(guān)性分析:定序變量又稱為有序(ordinal)變量、順序變量、等級變量,它取值的大小能夠表示觀測對象的某種順序關(guān)系(等級、方位或大小等)。定序變量的相關(guān)系數(shù)用斯皮爾曼(Spearman)相關(guān)系數(shù)和肯德爾(Kendall’s)相關(guān)系數(shù)來衡量。
Spearman相關(guān)系數(shù)及Z統(tǒng)計量Kendall’s等級相關(guān)系數(shù)及Z統(tǒng)計量68.1二元變量相關(guān)分析(3)分析步驟第1步計算相關(guān)系數(shù)r:利用樣本數(shù)據(jù)計算樣本相關(guān)系數(shù),樣本相關(guān)系數(shù)反映了兩變量間線性相關(guān)程度的強弱。相關(guān)系數(shù)的取值范圍界于-1與1之間,即-1≤r≤1當(dāng)0<r≤
1,表明變量之間存在正相關(guān)關(guān)系;當(dāng)-1≤
r<0,表明變量之間存在負相關(guān)關(guān)系;當(dāng)|r|=1時,表示其中一個變量的取值完全取決于另一個變量,二者即為函數(shù)關(guān)系;當(dāng)r=0時,說明變量之間不存在線性相關(guān)關(guān)系,但這并不排除變量之間存在其它非線性相關(guān)的可能。
根據(jù)經(jīng)驗可將其相關(guān)程度分為幾種:當(dāng)|r|≥0.8時視為高度相關(guān);當(dāng)0.5≤|r|<0.8時視為中度相關(guān);當(dāng)0.3≤|r|<0.5時視為低度相關(guān);當(dāng)|r|<0.3時說明變量之間的相關(guān)性很弱。78.1二元變量相關(guān)分析第2步對樣本來自的兩總體是否存在顯著的線性關(guān)系進行推斷:由于存在抽樣的隨機性和樣本數(shù)量較少等原因,通常樣本相關(guān)系數(shù)不能直接用來說明樣本來自的兩總體是否具有顯著的線性相關(guān)性,需要通過假設(shè)檢驗的方式對樣本的總體進行統(tǒng)計推斷。提出零假設(shè)H0:即兩總體無顯著的線性關(guān)系;構(gòu)造檢驗統(tǒng)計量:由于不同的相關(guān)系數(shù)采用不同的檢驗統(tǒng)計量,因此在相關(guān)分析時,不同的過程需要構(gòu)造不同的檢驗統(tǒng)計量;計算檢驗統(tǒng)計量的觀測值及對應(yīng)的概率p值;對兩總體的相關(guān)性進行推斷:如果檢驗統(tǒng)計量的概率p值小于給定的顯著性水平,應(yīng)拒絕零假設(shè),即認為兩總體之間存在顯著性線性關(guān)系;反之,應(yīng)接受零假設(shè)。88.1二元變量相關(guān)分析第3步二元相關(guān)分析設(shè)置:按如下圖所示設(shè)置,并打開Options…按鈕,在打開的對話框中選擇“Meansandstandarddeviations”和“Cross-productdeviationandcovariances”選項。10主要內(nèi)容8.0相關(guān)分析概述8.1二元變量相關(guān)分析8.2偏相關(guān)分析8.3距離分析128.2偏相關(guān)分析檢驗的統(tǒng)計量為:(3)統(tǒng)計分析步驟第1步根據(jù)公式計算偏相關(guān)系數(shù);第2步對樣本來自的兩總體是否存在顯著性相關(guān)進行推斷。提出零假設(shè)H0:即兩總體的偏相關(guān)系數(shù)與零無顯著性差異;選擇檢驗統(tǒng)計量:偏相關(guān)分析選擇的是t統(tǒng)計量;計算t值及對應(yīng)的概率p值;決策:如果相伴概率p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認為兩總體的偏相關(guān)系數(shù)與零有顯著性差異;否則,接受原假設(shè)。
148.2偏相關(guān)分析(4)SPSS實現(xiàn)舉例【例8-3】下表是四川綿陽地區(qū)3年生中山柏的數(shù)據(jù),分析月生長量與月平均氣溫、月降雨量、月平均日照時數(shù)、月平均濕度4個氣候因素中哪些因素有關(guān)。
月份月生長量月平均氣溫月降雨量月平均日照時數(shù)月平均濕度月份月生長量月平均氣溫月降雨量月平均日照時數(shù)月平均濕度10.014.21754.58171824.796.9101.68320.57.410.873.879819.324.5269.5164.68631.51017.484.775914.822194.881.683410.816.119.7137751010.31858.1848251321.1248.7149.67711813.14.979.381616.323.972.2109.5791216.812.666.582158.2偏相關(guān)分析第1步分析:這4個氣候因素彼此均有影響,分析時應(yīng)對生長量與4個氣候因素分別求偏相關(guān),如在求生長量與氣候因素的相關(guān)時控制其他因素的影響。所以需進行偏相關(guān)分析;第2步數(shù)據(jù)組織:如上表定義4個變量,輸入數(shù)據(jù)即可;第3步進行偏相關(guān)分析:按Analyze→Correlate→Partial順序啟動偏相關(guān)分析的主對話框,第一次分析變量“hgrow”和“temp”的偏相關(guān)系數(shù),并將“rain”、“hsun”、“humi”設(shè)為控制變量。如下圖所示設(shè)置:168.2偏相關(guān)分析第4步主要結(jié)果及分析。CorrelationsControlVariableshgrowtemprain&hsun&humihgrowCorrelation1.000.977Significance(2-tailed)..000df07tempCorrelation.9771.000Significance(2-tailed).000.df70“rain”、“hsun”和“humi”為控制變量,“hgrow”(生長量)與“temp”(氣溫)關(guān)系密切,偏相關(guān)系數(shù)0.977,雙尾檢測的相伴概率為0.000(表示趨近于0的正數(shù)),明顯小于顯著性水平0.05。故應(yīng)拒絕零假設(shè),說明中山柏的生長量與氣溫間存在顯著的相關(guān)性。17主要內(nèi)容8.0相關(guān)分析概述8.1二元變量相關(guān)分析8.2偏相關(guān)分析8.3距離分析188.3距離分析相似性測度
對于定距數(shù)據(jù)主要使用皮爾遜相關(guān)系數(shù)和夾角余弦距離;對于二值數(shù)據(jù)的相似性測度主要包括簡單匹配系數(shù)、Jaccard相似性指數(shù)、Hamann相似性測度等20余種。其中的距離又分為個案(觀測記錄)之間的距離和變量之間的距離兩種。(3)分析步驟
距離分析中不存在假設(shè)檢驗問題,主要是通過SPSS自動計算變量或個案之間的相似性或不相似性距離,根據(jù)其計算距離值的大小來確定變量或個案之間的相似性或不相似性的強弱。208.3距離分析(4)SPSS實現(xiàn)舉例【例8-4】已知我國四城市2004年各月的日照時數(shù)如下表所示,請分析各城市日照數(shù)是否近似。月份北京天津石家莊大連月份北京天津石家莊大連1194.7161.7193.8163.57203.2179.5185.4228.52213.5185.2219.2195.38187.4149.8152.11743243.6166.8220.9223.19198.9178.7203.4202.74248.2214.3240.9276.910225.2194.7220.7228.45253.3221277.9243.411201.4172.8197.5172.96202182.5213.419012144119.197.9167218.3距離分析第4步
主要結(jié)果及分析。ProximityMatrixEuclideanDistanceBeijingTianjinShiJZDalianBeijing.000122.93371.28070.542Tianjin122.933.000111.350121.427ShiJZ71.280111.350.000110.928Dalian70.542121.427110.928.000Thisisadiss
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 豬肉收儲知識培訓(xùn)課件
- 人教版(2024)七年級英語下冊Unit 7 學(xué)情調(diào)研測試卷(含答案)
- 鋼結(jié)構(gòu)切割施工方案
- 2025年中考物理二輪復(fù)習(xí):電磁學(xué)實驗題 能力提升練習(xí)題(含答案)
- 合同范本融資租賃合同
- 課題2 原子結(jié)構(gòu)(第2課時)(教學(xué)設(shè)計)九年級化學(xué)上冊同步高效課堂(人教版2024)
- 如何評估品牌傳播的效果與影響計劃
- 提升產(chǎn)品質(zhì)量的改進措施計劃
- 學(xué)期目標(biāo)與教學(xué)任務(wù)分解計劃
- 實施素質(zhì)教育的年度工作要點計劃
- 大學(xué)生心理健康 第3章-教學(xué)教案-自我意識
- 名著《駱駝祥子》中考真題及典型模擬題訓(xùn)練(原卷版)
- 女性健康知識講座超美的課件
- 2025年興安職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫匯編
- 2025年黑龍江職業(yè)學(xué)院單招職業(yè)技能測試題庫審定版
- 2025年湖南汽車工程職業(yè)學(xué)院單招職業(yè)技能測試題庫參考答案
- 拆除工程方案
- 2025年合肥職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及參考答案
- 天津2025年天津市機關(guān)后勤事務(wù)服務(wù)中心招聘6人筆試歷年參考題庫附帶答案詳解
- 人教版小學(xué)三年級數(shù)學(xué)下冊筆算練習(xí)題
- 山東黃河河務(wù)局公開招考2025高校畢業(yè)生易考易錯模擬試題(共500題)試卷后附參考答案
評論
0/150
提交評論