典型相關(guān)分析研_第1頁
典型相關(guān)分析研_第2頁
典型相關(guān)分析研_第3頁
典型相關(guān)分析研_第4頁
典型相關(guān)分析研_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

典型相關(guān)分析研第一頁,共二十六頁,編輯于2023年,星期日兩個隨機(jī)變量Y與X→ 簡單相關(guān)系數(shù)一個隨機(jī)變量Y與一組隨機(jī)變量X1,X2,…,Xp→ 復(fù)相關(guān)系數(shù)(多重相關(guān))一組隨機(jī)變量Y1,Y2,…,Yq與另一組隨機(jī)變量X1,X2,…,Xp→ 典型相關(guān)系數(shù)第二頁,共二十六頁,編輯于2023年,星期日典型相關(guān)是研究兩組變量之間相關(guān)性的一種統(tǒng)計分析方法。也是一種降維技術(shù)。由Hotelling(1935,1936)最早提出,CooleyandLohnes(1971)、Kshirsagar(1972)和Mardia,Kent,andBibby(1979)推動了它的應(yīng)用。第一節(jié)典型相關(guān)分析的基本思想第三頁,共二十六頁,編輯于2023年,星期日典型相關(guān)是簡單相關(guān)、多重相關(guān)的推廣;或者說簡單相關(guān)系數(shù)、復(fù)相關(guān)系數(shù)是典型相關(guān)系數(shù)的特例。例:收集了某年某省男生(19~22歲)的資料,欲研究形態(tài)指標(biāo)與機(jī)能指標(biāo)間的相關(guān)性。形態(tài)指標(biāo):身高、坐高、體重、胸圍、肩寬、盆骨寬;

機(jī)能指標(biāo):脈搏、收縮壓、舒張壓、肺活量。第四頁,共二十六頁,編輯于2023年,星期日典型相關(guān)分析示意圖

X1Y1Y2Y3Y4Y5X2X3X4X5X6XYU1U2U3U4U5V1V2V3V4V5CanR1CanR2CanR3CanR4CanR5第五頁,共二十六頁,編輯于2023年,星期日典型相關(guān)分析(canonicalcorrelationanalysis):為了研究兩組變量之間的相互關(guān)系,分別從兩組變量中提取綜合變量(為兩個變量組中各變量的線性組合),并利用各綜合變量之間的相關(guān)性來反映兩組指標(biāo)之間整體相關(guān)性的一種多元統(tǒng)計分析方法。第六頁,共二十六頁,編輯于2023年,星期日第二節(jié)典型相關(guān)分析的數(shù)學(xué)模型

設(shè)有兩組變量為X1,X2…,Xp和Y1,Y2,…,Yq,采用主成分思想尋找綜合變量對即典型(相關(guān))變量(Ui,Vi):第七頁,共二十六頁,編輯于2023年,星期日8典型相關(guān)變量對與典型相關(guān)系數(shù):在典型相關(guān)分析中,分別從兩組原始變量中提取的能反映兩組原始變量間整體相關(guān)信息的綜合變量稱為典型相關(guān)變量,典型相關(guān)變量是成對出現(xiàn)的,并且是按其反映兩組原始變量間整體相關(guān)信息量的大小排序的,如U1、V1之間的相關(guān)系數(shù)最大,則稱U1、V1

為第一對典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為第一典型相關(guān)系數(shù),類似地有第二對,第三對,…,第i對典型變量和第二、第三,…,第i典型相關(guān)系數(shù)。第八頁,共二十六頁,編輯于2023年,星期日典型相關(guān)變量的性質(zhì):第九頁,共二十六頁,編輯于2023年,星期日10即:同一組指標(biāo)的各典型變量(Ui與Uj)(j=1,2,…,i-1)之間互不相關(guān);不同組指標(biāo)的典型變量(Ui與Vj)(i≠j)之間互不相關(guān);各典型變量Ui與Vj的方差均為1;第十頁,共二十六頁,編輯于2023年,星期日11第三節(jié)典型相關(guān)變量及典型相關(guān)系數(shù)的求法

(了解)1.對各原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。2.求出X,Y的相關(guān)矩陣ΣXX,ΣYY及X與Y的相關(guān)矩陣ΣXY。3.求出所有非零根,進(jìn)而求得各典型相關(guān)系數(shù),并按大小順序排列。4.取最大根λ1,進(jìn)而求得非零解a1′=(a11,a12,…,a1p)

,b1′

=(

b11,b12,…,b1q)5.寫出第一對典型相關(guān)變量。6.求出第i對典型相關(guān)變量。第十一頁,共二十六頁,編輯于2023年,星期日12第四節(jié)典型相關(guān)系數(shù)的假設(shè)檢驗如果前m個典型相關(guān)系數(shù)在水準(zhǔn)α下有統(tǒng)計學(xué)意義,而其余的典型相關(guān)系數(shù)都不具有統(tǒng)計學(xué)意義,則可以認(rèn)為m對典型相關(guān)變量已經(jīng)把X與Y之間存在的全部相關(guān)信息進(jìn)行了分解并提取出來了。如果第一典型相關(guān)系數(shù)λ1無統(tǒng)計學(xué)意義,則可認(rèn)為兩組指標(biāo)X與Y之間互不相關(guān),不能進(jìn)行典型相關(guān)分析。在實際應(yīng)用中,通常只取第一對典型相關(guān)變量,因為第一對相關(guān)變量的專業(yè)意義較為明顯,且足以表達(dá)兩組指標(biāo)間的相關(guān)性。第十二頁,共二十六頁,編輯于2023年,星期日13第五節(jié)應(yīng)用實例

例21-1為了探討小學(xué)生的生長發(fā)育指標(biāo)與身體素質(zhì)的相互關(guān)系,某市對小學(xué)生的體質(zhì)進(jìn)行調(diào)查。先僅對84例10歲男孩的四項生長發(fā)育指標(biāo):肺活量、身高、體重、胸圍與四項反映身體素質(zhì)的指標(biāo):50m跑、跳高、跳遠(yuǎn)、實心球擲遠(yuǎn)進(jìn)行典型相關(guān)分析。編號肺活量X1(L)身高X2(cm)體重X3(kg)胸圍X4(cm)50m跑Y1(s)跳高Y2(cm)跳遠(yuǎn)Y3(m)實心球擲遠(yuǎn)Y4(m)11210120.123.861.010.2662.012.7321210120.723.459.811.3681.922.7131040121.222.959.010.1671.922.60………………………831580136.632.367.210.3872.664.04842370147.438.873.010.8912.824.38第十三頁,共二十六頁,編輯于2023年,星期日14SPSS的實現(xiàn):1.打開例21-1SPSS數(shù)據(jù)文件2.通過File-New-Date-Syntax打開一個空白文件,再在其中鍵入下面命令行:include'C:\ProgramFiles\SPSS\canonicalcorrelation.sps'.

cancorrset1=x1tox4/

set2=y1toy4/.3.再點(diǎn)擊一個向右的三角形圖標(biāo)(運(yùn)行目前程序,Runcurrent),就可以得到所需結(jié)果了。4.還可以把Syntax1.sps另以其他名字(比如tv.sps)存入一個文件夾。下次使用時就可以通過File-Open-Syntax來打開這個文件了。第十四頁,共二十六頁,編輯于2023年,星期日151.打開SPSS數(shù)據(jù)文件SPSS操作第十五頁,共二十六頁,編輯于2023年,星期日16SPSS操作2.編輯語法第十六頁,共二十六頁,編輯于2023年,星期日17編輯語法窗口第十七頁,共二十六頁,編輯于2023年,星期日18結(jié)果各典型相關(guān)系數(shù)依次為:λ1=0.886,λ2=0.279,λ3=0.279,λ4=0.038。并由檢驗可知,只有第一典型相關(guān)系數(shù)有統(tǒng)計學(xué)意義。因此,只取第一對典型相關(guān)變量。第十八頁,共二十六頁,編輯于2023年,星期日19原始的U典型相關(guān)變量原始的第一對典型相關(guān)變量為:原始的V典型相關(guān)變量原始的第一對典型相關(guān)變量為:第十九頁,共二十六頁,編輯于2023年,星期日20標(biāo)準(zhǔn)化的U典型相關(guān)變量標(biāo)準(zhǔn)化的V典型相關(guān)變量標(biāo)準(zhǔn)化的的第一對典型相關(guān)變量為:第二十頁,共二十六頁,編輯于2023年,星期日21

由標(biāo)準(zhǔn)化的典型相關(guān)變量可得:U1主要受X2和X4的影響,V1則在Y2和Y4上的權(quán)重較大。說明個子較為高大的男孩在跳高和實心球擲遠(yuǎn)這兩個項目上的成績較好。

V第二組原始指標(biāo)50m跑Y1跳高Y2跳遠(yuǎn)Y3實心球Y4典型相關(guān)0.886身高X2體重X3胸圍X4肺活量X1U第一組原始指標(biāo)0.4360.4800.6610.301第二十一頁,共二十六頁,編輯于2023年,星期日22對應(yīng)分析CorrespondenceAnalysis第二十二頁,共二十六頁,編輯于2023年,星期日23對應(yīng)分析:簡單對應(yīng)分析:兩個分類變量間的類別聯(lián)系多重對應(yīng)分析:多個分類變量間的類別聯(lián)系第二十三頁,共二十六頁,編輯于2023年,星期日24表1318例COPD患者的COPD分級與中醫(yī)證候分布COPD分級肺氣虛脾氣虛腎陽虛陰陽兩虛腎陰虛痰濁證血瘀證Ⅰ141220040Ⅱa4925402119Ⅱb261715241720Ⅲ12141675724

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論