典型相關(guān)分析及其應用實例_第1頁
典型相關(guān)分析及其應用實例_第2頁
典型相關(guān)分析及其應用實例_第3頁
典型相關(guān)分析及其應用實例_第4頁
典型相關(guān)分析及其應用實例_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

/摘要典型相關(guān)分析是多元統(tǒng)計分析的一個重要研究課題。它是研究兩組變量之間相關(guān)的一種統(tǒng)計分析方法,能夠有效地揭示兩組變量之間的相互線性依賴關(guān)系。它借助主成分分析降維的思想,用少數(shù)幾對綜合變量來反映兩組變量間的線性相關(guān)性質(zhì).目前它已經(jīng)在眾多領(lǐng)域的相關(guān)分析和預測分析中得到廣泛應用.本文首先描述了典型相關(guān)分析的統(tǒng)計思想,定義了總體典型相關(guān)變量及典型相關(guān)系數(shù),并簡要概述了它們的求解思路,然后深入對樣本典型相關(guān)分析的幾種算法做了比較全面的論述.根據(jù)典型相關(guān)分析的推理,歸納總結(jié)了它的一些重要性質(zhì)并給出了證明,接著推導了典型相關(guān)系數(shù)的顯著性檢驗.最后通過理論與實例分析兩個層面論證了典型相關(guān)分析的應用于實際生活中的可行性與優(yōu)越性?!娟P(guān)鍵詞】典型相關(guān)分析,樣本典型相關(guān),性質(zhì),實際應用ABSTRACTTheCanonicalCorrelationAnalysisisanimportantstudyingtopicoftheMultivariateStatisticalAnalysis。Itisthestatisticalanalysismethodwhichstudiesthecorrelationbetweentwosetsofvariables。Itcanworktorevealthemutuallinedependencerelationavailablybetweentwosetsofvariables.WiththehelpofthethoughtaboutthePrincipalComponents,wecanuseafewcomprehensivevariablestoreflectthelinearrelationshipbetweentwosetsofvariables.NowadaysIthasalreadybeenusedwidelyinthecorrelationanalysisandforecastedanalysis。ThistextdescribesthestatisticalthoughtoftheCanonicalCorrelationAnalysisfirstly,andthendefinesthetotalcanonicalcorrelationvariablesandcanonicalcorrelationcoefficient,andsumuptheirsolutionmethodbriefly.AfteritIgodeepintodiscusssomealgorithmofthesamplecanonicalcorrelationanalysisthoroughly.AccordingtothereasoningoftheCanonicalCorrelationAnalysis,sumupsomeofitsimportantpropertiesandgivetheidentification,followingit,Iinferthesignificancetestingaboutthecanonicalcorrelationcoefficient。Accordingtotheanalysisfromthetheoriesandtheapplication,wecanachievethepossibilityandthesuperiorityfromcanonicalcorrelationanalysisinthereallife?!綤eywords】CanonicalCorrelationAnalysis,Samplecanonicalcorrelation,Character,Practicalapplications目錄TOC\o"1-3”\h\z\u_Toc168575294”第1章典型相關(guān)分析的數(shù)學描述 2第2章典型變量與典型相關(guān)系數(shù) 32.1總體典型相關(guān) 32。2樣本典型相關(guān) 42.2。2典型相關(guān)變量的一般解法 92.2.3從相關(guān)矩陣出發(fā)計算典型相關(guān) 9第3章典型相關(guān)變量的性質(zhì) 12HYPERLINK\l”_Toc168575302”第4章典型相關(guān)系數(shù)的顯著性檢驗 16HYPERLINK\l”_Toc168575303”第5章典型相關(guān)分析的計算步驟及應用實例 195.1典型相關(guān)分析的計算步驟 19HYPERLINK\l”_Toc168575305”5.2實例分析 20參考文獻 29HYPERLINK\l”_Toc168575309”附錄 29前言典型相關(guān)分析(CanonicalCorrelationAnalysis,CCA)作為多元統(tǒng)計學的一個重要部分,是相關(guān)分析研究的一個主要內(nèi)容。典型相關(guān)分析不僅其方法本身具有重要的理論意義,而且它還可以作為其他分析方法,如多重回歸、判別分析和相應分析的工具,因此在多元分析方法中占有特殊的地位.典型相關(guān)的概念是在兩個變量相關(guān)的基礎(chǔ)上發(fā)展起來的。我們知道,兩個隨機變量的相關(guān)關(guān)系可以用它們的簡單相關(guān)系數(shù)來衡量;一個隨機變量與一組隨機變量之間的相關(guān)關(guān)系可以用復相關(guān)系數(shù)來衡量。但考慮一組隨機變量與另一組隨機變量的關(guān)系時,如果運用兩個變量的相關(guān)關(guān)系,分別考慮第一組每個變量和第二組中每個變量的相關(guān),或者運用復相關(guān)關(guān)系,考慮一組變量中的每個變量和另一組變量的相關(guān),這樣做比較繁瑣,抓不住要領(lǐng)。因此,為了用比較少的變量來反映兩組變量之間的相關(guān)關(guān)系,一種考慮的思路就是類似主成分分析,考慮兩組變量的線性組合,從這兩個線性組合中找出最相關(guān)的綜合變量,通過少數(shù)幾個綜合變量來反映兩組變量的相關(guān)性質(zhì),這樣便引出了典型相關(guān)分析。典型相關(guān)分析的基本思想是首先在每組變量中找出變量的線性組合,使其具有最大相關(guān)性,然后再在每組變量中找出第二對線性組合,使其分別與第一對線性組合不相關(guān),而第二對本身具有最大的相關(guān)性,如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為止.有了這樣線性組合的最大相關(guān),則討論兩組變量之間的相關(guān),就轉(zhuǎn)化為只研究這些線性組合的最大相關(guān),從而減少研究變量的個數(shù).典型相關(guān)分析是由Hotelling于1936年提出的.就目前而言,它的理論己經(jīng)比較完善,計算機的發(fā)展解決了典型相關(guān)分析在應用中計算方面的困難,成為普遍應用的進行兩組變量之間相關(guān)性分析技術(shù).如在生態(tài)環(huán)境方面,用典型相關(guān)理論對預報場與因子場進行分析,實現(xiàn)了短期氣象預測;借助典型相關(guān),分析了植被與環(huán)境的關(guān)系;在社會生活領(lǐng)域,應用典型相關(guān)分析了物價指標和影響物價因素的相關(guān)關(guān)系等等.第1章典型相關(guān)分析的數(shù)學描述一般地,假設(shè)有一組變量與另一組變量,我們要研究這兩組變量之間的相關(guān)關(guān)系,如何給兩組變量之間的相關(guān)性以數(shù)量的描述.當1時,就是我們常見的研究兩個變量與之間的簡單相關(guān)關(guān)系,其相關(guān)系數(shù)是最常見的度量,定義為:當(或)時,維隨機向量,設(shè),,其中,是第一組變量的協(xié)方差陣,是第一組與第二組變量的協(xié)方差陣,是第二組變量的協(xié)方差陣.則稱為與的全相關(guān)系數(shù),全相關(guān)系數(shù)用于度量一個隨機變量與另一組隨機變量的相關(guān)系數(shù)。當時,利用主成分分析的思想,可以把多個變量與多個變量之間的相關(guān)化為兩個新的綜合變量之間的相關(guān)。也就是做兩組變量的線性組合即其中,和為任意非零向量,于是我們把研究兩組變量之間的問題化為研究兩個變量之間的相關(guān)問題,希望尋求,使,之間最大可能的相關(guān),我們稱這種相關(guān)為典型相關(guān),基于這種原則的分析方法就是典型相關(guān)分析.第2章典型變量與典型相關(guān)系數(shù)2。1總體典型相關(guān)設(shè)有兩組隨機變量,,分別為隨機向量,根據(jù)典型相關(guān)分析的思想,我們用和的線性組合和之間的相關(guān)性來研究兩組隨機變量和之間的相關(guān)性。我們希望找到,使得最大。由相關(guān)系數(shù)的定義易得出對任意常數(shù),均有這說明使得相關(guān)系數(shù)最大的并不唯一。因此,為避免不必要的結(jié)果重復,我們在求綜合變量時常常限定,于是,我們就有了下面的定義:設(shè)有兩組隨機變量,,維隨機向量的均值向量為零,協(xié)方差陣(不妨設(shè))。如果存在和,使得在約束條件,下,則稱是的典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為典型相關(guān)系數(shù);其他典型相關(guān)變量定義如下:定義了前對典型相關(guān)變量之后,第對典型相關(guān)變量定義為:如果存在和,使得⑴和前面的對典型相關(guān)變量都不相關(guān);⑵,;⑶的相關(guān)系數(shù)最大,則稱是的第對(組)典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為第個典型相關(guān)系數(shù)()。2.2樣本典型相關(guān)以上是根據(jù)總體情況已知的情形進行,而實際研究中,總體均值向量和協(xié)方差陣通常是未知的,因而無法求得總體的典型相關(guān)變量和典型相關(guān)系數(shù),首先需要根據(jù)觀測到的樣本數(shù)據(jù)陣對進行估計.2.2。1第一對典型相關(guān)變量的解法設(shè)總體,已知總體的次觀測數(shù)據(jù)為:(),于是樣本數(shù)據(jù)陣為若假定則由參考文獻【2】中定理2。5.1知協(xié)方差陣的最大似然估計為其中=,樣本協(xié)方差矩陣為:式中,令,,則樣本的相關(guān)系數(shù)為又因為:所以由于,乘以任意常數(shù)并不改變他們之間的相關(guān)系數(shù),即不妨限定取標準化的與,即限定及的樣本方差為1,故有:(2。2.1)則(2.2.2)于是我們要求的問題就是在(2.2。1)的約束條件下,求,,使得式(2。2。2)達到最大。這是條件極值的問題,由拉格朗日乘子法,此問題等價于求,,使(2。2.3)達到最大。式中,,為拉格朗日乘數(shù)因子.對上式分別關(guān)于,求偏導并令其為0,得方程組:(2.2.4)分別用,左乘方程(2.2.4)得又所以也就是說,正好等于線性組合與之間的相關(guān)系數(shù),于是(2。2。4)式可寫為:或(2.2.5)而式(2。2。5)有非零解的充要條件是:(2。2。6)該方程左端是的次多項式,因此有個根。求解的高次方程(2.2。6),把求得的最大的代回方程組(2.2。5),再求得和,從而得出第一對典型相關(guān)變量.具體計算時,因的高次方程(2.2。6)不易解,將其代入方程組(2.2。5)后還需求解階方程組。為了計算上的方便,我們做如下變換:用左乘方程組(2.2.5)的第二式,則有—即=又由(2.2。5)的第一式,得代入上式:(2.2.7)再用左乘式(2。2。7),得(2.2。8)因此,對有個解,設(shè)為,對也有個解.類似地,用左乘式(2.2.5)中的第一式,則有(2。2。9)又由(2。2.5)中的第二式,得代入到(2。2。8)式,有再以左乘上式,得(2.2.10)因此對有個解,對也有個解,因此為的特征根,是對應于的特征向量.同時也是的特征根,為相應特征向量。而式(2。2。8)和(2.2。10)有非零解的充分必要條件為:(2.2.11)對于(2。2。11)式的第一式,由于,,所以,,故有:而與有相同的特征根.如果記則=類似的對式(2.2。11)的第二式,可得而與有相同的非零特征根,從而推出(2。2.8)和(2。2。10)的非零特征根是相同的.設(shè)已求得的個特征根依次為:則的個特征根中,除了上面的個外,其余的個都為零.故個特征根排列是,,因此,只要取最大的,代入方程組(2.2.5)即可求得相應的,.令=與為第一對典型相關(guān)變量,而為第一典型相關(guān)系數(shù).可見求典型相關(guān)系數(shù)及典型相關(guān)變量的問題,就等價于求解的最大特征值及相應的特征向量.2。2.2典型相關(guān)變量的一般解法從樣本典型相關(guān)變量的解法中,我們知道求典型相關(guān)變量和典型相關(guān)系數(shù)的問題,就是求解的最大特征值及相應的特征向量.不僅如此,求解第對典型相關(guān)變量和典型相關(guān)系數(shù),類似的也是求的第大的特征值和相應的特征向量.下面引用參考文獻【2】中定理10.1。1來得出樣本典型相關(guān)的一般求法.設(shè)總體的次觀測數(shù)據(jù)為:()不妨設(shè),樣本均值為0,協(xié)方差矩陣為:記,并設(shè)階方陣的特征值依次為();而為相應的單位正交特征向量。令,則,為第對典型相關(guān)變量,為第典型相關(guān)系數(shù).由上述分析不難看出,典型相關(guān)系數(shù)越大說明相應的典型變量之間的關(guān)系越密切,因此一般在實際中忽略典型相關(guān)系數(shù)很小的那些典型變量,按的大小只取前個典型變量及典型相關(guān)系數(shù)進行分析.2。2。3從相關(guān)矩陣出發(fā)計算典型相關(guān)以上我們從樣本協(xié)方差陣出發(fā),導出了樣本典型相關(guān)變量和樣本典型相關(guān)系數(shù).下面我們從樣本相關(guān)陣出發(fā)來求解樣本典型相關(guān)變量和樣本典型相關(guān)系數(shù).設(shè)樣本相關(guān)陣為,其中,為樣本協(xié)方差陣的行列元素.把相應剖分為有時,的各分量的單位不全相同,我們希望在對各分量作標準化變換之后再做典型相關(guān).記,則,,,對的各分量作標準化變換,即令,現(xiàn)在來求和的典型相關(guān)變量,,.于是因為所以式中,有同理:式中,有,由此可見,為的第對典型系數(shù),其第個典型相關(guān)系數(shù)為,在標準化變換下具有不變性.第3章典型相關(guān)變量的性質(zhì)根據(jù)典型相關(guān)分析的統(tǒng)計思想及推導,我們歸納總結(jié)了典型相關(guān)變量的一些重要性質(zhì)并對總體與樣本分別給出證明.性質(zhì)1同一組的典型變量互不相關(guān)ⅰ總體典型相關(guān)設(shè)的第對典型變量為,,則有證明詳見參考文獻【5】.ⅱ樣本典型相關(guān)設(shè)的第對典型變量為,,因為,,,,表明由組成的第一組典型變量互不相關(guān),且均有相同的方差1;同樣,由組成的第二組典型變量也互不相關(guān),且也有相同的方差1.性質(zhì)2不同組的典型變量之間的相關(guān)性ⅰ總體典型相關(guān)證明詳見參考文獻【5】。ⅱ樣本典型相關(guān),表明不同組的任意兩個典型變量,當時,相關(guān)系數(shù)為;當時是彼此不相關(guān)的.記,,則上述性質(zhì)可用矩陣表示為或其中性質(zhì)3原始變量與典型變量之間的關(guān)系求出典型變量后,進一步計算原始變量與典型變量之間的相關(guān)系數(shù)矩陣,也稱為典型結(jié)構(gòu)。下面我們分別對總體與樣本進行討論.ⅰ總體典型相關(guān)的原始變量與典型變量的相關(guān)性詳見參考文獻【2】。ⅱ樣本典型相關(guān)記=則所以利用協(xié)方差進一步可以計算原始變量與典型變量之間的相關(guān)關(guān)系.若假定原始變量均為標準化變量,則通過以上計算所得到的原始變量與典型變量的協(xié)方差陣就是相關(guān)系數(shù)矩陣.,,性質(zhì)4設(shè)分別為隨機向量,令,,其中為階非退化矩陣,為維常數(shù)向量,為階非退化矩陣,維常數(shù)向量.則:ⅰ對于總體典型相關(guān)有:⑴的典型相關(guān)變量為和,其中,();而是的第對典型相關(guān)變量的系數(shù).⑵,即線性變換不改變相關(guān)性.證明詳見參考文獻【2】。ⅱ對于樣本典型相關(guān)有:⑴的典型相關(guān)變量為和,其中,();而是的第對典型相關(guān)變量的系數(shù).⑵,即線性變換不改變相關(guān)性.證明:⑴設(shè)的典型相關(guān)變量分別為,由于,,所以即有是的第對典型相關(guān)變量的系數(shù).⑵由⑴的證明可知由于與都是常數(shù),所以即有線性變換不改變相關(guān)性.性質(zhì)5簡單相關(guān)、復相關(guān)和典型相關(guān)之間的關(guān)系當,之間的(惟一)典型相關(guān)就是它們之間的簡單相關(guān);當之間的(惟一)典型相關(guān)就是它們的復相關(guān)。復相關(guān)是典型相關(guān)的一個特例,而簡單相關(guān)又是復相關(guān)的一個特例.從第一個典型相關(guān)的定義可以看出,第一個典型相關(guān)系數(shù)至少同的任一分量與的復相關(guān)系數(shù)一樣大,即使所有這些復相關(guān)系數(shù)都很小,第一個典型相關(guān)系數(shù)仍可能很大;同樣,從復相關(guān)的定義也可以看出,當(或)時,之間的復相關(guān)系數(shù)也不會小于的任一分量之間的相關(guān)系數(shù),即使所有這些相關(guān)系數(shù)都很小,復相關(guān)系數(shù)仍可能很大。第4章典型相關(guān)系數(shù)的顯著性檢驗設(shè)總體的兩組變量,,且,在做兩組變量,的典型相關(guān)分析之前,首先應該檢驗兩組變量是否相關(guān),如果不相關(guān),則討論兩組變量的典型相關(guān)就毫無意義??紤]假設(shè)檢驗問題:::至少有一個不為零其中。若檢驗接受,則認為討論兩組變量之間的相關(guān)性沒有意義;若檢驗拒絕,則認為第一對典型變量是顯著的.上式實際上等價于假設(shè)檢驗問題:,:用似然比方法可導出檢驗的似然比統(tǒng)計量其中階樣本離差陣是的最大似然估計,且=,,分別是,的最大似然估計。該似然比統(tǒng)計量的精確分布已由霍特林(1936),Girshik(1939)和Anderson(1958)給出,但表達方式很復雜,又不易找到該分布的臨界值表,下面我們采用的近似分布。利用矩陣行列式及其分塊行列式的關(guān)系,可得出:=所以其中是的特征值(),按大小次序排列為,當時,在成立下近似服從分布,這里,,因此在給定檢驗水平之下,若由樣本算出的臨界值,則否定,也就是說第一對典型變量,具有相關(guān)性,其相關(guān)系數(shù)為,即至少可以認為第一個典型相關(guān)系數(shù)為顯著的.將它除去之后,再檢驗其余個典型相關(guān)系數(shù)的顯著性,這時用提出的大樣本檢驗計算統(tǒng)計量:則統(tǒng)計量近似地服從()()個自由度的分布,如果,則認為顯著,即第二對典型變量,相關(guān),以下逐個進行檢驗,直到某一個相關(guān)系數(shù)檢驗為不顯著時截止.這時我們就找出了反映兩組變量相互關(guān)系的對典型變量.檢驗:當否定時,表明相關(guān),進而可以得出至少第一個典型相關(guān)系數(shù),相應的第一對典型相關(guān)變量可能已經(jīng)提取了兩組變量相關(guān)關(guān)系的絕大部分信息。兩組變量余下的部分可認為不相關(guān),這時,故在否定后,有必要再檢驗,即第個及以后的所有典型相關(guān)系數(shù)均為。為了減少計算量,下面我們采用二分法來減少檢驗次數(shù),取檢驗統(tǒng)計量為它近似服從個自由度的分布。在檢驗水平下,若,則拒絕,即認為第對典型相關(guān)系數(shù)在顯著性水平下是顯著的,否則不顯著.從第2個典型相關(guān)系數(shù)到第個典型相關(guān)系數(shù),共個數(shù),所以根據(jù)二分法的原理,將它們分為一個區(qū)間,然后先檢驗第個典型相關(guān)系數(shù)即中位數(shù),當時,即認為第個典型相關(guān)系數(shù)不相關(guān),否定原假設(shè),接著檢驗;若當時,則檢驗.如此劃分區(qū)間依次檢驗下去,由數(shù)學分析上的區(qū)間套定理,一定存在第個數(shù),使得,而.以上的一系列檢驗實際上是一個序貫檢驗,檢驗直到對某個值未被拒絕為止.事實上,檢驗的總顯著性水平已不是了,且難以確定.還有,檢驗的結(jié)果易受樣本容量大小的影響。因此,檢驗的結(jié)果只宜作為確定典型變量個數(shù)的重要參考依據(jù),而不宜作為惟一的依據(jù).第5章典型相關(guān)分析的計算步驟及應用實例5.1典型相關(guān)分析的計算步驟設(shè)為取自正態(tài)總體的樣本(實際上,相當廣泛的情況下也對),每個樣品測量兩組指標,分別記為,,原始資料矩陣為:第一步計算相關(guān)矩陣,并將剖分為其中,分別為第一組變量和第二組變量之間的相關(guān)系數(shù)矩陣,為第一組與第二組變量之間的相關(guān)系數(shù)。第二步求典型相關(guān)系數(shù)及典型變量首先求的特征根,特征向量;的特征根,特征向量.,寫出樣本的典型變量為,,,第三步典型相關(guān)系數(shù)的顯著性檢驗首先,檢驗第一對典型變量的相關(guān)系數(shù),即:,:它的似然比統(tǒng)計量為則統(tǒng)計量給定顯著性水平,查表得,若,則否定,認為第一對典型變量相關(guān),否則不相關(guān).如果相關(guān)則依次逐個檢驗其余典型相關(guān)系數(shù),直到某一個相關(guān)系數(shù)檢驗為不顯著時截止。5.2實例分析例1:某康復俱樂部對20名中年人測量了三個生理指標:體重、腰圍()、脈搏()和三個訓練指標:引體向上()、起坐次數(shù)()、跳躍次數(shù)().數(shù)據(jù)如附錄1:解:記,,其中樣本容量。附錄1中的數(shù)據(jù)用SPSS統(tǒng)計軟件計算得六個變量之間的相關(guān)矩陣如下: CorrelationsX1X2X3Y1Y2Y3X1PearsonCorrelation1.870(**)-。366-。390-.493(*)-。226Sig。(2—tailed).。000.113.089.027.337N202020202020X2PearsonCorrelation。870(**)1-.353-.552(*)—。646(**)—.191Sig。(2-tailed)。000。.127。012.002。419N202020202020X3PearsonCorrelation-.366—。3531。151.225.035Sig.(2-tailed)。113。127。.526.340。884N202020202020Y1PearsonCorrelation—。390-.552(*)。1511。696(**).496(*)Sig.(2—tailed)。089.012.526.。001。026N202020202020Y2PearsonCorrelation—.493(*)—.646(**).225.696(**)1。669(**)Sig.(2-tailed)。027.002.340.001..001N202020202020Y3PearsonCorrelation—.226-.191。035.496(*).669(**)1Sig.(2—tailed)。337.419。884.026.001.N202020202020**Correlationissignificantatthe0。01level(2—tailed).*Correlationissignificantatthe0.05level(2-tailed)。即樣本相關(guān)矩陣為:===于是特征方程用求得矩陣的特征值分別為0。6630、0.0402和0。0053,于是,,下面我們進行典型相關(guān)系數(shù)的顯著性檢驗,先檢驗第一對典型變量的相關(guān)系數(shù),欲檢驗::,:它的似然比統(tǒng)計量為=查分布表得,,因此在的顯著性水平下,,所以拒絕原假設(shè),也即認為第一對典型相關(guān)變量是顯著相關(guān)的.然后檢驗第二對典型變量的相關(guān)系數(shù),即進一步檢驗::,:它的似然比統(tǒng)計量為所以無法否定原假設(shè),故接受:,即認為第二對典型相關(guān)變量不是顯著相關(guān)的。由以上檢驗可知只需求第一對典型變量即可.于是求的特征向量,而,解得,,因此,第一對樣本典型變量為第一對典型變量的相關(guān)系數(shù)為,可見兩者的相關(guān)性較為密切,即可認為生理指標與訓練指標之間存在顯著相關(guān)性。例2:為了研究某企業(yè)不同部門人員工作時間的關(guān)系,隨機選取25個企業(yè)進行入戶調(diào)查,達到25個被訪企業(yè)業(yè)務(wù)部門和技術(shù)部門經(jīng)理每月工作時間和員工每月工作時間(單位為小時),具體數(shù)據(jù)如附表2分析:設(shè)業(yè)務(wù)部門經(jīng)理和員工每月工作時間為(),技術(shù)部門經(jīng)理和員工每月工作時間為(),利用典型相關(guān)分析研究企業(yè)業(yè)務(wù)部門和技術(shù)部門人員工作時間的關(guān)系.解:樣本容量為,,分別為隨機變量的維數(shù).⑴標準化隨機變量與。根據(jù)樣本均值與標準差,依照公式,對數(shù)據(jù)標準化.⑵求解的相關(guān)矩陣,并將其分塊。將數(shù)據(jù)輸入SPSS軟件求得相關(guān)系數(shù)矩陣如下: CorrelationsX1X2Y1Y2X1PearsonCorrelation1。735(**)。711(**)。705(**)Sig.(2—tailed)。.000。000.000N25252525X2PearsonCorrelation。735(**)1.693(**).705(**)Sig.(2—tailed).000.。000.000N25252525Y1PearsonCorrelation.711(**)。693(**)1。834(**)Sig。(2—tailed).000。000。。000N25252525Y2PearsonCorrelation.705(**).705(**).834(**)1Sig。(2-tailed)。000。000。000。N25252525**Correlationissignificantatthe0.01level(2—tailed)。所以樣本相關(guān)矩陣分塊后⑶求解的兩個非零特征根,解得兩個非零特征根為,。⑷進行相關(guān)系數(shù)的顯著性檢驗,取個顯著性檢驗不為0的特征根.第一對典型變量的相關(guān)系數(shù)為,第二對典型變量的相關(guān)系數(shù)為。先檢驗第一對典型變量的相關(guān)系數(shù),假設(shè):(即第一對典型變量不相關(guān)),由典型相關(guān)系數(shù)的值可得計算統(tǒng)計量對于給定的顯著性水平所以否定零假設(shè).:,即第一對典型變量是顯著相關(guān)的.然后檢驗第二對典型變量的相關(guān)系數(shù),假設(shè):(即第二對典型變量不相關(guān)),由典型相關(guān)系數(shù)的值可得計算統(tǒng)計量對于給定的顯著性水平所以無法否定假設(shè)。:,即第二對典型變量不是顯著相關(guān)的.由以上檢驗可知,只需求第一對典型變量即可。⑸求個顯著性檢驗不為0的特征根的特征向量,而,解得,.⑹求出對典型相關(guān)變量,, 根據(jù)上面求得的特征向量,得第一對典型相關(guān)變量為第一對典型變量的相關(guān)系數(shù)為,可見其相關(guān)性較為密切.⑺由于,與業(yè)務(wù)部門經(jīng)理和員工每月工作時間都成正比,而且系數(shù)差不多,所以可以解釋為業(yè)務(wù)部門人員工作時間。同理可以解釋為技術(shù)部門人員的工作時間.可見一個企業(yè)技術(shù)部門和業(yè)務(wù)部門人員月工作時間存在顯著的相關(guān)性.結(jié)語典型相關(guān)分析是一種采用類似主成分分析的做法,在每一組變量中都選擇若干個有代表性的綜合指標(變量的線性組合),通過研究兩組的綜合指標之間的關(guān)系來反映兩組變量之間的相關(guān)關(guān)系.在實際中,只須著重研究相關(guān)關(guān)系較大的那幾對典型相關(guān)變量。本文首先根據(jù)典型相關(guān)分析的統(tǒng)計理論,初步探討了總體典型相關(guān)變量和典型相關(guān)系數(shù),然后重點討論了樣本典型相關(guān)分析,以及它們的一系列性質(zhì)與顯著性檢驗,并做了相應的實例分析.通過實例分析,我們進一步明確了典型相關(guān)分析是研究兩組變量之間相關(guān)性的一種降維技術(shù)的統(tǒng)計分析方法。而復相關(guān)是典型相關(guān)的一個特例,簡單相關(guān)是復相關(guān)的一個特例.第一對典型相關(guān)包含有最多的有關(guān)兩組變量間相關(guān)的信息,第二對其次,其他對依次遞減。各對典型相關(guān)變量所含的信息互不重復.并且經(jīng)標準化的兩組變量之間的典型相關(guān)系數(shù)與原始的兩組變量間的相應典型相關(guān)系數(shù)是相同的。致謝本文是在我的指導老師吳可法教授的精心指導和悉心關(guān)懷下完成的,在我的學習生涯和論文工作中無不傾注著老師的辛勤汗水和殷切關(guān)懷。吳老師寬厚的人格、敏捷的思維、嚴謹?shù)闹螌W態(tài)度、淵博的知識、積極向上的人生態(tài)度、平易近人的師長風范和兩年來的諄諄教導,使我深受啟迪,并永遠銘記在心.將成為惠及一生的寶貴財富.在此謹向吳老師致以最衷心的感謝和美好的祝愿!論文期間,我得到了許多老師和同學的幫助,本人在這里對他們致以衷心的感謝。我還要感謝我的家人,是他們的理解、支持和鼓勵,使我的學習能夠順利進行.最后衷心感謝在百忙之中評審論

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論