實驗九典型相關(guān)分析_第1頁
實驗九典型相關(guān)分析_第2頁
實驗九典型相關(guān)分析_第3頁
實驗九典型相關(guān)分析_第4頁
實驗九典型相關(guān)分析_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

課時授課計劃課次序號:_22一、課題:實驗九典型相關(guān)分析二、課型:上機實驗三、目的要求:1.掌握典型相關(guān)分析的理論與方法、模型的建立與顯著性檢驗掌握利用典型相關(guān)分析的SAS過程解決有關(guān)實際問題.四、教學(xué)重點:典型相關(guān)分析的SAS過程.教學(xué)難點:相關(guān)分析的理論與方法、模型的建立與顯著性檢驗.五、教學(xué)方法及手段:傳統(tǒng)教學(xué)與上機實驗相結(jié)合.六、參考資料:《應(yīng)用多元統(tǒng)計分析》,高惠璇編,北京大學(xué)出版社,2005;《使用統(tǒng)計方法與SAS系統(tǒng)》高惠璇編,北京大學(xué)出版社,2001;《多元統(tǒng)計分析》(二版),何曉群編,中國人民大學(xué)出版社,2008;《應(yīng)用回歸分析》(二版),何曉群編,中國人民大學(xué)出版社,2007;《統(tǒng)計建模與R軟件》薛毅編著,清華大學(xué)出版社,2007.七、作業(yè):八、授課記錄:授課日期班次九、授課效果分析:實驗九典型相關(guān)分析(CanonicalCorrelationAnalysis)(2學(xué)時)一、實驗?zāi)康暮鸵竽芾迷紨?shù)據(jù)與相關(guān)矩陣、協(xié)主差矩陣作相關(guān)分析,能根據(jù)SAS輸出結(jié)果選出滿足要求的幾個典型變量.二、實驗內(nèi)容典型相關(guān)分析的SAS過程一PROCCANCORR過程基本語句:PROCCANCORR<data=數(shù)據(jù)集〉<OUT=SAS數(shù)據(jù)集〉<OUTSTAT=SAS數(shù)據(jù)集〉<CORR><NCAN=m><EDF=n-1>;VARvariables;町THvariables;RUN;說明:此過程輸入數(shù)據(jù)可以是原始數(shù)據(jù),也可以是相關(guān)系數(shù)矩陣或協(xié)方差矩陣,輸出結(jié)果包含相關(guān)系數(shù)矩陣、典型相關(guān)系數(shù)、典型變量的系數(shù)、典型變量對之間的相關(guān)性檢驗的F統(tǒng)計量值、自由度、p值、典型變量與原始變量的相關(guān)系數(shù)等.(1)proccancorr語句的〈選項列表〉:OUT=SAS數(shù)據(jù)集一一創(chuàng)建含原始數(shù)據(jù)和典型相關(guān)變量得分(觀測值)的SAS集.OUTSTAT=SAS數(shù)據(jù)集一一創(chuàng)建含原始變量的樣本均值、樣本標(biāo)準(zhǔn)差、樣本相關(guān)系數(shù)陣、典型相關(guān)系數(shù)和典型變量的標(biāo)準(zhǔn)化和非標(biāo)準(zhǔn)化系數(shù)等SAS集.CORR(或C)——打印原始變量的樣本相關(guān)系數(shù)矩陣.NCAN=m——規(guī)定要求輸出的典型變量對個數(shù),默認為兩組變量個數(shù)較小者.EDF=n-1一一針對輸入原始數(shù)據(jù)集為樣本相關(guān)系數(shù)矩陣或樣本協(xié)方差矩陣,借此選項指定樣本容量為觀測個數(shù)減1.輸入為原始觀測數(shù)據(jù)時,省略此項.all——所有輸出項.noprint不輸出分析結(jié)果.short只輸出典型相關(guān)系數(shù)和多元分析統(tǒng)計數(shù).simple——簡單統(tǒng)計數(shù).vname=變量名——為var語句的變量定義名稱.vprefip前綴名為var語句的典型變量定義前綴.wname=變量名——為with語句的變量定義名稱.wprefix^前綴名為with語句的典型變量定義前綴.(2)VARvariables——VAR后列出進行相關(guān)分析的第一組變量名稱.(3)WITHvariables――with后列出進行相關(guān)分析的第二組變量名稱var與with語句經(jīng)常同proccancorr語句一起使用.其他語句類似corr過程.典型相關(guān)分析步驟兩組隨機變量X=(X1,X2,兩組隨機變量X=(X1,X2,…'Xp)T,Y=(Y1,Y2'…'YqA取值X=(X1,X2,…,X/,y=(yi,y2'…,叮Tn組觀測數(shù)據(jù)ipi1i2標(biāo)準(zhǔn)化樣本x*i=(x*,x*,i1i2X*)Tx*i=(x*,x*,i1i2X*)T=(ipx-Xx-Xi11—i22s11X匕i2一_

222x-X?,ip一p)Vs\ppy*i=(G,&11—y^)Tyq11i=1,2,…,n樣本相關(guān)系數(shù)矩陣(R11IR21R=R)12R丿22y為總體(XT,YT)T相關(guān)系數(shù)矩陣p的估計.樣本典型相關(guān)分析步驟:(1)求A*=R-1RR-1R(B*=R-1RR-1R)的特征值1112222122211112AAAp2>p2>…>p2>012p(2)求A*=R-1RR-1R和B*=R-1RR-1R對應(yīng)的正交單位化特征向量1112222122211112e,e12(3)第k對典型相關(guān)變量為UA=eTR-1x*,k1112其中X*=(X*,X*,…,X*),12TOC\o"1-5"\h\z12p樣本典型相關(guān)系數(shù)為p=pA,k=1,2,…,pAAkUk*,Vk*4)典型相關(guān)系數(shù)的顯著性檢驗H(k):p=0分H(k):p豐0k=1,2,…,p0k1kd1—A1/1h(k^真統(tǒng)計量F—2kk0?八F(d,d)kdA1/k1k2k1kk檢驗P值為P二P(F>f)二P(F(d,d)>f)kH0kk1k2kk若p<?,拒絕H(k).0依次就k=1,2,,p進行檢驗,若對某個k,檢驗p值首次滿足p>a,則認為只有前k-1對典型變量顯著相關(guān),選取前k-1對即可.注意:利用樣本協(xié)方差矩陣,分析方法一樣.不需要對數(shù)據(jù)標(biāo)準(zhǔn)化處理.實例分析例為研究空氣溫度與土壤溫度的關(guān)系,考慮六個變量X1:日最高土壤溫度;X2:日最低土壤溫度;X:日土壤溫度積分值;123Y:日最高氣溫;Y:日最低氣溫;Y:日氣溫曲線積分值.123觀測了n=46天,數(shù)據(jù)如表.X二(X,X,X)t,Y二(Y,Y,Y)t,做典型相關(guān)分析.123123解:(1)建立輸入數(shù)據(jù)集,程序如下:dataexamp4_6;inputx1-x3yl—y3;cards;85591518465147866115984651498364152796614283651588167147886918084681677767147746613178691597366131846815975671348971195846816191762068672169917620688731769476211907418794752118872171927020158721718768167816915483681627968149876617384691608768177847016088701698470168836617077671479267196876716692721998969171

947220489721809273201937218693722069374188947220894751999573214937419395702109374196957120796751989569202957620296691738473173916916891711708970189887217995712108972179967320891721829775215927419696691989475192956719696751959475211937619892731988874188907419788741789470205917217595712099272190967220892731899571208947519496712089676202run;(2)調(diào)用典型相關(guān)分析cancorr過程菜單操作方法為,選擇Globals/SAS/Assist/Dataanalysis/multivariate/canonicalcorrelationanalysis(典型相關(guān)分析)菜單命令.編程方法如下:proccancorrdata=examp4_6corr;/*調(diào)用相關(guān)分析過程,打印樣本相關(guān)系數(shù)矩陣*/varxl-x3;/*第一組變量x1-x3*/withy1-y3;/*第二組變量yl-y3*/run;R12RR12R22由SASproccancorr過程求得(X,X,X,Y,Y,Y)t樣本相關(guān)系數(shù)矩陣R=11123123IR21SAS系統(tǒng)10:24Sunday,November2,200814TheCANCORRProcedureCorrelationsAmongtheOriginalVariablesCorrelationsAmongtheVARVariables(變量x1-x3的相關(guān)系數(shù)矩陣R11)x1x1x2x1x2x3x1x2x3x3CorrelationsAmongtheWITHVariables(變量yl-y3的相關(guān)系數(shù)矩陣A??)y1y2y3yiy2y3CorrelationsBetweentheVARVariablesandtheWITHVariables變量xl-x3與yl-y3的相關(guān)系數(shù)矩陣R12yiy2y3xix2x3變量間高度相關(guān)。SAS系統(tǒng)i0:24Sunday,November2,2008i5TheCANCORRProcedureCanonicalCorrelationAnalysis典型相關(guān)分析的一般結(jié)果AdjustedApproximateSquaredCanonicalCanonicalStandardCanonicalCorrelationCorrelationErrorCorrelationA典型相關(guān)系數(shù)pkk校正的典型相關(guān)系數(shù)近似的標(biāo)準(zhǔn)誤典型相關(guān)系數(shù)平方iAp=1Ap2=12Ap=Ap2=223Ap=.3Ap2=33)檢驗各對典型變量是否顯著相關(guān)表各對典型變量相關(guān)性檢驗結(jié)果EigenvaluesofInv(E)*HTestofH0:Thecanonicalcorrelationsinthe=CanRsq/(1-CanRsq)艮卩p2/(1—p2)currentrowandallthatfollowarezerokkEigenvalueDifferenceProportionCumulativeLikelihoodApproximateRatioFValueNumDFDenDFPr>F各對相關(guān)系相鄰兩特特征值占特征值占方差似然比A,kFk值d1kd2kpk數(shù)特征值征值之差方差比例比例累計值i9<.000i20.48230.i42檢驗假設(shè)H(k):p=00kd1—Ai/1h(k)真檢驗統(tǒng)計量F=—ikk0?F(d,d),d,d為第一、第二自由度.由檢驗kdA1/k1k2k1k2k1kk結(jié)果可知,p<a=0.05,p<a=0.05,p=0.2816>0.05.故只有前兩對典型變123量顯著相關(guān).取前兩對進行分析即可.另外,從對典型變量(U,V)進行分析求得特征值在方差占比例的累計值(貢獻率)kk為也可看出,只需要前兩對變量即可.以下輸出用wilks'Lambda等四種方法對典型相關(guān)系數(shù)為零的假設(shè)檢驗MultivariateStatisticsandFApproximationsS=3M=N=19StatisticValueFValueNumDFDenDFPr>F統(tǒng)計方法F值檢驗P值Wilks'Lambda9<.0001Pillai'sTrace1.9126<.0001Hotelling-LawleyTrace6.9<.0001Roy'sGreatestRoot6.342<.0001NOTE:FStatisticforRoy'sGreatestRootisanupperbound.4)求出典型變量及典型相關(guān)系數(shù),并解釋典型變量的系數(shù)和典型結(jié)構(gòu)SAS系統(tǒng)10:24Sunday,November2,200816TheCANCORRProcedureCanonicalCorrelationAnalysisRawCanonicalCoefficientsfortheVARVariables第一組變量x1-x3的典型變量的系數(shù)(原始變量未標(biāo)準(zhǔn)化)

第一典型變量U第二典型變量力U123V1V2V3x1x2x3第二組變量y1-y3的典型變量的系數(shù)(原始變量為標(biāo)準(zhǔn)化)RawCanonicalCoefficientsfortheWITHVariablesTOC\o"1-5"\h\z第一典型變量扌第二典型變量匕/V12V3W1W2W3y1y2y3數(shù)據(jù)未標(biāo)準(zhǔn)化結(jié)果,即利用協(xié)方差矩陣分析的結(jié)果U=0.1280x—0.03139x+0.0219x1123

U=—0.0115y-0.0612y+0.0624y1223其余略SAS系統(tǒng)10:24Sunday,November2,200817TheCANCORRProcedureCanonicalCorrelationAnalysis第一組變量xl-x3的典型變量的系數(shù)(原始變量標(biāo)準(zhǔn)化后)StandardizedCanonicalCoefficientsfortheVARVariables第一典型變量U*第二典型變量UU*123V1V2V3x1(即x*)x2(即x2)x3(即x3)第二組變量yl-y3的典型變量的系數(shù)(原始變量標(biāo)準(zhǔn)化后)StandardizedCanonicalCoefficientsfortheWITHVariables3W3第一典型變量V*第一典型變量V3W312W1W2y1y2給出A*二R-1RR-1R的三個特征值1112222102二0.86091902二0.316047P2=0.027547TOC\o"1-5"\h\z1,2,3第一對典型變量U*=0.6485x*-0.1149x*+0.4600x*主要日最高、日均土壤溫度加權(quán)1123V*=-0.0863y*-0.2016y*+1.2527y*主要受日均氣溫影響1123第一對典型變量主要表現(xiàn)日均氣溫與日均、最高土壤溫度相關(guān)性。氣溫高,則土壤溫度高。第一對典型相關(guān)系數(shù)為S=0.9278571第二、第三對典型變量及典型相關(guān)系數(shù)U*=0.5550x*+1.6993x*-1.6963x*主要日最低土壤溫度和日均土壤溫度差異TOC\o"1-5"\h\z2123V*=0.2320y*+2.8436y*-2.7674y*主要最低氣溫和日均氣溫的差異2123第二對變量主要表現(xiàn)日均溫差與土壤溫差的關(guān)系。溫差大,則土壤溫度差異大U*=-2.0575x*-0.2749x*+2.3422x*3123V*=-1.6609y*-0.3950y*+1.6293y*312302=0.56218103=0.1659745)以下輸出原變量和典型變量間的相關(guān)系數(shù)(可不要求)SAS系統(tǒng)10:24Sunday,November2,200818TheCANCORRProcedureCanonicalStructure第一組變量x1-x3和它們的典型變量U*,U,U的相關(guān)系數(shù)123CorrelationsBetweentheVARVariablesandTheirCanonicalVariablesV1V2V3x1x2x3第二組變量yl-y3和它們的典型變量V*,V*,滬*的相關(guān)系數(shù)123CorrelationsBetweentheWITHVariablesandTheirCanonicalVariablesW1W2W3y1y2y3第一組變量x1-x3和第二組典型變量V*,V*,滬*的相關(guān)系數(shù)123CorrelationsBetweentheVARVariablesandtheCanonicalVariablesoftheWITHVariablesW1W2W3x1x2x3第二組變量yl-y3和第一組典型變量u*,u*,U*的相關(guān)系數(shù)123CorrelationsBetweentheWITHVariablesandtheCanonicalVariablesoftheVARVariablesV1V2V3y1y2y3原變量和第一對變量相關(guān)程度高,后兩組提取的信息很少,與典型對系數(shù)一致練習(xí):評委打分問題dataexampl;in]putx1-x3y1-y3ca:rds;8643854393719974997899893722102724335195)61311:38454355395458213221343532

3678487542786931853270524098369964862614408252151683868487263867987769539805780556878407242755856495448526139807176528165553116741281131122335503268234958699869978199559978976090361151526577186127685467339534596145874685678061726363627541637455507665135513285335513159662079186755run;(2)調(diào)用典型相關(guān)分析cancorr過程菜單操作方法為,選擇Globals/SAS/Assist/Dataanalysis/multivariate/canonicalcorrelationanalysis(典型相關(guān)分析)菜單命令.編程方法如下:proccancorrdata=ex5corr;/*調(diào)用相關(guān)分析過程,打印樣本相關(guān)系數(shù)矩陣*/varx1-x3;withy1-y3;run;/*第一組變量x1-x3*//*第二組變量y1-y3*/SAS系統(tǒng)2008年08月01日星期五下午09時25分34秒1TheCANCORRProcedureCorrelationsAmongtheOriginalVariablesCorrelationsAmongtheVARVariablesx1x1x2x3x1x1x2x3x2x3x333CorrelationsAmongtheWITHVariables

y1y2y3y1y2y3CorrelationsBetweentheVARVariablesandtheWITHVariablesy1y2y3y1y2y3x1x2x3x1x2x3SAS系統(tǒng)2008年08月01日星期五下午09時25分34秒2TheCANCORRProcedureCanonicalCorrelationAnalysisCanonicalCorrelation1AdjustedCanonicalCorrelation1AdjustedCanonicalCorrelationApproximateStandardErrorSquaredCanonicalCorrelationEigenvaluesofInv(E)*H=CanRsq/(1-CanRsq)thecurrentrowandallthatfollowarezeroLikelihoodApproximateTestofH0:ThecanonicalcorrelationsinRatioFValueNumDFDenDFPr>FEigenvaluesofInv(E)*H=CanRsq/(1-CanRsq)thecurrentrowandallthatfollowarezeroLikelihoodApproximateTestofH0:ThecanonicalcorrelationsinRatioFValueNumDFDenDFPr>FEigenvalueDifferenceProportionCumulative9<.0001450<.00010.126MultivariateStatisticsandFApproximationsS=3M=N=11StatisticValueFValueNumDFDenDFPrStatisticValueFValueNumDFDenDFPr>FWilks'Lambda<.0001Wilks'Lambda<.0001Pillai'sTrace2.78<.0001Pillai'sTrace2.78<.0001Hotelling-LawleyTrace119.9<.0001Roy'sGreatestRoot108.326<.0001NOTE:FStatisticforRoy'sGreatestRootisanupperbound.SAS系統(tǒng)2008年08月01日星期五下午09時25分34秒3TheCANCORRProcedureCanonicalCorrelationAnalysisRawCanonicalCoefficientsfortheVARVariablesV1V2V3x1x2x3RawCanonicalCoefficientsfortheWITHVariablesW1W2W3y1y2y3SAS系統(tǒng)2008年08月01日星期五下午09時25分34秒4TheCANCORRProcedure標(biāo)準(zhǔn)化數(shù)據(jù)典型相關(guān)分析CanonicalCorrelationAnalysisStandardizedCanonicalCoefficientsfortheVARVariablesV1V2V3x1x2x3StandardizedCanonicalCoefficientsfortheWITHVariablesW1W2W3y1y2y3給出A*二R-1RR-1R的三個特征值1112222102二0.99544002二0.952820P2=0.6373231,2,3第一特征根貢獻率91.18%,選一對就可以。也說明,兩組變量高度相關(guān)。第一對典型變量

U*=0.1489x*+0.9770x*-0.0520x*主要高學(xué)歷、低學(xué)歷加權(quán)與網(wǎng)絡(luò)調(diào)查差異。1123認=0.8575y*+0.0193y*+0.1454y*主要藝術(shù)家、部門主管、發(fā)行部門加權(quán)。1123第一對典型變量主要表現(xiàn)高低學(xué)歷打分與藝術(shù)家部門主管打分的關(guān)系。網(wǎng)絡(luò)調(diào)查占比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論