




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第七章典型相關(guān)典型相關(guān)分析7.1典型相關(guān)分析7.1.1典型相關(guān)分析的概念與步驟7.1.2用CANCORR過程實現(xiàn)典型相關(guān)分析7.1.1典型相關(guān)分析的概念與步驟1.典型相關(guān)分析的基本思想典型相關(guān)分析采用主成分的思想濃縮信息,根據(jù)變量間的相關(guān)關(guān)系,尋找少數(shù)幾對綜合變量(實際觀測變量的線性組合),用它們替代原始觀測變量,從而將二組變量的關(guān)系集中到少數(shù)幾對綜合變量的關(guān)系上,通過對這些綜合變量之間相關(guān)性的分析,回答兩組原始變量間相關(guān)性的問題。除了要求所提取的綜合變量所含的信息量盡可能大以外,提取時還要求第一對綜合變量間的相關(guān)性最大,第二對次之,依次類推。
這些綜合變量被稱為典型變量,或典則變量,第1對典型變量間的相關(guān)系數(shù)則被稱為第1典型相關(guān)系數(shù)。典型相關(guān)系數(shù)能簡單、完整地描述兩組變量間關(guān)系的指標(biāo)。當(dāng)兩個變量組均只有一個變量時,典型相關(guān)系數(shù)即為簡單相關(guān)系數(shù);當(dāng)其中的一組只有一個變量時,典型相關(guān)系數(shù)即為復(fù)相關(guān)系數(shù)。2.典型相關(guān)系數(shù)與典型相關(guān)變量設(shè)X=(X1,X2,…,Xp)',Y=(Y1,Y2,…,Yq)'是兩個隨機向量。利用主成分思想尋找第i對典型相關(guān)變量(Ui,Vi):Ui=ai1X1+ai2X2+…+aipXp=ai'XVi=bi1Y1+bi2Y2+…+biqYq=bi'Yi=1,2,…,m=min(p,q);稱ai'和bi'為(第i對)典型變量系數(shù)或典型權(quán)重。
記第一對典型相關(guān)變量間的典型相關(guān)系數(shù)為:CanR1=Corr(U1,V1)(使U1與V1間最大相關(guān));第二對典型相關(guān)變量間的典型相關(guān)系數(shù)為:CanR2=Corr(U2,V2)(與U1、V1無關(guān);使U2與V2間最大相關(guān))…
第m對典型相關(guān)變量間的典型相關(guān)系數(shù)為:CanRm=Corr(Um,Vm)(與U1,V1,…,Um–1,Vm–1無關(guān);Um與Vm間最大相關(guān))3.典型相關(guān)變量的性質(zhì)各對典型相關(guān)變量所包括的相關(guān)信息互不交叉,且滿足:
1)U1,U2,…,Um互不相關(guān),V1,V2,…,Vm互不相關(guān),即其相關(guān)系數(shù)為2)同一對典型相關(guān)變量Ui和Vi之間的相關(guān)系數(shù)為CanRi,不同對的典型相關(guān)變量之間互不相關(guān),即:
3)Ui和Vi的均值為0,方差為1(i=1,…,m)。
4)1≥CanR1≥CanR2≥…≥CanRm≥04.典型相關(guān)系數(shù)的求解步驟
1)求X,Y變量組的相關(guān)陣
R=;
2)求矩陣A=(R11)–1R12(R22)–1R21和B=(R22)–1R21(R11)–1R12,可以證明A、B有相同的非零特征值;
3)求A或B的特征值λi與CanRi,A或B的特征值即為典型相關(guān)系數(shù)的平方:λi=(CanRi)2,i=1,…,m。4)求A、B關(guān)于λi的特征向量。設(shè)ai為A關(guān)于λi的特征向量,bi為B關(guān)于λi的特征向量,則ai'和bi'為(第i對)典型變量系數(shù)。即第i對典型相關(guān)變量(Ui,Vi):Ui=ai'X*=ai1X1*+ai2X2*+…+aipXp*Vi=bi'Y*
=bi1Y1*+bi2Y2*+…+biqYq*i=1,2,…,m=min(p,q);其中X*,Y*為原變量組的標(biāo)準(zhǔn)化。5.特征根特征根(eigenvalue)是方差分析和多元檢驗的基礎(chǔ),特征根與典型相關(guān)系數(shù)之間的數(shù)量關(guān)系為:上式可以理解為第i對典型變量表示觀測變量總方差作用的指標(biāo),它的值越大說明表示作用越大。6.典型相關(guān)系數(shù)的標(biāo)準(zhǔn)誤7.典型相關(guān)系數(shù)的假設(shè)檢驗典型相關(guān)系數(shù)的假設(shè)檢驗包括對全部總體典型相關(guān)系數(shù)的檢驗和對部分總體典型相關(guān)系數(shù)的檢驗。對數(shù)據(jù)的要求:
1)兩個變量組均應(yīng)服從多維正態(tài)分布:(X,Y)~Np+q(μ,σ2)2)n>p+q(1)全部總體典型相關(guān)系數(shù)為0H0:CanRi=0,i=1,…,m
H1:至少有一個CanRi≠0
檢驗的似然比統(tǒng)計量為對于充分大的n,當(dāng)H0成立時,統(tǒng)計量近似服從自由度為pq的2分布。(2)部分總體典型相關(guān)系數(shù)為0
僅對較小的典型相關(guān)作檢驗:
H0:CanRi=0,i=s,…,m,2≤s≤mH1:至少有一個CanRi≠0其檢驗的統(tǒng)計量為對于充分大的n,當(dāng)H0成立時,統(tǒng)計量近似服從自由度為(p–k)(q–k)的2分布。7.1.4用CANCORR過程實現(xiàn)典型相關(guān)分析1.CANCORR過程
CANCORR過程的常用語法格式如下:PROCCANCORR<選項列表>;
WITH<變量列表>;
VAR<變量列表>;RUN;
其中PROCCANCORR語句、WITH語句是每個過程中必不可少的,其余語句可視情況使用。
下面分別介紹各語句的用法和功能。
(1)PROCCANCORR語句:標(biāo)示典型相關(guān)分析開始,可以規(guī)定輸入輸出數(shù)據(jù)集,指定分析方法和控制輸出結(jié)果的顯示等。語句中可設(shè)置的常用選項及其功能見表7-3。
(2)VAR語句:列出要進行典型相關(guān)分析的第一組變量,變量必須是數(shù)值型的。如果VAR語句被忽略,所有未被其他語句提到的數(shù)值型變量都將被視為第一組變量。
(3)WITH語句:列出要進行典型相關(guān)分析的第二組變量,變量必須是數(shù)值型的。該語句是每一個PROCCANCORR中必不可少的。表7-3常用選項及其功能EDF=指定誤差的自由度。EDF數(shù)為有效的觀察值減1DATA=指定輸入數(shù)據(jù)集的名字,可以是原始數(shù)據(jù)集,或用TYPE=CORR,COV,F(xiàn)ACTOR,SSCP,UCORR,或者UCOV的數(shù)據(jù)集,如果省略則使用最新創(chuàng)建的數(shù)據(jù)集OUT=指定輸出數(shù)據(jù)集的名字,輸出包括原始數(shù)據(jù)及典型變量得分的數(shù)據(jù)集。當(dāng)輸入數(shù)據(jù)集的類型為CORR,COV,F(xiàn)ACTOR,SSCP,UCORR,或者UCOV,就不能使用這個選項OUTSTAT=生成包含各種統(tǒng)計量的SAS數(shù)據(jù)集,包括典型相關(guān)系數(shù)和典型系數(shù),以及你要求的多元回歸統(tǒng)計量VNAME=為來自VAR語句中分析變量指定標(biāo)簽,作為標(biāo)簽的字符要用單引號引起來VPREFIX=為來自VAR語句的典型變量指定前綴名,默認(rèn)時典型變量命名為V1,V2,V3等WNAME=為來自WITH語句中的分析變量指定標(biāo)簽,作為標(biāo)簽的字符要用單引號引起來WPREFIX=為來自WITH語句中的典型變量指定前綴名,默認(rèn)為W1,W2,W3等控制輸出的選項ALL打印所有選擇的輸出CORR打印原始變量之間的相關(guān)系數(shù)NCAN=規(guī)定要輸出典型變量的個數(shù)NOPRINT禁止所有的輸出REDUNDANCY打印冗余度分析的結(jié)果SHORT除了典型相關(guān)和多元統(tǒng)計列表以外,禁止打印典型相關(guān)分析過程默認(rèn)的輸出SIMPLE打印均值、標(biāo)準(zhǔn)差等簡單統(tǒng)計量2.使用CANCORR過程【例7-3】家庭特征與家庭消費之間的關(guān)系。為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:
x1:每年去餐館就餐的頻率,x2:每年外出看電影的頻率;
y1:戶主的年齡,y2:家庭的年收入,y3:戶主受教育程度。
試分析兩組變量之間的關(guān)系。假定變量的相關(guān)系數(shù)陣如表所示。x1x2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00
如下代碼,利用變量的相關(guān)系數(shù)矩陣作典型相關(guān)分析:DATAjt(TYPE=CORR);INPUTNAME$1-2(X1X2Y1-Y3)(6.);CARDS;X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00;PROCCANCORREDF=70REDUNDANCY;VARX1X2;WITHY1-Y3;RUN;
說明:
1)在數(shù)據(jù)集名jt后用TYPE=CORR表明數(shù)據(jù)的類型為相關(guān)矩陣,而不是原始數(shù)據(jù)。
2)INPUT語句中用“NAME$”讀取左側(cè)的變量名,“1-2”表示變量名的字符落在第1、2列上,“(X1X2Y1-Y4)”表示各列數(shù)據(jù)所對應(yīng)的變量名,“(6.)”表示讀取數(shù)據(jù)的寬度均為6列,其中相關(guān)系數(shù)占4位,其后的空格占2位;3)選擇項EDF=n–1,為典型相關(guān)分析提供一個計算誤差自由度的參考值,因為該過程中沒有合適的選擇項可以將原始數(shù)據(jù)的樣本含量n準(zhǔn)確地送入。如果忽略這一選擇項,將以缺省值n=10000作為樣本含量參與有關(guān)計算和統(tǒng)計檢驗,顯然不妥;
4)選項REDUNDANCY表示輸出典型冗余分析的結(jié)果。3.結(jié)果分析(1)典型相關(guān)系數(shù)及顯著性檢驗第一部分的4列依次是:典型相關(guān)系數(shù)、校正的典型相關(guān)系數(shù)、近似的標(biāo)準(zhǔn)誤以及典型決定系數(shù)(典型相關(guān)系數(shù)的平方)。從中可以看出,本例提取了2個典型相關(guān)系數(shù),第一個典型相關(guān)系數(shù)CanR1=0.687948,其校正值為0.673671,標(biāo)準(zhǔn)誤為0.062956,CanR12=0.473272;第二個典型相關(guān)系數(shù)為0.186865。
第二部分是特征根以及相應(yīng)的統(tǒng)計量,從中可以看出,第一對典型變量所能解釋的變異已占總變異的96.13%,另一對典型相關(guān)變量的作用很小,只解釋了總變異的3.87%,可以不予考慮。右邊4列給出對典型相關(guān)系數(shù)的檢驗,具體采用似然比法,所求的似然比統(tǒng)計量近似服從F分布。第一行檢驗的是第一相關(guān)系數(shù)以及比它小的兩個相關(guān)系數(shù)是否為0,第一行的F值8.86,p值<0.0001。后一行檢驗的p值遠(yuǎn)大于置信水平0.05,故可以認(rèn)為只有第一個典型相關(guān)系數(shù)有統(tǒng)計學(xué)意義。
第三部分(圖7-21)輸出的是按照多元分析的原理進行的所有典型相關(guān)系數(shù)是否為0的檢驗,四種方法中一般參照Wilks'Lambda檢驗的結(jié)果。本例中4種方法的檢驗結(jié)果與前述完全一致。(2)典型變量系數(shù)與典型結(jié)構(gòu)第四部分(圖左)給出的是用原始變量表達(dá)的典型變量系數(shù)??紤]標(biāo)準(zhǔn)化后的系數(shù),即第五部分(圖右)給出的典型變量和標(biāo)準(zhǔn)化變量(對原始變量標(biāo)準(zhǔn)化)間的換算公式。由于使用原始變量的相關(guān)系數(shù)陣作為輸入數(shù)據(jù),所以這兩部分相同。
來自消費模式指標(biāo)的第一典型變量V1為(原始變量的右上角帶“*”表示為標(biāo)準(zhǔn)化變量):V1=0.7689x1*+0.2721x2*
它是x1*(每年去餐館就餐的頻率)和x2*(每年外出看電影的頻率)的加權(quán)和,在x1*上的權(quán)重更大些。來自家庭特征指標(biāo)的第一典型變量W1為:W1=0.0491y1*+0.8975y2*+0.1900y3*
它在y2*(家庭的年收入)上的系數(shù)最大。這一對典型變量主要是反映x1*(每年去餐館就餐的頻率)和y2*(家庭的年收入)的相關(guān)關(guān)系。
第六部分(圖7-24)為典型相關(guān)結(jié)構(gòu),分別是各組原始變量與典型變量兩兩之間的相關(guān)系數(shù)矩陣。
可以看出:x1和x2與第1典型變量V1的相關(guān)系數(shù)皆為正值,分別為0.9866和0.8872,可見V1可以作為消費特性的指標(biāo)。家庭特征指標(biāo)的所有變量與第1典型變量W1的相關(guān)系數(shù)分別為:0.4211,0.9822和0.5145,可見典型變量W1主要代表了了家庭收入。
V1和W1的典型相關(guān)系數(shù)為0.6879,這就說明家庭的消費與一個家庭的收入之間其關(guān)系是很密切的。
第二對典型變量中V2與x2的相關(guān)系數(shù)為0.4614,可以看出V2可以作為文化消費特性的指標(biāo),第二對典型變量中W2與y1和y3之間的分別相關(guān)系數(shù)為0.8464和0.3013,可見典型變量W2主要代表了家庭成員的年齡特征和教育程度,V2和W2的相關(guān)系數(shù)為0.1869,說明文化消費與年齡和受教育程度之間有一定關(guān)系。(3)典型冗余分析第七部分給出典型冗余分析的結(jié)果(圖7-25、7-26),由于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年北京十四中高一上學(xué)期期中考試化學(xué)試卷
- 網(wǎng)絡(luò)媒體行業(yè)市場競爭格局及投資前景展望報告
- 2024-2025學(xué)年安徽省蚌埠市鎮(zhèn)縣第二中學(xué)高一上學(xué)期12月月考化學(xué)試卷
- 2025年P(guān)ET鐳射素面膜行業(yè)深度研究分析報告-20241226-181017
- 2025年意大利層皮行業(yè)深度研究分析報告
- 乘法、除法(二)3、6、9的乘法之間的關(guān)系(教學(xué)設(shè)計)-2024-2025學(xué)年滬教版二年級數(shù)學(xué)上冊
- 轉(zhuǎn)讓新疆餐廳合同范本
- 2025年度房地產(chǎn)項目招投標(biāo)代理合同-@-5
- 2025年雙速自控調(diào)漿桶項目投資可行性研究分析報告
- 2025年度排污許可證環(huán)保政策解讀與培訓(xùn)合同4篇
- (完整word版)服務(wù)質(zhì)量評價表
- 數(shù)據(jù)結(jié)構(gòu)英文教學(xué)課件:chapter10 Hashing
- 藍(lán)色卡通風(fēng)學(xué)生班干部競選介紹PPT模板課件
- 人教新目標(biāo)英語九年級上冊單詞中文Units
- 機動車牌證申請表格模板(完整版)
- 部編版小學(xué)語文三年級(下冊)學(xué)期課程綱要
- 道路交通事故責(zé)任認(rèn)定行政復(fù)議申請書范例
- 高效液相含量測定計算公式
- 六宮格數(shù)獨解題技巧
- 公安機關(guān)通用告知書模板
- 工程款支付審批流程圖
評論
0/150
提交評論