系統(tǒng)和數(shù)據(jù)分析全隨機(jī)設(shè)計(jì)KruskalWallis秩和檢驗(yàn)_第1頁(yè)
系統(tǒng)和數(shù)據(jù)分析全隨機(jī)設(shè)計(jì)KruskalWallis秩和檢驗(yàn)_第2頁(yè)
系統(tǒng)和數(shù)據(jù)分析全隨機(jī)設(shè)計(jì)KruskalWallis秩和檢驗(yàn)_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余13頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二十九課完全隨機(jī)設(shè)計(jì)Kruskal-Wallis秩和檢驗(yàn)一、 完全隨機(jī)設(shè)計(jì)的 Kruskal-Wallis秩和檢驗(yàn)方差分析過(guò)程關(guān)注三個(gè)或更多總體的均值是否相等的問(wèn)題,數(shù)據(jù)是被假設(shè)成具有正態(tài)分 布和相等的方差,此時(shí) F檢驗(yàn)才能奏效。但有時(shí)采集的數(shù)據(jù)常常不能完全滿足這些條件。在 兩兩樣本比較時(shí),我們不妨嘗試將數(shù)據(jù)轉(zhuǎn)換成秩統(tǒng)計(jì)量,因?yàn)橹冉y(tǒng)計(jì)量的分布與總體分布無(wú) 關(guān),可以擺脫總體分布的束縛。在比較兩個(gè)以上的總體時(shí),廣泛使用非參數(shù)的Kruskal-Wallis秩和檢驗(yàn),它是對(duì)兩個(gè)以上的秩樣本進(jìn)行比較,本質(zhì)上它是兩樣本時(shí)的Wilcoxon秩和檢驗(yàn)方法在多于兩個(gè)樣本時(shí)的推廣。Kruskal-Wallis秩

2、和檢驗(yàn),首先要求從總體中抽取的樣本必須是獨(dú)立的,然后將所有樣本 的值混合在一起看成是單一樣本,再把這個(gè)單一的混合樣本中的值從小到大排序,序列值替 換成秩值,最小的值給予秩值1有結(jié)值時(shí)平分秩值。將數(shù)據(jù)樣本轉(zhuǎn)換成秩樣本后,再對(duì)這個(gè)秩樣本進(jìn)行方差分布,但此時(shí)我們構(gòu)造的統(tǒng)計(jì)量KW不是組間平均平方和除以組內(nèi)平均平方和,而是組間平方和除以全體樣本秩方差。這個(gè)KW統(tǒng)計(jì)量是我們判定各組之間是否存在差異的有力依據(jù)。設(shè)有組樣本,是第組樣本中的觀察數(shù),是所有樣本中的觀察總數(shù),是第組樣本中的秩和, 是第組樣本中的第個(gè)觀察值的秩值。需要檢驗(yàn)的原假設(shè)為各組之間不存在差異,或者說(shuō)各組 的樣本來(lái)自的總體具有相同的中心或均值或

3、中位數(shù)。在原假設(shè)為真時(shí),各組樣本的秩平均應(yīng)1+2+ n該與全體樣本的秩平均n = n一1比較接近。所以組間平方和為n2組間平方和k二、nii 1(29.1)恰好是刻畫(huà)這種接近程度的一個(gè)統(tǒng)計(jì)量,除以全體樣本秩方差,可以消除量綱的影響。樣本 方差的自由度為n-1。所以,全體樣本的秩方差為全體樣本的秩方差1 k nin -1 y j d2n 1j2丄Jn -1i =12n 1i2n(n 1)2(29.2)1=n -1/ 2n(n +1)(2 n + 1) n(n +1)2n(n 1)12因此,Kruskal-Wallis秩和統(tǒng)計(jì)量 KW 為:KW =全體樣IS!差12 knin(n 1) i412

4、Jn(n 1) i 4ni2/R. 2* -3( n 1)(29.3)如果樣本中存在結(jié)值,需要調(diào)整公式(433)中的KW統(tǒng)計(jì)量,校正系數(shù) C為:(29.4)其中,第j個(gè)結(jié)值的個(gè)數(shù)。調(diào)整后的 KWc統(tǒng)計(jì)量為:KWc 二 KW /C(29.5)如果每組樣本中的觀察數(shù)目至少有5個(gè),那么樣本統(tǒng)計(jì)量 KWc非常接近自由度為 k-1的卡方分布。因此,我們將用卡方分布來(lái)決定KWc統(tǒng)計(jì)量的檢驗(yàn)。例29.1某制造商雇用了來(lái)自三個(gè)本地大學(xué)的雇員作為管理人員。最近,公司的人事部門(mén) 已經(jīng)收集信息并考核了年度工作成績(jī)。從三個(gè)大學(xué)來(lái)的雇員中隨機(jī)地抽取了三個(gè)獨(dú)立樣本, 見(jiàn)表29.1中的第2、4、6列所示。制造商想知道來(lái)自這

5、三個(gè)不同的大學(xué)的雇員在管理崗位上 的表現(xiàn)是否有所不同。表29.1來(lái)自三個(gè)不同大學(xué)的雇員得分及統(tǒng)一秩值雇員大學(xué)A統(tǒng)編秩大學(xué)B統(tǒng)編秩大學(xué)C統(tǒng)編秩12536095072701220270123609304609485171518015.5595204069018.569018.5355701278015.57514秩和組A秩和95組B秩和27組C秩和88為了計(jì)算KW統(tǒng)計(jì)量,我們首先必須將來(lái)自三個(gè)大學(xué)的20名雇員統(tǒng)一按考核成績(jī)編排秩值,見(jiàn)表 29.1 中的第3、5、7 列所示。本例中,n r =7,n2=6,n3=7, n = 20,R|*=95,R2*=27, R3*=88 , k =3, Ho :

6、三個(gè)總體的考核成績(jī)分布是相同的。我們用(29.3)式計(jì)算KW統(tǒng)計(jì)量為:KW =12(95)(27)(88)-3(20 1) =8.916320(21) 1 767用(29.4)式計(jì)算校正系數(shù) C,從表29.1中我們可以發(fā)現(xiàn),相等成績(jī)值和相等的個(gè)數(shù)分別為60分3個(gè),70分3個(gè),80分2個(gè),90分2個(gè)。所以:C亠(八八八2宀)=0.992520 -20調(diào)整后的KWc為:KWc 二 KW/C =8.9163/0.9925 = 8.9839查表可知道,自由度為k_1=2的卡方分布,在=0.05顯著水平下,分布的上尾臨界值為5.99,由于8.985.99,因此拒絕原假設(shè)。所以,秩和最低的B組至少與秩和最

7、高的A組是不同的。二、freq頻數(shù)過(guò)程Freq頻數(shù)過(guò)程可以生成單向和n向的頻率表和交叉表。對(duì)于雙向表(二維表),該過(guò)程計(jì)算檢驗(yàn)統(tǒng)計(jì)量和關(guān)聯(lián)度。對(duì)于n向表,該過(guò)程進(jìn)行分層分析,計(jì)算每一層和交叉層的統(tǒng)計(jì)量。這些頻數(shù)也能夠輸出到SAS數(shù)據(jù)集里。1. freq過(guò)程說(shuō)明proc freq過(guò)程一般由下列語(yǔ)句控制:procfreqdata=數(shù)據(jù)集 ;by 變量列表;tables交叉表的表達(dá)式 ;weight 變量; output ;run ;該過(guò)程proc freq語(yǔ)句是必需的。其余語(yǔ)句是供選擇的。另外,該過(guò)程只能使用一個(gè) output語(yǔ)句。2. proc freq 語(yǔ)句的選項(xiàng)order=freq/data

8、/internal/formatted 規(guī)定變量水平的排列次序。 freq表示按頻數(shù)下 降的次序,data表示按輸入數(shù)據(jù)集中出現(xiàn)的次序,internal表示按非格式化值的次序(缺省值),formatted按格式化值的次序。formachar (1,2,7)=三個(gè)字符 規(guī)定用來(lái)構(gòu)造列聯(lián)表的輪廓線和分隔線的字符。 缺省值為formachar(1,2,7)= +,第一個(gè)字符用來(lái)表示垂直線,第二個(gè)字符用來(lái)表示水 平線,第三個(gè)字符用來(lái)表示水平與垂直的交叉線。page要求freq每頁(yè)只輸出一張表。否則,按每頁(yè)行數(shù)允許的空間輸出幾張表。 noprint禁止freq過(guò)程產(chǎn)生所有輸出。3. by語(yǔ)句一個(gè)by語(yǔ)句

9、能夠用來(lái)得到由 by變量定義的分組觀察,并分別進(jìn)行分析。過(guò)程要求輸入的數(shù)據(jù)集已按by變量排序。4. tables 語(yǔ)句可以包括多個(gè)tables語(yǔ)句。如果沒(méi)有tables語(yǔ)句,對(duì)數(shù)據(jù)集中的每個(gè)變量都生成一個(gè)單向 頻數(shù)表。如果tables語(yǔ)句沒(méi)有選項(xiàng),則計(jì)算tables語(yǔ)句中規(guī)定變量每個(gè)水平的頻數(shù)、累計(jì)頻數(shù)、占總頻數(shù)的百分比及累計(jì)百分比。Tables語(yǔ)句中的交叉表的表達(dá)式,請(qǐng)參見(jiàn)第二章第二節(jié)proc tabulate過(guò)程中的table語(yǔ)句的用法。Tables語(yǔ)句中的主要選項(xiàng)如下:all要求計(jì)算所有選項(xiàng)的檢驗(yàn)和度量,包括chisq、measures和cmh。chis 要求對(duì)每層是否齊性或獨(dú)立性進(jìn)行卡

10、方檢驗(yàn),包括pearson卡方、似然比卡方和Mantel-Haenszel卡方。并計(jì)算依賴于卡方統(tǒng)計(jì)量的關(guān)聯(lián)度,包括phi系數(shù)、列聯(lián)系數(shù)和Cramer V。對(duì)于2X 2聯(lián)列表還自動(dòng)計(jì)算 Fisher的精確檢驗(yàn)。cmh要求Cochran-Mantel-Haenszel卡方統(tǒng)計(jì)量,用于 2維以上表時(shí),檢驗(yàn)行變量和列變量是否有線性相關(guān)。exact要求對(duì)大于2X 2表計(jì)算Fisher的精確檢驗(yàn)。Fisher的精確檢驗(yàn)是假設(shè)行與列的邊緣頻數(shù)固定,并且在零假設(shè)為真時(shí),各種可能的表的超幾何概率之和。measures要求計(jì)算若干個(gè)有關(guān)相關(guān)的統(tǒng)計(jì)量及它們的漸近標(biāo)準(zhǔn)誤差。alpha=p設(shè)定100 (1 p) %置

11、信區(qū)間。缺省值為alpha= 0.05。scores=rank/table/ridit/modridi定義行/列得分的類型以便用于cmh統(tǒng)計(jì)量和pearson相關(guān)中。在非參數(shù)檢驗(yàn)中,一般常用scores=rank,用于指定非參數(shù)分析的秩得分。cellchi2要求輸出每個(gè)單元對(duì)總卡方統(tǒng)計(jì)量的貢獻(xiàn)。cumcol要求在單元中輸出累計(jì)列百分?jǐn)?shù)。expected在獨(dú)立性(或齊性)假設(shè)下,要求輸出單元頻數(shù)的期望值。deviation要求輸出單元頻數(shù)和期望值的偏差。misspri nt要求所有頻數(shù)表輸出缺失值的頻數(shù)。missing要求把缺失值當(dāng)作非缺失值看待,在計(jì)算百分?jǐn)?shù)及其他統(tǒng)計(jì)量時(shí)包括它們。out=輸出

12、數(shù)據(jù)集建立一個(gè)包括變量值和頻數(shù)的輸出數(shù)據(jù)集。sparse要求輸出在制表要求中變量水平的所有可能組合的信息。list以表格形式打印二維表。nocum/norow/nocol/nofreq/noprint分別不輸出累計(jì)頻率數(shù)、行百分率、列百分率、單元頻數(shù)、頻數(shù)表。5. weight 語(yǔ)句通常每個(gè)觀察對(duì)頻數(shù)計(jì)數(shù)的貢獻(xiàn)都是1。然而當(dāng)使用 weight語(yǔ)句時(shí),每個(gè)觀察對(duì)頻數(shù)計(jì)數(shù)的貢獻(xiàn)為這個(gè)觀察對(duì)應(yīng)的權(quán)數(shù)變量的值。6. output 語(yǔ)句該語(yǔ)句用于創(chuàng)建一個(gè)包含由 proc freq過(guò)程計(jì)算的統(tǒng)計(jì)量的 SAS數(shù)據(jù)集。由output語(yǔ)句創(chuàng) 建的數(shù)據(jù)集可以包括在 tables語(yǔ)句中要求的任意統(tǒng)計(jì)量。當(dāng)有多個(gè)ta

13、bles語(yǔ)句時(shí),output語(yǔ)句 創(chuàng)建的數(shù)據(jù)集的內(nèi)容相應(yīng)于最后要求的那個(gè)表。三、實(shí)例分析例29.1的SAS程序如下:data study.colleges ;do group=1 to 3;input n;do i=1 to n;input x ;output;end;end;cards;725 70 60 85 95 90 80660 20 30 15 40 35750 70 60 80 90 70 75proc npar1way data=study.colleges wilcoxon; class group;var x;run;程序說(shuō)明:建立輸入數(shù)據(jù)集colleges,數(shù)據(jù)的輸入和完全

14、隨機(jī)化方差分析的數(shù)據(jù)輸入完全相同,先輸入本組數(shù)據(jù)的總數(shù),然后輸入組中每個(gè)數(shù)據(jù)。分組變量為group,共有三組取值為1、2和3。輸入變量為x,存放每組中的數(shù)據(jù)。過(guò)程步調(diào)用npar1way過(guò)程,后面用選擇項(xiàng)wilcoxon,當(dāng)樣本數(shù)大于兩個(gè)時(shí),自動(dòng)進(jìn)行多樣本的Kruskal-Wallis秩和檢驗(yàn)。class語(yǔ)句后給出分組變量名group,var語(yǔ)句后給出要分析的變量x。主要結(jié)果如表29.2所示。表29.2用nparlway過(guò)程進(jìn)行多樣本比較的Kruskal-Wallis秩和檢驗(yàn)輸出結(jié)果N P A R 1 W A Y P R O C E D U R EWilcoxon Scores (Rank Su

15、ms) for Variable XClassified by Variable GROUPSum of Expected Std DevMeanGROUP N Scores Under H0 Under H0 Score1795.073.500000012.571898513.57142862627.063.000000012.07868944.50000003788.073.500000012.571898512.5714286Average Scores Were Used for Ties結(jié)果說(shuō)明:組1、組2和組3的秩和(Sum of Scores)分別為95.0、27.0和88.0。

16、原假設(shè) (組1、組2和組3的總體分布相同)為真時(shí),期望秩值( Expected)分別為(95+27+88 )x7/ (7+6+7 ) =73.50、(95+27+88 ) X 6/( 7+6+7) =63.00 和(95+27+88 ) X 7/ ( 7+6+7) =73.50, 各組的標(biāo)準(zhǔn)差( Std Dev)分別為 12.5718985、12.0786894、12.5718985。每組平均得分(MeanScore)分別為 95/7=13.5714286、27/6=4.50 和 88/7=12.5714286。按公式(29.5)調(diào)整后多樣本的Kruskal-Wallis秩和檢驗(yàn)統(tǒng)計(jì)量為 8.

17、9839,用自由度為DF=3 仁2的卡方分布近似, 得到大于近似卡方檢驗(yàn)統(tǒng)計(jì)量 8.9839的概率為p=0.01120.05,因此不能拒絕 group和x不線性相關(guān)。第二項(xiàng)cmh統(tǒng)計(jì)量為 ANOVA 統(tǒng)計(jì)量, 首先要求列變量 x是有序的。原假設(shè)為每一層的3個(gè)行的x平均得分是相等的,本例只有一層,且得分指定 scores=rank選項(xiàng),即用秩得分方法,因此就是Kruskal-Wallis秩和檢驗(yàn)統(tǒng)計(jì)量,自由度為行數(shù)減 1,即3-仁2,漸近自由度為2的卡方分布,KW= 8.984, p=0.0110.05,不能拒絕不相關(guān)。第三十課 Spearman等級(jí)相關(guān)分析四、秩相關(guān)的Spearman等級(jí)相關(guān)分

18、析前面介紹了使用非參數(shù)方法比較總體的位置或刻度參數(shù),我們同樣也可以用非參數(shù)方法 比較兩總體之間的相關(guān)問(wèn)題。秩相關(guān)(rank correlation )又稱等級(jí)相關(guān),它是一種分析和等級(jí)間是否相關(guān)的方法。適用于某些不能準(zhǔn)確地測(cè)量指標(biāo)值而只能以嚴(yán)重程度、名次先后、反應(yīng) 大小等定出的等級(jí)資料,也適用于某些不呈正態(tài)分布或難于判斷分布的資料。設(shè)和分別為和各自在變量 X和變量Y中的秩,如果變量 X與變量Y之間存在著正相關(guān), 那么X與Y應(yīng)當(dāng)是同時(shí)增加或減少,這種現(xiàn)象當(dāng)然會(huì)反映在(,)相應(yīng)的秩(,)上。反之,若(,)具有同步性,那么(,)的變化也具有同步性。因此:nn22d 八 di侃-Qi)(30.1)i 1

19、i d具有較小的數(shù)值。如果變量 X與變量Y之間存在著負(fù)相關(guān),那么 X與Y中一個(gè)增加時(shí),另一 個(gè)在減小,具有較大的數(shù)值。 既然由(,)構(gòu)成的樣本相關(guān)系數(shù)反映了 X與Y之間相關(guān)與否的 信息,那么在參數(shù)相關(guān)系數(shù)的公式 r(X,Y)中以和分別代替和,不是同樣地反映了這種信息嗎?基于這種想法,Charles Spearman秩相關(guān)系數(shù)rs (R, Q)應(yīng)運(yùn)而生:11 .二(Ri二 Ri)(Qi二 QJrs(R,Q)(30.2)nn1 2 1 2 (Ri - Ri)、(Qi 一 、Qi) nnrs(R, Q)與r(X,Y)形式上完全一致,但在 rs(R,Q)中的秩,不管 X與Y取值如何,總是只取1到之間的

20、數(shù)值,因此它不涉及 X與Y總體其他的內(nèi)在性質(zhì),例如,秩相關(guān)不需要總 體具有有限兩階矩的要求。由于:n(n 1)2n八 Qi =12i =i-R:八 Qi2 = 1222n2 n(n 1)(2n1)i Ai 4因此,公式(30.2)可以化簡(jiǎn)為:彳 6E(RiQ2 rs = 1n(n2 一1)顯然在=時(shí),秩相關(guān)系數(shù)達(dá)到最大值+6、d:_ _n(n2 -1)(30.3) (Ri -Q2 八 R2 Qi21。又因?yàn)椋篟Qi = n(n 1)(2n1)-2 RiQi而7 RQi在每對(duì)+= n 1時(shí)達(dá)到最小值,最小值求法為: (n 1)2 八 R2Qi2 2 RiQi所以,最小的a RiQi為:2n(n

21、1) n(n 1)(2n1)2 6_ 2最大的a (R -Qi)為:2n(n 1)(2 n 1)3-n(n 1)2n(n2 1)3故秩相關(guān)系數(shù)的最小值為 1 2= 1。在原假設(shè)和不相關(guān)的情況為真時(shí),即秩相關(guān)系數(shù)為0時(shí),的期望值為0,樣本的方差為2Srsn -2(30.4)自由度為n -2且分布關(guān)于零點(diǎn)對(duì)稱。當(dāng) 10時(shí),的樣本分布可以標(biāo)準(zhǔn)化為近似的t分布:rs - s(30.5) n -2例30.1某公司想要知道是否職工期望成為好的銷售員而實(shí)際上就能有好的銷售記錄。為了調(diào)查這個(gè)問(wèn)題,公司的副總裁仔細(xì)地查看和評(píng)價(jià)了公司10個(gè)職工的初始面試摘要、學(xué)科成績(jī)、推薦信等材料,最后副總裁根據(jù)他們成功的潛能給

22、出了單獨(dú)的等級(jí)評(píng)分。二年后獲得了 實(shí)際的銷售記錄,得到了第二份等級(jí)評(píng)分,見(jiàn)表30.1中的第1到4列所示。統(tǒng)計(jì)問(wèn)題為是否職工的銷售潛能與開(kāi)始二年的實(shí)際銷售成績(jī)一致。表30.1職工的銷售潛能與銷售成績(jī)的秩相關(guān)分析職工編號(hào)潛能等級(jí)銷售成績(jī)成績(jī)等級(jí)di = R -Qi124001112436031137300524412956-525562807-11633504-11710200100089260811982209-11105385239Z di2 =44Spearman秩相關(guān)系數(shù)rs (R, Q)的計(jì)算過(guò)程見(jiàn)表30.1中的第5到6列所示,最后計(jì)算結(jié)果為(=1 - 6 2di=1 -6(44)=0.

23、7333n(n2 -1)10(100-1)rs(R,Q)原假表明潛能與成績(jī)之間是較強(qiáng)的正相關(guān),高的潛能趨向于好的成績(jī)。秩相關(guān)系數(shù)設(shè)為0的t檢驗(yàn)統(tǒng)計(jì)量為:10 _ 2t 二 0.73332 二 3.05和-(0.7333)2查表自由度為 8,t=3.05的雙側(cè)p=0.0158。在0.05顯著水平上,t分布的上臨界點(diǎn)為 2.30,由 于3.052.30,因此,拒絕秩相關(guān)系數(shù)為0的原假設(shè),接受潛能與成績(jī)之間存在秩相關(guān)。五、Corr相關(guān)過(guò)程Corr相關(guān)過(guò)程用于計(jì)算變量之間的相關(guān)系數(shù),包括Pears on (皮爾遜)的乘積矩相關(guān)和加權(quán)乘積矩相關(guān)。還能產(chǎn)生三個(gè)非參數(shù)的關(guān)聯(lián)測(cè)量:Spearman的秩相關(guān),K

24、endall的tau-b和Hoeffding的相關(guān)性度量D。該過(guò)程也可以計(jì)算偏相關(guān)等一些單變量的描述性統(tǒng)計(jì)量。1. Corr過(guò)程說(shuō)明proc coproccorrdata=數(shù)據(jù)集 ;var變量列表with變量列表;partial變量列表;weight變量;freq變量;By變量列表;run ;proc corr語(yǔ)句調(diào)用corr過(guò)程,且是唯一必需的語(yǔ)句。如果只使用proc corr這一條語(yǔ)句,過(guò)程計(jì)算輸入數(shù)據(jù)集中所有數(shù)值變量之間的相關(guān)系數(shù)。其余語(yǔ)句是供選擇的。2. proc corr語(yǔ)句的選項(xiàng)outp=數(shù)據(jù)集名產(chǎn)生含有Pearson相關(guān)系數(shù)的一個(gè)新數(shù)據(jù)集。outs=數(shù)據(jù)集名產(chǎn)生含有Spearma

25、n等級(jí)相關(guān)系數(shù)的一個(gè)新數(shù)據(jù)集。outk=數(shù)據(jù)集名產(chǎn)生含有Kendall t b相關(guān)系數(shù)的一個(gè)新數(shù)據(jù)集。outh=數(shù)據(jù)集名產(chǎn)生含有Hoeffding D統(tǒng)計(jì)量的一個(gè)新數(shù)據(jù)集。pearson要求計(jì)算通常的 pearson乘積矩相關(guān)系數(shù),是缺省值。hoeffding要求計(jì)算并輸出 Hoeffding的D統(tǒng)計(jì)量。kendall要求計(jì)算并輸出 Kendall t b相關(guān)系數(shù)。spearman要求計(jì)算并輸出 Spearman等級(jí)相關(guān)系數(shù)。vardef= df|weight|wgt|wdf指定計(jì)算方差時(shí)的除數(shù):df (自由度 n ), weight或wgt (權(quán)重之和),n (觀察數(shù)),wdf (權(quán)重之和1

26、 )。缺省值為df。cov計(jì)算協(xié)方差方差矩陣。sscp要求輸出平方和與交叉積和。csscp要求輸出偏差平方和與交叉積和。best值對(duì)每個(gè)變量輸出指定個(gè)數(shù)的絕對(duì)值最大的相關(guān)系數(shù)。noprint禁止所有打印輸出。noprob禁止輸出同這些相關(guān)有聯(lián)系的顯著性概率。nosimple對(duì)原始數(shù)據(jù)執(zhí)行標(biāo)準(zhǔn)方差分析。rank要求按絕對(duì)值從高到低的次序?qū)γ總€(gè)變量輸出相關(guān)系數(shù)。 nocorr抑制Pearson相關(guān)的計(jì)算及輸出。nomiss將帶有某一變量缺失值的觀測(cè)值從所有計(jì)算中除去。 nosimple不輸出每個(gè)變量的簡(jiǎn)單描述性統(tǒng)計(jì)量。3. var語(yǔ)句該語(yǔ)句列出要計(jì)算相關(guān)系數(shù)的變量。例如,var a b c;則計(jì)算

27、a和b, a和c, b和c三對(duì)變量之間的相關(guān)系數(shù)。4. with語(yǔ)句為了得到變量間的特殊組合的相關(guān)系數(shù),該語(yǔ)句和var語(yǔ)句聯(lián)合使用。用var語(yǔ)句列出的變量在輸出相關(guān)陣的上方,而用 with語(yǔ)句列出的變量豎在相關(guān)陣左邊。例如, var a b;with x y 乙則生成x和a, y和a, z和a, x和b, y和b, z和b。5. partial 語(yǔ)句為了計(jì)算Pearson偏相關(guān),Spearman偏秩相關(guān),Kendall偏tau-b,用該語(yǔ)句給出偏出去 (即 固定)的變量名。6. weight 語(yǔ)句為了計(jì)算加權(quán)的乘積矩相關(guān)系數(shù),用該語(yǔ)句給出權(quán)數(shù)變量名。 該語(yǔ)句僅用于 Pearson相關(guān)。7. freq語(yǔ)句當(dāng)規(guī)定freq語(yǔ)句時(shí),輸入數(shù)據(jù)集中的每個(gè)觀察假定代表n個(gè)觀察,其中n是該觀察中freq變量中的值。觀察的總數(shù)規(guī)定為freq變量值的和。8. by語(yǔ)句使用by語(yǔ)句能夠獲得用by變量定義的分組觀察的獨(dú)立分析結(jié)果。六、實(shí)例分析例30.1的SAS程序如下:data study.persons ;input x y ;y=400-y;cards;2 400 4

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論