非參數(shù)統(tǒng)計(jì)學(xué)講義相關(guān)與回歸_第1頁
非參數(shù)統(tǒng)計(jì)學(xué)講義相關(guān)與回歸_第2頁
非參數(shù)統(tǒng)計(jì)學(xué)講義相關(guān)與回歸_第3頁
非參數(shù)統(tǒng)計(jì)學(xué)講義相關(guān)與回歸_第4頁
非參數(shù)統(tǒng)計(jì)學(xué)講義相關(guān)與回歸_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、個(gè)人資料整理 僅限學(xué)習(xí)使用非參數(shù)統(tǒng)計(jì)學(xué)講義主講:統(tǒng)計(jì)系袁靖第五章相關(guān)和回歸 1引言所謂相關(guān),是指兩組或兩組以上觀察結(jié)果之間的連帶性或聯(lián)系。換句話說,也就是各組觀察結(jié)果所反映的特性之間有關(guān)系。如幾個(gè)親生兄弟間的智商與出生順序有關(guān)系,受教育程度與性別有關(guān)系,出生率X和文盲率 Y之間的關(guān)系等等。在實(shí)際問題的研究中,人們常常想知道兩組或兩組以上的觀察結(jié)果是否有聯(lián)系,同時(shí)也想知道聯(lián)系的程度如何。前面的統(tǒng)計(jì)檢驗(yàn)?zāi)軌蛟谝欢ǖ娘@著性水平上,確定各組觀察 值的關(guān)系是否存在。相關(guān)方法被用來度量兩個(gè)或更多變量之間的線性關(guān)系的強(qiáng)度,是回歸分析的基礎(chǔ)。在數(shù)理統(tǒng)計(jì)學(xué)中,我們使用相關(guān)系數(shù)定義變量X和變量Y之間的相關(guān)性。:=

2、corr(X,Y)= C0V(X,Y)1(0,1.var(X) var(Y)對(duì)于龍羊本(Xi,Yi), (X2,Y2),(Xn,Yn)來說,Pearson相關(guān)系數(shù)為Z(Xi -x)(y -Y)nVZ(Xi -x)2Z(y -Y)2v (Xi -X)(y -Y)% (Xi -X)2% (Yi -Y)2(0.2如果在這個(gè)樣本中的 n個(gè)觀察值獨(dú)立,則r是P的漸近無偏估計(jì);如果它又是二元正態(tài)分布,則 r是P的ML估計(jì)。為了檢驗(yàn)H0:P=0, H: P#0 ,可以選取統(tǒng)計(jì)量t=r J 土言t(n2)1 1 -r結(jié)論:Pearson相關(guān)系數(shù)度量的是一種線性關(guān)系,而我們所要介紹的非參數(shù)的Spearman秩相

3、關(guān)系數(shù)rs和Kendall。相關(guān)系數(shù)實(shí)際上度量的是一種形式的相依聯(lián)系,或是更廣義的單調(diào)關(guān)系。因此相關(guān)的概念被推廣,不僅指線性相關(guān),而泛指相依或聯(lián)系。 2兩個(gè)樣本的相關(guān)分析等級(jí)相關(guān)等級(jí)相關(guān)(Rank Correlation也稱作級(jí)序相關(guān),用于兩個(gè)至少是定序尺度測(cè)量的樣本問相關(guān)程度的測(cè)定研究背景1 P度量了總體樣本點(diǎn)在標(biāo)準(zhǔn)差線周圍的聚集程度,詳見筆記 P38。個(gè)人資料整理 僅限學(xué)習(xí)使用基本方法兩個(gè)樣本X、Y,其觀察數(shù)據(jù)可以配對(duì)為(X1,Y1), (X2,丫2),(Xn,Yn)。將x1,x2,xn排序后 評(píng)秩,其秩記作 U,與Xi相對(duì)應(yīng)的秩為Ui(i =1,2,n);同樣,Yi,Y2;j-, Yn排

4、序后評(píng)秩,秩記作 V,與 yi相對(duì)應(yīng)的秩為Vi(i =1,2,n)。這樣得到的 n對(duì)秩(U1M), (U2M),,(U n ,Vn)可能每一對(duì)完全相 等,也可能不等。由于每一樣本都是n個(gè)數(shù)據(jù)評(píng)秩,因此 叫與Vj的取值都是從1到n。X、Y的秩可能完全一致,即對(duì)于所有的i來說,有Ui = M ,表51是完全一致的評(píng)秩結(jié)果。X、Y的秩可能完全相反,表52是完全相反的評(píng)秩結(jié)果。如果 X、Y完全相關(guān),應(yīng)該對(duì)于所有的i有Ui = Vi ,即Ui Vj =0。因此,Ui與Vi之差可以用來度量 X、Y的相關(guān)程度。定義Di =Ui -Vi表5-1完全一致的評(píng)秩X的秩Y的秩1122n 1n 1nn表5-2完全相反

5、的評(píng)秩X的秩Y的秩1n2n 1n 12n1則兩組秩完全相關(guān)時(shí),Di i 1 i 15.3)式的這個(gè)秩差值平方和的大小既受到n的多少的影響,又受到兩組秩不一致程度的影響,因此,采用相對(duì)的測(cè)量指標(biāo)有利于說明X、Y的相關(guān)程度。因?yàn)?Di2的最大值反映X、丫完全不相關(guān)的情況,所以,用5,4)式的中括號(hào)內(nèi)最后一項(xiàng),當(dāng)n為奇數(shù)時(shí)是22; n為偶數(shù)時(shí)是12。5.3)式除以5,4)式得到(0.5、D2_ 3, D2,2、,一 ,2、n(n -1)/3n(n -1)5,5)式的取值從0至IJ 1。根據(jù)表5-1中的數(shù)據(jù)計(jì)算5,5)式值為0,表5-2中的數(shù)據(jù)計(jì)算的5,5)式值為1,即X、Y的秩完全一致時(shí),5,5)式

6、的值為0, X、Y的秩完全不一致時(shí),5,5)式的值為1。測(cè)度兩個(gè)樣本等級(jí)相關(guān)程度可以象參數(shù)方法一樣,定義等級(jí)相關(guān)系數(shù)作為標(biāo)準(zhǔn)。斯皮爾曼的等級(jí)相 關(guān)系數(shù)(Spearmancoefficient of rank correlation是測(cè)定兩個(gè)樣本相關(guān)強(qiáng)度的重要指標(biāo)。其計(jì)算公式為6% Di2R =12 (0,6n(n -1)斯皮爾曼相關(guān)系數(shù)也寫為,在有下標(biāo)注以s是為表明這個(gè)相關(guān)系數(shù)r不是積矩相關(guān)的簡單相關(guān)系數(shù),而是等級(jí)相關(guān)的 Spearman相關(guān)系數(shù)。注:由于5,6)式與5,5)式不同,所以,R的取值從一 1到十1, R =1表明X、Y完全相關(guān),R =十l為完全正相關(guān),R=- 1為完全負(fù)相關(guān)。|R

7、越接近于I,表明相關(guān)程度越高,反之,R越接近于零,表明相關(guān)程度越低,R=0為完全不相關(guān)。R0為正相關(guān),RV0為負(fù)相關(guān)。通常認(rèn)為 R :0,8為相關(guān)程度較高。Spearman秩相關(guān)系數(shù)檢驗(yàn)臨界值查表可得,P198。存在打結(jié)時(shí),Spearman統(tǒng)計(jì)量要作相應(yīng)修正。在大樣本時(shí),可用正態(tài)近似作檢驗(yàn)。Z=rs,n1 nN(0,1)應(yīng)用【例5-1】經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平之間的相關(guān)分析對(duì)某地區(qū)12個(gè)街道進(jìn)行調(diào)查,并對(duì)經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平按規(guī)定的標(biāo)準(zhǔn)打分,評(píng)定結(jié)果如表5- 4。表5-4某地區(qū)經(jīng)濟(jì)水平與衛(wèi)生水平得分街道號(hào)經(jīng)濟(jì)水平182287360衛(wèi)生水平867865街道號(hào) 經(jīng)濟(jì)水平衛(wèi)生水平7848087877

8、98075個(gè)人資料整理 僅限學(xué)習(xí)使用498881094965756411858568990126870分析:將表5-4中定距尺度測(cè)量的分?jǐn)?shù),按從小到大的順序排等級(jí),得到表55的結(jié)果。對(duì)兩個(gè)定序尺度測(cè)量的樣本進(jìn)行相關(guān)分析,可以采用等級(jí)相關(guān)系數(shù)測(cè)定。必要的計(jì)算過程如表5-5所列。根據(jù)0. 8,所以該地區(qū)的經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平存在著正相關(guān)關(guān)系,相關(guān)程度較高,為 88. 81%。街道號(hào)經(jīng)濟(jì)水平U)衛(wèi)生水平式中,u是X中同分的觀察值數(shù)目,v是Y中同分的觀察值數(shù)目。【例5-2】經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平之間的相關(guān)分析某地區(qū)對(duì)24個(gè)區(qū)縣進(jìn)行調(diào)查,并對(duì)經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平按規(guī)定標(biāo)準(zhǔn)評(píng)分,結(jié)果如表56。分析:將

9、表56的評(píng)分轉(zhuǎn)換為秩次,從高往低排序,同分的秩取平均值,結(jié)果見表57。根據(jù)公式個(gè)人資料整理 僅限學(xué)習(xí)使用,_ 2R =1 - 6 i=16 347 =1 -0.1509 =0.8491n(n -1)24 (24 -1)由于經(jīng)濟(jì)水平和衛(wèi)生水平的評(píng)分中均有同分,應(yīng)采用校正因子修正。利用5.7式計(jì)算修正的R為,22n(n -1)-6% Di -6(u v)24 (575)-6 (347) -1 / 2 (16 12)n(n2-1) -12u . n(n2 _1)_12v,24 (575)-16.24 (575) -12= 0.8490對(duì)比兩個(gè) R值可知,由于同分的觀察值數(shù)目占觀察值總數(shù)目的比例不是很

10、大,因而校正后的R與校正前的R變化不大。但是,校正前的只略大于校正后的R,這說明同分對(duì)只的影響雖然很小,但同分的區(qū)縣編號(hào)經(jīng)濟(jì)水平X)衛(wèi)生水平Y(jié))區(qū)縣編號(hào)經(jīng)濟(jì)水平X)衛(wèi)生水平Y(jié))192561368552907014676639071156559487761664585816917615068068186054779621959438777020554597664214634107663224232117454233930126865243831影響是夸大R值。因此。在X、Y中至少有一個(gè)存在大量同分時(shí),應(yīng)進(jìn)行校正。表5-6經(jīng)濟(jì)水平與衛(wèi)生水平評(píng)分區(qū)縣編號(hào)X的秩次U)Y的秩次V)D=U-VD1114-

11、1316922.53.5-1132.520.50.254413955500666007711-416883.54.520.2599.590.50.25109.510-0.50.25111116.5-5.530.251212.584.520.251312.515-2.56.25141477491515123916161339171718-11表5-7經(jīng)濟(jì)水平與衛(wèi)生水平的秩次個(gè)人資料整理 僅限學(xué)習(xí)使用181816.51.52.25191920-11202019112121210022222200232324-1124242311347.004.R的顯著性檢驗(yàn)利用相關(guān)系數(shù)及其修正的公式計(jì)算的R值,是

12、抽自兩個(gè)總體的樣本數(shù)據(jù)計(jì)算的結(jié)果,從這一相關(guān)系數(shù)的大小,可猜測(cè)總體的秩相關(guān)系數(shù)是否與零有顯著差異,但是否為真,應(yīng)進(jìn)行假設(shè)檢驗(yàn)。對(duì)R的顯著性檢驗(yàn)正是為了回答這一問題。檢驗(yàn)可以僅研究兩個(gè)總體是否存在相關(guān),也可以分別研究相關(guān)的方向,即是正相關(guān),還是負(fù)相關(guān)。針對(duì)研究問題的不同,可以建立不同的假設(shè)組。雙側(cè)檢驗(yàn)H0:不相關(guān)H1:存在相關(guān)單側(cè)檢驗(yàn)H0 :不相關(guān)H0 :不相關(guān)H+ :正相關(guān)H :負(fù)相關(guān)為對(duì)假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測(cè)量的。根據(jù)前式計(jì)算出R值。當(dāng)nM30時(shí),在附表中,依據(jù)n和R查找相應(yīng)的概率 P。表58是判定指導(dǎo)表。表5-8 R顯著性檢驗(yàn)判定指導(dǎo)表設(shè)P-H+:正相關(guān)R的右尾概率H:負(fù)相

13、關(guān)R的左尾概率H1:存在相關(guān)R的較小概率的2倍若n30,則按【例5-3】對(duì)例53作顯著性檢驗(yàn)分析:由于例53中未指明相關(guān)的方向,只需檢驗(yàn)是否相關(guān),因而建立雙側(cè)備擇:H0:不相關(guān)Hi:存在相關(guān)個(gè)人資料整理 僅限學(xué)習(xí)使用利用提供的數(shù)據(jù)計(jì)算的R值為0. 8491 ,每個(gè)樣本數(shù)據(jù) n為24。在附表中 n= 24時(shí);雙側(cè)檢驗(yàn)R =0.608的概率為 0. 002。顯然,R = 0. 8491 R =0.608。因此,概率 PV0. 002,數(shù)據(jù)拒絕 Ho,表 明經(jīng)濟(jì)水平和衛(wèi)生水平確實(shí)存在相關(guān)關(guān)系。二、Kendall r相關(guān)檢驗(yàn)Kendall秩相關(guān)即肯德爾秩相關(guān),與等級(jí)相關(guān)一樣,也是用于兩個(gè)樣本相關(guān)程度的

14、測(cè)量,要求數(shù)據(jù)至 少是定序尺度的。它也是利用兩組秩次測(cè)定兩個(gè)樣本問相關(guān)程度的一種非參數(shù)統(tǒng)計(jì)方法。. 基本概率協(xié) 同0 ,則對(duì)子(Xi,Yi)與(Xj,Yj)協(xié)同;如果 (Xj Xi)(Yj -Y)非一致對(duì)評(píng)分與最大可能總分之比為2Vn(n -1)(0.10當(dāng)Y的秩對(duì)完全按自然順序排列時(shí),5.9)式的值為1, 5.10)式的值為0;而當(dāng)Y的秩對(duì)全部為非一致對(duì)時(shí),5.10)式的值為1, n(n -1)T =14Vn(n -1)(0.12若記S= U V ,則Kendall秩相關(guān)系數(shù)為n(n-1)(0.13這里的Kendall秩相關(guān)系數(shù) T是Tau的縮寫,也常寫作 。T = l,表明兩組秩次完全正相

15、關(guān);T =1,表明兩組秩次間完全負(fù)相關(guān)。一般 |T 0.8,可以為相關(guān)程度較高。NOTE :該定義式實(shí)質(zhì)為概率,-1 T , Cn -u Cn -V式中,uH=ZCu , u是X中同分觀察值的數(shù)目,v=C:, u是X中同分觀察值的數(shù)目。u, v仍分別表示X、Y的每一同分組中同分觀察值的數(shù)目。表5-11兩個(gè)裁判員的秩的評(píng)分XY的數(shù)對(duì)1, 2.52, 3.515個(gè)加1, 2.52, 3.513個(gè)減1, 4.52, 1-11 , 4.52, 512.5 , 2.53.5 , 3.50個(gè)人資料整理 僅限學(xué)習(xí)使用2.5 ,4.53.5 , 1-12.5 ,4.53.5 , 512.5 ,4.53.5 ,

16、 1-12.5 ,4.53.5 , 514.5 ,4.51 , 505. T的顯著性檢驗(yàn)與Spearman秩相關(guān)系數(shù) R一樣,Kendall秩相關(guān)系數(shù) T的顯著性也應(yīng)進(jìn)行檢驗(yàn)。這一檢驗(yàn)實(shí)際上是檢驗(yàn)兩個(gè)總體的相關(guān)是否真實(shí)存在,是正相關(guān)或是負(fù)相關(guān),從而說明以T的大小反映相關(guān)程度的高低是可信。如果研究關(guān)心的是相關(guān)是否確實(shí)存在,而不考慮相關(guān)的方向,則應(yīng)建立雙側(cè)備擇,假設(shè)組為H0:不相關(guān)H1:存在相關(guān)若關(guān)心的是相關(guān)的方向,則應(yīng)建立單側(cè)備擇,假設(shè)組為H0 :不相關(guān)H0 :不相關(guān)H+:正相關(guān)H-:負(fù)相關(guān)為對(duì)假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測(cè)量的。通過對(duì)數(shù)據(jù)求出一致對(duì)或非一致對(duì)數(shù)目,可 以按照計(jì)算公式算出

17、 Kendall秩相關(guān)系數(shù)T。1)小樣本時(shí)(n 30),可以查表給出尾概率,T的抽樣分布中附表中給出。表5-12 T顯著性檢驗(yàn)判定指導(dǎo)表設(shè)P-H+:正相關(guān)T的右尾概率H:負(fù)相關(guān)T的左尾概率Hi:存在相關(guān)T的較小概率的2倍30),可作正態(tài)近似(0.153T , n(n-1)2(2n 5), n(n -1)(2n 5)/18由于Z近似正態(tài)分布,故可以查標(biāo)準(zhǔn)正態(tài)分布表找到相應(yīng)的尾概率。三、 等級(jí)相關(guān)系數(shù)R和Kendall秩相關(guān)系數(shù)T的比較.相同點(diǎn)兩個(gè)相關(guān)系數(shù)的檢驗(yàn)都要求數(shù)據(jù)至少是在定序尺度上測(cè)量;都是計(jì)算秩相關(guān)系數(shù),用以測(cè)度兩個(gè)相關(guān)樣本之間的相關(guān)程度;它們的取值都是在一1到+1之間;.不同點(diǎn)R和T的

18、數(shù)值即使對(duì)于同一組數(shù)據(jù)也是不同的,多數(shù)情況下,R的絕對(duì)值大于T的絕對(duì)值;雖然R和T都使用了資料中同量的信息,但由于兩者具有不同的基礎(chǔ)尺度,R利用的是秩差,而T利用的是秩的順序,即一致對(duì)和非一致對(duì),因此,不能將它們的數(shù)值加以比較,以說明相關(guān)程度的高個(gè)人資料整理 僅限學(xué)習(xí)使用低。T的解釋比起 R來更容易。兩個(gè)觀察的數(shù)對(duì) (xi,yi) , (Xj,yj),當(dāng)Xi Xj時(shí),總有yi yj ,稱為 順序一致對(duì),若對(duì)于每個(gè) Xi yj ,則為不一致對(duì)。T的準(zhǔn)確意義是:一致對(duì)數(shù)目與非一致 對(duì)數(shù)目之差占全部可能數(shù)對(duì)的比重。四、偏秩相關(guān)詳見易丹輝教材k個(gè)樣本的相關(guān)分析前面一章研究的是 n個(gè)對(duì)象或個(gè)體的兩組秩之

19、間相關(guān)的度量,在實(shí)際問題中,往往還涉及n個(gè)對(duì)象或個(gè)體的幾組秩評(píng)定之間的相關(guān)。對(duì)于至少是定序尺度測(cè)量的k個(gè)配對(duì)樣本的數(shù)據(jù),或 k次實(shí)驗(yàn)得到的數(shù)據(jù),其秩評(píng)定間的相關(guān),可以采用 Kendall秩評(píng)定協(xié)同系數(shù)度量。本章主要介紹兩種Kendall秩評(píng)定協(xié)同系數(shù):完全秩評(píng)定協(xié)同系數(shù)和不完全秩評(píng)定協(xié)同系數(shù)。一、完全秩評(píng)定的Kendall協(xié)同系數(shù)完全秩評(píng)定的 Kendall 協(xié)同系數(shù)(KendallCoefficient of Concordancefor ComPlete Rankings用于是組秩 評(píng)定間相關(guān)程度的測(cè)定,即多組秩之間關(guān)聯(lián)程度的測(cè)定。.基本方法若被分析的數(shù)據(jù)是定序尺度測(cè)量的,那么n個(gè)數(shù)據(jù),即

20、n個(gè)對(duì)象或個(gè)體,可以分別給予某一個(gè)秩,在這一組數(shù)據(jù)內(nèi)所有的秩次和即等級(jí)和為2 HI n = n(n 1)/2如果有k組秩,那么這 k組秩的秩次總和就是 kn(n+1)/2。例如3個(gè)消費(fèi)者分別給 6種牌號(hào)電冰箱的質(zhì)量評(píng)等級(jí),結(jié)果如表514。表中最后一行 Rj是每一種6牌號(hào)電冰箱的秩和,總的秩和為kn(n+1)/2= 3(6)(6+ 1)/2 63Z R 。這也就是最大可能的秩次j 1和。這時(shí),對(duì)于每一個(gè)觀察對(duì)象或個(gè)體來說,平均的秩次和應(yīng)為kn(n+1)/2/ n表5-14消費(fèi)者給冰箱質(zhì)量評(píng)定的秩冰箱A冰箱B冰箱C冰多i D冰箱E冰多i F116325421564233632541個(gè)人資料整理 僅

21、限學(xué)習(xí)使用秩和C8141111118/2。如果Rj(j = l, 2,,n表示每一觀察對(duì)象或個(gè)體白實(shí)際秩和,那么, B與k(n 十1/2越接近,表明對(duì)第j個(gè)觀察對(duì)象或個(gè)體的秩評(píng)定越接近平均秩;二者相差越遠(yuǎn),遠(yuǎn)離平均秩。由于Rj與k(22十1/2的差值可正可負(fù),因此,在分析時(shí)應(yīng)采用差值的平方和。定義差值的平方和為S,即 nS 八(弓-k(n 1)/2)2(0.16j 1在k組秩評(píng)定完全一致時(shí),各個(gè)觀察對(duì)象或個(gè)體的秩和與平均秩和的離差平方和,是最大可能的離差平 方和。由于k組秩評(píng)定完全一致時(shí),各觀察對(duì)象或個(gè)體的秩和分別為k, 2k,,nk,如表514,如果3位消費(fèi)者對(duì)6種牌號(hào)電冰箱的質(zhì)量看法一致,

22、那么他們會(huì)給出相同的秩。這時(shí),被認(rèn)為質(zhì)量最好的電冰箱將得到3個(gè)秩1,它們的秩和 Rj = 1十1十1 = 3=ko被認(rèn)為質(zhì)量第二的,秩和Rj = 2十2十2= 6=2k。最差的電冰箱秩和將是Rj = 6十6十6=18=nko也就是說,當(dāng) k組秩評(píng)定之間完全一致的時(shí)候,Rj應(yīng)是k, 2k,,nko因此,最大可能的離差平方和為 nn、jk -k(n 1)/22 =k2% (j -(n 1)/2)2 =k2n(n2 -1)/12(0.17j 1j 1k組秩評(píng)定間的一致性,即協(xié)調(diào)程實(shí)際偏差平方和與最大可能偏差平方和之比,在一定程度上能反映度。5.16)式除以W的取值在0到1之間。若 W=0,表明k組秩

23、之間不相關(guān);若 W=1,表明k組秩之間完全相關(guān),即完全致。由于k2時(shí),k組秩評(píng)定不可能完全不一致,也就是說,只有當(dāng) k=2時(shí),秩評(píng)定一致和非一致是對(duì)稱相反的,而k2,對(duì)稱性不再存在,因此,W取值不可能為負(fù)。為方便實(shí)際計(jì)算,NOTE :在m組秩的評(píng)定完全一致時(shí),該離差平方和是最大可能的離差平方和,實(shí)際上,個(gè)體的秩和分別為:k,2k,,nk。22最大可能的離差平萬和為:k n(n -1)/12完全評(píng)秩的協(xié)同系數(shù) W,實(shí)際表達(dá)了實(shí)際偏差平方和和最大可能偏差平方和之比,在一定程度上反映了 k組評(píng)秩之間的一致性,即協(xié)同程度。個(gè)人資料整理 僅限學(xué)習(xí)使用0 WW W1。當(dāng)W=0時(shí),表明k組秩之間不相關(guān);若

24、W=1 ,表明k組秩之間完全相關(guān),即完全一致。在作檢驗(yàn)時(shí),W統(tǒng)計(jì)量和 S統(tǒng)計(jì)量都有表可查;當(dāng)大樣本時(shí),有12S2Q=k(n1)W= . (n -1)kn(n 1)應(yīng)用【例5-8】裁判組整體評(píng)分效果的相關(guān)分析在某次業(yè)余歌手大賽上,6名裁判員組成的裁判組,對(duì)10名參賽歌手的評(píng)分等級(jí)如表515。表5-15裁判員對(duì)歌手評(píng)定的等級(jí)歌手編號(hào)裁判員A裁判員B裁判員C裁判員D裁判員E裁判員F11111152237583354626949754106545365866647727329102487101034191082997108988310分析:裁判組由 6名裁判組成,要評(píng)價(jià) 6名裁判整體評(píng)分效果,實(shí)際上是

25、評(píng)價(jià)裁判組整體評(píng)分的一6個(gè)樣本完全秩評(píng)致程度。由于這是 6個(gè)配對(duì)樣本,且每一個(gè)觀察對(duì)象即參賽歌手全部都有秩,所以是定協(xié)調(diào)程度的考察,應(yīng)采用完全秩評(píng)定的Kendall協(xié)同系數(shù)。表5-16裁判員對(duì)歌手評(píng)定的等級(jí)歌手編號(hào)RjRj21101002287843321024441168153196163210247309008351225945202510462116合計(jì)33011840表516是Rj計(jì)算表。由于 k=6, n=10,按5.19)式有n R2 -3k2n(n 1)2j +k2n(n2 -1)一 _2二 12(11840) - 3(36)(10 -1)(10 1)-10(36)(102 -1

26、)=0.6865般來說,W的值越接近于l,表明k組秩評(píng)定之間的一致程度越高;W值越接近于0,則k組秩評(píng)個(gè)人資料整理 僅限學(xué)習(xí)使用定之間的一致程度就越低。這里,W=0. 6865,不算很大,表明裁判組6名裁判員對(duì)10名參賽歌手水平的意見一致程度不是很高。同分的處理詳見易丹輝編非參數(shù)統(tǒng)計(jì)一方法與應(yīng)用P134。W的顯著性檢驗(yàn)對(duì)W顯著性的檢驗(yàn),是為了對(duì)總體間是否存在真實(shí)的相關(guān)關(guān)系作出判定。由于是k個(gè)樣本,只能建立雙側(cè)備擇,假設(shè)組為Ho:不相關(guān)H1:存在相關(guān)為了對(duì)假設(shè)作出判定,需要容量均為n的k個(gè)樣本數(shù)據(jù)至少是在定序尺度上測(cè)量的,每一觀察值都能有相應(yīng)的秩。 TOC o 1-5 h z 檢驗(yàn)統(tǒng)計(jì)量因樣本的

27、大小而有所不同。當(dāng)樣本的觀察值n較小時(shí),采用的檢驗(yàn)統(tǒng)計(jì)量為SonnS c (B-k(n 1)/2)2 C R2-3k2n(n 1)2(0.20j ij 1當(dāng)樣本觀察值數(shù)目n較大時(shí),采用 Q統(tǒng)計(jì)量。12S2Q=k(n-1)W= - (n-1)(0.21kn(n 1)小樣本時(shí),檢驗(yàn)統(tǒng)計(jì)量 S在H0為真時(shí)的抽樣分布,可以參見附表。大樣本時(shí),可以查卡方分布表得 到其相應(yīng)的尾概率的值?!纠?-9】對(duì)上例的W值進(jìn)行顯著性檢驗(yàn)分析:因?yàn)樵谶@個(gè)問題中,n=l0, k= 6,所以應(yīng)利用 W值計(jì)算統(tǒng)計(jì)量 Q,根據(jù)式中,入是配對(duì)樣本被比較的次數(shù)。例如,3個(gè)消費(fèi)者對(duì)3種牌號(hào)的彩電質(zhì)量評(píng)等級(jí),若3種脾號(hào)的彩電僅一次被比

28、較,則 入=1。/2,由于有k行,因此,所 有的秩和為km(m十1/2。對(duì)于n列來說,平均每列的秩和為 km(m十1/2n。若每列的實(shí)際秩和記作 Rj(j=1, 2,,n那么,實(shí)際秩和與平均秩和的差值大小也可以用作判定協(xié)調(diào)性程度。由于實(shí)際秩和與平均秩和之差可正可負(fù),因而,仍采用差值平方和。定義S為km(m 1)12S =, B (0.23jT j 2n當(dāng)k組秩的評(píng)定完全一致時(shí),S就是2,2,、1 n(n -1) (0.2412這也就是實(shí)際秩和與平均秩和差值平方和的最大可能值。因此,將 5.23)式與 2n(n2 -1)nW =12%j i2(0.26Rj -km(m 1)/2n222 n(n

29、1)如果 m = m和入=k,那么5.25)式和5.26)式就是5.18)式。W值在0到1之間。W為0,表明k組秩評(píng)定之間不相關(guān);W為1,表明k組秩評(píng)定之間完全相關(guān),即完全一致。由于k2時(shí),秩評(píng)定的一致和非一致不是對(duì)稱的,因而, W取值不可能負(fù)。為實(shí)際計(jì)算的方便,5.25)式和5.26)式可以寫成5.27)式的形式。12S =12% R23k2m2(m 1)2nn12% Rf -3k2m2(m 1)2/nj注,2n(n2 -1)(0.27應(yīng)用【例5-10】消費(fèi)者對(duì)彩電質(zhì)量評(píng)價(jià)的一致性分析3個(gè)。因7種不同牌號(hào)的彩電質(zhì)量檢驗(yàn),不要求消費(fèi)者對(duì)每一種牌號(hào)的彩電都給出秩,只要求不大于而,m=3, n=7

30、。如果每對(duì)彩電僅一次被比較,因而有 入=1。需要的消費(fèi)者數(shù)目,可以從 (521式中計(jì)算得到n(n -1) 1(7)(7 -1) k = = = /m(m -1)3(3 -1)表5-18 消費(fèi)者對(duì)彩電質(zhì)量可能的評(píng)秩消費(fèi)者編號(hào)彩電A彩電B彩電C彩電D彩電E彩電F彩電G1*2*3*4*5*6*7*表5-19消費(fèi)者對(duì)彩電的秩評(píng)定結(jié)果消費(fèi)者編號(hào)彩電A彩電B彩電C彩電D彩電E彩電F彩電G112321323321個(gè)人資料整理 僅限學(xué)習(xí)使用4231513262137132合計(jì)3597846即需要有7名消費(fèi)者來評(píng)定。表518是一種滿足要求的設(shè)計(jì)表格。表中的*號(hào)表示那種牌號(hào)的彩電被消費(fèi)者評(píng)秩。由于 m=3, n=

31、7, k=7,所以表中每一行有 m=3個(gè)秩,表中每一列有 km/n=7(3/7=3個(gè)秩。經(jīng)過消費(fèi)者評(píng)秩,結(jié)果如表519。分析:由于這是不完全的秩評(píng)定,設(shè)計(jì)要求符合(5 21式的平衡假定,可以采用不完全秩評(píng)定的Kendall協(xié)同系數(shù),分析消費(fèi)者對(duì)彩電質(zhì)量評(píng)價(jià)的一致性。根據(jù)5.27)式有12S =12(32 52 92 72 82 42 62)-3(72)(32)(3 1)2 / 7 = 12(280)-30 24 = 336336W =-2=1 7(72 -1)這是W的最大值,表明7個(gè)消費(fèi)者對(duì)彩電質(zhì)量的看法完全一致。在不完全的秩評(píng)定中,同分也是可能出現(xiàn)的,因?yàn)閿?shù)據(jù)可以由定距尺度的評(píng)分轉(zhuǎn)換為定序尺

32、度的 秩。但是,目前沒有比較簡單的校正公式,因此,計(jì)算 Kendall協(xié)同系數(shù)時(shí),仍舊采用 524)式,5 25)式或 5.27)式。顯著性檢驗(yàn)對(duì)于不完全秩評(píng)定的 Kendall協(xié)同系數(shù),也可以進(jìn)行顯著性檢驗(yàn)。建立的假設(shè)組為Ho:不相關(guān)Hi:存在相關(guān)為對(duì)假設(shè)作出判定,需要k個(gè)樣本的數(shù)據(jù)至少是定序尺度測(cè)量的,并能夠根據(jù)前面的公式分別計(jì)算出S、Wo利用S、W按照5.28)式、5.29)式計(jì)算得到檢驗(yàn)統(tǒng)計(jì)量Q。統(tǒng)計(jì)量 Q近以于自由度 df = n-l的卡方分布。因此,可以根據(jù)卡方分布對(duì)原假設(shè)作出相應(yīng)的判斷。 (n2 -1)Wm 1(0.2812S1 n(m 1)(0.29【例5-11利用例5-10的

33、數(shù)據(jù)作顯著性檢驗(yàn)分析:在例5-10中,入=1, m = 3, n=7, W=1,將各個(gè)數(shù)值代入 5.28)式得到個(gè)人資料整理 僅限學(xué)習(xí)使用 TOC o 1-5 h z 22(n -1)W1(7 -1)1 .Q 二二二 12m 13 1自由度df=n 1 = 6,在卡方分布表中,H0為真時(shí),Q是12出現(xiàn)的概率P略大于0. 05,因?yàn)楫?dāng)概 率為0. 05時(shí),72=12. 59。由于這個(gè) P是近似的值,因而,可以在顯著性水平=0.05上拒絕Ho。況且,W的值為最大可能值1,拒絕H0是合乎邏輯的。多重比較若P值很小,以至于 H0被拒絕,也就是 k組不完全的秩評(píng)定之間存在相關(guān),那么,有必要比較這k組秩之

34、間是否有重大的不同,可以運(yùn)用多重比較技術(shù)來研究這一問題。第j列的秩和Rj除以該列的秩數(shù)目km/n,是第j個(gè)對(duì)象的平均秩,比較 n個(gè)對(duì)象的k個(gè)不完全組的秩之 間有無明顯不同,可以利用各個(gè)對(duì)象的平均秩比較,也可以利用各列秩和的差值比較。對(duì)于任意兩個(gè)列等級(jí)和(Ri,Rj)1i =j Wn,它們的差值在1 一口水平下,滿足5.30)式或(0.31表明n個(gè)對(duì)象間秩評(píng)定沒有重大的不同;而若大于5.30)式或5.31)式的右側(cè),表明這是有重大不同的數(shù)對(duì)。5.30)式、/2=21,查多重比較的臨界值Z表,得到2. 823,代入5 30)式,得到R - 0 K 2.82377(1)(3+ 1)/6 = 6.0984將表5-19中各列秩和兩倆比較差值,可知,最大差值為A與C歹U,即3-9=6。這一差值仍小于6. 0984。因此,可以得出結(jié)論:在 7種牌號(hào)彩毫的不完全秩評(píng)定中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論