數(shù)理統(tǒng)計(jì)2015 第12章非參數(shù)統(tǒng)計(jì)2015_第1頁
數(shù)理統(tǒng)計(jì)2015 第12章非參數(shù)統(tǒng)計(jì)2015_第2頁
數(shù)理統(tǒng)計(jì)2015 第12章非參數(shù)統(tǒng)計(jì)2015_第3頁
數(shù)理統(tǒng)計(jì)2015 第12章非參數(shù)統(tǒng)計(jì)2015_第4頁
數(shù)理統(tǒng)計(jì)2015 第12章非參數(shù)統(tǒng)計(jì)2015_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第12章非參數(shù)統(tǒng)計(jì)1習(xí)慣上把檢驗(yàn)問題劃分為參數(shù)檢驗(yàn)問題和非參數(shù)檢驗(yàn)問題,相應(yīng)的統(tǒng)計(jì)假設(shè)分別為參數(shù)性假設(shè)和非參數(shù)性假設(shè)。2前面所講的統(tǒng)計(jì)假設(shè)檢驗(yàn),首先要對(duì)總體參數(shù)提出一個(gè)假設(shè),如假設(shè)總體平均數(shù)等于某個(gè)特定的值0。然后通過樣本數(shù)據(jù)計(jì)算統(tǒng)計(jì)量,推斷這個(gè)假設(shè)是否可以被接受。如果可以被接受,樣本很可能抽自這個(gè)總體,否則,很可能是抽自另外一個(gè)總體。這樣的統(tǒng)計(jì)推斷類型稱為參數(shù)統(tǒng)計(jì)(parametricstatistics)或參數(shù)檢驗(yàn)(parametrictest)。統(tǒng)計(jì)量的抽樣分布與總體分布類型有關(guān),t分布、2分布和F分布都是建立在總體為正態(tài)分布的基礎(chǔ)上,或者說必須抽自正態(tài)總體。我們這里所說的“正態(tài)總體”,完全是為了數(shù)學(xué)理論上嚴(yán)謹(jǐn)性的需要。在實(shí)際應(yīng)用時(shí),當(dāng)總體峭度稍稍偏離正態(tài)分布,或者說當(dāng)總體為近似正態(tài)分布時(shí),t檢驗(yàn)、2檢驗(yàn)和F檢驗(yàn)仍可使用。在樣本含量很大時(shí),根據(jù)中心極限定理,即使總體偏離正態(tài)分布,也可認(rèn)為樣本平均數(shù)服從正態(tài)分布,從而保證檢驗(yàn)的有效性。3當(dāng)總體分布完全偏離正態(tài)分布、樣本含量又較小時(shí),上述參數(shù)檢驗(yàn)的方法就不能再使用了,其結(jié)果是無效的。此時(shí)可考慮非參數(shù)統(tǒng)計(jì)(nonparametricstatistics)或稱非參數(shù)檢驗(yàn)法(nonparametrictest)。非參數(shù)檢驗(yàn)在檢驗(yàn)時(shí)不需要利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)的信息,故此得名,它主要是利用樣本數(shù)據(jù)之間的大小比較及大小順序,對(duì)2個(gè)或多個(gè)樣本所屬總體是否相同進(jìn)行檢驗(yàn)。因?yàn)榉菂?shù)檢驗(yàn)不涉及總體參數(shù),也就不依賴于總體分布的形式,所以它是一種與總體分布狀況無關(guān)的檢驗(yàn)方法,因此也稱為無分布檢驗(yàn)法(distribution-freetest)。當(dāng)樣本觀測(cè)值的總體分布類型未知或知之甚少,無法肯定其性質(zhì),特別是觀測(cè)值明顯偏離正態(tài)分布,不具備參數(shù)檢驗(yàn)的條件時(shí)常用非參數(shù)檢驗(yàn)。4非參數(shù)檢驗(yàn)要解決的問題不是對(duì)總體參數(shù)(如、等)做檢驗(yàn),而是對(duì)總體的某些一般性假設(shè)做檢驗(yàn)。即使分布時(shí)正態(tài)的,非參數(shù)方法和參數(shù)方法差不多一樣有效。例如,檢驗(yàn)兩個(gè)總體分布是否相等,如推斷總體的位置,中位數(shù)是否等于某一特定的值。很多非參數(shù)的統(tǒng)計(jì)方法并不是直接分析原始數(shù)據(jù),而是先計(jì)算變量的秩,然后再用適當(dāng)?shù)姆椒▽?duì)秩做檢驗(yàn)。因此非參數(shù)檢驗(yàn)具有計(jì)算簡(jiǎn)便、直觀、易于掌握、檢驗(yàn)速度較快等優(yōu)點(diǎn)。但需要指出的是,當(dāng)資料符合參數(shù)檢驗(yàn)條件時(shí),非參數(shù)檢驗(yàn)的效率始終低于參數(shù)檢驗(yàn)法,這是因?yàn)榉菂?shù)檢驗(yàn)沒有利用已有的總體分布信息,也沒用充分利用樣本提供的信息,因而檢驗(yàn)功效較低,犯II型錯(cuò)誤的可能性較大。5非參數(shù)檢驗(yàn)的方法很多,幾乎對(duì)于每一種參數(shù)檢驗(yàn)方法,都有相對(duì)應(yīng)的非參數(shù)檢驗(yàn)法。實(shí)際上,第7章擬合優(yōu)度檢驗(yàn)也是一種非參數(shù)檢驗(yàn)。在做擬合優(yōu)度檢驗(yàn)時(shí)并不要求總體分布必須服從正態(tài)分布,也沒有對(duì)總體參數(shù)提出一個(gè)假設(shè)值,只是檢測(cè)觀測(cè)數(shù)與理論數(shù)之間是否相符。與卡方獨(dú)立性檢驗(yàn)對(duì)應(yīng)的參數(shù)檢驗(yàn)是相關(guān)系數(shù)的檢驗(yàn),二者都用于檢驗(yàn)兩個(gè)變量之間的相關(guān)關(guān)系,但前者適于兩個(gè)分類變量之間的相關(guān)關(guān)系檢驗(yàn),后者適合兩個(gè)正態(tài)分布的連續(xù)變量之間的相關(guān)關(guān)系檢驗(yàn)。其他的非參數(shù)檢驗(yàn)方法還有中位數(shù)檢驗(yàn)、游程檢驗(yàn)、符號(hào)檢驗(yàn)、符號(hào)秩和檢驗(yàn)、二組或多組資料的秩和檢驗(yàn)、等級(jí)相關(guān)等,本章介紹幾種常用的非參數(shù)檢驗(yàn)方法。6主要內(nèi)容12.1

秩和檢驗(yàn)12.2符號(hào)檢驗(yàn)12.3秩相關(guān)12.4游程檢驗(yàn)7一、兩組非配對(duì)數(shù)據(jù)的秩和檢驗(yàn)檢驗(yàn)兩組數(shù)據(jù)平均數(shù)差異的顯著性,有成組數(shù)據(jù)t檢驗(yàn)、配對(duì)(成對(duì))數(shù)據(jù)t檢驗(yàn),但這兩種方法都要求樣本是從正態(tài)總體或近似正態(tài)總體中抽取的。本節(jié)介紹另一種檢驗(yàn)獨(dú)立樣本的方法,稱為Wilcoxon秩和檢驗(yàn)(ranksumtest),相當(dāng)于參數(shù)統(tǒng)計(jì)中的成組數(shù)據(jù)t檢驗(yàn)。兩組非配對(duì)數(shù)據(jù)的秩和檢驗(yàn)是從兩個(gè)總體中獨(dú)立隨機(jī)地獲得的兩個(gè)樣本之間的比較。通常是一組為對(duì)照組,一組為處理組,零假設(shè)為這兩個(gè)樣本是從同一總體中抽取的。在零假設(shè)下,把兩組數(shù)據(jù)合并,將合并的數(shù)據(jù)從小到大排列好,每個(gè)數(shù)據(jù)對(duì)應(yīng)的序號(hào)稱為秩(rank)。最小的秩為1,下一個(gè)是2...。在按秩排列后,再將樣本分開,再分別計(jì)算兩個(gè)樣本的秩和(ranksum)。以秩和作為檢驗(yàn)統(tǒng)計(jì)量,來檢驗(yàn)變量的分布在兩組中的位置是否相同。12.1秩和檢驗(yàn)8例12.1考察兩種不同類型的肥料A和B對(duì)玉米的增產(chǎn)效應(yīng)。共選擇10塊試驗(yàn)地,隨機(jī)抽取n1=5塊地施用A肥料,n2=5塊地施用B肥料。產(chǎn)量列于表12-1。用秩和檢驗(yàn)法檢驗(yàn)兩種肥料對(duì)玉米的產(chǎn)量影響是否顯著。解:(1)假設(shè)H0:A、B兩總體分布位置相等;HA:A、B兩總體分布位置不等。零假設(shè)所提出的A、B兩總體分布位置相等,含義是:施用A肥料與施用B肥料的總體產(chǎn)量相同。備擇假設(shè)的含義是兩個(gè)總體的產(chǎn)量不同。因?yàn)椴还苁茿比B好,還是B比A好,備擇假設(shè)均成立,所以這個(gè)問題屬于雙側(cè)檢驗(yàn)。表12-1施用兩種不同肥料得到的玉米產(chǎn)量/kgA8476867094B12290921061009(2)編秩次。將全部結(jié)果作為一組數(shù)據(jù),由低到高排列,標(biāo)上秩,列在表12-2中。表12-2肥料試驗(yàn)的秩肥料種類AAAABBABBB產(chǎn)量70768486909294100106122秩12345678910(3)求秩和。假如兩種肥料的增產(chǎn)效應(yīng)相同,那么在表12-2中A、B應(yīng)相間出現(xiàn);若增產(chǎn)效應(yīng)不相同,則會(huì)出現(xiàn)A的連續(xù)出現(xiàn)多于B,或B的連續(xù)出現(xiàn)多于A。一個(gè)最方便的比較方法是,分別求出這兩個(gè)樣本的秩和,粗略地比較這兩個(gè)秩和的大小,若兩個(gè)秩和相差不多,則肥料有相同的增產(chǎn)效應(yīng),否則兩種肥料的增產(chǎn)效應(yīng)不同。10n=10時(shí),總秩和為。因此,B的秩和為55-17=38。A的秩和大約只有B的秩和的一半,說明A肥料的增產(chǎn)效應(yīng)遠(yuǎn)不如B肥料的,可以拒絕H0。但若A的秩和與B的秩和之間有差異,而差異又不是很懸殊,這時(shí)很難做出抉擇。為了能以一定的顯著水平接受或拒絕H0,還必須研究秩和的抽樣分布。將A的秩相加,得A的秩和為17。用總的秩和減去A的秩和,很容易求出B的秩和。假若秩的總數(shù)為n:1,2,...,n,總的秩和可用下式求出:11列成概率分布表,即可得到某一秩和在某一顯著水平下的上下限。附表14對(duì)不同的n1,n2給出了T的下限T1和上限T2。若T1<T<T2,則可接受H0;若TT2或TT1,則拒絕H0。本例nA=5,nB=5,從附表14可查出,=0.05時(shí),

T1=19,T2=36,統(tǒng)計(jì)量T=17,T<T1,故拒絕H0,結(jié)論是兩種肥料有顯著不同的效果。(4)統(tǒng)計(jì)推斷。兩樣本含量不同時(shí),以含量小的那個(gè)樣本的秩和作為檢驗(yàn)統(tǒng)計(jì)量;兩樣本含量相同時(shí),可任選一個(gè)作為檢驗(yàn)統(tǒng)計(jì)量,記為T。本例選A的秩和作為檢驗(yàn)統(tǒng)計(jì)量。在兩種肥料增產(chǎn)效應(yīng)相同的假設(shè)下,10個(gè)秩中的任何5個(gè)都等可能地屬于A(實(shí)際上,任何一個(gè)或一些秩都等可能地屬于A)。由(2.6)式可計(jì)算每一秩和出現(xiàn)的概率。1213這里的n應(yīng)充分大,但在實(shí)際應(yīng)用時(shí),只要n2?10(n1n2)就能得到滿意的結(jié)果。因此,附表14只給出了n1n210時(shí)T的臨界值,>10則可用上述u檢驗(yàn)。例12.2調(diào)查四年級(jí)學(xué)生中有視力障礙(A)和視力正常(B)的IQ得分。普遍認(rèn)為有視力障礙的學(xué)生的IQ比視力正常學(xué)生低。但心理學(xué)家認(rèn)為,有視力障礙的學(xué)生由于注意力特別集中,IQ得分不是低而是高。調(diào)查結(jié)果列在表12-3中,用秩和檢驗(yàn)法檢驗(yàn)有視力障礙的學(xué)生的IQ得分是否更高。當(dāng)n→時(shí),T漸近正態(tài)分布N,可用u檢驗(yàn)(12.2式)。應(yīng)做連續(xù)性矯正:上側(cè)檢驗(yàn)時(shí)-0.5,下側(cè)檢驗(yàn)時(shí)+0.5,或者當(dāng)T>時(shí)-0.5,

T<時(shí)+0.5。14表12-3學(xué)生的IQ得分

有視力障礙學(xué)生的IQ(A)視力正常學(xué)生的IQ(B)

Y1Y2Y12Y221049410816883611010312100106091061141123612996113126127691587611595132259025111102123211040102100104041000012898163849604110103121001060911711613689134561051102510711449和1116126312504413388915解:

(1)假設(shè)。H0:總體A的IQ分布與總體B的IQ分布相同;HA:總體A的IQ分布高于總體B的IQ分布。因?yàn)閭鋼窦僭O(shè)是總體A的IQ分布(位置)高于總體B,所以本實(shí)驗(yàn)為上尾單側(cè)檢驗(yàn)。(2)編秩次。將結(jié)果列成表12-4。表12-4例12.2IQ得分的秩次表樣本BBBBABBBABAIQ949598100102102103103104105106秩12345.55.57891011

樣本BAAAABABABAIQ107110110111113114115116117126128秩1213141516171819202122(3)求秩和。以樣本A的秩和T為檢驗(yàn)統(tǒng)計(jì)量:T=5.5+9+11+13+14+15+16+18+20+22=143.5n1(A)=10,n2(B)=1216(4)統(tǒng)計(jì)推斷。將T代入(12.2)式,得:取=0.05,u0.05=1.645,u>u0.05,拒絕H0。結(jié)論是:有視力障礙的學(xué)生比視力正常的學(xué)生有較高的IQ。在這里有必要對(duì)相等值(或稱為結(jié)值,tiedvalue)特別說明一下。所謂相等值是指兩個(gè)或多個(gè)相等的觀測(cè)值。對(duì)于相等值的最常用處理方法是,計(jì)算與這些相等值對(duì)應(yīng)的秩次平均數(shù),將平均數(shù)放在相應(yīng)的位置上。17表12-3的樣本A中,有兩個(gè)學(xué)生的IQ得分均為110,樣本B中有兩個(gè)學(xué)生的得分均為103。當(dāng)兩個(gè)相等的值出現(xiàn)在同一個(gè)樣本中時(shí),哪一個(gè)在前哪一個(gè)在后都可以,在表12-4中,它們分別放在7和8,13和14上。但當(dāng)兩個(gè)相等的值出現(xiàn)在不同的組中時(shí),前后位置不能隨意放置,因?yàn)榉胖玫奈恢貌煌瑫?huì)影響到T值。這時(shí)應(yīng)取這兩個(gè)秩的平均數(shù),放在相應(yīng)的兩個(gè)位置上。如A和B的兩個(gè)102,它們的秩的平均數(shù)為(5+6)/2=5.5,分別放在表12-4的第5和第6位置上。

兩組非配對(duì)數(shù)據(jù)的秩和檢驗(yàn)和成組數(shù)據(jù)的t檢驗(yàn)的比較:表12-3的數(shù)據(jù)做成組數(shù)據(jù)t檢驗(yàn)(設(shè)兩組數(shù)據(jù)具正態(tài)性):18H0:1=2;HA:

1>2n1=10;n2=12經(jīng)檢驗(yàn),s12和s22具齊性。將以上各值代入(5.6)式:19從附表4a查出,t20,0.05=1.725,結(jié)論仍是拒絕H0。一般來講,對(duì)于同樣數(shù)據(jù),t檢驗(yàn)比秩和檢驗(yàn)更有效。但t檢驗(yàn)要求總體分布是正態(tài)的,因而限制了t檢驗(yàn)的使用范圍。另外,秩和檢驗(yàn)還可以檢驗(yàn)直接按等級(jí)記載的實(shí)驗(yàn)數(shù)據(jù)。因此,秩和檢驗(yàn)是使用范圍更廣的一種檢驗(yàn)方法。二、多組數(shù)據(jù)的秩和檢驗(yàn)多組數(shù)據(jù)的秩和檢驗(yàn)法又稱Kruskal-Wallis檢驗(yàn)法,該法利用多個(gè)樣本的秩和來推斷它們分別代表的總體的分布位置是否相同,由于其檢驗(yàn)統(tǒng)計(jì)量用H表示,也稱H檢驗(yàn)法。20檢驗(yàn)統(tǒng)計(jì)量H的計(jì)算公式:其中N為觀測(cè)值總數(shù);ni為第i組的含量;Ti為第i組的秩和,每個(gè)觀測(cè)值的秩次的計(jì)算方法與兩組非配對(duì)數(shù)據(jù)的秩和檢驗(yàn)相同。當(dāng)分組數(shù)k3,且每組含量大于等于5時(shí),統(tǒng)計(jì)量H的抽樣分布近似于df=k-1時(shí)的2分布,于是可以用df=k-1時(shí)的2值作為臨界值來判斷各組秩和的差異是否顯著。對(duì)于k=3,且每組含量小于5時(shí),需要用Kruskal-Wallis的正確概率表進(jìn)行比較,這里不作介紹。21如果在樣本中有較多的平均秩次,應(yīng)對(duì)H值進(jìn)行校正,校正公式如下:式中C為校正系數(shù),計(jì)算公式如下:式中t為具有相同數(shù)值的個(gè)數(shù)。下面舉例說明多組數(shù)據(jù)秩和檢驗(yàn)的步驟。22例用4種方法對(duì)某種樣品脫水處理,每種方法重復(fù)5次,測(cè)脫水百分率,比較4種方法脫水效果有無顯著差異。方法一方法二方法三方法四測(cè)得值秩次測(cè)得值秩次測(cè)得值秩次測(cè)得值秩次1.69.51.561.451.111.7141.69.51.69.51.121.9171.69.51.69.51.231.9171.7141.7141.342.019.52.019.51.9171.69.5Ti7758.55519.5ni5555解:

(1)假設(shè)。H0:4種方法脫水百分率相等;HA:4種方法脫水百分率不相等。(2)編秩次。將各組數(shù)據(jù)混合,從小到大排隊(duì),統(tǒng)一編秩次,結(jié)果見上表的秩次列。23(3)求秩和。分別將各組秩次相加求和,計(jì)算H值:(4)統(tǒng)計(jì)推斷。由于本例數(shù)據(jù)多于3組,自由度等于k-1=3時(shí)的2臨界值,5%的2臨界值為7.81,1%的2臨界值為11.34。H大于7.81,表明4種方法脫水百分率有顯著差異。當(dāng)H檢驗(yàn)顯著后,如需進(jìn)一步判斷究竟哪些組間差異顯著,須進(jìn)行多重比較,方法與方差分析中的多重比較類似,只要將各組的均數(shù)換成秩和。24例如,如果用Duncan多重極差檢驗(yàn),假定每組的樣本含量相等(n),對(duì)于任意兩組的秩和,它們之差要達(dá)到顯著的最小極差為:式中,n為各組的樣本含量,k為要比較的兩組秩和所包含的范圍;r(k,)值可從附表9查得(取自由度為無窮大,附表最后一行)。kSEr0.05(k,)Rk0.05r0.01(k,)Rk0.0126.77002.7718.753.6424.64310.00002.9229.203.8038.00413.22883.0239.953.9051.5925將各組秩和之差與上表中的Rk比較,得多重比較結(jié)果如下:判斷結(jié)果:方法一、方法二和方法三彼此間差異不顯著(P>0.05),但都極顯著地高于方法四(P<0.01)。組別秩和TiTi-19.5Ti-55.5Ti-58.5177.057.5**22.018.5258.539.0**3.5355.035.5**419.52612.2符號(hào)檢驗(yàn)兩組非配對(duì)數(shù)據(jù)的秩和檢驗(yàn),相當(dāng)于參數(shù)統(tǒng)計(jì)中的成組數(shù)據(jù)t檢驗(yàn)。本節(jié)介紹符號(hào)檢驗(yàn)(signtest),它是非參數(shù)統(tǒng)計(jì)中配對(duì)數(shù)據(jù)的檢驗(yàn)方法。符號(hào)檢驗(yàn)只考慮每對(duì)數(shù)據(jù)差的符號(hào),不考慮差值的大小。正號(hào)用“+”表示,負(fù)號(hào)用“-”表示。其檢驗(yàn)的基本思想與原理:假定兩個(gè)樣本所屬的總體服從相同的分布,則正號(hào)或負(fù)號(hào)出現(xiàn)的頻率應(yīng)相等,或至少相差不應(yīng)過大,相差超過一定的臨界值時(shí),就認(rèn)為兩個(gè)樣本所屬的總體有顯著差異,它們不服從相同的分布。與秩和檢驗(yàn)一樣,這種檢驗(yàn)同樣不需要考慮總體分布的類型。符號(hào)檢驗(yàn)比配對(duì)數(shù)據(jù)t檢驗(yàn)有更廣泛的用途。例12.3用兩種方法測(cè)定同一種藥用植物的有效成分(mg/kg),共做20次重復(fù)測(cè)定,得到結(jié)果見表12-5。用符號(hào)檢驗(yàn)法檢驗(yàn)方法A的檢測(cè)結(jié)果的是否顯著大于方法B。27表12-5例12.3的實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)序號(hào)方法A方法B差符號(hào)148.037.0+11.0+233.041.0-0.8-337.523.4+14.1+448.017.0+31.0+542.531.5+11.0+640.040.00.00742.031.0+11.0+836.036.00.00911.35.7+5.6+1022.011.5+10.5+1136.021.0+15.0+1227.36.1+21.2+1314.226.5-12.3-1432.121.3+10.8+1552.044.5+7.5+1638.028.0+10.0+1717.322.6-5.3-1820.020.00.001921.011.0+10.0+2046.122.3+23.8+28解:同一種實(shí)驗(yàn)材料用兩種不同的方法測(cè)定,其實(shí)驗(yàn)數(shù)據(jù)是配對(duì)的。每對(duì)數(shù)據(jù)有一個(gè)差值,若A結(jié)果高于B結(jié)果,差值是正的,用“+”表示,其個(gè)數(shù)記為n+,反之,用“-”表示,其個(gè)數(shù)記為n-,差值為0的個(gè)數(shù)記為n0。檢驗(yàn)的假設(shè)為:H0:兩種方法測(cè)得結(jié)果具有相同分布HA:方法A測(cè)得結(jié)果大于方法B所測(cè)得結(jié)果符號(hào)檢驗(yàn)是不考慮差值為0的,除3個(gè)差值為0的以外,共有17個(gè)差值,n=17。其中,n+=14,n-=3。若總體A和總體B有相同的分布,這17個(gè)符號(hào)中的“+”號(hào)與“-”號(hào)應(yīng)大約各占1/2。若與這個(gè)值偏離較大,說明A和B可能有不同的分布。符號(hào)檢驗(yàn)所用的統(tǒng)計(jì)量S是n+、n-較小的一個(gè)。29本例的n+=14,n-=3,統(tǒng)計(jì)量S=3。表明用方法A所測(cè)得的結(jié)果絕大多數(shù)高于用方法B測(cè)得的結(jié)果,因而拒絕H0。顯然,這樣的拒絕是缺乏足夠理論依據(jù)的。必須在進(jìn)一步研究S的抽樣分布后,才能以一定的顯著性水平拒絕H0。在零假設(shè):總體A和總體B有相同的分布下,“+”號(hào)的概率和“-”號(hào)的概率應(yīng)各占1/2。本例共有17個(gè)符號(hào),其中出現(xiàn)3個(gè)“-”號(hào)和14個(gè)“+”號(hào)。實(shí)際上,符號(hào)檢驗(yàn)相當(dāng)于檢驗(yàn)二項(xiàng)分布參數(shù)=1/2。在實(shí)際應(yīng)用時(shí),只需事先計(jì)算出滿足P(SS)=中的S,當(dāng)SS時(shí)拒絕H0。附表15給出了不同n的S。如本例n=17,從表中查出,當(dāng)n=17、=0.05時(shí)S0.05=4。統(tǒng)計(jì)量S=3,S<S0.05,結(jié)論是拒絕H0。故用A

法所測(cè)的結(jié)果高于用B法所測(cè)得的結(jié)果。3031使用u檢驗(yàn)為了更嚴(yán)格起見,對(duì)(12.4)式還應(yīng)做連續(xù)性矯正。當(dāng)S>時(shí)用S-0.5矯正,當(dāng)S<時(shí)用S+0.5矯正。當(dāng)n→時(shí),S漸近正態(tài)分布N(,2)。其中32例12.4一位教育學(xué)家,研究一種新的語言學(xué)習(xí)方法。他認(rèn)為,在相同的時(shí)間內(nèi),除用通常的方法學(xué)習(xí)外,再加上一些新的措施,能提高學(xué)生學(xué)習(xí)語言的能力。實(shí)驗(yàn)是這樣安排的:以不同學(xué)校四年級(jí)各班的學(xué)生為研究對(duì)象,每班選出兩名語言能力相似的學(xué)生作為“對(duì)子”,共抽出25對(duì)。將各對(duì)隨機(jī)分成兩組,一組為對(duì)照組A,另一組為實(shí)驗(yàn)組B。對(duì)照組的學(xué)生仍回原班學(xué)習(xí),實(shí)驗(yàn)組學(xué)生在上語文課時(shí),集中到一個(gè)教室用新的方法學(xué)習(xí);實(shí)驗(yàn)組學(xué)生除按通常的方法學(xué)習(xí)外,還要寫讀書報(bào)告并進(jìn)行課堂討論。在學(xué)期末,兩組學(xué)生用同樣的問題進(jìn)行測(cè)驗(yàn),測(cè)驗(yàn)的成績(jī)列在表12-6中。用符號(hào)檢驗(yàn)法檢驗(yàn)這種新的學(xué)習(xí)方法效果是否顯著。33表12-6用兩種不同學(xué)習(xí)方法學(xué)習(xí)語文的成績(jī)

對(duì)子序號(hào)B組得分A組得分差(di)符號(hào)di216765+2+426672-6-3637774+3+949081+9+8157276-4-166959500076863+5+2589585+10+10099890+8+64106064-4-16117278-6-36129486+8+64139689+7+49147375-2-4159693+3+9169078+12+144179292000186367-4-16199588+7+49208879+9+81217560+15+225229590+5+25237882-4-16248573+12+144258286-4-16和

81

122934解:

H0:兩種學(xué)習(xí)方法效果相同HA:B學(xué)習(xí)方法效果優(yōu)于A學(xué)習(xí)方法根據(jù)備擇假設(shè),B學(xué)習(xí)方法的效果優(yōu)于A學(xué)習(xí)方法,為上尾單側(cè)檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量S=15。

n-=8,n+=15。第6對(duì)和第17對(duì)的差為0,故n0=2,n=23。將以上數(shù)據(jù)代入(12.4)式從附表3中查出u0.05=1.645,u<u0.05,接受H0。結(jié)論是,新的學(xué)習(xí)方法與老的學(xué)習(xí)方法無顯著差異。下面將符號(hào)檢驗(yàn)與配對(duì)數(shù)據(jù)t檢驗(yàn)做一比較。設(shè)差值(di)具有正態(tài)性,配對(duì)數(shù)據(jù)t檢驗(yàn)的假設(shè)為:35由表12-6的最后一行得出t24,0.05=1.17,t>t24,0.05。拒絕H0。結(jié)論是,新的學(xué)習(xí)方法比老的學(xué)習(xí)方法好。這里t檢驗(yàn)與符號(hào)檢驗(yàn)的結(jié)果不一致。一般,配對(duì)數(shù)據(jù)t檢驗(yàn)比符號(hào)檢驗(yàn)更有效,因?yàn)閠檢驗(yàn)不僅考慮了符號(hào)的正負(fù),還考慮了差值的大小。因此,可以用配對(duì)數(shù)據(jù)t檢驗(yàn)時(shí),盡量不用符號(hào)檢驗(yàn)。當(dāng)然符號(hào)檢驗(yàn)也有它的優(yōu)點(diǎn):方法簡(jiǎn)單、不用考慮總體分布類型以及可以對(duì)出現(xiàn)的定性資料做檢驗(yàn)等。所以它的用途比成對(duì)數(shù)據(jù)t檢驗(yàn)更廣泛。符號(hào)檢驗(yàn)法當(dāng)樣本的配對(duì)數(shù)少于6對(duì)時(shí),不能檢出差別;對(duì)子數(shù)7~12時(shí),檢驗(yàn)敏感性較低;只有對(duì)子數(shù)在20以上時(shí)效果較好,但效率仍只有t檢驗(yàn)的65%。3612.3秩相關(guān)參數(shù)統(tǒng)計(jì)中,Pearson相關(guān)系數(shù)r是變量X和變量Y之間的相關(guān)程度的定量計(jì)量。非參數(shù)統(tǒng)計(jì)中,用Spearman1904年提出的秩相關(guān)系數(shù)(rankcorrelationcoefficient)rS衡量?jī)蓚€(gè)變量間的相關(guān)程度:該式由參數(shù)統(tǒng)計(jì)的Pearson樣本相關(guān)系數(shù)r演變來,用變量X和Y的秩U和V取代變量X和Y,再經(jīng)化簡(jiǎn)得到?;?jiǎn)的依據(jù)是,在推導(dǎo)秩相關(guān)系數(shù)時(shí),一旦樣本含量n確定下來,秩的和、秩的平均數(shù)以及秩的平方和也就確定下來了。37上述公式計(jì)算起來很簡(jiǎn)單,但相等值數(shù)量較多時(shí)結(jié)果有較大偏差,這時(shí)要直接使用Pearson相關(guān)系數(shù)公式,用秩取代Pearson相關(guān)系數(shù)公式中的原來變量:如此得到的結(jié)果不受相等值影響,只是計(jì)算困難些。秩相關(guān)系數(shù)顯著性檢驗(yàn)的零假設(shè)H0:U和V不相關(guān)。備擇假設(shè)HA:U和V相關(guān)。n充分大時(shí),服從N(0,1)分布,即rs服從分布,可近似地做u檢驗(yàn);n較小時(shí),臨界值可從附表16秩相關(guān)系數(shù)顯著性檢驗(yàn)表中查出,當(dāng)rsrs,n,時(shí),拒絕零假設(shè)。3839例12.5調(diào)查10名學(xué)生,平均每周所用的學(xué)習(xí)時(shí)間和學(xué)習(xí)成績(jī),結(jié)果列在表12-7中。用秩相關(guān)法分析學(xué)習(xí)時(shí)間和得分的相關(guān)性。表12-7學(xué)習(xí)時(shí)間和得分間的秩相關(guān)計(jì)算學(xué)習(xí)時(shí)間(h/周)得分學(xué)習(xí)時(shí)間的秩U得分的秩V秩差U-V秩差的平方(U-V)2249067.5-1.52.2517502.511.52.2520684400419087.50.50.2552921091.01.00237855004695910-1.01.0017632.53-0.50.25155312-1.01.002982761.01.00和

9.0040解:將學(xué)習(xí)時(shí)間和得分按由小到大排列,得出相應(yīng)的秩。在用于學(xué)習(xí)的時(shí)間中,有兩個(gè)17h,所在位次為2和3,則秩為(2+3)/2=2.5,在得分列中有兩個(gè)90分,它們的秩均為7.5。將表中的數(shù)據(jù)代入(12.5)式,得出平均每周學(xué)習(xí)小時(shí)數(shù)與得分間的秩相關(guān)系數(shù)。從附表16查出rs,10,0.01=0.794,rs>rs,10,0.01結(jié)論是相關(guān)極顯著。因此,學(xué)習(xí)成績(jī)與所做的努力關(guān)系極為密切。這里,相等值對(duì)于用(12.5)式計(jì)算rs有一定影響,直接用(12.6)式計(jì)算的rs為0.94512,由于相等值數(shù)量較少,對(duì)用(12.5)式計(jì)算的結(jié)果影響較小。4112.4游程檢驗(yàn)用樣本數(shù)據(jù)推斷總體時(shí),觀測(cè)值的隨機(jī)性很重要。對(duì)于小概率事件,在一段時(shí)間內(nèi)所收集的樣本,是否為隨機(jī)樣本,會(huì)有各種爭(zhēng)議。例如,某地區(qū)罕見病例的收集,只能逐漸積累,不能在很短的時(shí)間內(nèi)由隨機(jī)抽樣獲得,這樣的樣本是非隨機(jī)的。為了能用統(tǒng)計(jì)學(xué)方法處理這樣的問題,必須證實(shí)它們類似于真正的隨機(jī)樣本。游程檢驗(yàn)(runtest)是判斷樣本是否為隨機(jī)樣本的一種檢驗(yàn)方法,包括游程總數(shù)檢驗(yàn)(numberofruntest)和游程長(zhǎng)度檢驗(yàn)(lengthofruntest)。重點(diǎn)介紹游程總數(shù)檢驗(yàn)。42假設(shè)觀測(cè)了連續(xù)出生的20個(gè)新生嬰兒的體重,將體重在中位數(shù)以上的記為a,中位數(shù)以下的記為b,按出生順序得到以下序列:序列I

a

bb

aaa

bb

a

bbbb

aaa

bb

aa在這個(gè)序列中,只有a和b兩種元素,元素a(或b)被另一種元素b(或a)分隔為一些子列。其中的每一個(gè)子列稱為一個(gè)游程(run)。每一個(gè)游程內(nèi)所含元素的個(gè)數(shù)稱為該游程的游程長(zhǎng)度(lengthofrun)。全部游程數(shù)稱為游程總數(shù)(numberofruns)。序列I中有5個(gè)a游程(a

aaa

a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論