04 SPSS非參數(shù)方法_第1頁
04 SPSS非參數(shù)方法_第2頁
04 SPSS非參數(shù)方法_第3頁
04 SPSS非參數(shù)方法_第4頁
04 SPSS非參數(shù)方法_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 非參數(shù)方法,4.1 擬合優(yōu)度檢驗(yàn) 4.2 獨(dú)立性檢驗(yàn) 4.3 符號(hào)檢驗(yàn) 4.4 威爾科克森符號(hào)秩檢驗(yàn) 4.5 威爾科克森秩和檢驗(yàn) 4.6 QQ圖,4.1 擬合優(yōu)度檢驗(yàn),一、分類數(shù)據(jù)的2檢驗(yàn) 二、分布擬合的2檢驗(yàn),一、分類數(shù)據(jù)的2檢驗(yàn),假定一個(gè)總體可分為k個(gè)類A1,A2,Ak,并設(shè)類Ai在總體中所占的比例為P(Ai)(i=1,2,k),且 。又設(shè)p1,p2,pk是一組給定的數(shù)值,滿足pk0(i=1,2,k), 。欲檢驗(yàn) H0:P(Ai)=pi,i=1,2,k H1:P(Ai)pi,至少存在一個(gè)I 容量為n的樣本中屬于類Ai的頻數(shù)為fi(i=1,2,k),有 。皮爾遜(K.Pearson,

2、1900)提出了一個(gè)檢驗(yàn)統(tǒng)計(jì)量,并指出,當(dāng)H0為真且n充分大(通常還要求npi5,i=1,2,k)時(shí),2近似服從2 (k1)分布。 該檢驗(yàn)稱為2擬合優(yōu)度檢驗(yàn)(chisquare goodness of fit test)。對(duì)給定的顯著性水平,其拒絕規(guī)則為: 若 ,則拒絕H0 例4.1.1 在一正20面體的20個(gè)面上,分別標(biāo)以數(shù)字09,每個(gè)數(shù)字在兩個(gè)對(duì)稱的面上標(biāo)出。為檢驗(yàn)其勻稱性,共作800次投擲試驗(yàn),各數(shù)字朝正上方的次數(shù)列于表4.1.1: 試問該正20面體是否勻稱(=0.05)。,表4.1.1 正20面體的800次投擲試驗(yàn)中,各數(shù)字朝正上方的觀測(cè)頻數(shù),以Ai表示數(shù)字i朝正上方,i=1,2,9。

3、要檢驗(yàn) 當(dāng)H0為真時(shí), 。,表4.1.2正20面體勻稱性的2檢驗(yàn)統(tǒng)計(jì)量計(jì)算過程,故接受H0,即認(rèn)為該正20面體勻稱。 如果pi(i=1,2,k)含有r(k1)個(gè)未知參數(shù)(如k=3,且p1=2,p2=2(1) ,p3=(1) 2,其中含有一個(gè)未知參數(shù)),則這r個(gè)未知參數(shù)可用其極大似然估計(jì)代替。用 代替上式中的pi,得 費(fèi)希爾(R.A.Fisher,1924)指出,當(dāng)H0為真且n充分大時(shí),2近似服從自由度為kr1的2分布。檢驗(yàn)的拒絕規(guī)則類似于前面的式子,只需將自由度由k1改為kr1即可。,二、分布擬合的2檢驗(yàn),欲檢驗(yàn)假設(shè) H0:F(x)=F0(x),H1:F(x)F0(x) 1.總體x為離散型的情

4、形 2.總體x為連續(xù)型的情形,1.總體x為離散型的情形,H0:P(x=ai)=pi,i=1,2,, H1:x不具有H0中的分布列 可將x的取值a1,a2,分成若干類。具體做法是,把npi5的ai各自作為一類,而把npi5的ai合并成一些類或合并到npi5的類中,以使每一類的期望頻數(shù)都大于等于5。 例4.1.2 為檢驗(yàn)工作日上午到達(dá)某商店顧客數(shù)是否服從泊松分布的假設(shè),隨機(jī)抽取了一個(gè)由工作日上午的128個(gè)10分鐘時(shí)間段組成的樣本。試檢驗(yàn)工作日上午的10分鐘時(shí)間段的顧客數(shù)x是否服從泊松分布(=0.05)。,表4.1.3128個(gè)10分鐘時(shí)間段到達(dá)某商店顧客數(shù)的觀測(cè)頻數(shù),解 建立假設(shè) H0:x服從泊松分

5、布,H1:x不服從泊松分布 的極大似然估計(jì)值為 。,表4.1.4到達(dá)顧客數(shù)的期望頻數(shù),表4.1.5分類后2統(tǒng)計(jì)量的計(jì)算過程,故不能拒絕H0。,2.總體x為連續(xù)型的情形,若要檢驗(yàn)總體x是否服從某連續(xù)型分布,則需先把x的取值范圍劃分為k個(gè)互不相交的區(qū)間: (a0,a1,(a1,a2,(ak2,ak1,(ak1,ak) 其中=a0a1ak1ak=。這k個(gè)區(qū)間相當(dāng)于k個(gè)類,當(dāng)H0為真時(shí),每個(gè)類在總體中所占的比例為 pi=P(ai1xai)=F0(ai)F0(ai1), i=1,2,k 式中若含有未知參數(shù),則用極大似然估計(jì)值代替。分類時(shí)應(yīng)使各類的期望頻數(shù)npi5。,例4.1.3 試問表1.2.1中的多元

6、統(tǒng)計(jì)分析期末考試成績(jī)數(shù)據(jù)是否提供了充分的證據(jù),說明觀測(cè)值并非來自正態(tài)總體(=0.05)。 解 依題意,需檢驗(yàn)假設(shè) H0:x服從正態(tài)分布,H1:x不服從正態(tài)分布 正態(tài)分布中含有兩個(gè)未知參數(shù)和,它們的極大似 然估計(jì)值為 。 故當(dāng)H0為真時(shí),x的分布函數(shù)F0(x)可估計(jì)為,表4.1.6 考試成績(jī)區(qū)間的期望頻數(shù),表4.1.7 2統(tǒng)計(jì)量的計(jì)算過程,故拒絕H0。,4.2 獨(dú)立性檢驗(yàn),欲檢驗(yàn) H0:兩個(gè)變量x和y相互獨(dú)立 H1:兩個(gè)變量x和y不相互獨(dú)立 為了檢驗(yàn)上述假設(shè),我們可按變量x的取值將總體分為k個(gè)類A1,A2,Ak,同時(shí)又按變量y的取值將總體分為l個(gè)類B1,B2,Bl。記 pij=P(xAi,yBj

7、),i=1,2,k,j=1,2,l pi=P(xAi),i=1,2,k pj=P(yBj),j=1,2,l 顯然有,設(shè)(x1,y1),(x2,y2),(xn,yn)是一個(gè)樣本,用fij表示樣本觀測(cè)中x值落入類Ai而y值落入類Bj中的頻數(shù)(i=1,2,k,j=1,2,l),用fi表示樣本觀測(cè)中x值落入類Ai中的頻數(shù)(i=1,2,k),用fj表示樣本觀測(cè)中y值落入類Bj中的頻數(shù)(j=1,2,l)。于是有 分類結(jié)果可列成如表4.2.1所示的二維表形式,該表稱為列聯(lián)表(contingency table)。,表4.2.1按兩個(gè)變量值分類的列聯(lián)表,各pi和pj的極大似然估計(jì)分別為: 采用檢驗(yàn)統(tǒng)計(jì)量 當(dāng)H

8、0為真,且n充分大,期望頻數(shù) 時(shí),2近似服從自由度為(k1)(l1)的2分布。對(duì)給定的,其拒絕規(guī)則為: 若 ,則拒絕H0,例4.2.1 在一項(xiàng)關(guān)于某些家庭用品的價(jià)格與質(zhì)量關(guān)系的研究中,一個(gè)市場(chǎng)調(diào)查公司讓一組家庭主婦來檢驗(yàn)135種產(chǎn)品,并請(qǐng)她們按劣、中、優(yōu)三個(gè)等級(jí)對(duì)這些產(chǎn)品作出評(píng)價(jià)。表4.2.2中所列的便是這些主婦按產(chǎn)品的價(jià)格類別對(duì)這135種產(chǎn)品所作的交叉分類。取=0.01,試檢驗(yàn)價(jià)格與質(zhì)量的獨(dú)立性。,表4.2.2評(píng)價(jià)等級(jí)與價(jià)格類別列聯(lián)表,解 依題意,需檢驗(yàn)假設(shè) H0:評(píng)價(jià)與價(jià)格獨(dú)立,H1:評(píng)價(jià)與價(jià)格不獨(dú)立 當(dāng)H0為真時(shí),各期望頻數(shù) ,其結(jié)果列于表4.2.3中,,表4.2.3表4.2.2中的期望

9、頻數(shù),從而得 故拒絕H0。,4.3 符號(hào)檢驗(yàn),本節(jié)介紹一種可用來對(duì)總體中位數(shù)進(jìn)行假設(shè)檢驗(yàn)的非參數(shù)方法符號(hào)檢驗(yàn)(sign test)。 設(shè)x1,x2,xn是從具有連續(xù)型分布的總體x中抽取的一個(gè)樣本。記m為x的中位數(shù),欲檢驗(yàn) H0:m=m0,H1:mm0 令 yi=xim0,i=1,2,n 當(dāng)H0為真時(shí),y1,y2,yn中正號(hào)的個(gè)數(shù)s+服從于二項(xiàng)分布b(n,0.5),該p值也可通過查二項(xiàng)分布表獲得。檢驗(yàn)的拒絕規(guī)則為: 若p,則拒絕H0 H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) 。,例4.3.1 為檢驗(yàn)?zāi)成痰耆諣I(yíng)業(yè)額的

10、中位數(shù)是否少于14萬元,隨機(jī)抽取13天的日營(yíng)業(yè)額記錄如下(單位:萬元): 11.2,12.6,14.0,12.3,11.5,17.2,13.8, 11.5,13.2,12.4,14.8,15.4,12.5 試問這組數(shù)據(jù)是否提供了充分的證據(jù),說明日營(yíng)業(yè)額的中位數(shù)不到14萬元(=0.05)。 解H0:m14,H1:m=0.05,故不能拒絕H0。,在n20的情形下,符號(hào)檢驗(yàn)的p值通??蓮亩?xiàng)分布表中查得。在n20的情形下,二項(xiàng)分布b(n,0.5)可用正態(tài)分布N(,2)近似代替,其中 。對(duì)給定的顯著性水平,以上各假設(shè)的拒絕規(guī)則分別為: 若 ,則拒絕H0 若 ,則拒絕H0 若 ,則拒絕H0,例4.3.2

11、 檢驗(yàn)?zāi)撤N維尼綸的纖度,測(cè)得100個(gè)數(shù)據(jù)列于表4.3.1中,試問這組數(shù)據(jù)是否提供了充分證據(jù)來否定該維尼綸纖度的中位數(shù)m為1.40的說法(=0.05)。 解 H0:m=1.40,H1:m1.40 題中,n=100,s+=43,由于 故接受H0。,表4.3.1 維尼綸纖度的100個(gè)數(shù)據(jù),4.4 威爾科克森符號(hào)秩檢驗(yàn),一、對(duì)稱總體的中位數(shù)檢驗(yàn) 二、基于成對(duì)數(shù)據(jù)的比較兩個(gè)總體分布的檢驗(yàn),一、對(duì)稱總體的中位數(shù)檢驗(yàn),設(shè)x1,x2,xn是從總體x中抽取的一個(gè)樣本,x為連續(xù)型隨機(jī)變量,且其分布對(duì)稱。記m為x的中位數(shù),希望檢驗(yàn) H0:m=m0,H1:mm0 令 yi=xim0,i=1,2,n 將|y1|,|y2

12、|,|yn|從小到大依次排列,|yi|在其中的排列序號(hào)稱為|yi|的秩(rank),記作Ri,i=1,2,n。若出現(xiàn)幾個(gè)相同的絕對(duì)值,則使用它們的平均秩。威爾科克森符號(hào)秩檢驗(yàn)(Wilcoxon signed-rank test)使用檢驗(yàn)統(tǒng)計(jì)量 T=min(T+,T),其中 ,它們分別是y1,y2,yn中正值的秩和及負(fù)值的秩和,且滿足 。對(duì)于給定 的顯著性水平,檢驗(yàn)的拒絕規(guī)則為: 若TT0,則拒絕H0 此處T0由附錄二的表5給出。 H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) 拒絕規(guī)則為: 若TT0,則拒絕H0 H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) 拒絕規(guī)

13、則為: 若T+T0,則拒絕H0 這里兩個(gè)檢驗(yàn)中的T0仍從附錄二的表5讀出。,當(dāng)樣本容量n很大,如n25時(shí),T+的抽樣分布接近于正態(tài)分布。采用檢驗(yàn)統(tǒng)計(jì)量 上述各假設(shè)的拒絕規(guī)則分別為: 若|u|u/2,則拒絕H0 若uu,則拒絕H0 若uu,則拒絕H0 例4.4.1 在例4.3.1中,假定該商店的日營(yíng)業(yè)額分布是對(duì)稱的,試用威爾科克森符號(hào)秩檢驗(yàn)再做檢驗(yàn)。 解 建立的假設(shè)是 H0:m14,H1:m14 令yi=xi14,從樣本中剔除yi=0的天。正yi值的秩和為,對(duì)=0.05,查威爾科克森符號(hào)秩檢驗(yàn)的T0值表得T0=17T+,故不能拒絕H0。,表4.4.1日營(yíng)業(yè)額的符號(hào)秩,SAS輸出中的符號(hào)檢驗(yàn)統(tǒng)計(jì)量

14、為 威爾科克森符號(hào)秩檢驗(yàn)統(tǒng)計(jì)量為,輸出4.4.1 位置參數(shù)檢驗(yàn)表,二、基于成對(duì)數(shù)據(jù)的比較兩個(gè)總體分布的檢驗(yàn),從總體x和總體y中抽取成對(duì)樣本(x1,y1),(x2,y2),(xn,yn)。 設(shè)總體x和總體y的分布函數(shù)分別為F(a)和G(a),欲檢驗(yàn) H0:F(a)=G(a),H1:F(a)G(a) 令di=xiyi(i=1,2,n),將這些差值的絕對(duì)值|di|由小到大排秩,|di|的秩記作Ri,使用檢驗(yàn)統(tǒng)計(jì)量 T=min(T+,T) 其中 ,它們分別是正、負(fù)兩種差值的秩 和。對(duì)于給定的,其檢驗(yàn)的拒絕規(guī)則與(4.4.3)式(或(4.4.10)式)相同。,例4.4.2 為檢驗(yàn)甲、乙兩家郵件快遞公司的

15、服務(wù)質(zhì)量,選擇十個(gè)不同的時(shí)刻,在其每一時(shí)刻同時(shí)將相同的兩份郵件分別交給這兩家公司,完成每次郵遞所需的時(shí)間如表4.4.2所示(單位:小時(shí))。試問這些數(shù)據(jù)是否表明兩家公司的郵遞時(shí)間有顯著差異(=0.05)。,表4.4.2郵遞時(shí)間,解 依題意,需檢驗(yàn)假設(shè) H0:兩總體分布相同,H1:兩總體分布不相同 令di=xiyi(i=1,2,10),有關(guān)結(jié)果列于表4.4.2中。將di=0的數(shù)據(jù)從樣本中剔除,于是樣本容量變?yōu)閚=9。由于 從而 T=min(T+,T)=T+=15.56=T0 故不能拒絕H0。,4.5 威爾科克森秩和檢驗(yàn),如果來自兩個(gè)總體的樣本是相互獨(dú)立的,則可以使用威爾科克森秩和檢驗(yàn)(Wilcox

16、on rank-sum test)對(duì)兩個(gè)總體進(jìn)行比較檢驗(yàn)。 設(shè) 是取自總體x的一個(gè)樣本, 是取自總體y的一個(gè)樣本,且兩個(gè)樣本相互獨(dú)立。又設(shè)總體x和總體y的分布函數(shù)分別為F(a)和G(a),希望檢驗(yàn) H0:F(a)=G(a),H1:F(a)G(a) 將 和 混合在一起,并按其大小由小到大進(jìn)行排秩,記xi在混合樣本中的秩為Ri,i=1,2,n1。威爾科克森在1945年提出,把 在混合樣本中的秩的總和,作為檢驗(yàn)上述假設(shè)的檢驗(yàn)統(tǒng)計(jì)量。對(duì)于給定的,檢驗(yàn)的拒絕規(guī)則可制定為: 若TTL或TTU,則拒絕H0 其中TL的值可直接從附錄二的表6讀出,而TU的值可由下式算出。 TU=n1(n1+n2+1)TL H0

17、:F(a)G(a),H1:F(a)G(a) (或H0:F(a)=G(a),H1:F(a)G(a) 拒絕規(guī)則為: 若TTU,則拒絕H0,H0:F(a)G(a),H1:F(a)G(a) (或H0:F(a)=G(a),H1:F(a)G(a) 拒絕規(guī)則為: 若TTL,則拒絕H0 TL同樣可從附錄二的表6讀出,TU由(4.5.4)式算得。 當(dāng)n1和n2都大于或等于10時(shí),T的抽樣分布可作正態(tài)近似。采用檢驗(yàn)統(tǒng)計(jì)量 對(duì)于給定的,上述各假設(shè)的拒絕規(guī)則分別為: 若|u|u/2,則拒絕H0 若uu,則拒絕H0 若uu,則拒絕H0,例4.5.1 有甲、乙兩臺(tái)機(jī)床加工同樣的產(chǎn)品。從這兩臺(tái)機(jī)床加工的產(chǎn)品中分別隨機(jī)地抽取

18、若干件,并測(cè)得其產(chǎn)品直徑為(單位:毫米): 甲:18.2,18.3,17.0,18.4,17.5,17.2,18.5,17.5 乙:19.1,18.5,18.0,19.2,16.7,18.4,17.6,18.8,17.3 試問這些數(shù)據(jù)能否表明甲、乙兩臺(tái)機(jī)床加工產(chǎn)品的直徑有顯著差異(=0.05) 解 依題意,n1=8,n2=9,建立假設(shè) H0:兩總體分布相同,H1:兩總體分布不相同 查TL值表得TL=51,又由(4.5.4)式算得 TU=n1(n1+n2+1)TL=8(8+9+1)51=93 由于TLT=60TU,故不能拒絕H0。,表4.5.1 產(chǎn)品直徑,4.6 QQ圖,QQ圖可簡(jiǎn)便地從直觀上判斷一組樣本數(shù)據(jù)是否來自具有某種分布形式的總體。 設(shè)x1,x2,xn是來自連續(xù)型總體x的一組樣本觀測(cè)值,x的分布函數(shù)為F(x),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論