版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第六章 SPSS的非參數(shù)檢驗(yàn) v 第1節(jié) 單樣本的非參數(shù)檢驗(yàn)v 第2節(jié) 兩獨(dú)立樣本的非參數(shù)檢驗(yàn)v 第3節(jié) 多獨(dú)立樣本的非參數(shù)檢驗(yàn)v 第4節(jié) 兩配對(duì)樣本的非參數(shù)檢驗(yàn)v 第5節(jié) 多配對(duì)樣本的非參數(shù)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷統(tǒng)計(jì)估計(jì)估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)推斷統(tǒng)計(jì) 推斷統(tǒng)計(jì)是根據(jù)樣本數(shù)據(jù)推斷總體數(shù)量特征的統(tǒng)計(jì)分析方法 推斷統(tǒng)計(jì)通常包括以下兩個(gè)內(nèi)容 總體分布已知,根據(jù)樣本數(shù)據(jù)對(duì)總體分布的統(tǒng)計(jì)參數(shù)(如均值、方差)進(jìn)行推斷,此時(shí)采用的推斷方法稱為參數(shù)估計(jì)或者參數(shù)檢驗(yàn) 總體分布未知,根據(jù)樣本數(shù)據(jù)對(duì)總體的分布形式進(jìn)行推斷,此時(shí)采用的推斷方法稱為非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)
2、的概念 無(wú)需假定總體分布的具體形式,僅僅依賴于數(shù)據(jù)觀測(cè)值的相對(duì)大小(秩)建立檢驗(yàn)統(tǒng)計(jì)量;然后找到在零假設(shè)下這些統(tǒng)計(jì)量的分布;并且看這些統(tǒng)計(jì)量的數(shù)據(jù)是否在零假設(shè)下屬于小概率事件. 這種和數(shù)據(jù)本身的具體總體分布無(wú)關(guān)進(jìn)行的檢驗(yàn)都稱為非參數(shù)檢驗(yàn)(nonparametric testing) 由于非參數(shù)檢驗(yàn)方法在推斷過(guò)程中不涉及有關(guān)總體分布的參數(shù),因而得名為“非參數(shù)”檢驗(yàn)非參數(shù)檢驗(yàn)在總體分布的優(yōu)越性 非參數(shù)檢驗(yàn)在總體分布未知時(shí)有很大的優(yōu)越性。在分布未知時(shí),還假定總體有諸如正態(tài)分布那樣的分布,在進(jìn)行統(tǒng)計(jì)推斷就可能產(chǎn)生錯(cuò)誤,非參數(shù)檢驗(yàn)總是比傳統(tǒng)檢驗(yàn)安全。 但在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)不如傳統(tǒng)方法效率高
3、。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無(wú)法拒絕。 非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳統(tǒng)方法要高,有時(shí)要高很多。是否用非參數(shù)統(tǒng)計(jì)方法,要根據(jù)對(duì)總體分布的了解程度來(lái)確定SPSS非參數(shù)檢驗(yàn) 在總體分布未知的情況下,利用樣本數(shù)據(jù)對(duì)總體的分布或各總體的分布特征是否有顯著差異進(jìn)行推斷 SPSS中的非參數(shù)檢驗(yàn)方法: 單樣本非參數(shù)檢驗(yàn) 兩獨(dú)立樣本的非參數(shù)檢驗(yàn) 多獨(dú)立樣本的非參數(shù)檢驗(yàn) 兩配對(duì)樣本的非參數(shù)檢驗(yàn) 多配對(duì)樣本的非參數(shù)檢驗(yàn)SPSS單樣本非參數(shù)檢驗(yàn) 得到一批樣本數(shù)據(jù)以后,往往希望了解樣本來(lái)自的總體的分布是否與某個(gè)已知的理論分布相吻合??梢酝ㄟ^(guò)繪制樣本數(shù)據(jù)的直方圖
4、、P-P圖、Q-Q圖等方法作粗略判斷,還可以利用非參數(shù)檢驗(yàn)的方法實(shí)現(xiàn)。 SPSS單樣本非參數(shù)檢驗(yàn)是對(duì)單個(gè)總體的分布形態(tài)等進(jìn)行推斷的方法。包括: 總體分布的chi-square檢驗(yàn) 二項(xiàng)分布檢驗(yàn) K-S檢驗(yàn) 變量值隨機(jī)性檢驗(yàn)等總體分布的卡方(chi-square)檢驗(yàn) 目的: 根據(jù)樣本數(shù)據(jù)推斷總體的分布與某個(gè)已知分布(某一理論分布)是否有顯著差異-吻合性檢驗(yàn) 通常適用于對(duì)有多項(xiàng)分類值資料的總體分布統(tǒng)計(jì)推斷 原假設(shè): 樣本來(lái)自的總體分布與期望分布或某一理論分布無(wú)顯著差異總體分布的卡方(chi-square)檢驗(yàn) 基本思想 如果從一個(gè)隨機(jī)變量X中隨機(jī)抽取若干個(gè)觀察樣本,這些觀察樣本落在X的k個(gè)互不相
5、交的子集中的觀察頻數(shù)服從一個(gè)多項(xiàng)分布,這個(gè)多項(xiàng)分布當(dāng)k趨于無(wú)窮時(shí)近似服從卡方分布?;谶@一思想,對(duì)變量X總體分布的檢驗(yàn)就可從對(duì)各個(gè)觀察頻數(shù)的分析入手 在原假設(shè)成立的條件下,如果變量值落在第i子集中的理論概率值為Pi,則相應(yīng)的期望頻數(shù)便為npi。由此計(jì)算出的期望頻數(shù)分布代表了原假設(shè)成立時(shí)的理論分布。為檢驗(yàn)實(shí)際分布是否與理論分布(期望分布)一致,可采用卡方檢驗(yàn)統(tǒng)計(jì)量總體分布的卡方(chi-square)檢驗(yàn) 卡方統(tǒng)計(jì)量:Pearson卡方 k為子集個(gè)數(shù); 服從k-1個(gè)自由度的卡方分布 如果卡方值較大,說(shuō)明觀測(cè)頻數(shù)分布與期望頻數(shù)分布差距較大 如果卡方值較小,則說(shuō)明觀測(cè)頻數(shù)分布與期望頻數(shù)分布較接近 如
6、果p大于,不能拒絕H0,認(rèn)為總體分布與已知分布無(wú)顯著差異.反之,則應(yīng)拒絕原假設(shè)kioieioifff122)(總體分布的chi-square檢驗(yàn)基本操作步驟 數(shù)據(jù)要求:原始數(shù)據(jù)(1個(gè)變量)或加權(quán)后的頻數(shù)數(shù)據(jù)(2個(gè)變量) 菜單:analyze-Nonparametric test-chi square待檢驗(yàn)變量待檢驗(yàn)個(gè)案的取值范圍全部樣本用戶自定義:只有在該取值范圍內(nèi)的觀測(cè)數(shù)據(jù)才參與分析指定期望頻數(shù)所有子集頻數(shù)都相同-均勻分布用戶自定義依次輸入例題 6.1 醫(yī)學(xué)家在研究心臟病人猝死人數(shù)與日期的關(guān)系時(shí)發(fā)現(xiàn):一周之中,星期一心臟病人猝死者比較多,其他日子則基本相當(dāng)。各天的比例近似為2.8:1:1:1
7、:1:1:1?,F(xiàn)收集到心臟病人死亡日期的樣本數(shù)據(jù),推斷其總體分布是否與上述理論分布相吻合。 “心臟病猝死.sav”二項(xiàng)分布檢驗(yàn) 基本思想 在現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分成男性和女性,產(chǎn)品可以分成合格和不合格,投擲硬幣實(shí)驗(yàn)的結(jié)果可以分成出現(xiàn)正面和反面等。通常將這樣的二值分別用1和0表示 如果進(jìn)行n次相同的實(shí)驗(yàn),則出現(xiàn)兩類(1或0)的次數(shù)可以用離散型隨機(jī)變量來(lái)描述。如果隨機(jī)變量值為1代表“成功”,其概率設(shè)為p,則隨機(jī)變量值為0的概率q便等于1-p,則成功次數(shù)變量X的分布為二項(xiàng)分布二項(xiàng)分布檢驗(yàn) SPSS的二項(xiàng)分布檢驗(yàn):通過(guò)樣本數(shù)據(jù)檢驗(yàn)樣本來(lái)自的總體是否服從指定的概率為p的二項(xiàng)
8、分布 原假設(shè):樣本來(lái)自的總體與指定的二項(xiàng)分布無(wú)顯著差異二項(xiàng)分布檢驗(yàn) SPSS二項(xiàng)分布檢驗(yàn) 在小樣本中采用精確檢驗(yàn)方法 大樣本則采用近似檢驗(yàn)方法 精確檢驗(yàn)方法:計(jì)算n次試驗(yàn)中某類出現(xiàn)的次數(shù)小于等于x次的概率,即二項(xiàng)分布檢驗(yàn) 近似檢驗(yàn)方法 采用Z檢驗(yàn)統(tǒng)計(jì)量,在原假設(shè)成立下Z統(tǒng)計(jì)量近似服從正態(tài)分布,其數(shù)學(xué)定義為 式中進(jìn)行了連續(xù)性修正,當(dāng)x小于n/2時(shí)加0.5,當(dāng)x大于n/2時(shí)減0.5 SPSS自動(dòng)計(jì)算上述精確概率和近似概率值。如果概率值小于顯著性水平.則拒絕原假設(shè),認(rèn)為樣本來(lái)自的總體與指定的二項(xiàng)分布有顯著差異;如果概率值大于顯著性水平a,則不能拒絕原假設(shè),認(rèn)為樣本來(lái)自的總體與指定的二項(xiàng)分布無(wú)顯著差異
9、)1 (5 . 0qnpnpxz二項(xiàng)分布基本操作步驟 選擇菜單: AnalyzeNonparametric Tests Binomial待檢驗(yàn)變量指定分類方式檢驗(yàn)變量為二值變量檢驗(yàn)變量不是二值變量輸人具體數(shù)值,小于等于該值的觀察值為第一組,大于該值的觀察值為第二組檢驗(yàn)概率值p例題 6.2 從某批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測(cè)并得到檢測(cè)結(jié)果數(shù)據(jù)。用1表示一級(jí)品,用0表示非一級(jí)品。根據(jù)抽樣結(jié)果驗(yàn)證該品產(chǎn)品的一級(jí)品率是否為90%。 “產(chǎn)品合格率.sav”SPSS單樣本的K-S檢驗(yàn) K-S檢驗(yàn)是以俄羅斯數(shù)學(xué)家柯?tīng)柲绾退姑字Z夫(Kolmogorov-Smirnov)的名字命名的一種非參數(shù)檢驗(yàn)方法 利
10、用樣本數(shù)據(jù)推斷樣本來(lái)自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗(yàn)方法 適用于探索連續(xù)型隨機(jī)變量的分布 正態(tài)分布,Poisson分布,均勻分布和指數(shù)分布 例如 收集一批周歲兒童身高的樣本數(shù)據(jù),需利用樣本數(shù)據(jù)推斷周歲兒童總體的身高是否服從正態(tài)分布 利用收集的住房狀況調(diào)查的樣本數(shù)據(jù),分析家庭人均住房面積是否服從正態(tài)分布SPSS單樣本的K-S檢驗(yàn) 基本思路:基本思路: 在原假設(shè)成立的前提下,根據(jù)用戶指定檢驗(yàn)的總體分布,構(gòu)造出一理論的頻數(shù)分布,計(jì)算各樣本觀測(cè)值在理論分布中出現(xiàn)的累計(jì)概率值F(x) 計(jì)算各樣本觀測(cè)值的實(shí)際累計(jì)概率值S(x) 計(jì)算實(shí)際累計(jì)概率值與理論累計(jì)概率值的差D(x) 計(jì)算差值序列
11、中的最大絕對(duì)差值,即實(shí)際累積概率為離散值,因此修正為: 如果相差較小,則認(rèn)為樣本所代表的總體符合指定的總體分布) )F(x- )S(xmax(Dii)F(x-)S(xmax(Di1 - iSPSS單樣本的K-S檢驗(yàn) 在小樣本下,原假設(shè)成立時(shí),D統(tǒng)計(jì)量服從Kolmogorov分布 在大樣本下,原假設(shè)成立時(shí), 近似服從K (x)分布: 當(dāng)D小于0時(shí),K(x)為0 當(dāng)D大于0時(shí), 如果樣本總體的分布與理論分布的差異不明顯,那么D不應(yīng)較大。如果D統(tǒng)計(jì)量的概率P值小于顯著性水平,則應(yīng)拒絕原假設(shè),認(rèn)為樣本來(lái)自的總體與指定的分布有顯著差異。反之。 在SPSS中,僅給出大樣本下的 和對(duì)應(yīng)的概率p值Dn)2ex
12、p() 1()(22xjxKjDnSPSS的單樣本K-S檢驗(yàn)基本步驟 菜單選項(xiàng):analyze-nonparametric tests-1-sample k-s待檢驗(yàn)變量指定檢驗(yàn)的分布名稱:normal:正態(tài)分布 uniform:均勻分布possion:泊松分布 exponential:指數(shù)分布Exact: 精確方法Monte Carlo: Monte Carlo抽樣方法Asymptotic only: 用于大樣本的漸近方法SPSS的單樣本K-S檢驗(yàn) 經(jīng)常有人在Kolmogorov-Smirnov檢驗(yàn)中,當(dāng)檢驗(yàn)不能拒絕總體分布為某分布時(shí),來(lái)“接受”或“證明”該樣本來(lái)自該分布。這是錯(cuò)誤的。 比如
13、我們有由1、2、3、4、5五個(gè)數(shù)目組成的數(shù)據(jù),我們分別檢驗(yàn)該數(shù)據(jù)是否是正態(tài)分布、均勻分布、Poisson分布或指數(shù)分布。結(jié)果歸納為下表Kolmogorov-Smirnov單樣本分布檢驗(yàn)單樣本分布檢驗(yàn)零假設(shè)的分布零假設(shè)的分布 (漸近雙邊檢驗(yàn)的)(漸近雙邊檢驗(yàn)的)p-值值正態(tài)分布正態(tài)分布1.000均勻分布均勻分布0.988Poisson分布分布1.000指數(shù)分布指數(shù)分布0.806根據(jù)此表,沒(méi)有足夠證據(jù)來(lái)拒絕任何一個(gè)零假設(shè)。難道我根據(jù)此表,沒(méi)有足夠證據(jù)來(lái)拒絕任何一個(gè)零假設(shè)。難道我們可以隨意們可以隨意“接受接受”該總體為其中任一個(gè)分布嗎?該總體為其中任一個(gè)分布嗎? 例題 6.3 收集到21名周歲兒童身
14、高的樣本數(shù)據(jù),分析周歲兒童身高的總體是否服從正態(tài)分布 “兒童身高.sav”變量值Z分?jǐn)?shù)理論累積概率 實(shí)際累計(jì)概率差值修正差值64-1.97490.02410.04760.0235.68-0.96950.16610.19050.0243-0.118568-0.96950.16610.19050.02430.024468-0.96950.16610.19050.02430.024469-0.71810.23630.23810.0018-0.045870-0.46680.32030.3810.0606-0.082270-0.46680.32030.3810.06060.060770-0.46680.
15、32030.3810.06060.060771-0.21540.41470.6190.2043-0.033771-0.21540.41470.6190.20430.204371-0.21540.41470.6190.20430.204371-0.21540.41470.6190.20430.204371-0.21540.41470.6190.20430.2043720.03590.51430.66670.15230.1047730.28730.6130.71430.10120.0537740.53860.70490.76190.0570.0094750.790.78520.80950.0243
16、-0.0233761.04130.85110.85710.006-0.0416781.5440.93870.9048-0.0339-0.0816791.79540.96370.9524-0.0113-0.0589802.04670.979710.0203-0.0273概率P值大于顯著性水平,因此不能拒絕原假設(shè),可以認(rèn)為周歲兒童身高的總體分布與正態(tài)分布無(wú)顯著差異變量值的隨機(jī)性檢驗(yàn) 目的 利用樣本數(shù)據(jù)對(duì)總體可能出現(xiàn)的變量值是否隨機(jī)進(jìn)行檢驗(yàn) 投硬幣:以1表示出現(xiàn)的是正面,以0表示出現(xiàn)的是反面。在進(jìn)行了若干次投幣后,將會(huì)得到一個(gè)以1、0組成的變量值序列。這時(shí)可能會(huì)分析“硬幣出現(xiàn)正反面是否是隨機(jī)的”這樣
17、的問(wèn)題 基本假設(shè): H0:總體可能出現(xiàn)的變量值是隨機(jī)的SPSS的單樣本隨機(jī)性檢驗(yàn) 基本方法觀察樣本序列出現(xiàn)了多少游程(run).游程:樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù).一般出現(xiàn)太多或太少的游程表示變量值序列有一定的非隨機(jī)性其中相同的0(或相同的1)在一起稱為一個(gè)游程(單獨(dú)的0或1也算) 4個(gè)0組成的游程和3個(gè)1組成的游程。一共是R=7個(gè)游程。其中0的個(gè)數(shù)為m=15,而1的個(gè)數(shù)為n=100 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0游程檢驗(yàn)的分布利用游程數(shù)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,把游程出現(xiàn)0和1的的這樣一個(gè)過(guò)程可以看成是參數(shù)為某未知p的Bernou
18、lli試驗(yàn)。但在給定了m和n之后,在0和1的出現(xiàn)是隨機(jī)的零假設(shè)之下,R的條件分布就和這個(gè)參數(shù)無(wú)關(guān)了。根據(jù)初等概率論,R的分布可以寫成(令N=m+n)11211(2 ),11112211(21)mnkkP RkNnmnmnkkkkP RkNn游程檢驗(yàn)的近似分布 在大樣本下,游程近似服從正態(tài)分布。R為游程數(shù) SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量,并依據(jù)正態(tài)分布表給出對(duì)應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為變量值的出現(xiàn)不是隨機(jī)的;如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為變量值的出現(xiàn)是隨機(jī)的rrRZ2rmnmn222(2)() (1)rmnmnmnmn
19、mnSPSS的單樣本隨機(jī)性檢驗(yàn)基本操作步驟 菜單選項(xiàng):analyze-nonparametric test-runs待檢驗(yàn)變量指定如何計(jì)算游程:median:以中位數(shù)為界線 mode:以眾數(shù)為界線mean:以均值為分界線 custom:以用戶指定值為界線小于界線值的為一類;大于等于界線值的為另一類例題 6.4 為檢驗(yàn)?zāi)衬蛪涸O(shè)備在某段時(shí)間內(nèi)工作是否持續(xù)正常,測(cè)試并記錄下該時(shí)間段內(nèi)各個(gè)時(shí)間點(diǎn)上的設(shè)備耐壓的數(shù)據(jù)?,F(xiàn)采用游程檢驗(yàn)方法對(duì)這批數(shù)據(jù)進(jìn)行分析。 如果耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的,可認(rèn)為該設(shè)備工作一直正常,否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象。 “電纜數(shù)據(jù).sav”SPSS兩獨(dú)立樣本非參數(shù)檢驗(yàn) 目的 由
20、獨(dú)立樣本數(shù)據(jù)推斷兩總體的分布是否存在顯著差異(或兩樣本是否來(lái)自同一總體)。 獨(dú)立樣本:在一個(gè)總體中隨機(jī)抽樣對(duì)在另一個(gè)總體中隨機(jī)抽樣沒(méi)有影響的情況下所獲得的樣本 基本假設(shè) H0:兩總體分布無(wú)顯著差異(兩樣本來(lái)自同一總體) 數(shù)據(jù)要求 樣本數(shù)據(jù)和分組標(biāo)志 基本內(nèi)容 曼-惠特尼U檢驗(yàn)、K-S檢驗(yàn)、W-W游程檢驗(yàn)、極端反應(yīng)檢驗(yàn)秩(rank) 非參數(shù)檢驗(yàn)中秩是最常使用的概念。 秩就是該數(shù)據(jù)按照升冪排列之后,每個(gè)觀測(cè)值的位置或名次。變量值有幾個(gè),對(duì)應(yīng)的秩便有幾個(gè)。 例如我們有下面數(shù)據(jù):下面一行(記為Ri)是上面一行數(shù)據(jù)Xi的秩。利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)Xi15
21、918317851379Ri75918426310曼-惠特尼U檢驗(yàn)(Mann-Whitney U) 通過(guò)對(duì)兩組樣本平均秩的研究來(lái)進(jìn)行推斷將兩樣本數(shù)據(jù)混合并按升序排序求出其秩對(duì)兩樣本的秩分別求平均如果兩樣本的平均秩大致相同,則認(rèn)為兩總體分布無(wú)顯著差異。 如果兩個(gè)平均秩相差甚遠(yuǎn),則應(yīng)是一組樣本的秩普遍偏小,另一組樣本的秩普遍偏大的結(jié)果,也就是一組樣本的值普遍偏小,另一組樣本的值普遍偏大的結(jié)果。此時(shí)原假設(shè)很可能是不成立的Wilcoxon (Mann-Whitney)秩和檢驗(yàn)曼一惠特尼U檢驗(yàn)常用Wilcoxon (或稱Mann-Whitney)秩和W檢驗(yàn),其原理是假定兩個(gè)個(gè)樣本X和Y分別有m個(gè)和n個(gè)觀
22、測(cè)值。 把兩個(gè)樣本混合后把這m+n個(gè)觀測(cè)值升冪排序,記下每個(gè)觀測(cè)值在混合排序下面的秩。之后分別把兩個(gè)樣本所得到的秩相加。記第一個(gè)樣本觀測(cè)值的秩的和為WX而第二個(gè)樣本秩的和為WY。這兩個(gè)值可以互相推算,稱為Wilcoxon統(tǒng)計(jì)量。 Wilcoxon W為:如果mn,則Wilcoxon W =Wx;曼惠特尼U統(tǒng)計(jì)量的計(jì)算公式為式中,W值即為Wilcoxon W; k為W對(duì)應(yīng)樣本組的樣本量) 1(21kkWUWilcoxon (Mann-Whitney)秩和檢驗(yàn)在小樣本下,U統(tǒng)計(jì)量服從曼-惠特尼分布。 SPSS自動(dòng)計(jì)算出U統(tǒng)計(jì)量的觀測(cè)值和概率P-值。在大樣本下,U統(tǒng)計(jì)量近似服從正態(tài)分布,計(jì)算公式為該
23、統(tǒng)計(jì)量的分布和兩個(gè)總體分布無(wú)關(guān)。由此分布SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的p-值。直觀上看,如果WX與WY之中有一個(gè)顯著地大,則可以選擇拒絕零假設(shè)。在小樣本下,依據(jù)U統(tǒng)計(jì)量的概率P-值進(jìn)行決策;而在大樣本下,則依據(jù)Z統(tǒng)計(jì)量的概率P-值進(jìn)行決策)1(12121nmmnmnUZ 例題 6.5 某工廠用甲乙兩種不同的工藝生產(chǎn)同一種產(chǎn)品,如果希望檢驗(yàn)兩種工藝下產(chǎn)品的使用壽命是否存在差異,可以從兩種工藝生產(chǎn)出的產(chǎn)品中隨機(jī)抽樣,得到各自的使用壽命數(shù)據(jù)。 “使用壽命.sav”工藝工藝使用壽命樣本值使用壽命樣本值甲工藝(1)675, 682, 692, 679, 669, 661, 693乙工藝(2)662,
24、 649, 672, 663, 650, 651, 646, 652混合后樣本數(shù)據(jù)各組標(biāo)記秩6462164922650236512465225661166622766328669196722106751116791126821136921146931154) 18(82140) 1(21kkWU)1(12121nmmnmnUZ兩獨(dú)立樣本分布的K-S檢驗(yàn)原假設(shè) 兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異基本思想 與單樣本K-S檢驗(yàn)的基本思想大體一致 主要差別:這里是以變量值的秩作為分析對(duì)象,而非變量值本身首先,將兩組樣本混合并按升序排序然后,分別計(jì)算兩組樣本秩的累計(jì)頻數(shù)和累計(jì)頻率最后,計(jì)算兩組累計(jì)
25、頻率的差,得到秩的差值序列并得到D統(tǒng)計(jì)量如果差距較小,則認(rèn)為兩總體分布無(wú)顯著差異兩獨(dú)立樣本分布的K-S檢驗(yàn) 假定兩個(gè)樣本的樣本量分別為n1和n2,用S1 (X)和S2 (X)分別表示兩個(gè)樣本的累積經(jīng)驗(yàn)分布函數(shù)。再記DjS1 (Xj)-S2 (Xj)。近似正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量為 SPSS中將自動(dòng)計(jì)算在大樣本下的Z的觀測(cè)值和概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩總體的分布有顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為兩總體的分布無(wú)顯著差異1212max |jjn nZDnn工藝工藝使用壽命樣本值使用壽命樣本值甲工藝(1)675,
26、 682, 692, 679, 669, 661, 693乙工藝(2)662, 649, 672, 663, 650, 651, 646, 652兩樣本W(wǎng)ald-Wolfowitz游程檢驗(yàn) 不同于單樣本游程檢驗(yàn),兩獨(dú)立樣本的游程檢驗(yàn)用來(lái)檢驗(yàn)兩獨(dú)立樣本來(lái)自的兩總體的分布是否存在顯著差異。 原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異。 兩獨(dú)立樣本的游程檢驗(yàn)(Wald-Wolfowitz runs test)和單樣本游程檢驗(yàn)基本思想基本相同。不同的是計(jì)算游程數(shù)的方法。兩獨(dú)立樣本的游程檢驗(yàn)中,游程數(shù)依賴于變量的秩。兩獨(dú)立樣本游程檢驗(yàn)首先,把兩個(gè)樣本混合,按照大小次序排列,對(duì)應(yīng)的組標(biāo)記值也會(huì)隨之重
27、新排列,同樣本的組標(biāo)記值在一起的為一個(gè)游程。然后,計(jì)算分組標(biāo)志序列的游程數(shù) 如果兩總體的分布存在較大差距,那么游程數(shù)會(huì)相對(duì)比較少 如果游程數(shù)比較大,則應(yīng)是兩組樣本值充分混合的結(jié)果,兩總體的分布不會(huì)存在顯著差異最后,根據(jù)游程數(shù)據(jù)計(jì)算Z統(tǒng)計(jì)量,該統(tǒng)計(jì)量近似服從正態(tài)分布。SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量的觀測(cè)值和對(duì)應(yīng)的概率P_值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩總體的分布存在顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為兩總體的分布無(wú)顯著差異混合排序后的樣本數(shù)據(jù)混合排序后的樣本數(shù)據(jù)各組標(biāo)記各組標(biāo)記646264926502651265226611
28、662266326691672267516791682169216931R=6兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn) 原假設(shè):兩獨(dú)立樣本來(lái)自的兩個(gè)總體的分布無(wú)顯著差異。 基本思想: 將一組樣本作為控制樣本,另一組樣本作為實(shí)驗(yàn)樣本。以控制樣本作為對(duì)照,檢驗(yàn)實(shí)驗(yàn)樣本相對(duì)于控制樣本是否出現(xiàn)了極端反應(yīng)。 如果實(shí)驗(yàn)樣本沒(méi)有出現(xiàn)極端反應(yīng),則認(rèn)為兩總體的分布無(wú)顯著差異 如果實(shí)驗(yàn)樣本存在極端反應(yīng),則認(rèn)為兩總體的分布存在顯著差異兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)分析過(guò)程 將兩組樣本混合按升序排序;然后,求出控制樣本的最小秩Qmin和最大秩Qmax,并計(jì)算出跨度(Span) 為消除樣本數(shù)據(jù)中極端值對(duì)分析結(jié)果的影響,在計(jì)算跨度之前可按比例
29、(通常為5%)去除控制樣本中部分靠近兩端的樣本值,然后再求跨度,得到截頭跨度 如果跨度或截頭跨度較小,則是兩組樣本數(shù)據(jù)無(wú)法充分混合,一組樣本值顯著大于另一組樣本值的結(jié)果,則認(rèn)為相對(duì)控制樣本,實(shí)驗(yàn)樣本出現(xiàn)了極端反應(yīng),樣本來(lái)自的兩總體的分布存在顯著差異 如果跨度或截頭跨度較大,則應(yīng)是兩組樣本數(shù)據(jù)充分混合,一組樣本值沒(méi)有顯著大于另一組樣本值的結(jié)果,則認(rèn)為相對(duì)控制樣本,實(shí)驗(yàn)樣本沒(méi)有出現(xiàn)極端反應(yīng),樣本來(lái)自的兩總體的分布沒(méi)有顯著差異1minmaxQQS極端反應(yīng)檢驗(yàn)統(tǒng)計(jì)量 針對(duì)跨度或截頭跨度計(jì)算H檢驗(yàn)統(tǒng)計(jì)量 m為控制樣本的樣本量;Qi為控制樣本在混合樣本中的秩; 為控制樣本的平均秩 小樣本下,H統(tǒng)計(jì)量服從H
30、ollander分布;大樣本下,H統(tǒng)計(jì)量近似服從正態(tài)分布 SPSS將自動(dòng)計(jì)算H統(tǒng)計(jì)量的觀測(cè)值和概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩獨(dú)立樣本來(lái)自的兩總體的分布存在顯著差異。反之21)(miiQQHQ樣本值樣本值646649650651652661662663669672675679682692693組標(biāo)記222221221211111秩123456789101112131415去除極端值后12345678910111213跨度為:15-6+1=10截頭跨度為:13-8+1=6以樣本1為控制組SPSS兩獨(dú)立樣本非參數(shù)檢驗(yàn)基本操作步驟 菜單選項(xiàng):analyze-n
31、onparametric tests-2 independent sample例題 6.6 分析兩種工藝下產(chǎn)品的使用壽命是否存在差異工藝工藝使用壽命樣本值使用壽命樣本值甲工藝(1)675, 682, 692, 679, 669, 661, 693乙工藝(2)662, 649, 672, 663, 650, 651, 646, 652SPSS多獨(dú)立樣本非參數(shù)檢驗(yàn) 目的 由多組獨(dú)立樣本數(shù)據(jù)推斷多個(gè)總體的分布是否存在顯著差異 多組獨(dú)立樣本是指按獨(dú)立抽樣方式獲得的多組樣本 基本假設(shè): H0:多個(gè)總體分布無(wú)顯著差異 數(shù)據(jù)要求: 樣本數(shù)據(jù)和分組標(biāo)志 基本內(nèi)容 中位數(shù)檢驗(yàn)、Kruskal-Wallis檢驗(yàn)、
32、Jonckheere-Terpstra檢驗(yàn)例題 6.7 利用“四城市兒童身高”數(shù)據(jù),對(duì)北京、上海、成都、廣州四城市的周歲兒童身高進(jìn)行比較分析,推斷四城市周歲兒童身高是否存在顯著差異中位數(shù)檢驗(yàn)(median) 中位數(shù)檢驗(yàn)通過(guò)對(duì)多組獨(dú)立樣本的分析,檢驗(yàn)它們來(lái)自的總體的中位數(shù)是否存在顯著差異。 原假設(shè) 多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)無(wú)顯著差異 基本思想 如果多個(gè)總體的中位數(shù)無(wú)顯著差異,或者說(shuō)多個(gè)總體有共同的中位數(shù),那么這個(gè)共同的中位數(shù)應(yīng)在各樣本組中均處在中間位置上。 于是,每組樣本中大于該中位數(shù)與小于該中位數(shù)的樣本量應(yīng)大致相同中位數(shù)檢驗(yàn)(median) 基本步驟 將多組樣本混合按升序排序,并求出
33、混合樣本的中位數(shù) 分別計(jì)算各組樣本中大于和小于上述中位數(shù)的樣本量,形成列聯(lián)表 利用卡方檢驗(yàn)方法分析各組樣本來(lái)自的總體對(duì)于上述中位數(shù)的分布是否一致中位數(shù)檢驗(yàn)(median) 如果各組中大于(或小于)上述中位數(shù)的樣本比例大致相同,則可以認(rèn)為多組樣本有共同的中位數(shù),它們來(lái)自的總體的中位數(shù)無(wú)顯著差異 反之,如果各組中大于(或小于)上述中位數(shù)的樣本比例相差較大,則可以認(rèn)為多組樣本的中位數(shù)不全部相同,它們來(lái)自的總體的中位數(shù)存在顯著差異 假定有k個(gè)總體,ni為第i個(gè)樣本量;把所有樣本量之和記為N 先把從這個(gè)k個(gè)總體來(lái)的樣本混合起來(lái)排序,找出它們的中位數(shù) 計(jì)算每個(gè)總體中小于該中位數(shù)的觀測(cè)值個(gè)數(shù)O1j,j=1,
34、k,和每個(gè)總體中大于該中位數(shù)的觀測(cè)值個(gè)數(shù)O2j,j=1,k。這樣就形成了一個(gè)由元素Oij組成的2k表。其列總和為ni,j=1,k;而兩個(gè)行總和為各樣本小于總中位數(shù)的觀測(cè)值總和:R1O11+O12+ O1k及各樣本大于總中位數(shù)的觀測(cè)值總和R2O21+O22+ O2k 列聯(lián)表,可以用Pearson 2統(tǒng)計(jì)量 卡方統(tǒng)計(jì)量服從(2-1) X (n-1)個(gè)自由度的卡方分布22211()kijijjiijOEEijijRnEN中位數(shù)檢驗(yàn)的計(jì)算示例 對(duì)樣本數(shù)據(jù)混合排序后,得到共同的中位數(shù)為74k-w檢驗(yàn)(推廣的平均秩檢驗(yàn)) 多獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)的實(shí)質(zhì)是兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)在多
35、個(gè)獨(dú)立樣本下的推廣,用于檢驗(yàn)多個(gè)總體的分布是否存在顯著差異 原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異 基本思想 首先,將多組樣本數(shù)據(jù)混合并按升序排序,求出各變量值的秩;然后,考察各組秩的均值是否存在顯著差異 如果各組秩的均值不存在顯著差異,則是多組數(shù)據(jù)充分混合,數(shù)值相差不大的結(jié)果,可以認(rèn)為多個(gè)總體的分布無(wú)顯著差異; 如果各組秩的均值存在顯著差異,則是多組數(shù)據(jù)無(wú)法混合,某些組的數(shù)值普遍偏大,另一些組的數(shù)值普遍偏小的結(jié)果,可以認(rèn)為多個(gè)總體的分布有顯著差異Kruskal-Wallis關(guān)于多個(gè)樣本的秩和檢驗(yàn) 目的是檢驗(yàn)多總體位置參數(shù)是否一樣。方法和Wilcoxon-Mann-Whitney檢
36、驗(yàn)的思想類似 為研究各組秩的差異,可借鑒方差分析方法總變差=組間差+組內(nèi)差如果各樣本組秩的總變差的大部分可由組間差解釋,則表明各樣本組的總體分布存在顯著差異;反之,如果各樣本組秩的總變差的大部分不能由組間差解釋,則表明各樣本組的總體分布沒(méi)有顯著差異構(gòu)造K-W檢驗(yàn)統(tǒng)計(jì)量Kruskal-Wallis多個(gè)樣本的秩和檢驗(yàn) 假定有k個(gè)總體。先把從這個(gè)k個(gè)總體來(lái)的樣本混合起來(lái)排序,記各個(gè)總體觀測(cè)值的秩之和為Ri,i=1,k。顯然如果這些Ri很不相同,就可以認(rèn)為它們位置參數(shù)相同的零假設(shè)不妥(備選假設(shè)為各個(gè)位置參數(shù)不全相等)Kruskal-Wallis檢驗(yàn)統(tǒng)計(jì)量 公式中表示樣本組數(shù);ni為第i組的樣本量,而N
37、為各個(gè)樣本量之和(總樣本量)。 這個(gè)統(tǒng)計(jì)量在位置參數(shù)相同的零假設(shè)下有漸近的自由度為k-1的2分布221112123(1)(1)(1)kkiiiiiiiRRHnRNN NnN NnKruskal-WallisKruskal-Wallis檢驗(yàn)的計(jì)算示例 有一些秩出現(xiàn)了“打結(jié)”。對(duì)此SPSS中通常以平均秩來(lái)處理 北京、上海、成都、廣州的平均秩: 14.4,8.2,15.8,3.6Jonckheere-TerpstraJonckheere-Terpstra多樣本的秩檢驗(yàn) Jonckheere-Terpstra檢驗(yàn)先在每?jī)蓚€(gè)樣本所有觀測(cè)值對(duì)之間比較,計(jì)算第i個(gè)樣本觀測(cè)值中小于第j個(gè)樣本觀測(cè)值的對(duì)子數(shù)Ui
38、j 上式表明,J-T統(tǒng)計(jì)量是所有Uij在ij組范圍內(nèi)的總和,稱為觀測(cè)的J-T統(tǒng)計(jì)量,在大樣本下近似服從正態(tài)分布ijijJU), 1, 1,(#lijlikijnlnkXXUJ-T統(tǒng)計(jì)量計(jì)算J-T統(tǒng)計(jì)量時(shí)會(huì)涉及樣本標(biāo)記值的大小順序。例如,如果有三組樣本,樣本標(biāo)記值分別為1, 2, 3,則觀測(cè)的J-T統(tǒng)計(jì)量為:第1組樣本觀察值小于第2組樣本觀察值的個(gè)數(shù)+第1組樣本觀察值小于第3組樣本觀察值的個(gè)數(shù)+第2組樣本觀察值小于第3組樣本觀察值的個(gè)數(shù)除計(jì)算觀測(cè)的J-T統(tǒng)計(jì)量,通常還將計(jì)算所有情況下的J-T統(tǒng)計(jì)量。例如,如果仍有1, 2, 3三組樣本,除了按照(l, 2, 3)的順序計(jì)算J-T值,還要按照(1,
39、 3, 2), (2, 1, 3), (2. 3, 1), (3, 1, 2), (3, 2, 1)的順序計(jì)算所有的J-T值,并計(jì)算這些J-T值的均值和標(biāo)準(zhǔn)差等如果觀測(cè)的J-T統(tǒng)計(jì)量遠(yuǎn)大于或遠(yuǎn)小于J-T均值,那么可以認(rèn)為,按照樣本標(biāo)記值的升序,樣本數(shù)據(jù)有明顯的上升或下降趨勢(shì),從而能夠判定樣本來(lái)自的多個(gè)總體的分布存在顯著差異檢驗(yàn)統(tǒng)計(jì)量 在大樣本下,J-T統(tǒng)計(jì)量近似服從正態(tài)分布 式中,J為觀測(cè)的J-T統(tǒng)計(jì)量;k為樣本組數(shù);ni為第i組樣本的樣本量SPSS將自動(dòng)計(jì)算J-T統(tǒng)計(jì)量、Z統(tǒng)計(jì)量和相應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布存在
40、顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),認(rèn)為多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布不存在顯著差異72/)32()32(4/)(122122ikiikiinnNNnNJZJonckheere-TerpstraJonckheere-Terpstra檢驗(yàn)的計(jì)算示例“打結(jié)”的情況計(jì)為0. 5,觀測(cè)的J-T值為45. 5,所有排列下的J-T平均值為75SPSS軟件使用說(shuō)明 數(shù)據(jù)要求: AnalyzeNonparametric TestsK Independent SamplesSPSS兩配對(duì)樣本非參數(shù)檢驗(yàn) 含義 由配對(duì)樣本數(shù)據(jù)推斷兩總體分布是否存在顯著差異 基本假設(shè) H0:兩配
41、對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異 數(shù)據(jù)要求 配對(duì)樣本的樣本量是相同的,且各樣本值的先后次序是不能隨意更改的 基本方法 McNemar檢驗(yàn)、符號(hào)檢驗(yàn)、Wilcoxon符號(hào)秩檢驗(yàn)舉例 要檢驗(yàn)一種新的訓(xùn)練方法是否對(duì)提高跳遠(yuǎn)運(yùn)動(dòng)員的成績(jī)有顯著效果,可以收集一批跳遠(yuǎn)運(yùn)動(dòng)員在使用新訓(xùn)練方法前后的跳遠(yuǎn)最好成績(jī),這樣的兩組樣本便是配對(duì)的 分析不同廣告形式是否對(duì)商品的銷售產(chǎn)生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數(shù)據(jù)(其他條件保持基本穩(wěn)定)。這里不同廣告形式下的若干組商品銷售額樣本便是配對(duì)樣本。 配對(duì)樣本的樣本量相同,且各樣本值的先后次序不能隨意更改變化顯著性檢驗(yàn)(McNemar) 將研究對(duì)象作
42、為自身的對(duì)照者檢驗(yàn)其“前后”的變化是否顯著 McNemar檢驗(yàn)是基于列聯(lián)表進(jìn)行分析的 關(guān)心的對(duì)象是發(fā)生變化的兩個(gè)單元格中頻數(shù)變化。發(fā)生變化的兩格中,如果頻數(shù)變化相當(dāng),則認(rèn)為無(wú)顯著變化 數(shù)據(jù)要求:只能是二分值數(shù)據(jù) 分析學(xué)生在學(xué)習(xí)“統(tǒng)計(jì)學(xué)”課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變例題學(xué)習(xí)統(tǒng)計(jì)學(xué)前和學(xué)習(xí)后的樣本是兩組配對(duì)樣本。在學(xué)習(xí)統(tǒng)計(jì)學(xué)課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)識(shí)會(huì)有下列四種情況A, B, C, D分別代表前后兩種狀態(tài)轉(zhuǎn)換的頻數(shù),它們的總和為所有樣本量如果頻數(shù)B和C大致相當(dāng),即態(tài)度從“不重要”到“重要”的人數(shù)與態(tài)度從“重要”到“不重要”的人數(shù)大致相當(dāng),那么可理解為學(xué)習(xí)前后學(xué)生對(duì)統(tǒng)計(jì)學(xué)重要
43、性的認(rèn)知總體上并沒(méi)有發(fā)生顯著的變化如果頻數(shù)B和C相差較大,即態(tài)度從“不重要”到“重要”的人數(shù)與態(tài)度從“重要”到“不重要”的人數(shù)相差較大,那么可理解為學(xué)習(xí)前后學(xué)生對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知總體上發(fā)生了顯著的變化學(xué)習(xí)后不重要(0)重要(1)學(xué)習(xí)前不重要(0)34重要(1)23檢驗(yàn)為了研究這個(gè)問(wèn)題,McNemar檢驗(yàn)采用二項(xiàng)分布檢驗(yàn)的方法,計(jì)算表中態(tài)度變化的分布是否服從概率P為0.5的二項(xiàng)分布。在小樣本下計(jì)算二項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的Z統(tǒng)計(jì)量式,它近似服從正態(tài)分布SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量和相應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為態(tài)度變化的分布與P為0.
44、5的二項(xiàng)分布存在顯著差異,即兩配對(duì)樣本所來(lái)自的兩總體的分布存在顯著差異;如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),認(rèn)為態(tài)度變化的分布與p為0.5的二項(xiàng)分布不存在顯著差異,即兩配對(duì)樣本所來(lái)自的兩總體的分布沒(méi)有顯著差異注意:兩配對(duì)樣本的McNemar檢驗(yàn)分析的是二值變量例題學(xué)習(xí)后01學(xué)習(xí)前0341233438. 05 . 05 . 062060iiiiinixiinCqpCxXP兩配對(duì)樣本的符號(hào)檢驗(yàn) 目的: 檢驗(yàn)量配對(duì)樣本所來(lái)自的總體的分布是否存在顯著差異 原假設(shè):兩配對(duì)樣本來(lái)自的量總體的分布無(wú)顯著差異 基本思路: 利用正負(fù)符號(hào)的個(gè)數(shù)實(shí)現(xiàn)檢驗(yàn) 將樣本2的各樣本值減去樣本1的各樣本值.
45、如果差值為正,則記為正號(hào);如果差值為負(fù),則記為負(fù)號(hào) 如果正負(fù)號(hào)的個(gè)數(shù)與負(fù)號(hào)的個(gè)數(shù)相當(dāng),則認(rèn)為無(wú)顯著變化.否則,認(rèn)為有顯著變化例 采用新訓(xùn)練方法前后的最好成績(jī)比較正負(fù)符號(hào)檢驗(yàn) 為了研究這個(gè)問(wèn)題,兩配對(duì)樣本的符號(hào)檢驗(yàn)采用二項(xiàng)分布檢驗(yàn)的方法,檢驗(yàn)正號(hào)個(gè)數(shù)和負(fù)號(hào)個(gè)數(shù)的分布是否服從概率P為0. 5的二項(xiàng)分布,即對(duì)正負(fù)符號(hào)變量進(jìn)行單樣本二項(xiàng)分布檢驗(yàn)。在小樣本下計(jì)算二項(xiàng)分布的精確概率,大樣本下采用修正的Z統(tǒng)計(jì)量,近似服從正態(tài)分布。 SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量和相應(yīng)的概率P-直。如果概率異值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩配對(duì)樣本所來(lái)自的兩總體的分布存在顯著差異;否則,則不能拒絕原假設(shè)0898.
46、 05 . 05 . 092090iiiiinixiinCqpCxXP兩配對(duì)樣本的Wilcoxon符號(hào)秩檢驗(yàn) 正負(fù)符號(hào)檢驗(yàn)只考慮了兩總體數(shù)據(jù)變化的性質(zhì),而沒(méi)有注意其變化的程度.符號(hào)平均秩檢驗(yàn)注意到了這點(diǎn) 基本思想: 將樣本2的各樣本值減去樣本1的各樣本值.如果差值為正,則記為正號(hào);如果差值為負(fù),則記為負(fù)號(hào) 將差值的絕對(duì)值按升序排序,并求其秩.分別計(jì)算正號(hào)秩和負(fù)號(hào)秩總和 W+W-最小為0,最大為n(n+1)/2 如果正秩和和負(fù)秩和相當(dāng),認(rèn)為正負(fù)變化程度相當(dāng),兩總體無(wú)顯著差異檢驗(yàn)統(tǒng)計(jì)量 在原假設(shè)成立的前提下,小樣本下的檢驗(yàn)統(tǒng)計(jì)量W=min(W+,W-)服從Wilcoxon符號(hào)秩分布。在大樣本下利用
47、W可構(gòu)造Z統(tǒng)計(jì)量,它近似服從正態(tài)分布: SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩配對(duì)樣本來(lái)自的兩總體的分布有顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可認(rèn)為兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異24/ ) 12)(1(4/ ) 1(nnnnnWZ例運(yùn)動(dòng)員編號(hào)運(yùn)動(dòng)員編號(hào)使用新方法前使用新方法前使用新方法后使用新方法后絕對(duì)值差絕對(duì)值差秩秩差的負(fù)號(hào)差的負(fù)號(hào)15.745.790.053+26.286.120.168-35.465.440.021-46.036.03055.395.570.189+65.775
48、.810.042+76.416.480.075+86.196.320.137+95.555.640.096+105.875.930.064+正號(hào)秩總和為36,負(fù)號(hào)秩總和為9。W檢驗(yàn)統(tǒng)計(jì)量為9兩配對(duì)樣本非參數(shù)檢驗(yàn)基本操作步驟 數(shù)據(jù)要求:兩個(gè)變量,分別存放兩組樣本的樣本值 選項(xiàng)AnalyzeNonparametric TestsRelated Samples 把變量before和after同時(shí)選入Test Pair(s) List之中 選擇一種或幾種檢驗(yàn)的方法SPSS多配對(duì)樣本非參數(shù)檢驗(yàn) 目的: 由多配對(duì)樣本數(shù)據(jù)推斷多個(gè)總體的中位數(shù)或分布是否存在顯著差異. 基本假設(shè): H0:各總體分布無(wú)顯著差異.
49、 數(shù)據(jù)要求: 多配對(duì)的樣本數(shù)據(jù). 基本內(nèi)容: Friedman檢驗(yàn)、Cochran Q檢驗(yàn)、Kendall協(xié)同系數(shù)檢驗(yàn)SPSS多配對(duì)樣本非參數(shù)檢驗(yàn) 收集乘客對(duì)多家航空公司是否滿意的數(shù)據(jù),分析航空公司的服務(wù)水平是否存在顯著差異; 收集不同促銷形式下若干種商品的銷售額數(shù)據(jù),分析比較不同促銷形式的效果; 收集多名評(píng)委對(duì)同一批歌手比賽打分的數(shù)據(jù),分析評(píng)委的打分標(biāo)準(zhǔn)是否一致,等等推廣的平均秩檢驗(yàn)(Friedman檢驗(yàn)) 將每個(gè)個(gè)案的變量值數(shù)據(jù)按升序排序,并求其秩 求各樣本的平均秩 如果平均秩相當(dāng),則認(rèn)為各總體分布無(wú)顯著差異Friedman秩和檢驗(yàn) 適用于兩個(gè)因子的各種水平的組合都僅有一個(gè)觀測(cè)值的情況 假
50、定第一個(gè)因子有b個(gè)水平(稱為處理,treatment),第二個(gè)因子有k個(gè)水平(稱為區(qū)組);因此一共有kbkb個(gè)觀測(cè)值。 這里之所以稱一個(gè)因子為處理,是因?yàn)檫@是我們想要看該因子各水平是否對(duì)試驗(yàn)結(jié)果有顯著的不同(它的各個(gè)水平的觀測(cè)值也就是多個(gè)相關(guān)樣本)。而另一個(gè)因子稱為區(qū)組,不同的區(qū)組也可能對(duì)結(jié)果有影響。例有三種肥料作為第一個(gè)因子(肥料因子)的三個(gè)水平;而四種土壤為第二個(gè)因子(土壤因子)的四個(gè)水平。感興趣于是否這三種肥料對(duì)于某作物的產(chǎn)量有區(qū)別。稱肥料因子為處理,而土壤因子為區(qū)組。數(shù)據(jù)在下表中(表中數(shù)字為相應(yīng)組合的產(chǎn)量,單位公斤) 肥料種類肥料種類肥料肥料A肥料肥料B肥料肥料C土土壤壤類類型型土壤土
51、壤1224668土壤土壤2253648土壤土壤3182120土壤土壤4111319Friedman秩和檢驗(yàn)基本思想: 無(wú)論哪個(gè)區(qū)組,每一種處理下的數(shù)據(jù)的秩在本區(qū)組內(nèi)的所有可能取值為1k中的任何一個(gè)值。如果k種處理不存在差異,那么每一種處理下的各區(qū)組的秩總和Ri(或平均秩 )應(yīng)等于其他任何一種處理下的各區(qū)組的秩總和Rj(或平均秩 )。即: 則: 總體分布不存在差異: 總體分布存在顯著差異:秩總和或平均秩差距較大iRjR)()(jiRRjiRRjiji或) 1(2)21 (21kknknRRRk21) 1(2kRknRii或Friedman秩和檢驗(yàn)為研究上述秩的差異問(wèn)題,F(xiàn)riedman檢驗(yàn)用類似
52、方差分析的方法進(jìn)行分析和構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。即如果不同處理(控制水平)下的秩(觀測(cè)值)不存在顯著差異,則由不同處理(控制水平)引起的秩的變差(組間差)應(yīng)在秩的總平均變差中占相對(duì)較小的比例Friedman統(tǒng)計(jì)量定義為大樣本下Friedman檢驗(yàn)統(tǒng)計(jì)量近似服從k-1個(gè)自由度的卡方分布個(gè)樣本的平均秩第配對(duì)樣本個(gè)數(shù)樣本數(shù),iRknkkRkknFridemanikii) 1()21() 1(12221Friedman秩和檢驗(yàn) 檢驗(yàn)實(shí)現(xiàn): 首先以行為單位將數(shù)據(jù)按升序排序,并求得各變量值在各自行中的秩 然后,分別計(jì)算各組樣本下的秩總和與平均秩為比較三種促銷形式對(duì)商品促銷的影響,收集若干種商品在不同促銷形式下的月
53、銷售額數(shù)據(jù)商品編號(hào)商品編號(hào)促銷形式促銷形式1促銷形式促銷形式2促銷形式促銷形式3112866172239865246735894522031048014461100724769196273756482132039423679674277178439656398193612601793946945222406110635558542商品編號(hào)商品編號(hào)促銷形式促銷形式1促銷形式促銷形式2促銷形式促銷形式3形式形式1的的秩秩形式形式2的的秩秩形式形式3的的秩秩112866172239865231246735894522013231048014461100722314769196273723156482
54、132039423132679674277131278439656392318193612601793312946945222406123110635558542321秩總和212514平均秩2.12.51.4多配對(duì)樣本的Cochran Q檢驗(yàn) 適用于變量值是二值變量的情況乘客號(hào)乘客號(hào)甲航空公司甲航空公司乙航空公司乙航空公司丙航空公司丙航空公司111021003100410151106110710081109000101001110012111131101411015010多配對(duì)樣本的Cochran Q檢驗(yàn)基本思想 認(rèn)為每行中取1的個(gè)數(shù)是可確定的。于是,在原假設(shè)成立的條件下,每列中出現(xiàn)1的概率是相等的,且這個(gè)概率值與各行中出現(xiàn)1的個(gè)數(shù)有關(guān) 構(gòu)造Cochran Q檢驗(yàn)統(tǒng)計(jì)量niniiikjkiijLLkGkGkkQ112121)1() 1(的個(gè)數(shù)行中取為第,的個(gè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度合作社土地入股與農(nóng)業(yè)廢棄物綜合利用合同
- 2025年度年度商品房團(tuán)購(gòu)服務(wù)協(xié)議
- 2025年度信息技術(shù)行業(yè)員工轉(zhuǎn)正合同范本
- 員工二零二五年度向公司借款合同爭(zhēng)議解決期限合同
- 2024年高端裝備制造技術(shù)與研發(fā)合作合同
- 2025年度廚師與美食餐廳老板合作經(jīng)營(yíng)協(xié)議
- 二零二五年度商鋪提前解約賠償及后續(xù)商業(yè)發(fā)展協(xié)議
- 2024版船舶改裝項(xiàng)目合作合同版B版
- 2025版高端電子產(chǎn)品全球采購(gòu)合同
- 2025年中國(guó)空調(diào)五金配件市場(chǎng)調(diào)查研究報(bào)告
- 2024午托承包合同-校園內(nèi)學(xué)生午休服務(wù)協(xié)議3篇
- 2025年醫(yī)院支部工作總結(jié)及工作計(jì)劃范文
- 茶歇合同范例
- DB37T 3329-2018 建筑陶瓷制品制造行業(yè)企業(yè)安全生產(chǎn)風(fēng)險(xiǎn)分級(jí)管控體系實(shí)施指南
- 小紅書種草營(yíng)銷師(初級(jí))認(rèn)證考試真題試題庫(kù)(含答案)
- 中學(xué)學(xué)校裝修改造工程施工組織設(shè)計(jì)方案
- 幼兒園反恐防暴技能培訓(xùn)內(nèi)容
- 2024年WPS計(jì)算機(jī)二級(jí)考試題庫(kù)350題(含答案)
- 2024年5G網(wǎng)絡(luò)覆蓋工程分包合同
- 2025屆北京市海淀區(qū)交大附中高一物理第一學(xué)期期末復(fù)習(xí)檢測(cè)試題含解析
- 護(hù)理員技能培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論