版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第六章SPSS的非參數(shù)檢驗第1節(jié)單樣本的非參數(shù)檢驗第2節(jié)兩獨立樣本的非參數(shù)檢驗第3節(jié)多獨立樣本的非參數(shù)檢驗第4節(jié)兩配對樣本的非參數(shù)檢驗第5節(jié)多配對樣本的非參數(shù)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計估計假設(shè)檢驗非參數(shù)檢驗參數(shù)檢驗推斷統(tǒng)計推斷統(tǒng)計是根據(jù)樣本數(shù)據(jù)推斷總體數(shù)量特征的統(tǒng)計分析方法推斷統(tǒng)計通常包括以下兩個內(nèi)容總體分布已知,根據(jù)樣本數(shù)據(jù)對總體分布的統(tǒng)計參數(shù)(如均值、方差)進(jìn)行推斷,此時采用的推斷方法稱為參數(shù)估計或者參數(shù)檢驗總體分布未知,根據(jù)樣本數(shù)據(jù)對總體的分布形式進(jìn)行推斷,此時采用的推斷方法稱為非參數(shù)檢驗非參數(shù)檢驗的概念無需假定總體分布的具體形式,僅僅依賴于數(shù)據(jù)觀測值的相對大小(秩)建立檢驗統(tǒng)計量;然后找到在零假設(shè)下這些統(tǒng)計量的分布;并且看這些統(tǒng)計量的數(shù)據(jù)是否在零假設(shè)下屬于小概率事件.這種和數(shù)據(jù)本身的具體總體分布無關(guān)進(jìn)行的檢驗都稱為非參數(shù)檢驗(nonparametrictesting)由于非參數(shù)檢驗方法在推斷過程中不涉及有關(guān)總體分布的參數(shù),因而得名為“非參數(shù)”檢驗非參數(shù)檢驗在總體分布的優(yōu)越性非參數(shù)檢驗在總體分布未知時有很大的優(yōu)越性。在分布未知時,還假定總體有諸如正態(tài)分布那樣的分布,在進(jìn)行統(tǒng)計推斷就可能產(chǎn)生錯誤,非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。但在總體分布形式已知時,非參數(shù)檢驗不如傳統(tǒng)方法效率高。這是因為非參數(shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗無法拒絕。非參數(shù)統(tǒng)計在總體未知時效率要比傳統(tǒng)方法要高,有時要高很多。是否用非參數(shù)統(tǒng)計方法,要根據(jù)對總體分布的了解程度來確定SPSS非參數(shù)檢驗在總體分布未知的情況下,利用樣本數(shù)據(jù)對總體的分布或各總體的分布特征是否有顯著差異進(jìn)行推斷SPSS中的非參數(shù)檢驗方法:單樣本非參數(shù)檢驗兩獨立樣本的非參數(shù)檢驗多獨立樣本的非參數(shù)檢驗兩配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗SPSS單樣本非參數(shù)檢驗得到一批樣本數(shù)據(jù)以后,往往希望了解樣本來自的總體的分布是否與某個已知的理論分布相吻合??梢酝ㄟ^繪制樣本數(shù)據(jù)的直方圖、P-P圖、Q-Q圖等方法作粗略判斷,還可以利用非參數(shù)檢驗的方法實現(xiàn)。SPSS單樣本非參數(shù)檢驗是對單個總體的分布形態(tài)等進(jìn)行推斷的方法。包括:總體分布的chi-square檢驗二項分布檢驗K-S檢驗變量值隨機(jī)性檢驗等總體分布的卡方(chi-square)檢驗?zāi)康模焊鶕?jù)樣本數(shù)據(jù)推斷總體的分布與某個已知分布(某一理論分布)是否有顯著差異--吻合性檢驗通常適用于對有多項分類值資料的總體分布統(tǒng)計推斷原假設(shè):樣本來自的總體分布與期望分布或某一理論分布無顯著差異總體分布的卡方(chi-square)檢驗基本思想如果從一個隨機(jī)變量X中隨機(jī)抽取若干個觀察樣本,這些觀察樣本落在X的k個互不相交的子集中的觀察頻數(shù)服從一個多項分布,這個多項分布當(dāng)k趨于無窮時近似服從卡方分布?;谶@一思想,對變量X總體分布的檢驗就可從對各個觀察頻數(shù)的分析入手在原假設(shè)成立的條件下,如果變量值落在第i子集中的理論概率值為Pi,則相應(yīng)的期望頻數(shù)便為npi。由此計算出的期望頻數(shù)分布代表了原假設(shè)成立時的理論分布。為檢驗實際分布是否與理論分布(期望分布)一致,可采用卡方檢驗統(tǒng)計量總體分布的卡方(chi-square)檢驗卡方統(tǒng)計量:Pearson卡方
k為子集個數(shù);服從k-1個自由度的卡方分布如果卡方值較大,說明觀測頻數(shù)分布與期望頻數(shù)分布差距較大如果卡方值較小,則說明觀測頻數(shù)分布與期望頻數(shù)分布較接近如果p大于ɑ,不能拒絕H0,認(rèn)為總體分布與已知分布無顯著差異.反之,則應(yīng)拒絕原假設(shè)總體分布的chi-square檢驗基本操作步驟數(shù)據(jù)要求:原始數(shù)據(jù)(1個變量)或加權(quán)后的頻數(shù)數(shù)據(jù)(2個變量)菜單:analyze->Nonparametrictest->chisquare待檢驗變量待檢驗個案的取值范圍全部樣本用戶自定義:只有在該取值范圍內(nèi)的觀測數(shù)據(jù)才參與分析指定期望頻數(shù)所有子集頻數(shù)都相同--均勻分布用戶自定義依次輸入例題6.1醫(yī)學(xué)家在研究心臟病人猝死人數(shù)與日期的關(guān)系時發(fā)現(xiàn):一周之中,星期一心臟病人猝死者比較多,其他日子則基本相當(dāng)。各天的比例近似為2.8:1:1:1:1:1:1?,F(xiàn)收集到心臟病人死亡日期的樣本數(shù)據(jù),推斷其總體分布是否與上述理論分布相吻合?!靶呐K病猝死.sav”二項分布檢驗基本思想在現(xiàn)實生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分成男性和女性,產(chǎn)品可以分成合格和不合格,投擲硬幣實驗的結(jié)果可以分成出現(xiàn)正面和反面等。通常將這樣的二值分別用1和0表示如果進(jìn)行n次相同的實驗,則出現(xiàn)兩類(1或0)的次數(shù)可以用離散型隨機(jī)變量來描述。如果隨機(jī)變量值為1代表·“成功”,其概率設(shè)為p,則隨機(jī)變量值為0的概率q便等于1-p,則成功次數(shù)變量X的分布為二項分布二項分布檢驗SPSS的二項分布檢驗:通過樣本數(shù)據(jù)檢驗樣本來自的總體是否服從指定的概率為p的二項分布原假設(shè):樣本來自的總體與指定的二項分布無顯著差異二項分布檢驗SPSS二項分布檢驗在小樣本中采用精確檢驗方法大樣本則采用近似檢驗方法精確檢驗方法:計算n次試驗中某類出現(xiàn)的次數(shù)小于等于x次的概率,即二項分布檢驗近似檢驗方法采用Z檢驗統(tǒng)計量,在原假設(shè)成立下Z統(tǒng)計量近似服從正態(tài)分布,其數(shù)學(xué)定義為
式中進(jìn)行了連續(xù)性修正,當(dāng)x小于n/2時加0.5,當(dāng)x大于n/2時減0.5SPSS自動計算上述精確概率和近似概率值。如果概率值小于顯著性水平α.則拒絕原假設(shè),認(rèn)為樣本來自的總體與指定的二項分布有顯著差異;如果概率值大于顯著性水平a,則不能拒絕原假設(shè),認(rèn)為樣本來自的總體與指定的二項分布無顯著差異二項分布基本操作步驟選擇菜單:Analyze→NonparametricTests→Binomial待檢驗變量指定分類方式檢驗變量為二值變量檢驗變量不是二值變量輸人具體數(shù)值,小于等于該值的觀察值為第一組,大于該值的觀察值為第二組檢驗概率值p例題6.2從某批產(chǎn)品中隨機(jī)抽取23個樣品進(jìn)行檢測并得到檢測結(jié)果數(shù)據(jù)。用1表示一級品,用0表示非一級品。根據(jù)抽樣結(jié)果驗證該品產(chǎn)品的一級品率是否為90%?!爱a(chǎn)品合格率.sav”SPSS單樣本的K-S檢驗K-S檢驗是以俄羅斯數(shù)學(xué)家柯爾莫哥和斯米諾夫(Kolmogorov-Smirnov)的名字命名的一種非參數(shù)檢驗方法利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗方法適用于探索連續(xù)型隨機(jī)變量的分布正態(tài)分布,Poisson分布,均勻分布和指數(shù)分布例如收集一批周歲兒童身高的樣本數(shù)據(jù),需利用樣本數(shù)據(jù)推斷周歲兒童總體的身高是否服從正態(tài)分布利用收集的住房狀況調(diào)查的樣本數(shù)據(jù),分析家庭人均住房面積是否服從正態(tài)分布SPSS單樣本的K-S檢驗基本思路:在原假設(shè)成立的前提下,根據(jù)用戶指定檢驗的總體分布,構(gòu)造出一理論的頻數(shù)分布,計算各樣本觀測值在理論分布中出現(xiàn)的累計概率值F(x)計算各樣本觀測值的實際累計概率值S(x)計算實際累計概率值與理論累計概率值的差D(x)計算差值序列中的最大絕對差值,即實際累積概率為離散值,因此修正為:如果相差較小,則認(rèn)為樣本所代表的總體符合指定的總體分布SPSS單樣本的K-S檢驗在小樣本下,原假設(shè)成立時,D統(tǒng)計量服從Kolmogorov分布在大樣本下,原假設(shè)成立時,
近似服從K(x)分布:當(dāng)D小于0時,K(x)為0當(dāng)D大于0時,如果樣本總體的分布與理論分布的差異不明顯,那么D不應(yīng)較大。如果D統(tǒng)計量的概率P值小于顯著性水平α,則應(yīng)拒絕原假設(shè),認(rèn)為樣本來自的總體與指定的分布有顯著差異。反之。在SPSS中,僅給出大樣本下的和對應(yīng)的概率p值SPSS的單樣本K-S檢驗基本步驟菜單選項:analyze->nonparametrictests->1-samplek-s待檢驗變量指定檢驗的分布名稱:normal:正態(tài)分布uniform:均勻分布possion:泊松分布exponential:指數(shù)分布Exact:精確方法MonteCarlo:MonteCarlo抽樣方法Asymptoticonly:用于大樣本的漸近方法SPSS的單樣本K-S檢驗經(jīng)常有人在Kolmogorov-Smirnov檢驗中,當(dāng)檢驗不能拒絕總體分布為某分布時,來“接受”或“證明”該樣本來自該分布。這是錯誤的。比如我們有由1、2、3、4、5五個數(shù)目組成的數(shù)據(jù),我們分別檢驗該數(shù)據(jù)是否是正態(tài)分布、均勻分布、Poisson分布或指數(shù)分布。結(jié)果歸納為下表Kolmogorov-Smirnov單樣本分布檢驗 零假設(shè)的分布 (漸近雙邊檢驗的)p-值 正態(tài)分布 1.000 均勻分布 0.988 Poisson分布 1.000指數(shù)分布 0.806 根據(jù)此表,沒有足夠證據(jù)來拒絕任何一個零假設(shè)。難道我們可以隨意“接受”該總體為其中任一個分布嗎?
例題6.3收集到21名周歲兒童身高的樣本數(shù)據(jù),分析周歲兒童身高的總體是否服從正態(tài)分布“兒童身高.sav”概率P值大于顯著性水平,因此不能拒絕原假設(shè),可以認(rèn)為周歲兒童身高的總體分布與正態(tài)分布無顯著差異變量值的隨機(jī)性檢驗?zāi)康睦脴颖緮?shù)據(jù)對總體可能出現(xiàn)的變量值是否隨機(jī)進(jìn)行檢驗投硬幣:以1表示出現(xiàn)的是正面,以0表示出現(xiàn)的是反面。在進(jìn)行了若干次投幣后,將會得到一個以1、0組成的變量值序列。這時可能會分析“硬幣出現(xiàn)正反面是否是隨機(jī)的”這樣的問題基本假設(shè):H0:總體可能出現(xiàn)的變量值是隨機(jī)的SPSS的單樣本隨機(jī)性檢驗基本方法觀察樣本序列出現(xiàn)了多少游程(run).游程:樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù).一般出現(xiàn)太多或太少的游程表示變量值序列有一定的非隨機(jī)性其中相同的0(或相同的1)在一起稱為一個游程(單獨的0或1也算)4個0組成的游程和3個1組成的游程。一共是R=7個游程。其中0的個數(shù)為m=15,而1的個數(shù)為n=100000111111001011100000000游程檢驗的分布利用游程數(shù)構(gòu)造檢驗統(tǒng)計量,把游程出現(xiàn)0和1的的這樣一個過程可以看成是參數(shù)為某未知p的Bernoulli試驗。但在給定了m和n之后,在0和1的出現(xiàn)是隨機(jī)的零假設(shè)之下,R的條件分布就和這個參數(shù)無關(guān)了。根據(jù)初等概率論,R的分布可以寫成(令N=m+n)游程檢驗的近似分布在大樣本下,游程近似服從正態(tài)分布。R為游程數(shù)SPSS將自動計算Z統(tǒng)計量,并依據(jù)正態(tài)分布表給出對應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為變量值的出現(xiàn)不是隨機(jī)的;如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為變量值的出現(xiàn)是隨機(jī)的SPSS的單樣本隨機(jī)性檢驗基本操作步驟菜單選項:analyze->nonparametrictest->runs待檢驗變量指定如何計算游程:median:以中位數(shù)為界線mode:以眾數(shù)為界線mean:以均值為分界線custom:以用戶指定值為界線小于界線值的為一類;大于等于界線值的為另一類例題6.4為檢驗?zāi)衬蛪涸O(shè)備在某段時間內(nèi)工作是否持續(xù)正常,測試并記錄下該時間段內(nèi)各個時間點上的設(shè)備耐壓的數(shù)據(jù)?,F(xiàn)采用游程檢驗方法對這批數(shù)據(jù)進(jìn)行分析。如果耐壓數(shù)據(jù)的變動是隨機(jī)的,可認(rèn)為該設(shè)備工作一直正常,否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象?!半娎|數(shù)據(jù).sav”SPSS兩獨立樣本非參數(shù)檢驗?zāi)康挠瑟毩颖緮?shù)據(jù)推斷兩總體的分布是否存在顯著差異(或兩樣本是否來自同一總體)。獨立樣本:在一個總體中隨機(jī)抽樣對在另一個總體中隨機(jī)抽樣沒有影響的情況下所獲得的樣本基本假設(shè)H0:兩總體分布無顯著差異(兩樣本來自同一總體)數(shù)據(jù)要求樣本數(shù)據(jù)和分組標(biāo)志基本內(nèi)容曼--惠特尼U檢驗、K-S檢驗、W-W游程檢驗、極端反應(yīng)檢驗秩(rank)
非參數(shù)檢驗中秩是最常使用的概念。秩就是該數(shù)據(jù)按照升冪排列之后,每個觀測值的位置或名次。變量值有幾個,對應(yīng)的秩便有幾個。例如我們有下面數(shù)據(jù):下面一行(記為Ri)是上面一行數(shù)據(jù)Xi的秩。利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗的優(yōu)點曼-惠特尼U檢驗(Mann-WhitneyU)通過對兩組樣本平均秩的研究來進(jìn)行推斷將兩樣本數(shù)據(jù)混合并按升序排序求出其秩對兩樣本的秩分別求平均如果兩樣本的平均秩大致相同,則認(rèn)為兩總體分布無顯著差異。如果兩個平均秩相差甚遠(yuǎn),則應(yīng)是一組樣本的秩普遍偏小,另一組樣本的秩普遍偏大的結(jié)果,也就是一組樣本的值普遍偏小,另一組樣本的值普遍偏大的結(jié)果。此時原假設(shè)很可能是不成立的Wilcoxon(Mann-Whitney)秩和檢驗曼一惠特尼U檢驗常用Wilcoxon(或稱Mann-Whitney)秩和W檢驗,其原理是假定兩個個樣本X和Y分別有m個和n個觀測值。把兩個樣本混合后把這m+n個觀測值升冪排序,記下每個觀測值在混合排序下面的秩。之后分別把兩個樣本所得到的秩相加。記第一個樣本觀測值的秩的和為WX而第二個樣本秩的和為WY。這兩個值可以互相推算,稱為Wilcoxon統(tǒng)計量。WilcoxonW為:如果m<n,則WilcoxonW=WY;如果m>n,則WilcoxonW=Wx;曼—惠特尼U統(tǒng)計量的計算公式為式中,W值即為WilcoxonW;k為W對應(yīng)樣本組的樣本量Wilcoxon(Mann-Whitney)秩和檢驗在小樣本下,U統(tǒng)計量服從曼-惠特尼分布。SPSS自動計算出U統(tǒng)計量的觀測值和概率P-值。在大樣本下,U統(tǒng)計量近似服從正態(tài)分布,計算公式為該統(tǒng)計量的分布和兩個總體分布無關(guān)。由此分布SPSS將自動計算Z統(tǒng)計量和對應(yīng)的p-值。直觀上看,如果WX與WY之中有一個顯著地大,則可以選擇拒絕零假設(shè)。在小樣本下,依據(jù)U統(tǒng)計量的概率P-值進(jìn)行決策;而在大樣本下,則依據(jù)Z統(tǒng)計量的概率P-值進(jìn)行決策例題6.5某工廠用甲乙兩種不同的工藝生產(chǎn)同一種產(chǎn)品,如果希望檢驗兩種工藝下產(chǎn)品的使用壽命是否存在差異,可以從兩種工藝生產(chǎn)出的產(chǎn)品中隨機(jī)抽樣,得到各自的使用壽命數(shù)據(jù)?!笆褂脡勖?sav”兩獨立樣本分布的K-S檢驗原假設(shè)兩組獨立樣本來自的兩總體的分布無顯著差異基本思想與單樣本K-S檢驗的基本思想大體一致主要差別:這里是以變量值的秩作為分析對象,而非變量值本身首先,將兩組樣本混合并按升序排序然后,分別計算兩組樣本秩的累計頻數(shù)和累計頻率最后,計算兩組累計頻率的差,得到秩的差值序列并得到D統(tǒng)計量如果差距較小,則認(rèn)為兩總體分布無顯著差異兩獨立樣本分布的K-S檢驗假定兩個樣本的樣本量分別為n1和n2,用S1(X)和S2(X)分別表示兩個樣本的累積經(jīng)驗分布函數(shù)。再記Dj=S1(Xj)-S2(Xj)。近似正態(tài)分布的檢驗統(tǒng)計量為SPSS中將自動計算在大樣本下的Z的觀測值和概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩總體的分布有顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為兩總體的分布無顯著差異兩樣本W(wǎng)ald-Wolfowitz游程檢驗不同于單樣本游程檢驗,兩獨立樣本的游程檢驗用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異。原假設(shè):兩組獨立樣本來自的兩總體的分布無顯著差異。兩獨立樣本的游程檢驗(Wald-Wolfowitzrunstest)和單樣本游程檢驗基本思想基本相同。不同的是計算游程數(shù)的方法。兩獨立樣本的游程檢驗中,游程數(shù)依賴于變量的秩。兩獨立樣本游程檢驗首先,把兩個樣本混合,按照大小次序排列,對應(yīng)的組標(biāo)記值也會隨之重新排列,同樣本的組標(biāo)記值在一起的為一個游程。然后,計算分組標(biāo)志序列的游程數(shù)如果兩總體的分布存在較大差距,那么游程數(shù)會相對比較少如果游程數(shù)比較大,則應(yīng)是兩組樣本值充分混合的結(jié)果,兩總體的分布不會存在顯著差異最后,根據(jù)游程數(shù)據(jù)計算Z統(tǒng)計量,該統(tǒng)計量近似服從正態(tài)分布。SPSS將自動計算Z統(tǒng)計量的觀測值和對應(yīng)的概率P_值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩總體的分布存在顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為兩總體的分布無顯著差異R=6兩獨立樣本的極端反應(yīng)檢驗原假設(shè):兩獨立樣本來自的兩個總體的分布無顯著差異?;舅枷?將一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對于控制樣本是否出現(xiàn)了極端反應(yīng)。如果實驗樣本沒有出現(xiàn)極端反應(yīng),則認(rèn)為兩總體的分布無顯著差異如果實驗樣本存在極端反應(yīng),則認(rèn)為兩總體的分布存在顯著差異兩獨立樣本的極端反應(yīng)檢驗分析過程將兩組樣本混合按升序排序;然后,求出控制樣本的最小秩Qmin和最大秩Qmax,并計算出跨度(Span)為消除樣本數(shù)據(jù)中極端值對分析結(jié)果的影響,在計算跨度之前可按比例(通常為5%)去除控制樣本中部分靠近兩端的樣本值,然后再求跨度,得到截頭跨度如果跨度或截頭跨度較小,則是兩組樣本數(shù)據(jù)無法充分混合,一組樣本值顯著大于另一組樣本值的結(jié)果,則認(rèn)為相對控制樣本,實驗樣本出現(xiàn)了極端反應(yīng),樣本來自的兩總體的分布存在顯著差異如果跨度或截頭跨度較大,則應(yīng)是兩組樣本數(shù)據(jù)充分混合,一組樣本值沒有顯著大于另一組樣本值的結(jié)果,則認(rèn)為相對控制樣本,實驗樣本沒有出現(xiàn)極端反應(yīng),樣本來自的兩總體的分布沒有顯著差異極端反應(yīng)檢驗統(tǒng)計量針對跨度或截頭跨度計算H檢驗統(tǒng)計量m為控制樣本的樣本量;Qi為控制樣本在混合樣本中的秩;
為控制樣本的平均秩小樣本下,H統(tǒng)計量服從Hollander分布;大樣本下,H統(tǒng)計量近似服從正態(tài)分布SPSS將自動計算H統(tǒng)計量的觀測值和概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩獨立樣本來自的兩總體的分布存在顯著差異。反之跨度為:15-6+1=10截頭跨度為:13-8+1=6以樣本1為控制組SPSS兩獨立樣本非參數(shù)檢驗基本操作步驟菜單選項:analyze->nonparametrictests->2independentsample例題6.6分析兩種工藝下產(chǎn)品的使用壽命是否存在差異SPSS多獨立樣本非參數(shù)檢驗?zāi)康挠啥嘟M獨立樣本數(shù)據(jù)推斷多個總體的分布是否存在顯著差異多組獨立樣本是指按獨立抽樣方式獲得的多組樣本基本假設(shè):H0:多個總體分布無顯著差異數(shù)據(jù)要求:樣本數(shù)據(jù)和分組標(biāo)志基本內(nèi)容中位數(shù)檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗例題6.7利用“四城市兒童身高”數(shù)據(jù),對北京、上海、成都、廣州四城市的周歲兒童身高進(jìn)行比較分析,推斷四城市周歲兒童身高是否存在顯著差異中位數(shù)檢驗(median)中位數(shù)檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數(shù)是否存在顯著差異。原假設(shè)多個獨立樣本來自的多個總體的中位數(shù)無顯著差異基本思想如果多個總體的中位數(shù)無顯著差異,或者說多個總體有共同的中位數(shù),那么這個共同的中位數(shù)應(yīng)在各樣本組中均處在中間位置上。于是,每組樣本中大于該中位數(shù)與小于該中位數(shù)的樣本量應(yīng)大致相同中位數(shù)檢驗(median)基本步驟將多組樣本混合按升序排序,并求出混合樣本的中位數(shù)分別計算各組樣本中大于和小于上述中位數(shù)的樣本量,形成列聯(lián)表利用卡方檢驗方法分析各組樣本來自的總體對于上述中位數(shù)的分布是否一致中位數(shù)檢驗(median)如果各組中大于(或小于)上述中位數(shù)的樣本比例大致相同,則可以認(rèn)為多組樣本有共同的中位數(shù),它們來自的總體的中位數(shù)無顯著差異反之,如果各組中大于(或小于)上述中位數(shù)的樣本比例相差較大,則可以認(rèn)為多組樣本的中位數(shù)不全部相同,它們來自的總體的中位數(shù)存在顯著差異假定有k個總體,ni為第i個樣本量;把所有樣本量之和記為N先把從這個k個總體來的樣本混合起來排序,找出它們的中位數(shù)計算每個總體中小于該中位數(shù)的觀測值個數(shù)O1j,j=1,…,k,和每個總體中大于該中位數(shù)的觀測值個數(shù)O2j,j=1,…,k。這樣就形成了一個由元素Oij組成的2×k表。其列總和為ni,j=1,…,k;而兩個行總和為各樣本小于總中位數(shù)的觀測值總和:R1=O11+O12+…+O1k及各樣本大于總中位數(shù)的觀測值總和R2=O21+O22+…+O2k列聯(lián)表,可以用Pearsonc2統(tǒng)計量卡方統(tǒng)計量服從((2-1)X(n-1)個自由度的卡方分布中位數(shù)檢驗的計算示例對樣本數(shù)據(jù)混合排序后,得到共同的中位數(shù)為74k-w檢驗(推廣的平均秩檢驗)多獨立樣本的Kruskal-Wallis檢驗的實質(zhì)是兩獨立樣本的曼-惠特尼U檢驗在多個獨立樣本下的推廣,用于檢驗多個總體的分布是否存在顯著差異原假設(shè):多個獨立樣本來自的多個總體的分布無顯著差異基本思想首先,將多組樣本數(shù)據(jù)混合并按升序排序,求出各變量值的秩;然后,考察各組秩的均值是否存在顯著差異如果各組秩的均值不存在顯著差異,則是多組數(shù)據(jù)充分混合,數(shù)值相差不大的結(jié)果,可以認(rèn)為多個總體的分布無顯著差異;如果各組秩的均值存在顯著差異,則是多組數(shù)據(jù)無法混合,某些組的數(shù)值普遍偏大,另一些組的數(shù)值普遍偏小的結(jié)果,可以認(rèn)為多個總體的分布有顯著差異Kruskal-Wallis關(guān)于多個樣本的秩和檢驗
目的是檢驗多總體位置參數(shù)是否一樣。方法和Wilcoxon-Mann-Whitney檢驗的思想類似為研究各組秩的差異,可借鑒方差分析方法總變差=組間差+組內(nèi)差如果各樣本組秩的總變差的大部分可由組間差解釋,則表明各樣本組的總體分布存在顯著差異;反之,如果各樣本組秩的總變差的大部分不能由組間差解釋,則表明各樣本組的總體分布沒有顯著差異構(gòu)造K-W檢驗統(tǒng)計量Kruskal-Wallis多個樣本的秩和檢驗假定有k個總體。先把從這個k個總體來的樣本混合起來排序,記各個總體觀測值的秩之和為Ri,i=1,…,k。顯然如果這些Ri很不相同,就可以認(rèn)為它們位置參數(shù)相同的零假設(shè)不妥(備選假設(shè)為各個位置參數(shù)不全相等)Kruskal-Wallis檢驗統(tǒng)計量公式中表示樣本組數(shù);ni為第i組的樣本量,而N為各個樣本量之和(總樣本量)。這個統(tǒng)計量在位置參數(shù)相同的零假設(shè)下有漸近的自由度為k-1的χ2分布Kruskal-Wallis檢驗的計算示例有一些秩出現(xiàn)了“打結(jié)”。對此SPSS中通常以平均秩來處理北京、上海、成都、廣州的平均秩:14.4,8.2,15.8,3.6Jonckheere-Terpstra多樣本的秩檢驗Jonckheere-Terpstra檢驗先在每兩個樣本所有觀測值對之間比較,計算第i個樣本觀測值中小于第j個樣本觀測值的對子數(shù)Uij上式表明,J-T統(tǒng)計量是所有Uij在i<j組范圍內(nèi)的總和,稱為觀測的J-T統(tǒng)計量,在大樣本下近似服從正態(tài)分布J-T統(tǒng)計量計算J-T統(tǒng)計量時會涉及樣本標(biāo)記值的大小順序。例如,如果有三組樣本,樣本標(biāo)記值分別為1,2,3,則觀測的J-T統(tǒng)計量為:第1組樣本觀察值小于第2組樣本觀察值的個數(shù)+第1組樣本觀察值小于第3組樣本觀察值的個數(shù)+第2組樣本觀察值小于第3組樣本觀察值的個數(shù)除計算觀測的J-T統(tǒng)計量,通常還將計算所有情況下的J-T統(tǒng)計量。例如,如果仍有1,2,3三組樣本,除了按照(l,2,3)的順序計算J-T值,還要按照(1,3,2),(2,1,3),(2.3,1),(3,1,2),(3,2,1)的順序計算所有的J-T值,并計算這些J-T值的均值和標(biāo)準(zhǔn)差等如果觀測的J-T統(tǒng)計量遠(yuǎn)大于或遠(yuǎn)小于J-T均值,那么可以認(rèn)為,按照樣本標(biāo)記值的升序,樣本數(shù)據(jù)有明顯的上升或下降趨勢,從而能夠判定樣本來自的多個總體的分布存在顯著差異檢驗統(tǒng)計量在大樣本下,J-T統(tǒng)計量近似服從正態(tài)分布式中,J為觀測的J-T統(tǒng)計量;k為樣本組數(shù);ni為第i組樣本的樣本量SPSS將自動計算J-T統(tǒng)計量、Z統(tǒng)計量和相應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為多個獨立樣本來自的多個總體的分布存在顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),認(rèn)為多個獨立樣本來自的多個總體的分布不存在顯著差異Jonckheere-Terpstra檢驗的計算示例“打結(jié)”的情況計為0.5,觀測的J-T值為45.5,所有排列下的J-T平均值為75SPSS軟件使用說明
數(shù)據(jù)要求:Analyze-NonparametricTests-KIndependentSamplesSPSS兩配對樣本非參數(shù)檢驗含義由配對樣本數(shù)據(jù)推斷兩總體分布是否存在顯著差異基本假設(shè)H0:兩配對樣本來自的兩總體分布無顯著差異數(shù)據(jù)要求配對樣本的樣本量是相同的,且各樣本值的先后次序是不能隨意更改的基本方法McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗舉例要檢驗一種新的訓(xùn)練方法是否對提高跳遠(yuǎn)運動員的成績有顯著效果,可以收集一批跳遠(yuǎn)運動員在使用新訓(xùn)練方法前后的跳遠(yuǎn)最好成績,這樣的兩組樣本便是配對的分析不同廣告形式是否對商品的銷售產(chǎn)生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數(shù)據(jù)(其他條件保持基本穩(wěn)定)。這里不同廣告形式下的若干組商品銷售額樣本便是配對樣本。配對樣本的樣本量相同,且各樣本值的先后次序不能隨意更改變化顯著性檢驗(McNemar)將研究對象作為自身的對照者檢驗其“前后”的變化是否顯著McNemar檢驗是基于列聯(lián)表進(jìn)行分析的關(guān)心的對象是發(fā)生變化的兩個單元格中頻數(shù)變化。發(fā)生變化的兩格中,如果頻數(shù)變化相當(dāng),則認(rèn)為無顯著變化數(shù)據(jù)要求:只能是二分值數(shù)據(jù)分析學(xué)生在學(xué)習(xí)“統(tǒng)計學(xué)”課程前后對統(tǒng)計學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變例題學(xué)習(xí)統(tǒng)計學(xué)前和學(xué)習(xí)后的樣本是兩組配對樣本。在學(xué)習(xí)統(tǒng)計學(xué)課程前后對統(tǒng)計學(xué)重要性的認(rèn)識會有下列四種情況A,B,C,D分別代表前后兩種狀態(tài)轉(zhuǎn)換的頻數(shù),它們的總和為所有樣本量如果頻數(shù)B和C大致相當(dāng),即態(tài)度從“不重要”到“重要”的人數(shù)與態(tài)度從“重要”到“不重要”的人數(shù)大致相當(dāng),那么可理解為學(xué)習(xí)前后學(xué)生對統(tǒng)計學(xué)重要性的認(rèn)知總體上并沒有發(fā)生顯著的變化如果頻數(shù)B和C相差較大,即態(tài)度從“不重要”到“重要”的人數(shù)與態(tài)度從“重要”到“不重要”的人數(shù)相差較大,那么可理解為學(xué)習(xí)前后學(xué)生對統(tǒng)計學(xué)重要性的認(rèn)知總體上發(fā)生了顯著的變化檢驗為了研究這個問題,McNemar檢驗采用二項分布檢驗的方法,計算表中態(tài)度變化的分布是否服從概率P為0.5的二項分布。在小樣本下計算二項分布的累計精確概率,大樣本下采用修正的Z統(tǒng)計量式,它近似服從正態(tài)分布SPSS將自動計算Z統(tǒng)計量和相應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為態(tài)度變化的分布與P為0.5的二項分布存在顯著差異,即兩配對樣本所來自的兩總體的分布存在顯著差異;如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),認(rèn)為態(tài)度變化的分布與p為0.5的二項分布不存在顯著差異,即兩配對樣本所來自的兩總體的分布沒有顯著差異注意:兩配對樣本的McNemar檢驗分析的是二值變量例題兩配對樣本的符號檢驗?zāi)康模簷z驗量配對樣本所來自的總體的分布是否存在顯著差異原假
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度股權(quán)質(zhì)押資產(chǎn)重組合同示范文本3篇
- 二零二五年度鋼材倉儲物流服務(wù)合同9篇
- 二零二五年度路燈照明設(shè)施安全檢測合同樣本2篇
- 二零二五年度:勞動合同法實務(wù)操作與案例分析合同3篇
- 二零二五年度船舶建造與設(shè)備安裝合同2篇
- 二零二五年度農(nóng)產(chǎn)品質(zhì)量檢測合同范本3篇
- 二零二五年度安置房買賣合同電子支付與結(jié)算規(guī)范3篇
- 3、2025年度綠色出行接送機(jī)服務(wù)合同范本2篇
- 二零二五年度文化創(chuàng)意產(chǎn)業(yè)合作開發(fā)合同范本3篇
- 家里陪護(hù)合同(2篇)
- 人教版小學(xué)數(shù)學(xué)(2024)一年級下冊第一單元 認(rèn)識平面圖形綜合素養(yǎng)測評 B卷(含答案)
- 企業(yè)年會攝影服務(wù)合同
- 電商運營管理制度
- 二零二五年度一手房購房協(xié)議書(共有產(chǎn)權(quán)房購房協(xié)議)3篇
- 2025年上半年上半年重慶三峽融資擔(dān)保集團(tuán)股份限公司招聘6人易考易錯模擬試題(共500題)試卷后附參考答案
- 城市公共交通運營協(xié)議
- 內(nèi)燃副司機(jī)晉升司機(jī)理論知識考試題及答案
- 2024北京東城初二(上)期末語文試卷及答案
- 2024設(shè)計院與職工勞動合同書樣本
- 2024年貴州公務(wù)員考試申論試題(B卷)
- 電工高級工練習(xí)題庫(附參考答案)
評論
0/150
提交評論