一多元統(tǒng)計分析講座非參數(shù)檢驗_第1頁
一多元統(tǒng)計分析講座非參數(shù)檢驗_第2頁
一多元統(tǒng)計分析講座非參數(shù)檢驗_第3頁
一多元統(tǒng)計分析講座非參數(shù)檢驗_第4頁
一多元統(tǒng)計分析講座非參數(shù)檢驗_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一多元統(tǒng)計分析講座非參數(shù)檢驗1第一頁,共四十四頁,2022年,8月28日2第二頁,共四十四頁,2022年,8月28日非參數(shù)檢驗第三頁,共四十四頁,2022年,8月28日非參數(shù)檢驗基本原理單樣本非參數(shù)檢驗兩獨立樣本非參數(shù)檢驗多獨立樣本非參數(shù)檢驗兩相關樣本非參數(shù)檢驗多相關樣本非參數(shù)檢驗非參數(shù)檢驗SPSS實例本章內容4第四頁,共四十四頁,2022年,8月28日非參數(shù)檢驗是相對于參數(shù)檢驗而言的,是指在總體分布未知或知之甚少時,利用已知樣本數(shù)據(jù)對總體分布形態(tài)做出推斷的方法。非參數(shù)檢驗主要是利用樣本數(shù)據(jù)之間的大小比較及大小順序,對兩個或多個樣本所屬總體的分布是否相同進行檢驗,而不對總體分布的參數(shù)如平均數(shù)、標準差等進行統(tǒng)計推斷。5非參數(shù)檢驗基本原理第五頁,共四十四頁,2022年,8月28日相對于參數(shù)檢驗,非參數(shù)檢驗的優(yōu)點包括:對總體的假定相對較少,效率高,結果一般有較好的穩(wěn)定性;不僅適用于定比數(shù)據(jù)和定距數(shù)據(jù)的檢驗,還適用于定類數(shù)據(jù)和定序數(shù)據(jù)的檢驗,可以解決參數(shù)假設檢驗無法解決的定性資料的檢驗問題;思想容易理解,計算簡單,尤其適用于小樣本。6非參數(shù)檢驗基本原理第六頁,共四十四頁,2022年,8月28日非參數(shù)檢驗的缺點包括:最大的不足是沒能充分利用數(shù)據(jù)資料的全部信息;如果對總體有充分的了解且足以確定其分布類型,非參數(shù)檢驗就不如參數(shù)檢驗具有更強的針對性,有效性會差一些;目前還不能用于處理因素間的交互作用。7非參數(shù)檢驗基本原理第七頁,共四十四頁,2022年,8月28日非參數(shù)檢驗并非要取代參數(shù)檢驗,而是作為參數(shù)檢驗的一個有力的補充。與參數(shù)檢驗類似,非參數(shù)檢驗過程也是先根據(jù)問題提出原假設,然后利用統(tǒng)計學原理構造適當?shù)慕y(tǒng)計量,最后利用樣本數(shù)據(jù)計算統(tǒng)計量的概率p值,與顯著性水平進行比較,得出拒絕或者接受原假設的結論。8非參數(shù)檢驗基本原理第八頁,共四十四頁,2022年,8月28日卡方檢驗二項分布檢驗游程檢驗單樣本K-S檢驗9單樣本非參數(shù)檢驗對離散型數(shù)據(jù)樣本進行檢驗可對連續(xù)型數(shù)據(jù)樣本進行檢驗第九頁,共四十四頁,2022年,8月28日用于檢驗樣本數(shù)據(jù)是否與某種概率分布的理論數(shù)值相符合,進而推斷樣本數(shù)據(jù)是否是來自于該分布的樣本。檢驗的過程,通常是先根據(jù)以往的經驗或實際觀測數(shù)據(jù)的分布情況,推測總體服從于某種分布,分布函數(shù)為F(x),然后再利用樣本數(shù)據(jù)檢驗該總體的分布函數(shù)是否真的是F(x)??ǚ綑z驗直接檢驗的是實際頻數(shù)與指定分布的頻數(shù)是否相符。最典型的卡方檢驗統(tǒng)計量是Pearson統(tǒng)計量,其數(shù)學定義為:10卡方檢驗第十頁,共四十四頁,2022年,8月28日在進行n次相同的試驗之后,出現(xiàn)0或者1的次數(shù)可以用離散型隨機變量X表示,X值為1的概率設為p,X值為0的概率設為1-p,形成二項分布。二項分布檢驗通過樣本數(shù)據(jù)來判斷其總體是否服從概率為指定數(shù)值的二項分布。在大樣本中,采用Z檢驗統(tǒng)計量,在原假設成立的條件下,Z檢驗統(tǒng)計量近似服從正態(tài)分布,其數(shù)學定義為:11二項分布檢驗第十一頁,共四十四頁,2022年,8月28日游程檢驗的目的是檢驗取值為二分類,并且按照時間或者其他某種順序排列的數(shù)列數(shù)值是否真的隨機出現(xiàn)。在一個連續(xù)符號排列中,所謂游程就是一個具有相同符號的連續(xù)串,在它前后相接的是與其不同的符號或者完全沒有符號。12游程檢驗第十二頁,共四十四頁,2022年,8月28日設和是分別來自同總體X和Y的隨機樣本數(shù)據(jù),將這兩個樣本合在一起,并按照從小到大的順序排列,得到次序統(tǒng)計量:

。如果將次序統(tǒng)計量中來自于總體X的樣本值記為0,來自于總體Y的樣本值記為1,仍然按照原順序表示次序統(tǒng)計量,則得到了一個由0和1構成的序列。將連續(xù)出現(xiàn)0(或者連續(xù)出現(xiàn)1)的一組數(shù)分別稱為0的游程(或者1的游程),一個游程中包含0(或者1)的個數(shù)成為游程長度。13游程檢驗第十三頁,共四十四頁,2022年,8月28日在任一給定容量的樣本中,游程的總數(shù)標志著樣本是否是隨機的。如果0和1是隨機出現(xiàn)的,則出現(xiàn)連續(xù)的很多0或者連續(xù)的很多1的可能性很小,同時,0和1頻繁交叉出現(xiàn)的可能性也很小。如果游程的數(shù)目很少,就意味著樣本由于缺乏獨立性而形成了一致的趨勢或者成束結構;如果游程數(shù)目很多,則表明有系統(tǒng)的短周期波動影響觀察結果。游程檢驗是一種檢驗效能非常低的方法,它只利用了游程的數(shù)目,失去了絕大部分的信息,得出的隱性結論只供參考,如果有其它方法可供選擇的時候,一般不要選擇游程檢驗方法。14游程檢驗第十四頁,共四十四頁,2022年,8月28日K-S檢驗是柯爾莫哥洛夫-斯米爾諾夫檢驗(Kolmogorov-SmirnovTest)的簡稱。K-S檢驗就是一種可以對連續(xù)性數(shù)據(jù)進行分析的方法,可以利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布。由于卡方擬合優(yōu)度檢驗需要將樣本空間分成不相交的子集,包含了較多的主觀因素,特別是對于連續(xù)型總體,有可能會由于子集劃分的不同而導致對同一樣本得到對立的檢驗結果;而K-S檢驗方法在一定程度上克服了卡方檢驗的缺點,是比卡方檢驗更精確的一種非參數(shù)檢驗方法。15單樣本K-S檢驗第十五頁,共四十四頁,2022年,8月28日K-S檢驗是將觀測量的累積分布函數(shù)與某個確定的理論分布函數(shù)相比較,以檢驗一個樣本是否是來自于某指定分布的樣本?;舅悸肥牵悍謩e求出已知理論分布下的累積概率分布和觀察的累積概率分布,對兩者進行比較,從而確定兩種分布的最大差異點。如果樣本確實服從理論分布,那么差異值不應太高。計算各樣本觀測值在理論分布中出現(xiàn)的累計概率值

F(x)和實際累計概率值S(x),并計算實際概率值與累計概率值的差值D(x),最后求出差值序列中的最大絕對差值:16單樣本K-S檢驗第十六頁,共四十四頁,2022年,8月28日兩獨立樣本非參數(shù)檢驗是在對總體分布不太了解的情況下,通過對兩獨立樣本進行分析,推斷來自的兩個總體的分布是否存在顯著性差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下獲得的樣本。17兩獨立樣本非參數(shù)檢驗第十七頁,共四十四頁,2022年,8月28日曼-惠特尼U檢驗檢驗兩總體均值是否相等Moses極端反應檢驗檢驗是否產生極端反應K-SZ檢驗Wald-Wolfowitz游程檢驗18兩獨立樣本非參數(shù)檢驗檢驗兩總體分布是否相同第十八頁,共四十四頁,2022年,8月28日基本思路為:設兩個樣本

分別來自總體X和Y,將其觀察值

按照升序排列,如果兩樣本均值相等,則觀察值中大于觀察值

的數(shù)量與觀察值

中大于觀察值

的數(shù)量應相差不多。其原假設為:總體X和Y的均值相等。將兩樣本

混合后按升序排列,求出混合后每個數(shù)據(jù)的秩。然后分別將樣本

各個觀察值的秩相加,記為

,平均秩記為

。如果原假設成立,

相差應比較小。19曼-惠特尼U檢驗第十九頁,共四十四頁,2022年,8月28日當預期試驗條件將以一個方向影響某些受試者而以相反方向影響另一些受試者時,采用Moses極端反應檢驗。設兩個樣本

分別來自總體X和Y,其中X為實驗組,Y為對照組。Moses極端反應檢驗基本思路為:把來自兩個獨立總體的樣本的觀察值混合,然后對每個觀察值進行評分并按照升序排列,計算對照組Y的得分跨度S,如果S較大,表明存在極端反應;反之,不存在極端反應。20Moses極端反應檢驗第二十頁,共四十四頁,2022年,8月28日Kolmogorov-Smirnov雙樣本檢驗,簡稱K-SZ檢驗,其基本思路與單樣本K-S檢驗的思路基本上是一致的,差別在于K-SZ檢驗以變量值的秩作為分析對象,而不是變量值本身。操作步驟為:首先將兩組樣本混合并按升序排列;然后分別計算兩組樣本秩的累計頻數(shù)和累計頻率;最后計算兩組累計頻率的差,得到秩的差值序列并得到檢驗統(tǒng)計量D。此處統(tǒng)計量D的計算方法與單樣本K-S檢驗中統(tǒng)計量

計算方法相同,但不需要進行修正。21K-SZ檢驗第二十一頁,共四十四頁,2022年,8月28日基本思路為:設兩個樣本

分別來自總體X和Y,把來自兩獨立總體樣本的觀察值混合,給每個觀察值進行評分并按升序排列,然后確定序列中的游程數(shù)量r。當兩總體分布相同時,觀察值混合均勻,游程數(shù)量較大;如果兩總體分布不相同,觀察值混合不均勻,游程數(shù)量較小。22Wald-Wolfowitz游程檢驗第二十二頁,共四十四頁,2022年,8月28日中位數(shù)檢驗檢驗多個獨立樣本的中位數(shù)是否相同Kruskal-Wallis檢驗檢驗多個總體分布是否相同Jonckheere-Terpstra檢驗檢驗多個獨立樣本位置是否有上升趨勢23多獨立樣本非參數(shù)檢驗第二十三頁,共四十四頁,2022年,8月28日基本思路為:為檢驗k組獨立樣本指定指標的中位數(shù)是否存在差異,首先將k組獨立樣本混合在一起,求出全部樣本指定指標的公共中位數(shù),然后分別計算每組樣本指定指標大于或者小于等于公共中位數(shù)個案的數(shù)量。如果每組樣本大于或者小于等于公共中位數(shù)個案的數(shù)量基本相同,則k組樣本的中位數(shù)不存在顯著差異;反之,k組樣本的中位數(shù)存在顯著差異。24中位數(shù)檢驗第二十四頁,共四十四頁,2022年,8月28日Kruskal-Wallis檢驗是通過來自多個獨立總體樣本的觀察值,判斷其在指標p上的分布是否相同的非參數(shù)檢驗方法。基本思路為:將來自多個獨立總體的樣本在指標p上的觀察值混合,并按照升序排列,得到每個觀察值的秩,然后求秩的平均數(shù)。如果各組樣本的平均秩與混合樣本的平均秩大致相等,則認為其分布無顯著差異;反之,其分布存在顯著差異。25Kruskal-Wallis檢驗第二十五頁,共四十四頁,2022年,8月28日Jonckheere-Terpstra檢驗是通過多組獨立樣本的觀察值,判斷樣本來自的多個總體在指定指標上的觀察值是否呈現(xiàn)上升或下降趨勢的非參數(shù)檢驗方法。基本思路為:假設k組獨立樣本

在指標p上的觀察值呈現(xiàn)上升趨勢,則

在指標p上觀察值小于

在指標p上觀察值的樣本數(shù)量比較多(i<j);否則,

在指標p上觀察值小于

在指標p上觀察值的樣本數(shù)量比較少(i<j)。26Jonckheere-Terpstra檢驗第二十六頁,共四十四頁,2022年,8月28日兩相關樣本非參數(shù)檢驗是在總體分布類型未知的情況下,通過兩個相關樣本判斷它們的抽樣總體是否具有相同分布的非參數(shù)檢驗方法。兩相關樣本是指從一個對象上測得兩個或多個指標,將這些指標分別視為兩個抽樣,這時由于一個指標的抽樣會對其它指標的抽樣產生影響,這兩個抽樣就不是獨立的,而是具有相關性。27兩相關樣本非參數(shù)檢驗第二十七頁,共四十四頁,2022年,8月28日McNemar變化顯著性檢驗符號檢驗Wilcoxon符號秩檢驗28兩相關樣本非參數(shù)檢驗判斷兩個稱名量表測量指標之間是否存在顯著差異判斷兩個間隔量表或者比例量表測量指標之間是否存在顯著差異第二十八頁,共四十四頁,2022年,8月28日McNemar變化顯著性檢驗適合先后匹配性的設計,在這種設計中,每個研究對象以自身作為參照物,研究試驗前后變化的有效程度。指標的測量水平較低,只是稱名量表或者順序量表。29McNemar變化顯著性檢驗第二十九頁,共四十四頁,2022年,8月28日表中“+”和“-”表示不同的反應,試驗前后有變化的研究對象數(shù)量填在B或C格內,試驗前后沒有變化的研究對象數(shù)量填在A或D格內。30McNemar變化顯著性檢驗第三十頁,共四十四頁,2022年,8月28日基本思路:如果試驗對研究對象沒有影響,則B、C的數(shù)量應該接近其期望值

;否則B、C的數(shù)量與其期望值

存在較大差距。McNemar變化顯著性檢驗的統(tǒng)計量為

,在原假設成立時,

統(tǒng)計量近似服從自由度為1的卡方分布。

的數(shù)學定義為:31McNemar變化顯著性檢驗第三十一頁,共四十四頁,2022年,8月28日對兩個相關樣本分布是否相同進行檢驗時,如果所收集到的數(shù)據(jù)測量水平為間隔量表或者比例量表,可以使用符號檢驗方法來判斷兩個配對總體的分布是否存在顯著差異。符號檢驗的基本思路為:首先去掉觀察值相同的樣本對,再進行分析。將實驗組樣本的觀察值減去對照組樣本的觀察值,差值為正記作“+”,差值為負記作“-”,然后計算“+”和“-”的數(shù)量k和n-k

,其中n為樣本對的數(shù)量。如果兩個樣本的分布基本相同,則k和n-k基本相等;否則k和n-k差異較大。32符號檢驗第三十二頁,共四十四頁,2022年,8月28日Wilcoxon符號秩檢驗也用于判斷兩個配對總體的分布是否存在顯著差異,比符號檢驗更能充分利用樣本信息?;舅悸窞椋菏紫热サ粲^察值相同的樣本對,再進行分析。將實驗組樣本的觀察值減去對照組樣本的觀察值,差值為正記作“+”,差值為負記作“-”。然后將差值絕對值數(shù)據(jù)按照升序排列,并求出相應的秩,計算出正號秩總和

和負號秩總和

。如果

相差較小,則兩個樣本分布基本相同。33Wilcoxon符號秩檢驗第三十三頁,共四十四頁,2022年,8月28日Friedman雙向評秩方差檢驗KendallW協(xié)同系數(shù)檢驗CochranQ檢驗34多相關樣本非參數(shù)檢驗判斷多個相關指標之間是否存在顯著差異判斷多個相關指標之間是否存在一致性根據(jù)多個稱名量表測量的指標判斷其總體分布是否相同第三十四頁,共四十四頁,2022年,8月28日在對多個相關樣本分布是否相同進行檢驗時,如果收集到的數(shù)據(jù)的測量水平為順序量表、間隔量表或者比例量表,可采用Friedman雙向評秩方差檢驗方法來判斷多個相關總體分布是否存在顯著性差異。35Friedman雙向評秩方差檢驗第三十五頁,共四十四頁,2022年,8月28日基本思路為:從行出發(fā),對每個樣本的各個指標觀察值按照升序排列,計算每個樣本各個指標觀察值的秩

;

),然后計算k個指標的秩和。如果多個指標的分布沒有顯著差異,則秩和相差很小;反之,秩和存在較大差距。設

為第j個指標在所有樣本上的觀察值的秩和則

,F(xiàn)riedman雙向評秩方差檢驗統(tǒng)計量為

,其數(shù)學定義為:36Friedman雙向評秩方差檢驗第三十六頁,共四十四頁,2022年,8月28日KendallW協(xié)同系數(shù)檢驗是對樣本多個指標得分是否存在一致性進行檢驗的方法,協(xié)和系數(shù)越大,多個指標之間的一致性越強。在對多個指標之間的一致性進行判斷時,如果收集到的數(shù)據(jù)的測量水平為順序量表、間隔量表或者比例量表,可以采用KendallW協(xié)同系數(shù)檢驗。37KendallW協(xié)同系數(shù)檢驗第三十七頁,共四十四頁,2022年,8月28日38KendallW協(xié)同系數(shù)檢驗第三十八頁,共四十四頁,2022年,8月28日基本思路為:從行出發(fā),對所有樣本在每個指標上的觀察值按照升序排列,計算每個樣本在各個指標觀察值的秩

;

),然后計算各個樣本的秩和

)。如果k個指標評價的一致性最高,即完全相符時,

)應為

;否則

)應該十分接近,每個

與平均值

相差較小。KendallW協(xié)同系數(shù):39KendallW協(xié)同系數(shù)檢驗第三十九頁,共四十四頁,2022年,8月28日CochranQ檢驗是檢驗三組或三組以上的相關樣本分布是否存在顯著差異的非參數(shù)檢驗方法。當樣本觀測值的觀測水平為稱名量表或者二值順序量表時,CochranQ檢驗非常適用。40CochranQ檢驗第四十頁,共四十四頁,2022年,8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論