版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計學(xué)非參數(shù)檢驗演示文稿當(dāng)前第1頁\共有91頁\編于星期四\7點方法的回顧單個因素(兩水平)的作用評價:兩組比較完全隨機設(shè)計下的單因素兩組比較匹配設(shè)計的兩組比較單個因素(多水平)的作用評價:多組比較完全隨機設(shè)計下的單因素多水平比較兩個因素的分析問題無交互作用、有交互作用當(dāng)前第2頁\共有91頁\編于星期四\7點單因素兩組比較:t檢驗完全隨機兩組均數(shù)比較的t檢驗(獨立t檢驗)匹配設(shè)計下兩組均數(shù)比較的t檢驗(匹配t檢驗)單因素多組比較:方差分析完全隨機設(shè)計下的多組均數(shù)比較當(dāng)前第3頁\共有91頁\編于星期四\7點局限性t檢驗獨立t檢驗要求:正態(tài)、方差相等(或不相等)、個體獨立匹配t檢驗要求:差值正態(tài)、個體獨立方差分析單因素多水平比較方差分析要求:正態(tài)、方差相等、個體獨立當(dāng)前第4頁\共有91頁\編于星期四\7點未解決問題兩組性別結(jié)構(gòu)是否相同?療效用痊愈、顯效、有效、無效四級分類法進(jìn)行評價時,兩組或多組如何比較?如何檢驗樣本數(shù)據(jù)來自的總體服從正態(tài)分布?總體不是正態(tài)分布,小樣本情況下,如何檢驗總體的集中趨勢?有6名歌手參加比賽,4名評委進(jìn)行評判打分,推斷評委的評判標(biāo)準(zhǔn)是否一致……當(dāng)前第5頁\共有91頁\編于星期四\7點參數(shù)檢驗:樣本被視為從分布族的某個參數(shù)族抽取出來的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值推斷問題就轉(zhuǎn)化為對分布族的若干個未知參數(shù)的估計問題,用樣本對這些參數(shù)做出估計或者進(jìn)行某種形式的假設(shè)檢驗,這類推斷方法稱為參數(shù)方法。當(dāng)前第6頁\共有91頁\編于星期四\7點非參數(shù)檢驗(nonparametrictests)又稱為任意分布檢驗(distribution-freetest),它不考慮研究對象總體分布具體形式,也不對總體參數(shù)進(jìn)行統(tǒng)計推斷僅僅依賴于數(shù)據(jù)觀測值的相對大小(秩)等,而是通過檢驗樣本所代表的總體分布形式是否一致來得出統(tǒng)計結(jié)論。當(dāng)前第7頁\共有91頁\編于星期四\7點非參數(shù)統(tǒng)計的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)參數(shù);它被稱為“和分布無關(guān)”(distribution—free),是因為其推斷方法和總體分布無關(guān);不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無關(guān).當(dāng)前第8頁\共有91頁\編于星期四\7點對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。假定較少不需要對總體參數(shù)的假定與參數(shù)結(jié)果接近針對幾乎所有類型的數(shù)據(jù)形態(tài)。容易計算在計算機盛行之前就已經(jīng)發(fā)展起來。非參數(shù)檢驗的優(yōu)點當(dāng)前第9頁\共有91頁\編于星期四\7點可能會浪費一些信息特別當(dāng)數(shù)據(jù)可以使用參數(shù)模型的時候大樣本手算相當(dāng)麻煩一些表不易得到非參數(shù)檢驗的弱點當(dāng)前第10頁\共有91頁\編于星期四\7點已知總體分布類型,對未知參數(shù)進(jìn)行統(tǒng)計推斷依賴于特定分布類型,比較的是參數(shù)
參數(shù)檢驗(parametrictest)
非參數(shù)檢驗(nonparametrictest)對總體的分布類型不作嚴(yán)格要求不受分布類型的影響,比較的是總體分布位置優(yōu)點:方法簡便、易學(xué)易用,易于推廣使用、應(yīng)用范圍廣;可用于參數(shù)檢驗難以處理的資料(如等級資料,或含數(shù)值“>50mg”等
)缺點:方法比較粗糙,對于符合參數(shù)檢驗條件者,采用非參數(shù)檢驗會損失部分信息,其檢驗效能較低;樣本含量較大時,兩者結(jié)論常相同當(dāng)前第11頁\共有91頁\編于星期四\7點非參數(shù)檢驗的特點非參數(shù)檢驗不需要嚴(yán)格假設(shè)條件,因而比參數(shù)檢驗有更廣泛的適用面。非參數(shù)檢驗幾乎可以處理包括定類數(shù)據(jù)和定序數(shù)據(jù)在內(nèi)的所有類型的數(shù)據(jù),而參數(shù)檢驗通常只能用于定量數(shù)據(jù)的分析。在參數(shù)檢驗和非參數(shù)檢驗都可以使用的情況下,非參數(shù)檢驗的功效(power)要低于參數(shù)檢驗方法。當(dāng)前第12頁\共有91頁\編于星期四\7點以下情況下應(yīng)當(dāng)首選非參數(shù)方法參數(shù)檢驗中的假設(shè)條件不滿足,從而無法應(yīng)用。例如總體分布為偏態(tài)或分布形式未知,且樣本為小樣本時。檢驗中涉及的數(shù)據(jù)為定類或定序數(shù)據(jù)。所涉及的問題中并不包含參數(shù),如判斷某樣本是否來自正態(tài)分布等,判斷某樣本是否為隨機樣本。當(dāng)前第13頁\共有91頁\編于星期四\7點常用的非參數(shù)檢驗方法用于單個樣本的c2擬合優(yōu)度檢驗、K-S擬合優(yōu)度檢驗、中位數(shù)的符號檢驗用于兩個匹配樣本的Wilcoxon符號秩檢驗用于兩個獨立樣本的Wlicoxon秩和檢驗用于多個獨立樣本的Kruskal-Wallis檢驗。當(dāng)前第14頁\共有91頁\編于星期四\7點第六章非參數(shù)檢驗非參數(shù)檢驗概述非參數(shù)檢驗、特點及應(yīng)用單樣本的非參數(shù)檢驗兩個樣本和多個樣本的非參數(shù)檢驗當(dāng)前第15頁\共有91頁\編于星期四\7點單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗K-S擬合優(yōu)度檢驗中位數(shù)的符號檢驗分類數(shù)據(jù)檢驗分布對中位數(shù)的推斷當(dāng)前第16頁\共有91頁\編于星期四\7點c2統(tǒng)計量用來測定定類變量之間的相關(guān)程度c2統(tǒng)計量的分布與自由度有關(guān);c2統(tǒng)計量描述了觀察值與期望值的接近程度當(dāng)前第17頁\共有91頁\編于星期四\7點擬合優(yōu)度檢驗(goodnessoffittest)用c2統(tǒng)計量進(jìn)行統(tǒng)計顯著性檢驗的重要內(nèi)容之一;依據(jù)總體分布狀況,計算出分類變量中各類別的期望頻數(shù),與分布的觀察頻數(shù)進(jìn)行對比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異,從而達(dá)到對分類變量進(jìn)行分析的目的。當(dāng)前第18頁\共有91頁\編于星期四\7點1912年4月15日,豪華巨輪泰坦尼克號與冰山相撞沉沒。當(dāng)時船上共有2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者共718人,其中男性374人,女性344人,以顯著性水平為0.1檢驗存活狀況與性別是否有關(guān)?當(dāng)前第19頁\共有91頁\編于星期四\7點提出零假設(shè)和備擇假設(shè)H0:觀察頻數(shù)與期望頻數(shù)一致H1:觀察頻數(shù)與期望頻數(shù)不一致計算期望頻數(shù)男性的期望頻數(shù),女性為153人計量c2統(tǒng)計量查表(自由度為類別數(shù)-1)做出判斷:決絕原假設(shè),認(rèn)為存活狀況與性別顯著相關(guān)當(dāng)前第20頁\共有91頁\編于星期四\7點一種飲料的容器材料可以選擇玻璃、塑料或者金屬。為了比較消費者對包裝材料的偏好,抽樣調(diào)查了120名消費者發(fā)現(xiàn),最喜歡玻璃、塑料和金屬容器的分別有55、25和40人。根據(jù)調(diào)查結(jié)果,能否認(rèn)為消費者對3種材料的偏好程度是無差異的(顯著性水平a=0.05)?當(dāng)前第21頁\共有91頁\編于星期四\7點分析如果消費者對3種材料的偏好程度是無差異的,也就是說消費者對材料的偏好服從均勻分布,則理論上來說,調(diào)查120名消費者,偏好每種材料的人數(shù)應(yīng)該是相等的,也就是40人。各組觀測到的人數(shù)與理論人數(shù)(期望值)之間的差異應(yīng)該都是由于抽樣的隨機性造成的,因此不應(yīng)該太大。如果二者之間的差異特別大,則說明我們所作的假設(shè)(消費者對3種材料的偏好程度是無差異的)很可能不成立。當(dāng)前第22頁\共有91頁\編于星期四\7點檢驗統(tǒng)計量k是樣本分類的個數(shù),表示實際觀察到的頻數(shù),表示理論頻數(shù)。觀察頻數(shù)與期望頻數(shù)越接近,則c2值越小。根據(jù)皮爾遜定理,當(dāng)n充分大時,c2統(tǒng)計量漸近服從于k-1個自由度的c2分布。當(dāng)前第23頁\共有91頁\編于星期四\7點軟件操作:數(shù)據(jù)錄入當(dāng)前第24頁\共有91頁\編于星期四\7點軟件操作:方法設(shè)定選擇“分析”“非參數(shù)檢驗”“卡方”,在彈出的對話框中將“材料”設(shè)定為檢驗變量;單擊對話框中的“精確…”,選中彈出對話框中的“精確”,單擊“繼續(xù)”、“確定”當(dāng)前第25頁\共有91頁\編于星期四\7點軟件操作:結(jié)果分析(1)觀察數(shù)期望數(shù)殘差1.005540.015.02.002540.0-15.03.004040.0.0總數(shù)120當(dāng)前第26頁\共有91頁\編于星期四\7點軟件操作:結(jié)果分析(2)材料卡方11.250df2漸近顯著性.004精確顯著性.003點概率.000當(dāng)前第27頁\共有91頁\編于星期四\7點結(jié)果分析(3)結(jié)論:計算出的c2統(tǒng)計量的值為11.250,自由度為2,相應(yīng)的p值(漸近顯著性)為0.004,小于a=0.05。所以檢驗的結(jié)論是拒絕總體中消費者對3種材料的偏好程度無差異的零假設(shè)。當(dāng)前第28頁\共有91頁\編于星期四\7點特別說明大樣本、每個單元中的期望頻數(shù)大于等于5時可以使用c2分布。小樣本時應(yīng)該按照精確方法計算得到的p值得出結(jié)論。c2檢驗也可以按照同樣的思想對正態(tài)分布或者任何想象的其他分布進(jìn)行檢驗,但主要用于對定性變量的檢驗。另外,c2檢驗也可以用于對兩個總體分布的比較。當(dāng)前第29頁\共有91頁\編于星期四\7點單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗對定類變量用c2統(tǒng)計量進(jìn)行統(tǒng)計顯著性檢驗K-S擬合優(yōu)度檢驗中位數(shù)的符號檢驗檢驗分布當(dāng)前第30頁\共有91頁\編于星期四\7點單樣本K-S檢驗檢驗總體分布是否為理論分布(正態(tài)、Possion、均勻、指數(shù))是以兩位蘇聯(lián)數(shù)學(xué)家Kolmogorov和Smirnov命名的,全稱為Kolmogorov-Smirnov檢驗。通過對兩個分布差異的分析確定能否認(rèn)為樣本的觀察值來自所設(shè)定的理論分布總體。當(dāng)前第31頁\共有91頁\編于星期四\7點定義,顯然若對每一個x值來說,如果經(jīng)驗分布函數(shù)與特定分布函數(shù)的擬合程度很高,則有理由認(rèn)為樣本數(shù)據(jù)來自具有該理論分布的總體。檢驗統(tǒng)計量:根據(jù)檢驗統(tǒng)計量的精確分布或漸進(jìn)分布,可以計算出假設(shè)檢驗的p值,從而得出檢驗的結(jié)論。當(dāng)前第32頁\共有91頁\編于星期四\7點SPSSK-S檢驗中檢驗統(tǒng)計量Z的計算當(dāng)前第33頁\共有91頁\編于星期四\7點SPSSK-S檢驗中p值的計算當(dāng)前第34頁\共有91頁\編于星期四\7點有100名兒童每周看電視時間的數(shù)據(jù)(數(shù)據(jù)文件:電視時間.sav)。檢驗?zāi)芊裾J(rèn)為總體中兒童每周看電視的時間服從正態(tài)分布(顯著性水平a=0.05)。這里K-S檢驗的零假設(shè)和備擇假設(shè)為:H0:總體中兒童每周看電視的時間服從正態(tài)分布。H1:總體中兒童每周看電視的時間不服從正態(tài)分布。當(dāng)前第35頁\共有91頁\編于星期四\7點當(dāng)前第36頁\共有91頁\編于星期四\7點在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗”“1樣本K-S”,在彈出的對話框中將“時間”設(shè)定為檢驗變量;檢驗分布為默認(rèn)的“常規(guī)”(正態(tài)分布)。單擊“確定”當(dāng)前第37頁\共有91頁\編于星期四\7點時間N100正態(tài)參數(shù)a,,b均值27.191標(biāo)準(zhǔn)差8.3728最極端差別絕對值.096正.096負(fù)-.039Kolmogorov-SmirnovZ.960漸近顯著性(雙側(cè)).315當(dāng)前第38頁\共有91頁\編于星期四\7點檢驗結(jié)論相應(yīng)的p值(漸近顯著性)為0.315。由于0.315大于0.05,所以在5%的顯著性水平下不能拒絕原假設(shè),也就是說根據(jù)樣本數(shù)據(jù)不能認(rèn)為總體分布是非正態(tài)的。注意這里并不能得出總體服從正態(tài)分布的嚴(yán)格結(jié)論??傮w服從正態(tài)分布的結(jié)論可能犯第二類錯誤(取偽錯誤),這個概率是未知的,在有些情況下可能會很大。當(dāng)前第39頁\共有91頁\編于星期四\7點特別聲明在K-S檢驗中如果使用的是小樣本,則根據(jù)漸進(jìn)分布計算p值的誤差會增大。這時應(yīng)該通過相應(yīng)的設(shè)定要求軟件輸出精確檢驗的p值,根據(jù)精確檢驗的p值得出檢驗結(jié)論。K-S檢驗也可以用于對兩個總體分布是否一致的檢驗。當(dāng)前第40頁\共有91頁\編于星期四\7點單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗對定類變量用c2統(tǒng)計量進(jìn)行統(tǒng)計顯著性檢驗K-S擬合優(yōu)度檢驗檢驗總體分布形態(tài)中位數(shù)的符號檢驗對中位數(shù)的推斷當(dāng)前第41頁\共有91頁\編于星期四\7點單樣本中位數(shù)的檢驗秩符號檢驗Wilcoxon符號秩檢驗當(dāng)前第42頁\共有91頁\編于星期四\7點秩(rank)是指全部觀察值按某種順序排列的位序;通常是將數(shù)據(jù)按照升冪排列之后,每個觀測值的位置,秩次在一定程度上反映了等級的高低。下面一行Ri就是上面一行數(shù)據(jù)Xi的秩。當(dāng)前第43頁\共有91頁\編于星期四\7點數(shù)據(jù)中有相同的數(shù)值,稱為結(jié)。結(jié)中數(shù)字的秩為它們所占位置的平均值Xi159173178513719Ri758.518.5426310當(dāng)前第44頁\共有91頁\編于星期四\7點A組:-、、+、+、+、+、++、++、++、++、+++、+++
-±++++++++++++++++++
123456789101112
124.54.54.5
4.58.58.58.58.511.511.5平均秩次=(3+6)/2=4.5當(dāng)前第45頁\共有91頁\編于星期四\7點利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗的優(yōu)點。多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒有涉及秩的性質(zhì)。當(dāng)前第46頁\共有91頁\編于星期四\7點符號檢驗(signtest)在非正態(tài)總體小樣本的情況下,如果要對總體分布的位置進(jìn)行推斷,由于t檢驗不適用,也可使用符號檢驗的方法。在數(shù)據(jù)呈偏態(tài)分布的情況下,我們可能對總體的中位數(shù)更感興趣,希望對總體的中位數(shù)作出推斷,這時可以使用符號檢驗的方法。當(dāng)前第47頁\共有91頁\編于星期四\7點例6.3在某地區(qū)隨機調(diào)查了60個家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?當(dāng)前第48頁\共有91頁\編于星期四\7點當(dāng)前第49頁\共有91頁\編于星期四\7點符號檢驗的基本思想:每個數(shù)據(jù)都減去零假設(shè)中的中位數(shù),記錄其差值的符號。計算正、負(fù)符號的個數(shù)(差值為0的不計算在任何一個中)當(dāng)原假設(shè)為真時二者應(yīng)該很接近;若兩者相差太遠(yuǎn),就有理由拒絕原假設(shè)。當(dāng)前第50頁\共有91頁\編于星期四\7點檢驗統(tǒng)計量原假設(shè)成立時,檢驗統(tǒng)計量S服從二項分布。根據(jù)二項分布計算得到p值,從而得出檢驗的結(jié)論。當(dāng)正號和負(fù)號個數(shù)之和大于25時,可以按照正態(tài)分布進(jìn)行近似計算。當(dāng)前第51頁\共有91頁\編于星期四\7點例6.3在某地區(qū)隨機調(diào)查了60個家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?當(dāng)前第52頁\共有91頁\編于星期四\7點在SPSS中打開數(shù)據(jù)文件。為了對中位數(shù)進(jìn)行檢驗,先在SPSS中生成一個新的變量Median,取值為5000:單擊“轉(zhuǎn)換”“計算變量”,在彈出的對話框中按照圖6-3進(jìn)行設(shè)置,單擊確定。當(dāng)前第53頁\共有91頁\編于星期四\7點選擇“分析”“非參數(shù)檢驗”“2個相關(guān)樣本”,在彈出的對話框中將“Median”和“家庭月收入”設(shè)定檢驗的一對變量;選中“符號檢驗”,取消選擇“Wilcoxon”,單擊“確定”
當(dāng)前第54頁\共有91頁\編于星期四\7點當(dāng)前第55頁\共有91頁\編于星期四\7點用正態(tài)分布進(jìn)行近似計算時,Z統(tǒng)計量的值為-0.129,雙側(cè)檢驗的p值為0.897。由于p值大于0.05,檢驗的結(jié)論是不能拒絕原假設(shè),即沒有充分證據(jù)證明中位數(shù)不等于5000。當(dāng)前第56頁\共有91頁\編于星期四\7點特別聲明如果樣本量較小,則需要使用軟件輸出的精確檢驗的p值進(jìn)行推斷在小樣本時,如果要求進(jìn)行精確檢驗,SPSS會自動按照二項分布進(jìn)行概率計算。當(dāng)前第57頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗符號檢驗只用到差值的符號,而對差值數(shù)值的大小未能考慮,因而失去了部分信息。Wilcoxon符號秩檢驗既考慮差值的符號,又考慮差值的大小,因此在所需的假設(shè)條件滿足時其功效比符號檢驗高。當(dāng)前第58頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗計算差值絕對值的秩。將差值絕對值從小到大排序,其位次就是的秩(rank),等于0值不參與排序。分別計算出差值序列中正數(shù)的秩和W+以及負(fù)數(shù)的秩和W-。顯然,如果零假設(shè)成立,W+與W-應(yīng)該比較接近。如果二者過大或過小,則說明零假設(shè)不成立。將正數(shù)的秩和或者負(fù)數(shù)的秩作為檢驗統(tǒng)計量,根據(jù)其統(tǒng)計分布計算p值,從而可以得出檢驗的結(jié)論。前提假設(shè):樣本點來自連續(xù)對稱總體分布當(dāng)前第59頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗計算,將其按照大小排序,得到的秩;把的正負(fù)號加到相應(yīng)的秩上;計算計算檢驗統(tǒng)計量做出判斷,W太小時,決絕零假設(shè)當(dāng)前第60頁\共有91頁\編于星期四\7點當(dāng)前第61頁\共有91頁\編于星期四\7點第六章非參數(shù)檢驗非參數(shù)檢驗概述非參數(shù)檢驗、特點及應(yīng)用單樣本的非參數(shù)檢驗c2擬合優(yōu)度檢驗、K-S檢驗、中位數(shù)的符號檢驗及Wilcoxon符號秩檢驗兩個樣本和多個樣本的非參數(shù)檢驗當(dāng)前第62頁\共有91頁\編于星期四\7點兩個樣本和多個樣本的非參數(shù)檢驗兩個匹配樣本的Wilcoxon符號秩檢驗兩個獨立樣本的Wlicoxon秩和檢驗多個獨立樣本的Kruskal-Wallis檢驗當(dāng)前第63頁\共有91頁\編于星期四\7點匹配樣本的非參數(shù)檢驗如果t檢驗的假設(shè)條件不滿足,t檢驗就不適用了。符號檢驗和Wilcoxon符號秩檢驗都可以用做替代的檢驗方法。用樣本數(shù)據(jù)中對應(yīng)的數(shù)值相減得到新的序列:零假設(shè):差值總體的中位數(shù)=0;備擇假設(shè):差值總體的中位數(shù)≠0。當(dāng)前第64頁\共有91頁\編于星期四\7點例6.4從實施適時管理(JIT)的企業(yè)中隨機抽取10家進(jìn)行效益分析,得到它們在實施JIT前后三年的平均資產(chǎn)報酬率(數(shù)據(jù)文件:JIT管理.sav)。在5%的顯著性水平下企業(yè)在實施JIT前后的資產(chǎn)報酬率是否有顯著差異?當(dāng)前第65頁\共有91頁\編于星期四\7點當(dāng)前第66頁\共有91頁\編于星期四\7點在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗”“2個相關(guān)樣本”,在彈出的對話框中將“JIT后”和“JIT前”設(shè)定檢驗的一對變量;選中“Wilcoxon”和“符號檢驗”。由于這里樣本量很小,我們要求進(jìn)行精確檢驗:單擊對話框中的“精確…”,選中彈出對話框中的“精確”,單擊“繼續(xù)”、“確定”當(dāng)前第67頁\共有91頁\編于星期四\7點符號檢驗結(jié)果(1)NJIT前-JIT后負(fù)差分a7正差分b3結(jié)c0總數(shù)10當(dāng)前第68頁\共有91頁\編于星期四\7點符號檢驗結(jié)果(2)結(jié)論:不能拒絕零假設(shè),沒有證據(jù)表明小于企業(yè)在實施JIT前后的資產(chǎn)報酬率有顯著變化JIT前-JIT后精確顯著性(雙側(cè)).344a精確顯著性(單側(cè)).172點概率.117當(dāng)前第69頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗結(jié)果(1)N秩均值秩和JIT前-JIT后負(fù)秩7a4.3630.50正秩3b8.1724.50結(jié)0c總數(shù)10當(dāng)前第70頁\共有91頁\編于星期四\7點Wilcoxon符號秩檢驗結(jié)果(2)JIT前-JIT后Z-.307a漸近顯著性(雙側(cè)).759精確顯著性(雙側(cè)).787精確顯著性(單側(cè)).394點概率.020當(dāng)前第71頁\共有91頁\編于星期四\7點兩個獨立樣本的Wlicoxon秩和檢驗在兩個獨立樣本的t檢驗不適用時,Wlicoxon秩和檢驗可以作為一種替代的非參數(shù)檢驗方法使用。這一檢驗可以用來對兩個總體的中位數(shù)進(jìn)行檢驗。當(dāng)前第72頁\共有91頁\編于星期四\7點基本原理如果兩個總體具有相似的分布形狀,并且中位數(shù)相同,那么由m個x、n個y組成的m十n=N個觀察值可以被看作來自同一總體的一個隨機樣本。將全部x和y從小到大排序確定每個數(shù)值的秩,然后計算m個x的秩的和Wx
、n個y的秩的和Wy
。由于抽樣的隨機性,x、y應(yīng)較均勻地分布在混合排列的樣本中。如果零假設(shè)成立,在樣本量相同的情況下兩個秩和應(yīng)該比較接近;樣本量不同的情況下平均秩和的平均秩應(yīng)該比較接近。否則就說明兩個總體的中位數(shù)是不相等的。當(dāng)前第73頁\共有91頁\編于星期四\7點由于對稱性,兩個秩和Wx、Wy都可以用作Wilcoxon秩和檢驗的檢驗統(tǒng)計量。SPSS軟件中使用的是平均秩較小的一組的秩和。統(tǒng)計量W的統(tǒng)計分布可以精確推導(dǎo)出來在樣本量較大時(m和n都不小于10)可以用正態(tài)分布來進(jìn)行近似。得到p值之后,再通過比較p值和a的大小得出結(jié)論。當(dāng)前第74頁\共有91頁\編于星期四\7點相關(guān)說明由于Wilcoxon秩和檢驗與Mann和Whitney提出的U檢驗完全等價,因此這種方法也被稱為Wlicoxon-Mann-Whitney檢驗,或者M(jìn)ann-WhitneyU檢驗。在樣本量較小時,應(yīng)當(dāng)使用精確檢驗的結(jié)果嚴(yán)格來說用Wilcoxon秩和檢驗對中位數(shù)進(jìn)行假設(shè)檢驗,需要假定兩個總體分布有類似的形狀才能得出可靠的結(jié)論。當(dāng)前第75頁\共有91頁\編于星期四\7點例6.5已知某企業(yè)職工的收入調(diào)查中20名本科畢業(yè)生和15名研究生的月收入(元)(數(shù)據(jù)文件:本科研究生收入.sav),試比較本科生和研究生的收入水平(顯著性水平a=0.05)。當(dāng)前第76頁\共有91頁\編于星期四\7點分析由于收入一般是右偏分布,因此不適合用t檢驗進(jìn)行分析。我們用Wilcoxon秩和檢驗來比較兩個總體的中位數(shù)。檢驗的零假設(shè)和備擇假設(shè)如下:H0:本科和研究生月收入的中位數(shù)相等;H1:本科和研究生月收入的中位數(shù)不相等。當(dāng)前第77頁\共有91頁\編于星期四\7點在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗”“2個獨立樣本”,在彈出的對話框中將“月收入”設(shè)定為檢驗變量,“學(xué)歷”設(shè)定為分組變量,然后單擊“定義組”,按照“學(xué)歷”的取值進(jìn)行設(shè)定,然后單擊“繼續(xù)”,檢驗類型使用默認(rèn)“Mann-WhitneyU”,單擊“確定”
當(dāng)前第78頁\共有91頁\編于星期四\7點結(jié)果分析:學(xué)歷N秩均值秩和月收入本科2013.55271.00研究生1523.93359.00總數(shù)35當(dāng)前第79頁\共有91頁\編于星期四\7點根據(jù)精確檢驗的p值,在顯著性水平大于0.002時我們應(yīng)該拒絕原假設(shè),結(jié)論是本科與研究生的收入的中位數(shù)不相等。月收入Mann-WhitneyU61.000WilcoxonW271.000Z-2.967漸近顯著性(雙側(cè)).003精確顯著性[2*(單側(cè)顯著性)].002a當(dāng)前第80頁\共有91頁\編于星期四\7點多個獨立樣本的Kruskal-Wallis檢驗Kruskal-Wallis檢驗是Wlicoxon秩和檢驗的推廣,用來對多個總體的中位數(shù)進(jìn)行比較。在單因素方差分析模型不適用于所研究的問題時,Kruskal-Wallis往往是一種可以替代的非參數(shù)檢驗方法。當(dāng)前第81頁\共有91頁\編于星期四\7點基本原理Kruskal-Wallis檢驗也是根據(jù)秩和來構(gòu)造檢驗統(tǒng)計量的。將所有樣本的數(shù)據(jù)合在一起,從小到大排序得到每個數(shù)值的秩,然后計算各樣本的秩和以及平均秩。如果各組沒有顯著性差異,則各組的平均秩應(yīng)該趨于相等;如果各組的平均秩相差較大,則各組中位數(shù)有顯著性差異的可能性較大。當(dāng)前第82頁\共有91頁\編于星期四\7點檢驗統(tǒng)計量當(dāng)前第83頁\共有91頁\編于星期四\7點基本原理:當(dāng)樣本組數(shù)k,每組樣本樣本容量ni不是很小時,檢驗統(tǒng)計量H的抽樣分布近似服從自由度為k-1的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 泰康協(xié)議存款合同的稅務(wù)影響
- 股權(quán)投資對賭協(xié)議范本
- 林木選購合同
- 降水井施工勞務(wù)外包合同
- 城市綠化花卉承包合同
- 以租代售設(shè)備合同樣本
- 購銷合同中的商業(yè)秘密保護
- 食堂承包經(jīng)營合同協(xié)議
- 教育咨詢服務(wù)網(wǎng)站建設(shè)協(xié)議
- 隨身護衛(wèi)人員管理服務(wù)合同
- 吉利NPDS流程和PPAP介紹
- 專題02:名著導(dǎo)讀-2022-2023學(xué)年八年級語文下學(xué)期期中專題復(fù)習(xí)(北京專用)
- 男朋友無償贈與車輛協(xié)議書怎么寫
- 高考語文新題型+“文學(xué)短評”相關(guān)寫作(真題+技法+練習(xí))
- 汽車認(rèn)識實訓(xùn)課件
- 輪機工程材料18章總結(jié)
- 公路管理行業(yè)支撐性科研課題立項評審評分標(biāo)準(zhǔn)表
- 單招面試技巧范文
- GB/T 5195.1-2006螢石氟化鈣含量的測定
- (職高)高一語文期末測試題及答案解析
- 2023年自考傳播學(xué)概論試題及答案
評論
0/150
提交評論