




已閱讀5頁,還剩129頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第7章SPSS的非參數(shù)檢驗(yàn) 前面已經(jīng)討論的許多統(tǒng)計(jì)分析方法對總體有特殊的要求 如T檢驗(yàn)要求總體符合正態(tài)分布 F檢驗(yàn)要求誤差呈正態(tài)分布且各組方差整齊 等等 這些方法常用來估計(jì)或檢驗(yàn)總體參數(shù) 統(tǒng)稱為參數(shù)檢驗(yàn) 但許多調(diào)查或?qū)嶒?yàn)所得的科研數(shù)據(jù) 其總體分布未知或無法確定 因?yàn)橛械臄?shù)據(jù)不是來自所假定分布的總體 或者數(shù)據(jù)根本不是來自一個(gè)總體 還有可能數(shù)據(jù)因?yàn)槟撤N原因被嚴(yán)重污染 這樣在假定分布的情況下進(jìn)行推斷的做法就有可能產(chǎn)生錯(cuò)誤的結(jié)論 此時(shí)人們希望檢驗(yàn)對一個(gè)總體分布形狀不必作限制 這種不是針對總體參數(shù) 而是針對總體的某些一般性假設(shè) 如總體分布 的統(tǒng)計(jì)分析方法稱非參數(shù)檢驗(yàn) NonparametricTests 非參數(shù)檢驗(yàn)根據(jù)樣本數(shù)目以及樣本之間的關(guān)系可以分為單樣本非參數(shù)檢驗(yàn) 兩獨(dú)立樣本非參數(shù)檢驗(yàn) 多獨(dú)立樣本非參數(shù)檢驗(yàn) 兩配對樣本非參數(shù)檢驗(yàn)和多配對樣本非參數(shù)檢驗(yàn)幾種 本節(jié)將介紹總體分布的卡方 Chi square 檢驗(yàn) 二項(xiàng)分布 Binomial 檢驗(yàn) 單樣本K S Kolmogorov Smirnov 檢驗(yàn) 單樣本變量值隨機(jī)性檢驗(yàn) RunsTest 等常用的非參數(shù)檢驗(yàn)方法 7 1單樣本的非參數(shù)檢驗(yàn) 7 1 1總體分布的卡方 Chi square 檢驗(yàn) 在得到一批樣本數(shù)據(jù)后 人們往往希望從中得到樣本所來自的總體的分布形態(tài)是否和某種特定分布相擬合 這可以通過繪制樣本數(shù)據(jù)直方圖的方法來進(jìn)行粗略的判斷 如果需要進(jìn)行比較準(zhǔn)確的判斷 則需要使用非參數(shù)檢驗(yàn)的方法 其中總體分布的卡方檢驗(yàn) 也記為 2檢驗(yàn) 就是一種比較好的方法 7 1 1 1卡方檢驗(yàn)的基本思想 定義 總體分布的卡方檢驗(yàn)適用于吻合性檢驗(yàn) 是根據(jù)樣本數(shù)據(jù)推斷總體分布與期望分布或理論分布是否有顯著差異 它的零假設(shè)H0 樣本來自的總體分布和期望分布或某一理論分布沒有顯著差異 因此 總體分布的卡方檢驗(yàn)是一種吻合性檢驗(yàn) 比較適用于一個(gè)因素的多項(xiàng)分類數(shù)據(jù)分析 總體分布的卡方檢驗(yàn)的數(shù)據(jù)是實(shí)際收集到的樣本數(shù)據(jù) 而非頻數(shù)數(shù)據(jù) 7 1 1 2總體分布卡方檢驗(yàn)的應(yīng)用舉例 研究問題為研究心臟病人猝死人數(shù)與日期的關(guān)系 收集到了168個(gè)觀察數(shù)據(jù) 其中星期一至星期日的死亡人數(shù)分別依次為55 23 18 11 26 20 15 并用數(shù)字1 7表示星期 現(xiàn)在利用這批樣本數(shù)據(jù) 推斷心臟病人猝死人數(shù)與日期的關(guān)系是否為2 8 1 1 1 1 1 1 問題 為驗(yàn)證某批產(chǎn)品的一級品率是否低于90 現(xiàn)從該批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測并得到檢測結(jié)果數(shù)據(jù) 其中1表示一級品 0表示非一級品 7 1 2二項(xiàng)分布檢驗(yàn) 7 1 2 1二項(xiàng)分布檢驗(yàn)的基本思想 現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值只有兩類 如醫(yī)學(xué)中的生與死 患病的有與無 性別中的男性和女性 產(chǎn)品的合格與不合格等 從這種二分類總體中抽取的所有可能結(jié)果 要么是對立分類中的這一類 要么是另一類 其頻數(shù)分布稱為二項(xiàng)分布 調(diào)用SPSS中的二項(xiàng)分布檢驗(yàn) Binomial 可對樣本資料進(jìn)行二項(xiàng)分布分析 SPSS二項(xiàng)分布檢驗(yàn)就是根據(jù)收集到的樣本數(shù)據(jù) 推斷總體分布是否服從某個(gè)指定的二項(xiàng)分布 其零假設(shè)是H0 樣本來自的總體與所指定的某個(gè)二項(xiàng)分布不存在顯著的差異 SPSS中的二項(xiàng)分布檢驗(yàn) 在樣本小于或等于30時(shí) 采用精確檢驗(yàn) 按照計(jì)算二項(xiàng)分布概率的公式進(jìn)行計(jì)算 計(jì)算n次試驗(yàn)中成功出現(xiàn)的次數(shù)小于等于K次的概率 樣本數(shù)大于30時(shí) 采用近似檢驗(yàn) 計(jì)算的是Z統(tǒng)計(jì)量 認(rèn)為在零假設(shè)下 Z統(tǒng)計(jì)量服從正態(tài)分布 Z統(tǒng)計(jì)量的計(jì)算公式如下 SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量 并給出相應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為樣本來自的總體分布形態(tài)與指定的二項(xiàng)分布存在顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為樣本來自的總體分布形態(tài)與指定的二項(xiàng)分布不存在顯著差異 SPSS二項(xiàng)分布檢驗(yàn)的數(shù)據(jù)是實(shí)際收集到的樣本數(shù)據(jù) 而非頻數(shù)數(shù)據(jù) 研究問題1為驗(yàn)證某批產(chǎn)品的一級品率是否低于90 現(xiàn)從該批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測并得到檢測結(jié)果數(shù)據(jù) 其中1表示一級品 0表示非一級品 7 1 2 2二項(xiàng)分布檢驗(yàn)的應(yīng)用舉例 研究問題2根據(jù)居民儲蓄 存款 的樣本數(shù)據(jù) 分析儲戶對未來收入的看法 檢驗(yàn)儲戶總體對收入持保守或悲觀態(tài)度的比例是否與0 4有顯著性差異 持樂觀態(tài)度的比例是否與0 6有顯著性差異 問題 為檢驗(yàn)?zāi)衬蛪涸O(shè)備在某段時(shí)間內(nèi)工作是否持續(xù)正常 測試并記錄下該時(shí)間段內(nèi)各個(gè)時(shí)間點(diǎn)上的設(shè)備耐壓的數(shù)據(jù) 如果耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的 可認(rèn)為該設(shè)備工作一直正常 否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象 7 1 3SPSS單樣本變量值隨機(jī)性檢驗(yàn) 7 1 3 1變量值隨機(jī)性檢驗(yàn)的基本思想 定義 單樣本變量值的隨機(jī)性檢驗(yàn)是對某變量的取值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn) 也稱為游程檢驗(yàn) Run過程 單樣本變量值的隨機(jī)性檢驗(yàn)是由Wald提出的 它的零假設(shè)為H0 總體某變量的變量值出現(xiàn)是隨機(jī)的 單樣本變量值的隨機(jī)性檢驗(yàn)通過游程 Run 數(shù)來實(shí)現(xiàn) 所謂游程是一個(gè)或一個(gè)以上相同符號連續(xù)出現(xiàn)的段 設(shè)某樣本n 12人的標(biāo)志表現(xiàn)為男 女 有以下三種排列 i 男男女女女男女女男男男 ii 男男男男男男男女女女女女 iii 男女男女男女男女男女男男請問游程數(shù)分別為多少 問28次投擲硬幣出現(xiàn)正反兩面的變量值序列為1011011010011000101010000111 游程數(shù)為多少 利用游程數(shù)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 設(shè)為出現(xiàn)1的個(gè)數(shù) 為出現(xiàn)0的個(gè)數(shù) 當(dāng)較大時(shí) 游程的抽樣分布的均值為 方差為 在大樣本時(shí) 游程近似服從正態(tài)分布 即其中為游程數(shù) 在SPSS單樣本變量值的隨機(jī)性檢驗(yàn)中 SPSS將利用游程構(gòu)造Z統(tǒng)計(jì)量 并依據(jù)正態(tài)分布表給出對應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為樣本值的出現(xiàn)不是隨機(jī)的 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為變量值的出現(xiàn)是隨機(jī)的 7 1 3 2變量值隨機(jī)性檢驗(yàn)的應(yīng)用舉例 研究問題為檢驗(yàn)?zāi)衬蛪涸O(shè)備在某段時(shí)間內(nèi)工作是否持續(xù)正常 測試并記錄下該時(shí)間段內(nèi)各個(gè)時(shí)間點(diǎn)上的設(shè)備耐壓的數(shù)據(jù) 如果耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的 可認(rèn)為該設(shè)備工作一直正常 否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象 7 1 4 1單樣本K S檢驗(yàn)的基本思想 7 1 4SPSS單樣本K S檢驗(yàn) 定義 單樣本K S檢驗(yàn)是以兩位前蘇聯(lián)數(shù)學(xué)家Kolmogorov和Smirnov命名的 也是一種擬合優(yōu)度的非參數(shù)檢驗(yàn)方法 單樣本K S檢驗(yàn)是利用樣本數(shù)據(jù)推斷樣本來自的總體是否與某一理論分布有顯著差異 適用于探索連續(xù)型隨機(jī)變量的分布 單樣本K S檢驗(yàn)可以將一個(gè)變量的實(shí)際頻數(shù)分布與正態(tài)分布 Normal 均勻分布 Uniform 指數(shù) Exponential 分布 泊松分布 Poisson 進(jìn)行比較 其零假設(shè)H0為樣本來自的總體與指定的理論分布無顯著差異 SPSS在統(tǒng)計(jì)中將計(jì)算K S的D統(tǒng)計(jì)量 并依據(jù)Kolmogorov分布表 小樣本 或K x 分布表 大樣本 給出對應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為樣本來自的總體與指定的分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為樣本來自的總體與指定的分布無顯著差異 7 1 4 2單樣本K S檢驗(yàn)的應(yīng)用舉例 研究問題1利用收集到的21名周歲兒童身高的樣本數(shù)據(jù) 利用K S方法檢驗(yàn)周歲兒童身高的總體是否與正態(tài)分布有顯著差異 研究問題2利用K S檢驗(yàn)分析儲戶一次存款金額的總體是否服從正態(tài)分布 問題 從甲乙兩種不同工藝生產(chǎn)出來的產(chǎn)品中隨機(jī)選取若干個(gè)樣本 分析兩種工藝產(chǎn)品的使用壽命是否存在顯著性差異 7 2兩獨(dú)立樣本的非參數(shù)檢驗(yàn) 定義 兩獨(dú)立樣本的非參數(shù)檢驗(yàn)是在對總體分布不很了解的情況下 通過分析樣本數(shù)據(jù) 推斷樣本來自的兩個(gè)獨(dú)立總體分布是否存在顯著差異 一般用來對兩個(gè)獨(dú)立樣本的均數(shù) 中位數(shù) 離散趨勢 偏度等進(jìn)行差異比較檢驗(yàn) 兩個(gè)樣本是否獨(dú)立 主要看在一個(gè)總體中抽取樣本對另外一個(gè)總體中抽取樣本有無影響 如果沒有影響 則可以認(rèn)為兩個(gè)總體是獨(dú)立的 SPSS提供了4種兩獨(dú)立樣本的非參數(shù)檢驗(yàn)方法 1 兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn) 兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn)的零假設(shè)H0為兩組獨(dú)立樣本來自的兩總體分布沒有顯著差異 兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn)主要通過對平均秩的研究來實(shí)現(xiàn)推斷 秩簡單地說就是變量值排序的名次 如果將數(shù)據(jù)按照升序進(jìn)行排序 這時(shí)每一個(gè)變量值都會有一個(gè)在整個(gè)變量值中的位置或名次 這就是該變量值的秩 變量值有多少個(gè) 秩便有多少個(gè) 基本步驟 計(jì)算示例 應(yīng)用舉例 研究問題從甲乙兩種不同工藝生產(chǎn)出來的產(chǎn)品中隨機(jī)選取若干個(gè)樣本 分析兩種工藝產(chǎn)品的使用壽命是否存在顯著性差異 2 兩獨(dú)立樣本的K S檢驗(yàn) 兩獨(dú)立樣本的K S檢驗(yàn)?zāi)軌驅(qū)瑟?dú)立樣本的總體分布情況進(jìn)行比較 其零假設(shè)是H0為兩組獨(dú)立樣本來自的兩總體的分布沒有顯著差異 兩獨(dú)立樣本的K S檢驗(yàn)實(shí)現(xiàn)方法是 首先將兩組樣本數(shù)據(jù) X1 X2 Xm 和 Y1 Y2 Yn 混合并按升序排列 m和n是兩組樣本的樣本容量 然后分別計(jì)算兩組樣本秩的累計(jì)頻數(shù)和累計(jì)頻率 最后將兩個(gè)累計(jì)頻率相減 得到差值序列數(shù)據(jù) 見教材151頁表7 8 兩獨(dú)立樣本的K S檢驗(yàn)將關(guān)注差值序列 SPSS將自動(dòng)計(jì)算K SD統(tǒng)計(jì)量及對應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來自的總體分布無顯著差異 3 兩獨(dú)立樣本的游程檢驗(yàn) Wald WolfwitzRuns 兩獨(dú)立樣本的游程檢驗(yàn)用來檢驗(yàn)兩組獨(dú)立樣本來自的兩總體的分布是否存在顯著差異 其零假設(shè)是H0為兩組獨(dú)立樣本來自的兩總體的分布沒有顯著差異 兩獨(dú)立樣本的游程檢驗(yàn)中 計(jì)算游程的方法與觀察值的秩有關(guān) 首先 將兩組樣本混合并按照升序排列 在數(shù)據(jù)排序時(shí) 兩組樣本的每個(gè)觀察值對應(yīng)的樣本組標(biāo)志值序列也隨之重新排列 然后對標(biāo)志值序列按照前面討論的方法求游程 兩獨(dú)立樣本游程檢驗(yàn)計(jì)算示例 如果計(jì)算出的游程數(shù)相對比較小 則說明樣本來自的兩總體的分布形態(tài)存在較大差距 如果得到的游程數(shù)相對比較大 則說明樣本來自的兩總體的分布形態(tài)不存在顯著差異 SPSS將自動(dòng)計(jì)算游程數(shù)得到Z統(tǒng)計(jì)量并依據(jù)正態(tài)分布表給出對應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來自的總體分布無顯著差異 4 兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn) MosesExtremeReactions 兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)用來檢驗(yàn)兩組獨(dú)立樣本來自的兩總體的分布是否存在顯著差異 其零假設(shè)H0為兩組獨(dú)立樣本來自的兩總體的分布沒有顯著差異 兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)將一個(gè)樣本作為控制樣本 另外一個(gè)樣本作為實(shí)驗(yàn)樣本 以控制樣本作對照 檢驗(yàn)實(shí)驗(yàn)樣本是否出現(xiàn)了極端反應(yīng) 首先將兩組樣本混合并按升序排列 然后找出控制樣本最小秩和最大秩之間所包含的觀察值個(gè)數(shù) 即跨度 Span也即最大秩 最小秩 1 為消除樣本數(shù)據(jù)中極端值對分析結(jié)果的影響 也可以先按比例 通常為5 去除控制樣本中部分靠近兩端的樣本值 然后再求跨度 這個(gè)跨度稱為截頭跨度 極端反應(yīng)檢驗(yàn)的基本思想 極端反應(yīng)檢驗(yàn)計(jì)算示例 兩獨(dú)立樣本的極端檢驗(yàn)計(jì)算跨度和截頭跨度 如果跨度或截頭跨度很小 則表明兩個(gè)樣本數(shù)據(jù)無法充分混合 可以認(rèn)為實(shí)驗(yàn)樣本出現(xiàn)了極端反應(yīng) 樣本來自的兩總體分布存在顯著差異 反之 如果跨度或截頭跨度較大 則表明兩個(gè)樣本數(shù)據(jù)充分混合 可以認(rèn)為實(shí)驗(yàn)樣本沒有出現(xiàn)極端反應(yīng) 樣本來自的兩總體分布沒有顯著差異 SPSS自動(dòng)計(jì)算跨度和截頭跨度的H檢驗(yàn)統(tǒng)計(jì)量依據(jù)分布表給出對應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來自的總體分布無顯著差異 四種檢驗(yàn)方法的說明 1 Man WhitneyU 默認(rèn) 相當(dāng)于兩樣本秩和檢驗(yàn) 與參數(shù)檢驗(yàn)的t檢驗(yàn)相對 是對數(shù)據(jù)大小次序進(jìn)行檢驗(yàn) 變量至少為順序測量 即檢驗(yàn)A樣本中的數(shù)值是否多數(shù)都大于B樣本 2 Kolmogorov SmirnovZ檢驗(yàn)兩個(gè)獨(dú)立樣本是否取自同一總體 原理是做出兩個(gè)樣本的累積頻數(shù)分布曲線進(jìn)行比較 檢驗(yàn)的是總體分布情況是否相同 而不僅僅是其中心位置是否相同 可以用于連續(xù)性資料 3 Wald Wolfowitzruns屬于游程檢驗(yàn)的一種 即檢驗(yàn)的是總體分布情況是否相同 只要兩樣本各自所在總體有分布上的差異 無論是集中 離散 偏度等都可檢驗(yàn)出來 注意 給出結(jié)果為單側(cè)檢驗(yàn) 4 Mosesextremereactions有特定的用途 注意給出的結(jié)果均為單側(cè)檢驗(yàn) 如果施加的處理使得某些個(gè)體出現(xiàn)正向效應(yīng) 而另一些個(gè)體出現(xiàn)負(fù)向效應(yīng) 則應(yīng)該采用它 5 兩獨(dú)立樣本非參數(shù)檢驗(yàn)的練習(xí) 研究問題利用居民儲蓄調(diào)查 存款 數(shù)據(jù) 對城鎮(zhèn)和農(nóng)村儲戶存款金額的分布進(jìn)行比較分析 問題 從北京 上海 成都 廣州四城市中隨機(jī)選取若干個(gè)周歲兒童身高的樣本 分析四城市周歲兒童身高分布是否存在顯著性差異 7 3多獨(dú)立樣本的非參數(shù)檢驗(yàn) 定義 多獨(dú)立樣本非參數(shù)檢驗(yàn)分析樣本數(shù)據(jù)是推斷樣本來自的多個(gè)獨(dú)立總體分布是否存在顯著差異 SPSS多獨(dú)立樣本非參數(shù)檢驗(yàn)一般推斷多個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異 多個(gè)樣本之間是否獨(dú)立 需要看在一個(gè)總體中抽取樣本對其他總體中抽取樣本是否有影響 如果沒有影響 則認(rèn)為這些總體之間是獨(dú)立的 例如 隨機(jī)抽取3個(gè)班級之間學(xué)生的學(xué)生成績 分析3個(gè)班級總體的成績是否存在顯著的差異 由于對各個(gè)班級都是隨機(jī)抽取樣本 抽樣沒有相互影響 可以認(rèn)為這三個(gè)班級學(xué)生成績是獨(dú)立的 SPSS中有3種多獨(dú)立樣本非參數(shù)檢驗(yàn)方法 1 多獨(dú)立樣本的中位數(shù)檢驗(yàn) Median 多獨(dú)立樣本的中位數(shù)檢驗(yàn)通過對多組獨(dú)立樣本的分析檢驗(yàn)它們來自的多個(gè)總體的中位數(shù)是否存在顯著差異 多獨(dú)立樣本的中位數(shù)檢驗(yàn)的零假設(shè)H0為 多個(gè)獨(dú)立樣本來自的多個(gè)總體的中位數(shù)無顯著差異 基本思想 如果多個(gè)總體的中位數(shù)無顯著差異 或者說多個(gè)總體有共同的中位數(shù) 那么這個(gè)共同的中位數(shù)應(yīng)在各樣本組中處在中間位置上 于是 每組樣本中大于該中位數(shù)或小于該中位數(shù)的樣本數(shù)目應(yīng)大致相同 基本步驟 1 首先將多組樣本混合按升序排序 并求出混合樣本的中位數(shù) 2 分別計(jì)算各組樣本中大于和小于上述中位數(shù)的樣本個(gè)數(shù) 形成列聯(lián)表 見教材156頁 3 利用卡方檢驗(yàn)方法分析各組樣本來自的總體對于上述中位數(shù)的分布是否一致 研究問題從北京 上海 成都 廣州四城市中隨機(jī)選取若干個(gè)周歲兒童身高的樣本 分析四城市周歲兒童身高分布是否存在顯著性差異 應(yīng)用舉例 2 多獨(dú)立樣本的K W檢驗(yàn) 多獨(dú)立樣本的K W檢驗(yàn)是Kruskal Waillis檢驗(yàn)的縮寫 是一種推廣的平均秩檢驗(yàn) 其零假設(shè)為 多個(gè)獨(dú)立樣本來自的多個(gè)總體的分布無顯著差異 多獨(dú)立樣本的K W檢驗(yàn)的基本方法是 首先將多組樣本數(shù)混合并按升序排列 求出每個(gè)變量值的秩 然后對多組樣本的秩分別求平均值 如果各組樣本的平均秩大致相等 則可以認(rèn)為多個(gè)總體的分布沒有顯著差異 如果各樣本的平均秩相差很大 則認(rèn)為多個(gè)總體的分布有顯著差異 K W檢驗(yàn)統(tǒng)計(jì)量 計(jì)算示例 3 多獨(dú)立樣本的Jonkheere Terpstra檢驗(yàn) 多獨(dú)立樣本的Jonkheere Terpstra檢驗(yàn)用于分析多個(gè)獨(dú)立樣本來自的多個(gè)總體分布是否存在顯著差異 其零假設(shè)是 多個(gè)獨(dú)立樣本來自的多個(gè)總體的分布無顯著差異 多獨(dú)立樣本的Jonkheere Terpstra檢驗(yàn)的基本方法和兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn)比較類似 也是計(jì)算一組樣本的觀察值小于其他組樣本觀察值的個(gè)數(shù) 檢驗(yàn)統(tǒng)計(jì)量 計(jì)算示例 研究問題利用居民儲蓄調(diào)查 存款 數(shù)據(jù) 對不同職業(yè)儲戶存款金額的分布進(jìn)行比較分析 4 多獨(dú)立樣本非參數(shù)檢驗(yàn)的應(yīng)用舉例 說明 中位數(shù)檢驗(yàn)強(qiáng)調(diào)中間位置 Kruskal Wallis檢驗(yàn)重點(diǎn)分析平均秩 Jonckheere Terpstra檢驗(yàn)則通過比較同向?qū)?shù)來分析 各種方法各有長短 在應(yīng)用時(shí)應(yīng)嘗試用多種方法進(jìn)行分析 并注意結(jié)合實(shí)際問題對分析結(jié)果進(jìn)行解釋 問題 對統(tǒng)計(jì)學(xué)是否重要的問題進(jìn)行分析 7 4兩配對樣本非參數(shù)檢驗(yàn) 定義 兩配對樣本 2RelatedSamples 非參數(shù)檢驗(yàn)是在對總體分布不很清楚的情況下 對兩配對樣本來自的兩個(gè)總體分布是否存在顯著性差異進(jìn)行檢驗(yàn) 兩配對樣本非參數(shù)檢驗(yàn)一般用于同一研究對象 或兩配對對象 分別給予兩種不同處理的效果比較 以及同一研究對象 或兩配對對象 處理前后的效果比較 前者推斷兩種效果有無差別 后者推斷某種處理是否有效 兩配對樣本非參數(shù)檢驗(yàn)的前提要求兩個(gè)樣本應(yīng)是配對的 在應(yīng)用領(lǐng)域中 主要的配對資料包括 具有年齡 性別 體重 病況等非處理因素相同或相似者 首先兩個(gè)樣本的觀察數(shù)目相同 其次兩樣本的觀察值順序不能隨意改變 SPSS中有以下3種兩配對樣本非參數(shù)檢驗(yàn)方法 1 兩配對樣本的McNemar變化顯著性檢驗(yàn) McNemar變化顯著性檢驗(yàn)以研究對象自身為對照 檢驗(yàn)其 前后 兩組樣本變化是否顯著 其零假設(shè)為 兩配對樣本來自的兩總體分布無顯著差異 McNemar變化顯著性檢驗(yàn)要求待檢驗(yàn)的兩組樣本的觀察值是二值數(shù)據(jù) 在實(shí)際分析中有一定的局限性 McNemar變化顯著性檢驗(yàn)基本方法采用二項(xiàng)分布檢驗(yàn) 它通過對兩組樣本前后變化的頻率 計(jì)算二項(xiàng)分布的概率值 研究問題對統(tǒng)計(jì)學(xué)是否重要的問題 采用兩配對樣本的McNemar檢驗(yàn)進(jìn)行分析 應(yīng)用舉例 分析10個(gè)學(xué)生接受某種方法進(jìn)行訓(xùn)練的效果 收集到這些學(xué)生在訓(xùn)練前 后的成績 如表7 9所示 表格的每一行表示一個(gè)學(xué)生的4個(gè)成績 其中第一列表示 訓(xùn)練前的成績是否合格 0表示不合格 1表示合格 第二列表示訓(xùn)練后的成績是否合格 0表示不合格 1表示合格 第三列表示訓(xùn)練前學(xué)生的具體成績 第四列表示訓(xùn)練后學(xué)生的具體成績 問訓(xùn)練前后學(xué)生的成績是否存在顯著差異 問題 表7 9訓(xùn)練前后的成績 2 兩配對樣本的符號 Sign 檢驗(yàn) 當(dāng)兩配對樣本的觀察值不是二值數(shù)據(jù)時(shí) 無法利用前面一種檢驗(yàn)方法 這時(shí)可以采用兩配對樣本的符號 Sign 檢驗(yàn)方法 其零假設(shè)為 兩配對樣本來自的兩總體的分布無顯著差異 兩配對樣本的符號檢驗(yàn)利用正 負(fù)符號的個(gè)數(shù)多少來進(jìn)行檢驗(yàn) 首先 將第二組樣本的各個(gè)觀察值減去第一組樣本對應(yīng)的觀察值 如果得到差值是一個(gè)正數(shù) 則記為正號 差值為負(fù)數(shù) 則記為負(fù)號 然后計(jì)算正號的個(gè)數(shù)和負(fù)號的個(gè)數(shù) 通過比較正號的個(gè)數(shù)和負(fù)號的個(gè)數(shù) 可以判斷兩組樣本的分布 例如 正號的個(gè)數(shù)和負(fù)號的個(gè)數(shù)大致相當(dāng) 則可以認(rèn)為兩配對樣本數(shù)據(jù)分布差距較小 正號的個(gè)數(shù)和負(fù)號的個(gè)數(shù)相差較多 可以認(rèn)為兩配對樣本數(shù)據(jù)分布差距較大 SPSS將自動(dòng)對差值正負(fù)符號序列作單樣本二項(xiàng)分布檢驗(yàn) 計(jì)算出實(shí)際的概率值 如果得到的概率值小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩配對樣本來自的總體分布有顯著差異 如果概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩配對樣本來自的總體分布無顯著差異 研究問題分析10個(gè)學(xué)生接受某種方法進(jìn)行訓(xùn)練的效果 收集到這些學(xué)生在訓(xùn)練前 后的成績 如表7 9所示 表格的每一行表示一個(gè)學(xué)生的4個(gè)成績 其中第一列表示 訓(xùn)練前的成績是否合格 0表示不合格 1表示合格 第二列表示訓(xùn)練后的成績是否合格 0表示不合格 1表示合格 第三列表示訓(xùn)練前學(xué)生的具體成績 第四列表示訓(xùn)練后學(xué)生的具體成績 問訓(xùn)練前后學(xué)生的成績是否存在顯著差異 應(yīng)用舉例 表7 9訓(xùn)練前后的成績 3 兩配對樣本的Wilcoxon符號秩檢驗(yàn) 兩配對樣本的符號檢驗(yàn)考慮了總體數(shù)據(jù)變化的性質(zhì) 但沒有考慮兩組樣本變化的程度 兩配對樣本的Wilcoxon符號秩檢驗(yàn)考慮了這方面的因素 其零假設(shè)為 兩配對樣本來自的兩個(gè)總體的分布無顯著差異 兩配對樣本的Wilcoxon符號秩檢驗(yàn)首先按照符號檢驗(yàn)的方法 將第二組樣本的各個(gè)觀察值減去第一組樣本對應(yīng)的觀察值 如果得到差值是一個(gè)正數(shù) 則記為正號 差值為負(fù)數(shù) 則記為負(fù)號 同時(shí)保存差值數(shù)據(jù) 然后將差值變量按升序排序 并求出相應(yīng)的秩 最后分別計(jì)算正號秩和統(tǒng)計(jì)量W 負(fù)號秩和統(tǒng)計(jì)量W 計(jì)算示例 如果正秩和負(fù)秩大致相當(dāng) 則可以認(rèn)為兩配對樣本數(shù)據(jù)正負(fù)變化程度基本相當(dāng) 兩配對總體的分布無顯著性差異 兩配對樣本的Wilcoxon符號秩檢驗(yàn)按照下面的公式計(jì)算Z統(tǒng)計(jì)量 n為總樣本數(shù) 它近似服從正態(tài)分布 研究問題分析10個(gè)學(xué)生接受某種方法進(jìn)行訓(xùn)練的效果 收集到這些學(xué)生在訓(xùn)練前 后的成績 如表7 9所示 表格的每一行表示一個(gè)學(xué)生的4個(gè)成績 其中第一列表示 訓(xùn)練前的成績是否合格 0表示不合格 1表示合格 第二列表示訓(xùn)練后的成績是否合格 0表示不合格 1表示合格 第三列表示訓(xùn)練前學(xué)生的具體成績 第四列表示訓(xùn)練后學(xué)生的具體成績 問訓(xùn)練前后學(xué)生的成績是否存在顯著差異 應(yīng)用舉例 表7 9訓(xùn)練前后的成績 問題 利用不同促銷形式的銷售額的數(shù)據(jù) 分析不同促銷形式是否對銷售額產(chǎn)生了顯著影響 7 5多配對樣本的非參數(shù)檢驗(yàn) 定義 多配對樣本非參數(shù)檢驗(yàn)是對多個(gè)匹配樣本的總體分布是否存在顯著性差異進(jìn)行統(tǒng)計(jì)分析 SPSS中有以下3種多配對樣本非參數(shù)檢驗(yàn)方法 1 多配對樣本的Friedman檢驗(yàn) 多配對樣本的Friedman檢驗(yàn)是利用秩實(shí)現(xiàn)多個(gè)總體分布是否存在顯著性差異檢驗(yàn)的一種方法 多配對樣本的Friedman檢驗(yàn)要求數(shù)據(jù)是定距的 其零假設(shè)為 多個(gè)配對樣本來自的多個(gè)總體的分布無顯著差異 多配對樣本的Friedman檢驗(yàn)的實(shí)現(xiàn)原理是 首先以行為單位 將各個(gè)數(shù)據(jù)按照升序排列 并求得各變量值在各自行中的秩 然后計(jì)算各組樣本下的秩和與平均秩 計(jì)算示例 如果多個(gè)配對樣本的分布存在顯著的差異 那么數(shù)值普遍偏大的組秩和必然偏大 數(shù)值普遍偏小的組 秩和也必然偏小 各組的秩之間就會存在顯著差異 如果各樣本的平均秩大致相當(dāng) 那么可以認(rèn)為各組的總體分布沒有顯著差異 Friedman檢驗(yàn)統(tǒng)計(jì)量為k為樣本組數(shù) n為樣本數(shù) 為平均秩 大樣本下Friedman檢驗(yàn)統(tǒng)計(jì)量近似服從k 1個(gè)自由度的卡方分布 應(yīng)用舉例 研究問題 利用不同促銷形式的銷售額的數(shù)據(jù) 分析不同促銷形式是否對銷售額產(chǎn)生了顯著影響 問題 利用評委給歌手打分的數(shù)據(jù) 分析評委的評分標(biāo)準(zhǔn)是否一致 2 多配對樣本的Kendall協(xié)同系數(shù)檢驗(yàn) 多配對樣本的Kendall協(xié)同系數(shù)檢驗(yàn)和Friedman檢驗(yàn)非常類似 也是一種多配對樣本的非參數(shù)檢驗(yàn) 但分析的角度不同 多配對樣本的Kendall協(xié)同系數(shù)檢驗(yàn)主要用在分析評判者的判別標(biāo)準(zhǔn)是否一致公平方面 它將每個(gè)評判對象的分?jǐn)?shù)都看作是來自多個(gè)配對總體的樣本 一個(gè)評判對象對不同被判定對象的分?jǐn)?shù)構(gòu)成一個(gè)樣本 其零假設(shè)為 樣本來自的多個(gè)配對總體的分布無顯著差異 即評判者的評判標(biāo)準(zhǔn)不一致 舉例 Kendall協(xié)同系數(shù)檢驗(yàn)中會計(jì)算Friedman檢驗(yàn)方法 得到Friedman統(tǒng)計(jì)量和相伴概率 如果相伴概率小于顯著性水平 可以認(rèn)為這10個(gè)節(jié)目之間沒有顯著差異 那么可以認(rèn)為這5個(gè)評委判定標(biāo)準(zhǔn)不一致 也就是判定結(jié)果不一致 協(xié)同系數(shù) 其中m是評判者人數(shù) n是被評判者人數(shù) 為第i個(gè)被評判者的秩和 取值范圍在0至1之間 W協(xié)同系數(shù)越接近1 表明秩的組間差異越大 意味著被評判者所得分?jǐn)?shù)間有顯著差異 進(jìn)而說明評判者的評判標(biāo)準(zhǔn)具有一致性 反之 W協(xié)同系數(shù)越接近0 表明秩的組間差異越小 意味著各個(gè)被評判者所得分?jǐn)?shù)間的差異不明顯 說明評判者對于各被評判者的意見很不一致 沒有理由認(rèn)為評判者的評判標(biāo)準(zhǔn)具有一致性 應(yīng)用舉例 研究問題 利用評委給歌手打分的數(shù)據(jù) 分析評委的評分標(biāo)準(zhǔn)是否一致 問題 利用乘客對三家航空公司是否滿意的數(shù)據(jù) 分析三家航空公司的服務(wù)水平是否存在顯著性差異 3 多配對樣本的CochranQ檢驗(yàn) 多配對樣本的CochranQ檢驗(yàn)也是對多個(gè)互相匹配樣本總體分布是否存在顯著性差異的統(tǒng)計(jì)檢驗(yàn) 不同的是多配對樣本的CochranQ檢驗(yàn)所能處理的數(shù)據(jù)是二值的 0和1 其零假設(shè)是 多配對樣本來自的多個(gè)總體分布無顯著差異 基本思想及檢驗(yàn)統(tǒng)計(jì)量 基本思想 認(rèn)為每行中取1的個(gè)數(shù)是可確定的 CochranQ檢驗(yàn)統(tǒng)計(jì)量 計(jì)算示例 在大樣本時(shí) Q統(tǒng)計(jì)量近似服從 k 1 個(gè)自由度的卡方分布 SPSS將自動(dòng)計(jì)算Q統(tǒng)計(jì)量和對應(yīng)的概率P值 應(yīng)用舉例 研究問題 利用乘客對三家航空公司是否滿意的數(shù)據(jù) 分析三家航空公司的服務(wù)水平是否存在顯著性差異 4 多配對樣本非參數(shù)檢驗(yàn)的練習(xí) 研究問題1為了試驗(yàn)?zāi)撤N減肥藥的性能 測量10個(gè)人在服用該藥前以及服用該藥一個(gè)月后 兩個(gè)月后 3個(gè)月后的體重 問在這4個(gè)時(shí)期 10個(gè)人的體重有無發(fā)生顯著的變化 數(shù)據(jù)如表7 10所示 表7 104個(gè)時(shí)期的體重 kg 研究問題2某文藝晚會中有5個(gè)節(jié)目 共有5個(gè)評委參與打分 問這5個(gè)評委的判斷標(biāo)準(zhǔn)是否一致 數(shù)據(jù)如表7 11所示 表7 115個(gè)評委的打分表 研究問題3消費(fèi)者協(xié)會調(diào)查了顧客對3種品牌的電視機(jī)的滿意程度 共有10個(gè)顧客參與了滿意度調(diào)查 數(shù)據(jù)如表7 12所示 表7 12顧客的滿意度表格 小結(jié) 非參數(shù)檢驗(yàn)主要用于那些總體分布不能用有限個(gè)實(shí)參數(shù)來刻畫 或者不考慮被研究的對象為何種分布以及是否已知的情況 這種方法進(jìn)行的并不是參數(shù)間的比較 而是分布位置 分布形狀之間的比較 研究目標(biāo)總體與理論總體分布是否相同 或者各樣本所在總體的分布位置是否相同等 小結(jié) 1 一般不需要嚴(yán)格的前提假設(shè) 2 非參數(shù)檢驗(yàn)特別適用于順序資料或等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人際關(guān)系調(diào)查的統(tǒng)計(jì)特征試題及答案
- 小學(xué)六年級語文分項(xiàng)能力提升試題及答案
- 食品饋贈與人際關(guān)系的影響試題及答案
- 古代文學(xué)史挑戰(zhàn)性試題及答案
- 2025年企業(yè)員工安全培訓(xùn)考試試題及答案4A
- 藥理學(xué)復(fù)習(xí)方法創(chuàng)新試題及答案
- 2025年企業(yè)安全培訓(xùn)考試試題及下載答案
- 汽車美容師與消費(fèi)者互動(dòng)技巧試題及答案
- 2025年安全標(biāo)準(zhǔn)化安全培訓(xùn)考試試題【基礎(chǔ)題】
- 2025工廠職工安全培訓(xùn)考試試題附完整答案【全優(yōu)】
- 佳能相機(jī)PowerShot SX60 HS使用說明書
- 2025屆高考語文復(fù)習(xí):補(bǔ)寫語句+課件
- 人教版部編版統(tǒng)編版一年級語文上冊漢語拼音9《y+w》課件
- CB-Z-211-1984船用金屬復(fù)合材料超聲波探傷工藝規(guī)程
- CJJ99-2017 城市橋梁養(yǎng)護(hù)技術(shù)標(biāo)準(zhǔn)
- 《職業(yè)道德與法治》開學(xué)第一課(導(dǎo)言)(課件)-【中職專用】中職思想政治《職業(yè)道德與法治》高效課堂課件+教案(高教版2023·基礎(chǔ)模塊)
- SB-T 11164-2016 綠色倉庫要求與評價(jià)
- 中考物理總復(fù)習(xí)《歐姆定律》專項(xiàng)提升練習(xí)(帶答案)
- 生態(tài)公園設(shè)計(jì)方案
- 小學(xué)心理班會課設(shè)計(jì)方案及流程
- 陜09J01 建筑用料及做法圖集
評論
0/150
提交評論