




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章非參數(shù)檢驗(yàn)詳解演示文稿現(xiàn)在是1頁(yè)\一共有78頁(yè)\編輯于星期五優(yōu)選第七章非參數(shù)檢驗(yàn)現(xiàn)在是2頁(yè)\一共有78頁(yè)\編輯于星期五非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn):(1)在總體分布未知或知道甚少的情況下,利用樣本數(shù)據(jù)對(duì)總體分布形態(tài)等進(jìn)行推斷的方法。(2)推斷過(guò)程中不涉及有關(guān)總體分布的參數(shù)。現(xiàn)在是3頁(yè)\一共有78頁(yè)\編輯于星期五7.1單樣本的非參數(shù)檢驗(yàn)
1.目的:樣本來(lái)自總體的分布是否與某個(gè)已知的分布相吻合?—繪制樣本數(shù)據(jù)的直方圖、pp圖、QQ圖判斷—粗略—通過(guò)非參數(shù)檢驗(yàn)—精確2.單樣本非參數(shù)檢驗(yàn)(1)對(duì)單個(gè)總體的分布形態(tài)等進(jìn)行推斷(2)方法:卡方檢驗(yàn)、二項(xiàng)分布檢驗(yàn)、K-S檢驗(yàn)、變量值隨機(jī)性檢驗(yàn)等?,F(xiàn)在是4頁(yè)\一共有78頁(yè)\編輯于星期五總體分布的卡方檢驗(yàn)1、基本思想的理論依據(jù):
如果從一個(gè)隨機(jī)變量X中隨機(jī)抽取若干個(gè)觀察樣本,這些觀察樣本落在X的k個(gè)互不相交的子集中的觀察頻數(shù)服從一個(gè)多項(xiàng)分布,這個(gè)多項(xiàng)分布當(dāng)k趨于無(wú)窮時(shí)近似服從卡方分布?;谶@一思想,對(duì)變量X總體分布的檢驗(yàn)可從對(duì)各個(gè)觀察頻數(shù)的分析入手。現(xiàn)在是5頁(yè)\一共有78頁(yè)\編輯于星期五總體分布的卡方檢驗(yàn)1.基本思想-吻合性檢驗(yàn)(1)原假設(shè):樣本來(lái)自的總體分布與期望分布無(wú)顯著差異。變量值落入第i個(gè)子集中的理論概率為,相應(yīng)的期望頻率為現(xiàn)在是6頁(yè)\一共有78頁(yè)\編輯于星期五二.總體分布卡方檢驗(yàn)的應(yīng)用實(shí)例:
SPSS總體分布的卡方檢驗(yàn)對(duì)數(shù)據(jù)存放,需要定義一個(gè)存放變量值的SPSS變量和一個(gè)存放各變量值觀測(cè)頻數(shù)的變量,并指定該變量為加權(quán)變量?,F(xiàn)在是7頁(yè)\一共有78頁(yè)\編輯于星期五2.實(shí)現(xiàn)步驟[Analyze]-[NonparametricTests]-[Chi-Square]現(xiàn)在是8頁(yè)\一共有78頁(yè)\編輯于星期五(1)選定待檢驗(yàn)的變量到[TestVariablelist](2)在[ExpectedRange]中確定參與分析的觀測(cè)值的范圍:[Getfromdata]:所有觀測(cè)數(shù)據(jù)都參與分析[usespecifiedrange]:只在該取值范圍內(nèi)的觀測(cè)數(shù)據(jù)才參與分析。(3)[Expectedvalues]給出各理論值[Allcategoriesequal]:所有子集的頻數(shù)都相同[value]:依次輸入值,通過(guò)[add]、[change]、[remove]進(jìn)行增加、修改和刪除。(4)單擊Options按鈕,在Statistics欄中選擇輸出統(tǒng)計(jì)量。Descriptive復(fù)選項(xiàng),指定輸出變量的均值、標(biāo)準(zhǔn)差、最大值、最小值、非缺失個(gè)體的數(shù)量?,F(xiàn)在是9頁(yè)\一共有78頁(yè)\編輯于星期五Quartiles復(fù)選項(xiàng),輸出四分位數(shù)。(2)MissingValues欄中選擇對(duì)缺失值的處理方式。Excludecasetest-by-test選項(xiàng),將參與對(duì)比中的缺失值排除。Excludecaseslistwise選項(xiàng),剔除任何變量中所有含缺失值的樣品?,F(xiàn)在是10頁(yè)\一共有78頁(yè)\編輯于星期五3.應(yīng)用案例醫(yī)學(xué)研究表明心臟病人猝死人數(shù)與日期的關(guān)系為:一周內(nèi),星期一猝死者較多,其他日子基本相當(dāng),各天的比例近似為:2.8:1:1:1:1:1:1根據(jù)“心臟病猝死”數(shù)據(jù),推斷總體分布是否與理論分布相吻合。分析:利用總體分布卡方檢驗(yàn)實(shí)現(xiàn)?,F(xiàn)在是11頁(yè)\一共有78頁(yè)\編輯于星期五4.應(yīng)用練習(xí)擲一顆六面體300次,用數(shù)字型數(shù)據(jù)1、2、3、4、5、6分別代表六面的六個(gè)點(diǎn),試問(wèn)這顆六面體是否均勻。123456434956456641現(xiàn)在是12頁(yè)\一共有78頁(yè)\編輯于星期五二項(xiàng)分布檢驗(yàn)在現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分為男性和女性,產(chǎn)品可以分為合格和不合格,學(xué)生可以分為三好學(xué)生和非三好學(xué)生。通常將這樣的二值分別用1和0表示。如果進(jìn)行n次相同的實(shí)驗(yàn),則出現(xiàn)兩類(lèi)(1或0)的次數(shù)可以用離散型隨機(jī)變量來(lái)描述。如果隨機(jī)變量值為1代表成功,其概率設(shè)為p,則隨機(jī)變量值為0的概率q便等于1-p,則成功次數(shù)變量X的分布為二項(xiàng)分布?,F(xiàn)在是13頁(yè)\一共有78頁(yè)\編輯于星期五二項(xiàng)分布檢驗(yàn)1.基本思想(1)通過(guò)樣本數(shù)據(jù)檢驗(yàn)樣本來(lái)自的總體是否服從指定概率p的二項(xiàng)分布。(2)小樣本-精確檢驗(yàn):計(jì)算n次試驗(yàn)中某類(lèi)出現(xiàn)的次數(shù)小于等于x次的概率:大樣本-近似檢驗(yàn)現(xiàn)在是14頁(yè)\一共有78頁(yè)\編輯于星期五2.實(shí)現(xiàn)步驟
[Analyze]-[NonparametricTests]-[Binomial]現(xiàn)在是15頁(yè)\一共有78頁(yè)\編輯于星期五(1)選定待檢驗(yàn)的變量到[TestVariablelist](2)[definedichotomy]中指定如何分類(lèi)[getfromdata]:檢驗(yàn)變量為二值變量[cutpoint]:輸入具體數(shù)值,小于等于該值的為第一組,大于該組的為第二組(3)[Testproportion]:輸入二項(xiàng)分布的檢驗(yàn)概率值現(xiàn)在是16頁(yè)\一共有78頁(yè)\編輯于星期五3.應(yīng)用案例利用“產(chǎn)品合格率”數(shù)據(jù),推斷該批產(chǎn)品的一級(jí)品率是否為90%。分析:產(chǎn)品合格與否屬于二值變量,可以通過(guò)二項(xiàng)分布檢驗(yàn)實(shí)現(xiàn)?,F(xiàn)在是17頁(yè)\一共有78頁(yè)\編輯于星期五3.應(yīng)用練習(xí)1.擲一枚硬幣31次,出現(xiàn)正面和反面在上的結(jié)果見(jiàn)下表,試問(wèn)這枚硬幣是否均勻。2.根據(jù)居民儲(chǔ)蓄存款的數(shù)據(jù),分析儲(chǔ)戶(hù)對(duì)未來(lái)收入的看法,檢驗(yàn)儲(chǔ)戶(hù)總體對(duì)收入持保守或悲觀態(tài)度的比例是否與0.4有顯著性差異。次12345678910111213141516面ABABBAAABBABBAAA次171819202122232425262728293031面BABBABBABABBABA現(xiàn)在是18頁(yè)\一共有78頁(yè)\編輯于星期五單樣本K-S檢驗(yàn)1.基本思想(1)以俄羅斯數(shù)學(xué)家柯?tīng)柲绾退姑字Z夫名字命名(2)利用樣本數(shù)據(jù)推斷樣本來(lái)自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗(yàn)方法,適用于探索連續(xù)型隨機(jī)變量的分布(3)步驟①計(jì)算各樣本觀測(cè)值在理論分布中出現(xiàn)的理論累計(jì)概率值F(x)②計(jì)算各樣本觀測(cè)值的實(shí)際累計(jì)概率值S(x)③計(jì)算理論累計(jì)概率值與實(shí)際累計(jì)概率值的差D(x)④計(jì)算差值序列中最大絕對(duì)差值D現(xiàn)在是19頁(yè)\一共有78頁(yè)\編輯于星期五(4)原假設(shè)成立時(shí):①小樣本下:D~kolmogorov分布②大樣本下:近似服從K(x)分布③SPSS僅給出大樣本下的和對(duì)應(yīng)的p值(5)決策①D統(tǒng)計(jì)量的p值<顯著性水平,拒絕原假設(shè),樣本來(lái)自的總體與指定分布有顯著差異②D統(tǒng)計(jì)量的p值>顯著性水平,不拒絕原假設(shè),樣本來(lái)自的總體與指定分布無(wú)顯著差異現(xiàn)在是20頁(yè)\一共有78頁(yè)\編輯于星期五2.實(shí)現(xiàn)步驟
[Analyze]-[NonparametricTests]-[1-sampleK-S]現(xiàn)在是21頁(yè)\一共有78頁(yè)\編輯于星期五(1)選定待檢驗(yàn)的變量到[TestVariablelist](2)[Testdistribution]:選擇理論分布①[normal]:正態(tài)分布②[uniform]:均勻分布③[poisson]:泊松分布④[exponential]:指數(shù)分布現(xiàn)在是22頁(yè)\一共有78頁(yè)\編輯于星期五3.應(yīng)用案例利用“兒童身高”數(shù)據(jù)分析周歲兒童身高總體是否服從正態(tài)分布。分析:可以通過(guò)單樣本K-S檢驗(yàn)實(shí)現(xiàn)?,F(xiàn)在是23頁(yè)\一共有78頁(yè)\編輯于星期五3.應(yīng)用練習(xí)1、利用存款儲(chǔ)蓄調(diào)查數(shù)據(jù),分析儲(chǔ)戶(hù)一次存款金額的總體是否服從正態(tài)分布,并結(jié)合存款金額的pp圖和qq圖來(lái)分析?,F(xiàn)在是24頁(yè)\一共有78頁(yè)\編輯于星期五7.1.4變量值隨機(jī)性檢驗(yàn)1.基本思想(1)通過(guò)對(duì)樣本變量值的分析,實(shí)現(xiàn)對(duì)總體的變量值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn)。(2)原假設(shè):總體變量值出現(xiàn)是隨機(jī)的。①檢驗(yàn)依據(jù):游程-樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù)。②游程數(shù)太大或太小都表明變量值存在不隨機(jī)的現(xiàn)象現(xiàn)在是25頁(yè)\一共有78頁(yè)\編輯于星期五關(guān)于隨機(jī)性的游程檢驗(yàn)(runtest)游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量的這兩個(gè)值的出現(xiàn)是否是隨機(jī)的。假定下面是由0和1組成的一個(gè)這種變量的樣本:0000111111001011100000000其中相同的0(或相同的1)在一起稱(chēng)為一個(gè)游程(單獨(dú)的0或1也算)。這個(gè)數(shù)據(jù)中有4個(gè)0組成的游程和3個(gè)1組成的游程。一共是R=7個(gè)游程。其中0的個(gè)數(shù)為m=15,而1的個(gè)數(shù)為n=10。
現(xiàn)在是26頁(yè)\一共有78頁(yè)\編輯于星期五(3)檢驗(yàn)統(tǒng)計(jì)量(4)決策:Z統(tǒng)計(jì)量的p值<顯著性水平,拒絕原假設(shè),變量值的出現(xiàn)不是隨機(jī)的。Z統(tǒng)計(jì)量的p值>顯著性水平,不拒絕原假設(shè),變量值的出現(xiàn)是隨機(jī)的。現(xiàn)在是27頁(yè)\一共有78頁(yè)\編輯于星期五關(guān)于隨機(jī)性的游程檢驗(yàn)(runtest)
例(run2.sav):從某裝瓶機(jī)出來(lái)的30盒化妝品的重量如下(單位克)當(dāng)然,游程檢驗(yàn)并不僅僅用于只取兩個(gè)值的變量,它還可以用于某個(gè)連續(xù)變量的取值小于某個(gè)值及大于該值的個(gè)數(shù)(類(lèi)似于0和1的個(gè)數(shù))是否隨機(jī)的問(wèn)題??聪旅胬印?1.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9為了看該裝瓶機(jī)是否工作正常,首先需要驗(yàn)證是否大于和小于中位數(shù)的個(gè)數(shù)是否是隨機(jī)的(零假設(shè)為這種個(gè)數(shù)的出現(xiàn)是隨機(jī)的)。
現(xiàn)在是28頁(yè)\一共有78頁(yè)\編輯于星期五關(guān)于隨機(jī)性的游程檢驗(yàn)(runtest)
如果把小于中位數(shù)的記為0,否則記為1,上面數(shù)據(jù)變成下面的0-1序列111111110111101000000000000110這就歸為上面的問(wèn)題。當(dāng)然這里進(jìn)行這種變換只是為了易于理解。實(shí)際計(jì)算時(shí),用不著這種變換,計(jì)算機(jī)會(huì)自動(dòng)處理這個(gè)問(wèn)題的。直接利用這個(gè)數(shù)據(jù),通過(guò)SPSS,得到下面游程檢驗(yàn)結(jié)果的輸出。
現(xiàn)在是29頁(yè)\一共有78頁(yè)\編輯于星期五2.實(shí)現(xiàn)步驟
[Analyze]-[NonparametricTests]-[Runs]現(xiàn)在是30頁(yè)\一共有78頁(yè)\編輯于星期五(1)選定待檢驗(yàn)的變量到[TestVariablelist](2)[cutpoint]:計(jì)算游程數(shù)的分界值①[median]:樣本中位數(shù)為分界值②[mode]:樣本眾數(shù)為分界值③[mean]:樣本均值為分界值④[custom]:以用戶(hù)輸入的值為分界值,SPSS將小于該分界值的所有變量作為一組,大于或等于該分界值的所有變量作為一組,計(jì)算游程?,F(xiàn)在是31頁(yè)\一共有78頁(yè)\編輯于星期五3.應(yīng)用案例利用“電纜數(shù)據(jù)”推斷耐壓設(shè)備的工作是否正常。分析:①若耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的-則設(shè)備工作正常②若耐壓數(shù)據(jù)的變動(dòng)不是隨機(jī)的-則設(shè)備工作存在不正常③可以通過(guò)變量值隨機(jī)性檢驗(yàn)實(shí)現(xiàn)。現(xiàn)在是32頁(yè)\一共有78頁(yè)\編輯于星期五4.應(yīng)用練習(xí)擲硬幣20次得到的實(shí)驗(yàn)數(shù)據(jù),試問(wèn)硬幣實(shí)驗(yàn)是否是隨機(jī)的。11010001101011100110現(xiàn)在是33頁(yè)\一共有78頁(yè)\編輯于星期五7.2兩獨(dú)立樣本的非參數(shù)檢驗(yàn)(1)獨(dú)立樣本:在一個(gè)總體中隨機(jī)抽樣對(duì)在另一個(gè)總體中隨機(jī)抽樣沒(méi)有影響的情況下所獲得的樣本。(2)推斷樣本來(lái)自的兩個(gè)總體的分布等是否存在顯著差異。(3)方法:曼-惠特尼U檢驗(yàn)、K-S檢驗(yàn)、W-W游程檢驗(yàn)、極端反應(yīng)檢驗(yàn)等?,F(xiàn)在是34頁(yè)\一共有78頁(yè)\編輯于星期五秩(rank)
非參數(shù)檢驗(yàn)中秩是最常使用的概念。什么是一個(gè)數(shù)據(jù)的秩呢?一般來(lái)說(shuō),秩就是該數(shù)據(jù)按照升冪排列之后,每個(gè)觀測(cè)值的位置。例如我們有下面數(shù)據(jù).Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。
現(xiàn)在是35頁(yè)\一共有78頁(yè)\編輯于星期五秩(rank)
利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒(méi)有涉及秩的性質(zhì)。
現(xiàn)在是36頁(yè)\一共有78頁(yè)\編輯于星期五兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)1.基本思想(1)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體分布無(wú)顯著差異。(2)通過(guò)兩組樣本平均秩的研究實(shí)現(xiàn)推斷
秩-變量值排序的名次,變量值有幾個(gè),對(duì)應(yīng)的秩便有幾個(gè)。(3)檢驗(yàn)步驟①將兩組樣本混合并升序排列,得每個(gè)數(shù)據(jù)的秩②分別對(duì)樣本X和Y的秩求平均,得平均秩和③計(jì)算樣本X優(yōu)于樣本Y秩的個(gè)數(shù)和樣本Y優(yōu)于樣本X秩的個(gè)數(shù)④依據(jù)和計(jì)算WilcoxonW統(tǒng)計(jì)量和曼-惠特尼U統(tǒng)計(jì)量?,F(xiàn)在是37頁(yè)\一共有78頁(yè)\編輯于星期五WilcoxonW統(tǒng)計(jì)量:曼-惠特尼統(tǒng)計(jì)量U為:大樣本下,U近似服從正態(tài)分布現(xiàn)在是38頁(yè)\一共有78頁(yè)\編輯于星期五現(xiàn)在是39頁(yè)\一共有78頁(yè)\編輯于星期五兩獨(dú)立樣本的K-S檢驗(yàn)1.基本思想(1)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)與單樣本K-S檢驗(yàn)的基本思路大體一致,差別在于:以變量值的秩為分析對(duì)象,而非變量值本身。(3)檢驗(yàn)步驟①將兩組樣本混合并按升序排列②分別計(jì)算兩組樣本秩的累計(jì)頻數(shù)和累計(jì)頻率③計(jì)算兩組累計(jì)頻率的差,得秩的差值序列及D統(tǒng)計(jì)量,④SPSS計(jì)算大樣本下的和對(duì)應(yīng)的p值(3)決策::拒絕原假設(shè),兩總體的分布有顯著差異:不拒絕原假設(shè),兩總體的分布無(wú)顯著差異
現(xiàn)在是40頁(yè)\一共有78頁(yè)\編輯于星期五2.k-s檢驗(yàn)將兩樣本混合并按升序排序分別計(jì)算兩個(gè)樣本在相同點(diǎn)上的累計(jì)頻數(shù)和累計(jì)頻率兩個(gè)累計(jì)頻率相減.如果差距較小,則認(rèn)為兩總體分布無(wú)顯著差異應(yīng)保證有較大的樣本數(shù)現(xiàn)在是41頁(yè)\一共有78頁(yè)\編輯于星期五現(xiàn)在是42頁(yè)\一共有78頁(yè)\編輯于星期五兩獨(dú)立樣本的游程檢驗(yàn)1.基本思想(1)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)檢驗(yàn)步驟①將兩組樣本混合并按升序排列,組標(biāo)記值也隨之重新排列②計(jì)算組標(biāo)記值序列的游程數(shù),如果游程數(shù)較大,則說(shuō)明是由于兩類(lèi)樣本數(shù)據(jù)充分混合的結(jié)果,即:認(rèn)為兩總體分布無(wú)顯著差異.③根據(jù)游程數(shù)計(jì)算Z統(tǒng)計(jì)量,Z統(tǒng)計(jì)量近似服從正態(tài)分布(3)決策::拒絕原假設(shè),兩總體的分布有顯著差異:不拒絕原假設(shè),兩總體的分布無(wú)顯著差異現(xiàn)在是43頁(yè)\一共有78頁(yè)\編輯于星期五極端反應(yīng)檢驗(yàn)1.基本思想(1)原假設(shè):兩獨(dú)立樣本來(lái)自的兩個(gè)總體的分布無(wú)顯著差異。(2)一組樣本為控制樣本,一組樣本為實(shí)驗(yàn)樣本,看實(shí)驗(yàn)樣本相對(duì)于控制樣本是否出現(xiàn)了極端反應(yīng)。(3)檢驗(yàn)步驟①兩組樣本混合按升序排列②求控制樣本的最小秩和最大秩③計(jì)算跨度④為了消除樣本數(shù)據(jù)中的極端值,計(jì)算跨度前可按比例(通常5%)去除控制樣本中靠近兩端的樣本值,再求跨度,得截頭跨度⑤針對(duì)跨度或截頭跨度計(jì)算H統(tǒng)計(jì)量:現(xiàn)在是44頁(yè)\一共有78頁(yè)\編輯于星期五小樣本下,H服從Hollander分布,大樣本下,H近似服從正態(tài)分布(4)決策:①H統(tǒng)計(jì)量的p值<顯著性水平,拒絕原假設(shè),兩獨(dú)立樣本來(lái)自的總體分布存在顯著差異②H統(tǒng)計(jì)量的p值>顯著性水平,不拒絕原假設(shè),兩獨(dú)立樣本來(lái)自的總體分布不存在顯著差異現(xiàn)在是45頁(yè)\一共有78頁(yè)\編輯于星期五兩獨(dú)立樣本非參數(shù)檢驗(yàn)的步驟[Analyze]-[NonparametricTests]-[2independentsamples](1)選擇待檢驗(yàn)的變量到[Testvariablelist](2)[groupingvariable]:存放組標(biāo)志的變量,并通過(guò)[definegroups]給出兩組的標(biāo)志值。(3)[testtype]:選擇相應(yīng)的檢驗(yàn)方法現(xiàn)在是46頁(yè)\一共有78頁(yè)\編輯于星期五現(xiàn)在是47頁(yè)\一共有78頁(yè)\編輯于星期五兩獨(dú)立樣本非參數(shù)檢驗(yàn)的方法比較不同的分析方法對(duì)同批數(shù)據(jù)的分析,其結(jié)論可能不盡相同。一方面說(shuō)明分析過(guò)程中對(duì)數(shù)據(jù)進(jìn)行反復(fù)探索是極為必要的,另一方面也注意不同方法本身側(cè)重點(diǎn)的差異性。1、曼-惠特尼U檢驗(yàn)注重對(duì)分布的中心位置(平均水平)作檢驗(yàn),實(shí)際上是檢驗(yàn):兩樣本所對(duì)應(yīng)的總體具有相同的中心位置(中位數(shù))。若不能明確兩總體分布的形狀是否相同,則不宜單獨(dú)使用此方法。2、K-S檢驗(yàn)用于兩總體分布是否存在顯著差異性,對(duì)兩總體的全貌作檢查,即位置和分布形狀的差異性的檢驗(yàn)。3、游程檢驗(yàn)與K-S檢驗(yàn)相似,也是對(duì)全貌作檢驗(yàn),但其功效不如K-S檢驗(yàn)。4、極端反應(yīng)檢驗(yàn)注重對(duì)分布范圍(變異程度)作檢驗(yàn),實(shí)際上是檢驗(yàn)兩樣本所對(duì)應(yīng)的總體具有相同的分布范圍,要求樣本足夠大?,F(xiàn)在是48頁(yè)\一共有78頁(yè)\編輯于星期五應(yīng)用案例利用“使用壽命”數(shù)據(jù),判斷兩種工藝下產(chǎn)品的使用壽命的分布是否存在顯著差異,進(jìn)而對(duì)兩個(gè)工藝的優(yōu)劣進(jìn)行判斷。分析:兩個(gè)工藝產(chǎn)品的使用壽命可看作兩獨(dú)立樣本,可以通過(guò)曼-惠特尼U檢驗(yàn)、K-S檢驗(yàn)、W-W游程檢驗(yàn)、極端反應(yīng)檢驗(yàn)實(shí)現(xiàn)?,F(xiàn)在是49頁(yè)\一共有78頁(yè)\編輯于星期五應(yīng)用練習(xí)1、設(shè)有甲、乙兩種安眠藥,考慮比較它們的治療效果,獨(dú)立觀察20名患者。10人服甲藥,令10人服乙藥,睡眠延長(zhǎng)的時(shí)數(shù)見(jiàn)下表。試問(wèn)這兩種藥物的療效有無(wú)顯著性差異。2、利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)城鎮(zhèn)和農(nóng)村儲(chǔ)戶(hù)的存款金額的分布進(jìn)行比較分析。服甲藥睡眠延長(zhǎng)時(shí)數(shù)1.90.81.10.10.14.45.51.64.63.4服乙藥睡眠延長(zhǎng)時(shí)數(shù)0.7-1.6-0.2-1.2-0.13.43.70.80.02.0現(xiàn)在是50頁(yè)\一共有78頁(yè)\編輯于星期五7.3多獨(dú)立樣本的非參數(shù)檢驗(yàn)1.通過(guò)分析多組獨(dú)立樣本數(shù)據(jù),推斷樣本來(lái)自的多個(gè)總體的中位數(shù)或分布是否存在顯著差異。2.方法:中位數(shù)檢驗(yàn)、Kruskal-Wallis檢驗(yàn)、Jonckheere-Terpstra檢驗(yàn)?,F(xiàn)在是51頁(yè)\一共有78頁(yè)\編輯于星期五中位數(shù)檢驗(yàn)1.基本思想(1)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)無(wú)顯著差異。(2)檢驗(yàn)步驟①將多組樣本混合升序排列,求混合樣本的中位數(shù)②分別計(jì)算各組樣本中大于和小于中位數(shù)的樣本個(gè)數(shù),形成列聯(lián)表(p230表7-13)③利用卡方檢驗(yàn)分析各組樣本來(lái)自的總體對(duì)中位數(shù)的分布是否一致。現(xiàn)在是52頁(yè)\一共有78頁(yè)\編輯于星期五(3)決策①卡方統(tǒng)計(jì)量的p值<顯著性水平,拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)存在顯著差異。②卡方統(tǒng)計(jì)量的p值>顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的總體的中位數(shù)不存在顯著差異?,F(xiàn)在是53頁(yè)\一共有78頁(yè)\編輯于星期五多獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)1.基本思想(1)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異。(2)是兩獨(dú)立樣本曼-惠特尼U檢驗(yàn)的推廣(3)檢驗(yàn)步驟①將多組樣本數(shù)據(jù)混合并升序排列,求各變量的秩②考察各組秩的均值是否有顯著差異③各組秩的差異借助方差分析:秩的變差分解為:組間差和組內(nèi)差
a若秩的總變差大部分可由組間差解釋?zhuān)瑒t各樣本組的總體分布存在顯著差異
b若秩的總變差大部分不能由組間差解釋?zhuān)瑒t各樣本組的總體分布無(wú)顯著差異現(xiàn)在是54頁(yè)\一共有78頁(yè)\編輯于星期五④構(gòu)造K-W統(tǒng)計(jì)量(4)決策:SPSS自動(dòng)計(jì)算K-W統(tǒng)計(jì)量和對(duì)應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布存在顯著差異。
②p值>顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布無(wú)顯著差異?,F(xiàn)在是55頁(yè)\一共有78頁(yè)\編輯于星期五多獨(dú)立樣本的Jonckheere-Terpstra檢驗(yàn)1.基本思想(1)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異(2)J-T統(tǒng)計(jì)量現(xiàn)在是56頁(yè)\一共有78頁(yè)\編輯于星期五(3)決策:SPSS自動(dòng)計(jì)算J-T統(tǒng)計(jì)量,Z統(tǒng)計(jì)量和對(duì)應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布存在顯著差異;
②p值>顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布無(wú)顯著差異。現(xiàn)在是57頁(yè)\一共有78頁(yè)\編輯于星期五多獨(dú)立樣本非參數(shù)檢驗(yàn)的步驟1.按規(guī)定的格式組織數(shù)據(jù):設(shè)置兩個(gè)變量分別存放樣本值和組標(biāo)記值2.菜單:[Analyze]-[NonparametricTests]-[Kindependentsamples](1)選擇待檢驗(yàn)的變量到[Testvariablelist](2)[groupingvariable]:存放組標(biāo)志的變量,并通過(guò)[definegroups]給出標(biāo)志值的取值范圍。(3)[testtype]:選擇相應(yīng)的檢驗(yàn)方法現(xiàn)在是58頁(yè)\一共有78頁(yè)\編輯于星期五現(xiàn)在是59頁(yè)\一共有78頁(yè)\編輯于星期五7.3.5應(yīng)用案例利用“多城市兒童身高”數(shù)據(jù),對(duì)北京、上海、成都、廣州四城市的周歲兒童身高進(jìn)行比較分析,推斷四城市周歲兒童身高是否存在顯著差異。分析:(1)對(duì)身高分布無(wú)確切把握,涉及多個(gè)獨(dú)立樣本采采用多獨(dú)立樣非參數(shù)檢驗(yàn)(2)分別用中位數(shù)檢驗(yàn)、多獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)、多獨(dú)立樣本的Jonckheere-Terpstra檢驗(yàn)實(shí)現(xiàn)?,F(xiàn)在是60頁(yè)\一共有78頁(yè)\編輯于星期五7.4兩配對(duì)樣本的非參數(shù)檢驗(yàn)1.通過(guò)兩配對(duì)樣本推斷樣本來(lái)自的兩個(gè)總體的分布是否存在顯著差異。2.方法:McNemar檢驗(yàn)、符號(hào)檢驗(yàn)、Wilcoxon符號(hào)秩檢驗(yàn)?,F(xiàn)在是61頁(yè)\一共有78頁(yè)\編輯于星期五兩配對(duì)樣本的McNemar檢驗(yàn)1.基本思想(1)McNemar檢驗(yàn)是一種變化顯著性檢驗(yàn),將研究對(duì)象自身作為對(duì)照者檢驗(yàn)其“前后”的變化是否顯著。(2)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。(3)分析的變量是二值變量,若不是二值變量,應(yīng)現(xiàn)將數(shù)據(jù)轉(zhuǎn)換后再使用。導(dǎo)致該方法的應(yīng)用范圍具有局限性。(4)McNemar檢驗(yàn)采用二項(xiàng)分布檢驗(yàn)方法,小樣本下計(jì)算二項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的Z統(tǒng)計(jì)量。(5)SPSS自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布存在顯著差異
②p值>顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異現(xiàn)在是62頁(yè)\一共有78頁(yè)\編輯于星期五兩配對(duì)樣本的符號(hào)檢驗(yàn)1.基本思想(1)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)利用正負(fù)符號(hào)的個(gè)數(shù)實(shí)現(xiàn)檢驗(yàn)。(3)檢驗(yàn)步驟①分別用第二組樣本的各觀察值減第一組對(duì)應(yīng)樣本觀察值,差值為正記為+,差值為負(fù)記為-②將+的個(gè)數(shù)與-的個(gè)數(shù)進(jìn)行比較:采用二項(xiàng)分布檢驗(yàn)法,對(duì)正負(fù)符號(hào)變量進(jìn)行單樣本二項(xiàng)分布檢驗(yàn)。③小樣本下計(jì)算二項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的Z統(tǒng)計(jì)量(4)SPSS自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布存在顯著差異
②p值>顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異(4)缺陷:兩配對(duì)樣本的符號(hào)檢驗(yàn)注重對(duì)變化方向的分析,只考慮了數(shù)據(jù)變化的性質(zhì),沒(méi)有考慮變化的幅度,對(duì)數(shù)據(jù)的利用不夠充分?,F(xiàn)在是63頁(yè)\一共有78頁(yè)\編輯于星期五兩配對(duì)樣本W(wǎng)ilcoxon符號(hào)秩檢驗(yàn)1.基本思想(1)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)檢驗(yàn)步驟①分別用第二組樣本的各觀察值減第一組對(duì)應(yīng)樣本觀察值,差值為正記為+,差值為負(fù)記為-,并保持差值數(shù)據(jù)②將差值變量按升序排列,并求差值變量的秩③分別計(jì)算正號(hào)秩總和負(fù)號(hào)秩總和④統(tǒng)計(jì)量現(xiàn)在是64頁(yè)\一共有78頁(yè)\編輯于星期五(3)決策:SPSS自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布存在顯著差異
②p值>顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異現(xiàn)在是65頁(yè)\一共有78頁(yè)\編輯于星期五兩配對(duì)樣本非參數(shù)檢驗(yàn)的步驟1.按規(guī)定的格式組織數(shù)據(jù):設(shè)置兩個(gè)變量分別存放兩組樣本的樣本值2.菜單:[Analyze]-[NonparametricTests]-[2relatedsamples](1)選擇待檢驗(yàn)的兩個(gè)配對(duì)變量到[Testpairslist](2)[testtype]:選擇相應(yīng)的檢驗(yàn)方法現(xiàn)在是66頁(yè)\一共有78頁(yè)\編輯于星期五現(xiàn)在是67頁(yè)\一共有78頁(yè)\編輯于星期五應(yīng)用案例1.利用“統(tǒng)計(jì)學(xué)習(xí)”數(shù)據(jù),分析學(xué)生在學(xué)習(xí)“統(tǒng)計(jì)學(xué)”課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變。分析:(1)統(tǒng)計(jì)學(xué)習(xí)前后,屬于配對(duì)樣本(2)認(rèn)知程度屬二值變量(3)可以采用兩配對(duì)樣本McNemar檢驗(yàn)現(xiàn)在是68頁(yè)\一共有78頁(yè)\編輯于星期五2.利用“訓(xùn)練成績(jī)”數(shù)據(jù),分析新訓(xùn)練方法是否有助于提高跳遠(yuǎn)運(yùn)動(dòng)員的成績(jī)。分析:(1)新訓(xùn)練方法使用前后,屬于配對(duì)樣本(2)可采用兩配對(duì)樣本的符號(hào)檢驗(yàn)、兩配對(duì)樣本W(wǎng)ilcoxon符號(hào)秩檢驗(yàn)實(shí)現(xiàn)。現(xiàn)在是69頁(yè)\一共有78頁(yè)\編輯于星期五7.5多配對(duì)樣本的非參數(shù)檢驗(yàn)1.通過(guò)多組配對(duì)樣本推斷樣本來(lái)自的多個(gè)總體的中位數(shù)或分布是否存在顯著差異。2.方法:Friedman檢驗(yàn)、Cochra
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醬油食醋的發(fā)酵過(guò)程監(jiān)測(cè)技術(shù)考核試卷
- 嵌入式系統(tǒng)開(kāi)發(fā)實(shí)戰(zhàn)模擬試題及答案
- 有線電視傳輸網(wǎng)絡(luò)網(wǎng)絡(luò)功能虛擬化技術(shù)考核試卷
- 金屬密封件密封性能優(yōu)化考核試卷
- 硬件描述語(yǔ)言的應(yīng)用試題及答案
- 通信設(shè)備零售價(jià)格策略與彈性分析考核試卷
- 聚乙烯醇縮丙醛纖維應(yīng)用考核試卷
- 租賃業(yè)務(wù)中的風(fēng)險(xiǎn)規(guī)避措施考核試卷
- 公路工程考試考點(diǎn)總結(jié)試題及答案
- 軟件測(cè)試過(guò)程中的挑戰(zhàn)與解決方案試題及答案
- PDCA降低護(hù)士針刺傷發(fā)生率
- 幼兒園大班美術(shù)《臉部彩繪》
- 2021年安全生產(chǎn)月:安全執(zhí)行力培養(yǎng)專(zhuān)題培訓(xùn)課件
- 陜西碑刻總目提要編纂凡例
- 大學(xué)語(yǔ)文-陜西師范大學(xué)中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- 5G網(wǎng)絡(luò)優(yōu)化PHU Smart測(cè)試軟件使用手冊(cè)
- GB/T 3785.1-2023電聲學(xué)聲級(jí)計(jì)第1部分:規(guī)范
- gds系統(tǒng)應(yīng)急預(yù)案
- 國(guó)家開(kāi)放大學(xué)《農(nóng)村政策法規(guī)》形成性考核1(平時(shí)作業(yè))參考答案
- 雅百特財(cái)務(wù)造假分析
- 儲(chǔ)罐電動(dòng)葫蘆倒裝提升方案
評(píng)論
0/150
提交評(píng)論