第7章 群體間的差異比較――非參數(shù)檢驗(yàn)_第1頁
第7章 群體間的差異比較――非參數(shù)檢驗(yàn)_第2頁
第7章 群體間的差異比較――非參數(shù)檢驗(yàn)_第3頁
第7章 群體間的差異比較――非參數(shù)檢驗(yàn)_第4頁
第7章 群體間的差異比較――非參數(shù)檢驗(yàn)_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、群體間的差異比較非參數(shù)檢驗(yàn),第7章,內(nèi)容提要,7.1 非參數(shù)檢驗(yàn)概述,(一)區(qū)分參數(shù)VS統(tǒng)計(jì)量,統(tǒng)計(jì)量:根據(jù)樣本所計(jì)算出來的樣本的各種描述性指標(biāo)。如均數(shù)、方差、標(biāo)準(zhǔn)差等; 參數(shù):關(guān)于總體性質(zhì)的數(shù)量化描述。如通過人口普查計(jì)算得全國人口的平均年齡。 參數(shù)估計(jì):采用抽樣方法時(shí),可以用樣本得到的“統(tǒng)計(jì)量”對(duì)“參數(shù)”進(jìn)行估計(jì),也叫參數(shù)估計(jì)。如用樣本均數(shù)來推斷總體均數(shù)。,(一)區(qū)分參數(shù)VS統(tǒng)計(jì)量,參數(shù)檢驗(yàn):利用樣本或總體的一些數(shù)值屬性構(gòu)造“統(tǒng)計(jì)量”(如 t 統(tǒng)計(jì)量、F 統(tǒng)計(jì)量),然后利用統(tǒng)計(jì)量所服從的某種已知分布來評(píng)價(jià)某種情況是不是“小概率事件”,進(jìn)而拒絕原假設(shè)的方法。 參數(shù)檢驗(yàn)要求樣本是獨(dú)立的、隨機(jī)的,

2、并且來自同一個(gè)正態(tài)總體,以便得到的統(tǒng)計(jì)量確實(shí)服從某種已知分布。,(二)非參數(shù)檢驗(yàn),如果樣本來源的總體并非正態(tài)的,但樣本規(guī)模很大且總體的偏態(tài)不明顯,參數(shù)檢驗(yàn)也有一定的適用性; 如果樣本來源的總體并非正態(tài)的,同時(shí)樣本規(guī)模很少,這時(shí)利用參數(shù)檢驗(yàn)就會(huì)得到錯(cuò)誤的結(jié)論。,非參數(shù)檢驗(yàn)解決了這一問題,它也需要人為地構(gòu)造一些統(tǒng)計(jì)量,但這些構(gòu)造出來的統(tǒng)計(jì)量并不使用樣本的均值或方差等這類對(duì)分布非常敏感的統(tǒng)計(jì)量,也不對(duì)總體分布的正態(tài)性提出要求,這種方法被稱作“非參數(shù)檢驗(yàn)”。,7.2 單樣本的非參數(shù)檢驗(yàn),單樣本的非參數(shù)檢驗(yàn),在進(jìn)行參數(shù)檢驗(yàn)之前,可以先利用非參數(shù)檢驗(yàn)看一下數(shù)據(jù)來自什么樣的總體,即判斷樣本的分布形狀,然后有

3、針對(duì)性地在參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)之間做出選擇。 擬合優(yōu)度檢驗(yàn):判斷分布形狀的非參數(shù)檢驗(yàn)。把實(shí)際觀測(cè)到的樣本與一個(gè)理論上的某種分布所對(duì)應(yīng)的理論預(yù)測(cè)值進(jìn)行比較,檢驗(yàn)兩者是否有顯著的差異。包括: 隨機(jī)性檢驗(yàn) 正態(tài)性檢驗(yàn) 比例檢驗(yàn),(一)隨機(jī)性檢驗(yàn)游程檢驗(yàn)(Runs Test),用于檢驗(yàn)樣本是否是隨機(jī)抽樣的結(jié)果。 游程:是指樣本序列中連續(xù)出現(xiàn)相同變量值的次數(shù)。 如投擲硬幣出現(xiàn)正反兩面的變量值序列為1011011010011000101010000111。 其中連續(xù)的1有9組,連續(xù)的0有8組,這一序列總的游程數(shù)量為17。 如果硬幣的正反面出現(xiàn)是隨機(jī)的,那么在該序列中,許多個(gè)1或許多個(gè)0連續(xù)出現(xiàn)的可能性都不

4、大,且1和0頻繁交叉出現(xiàn)的可能性也非常小,因此,游程數(shù)太大或太小都將表明變量值存在不隨機(jī)的現(xiàn)象。 故游程檢驗(yàn)是對(duì)二分變量的隨機(jī)檢驗(yàn),可用于判斷觀察值的順序是否隨機(jī)。,(一)隨機(jī)性檢驗(yàn)游程檢驗(yàn)(Runs Test),隨機(jī)性檢驗(yàn)的原假設(shè)為:總體變量值出現(xiàn)是隨機(jī)的。 分析非參數(shù)檢驗(yàn)舊對(duì)話框游程,例:從性別的角度檢驗(yàn)數(shù)據(jù)“手機(jī)購買.sav”是否為隨機(jī)抽樣。,選入二分變量,規(guī)定分界點(diǎn),(一)隨機(jī)性檢驗(yàn)游程檢驗(yàn)(Runs Test),結(jié)果說明,概值大于0.05,因此可以接受Runs檢驗(yàn)的原假設(shè),即就性別而言,數(shù)據(jù)來自一次隨機(jī)抽樣。,(二)正態(tài)性檢驗(yàn)單樣本K-S檢驗(yàn),單樣本K-S檢驗(yàn)的原假設(shè):樣本所屬的總體

5、與指定的理論分布一致。 分析非參數(shù)檢驗(yàn)舊對(duì)話框1-樣本 K-S,例:針對(duì)“社團(tuán).sav”,分析參加社團(tuán)活動(dòng)的時(shí)間是否服從正態(tài)分布。,正態(tài)分布,均勻分布,泊松分布,指數(shù)分布,(二)正態(tài)性檢驗(yàn)單樣本K-S檢驗(yàn),結(jié)果說明,概值小于0.05,因此拒絕原假設(shè),即參與社團(tuán)活動(dòng)的時(shí)間不服從正態(tài)分布。,(三)二項(xiàng)分布檢驗(yàn)(Binominal Test),對(duì)于任何僅可分成兩類的總體,如果已知其中一類事件所占的比例為P,那么另一類所占的比例必定是1-P,用Q表示。 對(duì)于同一個(gè)總體,P值總是固定的。但在抽樣過程中,每次抽樣所得的P值都有可能不同。 二項(xiàng)分布就是從二分類的總體中抽得的隨機(jī)樣本中可觀察到的兩類比例的抽樣

6、分布??疾烀總€(gè)類別中觀察值的頻數(shù)與特定二項(xiàng)分布下的預(yù)期頻數(shù)間是否存在統(tǒng)計(jì)學(xué)差異,是對(duì)二分類變量的擬合優(yōu)度檢驗(yàn)。 原假設(shè):總體中第一類事件的比例是P。,(三)二項(xiàng)分布檢驗(yàn)(Binominal Test),二項(xiàng)分布檢驗(yàn)的原假設(shè):總體中第一類事件的比例是P。 分析非參數(shù)檢驗(yàn)舊對(duì)話框二項(xiàng)式,例:針對(duì)“住房狀況調(diào)查.sav”,分析外地戶口的比例是否為15%。,輸入檢驗(yàn)變量中第一類事件的比例。,(三)二項(xiàng)分布檢驗(yàn)(Binominal Test),結(jié)果說明,單尾 檢驗(yàn)的概值小于5%,則拒絕原假設(shè),認(rèn)為外地戶口的比例不是15%。從觀測(cè)比例來看,應(yīng)小于15%。,觀測(cè)比例,檢驗(yàn)比例,(三)二項(xiàng)分布檢驗(yàn)(Binom

7、inal Test),例:針對(duì)“住房狀況調(diào)查.sav”,分析現(xiàn)住面積在100平米以上的是否為20%.,輸入檢驗(yàn)變量中第一類事件的比例。,確定分割點(diǎn),7.3 雙獨(dú)立樣本的非參數(shù)檢驗(yàn),(一)秩和檢驗(yàn)的原理,獨(dú)立樣本的t 檢驗(yàn)時(shí),要求數(shù)據(jù)來自正態(tài)分布總體的獨(dú)立隨機(jī)樣本?;蛘吒鶕?jù)中心極限定理,樣本容量足夠大,其均值的抽樣分布近似正態(tài)分布。 而在樣本容量較小的情況下,如果樣本呈非正態(tài)分布,這時(shí)就要考慮以一種更合理的非參數(shù)檢驗(yàn)方法來代替獨(dú)立樣本的t檢驗(yàn)。即秩和檢驗(yàn)。,(一)秩和檢驗(yàn)的原理,假設(shè)從兩個(gè)未知的總體中分別獨(dú)立、隨機(jī)地各抽取一個(gè)樣本,把兩個(gè)樣本中的案例合并起來,然后按照案例值的大小進(jìn)行排序編號(hào),每

8、個(gè)數(shù)據(jù)的編號(hào)就是它的秩。 如果混合樣本中有相同的數(shù)值,就在其所在的位置將這幾個(gè)相同的秩求平均,作為這幾個(gè)案例值相同數(shù)值的秩。,(一)秩和檢驗(yàn)的原理,分別計(jì)算來自兩個(gè)樣本的案例值的秩的和。 如果兩個(gè)樣本具有相同分布,它們的秩和的均值應(yīng)該相等。否則,則可推斷兩總體的分布是有差異的。,(二)雙獨(dú)立樣本的非參數(shù)檢驗(yàn),此例適用于雙獨(dú)立樣本的T檢驗(yàn)。但通過正態(tài)性檢驗(yàn)發(fā)現(xiàn),數(shù)據(jù)不符合正態(tài)分布。 樣本量足夠大的情況下,即使違反正態(tài)性假設(shè),T檢驗(yàn)也適用。 此時(shí)可做完T檢驗(yàn)后再進(jìn)一步用雙獨(dú)立樣本的非參數(shù)檢驗(yàn)加以驗(yàn)證。 分析非參數(shù)檢驗(yàn)舊對(duì)話框2個(gè)獨(dú)立樣本,針對(duì)數(shù)據(jù)“住房狀況調(diào)查.sav”,分析本市戶口和外地戶口的現(xiàn)

9、住面積和計(jì)劃面積有無顯著差異。,(二)雙獨(dú)立樣本的非參數(shù)檢驗(yàn),(二)雙獨(dú)立樣本的非參數(shù)檢驗(yàn),本市戶口和外地戶口的現(xiàn)住面積差異顯著,計(jì)劃面積差異不顯著。,7.4 多獨(dú)立樣本的非參數(shù)檢驗(yàn),多獨(dú)立樣本的非參數(shù)檢驗(yàn),我們?cè)谧鲎宰兞克綖閮蓚€(gè)以上的均值比較時(shí),一般采用方差分析。 方差分析是一種非常穩(wěn)健的統(tǒng)計(jì)分析方法,即在違反數(shù)據(jù)要求的情況下往往仍然能夠得到科學(xué)的結(jié)果。 當(dāng)數(shù)據(jù)的正態(tài)性假設(shè)不能滿足的情況下,可進(jìn)一步采用多獨(dú)立樣本的非參數(shù)檢驗(yàn)來進(jìn)一步說明問題。,多獨(dú)立樣本的非參數(shù)檢驗(yàn),在對(duì)參加社團(tuán)活動(dòng)的時(shí)間做正態(tài)性檢驗(yàn)時(shí),發(fā)現(xiàn)“time”變量不能通過正態(tài)性檢驗(yàn)。,例:數(shù)據(jù)社團(tuán).sav中,比較低年級(jí)學(xué)生、本科

10、高年級(jí)學(xué)生、碩士生和博士生參加社團(tuán)活動(dòng)的時(shí)間是否有差別。,多獨(dú)立樣本的非參數(shù)檢驗(yàn),違反正態(tài)性假設(shè)的前提下,仍可以做方差分析。,方差分析結(jié)果顯著。此時(shí)可進(jìn)一步進(jìn)行非參數(shù)檢驗(yàn)。,多獨(dú)立樣本的非參數(shù)檢驗(yàn),分析非參數(shù)檢驗(yàn)舊對(duì)話框K個(gè)獨(dú)立樣本,利用秩次進(jìn)行檢驗(yàn),原假設(shè)為K組變量都來自相同的一個(gè)分布,但不一定要求是正態(tài)的,可以在違反正態(tài)性假設(shè)的情況下代替方差分析。,中位數(shù)檢驗(yàn),多獨(dú)立樣本的非參數(shù)檢驗(yàn),結(jié)果說明:,秩次越高,參加社團(tuán)活動(dòng)的時(shí)間越多。,各組差異顯著,定序變量的秩和檢驗(yàn),多獨(dú)立樣本的非參數(shù)檢驗(yàn)(秩和檢驗(yàn)),可以對(duì)定序變量進(jìn)行多組比較,而 t 檢驗(yàn)和方差分析的因變量只能是定距!,例:利用財(cái)經(jīng)節(jié)目.

11、sav分析不同受教育程度對(duì)財(cái)經(jīng)節(jié)目的喜好程度有無差異。,秩次越高,對(duì)財(cái)經(jīng)節(jié)目的喜好程度越低。,各組差異顯著,7.6 配對(duì)樣本的非參數(shù)檢驗(yàn),配對(duì)樣本的非參數(shù)檢驗(yàn),在 t 檢驗(yàn)中,配對(duì)樣本的t 檢驗(yàn)要求前后測(cè)的數(shù)據(jù)來自正態(tài)總體。當(dāng)樣本不服從正態(tài)總體時(shí),利用配對(duì)樣本的t 檢驗(yàn)便可能對(duì)結(jié)論產(chǎn)生嚴(yán)重誤導(dǎo)。這時(shí)可以用配對(duì)樣本的非參數(shù)檢驗(yàn)方法。,例:對(duì)20個(gè)人進(jìn)行了一次心理學(xué)上關(guān)于自負(fù)程度的測(cè)試,分?jǐn)?shù)越高表示自負(fù)的程度也越高。對(duì)受試者自負(fù)程度先進(jìn)行前測(cè),經(jīng)過一定的指導(dǎo)后,再進(jìn)行后測(cè),試分析這種指導(dǎo)是否減少自負(fù)是否有作用。數(shù)據(jù)見自負(fù)程度.sav。,進(jìn)行正態(tài)性檢驗(yàn)知,樣本并不服從正態(tài)總體。因此不能采用t 檢驗(yàn),

12、考慮用配對(duì)樣本的非參數(shù)檢驗(yàn)。,配對(duì)樣本的非參數(shù)檢驗(yàn),原假設(shè):前后測(cè)的差值為0(這種指導(dǎo)沒有作用) 備擇假設(shè):后測(cè)-前測(cè)0 分析非參數(shù)檢驗(yàn)舊對(duì)話框2個(gè)相關(guān)樣本,Wilcoxon檢驗(yàn)和Sign檢驗(yàn)都是假設(shè)前后測(cè)的數(shù)據(jù)有相同的形狀分布,即兩個(gè)分布有同樣的均值和方差。 因此,配對(duì)樣本的非參數(shù)檢驗(yàn)并不關(guān)心分布的具體類型。,配對(duì)樣本的非參數(shù)檢驗(yàn),結(jié)果說明,P值小于5%,說明前后測(cè)的差值是顯著的。,7.7 多配對(duì)樣本的非參數(shù)檢驗(yàn),多配對(duì)樣本的非參數(shù)檢驗(yàn),多配對(duì)樣本的非參數(shù)檢驗(yàn)是通過分析多組配對(duì)樣本數(shù)據(jù),推斷樣本來自的多個(gè)總體的中位數(shù)或分布是否存在顯著差異。 數(shù)據(jù)要求: 各個(gè)樣本為隨機(jī)樣本 各個(gè)樣本的數(shù)據(jù)是配

13、對(duì)的,即相關(guān)樣本,各個(gè)樣本的容量相同。 檢驗(yàn)方法為弗瑞德曼(Friedman)檢驗(yàn)和肯德爾(Kendall)協(xié)同系數(shù)檢驗(yàn)時(shí),樣本應(yīng)是定序、定距或定比數(shù)據(jù)。 檢驗(yàn)方法為克科倫(Cochran)Q檢驗(yàn)時(shí),樣本應(yīng)是二分變量。,(一) Friedman檢驗(yàn),例:為比較三種促銷形式對(duì)商品銷售的影響,收集若干種商品在不同促銷形式下的月銷售額數(shù)據(jù)如下。試分析三種促銷形式對(duì)銷售額的影響有無顯著差異。見數(shù)據(jù)“促銷方式.sav”,(一) Friedman檢驗(yàn),檢驗(yàn)思路:如果三種促銷形式?jīng)]有顯著差異,那么銷售額排序后的秩和應(yīng)相等。,(一) Friedman檢驗(yàn),分析非參數(shù)檢驗(yàn)舊對(duì)話框K個(gè)相關(guān)樣本,(一) Fried

14、man檢驗(yàn),結(jié)果說明,P值小于5%,說明三種促銷形式下商品的銷售額有顯著差異。,促銷形式2的商品銷售額最高。,(二) Kendall協(xié)同系數(shù)檢驗(yàn),例:有6名歌手參加比賽,4名評(píng)委進(jìn)行評(píng)判打分。試推斷這4個(gè)評(píng)委的評(píng)判標(biāo)準(zhǔn)是否一致。數(shù)據(jù)見“評(píng)委打分.sav”。,Kendall協(xié)同系數(shù)檢驗(yàn)主要是一致性檢驗(yàn)。,(二) Kendall協(xié)同系數(shù)檢驗(yàn),例:有6名歌手參加比賽,4名評(píng)委進(jìn)行評(píng)判打分。試推斷這4個(gè)評(píng)委的評(píng)判標(biāo)準(zhǔn)是否一致。數(shù)據(jù)見“評(píng)委打分.sav”。,此問題可先進(jìn)行Friedman檢驗(yàn),考察6個(gè)歌手的水平是否存在顯著差異。 如果Friedman檢驗(yàn)顯著,則進(jìn)一步進(jìn)行Kendall協(xié)同系數(shù)檢驗(yàn)。 K

15、endalls W協(xié)同系數(shù)在0-1之間,W系數(shù)越接近于1,說明越具有一致性;反之,越不具有一致性。,(二) Kendall協(xié)同系數(shù)檢驗(yàn),分析非參數(shù)檢驗(yàn)舊對(duì)話框K個(gè)相關(guān)樣本,(二) Kendall協(xié)同系數(shù)檢驗(yàn),結(jié)果說明,Friedman Test,Kendalls W Test,Friedman檢驗(yàn)結(jié)果顯著,說明歌手的水平間存在顯著差異。此時(shí)可進(jìn)一步進(jìn)行Kendall協(xié)同系數(shù)檢驗(yàn)推斷專家評(píng)分的一致性。,Kendall檢驗(yàn)結(jié)果顯著,說明專家的評(píng)判標(biāo)準(zhǔn)一致。同時(shí)W系數(shù)接近于1,進(jìn)一步說明專家的評(píng)判標(biāo)準(zhǔn)一致。,(三) Cochran Q檢驗(yàn),Cochran Q檢驗(yàn)主要用于二分變量的檢驗(yàn)。,例:數(shù)據(jù)見“

16、航空公司.sav”是15名乘客對(duì)三家航空公司是否滿意的數(shù)據(jù)(1表示滿意,0表示不滿意)。試推斷三家航空公司的服務(wù)水平是否有顯著差異。,Cochran Q檢驗(yàn)的思路:如果三家航空公司的服務(wù)水平?jīng)]有顯著差異,則其得到乘客選1的可能性是相等的。,(三) Cochran Q檢驗(yàn),分析非參數(shù)檢驗(yàn)舊對(duì)話框K個(gè)相關(guān)樣本,Cochran Q檢驗(yàn)結(jié)果顯著,說明三家航空公司的服務(wù)水平存在顯著差異。,(三) Cochran Q檢驗(yàn),結(jié)果說明,甲公司得到的滿意最多,不滿意最少。,本章練習(xí),1、針對(duì)數(shù)據(jù)“住房狀況調(diào)查.sav” 分析學(xué)歷在高中以上的比例是否為80%。 分析人均面積在20平方米以下的是否為70%。 2、在電視歌手大獎(jiǎng)賽中,同時(shí)聘請(qǐng)專家和群眾對(duì)歌手進(jìn)行打分,評(píng)分結(jié)果如下,試比較專家和群眾的評(píng)分是否有顯著差異。 專家:90.5 91.5 93.5 94 群眾:93 95 96 97 98 3、某電信公司從3所大學(xué)招聘管理人員,從而來源于3所不同大學(xué)的雇員組成了3組獨(dú)立的樣本。半年試用期滿后,人力資源部對(duì)他們進(jìn)行了考核,并評(píng)出了這些雇員的表現(xiàn)成績,見數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論