第六章非參數(shù)檢驗(yàn)_第1頁(yè)
第六章非參數(shù)檢驗(yàn)_第2頁(yè)
第六章非參數(shù)檢驗(yàn)_第3頁(yè)
第六章非參數(shù)檢驗(yàn)_第4頁(yè)
第六章非參數(shù)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章非參數(shù)檢驗(yàn)第1頁(yè),共42頁(yè),2023年,2月20日,星期三主要內(nèi)容非參數(shù)檢驗(yàn)和參數(shù)檢驗(yàn)的區(qū)別總體分布的卡方檢驗(yàn)二項(xiàng)分布檢驗(yàn)SPSS單樣本變量值隨機(jī)性檢驗(yàn)SPSS單樣本K-S檢驗(yàn)兩獨(dú)立樣本非參數(shù)檢驗(yàn)多獨(dú)立樣本非參數(shù)檢驗(yàn)兩配對(duì)樣本非參數(shù)檢驗(yàn)多配對(duì)樣本非參數(shù)檢驗(yàn)第2頁(yè),共42頁(yè),2023年,2月20日,星期三非參數(shù)檢驗(yàn)簡(jiǎn)介參數(shù)檢驗(yàn)方法檢驗(yàn)的內(nèi)容是總體分布的某些參數(shù),例如均值,方差,比率等。非參數(shù)檢驗(yàn)主要用于不考慮被研究對(duì)象的總體分布,或?qū)傮w的分布不做任何事先的假定的檢驗(yàn)。非參數(shù)檢驗(yàn)的內(nèi)容不是總體分布的某些參數(shù),而是檢驗(yàn)總體某些有關(guān)的性質(zhì),例如總體的分布位置、分布形狀之間的比較,或者各樣本所在總體是否獨(dú)立等。第3頁(yè),共42頁(yè),2023年,2月20日,星期三非參數(shù)檢驗(yàn)方法的優(yōu)點(diǎn)穩(wěn)健性:因?qū)傮w分布的約束條件放寬,從而對(duì)一些離群值或極端值不至于太敏感。使用范圍廣:對(duì)數(shù)據(jù)的度量標(biāo)準(zhǔn)(或測(cè)量測(cè)度)無(wú)約束,定序數(shù)據(jù)、定量數(shù)據(jù)都可;部分?jǐn)?shù)據(jù)缺失也可;小樣本、分布未知樣本、數(shù)據(jù)污染樣本、混雜樣本等都可以應(yīng)用非參數(shù)方法。第4頁(yè),共42頁(yè),2023年,2月20日,星期三非參數(shù)檢驗(yàn)的應(yīng)用范圍參數(shù)檢驗(yàn)方法的條件不滿足。例如樣本來(lái)自的總體不服從正態(tài)分布,T檢驗(yàn)不適用,必須應(yīng)用非參數(shù)方法來(lái)比較兩個(gè)總體的中心趨勢(shì)。研究定類變量和定序變量之間的關(guān)系。第5頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS非參數(shù)檢驗(yàn)第6頁(yè),共42頁(yè),2023年,2月20日,星期三非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)根據(jù)樣本數(shù)目以及樣本之間的關(guān)系可以分為:?jiǎn)螛颖痉菂?shù)檢驗(yàn)兩獨(dú)立樣本非參數(shù)檢驗(yàn)多獨(dú)立樣本非參數(shù)檢驗(yàn)兩配對(duì)樣本非參數(shù)檢驗(yàn)多配對(duì)樣本非參數(shù)檢驗(yàn)第7頁(yè),共42頁(yè),2023年,2月20日,星期三單樣本非參數(shù)檢驗(yàn)SPSS的單樣本非參數(shù)檢驗(yàn)方法包括:總體分布的卡方(Chi-square)檢驗(yàn)二項(xiàng)分布(Binomial)檢驗(yàn)單樣本K-S(Kolmogorov-Smirnov)檢驗(yàn)單樣本變量值隨機(jī)性檢驗(yàn)(RunsTest)第8頁(yè),共42頁(yè),2023年,2月20日,星期三卡方檢驗(yàn)卡方檢驗(yàn)是一種常用的對(duì)總體分布進(jìn)行檢驗(yàn)的非參數(shù)檢驗(yàn)方法。例如,醫(yī)生研究心臟病人猝死人數(shù)與日期的關(guān)系,檢驗(yàn)現(xiàn)在的人口結(jié)構(gòu)和十年前是否一樣,血型是否和人的性格有關(guān)系,現(xiàn)代社會(huì)中受過(guò)高等教育、高中畢業(yè)、初中畢業(yè)、小學(xué)畢業(yè)和文盲的比例是否為3:6:10:2:1等問(wèn)題都可以通過(guò)卡方檢驗(yàn)來(lái)實(shí)現(xiàn)。第9頁(yè),共42頁(yè),2023年,2月20日,星期三卡方檢驗(yàn)的定義定義:總體分布的卡方檢驗(yàn)適用于配合度檢驗(yàn),是根據(jù)樣本數(shù)據(jù)的實(shí)際頻數(shù)推斷總體分布與期望分布或理論分布是否有顯著差異??ǚ綑z驗(yàn)的原假設(shè)是:H0樣本來(lái)自的總體的分布與假設(shè)的分布(又稱期望分布或者理論分布)無(wú)顯著差異。第10頁(yè),共42頁(yè),2023年,2月20日,星期三卡方檢驗(yàn)的原理(1)卡方檢驗(yàn)的基本思想是,如果從一個(gè)隨機(jī)變量X所在的總體中隨機(jī)抽取若干個(gè)觀察樣本,這些觀察樣本落在X的k個(gè)互不相交的子集中的觀測(cè)頻數(shù)服從一個(gè)多項(xiàng)分布,這個(gè)多項(xiàng)分布當(dāng)k趨于無(wú)窮時(shí)近似服從卡方分布。第11頁(yè),共42頁(yè),2023年,2月20日,星期三卡方檢驗(yàn)的原理(2)因此假設(shè)樣本來(lái)自總體服從某個(gè)期望分布或理論分布,同時(shí)獲得樣本數(shù)據(jù)各子集的實(shí)際觀察頻數(shù),并根據(jù)下面的公式計(jì)算統(tǒng)計(jì)量Q,作出推斷:其中,Qi表示觀察頻數(shù),Ei表示期望頻數(shù)或理論頻數(shù)??梢?jiàn)Q值越大,表示觀察頻數(shù)和理論頻數(shù)越不接近;Q值越小,說(shuō)明觀察頻數(shù)和理論頻數(shù)越接近。第12頁(yè),共42頁(yè),2023年,2月20日,星期三卡方檢驗(yàn)的原理(3)SPSS將自動(dòng)計(jì)算Q統(tǒng)計(jì)量,由于Q統(tǒng)計(jì)量服從自由度為k-1的卡方分布,因此SPSS將根據(jù)卡方分布表給出Q統(tǒng)計(jì)量所對(duì)應(yīng)的相伴概率值。如果相伴概率小于或等于顯著性水平α,則應(yīng)拒絕零假設(shè)H0,認(rèn)為樣本來(lái)自的總體分布形態(tài)與期望分布或理論分布存在顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為樣本來(lái)自的總體分布形態(tài)與期望分布或理論分布不存在顯著差異。第13頁(yè),共42頁(yè),2023年,2月20日,星期三卡方檢驗(yàn)例子某地一周內(nèi)各日患憂郁癥的人數(shù)分布如下表所示,請(qǐng)檢驗(yàn)一周內(nèi)各日患憂郁癥人數(shù)是否滿足1:1:2:2:1:1:1第14頁(yè),共42頁(yè),2023年,2月20日,星期三單擊Data菜單中的WeightCases命令,彈出WeightCases對(duì)話框,選中Weightcasesby選項(xiàng),將變量“患者數(shù)”添加到FrequencyVariable框中,定義該變量為權(quán)數(shù),再單擊OK按鈕,返回?cái)?shù)據(jù)編輯窗口。第15頁(yè),共42頁(yè),2023年,2月20日,星期三第16頁(yè),共42頁(yè),2023年,2月20日,星期三彈出Chi-SquareTest對(duì)話框,要對(duì)一周內(nèi)各日的人數(shù)進(jìn)行分布分析,故在對(duì)話框左側(cè)的變量列表中選擇“周日”變量,使之添加到TestVariableList框中。確定待檢驗(yàn)樣本的取值范圍所有數(shù)據(jù)都參加檢驗(yàn)用戶自定義一個(gè)取值范圍,只有在這個(gè)范圍內(nèi)的數(shù)據(jù)才參與檢驗(yàn)給出期望分布的頻數(shù)表示所有分組的期望頻數(shù)都相同,即期望分布為均勻分布要求用戶輸入期望分布的頻率數(shù),通過(guò)單擊Add(增加),Change(更改),Remove(刪除)按鈕對(duì)期望分布進(jìn)行操作第17頁(yè),共42頁(yè),2023年,2月20日,星期三單擊Chi-SquareTest對(duì)話框中的Options按鈕,打開(kāi)上圖對(duì)話框。Options對(duì)話框中的Statistics框用來(lái)指定輸出附加的分析結(jié)果,其中:Descriptive:表示輸出待檢驗(yàn)變量的描述統(tǒng)計(jì)量Quartiles:表示輸出待檢驗(yàn)變量的四分位數(shù)MissingValues框用來(lái)說(shuō)明缺失值如何處理,其中:Excludecasestest-by-test:表示當(dāng)分析計(jì)算涉及到含有缺失值的變量時(shí),則去掉在該變量上是缺失值的個(gè)案Excludecaseslistwise:表示去除所有含缺失值的個(gè)案后再進(jìn)行分析第18頁(yè),共42頁(yè),2023年,2月20日,星期三結(jié)果分析第一個(gè)表中,周一到周日實(shí)際患病的人數(shù)(ObservedN)分別為31、38、70、80、29、24、31,按照給定的理論分布,這一周各天的期望頻數(shù)(ExpectedN)應(yīng)為33.7、33.7、67.3、67.3、33.7、33.7、33.7。實(shí)際觀察頻數(shù)和期望頻數(shù)的差(Residual)分別為-2.7、4.3、2.7、12.7、-4.7、-9.7、-2.7第二表中,Asymp.Sig值即相伴概率值0.331,大于顯著性水平0.05,因此不能拒絕零假設(shè),可以認(rèn)為樣本來(lái)自的總體分布與指定的期望分布無(wú)顯著差異,即憂郁癥患病人數(shù)在一周內(nèi)的比例關(guān)系基本是1:1:2:2:1:1:1第19頁(yè),共42頁(yè),2023年,2月20日,星期三二項(xiàng)分布檢驗(yàn)現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值只有兩類,如醫(yī)學(xué)中的生與死、患病的有與無(wú)、性別中的男與女、產(chǎn)品的合格與不合格等。從這種二分類總體中抽取的所有可能結(jié)果,要么是對(duì)立分類中的這一類,要么是另一類,其頻數(shù)分布稱為二項(xiàng)分布。SPSS二項(xiàng)分布檢驗(yàn)就是根據(jù)收集到的樣本數(shù)據(jù),推斷總體分布是否服從某個(gè)指定的二項(xiàng)分布。第20頁(yè),共42頁(yè),2023年,2月20日,星期三二項(xiàng)分布檢驗(yàn)其零假設(shè)是:樣本來(lái)自的總體與所指定的某個(gè)二項(xiàng)分布不存在顯著的差異。如果相伴概率小于或等于顯著性水平α,則應(yīng)拒絕零假設(shè)H0,認(rèn)為樣本來(lái)自的總體分布形態(tài)與指定的二項(xiàng)分布存在顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為樣本來(lái)自的總體分布形態(tài)與指定的二項(xiàng)分布不存在顯著差異。第21頁(yè),共42頁(yè),2023年,2月20日,星期三二項(xiàng)分布檢驗(yàn)例:某地某一時(shí)期內(nèi)出生35名嬰兒,其中女性19名,男性16名,問(wèn)這個(gè)地方出生嬰兒的性別比例與通常的男女比例(總體概率約為0.5)是否不同?第22頁(yè),共42頁(yè),2023年,2月20日,星期三在Analyze菜單NonparametricTests中選擇BinomialTest命令第23頁(yè),共42頁(yè),2023年,2月20日,星期三在彈出的BinomialTest對(duì)話框中,將變量“性別”添加到TestVariableList框中。DefineDichotomy用來(lái)確定待檢驗(yàn)樣本的取值范圍。其中:Getfromdata:表示所有觀察數(shù)據(jù)都參與檢驗(yàn),而且這些數(shù)據(jù)本身就是二值數(shù)據(jù)的情況。Cutpoint:如果檢驗(yàn)變量的數(shù)據(jù)不是二值數(shù)據(jù),則可以選擇該項(xiàng),并在這里輸入一個(gè)分割點(diǎn),小于該分割點(diǎn)值的觀察值為一類,大于該值為另外一類。輸入二項(xiàng)分布的檢驗(yàn)概率值第24頁(yè),共42頁(yè),2023年,2月20日,星期三單擊BinomialTest對(duì)話框中的Options按鈕,打開(kāi)上圖對(duì)話框。Options對(duì)話框中的Statistics框用來(lái)指定輸出附加的分析結(jié)果,其中:Descriptive:表示輸出待檢驗(yàn)變量的描述統(tǒng)計(jì)量Quartiles:表示輸出待檢驗(yàn)變量的四分位數(shù)MissingValues框用來(lái)說(shuō)明缺失值如何處理,其中:Excludecasestest-by-test:表示當(dāng)分析計(jì)算涉及到含有缺失值的變量時(shí),則去掉在該變量上是缺失值的個(gè)案Excludecaseslistwise:表示去除所有含缺失值的個(gè)案后再進(jìn)行分析第25頁(yè),共42頁(yè),2023年,2月20日,星期三結(jié)果分析總共35個(gè)觀察數(shù)據(jù),男性16人,女性19人,分別占的比率(ObservedProp.)為0.46和0.54,最后一列(Asymp.Sig.)給出相伴概率為0.736,大于顯著性水平0.05,因此不能拒絕零假設(shè),認(rèn)為該地區(qū)出生的嬰兒性別比例相等。第26頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS單樣本變量值隨機(jī)性檢驗(yàn)定義:?jiǎn)螛颖咀兞恐档碾S機(jī)性檢驗(yàn)是對(duì)某變量的取值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn),也稱為游程檢驗(yàn)(Run過(guò)程)。例如,某村發(fā)生一種地方病,其住戶沿一條河居住,調(diào)查時(shí)對(duì)發(fā)病的住戶標(biāo)記為“1”,對(duì)非發(fā)病住戶標(biāo)記為“0”。經(jīng)過(guò)調(diào)查就可以得到一個(gè)以1、0組成的數(shù)據(jù)序列,如101110000111010.人們就會(huì)問(wèn),這種病的出現(xiàn)是否具有隨機(jī)性。要研究這個(gè)問(wèn)題,就需要對(duì)上面的0、1序列進(jìn)行分析,通過(guò)驗(yàn)證0、1出現(xiàn)是否隨機(jī)來(lái)判定該病出現(xiàn)是否具有隨機(jī)性。第27頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS單樣本變量值隨機(jī)性檢驗(yàn)單樣本變量值隨機(jī)性檢驗(yàn)的零假設(shè)是:總體某變量的變量值出現(xiàn)是隨機(jī)的。單樣本變量值隨機(jī)性檢驗(yàn)通過(guò)游程(Run)數(shù)來(lái)實(shí)現(xiàn)。所謂游程是樣本序列中連續(xù)出現(xiàn)的變量值的次數(shù)。如果該地方病的出現(xiàn)是隨機(jī)的,那么在上面的數(shù)據(jù)序列中,將不太可能有許多0或1連續(xù)出現(xiàn)的情況,同時(shí)也不太可能出現(xiàn)1和0交叉頻繁的現(xiàn)象。因此出現(xiàn)太少或太多的游程就表明相應(yīng)的變量值出現(xiàn)在一定程度上不是隨機(jī)的。第28頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS單樣本變量值隨機(jī)性檢驗(yàn)在SPSS單樣本變量值隨機(jī)性檢驗(yàn)中,SPSS將利用游程構(gòu)造Z統(tǒng)計(jì)量,并依據(jù)正態(tài)分布表給出對(duì)應(yīng)的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平α,則應(yīng)拒絕零假設(shè),認(rèn)為樣本值的出現(xiàn)不是隨機(jī)的;如果相伴概率大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為變量值的出現(xiàn)是隨機(jī)的。第29頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS單樣本變量值隨機(jī)性檢驗(yàn)例,某村發(fā)生一種地方病,其住戶沿一條河居住,調(diào)查時(shí)對(duì)發(fā)病的住戶標(biāo)記為“1”,對(duì)非發(fā)病住戶標(biāo)記為“0”,共35戶居民,問(wèn)這種病的出現(xiàn)是否具有隨機(jī)性。第30頁(yè),共42頁(yè),2023年,2月20日,星期三在彈出的RunsTest對(duì)話框中,在左側(cè)的變量列表中選擇“發(fā)病情況”變量,使之添加到TestVariableList框中。在臨近割點(diǎn)CutPoint框中有4個(gè)選項(xiàng):Median:中位數(shù)作臨界割點(diǎn),在臨界割點(diǎn)之下的為一類,大于或等于臨界割點(diǎn)的為另一類。Mode:眾數(shù)作臨界割點(diǎn),在臨界割點(diǎn)之下的為一類,大于或等于臨界割點(diǎn)的為另一類。Mean:均數(shù)作臨界割點(diǎn),在臨界割點(diǎn)之下的為一類,大于或等于臨界割點(diǎn)的為另一類。Custom:用戶指定臨界割點(diǎn),在臨界割點(diǎn)之下的為一類,大于或等于臨界割點(diǎn)的為另一類。本例選擇Custom項(xiàng),在其方框中輸入1(根據(jù)需要選項(xiàng),本例是0、1二分變量,故臨界割點(diǎn)值是1.)第31頁(yè),共42頁(yè),2023年,2月20日,星期三單擊RunsTest對(duì)話框中的Options按鈕,打開(kāi)上圖對(duì)話框。Options對(duì)話框中的Statistics框用來(lái)指定輸出附加的分析結(jié)果,其中:Descriptive:表示輸出待檢驗(yàn)變量的描述統(tǒng)計(jì)量Quartiles:表示輸出待檢驗(yàn)變量的四分位數(shù)MissingValues框用來(lái)說(shuō)明缺失值如何處理,其中:Excludecasestest-by-test:表示當(dāng)分析計(jì)算涉及到含有缺失值的變量時(shí),則去掉在該變量上是缺失值的個(gè)案Excludecaseslistwise:表示去除所有含缺失值的個(gè)案后再進(jìn)行分析第32頁(yè),共42頁(yè),2023年,2月20日,星期三結(jié)果分析從結(jié)果表格中看出,總共35個(gè)觀察數(shù)據(jù),游程數(shù)(NumberofRuns)為14,測(cè)試值(TestValue)為1,得到的相伴概率為0.181,大于顯著性水平0.05,因此不能拒絕零假設(shè),認(rèn)為患病的住戶沿河分布的情況無(wú)聚集性,而是呈隨機(jī)分布。第33頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS單樣本K-S檢驗(yàn)定義:?jiǎn)螛颖綤-S檢驗(yàn)是以兩位前蘇聯(lián)數(shù)學(xué)家Kolmogorov和Smirnov命名的,也是一種擬合優(yōu)度的非參數(shù)檢驗(yàn)方法。單樣本K-S檢驗(yàn)是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)型隨機(jī)變量的分布形態(tài)。單樣本K-S檢驗(yàn)可以將一個(gè)變量的實(shí)際頻數(shù)分布與正態(tài)分布(Normal)、均勻分布(Uniform)、泊松分布(Poisson)、指數(shù)(Exponential)分布進(jìn)行比較。第34頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS單樣本K-S檢驗(yàn)SPSS單樣本K-S檢驗(yàn)的零假設(shè)為:樣本來(lái)自的總體與指定的理論分布無(wú)顯著差異。SPSS在統(tǒng)計(jì)中將計(jì)算K-S的Z統(tǒng)計(jì)量。并依據(jù)K-S分布表(小樣本)或正態(tài)分布表(大樣本)給出對(duì)應(yīng)的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平α,則應(yīng)拒絕零假設(shè),認(rèn)為樣本來(lái)自的總體與指定的分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為樣本來(lái)自的總體與指定的分布無(wú)顯著差異。第35頁(yè),共42頁(yè),2023年,2月20日,星期三SPSS單樣本K-S檢驗(yàn)?zāi)车?44個(gè)周歲兒童的身高數(shù)據(jù),問(wèn)該地區(qū)兒童身高是否呈正態(tài)分布?第36頁(yè),共42頁(yè),2023年,2月20日,星期三彈出的One-SampleKolmogorov-SmirnovTest對(duì)話框,左側(cè)變量列表中的“人數(shù)”使之添加到TestVariableList框中TestDistribution框中選擇理論

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論