第十章卡方檢驗_第1頁
第十章卡方檢驗_第2頁
第十章卡方檢驗_第3頁
第十章卡方檢驗_第4頁
第十章卡方檢驗_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十章X2檢驗第一節(jié)X2檢驗的原理—、Z2檢驗的假設(一)分類相互排斥,互不包容X2檢驗中的分類必須相互排斥,這樣每一個觀測值就會被劃分到一個類別或另一個類別之中。此外,分類必須互不包容,這樣,就不會出現(xiàn)某一觀測值同時劃分到更多的類別當中去的情況。(二)觀測值相互獨立各個被試的觀測值之間彼此獨立,這是最基本的一個假定。如一個被試對某一品牌的選擇對另一個被試的選擇沒有影響。當同一被試被劃分到一個以上的類別中時,常常會違反這個假定。當討論列聯(lián)表時,獨立性假定是指變量之間的相互獨立。這種情況下,這種變量的獨立性正在被檢測。而觀測值的獨立性則是預先的一個假定。(三)期望次數(shù)的大小每一個單元格中的期望次數(shù)應該至少在5以上。一些更加謹慎的統(tǒng)計學家提出了更嚴格的標準,當自由度等于1時,在進行X2檢驗時,每一個單元格的期望次數(shù)至少不應低于10,這樣才能保證檢驗的準確性。另外,在許多分類研究中會存在這樣一種情況,如自由度很大,有幾個類別的理論次數(shù)雖然很小,但在給以接受的標準范圍內,只有一個類別的理論次數(shù)低于1。此時,一個簡單的處理原則是設法使每一個類別的理論次數(shù)都不要低于1,分類中不超過20%的類別的理論次數(shù)可以小于5。在理論次數(shù)較小的特殊的四格表中,應運用一個精確的多項檢驗來避免使用近似的X2檢驗。二、X2檢驗的類別(一)配合度檢驗配合度檢驗主要用來檢驗一個因素多項分類的實際觀察數(shù)與某理論次數(shù)是否接近,這種X2檢驗方法有時也稱為無差假說檢驗。當對連續(xù)數(shù)據(jù)的正態(tài)性進行檢驗時,這種檢驗又可稱為正態(tài)吻合性檢驗。(二)獨立性檢驗獨立性檢驗是用來檢驗兩個或兩個以上因素各種分類之間是否有關聯(lián)或是否具有獨立性的問題。這種類型的X2檢驗適用于探討兩個變量之間是否具有關聯(lián)(非獨立)或無關(獨立),如果再加入另一個變量的影響,即探討三個變量之間關系時,就必須使用多維列聯(lián)表分析方法。同質性檢驗同質性檢驗的主要目的在于檢定不同人群母總體在某一個變量的反應是否具有顯著差異。當用同質性檢驗檢測雙樣本在單一變量的分布情形,如果兩樣本沒有差異,就可以說兩個母總體是同質的,反之,則說這兩個母總體是異質的。三、X2檢驗的基本公式z2是表示實測次數(shù)與理論次數(shù)(即期望次數(shù))之間差異程度的指標,其基本數(shù)學定義是實測次數(shù)與期望次數(shù)之差的平方與期望次數(shù)的比率。X2檢驗就是檢驗實測次數(shù)與期望次數(shù)是否一致的統(tǒng)計方法?;竟饺缦拢浩渲衒0表示實際觀察次數(shù),fe表示某理論次數(shù)。要求:fe25四、小期望次數(shù)的連續(xù)性校正第一,單元格合并法。若有一格或多個單元格的期望次數(shù)小于5時,在配合研究目的情況下,可適當調整變量的分類方式,將部分單元格予以合并。第二,增加樣本數(shù)。如果研究者無法改變變量的分類方式,又想獲得有效樣本,最佳的方法是直接增加樣本數(shù)來提高期望次數(shù)。第三,去除樣本法。如果樣本無法增加,次數(shù)偏低的類別又不具有分析與研究價值時,可以將該類被試除去,但研究的結論不能推論到這些被除去的母總體中。第四,使用校正公式。在2x2的列聯(lián)表檢驗中,若單元格的期望次數(shù)低于10但高于5,可使用耶茨校正(Yates’correctionforcontinuity)公式來加以校正。若期望次數(shù)低于5時,或樣本總人數(shù)低于20時,則應使用費舍精確概率檢驗^Fisher’sexactprobabilitytest)。當單元格內容牽涉到重復測量設計時(例如前后測設計),則可使用麥內瑪檢驗(McNemartest)。第二節(jié)配合度檢驗配合度檢驗(goodnessoffittest)主要用于檢驗單一變量的實際觀察次數(shù)分布與某理論次數(shù)是否有差別。由于它檢驗的內容僅涉及一個因素多項分類的計數(shù)資料,故可以說是一種單因素檢驗(One-waytest)。一、配合度檢驗的一般問題

建立假設H0:f=fe°"在Z2檢驗中,理論(或期望)次數(shù)的確定就取決于這種比例的假設。*2的臨界值是在H0成立的條件下導出理論分布,并由*2公式計算出來的。若實際計算出的*2值大于理論上的臨界值*d)0.05,即*2>*(df)0.05則說在以=0,05的顯著水平上拒絕H0。自由度的確定原則自由度確定的一般原則是:以相互獨立的類別數(shù)*(或C)減去所受的限制數(shù)M,即£f=£f0edf=k-M£f=£f0e的限制,在各種適合性檢驗中,如果理論次數(shù)只受到總和的限制,即受df=k-1則自由度為在正態(tài)分布的適合性檢驗,因其除了受^f0=£fe的限制以外,還受理論分布的均數(shù)和標準差兩個未知參數(shù)的限制,即受到三個條件的限制,其自由度為df的限制,df=k-1理論次數(shù)的計算規(guī)則(.一是數(shù)據(jù)分布有其理論概率為依據(jù),這時的理論次數(shù)^e等于總次數(shù)乘以某種屬性出現(xiàn)的概率(P),即fe=Np理論次數(shù)的計算,一般是根據(jù)某種理論,按一定的概率通過樣本即實際觀察次數(shù)計算。某種理論有經驗概率,也有理論概率,如二項分布、正態(tài)分布等理論概率。二、配合度檢驗的應用(一)檢驗無差假說這里講的無差假說,是指各項分類的實計數(shù)之間沒有差異,也就是假設,各項分類之間的幾會相等,或概率相等,因此理論次數(shù)完全按概率相等的條件計算。即:1理論次數(shù)二總數(shù)X分類項數(shù)例10-1:隨機抽取60名學生,詢問他們在高中是否需要文理分科,贊成分科的39人,反對分科的21人,問他們對分科的意見是否有顯著差異?解:1)建立假設H:f=fH:f=fH0:f卜f2)計算統(tǒng)計量f=60x-=30X2=S^ff-e(39-30)2*(21-30)23030(贊成與反對的人數(shù)相等)(贊成與反對的人數(shù)不相等)92+(-9)2=5.4303)進行統(tǒng)計決策查X2表,當查X2表,當df=1時X0.05=3.84,X20.01=6.63,因為x2=5.4,X2vX2<X2,0.050.01所以,0.01vpV0.05。達到顯著性水平,拒絕原假設。說明兩種態(tài)度有顯著差異。例10-2:某項民意測驗,答案有同意、不置可否、不同意三種。調查了48人,結果同意的24人,不置可否的12人,不同意的12人。問持這三種意見的人數(shù)是否有顯著不同?=48x13=16e'解:此題為檢驗無差假說,已知分類的項數(shù)為三,故各項分類假設實計數(shù)相等。所以p=—,N=48,f=48x13=16e'1)建立假設H0:f=fH:f”2)計算統(tǒng)計量(24-16)2(12-(24-16)2(12-16)2(12-16)2X2=++=61616163)進行統(tǒng)計決策,所以查X2表,當df=3-1=2時,X2=5.99,因為X2=6〉X2—0.050.05Pv0.05。達到顯著性水平,拒絕原假設。說明三種態(tài)度有顯著差異。,所以(二)檢驗假設分布的概率假設某因素各項分類的次數(shù)分布為正態(tài),檢驗實計數(shù)與理論上期望的結果之間是否有差

異。因為已假定所觀察的資料是按正態(tài)分布的,故其理論次數(shù)的計算應按正態(tài)分布概率,分別計算各項分類的理論次數(shù)。具體方法是先按正態(tài)分布理論計算各項分類應有的概率再乘以總數(shù),便得到各項分類的理論次數(shù)。如果不是事先假定所觀察的資料為正態(tài)分布而是其他分布,如二項分布、泊松分布等,其概率應按各所假定的分布計算。事先假定的分布不是理論分布而是經驗分布,亦可按此經驗分布計算概率,在乘以總數(shù)便可得到理論次數(shù),從而進一步檢驗假設分布與實計數(shù)的分布之間,亦即實計數(shù)與理論次數(shù)之間差異是否顯著。例10-3:某班有學生50人,體檢結果按一定標準劃分為甲乙丙三類,其中甲類16人,乙類24人,丙類10人,問該班學生的身體狀況是否符合正態(tài)分布?解:該題中的理論次數(shù)應按假設的正態(tài)分布概率計算。按正態(tài)分布,就可以認為土勿包括了全體,各等級所占的橫坐標應該相同(衍:3=星),故各類人數(shù)應占的比率為:甲級:%?1。之間,曲線下的面積應為0.50-0.3413=0.1587乙級:1。?-1。之間,曲線下的面積應為0.3413x2=0.6826丙級:-1。?-3。之間,曲線下的面積應為0.50-0.3413=0.1587各等級的理論次數(shù)為:f=0.1587x50牝8e甲f=0.6826x50=34e乙f=0.1587x50牝8e丙1)建立假設H0:學生的身體狀況符合正態(tài)分布H"學生的身體狀況不符合正態(tài)分布2)計算統(tǒng)計量(16-8)2(16-8)28(24-34)2(10-8)2++834=11.443)進行統(tǒng)計決策當df=3-1=2時,X2=10.6,X2>X2,所以達到顯著性水平,拒絕原假設。0.050.05說明學生身體狀況不符合正態(tài)分布。例10-4:根據(jù)以往的經驗,某校長認為高中生升學的男女比例為2:1,今年的升學情況是男生85人,女生35人,問今年升學的男女比例是否符合該校長的經驗?解:此題是假設男女生升學的人數(shù)分布與校長的經驗分布相同,故理論次數(shù)應按經驗分

布的概率計算理論次數(shù)為:/=(85+35)x2,;=80/=(85+35)x%=40e男e女1)建立假設H0:男女升學比例符合校長經驗H1:男女升學比例不符合校長經驗2)計算統(tǒng)計量(85-80)2(35-40)2八命40X2=+=0.9480403)進行統(tǒng)計決策當df=2-1時,X005=3.84,因為X2<X005,故差異不顯著。接受原假設。說明男女升學比例符合校長經驗。三、連續(xù)變量分布的吻合性檢驗(自學)對于連續(xù)性數(shù)據(jù)總體分布的檢驗,一種方法是將測量數(shù)據(jù)整理成次數(shù)分布表,畫出次數(shù)分布曲線圖,根據(jù)次數(shù)分布曲線,判斷選擇恰當?shù)睦碚摲植?。有時可選擇某一直線或曲線的理論分布函數(shù)方程式計算理論次數(shù),然后把實際分組次數(shù)(f0)和理論次數(shù)(fe)代入檢驗的基本公式,計算X2值查X2表,確定其差異是否顯著。若差異顯著,說明實際次數(shù)分布于所選擇的理論次數(shù)分布不吻合,這時可另選擇理論分布函數(shù),再次比較,直至吻合,這個理論分布函數(shù)就是該實際測量的次數(shù)分布函數(shù)。若差異不顯著則說明所選的理論次數(shù)分布于實際次數(shù)分布吻合。對連續(xù)隨機變量分布的吻合性檢驗,關鍵的步驟是計算理論次數(shù)與確定自由度。理論次數(shù)的計算是把實際次數(shù)分布的統(tǒng)計量代入所選的理論分布函數(shù)方程,計算各分組區(qū)間的理論頻率,然后乘以總數(shù)得到各分組區(qū)間的理論次數(shù)。確定自由度時是將分組的數(shù)目減去計算理論次數(shù)是所用統(tǒng)計量的數(shù)目。下面以正態(tài)分布吻合性檢驗為例,說明理論次數(shù)的計算與自由度的確定。例10-5:表10-1所列資料是552名中學生的身高次數(shù)分布,問這些學生的身高分布是否符合正態(tài)分布。解:(1)本題要求檢驗實際次數(shù)分布與正態(tài)分布是否符合,它的理論次數(shù)計算應該根據(jù)正態(tài)分布概率,查正態(tài)曲線表得到。一般地,這一類問題計算理論次數(shù)的方法有兩種。第一種方法的具體步驟包括:①求各分組區(qū)間組中值%c與平均數(shù)的離差x;②求各is離差的Z分數(shù);③根據(jù)Z分數(shù)查正態(tài)表求y值;④將y值乘以(以Z分數(shù)為單位的組間距),得到按正態(tài)分布各分組區(qū)間的概率p;⑤求各組的理論次數(shù)f=pxN。e第二種方法的步驟是:①求各分組精確上、下限的Z分數(shù),z=組限—平均數(shù);②查標準差正態(tài)表求各Z分數(shù)的概率;③求各分組區(qū)間的概率;用精確上限查到的概率值減去精確下線查到的概率值,這是平均數(shù)以上各分組區(qū)間的求法。若用平均數(shù)以下各分組區(qū)間則與此相反;④用各組區(qū)間的概率乘以總數(shù),求出各組的理論次數(shù),即f=pxN。e下表是按照第一種方法計算理論次數(shù)的過程。身高分組Xcf0xZypfe(f0fe169-170215.383.030.00400.002371}0.125166-167712.382.440.00200.012017163-164229.381.850.07200.04260240.167160-161576.381.260.18400.10888600.150157-1581103.380.670.31870.188581040.471154-1551240.380.070.39790.235441300.277151-152112-2.26-0.520.34840.206151140.035148-14980-5.26-1.110.21540.12746701.429145-14625-8.26-1.700.09400.05562311.161142-1438-11.26-2.290.02890.017109}0.090139-1404-14.26-2.880.00670.003962N=552X=154.62s=5.07Xfe=552x2=3.905(2)有了各組的理論次數(shù)與實際次數(shù),代人X2基本公式,得到咒2=3.9°5。(3)確定自由度。本題共分11組,在計算理論次數(shù)時,為了克服由于分組最高組和最低組兩極端次數(shù)太少絡帶來的影響,進行了組別合并。一般合并分組的原則是當f小e于5時,就應合并。合并后為9組。在計算理論次數(shù)的過程中共用到平均數(shù)、標準差、總數(shù)三個統(tǒng)計量,故本題的自由度df=9-3=6(4)查X2值表。當#=6時X2=3.45,X2=5.35,用內插法計算得X2=3.905,0.750.500.6938X2VXj?,故差異不顯著。答:552名中學生的身高分布符合正態(tài)分布。第三節(jié)獨立性檢驗獨立性檢驗主要用于兩個或兩個以上因素多項分類的計數(shù)資料分析,也就是研究兩類變量之間的關聯(lián)性和依存性問題。如果要研究的兩個因素(又稱自變量)或兩個以上因素之間是否具有獨立性,或有無關聯(lián)的,或有無“交互作用”的存在,就要獨立性檢驗。其目的在于檢驗從樣本得到的兩個變量的觀測值,是否具有特殊的關聯(lián)。一、獨立性檢驗的一般問題與步驟(一)統(tǒng)計假設獨立性檢驗的虛無假設是二因素(或多因素)之間是獨立的或無關聯(lián)的,備擇假設則是二因素(或多因素)之間有關聯(lián)或者說差異顯著。一般多用文字敘述而很少用統(tǒng)計符號表示。(二)理論次數(shù)的計算獨立性檢驗的理論次數(shù)是假設兩個變量沒有關聯(lián)的情況下推算出來的。二變量或稱兩樣本其各行或各列數(shù)目的和,即每一項分類的數(shù)目與總數(shù)(N)的比值,提供了樣本的比率。f=eN(三)自由度的確定兩因素列聯(lián)表自由度與兩因素各自的分類項數(shù)有關。設R為每一行的分類項數(shù),C為每一列的分類數(shù)目,則自由度為:df=(R-1)(C-1)(四)統(tǒng)計方法的選擇一般應用獨立性檢驗的場合,獨立樣本居多用X2檢驗的基本公式計算:穴2_£(fff,)2e簡捷式:f2X2=N(S-f―f--1)(五)結果及解釋查df為(R-1)(C-1)時確定X2臨界值,如果X2<X0.05⑵或X201,則接受原假設,說明兩個因素無關聯(lián),或者兩個因素獨立。當X2〉X2()或X,則拒絕原假設,說明兩個因素有關聯(lián),或者兩個因素不獨立..J-二、四格表獨立性檢驗(一)獨立樣本四格表檢驗計算公式:N(AD—BC)2X2=(A+B)(C+D)(A+C)(B+D)式中A,B,C,D分別為四格表內各格的實計數(shù),(A+B),(C+D),(A+C),(D+B)為各邊緣次數(shù),自由度cf=1。四格表各單元格表示方式具體見表如下所示:因素A分類1分類2分類1ABA+B因素B分類2CDC+DA+CB+DN=A+B+C+D例10-7:隨機抽取90人,按男女不同性別分類,將學生成績分為中等以上中等以下兩類,結果如下。問男女生在學業(yè)水平是是否有關聯(lián)?學業(yè)水平中等以上中等以下性男23(A)17(B)_40(A+B)別女28(C)22(D)_50(C+D)51(A+C)39(B+D)90解:1)建立假設H0:男女生在學業(yè)成績上沒有關聯(lián)H"男女生在學業(yè)成績上有關聯(lián)計算統(tǒng)計量X2二(23x22-17x28)2x90八==0.0203640x50x51x39進行統(tǒng)計決策查X2表,當df=1時,先205⑴=3.84,Z2<又(205,所以接受原假設,說明男女生在學業(yè)成績上沒有關聯(lián)。在2x2列聯(lián)表中若某格的理論次數(shù)小于5,—般需要進行耶茨校正,其校正公式為N\ad-bC-?j

3+b凡+d)a+c旃+d)例10-8:今對一廣告的態(tài)度調查,隨機抽20名被試對該廣告進行評價。試問對廣告的偏好與性別有無關聯(lián)?表10-1被試對廣告的評價表

不好男7£9151812不好男7£91518122020x[|7x3-9x1|-20T7200=°.01=I2J8x12x15x5=0.01<")0.05=3.484.說明對廣告的偏好與性別沒有關聯(lián)。7200=°.013)X2與%的關系在2x2列聯(lián)表的獨立樣本X2檢驗中,不僅可以檢驗兩種變量的相倚關系,而且還可以對“二分變量''的叩相關系數(shù)進行顯著性檢驗。只要X2檢驗結果是顯著的,就可以檢驗%是否與零相關的虛無假設有顯著的差別,這是因為二者之存在著以下關系:z2=N%,即x2是七系數(shù)的函數(shù)。_:X2W'N2.相關樣本的X2檢驗(二)相關樣本四格表檢驗檢驗公式為:(A-D)2

A+D例10-8:100名學生先后測驗兩次,結果如下:測驗1錯對測驗2對5(A)55(B)一60(A+B)錯25(C)15(D)一40(C+D)30(A+C)70(B+D)100解:1)建立假設丑。:兩次測驗分數(shù)無顯著關系Ha:兩次測驗分數(shù)有顯著關系2)計算統(tǒng)計量

(a-d*%2=a+d(a-d*_(5-15)2_-5+15一查%2值表,當df=1時,有h05=3-84%.01=6.63。因為%2=5>查%2值表,當df=1時,有h05=3-84%.01=6.63。因為%2=5>%2)0.05=3,84,p<0.05,相關顯著。所以,拒絕虛

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論