


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第八章 卡方檢驗與交互分析交互分析是社會調(diào)查研究中常用方法之一,用于研究兩個定類變量的關系。交互分析中用于檢驗兩個變量是否相關的方法叫做卡方檢驗,也叫獨立性檢驗??ǚ綑z驗是建立在觀測頻次和期望頻次之差基礎上的一種檢驗。一、卡方檢驗的原理例:一項調(diào)查得到890個樣本的與收入和所處地區(qū)的數(shù)據(jù),希望分析收入和地區(qū)的關系。表1東部城市中西北部城市總頻次個人月收入Y0-1000元1461723181000-1500元661001661500-2000元51861372000元以上166103269總頻次429461890相對頻次0.4820.5181.00要檢驗的H0:收入和地區(qū)之間沒有相關性,即每一地
2、區(qū)的收入分布模式應該是相同的,收入的高低不應隨著地區(qū)的不同而有所差異。也就是說,如果東部城市的四個收入類別各自比重和中西北部城市的四個收入類別各自比重一致,那么,收入和地區(qū)之間是相互獨立的。如果這個890人的樣本能夠反應總體的獨立性特征,那么就應該能夠觀測到兩個地區(qū)具有相同的收入分布模式,稱為期望模式,樣本的期望觀測頻次如下:表2東部城市中西北部城市總頻次個人月收入Y0-1000元153.3164.73181000-1500元80861661500-2000元66711372000元以上129.7139.3269總頻次429461890相對頻次0.4820.5181.00接下來,計算觀測頻次f
3、0與期望頻次fe之間的偏差(f0-fe),如果這些偏差比較小,則有利于證明原假設即總體的獨立性。反之,則可能推翻原假設。但偏差之和為0,所以對偏差進行平方。但是,為了說明每一個偏差的相對重要性,每一偏差平方和都需要和本組中的期望頻次相比較,計算相對(f0-fe)2/fe。然后,將所有組的貢獻相加,從而得到度量全部偏差的一個量,叫做卡方2=(fo-fe)2fe,服從自由度為(c-1)(r-1)的卡方分布。如用c和r分別表示表中的列數(shù)和行數(shù),自由度為(c-1)(r-1)。f0 fe146172661005186166103153.3164.780866671129.7139.3(f0-fe)-7.
4、37.3-1414-151536.3-36.3(f0-fe)2/fe0.350.322.452.283.413.1710.169.46計算出卡方值后,可根據(jù)已知的顯著性水平和自由度查卡方分布表,找出臨界值,與之作對比。反過來,也可以計算出概值,再根據(jù)我們所希望的顯著性水平做比較。該例題中計算出2為31.6,查表發(fā)現(xiàn)對應自由度為3的那一行的所有臨界值都小于2,因此,概值小于0.001。由于概值如此小,檢驗水平可以是1%甚至更小,所以一定可以拒絕原假設。也就是說,在總人口中,收入與地區(qū)有顯著的相關性,二者并不獨立。練習題:在電視的收視率調(diào)查中,得到性別與收視習慣的聯(lián)列表如下,試分析性別和收視習慣的
5、關系。男女總頻次幾乎天天看382462偶爾看31738總頻次6931100相對頻率0.690.311.00解:原假設為“性別和收視習慣相互獨立”,如果原假設成立,那么兩列期望憑此應通過0.69和0.31分別乘以最后一列總頻次而得到。382431742.819.226.211.8(f0-fe)-4.84.84.8-4.8(f0-fe)2/fe0.541.200.881.95卡方值=4.57。自由度為(2-1)(2-1)=1??ǚ街荡笥?.052=3.84,所以概值小于0.05。可以認為在5%的顯著性水平下拒絕原假設,認為性別與收視習慣并不是相互獨立的。二、卡方檢驗的局限性和補救辦法 1、卡方值隨
6、分類的不同而不同交互分析將數(shù)據(jù)按類別整理,分類的不同可改變卡方值,甚至導致相反結果。在例題中,收入如果分成高、中、低三類,結果必然不同。因此,在分類時最好有理論(統(tǒng)計上的)依據(jù)。如果沒有,則需要有統(tǒng)計上的依據(jù),例如利用中位數(shù),將數(shù)據(jù)平分兩類。2、樣本量不能太小,也不宜過大樣本量應大于30或50,一般調(diào)查中都會超過50。樣本量太大,檢驗結果也可能會失去意義。因為卡方值受樣本量影響很大,樣本量越大,越容易得到拒絕原假設的結果。比如將樣本量增大10倍,各種對應關系不變,則卡方值也會增大10倍。原來的不拒絕結果可能就會變成拒絕原假設的結果。為了解決這一問題,要采用補救辦法,常用的是聯(lián)列系數(shù)C,可以消除樣本量的影響,解釋變量間真正關系的密切程度。C= ,雖然卡方值不同,但C值相同。因此,當卡方檢驗顯著單樣本量有很大時,最好參照C值的大小,如果C值也比較大,才可以拒絕原假設。遺憾的是,對于C值的顯著程度沒有可行的統(tǒng)計檢驗方法,有些學者認為C值至少要超過0.16,最好達到0.25,才可以考慮兩個變量相關。同時,C值還受到連列表規(guī)模影響。對于2*2的表,C值不會超過0.707,但對于4*6的表,C值上限可達到0.877。所以,也有學者建議將C值與其理論上限值作比較,如果接近上限,關系顯著。但后一種方法過于嚴格,對很多
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 民政小區(qū)車輛管理辦法
- 小學籃球社團活動方案
- 220kV變電站工程試運行流程與解析
- 古代文學專題:經(jīng)典文本與思想傳承研究
- 公共平臺建設管理辦法
- 大豆籽粒營養(yǎng)成分與豆乳品質(zhì)的關系分析
- 高考期間食堂食品安全保障措施
- 太陽系行星保護在深空探測任務中的實踐與挑戰(zhàn)
- 施工企業(yè)安全生產(chǎn)事故應急預案
- 氣溶膠輻射特征影響下的香河地區(qū)環(huán)境監(jiān)測研究
- 護理領域的職業(yè)發(fā)展與前景展望
- 2025上海濟光職業(yè)技術學院輔導員考試試題及答案
- 2024年江蘇三支一扶真題
- 主、被動防護網(wǎng)施工方案-圖文
- 2025年初中語文文學常識:常考100題匯編
- 君易和文化課件
- 藥食同源106種25年4月更新
- 2025年江蘇省南通市中考英語適應性試卷(A卷)
- 無機鹽在化妝品行業(yè)的應用研究考核試卷
- 豬場生產(chǎn)安全
評論
0/150
提交評論