




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、卡方檢驗(yàn)及其應(yīng)用一、卡方檢驗(yàn)概述:卡方檢驗(yàn)主要應(yīng)用于計(jì)數(shù)數(shù)據(jù)的分析,對(duì)于總體的分布不作任何假設(shè),因此它屬于非參數(shù)檢驗(yàn)法中的一種。它由統(tǒng)計(jì)學(xué)家皮爾遜推導(dǎo)。理論證明,實(shí)際觀察次數(shù)(fo)與理論次數(shù)(fe),又稱期望次數(shù))之差的平方再除以理論次數(shù)所得的統(tǒng)計(jì)量,近似服從卡方分布,可表示為:這是卡方檢驗(yàn)的原始公式,其中當(dāng)fe越大,近似效果越好。顯然fo與fe相差越大,卡方值就越大;fo與fe相差越小,卡方值就越??;因此它能夠用來表示fo與fe相差的程度。根據(jù)這個(gè)公式,可認(rèn)為卡方檢驗(yàn)的一般問題是要檢驗(yàn)名義型變量的實(shí)際觀測(cè)次數(shù)和理論次數(shù)分布之間是否存在顯著差異。一般用卡方檢驗(yàn)方法進(jìn)行統(tǒng)計(jì)檢驗(yàn)時(shí),要求樣本容量
2、不宜太小,理論次數(shù)5,否則需要進(jìn)行校正。如果個(gè)別單元格的理論次數(shù)小于5,處理方法有以下四種:1、單元格合并法;2、增加樣本數(shù);3、去除樣本法;4、使用校正公式。當(dāng)某一期望次數(shù)小于5時(shí),應(yīng)該利用校正公式計(jì)算卡方值。公式為:二、卡方檢驗(yàn)的統(tǒng)計(jì)原理: 卡方檢驗(yàn)所檢測(cè)的是樣本觀察次數(shù)或百分比與理論或總體次數(shù)或百分比的差異性。 理論或總體的分布狀況,可用統(tǒng)計(jì)的期望值(理論值)來體現(xiàn)。 卡方的統(tǒng)計(jì)原理,是取觀察值與期望值相比較??ǚ街翟酱螅斫y(tǒng)計(jì)量與理論值的差異越大,一旦卡方值大于某一個(gè)臨界值,即可獲得顯著的統(tǒng)計(jì)結(jié)論。三、卡方檢驗(yàn)的主要應(yīng)用:1、獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)主要用于兩個(gè)或兩個(gè)以上因素多項(xiàng)分類的計(jì)
3、數(shù)資料分析,也就是研究兩類變量之間的關(guān)聯(lián)性和依存性問題。如果兩變量無關(guān)聯(lián)即相互獨(dú)立,說明對(duì)于其中一個(gè)變量而言,另一變量多項(xiàng)分類次數(shù)上的變化是在無差范圍之內(nèi);如果兩變量有關(guān)聯(lián)即不獨(dú)立,說明二者之間有交互作用存在。獨(dú)立性檢驗(yàn)一般采用列聯(lián)表的形式記錄觀察數(shù)據(jù), 列聯(lián)表是由兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表,是用于提供基本調(diào)查結(jié)果的最常用形式,可以清楚地表示定類變量之間是否相互關(guān)聯(lián)。又可具體分為:(1)四格表的獨(dú)立性檢驗(yàn):又稱為2*2列聯(lián)表的卡方檢驗(yàn)。四格表資料的獨(dú)立性檢驗(yàn)用于進(jìn)行兩個(gè)率或兩個(gè)構(gòu)成比的比較,是列聯(lián)表的一種最簡(jiǎn)單的形式。a) 專用公式:若四格表資料四個(gè)格子的頻數(shù)分別為a,b,c,d,
4、則四格表資料卡方檢驗(yàn)的卡方值=n*(ad-bc)2/(a+b)(c+d)(a+c)(b+d),自由度v=(行數(shù)-1)*(列數(shù)-1)b) 應(yīng)用條件:要求樣本含量應(yīng)大于40且每個(gè)格子中的理論頻數(shù)不應(yīng)小于5。當(dāng)樣本含量大于40但理論頻數(shù)有小于5的情況時(shí)卡方值需要校正,即公式,當(dāng)樣本含量小于40時(shí)只能用確切概率法計(jì)算概率。(2)、行*列表資料的獨(dú)立性檢驗(yàn):又稱為R*C列聯(lián)表的卡方檢驗(yàn)。行*列表資料的獨(dú)立性檢驗(yàn)用于多個(gè)率或多個(gè)構(gòu)成比的比較。a) 專用公式:r行c列表資料卡方檢驗(yàn)的卡方值=n*(A11/n1n1+A12/n1n2+.+Arc/nrnc)-1b) 應(yīng)用條件:要求每個(gè)格子中的理論頻數(shù)T均大于5
5、或1T5的格子數(shù)不超過總格子數(shù)的1/5。當(dāng)有T1或1T5的格子較多時(shí),可采用并行并列、刪行刪列、增大樣本含量的辦法使其符合行*列表資料卡方檢驗(yàn)的應(yīng)用條件。多個(gè)率的兩兩比較可采用行*列表分割的辦法。獨(dú)立性檢驗(yàn)的理論頻數(shù)的計(jì)算公式為: 公式中,fxi表示橫行各組實(shí)際頻數(shù)的總和; fyi表示縱列各組實(shí)際頻數(shù)的總和; N表示樣本容量的總和;例1:為了解男女在公共場(chǎng)所禁煙上的態(tài)度,隨機(jī)調(diào)查100名男性和80名女性。男性中有58人贊成禁煙,42人不贊成;而女性中則有61人贊成,19人不贊成。那么,男女在公共場(chǎng)所禁煙的問題所持態(tài)度不同?贊成不贊成行總和男性fo11 =58fo12 =42R1100女性fo2
6、1 =62fo22 =18R280列總和C1120C260T180解:(1)提出零假設(shè)Ho:男女對(duì)公共場(chǎng)所禁煙的態(tài)度沒有差異。(2)確定自由度為(2-1)(2-1)=1,選擇顯著水平=0.05。(3)求解男女對(duì)在公共場(chǎng)合抽煙的態(tài)度的期望值,這里采用所在行列的合計(jì)值的乘積除以總計(jì)值來計(jì)算每一個(gè)期望值(如在下表中:66.7=120*100/180)。贊成不贊成行總和男性fo11 =58fo12 =42R1100Fe11 =66.7Fe12 =33.3女性fo21 =62fo22 =18R280Fe21 =53.3Fe22 =26.7列總和C1120C260T180拒絕零假設(shè),即男女對(duì)公共場(chǎng)所禁煙的
7、態(tài)度有顯著差異。例2:某機(jī)構(gòu)欲了解現(xiàn)在性別與收入是否有關(guān),他們隨機(jī)抽樣500人,詢問對(duì)此的看法,結(jié)果分為“有關(guān)、無關(guān)、不好說,三種答案,調(diào)查結(jié)果如下表:性別有關(guān)無關(guān)不知道合計(jì)男1206050260女10011060240合計(jì)220170110500解:(1)零假設(shè)Ho:性別與收入無關(guān)。(2)確定自由度為(3-1)(2-1)=2,選擇顯著水平=0.05。 (3)利用卡方統(tǒng)計(jì)量計(jì)算公式計(jì)算統(tǒng)計(jì)量: 故拒絕零假設(shè),即認(rèn)為性別與收入有關(guān)。2、擬合性檢驗(yàn):卡方檢驗(yàn)?zāi)軝z驗(yàn)單個(gè)多項(xiàng)分類名義型變量各分類間的實(shí)際觀測(cè)次數(shù)與理論次數(shù)之間是否一致的問題,這里的觀測(cè)次數(shù)是根據(jù)樣本數(shù)據(jù)得多的實(shí)計(jì)數(shù),理論次數(shù)則是根據(jù)理論
8、或經(jīng)驗(yàn)得到的期望次數(shù)。這一類檢驗(yàn)稱為擬合性檢驗(yàn)。其自由度通常為分類數(shù)減去1,理論次數(shù)通常根據(jù)某種經(jīng)驗(yàn)或理論。例3:隨機(jī)抽取60名高一學(xué)生,問他們文理要不要分科,回答贊成的39人,反對(duì)的21人,問對(duì)分科的意見是否有顯著的差異。解:(1)提出零假設(shè)Ho:學(xué)生們對(duì)文理分科的意見沒有差異;(2)分析:如果沒有顯著的差異,則贊成與反對(duì)的各占一半,因此是一個(gè)無差假設(shè)的檢驗(yàn),于是理論次數(shù)為60/2=30,代入公式:所以拒絕原假設(shè),認(rèn)為對(duì)于文理分科,學(xué)生們的態(tài)度是有顯著的差異的。例4:某大學(xué)二年級(jí)的公共體育課是球類課,根據(jù)自己的愛好,學(xué)生只需在籃球、足球和排球三種課程中選擇一種。據(jù)以往的統(tǒng)計(jì),選擇這三種課程的
9、學(xué)生人數(shù)是相等的。今年開課前對(duì)90名學(xué)生進(jìn)行抽樣調(diào)查,選擇籃球的有39人,選擇足球的28人,選擇排球的23人,那么,今年學(xué)生對(duì)三種課程選擇的人數(shù)比例與以往是否不同?籃球足球排球觀察次數(shù)(fo)392823期望次數(shù)(fe)303030解: 提出零假設(shè)Ho:選擇三種課程的學(xué)生比例與以往沒有差異; 所以接受零假設(shè),即選擇三種課程的學(xué)生比例與以往相同。四、兩種檢驗(yàn)的異同:從表面上看,擬合性檢驗(yàn)和獨(dú)立性檢驗(yàn)不論在列聯(lián)表的形式上,還是在計(jì)算卡方的公式上都是相同的,所以經(jīng)常被籠統(tǒng)地稱為卡方檢驗(yàn)。但是兩者還是存在差異的。首先,兩種檢驗(yàn)抽取樣本的方法不同。如果抽樣是在各類別中分別進(jìn)行,依照各類別分別計(jì)算其比例,屬于擬合優(yōu)度檢驗(yàn)。如果抽樣時(shí)并未事先分類,抽樣后根據(jù)研究內(nèi)容,把入選單位按兩類變量進(jìn)行分類,形成列聯(lián)表,則是獨(dú)立性檢驗(yàn)。其次,兩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆四川省瀘州市五中學(xué)七年級(jí)英語第二學(xué)期期末預(yù)測(cè)試題含答案
- 2025年出入管理協(xié)議
- 2025年項(xiàng)目部環(huán)境保護(hù)與污染防治安全協(xié)議
- 2025年標(biāo)準(zhǔn)純凈水交易條款協(xié)議
- 2025年北京租賃住宅策劃協(xié)議版
- 2025年分校擴(kuò)展與策劃管理協(xié)議
- 人防工程施工中與地方基礎(chǔ)設(shè)施的銜接問題
- 未來糧食儲(chǔ)備體系的技術(shù)革新與發(fā)展趨勢(shì)
- 商業(yè)空間節(jié)假日環(huán)境維護(hù)規(guī)劃基礎(chǔ)知識(shí)點(diǎn)歸納
- 理賠業(yè)務(wù)系統(tǒng)升級(jí)風(fēng)險(xiǎn)基礎(chǔ)知識(shí)點(diǎn)歸納
- 【年產(chǎn)100噸β-葡萄糖苷酶生產(chǎn)工藝設(shè)計(jì)17000字(論文)】
- 孕產(chǎn)婦系統(tǒng)保健卡
- 國家開放大學(xué)《心理健康教育》形考任務(wù)1-9參考答案
- 手術(shù)標(biāo)本不良事件
- 勞動(dòng)楷模人物
- 難燃型改性聚乙烯保溫隔聲卷材建筑樓面工程應(yīng)用技術(shù)標(biāo)準(zhǔn)
- 醫(yī)療行業(yè)知識(shí)培訓(xùn)課件
- 六年級(jí)孩子心理教育
- 福建省信息技術(shù)會(huì)考綱要樣本
- 鄉(xiāng)村振興建設(shè)交易平臺(tái)創(chuàng)業(yè)計(jì)劃書
- 餅干行業(yè)swoyt分析
評(píng)論
0/150
提交評(píng)論