版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、8.3.2獨立性檢驗問題引入22列聯(lián)表隨機事件頻率的穩(wěn)定性兩個分類變量是否有關(guān)聯(lián)用頻率推斷兩個分類變量是否獨立有什么缺點?頻率具有隨機性,與概率之間存在差異樣本容量較小時,犯錯誤的概率較大問題回溯有沒有更合理的推斷方法,同時也希望對出現(xiàn)的錯誤推斷的概率一定的控制或估算?A與B相互獨立(簡稱為獨立)的充要條件是抽象簡化列聯(lián)表X=0X=1Y=0X=0,Y=0X=1,Y=0Y=1X=0,Y=1X=1,Y=1x=1與y=1是否有關(guān)聯(lián)呢?前方高能如何判斷x=1與y=1是否有關(guān)聯(lián)呢?x=0與x=1對立, y=0與y=1對立原(零)假設(shè)!進一步由條件概率獨立含義的全解X=0與Y=0獨立X=0與Y=1獨立X=
2、1與Y=0獨立X=1與Y=1獨立具體的列聯(lián)表頻數(shù)的期望值與實際值P(X=0)和P(Y=0)對應(yīng)的頻率的乘積X=0,Y=0發(fā)生的頻率的期望值兩者應(yīng)當相差不大如何衡量差別呢原假設(shè)成立,下面四個量值不應(yīng)該太大是不是有點麻煩?構(gòu)造一個方便科學的統(tǒng)計量看起來好一點了卡方統(tǒng)計量卡方統(tǒng)計量有什么用呢? 統(tǒng)計學家建議,用卡方的大小作為判斷零假設(shè)是否成立的依據(jù),當它比較大時推斷不成立,否則認為成立。 那么,究竟大到什么程度,可以推斷不成立呢? 或者說,怎樣確定判斷卡方大小的標準呢?卡方統(tǒng)計量有什么用呢? 在假定的條件下,對于有放回簡單隨機抽樣,當樣本容量充分大時,統(tǒng)計學家得到了卡方的近似分布。忽略卡方的實際分布
3、與該近似分布的誤差后,對于任何小概率值,可以找到相應(yīng)的正實數(shù),使得下面關(guān)系成立:臨界值基于小概率值的檢驗規(guī)則(小概率值)臨界值表0.10.050.010.0050.001x2.7063.8416.6357.87910.828紙上得來終覺淺,絕知此事要躬行例2:為比較甲、乙兩所學校學生的數(shù)學水平,采用簡單隨機抽樣的方法抽取88名學生,通過測驗得到了如下數(shù)據(jù):甲校43名學生中有10名數(shù)學成績優(yōu)秀;乙校45名學生中有7名數(shù)學成績優(yōu)秀。依據(jù)=0.1的卡方獨立性檢驗,試分析兩校學生中數(shù)學成績優(yōu)秀率之間是否存在差異?具體的列聯(lián)表學校數(shù)學成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(
4、X=1)38745合計711788解:零假設(shè)H0:分類變量X與Y相互獨立,即兩校學生的數(shù)學成績優(yōu)秀率無差異根據(jù)表中的數(shù)據(jù),計算得到根據(jù)小概率值=0.1的卡方獨立性檢驗,沒有允分證據(jù)推斷H0不成立,因此可以認為H0成立,即認為兩校的數(shù)學成績優(yōu)秀率沒有差異思考:例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說明其中的原因嗎? 例1事實上是根據(jù)兩個頻率的差異進行推斷的,沒有考慮隨機性的影響。但事實上,即便兩個樣本來自同一個總體,也會因為隨機性使得頻率產(chǎn)生差異,因此需要用概率的方法進行推斷,由于樣本具有隨機性,依據(jù)頻率所作的推斷可能會犯錯誤.例3: 為研究吸煙是否與肺癌有關(guān), 某腫瘤研
5、究所采取有放回簡單隨機抽樣的方法, 調(diào)查了9965人, 得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計結(jié)果, 如下表所示. 依據(jù)小概率值=0.001的獨立性檢驗, 分析吸煙是否會增加患肺癌的風險.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965解:零假設(shè)H0:吸煙與患肺癌之間無關(guān)聯(lián)根據(jù)小概率值=0.001的卡方獨立性檢驗,推斷H0不成立,因此可以吸煙與患肺癌之間有關(guān)聯(lián),此推斷犯錯誤的概率不大于 0.001用頻率計算再次進行比較:不吸煙者中患肺癌的頻率:吸煙者中患肺癌的頻率:其中兩者的比值為:在被調(diào)查者中, 吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的 4 倍以上總結(jié)獨立性檢驗的步驟應(yīng)用獨立性檢驗解決實際問題主要環(huán)節(jié):(1) 提出零假設(shè)H0:X和Y相互獨立, 并給出在問題中的解釋.(2) 根據(jù)抽樣數(shù)據(jù)整理出22列聯(lián)表, 計算2的值, 并與臨界值比較.(3) 根據(jù)檢驗規(guī)則得出推斷結(jié)論.(4) 在 X和Y不獨立的情況下, 根據(jù)需要, 通過比較相應(yīng)的頻率, 分析 X和Y間的 影響規(guī)律.思考1:列聯(lián)表中,對換行或列的值,會影響卡方的取值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 航空貨運信息規(guī)范 第4部分:數(shù)據(jù)報文接口
- 寵物健康監(jiān)測設(shè)備市場現(xiàn)狀分析
- 教育體系與家長教育的互動發(fā)展探討
- 2025年粵教版八年級歷史上冊階段測試試卷
- 2025年滬科版九年級歷史上冊階段測試試卷含答案
- 2025年滬科版選擇性必修1語文上冊月考試卷含答案
- 年產(chǎn)4000萬個塑料泵頭項目可行性研究報告寫作模板-申批備案
- 2025年西師新版必修3生物下冊階段測試試卷
- 2025年滬教版必修1歷史上冊月考試卷含答案
- 二零二五版苗圃土地租賃與生態(tài)農(nóng)業(yè)示范區(qū)建設(shè)合同4篇
- 勞務(wù)協(xié)議范本模板
- 2024年全國職業(yè)院校技能大賽高職組(生產(chǎn)事故應(yīng)急救援賽項)考試題庫(含答案)
- 2025大巴車租車合同范文
- 老年上消化道出血急診診療專家共識2024
- 人教版(2024)數(shù)學七年級上冊期末測試卷(含答案)
- 2024年國家保密培訓
- 2024年公務(wù)員職務(wù)任命書3篇
- CFM56-3發(fā)動機構(gòu)造課件
- 會議讀書交流分享匯報課件-《殺死一只知更鳥》
- 2025屆撫州市高一上數(shù)學期末綜合測試試題含解析
- 公司印章管理登記使用臺賬表
評論
0/150
提交評論