




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1.2 獨立性檢驗的基本思想 及其初步應用,我們經常聽到這些說法: 吸煙對患肺癌有影響; 數學好的人物理一般也很好; 性別與是否喜歡數學課程之間有關系; 人的血型會決定人的性格; 星座與人的命運之間有某種聯系; 這些說法都有道理嗎?,1.理解獨立性檢驗的基本思想.(重點) 2.會從列聯表、條形圖直觀判斷吸煙與患肺癌 有關.(難點) 3.了解隨機變量K2的含義,理解獨立性檢驗的 基本思想及實施步驟.(難點),探究點1 獨立性檢驗的基本思想,對于性別變量,其取值為男和女兩種.這種變量 的不同“值”表示個體所屬的不同類別,這樣的變 量稱為 .,分類變量在現實生活中是大量存在的,如是否吸煙,是否患肺癌
2、,宗教信仰,國別,年齡,出生月份等.,分類變量,問題:為了調查吸煙是否對患肺癌有影響,某腫瘤研究所隨機地調查了9965人,得到如下結果(單位:人),在吸煙者中患肺癌的比重是_.,說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大.,0.54%,2.28%,在不吸煙者中患肺癌的比重是_,通過圖形直觀判斷兩個分類變量是否相關:,患肺癌 比例,不患肺癌 比例,等高條形圖,通過數據和圖表分析,得到結論是:吸煙與患肺癌有關,那么這種判斷是否可靠呢?我們可以通過統(tǒng)計分析回答這個問題.,假設H0: 吸煙與患肺癌之間沒有關系,如果“吸煙與患肺癌沒有關系”,那么吸煙樣本中不患肺癌的比例應該與不
3、吸煙樣本中相應的比例差不多.,即,引入一個隨機變量,它是檢驗在多大程度上可以認為“兩個變量有關系”的標準.,ad-bc越小,說明吸煙與患肺癌之間的關系越弱,,ad-bc越大,說明吸煙與患肺癌之間的關系越強.,其中n=a+b+c+d為樣本容量.,通過公式計算,已知在 成立的情況下,,即在 成立的情況下,K2的觀測值大于6.635 的概率非常小,近似為0.010,是一個小概率事件.,思考:這個值到底告訴我們什么呢?,現在K2的觀測值k56.632,遠遠大于6.635,所以有理 由斷定H0不成立,即認為“吸煙與患肺癌有關系”.,獨立性檢驗的定義,利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為
4、獨立性檢驗.,獨立性檢驗的一般步驟,(1)假設兩個分類變量X與Y沒有關系;,(2)計算出K2的觀測值k;,(3)把k的值與臨界值比較確定X與Y有關的程度或無關系.,設有兩個分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數列聯表(稱為22列聯表)為,如P(k010.828)= 0.001表示在犯錯誤的概率不超過0.001的前提下,認為“X與Y有關系”.,如P(k06.635)= 0.01表示在犯錯誤的概率不超過0.01的前提下,認為“X與Y有關系”.,臨界值表:,獨立性檢驗的基本思想類似反證法,(1)假設結論不成立,即“兩個分類變量沒有關系”. (2)在此假設下隨機變量K2應該
5、很小,如果由觀測數據計算得到K2的觀測值k很大,則在一定程度上說明假設不合理. (3)根據隨機變量K2的含義,可以通過評價該假設不合理的程度,如由實際計算出的k10.828.說明假設不合理的程度為99.9%,即“兩個分類變量有關系”這一結論成立的可信度為約為99.9%.,探究點2 獨立性檢驗的初步應用,例1.在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中,有175人禿頂.利用圖形判斷禿頂與患心臟病是否有關系?能否在犯錯誤的概率不超過0.010的前提下認為禿頂與患心臟病有關系?,解:根據題目所給數據得到如下列聯表:,相應的等高條
6、形圖如下所示,,禿頂,不禿頂,不患心臟病 患心臟病,因此,在犯錯誤的概率不超過0.010的前提下,認為禿頂與患心臟病有關系.,根據列聯表中的數據,得到,思考:考察下表,,定義,根據獨立性檢驗原理,如何用W構造一個判斷X和Y是否有關系的規(guī)則,使得在該規(guī)則下把“X和Y沒有關系”錯判成“X和Y有關系”的概率不超過0.010?,由W的定義可以發(fā)現:它越大,越有利于結論“X和Y有關系”;它越小,越有利于結論“X和Y沒有關系”.因此可以建立如下的判斷規(guī)則:,當W的觀測值 0時,就判斷“X和Y有關系”;否則,判斷“X和Y沒有關系”.這里0為正實數,滿足如下條件:在“X和Y沒有關系”的前提下,,思考:若在“X
7、和Y沒有關系”的情況下有,C,2下列說法中正確的是( ) 獨立性檢驗的基本思想是帶有概率性質的反證法; 獨立性檢驗就是選取一個假設H0條件下的小概率事件, 若在一次試驗中該事件發(fā)生了,這是與實際推斷相抵觸 的“不合理”現象,則作出拒絕H0的推斷; 獨立性檢驗一定能給出明確的結論 A B C D,3有兩個分類變量X與Y的一組數據,由其列聯表 計算得K24.523,則認為X與Y有關系是錯誤的 可信度為( ) A95% B90% C5% D10%,4在對人們的休閑方式的一次調查中,共調查了 124人,其中女性70人,男性54人,女性中有43人 主要的休閑方式是看電視,另外27人主要的休閑方式 是運動;男性中有21人主要的休閑方式是看電視, 另外33人主要的休閑方式是運動 (1)根據以上數據建立一個22的列聯表. (2)判斷休閑方式與性別是否有關系,休閑方式,獨立性檢驗的一般步驟:,(1)假設兩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 制定管理辦法技巧包括
- 《宏觀經濟分析:貨幣供應、價格與匯率的實證研究》
- 全面質量控制流程與程序手冊
- 企業(yè)人才戰(zhàn)略規(guī)劃體系構建與實施路徑
- 硬車削工藝參數優(yōu)化:全因子試驗與響應曲面分析
- 校園榜樣力量培養(yǎng)與傳承案例分析
- 基于增強現實的博物館藏品虛擬復原研究-洞察及研究
- 安全教育的內容
- 安全生產目標評估
- 商混站安全操作規(guī)程
- 2025至2030中國大型連鎖超市行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- T-GDMDMA 0044-2025 一次性使用血液灌流器的臨床使用指南
- 2025-2030年中國鱈魚腸行業(yè)市場發(fā)展分析及發(fā)展前景與投資策略研究報告
- 2025-2030年中國智慧應急行業(yè)市場深度調研及市場前瞻與投資策略研究報告
- 2025年全國統(tǒng)一高考語文試卷(全國一卷)含答案
- T/DZJN 03-2019即熱式飲水電加熱器具能效限定值及能效等級
- 2025年調解員職業(yè)技能考試試卷及答案
- 噴粉技術質量協議書
- 2025年自考有效溝通技巧試題及答案
- 商場物業(yè)外包合同協議
- 2025民宿租賃合同標準范本
評論
0/150
提交評論