




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1第8章《成對數據的統(tǒng)計分析》人教A版2019選擇性必修第三冊8.3.2獨立性檢驗1.了解隨機變量χ2的意義,通過對典型案例分析,2.了解獨立性檢驗的基本思想和方法.學習目標
前面我們通過2×2列聯表整理成對分類變量的樣本觀測數據,并根據隨機事件頻率的穩(wěn)定性推斷兩個分類變量之間是否有關聯.
對于隨機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法,同時也希望能對出現錯誤推斷的概率有一定的控制或估算.環(huán)節(jié)一:創(chuàng)設情境,引入課題根據我們通過簡單隨機抽樣得到了X和Y的抽樣數據列聯表,如表8.3-3所示.XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d對于隨機樣本,表8.3-3中的頻數a,b,c,d都是隨機變量,而表8.3-2中的響應數據是這些隨機變量的一次觀測結果.思考:如何基于②中的四個等式及列聯表8.3-3中的數據,構造適當的統(tǒng)計量,對成對的分類變量X和Y是否相互獨立作出推斷?環(huán)節(jié)二:觀察分析,感知概念顯然,分別考慮③中的四個差的絕對值很困難.我們需要找到一個既合理又能夠計算分布的統(tǒng)計量,來推斷是否成立.一般來說,若頻數的期望值較大,則③中相應的差的絕對值也會較大;而若頻數的期望值較小,則③中相應的差的絕對值也會較小.為了合理地平衡這種影響,我們將四個差的絕對值取平方后分別除以相應的期望值再求和,得到如下的統(tǒng)計量:環(huán)節(jié)三:抽象概括,形成概念0.10.050.010.0050.0012.7063.8416.6357.87910.828表8.3-40.10.050.010.0050.0012.7063.8416.6357.87910.828表8.3-4環(huán)節(jié)四:辨析理解,深化概念學校數學成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計711788思考:例1和例2都是基于同一組數據的分析,但卻得出了不同的結論,你能說明其中的原因嗎?事實上,如前所述,例1只是根據一個樣本的兩個頻率間存在差異得出兩校學生數學成績優(yōu)秀率有差異的結論,并沒有考慮由樣本隨機性可能導致的錯誤,所以那里的推斷依據不太充分.解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治療數據的列聯表,如表8.3-5所示.表8.3-5單位:人療法療效合計未治愈治愈甲155267乙66369合計21115136療法療效合計未治愈治愈甲155267乙66369合計21115136觀察表8.3-6單位:人吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965環(huán)節(jié)五:課堂練習,鞏固運用解:零假設為H0:吸煙與患肺癌之間無關聯.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965總結上面的例子,應用獨立性檢驗解決實際問題大致應包括以下幾個主要環(huán)節(jié):(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.(3)根據檢驗規(guī)則得出推斷結論.(4)在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律.注意,上述幾個環(huán)節(jié)的內容可以根據不同情況進行調整例如,在有些時候,分類變量的抽樣數據列聯表是問題中給定的.思考:獨立性檢驗的思想類似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?簡單地說,反證法是在某種假設H0之下,推出一個矛盾結論,從而證明H0不成立;而獨立性檢驗是在零假設H0之下,如果出現一個與H0相矛盾的小概率事件,就推斷不成立,且該推斷犯錯誤的概率不大于這個小概率.另外,在全部邏輯推理正確的情況下,反證法不會犯錯誤,但獨立性檢驗會犯隨機性錯誤.1.小概率值α的臨界值:忽略χ2的實際分布與該近似分布的誤差后,對于任何小概率值α,可以找到相應的正實數xα,使得P(χ2≥xα)=α成立.我們稱xα為α的臨界值,這個臨界值就可作為判斷χ2大小的標準,概率值α越小,臨界值xα越大.2.χ2計算公式:3.基于小概率值α的檢驗規(guī)則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.環(huán)節(jié)六:歸納總結,反思提升4.分類變量X和Y的抽樣數據的2×2列聯表:5.獨立性檢驗的一般步驟:(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.(2)根據抽樣數據整理出2×2列聯表,計算χ2的值,并與臨界值xα比較.(3)根據檢驗規(guī)則得出推斷結論.(4)在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律.n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX
先假設兩個分類變量X與Y無關系,利用上述公式根據觀測數據求出K2的觀測值k,再得出X與Y有關系的程度.(1)如果k≥10.828,就有______的把握認為“X與Y有關系”
(2)如果k≥7.879,就有______的把握認為“X與Y有關系”;99.9%99.5%(3)如果k≥_____,就有99%的把握認為“X與Y有關系”
(4)如果k≥5.024,就有97.5%的把握認為“X與Y有關系”
(5)如果k≥3.841,就有_____的把握認為“X與Y有關系”
(6)如果k≥2.706,就有_____的把握認為“X與Y有關系”.6.63595%90%環(huán)節(jié)七:目標檢測,作業(yè)布置完成教材:練習3.并完成自主學習課本例3,練習
第134頁療法療效合計未治愈治愈甲155267乙66369合計211151362.根據同一抽查數據推斷兩個分類變量之間是否有關聯,應用不同的小概率值,是否會得出不同的結論?為什么?3.為考察某種藥物A對預防疾病B的效果,進行了動物試驗,根據105個有放回簡單隨機樣本的數據,得到如下列聯表:藥物A疾病B合計未患病患病未服用291544服用471461合計7629105單位:只零假設H0為:藥物A與預防疾病B無關聯,即藥物A對預防疾病B沒有效果.4.從某學校獲取了容量為400的有放回簡單隨機樣本,將所得數學和語文期末考試成績的樣本觀測數據整理如下:數學成績語文成績合計不優(yōu)秀優(yōu)秀不優(yōu)秀21261273優(yōu)秀5473127合計266134400單位:人零假設為H0:數學成績與語文成績獨立,即數學成績與語文成績沒有關聯.由此可以看出,數學成績優(yōu)秀的人中語文成績優(yōu)秀的頻率明顯高于數學成績不優(yōu)秀的人中語文成績優(yōu)秀的頻率.根據頻率穩(wěn)定于概率的原理,我們可以推斷,數學成績優(yōu)秀的人其語文成績優(yōu)秀的概率較大.習題8.3(第135頁)1.為什么必須基于成對樣本數據推斷兩個分類變量之間是否有關聯?我們要研究的問題是同一個總體的兩個分類變量之間是否有關聯,成對樣本觀測數據是來自于對同一個總體的兩個分類變量的觀測,只有成對樣本數據才能反映兩個分類變量之間是否有關聯,以及關聯的方式和程度.3.等高堆積條形圖在兩個分類變量之間關聯性的研究中能夠起到什么作用?可以更加直觀地反映兩個分類變量之間是否具有關聯性.4.對于已經獲取的成對樣本數據,檢驗結論“兩個變量之間有關聯”的實際含義是什么?檢驗結論“兩個變量之間沒有關聯”的實際含義又是什么?檢驗結論“兩個變量之間有關聯”是“兩個變量不獨立”的另一種說法,指在零假設“兩個變量獨立”之下,成對樣本數據顯示在一次試驗中某個不利于這個假設的小概率事件發(fā)生了,由此推斷零假設不成立,從而得出“兩個變量不獨立”的檢驗結論.檢驗結論“兩個變量之間沒有關聯”是“兩個變量獨立”的另一種說法,指在零假設“兩個變量獨立”之下,成對樣本數據顯示在一次試驗中某個不利于這個假設的小概率事件沒有發(fā)生,因此不能推斷零假設不成立,按照通常的習慣接受零假設,即得出“兩個變量獨立”的檢驗結論.5.為了研究高三年級學生的性別和身高是否大于170cm的關聯性,調查了某中學所有高三年級的學生,整理得到如下列聯表:性別身高合計低于170cm不低于170cm女811697男2875103合計10991200單位:人請畫出列聯表的等高堆積條形圖,判斷該中學高三年級學生的性別和身高是否有關聯.如果結論是性別與身高有關聯,請解釋它們之間如何相互影響.性別身高合計低于170cm不低于170cm女811697男2875103合計109912006.第5題中的身高變量是數值型變量還是分類變量?為什么?分類變量.因為第5題中的身高變量只有兩個不同的取值(低于170cm和不低于170cm),用于區(qū)分兩類不同的身高現象.7.從第5題的高三學生中獲取容量為40的有放回簡單隨機樣本,由樣本數據整理得到如下列聯表:性別身高合計低于170cm不低于170cm女14721男81119合計221840單位:人性別身高合計低于170cm不低于170cm女14721男81119合計2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高硅氧玻璃纖維布合作協議書
- 農戶土地出租合同范本
- 個人賣房合同范本
- 廚房補充協議合同范本
- 合作酒吧合同范本
- 合作聯營超市合同范本
- 合伙烘焙店合同范本
- 醫(yī)院助手簽約合同范本
- 廚房設備供貨協議合同范本
- 東莞學校宿舍租賃合同范本
- 表面工程學第四章-表面淬火和表面形變強化技術
- 健康管理調查表
- 汶川地震波時程記錄(臥龍3向)
- NACHI那智機器人(操作篇)課件
- 五步三查”流程規(guī)范要求ppt課件
- 企業(yè)員工培訓PPT課件:職務犯罪培訓
- 場地租賃安全管理協議書
- 數學物理方程(很好的學習教材)PPT課件
- 電力建設工程質量監(jiān)督檢查大綱新版
- GB-T-15894-2008-化學試劑-石油醚
- 工業(yè)自動化設備項目用地申請報告(模板)
評論
0/150
提交評論