32獨立性檢驗的基本思想及其初步應用課件_第1頁
32獨立性檢驗的基本思想及其初步應用課件_第2頁
32獨立性檢驗的基本思想及其初步應用課件_第3頁
32獨立性檢驗的基本思想及其初步應用課件_第4頁
32獨立性檢驗的基本思想及其初步應用課件_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

3.2獨立性檢驗的基本思想及其初步應用人教A版選修2-3第三章獨立性檢驗本節(jié)研究的是兩個分類變量的獨立性檢驗問題。在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對于喜歡數(shù)學課程有影響?等等。

吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調(diào)查了9965人,得到如下結(jié)果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是

在吸煙者中患肺癌的比重是

說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。0.54%2.28%探究不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計98749199651、列聯(lián)表通過圖形直觀判斷兩個分類變量是否相關(guān):2、等高條形圖不吸煙吸煙患肺癌比例不患肺癌比例等高條形圖更清晰地表達了兩種情況下患肺癌的比例。

上面我們通過分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實是否真的如此呢?這需要用統(tǒng)計觀點來考察這個問題。

現(xiàn)在想要知道能夠以多大的把握認為“吸煙與患肺癌有關(guān)”,為此先假設(shè)

H0:吸煙與患肺癌沒有關(guān)系.

用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關(guān)系”等價于“吸煙與患肺癌獨立”,即假設(shè)H0等價于P(AB)=P(A)P(B).不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d=n因此|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;

|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強。不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d=nA表示不吸煙,B表示不患肺癌H0成立時(n=a+b+c+d)

為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,基于上述分析,我們構(gòu)造一個隨機變量-----卡方統(tǒng)計量(1)

H0成立,即“吸煙與患肺癌沒有關(guān)系”,則K2應很小。根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計算得到K2的觀測值為:那么這個值到底能告訴我們什么呢?(2)

獨立性檢驗在H0成立的情況下,統(tǒng)計學家估算出如下的概率

即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。

也就是說,在H0成立的情況下,對隨機變量K2進行多次觀測,觀測值超過6.635的頻率約為0.01。思考

答:判斷出錯的概率為0.01。獨立性檢驗的基本思想(類似反證法)(1)假設(shè)結(jié)論不成立,即“兩個分類變量沒有關(guān)系”.(2)在此假設(shè)下我們所構(gòu)造的隨機變量K2

應該很小,如果由觀測數(shù)據(jù)計算得到K2的觀測值k很大,則在一定可信程度上說明不成立.即在一定可信程度上認為“兩個分類變量有關(guān)系”;如果k的值很小,則說明由樣本觀測數(shù)據(jù)沒有發(fā)現(xiàn)反對的充分證據(jù)。(3)根據(jù)隨機變量K2的含義,可以通過評價該假設(shè)不合理的程度,由實際計算出的k的值與臨界值比較,說明假設(shè)不合理的程度,即說明“兩個分類變量有關(guān)系”這一結(jié)論成立的可信度上面這種利用隨機變量K2來判斷“兩個分類變量有關(guān)系”的方法,稱為兩個分類變量的獨立性檢驗。例1在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂;而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂。分別利用圖形和獨立性檢驗方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437

根據(jù)聯(lián)表1-13中的數(shù)據(jù),得到所以有99%的把握認為“禿頂患心臟病有關(guān)”。P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828獨立性檢驗的步驟1.提出獨立性假設(shè)H0,假設(shè)兩個分類變量沒有關(guān)系;2.列出2×2列聯(lián)表,并計算K2的觀測值k;3.將觀測值k與臨界值k0進行比較,并作出判斷.(1)當K2>2.706,有_________的把握判定兩個分類變量有關(guān)系;(2)當K2>3.841,有_________的把握判定兩個分類變量有關(guān)系;(3)當K2>6.635,有_________的把握判定兩個分類變量有關(guān)系;P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.82890%95%99%課堂練習1.為考察高中生性別與是否喜歡數(shù)學課程之間的關(guān)系,在某城市的某校高中生中隨機抽取300名學生,得到如下列聯(lián)表:喜歡數(shù)學課程不喜歡數(shù)學課程總計男3785122女35143178總計72228300由表中數(shù)據(jù)計算得K2≈4.513.問:能夠有95%的把握認為高中生的性別與是否喜歡數(shù)學課程之間有關(guān)系嗎?

[2014高考遼寧文.18改編題]3.某大學餐飲中心為了了解新生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論