




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用(一),人教A版 選修2-3 第三章 統(tǒng)計(jì)案例,獨(dú)立性檢驗(yàn),本節(jié)研究,分類變量之間是否有關(guān)系,兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問題。,創(chuàng)設(shè)情境: 最新研究發(fā)現(xiàn),花太多時(shí)間玩電腦游戲的兒童,患多動(dòng)癥的風(fēng)險(xiǎn)會(huì)加倍。青少年的大腦會(huì)很快習(xí)慣閃爍的屏幕、變幻莫測(cè)的電腦游戲,一旦如此,他們?cè)诮淌业纫曈X刺激較少的地方,就很難集中注意力。研究人員對(duì)1323名年齡在7歲到10歲的兒童進(jìn)行調(diào)查,并在孩子父母的幫助下記錄了他們?cè)?3個(gè)月里玩電腦游戲的習(xí)慣。同時(shí),教師記下這些孩子出現(xiàn)的注意力不集中問題。統(tǒng)計(jì)獲得下列數(shù)據(jù): 根據(jù)這則網(wǎng)上收集到的新聞,提出問題: “從這則新聞中可以得出哪些結(jié)
2、論?有多大把握認(rèn)為你所得出結(jié)論正確?”,為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人),列聯(lián)表,在不吸煙者中患肺癌的比重是,在吸煙者中患肺癌的比重是,說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。,0.54%,2.28%,探究,等高條形圖,等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例。,小結(jié): 根據(jù)列聯(lián)表和等高條形圖判斷的標(biāo)準(zhǔn)是什么?,吸煙群體與不吸煙群體,患肺癌的可能性是否有差異,思考: 1:差異大到什么程度才能作出“吸煙與患肺癌有關(guān)” 的判斷? 2:能否用數(shù)量刻畫出“有關(guān)”的程度?,這就需要我們用統(tǒng)計(jì)學(xué)知識(shí)來分析這個(gè)問題
3、。,引例情境如下:,現(xiàn)在想要知道吸煙與患肺癌是否真的有關(guān)以及從數(shù)量上刻畫能夠以多大的把握認(rèn)為“吸煙與患肺癌有關(guān)”,需要我們用統(tǒng)計(jì)的觀點(diǎn)來分析。,H0:吸煙與患肺癌沒有關(guān)系.,把表中的數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表,用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關(guān)系”等價(jià)于“吸煙與患肺癌獨(dú)立”,即假設(shè)H0等價(jià)于 P(AB)=P(A)P(B).,為此先假設(shè),在表中,a恰好為事件AB發(fā)生的頻數(shù);a+b和a+c恰好分 別為事件A和B發(fā)生的頻數(shù)。由于頻率接近于概率,所以應(yīng)該有,在H0成立的條件下,|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱 |ad-bc|越大,說明吸煙與患肺癌之間
4、關(guān)系越強(qiáng)。,為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,統(tǒng)計(jì)學(xué)家構(gòu)造一個(gè)隨機(jī)變量-卡方統(tǒng)計(jì)量,(1),若 H0成立,即“吸煙與患肺癌沒有關(guān)系”,則K2應(yīng)很小。,根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計(jì)算得到K2的觀測(cè)值為:,那么這個(gè)值到底能告訴我們什么呢?,(2),獨(dú)立性檢驗(yàn),統(tǒng)計(jì)學(xué)家們還得到了如下的卡方臨界值表:,以k0=6.635為例,就是說在H0成立的條件下,計(jì)算出隨機(jī)變量 的觀測(cè)值大于等于6.635的概率非常小近似0.01,也就是有99%的情況下其觀測(cè)值是小于6.635的。,分析:,判斷 是否成立的規(guī)則,如果 ,就判斷 不成立,即認(rèn)為吸煙與患肺癌有關(guān)系;否則,就判斷 成立,即
5、認(rèn)為吸煙與患肺癌沒有關(guān)系。,獨(dú)立性檢驗(yàn)的定義,上面這種利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方法,稱為獨(dú)立性檢驗(yàn)。,在該規(guī)則下,把結(jié)論“ 成立”錯(cuò)判成“ 不成立”的概率不會(huì)超過,即有99%的把握認(rèn)為 不成立。,獨(dú)立性檢驗(yàn)的基本思想(類似反證法),(1)假設(shè)結(jié)論不成立,即 “兩個(gè)分類變量沒有關(guān)系”.,(2)在此假設(shè)下我們所構(gòu)造的隨機(jī)變量 K2 應(yīng)該很小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到K2的觀測(cè)值k很大,則在一定可信程度上說明 不成立.即在一定可信程度上認(rèn)為“兩個(gè)分類變量有關(guān)系”;如果k的值很小,則說明由樣本觀測(cè)數(shù)據(jù)沒有發(fā)現(xiàn)反對(duì) 的充分證據(jù)。,(3)根據(jù)隨機(jī)變量K2的含義,借助臨界值表還可以定量評(píng)
6、價(jià)該假設(shè)不合理的程度以及我們得到“有關(guān)系”的結(jié)論成立的可信度。,反證法原理與獨(dú)立性檢驗(yàn)原理,反證法原理: 在假設(shè)H0下,如果推出一個(gè)矛盾,就證明了H0不成立。,獨(dú)立性檢原理 在假設(shè)H0下,如果出現(xiàn)一個(gè)與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯(cuò)誤的概率不超過這個(gè)小概率。,怎樣判斷K2的觀測(cè)值k是大還是小呢?,這僅需確定一個(gè)正數(shù)k0,當(dāng)kk0時(shí)就 認(rèn)為k2的觀測(cè)值大。如果kk0 ,就認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;否則就認(rèn)為“兩個(gè)分類變量之間沒有關(guān)系”,我們稱k0為一個(gè)判斷規(guī)則的臨界值。,臨界值又怎么確定呢?,思考: 你能從上述探究過程中總結(jié)出一種直觀判斷兩個(gè)分類變量有關(guān)系的思路嗎?
7、直觀判斷有何不足?,一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:,若要判斷的結(jié)論為:H1:“X與Y有關(guān)系”,可以按如下步驟判斷H1成立的可能性:,2、可以利用獨(dú)立性檢驗(yàn)來考察兩個(gè)分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。,1、通過列聯(lián)表和等高條形圖,可以粗略地判斷兩個(gè)變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度.,(1)在列聯(lián)表中,可以計(jì)算滿足條件X=x1的個(gè)體中具有Y=y1的個(gè)體所占的比例,也可以計(jì)算滿足條件X=x2的個(gè)體中具有Y=y1的個(gè)體所占的比例。兩個(gè)比例相差越大,H1成立的可能性就越
8、大。,(2)在等高條形圖中,比較兩個(gè)深色條的高,相差越大,H1成立的可能性就越大。,在實(shí)際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過下表確定臨界值:,:,(1)根據(jù)實(shí)際問題需要的可信程度確定臨界值,(2)利用公式(1),由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量 K2 的觀測(cè)值k,(3)如果kk0,就以 1-p(k2k0 )的把握認(rèn)為“X與Y有關(guān)系”;否則就說樣本觀測(cè)數(shù)據(jù)沒有提供“X與Y有關(guān)系”的充分證據(jù)。,創(chuàng)設(shè)情境:(分組討論解決問題) 最新研究發(fā)現(xiàn),花太多時(shí)間玩電腦游戲的兒童,患多動(dòng)癥的風(fēng)險(xiǎn)會(huì)加倍。青少年的大腦會(huì)很快習(xí)慣閃爍的屏幕、變幻莫測(cè)的電腦游戲,一旦如此,他們?cè)诮淌业纫曈X刺激較少的地方,就很難集中注意力。研究
9、人員對(duì)1323名年齡在7歲到10歲的兒童進(jìn)行調(diào)查,并在孩子父母的幫助下記錄了他們?cè)?3個(gè)月里玩電腦游戲的習(xí)慣。同時(shí),教師記下這些孩子出現(xiàn)的注意力不集中問題。統(tǒng)計(jì)獲得下列數(shù)據(jù): 根據(jù)這則網(wǎng)上收集到的新聞,提出問題: “從這則新聞中可以得出哪些結(jié)論?有多大把握認(rèn)為你所得出結(jié)論正確?”,反思與補(bǔ)遺,問題 1: 2 2列聯(lián)表中的2、3行或第2、3列能交換嗎?,問題2 : 你能聯(lián)想隨機(jī)事件概率的定義來感受卡方統(tǒng)計(jì)量公式的來之不易嗎?,問題 3 : 你能類比方差公式理解卡方統(tǒng)計(jì)量公式結(jié)構(gòu)的合理之處嗎?,1、回憶隨機(jī)事件A::擲一枚硬幣,正面向上,聯(lián)想其概率的確定過程。 大量的重復(fù)試驗(yàn),頻率在常數(shù)0.5附近擺動(dòng)并趨于穩(wěn)定,確定概率。 類比卡方統(tǒng)計(jì)量公式 應(yīng)該是通過大量的觀察試驗(yàn)并結(jié)合我們現(xiàn)在未知的理論研究得來的 。,2, 類比方差公式的結(jié)構(gòu)特征理解卡方統(tǒng)計(jì)量公式。,(1),方差公式中取每個(gè)樣本數(shù)據(jù)與樣本平均數(shù)差取平方即 , 這是為防止正負(fù)抵消,掩蓋真像。,(2),公式中 的主要是協(xié)調(diào)作用:因樣本容量的不同而
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 河道保潔長效管理辦法
- 河南綠化養(yǎng)護(hù)管理辦法
- 行業(yè)行為管理與運(yùn)營優(yōu)化
- 來華工作經(jīng)費(fèi)管理辦法
- 水文自動(dòng)測(cè)報(bào)系統(tǒng)的運(yùn)行機(jī)制與質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)研究
- 杭州法院薪酬管理辦法
- 前臺(tái)考勤考核管理辦法
- 保健按摩養(yǎng)生管理辦法
- 水土保持生態(tài)產(chǎn)品價(jià)值轉(zhuǎn)化機(jī)制研究
- 企業(yè)安全生產(chǎn)費(fèi)用計(jì)提標(biāo)準(zhǔn)
- 2023年高考真題-物理(廣東卷) 含答案
- 2025年湖北荊門市交通旅游投資集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 無損檢測(cè)員(鐵路探傷工)理論試題(高級(jí)工)
- 2025-2030年中國無水叔丁醇產(chǎn)業(yè)發(fā)展現(xiàn)狀及前景趨勢(shì)分析報(bào)告
- DB37T4252-2020靈芝菌種質(zhì)量要求
- 《學(xué)前教育法》知識(shí)考試題庫100題(含答案)
- 2025年工業(yè)和信息化部人才交流中心第二次招聘1人管理單位筆試遴選500模擬題附帶答案詳解
- 寧夏回族自治區(qū)城市體檢工作技術(shù)指南(試行)2024
- 國開《課堂提問與引導(dǎo)》期末大作業(yè)及答案
- 固定式啟閉機(jī)及閘門的檢修與維護(hù)規(guī)范
- 內(nèi)蒙古呼和浩特市(2024年-2025年小學(xué)五年級(jí)語文)統(tǒng)編版期末考試(下學(xué)期)試卷及答案
評(píng)論
0/150
提交評(píng)論