




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、獨(dú)立性檢驗(yàn)的基本思想獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用及其初步應(yīng)用定量變量定量變量的取值一定是實(shí)數(shù),它們的取值大小有特定的取值一定是實(shí)數(shù),它們的取值大小有特定的含義,不同取值之間的運(yùn)算也有特定的含義的含義,不同取值之間的運(yùn)算也有特定的含義. .如身高、體重、考試成績(jī)、溫度等等如身高、體重、考試成績(jī)、溫度等等.變量變量定量變量定量變量分類變量分類變量例如身高、體重、考試成績(jī)等,張明的身高是例如身高、體重、考試成績(jī)等,張明的身高是180cm180cm,李立的身高是李立的身高是175cm175cm,說(shuō)明張明比李立高,說(shuō)明張明比李立高180-175=5180-175=5(cmcm). .兩個(gè)定量變量的相
2、關(guān)關(guān)系分析:回歸分析(畫(huà)散點(diǎn)圖、兩個(gè)定量變量的相關(guān)關(guān)系分析:回歸分析(畫(huà)散點(diǎn)圖、相關(guān)系數(shù)相關(guān)系數(shù)r、相關(guān)指數(shù)、相關(guān)指數(shù)R2、殘差分析)、殘差分析)對(duì)于性別變量,其取值為男和女兩種,這種變量的不對(duì)于性別變量,其取值為男和女兩種,這種變量的不同同“值值”表示個(gè)體所屬的不同類別,像這樣的變量稱表示個(gè)體所屬的不同類別,像這樣的變量稱為為分類變量分類變量. .在日常生活中,主要考慮在日常生活中,主要考慮分類變量之間是否有關(guān)系分類變量之間是否有關(guān)系:如是否吸煙、宗教信仰、是否患肺癌、國(guó)籍等等如是否吸煙、宗教信仰、是否患肺癌、國(guó)籍等等. .例如,吸煙是否與患肺癌有關(guān)系?例如,吸煙是否與患肺癌有關(guān)系? 性別是
3、否對(duì)于喜歡數(shù)學(xué)課程有影響?等等性別是否對(duì)于喜歡數(shù)學(xué)課程有影響?等等. .分類變量也稱為屬性變量或定性變量,它們的取值一分類變量也稱為屬性變量或定性變量,它們的取值一定是離散的,而且不同的取值僅表示個(gè)體所屬的類別,定是離散的,而且不同的取值僅表示個(gè)體所屬的類別,如性別變量,只取男、女兩個(gè)值,商品的等級(jí)變量只如性別變量,只取男、女兩個(gè)值,商品的等級(jí)變量只取一級(jí)、二級(jí)、三級(jí)等等取一級(jí)、二級(jí)、三級(jí)等等. .有時(shí)也可以把分類變量的不同取值用數(shù)字來(lái)表示,但有時(shí)也可以把分類變量的不同取值用數(shù)字來(lái)表示,但這時(shí)的數(shù)字除了分類以外沒(méi)有其他的含義,這時(shí)的數(shù)字除了分類以外沒(méi)有其他的含義,例如用例如用0 0表示表示“男
4、男”,1 1表示表示“女女”,性別變量就變成,性別變量就變成取值為取值為0 0和和1 1的隨機(jī)變量,但是這些數(shù)字沒(méi)有其他的含的隨機(jī)變量,但是這些數(shù)字沒(méi)有其他的含義義. .此時(shí)比較性別變量的兩個(gè)不同值之間的大小沒(méi)有意義,此時(shí)比較性別變量的兩個(gè)不同值之間的大小沒(méi)有意義,性別變量的均值和方差也沒(méi)有意義性別變量的均值和方差也沒(méi)有意義. .兩個(gè)分類變量的相關(guān)關(guān)系的分析:通過(guò)圖形直觀判兩個(gè)分類變量的相關(guān)關(guān)系的分析:通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān);獨(dú)立性檢驗(yàn)斷兩個(gè)分類變量是否相關(guān);獨(dú)立性檢驗(yàn).由列聯(lián)表可以粗略估計(jì)出,在不吸煙者中,有由列聯(lián)表可以粗略估計(jì)出,在不吸煙者中,有0.54%0.54%患患有肺癌
5、;在吸煙者中,有有肺癌;在吸煙者中,有2.28%2.28%患有肺癌。因此,直觀患有肺癌。因此,直觀上可以得到結(jié)論:上可以得到結(jié)論:吸煙者和不吸煙者患肺癌的可能性吸煙者和不吸煙者患肺癌的可能性存在差異存在差異. .與表格相比,三維柱形圖和二維條形圖能更直觀地反與表格相比,三維柱形圖和二維條形圖能更直觀地反映出相關(guān)數(shù)據(jù)的總體狀況映出相關(guān)數(shù)據(jù)的總體狀況. .為調(diào)查吸煙是否對(duì)患肺癌有影響,某腫瘤研究所隨機(jī)為調(diào)查吸煙是否對(duì)患肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了地調(diào)查了9965人,得到如下結(jié)果(單位:人):人,得到如下結(jié)果(單位:人):吸煙與患肺癌吸煙與患肺癌列聯(lián)表列聯(lián)表(列出兩個(gè)分類變量的頻數(shù)表):(列
6、出兩個(gè)分類變量的頻數(shù)表):1 1、列聯(lián)表、列聯(lián)表2 2、三維柱形圖、三維柱形圖3 3、二維條形圖、二維條形圖不患肺癌患肺癌吸煙不吸煙不患肺癌患肺癌吸煙不吸煙080007000600050004000300020001000從三維柱形圖能清晰看出各從三維柱形圖能清晰看出各個(gè)頻數(shù)的相對(duì)大小個(gè)頻數(shù)的相對(duì)大小. .從二維條形圖能看出,吸煙者中從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例患肺癌的比例高于不患肺癌的比例. .不吸煙吸煙00.10.20.30.40.50.60.70.80.91不吸煙不吸煙吸煙吸煙患肺癌比例不患肺癌比例4 4、等高條形圖、等高條形圖等高條形圖更清晰地表達(dá)了兩種情
7、況下患肺癌的比例等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例.上面我們通過(guò)分析數(shù)據(jù)和圖形,得到的直觀印象是吸上面我們通過(guò)分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要用統(tǒng)計(jì)觀點(diǎn)來(lái)考察這個(gè)問(wèn)題用統(tǒng)計(jì)觀點(diǎn)來(lái)考察這個(gè)問(wèn)題. .現(xiàn)在想要知道能夠以多大的把握認(rèn)為現(xiàn)在想要知道能夠以多大的把握認(rèn)為“吸煙與患肺癌吸煙與患肺癌有關(guān)有關(guān)”,為此先假設(shè):,為此先假設(shè):H H0 0:吸煙與患肺癌沒(méi)有關(guān)系:吸煙與患肺癌沒(méi)有關(guān)系把數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表:把數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表:()()0aca cd
8、c abadbcabcd 吸煙與患肺癌的列聯(lián)表:吸煙與患肺癌的列聯(lián)表:如果如果“吸煙與患肺癌沒(méi)有關(guān)系吸煙與患肺癌沒(méi)有關(guān)系”,則在吸煙者中不患,則在吸煙者中不患肺癌的比例應(yīng)該與不吸煙者中相應(yīng)的比例應(yīng)差不多,肺癌的比例應(yīng)該與不吸煙者中相應(yīng)的比例應(yīng)差不多,即即|ad-bc|ad-bc|越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱;越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|ad-bc|越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng)越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng). .以以A表示不吸煙,表示不吸煙,B表示不患肺癌,則表示不患肺癌,則a表示事件表示事件AB發(fā)生的頻數(shù);發(fā)生的頻數(shù);a+b和和a+c恰好分別為事件恰好分別
9、為事件A和和B發(fā)生的發(fā)生的頻數(shù)頻數(shù).為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量上述分析,我們構(gòu)造一個(gè)隨機(jī)變量 若若H H0 0成立,即成立,即“吸煙與患肺癌沒(méi)有關(guān)系吸煙與患肺癌沒(méi)有關(guān)系”,則,則K K2 2應(yīng)很小應(yīng)很小. .由列聯(lián)表中數(shù)據(jù),利用公式(由列聯(lián)表中數(shù)據(jù),利用公式(1 1)計(jì)算得)計(jì)算得K K2 2的觀測(cè)值為:的觀測(cè)值為:22()()()()()n adbcKab cdac bd (1 1)29965(7775 49422099)56.632.78172148 9874 91k 其中其中n=a+b+c+d
10、為樣本容量為樣本容量.1)1)如果如果P(P(m10.828)= 0.00110.828)= 0.001表示有表示有99.9%99.9%的把握認(rèn)為的把握認(rèn)為”X X與與Y”Y”有關(guān)有關(guān)系系; ;2)2)如果如果P(m7.879)= 0.005P(m7.879)= 0.005表示有表示有99.5%99.5%的把握認(rèn)為的把握認(rèn)為”X X與與Y”Y”有關(guān)系有關(guān)系; ;3)3)如果如果P(m6.635)= 0.01P(m6.635)= 0.01表示有表示有99%99%的把握認(rèn)為的把握認(rèn)為”X X與與Y”Y”有關(guān)系有關(guān)系; ;4)4)如果如果P(m5.024)= 0.025P(m5.024)= 0.02
11、5表示有表示有97.5%97.5%的把握認(rèn)為的把握認(rèn)為”X X與與Y”Y”有關(guān)系有關(guān)系; ;5)5)如果如果P(m3.841)= 0.05P(m3.841)= 0.05表示有表示有95%95%的把握認(rèn)為的把握認(rèn)為”X X與與Y”Y”有關(guān)系有關(guān)系; ;6)6)如果如果P(m2.706)= 0.010P(m2.706)= 0.010表示有表示有90%90%的把握認(rèn)為的把握認(rèn)為”X X與與Y”Y”有關(guān)系有關(guān)系; ;7)7)如果如果m m2.706),2.706),就認(rèn)為沒(méi)有充分的證據(jù)顯示就認(rèn)為沒(méi)有充分的證據(jù)顯示”X X與與Y”Y”有關(guān)系有關(guān)系; ;設(shè)有兩個(gè)分類變量設(shè)有兩個(gè)分類變量X X和和Y Y它們
12、的值域分別為它們的值域分別為xx1 1,x,x2 2 和和yy1 1,y,y2 2 其樣本頻數(shù)列表其樣本頻數(shù)列表( (稱為稱為2 22 2列聯(lián)表列聯(lián)表) ) 為為22()()()()n ad bcKa b c d a c b d()2 2P(k m)P(k m)適用觀測(cè)數(shù)據(jù)適用觀測(cè)數(shù)據(jù)a a、b b、c c、d d不小于不小于5 5在在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率:成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率:2(6.635)0.01P K 也就是說(shuō),在也就是說(shuō),在H H0 0成立的情況下,對(duì)隨機(jī)變量成立的情況下,對(duì)隨機(jī)變量K K2 2進(jìn)行多次觀進(jìn)行多次觀測(cè),觀測(cè)值超過(guò)測(cè),觀測(cè)值超過(guò)6
13、.6356.635的頻率約為的頻率約為0.010.01,是一個(gè)小概率事,是一個(gè)小概率事件件. .現(xiàn)在現(xiàn)在K K2 2的觀測(cè)值的觀測(cè)值 ,遠(yuǎn)遠(yuǎn)大于,遠(yuǎn)遠(yuǎn)大于6.6356.635,所以,所以有理由斷定有理由斷定H H0 0不成立,即認(rèn)為不成立,即認(rèn)為“吸煙與患肺癌有關(guān)系吸煙與患肺癌有關(guān)系” ” 56.632k 但這種判斷會(huì)犯錯(cuò)誤,犯錯(cuò)誤的概率不會(huì)超過(guò)但這種判斷會(huì)犯錯(cuò)誤,犯錯(cuò)誤的概率不會(huì)超過(guò)0.01,即,即我們有我們有99的把握認(rèn)為的把握認(rèn)為“吸煙與患肺癌有關(guān)系吸煙與患肺癌有關(guān)系”.利用隨機(jī)變量利用隨機(jī)變量K K2 2來(lái)確定在多大程度上可以認(rèn)為來(lái)確定在多大程度上可以認(rèn)為“兩個(gè)兩個(gè)分類變量有關(guān)系分類變
14、量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)檢驗(yàn). .獨(dú)立性檢驗(yàn):獨(dú)立性檢驗(yàn):如果如果 ,就判斷,就判斷H0不成立;否則就判斷不成立;否則就判斷H0成立成立.6.635k (6.635)0.01P k 1、列聯(lián)表2、三維柱形圖3、二維條形圖不患肺癌患肺癌吸煙不吸煙不患肺癌患肺癌吸煙不吸煙080007000600050004000300020001000從三維柱形圖能清晰看出從三維柱形圖能清晰看出各個(gè)頻數(shù)的相對(duì)大小。各個(gè)頻數(shù)的相對(duì)大小。從二維條形圖能看出,吸煙者中從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例?;挤伟┑谋壤哂诓换挤伟┑谋壤?。通過(guò)圖形直觀
15、判斷兩個(gè)分類變量是否相關(guān):通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān):不吸煙吸煙00.10.20.30.40.50.60.70.80.91不吸煙不吸煙吸煙吸煙患肺癌比例不患肺癌比例4、等高條形圖等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例。隨機(jī)變量隨機(jī)變量-卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量22(),()()()()其中為樣本容量。n adbcKab cdac bdnabcd 5、獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)0k0)k2P(K臨界值表臨界值表828.102K635. 62K706. 22K22.706K 0.1%0.1%把握認(rèn)為把握認(rèn)為A A與與B B無(wú)關(guān)無(wú)關(guān)1%1%把握認(rèn)為把握認(rèn)為A A與與B B無(wú)關(guān)無(wú)關(guān)99.9%9
16、9.9%把握認(rèn)把握認(rèn)A A與與B B有關(guān)有關(guān)99%99%把握認(rèn)為把握認(rèn)為A A與與B B有關(guān)有關(guān)90%90%把握認(rèn)為把握認(rèn)為A A與與B B有關(guān)有關(guān)10%10%把握認(rèn)為把握認(rèn)為A A與與B B無(wú)關(guān)無(wú)關(guān)沒(méi)有充分的依據(jù)顯示沒(méi)有充分的依據(jù)顯示A A與與B B有關(guān),但也不能顯示有關(guān),但也不能顯示A A與與B B無(wú)關(guān)無(wú)關(guān)第一步:第一步:H H0 0: 吸煙吸煙和和患病患病之間沒(méi)有關(guān)系之間沒(méi)有關(guān)系 第二步:列出第二步:列出2 22 2列聯(lián)表列聯(lián)表 6、獨(dú)立性檢驗(yàn)的步驟、獨(dú)立性檢驗(yàn)的步驟第三步:計(jì)算第三步:計(jì)算第四步:查對(duì)臨界值表,作出判斷。第四步:查對(duì)臨界值表,作出判斷。)()()()(22dcbadbc
17、abcadnK一般地,假設(shè)有兩個(gè)分類變量一般地,假設(shè)有兩個(gè)分類變量X X和和Y Y,它們的可能取值,它們的可能取值分別為分別為xx1 1,x,x2 2 和和yy1 1,y,y2 2,其樣本頻數(shù)列聯(lián)表(稱為其樣本頻數(shù)列聯(lián)表(稱為2x22x2列聯(lián)表)為:列聯(lián)表)為:反證法原理與假設(shè)檢驗(yàn)原理反證法原理: 在一個(gè)已知假設(shè)下,如果推出一個(gè)矛盾,就證明了這個(gè)假設(shè)不成立。假設(shè)檢驗(yàn)原理:在一個(gè)已知假設(shè)下,如果一個(gè)與該假設(shè)矛盾的小概率事件發(fā)生,就推斷這個(gè)假設(shè)不成立。獨(dú)立性檢驗(yàn)的基本思想:獨(dú)立性檢驗(yàn)的基本思想:類似于數(shù)學(xué)上的反證法,對(duì)類似于數(shù)學(xué)上的反證法,對(duì)“兩個(gè)分類變量有關(guān)系兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可
18、信程度的判斷:這一結(jié)論成立的可信程度的判斷:(1 1)假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論)假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)分類變量?jī)蓚€(gè)分類變量沒(méi)有關(guān)系沒(méi)有關(guān)系”成立成立. .(2 2)在假設(shè)條件下,計(jì)算構(gòu)造的隨機(jī)變量)在假設(shè)條件下,計(jì)算構(gòu)造的隨機(jī)變量K K2 2,如果有,如果有觀測(cè)數(shù)據(jù)計(jì)算得到的觀測(cè)數(shù)據(jù)計(jì)算得到的K K2 2很大,則在一定程度上說(shuō)明假很大,則在一定程度上說(shuō)明假設(shè)不合理設(shè)不合理. .(3 3)根據(jù)隨機(jī)變量)根據(jù)隨機(jī)變量K K2 2的含義,可以通過(guò)(的含義,可以通過(guò)(2 2)式評(píng)價(jià)假)式評(píng)價(jià)假設(shè)不合理的程度,由實(shí)際計(jì)算出的設(shè)不合理的程度,由實(shí)際計(jì)算出的k6.635k6.635,說(shuō)明假設(shè)
19、,說(shuō)明假設(shè)不合理的程度約為不合理的程度約為99%99%,即,即“兩個(gè)分類有關(guān)系兩個(gè)分類有關(guān)系”這一結(jié)這一結(jié)論成立的可信程度約為論成立的可信程度約為99%.99%.若要判斷結(jié)論為:若要判斷結(jié)論為:H H1 1:“X X與與Y Y有關(guān)系有關(guān)系”,可按如下步,可按如下步驟判斷驟判斷H H1 1成立的可能性:成立的可能性:1.通過(guò)三維柱形圖和二維條形圖,可以初略地判斷兩個(gè)通過(guò)三維柱形圖和二維條形圖,可以初略地判斷兩個(gè)分類變量是否有關(guān)系,但是這種判斷無(wú)法精確地給出所分類變量是否有關(guān)系,但是這種判斷無(wú)法精確地給出所得結(jié)論的可靠程度得結(jié)論的可靠程度.(i)在三維柱形圖中,主對(duì)角線上兩個(gè)柱形高度的乘積在三維柱
20、形圖中,主對(duì)角線上兩個(gè)柱形高度的乘積ad與副對(duì)角線上的兩個(gè)柱形高度的乘積與副對(duì)角線上的兩個(gè)柱形高度的乘積bc相差越大,相差越大,H1成立的可能性就越大成立的可能性就越大.(ii)在二維條形圖中,可以估計(jì)滿足條件在二維條形圖中,可以估計(jì)滿足條件X=x1的個(gè)體中的個(gè)體中具有具有Y=y1的個(gè)體所占的比例的個(gè)體所占的比例 ,也可以估計(jì)滿足條,也可以估計(jì)滿足條件件X=x2的個(gè)體中具有的個(gè)體中具有Y=y1的個(gè)體所占的比例的個(gè)體所占的比例 ,兩,兩個(gè)比例的值相差越大,個(gè)比例的值相差越大,H1成立的可能性就越大成立的可能性就越大.aab ccd 利用獨(dú)立性檢驗(yàn)來(lái)考察兩個(gè)分類變量是否有關(guān)系,能利用獨(dú)立性檢驗(yàn)來(lái)考
21、察兩個(gè)分類變量是否有關(guān)系,能較精確地給出這種判斷的可靠程度較精確地給出這種判斷的可靠程度. .具體作法是:具體作法是:(1 1)根據(jù)實(shí)際問(wèn)題需要的可信程度確定臨界值)根據(jù)實(shí)際問(wèn)題需要的可信程度確定臨界值k k0 0;(2)由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量)由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量K2的觀測(cè)值的觀測(cè)值k;(3)如果)如果k6.635,就以(,就以(1-P(K26.635))100%的把握認(rèn)為的把握認(rèn)為“X與與Y有關(guān)系有關(guān)系”;否則就說(shuō)樣本觀測(cè)數(shù)據(jù);否則就說(shuō)樣本觀測(cè)數(shù)據(jù)沒(méi)有提供沒(méi)有提供“X與與Y有關(guān)系有關(guān)系”的充分證據(jù)的充分證據(jù).10.8287.8796.6355.0243.8412.7062.072
22、1.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()P Kk(1 1)如果)如果k10.828k10.828,就有,就有99.9%99.9%的把握認(rèn)為的把握認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”;(2 2)如果)如果k7.879k7.879,就有,就有99.5%99.5%的把握認(rèn)為的把握認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”;(3 3)如果)如果k6.635k6.635,就有,就有99%99%的把握認(rèn)為的把握認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”;(4 4)如果)如果k5.024k5.024,就有,就有97.5%97.5%的把
23、握認(rèn)為的把握認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”;(5 5)如果)如果k3.841k3.841,就有,就有95%95%的把握認(rèn)為的把握認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”;(6 6)如果)如果k2.706k2.706,就有,就有90%90%的把握認(rèn)為的把握認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”;(7 7)如果)如果k=2.706k=2.706,就認(rèn)為沒(méi)有充分的證據(jù)顯示,就認(rèn)為沒(méi)有充分的證據(jù)顯示 “ “X X與與Y Y有關(guān)系有關(guān)系”. .例例1 在某醫(yī)院,因?yàn)榛夹呐K病而住院的在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有名男性病人中,有214人禿頂;而另外人禿頂;而另外772名不是因?yàn)榛夹呐K
24、病而住院的男性病人中有名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表: 相應(yīng)的三維柱形圖如圖所相應(yīng)的三維柱形圖如圖所示,比較來(lái)說(shuō),底面副對(duì)示,比較來(lái)說(shuō),底面副對(duì)角線上兩個(gè)柱體高度的乘角線上兩個(gè)柱體高度的乘積要大一些,因此可以在積要大一些,因此可以在某種程度上認(rèn)為某種程度上認(rèn)為“禿頂與禿頂與患心臟病有關(guān)患心臟病有關(guān)”。禿頭不禿頭例例1 在某
25、醫(yī)院,因?yàn)榛夹呐K病而住院的在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有名男性病人中,有214人禿頂;而另外人禿頂;而另外772名不是因?yàn)榛夹呐K病而住院的男性病人中有名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表: 根據(jù)聯(lián)表根據(jù)聯(lián)表1-13中的數(shù)據(jù),得到中的數(shù)據(jù),得到221437 (214 597 175 451)16.3736.6
26、35.389 1048 665 772K所以有所以有99%的把握認(rèn)為的把握認(rèn)為“禿頂患心臟病有關(guān)禿頂患心臟病有關(guān)”。例1.禿頭與患心臟病 在解決實(shí)際問(wèn)題時(shí),可以直接計(jì)算K2的觀測(cè)值k進(jìn)行獨(dú)立檢驗(yàn),而不必寫(xiě)出K2的推導(dǎo)過(guò)程 。 本例中的邊框中的注解,主要是使得學(xué)生們注意統(tǒng)計(jì)結(jié)果的適用范圍(這由樣本的代表性所決定)。因?yàn)檫@組數(shù)因?yàn)檫@組數(shù)據(jù)來(lái)自住院據(jù)來(lái)自住院的病人,因的病人,因此所得到的此所得到的結(jié)論適合住結(jié)論適合住院的病人群院的病人群體體例例2 為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取某城市的某校高中生中隨機(jī)抽
27、取300名學(xué)生,得到如下聯(lián)表:名學(xué)生,得到如下聯(lián)表:由表中數(shù)據(jù)計(jì)算由表中數(shù)據(jù)計(jì)算K2的觀測(cè)值的觀測(cè)值k 4.514。能夠以。能夠以95%的把握認(rèn)為高的把握認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎?請(qǐng)?jiān)敿?xì)闡述得出中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎?請(qǐng)?jiān)敿?xì)闡述得出結(jié)論的依據(jù)。結(jié)論的依據(jù)。解:可以有解:可以有95%以上的把握認(rèn)為以上的把握認(rèn)為“性別與喜歡數(shù)學(xué)課程之間有關(guān)系性別與喜歡數(shù)學(xué)課程之間有關(guān)系”。分別用分別用a,b,c,d表示樣本中喜歡數(shù)學(xué)課的男生人數(shù)、不喜歡數(shù)學(xué)課的男生表示樣本中喜歡數(shù)學(xué)課的男生人數(shù)、不喜歡數(shù)學(xué)課的男生人數(shù)、喜歡數(shù)學(xué)課的女生人數(shù)、不喜歡數(shù)學(xué)課的女生人數(shù)。人數(shù)、喜歡
28、數(shù)學(xué)課的女生人數(shù)、不喜歡數(shù)學(xué)課的女生人數(shù)。如果性別與是否喜歡數(shù)學(xué)課有關(guān)系,則男生中喜歡數(shù)學(xué)課的比例如果性別與是否喜歡數(shù)學(xué)課有關(guān)系,則男生中喜歡數(shù)學(xué)課的比例 與與女生中喜歡數(shù)學(xué)課的比例女生中喜歡數(shù)學(xué)課的比例 應(yīng)該相差很多,即應(yīng)該相差很多,即aabccd()()acadbcabcdab cd()()()()()abcdab cdac bd例例2 為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下聯(lián)表:名學(xué)生,得到如下聯(lián)表:由表中數(shù)據(jù)計(jì)算由表中數(shù)據(jù)計(jì)算K2的觀測(cè)值的觀測(cè)值k
29、 4.514。能夠以。能夠以95%的把握認(rèn)為高的把握認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎?請(qǐng)?jiān)敿?xì)闡述得出中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎?請(qǐng)?jiān)敿?xì)闡述得出結(jié)論的依據(jù)。結(jié)論的依據(jù)。()()()()()abcd ab cdac bd 22(),()()()()n adbcKab cdac bd因此,因此, 越大,越大, “性別與喜歡數(shù)學(xué)課程之間有關(guān)系性別與喜歡數(shù)學(xué)課程之間有關(guān)系”成立的可能性就越大。成立的可能性就越大。2K另一方面,在假設(shè)另一方面,在假設(shè)“性別與喜歡數(shù)學(xué)課程之間有關(guān)系性別與喜歡數(shù)學(xué)課程之間有關(guān)系”的前提下,事件的前提下,事件 的概率為的概率為23.841K 2(3.
30、841)0.05,P K 因此事件因此事件A是一個(gè)小概率事件。而由樣本數(shù)據(jù)計(jì)算得是一個(gè)小概率事件。而由樣本數(shù)據(jù)計(jì)算得 的觀測(cè)值的觀測(cè)值k=4.514,即即小概率事件小概率事件A發(fā)生。因此應(yīng)該斷定發(fā)生。因此應(yīng)該斷定“性別與喜歡數(shù)學(xué)課程之間有關(guān)系性別與喜歡數(shù)學(xué)課程之間有關(guān)系”成立,成立,并且這種判斷結(jié)果出錯(cuò)的可能性約為并且這種判斷結(jié)果出錯(cuò)的可能性約為5%。所以,約有。所以,約有95%的把握認(rèn)為的把握認(rèn)為“性性別與喜歡數(shù)學(xué)課程之間有關(guān)系別與喜歡數(shù)學(xué)課程之間有關(guān)系”。2K例例3.3.在在500500人身上試驗(yàn)?zāi)撤N血清預(yù)防感冒作用,把他們一年中的人身上試驗(yàn)?zāi)撤N血清預(yù)防感冒作用,把他們一年中的感冒記錄與另
31、外感冒記錄與另外500500名未用血清的人的感冒記錄作比較,結(jié)果如名未用血清的人的感冒記錄作比較,結(jié)果如表所示。表所示。試畫(huà)出列聯(lián)表的條形圖,并通過(guò)圖形判斷這種血清能否起到預(yù)試畫(huà)出列聯(lián)表的條形圖,并通過(guò)圖形判斷這種血清能否起到預(yù)防感冒的作用?并進(jìn)行獨(dú)立性檢驗(yàn)。防感冒的作用?并進(jìn)行獨(dú)立性檢驗(yàn)。解:設(shè)解:設(shè)H0:感冒與是否使用該血清沒(méi)有關(guān)系。:感冒與是否使用該血清沒(méi)有關(guān)系。075.7500500526474216242284258100022K因當(dāng)因當(dāng)H0成立時(shí),成立時(shí),K26.635的概率約為的概率約為0.01,故有,故有99%的把握認(rèn)的把握認(rèn)為該血清能起到預(yù)防感冒的作用。為該血清能起到預(yù)防感冒的作用。解:設(shè)解:設(shè)H0:藥的效果與給藥方式?jīng)]有關(guān)系。:藥的效果與給藥方式?jīng)]有關(guān)系。3896.19598711224064315819322K因當(dāng)因當(dāng)H0成立時(shí),成立時(shí),K21.3896的概率大于的概率大于15%,故不能否定假設(shè),故不能否定假設(shè)H0,即不能作出藥的效果與給藥方式有關(guān)的結(jié)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東省德州市齊河縣2024-2025學(xué)年八年級(jí)上學(xué)期期末生物學(xué)試題(含答案)
- 客戶溝通與反饋記錄
- 小王子遇見(jiàn)世界的觀后感
- 高中化學(xué)實(shí)驗(yàn)設(shè)計(jì)與探究:化學(xué)反應(yīng)原理教案
- 《初高中英語(yǔ)語(yǔ)法比較與辨析教案》
- 不動(dòng)產(chǎn)交易買賣協(xié)議書(shū)
- 中學(xué)生歷史事件故事讀后感
- 美容師儀器知識(shí)培訓(xùn)課件
- 血液++課件-2024-2025學(xué)年北師大版生物七年級(jí)下冊(cè)
- 紅色故事鐵道游擊隊(duì)的愛(ài)國(guó)主義教育解讀
- 脊柱內(nèi)鏡應(yīng)用與進(jìn)展
- 鹿茸的現(xiàn)代藥理研究報(bào)告
- 化工行業(yè)儀表典型事故分析報(bào)告
- 2024年初級(jí)會(huì)計(jì)職稱《初級(jí)會(huì)計(jì)實(shí)務(wù)》真題匯編及答案
- 醫(yī)用耗材配送服務(wù)方案
- 中職統(tǒng)編《金屬材料與熱處理》系列課件 第3章 鐵碳合金(動(dòng)畫(huà)) 云天系列課件
- 人教版七年級(jí)下冊(cè)地理全冊(cè)復(fù)習(xí)知識(shí)點(diǎn)匯總課件
- 外墻瓷磚隱患排查施工方案
- 21 自然界和社會(huì)
- 反腐倡廉廉潔行醫(yī)
- 國(guó)家公務(wù)員考試準(zhǔn)考證模板
評(píng)論
0/150
提交評(píng)論