北京四中高三數(shù)學(xué)總復(fù)習(xí)獨立性檢驗的基本思想及其初步應(yīng)用知識講解_第1頁
北京四中高三數(shù)學(xué)總復(fù)習(xí)獨立性檢驗的基本思想及其初步應(yīng)用知識講解_第2頁
北京四中高三數(shù)學(xué)總復(fù)習(xí)獨立性檢驗的基本思想及其初步應(yīng)用知識講解_第3頁
北京四中高三數(shù)學(xué)總復(fù)習(xí)獨立性檢驗的基本思想及其初步應(yīng)用知識講解_第4頁
北京四中高三數(shù)學(xué)總復(fù)習(xí)獨立性檢驗的基本思想及其初步應(yīng)用知識講解_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、14獨立性檢驗的基本思想及其初步應(yīng)用【學(xué)習(xí)目標(biāo)】1 . 了解獨立性檢驗(只要求 2X2列聯(lián)表)的基本思想、方法及初步應(yīng)用2 .通過典型案例的探究,了解實際推斷原理和假設(shè)檢驗的基本思想、方法及初步應(yīng)用【要點梳理】要點一、分類變量有一種變量,這種變量所取不同的“值”表示的是個體所屬不同類別,稱這種變量為分類變量。要點詮釋:(1)對分類變量的理解。這里的“變量”和“值”都應(yīng)作為廣義的“變量”和“值”進行理解。例如:“性別變量”有“男”和“女”兩種類別,這里的變量指的是性別,同樣這里的“值”指的是“男”和“女”。因此,這里所說的“變量”和“值”取的不一定是具體的數(shù)值。(2)分類變量可以有多種類別。例如

2、:吸煙變量有“吸煙”與“不吸煙”兩種類別,而國籍變量則有多種類別。要點二、2X2列聯(lián)表1 .列聯(lián)表用表格列出的分類變量的頻數(shù)表,叫做列聯(lián)表。2 . 2 X2列聯(lián)表對于兩個事件 A, B,列出兩個事件在兩種狀態(tài)下的數(shù)據(jù),如下表所示:事件B事件B合計事件Aaba+b事件Acdc+d合計a+cb +da+b+c+d這樣的表格稱為2X2列聯(lián)表。要點三:卡方統(tǒng)計量公式為了研究分類變量 X與Y的關(guān)系,經(jīng)調(diào)查得到一張 2X2列聯(lián)表,如下表所示YY2合計X1aba+bXcdc+d合計a+cb+dn=a+b+c+d統(tǒng)計中有一個有用的(讀做“卡方” )統(tǒng)計量,它的表達式是:n a b c d為樣本容量) 2n(a

3、d bc)2K(a b)(c d)(a c)(b d)要點四、獨立性檢驗1 .獨立性檢驗通過2X2列聯(lián)表,再通過卡方統(tǒng)計量公式計算K2的值,利用隨機變量K2來確定在多大程度上可以認(rèn)為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗。2 .變量獨立性的判斷通過對K2統(tǒng)計量分布的研究,已經(jīng)得到兩個臨界值:3.841和6.635。當(dāng)數(shù)據(jù)量較大時,在統(tǒng)計中,用以下結(jié)果對變量的獨立性進行判斷:如果K2W 3.841時,認(rèn)為事件 A與B是無關(guān)的。如果K2 >3.841時,有95%勺把握說事件 A與事件B有關(guān);如果K2 >6.635時,有99%的把握說事件 A與事件B有關(guān); 要點詮釋:(

4、1)獨立性檢驗一般是指通過計算K 2統(tǒng)計量的大小對兩個事件是否有關(guān)進行判斷;(2)獨立性檢驗的基本思想類似于反證法。即在H):事件A與B無關(guān)的統(tǒng)計假設(shè)下,利用K2統(tǒng)計量即拒絕“事件 A與B無關(guān)",從而認(rèn)為事件 A與B有的大小來決定在多大程度上拒絕原來的統(tǒng)計假設(shè) 關(guān)。獨立性檢驗為假設(shè)檢驗的特例。(3)利用獨立性檢驗可以考察兩個分類變量是否有關(guān),并且能較精確地給出這種判斷的.把握程度。3 .獨立性檢驗的基本步驟及簡單應(yīng)用獨立性檢驗的步驟:要推斷“ A與B是否有關(guān)”,可按下面步驟進行:(1)提出統(tǒng)計假設(shè) H):事件A與B無關(guān)(相互獨立);(2)抽取樣本(樣本容量不要太小,每個數(shù)據(jù)都要大于5

5、);(3)列出2X2列聯(lián)表;(4)根據(jù)2X2列聯(lián)表,利用公式:K2n(ad bc)2,計算出 (a c)(b d)(a b)(c d)2K2的值;(5)統(tǒng)計推斷:當(dāng) K2 >3.841時,有95%的把握說事件 A與B有關(guān)當(dāng)K2>6.635時,有99%的把握說事件 A與B有關(guān);當(dāng)K2> 10.828時,有99.9 %的把握說事件 A與B有關(guān);當(dāng)K2W3.841時,認(rèn)為事件A與B是無關(guān)的.要點詮釋: 使用K2統(tǒng)計量作2X2列聯(lián)表的獨立性檢驗時,要求表中的4個數(shù)據(jù)都要大于5.D 一定要弄清K2的表達式 2 n(ad bc)中各個量的含義.(a c)(b d)(a b)(c d) 獨

6、立性檢驗的基本思想類似于反證法.要確認(rèn)“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度,首先假設(shè)結(jié)論不成立,即假設(shè)結(jié)論“兩個分類變量沒有關(guān)系” 成立,在該假設(shè)下構(gòu)造的隨機變量 K2應(yīng)該很小,如果由觀測數(shù)據(jù)計算得到的 K2的觀測值很大,則在一定程度上說明假設(shè)不合理.根據(jù)隨機變量K2的含義,由實際計算的 K2 >6.635,說明假設(shè)不合理的程度約為99%,即“兩個分類變量有關(guān)系這一結(jié)論成立的可信程度約為99%.當(dāng)K2W 3.841時,認(rèn)為兩個分類變量是無關(guān)的.【典型例題】 類型一、利用2X2列聯(lián)表計算卡方50名學(xué)例1.為了考察中學(xué)生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某校學(xué)生中隨機地抽取了 生

7、,得到如下列聯(lián)表:喜歡數(shù)學(xué)小喜歡數(shù)學(xué)合計男131023女72027合計203050根據(jù)表中的數(shù)據(jù),計算 K2【思路點撥】禾I用K2公式計算【解析】得到K2一 一250 (13 20 10 7)-4.84423 27 20 30【思路點撥】在利用2 2列聯(lián)表計算 2統(tǒng)計量作獨立性檢驗時,要求表中的4個數(shù)據(jù)大于等于5,為此,在選取樣本的容量時一定要注意 這一點。BB合計Annn12n1+An21n22n2+合計n+1n+2n【變式1】研究兩個事件 A, B之間的關(guān)系時,根據(jù)數(shù)據(jù)信息 列出如下的2X2列聯(lián)表:2計算公式正確的是(則以下A.2門(叫田22R2n21)2Bn(n1 n 1 n2 n 2)

8、2n 1n 2n1 n2nn12n21n22C 2 ngN n21n22)2 Dn 短2口1n2【答案】A則隨機變量2【變式2】由列聯(lián)表y1y2合計X143162205X213121134合計56283339。(精確到0.001 )2【答案】由K公式計算得:7.469 類型二、獨立性檢驗例2.近年來,隨著我國經(jīng)濟的飛速發(fā)展,在生產(chǎn)車間中,由于保護不當(dāng),對生產(chǎn)工人造成傷害的事件也 越來越多.某礦石粉廠當(dāng)生產(chǎn)一種礦石粉時,在數(shù)天內(nèi)即有部分工人患職業(yè)性皮膚炎(注:檢查為陽性則 為患皮膚炎),在生產(chǎn)季節(jié)開始時,隨機抽取75名車間工人穿上新防護服,其余仍穿原用的防護服,生產(chǎn)進行一個月后,檢查兩組工人的皮

9、膚炎患病人數(shù)的結(jié)果如下:陽性例數(shù)陰性例數(shù)合計新57075舊101828合計1588103問這種新防護服對預(yù)防工人患職業(yè)性皮膚炎是否有效?并說明你的理由.【思路點撥】這是一個2 2列聯(lián)表的獨立性檢驗問題,根據(jù)列聯(lián)表的數(shù)據(jù)求解判斷。【解析】提出假設(shè)H):新防護服對預(yù)防工人患職業(yè)性皮膚炎無效.將表中數(shù)據(jù)代入K2"瓷K213.826,查表可知:2、P ( K >10.828 ) 0.001 ,而13.826 >10.828,故有99.9 %的把握認(rèn)為新防護服對預(yù)防這種職業(yè)性皮膚炎有效.【總結(jié)升華】.在掌握了獨立性檢驗的基本思想后我們一般通過計算K2的值,然后比較 K 2的值與臨界

10、值的大小來精確地給出“兩個分類變量”的相關(guān)程度.舉一反三:【變式1】某企業(yè)為了更好地了解設(shè)備改造前后與生產(chǎn)合格品的關(guān)系,隨機抽取了 0 180件產(chǎn)品進行分析。其中設(shè)備改造前生產(chǎn)的合格品有 36件,不合格品有49件;設(shè)備改造后生產(chǎn)的合格品有 65件,不合格品 有30件。根據(jù)上面的數(shù)據(jù),你能得出什么結(jié)論?【答案】由已知數(shù)據(jù)得到下表一合格品不合格品合計設(shè)備改造后653095設(shè)備改造前364985合計1017918022 12.38 。95 85 101 79n 1n 2nl n2根據(jù)公式2"n11"一"n2' 得 I8。_竺_西_雙_由于12.38 >6.

11、635 ,可以得出產(chǎn)品是否合格與設(shè)備改造是有關(guān)的?!咀兪?】考察黃煙經(jīng)過培養(yǎng)液處理與否跟發(fā)生青花病的關(guān)系。調(diào)查了457株黃煙,得到下表中數(shù)據(jù),請根據(jù)數(shù)據(jù)作統(tǒng)計分析。培養(yǎng)液處理未處理合計青花病25210235無青花病80142222合計105352457分析:計算 2的值與臨界值的大小關(guān)系。2457 25 142 80 210 2【答案】 根據(jù)公式= =41.61 。235 222 105 352由于41.61 >6.635 ,說明經(jīng)過培養(yǎng)液處理的黃煙跟發(fā)生青花病是有關(guān)的?!咀兪?】為了研究色盲與性別的關(guān)系,調(diào)查了 1000人,調(diào)查結(jié)果如下表所示:男女正常442514色盲386根據(jù)上述數(shù)據(jù)

12、試問色盲與性別是否是相互獨立的?【答案】由已知條件可得下表男女合計正常442514956色盲38644合計480520100022依據(jù)公式 2 n(%n22 MnJ 得 2 = 1000 442 6 38 514=27.139。n 1n 2n1n2956 44 480 520由于27.139 >6.635 ,所以有99%勺把握認(rèn)為色盲與性別是有關(guān)的,從而拒絕原假設(shè), 可以認(rèn)為色盲與性別不是相互獨立的?!靖咔逭n堂: 獨立性檢驗的基本思想及其初步應(yīng)用406875 例題1】例3.對196個接受心臟搭橋手術(shù)的病人和196個接受血管清障手術(shù)的病人進行3年的跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查

13、結(jié)果如下表所示:又發(fā)作過心臟病未發(fā)作過心臟病合計心臟搭橋手術(shù)39157196血管清障手術(shù)29167196合計68324392試根據(jù)上述數(shù)據(jù)比較這兩種手術(shù)對病人又發(fā)作過心臟病的影響有沒有差別.【思路點撥】先提出假設(shè),然后根據(jù)K2的大小做出準(zhǔn)確估計判斷?!窘馕觥考僭O(shè)病人又發(fā)作過心臟病與做過心臟搭橋手術(shù)還是血管清障手術(shù)沒有關(guān)系.由于 a=39, b=157, c=29, d=167, a+b=196, c+d=196, a+c=68, b+d=324, n=392,2所以 K2 n(ad bc)(a c)(b d)(a b)(c d)392 (39 167 157 29)2 / -1.779。196

14、 196 68 324因為K2= 1.779 <<2.706 ,所以不能作出病人又發(fā)作過心臟病與做過心臟搭橋手術(shù)還是血管清障手術(shù) 有關(guān)系的結(jié)論.即這兩種手術(shù)對病人又發(fā)作過心臟病的影響沒有差別.【總結(jié)升華J此類問題的一般解法是利用K2n(ad bc)2(a c)(b d )(a b)(c d),求出K2的值,再利用與臨界值的大小關(guān)系來判斷假設(shè)是,否成立.在解題時應(yīng)注意準(zhǔn)確代數(shù)與計算.舉一反三:【變式1】對男女大學(xué)生在購買食品時是否看營養(yǎng)說明進行了調(diào)查,得到的數(shù)據(jù)如下表所示:看營養(yǎng)說明不看營養(yǎng)說明合計男大學(xué)生233255女大學(xué)生92534合計325789利用2X 2列聯(lián)表的獨立性檢驗估

15、計看營養(yǎng)說明與性別的關(guān)系中準(zhǔn)確的是()A.二者一定無關(guān)B.有95%勺把握說二者有關(guān)C.有99%勺把握說二者有關(guān)D.沒有理由說二者有關(guān)89 (23 25 32 9)255 34 32 572.149 ,【答案】D;由公式得:因為2.149 V 3.841 ,所以我們沒有理由說看營養(yǎng)說明與性別有關(guān)。故選D。船的情況如【變式2】在大連一煙臺的某次航運中,出現(xiàn)了惡劣氣候。隨機調(diào)查男、女乘客在船上暈 卜表所示:暈船不暈船合計男人325183女人82432合計4075115據(jù)此資料,你能否認(rèn)為在惡劣氣候中航行時,男人比女人更容易暈船?2115 (32 24 51 8)2【答案】由卡萬公式得:2 - 1.8

16、7083 32 40 75因為1.870 V 3.841 ,所以我們沒有理由說暈船跟性別有關(guān)。因此不能認(rèn)為在惡劣氣候中航行時,男人比女人更容易暈船。注意:解決本題主要運用卡方公式來判斷,盡管這次航行中男人暈船比例2比女人暈船比例-8高,8332但我們不能就此認(rèn)為在惡劣氣候中航行時男人比女人更容易暈船。類型三、獨立性檢驗的應(yīng)用例4.甲乙兩個班級進行一門考試,按照學(xué)生考試成績優(yōu)秀和不優(yōu)秀統(tǒng)計成績后,得到如下的列聯(lián)表:班級與成績列聯(lián)表優(yōu)秀不優(yōu)秀總計甲班103545乙班73845總計177390畫出列聯(lián)表的條形圖,并通過圖形判斷成績與班級是否有關(guān);利用列聯(lián)表的獨立性檢驗估計,認(rèn)為“成績與班級有關(guān)系”犯

17、錯誤的概率是多少?!窘馕觥苛新?lián)表的條形圖如圖所示:由圖及表直觀判斷,好像“成績優(yōu)秀與班級有關(guān)系”;由表中數(shù)據(jù)計算得0.653>0.455。K2的觀察值r為由下表中數(shù)據(jù)P (K2>k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828得:P(K2>0.455) =0.50 ,從而有50%勺把握認(rèn)為“成績與班級有關(guān)系”,即斷言“成績優(yōu)秀與班級有關(guān)系”犯錯誤的概率為0.5?!究偨Y(jié)升華】(1)畫出條形圖后,從圖形上判斷兩個分類變量之間是否有關(guān)系

18、。這里通過圖形的直觀感覺的結(jié)果 可能會出錯。(2)計算得到K2的觀測值比較小,所以沒有理由說明“成績優(yōu)秀與班級有關(guān)系”。這與反證法也有 類似的地方,在使用反證法證明結(jié)論時,假設(shè)結(jié)論不成立的條件下如果沒有推出矛盾,并不能說明結(jié)論成 立也不能說明結(jié)論不成立。在獨立性檢驗中,在假設(shè)“成績優(yōu)秀與班級沒有關(guān)系”的情況下,計算得到的 K2的值比較小,且P(K2>0.653) =0.42,說明事件(K2A0.653)不是一個小概率事件這個事件的發(fā)生不足 以說明“成績優(yōu)秀與班級沒有關(guān)系”,即沒有理由說明“成績優(yōu)秀與班級有關(guān)系”。這里沒有推出小概率 事件發(fā)生類似于反證法中沒有推出矛盾。舉一反三:【變式1】

19、 在調(diào)查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分別利用圖形和獨 立性檢驗的方法來判斷色盲與性別是否有關(guān).你所得到的結(jié)論在什么范圍內(nèi)有效?【答案】根據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表:色盲不色盲合計男38442480女6514520合計449561000作出相應(yīng)的二維條形圖,如圖所示.由二維條形圖可知在男人中患色盲的比例要比在女人中患色盲的比- 6 386例大,其差值 0.068比較大,因而我們可以認(rèn)為性別與患色盲是有關(guān)的;520|480 520根據(jù)列聯(lián):表中所給的數(shù)據(jù)可知:a=38 , b=442, c=6, d=514, a+b=480, c+d=520, a+c=4

20、4, b+d=956, n=1000,代入公式2n(ad bC)2(a c)(b d)(a b)(c d)1000 (38 514 6 442)2得 - 27.1 ,因為 =27.1 >10.828 ,所以我們有 99.9 %的把握認(rèn)480 520 44 965為性別與患色盲有關(guān)系.這個結(jié)論只對所調(diào)查的480名男人和520名女人有效.【變式2】某年高考后,某市教育主管部門對該市一重點中學(xué)高考上線情況進行統(tǒng)計,隨機抽查244名學(xué)生,得到如下表格:數(shù)學(xué)英語綜合科目上線不上線上線不上線上線不上線上線不上線總分上線201人17427178231762517526總分不上線43人3013232024192617總計20440201432004420143試求各科上線與總分上線之間的關(guān)系.,并求出哪一科目與總分上線關(guān)系最大?【答案】對于上述四個科目,分別構(gòu).造四個隨機變量 K12, K22, K32, K2,由表中數(shù)據(jù)可以得到:2語乂:Ki7.294 6.635 ,244 (174 13 27 30)2201 43 204 402 一 _2數(shù)學(xué) K2244(178 20 23 23)了' , K 230.00810.828,201 43 201 43_ _、2英自 K2244 (176 19 25

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論