8.3列聯(lián)表與獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁
8.3列聯(lián)表與獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁
8.3列聯(lián)表與獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁
8.3列聯(lián)表與獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁
8.3列聯(lián)表與獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

人教A版

數(shù)學(xué)

選擇性必修第三冊第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析8.3列聯(lián)表與獨(dú)立性檢驗(yàn)課標(biāo)定位素養(yǎng)闡釋1.了解分類變量、2×2列聯(lián)表、隨機(jī)變量χ2的意義.2.了解獨(dú)立性檢驗(yàn)的基本思想方法.3.能夠運(yùn)用2×2列聯(lián)表及χ2進(jìn)行獨(dú)立性檢驗(yàn).4.通過本節(jié)課的學(xué)習(xí),進(jìn)一步提升邏輯推理、數(shù)據(jù)分析的核心素養(yǎng).自主預(yù)習(xí)新知導(dǎo)學(xué)一、分類變量與列聯(lián)表1.為了解高中生的課外活動方式,某校進(jìn)行了抽樣調(diào)查,結(jié)果整理成下表:如何直觀判定“喜歡體育還是文娛與性別有聯(lián)系”?提示:可通過表格內(nèi)分類統(tǒng)計(jì)的數(shù)據(jù)進(jìn)行直觀分析.性別課外活動合計(jì)體育文娛男生210230440女生60290350合計(jì)2705207902.(1)我們經(jīng)常會使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為

分類變量

.(2)按研究問題的需要,將數(shù)據(jù)分類統(tǒng)計(jì),并做成表格加以保存.這種形式的數(shù)據(jù)統(tǒng)計(jì)表稱為

2×2列聯(lián)表

,關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表如下:XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d3.下面是一個2×2列聯(lián)表:XY合計(jì)Y=0Y=1X=0a2173X=122527合計(jì)b46100則表中a,b處的值分別為(

)A.94,96 B.52,50C.52,54

D.54,52解析:a=73-21=52,b=100-46=54.答案:C二、獨(dú)立性檢驗(yàn)1.有人說:“在犯錯誤的概率不超過0.01的前提下認(rèn)為吸煙和患肺癌有關(guān),是指每100個吸煙者中就會有99個患肺癌的.”你認(rèn)為這種觀點(diǎn)正確嗎?為什么?提示:觀點(diǎn)不正確.犯錯誤的概率不超過0.01說明的是吸煙與患肺癌有關(guān)的程度,不是患肺癌的百分?jǐn)?shù).2.(1)利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).(3)基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯誤的概率不超過

α;當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立

.(4)χ2獨(dú)立性檢驗(yàn)中幾個常用的小概率值和相應(yīng)的臨界值:(5)應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題大致應(yīng)包括以下幾個主要環(huán)節(jié):①提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋.②根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較.③根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.④在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【思考辨析】

判斷下列說法是否正確,正確的在后面的括號內(nèi)畫“√”,錯誤的畫“×”.(1)列聯(lián)表中的數(shù)據(jù)是兩個分類變量的頻數(shù).(

)(2)χ2是判斷分類變量X與Y是否相關(guān)的統(tǒng)計(jì)量.(

)(3)當(dāng)χ2≥x0.05=3.841時(shí),認(rèn)為X和Y不獨(dú)立,該推斷犯錯誤的概率超過0.05.(

×)合作探究釋疑解惑探究一利用等高堆積條形圖判斷兩個分類變量是否存在差異【例1】

某學(xué)校對高三學(xué)生是否愛好某項(xiàng)運(yùn)動作了調(diào)查發(fā)現(xiàn):426名男生中有332人愛好該項(xiàng)運(yùn)動,594名女生中有213人愛好該項(xiàng)運(yùn)動.作出等高堆積條形圖,利用圖形判斷愛好該項(xiàng)運(yùn)動與性別是否有關(guān)系.解:作列聯(lián)表如下:是否愛好該項(xiàng)運(yùn)動性別合計(jì)男生女生愛好332213545不愛好94381475合計(jì)4265941

020在愛好的學(xué)生中,男生約占61%,在不愛好的學(xué)生中,男生約占20%.相應(yīng)的等高堆積條形圖如圖所示:圖中陰影部分表示愛好與不愛好的學(xué)生中男生的比例,從圖中可以看出愛好的學(xué)生中男生占的比例比不愛好的學(xué)生中男生占的比例高,可以認(rèn)為愛好該項(xiàng)運(yùn)動與性別有關(guān).利用等高堆積條形圖判斷兩個分類變量是否相關(guān)的步驟:(1)統(tǒng)計(jì):收集數(shù)據(jù),統(tǒng)計(jì)結(jié)果.(2)列表:列出2×2列聯(lián)表,計(jì)算頻率、粗略估計(jì).(3)繪圖:繪制等高堆積條形圖,直觀分析.【變式訓(xùn)練1】

網(wǎng)絡(luò)對現(xiàn)代人的生活影響較大,尤其是對青少年,為了解網(wǎng)絡(luò)對中學(xué)生學(xué)習(xí)成績的影響,某地區(qū)教育主管部門從轄區(qū)初中生中隨機(jī)抽取了1000人調(diào)查,發(fā)現(xiàn)其中經(jīng)常上網(wǎng)的有200人,這200人中有80人期末考試數(shù)學(xué)成績不及格,而另外800人中有120人數(shù)學(xué)成績不及格.利用圖形判斷學(xué)生經(jīng)常上網(wǎng)與數(shù)學(xué)學(xué)習(xí)成績是否有關(guān).解:根據(jù)題目所給的數(shù)據(jù)得到如下2×2列聯(lián)表:數(shù)學(xué)成績上網(wǎng)合計(jì)經(jīng)常上網(wǎng)不經(jīng)常上網(wǎng)不及格80120200及格120680800合計(jì)2008001

000得出等高堆積條形圖如圖所示:比較圖中陰影部分的高可以發(fā)現(xiàn)經(jīng)常上網(wǎng)數(shù)學(xué)成績不及格的頻率明顯高于經(jīng)常上網(wǎng)數(shù)學(xué)成績及格的頻率,因此可以認(rèn)為經(jīng)常上網(wǎng)與數(shù)學(xué)成績有關(guān).探究二獨(dú)立性檢驗(yàn)【例2】

某校高三年級在一次全年級的大型考試中,數(shù)學(xué)成績優(yōu)秀和非優(yōu)秀的學(xué)生中,物理、化學(xué)、總分也為優(yōu)秀的人數(shù)如下表所示,依據(jù)α=0.001的獨(dú)立性檢驗(yàn),分析數(shù)學(xué)成績優(yōu)秀分別與物理、化學(xué)、總分優(yōu)秀的相關(guān)性.注:該年級此次考試中數(shù)學(xué)成績優(yōu)秀的有360人,非優(yōu)秀的有880人.數(shù)學(xué)成績物理優(yōu)秀化學(xué)優(yōu)秀總分優(yōu)秀優(yōu)秀228225267非優(yōu)秀14315699解:(1)零假設(shè)為H0:數(shù)學(xué)成績與物理成績獨(dú)立,即數(shù)學(xué)成績對物理成績沒有影響.根據(jù)已知數(shù)據(jù)列出2×2列聯(lián)表如下:數(shù)學(xué)成績物理成績合計(jì)物理優(yōu)秀物理非優(yōu)秀數(shù)學(xué)優(yōu)秀228b360數(shù)學(xué)非優(yōu)秀143d880合計(jì)371b+d1

240∴b=360-228=132,d=880-143=737,b+d=132+737=869.代入公式可得χ2≈270.114>10.828=x0.001.(2)按照上述方法列出數(shù)學(xué)與化學(xué)優(yōu)秀的2×2列聯(lián)表如下:數(shù)學(xué)成績化學(xué)成績合計(jì)化學(xué)優(yōu)秀化學(xué)非優(yōu)秀數(shù)學(xué)優(yōu)秀225135360數(shù)學(xué)非優(yōu)秀156724880合計(jì)3818591

240代入公式可得χ2≈240.611>10.828=x0.001.(3)列出數(shù)學(xué)與總分優(yōu)秀的2×2列聯(lián)表如下:數(shù)學(xué)成績總成績合計(jì)總分優(yōu)秀總分非優(yōu)秀數(shù)學(xué)優(yōu)秀26793360數(shù)學(xué)非優(yōu)秀99781880合計(jì)3668741

240代入公式可得χ2≈486.123>10.828=x0.001.根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們認(rèn)為數(shù)學(xué)成績優(yōu)秀與物理、化學(xué)、總分優(yōu)秀有關(guān)系,此推斷犯錯誤的概率不大于0.001.利用χ2進(jìn)行獨(dú)立性檢驗(yàn)的步驟(1)列表:列出2×2列聯(lián)表.(2)求值:求出χ2的值.(3)判斷:與臨界值比較,得出事件有關(guān)的可能性大小,作出判斷.【變式訓(xùn)練2】

某周末,某公園內(nèi)匯聚了八方來客.面對該公園內(nèi)相鄰的兩個主題園區(qū)A和B,成年人和未成年人選擇游玩的意向會有所不同.某統(tǒng)計(jì)機(jī)構(gòu)對公園內(nèi)的100位游客(這些游客只在兩個主題園區(qū)中二選一)進(jìn)行了問卷調(diào)查.調(diào)查結(jié)果顯示,在被調(diào)查的50位成年人中,只有10人選擇A,而選擇A的未成年人有20人.(1)根據(jù)題意,請將下面的2×2列聯(lián)表填寫完整;年齡特征主題園區(qū)合計(jì)選擇A選擇B成年人

未成年人

合計(jì)

(2)根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),分析選擇哪個主題園區(qū)與年齡特征的相關(guān)性.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:(1)根據(jù)題目中的數(shù)據(jù),列出2×2列聯(lián)表如下:年齡特征主題園區(qū)合計(jì)選擇A選擇B成年人104050未成年人203050合計(jì)3070100(2)零假設(shè)為H0:年齡特征與選擇主題園區(qū)獨(dú)立,即成年人和未成年人對主題園區(qū)的選擇沒有差異.根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為年齡特征與選擇主題園區(qū)無關(guān).探究三獨(dú)立性檢驗(yàn)的綜合應(yīng)用【例3】

某市環(huán)保部門對該市市民進(jìn)行了一次垃圾分類知識的網(wǎng)絡(luò)問卷調(diào)查,每位市民僅有一次參加機(jī)會,通過簡單隨機(jī)抽樣,得到參與問卷調(diào)查的100人的得分(滿分:100分)數(shù)據(jù),統(tǒng)計(jì)結(jié)果如表所示.組別[40,50)[50,60)[60,70)[70,80)[80,90)[90,100)男235151812女051010713(1)若規(guī)定問卷得分不低于70分的市民稱為“環(huán)保關(guān)注者”,請列出2×2列聯(lián)表,依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析“環(huán)保關(guān)注者”是否與性別有關(guān).(2)若問卷得分不低于80分的人稱為“環(huán)保達(dá)人”,視頻率為概率:①在我市所有“環(huán)保達(dá)人”中,隨機(jī)抽取3人,求抽取的3人中,既有男“環(huán)保達(dá)人”又有女“環(huán)保達(dá)人”的概率;②為了鼓勵市民關(guān)注環(huán)保,針對此次的調(diào)查制定了如下獎勵方案:“環(huán)保達(dá)人”獲得兩次抽獎活動;其他參與的市民獲得一次抽獎活動,每次抽獎獲得紅包的金額和對應(yīng)的概率如下表:現(xiàn)某市民要參加此次問卷調(diào)查,記X(單位:元)為該市民參加問卷調(diào)查獲得的紅包金額,求X的分布列及均值.χ2獨(dú)立性檢驗(yàn)中常用的小概率值和相應(yīng)的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:(1)零假設(shè)為H0:性別與是否為“環(huán)保關(guān)注者”獨(dú)立,由題中表格可得2×2列聯(lián)表如下:性別是否為“環(huán)保關(guān)注者”合計(jì)非“環(huán)保關(guān)注者”“環(huán)保關(guān)注者”男104555女153045合計(jì)2575100將2×2列聯(lián)表中的數(shù)據(jù)代入公式根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為性別與“環(huán)保關(guān)注者”獨(dú)立.獨(dú)立性檢驗(yàn)綜合應(yīng)用的方法策略(1)獨(dú)立性檢驗(yàn)是判斷兩個分類變量是否相互獨(dú)立的一種檢驗(yàn)方法,主要依據(jù)是先計(jì)算χ2的值,再與臨界值進(jìn)行比較從而作出判斷.(2)統(tǒng)計(jì)的特征之一是通過樣本的部分?jǐn)?shù)據(jù)來推測總體全部數(shù)據(jù)的特征,因此統(tǒng)計(jì)推斷可能犯錯誤,即從數(shù)據(jù)上體現(xiàn)的只是統(tǒng)計(jì)關(guān)系而不是因果關(guān)系.【變式訓(xùn)練3】

為比較注射A,B兩種藥物產(chǎn)生的皮膚皰疹的面積,選200只家兔作試驗(yàn),將這200只家兔隨機(jī)地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.表1和表2所示的分別是注射藥物A和藥物B后皮膚皰疹面積的頻數(shù)分布.(皰疹面積單位:mm2)表1皰疹面積[60,65)[65,70)[70,75)[75,80]頻數(shù)30402010表2皰疹面積[60,65)[65,70)[70,75)[75,80)[80,85]頻數(shù)1025203015(1)完成圖①和圖②所示的分別注射藥物A,B后皮膚皰疹面積的頻率分布直方圖,并求注射藥物A后皰疹面積的中位數(shù);圖①

圖②(2)完成下面的2×2列聯(lián)表,依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析注射兩種藥物是否與皰疹面積有關(guān).注射藥物皰疹面積合計(jì)皰疹面積小于70mm2皰疹面積不小于70mm2注射藥物Aa=b=

注射藥物Bc=d=

合計(jì)

χ2獨(dú)立性檢驗(yàn)中常用的小概率值和相應(yīng)的臨界值

α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:(1)根據(jù)題意,完成圖①和圖②所示的頻率分布直方圖,如圖所示:圖①

圖②

(2)零假設(shè)為H0:注射藥物與皰疹面積獨(dú)立,即注射兩種藥物對皰疹面積沒有差異.根據(jù)題意填寫列聯(lián)表如下:注射藥物皰疹面積合計(jì)皰疹面積小于70

mm2皰疹面積不小于70

mm2注射藥物Aa=70b=30100注射藥物Bc=35d=65100合計(jì)10595200根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為注射兩種藥物對皰疹面積有差異,此推斷犯錯誤的概率不大于0.001.

易錯辨析獨(dú)立性檢驗(yàn)思想的應(yīng)用【典例】

為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機(jī)抽樣方法從該地區(qū)調(diào)查了500位老年人,結(jié)果如下:是否需要志愿者性別男女需要4030不需要160270(1)估計(jì)該地區(qū)老年人中需要志愿者提供幫助的老年人的比例.(2)試根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),分析該地區(qū)老年人需要志愿者提供幫助是否與性別有關(guān).(3)根據(jù)(2)的結(jié)論,能否提出更好的調(diào)查方法來估計(jì)該地區(qū)的老年人中需要志愿者提供幫助的老年人的比例?說明理由.根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為該地區(qū)老年人需要志愿者提供幫助與性別有關(guān),此推斷犯錯誤的概率不大于0.01.(3)由(2)的結(jié)論知,該地區(qū)老年人是否需要幫助與性別有關(guān),并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時(shí),先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層隨機(jī)抽樣方法,比采用簡單隨機(jī)抽樣方法更好.獨(dú)立性檢驗(yàn)與反證法的區(qū)別與聯(lián)系簡單地說,反證法是在某種假設(shè)H0之下,推出一個矛盾結(jié)論,從而證明H0不成立;而獨(dú)立性檢驗(yàn)是在零假設(shè)H0之下,如果出現(xiàn)一個與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯誤的概率不大于這個小概率.另外,在全部邏輯推理正確的情況下,反證法不會犯錯誤,但獨(dú)立性檢驗(yàn)會犯隨機(jī)性錯誤.隨堂練習(xí)1.對于分類變量X與Y的隨機(jī)變量χ2的值,下列說法正確的是(

)A.χ2越大,“X與Y有關(guān)系”的可信程度越小B.χ2越小,“X與Y有關(guān)系”的可信程度越小C.χ2越接近于0,“X與Y沒有關(guān)系”的可信程度越小D.χ2越大,“X與Y沒有關(guān)系”的可信程度越大解析:χ2越大,“X與Y沒有關(guān)系”的可信程度越小,則“X與Y有關(guān)系”的可信程度越大,χ2越小,“X與Y有關(guān)系”的可信程度越小.答案:B2.根據(jù)分類變量x與y的觀測數(shù)據(jù),計(jì)算得到χ2=2.974,依據(jù)α=0.05的獨(dú)立性檢驗(yàn),結(jié)論為(

)A.變量x與y不獨(dú)立B.變量x與y不獨(dú)立,這個結(jié)論犯錯誤的概率不超過0.05C.變量x與y獨(dú)立D.變量x與y獨(dú)立,這個結(jié)論犯錯誤的概率不超過0.05解析:因?yàn)棣?=2.974<x0.05=3.841,所以變量x與y獨(dú)立,故選C.答案:Cα0.100.050.010.0050.001xα2.7063.8416.6357.87910.8283.(多選題)對于獨(dú)立性檢驗(yàn),下列說法錯誤的是(

)A.χ2的值可以為負(fù)值B.獨(dú)立性檢驗(yàn)的統(tǒng)計(jì)假設(shè)是各事件之間相互獨(dú)立C.獨(dú)立性檢驗(yàn)顯示“患慢性支氣管炎與吸煙有關(guān)聯(lián)”即指“吸煙的人必會患

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論