8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.3.2獨(dú)立性檢驗(yàn)分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:2×2列聯(lián)表給出成對(duì)分類變量數(shù)據(jù)的交叉分類頻數(shù)n=a+b+c+db+da+c合計(jì)c+ddcX=1a+bbaX=0Y=1Y=0合計(jì)YX

2×2列聯(lián)表的概念

按研究問(wèn)題的需要,將數(shù)據(jù)分類統(tǒng)計(jì),并做成表格加以保存,這種形式的數(shù)據(jù)統(tǒng)計(jì)表稱為列聯(lián)表。它包含了X和Y的如下信息:最后一行的前兩個(gè)數(shù)分別是事件{Y=0}和{Y=1}中樣本點(diǎn)的個(gè)數(shù);最后一列的前兩個(gè)數(shù)分別是事件{X=0}和{X=1}中樣本點(diǎn)的個(gè)數(shù);中間的四個(gè)格中的數(shù)是表格的核心部分,給出了事件{X=x,Y=y}(x,y=0,1)中樣本點(diǎn)的個(gè)數(shù);右下角格中的數(shù)是樣本空間中樣本點(diǎn)的總數(shù)。復(fù)習(xí)鞏固兩個(gè)分類變量之間關(guān)聯(lián)關(guān)系的定性分析的方法:

(2)圖形分析法:與表格相比,圖形更能直觀地反映出兩個(gè)分類變量間是否互相影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.將列聯(lián)表中的數(shù)據(jù)用高度相同的兩個(gè)條形圖表示出來(lái),其中兩列的數(shù)據(jù)分別對(duì)應(yīng)不同的顏色,這就是等高堆積條形圖.復(fù)習(xí)鞏固

“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩個(gè)頻率間存在差異推斷出來(lái)的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個(gè)樣本中,兩個(gè)頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率實(shí)際上是沒(méi)有差別的.

對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.

因此,需要找到一種更為合理的推斷方法,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.獨(dú)立性檢驗(yàn)引入新課1.零假設(shè)(原假設(shè))H0

:用概率語(yǔ)言,可將零假設(shè)改述為H0:分類變量X和Y獨(dú)立

設(shè)X和Y是定義在Ω上,取值于{0,1}的成對(duì)分類變量。判斷下面的假設(shè)關(guān)系H0:P(Y=1ΙX=0)=P(Y=1ΙX=1)是否成立,通常稱為零假設(shè)或原假設(shè)。P(Y=1ΙX=0)表示從{X=0}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=0,Y=1}的概率;P(Y=1ΙX=1)表示從{X=1}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=1,Y=1}的概率;學(xué)習(xí)新知2.獨(dú)立性檢驗(yàn)公式及定義:

假定我們通過(guò)簡(jiǎn)單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,在列聯(lián)表中,如果零假設(shè)H0成立,則應(yīng)滿足

,即ad-bc≈0.因此|ad?bc|越小,說(shuō)明兩個(gè)分類變量之間關(guān)系越弱;|ad?bc|越大,說(shuō)明兩個(gè)分類變量之間關(guān)系越強(qiáng).

2=χ為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量學(xué)習(xí)新知2=χ

用χ2取值的大小作為判斷零假設(shè)H0是否成立的依據(jù),當(dāng)它比較大時(shí)推斷H0不成立,否則認(rèn)為H0成立。這種利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).獨(dú)立性檢驗(yàn)3.臨界值的定義:對(duì)于任何小概率值α,可以找到相應(yīng)的正實(shí)數(shù)xα,使得P(χ2≥xα)=α成立,我們稱xα為α的臨界值,這個(gè)臨界值可作為判斷χ2大小的標(biāo)準(zhǔn),概率值α越小,臨界值xα越大.χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.10.8287.8796.6353.8412.706xα0.0010.0050.010.050.1α

學(xué)習(xí)新知4.基于小概率值α的檢驗(yàn)規(guī)則:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα?xí)r,我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.學(xué)習(xí)新知例2:依據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),分析例1中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異?解:零假設(shè)為H0:分類變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無(wú)差異.因?yàn)?=χ<計(jì)算得到:根據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異.例題分析思考:例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說(shuō)明其中的原因嗎?

例1只是根據(jù)一個(gè)樣本的兩個(gè)頻率間存在差異得出兩校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論,并沒(méi)有考慮由樣本隨機(jī)性可能導(dǎo)致的錯(cuò)誤,所以那里的推斷依據(jù)不太充分,在本例中,我們用χ2獨(dú)立性檢驗(yàn)對(duì)零假設(shè)H0進(jìn)行了檢驗(yàn),通過(guò)計(jì)算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對(duì)應(yīng)的臨界值2.706,因此認(rèn)為沒(méi)有充分證據(jù)推斷H0不成立,所以接受H0,推斷出兩校學(xué)生的數(shù)學(xué)優(yōu)秀率沒(méi)有顯著差異的結(jié)論,

這個(gè)檢驗(yàn)結(jié)果意味著,抽樣數(shù)據(jù)中兩個(gè)頻率的差異很有可能是由樣本隨機(jī)性導(dǎo)致的,因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論是不可靠的。

由此可見,相對(duì)于簡(jiǎn)單比較兩個(gè)頻率的推斷,用χ2獨(dú)立性檢驗(yàn)得到的結(jié)果更理性、更全面,理論依據(jù)也更充分。

當(dāng)我們接受零假設(shè)H0時(shí),也可能犯錯(cuò)誤。我們不知道犯這類錯(cuò)誤的概率p的大小,但是知道,若α越大,則p越小例3某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡(jiǎn)單隨機(jī)抽樣的方法對(duì)治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒(méi)有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,1361152169636675215治愈未治愈合計(jì)療效合計(jì)乙甲療法

例題解析根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到2=χ<根據(jù)小概率值α=0.005的χ2獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩種療法效果沒(méi)有差異.1361152169636675215治愈未治愈合計(jì)療效合計(jì)乙甲療法

追問(wèn)1:在表8.3-5中,若對(duì)調(diào)兩種療法的位置或?qū)φ{(diào)兩種療效的位置,這樣做會(huì)影響χ2取值的計(jì)算結(jié)果嗎?不影響療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136療法療效合計(jì)未治愈治愈乙66369甲155267合計(jì)21115136療法療效合計(jì)治愈未治愈甲521567乙63669合計(jì)11521136追問(wèn)2:對(duì)于例3中的抽樣數(shù)據(jù),根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒(méi)有差異.根據(jù)小概率值α=0.05的χ2獨(dú)立性檢驗(yàn),我們推斷H0不成立,即可以認(rèn)為兩種療法效果有差異,該推斷犯錯(cuò)誤的概率不超過(guò)0.05.因此可以推斷乙種療法的效果比甲種療法好例4:為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所采取有放回簡(jiǎn)單隨機(jī)抽樣,調(diào)查了9965人,得到如下結(jié)果(單位:人)依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn)。解:零假設(shè)為H0:吸煙和患肺癌之間沒(méi)有關(guān)系根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算的χ2=>根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為吸煙與患肺癌有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001,即我們有99.9%的把握認(rèn)為“吸煙與患肺癌有關(guān)系”.吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965例題解析根據(jù)表中的數(shù)據(jù)計(jì)算不吸煙者中不患肺癌和患肺癌的頻率分別為吸煙者中不患肺癌和患肺癌的評(píng)率分別為由可見,在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌頻率的4倍以上。于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌概率,即吸煙更容易引發(fā)肺癌。(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問(wèn)題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較.(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):注意:上述幾個(gè)環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進(jìn)行調(diào)整,例如,在有些時(shí)候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問(wèn)題中給定的.方法總結(jié)1.分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:課堂小結(jié)2.獨(dú)立性檢驗(yàn)的一般步驟:(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問(wèn)題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論