列聯(lián)表與獨(dú)立檢驗(yàn)-課件_第1頁
列聯(lián)表與獨(dú)立檢驗(yàn)-課件_第2頁
列聯(lián)表與獨(dú)立檢驗(yàn)-課件_第3頁
列聯(lián)表與獨(dú)立檢驗(yàn)-課件_第4頁
列聯(lián)表與獨(dú)立檢驗(yàn)-課件_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

精品課件高中數(shù)學(xué)選擇性必修3第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析新人教版

列聯(lián)表與獨(dú)立檢驗(yàn)特級教師優(yōu)秀課件精選精品高中數(shù)學(xué)選擇性必修3第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析新人教版1教學(xué)目標(biāo)了解獨(dú)立性檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想.理解獨(dú)立性檢驗(yàn)中P(

≥K0)的具體含義.掌握獨(dú)立性檢驗(yàn)的方法和步驟.教學(xué)目標(biāo)了解獨(dú)立性檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想.理解教學(xué)重點(diǎn)教學(xué)難點(diǎn)相互獨(dú)立事件的概念以及概率積公式的應(yīng)用,獨(dú)立檢驗(yàn)的方法與步驟。對獨(dú)立性檢驗(yàn)的基本思想以及

的意義的理解。

教學(xué)重點(diǎn)教學(xué)難點(diǎn)相互獨(dú)立事件的概念以及概率積公式的應(yīng)用,獨(dú)立

1.定義:事件A是否發(fā)生對事件B發(fā)生的概率

,即P(B|A)=________,這時(shí),我們稱兩個(gè)事件A,B相互獨(dú)立,并把這兩個(gè)事件叫做相互獨(dú)立事件.

2.性質(zhì):當(dāng)事件A,B相互獨(dú)立時(shí),________與________,________與________,________與________也相互獨(dú)立.

沒有影響P(B)AABBAB相互獨(dú)立事件的概念與性質(zhì)

1.定義:事件A是否發(fā)生對事件B發(fā)生的概率

飲用水的質(zhì)量是人類普遍關(guān)心的問題.據(jù)統(tǒng)計(jì),飲用優(yōu)質(zhì)水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人.

人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?飲用水的質(zhì)量是人類普遍關(guān)心的問題.據(jù)統(tǒng)計(jì),飲用優(yōu)質(zhì)水的518問題:數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實(shí)際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。

假設(shè)“面包份量足”,則一年購買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個(gè)平均值不大于950g”是一個(gè)與假設(shè)“面包份量足”矛盾的小概率事件;這個(gè)小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。

問題:數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面一:假設(shè)檢驗(yàn)問題的原理

假設(shè)檢驗(yàn)問題由兩個(gè)互斥的假設(shè)構(gòu)成,其中一個(gè)叫做原假設(shè),用H0表示;另一個(gè)叫做備擇假設(shè),用H1表示。

例如,在前面的例子中,原假設(shè)為:H0:面包份量足,備擇假設(shè)為:H1:面包份量不足。

這個(gè)假設(shè)檢驗(yàn)問題可以表達(dá)為:H0:面包份量足←→H1:面包份量不足

一:假設(shè)檢驗(yàn)問題的原理

假設(shè)檢驗(yàn)問題由兩個(gè)互斥的假設(shè)構(gòu)成,二:求解假設(shè)檢驗(yàn)問題

考慮假設(shè)檢驗(yàn)問題:H0:面包分量足←→H1:面包分量不足

求解思路分析:

1.在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件;

2.如果樣本使得這個(gè)小概率事件發(fā)生,就能以一定把握斷言H1成立;

否則,斷言沒有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。

二:求解假設(shè)檢驗(yàn)問題

考慮假設(shè)檢驗(yàn)問題:H0:面包分量足兩種變量:變量定量變量:體重。身高,溫度??荚嚦煽兊鹊?。分類變量:性別,是否吸煙、是否患肺癌、宗教信仰,國籍等。在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?

性別是否對于喜歡數(shù)學(xué)課程有影響?等等。研究兩個(gè)變量的相關(guān)關(guān)系:變量本節(jié)研究的是兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問題。定量變量:回歸分析(畫散點(diǎn)圖、相關(guān)系數(shù)r、相關(guān)指數(shù)

、殘差分析)分類變量:獨(dú)立性檢驗(yàn)兩種變量:變量定量變量:體重。身高,溫度??荚嚦煽兊鹊?。分類總計(jì)總計(jì)abcda+cb+da+bc+da+b+c+d列聯(lián)表①定義:列出的兩個(gè)分類變量的________稱為列聯(lián)表.②2×2列聯(lián)表一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為_________和__________,其樣本頻數(shù)列聯(lián)表(也稱為2×2列聯(lián)表)為下表.頻數(shù)表{

}{

,

}總計(jì)總計(jì)abcda+cb+da+bc+da+b+c+d列聯(lián)表(1)

2×2列聯(lián)表用于研究兩類變量之間是否相互獨(dú)立,它適用于分析兩類變量之間的關(guān)系,是對兩類變量進(jìn)行獨(dú)立性檢驗(yàn)的基礎(chǔ).

(2)

表中|ad-bc|越小,兩個(gè)變量之間的關(guān)系越弱;|ad-bc|越大,兩個(gè)變量之間的關(guān)系越強(qiáng).對2×2列聯(lián)表的理解(1)

2×2列聯(lián)表用于研究兩類變量之間是否相互獨(dú)立,它適1.為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測驗(yàn)得到了如下?lián)杭仔?3名學(xué)生中有10名數(shù)學(xué)成績優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績優(yōu)秀率之間是否存在差異.解:用

表示兩所學(xué)校的全體學(xué)生構(gòu)成的集合,考慮以為樣本空間的古典概型.對于2中每一名學(xué)生,定義分類變量X和Y如下:我們將所給數(shù)據(jù)整理成下表學(xué)校甲校(X=0)乙校(X=1)數(shù)學(xué)成績不優(yōu)秀(Y=0)優(yōu)秀(Y=1)33387110717合計(jì)合計(jì)4345881.為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的上表是關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:最后一行的前兩個(gè)數(shù)分別是事件(Y=0)和(Y-1)的頻數(shù);最后一列的前兩個(gè)數(shù)分別是事件(X一0)和(X=1)的頻數(shù);中間的四個(gè)格中的數(shù)是事件(X=x,Y=y)(x,y=0,1)的頻數(shù);右下角格中的數(shù)是樣本容量.因此,甲校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為:

乙校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為:

我們可以用等高堆積條形圖直觀地展示上述計(jì)算結(jié)果,如下圖所示.和和上表是關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:最后一行的在右圖中,左邊的藍(lán)色和紅色條的高度分別是甲校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率;右邊的藍(lán)色和紅色條的高度分別是乙校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率。通過比較發(fā)現(xiàn),兩個(gè)學(xué)校學(xué)生抽樣數(shù)據(jù)中數(shù)學(xué)成績優(yōu)秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率。

依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷

P(Y=1|X=0)>P(Y=1|X=1),也就是說,如果從甲校和乙校各隨機(jī)選取一名學(xué)生,那么甲校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率,因此,可以認(rèn)為兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績優(yōu)秀率比乙校學(xué)生的高.在右圖中,左邊的藍(lán)色和紅色條的高度分別是甲校學(xué)生中數(shù)學(xué)成績不事實(shí)上,“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩個(gè)頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個(gè)樣本中,兩個(gè)頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率實(shí)際上是沒有差別的。這就是說,樣本的隨機(jī)性導(dǎo)致了兩個(gè)頻率間出現(xiàn)較大差異,在這種情況下,我們推斷出的結(jié)論就是錯(cuò)誤的.后面我們將討論犯這種錯(cuò)誤的概率大小問題。你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯(cuò)誤的?事實(shí)上,“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩2.下面是一個(gè)2×2列聯(lián)表則表中a,b處的值分別為()A.94,96B.52,50C.52,54D.54,52C合計(jì)合計(jì)ab22125467327100單位:人2.下面是一個(gè)2×2列聯(lián)表則表中a,b處的值分別為()

(1)吸煙是否對每位煙民一定會(huì)引發(fā)健康問題?

(2)有人說吸煙不一定引起健康問題,因此可以吸煙.這種說法對嗎?3.根據(jù)有關(guān)規(guī)定,香煙盒上必須印上“吸煙有害健康”的警示語,那么(1)不一定答案:(2)不對

(1)吸煙是否對每位煙民一定會(huì)引發(fā)健康問題?

(2)有人(1)定義:利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).

(2)K2=

,

其中n=a+b+c+d為樣本容量.獨(dú)立性檢驗(yàn)(1)定義:利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方①根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤概率的上界α,然后查表確定___________

.②利用公式計(jì)算隨機(jī)變量

的___________

.

③如果

___________

,就推斷

“X

與Y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過α,否則就認(rèn)為在___________

___________

不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中支持結(jié)論“X與Y有關(guān)系”.臨界值觀測值犯錯(cuò)誤的概率沒有發(fā)現(xiàn)足夠證據(jù)0獨(dú)立性檢驗(yàn)的具體做法①根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤獨(dú)立性檢驗(yàn)的基本思想與反證法的思想的相似之處反證法獨(dú)立性檢驗(yàn)要證明結(jié)論A要確認(rèn)“兩個(gè)分類變量有關(guān)系”在A不成立的前提下進(jìn)行推理假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)在A不成立的前分類變量沒有關(guān)系”成立,在該假設(shè)下提下進(jìn)行推理計(jì)算

獨(dú)立性檢驗(yàn)的基本思想與反證法的思想的相似之處反證法獨(dú)立性檢驗(yàn)

獨(dú)立性檢驗(yàn);

根據(jù)觀測值分析事件是否獨(dú)立。獨(dú)立性檢驗(yàn)

獨(dú)立性檢驗(yàn);

根據(jù)觀測值分析事件是否獨(dú)立。獨(dú)立性檢驗(yàn)2.依據(jù)小概率值a=0.1的X2獨(dú)立性檢驗(yàn),分析例1中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率有差異?解:零假設(shè)為

Ho:分類變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異.根據(jù)表中的數(shù)據(jù),計(jì)算得到

根據(jù)小概率值a=0.1的X2獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷出H0不成立,因此可以認(rèn)為Ho成立,即認(rèn)為兩校的數(shù)學(xué)成績優(yōu)秀率沒有差異.

2.依據(jù)小概率值a=0.1的X2獨(dú)立性檢驗(yàn),分析例1中的抽樣3.某兒童醫(yī)院用甲、乙兩種療扶治療小兒消化不良,采用有故回簡單隨機(jī)抽樣的方法對治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值

=0.005的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療祛好.將所給數(shù)據(jù)進(jìn)行整理,得兩種療法治療數(shù)據(jù)的列聯(lián)表,如下表.解:零假設(shè)為Ho:療法與療效獨(dú)立,即兩種療祛效果沒有差異.3.某兒童醫(yī)院用甲、乙兩種療扶治療小兒消化不良,采用有故回簡療法療效合計(jì)甲乙合計(jì)未治愈治愈1552152631156769136根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到根據(jù)小概率值

=0.005的獨(dú)立性檢驗(yàn),沒有充分證推斷H,不成立,因此可以認(rèn)為Ho

成立,即認(rèn)為兩種療法效果沒有差異.單位:人療法療效合計(jì)甲乙合計(jì)未治愈治愈1552152631156764.為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計(jì)結(jié)果,如表8.3-6所示。依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn).單位:人吸煙非吸煙者吸煙者合計(jì)肺癌非肺癌患者肺癌患者777520999874424991合計(jì)781721489965解:零假設(shè)為Ho:吸煙與患肺之間無關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到4.為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機(jī)據(jù)小概率值

=0.001的獨(dú)立性檢驗(yàn),我們推斷H。不成立,即認(rèn)為吸煙與患肺關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001.根據(jù)表8.3-6中的數(shù)據(jù)計(jì)算,不吸煙者中不患肺癌和患肺癌的頻率分別為和吸煙者中不患肺癌和患肺癌的頻率分別為:和由可見,在破調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的4倍以上.于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌的概率,即吸煙更容易引發(fā)肺癌。據(jù)小概率值

=0.001的獨(dú)立性檢驗(yàn),我們推斷H。不A.B.C.D.CA.B.C.D.C1.對于分類變量A與B的統(tǒng)計(jì)量χ2,下列說法正確的是()A.χ2越大,說明“A與B有關(guān)系”的可信度越小B.χ2越大,說明“A與B無關(guān)”的程度越大C.χ2越小,說明“A與B有關(guān)系”的可信度越小D.χ2接近于0,說明“A與B無關(guān)”的程度越小1.對于分類變量A與B的統(tǒng)計(jì)量χ2,下列說法正確的是()列聯(lián)表與獨(dú)立檢驗(yàn)_課件應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):(1)提出零假設(shè)Ho:X和Y相互獨(dú)立,并給出在問題中的解釋;

(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算

的值,并與臨界值x。比較;

(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論;

(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):(1)1.為了研究高三年級學(xué)生的性別和身高是否大于170cm的問題,得到某中學(xué)高三年級學(xué)生的性別和身高的所有觀測數(shù)據(jù)所對應(yīng)的列聯(lián)表如下:計(jì)算出K2,然后與臨界值對比單位:人性別女男合計(jì)合計(jì)身高低于170cm不低于170cm812810916759197103200請畫出列聯(lián)表的等高堆積條形圖,判斷該中學(xué)高三年級學(xué)生的性別和身高是否有關(guān)聯(lián).如果結(jié)論是性別與身高有關(guān)聯(lián),請解釋它們之間如何相互影響.1.為了研究高三年級學(xué)生的性別和身高是否大于170cm的問題2.從第1題的高三學(xué)生中獲取容量為40的有放回簡單隨機(jī)樣本,得到性別和身高變量的樣本觀測數(shù)據(jù)所對應(yīng)的列聯(lián)表如下:單位:人性別女男合計(jì)身高低于170cm不低于170cm合計(jì)1482271118211940(1)依據(jù)α=0.05的獨(dú)立性檢驗(yàn),能否認(rèn)為該中學(xué)高三年級學(xué)生的性別與身高有關(guān)聯(lián)?解釋所得結(jié)論的實(shí)際含義.

(2)得到的結(jié)論與第1題的一致嗎?如果不一致,你認(rèn)為原因是什么.2.從第1題的高三學(xué)生中獲取容量為40的有放回簡單隨機(jī)樣本,3.調(diào)查某醫(yī)院一段時(shí)間內(nèi)嬰兒出生的時(shí)間和性別的關(guān)聯(lián)性,得到如下的列聯(lián)表:單位:人出生時(shí)間性別女男合計(jì)合計(jì)晚上白天24832312657553489依據(jù)α=0.1的獨(dú)立性檢驗(yàn),能否認(rèn)為性別與出生時(shí)間有關(guān)聯(lián)?解釋所得結(jié)論的實(shí)際含義.根據(jù)表中數(shù)據(jù),計(jì)算對照臨界值知,認(rèn)為嬰兒的性別與出生時(shí)間有關(guān)系的把握為90%.3.調(diào)查某醫(yī)院一段時(shí)間內(nèi)嬰兒出生的時(shí)間和性別的關(guān)聯(lián)性,得到如獨(dú)立性檢驗(yàn)2×2列聯(lián)表作法(理解)

統(tǒng)計(jì)量的計(jì)算(理解)

理解獨(dú)立性檢驗(yàn)的思想(了解)

總結(jié)獨(dú)立性檢驗(yàn)2×2列聯(lián)表作法(理解)

統(tǒng)計(jì)量的精品課件高中數(shù)學(xué)選擇性必修3第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析新人教版

列聯(lián)表與獨(dú)立檢驗(yàn)特級教師優(yōu)秀課件精選精品高中數(shù)學(xué)選擇性必修3第八章成對數(shù)據(jù)的統(tǒng)計(jì)分析新人教版35教學(xué)目標(biāo)了解獨(dú)立性檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想.理解獨(dú)立性檢驗(yàn)中P(

≥K0)的具體含義.掌握獨(dú)立性檢驗(yàn)的方法和步驟.教學(xué)目標(biāo)了解獨(dú)立性檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想.理解教學(xué)重點(diǎn)教學(xué)難點(diǎn)相互獨(dú)立事件的概念以及概率積公式的應(yīng)用,獨(dú)立檢驗(yàn)的方法與步驟。對獨(dú)立性檢驗(yàn)的基本思想以及

的意義的理解。

教學(xué)重點(diǎn)教學(xué)難點(diǎn)相互獨(dú)立事件的概念以及概率積公式的應(yīng)用,獨(dú)立

1.定義:事件A是否發(fā)生對事件B發(fā)生的概率

,即P(B|A)=________,這時(shí),我們稱兩個(gè)事件A,B相互獨(dú)立,并把這兩個(gè)事件叫做相互獨(dú)立事件.

2.性質(zhì):當(dāng)事件A,B相互獨(dú)立時(shí),________與________,________與________,________與________也相互獨(dú)立.

沒有影響P(B)AABBAB相互獨(dú)立事件的概念與性質(zhì)

1.定義:事件A是否發(fā)生對事件B發(fā)生的概率

飲用水的質(zhì)量是人類普遍關(guān)心的問題.據(jù)統(tǒng)計(jì),飲用優(yōu)質(zhì)水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人.

人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?飲用水的質(zhì)量是人類普遍關(guān)心的問題.據(jù)統(tǒng)計(jì),飲用優(yōu)質(zhì)水的518問題:數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實(shí)際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。

假設(shè)“面包份量足”,則一年購買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個(gè)平均值不大于950g”是一個(gè)與假設(shè)“面包份量足”矛盾的小概率事件;這個(gè)小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。

問題:數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面一:假設(shè)檢驗(yàn)問題的原理

假設(shè)檢驗(yàn)問題由兩個(gè)互斥的假設(shè)構(gòu)成,其中一個(gè)叫做原假設(shè),用H0表示;另一個(gè)叫做備擇假設(shè),用H1表示。

例如,在前面的例子中,原假設(shè)為:H0:面包份量足,備擇假設(shè)為:H1:面包份量不足。

這個(gè)假設(shè)檢驗(yàn)問題可以表達(dá)為:H0:面包份量足←→H1:面包份量不足

一:假設(shè)檢驗(yàn)問題的原理

假設(shè)檢驗(yàn)問題由兩個(gè)互斥的假設(shè)構(gòu)成,二:求解假設(shè)檢驗(yàn)問題

考慮假設(shè)檢驗(yàn)問題:H0:面包分量足←→H1:面包分量不足

求解思路分析:

1.在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件;

2.如果樣本使得這個(gè)小概率事件發(fā)生,就能以一定把握斷言H1成立;

否則,斷言沒有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。

二:求解假設(shè)檢驗(yàn)問題

考慮假設(shè)檢驗(yàn)問題:H0:面包分量足兩種變量:變量定量變量:體重。身高,溫度??荚嚦煽兊鹊?。分類變量:性別,是否吸煙、是否患肺癌、宗教信仰,國籍等。在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?

性別是否對于喜歡數(shù)學(xué)課程有影響?等等。研究兩個(gè)變量的相關(guān)關(guān)系:變量本節(jié)研究的是兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問題。定量變量:回歸分析(畫散點(diǎn)圖、相關(guān)系數(shù)r、相關(guān)指數(shù)

、殘差分析)分類變量:獨(dú)立性檢驗(yàn)兩種變量:變量定量變量:體重。身高,溫度。考試成績等等。分類總計(jì)總計(jì)abcda+cb+da+bc+da+b+c+d列聯(lián)表①定義:列出的兩個(gè)分類變量的________稱為列聯(lián)表.②2×2列聯(lián)表一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為_________和__________,其樣本頻數(shù)列聯(lián)表(也稱為2×2列聯(lián)表)為下表.頻數(shù)表{

}{

,

}總計(jì)總計(jì)abcda+cb+da+bc+da+b+c+d列聯(lián)表(1)

2×2列聯(lián)表用于研究兩類變量之間是否相互獨(dú)立,它適用于分析兩類變量之間的關(guān)系,是對兩類變量進(jìn)行獨(dú)立性檢驗(yàn)的基礎(chǔ).

(2)

表中|ad-bc|越小,兩個(gè)變量之間的關(guān)系越弱;|ad-bc|越大,兩個(gè)變量之間的關(guān)系越強(qiáng).對2×2列聯(lián)表的理解(1)

2×2列聯(lián)表用于研究兩類變量之間是否相互獨(dú)立,它適1.為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測驗(yàn)得到了如下?lián)杭仔?3名學(xué)生中有10名數(shù)學(xué)成績優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績優(yōu)秀,試分析兩校學(xué)生中數(shù)學(xué)成績優(yōu)秀率之間是否存在差異.解:用

表示兩所學(xué)校的全體學(xué)生構(gòu)成的集合,考慮以為樣本空間的古典概型.對于2中每一名學(xué)生,定義分類變量X和Y如下:我們將所給數(shù)據(jù)整理成下表學(xué)校甲校(X=0)乙校(X=1)數(shù)學(xué)成績不優(yōu)秀(Y=0)優(yōu)秀(Y=1)33387110717合計(jì)合計(jì)4345881.為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的上表是關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:最后一行的前兩個(gè)數(shù)分別是事件(Y=0)和(Y-1)的頻數(shù);最后一列的前兩個(gè)數(shù)分別是事件(X一0)和(X=1)的頻數(shù);中間的四個(gè)格中的數(shù)是事件(X=x,Y=y)(x,y=0,1)的頻數(shù);右下角格中的數(shù)是樣本容量.因此,甲校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為:

乙校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為:

我們可以用等高堆積條形圖直觀地展示上述計(jì)算結(jié)果,如下圖所示.和和上表是關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:最后一行的在右圖中,左邊的藍(lán)色和紅色條的高度分別是甲校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率;右邊的藍(lán)色和紅色條的高度分別是乙校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率。通過比較發(fā)現(xiàn),兩個(gè)學(xué)校學(xué)生抽樣數(shù)據(jù)中數(shù)學(xué)成績優(yōu)秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率。

依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷

P(Y=1|X=0)>P(Y=1|X=1),也就是說,如果從甲校和乙校各隨機(jī)選取一名學(xué)生,那么甲校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率,因此,可以認(rèn)為兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績優(yōu)秀率比乙校學(xué)生的高.在右圖中,左邊的藍(lán)色和紅色條的高度分別是甲校學(xué)生中數(shù)學(xué)成績不事實(shí)上,“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩個(gè)頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個(gè)樣本中,兩個(gè)頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率實(shí)際上是沒有差別的。這就是說,樣本的隨機(jī)性導(dǎo)致了兩個(gè)頻率間出現(xiàn)較大差異,在這種情況下,我們推斷出的結(jié)論就是錯(cuò)誤的.后面我們將討論犯這種錯(cuò)誤的概率大小問題。你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯(cuò)誤的?事實(shí)上,“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩2.下面是一個(gè)2×2列聯(lián)表則表中a,b處的值分別為()A.94,96B.52,50C.52,54D.54,52C合計(jì)合計(jì)ab22125467327100單位:人2.下面是一個(gè)2×2列聯(lián)表則表中a,b處的值分別為()

(1)吸煙是否對每位煙民一定會(huì)引發(fā)健康問題?

(2)有人說吸煙不一定引起健康問題,因此可以吸煙.這種說法對嗎?3.根據(jù)有關(guān)規(guī)定,香煙盒上必須印上“吸煙有害健康”的警示語,那么(1)不一定答案:(2)不對

(1)吸煙是否對每位煙民一定會(huì)引發(fā)健康問題?

(2)有人(1)定義:利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).

(2)K2=

,

其中n=a+b+c+d為樣本容量.獨(dú)立性檢驗(yàn)(1)定義:利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方①根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤概率的上界α,然后查表確定___________

.②利用公式計(jì)算隨機(jī)變量

的___________

.

③如果

___________

,就推斷

“X

與Y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過α,否則就認(rèn)為在___________

___________

不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中支持結(jié)論“X與Y有關(guān)系”.臨界值觀測值犯錯(cuò)誤的概率沒有發(fā)現(xiàn)足夠證據(jù)0獨(dú)立性檢驗(yàn)的具體做法①根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤獨(dú)立性檢驗(yàn)的基本思想與反證法的思想的相似之處反證法獨(dú)立性檢驗(yàn)要證明結(jié)論A要確認(rèn)“兩個(gè)分類變量有關(guān)系”在A不成立的前提下進(jìn)行推理假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)在A不成立的前分類變量沒有關(guān)系”成立,在該假設(shè)下提下進(jìn)行推理計(jì)算

獨(dú)立性檢驗(yàn)的基本思想與反證法的思想的相似之處反證法獨(dú)立性檢驗(yàn)

獨(dú)立性檢驗(yàn);

根據(jù)觀測值分析事件是否獨(dú)立。獨(dú)立性檢驗(yàn)

獨(dú)立性檢驗(yàn);

根據(jù)觀測值分析事件是否獨(dú)立。獨(dú)立性檢驗(yàn)2.依據(jù)小概率值a=0.1的X2獨(dú)立性檢驗(yàn),分析例1中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率有差異?解:零假設(shè)為

Ho:分類變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異.根據(jù)表中的數(shù)據(jù),計(jì)算得到

根據(jù)小概率值a=0.1的X2獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷出H0不成立,因此可以認(rèn)為Ho成立,即認(rèn)為兩校的數(shù)學(xué)成績優(yōu)秀率沒有差異.

2.依據(jù)小概率值a=0.1的X2獨(dú)立性檢驗(yàn),分析例1中的抽樣3.某兒童醫(yī)院用甲、乙兩種療扶治療小兒消化不良,采用有故回簡單隨機(jī)抽樣的方法對治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值

=0.005的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療祛好.將所給數(shù)據(jù)進(jìn)行整理,得兩種療法治療數(shù)據(jù)的列聯(lián)表,如下表.解:零假設(shè)為Ho:療法與療效獨(dú)立,即兩種療祛效果沒有差異.3.某兒童醫(yī)院用甲、乙兩種療扶治療小兒消化不良,采用有故回簡療法療效合計(jì)甲乙合計(jì)未治愈治愈1552152631156769136根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到根據(jù)小概率值

=0.005的獨(dú)立性檢驗(yàn),沒有充分證推斷H,不成立,因此可以認(rèn)為Ho

成立,即認(rèn)為兩種療法效果沒有差異.單位:人療法療效合計(jì)甲乙合計(jì)未治愈治愈1552152631156764.為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計(jì)結(jié)果,如表8.3-6所示。依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn).單位:人吸煙非吸煙者吸煙者合計(jì)肺癌非肺癌患者肺癌患者777520999874424991合計(jì)781721489965解:零假設(shè)為Ho:吸煙與患肺之間無關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到4.為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機(jī)據(jù)小概率值

=0.001的獨(dú)立性檢驗(yàn),我們推斷H。不成立,即認(rèn)為吸煙與患肺關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001.根據(jù)表8.3-6中的數(shù)據(jù)計(jì)算,不吸煙者中不患肺癌和患肺癌的頻率分別為和吸煙者中不患肺癌和患肺癌的頻率分別為:和由可見,在破調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的4倍以上.于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論