版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、8.3列聯(lián)表與獨立性檢驗8.3.2 獨立性檢驗我們將下表這種形式的數據統(tǒng)計表稱為22列聯(lián)表(contingency table).復習回顧22列聯(lián)表給出了成對分類變量數據的交叉分類頻數,以下表為例,它包含了X和Y的如下信息:最后一行的前兩個數分別是事件Y=0和Y=1中樣本點的個數;最后一列的前兩個數分別是事件X=0和X=1中樣本點的個數;中間的四個格中的數是表格的核心部分,給出了事件X=x,Y=y(x,y=0,1)中樣本點的個數;右下角格中的數是樣本空間中樣本點的總數。n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX復習回顧兩個分類變量之間關聯(lián)關系的定性分
2、析的方法:(2)圖形分析法:與表格相比,圖形更能直觀地反映出兩個分類變量間是否互相影響,常用等高堆積條形圖展示列聯(lián)表數據的頻率特征.將列聯(lián)表中的數據用高度相同的兩個條形圖表示出來,其中兩列的數據分別對應不同的顏色,這就是等高堆積條形圖. “兩校學生的數學成績優(yōu)秀率存在差異”這個結論是根據兩個頻率間存在差異推斷出來的.有可能出現這種情況:在隨機抽取的這個樣本中,兩個頻率間確實存在差異,但兩校學生的數學成績優(yōu)秀率實際上是沒有差別的.對于隨機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法
3、,同時也希望能對出現錯誤推斷的概率有一定的控制或估算.X=0與Y=0獨立;X=0與Y=1獨立;X=1與Y=0獨立;X=1與Y=1獨立。學習新知以上性質成立,我們就稱分類變量X和Y獨立,這相當于下面四個等式成立;P(X=0,Y=0)=P(X=0)P(Y=0); P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0); P(X=1,Y=1)=P(X=1)P(Y=1).我們可以用概率語言,將零假設改述為H0:分類變量X和Y獨立.假定我們通過簡單隨機抽樣得到了X和Y的抽樣數據列聯(lián)表,如下表所示。n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y
4、=1Y=0合計YX對于隨機樣本,表中的頻數a,b,c,d 都是隨機變量,而表中的相應數據是這些隨機變量的一次觀測結果。表是關于分類變量X和Y的抽樣數據的22列聯(lián)表:最后一行的前兩個數分別是事件Y=0和Y=1的頻數;最后一列的前兩個數分別是事件X=0和X=1的頻數;中間的四個數a,b,c,d是事件X=x,Y=y(x, y=0,1)的頻數;右下角格中的數n是樣本容量。思考:如何基于中的四個等式及列聯(lián)表中的數據,構造適當的統(tǒng)計量,對成對分類變量X和Y是否相互獨立作出推斷?P(X=0,Y=0)=P(X=0)P(Y=0); P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1
5、)P(Y=0); P(X=1,Y=1)=P(X=1)P(Y=1).n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX綜合中的四個式子,如果零假設H0成立,下面四個量的取值都不應該太大:反之,當這些量的取值較大時,就可以推斷H0不成立。 分別考慮中的四個差的絕對值很困難,我們需要找到一個既合理又能夠計算分布的統(tǒng)計量,來推斷H0是否成立.一般來說,若頻數的期望值較大,則中相應的差的絕對值也會較大;而若頻數的期望值較小,則中相應的差的絕對值也會較小.為了合理地平衡這種影響,我們將四個差的絕對值取平方后分別除以相應的期望值再求和,得到如下的統(tǒng)計量:該表達式可化簡為獨
6、立性檢驗公式及定義:提出零假設(原假設)H0:分類變量X和Y獨立 2 =為了使不同樣本容量的數據有統(tǒng)一的評判標準,基于上述分析,我們構造一個隨機變量學習新知2獨立性檢驗中幾個常用的小概率值和相應的臨界值.10.8287.8796.6353.8412.706x0.0010.0050.010.050.1n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX臨界值的定義: 對于任何小概率值,可以找到相應的正實數x,使得P(2x)=成立,我們稱x為的臨界值,這個臨界值可作為判斷2大小的標準,概率值越小,臨界值x越大.2獨立性檢驗中幾個常用的小概率值和相應的臨界值.基于小
7、概率值的檢驗規(guī)則:當2x時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過;當2x時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.10.8287.8796.6353.8412.706x0.0010.0050.010.050.1 用2取值的大小作為判斷零假設H0是否成立的依據,當它比較大時推斷H0不成立,否則認為H0成立。這種利用2的取值推斷分類變量X和Y是否獨立的方法稱為2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.例1:為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生.通過測驗得到了如下數據:甲校43名學生中有10名數學成績優(yōu)秀;乙
8、校45名學生中有7名數學成績優(yōu)秀.試分析兩校學生中數學成績優(yōu)秀率之間是否存在差異.解:零假設為H0:分類變量X與Y相互獨立,即兩校學生的數學成績優(yōu)秀率無差異.學校數學成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計711788因為思考例1和例2都是基于同一組數據的分析,但卻得出了不同的結論,你能說明其中的原因嗎?當我們接受零假設H0時,也可能犯錯誤。我們不知道犯這類錯誤的概率p的大小,但是知道,若越大,則p越小解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治療數據的列聯(lián)表,療法療效合計未治愈治愈甲15526
9、7乙66369合計21115136不影響療法療效合計未治愈治愈甲155267乙66369合計21115136療法療效合計未治愈治愈乙66369甲155267合計21115136療法療效合計治愈未治愈甲521567乙63669合計11521136解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治療數據的列聯(lián)表,療法療效合計未治愈治愈甲155267乙66369合計21115136解: 因此可以推斷乙種療法的效果比甲種療法好。例4:為了調查吸煙是否對肺癌有影響,某腫瘤研究所采取有放回簡單隨機抽樣,調查了9965人,得到如下結果(單位:人)依據小概率值=0.0
10、01的獨立性檢驗,分析吸煙是否會增加患肺癌的風險。解:零假設為H0:吸煙和患肺癌之間沒有關系根據列聯(lián)表中的數據,經計算的2 =根據小概率值=0.001的獨立性檢驗,推斷H0不成立,即認為吸 煙與患肺癌有關聯(lián),此推斷犯錯誤的概率不大于0.001,即我們有99.9的把握認為“吸煙與患肺癌有關系”.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965根據表中的數據計算不吸煙者中不患肺癌和患肺癌的頻率分別為吸煙者中不患肺癌和患肺癌的評率分別為由 可見,在被調查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌頻率的4倍以上。于是,根據頻率穩(wěn)定于概率的原理,
11、我們可以認為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌概率,即吸煙更容易引發(fā)肺癌。方法總結應用獨立性檢驗解決實際問題大致應包括以下幾個主要環(huán)節(jié):注意:上述幾個環(huán)節(jié)的內容可以根據不同情況進行調整,例如,在有些時候,分類變量的抽樣數據列聯(lián)表是問題中給定的.P(2x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828P(x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722
12、.7063.8415.0246.6357.87910.8280.1%把握認為A與B無關1%把握認為A與B無關99.9%把握認為A與B有關99%把握認為A與B有關90%把握認為A與B有關10%把握認為A與B無關沒有充分的依據顯示A與B有關,但也不能顯示A與B無關例如學習新知 在500人身上試驗某種血清預防感冒作用,把他們一年中的感冒記錄與另外500名未用血清的人的感冒記錄作比較,結果如表所示。問:該種血清能否起到預防感冒的作用?未感冒感冒合計使用血清258242500未使用血清216284500合計4745261000解:設H0:感冒與是否使用該血清沒有關系。因當H0成立時, 26.635的概率
13、約為0.01,故有99%的把握認為該血清能起到預防感冒的作用。P(x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828典型例題P(x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828有效無效合計口服584098注射643195合計12271193解:設H0:藥的效果與給藥方式沒有關系。2.072 為研究
14、不同的給藥方式(口服與注射)和藥的效果(有效與無效)是否有關,進行了相應的抽樣調查,調查的結果列在表中,根據所選擇的193個病人的數據,能否作出藥的效果和給藥方式有關的結論?典型例題P(x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 氣管炎是一種常見的呼吸道疾病,醫(yī)藥研究人員對兩種中草藥治療慢性氣管炎的療效進行對比,所得數據如表所示,問:它們的療效有無差異?有效無效合計復方江剪刀草18461245膽黃片919100合計27570345解:設H
15、0:兩種中草藥的治療效果沒有差異。典型例題 某校對學生的課外活動進行調查,結果整理成下表:體育文娛總計男生212344女生62935總計275279試用你所學過的知識分析:能否在犯錯誤的概率不超過0.005的前提下,認為“喜歡體育還是文娛與性別有關系”?鞏固練習a21,b23,c6,d29,n79,即我們得到的K2的觀測值k8.106超過7.879這就意味著:“喜歡體育還是文娛與性別沒有關系”這一結論成立的可能性小于0.005,即在犯錯誤的概率不超過0.005的前提下認為“喜歡體育還是喜歡文娛與性別有關”P(x0)0.500.400.250.150.100.050.0250.0100.0050
16、.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828鞏固練習 某縣城區(qū)常見在合法的廣告牌上又貼有違法的黑廣告,城管對此進行了清理,并下了通告一周后,城管對某街道進行了檢查作了如下統(tǒng)計:貼有黑廣告未貼有黑廣告總計通告前39157196通告后29167196總計68324392請你判斷,城管下通告對減少黑廣告數是否有效?鞏固練習鞏固練習C先假設兩個分類變量X與Y無關系,利用上述公式根據觀測數據求出K2的觀測值k,再得出X與Y有關系的程度(1)如果k10.828,就有_的把握認為“X與Y有關系” (2)如果k7.879,就有_的把握認為“X與Y有關系”;99.9%99.5%(3)如果k_,就有99%的把握認為“X與Y有關系” (4)如果k5.024,就有97.5%的把握認為“X與Y有關系” (5)如果k3.841,就有_的把握認為“X與Y有關系” (6)如果k2.706,就有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球七葉神安片行業(yè)調研及趨勢分析報告
- 2025-2030全球醫(yī)療器械消毒產品行業(yè)調研及趨勢分析報告
- 2025年全球及中國缺氧帳篷行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025年全球及中國有機空穴傳輸材料行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025-2030全球連續(xù)式鋰電池熱解爐行業(yè)調研及趨勢分析報告
- 競業(yè)限制合同協(xié)議書
- 家具房屋租賃合同書
- 2025危險廢物委托處置合同
- 房地產借款合同
- 提高談判技巧的訓練課程
- 國有資產管理法律責任與風險防控
- 未婚生子的分手協(xié)議書
- 變更監(jiān)事章程修正案范例
- 北京小客車指標租賃協(xié)議五篇
- 輸液室運用PDCA降低靜脈輸液患者外滲的發(fā)生率品管圈(QCC)活動成果
- YY/T 0681.2-2010無菌醫(yī)療器械包裝試驗方法第2部分:軟性屏障材料的密封強度
- GB/T 20472-2006硫鋁酸鹽水泥
- 煙氣管道阻力計算
- 城鄉(xiāng)環(huán)衛(wèi)一體化保潔服務迎接重大節(jié)日、活動的保障措施
- 醫(yī)院-9S管理共88張課件
- 高考作文復習:議論文論證方法課件15張
評論
0/150
提交評論