獨(dú)立性檢驗(yàn)49768ppt課件_第1頁
獨(dú)立性檢驗(yàn)49768ppt課件_第2頁
獨(dú)立性檢驗(yàn)49768ppt課件_第3頁
獨(dú)立性檢驗(yàn)49768ppt課件_第4頁
獨(dú)立性檢驗(yàn)49768ppt課件_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

,32獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用,學(xué)習(xí)導(dǎo)航,定量變量的取值一定是實(shí)數(shù),它們的取值大小有特定的含義,不同取值之間的運(yùn)算也有特定的含義.,如身高、體重、考試成績(jī)、溫度等等.,變量,定量變量,分類變量,例如身高、體重、考試成績(jī)等,張明的身高是180cm,李立的身高是175cm,說明張明比李立高180-175=5(cm).,兩個(gè)定量變量的相關(guān)關(guān)系分析:回歸分析(畫散點(diǎn)圖、相關(guān)系數(shù)r、相關(guān)指數(shù)R2、殘差分析),對(duì)于性別變量,其取值為男和女兩種,這種變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.,在日常生活中,主要考慮分類變量之間是否有關(guān)系:,如:是否吸煙、宗教信仰、是否患肺癌、國籍等等.,例如,吸煙是否與患肺癌有關(guān)系?性別是否對(duì)于喜歡數(shù)學(xué)課程有影響?等等.,分類變量也稱為屬性變量或定性變量,它們的取值一定是離散的,而且不同的取值僅表示個(gè)體所屬的類別,如性別變量,只取男、女兩個(gè)值,商品的等級(jí)變量只取一級(jí)、二級(jí)、三級(jí)等等.,有時(shí)也可以把分類變量的不同取值用數(shù)字來表示,但這時(shí)的數(shù)字除了分類以外沒有其他的含義,,例如:用0表示“男”,1表示“女”,性別變量就變成取值為0和1的隨機(jī)變量,但是這些數(shù)字沒有其他的含義.,此時(shí)比較性別變量的兩個(gè)不同值之間的大小沒有意義,性別變量的均值和方差也沒有意義.,兩個(gè)分類變量的相關(guān)關(guān)系的分析:通過圖形直觀判斷兩個(gè)分類變量是否相關(guān);獨(dú)立性檢驗(yàn).,1、列出兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表,利用頻數(shù)分析分類變量的關(guān)系一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為:,等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征,由列聯(lián)表可以粗略估計(jì)出,在不吸煙者中,有0.54%患有肺癌;在吸煙者中,有2.28%患有肺癌。因此,直觀上可以得到結(jié)論:吸煙者和不吸煙者患肺癌的可能性存在差異.,與表格相比,三維柱形圖和二維條形圖能更直觀地反映出相關(guān)數(shù)據(jù)的總體狀況.,為調(diào)查吸煙是否對(duì)患肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人):,吸煙與患肺癌列聯(lián)表(列出兩個(gè)分類變量的頻數(shù)表):,1、列聯(lián)表,2、三維柱形圖,3、二維條形圖,從三維柱形圖能清晰看出各個(gè)頻數(shù)的相對(duì)大小.,從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例.,4、等高條形圖,等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例.,吸煙與患肺癌的列聯(lián)表:,如果“吸煙與患肺癌沒有關(guān)系”,則在吸煙者中不患肺癌的比例應(yīng)該與不吸煙者中相應(yīng)的比例應(yīng)差不多,即,|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強(qiáng).,以A表示不吸煙,B表示不患肺癌,則a表示事件AB發(fā)生的頻數(shù);a+b和a+c恰好分別為事件A和B發(fā)生的頻數(shù).,等高條形圖,著重關(guān)注同色塊在各自矩形中所占的比例。若同色塊所占比例大體一致,則兩個(gè)分類變量幾乎沒有關(guān)系;若同色塊所占比例相差較大,則兩個(gè)分類變量的關(guān)系較強(qiáng)。,做一做班級(jí)與成績(jī)22列聯(lián)表:表示數(shù)據(jù)m,n,p,q的值應(yīng)分別為()A70,73,45,188B17,73,45,90C73,17,45,90D17,73,45,45答案:B,為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量,若H0成立,即“吸煙與患肺癌沒有關(guān)系”,則K2應(yīng)很小.,由列聯(lián)表中數(shù)據(jù),利用公式(1)計(jì)算得K2的觀測(cè)值為:,(1),其中n=a+b+c+d為樣本容量.,在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率:,也就是說,在H0成立的情況下,對(duì)隨機(jī)變量K2進(jìn)行多次觀測(cè),觀測(cè)值超過6.635的頻率約為0.01,是一個(gè)小概率事件.現(xiàn)在K2的觀測(cè)值,遠(yuǎn)遠(yuǎn)大于6.635,所以有理由斷定H0不成立,即認(rèn)為“吸煙與患肺癌有關(guān)系”,但這種判斷會(huì)犯錯(cuò)誤,犯錯(cuò)誤的概率不會(huì)超過0.01,即我們有99的把握認(rèn)為“吸煙與患肺癌有關(guān)系”.,如果,就判斷H0不成立;否則就判斷H0成立.,但這種判斷會(huì)犯錯(cuò)誤,犯錯(cuò)誤的概率不會(huì)超過0.01,即我們有99的把握認(rèn)為“H0不成立”.,其基本的思想類似反證法,(1)假設(shè)結(jié)論不成立,即“兩個(gè)分類變量沒有關(guān)系”.(2)在此假設(shè)下隨機(jī)變量K2應(yīng)該很能小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到K2的觀測(cè)值k很大,則在一定程度上說明假設(shè)不合理.(3)根據(jù)隨機(jī)變量K2的含義,可以通過評(píng)價(jià)該假設(shè)不合理的程度,由實(shí)際計(jì)算出的,說明假設(shè)合理的程度為99.9%,即“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信度為約為99.9%.,獨(dú)立性檢驗(yàn):,利用隨機(jī)變量K2來確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).,隨機(jī)變量-卡方統(tǒng)計(jì)量,獨(dú)立性檢驗(yàn),臨界值表,0.1%把握認(rèn)為A與B無關(guān),1%把握認(rèn)為A與B無關(guān),99.9%把握認(rèn)A與B有關(guān),99%把握認(rèn)為A與B有關(guān),90%把握認(rèn)為A與B有關(guān),10%把握認(rèn)為A與B無關(guān),沒有充分的依據(jù)顯示A與B有關(guān),但也不能顯示A與B無關(guān),第一步:H0:吸煙和患病之間沒有關(guān)系,第二步:列出22列聯(lián)表,獨(dú)立性檢驗(yàn)的步驟,第三步:計(jì)算,第四步:查對(duì)臨界值表,作出判斷。,獨(dú)立性檢驗(yàn),abcd,想一想由獨(dú)立性檢驗(yàn)可知,在犯錯(cuò)誤的概率不超過0.10的前提下認(rèn)為吸煙與患?xì)夤苎子嘘P(guān)系時(shí),我們說某人吸煙,那么他有90%的可能患有氣管炎,此說法正確嗎?提示:不正確應(yīng)認(rèn)為有90%的把握認(rèn)為吸煙與患?xì)夤苎子嘘P(guān),題型一兩分類變量關(guān)系的直觀分析,為了解鉛中毒病人與尿棕色素為陽性是否有關(guān)系,分別對(duì)病人組和對(duì)照組的尿液作尿棕色素定性檢查,結(jié)果如下:,【解】等高條形圖如圖所示:其中兩個(gè)淺色條的高分別代表鉛中毒病人和對(duì)照組樣本中尿棕色素為陽性的頻率由圖可以直觀地看出鉛中毒病人與對(duì)照組相比較尿棕色素為陽性差異明顯,因此鉛中毒病人與尿棕色素為陽性存在關(guān)聯(lián)關(guān)系,【名師點(diǎn)評(píng)】在判斷兩個(gè)變量是否有關(guān)系時(shí),通過作出等高條形圖,能直觀地反映數(shù)據(jù)的情況,從中清晰地看出各個(gè)頻數(shù)的相對(duì)大小,粗略判斷兩個(gè)分類變量是否有關(guān)系要注意的是這種判斷不能精確地給出其犯錯(cuò)誤的概率,跟蹤訓(xùn)練1在一次惡劣氣候的飛行航程中,調(diào)查男女乘客在機(jī)上暈機(jī)的情況如下表所示畫出等高條形圖,判斷在惡劣氣候飛行中男性比女性是否更容易暈機(jī)?,解:由數(shù)據(jù)的列聯(lián)表可以得到等高條形圖為:從上圖中可以發(fā)現(xiàn)男性中暈機(jī)的人的頻率與女性中暈機(jī)的人的頻率相差較大,故我們認(rèn)為性別和是否暈機(jī)是有關(guān)系的,且在惡劣氣候飛行中男性比女性更容易暈機(jī),根據(jù)列聯(lián)表中的數(shù)據(jù),得到:,所以有99%的把握認(rèn)為“禿頂患心臟病有關(guān)”.,在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有214人禿頂;而另外772名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?,解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:,題型二獨(dú)立性檢驗(yàn),為了探究學(xué)生選報(bào)文、理科是否與對(duì)外語的興趣有關(guān),某同學(xué)調(diào)查了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科對(duì)外語有興趣的有138人,無興趣的有98人,文科對(duì)外語有興趣的有73人,無興趣的有52人試分析學(xué)生選報(bào)文、理科與對(duì)外語的興趣是否有關(guān)?【解】列出22列聯(lián)表,題型二獨(dú)立性檢驗(yàn),【名師點(diǎn)評(píng)】運(yùn)用獨(dú)立檢驗(yàn)的方法:(1)列出22列聯(lián)表,根據(jù)公式計(jì)算K2的觀測(cè)值k.(2)比較k與k0的大小作出結(jié)論特別注意本題類型的無關(guān)問題,跟蹤訓(xùn)練2研究人員選取170名青年男女大學(xué)生作為樣本,對(duì)他們進(jìn)行一種心理測(cè)驗(yàn),發(fā)現(xiàn)60名女生對(duì)該心理測(cè)驗(yàn)中的最后一個(gè)題目的反應(yīng)是:作肯定的有22名,作否定的有38名;男生110名在相同的題目上作肯定的有22名,作否定的有88名,問:性別與態(tài)度之間是否存在某種關(guān)系?試用獨(dú)立性檢驗(yàn)的方法判斷解:根據(jù)題意,得如下22列聯(lián)表:,1K2的計(jì)算公式中字母取值勿取錯(cuò);在22列聯(lián)表中,a,b,c,d是有順序的,因此在計(jì)算K2的值時(shí)容易取錯(cuò)字母a,b,c,d的值2只有當(dāng)K2的值大于或等于k0時(shí),我們才說兩個(gè)變量“有關(guān)系”;否則就說“沒有充分的證據(jù)顯示兩個(gè)變量有關(guān)系”,即認(rèn)為兩個(gè)變量無關(guān)系,獨(dú)立性檢驗(yàn)中的易誤點(diǎn)對(duì)196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示:試根據(jù)上述數(shù)據(jù),比較這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有沒有差別,易錯(cuò)警示,【常見錯(cuò)誤】在獨(dú)立性檢驗(yàn)中當(dāng)K22.706時(shí),得出結(jié)論:“我們判定又發(fā)作過心臟病和他是否做過這兩種手術(shù)無關(guān)”,這里的錯(cuò)誤主要是結(jié)論下的太過武斷,【防范措施】在利用22列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn)時(shí),如果K22.706,并不是表示兩個(gè)分類變量沒有關(guān)系,只是沒有充分證據(jù)表明它們有關(guān)系而已,所以在解題中不要濫用,跟蹤訓(xùn)練3在吸煙與患肺病這兩個(gè)分類變量的計(jì)算中,下列說法中:若統(tǒng)計(jì)量K26.635,我們有99%的把握說吸煙與患肺病有關(guān),則某人吸煙,那么他有99%的可能患有肺病;若從統(tǒng)計(jì)中求出,有99%的把握說吸煙與患肺病有關(guān),則在100個(gè)吸煙者中必有99個(gè)人患有肺病;若從統(tǒng)計(jì)中求出有95%的把握說吸煙與患肺病有關(guān),是指有5%的可能性使得推斷錯(cuò)誤正確的個(gè)數(shù)為(),A0B1C2D3解析:選B.統(tǒng)計(jì)量K2僅僅說明一個(gè)統(tǒng)計(jì)推斷,并不能說明個(gè)案或某些情況從而正確,故選B.,一、選擇題1調(diào)查男女學(xué)生購買食品時(shí)是否看出廠日期與性別有無關(guān)系時(shí),最有說服力的是()A期望B方差C正態(tài)分布D獨(dú)立性檢驗(yàn)答案D,210名學(xué)生在一次數(shù)學(xué)考試中的成績(jī)?nèi)缦卤恚阂芯窟@10名學(xué)生成績(jī)的平均情況,則最能說明問題的是()A概率B期望C方差D獨(dú)立性檢驗(yàn)答案B,3下面是一個(gè)22列聯(lián)表則表中a、b處的值分別為()A94、96B52、50C52、59D54、52答案C,二、填空題4用K2統(tǒng)計(jì)量進(jìn)行獨(dú)立性檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論