生物統(tǒng)計(jì)學(xué)第五章 卡方檢驗(yàn)_第1頁
生物統(tǒng)計(jì)學(xué)第五章 卡方檢驗(yàn)_第2頁
生物統(tǒng)計(jì)學(xué)第五章 卡方檢驗(yàn)_第3頁
生物統(tǒng)計(jì)學(xué)第五章 卡方檢驗(yàn)_第4頁
生物統(tǒng)計(jì)學(xué)第五章 卡方檢驗(yàn)_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五章卡方檢驗(yàn)教學(xué)目的要求掌握:卡方檢驗(yàn)的適用條件和計(jì)算公式;適合性檢驗(yàn)的基本原理和方法;獨(dú)立性檢驗(yàn)的原理和方法。熟悉:適合性檢驗(yàn)和獨(dú)立性檢驗(yàn)的應(yīng)用。了解:適合性檢驗(yàn)在遺傳學(xué)及其他生物學(xué)科中上的應(yīng)用。講授內(nèi)容一、卡方檢驗(yàn)的原理和方法二、適合性檢驗(yàn)三、獨(dú)立性檢驗(yàn)一、卡方檢驗(yàn)的原理和方法1、卡方檢驗(yàn)的原理應(yīng)用理論值(expectedvalue,E)與觀測值(observedvalue,O)之間的偏離程度來決定卡方值的大小。2、卡方檢驗(yàn)的程序?qū)⒂^測值分為k組計(jì)算n次觀測值中每組的觀測頻數(shù),記為Oi根據(jù)變量的分布規(guī)律或概率運(yùn)算法則,計(jì)算每組的理論頻率為Pi計(jì)算每組的理論頻數(shù)Ei檢驗(yàn)Oi與Ei的差異顯著性,判斷兩者之間的不符合度a、零假設(shè):H0:O-E=0;備擇假設(shè):O-E≠0(這里檢驗(yàn)的不是參數(shù),而是判斷觀測數(shù)是否符合理論分布)b、檢驗(yàn)統(tǒng)計(jì)量:這里要求n充分的大,當(dāng)n≥50時(最好≥100),所定義的檢驗(yàn)統(tǒng)計(jì)量近似服從卡方分布,Ei=nPi不得小于5,若小于5,將尾區(qū)相鄰的組合并,直到合并后的組的Ei≥5,合并后再計(jì)算卡方值。c、建立拒絕域d、作出統(tǒng)計(jì)學(xué)結(jié)論用來檢驗(yàn)觀測數(shù)與依照某種假設(shè)或分布模型計(jì)算得到的理論數(shù)之間一致性的一種統(tǒng)計(jì)假設(shè)檢驗(yàn),以便判斷該假設(shè)或模型是否與實(shí)際觀測數(shù)相吻合。二、適合性檢驗(yàn)(goodnessoffit)(一)總體參數(shù)未知的正態(tài)性檢驗(yàn)155153159155150159157159151152159158153153144156150157160150150150160156160155160151157155159161156141156145156153158161157149153153155162154152162155161159161156162151152154157162158155153151157156153147158155148163156163154158152163158154164155156158164148164154157165158166154154157167157159170158例1高粱“三尺三”株高測定結(jié)果(cm)題解組號組限/cm組界/cm中值頻數(shù)頻率1141~143140.5~143.514210.012144~146143.5~146.514520.023147~149146.5~149.514840.044150~152149.5~152.5151130.135153~155152.5~155.5154230.236156~158155.5~158.5157280.287159~161158.5~161.5160150.158162~164161.5~164.5163100.109165~167164.5~167.516630.0310168~170167.5~170.516910.01——總計(jì)————1001高粱“三尺三”株高頻數(shù)分布表(1)將觀測值分為k組;按照分組原理分成10組,制成頻數(shù)分布表(2)獲得的n次觀測值中,第i組的觀測頻數(shù)記為Oi,(3)第i組的理論頻率為Pi,其計(jì)算方法如下:

①先計(jì)算樣本平均數(shù)和標(biāo)準(zhǔn)差②假設(shè)高粱“三尺三”符合正態(tài)分布。根據(jù)參數(shù)估計(jì)原理,

用估計(jì),用s/c4=4.98/0.9975=4.99估計(jì)(樣本標(biāo)準(zhǔn)差分布的矩系數(shù)C4、C5表)。即假設(shè)高粱的株高x服從正態(tài)分布

③根據(jù)正態(tài)分布概率的計(jì)算關(guān)系,查附表1,計(jì)算各組組界的理論頻率組號組界/cm觀察頻數(shù)(Oi)觀察頻率(Pi)理論頻率(P)理論頻數(shù)(Ei)1140.5~143.510.010.0050.52143.5~146.520.020.0222.23146.5~149.540.040.0666.64149.5~152.5130.130.14214.25152.5~155.5230.230.21621.66155.5~158.5280.280.23223.27158.5~161.5150.150.17617.68161.5~164.5100.100.0949.49164.5~167.530.030.0353.510167.5~170.510.010.0090.9————1001.001.00100高粱“三尺三”株高觀察頻數(shù)和理論頻數(shù)表

(4)計(jì)算各組的理論頻數(shù)為Ei=npi,填入下表組號組界/cm觀察頻數(shù)(Oi)觀察頻率(Pi)理論頻率(P)理論頻數(shù)(Ei)卡方值1~3140.5~149.570.070.0939.300.5694149.5~152.5130.130.14214.20.1015152.5~155.5230.230.21621.60.0916155.5~158.5280.280.23223.20.9937158.5~161.5150.150.17617.60.3848~10161.5~164.5140.140.13813.80.003總計(jì)——1001.001.001002.141(5)Oi與Ei進(jìn)行比較,判斷兩者之間的不符合度,檢驗(yàn)程序如下:①零假設(shè):H0:O-E=0;HA:O-E≠0②檢驗(yàn)統(tǒng)計(jì)量:高粱“三尺三”株高觀察頻數(shù)和理論頻數(shù)表(合并后)

卡方值的自由度df=k-1-a,其中k為合并后的組數(shù),a為需要由樣估計(jì)的總體參數(shù)的個數(shù);合并后的組數(shù)k=6,由樣本估計(jì)了總體的平均數(shù)和標(biāo)準(zhǔn)差,故a=2,df=3,不用校正,計(jì)算卡方值③建立拒絕域④結(jié)論:高粱株高服從正態(tài)分布(二)總體參數(shù)已知的正態(tài)性檢驗(yàn)例2自動包裝的袋裝食鹽的重量是否服從正態(tài)分布?已知每袋標(biāo)準(zhǔn)重量為500g,調(diào)查了100袋,結(jié)果如下表所示。袋裝食鹽重量調(diào)查表500512515542522514488497475487497500518508530508500479506504493491506487486491505478492512498494482482512527522470493548502496494494488505472482506478494518503503503485529476496500499484517517506500503527500499490496491491490520512482488509488518516516530508492486492536494500511511506493522524492478題解

(1)零假設(shè):H0:O-E=0;備擇假設(shè)HA:O-E≠0(2)分組:樣本容量n=100,取組數(shù)m=10,組距為8g(3)計(jì)算理論頻率pi和理論頻數(shù)Ei(4)檢驗(yàn)統(tǒng)計(jì)量的計(jì)算(5)自由度df=k-1-a=8-1-1=6(6)拒絕域的建立(7)接受H0,服從正態(tài)分布(三)總體參數(shù)未知的二項(xiàng)分布檢驗(yàn)例3檢驗(yàn)煙草種子的發(fā)芽率,每個培養(yǎng)皿放10粒種子,共100個培養(yǎng)皿,實(shí)驗(yàn)結(jié)果如下表所示。1000粒種子有590粒發(fā)芽,檢驗(yàn)發(fā)芽的種子數(shù)是否符合二項(xiàng)分布。每皿發(fā)芽種子數(shù)Xi觀察頻數(shù)(Oi)001020344145226277198995100總計(jì)100煙草種子發(fā)芽率的觀察頻數(shù)每皿發(fā)芽種子數(shù)Xi觀察頻數(shù)(Oi)OiXi理論頻率(P)理論頻數(shù)(Ei)卡方值0000.00016.250.811000.00192000.012534120.0480414560.120912.090.3025221100.208720.870.0616271620.250325.030.1557191330.205820.580.12189720.111115.710.0995450.035510000.0051總計(jì)10059011001.539煙草種子發(fā)芽率的觀察頻數(shù)和理論頻數(shù)表題解1、提出假設(shè)H0:O-E=0;HA:O-E≠02、總體參數(shù)未知,需要由樣本比例估計(jì)P=590/1000=0.593、計(jì)算理論值和卡方值,理論頻率Pi按照二項(xiàng)分布公式計(jì)算——n=10,0≤k≤10,理論數(shù)Ei=NPi4、拒絕域的建立5、結(jié)論:種子發(fā)芽率服從二項(xiàng)分布(四)總體參數(shù)已知的二項(xiàng)分布檢驗(yàn)例4水稻植株中對白葉枯病有抗性的純合體的基因型為SS,對白葉枯病敏感的純合體為ss,雜合體的基因型為Ss。其中抗性為顯性性狀,敏感為隱性性狀,將Ss與ss進(jìn)行雜交,20個后代中有14株抗性植株,6株敏感植株。問后代的分離比是否符合孟德爾分離定律?表型觀察頻數(shù)(Oi)理論頻數(shù)(Ei)卡方值抗性植株14101.225敏感植株6101.225總計(jì)20202.45題解按照孟德爾分離定律,Ss與ss的雜交后代代表型的比例應(yīng)該為1:1,即10個抗性植株和10個敏感植株(1)提出假設(shè)

H0:O-E=0;HA:O-E≠0(2)計(jì)算理論值和卡方值:理論值就是根據(jù)孟德爾遺傳定律計(jì)算得到的后代分離理論數(shù)量(3)檢驗(yàn)統(tǒng)計(jì)量的計(jì)算:本例是兩組數(shù)據(jù),沒有估計(jì)參數(shù),k=2,a=0,df=1,樣本統(tǒng)計(jì)量需要連續(xù)矯正(4)拒絕域的建立(5)結(jié)論:符合孟德爾分離定律適合性檢驗(yàn)的自動程序:P=Chitest(Oi,Ei):Oi表示觀察值區(qū)域;Ei表示理論值區(qū)域;用于適合性檢驗(yàn)三、獨(dú)立性檢驗(yàn)原理:通過觀測數(shù)與理論數(shù)之間的一致性判斷事件之間的獨(dú)立性,即判斷兩個事件是否是獨(dú)立事件或處理間差異是否顯著。方法:將數(shù)據(jù)列成列聯(lián)表,也稱列聯(lián)表卡方檢驗(yàn)。一、2×2列聯(lián)表卡方檢驗(yàn)(一)原理:例5青霉素可以注射,也可以口服,每天給感冒患者口服或注射80萬單位的青霉素,調(diào)查兩種給藥方式的藥效,結(jié)果如下表所示,試分析青霉素的兩種給藥方式的藥用效果是否有差異?兩種青霉素的給藥方式的藥用效果調(diào)查表給藥方式有效(A)無效(?。┛倲?shù)有效率口服(B)58409859.20%注射()64319567.40%總計(jì)12271193——一般考慮樣本中各處理之間是否有關(guān)聯(lián),處理間是否是獨(dú)立事件檢驗(yàn)時以各處理間無關(guān)聯(lián)或者各處理是獨(dú)立事件作為零假設(shè)在一定自由度下和顯著水平下進(jìn)行卡方檢驗(yàn)獨(dú)立檢驗(yàn)(independencetest)(二)檢驗(yàn)程序1、提出假設(shè)H0:O-E=0;HA:O-E≠02、根據(jù)概率的乘法法則計(jì)算理論數(shù):理論數(shù)的計(jì)算方法——給藥方式有效(A)無效(?。┛倲?shù)口服(B)O1=58E1=98×122/193=61.95O2=40E2=98×71/193=36.0598注射()O3=64E1=95×122/193=60.05O4=31E1=95×71/193=34.9595總計(jì)12271193兩種青霉素的給藥方式的藥用效果調(diào)查的觀測值和理論值3、檢驗(yàn)統(tǒng)計(jì)量:4、確定自由度:2×2列聯(lián)表的自由度df=(r-1)(c-1),r是列聯(lián)表的行數(shù),c是列聯(lián)表的列數(shù),若自由度=1,則應(yīng)做連續(xù)性校正,校正后的統(tǒng)計(jì)量為:5、拒絕域的建立:6、結(jié)論青霉素口服效果與注射效果差異不大。注意:2×2列聯(lián)表卡方檢驗(yàn)與之前講的吻合度檢驗(yàn)一樣,要求理論數(shù)不得小于5;當(dāng)理論數(shù)小于5時,應(yīng)使用2×2列聯(lián)表精確檢驗(yàn)法。二、r×c列聯(lián)表行數(shù)和列數(shù)都大于2時的情況稱為r×c列聯(lián)表,其理論數(shù)的計(jì)算仍為例6植物轉(zhuǎn)基因方法常用的有三種:基因槍介導(dǎo)轉(zhuǎn)化法、農(nóng)桿菌介導(dǎo)轉(zhuǎn)化法和花粉管通道法,三種方法轉(zhuǎn)化煙草的成功率(種子數(shù))如表所示,問三種轉(zhuǎn)基因方法的轉(zhuǎn)基因成功率差異是否顯著?轉(zhuǎn)基因方式陽性種子假陽性種子總數(shù)基因槍法19233783570農(nóng)桿菌法31932973616花粉管法19436203814總數(shù)7051029511000三種方法轉(zhuǎn)化煙草的實(shí)驗(yàn)結(jié)果題解1、提出假設(shè)H0:O-E=0;HA:O-E≠02、根據(jù)概率的乘法法則計(jì)算理論數(shù):理論數(shù)轉(zhuǎn)基因方式陽性種子假陽性種子總數(shù)基因槍法O1=192E1=228.8O2=3378E2=3341.23570農(nóng)桿菌法O3=319E3=231.8O4=3297E4=3384.23616花粉管法O5=194E5=244.4O6=3620E6=3569.63814總數(shù)7051029511000三種方法轉(zhuǎn)化煙草的實(shí)驗(yàn)結(jié)果的理論數(shù)3、檢驗(yàn)統(tǒng)計(jì)量:4、確定自由度:列聯(lián)表的自由度df=(r-1)(c-1),r是列聯(lián)表的行數(shù),c是列聯(lián)表的列數(shù),df=(3-1)(2-1)=2,不用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論