版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第七章次數(shù)資料分析
——
2檢驗
在生物試驗中常常有一類資料難以用數(shù)量水平表示,例如前面介紹的分類資料,如:動物的公母,毛色的黑、白、花,臨床上的陰性和陽性,這類資料不好測量,只能統(tǒng)計各種類別出現(xiàn)的次數(shù),故又稱做次數(shù)資料。這種資料的處理主要應(yīng)用
2檢驗,當(dāng)然如將其轉(zhuǎn)化為相對數(shù),則可用t檢驗或u檢驗進(jìn)行分析。
第一節(jié)
2統(tǒng)計量與
2分布一、
2統(tǒng)計量的意義
為了便于理解,現(xiàn)結(jié)合一實例說明
2(讀作卡方)統(tǒng)計量的意義。根據(jù)遺傳學(xué)理論,動物的性別比例是1:1。統(tǒng)計某羊場一年所產(chǎn)的876只羔羊中,有公羔428只,母羔448只。按1:1的性別比例計算,公、母羔均應(yīng)為438只。以A表示實際觀察次數(shù),T表示理論次數(shù),可將上述情況列成表7-1。表7-1羔羊性別實際觀察次數(shù)與理論次數(shù)性別實際觀測次數(shù)A理論次數(shù)TA-T(A-T)2/T公428(A1)438(T1)-100.2283母448(A2)438(T2)100.2283合計87687600.4566從表7-1看到,實際觀察次數(shù)與理論次數(shù)存在一定的差異,這里公、母各相差10只。這個差異是屬于抽樣誤差(把對該羊場一年所生羔羊的性別統(tǒng)計當(dāng)作是一次抽樣調(diào)查)、還是羔羊性別比例發(fā)生了實質(zhì)性的變化?
要回答這個問題,首先需要確定一個統(tǒng)計量用以表示實際觀察次數(shù)與理論次數(shù)偏離的程度;然后判斷這一偏離程度是否屬于抽樣誤差,即進(jìn)行顯著性檢驗。
為了度量實際觀察次數(shù)與理論次數(shù)偏離的程度,最簡單的辦法是求出實際觀察次數(shù)與理論次數(shù)的差數(shù)。從表7-1看出:A1-T1=-10,A2-T2=10,由于這兩個差數(shù)之和為0,顯然不能用這兩個差數(shù)之和來表示實際觀察次數(shù)與理論次數(shù)的偏離程度。為了避免正、負(fù)抵消,可將兩個差數(shù)A1-T1、A2-T2
平方后再相加,即計算∑(A-T)2,其值越大,實際觀察次數(shù)與理論次數(shù)相差亦越大,反之則越小。但利用∑(A-T)2表示實際觀察次數(shù)與理論次數(shù)的偏離程度尚有不足。例如某一組實際觀察次數(shù)為505、理論次數(shù)為500,相差5;而另一組實際觀察次數(shù)為26、理論次數(shù)為21,相差亦為5。顯然這兩組實際觀察次數(shù)與理論次數(shù)的偏離程度是不同的。因為前者是相對于理論次數(shù)500相差5,后者是相對于理論次數(shù)21相差5。為了彌補這一不足,可先將各差數(shù)平方除以相應(yīng)的理論次數(shù)后再相加,并記之為
2,即
也就是說
2是度量實際觀察次數(shù)與理論次數(shù)偏離程度的一個統(tǒng)計量,
2越小,表明實際觀察次數(shù)與理論次數(shù)越接近;
2=0,表示兩者完全吻合;
2越大,表示兩者相差越大。對于表7-1的資料,可計算得表明實際觀察次數(shù)與理論次數(shù)是比較接近的。二、
2分布上面在屬于離散型隨機變量的次數(shù)資料的基礎(chǔ)上引入了統(tǒng)計量
2,它近似地服從統(tǒng)計學(xué)中一種連續(xù)型隨機變量的概率分布
2分布。下面對統(tǒng)計學(xué)中的
2分布作一簡略介紹。
三、
2分布的連續(xù)性矯正由(7-1)式計算的
2只是近似地服從連續(xù)型隨機變量
2分布。在對次數(shù)資料進(jìn)行
2檢驗利用連續(xù)型隨機變量
2分布計算概率時,常常偏低,特別是當(dāng)自由度為1時偏差較大。Yates(1934)提出了一個矯正公式,矯正后的
2值記為:(7-4)
當(dāng)自由度大于1時,(7-1)式的
2分布與連續(xù)型隨機變量
2分布相近似,這時,可不作連續(xù)性矯正,但要求各組內(nèi)的理論次數(shù)不小于5。若某組的理論次數(shù)小于5,則應(yīng)把它與其相鄰的一組或幾組合并,直到理論次數(shù)大于5為止。四、
2檢驗的一般步驟1.提出無效假設(shè)H0和備擇假設(shè)HAH0:樣本所屬總體屬性分配符合已知理論屬性分配(適合性檢驗);因子之間相互獨立(獨立性檢驗)。
HA:樣本所屬總體屬性分配不符合已知理論屬性分配(適合性檢驗);因子之間是相互關(guān)聯(lián)的(獨立性檢驗)。2.計算理論次數(shù)E
在無效假設(shè)成立的條件下,按已知理論屬性分配計算各屬性的理論次數(shù)(適合性檢驗);或按比例推算出理論次數(shù)(獨立性檢驗)。3.計算統(tǒng)計量
2值先確定自由度df:適合性檢驗df=k-a-1,k為屬性類別數(shù),a為計算理論分布時所用參數(shù)的個數(shù)。在R×C列聯(lián)表的獨立性檢驗中,df=(R-1)×(C-1),R為行數(shù),C為列數(shù)。然后根據(jù)(6-1)或(6-2)式計算
2
(或)。
4.統(tǒng)計推斷根據(jù)df查
2值表(附表3)找出臨界值
20.05和
20.01,將計算的
2
(或)與之比較:(1)
2
(或)<
20.05
,p>0.05,接受H0,表明觀測次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為觀測次數(shù)所屬總體屬性分配符合已知屬性分配的理論值(適合性檢驗);表明兩因子相互獨立(獨立性檢驗);(2)
20.05≤
2
(或)<
20.01
,0.01<p≤0.05,否定H0,表明觀測次數(shù)與理論次數(shù)差異顯著,在α=0.05水平上,樣本所屬總體的屬性分配不符合已知屬性分配的理論(適合性檢驗);兩因子顯著相關(guān)(獨立性檢驗);(3)
2
(或)≥
20.01
,p≤0.01,否定H0,表明觀測次數(shù)與理論次數(shù)差異極顯著,樣本所屬總體的屬性分配不符合已知屬性類別分配的理論(適合性檢驗);兩因子極顯著相關(guān)(獨立性檢驗)。
第二節(jié)適合性檢驗一、適合性檢驗的意義
判斷實際觀察的屬性類別分配是否符合已知屬性類別分配理論或?qū)W說的假設(shè)檢驗稱為適合性檢驗。如遺傳學(xué)中常用來檢驗實際結(jié)果是否與遺傳規(guī)律相符合,樣本的分布與總體理論分布是否相符合等,其理論次數(shù)是以某種概率求得。在適合性檢驗中,在無效假設(shè)成立的條件下,按已知屬性類別分配的理論或?qū)W說計算各屬性類別的理論次數(shù)。因所計算得的各個屬性類別理論次數(shù)的總和應(yīng)等于各個屬性類別實際觀察次數(shù)的總和,即獨立的理論次數(shù)的個數(shù)等于屬性類別分類數(shù)減1。也就是說,適合性檢驗的自由度等于屬性類別分類數(shù)減1。若屬性類別分類數(shù)為k,則適合性檢驗的自由度為k-1
。
二、適合性檢驗的方法
下面結(jié)合實例說明適合性檢驗方法
【例7.1】在進(jìn)行山羊群體遺傳檢測時,觀察了260只白色羊與黑色羊雜交的子二代毛色,其中181只為白色,79只為黑色,問此毛色的比率是否符合孟德爾遺傳分離定律的3∶1比例?
檢驗步驟如下:
1:提出無效假設(shè)與備擇假設(shè)
H0:子二代分離現(xiàn)象符合3∶1的理論比例。
HA:子二代分離現(xiàn)象不符合3∶1的理論比例。
2:計算理論次數(shù)根據(jù)理論比率3∶1求理論次數(shù):白色理論次數(shù):T1=260×3/4=195
黑色理論次數(shù):T2=260×1/4=65或T2=260-T1=260-195=653:計算統(tǒng)計量
2值由于本例是涉及到兩組毛色(白色與黑色),屬性類別分類數(shù)k=2,自由度df=k-1=2-1=1,須使用(7—4)式來計算。性狀實際觀測次數(shù)(A)理論次數(shù)(T)A-T白色181195-140.935黑色7965142.804總合26026003.7394.統(tǒng)計推斷當(dāng)自由度df=1時,查得
20.05(1)
=3.84,計算的
2c<
20.05(1),P>0.05,不能否定H0,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為白色羊與黑色羊的比率符合孟德爾遺傳分離定律3∶1的理論比例。
【例7.2】在研究牛的毛色和角的有無兩對相對性狀分離現(xiàn)象時,用黑色無角牛和紅色有角牛雜交,子二代出現(xiàn)黑色無角牛192頭,黑色有角牛78頭,紅色無角牛72頭,紅色有角牛18頭,共360頭。試問這兩對性狀是否符合孟德爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例?檢驗步驟:
1:提出無效假設(shè)與備擇假設(shè)
H0:實際觀察次數(shù)之比符合9∶3∶3∶1的理論比例;
HA:實際觀察次數(shù)之比不符合9∶3∶3∶1的理論比例。
2:計算理論次數(shù)依據(jù)各理論比例9:3:3:1計算理論次數(shù):黑色無角牛的理論次數(shù)T1:360×9/16=202.5;黑色有角牛的理論次數(shù)T2:360×3/16=67.5;紅色無角牛的理論次數(shù)T3:360×3/16=67.5;紅色有角牛的理論次數(shù)T4:360×1/16=22.5;或T4=360-202.5-67.5-67.5=22.5。3:計算統(tǒng)計量
2值由于本例的屬性類別分類數(shù)k=4:自由度df=k-1=4-1=3>1,故利用(7—1)式計算
2
。類型實際觀察次數(shù)(A)理論次數(shù)(T)A-T(A-T)2/T黑色無角牛192202.5-10.50.5444黑色有角牛7867.510.51.6333紅色無角牛7267.54.51.6333紅色有角牛1822.5-4.50.9000總計36036004.711
=0.5444+1.6333+1.6333+0.9=4.7114.統(tǒng)計推斷當(dāng)df=3時,
20.05(3)=7.81,因
2<
2005(3),P>0.05,不能否定H0,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為毛色與角的有無兩對性狀雜交二代的分離現(xiàn)象符合孟德爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例。第三節(jié)獨立性檢驗一、獨立性檢驗的意義對次數(shù)資料,除進(jìn)行適合性檢驗外,有時需要分析兩類因子是相互獨立還是彼此相關(guān)。如研究兩類藥物對家畜某種疾病治療效果的好壞,先將病畜分為兩組,一組用第一種藥物治療,另一組用第二種藥物治療,然后統(tǒng)計每種藥物的治愈頭數(shù)和未治愈頭數(shù)。這時需要分析藥物種類與療效是否相關(guān),若兩者彼此相關(guān),表明療效因藥物不同而異,即兩種藥物療效不相同;若兩者相互獨立,表明兩種藥物療效相同。這種根據(jù)次數(shù)資料判斷兩類因子彼此相關(guān)或相互獨立的假設(shè)檢驗就是獨立性檢驗。獨立性檢驗實際上是基于次數(shù)資料對子因子間相關(guān)性的研究。獨立性檢驗與適合性檢驗是兩種不同的檢驗方法,除了研究目的不同外,還有以下區(qū)別:(一)獨立性檢驗的次數(shù)資料是按兩因子屬性類別進(jìn)行歸組。根據(jù)兩因子屬性類別數(shù)的不同而構(gòu)成2×2、2×c、r×c列聯(lián)表(r為行因子的屬性類別數(shù),c為列因子的屬性類別數(shù))。而適合性檢驗只按某一因子的屬性類別將如性別、表現(xiàn)型等次數(shù)資料歸組。(二)適合性檢驗按已知的屬性分類理論或?qū)W說計算理論次數(shù)。獨立性檢驗在計算理論次數(shù)時沒有現(xiàn)成的理論或?qū)W說可資利用,理論次數(shù)是在兩因子相互獨立的假設(shè)下進(jìn)行計算。(三)在適合性檢驗中確定自由度時,只有一個約束條件:各理論次數(shù)之和等于各實際次數(shù)之和,自由度為屬性類別數(shù)減1。而在r×c列聯(lián)表的獨立性檢驗中,共有rc個理論次數(shù),但受到以下條件的約束:
1、rc個理論次數(shù)的總和等于rc個實際次數(shù)的總和;
2、r個橫行中的每一個橫行理論次數(shù)總和等于該行實際次數(shù)的總和。但由于r個橫行實際次數(shù)之和的總和應(yīng)等于rc
個實際次數(shù)之和,因而獨立的行約束條件只有r-1個;
3、類似地,獨立的列約束條件有c-1個。因而在進(jìn)行獨立性檢驗時,自由度為rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(橫行屬性類別數(shù)-1)×(直列屬性類別數(shù)-1)。表7-102×2列聯(lián)表的一般形式12行總合12列總合其中Aij為實際觀察次數(shù),Tij為理論次數(shù)?!纠?.7】某豬場用80頭豬檢驗?zāi)撤N疫苗是否有預(yù)防效果。結(jié)果是注射疫苗的44頭中有12頭發(fā)病,32頭未發(fā)病;未注射的36頭中有22頭發(fā)病,14頭未發(fā)病,問該疫苗是否有預(yù)防效果?
1、先將資料整理成列聯(lián)表表7—112×2列聯(lián)表發(fā)病未發(fā)病行總和發(fā)病率注射12(18.7)32(25.3)4427.3%未注射22(15.3)14(20.7)3661.1%列總和3446802、提出無效假設(shè)與備擇假設(shè)
H0:發(fā)病與否和注射疫苗無關(guān),即二因子相互獨立。
HA:發(fā)病與否和注射疫苗有關(guān),即二因子彼此相關(guān)。
3、計算理論次數(shù)根據(jù)二因子相互獨立的假設(shè),由樣本數(shù)據(jù)計算出各個理論次數(shù)。二因子相互獨立,就是說注射疫苗與否不影響發(fā)病率。也就是說注射組與未注射組的理論發(fā)病率應(yīng)當(dāng)相同,均應(yīng)等于總發(fā)病率34/80=0.425=42.5%。依此計算出各個理論次數(shù)如下:注射組的理論發(fā)病數(shù):T11=44×34/80=18.7
注射組的理論未發(fā)病數(shù):T12=44×46/80=25.3,或T12=44-18.7=25.3;未注射組的理論發(fā)病數(shù):T21=36×34/80=15.3,或T21=34-18.7=15.3;未注射組的理論未發(fā)病數(shù):T22=36×46/80=20.7,或T22=36-15.3=20.7從上述各理論次數(shù)Tij的計算可以看到,理論次數(shù)的計算利用了行、列總和,總總和,4個理論次數(shù)僅有一個是獨立的。表7-11括號內(nèi)的數(shù)據(jù)為相應(yīng)的理論次數(shù)。
4、計算值將表7-11中的實際次數(shù)、理論次數(shù)代入(7—4)式得:
5、由自由度df=1查臨界
2值,作出統(tǒng)計推斷因為
20.01(1)=6.63,而=7.944>
20.01(1),P<0.01,否定H0,接受HA,表明發(fā)病率與是否注射疫苗極顯著相關(guān),這里表現(xiàn)為注射組發(fā)病率極顯著低于未注射組,說明該疫苗是有預(yù)防效果的。
在進(jìn)行2
2列聯(lián)表獨立性檢驗時,還可利用下述簡化公式(7-6)計算:(7—6)在(7-6)式中,不需要先計算理論次數(shù),直接利用實際觀察次數(shù)Aij,行、列總和Ti.、T.j和總總和T..進(jìn)行計算,比利用公式(7-4)計算簡便,且舍入誤差小。對于【例7.7】,利用(7-6)式可得:所得結(jié)果與前面計算計算的相同。
(二)2×c列聯(lián)表的獨立性檢驗
2×c列聯(lián)表是行因子的屬性類別數(shù)為2,列因子的屬性類別數(shù)為c(c
3)的列聯(lián)表。其自由度df=(2-1)(c-1)=(c-1),因為c
3,所以自由度大于2,在進(jìn)行
2檢驗時,不需作連續(xù)性矯正。2×c表的一般形式見表7—12。其中(i=1,2;j=1,2,…,c)為實際觀察次數(shù)。
表7-122×C列聯(lián)表的一般形式12…C行總合Ti.1A11A12…A1CT1.2A21A22…A2CT2.列總合T.jT.1T.2…T.C總總和T..【例7.8】在甲、乙兩地進(jìn)行水牛體型調(diào)查,將體型按優(yōu)、良、中、劣四個等級分類,其結(jié)果見表7—13,問兩地水牛體型構(gòu)成比是否相同。表7—13兩地水牛體型分類統(tǒng)計優(yōu)良中劣行總和Ti.甲10(13.3)10(10.0)60(53.3)10(13.4)90乙10(6.7)5(5.0)20(26.7)10(6.6)45列總和T.j20158020135這是一個2×4列聯(lián)表獨立性檢驗的問題。檢驗步驟如下:
1.提出無效假設(shè)與備擇假設(shè)
H0:水牛體型構(gòu)成比與地區(qū)無關(guān),即兩地水牛體型構(gòu)成比相同。
HA:水牛體型構(gòu)成比與地區(qū)有關(guān),即兩地水牛體型構(gòu)成比不同。
2.計算各個理論次數(shù),并填在各觀察次數(shù)后的括號中計算方法與2×2表類似,即根據(jù)兩地水牛體型構(gòu)成比相同的假設(shè)計算。如優(yōu)等組中,甲地、乙地的理論次數(shù)按理論比率20/135計算;良等組中,甲地、乙地的理論次數(shù)按理論比率15/135計算;中等、劣等組中,甲地、乙地的理論次數(shù)分別按理論比率80/135和20/135計算。甲地優(yōu)等組理論次數(shù):T11=90×20/135=13.3,乙地優(yōu)等組理論次數(shù):T21=45×20/135=6.7,或T21=20-13.3=6.7;其余各個理論次數(shù)的計算類似。
3.計算計算
2值4.由自由度df=3查臨界
2值,作出統(tǒng)計推斷因為
20..05(3)=7.81,而
2=7.582<
20..05(3),p>0.05,不能否定H0,可以認(rèn)為甲、乙兩地水牛體型構(gòu)成比相同。在進(jìn)行2×c列聯(lián)表獨立性檢驗時,還可利用下述簡化公式(7-7)或(7-8)計算
2
:(7—7)
或(7—8)(7-7)與(7-8)式的區(qū)別在于:(7-7)式利用第一行中的實際觀察次數(shù)A1j和行總和T1.;(7-8)式利用第二行中的實際觀察次數(shù)A2j和行總和T2.,計算結(jié)果相同。對于[例7.7]利用(7-8)式計算
2值得:
(三)r×c列聯(lián)表的獨立性檢驗
r×c表是指行因子的屬性類別數(shù)為r(r>2),列因子的屬性類別數(shù)為c(c>2)的列聯(lián)表。其一般形式見表7-17表7—17r×c列聯(lián)表的一般形式12…c行總和Ti.1A11A12…A1cT1.2A21A22…A2cT2.………………rAr1Ar2…ArcTr.列總和T.jT.1T.2T.cT..其中Aij(i=1,2,…r;j=1,2,…c)為實際觀察次數(shù)。
r×c
列聯(lián)表各個理論次數(shù)的計算方法與上述(2×2)、(2×c)表適合性檢驗類似。但一般用簡化公式計算
2值,其公式為:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024教育培訓(xùn)服務(wù)合同的教學(xué)質(zhì)量保證
- 2024年度數(shù)字貨幣技術(shù)知識產(chǎn)權(quán)歸屬及保密服務(wù)合同3篇
- 2024年試用期間勞動合同指南2篇
- 2024年碼頭水泥硬化施工合同3篇
- 2024年礦石批量采購協(xié)議
- 2024年食品加工企業(yè)與供應(yīng)商之間的原材料采購合同
- 2024年礦產(chǎn)資源勘探與開發(fā)許可合同
- 2024年自建住宅小區(qū)勞務(wù)承包合同3篇
- 2024年度化學(xué)品倉儲服務(wù)與租賃全面合作協(xié)議3篇
- 2024年礦區(qū)開采責(zé)任承包合同版
- 吉首大學(xué)《高等數(shù)學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 打印和復(fù)印服務(wù)協(xié)議
- 針灸習(xí)題庫(附參考答案)
- 前置胎盤手術(shù)配合
- 期末試卷(試題)-2024-2025學(xué)年五年級上冊數(shù)學(xué)北師大版
- 2024年中國電信服務(wù)合同標(biāo)準(zhǔn)文本
- 四川省成都市2023-2024學(xué)年高一上學(xué)期語文期末考試試卷(含答案)
- 2024-2025學(xué)年人教版八年級上冊數(shù)學(xué)期末必刷壓軸60題(原卷版)
- 投標(biāo)述標(biāo)演講稿
- 企業(yè)名稱:個人防護(hù)用品(PPE)管理規(guī)定
- 2023年工裝行業(yè)分析報告及未來五至十年行業(yè)發(fā)展報告
評論
0/150
提交評論