版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
AdvancedBiostatistics關(guān)于《高等生物統(tǒng)計課程》的說明
本課程是為滿足生物科學(xué)各專業(yè)研究生學(xué)習(xí)和研究的需要而開設(shè)的一門工具類課程。課程主要介紹生物學(xué)研究中常用的現(xiàn)代統(tǒng)計分析方法,課程注重統(tǒng)計思想和方法應(yīng)用、計算機實現(xiàn)的介紹。內(nèi)容包括均值比較、回歸分析、數(shù)據(jù)縮減、聚類與模式識別等。要求學(xué)生具有初等概率統(tǒng)計或初等生物統(tǒng)計的基礎(chǔ)和計算機基礎(chǔ)。課程的內(nèi)容分為兩部分1.思想方法講授,大約用42課時;2.統(tǒng)計方法的計算機實現(xiàn),大約18課時。主要參考資料:1.高級生物統(tǒng)計,明道緒主編,中國農(nóng)業(yè)出版社,20062.試驗設(shè)計與分析,袁志發(fā)主編,中國農(nóng)業(yè)出版社,20073.多元統(tǒng)計分析,袁志發(fā)主編,科學(xué)出版社,19994.非參數(shù)統(tǒng)計方法,吳喜之主編,高等教育出版社,19965.SPSS實用教程,阮貴海主編,高等教育出版社,2000高等生物統(tǒng)計學(xué)的概述一、生物統(tǒng)計學(xué)科性質(zhì)與任務(wù)生物學(xué)領(lǐng)域中所涉及的大多數(shù)學(xué)科是實驗科學(xué),這些學(xué)科研究的共同特點是通過縝密設(shè)計的實驗探索新知識,發(fā)現(xiàn)客觀世界規(guī)律。而實驗方法主要有兩類:一類是試驗,另一類是抽樣調(diào)查。這些學(xué)科研究的基本過程一般包括:
1.由經(jīng)驗和已有的知識對所研究新問題提出一種假設(shè);
2.根據(jù)假設(shè)內(nèi)容科學(xué)的安排實驗(包括試驗與抽樣調(diào)查);
3.根據(jù)實驗數(shù)據(jù)進(jìn)行分析推段,形成結(jié)論。生物統(tǒng)計(BiometricsorBiostatistics)為實現(xiàn)這一基本過程中2,3環(huán)節(jié)而產(chǎn)生的一個學(xué)科。合理設(shè)計試驗和調(diào)查,科學(xué)地整理分析試驗數(shù)據(jù),揭示和發(fā)現(xiàn)新知識是其根本任務(wù)。77-1855)各自獨立地導(dǎo)出了正態(tài)曲線,還創(chuàng)立了最小二乘法,并被廣泛地應(yīng)用于生物學(xué),英國優(yōu)生學(xué)派創(chuàng)始人高爾頓(達(dá)爾文的堂弟,博物學(xué)家,生物統(tǒng)計學(xué)之父)和他的繼承人皮爾森在遺傳學(xué)研究中發(fā)展了相關(guān)與回歸的概念,皮爾森還發(fā)展了著名的卡方檢驗法,并于1901年創(chuàng)辦了Biometrika雜志,使數(shù)理統(tǒng)計學(xué)的研究與發(fā)展進(jìn)入一個新的階段。
2.蓬勃發(fā)展階段
進(jìn)入20世紀(jì)后,數(shù)理統(tǒng)計理論和方法得到了蓬勃發(fā)展。英國統(tǒng)計學(xué)家哥色特提出了學(xué)生氏t分布,并將其用于平均數(shù)的比較;英國生物學(xué)家費希爾提出了試驗設(shè)計的基本原則和方差分析法;英國計算機科學(xué)家葉茨也作了大量工作。許多多元分析方法被建立和應(yīng)用。特別是20世紀(jì)后期由于計算機的快算發(fā)展,使得許多統(tǒng)計方法在解決生物科學(xué)領(lǐng)域內(nèi)問題時,發(fā)揮出巨大作用。
3.國內(nèi)的發(fā)展情況在我國,現(xiàn)代生物統(tǒng)計學(xué)的起步較晚。在30年代首次由著名生物統(tǒng)計學(xué)家、植物育種學(xué)家王綬教授(1876-1972)將生物統(tǒng)計學(xué)引入我國,撰寫的《實用生物統(tǒng)計法》是我國出版最早的生物統(tǒng)計專著之一。之后南京中央農(nóng)業(yè)試驗廳邀請美國專家H.H.Love來我國講學(xué),講授StatisticalMethodinAgriculturalResearch,后來這本講義由沈驪英翻譯為《生物統(tǒng)計之理論與實際》,范福仁出版了《田間試驗技術(shù)》等,這些對推動我國農(nóng)業(yè)生物統(tǒng)計和田間試驗方法的應(yīng)用都產(chǎn)生了很大影響。解放初期,由于生物統(tǒng)計學(xué)的理論與方法與當(dāng)時所推行的蘇聯(lián)米丘林遺傳學(xué)相悖,使這門學(xué)科的研究、應(yīng)用與發(fā)展受到很大影響,直到60年代初,隨著農(nóng)業(yè)科學(xué)研究的需要,才又重新被重視并得以迅速發(fā)展。黨的十一屆三中全會的春風(fēng)使我國生物統(tǒng)計學(xué)的研究與應(yīng)用進(jìn)三、生物統(tǒng)計基本概念總體:根據(jù)研究目的確定的研究對象的全體。樣本:按照一定方法從總體中抽取的一部分單元的全體。統(tǒng)計量:樣本決定的不含任何參數(shù)的函數(shù)。準(zhǔn)確度:指在調(diào)查或試驗中某一試驗指標(biāo)或性狀的觀測值與其真值接近的程度。精確度:指調(diào)查或試驗中同一試驗指標(biāo)或性狀的重復(fù)觀測值彼此接近的程度。進(jìn)入到對一個新的歷史時期,在農(nóng)業(yè)部領(lǐng)導(dǎo)下,于1977年著手編寫了《田間試驗與統(tǒng)計方法》教學(xué)大綱,并由南京農(nóng)業(yè)大學(xué)著名統(tǒng)計遺傳學(xué)專家馬育華教授編寫了《田間試驗與統(tǒng)計方法》全國統(tǒng)編教材。20世紀(jì)80年代后,我國各大農(nóng)業(yè)院校陸續(xù)開設(shè)了生物統(tǒng)計課程,部分綜合院校設(shè)立了生物統(tǒng)計碩士點,生物統(tǒng)計在我國進(jìn)入一個嶄新的時期。2.試驗數(shù)據(jù)誤差分類系統(tǒng)誤差:是由較確定的原因引起的,可校正和消除;隨機誤差:是由不確定原因引起的,不可避免和消除;過失誤差:是指一種顯然與事實不符的誤差,必須避免和剔除。3.試驗數(shù)據(jù)誤差的來源試驗材料的固有差異:生物學(xué)研究對象一般是生物有機體。自然界不同的生物體具有不同的遺傳性質(zhì),同一生物的不同種具有不同的特征,同一品種生物在生長發(fā)育過程中不同個體也有差異,這都能導(dǎo)致研究指標(biāo)的變化。環(huán)境條件的差異:生物學(xué)試驗一般都要在外界環(huán)境中進(jìn)行,而外界環(huán)境是多變樣的,且地域性很強有較難控制,這就會導(dǎo)致研究指標(biāo)的差異。管理不一致所引起的差異:生物學(xué)試驗是以生物個體為對象研究問題,生物個體在發(fā)育和生長過程需要管理,而對每個生物個體的管理很難做到完全一致,這就合造成觀測結(jié)果的差異。觀測不一致造成的差異:生物試驗在觀察和測定時,由于人員不同、時間不同也會導(dǎo)致試驗結(jié)果的差異。4.隨機誤差的統(tǒng)計規(guī)律最大正誤差、最大負(fù)誤差的“有界性”;絕對值小的誤差出現(xiàn)的次數(shù)比絕對值大的誤差出現(xiàn)的次數(shù)多,“單峰性”;正負(fù)誤差出現(xiàn)次數(shù)大致相等,“對稱性”;測量次數(shù)增加,誤差減小,“補償性”;正常的隨機誤差服從均值為零的正態(tài)分布。五、樣本異常值的判斷與處理
1.異常值的概念:樣本異常值是指樣本中的個別值,其數(shù)值明顯偏離它所在樣本的其余觀測值。2.樣本異常值的形成原因:異常值可能僅僅是數(shù)據(jù)中固有的隨機誤差的極端表現(xiàn),也可能是過失誤差。3.樣本異常值的判定:如果某個測量值Xd的離差Ud滿足Ud>3S
,其中S為樣本方差,則認(rèn)為Xd是含有過失誤差的異常值。4.樣本異常值的處理原則異常值保留在樣本中參加其后的數(shù)據(jù)統(tǒng)計計算;允許剔除異常值,即把異常值從樣本中排除;允許剔除異常值并追加適宜的觀測值代入樣本。在找到實際原因時修正異常值。處理規(guī)則為:(1)對于任何異常值,若無充分的技術(shù)上的原因,則不得剔除或修正;(2)異常值中除有充分的技術(shù)上的或?qū)嶒炆系睦碛赏?,在統(tǒng)計上表現(xiàn)為高異常,才允許剔除或修正。一個樣本均值比較
生物科學(xué)研究與生產(chǎn)實踐中一種方法,一種藥及處理,一種生境下植物生長狀態(tài)與給定理論之比較等,這種實際問題都可以歸為一個樣本均值比較統(tǒng)計問題下。下面分不同條件討論這類問題解法。
一個樣本均值與給定的標(biāo)準(zhǔn)比較時,針對樣本所滿足的不同條件,可以選用Z-檢驗或T-檢驗。Z-檢驗T-檢驗1843401622302932373639343945283640343952符號檢驗當(dāng)樣本容量n>30時,檢驗統(tǒng)計量可以用近似服從正態(tài)分布的Z統(tǒng)計量檢驗:P-Value表示法
所謂P-Value表示法是指:在統(tǒng)計比較時把檢驗統(tǒng)計量大于檢驗統(tǒng)計量樣本實現(xiàn)的概率與檢驗水平比較,從而得出拒絕還是接受零假設(shè)結(jié)論的表示方法。下面以一個樣本均值比較的Z-檢驗說明這種表示法。
例如前面對昆蟲平均身長比較的Z-檢驗,由于z0=-2.47,由正態(tài)分布N(100,122)計算P-Value得
生物科學(xué)研究與生產(chǎn)實踐中兩種方法,兩種藥及處理,兩種生境下植物生長狀態(tài)比較等,這種實際問題都可以歸為兩總體平均值比較統(tǒng)計問題下。下面分不同條件討論其解法。配對樣本的符號檢驗在進(jìn)行配對樣本均值是否相等的比較時,如果樣本不服從正態(tài)分布,T-檢驗就不再適用。而符號檢驗恰好可以解決這一問題。這種檢驗的一般做法是:首先,將配對樣本實現(xiàn)比較大小,轉(zhuǎn)化樣本實現(xiàn)為符號(大于記“+”,小于記“-”,等于記“0”),數(shù)樣本中“+”的個數(shù)n+,“-”的個數(shù)n-。符號檢驗:總體分布未限制,樣本量較?。ㄐ∮?0)。多個樣本均值比較方差分析(AnalysisOfVariance)一、方差分析的概念與基本思想
1.問題的提出例題8.1在飼料養(yǎng)雞增肥研究中,某飼料研究所提出三種配方:A1以魚粉為添加料,A2以槐樹粉為添加料,A3以苜蓿粉添加料。為比較三種飼料的效果,特選24只相似的雛雞隨機分為三組,每組用一種飼料喂養(yǎng),60天后測其體重,獲得數(shù)據(jù)如下表飼料A雞重/gA110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048比較三種飼料的增重效果是否一致,可以轉(zhuǎn)化為利用樣本比較三個總體均值是否相等。直觀上看該問題可以用兩個總體均值差異顯著性檢驗解決,但細(xì)想想還是存在一定問題,因為這樣的比較能增大犯錯誤的概率。為解決這類問題,英國統(tǒng)計學(xué)家R.A.Fisher于1924年提出了解決此類問題的通用方法-方差分析法。2.方差分析的概念因素:影響試驗指標(biāo)變化的原因。水平:因素所劃分成不同等級,每個等級稱為該因素的一個水平。條件變差:能反映控制因素不同水平對試驗指標(biāo)的作用的量,又稱為處理效應(yīng)或組間效應(yīng)。隨機誤差:能反映控制因素以外因素對試驗指標(biāo)作用的量。3.方差分析的基本思想試驗指標(biāo)的變化可以用指標(biāo)值的方差反映,導(dǎo)致指標(biāo)值發(fā)生變化的原因有兩方面:一是可控因素,二是不可控因素或未加控制因素。方差分析就是將指標(biāo)值的方差分解成條件變差與隨機誤差,然后依據(jù)概率原理比較條件變差與隨機誤差大小關(guān)系,決定引起指標(biāo)值的變化的主要原因。4.方差分析的基本假定不同因素對試驗指標(biāo)值的影響作用是加性效應(yīng),即試驗指標(biāo)值的變化是各種因素所起作用的累加;試驗指標(biāo)服從正態(tài)分布;試驗數(shù)據(jù)是隨機的,并且可控因素不同水平的試驗數(shù)據(jù)方差齊性。二、單因素方差分析單因素方差分析的數(shù)據(jù)結(jié)構(gòu)單因素方差分析的試驗數(shù)據(jù)應(yīng)具有下列結(jié)構(gòu)模式。因素-水平試驗數(shù)據(jù)和平均單因素方差分析的統(tǒng)計模型該形式稱為單因素方差分析的統(tǒng)計模型。
在方差分析統(tǒng)計模型下,方差分析要解決的問題轉(zhuǎn)化為下列假設(shè)檢驗問題:
三、單因素方差分析的原理試驗數(shù)據(jù)離差平方和分解離差平方和分解式在實際應(yīng)用中,方差分析結(jié)果以方差分析表形式給出。單因素方差分析表方差來源平方和自由度均方F臨界值或Sig組間SSAr-1SSA/(r-1)MSA/MSe組內(nèi)SSer(m-1)SSe/r(m-1)總和SSTrm-1例題在飼料養(yǎng)雞增肥研究中,某飼料研究所提出三種配方:
A1以魚粉為添加料,A2以槐樹粉為添加料,A3以苜蓿粉添加料。為比較三種飼料的效果,特選24只相似的雛雞隨機分為三組,每組用一種飼料喂養(yǎng),60天后測其體重,獲數(shù)據(jù)如下表,試以此數(shù)據(jù)判定不同飼料是否有差異?飼料A雞重/g-1000A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363方差分析表方差來源平方和自由度均方F臨界值組間9660.0822830.043.59*3.47組內(nèi)28215.96211343.62總和37876.0423例
以A,B,C,D4種藥劑處理水稻種子,其中A為對照,每處理各得4個苗高觀察值(cm),試由此試驗數(shù)據(jù)判定藥劑處理對水稻苗高聲有無影響。藥劑苗高觀察值總和Ti平均數(shù)A182120137218B202426229223C101517145614D2827293211629T=336=21因此誤差平方和可以采用簡單的辦法計算
SSe=SST-SSB=602-504=98進(jìn)而可得均方:查附表在f1=3,f2=12時,F(xiàn)0.05=3.49,F(xiàn)0.01=5.95實得F>F0.01或
P<0.01,說明藥劑處理有統(tǒng)計意義。
四、單因素方差分析模型參數(shù)的估計當(dāng)方差分析結(jié)果為否定原假設(shè)時,就需要估計模型的有關(guān)參數(shù),下面就討論方差分析模型參數(shù)的估計。
四、秩和單因素方差分析
(Kruskal–Wallisone-wayanalysisofvariance)在生物學(xué)研究中,經(jīng)常會遇到多種處理試驗數(shù)據(jù)差異分析,而這種試驗數(shù)據(jù)有嚴(yán)重偏離正態(tài)分布,這時傳統(tǒng)的方差分析已無法解決這類問題。為解決這種問題,一般是把差異比較轉(zhuǎn)化為分布齊一性檢驗,利用秩和檢驗法解決。單因素方差分析的試驗數(shù)據(jù)應(yīng)具有下列結(jié)構(gòu)模式。因素-水平試驗數(shù)據(jù)因素-水平試驗數(shù)據(jù)秩和秩平均首先,將個水平數(shù)據(jù)放在一起確定每個數(shù)據(jù)的秩,從而數(shù)據(jù)轉(zhuǎn)化為秩數(shù)據(jù),并對秩數(shù)據(jù)整理如下表可以證明,在各處理水平數(shù)據(jù)同分布,且ni>5,n>15情況下,統(tǒng)計量R成立以下結(jié)論:于是當(dāng)ni>5,n>15時,可以用該結(jié)論檢驗分布同質(zhì)性,也可以在分布形狀和尺度相同下,檢驗不同總體中位數(shù)差異顯著性,即方差分析。秩和單因素方差以下列步驟實施:例
以A,B,C,D表示4種海拔水平,為掌握某植物生長受海拔影響,研究人員分別在每個海拔水平實測該植物生長量,數(shù)據(jù)如下所示(單位g),試由此試驗數(shù)據(jù)判定該植物生長是否受海拔影響。ABCD解五、多重比較法拒絕H0,接受H1,表示總體均數(shù)不全相等哪兩兩均數(shù)之間相等?哪兩兩均數(shù)之間不等?
————>需要進(jìn)一步作多重比較。方差分析結(jié)果不拒絕H0,表示拒絕總體均數(shù)相等的證據(jù)不足,
————>分析終止。
常用多重比較法最小顯著差數(shù)法(Leastsignificantdifference,簡稱LSD法)q法(又稱SNK(student-Newman-Keuls)檢驗法)q測驗方法是將r個平均數(shù)由大到小排列后,根據(jù)所比較的兩個處理平均數(shù)的差數(shù)是幾個平均數(shù)間的極差分別確定最小顯著極差LSRα值的。Tukey法(又稱honestlysignificantdifference,簡稱HSD
)Bonferroni法Bonferroni法是根據(jù)所比較的兩個處理平均數(shù)的個數(shù)k,將檢驗水平縮小k倍祖為真實比較水平,確定是幾個平均數(shù)間的極差分別確定最小顯著差數(shù)LSDα值的。多重比較法選擇1.試驗事先確定比較的標(biāo)準(zhǔn),凡是與對照相比較,或與預(yù)定要比較的對象比較,一般可選用最小顯著差數(shù)法LSDa法;2.根據(jù)否定一個正確的H0和接受一個不正確的H0的相對重要性來決定。參考以下觀點:根據(jù)試驗的側(cè)重點選擇。三種方法的顯著尺度不相同,LSD法最低,HSD法次之,SNK法最高。故對于試驗結(jié)論事關(guān)重大或有嚴(yán)格要求時,用SNK法,一般試驗可采用HSD法。當(dāng)比較次數(shù)不多時,Bonferroni法的效果較好;但當(dāng)比較次數(shù)較多(例如在10次以上)時,則由于其檢驗水準(zhǔn)選擇得過低,結(jié)論偏于保守。雙因素方差分析背景雙因素方差分析的類型若把品種看成影響產(chǎn)量的因素A,肥料則是影響產(chǎn)量的因素B。對因素A、因素B和二者互作同時進(jìn)行分析,就屬于雙因素方差分析。在實際問題的研究中,有時需要考慮兩個因素對實驗結(jié)果的影響。如研究小麥產(chǎn)量問題,除了關(guān)心品種對產(chǎn)量的作用之外,我們還想了解化肥的使用對產(chǎn)量的作用,有時甚至要考慮品種與肥料的相互促進(jìn)作用。如果不同品種、不同施肥量對產(chǎn)量作用存在顯著的差異,就需要分析原因。選擇合適的品種,決定恰當(dāng)?shù)氖┓柿?,以達(dá)到增產(chǎn)的目的。雙因素方差分析雙因素方差分析的類型無交互作用的雙因素方差分析
有交互作用的雙因素方差分析
因素A和因素B的效應(yīng)之間是相互獨立的,不存在相互關(guān)系
因素A和因素B的結(jié)合會產(chǎn)生出一種新的效應(yīng)(交互效應(yīng))
交互作用的概念有人在研究油菜產(chǎn)量受氮肥與磷肥影響問題時,獲得如下試驗數(shù)據(jù)。顯然512-470-2-10=30既不是單純氮肥引起的產(chǎn)量變化,也不是單純磷肥引起的產(chǎn)量變化,這就是交互作用。氮肥磷肥06047047215480512不考慮交互作用的雙因素方差分析
因素B
數(shù)據(jù)因素A
雙因素不考慮交互作用方差分析的數(shù)據(jù)結(jié)構(gòu)雙因素不考慮互作方差分析試驗數(shù)據(jù)具有下列結(jié)構(gòu)模式。雙因素不考慮交互作用方差分析的統(tǒng)計模型該形式稱為雙因素不考慮交互作用方差分析的統(tǒng)計模型。
在方差分析統(tǒng)計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025縫紉機機器租賃合同
- 蘭州市政府2025年度合同管理創(chuàng)新試點合同3篇
- 2025年度酒店客房內(nèi)墻乳膠漆翻新服務(wù)合同3篇
- 2025年度知識產(chǎn)權(quán)交易及投資合作協(xié)議3篇
- 二零二五年度競業(yè)禁止機械租賃與節(jié)能技術(shù)合同3篇
- 二零二五年度跨國公司股東合伙人戰(zhàn)略合作協(xié)議3篇
- 二零二五年度航空航天出資入股協(xié)議
- 2025年度生態(tài)園林景觀設(shè)計-特色樹苗訂購與施工合同
- 二零二五年度生物醫(yī)藥研發(fā)項目轉(zhuǎn)讓合同3篇
- 二零二五年度房產(chǎn)轉(zhuǎn)讓合同中的稅務(wù)籌劃及優(yōu)惠條款協(xié)議3篇
- 物業(yè)品質(zhì)工作述職報告
- 專題01 名詞的種類精講課件初中英語語法課件
- 醫(yī)療器械監(jiān)督管理條例培訓(xùn)2024
- 旅游度假村分成協(xié)議
- 醫(yī)療技術(shù)管理總結(jié)
- 艦艇損害管制與艦艇損害管制訓(xùn)練
- 常見年宵花春節(jié)期間養(yǎng)護攻略
- 安全安全技術(shù)交底模板
- 2021年河南學(xué)業(yè)水平考試 pyton操作題代碼以及 Python基礎(chǔ)知識點
- 整本書閱讀《鄉(xiāng)土中國》課件+2024-2025學(xué)年統(tǒng)編版高中語文必修上冊
- 夏天奔跑的聲音(2022年浙江杭州中考語文試卷記敘文閱讀題及答案)
評論
0/150
提交評論