生物統(tǒng)計統(tǒng)計數(shù)據(jù)的搜集與整理_第1頁
生物統(tǒng)計統(tǒng)計數(shù)據(jù)的搜集與整理_第2頁
生物統(tǒng)計統(tǒng)計數(shù)據(jù)的搜集與整理_第3頁
生物統(tǒng)計統(tǒng)計數(shù)據(jù)的搜集與整理_第4頁
生物統(tǒng)計統(tǒng)計數(shù)據(jù)的搜集與整理_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

生物統(tǒng)計統(tǒng)計數(shù)據(jù)的搜集與整理第一頁,共三十二頁,2022年,8月28日2023/2/15遺傳因素環(huán)境因素1.1.1統(tǒng)計數(shù)據(jù)的不齊性第一章統(tǒng)計數(shù)據(jù)的搜集與整理1.1總體與樣本1.1.2總體與樣本統(tǒng)計學研究的核心問題是如何通過樣本來推斷總體??傮w與樣本是生物統(tǒng)計學最基本的兩個概念第二頁,共三十二頁,2022年,8月28日2023/2/15

總體(Population)指研究的全部對象,是由所研究具有某種共同性質的全部個體所組成的集合體。分為有限總體(finitepopulation)和無限總體(infinitepopulation)。樣本(Sample)為總體的一部分,樣本內(nèi)包含的個體數(shù)目稱為樣本含量??傮w與樣本第三頁,共三十二頁,2022年,8月28日2023/2/15

從總體獲得樣本的過程稱抽樣,抽樣的目的是希望通過對樣本的研究推斷其總體。抽樣方法有隨機抽樣、分類抽樣等。生物統(tǒng)計學上要求抽樣具有代表性,應是一個總體的縮影,因此要根據(jù)具體情況采用不同抽樣方法。1.1.3抽樣第四頁,共三十二頁,2022年,8月28日2023/2/15要求總體中的任何個體都有同等的機會被抽到;要求抽樣時不受任何主觀因素的影響。如抽簽,抓鬮,用隨機數(shù)字表等。隨機表的用法(附表1,自習)1.1.4隨機抽樣第五頁,共三十二頁,2022年,8月28日2023/2/15放回式抽樣:從總體中抽出一個個體,記下它的特征后,放回總體中,再做第二次抽樣。非放回式抽樣:從總體中抽出個體后,不再放回。有限總體中的抽樣:放回式的抽樣可能會重復抽中某一個體。尤其是總體量不大,或抽樣范圍小的時候。無限總體在同等抽樣條件下,放回式抽樣和非放回式抽樣沒有區(qū)別。一般情況樣本的含量越大越有代表性。1.1.5放回式抽樣和非放回式抽樣第六頁,共三十二頁,2022年,8月28日2023/2/151.2.1連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)統(tǒng)計學的最基本工作是收集數(shù)據(jù),數(shù)據(jù)收集得越多越有可能揭示客觀現(xiàn)象的特性和變化規(guī)律。數(shù)據(jù)類型:連續(xù)型數(shù)據(jù)(度量數(shù)據(jù)):與某種標準做比較所得到的數(shù)據(jù).例如:長度,時間,重量。對連續(xù)型數(shù)據(jù)進行分析的方法,通常稱為變量的方法。離散型數(shù)據(jù)(記數(shù)數(shù)據(jù)):由記錄不同類別個體的數(shù)目所得到的數(shù)據(jù).例如:尾數(shù),成活或死亡個數(shù)對離散型數(shù)據(jù)進行分析的方法,通常稱為屬性的方法。1.2數(shù)據(jù)類型及頻率分布第七頁,共三十二頁,2022年,8月28日2023/2/151.2.2頻數(shù)(率)表和頻數(shù)(率)圖的編繪離散型數(shù)據(jù)與連續(xù)型數(shù)據(jù)的頻數(shù)(率)表和頻數(shù)(率)圖略有不同。離散型數(shù)據(jù)頻數(shù)(率)表和頻數(shù)(率)圖。例:調查每天出生的10名新生兒中,體重超過3kg的人數(shù),共調查120天。每天的10名新生兒中,體重超過3kg的人數(shù),可能有11種情況:1名也沒有,有1名,有2名,…,10名都是,如表1-1的第一列所示,這一組稱為組值。第八頁,共三十二頁,2022年,8月28日2023/2/15表1-1每10名新生兒體重超過3kg的人數(shù)頻數(shù)(率)表第九頁,共三十二頁,2022年,8月28日2023/2/15圖1-1每10名新生兒體重超過3kg的人數(shù)頻數(shù)圖第十頁,共三十二頁,2022年,8月28日2023/2/15例:表1-2列出了某農(nóng)場做高粱“三尺三”提純時所調查的100個數(shù)據(jù),試做其頻數(shù)(率)表和頻數(shù)(率)圖。連續(xù)型數(shù)據(jù)頻數(shù)(率)表和頻數(shù)(率)圖。表1-2“三尺三”株高測量結果第十一頁,共三十二頁,2022年,8月28日2023/2/151、從原始數(shù)據(jù)中找出最大值和最小值,并求出極差。R=mamx-minx(R=170-141=30)2、決定劃分的組數(shù),分組數(shù)是由數(shù)據(jù)的多少決定的,美國統(tǒng)計學家斯特吉斯提出分組數(shù)公式:n=1+3.322lgN(式中N為樣本數(shù))。3、根據(jù)極差與決定劃分的組數(shù)、確定組限。(30/10=3)4、在頻數(shù)表中列出全部組限、組界及中值。5、將原始數(shù)據(jù)表中數(shù)據(jù),填入頻數(shù)表中,計算出每組的頻數(shù)和頻率。編制連續(xù)型數(shù)據(jù)的頻數(shù)(率)表的步驟:第十二頁,共三十二頁,2022年,8月28日2023/2/15表1-3“三尺三”株高頻數(shù)(率)表第十三頁,共三十二頁,2022年,8月28日2023/2/15直方圖:又稱組織圖,橫軸表示組界,縱軸表示頻數(shù)(頻數(shù)圖)或頻率(頻率圖),兩者圖形完全一樣。直方圖第十四頁,共三十二頁,2022年,8月28日2023/2/15多邊形圖(折線圖):橫軸表示各組中值,縱軸表示頻數(shù)(率),連接各點得到多邊形圖。累積頻數(shù)圖:橫軸表示各組中值,縱軸表示累積頻數(shù)(率),連接各點得到累積頻數(shù)(率)圖(向上累積與向下累積)。頻數(shù)(率)圖的編繪第十五頁,共三十二頁,2022年,8月28日2023/2/15根據(jù)頻數(shù)(率)表或頻數(shù)(率)圖,可以看出數(shù)據(jù)的三個重要特征。集中情況:平均數(shù),中位數(shù),眾數(shù)。變異情況:集中在平均數(shù)兩側的程度,越集中在平均數(shù)附近說明數(shù)據(jù)越整齊。圖形的形狀:對稱與不對稱,也可能顯示異常分布,出現(xiàn)一些不規(guī)則的情況,需要尋找原因。1.2.3研究頻數(shù)(率)分布的意義第十六頁,共三十二頁,2022年,8月28日2023/2/15同一總體中隨機抽取的樣本,其頻數(shù)分布不完全相同,有時差距還很大。由于樣本分布的不恒定性,當用樣本去推斷總體時,推斷的結果也會有不同,因此,需要考察結果的可信度。為了回答這一問題,首先要對總體分布有所了解。后面的第二、三章的內(nèi)容就是圍繞總體展開的。1.2.4頻數(shù)分布的不恒定性第十七頁,共三十二頁,2022年,8月28日2023/2/15樣本特征數(shù):描述樣本頻率分布特征的數(shù)字.1.3.1平均數(shù):數(shù)據(jù)集中點的度量,種類很多。算術平均數(shù):通常簡稱平均數(shù)。常用簡單算術平均數(shù)方法,實際應用中也常用加權平均的方法來計算。幾何平均數(shù):處于穩(wěn)定消長過程中生物群體的數(shù)量變化呈幾何級數(shù),如在細菌、藻類等培養(yǎng),求平均消長率應采用幾何平均數(shù),若用算術平均數(shù)則偏高(幾何平均數(shù)小于算術平均數(shù))。1.3樣本的幾個特征數(shù)第十八頁,共三十二頁,2022年,8月28日2023/2/15

中位數(shù):居于中間位置個體的數(shù)值。眾數(shù):具有最高頻數(shù)的組值或中值。有單眾數(shù)、雙眾數(shù)、三眾數(shù)等。生物統(tǒng)計學中一般都是用平均數(shù),中位數(shù)和眾數(shù)很少使用。自習:頻數(shù)圖、頻數(shù)表、平均數(shù)的性質、平均數(shù)的簡化計算公式。1.3.1平均數(shù)第十九頁,共三十二頁,2022年,8月28日2023/2/15數(shù)據(jù)的變異程度范圍(或極差)(R)R=maxx-minx平均離差(MD):離均差絕對值的和的平均數(shù)。1.3.2標準差第二十頁,共三十二頁,2022年,8月28日2023/2/15

樣本方差(S2):離均差平方的和(離差平方和)除以n-1。標準差(SD)或(S):樣本方差的開平方。1.3.2標準差(續(xù))第二十一頁,共三十二頁,2022年,8月28日2023/2/15非頻數(shù)資料標準差的簡化計算公式:標準差的簡化計算方法第二十二頁,共三十二頁,2022年,8月28日2023/2/15連續(xù)型數(shù)據(jù):用中值代替,類似離散型數(shù)據(jù)計算方法(數(shù)據(jù)較大時可用編碼):頻數(shù)資料標準差的簡化計算公式:離散型數(shù)據(jù):第二十三頁,共三十二頁,2022年,8月28日2023/2/15一般用三階中心矩m3

:m3=0

,說明曲線對稱于平均數(shù),此時平均數(shù)等于中位數(shù)也等于眾數(shù)。m3>0,說明曲線向左偏斜,稱左偏或正偏,此時眾數(shù)小于中位數(shù),而中位數(shù)小于平均數(shù)。見圖1-5A。m3<0,說明曲線向右偏斜面,稱右編或負偏,此時平均數(shù)小于中位數(shù),而中位數(shù)小于眾數(shù),見圖1-5B圖。1.3.3偏斜度和峭度偏斜度:度量數(shù)據(jù)圍繞眾數(shù)呈不對稱的程度。第二十四頁,共三十二頁,2022年,8月28日2023/2/15圖1-5B圖1-5A偏斜的圖示第二十五頁,共三十二頁,2022年,8月28日2023/2/15

用三階中心距的兩個缺陷:單位為物理學單位的立方,因此不同類型數(shù)據(jù)之間不易進行比較沒有計算數(shù)據(jù)變異的性質,因此沒有一個絕對的含義。標準化的三階中心距g1:

其判斷方法與m3是一樣的。1.3.3偏斜度和峭度(續(xù))第二十六頁,共三十二頁,2022年,8月28日2023/2/15g2=0,認為數(shù)據(jù)是正態(tài)的;g2>0,說明曲線過于陡峭;g2<0,說明曲線過于平坦。判斷偏斜度g1

時,樣本含量至少要>200、判斷峭度g2時,樣本含量至少要>1000。峭度g2

:也是用來度量曲線形狀,其值為四階中心距m4與二階中心距m2的平方的商再減去3:第二十七頁,共三十二頁,2022年,8月28日2023/2/15考慮標準差和平均數(shù)兩者關系用來表明樣本標準差對平均數(shù)的變異幅度??梢杂脕砼袛鄶?shù)據(jù)整齊程度,變異系數(shù)比較小的數(shù)據(jù)組比較整齊。1.3.4變異系數(shù)CV第二十八頁,共三十二頁,2022年,8月28日2023/2/15一、名詞解釋總體樣本標準差方差變異系數(shù)偏斜度峭度習題第二十九頁,共三十二頁,2022年,8月28日2023/2/15二、簡答題1、簡述生物統(tǒng)計學概念?它在水產(chǎn)科學研究中有何作用?2、如何提高試驗的準確性與精確性?3、如何控制、降低隨機誤差,避免系統(tǒng)誤差和總偶然誤差?習題第三十頁,共三十二頁,2022年,8月28日2023/2/15

二、簡答題4、頻率(數(shù))分布表與頻率(數(shù))分布圖有何用途?常用頻率(數(shù))分布圖、頻率(數(shù))分布表有哪些?5、生物統(tǒng)計中常用的平均數(shù)有幾種?各在什么情況下應用?6、算術平均數(shù)有哪些基本性質?7、標準差有哪些特性?8、為什么變異系數(shù)要與平均數(shù)、標準差配合使用?習題第三十一頁,共三十二頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論