003田間統(tǒng)計(jì).ppt_第1頁(yè)
003田間統(tǒng)計(jì).ppt_第2頁(yè)
003田間統(tǒng)計(jì).ppt_第3頁(yè)
003田間統(tǒng)計(jì).ppt_第4頁(yè)
003田間統(tǒng)計(jì).ppt_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章 次數(shù)分布和平均數(shù)、變異數(shù),第一節(jié) 總體及其樣本 第二節(jié) 次數(shù)分布 第三節(jié) 平均數(shù) 第四節(jié) 變異數(shù) 第五節(jié) 理論總體(群體)的平均數(shù)和標(biāo)準(zhǔn)差,第一節(jié) 總體及其樣本,總體( population ) - 具有共同性質(zhì)的個(gè)體所組成的集團(tuán). 有限總體-總體所包含的個(gè)體數(shù)目有無(wú)窮多個(gè) . 無(wú)限總體-由有限個(gè)個(gè)體構(gòu)成的總體. 觀察值( observation ) -每一個(gè)體的某一性狀、特性的測(cè)定數(shù)值. 變數(shù)( variable ) -觀察值集合起來(lái),稱(chēng)為總體的變數(shù)。變數(shù)又稱(chēng)為隨機(jī)變數(shù)(random variable)。,樣本( sample ) -從總體中抽取若干個(gè)個(gè)體的集合稱(chēng)為樣本(sample

2、)。 統(tǒng)計(jì)數(shù)( statistic ) -測(cè)定樣本中的各個(gè)體而得的樣本特征數(shù),如平均數(shù)等,稱(chēng)為統(tǒng)計(jì)數(shù)(statistic)。 隨機(jī)樣本( random sample ) -從總體中隨機(jī)抽取的樣本稱(chēng)為隨機(jī)樣本(random sample) 樣本容量 ( sample size ) -樣本中包含的個(gè)體數(shù)稱(chēng)為樣本容量或樣本含量(sample size),第二節(jié) 次數(shù)分布,一、試驗(yàn)資料的性質(zhì)與分類(lèi) 二、次數(shù)分布表 三、次數(shù)分布圖,一、試驗(yàn)資料的性質(zhì)與分類(lèi),(一) 數(shù)量性狀資料 (二) 質(zhì)量性狀資料,(一) 數(shù)量性狀資料 數(shù)量性狀(quantitative trait)的度量有計(jì)數(shù)和量測(cè)兩種方式,其所得

3、變數(shù)不同。 1. 不連續(xù)性或間斷性變數(shù)( discontinuous or discrete variable ) 指用計(jì)數(shù)方法獲得的數(shù)據(jù)。 2. 連續(xù)性變數(shù)( continuous variable ) 指稱(chēng)量、度量或測(cè)量方法所得到的數(shù)據(jù),其各個(gè)觀察值并不限于整數(shù),在兩個(gè)數(shù)值之間可以有微量數(shù)值差異的第三個(gè)數(shù)值存在。,(二) 質(zhì)量性狀資料 質(zhì)量性狀( qualitative trait )指能觀察而不能量測(cè)的狀即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的有無(wú)、絨毛的有無(wú)等。要從這類(lèi)性狀獲得數(shù)量資料,可采用下列兩種方法: 統(tǒng)計(jì)次數(shù)法 于一定總體或樣本內(nèi),統(tǒng)計(jì)其具有某個(gè)性狀的個(gè)體數(shù)目及具有不同

4、性狀的個(gè)體數(shù)目,按類(lèi)別計(jì)其次數(shù)或相對(duì)次數(shù)。 2. 給分法 給予每類(lèi)性狀以相對(duì)數(shù)量的方法,二、次數(shù)分布表,(一) 間斷性變數(shù)資料的整理 (二) 連續(xù)性變數(shù)資料的整理 (三) 屬性變數(shù)資料的整理,(一) 間斷性變數(shù)資料的整理,現(xiàn)以某小麥品種的每穗小穗數(shù)為例,隨機(jī)采取100個(gè)麥穗,計(jì)數(shù)每穗小穗數(shù),未加整理的資料列成表3.1。,表3.1 100個(gè)麥穗的每穗小穗數(shù),表3.2 100個(gè)麥穗每穗小 穗數(shù)的次數(shù)分布表,從表3.2中看到,一堆雜亂的原始資料表3.1,經(jīng)初步整理后,就可了解資料的大致情況,另外,經(jīng)過(guò)整理的資料也便于進(jìn)一步的分析。,上述資料為間斷性變數(shù)資料,每穗小穗數(shù)在1520的范圍內(nèi)變動(dòng),把所有觀

5、察值按每穗小穗數(shù)多少加以歸類(lèi),共分為6組,組與組間相差為1小穗,稱(chēng)為組距。這樣可得表3.2形式的次數(shù)分布表。,(二) 連續(xù)性變數(shù)資料的整理,茲以表3.4的100行水稻試驗(yàn)的產(chǎn)量為例,說(shuō)明整理方法。,表3.4 140行水稻產(chǎn)量(單位:克),具體步驟: 1. 數(shù)據(jù)排序(sort) 首先對(duì)數(shù)據(jù)按從小到大排列(升序)或從大到小排列(降序)。 2. 求極差(range) 所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱(chēng)為極差,亦即整個(gè)樣本的變異幅度。從表3.4中查到最大觀察值為254g,最小觀察值為75g,極差為25475=179g。,3. 確定組數(shù)和組距( class interval ) 根據(jù)極差分為若

6、干組,每組的距離相等,稱(chēng)為組距。 在確定組數(shù)和組距時(shí)應(yīng)考慮: (1)觀察值個(gè)數(shù)的多少; (2)極差的大?。?(3)便于計(jì)算; (4)能反映出資料的真實(shí)面貌等方面。 樣本大小(即樣本內(nèi)包含觀察值的個(gè)數(shù)的多少)與組數(shù)多少的關(guān)系可參照表3.5來(lái)確定。,表3.5樣本容量與組數(shù)多少的關(guān)系,組數(shù)確定后,還須確定組距。組距=極差/組數(shù)。以表3.4中140行水稻產(chǎn)量為例,樣本內(nèi)觀察值的個(gè)數(shù)為140,查表3.5可分為816組,假定分為12組,,則組距為179/12=14.9g,為分組方便起見(jiàn),可以15g作為組距。,4. 選定組限( class limit )和組中點(diǎn)值( 組值,class value ) 以表3

7、.4中140行水稻產(chǎn)量為例,選定第一組的中點(diǎn)值為75g,與最小觀察值75g相等;則第二組的中點(diǎn)值為75+15=90g,余類(lèi)推。 各組的中點(diǎn)值選定后,就可以求得各組組限。每組有兩個(gè)組限,數(shù)值小的稱(chēng)為下限( lower limit ),數(shù)值大的稱(chēng)為上限( upper limit )。上述資料中,第一組的下限為該組中點(diǎn)值減去1/2組距,即75(15/2)=67.5g,上限為中點(diǎn)值加1/2組距,即75+(15/2)=82.5g。故第一組的組限為67.582.5g。按照此法計(jì)算其余各組的組限,就可寫(xiě)出分組數(shù)列。,5. 把原始資料的各個(gè)觀察值按分組數(shù)列的各組組限歸組 可按原始資料中各觀察值的次序,逐個(gè)把數(shù)

8、值歸于各組。 待全部觀察值歸組后,即可求得各組的次數(shù),制成一個(gè)次數(shù)分布表。 例如表3.4中第一個(gè)觀察值177應(yīng)歸于表3.6中第8組,組限為172.5187.5;第二個(gè)觀察值149應(yīng)歸于第6組,組限為142.5157.5;。依次把140個(gè)觀察值都進(jìn)行歸組,即可制成140行水稻產(chǎn)量的次數(shù)分布表(表3.6)。,表3.6 140行水稻的次數(shù)分布,注:前面提到分為12組,但由于第一組的中點(diǎn)值接近于最小觀察值,故第一組的下限小于最小觀察值,實(shí)際上差不多增加了1/2組;這樣也使最后一組的中點(diǎn)值接近于最大值,又增加了1/2組,故實(shí)際的組數(shù)比原來(lái)確定的要多一個(gè)組,為13組。,(三) 屬性變數(shù)資料的整理,屬性變數(shù)

9、的資料,也可以用類(lèi)似次數(shù)分布的方法來(lái)整理。 在整理前,把資料按各種質(zhì)量性狀進(jìn)行分類(lèi),分類(lèi)數(shù)等于組數(shù), 然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中, 即可得到屬性分布的規(guī)律性認(rèn)識(shí)。 例如,某水稻雜種第二代植株 米粒性狀的分離情況,歸于表3.7。,表3.7 水稻雜種二代植株 米粒性狀的分離情況,三、次數(shù)分布圖,(一) 方柱形圖 (二) 多邊形圖 (三) 條形圖 (四) 餅圖,(一) 方柱形圖,方柱形圖( histogram )適用于表示連續(xù)性變數(shù)的次數(shù)分布。,現(xiàn)以表3.6的140行水稻產(chǎn)量的次數(shù)分布表為例加以說(shuō)明。即成方柱形次數(shù)分布圖3.1。,(二) 多邊形圖,多邊形圖( polyg

10、on )也是表示連續(xù)性變數(shù)資料的一種普通的方法,且在同一圖上可比較兩組以上的資料。,仍以140行水稻產(chǎn)量次數(shù)分布為例,所成圖形即為次數(shù)多邊形圖(圖3.2)。,(三) 條形圖,條形圖(bar)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中點(diǎn)值或分類(lèi)性狀,縱軸標(biāo)出次數(shù)。,現(xiàn)以表3.7水稻雜種第二代米粒性狀的分離情況為例,可畫(huà)成水稻雜種第二代植株4種米粒性狀分離情況條形圖(3.3)。,圖3.3 水稻F2代米粒性狀分離條形圖,(四) 餅圖,餅圖( pie )適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個(gè)數(shù)中的百分比。,

11、如圖3.4中白米糯稻在F2群體中占8%,白米非糯、紅米糯稻和紅米非糯分別占17%、21%和54%。,第三節(jié) 平均數(shù),一、平均數(shù)的意義和種類(lèi) 二、算術(shù)平均數(shù)的計(jì)算方法 三、算術(shù)平均數(shù)的重要特性 四、總體平均數(shù),一、平均數(shù)的意義和種類(lèi),平均數(shù)的意義: 平均數(shù)( average )是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。,平均數(shù)的種類(lèi) : (1) 算術(shù)平均數(shù) 一個(gè)數(shù)量資料中各個(gè)觀察值的總和除以觀察值個(gè)數(shù)所得的商數(shù),稱(chēng)為算術(shù)平均數(shù)( arithmetic mean ),記作 。因其應(yīng)用廣泛,常簡(jiǎn)稱(chēng)平均數(shù)或均數(shù)(mean)。均數(shù)的

12、大小決定于樣本的各觀察值。 (2) 中數(shù) 將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱(chēng)為中數(shù)( median ),計(jì)作Md。如觀察值個(gè)數(shù)為偶數(shù),則以中間二個(gè)觀察值的算術(shù)平均數(shù)為中數(shù)。,(3) 眾數(shù) 資料中最常見(jiàn)的一數(shù),或次數(shù)最多一組的中點(diǎn)值,稱(chēng)為眾數(shù)( mode ),計(jì)作MO。如棉花纖維檢驗(yàn)時(shí)所用的主體長(zhǎng)度即為眾數(shù)。 (4) 幾何平均數(shù) 如有n個(gè)觀察值,其相乘積開(kāi)n次方,即為幾何平均數(shù)( geometric mean ),用G代表。,(31),平均數(shù)的種類(lèi) :,二、算術(shù)平均數(shù)的計(jì)算方法,若樣本較小,即資料包含的觀察值個(gè)數(shù)不多,可直接計(jì)算平均數(shù)。設(shè)一個(gè)含有n個(gè)觀察值的樣本,其各個(gè)觀察值為

13、y1、y2、y3、yn,則算術(shù)平均數(shù)由下式算得:,(32),若樣本較大,且已進(jìn)行了分組(如表3.6),可采用加權(quán)法計(jì)算算術(shù)平均數(shù),即用組中點(diǎn)值代表該組出現(xiàn)的觀測(cè)值以計(jì)算平均數(shù),其公式為,(33),其中yi 為第i 組中點(diǎn)值,fi 為第 i 組變數(shù)出現(xiàn)次數(shù)。,例3.1 在水稻品種比較試驗(yàn)中,湘矮早四號(hào)的5個(gè)小區(qū)產(chǎn)量分別為20.0、19.0、21.0、17.5、18.5kg,求該品種的小區(qū)平均產(chǎn)量。,例3.2 利用表3.6資料計(jì)算平均每行水稻產(chǎn)量。,若采用直接法, =157.47。因此,兩者的結(jié)果十分相近。,由(32)有,三、算術(shù)平均數(shù)的重要特性,(1) 樣本各觀察值與其平均數(shù)的差數(shù)(簡(jiǎn)稱(chēng)離均差,

14、deviation from mean)的總和等于0。即:,(2) 樣本各觀察值與其平均數(shù)的差數(shù)平方的總和,較各個(gè)觀察值與任意其他數(shù)值的差數(shù)平方的總和為小,亦即離均差平方的總和最小。這個(gè)問(wèn)題可作這樣的說(shuō)明,設(shè)Q為各個(gè)觀察值與任意數(shù)值a的差數(shù)平方的總和,即:,對(duì)此Q求最小值,可得使Q最小的a 值為平均數(shù)。,四、總體平均數(shù),總體平均數(shù)用 來(lái)代表,它同樣具有算術(shù)平均數(shù)所具有的特性。,(34),上式y(tǒng)i 代表各個(gè)觀察值,N代表有限總體所包含的個(gè)體數(shù), 表示總體內(nèi)各個(gè)觀察值的總和。,第四節(jié) 變異數(shù),一、極差 二、方差 三、標(biāo)準(zhǔn)差 四、變異系數(shù),一、極 差,極差( range ),又稱(chēng)全距,記作R,是資料

15、中最大觀察值與最小觀察值的差數(shù)。例如調(diào)查兩個(gè)小麥品種的每穗小穗數(shù),每品種計(jì)數(shù)10個(gè)麥穗,經(jīng)整理后的數(shù)字列于表3.8。,表3.8 兩個(gè)小麥品種的每穗小穗數(shù),表3.8資料中,甲品種每穗小穗數(shù)最少為13個(gè),最多為23個(gè),R=2313=10個(gè)小穗;乙品種每穗小穗數(shù)最少為16個(gè),最多為20個(gè),R=2016=4個(gè)小穗。 可以看出,兩品種的平均每穗小穗數(shù)雖同為18個(gè),但甲品種的極差較大,其變異范圍較大,平均數(shù)的代表性較差;乙品種的極差較小,其變異幅度較小,其平均數(shù)代表性較好。,二、方 差,離均差平方和(簡(jiǎn)稱(chēng)平方和)SS -將各個(gè)離均差平方后相加,樣本SS=,(35),總體SS=,(36),均方或方差(var

16、iance) -用觀察值數(shù)目來(lái)除平方和,樣本均方(mean square)用s2表示,定義為:,總體方差用 表示,定義為:,樣本均方是總體方差的無(wú)偏估計(jì)值,三、標(biāo)準(zhǔn)差,(一) 標(biāo)準(zhǔn)差的定義 標(biāo)準(zhǔn)差為方差的正平方根值,用以表示資料的變異度,其單位與觀察值的度量單位相同。從樣本資料計(jì)算標(biāo)準(zhǔn)差的公式為:,(39),總體標(biāo)準(zhǔn)差用表示:,(310),樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計(jì)值。,(二) 自由度的意義,自由度記作DF,其具體數(shù)值則常用 表示。 統(tǒng)計(jì)意義:是指樣本內(nèi)獨(dú)立而能自由變動(dòng)的離均差個(gè)數(shù)。,例如一個(gè)有5個(gè)觀察值的樣本,因?yàn)槭芙y(tǒng)計(jì)數(shù)的約束,在5個(gè)離均差中,只有4個(gè)數(shù)值可以在一定范圍之內(nèi)自由變動(dòng)取值,

17、而第五個(gè)離均差必須滿(mǎn)足。如一樣本為(3,4,5,6,7),平均數(shù)為5,前個(gè)離差為2 ,1,0和1,則第5個(gè)離均差為前4個(gè)離均差之和的變號(hào)數(shù),即( 2)=2。一般地,樣本自由度等于觀察值的個(gè)數(shù)(n)減去約束條件的個(gè)數(shù)(k),即 。,注:比較(39)和(310),樣本標(biāo)準(zhǔn)差不以樣本容量n,而以自由度n1作為除數(shù),這是因?yàn)橥ǔK莆盏氖菢颖举Y料,不知 的數(shù)值,不得不用樣本平均數(shù) 代替 。 與 有差異,由算術(shù)平均數(shù)的性質(zhì)(2)可知, 比 小。因此,由 算出的標(biāo)準(zhǔn)差將偏小。如分母用n1代替,則可免除偏小的弊病。數(shù)理統(tǒng)計(jì)上可以證明用自由度作除數(shù)計(jì)算標(biāo)準(zhǔn)差的無(wú)偏性。,(三) 標(biāo)準(zhǔn)差的計(jì)算方法,1. 直接法

18、可按 計(jì)算,分四個(gè)步驟:,(1)先求出 , (2)再求出各個(gè) 和各個(gè) , (3)求和得 , (4) 代入 算得標(biāo)準(zhǔn)差。,例3.3 設(shè)某一水稻單株粒重的樣本有5個(gè)觀察值,以克為單位,其數(shù)為2、8、7、5、4(用y代表),按照上述步驟,由表3.9可算得平方和為22.80,把它代入 即可得到:,這就是該水稻單株粒重的標(biāo)準(zhǔn)差為2.39g。,表3.9 水稻粒重的平方和的計(jì)算,2 矯正數(shù)法 經(jīng)過(guò)轉(zhuǎn)換可得,(311),其中 項(xiàng)稱(chēng)為矯正數(shù),記作C。,在例3.3中,于表3.9第5列寫(xiě)出各觀察值的平方值,將有關(guān)數(shù)字代入(311)即有:,其結(jié)果和直接法算得相同。,3 加權(quán)法 若樣本較大,并已獲得如表3.6的次數(shù)分布表,可采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差,其公式為:,(312),表3.6 140行水稻的次數(shù)分布,例3.4 利用表3.6的次數(shù)分布資料計(jì)算每行水稻產(chǎn)量的標(biāo)準(zhǔn)差。 由(312),可得,若采用直接法,其標(biāo)準(zhǔn)差s=36.23(g)。由此可見(jiàn),直接法和加權(quán)法的結(jié)果是很相近的。,四、變異系數(shù),變異系數(shù)( coefficient of variation ) -樣本的標(biāo)準(zhǔn)差對(duì)均數(shù)的百分?jǐn)?shù):,(315),變異系數(shù)是一個(gè)不帶單位的純數(shù),可用以比較二個(gè)事物的變異度大小。,例如表3.10為兩個(gè)小麥品種主莖高度的平均數(shù)、標(biāo)準(zhǔn)差和變異系數(shù)。如只從標(biāo)準(zhǔn)差看,品種甲比乙的變異大些;但因兩者的均數(shù)不同,標(biāo)準(zhǔn)差間

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論