試驗設(shè)計與描述性統(tǒng)計_第1頁
試驗設(shè)計與描述性統(tǒng)計_第2頁
試驗設(shè)計與描述性統(tǒng)計_第3頁
試驗設(shè)計與描述性統(tǒng)計_第4頁
試驗設(shè)計與描述性統(tǒng)計_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一章第一章 試驗設(shè)計與描述性統(tǒng)計試驗設(shè)計與描述性統(tǒng)計 field experiment design and discriptive Stat. 基本概念基本概念(Basic Concepts)第一節(jié)第一節(jié) 試驗設(shè)計試驗設(shè)計(experiment design)第二節(jié)第二節(jié) 描述性統(tǒng)計描述性統(tǒng)計(discriptive Stat.)基本概念(基本概念(Basic Concepts)1. 總體(總體(population): 具有共同性質(zhì)的個體所組成的集團。具有共同性質(zhì)的個體所組成的集團。分為有限總體和無限總體。分為有限總體和無限總體。2. 樣本(樣本(Sample):從總體中抽出的若干個個體

2、組成樣本。):從總體中抽出的若干個個體組成樣本。3. 觀察值(觀察值(Observed Value):每一個體的某一性狀、特性):每一個體的某一性狀、特性的測定數(shù)值。的測定數(shù)值。4. 變數(shù)(變數(shù)(Variable):凡表現(xiàn)出變異的觀察值稱為變數(shù)。):凡表現(xiàn)出變異的觀察值稱為變數(shù)。5. 參數(shù)(參數(shù)(Parameter):由總體的全部觀察值而計算得到的):由總體的全部觀察值而計算得到的總體特征數(shù),如總體平均數(shù)等??傮w特征數(shù),如總體平均數(shù)等。6. 統(tǒng)計數(shù)(統(tǒng)計數(shù)(Statistic):測定樣本中的各個體而得到的特征):測定樣本中的各個體而得到的特征數(shù),如樣本平均數(shù)等。數(shù),如樣本平均數(shù)等。7. 隨機樣

3、本(隨機樣本(Random Sample):從總體中隨機抽取的樣本。):從總體中隨機抽取的樣本。水平(水平(Level):因素內(nèi)設(shè)置的不同處理級別。):因素內(nèi)設(shè)置的不同處理級別。處理(處理(Treatment):幾個因素不同水平的組合。):幾個因素不同水平的組合。準確度(準確度(Accuracy):同一處理的觀察值與其真實值的接):同一處理的觀察值與其真實值的接近程度。近程度。精確度(精確度(Precision):同一處理的重復(fù)觀察值間彼此接近):同一處理的重復(fù)觀察值間彼此接近程度。程度。試驗單元(試驗單元(Experimental Unit):是指接受某種處理的最):是指接受某種處理的最小的

4、一個獨立的試驗材料單位。如一張葉片、一個果實、小的一個獨立的試驗材料單位。如一張葉片、一個果實、一個枝條、一個植株等。一個枝條、一個植株等。13. 誤差(誤差(Error):觀察值與處理真實值間的偏離程度。):觀察值與處理真實值間的偏離程度。14. 系統(tǒng)誤差(系統(tǒng)誤差(Systematic Error):觀察值與處理真實值間):觀察值與處理真實值間 出現(xiàn)有一定方向的系統(tǒng)偏離,如供試材料的遺傳背景、儀出現(xiàn)有一定方向的系統(tǒng)偏離,如供試材料的遺傳背景、儀器等方面存在的可辨識的差別所造成的誤差。器等方面存在的可辨識的差別所造成的誤差。15. 隨機誤差(隨機誤差(Random Error):觀察值與處理

5、真實值間出):觀察值與處理真實值間出現(xiàn)的大小、方向不同的微小差異。如在試驗單元、管理方現(xiàn)的大小、方向不同的微小差異。如在試驗單元、管理方法、操作方法等方面存在的不可辨識的差別所造成的誤差。法、操作方法等方面存在的不可辨識的差別所造成的誤差。16. 樣本含量(樣本含量(Sample Size/Capacity):樣本中所包含的個):樣本中所包含的個體數(shù)目。體數(shù)目。第一節(jié)第一節(jié) 試驗設(shè)計試驗設(shè)計experiment design試驗和實驗試驗和實驗試驗是在人為控制條件下有目的地進行的一種實踐活動。試驗是在人為控制條件下有目的地進行的一種實踐活動。一、試驗類型(一)一、試驗類型(一)1. 田間試驗田

6、間試驗2. 溫室試驗溫室試驗3. 實驗室試驗實驗室試驗4. 皿內(nèi)試驗皿內(nèi)試驗5. 人工氣候室內(nèi)試驗等等人工氣候室內(nèi)試驗等等二、試驗的基本要求:二、試驗的基本要求:1. 目的明確目的明確2. 結(jié)果可靠結(jié)果可靠3. 試驗條件有代表性試驗條件有代表性4. 試驗結(jié)果能夠重復(fù)試驗結(jié)果能夠重復(fù)精確度準確度即準確又精確即準確又精確準確而不精確準確而不精確即不準確又不精確即不準確又不精確精確而不準確精確而不準確試驗?zāi)P驮囼災(zāi)P凸┰圀w供試體輸入輸入處理處理輸出輸出試驗指標試驗指標隨機干擾隨機干擾Fig. 1 General model of experimentUxFig. 1 Mathematical mod

7、el of experiment),(ufx 離散的測定幾個點,采用統(tǒng)計學(xué)的方法經(jīng)驗的估計離散的測定幾個點,采用統(tǒng)計學(xué)的方法經(jīng)驗的估計 xf(U)(如上圖所示),顯然觀測點未必都在曲線上。如果估計出了(如上圖所示),顯然觀測點未必都在曲線上。如果估計出了xf(U),我們就掌握了,我們就掌握了x隨隨U而變化的規(guī)律,就可以進行預(yù)而變化的規(guī)律,就可以進行預(yù)測和控制。測和控制。三、處理設(shè)計三、處理設(shè)計田間試驗按試驗小區(qū)大小、試驗?zāi)攴?、試驗地點等可分為田間試驗按試驗小區(qū)大小、試驗?zāi)攴?、試驗地點等可分為若干類,但最基本的是根據(jù)試驗因素可將田間試驗分為:若干類,但最基本的是根據(jù)試驗因素可將田間試驗分為:單因

8、素試驗(單因素試驗(Singlefactor experiment)僅研究某一僅研究某一個問題,如施肥對產(chǎn)量的影響,可以包含肥料的不同等級。個問題,如施肥對產(chǎn)量的影響,可以包含肥料的不同等級。優(yōu)點:試驗簡單,容易分析、但是不能了解各因素之間的優(yōu)點:試驗簡單,容易分析、但是不能了解各因素之間的關(guān)系。關(guān)系。多因素試驗(多因素試驗(Multiple-factor experiment)中包含了不中包含了不同因素及不同水平的組合。優(yōu)點:便于了解各因素之間的同因素及不同水平的組合。優(yōu)點:便于了解各因素之間的相互關(guān)系,試驗復(fù)雜,設(shè)計不妥時不便于分析。相互關(guān)系,試驗復(fù)雜,設(shè)計不妥時不便于分析。綜合試驗(綜合

9、試驗(Comprehensive experiment)是在進行多因是在進行多因素研究之后,將重要因素重新組合,進行試驗分析,各因素研究之后,將重要因素重新組合,進行試驗分析,各因素的水平不需要構(gòu)成平衡處理。素的水平不需要構(gòu)成平衡處理。四、試驗單元的排列方式四、試驗單元的排列方式 試驗設(shè)計的目的是避免系統(tǒng)誤差,縮小隨機誤差,以保證試驗設(shè)計的目的是避免系統(tǒng)誤差,縮小隨機誤差,以保證試驗的準確度和精確度。試驗的準確度和精確度。試驗設(shè)計的三個基本原理:試驗設(shè)計的三個基本原理:1.重復(fù)(重復(fù)(Replication):重復(fù)的作用():重復(fù)的作用(1)若試驗中沒有系統(tǒng)誤)若試驗中沒有系統(tǒng)誤差存在,只有隨

10、機誤差,則可用處理多次重復(fù)觀察值間的參差差存在,只有隨機誤差,則可用處理多次重復(fù)觀察值間的參差不棄程度來估計隨機誤差。只有不棄程度來估計隨機誤差。只有1次重復(fù)就無法估計隨機誤差次重復(fù)就無法估計隨機誤差(2)同一處理多次觀察值的平均值是處理真值的最好估計。)同一處理多次觀察值的平均值是處理真值的最好估計。2.隨機化(隨機化(Randomization):通過試驗單元的隨機化排列來消):通過試驗單元的隨機化排列來消除試驗單元間的系統(tǒng)誤差。除試驗單元間的系統(tǒng)誤差。3.局部控制(局部控制(Local control):將整個試驗空間分成若干個各):將整個試驗空間分成若干個各自相對均勻的局部(區(qū)組),所

11、以的區(qū)組構(gòu)成區(qū)組因素。作用自相對均勻的局部(區(qū)組),所以的區(qū)組構(gòu)成區(qū)組因素。作用(1)可將系統(tǒng)誤差分離出來增加準確度;()可將系統(tǒng)誤差分離出來增加準確度;(2)區(qū)組內(nèi)保證試)區(qū)組內(nèi)保證試驗單元的一致性,增加精確度。驗單元的一致性,增加精確度。nxx/隨機化排列隨機化排列 重重復(fù)復(fù) I重重復(fù)復(fù) IIbcdefgck2ckckheabcfgdaabcdefghck1 1、田間試驗設(shè)計、田間試驗設(shè)計ckabcgedf利用查表或產(chǎn)生隨機數(shù)的方法進行設(shè)計利用查表或產(chǎn)生隨機數(shù)的方法進行設(shè)計ck2五、局部控制五、局部控制1 1、田間試驗設(shè)計、田間試驗設(shè)計abcdefck設(shè)置重復(fù)設(shè)置重復(fù)隨機化排列隨機化排列局

12、部控制局部控制消除系統(tǒng)誤差,消除系統(tǒng)誤差,無偏試驗誤差估計無偏試驗誤差估計估計和降低估計和降低隨機誤差隨機誤差與隨機化結(jié)合與隨機化結(jié)合分離系統(tǒng)誤差分離系統(tǒng)誤差降低隨機誤差降低隨機誤差提高準確度和精確度提高準確度和精確度保證統(tǒng)計推斷的可靠性保證統(tǒng)計推斷的可靠性試驗類型(二) 試驗設(shè)計可以歸納為全面實施試驗和部分實施試試驗設(shè)計可以歸納為全面實施試驗和部分實施試驗兩種類型。驗兩種類型。 全面實施試驗分為順序排列的試驗設(shè)計和隨全面實施試驗分為順序排列的試驗設(shè)計和隨機排列的試驗設(shè)計兩大類。前者常用在處理數(shù)量機排列的試驗設(shè)計兩大類。前者常用在處理數(shù)量大、精確度要求不高、不須作統(tǒng)計推斷的預(yù)備試大、精確度要求

13、不高、不須作統(tǒng)計推斷的預(yù)備試驗,容易發(fā)生系統(tǒng)誤差;后者強調(diào)有合理的試驗驗,容易發(fā)生系統(tǒng)誤差;后者強調(diào)有合理的試驗誤差估計,常用于對精確度要求較高的試驗。誤差估計,常用于對精確度要求較高的試驗。全面實施試驗(全因子試驗)全面實施試驗(全因子試驗)一、順序排列的試驗設(shè)計一、順序排列的試驗設(shè)計1. 對比法設(shè)計(contrast design) 常用于少數(shù)處理試驗及示范性試驗,其試驗單元排列特點是處理單元直接排列在對照區(qū)旁邊,使每一小區(qū)可與其鄰旁的對照區(qū)直接比較。IIIIII1CK23CK 45678CKCK7CK81CK 23456CKCK5CK67CK 81234CKCK2. 間比法設(shè)計(inte

14、rval contrast design) 常用處理試驗單元較多的試驗,要求不高,但用隨機區(qū)組排列有困難的試驗。其試驗單元排列特點是第一個小區(qū)和末尾小區(qū)一定是對照,每二個對照之間排列相同數(shù)目的處理小區(qū),通常是4或9個,重復(fù)24次。CKCKCKCK123456789 10 11 1212個小麥品種的間比法排列個小麥品種的間比法排列二、隨機排列的試驗設(shè)計二、隨機排列的試驗設(shè)計1. 完全隨機設(shè)計(completely random design) 將各個處理隨機分配到各個試驗單元(或小區(qū))中,每一個處理的重復(fù)數(shù)可以相等或不相等。這種設(shè)計靈活機動,單因素和多因素均可使用。2. 隨機區(qū)組設(shè)計(rando

15、mized blocks design)亦稱完全隨機區(qū)組設(shè)計(random complete block design) 根據(jù)局部控制的原則將試驗地劃分為等于重復(fù)次數(shù)的區(qū)組,一個區(qū)組安排一個重復(fù),區(qū)組內(nèi)各處理都獨立隨機排列。主要特點(1)簡單;(2)適應(yīng)性廣;(3)能提供無偏的誤差估計,降低誤差;(4)對試驗地形要求不嚴格;(5)試驗的處理數(shù)目一般不要超過20。74211317368548732164524887566532IIIIIIIV肥力梯度:肥力梯度:8個品種個品種4次重復(fù)的隨機區(qū)組排列次重復(fù)的隨機區(qū)組排列3. 拉丁方設(shè)計(latin square design) 將各個處理從縱橫兩個

16、方向排列為區(qū)組(或重復(fù)),使每一個處理在每一列和每一行中出現(xiàn)的次數(shù)相等(通常一次)。所以它比隨機區(qū)組多一個方向進行局部控制的隨機排列設(shè)計。拉丁方設(shè)計具有雙向控制土壤差異的作用,有較高的精確度,但缺乏伸縮性,適應(yīng)于48個處理的試驗設(shè)計。ABCDEBCDEACDEABDEABCEABCD4. 裂區(qū)設(shè)計(split-plot design) 是多因素試驗的一種設(shè)計形式。先按一個因素設(shè)計主處理小區(qū)(main plot),然后在這個主處理小區(qū)內(nèi)引進第二個因素的各個處理的小區(qū)(副區(qū)或裂區(qū),split-plot)。152541243634362651高高低低中中653231163142465254低低中中高

17、高246532142135461653高高中中低低IIIIII5. 再裂區(qū)設(shè)計(split-split plot design) 若在裂區(qū)試驗中需要引進第三個因素時,可以進一步裂區(qū),將第三個因素的各個處理隨機排列在裂區(qū)內(nèi)。6. 條區(qū)設(shè)計(strip blocks design) 條區(qū)設(shè)計是裂區(qū)設(shè)計的一種衍生設(shè)計,當要研究的兩個因素都需要較大的小區(qū)面積,且為了便于觀察和管理,將每個區(qū)組劃分為縱向長條形小區(qū),安排第一個因素的各個處理,再將各個區(qū)組劃分為若干個橫向長條形小區(qū),安排第二個因素的各個處理。部分實施試驗(部分因子試驗)部分實施試驗(部分因子試驗)正交設(shè)計(正交設(shè)計(orthogonal d

18、esign):):兩個重要的特點:兩個重要的特點:(1)每列中因素各水平數(shù)字出現(xiàn)的次數(shù)相等,即整)每列中因素各水平數(shù)字出現(xiàn)的次數(shù)相等,即整齊可比性;齊可比性;(2)任兩列放在一起,他們的行構(gòu)成一個有序數(shù)對,)任兩列放在一起,他們的行構(gòu)成一個有序數(shù)對,這樣的數(shù)對出現(xiàn)的次數(shù)也相等?;蛘哒f任兩列之間的這樣的數(shù)對出現(xiàn)的次數(shù)也相等?;蛘哒f任兩列之間的所有可能的水平組合都出現(xiàn),且出現(xiàn)的次數(shù)均等。即所有可能的水平組合都出現(xiàn),且出現(xiàn)的次數(shù)均等。即均衡分散性。均衡分散性。 具有這樣特點的數(shù)表稱為正交表。正交表是正交具有這樣特點的數(shù)表稱為正交表。正交表是正交拉丁方的推廣。一般用拉丁方的推廣。一般用LN(mk)表示

19、正交表,表示正交表,N為試為試驗次數(shù);驗次數(shù);k為所能容納的最多因素數(shù);為所能容納的最多因素數(shù);m為每個因素為每個因素的水平數(shù)。如的水平數(shù)。如L8(27)。)。 假設(shè)我們要做一個三因素二水平的試驗,若已知不需要考慮任何假設(shè)我們要做一個三因素二水平的試驗,若已知不需要考慮任何交互作用,可以用交互作用,可以用L4(23)表,)表,但在這種情況下,誤差項但在這種情況下,誤差項Sse分離不出來,分離不出來,無法作統(tǒng)計檢驗,只能直觀比較哪個水平好。若存在交互作用,就會迭無法作統(tǒng)計檢驗,只能直觀比較哪個水平好。若存在交互作用,就會迭加在其它列上,從而得到錯誤的結(jié)果。因此,若不能排除存在交互作用加在其它列上

20、,從而得到錯誤的結(jié)果。因此,若不能排除存在交互作用的可能,則應(yīng)利用的可能,則應(yīng)利用L8(27)表)表。12345671111111121112222312211224122221152121212621221217221122182212112ColRow表頭設(shè)計: 首先將A、B放在第1,2列上,查交互作用表,他們的交互作用AB在第3列,因此,C因素不能放在第3列上,應(yīng)放在第4列上,AC放在第5列上,BC放在第6列上,ABC放在第7列上,真正安排時只用1,2,4列。若ABC不存在,則第7列可作為誤差e,這樣就得到了表頭設(shè)計如下:因素ABABCACBCe列號1234567第二節(jié) 描述性統(tǒng)計一、試

21、驗資料的性質(zhì)與分類一、試驗資料的性質(zhì)與分類1. 數(shù)量性狀資料(數(shù)量性狀資料(quantitative trait) 采用計數(shù)和采用計數(shù)和量測兩種方式所得到的數(shù)據(jù)。量測兩種方式所得到的數(shù)據(jù)。間斷性變數(shù)間斷性變數(shù)Discontinuous or discrete variable連續(xù)性變數(shù)連續(xù)性變數(shù)continuous variable小麥基本苗數(shù)、菌落數(shù)、穗數(shù)、分孽數(shù)等等病斑長度、作物產(chǎn)量、株高、土壤水分含量等等2. 質(zhì)量性狀資料(質(zhì)量性狀資料(qualitative trait) 觀察而不能量觀察而不能量測性狀,如菌落的顏色、麥穗有無芒等等。測性狀,如菌落的顏色、麥穗有無芒等等。統(tǒng)計次數(shù)法統(tǒng)計

22、次數(shù)法給分法給分法統(tǒng)計具有某個性狀的個體數(shù)目及具有不同性狀的個體數(shù)目,按類別計其次數(shù)或相對次數(shù)給予每類性狀以相對數(shù)量的方法,如小麥籽粒有紅白兩種顏色,可用0表示白色,用1表示紅色二、次數(shù)分布表二、次數(shù)分布表 將試驗所得到的大量未加整理的數(shù)據(jù),按觀察值大小將試驗所得到的大量未加整理的數(shù)據(jù),按觀察值大小或數(shù)據(jù)類別進行分組,制成關(guān)于觀察值不同組別或不同分或數(shù)據(jù)類別進行分組,制成關(guān)于觀察值不同組別或不同分類單位的次數(shù)分布表,就可以看出資料中不同表現(xiàn)的觀察類單位的次數(shù)分布表,就可以看出資料中不同表現(xiàn)的觀察值與其頻率間的規(guī)律性,從而對資料有一個初步概念。值與其頻率間的規(guī)律性,從而對資料有一個初步概念。1.

23、 間斷性資料的整理間斷性資料的整理 參見參見 P13 例例2。2. 連續(xù)性資料的整理連續(xù)性資料的整理 參加參加 P14 例例3。3. 屬性變數(shù)資料的整理屬性變數(shù)資料的整理 在整理前,將資料按各種質(zhì)量性狀進行分類,分類數(shù)等在整理前,將資料按各種質(zhì)量性狀進行分類,分類數(shù)等于組數(shù),然后根據(jù)各個體在質(zhì)量屬性上的具體表現(xiàn),分于組數(shù),然后根據(jù)各個體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,即可以得到屬性分布的規(guī)律性認識。別歸入相應(yīng)的組中,即可以得到屬性分布的規(guī)律性認識。三、次數(shù)分圖三、次數(shù)分圖0255075100t MIDPOINT11.11 %22.22 %27.78 %16.67 %22.22 %條

24、形圖(條形圖(bar diagram)適合于間斷性變數(shù)和屬性資料3月0.020.040.060.080.0100.0120.012345673月條形圖(條形圖(bar diagram)適合于間斷性變數(shù)和屬性資料多邊形圖(多邊形圖(polygon)適合于連續(xù)性變數(shù)資料方柱形圖(histogram)適合于連續(xù)性變數(shù)資料2-Jun11-Jun16-Jun22-Jun27-Jun3-Jul餅圖(餅圖(pie diagram)適合于間斷性變數(shù)和屬性資料12月1234567餅圖(餅圖(pie diagram)適合于間斷性變數(shù)和屬性資料四、平均數(shù)四、平均數(shù)1. 算術(shù)平均數(shù)(算術(shù)平均數(shù)(arithmetic

25、mean),Mean2. 中數(shù)(中數(shù)(median)Md3. 眾數(shù)(眾數(shù)(mode),Mo4. 幾何平均數(shù)(幾何平均數(shù)(geometric mean),GnxnxxxG*.*3*2*1算術(shù)平均數(shù)的兩個重要特性:算術(shù)平均數(shù)的兩個重要特性:(1)離均差之和等于零。)離均差之和等于零。0).21()(.)3()2()1()(xnxixnxnxxxxnxxxxxxxxi(2)離均差平方和最小。)離均差平方和最小。設(shè)設(shè)a為任意數(shù),但為任意數(shù),但a不等于不等于x的平均數(shù),則的平均數(shù),則 xa( 為一定量,但 )2222222)(2)()(2)()()()(nxxxxxxxxxxxxax222)()(00

26、xxaxn0樣本平均數(shù)一般用樣本平均數(shù)一般用 表示。表示。n為觀察值的個數(shù)。為觀察值的個數(shù)??傮w平均數(shù)一般用總體平均數(shù)一般用 表示。表示。N為有限總體中觀察值的個數(shù)。為有限總體中觀察值的個數(shù)。Nyi/ )(xnxxi/ )(五、變異數(shù)五、變異數(shù)1. 極差(極差(Range) R=Xmax-Xmin,當,當n10時,常時,常采用采用R來表示資料的變異度。例如兩個小麥品種的來表示資料的變異度。例如兩個小麥品種的每穗小穗數(shù)見下表。每穗小穗數(shù)見下表。品種每穗小穗數(shù)每穗小穗數(shù)總和平均R甲131415171818192122231801810乙16161718181818192020180184 說明甲品

27、種級差較乙品種的大,其變異范圍較大,平說明甲品種級差較乙品種的大,其變異范圍較大,平均數(shù)的代表較差;乙品種的極差較小,其變異幅度較小,均數(shù)的代表較差;乙品種的極差較小,其變異幅度較小,平均數(shù)的代表性較好。平均數(shù)的代表性較好。 極差只是兩個極端數(shù)據(jù)所決定的,沒有充分利用資料極差只是兩個極端數(shù)據(jù)所決定的,沒有充分利用資料的全部信息,所以用它代表整個樣本的變異度是有缺陷的。的全部信息,所以用它代表整個樣本的變異度是有缺陷的。2. 方差或均方(方差或均方(Variance)用觀察值數(shù)目除離均差平方和)用觀察值數(shù)目除離均差平方和(簡稱平方和)。(簡稱平方和)。 樣本均方(樣本均方(S2) 1)(1)(/

28、)(21)(/)(21)(2121)(22222222222222nnxxnnxnxxnnxnnxxnnxnxxxnxxxxnxxis總體方差(總體方差(2)Nxi22)( 方差是根據(jù)全部觀察值來度量資料的變異度的,是方差是根據(jù)全部觀察值來度量資料的變異度的,是能夠正確反映資料的變異度的度量方法。能夠正確反映資料的變異度的度量方法。3. 標準差(標準差(Standard Deviation)是方差的正根值,可)是方差的正根值,可以很好的表示資料的變異度,其單位與觀察值的度量以很好的表示資料的變異度,其單位與觀察值的度量單位相同單位相同。 樣本標準差(樣本標準差(S) 總體標準差(總體標準差()

29、1)(2nxxsiNxi2)(1)(2iiifxxfs自由度(自由度(degree of freedom,所寫為,所寫為DF)解釋之一:解釋之一: 對于一個具有對于一個具有n個觀察值的樣本,每個個觀察值的樣本,每個x與其平均數(shù)比較與其平均數(shù)比較時,雖然具有時,雖然具有n個離均差,但因受到離均差之和等于個離均差,但因受到離均差之和等于0的限制,的限制,所以只能有所以只能有n1個是自由的。個是自由的。 例如:有例如:有5個觀察值,其個觀察值,其4個的離均差為個的離均差為3,2,3,6,則第則第5個離均差必定為個離均差必定為8,才能保證離均差之和等于,才能保證離均差之和等于0。 所以,在估計其他統(tǒng)計

30、數(shù)時,如果該統(tǒng)計數(shù)受所以,在估計其他統(tǒng)計數(shù)時,如果該統(tǒng)計數(shù)受K個條件個條件限制,則其自由度應(yīng)該為限制,則其自由度應(yīng)該為nK。 在應(yīng)用上,小樣本一定要用自由度來估算標準差;若為在應(yīng)用上,小樣本一定要用自由度來估算標準差;若為大樣本,因大樣本,因n和和n1相差較小,可直接用相差較小,可直接用n作除數(shù),但大樣本作除數(shù),但大樣本的界限沒有統(tǒng)一規(guī)定,一般以的界限沒有統(tǒng)一規(guī)定,一般以30以上為大樣本。以上為大樣本。 比較以上兩式可以發(fā)現(xiàn),樣本標準差不以樣本容量比較以上兩式可以發(fā)現(xiàn),樣本標準差不以樣本容量n而以而以n1作為除數(shù)。這是因為通常我們只能掌握樣本資料,作為除數(shù)。這是因為通常我們只能掌握樣本資料,不知道總體平均數(shù)的數(shù)值,不得不用樣本平均數(shù)代替總體不知道總體平均數(shù)的數(shù)值,不得不用樣本平均數(shù)代替總體平均數(shù)。但由于離均差平方和最小,即平均數(shù)。但由于離均差平方和最小,即解釋之二:解釋之二:1)(2nxxisNxi2)(22)()(xxx因此,采用因此,采用 nxxis2)( 計算出的標準差將失之過小。將分母用計算出的標準差將失之過小。將分母用n1代替,可以代替,可以避免偏小的弊病,可以做到對總體標準差的較好的估計。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論