第三章次數(shù)分布和平均數(shù)、變異數(shù)_第1頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第2頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第3頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第4頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章第三章 次數(shù)分布和平均數(shù)、變異數(shù)次數(shù)分布和平均數(shù)、變異數(shù)第一節(jié)第一節(jié) 總體及其樣本總體及其樣本第二節(jié)第二節(jié) 次數(shù)分布次數(shù)分布第三節(jié)第三節(jié) 平均數(shù)平均數(shù)第四節(jié)第四節(jié) 變異數(shù)變異數(shù)第五節(jié)第五節(jié) 理論總體理論總體(群體群體)的平均數(shù)和標(biāo)準(zhǔn)差的平均數(shù)和標(biāo)準(zhǔn)差第一節(jié)第一節(jié) 總體及其樣本總體及其樣本l 總體總體( population )( population ) - 具有共同性質(zhì)的個(gè)體所組成的集團(tuán)具有共同性質(zhì)的個(gè)體所組成的集團(tuán). 有限總體有限總體-總體所包含的個(gè)體數(shù)目有無窮多個(gè)總體所包含的個(gè)體數(shù)目有無窮多個(gè) . 無限總體無限總體-由有限個(gè)個(gè)體構(gòu)成的總體由有限個(gè)個(gè)體構(gòu)成的總體.l 觀察值觀察值(

2、observation )( observation ) -每一個(gè)體的某一性狀、特性的測每一個(gè)體的某一性狀、特性的測定數(shù)值定數(shù)值.l 變數(shù)變數(shù)( variable )( variable ) -觀察值集合起來,稱為總體的變數(shù)。觀察值集合起來,稱為總體的變數(shù)。變數(shù)又稱為隨機(jī)變數(shù)變數(shù)又稱為隨機(jī)變數(shù)(random variable)。 l樣本樣本( sample )( sample ) -從總體中抽取若干個(gè)個(gè)體的集合稱為樣從總體中抽取若干個(gè)個(gè)體的集合稱為樣本本(sample)。l統(tǒng)計(jì)數(shù)統(tǒng)計(jì)數(shù)( statistic )( statistic ) -測定樣本中的各個(gè)體而得的樣本特征測定樣本中的各個(gè)體而得

3、的樣本特征數(shù),如平均數(shù)等,稱為統(tǒng)計(jì)數(shù)數(shù),如平均數(shù)等,稱為統(tǒng)計(jì)數(shù)(statistic)。l隨機(jī)樣本隨機(jī)樣本( random sample )( random sample ) -從總體中隨機(jī)抽取的樣本稱從總體中隨機(jī)抽取的樣本稱為隨機(jī)樣本為隨機(jī)樣本(random sample) l樣本容量樣本容量 ( sample size )( sample size ) -樣本中包含的個(gè)體數(shù)稱為樣本樣本中包含的個(gè)體數(shù)稱為樣本容量或樣本含量容量或樣本含量(sample size) 第二節(jié)第二節(jié) 次數(shù)分布次數(shù)分布一、試驗(yàn)資料的性質(zhì)與分類一、試驗(yàn)資料的性質(zhì)與分類二、次數(shù)分布表二、次數(shù)分布表三、次數(shù)分布圖三、次數(shù)分布

4、圖一、試驗(yàn)資料的性質(zhì)與分類一、試驗(yàn)資料的性質(zhì)與分類(一一) 數(shù)量性狀資料數(shù)量性狀資料(二二) 質(zhì)量性狀資料質(zhì)量性狀資料(一一) 數(shù)量性狀資料數(shù)量性狀資料 數(shù)量性狀數(shù)量性狀(quantitative trait)的度量有計(jì)數(shù)和量測兩種的度量有計(jì)數(shù)和量測兩種方式,其所得變數(shù)不同。方式,其所得變數(shù)不同。 1. 不連續(xù)性或間斷性變數(shù)不連續(xù)性或間斷性變數(shù)( discontinuous or discrete ( discontinuous or discrete variable )variable ) 指用計(jì)數(shù)方法獲得的數(shù)據(jù)指用計(jì)數(shù)方法獲得的數(shù)據(jù)。 2. 連續(xù)性變數(shù)連續(xù)性變數(shù)( continuous

5、variable )( continuous variable ) 指稱量、度量或測指稱量、度量或測量方法所得到的數(shù)據(jù),其各個(gè)觀察值并不限于整數(shù),在兩個(gè)量方法所得到的數(shù)據(jù),其各個(gè)觀察值并不限于整數(shù),在兩個(gè)數(shù)值之間可以有微量數(shù)值差異的第三個(gè)數(shù)值存在。數(shù)值之間可以有微量數(shù)值差異的第三個(gè)數(shù)值存在。 (二二) 質(zhì)量性狀資料質(zhì)量性狀資料 質(zhì)量性狀質(zhì)量性狀( qualitative trait )( qualitative trait )指能觀察而不能量測的狀指能觀察而不能量測的狀即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的有無、絨毛的有無等。要從這類性

6、狀獲得數(shù)量資料,可有無、絨毛的有無等。要從這類性狀獲得數(shù)量資料,可采用下列兩種方法:采用下列兩種方法: 統(tǒng)計(jì)次數(shù)法統(tǒng)計(jì)次數(shù)法 于一定總體或樣本內(nèi),統(tǒng)計(jì)其具有某個(gè)性于一定總體或樣本內(nèi),統(tǒng)計(jì)其具有某個(gè)性狀的個(gè)體數(shù)目及具有不同性狀的個(gè)體數(shù)目,按類別計(jì)其狀的個(gè)體數(shù)目及具有不同性狀的個(gè)體數(shù)目,按類別計(jì)其次數(shù)或相對次數(shù)。次數(shù)或相對次數(shù)。 2. 給分法給分法 給予每類性狀以相對數(shù)量的方法給予每類性狀以相對數(shù)量的方法二、次數(shù)分布表二、次數(shù)分布表(一一) 間斷性變數(shù)資料的整理間斷性變數(shù)資料的整理(二二) 連續(xù)性變數(shù)資料的整理連續(xù)性變數(shù)資料的整理(三三) 屬性變數(shù)資料的整理屬性變數(shù)資料的整理(一一) 間斷性變數(shù)資

7、料的整理間斷性變數(shù)資料的整理 現(xiàn)以某小麥品種的每穗小穗數(shù)為例,隨機(jī)采取現(xiàn)以某小麥品種的每穗小穗數(shù)為例,隨機(jī)采取100個(gè)麥穗,計(jì)數(shù)每穗小穗數(shù),未加整理的資料列個(gè)麥穗,計(jì)數(shù)每穗小穗數(shù),未加整理的資料列成表成表3.1。 表3.1 100個(gè)麥穗的每穗小穗數(shù)18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819

8、171615161817181717161917每穗小穗數(shù)每穗小穗數(shù)( y )次數(shù)次數(shù)( f )1561615173218251917205總次數(shù)總次數(shù)( n )100表表3.2 100個(gè)麥穗每穗小個(gè)麥穗每穗小穗數(shù)的次數(shù)分布表穗數(shù)的次數(shù)分布表 從表從表3.2中看到,一堆雜亂的原中看到,一堆雜亂的原始資料表始資料表3.1,經(jīng)初步整理后,就,經(jīng)初步整理后,就可了解資料的大致情況,另外,經(jīng)可了解資料的大致情況,另外,經(jīng)過整理的資料也便于進(jìn)一步的分析。過整理的資料也便于進(jìn)一步的分析。 上述資料為間斷性變數(shù)資料,上述資料為間斷性變數(shù)資料,每穗小穗數(shù)在每穗小穗數(shù)在1520的范圍內(nèi)變動(dòng),的范圍內(nèi)變動(dòng),把所有

9、觀察值按每穗小穗數(shù)多少加把所有觀察值按每穗小穗數(shù)多少加以歸類,共分為以歸類,共分為6組,組與組間相差組,組與組間相差為為1小穗,稱為小穗,稱為組距組距。這樣可得表。這樣可得表3.2形式的次數(shù)分布表。形式的次數(shù)分布表。(二二) 連續(xù)性變數(shù)資料的整理連續(xù)性變數(shù)資料的整理茲以表茲以表3.4的的100行水稻試驗(yàn)的產(chǎn)量為例,說明整理方法。行水稻試驗(yàn)的產(chǎn)量為例,說明整理方法。177 215 197 97123 159 245 119119 131 149 152 167 104161 214 125 175 219 118 192 176 175 95136 199 116 165214 95158831

10、37 80138 151 187 126 196 134 206 137 98 97129 143 179 174 159 165 136 108 101 141 148 168163 176 102 194 145 173 75130 149 150 161 155111158131 189 91142 140 154 152 163 123 205 149 155 131 209183 97119 181 149 187 131 215111186 118 150 155 197116 254 239 160 172 179 151 198 124 179 135 184 168 1691

11、73 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 159 177 147 194 227 141 169 124 159表表3.4 140行水稻產(chǎn)量行水稻產(chǎn)量(單位:克單位:克) 具體步驟:具體步驟: 1. 數(shù)據(jù)排序數(shù)據(jù)排序(sort)(sort) 首先對數(shù)據(jù)按從小到大排列首先對數(shù)據(jù)按從小到大排列(升序升序)或從大到小排列或從大到小排列(降序降序)。 2. 求極差求極差(range)(range) 所有數(shù)據(jù)中的最大觀察值和最小所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱為觀察值的差數(shù),稱為極差極差

12、,亦即整個(gè)樣本的變異幅度。,亦即整個(gè)樣本的變異幅度。從表從表3.4中查到最大觀察值為中查到最大觀察值為254g,最小觀察值為,最小觀察值為75g,極差為極差為25475=179g。 3. 確定組數(shù)和組距確定組數(shù)和組距( class interval )( class interval ) 根據(jù)極差分為若根據(jù)極差分為若干組,每組的距離相等,稱為干組,每組的距離相等,稱為組距組距。 在確定組數(shù)和組距在確定組數(shù)和組距時(shí)應(yīng)考慮:時(shí)應(yīng)考慮: (1)觀察值個(gè)數(shù)的多少;觀察值個(gè)數(shù)的多少; (2)極差的大??;極差的大??; (3)便于計(jì)算;便于計(jì)算; (4)能反映出資料的真實(shí)面貌等方面。能反映出資料的真實(shí)面貌等

13、方面。 樣本大小樣本大小(即樣本內(nèi)包含觀察值的個(gè)數(shù)的多少即樣本內(nèi)包含觀察值的個(gè)數(shù)的多少)與組與組數(shù)多少的關(guān)系可參照數(shù)多少的關(guān)系可參照表表3.5來確定。來確定。表3.5樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個(gè)數(shù)分組時(shí)的組數(shù)50 510100 81620010203001224500153010002040 組數(shù)確定后,還須組數(shù)確定后,還須確定組距。組距確定組距。組距=極差極差/組數(shù)。以表組數(shù)。以表3.4中中140行行水稻產(chǎn)量為例,樣本內(nèi)水稻產(chǎn)量為例,樣本內(nèi)觀察值的個(gè)數(shù)為觀察值的個(gè)數(shù)為140,查表查表3.5可分為可分為816組,組,假定分為假定分為12組,組,則組距為則組距為179/12=14.9

14、g,為分組方便起見,可以,為分組方便起見,可以15g作為組距。作為組距。 4. 選定組限選定組限( class limit )( class limit )和組中點(diǎn)值和組中點(diǎn)值( ( 組值,組值,class value )class value ) 以表以表3.4中中140行水稻產(chǎn)量為例,選定第一組的中點(diǎn)行水稻產(chǎn)量為例,選定第一組的中點(diǎn)值為值為75g,與最小觀察值,與最小觀察值75g相等;則第二組的中點(diǎn)值為相等;則第二組的中點(diǎn)值為75+15=90g,余類推。,余類推。 各組的中點(diǎn)值選定后,就可以求得各組組限。每組各組的中點(diǎn)值選定后,就可以求得各組組限。每組有兩個(gè)組限,數(shù)值小的稱為有兩個(gè)組限,數(shù)

15、值小的稱為下限下限( lower limit )( lower limit ),數(shù)值大的,數(shù)值大的稱為稱為上限上限( upper limit )( upper limit )。上述資料中,第一組的下限為該。上述資料中,第一組的下限為該組中點(diǎn)值減去組中點(diǎn)值減去1/2組距,即組距,即75(15/2)=67.5g,上限為中,上限為中點(diǎn)值加點(diǎn)值加1/2組距,即組距,即75+(15/2)=82.5g。故第一組的組限為。故第一組的組限為67.582.5g。按照此法計(jì)算其余各組的組限,就可寫出。按照此法計(jì)算其余各組的組限,就可寫出分組數(shù)列。分組數(shù)列。 5. 把原始資料的各個(gè)觀察值按分組數(shù)列的各組組限歸組把原

16、始資料的各個(gè)觀察值按分組數(shù)列的各組組限歸組 可按原始資料中各觀察值的次序,逐個(gè)把數(shù)值歸于各可按原始資料中各觀察值的次序,逐個(gè)把數(shù)值歸于各組。組。 待全部觀察值歸組后,即可求得各組的次數(shù),制成一待全部觀察值歸組后,即可求得各組的次數(shù),制成一個(gè)次數(shù)分布表。個(gè)次數(shù)分布表。 例如表例如表3.4中第一個(gè)觀察值中第一個(gè)觀察值177應(yīng)歸于表應(yīng)歸于表3.6中第中第8組,組,組限為組限為172.5187.5;第二個(gè)觀察值;第二個(gè)觀察值149應(yīng)歸于第應(yīng)歸于第6組,組組,組限為限為142.5157.5;。依次把。依次把140個(gè)觀察值都進(jìn)行歸個(gè)觀察值都進(jìn)行歸組,即可制成組,即可制成140行水稻產(chǎn)量的次數(shù)分布表行水稻產(chǎn)

17、量的次數(shù)分布表(表表3.6)。表3.6 140行水稻的次數(shù)分布組組 限限中點(diǎn)值中點(diǎn)值( y )次數(shù)次數(shù)( f ) 67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.513517142.5157.515020157.5172.516525172.5187.518021187.5202.519513202.5217.52109217.5232.52253232.5247.52402247.5262.52551合計(jì)合計(jì)( n )140 注注:前面提到分為前面提到分為12組,組,但由于第一組的中點(diǎn)值接近但由于第一組的中點(diǎn)值接近

18、于最小觀察值,故第一組的于最小觀察值,故第一組的下限小于最小觀察值,實(shí)際下限小于最小觀察值,實(shí)際上差不多增加了上差不多增加了1/2組;這樣組;這樣也使最后一組的中點(diǎn)值接近也使最后一組的中點(diǎn)值接近于最大值,又增加了于最大值,又增加了1/2組,組,故實(shí)際的組數(shù)比原來確定的故實(shí)際的組數(shù)比原來確定的要多一個(gè)組,為要多一個(gè)組,為13組。組。 (三三) 屬性變數(shù)資料的整理屬性變數(shù)資料的整理 屬性變數(shù)的資料,也可以用類屬性變數(shù)的資料,也可以用類似次數(shù)分布的方法來整理。似次數(shù)分布的方法來整理。在整理前,把資料按各種質(zhì)量性在整理前,把資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等于組數(shù),狀進(jìn)行分類,分類數(shù)等于組數(shù),然后根

19、據(jù)各個(gè)體在質(zhì)量屬性上的然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,具體表現(xiàn),分別歸入相應(yīng)的組中,即可得到屬性分布的規(guī)律性認(rèn)識。即可得到屬性分布的規(guī)律性認(rèn)識。例如,某水稻雜種第二代植株例如,某水稻雜種第二代植株米粒性狀的分離情況,歸于表米粒性狀的分離情況,歸于表3.7。表3.7 水稻雜種二代植株 米粒性狀的分離情況屬性分組屬性分組( y )次數(shù)次數(shù)( f )紅米非糯紅米非糯96紅米糯稻紅米糯稻37白米非糯白米非糯31白米糯稻白米糯稻15合計(jì)合計(jì)( n )179三、次數(shù)分布圖三、次數(shù)分布圖(一一) 方柱形圖方柱形圖(二二) 多邊形圖多邊形圖(三三) 條形圖條形圖 (四四) 餅圖餅圖

20、(一一) 方柱形圖方柱形圖方柱形圖方柱形圖( histogram )( histogram )適用于表示連續(xù)性變數(shù)的次數(shù)分布。適用于表示連續(xù)性變數(shù)的次數(shù)分布。607590105 120 135 150 165 180 195 210 225 240 255 270510152025y(產(chǎn)量 ,克 /行 ) 現(xiàn)以表現(xiàn)以表3.6的的140行水稻產(chǎn)量的次數(shù)行水稻產(chǎn)量的次數(shù)分布表為例加以說分布表為例加以說明。即成方柱形次明。即成方柱形次數(shù)分布圖數(shù)分布圖3.1。圖圖3.1 140行水稻產(chǎn)量次數(shù)分布方柱形圖行水稻產(chǎn)量次數(shù)分布方柱形圖(二二) 多邊形圖多邊形圖 多邊形圖多邊形圖( polygon )( po

21、lygon )也是表示連續(xù)性變數(shù)資料的一種普也是表示連續(xù)性變數(shù)資料的一種普通的方法,且在同一圖上可比較兩組以上的資料。通的方法,且在同一圖上可比較兩組以上的資料。607590 105 120 135 150 165 180 195 210 225 240 255 270051015202530y(產(chǎn)量 ,克 /行 ) 仍以仍以140行水稻產(chǎn)量次行水稻產(chǎn)量次數(shù)分布為例,所成圖形即數(shù)分布為例,所成圖形即為次數(shù)多邊形圖為次數(shù)多邊形圖(圖圖3.2)。圖圖3.2 140行水稻產(chǎn)量次數(shù)分布多邊形圖行水稻產(chǎn)量次數(shù)分布多邊形圖(三三) 條形圖條形圖 條形圖條形圖(bar)(bar)適用于間斷性變數(shù)和屬性變數(shù)資

22、料,用以適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中點(diǎn)值或分類性狀,縱軸標(biāo)出次數(shù)。點(diǎn)值或分類性狀,縱軸標(biāo)出次數(shù)。020406080100120紅米非糯紅米糯稻白米非糯白米糯稻f 現(xiàn)以表現(xiàn)以表3.7水稻雜種第二水稻雜種第二代米粒性狀的分離情況為例,代米粒性狀的分離情況為例,可畫成水稻雜種第二代植株可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖種米粒性狀分離情況條形圖(3.3)。圖圖3.3 水稻水稻F2代米粒性狀分離條形圖代米粒性狀分離條形圖 (四四) 餅圖餅圖 餅圖餅圖( pie )( pie )適用

23、于間斷性變數(shù)和屬性變數(shù)資料,用以表適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個(gè)示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個(gè)數(shù)中的百分比。數(shù)中的百分比。 如圖如圖3.4中白米糯稻在中白米糯稻在F2群體中占群體中占8%,白米非糯、,白米非糯、紅米糯稻和紅米非糯分別紅米糯稻和紅米非糯分別占占17%、21%和和54%。紅米非糯54%紅米糯稻21%白米非糯17%白米糯稻8%圖3.4 水稻F2代米粒性狀分離的餅圖第三節(jié)第三節(jié) 平均數(shù)平均數(shù)一、平均數(shù)的意義和種類一、平均數(shù)的意義和種類二、算術(shù)平均數(shù)的計(jì)算方法二、算術(shù)平均數(shù)的計(jì)算方法三、算術(shù)平均數(shù)的重要特性

24、三、算術(shù)平均數(shù)的重要特性四、總體平均數(shù)四、總體平均數(shù)一、平均數(shù)的意義和種類一、平均數(shù)的意義和種類 平均數(shù)的意義平均數(shù)的意義: 平均數(shù)平均數(shù)( average )( average )是數(shù)據(jù)的代表值,表示資料中是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。一組資料相比較,借以明確二者之間相差的情況。 平均數(shù)的種類平均數(shù)的種類 : (1) 算術(shù)平均數(shù)算術(shù)平均數(shù) 一個(gè)數(shù)量資料中各個(gè)觀察值的總和一個(gè)數(shù)量資料中各個(gè)觀察值的總和除以觀察值個(gè)數(shù)所得的商數(shù),稱為除以觀察值個(gè)數(shù)所得的商數(shù),稱為算術(shù)平均

25、數(shù)算術(shù)平均數(shù)( arithmetic ( arithmetic mean )mean ),記作,記作 。因其應(yīng)用廣泛,常簡稱平均數(shù)或均數(shù)。因其應(yīng)用廣泛,常簡稱平均數(shù)或均數(shù)(mean)。均數(shù)的大小決定于樣本的各觀察值。均數(shù)的大小決定于樣本的各觀察值。 (2) 中數(shù)中數(shù) 將資料內(nèi)所有觀察值從大到小排序,居中間將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱為位置的觀察值稱為中數(shù)中數(shù)( median )( median ),計(jì)作,計(jì)作Md。如觀察值個(gè)。如觀察值個(gè)數(shù)為偶數(shù),則以中間二個(gè)觀察值的算術(shù)平均數(shù)為中數(shù)。數(shù)為偶數(shù),則以中間二個(gè)觀察值的算術(shù)平均數(shù)為中數(shù)。y (3) 眾數(shù)眾數(shù) 資料中最常見的一數(shù)

26、,或次數(shù)最多一組的中資料中最常見的一數(shù),或次數(shù)最多一組的中點(diǎn)值,稱為點(diǎn)值,稱為眾數(shù)眾數(shù)( mode )( mode ),計(jì)作,計(jì)作MO。如棉花纖維檢驗(yàn)時(shí)所。如棉花纖維檢驗(yàn)時(shí)所用的主體長度即為眾數(shù)。用的主體長度即為眾數(shù)。 (4) 幾何平均數(shù)幾何平均數(shù) 如有如有n個(gè)觀察值,其相乘積開個(gè)觀察值,其相乘積開n次方,次方,即為即為幾何平均數(shù)幾何平均數(shù)( geometric mean )( geometric mean ),用,用G代表。代表。nnnnyyyyyyyyG/1321321)( (31) 平均數(shù)的種類平均數(shù)的種類 :二、算術(shù)平均數(shù)的計(jì)算方法二、算術(shù)平均數(shù)的計(jì)算方法 若樣本較小,即資料包含的觀察

27、值個(gè)數(shù)不多,可直接若樣本較小,即資料包含的觀察值個(gè)數(shù)不多,可直接計(jì)算平均數(shù)。設(shè)一個(gè)含有計(jì)算平均數(shù)。設(shè)一個(gè)含有n個(gè)觀察值的樣本,其各個(gè)觀察個(gè)觀察值的樣本,其各個(gè)觀察值為值為y1、y2、y3、yn,則算術(shù)平均數(shù)由下式算得:,則算術(shù)平均數(shù)由下式算得:nynyyyyyniin1321(32) 若樣本較大,且已進(jìn)行了分組若樣本較大,且已進(jìn)行了分組(如表如表3.6),可采用加權(quán),可采用加權(quán)法計(jì)算算術(shù)平均數(shù),即用組中點(diǎn)值代表該組出現(xiàn)的觀測值法計(jì)算算術(shù)平均數(shù),即用組中點(diǎn)值代表該組出現(xiàn)的觀測值以計(jì)算平均數(shù),其公式為以計(jì)算平均數(shù),其公式為nfyfyfyiii(33) 其中其中yi 為第為第i 組中點(diǎn)值,組中點(diǎn)值,

28、fi 為第為第 i 組變數(shù)出現(xiàn)次數(shù)。組變數(shù)出現(xiàn)次數(shù)。 例例3.1 在水稻品種比較試驗(yàn)中,湘矮早四號的在水稻品種比較試驗(yàn)中,湘矮早四號的5個(gè)小區(qū)個(gè)小區(qū)產(chǎn)量分別為產(chǎn)量分別為20.0、19.0、21.0、17.5、18.5kg,求該品種的,求該品種的小區(qū)平均產(chǎn)量。小區(qū)平均產(chǎn)量。 例例3.2 利用表利用表3.6資料計(jì)算平均每行水稻產(chǎn)量。資料計(jì)算平均每行水稻產(chǎn)量。若采用直接法,若采用直接法, =157.47。因此,兩者的結(jié)果十分相近。因此,兩者的結(jié)果十分相近。)(2195518517021019020kg.nyy由由(32)有有)(93157140221101402551907752g.nfyyy三、算

29、術(shù)平均數(shù)的重要特性三、算術(shù)平均數(shù)的重要特性 (1) 樣本各觀察值與其平均數(shù)的差數(shù)樣本各觀察值與其平均數(shù)的差數(shù)(簡稱離均差,簡稱離均差,deviation from mean)的總和等于的總和等于0。即:。即: 0)()(1yyyyinii (2) 樣本各觀察值與其平均數(shù)的差數(shù)平方的總和,較各樣本各觀察值與其平均數(shù)的差數(shù)平方的總和,較各個(gè)觀察值與任意其他數(shù)值的差數(shù)平方的總和為小,亦即離均個(gè)觀察值與任意其他數(shù)值的差數(shù)平方的總和為小,亦即離均差平方的總和最小。這個(gè)問題可作這樣的說明,設(shè)差平方的總和最小。這個(gè)問題可作這樣的說明,設(shè)Q為各個(gè)為各個(gè)觀察值與任意數(shù)值觀察值與任意數(shù)值a的差數(shù)平方的總和,即:的

30、差數(shù)平方的總和,即:niiayQ12)(對此對此Q求最小值,可得使求最小值,可得使Q最小的最小的a 值為平均數(shù)。值為平均數(shù)。四、總體平均數(shù)四、總體平均數(shù) 總體平均數(shù)用總體平均數(shù)用 來代表,它同樣具有算術(shù)平均數(shù)所具有來代表,它同樣具有算術(shù)平均數(shù)所具有的特性。的特性。NyNii 1(34) 上式上式y(tǒng)i 代表各個(gè)觀察值,代表各個(gè)觀察值,N代表有限總體所包含的個(gè)體代表有限總體所包含的個(gè)體數(shù),數(shù), 表示總體內(nèi)各個(gè)觀察值的總和。表示總體內(nèi)各個(gè)觀察值的總和。Niiy1第四節(jié)第四節(jié) 變異數(shù)變異數(shù)一、極差一、極差二、方差二、方差三、標(biāo)準(zhǔn)差三、標(biāo)準(zhǔn)差四、變異系數(shù)四、變異系數(shù)一、極一、極 差差 極差極差( ran

31、ge )( range ),又稱,又稱全距全距,記作,記作R,是資料中最大觀察,是資料中最大觀察值與最小觀察值的差數(shù)。例如調(diào)查兩個(gè)小麥品種的每穗小值與最小觀察值的差數(shù)。例如調(diào)查兩個(gè)小麥品種的每穗小穗數(shù),每品種計(jì)數(shù)穗數(shù),每品種計(jì)數(shù)10個(gè)麥穗,經(jīng)整理后的數(shù)字列于表個(gè)麥穗,經(jīng)整理后的數(shù)字列于表3.8。表表3.8 兩個(gè)小麥品種的每穗小穗數(shù)兩個(gè)小麥品種的每穗小穗數(shù)品種名稱品種名稱每穗小穗數(shù)每穗小穗數(shù)總和總和平均平均甲甲13 14 15 17 18 18 19 21 22 2318018乙乙16 16 17 18 18 18 18 19 20 2018018 表表3.8資料中,甲品種每穗小穗數(shù)最少為資料中

32、,甲品種每穗小穗數(shù)最少為13個(gè),最多個(gè),最多為為23個(gè),個(gè),R=2313=10個(gè)小穗;乙品種每穗小穗數(shù)最少個(gè)小穗;乙品種每穗小穗數(shù)最少為為16個(gè),最多為個(gè),最多為20個(gè),個(gè),R=2016=4個(gè)小穗。個(gè)小穗。 可以看出,兩品種的平均每穗小穗數(shù)雖同為可以看出,兩品種的平均每穗小穗數(shù)雖同為18個(gè),但個(gè),但甲品種的極差較大,其變異范圍較大,平均數(shù)的代表性較甲品種的極差較大,其變異范圍較大,平均數(shù)的代表性較差;乙品種的極差較小,其變異幅度較小,其平均數(shù)代表差;乙品種的極差較小,其變異幅度較小,其平均數(shù)代表性較好。性較好。二、方二、方 差差離均差平方和離均差平方和( (簡稱平方和簡稱平方和) )SS -將

33、各個(gè)離均差平方后相加將各個(gè)離均差平方后相加樣本樣本SS= 2)( yyi (35) 總體總體SS= 2)(iy(36)均方或方差均方或方差(variance)(variance) -用觀察值數(shù)目來除平方和用觀察值數(shù)目來除平方和 樣本均方樣本均方(mean square)(mean square)用用s2表示,定義為:表示,定義為: 總體方差總體方差用用 表示,定義為:表示,定義為: 2NyNi122)(樣本均方是總體方差的無偏估計(jì)值樣本均方是總體方差的無偏估計(jì)值 1122nyysni)(三、標(biāo)準(zhǔn)差三、標(biāo)準(zhǔn)差(一一) 標(biāo)準(zhǔn)差的定義標(biāo)準(zhǔn)差的定義 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差為方差的正平方根值,用以表示資料的變異度

34、為方差的正平方根值,用以表示資料的變異度,其單位與觀察值的度量單位相同。從樣本資料計(jì)算標(biāo)準(zhǔn)差的其單位與觀察值的度量單位相同。從樣本資料計(jì)算標(biāo)準(zhǔn)差的公式為:公式為:1)(2nyys(39)總體標(biāo)準(zhǔn)差用表示:總體標(biāo)準(zhǔn)差用表示:Ny2)(310)樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計(jì)值。樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計(jì)值。 (二二) 自由度的意義自由度的意義 自由度記作自由度記作DF,其具體數(shù)值則常用,其具體數(shù)值則常用 表示。表示。統(tǒng)計(jì)意義統(tǒng)計(jì)意義:是指樣本內(nèi)獨(dú)立而能自由變動(dòng)的離均差個(gè)數(shù)。:是指樣本內(nèi)獨(dú)立而能自由變動(dòng)的離均差個(gè)數(shù)。kn 例如一個(gè)有例如一個(gè)有5個(gè)觀察值的樣本,因?yàn)槭芙y(tǒng)計(jì)數(shù)的約束,在個(gè)觀察值的樣本,因

35、為受統(tǒng)計(jì)數(shù)的約束,在5個(gè)離均差中,只有個(gè)離均差中,只有4個(gè)數(shù)值可以在一定范圍之內(nèi)自由變動(dòng)取個(gè)數(shù)值可以在一定范圍之內(nèi)自由變動(dòng)取值,而第五個(gè)離均差必須滿足。如一樣本為值,而第五個(gè)離均差必須滿足。如一樣本為(3,4,5,6,7),平均數(shù)為),平均數(shù)為5,前,前個(gè)離差為個(gè)離差為2 ,1,0和和1,則第,則第5個(gè)離個(gè)離均差為前均差為前4個(gè)離均差之和的變號數(shù),即個(gè)離均差之和的變號數(shù),即( 2)=2。一般地,。一般地,樣本自由度等于觀察值的個(gè)數(shù)樣本自由度等于觀察值的個(gè)數(shù)(n)減去約束條件的個(gè)數(shù)減去約束條件的個(gè)數(shù)(k),即即 。 注:注:比較比較(39)和和(310),樣本標(biāo)準(zhǔn)差不以樣本容量,樣本標(biāo)準(zhǔn)差不以樣

36、本容量n,而以自由度而以自由度n1作為除數(shù),這是因?yàn)橥ǔK莆盏氖菢颖咀鳛槌龜?shù),這是因?yàn)橥ǔK莆盏氖菢颖举Y料,不知資料,不知 的數(shù)值,不得不用樣本平均數(shù)的數(shù)值,不得不用樣本平均數(shù) 代替代替 。 與與 有差異,由算術(shù)平均數(shù)的性質(zhì)有差異,由算術(shù)平均數(shù)的性質(zhì)(2)可知,可知, 比比 小。因此,由小。因此,由 算出的標(biāo)準(zhǔn)差將偏小。如分母算出的標(biāo)準(zhǔn)差將偏小。如分母用用n1代替,則可免除偏小的弊病。數(shù)理統(tǒng)計(jì)上可以證明代替,則可免除偏小的弊病。數(shù)理統(tǒng)計(jì)上可以證明用自由度作除數(shù)計(jì)算標(biāo)準(zhǔn)差的無偏性。用自由度作除數(shù)計(jì)算標(biāo)準(zhǔn)差的無偏性。yy2)( yy2)(ynyy/)(2(三三) 標(biāo)準(zhǔn)差的計(jì)算方法標(biāo)準(zhǔn)差的計(jì)算方

37、法 1. 直接法直接法 可按可按 計(jì)算,分四個(gè)步驟:計(jì)算,分四個(gè)步驟:yyy 2)(yy 2)(yy 1)(2nyys (1)先求出先求出 , (2)再求出各個(gè)再求出各個(gè) 和各個(gè)和各個(gè) , (3)求和得求和得 , (4) 代入代入 算得標(biāo)準(zhǔn)差。算得標(biāo)準(zhǔn)差。1)(2nyys 例例3.3 設(shè)某一水稻單株粒重的樣本有設(shè)某一水稻單株粒重的樣本有5個(gè)觀察值,個(gè)觀察值,以克為單位,其數(shù)為以克為單位,其數(shù)為2、8、7、5、4(用用y代表代表),按照上,按照上述步驟,由表述步驟,由表3.9可算得平方和為可算得平方和為22.80,把它代入,把它代入 即可得到:即可得到:這就是該水稻單株粒重的標(biāo)準(zhǔn)差為這就是該水稻

38、單株粒重的標(biāo)準(zhǔn)差為2.39g。1)(2nyys)(3921580221)(2g.nyysyy 2)(yy 計(jì)算項(xiàng)目yy223.210.24482.87.846471.83.244950.20.042541.21.4416總和26022.80158平均5.2表表3.9 水稻粒重的平方和的計(jì)算水稻粒重的平方和的計(jì)算2 矯正數(shù)法矯正數(shù)法 經(jīng)過轉(zhuǎn)換可得經(jīng)過轉(zhuǎn)換可得 (311)其中其中 項(xiàng)稱為矯正數(shù),記作項(xiàng)稱為矯正數(shù),記作C。 ny2)( 在例在例3.3中,于表中,于表3.9第第5列寫出各觀察值的平方值,將列寫出各觀察值的平方值,將有關(guān)數(shù)字代入有關(guān)數(shù)字代入(311)即有:即有:其結(jié)果和直接法算得相同。其

39、結(jié)果和直接法算得相同。1)(2nyys122nnyys)()(392155)26(1581)(222g.nnyys3 加權(quán)法加權(quán)法 若樣本較大,并已獲得如表若樣本較大,并已獲得如表3.6的次數(shù)分布表,可采用加的次數(shù)分布表,可采用加權(quán)法計(jì)算標(biāo)準(zhǔn)差,其公式為:權(quán)法計(jì)算標(biāo)準(zhǔn)差,其公式為:1)(1)(nnyfyffyyfsiiiiiii222(312) 組組 限限中點(diǎn)值中點(diǎn)值( y )次數(shù)次數(shù)( f ) 67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.513517142.5157.515020157.5172.516525172.5187.518021187.5202.519

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論