平均數標準差和變異系數_第1頁
平均數標準差和變異系數_第2頁
平均數標準差和變異系數_第3頁
平均數標準差和變異系數_第4頁
平均數標準差和變異系數_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于平均數標準差與變異系數第一張,PPT共三十五頁,創(chuàng)作于2022年6月數據有兩種變化趨勢:集中趨勢和離散趨勢。表示數據集中趨勢的指標有多個,如平均數(算術平均數、幾何平均數)、中位數、眾數,使用最多的是算術平均數。表示數據離散趨勢的指標有多個,如極差、平均離差、方差與標準差,使用最多的是方差與標準差。第二張,PPT共三十五頁,創(chuàng)作于2022年6月資料中各觀察值的總和除以觀察值的個數所得的商,稱為算術平均數,簡稱為平均數或均數。用符號 表示。 平均數的意義: 平均數用來描述資料的集中性,即指出資料中數據集中較多的中心位置,常用于同類性質資料間的相互比較。一、集中趨勢第三張,PPT共三十五頁,創(chuàng)

2、作于2022年6月計算方法1. 直接法 適用于樣本含量較小的非頻數資料如果一個含量為n的樣本,其n個觀察值分別用x1、x2xn表示,則它們的平均數為其中,(Sigma)為總和符號, 表示從第一個觀察值x1累加到第n個觀察值xn,若在意義上已明確時,簡記為x。第四張,PPT共三十五頁,創(chuàng)作于2022年6月常數的總和等于該常數的n倍,即代數和的總和等于總和的代數和,即總和符號內的常數因子可以提取到總和符號之外,即其中C為常數(a為常數)關于總和符號的幾個性質第五張,PPT共三十五頁,創(chuàng)作于2022年6月2. 加權法如果樣本中有n1個x1,有n2個x2,那么,n1+n2個數的平均數是加權平均數。同理

3、:各組的次數 fi 是權衡各組中值 xi在資料中所占比重大小的數量,因此f被稱為是x的“權”,加權法也由此而得名。第六張,PPT共三十五頁,創(chuàng)作于2022年6月在計算離散型頻數資料的平均數時,式中x為組值,f為頻數,N為總頻數(f),k為組數。第七張,PPT共三十五頁,創(chuàng)作于2022年6月 表3-150只小雞出殼天數的頻數分布表第八張,PPT共三十五頁,創(chuàng)作于2022年6月在計算連續(xù)型頻數資料的平均數時,式中m為組中值,f、N和k同上式。第九張,PPT共三十五頁,創(chuàng)作于2022年6月組 別組中值m頻數(f)fm44.2545.029045.7546.529347.2548.01048048.7

4、549.51259450.2551.026132651.7552.544231053.2554.043232254.7555.5291609.556.2557.01162757.7558.515877.559.2560.0212060.7561.54246合計20010695表3-2 某純系蛋雞200枚蛋重的頻數分布表 =10695/200 =53.475第十張,PPT共三十五頁,創(chuàng)作于2022年6月平均數有以下幾個基本特性:(1)平均數的計算與樣本內每個值都有關,它的大小受每個值的影響。(2)若每個xi都乘以相同的數k,則平均數亦應乘以k。(3)若每個xi都加上(或減去)相同的數A,則平均數

5、亦應加上(或減去) A。第十一張,PPT共三十五頁,創(chuàng)作于2022年6月中位數(median) 將資料中所有觀察值從小到大依次排列,處于中間位置的數。以Md表示。 適用條件 資料呈偏態(tài)分布或頻數分布類型不明,以及一端或兩端無確定數值,這種資料用中位數作為代表值比用算術平均數為好。 非頻數資料,先將各觀察值由小到大排列,當n為奇數時,第(n+1)/2位置的觀察值即為中位數,即: Md =x (n+1)/2第十二張,PPT共三十五頁,創(chuàng)作于2022年6月其中:L中位數所在組的下限;i組距;f中位數所在組的頻數;n總頻數;c小于中數所在組的累積頻數。當n為偶數時, 和 位置的兩個觀察值之和的二分之一

6、即為中位數,即: 若資料已分組,并編制成了頻數分布表,可利用頻數分布表計算中數。第十三張,PPT共三十五頁,創(chuàng)作于2022年6月潛伏期(小時)病例數f 累計例數02525125883244012336231464812158605163721164例某地區(qū)有164人因沙門氏菌食物中毒,其潛伏期資料經整理如下表,試計算中位數。第十四張,PPT共三十五頁,創(chuàng)作于2022年6月眾數(Mode)資料中出現次數最多的那個數或頻數最多一組的組中值,記為Mo。第十五張,PPT共三十五頁,創(chuàng)作于2022年6月 fmax=24, Mo=22 50只小雞出殼天數的頻數分布表Md=22第十六張,PPT共三十五頁,創(chuàng)

7、作于2022年6月組 別組中值m頻數(f)fx44.2545.029045.7546.529347.2548.01048048.7549.51259450.2551.026132651.7552.544231053.2554.043232254.7555.5291609.556.2557.01162757.7558.515877.559.2560.0212060.7561.54246合計20010695表3-2 某純系蛋雞200枚蛋重的頻數分布表 =10695/200 =53.475fmax=44, Mo=52.5Md=53.35第十七張,PPT共三十五頁,創(chuàng)作于2022年6月幾何平均數(Ge

8、ometric mean)定義 指n個觀察值乘積的n次方根。即適用條件 主要應用于數據呈倍數關系或不對稱分布的資料,算術平均數對這類資料的代表性差。如抗體效價(1:10,1:100,1:1000,1:10000)、增長率或生長率、動態(tài)發(fā)展速度等。第十八張,PPT共三十五頁,創(chuàng)作于2022年6月計算1、應用公式計算(實際應用時常取對數)第十九張,PPT共三十五頁,創(chuàng)作于2022年6月例 海蝦養(yǎng)殖試驗,各旬的生長速度3.0,1.5 1.3,1.2,1.2,1.1,1.1,求海蝦的旬平均生長速度。解: 即海蝦平均生長速度為1.38。其算術平均數為第二十張,PPT共三十五頁,創(chuàng)作于2022年6月當資料

9、編成頻數分布表時, 各組組中值; 各組次數;第二十一張,PPT共三十五頁,創(chuàng)作于2022年6月二、離散趨勢資料的另一方面的特征是變異程度。如: A 組資料: 3 、 4 、 5 、 6 、 7 平均數為: 5 B 組資料: 1 、 3 、 5 、 7 、 9 平均數為: 5 這里的平均數 5 對于 A 組資料的代表性好?還是對于 B 組資料的代 表性好?可見,只表明了數據的集中程度是遠遠不夠的,還需要進一步說明數據的變異程度。只有通過變異程度的描述,才知道代表值的代表性。表示數據變異特征的數值叫變異數。常用的變異數有:極差、平均離差、方 差、標準差、變異系數等。 第二十二張,PPT共三十五頁,

10、創(chuàng)作于2022年6月極差(全距) 極差 = 最大值 - 最小值 只利用了資料中最大值和最小值,不能準確表達資料中各個觀察值的變異程度。平均離差 第二十三張,PPT共三十五頁,創(chuàng)作于2022年6月它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統(tǒng)計學中未被采用消除離均差的負號離均差的平方之和(簡稱平方和,記為SS)稱為均方(縮寫為MS),又稱為樣本方差,記為S2標準差S離均差第二十四張,PPT共三十五頁,創(chuàng)作于2022年6月首先求出離均差,即每個數與它們的平均數之間的離差;然后將所有的離均差平方,再相加,得出離均差平方和;最后用n-1除離均差平方和(按照統(tǒng)計學理論,不要用樣本含量n去除)

11、,所得的商稱為樣本方差,用符號s2表示。方差s2是離均差平方的平均數。雖然方差在實際應用中用得最廣泛,但因它的單位是原始數據單位的平方,所以它不能直接地指出某個數x與平均數之間的偏離究竟達到什么程度。為此,采用標準差s做標準,衡量x與平均數之間的離散程度。第二十五張,PPT共三十五頁,創(chuàng)作于2022年6月 自由度 (degree of freedom) :統(tǒng)計學借此來反映一批變量的約束條件。例如一個有 5 個觀察值的樣本,因為受到統(tǒng)計數的約束,在5個離均差中,只有4個數值可以在一定范圍內自由變動取值,而第五個離均差必須滿足這一限制條件。 自由度記作 DF , 一般樣本自由度等于觀察值個數 (

12、n ) 減去約束條件的個數 ( k ) ,即 DF n k 。 第二十六張,PPT共三十五頁,創(chuàng)作于2022年6月樣本方差樣本標準差第二十七張,PPT共三十五頁,創(chuàng)作于2022年6月為了方便計算,將離均差平方和轉化為另一種形式,同時略去下標,上式可表示為:第二十八張,PPT共三十五頁,創(chuàng)作于2022年6月在計算離散型頻數資料的標準差時,式中x為組值,f為頻數,N為總頻數(f),k為組數。第二十九張,PPT共三十五頁,創(chuàng)作于2022年6月在計算連續(xù)型頻數資料的標準差時,式中m為組中值,f、N和k同上式。第三十張,PPT共三十五頁,創(chuàng)作于2022年6月標準差的特性(一)標準差的大小受資料中各觀察值的影響,觀察值間變異大的標準差也大,反之則小;(二)計算標準差時,各觀測值加上或減去一個常數,標準差的值不變; (三)當每個觀察值都乘以一個常數a時,所得的標準差是原來標準差的a倍第三十一張,PPT共三十五頁,創(chuàng)作于2022年6月樣本的方差為總體的方差為第三十二張,PPT共三十五頁,創(chuàng)作于2022年6月變異系數Coeffcient of variation資料的單位不同或平均數相差很大時,直接利用標準差比較資料間變異程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論