版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
作為一個資料的代表,指資料中各變數(shù)集中較多的中心位置,用來與另一資料相比較。不同的平均數(shù)適合于不同的數(shù)據(jù)資料。例如:不同國家、地區(qū)、種族之間身高、體重等的比較;不同品種的家畜、家禽之間生產(chǎn)性能的比較集中趨勢的度量平均數(shù)的意義第一頁,共四十三頁,2022年,8月28日3.1.1算術(shù)平均數(shù)一、定義
一組資料中,所有觀測值的總和除以其個數(shù)所得到的商,稱為算術(shù)平均數(shù),簡稱平均數(shù)或均數(shù)。
是最常用的一種集中趨勢度量指標。
樣本的平均數(shù)記為
總體平均數(shù)記為
集中趨勢的度量第二頁,共四十三頁,2022年,8月28日:第i個觀察值或變數(shù)n:觀察值或變數(shù)的個數(shù)∑:求和符號(sigma)計算公式:集中趨勢的度量3.5.1算術(shù)平均數(shù)第三頁,共四十三頁,2022年,8月28日Σ的性質(zhì)第四頁,共四十三頁,2022年,8月28日例2.1:5頭豬的體重分別為70、72、80、83、88kg,問5頭豬的算術(shù)平均數(shù)是多少?
從計算結(jié)果看5頭豬都距78.6(kg)不遠,所以平均數(shù)是數(shù)量資料的代表值。
上述計算方法稱為直接法,適用于樣本小,即資料內(nèi)包含變數(shù)個數(shù)不多,一般在30個變數(shù)以下未經(jīng)分組的資料。集中趨勢的度量一、直接法第五頁,共四十三頁,2022年,8月28日1.分類資料:每個類別在某個指標上取相同的值。2.計數(shù)資料和連續(xù)性資料:頻率分布表
加權(quán)法,即計算時先將各個變數(shù)乘上它的權(quán)數(shù),再經(jīng)過總和,然后除以權(quán)數(shù)的總合,稱為加權(quán)平均數(shù)。集中趨勢的度量二、加權(quán)法第六頁,共四十三頁,2022年,8月28日
xi=變數(shù)值
fi=變數(shù)值xi出現(xiàn)的頻數(shù)計算公式:集中趨勢的度量二、加權(quán)法第七頁,共四十三頁,2022年,8月28日例:一個有1000個個體的群體,等位基因A的頻率為0.6,另一個400個個體的群體,等位基因A的頻率為0.3,這兩個群體的混合在一起,整個混合群體的等位基因A的頻率為:集中趨勢的度量二、加權(quán)法第八頁,共四十三頁,2022年,8月28日例:200頭大白豬的仔豬的一月窩重的資料組別組中值頻數(shù)(f)fx8-16-24-32-40-48-56-64-72-80-88-96-104-112-122028364452606876849210010811646910131726352821168434812025236057288415602380212817641472800432348總合20013120集中趨勢的度量二、加權(quán)法第九頁,共四十三頁,2022年,8月28日xi=組中值fi=組中值出現(xiàn)的頻數(shù)集中趨勢的度量二、加權(quán)法第十頁,共四十三頁,2022年,8月28日(一)離均差之和為零:一個樣本觀察值與平均數(shù)之差簡稱離均差?!疲▁i-)=(x1-)+(x2-)+……+(xn-)=x1+x2+……+xn+n?=∑xi-n?∑xi/n=0三、算術(shù)平均數(shù)的性質(zhì)集中趨勢的度量第十一頁,共四十三頁,2022年,8月28日(二)離均差平方和最小:一個樣本的各個觀察值與平均數(shù)之差的平方和比各個觀察值與任意其他數(shù)之差的平方和小。所以:平均數(shù)是與各個觀察值最接近的數(shù)值。所以:平均數(shù)代表這個樣本的集中趨勢。集中趨勢的度量三、算術(shù)平均數(shù)的性質(zhì)第十二頁,共四十三頁,2022年,8月28日定義:將n個觀察值從小到大依次排隊,位于中間的那個觀察值稱為中位數(shù)。3.1.2中位數(shù)(Md)集中趨勢的度量第十三頁,共四十三頁,2022年,8月28日例:2.5現(xiàn)有一窩仔豬的出生重資料為:1.4,1.0,1.3,1.2,1.6kg,試求其中位數(shù)。解:首先排序:1.0,1.2,1.3,1.4,1.6;
(n+1)/2=(5+1)/2=3;Md=X3=1.3如果增加一頭仔豬,出生重為1.8kg,計算中位數(shù):n/2=6/2=3(n/2)+1=3+1=4;Md=(X3+X4)/2=(1.3+1.4)/2=1.35集中趨勢的度量3.1.2中位數(shù)(Md)第十四頁,共四十三頁,2022年,8月28日對于頻數(shù)分布的資料,公式如下:Lmd:中位數(shù)所在組的組下限;fm:中位數(shù)所在組的頻數(shù);C:從第一組到中位數(shù)所在組前一組的累計頻數(shù)n:樣本含量;
i:組距;例:表2-5集中趨勢的度量3.1.2中位數(shù)(Md)第十五頁,共四十三頁,2022年,8月28日集中趨勢的度量3.1.2中位數(shù)(Md)第十六頁,共四十三頁,2022年,8月28日定義:n個非負數(shù)的乘積開n次方的根稱為幾何平均數(shù),用G表示。3.1.3幾何平均數(shù)集中趨勢的度量第十七頁,共四十三頁,2022年,8月28日為了計算方便,各變數(shù)先取對數(shù),再相加除以n,即為logG,再求其反對數(shù),即為G值。集中趨勢的度量3.1.3幾何平均數(shù)幾何平均數(shù)用于以百分率、比例表示的數(shù)據(jù)資料,如:增長率、利率、藥物效價、抗體滴度等。能夠消弱數(shù)據(jù)中個別過分偏大值的影響。第十八頁,共四十三頁,2022年,8月28日例:某奶牛場在1995年有100頭奶牛,已知在1996、1997、1998年的奶牛頭數(shù)分別為前一年的2,3和4.5倍,求其年平均增加率。?1998年的奶牛頭數(shù)為:100×2×3×4.5=2700頭或者100×33=2700頭集中趨勢的度量3.1.3幾何平均數(shù)第十九頁,共四十三頁,2022年,8月28日定義:在資料中某一個變數(shù)出現(xiàn)次數(shù)最多,就稱之為眾數(shù)。1.離散性資料:出現(xiàn)頻數(shù)最多的數(shù)。2.連續(xù)性資料:頻數(shù)分布表中,頻數(shù)出現(xiàn)最多的一組的組中值。!!有的資料可出現(xiàn)多個眾數(shù),即多個數(shù)具有相同的最高頻數(shù);有的資料沒有眾數(shù),即所有數(shù)出現(xiàn)的頻數(shù)都相同。集中趨勢的度量3.1.4眾數(shù)第二十頁,共四十三頁,2022年,8月28日定義:各觀察值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)3.1.5調(diào)和平均數(shù)簡單調(diào)和平均數(shù)集中趨勢的度量適用于極端右偏態(tài)第二十一頁,共四十三頁,2022年,8月28日3.1.5調(diào)和平均數(shù)集中趨勢的度量例:用某藥物救治12只中毒的小鼠,它們的存活天數(shù)記錄如下:8、8、8、10、10、7、13、10、9、14,另有兩只一直未死亡,求平均存活天數(shù)。由于數(shù)據(jù)極端右偏態(tài),用調(diào)和平均數(shù)較為合理。第二十二頁,共四十三頁,2022年,8月28日復習連續(xù)性資料分組方法集中趨勢(平均數(shù))有哪幾種表示方式?算術(shù)平均數(shù)的性質(zhì)第二十三頁,共四十三頁,2022年,8月28日2.2.3百分位數(shù)(百分位點)指將一組n個數(shù)據(jù)由小到大排列,如果小于某數(shù)值的數(shù)據(jù)個數(shù)為全體數(shù)據(jù)個數(shù)的x%,則稱該數(shù)為第x百分位數(shù)或x%分位數(shù)。
25%分位數(shù)或下四分位數(shù):0.25n個數(shù)的后一個數(shù)。
50%分位數(shù)或中位數(shù):0.5n個數(shù)的后一個數(shù)。
75%分位數(shù)或上四分位數(shù):0.75n個數(shù)的后一個數(shù)。24第二十四頁,共四十三頁,2022年,8月28日一、各個集中趨勢度量指標之間的關(guān)系1.在完全對稱分布情況下,算數(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相等。集中趨勢的度量第二十五頁,共四十三頁,2022年,8月28日
適用于正態(tài)分布資料。家畜的大多數(shù)數(shù)量性狀都是正態(tài)分布,因此算術(shù)平均數(shù)是最常用的,也是最重要的。集中趨勢的度量2、算術(shù)平均數(shù)但是當分布不對稱時,呈偏態(tài)時,用算術(shù)平均數(shù)則難以表示資料的集中趨勢。第二十六頁,共四十三頁,2022年,8月28日適用于非參數(shù)檢驗,如卡方檢驗。4、幾何平均數(shù)和調(diào)和平均數(shù)適用于右偏態(tài)分布。偏態(tài):是指大部分數(shù)值落在平均數(shù)的哪一邊,若分配較多的集中在低數(shù)值的方面視為正偏態(tài),或稱為右偏態(tài)集中趨勢的度量3、中位數(shù)第二十七頁,共四十三頁,2022年,8月28日平均數(shù)的代表程度與樣本的變異程度有關(guān)一個樣本內(nèi)有很多的變數(shù),用平均數(shù)作為樣本的代表,其代表程度決定于樣本內(nèi)各個變數(shù)的變異程度。3.2標準差離散趨勢的度量第二十八頁,共四十三頁,2022年,8月28日即使兩個樣本的平均數(shù)相同,但是樣本內(nèi)變數(shù)的變異程度不一定相同。產(chǎn)仔數(shù)總和甲8,4,16,12,22,17,6,14,6,511011乙14,8,11,9,11,12,10,14,13,811011離散趨勢的度量3.2標準差第二十九頁,共四十三頁,2022年,8月28日甲的變異程度大于乙甲的平均數(shù)的代表性小于乙的平均數(shù)所以,應(yīng)該測定其變異程度離散趨勢的度量?甲、乙兩品種的平均產(chǎn)仔數(shù)相同,都是11頭。
從平均數(shù)來看,兩個品種沒有差異。從以上統(tǒng)計結(jié)果可知:?進一步觀察各個變數(shù),二者變異程度并不相同。
甲:最小為4,最大為22;乙:最小為8,最大為14第三十頁,共四十三頁,2022年,8月28日1.如果各個變數(shù)相同或者變異程度比較小,則平均數(shù)能夠代表整個樣本。2.如果各個變數(shù)的變異程度比較大,則平均數(shù)的代表性就小。離散趨勢的度量
因此,單靠平均數(shù)不能全面、正確地了解樣本。也不能了解平均數(shù)作為樣本的變異程度。3.2標準差第三十一頁,共四十三頁,2022年,8月28日定義:全部變數(shù)的最大值與最小值之差
R=Max(x)-Min(x)3.2范圍(全距)范圍或全距可以反映變異程度的一部分,但是不能代表樣本內(nèi)各變數(shù)之間的變異程度。
目前,被廣泛使用的是以標準差來度量變異程度。離散趨勢的度量第三十二頁,共四十三頁,2022年,8月28日如果一個樣本有n個觀察值x1,x2……
xn,設(shè)其算術(shù)平均數(shù)為,則該樣本的標準差為:標準差考慮了每個變數(shù)與平均數(shù)的離差。每個變數(shù)與平均數(shù)相差愈小,樣本變異程度愈小,反之,愈大。因此,標準差是離散程度的度量3.2.1標準差的定義離散趨勢的度量第三十三頁,共四十三頁,2022年,8月28日1.離均差=(x-)2.離均差之和=∑(x-)=03.離均差平方和SS=∑(x-)2為了合理地計算平均差異,用平方和的辦法來消除離均差的正負號,離均差平方相加,得到平方和(SS),但是由于不同樣本的觀察值個數(shù)不同,所以離均差平方和也不是理想指標離散趨勢的度量雖然離均差可以衡量變異程度,但是離均差之和為0,所以不是理想的指標3.2.2標準差公式的來源第三十四頁,共四十三頁,2022年,8月28日3.2.3樣本方差和樣本標準差將離均差平方和求平均數(shù),稱為樣本方差,目的是消除觀察值個數(shù)的影響樣本方差開方,目的是使變異還原,即標準差。離散趨勢的度量第三十五頁,共四十三頁,2022年,8月28日總體是未知的,用樣本標準差估計和推斷總體標準差離散趨勢的度量3.2.4總體方差和樣本標準差第三十六頁,共四十三頁,2022年,8月28日如果一個樣本含有n個變數(shù),從理論上講,n個變數(shù)都同樣用以計算標準差,n個變數(shù)與平均數(shù)相減有n個離均差。表面上雖有n個比較,但實質(zhì)上僅有n-1個可以自由變動,最后一個離均差受到離均差之和這個條件的限制,所以不能自由。3.2.5自由度:
df,n-1第三十七頁,共四十三頁,2022年,8月28日例如:有3個變數(shù),平均數(shù)等于5。問著三個變數(shù)可能是多少?離散趨勢的度量3.2.5自由度:(4、5、6)(2、4、9)(3、5、7)……他們的共同特點:前兩個數(shù)可以自由選擇,為了使平均數(shù)等于5,第三個數(shù)不用選就確定了。這時(3-1)=2就是所謂自由度。自由度:消除限制性因數(shù)后,所剩余的獨立變數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024離婚財產(chǎn)評估及分配程序合同
- 2025年度消防水源與供水設(shè)施建設(shè)施工協(xié)議4篇
- 2025年度智慧交通設(shè)施安裝與維護服務(wù)合同3篇
- 2024版正規(guī)的居間服務(wù)合同范本
- 2024跨區(qū)域教育資源共享與合作合同
- 2024年裝修工程專項分包協(xié)議3篇
- 2025年度特色餐飲品牌店面租賃合同3篇
- 2025年度甘肅桉樹種植與干旱地區(qū)林業(yè)發(fā)展合同3篇
- 2025年度生態(tài)環(huán)保工程承包人工合同模板4篇
- 2025年度倉儲物流場地租賃合同12篇
- 《黃河頌》示范公開課教學PPT課件【統(tǒng)編人教版七年級語文下冊】
- TSEESA 010-2022 零碳園區(qū)創(chuàng)建與評價技術(shù)規(guī)范
- GB/T 19867.5-2008電阻焊焊接工藝規(guī)程
- 2023年市場部主管年終工作總結(jié)及明年工作計劃
- 第三章旅游活動的基本要素課件
- 國有資產(chǎn)出租出借審批表(學校事業(yè)單位臺賬記錄表)
- 安全生產(chǎn)風險分級管控實施細則
- 30第七章-農(nóng)村社會治理課件
- 考研考博-英語-東北石油大學考試押題三合一+答案詳解1
- 出國學生英文成績單模板
- 植物細胞中氨基酸轉(zhuǎn)運蛋白的一些已知或未知的功能
評論
0/150
提交評論