![第6章定量資料的統(tǒng)計(jì)描述_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/15/e554781e-bffb-419c-9234-3b102be37ea4/e554781e-bffb-419c-9234-3b102be37ea41.gif)
![第6章定量資料的統(tǒng)計(jì)描述_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/15/e554781e-bffb-419c-9234-3b102be37ea4/e554781e-bffb-419c-9234-3b102be37ea42.gif)
![第6章定量資料的統(tǒng)計(jì)描述_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/15/e554781e-bffb-419c-9234-3b102be37ea4/e554781e-bffb-419c-9234-3b102be37ea43.gif)
![第6章定量資料的統(tǒng)計(jì)描述_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/15/e554781e-bffb-419c-9234-3b102be37ea4/e554781e-bffb-419c-9234-3b102be37ea44.gif)
![第6章定量資料的統(tǒng)計(jì)描述_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/15/e554781e-bffb-419c-9234-3b102be37ea4/e554781e-bffb-419c-9234-3b102be37ea45.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第6章定量資料的統(tǒng)計(jì)描述第第6章章 定量資料的統(tǒng)計(jì)描述定量資料的統(tǒng)計(jì)描述第6章定量資料的統(tǒng)計(jì)描述學(xué)習(xí)目標(biāo)v掌握集中趨勢和離散趨勢描述的常用統(tǒng)計(jì)量;v掌握正態(tài)分布的特征及其作用意義;v掌握利用PROC MEANS過程進(jìn)行資料的統(tǒng)計(jì)描述;v掌握利用PROC UNIVARIATE過程進(jìn)行資料的統(tǒng)計(jì)描述。第6章定量資料的統(tǒng)計(jì)描述數(shù)據(jù)的統(tǒng)計(jì)特征v在對一組統(tǒng)計(jì)數(shù)據(jù)的分布變化進(jìn)行深入研究之前,我們首先研究一組數(shù)據(jù)的特征。為了比較精確地描述一組統(tǒng)計(jì)資料的特征,需要使用一些統(tǒng)計(jì)指標(biāo)來描述它。一組數(shù)據(jù)的統(tǒng)計(jì)特征通常包括以下四個(gè)方面: v集中趨勢 v離散趨勢 v偏度 v峰度 第6章定量資料的統(tǒng)計(jì)描述集中趨勢v集中趨
2、勢,也稱作中心位置。即表示一組數(shù)據(jù)的中心位置的數(shù)據(jù)點(diǎn)是在什么地方,也就是數(shù)據(jù)集中分布的位置。v一組數(shù)據(jù)的集中趨勢通常用平均數(shù)、中位數(shù)和眾數(shù)等來表示。這些統(tǒng)計(jì)量均稱為平均指標(biāo)。平均指標(biāo)的特點(diǎn)是將一組數(shù)據(jù)中各個(gè)數(shù)據(jù)之間的差異抽象化,用一個(gè)指標(biāo)來代表各個(gè)數(shù)據(jù)的一般水平,它反映了一組數(shù)據(jù)中各個(gè)數(shù)據(jù)的代表水平、中心位置或集中趨勢。第6章定量資料的統(tǒng)計(jì)描述均數(shù) v是算術(shù)均數(shù)的簡稱。常用表示樣本均數(shù),表示總體均數(shù)。均數(shù)用于反映一組同質(zhì)觀察值的平均水平,適用于正態(tài)或近似正態(tài)分布的數(shù)值變量資料。其計(jì)算方法有:v直接法 v加權(quán)法 第6章定量資料的統(tǒng)計(jì)描述均數(shù)(直接法)v用于樣本含量較少時(shí),其公式為:v式中,希臘字
3、母(讀作sigma)表示求和;X1,X2,Xn為各觀察值;n為樣本含量,即觀察值的個(gè)數(shù)。NxNXXXXNiiN121第6章定量資料的統(tǒng)計(jì)描述均數(shù)(加權(quán)法 )v用于頻數(shù)表資料或樣本中相同觀察值較多時(shí),其公式為:v式中,X1,X2,Xn與f1,f2,fk分別為相同觀察值與其對應(yīng)的頻數(shù) (或頻數(shù)表資料中各組段的組中值和相應(yīng)組段的頻數(shù))。第6章定量資料的統(tǒng)計(jì)描述幾何均數(shù) v適用于對數(shù)正態(tài)分布,即數(shù)據(jù)經(jīng)過對數(shù)變換后呈正態(tài)分布的資料;等比級數(shù)資料,即觀察值之間呈倍數(shù)或近似倍數(shù)變化的資料。如抗體滴度、平均效價(jià)等。其計(jì)算方法有:v直接法 v加權(quán)法 第6章定量資料的統(tǒng)計(jì)描述幾何均數(shù)(直接法)v或第6章定量資料的
4、統(tǒng)計(jì)描述幾何均數(shù)(加權(quán)法)v注意:計(jì)算幾何均數(shù)時(shí)觀察值中不能有0,因0不能取對數(shù);一組觀察值中不能同時(shí)有正值和負(fù)值。 第6章定量資料的統(tǒng)計(jì)描述中位數(shù) v一組由小到大按順序排列的觀察值中位次居中的數(shù)值。中位數(shù)可用于描述:非正態(tài)分布資料(對數(shù)正態(tài)分布除外);頻數(shù)分布的一端或兩端無確切數(shù)據(jù)的資料;以及總體分布不清楚的資料。在全部觀察中,小于和大于中位數(shù)的觀察值個(gè)數(shù)相等。其計(jì)算方法也包括v直接法v頻數(shù)表法第6章定量資料的統(tǒng)計(jì)描述百分位數(shù) v用Px表示。一個(gè)百分位數(shù)Px將一組觀察值分為兩部分,理論上有X%的觀察值比它小,有(100-X)%的觀察值比它大,是一種位置指標(biāo)。中位數(shù)是一個(gè)特殊的百分位數(shù),即M=
5、P50。百分位數(shù)的計(jì)算步驟與中位數(shù)類似,首先要確定Px所在的組段。先計(jì)算n*x%,累計(jì)頻數(shù)中大于n*x%的最小值所在的組段就是Px所在組段。 第6章定量資料的統(tǒng)計(jì)描述離散趨勢描述 v計(jì)量資料的頻數(shù)分布有集中趨勢和離散趨勢兩個(gè)主要特征,僅僅用集中趨勢來描述數(shù)據(jù)的分布特征是不夠的,只有把兩者結(jié)合起來,才能全面地認(rèn)識事物。我們經(jīng)常碰到平均數(shù)相同的兩組數(shù)據(jù)其離散程度可以是不同的。一組數(shù)據(jù)的分布可能比較集中,差異較小,則平均數(shù)的代表性較好。另一組數(shù)據(jù)可能比較分散,變異較大,則平均數(shù)的代表性就較差。描述一組計(jì)量資料離散趨勢的常用指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤和變異系數(shù)等,其中方差和標(biāo)準(zhǔn)差最
6、常用。第6章定量資料的統(tǒng)計(jì)描述極差v 極差又稱全距,是指一組數(shù)據(jù)的觀察值中的最大值和最小值之差。用公式表示為:v 極差最大觀察值最小觀察值v 極差的計(jì)算簡單,但是它只考慮了數(shù)據(jù)中的最大值和最小值,而忽略了全部觀察值之間的差異。兩組數(shù)據(jù)的最大值和最小值可能相同,于是它們的極差相等,但是離散的程度可能相當(dāng)不一致。由此可見,極差往往不能反映一組數(shù)據(jù)的實(shí)際離散程度,極差所反映的僅僅是一組數(shù)據(jù)的最大的離散值。第6章定量資料的統(tǒng)計(jì)描述平均差v平均差是指一組數(shù)據(jù)中的各數(shù)據(jù)對平均數(shù)的離差絕對值的平均數(shù)。一組數(shù)據(jù)中的各數(shù)據(jù)對平均數(shù)的離差有正有負(fù),其和為零,因此平均差必須用離差的絕對值來計(jì)算。平均差愈大,表示數(shù)據(jù)
7、之間的變異程度愈大,反之則變異程度愈小。計(jì)算公式為: nxx第6章定量資料的統(tǒng)計(jì)描述方差v平均差用絕對值來進(jìn)行度量,雖然避免了正負(fù)離差的相互抵消,但不便于運(yùn)算。一般情況下,用方差來度量一組數(shù)據(jù)的離散性。其計(jì)算公式為:xxn2第6章定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)差v為了使統(tǒng)計(jì)量的單位同觀察值的單位相一致,通常將方差開平方,即得到標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差也稱為均方差。其計(jì)算公式為: xxn2第6章定量資料的統(tǒng)計(jì)描述方差和標(biāo)準(zhǔn)差v由定義可知,方差和標(biāo)準(zhǔn)差所反映的是一組數(shù)據(jù)對其均值為代表的中心的某種偏離程度。從定義可知,標(biāo)準(zhǔn)差(或方差)較小的分布一定是比較集中在均值附近的,反之則是比較分散的。標(biāo)準(zhǔn)差的缺點(diǎn)是計(jì)算起來比較
8、麻煩。標(biāo)準(zhǔn)差也是根據(jù)全部數(shù)據(jù)來計(jì)算的,但是它也會受到極端值的影響。標(biāo)準(zhǔn)差的計(jì)算要比平均差方便,因此,標(biāo)準(zhǔn)差是描述數(shù)據(jù)離散趨勢最常用的統(tǒng)計(jì)量 第6章定量資料的統(tǒng)計(jì)描述方差和標(biāo)準(zhǔn)差v當(dāng)總體中的個(gè)體數(shù)很大時(shí),我們希望通過抽樣,用樣本標(biāo)準(zhǔn)差來估計(jì)總體的標(biāo)準(zhǔn)差時(shí),就需要計(jì)算樣本的方差和標(biāo)準(zhǔn)差。僅需要對總體方差和標(biāo)準(zhǔn)差的計(jì)算公式作一些調(diào)整。 Sxxn22112nxxS第6章定量資料的統(tǒng)計(jì)描述變異系數(shù)v標(biāo)準(zhǔn)差是表示所有數(shù)據(jù)離散性大小的一個(gè)絕對值,其度量單位與原數(shù)據(jù)的度量單位相同。因此,標(biāo)準(zhǔn)差只能度量一組數(shù)據(jù)對其均值的偏離程度。但若要比較兩組數(shù)據(jù)的離散程度,用兩個(gè)標(biāo)準(zhǔn)差直接進(jìn)行比較有時(shí)就顯得不合適了。例如,如
9、果一個(gè)總體的標(biāo)準(zhǔn)差是10,均值是100。如果另有一個(gè)總體的標(biāo)準(zhǔn)差是20,均值是2000。如果直接用標(biāo)準(zhǔn)差來進(jìn)行比較,后一總體的標(biāo)準(zhǔn)差是前一總體標(biāo)準(zhǔn)差的2倍,似乎前一總體的分布集中而后一總體的分布分散。但前一總體用標(biāo)準(zhǔn)差來衡量的各數(shù)據(jù)的差異量是其均值的1/10;后一總體用標(biāo)準(zhǔn)差來衡量的各數(shù)據(jù)差異是其均值的1/100,是微不足道的。第6章定量資料的統(tǒng)計(jì)描述變異系數(shù)v可見用標(biāo)準(zhǔn)差與均值的比值大小來衡量不同總體數(shù)據(jù)的分散程度更合理。統(tǒng)計(jì)上把這一比例稱為變異系數(shù)。變異系數(shù)是一個(gè)表示標(biāo)準(zhǔn)差相對于平均數(shù)的大小的相對量,即標(biāo)準(zhǔn)差相對于均值的百分比,其計(jì)算公式如下:v離散系數(shù) 1 0 0 %第6章定量資料的統(tǒng)計(jì)
10、描述正態(tài)分布 v在實(shí)際遇到的許多隨機(jī)現(xiàn)象都服從或近似服從正態(tài)分布。正態(tài)分布在統(tǒng)計(jì)學(xué)中是最基本、最重要的一種分布。正態(tài)分布是概率論中最重要的一種分布,一般來講,若影響某一數(shù)量指標(biāo)的隨機(jī)因素很多,而每個(gè)因素所起的作用不太大,則這個(gè)指標(biāo)服從正態(tài)分布。如測量的誤差;人的身高、體重;農(nóng)作物的收獲量等都近似服從正態(tài)分布。第6章定量資料的統(tǒng)計(jì)描述正態(tài)分布v正態(tài)分布是可以用函數(shù)形式來表述的。若隨機(jī)變量的密度函數(shù)(頻率曲線)為正態(tài)函數(shù)(曲線)v則稱 服從正態(tài)分布,其中 、 是兩個(gè)不確定常數(shù),是正態(tài)分布的參數(shù), 描述正態(tài)分布的集中位置,而 用來描述正態(tài)分布的離散程度,不同的和對應(yīng)不同的正態(tài)分布。 v正態(tài)曲線呈鐘型
11、,兩頭低,中間高,左右對稱,曲線與橫軸間的面積總等于1。 )2()(2221)(XeXfX第6章定量資料的統(tǒng)計(jì)描述正態(tài)分布的特征v服從正態(tài)分布的變量的頻數(shù)分布由 、 完全決定。v是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢位置。正態(tài)分布以 為對稱軸,左右完全對稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于 。v 描述正態(tài)分布資料數(shù)據(jù)分布的離散程度, 越大,數(shù)據(jù)分布越分散, 越小,數(shù)據(jù)分布越集中。也稱為是正態(tài)分布的形狀參數(shù), 越大,曲線越扁平,反之, 越小,曲線越瘦高。x第6章定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)正態(tài)分布v 標(biāo)準(zhǔn)正態(tài)分布是一種特殊的正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的 v標(biāo)準(zhǔn)化變換: ,此變換有特性:若 服
12、從正態(tài)分布,則 就服從標(biāo)準(zhǔn)正態(tài)分布,故該變換被稱為標(biāo)準(zhǔn)化變換。012XuXu第6章定量資料的統(tǒng)計(jì)描述幾個(gè)重要的面積比例 v 軸與正態(tài)曲線之間的面積恒等于1。正態(tài)曲線下, 橫軸區(qū)間內(nèi)的面積為68.27%,橫軸區(qū)間 內(nèi)的面積為90.00%,橫軸區(qū)間內(nèi) 的面積為95.00%,橫軸區(qū)間 內(nèi)的面積為99.00%。X64. 196. 158. 2第6章定量資料的統(tǒng)計(jì)描述正態(tài)分布的應(yīng)用v某些醫(yī)學(xué)現(xiàn)象,如同質(zhì)群體的身高、紅細(xì)胞數(shù)、血紅蛋白量,以及實(shí)驗(yàn)中的隨機(jī)誤差,呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些指標(biāo)(變量)雖服從偏態(tài)分布,但經(jīng)數(shù)據(jù)轉(zhuǎn)換后可服從正態(tài)或近似正態(tài)分布,可按正態(tài)分布規(guī)律處理。其中經(jīng)對數(shù)轉(zhuǎn)換后服從正態(tài)分布
13、的指標(biāo),被稱為服從對數(shù)正態(tài)分布。正態(tài)分布的研究有著廣泛的應(yīng)用價(jià)值:第6章定量資料的統(tǒng)計(jì)描述正態(tài)分布的應(yīng)用v估計(jì)頻數(shù)分布 一個(gè)服從正態(tài)分布的變量只要知道其均數(shù)與標(biāo)準(zhǔn)差就可根據(jù)公式(6-16)估計(jì)任意取值范圍內(nèi)的頻數(shù)比例。v制定參考值范圍:適用于服從正態(tài)(或近似正態(tài))分布指標(biāo)以及可以通過轉(zhuǎn)換后服從正態(tài)分布的指標(biāo)。但是對于非正態(tài)分布(偏態(tài)分布)的指標(biāo),需要采用百分位數(shù)法制定其參考值范圍。第6章定量資料的統(tǒng)計(jì)描述正態(tài)分布的應(yīng)用v質(zhì)量控制:為了控制實(shí)驗(yàn)中的測量(或?qū)嶒?yàn))誤差,常以 作為上、下警戒值,以作為 上、下控制值。這樣設(shè)置的依據(jù)就是因?yàn)橐话闱闆r下測量(或?qū)嶒?yàn))誤差服從正態(tài)分布。v正態(tài)分布是許多統(tǒng)計(jì)
14、方法的理論基礎(chǔ)。檢驗(yàn)、方差分析、相關(guān)和回歸分析等多種統(tǒng)計(jì)方法均要求分析的指標(biāo)服從正態(tài)分布。許多統(tǒng)計(jì)方法雖然不要求分析指標(biāo)服從正態(tài)分布,但相應(yīng)的統(tǒng)計(jì)量在大樣本時(shí)近似正態(tài)分布,因而大樣本時(shí)這些統(tǒng)計(jì)推斷方法也是以正態(tài)分布為理論基礎(chǔ)的。SX2SX3第6章定量資料的統(tǒng)計(jì)描述統(tǒng)計(jì)描述分析 vSAS系統(tǒng)中進(jìn)行定量資料的統(tǒng)計(jì)描述最常用的兩個(gè)過程是PROC MEANS過程和PROC UNIVARIATE過程。vMEANS過程提供單個(gè)或多個(gè)變量的簡單描述。和UNIVARIATE過程相比,它更傾向于描述已經(jīng)明確樣本所在總體符合正態(tài)分布的變量,因此它不提供百分位數(shù),但可以提供95%可信區(qū)間。同時(shí)在多個(gè)變量輸出時(shí),它的
15、輸出格式緊湊,便于閱讀。第6章定量資料的統(tǒng)計(jì)描述統(tǒng)計(jì)描述分析vUNIVARIATE過程對數(shù)值變量給出比較詳細(xì)的變量分布的描述,其中包括:變量的極端值、常用的百分位數(shù)(包括四分位數(shù)和中位數(shù))、用幾個(gè)散點(diǎn)圖描繪變量的分布、頻數(shù)表和正態(tài)分布的檢驗(yàn)等。第6章定量資料的統(tǒng)計(jì)描述本章小節(jié) v本章介紹了定量資料的統(tǒng)計(jì)特征描述,主要包括四個(gè)方面:集中趨勢、離散趨勢、偏度和峰度。本章重點(diǎn)講解了集中趨勢和離散趨勢的描述指標(biāo)。一組數(shù)據(jù)的集中趨勢通常用平均數(shù)、中位數(shù)和眾數(shù)等來表示。描述一組計(jì)量資料離散趨勢的常用指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤和變異系數(shù)等,其中方差和標(biāo)準(zhǔn)差最常用。本章分別詳細(xì)介紹了各種統(tǒng)計(jì)量的意義以及計(jì)算方法。我們應(yīng)在學(xué)習(xí)的過程中掌握這些統(tǒng)計(jì)量并學(xué)會計(jì)算。第6章定量資料的統(tǒng)計(jì)描述本章小節(jié)v本章重點(diǎn)介紹了正態(tài)分布。正態(tài)分布在統(tǒng)計(jì)學(xué)中是最基本、最重要的一種分布,而且它是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度房地產(chǎn)開發(fā)項(xiàng)目借款合同模板
- 2025年度建筑工程施工安全防護(hù)用品供應(yīng)合同-@-5
- 2025年度智能設(shè)備全球購銷合同集合(新版)
- 2025年度跨境電商供應(yīng)鏈融資借款協(xié)議
- 2025年度地質(zhì)災(zāi)害防治土方處理服務(wù)合同
- 2025年度新能源發(fā)電項(xiàng)目投資合作協(xié)議-@-48
- 二零二五年度智能電網(wǎng)建設(shè)與維護(hù)合同3篇
- 2025年度綠色建筑項(xiàng)目招投標(biāo)與合同管理實(shí)務(wù)手冊
- 2025年度紅酒年份酒品牌授權(quán)與加盟合同
- 2025年度生物科技產(chǎn)業(yè)合伙經(jīng)營合同(年度版)
- 杭州市淳安縣國有企業(yè)招聘筆試真題2024
- 2024政府采購評審專家考試真題庫及答案
- 2025年道路貨運(yùn)駕駛員從業(yè)資格證模擬考試題
- 數(shù)學(xué)-安徽省皖南八校2025屆高三上學(xué)期12月第二次大聯(lián)考試題和答案
- 融資報(bào)告范文模板
- 桃李面包盈利能力探析案例11000字
- GB/Z 30966.71-2024風(fēng)能發(fā)電系統(tǒng)風(fēng)力發(fā)電場監(jiān)控系統(tǒng)通信第71部分:配置描述語言
- 腦梗死的護(hù)理查房
- 2025高考數(shù)學(xué)專項(xiàng)復(fù)習(xí):概率與統(tǒng)計(jì)的綜合應(yīng)用(十八大題型)含答案
- 2024-2030年中國紫蘇市場深度局勢分析及未來5發(fā)展趨勢報(bào)告
- 銷售人員課件教學(xué)課件
評論
0/150
提交評論