![高等教育統(tǒng)計(jì)描述一課件_第1頁(yè)](http://file4.renrendoc.com/view/6daeacca5b65c4f1863020727cbdcfb3/6daeacca5b65c4f1863020727cbdcfb31.gif)
![高等教育統(tǒng)計(jì)描述一課件_第2頁(yè)](http://file4.renrendoc.com/view/6daeacca5b65c4f1863020727cbdcfb3/6daeacca5b65c4f1863020727cbdcfb32.gif)
![高等教育統(tǒng)計(jì)描述一課件_第3頁(yè)](http://file4.renrendoc.com/view/6daeacca5b65c4f1863020727cbdcfb3/6daeacca5b65c4f1863020727cbdcfb33.gif)
![高等教育統(tǒng)計(jì)描述一課件_第4頁(yè)](http://file4.renrendoc.com/view/6daeacca5b65c4f1863020727cbdcfb3/6daeacca5b65c4f1863020727cbdcfb34.gif)
![高等教育統(tǒng)計(jì)描述一課件_第5頁(yè)](http://file4.renrendoc.com/view/6daeacca5b65c4f1863020727cbdcfb3/6daeacca5b65c4f1863020727cbdcfb35.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)描述(一)統(tǒng)計(jì)描述(一)1統(tǒng)計(jì)描述統(tǒng)計(jì)分析
統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)描述統(tǒng)計(jì)統(tǒng)計(jì)描述統(tǒng)計(jì)推斷2統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過(guò)計(jì)算相應(yīng)的統(tǒng)計(jì)指標(biāo),必要時(shí)結(jié)合統(tǒng)計(jì)圖表就可較全面地刻畫(huà)出研究結(jié)果的特征。統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過(guò)計(jì)算相應(yīng)的3統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒(méi)有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理的統(tǒng)計(jì)推斷結(jié)果。因此我們必須重視統(tǒng)計(jì)描述;否則,統(tǒng)計(jì)推斷就成了“無(wú)源之水”。統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒(méi)有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理4統(tǒng)計(jì)描述統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指標(biāo)統(tǒng)計(jì)表統(tǒng)計(jì)圖正態(tài)分布t分布F分布x2分布二項(xiàng)分布相對(duì)數(shù)指標(biāo)統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指5頻數(shù)分布表與頻數(shù)分布圖
(frequencytableandfrequencydistribution)
頻數(shù)分布表與頻數(shù)分布圖
(frequencytable6
用途:描述資料的分布特征
頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)頻數(shù)分布表
(frequencytable)
用途:描述資料的分布特征
頻數(shù):在一批樣本中,相同情形出7某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)
3.985.394.544.745.134.434.814.983.795.494.665.264.904.904.174.284.634.944.334.844.754.014.494.575.165.694.845.035.324.544.684.604.394.804.974.804.855.214.454.625.054.135.074.405.084.735.104.734.424.814.983.895.464.534.744.104.904.914.274.294.665.235.314.864.674.434.575.005.165.694.835.044.464.615.004.364.754.965.045.374.954.704.834.424.134.784.864.785.234.785.204.804.554.824.983.944.544.745.104.434.584.994.314.644.665.265.284.834.154.354.935.175.614.875.043.984.484.574.774.114.955.005.365.064.684.634.405.304.975.294.855.884.494.624.534.104.534.704.805.235.674.674.675.405.294.775.385.154.645.19某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)3.988
計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組段數(shù)和組距:根據(jù)樣本含量n確定,組段數(shù)通常取8-15組。實(shí)際工作中,組距通常參考極差的十分之一,再略加調(diào)整。本例i=R
/10=2.09/10=0.209≈0.2。計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大9(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)稱為上限。第一組段把最小值包括進(jìn)去,最后一個(gè)組段把最大值包括進(jìn)去。本例:第一組下限可取3.7,則上限為3.9,依此類(lèi)推……,共得11組。(4)列表整理:按照“下限≤X<上限”的原則,用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)10組段(1)頻數(shù)f(2)組中值X0(3)fX0(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9合計(jì)15.85.8150—719.8組段頻數(shù)f組中值X0fX03.7~111頻數(shù)分布圖
(frequencydistribution)
計(jì)數(shù)資料
以類(lèi)別或?qū)傩詾闄M軸,以各直條的長(zhǎng)短表示頻數(shù)的多少頻數(shù)分布圖
(frequencydistribution12計(jì)量資料以組段為橫軸,在各組段上分別繪制長(zhǎng)方形,令長(zhǎng)方形的高度等于相應(yīng)的頻數(shù)。這樣的頻數(shù)圖因諸多長(zhǎng)方形又名為頻數(shù)直方圖。計(jì)量資料13頻數(shù)表和頻數(shù)分布圖用途第一:
描述資料分布的類(lèi)型(1)對(duì)稱分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布(2)偏態(tài)分布:頻數(shù)表和頻數(shù)分布圖用途第一:描述資料分布的類(lèi)型14右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,向右側(cè)拖尾的分布。
表
115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的15[高等教育]統(tǒng)計(jì)描述一課件16左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。
表101名正常人的血清肌紅蛋白(μg/mL)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)17[高等教育]統(tǒng)計(jì)描述一課件18第二:描述頻數(shù)分布的集中趨勢(shì)和離散趨勢(shì)集中趨勢(shì)(centraltendency):頻數(shù)較集中的組段趨勢(shì)。——平均水平指標(biāo)離散趨勢(shì)(tendencyofdispersion):頻數(shù)由較集中的組段逐漸減少的趨勢(shì)。
——變異水平指標(biāo)
第二:描述頻數(shù)分布的集中趨勢(shì)和離散趨勢(shì)集中趨勢(shì)(centra19第三:便于發(fā)現(xiàn)一些特大或特小的可疑值第三:便于發(fā)現(xiàn)一些特大或特小的可疑值20計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢(shì)的指標(biāo)描述離散趨勢(shì)的指標(biāo)計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢(shì)的指標(biāo)21(一)、描述集中趨勢(shì)的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(average),反映資料的集中趨勢(shì)。常用的平均數(shù)有:
1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
(一)、描述集中趨勢(shì)的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(av221、算術(shù)均數(shù)(mean)
符號(hào):總體均數(shù),樣本均數(shù)
適用條件:資料呈對(duì)稱分布,尤其是正態(tài)分布或近似正態(tài)分布計(jì)算:(1)直接法1、算術(shù)均數(shù)(mean)符號(hào):總體均數(shù),樣本均數(shù)
適23(2)頻數(shù)表法該組段的組中值組段的頻數(shù)(2)頻數(shù)表法該組段的組中值組段的頻數(shù)24表示求X的以10為底的反對(duì)數(shù)(即)符號(hào):只適合于數(shù)據(jù)大于0的資料適用條件:數(shù)據(jù)呈倍數(shù)關(guān)系或服從對(duì)數(shù)對(duì)稱分布(一種偏態(tài)分布)的資料計(jì)算:(1)直接法:(2)頻數(shù)表法:2、幾何均數(shù)(geometricmean)表示求X的以10為底的反對(duì)數(shù)(即)符號(hào):25
例
血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。解:特點(diǎn):1、倍數(shù)關(guān)系
2、偏態(tài)分布算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。因此,平均抗體效價(jià)約為1:1000例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、10026頻數(shù)表資料的幾何均數(shù)抗體滴度
⑴人數(shù),f⑵滴度倒數(shù),X⑶lgX⑷
f·lgX⑸1:4
1:81:161:32┇1:512
合計(jì)1562┇540481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471
頻數(shù)表資料的幾何均數(shù)抗體滴度人數(shù),f滴度倒數(shù),XlgX273.中位數(shù)(median)符號(hào):M意義:中位數(shù)是將全部觀察值由小到大排列后位次居中的數(shù)據(jù)值。適用條件:①偏態(tài)分布的資料;②分布類(lèi)型不明的資料;③開(kāi)口資料3.中位數(shù)(median)符號(hào):M28計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)(n為奇數(shù))(n為偶數(shù))計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):29頻數(shù)表資料的中位數(shù)對(duì)于頻數(shù)表資料可通過(guò)百分位數(shù)法計(jì)算中位數(shù)。
百分位數(shù):是一種位置指標(biāo),用表示。是一個(gè)界值,它將觀察值分成兩部分,有X%的觀察值比它小,有(100-X)%的觀察值比它大。
如:第25百分位數(shù)第50百分位數(shù)第75百分位數(shù)第50百分位數(shù)即中位數(shù)頻數(shù)表資料的中位數(shù)對(duì)于頻數(shù)表資料可通過(guò)百分位數(shù)法計(jì)算中位數(shù)30
頻數(shù)表資料中百分位數(shù)計(jì)算方法:
百分位數(shù)該組的頻數(shù)所在組段的下限該組段的組距總頻數(shù)該組段之前的累計(jì)頻數(shù)頻數(shù)表資料中百分位數(shù)計(jì)算方法:百分位數(shù)該組的頻數(shù)所在31潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—例4-8潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466332均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)右(正)偏態(tài)分布:均數(shù)>中位數(shù)左(負(fù))偏態(tài)分布時(shí):均數(shù)<中位數(shù)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)33【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積頻數(shù)累積百分比1-20208.373-668635.985-6014661.097-4819481.179-1821288.7011-1622895.4013-623497.9115-123598.3317-123698.7419-3239100.00合計(jì)239【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積34Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與均數(shù)的關(guān)系Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與35小結(jié):
集中趨勢(shì)的描述——平均數(shù)
定義:描述一組變量值的集中位置或平均水平的指標(biāo)體系。應(yīng)用:均數(shù):正態(tài)分布或?qū)ΨQ分布資料(參數(shù)方法)中位數(shù):偏態(tài)分布或未知分布資料(非參數(shù)方法)幾何均數(shù)—變量值呈倍數(shù)(等比級(jí)數(shù))關(guān)系,或資料呈對(duì)數(shù)正態(tài)分布。小結(jié):集中趨勢(shì)的描述——平均數(shù)定義:描述一組變量值的集中36(二)、描述離散趨勢(shì)的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)體觀察值的變異程度。常用的指標(biāo)有:
1.極差/全距(range)
2.四分位數(shù)間距(IQR,inter-quartilerange)
3.方差(variance)
4.標(biāo)準(zhǔn)差(standarddeviation)
5.變異系數(shù)(coefficientofvariation)
(二)、描述離散趨勢(shì)的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)371、極差/全距(range,
R)符號(hào):R計(jì)算:意義:反映個(gè)體變異的范圍。適用范圍:任何計(jì)量資料,是參考變異指標(biāo)缺點(diǎn):1.只利用了兩個(gè)極端值
2.n大,R也會(huì)大
3.穩(wěn)定性差1、極差/全距(range,R)符號(hào):R38一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百分位數(shù)()之差,可看作中間一半觀測(cè)值的極差。
多用于描述偏態(tài)分布資料的變異水平。2、四分位數(shù)間距(inter-quartilerange,IQR
)一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百39潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466340反映一組數(shù)據(jù)的平均變異水平,前者是后者的平方。標(biāo)準(zhǔn)差最常應(yīng)用,常結(jié)合均數(shù)描述正態(tài)分布的特征。
標(biāo)準(zhǔn)差計(jì)算如下:3、方差(variance)和標(biāo)準(zhǔn)差(standarddeviation,S)反映一組數(shù)據(jù)的平均變異水平,前者是后者的平方。標(biāo)準(zhǔn)差最41離均差
離均差平方和
總體方差總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差變異與N有關(guān)離均差變異與N有關(guān)42頻數(shù)表計(jì)算樣本標(biāo)準(zhǔn)差的公式為:頻數(shù)表計(jì)算樣本標(biāo)準(zhǔn)差的公式為:43標(biāo)準(zhǔn)差的計(jì)算丙甲2乙2丙27.9115.8150.99標(biāo)準(zhǔn)差250051050550049549012604003136002916002500002116001936001251000270400260100250000240100230400125025026010025502525000024502524010025002500合計(jì)52056055105404500500349046024804401乙甲盤(pán)編號(hào)標(biāo)準(zhǔn)差的計(jì)算丙甲2乙2丙27.9115.8150.99標(biāo)準(zhǔn)差44組段(1)頻數(shù),f(2)組中值,X(3)
fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9
合計(jì)15.85.8150719.8組段頻數(shù),f組中值,XfX345標(biāo)準(zhǔn)差應(yīng)用標(biāo)準(zhǔn)差是數(shù)據(jù)處理中最常用的統(tǒng)計(jì)指標(biāo),用途:(1)常用作為計(jì)量資料描述的專用符號(hào)。:平均水平;:變異度大小
(2)表示數(shù)據(jù)分布的離散程度,衡量變異度大小。(3)描述計(jì)量資料,尤其是正態(tài)分布的數(shù)據(jù)資料,并利用正態(tài)曲線下面積分布規(guī)律,制定各種參考值范圍。標(biāo)準(zhǔn)差應(yīng)用標(biāo)準(zhǔn)差是數(shù)據(jù)處理中最常用的統(tǒng)計(jì)指標(biāo),用途:465.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重
②同單位資料,但均數(shù)相差懸殊均數(shù)標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%
意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。計(jì)算:5.變異系數(shù)(coefficientofvariati47變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊的資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用,如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;偏態(tài)分布:中位數(shù)變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布48統(tǒng)計(jì)描述思考題:一個(gè)服從正態(tài)分布的總體,若其中每個(gè)變量均加上一個(gè)常數(shù),問(wèn):均數(shù)、方差、標(biāo)準(zhǔn)差、變異系數(shù)的變化?若是均乘以一個(gè)常數(shù),這4個(gè)指標(biāo)又是如何變化的?統(tǒng)計(jì)描述思考題:49統(tǒng)計(jì)描述(一)統(tǒng)計(jì)描述(一)50統(tǒng)計(jì)描述統(tǒng)計(jì)分析
統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)描述統(tǒng)計(jì)統(tǒng)計(jì)描述統(tǒng)計(jì)推斷51統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過(guò)計(jì)算相應(yīng)的統(tǒng)計(jì)指標(biāo),必要時(shí)結(jié)合統(tǒng)計(jì)圖表就可較全面地刻畫(huà)出研究結(jié)果的特征。統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過(guò)計(jì)算相應(yīng)的52統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒(méi)有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理的統(tǒng)計(jì)推斷結(jié)果。因此我們必須重視統(tǒng)計(jì)描述;否則,統(tǒng)計(jì)推斷就成了“無(wú)源之水”。統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒(méi)有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理53統(tǒng)計(jì)描述統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指標(biāo)統(tǒng)計(jì)表統(tǒng)計(jì)圖正態(tài)分布t分布F分布x2分布二項(xiàng)分布相對(duì)數(shù)指標(biāo)統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指54頻數(shù)分布表與頻數(shù)分布圖
(frequencytableandfrequencydistribution)
頻數(shù)分布表與頻數(shù)分布圖
(frequencytable55
用途:描述資料的分布特征
頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)頻數(shù)分布表
(frequencytable)
用途:描述資料的分布特征
頻數(shù):在一批樣本中,相同情形出56某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)
3.985.394.544.745.134.434.814.983.795.494.665.264.904.904.174.284.634.944.334.844.754.014.494.575.165.694.845.035.324.544.684.604.394.804.974.804.855.214.454.625.054.135.074.405.084.735.104.734.424.814.983.895.464.534.744.104.904.914.274.294.665.235.314.864.674.434.575.005.165.694.835.044.464.615.004.364.754.965.045.374.954.704.834.424.134.784.864.785.234.785.204.804.554.824.983.944.544.745.104.434.584.994.314.644.665.265.284.834.154.354.935.175.614.875.043.984.484.574.774.114.955.005.365.064.684.634.405.304.975.294.855.884.494.624.534.104.534.704.805.235.674.674.675.405.294.775.385.154.645.19某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)3.9857
計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組段數(shù)和組距:根據(jù)樣本含量n確定,組段數(shù)通常取8-15組。實(shí)際工作中,組距通常參考極差的十分之一,再略加調(diào)整。本例i=R
/10=2.09/10=0.209≈0.2。計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大58(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)稱為上限。第一組段把最小值包括進(jìn)去,最后一個(gè)組段把最大值包括進(jìn)去。本例:第一組下限可取3.7,則上限為3.9,依此類(lèi)推……,共得11組。(4)列表整理:按照“下限≤X<上限”的原則,用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)59組段(1)頻數(shù)f(2)組中值X0(3)fX0(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9合計(jì)15.85.8150—719.8組段頻數(shù)f組中值X0fX03.7~160頻數(shù)分布圖
(frequencydistribution)
計(jì)數(shù)資料
以類(lèi)別或?qū)傩詾闄M軸,以各直條的長(zhǎng)短表示頻數(shù)的多少頻數(shù)分布圖
(frequencydistribution61計(jì)量資料以組段為橫軸,在各組段上分別繪制長(zhǎng)方形,令長(zhǎng)方形的高度等于相應(yīng)的頻數(shù)。這樣的頻數(shù)圖因諸多長(zhǎng)方形又名為頻數(shù)直方圖。計(jì)量資料62頻數(shù)表和頻數(shù)分布圖用途第一:
描述資料分布的類(lèi)型(1)對(duì)稱分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布(2)偏態(tài)分布:頻數(shù)表和頻數(shù)分布圖用途第一:描述資料分布的類(lèi)型63右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,向右側(cè)拖尾的分布。
表
115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的64[高等教育]統(tǒng)計(jì)描述一課件65左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。
表101名正常人的血清肌紅蛋白(μg/mL)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)66[高等教育]統(tǒng)計(jì)描述一課件67第二:描述頻數(shù)分布的集中趨勢(shì)和離散趨勢(shì)集中趨勢(shì)(centraltendency):頻數(shù)較集中的組段趨勢(shì)?!骄街笜?biāo)離散趨勢(shì)(tendencyofdispersion):頻數(shù)由較集中的組段逐漸減少的趨勢(shì)。
——變異水平指標(biāo)
第二:描述頻數(shù)分布的集中趨勢(shì)和離散趨勢(shì)集中趨勢(shì)(centra68第三:便于發(fā)現(xiàn)一些特大或特小的可疑值第三:便于發(fā)現(xiàn)一些特大或特小的可疑值69計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢(shì)的指標(biāo)描述離散趨勢(shì)的指標(biāo)計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢(shì)的指標(biāo)70(一)、描述集中趨勢(shì)的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(average),反映資料的集中趨勢(shì)。常用的平均數(shù)有:
1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
(一)、描述集中趨勢(shì)的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(av711、算術(shù)均數(shù)(mean)
符號(hào):總體均數(shù),樣本均數(shù)
適用條件:資料呈對(duì)稱分布,尤其是正態(tài)分布或近似正態(tài)分布計(jì)算:(1)直接法1、算術(shù)均數(shù)(mean)符號(hào):總體均數(shù),樣本均數(shù)
適72(2)頻數(shù)表法該組段的組中值組段的頻數(shù)(2)頻數(shù)表法該組段的組中值組段的頻數(shù)73表示求X的以10為底的反對(duì)數(shù)(即)符號(hào):只適合于數(shù)據(jù)大于0的資料適用條件:數(shù)據(jù)呈倍數(shù)關(guān)系或服從對(duì)數(shù)對(duì)稱分布(一種偏態(tài)分布)的資料計(jì)算:(1)直接法:(2)頻數(shù)表法:2、幾何均數(shù)(geometricmean)表示求X的以10為底的反對(duì)數(shù)(即)符號(hào):74
例
血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。解:特點(diǎn):1、倍數(shù)關(guān)系
2、偏態(tài)分布算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。因此,平均抗體效價(jià)約為1:1000例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、10075頻數(shù)表資料的幾何均數(shù)抗體滴度
⑴人數(shù),f⑵滴度倒數(shù),X⑶lgX⑷
f·lgX⑸1:4
1:81:161:32┇1:512
合計(jì)1562┇540481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471
頻數(shù)表資料的幾何均數(shù)抗體滴度人數(shù),f滴度倒數(shù),XlgX763.中位數(shù)(median)符號(hào):M意義:中位數(shù)是將全部觀察值由小到大排列后位次居中的數(shù)據(jù)值。適用條件:①偏態(tài)分布的資料;②分布類(lèi)型不明的資料;③開(kāi)口資料3.中位數(shù)(median)符號(hào):M77計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)(n為奇數(shù))(n為偶數(shù))計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):78頻數(shù)表資料的中位數(shù)對(duì)于頻數(shù)表資料可通過(guò)百分位數(shù)法計(jì)算中位數(shù)。
百分位數(shù):是一種位置指標(biāo),用表示。是一個(gè)界值,它將觀察值分成兩部分,有X%的觀察值比它小,有(100-X)%的觀察值比它大。
如:第25百分位數(shù)第50百分位數(shù)第75百分位數(shù)第50百分位數(shù)即中位數(shù)頻數(shù)表資料的中位數(shù)對(duì)于頻數(shù)表資料可通過(guò)百分位數(shù)法計(jì)算中位數(shù)79
頻數(shù)表資料中百分位數(shù)計(jì)算方法:
百分位數(shù)該組的頻數(shù)所在組段的下限該組段的組距總頻數(shù)該組段之前的累計(jì)頻數(shù)頻數(shù)表資料中百分位數(shù)計(jì)算方法:百分位數(shù)該組的頻數(shù)所在80潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—例4-8潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466381均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)右(正)偏態(tài)分布:均數(shù)>中位數(shù)左(負(fù))偏態(tài)分布時(shí):均數(shù)<中位數(shù)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)82【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積頻數(shù)累積百分比1-20208.373-668635.985-6014661.097-4819481.179-1821288.7011-1622895.4013-623497.9115-123598.3317-123698.7419-3239100.00合計(jì)239【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積83Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與均數(shù)的關(guān)系Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與84小結(jié):
集中趨勢(shì)的描述——平均數(shù)
定義:描述一組變量值的集中位置或平均水平的指標(biāo)體系。應(yīng)用:均數(shù):正態(tài)分布或?qū)ΨQ分布資料(參數(shù)方法)中位數(shù):偏態(tài)分布或未知分布資料(非參數(shù)方法)幾何均數(shù)—變量值呈倍數(shù)(等比級(jí)數(shù))關(guān)系,或資料呈對(duì)數(shù)正態(tài)分布。小結(jié):集中趨勢(shì)的描述——平均數(shù)定義:描述一組變量值的集中85(二)、描述離散趨勢(shì)的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)體觀察值的變異程度。常用的指標(biāo)有:
1.極差/全距(range)
2.四分位數(shù)間距(IQR,inter-quartilerange)
3.方差(variance)
4.標(biāo)準(zhǔn)差(standarddeviation)
5.變異系數(shù)(coefficientofvariation)
(二)、描述離散趨勢(shì)的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)861、極差/全距(range,
R)符號(hào):R計(jì)算:意義:反映個(gè)體變異的范圍。適用范圍:任何計(jì)量資料,是參考變異指標(biāo)缺點(diǎn):1.只利用了兩個(gè)極端值
2.n大,R也會(huì)大
3.穩(wěn)定性差1、極差/全距(range,R)符號(hào):R87一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百分位數(shù)()之差,可看作中間一半觀測(cè)值的極差。
多用于描述偏態(tài)分布資料的變異水平。2、四分位數(shù)間距(inter-quartilerange,IQR
)一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百88潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466389反映一組數(shù)據(jù)的平均變異水平,前者是后者的平方。標(biāo)準(zhǔn)差最常應(yīng)用,常結(jié)合均數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年信貸購(gòu)車(chē)合同權(quán)益轉(zhuǎn)讓他方
- 2025年酒類(lèi)采購(gòu)供應(yīng)合同
- 2025年外包合同樣本
- 2025年二手車(chē)質(zhì)權(quán)借款合同范本
- 2025年健身休閑合同標(biāo)準(zhǔn)評(píng)估
- 2025年辦公設(shè)備租賃合同爭(zhēng)議解決
- 2025年個(gè)人信用貸款保證合同
- 2025年個(gè)人隱私保護(hù)合同樣本
- 2025年公司試用期合同示例
- 2025年中介公司采購(gòu)合同書(shū)
- 2025年道路運(yùn)輸企業(yè)安全生產(chǎn)管理人員考試題(附答案)
- 建設(shè)工程質(zhì)量安全監(jiān)督人員考試題庫(kù)含答案
- 《中華人民共和國(guó)學(xué)前教育法》專題培訓(xùn)
- 工程款支付報(bào)審表
- 同位角內(nèi)錯(cuò)角同旁內(nèi)角專項(xiàng)練習(xí)題有答案
- 常用抗凝藥物的應(yīng)用及護(hù)理PPT課件
- 淺談壓力容器產(chǎn)品監(jiān)督檢驗(yàn)工作要點(diǎn)
- 食品分析實(shí)驗(yàn)講義(1)
- 泥炭生化復(fù)合肥建設(shè)項(xiàng)目可行性研究報(bào)告
- 軟件公司K3渠道招募制度
- 藥店醫(yī)保培訓(xùn)記錄.doc
評(píng)論
0/150
提交評(píng)論