版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
(計(jì)量資料)
統(tǒng)計(jì)描述
DescriptiveStatistics
162名健康男性血清總膽固醇(mmol/L)5.534.345.603.554.133.934.204.354.314.815.804.084.904.923.946.344.894.163.054.504.483.624.523.974.114.375.264.982.725.393.753.704.943.906.104.564.394.093.764.824.694.024.543.785.334.444.534.503.794.284.534.555.204.495.574.214.884.444.964.704.574.454.333.534.844.103.845.114.455.654.475.014.214.563.894.734.865.104.675.403.224.983.524.113.823.595.024.665.235.054.234.684.905.004.752.964.744.354.714.855.254.255.144.293.394.723.435.085.174.965.214.276.124.915.434.934.874.464.264.764.694.795.224.614.784.244.514.714.563.864.455.294.504.724.004.544.205.305.185.734.974.665.494.375.344.683.664.385.414.535.074.784.694.715.035.375.685.835.934.626.015.77計(jì)量資料的統(tǒng)計(jì)描述頻數(shù)表與頻數(shù)分布描述幾種趨勢(shì)的指標(biāo)
算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)描述變異程度的指標(biāo)極差、百分位數(shù)與四分位間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)
頻數(shù)
(frequency)
某個(gè)測(cè)量值的個(gè)(例)數(shù)。
頻數(shù)分布表(frequencydistributiontable):
又稱頻數(shù)表。是將原始數(shù)據(jù)值適當(dāng)分組后得到各組的頻數(shù),
用于描述資料的分布特征,適用樣本量較大的資料進(jìn)行統(tǒng)計(jì)描述的常用方法。通過(guò)頻數(shù)表可以顯示數(shù)據(jù)分布的范圍與形態(tài)。一、頻數(shù)與頻數(shù)分布
離散型定量變量的頻數(shù)分布
例1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7等共96個(gè)數(shù)值.96名婦女產(chǎn)前檢查次數(shù)分布的頻數(shù)分布表表
1998年某地96名婦女產(chǎn)前檢查次數(shù)分布檢查次數(shù)頻數(shù)頻率(%)累計(jì)人數(shù)累計(jì)頻率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合計(jì)96100
連續(xù)型定量變量的頻數(shù)分布
抽樣調(diào)查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L),將數(shù)據(jù)適當(dāng)分組,計(jì)數(shù)每組的頻數(shù),根據(jù)這些數(shù)據(jù)編制成的頻數(shù)分布表,則能顯示出這組數(shù)據(jù)分布的特點(diǎn)。160名正常成年女子的血清甘油三酯(mmol/L)
編號(hào)血清甘油三脂編號(hào)血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77手工編制表步驟。(1)計(jì)算全距(range,R),也稱為極
R=最大值-最小值本例極差:R=1.77-0.51=1.26(mmol/L)(2)確定組段數(shù)與組距:組段數(shù)一般可在10~15之間選擇組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=1.26/10=0.126≈0.1。(3)列表做出表格,將選好的組段順序地列在(1)列。按照“下限≤x<上限”的原則確定每一例數(shù)據(jù)x應(yīng)歸屬的組段。(4)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(5)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。
組段(1)
劃記(2)
頻數(shù),f(3)
組中值,X(4)fX(5)=(3)×(4)0.5~
30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5512.401.6~正81.6514.851.7~1.8
合計(jì)
31.755.25160182.30頻數(shù)分布圖:在表的基礎(chǔ)上,可以繪制出圖稱為直方圖(頻率直方圖)。
橫軸:血清甘油三酯
縱軸:頻率密度,即頻率/組距(直條面積等于相應(yīng)組段的頻率)。在組距相等時(shí),直方圖中矩形直條的高度與相應(yīng)組段的頻率成正比。對(duì)稱分布:頻數(shù)最多的組段在中央,正偏峰分布:峰向左側(cè)偏移的分布,右側(cè)的組段數(shù)多于左側(cè),為右偏峰分布。負(fù)偏峰分布:峰向右側(cè)偏移的分布,左側(cè)的組段數(shù)多于右側(cè),稱為左偏峰分布。正態(tài)分布與偏態(tài)分布1.頻數(shù)表——正態(tài)分布normaldistribution
2.頻數(shù)表——右偏態(tài)(skewedtotheright),也稱正偏態(tài)(positiveskewed)
3.頻數(shù)表——左偏態(tài)(skewedtotheleft),也稱負(fù)偏態(tài)(negativeskewed)正態(tài)分布:中間高、兩邊低、左右對(duì)稱正偏態(tài)分布:長(zhǎng)尾向右延伸負(fù)偏態(tài)分布:長(zhǎng)尾向左延伸頻數(shù)分布①集中趨勢(shì)(centraltendency):變量值集中位置?!骄街笜?biāo)②離散趨勢(shì)(tendency
of
dispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越??;且圍繞“中心”左右對(duì)稱?!儺愃街笜?biāo)
頻數(shù)表的用途1.揭示頻數(shù)分布的類(lèi)型和特征;分布類(lèi)型:對(duì)稱分布(正態(tài))偏態(tài)分布分布特征:中心位置分布范圍對(duì)稱性變動(dòng)趨勢(shì)2.便于進(jìn)一步計(jì)算指標(biāo)和分析處理;3.發(fā)現(xiàn)某些特大特小的可疑值;
4.進(jìn)行正態(tài)性判定等集中趨勢(shì)指標(biāo)
總稱為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency
)。
常用的有:
1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)
(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
4.眾數(shù)(mode)1.均數(shù)(mean)Σ為求和符號(hào),讀成sigma適用條件:資料呈正態(tài)或近似正態(tài)。
組段(1)
劃記(2)
頻數(shù),f(3)
組中值,X(4)fX(5)=(3)×(4)0.5~
30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5513.951.6~正81.6513.201.7~1.8
合計(jì)
31.755.25160182.30例:均數(shù)=182.3/160=1.142.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。
幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料
例:血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴
人數(shù),f⑵
滴度倒數(shù),X⑶lgX⑷
f·lgX⑸1:2.5
1:101:401:1601:640
合計(jì)141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.1032例:幾何均數(shù)=反對(duì)數(shù)(102.1/72)=26.193.中位數(shù)(median)
中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號(hào)為Md,反映一批觀察值在位次上的平均水平。
適用條件:適合各種類(lèi)型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。
中位數(shù)計(jì)算公式與實(shí)例
先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)例:9名病人潛伏期:2,3,3,3,4,5,6,9,16頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md
組段(1)
劃記(2)
頻數(shù),f(3)
累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~
331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8
合計(jì)
3160100.0(98.1~100)160中位數(shù)=1.1+0.1x[(160x50%-72)/20]
=1.14微克/毫升4.眾數(shù)(mode)
出現(xiàn)次數(shù)(或頻數(shù))最多的觀察值;在頻數(shù)分布圖中對(duì)應(yīng)于高峰所在位置的觀察值。適用于大樣本;較粗糙。從分布的角度看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,一組數(shù)據(jù)分布的最高峰點(diǎn)所對(duì)應(yīng)的變量值即為眾數(shù)。如果數(shù)據(jù)的分布沒(méi)有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)也可以不存在;如果有多個(gè)高峰點(diǎn),也就有多個(gè)眾數(shù)特點(diǎn):1.集中趨勢(shì)的測(cè)度值之一;2.出現(xiàn)次數(shù)最多的變量值;3.不受極端值的影響;4.可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù);5.適用于定類(lèi)數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)和定比數(shù)據(jù)。眾數(shù)的不唯一性:無(wú)眾數(shù)原始數(shù)據(jù):10591268一個(gè)眾數(shù)原始數(shù)據(jù):659855多于一個(gè)眾數(shù)原始數(shù)據(jù):252828364242均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)=眾數(shù)右偏態(tài)分布時(shí):均數(shù)>中位數(shù)>眾數(shù)左偏態(tài)分布時(shí):均數(shù)<中位數(shù)<眾數(shù)三、變異(variation)指標(biāo)
反映數(shù)據(jù)的離散度(Dispersion
)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:
1.極差(Range)
(全距)
2.百分位數(shù)與四分位數(shù)間距
PercentileandQuartilerange
3.方差
Variance
4.標(biāo)準(zhǔn)差StandardDeviation
5.變異系數(shù)
CoefficientofVariation
盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500
例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙1.極差(Range)(全距)優(yōu)點(diǎn):簡(jiǎn)便缺點(diǎn):1.只利用了兩個(gè)極端值
2.n大,R也會(huì)大
3.不穩(wěn)定12040202.百分位數(shù)與四分位數(shù)間距
Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:QR=P75-P25四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px
組段(1)
劃記(2)
頻數(shù),f(3)
累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~
331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8
合計(jì)
3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36QR=1.36-0.92=0.44;QD=0.22百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征3.方差
方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。樣本方差為什么要除以(n-1)小樣本分母為n-1,稱為自由度。4.標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500標(biāo)準(zhǔn)差50.9915.817.91()155/25001222甲的標(biāo)準(zhǔn)差--=--=??nnXX
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 紡織品品牌合作授權(quán)規(guī)范
- 律師事務(wù)所裝修改造合同
- 2025年隔膜板項(xiàng)目合作計(jì)劃書(shū)
- 書(shū)店設(shè)計(jì)投標(biāo)文件范本
- 企業(yè)客戶接待通勤車(chē)租賃合同
- 建筑施工安裝分包合同:綠化景觀
- 滑雪場(chǎng)鋼絲網(wǎng)施工協(xié)議
- 水庫(kù)大壩設(shè)備安裝吊車(chē)租賃合同
- 基坑支護(hù)施工合同:公路工程篇
- 鐵道橋梁隧道工程技術(shù)基礎(chǔ)知識(shí)單選題100道及答案
- 馬克思主義基本原理+2024秋+試題 答案 國(guó)開(kāi)
- 《地震災(zāi)害及其防治》課件
- 2023年深圳市云端學(xué)校應(yīng)屆生招聘教師考試真題
- 店鋪三年規(guī)劃
- 2024年版電商平臺(tái)入駐商家服務(wù)與銷(xiāo)售分成合同
- 蜜雪冰城合同范例
- 2023年國(guó)網(wǎng)四川省電力公司招聘筆試真題
- LPG液化氣充裝站介質(zhì)分析操作規(guī)程 202412
- 養(yǎng)老院環(huán)境衛(wèi)生保潔方案
- 2023-2024學(xué)年廣東省深圳市龍華區(qū)六年級(jí)上學(xué)期期末英語(yǔ)試卷
- 2024年注冊(cè)會(huì)計(jì)師審計(jì)考試題及答案
評(píng)論
0/150
提交評(píng)論