醫(yī)學(xué)統(tǒng)計(jì) 統(tǒng)計(jì)描述_第1頁
醫(yī)學(xué)統(tǒng)計(jì) 統(tǒng)計(jì)描述_第2頁
醫(yī)學(xué)統(tǒng)計(jì) 統(tǒng)計(jì)描述_第3頁
醫(yī)學(xué)統(tǒng)計(jì) 統(tǒng)計(jì)描述_第4頁
醫(yī)學(xué)統(tǒng)計(jì) 統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章第三章 統(tǒng)計(jì)描述統(tǒng)計(jì)描述Statistical DescriptionsContent頻數(shù)分布計(jì)量資料的統(tǒng)計(jì)描述分類資料的統(tǒng)計(jì)描述統(tǒng)計(jì)圖表第一節(jié) 頻數(shù)分布 一、頻數(shù)分布表 (frequency distribution table)例3-1 從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇( )的測量結(jié)果如下,試編制頻數(shù)分布表。 mmol/L2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.7

2、5 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.4

3、8 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 編制步驟如下:1. 求極差 : 極差(range)也稱全距,即最大值和最小值之差,記作R。本例:。5.71 2.353.36(mmol/L)R 2確定組段數(shù)和組距(i) :組段數(shù)通常取組 10-15組本例組距 3寫組段:組下限(L):每個(gè)組段的起點(diǎn)組上限(U):每個(gè)組段的終點(diǎn)3.36/100.3360.30i 組 段 2.30 2.60 2.90 3.20 5.605.90 2.302.60 4分組段劃記并統(tǒng)計(jì)頻

4、數(shù) LXU 2.302.60組 段 頻數(shù)f (1) (2) 2.30 1 2.60 3 2.90 6 3.20 8 3.50 17 3.80 20 4.10 17 4.40 12 4.70 9 5.00 5 5.30 2 5.605.90 1 合 計(jì) 101 頻數(shù)表:由各組段及其頻數(shù)所構(gòu)成的統(tǒng) 計(jì)表。二、頻數(shù)分布圖 血 清 總 膽 固 醇(mmol/L)05101520252.453.053.654.254.855.456.10圖 2 - 1 101 名 正 常 成 年 女 子 血 清 總 膽 固 醇 的 頻 數(shù) 分 布頻 數(shù)計(jì)數(shù)資料和等級資料的頻數(shù)分布三、頻數(shù)表和頻數(shù)分布圖用途1描述頻數(shù)分布

5、的類型 (1)對稱分布 :若各組段的頻數(shù)以頻數(shù)最多組段為中心左右兩側(cè)大體對稱,就認(rèn)為該資料是對稱分布 血 清 總 膽 固 醇(mmol/L)05101520252.453.053.654.254.855.456.10圖 2 - 1 101 名 正 常 成 年 女 子 血 清 總 膽 固 醇 的 頻 數(shù) 分 布頻 數(shù) (2)偏態(tài)分布 :1)右偏態(tài)分布(skewed to the right distribution)也稱正偏態(tài)分布(positive skewness distribution):右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾 血清轉(zhuǎn)氨酶(mmol/L)051015202513.51

6、9.525.531.537.543.5.圖2-2 115名正常成年女子血清轉(zhuǎn)氨酶的頻數(shù)分布人 數(shù) 2 ) 左 偏 態(tài) 分 布(skewed to the left distribution)也稱負(fù)偏態(tài) 分 布 ( n e g a t i v e skewness distribution):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾 血 清 肌 紅 蛋 白(g / m L)05101520252.512.522.532.542.552.5圖 2-3 101 名 正 常 人 血 清 肌 紅 蛋 白 的 頻 數(shù) 分 布人 數(shù) 2描述頻數(shù)分布的特征 變異的范圍在2.305.90有明顯的統(tǒng)計(jì)分布規(guī)律

7、,數(shù)據(jù)主要集中在3.504.70 之間,尤以組段的人數(shù)3.804.10 最多,且上下組段數(shù)的頻數(shù)分布基本對稱。 (mmol/L)(mmol/L)(mmol/L) 3便于發(fā)現(xiàn)一些特大或特小的可疑值 組 段 頻數(shù)f (1) (2) 2.30 1 2.60 0 2.90 0 3.20 0 3.50 17 3.80 20 4.10 17 4.40 12 4.70 9 5.00 5 5.30 2 5.605.90 1 合 計(jì) 101 4便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)第二節(jié) 計(jì)量資料的統(tǒng)計(jì)描述計(jì)量資料的統(tǒng)計(jì)描述集中趨勢的描述離散趨勢的描述(一)集中趨勢的描述 統(tǒng)計(jì)上使用平均數(shù)(average)這一指標(biāo)體

8、系來描述一組變量值的集中位置或平均水平。常用的平均數(shù)有: 算術(shù)均數(shù) 幾何均數(shù) 中位數(shù) 一、算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean) 可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。1、計(jì)算方法(1)直接計(jì)算法 公式 :12nXXXXXnn式中12,nXXX為所有觀察值,n為樣本含量,(希臘字母,讀作sigma)為求和的符號。 例3-2 用直接法計(jì)算例3-1某單位101名正常成年女子的血清總膽固醇的均數(shù)。2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66

9、 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78

10、 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 2.354.783.914.03(mmol/L)101X (2)加權(quán)法:公式 :計(jì)算4,4,4,6,6,8,8,8,10的均數(shù)?112233123kkkfXf Xf Xf Xf XXfffff1323101836243X例3-3 利用表3-1計(jì)算101名正常成年女子的血總膽固醇的均數(shù)。組 段 頻數(shù)f (1) (2) 2.30 1 2.60 3 2.90 6

11、 3.20 8 3.50 17 3.80 20 4.10 17 4.40 12 4.70 9 5.00 5 5.30 2 5.605.90 1 合 計(jì) 101 式中k表示頻數(shù)表的組段數(shù), 及 分別表示各組段的頻數(shù)和組中值,如表2-1第1個(gè)組段的組中值為, 其余類推(見表3-1的第(3)欄)。在這里,頻數(shù)起到了“權(quán)”(weight)的作用,即某個(gè)組段頻數(shù)多,權(quán)數(shù)就大,其組中值對均數(shù)的影響也大;反之,影響則小。 12, , ,kf ff12,kXXX(2.302.60)/22.45 1 2.45 3 2.751 5.75409.754.06(mmol/L)1 31101X 2、應(yīng)用 適用于對稱分布

12、,特別適用于對稱分布,特別是正態(tài)分布資料是正態(tài)分布資料。二、 幾何均數(shù)幾何均數(shù)(geometric mean,G): 可用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平。1、計(jì)算方法(1)直接計(jì)算法 公式: 或12nnGX XX1lglg ()XGn例3-4 某地5例微絲蚴血癥患者治療七年后用間接熒光抗體試驗(yàn)測得其抗體滴度倒數(shù)分別為10,20,40,40,160,求幾何均數(shù)。510204040 16034.8G 11lglg10lg20lg40lg40lg160lg ()lg ()34.85XGn(2)加權(quán)法公式:1lglg ()fXGf例3-5 69例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清

13、EBV-VCA-lgG抗體滴度的分布見表3-4第(1)、(2)欄,求其平均抗體滴度。 故例類風(fēng)濕關(guān)節(jié)炎患者血清EBV-VCA-lgG抗體的平均滴度為:1:150.6。111lg150.2778lg ()lg ()lg (2.1779)150.669fXGf 2、應(yīng)用: 適用于成等比級數(shù)的資料,特別是對數(shù)正態(tài)分布資料。三、中位數(shù)與百分位數(shù)1、中位數(shù) 中位數(shù)(median):是將變量值從小到大排列,位置居于中間的那個(gè)變量值。例: 1,3,7,5,100 中位數(shù)為多少?計(jì)算公式: n為奇數(shù)時(shí) n為偶數(shù)時(shí) 1()2nMX()(1)2212nnMXX例3-6 7名病人患某病的潛伏期分別為2, 3, 4,

14、 5, 6, 9, 16天,求其中位數(shù)。本例n=7,為奇數(shù) 例3-7 8名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時(shí),求其中位數(shù)。本例n=8,為偶數(shù) 7 14()25()MXX天8845()(1)22111354()222MXXXX小時(shí)應(yīng)用 適用于:1、各種分布類型的資料 2、特別是偏態(tài)分布資料和開囗資料(一端或兩端無確切數(shù)值的資料)。 2、百分位數(shù) 百分位數(shù)(percentile)是一種位置指標(biāo),用 來表示。一個(gè)百分位數(shù) 將全部變量值分為兩部分,在不包含 的全部變量值中有 的變量值比它小, 變量值比它大。 XPXP%X(100)%XXP1直接計(jì)算法 設(shè)有x個(gè)原始數(shù)據(jù)從小

15、到大排列,第x百分位數(shù)的計(jì)算公式為:當(dāng) 為帶有小數(shù)位時(shí): 當(dāng) 為 整數(shù)時(shí):%nXtrunc(%) 1XnXPX%nX(%)(% 1)12XnXnXPXX例3-9 對某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計(jì),名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)?;?者: 住院天數(shù): n=120,120X5%=6,為整數(shù): 1 2 3 4 5 6 7 8 9 117 118 119 120 1 2 2 2 3 3 4 4 5 40 40 42 455(6)(7)11(34)3.5()22PXX天例3-9 對某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計(jì),名患者的住院天數(shù)從小到大的排列如下,試求第

16、5百分位數(shù)和第99百分位數(shù)?;?者:住院天數(shù): ,帶有小數(shù),取整后trunc(118.8)= 1181 2 3 4 5 6 7 8 9 117 118 119 120 1 2 2 2 3 3 4 4 5 40 40 42 4512099%118.899(trunc(118.8) 1)(119)42()PXX天2頻數(shù)表法 公式:(%)XXXLXiPLnXff式中XL、Xi和Xf分別為第X百分位數(shù)所在組段 的下限、組距和頻數(shù),Lf為小于XL各組段的累計(jì)頻數(shù),n 為總例數(shù)。 當(dāng)1%50%2X時(shí),公式(2-9)即為中位數(shù)的計(jì)算公式 50505050()2LinMPLff例3-10 某地118名鏈球菌咽

17、喉炎患者的潛伏期頻數(shù)表見表3-5第(1)、(2)欄,試分別求中位數(shù)及第25、第75百分位數(shù)。 5012 11848(53)51 ()242MP天251236(118 25%21)39.2 ()32P 天751260(118 75%77)67.7 ()18P 天(三)離散趨勢的描述例3-11 三組同齡男孩的身高值(cm) 甲組:90 95 100 105 110 100cmX甲 乙組:96 98 100 102 104 100cmX乙 丙組:96 99 100 101 104 100cmX丙 常用統(tǒng)計(jì)指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。一、 極差 極差,用R表示:即一組變量值最大值

18、與最小值之差。 1109020cmR甲104968cmR 乙104968cmR丙二、四分位數(shù)間距 四分位數(shù)間距,用QR表示:QR=下四分位數(shù):上四分位數(shù):2575PP 25LQP75UQP 例3-12 續(xù)例3-10。已知P25=39.2,P75=67.7,計(jì)算118名鏈球菌咽喉炎患者潛伏期的四分位數(shù)間距。 (天)請回答:四分位數(shù)間距可以看成大小在中間的一半變量值的全距( R )。67.739.228.5QR 四分位數(shù)間距可以看成一半變量值的極差。三、方差與標(biāo)準(zhǔn)差 1、方差(variance)也稱均方差(mean square deviation),反映一組數(shù)據(jù)的平均離散水平。 樣本方差用 表示 總體方差用2 表示 22()XN2S2、公式:樣本標(biāo)準(zhǔn)差用 表示 公式:總體標(biāo)準(zhǔn)差用表示 2()XNS2()1XXSn 標(biāo)準(zhǔn)差的公式還可以寫成 :利用頻數(shù)表計(jì)算標(biāo)準(zhǔn)差的公式為22()1XXnSn22()1fXfXfSf例3-12 續(xù)例3-10,計(jì)算三組資料的標(biāo)準(zhǔn)差。甲組: 5,9095 100 105 110500nX2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論