醫(yī)學統(tǒng)計學 個體變異與變量分布課件_第1頁
醫(yī)學統(tǒng)計學 個體變異與變量分布課件_第2頁
醫(yī)學統(tǒng)計學 個體變異與變量分布課件_第3頁
醫(yī)學統(tǒng)計學 個體變異與變量分布課件_第4頁
醫(yī)學統(tǒng)計學 個體變異與變量分布課件_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章 個體變異與變量分布,一、個體變異 二、頻數(shù)分布 三、定量資料的統(tǒng)計指標 四、定性資料與等級資料的統(tǒng)計指標,1,PPT學習交流,個體變異(individual variation),是同質(zhì)觀察對象間表現(xiàn)出的差異。 變異是生物體在一種或多種、已知或未知的不可控因素作用下所產(chǎn)生的綜合反映。 就個體而言:變異是隨機的(random)。 就總體而言:個體變異是有規(guī)律的。,2,PPT學習交流,幻燈片 1,個體變異是統(tǒng)計學應(yīng)用的前提,3,PPT學習交流,(一)定量資料的頻數(shù)分布,例: 某市 1997 年 12 歲男童 120 人的身高 (cm) 資料,4,PPT學習交流,1.頻數(shù)分布表的制作步驟 (

2、 1)計算極差( R ) R= Xmax Xmin=160.9-125.9=35 ( cm ) ( 2)確定組數(shù)、組距: 組數(shù): 8 12 組距:i= R/ 組數(shù) =35 / 10 =3.5 4 ( cm ) ( 3)確定組段:含下限,不含上限 第一組段下限 Xmin 最后一組上限 Xmax ( 4)劃記:計算頻數(shù)、頻率 2.分布圖,5,PPT學習交流,1997 年某市 120 名 12 歲男童的身高 (cm) 頻數(shù)分布,劃記,正正,正正正正 正正正正正正正 正正正正正 正正正正正,上一張幻燈片,6,PPT學習交流,某市 120 名 12 歲男童身高的頻數(shù)分布,7,PPT學習交流,定性資料的整

3、理:根據(jù)指標的自然屬性歸類,計數(shù)頻數(shù) 等級資料的整理:根據(jù)指標的不同等級歸類,計數(shù)頻數(shù),507 名傣族人血型的頻數(shù)分布,(二)定性資料及等級資料的頻數(shù)分布,8,PPT學習交流,709 對肺癌患者和非肺癌患者吸煙情況,此表是Doll和Hill于1948年至1952年間采用回顧性配對調(diào)查方法研究了吸煙與肺癌的關(guān)系 得到的資料(此表分類方法是交叉分類),9,PPT學習交流,例:某醫(yī)院探討不同期次矽肺的胸部平片肺門密度變化,資料如下表,問矽肺患者肺門密度的增加與矽肺期次有無關(guān)系?,245, 1 96 72 169, 6 17 55 78,合 計 50 301 141 492,合計,矽肺期次,10,PP

4、T學習交流,描述分布類型 描述分布的特征 便于發(fā)現(xiàn)特大、特小的可疑值 便于計算有關(guān)指標、統(tǒng)計分析與處理,頻數(shù)分布表和頻數(shù)分布圖的用途,11,PPT學習交流,(三)數(shù)據(jù)的分布類型,對稱分布: 非對稱分布(偏態(tài)分布) 對稱分布:頻數(shù)以中間最多,兩側(cè)逐漸減少,基本對稱 右偏態(tài)(正偏態(tài)):高峰在左側(cè),尾部拖在右側(cè) 左偏態(tài)(負偏態(tài)):高峰在右側(cè),尾部拖在左側(cè) 單峰分布: 雙峰或多峰分布:,正偏態(tài)(右),負偏態(tài)(左),分布的對稱,峰的多少,12,PPT學習交流,某市 120 名 12 歲男童身高的頻數(shù)分布,13,PPT學習交流,發(fā)汞含量( ),239 人發(fā)汞含量的頻數(shù)分布,人 數(shù),14,PPT學習交流,自

5、評分,某城市 892 名老年人生存質(zhì)量自評分的頻數(shù)分布,人數(shù),15,PPT學習交流,生存時間 (月),102 名黑色素瘤患者的生存時間頻數(shù)分布,人 數(shù),16,PPT學習交流,人數(shù),死亡年齡 (歲),某地某年 10000 例死亡者年齡分布,17,PPT學習交流,分布類型,對稱分布 正偏態(tài)(右) 負偏態(tài)(左),幻燈片 1,18,PPT學習交流,集中位置的描述 離散趨勢的描述,三、定量資料的統(tǒng)計指標,19,PPT學習交流,是描述一組變量值的集中趨勢或平均水平的統(tǒng)計指標。是一組變量值的集中水平的代表值。 種類:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、加權(quán)均數(shù)等 注意:同質(zhì)的變量值才能在一起求平均數(shù)!,平均數(shù)

6、(集中位置描述),20,PPT學習交流,(一)算術(shù)均數(shù)(arithmetic mean)簡稱均數(shù)(mean) 1 .適用條件:單峰對稱分布、正態(tài)分布的資料 2 .計算公式: 小樣本:,加權(quán)系數(shù),例:某門功課的成績:平時占 0.2 ,期中占 0.3,期末占 0.5 則平均成績?yōu)椋?21,PPT學習交流,大樣本:,各組段的頻數(shù) 各組段的組中值,22,PPT學習交流,1997 年某市 120 名 12 歲男童的身高 (cm),組中值,126 130 134 138 142 146 150 154 158 162,23,PPT學習交流,例:五人血清抗體滴度: 1:10, 1:100 , 1:1000

7、, 1:10000, 1:100000,看一個實例,24,PPT學習交流,1 適用條件:各變量值成倍數(shù)或?qū)?shù)正態(tài)分布的資料 2 公式:,3 計算,(二)幾何均數(shù)(geometric mean ),25,PPT學習交流,例、有 5 份血清的抗體效價分別為 1:10 , 1:20 , 1:40 , 1:80 , 1:160 , 求平均抗體效價?,此 5 人血清的平均抗體效價為 1 : 40 。,26,PPT學習交流,使用注意: (1)變量值中不能有 0; (2)同一組變量值不能同時存在正,負值; (3)若變量全為負值,計算時將負號除去,算完后再加上。,有 25 份血清的抗體效價分別為 抗體效價 1

8、:10 , 1:20 , 1:40 , 1:80 , 1:160 , 人數(shù) 2 5 8 7 3,所以,這 25 份血清的平均效價是 1:44.7 。,27,PPT學習交流,(三)中位數(shù)(median)及百分位數(shù)(percentile) 將一組變量值從小到大排列,居中的那個變量值。 1 .適用條件:任何分布(偏態(tài)、分布不明、兩端無界限) 2 .計算公式: 小樣本:,當 n 為偶數(shù),例、有 10 人的發(fā)汞值( ) 1.1,1.8,3.5,4.2,4.8,5.6,5.9,7.1,10.5,16.3,當 n 為奇數(shù):,28,PPT學習交流,L : M 所在組的下限 i : M 所在組的組距 fm :

9、M 所在組的頻數(shù) : M 所在組前一組累積頻數(shù),大樣本:,5,7,發(fā)汞值,60,M,5,7,29,PPT學習交流,例 2.16 在某市測得 239 名正常人發(fā)汞,資料見表 2.11 ,試計算其 95 參考值范圍。 表 2.11 某市 239 名正常人發(fā)汞值,某市 239 名正常人發(fā)汞值,累積 頻數(shù),30,PPT學習交流,百分位數(shù),0 Px M 100%,百分位數(shù)是一個位置指標,以 PX 表示。 一個百分位數(shù)將全部觀察值分為兩部分: x%的變量值小于 PX ;( 100 -x )%的變量值大于 PX 。 有 10 人的發(fā)汞值(umol/Kg) 1.1, 1.8, 3.5, 4.2, 4.8, 5

10、.6, 5.9, 7.1, 10.5,16.3,31,PPT學習交流,某市 239 名正常人發(fā)汞值,發(fā)汞值 男性 女性 合計頻數(shù) 累積頻數(shù),32,PPT學習交流,應(yīng)用中位數(shù)和百分位數(shù)時注意事項: 所有分布類型的資料均可計算中位數(shù)和百分位數(shù); 例數(shù)較少時,接近兩端的百分位數(shù)不穩(wěn)定,不宜用兩端 的百分位數(shù)估計頻數(shù)分布范圍; 中位數(shù)抗極端值的影響,比均數(shù)好,但不及均數(shù)精確; 當資料可計算均數(shù)或幾何均數(shù)時,不宜計算中位數(shù)。,33,PPT學習交流,描述集中趨勢的指標:平均數(shù) 種類 適用條件 計算公式 正態(tài)分布 對數(shù)正態(tài) 任何分布,34,PPT學習交流,有甲、乙兩組同性別同年齡兒童體重 (公斤) : 甲組

11、 26 , 28 , 30 , 32 , 34 乙組 24 , 27 , 30 , 33 , 36,看一個實例,上述兩組數(shù)據(jù)的特點: 集中位置 相同:均為30kg 離散程度不同:各觀察值與均數(shù)的差值不同,35,PPT學習交流,離散趨勢的描述,全距(range) 四分位數(shù)間距( interquartile range Q ) 方差、標準差(variance and standard deviation) 變異系數(shù)(coefficient of variation),36,PPT學習交流,1.全距(極差) R=Xmax- Xmin 反映資料的分布范圍 R 大變異程度大, R 小變異程度小 優(yōu)點:簡

12、單明了 缺點:不靈敏:只考慮了最大、最小值 抽樣誤差大,不穩(wěn)定,37,PPT學習交流,2.四分位數(shù)間距(Q) 即 P75 與 P25 之差 P25 :1/4 的觀察值小于它,稱下四分位數(shù) P25 QL。 P75 :1/4 的觀察值大于它,稱上四分位數(shù) P75 QU。 Q=QU-QL,其間包含了中間的 50% 變量值,即 中間 50% 變量值的極差。,Q 值大變異程度大, Q 小變異程度小,偏態(tài)分布資料,集中趨勢中位數(shù) 離散趨勢四分位數(shù),38,PPT學習交流,3.方差與標準差,離均差總和,離均差平方和,方差,標準差,自由度,39,PPT學習交流,( 1-4 )+( 2-4 )+( 3-4 )+(

13、 4- -3-2-1+0+1+2+3 0,對于對稱分布或正態(tài)分布資料其離均差總和恒等于 0 。,4 )+( 5-4 )+( 6-4 )+( 7-4 ),例: 1 、 2 、 3 、 4 、 5 、 6 、 7,40,PPT學習交流,計算公式:,甲組: 26 , 28 , 30 , 32 , 34 乙組: 24 , 27 , 30 , 33 , 36,標準差表示一組變量值與均數(shù)的平均距離 直接、全面、平均地描述一組變量值的離散程度。,41,PPT學習交流,標準差是描述變量值變異程度的指標。 標準差大 變異程度大 均數(shù)的代表性差 標準差小 變異程度小 均數(shù)的代表性好,用途 1 表示變異程度的大小

14、2 計算標準誤、變異系數(shù) 3 估計正常值范圍,幻燈片 31,標準差的意義,42,PPT學習交流,一個實例,例:某地 20 歲男子 100 人,身高均數(shù)為 166.06 cm ,標準差為 4.95 cm ;體重均數(shù)為 53.7 kg ,標準差為 4.96 kg,問:體重和身高,哪個變異大?,43,PPT學習交流,使用條件: 均數(shù)相差較大時,比較各組資料的變異度; 度量衡單位不同時,比較各組資料的變異程度。,4.變異系數(shù)(離散系數(shù)),44,PPT學習交流,某地 6 歲以下兒童身高 (cm) 的變異,絕對變異受平均水平的影響 相對變異排除了平均水平的影響,45,PPT學習交流,描述離散程度的指標 種

15、類 應(yīng)用條件 計算公式 R 任何資料 R= Xmax- Xmin Q 偏態(tài)分布資料 S2 ( S ) 正態(tài),單位同 均數(shù)相差不大 CV 單位不同,均數(shù)差大,46,PPT學習交流,小結(jié):定量資料的描述,列表描述:頻數(shù)分布表、一覽表 圖形描述:頻數(shù)分布圖、趨勢圖 指標描述 定量資料 集中位置:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù) 離散程度:極差、四分位數(shù)間距、方差、標準差 定性或等級資料 相對數(shù)指標:率、構(gòu)成比、比,47,PPT學習交流,平均數(shù)與變異度的關(guān)系,平均數(shù)表示的集中性與變異度表示的離散性,是從兩個不同的角度闡明計量資料的特征 變異度越小,平均數(shù)對各變量值的代表性越好 變異度越大,平均數(shù)對

16、各變量值的代表性越差,48,PPT學習交流,平均數(shù)與變異度的關(guān)系,通常,平均數(shù)與變異指標一起描述資料的分布特征。 用均數(shù)和標準差描述正態(tài)分布資料的特征; 用中位數(shù)和四分位數(shù)間距描述偏態(tài)分布資料的特征。,49,PPT學習交流,絕對數(shù)的概念與意義,調(diào)查研究和實驗研究得到的定性資料或等級資料經(jīng)過整理,清點數(shù)目得到的數(shù)值稱為絕對數(shù)。 如某病的發(fā)病人次數(shù)、醫(yī)院收容人數(shù)、治愈人數(shù)等。 絕對數(shù)反映一定條件下某種事物的規(guī)?;蛩?是計劃或總結(jié)工作的依據(jù), 絕對數(shù)是計算相對數(shù)與平均數(shù)的基礎(chǔ)。 絕對數(shù)往往不便于比較。,50,PPT學習交流,例:調(diào)查得某年小學生中流腦發(fā)?。杭椎貐^(qū) 63例,乙地區(qū)35例。,甲地區(qū)流腦

17、流行比乙地區(qū)嚴重,如已知小學生總?cè)藬?shù):甲地區(qū)50051人,乙地區(qū)14338人,可算出兩個發(fā)病率: 甲地區(qū)流腦發(fā)病率:63/500511000=1.26 乙地區(qū)流腦發(fā)病率:35/14338 1000=2.44,乙地區(qū)流腦流行比甲地區(qū)嚴重,51,PPT學習交流,相對數(shù)的概念 和意義,概念:相對數(shù)是兩個有聯(lián)系的指標之比。 兩個特點: 表示事物出現(xiàn)的頻度。 把基數(shù)化作相等,便于比較。 常用相對數(shù) 率、構(gòu)成比、相對比,52,PPT學習交流,率,率(rate)又稱頻率指標,用以說明某事物或某現(xiàn)象在其可能發(fā)生的范圍內(nèi)實際發(fā)生的頻率或強度。計算公式為:,53,PPT學習交流,表 1.5 某市某年各區(qū)急性傳染病

18、發(fā)生數(shù)及其相對數(shù) 市區(qū) 年平均 急性傳染病 各區(qū)與區(qū) 構(gòu)成比 發(fā)病率 人口數(shù) 發(fā)生數(shù) 發(fā)病數(shù)之比 () (/萬) 1 636723 2433 1.00 18.9 38.21 2 389540 3033 1.25 23.5 77.86 3 699712 1650 0.68 12.8 23.58 4 328363 1503 0.62 11.6 45.77 5 286967 1282 0.53 10.0 44.67 6 317504 1853 0.76 14.4 58.36 7 153838 1130 0.46 8.8 73.45 合計 2812647 12884 100.0 45.81,54,PP

19、T學習交流,關(guān)于率的幾點說明(一),分子和分母都是計數(shù)值,從定義上來看,分子應(yīng)為分母的一部分,但在實際應(yīng)用中一些率的指標可能并不符合率的定義,但它們是約定俗成、沿習使用的。 根據(jù)頻率的穩(wěn)定性,分母較大時,可以用率作為該事件發(fā)生機會(即概率)的近似值。 例如:醫(yī)治100例病人,90例痊愈, 則:治愈率=90/100=90%。 它近似的反映了病人治愈機會的大小。,55,PPT學習交流,關(guān)于率的幾點說明(二),0 rate1 率常以百分率(%)、千分率()、萬分率(1萬)、十萬分率(l10萬)等表示。 比例基數(shù)(K )可以是100、1000、,其選取是根據(jù)習慣用法和需要選用,主要使算得的率至少保留1

20、2位整數(shù),便于閱讀。 患病率、發(fā)病率、感染率 :百分率(%) 人口出生率與死亡率: 千分率() 腫瘤死亡率: 十萬分率(l10萬),56,PPT學習交流,構(gòu)成比,構(gòu)成比(proportion) 又稱構(gòu)成指標,表示某一事物內(nèi)部各組成部分所占的比重或分布,常以百分數(shù)表示,計算公式為:,57,PPT學習交流,設(shè)某事物個體數(shù)的合計由A1,A2,Ak個部分組成,構(gòu)成比計算為:,58,PPT學習交流,構(gòu)成比的特點:,同一事物內(nèi)部的k個組成部分構(gòu)成比總和為100%。 各部分構(gòu)成比之間是相互影響的,某一部分比重的變化受到兩方面因素的影響:其一是這個部分自身數(shù)值的變化,其二受其他部分數(shù)值變化的影響。,59,PP

21、T學習交流,相對比,相對比(ratio)亦稱比,是 A、B兩個有關(guān)指標之比。 說明A為B的若干倍或百分之幾,它是對比的最簡單形式。A、B兩個指標可以是絕對數(shù),也可以是相對數(shù);可以性質(zhì)相同,也可以性質(zhì)不同;可以是定性資料,也可以是定量資料。,60,PPT學習交流,正確應(yīng)用相對數(shù)(一),計算相對數(shù)的分母不宜過小 例數(shù)較少,相對數(shù)波動較大。如:0/2,1/2,2/2 例數(shù)較少時,宜用絕對數(shù)表示,必須用相對數(shù)時,可同時列出其可信區(qū)間。,61,PPT學習交流,分析時不能以構(gòu)成比代替率 率反映的是頻率或者強度 構(gòu)成比反映的是比重或分布,正確應(yīng)用相對數(shù)(二),62,PPT學習交流,正確應(yīng)用相對數(shù)(三),正確計算合并率 對觀察單位數(shù)不等的幾個率,不能直接相加求其平均率(或稱總率) 例如用某療法治療肝炎,第一次治療150人,治愈30人,治愈率20%;第二次治療100人,治愈30人,治愈率30%。試計算兩批的合并治愈率。 觀察單位數(shù)相等時?,63,PPT學習交流,正確應(yīng)用相對數(shù)(四),計算率時要注意資料的同質(zhì)性 對比分析時應(yīng)注意資料的可比性 所謂可比,就是說除了要對比的因素外(如不同藥物),其余的影響因素應(yīng)盡可能的相同、相似或接近。 觀察對象同質(zhì),研究方法相同,觀察時間相等,以及地區(qū)、周圍環(huán)境、風俗習

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論