統(tǒng)計描述的正確應用.ppt_第1頁
統(tǒng)計描述的正確應用.ppt_第2頁
統(tǒng)計描述的正確應用.ppt_第3頁
統(tǒng)計描述的正確應用.ppt_第4頁
統(tǒng)計描述的正確應用.ppt_第5頁
已閱讀5頁,還剩128頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1,統(tǒng)計描述的正確應用,張菊英 教授 四川大學華西公共衛(wèi)生學院,2,一、定量資料的統(tǒng)計描述,定量變量 關(guān)注測定值的大小,3,定量資料的統(tǒng)計描述,主要內(nèi)容: 定量資料的頻數(shù)表 集中位置的統(tǒng)計描述 離散程度的統(tǒng)計描述,4,1.定量資料的頻數(shù)表和頻數(shù)分布圖,揭示頻數(shù)分布的特征:集中趨勢、離散程度 揭示頻數(shù)分布的類型:對稱分布、偏態(tài)分布 便于進一步計算指標和統(tǒng)計處理 便于發(fā)現(xiàn)某些特大或特小的可疑值,5,1.1離散型定量變量的頻數(shù)表,表1.1 2005年某市102名高中男生引體向 上 完成次數(shù)的頻數(shù)分布,按變量的取值為分組單位,6,1.2 連續(xù)型定量變量的頻數(shù)表,表1.2 2005年某市120名9歲男孩肺活量(L)頻數(shù)分布,根據(jù)數(shù)據(jù)劃分的組段,7,1.3 頻數(shù)分布圖,用圖形的方法能夠直觀形象地表達頻數(shù)分布的信息,并可與頻數(shù)表互為補充 連續(xù)型定量變量的頻數(shù)表可繪制成直方圖,8,圖1.1 2005年某市120名9歲男孩肺活量頻數(shù)分布,9,2.集中位置的統(tǒng)計描述,集中趨勢(central tendency) 一組數(shù)據(jù)向某一個位置聚集或集中的傾向 集中位置用平均數(shù)描述,10,2.1 均數(shù)與中位數(shù),均數(shù)(mean) 適用條件:對稱分布,特別是正態(tài)或近似正態(tài)分布的定量資料。 中位數(shù)(median,M ) 適用條件:偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料 。,11,某市1974年留駐該市一年以上,無明顯肝、腎疾病,無汞作業(yè)接觸史的居民238人的發(fā)汞值(mol/kg)檢測結(jié)果如表1.3的第1和3列所示。,表1.3 某市1974年238人得發(fā)汞檢測結(jié)果,應采用何種指標對該數(shù)據(jù)的集中趨勢進行描述?,13,均數(shù)與中位數(shù),表1.4 不同級別醫(yī)院費用比較( ,元),所使用的指標正確嗎?,14,例 某實驗室觀察局部溫熱治療小鼠移植性腫瘤的療效,以生存日數(shù)(天)作為觀察指標,共觀察10只老鼠的生存日數(shù)(天)為:10,12,15,15,16,17,18,20,23,90。試描述10只老鼠生存日數(shù)的平均水平。,15,2.2 幾何均數(shù)(geometric mean),適用條件:某些呈正偏態(tài)分布,但數(shù)據(jù)經(jīng)過對數(shù)變換后呈正態(tài)分布的資料,也可用于觀察值之間呈倍數(shù)或近似倍數(shù)變化(等比關(guān)系)的資料。,16,表1.5 75名兒童的平均抗體滴度計算表,觀察值呈倍數(shù)關(guān)系,17,幾何均數(shù)的應用,18,3. 離散程度的統(tǒng)計描述,離散度指標反映一組同質(zhì)觀察值的變異度; 常用的指標有全距、四分位數(shù)間距、方差、標準差和變異系數(shù); 其值越大,表示資料的變異程度越大。,19,3.1 極差(range,簡記為R),涵義:也稱全距,即全部數(shù)據(jù)中最大值與最小值之差,用符號表示。極差大,說明變異程度大。 適用條件:常由于描述單峰對稱分布小樣本資料的變異程度或由于初步了解資料的變異程度。 缺點:只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;,20,例 試觀察三組數(shù)據(jù)的離散狀況,A組:26,28,30,32,34; B組:24,27,30,33,36; C組:26,29,30,31,34。,21,將三組數(shù)據(jù)分別點在直線上,如圖:,圖1.2 三組數(shù)據(jù)離散狀況比較,計算三組數(shù)據(jù)的極差: A組 R=34-26=8 B組 R=36-24=12 C組 R=34-26=8,A、C兩組極差相同,但由圖3.1可以看出兩組觀察值的離散程度是不同的。,22,3.2 百分位數(shù)(percentile),涵義:是指將觀察值從小到大排列后處于第x百分位置上的數(shù)值,用符號表示為 百分位數(shù)是一個位置指標,其中P50為中位數(shù),23,3.3 四分位數(shù)間距,四分位數(shù)(quartile,簡記為Q) 通過P25,P50,P75這3個點將全部觀察值等分為四部分,處于P25和P75分位點上的數(shù)值就是四分位數(shù) P25下四分位數(shù),用 表示 P75上四分位數(shù),用 表示 四分位數(shù)間距(inter-quartile range)為上、下四分位數(shù)之間的差值,即,24,四分位數(shù)間距的適用條件,常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。,某研究者在“清醒狀態(tài)下大鼠腦震蕩動物模型的建 立”一文中,給出了如下的資料,請問:這樣表達妥 當么?,表1.6 大鼠頭部受傷后1d迷宮實驗的結(jié)果,對策1 作變量變換,看資料經(jīng)過變換后是否滿足正態(tài)性要求 對策2 若未找到合適的變換方法,用中位數(shù)或四分位數(shù)間距,例 50例鏈球菌咽峽炎患者的潛伏期(小時)如下表第(1)(3)列,,表1.7 50例鏈球菌咽峽炎患者潛伏期(小時)的頻率分布表,描述其離散程度應選用何種指標?,27,優(yōu)缺點,四分位數(shù)間距較全距穩(wěn)定,但仍未考慮全部觀察值的變異度。,28,3.4方差和標準差,為了全面考慮每個觀察值的變異情況,克服全距和四分位數(shù)間距的缺點,引入了方差 。 方差的單位是觀察值單位的平方,在實際工作中使用不方便,為還原單位,將方差開平方即得到標準差(standard deviation)??傮w標準差用 表示,樣本標準差用S 表示。,29,方差和標準差的適用條件,正態(tài)或近似正態(tài)分布資料,30,變異系數(shù)(coefficient of variation),簡記為CV 適用: 比較計量單位不同的幾組資料的離散程度 比較均數(shù)相差懸殊的幾組資料的離散程度,例 1985年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為8.42kg,標準差為0.98kg;身高均數(shù)為72.4cm,標準差為3.0cm。 某研究者就此判斷十省農(nóng)村周歲女童身高的變異大于體重的變異,他的判斷正確嗎?,體重 身高,32,描述定量變量指標的正確選擇,正態(tài)或近似正態(tài)分布的資料 均數(shù)和標準差 偏態(tài)分布的資料 中位數(shù)和四分位數(shù)間距 等比級數(shù)或?qū)?shù)正態(tài)分布的資料 幾何均數(shù),33,二、定性資料的統(tǒng)計描述,常用相對數(shù)及其應用 應用相對數(shù)的注意事項 率的標準化,34,相對數(shù),概念:兩個有關(guān)的數(shù)據(jù)或指標之比。 例:甲小學有534人,乙小學為313人, 經(jīng)檢查發(fā)現(xiàn), 甲學校學生中患齲齒者57人, 乙學校33人, 問那所學校發(fā)現(xiàn)患齲齒的強度高?,35,率 構(gòu)成比 相對比,常用的相對數(shù),表2.1 某市某年各區(qū)急性傳染病發(fā)生數(shù)及其相對數(shù),相對比,構(gòu)成比,率,37,1.率,概念: 說明某現(xiàn)象出現(xiàn)的頻率或強度。 類型:頻率(frequency) 、速率(rate),38,頻率(frequency),式中k為比例基數(shù),常取100、1000和100000/10萬等。 特點:分母不引入時間因素、無時間量綱、取值在01之間 常見頻率指標:發(fā)病率、患病率、病死率、治愈率等,例 為研究吸煙與肺癌的關(guān)系,某醫(yī)生收集了 2003-2005年286例住院肺癌患者的吸煙史,吸煙者中肺癌患的有166例,而同時期同年齡段的1855名肺癌患者中,吸煙的有407例。試計算該資料中肺癌患者與非肺癌患者的吸煙率。 肺癌患者吸煙率=166/286100%=58.04% 非肺癌患者吸煙率=407/1855100%=21.94%,某課題組為研究白細胞減少癥與工作環(huán)境的關(guān)系,用隨機抽樣的方法于2004年對某市企業(yè)中的四個工種共1114名工人進行了調(diào)查。依據(jù)白細胞減少癥的診斷標準判斷調(diào)查對象是否患者。,表2.2 不同工種的白細胞減少癥患病率,41,速率(rate),式中k為比例基數(shù),常取100、1000和100000/10萬等。 特點:包含時間因素、有量綱、取值在0,+) 常見速率指標:年發(fā)病率、某病患者5年生存率,42,例 在一項隨訪研究中,對125人追蹤隨訪了2年,結(jié)果有2人發(fā)生了死亡,試求其年死亡率。 年死亡率=2/(1252)100%=0.8%,觀察人時數(shù),43,率是兩個數(shù)值的比,作為分子和分母的兩個數(shù)值的內(nèi)涵決定了所計算出來率的含義,如死亡率、發(fā)病率、病死率等。,44,在一篇報道多器官衰竭者監(jiān)護效果的文章中有如下描述:“累及2個器官的20例,死亡8例,死亡率為40%;累及3個器官的10例,死亡9例,死亡率90%”。 這里把病死率錯當成死亡率進行報道。,45,2.構(gòu)成比,概念:說明某一事物內(nèi)部各組成部分所占比重或分布, 常用百分數(shù)表示。 特點: 總體內(nèi)各組構(gòu)成比的總和應為1或者100%; 事物內(nèi)部各組成部分構(gòu)成比之間呈此消彼長。,46,表2.3 某醫(yī)院2003年各科室收治住院患者的構(gòu)成情況,47,3.相對比 (ratio),概念:簡稱比,是兩個有關(guān)聯(lián)的指標的比值,用以說明一個指標是另一指標的幾倍或幾分之幾。 分類: 關(guān)系指標:有關(guān)的非同類事物指標之比,如醫(yī)護人員數(shù)與病床數(shù)之比 對比指標:同類事物兩個指標之比,如出生性別比,48,例 為了解新生兒的鋅的營養(yǎng)狀況,分別測量某醫(yī)院足月兒以及早產(chǎn)兒的臍血血清鋅含量,結(jié)果顯示足月兒及早產(chǎn)兒的臍血血清鋅含量的均數(shù)分別為1.85 mg/L和1.41 mg/L,則該醫(yī)院足月兒與早產(chǎn)兒的臍血血清鋅含量之比1.85/1.41=1.31,即該醫(yī)院足月兒臍血血清鋅含量是早產(chǎn)兒的1.31倍。,49,4. 應用相對數(shù)時應注意的問題,分母觀察單位數(shù)不能太少 不能以構(gòu)成比代率 應當特別注意不能用構(gòu)成比的動態(tài)分析代替率的動態(tài)分析 對觀察單位不等的幾個率不能相加求平均率 相對數(shù)進行比較應注意可比性 比較樣本率或構(gòu)成比需作假設(shè)檢驗,50,4.1 分母觀察單位數(shù)不能太少,某醫(yī)師應用一種新的手術(shù)方法治療了3例某病病人全部痊愈,此醫(yī)師由此報道新的手術(shù)方法痊愈率為100,以前的手術(shù)方法痊愈率為70,故得出新的手術(shù)方法優(yōu)于以前的手術(shù)方法。 試問該說法是否正確?,51,4.2不能以構(gòu)成比代率,下表中,列出了5種心理問題,原作者根據(jù)各行數(shù)據(jù)和總患者人數(shù)50,計算出5個相對數(shù),并稱之為“百分比”,對嗎?,表2. 4 病人常見的心理問題(n=50),52,某研究者“208例肺不張的病因與臨床分析”研究中男性患者152例,占73%,女性患者56例,占27%,因此男性肺不張的發(fā)病率高于女性。試述該結(jié)論是否正確,并說明理由。,表2.5 某市1980年和1990年五種傳染病發(fā)病情況,54,有人據(jù)此得出1990年和1980年相比,痢疾發(fā)病率下降,肝炎發(fā)病率上升最明顯的結(jié)論。該結(jié)論是否正確?,55,4.3 對觀察單位不等的幾個率不能相加求平均率,某班有男生50人,女生20人,男生英語四級通過率為80%,女生四級通過率為100%,請問該班四級通過率為多少? 答案1:90%? 答案2:85.7%?,56,例 某醫(yī)院消化內(nèi)科上半年收治250例胃潰瘍患者,治愈200例,治愈率為80.0%;下半年收治280例胃潰瘍患者,治愈238例,治愈率為85.0%,則該消化內(nèi)科全年對胃潰瘍的治愈率應該是 而不是(80%+85%)/2=82.5%,57,4.4 兩個率或構(gòu)成比的對比應注意可比性,試驗組和對照組除研究因素外,其余重要的非處理因素,如觀察對象、研究方法、觀察時間、地區(qū)和民族等因素應相同或相近。 兩比較組的內(nèi)部構(gòu)成應相同或相近。,58,相對數(shù)進行比較應注意可比性,兩種療法治療某病的死亡率如下表所示:,表2.6 兩種療法治療某病的病死率,59,如果只比較合計病死率,似乎新療法優(yōu)于一般療法,但當分別考察普通型病例和重型病例時,兩種療法的病死率是相同的。 原因:兩種療法治療對象的病型構(gòu)成不同,新療法組普通型病例多而重型病少,一般療法組卻是普通型病例少而重型病例多。,60,4.5 比較樣本率或構(gòu)成比需作假設(shè)檢驗,例 為了解某校本科生體測合格率的性別差異。隨機抽查了本科男生110人和女生130人,其中男生合格率為90.91%,女生合格率為78.85%,有人據(jù)此認為男生的合格率高于女生。,61,動態(tài)數(shù)列及其應用,概念:動態(tài)數(shù)列(dynamic series)是一系列按時間順序排列起來的統(tǒng)計指標,包括絕對數(shù)、相對數(shù)或平均數(shù),用以說明事物在時間上的變化和發(fā)展趨勢。,62,動態(tài)數(shù)列及其應用,常用動態(tài)數(shù)列指標: 絕對增長量:累計增長量、逐年增長量 發(fā)展速度:定基比、環(huán)比 增長速度:增長速度=發(fā)展速度-1 平均發(fā)展速度: 平均增長速度:平均增長速度=平均發(fā)展速度-1,63,常用動態(tài)數(shù)列指標,絕對增長量:累計增長量、逐年增長量 發(fā)展速度:定基比、環(huán)比 增長速度:增長速度=發(fā)展速度-1 平均發(fā)展速度: 平均增長速度:平均增長速度=平均發(fā)展速度-1,表2.7 某地區(qū)19992002住院患者數(shù)發(fā)展動態(tài),65,5. 標準化法,基本思想 采用統(tǒng)一的標準構(gòu)成,以消除混雜因素的影響,使算得的標準化率具有可比性。 標準化法 直接法 間接法,表2.8 甲、乙兩地各年齡組人口數(shù)和死亡率(),某研究者據(jù)此認為,甲地的死亡率高于乙地,他的結(jié)論是否正確?,67,5.1 直接標化法,適用條件:已知被標化組的死亡率 已知標準組年齡別人口數(shù): 已知標準組年齡別人口構(gòu)成比:,表2.10 用直接法計算標準化死亡率(),70,標準人口的選擇,標準人口構(gòu)成應以所在地區(qū)如某市、某縣的年齡別人口構(gòu)成作為標準,若不可行也可用兩組各年齡別人口合計的構(gòu)成比代之。 兩個行政區(qū)域資料的比較中,如兩個縣、兩個市、兩個省的比較中,常以全國人口作為標準人口。,71,計算標準化率的步驟,根據(jù)現(xiàn)有數(shù)據(jù)的條件選用直接法或間接法 選定標準:標準組應有代表性、穩(wěn)定、數(shù)據(jù)量 較大的人群 應用公式計算 樣本標化率應作統(tǒng)計推斷,72,5.2 標準化法注意事項,1. 由于選定的標準人口不同,算得的標準化率也不同,故標準化率不表示某地實際水平,僅反映資料間的相對水平。,73,表2.11 甲、乙兩種療法治療某病的治愈率比較,74,選取兩組合并人口作為標準人口,表2.12 兩種療法甲、乙兩種療法治療某病的標準化治愈率,75,選定甲療法組作為標準組,表2.13 兩種療法甲、乙兩種療法治療某病的標準化治愈率,76,2. 各年齡組率若出現(xiàn)明顯交叉,宜比較年齡組死亡率,不用標準化法;如不計算標準化率,而分別計算各分組的率,也可得出正確結(jié)論,但不能比較總率的大小。,表2.14 2000年甲乙兩地某病死亡率(),如何比較兩地該病的死亡率?,78,3. 一般情況下,直接法計算簡便,易于了解,更為常用;如原資料中有些年齡組人口過少,致使年齡別死亡率波動較大時,宜用間接法。 4. 兩樣本標化率的比較應作假設(shè)檢驗,79,三、統(tǒng)計分析結(jié)果的正確表達,常用統(tǒng)計表與統(tǒng)計圖 醫(yī)學論文統(tǒng)計報告的基本要求 統(tǒng)計分析結(jié)果表達的常見錯誤,80,1. 常用統(tǒng)計表,統(tǒng)計表:以表格的形式表達科研結(jié)果中的數(shù)據(jù) 和統(tǒng)計指標。 優(yōu)點:簡潔、條理化、便于閱讀比較,81,1.1 統(tǒng)計表的制作原則,重點突出 層次清楚 簡單明了,82,1.2 統(tǒng)計表的基本結(jié)構(gòu),標題 標目 線條 數(shù)字,83,標題,標題是對表格內(nèi)容的高度概括 時間、地點、內(nèi)容 左側(cè)加表序號,置于表的正上方,84,標目,橫標目位于表頭左側(cè),代表研究的對象 縱標目位于表頭右側(cè) ,代表研究指標 (帶單位),85,線條,三線表頂線、底線、縱標目下橫線 一律不能使用豎線和斜線,86,數(shù)字,同一指標小數(shù)點位數(shù)一致,位次對齊 無數(shù)字用“”表示,缺失數(shù)字用“”表示,數(shù)值為0者記為“0”。 數(shù)字區(qū)不要插入文字,也不列備注項,某項研究比較三種治療方法對中晚期胃癌患者的療效,同時記錄了各種毒副反應的發(fā)生情況。某醫(yī)生將收集得到的資料整理成下表。,表格的標題沒有準確、全面的概括表中的內(nèi)容,某項研究比較三種治療方法對中晚期胃癌患者的療效,同時記錄了各種毒副反應的發(fā)生情況。某醫(yī)生將收集得到的資料整理成下表。,表格的線條太多,不規(guī)范,某項研究比較三種治療方法對中晚期胃癌患者的療效,同時記錄了各種毒副反應的發(fā)生情況。某醫(yī)生將收集得到的資料整理成下表。,橫標目和縱標目的安排不合理 橫標目位于表頭左側(cè),代表研究的對象 縱標目位于表頭右側(cè) ,代表研究指標(帶單位),某項研究比較三種治療方法對中晚期胃癌患者的療效,同時記錄了各種毒副反應的發(fā)生情況。某醫(yī)生將收集得到的資料整理成下表。,備注說明不清楚,某項研究比較三種治療方法對中晚期胃癌患者的療效,同時記錄了各種毒副反應的發(fā)生情況。某醫(yī)生將收集得到的資料整理成下表。,數(shù)據(jù)表達過于復雜,不夠清晰明了,92,修改后的統(tǒng)計表如下,錯誤表格示例,94,修改后的統(tǒng)計表如下,95,96,例,97,數(shù)值單位未注明,98,縱標目表示分組方式不當,99,2. 常用統(tǒng)計圖,統(tǒng)計圖:以幾何圖形表達科研結(jié)果中的數(shù)據(jù)和統(tǒng)計指標。 優(yōu)點:形象、直觀,100,2.1統(tǒng)計圖的制作原則,選用適當?shù)慕y(tǒng)計圖 制圖空間一般位于第一象限 準確、美觀,101,2.2 統(tǒng)計圖的基本結(jié)構(gòu),標題位于圖的正下方 標目表示橫軸和縱軸數(shù)字刻度的意義 刻度橫縱坐標軸上的坐標尺度,橫縱軸長度比例一般為5:7 或7:5 圖例以平衡美觀為原則,102,2.3 幾種常用統(tǒng)計圖,條圖:用相同寬度的直條長短表示相互獨立的統(tǒng)計指標的數(shù)值大小和它們之間的對比關(guān)系 條圖的結(jié)構(gòu):橫軸為分組因素、縱軸為統(tǒng)計指標 條圖類型:單式條圖、復式條圖,103,圖3.1 全國各地區(qū)1990年、2000年人口總數(shù)比較,2.3.1 條圖,104,注意:條圖的尺度必須從0開始,否則會改變 各對比組間的比例關(guān)系,105,例 小聰和小明競選學生會主席。通過民意調(diào)查,小聰目前的支持率為43,小明的支持率為41,可謂旗鼓相當。小聰?shù)母傔x參謀彤彤根據(jù)調(diào)查結(jié)果繪制了一張條圖(圖3.2),用以反應目前兩名競爭對手的支持率,并將該圖作為小聰?shù)母傔x海報。請指出圖3.2是否存在不妥之處,該圖作為小聰?shù)母傔x海報可能產(chǎn)生什么效果。,106,圖3.2 小聰和小明的支持率對比,縱坐標不是從0開始,于是給人的印象是小聰?shù)闹С致?比小明多約兩倍的假象。,107,圖3.3 1990年華東與東北地區(qū)人口數(shù)比較,圖3.4 1990年華東與東北地區(qū)人口數(shù)比較,108,2.3.2 圓圖,圓圖:以圓的總面積表示事物的全部,將其分割成若干扇面表示事物內(nèi)部各構(gòu)成部分所占的比重 一般從相當于時鐘12點位置作為起點,109,110,2.3.3 百分比條圖,百分比條圖:以某一矩形總長度表示事物的全部,將其分割成不同長度的段表示各構(gòu)成的比重 ,適合描述分類變量的各類別所占的構(gòu)成比 。 特別適合比較多個構(gòu)成比,111,112,2.3.4 線圖,線圖:用線段的升降來表示數(shù)值的變化,適合于描述某統(tǒng)計量隨另一連續(xù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論