《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》完全版_第1頁
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》完全版_第2頁
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》完全版_第3頁
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》完全版_第4頁
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》完全版_第5頁
已閱讀5頁,還剩648頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第1章緒論,第1頁 共654頁,醫(yī)學(xué)本科生用 醫(yī) 學(xué) 統(tǒng) 計(jì) 學(xué),wanshoy,第1章緒論,第2頁 共654頁,醫(yī)學(xué)統(tǒng)計(jì)學(xué)總目錄,第1章緒論,第2章定量資料統(tǒng)計(jì)描述,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第4章方差分析,第5章定性資料的統(tǒng)計(jì)描述,第6章總體率的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第7章二項(xiàng)分布與泊松分布,第8章秩和檢驗(yàn),第9章直線相關(guān)與回歸,第10章實(shí)驗(yàn)設(shè)計(jì),第11章調(diào)查設(shè)計(jì),第12章統(tǒng)計(jì)表與統(tǒng)計(jì)圖,第1章緒論,第3頁 共654頁,第1章緒論 目錄,第五節(jié) 學(xué)習(xí)統(tǒng)計(jì)學(xué)應(yīng)注意的幾個(gè)問題,第二節(jié) 統(tǒng)計(jì)工作的基本步驟,第三節(jié) 統(tǒng)計(jì)資料的類型,第四節(jié) 統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念,第一節(jié) 醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義和

2、內(nèi)容,第1章緒論,第4頁 共654頁,第一章 緒論 第一節(jié) 醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義和內(nèi)容,醫(yī)學(xué)統(tǒng)計(jì)學(xué)(medical statistics) -是以醫(yī)學(xué)理論為指導(dǎo),運(yùn)用數(shù)理統(tǒng)計(jì)學(xué)的原理和方法研究醫(yī)學(xué)資料的搜集、整理與分析,從而掌握事物內(nèi)在客觀規(guī)律的一門學(xué)科。,第1章緒論,第5頁 共654頁,醫(yī)學(xué)研究的對(duì)象-主要是人以及與其健康有關(guān)的各種影響因素。 醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容 : 1.統(tǒng)計(jì)設(shè)計(jì) 包括實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì),它可以合理地、科學(xué)地安排實(shí)驗(yàn)和調(diào)查工作,使之能較少地花費(fèi)人力、物力和時(shí)間,取得較滿意和可靠的結(jié)果。 2.資料的統(tǒng)計(jì)描述和總體指標(biāo)的估計(jì) 通過計(jì)算各種統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)圖表來描述資料的集中趨勢(shì)、離散

3、趨勢(shì)和分布特征況(如正態(tài)分布或偏態(tài)分布);利用樣本指標(biāo)來估計(jì)總體指標(biāo)的大小。,第1章緒論,第6頁 共654頁,3.假設(shè)檢驗(yàn) 是通過統(tǒng)計(jì)檢驗(yàn)方法(如t檢驗(yàn)、u檢驗(yàn)、f檢驗(yàn)、卡方檢驗(yàn)、秩和檢驗(yàn)等)來推斷兩組或多組統(tǒng)計(jì)指標(biāo)的差異是抽樣誤差造成的還是有本質(zhì)的差別。 4.相關(guān)與回歸 醫(yī)學(xué)中存在許多相互聯(lián)系、相互制約的現(xiàn)象。如兒童的身高與體重、胸圍與肺活量、血糖與尿糖等,都需要利用相關(guān)與回歸來分析。,第1章緒論,第7頁 共654頁,5.多因素分析 如多元回歸、判別分析、聚類分析、正交設(shè)計(jì)分析、主成分分析、因子分析、logistic回歸、cox比例風(fēng)險(xiǎn)回歸等,都是分析醫(yī)學(xué)中多因素有效的方法(本書不涉及,請(qǐng)參

4、考有關(guān)統(tǒng)計(jì)書籍)。這些方法計(jì)算復(fù)雜,大部分需借助計(jì)算機(jī)來完成。 6.健康統(tǒng)計(jì) 研究人群健康的指標(biāo)與統(tǒng)計(jì)方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預(yù)測(cè)等方法,第1章緒論,第8頁 共654頁,醫(yī)學(xué)統(tǒng)計(jì)工作可分為四個(gè)步驟: 統(tǒng)計(jì)設(shè)計(jì)、搜集資料、整理資料和分析資料。 這四個(gè)步驟密切聯(lián)系,缺一不可,任何一個(gè)步驟的缺陷和失誤,都會(huì)影響統(tǒng)計(jì)結(jié)果的正確性。,第二節(jié) 統(tǒng)計(jì)工作的基本步驟,第1章緒論,第9頁 共654頁,設(shè)計(jì)(design)是統(tǒng)計(jì)工作的第一步,也是關(guān)鍵的一步,是對(duì)統(tǒng)計(jì)工作全過程的設(shè)想和計(jì)劃安排。 統(tǒng)計(jì)設(shè)計(jì)就是根據(jù)研究目的確定試驗(yàn)因素、受試對(duì)象和觀察指標(biāo),并

5、在現(xiàn)有的客觀條件下決定用什么方式和方法來獲取原始資料,并對(duì)原始資料如何進(jìn)行整理,以及整理后的資料應(yīng)該計(jì)算什么統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)分析的預(yù)期結(jié)果如何等。,一、統(tǒng)計(jì)設(shè)計(jì),第1章緒論,第10頁 共654頁,搜集資料(collection of date) 是根據(jù)設(shè)計(jì)的要求,獲取準(zhǔn)確可靠的原始資料,是統(tǒng)計(jì)分析結(jié)果可靠的重要保證。 醫(yī)學(xué)統(tǒng)計(jì)資料的來源主要有以下三個(gè)方面: 1.統(tǒng)計(jì)報(bào)表 統(tǒng)計(jì)報(bào)表是醫(yī)療衛(wèi)生機(jī)構(gòu)根據(jù)國家規(guī)定的報(bào)告制度,定期逐級(jí)上報(bào)的有關(guān)報(bào)表。如法定傳染病報(bào)表、出生死亡報(bào)表、醫(yī)院工作報(bào)表等,報(bào)表要完整、準(zhǔn)確、及時(shí)。,二、搜集資料,第1章緒論,第11頁 共654頁,2.醫(yī)療衛(wèi)生工作記錄 如病歷、醫(yī)學(xué)檢

6、查記錄、衛(wèi)生監(jiān)測(cè)記錄等。 3.專題調(diào)查或?qū)嶒?yàn)研究 它是根據(jù)研究目的選定的專題調(diào)查或?qū)嶒?yàn)研究,搜集資料有明確的目的與針對(duì)性。它是醫(yī)學(xué)科研資料的主要來源。,第1章緒論,第12頁 共654頁,整理資料(sorting data)的目的就是將搜集到的原始資料進(jìn)行反復(fù)核對(duì)和認(rèn)真檢查,糾正錯(cuò)誤,分類匯總,使其系統(tǒng)化、條理化,便于進(jìn)一步的計(jì)算和分析。整理資料的過程如下: 1.審核:認(rèn)真檢查核對(duì),保證資料的準(zhǔn)確性和完整性。 2.分組:歸納分組,分組方法有兩種: 質(zhì)量分組,即將觀察單位按其類別或?qū)傩苑纸M,如按性別、職業(yè)、陽性和陰性等分組。 數(shù)量分組,即將觀察單位按其數(shù)值的大小分組,如按年齡的大小、藥物劑量的大小

7、等分組。,三、整理資料,第1章緒論,第13頁 共654頁,3.匯總: 分組后的資料要按照設(shè)計(jì)的要求進(jìn)行 匯總,整理成統(tǒng)計(jì)表。原始資料較少時(shí)用手工匯 總,當(dāng)原始資料較多時(shí),可使用計(jì)算機(jī)匯總。 四、分析資料 分析資料(analysis of data) 是根據(jù)設(shè)計(jì)的要求,對(duì)整理后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,結(jié)合專業(yè)知識(shí),作出科學(xué)合理的解釋。,第1章緒論,第14頁 共654頁,1.統(tǒng)計(jì)描述(descriptive statistics) 將計(jì)算出的統(tǒng)計(jì)指標(biāo)與統(tǒng)計(jì)表、統(tǒng)計(jì)圖相結(jié)合,全面描述資料的數(shù)量特征及分布規(guī)律。 2.統(tǒng)計(jì)推斷(inferential statistics) 使用樣本信息推斷總體特征。通過

8、樣本統(tǒng)計(jì)量進(jìn)行總體參數(shù)的估計(jì)和假設(shè)檢驗(yàn),以達(dá)到了解總體的數(shù)量特征及其分布規(guī)律,才是最終的研究目的。,統(tǒng)計(jì)分析包括以下兩大內(nèi)容:,第1章緒論,第15頁 共654頁,醫(yī)學(xué)統(tǒng)計(jì)資料按研究指標(biāo)的性質(zhì)一般分為定量資料、定性資料和等級(jí)資料三大類。 一、定量資料 定量資料(quantitative data) 亦稱計(jì)量資料(measurement data),是用定量的方法測(cè)定觀察單位(個(gè)體)某項(xiàng)指標(biāo)數(shù)值的大小,所得的資料稱定量資料。如身高()、體重()、脈搏(次/分)、血壓(kpa)等為數(shù)值變量,其組成的資料為定量資料。,第三節(jié) 統(tǒng)計(jì)資料的類型,第1章緒論,第16頁 共654頁,定性資料(qualitat

9、ive data) 亦稱計(jì)數(shù)資料(enumeration data)或分類資料(categorical data),是將觀察單位按某種屬性或類別分組,清點(diǎn)各組的觀察單位數(shù),所得的資料稱定性資料。 定性資料的觀察指標(biāo)為分類變量(categorical variable)。如人的性別按男、女分組;化驗(yàn)結(jié)果按陽性、陰性分組;動(dòng)物實(shí)驗(yàn)按生存、死亡分組;調(diào)查某人群的血型按a、b、o、ab分組等,觀察單位出現(xiàn)的結(jié)果為分類變量,分類變量沒有量的差別,只有質(zhì)的不同,其組成的資料為定性資料。,二、定性資料,第1章緒論,第17頁 共654頁,三、等級(jí)資料,等級(jí)資料(ranked data)亦稱有序分類資料(ord

10、inal categorical data),是將觀察單位按屬性的等級(jí)分組,清點(diǎn)各組的觀察單位數(shù),所得的資料為等級(jí)資料。 如治療結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四個(gè)等級(jí)。,第1章緒論,第18頁 共654頁,根據(jù)需要,各類變量可以互相轉(zhuǎn)化。若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白分為四個(gè)等級(jí):重度貧血、中度貧血、輕度貧血、正常,可按等級(jí)資料處理。有時(shí)亦可將定性資料或等級(jí)資料數(shù)量化,如將等級(jí)資料的治療結(jié)果賦以分值,分別用0、1、2等表示,則可按定量資料處理。 如調(diào)查某人群的尿糖的情況,以人為觀察單位,結(jié)果可分、五個(gè)等級(jí)。,第1章緒論,第19頁 共654頁,同質(zhì)(homogeneity) 是指觀察單位或研究個(gè)體間

11、被研究指標(biāo)的主要影響因素相同或基本相同。如研究兒童的生長發(fā)育,同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)兒童。 變異(variation) 由于生物個(gè)體的各種指標(biāo)所受影響因素極為復(fù)雜,同質(zhì)的個(gè)體間各種指標(biāo)存在差異,這種差異稱為變異。如同質(zhì)的兒童身高、體重、血壓、脈搏等指標(biāo)會(huì)有一定的差別。,第四節(jié) 統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念 一、同質(zhì)與變異,第1章緒論,第20頁 共654頁,二、總體與樣本,樣本(sample):是從總體中隨機(jī)抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(sample size)。 注意: 1??傮w是相對(duì)的,總體的大小是根據(jù)研究目的而確定的。 2。樣本應(yīng)有代表性,即

12、應(yīng)該隨機(jī)抽樣并有足夠的樣本含量。,第1章緒論,第21頁 共654頁,圖示:總體與樣本,population,sample2,sample1,sample3,sample4,sample5,第1章緒論,第22頁 共654頁,三、參數(shù)與統(tǒng)計(jì)量,參數(shù)(parameter):由總體計(jì)算或得到的統(tǒng)計(jì)指標(biāo)稱為參數(shù)??傮w參數(shù)具有很重要的參考價(jià)值。如總體均數(shù),總體標(biāo)準(zhǔn)差等。 統(tǒng)計(jì)量(statistic):由樣本計(jì)算的指標(biāo)稱為統(tǒng)計(jì)量。如樣本均數(shù),樣本標(biāo)準(zhǔn)差s等。 注意:一般不容易得到參數(shù),而容易獲得樣本統(tǒng)計(jì)量。,第1章緒論,第23頁 共654頁,四、抽樣誤差,抽樣誤差(sample error): 由于隨機(jī)抽樣

13、所引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異以及樣本統(tǒng)計(jì)量之間的差別稱為抽樣誤差。如樣本均數(shù)與總體均數(shù)之間的差別,樣本率與總體率的差別等。 注意:抽樣誤差是不可避免的。無論抽樣抽得多么好,也會(huì)存在抽樣誤差。,第1章緒論,第24頁 共654頁,五、概率,概率(probability):是描述隨機(jī)事件發(fā)生可能性大小的量值。用英文大寫字母p來表示。概率的取值范圍在01之間。當(dāng)p0時(shí),稱為不可能事件;當(dāng)p1時(shí),稱為必然事件。 小概率事件:統(tǒng)計(jì)學(xué)上一般把p0.05或p0.01的事件稱為小概率事件。 小概率原理:小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。利用該原理可對(duì)科研資料進(jìn)行假設(shè)檢驗(yàn)。,第1章緒論,第25頁 共

14、654頁,第五節(jié) 學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,1.重點(diǎn)掌握醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本知識(shí)、基本技能、基本概念和基本方法,掌握使用范圍和注意事項(xiàng)。 2.要培養(yǎng)科學(xué)的統(tǒng)計(jì)思維方法,提高分析問題、解決問題的能力。 3.掌握調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì)的原則,培養(yǎng)搜集、整理、分析統(tǒng)計(jì)資料的系統(tǒng)工作能力。,第1章緒論,第26頁 共654頁,課后作業(yè),列舉出計(jì)量資料、分類資料、等級(jí)資料各10個(gè)實(shí)例。 列舉出可能事件、必然事件、不可能事件及小概率事件各10個(gè)。 認(rèn)真復(fù)習(xí)本章已學(xué)過的基本概念23遍。,第1章緒論,第27頁 共654頁,best wishes to all of you! thank you for listeni

15、ng!,the end,第2章定量資料統(tǒng)計(jì)描述,第28頁,醫(yī)學(xué)本科生用,主講 王守英,新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)系綜合實(shí)驗(yàn)室 wanshoy,醫(yī)學(xué)統(tǒng)計(jì)學(xué),第2章定量資料統(tǒng)計(jì)描述,第29頁,第2章定量資料的統(tǒng)計(jì)描述 目錄,第二節(jié) 集中趨勢(shì)的描述,第三節(jié) 離散趨勢(shì)的描述,第四節(jié) 正態(tài)分布,第一節(jié) 頻數(shù)分布表,第2章定量資料統(tǒng)計(jì)描述,第30頁,統(tǒng)計(jì)描述:是用統(tǒng)計(jì)圖表、統(tǒng)計(jì)指標(biāo)來描述資料的分布規(guī)律及其數(shù)量特征。 頻數(shù)分布表(frequency distribution table):主要由組段和頻數(shù)兩部分組成表格。,第一節(jié) 頻數(shù)分布表,第二章 定量資料的統(tǒng)計(jì)描述,第2章定量資料統(tǒng)計(jì)描述,第31頁,二、頻數(shù)分

16、布表的編制,編制步驟 : 1. 計(jì)算全距 (range): 一組變量值最大值和最小值之差稱為全距(range),亦稱極差,常用r表示。 2. 確定組距(class interval): 組距用i表示; 3. 劃分組段: 每個(gè)組段的起點(diǎn)稱組下限,終點(diǎn)稱組上限。一般分為815組。 ; 4. 統(tǒng)計(jì)頻數(shù): 將所有變量值通過劃記逐個(gè)歸入相應(yīng)組段 ; 5.頻率與累計(jì)頻率: 將各組的頻數(shù)除以n所得的比值被稱為頻率。累計(jì)頻率等于累計(jì)頻數(shù)除以總例數(shù)。,第2章定量資料統(tǒng)計(jì)描述,第32頁,表2-2 某年某市120名12歲健康男孩身高(cm)的頻數(shù)分布,第2章定量資料統(tǒng)計(jì)描述,第33頁,第2章定量資料統(tǒng)計(jì)描述,第34

17、頁,二、頻數(shù)分布表的用途,1.揭示資料的分布類型 2.觀察資料的集中趨勢(shì)和離散趨勢(shì) 3.便于發(fā)現(xiàn)某些特大或特小的可疑值 4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理,第2章定量資料統(tǒng)計(jì)描述,第35頁,第2章定量資料統(tǒng)計(jì)描述,第36頁,第二節(jié) 集中趨勢(shì)的描述,集中趨勢(shì) :代表一組同質(zhì)變量值的集中趨勢(shì) 或平均水平。 常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。 另外不常用的有:眾數(shù),調(diào)和平均數(shù)和調(diào)整均數(shù)等。,第2章定量資料統(tǒng)計(jì)描述,第37頁,一、算術(shù)均數(shù),算術(shù)均數(shù) (arithmetic mean): 簡(jiǎn)稱均數(shù)。 適用條件:對(duì)稱分布或近似對(duì)稱分布的資料。 習(xí)慣上以希臘字母表示總體均數(shù)(population

18、 mean),以英文字母表示樣本均數(shù)(sample mean),第2章定量資料統(tǒng)計(jì)描述,第38頁,1. 直接法:用于觀察值個(gè)數(shù)不多時(shí),計(jì)算方法,第2章定量資料統(tǒng)計(jì)描述,第39頁,2.加權(quán)法(weighting method):用于變量值個(gè)數(shù) 較多時(shí)。,注意:權(quán)數(shù)即頻數(shù)f,為權(quán)重權(quán)衡之意。,第2章定量資料統(tǒng)計(jì)描述,第40頁,表2-4 120名12歲健康男孩身高(cm)均數(shù)和標(biāo)準(zhǔn)差加權(quán)法計(jì)算表,第2章定量資料統(tǒng)計(jì)描述,第41頁,第2章定量資料統(tǒng)計(jì)描述,第42頁,120名12歲健康男孩身高均數(shù)為143.07cm。,計(jì)算結(jié)果,第2章定量資料統(tǒng)計(jì)描述,第43頁,幾何均數(shù)(geometric mean,簡(jiǎn)

19、記為):表示其平均水平。 適用條件:對(duì)于變量值呈倍數(shù)關(guān)系或呈對(duì)數(shù)正態(tài)分布(正偏態(tài)分布),如抗體效價(jià)及抗體滴度,某些傳染病的潛伏期,細(xì)菌計(jì)數(shù)等。 計(jì)算公式:有直接法和加權(quán)法。,二、幾何均數(shù),第2章定量資料統(tǒng)計(jì)描述,第44頁,1.直接法: 用于變量值的個(gè)數(shù)n較少時(shí),第2章定量資料統(tǒng)計(jì)描述,第45頁,直接法計(jì)算實(shí)例,第2章定量資料統(tǒng)計(jì)描述,第46頁,2.加權(quán)法 : 用于資料中相同變量值的個(gè)數(shù)f(即頻數(shù))較多時(shí)。,第2章定量資料統(tǒng)計(jì)描述,第47頁,表2-5 50名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計(jì)算表,第2章定量資料統(tǒng)計(jì)描述,第48頁,第2章定量資料統(tǒng)計(jì)描述,第49頁,50名兒童麻疹疫苗接種

20、后平均血凝抑制抗體滴度為1:60.55。,計(jì)算結(jié)果:將有關(guān)已知數(shù)據(jù)代入公式有,第2章定量資料統(tǒng)計(jì)描述,第50頁,變量值中不能有0; 不能同時(shí)有正值和負(fù)值; 若全是負(fù)值,計(jì)算時(shí)可先把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。,計(jì)算幾何均數(shù)注意事項(xiàng):,第2章定量資料統(tǒng)計(jì)描述,第51頁,中位數(shù) 定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡(jiǎn)記為m)。 適用條件:變量值中出現(xiàn)個(gè)別特小或特大的數(shù)值;資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個(gè)數(shù)值;資料的分布不清。,三、中位數(shù)及百分位數(shù),第2章定量資料統(tǒng)計(jì)描述,第52頁,定義

21、:百分位數(shù)(percentile)是一種位置指標(biāo),以px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有x%的變量值比px小,有(100-x)%的變量值比px大。故p50分位數(shù)也就是中位數(shù),即p50=m 。, 百分位數(shù),第2章定量資料統(tǒng)計(jì)描述,第53頁,描述一組資料在某百分位置上的水平; 用于確定正常值范圍; 計(jì)算四分位數(shù)間距。,百分位數(shù)的應(yīng)用條件:,第2章定量資料統(tǒng)計(jì)描述,第54頁,計(jì)算方法:有直接法和加權(quán)法,1.直接法:用于例數(shù)較少時(shí),n為奇數(shù)時(shí),n為偶數(shù)時(shí),第2章定量資料統(tǒng)計(jì)描述,第55頁,2.頻數(shù)表法: 用于例數(shù)較多時(shí),中位數(shù),百分位數(shù),第2章定量資料統(tǒng)

22、計(jì)描述,第56頁,表2-6 145例食物中毒病人潛伏期分布表,第2章定量資料統(tǒng)計(jì)描述,第57頁,第2章定量資料統(tǒng)計(jì)描述,第58頁,先找到包含px的最小累計(jì)頻率; 該累計(jì)頻率同行左邊的組段值為l; l同行右邊的頻數(shù)為fx(或fm); l前一行的累計(jì)頻數(shù)為fl; 將上述已知條件代入公式計(jì)算px或p50 。,計(jì)算中位數(shù)及百分位數(shù)的步驟:,第2章定量資料統(tǒng)計(jì)描述,第59頁,計(jì)算結(jié)果:,第2章定量資料統(tǒng)計(jì)描述,第60頁,定義:用來說明變量值的離散程度或變異程度。 注意:僅用集中趨勢(shì)尚不能完全反映一組數(shù)據(jù)的特征。故應(yīng)將集中趨勢(shì)和離散趨勢(shì)結(jié)合起來才能更好地反映一組數(shù)據(jù)的特征。 常用離散指標(biāo)有:極差、四分位數(shù)

23、間距、標(biāo)準(zhǔn)差、方差、變異系數(shù)。,第三節(jié) 離散趨勢(shì)的描述,第2章定量資料統(tǒng)計(jì)描述,第61頁,甲組: 184 186 188 190 192 乙組: 180 184 188 192 196 兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢(shì),就要用離散指標(biāo)。,實(shí)例分析,第2章定量資料統(tǒng)計(jì)描述,第62頁,極差 極差(range,簡(jiǎn)記為r)亦稱全距,即一組變量值中最大值與最小值之差 。 特點(diǎn):計(jì)算簡(jiǎn)單,不穩(wěn)定,不全面,易變化;可用于各種分布的資料。,一、極差和四分位數(shù)間距,第2章定量資料統(tǒng)計(jì)描述,第63頁,四分位數(shù)間距,公式: q= p75p25 特點(diǎn):比

24、極差穩(wěn)定,只反映中間兩端值的差異。 計(jì)算不太方便??捎糜诟鞣N分布的資料。,第2章定量資料統(tǒng)計(jì)描述,第64頁,二、方差和標(biāo)準(zhǔn)差,方差(variance),總體方差,樣本方差,第2章定量資料統(tǒng)計(jì)描述,第65頁,自由度(degree of freedom)的概念,n-1是自由度,用希臘小寫字母表示,讀作nju:。 定義:在n維或n度空間中能夠自由選擇的維數(shù)或度數(shù)。 例:abc,共有n=3個(gè)元素,其中只能任選2個(gè)元素的值,故自由度n-1=3-1=2。,第2章定量資料統(tǒng)計(jì)描述,第66頁,方差的特點(diǎn),充分反映每個(gè)數(shù)據(jù)間的離散狀況,意義深刻; 指標(biāo)穩(wěn)定,應(yīng)用廣泛,但計(jì)算較為復(fù)雜,不易理解; 方差的單位與原數(shù)

25、據(jù)不同,有時(shí)使用時(shí)不太方便; 在方差分析中應(yīng)用甚廣而極為重要。,第2章定量資料統(tǒng)計(jì)描述,第67頁,(二)標(biāo)準(zhǔn)差(standard deviation),總體標(biāo)準(zhǔn)差,樣本標(biāo)準(zhǔn)差,第2章定量資料統(tǒng)計(jì)描述,第68頁,牢記:離均差平方和展開式:,第2章定量資料統(tǒng)計(jì)描述,第69頁,標(biāo)準(zhǔn)差的特點(diǎn):,意義同方差,是方差的開平方; 標(biāo)準(zhǔn)差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應(yīng)用廣泛;故一般已作為醫(yī)學(xué)生物學(xué)領(lǐng)域中反映變異的標(biāo)準(zhǔn),故稱標(biāo)準(zhǔn)差。,第2章定量資料統(tǒng)計(jì)描述,第70頁,標(biāo)準(zhǔn)差的計(jì)算方法:可分為直接法和加權(quán)法。,1.直接法,2.加權(quán)法,第2章定量資料統(tǒng)計(jì)描述,第71頁,直接法:標(biāo)準(zhǔn)差計(jì)算實(shí)例:,例2.1

26、2 例2.2中7名正常男子紅細(xì)胞數(shù)(1012/l)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,計(jì)算其標(biāo)準(zhǔn)差。 x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99,第2章定量資料統(tǒng)計(jì)描述,第72頁,計(jì)算結(jié)果:,第2章定量資料統(tǒng)計(jì)描述,第73頁,例2.13 對(duì)表2-4資料用加權(quán)法計(jì)算120名12歲健康男孩身高值的標(biāo)準(zhǔn)差。,加權(quán)法:標(biāo)準(zhǔn)差計(jì)算實(shí)例:,在表2-4中已算得fx=17168,fx2 =2460040, 代入公式,

27、第2章定量資料統(tǒng)計(jì)描述,第74頁,變異系數(shù)(coefficient of variation): 簡(jiǎn)記為cv ; 特征:變異系數(shù)為無量綱單位,可以比較不同單位指標(biāo)間的變異度;變異系數(shù)消除了均數(shù)的大小對(duì)標(biāo)準(zhǔn)差的影響,所以可以比較兩均數(shù)相差較大時(shí)指標(biāo)間的變異度。,三、變異系數(shù),第2章定量資料統(tǒng)計(jì)描述,第75頁,例2.14 某地20歲男子160人,身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm; 體重均數(shù)為53.72kg, 標(biāo)準(zhǔn)差為4.96kg。試比較身高與體重的變異程度。,變異系數(shù) 計(jì)算實(shí)例,第2章定量資料統(tǒng)計(jì)描述,第76頁,身高,體重,變異系數(shù) 計(jì)算結(jié)果,第2章定量資料統(tǒng)計(jì)描述,第77頁,第四

28、節(jié) 正態(tài)分布,一、正態(tài)分布的概念和特征,正態(tài)分布(normal distribution):也稱高斯分布,是醫(yī)學(xué)和生物學(xué)最常見的連續(xù)性分布。如身高、體重、紅細(xì)胞數(shù)、血紅蛋白等。,第2章定量資料統(tǒng)計(jì)描述,第78頁,圖2-1 120名12歲健康男孩身高的頻數(shù)分布,第2章定量資料統(tǒng)計(jì)描述,第79頁, 正態(tài)分布的函數(shù)和圖形,正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為:,第2章定量資料統(tǒng)計(jì)描述,第80頁,圖2-2 頻數(shù)分布逐漸接近正態(tài)分布示意,第2章定量資料統(tǒng)計(jì)描述,第81頁,為了應(yīng)用方便,常按公式(2.19)作變量變換,u值稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,有的參考書也將u值稱為z值。,第2章定量資料統(tǒng)計(jì)描

29、述,第82頁,這樣將正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布 (standard normal distribution),第2章定量資料統(tǒng)計(jì)描述,第83頁,圖2-3 正態(tài)分布的面積與縱高,第2章定量資料統(tǒng)計(jì)描述,第84頁,正態(tài)分布的特征,1. 集中性 正態(tài)曲線的高峰位于正中央, 即均數(shù)所在的位置。 對(duì)稱性 正態(tài)曲線以均數(shù)為中心,左右對(duì)稱, 3. 正態(tài)分布有兩個(gè)參數(shù),即均數(shù)和標(biāo)準(zhǔn)差。 4. 正態(tài)曲線下面積有一定的分布規(guī)律,第2章定量資料統(tǒng)計(jì)描述,第85頁,圖2-4 不同標(biāo)準(zhǔn)差的正態(tài)分布示意,第2章定量資料統(tǒng)計(jì)描述,第86頁,二、正態(tài)曲線下面積的分布規(guī)律,第2章定量資料統(tǒng)計(jì)描述,第87頁,標(biāo)準(zhǔn)正態(tài)分布表(u值

30、表),標(biāo)準(zhǔn)正態(tài)分布曲線下的面積,由此表可查出曲線下某區(qū)間的面積。查表時(shí)應(yīng)注意: 表中曲線下面積為-到u 的下側(cè)累計(jì)面積; 當(dāng)已知、和x時(shí),先按公式(2.19)求得u值,再查表;當(dāng)和未知時(shí),并且樣本例數(shù)在100例以上,常用樣本均數(shù)和標(biāo)準(zhǔn)差s分別代替和 ,按公式(2.19)求得u值; 曲線下橫軸上的總面積為100%或1,第2章定量資料統(tǒng)計(jì)描述,第88頁,例2.16 前例2.1中,某年某市120名12歲健康男孩身高,已知均數(shù)=143.07cm,標(biāo)準(zhǔn)差s=5.70cm, 估計(jì)該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數(shù)的百分?jǐn)?shù); 估計(jì)身高界于135cm150cm范圍內(nèi)12歲男孩的比例;

31、 分別求出均數(shù)1s、均數(shù)1.96s、均數(shù)2.58s范圍內(nèi)12歲男孩人數(shù)占該120名男孩總數(shù)的實(shí)際百分?jǐn)?shù),說明與理論百分?jǐn)?shù)是否接近。,第2章定量資料統(tǒng)計(jì)描述,第89頁,根據(jù)題意,按公式(2.19)作u變換,第2章定量資料統(tǒng)計(jì)描述,第90頁,身高范圍所占面積,故估計(jì)該地12男孩身高在135cm以下者約占7.78; 身高界于135cm150cm范圍內(nèi)者約占81.10。,第2章定量資料統(tǒng)計(jì)描述,第91頁,三、正態(tài)分布的應(yīng)用,制定醫(yī)學(xué)參考值范圍 參考值范圍也稱為正常值范圍。醫(yī)學(xué)上常把絕大數(shù)正常人的某指標(biāo)范圍稱為該指標(biāo)的正常值范圍。這里的“絕大多數(shù)”可以是90、95、99,最常用的是95。 質(zhì)量控制 常以

32、均數(shù)2s作為上、下警戒值,以均數(shù)3s作為上、下控制值。 正態(tài)分布是很多統(tǒng)計(jì)方法的理論基礎(chǔ),第2章定量資料統(tǒng)計(jì)描述,第92頁,the end,thank you for listening,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第93頁,本科生用 醫(yī)學(xué)統(tǒng)計(jì)學(xué)教案,主講 王守英,新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)系綜合實(shí)驗(yàn)室 wanshoy,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第94頁,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn) 目錄,第五節(jié) 均數(shù)的 u 檢驗(yàn),第二節(jié) t 分布,第三節(jié) 總體均數(shù)的區(qū)間估計(jì),第四節(jié) 假設(shè)檢驗(yàn)的意義和基本步驟,第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,第六節(jié) 均數(shù)的 t 檢驗(yàn),第七節(jié)兩個(gè)方差的齊性檢驗(yàn)

33、和t檢驗(yàn),第八節(jié) 型錯(cuò)誤和型錯(cuò)誤,第九節(jié) 應(yīng)用假設(shè)檢驗(yàn)應(yīng)注意的問題,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第95頁,圖示:總體與樣本,population ,sample2,sample1,sample3,sample4,sample5,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第96頁,一、標(biāo)準(zhǔn)誤的意義及其計(jì)算 統(tǒng)計(jì)推斷(statistical inference) :根據(jù)樣本信息來推論總體特征。 均數(shù)的抽樣誤差 :由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。 標(biāo)準(zhǔn)誤(standard error):反映均數(shù)抽樣誤差大小的指標(biāo)。,第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,第3章總體均數(shù)的區(qū)間估計(jì)和

34、假設(shè)檢驗(yàn),第97頁,已知:,標(biāo)準(zhǔn)誤計(jì)算公式,未知:,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第98頁,實(shí)例:如某年某市120名12歲健康男孩,已求得 均數(shù)為143.07cm,標(biāo)準(zhǔn)差為5.70cm,按公式計(jì)算,則標(biāo)準(zhǔn)誤為:,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第99頁,1.表示抽樣誤差的大小 ; 2.進(jìn)行總體均數(shù)的區(qū)間估計(jì); 3.進(jìn)行均數(shù)的假設(shè)檢驗(yàn)等 。,二、標(biāo)準(zhǔn)誤的應(yīng)用,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第100頁,正態(tài)變量x采用u(x)/變換,則一般的正態(tài)分布n (,)即變換為標(biāo)準(zhǔn)正態(tài)分布n (0,1)。 又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布 n(, ),同樣可作正態(tài)變量的u變換,即,第二

35、節(jié) t 分布 一、t 分布的概念,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第101頁,實(shí)際工作中由于理論的標(biāo)準(zhǔn)誤往往未知,而用樣本的標(biāo)準(zhǔn)誤作為的估計(jì)值, 此時(shí)就不是u變換而是t變換了,即下式:,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第102頁,t分布于1908年由英國統(tǒng)計(jì)學(xué)家w.s.gosset以“student”筆名發(fā)表,故又稱student t 分布(students t-distribution)。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第103頁,二、t分布曲線的特征,t分布曲線是單峰分布,以0為中心,左右兩側(cè)對(duì)稱, 曲線的中間比標(biāo)準(zhǔn)正態(tài)曲線(u分布曲線)低,兩側(cè)翹得比標(biāo)準(zhǔn)正態(tài)曲線略高。 t分

36、布曲線隨自由度而變化,當(dāng)樣本含量越?。▏?yán)格地說是自由度 =n-1越小),t分布與u分布差別越大;當(dāng)逐漸增大時(shí),t分布逐漸逼近于u分布,當(dāng) =時(shí),t分布就完全成正態(tài)分布 。 t分布曲線是一簇曲線,而不是一條曲線。 t分布下面積分布規(guī)律:查t分布表。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第104頁,t 分布示意圖,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第105頁,t分布曲線下雙側(cè)或單側(cè)尾部合計(jì)面積,我們常把自由度為的t分布曲線下雙側(cè)尾部合計(jì)面積或單側(cè)尾部面積為指定值時(shí),則橫軸上相應(yīng)的t界值記為t,。如當(dāng) =20, =0.05時(shí),記為t0.05, 20;當(dāng) =22, =0.01時(shí),記為t0.01, 2

37、2。對(duì)于t, 值,可根據(jù)和值,查附表2,t界值表。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第106頁,t分布是t檢驗(yàn)的理論基礎(chǔ)。由公式(3.4)可知,t值與樣本均數(shù)和總體均數(shù)之差成正比,與標(biāo)準(zhǔn)誤成反比 。 在t分布中t值越大,其兩側(cè)或單側(cè)以外的面積所占曲線下總面積的比重就越小 ,說明在抽樣中獲得此t值以及更大t值的機(jī)會(huì)就越小,這種機(jī)會(huì)的大小是用概率p來表示的。 t值越大,則p值越??;反之,t值越小,p值越大。根據(jù)上述的意義,在同一自由度下,t t ,則p ; 反之,tt,則p。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第107頁,第三節(jié) 總體均數(shù)的區(qū)間估計(jì),參數(shù)估計(jì):用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)

38、(參數(shù))稱為參數(shù)估計(jì)。 估計(jì)總體均數(shù)的方法有兩種,即: 點(diǎn)值估計(jì)(point estimation ) 區(qū)間估計(jì)(interval estimation)。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第108頁,一、點(diǎn)值估計(jì),點(diǎn)值估計(jì):是直接用樣本均數(shù)作為總體均數(shù)的估計(jì)值。 此法計(jì)算簡(jiǎn)便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準(zhǔn)確地估計(jì)出總體均數(shù)大小,也無法確知總體均數(shù)的可靠程度 。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第109頁,二、區(qū)間估計(jì),區(qū)間估計(jì)是按一定的概率(1-)估計(jì)包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(confidence interval,縮寫為ci)。 1-稱為可信

39、度,常取1-為0.95和0.99,即總體均數(shù)的95%可信區(qū)間和99%可信區(qū)間。 1-(如95)可信區(qū)間的含義是:總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是1-,即(95),沒有被包含的可能性為,即(5)。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第110頁,總體均數(shù)的可信區(qū)間的計(jì)算,1.未知且n較小(n100),可用u檢驗(yàn)。不同的統(tǒng)計(jì)檢驗(yàn)方法,可得到不同的統(tǒng)計(jì)量,如t 值和u值。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第121頁,4.確定概率p值 p值是指在h0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或小于)現(xiàn)有統(tǒng)計(jì)量的概率。 t t, ,則p ;t 。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第122頁,5

40、.作出推斷結(jié)論 當(dāng)p時(shí),表示在h0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計(jì)量的概率是小概率,根據(jù)小概率事件原理,現(xiàn)有樣本信息不支持h0,因而拒絕h0,結(jié)論為按所取檢驗(yàn)水準(zhǔn)拒絕h0,接受h1,即差異有統(tǒng)計(jì)學(xué)意義,如例3.3 可認(rèn)為兩總體脈搏均數(shù)有差別; 當(dāng)p時(shí),表示在h0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計(jì)量的概率不是小概率,現(xiàn)有樣本信息還不能拒絕h0,結(jié)論為按所取檢驗(yàn)水準(zhǔn)不拒絕h0,即差異無統(tǒng)計(jì)意義,如例3.3 尚不能認(rèn)為兩總體脈搏均數(shù)有差別。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第123頁,下結(jié)論時(shí)的注意點(diǎn):,p ,拒絕h0,不能認(rèn)為h0肯定不成立,因?yàn)殡m然在h0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)

41、計(jì)量的概率雖小,但仍有可能出現(xiàn); 同理,p ,不拒絕h0,更不能認(rèn)為h0肯定成立。由此可見,假設(shè)檢驗(yàn)的結(jié)論是具有概率性的,無論拒絕h0或不拒絕h0,都有可能發(fā)生錯(cuò)誤,即第一類錯(cuò)誤或第二類錯(cuò)誤,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第124頁,第五節(jié) 均數(shù)的u檢驗(yàn),國外統(tǒng)計(jì)書籍及統(tǒng)計(jì)軟件亦稱為單樣本u檢驗(yàn)(one sample u-test)。 樣本均數(shù)與總體均數(shù)比較的u檢驗(yàn)適用于: 總體標(biāo)準(zhǔn)差已知的情況; 樣本含量較大時(shí),比如n100時(shí)。對(duì)于后者,是因?yàn)閚較大,也較大,則t分布很接近u分布的緣故。,一、樣本均數(shù)與總體均數(shù)比較的u檢驗(yàn),第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第125頁,u 值的計(jì)算公

42、式為:,總體標(biāo)準(zhǔn)差已知 時(shí),不管n的大小。,總體標(biāo)準(zhǔn)差未知 時(shí),但n100時(shí)。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第126頁,例3.4 某托兒所三年來測(cè)得2124月齡的47名男嬰平均體重11kg。查得近期全國九城市城區(qū)大量調(diào)查的同齡男嬰平均體重11.18kg,標(biāo)準(zhǔn)差為1.23kg。問該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平有無不同?(全國九城市的調(diào)查結(jié)果可作為總體指標(biāo)),實(shí) 例,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第127頁,(1)建立檢驗(yàn)假設(shè) h0: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同, 0.05(雙側(cè)) h1: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九

43、城市的同期水平不同。 (2)計(jì)算u值 本例因總體標(biāo)準(zhǔn)差已知,故可用u檢驗(yàn)。 本例n=47, 樣本均數(shù)=11, 總體均數(shù)=11.18,總體標(biāo)準(zhǔn)差=1.23, 代入公式(3.7),第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第128頁,(3)確定p值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u0.05=1.96,u=1.0030.05。按=0.05水準(zhǔn),不拒絕h0,差異無統(tǒng)計(jì)學(xué)意義。 結(jié)論:可認(rèn)為該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第129頁,二、兩樣本均數(shù)比較的u檢驗(yàn),該檢驗(yàn)也稱為獨(dú)立樣本u檢驗(yàn)(independent sample

44、 u-test),適用于兩樣本含量較大(如n150且n250)時(shí),u值可按下式計(jì)算:,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第130頁,例3.5 測(cè)得某地2024歲健康女子100人收縮壓均數(shù)為15.27kpa,標(biāo)準(zhǔn)差為1.16kpa;又測(cè)得該地2024歲健康男子100人收縮壓均數(shù)為16.11kpa,標(biāo)準(zhǔn)差為1.41kpa。問該地2024歲健康女子和男子之間收縮壓均數(shù)有無差別?,實(shí) 例,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第131頁,(1)建立檢驗(yàn)假設(shè) h0:1 2 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)相同; h1: 12 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)不同。 0.05(

45、雙側(cè)) (2)計(jì)算u值 本例 n1=100, 均數(shù)1=15.27, s1=1.16 n2=100, 均數(shù)2=16.11, s2=1.41,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第132頁,(3)確定p值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u0.05=1.96,現(xiàn)uu0.05=1.96,故p0.05。按水準(zhǔn) =0.05,拒絕h0,接受h1,差異有統(tǒng)計(jì)學(xué)意義。 結(jié)論:可認(rèn)為該地2024歲健康人的收縮壓均數(shù)男性高于女性。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第133頁,第六節(jié) 均數(shù)的 t 檢驗(yàn),當(dāng)樣本含量較?。ㄈ鏽 f 0.05,7,9=4.20; 故p0.05, 按=0.05

46、水準(zhǔn),拒絕h0, 接受h1, 結(jié)論:故可認(rèn)為兩總體方差不齊。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第157頁,方差不齊時(shí),兩小樣本均數(shù)的比較,可選用以下方法: 采用適當(dāng)?shù)淖兞孔儞Q,使達(dá)到方差齊的要求; 采用秩和檢驗(yàn); 采用近似法t 檢驗(yàn)。,二、t 檢驗(yàn),第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第158頁,計(jì)算統(tǒng)計(jì)量t 值,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第159頁,例3.12 由例3.11已知表層水和深層水含汞量方差不齊,試比較其均數(shù)有無差別? 自學(xué)內(nèi)容,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第160頁,假設(shè)檢驗(yàn)中作出的推斷結(jié)論可能發(fā)生兩種錯(cuò)誤: 拒絕了實(shí)際上是成立的h0,這叫型錯(cuò)誤(typee

47、rror)或第一類錯(cuò)誤,也稱為錯(cuò)誤。 不拒絕實(shí)際上是不成立的h0,這叫型錯(cuò)誤(typeerror)或第二類錯(cuò)誤,也稱為錯(cuò)誤。,第八節(jié) 型錯(cuò)誤和型錯(cuò)誤,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第161頁,表3-6 可能發(fā)生的兩類錯(cuò)誤,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第162頁,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第163頁,聯(lián)系:一般增大,則減??; 減小,則增大; 區(qū)別: (1)一般為已知,可取單側(cè)或雙側(cè),如0.05,或0.01。 (2)一般為未知,只取單側(cè),如取0.1或0.2。1 (把握度)0.75。,兩類錯(cuò)誤的聯(lián)系與區(qū)別,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第164頁,1-稱為檢驗(yàn)效能(po

48、wer of test)或把握度,其意義是兩總體確有差別,按水準(zhǔn)能發(fā)現(xiàn)它們有差別的能力。 與的大小應(yīng)根據(jù)實(shí)際情況適當(dāng)取值。,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第165頁,1.資料要來自嚴(yán)密的抽樣研究設(shè)計(jì) 2.選用假設(shè)檢驗(yàn)的方法應(yīng)符合其應(yīng)用條件 3.正確理解差別有無顯著性的統(tǒng)計(jì)涵義 正確理解差別有統(tǒng)計(jì)學(xué)意義 及臨床上的差別的統(tǒng)計(jì)學(xué)意義。 4.假設(shè)檢驗(yàn)的推斷結(jié)論不能絕對(duì)化 5.要根據(jù)資料的性質(zhì)事先確定采用雙側(cè)檢驗(yàn)或單側(cè)檢驗(yàn),第九節(jié) 應(yīng)用假設(shè)檢驗(yàn)的注意問題,第3章總體均數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn),第166頁,thank you for listening,the end,第4章方差分析,第167頁,醫(yī)

49、學(xué)本科生用,新鄉(xiāng)醫(yī)學(xué)院公共衛(wèi)生學(xué)系綜合實(shí)驗(yàn)室 wanshoy,主 講 王守英,醫(yī)學(xué)統(tǒng)計(jì)學(xué),第4章方差分析,第168頁,第4章 方差分析 目錄,第五節(jié) 多個(gè)方差的齊性檢驗(yàn),第二節(jié) 單因素方差分析,第三節(jié) 雙因素方差分析,第四節(jié) 多個(gè)樣本均數(shù)間的兩兩比較,第一節(jié) 方差分析的基本思想,第六節(jié) 變量變換,第4章方差分析,第169頁,第四章 方差分析,學(xué)習(xí)要求: 1。掌握方差分析的基本思想; 2。掌握單因素、雙因素方差分析的應(yīng)用條件、意義及計(jì) 算方法; 3。熟悉多個(gè)均數(shù)間兩兩比較的意義及方法; 4。了解方差齊性檢驗(yàn)和t檢驗(yàn)的意義及方法; 5。熟悉變量變換的意義和方法。,第4章方差分析,第170頁,第一節(jié)

50、 方差分析的基本思想,一、方差分析的用途及應(yīng)用條件 方差分析(analysis of variance,縮寫為anova) 是常用的統(tǒng)計(jì)分析方法之一。其應(yīng)用廣泛,分析效率高,節(jié)省樣本含量。 主要用途有: 進(jìn)行兩個(gè)或兩個(gè)以上樣本均數(shù)的比較; 可以同時(shí)分析一個(gè)、兩個(gè)或多個(gè)因素對(duì)試驗(yàn)結(jié)果的作用和影響; 分析多個(gè)因素的獨(dú)立作用及多個(gè)因素之間的交互作用; 進(jìn)行兩個(gè)或多個(gè)樣本的方差齊性檢驗(yàn)等。 方差分析對(duì)分析數(shù)據(jù)的要求及條件比較嚴(yán)格,即要求各樣本為隨機(jī)樣本,各樣本來自正態(tài)總體,各樣本所代表的總體方差齊性或相等。,第4章方差分析,第171頁,二、方差分析的基本思想 處理因素可分為若干個(gè)等級(jí)或不同類型,通常稱

51、為水平。在不同的水平下進(jìn)行若干次試驗(yàn)并取得多個(gè)數(shù)據(jù),可以將在每個(gè)水平下取得的這些數(shù)據(jù)看作一個(gè)樣本。若某個(gè)因素有四個(gè)水平,每個(gè)水平的數(shù)據(jù)代表一個(gè)樣本,則獲得四個(gè)樣本的數(shù)據(jù)。 設(shè)有k個(gè)相互獨(dú)立的樣本,分別來自k個(gè)正態(tài)總體x1,x2,xk,且方差相等, 即要求檢驗(yàn)假設(shè)為 此假設(shè)的意義為,在某處理因素的不同水平下,各樣本的總體均數(shù)相等。,第4章方差分析,第172頁,1。設(shè)某因素有多個(gè)水平,即試驗(yàn)數(shù)據(jù)產(chǎn)生多個(gè)樣本。由多個(gè)樣本的全部數(shù)據(jù)可以計(jì)算出總變異,稱為總的離均差平方和。即ss總。 2。數(shù)理統(tǒng)計(jì)證明,ss總可以由幾個(gè)部分構(gòu)成。單因素方差分析中, ss總由組間變異和組內(nèi)變異構(gòu)成。 ss總ss組間ss組內(nèi)

52、。 3。組間變異主要受到處理因素和個(gè)體誤差兩方面影響,組內(nèi)變異主要受個(gè)體誤差的影響。當(dāng)h0 為真時(shí),由于處理因素不起作用,組間變異只受個(gè)體誤差的影響。此時(shí),組間變異與組內(nèi)變異相差不能太大。,第4章方差分析,第173頁,表42 pcna在三種不同胃組織中的表達(dá)結(jié)果,第4章方差分析,第174頁,4。各種變異除以相應(yīng)的自由度,稱為均方,用ms表示,也就是方差。當(dāng)h0為真時(shí),組間均方與組內(nèi)均方相差不大,兩者比值f值約接近于1。 即 f組間均方組內(nèi)均方1。 5。當(dāng)h0不成立時(shí),處理因素產(chǎn)生了作用,使得組間均方增大,此時(shí),f1,當(dāng)大于等于f臨界值時(shí),則p0.05??烧J(rèn)為h0不成立,各樣本均數(shù)不全相等。,第

53、4章方差分析,第175頁,三、方差分析的類型 1。單因素方差分析(one-way anova) 也稱為完全隨機(jī)設(shè)計(jì)(completely random design)的方差分析。該設(shè)計(jì)只能分析一個(gè)因素下多個(gè)水平對(duì)試驗(yàn)結(jié)果的影響。 2。雙因素方差分析(two-way anova) 稱為隨機(jī)區(qū)組設(shè)計(jì)(randomized block design)的方差分析。該設(shè)計(jì)可以分析兩個(gè)因素。一個(gè)為處理因素,也稱為列因素;一個(gè)為區(qū)組因素,也稱為行因素。,第4章方差分析,第176頁,3。三因素方差分析 也稱為拉丁方設(shè)計(jì)(latin square design)的方差分析。該設(shè)計(jì)特點(diǎn)是,可以同時(shí)分析三個(gè)因素對(duì)試

54、驗(yàn)結(jié)果的作用,且三個(gè)因素之間相互獨(dú)立,不能有交互作用。 4。析因設(shè)計(jì)(factorial design)的方差分析 當(dāng)兩個(gè)因素或多個(gè)因素之間存在相互影響或交互作用時(shí),可用該設(shè)計(jì)來進(jìn)行分析。該設(shè)計(jì)不僅可以分析多個(gè)因素的獨(dú)立作用,也可以分析多個(gè)因素間的交互作用,是一種高效率的方差分析方法。,第4章方差分析,第177頁,5。正交試驗(yàn)設(shè)計(jì)的方差分析 如果要分析的因素有三個(gè)或三個(gè)以上,可進(jìn)行正交試驗(yàn)設(shè)計(jì)(orthogonal experimental design)的方差分析。當(dāng)分析因素較多時(shí),試驗(yàn)次數(shù)會(huì)急劇增加,用此設(shè)計(jì)進(jìn)行分析則更能體現(xiàn)出其優(yōu)越性。該設(shè)計(jì)利用正交表來安排各次試驗(yàn),以最少的試驗(yàn)次數(shù),得

55、到更多的分析結(jié)果。,第4章方差分析,第178頁,四、方差分析的基本步驟 1。計(jì)算總變異:指所有試驗(yàn)數(shù)據(jù)的離均差平方和。,2。計(jì)算各部分變異 :?jiǎn)我蛩胤讲罘治鲋?,可以分出組間變異(ss組間)和組內(nèi)變異(ss組內(nèi));雙因素方差分析中,可以分出處理組變異(ss處理),區(qū)組變異(ss區(qū)組)或稱為配伍組變異(ss配伍)及誤差變異(ss誤差)。,第4章方差分析,第179頁,3。計(jì)算各部分變異的均方 在方差分析中,方差也稱為均方,是各部分的離均差平方和除以其相應(yīng)的自由度,用ms表示?;竟綖椋簃sss。 4。計(jì)算統(tǒng)計(jì)量f值 f值是指兩個(gè)均方之比。一般是用較大的均方除以較小的均方。故f值一般不會(huì)小于1。 5

56、。確定p值,推斷結(jié)論 根據(jù)分子1,分母2,查f界值表(方差分析用),得到f值的臨界值(critical value),即:如果ff界值,則p0.05,在=0.05水準(zhǔn)上拒絕h0,接受h1??梢哉J(rèn)為各樣本所代表的總體均數(shù)不全相等。如果想要了解哪兩個(gè)樣本均數(shù)之間有差異,可以繼續(xù)進(jìn)行各樣本均數(shù)的兩兩比較。,第4章方差分析,第180頁,第二節(jié) 單因素方差分析,1 。特點(diǎn) 單因素方差分析是按照完全隨機(jī)設(shè)計(jì)的原則將處理因素分為若干個(gè)不同的水平,每個(gè)水平代表一個(gè)樣本,只能分析一個(gè)因素對(duì)試驗(yàn)結(jié)果的影響及作用。其設(shè)計(jì)簡(jiǎn)單,計(jì)算方便,應(yīng)用廣泛,是一種常用的分析方法,但其效率相對(duì)較低。該設(shè)計(jì)中的總變異可以分出兩個(gè)部

57、分, 即ss總ss組間ss組內(nèi)。 2。常用符號(hào)及其意義 (1)xij 意義為第i組的第j個(gè)數(shù)據(jù)。其中下標(biāo) i 表示列,j 表示行。 (2) 意義為將第i組的全部j個(gè)數(shù)據(jù)合計(jì)。,第4章方差分析,第181頁,(3) 將第i組的j個(gè)數(shù)據(jù)合計(jì)后平方, 再將所有各i組的平方值合計(jì)。 (4)變異來源 ss總:表示變異由處理因素及隨機(jī)誤差共同所致; ss組間:表示變異來自處理因素的作用或影響;ss組內(nèi):表示變異由個(gè)體差異和測(cè)量誤差等隨機(jī)因素所致。,第4章方差分析,第182頁,計(jì)算公式,第4章方差分析,第183頁,三。計(jì)算實(shí)例 例4.1 科研人員研究細(xì)胞增殖核抗原(pcna)在胃癌組織(a組),胃癌旁組織(b組)及正常胃粘膜組織(c組)中的表達(dá)狀況。檢測(cè)結(jié)果用表達(dá)指數(shù)來表示。 數(shù)據(jù)見表42。試分析pcna在三種胃組織中的表達(dá)有無差異。,第4章方差分析,第184頁,表42 pcna在三種不同胃組織中的表達(dá)結(jié)果,第4章方差分析,第185頁,檢驗(yàn)步驟及方法 建立檢驗(yàn)假設(shè) h0:pcna在三種組織中的表達(dá)指數(shù)相同,123; h1:pcna在三種組織中的表達(dá)指數(shù)不全相同。 0.05, 計(jì)算檢驗(yàn)統(tǒng)計(jì)量f值 由表4-2的數(shù)據(jù)計(jì)算有: 校正系數(shù) c(x)2n(874)22728291.70 ss總x2c39236-28291.7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論