護(hù)理研究 醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與科研分析思路_第1頁
護(hù)理研究 醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與科研分析思路_第2頁
護(hù)理研究 醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與科研分析思路_第3頁
護(hù)理研究 醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與科研分析思路_第4頁
護(hù)理研究 醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與科研分析思路_第5頁
已閱讀5頁,還剩148頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)內(nèi)容一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義二、統(tǒng)計(jì)學(xué)中的基本概念三、統(tǒng)計(jì)工作的步驟四、常見的抽樣分布 五、描述性指標(biāo)六、總體參數(shù)的估計(jì) 七、假設(shè)檢驗(yàn)一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義 統(tǒng)計(jì)學(xué)(statistics)是認(rèn)識(shí)社會(huì)和自然界中隨機(jī)現(xiàn)象的數(shù)量特征的一門科學(xué)。自然界中存在的各種現(xiàn)象可歸納為兩類: 必然現(xiàn)象在一定條件下必然發(fā)生的現(xiàn)象。(一定條件下其發(fā)生與否是確定的) 隨機(jī)現(xiàn)象在同一條件下進(jìn)行實(shí)驗(yàn),一次實(shí)驗(yàn)結(jié)果不確定,而在一定數(shù)量的重復(fù)試驗(yàn)后呈現(xiàn)統(tǒng)計(jì)規(guī)律性的現(xiàn)象。industrygovernmentbusinesseducationresearchfinancehealththe natural world

2、Statistics in .醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義醫(yī)學(xué)統(tǒng)計(jì)學(xué) (medical statistics) 是運(yùn)用概率論和數(shù)理統(tǒng)計(jì)學(xué)的原理與方法,研究醫(yī)學(xué)和衛(wèi)生學(xué)領(lǐng)域中隨機(jī)現(xiàn)象有關(guān)數(shù)據(jù)的搜集、整理、分析與推斷,進(jìn)而闡明其客觀規(guī)律的一門應(yīng)用科學(xué)。醫(yī)學(xué)統(tǒng)計(jì)學(xué)的定義二、統(tǒng)計(jì)學(xué)中的基本概念同質(zhì)與變異變量 總體與樣本抽樣誤差概率 同質(zhì)與變異 - 同質(zhì)(homogeneity) 影響研究指標(biāo)較大的、可以控制的主要因素盡可能相同。 - 變異 (variation) 同質(zhì)基礎(chǔ)上的各觀察值間的差異稱為變異。 變異可理解為同質(zhì)基礎(chǔ)上的個(gè)體差異。基本概念變量 - 變量 (variable)搜集資料時(shí),先要根據(jù)研究目的確定同

3、質(zhì)觀察單位,再對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量或觀察,這種特征稱為變量。 - 變量值(value of variable) 變量的觀察結(jié)果或測(cè)量值稱為變量值,亦稱為資料(data) - 變量按其值的性質(zhì)可分為不同類型?;靖拍?變量 - 變量的類型數(shù)值變量 (numerical variable)分類變量(categorical variable) - 無序分類變量(unordered categorical variable) 二項(xiàng)分類(binomial)、多項(xiàng)分類(multinomial) - 有序分類變量(ordinal categorical variable) 基本概念 變量數(shù)值變量

4、 其變量值是定量的,表現(xiàn)為數(shù)值大小,多有度量單位。由數(shù)值變量的測(cè)定值構(gòu)成的資料稱為計(jì)量資料(measurement data)或數(shù)值變量資料(numerical variable data)。 多數(shù)的數(shù)值變量為連續(xù)型變量,如身高、體重、血壓;但有的數(shù)值變量的測(cè)定值只是正整數(shù),如心率、白細(xì)胞計(jì)數(shù)等,在醫(yī)學(xué)統(tǒng)計(jì)學(xué)中也視為連續(xù)型變量?;靖拍?變量分類變量 表現(xiàn)為互不相容的類別或?qū)傩?,亦稱定性變量。- 無序分類變量的各類別或?qū)傩灾g無程度(或順序)上的差別;所得資料稱為計(jì)數(shù)資料(enumeration data)或無序分類變量資料(unordered categorical variable dat

5、a);又有二項(xiàng)分類和多項(xiàng)分類之分。- 有序分類變量的各類別之間有程度(或順序)的差別。所得資料稱為等級(jí)資料(ranked data)或有序分類變量資料(ordinal categorical variable data)?;靖拍?變量 注意!變量類型不是一成不變的,可根據(jù)分析的需要進(jìn)行轉(zhuǎn)化。 例,白細(xì)胞計(jì)數(shù)原屬數(shù)值變量 若按正常、異常分組,則為無序分類變量; 若按過低(10000)分組,則為有序分類變量。 分類變量也可數(shù)量化:有序分類變量可用0、1、2、3、4表示;無序分類變量可用啞變量(dummy variable)表示。基本概念 總體與樣本 總體(population)根據(jù)研究目的所確定

6、的同質(zhì)研究對(duì)象中所有觀察單位某變量值的集合??傮w所包含的范圍隨研究目的的不同而變化。 在醫(yī)學(xué)科學(xué)研究中,研究對(duì)象可以是人、實(shí)驗(yàn)動(dòng)物、微生物等;觀察單位可以是一個(gè)地區(qū)、一個(gè)家庭、一個(gè)人、一只眼睛、一個(gè)細(xì)胞株、一個(gè)基因片段等?;靖拍?總體與樣本 有限總體與無限總體在某特定的時(shí)間與空間范圍內(nèi),同質(zhì)研究對(duì)象的所有觀察單位的某變量值的個(gè)數(shù)為有限的,稱為有限總體 (finite population)。 總體是假設(shè)的,無時(shí)間和空間的限制,觀察單位數(shù)是無限的,稱為無限總體(infinite population)。 基本概念 總體與樣本樣本(sample)樣本是按隨機(jī)化原則從同質(zhì)總體中抽取的部分觀察單位其

7、變量值的集合。樣本須具有代表性。“代表性”的前提是來自同質(zhì)總體、足夠的觀察單位數(shù)和隨機(jī)抽樣。樣本中所含的觀察單位個(gè)數(shù)稱為樣本含量 n 。隨機(jī)化原則通常是指總體中的每個(gè)個(gè)體都有同樣的機(jī)會(huì)被抽到樣本中;但不同的研究目的,所采用的抽樣方法不同,如單純隨機(jī)抽樣、系統(tǒng)抽樣、整群抽樣和分層抽樣等?;靖拍?總體與樣本 抽樣研究的目的是用樣本信息去推斷總體特征。描述樣本特征的指標(biāo)稱為統(tǒng)計(jì)量(statistics);描述總體特征的指標(biāo)稱為參數(shù)(parameter)基本概念 抽樣誤差 抽樣誤差(sampling error) 由于個(gè)體變異的存在,抽樣研究時(shí),樣本的統(tǒng)計(jì)量與總體參數(shù)往往不等;即使若干個(gè)樣本是從同一

8、總體中隨機(jī)抽取的,各樣本統(tǒng)計(jì)量也往往不等。這種因抽樣研究所引起的各統(tǒng)計(jì)量之間以及統(tǒng)計(jì)量與參數(shù)之間的差異,稱為抽樣誤差。 抽樣誤差在抽樣研究中是不可避免的,但只要遵循隨機(jī)化原則抽樣的話,抽樣誤差的大小是可以估計(jì)的。基本概念 抽樣誤差基本概念 概率隨機(jī)事件概率小概率事件基本概念 概率隨機(jī)事件 (random event)對(duì)隨機(jī)現(xiàn)象進(jìn)行實(shí)驗(yàn)或觀察稱為隨機(jī)試驗(yàn)(random trial)。隨機(jī)試驗(yàn)的各種可能結(jié)果的集合稱為隨機(jī)事件(random event ),簡稱事件( event )。在一次隨機(jī)試驗(yàn)中,某隨機(jī)事件可能發(fā)生,也可能不發(fā)生;但在一定數(shù)量的重復(fù)試驗(yàn)后,某隨機(jī)事件的發(fā)生與否是有規(guī)律的?;靖?/p>

9、念 概率概率(probability)是描述隨機(jī)事件在一定條件下發(fā)生的可能性大小的一個(gè)度量,通常用P表示。對(duì)事件A,若有 ,則稱A為必然事件;若 ,稱A為不可能事件。隨機(jī)事件A的概率為 。基本概念 概率小概率事件(small probability event)若隨機(jī)事件A的概率 ,則稱隨機(jī)事件A為小概率事件。其統(tǒng)計(jì)學(xué)意義是小概率事件在一次隨機(jī)試驗(yàn)中認(rèn)為不可能發(fā)生。 “小概率”的標(biāo)準(zhǔn) 是人為規(guī)定的。在醫(yī)學(xué)統(tǒng)計(jì)學(xué)中,通常設(shè) ;但對(duì)于可能引起嚴(yán)重后果的事件,如術(shù)中大出血等,可設(shè) ,甚至更小?;靖拍钊?、統(tǒng)計(jì)工作的步驟設(shè)計(jì)搜集資料整理資料分析資料 設(shè)計(jì)(design) 在保證科學(xué)性、可重復(fù)性和高效性

10、的前提下,為驗(yàn)證研究假說而進(jìn)行的周密安排。明確研究目的和研究假說,確定研究內(nèi)容、觀察對(duì)象與觀察單位、樣本含量和抽樣方法,擬定研究方案、預(yù)期分析指標(biāo)、誤差控制措施、進(jìn)度與費(fèi)用。根據(jù)醫(yī)學(xué)研究類型,有調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì)之分。統(tǒng)計(jì)工作的步驟 搜集資料(collection of data)遵循統(tǒng)計(jì)學(xué)原理原則:及時(shí)、準(zhǔn)確、完整來源:統(tǒng)計(jì)報(bào)表 經(jīng)常性工作記錄 專題調(diào)查(或?qū)嶒?yàn))資料儲(chǔ)存:所搜集的原始記錄,要妥善保存,并定期備份復(fù)制。統(tǒng)計(jì)工作的步驟 整理之前的資料稱為原始資料(raw data)目的:經(jīng)科學(xué)分組與歸納,使原始資料系統(tǒng)化、條理化,便于計(jì)算統(tǒng)計(jì)指標(biāo)和分析。過程:準(zhǔn)確性審查(邏輯審查與技術(shù)審查)和

11、完整性審查;擬定整理表,按照“同質(zhì)者合并,非同質(zhì)者分開”的原則對(duì)資料進(jìn)行質(zhì)量分組,并在同質(zhì)基礎(chǔ)上根據(jù)數(shù)值大小進(jìn)行數(shù)量分組;統(tǒng)計(jì)歸納。 整理資料(sorting data)統(tǒng)計(jì)工作的步驟 分析資料(analysis of data)目的 計(jì)算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計(jì)描述 (descriptive statistics)用描述性指標(biāo)、統(tǒng)計(jì)表與統(tǒng)計(jì)圖等,對(duì)樣本資料的數(shù)量特征及其分布規(guī)律進(jìn)行描述。統(tǒng)計(jì)推斷(inferential statistics)如何抽樣?如何用樣本信息推斷總體特征。統(tǒng)計(jì)分析時(shí),要根據(jù)研究目的、設(shè)計(jì)類型、樣本含量、資料類型及其分布特征選擇恰當(dāng)?shù)?/p>

12、統(tǒng)計(jì)指標(biāo)和分析方法。統(tǒng)計(jì)工作的步驟四、常見的抽樣分布抽樣分布 分布和 分布N(,2)N(0,1)標(biāo)準(zhǔn)正態(tài)分布以固定樣本含量n抽樣N(,2/n)Xt 分布00抽樣分布t 值的分布稱為 t 分布,由于s 隨 n 的增大漸穩(wěn)定于,故 越大,t 分布越逼近 u 分布。抽樣分布抽樣分布抽樣分布t 分布的分位數(shù)( t 界值)/2/21-t/2,-t/2,陰影部分表示 的概率抽樣分布1-t,t 分布的分位數(shù)( t 界值)陰影部分表示 的概率抽樣分布抽樣分布二項(xiàng)分布(binomial distribution)二項(xiàng)分布的應(yīng)用條件 試驗(yàn)中只有對(duì)立的兩類結(jié)果,每一個(gè)觀察單位只能發(fā)生兩種對(duì)立結(jié)果之一(即兩分類資料)

13、; 已知其中一類結(jié)果的發(fā)生率為 ,其對(duì)立結(jié)果的發(fā)生率為 ; 在同一條件下,n 次試驗(yàn)是相互獨(dú)立的,即各觀察單位的觀察結(jié)果相互獨(dú)立。抽樣分布抽樣分布 Poisson分布抽樣分布抽樣分布 五、描述性指標(biāo) 需根據(jù)研究目的、資料類型及其分布、樣本含量選用恰當(dāng)?shù)拿枋鲂灾笜?biāo)。數(shù)值變量資料的描述性指標(biāo)分類變量資料的描述性指標(biāo)數(shù)值變量資料的描述性指標(biāo)集中趨勢(shì)指標(biāo)(central tendency)反映一組變量值的平均水平或中心位置。 - 均數(shù)、幾何均數(shù)、中位數(shù)、調(diào)和均數(shù)和眾數(shù)離散趨勢(shì)指標(biāo)(dispersion tendency) 反映一組變量值的變異(分散)程度。 - 全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系

14、數(shù)描述性指標(biāo)集中趨勢(shì)指標(biāo)(數(shù)值變量)均數(shù)(mean) 適用于正態(tài)及近似正態(tài)分布的數(shù)值變量資料。 符號(hào):樣本均數(shù)( )、總體均數(shù)( ) 計(jì)算公式:直接法公式加權(quán)法公式(用于小樣本資料)(用于頻數(shù)表資料)描述性指標(biāo)例 隨機(jī)抽取某地10名2030歲健康男性居民血清鐵含量分別為:6.58,7.42,15.32,15.78,17.60,17.98 ,15.21,17.53,20.11,22.64。試求其平均血清鐵含量。例 計(jì)算某地100名男大學(xué)生身高平均數(shù)描述性指標(biāo)集中趨勢(shì)指標(biāo)(數(shù)值變量)幾何均數(shù)(geometric mean) 適用于對(duì)數(shù)正態(tài)分布資料或等比級(jí)數(shù)資料。 符號(hào):G 計(jì)算公式: 直接法(小樣

15、本資料)加權(quán)法(頻數(shù)表資料)描述性指標(biāo)集中趨勢(shì)指標(biāo)(數(shù)值變量)例 9名麻疹易感兒接種麻疹疫苗一個(gè)月后,其血凝抑制抗體滴度為: 1:4,1:8,1:16,1:32,1:64,1:128,1:256,1:512,1:1024。試求其平均滴度。9名麻疹易感兒的平均抗體滴度為1:64。描述性指標(biāo)集中趨勢(shì)指標(biāo)(數(shù)值變量)例 某地區(qū)50名麻疹易感兒童接種麻疹疫苗1個(gè)月后,測(cè)其血凝抑制抗體滴度,如表中(1)、(2)欄,求平均抗體滴度。其血凝抗體滴度的平均滴度為1:57。 描述性指標(biāo)中位數(shù)(median) 適用于任何分布類型的數(shù)值變量資料,常用于偏態(tài)分布資料及頻數(shù)分布一端或兩端無確切數(shù)值的數(shù)值變量資料。符號(hào):

16、M計(jì)算公式:加權(quán)法(頻數(shù)表資料)(n為奇數(shù)時(shí))直接法(小樣本資料)(n為偶數(shù)時(shí))描述性指標(biāo)集中趨勢(shì)指標(biāo)(數(shù)值變量)例 5名成年男子的體重(kg)分別為 60、70、75、80、90,求中位數(shù) 例 6名成年男子的體重(kg)分別為 60,70, 75,80,82,90,求中位數(shù) =(X3+X4)/2=(75+80)/2=77.5(kg)=75(kg)描述性指標(biāo)集中趨勢(shì)指標(biāo)(數(shù)值變量)例 某疾病控制中心記錄了199名沙門氏菌屬食物中毒患者發(fā)病的潛伏期,并整理成表2-3中(1)、(2)欄,試計(jì)算其平均發(fā)病潛伏期。 (h)描述性指標(biāo)離散趨勢(shì)指標(biāo)(數(shù)值變量)全距(range) 亦稱極差,適用于任何分布類

17、型的資料。 符號(hào):R 計(jì)算公式:描述性指標(biāo)四分位數(shù)間距(quartile range) 適用資料類型同中位數(shù)。符號(hào):Q或QR計(jì)算公式:描述性指標(biāo)離散趨勢(shì)指標(biāo)(數(shù)值變量)方差 (variance) 適用于正態(tài)和近似正態(tài) 分布資料計(jì)算公式:符號(hào): ,樣本方差 總體方差描述性指標(biāo)離散趨勢(shì)指標(biāo)(數(shù)值變量)標(biāo)準(zhǔn)差(standard deviation) 適用于正態(tài)和 近似正態(tài)分布資料計(jì)算公式:符號(hào): ,樣本標(biāo)準(zhǔn)差 總體標(biāo)準(zhǔn)差直接法(小樣本資料)加權(quán)法(小樣本資料)描述性指標(biāo)離散趨勢(shì)指標(biāo)(數(shù)值變量)例 求表2-1中100名18歲男大學(xué)生身高的標(biāo)準(zhǔn)差。 描述性指標(biāo)離散趨勢(shì)指標(biāo)(數(shù)值變量)描述性指標(biāo)離散趨勢(shì)指

18、標(biāo)(數(shù)值變量)變異系數(shù)(coefficient of variation)適用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異度。符號(hào):CV計(jì)算公式:描述性指標(biāo)離散趨勢(shì)指標(biāo)(數(shù)值變量)分類變量資料的統(tǒng)計(jì)描述相對(duì)數(shù):兩個(gè)有關(guān)數(shù)值之比稱為相對(duì)數(shù)常用的相對(duì)數(shù):構(gòu)成比、率、相對(duì)比描述性指標(biāo)構(gòu)成比(proportion),又稱構(gòu)成指標(biāo),它說明某事物(或現(xiàn)象)內(nèi)部各組成部分所占的比重或分布,常以百分?jǐn)?shù)表示。計(jì)算公式: 注意:所有組成部分的構(gòu)成比之和應(yīng)等于100%; 同一事物內(nèi)部各組成部分的構(gòu)成比,計(jì)算時(shí) 小數(shù)點(diǎn)后保留位數(shù)應(yīng)相同。描述性指標(biāo)分類變量資料率(rate),又稱頻率指標(biāo)或強(qiáng)度指標(biāo),它說明

19、某現(xiàn)象發(fā)生的頻率或強(qiáng)度。計(jì)算公式:式中,K為比例基數(shù),常用的K 有100%或1000、 10000/萬、100000/10萬等。選擇K的要點(diǎn):根據(jù)習(xí)慣用法以便于比較,如治愈率、某病病死率、人工流產(chǎn)率等用百分率;出生率、嬰兒死亡率等用千分率;惡性腫瘤死亡率用十萬分率;使算得的率至少保留12位整數(shù)。描述性指標(biāo)分類變量資料相對(duì)比(relative ratio),亦稱比(ratio),是A、B 2個(gè)有關(guān)指標(biāo)之比,說明A為B的若干倍或百分之幾。A、B兩個(gè)指標(biāo)可以是性質(zhì)相同的,也可以是性質(zhì)不同的;兩個(gè)指標(biāo)可以是絕對(duì)數(shù),也可以是相對(duì)數(shù)或平均數(shù)。計(jì)算公式為:描述性指標(biāo)分類變量資料A、B為同類指標(biāo)時(shí),相對(duì)比用以

20、說明兩事物的相對(duì)水平。常以百分?jǐn)?shù)或倍數(shù)表示,如人口出生性別比、兩病區(qū)病床數(shù)之比。流行病學(xué)中常用: 相對(duì)危險(xiǎn)度(RR)、比數(shù)比(OR)也為此類。A、B為不同類指標(biāo)時(shí),如人口密度(人/平方公里)、醫(yī)生數(shù)/千人口、病床數(shù)/千人口、小鼠肝重與體重之比、變異系數(shù)等。相對(duì)比是相對(duì)數(shù)的最簡單形式,常用于動(dòng)態(tài)數(shù)列的分析。描述性指標(biāo)分類變量資料描述性指標(biāo)分類變量資料 應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的問題計(jì)算相對(duì)數(shù)的分母不宜過小 當(dāng)分母觀察例數(shù)足夠多時(shí),計(jì)算的相對(duì)數(shù)比較穩(wěn)定,能夠正確反映實(shí)際情況;當(dāng)分母觀察例數(shù)很少(如少于30)時(shí),易受偶然因素的影響,不宜計(jì)算相對(duì)數(shù),可用絕對(duì)數(shù)表示。如必須計(jì)算率,應(yīng)同時(shí)列出可信區(qū)間。某文章報(bào)

21、道“5 名患者, 治愈3 人, 治愈率為60%”。該結(jié)論恰當(dāng)否?分析: 該結(jié)論不恰當(dāng),當(dāng)觀察例數(shù)很少時(shí), 分子每改變一個(gè)單位對(duì)結(jié)果的影響很大, 此時(shí)不宜計(jì)算相對(duì)數(shù), 直接用絕對(duì)數(shù)描述即可。描述性指標(biāo)分類變量資料分析時(shí)不能以構(gòu)成比代替率 構(gòu)成比是說明某現(xiàn)象中各組成部分的比重或分布的指標(biāo),率則反映某現(xiàn)象發(fā)生的頻率或強(qiáng)度的指標(biāo)。應(yīng)用時(shí)兩者不能混淆。 描述性指標(biāo)分類變量資料以比代率應(yīng)用相對(duì)數(shù)的注意事項(xiàng)描述性指標(biāo)觀察單位數(shù)不等的幾個(gè)率,不能直接相加求其平均率 對(duì)觀察單位數(shù)不等的幾個(gè)率求平均率時(shí),要用各率的分子之和與分母之和來計(jì)算?!坝媚朝煼ㄖ委煾窝? 甲醫(yī)院治療150 人,治愈30 人, 治愈率為20%

22、; 乙醫(yī)院治療100 人, 治愈30 人, 治愈率為30%。則兩個(gè)醫(yī)院平均治愈率為( 20%+30%) /2=25%。”上述計(jì)算方法有無問題?分析: 該作者平均率的計(jì)算方法有誤。兩個(gè)醫(yī)院共治療250 人, 其中治愈60 人, 則平均治愈率為60/250=24%。應(yīng)用相對(duì)數(shù)的注意事項(xiàng)描述性指標(biāo)分類變量資料比較相對(duì)數(shù)時(shí)應(yīng)注意其可比性 影響率和構(gòu)成比的因素很多。兩個(gè)或多個(gè)率(構(gòu)成比)比較時(shí),各組間除研究因素外,其它影響因素要基本相同,即各組間要具有可比性。 注意: 各組的研究對(duì)象要同質(zhì),研究方法要相同,觀察時(shí)間 相等以及內(nèi)外環(huán)境條件相近。 所比較資料的內(nèi)部構(gòu)成要相同。 同一地區(qū)不同時(shí)期資料的對(duì)比,應(yīng)

23、注意客觀條件有無變化。應(yīng)用相對(duì)數(shù)的注意事項(xiàng)描述性指標(biāo)分類變量資料對(duì)樣本率(或構(gòu)成比)的比較應(yīng)遵循隨機(jī)抽樣,并做假設(shè)檢驗(yàn) 遵循隨機(jī)抽樣的原則才能保證樣本具有代表性,才能用該樣本信息推斷總體特征。 抽樣研究中,樣本率或構(gòu)成比也存在抽樣誤差,因此在比較兩個(gè)或多個(gè)率(構(gòu)成比)時(shí),要做假設(shè)檢驗(yàn)。應(yīng)用相對(duì)數(shù)的注意事項(xiàng)描述性指標(biāo)分類變量資料六、總體參數(shù)的估計(jì)數(shù)值變量資料 - 總體均數(shù)的估計(jì) - 總體幾何均數(shù)的估計(jì) - 總體中位數(shù)的估計(jì)分類變量資料 - 總體率的估計(jì) - 總體平均數(shù)的估計(jì)總體均數(shù)的估計(jì)點(diǎn)值估計(jì) (point estimation) : 用樣本均數(shù) 作為總體均數(shù) 的點(diǎn)值估計(jì)。由于抽樣誤差的存在,

24、 往往不等于 。 區(qū)間估計(jì) (interval estimation) : 按一定的概率100(1)%估計(jì)總體均數(shù) 所在的范圍,亦稱可信區(qū)間 (confidence interval, CI)。 常取95%和99%的可信度,即95%CI和99%CI。 總體參數(shù)估計(jì)數(shù)值變量資料總體均數(shù)的區(qū)間估計(jì)未知且n 小時(shí), 按 t 分布原理計(jì)算, 總體均數(shù)(1-)100%的可信區(qū)間為:未知,但 n足夠大時(shí)( n 100),t 分布近似 u 分布,按正態(tài)分布的原理估計(jì)可信區(qū)間??傮w 均數(shù)(1-)100%的可信區(qū)間為:總體參數(shù)估計(jì)數(shù)值變量資料總體均數(shù)的區(qū)間估計(jì)已知時(shí),按正態(tài)分布的原理估計(jì)可信區(qū)間??傮w均數(shù)(1-

25、)100%的可信區(qū)間為:總體參數(shù)估計(jì)數(shù)值變量資料由20名18歲男大學(xué)生身高均數(shù)資料得, cm, cm,試估計(jì)該地18歲男大學(xué)生身高總體均數(shù)的95%可信區(qū)間。 n = 20 ,且 未知,雙側(cè) 即該地18歲男大學(xué)生身高總體均數(shù)的95%可信區(qū)間為170.70173.80cm 總體參數(shù)估計(jì)總體均數(shù)的區(qū)間估計(jì)數(shù)值變量資料總體幾何均數(shù)的估計(jì)點(diǎn)值估計(jì) 用樣本幾何均數(shù)作為總體幾何均數(shù)的點(diǎn)值估計(jì)。區(qū)間估計(jì) 總體參數(shù)估計(jì)數(shù)值變量資料總體中位數(shù)的區(qū)間估計(jì) 先求第50百分位數(shù)的上、下限: 下限 上限 再按 分別求 和總體參數(shù)估計(jì)數(shù)值變量資料總體率的估計(jì)點(diǎn)值估計(jì):p 為 的點(diǎn)值估計(jì)。 由于抽樣誤差的存在,p 往往不等于

26、 ,故通常用區(qū)間估計(jì)。區(qū)間估計(jì):根據(jù)樣本含量n的大小以及 p 是否遠(yuǎn)離0.5,可用查表法和正態(tài)近似法??傮w參數(shù)估計(jì)分類變量資料總體率的區(qū)間估計(jì)-查表法當(dāng)樣本含量n較小,如 ,特別是 p 很接近于0或1 (遠(yuǎn)離0.5)時(shí),根據(jù) n 和陽性數(shù) X 查 “百分率的可信區(qū)間”表。某醫(yī)院眼科醫(yī)生用某種方法矯正30名近視眼患者的視力,其中8人近期有效,求該法近期有效率的95%CI。注意:由于附表7中X值只列出了 的部分, 當(dāng) 時(shí),應(yīng)以 查表,再從100中減去查得的數(shù)值即為所求可信區(qū)間??傮w參數(shù)估計(jì)分類變量資料總體率的區(qū)間估計(jì)-正態(tài)近似法當(dāng)樣本含量 n 足夠大(如 ),且樣本率p和 1-p均不太小,一般 n

27、 p 與n(1-p)均大于5時(shí),樣本率 p 的抽樣分布近似正態(tài)分布,可用正態(tài)近似法??傮w率 的可信區(qū)間可按下式進(jìn)行估計(jì) : 95CI為總體參數(shù)估計(jì)分類變量資料在某鎮(zhèn)按人口的1/20隨機(jī)抽取520人,作漢坦病毒IgG抗體滴度實(shí)驗(yàn),得腎綜合癥出血熱隱性感染率為5.17,求該鎮(zhèn)人群中腎綜合癥出血熱隱性感染率的95%可信區(qū)間。本例 P=0.0517,該鎮(zhèn)人群中腎綜合癥出血熱隱性感染率的95%可信區(qū)間為3.27%7.07%。 總體參數(shù)估計(jì)分類變量資料總體率的區(qū)間估計(jì)-正態(tài)近似法總體平均數(shù)的估計(jì)點(diǎn)值估計(jì):以 X 作為為 的點(diǎn)值估計(jì)。 由于抽樣誤差的存在,X往往不等于 ,通常用區(qū)間估計(jì)。區(qū)間估計(jì):根據(jù)樣本平

28、均數(shù)X是否大于50,可用 查表法和正態(tài)近似法??傮w參數(shù)估計(jì)分類變量資料總體平均數(shù)區(qū)間估計(jì)-查表法當(dāng)樣本陽性數(shù) 時(shí),用 查Poisson分布 的可信區(qū)間,可得總體平均數(shù) 的95%或99%可信區(qū)間。 例 將一個(gè)面積為100cm2的培養(yǎng)皿置于病房中,1h后取出,培養(yǎng)24h,查得8個(gè)菌落,試估計(jì)該病房平均每100cm2細(xì)菌數(shù)的95CI。 本例 ,查附表4 ,得 的95%下限為3.4,上限為15.8,即該病房平均每100cm2細(xì)菌數(shù)的95可信區(qū)間為3.415.8??傮w參數(shù)估計(jì)分類變量資料總體平均數(shù)區(qū)間估計(jì)-正態(tài)近似法當(dāng)樣本陽性數(shù) 時(shí),可按正態(tài)近似法估計(jì) 的可信區(qū)間: 總體參數(shù)估計(jì)分類變量資料總體平均數(shù)區(qū)

29、間估計(jì)-正態(tài)近似法用計(jì)數(shù)器測(cè)得某放射性物質(zhì)2小時(shí)內(nèi)發(fā)出的脈沖數(shù)為400個(gè), 據(jù)此估計(jì)該放射性物質(zhì)平均每小時(shí)發(fā)出的脈沖數(shù)的95%可信區(qū)間。x=400,則平均每 2小時(shí)發(fā)出的脈沖數(shù)的95%CI為:平均每小時(shí)發(fā)出的脈沖數(shù)的95%CI為總體參數(shù)估計(jì)分類變量資料七、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本思想與步驟假設(shè)檢驗(yàn)的數(shù)值變量資料的假設(shè)檢驗(yàn) - t 檢驗(yàn)與u 檢驗(yàn) - 方差分析分類變量資料的假設(shè)檢驗(yàn) - 服從二項(xiàng)分布與poisson分布的假設(shè)檢驗(yàn) - 卡方檢驗(yàn)秩和檢驗(yàn) 由于個(gè)體變異的普遍存在,抽樣研究時(shí),不可避免地存在著抽樣誤差。當(dāng)根據(jù)樣本資料求出樣本統(tǒng)計(jì)量后,遇到樣本統(tǒng)計(jì)量與某一總體參數(shù)不等,或兩個(gè)(多個(gè))樣本統(tǒng)

30、計(jì)量不等時(shí),首先要考慮到抽樣誤差的問題,還要考慮到樣本統(tǒng)計(jì)量可能不是來自該總體。即有兩種可能性:一種可能:樣本是從該總體(或同一總體)中隨機(jī)抽取的,其差異僅僅是由抽樣誤差造成的;另一種可能:樣本不是從該總體(或同一總體)中隨機(jī)抽取的,而是有本質(zhì)上的不同,單純用抽樣誤差解釋不了。 如何判斷?需進(jìn)行假設(shè)檢驗(yàn)。 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本思想 2確定單、雙側(cè)檢驗(yàn) 根據(jù)研究目的或?qū)I(yè)知識(shí)確 定單側(cè)檢驗(yàn)(one-sided test)或雙側(cè)檢驗(yàn)(two-sided test)。單側(cè)檢驗(yàn)要注明 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本步驟(一)建立假設(shè)和確定檢驗(yàn)水準(zhǔn)(二)選定

31、檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量 根據(jù)研究目的、設(shè)計(jì)類型、資料類型及其分布特征等選用適當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn)方法,并計(jì)算出相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本步驟假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本步驟假設(shè)檢驗(yàn)數(shù)值變量資料的假設(shè)檢驗(yàn) t 檢驗(yàn)假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量單樣本 t 檢驗(yàn) ( one sample t-test)假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量單樣本 t 檢驗(yàn)隨機(jī)測(cè)得26名男性汽車司機(jī)的脈搏平均數(shù)為73.7次/分,標(biāo)準(zhǔn)差為8.8/分。據(jù)此能否認(rèn)為男性汽車司機(jī)的脈搏平均數(shù)高于一般男性脈搏數(shù)(72次/分)?假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量單樣本 t 檢驗(yàn)假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量配對(duì)t 檢驗(yàn)

32、(paired t-test for dependent samples ) t 檢驗(yàn)-數(shù)值變量配對(duì)t 檢驗(yàn)假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量配對(duì)t 檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量配對(duì)t 檢驗(yàn) t 檢驗(yàn)-數(shù)值變量配對(duì)t 檢驗(yàn)假設(shè)檢驗(yàn)兩樣本t 檢驗(yàn)(two-sample/group t-test for independent samples)假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量假設(shè)檢驗(yàn) t 檢驗(yàn)-數(shù)值變量兩樣本t 檢驗(yàn) u檢驗(yàn)數(shù)值變量資料的假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)單樣本u 檢驗(yàn)(one sample u test) u檢驗(yàn)-數(shù)值變量假設(shè)檢驗(yàn)兩樣本u 檢驗(yàn) two-sample u-test for

33、 independent samples u檢驗(yàn)-數(shù)值變量 用途:兩個(gè)或多個(gè)樣本均數(shù)間的比較分析兩個(gè)或多個(gè)因素間的交互作用直線回歸方程的假設(shè)檢驗(yàn)多元線性回歸方程的假設(shè)檢驗(yàn)兩個(gè)方差的齊性檢驗(yàn)假設(shè)檢驗(yàn)數(shù)值變量資料的假設(shè)檢驗(yàn) 方差分析 應(yīng)用條件:方差分析的應(yīng)用條件基本同 檢驗(yàn):各樣本是相互獨(dú)立的隨機(jī)樣本;各樣本來自正態(tài)分布總體;各總體方差相等,即 。假設(shè)檢驗(yàn) 方差分析-數(shù)值變量假設(shè)檢驗(yàn)分類變量資料的假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)分類變量資料的假設(shè)檢驗(yàn) 檢驗(yàn)假設(shè)檢驗(yàn) 檢驗(yàn)-分類變量假設(shè)檢驗(yàn) 檢驗(yàn)-分類變量假設(shè)檢驗(yàn) 檢驗(yàn)-分類變量 屬非參數(shù)檢驗(yàn)。 常用的方法有:配對(duì)設(shè)計(jì)的符號(hào)秩和檢驗(yàn)成組設(shè)計(jì)的兩樣本比較的秩和檢驗(yàn)成組設(shè)計(jì)的多樣本比較的秩和檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)資料的秩和檢驗(yàn)假設(shè)檢驗(yàn)秩和檢驗(yàn)假設(shè)檢驗(yàn)時(shí)應(yīng)注意的事項(xiàng) 1.要有嚴(yán)密的抽樣研究設(shè)計(jì) 樣本必須是從同質(zhì)總體中隨機(jī)抽取的;要保證組間的均衡性和資料的可比性,即對(duì)比組間除處理因素(如新藥和常規(guī)藥)外,非處理因素(如年齡、性別、病程、病情輕重等)應(yīng)盡可能相同。2.正確選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論