醫(yī)學統(tǒng)計知識點整理_第1頁
醫(yī)學統(tǒng)計知識點整理_第2頁
醫(yī)學統(tǒng)計知識點整理_第3頁
醫(yī)學統(tǒng)計知識點整理_第4頁
醫(yī)學統(tǒng)計知識點整理_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、醫(yī)學統(tǒng)計學知識點整理第一節(jié) 統(tǒng)計學中基本概念一、同質與變異 同質:統(tǒng)計研究中,給觀察單位規(guī)定一些相同的因素情況。 如兒童的生長發(fā)育,規(guī)定同性別、同年齡、健康的兒童即為同質的兒童。 變異:同質的基礎上個體間的差異?!巴|”是相對的,是客觀事物在特定條件下的相對一致性,而 “變異”則是絕對的二、總體與樣本1、總體:是根據研究目的所確定的,同質觀察對象(個體)所構成的全體。2、樣本:是從總體中隨機抽取的部分觀察單位變量值的集合。三、參數(shù)與統(tǒng)計量 總體參數(shù):根據總體個體值統(tǒng)計計算出來的描述總體的特征量。 用希臘字母表示。卩& n樣本統(tǒng)計量:根據樣本個體值統(tǒng)計計算出來的描述樣本的特征量。 用拉丁字母表

2、示。X.S.p總體參數(shù)一般是不知道的,抽樣研究的目的就是用樣本統(tǒng)計量來推斷總體參數(shù), 包括區(qū)間估計和假設檢驗四、誤差:實測值與真值之差1.隨機誤差:是一類不恒定的、隨機變化的誤差,由多種尚無法控制的因素引起。 隨機測量誤差、抽樣誤差。2.系統(tǒng)誤差:是一類恒定不變或遵循一定變化規(guī)律的誤差,其產生原因往往是可 知的或可能掌握的。3.非系統(tǒng)誤差:過失誤差,可以避免或清除。五、概率是用來描述事件發(fā)生可能性大小的一個量值,常用 P表示。概率取值01。統(tǒng)計上一般將pw 0.05或pw 0.01的事件稱為小概率事件,表示其發(fā)生的概率 很小,可以認為在一次抽樣中不會發(fā)生。第二節(jié)統(tǒng)計資料的類型變量:確定總體之后

3、, 研究者應對每個觀察單位的某項特征進行觀察或測量, 這 種特征能表現(xiàn)觀察單位的變異性,稱為變量。一、數(shù)值變量資料 又稱為計量資料、定量資料:觀測每個觀察單位某項指標的大小而獲得的資料。 表現(xiàn)為數(shù)值大小,帶有度、量、衡單位。如身高(cm)、體重(kg)、血紅蛋白(g) 等。二、無序分類變量資料又稱為定性資料或計數(shù)資料: 將觀察對象按觀察對象的某種類別或屬性進行分組 計數(shù),分組匯總各組觀察單位后得到的資料。分類:二分類: + -;有效,無效; 多分類: ABO 血型系統(tǒng) 特點:沒有度量衡單位,多為間斷性資料【例題單選】某地A、B、O AB血型人數(shù)分布的數(shù)據資料是()A.定量資料B.計量資料C.計

4、數(shù)資料D.等級資料【答案】 C【解析】ABO血型系統(tǒng)人數(shù)分布資料屬于無序分類變量資料,又稱為計數(shù)資料。 因為是按照變量的血型分類,血型表現(xiàn)為互不相容的屬性。所以本題選 C?!纠}單選】測量正常人的脈搏數(shù)所得的變量是()A.二分類變量B.多分類變量C定量變量D.定性變量【答案】 C【解析】脈搏數(shù)有數(shù)值大小, 有度量衡,所以這個資料屬于定量資料。 本題選 C。三、 有序分類變量資料半定量資料或等級資料: 將觀察對象按觀察對象的某種屬性的不同程度分成等級 后分組計數(shù),分組匯總各組觀察單位后得到的資料。特點:每一個觀察單位沒有確切值,各組之間有性質上的差別或程度上的不同 舉例: - + + +第三節(jié)

5、統(tǒng)計工作的基本步驟 1.統(tǒng)計設計2.收集資料3.整理資料4.分析資料:統(tǒng)計描述:是利用統(tǒng)計指標、 統(tǒng)計表和統(tǒng)計圖相結合來描述樣本資料的數(shù)量特征 及分布規(guī)律。統(tǒng)計推斷:是使用樣本信息來推斷總體特征。 統(tǒng)計推斷包括區(qū)間估計和假設檢驗。 第四節(jié) 統(tǒng)計表與統(tǒng)計圖 一、統(tǒng)計表統(tǒng)計表的基本結構與要求 標題:高度概括表的主要內容,時間、地點、研究內容,位于表的上方,居中擺 放,左側加表的序號。標目:橫標目和縱標目。 線條:通常采用三線表和四線表的形式。沒有豎線或斜線。數(shù)字:表內數(shù)字一律用阿拉伯數(shù)字。同一指標,小數(shù)位數(shù)應一致,位次對齊。無 數(shù)字用“一”表示。暫缺用“表示?!?為確切值。備注:位于表的下面,通常

6、是對表內數(shù)字的注解和說明,必要時可以用“ *”等 標出。一張統(tǒng)計表的備注不宜太多。二、 制表原則 重點突出,一個表一個中心內容 主謂分明,層次清楚簡單明了,一切文字數(shù)字線條盡量從簡 【例題單選】統(tǒng)計表內不列的項是 ()(2010.7 )A.標目 B. 線條 C. 數(shù)字D.備注【答案】 D【解析】統(tǒng)計表內備注位于表的下面,不列在統(tǒng)計表內,所以本題選擇D。三、 統(tǒng)計圖1.(1)標題 (2)標目(3)刻度( 4)圖例:不同顏色或者不同線條表示,需 要說明。2.常用統(tǒng)計圖的適用條件與要求(1)條圖:適用于比較、分析獨立的或離散變量的多個組或多個類別的統(tǒng)計指 標。0(2)圓圖和百分比條圖:構成比的比較(

7、3)線圖:描述某統(tǒng)計量隨另一連續(xù)性數(shù)值變量變化而變化的趨勢。(4)直方圖:數(shù)值變量的頻數(shù)分布。(5)散點圖:用點的密集程度和趨勢描述 2個變量間的數(shù)量關系(6)箱式圖:多組數(shù)據分布的比較(7)統(tǒng)計地圖:用不同的顏色和花紋表示統(tǒng)計量的在地理分布上的變化,適宜 描述研究指標的地理分布?!纠}填空】描述某地十年間結核病死亡率的變化趨勢宜繪制 _圖?!敬鸢浮烤€圖數(shù)值變量資料的統(tǒng)計分析第一節(jié)數(shù)值變量資料的統(tǒng)計描述一、頻數(shù)分布表1.編制步驟(1)計算全距(2)確定組距(3)劃分組段(3)統(tǒng)計頻數(shù)(4)確定頻率與累 計頻率2.頻數(shù)分布表的主要用途:(1)揭示資料的分布類型 (2)觀察資料的集中趨勢和離散趨勢

8、(3)便于發(fā) 現(xiàn)某些特大或特小離群值(4)便于進一步計算統(tǒng)計指標和作統(tǒng)計處理二、集中趨勢指標數(shù)值變量資料的集中趨勢指標是用平均數(shù)來描述的, 代表一組同質變量值的平均 水平。常用的有算術均數(shù)、幾何均數(shù)和中位數(shù)。1算數(shù)均數(shù)適用于對稱分布(正態(tài)分布)或者近似對稱分布的資料。習慣上以卩表示總體均數(shù),以表示樣本均數(shù)。2. 幾何均數(shù) 數(shù)值變量呈倍數(shù)關系或者呈對數(shù)正態(tài)分布,如抗體效價及抗體滴 度,某些傳染病的潛伏期、細菌計數(shù)等,宜用幾何均數(shù)(G)。幾何均數(shù)常用于 等比資料或對數(shù)正態(tài)分布資料。3.中位數(shù) 是指將一組變量值從小到大排列,位次居中的觀察值就是中位數(shù)。適用條件:變量值中出現(xiàn)個別特別大或特別小的數(shù)值;

9、偏態(tài)分布資料;數(shù)值一端或兩端無確定數(shù)值;資料類型不明。4.百分位數(shù) 是一種位置指標,以Px表示,把一組數(shù)據從小到大排列后,理論 上有x%的變量比Px小,有(100-x) %的變量值比Px大【例題單選】描述正態(tài)分布資料集中趨勢的指標是(A.中位數(shù)B幾何均數(shù)C算術平均數(shù)D.標準差【答案】C【解析】算數(shù)均數(shù)適用于對稱分布或者近似對稱分布的資料。幾何均數(shù)常用于等比資料或對數(shù)正態(tài)分布資料。中位數(shù)適用條件:變量值中出現(xiàn)個別特別大或特別 小的數(shù)值;偏態(tài)分布資料;數(shù)值一端或兩端無確定數(shù)值 ;資料類型不明。標準 差描述數(shù)據的離散趨勢指標。所以本題選擇 Co三、離散趨勢指標1.極差和四分位數(shù)間距極差:簡記為R,亦

10、稱全距,即一組變量值中最大值與最小值之差,反應變量值 的離散范圍。四分位數(shù)間距Q: 般和中位數(shù)一起描述偏態(tài)分布資料的分布離散趨勢的平均離散情況。標準差是方差的正平方根。用途:s X X j X2 厶11n 1n 1(6未知)參數(shù)估計-用樣本指標估計總體指標假設檢驗3.方差和標準差:方差表示樣本觀察值的離均差平方和的均值。表示一組數(shù)據 卩值,曲線沿著X軸平行移動,其形狀不變,故卩稱為位置參數(shù)。標準差C描述 了正態(tài)分布的離散程度,若固定卩,6越小,曲線越陡峭;反之,6越大,曲線 越平坦故C稱為形狀參數(shù)或離散度參數(shù)。(4)正態(tài)曲線下的面積分布有一定的 規(guī)律。4.正態(tài)曲線下面積的分布規(guī)律(二)醫(yī)學參考

11、值范圍的制定醫(yī)學參考值:是指絕大多數(shù)正常人的人體形態(tài)、功能和代謝產物等各種生理及生 化指標常數(shù),也稱正常值。第二節(jié) 數(shù)值變量資料的統(tǒng)計推斷一、均數(shù)的抽樣誤差與標準誤抽樣誤差:由于個體變異和抽樣造成的樣本統(tǒng)計量與總體參數(shù)和樣本統(tǒng)計量之 間的差異。均數(shù)的抽樣誤差:由于抽樣造成的樣本均數(shù)與總體均數(shù)和樣本均數(shù)間的差異。 標準誤:樣本均數(shù)的標準差,用右來表示。、t分布t分布曲線以0為中心,vt分布為一簇單峰分布曲線,u不同,曲線形狀不同s. vnsx 1t分布與u有關,u越小,t值越分散,t分布的峰部越低,而兩側尾部翹得越 高t界值表中一側尾部面積稱單側概率 (a )兩側尾部面積之和稱雙側概率(a /2

12、) 如:t0.05/2,9=2.262 , t0.05,9=1.833在相同自由度時,丨t I值增大,a減小 在相同a時,單尾a 對應的t值比雙尾a 的小三、總體均數(shù)的區(qū)間估計總體均數(shù)置信區(qū)間(可信區(qū)間)的計算統(tǒng)計描述區(qū)間估計:是按預先給定的概率(1-a )所確定的包含未知總體參數(shù)的一個范圍(一) 小樣本或c未知-按t分布,-1(二) 1已知 c U分布 一樂,瓦+ %血、口2.c未知,但大樣本(n60 )-按 u分布四、假設檢驗的意義和基本步驟假設檢驗:先對總體的參數(shù)或分布做出某種假設,再用適當?shù)慕y(tǒng)計方法根據樣 本對總體提供的信息,推斷此假設應當拒絕或不拒絕?;静襟E:1、建立檢驗假設,確定

13、檢驗水準(1)Ho:(無效假設) 卩=e(2)Hi:(備擇假設) 吋(JO ,卩o(或 卩0 x(3)確定檢驗水準 a =0.052選定檢驗方法,計算檢驗統(tǒng)計量3.確定P值,作出推斷結論第三節(jié) 均數(shù)的t檢驗與u檢驗t檢驗應用條件:樣本與總體/兩樣本均數(shù)的比較 當n 60且n2 60)五、 假設檢驗應注意的問題1、 假設檢驗應有嚴格的抽樣設計 -同質2、 要注意選用的假設檢驗方法的應用條件3、 正確區(qū)分差別有無統(tǒng)計意義與有無專業(yè)上的實際意義4、 結論不能絕對化5、 假設檢驗的單側檢驗與雙側檢驗的選擇 假設檢驗的兩類錯誤第I類錯誤:拒絕實際上成立的 Ho,犯第I類錯誤的概率大小為 a第U類錯誤:不

14、拒絕實際上不成立的 Ho,犯第U類錯誤的概率為 俟當樣本含量n 定時,a越小,B越大;若想同時減少a和B,只有增大樣本 含量。1- P稱為假設檢驗的功效當所研究的總體與Ho確有差別時,按檢驗水準 a能夠發(fā)現(xiàn)它(拒絕Ho)的概率。分類變量資料的統(tǒng)計分析第一節(jié)分類變量資料的統(tǒng)計描述、常用相對數(shù)率:說明某現(xiàn)象發(fā)生的頻率或強度。 構成比:說明某一事物內部各組成部分所占的比重或分布。 相對比:說明一個指標是另一個指標的幾倍或百分之幾。 【例題單選】某醫(yī)院住院病人中有 15的胃癌患者,該 15是()A.患病率B.發(fā)病率C構成比D相對比【答案】C【解析】 15的胃癌患者指的是胃癌患者占住院病人的 15%,所

15、以是構成比。 【例題填空】構成比是說明 _或分布指標。率是說明 _或強度的指標?!敬鸢浮勘戎?;頻率二、應用相對數(shù)時應注意的問題 (2011.7簡答題)1.計算相對數(shù)時,觀察單位數(shù)應足夠多2.分析時不能以構成比代替率3.相對數(shù)的相互比較應注意可比性,不具有可比性應進行標準化4.樣本率或構成比的比較應做假設檢驗第二節(jié)分類變量資料的統(tǒng)計推斷一、 率的抽樣誤差與標準誤二、 總體率的區(qū)間估計1.查表法:當n較小,如nW50,特別是p接近與0或1時(小概率事件),按 二項分布原則估計總體率的可信區(qū)間。2.區(qū)間估計正態(tài)近似法:當樣本含量n足夠大,樣本率p或1-p均不太小時如np和n(1-p)均大于5,樣本率

16、的分布近似正態(tài)分布,總體率可信區(qū)間在(1-a) 可信度下,估計為:P Ua /2Sp例:總體率95%勺可信區(qū)間:P 1.96Sp;總體率99%勺可信區(qū)間:P 2.58Sp三、 兩總體率之差的區(qū)間估計條件:當樣本含量 n 足夠大,樣本率 p 或 1-p 均不太小時,即 np 和 n(1-p) 均大于 5,樣本率的分布近似于正態(tài)分布 (p 1-p 2 -u a /2 Sp1-p2 ,(p 1-p 2 +u a /2 Sp1-p2 )(二)四格表資料的X檢驗的校正公式(A T0.5)2T或四、率的u檢驗(一) 樣本率與總體率比較的 u檢驗(二) 兩樣本率比較的u檢驗第三節(jié) X檢驗一、四格表資料的X檢

17、驗(一)四格表資料的X檢驗的基本思想假設兩組資料率的差異來自抽樣誤差,用 X1值反映實際頻數(shù)和理論頻數(shù)吻合 的程度。在Ho (n 1= n 2)成立的條件下,實際頻數(shù)與理論頻數(shù)相差不應該很大, 若實際算出的X 2值較大,超過了設定的檢驗水準,則有理由懷疑 Ho的真實性, 從而拒絕Ho,接受Hi (Hi: n 1工冗2)應用:推斷兩個(或多個)總體率或構成比之間是否有差別和多個樣本率間的多重比較、四個表資料的卡方檢驗 四個表X檢驗基本公式: 四個表X檢驗專用公式:適用條件:兩樣本率比較時, 總例數(shù)n40且所有格子T5配對設計四個表卡方檢驗公式:若 b+c 401 (ad bc n/2)2n(a

18、b)(c d)(a c)(b d)1.當n40且所有的T5時,用X檢驗的基本公式或四格表資料X檢驗的專用公式;當a時,改用四格表資料的Fisher確切概率法。2.當n40但有 K T5時,用四格表資料X檢驗的校正公式或改用四格表資料的Fisher確切概率法3.當nv40,或Tvl時,用四格表資料的Fisher確切概率法。(三)四格表資料的確切概率法四格表資料的Fisher確切概率法是一種直接計算概率的方法,理論依據是超幾 何分布,四格表資料的確切概率法不屬于 X檢驗的范疇,常作為四格表資料假 設檢驗的補充。二、配對四格表資料的X檢驗八 b , v =1若 b+cv 40/ =叫4,v =1三、

19、行x列表資料的 X檢驗用于多個樣本率的比較,兩個或多個構成比的比較理論頻數(shù)不應小于1,K T5的格子數(shù)不應超過總格子數(shù)1/5多個樣本率比較,若所得統(tǒng)計推斷為拒絕 H0,接受H1時,只能認為各總體率之 間總的來說有差別,但不能說明任兩個總體率之間均有差別。一般的X 2檢驗不適用于有序分類資料(等級資料)一一等級” 程度” 優(yōu)劣 的比較分析。因為檢驗只利用了兩組構成比提供的信息,損失了有序指標包含 的等級”信息。第四節(jié) 秩和檢驗秩和檢驗是將定量數(shù)據從小到大、等級從弱到強或從強到弱轉換成秩后,求秩和,計算檢驗統(tǒng)計量一一秩統(tǒng)計量,做出統(tǒng)計推斷。應用:? 不滿足t檢驗條件的數(shù)值變量資料? 有序分類變量資

20、料(等級資料)? 分布類型不明? 一端或二端無確定數(shù)值? 任何分布類型的資料秩和檢驗應用中的注意事項(1)秩和檢驗一方面由于其方法的穩(wěn)健性而具備不受總體分布限制,適用范圍廣 的優(yōu)點,但另一方面,在秩轉換的過程中損失了原數(shù)據的部分信息。如果已知計量資料滿足(或近似滿足)t檢驗應用條件,這時若選秩和檢驗,由于沒有充分 利用資料提供的信息,會降低檢驗效能。即當 Ho不真時,秩和檢驗將不如t檢 驗能較靈敏的拒絕H。,犯第2類錯誤的概率要比t檢驗大。(2)對于計量資料,若滿足正態(tài)和方差齊性條件,應選t檢驗對總體均數(shù)作假設檢 驗;當資料偏離假定條件時,選用秩和檢驗才是可靠的。(3)對于大樣本資料,通過把原

21、變量值或等級轉換成秩后,可采用t檢驗方法對平均秩次進行檢驗?!纠}填空】等級資料的比較宜選用 _檢驗?!敬鸢浮恐群汀纠}簡答】秩和檢驗的優(yōu)點【答案】秩和檢驗適合任何分布的資料;具有較好的穩(wěn)健性。第十八章直線回歸和直線相關第一節(jié)直線回歸用于分析兩變量間依存變化的數(shù)量關系一、直線回歸方程式中的X為自變量;式中的是由自變量 X推算應變量丫的估計值。a是回歸直線在丫軸上的截距,即X=0時的丫值;b為樣本的回歸系數(shù),即回歸直線的斜率,表示當 X變動一個單位時,丫平均變 動b個單位。a和b的估計常用最小二乘法原則所有的點離回歸線的縱向距離最近;回歸線必然通過T丫)求回歸方程的的步驟: 在普通坐標系中作散點圖,看是否有直線趨勢。 求X、丫的離均差乘積和Ixy及X、丫的離均差平方和Ixx、lyy 求a和bb蟲 (X艮)(丫 丫) 列出回歸方程:=a+bW X r【例題填空】直線回歸是分析間數(shù)量關系的統(tǒng)計方法。(2011.4)X Y【答案】兩個變量丫n2二、總體回歸系數(shù)的假設檢驗)nt檢驗法判斷b是否來自回歸系數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論