研究生緒論 醫(yī)學統(tǒng)計學課件_第1頁
研究生緒論 醫(yī)學統(tǒng)計學課件_第2頁
研究生緒論 醫(yī)學統(tǒng)計學課件_第3頁
研究生緒論 醫(yī)學統(tǒng)計學課件_第4頁
研究生緒論 醫(yī)學統(tǒng)計學課件_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多元統(tǒng)計與軟件應用研究生教學用書/教育部學位管理與研究生教育司推薦

醫(yī)

統(tǒng)

學(第三版)

出版日:2010-08-01

孫振球主編徐勇勇副主編課程安排

72學時

4~17周,每周6學時(星期一、日)考試時間另行通知由衛(wèi)生部教材辦和全國高等醫(yī)藥教材建設(shè)研究會規(guī)劃的研究生教材《醫(yī)學統(tǒng)計學》于2010年8月(第三版)出版以來,為全國大多數(shù)高等醫(yī)藥院校選用,反映良好。2002年8月(第一版)2005年8月(第二版)2010年8月(第三版)2014年(第四版)講授內(nèi)容內(nèi)容提要第一節(jié)概述第二節(jié)醫(yī)學統(tǒng)計資料的來源與分類第三節(jié)統(tǒng)計學常用的基本概念第四節(jié)統(tǒng)計工作的基本步驟第五節(jié)統(tǒng)計學發(fā)展簡史統(tǒng)計學(statistics)統(tǒng)計學是關(guān)于數(shù)據(jù)(data)的科學,是從數(shù)據(jù)中提取信息的一門學科,包括設(shè)計、搜集、整理、分析和表達等步驟。第一節(jié)概述1.采用統(tǒng)計學方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。變異(variation)是社會和生物醫(yī)學中的普遍現(xiàn)象。變異使得實驗或觀察的結(jié)果具有不確定性,如每個人的身高、體重、血壓等各有不同。

為什么要學統(tǒng)計學?

最大值=6.18,最小值=3.29,極差=2.89。算術(shù)均數(shù)=4.72,標準差=0.57。2.用統(tǒng)計學思維方式考慮有關(guān)醫(yī)學研究中的問題

“陽性”結(jié)果是否是虛假聯(lián)系?某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效?

“陰性”結(jié)果是否是樣本含量不足?

有人曾對發(fā)表在Lancet,NEnglJMed,JAMA等著名醫(yī)學雜志上的71篇陰性結(jié)果的論文作過分析,發(fā)現(xiàn)其中有62篇(93%)可能是由于樣本含量不足造成的假陰性。

JAMA,新英格蘭醫(yī)學雜志(NEJM)、英國醫(yī)學雜志、中華醫(yī)學會雜志對來稿都有統(tǒng)計學要求或統(tǒng)計學指導。國際生物醫(yī)學雜志編輯協(xié)會在其《生物醫(yī)學期刊投稿的統(tǒng)一要求》中也包含了統(tǒng)計學要求。UniformRequirementsforManuscripts

SubmittedtoBiomedicalJournals

http://4.獲得循證醫(yī)學證據(jù)的主要手段“良好愿望的醫(yī)學”(well-meaningmedicine)轉(zhuǎn)入“以證據(jù)為基礎(chǔ)的醫(yī)學”(evidence-basedmedicine,EBM)需要有統(tǒng)計學方法的支持。

全世界的醫(yī)學期刊每年大約刊登600萬學術(shù)論文,但能作為可靠“證據(jù)”的論文并不多。

二、統(tǒng)計數(shù)據(jù)的分類只有認識了數(shù)據(jù)的特點,才能正確地選用統(tǒng)計分析方法

按變量測量的精確程度由低到高,將數(shù)據(jù)分類為:名義數(shù)據(jù)(如性別、婚姻狀況)、有序變量(如療效,類別間差別大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差別有實際意義)、比變量(如身高,除具有區(qū)間變量的特征外,還具有真實意義的零點。攝氏溫度的零點為水結(jié)冰時溫度,并非絕對意義的零點,所以它不屬于比變量)定量數(shù)據(jù)定性數(shù)據(jù)1、定性數(shù)據(jù)(qualitativedata)

(二項與多項)分類數(shù)據(jù)(categoricaldata)計數(shù)數(shù)據(jù)(enumeration(counting)data)

2、定量數(shù)據(jù)(quantitativedata)

計量數(shù)據(jù)(measurementdata)區(qū)間數(shù)據(jù)(intervaldata)數(shù)值數(shù)據(jù)(numericaldata)3、等級資料(rankeddata)

有序資料(ordinaldata)

(一)定性與定量數(shù)據(jù)的別名(二)三類數(shù)據(jù)間的關(guān)系

例:一組2040歲成年人的血壓以12kPa為界分為正常與異常兩組,統(tǒng)計每組例數(shù)

<8低血壓8正常血壓12輕度高血壓15中度高血壓17重度高血壓定量數(shù)據(jù)等級數(shù)據(jù)定性數(shù)據(jù)觀察單位observations個體individuals變量variablesQuantitativedata定量資料Qualitativedata定性數(shù)據(jù)Units;elements(三)三類數(shù)據(jù)的編碼與計算(1)

例:一組2040歲成年人的血壓以12kPa為界分為正常(=0)與異常(=1)兩組,統(tǒng)計每組例數(shù)

<8低血壓418正常血壓102

12輕度高血壓13315中度高血壓164

17重度高血壓185定量數(shù)據(jù)等級數(shù)據(jù)定性數(shù)據(jù)(三)三類數(shù)據(jù)的編碼與計算(2)1.定量數(shù)據(jù):允許計算均數(shù)、標準差等(可采用t、F檢驗等,可當做有序或定性數(shù)據(jù)處理)2.定性數(shù)據(jù):編碼是任意的,不能對編碼執(zhí)行均數(shù)標準差等計算,但可計算率或比(可采用卡方檢驗等)

調(diào)查14名男子的婚姻狀況3.有序數(shù)據(jù):允許基于順序的計算,如計算中位數(shù)、百分位數(shù)(可當做定性數(shù)據(jù)處理)1、變量——可以測量的任何特征或?qū)傩訟nycharacteristicorattributethatcanbemeasured。(不同個體結(jié)果可能不同)隨機變量——在概率論中稱變量為隨機變量

一、變量與隨機變量Variableandrandomvariable根據(jù)觀察數(shù)據(jù)之間有無縫隙(gap),常將數(shù)據(jù)分類為離散型(discrete)變量(有縫隙)與連續(xù)型(continuous)變量(無縫隙)兩大類。三、總體與樣本populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分研究對象

隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的方法抽取樣本(在總體中每個個體具有相同的機會被抽到)。四、參數(shù)與統(tǒng)計量

parameterandstatistic參數(shù):總體的統(tǒng)計指標,如總體均數(shù)、標準差,采用希臘字母分別記為μ、σ。固定的常數(shù)

總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

推斷inference統(tǒng)計量:樣本的統(tǒng)計指標,如樣本均數(shù)、標準差,采用拉丁字母分別記為。參數(shù)附近波動的隨機變量。

樣本的實際發(fā)生率稱為頻率。設(shè)在相同條件下,獨立重復進行n次試驗,事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。

概率:隨機事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。五、頻率與概率

frequencyandprobability必然事件P=1隨機事件0<P<1不可能事件P=0

P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習慣),統(tǒng)計學上認為不大可能發(fā)生。小概率事件CertainImpossible0.501頻率與概率間的關(guān)系:1.樣本頻率總是圍繞概率上下波動2.樣本含量n越大,波動幅度越小,頻率越接近概率。六、誤差(Error)測量值=真值+隨機誤差+非隨機誤差

Xi=i+i

1.隨機誤差(隨機抽樣誤差):影響因素眾多,變化無方向性,不可避免,但可用統(tǒng)計方法進行分析。2.系統(tǒng)誤差受確定因素影響,大小變化有方向性。3.非系統(tǒng)誤差(過失誤差)研究者偶然失誤而造成的誤差。偏差(bias)七、準確度與可靠度準確度(accuracy)或真實性(validity):觀察值與真值的接近程度,受系統(tǒng)誤差的影響(常用指標:如靈敏度、特異度)??煽慷龋╮eliabiliy)——也稱精密度(precision)或重復性(repeatability):重復觀察時觀察值與其均值的接近程度,受隨機誤差的影響(常用指標:一致百分率、Kappa值)。八、因果關(guān)系與統(tǒng)計學聯(lián)系因果關(guān)系(causality)統(tǒng)計學聯(lián)系(association)由于混雜因素,標準的統(tǒng)計學方法一般只能獲得是否存在統(tǒng)計學聯(lián)系的結(jié)論。一、研究設(shè)計二、搜集資料三、整理資料四、分析資料五、結(jié)果表達第四節(jié)統(tǒng)計工作的基本步驟1.調(diào)查設(shè)計(surveydesign)對研究對象不施加任何干預,通常建立隨機抽樣(randomsampling)方案。2.實驗設(shè)計(experimentdesign)對研究對象施加干預,如動物實驗研究、臨床試驗,通常建立隨機分組(randomallocation)方案。一、研究設(shè)計實驗設(shè)計的三個基本原則1.隨機化(randomization)2.對照(control)3.重復(replication)Fisher在他的著作中多次強調(diào),統(tǒng)計學家與科學研究者的合作應該在實驗設(shè)計階段,而不是在需要數(shù)據(jù)處理的時候?!霸囼炌瓿珊笤僬医y(tǒng)計學家,無異于請統(tǒng)計學家為試驗進行“尸體解剖”。統(tǒng)計學家或許只能告訴你試驗失敗的原因。”

二、搜集資料(datacollection)搜集資料要遵循準確、完整、及時三個原則。資料搜集計劃包括:①選擇搜集資料的地點、人員和時間;②搜集資料人員的培訓方案;③預調(diào)查或預實驗方案擬定;④資料的記錄方式;⑤調(diào)查表的擬訂和印刷;⑥調(diào)查或?qū)嶒瀮x器、試劑的準備;⑦調(diào)查資料的抽樣復核比例和方法;⑧搜集資料所需經(jīng)費的準備等。人員選擇:高素質(zhì)、有相關(guān)專業(yè)基礎(chǔ)、以往曾有類似研究經(jīng)歷的人員加以嚴格培訓和管理是能夠遵循三原則的保證。搜集資料的方式:直接觀察、采訪、填表和通信。直接觀察、采訪:調(diào)查人員親自參與和記錄,若調(diào)查人員素質(zhì)高,工作認真負責,并接受過統(tǒng)一的培訓,調(diào)查結(jié)果可靠。填表和通信由被調(diào)查者自己填寫,若被調(diào)查者文化水平高,素質(zhì)高,樂意配合調(diào)查,也可以得到可靠的資料,否則資料的誤差較大。三、整理資料(datasorting)

目的是將搜集到的原始資料系統(tǒng)化、條理化,便于進一步計算與分析。編碼,將數(shù)據(jù)輸入計算機糾錯改錯、補漏等四、分析資料(dataanalysis)根據(jù)研究設(shè)計的目的、要求,資料的類型和分布的特征等選擇統(tǒng)計分析方法。1.統(tǒng)計描述:即計算統(tǒng)計指標,如平均值、發(fā)病率等,繪制統(tǒng)計圖。2.統(tǒng)計推斷:即可信區(qū)間估計與統(tǒng)計學假設(shè)檢驗總體均數(shù)、總體率的可信區(qū)間及其假設(shè)檢驗兩個總體均數(shù)、總體率差值的可信區(qū)間及其假設(shè)檢驗多個總體指標之間的假設(shè)檢驗。3.多因素回歸模型分析等。統(tǒng)計描述統(tǒng)計推斷指標描述圖表描述參數(shù)估計假設(shè)檢驗統(tǒng)計分析五、結(jié)果表達使用的統(tǒng)計學方法使用的統(tǒng)計學軟件假設(shè)檢驗的統(tǒng)計量、P值等結(jié)論第五節(jié)統(tǒng)計學發(fā)展簡史

1.早期公元前3050年古埃及人為修建金字塔籌集建筑費,對全國的人口和財產(chǎn)進行了普查。19世紀,應用數(shù)學家為解決賭徒們在博彩中出現(xiàn)的輸贏概率問題逐漸形成和發(fā)展了概率論,從而為統(tǒng)計學的發(fā)展奠定了堅實的基礎(chǔ)。2.近代

計算機和統(tǒng)計軟件如SAS、SPSS的出現(xiàn)使統(tǒng)計學得到了突飛猛進的發(fā)展。

3.現(xiàn)代

生物統(tǒng)計學著名歷史人物其人其事

1.數(shù)學神童Gauss

(1777-1855)德國數(shù)學神童高斯

在孩童時就能夠快速計算出“1+2+3+…+100=5050”的答案。他對統(tǒng)計的主要貢獻除了正態(tài)分布(

normaldistribution)外,還有算術(shù)均數(shù)、幾何均數(shù)、二項分布理論和最小二乘法等。其實,在Gauss之前就有人發(fā)現(xiàn)了正態(tài)分布,但只有他很快將之應用于天文學研究,并使其應用價值廣為人知,故正態(tài)分布又稱高斯分布(Gaussiandistribution)。2.從釀酒師到統(tǒng)計主管的Gosset(1876-1937)

1899年Gosset在英國都柏林一釀酒公司做釀酒師,在對小樣本進行質(zhì)量控制的研究中發(fā)現(xiàn)了t分布,其論文1908年以Student為筆名發(fā)表。自此開創(chuàng)了小樣本統(tǒng)計的新紀元。

非常有趣的現(xiàn)象是,Gosset的數(shù)學欠佳,因而不能自己解決t檢驗的理論和應用問題,其最后的完善,是由Fisher,Neyman和EPearson先后完成的。正如后人評價的那樣:“Gosset提出實際問題,F(xiàn)isher和EPearson將其轉(zhuǎn)成統(tǒng)計問題,Neyman用數(shù)學解決問題”。

實際上是1925年Fisher在《t分布的應用》一文中定義的。

大家熟知的公式:3.醫(yī)院統(tǒng)計與衛(wèi)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論