![醫(yī)學統(tǒng)計學基本概念(馬修強)_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb61.gif)
![醫(yī)學統(tǒng)計學基本概念(馬修強)_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb62.gif)
![醫(yī)學統(tǒng)計學基本概念(馬修強)_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb63.gif)
![醫(yī)學統(tǒng)計學基本概念(馬修強)_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb64.gif)
![醫(yī)學統(tǒng)計學基本概念(馬修強)_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb6/1faac785-ede8-47c6-99dc-0c3ae5b1ecb65.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、醫(yī)學統(tǒng)計學醫(yī)學統(tǒng)計學(medical statistics)衛(wèi)生統(tǒng)計學教研室衛(wèi)生統(tǒng)計學教研室馬修強馬修強 副教授副教授2011-9-13名人名言名人名言學者不能離開統(tǒng)計學而研學;學者不能離開統(tǒng)計學而研學;政治家不能離開統(tǒng)計學而施政;政治家不能離開統(tǒng)計學而施政;事業(yè)家不能離開統(tǒng)計學而執(zhí)業(yè);事業(yè)家不能離開統(tǒng)計學而執(zhí)業(yè);軍事家不能離開統(tǒng)計學而謀略。軍事家不能離開統(tǒng)計學而謀略。馬寅初馬寅初統(tǒng)計學的定義統(tǒng)計學的定義nA science dealing with the collection, analysis, interpretation and pre-sentation of messes of
2、numerical data. (關于關于數(shù)據(jù)的收集、分析、解數(shù)據(jù)的收集、分析、解釋和表達的學科釋和表達的學科) - Websters International Dictionary統(tǒng)計學的定義統(tǒng)計學的定義nThe science and art of dealing with variation through collection, classifi-cation, and analysis in such a way as to obtain reliable result. (通過數(shù)據(jù)的收集、分通過數(shù)據(jù)的收集、分類和分析來處理變異以獲得類和分析來處理變異以獲得可靠結果的一門學科和藝術
3、可靠結果的一門學科和藝術)-John M. Last, A Dictionary of Epidemiology統(tǒng)計學與醫(yī)學統(tǒng)計學與醫(yī)學n統(tǒng)計學在醫(yī)學方面應用的分支名稱:統(tǒng)計學在醫(yī)學方面應用的分支名稱:q生物統(tǒng)計學生物統(tǒng)計學(biostatistics)q醫(yī)學統(tǒng)計學(醫(yī)學統(tǒng)計學(medical statistics)q衛(wèi)生統(tǒng)計學(衛(wèi)生統(tǒng)計學(health statistics)n醫(yī)學統(tǒng)計學醫(yī)學統(tǒng)計學q運用統(tǒng)計學原理和方法研究醫(yī)學科研中有關數(shù)據(jù)的運用統(tǒng)計學原理和方法研究醫(yī)學科研中有關數(shù)據(jù)的收集、整理和分析的應用學科。收集、整理和分析的應用學科。1.學會駕馭變異性(學會駕馭變異性(variatio
4、n) 變異性是社會和生物醫(yī)學中的普遍現(xiàn)象。變異性是社會和生物醫(yī)學中的普遍現(xiàn)象。 WHO報告中國期望壽命:平均報告中國期望壽命:平均 71(歲)(歲) 實際上每個人的實際壽命是不確定,有些用現(xiàn)有實際上每個人的實際壽命是不確定,有些用現(xiàn)有的知識可以解釋,有些不能解釋。統(tǒng)計試圖為不能解的知識可以解釋,有些不能解釋。統(tǒng)計試圖為不能解釋的問題(困惑費解的問題)提供線索和依據(jù)。釋的問題(困惑費解的問題)提供線索和依據(jù)。 統(tǒng)計學就是處理數(shù)據(jù)中變異的科學。統(tǒng)計學就是處理數(shù)據(jù)中變異的科學。為什么要學習醫(yī)學統(tǒng)計學?為什么要學習醫(yī)學統(tǒng)計學?The odds of finding two identical fing
5、erprints were 1 in 64 billion.Francis Galton兩個隨機個體具有相同DNA圖形的概率為310-11;如果同時用兩種探針進行比較,兩個個體完全相同的概率小于510-19。每支槍的槍管都有獨一無二的特征,這種特征影響了它所發(fā)射的每一發(fā)子彈。司法彈道學120名正常成年男子紅細胞計數(shù)值名正常成年男子紅細胞計數(shù)值(1012/L) 5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.64 5.14 5.46 4.66 4.204
6、.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.83 4
7、.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.692. 設計你的研究設計你的研究 隨機對照試驗,隨機對照試驗,Randomized Controlled Trial(RCT) 不一定是最好的醫(yī)學研究方法不一定是最好的醫(yī)學研究方法, 但是最好的試驗方法。但是最好的試驗方法。 國際生物醫(yī)學雜志編輯協(xié)會一般要求國
8、際生物醫(yī)學雜志編輯協(xié)會一般要求(包含了包含了統(tǒng)計學要求統(tǒng)計學要求):Uniform Requirements for Manuscripts Submitted to Biomedical Journals國際醫(yī)學雜志編輯委員會對隨機對照試驗論文國際醫(yī)學雜志編輯委員會對隨機對照試驗論文報告要求報告要求:CONSORT (Consolidated Standards of Reporting Trials) /Statement/revisedstatement.htm#ref53. 論文的統(tǒng)計學審查論文的統(tǒng)計學審查論文段(主題)論文
9、段(主題)序號序號論文段(主題)論文段(主題)序號序號題目與摘要題目與摘要1統(tǒng)計學方法統(tǒng)計學方法12序言序言2結果結果13方法與參與方方法與參與方3招募受試者招募受試者14受試者受試者4基線數(shù)據(jù)基線數(shù)據(jù)15干預措施干預措施5納入分析的例數(shù)納入分析的例數(shù)16結局指標結局指標6結局和估計值結局和估計值17樣本量樣本量7輔助分析輔助分析18隨機數(shù)的產(chǎn)生隨機數(shù)的產(chǎn)生8不良事件不良事件19隨機分組(密封的方案)隨機分組(密封的方案)9局限性局限性20隨機的實施隨機的實施10可推廣性可推廣性 21盲法盲法11解釋解釋22在全世界報告的在全世界報告的122個關于個關于Selective Sero-tonin
10、 Reuptake Inhibitors (SSRI) 抗抑郁作抗抑郁作用的用的RCT研究報告中,僅有一個研究報告中,僅有一個(0.8%)報告報告符合符合CONSORT的描述規(guī)范。的描述規(guī)范。“良好愿望的醫(yī)學良好愿望的醫(yī)學”(well-meaning medicine)轉入轉入“基于證據(jù)的醫(yī)學基于證據(jù)的醫(yī)學” (evidence-based medicine,EBM)。所有臨床試驗的結果都是先有統(tǒng)計學結論所有臨床試驗的結果都是先有統(tǒng)計學結論(統(tǒng)計指標比較、統(tǒng)計指標比較、P 值值),再給出專業(yè)結論。,再給出專業(yè)結論。 4. 統(tǒng)計學結論是重要的科學證據(jù)之一統(tǒng)計學結論是重要的科學證據(jù)之一統(tǒng)計學與數(shù)值
11、計算統(tǒng)計學與數(shù)值計算n統(tǒng)計學的結論是建立在正確的數(shù)值計算的基礎上;統(tǒng)計學的結論是建立在正確的數(shù)值計算的基礎上;數(shù)值計算可以由多種途徑完成,如心算、手工計算、數(shù)值計算可以由多種途徑完成,如心算、手工計算、計算器、電腦(統(tǒng)計軟件);計算器、電腦(統(tǒng)計軟件);n使用統(tǒng)計軟件僅僅是解決復雜統(tǒng)計計算的快速實現(xiàn)使用統(tǒng)計軟件僅僅是解決復雜統(tǒng)計計算的快速實現(xiàn)問題,其真正的精髓并不在于如何操作軟件,而在問題,其真正的精髓并不在于如何操作軟件,而在于你是否具有足夠的統(tǒng)計學知識選擇合適的統(tǒng)計方于你是否具有足夠的統(tǒng)計學知識選擇合適的統(tǒng)計方法,并對結果作出合理的解釋。法,并對結果作出合理的解釋。產(chǎn)生的問題:產(chǎn)生的問題:
12、1. 數(shù)據(jù)的可靠性:數(shù)據(jù)的可靠性:數(shù)據(jù)造假問題數(shù)據(jù)造假問題2. 統(tǒng)計方法的選擇:統(tǒng)計方法的選擇:誤用非常嚴重誤用非常嚴重舍恩舍恩(Schon)事件事件維克托維克托 尼努夫化學尼努夫化學元素發(fā)現(xiàn)造假事件元素發(fā)現(xiàn)造假事件黃禹錫事件黃禹錫事件數(shù)據(jù)造假數(shù)據(jù)造假20052005年年6 6月月9 9日,日,自然自然雜志公布了一份雜志公布了一份令人震驚的調查結果。令人震驚的調查結果。美國調查人員對美國調查人員對3247名科學家的問卷調查結果顯示:名科學家的問卷調查結果顯示: 約約5%的科學家承認,由于得到的信息與他們正在進的科學家承認,由于得到的信息與他們正在進行的研究相抵觸,他們曾丟棄某些數(shù)據(jù);行的研究相
13、抵觸,他們曾丟棄某些數(shù)據(jù);10%的科學家承認,他們在發(fā)表研究報告時,曾的科學家承認,他們在發(fā)表研究報告時,曾不適當?shù)貙⒆约夯蛩说拿至袨樽髡撸徊贿m當?shù)貙⒆约夯蛩说拿至袨樽髡撸怀^超過15%的科學家承認,他們曾改變原來的設計或的科學家承認,他們曾改變原來的設計或結果,或忽略一些觀測以便使贊助商滿意。結果,或忽略一些觀測以便使贊助商滿意。統(tǒng)計方法的誤用統(tǒng)計方法的誤用70%左右的文章有統(tǒng)計學錯誤;其中,左右的文章有統(tǒng)計學錯誤;其中,70%的錯誤的錯誤出在初等的、基本的統(tǒng)計學方法,出在初等的、基本的統(tǒng)計學方法,30%的錯誤出在的錯誤出在高等的、復雜的統(tǒng)計學方法。高等的、復雜的統(tǒng)計學方法。1966
14、年,據(jù)對美國醫(yī)師協(xié)會雜志(年,據(jù)對美國醫(yī)師協(xié)會雜志(JAMA)等醫(yī)學)等醫(yī)學雜志的來稿的統(tǒng)計顯示,雜志的來稿的統(tǒng)計顯示,149篇投稿論文中,僅有篇投稿論文中,僅有28%可以接受,可以接受,67%有統(tǒng)計缺陷但尚可以糾正,有統(tǒng)計缺陷但尚可以糾正,5%不可救藥。不可救藥?!吧锝y(tǒng)計學者是我們的可貴盟友。生物統(tǒng)計學生物統(tǒng)計學者是我們的可貴盟友。生物統(tǒng)計學不是遠離我們的數(shù)學,而是現(xiàn)代醫(yī)學的一門基不是遠離我們的數(shù)學,而是現(xiàn)代醫(yī)學的一門基本學科,就像大廈中的一個支柱本學科,就像大廈中的一個支柱”。 美國醫(yī)師協(xié)會雜志編輯美國醫(yī)師協(xié)會雜志編輯 “非常痛心地看到,因為數(shù)據(jù)分析的缺陷和非常痛心地看到,因為數(shù)據(jù)分析的
15、缺陷和錯誤,那么多好的生物研究工作面臨著被錯誤,那么多好的生物研究工作面臨著被葬送的危險葬送的危險”。 Yates和和HealyHow to lie with statistics-Darrell Huff如何用統(tǒng)計學說謊或統(tǒng)計數(shù)字會撒謊如何用統(tǒng)計學說謊或統(tǒng)計數(shù)字會撒謊n統(tǒng)計這種神秘的語言,在一個用事實說話的社會統(tǒng)計這種神秘的語言,在一個用事實說話的社會里是如此吸引人,但有時它卻被利用并成為惡意里是如此吸引人,但有時它卻被利用并成為惡意夸大或迷惑他人的工具。統(tǒng)計方法和統(tǒng)計術語是夸大或迷惑他人的工具。統(tǒng)計方法和統(tǒng)計術語是必不可少的。但必不可少的。但如果不能準確理解和恰當使用這如果不能準確理解和恰
16、當使用這些統(tǒng)計語言,不能正確了解其含義,統(tǒng)計結果只些統(tǒng)計語言,不能正確了解其含義,統(tǒng)計結果只能是一堆廢話能是一堆廢話。n統(tǒng)計不僅是一門科學,更是一門藝術統(tǒng)計不僅是一門科學,更是一門藝術(加工、處理、加工、處理、升華升華)。統(tǒng)計學的幾個基本概念統(tǒng)計學的幾個基本概念n同質與變異同質與變異n總體與樣本總體與樣本n參數(shù)與統(tǒng)計量參數(shù)與統(tǒng)計量n變量與資料變量與資料n誤差誤差n頻率與概率頻率與概率n同質同質:指事物的性質、影響條件或背景相:指事物的性質、影響條件或背景相同或非常相近。同或非常相近。 例:調查例:調查20102010年上海市年上海市7 7歲男童的身高和體重歲男童的身高和體重 同質:同質:201
17、02010年、上海市、年、上海市、7 7歲男童歲男童:同質個體間測量結果的差異。:同質個體間測量結果的差異。 變異:變異: 上海市上海市7 7歲男童的身高和體重各不相同歲男童的身高和體重各不相同5.805.605.405.205.004.804.604.404.204.003.8035302520151050總體總體(population)n定義:根據(jù)研究目的確定的、同質的全部研究定義:根據(jù)研究目的確定的、同質的全部研究對象的觀測值的全體。對象的觀測值的全體。q如研究如研究18歲男青年的生長發(fā)育情況,指標為身高、歲男青年的生長發(fā)育情況,指標為身高、體重,則所有體重,則所有18歲男青年的身高測量
18、值為一個總體,歲男青年的身高測量值為一個總體,體重測量值為另一個總體。體重測量值為另一個總體。n有限總體有限總體(finite population) 如如2011年上海市在校大學生年上海市在校大學生n無限總體無限總體(infinite population) 如高血壓病人如高血壓病人樣本樣本(sample)n來自總體的部分研究對象的觀測值。來自總體的部分研究對象的觀測值。n抽樣抽樣(sampling):總體中的每個研究單位被抽:總體中的每個研究單位被抽取作為樣本的過程。取作為樣本的過程。n樣本量樣本量(sample size):樣本包含的研究對象的:樣本包含的研究對象的個數(shù)。個數(shù)。Today
19、: 7 April 2022參數(shù)參數(shù):反映:反映總體特征總體特征的的統(tǒng)計指標,如總體均數(shù)、統(tǒng)計指標,如總體均數(shù)、標準差,采用希臘字母標準差,采用希臘字母分別記為分別記為、。固定固定的常數(shù)。的常數(shù)??傮w總體樣本樣本抽取部分觀察單位抽取部分觀察單位 推斷推斷統(tǒng)計量統(tǒng)計量:反映:反映樣本樣本特征的統(tǒng)計指標,如樣本均數(shù)、標特征的統(tǒng)計指標,如樣本均數(shù)、標準差,采用拉丁字母分別記為準差,采用拉丁字母分別記為 。 參數(shù)附近波動參數(shù)附近波動的隨機變量。的隨機變量。SX、參數(shù)與統(tǒng)計量參數(shù)與統(tǒng)計量 (parameter and statistic)誤差誤差(error)n誤差的定義:實測值與真實值之間的差異誤差的
20、定義:實測值與真實值之間的差異n誤差的分類:誤差的分類:q隨機誤差隨機誤差(random error)q非隨機誤差非隨機誤差(nonrandom error)n系統(tǒng)誤差系統(tǒng)誤差(systematic error)n非系統(tǒng)誤差非系統(tǒng)誤差(nonsystematic error)隨機誤差隨機誤差n由多種尚無法控制的因素引起的誤差。由多種尚無法控制的因素引起的誤差。n無法消除或不可避免,但有規(guī)律可循。無法消除或不可避免,但有規(guī)律可循。n抽樣誤差(抽樣誤差(sampling error)q在抽樣過程中由于抽樣的偶然性而出現(xiàn)的誤差。在抽樣過程中由于抽樣的偶然性而出現(xiàn)的誤差。q表現(xiàn)為總體參數(shù)與樣本統(tǒng)計量的
21、差異,以及多個樣本表現(xiàn)為總體參數(shù)與樣本統(tǒng)計量的差異,以及多個樣本統(tǒng)計量之間的差異。統(tǒng)計量之間的差異。q可用標準誤描述其大小??捎脴藴收`描述其大小。系統(tǒng)誤差系統(tǒng)誤差n由可知的或可掌握的因素引起的誤差。由可知的或可掌握的因素引起的誤差。n其值恒定不變或遵循一定變化規(guī)律,產(chǎn)生原因其值恒定不變或遵循一定變化規(guī)律,產(chǎn)生原因往往是已知或可能掌握的往往是已知或可能掌握的n理論上可以通過周密的研究設計和嚴格的技術理論上可以通過周密的研究設計和嚴格的技術措施消除,實際操作上要看具體情況。措施消除,實際操作上要看具體情況。q實驗者感覺或操作上的差異;實驗者感覺或操作上的差異;q儀器設備的測量精度;儀器設備的測量精
22、度;q抽樣不均勻,分配不隨機等。抽樣不均勻,分配不隨機等。n舉例:舉例:用動脈血壓計測量某人血壓用動脈血壓計測量某人血壓( (實際值為實際值為80mmHg)80mmHg),各次測量的均值為,各次測量的均值為100mmHg100mmHg。下圖為。下圖為系統(tǒng)誤差和隨機誤差的示意圖。系統(tǒng)誤差和隨機誤差的示意圖。隨機誤差隨機誤差80100舒張壓舒張壓(mmHg)系統(tǒng)誤差系統(tǒng)誤差發(fā)發(fā)生生頻頻次次血壓計法測量舒張壓值的分布血壓計法測量舒張壓值的分布非系統(tǒng)誤差非系統(tǒng)誤差n又稱過失誤差又稱過失誤差(gross error)n由研究者偶然失誤造成的誤差。由研究者偶然失誤造成的誤差。n可通過研究者的認真檢查核對避
23、免此類誤差??赏ㄟ^研究者的認真檢查核對避免此類誤差。q儀器失靈儀器失靈q記錄錯誤(點錯小數(shù)點、指標弄錯等)記錄錯誤(點錯小數(shù)點、指標弄錯等)確定性現(xiàn)象和不確定現(xiàn)象確定性現(xiàn)象和不確定現(xiàn)象n確定性現(xiàn)象:在一定條件下,必定會發(fā)生的現(xiàn)確定性現(xiàn)象:在一定條件下,必定會發(fā)生的現(xiàn)象。象。q必然事件必然事件(P1)和不可能事件和不可能事件(P0)。n隨機現(xiàn)象:在同樣條件下會出現(xiàn)兩種或多種結隨機現(xiàn)象:在同樣條件下會出現(xiàn)兩種或多種結果,事先不能確定可能發(fā)生何種結果的現(xiàn)象。果,事先不能確定可能發(fā)生何種結果的現(xiàn)象。q在一定條件下可能發(fā)生的事件為隨機事件在一定條件下可能發(fā)生的事件為隨機事件(0P1)。頻率與概率頻率與概
24、率n頻率頻率(relative frequency):在相同條件下,獨:在相同條件下,獨立地重復立地重復n次試驗,隨機事件次試驗,隨機事件A出現(xiàn)出現(xiàn) f 次,則稱次,則稱 f/n 為隨機事件為隨機事件A出現(xiàn)的頻率。出現(xiàn)的頻率。實實 驗驗 者者Buffon(法法)k.pearson(英英)k.pearson(英英)投擲次數(shù)投擲次數(shù) 4040 12000 24000“正面正面”次數(shù)次數(shù) 2048 6019 12012 頻頻 率率 0.5069 0.5016 0.5005頻率與概率頻率與概率n概率概率(probability):隨機事件發(fā)生可能性大?。弘S機事件發(fā)生可能性大小的度量指標。的度量指標。q
25、當當n趨近無窮大時,頻率趨近無窮大時,頻率f/n始終在一個常數(shù)左右微始終在一個常數(shù)左右微小擺動,稱該常數(shù)為隨機事件小擺動,稱該常數(shù)為隨機事件A的概率的概率q用用 P 表示,表示,0 P 1。q隨著樣本量的增加,頻率越來越接近概率。隨著樣本量的增加,頻率越來越接近概率。q只要觀察單位數(shù)足夠多,可將頻率作為概率的估計只要觀察單位數(shù)足夠多,可將頻率作為概率的估計值。值。Probability = Frequency?Patient: Will I survive this risky operation? Surgeon: Yes, Im absolutely sure that you will
26、survive the operation. Patient: How can you be so sure? Surgeon: Well, 9 out of 10 patients die in this operation, and yesterday my ninth patient died. Surely not變量(變量(variable)n研究者對每個觀察單位的某項特征進行觀察研究者對每個觀察單位的某項特征進行觀察或測量,該特征稱為變量?;驕y量,該特征稱為變量。n觀察或測量的結果稱為變量值或觀察值。觀察或測量的結果稱為變量值或觀察值。n變量值可以是數(shù)值,也可以是某種屬性。變量值可
27、以是數(shù)值,也可以是某種屬性。n變量值構成資料(變量值構成資料(data)。)。醫(yī)學研究中常見的資料類型醫(yī)學研究中常見的資料類型n計量資料計量資料(measurement data)n計數(shù)資料計數(shù)資料(enumeration data)n等級資料等級資料(ranked data)計量資料計量資料n又稱定量資料又稱定量資料(quantitative data),即觀測每個,即觀測每個觀察對象某項指標的大小而得到的資料;觀察對象某項指標的大小而得到的資料;n必須通過必須通過“量量”才能獲得;才能獲得;n帶有度量衡單位;帶有度量衡單位;n每個個體擁有一個數(shù)值;每個個體擁有一個數(shù)值;n可以轉換為等級資料
28、和計數(shù)資料??梢赞D換為等級資料和計數(shù)資料。計量資料的類型計量資料的類型n離散型:在一定范圍內(nèi)取值的個數(shù)為有限。離散型:在一定范圍內(nèi)取值的個數(shù)為有限。q如:出生嬰兒數(shù)、死亡人數(shù)等。如:出生嬰兒數(shù)、死亡人數(shù)等。n連續(xù)型:在一定范圍內(nèi)取值的個數(shù)為無限。連續(xù)型:在一定范圍內(nèi)取值的個數(shù)為無限。q如:身高、體重等。如:身高、體重等。計數(shù)資料計數(shù)資料n又稱定性資料又稱定性資料(qualitative data),或稱無序分,或稱無序分類變量類變量(unordered categorical variable),即將,即將觀察單位按某種屬性或類別分組計算各組的例觀察單位按某種屬性或類別分組計算各組的例數(shù),分組
29、匯總各組觀察單位數(shù)后得到的資料。數(shù),分組匯總各組觀察單位數(shù)后得到的資料。n必須通過必須通過“數(shù)數(shù)”才能獲得;才能獲得;n不帶有度量衡單位,每個個體擁有一個屬性。不帶有度量衡單位,每個個體擁有一個屬性。計數(shù)資料的類型計數(shù)資料的類型n兩分類:陽性或陰性;存活或死亡;兩分類:陽性或陰性;存活或死亡; 有效或無效;男性或女性有效或無效;男性或女性n多分類:如血型中的多分類:如血型中的A、B、O、AB四種四種等級資料的特點等級資料的特點n又稱有序分類資料又稱有序分類資料(ordinal categorical data),即,即將觀察單位按某種屬性的大小程度分成等級后分將觀察單位按某種屬性的大小程度分成
30、等級后分組計算各組的例數(shù),分組匯總各組觀察單位數(shù)后組計算各組的例數(shù),分組匯總各組觀察單位數(shù)后得到的資料。得到的資料。n必須先必須先“量量”后后“數(shù)數(shù)”才能獲得;才能獲得;n不帶有度量衡單位,每個個體擁有一個屬性;不帶有度量衡單位,每個個體擁有一個屬性;q如治療效果分為痊愈、有效、無效、惡化等如治療效果分為痊愈、有效、無效、惡化等練習:資料類型的判斷練習:資料類型的判斷病例號病例號年齡年齡(歲歲)性別性別身高身高(cm)血型血型 心電圖心電圖尿尿WBC職業(yè)職業(yè)血血RBC(1012/L)135女女1.65A正常正常教師教師4.67244男男1.74B正常正常工人工人5.21326男男1.80O正常
31、正常職員職員4.10425女女1.61AB正常正常農(nóng)民農(nóng)民3.92541男男1.71A異常異常+工人工人3.49645女女1.58B正常正常+工人工人5.48750女女1.60O異常異常+干部干部6.78828男男1.76AB正常正常+干部干部7.10931女女1.62O正常正常軍人軍人5.24資料類型的轉化資料類型的轉化n計量資料可以轉化為等級資料和計數(shù)資料計量資料可以轉化為等級資料和計數(shù)資料q如血壓中收縮壓為計量資料;如血壓中收縮壓為計量資料;q按照按照90160mmHg為界值,可分為低血壓、正常為界值,可分為低血壓、正常血壓、高血壓(等級資料);血壓、高血壓(等級資料);q也可以分為正常
32、和不正常(計數(shù)資料)。也可以分為正常和不正常(計數(shù)資料)。n計量資料的信息最豐富,研究中盡可能收集計量資料的信息最豐富,研究中盡可能收集計量資料。計量資料。 醫(yī)學統(tǒng)計學的基本步驟醫(yī)學統(tǒng)計學的基本步驟設計設計(design) 收集資料收集資料(collection of data) 整理資料整理資料(sorting data) 分析資料分析資料(analysis of data) 一、設計一、設計(design)統(tǒng)計設計:對資料收集、整理和分析全過程總的統(tǒng)計設計:對資料收集、整理和分析全過程總的設想和安排。是后續(xù)步驟的依據(jù),是最關鍵的一設想和安排。是后續(xù)步驟的依據(jù),是最關鍵的一環(huán)。是提高觀察或實
33、驗質量的重要保證。環(huán)。是提高觀察或實驗質量的重要保證??蒲性O計科研設計專業(yè)設計專業(yè)設計統(tǒng)計設計統(tǒng)計設計成果:先進性、創(chuàng)新性成果:先進性、創(chuàng)新性 科學性和可行性科學性和可行性 研究者在統(tǒng)計設計過程中的幾個關鍵問題:研究者在統(tǒng)計設計過程中的幾個關鍵問題:(1 1)如何進行抽樣,如何安排設計所規(guī)定的)如何進行抽樣,如何安排設計所規(guī)定的干預措施?干預措施?(2 2)要達到研究目的應抽取多少個觀察單位?)要達到研究目的應抽取多少個觀察單位?(3 3)如何在諸多的影響因素中,分離出研究)如何在諸多的影響因素中,分離出研究因素對結果的效應?因素對結果的效應? 二、收集資料二、收集資料(collection
34、of data) 根據(jù)設計方案,取得準確可靠的原始數(shù)據(jù),根據(jù)設計方案,取得準確可靠的原始數(shù)據(jù),是統(tǒng)計分析的基礎。是統(tǒng)計分析的基礎。 來源來源統(tǒng)計報表資料統(tǒng)計報表資料經(jīng)常性工作記錄經(jīng)常性工作記錄專題調查或實驗研究專題調查或實驗研究統(tǒng)計年鑒和統(tǒng)計數(shù)據(jù)專輯統(tǒng)計年鑒和統(tǒng)計數(shù)據(jù)專輯 三、整理資料三、整理資料(sorting data) 將原始數(shù)據(jù)將原始數(shù)據(jù)凈化、系統(tǒng)化、條理化凈化、系統(tǒng)化、條理化,以便,以便為進一步計算和統(tǒng)計分析。為進一步計算和統(tǒng)計分析。 凈化凈化是指對原始數(shù)據(jù)的清理、檢查、核對是指對原始數(shù)據(jù)的清理、檢查、核對和糾正錯誤等;和糾正錯誤等; 系統(tǒng)化和條理化系統(tǒng)化和條理化是指根據(jù)研究目的,將
35、原是指根據(jù)研究目的,將原始數(shù)據(jù)合理分組并歸納匯總等。始數(shù)據(jù)合理分組并歸納匯總等。 資料整理包括:資料整理包括:1 1、首先對原始數(shù)據(jù)進行核對和檢查、首先對原始數(shù)據(jù)進行核對和檢查2 2、設計分組、設計分組 質量分組:將觀察單位按其屬性或類別歸質量分組:將觀察單位按其屬性或類別歸類分組。如性別、職業(yè)分類等。類分組。如性別、職業(yè)分類等。 數(shù)量分組:將觀察單位按數(shù)值大小進行分數(shù)量分組:將觀察單位按數(shù)值大小進行分組。如年齡大小、血壓高低等。組。如年齡大小、血壓高低等。3 3、按分組要求設計整理表,匯總資料。、按分組要求設計整理表,匯總資料。 數(shù)據(jù)的預處理:數(shù)據(jù)的預處理: 把原始數(shù)據(jù)轉化為能被統(tǒng)計軟件識別
36、的把原始數(shù)據(jù)轉化為能被統(tǒng)計軟件識別的數(shù)據(jù)集。數(shù)據(jù)集。例:性別:男、女例:性別:男、女 sex: =1(男)(男) =2(女)(女)數(shù)據(jù)錄入工具:數(shù)據(jù)錄入工具:EpiData、Ecxel等等 四、分析資料四、分析資料(analysis of data) 計算有關統(tǒng)計指標,反映數(shù)據(jù)的綜合特計算有關統(tǒng)計指標,反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計分析分為:統(tǒng)計分析分為: (1)統(tǒng)計描述)統(tǒng)計描述 (2)統(tǒng)計推斷)統(tǒng)計推斷統(tǒng)計學發(fā)展簡史統(tǒng)計學發(fā)展簡史統(tǒng)計學的發(fā)展史可分為三個時期:統(tǒng)計學的發(fā)展史可分為三個時期:n17世紀世紀70年代年代18世紀末:古典統(tǒng)計學世紀
37、末:古典統(tǒng)計學n18世紀末世紀末19世紀末:近代統(tǒng)計學世紀末:近代統(tǒng)計學n20世紀初世紀初現(xiàn)在:現(xiàn)代統(tǒng)計學現(xiàn)在:現(xiàn)代統(tǒng)計學Statisticians are very careful!As a biologist, a physicist, and a statistician are riding on a train through Wisconsin, they pass a herd of cows, one of which is completely white. “Oh look, there are white cows in Wisconsin,” says the biol
38、ogist. “You mean,” says the physicist with an air of superiority, “there is at least one white cow in Wisconsin.” “No,” says the statistician, “there is at least one cow in Wisconsin thats white on at least one side!”現(xiàn)代統(tǒng)計學的開端現(xiàn)代統(tǒng)計學的開端nFrancis Galton(1822-1911),維多利亞維多利亞女王時代最博學的人,女王時代最博學的人,創(chuàng)用和發(fā)展了創(chuàng)用和發(fā)展了
39、“相關相關”與與“回歸回歸”。n平生著書平生著書15種,撰寫各種學術論文種,撰寫各種學術論文220篇,涉獵范圍包括地理、天文、氣象、篇,涉獵范圍包括地理、天文、氣象、物理、機械、人類學、社會學、統(tǒng)計學、物理、機械、人類學、社會學、統(tǒng)計學、教育學、醫(yī)學、生理學、心理學、遺傳教育學、醫(yī)學、生理學、心理學、遺傳學、優(yōu)生學、指紋學、音樂、美術等,學、優(yōu)生學、指紋學、音樂、美術等,是一位百科全書式的學者。是一位百科全書式的學者。生物統(tǒng)計學生物統(tǒng)計學派創(chuàng)始人派創(chuàng)始人nKarl Pearson是是Galton的學生的學生n開創(chuàng)了統(tǒng)計方法學,把這門開創(chuàng)了統(tǒng)計方法學,把這門學科由描述性統(tǒng)計改變?yōu)橥茖W科由描述性統(tǒng)
40、計改變?yōu)橥茢嘈越y(tǒng)計。斷性統(tǒng)計。n創(chuàng)造創(chuàng)造“標準差標準差”術語,術語,提出提出 2檢驗、檢驗、線性相關與回歸。線性相關與回歸。n1911年,在倫敦大學創(chuàng)立了年,在倫敦大學創(chuàng)立了世界首個綜合大學統(tǒng)計系。世界首個綜合大學統(tǒng)計系?,F(xiàn)代統(tǒng)計學的開端現(xiàn)代統(tǒng)計學的開端現(xiàn)代統(tǒng)計學之父現(xiàn)代統(tǒng)計學之父Karl Pearson對相對論的貢獻對相對論的貢獻愛因斯坦愛因斯坦23歲時設立歲時設立 Olympia專業(yè)研究組,專業(yè)研究組,向成員推薦的第一本書向成員推薦的第一本書Pearson認為自然的法則認為自然的法則與觀察者的理解能力有關。與觀察者的理解能力有關。自然進程的不可逆純粹是自然進程的不可逆純粹是相對的概念。一個
41、能以光相對的概念。一個能以光速前進的觀察者將看到永速前進的觀察者將看到永恒的現(xiàn)在。他推測如果研恒的現(xiàn)在。他推測如果研究者的速度超過了光速將究者的速度超過了光速將會看到時光倒流,就像電會看到時光倒流,就像電影回放一樣。該書介紹的影回放一樣。該書介紹的某些主題后來成為愛因斯某些主題后來成為愛因斯坦理論的部分內(nèi)容。坦理論的部分內(nèi)容。Biometrika shall serve as a means not only of collecting or publishing under one title biological data of a kind not systematically collected or published elsewhere in any other periodical, but also of spreading a knowledge of such statistical theory as may be requisite for their scientific treatment. 19061936 Karl Pears
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版部編歷史七年級上冊《第19課 北魏政治和北方民族大交融》聽課評課記錄
- 湘教版數(shù)學八年級上冊1.5《分式方程的應用》聽評課記錄2
- 八年級數(shù)學下冊23.3事件的概率1聽評課記錄滬教版五四制
- 人教版地理八年級下冊6.3《世界上最大的黃土堆積區(qū)-黃土高原》聽課評課記錄1
- 蘇科版數(shù)學八年級上冊聽評課記錄《5-1物體位置的確定》
- 用功合同范本(2篇)
- 環(huán)境友好原材料采購合同(2篇)
- 人教版五年級下冊數(shù)學《第2單元因數(shù)與倍數(shù) 第1課時 因數(shù)和倍數(shù)(1)》聽評課記錄
- 聽評課記錄2年級
- 統(tǒng)編教材部編人教版道德與法治九年級下冊《3.2 與世界深度互動》聽課評課記錄
- 二零二五年度大型自動化設備買賣合同模板2篇
- 2024版金礦居間合同協(xié)議書
- 江西省部分學校2024-2025學年高三上學期1月期末英語試題(含解析無聽力音頻有聽力原文)
- GA/T 2145-2024法庭科學涉火案件物證檢驗實驗室建設技術規(guī)范
- 2025內(nèi)蒙古匯能煤化工限公司招聘300人高頻重點提升(共500題)附帶答案詳解
- 2025年中國融通資產(chǎn)管理集團限公司春季招聘(511人)高頻重點提升(共500題)附帶答案詳解
- 寵物護理行業(yè)客戶回訪制度構建
- 電廠檢修管理
- 《SPIN銷售法課件》課件
- 機動車屬性鑒定申請書
- 2024年中考語文試題分類匯編:非連續(xù)性文本閱讀(學生版)
評論
0/150
提交評論