![研究生統(tǒng)計學(xué)講義第1講第一章緒論_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/d259ff93-1e08-4df6-9e0e-af23b4c1b27c/d259ff93-1e08-4df6-9e0e-af23b4c1b27c1.gif)
![研究生統(tǒng)計學(xué)講義第1講第一章緒論_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/d259ff93-1e08-4df6-9e0e-af23b4c1b27c/d259ff93-1e08-4df6-9e0e-af23b4c1b27c2.gif)
![研究生統(tǒng)計學(xué)講義第1講第一章緒論_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/d259ff93-1e08-4df6-9e0e-af23b4c1b27c/d259ff93-1e08-4df6-9e0e-af23b4c1b27c3.gif)
![研究生統(tǒng)計學(xué)講義第1講第一章緒論_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/d259ff93-1e08-4df6-9e0e-af23b4c1b27c/d259ff93-1e08-4df6-9e0e-af23b4c1b27c4.gif)
![研究生統(tǒng)計學(xué)講義第1講第一章緒論_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/13/d259ff93-1e08-4df6-9e0e-af23b4c1b27c/d259ff93-1e08-4df6-9e0e-af23b4c1b27c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、 中醫(yī)臨床醫(yī)學(xué)是一門經(jīng)驗科學(xué)。長期以來,臨床研中醫(yī)臨床醫(yī)學(xué)是一門經(jīng)驗科學(xué)。長期以來,臨床研究方法主要停留在傳統(tǒng)經(jīng)典文獻的體會和詮釋、臨床究方法主要停留在傳統(tǒng)經(jīng)典文獻的體會和詮釋、臨床觀察和醫(yī)案報告、師徒口傳心授以及個人經(jīng)驗積累。觀察和醫(yī)案報告、師徒口傳心授以及個人經(jīng)驗積累。這些方法在過去和現(xiàn)在都對中醫(yī)臨床醫(yī)學(xué)的發(fā)展發(fā)揮這些方法在過去和現(xiàn)在都對中醫(yī)臨床醫(yī)學(xué)的發(fā)展發(fā)揮了積極作用,而且至今占據(jù)主導(dǎo)地位,成為研究方法了積極作用,而且至今占據(jù)主導(dǎo)地位,成為研究方法的主要方面,但是上述研究畢竟有它的局限性和盲目的主要方面,但是上述研究畢竟有它的局限性和盲目性,由此得出許多結(jié)論帶有片面性,有些甚至是錯誤性,
2、由此得出許多結(jié)論帶有片面性,有些甚至是錯誤和荒謬的。和荒謬的。( (參考:胡鏡清,賴世隆,中醫(yī)臨床研究參考:胡鏡清,賴世隆,中醫(yī)臨床研究方法指南方法指南概論。國家中醫(yī)藥管理局科技教育司。概論。國家中醫(yī)藥管理局科技教育司。 如何吸取和應(yīng)用現(xiàn)代科技如何吸取和應(yīng)用現(xiàn)代科技( (包括西醫(yī)理論包括西醫(yī)理論) )、方法、方法、手段來促進中醫(yī)學(xué)的發(fā)展,這是富有意義的,需要方手段來促進中醫(yī)學(xué)的發(fā)展,這是富有意義的,需要方法學(xué)的突破和思路創(chuàng)新。將統(tǒng)計學(xué)、臨床流行病學(xué)法學(xué)的突破和思路創(chuàng)新。將統(tǒng)計學(xué)、臨床流行病學(xué)(dme) 和循證醫(yī)學(xué)和循證醫(yī)學(xué)(ebm)原理方法向中醫(yī)學(xué)滲透。原理方法向中醫(yī)學(xué)滲透。1. 制定中醫(yī)證候
3、宏觀辯證量表:制定中醫(yī)證候宏觀辯證量表:統(tǒng)一辯證標(biāo)準(zhǔn);統(tǒng)一辯證標(biāo)準(zhǔn);表面效度評價表面效度評價:kappa值方法。值方法??煽啃耘c反應(yīng)度可靠性與反應(yīng)度評價。評價。2.病證結(jié)合的觀察性描述研究病證結(jié)合的觀察性描述研究:橫斷面調(diào)查。橫斷面調(diào)查。3.證候與微觀指標(biāo)之間的相關(guān)與回歸分析。證候與微觀指標(biāo)之間的相關(guān)與回歸分析。4.為中醫(yī)證候篩選微觀指標(biāo)的多元線性逐步回歸分析為中醫(yī)證候篩選微觀指標(biāo)的多元線性逐步回歸分析5.同病多種證候與多項微觀指標(biāo)之間的典則相關(guān)分析同病多種證候與多項微觀指標(biāo)之間的典則相關(guān)分析6.某病多證候與多項基因指標(biāo)之間的對應(yīng)分析某病多證候與多項基因指標(biāo)之間的對應(yīng)分析:證候證候基因本質(zhì)的研
4、究?;虮举|(zhì)的研究。7.中醫(yī)體質(zhì)診斷研究方法。中醫(yī)體質(zhì)診斷研究方法。8.中醫(yī)體質(zhì)與分類指標(biāo)之間的數(shù)量依存關(guān)系中醫(yī)體質(zhì)與分類指標(biāo)之間的數(shù)量依存關(guān)系:logistic 回歸分析。回歸分析。9.體質(zhì)或證候的指數(shù)計量診斷。體質(zhì)或證候的指數(shù)計量診斷。10.體質(zhì)或證候的判別分析。體質(zhì)或證候的判別分析。11.建立體質(zhì)或證候的指標(biāo)聚類分析。建立體質(zhì)或證候的指標(biāo)聚類分析。12.建立體質(zhì)或證候分類標(biāo)準(zhǔn)的因子分析。建立體質(zhì)或證候分類標(biāo)準(zhǔn)的因子分析。13.診斷研究及其循證醫(yī)學(xué)評價。診斷研究及其循證醫(yī)學(xué)評價。14.疾病或證候預(yù)后研究疾病或證候預(yù)后研究:生存或死亡的生存或死亡的cox比例風(fēng)比例風(fēng)險回歸模型分析。險回歸模型
5、分析。15.中醫(yī)文獻的循證醫(yī)學(xué)薈萃分析中醫(yī)文獻的循證醫(yī)學(xué)薈萃分析(meta分析分析)第第1章章 緒論緒論一、統(tǒng)計學(xué)的意義與內(nèi)容一、統(tǒng)計學(xué)的意義與內(nèi)容意義意義 1.利用概率論與數(shù)理統(tǒng)計進行統(tǒng)計設(shè)計,搜集和整理利用概率論與數(shù)理統(tǒng)計進行統(tǒng)計設(shè)計,搜集和整理資料,對分析結(jié)果進行恰當(dāng)?shù)慕忉專鞒隹茖W(xué)結(jié)論。資料,對分析結(jié)果進行恰當(dāng)?shù)慕忉?,作出科學(xué)結(jié)論。 2.保證分組具有可比性保證分組具有可比性,保證有合適的樣本容量保證有合適的樣本容量. 3.控制實驗誤差控制實驗誤差,是否在科學(xué)上具有可重復(fù)性是否在科學(xué)上具有可重復(fù)性. 4.在撰寫論文或報告時在撰寫論文或報告時,將大量原始數(shù)據(jù)歸納整理為將大量原始數(shù)據(jù)歸納整理
6、為正確的統(tǒng)計指標(biāo)正確的統(tǒng)計指標(biāo),按照規(guī)范列出統(tǒng)計表按照規(guī)范列出統(tǒng)計表(圖圖). 5.能夠讀懂國內(nèi)外醫(yī)學(xué)文獻中的統(tǒng)計資料能夠讀懂國內(nèi)外醫(yī)學(xué)文獻中的統(tǒng)計資料,判斷其判斷其可靠程度和局限性可靠程度和局限性,吸收和借鑒吸收和借鑒. 主要包括主要包括:統(tǒng)計學(xué)基本理論和統(tǒng)計方法統(tǒng)計學(xué)基本理論和統(tǒng)計方法:即設(shè)計、描即設(shè)計、描述、推斷述、推斷.內(nèi)容內(nèi)容二、統(tǒng)計學(xué)常用概念二、統(tǒng)計學(xué)常用概念1隨機變量隨機變量 隨機現(xiàn)象隨機現(xiàn)象(random phenomenon)的特點是在相同條的特點是在相同條件下進行實驗或觀察時,具有二個或二個以上可能的件下進行實驗或觀察時,具有二個或二個以上可能的結(jié)果,對一次實驗或觀察來說,
7、究竟會發(fā)生哪一個結(jié)結(jié)果,對一次實驗或觀察來說,究竟會發(fā)生哪一個結(jié)果,事先是不能確定的,但在大量重復(fù)試驗中可呈現(xiàn)果,事先是不能確定的,但在大量重復(fù)試驗中可呈現(xiàn)某種規(guī)律性。某種規(guī)律性。 對隨機現(xiàn)象研究所做的試驗或觀察稱隨機試驗對隨機現(xiàn)象研究所做的試驗或觀察稱隨機試驗(random trial),試驗中每一個可能的結(jié)果稱為基本事試驗中每一個可能的結(jié)果稱為基本事件。基本事件組合而成的事件稱為復(fù)合事件。無論是件。基本事件組合而成的事件稱為復(fù)合事件。無論是基本事件還是復(fù)合事件都叫做隨機事件,簡稱事件,基本事件還是復(fù)合事件都叫做隨機事件,簡稱事件,常用大寫字母常用大寫字母a a、b b等表示。事件間的相互關(guān)
8、系類似于等表示。事件間的相互關(guān)系類似于中學(xué)數(shù)學(xué)介紹的集合間的相互關(guān)系中學(xué)數(shù)學(xué)介紹的集合間的相互關(guān)系。 觀察單位(稱為個體)的研究特征(或指標(biāo))稱為變觀察單位(稱為個體)的研究特征(或指標(biāo))稱為變量量(variable)。變量的觀察結(jié)果即觀察值。變量的觀察結(jié)果即觀察值(observed value),稱為變量值,稱為變量值(value of variable)。變量值是變量。變量值是變量的具體表現(xiàn)。隨機變量的具體表現(xiàn)。隨機變量(random variable)是專指具有是專指具有一個分布或一個概率或概率分布的變量,特性:一個分布或一個概率或概率分布的變量,特性:(1) 在一次試驗中,取值具有不確
9、定性。隨機事件在一次在一次試驗中,取值具有不確定性。隨機事件在一次試驗中可能發(fā)生,也可能不發(fā)生,所以隨機變量的取試驗中可能發(fā)生,也可能不發(fā)生,所以隨機變量的取值是隨機的,取決于隨機試驗結(jié)果。值是隨機的,取決于隨機試驗結(jié)果。(2) 在大量重復(fù)在大量重復(fù)試驗中,隨機變量的各種可能取值發(fā)生的可能性大小試驗中,隨機變量的各種可能取值發(fā)生的可能性大小具有一定的統(tǒng)計規(guī)律,也就是說,具有一定的具有一定的統(tǒng)計規(guī)律,也就是說,具有一定的“概率概率”意義??梢?,隨機變量既具有變量的意義,又具有意義??梢姡S機變量既具有變量的意義,又具有概率意義,這種雙重意義正是隨機變量與普通變量的概率意義,這種雙重意義正是隨機變
10、量與普通變量的區(qū)別。在不致混淆的情況下,通常將隨機變量簡稱變區(qū)別。在不致混淆的情況下,通常將隨機變量簡稱變量。量。 2總體、個體與樣本總體、個體與樣本 研究對象的全體稱為總體研究對象的全體稱為總體(population)。構(gòu)成總體的每個成員稱為個體,亦稱。構(gòu)成總體的每個成員稱為個體,亦稱樣品或觀察單位??傮w是根據(jù)研究目的所確定的性樣品或觀察單位??傮w是根據(jù)研究目的所確定的性質(zhì)相同的所有個體的研究指標(biāo)值的集合。質(zhì)相同的所有個體的研究指標(biāo)值的集合。 個體(個體(individual)即觀察單位()即觀察單位(study unit)??偅???傮w的性質(zhì)特征由其各個個體的性質(zhì)而定,要研究總體的性質(zhì)特征由
11、其各個個體的性質(zhì)而定,要研究總體的性質(zhì)或特征,須對它的個體進行觀測。體的性質(zhì)或特征,須對它的個體進行觀測。 從 總 體 中 隨 機 抽 取 部 分 個 體 的 過 程 稱 為 抽 樣從 總 體 中 隨 機 抽 取 部 分 個 體 的 過 程 稱 為 抽 樣(sampling),從總體中隨機抽取的代表總體的部分個,從總體中隨機抽取的代表總體的部分個體的觀察值集合稱為樣本體的觀察值集合稱為樣本(sample)。樣本中所包含的。樣本中所包含的個體數(shù)目,即樣本例數(shù),稱為樣本含量個體數(shù)目,即樣本例數(shù),稱為樣本含量(sample size)。總體中有很多個體,究竟哪些個體在抽樣中被抽。總體中有很多個體,究
12、竟哪些個體在抽樣中被抽到,要依機會而定。因此,樣本是隨機變量;到,要依機會而定。因此,樣本是隨機變量; 抽樣的目的是用樣本信息推斷總體特征,所以樣本抽樣的目的是用樣本信息推斷總體特征,所以樣本要有足夠的含量及代表性。要有足夠的含量及代表性。 樣本要具有:樣本要具有:隨機性:即要使總體中的每一個體隨機性:即要使總體中的每一個體都有同等的機會被抽到和分配,不受研究者的主觀意都有同等的機會被抽到和分配,不受研究者的主觀意愿或客觀偏性影響,樣本可能取值與總體是完全一樣愿或客觀偏性影響,樣本可能取值與總體是完全一樣的,并且取各個值的概率也是完全一樣的,這就是說的,并且取各個值的概率也是完全一樣的,這就是
13、說,樣本與總體是同分布的隨機變量。,樣本與總體是同分布的隨機變量。獨立性:即各獨立性:即各個樣品的取得互不影響,即任何一次抽樣都未改變總個樣品的取得互不影響,即任何一次抽樣都未改變總體成份,因而下一次抽樣是在同樣條件下進行的。例體成份,因而下一次抽樣是在同樣條件下進行的。例如,有放回的抽樣就能保證這一點;無放回的抽樣在如,有放回的抽樣就能保證這一點;無放回的抽樣在總體很大時,也近似滿足這一點??傮w很大時,也近似滿足這一點。 數(shù)理統(tǒng)計方法就是應(yīng)用概率論的結(jié)果,通過樣數(shù)理統(tǒng)計方法就是應(yīng)用概率論的結(jié)果,通過樣本來了解和判斷總體的統(tǒng)計特征的科學(xué)方法。本來了解和判斷總體的統(tǒng)計特征的科學(xué)方法。 3概率與頻
14、率概率與頻率 概率概率(probability)和頻率和頻率(frequency)都是反映某一隨機事件發(fā)生可能性大小的度量。都是反映某一隨機事件發(fā)生可能性大小的度量。 若隨機事件若隨機事件a在在n次獨立重復(fù)試驗中發(fā)生了次獨立重復(fù)試驗中發(fā)生了m次,則稱次,則稱m為頻數(shù)為頻數(shù)(counts)。稱比值。稱比值m/ n為事件為事件a在在n次試驗中出次試驗中出現(xiàn)的頻率或相對頻數(shù)現(xiàn)的頻率或相對頻數(shù)(relative frequency) ,0m/ n1,即事件即事件a發(fā)生的頻率為發(fā)生的頻率為m/ n。 試試 驗驗 者者擲幣數(shù)擲幣數(shù)n正面數(shù)正面數(shù)m正頻率正頻率fn de morgan204810610.51
15、81buffon404020480.5069pearson1200060190.5016pearson24000120120.5005 統(tǒng)計上常用符號統(tǒng)計上常用符號 p 表示概率,概率的統(tǒng)計定義是:表示概率,概率的統(tǒng)計定義是:如果事件如果事件 a 在大量重復(fù)試驗中出現(xiàn)的頻率穩(wěn)定在某在大量重復(fù)試驗中出現(xiàn)的頻率穩(wěn)定在某一常數(shù)一常數(shù)p,則稱事件,則稱事件 a 的概率為的概率為p,記作,記作p(a)=p, 概率的統(tǒng)計定義實際上給出了一個近似計算隨機事概率的統(tǒng)計定義實際上給出了一個近似計算隨機事件的概率的方法,即當(dāng)試驗次數(shù)件的概率的方法,即當(dāng)試驗次數(shù) n 夠大時,可用頻率夠大時,可用頻率作為概率的近似值
16、。作為概率的近似值。 注意注意: 頻率具有偶然性;而概率刻劃的則是總體中隨頻率具有偶然性;而概率刻劃的則是總體中隨機事件機事件(隨機變量隨機變量)出現(xiàn)的可能性大小,一個隨機變量出現(xiàn)的可能性大小,一個隨機變量的概率是一個常數(shù),具有必然性,是一種客觀存在。的概率是一個常數(shù),具有必然性,是一種客觀存在。 0p(a)1。必然事件概率為。必然事件概率為1,不可能事件的概率,不可能事件的概率為為0,概率越接近,概率越接近1,表明其事件發(fā)生的可能性越大,表明其事件發(fā)生的可能性越大,概率越接近概率越接近0,其事件發(fā)生的可能性越小,其事件發(fā)生的可能性越小,p0.05表表示事件發(fā)生的可能性小于示事件發(fā)生的可能性小
17、于0.05,p0.01表示事件發(fā)生表示事件發(fā)生的可能性小于的可能性小于0.01 5概率分布概率分布 對一個隨機變量,不但要了解它可能取對一個隨機變量,不但要了解它可能取得的數(shù)值,還要了解它以多大的概率取得這些數(shù)值,得的數(shù)值,還要了解它以多大的概率取得這些數(shù)值,只有這樣,才算是掌握了這個隨機變量所刻劃的隨機只有這樣,才算是掌握了這個隨機變量所刻劃的隨機現(xiàn)象。事實上,隨機變量的取值有一定的概率意義,現(xiàn)象。事實上,隨機變量的取值有一定的概率意義,所以必須用隨機變量的取值及其相應(yīng)的概率才能完整所以必須用隨機變量的取值及其相應(yīng)的概率才能完整地刻劃隨機現(xiàn)象的規(guī)律。一個隨機變量各可能的取值地刻劃隨機現(xiàn)象的規(guī)
18、律。一個隨機變量各可能的取值與其對應(yīng)的概率共同構(gòu)造出它的概率分布與其對應(yīng)的概率共同構(gòu)造出它的概率分布(probability distribution),簡稱分布。,簡稱分布。 樣本的概率分布稱為抽樣分布,統(tǒng)計上描述一個樣樣本的概率分布稱為抽樣分布,統(tǒng)計上描述一個樣本的性質(zhì),就等價于給出它的概率分布。由樣本的分本的性質(zhì),就等價于給出它的概率分布。由樣本的分布可以推斷出總體的分布,這是隨機抽樣的特征,可布可以推斷出總體的分布,這是隨機抽樣的特征,可以把它取作以把它取作“隨機抽樣隨機抽樣”的定義。從總體中隨機抽取的定義。從總體中隨機抽取一定個體數(shù)目的樣本進行研究,通過樣本指標(biāo)推斷總一定個體數(shù)目的樣
19、本進行研究,通過樣本指標(biāo)推斷總體指標(biāo)的方法,稱為抽樣研究方法。體指標(biāo)的方法,稱為抽樣研究方法。樣本的樣本的“質(zhì)質(zhì)”通過適當(dāng)?shù)某闃臃椒▉肀WC,必須使樣通過適當(dāng)?shù)某闃臃椒▉肀WC,必須使樣本中的每一個體確屬同質(zhì)總體,必須遵循隨機化本中的每一個體確屬同質(zhì)總體,必須遵循隨機化抽樣抽樣和分配的原則,使樣本足以代表總體,能充分反映總和分配的原則,使樣本足以代表總體,能充分反映總體的實際情況,保證樣本的可靠性體的實際情況,保證樣本的可靠性6參數(shù)與統(tǒng)計量參數(shù)與統(tǒng)計量 出現(xiàn)在總體分布中的統(tǒng)計指標(biāo)稱為出現(xiàn)在總體分布中的統(tǒng)計指標(biāo)稱為參數(shù)參數(shù)(parameter),參數(shù)一般用小寫的希臘字母表示,參數(shù)一般用小寫的希臘字母
20、表示,如用如用表示總體均數(shù),用表示總體均數(shù),用表示總體標(biāo)準(zhǔn)差。表示總體標(biāo)準(zhǔn)差。 通過對樣本數(shù)據(jù)進行統(tǒng)計分析所產(chǎn)生的統(tǒng)計指標(biāo)通過對樣本數(shù)據(jù)進行統(tǒng)計分析所產(chǎn)生的統(tǒng)計指標(biāo)稱為統(tǒng)計量稱為統(tǒng)計量(statistical variable)。統(tǒng)計量也是隨機變量,統(tǒng)計量的分布稱為抽樣分布。統(tǒng)計量也是隨機變量,統(tǒng)計量的分布稱為抽樣分布。常用的有常用的有 2分布、分布、t分布、分布、f分布。在統(tǒng)計推斷中,抽分布。在統(tǒng)計推斷中,抽樣分布充分發(fā)揮作用。統(tǒng)計學(xué)研究的基本方法是通過樣分布充分發(fā)揮作用。統(tǒng)計學(xué)研究的基本方法是通過樣本構(gòu)造統(tǒng)計量,再通過抽樣分布的研究,對樣本所樣本構(gòu)造統(tǒng)計量,再通過抽樣分布的研究,對樣本所來
21、自的總體進行分析和推斷。來自的總體進行分析和推斷。7統(tǒng)計描述與統(tǒng)計推斷統(tǒng)計描述與統(tǒng)計推斷 統(tǒng)計描述是對原始資料的一種概括,即把分散而不統(tǒng)計描述是對原始資料的一種概括,即把分散而不好理解的原始數(shù)據(jù),通過統(tǒng)計指標(biāo)、統(tǒng)計圖、統(tǒng)計表好理解的原始數(shù)據(jù),通過統(tǒng)計指標(biāo)、統(tǒng)計圖、統(tǒng)計表等方法,來描述資料的特征及其分布規(guī)律。統(tǒng)計描述等方法,來描述資料的特征及其分布規(guī)律。統(tǒng)計描述不考慮抽樣誤差問題。不考慮抽樣誤差問題。 統(tǒng)計推斷通過樣本所提供的信息來推斷總體特征統(tǒng)計推斷通過樣本所提供的信息來推斷總體特征,并標(biāo)明可能發(fā)生的誤差。統(tǒng)計推斷包括置信區(qū)間,并標(biāo)明可能發(fā)生的誤差。統(tǒng)計推斷包括置信區(qū)間(confidence
22、interval)與假設(shè)檢驗與假設(shè)檢驗(hypothesis testing )。是對整理出的統(tǒng)計量作進一步的分析,統(tǒng)計推斷。是對整理出的統(tǒng)計量作進一步的分析,統(tǒng)計推斷的結(jié)果為研究者下專業(yè)結(jié)論時提供科學(xué)的依據(jù),所的結(jié)果為研究者下專業(yè)結(jié)論時提供科學(xué)的依據(jù),所下的推斷結(jié)論將影響后來的決策。例如,某新藥下的推斷結(jié)論將影響后來的決策。例如,某新藥a與某常規(guī)藥與某常規(guī)藥b對某病療效的差異有統(tǒng)計意義,對某病療效的差異有統(tǒng)計意義,a藥效藥效應(yīng)較好,這種推斷結(jié)論所導(dǎo)致的決策就是把應(yīng)較好,這種推斷結(jié)論所導(dǎo)致的決策就是把a藥引藥引入市場,推廣應(yīng)用于臨床。入市場,推廣應(yīng)用于臨床。 三、統(tǒng)計中資料類型與測量尺度三、統(tǒng)
23、計中資料類型與測量尺度 亦稱等級資料亦稱等級資料有序分類資料有序分類資料亦稱計數(shù)資料亦稱計數(shù)資料無序分類資料無序分類資料亦稱定性資料亦稱定性資料分類資料分類資料料料亦稱數(shù)值資料或計量資亦稱數(shù)值資料或計量資定量資料定量資料1定量資料定量資料 定量資料定量資料(measurement variable)又稱又稱數(shù)值資料數(shù)值資料(numerical variable)或計量資料?;蛴嬃抠Y料。一般為一般為連續(xù)型隨機變量。連續(xù)型隨機變量。 2分類資料分類資料 分類資料分類資料(categorical variable)亦稱定性亦稱定性資料資料(qualitative variable)。它由分類因素構(gòu)成
24、,系對。它由分類因素構(gòu)成,系對定性因素的觀察結(jié)果,將研究因素按類別或檔次分組定性因素的觀察結(jié)果,將研究因素按類別或檔次分組,清點各組個體的個數(shù)所得的資料。,清點各組個體的個數(shù)所得的資料。一般為離散型隨一般為離散型隨機變量,有有序分類和無序分類兩種情況:機變量,有有序分類和無序分類兩種情況: (1) 無序分類資料無序分類資料(unordered categorical variable):無序分類資料又稱計數(shù)資料無序分類資料又稱計數(shù)資料(enumeration data)。是。是將觀察單位按互斥的屬性或類型分組計數(shù)。根據(jù)屬將觀察單位按互斥的屬性或類型分組計數(shù)。根據(jù)屬性或類型分組的多少又可分為兩種
25、:性或類型分組的多少又可分為兩種: 兩分類資料:它是將觀察單位按兩種對立的屬性兩分類資料:它是將觀察單位按兩種對立的屬性分類,如按死亡和生存、治愈和未愈、有效和無效等分類,如按死亡和生存、治愈和未愈、有效和無效等兩種分類計數(shù)。兩種分類計數(shù)。 多分類資料:它是將觀察單位按多種互斥的屬性多分類資料:它是將觀察單位按多種互斥的屬性分類,清點各類觀察單位的個數(shù),如血型按分類,清點各類觀察單位的個數(shù),如血型按a、b、ab、o四種分類計數(shù)。四種分類計數(shù)。 (2) 有序分類資料有序分類資料(ordered categorical variable):亦稱:亦稱等級資料等級資料(ranked data)。是將
26、觀察單位按某種屬性的。是將觀察單位按某種屬性的不同程度、檔次或等級順序分類或分組后,清點各順不同程度、檔次或等級順序分類或分組后,清點各順序分組的觀察單位數(shù)。序分組的觀察單位數(shù)。必須指出:根據(jù)分析研究需要,定量資料、無序分類資必須指出:根據(jù)分析研究需要,定量資料、無序分類資料和有序分類資料可以互相轉(zhuǎn)化,在多資料分析中,定料和有序分類資料可以互相轉(zhuǎn)化,在多資料分析中,定性指標(biāo)數(shù)量化時,例如將性別男、女取為性指標(biāo)數(shù)量化時,例如將性別男、女取為0與與1;又如制;又如制定中醫(yī)證候宏觀辯證量表,制定方法是四診項目組合法定中醫(yī)證候宏觀辯證量表,制定方法是四診項目組合法+臨床流行病學(xué)調(diào)查證候加權(quán)積分法:臨床
27、流行病學(xué)調(diào)查證候加權(quán)積分法:0分分-無某項癥狀;無某項癥狀;2分分-輕癥狀;輕癥狀;4分分-中癥狀;中癥狀;6分分-重癥狀。重癥狀。四、統(tǒng)計工作的基本步驟四、統(tǒng)計工作的基本步驟 分為設(shè)計分為設(shè)計搜集搜集整理整理分析資料和運用資料五個分析資料和運用資料五個基本步驟:基本步驟: 1設(shè)計設(shè)計 設(shè)計就是制定完成科研目標(biāo)的技術(shù)路線和實設(shè)計就是制定完成科研目標(biāo)的技術(shù)路線和實施方案,是對包括研究目的,觀察指標(biāo),資料搜集,施方案,是對包括研究目的,觀察指標(biāo),資料搜集,整理,分析和運用全過程總的安排,是先導(dǎo),依據(jù)。整理,分析和運用全過程總的安排,是先導(dǎo),依據(jù)。是研究保證。設(shè)計有專業(yè)設(shè)計與統(tǒng)計學(xué)設(shè)計之分,統(tǒng)是研究
28、保證。設(shè)計有專業(yè)設(shè)計與統(tǒng)計學(xué)設(shè)計之分,統(tǒng)計設(shè)計包括調(diào)查設(shè)計和實驗設(shè)計。計設(shè)計包括調(diào)查設(shè)計和實驗設(shè)計。 表表1-2 1-2 專業(yè)設(shè)計與統(tǒng)計設(shè)計對比專業(yè)設(shè)計與統(tǒng)計設(shè)計對比 專專 業(yè)業(yè) 設(shè)設(shè) 計計統(tǒng)統(tǒng) 計計 學(xué)學(xué) 設(shè)設(shè) 計計依依據(jù)據(jù)運用現(xiàn)代科學(xué)技術(shù)與醫(yī)藥專業(yè)知運用現(xiàn)代科學(xué)技術(shù)與醫(yī)藥專業(yè)知識進行設(shè)計識進行設(shè)計運用數(shù)理統(tǒng)計的原理和方法進行設(shè)運用數(shù)理統(tǒng)計的原理和方法進行設(shè)計計目目的的主要解決調(diào)查或?qū)嶒炗^察結(jié)果的主要解決調(diào)查或?qū)嶒炗^察結(jié)果的創(chuàng)新性、先進性和應(yīng)用性創(chuàng)新性、先進性和應(yīng)用性主要解決抽樣誤差的問題,保證樣主要解決抽樣誤差的問題,保證樣本的代表性和組間的可比性,實現(xiàn)本的代表性和組間的可比性,實現(xiàn)調(diào)查或
29、實驗觀察結(jié)果的可靠性、科調(diào)查或?qū)嶒炗^察結(jié)果的可靠性、科學(xué)性、可重復(fù)性和經(jīng)濟性學(xué)性、可重復(fù)性和經(jīng)濟性意意義義決定學(xué)術(shù)水平的高低及科研成果決定學(xué)術(shù)水平的高低及科研成果的大小的大小有效地控制誤差和提高檢驗效率有效地控制誤差和提高檢驗效率內(nèi)內(nèi)容容選擇研究題目選擇研究題目明確觀察指標(biāo)及研究方法明確觀察指標(biāo)及研究方法確定診斷標(biāo)準(zhǔn)及觀察對象確定診斷標(biāo)準(zhǔn)及觀察對象 對照形式對照形式選擇調(diào)查或?qū)嶒灥脑O(shè)計方案選擇調(diào)查或?qū)嶒灥脑O(shè)計方案隨機抽樣和均衡分配隨機抽樣和均衡分配樣本含量及抽樣誤差大小的估計樣本含量及抽樣誤差大小的估計盲法盲法2 2搜集資料搜集資料 搜集資料一項艱巨任務(wù),是分析前提搜集資料一項艱巨任務(wù),是分析
30、前提與基礎(chǔ),是科研實踐中極其重要的一個組成部分。要與基礎(chǔ),是科研實踐中極其重要的一個組成部分。要求及時、準(zhǔn)確、完整、清楚、統(tǒng)一,防止誤差及偏倚求及時、準(zhǔn)確、完整、清楚、統(tǒng)一,防止誤差及偏倚影響觀察結(jié)果的精確性。因為統(tǒng)計學(xué)各種數(shù)據(jù)處理公影響觀察結(jié)果的精確性。因為統(tǒng)計學(xué)各種數(shù)據(jù)處理公式都是科學(xué)地建立在原始數(shù)據(jù)基礎(chǔ)上的,準(zhǔn)確的原始式都是科學(xué)地建立在原始數(shù)據(jù)基礎(chǔ)上的,準(zhǔn)確的原始資料是統(tǒng)計處理的關(guān)鍵。其中任何一項若有欠缺都會資料是統(tǒng)計處理的關(guān)鍵。其中任何一項若有欠缺都會給資料的整理和分析帶來困難,并影響到結(jié)果的準(zhǔn)確給資料的整理和分析帶來困難,并影響到結(jié)果的準(zhǔn)確性。一份不準(zhǔn)確、不科學(xué)的資料性。一份不準(zhǔn)確、
31、不科學(xué)的資料( (例如系統(tǒng)誤差很大例如系統(tǒng)誤差很大) ),統(tǒng)計處理不但不能解決問題,反而會給人一種錯覺,統(tǒng)計處理不但不能解決問題,反而會給人一種錯覺,得出某種錯誤結(jié)論。確保資料的科學(xué)性和可靠性,得出某種錯誤結(jié)論。確保資料的科學(xué)性和可靠性,必須嚴(yán)格按科研設(shè)計方案收集,例如隨機抽樣,要注必須嚴(yán)格按科研設(shè)計方案收集,例如隨機抽樣,要注意審查樣本是否從同質(zhì)總體中隨機抽取的,樣本含量意審查樣本是否從同質(zhì)總體中隨機抽取的,樣本含量是否適當(dāng),資料是否完整,數(shù)據(jù)是否準(zhǔn)確,是否是同是否適當(dāng),資料是否完整,數(shù)據(jù)是否準(zhǔn)確,是否是同時期的資料,診斷標(biāo)準(zhǔn)和療效判斷標(biāo)準(zhǔn)要有科學(xué)依據(jù)時期的資料,診斷標(biāo)準(zhǔn)和療效判斷標(biāo)準(zhǔn)要有科
32、學(xué)依據(jù)并要求統(tǒng)一,避免研究者的主觀偏見。并要求統(tǒng)一,避免研究者的主觀偏見。 通常運用觀察法、實驗法、調(diào)查法三類方法獲得資料。通常運用觀察法、實驗法、調(diào)查法三類方法獲得資料。 3整理資料整理資料 整理資料是在對資料作好檢查、核對后整理資料是在對資料作好檢查、核對后,將雜亂無章的資料條理化,以便于進行統(tǒng)計計算與,將雜亂無章的資料條理化,以便于進行統(tǒng)計計算與分析。包括:分析。包括: (1) (1) 對原始資料進行邏輯和計算審核。對原始資料進行邏輯和計算審核。(2) (2) 設(shè)計分組,包括質(zhì)量分組設(shè)計分組,包括質(zhì)量分組( (如病人按性別、職業(yè)如病人按性別、職業(yè)、病情輕重分組、病情輕重分組) )和數(shù)量分
33、組和數(shù)量分組( (如按年齡、體重、身高如按年齡、體重、身高分組分組) )兩種。分組的原則是合理,具有同質(zhì)性,先細兩種。分組的原則是合理,具有同質(zhì)性,先細后粗,先分后合。后粗,先分后合。(3) (3) 擬訂整理表。整理表是統(tǒng)計表的前身,是過渡性擬訂整理表。整理表是統(tǒng)計表的前身,是過渡性表格,作歸納匯總用。宜盡量把整理表設(shè)計成復(fù)合表表格,作歸納匯總用。宜盡量把整理表設(shè)計成復(fù)合表及相關(guān)表,以免漏掉兩指標(biāo)間存在的相關(guān)信息。及相關(guān)表,以免漏掉兩指標(biāo)間存在的相關(guān)信息。 (4) (4) 編制統(tǒng)計表。編制統(tǒng)計表。 4分析資料分析資料 就是按照統(tǒng)計原理,利用對比分析、歸就是按照統(tǒng)計原理,利用對比分析、歸納、邏輯推理、假說的驗證等統(tǒng)計學(xué)處理方法納、邏輯推理、假
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國鏈條式燃煤氣化鍋爐行業(yè)投資前景及策略咨詢研究報告
- 平頂山2024年河南平頂山市農(nóng)業(yè)科學(xué)院招聘7人筆試歷年參考題庫附帶答案詳解
- 2025年鹽漬裙帶葉項目可行性研究報告
- 2025年桑拿服項目可行性研究報告
- 2025至2031年中國異型軋輥行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國套裝風(fēng)炮行業(yè)投資前景及策略咨詢研究報告
- 廣西2025年廣西生態(tài)工程職業(yè)技術(shù)學(xué)院招聘筆試歷年參考題庫附帶答案詳解
- 2025年劍桿綜框項目可行性研究報告
- 2025年中央供氧系統(tǒng)項目可行性研究報告
- 2025至2030年高錳鐵項目投資價值分析報告
- 2022年4月自考00277行政管理學(xué)試題及答案含解析
- 消防設(shè)施安全檢查表
- 《網(wǎng)絡(luò)應(yīng)急響應(yīng)預(yù)案》課件
- 安全生產(chǎn)風(fēng)險評估培訓(xùn)課件
- 跟單員工作職責(zé)與流程
- 氣流組織模擬分析報告教程
- 教科版小學(xué)科學(xué)五年級【上冊】全冊教案
- 車間消防安全知識培訓(xùn)課件
- 勞動法概述勞動法與新經(jīng)濟業(yè)態(tài)的結(jié)合
- 孤殘兒童護理員兒童護理工作基礎(chǔ)知識課件
- 九年級短跑2 公開課教學(xué)設(shè)計
評論
0/150
提交評論