版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
衛(wèi)生統(tǒng)計(jì)學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)第一章緒論什么是統(tǒng)計(jì)學(xué)(statistics)?“Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata”(Webster'sInternationalDictionary)?!癟hescienceandartofdealingwithvariationindatathroughcollection,classification,andanalysisinsuchawayastoobtainreliableresults”(JohnM.Last,ADictionaryofEpidemiology)什么是統(tǒng)計(jì)學(xué)(statistics)??jī)?nèi)容:收集、分析、解釋和表達(dá)數(shù)據(jù)統(tǒng)計(jì)學(xué):處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)目的:求得可靠的結(jié)果統(tǒng)計(jì)學(xué)的現(xiàn)實(shí)地位:合作、審稿、基金申請(qǐng)(NIH)、藥物開(kāi)發(fā)與申報(bào)(FDA)、衛(wèi)生決策
統(tǒng)計(jì)學(xué)的若干概念1.總體與樣本總體(population):大同小異的對(duì)象全體。目標(biāo)總體(targetpopulation):試圖下結(jié)論的某個(gè)總體.例如,英國(guó)成年男子為目標(biāo)總體研究總體(studypopulation):資料來(lái)源的較小的總體.例如,1951年英國(guó)全部注冊(cè)醫(yī)生需要謹(jǐn)慎:就研究總體所下的結(jié)論未必適用于目標(biāo)總體。抽樣(sampling):從研究總體抽取部分個(gè)體樣本(sample):抽取的部分個(gè)體數(shù)據(jù)(data):觀察所得資料推斷(inference):分析樣本數(shù)據(jù),獲得關(guān)于總體的知識(shí)數(shù)據(jù)信息信息知識(shí)統(tǒng)計(jì)推斷的工具:有關(guān)概率的理論。
推斷的結(jié)論從來(lái)不是完全肯定或完全否定的。
關(guān)鍵與核心:抽樣方法、樣本的代表性和推斷的方法
2.同質(zhì)與變異同質(zhì)性(homogeneity)共性,大同小異
變異(variation)個(gè)體間差異,多樣性
沒(méi)有同質(zhì)性就構(gòu)不成一個(gè)總體;
總體內(nèi)沒(méi)有變異性就無(wú)需統(tǒng)計(jì)學(xué)。
統(tǒng)計(jì)學(xué)的任務(wù):
在變異的背景上
描述同一總體的同質(zhì)性,
揭示不同總體的異質(zhì)性(heterogeneity)。
3.變量的類(lèi)型變量(variable):個(gè)體特性的數(shù)量描述(1)定性變量
(i)分類(lèi)變量(categoricalvariable)或名義變量(nominativevariable)。分類(lèi)變量的水平(level)代碼(code)用1、2、3、4、5等來(lái)表示各個(gè)水平。二分類(lèi)變量(binaryvariable),也稱0-1變量或假變量(dummyvariable)(ii)有序變量(ordinalvariable)
種種可能的“取值”中自然地存在著次序。
(2)定量變量
(i)離散型變量只能取整數(shù)值。例如,手術(shù)病人數(shù);新生兒數(shù)
(ii)連續(xù)型變量可以取實(shí)數(shù)軸上的任何數(shù)值。由測(cè)量而得到的大多屬于連續(xù)型變量例如,血壓、身高、體重等“連續(xù)”:指該變量可以在實(shí)數(shù)軸上連續(xù)變動(dòng)。變通:紅細(xì)胞記數(shù)也視為連續(xù)型變量。(一個(gè)、兩個(gè)、三個(gè)之間的差別并不重要)變量類(lèi)型的轉(zhuǎn)化:只能由高級(jí)向低級(jí)轉(zhuǎn)化,
不能作相反方向的轉(zhuǎn)化
連續(xù)型→有序→分類(lèi)→二值離散型變量常常通過(guò)適當(dāng)?shù)淖儞Q或連續(xù)性校正后借用連續(xù)型變量或有序變量的方法來(lái)分析。4.因果與聯(lián)系公共衛(wèi)生領(lǐng)域常常要探究危險(xiǎn)因素與疾病之間的因果關(guān)系(causation)。首先應(yīng)當(dāng)問(wèn)存在不存在聯(lián)系(association)然而,存在聯(lián)系未必有因果關(guān)系在解釋統(tǒng)計(jì)分析的結(jié)果以及下結(jié)論時(shí),
務(wù)必對(duì)“因果”二字慎之又慎。學(xué)習(xí)目的與方法(1)統(tǒng)計(jì)思維享用一生事件的不確定性----概率由樣本推斷總體,結(jié)論的不確定性----有可能犯錯(cuò)誤
統(tǒng)計(jì)學(xué)任務(wù)
----限定犯錯(cuò)誤概率的大小,在此前提下,作決策(2)理解概念是首位研究設(shè)計(jì)的原則確定樣本量的依據(jù)參數(shù)估計(jì)的精度決策的兩類(lèi)錯(cuò)誤
案例辨析:在辨析中提高,從反面吸取教訓(xùn)
----平時(shí)爭(zhēng)論、課堂討論(3)重在理解和解釋結(jié)果通過(guò)計(jì)算,體驗(yàn)統(tǒng)計(jì)概念和思想正確理解、解釋和表達(dá)計(jì)算結(jié)果
中英文結(jié)果報(bào)告:內(nèi)容齊全,表達(dá)規(guī)范
----作業(yè)要按照規(guī)格撰寫(xiě)(4)電腦實(shí)驗(yàn)用電腦模擬現(xiàn)實(shí)世界,從實(shí)驗(yàn)中看隨機(jī)現(xiàn)象統(tǒng)計(jì)軟件:反復(fù)實(shí)踐,靈活運(yùn)用
----機(jī)房開(kāi)放,勤動(dòng)手!(5)考試
*筆試:理論、方法不記公式,無(wú)數(shù)學(xué)推導(dǎo),無(wú)復(fù)雜計(jì)算*上機(jī)考試:已做過(guò)的電腦實(shí)驗(yàn);不編程序第二章定量資料的統(tǒng)計(jì)描述
把握資料的基本特征為統(tǒng)計(jì)分析打下基礎(chǔ)統(tǒng)計(jì)表描述性統(tǒng)計(jì)量統(tǒng)計(jì)圖統(tǒng)計(jì)描述
----從資料中獲取信息最基本的方法第一節(jié)頻數(shù)與頻數(shù)分布
頻數(shù)分布表(frequencydistributiontable),又稱頻數(shù)表
一、
離散型定量變量的頻數(shù)分布例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:
0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7直條圖(barchart)橫坐標(biāo):產(chǎn)前檢查次數(shù);縱坐標(biāo):頻率,檢查k次的婦女所占的比例(%)等寬矩形長(zhǎng)條:高度相當(dāng)于檢查次數(shù)的頻率二、連續(xù)型定量變量的頻數(shù)分布
例2-2抽樣調(diào)查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L),數(shù)據(jù)如下:直方圖(頻率直方圖)橫軸:血清鐵含量縱軸:頻率密度
=頻率/組距面積=頻率注:組距相等時(shí),矩形直條的高度與相應(yīng)組段的頻率成正比。
圖2-2120例健康成年男子血清鐵含量分布
單峰、對(duì)稱-----對(duì)稱分布圖2-3某地居民238人發(fā)汞含量(μmol/kg)分布
正偏峰分布(positivelyskeweddistribution)負(fù)偏峰分布(negativelyskeweddistribution)
第二節(jié)定量變量的特征數(shù)
定量地描述集中趨勢(shì)與離中趨勢(shì)是統(tǒng)計(jì)描述的重要內(nèi)容一、
描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)
對(duì)于連續(xù)型定量變量,描述集中趨勢(shì)常用的統(tǒng)計(jì)量為算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。1.算術(shù)均數(shù)簡(jiǎn)稱均數(shù)(mean,),適合描述對(duì)稱分布資料的集中位置(也稱為平均水平)。其計(jì)算公式為
n:樣本含量
X1,X2,…,Xn:觀察值或:觀察值之和例2-3測(cè)得8只正常大鼠血清總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。按式(2-1),算術(shù)均數(shù)為
對(duì)于偏峰分布資料算術(shù)均數(shù)不能較好地反映分布的集中趨勢(shì)。
2.幾何均數(shù)(geometricmean,G)
適用于觀察值變化范圍跨越多個(gè)數(shù)量級(jí)的資料
頻數(shù)圖一般呈正偏峰分布
例2-57名慢性遷延性肝炎患者的HBsAg滴度資料為1:16,1:32,1:32,1:64,1:64,1:128,1:512。試計(jì)算其幾何均數(shù)。3.中位數(shù)(median,M)
可用于各種分布的定量資料總體中有一半個(gè)體的數(shù)值低于這個(gè)數(shù),一半個(gè)體的數(shù)值高于這個(gè)數(shù)。
基于樣本資料將n例數(shù)據(jù)按升序排列,第i個(gè)數(shù)據(jù)記為
n為奇數(shù)時(shí)
n為偶數(shù)時(shí)
例2-7某藥廠觀察9只小鼠口服高山紅景天醇提取物(RSAE)后在乏氧條件下的生存時(shí)間(分鐘)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數(shù)。百分位數(shù)(percentile)總體中,數(shù)值小于它的個(gè)體恰有X%,大于它的個(gè)體恰有1-X%樣本估計(jì):按照升序排列的數(shù)列里,其左側(cè)(即小于它)的個(gè)體數(shù)在整個(gè)樣本中所占百分比為X%。4.眾數(shù)(mode)總體中出現(xiàn)機(jī)會(huì)最高的數(shù)值。樣本估計(jì):在樣本中出現(xiàn)次數(shù)最多的數(shù)值。例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7
眾數(shù)為4(次)二、描述離散趨勢(shì)的特征數(shù)同一總體中不同個(gè)體之間的離散趨勢(shì)又稱為變異(variation)。
例2-11試觀察三組數(shù)據(jù)的離散狀況。(均數(shù)都是30)
A組:26,28,30,32,34
B組:24,27,30,33,36
C組:26,29,30,31,341.極差(range,R)R=最大值-最小值計(jì)算簡(jiǎn)便,但僅利用了兩個(gè)數(shù)據(jù)的信息一般,樣本量n越大R也往往會(huì)越大,不夠穩(wěn)定
例2-12計(jì)算上述三組數(shù)據(jù)的極差A(yù)組R=34-26=8B組R=36-24=12C組R=34-26=82.四分位數(shù)間距(quartilerange,Q)Q=P75-P25
P25與P75之間恰好包含50%的個(gè)體四分位數(shù)間距Q是總體中數(shù)值居中的50%個(gè)體散布的范圍Q越大意味著數(shù)據(jù)間變異越大
3.方差(variance)與標(biāo)準(zhǔn)差(standarddeviation)
用于反映一組對(duì)稱分布的觀察值在數(shù)量上的變異程度??傮w中:樣本中:例2-14分別計(jì)算例2-11中三組數(shù)據(jù)的標(biāo)準(zhǔn)差。按照公式(2-11)與標(biāo)準(zhǔn)差的定義
C組數(shù)據(jù)的離散趨勢(shì)最小,B組的最大5.變異系數(shù)(coefficientofvariation,CV)
例2-151985年通過(guò)十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差為0.98kg;身高均數(shù)為72.4cm,標(biāo)準(zhǔn)差為3.0cm。體重的變異大還是身高的變異大?體重的變異系數(shù)身高的變異系數(shù)
用于量綱不同的變量間變異程度的比較或均數(shù)差別較大的變量間變異程度的比較四、描述分布形態(tài)的統(tǒng)計(jì)指標(biāo)1.偏度系數(shù)(coefficientofskewness,SKEW)總體偏度系數(shù)為0時(shí),分布是對(duì)稱的;取正值時(shí),分布為正偏峰;取負(fù)值時(shí),分布為負(fù)偏峰。例2-2中血清鐵含量(μmol/L)數(shù)據(jù)偏度系數(shù)SKEW=-0.1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025陜西省建筑安全員知識(shí)題庫(kù)及答案
- 2025海南省建筑安全員-A證考試題庫(kù)附答案
- 2025河南建筑安全員知識(shí)題庫(kù)附答案
- 《A期中沖刺復(fù)習(xí)》課件
- 下肢深靜脈血栓的形成
- 物質(zhì)的量完整課件
- 《醫(yī)院火災(zāi)培訓(xùn)課件》課件
- 房地產(chǎn)行業(yè)定期報(bào)告:鄭州出臺(tái)容積率新規(guī)一線新房成交環(huán)比與9.6
- 《技術(shù)必修》課件
- 單位管理制度展示合集職員管理篇十篇
- 脊柱四肢及肛門(mén)直腸檢查
- 頸椎病診治與康復(fù)指南2023年版
- 高中政治期末綜合檢測(cè)部編版選修1
- 鑄造基礎(chǔ)知識(shí)及常見(jiàn)鑄造缺陷簡(jiǎn)介課件
- 歷史(中職)PPT全套教學(xué)課件
- 藥物分離技術(shù)教材吳昊課后參考答案
- 我和外公的戰(zhàn)爭(zhēng)
- 浙人美2011版二年級(jí)美術(shù)上冊(cè)《淘氣堡》教案及教學(xué)反思
- 提高屋面防水合格率QC成果演示文稿
- 【招標(biāo)控制價(jià)編制研究文獻(xiàn)綜述(論文)4800字】
- 肝硬化護(hù)理教學(xué)查房
評(píng)論
0/150
提交評(píng)論