醫(yī)學(xué)研究數(shù)據(jù)管理與統(tǒng)計分析(1)_Epidata_第1頁
醫(yī)學(xué)研究數(shù)據(jù)管理與統(tǒng)計分析(1)_Epidata_第2頁
醫(yī)學(xué)研究數(shù)據(jù)管理與統(tǒng)計分析(1)_Epidata_第3頁
醫(yī)學(xué)研究數(shù)據(jù)管理與統(tǒng)計分析(1)_Epidata_第4頁
醫(yī)學(xué)研究數(shù)據(jù)管理與統(tǒng)計分析(1)_Epidata_第5頁
已閱讀5頁,還剩133頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、1 1搜集資料整理與分析資料調(diào)查(研究)項目分析表(指標(biāo))研究目的回答統(tǒng)計分析步驟調(diào)查研究步驟解釋、呈現(xiàn)結(jié)果2 2 確定調(diào)查和研究的目的是選定研究指標(biāo)的依據(jù)確定調(diào)查和研究的目的是選定研究指標(biāo)的依據(jù) 研究指標(biāo)又是研究目的的具體體現(xiàn)研究指標(biāo)又是研究目的的具體體現(xiàn)n了解了解,用以說明總體。,用以說明總體。n 研究研究,通過確立統(tǒng)計學(xué)聯(lián)系來,通過確立統(tǒng)計學(xué)聯(lián)系來 探索病因或驗證療效等。探索病因或驗證療效等。3 3:對象來源總體是什么?:對象來源總體是什么?如何抽樣?代表性?如何抽樣?代表性?:個體?群體?:個體?群體?4 4根據(jù)研究目的選擇合適的設(shè)計類型:描述疾病的或健康狀況的三間分布描述疾病的或健康

2、狀況的三間分布探討病因探討病因驗證預(yù)防和控制措施的效果驗證預(yù)防和控制措施的效果評價疫苗的效果評價疫苗的效果新藥上市前臨床試驗新藥上市前臨床試驗5 56 67 7p根據(jù)研究設(shè)計類型確定所需樣本量計算公式。p相關(guān)參數(shù):一類錯誤的概率:即檢驗水準(zhǔn),越小所需樣本含量越多,對于相同的檢驗水準(zhǔn),雙側(cè)檢驗比單側(cè)檢驗所需的樣本含量更大,通常取0.05。 把握度(power) 1-,一般0.8-0.9單側(cè)檢驗還是雙側(cè)檢驗,單側(cè)檢驗所需樣本量小,雙側(cè)檢驗所需樣本量大。8 8常用軟件:EpiCalc 20009 9常用軟件:EPI INFO1010常用軟件:OPENEPI1111 直接觀察法 采訪法 包括面訪、調(diào)查

3、會及信訪、電話訪問等 原始資料的收集方式1212n 真實性真實性(效度)(效度) n 可靠性可靠性(信度)(信度)1313 ExcelExcel、AccessAccess、EpiDataEpiData、STATASTATA、SPSSSPSS、SASSAS軟件等軟件等邏輯檢查、核對邏輯檢查、核對 排序(排序(sortingsorting)建立新變量建立新變量數(shù)據(jù)的編碼和轉(zhuǎn)換數(shù)據(jù)的編碼和轉(zhuǎn)換缺失值的處理缺失值的處理1414Dbase, FoxBase,Visual FoxPro,Lotus1515用EPIDATA構(gòu)建調(diào)查表數(shù)據(jù)庫16161717用EPIDATA錄入調(diào)查表統(tǒng)計分析常用軟件統(tǒng)計分析常用

4、軟件1818讓我們從一個簡單的調(diào)查開始.研究目的研究目的:了解本班同學(xué)姓名、性別、身高、出生日期等信息。Step1: 建立調(diào)查表 文本編輯軟件:Word19192020調(diào)查表編號:編號:姓名姓名:_性別:(性別:(1 1)男)男 (2 2)女)女身高:身高:_._ CM_._ CM出生日期:出生日期:_年年_月月_日日為何不寫成為何不寫成性別:性別:_S STEPTEP 2: 2:調(diào)查表數(shù)據(jù)錄入調(diào)查表數(shù)據(jù)錄入2121EpiData軟件概述一、EpiData的設(shè)計 設(shè)計者:丹麥的Jens M、Michael Bruus和英國的Mark Myatt 編程者:丹麥的Michael Bruus 開發(fā)思

5、路和原理:基于Epi Info 6.0二、軟件下載和登記注冊 下載地址:http:/www.epidata.dk/ download.htm三、版本信息 EpiData 1.5(2001年2月22日);EpiData 2.1a(2002年) EpiData 3.02(2004); EpiData 3.10(NOW)2222EpiData軟件概述uEpiData軟件安裝如同拷貝程序文檔一樣簡單。例如,它可以從U盤運行,并且占用內(nèi)存很?。?.5M)。u由于捐助和志愿者的工作,軟件免費免費發(fā)布。2323EPIDATA程序下載與安裝http:/www.epidata.dk/2424EPIDATA程序下

6、載與安裝2525數(shù)據(jù)錄入EPIDATA 軟件EpiData 軟件是在吸收 DOS版的Epi Info 6.0 軟件優(yōu)點基礎(chǔ)上開發(fā)研制的 Windows版軟件。2626EPIDATA 軟件它一方面吸收了Epi Info軟件的長處,同時又極具自身特色。與 視窗版Epi Info軟件相比,占用空間小,更加簡單易學(xué),且界面友好,可以很方便的對數(shù)據(jù)進行儲存、核對和管理等,2727用EpiData軟件進行數(shù)據(jù)錄入和管理,將產(chǎn)生三種基本的文件.(1)調(diào)查表文件:后綴為.QES。通過建立調(diào)查表文件,系統(tǒng)根據(jù)特定規(guī)則自動定義數(shù)據(jù)文件的結(jié)構(gòu),包括變量名、變量類型和長度等,用于數(shù)據(jù)錄入。(2)數(shù)據(jù)文件:后綴為.RE

7、C。數(shù)據(jù)文件包含錄入的數(shù)據(jù)信息以及已經(jīng)定義好的編碼,用于數(shù)據(jù)的統(tǒng)計分析。(3)核對文件:后綴為.CHK。通過建立核對文件,系統(tǒng)將定義數(shù)據(jù)錄入的有效性規(guī)則。文件組成2828E EPIPID DATAATA E ENTRYNTRY 的特點的特點調(diào)查表設(shè)計便捷調(diào)查表設(shè)計便捷 數(shù)據(jù)核查功能強大且實現(xiàn)簡便數(shù)據(jù)核查功能強大且實現(xiàn)簡便 與調(diào)查表形式一致的可視數(shù)據(jù)錄入界面與調(diào)查表形式一致的可視數(shù)據(jù)錄入界面 數(shù)據(jù)轉(zhuǎn)換功能強大數(shù)據(jù)轉(zhuǎn)換功能強大 2929講了半天, EpiData究竟長什么樣?3030請打開電腦上EPIDATA主程序為何我的電腦上沒有歡迎使用EpiData?3131EpiData軟件的窗口介紹323

8、2編輯過程工具條工具欄數(shù)據(jù)表預(yù)覽粘貼字段編輯器編碼編輯器3333建立調(diào)查表文件建立調(diào)查表文件(.QES)(.QES) 建立調(diào)查表文件是建立數(shù)據(jù)庫、實現(xiàn)數(shù)據(jù)錄入和管理的第一步。3434建立調(diào)查表文件有以下幾種方法:建立調(diào)查表文件有以下幾種方法:第一種:在菜單中,點擊 “文件”(File)“生成調(diào)查表文件QES文件”第二種:在工作欄的工作流程中,點擊“1. 打開文件”(1.Define Data)“建立新QES文件”第三種:在按鈕欄中,點擊 ,這時窗口中會在工作區(qū)顯示一個空白的文檔,你可以在此文檔中鍵入調(diào)查表內(nèi)容和框架,編輯完成后,將調(diào)查表文件保存,文件的擴展名統(tǒng)一為.QES。3535假定現(xiàn)有一調(diào)

9、查表如下,如何建立.QES文件?調(diào)查表調(diào)查表姓名:姓名:_性別:(性別:(1 1)男)男 (2 2)女)女身高:身高:_._ CM_._ CM出生日期:出生日期:_年年_月月_日日3636如果按原調(diào)查表格式直接建立數(shù)據(jù)庫,結(jié)果如果按原調(diào)查表格式直接建立數(shù)據(jù)庫,結(jié)果會怎樣?會怎樣?3737必須定義字段必須定義字段名名和字段和字段類型類型字段類型字段類型字段編碼字段編碼自動ID號數(shù)字# # .#文本_加密字段大寫文本邏輯(是/否)日期自動插入日期聲音提示3838調(diào)用字段編輯器:第一種方法:直接按CTRL-Q鍵。第二種方法:在編輯器工具條上點擊字段編輯器圖標(biāo)。手工輸入或使用字段編輯器3939字段類型

10、介紹字段類型介紹數(shù)值型字段:#,#.# ;僅接受數(shù)字和空格,不輸按空格處理,分析時作缺失值處理,以“.”顯示。數(shù)字位數(shù)由“#”個數(shù)決定,小數(shù)位數(shù)由小數(shù)點右邊的“#”個數(shù)確定。最長可達14位,小數(shù)點按1個字符計算。4040文本型字段:包括三種。一種是常用的文本(或下劃線、或底線)型字段:_;該型字段由連續(xù)下劃線來定義,長度由下劃線字符個數(shù)決定,最大值為80,空白字段(字段內(nèi)容空缺)時,數(shù)據(jù)管理時將按缺失值處理。另一種為大寫文本型字段:。4141日期型字段:包括兩種。一種為常用日期字段:、,分美式、英式兩種,輸入時即進行合法性檢驗;只需輸入日期,系統(tǒng)自動插入斜杠。另一種為自動日期型字段:、 ;儲存

11、或修改數(shù)據(jù)時該字段自動輸入系統(tǒng)日期,如系統(tǒng)日期正確,也即當(dāng)天日期。4242自動ID號型字段:;這是一種專用字段,用作記錄識別號,文件的第一個記錄為1,以后記錄自動賦值順次較前增加1,并自動保證編號的唯一性。輸入數(shù)據(jù)時光標(biāo)跳過此字段。如需使第一個記錄號大于1,則可在“文件”菜單“選擇項”中的“高級設(shè)置”中設(shè)置。邏輯型字段(即布爾函數(shù)型字段):;只接受Y、N、空格或回車鍵。后兩者作缺失值處理。Y、N字符輸入后即轉(zhuǎn)為大寫字母。4343我們按照這些要求重新建立數(shù)據(jù)庫,這次應(yīng)該成功了吧?先預(yù)覽一下先預(yù)覽一下4444怎么會這樣?4545定義字段名(定義字段名(F FIELDIELD N NAMESAMES

12、)以調(diào)查表中字段的第一個詞命名(First word in question is field names)使用 內(nèi)的內(nèi)容自動添加字段名(Automatic field names)4646軟件安裝后默認(rèn)是第一種命名方軟件安裝后默認(rèn)是第一種命名方式,建議大家安裝軟件后立即修式,建議大家安裝軟件后立即修改選項!改選項!定義字段名(定義字段名(F FIELDIELD N NAMESAMES)“文件”(File)“選項”(Option)“生成REC文件”(Create data file) 在“如何生成字段名”(How to generate field names)中選擇字段的命名方式。4747“

13、更新問題為實際文件名更新問題為實際文件名”如果未勾選如果未勾選4848預(yù)覽顯示的并非真實的預(yù)覽顯示的并非真實的字段名字段名如如“姓名姓名”, , 真實的字真實的字段名是段名是F FIELDIELD1 149495050按 命名規(guī)則修改調(diào)查表,然后預(yù)覽生成REC文件5151別忘了修改別忘了修改“選項選項”否則否則會是這樣的5252制作調(diào)查表文件可用EpiData編輯器進行。也可用Word或其它文本編輯器編寫。注意,必須以純文本格式存盤,文件后綴名必須是“.qes”。也可在其它文本編輯器編寫,再粘貼到EpiData編輯器窗口。如何編寫調(diào)查表文件5353編寫調(diào)查表文件注意事項(一)編寫過程中及時保存

14、文件,文件類型為編寫過程中及時保存文件,文件類型為. .qesqes文件文件。系統(tǒng)只會根據(jù)系統(tǒng)只會根據(jù)“特殊符號特殊符號”來定義一個輸入字段(包括類型和來定義一個輸入字段(包括類型和長度),并根據(jù)符號前的字符給字段命名。建議在編寫過程中利長度),并根據(jù)符號前的字符給字段命名。建議在編寫過程中利用用“字段快速清單字段快速清單”插入插入“特殊符號特殊符號”,即:選擇字段類型,定,即:選擇字段類型,定義好長度后,按義好長度后,按“插入插入”圖標(biāo),可避免由于圖標(biāo),可避免由于“特殊符號特殊符號”輸入錯輸入錯誤而不能產(chǎn)生有效的輸入字段。誤而不能產(chǎn)生有效的輸入字段。調(diào)查表用中文編寫時,可用調(diào)查表用中文編寫時

15、,可用定界符(定界符(“”)將字段名定義為英將字段名定義為英文字符(英文字母或英文字母阿拉伯?dāng)?shù)字),有利于數(shù)據(jù)庫的文字符(英文字母或英文字母阿拉伯?dāng)?shù)字),有利于數(shù)據(jù)庫的管理和其他軟件的統(tǒng)計分析。注意:管理和其他軟件的統(tǒng)計分析。注意:“”必須為半角型,而不能必須為半角型,而不能是全角型是全角型(“ (“”) )。5454盡可能把字段定義盡可能把字段定義數(shù)值型數(shù)值型,有利于統(tǒng)計分析。如糖尿病史,有利于統(tǒng)計分析。如糖尿病史“dmhisdmhis” ”可定義為數(shù)值型字段,可定義為數(shù)值型字段,“1”1”表示表示“有有”,“0”0”表示表示“無無”。調(diào)查表文件調(diào)查表文件格式盡可能和原調(diào)查表一致格式盡可能和

16、原調(diào)查表一致,有利于直觀錄入數(shù)據(jù)。,有利于直觀錄入數(shù)據(jù)。如果用其他文本編輯器編寫如果用其他文本編輯器編寫. .qesqes文件,在運行文件,在運行EpiDataEpiData后,打開后,打開該該. .qesqes文件即可編輯。文件即可編輯。調(diào)查表文件的編寫是否符合要求,可通過調(diào)查表文件的編寫是否符合要求,可通過“數(shù)據(jù)表預(yù)覽數(shù)據(jù)表預(yù)覽”來查看。來查看。編寫調(diào)查表文件注意事項(二)5555數(shù)據(jù)文件的產(chǎn)生和修改 主菜單主菜單選擇數(shù)據(jù)導(dǎo)入選擇數(shù)據(jù)導(dǎo)入/ /導(dǎo)出菜單導(dǎo)出菜單“根據(jù)根據(jù)QESQES文件生成文件生成RECREC文件文件”在工作過程工具條按第二個按鈕在工作過程工具條按第二個按鈕“生成生成REC

17、REC文文件件”在編輯器菜單在編輯器菜單RECREC文件菜單文件菜單選擇選擇“生成生成RECREC文件文件”5656生成生成RECREC文件文件57575858請大家根據(jù)EPIDATA建立調(diào)查表庫data.qes,生成數(shù)據(jù)庫,保存為data.rec5959調(diào)查表調(diào)查表姓名:姓名:_性別:(性別:(1 1)男)男 (2 2)女)女身高:身高:_._ CM_._ CM出生日期:出生日期:_年年_月月_日日現(xiàn)在我們已經(jīng)有了兩個文件:*.QES 調(diào)查表文件*.REC 數(shù)據(jù)文件*.REC文件是根據(jù)QES文件生成的,用于數(shù)據(jù)錄入萬一我的QES文件丟了怎么辦?6060數(shù)據(jù)文件結(jié)構(gòu)的修改6161調(diào)查表結(jié)構(gòu)重新

18、修改后怎么辦?調(diào)查表結(jié)構(gòu)重新修改后怎么辦?數(shù)據(jù)庫建立后,錄入了一部分分?jǐn)?shù)據(jù),發(fā)現(xiàn)漏掉了一個數(shù)據(jù)庫建立后,錄入了一部分分?jǐn)?shù)據(jù),發(fā)現(xiàn)漏掉了一個字段,于是重新修改調(diào)查表,這里可以根據(jù)修改后的字段,于是重新修改調(diào)查表,這里可以根據(jù)修改后的QESQES文件更新文件更新RECREC文件。文件。6262我一邊我一邊QQQQ聊天,一邊錄入數(shù)據(jù),萬一聊天,一邊錄入數(shù)據(jù),萬一錄錯了,軟件會通知我嗎?錄錯了,軟件會通知我嗎?6363嗨!有第嗨!有第3 3種人嗎?種人嗎?核對文件的建立 核對文件核對文件:CHECKCHECK文件或文件或 .CHK.CHK文件文件 n 范圍范圍/ /合法值(合法值(Range/Lega

19、lRange/Legal)n 跳轉(zhuǎn)(跳轉(zhuǎn)(JumpsJumps)n 必須輸入(必須輸入(MustEnterMustEnter)n 重復(fù)輸入(重復(fù)輸入(RepeatRepeat)64646565光標(biāo)懸停,會提示你命令格式6666錄入錯誤時,軟件會彈出警告6767關(guān)鍵字段的定義以編號code2為例,這個編號具有唯一性,為避免重復(fù)輸入,可在CHK文件中定義:code2 KEY UNIQUE 1 MUSTENTEREND6868練習(xí)請大家根據(jù)下列調(diào)查表內(nèi)容,利用EPIDATA建立調(diào)查表數(shù)據(jù)庫,保存為data1.qes,并生成data1.rec用于錄入資料。6969調(diào)查表1.地區(qū): _ 2.調(diào)查表編號:

20、 3. 錄入ID號: 4.姓名:_ 5.性別:(1)男 (2)女 6.你吸煙嗎? (1)否跳問7 (2)是 續(xù)問6.1 6.1 你多在年齡開始吸煙的? _ 歲 6.2 平均每天吸煙支數(shù)? _ 支 7.身高:_._ CM8.血壓值(收縮壓/舒張壓): _ /_mmHg 9.出生日期:_月_日_年 10. 你是否具有下列癥狀?如有請在相應(yīng)癥狀前打勾。 咳嗽 咳痰 發(fā)熱 胸痛 呼吸困難 咯血 11.調(diào)查表錄入日期: _月_日_年 7070錄入時自動編碼請大家根據(jù)data1.rec數(shù)據(jù)庫,建立CHK文件,保存為data1.chk要求:(1 1)地區(qū)號自動錄入)地區(qū)號自動錄入(2 2)編號、姓名必須錄入

21、)編號、姓名必須錄入(3 3)性別只能填)性別只能填1 1或或2 2(4 4)是否吸煙只能填)是否吸煙只能填1 1、2 2或或9 9(5 5)是否吸煙能夠?qū)崿F(xiàn)跳轉(zhuǎn))是否吸煙能夠?qū)崿F(xiàn)跳轉(zhuǎn)(6 6)平均每天吸煙支數(shù)的范圍在)平均每天吸煙支數(shù)的范圍在1-401-40之間或填之間或填9999并請嘗試錄入35份調(diào)查表,存盤。7171記錄刪除此處僅是在記錄加上刪除標(biāo)記,徹底刪除需至“工具”清理REC文件”點擊點擊7272如果研究對象是(如果研究對象是(1 1)男性,而我)男性,而我卻錄成了(卻錄成了(2 2)女性,軟件好象)女性,軟件好象不會彈出警告嘛不會彈出警告嘛 !7373雙錄入核對 DOUBLE E

22、NTRY為了確保錄入質(zhì)量,可以采用雙人錄入法進行核對。首先利用工具-復(fù)制REC文件結(jié)構(gòu),復(fù)制已建立好的數(shù)據(jù)庫(包括CHK文件),另存為一新庫,但已錄入的數(shù)據(jù)不會被復(fù)制。7474雙錄入核對 DOUBLE ENTRY如需要,可不復(fù)制字符型變量因為家庭住址、工作單位等很少有人愿意錄入兩次。7575兩次錄入的一致性檢驗 雙軌錄入完成后可進行一致檢驗比較兩次錄入不同的地方注意選擇兩數(shù)據(jù)庫中的匹配字段用于比較767677777878調(diào)查表錄入兩次,比較后發(fā)現(xiàn)調(diào)查表錄入兩次,比較后發(fā)現(xiàn)錯誤再修改,好象太麻煩!錯誤再修改,好象太麻煩!有沒有邊錄入邊比較的方法?有沒有邊錄入邊比較的方法?7979雙錄入實時校驗先

23、點擊工具-準(zhǔn)備雙錄入實時校驗8080與雙錄入一致性檢驗比較,使用較少雙錄入實時校驗u指定第1 次已錄入的REC文件u創(chuàng)建1新的REC文件,用于雙錄入8181雙錄入實時校驗8282應(yīng)注意錄入調(diào)查表的順序顯示數(shù)據(jù)8383瀏覽數(shù)據(jù)庫其它一些常用功能打印調(diào)查表(在數(shù)據(jù)錄入窗體下)文件-打印數(shù)據(jù)表8484將數(shù)據(jù)庫存檔工具-創(chuàng)建壓縮文件可以將指定目錄下所有文件、僅EPIDATA文件或單個文件壓縮、打包和保存。(ZIP)需要的時候再利用“工具-解壓縮文件”解壓縮8585描述數(shù)據(jù)8686簡單描述和分析數(shù)據(jù)數(shù)據(jù)文件的導(dǎo)出和導(dǎo)入 8787數(shù)據(jù)庫的縱向追加與橫向合并 8888數(shù)據(jù)庫的縱向追加(頭-尾)一般用于追加記

24、錄,如同學(xué)甲錄了50份,同學(xué)乙錄入了60份,現(xiàn)將兩數(shù)據(jù)庫合并成個庫,共110份記錄。注意選項8989數(shù)據(jù)庫的橫向合并 (肩-肩)如一份調(diào)查表包括兩部分,同學(xué)甲錄了Part 1,同學(xué)乙錄入Part 2,現(xiàn)將兩數(shù)據(jù)庫合并成個庫,包含Part 1和Part 2。選擇關(guān)鍵字段用于匹配,一般用記錄號NO作為關(guān)鍵字段,注意需保證其唯一性9090請大家將數(shù)據(jù)庫data3與data4合并,保存為data34.rec請大家將數(shù)據(jù)庫data5與data6合并,保存為data56.rec請大家將數(shù)據(jù)庫data5與data7合并,保存為data57.rec比較異同點9191D DATAATA3 3 + + DATAD

25、ATA4 49292追加記錄(注意變追加記錄(注意變量是否增加)量是否增加)D DATAATA5 5 + + DATADATA6 69393追加變量D DATAATA5 + 5 + DATADATA7 79494追加變量及記錄EpiData軟件的工具菜單 9595EpiData軟件的選項 9696有了數(shù)據(jù)庫,那就得考慮如何分析了有了數(shù)據(jù)庫,那就得考慮如何分析了統(tǒng)計描述統(tǒng)計推斷9797資料分析(DATA ANALYSIS)9898(1)(1)統(tǒng)計描述統(tǒng)計描述(descriptive statisticdescriptive statistic)指用統(tǒng))指用統(tǒng)計指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法,對資料計

26、指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及其分布規(guī)律進行描述。的數(shù)量特征及其分布規(guī)律進行描述。(2)(2)統(tǒng)計推斷統(tǒng)計推斷(inferential statisticinferential statistic)指如何)指如何由樣本信息推斷總體特征問題。由樣本信息推斷總體特征問題。資料的分類資料的分類9999 計量資料計量資料 分類資料分類資料 二分類二分類 多分類多分類無序多分類無序多分類有序多分類有序多分類(等級資料等級資料)100100統(tǒng)計資料的描述統(tǒng)計資料的描述v指標(biāo)描述指標(biāo)描述 集中位置:集中位置:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù) 離散程度:

27、離散程度:極差、標(biāo)準(zhǔn)差、方差、四分位數(shù)間距極差、標(biāo)準(zhǔn)差、方差、四分位數(shù)間距v圖形描述圖形描述頻數(shù)分布圖頻數(shù)分布圖 趨勢圖趨勢圖計量資料計量資料集中趨勢的描述集中趨勢的描述算術(shù)均數(shù)算術(shù)均數(shù)幾何均數(shù)幾何均數(shù)中位數(shù)中位數(shù)百分位數(shù)百分位數(shù)101101計量資料計量資料集中趨勢的描述集中趨勢的描述算術(shù)均數(shù)算術(shù)均數(shù)幾何均數(shù)幾何均數(shù)中位數(shù)中位數(shù)百分位數(shù)百分位數(shù)10210212nXXXXn1niiiXXXnnmean最適于最適于對稱分布對稱分布資料,特別是資料,特別是正態(tài)分布正態(tài)分布資料資料; ;對于偏態(tài)資料,均數(shù)對于偏態(tài)資料,均數(shù)不能不能較好地反映其集中趨勢。較好地反映其集中趨勢。計量資料計量資料集中趨勢的描

28、述集中趨勢的描述算術(shù)均數(shù)算術(shù)均數(shù)幾何均數(shù)幾何均數(shù)中位數(shù)中位數(shù)百分位數(shù)百分位數(shù)103103geometric mean1. 1.等比資料,如抗體平均滴度等比資料,如抗體平均滴度2.2.對數(shù)正態(tài)分布資料對數(shù)正態(tài)分布資料12nnGXXX f lgx fG=lg-1計量資料計量資料集中趨勢的描述集中趨勢的描述算術(shù)均數(shù)算術(shù)均數(shù)幾何均數(shù)幾何均數(shù)中位數(shù)中位數(shù)百分位數(shù)百分位數(shù)104104 Median 將一組數(shù)據(jù)按從小到將一組數(shù)據(jù)按從小到大的順序排列,位置大的順序排列,位置居中的數(shù)即是中位數(shù)。居中的數(shù)即是中位數(shù)。中位數(shù)常用于描述中位數(shù)常用于描述偏態(tài)資料,開口資料,有不確定偏態(tài)資料,開口資料,有不確定值的資料值

29、的資料的集中趨勢;的集中趨勢;中位數(shù)和均數(shù)在對稱分布上理論上是相同的。中位數(shù)和均數(shù)在對稱分布上理論上是相同的。計量資料計量資料集中趨勢的描述集中趨勢的描述算術(shù)均數(shù)算術(shù)均數(shù)幾何均數(shù)幾何均數(shù)中位數(shù)中位數(shù)百分位數(shù)百分位數(shù)105105Percentile用于描述某個觀察用于描述某個觀察序列在某百分位序列在某百分位置上的水平。置上的水平。u常用于確定參考值范圍,亦稱正常值范圍。常用于確定參考值范圍,亦稱正常值范圍。u50%50%分位數(shù)就是中位數(shù)分位數(shù)就是中位數(shù)u25%,75%25%,75%分位數(shù)稱四分位數(shù)分位數(shù)稱四分位數(shù)(quartile)(quartile)X% PX (100-X)%計量資料計量資料

30、106106均數(shù)應(yīng)用時的注意事項均數(shù)應(yīng)用時的注意事項v均數(shù)適用于:單峰對稱分布的資料均數(shù)適用于:單峰對稱分布的資料v幾何均數(shù)適用于:對數(shù)變換后單峰對稱的幾何均數(shù)適用于:對數(shù)變換后單峰對稱的資料資料v中位數(shù)適用于:任何分布資料,有不確定中位數(shù)適用于:任何分布資料,有不確定值的資料值的資料計量資料計量資料107107v極差極差 /全距全距 (range)v四分位數(shù)間距四分位數(shù)間距 (inter-quartile range) v方差方差 (variance) v標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 SD (standard deviation)v變異系數(shù)變異系數(shù) CV (coefficient of variation)

31、 描述離散程度的指標(biāo)描述離散程度的指標(biāo):計量資料計量資料108108v極差極差 /全距全距v四分位數(shù)間距四分位數(shù)間距 v方差方差 v標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差v變異系數(shù)變異系數(shù) 描述離散程度的指標(biāo)描述離散程度的指標(biāo):v極差(全距),描述數(shù)據(jù)分布的范圍。極差大,說明數(shù)據(jù)分布較分散。v方法簡單明了。v不靈敏。v不穩(wěn)定。 計量資料計量資料109109v極差極差 /全距全距v四分位數(shù)間距四分位數(shù)間距 v方差方差 v標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差v變異系數(shù)變異系數(shù) 描述離散程度的指標(biāo)描述離散程度的指標(biāo):四分位數(shù)四分位數(shù) (quartile) Q QU U -Q -QL Lp下四分位數(shù)即第下四分位數(shù)即第2525百分位百分位數(shù),常用數(shù),常

32、用QQL L表示;表示;p上四分位數(shù)即第上四分位數(shù)即第7575百分位百分位數(shù),常用數(shù),常用QQU U表示表示計量資料計量資料110110v極差極差 /全距全距v四分位數(shù)間距四分位數(shù)間距 v方差方差 v標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差v變異系數(shù)變異系數(shù) 描述離散程度的指標(biāo)描述離散程度的指標(biāo):方差是實際值與期望值之差平方的平均值,而標(biāo)準(zhǔn)差是方差的平方根。一般情況下,總體均一般情況下,總體均數(shù)未知,數(shù)未知,需用樣本均需用樣本均數(shù)數(shù)估計估計計量資料計量資料111111v極差極差 /全距全距v四分位數(shù)間距四分位數(shù)間距 v方差方差 v標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差v變異系數(shù)變異系數(shù) 描述離散程度的指標(biāo)描述離散程度的指標(biāo):100%sCVX變異系

33、數(shù)變異系數(shù)CVcoefficient of variation計量資料計量資料112112集中趨勢集中趨勢+離散趨勢離散趨勢共同描述v均數(shù)標(biāo)準(zhǔn)差(min,max)v中位數(shù)四分位數(shù)間距 (min,max)v變異度小,則均數(shù)代表性好!v變異度大,數(shù)據(jù)分散,則均數(shù)代表性差!v平均數(shù)所表示的集中性與變異度所表示的離散性,從兩個不同的角度闡明計量資料的特征!計量資料計量資料樣本均數(shù)與總體均數(shù)比較樣本均數(shù)與總體均數(shù)比較 成組設(shè)計成組設(shè)計兩樣本均數(shù)比較(兩樣本均數(shù)比較(成組成組t t 檢驗檢驗)配對設(shè)計配對設(shè)計資料均數(shù)比較(資料均數(shù)比較(配對配對t t 檢驗檢驗) t t 檢驗檢驗方差分析方差分析成組設(shè)計成

34、組設(shè)計多個樣本均數(shù)的比較多個樣本均數(shù)的比較(one-way ANOVAone-way ANOVA)配伍組設(shè)計配伍組設(shè)計多個樣本均數(shù)比較多個樣本均數(shù)比較(two-way ANOVAtwo-way ANOVA)多個樣本均數(shù)的兩兩比較多個樣本均數(shù)的兩兩比較(q q檢驗,檢驗,Student-Newman-Student-Newman-KeulsKeuls法法) 多個實驗組和一個對照組均數(shù)間的兩兩比較多個實驗組和一個對照組均數(shù)間的兩兩比較(LSDLSD法和法和DuncanDuncan法法)113113計量資料計量資料定量數(shù)據(jù)差別的統(tǒng)計意義檢驗小結(jié)定量數(shù)據(jù)差別的統(tǒng)計意義檢驗小結(jié) 114114計量資料計量

35、資料兩連續(xù)變量間兩連續(xù)變量間的關(guān)系分析的關(guān)系分析115115計量資料計量資料分類資料統(tǒng)計分析分類資料統(tǒng)計分析統(tǒng)計分析統(tǒng)計分析統(tǒng)計描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷參數(shù)估計參數(shù)估計假設(shè)檢驗假設(shè)檢驗Example分類分類資料資料率、比、構(gòu)成比率、比、構(gòu)成比總體率的可信區(qū)間總體率的可信區(qū)間2 2檢驗、檢驗、u u檢驗檢驗分類資料分類資料分類資料統(tǒng)計描述分類資料統(tǒng)計描述常用的相對數(shù)率 Rate構(gòu)成比 Proportion比 Ratio117117分類資料分類資料聯(lián)系強度聯(lián)系強度118118分類資料統(tǒng)計推斷分類資料統(tǒng)計推斷數(shù)據(jù)類型的轉(zhuǎn)換數(shù)據(jù)類型的轉(zhuǎn)換 定量數(shù)據(jù)轉(zhuǎn)換為定性數(shù)據(jù)一般比較簡單,但定量數(shù)據(jù)轉(zhuǎn)換為定性數(shù)

36、據(jù)一般比較簡單,但從名義變量、等級數(shù)據(jù)轉(zhuǎn)換為定量數(shù)據(jù),則比從名義變量、等級數(shù)據(jù)轉(zhuǎn)換為定量數(shù)據(jù),則比較繁瑣且損失數(shù)據(jù)信息。較繁瑣且損失數(shù)據(jù)信息。對兩組或多組研究單項的某項指標(biāo)進行統(tǒng)計對兩組或多組研究單項的某項指標(biāo)進行統(tǒng)計學(xué)檢驗時,數(shù)據(jù)從定量轉(zhuǎn)換為定性或等級數(shù)據(jù)學(xué)檢驗時,數(shù)據(jù)從定量轉(zhuǎn)換為定性或等級數(shù)據(jù)時,統(tǒng)計學(xué)的效率會下降。時,統(tǒng)計學(xué)的效率會下降。119119以以正常參考值或臨床診斷標(biāo)準(zhǔn)正常參考值或臨床診斷標(biāo)準(zhǔn)作為分組依據(jù)。作為分組依據(jù)。某些定量指標(biāo)尚無公認(rèn)的正常參考值,可根據(jù)某些定量指標(biāo)尚無公認(rèn)的正常參考值,可根據(jù)均數(shù)、均數(shù)、中位數(shù)或三分位、四分位間距值中位數(shù)或三分位、四分位間距值,將其分為兩組

37、或多,將其分為兩組或多組。組。根據(jù)數(shù)據(jù)的根據(jù)數(shù)據(jù)的分布特點分布特點和和研究需要研究需要,自行確定,但要,自行確定,但要能能 對統(tǒng)計分析結(jié)果做出合理的解釋。對統(tǒng)計分析結(jié)果做出合理的解釋。定量數(shù)據(jù)轉(zhuǎn)換為定性或等級數(shù)據(jù)定量數(shù)據(jù)轉(zhuǎn)換為定性或等級數(shù)據(jù)分組切分組切割值確定方法割值確定方法120120數(shù)據(jù)類型數(shù)據(jù)類型 計量資料?計量資料? 計數(shù)資料?計數(shù)資料?分布類型分布類型 是否正態(tài)分布?是否正態(tài)分布? 數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換研究設(shè)計研究設(shè)計 成組?配對?配伍組?其他?成組?配對?配伍組?其他?統(tǒng)計分析方法和指標(biāo)的選擇統(tǒng)計分析方法和指標(biāo)的選擇取決于121121 常用的數(shù)據(jù)轉(zhuǎn)換類型及方法常用的數(shù)據(jù)轉(zhuǎn)換類型及方法x

38、x pxarcsinxxlog數(shù)據(jù)類型轉(zhuǎn)換方法舉例Poisson分布平方根轉(zhuǎn)換水中細菌數(shù)、單位時間放射性計數(shù)等二項分布反正弦函數(shù)轉(zhuǎn)換非傳染病患病率、白細胞百分?jǐn)?shù)、淋巴細胞轉(zhuǎn)換率等標(biāo)準(zhǔn)差與均數(shù)呈正比關(guān)系對數(shù)轉(zhuǎn)換發(fā)汞含量122122檢驗方法正態(tài)性用直方圖或正態(tài)概率紙進行觀察用矩法、W 法或 D 法進行統(tǒng)計檢驗兩組方差齊性F 檢驗多組方差齊性Bartlett檢驗常用正態(tài)性及方差齊性檢驗的方法常用正態(tài)性及方差齊性檢驗的方法 123123常用非參數(shù)統(tǒng)計方法小結(jié)常用非參數(shù)統(tǒng)計方法小結(jié)設(shè)計方法設(shè)計方法參數(shù)統(tǒng)計方法參數(shù)統(tǒng)計方法非參數(shù)統(tǒng)計方法非參數(shù)統(tǒng)計方法配對比較配對比較配對配對t t 檢驗檢驗符號檢驗符號檢驗

39、* *、符號等級檢驗、符號等級檢驗(WilcoxonWilcoxon法)法)兩組比較兩組比較成組比較成組比較t t 檢驗檢驗兩樣本等級秩和檢驗(兩樣本等級秩和檢驗(WilcoxonWilcoxon Mann and WhitneyMann and Whitney法)、中位數(shù)檢驗法)、中位數(shù)檢驗* *配 伍 組 比配 伍 組 比較較隨機區(qū)組隨機區(qū)組ANOVAANOVAMM檢驗(檢驗(FriedmanFriedman法)法)多組比較多組比較完全隨機設(shè)計完全隨機設(shè)計ANOVAANOVAHH檢驗(檢驗(KruskalKruskal and Wallis and Wallis法)法)124124125125(三組及以上均數(shù)比較)(三組及以上均數(shù)比較)126126127127n 統(tǒng)計量和概率為斜體:t,F(xiàn),P0.05; 不是n 統(tǒng)計表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論