山東大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)網(wǎng)上教案_第1頁(yè)
山東大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)網(wǎng)上教案_第2頁(yè)
山東大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)網(wǎng)上教案_第3頁(yè)
山東大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)網(wǎng)上教案_第4頁(yè)
山東大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)網(wǎng)上教案_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《衛(wèi)生統(tǒng)計(jì)學(xué)》網(wǎng)上教案錯(cuò)誤!未定義書(shū)簽。個(gè)樣本的方差齊性檢驗(yàn)20

第一章緒論1第六節(jié)變量變換20

第一節(jié)衛(wèi)生統(tǒng)計(jì)學(xué)的定義和內(nèi)容1第六章定性資料的統(tǒng)計(jì)描述21

第二節(jié)統(tǒng)計(jì)工作的步驟1第七章二項(xiàng)分布與Poisson分布及其應(yīng)用22

第三節(jié)統(tǒng)計(jì)學(xué)中的幾個(gè)根本概念1第一節(jié)二項(xiàng)分柞的概念與特征22

第四節(jié)學(xué)習(xí)衛(wèi)生統(tǒng)計(jì)學(xué)應(yīng)注意的問(wèn)題2第二節(jié)二項(xiàng)分布的應(yīng)用23

第二章定量資料的統(tǒng)計(jì)描述2第三節(jié)Poisson分立的概念與特征24

第?節(jié)數(shù)值變量資料的頻數(shù)表2第四節(jié)Poisson分布的應(yīng)用25

第第八章無(wú)2檢

驗(yàn)26

節(jié)第一節(jié)四格

表資料的公

檢驗(yàn)27

:衛(wèi)生統(tǒng)計(jì)學(xué)第二節(jié)配對(duì)

勢(shì)四格表資料

的的%2檢驗(yàn)28

統(tǒng)HealthStatistics第三節(jié)四格

計(jì)表資料的

描Fisher確切概

述指標(biāo)3率法29

第三節(jié)離散程度的統(tǒng)計(jì)描述指標(biāo)4第四節(jié)行x列表資料的爐檢驗(yàn)30

第三章正態(tài)分布及其應(yīng)用5第五節(jié)多個(gè)樣本率比擬的%2分割法31

第一節(jié)正態(tài)分布的概念和特征5第六節(jié)頻數(shù)分布擬合優(yōu)度的好檢驗(yàn)33

第二節(jié)正態(tài)分布的應(yīng)用6笫九章秩和檢驗(yàn)34

第四章總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)7第一節(jié)配對(duì)設(shè)計(jì)和單樣本資料的符號(hào)秩和

第一節(jié)抽樣研究與抽樣誤差7檢驗(yàn)34

第二節(jié)[分布9第二節(jié)完全隨機(jī)化設(shè)計(jì)兩獨(dú)立樣本的秩和檢

第三節(jié)總體均數(shù)的估計(jì)9驗(yàn)35

第四節(jié)假設(shè)臉驗(yàn)的根本步驟10第三節(jié)完全隨機(jī)化設(shè)計(jì)多組獨(dú)立樣本的秩和

第五節(jié)樣本與總體比擬的假設(shè)檢驗(yàn)|1檢驗(yàn)36

第六節(jié)配對(duì)設(shè)計(jì)(paireddesign)資料的假設(shè)第四節(jié)隨機(jī)化區(qū)組設(shè)計(jì)資料的秩和檢驗(yàn)37

檢驗(yàn)II第五節(jié)多個(gè)樣本間的多重比擬38

第七節(jié)兩樣本比擬的假設(shè)檢驗(yàn)12第六節(jié)小結(jié)40

第八節(jié)第一類錯(cuò)誤與第二類錯(cuò)誤12第十章直線回歸與相關(guān)40

第五章方差分析13笫一節(jié)直線回歸41

第一節(jié)方差分析的根本思想13第二十直線相關(guān)分析45

第二節(jié)完全隨機(jī)設(shè)計(jì)的單因素方差分析第三節(jié)等級(jí)相關(guān)47

(one-wayANOVA)15笫四節(jié)曲線擬合48

第三節(jié)隨機(jī)區(qū)組設(shè)計(jì)的兩因素方差分析第十二章統(tǒng)計(jì)表和統(tǒng)計(jì)圖49

(two-wayANOVA)16第十三章實(shí)驗(yàn)設(shè)計(jì)51

第四節(jié)多個(gè)樣本均數(shù)間的多重比擬18第一節(jié)實(shí)驗(yàn)設(shè)計(jì)的特點(diǎn)及分類52

第第二節(jié)實(shí)驗(yàn)

五口設(shè)計(jì)的根本

節(jié)2023/10/4要素52

多第三節(jié)實(shí)驗(yàn)

設(shè)計(jì)的根本原那么53第三節(jié)常用的抽樣方法64

第四節(jié)常用的實(shí)驗(yàn)設(shè)計(jì)方法60第四節(jié)調(diào)查的質(zhì)量控制65

第十四章調(diào)查設(shè)計(jì)63第十五章醫(yī)學(xué)人口統(tǒng)計(jì)學(xué)與疾病統(tǒng)計(jì)常用指標(biāo)65

第一節(jié)調(diào)查研究的特點(diǎn)63第一節(jié)醫(yī)學(xué)人匚統(tǒng)計(jì)常用指標(biāo)65

第二節(jié)調(diào)查設(shè)計(jì)的根本原那么與內(nèi)容64第二節(jié)疾病統(tǒng)計(jì)常用指標(biāo)67

第一章緒論

學(xué)時(shí)分配:2學(xué)時(shí)

掌握內(nèi)容:

1、衛(wèi)生統(tǒng)計(jì)學(xué)的定義

2、統(tǒng)計(jì)工作的步驟

3、統(tǒng)計(jì)學(xué)中的幾個(gè)根本概念

4、學(xué)習(xí)衛(wèi)生統(tǒng)計(jì)學(xué)應(yīng)注意的問(wèn)題

了解內(nèi)容:衛(wèi)生統(tǒng)計(jì)學(xué)的內(nèi)容

第一節(jié)衛(wèi)生統(tǒng)計(jì)學(xué)的定義和內(nèi)容

I、II生統(tǒng)計(jì)學(xué)的定義

統(tǒng)計(jì)學(xué)(statistics)是研究數(shù)據(jù)的收集、整理和分析的一門科學(xué),幫助人們分析所占有的信息,到達(dá)去偽存

真、去粗取精、正確認(rèn)識(shí)世界的一種重要手段。

衛(wèi)生統(tǒng)計(jì)學(xué)(healthstatistics)是應(yīng)用數(shù)統(tǒng)計(jì)學(xué)的原理與方法研究居民健康狀況以及衛(wèi)生效勞領(lǐng)域中數(shù)據(jù)的

收集、整理和分析的一門科學(xué)。

Webster國(guó)際大辭典(第三版)對(duì)統(tǒng)計(jì)學(xué)的定義是“asciencedealingwiththecollection,analysis,interpretation

andpresentationofnumericaldata"。LastJM主編的一本流行病學(xué)辭典對(duì)統(tǒng)計(jì)學(xué)的定義是“thescienceandartof

dealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliable

results"。由此看出:統(tǒng)計(jì)學(xué)是處理資料中變異性的科學(xué)和藝術(shù),是在收集、歸類、分析和解釋大量數(shù)據(jù)的過(guò)

程中獲取可靠結(jié)果的一門學(xué)科。這里強(qiáng)調(diào)了“過(guò)程",但在實(shí)際工作中,許多人往往是忽略了設(shè)計(jì)、收集和歸類

(整理),到了分析數(shù)據(jù)時(shí)才想到統(tǒng)計(jì)學(xué),此時(shí)難免發(fā)生“悔之晚矣”的憾事。作為統(tǒng)計(jì)學(xué)的應(yīng)用者應(yīng)充分認(rèn)識(shí)到

這一點(diǎn)。

2、衛(wèi)生統(tǒng)計(jì)學(xué)的內(nèi)容:

I)健康統(tǒng)計(jì):醫(yī)學(xué)人口統(tǒng)計(jì)、疾病統(tǒng)計(jì)和生長(zhǎng)發(fā)育統(tǒng)計(jì)等;

2)衛(wèi)生效勞統(tǒng)計(jì):包括衛(wèi)生資源利用、醫(yī)療衛(wèi)生效勞的需求、醫(yī)療保健體制改革等方面的統(tǒng)計(jì)學(xué)問(wèn)題。

在教材的主要內(nèi)容為:

1)衛(wèi)生統(tǒng)計(jì)學(xué)的根本原理和方法:包括統(tǒng)計(jì)描述(定量資料和分類資料的描述性指標(biāo)以及常用統(tǒng)計(jì)圖表)、

常見(jiàn)的理論分布及其應(yīng)用(正態(tài)分布、二項(xiàng)分布與Poisson分布)、總體參數(shù)的估計(jì)(分總體均數(shù)、總體率和總

體平均數(shù))、假設(shè)檢驗(yàn)。檢驗(yàn)、〃檢驗(yàn)、方差分析、/檢驗(yàn)、秩和槍驗(yàn)等)、回歸與相關(guān)、多元線性回歸與logislic

回歸、實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì)(第2?第14章);

2)健康統(tǒng)計(jì):醫(yī)學(xué)人口與疾病統(tǒng)計(jì)中常用的指標(biāo)(第15章)、壽命表(第16章)、生存率分析(第17章);

3)常用的綜合評(píng)價(jià)方法(第18章)。

第二節(jié)統(tǒng)計(jì)工作的步驟

統(tǒng)計(jì)學(xué)對(duì)統(tǒng)計(jì)工作的全過(guò)程起指導(dǎo)作用,任何統(tǒng)計(jì)工作和統(tǒng)計(jì)研究的全過(guò)程都可分為以下四個(gè)步驟:

1、設(shè)計(jì)(design):在進(jìn)行統(tǒng)計(jì)工作和研究工作之前必須有一個(gè)周密的設(shè)計(jì)。設(shè)計(jì)是在廣泛查閱文獻(xiàn)、全面

了解現(xiàn)狀、充分征詢意見(jiàn)的根底上,對(duì)將要進(jìn)行的研究工作所做的全面設(shè)想。其內(nèi)容包括:明確研究目的和研究

假說(shuō),確定觀察對(duì)象、觀察單位、樣本含量和抽樣方法,擬定研究方案、預(yù)期分析指標(biāo)、誤差控制措施、進(jìn)度與

費(fèi)用等。設(shè)計(jì)是整個(gè)研究工作中最關(guān)鍵的一環(huán),也是指導(dǎo)以后工作的依據(jù)(詳見(jiàn)第13、14章)。

2、收集資料(collection):遵循統(tǒng)計(jì)學(xué)原理采取必要措施得到準(zhǔn)確可靠的原始資料。及時(shí)、準(zhǔn)確、完整是收

集統(tǒng)計(jì)資料的根本原那么。衛(wèi)生工作中的統(tǒng)計(jì)資料主要來(lái)自以下三個(gè)方面:①統(tǒng)計(jì)報(bào)表:是由國(guó)家統(tǒng)?設(shè)計(jì),有

關(guān)醫(yī)療衛(wèi)生機(jī)構(gòu)定期逐級(jí)上報(bào),提供居民健康狀況和醫(yī)療衛(wèi)生機(jī)構(gòu)工作的主要數(shù)據(jù),是制定衛(wèi)生工作方案與措施、

檢查與總結(jié)工作的依據(jù)。如法定傳染病報(bào)表,職業(yè)病報(bào)表,醫(yī)院工作報(bào)表等。②經(jīng)常性工作記錄:如衛(wèi)生監(jiān)測(cè)記

錄、健康檢查記錄等。③專題調(diào)查或?qū)嶒?yàn)。

3、整理資料(sortingdata):收集來(lái)的資料在整理之前稱為原始資料,原始資料通常是一堆雜亂無(wú)章的數(shù)據(jù)。

整理資料的目的就是通過(guò)科學(xué)的分組和歸納,使原始資料系統(tǒng)化、條理化,便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和分析。其

過(guò)程是:首先對(duì).原始資料進(jìn)行準(zhǔn)確性審查(邏輯審查與技術(shù)審查)和完整性審查;再擬定整理表,按照“同質(zhì)者

合并,非同質(zhì)者分開(kāi)”的原那么對(duì)資料進(jìn)行質(zhì)量分組,并在同質(zhì)根底上根據(jù)數(shù)值大小進(jìn)行數(shù)量分組;最后匯總歸

納。

4、分析資料(analysisofdata):其目的是計(jì)算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特征,說(shuō)明事物的內(nèi)在聯(lián)系和規(guī)律。

統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述(descriptivestatistics)和統(tǒng)計(jì)推斷(inferentialstatistics)o前者是用統(tǒng)計(jì)指標(biāo)與統(tǒng)計(jì)圖(表)

等方法對(duì)樣本資料的數(shù)量特征及其分布規(guī)律進(jìn)行描述1詳見(jiàn)第2、6、12章);后者是指如何抽樣,以及如何用樣

本信息推斷總體特征(詳見(jiàn)第4、5、7、8、9、10、II、17、18章)。進(jìn)行資料分析時(shí),需根據(jù)研究目的、設(shè)計(jì)

類型和資料類型選擇恰當(dāng)?shù)拿枋鲂灾笜?biāo)和統(tǒng)計(jì)推斷方法。

統(tǒng)計(jì)工作的四個(gè)步驟緊密相連、不可分割,任何一步的缺陷,都將影響整個(gè)研究結(jié)果。

第三節(jié)統(tǒng)計(jì)學(xué)中的幾個(gè)根本概念

1、同質(zhì)[homogeneity)與變異(variation)

嚴(yán)格地講,同質(zhì)是指被研究指標(biāo)的影響因素完全相同。但在醫(yī)學(xué)研究中,有些影響因素往往是難以控制的(如

遺傳、營(yíng)養(yǎng)等),甚至是未知的。所以,在統(tǒng)計(jì)學(xué)中常把同質(zhì)理解為對(duì)研究指標(biāo)影響較大的、可以控制的主要因

素盡可能相同。例如研究?jī)和纳砀邥r(shí),要求性別、年齡、民族、地區(qū)等影響身高較大的、易控制的因素要相同,

而不易控制的遺傳、營(yíng)養(yǎng)等影響因素可以忽略。

同質(zhì)根底上的個(gè)體差異稱為變異。如同性別、同年齡、同民族、同地區(qū)的健康兒童的身高、體重不盡相同。

事實(shí)上,客觀世界充滿了變異,生物醫(yī)學(xué)領(lǐng)域更是如此。哪里有變異,哪里就需要統(tǒng)計(jì)學(xué)。假設(shè)所研究的同質(zhì)群

體中所有個(gè)體一模一樣,只需觀察任一個(gè)體即可,無(wú)須進(jìn)行統(tǒng)計(jì)研究。

2、總體[population)與樣本(sample)

任何統(tǒng)計(jì)研究都必須首先確定觀察質(zhì)位(observedunit),亦稱個(gè)體(individual)o觀察單位是統(tǒng)計(jì)研究,中最

根本的單位,可以是一個(gè)人、一個(gè)家庭、一個(gè)地區(qū)、一個(gè)樣品、一個(gè)采樣點(diǎn)等。

總體是根據(jù)研究目確實(shí)定的同質(zhì)觀察單位的全體,或者說(shuō),是同質(zhì)的所有觀察單位某種觀察值(變量值)的

集合。例如欲研究山東省2002年7歲健康男孩的身高,那么,觀察對(duì)象是山東省2002年的7歲健康男孩,觀察

單位是每個(gè)7歲健康男孩,變量是身高,變量值(觀察值)是身高測(cè)量值,那么山東省2002年全體7歲健康男

孩的身高值構(gòu)成一個(gè)總體。它的同質(zhì)根底是同地區(qū)、同年份、同性別、同為健康兒童??傮w又分為有限總體(finite

population)和無(wú)限總體(infinitepopulation)?有限總體是指在某特定的時(shí)間與空間范圍內(nèi),同質(zhì)研究對(duì)象的所

有觀察單位的某變量值的個(gè)數(shù)為有限個(gè),如上例;無(wú)限總體是抽象的,無(wú)時(shí)間和空間的限制,觀察單位數(shù)是無(wú)限

的,如研究碘鹽對(duì)缺碘性甲狀腺病的防治效果,該總體的同質(zhì)根底是缺碘性甲狀腺病患者,同用碘鹽防治:該總

體應(yīng)包括已使用和設(shè)想使用碘鹽防治的所有缺碘性甲狀腺病患者的防治效果,沒(méi)有時(shí)間和空間范用的限制,因而

觀察單位數(shù)無(wú)限,該總體為無(wú)限總體。

在實(shí)際工作中,所要研究的總體無(wú)論是有限的還是無(wú)限的,通常都是采用抽樣研究。樣本是按照隨機(jī)化原那

么,從總體中抽取的有代表性的局部觀察單位的變量值的集合。如從上例的有限總體(山東省2002年7歲健康

男孩)中,按照隨機(jī)化原那么抽取100名7歲健康男孩,他們的身高值即為樣本。從總體中抽取樣本的過(guò)程為抽

樣,抽樣方法有多種,詳見(jiàn)第14章,抽樣研究的目的是用樣本信息推斷總體特征。

統(tǒng)計(jì)學(xué)好比是總體與樣本間的橋梁,能幫助人們?cè)O(shè)計(jì)與實(shí)施如何從總體中科學(xué)地抽取樣本,使樣本中的觀察

單位數(shù)(亦稱樣本含量,samplesize)恰當(dāng),信息豐富,代表性好:能幫助人們挖掘樣本中的信息,推斷總體的

規(guī)律性。

3、資料(data)與變量(variable)及其分類

總體確定之后,研究者應(yīng)對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量或觀察,特征稱為變量。如“身高”、"體重〃、

“性別"、"血型"、“療效”等。變量的測(cè)定值或觀察值稱為變量值(valueofvariable)或觀察值(observedvalue),

亦稱為資料。

按變量的值是定量的還是定性的,可將變量分為以下類型,變量的類型不同,其分布規(guī)律亦不同,對(duì)它們采

用的統(tǒng)計(jì)分析方法也不同。在處理資料之前,首先要分清變量類型。

1)數(shù)值變量(numericalvariable):其變量值是定量的,表現(xiàn)為數(shù)值大小,可經(jīng)測(cè)量取得數(shù)值,多有度量衡

單位。如身高(cm)、體重(kg)、血壓(mmHgkPa)、脈搏(次/min)和白細(xì)胞計(jì)數(shù)(xlO9/D等。這種由數(shù)

值變鼠的測(cè)顯值構(gòu)成的資料稱為數(shù)值變量資料,亦稱為定晟?資料(quantitativedata)o大多數(shù)的數(shù)值變量為連續(xù)

型變量,如身高、體重、血壓等;而有的數(shù)值變量的測(cè)定值只能是正整數(shù),如脈搏、白細(xì)胞計(jì)數(shù)等,在醫(yī)學(xué)統(tǒng)

計(jì)學(xué)中把它們也視為連續(xù)型變量。

2)分類變量(catagoricalvariable):其變量值是定性的,表現(xiàn)為互不相容的類別或?qū)傩?。分類變量可分為無(wú)

序變量和有序變量?jī)深悾?/p>

(1)無(wú)序分類變量(unorderedcategoricalvariable)是指所分類別或?qū)傩灾g無(wú)程度和順序的差異。,它又

可分為①二項(xiàng)分類,如性別(男、女),藥物反響(陰性和陽(yáng)性)等;②多項(xiàng)分類,如血型(O、A、B、AB),

職業(yè)(工、農(nóng)、商、學(xué)、兵)等。對(duì)于無(wú)序分類變量的分析,應(yīng)允按類別分組,清點(diǎn)各組的觀察單位數(shù),編制

分類變量的頻數(shù)表,所得資料為無(wú)序分類資料,亦稱計(jì)數(shù)資料。

(2)有序分類變量(ordinalcategoricalvariable)各類別之間有程度的差異。如尿糖化驗(yàn)結(jié)果按一、土、+、

++、+++分類;療效按治愈、顯效、好轉(zhuǎn)、無(wú)效分類。對(duì)于有序分類變量,應(yīng)先按等級(jí)順序分組,清點(diǎn)各

組的觀察單位個(gè)數(shù),編制有序變量:各等級(jí))的頻數(shù)表,所得資料稱為等級(jí)資料。

變量類型不是一成不變的,根據(jù)研究H的的需要,各類變量之間可以進(jìn)行轉(zhuǎn)化。例如血紅蛋白量(g/L)原

屬數(shù)值變量,假設(shè)按血紅蛋白正常與偏低分為兩類時(shí),可按二項(xiàng)分類資料分析;假設(shè)按重度貧H1、中度貧血、

輕度苗血、正常、血紅率白增高分為五個(gè)等級(jí)時(shí),可按等級(jí)資料分析。有時(shí)亦可將分類資料數(shù)后化,如可將病

人的惡心反響以0、1、2、3表示,那么可按數(shù)值變量資料[定量資料)分析。

4、隨機(jī)事件(randomevent)與概率(probability)

醫(yī)學(xué)研究的現(xiàn)象,大多數(shù)是隨機(jī)現(xiàn)象,對(duì)隨機(jī)現(xiàn)象進(jìn)行實(shí)驗(yàn)或觀察稱為隨機(jī)試驗(yàn)。隨機(jī)試驗(yàn)的各種可能結(jié)果

的集合稱為隨機(jī)事件,亦稱偶然事件,簡(jiǎn)稱事件。例如用相同治療方案治療一批某病的患者,治療轉(zhuǎn)歸可能為治

頻數(shù)分布有對(duì)稱分布和偏態(tài)分布之分。對(duì)稱分布是指多數(shù)頻數(shù)集中在中央位置,兩端的頻數(shù)分布大致對(duì)稱。

偏態(tài)分布是指頻數(shù)分布不對(duì)稱,集中位置偏向一側(cè),假設(shè)集中位置偏向數(shù)值小的一側(cè),稱為正偏態(tài)分布;集中位

置偏向數(shù)值大的一側(cè),稱為負(fù)偏態(tài)分布,如冠心病、大多數(shù)惡性腫解等慢性病患者的年齡分布為負(fù)偏態(tài)分布。臨

床上E偏態(tài)分布資料較多見(jiàn)。不同的分布類型應(yīng)選用不同的統(tǒng)計(jì)分析方法。

4.頻數(shù)表的用途

可以揭示資料分布類型和分布特征,以便選取適當(dāng)?shù)慕y(tǒng)計(jì)方法;便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理;便于發(fā)現(xiàn)

某些特大或特小的可疑值。

第二節(jié)集中趨勢(shì)的統(tǒng)計(jì)描述指標(biāo)

描述一組同質(zhì)觀察值的平均水平或中心位置的常用指標(biāo)有均數(shù)、幾何均數(shù)、中位數(shù)等。

1.均數(shù)[mean,average):是算術(shù)均數(shù)(arithmeticmean)的簡(jiǎn)稱。常用X表示樣本均數(shù),〃表示總體均

數(shù)。均數(shù)用于反映一組同質(zhì)觀察值的平均水平,適用于正態(tài)或近似正態(tài)分布的數(shù)值變量資料。其計(jì)算方法有:

(1)直接法:用干樣本含量較少時(shí),其公式為:

q=…X”(2J)

nn

式中,希臘字母E(讀作sigma)表示求和;X,X2,…,K為各觀察值;〃為樣本含量,即觀察值的個(gè)數(shù)。

(2)加權(quán)法(weighingmethod):用于頻數(shù)表資料或樣本中相同觀察值較多時(shí),其公式為:

j笠優(yōu):二小野四-

式中,X”X2,...?Xk與力,力,…,次分別為頻數(shù)表資料中各組段的組中值和相應(yīng)組段的頻數(shù)(或相同觀察

值與其對(duì)應(yīng)的頻數(shù))。

2.幾何均數(shù)(geometricmean)用G表示,適用于①對(duì)數(shù)正態(tài)分布,即數(shù)據(jù)經(jīng)過(guò)對(duì)數(shù)變換后呈正態(tài)分布的

資料;②等比級(jí)數(shù)資料,即觀察值之間呈倍數(shù)或近似倍數(shù)變化的資料。如醫(yī)學(xué)實(shí)踐中的抗體滴度、平均效價(jià)等。

其計(jì)算方法有

(I)直接法:

或G=IgT(虻上電X"…+電X")=igT(Z蛀)(2.3)

nn

(2)加權(quán)法:

G也怔"泮戶+…/"—鑼).J

/+人+.??.+/工f

注意;計(jì)算幾何均數(shù)時(shí)觀察值中不能有0,因0不能取對(duì)數(shù);一組觀察值中不能同時(shí)有正或負(fù)值。

3.中位數(shù)(median)用M表示。中位數(shù)是一組由小到大按順序排列的觀察值中位次居中的數(shù)值。中位數(shù)

可用于描述①非正態(tài)分布資料(對(duì)數(shù)正態(tài)分布除外);②頻數(shù)分布的一端或兩端無(wú)確切數(shù)據(jù)的資料③總體分布不

清楚的資料。在全部觀察中,小于和大于中位數(shù)的觀察值個(gè)數(shù)相等。

(I)直接法:將觀察值由小到大排列,按式(2.6)或式(2.7)計(jì)算。

〃為奇數(shù),M=X(,J+1)/2(1.5)

”為偶數(shù),M=?(X“+X”)(1.6)

2J”

式中下標(biāo)二、巴+i、Ml為有序數(shù)列的位次。X“+1、X,、X“為相應(yīng)位次的觀察值。

222(爭(zhēng)9出)

(2)頻數(shù)表法:用于頻數(shù)表資料。

計(jì)算步驟是:①計(jì)算卷的大小,并按所分組段由小到大計(jì)算累計(jì)頻數(shù)和累計(jì)頻率,如表2.1第(3)、(4)欄;

②確定”所在組段。累計(jì)頻數(shù)中大于5的最小數(shù)值所在的組段即為M所在的組段;或累計(jì)頻率中大于50%的

最小頻率所在的組段即為M所在的組段。③按式(2.7)求中位數(shù)M°

用"十六(/匕)(2.7)

JM乙

式中:/.、i、九分別為歷所戶組段的下限、組距和頻數(shù):Z/乙為小于/.的各組段的累計(jì)頻數(shù)C

例1.1由表2.1計(jì)算中位數(shù)M。

表2.1199名食物中毒患者潛伏期的M和Px的計(jì)算

潛伏期〔小時(shí))人數(shù)/累計(jì)頻數(shù)Z/累計(jì)頻率(%)

(1)(2)(3)(4)=(3)/〃

()?303015.1

12?7110150.8

24?4915075.4

36?2817889.4

48?1419296.5

60?619899.5

72?841199100.0

合計(jì)199

木例〃=199,根據(jù)表2.3第⑵欄數(shù)據(jù),自上而下計(jì)算累計(jì)頻數(shù)及累計(jì)頻率,見(jiàn)第(3)、(4)欄。3=99.5,

由第⑶欄知,101是累計(jì)頻數(shù)中大于99.5的最小值,或由第(4)欄知50.8%是大于50%的最小的累計(jì)頻

率,故M在“12?”組段內(nèi),將相應(yīng)的L、八/0、Z力.代入(2.8),求得M。

M=P5O=£+—(/7.50%-4)=12+12/71(199x50%-30)=23.75(小時(shí))

J50

4.百分位數(shù)(percentile)用Px表示。一個(gè)百分位數(shù)Px將一組觀察值分為兩局部,理論上有X%的觀察

值比它小,有(100-X)%的觀察值比它大,是一種位置指標(biāo)。中位數(shù)是一個(gè)特定的百分位數(shù),即M=P50。

百分位數(shù)的計(jì)算步驟與中位數(shù)類似,首先要確定Px所在的組段。先計(jì)算〃?》%,累計(jì)頻數(shù)中大于〃的

最小值所在的組段就是Px所在組段。計(jì)算見(jiàn)公式(2.8)。

Px=L4-(n.X%—^//)(2.8)

Jx

式中:L、i、八分別為Px圻在組段的下限、組距和頻數(shù);為小于L的各組段的累計(jì)頻數(shù)。

百分位數(shù)用丁?描述組數(shù)據(jù)某百分位位置的水平,多個(gè)百分位數(shù)的結(jié)合應(yīng)用時(shí),可描述組觀察值的

分布特征;百分位數(shù)可用于確定非正態(tài)分布資料的醫(yī)學(xué)參考值范圍。應(yīng)用百分位數(shù),樣本含量要足夠大,否

那么不宜取靠近兩端的百分位數(shù)。

第三節(jié)離散程度的統(tǒng)計(jì)描述指標(biāo)

描述數(shù)值變量資料頻數(shù)分布的另一主要特征是離散程度,用變異指標(biāo)表示。只有把集中指標(biāo)和離散指標(biāo)結(jié)合

起來(lái)才能全面反映資料的分布特征。常用變異指標(biāo)有全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。

1.全距(range,簡(jiǎn)記為R):亦稱極差,是一組同質(zhì)觀察值中最大值與最小值之差。它反映了個(gè)體差異的范

圍,全距大,說(shuō)明變異度大;反之,全距小,說(shuō)明變異度小。用全距描述定量資料的變異度大小,雖然計(jì)算簡(jiǎn)單,

但缺乏之處有:①只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;②樣本含量越大,抽到較

大或較小觀察值的可能性越大,那么全距可能越大。因此樣本含量相差懸殊時(shí)不宜用全距比擬。

2.四分位數(shù)間距(quartile,簡(jiǎn)記為。):為上四分位數(shù)如(即P75)與下四分位數(shù)QL(即25)之差。四分位

數(shù)間距可看成是中間50%觀察值的極差,其數(shù)值越大,變異度越大,反之,變異度越小。如例2.7中,已求得

如=85=35.82小時(shí),QL=P25=15.34小時(shí),那么四分位數(shù)間距QU-QL==35.82-15.34=20.48(小時(shí))。由于四分位數(shù)

間距不受兩端個(gè)別極大值或極小值的影響,因而四分位數(shù)間距較全距穩(wěn)定,但仍未考慮全部觀察道的變異度,常

用于描述偏態(tài)頻數(shù)分布以及分布的一端或兩端無(wú)確切數(shù)值資料的離散程度。

3.方差(variance):為了全面考慮觀察值的變異情況,克服全距和四分位數(shù)間距的缺點(diǎn),需計(jì)算總體中每

個(gè)觀察值X與總體均數(shù)〃的差值(X-〃),稱之為離均差。由于Z(X-")=0,不能反映變異度的大小,而用離均差平

方和£(X-p)2(sumofsquaresofdeviationsfrommean)反映之,同時(shí)還應(yīng)考慮觀察值個(gè)數(shù)N的影響,故用式(2.9)

即總體方差,表示。

一—*2.9)

N

在實(shí)際工作中,總體均數(shù)p往往是未知的,所以只能用樣本均數(shù)X作為總體均數(shù)〃的估計(jì)值,即用

工(乂一9)2代替工(乂一〃)2,用樣本例數(shù)〃代替M但再按式(2.9)計(jì)算的結(jié)果總是比實(shí)際b?小。英國(guó)統(tǒng)

計(jì)學(xué)家W.S.Gosset提出用代替“來(lái)校正,這就是樣本方差其公式為:

,y(x-x)2

S2---------------(2.10)

n-1

式中的1稱為自由度(degreeoffreedom)。

4.標(biāo)準(zhǔn)差(standarddeviation):方差的度量單位是原度量單;立的平方,將方差開(kāi)方后與原數(shù)據(jù)的度量單位

相同。標(biāo)準(zhǔn)差大,表示觀察值的變異度大;反之,標(biāo)準(zhǔn)差小,表示觀察值的變異度小。計(jì)算見(jiàn)公式(2.11)和(2.12)。

Z(x-〃)

CT=(1.11)

n

Z(x-G)2

s=(M2)

n-\

離均差平方和Z(x-》)2常用ss或儀〉:表示。數(shù)學(xué)上可以證明:

SS=,xx=Z(X—刈2=2>2-所以,樣本標(biāo)準(zhǔn)差的計(jì)算公式可寫(xiě)成:

直接法:s=]—〃(2.13)

n-l

■y僅2(Z#)2

加權(quán)法:

S(1.14)

5.變異系數(shù)(coefficientofvariation,簡(jiǎn)記為CV):常用于比擬度量單位不同或均數(shù)相差懸殊的兩組或多組資

料的變異度。其公式為

CV=JX100%(2.15)

(丁守鑾)

第三章正態(tài)分布及其應(yīng)用

學(xué)時(shí)分配:2學(xué)時(shí)

掌握內(nèi)容:

I、正態(tài)分布的概念、特征和標(biāo)準(zhǔn)正態(tài)分布

2、正態(tài)分布的應(yīng)用

第一節(jié)正態(tài)分布的概念和特征

一、正態(tài)分布的概念

日表1.1的頻數(shù)表資料所繪制的直方圖,圖3.1(1)可以看出,頂峰位于中部,左右兩側(cè)大致對(duì)稱。我們?cè)O(shè)

想,如果觀察例數(shù)逐漸增多,組段不斷分細(xì),直方圖頂端的連線就會(huì)逐漸形成一條頂峰位于中央(均數(shù)所在處),

兩側(cè)逐漸降低且左右對(duì)稱,不與橫軸相交的光滑曲線圖3.1(3)。這條曲線稱為頻數(shù)曲線或頻率曲線,近似于數(shù)

學(xué)上的正態(tài)分布(normaldistribution)e由于頻率的總和為100%或1,故該曲線下橫軸上的面積為100%或1。

⑴⑵

圖3.1頻數(shù)分布逐漸接近正態(tài)分布示意圖

為了應(yīng)用方便,常對(duì)正態(tài)分布變量X作變量變換。

X—,

u=-------(3.1)

(T

該變換使原來(lái)的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布(standardnonnaldistribution),亦稱〃分布?!北环Q為標(biāo)準(zhǔn)正

態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差(standaidiiminaldeviate)?

二、正態(tài)分布的特征:

1.正態(tài)曲線(normalcune)在橫軸上方均數(shù)處最高。

2.正態(tài)分布以均數(shù)為中心,左右對(duì)稱。

3.正態(tài)分布有兩個(gè)參數(shù),即均數(shù)〃和標(biāo)準(zhǔn)差〃是位置參數(shù),當(dāng)C固定不變時(shí),〃越大,曲線沿橫軸

越向右移動(dòng);反之,〃越小,那么曲線沿橫軸越向左移動(dòng)。。是形狀參數(shù),當(dāng)〃固定不變時(shí),。越大,曲線越

平闊;。越小,曲線越尖峭。通常月N(〃,b2)表示均數(shù)為〃,方差為的正態(tài)分布。用N(0,1)表示標(biāo)準(zhǔn)

正態(tài)分布。

4.正態(tài)曲線下面積的分布有一定規(guī)律。

實(shí)際工作中,常需要了解正態(tài)曲線下橫軸上某一區(qū)間的面積占總面積的百分?jǐn)?shù),以便估計(jì)該區(qū)間的例數(shù)占總

例數(shù)的百分?jǐn)?shù)(頻數(shù)分布)或觀察值落在該區(qū)間的概率。正態(tài)曲線卜.一定區(qū)間的面積可以通過(guò)附表1求得。對(duì)于

正態(tài)或近似正態(tài)分布的資料,均數(shù)和標(biāo)準(zhǔn)差,就可對(duì)其頻數(shù)分布作出概約估計(jì)。

宜附表1應(yīng)注意:①表中曲線下面積為-8到〃的左側(cè)累呼積;②當(dāng)jo和X時(shí)先按式(3.1)求得〃值,

再查表,當(dāng)卜、。未知且樣本含量〃足夠大時(shí),可用樣本均數(shù)亍和標(biāo)準(zhǔn)差5分別代替卜i和。,按〃=(X-》)/s

式求得〃值,再查表;③曲線下對(duì)稱于。的區(qū)間面積相等,如區(qū)間(-00,-1.96)與區(qū)間(1.96,00)的面積相等,

④曲線下橫軸上的總面積為100%或1。

E態(tài)分布曲線下有三個(gè)區(qū)間的面枳應(yīng)用較多,應(yīng)熟記:①標(biāo)準(zhǔn)正態(tài)分布時(shí)區(qū)間(-1,1)或正態(tài)分布時(shí)區(qū)間

3-10山+1。)的面積占總面積的68.27%;②標(biāo)準(zhǔn)正態(tài)分布時(shí)區(qū)間(-1.96,1.96)或正態(tài)分布時(shí)區(qū)間(的1.96叫+1.96G)

的面積占總面積的95%;③標(biāo)準(zhǔn)正態(tài)分布時(shí)區(qū)間(-2.58258)或正態(tài)分布時(shí)區(qū)間(M-2.58O^+2.58O)的面積占總

面積的99%。如圖3.2所示。

圖3.2正態(tài)曲線與標(biāo)準(zhǔn)正態(tài)曲線的面積分布

第二節(jié)正態(tài)分布的應(yīng)用

某些醫(yī)學(xué)現(xiàn)象,如同質(zhì)群體的身高、紅細(xì)胞數(shù)、血紅蛋白量、膽固醇等,以及實(shí)驗(yàn)中的隨機(jī)誤差,呈現(xiàn)為正

態(tài)或近似正態(tài)分布:有些資料雖為偏態(tài)分布,但經(jīng)數(shù)據(jù)變換后可成為正態(tài)或近似正態(tài)分布,故可按正態(tài)分布規(guī)律

處理。

I.估計(jì)正態(tài)分布資料的頻數(shù)分布

例1.10某地1993年抽樣調(diào)查了100名18歲男大學(xué)生身高(cm),其均數(shù)=172.70cm,標(biāo)準(zhǔn)差s=4.01cm,①

估計(jì)該地18歲男大學(xué)生身高在168cm以下者占該地18歲男大學(xué)生總數(shù)的百分?jǐn)?shù);②分別求又±卜、無(wú)±1.96$、

5±2.58s范圍內(nèi)18歲男大學(xué)生占該地18歲男大學(xué)生總數(shù)的實(shí)際股數(shù),并與理論百分?jǐn)?shù)比擬。

在例,〃、。未知但樣本含量"較大,按式(3.1)用樣本均數(shù)歹和標(biāo)準(zhǔn)差S分別代替〃和求得〃值,

w=(163-172.70)/4.01=-I.l7o查附表標(biāo)準(zhǔn)正態(tài)曲線下的面積,在表的左側(cè)找到-1.1,表的上方找到0.07,兩者相交

處為0.1210=12.10%。該地18歲男大學(xué)生身高在168cm以下者,約占總數(shù)12.10%。其它計(jì)算結(jié)果見(jiàn)表3.1。

表3.1100名18歲男大學(xué)生身高的實(shí)際分布與理論分布

實(shí)際分布

身高范圍(cm)-理論分布(%)

X±s人數(shù)百分?jǐn)?shù)(%)

X±\s168.69~176.716767.0068.27

X±1.965164.84—180.569595.0095.00

X±2.585162.35?183.059999.0099.00

2.制定醫(yī)學(xué)參考值范圍:亦稱醫(yī)學(xué)正常值范圍。它是指所謂“正常人”的解剖、生理、生化等指標(biāo)的波動(dòng)范

闈。制定正常值范圍時(shí),首先要確定一批樣本含量足夠大的“正常人”,所謂"正常人”不是指"健康人〃,而是

指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群;其次需根據(jù)研究目的和使用要求選定適當(dāng)?shù)陌俜纸缰担?/p>

如80%,90%,95%和99%,常用95%;根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值,如白細(xì)胞計(jì)數(shù)過(guò)高過(guò)低皆屬

不正常須確定雙側(cè)界值,又如肝功中轉(zhuǎn)氨酶過(guò)高屬不正常須確定單惻上界,肺活量過(guò)低屬不正常須確定單側(cè)下界。

另外,還要根據(jù)資料的分布特點(diǎn),選用恰當(dāng)?shù)挠?jì)算方法。常用方法有:

(1)正態(tài)分至法:適用于正態(tài)或近似些態(tài)分布的資料。

雙側(cè)界值:X±uaS單側(cè)上界:X+uaS,或單側(cè)下界:X-uaS

(2)對(duì)數(shù)正態(tài)分坐法:適用于對(duì)數(shù)正態(tài)分布資料。__

雙側(cè)界值:lgT*g.”土〃HgJ;單側(cè)上界:lgT*"+/S*),或單側(cè)下界:IgT(凡1―愴J。

常用〃值可根據(jù)要求由表3.2查出。

(3)百分位數(shù)法:常用于偏態(tài)分布資料以及資料中一端或兩端無(wú)確切數(shù)值的資料。

雙側(cè)界值:。2.5和^97.5;單側(cè)上界:。95,或單側(cè)卜界:25。

表3.2常用〃值表

參考值范圍(%)單側(cè)雙側(cè)

800.8421.282

901.2821.645

951.6451.960

992.3262.576

3.正態(tài)分布是許多統(tǒng)計(jì)方法的理論根底:如,分布、廠分布、/分布都是在正態(tài)分布的根底上推導(dǎo)出來(lái)的,

〃檢驗(yàn)也是以正態(tài)分布為根底的。此外,/分布、二項(xiàng)分布、Poisson分布的極限為正態(tài)分布,在一定條件下,可

以按正態(tài)分布原理來(lái)處理。

(丁守鑾)

第四章總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)

學(xué)時(shí)分配:8學(xué)時(shí)

掌握內(nèi)容:

1./分布的概念和特征

2.總體均數(shù)的區(qū)間估計(jì)

3.總體率的區(qū)間估計(jì)

4.假設(shè)檢驗(yàn)的根本步驟

5.假設(shè)檢驗(yàn)的根本原理

6.常用的數(shù)值型變量假設(shè)檢驗(yàn)的方法

熟悉:1、抽樣誤差的概念

2、引起抽樣誤差的原因

3、均數(shù)、率的標(biāo)準(zhǔn)誤的計(jì)算

4、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別

了解內(nèi)容:

1.假設(shè)檢驗(yàn)中概率P與檢驗(yàn)水準(zhǔn)a的關(guān)系

2.抽樣研究的意義

3.中心極限定理的內(nèi)容

第一節(jié)抽樣研究與抽樣誤差

一.抽樣研究

(一)抽樣研究的意義

前面已經(jīng)講述了總體與樣本兩個(gè)統(tǒng)計(jì)學(xué)術(shù)語(yǔ),人們?cè)卺t(yī)學(xué)研究中多采用由樣本信息來(lái)推論總體特征的方法,

這在實(shí)際工作中是十分必要的,經(jīng)理論與實(shí)踐證明也是行之有效的。目前對(duì)某一總體進(jìn)行研究的最重要、最常用

的方法就是抽樣研究。

日于研究對(duì)象很多是無(wú)限總體,要直接研究總體的情況是不可能的。即使對(duì)有限總體來(lái)說(shuō),假設(shè)包含的觀察

單位數(shù)過(guò)多,需要消耗大量的人力、物力和時(shí)間,而且也不易組織,難以保證工作的質(zhì)量。有的時(shí)候,觀察的實(shí)

質(zhì)就是一種破壞性實(shí)驗(yàn),根本就不允許對(duì)總體中的每一個(gè)體逐一觀察.如對(duì)一批注射藥劑作質(zhì)量卷查,不可能將

所有的藥劑瓶都翻開(kāi)加以檢驗(yàn),這顯然是不可能的。

抽樣研究作為一種由局部認(rèn)識(shí)整體的觀察方法,從古到今一直被人們自覺(jué)或不自覺(jué)地應(yīng)用著,如炒菜時(shí)嘗嘗

咸淡,就醫(yī)時(shí)取幾滴血作化驗(yàn)等。實(shí)踐證明這是行之有效的方法。目前抽樣研究的理論與技術(shù)口開(kāi)展成熟,只要

嚴(yán)格按照有關(guān)抽樣研究的要求去做,這是完全可行的。所以,在實(shí)際工作中人們多采用抽樣研究的方法,其目的

就是要用樣本信息來(lái)推斷總體特征,這就叫統(tǒng)計(jì)推斷Isialislicalinference).

(二)抽樣研究和抽樣誤差

抽樣研究是指從總體中按照隨機(jī)化的原那么,抽取一定數(shù)量的個(gè)體組成樣本進(jìn)行研究,從而推斷總體的研究

方法。在實(shí)際工作中,由于總體中各觀察對(duì)象之間存在著個(gè)體變異,且隨機(jī)抽取的樣本乂只是總體中的一局部,

因此計(jì)算的樣本統(tǒng)計(jì)量,不一定恰好等于相應(yīng)的總體參數(shù)。這種由于個(gè)體變異的存在,在抽樣研究中產(chǎn)生的樣本

統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)間的差異,稱為抽樣誤差(samplingerror),同樣,來(lái)自同一總體的假設(shè)干樣本的統(tǒng)計(jì)

量之間,也會(huì)存在誤差,這種誤差也反映在樣本統(tǒng)計(jì)量與總體參數(shù)間的差異。當(dāng)樣本是來(lái)自相應(yīng)息體的隨機(jī)樣本

時(shí),抽樣誤差為隨機(jī)誤差,其誤差大小可以依據(jù)中心極限定理進(jìn)行估計(jì)。中心極限定理的內(nèi)容是,以數(shù)值變量資

料為例,假設(shè)從均數(shù)為〃的正態(tài)總體中以固定〃反復(fù)屢次(比方100次)抽樣時(shí),所得的樣本均數(shù)元的分布是正

態(tài)分布;即使是從偏態(tài)總體中抽樣,只要〃足夠大,天的分布也近似正態(tài)分布。

在抽樣研究中抽樣誤差是不可防止的,根據(jù)資料的性質(zhì)和指標(biāo)種類的不同,抽樣誤差有多種,例如:①?gòu)哪?/p>

地7歲男童中隨機(jī)抽取110名,測(cè)得平均身高為119.95cm,該樣本均數(shù)不一定等于該地7歲男童身高的總體均

數(shù),這種樣本均數(shù)與總體均數(shù)間的差異,稱為均數(shù)的抽樣誤差。②某縣為血吸蟲(chóng)病流行區(qū),從該縣人群中隨機(jī)抽

取400人,測(cè)得的血吸蟲(chóng)感染人數(shù)為60人,感染率為15%,該樣本率不一定等于該地人群的總體感染率。此為

樣本率與總體率之間的差異,稱為率的抽樣誤差。此外,樣本方差和相應(yīng)的總體方差也存在抽樣誤差,后面介紹

的相關(guān)系數(shù)和回歸系數(shù)也有抽樣誤差的問(wèn)題。

二.均數(shù)的抽樣誤差

在抽樣研究中,彳后設(shè)從同一總體中隨機(jī)抽取樣本含量相同的假設(shè)干個(gè)樣本,并計(jì)算出某種樣本統(tǒng)計(jì)量(如樣

本均數(shù)),由于生物間的個(gè)體變異是客觀存在的,抽樣誤差是不可防止的,這些樣本統(tǒng)計(jì)量之間具有離散趨勢(shì)。

數(shù)理統(tǒng)計(jì)研究說(shuō)明,抽樣誤差具有一定的規(guī)律性,可以用特定的指標(biāo)來(lái)描述。這個(gè)指標(biāo)稱為標(biāo)準(zhǔn)誤(standard

error),標(biāo)準(zhǔn)誤除了反映樣本統(tǒng)計(jì)量之間的離散程度外,也反映樣本統(tǒng)計(jì)量與相應(yīng)總體參數(shù)之間的差異,即抽樣

誤差大小。本章主要介紹最常用的均數(shù)標(biāo)準(zhǔn)誤以及率的標(biāo)準(zhǔn)誤。

[一)均數(shù)標(biāo)準(zhǔn)誤的意義

將來(lái)自同一總體的假設(shè)干個(gè)樣本均數(shù)看成一組新的觀察值,研究其頻數(shù)分布,包括集中趨勢(shì)和離散趨勢(shì),可

計(jì)算樣本均數(shù)的均數(shù)和標(biāo)準(zhǔn)差。

例3.1假定某市16歲女中學(xué)生的身高分布服從均數(shù)(//)為155.4cm,標(biāo)準(zhǔn)差M為5.3cm的正態(tài)分布。

現(xiàn)用電子計(jì)算機(jī)作抽樣模擬試驗(yàn),每次隨機(jī)抽出10個(gè)觀察值(即樣本含量〃=10),共抽取100個(gè)樣本,求得100

個(gè)樣本均數(shù)并編制成頻數(shù)分布表如表4.1o

_______表4.110()個(gè)樣本均數(shù)的頻數(shù)分布"=]55.4cm,k5.3cm)

組段(cm)

151?1

152~6

153-15

154~19

155-27

156-16

157-8

158~5

159-3

合計(jì)100

從表4.1中可以發(fā)現(xiàn),當(dāng)原始觀察值的分布為正態(tài)分布時(shí),這些樣本均數(shù)的頻數(shù)分布根本服從正態(tài)分布。統(tǒng)

計(jì)理論證明,假設(shè)原始觀察值的分作為偏態(tài)分布,當(dāng)樣本含量〃足夠大時(shí),其樣本均數(shù)的分布仍近似服從正態(tài)分

布。所以,可以求得樣本均數(shù)的均數(shù)為155.38cm,與總體均數(shù)155.4cm接近。中心極限定理說(shuō)明,樣本均數(shù)的

均數(shù)等于原總體的總體均數(shù)同樣,也可以求得樣本均數(shù)的標(biāo)準(zhǔn)差為b1為了與描述觀察值離散程度的標(biāo)

準(zhǔn)差相區(qū)別,用均數(shù)標(biāo)準(zhǔn)誤來(lái)表示樣本均數(shù)的標(biāo)準(zhǔn)差。均數(shù)標(biāo)準(zhǔn)誤反映來(lái)自同一總體的樣本均數(shù)的離散程度以及

樣本均

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論