第二章 第三章 定量資料描述課件_第1頁
第二章 第三章 定量資料描述課件_第2頁
第二章 第三章 定量資料描述課件_第3頁
第二章 第三章 定量資料描述課件_第4頁
第二章 第三章 定量資料描述課件_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

(計(jì)量資料的統(tǒng)計(jì)描述)

第二章集中趨勢(shì)的統(tǒng)計(jì)描述

第三章變異程度的統(tǒng)計(jì)描述

第二章第三章定量資料描述內(nèi)容:1、頻數(shù)分布表的編制2、計(jì)量資料集中趨勢(shì)的統(tǒng)計(jì)描述第二章第三章定量資料描述問題:何為計(jì)量資料?何為統(tǒng)計(jì)描述(statisticaldescription)?第二章第三章定量資料描述

統(tǒng)計(jì)描述:用統(tǒng)計(jì)表、或統(tǒng)計(jì)圖、或統(tǒng)計(jì)指標(biāo)(描述統(tǒng)計(jì)量)概括和揭示資料(data)的數(shù)量信息和特征。目的使資料簡潔、明了,便于人們了解資料的規(guī)律性。第二章第三章定量資料描述一、變量的頻數(shù)分布1、離散型定量變量的頻數(shù)分布例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:

0,3,2,0,1,5,6,3,2,4,1,0,6,5,……,4,7。第二章第三章定量資料描述檢查次數(shù)頻數(shù)頻率(%)累計(jì)人數(shù)累計(jì)頻率(%)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合計(jì)96100.0————表2-11998年某地96名婦女產(chǎn)前檢查次數(shù)頻數(shù)分布第二章第三章定量資料描述第二章第三章定量資料描述

頻數(shù)(frequency):重復(fù)某隨機(jī)試驗(yàn),某隨機(jī)事件出現(xiàn)的次數(shù),稱為頻數(shù)。

頻數(shù)分布表(frequencydistributiontable)簡稱頻數(shù)表(frequencytable):含有組段與頻數(shù)的統(tǒng)計(jì)表,稱頻數(shù)表。

直方圖(histogram):為直觀反映頻數(shù)表,利用直角坐標(biāo)系繪制頻數(shù)圖,橫軸表示變量的“各種情形”,縱軸表示頻數(shù)、或頻率、或頻率密度。第二章第三章定量資料描述2、連續(xù)型定量變量的頻數(shù)分布問題:

1)何為連續(xù)型定量變量?

2)其與離散型定量變量有何區(qū)別?

3)連續(xù)型定量變量的頻數(shù)分布表該如何繪制?第二章第三章定量資料描述4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76

例2.1某地用隨機(jī)抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測(cè)結(jié)果如表2-1所示:

表2-2某地140名成年男性紅細(xì)胞數(shù)(×1012/L)第二章第三章定量資料描述表2-3某地140名成年男性紅細(xì)胞數(shù)的頻數(shù)表第二章第三章定量資料描述第二章第三章定量資料描述找出觀察值中的最大值和最小值,并求出極差。最大值與最小值之差稱為極差(range),記為RR=5.95-3.82=2.13

最大值與最小值反映了觀察值的分布范圍,極差反映了觀察值分布的跨度。第二章第三章定量資料描述按極差大小決定組段數(shù)和組距頻數(shù)表一般設(shè)8~15個(gè)組段,視觀察單位數(shù)的多少而定,其原則是要充分反映數(shù)據(jù)的分布特征。組距即各組的跨度,是每一組內(nèi)的范圍,常采用等距分組。

第二章第三章定量資料描述為了計(jì)算方便取0.2為組距各組段應(yīng)界限分明,上下銜接,互不交叉,第一組段要包括最小值,最后一組段要包括最大值。每一組的起點(diǎn)稱下限,終點(diǎn)稱上限。第二章第三章定量資料描述3.84.24.65.05.45.805152535人數(shù)4.04.44.85.25.66.0圖2-2140名正常男子紅細(xì)胞計(jì)數(shù)的直方圖第二章第三章定量資料描述潛伏期(小時(shí))頻數(shù)累計(jì)頻數(shù)0---353512---7010524---4014536---2316848---1218060---618672---841187合計(jì)187——表2-4187例某種沙門氏菌食物中毒潛伏期分布第二章第三章定量資料描述圖2-3187例某種沙門氏菌食物中毒潛伏期頻數(shù)直方圖第二章第三章定量資料描述某城市892名老年人生存質(zhì)量自評(píng)分的頻數(shù)分布0102030405060708090100自評(píng)分4003002001000人數(shù)第二章第三章定量資料描述變量頻數(shù)分布的類型:1)對(duì)稱分布2)偏態(tài)分布:正偏峰(positiveskew)分布負(fù)偏峰(negativeskew)分布第二章第三章定量資料描述變量頻數(shù)分布的兩個(gè)特征1)集中趨勢(shì)(centraltendency)2)離散趨勢(shì)(tendencyofdispersion)第二章第三章定量資料描述二、計(jì)量資料集中趨勢(shì)(平均水平)的描述指標(biāo)第二章第三章定量資料描述1、描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)(平均數(shù)average)1)算術(shù)均數(shù)(arithmeticmean),簡稱均數(shù)2)幾何均數(shù)(geometricmean,G)3)中位數(shù)(median,M)第二章第三章定量資料描述加權(quán)法根據(jù)頻數(shù)表計(jì)算均數(shù)的一種方法。第二章第三章定量資料描述P9例:求140名成年男子紅細(xì)胞數(shù)平均水平紅細(xì)胞計(jì)數(shù)組中值頻數(shù)fxfx23.80~3.9027.8030.424.00~4.10624.60100.864.20~4.301147.30203.394.40~4.5025112.50506.254.60~4.7032150.40706.884.80~4.9027132.30648.275.00~5.101786.70442.175.20~5.301368.90365.175.40~5.50422.00121.005.60~5.70211.4064.985.80~5.9015.9034.81合計(jì)140669.803224.20第二章第三章定量資料描述加權(quán)法:加權(quán)法與直接法結(jié)果為什么有不同?第二章第三章定量資料描述工資人數(shù)125010140013165017200010合計(jì)50表2-5某單位工資情況求該單位平均工職?=1575第二章第三章定量資料描述幾何均數(shù)(geometricmean)

第二章第三章定量資料描述對(duì)于頻數(shù)表資料第二章第三章定量資料描述例2.2測(cè)的10個(gè)人的血清滴度的倒數(shù)分別為2,2,4,4,8,8,8,8,32,32,求平均滴度。如果計(jì)算均數(shù),其值為X=10.8現(xiàn)計(jì)算幾何均數(shù)顯然在這里均數(shù)不能代表其平均水平,選擇幾何均數(shù)則比較合適,故10份血清滴度的平均水平1:7第二章第三章定量資料描述例:100名受試者接種某疫苗三周后,抗體測(cè)定結(jié)果如下表,試計(jì)算平均抗體滴度。第二章第三章定量資料描述100名受試者平均抗體滴度為1:32.2。第二章第三章定量資料描述計(jì)算幾何均數(shù)時(shí)注意:變量值中不能有0;同一組變量值不能同時(shí)存在正負(fù)值;若變量值全為負(fù)值,可在計(jì)算時(shí)將負(fù)號(hào)除去,算出結(jié)果后再冠以負(fù)號(hào)。醫(yī)學(xué)工作中常用于處理:抗體滴度水平等成倍數(shù)增長的數(shù)據(jù)(等比級(jí)數(shù)資料)第二章第三章定量資料描述中位數(shù)例9例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.5

M=4.89例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.1>16

M=4.810例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.5>16

M=(4.8+5.6)/2=5.2第二章第三章定量資料描述

頻數(shù)表法:

當(dāng)觀察例數(shù)較多時(shí),可先編制頻數(shù)表,再計(jì)算中位數(shù)。計(jì)算公式:

式中LM表示中位數(shù)M所在組段的下限;i和fM分別表示中位數(shù)M所在組段的組距和頻數(shù);∑fL表示小于LM的各組段的累計(jì)頻數(shù)。第二章第三章定量資料描述確定中位數(shù)所在組段的方法:累計(jì)頻數(shù)恰好第一次大于n/2的組段為中位數(shù)所在組段?;蚶塾?jì)頻率恰好第一次大于50%的組段第二章第三章定量資料描述例:某種傳染病的潛伏期(天)見下表,試求平均潛伏期。

第二章第三章定量資料描述4~組段累計(jì)頻數(shù)(∑f=74)恰好第一個(gè)大于n/2(110/2=55),故中位數(shù)位于4~組段。平均潛伏期為5.21天。

第二章第三章定量資料描述百分位數(shù)位置指標(biāo),以表示;理論上有X%的觀察值比小,有(100-X)%的觀察值比大;百分位數(shù)是一個(gè)界值,是分布數(shù)列的一百等份分割值;即是中位數(shù)。百分位數(shù)常用于描述一組觀察值在某百分位置上的水平,多個(gè)百分位數(shù)結(jié)合使用可全面地描述資料的分布特征。第二章第三章定量資料描述百分位數(shù)的計(jì)算方法計(jì)算公式:

式中LX表示第X百分位數(shù)PX所在組段的下限;i和fX分別表示第X百分位數(shù)PX所在組段的組距和頻數(shù)∑fL表示小于LX的各組段的累計(jì)頻數(shù)。確定第X百分位數(shù)PX所在組段的方法:累計(jì)頻數(shù)恰好第一次大于n×X%的組段為第X百分位數(shù)PX所在組段。第二章第三章定量資料描述例:某種傳染病的潛伏期(天)見下表,試求平均潛伏期。

第二章第三章定量資料描述某傳染病的潛伏期資料為例,試計(jì)算P2.5,P25,P75。

由確定PX所在組段方法可判定P2.5,P25,P75分別在2~,4~,6~三個(gè)組段內(nèi)。第二章第三章定量資料描述中位數(shù)和百分位數(shù)的應(yīng)用對(duì)資料的分布沒有特殊要求;中位數(shù)只受位置居中的變量值影響,抗極端值,具有較好的穩(wěn)定性,但不如均數(shù)精確,不便于統(tǒng)計(jì)運(yùn)算;當(dāng)資料適合計(jì)算均數(shù)或幾何均數(shù)時(shí),不宜用中位數(shù)表示其平均水平。百分位數(shù)常結(jié)合使用說明某一特定問題。第二章第三章定量資料描述思考題:算術(shù)平均數(shù)與中位數(shù)的異同點(diǎn)第二章第三章定量資料描述問題:考核甲、乙兩中藥店服務(wù)員的技術(shù)水平,令每人每次從盒中取10克某種中藥,各取5次進(jìn)行稱量,結(jié)果如下(g):甲:9.610.510.09.510.4乙:9.910.19.910.29.9第二章第三章定量資料描述2、描述離散趨勢(shì)(變異)的統(tǒng)計(jì)指標(biāo)1)極差(range,R)2)四分位數(shù)間距(quartilerange,QR)3)方差(variance)4)標(biāo)準(zhǔn)差(standarddeviation)5)變異系數(shù)(coefficientofvariation)第二章第三章定量資料描述1)極差:

R=最大值–最小值A(chǔ):2628303234B:2427303336C:2629303134第二章第三章定量資料描述極差:計(jì)算方便;只考慮兩個(gè)極值;與n有關(guān),用于比較是需注意。

第二章第三章定量資料描述2)四分位數(shù)間距:

QR=P75–P25第二章第三章定量資料描述四分位數(shù)間距:包抱總體中數(shù)值居中的50%的個(gè)體;計(jì)算是沒用到每個(gè)個(gè)體的數(shù)值;其值越大,說明變量變異越大。第二章第三章定量資料描述3)方差,又稱均方差(meansquaredeviation)第二章第三章定量資料描述xX-u(x-u)226-41628-243000322434416合計(jì)04029第二章第三章定量資料描述第二章第三章定量資料描述4)標(biāo)準(zhǔn)差:方差的算術(shù)平方根,即為標(biāo)準(zhǔn)差。第二章第三章定量資料描述

標(biāo)準(zhǔn)差與方差的含義類似,值越大,說明變量的變異越大,都適合用來表達(dá)對(duì)稱分布的離散趨勢(shì)。兩者不同的是量綱不一樣。第二章第三章定量資料描述5)變異系數(shù):標(biāo)準(zhǔn)差與均數(shù)之比,即為變異系數(shù)。用于描述對(duì)稱分布資料的變異程度。變異系數(shù)無量綱,其值大,說明相對(duì)均數(shù)而言的相對(duì)變異較大??捎糜诹烤V相同、或不同的變量變異程度大小的比較。第二章第三章定量資料描述例:某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71cm;體重均數(shù)為22.29kg,標(biāo)準(zhǔn)差為2.26kg,比較其變異度?

第二章第三章定量資料描述

n1=351015均數(shù)=10元標(biāo)準(zhǔn)差=5元n2=395100105均數(shù)=100元標(biāo)準(zhǔn)差=5元第二章第三章定量資料描述下列兩組數(shù)據(jù)(量綱相同)何者變異較大?甲:124816乙:10204080160第二章第三章定量資料描述問題:均數(shù)、方差(標(biāo)準(zhǔn)差)常用來描述對(duì)稱分布資料,為什么?第二章第三章定量資料描述對(duì)稱分布偏態(tài)分布開口數(shù)據(jù)等比級(jí)數(shù)資料平均水平算術(shù)均數(shù)中位數(shù)中位數(shù)幾何均數(shù)中位數(shù)變異程度標(biāo)準(zhǔn)差方差變異系數(shù)全距四分位數(shù)間距全距四分位間距全距對(duì)數(shù)標(biāo)準(zhǔn)差描述統(tǒng)計(jì)量的一般應(yīng)用總結(jié)表第二章第三章定量資料描述正態(tài)分布第二章第三章定量資料描述正態(tài)分布的概念

120名13歲女孩身高頻率密度直方圖12413214014815616400.020.040.060.08頻率密度第二章第三章定量資料描述(a)(b)(d)(c)第二章第三章定量資料描述

當(dāng)n大時(shí),頻率密度曲線可估計(jì)概率密度曲線。醫(yī)學(xué)中的許多變量,其概率密度曲線類似正態(tài)曲線。故可用正態(tài)曲線的特點(diǎn)來描述這些變量的統(tǒng)計(jì)規(guī)律。第二章第三章定量資料描述

正態(tài)曲線(normalcurve):是一條高峰位于中央,兩側(cè)逐漸下降并完全對(duì)稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。其概率密度函數(shù)為:-∞<X<+∞第二章第三章定量資料描述正態(tài)分布圖示x0.1.2.3.4f(x)-3-2-++2+3

第二章第三章定量資料描述正態(tài)分布有兩個(gè)參數(shù):位置參數(shù):μ

變異度參數(shù):σ2正態(tài)分布的表示方法:

X~N(μ,σ2)第二章第三章定量資料描述第二章第三章定量資料描述第二章第三章定量資料描述正態(tài)分布的性質(zhì)正態(tài)分布只有一個(gè)高峰,高峰位置在均數(shù)處(說明什么?);正態(tài)分布以均數(shù)為中心,左右對(duì)稱;正態(tài)分布的兩個(gè)參數(shù)μ和σ決定了分布的位置和形狀;正態(tài)分布曲線下的面積分布是有規(guī)律的。第二章第三章定量資料描述正態(tài)曲線下面積的分布規(guī)律1)由頻率密度直方圖的含義,我們不難理解頻率(概率)密度曲線下面積的含義。2)正態(tài)曲線可作為很多醫(yī)學(xué)變量概率密度曲線的近似。3)當(dāng)知道了密度函數(shù)f(x)時(shí),頻率(概率)密度曲線下的面積可通過對(duì)密度函數(shù)求定積分的方法獲得。4)定積分的方法求正態(tài)曲線下的面積過于復(fù)雜,我們可用簡便的查表法解決這一問題。第二章第三章定量資料描述若變量

u~N(0,1),我們稱u為標(biāo)準(zhǔn)正態(tài)變量,其密度曲線稱為標(biāo)準(zhǔn)正態(tài)曲線,其概率密度函數(shù)為:-∞<u<+∞標(biāo)準(zhǔn)正態(tài)分布是正態(tài)分布的一種特例。正態(tài)曲線下的面積規(guī)律與標(biāo)準(zhǔn)正態(tài)曲線下的面積規(guī)律有什么關(guān)系呢?第二章第三章定量資料描述由積分知識(shí)可證明:式中分別是正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù),分別是它們的分布函數(shù)。,和F(X)和注意:請(qǐng)正確理解分布函數(shù)的意義第二章第三章定量資料描述

標(biāo)準(zhǔn)正態(tài)分布160170176f(X)

正態(tài)分布X~N(170,62)-1.66701.00uf(u)Ф(-1.667)=0.0475第二章第三章定量資料描述第二章第三章定量資料描述第二章第三章定量資料描述統(tǒng)計(jì)學(xué)家編制了標(biāo)準(zhǔn)正態(tài)分布函數(shù)表(附表1),故求正態(tài)曲線下的面積可通過查附表1獲得。因?yàn)檎龖B(tài)分布的對(duì)稱性,為節(jié)省篇幅,附表1只給出Z取負(fù)值的情況。第二章第三章定量資料描述第二章第三章定量資料描述例:已知健康成年男性身高(厘米)X~N(170,62),求成年男性中身位于165厘米至175厘米的人占整個(gè)成年男性的比例。例:對(duì)于35至44歲的男性,如果舒張壓是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論