計量資料的統(tǒng)計分析_第1頁
計量資料的統(tǒng)計分析_第2頁
計量資料的統(tǒng)計分析_第3頁
計量資料的統(tǒng)計分析_第4頁
計量資料的統(tǒng)計分析_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、計量資料的統(tǒng)計分析計量資料的統(tǒng)計分析 計量資料的統(tǒng)計描述計量資料的統(tǒng)計描述 正態(tài)分布和參考值范圍正態(tài)分布和參考值范圍 抽樣誤差和假設檢驗抽樣誤差和假設檢驗 t t 檢驗和檢驗和u u 檢驗檢驗第二章第二章 集中趨勢的統(tǒng)計描述集中趨勢的統(tǒng)計描述(Measures of Central Tendency)要求:要求: 掌握:掌握:計量資料的頻數分布;算術計量資料的頻數分布;算術均數、幾何均數、中位數適用的資料類均數、幾何均數、中位數適用的資料類型及計算方法。型及計算方法。 熟悉:熟悉:百分位數。百分位數。計量資料的統(tǒng)計描述計量資料的統(tǒng)計描述方法有兩類:方法有兩類:1. 1. 統(tǒng)計圖表統(tǒng)計圖表 主要

2、是頻數分布表、頻數分布圖主要是頻數分布表、頻數分布圖(直方圖)(直方圖)2. 2. 選用適當的統(tǒng)計指標選用適當的統(tǒng)計指標 集中趨勢指標、變異程度指標集中趨勢指標、變異程度指標計量資料(計量資料(measurement data):對每個對每個觀察對象的觀察指標用定量方法測定觀察對象的觀察指標用定量方法測定其數值大小所得的資料,一般有度量其數值大小所得的資料,一般有度量衡單位。衡單位。第一節(jié)第一節(jié) 頻數分布頻數分布( (Frequency Distribution)Frequency Distribution) 由實驗或臨床觀察等各種方式得到的原始數據,由實驗或臨床觀察等各種方式得到的原始數據,

3、如果是計量資料并且觀察的例數較多,為了能夠顯如果是計量資料并且觀察的例數較多,為了能夠顯示數據的分布規(guī)律,可以對數據進行分組,然后制示數據的分布規(guī)律,可以對數據進行分組,然后制作頻數表或繪制直方圖。作頻數表或繪制直方圖。 例例2.1 2.1 某地用隨機抽樣方法檢查了某地用隨機抽樣方法檢查了140140名成年男子名成年男子的紅細胞數,檢測結果如表所示:的紅細胞數,檢測結果如表所示: 如何有效地組織、整理和表達數據的信息?如何有效地組織、整理和表達數據的信息? 4.764.765.265.265.615.615.955.954.464.464.574.574.314.315.185.184.924

4、.924.274.274.774.774.884.885.005.004.734.734.474.475.345.344.704.704.814.814.934.935.045.044.404.405.275.274.634.635.505.505.245.244.974.974.714.714.444.444.944.945.055.054.784.783.823.824.634.635.025.024.764.76確定組數確定組數k通常選擇在通常選擇在8 81515之間之間 確定組距確定組距常用全距的常用全距的1/101/10取整作為組距,等距取整作為組距,等距確定組段確定組段每個組段的起

5、點稱組下限,終點稱組上限。每個組段的起點稱組下限,終點稱組上限。第第1 1組段包括最小值,最后組段包括最小值,最后1 1組包括最大值。組包括最大值。組段寫為上限開口型,最末一組段同時寫出組段寫為上限開口型,最末一組段同時寫出其下限和上限。其下限和上限。列表劃記列表劃記將原始數據采用劃記法或計算機匯將原始數據采用劃記法或計算機匯總,得到各個組段的觀察單位數總,得到各個組段的觀察單位數(頻數),列成頻數表。(頻數),列成頻數表。一、頻數表一、頻數表 ( (Frequency Table)Frequency Table) 頻數表:同時列出觀察指標的可能取值區(qū)間及其在頻數表:同時列出觀察指標的可能取值

6、區(qū)間及其在各區(qū)間內出現的頻數。各區(qū)間內出現的頻數。 表表2-2 某地某地140名正常男子紅細胞數的頻數表名正常男子紅細胞數的頻數表 紅細胞數紅細胞數頻頻 數數 頻頻 率率(%) (%) 累計頻數累計頻數累計頻率累計頻率(%) (%) 3.80 2 1.4 2 1.44.00 6 4.3 8 5.74.20 11 7.919 13.64.40 25 17.9 44 31.54.60 32 22.9 76 54.44.80 27 19.3 103 73.75.00 17 12.1 120 85.85.20 13 9.3 133 95.15.40 4 2.9 137 98.05.60 2 1.4 1

7、39 99.45.80 6.00 1 0.7 140 100.0合計合計140 100.0各組頻數分別各組頻數分別除以總頻數的除以總頻數的比值稱為頻率。比值稱為頻率。各組頻率之和各組頻率之和應為應為100100。頻率描述了各頻率描述了各組頻數在全體組頻數在全體中所占的比重。中所占的比重。累計頻數累計頻數除以總頻除以總頻數的比值數的比值稱為稱為累計累計頻率頻率。它。它描述了累描述了累計頻數在計頻數在全體中所全體中所占的比重。占的比重。累計頻累計頻數:某數:某一指定一指定組段及組段及前面各前面各組段的組段的頻數之頻數之和。和。 圖圖2-1 140名正常男子紅細胞計數的直方圖名正常男子紅細胞計數的直

8、方圖 二、直方圖(二、直方圖(HistogramHistogram) 直觀、形象地表示頻數分布的直觀、形象地表示頻數分布的形態(tài)和特征形態(tài)和特征。三、頻數表的用途三、頻數表的用途 1.1.作為陳述資料的形式,可代替原始資料,便作為陳述資料的形式,可代替原始資料,便于進一步分析于進一步分析 2.2.便于觀察數據的分布類型便于觀察數據的分布類型 3.3.便于發(fā)現資料中某些遠離群體的特大或特小便于發(fā)現資料中某些遠離群體的特大或特小的可疑值的可疑值 4.4.當樣本含量比較大時,可用各組段的頻率作當樣本含量比較大時,可用各組段的頻率作為概率的估計值為概率的估計值 對稱分布對稱分布: : 集中位置在正集中位

9、置在正中中, ,左右兩側頻數分布大左右兩側頻數分布大體對稱體對稱 偏態(tài)分布偏態(tài)分布: : 集中位置偏向集中位置偏向一側一側, ,頻數分布不對稱。頻數分布不對稱。又分為正偏態(tài)分布和負又分為正偏態(tài)分布和負偏態(tài)分布。偏態(tài)分布。 圖圖2-1 140名正常男子紅細胞計數的直方圖名正常男子紅細胞計數的直方圖 正態(tài)分布:中間高、兩邊低、左右對稱正態(tài)分布:中間高、兩邊低、左右對稱正偏態(tài)分布:長尾向正偏態(tài)分布:長尾向右右延伸延伸05101520250.53.56.59.512.515.518.521.524.527.530.533.536.539.542.545.548.551.554.557.5三、頻數表的用

10、途三、頻數表的用途 1.1.作為陳述資料的形式,可代替原始資料,便作為陳述資料的形式,可代替原始資料,便于進一步分析于進一步分析 2.2.便于觀察數據的分布類型便于觀察數據的分布類型 3.3.便于發(fā)現資料中某些遠離群體的特大或特小便于發(fā)現資料中某些遠離群體的特大或特小的可疑值的可疑值 4.4.當樣本含量比較大時,可用各組段的頻率作當樣本含量比較大時,可用各組段的頻率作為概率的估計值為概率的估計值 表表2-2 某地某地140名正常男子紅細胞數的頻數表名正常男子紅細胞數的頻數表 紅細胞數紅細胞數頻頻 數數 頻頻 率率(%) (%) 3.80 2 1.4 4.00 6 4.3 4.20 11 7.9

11、4.40 25 17.9 4.60 32 22.9 4.80 27 19.3 5.00 17 12.1 5.20 13 9.3 5.40 4 2.9 5.60 2 1.4 5.80 6.00 1 0.7 合計合計140 常用的有:常用的有:1. 算術均數算術均數(arithmetic mean),簡稱,簡稱均數均數 (mean)2. 幾何均數幾何均數(geometric mean)3. 中位數中位數 (median)第二節(jié)第二節(jié) 平均數平均數 (Average)意義:意義:1.描述一組觀察值集中位置或平均水平的統(tǒng)計指描述一組觀察值集中位置或平均水平的統(tǒng)計指標;標;2. 作為一組數據的代表值,用

12、于分析和進行組間作為一組數據的代表值,用于分析和進行組間的比較。的比較。直接法12inxxxxxnn+=112212iinninf Xf Xf Xf Xxffff+=+加權法加權法 表表2-2 某地某地140名正常男子紅細胞數的頻數表名正常男子紅細胞數的頻數表 紅細胞數紅細胞數頻數頻數(f fi) 組中值(組中值(X X)f f i i Xi i3.80 2 3.907.804.00 6 4.1024.604.20 11 4.3047.304.40 25 4.50112.504.60 32 4.70150.404.80 27 4.90132.305.00 17 5.1086.705.20 13

13、 5.3068.905.40 4 5.5022.005.60 2 5.7011.405.80 6.00 1 5.905.90合計合計140(f fi )669.80(f f i i Xi)112212iinninf Xf Xf Xf Xxffff+=+669.80/1404.78(1012/L)應用:主要適用于對稱分布或偏度不應用:主要適用于對稱分布或偏度不大的資料,尤其適合正態(tài)分布資料。大的資料,尤其適合正態(tài)分布資料。二、幾何均數(二、幾何均數(Geometric Mean ) nnXXXG21 )lg(lg)lglglg(lg1211nXnXXXGn 例:有例:有5 5個人的血清抗體效價為

14、個人的血清抗體效價為1 1:1010,1 1:100100, 1 1:10001000,1 1:1000010000,1 1:100000100000。求平均血清抗體效價。求平均血清抗體效價。5 5個人的平均血清抗體效價為個人的平均血清抗體效價為1 1:10001000二、幾何均數(二、幾何均數(Geometric Mean ) 例例2.2 2.2 測得測得1010個人的血清滴度的倒數分別為個人的血清滴度的倒數分別為2 2,2 2,4 4,4 4,8 8,8 8,8 8,8 8,3232,3232,求平均滴度。,求平均滴度。 例例2.3 2.3 (頻數表資料)(頻數表資料) nnXXXG21

15、)lg(lg)lglglg(lg1211nXnXXXGn 71032lg32lg8lg8lg8lg8lg4lg4lg2lg2lglg1 G幾何均數的應用幾何均數的應用 幾何均數常用于等比資料,主要用于血清幾何均數常用于等比資料,主要用于血清學和微生物學中學和微生物學中 用于對數正態(tài)分布資料(原始數據不對稱,用于對數正態(tài)分布資料(原始數據不對稱,但各變量值取對數后呈對稱分布的資料);但各變量值取對數后呈對稱分布的資料); 觀察值不能有觀察值不能有0 0; 觀察值不能同時有正值和負值。觀察值不能同時有正值和負值。中位數中位數 (medianmedian)將一組觀察值從小到大按順序排列,居中將一組觀

16、察值從小到大按順序排列,居中心位置的數值即為中位數。,用心位置的數值即為中位數。,用MM表示。表示。 如如,2、3、5、 、9、11、127直接法直接法n n為偶數為偶數某病患者某病患者8 8人的潛伏期(天)分別為人的潛伏期(天)分別為5 5,6 6,8 8,9 9,1111,1111,1313,1616。求中位數。求中位數。 8 8人的平均潛伏期為人的平均潛伏期為1010天,即天,即MM1010(天)(天)n n為奇數為奇數有有7 7個人的血壓(收縮壓)測定值(個人的血壓(收縮壓)測定值(mmHgmmHg)為:為:120120、123123、125125、127127、128128、1301

17、30、132132, 求中位數。求中位數。 M=127M=127(mmHgmmHg) 頻數表計算法頻數表計算法 編制頻數表編制頻數表 由小到大計算累計頻數、累計頻率由小到大計算累計頻數、累計頻率 找出找出MM或或P Px x所在組所在組 代入公式代入公式頻數表資料頻數表資料 表表2-4 2-4 某地某地630630名正常女性血清甘油三脂含量名正常女性血清甘油三脂含量( (mg/dl)mg/dl)甘油三脂甘油三脂頻數頻數 累計頻數累計頻數累計頻率累計頻率(%) (%) 0.100.10 2727 2727 4.34.30.400.40169169196196 31.131.10.700.7016

18、7167363363 57.6 57.6 MM1.001.00 9494457457 72.572.51.301.30 8181538538 85.485.41.601.60 4242580580 92.192.11.901.90 2828608608 96.596.52.202.20 1414622622 98.798.72.502.50 4 4626626 99.499.42.802.80 3 3629629 99.899.83.103.10 1 1630630100.0 100.0 合計合計630630 - - - -03060901201501801頻頻數數甘油三脂甘油三脂(mg/dL

19、)0.10.4 0.7 1.01.31.6 1.92.2 2.5 2.83.16300.5196ML L、i iMM、f fMM分別為分別為MM所在組段的下限、組距和頻數,所在組段的下限、組距和頻數, f fL L為為MM所在組段之前各組段的累積頻數。所在組段之前各組段的累積頻數。914. 030. 01671965 . 063070. 0 MMMLiffnLM 5.0中位數的特點中位數的特點1. 1. 特定的百分位數(特定的百分位數(p p5050),在全部觀),在全部觀察值中有一半比它大,有一半比它小。察值中有一半比它大,有一半比它小。應用最廣。應用最廣。2. 2. 不是由全部觀察值計算出

20、來的,因不是由全部觀察值計算出來的,因此不受特大值、特小值的影響,適用此不受特大值、特小值的影響,適用于描述偏態(tài)資料的集中位置。于描述偏態(tài)資料的集中位置。中位數的特點中位數的特點3. 3. 只受居中觀察值波動的影響,因而不只受居中觀察值波動的影響,因而不敏感。敏感。4. 4. 理論上,正態(tài)分布資料的均數等于中理論上,正態(tài)分布資料的均數等于中位數,對數正態(tài)分布的幾何均數等于中位數,對數正態(tài)分布的幾何均數等于中位數。但用中位數代替均數、幾何均數位數。但用中位數代替均數、幾何均數會減低靈敏度,進一步統(tǒng)計處理的方會減低靈敏度,進一步統(tǒng)計處理的方法較少,應盡量使用均數和幾何均數。法較少,應盡量使用均數和

21、幾何均數。中位數的適用范圍中位數的適用范圍 明顯偏態(tài)分布的資料明顯偏態(tài)分布的資料 開口資料開口資料 (資料的一端或兩端無確定數據)(資料的一端或兩端無確定數據) 資料分布類型不清資料分布類型不清百分位數百分位數 (percentilepercentile) 把一組數據從小到大排列,分成把一組數據從小到大排列,分成100100等份,各等份,各等份含等份含1 1的觀察值,分割界限上的值就是百分位的觀察值,分割界限上的值就是百分位數,用數,用PxPx表示。它是一種位置指標,即一個百分表示。它是一種位置指標,即一個百分位數位數PxPx將總體或樣本的全部變量值分為兩部分,將總體或樣本的全部變量值分為兩部

22、分,理論上有理論上有x%x%的變量值比它小,有(的變量值比它小,有(100-x100-x)%的的變量值比它大。變量值比它大。百分位數百分位數( (Percentile) Percentile) L L: : 組段的下限;組段的下限; i iMM: : 組距;組距; f fx x: : 頻數;頻數; f fL L: : P Px x所在組段之前的累積頻數。所在組段之前的累積頻數。 例例2.5 2.5 計算例計算例2.42.4的百分位數的百分位數P P2525 、 P P7575 、 P P9090。xxLxiffxnLP %)mmol/L(632.030.01692725.063040.025

23、P)mmol/L(357.130.08145775.063030.175 P)mmol/L(807.130.04253890.063060.190 P頻數表資料頻數表資料 表表2-4 2-4 某地某地630630名正常女性血清甘油三脂含量名正常女性血清甘油三脂含量( (mg/dl)mg/dl)甘油三脂甘油三脂頻數頻數 累計頻數累計頻數累計頻率累計頻率(%) (%) 0.100.10 2727 2727 4.34.30.400.40169169196196 31.131.10.700.70167167363363 57.6 57.6 MM1.001.00 9494457457 72.572.51

24、.301.30 8181538538 85.485.41.601.60 4242580580 92.192.11.901.90 2828608608 96.596.52.202.20 1414622622 98.798.72.502.50 4 4626626 99.499.42.802.80 3 3629629 99.899.83.103.10 1 1630630100.0 100.0 合計合計630630 - - - -百分位數的應用百分位數的應用 1.1.中位數是百分位數的特例。其特點是不易受異常中位數是百分位數的特例。其特點是不易受異常值的影響,適用于描述明顯偏態(tài)分布、或兩端無值的影響,適用于描述明顯偏態(tài)分布、或兩端無確定數值數據的平均水平。確定數值數據的平均水平。 2.2.描述數據序列在某百分位置的水平。多個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論