第二章定量的基本統(tǒng)計方法_第1頁
第二章定量的基本統(tǒng)計方法_第2頁
第二章定量的基本統(tǒng)計方法_第3頁
第二章定量的基本統(tǒng)計方法_第4頁
第二章定量的基本統(tǒng)計方法_第5頁
已閱讀5頁,還剩92頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章定量資料的基本統(tǒng)計方法張菊英復習總體與樣本、抽樣誤差小概率事件復習資料的兩種類型

數(shù)值變量資料分類資料問題:數(shù)值變量關(guān)注測定值的大小統(tǒng)計分析統(tǒng)計描述:是用統(tǒng)計圖(表)、統(tǒng)計指標來描述資料的分布規(guī)律及其數(shù)量特征。統(tǒng)計推斷:用樣本信息推斷總體特征。定量資料的統(tǒng)計描述

集中趨勢的統(tǒng)計描述定量資料的頻數(shù)表離散程度的統(tǒng)計描述

定量資料的頻數(shù)表在什么情況下需編頻數(shù)表?離散型計量資料的頻數(shù)表以變量取值為標志分組,并列出各組的頻數(shù)

例2.1表2.1某年某地區(qū)434名少數(shù)民族已婚婦女

現(xiàn)有子女數(shù)的頻數(shù)分布連續(xù)性變量的頻數(shù)表的編制

求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示定組段和組距(classinterval)列出頻數(shù)表

定組段和組距根據(jù)全距的大小和樣本含量的多少確定“組段”數(shù)各組段的起點和終點分別稱為下限和上限,某組段的組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱組距,常用全距的1/10取整做組距第一組段應包括全部觀察值中的最小值,最末組段應包括全部觀察值中的最大值并且同時寫出其下限與上限。頻數(shù)分布的特征

集中趨勢(centraltendency)

一組數(shù)據(jù)向某一個位置聚集或集中的傾向離散趨勢(dispersiontendency)

一組數(shù)據(jù)的分散性頻數(shù)分布的類型

對稱分布:對稱分布偏態(tài)分布:

正偏態(tài)分布負偏態(tài)分布頻數(shù)表的用途揭示資料的分布類型,以便于選用相應的統(tǒng)計分析方法;便于進一步計算指標和統(tǒng)計處理;便于發(fā)現(xiàn)某些特大或特小的可疑值。集中趨勢的統(tǒng)計描述描述一組同質(zhì)觀察值的平均水平或中心位置的指標有均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù)現(xiàn)有2.1,2.2,2.3等3個觀察值,求其均數(shù)

1XX++LL均數(shù)(mean)

適用條件:對稱分布,特別是正態(tài)或近似正態(tài)分布的定量資料。符號:表示樣本均數(shù),希臘字母表示總體均數(shù)。計算方法:直接法:加權(quán)法(weightingmethod):例2.3120名5歲女孩身高均數(shù)均數(shù)的特性均數(shù)的應用幾何均數(shù)(geometricmean)適用條件:某些呈正偏態(tài)分布,但數(shù)據(jù)經(jīng)過對數(shù)變換后呈正態(tài)分布的資料,也可用于觀察值之間呈倍數(shù)或近似倍數(shù)變化(等比關(guān)系)的資料。符號:用G表示計算方法:直接法:或加權(quán)法(weightingmethod):例2.4例2.5幾何均數(shù)注意事項中位數(shù)(median)適用條件:偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料符號:P50

或M計算方法:直接法:n為奇數(shù)時:n為偶數(shù)時:頻數(shù)表法(weightingmethod):

頻數(shù)表法計算Px表2.41503名中年知識分子SCL-90總分

中位數(shù)的應用注意事項中位數(shù)可用于各種分布的資料。對于正態(tài)分布資料,中位數(shù)等于均數(shù);對于對數(shù)正態(tài)分布資料,中位數(shù)等于幾何均數(shù)。中位數(shù)不受極端值的影響,因此,實際工作中主要用于偏態(tài)分布資料、兩端無確切值或分布不明確的資料。三組同性別、同年齡兒童的體重(kg)如下:甲組2628303234乙組2427303336丙組2629303134離散程度的統(tǒng)計描述離散度指標反映一組同質(zhì)觀察值的變異度;常用的指標有全距、四分位數(shù)間距、方差、標準差和變異系數(shù);值越大,表示資料的變異程度越大。全距(range,簡記為R)涵義:亦稱極差,為一組同質(zhì)觀察值中最大值與最小值之差。它反映了個體差異的范圍,全距大,說明變異度大;反之,全距小,說明變異度小。計算:適用條件:常由于描述單峰對稱分布小樣本資料的變異程度或由于初步了解資料的變異程度。不足之處:只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大,因此樣本含量懸殊時不宜用全距比較。四分位數(shù)間距(quartile,簡記為Q)涵義:為上四分位數(shù)Qu(即)與下四分位數(shù)QL(即)之差。其間包括了一組觀察值的一半,故四分位數(shù)間距可看成是中間50%觀察值的極差。百分位數(shù)的計算

四分位數(shù)的計算適用條件常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。優(yōu)缺點:四分位數(shù)間距較全距穩(wěn)定,但仍未考慮全部觀察值的變異度。例2.9某醫(yī)學院用自編生存質(zhì)量量表測得三組同年齡、同性別中年知識分子的軀體功能維度得分資料如下:

甲組88910111212

乙組56810121415

丙組12510151819

方差(variance)為了全面考慮每個觀察值的變異情況,克服全距和四分位數(shù)間距的缺點,引入了“方差”自由度隨機變量能夠自由取值的個數(shù)符號為標準差因方差的度量單位是原度量單位的平方,故將方差開方,恢復成原度量單位,得總體標準差和樣本標準差S

總體標準差樣本標準差標準差的計算直接法加權(quán)法例2.15方差和標準差的應用條件正態(tài)或近似正態(tài)分布

變異系數(shù)(coefficientofvariation)

簡記為CV適用:常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異度。計算公式描述數(shù)值變量分布特征的內(nèi)容分布范圍集中趨勢,集中位置離散趨勢,離散程度是否對稱描述數(shù)值變量的指標的正確選擇正態(tài)或近似正態(tài)分布的資料均數(shù)和標準差偏態(tài)分布的資料中位數(shù)和四分位數(shù)間距等比級數(shù)或?qū)?shù)正態(tài)分布的資料幾何均數(shù)正態(tài)分布及其應用正態(tài)分布的概念和特征

正態(tài)曲線下面積的分布規(guī)律

正態(tài)分布的應用

正態(tài)分布的概念概念:正態(tài)分布是高峰位于中央(均數(shù)所在處)、兩側(cè)逐漸降低且左右對稱、不與橫軸相交的鐘型光滑曲線,也叫高斯分布。正態(tài)分布的圖形標準正態(tài)分布(standardnormaldistribution)

向左平移個單位后再縮小倍,即按式進行變量代換得到標準正態(tài)分布標準正態(tài)分布用N(0,1)表示正態(tài)分布的特征正態(tài)曲線在橫軸上方均數(shù)處最高正態(tài)分布以均數(shù)為中心,左右對稱正態(tài)分布有兩個參數(shù),即均數(shù)與標準差正態(tài)曲線在1處各有一個拐點正態(tài)曲線下的面積分布有一定的規(guī)律

查附表1時注意事項曲線下橫軸上的總面積為100%或1。表中曲線下面積為-∞到u的面積。當分布不是標準正態(tài)分布,但已知,和X時,先按式求得u值,再查表求得曲線下某區(qū)間的面積。正態(tài)曲線下面積的分布規(guī)律采用“定積分法”可求出正態(tài)分布曲線下-∞到X之間的面積以及標準正態(tài)變量-∞到u的面積統(tǒng)計學家按標準正態(tài)分布的累積概率分布函數(shù)(u)編制了附表1,標準正態(tài)分布曲線下的面積常用的三個區(qū)間

1.645區(qū)間面積占總面積(或總觀察例數(shù))的90%

1.96區(qū)間面積占總面積(或總觀察例數(shù))的95%

2.58區(qū)間面積占總面積(或總觀察例數(shù))的99%正態(tài)分布的應用估計頻數(shù)分布制定醫(yī)學參考值范圍質(zhì)量控制正態(tài)分布是許多統(tǒng)計方法的理論基礎(chǔ)制定醫(yī)學參考值范圍也稱醫(yī)學正常值范圍它是指所謂“正常人”的解剖、生理、生化等指標的波動范圍大多數(shù)“正常人”“正常人”所謂“正常人”不是指“健康人”,而是指排除了影響所研究指標的疾病和有關(guān)因素的同質(zhì)人群。計算醫(yī)學參考值范圍常用的方法正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料。雙側(cè)界值:單側(cè)上界:;單側(cè)下界:對數(shù)正態(tài)分布法:適用于對數(shù)正態(tài)分布資料雙側(cè)界值:百分位數(shù)法:常用于偏態(tài)分布資料雙側(cè)界值:和;單側(cè)上界:,如尿鉛、發(fā)汞;或單側(cè)下界:,如肺活量。例2.21某地調(diào)查正常成年男子200人的紅細胞數(shù)得均數(shù)=55.26×1012/L,標準差S=0.38×1012/L,試估計該地正常成年男子紅細胞數(shù)的95%參考值范圍

因紅細胞數(shù)過多或過少均屬異常,故取雙側(cè)。該地正常成年男子紅細胞數(shù)的95%參考值范圍為

下限:-1.96S

=55.26-1.96×0.38=54.52(/L)

上限:+1.96S

=55.26+1.96×0.38=56.00(/L)

例2.22某地調(diào)查120名健康成年男性的第一秒肺通氣量得均數(shù)=4.2L,標準差S=0.7L,試估計該地健康成年男性第一秒肺通氣量的95%參考值范圍。

因第一秒肺通氣量僅過低屬異常,故按取單側(cè)下限。該地健康成年男性第一秒肺通氣量的95%參考值范圍為:

下限:

即該地健康成年男性第一秒肺通氣量的95%參考值范圍為不低于3.05L。制定正常值范圍時注意事項要確定一批樣本含量足夠大的“正常人”;選定同質(zhì)正常人作為研究對象控制檢測誤差需根據(jù)指標的實際用途確定單側(cè)或雙側(cè)界值;根據(jù)研究目的和實用要求選定適當?shù)陌俜纸缰担?0%,90%,95%,和99%,常用95%;根據(jù)資料的分布特點,選用恰當?shù)挠嬎惴椒ㄗ鳂I(yè)1.11.31.4總體均數(shù)的估計均數(shù)的抽樣誤差t分布總體均數(shù)的估計均數(shù)的抽樣誤差為什么進行抽樣?概念:抽樣引起的總體參數(shù)與樣本統(tǒng)計量之間的差異稱為抽樣誤差(samplingerror)。均數(shù)的抽樣誤差:抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。從總體N(4.83,0.522)中抽出100個樣本的、S、t值與的95%的可信區(qū)間

100個樣本均數(shù)的均數(shù)為4.828,與總體均數(shù)4.83接近;樣本均數(shù)的標準差為0.18。

樣本均數(shù)抽樣誤差樣本1

樣本2

樣本k總體數(shù)理統(tǒng)計的中心極限定理從正態(tài)分布N(,2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布;即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;樣本均數(shù)的總體均數(shù)仍為,樣本均數(shù)的標準差為。標準誤(standarderror)樣本均數(shù)的標準差稱標準誤,是說明均數(shù)抽樣誤差大小的指標,大,抽樣誤差大;反之,小,抽樣誤差小。標準誤的計算:標準誤的估計值:影響標準誤大小的因素

的大小與成正比與樣本含量n的平方根成反比t分布t分布的由來t分布的特征t分布曲線下的面積t分布的由來變量變換總體

樣本均數(shù)

中心極限定理標準正態(tài)分布

變量變換未知

從總體N(4.83,0.522)中抽出100個樣本的、S、t值與的95%的可信區(qū)間

圖3.2自由度分別為1、5、∞的t分布

自由度隨機變量能夠自由取值的個數(shù)

=n-限制條件的個數(shù)t分布的特征t分布是一簇單峰分布曲線。t分布以0為中心,左右對稱且均勻下降。其形態(tài)變化與自由度的大小有關(guān)。

自由度逐漸增大時,t分布逐漸逼近u分布;當=∞時,t分布即為u分布。

t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%t分布曲線下面積以0為中心左右對稱由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化附表2,t分布表的特點附表2的橫標目為自由度,縱標目為概率P,表中數(shù)值為其相應的t界值,記作t,

。附表2只列出正值,若計算的t值為負值時,可用其絕對值查表。附表2右上附圖的陰影部分表示t,以外尾部面積的概率。單側(cè)t0.05,30=1.697其通式為單側(cè):P(t≤-t,)=或P(t≥t,)=

雙側(cè):P(t≤-t/2,)+P(t≥t/2,)=圖中非陰影部分面積的概率為,

P(-t/2,<t<t/2,)=1-總體均數(shù)的估計用樣本指標估計總體指標稱為參數(shù)估計,是統(tǒng)計推斷的一個重要方面??傮w均數(shù)估計的兩種方法點估計:是直接用統(tǒng)計量估計總體參數(shù).

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論