醫(yī)學統(tǒng)計學總體均數(shù)估計和假設(shè)檢驗_第1頁
醫(yī)學統(tǒng)計學總體均數(shù)估計和假設(shè)檢驗_第2頁
醫(yī)學統(tǒng)計學總體均數(shù)估計和假設(shè)檢驗_第3頁
醫(yī)學統(tǒng)計學總體均數(shù)估計和假設(shè)檢驗_第4頁
醫(yī)學統(tǒng)計學總體均數(shù)估計和假設(shè)檢驗_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

總體均數(shù)估計與假設(shè)檢驗尹家祥大理學院公共衛(wèi)生學院2020/12/181總體均數(shù)的估計2020/12/182普查(overallsurvey)是了解總體特征的最好方法。抽樣研究(samplingstudy)的目的就是要用樣本信息來推斷相應總體的特征,這一過程稱為統(tǒng)計推斷(statisticalinference)。統(tǒng)計推斷包括兩方面的內(nèi)容:總體參數(shù)的估計和假設(shè)檢驗(顯著性檢驗)。2020/12/183三類誤差系統(tǒng)誤差(systematicerror):由于受試對象、研究者、儀器設(shè)備、研究方法、非實驗因素影響等確定性原因造成,有一定傾向性或規(guī)律性的誤差??梢员苊?。隨機誤差(randomerror):由于多種無法控制的偶然因素引起,對同一樣品多次測量數(shù)據(jù)的不一致。無傾向性,不可避免。抽樣誤差(samplingerror):由個體變異產(chǎn)生的、由于抽樣而造成的樣本均數(shù)與樣本均數(shù)及樣本均數(shù)與總體均數(shù)之間的差異稱為均數(shù)的抽樣誤差。2020/12/184抽樣誤差的概念

總體樣本統(tǒng)計推斷抽樣抽樣誤差

抽樣誤差產(chǎn)生的根本原因是個體變異、產(chǎn)生的直接原因是抽樣。只要有抽樣,抽樣誤差就不可避免。2020/12/185抽樣抽樣誤差。。。。。。。。。。。。。。。。。。。。Normaldistribution2020/12/186樣本均數(shù)的分布特點各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)間存在差異。樣本均數(shù)分布很有規(guī)律,在正態(tài)總體中隨機抽取例數(shù)為n的樣本,樣本均數(shù)服從正態(tài)分布。樣本均數(shù)間相差較小,其變異范圍較原變量值的變異范圍縮小。在偏態(tài)總體中隨機抽樣,當n足夠大時(n>60),也近似正態(tài)分布。2020/12/187該資料是一個正偏峰的分布,用電腦從中隨機抽取樣本含量分別為5,10,30和50的樣本各1000次,計算樣本均數(shù)并繪制4個直方圖。原始數(shù)據(jù)2020/12/188(b)n=5(c)n=10

(d)n=30(e)n=502020/12/1891)從正態(tài)總體N(μ,σ2)中,隨機抽取例數(shù)為n的多個樣本,樣本均數(shù)服從正態(tài)分布;即使是從偏態(tài)總體中隨機抽樣,當n足夠大時(如n>30),也近似正態(tài)分布。數(shù)理統(tǒng)計推理和中心極限定理表明:2)從均數(shù)為μ,標準差為σ的正態(tài)或偏態(tài)總體中抽取例數(shù)為n的樣本,樣本均數(shù)的標準差即標準誤為。2020/12/1810標準誤的概念

用于表示均數(shù)抽樣誤差的指標叫樣本均數(shù)的標準差,根據(jù)其實際意義,常稱作樣本均數(shù)的標準誤(standarderror)。2020/12/1811

標準誤的大小與σ的大小成正比,與n的平方根成反比,而σ為定值,說明可以通過增加樣本例數(shù)來減少標準誤,以降低抽樣誤差。σ未知,用樣本標準差S來估計總體標準差σ。用來表示均數(shù)抽樣誤差的大小。(標準誤的理論值)(標準誤的估計值)2020/12/1812隨著nS穩(wěn)定Sx0均數(shù)的標準誤與標準差成正比,與樣本例數(shù)n的平方根成反比。因此,減少抽樣誤差最有效的辦法:增加樣本例數(shù)2020/12/1813例12000年某研究所隨機調(diào)查某地健康成年男子27人,得到血紅蛋白的均數(shù)為125g/L,標準差為15g/L。試估計該樣本均數(shù)的抽樣誤差。2020/12/1814標準誤的應用反映抽樣誤差大?。簶藴收`越大,抽樣誤差越大;反映均數(shù)的可靠性:越大,樣本均數(shù)的抽樣誤差越大,(用樣本均數(shù)推算總體均數(shù)的)可靠性差;反之,越小,均數(shù)抽樣誤差越小,(用樣本均數(shù)推算總體均數(shù)的)可靠性好。用于進行假設(shè)檢驗。2020/12/1815標準差和標準誤的區(qū)別和聯(lián)系區(qū)別:概念不同:標準差是描述觀察值(個體值)之間的變異程度,S越小,均數(shù)的代表性越好;標準誤是描述樣本均數(shù)的抽樣誤差,Sx越小,均數(shù)的可靠性越高;用途不同:標準差與均數(shù)結(jié)合估計參考值范圍,計算變異系數(shù),計算標準誤等。標準誤用于估計參數(shù)的可信區(qū)間,進行假設(shè)檢驗等。與樣本含量的關(guān)系不同:當樣本含量n足夠大時,標準差趨向穩(wěn)定;而標準誤隨n的增大而減小,甚至趨于0。聯(lián)系:標準差、標準誤均為變異指標,當樣本含量不變時,標準誤與標準差成正比。2020/12/1816t分布在統(tǒng)計應用中,可以把任何一個均數(shù)為μ,標準差為σ的正態(tài)分布N(μ,σ2)轉(zhuǎn)變?yōu)棣?0,σ=1的標準正態(tài)分布,即將正態(tài)變量值X用來代替。由于服從正態(tài)分布,故服從標準正態(tài)分布N

(0,1)。2020/12/1817

實際資料的分析中,由于σ

往往未知,故標準化轉(zhuǎn)換演變?yōu)椋悍摩?n-1的t分布,即:2020/12/1818t-分布ν(f)->degreeoffreedom自由度ν=n-12020/12/1819t分布曲線下面積規(guī)律:t分布曲線下總面積仍為1或100%t分布曲線下面積以0為中心左右對稱。t分布是一簇曲線,故t分布曲線下固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化。2020/12/1820t分布曲線特點:

1)

t分布曲線是單峰分布,它以0為中心,左右對稱。

2)t分布的形狀與樣本例數(shù)n有關(guān)。自由度越小,則越大,t值越分散,曲線的峰部越矮,尾部則偏高。

3)當n→∞時,則S逼近σ,t

分布逼近標準正態(tài)分布。

t分布不是一條曲線,而是一簇曲線。t分布的圖形和t分布表2020/12/1821總體參數(shù)估計統(tǒng)計推斷包括參數(shù)估計和假設(shè)檢驗。參數(shù)估計就是用樣本指標(統(tǒng)計量)來估計總體指標(參數(shù))。參數(shù)估計:點估計(pointestimation):用相應樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。如用估計μ、S估計σ等。其方法雖簡單,但未考慮抽樣誤差的大小。

區(qū)間估計(intervalestimation):按一定的概率(1-α)估計總體均數(shù)所在范圍(置信區(qū)間)。2020/12/1822

,即認為2000年該地所有健康成年男性血紅蛋白量的總體均數(shù)為125g/L。1.點估計:用樣本統(tǒng)計量直接作為總體參數(shù)的估計值。例2

2000年某研究所測得某地27例健康成年男性血紅蛋白量的樣本均數(shù)為125g/L,試估計其總體均數(shù)。2020/12/18232.區(qū)間估計:按預先給定的置信水平(1-α)估計總體參數(shù)的可能位置,該范圍就稱為總體參數(shù)的1-α置信區(qū)間(confidenceintervalCI)。預先給定的概率(1-α)稱為置信度,常取95%或99%。如無特別說明,一般取雙側(cè)95%。

置信區(qū)間由兩個數(shù)值即置信限(下限和上限)構(gòu)成。2020/12/1824通式:(雙側(cè))

(1)σ已知,按標準正態(tài)分布原理計算由z分布,標準正態(tài)曲線下有95%的z值在±1.96之間。95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:總體均數(shù)可信區(qū)間的計算2020/12/1825

02.5%2.5%-t0.05t0.052020/12/1826通式:(雙側(cè))(2)σ未知但樣本例數(shù)n足夠大(n>50)時

由t分布可知,自由度越大,t分布越逼近標準正態(tài)分布,此時t曲線下約有95%的t值在±1.96之間,即95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:2020/12/1827例3

某市2000年隨機測量了90名19歲健康男大學生的身高,其均數(shù)為172.2cm,標準差為4.5cm,,試估計該地19歲健康男大學生的身高的95%置信區(qū)間。該市19歲健康男大學生的身高的95%置信區(qū)間(171.3,173.1)cm2020/12/1828(3)σ未知且樣本例數(shù)n較小時,按t分布原理,此時某自由度的t曲線下約有95%的t值在±t0.05/2(ν)之間,

通式:95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:tа/2,ν是按自由度ν=n-1,由附表2查得的t值。2020/12/1829例4

已知某地27例健康成年男性血紅蛋白量的均數(shù)為,標準差S=15g/L,試問該地健康成年男性血紅蛋白量的95%和99%置信區(qū)間。

本例n=27,S=1595%CI:99%CI:2020/12/1830可信區(qū)間的確切涵義

從總體中作隨機抽樣,進行重復抽樣的試驗中,平均有1-a的可信區(qū)間包含了總體參數(shù),有a的可信區(qū)間不包括總體均數(shù)。即犯錯誤的概率為a,而a是小概率事件,對一次試驗的可能性小,因此,實際應用中就認為總體均數(shù)在算得的可信區(qū)間內(nèi)。2020/12/183195%的可信區(qū)間的理解(1)所要估計的總體參數(shù)有95%的可能在我們所估計的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數(shù)和標準差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,我們就認為該區(qū)間包含了總體均數(shù)。2020/12/1832可信區(qū)間的兩個要素準確度(accuracy):反映在可信度(1-α)的大小。1-α越接近1,就越準確。如可信度99%比95%準確。精確度(precision):反映在區(qū)間的長度。長度越小越好,在例數(shù)n確定的情況下,二者呈反比關(guān)系:準確度↑,精確度↓(范圍變寬)。要兼顧準確度和精確度,一般取95%可信區(qū)間。2020/12/1833可信區(qū)間與參考值范圍區(qū)別意義不同正常值范圍是指絕大多數(shù)觀察值在某個范圍可信區(qū)間是指按一定的可信度估計總體均數(shù)(參數(shù))的所在范圍計算公式不同可信區(qū)間參考值范圍應用不同可信區(qū)間:估計總體均數(shù)參考值范圍:判斷某項指標是否正常2020/12/1834假設(shè)檢驗2020/12/1835

假設(shè)檢驗(hypothesistest)也稱顯著性檢驗(significancetest),是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起的?還是本質(zhì)差別造成的?由于存在抽樣誤差,從總體中隨機抽樣所得的樣本均數(shù)與總體均數(shù)之間存在誤差,從同一總體中抽取的樣本均數(shù)之間也有誤差。假設(shè)檢驗原理2020/12/1836例5

某醫(yī)生測量了36名從事鉛作業(yè)的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?2020/12/1837例5μ0=140g/L已知總體μX=130.83g/LS=25.74g/L未知總體=2020/12/1838①完全由抽樣誤差引起,比較的均數(shù)來源于同一總體;的原因假設(shè)檢驗計算①②的概率判斷。②來自于不同的總體,均數(shù)之間存在本質(zhì)差別。2020/12/1839μ0Xμ=①差異完全由抽樣誤差引起2020/12/1840μ0X①差異完全由抽樣誤差引起2020/12/1841μ0Xμ≠②來自于不同的總體2020/12/1842μ0X②來自于不同的總體2020/12/1843假設(shè)檢驗的基本思想小概率思想:小概率事件:在一次試驗中認為基本上不可能發(fā)生。小概率事件的概率是相對的,統(tǒng)計分析時就是預先規(guī)定檢驗水準(sizeofatest),用表示,反證法思想:當檢驗假設(shè)H0成立時,用合適的統(tǒng)計方法獲得現(xiàn)在樣本的概率大?。≒值)。如果是小概率事件,則推斷假設(shè)是假的,因此拒絕它;如果不是小概率事件,則不能認為假設(shè)是假的,也因此不能拒絕它。2020/12/1844假設(shè)檢驗的基本步驟

1、建立假設(shè)和確定檢驗水準

2、選定檢驗方法和計算檢驗統(tǒng)計量

3、確定P值和作出推斷結(jié)論

2020/12/18451、建立假設(shè)和確定檢驗水準

(1)兩個假設(shè)無效假設(shè):H0:u=u0

備擇假設(shè):H1:

u≠u02020/12/1846對于假設(shè)檢驗,須注意:①檢驗的假設(shè)是針對總體而言,而不是針對樣本;②H0和H1是相互聯(lián)系、對立的假設(shè),后面的結(jié)論是根據(jù)H0和H1作出的,因此,兩者不是可有可無,而是缺一不可;③H0是無效假設(shè),其假設(shè)通常是:某兩個總體參數(shù)相等,或兩個總體參數(shù)之差等于0等等。④H1的內(nèi)容反映了檢驗的單雙側(cè)。2020/12/1847單側(cè)檢驗:在比較兩種藥物的療效時,根據(jù)專業(yè)知識可認為新藥不會比舊藥差,只關(guān)心新藥是否比舊藥好(至多相同,絕對排除出現(xiàn)相反的可能性),可用單側(cè)檢驗。

(2)確定單側(cè)或雙側(cè)檢驗

根據(jù)專業(yè)知識和研究目的而定2020/12/1848雙側(cè)檢驗:在比較兩種藥物的療效時,事先不能確定哪種藥的療效較好,只關(guān)心兩藥的療效有無差別,要用雙側(cè)檢驗。

雙側(cè)檢驗若有差別,單側(cè)檢驗肯定有差別;反之,單側(cè)檢驗若有差別,雙側(cè)檢驗不一定有差別。

2020/12/1849

甲均數(shù)與乙均數(shù)相比:

可能高,也可能低雙側(cè)檢驗

肯定不會低(或高)單側(cè)檢驗H1:μ>μ0μ<μ0

μ1>μ2μ1<

μ22020/12/18502020/12/1851

(3)

確定檢驗水準(顯著性水準)α

一般α=0.05,發(fā)生第一類錯誤的概率,即H0實際成立,但拒絕H0的概率。2020/12/18522、選定檢驗方法和計算檢驗統(tǒng)計量

不同設(shè)計、不同的資料類型和不同的推斷目的,選用不同的檢驗方法。

2020/12/18533、確定P值

P值是指由所規(guī)定的總體作隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值的概率。手工計算:一般是通過查界值表獲得。

統(tǒng)計軟件:直接給出精確的P值2020/12/18544、作出推斷結(jié)論(含統(tǒng)計結(jié)論和專業(yè)結(jié)論)統(tǒng)計結(jié)論:拒絕H0,接受H1,差異有統(tǒng)計學意義。專業(yè)結(jié)論:可認為…不同或不等。當P≤α時,

將獲得的事后概率P與事先規(guī)定的概率α進行比較。2020/12/1855當P>α時,統(tǒng)計結(jié)論:不拒絕H0,差異無統(tǒng)計學意義專業(yè)結(jié)論:還不能認為…不同或不等。2020/12/1856假設(shè)檢驗的特點:

1、統(tǒng)計檢驗的假設(shè)是關(guān)于總體特征的假設(shè);

2、用于檢驗的方法是以檢驗統(tǒng)計量的抽樣分布為理論根據(jù)的;

3、作出的結(jié)論是概率性的,不是絕對的肯定或絕對的否定。(無論是拒絕H0或不拒絕H0,都有可能發(fā)生錯誤)

2020/12/1857假設(shè)檢驗中α值與P值的區(qū)別:1、假設(shè)檢驗中α值是檢驗水準,是拒絕或不拒絕H0的概率標準。α的大小是人為選定的,一般取0.05。2、P值是指在H0所規(guī)定的總體中作隨機抽樣,獲得等于或大于(等于或小于)現(xiàn)有樣本統(tǒng)計量的概率。通過P值與α值的比較來確定拒絕或不拒絕H0。

2020/12/1858①未知σ②兩樣本較?。╪1與n2<50)③兩樣本均數(shù)比較時,兩樣本的總體方差相等(即方差齊)④上述都要求:資料服從對稱或正態(tài)分布。t檢驗適用條件2020/12/1859

①已知σ,x與μ比較②兩大樣本(n1與n2≥50)均數(shù)比較③上述兩種情況都要求:資料服從對稱或正態(tài)分布。u檢驗適用條件2020/12/1860t檢驗和u檢驗類型

1、樣本均數(shù)與總體均數(shù)的比較t檢驗

2、配對設(shè)計差值均數(shù)與總體均數(shù)0的比較t檢驗

3、兩樣本均數(shù)的比較t檢驗

4、兩樣本幾何均數(shù)的比較t檢驗

5、兩大樣本均數(shù)比較u檢驗

2020/12/18611、單樣本t檢驗

樣本均數(shù)代表的未知總體均數(shù)μ和已知總體均數(shù)μ0的比較μμ0=理論值、標準值、穩(wěn)定值X2020/12/1862

樣本均數(shù)與已知總體均數(shù)(一般為理論值、標準值或大量觀測所得的穩(wěn)定值)的比較,目的是推斷樣本所代表的總體與已知總體是否相等。根據(jù)σ是否已知和樣本含量n的大小,選用u檢驗或t檢驗。2020/12/1863t檢驗計算公式為:2020/12/1864例5

某醫(yī)生測量了36名從事鉛作業(yè)的血紅蛋白含量,算得其均數(shù)為=130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?2020/12/1865例5μ0=140g/L已知總體μ

=130.83g/LS=25.74g/L未知總體==2020/12/1866檢驗步驟:

例5①建立假設(shè)和確定檢驗水準

H0:μ=μ0=140g/LH1:μ≠μ0=140g/L

雙側(cè)α=0.052020/12/1867②選定檢驗方法和計算檢驗統(tǒng)計量本例n=36,=130.83g/L,S=25.74g/L,

μ0=140g/L,按下式

v=n-1=36-1=352020/12/1868例5③確定P值以v=35查附表2,t界值表,得:(v一定時,t值越大,P值越小)

2020/12/1869

查t值表時,先查P=0.05時的界值。當P<0.05時,需繼續(xù)往P更小的一側(cè)查,直到最小的P值為止。當P>0.05時,需繼續(xù)往P更大的一側(cè)查,直到最大的P值為止。如使用統(tǒng)計軟件,會給出確切的概率值。注意2020/12/1870

今0.02<P<0.05,按α=0.05水準,拒絕H0,接受H1,差異有統(tǒng)計學意義(統(tǒng)計結(jié)論),可認為從事鉛作業(yè)的男性工人平均血紅蛋白量低于正常成年男性(專業(yè)結(jié)論)。

④作出推斷結(jié)論(統(tǒng)計結(jié)論和專業(yè)結(jié)論)2020/12/1871<t0.05,v>0.05不拒絕H0無統(tǒng)計學意義≥t0.05,v≤0.05拒絕H0,接受H1有統(tǒng)計學意義≥t0.01,v≤0.01拒絕H0,接受H1有統(tǒng)計學意義t值、P值與統(tǒng)計結(jié)論的關(guān)系(α=0.05)t值P值結(jié)論差異的統(tǒng)計學意義2020/12/1872例6

根據(jù)大量調(diào)查已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機調(diào)查了30名健康男子,求得脈搏均數(shù)為74.2次/分,標準差為6.5次/分。能否認為該山區(qū)的成年男子的脈搏均數(shù)與一般男子的脈搏均數(shù)相等?2020/12/1873例6μ0=72次/分已知總體μ

=74.2次/分S=6.5次/分未知總體==2020/12/1874檢驗步驟:

例6①建立假設(shè)和確定檢驗水準

H0:μ=μ0=72次/分

H1:μ≠μ0=72次/分雙側(cè)α=0.052020/12/1875②選定檢驗方法和計算檢驗統(tǒng)計量本例n=30,=74.2,S=6.5,

μ0=72,按下式

v=n-1=30-1=292020/12/1876④作出推斷結(jié)論

今P>0.05,按α=0.05水準,不拒絕H0,差異無統(tǒng)計學意義(統(tǒng)計結(jié)論),尚不能認為該山區(qū)的成年男子的脈搏均數(shù)高于一般男子的脈搏均數(shù)(專業(yè)結(jié)論)。2020/12/18772、配對t檢驗(pairedt-test)(1)同質(zhì)的兩個受試對象配成對子分別接受兩種不同的處理。

(2)同一樣品用兩種方法(或儀器等)檢驗的結(jié)果或同一受試對象分別接受兩種不同處理。

(3)同一受試對象接受(一種)處理前后。(這是難點也是重點,易和成組設(shè)計的兩樣本t檢驗相混淆)2020/12/1878例7隨機選擇9窩中年大鼠,每窩中取兩只雌性大鼠隨機地分入甲、乙兩組,甲組大鼠不接受任何處理(即空白對照),乙組中的每只大鼠接受3mg/Kg的內(nèi)毒素。分別測得兩組大鼠的肌酐(mg/L)測定結(jié)果如下。

窩別編號:123456789

甲(對照)組:6.23.75.82.73.96.16.77.83.8

乙(處理)組:7.53.86.34.35.37.35.67.97.22020/12/1879例8

檢驗血磷含量有甲、乙兩種方法,其中,乙法具有快速、簡便等優(yōu)點。現(xiàn)用甲、乙兩法檢測相同的血液樣品,所得結(jié)果如下表。問:檢驗甲乙兩法檢出血磷是否相同,用何統(tǒng)計方法?

樣本號1234567

乙法2.740.541.205.003.851.826.51

甲法4.491.212.137.525.813.359.61

2020/12/1880例9某腦電圖室觀察家兔注射AT3前后腦電圖波形的變化,觀測結(jié)果如下。試分析注射AT3前后腦電圖波形是否發(fā)生了顯著性變化。

注射AT3前后腦電圖波形的變化率(%)

家兔編號注射前注射后

1293722844338524293553441641432020/12/1881

醫(yī)學研究中將配對計量資料也可分為:①同源配對:同一對象處理前后的數(shù)據(jù),同一樣品用兩種方法測定的結(jié)果。②異源配對:將實驗對象配成對子,對每一對子中的兩個實驗對象給予兩種不同的處理,以推斷兩種處理的效果有無差別。2020/12/188211062139374:

:n85病人號治療前治療后某藥治療前后的血沉(mm/h)同源配對(自身配對)2020/12/188311062139374:

:n85樣品號甲乙同一批樣品用兩方法測定的結(jié)果同源配對2020/12/18841A1——a1962A2——a2833A3——a351:

:::nAn——an105

編號甲乙甲指標乙指標異源配對2020/12/1885

注意:配對t檢驗的實質(zhì)同于單樣本的t檢驗,以上述第一種情況,兩同質(zhì)受試對象配對分別接受兩種不同的處理為例。若兩種處理效應相同,即μ1=μ2,則μ1-μ2=0(當成已知總體均數(shù)μ0)。因此,可將此類資料看成是差值的樣本均數(shù)所代表的未知總體均數(shù)μd與已知總體均數(shù)μ0=0的比較。2020/12/1886配對t檢驗計算公式:

0為差數(shù)的總體均數(shù)d為成對數(shù)據(jù)之差(差數(shù))的均數(shù)Sd為差數(shù)均數(shù)的標準差2020/12/18873、兩個獨立樣本t檢驗應用條件:(1)兩樣本均數(shù)來自正態(tài)總體(2)兩樣本的方差齊在正式的統(tǒng)計分析中,先要看方差是否齊,如果不齊,要選方差不齊的結(jié)果!

注:在一般的統(tǒng)計軟件中,都會同時給出方差齊性檢驗的結(jié)果2020/12/1888完全隨機設(shè)計資料的兩種類型:

1、選擇一定數(shù)量的觀察對象,將它們隨機分成兩組或多組,分別給予不同處理;

2、從兩組或多組具有不同特征的人群中,分別隨機抽取一定數(shù)量的樣本,比較某一指標在不同特征人群中是否相等。2020/12/1889兩小樣本均數(shù)比較t檢驗t’檢驗

方差不齊

方差齊變量變換

秩和檢驗

t檢驗---兩個小樣本均數(shù)的比較2020/12/1890(1)總體方差相等時的檢驗

當兩總體方差相等,即時,可將兩總體方差合并,求兩者的共同方差---合并方差。2020/12/1891

兩樣本t檢驗計算公式即:2020/12/1892例10

為研究國產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院用40名II型糖尿病病人進行同期隨機對照試驗。試驗者將這些病人隨機等分到試驗組(用阿卡波糖膠囊)和對照組(用拜唐蘋膠囊),分別測得試驗開始前和8周后的空腹血糖,算得空腹血糖下降值見下表,能否認為該國產(chǎn)四類新藥阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同?2020/12/1893

試驗組和對照組空腹血糖下降值(mmol/L)

-0.70

-5.60

2.00

2.80

0.70

3.50

4.00

5.80

7.10

-0.50

試驗組X1

(n1=20)

2.50

-1.60

1.70

3.00

0.40

4.50

4.60

2.50

6.00

-1.40

3.70

6.50

5.00

5.20

0.80

0.20

0.60

3.40

6.60

-1.10

對照組X2

(n2=20)

6.00

3.80

2.00

1.60

2.00

2.20

1.20

3.10

1.70

-2.00

2020/12/18942020/12/1895

(2)計算檢驗統(tǒng)計量

2020/12/1896(3)確定P值,作出推斷結(jié)論2020/12/1897U檢驗---兩個大樣本均數(shù)的比較

當兩個大樣本含量較大(均>100)時,可用u檢驗。2020/12/1898兩種職業(yè)的血清膽固醇水平(mmol/L)

職業(yè)類型人數(shù)均值標準差教師5374.80.72

工人6434.60.81

例11

某醫(yī)生研究血清膽固醇水平與職業(yè)的關(guān)系,得調(diào)查資料如下表,問兩種職業(yè)的血清膽固醇水平是否不同?2020/12/1899①假設(shè):H0:μ1=μ2H1:μ1≠μ2

α=0.05②計算u值448.464381.053772.06.48.4222221212__1__=+=+=nSnSxxu--2020/12/18100

③確定P值

u>

2.58P<0.01④統(tǒng)計推斷結(jié)論

P<

0.01,在α=0.05水準上拒絕H0,接受H1,差異有統(tǒng)計學意義。可認為教師的血清膽固醇水平高于工人。2020/12/18101<1.96

>0.05不拒絕H0無≥1.96

≤0.05拒絕H0,接受H1有≥2.58≤0.01拒絕H0,接受H1有高度u值、P值與統(tǒng)計結(jié)論的關(guān)系(α=0.05)u值*P值結(jié)論差異的統(tǒng)計學意義

*為雙側(cè),單側(cè)u界值為1.645、2.326。2020/12/18102兩個樣本幾何均數(shù)比較

1、應用條件:

a.兩樣本的對數(shù)值均來自正態(tài)總體

b.兩樣本的對數(shù)值的方差齊

2、檢驗公式與兩樣本均數(shù)的t檢驗和u檢驗公式相同,只是原始數(shù)據(jù)要作對數(shù)變換,用對數(shù)值的均數(shù)和標準差代公式。

2020/12/181033、檢驗步驟

在使用統(tǒng)計軟件進行分析時,先將原始數(shù)據(jù)取對數(shù),然后用對數(shù)值作一般的t檢驗。注意啦!檢驗步驟同兩樣本均數(shù)比較的t檢驗2020/12/18104可信區(qū)間與假設(shè)檢驗的關(guān)系(1)可信區(qū)間亦可用于回答假設(shè)檢驗問題。(2)可信區(qū)間比假設(shè)檢驗還可提供更多的信息。

但這并不意味著可以完全用可信區(qū)間代替假設(shè)檢驗。假設(shè)檢驗得到的P值可以較精確地說明結(jié)論的概率保證,而可信區(qū)間只能告訴我們在α水準上有無統(tǒng)計意義,卻不能象P值那樣提供精確的概率。2020/12/18105例5

某醫(yī)生測量了36名從事鉛作業(yè)的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?

95%CI為(122.12,139.54)g/L<140g/L2020/12/18106有實際意義有統(tǒng)計意義,可能有實際意義有統(tǒng)計意義,無實際意義無統(tǒng)計意義,樣本例數(shù)太少確實無差別有實際意義值H02020/12/18107變量變換

實際資料若不滿足正態(tài)性或/和方差齊性的假定,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論