假設(shè)檢驗新知識點

上傳人：露*** IP屬地：上海上傳時間：2022-03-31 格式：DOCX 頁數(shù)：6 大?。?0.95KB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩1頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、假設(shè)檢驗一、假設(shè)檢驗的概念統(tǒng)計推斷包括兩大方面的內(nèi)容，其一為參數(shù)估計(如總體均數(shù)的估計)，另一方面，即假設(shè)檢驗（hypothesis test)。假設(shè)檢驗過去亦稱顯著性檢驗（significance test)。其基本原理和步驟用以下實例說明。例為研究某山區(qū)成年男子的脈搏均數(shù)是否高于一般成年男子的脈搏均數(shù)。某醫(yī)生在一山區(qū)隨機抽查了 25名健康成年男子，求得其脈搏的均數(shù)為 742次分，標(biāo)準(zhǔn)差為60次分。根據(jù)大量調(diào)查，已知健康成年男子脈搏均數(shù)為72次分；能否據(jù)此認(rèn)為該山區(qū)成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)？本例可用下圖表示。顯然，本例其目的是判斷是否0。從所給條件看，樣本均數(shù)X與已知總

2、體均數(shù)0不等，造成兩者不等的原因有二：非同一總體，即#0；同一總體即=0，兩個均數(shù)不相等的原因在于抽樣誤差。假設(shè)檢驗的目的就是要判斷造成上面兩個均數(shù)不等的原因是哪一個。也就是說，是解決樣本均數(shù)代表性如何的問題。上例是，樣本均數(shù)比已知總體均數(shù)大，有可能是由于抽樣誤差引起，也有可能是由于所調(diào)查的樣本人群的生活環(huán)境、生活習(xí)慣、遺傳或其他原因所致，如何判斷呢，這就需要利用統(tǒng)計學(xué)方法-假設(shè)檢驗方法。假設(shè)檢驗也是統(tǒng)計分析的重要組成部分。(提問：統(tǒng)計分析包括參數(shù)估計和假設(shè)檢驗)下面我們以例題所提出的問題學(xué)習(xí)假設(shè)檢驗的基本步驟，同時學(xué)習(xí)樣本均數(shù)與總體均數(shù)比較的t檢驗。假設(shè)檢驗一般都是有“名”的，比如t檢驗，大

3、家要知道假設(shè)檢驗的命名通常是以所要計算的統(tǒng)計量來命名的，如t檢驗、F檢驗、X2檢驗等。后面有進一步介紹。二、假設(shè)檢驗的基本步驟建立檢驗假設(shè)（一)建立假設(shè)假設(shè)有兩種：一種是檢驗假設(shè)，常稱無效假設(shè)，用 H0表示。這種假設(shè)的含義是假設(shè)兩個指標(biāo)(樣本指標(biāo)與總體指標(biāo)、或兩個樣本指標(biāo))是相等的，它們的差別是由于抽樣誤差引起的。另一種是備擇假設(shè)，常稱對立假設(shè)，常用H1表示，是與H0相對立的假設(shè)，假設(shè)兩個指標(biāo)不相等，它們的差別不是由于抽樣誤差引起的，若無效假設(shè)被否決則該假設(shè)成立。在建立檢驗假設(shè)時，應(yīng)當(dāng)注意：檢驗假設(shè)是針對總體而言，而不是針對樣本；H0和 H1是相互聯(lián)系、對立的假設(shè)，后面的結(jié)論是根據(jù) HO和

4、 H1作出的，因此兩者不是可有可無，而是缺一不可；H0為無效假設(shè)，其假定通常是：某兩個（或多個)總體參數(shù)相等，或某兩個總體參數(shù)之差等于0；H1的內(nèi)容反映出檢驗的單雙側(cè)。若H1假設(shè)為0或<0，則此檢驗為單側(cè)檢驗（onesided test)。它不僅考慮有無差異，而且還考慮差異的方向。如上例研究者只關(guān)心山區(qū)成年男子的脈搏數(shù)是否高于一般；若H1為#0，則此檢驗為雙側(cè)檢驗（twosided test)。例如研究者對山區(qū)成年男子的脈搏數(shù)高于一般和低于一般同樣關(guān)心。單雙側(cè)檢驗首先應(yīng)根據(jù)專業(yè)知識來確定，同時也應(yīng)考慮所要解決問題的目的。若從專業(yè)知識判斷一種方法的結(jié)果不可能低于或高于另一種方法的結(jié)果，擬用

5、單側(cè)檢驗。在尚不能從專業(yè)知識判斷兩種結(jié)果誰高準(zhǔn)低時，則用雙側(cè)檢驗。一般認(rèn)為雙側(cè)檢驗較保守和穩(wěn)妥?，F(xiàn)以樣本均數(shù)的比較為例，用符號表示如下：樣本均數(shù)所代表的未知總體µ與已知總體均數(shù)µ0的比較（二)確定檢驗水準(zhǔn)（size of a test)，代號,過去稱顯著性水準(zhǔn)（significance level)，是一個接受或拒絕H0的概率標(biāo)準(zhǔn)，是預(yù)先規(guī)定的概率值，它確定了小概率事件標(biāo)準(zhǔn)。在實際工作中一般取=005。但的取值并非一成不變，可根據(jù)不同研究目的給予不同設(shè)置，如方差齊性檢驗、正態(tài)性檢驗等常取等于010、020，甚至更高。(三)選定檢驗方法，計算檢驗統(tǒng)計量應(yīng)根據(jù)研究目的、變量或資

6、料類型、設(shè)計方案、檢驗方法的適用條件等選擇檢驗方法，并計算統(tǒng)計量（test statistic)。如兩均數(shù)比較可選用t檢驗，(當(dāng)樣本含量較大，如n>100時可用u檢驗；兩樣本方差比較可選用F檢驗、率的比較可選用u檢驗或x2檢驗。 (四)確定P值從假設(shè)檢驗的整個邏輯推理過程可看出，P的含義是指從由H0規(guī)定的總體中隨機抽得等于及大于（或等于及小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值（如 t或u)的概率，可以簡單地理解P的含義是H0成立的概率。(五)作出統(tǒng)計推斷根據(jù)計算出的檢驗統(tǒng)計量，查相應(yīng)的界值表即可得概率P。如上例，算得t1833，查表14-16，t界值表，先從橫標(biāo)目找到自由度24一行，

7、1. 833在界值1.711與2064之間，相對應(yīng)縱標(biāo)目的單尾P值分別為005與0.025，得本例0025 P 005；余類推。將獲得的事后概率P，與事先規(guī)定的概率檢驗水準(zhǔn)進行比較而得出結(jié)論。一般來說，推斷的結(jié)論應(yīng)包含統(tǒng)計結(jié)論和專業(yè)結(jié)論兩部分。統(tǒng)計結(jié)論只說明有統(tǒng)計學(xué)意義（statistical significance)或無統(tǒng)計學(xué)意義（statistical significance)，而不能說明專業(yè)上的差異大小。它必須和專業(yè)結(jié)論有機地相結(jié)合，才能得出恰如其分、符合客觀實際的最終結(jié)論。若P，則結(jié)論為按所取的檢驗水準(zhǔn)，拒絕H0，接受H1，差別有統(tǒng)計學(xué)意義（統(tǒng)計結(jié)論)，可認(rèn)為不同或不等

8、（專業(yè)結(jié)論)。如例題得到0025P005，按所取檢驗水準(zhǔn)005，則拒絕H0，接受H1，有統(tǒng)計學(xué)意義，可認(rèn)為該山區(qū)健康成年男子脈搏均數(shù)高于一般健康成年男子。若Pa，則結(jié)論為按檢驗水準(zhǔn)，不拒絕H。，無統(tǒng)計學(xué)意義（統(tǒng)計結(jié)論)，還不能認(rèn)為不同或不等（專業(yè)結(jié)論)。P過去稱“無顯著性”，在文獻中常用 NS（non- significantno- significant。)表示，也就是人們常說的“陰性結(jié)論”。注意：雖然否定之否定為肯定，但不拒絕H0不等于完全接受H。,此時，尚沒有足夠的證據(jù)認(rèn)為H。成立。從決策的觀點：可認(rèn)為暫時“接受”它，或“陰性待觀察”。下結(jié)論時，對H0只能說：拒絕（reject)或不拒絕

9、（not reject)；而對 H1只能說：接受 H1，除此之外的其它說法均不妥當(dāng)。三.計量資料的假設(shè)檢驗假設(shè)檢驗的具體方法，通常以選定的檢驗統(tǒng)計量來命名。如檢驗統(tǒng)計量t和u分別對應(yīng)于t檢驗（ttest，亦稱 Students ttest)和 u檢驗（utest，亦稱 Ztest)。假設(shè)檢驗方法的選擇應(yīng)根據(jù)不同的資料類型和性質(zhì)，研究的目的等來確定。實際應(yīng)用時，應(yīng)弄清各種檢驗方法的用途、適用條件和注意事項。前面我們學(xué)過，統(tǒng)計資料可分為計量資料、計數(shù)資料和等級資料三種，這三種不同類型的資料都有其相應(yīng)的假設(shè)檢驗方法：計量資料：常用t檢驗(u檢驗)、F檢驗(方差分析)等；計數(shù)資料：X2檢驗等；等級資料

10、：秩和檢驗。我們首先學(xué)習(xí)計量資料的假設(shè)檢驗。同樣是計量資料，還有不同的檢驗方法，這主要是要根據(jù)具體的資料內(nèi)容的研究目的來確定。一般來說，兩均數(shù)比較用t檢驗，而兩個以上均數(shù)的比較就必須用方差分析了。t檢驗的應(yīng)用條件：當(dāng)樣本含量n較小時（如n 50，理論上要求樣本取自正態(tài)總體，兩小樣本均數(shù)比較時還要求兩樣本總體方差相等。但在實際應(yīng)用時，與上述條件略有偏離，只要其分布為單峰近似對稱分布，則對結(jié)果亦影響不大。u檢驗的應(yīng)用條件：樣本含量n較大, 一般要求n>50。其實，u檢驗和t檢驗都屬同類，其方法步驟也基本相同，不同的地方僅在于確定P值時界值的選擇。(一)樣本均數(shù)與總體均數(shù)比較的t檢驗下面我們以

11、例題提出的問題為例，學(xué)習(xí)假設(shè)檢驗的一般步驟方法、掌握樣本均數(shù)與總體均數(shù)比較的t檢驗的過程。在例題中，某醫(yī)生在一山區(qū)隨機抽查了 25名健康成年男子，其脈搏的均數(shù)為 742次分，標(biāo)準(zhǔn)差為60次分，這是一個樣本。而已知的一般健康成人脈搏均數(shù)72次分可作為總體均數(shù)。這是一個樣本均數(shù)與已知總體均數(shù)比較的問題，故選用t檢驗方法。(有的同學(xué)會問，不是說總體均數(shù)一般為未知的嗎？是的，但醫(yī)學(xué)上也有一些數(shù)據(jù)比較穩(wěn)定、經(jīng)過長時間研究應(yīng)用的常數(shù)，如醫(yī)學(xué)正常值、理論值、標(biāo)準(zhǔn)值，這些有時可作為總體均數(shù)來應(yīng)用。)建立檢驗假設(shè)，確定檢驗水準(zhǔn)H0：µ=µ0，即山區(qū)成年男子平均脈搏數(shù)與一般成年男子相等H1：&

12、#181;µ0，即山區(qū)成年男子平均脈搏數(shù)高于一般成年男子=005選定檢驗方法，計算檢驗統(tǒng)計量因該例為計量資料且 n=2550，故選用樣本均數(shù)與總體均數(shù)比較的 t檢驗。已知 X=742次分，S=60次分，按下式計算統(tǒng)計量： t=(X-µ)/sx=1.833確定P值按自由度=n-1=25-1=24查t界值表得：單側(cè)t0.05,24=1.711; t0.01,24=2.492 t0.05,24=1.711<t< t0.01,24 故單側(cè)0.01<P<0.05。統(tǒng)計推斷，下結(jié)論因0.01<P<0.05，按=0.05的水準(zhǔn)拒絕H0，接

13、受H1，差別有統(tǒng)計學(xué)意義?？烧J(rèn)為該山區(qū)健康成年男子脈搏數(shù)高于一般成年男子。這個例題是一個單側(cè)t檢驗，就是說研究者只關(guān)心山區(qū)健康成年男子脈搏數(shù)是否高于一般成年男子，并不認(rèn)為相反結(jié)果會成立。但是醫(yī)學(xué)上的大部分研究都必須關(guān)心到正反兩種結(jié)果，如一種新療法與傳統(tǒng)療法的療效比較等，所以，除非有確實必要或?qū)I(yè)知識的要求，我們一般都要用雙側(cè)檢驗。雙側(cè)檢驗和單側(cè)檢驗的區(qū)別在于建立假設(shè)時的敘述；確定P值時查表是用單側(cè)或是雙側(cè)(二)配對資料的t檢驗有以下兩種不同的配對資料：將實驗對象配成對子，分別給予不同的處理，以推斷兩種處理是否有區(qū)別；對同一實驗對象，比較其處理前后的差別，以推斷某種處理有無作用，如臨床上病人治療

14、前后某個指標(biāo)的對比。(三)兩樣本均數(shù)的t檢驗又稱成組t檢驗，適用于完全隨機設(shè)計兩樣本均數(shù)的比較。完全隨機設(shè)計是分別從兩個研究總體中隨機抽取樣本，對這兩個樣本均數(shù)進行比較，以推斷它們所代表的總體是否一致。其他的還有兩大樣本比較的u檢驗、兩幾何均數(shù)比較的t檢驗等。這些檢驗思路、方法基本相同，只不過是計算統(tǒng)計量的公式不同而已。四假設(shè)檢驗應(yīng)注意的問題(1)要有嚴(yán)密的研究設(shè)計，這是假設(shè)檢驗的前提。組間應(yīng)具可比性，也就是除對比的主要因素（如用新藥和用安慰劑)外，其它可能影響結(jié)果的因素（如年齡，性別，病程，病情輕重等),在對比組間應(yīng)盡可能相同或相近；應(yīng)保證樣本是從同質(zhì)總體中隨機抽取。(2)不同變量或資料應(yīng)選

15、用不同的檢驗方法。應(yīng)根據(jù)分析目的、資料（變量)類型和分布、設(shè)計方案、樣本含量大小等選用適當(dāng)?shù)臋z驗方法。如：配對設(shè)計的計量資料采用配對t檢驗，而完全隨機的兩樣本定量（變量)資料，若為小樣本（即任一組 n 50)且方差齊，則選用兩小樣本t檢驗；若方差不齊，則選用近似t'檢驗（CochranCox法或Satterthwaite法)；若為大樣本（每組n50)，則可選用大樣本u檢驗。(3)正確理解“顯著性”一詞的含義。差別有統(tǒng)計學(xué)意義，過去稱差別有“顯著性”，不能理解為差異大。假設(shè)檢驗的結(jié)果并不指差異的大小，只能反映兩者是否相同或不同，因此一般采用“有無統(tǒng)計學(xué)意義”一詞表達。差異的大小只能根據(jù)專

16、業(yè)知識予以確定。(4)作結(jié)論不能絕對化。因統(tǒng)計結(jié)論具有概率性質(zhì)，不宜用“肯定”，“一定”，“必定”等詞。在報告結(jié)論時，最好應(yīng)列出檢驗統(tǒng)計量的值，盡量寫出P值的確切范圍（并注明單側(cè)還是雙側(cè))，如寫成0025P005，以便讀者與同類研究進行比較。(5) 統(tǒng)計“顯著性”與醫(yī)學(xué)臨床生物學(xué)“顯著性”（statistical vs medical clinical biological significance)。統(tǒng)計“顯著性”對應(yīng)于統(tǒng)計結(jié)論，而醫(yī)學(xué)臨床生物學(xué)“顯著性”對應(yīng)于專業(yè)結(jié)論。假設(shè)檢驗是為各專業(yè)服務(wù)的，統(tǒng)計結(jié)論必須和專業(yè)結(jié)論有機的相結(jié)合，才能得出恰如其分、符合客觀實際的最終結(jié)論。若統(tǒng)計結(jié)

17、論和專業(yè)結(jié)論一致，則最終結(jié)論就和這兩者均一致（即均有或均無意義)；若統(tǒng)計結(jié)論和專業(yè)結(jié)論不一致，則最終結(jié)論需根據(jù)實際情況加以考慮。當(dāng)統(tǒng)計結(jié)論有意義，而專業(yè)結(jié)論無意義，則可能由于樣本含量過大或設(shè)計存在嚴(yán)重的偏倚（偏性)，那么最終結(jié)論則沒有意義。例如：有人欲比較A、B兩種降壓藥物的降壓效果，隨機抽取了高血壓病人各100名，分別測定兩組病人服藥后舒張壓的改變值，得兩組舒張壓改變值之差的平均數(shù)為011kPa。作兩大樣本u檢驗得u6306，P0001，有統(tǒng)計學(xué)意義。但因A、B兩組高血壓病人服藥后舒張壓改變值之差較小，僅011kPa，不足有臨床意義的差值067kPa，故最終結(jié)論并無實際意義。相反，統(tǒng)計結(jié)論無意義，而專業(yè)結(jié)論被認(rèn)為有意義，那就應(yīng)當(dāng)檢查設(shè)計是否合理、統(tǒng)計分析方法應(yīng)用是否恰

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

假設(shè)檢驗新知識點

文檔簡介

溫馨提示

最新文檔

評論

假設(shè)檢驗新知識點

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔