廣義似然比檢驗(yàn)GeneralizedLikeli課件_第1頁(yè)
廣義似然比檢驗(yàn)GeneralizedLikeli課件_第2頁(yè)
廣義似然比檢驗(yàn)GeneralizedLikeli課件_第3頁(yè)
廣義似然比檢驗(yàn)GeneralizedLikeli課件_第4頁(yè)
廣義似然比檢驗(yàn)GeneralizedLikeli課件_第5頁(yè)
已閱讀5頁(yè),還剩201頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章假設(shè)檢驗(yàn)

HypothesisTesting數(shù)理統(tǒng)計(jì)課題組第五章假設(shè)檢驗(yàn)

HypothesisTesting數(shù)理統(tǒng)1本章大綱假設(shè)檢驗(yàn)的基本概念Neyman-Pearson范式和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問(wèn)題廣義似然比檢驗(yàn)單樣本檢驗(yàn)的幾個(gè)實(shí)例兩個(gè)樣本的比較實(shí)驗(yàn)設(shè)計(jì)本章大綱假設(shè)檢驗(yàn)的基本概念2學(xué)習(xí)目標(biāo)理解假設(shè)檢驗(yàn)的直觀概念和Neyman-Pearson范式了解假設(shè)檢驗(yàn)方法的可能缺陷掌握廣義似然比檢驗(yàn)掌握正態(tài)、多項(xiàng)、泊松總體的假設(shè)檢驗(yàn)掌握HangingRootogram和概率圖掌握兩個(gè)獨(dú)立樣本的比較理解實(shí)驗(yàn)設(shè)計(jì)學(xué)習(xí)目標(biāo)理解假設(shè)檢驗(yàn)的直觀概念和Neyman-Pearson3本章詳細(xì)大綱假設(shè)檢驗(yàn)的基本概念Neyman-Pearson范式Neyman-Pearson引理顯著性水平的確定和p-值一致最優(yōu)檢驗(yàn)和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問(wèn)題置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系如何選擇原假設(shè)廣義似然比檢驗(yàn)廣義似然比方法多項(xiàng)分布的廣義似然比檢驗(yàn)泊松分布的廣義似然比檢驗(yàn)單樣本檢驗(yàn)的幾個(gè)實(shí)例兩個(gè)樣本的比較本章詳細(xì)大綱假設(shè)檢驗(yàn)的基本概念41.假設(shè)檢驗(yàn)的基本概念(HypothesisTesting)硬幣猜測(cè)游戲用似然比likelihoodratio和貝葉斯方法處理這個(gè)問(wèn)題

正面朝上的概率 硬幣0 0.5硬幣1 0.71.假設(shè)檢驗(yàn)的基本概念(HypothesisTesting5猜硬幣中的似然比如果你在10次拋擲中看到2次正面朝上。則P0(2)/P1(2)=30。這就是似然比。硬幣0出現(xiàn)這個(gè)結(jié)果的機(jī)會(huì)是硬幣1的30倍猜硬幣中的似然比如果你在10次拋擲中看到2次正面朝上。則P06猜硬幣中的似然比根據(jù)拋擲結(jié)果計(jì)算出的后驗(yàn)概率成為評(píng)判標(biāo)準(zhǔn)C是臨界值criticalvalue猜硬幣中的似然比根據(jù)拋擲結(jié)果計(jì)算出的后驗(yàn)概率成為評(píng)判標(biāo)準(zhǔn)C是7猜硬幣中的錯(cuò)判概率假定c=1。則判別規(guī)則如下:因?yàn)榻Y(jié)果有隨機(jī)性,這個(gè)規(guī)則導(dǎo)致錯(cuò)判錯(cuò)誤分成兩類(lèi):H0為真的時(shí)候拒絕H0,H0為假的時(shí)候接受H0猜硬幣中的錯(cuò)判概率假定c=1。則判別規(guī)則如下:8臨界值c對(duì)錯(cuò)判概率的影響假定c=0.1,即先驗(yàn)概率有差異臨界值c對(duì)錯(cuò)判概率的影響假定c=0.1,即先驗(yàn)概率有差異92.Neyman-Pearson范式不用貝葉斯方法規(guī)避了先驗(yàn)概率的決定對(duì)兩個(gè)假設(shè)區(qū)別對(duì)待,一個(gè)成為原假設(shè)H0(nullhypotheses),另一個(gè)成為備擇假設(shè)H1(alternativehypotheses)由此導(dǎo)致在有些場(chǎng)合下選擇原假設(shè)的困難2.Neyman-Pearson范式不用貝葉斯方法10Neyman-Pearson范式中的術(shù)語(yǔ)第I類(lèi)錯(cuò)誤(TypeIError),H0為真的時(shí)候拒絕H0檢驗(yàn)的顯著性水平(significancelevel),第I類(lèi)錯(cuò)誤的概率,通常記為第II類(lèi)錯(cuò)誤(TypeIError),H0為假的時(shí)候接受H0,其概率記為檢驗(yàn)的功效(power),H0為假的時(shí)候拒絕H0,其概率記為檢驗(yàn)統(tǒng)計(jì)量(teststatistics)拒絕域(rejectionregion)和接受域(acceptanceregion)原分布(nulldistribution),在原假設(shè)為真的條件檢驗(yàn)統(tǒng)計(jì)量所服從的分布Neyman-Pearson范式中的術(shù)語(yǔ)第I類(lèi)錯(cuò)誤(Type11Neyman-Pearson引理(lemma)Neyman-Pearson引理(lemma)12方差已知的正態(tài)方差已知的正態(tài)13方差已知的正態(tài)方差已知的正態(tài)14置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系15置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理A引理A置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理A引理A16置信區(qū)間和假設(shè)檢驗(yàn):引理A證明引理A證明則按照C(X)的定義置信區(qū)間和假設(shè)檢驗(yàn):引理A證明引理A證明則按照C(X)的定17置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理B引理B證明置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理B引理B證明18廣義似然比檢驗(yàn)

(GeneralizedLikelihoodRatioTest)似然比檢驗(yàn)在對(duì)兩個(gè)簡(jiǎn)單假設(shè)進(jìn)行檢驗(yàn)的時(shí)候是最優(yōu)的。本節(jié)介紹的廣義似然比檢驗(yàn)將能夠處理比較復(fù)雜的假設(shè)形式。其原理和似然比有相似之處。一個(gè)比較自然的度量?jī)蓚€(gè)假設(shè)可信程度的指標(biāo)是兩個(gè)假設(shè)的似然比。廣義似然比檢驗(yàn)

(GeneralizedLikelihoo19廣義似然比檢驗(yàn)因?yàn)樵趦蓚€(gè)假設(shè)中,參數(shù)都有多個(gè)可能取值,所以在可能的參數(shù)集合上取最大值是一個(gè)可以考慮的出于數(shù)學(xué)處理上的考慮,把分母改成在整個(gè)參數(shù)集合上取最大值廣義似然比檢驗(yàn)因?yàn)樵趦蓚€(gè)假設(shè)中,參數(shù)都有多個(gè)可能取值,所以出20廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)21廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)22廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)23多項(xiàng)分布的廣義似然比檢驗(yàn)考慮多項(xiàng)分布的似然比檢驗(yàn)。多項(xiàng)分布的廣義似然比檢驗(yàn)考慮多項(xiàng)分布的似然比檢驗(yàn)。24多項(xiàng)分布的廣義似然比檢驗(yàn)多項(xiàng)分布的廣義似然比檢驗(yàn)25Pearson卡方統(tǒng)計(jì)量和似然比可以證明在H0成立的條件下,Pearson統(tǒng)計(jì)量和似然比漸近等價(jià),這里用Taylor展開(kāi)做一直觀解釋。Pearson卡方統(tǒng)計(jì)量和似然比可以證明在H0成立的條件下,26Pearson卡方統(tǒng)計(jì)量和似然比Pearson卡方統(tǒng)計(jì)量和似然比27Handy-Weinberg均衡在參數(shù)估計(jì)的例子中引入了Handy-Weinberg均衡Handy-Weinberg均衡在參數(shù)估計(jì)的例子中引入了Ha28BacterialClump用顯微鏡檢查0.01毫升牛奶中的細(xì)菌群的數(shù)量.計(jì)量方法是每個(gè)方格子里的數(shù)量看起來(lái)用泊松分布是不錯(cuò)的以下數(shù)據(jù)來(lái)自BlissandFisher(1953)BacterialClump用顯微鏡檢查0.01毫升牛奶中29BacterialClumpBacterialClump30Fisher重新檢驗(yàn)孟德?tīng)?Mendel)的數(shù)據(jù)現(xiàn)代基因理論的結(jié)果孟德?tīng)柕挠^測(cè)結(jié)果Pearson卡方統(tǒng)計(jì)量=0.604Fisher重新檢驗(yàn)孟德?tīng)?Mendel)的數(shù)據(jù)現(xiàn)代基因理論31泊松散布度檢驗(yàn)(dispersiontest)泊松分布的特點(diǎn)是均值和方差相等泊松散布度檢驗(yàn)(dispersiontest)泊松分布的特32泊松散布度檢驗(yàn)(dispersiontest)泊松散布度檢驗(yàn)(dispersiontest)33泊松散布度檢驗(yàn)(dispersiontest)近似公式可以有如下解釋:等于方差估計(jì)值除以均值估計(jì)值的比率的n倍泊松分布的方差和均值相等,但一般情況下的數(shù)據(jù)的方差大于均值。因此這個(gè)檢驗(yàn)稱為散布度檢驗(yàn)比如負(fù)二項(xiàng)分布和泊松分布相比就具有更大的散布程度泊松散布度檢驗(yàn)(dispersiontest)近似公式可以34泊松散布度檢驗(yàn):石棉纖維泊松散布度檢驗(yàn):石棉纖維35泊松散布度檢驗(yàn):細(xì)菌菌落泊松散布度檢驗(yàn):細(xì)菌菌落36更多的評(píng)估擬合優(yōu)度的方法HangingrootogramsProbabilityplots正態(tài)性檢驗(yàn)更多的評(píng)估擬合優(yōu)度的方法37Hangingrootograms原理:用圖象展示觀測(cè)值和擬合值的直方圖之間的差異演示數(shù)據(jù):來(lái)自Martin,GudzinowiczandFanger1975,共152通常會(huì)用正態(tài)分布來(lái)擬合所得到的數(shù)據(jù)Hangingrootograms原理:用圖象展示觀測(cè)值和38HangingrootogramsHangingrootograms39HangingrootogramsHangingrootograms40Probabilityplots要對(duì)一組數(shù)據(jù)對(duì)某個(gè)理論分布的擬合程度進(jìn)行定性判斷,概率圖是極為有用的一種圖形工具Probabilityplots要對(duì)一組數(shù)據(jù)對(duì)某個(gè)理論分布41Probabilityplots均勻-均勻概率圖Probabilityplots均勻-均勻概率圖42ProbabilityplotsProbabilityplots43概率圖顯然這條曲線不是線性的均勻-三角概率圖概率圖顯然這條曲線均勻-三角概率圖44概率圖:概率積分變換

probabilityintegraltransformation概率圖:概率積分變換

probabilityintegra45概率圖:特定的F(x)概率圖:特定的F(x)46概率圖:Michelson光速測(cè)定實(shí)驗(yàn)結(jié)果概率圖:Michelson光速測(cè)定實(shí)驗(yàn)結(jié)果47廣義似然比檢驗(yàn)GeneralizedLikeli課件48正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)49正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)50正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)51比較兩個(gè)獨(dú)立樣本(IndependentSamples)比較兩個(gè)獨(dú)立樣本(IndependentSamples)52比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布53比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差已知比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差已知54比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知55比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知定理A的證明統(tǒng)計(jì)量可以表示為U/V.U服從標(biāo)準(zhǔn)正態(tài)分布.V等于卡方隨機(jī)變量除以其分布自由度.U/V服從t分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知定理A的證明統(tǒng)計(jì)量可56比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知57比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A問(wèn)題:今有A和B兩種決定冰的熱功當(dāng)量的方法此處放箱線圖比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A問(wèn)題:此處放箱58比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A自由度為19的t分布的.975分位點(diǎn)等于2.093即(.015,.065)比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A自由度為19的59兩樣本假設(shè)檢驗(yàn)雙側(cè)備擇假設(shè)two-sidedalternative單側(cè)備擇假設(shè)one-sidedalternative兩樣本假設(shè)檢驗(yàn)雙側(cè)備擇假設(shè)two-sidedaltern60兩樣本假設(shè)檢驗(yàn),續(xù)例A兩樣本假設(shè)檢驗(yàn),續(xù)例A61檢驗(yàn)H0對(duì)H1等價(jià)于似然比檢驗(yàn)檢驗(yàn)H0對(duì)H1等價(jià)于似然比檢驗(yàn)62求最大值:似然比的分子部分求最大值:似然比的分子部分63求最大值:似然比的分母部分求最大值:似然比的分母部分64似然比的計(jì)算結(jié)果似然比的計(jì)算結(jié)果65分子部分的變換分子部分的變換66廣義似然比檢驗(yàn)GeneralizedLikeli課件67如果方差不相等以它為t統(tǒng)計(jì)量的分母,所得到的統(tǒng)計(jì)量不再服從t分布,但近似服從自由度為下述結(jié)果取整之后的結(jié)果的t分布如果方差不相等以它為t統(tǒng)計(jì)量的分母,所得到的統(tǒng)計(jì)量不再服從t68教材例11.2.1.1[待處理]教材例11.2.1.1[待處理]69教材例11.2.1.1下面是對(duì)數(shù)變換的模型教材例11.2.1.1下面是對(duì)數(shù)變換的模型70變異系數(shù)

(coefficientofvariation)一個(gè)分布的標(biāo)準(zhǔn)差和均值的比率稱為變異系數(shù)(coefficientofvariation)變異系數(shù)

(coefficientofvariation71對(duì)于變換后的數(shù)據(jù),t統(tǒng)計(jì)量為.917,p-值為.37。沒(méi)有理由拒絕原假設(shè)。95%置信區(qū)間是(-.61,.23)對(duì)于變換后的數(shù)據(jù),t統(tǒng)計(jì)量為.917,p-值為.37。沒(méi)有理72功效(power)計(jì)算功效對(duì)于在規(guī)劃實(shí)驗(yàn)時(shí)確定樣本量的大小具有重要意義。檢驗(yàn)的功效是在原假設(shè)為假的時(shí)候拒絕原假設(shè)的概率。影響兩樣本t檢驗(yàn)的四個(gè)要素包括:功效(power)計(jì)算功效對(duì)于在規(guī)劃實(shí)驗(yàn)時(shí)確定樣本量的大小具73功效的計(jì)算功效的計(jì)算74廣義似然比檢驗(yàn)GeneralizedLikeli課件75廣義似然比檢驗(yàn)GeneralizedLikeli課件76例A。兩樣本比較。樣本量均為18,來(lái)自正態(tài)總體,標(biāo)準(zhǔn)差都是5,顯著性水平.05。例A。兩樣本比較。樣本量均為18,來(lái)自正態(tài)總體,77廣義似然比檢驗(yàn)GeneralizedLikeli課件78非參數(shù)方法:Mann-Whitney檢驗(yàn)這個(gè)檢驗(yàn)也叫Wilcoxon秩和檢驗(yàn)(WilcoxonRankSumTest)將m+n次實(shí)驗(yàn)分配給處理組和對(duì)照組,隨機(jī)抽取n個(gè)分配給對(duì)照組,剩下的m個(gè)給處理組要檢驗(yàn)的原假設(shè)是處理沒(méi)有效應(yīng)。如果原假設(shè)通過(guò)檢驗(yàn),就說(shuō)明結(jié)果中的差異是由隨機(jī)化造成的統(tǒng)計(jì)量的計(jì)算方法如下1、將m+n個(gè)觀測(cè)值放在一起,按照升序排列。(為簡(jiǎn)化問(wèn)題,假定沒(méi)有并列名次。實(shí)際上,出現(xiàn)并列名次并不影響我們的計(jì)算)。2、計(jì)算來(lái)自對(duì)照組的觀測(cè)值的秩的和3、如果秩和太大或者太小就可以拒絕原假設(shè)非參數(shù)方法:Mann-Whitney檢驗(yàn)這個(gè)檢驗(yàn)也叫Wilc79Mann-Whitney檢驗(yàn)的簡(jiǎn)單例子4位受試,隨機(jī)抽取其中兩名進(jìn)入處理組,剩下兩名在對(duì)照組表中的數(shù)據(jù)是實(shí)驗(yàn)結(jié)果(響應(yīng)值),括號(hào)中出現(xiàn)的是這個(gè)值的秩對(duì)照組的秩和等于7,處理組的秩和等于3這個(gè)差異足以讓我們相信在處理組和對(duì)照組的結(jié)果之間存在系統(tǒng)的差別嗎?讓我們來(lái)做一個(gè)概率計(jì)算。Mann-Whitney檢驗(yàn)的簡(jiǎn)單例子4位受試,隨機(jī)抽取其中80Mann-Whitney檢驗(yàn)的簡(jiǎn)單例子Mann-Whitney檢驗(yàn)的關(guān)鍵思想是:我們可以用顯式公式計(jì)算原假設(shè)下的秩和分布。在原假設(shè)下,所有觀測(cè)值的秩的組合都是等概率的。這樣一共有4!=24種結(jié)果。特別地,處理組的結(jié)果的秩有6種,也應(yīng)該是等概率出現(xiàn)的。Mann-Whitney檢驗(yàn)的簡(jiǎn)單例子Mann-Whitne81Mann-Whitney檢驗(yàn)實(shí)際中的檢驗(yàn)問(wèn)題不可能有這么小的m和nMann-Whitney檢驗(yàn)實(shí)際中的檢驗(yàn)問(wèn)題不可能有這么小的82Mann-Whitney檢驗(yàn):例A數(shù)據(jù)來(lái)自教材423頁(yè),例A排序結(jié)果,有并列排名并列排名的處理方式:比如有4個(gè)值都等于79.97。它們占據(jù)的名次為3,4,5和6,則每個(gè)數(shù)的秩都等于(3+4+5+6)/4=4.5Mann-Whitney檢驗(yàn):例A數(shù)據(jù)來(lái)自教材423頁(yè),例A83Mann-Whitney檢驗(yàn):例AMann-Whitney檢驗(yàn):例A84Mann-Whitney檢驗(yàn):定理A證明提示:利用教材7.3.1的定理A和BMann-Whitney檢驗(yàn):定理A證明提示:85Mann-Whitney檢驗(yàn):定理A的證明Mann-Whitney檢驗(yàn):定理A的證明86Mann-Whitney檢驗(yàn)Mann-Whitney檢驗(yàn)不依賴正態(tài)假設(shè)用排序名次取代實(shí)際數(shù)字,對(duì)離群值不敏感可以證明,如果正態(tài)假設(shè)成立,則Mann-Whitney檢驗(yàn)和t分布的功效幾乎相等下面我們用另一種觀點(diǎn)看待Mann-Whitney檢驗(yàn)Mann-Whitney檢驗(yàn)Mann-Whitney檢驗(yàn)不依87Mann-Whitney檢驗(yàn)Mann-Whitney檢驗(yàn)88Mann-Whitney檢驗(yàn)Mann-Whitney檢驗(yàn)89Mann-Whitney檢驗(yàn)Mann-Whitney檢驗(yàn)90廣義似然比檢驗(yàn)GeneralizedLikeli課件91Mann-Whitney檢驗(yàn)Mann-Whitney檢驗(yàn)92貝葉斯方法貝葉斯方法93貝葉斯方法貝葉斯方法94貝葉斯方法解釋是完全不一樣的貝葉斯方法解釋是完全不一樣的95貝葉斯方法補(bǔ)充例題貝葉斯方法補(bǔ)充例題96比較配對(duì)樣本

comparingpairedsamples許多實(shí)驗(yàn)中使用的不是獨(dú)立樣本,而是配對(duì)樣本。醫(yī)學(xué)實(shí)驗(yàn)。受試可能按照年齡、體重或者患病程度配對(duì),然后每個(gè)對(duì)中的一個(gè)成員會(huì)被隨機(jī)分到處理組,另一個(gè)進(jìn)入對(duì)照組。或者,對(duì)是由同一位受試在計(jì)量“之前”和“之后”構(gòu)成關(guān)鍵問(wèn)題是如何處理“不獨(dú)立”樣本的相關(guān)性比較配對(duì)樣本

comparingpairedsample97比較配對(duì)樣本比較配對(duì)樣本98比較配對(duì)樣本配對(duì)實(shí)驗(yàn)的優(yōu)勢(shì)在于,如果X和Y的相關(guān)系數(shù)大于0,則估計(jì)值的方差更小比較配對(duì)樣本配對(duì)實(shí)驗(yàn)的優(yōu)勢(shì)在于,如果X和Y的相關(guān)系數(shù)大于0,99比較配對(duì)樣本:正態(tài)分布比較配對(duì)樣本:正態(tài)分布100比較配對(duì)樣本:正態(tài)分布,例A數(shù)據(jù):Levine(1973)研究比較配對(duì)樣本:正態(tài)分布,例A數(shù)據(jù):101比較配對(duì)樣本:正態(tài)分布比較配對(duì)樣本:正態(tài)分布102比較配對(duì)樣本非參數(shù)方法,

符號(hào)秩檢驗(yàn)signedranktext比較配對(duì)樣本非參數(shù)方法,

符號(hào)秩檢驗(yàn)signedrank103第五章假設(shè)檢驗(yàn)

HypothesisTesting數(shù)理統(tǒng)計(jì)課題組第五章假設(shè)檢驗(yàn)

HypothesisTesting數(shù)理統(tǒng)104本章大綱假設(shè)檢驗(yàn)的基本概念Neyman-Pearson范式和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問(wèn)題廣義似然比檢驗(yàn)單樣本檢驗(yàn)的幾個(gè)實(shí)例兩個(gè)樣本的比較實(shí)驗(yàn)設(shè)計(jì)本章大綱假設(shè)檢驗(yàn)的基本概念105學(xué)習(xí)目標(biāo)理解假設(shè)檢驗(yàn)的直觀概念和Neyman-Pearson范式了解假設(shè)檢驗(yàn)方法的可能缺陷掌握廣義似然比檢驗(yàn)掌握正態(tài)、多項(xiàng)、泊松總體的假設(shè)檢驗(yàn)掌握HangingRootogram和概率圖掌握兩個(gè)獨(dú)立樣本的比較理解實(shí)驗(yàn)設(shè)計(jì)學(xué)習(xí)目標(biāo)理解假設(shè)檢驗(yàn)的直觀概念和Neyman-Pearson106本章詳細(xì)大綱假設(shè)檢驗(yàn)的基本概念Neyman-Pearson范式Neyman-Pearson引理顯著性水平的確定和p-值一致最優(yōu)檢驗(yàn)和假設(shè)檢驗(yàn)有關(guān)的兩個(gè)問(wèn)題置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系如何選擇原假設(shè)廣義似然比檢驗(yàn)廣義似然比方法多項(xiàng)分布的廣義似然比檢驗(yàn)泊松分布的廣義似然比檢驗(yàn)單樣本檢驗(yàn)的幾個(gè)實(shí)例兩個(gè)樣本的比較本章詳細(xì)大綱假設(shè)檢驗(yàn)的基本概念1071.假設(shè)檢驗(yàn)的基本概念(HypothesisTesting)硬幣猜測(cè)游戲用似然比likelihoodratio和貝葉斯方法處理這個(gè)問(wèn)題

正面朝上的概率 硬幣0 0.5硬幣1 0.71.假設(shè)檢驗(yàn)的基本概念(HypothesisTesting108猜硬幣中的似然比如果你在10次拋擲中看到2次正面朝上。則P0(2)/P1(2)=30。這就是似然比。硬幣0出現(xiàn)這個(gè)結(jié)果的機(jī)會(huì)是硬幣1的30倍猜硬幣中的似然比如果你在10次拋擲中看到2次正面朝上。則P0109猜硬幣中的似然比根據(jù)拋擲結(jié)果計(jì)算出的后驗(yàn)概率成為評(píng)判標(biāo)準(zhǔn)C是臨界值criticalvalue猜硬幣中的似然比根據(jù)拋擲結(jié)果計(jì)算出的后驗(yàn)概率成為評(píng)判標(biāo)準(zhǔn)C是110猜硬幣中的錯(cuò)判概率假定c=1。則判別規(guī)則如下:因?yàn)榻Y(jié)果有隨機(jī)性,這個(gè)規(guī)則導(dǎo)致錯(cuò)判錯(cuò)誤分成兩類(lèi):H0為真的時(shí)候拒絕H0,H0為假的時(shí)候接受H0猜硬幣中的錯(cuò)判概率假定c=1。則判別規(guī)則如下:111臨界值c對(duì)錯(cuò)判概率的影響假定c=0.1,即先驗(yàn)概率有差異臨界值c對(duì)錯(cuò)判概率的影響假定c=0.1,即先驗(yàn)概率有差異1122.Neyman-Pearson范式不用貝葉斯方法規(guī)避了先驗(yàn)概率的決定對(duì)兩個(gè)假設(shè)區(qū)別對(duì)待,一個(gè)成為原假設(shè)H0(nullhypotheses),另一個(gè)成為備擇假設(shè)H1(alternativehypotheses)由此導(dǎo)致在有些場(chǎng)合下選擇原假設(shè)的困難2.Neyman-Pearson范式不用貝葉斯方法113Neyman-Pearson范式中的術(shù)語(yǔ)第I類(lèi)錯(cuò)誤(TypeIError),H0為真的時(shí)候拒絕H0檢驗(yàn)的顯著性水平(significancelevel),第I類(lèi)錯(cuò)誤的概率,通常記為第II類(lèi)錯(cuò)誤(TypeIError),H0為假的時(shí)候接受H0,其概率記為檢驗(yàn)的功效(power),H0為假的時(shí)候拒絕H0,其概率記為檢驗(yàn)統(tǒng)計(jì)量(teststatistics)拒絕域(rejectionregion)和接受域(acceptanceregion)原分布(nulldistribution),在原假設(shè)為真的條件檢驗(yàn)統(tǒng)計(jì)量所服從的分布Neyman-Pearson范式中的術(shù)語(yǔ)第I類(lèi)錯(cuò)誤(Type114Neyman-Pearson引理(lemma)Neyman-Pearson引理(lemma)115方差已知的正態(tài)方差已知的正態(tài)116方差已知的正態(tài)方差已知的正態(tài)117置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系118置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理A引理A置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理A引理A119置信區(qū)間和假設(shè)檢驗(yàn):引理A證明引理A證明則按照C(X)的定義置信區(qū)間和假設(shè)檢驗(yàn):引理A證明引理A證明則按照C(X)的定120置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理B引理B證明置信區(qū)間和假設(shè)檢驗(yàn)的對(duì)偶關(guān)系:引理B引理B證明121廣義似然比檢驗(yàn)

(GeneralizedLikelihoodRatioTest)似然比檢驗(yàn)在對(duì)兩個(gè)簡(jiǎn)單假設(shè)進(jìn)行檢驗(yàn)的時(shí)候是最優(yōu)的。本節(jié)介紹的廣義似然比檢驗(yàn)將能夠處理比較復(fù)雜的假設(shè)形式。其原理和似然比有相似之處。一個(gè)比較自然的度量?jī)蓚€(gè)假設(shè)可信程度的指標(biāo)是兩個(gè)假設(shè)的似然比。廣義似然比檢驗(yàn)

(GeneralizedLikelihoo122廣義似然比檢驗(yàn)因?yàn)樵趦蓚€(gè)假設(shè)中,參數(shù)都有多個(gè)可能取值,所以在可能的參數(shù)集合上取最大值是一個(gè)可以考慮的出于數(shù)學(xué)處理上的考慮,把分母改成在整個(gè)參數(shù)集合上取最大值廣義似然比檢驗(yàn)因?yàn)樵趦蓚€(gè)假設(shè)中,參數(shù)都有多個(gè)可能取值,所以出123廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)124廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)125廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)廣義似然比檢驗(yàn):

方差未知正態(tài)總體的均值檢驗(yàn)126多項(xiàng)分布的廣義似然比檢驗(yàn)考慮多項(xiàng)分布的似然比檢驗(yàn)。多項(xiàng)分布的廣義似然比檢驗(yàn)考慮多項(xiàng)分布的似然比檢驗(yàn)。127多項(xiàng)分布的廣義似然比檢驗(yàn)多項(xiàng)分布的廣義似然比檢驗(yàn)128Pearson卡方統(tǒng)計(jì)量和似然比可以證明在H0成立的條件下,Pearson統(tǒng)計(jì)量和似然比漸近等價(jià),這里用Taylor展開(kāi)做一直觀解釋。Pearson卡方統(tǒng)計(jì)量和似然比可以證明在H0成立的條件下,129Pearson卡方統(tǒng)計(jì)量和似然比Pearson卡方統(tǒng)計(jì)量和似然比130Handy-Weinberg均衡在參數(shù)估計(jì)的例子中引入了Handy-Weinberg均衡Handy-Weinberg均衡在參數(shù)估計(jì)的例子中引入了Ha131BacterialClump用顯微鏡檢查0.01毫升牛奶中的細(xì)菌群的數(shù)量.計(jì)量方法是每個(gè)方格子里的數(shù)量看起來(lái)用泊松分布是不錯(cuò)的以下數(shù)據(jù)來(lái)自BlissandFisher(1953)BacterialClump用顯微鏡檢查0.01毫升牛奶中132BacterialClumpBacterialClump133Fisher重新檢驗(yàn)孟德?tīng)?Mendel)的數(shù)據(jù)現(xiàn)代基因理論的結(jié)果孟德?tīng)柕挠^測(cè)結(jié)果Pearson卡方統(tǒng)計(jì)量=0.604Fisher重新檢驗(yàn)孟德?tīng)?Mendel)的數(shù)據(jù)現(xiàn)代基因理論134泊松散布度檢驗(yàn)(dispersiontest)泊松分布的特點(diǎn)是均值和方差相等泊松散布度檢驗(yàn)(dispersiontest)泊松分布的特135泊松散布度檢驗(yàn)(dispersiontest)泊松散布度檢驗(yàn)(dispersiontest)136泊松散布度檢驗(yàn)(dispersiontest)近似公式可以有如下解釋:等于方差估計(jì)值除以均值估計(jì)值的比率的n倍泊松分布的方差和均值相等,但一般情況下的數(shù)據(jù)的方差大于均值。因此這個(gè)檢驗(yàn)稱為散布度檢驗(yàn)比如負(fù)二項(xiàng)分布和泊松分布相比就具有更大的散布程度泊松散布度檢驗(yàn)(dispersiontest)近似公式可以137泊松散布度檢驗(yàn):石棉纖維泊松散布度檢驗(yàn):石棉纖維138泊松散布度檢驗(yàn):細(xì)菌菌落泊松散布度檢驗(yàn):細(xì)菌菌落139更多的評(píng)估擬合優(yōu)度的方法HangingrootogramsProbabilityplots正態(tài)性檢驗(yàn)更多的評(píng)估擬合優(yōu)度的方法140Hangingrootograms原理:用圖象展示觀測(cè)值和擬合值的直方圖之間的差異演示數(shù)據(jù):來(lái)自Martin,GudzinowiczandFanger1975,共152通常會(huì)用正態(tài)分布來(lái)擬合所得到的數(shù)據(jù)Hangingrootograms原理:用圖象展示觀測(cè)值和141HangingrootogramsHangingrootograms142HangingrootogramsHangingrootograms143Probabilityplots要對(duì)一組數(shù)據(jù)對(duì)某個(gè)理論分布的擬合程度進(jìn)行定性判斷,概率圖是極為有用的一種圖形工具Probabilityplots要對(duì)一組數(shù)據(jù)對(duì)某個(gè)理論分布144Probabilityplots均勻-均勻概率圖Probabilityplots均勻-均勻概率圖145ProbabilityplotsProbabilityplots146概率圖顯然這條曲線不是線性的均勻-三角概率圖概率圖顯然這條曲線均勻-三角概率圖147概率圖:概率積分變換

probabilityintegraltransformation概率圖:概率積分變換

probabilityintegra148概率圖:特定的F(x)概率圖:特定的F(x)149概率圖:Michelson光速測(cè)定實(shí)驗(yàn)結(jié)果概率圖:Michelson光速測(cè)定實(shí)驗(yàn)結(jié)果150廣義似然比檢驗(yàn)GeneralizedLikeli課件151正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)152正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)153正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)154比較兩個(gè)獨(dú)立樣本(IndependentSamples)比較兩個(gè)獨(dú)立樣本(IndependentSamples)155比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布156比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差已知比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差已知157比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知158比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知定理A的證明統(tǒng)計(jì)量可以表示為U/V.U服從標(biāo)準(zhǔn)正態(tài)分布.V等于卡方隨機(jī)變量除以其分布自由度.U/V服從t分布比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知定理A的證明統(tǒng)計(jì)量可159比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知160比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A問(wèn)題:今有A和B兩種決定冰的熱功當(dāng)量的方法此處放箱線圖比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A問(wèn)題:此處放箱161比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A自由度為19的t分布的.975分位點(diǎn)等于2.093即(.015,.065)比較兩個(gè)獨(dú)立樣本:基于正態(tài)分布

方差未知,例A自由度為19的162兩樣本假設(shè)檢驗(yàn)雙側(cè)備擇假設(shè)two-sidedalternative單側(cè)備擇假設(shè)one-sidedalternative兩樣本假設(shè)檢驗(yàn)雙側(cè)備擇假設(shè)two-sidedaltern163兩樣本假設(shè)檢驗(yàn),續(xù)例A兩樣本假設(shè)檢驗(yàn),續(xù)例A164檢驗(yàn)H0對(duì)H1等價(jià)于似然比檢驗(yàn)檢驗(yàn)H0對(duì)H1等價(jià)于似然比檢驗(yàn)165求最大值:似然比的分子部分求最大值:似然比的分子部分166求最大值:似然比的分母部分求最大值:似然比的分母部分167似然比的計(jì)算結(jié)果似然比的計(jì)算結(jié)果168分子部分的變換分子部分的變換169廣義似然比檢驗(yàn)GeneralizedLikeli課件170如果方差不相等以它為t統(tǒng)計(jì)量的分母,所得到的統(tǒng)計(jì)量不再服從t分布,但近似服從自由度為下述結(jié)果取整之后的結(jié)果的t分布如果方差不相等以它為t統(tǒng)計(jì)量的分母,所得到的統(tǒng)計(jì)量不再服從t171教材例11.2.1.1[待處理]教材例11.2.1.1[待處理]172教材例11.2.1.1下面是對(duì)數(shù)變換的模型教材例11.2.1.1下面是對(duì)數(shù)變換的模型173變異系數(shù)

(coefficientofvariation)一個(gè)分布的標(biāo)準(zhǔn)差和均值的比率稱為變異系數(shù)(coefficientofvariation)變異系數(shù)

(coefficientofvariation174對(duì)于變換后的數(shù)據(jù),t統(tǒng)計(jì)量為.917,p-值為.37。沒(méi)有理由拒絕原假設(shè)。95%置信區(qū)間是(-.61,.23)對(duì)于變換后的數(shù)據(jù),t統(tǒng)計(jì)量為.917,p-值為.37。沒(méi)有理175功效(power)計(jì)算功效對(duì)于在規(guī)劃實(shí)驗(yàn)時(shí)確定樣本量的大小具有重要意義。檢驗(yàn)的功效是在原假設(shè)為假的時(shí)候拒絕原假設(shè)的概率。影響兩樣本t檢驗(yàn)的四個(gè)要素包括:功效(power)計(jì)算功效對(duì)于在規(guī)劃實(shí)驗(yàn)時(shí)確定樣本量的大小具176功效的計(jì)算功效的計(jì)算177廣義似然比檢驗(yàn)GeneralizedLikeli課件178廣義似然比檢驗(yàn)GeneralizedLikeli課件179例A。兩樣本比較。樣本量均為18,來(lái)自正態(tài)總體,標(biāo)準(zhǔn)差都是5,顯著性水平.05。例A。兩樣本比較。樣本量均為18,來(lái)自正態(tài)總體,180廣義似然比檢驗(yàn)GeneralizedLikeli課件181非參數(shù)方法:Mann-Whitney檢驗(yàn)這個(gè)檢驗(yàn)也叫Wilcoxon秩和檢驗(yàn)(WilcoxonRankSumTest)將m+n次實(shí)驗(yàn)分配給處理組和對(duì)照組,隨機(jī)抽取n個(gè)分配給對(duì)照組,剩下的m個(gè)給處理組要檢驗(yàn)的原假設(shè)是處理沒(méi)有效應(yīng)。如果原假設(shè)通過(guò)檢驗(yàn),就說(shuō)明結(jié)果中的差異是由隨機(jī)化造成的統(tǒng)計(jì)量的計(jì)算方法如下1、將m+n個(gè)觀測(cè)值放在一起,按照升序排列。(為簡(jiǎn)化問(wèn)題,假定沒(méi)有并列名次。實(shí)際上,出現(xiàn)并列名次并不影響我們的計(jì)算)。2、計(jì)算來(lái)自對(duì)照組的觀測(cè)值的秩的和3、如果秩和太大或者太小就可以拒絕原假設(shè)非參數(shù)方法:Mann-Whitney檢驗(yàn)這個(gè)檢驗(yàn)也叫Wilc182Mann-Whitney檢驗(yàn)的簡(jiǎn)單例子4位受試,隨機(jī)抽取其中兩名進(jìn)入處理組,剩下兩名在對(duì)照組表中的數(shù)據(jù)是實(shí)驗(yàn)結(jié)果(響應(yīng)值),括號(hào)中出現(xiàn)的是這個(gè)值的秩對(duì)照組的秩和等于7,處理組的秩和等于3這個(gè)差異足以讓我們相信在處理組和對(duì)照組的結(jié)果之間存在系統(tǒng)的差別嗎?讓我們來(lái)做一個(gè)概

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論