貝葉斯統(tǒng)計(jì)學(xué)_第1頁(yè)
貝葉斯統(tǒng)計(jì)學(xué)_第2頁(yè)
貝葉斯統(tǒng)計(jì)學(xué)_第3頁(yè)
貝葉斯統(tǒng)計(jì)學(xué)_第4頁(yè)
貝葉斯統(tǒng)計(jì)學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩121頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

優(yōu)選貝葉斯統(tǒng)計(jì)學(xué)第一頁(yè),共一百二十六頁(yè)。2023/2/722.1條件方法未知參數(shù)θ的后驗(yàn)分布是集總體、樣本和先驗(yàn)三種信息于一身,是將三種信息進(jìn)行有效綜合的結(jié)果,反映了我們所能了解的有關(guān)θ的全部信息。應(yīng)該說(shuō)給統(tǒng)計(jì)推斷提供了更有利條件。----條件方法正是充分利用這一條件的方法。后驗(yàn)分布是在樣本x給定下θ的條件分布,基于后驗(yàn)分布的統(tǒng)計(jì)推斷就意味著只考慮已經(jīng)出現(xiàn)的數(shù)據(jù)(樣本觀測(cè)值),而認(rèn)為未出現(xiàn)的數(shù)據(jù)與推斷無(wú)關(guān),這一重要的觀點(diǎn)被稱為“條件觀點(diǎn)”,基于這種觀點(diǎn)提出的統(tǒng)計(jì)推斷方法被稱為條件方法。第二頁(yè),共一百二十六頁(yè)。2023/2/73經(jīng)典統(tǒng)計(jì)中統(tǒng)計(jì)推斷的簡(jiǎn)單回顧經(jīng)典統(tǒng)計(jì)統(tǒng)計(jì)推斷過(guò)程:總體樣本樣本數(shù)據(jù)x統(tǒng)計(jì)量T統(tǒng)計(jì)量分布已知未知樞軸統(tǒng)計(jì)量樞軸統(tǒng)計(jì)分布推斷第三頁(yè),共一百二十六頁(yè)。2023/2/74條件方法統(tǒng)計(jì)推斷過(guò)程綜合總體信息、樣本信息和先驗(yàn)信息得到后驗(yàn)分布?;诤篁?yàn)分布,在已出現(xiàn)的樣本基礎(chǔ)上推斷總體參數(shù)。對(duì)統(tǒng)計(jì)推斷的結(jié)果,不認(rèn)為所謂無(wú)偏性是優(yōu)良估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)。第四頁(yè),共一百二十六頁(yè)。2023/2/752.2貝葉斯點(diǎn)估計(jì)貝葉斯點(diǎn)估計(jì)的含義最大后驗(yàn)估計(jì)條件期望估計(jì)貝葉斯估計(jì)誤差第五頁(yè),共一百二十六頁(yè)。2023/2/761.貝葉斯估計(jì)的含義定義:設(shè)θ總體分布中的參數(shù),若事先從該總體中抽得一個(gè)樣本,同時(shí)根據(jù)θ的先驗(yàn)信息選擇一個(gè)先驗(yàn)分布,在貝葉斯公式的基礎(chǔ)上計(jì)算后驗(yàn)分布,這種對(duì)θ的所有推斷估計(jì)都依據(jù)后驗(yàn)分布進(jìn)行估計(jì)方法統(tǒng)稱為貝葉斯估計(jì)。貝葉斯估計(jì)的分類:①首先與經(jīng)典統(tǒng)計(jì)一樣,貝葉斯估計(jì)也可按照方式分----點(diǎn)估計(jì)和區(qū)間估計(jì)。②按照估計(jì)的具體方法分----最大后驗(yàn)估計(jì)、條件期望估計(jì)和后驗(yàn)中位數(shù)估計(jì)。第六頁(yè),共一百二十六頁(yè)。2023/2/772.最大后驗(yàn)估計(jì)若使得則稱為θ的最大后驗(yàn)估計(jì)。顯然,最大后驗(yàn)估計(jì)的特殊情形是當(dāng)先驗(yàn)分布時(shí)最大后驗(yàn)分布就是經(jīng)典統(tǒng)計(jì)中的最大似然估計(jì)。第七頁(yè),共一百二十六頁(yè)。2023/2/78一般來(lái)說(shuō),由于后驗(yàn)分布中,蘊(yùn)含了抽樣信息、先驗(yàn)信息和總體信息,其估計(jì)應(yīng)該比經(jīng)典統(tǒng)計(jì)中的“極大似然估計(jì)”要好。在“無(wú)信息”的條件下,最大后驗(yàn)估計(jì)即為最大似然估計(jì)。其他情況下,應(yīng)該比其更好。

第八頁(yè),共一百二十六頁(yè)。2023/2/79例:設(shè)是來(lái)自正態(tài)分布的樣本,其中已知。又設(shè)的先驗(yàn)分布為求的最大后驗(yàn)估計(jì)。解:由題意知其先驗(yàn)分布為第九頁(yè),共一百二十六頁(yè)。2023/2/710∴

兩邊取對(duì)數(shù)得:

第十頁(yè),共一百二十六頁(yè)。2023/2/711為了求上式的最大值,對(duì)上式求的導(dǎo)數(shù),并令導(dǎo)數(shù)為0,則:

解得:

第十一頁(yè),共一百二十六頁(yè)。2023/2/712按照教材的假設(shè),若取為一兒童智力測(cè)驗(yàn)結(jié)果的分布,

為先驗(yàn)分布,在n=1時(shí)可得X=x的條件下該兒童智商的后驗(yàn)分布是正態(tài)布,且有

當(dāng)x等于某一具體值時(shí),按此立刻估計(jì)出智商水平。此外,在正態(tài)分布條件下,中位數(shù)、眾數(shù)和期望相等,因此最大后驗(yàn)估計(jì)也就是條件期望估計(jì)和后驗(yàn)中位數(shù)估計(jì)。第十二頁(yè),共一百二十六頁(yè)。2023/2/713例:(1)設(shè)是來(lái)自正態(tài)總體的樣本,又設(shè)的先驗(yàn)分布為求的最大后驗(yàn)估計(jì)。

(2)若記,設(shè)的先驗(yàn)分布為,求的最大后驗(yàn)估計(jì)。

解:(1)樣本的似然函數(shù)為:

第十三頁(yè),共一百二十六頁(yè)。2023/2/714當(dāng)?shù)南闰?yàn)分布為時(shí),其后驗(yàn)分布為

兩邊去對(duì)數(shù)有

所以

第十四頁(yè),共一百二十六頁(yè)。2023/2/715

(2)同理,可得樣本的似然函數(shù)為

當(dāng)?shù)南闰?yàn)分布為時(shí),其后驗(yàn)分布為

第十五頁(yè),共一百二十六頁(yè)。2023/2/716取對(duì)數(shù),并對(duì)求導(dǎo)則有

所以,有的最大后驗(yàn)估計(jì)為

可見(jiàn)和的最大后驗(yàn)估計(jì)是不同的。第十六頁(yè),共一百二十六頁(yè)。2023/2/7173.條件期望估計(jì)(后驗(yàn)期望估計(jì))定義:設(shè)后驗(yàn)分布為,如果滿足:則稱為的條件期望估計(jì)。第十七頁(yè),共一百二十六頁(yè)。2023/2/718例:設(shè)服從二項(xiàng)分布,又設(shè)的先驗(yàn)分布為,求的最大后驗(yàn)估計(jì),條件期望估計(jì)。

解:①由以上知識(shí)知,樣本似然函數(shù)為

取的先驗(yàn)分布為貝塔分布

第十八頁(yè),共一百二十六頁(yè)。2023/2/719∴后驗(yàn)分布密度為

的最大后驗(yàn)估計(jì)為

第十九頁(yè),共一百二十六頁(yè)。2023/2/720當(dāng)時(shí),先驗(yàn)分布為,也即均勻分布因此,的最大后驗(yàn)分布為

此即為經(jīng)典統(tǒng)計(jì)學(xué)中的極大似然估計(jì)。

②由以上知,

可見(jiàn),后驗(yàn)密度為,其條件期望估計(jì)為

第二十頁(yè),共一百二十六頁(yè)。2023/2/721例:設(shè)是來(lái)自poisson分布總體

的樣本,又設(shè)的先驗(yàn)分布為,求參數(shù)的后驗(yàn)期望估計(jì)。

解:樣本似然函數(shù)為

其中。而其給定的先驗(yàn)分布為

第二十一頁(yè),共一百二十六頁(yè)。2023/2/722∴后驗(yàn)分布為

這仍然是伽瑪分布的“核”,所以的后驗(yàn)期望估計(jì)為

第二十二頁(yè),共一百二十六頁(yè)。2023/2/7234.貝葉斯估計(jì)的誤差引子:設(shè)是的一個(gè)貝葉斯估計(jì),在樣本給定時(shí),是一個(gè)具體的數(shù)。在取得后驗(yàn)分布以后,評(píng)價(jià)一個(gè)估計(jì)的好壞,一般計(jì)算對(duì)的后驗(yàn)均方差或后驗(yàn)標(biāo)準(zhǔn)差。這就是貝氏統(tǒng)計(jì)評(píng)價(jià)標(biāo)準(zhǔn)。說(shuō)明:在評(píng)價(jià)一個(gè)估計(jì)時(shí),經(jīng)典統(tǒng)計(jì)中是利用所謂所謂幾個(gè)優(yōu)良標(biāo)準(zhǔn):即無(wú)偏性、一致性和有效性。但貝葉斯統(tǒng)計(jì)并不接受這些所謂的標(biāo)準(zhǔn)。因?yàn)樗麄兪墙⑺袠颖镜幕A(chǔ)之上的理論。第二十三頁(yè),共一百二十六頁(yè)。2023/2/724定義1:設(shè)參數(shù)的后驗(yàn)分布

貝葉斯估計(jì)為,則的后驗(yàn)期望

稱為的后驗(yàn)均方差。其平方根

稱為的后驗(yàn)標(biāo)準(zhǔn)誤差。定義2:當(dāng)為的后驗(yàn)期望估計(jì)時(shí),則稱為后驗(yàn)方差。其中,其平方根稱為后驗(yàn)標(biāo)準(zhǔn)差。第二十四頁(yè),共一百二十六頁(yè)。2023/2/725均方差和后驗(yàn)方差有如下關(guān)系:

第二十五頁(yè),共一百二十六頁(yè)。2023/2/726

這表明當(dāng)為后驗(yàn)期望估計(jì)時(shí),可是后驗(yàn)均方差達(dá)到最小,所以實(shí)際中常使用后驗(yàn)期望估計(jì)作為的估計(jì)。因此后驗(yàn)期望估計(jì)一般優(yōu)于最大后驗(yàn)估計(jì)。

第二十六頁(yè),共一百二十六頁(yè)。2023/2/727例:設(shè)一批產(chǎn)品不合格率為θ,檢查是一個(gè)接一個(gè)地進(jìn)行,直到發(fā)現(xiàn)第一個(gè)不合格聘停止檢查,若設(shè)x為發(fā)現(xiàn)第一個(gè)不合格品時(shí),已檢查的產(chǎn)品數(shù),則x服從幾何分布,其概率分布為

現(xiàn)假如其中參數(shù)θ只能以相同的概率取1/4,2/4和3/4三個(gè)值,現(xiàn)只獲得一個(gè)樣本觀察值x=3,要求θ的最大后驗(yàn)估計(jì),并計(jì)算他的誤差。

第二十七頁(yè),共一百二十六頁(yè)。2023/2/728解:顯然,有題設(shè)條件有:θ的先驗(yàn)分布為

在θ給定的條件下,x=3的條件概率分布為

于是其聯(lián)合概率分布為

第二十八頁(yè),共一百二十六頁(yè)。2023/2/729所以,x=3的邊緣概率分布為

所以在x=3的條件下,θ的后驗(yàn)分布為

i=1,2,3第二十九頁(yè),共一百二十六頁(yè)。2023/2/730所以,θ的概率分布表為

可見(jiàn)θ的最大后驗(yàn)估計(jì)。

上述后驗(yàn)分布的均值和方差可計(jì)算:

θ1/42/43/49/208/203/20第三十頁(yè),共一百二十六頁(yè)。2023/2/731所以,后驗(yàn)均方差為

后驗(yàn)標(biāo)準(zhǔn)誤為:

第三十一頁(yè),共一百二十六頁(yè)。2023/2/7322.3區(qū)間估計(jì)引子可信區(qū)間最大后驗(yàn)可信區(qū)間第三十二頁(yè),共一百二十六頁(yè)。2023/2/7331.引子概述:對(duì)于區(qū)間估計(jì)問(wèn)題,貝葉斯方法比經(jīng)典統(tǒng)計(jì)方法易于處理,因?yàn)閰?shù)θ是一個(gè)隨機(jī)變量,且經(jīng)過(guò)計(jì)算后,它的后驗(yàn)分布已知,所以θ落在某一區(qū)間的概率是容易確定的。經(jīng)典統(tǒng)計(jì)將θ看作常量由此產(chǎn)生了置信概率計(jì)算上的困難。如計(jì)算在區(qū)間(a,b)上的概率,反之也易。第三十三頁(yè),共一百二十六頁(yè)。2023/2/734說(shuō)明:經(jīng)典統(tǒng)計(jì)中對(duì)所作的區(qū)間估計(jì)稱作置信區(qū)間。其本質(zhì)是將1-α的保證概率(置信概率)放在中間,兩邊各留出α/2的概率作為顯著性水平,在大多數(shù)統(tǒng)計(jì)學(xué)中經(jīng)典統(tǒng)計(jì)都回避了這一本質(zhì)(討論其他情況太復(fù)雜)。因?yàn)閷?shí)際上這樣得到的所謂置信區(qū)間未必就是可行、可信和最優(yōu)的估計(jì)區(qū)間。這樣所作的置信區(qū)間也實(shí)際建立概率密度是單峰、連續(xù)和對(duì)稱條件下的一種估計(jì)。由于貝葉斯統(tǒng)計(jì)處理上的簡(jiǎn)化,所以它對(duì)區(qū)間估計(jì)處理和認(rèn)識(shí)要細(xì)致一些。第三十四頁(yè),共一百二十六頁(yè)。2023/2/735貝葉斯統(tǒng)計(jì)中區(qū)間估計(jì)的分類:以上無(wú)論哪一種可信區(qū)間都可以說(shuō)θ落在某一區(qū)間。而經(jīng)典統(tǒng)計(jì)絕對(duì)不能這樣說(shuō)。第三十五頁(yè),共一百二十六頁(yè)。2023/2/7362.可信區(qū)間定義:設(shè)參數(shù)θ的后驗(yàn)分布為,對(duì)于給定的樣本和概率1-α(0<α<1),若存在這樣的兩個(gè)統(tǒng)計(jì)量,使得則稱區(qū)間為參數(shù)θ的可信水平為1-α的貝葉斯可信區(qū)間。當(dāng)將可信水平置于中間所得的可信區(qū)間為同等可信區(qū)間(由于大多屬于此類,通常將此類簡(jiǎn)稱可信區(qū)間)。為可信上、下限。當(dāng)滿足即當(dāng)()時(shí),稱區(qū)間為(單側(cè))上側(cè)可信區(qū)間。此時(shí)稱為(單側(cè))可信下限。第三十六頁(yè),共一百二十六頁(yè)。2023/2/737當(dāng)滿足即當(dāng)()時(shí),稱區(qū)間為(單側(cè))下側(cè)可信區(qū)間。此時(shí)稱為(單側(cè))可信上限。第三十七頁(yè),共一百二十六頁(yè)。2023/2/738例:對(duì)正態(tài)分布作觀察,獲得三個(gè)觀察值:2、4、3,若θ的先驗(yàn)分布為,求θ的0.95的可信區(qū)間。

解:由以前知識(shí)知道,先驗(yàn)分布是參數(shù)θ的共軛先驗(yàn)分布,所以其后驗(yàn)分布為,且

第三十八頁(yè),共一百二十六頁(yè)。2023/2/739相應(yīng)

即后驗(yàn)分布為,所以

顯然可查的所以

第三十九頁(yè),共一百二十六頁(yè)。2023/2/740即:θ的0.95的可信區(qū)間為

如果按經(jīng)典統(tǒng)計(jì)計(jì)算,則θ的0.95的置信區(qū)間為

第四十頁(yè),共一百二十六頁(yè)。2023/2/741例:經(jīng)過(guò)早期篩選后的彩色電視機(jī)的壽命服從指數(shù)分布,其密度函數(shù)為,t>0。其中θ>0是彩電的平均壽命?,F(xiàn)從一批彩電中隨機(jī)地抽取n臺(tái)進(jìn)行壽命實(shí)驗(yàn),試驗(yàn)到第r(<n)臺(tái)失效為止,其失效時(shí)間為,另外n-r臺(tái)直到實(shí)驗(yàn)停止時(shí)()還未失效這樣的試驗(yàn)稱為截尾壽命試驗(yàn),所得樣本成為截尾樣本,請(qǐng)確定彩電平均壽命θ的貝葉斯估計(jì)。

第四十一頁(yè),共一百二十六頁(yè)。2023/2/742解:樣本聯(lián)合密度(似然函數(shù))為

其中,

t>0

第四十二頁(yè),共一百二十六頁(yè)。2023/2/743選用倒伽瑪分布作為θ的先驗(yàn)分布,即

假定我們已經(jīng)從15個(gè)彩電廠收集到13142臺(tái)彩電的壽命試驗(yàn)數(shù)據(jù),共計(jì)5369812臺(tái)時(shí),此外還對(duì)9240臺(tái)彩電進(jìn)行了5547810臺(tái)時(shí)的三年跟蹤試驗(yàn),在此實(shí)驗(yàn)中總共不超過(guò)250臺(tái)失效。由這些數(shù)據(jù),專家確認(rèn)我國(guó)彩電平均壽命不低于30000小時(shí),10%的分位數(shù)大約為11250小時(shí)。由此我們可以確定其超參數(shù):

第四十三頁(yè),共一百二十六頁(yè)。2023/2/744所以,即先驗(yàn)分布為

故后驗(yàn)分布為

這仍然是一個(gè)倒伽瑪分布的核

取后驗(yàn)分布均值(即作后驗(yàn)期望估計(jì))作為θ的貝葉斯估計(jì)有

當(dāng)

代入上式有第四十四頁(yè),共一百二十六頁(yè)。2023/2/745作θ的(單側(cè))上側(cè)可信區(qū)間,如果相對(duì)應(yīng)給出1-γ=0.9,則有

值得注意的是,按照教材:

①θ~I(xiàn)Ga,則。

②則,所以,這里有

當(dāng)

第四十五頁(yè),共一百二十六頁(yè)。2023/2/746例:設(shè)來(lái)自正態(tài)總體

的樣本,其中已知,求的的可信區(qū)間。

(1)選用共軛先驗(yàn)。

(2)選用廣義均勻分布作先驗(yàn)分布。

第四十六頁(yè),共一百二十六頁(yè)。2023/2/747解:顯然μ的可信區(qū)間與選用什么樣的先驗(yàn)分布有關(guān)。我們來(lái)比較兩個(gè)不同的先驗(yàn)分布給出的可信區(qū)間的差異。

1)選用共軛先驗(yàn)分布作為共軛先驗(yàn)分布。由以前知識(shí)可知,μ的后驗(yàn)分布可為并且有:第四十七頁(yè),共一百二十六頁(yè)。2023/2/748因此,給定1-α之后從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的分布表上可查得1-α/2的分位點(diǎn),所以

這樣很快就可得到μ的1-α的可信區(qū)間為

將和代入上式,有第四十八頁(yè),共一百二十六頁(yè)。2023/2/749顯然,如果先驗(yàn)分布非常分散(即對(duì)μ的先驗(yàn)信息作用不大)則可考慮到下式成立此時(shí),上述區(qū)間可為

這就是經(jīng)典統(tǒng)計(jì)的結(jié)果。第四十九頁(yè),共一百二十六頁(yè)。2023/2/7502)選用廣義貝葉斯(廣義均勻分布)作為μ的先驗(yàn)分布,即所以,在樣本給定(樣本均值是充分統(tǒng)計(jì)量)第五十頁(yè),共一百二十六頁(yè)。2023/2/751即μ的后驗(yàn)分布是正態(tài)分布所以

因此,在給定1-α以后第五十一頁(yè),共一百二十六頁(yè)。2023/2/752相對(duì)應(yīng)的可信區(qū)間為它與經(jīng)典統(tǒng)計(jì)結(jié)果一致。這說(shuō)明,在沒(méi)有任何先驗(yàn)信息可利用的條件下,只能靠樣本信息來(lái)估計(jì)時(shí),就是經(jīng)典統(tǒng)計(jì)。第五十二頁(yè),共一百二十六頁(yè)。2023/2/7533.最大后驗(yàn)可信區(qū)間1)問(wèn)題的提出及其含義2)定義3)最大后驗(yàn)密度可信區(qū)間的計(jì)算第五十三頁(yè),共一百二十六頁(yè)。2023/2/754問(wèn)題提出及其含義首先對(duì)于給定的可信水平,事實(shí)上當(dāng)把1-α放在不同的地方就會(huì)得到不同的區(qū)間。最基本的以正態(tài)分布為例,顯然當(dāng)把1-α放在左邊和放在右邊所得到的可信區(qū)間(經(jīng)典統(tǒng)計(jì)中的置信區(qū)間)是不同的。常用的方法是放在中間。特別當(dāng)后驗(yàn)分布不是單峰,對(duì)稱和連續(xù)分布時(shí)上述區(qū)間就不一定是理想估計(jì)區(qū)間。理想的估計(jì)區(qū)間:應(yīng)該是估計(jì)精度高、保證概率大。這就提出一個(gè)要求:我們所作的區(qū)間應(yīng)該將密度值大的點(diǎn)包括在可信區(qū)間中——最大后驗(yàn)可信區(qū)間第五十四頁(yè),共一百二十六頁(yè)。2023/2/755定義設(shè)參數(shù)θ的后驗(yàn)分布為,對(duì)于給定的概率1-α(0<α<1)若在直線上存在這樣一個(gè)子區(qū)間(子集)c,滿足下列兩個(gè)條件:

1.2.對(duì)于任意給定的,總有成立。則稱區(qū)間c為θ的可信水平為1-α的最大后驗(yàn)密度可信集。若c是一個(gè)區(qū)間,則c又稱θ的1-α的最大后驗(yàn)可信區(qū)間,簡(jiǎn)稱為HPD可信區(qū)間。第五十五頁(yè),共一百二十六頁(yè)。2023/2/756最大后驗(yàn)可信區(qū)間的實(shí)際計(jì)算盡管最大后驗(yàn)可信區(qū)間的理論分析是非常清楚,含義也很明確,但是實(shí)際計(jì)算存在困難。關(guān)鍵是要比較密度值的大小。對(duì)于θ的后驗(yàn)分布實(shí)際上,有可能是離散分布、也可能是連續(xù)分布;也有可能是對(duì)稱分布,或者非對(duì)稱分布;還有可能是單峰的分布,或者多峰的分布。這些對(duì)于計(jì)算最大后驗(yàn)可信區(qū)間都是由影響的。第五十六頁(yè),共一百二十六頁(yè)。2023/2/757①當(dāng)θ為離散隨機(jī)變量時(shí),HPD可信區(qū)間很難直接找到(實(shí)現(xiàn)),操作上需要將所有θ的取值的相應(yīng)概率進(jìn)行比較。②當(dāng)θ為連續(xù)型隨機(jī)變量,但后驗(yàn)分布為多峰分布時(shí),最大后驗(yàn)可信區(qū)間c可能是幾個(gè)互不相連的幾個(gè)區(qū)間構(gòu)成。有人認(rèn)為這樣計(jì)算的區(qū)間難度也很大,而實(shí)用性卻不高,因此甚至有人建議在這種情況下放棄計(jì)算最大后驗(yàn)可信區(qū)間的準(zhǔn)則。③當(dāng)θ為連續(xù)型隨機(jī)變量,且后驗(yàn)密度函數(shù)為單峰分布時(shí),可采用計(jì)算機(jī)疊代逼近,計(jì)算HPD可信區(qū)間。特別是當(dāng)后驗(yàn)分布為對(duì)稱分布時(shí),HPD可信區(qū)間是已于確定的——等尾可信區(qū)間。第五十七頁(yè),共一百二十六頁(yè)。2023/2/758疊代方法步驟第一步,計(jì)算第二步,取,并計(jì)算由此得到。第三步,計(jì)算區(qū)間上的概率,即

第四步,若p(*)=1-α,則極為所求。若p(*)>1-α,則應(yīng)減少并重復(fù)上述步驟。若p(*)<1-α,則應(yīng)增加并重復(fù)上述步驟。第五十八頁(yè),共一百二十六頁(yè)。2023/2/759例:在前面我們已經(jīng)確定了彩電平均壽命θ的后驗(yàn)分布為倒伽碼分布即求θ的可信水平為0.9的PHD可信區(qū)間。解:θ的后驗(yàn)密度為第五十九頁(yè),共一百二十六頁(yè)。2023/2/760為了計(jì)算上的方便計(jì)算其分布函數(shù)求得取,所以有代入后驗(yàn)密度函數(shù)有第六十頁(yè),共一百二十六頁(yè)。2023/2/761所以,有區(qū)間

計(jì)算

故需增加的值,取即

相應(yīng)地,有有區(qū)間

第六十一頁(yè),共一百二十六頁(yè)。2023/2/762所以,增加

得到

所以所求的最大后驗(yàn)可信區(qū)間為

第六十二頁(yè),共一百二十六頁(yè)。2023/2/7632.4

假設(shè)檢驗(yàn)1.概述2.貝葉斯因子3.假設(shè)檢驗(yàn)的具體操作第六十三頁(yè),共一百二十六頁(yè)。2023/2/7641.概述經(jīng)典統(tǒng)計(jì)中假設(shè)檢驗(yàn)的處理方法貝葉斯假設(shè)檢驗(yàn)問(wèn)題處理的一般步驟貝葉斯假設(shè)檢驗(yàn)與經(jīng)典統(tǒng)計(jì)相比存在的優(yōu)點(diǎn)第六十四頁(yè),共一百二十六頁(yè)。2023/2/765經(jīng)典統(tǒng)計(jì)中假設(shè)檢驗(yàn)的處理方法

1.建立原假設(shè)和備擇假設(shè)。2.選擇統(tǒng)計(jì)量,在原假設(shè)為真時(shí),使其概率分布已知。3.對(duì)給定的顯著性水平,確定拒絕域W,使犯第一類錯(cuò)誤的概率不超過(guò)。4.當(dāng)由樣本所構(gòu)造的統(tǒng)計(jì)量值落入一個(gè)非常小的概率所對(duì)應(yīng)的拒絕域W時(shí),就不能接受原假設(shè)。相應(yīng)只能更加相信備擇假設(shè)。第六十五頁(yè),共一百二十六頁(yè)。2023/2/766貝葉斯假設(shè)檢驗(yàn)問(wèn)題處理的一般步驟1.根據(jù)有關(guān)理論,確定后驗(yàn)分布。2.作假設(shè):。3.計(jì)算后驗(yàn)概率:。4.計(jì)算后驗(yàn)機(jī)會(huì)比。5.判斷:當(dāng)時(shí),接受;當(dāng)時(shí),接受;當(dāng)時(shí),應(yīng)增加樣本容量第六十六頁(yè),共一百二十六頁(yè)。2023/2/767貝葉斯假設(shè)檢驗(yàn)與經(jīng)典統(tǒng)計(jì)相比存在的優(yōu)點(diǎn)1.貝葉斯假設(shè)檢驗(yàn),過(guò)程簡(jiǎn)便,含義直觀,思路清晰。2.貝葉斯假設(shè)檢驗(yàn)無(wú)需事先給出顯著性水平。3.貝葉斯假設(shè)檢驗(yàn)無(wú)需已知統(tǒng)計(jì)量及其對(duì)應(yīng)的樞軸統(tǒng)計(jì)量的概率密度。第六十七頁(yè),共一百二十六頁(yè)。2023/2/768例:設(shè)從正態(tài)總體中抽得樣本容量為10的樣本,并算得樣本均值為,設(shè)的先驗(yàn)分布是,作下列貝葉斯假設(shè)檢驗(yàn):解:由共軛先驗(yàn)分布有關(guān)知識(shí)知,后驗(yàn)分布為且有:

第六十八頁(yè),共一百二十六頁(yè)。2023/2/769所以故拒絕,相應(yīng)接受。第六十九頁(yè),共一百二十六頁(yè)。2023/2/770例:設(shè)是從二項(xiàng)分布中抽得的一個(gè)樣本,現(xiàn)考慮如下二個(gè)假設(shè):其中,若取均勻分布作為θ的先驗(yàn)分布,請(qǐng)據(jù)此作假設(shè)檢驗(yàn)。解:由題設(shè)知,第七十頁(yè),共一百二十六頁(yè)。2023/2/771∴后驗(yàn)分布為貝塔分布即:第七十一頁(yè),共一百二十六頁(yè)。2023/2/772當(dāng)n=5時(shí),數(shù)據(jù)見(jiàn)(mathcad中:貝塔分布計(jì)算表)由此可見(jiàn),當(dāng)x=0,1,2時(shí),應(yīng)該接受而當(dāng)x=3,4,5時(shí),應(yīng)該拒絕接受。第七十二頁(yè),共一百二十六頁(yè)。2023/2/773例:如上例類似,現(xiàn)設(shè)有一批產(chǎn)品的廢品率是θ,其先驗(yàn)分布是均勻分布,從該批產(chǎn)品中有放回地抽取樣本容量為100的樣本,記其廢品數(shù)為x作下列貝葉斯假設(shè)檢驗(yàn):使制定一個(gè)抽樣方案,說(shuō)明何時(shí)接,何時(shí)拒絕。解:因?yàn)槭怯蟹呕爻闃樱钥傮w分布可以看作二項(xiàng)分布即x~當(dāng)廢品數(shù)為x時(shí),其樣本聯(lián)合分布為第七十三頁(yè),共一百二十六頁(yè)。2023/2/774∴后驗(yàn)分布也就是貝塔分布∴很快就有依此相應(yīng)計(jì)算出。將和以及它們的比值分別計(jì)算出來(lái)(mathcad:貝塔分布計(jì)算表2)第七十四頁(yè),共一百二十六頁(yè)。2023/2/775第七十五頁(yè),共一百二十六頁(yè)。2023/2/7762.貝葉斯因子定義:設(shè)兩個(gè)假設(shè)和的先驗(yàn)概率分別為和,后驗(yàn)概率分別為和,則稱為貝葉斯因子。第七十六頁(yè),共一百二十六頁(yè)。2023/2/777說(shuō)明:①后驗(yàn)概率(機(jī)會(huì)),一般認(rèn)為它包含了先驗(yàn)信息和樣本數(shù)據(jù)的影響。從定義來(lái)看,貝葉斯因子它也依賴于先驗(yàn)分布和樣本數(shù)據(jù),但貝葉斯因子將后驗(yàn)機(jī)會(huì)與先驗(yàn)機(jī)會(huì)進(jìn)行對(duì)比,很多人認(rèn)為:這樣比較可能會(huì)消弱先驗(yàn)分布的影響,突出樣本數(shù)據(jù)對(duì)假設(shè)檢驗(yàn)判斷的影響。所以從這一角度來(lái)看,貝葉斯因子實(shí)際上是樣本數(shù)據(jù)對(duì)的支持程度。研究貝葉斯因子的重要性也正是在于它被解釋為“數(shù)據(jù)得出的與的機(jī)會(huì)比”。根據(jù)貝葉斯因子,有時(shí)可以將假設(shè)檢驗(yàn)的判斷問(wèn)題轉(zhuǎn)化為似然比與先驗(yàn)機(jī)會(huì)比的比較問(wèn)題。第七十七頁(yè),共一百二十六頁(yè)。2023/2/778貝葉斯假設(shè)檢驗(yàn)的簡(jiǎn)單分類1.假設(shè)檢驗(yàn)問(wèn)題的一般表述:其中和分別是θ的某一區(qū)間。第七十八頁(yè),共一百二十六頁(yè)。2023/2/7792.假設(shè)檢驗(yàn)問(wèn)題的分類,按θ的取值區(qū)間分:簡(jiǎn)單對(duì)簡(jiǎn)單假設(shè)復(fù)雜對(duì)復(fù)雜假設(shè)簡(jiǎn)單對(duì)復(fù)雜(或復(fù)雜對(duì)簡(jiǎn)單)假設(shè)第七十九頁(yè),共一百二十六頁(yè)。2023/2/7803.假設(shè)檢驗(yàn)的具體操作1)簡(jiǎn)單對(duì)簡(jiǎn)單假設(shè)其中:。也即:

一定要注意的是實(shí)際上就是先驗(yàn)概率。在發(fā)生的條件下x的條件概率為,相應(yīng)地在發(fā)生的條件下x的條件概率為。第八十頁(yè),共一百二十六頁(yè)。2023/2/781則相對(duì)應(yīng)的后驗(yàn)概率為在這里實(shí)際上貝葉斯因子就是似然比。這種情況下可利用似然比(貝氏因子)來(lái)給出判斷。第八十一頁(yè),共一百二十六頁(yè)。2023/2/782即當(dāng)時(shí),接受拒絕;相對(duì)應(yīng),當(dāng)可以看出先驗(yàn)機(jī)會(huì)比似乎就是一個(gè)所謂臨界值。第八十二頁(yè),共一百二十六頁(yè)。2023/2/783例:設(shè)x~,其中θ只有兩種可能,非0即1,若從該總體中抽取了一個(gè)樣本容量為n的樣本,其均值是充分統(tǒng)計(jì)量,要求對(duì)作出判斷。解:作假設(shè)∴在和分別為真時(shí),的似然函數(shù)為第八十三頁(yè),共一百二十六頁(yè)。2023/2/784值得注意的是,在這里我們忽略了,但是我們注意到貝葉斯因子:第八十四頁(yè),共一百二十六頁(yè)。2023/2/785理應(yīng)當(dāng)接受,拒絕。接受,拒絕。當(dāng)n=100,時(shí),貝葉斯因子的取值為要求即支持原假設(shè)的機(jī)會(huì)是很小的。第八十五頁(yè),共一百二十六頁(yè)。2023/2/7862.)復(fù)雜對(duì)復(fù)雜假設(shè)此時(shí)假設(shè)形式為即這是我們注意到第八十六頁(yè),共一百二十六頁(yè)。2023/2/787在成立時(shí),設(shè)有一先驗(yàn)分布同里,在成立時(shí),設(shè)有一先驗(yàn)分布∴這時(shí),實(shí)質(zhì)上先驗(yàn)分布表示為第八十七頁(yè),共一百二十六頁(yè)。2023/2/788所以后驗(yàn)機(jī)會(huì)比為貝葉斯因子為第八十八頁(yè),共一百二十六頁(yè)。2023/2/789可見(jiàn):①就是加權(quán)似然比。②它強(qiáng)調(diào)了樣本的作用。③它部分地消除了先驗(yàn)分布的影響。第八十九頁(yè),共一百二十六頁(yè)。2023/2/790例:一產(chǎn)品的長(zhǎng)度的誤差服從正態(tài)分布,設(shè)的先驗(yàn)分布Iga(0,0),也即,現(xiàn)在取200個(gè)做實(shí)驗(yàn),設(shè)其長(zhǎng)度的誤差平方和。作下列貝葉斯假設(shè)檢驗(yàn):解:似然函數(shù)為

第九十頁(yè),共一百二十六頁(yè)。2023/2/791第九十一頁(yè),共一百二十六頁(yè)。2023/2/792其先驗(yàn)分布為Iga(0,0),即:所以,有后驗(yàn)分布為第九十二頁(yè),共一百二十六頁(yè)。2023/2/793顯然這仍然是一個(gè)倒伽瑪分布,即又由于t=17.24,所以后驗(yàn)分布為如果你有伽瑪分布的概率分布表,由于第九十三頁(yè),共一百二十六頁(yè)。2023/2/794所以倒伽瑪分布與伽瑪分布有則后驗(yàn)概率第九十四頁(yè),共一百二十六頁(yè)。2023/2/795所以,接受如果直接用mathcad計(jì)算:倒伽瑪分布概率計(jì)算第九十五頁(yè),共一百二十六頁(yè)。2023/2/7963)簡(jiǎn)單對(duì)復(fù)雜假設(shè)此時(shí)假設(shè)的基本形式為其中:按照慣例,即為了研究方便,通常還將其看作其中:為無(wú)窮小量。第九十六頁(yè),共一百二十六頁(yè)。2023/2/797對(duì)于原假設(shè),顯然不可能存在一個(gè)連續(xù)密度函數(shù)作為θ的先驗(yàn)分布。因?yàn)閷?duì)于連續(xù)分布而言,當(dāng)時(shí)的先驗(yàn)概率為0,因此,為了研究的需要作如下處理:設(shè):當(dāng)成立時(shí)有一先驗(yàn)分布;當(dāng)成立時(shí),也有一先驗(yàn)分布第九十七頁(yè),共一百二十六頁(yè)。2023/2/798因此,類似地,先驗(yàn)分布可表示為這時(shí),若似然函數(shù)為,則利用以上給定的條件可得樣本邊緣分布第九十八頁(yè),共一百二十六頁(yè)。2023/2/799其中:。后驗(yàn)分布為當(dāng)成立時(shí),第九十九頁(yè),共一百二十六頁(yè)。2023/2/7100相應(yīng)地,當(dāng)成立時(shí),所以因此從而相應(yīng)的貝氏因子為第一百頁(yè),共一百二十六頁(yè)。2023/2/7101在這一情況下,貝氏因子較易于計(jì)算,所以通常也可先計(jì)算貝氏因子,在計(jì)算后驗(yàn)概率。第一百零一頁(yè),共一百二十六頁(yè)。2023/2/7102例:設(shè)x是從二項(xiàng)分布b(n,θ)中抽取的一個(gè)樣本,若設(shè)在上的先驗(yàn)密度為區(qū)間(0,1)上的均勻分布,現(xiàn)考察如下假設(shè):解:似然函數(shù)為第一百零二頁(yè),共一百二十六頁(yè)。2023/2/7103所以于是,貝葉斯因子為原假設(shè)成立的后驗(yàn)概率第一百零三頁(yè),共一百二十六頁(yè)。2023/2/7104當(dāng)n=5,x=3,用mathcad計(jì)算:規(guī)劃計(jì)算1第一百零四頁(yè),共一百二十六頁(yè)。2023/2/7105例:設(shè)為來(lái)自正態(tài)總體的樣本,要求作下列假設(shè)檢驗(yàn):分別為成立時(shí)的先驗(yàn)概率,且為單點(diǎn)集,若成立,。若成立,。第一百零五頁(yè),共一百二十六頁(yè)。2023/2/7106解:根據(jù)以上條件所以,第一百零六頁(yè),共一百二十六頁(yè)。2023/2/7107所以故:第一百零七頁(yè),共一百二十六頁(yè)。2023/2/7108在其他條件不變時(shí),要求越大,實(shí)際上就是要求越小。這完全符合實(shí)際。注:第一百零八頁(yè),共一百二十六頁(yè)。2023/2/7109第一百零九頁(yè),共一百二十六頁(yè)。2023/2/7110例:投擲一枚錢幣,共投擲n=10次,出現(xiàn)正面x次,問(wèn)能否認(rèn)為錢幣是均勻的?

1)x=32)x=8解:設(shè)出現(xiàn)正面的概率為,作假設(shè)又設(shè)先驗(yàn)分布第一百一十頁(yè),共一百二十六頁(yè)。2023/2/7111所以又第一百一十一頁(yè),共一百二十六頁(yè)。2023/2/7112貝葉斯因子為當(dāng)時(shí),所以:1)當(dāng)n=10,x=3,2)當(dāng)n=10,x=8,第一百一十二頁(yè),共一百二十六頁(yè)。2023/2/7113即1)當(dāng)x=3時(shí),接受。

2)當(dāng)x=8時(shí),不能接受。事實(shí)上,用mathcad計(jì)算其結(jié)果可見(jiàn)規(guī)律:規(guī)劃計(jì)算2第一百一十三頁(yè),共一百二十六頁(yè)。2023/2/71142.5預(yù)測(cè)1.預(yù)測(cè)的含義2.預(yù)測(cè)分布3.預(yù)測(cè)的基本原理第一百一十四頁(yè),共一百二十六頁(yè)。2023/2/71151.預(yù)測(cè)的含義對(duì)隨機(jī)變量X未來(lái)觀測(cè)值作出統(tǒng)計(jì)推斷稱為預(yù)測(cè)。對(duì)隨機(jī)變量未來(lái)觀測(cè)值的預(yù)測(cè),無(wú)非有兩種:①已知X~p(x/θ)(或者來(lái)自p(x/θ)的一組觀測(cè)值),在參數(shù)θ位置的條件下,對(duì)X未來(lái)觀測(cè)值作出推斷。②得到來(lái)自p(x/θ)的一組觀測(cè)值后,如何對(duì)具有密度函數(shù)g(z/θ)的隨機(jī)變量Z的觀測(cè)值作出推斷。第一百一十五頁(yè),共一百二十六頁(yè)。2023/2/71162.預(yù)測(cè)分布預(yù)測(cè)問(wèn)題也是統(tǒng)計(jì)推斷形式之一,在統(tǒng)計(jì)學(xué)中有些問(wèn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論