版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章模型選擇和模型評(píng)估MLE3-1第一頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-2上節(jié)課內(nèi)容總結(jié)后驗(yàn)的仿真模擬貝葉斯推理與MLE例令為的極大似然估計(jì),在合適的正則條件下,后驗(yàn)均值為貝葉斯推理的優(yōu)點(diǎn)可以方便的結(jié)合先驗(yàn)信息數(shù)據(jù)和先驗(yàn)同等對(duì)待由后驗(yàn)可以同時(shí)推出點(diǎn)估計(jì)和區(qū)間估計(jì)
第二頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-3第七章:模型選擇和模型評(píng)估內(nèi)容:估計(jì)選擇(Ch13)模型選擇(Ch14,Ch9,統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ)第7章)第三頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-4估計(jì)選擇有幾個(gè)不同的估計(jì),哪個(gè)估計(jì)更好一些?統(tǒng)計(jì)決策理論第四頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-5損失函數(shù)損失函數(shù):度量真值與估計(jì)之間的差異損失函數(shù)舉例平方誤差損失絕對(duì)誤差損失損失0-1損失KullbackLeibler損失第五頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-6風(fēng)險(xiǎn)函數(shù)風(fēng)險(xiǎn)函數(shù):損失的均值一個(gè)估計(jì)的風(fēng)險(xiǎn)是對(duì)平方誤差損失,風(fēng)險(xiǎn)為MSE風(fēng)險(xiǎn)是的函數(shù)比較不同的估計(jì),轉(zhuǎn)化為比較不同估計(jì)的風(fēng)險(xiǎn)但并不能清楚地回答哪個(gè)估計(jì)更好第六頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-7風(fēng)險(xiǎn)比較沒(méi)有一個(gè)估計(jì)的風(fēng)險(xiǎn)在所有的θ值都超過(guò)另外一個(gè)第七頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-8風(fēng)險(xiǎn)比較風(fēng)險(xiǎn)函數(shù)的兩個(gè)單值概述最大風(fēng)險(xiǎn)貝葉斯風(fēng)險(xiǎn)其中為θ的先驗(yàn)。第八頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-9決策規(guī)則
(DecisionRules)決策規(guī)則是估計(jì)的別名最小化貝葉斯風(fēng)險(xiǎn)的決策規(guī)則成為貝葉斯規(guī)則或貝葉斯估計(jì),即為對(duì)應(yīng)先驗(yàn)f的貝葉斯估計(jì)其中下界是對(duì)所有的估計(jì)計(jì)算最小化最大風(fēng)險(xiǎn)的估計(jì)稱為最小最大規(guī)則其中下界是對(duì)所有的估計(jì)計(jì)算第九頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-10貝葉斯估計(jì)給定一個(gè)模型(先驗(yàn)和后驗(yàn))和損失函數(shù),就可以找到貝葉斯規(guī)則若,則貝葉斯規(guī)則為后驗(yàn)均值若,則貝葉斯規(guī)則為后驗(yàn)中值若為0-1損失,則貝葉斯規(guī)則為后驗(yàn)眾數(shù)第十頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-11最小最大規(guī)則找最小最大規(guī)則,或者證明一個(gè)估計(jì)是最小最大估計(jì)是一件很困難的事情。但還是有一個(gè)簡(jiǎn)單的方法:有些貝葉斯估計(jì)(如風(fēng)險(xiǎn)為常數(shù))是最小最大估計(jì)令對(duì)應(yīng)先驗(yàn)f的貝葉斯估計(jì):假設(shè)則為最小最大估計(jì),且f稱為最小受歡迎先驗(yàn)(leastfavorableprior)。上述結(jié)論一個(gè)簡(jiǎn)單的結(jié)果有:如果一個(gè)貝葉斯規(guī)則的風(fēng)險(xiǎn)為常數(shù),則它是最小最大估計(jì)。第十一頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-12MLE為近似最小最大估計(jì)對(duì)滿足弱正則條件的參數(shù)模型,極大似然估計(jì)近似為最小最大估計(jì)。對(duì)均方誤差損失,通常根據(jù)Cramer-Rao不等式,這是所有無(wú)偏估計(jì)的方差的下界。第十二頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-13MLE為近似最小最大估計(jì)因此對(duì)所有估計(jì),有對(duì)大數(shù)N,MLE為近似最小最大估計(jì)。因此,對(duì)大多數(shù)參數(shù)模型,當(dāng)有大量樣本時(shí),MLE近似為最小最大估計(jì)和貝葉斯估計(jì)。ManyNormalMeans情況不成立(不是大樣本)第十三頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-14可接受性
(Admissibility)一個(gè)估計(jì)如果在θ所有值上都比其它估計(jì)的風(fēng)險(xiǎn)大,則該估計(jì)不是我們所希望的。如果存在一個(gè)其它的規(guī)則,使得則該估計(jì)是不可接受的。否則,是可接受的。至少存在一個(gè)θ第十四頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-15可接受性可接受性是與其他表示估計(jì)好壞的方法有何關(guān)系?在一些正則條件下,如果為貝葉斯規(guī)則且有有限風(fēng)險(xiǎn),則它是可接受的。如果的風(fēng)險(xiǎn)為常數(shù)且是可接受的,則它是最小最大估計(jì)。第十五頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-16許多正態(tài)均值
(ManyNormalMeans)ManyNormalMeans是一個(gè)原型問(wèn)題,與一般的非參數(shù)回歸或密度估計(jì)等價(jià)。對(duì)這個(gè)問(wèn)題,以前許多關(guān)于極大似然估計(jì)的正面的結(jié)論都不再滿足。令,表示數(shù)據(jù),表示未知參數(shù),c>0,這里參數(shù)的數(shù)目與觀測(cè)數(shù)據(jù)一樣多第十六頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-17ManyNormalMeansMLE為,損失函數(shù)為MLE的風(fēng)險(xiǎn)為最小最大估計(jì)的風(fēng)險(xiǎn)近似為,且存在這樣一個(gè)估計(jì)能達(dá)到該風(fēng)險(xiǎn)。也就是說(shuō),存在風(fēng)險(xiǎn)比MLE更小的估計(jì),因此MLE是不可接受的。在實(shí)際應(yīng)用中,風(fēng)險(xiǎn)的差值可能很重要。
因此對(duì)高維問(wèn)題或非參數(shù)問(wèn)題,MLE并不是最優(yōu)估計(jì)。另外在非參數(shù)場(chǎng)合,MLE的魯棒性也不是很好。第十七頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-18底線根據(jù)這些工具,怎樣選擇估計(jì)呢?如果一個(gè)估計(jì)是不可接受的,則該估計(jì)一定是不好的。如果你信仰貝葉斯觀點(diǎn),則你可以用貝葉斯規(guī)則如果最小最大性滿足應(yīng)用要求,可以使用最小最大估計(jì)。第十八頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-19模型選擇給定一個(gè)估計(jì)和風(fēng)險(xiǎn)函數(shù),應(yīng)該選擇哪個(gè)模型/參數(shù)?第十九頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-20“模型”我們說(shuō)的“模型”有時(shí)指的是模型類別,例如所有2個(gè)高斯的混合模型和所有3個(gè)高斯的混合模型。有時(shí)也指在一個(gè)類別的模型中的一員,如參數(shù)的值為特定值。也就是說(shuō),模型的類別是固定的,而考慮的是不同的參數(shù)值。在實(shí)際應(yīng)用中,我們通常同時(shí)考慮上述兩種情況,也就是說(shuō):第二十頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-21訓(xùn)練與測(cè)試訓(xùn)練數(shù)據(jù)目標(biāo)/類別學(xué)習(xí)模型測(cè)試數(shù)據(jù)應(yīng)用模型第二十一頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-22訓(xùn)練誤差與測(cè)試誤差
測(cè)試誤差,亦稱泛化誤差(generalizationerror),是在與訓(xùn)練數(shù)據(jù)同分布的獨(dú)立的測(cè)試樣本上的期望預(yù)測(cè)誤差:訓(xùn)練誤差是在訓(xùn)練樣本上的平均損失:第二十二頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-23訓(xùn)練誤差與測(cè)試誤差我們的目標(biāo):選擇使測(cè)試誤差最小的模型M,稱為模型選擇。第二十三頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-24訓(xùn)練誤差與測(cè)試誤差選擇次優(yōu)模型:過(guò)擬合/欠擬合第二十四頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-25訓(xùn)練誤差與測(cè)試誤差訓(xùn)練誤差為預(yù)測(cè)風(fēng)險(xiǎn)的過(guò)小估計(jì):第二十五頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-26模型選擇和模型評(píng)估為了進(jìn)行模型選擇,我們只需知道不同模型的測(cè)試誤差的相對(duì)值。漸近近似有時(shí)對(duì)比較不同模型的測(cè)試誤差很有用。通常對(duì)誤差的真值沒(méi)有很好的估計(jì)。當(dāng)樣本有限時(shí),漸近近似通常還不能得到足夠好的估計(jì)。這種情況下我們可以采用重采樣(resampling)方法。當(dāng)然如過(guò)我們對(duì)測(cè)試誤差有一種很好的方法來(lái)直接估計(jì),我們可以用它來(lái)進(jìn)行模型選擇。第二十六頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-27訓(xùn)練誤差的樂(lè)觀性訓(xùn)練誤差的樂(lè)觀性定義為也就是說(shuō),欠估計(jì)R(M)的量取決于yi
影響其預(yù)測(cè)的強(qiáng)度。我們?cè)诫y擬合數(shù)據(jù),樂(lè)觀性越大。第二十七頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-28訓(xùn)練誤差的樂(lè)觀性通常我們有因此,為了選擇模型,我們可以對(duì)進(jìn)行估計(jì),或以某種方式估計(jì)R(M)欠擬合程度+復(fù)雜性懲罰第二十八頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-29估計(jì)樂(lè)觀性通過(guò)各種技巧(通常是漸近性)估計(jì)樂(lè)觀性第二十九頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-30MallowsCp統(tǒng)計(jì)量當(dāng)取平方誤差損失,誤差模型為,其中誤差的均值為0,方差為其中為模型中參數(shù)的數(shù)目。第三十頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-31MallowsCp統(tǒng)計(jì)量這樣,可以用MallowsCp統(tǒng)計(jì)來(lái)估計(jì)R(M)其中為從一個(gè)低偏差(的復(fù)雜)估計(jì)的MSE獲得。第三十一頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-32AIC(AkaikeInformationCriterion)假設(shè)采用log似然作為損失函數(shù)實(shí)際上我們采用的是?2l(M)如果模型為,則當(dāng)時(shí),其中為的MLE,為訓(xùn)練數(shù)據(jù)上的似然值第三十二頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-33AIC(AkaikeInformationCriterion)這導(dǎo)出R(M)的一個(gè)估計(jì):AIC(AkaikeInformationCriterion)其中為從一個(gè)低偏差(的復(fù)雜)估計(jì)的MSE獲得。這同MallowsCp統(tǒng)計(jì)量相同,只是適用假設(shè)范圍更寬(推廣)但是注意:這并不是普遍滿足,如0-1損失。第三十三頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-34貝葉斯模型選擇假設(shè)我們有一個(gè)候選模型M,其參數(shù)空間為,后驗(yàn)為為了比較兩個(gè)模型M1和M2,可以計(jì)算兩個(gè)模型的相對(duì)后驗(yàn)概率,稱為后驗(yàn)幾率(posteriorodds):稱為貝葉斯因子(Bayesfactor),是數(shù)據(jù)對(duì)后驗(yàn)的貢獻(xiàn)第三十四頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-35BIC(BayesianInformationCriterion)假設(shè)模型的先驗(yàn)是常量且參數(shù)的先驗(yàn)平滑,我們用Laplace近似來(lái)近似計(jì)算的積分,再加上某些簡(jiǎn)化,得到其中,為的MLE。這導(dǎo)出了另外一個(gè)模型選擇計(jì)分的準(zhǔn)則:貝葉斯信息準(zhǔn)則(BayesianInformationCriterion,BIC)第三十五頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-36BIC(BayesianInformationCriterion)當(dāng)取平方誤差損失,誤差模型為,其中誤差的均值為0,方差為,有得到BIC(M),其中因子2被logN代替AIC傾向于過(guò)擬合,而B(niǎo)IC傾向于欠擬合第三十六頁(yè),共三十九頁(yè),編輯于2023年,星期四MLE3-37BICAIC不是一致的,而B(niǎo)IC是一致的,也就是說(shuō),選擇最小BIC的模型等價(jià)于選擇最大后驗(yàn)概率的模型(在漸近意義下)。事實(shí)上模型的后驗(yàn)概率為不僅可以估計(jì)最好的模型,而且可以評(píng)估所考慮模型的相關(guān)指標(biāo)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人住宅小區(qū)地下車庫(kù)車位買(mǎi)賣(mài)協(xié)議范本2篇
- 2025年度個(gè)人帶車庫(kù)帶儲(chǔ)藏室公寓買(mǎi)賣(mài)協(xié)議
- 2025年度個(gè)人二手挖掘機(jī)買(mǎi)賣(mài)合同范本全新升級(jí)版2篇
- 2025年全球及中國(guó)智能安防巡檢機(jī)器人行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球胃電刺激裝置行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)可調(diào)鎖骨矯正器行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2024年軍隊(duì)文職人員招聘考試題庫(kù)
- 2025年度頁(yè)巖磚生產(chǎn)廢棄物資源化利用技術(shù)研發(fā)合同4篇
- 2025年度老舊小區(qū)改造工程維修管理服務(wù)合同范本2篇
- 二零二五年度櫥柜品牌授權(quán)生產(chǎn)與銷售代理合同3篇
- 醫(yī)保政策與健康管理培訓(xùn)計(jì)劃
- 無(wú)人化農(nóng)場(chǎng)項(xiàng)目可行性研究報(bào)告
- 《如何存款最合算》課件
- 社區(qū)團(tuán)支部工作計(jì)劃
- 拖欠工程款上訪信范文
- 2024屆上海市金山區(qū)高三下學(xué)期二模英語(yǔ)試題(原卷版)
- 學(xué)生春節(jié)安全教育
- 《wifi協(xié)議文庫(kù)》課件
- 《好東西》:女作者電影的話語(yǔ)建構(gòu)與烏托邦想象
- 教培行業(yè)研究系列(七):出國(guó)考培的再研究供需變化的新趨勢(shì)
- GB/T 44895-2024市場(chǎng)和社會(huì)調(diào)查調(diào)查問(wèn)卷編制指南
評(píng)論
0/150
提交評(píng)論