




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、機器學習中有關(guān)概率論知識的小結(jié)、引言最近寫了許多關(guān)于機器學習的學習筆記,里面經(jīng)常涉及概率論的知識,這里對所有概率論知識做一個總結(jié)和復習,方便自己查閱,與廣大博友共享,所謂磨刀不誤砍柴工,希望博友們在這篇博文的幫助下,閱讀機器學習的相關(guān)文獻時能夠更加得心應(yīng)手!這里只對本人覺得經(jīng)常用到的概率論知識點做一次小結(jié),主要是基本概念,因為機器學習中涉及概率論的地方,往往知道基本概念就不難理解,后面會不定期更新,希望博友們多留言補充。二、貝葉斯(Bayes)公式通常把事件A的概率P(A)叫做實驗前的假設(shè)概率,即先驗概率(priorprobability),如果有另一個事件B與事件A有某種關(guān)系,即事件A和B不
2、是互相獨立的,那么當事件B確實發(fā)生之后,則應(yīng)當重新估計事件A的概率,即P(A|B),這叫做條件概率或者試驗后的假設(shè)概率,即后驗概率(posteriorprobability).公式一:再引入全概率公式:設(shè)事件A當前僅當互不相容的事件(即任意兩個事件不可能同時發(fā)生的)5(i=1,2,).中的任意一個事件發(fā)生時才可能發(fā)生,已知事件Hi的概率卩(比)及事件A在乩已發(fā)生的條件下的條件概率,則事件A發(fā)生的概率為:ni=l這就是全概率公式.根據(jù)概率乘法定理:P(AB)=P(A)P(BA)二P(B)P(AR)我們可以得到:PP&訂(辭加|財P(民)玖4|艮)于是:再根據(jù)上面介紹的全概率公式,則可得到傳說中的
3、貝葉斯公式鞏5)吃|艮)這些公式定理幾乎貫穿整個機器學習,很基本,也很重要!三、常用的離散隨見變量分布i.“0T”分布:設(shè)隨機變量X只能取得兩個數(shù)值:0與1,而概率函數(shù)是:北二0,i;通常把這種分布叫做“0-1”分布或者兩點分布,卩是分布參數(shù)2.二項分布(binomialdistribution):設(shè)隨機變量X可能的的值是0,1,2,n,而概率函數(shù)是:其中0;和P,通常把這種分布記作R(弘卩)丄,這種分布叫做二項分布,含有兩個參f(x)=Cpxqnx,如果隨見變量x服從二項分布數(shù)乳召(徐卩),記作X3.泊松(Possion)分布:設(shè)隨機變量X的可能值是一切非負整數(shù),而概率函數(shù)是:其中九0為常數(shù)
4、,這種分布叫做泊松分布。泊松分布就含有一個參數(shù)九,記作P),如果隨機變量X服從泊松分布,則記作XP四、隨機變量的分布函數(shù)設(shè)x是任何實數(shù),考慮隨機變量X取得的值不大于x的概率,即事件Xx的概率,記作F(x)=P(Xx),這個函數(shù)叫做隨機變量X的概率分布函數(shù)或者分布函數(shù),注意區(qū)別于上面講到的概率函數(shù).如果已知隨機變量X的分布函數(shù)F(X),則隨見變量X落在半開區(qū)間,x2內(nèi)的概率:P(xiXx2)=F(x2)-F(xi)五、連續(xù)隨機變量的概率密度連續(xù)隨機變量的概率密度就是分布函數(shù)的導函數(shù)六、隨機變量的數(shù)學期望如果隨機變量X只能取得有限個值:而取得有限個值得概率分別是:pCQ型(動衛(wèi)仏)則數(shù)學期望:E(
5、X)=+x2p(x2)+n=Fxnpxn)如果連續(xù)隨機變量x的概率密度為/(X),則連續(xù)隨機變量的數(shù)學期望:xf(x)dx一個常數(shù)的的數(shù)學期望等于這個常數(shù)本身。定理:兩個獨立隨機變量的乘積的數(shù)學期望等于它們數(shù)學期望的乘積。證明如下:對于離散隨機變量X與Y獨立:E(XY)=II可護。旳)iiij2_jXipx(xi)2_jyjpY(yjy=EQQEm對于連續(xù)隨機變量X與Y獨立:4-ooE(XY)=+ooy/r(y)妙oo4-coxyf(x,y)dxdy“一oooo+ooxyfxdxdy.co*cor+oo=Ixfx(尤)dxJoo=E(X)E(Yy七、方差與標準差隨機變量X的方差記作D(X),定
6、義為:下面證明一個很有用的公式(會用到性質(zhì):一個常數(shù)的的數(shù)學期望等于這個常數(shù)本身):D(X)=EX_E(X)2”=EX2一2XE(X)+(X)2.=E(X2-2EXEX)+EE(X)2).=E(X2)一2E(X)E(X)+E(X)巴=E(XE(X)F簡而言之:隨機變量的方差等于變量平方的期望減去期望的平方.標準差就是方差的算術(shù)平方根。常數(shù)的方差為0.八、協(xié)方差與相關(guān)系數(shù)隨機變量X與隨機變量Y的協(xié)方差記作:進一步推導可得:因為兩個獨立隨機變量乘積的期望等于兩個隨機變量各自期望的乘積,于是當兩個隨機變量獨立使,很容易得到它們的協(xié)方差為0.兩個隨機變量X與Y的相關(guān)系數(shù)為:兩個隨機變量的相關(guān)系數(shù)的絕對值不大于1.當且僅當隨機變量Y與X之間存在線性關(guān)系:時,相關(guān)系數(shù)R(X)的絕對值等于1,并且1bQ九、正態(tài)分布正態(tài)分布又叫高斯分布,設(shè)連續(xù)隨機變量X的概率密度fW1盂_肛=-=e_272j-oox0都是常數(shù),這種分布就是正態(tài)分布正態(tài)分布含有兩個參數(shù)卩及00,其中U等于正態(tài)分布的數(shù)學期望,而o等于正態(tài)分布的N(ufcr2)N(u,cr2)標準差,通常把這種分布記作,隨機
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 交通安全現(xiàn)場勘察與優(yōu)化方案合同
- 潮汐能發(fā)電站圍堰施工與生態(tài)補償合同
- 勞動合同續(xù)簽標準書含薪酬調(diào)整
- 低碳環(huán)保廠房物業(yè)管理與綠色能源應(yīng)用合同
- 礦山采礦權(quán)抵押貸款與礦山安全生產(chǎn)責任保險合同
- 4月安全生產(chǎn)事故
- 六月消防安全月活動方案
- 食品安全生產(chǎn)主體責任
- 安全生產(chǎn)培訓包括
- 物業(yè)品質(zhì)部管理制度
- GB/T 29776-2013紡織品防蟲蛀性能的測定
- GB/T 18998.2-2022工業(yè)用氯化聚氯乙烯(PVC-C)管道系統(tǒng)第2部分:管材
- 最新國家開放大學電大《調(diào)劑學》形考任務(wù)4試題及答案
- DB32T 4176-2021 公共建筑室內(nèi)空氣質(zhì)量監(jiān)測系統(tǒng)技術(shù)規(guī)程
- 中俄文一般貿(mào)易合同范本
- 不合格品退貨處理單
- 大連海事大學畢業(yè)成績表
- 人防卷材防水層工程檢驗批質(zhì)量驗收記錄表
- 尾礦庫模施袋筑壩工藝在施工中的應(yīng)用
- 中國34個省級行政區(qū)輪廓圖
評論
0/150
提交評論