![概率論總結(jié)介紹_第1頁(yè)](http://file4.renrendoc.com/view4/M02/14/3E/wKhkGGaedcSAfFmMAAEjWuUEwh0798.jpg)
![概率論總結(jié)介紹_第2頁(yè)](http://file4.renrendoc.com/view4/M02/14/3E/wKhkGGaedcSAfFmMAAEjWuUEwh07982.jpg)
![概率論總結(jié)介紹_第3頁(yè)](http://file4.renrendoc.com/view4/M02/14/3E/wKhkGGaedcSAfFmMAAEjWuUEwh07983.jpg)
![概率論總結(jié)介紹_第4頁(yè)](http://file4.renrendoc.com/view4/M02/14/3E/wKhkGGaedcSAfFmMAAEjWuUEwh07984.jpg)
![概率論總結(jié)介紹_第5頁(yè)](http://file4.renrendoc.com/view4/M02/14/3E/wKhkGGaedcSAfFmMAAEjWuUEwh07985.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
概率論總結(jié)介紹第1篇概率論總結(jié)介紹第1篇?多維隨機(jī)變量的函數(shù)分布:
(一)和的分布:
設(shè)是一個(gè)二維離散型隨機(jī)變量,密度函數(shù)為,現(xiàn)在來求的分布,按照定義為
用密度函數(shù)代替密度函數(shù)
可得:
則對(duì).
同理有對(duì)稱性可以求出:.
以上所得和分布的邊際密度通常稱之為概率密度的卷積公式,顯然和的分布函數(shù)主要是要確定好分布函數(shù)的積分區(qū)域然后將二重積分化為累次積分即可.
以下給出一些具有可加性的常用結(jié)論:
假設(shè)隨機(jī)變量相互獨(dú)立
二項(xiàng)分布:
若,且二者獨(dú)立,則.
泊松分布:
若且二者相互獨(dú)立,則
正態(tài)分布:
伽馬分布:
卡方分布:
m個(gè)兩點(diǎn)分布的隨機(jī)變量的和服從試驗(yàn)次數(shù)為m的二項(xiàng)分布
服從幾何分布的m個(gè)隨機(jī)變量的和負(fù)二項(xiàng)分布Nb(m,p)
服從的m個(gè)指數(shù)分布的和服從伽馬分布
(二)商的分布與和的分布:
這個(gè)主要是利用二重積分的變量替換利,用雅可比行列式進(jìn)行變量替換之后在利用求邊際密度方法求得替換之后的變量的密度函數(shù),然后在積分即得到分布函數(shù).
這里不做過多敘述…….
多維隨機(jī)變量的特征數(shù):
這里只討論二維的情形,高于二維的情形在二維的情形上推廣之即可.
多維隨機(jī)變量的數(shù)學(xué)期望:
設(shè)若二維隨機(jī)變量的分布用聯(lián)合分布列或者用聯(lián)合密度函數(shù)表示,則的數(shù)學(xué)期望如下:
二維離散型隨機(jī)變量的數(shù)學(xué)期望:
對(duì)于離散型隨機(jī)變量而言其分布列只要把與分別對(duì)應(yīng)合并起來即可
其數(shù)學(xué)期望表達(dá)式為:
二維連續(xù)型隨機(jī)變量的數(shù)學(xué)期望:
.
多維隨機(jī)變量的方差:
這個(gè)根據(jù)數(shù)學(xué)期望依據(jù)方差的計(jì)算公式即可,不做過多描述.
數(shù)學(xué)期望與方差的性質(zhì):
注意這里只列出二維的情形,多維的情形推廣之.
設(shè)是二維隨機(jī)變量,則有:.
若隨機(jī)變量和相互獨(dú)立,則有:
協(xié)方差:
設(shè)是一個(gè)二維隨機(jī)變量,若存在,則稱此數(shù)學(xué)期望為的協(xié)方差,或稱為X與Y的相關(guān)矩,并將其記為:
.
特別有.
從協(xié)方差的定義可以看出他是偏差的數(shù)學(xué)期望,由于偏差可正可負(fù)故其協(xié)方差也可正可負(fù),取值的正負(fù)有其意義,要想理解協(xié)方差到底是個(gè)什么意思且看下圖:
假設(shè)二維隨機(jī)變量的取值區(qū)域如上圖所示,若為二維離散型隨機(jī)變量的取值也如上圖所示只不過不能取到橢圓域內(nèi)的所有點(diǎn)只去離散個(gè)點(diǎn).假設(shè)上圖平行于X軸與平行于y軸的兩條相交直線的交點(diǎn)坐標(biāo)為且將二維隨機(jī)變量取值的區(qū)域分割為四個(gè)象限則由協(xié)方差的定義:
當(dāng)隨機(jī)變量的取值落在區(qū)域的時(shí)候?qū)?dǎo)致,當(dāng)隨機(jī)變量的取值落在區(qū)域的時(shí)候?qū)?dǎo)致,由此可知當(dāng)落在區(qū)域的隨機(jī)變量取值多于區(qū)域取值或者在區(qū)域的取值,偏離的程度很大的時(shí)候,一般情況下也即的面積大于的面積和的時(shí)候,將導(dǎo)致,這個(gè)時(shí)候隨機(jī)變量的取值圖形將如上圖所示,這時(shí)候我們可以看出圖形呈現(xiàn)出的情形是X的取值將與Y的取值大致呈現(xiàn)出同時(shí)增加的傾向,這時(shí)候我們就稱兩隨機(jī)變量大致呈現(xiàn)出正相關(guān)的關(guān)系.
如果反之隨機(jī)變量的取值區(qū)域呈現(xiàn)出如下情形:
此時(shí)將與上面的分析相反其相關(guān)系數(shù),X的取值與Y的取值大致呈現(xiàn)出同時(shí)減小的傾向,則稱此時(shí)的兩隨機(jī)變量為負(fù)相關(guān).
而當(dāng)隨機(jī)變量的取值區(qū)域呈現(xiàn)出下面的情況時(shí)候:
?不相關(guān).png
這個(gè)時(shí)候與的值正負(fù)相抵導(dǎo)致此時(shí)則稱兩隨機(jī)變量完全不相關(guān).
上面為了幫助理解相關(guān)系數(shù),我們從幾何的角度去理解,因?yàn)楹芏嗟臄?shù)學(xué)問題如果從邏輯上面不好把握的話我們可以從幾何上找到突破口,我國(guó)著名數(shù)學(xué)家華羅庚曾經(jīng)說過:‘’數(shù)無形時(shí)少直覺,形無數(shù)時(shí)難入微“,這句話說得相當(dāng)?shù)木?,短?4個(gè)字就把數(shù)與形的關(guān)系說得清清楚楚說得你醍醐灌頂、豁然開朗,你不服都不行.確實(shí)從幾何上面來理解數(shù)學(xué)更加的直觀形象,但是上面我們僅僅是從圖形出發(fā)來建立什么是多維隨機(jī)變量的相關(guān)性的感性認(rèn)知,兩個(gè)隨機(jī)變量什么時(shí)候正相關(guān)負(fù)相關(guān)如果僅僅只是從圖形上面感性理解這也是片面的朦朧的不精確的,比如從上面的圖形中我們能夠感性的認(rèn)識(shí)到如果隨機(jī)變量取值總區(qū)域越偏平即橢圓形狀越是扁其線性相關(guān)程度就越高,越是呈圓形那么其相關(guān)程度就越是低,如果取極限位置即兩個(gè)隨機(jī)變量呈現(xiàn)出一條直線那么他們不就是完全相關(guān)了嗎?但是我們?nèi)绾稳ズ饬繖E圓的扁平程度嘞?用一個(gè)什么樣的表達(dá)式去衡量嘞?這是一個(gè)問題,所以我們?nèi)绻肜硇缘恼J(rèn)識(shí)什么是多維隨機(jī)變量的相關(guān)性與不相關(guān),還是得從更加微觀的角度即數(shù)的角度去認(rèn)知他,下面我們就從代數(shù)出發(fā)來認(rèn)知協(xié)方差與標(biāo)準(zhǔn)化后的協(xié)方差即相關(guān)系數(shù)的具體意義
相關(guān)系數(shù):
就如同方差有量綱一樣,協(xié)方差也是一個(gè)有量綱的量,為了比較相關(guān)程度的高低我們必須設(shè)法去掉協(xié)方差的量綱,之前說過方差是描述數(shù)據(jù)之間的差異與數(shù)據(jù)的波動(dòng)程度的一個(gè)量,我們?yōu)榱藢⒉煌S機(jī)變量的方差進(jìn)行比較將他們進(jìn)行了標(biāo)準(zhǔn)化即放在同一個(gè)標(biāo)準(zhǔn)下進(jìn)行比較因此我們將方差比上數(shù)學(xué)期望去掉了量綱,同方差一樣我們也要對(duì)協(xié)方差進(jìn)行標(biāo)準(zhǔn)化處理去掉量綱使得不同隨機(jī)二維變量之間的相關(guān)程度具有可比性.
因此就將標(biāo)準(zhǔn)化后的相關(guān)系數(shù)稱之為協(xié)方差:
設(shè)若是一個(gè)二維離散型隨機(jī)變量,且,.則稱
.
為隨機(jī)變量的相關(guān)系數(shù).由此可見所謂相關(guān)系數(shù)就是將協(xié)方差比上隨機(jī)變量各自的標(biāo)準(zhǔn)差,相關(guān)系數(shù)的正負(fù)由分子決定,相關(guān)系數(shù)大于零則說明正相關(guān),小于零則說明負(fù)相關(guān),等于零則說明不相關(guān).如果相關(guān)系數(shù)的作用和協(xié)方差是一樣的那么說句話糙理不糙的話就是脫褲子放屁多此一舉說了數(shù)學(xué)家是不會(huì)做這么無聊的
上面為了幫助理解相關(guān)系數(shù),我們從幾何的角度去理解,因?yàn)楹芏嗟臄?shù)學(xué)問題如果從邏輯上面不好把握的話我們可以從幾何上找到突破口,我國(guó)著名數(shù)學(xué)家華羅庚曾經(jīng)說過:‘’數(shù)無形時(shí)少直覺,形無數(shù)時(shí)難入微“,這句話說得相當(dāng)?shù)木?,短?4個(gè)字就把數(shù)與形的關(guān)系說得清清楚楚說得你醍醐灌頂、豁然開朗,你不服都不行.確實(shí)從幾何上面來理解數(shù)學(xué)更加的直觀形象,但是上面我們僅僅是從圖形出發(fā)來建立什么是多維隨機(jī)變量的相關(guān)性的感性認(rèn)知,兩個(gè)隨機(jī)變量什么時(shí)候正相關(guān)負(fù)相關(guān)如果僅僅只是從圖形上面感性理解這也是片面的朦朧的不精確的,比如從上面的圖形中我們能夠感性的認(rèn)識(shí)到如果隨機(jī)變量取值總區(qū)域越偏平即橢圓形狀越是扁其線性相關(guān)程度就越高,越是呈圓形那么其相關(guān)程度就越是低,如果取極限位置即兩個(gè)隨機(jī)變量呈現(xiàn)出一條直線那么他們不就是完全相關(guān)了嗎?但是我們?nèi)绾稳ズ饬繖E圓的扁平程度嘞?用一個(gè)什么樣的表達(dá)式去衡量嘞?這是一個(gè)問題,所以我們?nèi)绻肜硇缘恼J(rèn)識(shí)什么是多維隨機(jī)變量的相關(guān)性與不相關(guān),還是得從更加微觀的角度即數(shù)的角度去認(rèn)知他,下面我們就從代數(shù)出發(fā)來認(rèn)知協(xié)方差與標(biāo)準(zhǔn)化后的協(xié)方差即相關(guān)系數(shù)的具體意義事情的,連我這樣的小子都不會(huì)做這樣的事情何況高尚偉大的數(shù)學(xué)家.相關(guān)系數(shù)除了用來判斷兩隨機(jī)變量的相關(guān)性以外還可以用來度量相關(guān)性.
那么度量相關(guān)性到底是如何實(shí)現(xiàn)的嘞?先來看一個(gè)數(shù)學(xué)上非常著名且無論是在幾何學(xué)還是在分析學(xué)亦或是在代數(shù)學(xué)上都有應(yīng)用的不等式,帥氣且霸氣的柯西—施瓦茨(Schwarz)不等式:
對(duì)任意二維隨機(jī)變量,若X與Y的方差都存在,且記為,則有
.
這個(gè)定理的證明是很簡(jiǎn)單,這不是重點(diǎn),重點(diǎn)是大家有沒有覺得這個(gè)不等式很熟悉?r如果我們將協(xié)方差看做是一個(gè)內(nèi)積的話像不像高等代數(shù)中的內(nèi)積公式?,這簡(jiǎn)直就像極了愛情,這是不是巧合?我們是不是可以將概率論中的實(shí)值函數(shù)隨機(jī)變量做成一個(gè)向量空間,然后在定義一個(gè)內(nèi)積為協(xié)方差,這樣就做成了一個(gè)概率空間上面的歐式空間?有這個(gè)想法可以但是有待驗(yàn)證,下面就來驗(yàn)證隨機(jī)變量是否能做成一個(gè)高等代數(shù)中的向量空間然后在驗(yàn)證是否定義了協(xié)方差這個(gè)內(nèi)積之后可以做成一個(gè)歐式空間.
驗(yàn)證是否概率論中的隨機(jī)變量做成的集合能否做成實(shí)數(shù)域上的一個(gè)向量空間
以上即可證明隨機(jī)變量可以做成一個(gè)向量空間
下面接著證明協(xié)方差是否能夠定義為向量空間上的內(nèi)積將隨機(jī)變量做成的向量空間在作成一個(gè)歐式空間.
對(duì)稱性:
線性性質(zhì):
由協(xié)方差的定義可得
.
正則性:
故綜上所述所有的隨機(jī)變量可以做成一個(gè)歐式空間其內(nèi)積為協(xié)方差.
由向量的內(nèi)積公式可得其中為向量X與Y的夾角.故.然后可以證明的充要條件是X與Y有相關(guān)關(guān)系.當(dāng)?shù)臅r(shí)候不相關(guān),上面感性的認(rèn)識(shí)過越大即相關(guān)系數(shù)的分子絕對(duì)值越大也即相關(guān)系數(shù)絕對(duì)值越大則兩隨機(jī)變量的相關(guān)程度就越高,故相關(guān)系數(shù)越是接近于一則兩隨機(jī)變量的相關(guān)程度也就越高,反之越是接近與零則其相關(guān)程度也就越低.
其實(shí)相關(guān)系數(shù)還可以做另外一種理解:
若即隨機(jī)變量的數(shù)學(xué)期望為則其標(biāo)準(zhǔn)化的變量為
則即兩隨機(jī)變量的相關(guān)系數(shù)等于標(biāo)準(zhǔn)化后的隨機(jī)變量的方差.
通過將高等代數(shù)中的歐式空間引入到概率論中能夠有助于我們理解相關(guān)系數(shù),因此我們要具有知識(shí)的遷移能力這很重要,不能為了知識(shí)而知識(shí),知識(shí)就是拿來運(yùn)用的.
協(xié)方差矩陣:
記n維隨機(jī)向量為,若其每個(gè)分量的數(shù)學(xué)期望都存在,則:
為n維隨機(jī)變量向量的數(shù)學(xué)期望向量簡(jiǎn)稱為X的數(shù)學(xué)期望而稱
為隨機(jī)向量的協(xié)方差矩陣,此矩陣是一個(gè)對(duì)稱非負(fù)定矩陣,主對(duì)角線上的元素為對(duì)應(yīng)位置的方差,其他位置為對(duì)應(yīng)隨機(jī)變量的協(xié)方差,只要將協(xié)方差矩陣的算法輸入到計(jì)算機(jī)內(nèi)部我們就可以很清晰的看清楚n維隨機(jī)向量任意兩個(gè)隨機(jī)變量間的相關(guān)關(guān)系.
條件分布與數(shù)學(xué)期望
離散型隨機(jī)變量的條件分布
條件分布無疑就是在知道聯(lián)合分布的情況下運(yùn)用條件概率公式求之即可不做過多敘述.
連續(xù)型隨機(jī)變量的條件分布
設(shè)二維離散型隨機(jī)變量的聯(lián)合概率密度,邊際密度函數(shù)為.
在離散隨機(jī)變量場(chǎng)合,其條件概率的分布函數(shù)為.因?yàn)檫B續(xù)型隨機(jī)變量取某個(gè)值的時(shí)候其概率為零,故在連續(xù)型場(chǎng)合不可以簡(jiǎn)單的使用條件概率公式,這會(huì)導(dǎo)致分母為零,因此既然不能求出某一點(diǎn)取值的概率,我們又在數(shù)學(xué)分析中學(xué)過極限的概念,因此我們可以將看做時(shí)的值去代替,于是就可以得出如下的定理:
對(duì)一切使得的y,給定條件下X的條件分布函數(shù)和條件密度函數(shù)分別為
.
連續(xù)場(chǎng)合的全概率公式和貝葉斯公式
由條件密度函數(shù)可得
可得到邊際密度函數(shù)
就得貝葉斯公式的密度函數(shù)形式為:
由對(duì)稱性即可得到.
條件數(shù)學(xué)期望
條件分布的數(shù)學(xué)期望如果存在則稱其為條件期望.條件期望的計(jì)算只要利用連續(xù)型場(chǎng)合和離散型場(chǎng)合的定義用條件概率代替非條件概率計(jì)算即可.
設(shè)服從二維正態(tài)分布由邊際分布知X服從正態(tài)分布,Y服從正態(tài)分布.我們可以求得其條件分布也服從正態(tài)分布
要了解條件數(shù)學(xué)期望的意義且看如下例子:
_在勘察犯罪現(xiàn)場(chǎng)獲取犯罪分子信息的時(shí)候經(jīng)常根據(jù)腳印的大小來判斷其身高,一般認(rèn)為腳印和足長(zhǎng)可以可以視作二維正態(tài)分布在處理,即其條件分布服從正態(tài)分布由此可以得到:,里面除了腳印大小y為未知數(shù)以外其他的參數(shù)都可以看做是已知的,因此只要知道了犯罪嫌疑人的腳印大小就可以推斷其身高.
上面已經(jīng)知道了我們可以用條件期望來進(jìn)行推斷實(shí)際上這種推斷只是一種估計(jì),那么這種推斷是否是可靠的嘞?可靠的依據(jù)又在哪里嘞?
條件均值說白了就是在已知的條件下去預(yù)測(cè)的值,那么用條件均值預(yù)測(cè)有些什么好處嘞?下面進(jìn)行說明.
我們已經(jīng)知道條件均值是關(guān)于未知數(shù)y的一個(gè)函數(shù),我們不妨假定還有其他的關(guān)于y的函數(shù)可以對(duì)x進(jìn)行預(yù)測(cè),判斷這個(gè)預(yù)測(cè)值好壞的依據(jù)是誤差要盡可能的小即,但是是一個(gè)隨機(jī)變量取值并不固定,因此就要求其均值
為了去掉絕對(duì)值方便運(yùn)算將其替換成.
我們可以證明當(dāng)?shù)臅r(shí)候成立,因此用條件均值進(jìn)行預(yù)測(cè)的時(shí)候其均方誤差將達(dá)到最小,這就是用條件均值進(jìn)行合理預(yù)測(cè)的理論依據(jù).我們也將稱之為是第一類回歸.
但是當(dāng)某些分布的密度函數(shù)未知或者是函數(shù)過分復(fù)雜的時(shí)候我們也可以降低要求,即不尋求最優(yōu)預(yù)測(cè),只需求滿意預(yù)測(cè)即可,當(dāng)不使用條件均值時(shí)我們通常使用一個(gè)簡(jiǎn)單的函數(shù)即線性函數(shù)來替代他進(jìn)行預(yù)測(cè),不妨設(shè)為的線性預(yù)測(cè),則我們要求
為了求出參數(shù)a和b,可以進(jìn)行如下處理將上式分別對(duì)a和b求偏導(dǎo)數(shù)然后求出穩(wěn)定點(diǎn)a,b即可得到參數(shù)a,b的計(jì)算公式(很顯然必然有一個(gè)a,b的取值滿足上式).
由此得到我們將其稱之為第二類回歸,由此可知對(duì)正態(tài)分布而言其第一類回歸就是第二類回歸,即在理論上來講用條件均值來預(yù)測(cè)犯罪嫌疑人的身高是合理最優(yōu)的預(yù)測(cè)方案.
特征函數(shù)
隨機(jī)變量的分布函數(shù)可以全面的描述隨機(jī)變量的統(tǒng)計(jì)規(guī)律,但是分布函數(shù)和密度函數(shù)使用起來并不方便,比如知兩隨機(jī)變量他們兩個(gè)相互獨(dú)立其密度函數(shù)分別為則的密度函數(shù)即為的卷積,但是當(dāng)我們要研究即n個(gè)隨機(jī)變量和的分布的時(shí)候我們就要求次卷積,我的媽耶,這個(gè)計(jì)算量是相當(dāng)?shù)拇蟮?,即便是如今的?jì)算機(jī)也是吃不消的,因此我們必須需求其他的工具來解決這個(gè)問題,在數(shù)學(xué)分析中我們知道傅里葉(Fourier)變換能夠?qū)⒕矸e運(yùn)算轉(zhuǎn)化為乘法運(yùn)算即,因此我們密度函數(shù)進(jìn)行傅里葉變換將卷積運(yùn)算轉(zhuǎn)化為乘法運(yùn)算然后在通過傅里葉逆變換即可以求得密度函數(shù),乘法運(yùn)算顯然是要比卷積運(yùn)算方便的.
設(shè)是隨機(jī)變量的密度函數(shù),則的傅里葉變換是,i是虛數(shù)也即.
設(shè)是任一隨機(jī)變量,則稱
是的特征函數(shù).
顯然任何一個(gè)隨機(jī)變量其特征函數(shù)都是存在的因?yàn)?
定理一:
設(shè)的特征函數(shù)分別為則的特征函數(shù)為
,n維情形推廣之.
定理二:
設(shè)隨機(jī)變量有N階矩存在,則的特征函數(shù)可微N次且對(duì)有:
,這個(gè)公式可以方便計(jì)算隨機(jī)變量的K階矩只要對(duì)其特征函數(shù)求K階導(dǎo)數(shù)即可
從上面我們知道任何一個(gè)隨機(jī)變量分布函數(shù)唯一的對(duì)應(yīng)著一個(gè)特征函數(shù),實(shí)際上也可以證明任何一個(gè)特征函數(shù)也唯一地確定了他的分布函數(shù),即特征函數(shù)與分布函數(shù)是一個(gè)雙射.由此我們就可以利用傅里葉逆變換根據(jù)隨機(jī)變量的特征函數(shù)來確定其密度函數(shù)與分布函數(shù).
傅里葉變換:.
傅里葉逆變換:
由特征函數(shù)我們可以看到,數(shù)學(xué)各個(gè)分支看起來似乎相互獨(dú)立,其實(shí)是各分支相互滲透的,概率論的產(chǎn)生離不開數(shù)學(xué)分析,高等代數(shù)和復(fù)變函數(shù)的發(fā)展,而概率論的發(fā)展也反過來推動(dòng)了其他數(shù)學(xué)分支的發(fā)展,知識(shí)與知識(shí)之間要有遷移能力,要有整體上的把握,這樣才能對(duì)數(shù)學(xué)有全面的了解.
大數(shù)定律與中心極限定律
前面說過對(duì)于隨機(jī)試驗(yàn),隨著隨機(jī)試驗(yàn)的次數(shù)逐漸增多,頻率將會(huì)逐漸穩(wěn)定到概率,平均值將會(huì)逐漸穩(wěn)定到均值,這個(gè)穩(wěn)定只是一個(gè)很直覺的說法,那么如和讓這種直覺轉(zhuǎn)化成數(shù)學(xué)意義嘞?這就是下面要解決的問題.
伯努利大數(shù)定律:
設(shè)是n重伯努利試驗(yàn)中A試驗(yàn)發(fā)生的次數(shù),又A在每次試驗(yàn)中出現(xiàn)的概率為.則對(duì)任意的,有
上式中的就是n次隨機(jī)試驗(yàn)的頻率,也就是說隨著n次數(shù)的增加其頻率趨向于概率的概率趨向于一,這個(gè)是與數(shù)學(xué)分析中的極限概念是不同,極限是存在存在,當(dāng),的時(shí)候任意的都滿足
而伯努利大數(shù)定律是強(qiáng)調(diào)的是概率,當(dāng)n趨于無窮的時(shí)候其概率趨向于一,也就是說,事件發(fā)生的可能性會(huì)越來越大,但也有可能的事件會(huì)發(fā)生,因此我們就將頻率依照概率收斂于概率.
對(duì)于伯努利大數(shù)定律實(shí)際上我們是討論了形如的隨機(jī)變量,當(dāng)時(shí)的統(tǒng)計(jì)規(guī)律,其中是獨(dú)立的服從分布的隨機(jī)變量,因此我們將伯努利大數(shù)定律推廣到更為一般的情形
大數(shù)定律:
若諸是隨機(jī)變量序列,如果存在常數(shù)序列使得對(duì)任意的有:
成立,則稱隨機(jī)變量序列服從大數(shù)定律,由此可知,伯努利大數(shù)定律只是上敘大數(shù)定律的一個(gè)特例.
切比雪夫大數(shù)定律:
設(shè)是一些兩兩互不相關(guān)的隨機(jī)變量,又設(shè)他們的方差有界,即存在常數(shù)使得諸則對(duì)任意的有:
此定理可有切比雪夫不等式得證明
由此可見伯努利大數(shù)定律是切比雪夫大數(shù)定律的特例,切比雪夫大數(shù)定律是大數(shù)定律的特例
馬爾可夫大數(shù)定律:
在證明切比雪夫大數(shù)定律的過程中其實(shí)我們可以發(fā)現(xiàn)只要?jiǎng)t{}服從大數(shù)定律,即對(duì)任意的有:
切比雪夫大數(shù)定律是馬爾可夫大數(shù)定律的特例,馬爾可夫大數(shù)定律的重要性在與對(duì)于隨機(jī)變量序列已經(jīng)沒有了獨(dú)立性、同分布性、不相關(guān)性的假定,在以上大數(shù)定律的證明過程中都是以切比雪夫不等式為前提的因此都要要求隨機(jī)變量具有方差,但是進(jìn)一步的研究表明,方差的存在也不是必要的,下面介紹一個(gè)與方差無關(guān)的大數(shù)定律,辛欽大數(shù)定律
辛欽大數(shù)定律:
設(shè)諸是一系列獨(dú)立同分布的隨機(jī)變量且數(shù)學(xué)期望存在:
則對(duì)任意的,有成立
在上面的所有大數(shù)定律中伯努利大數(shù)定律是證明了頻率依照概率穩(wěn)定與概率,而辛欽大數(shù)定律是證明了平均值依照概率會(huì)穩(wěn)定與數(shù)學(xué)期望,現(xiàn)有伯努利大數(shù)定律而后將其推廣給出大數(shù)定律的一般形式,而后將伯努利大數(shù)定律的條件一步步放寬,伯努利大數(shù)定律數(shù)切比雪夫大數(shù)定律的特例子,切比雪夫大數(shù)定律是馬爾可夫大數(shù)定律的特例,無論是切比雪夫大數(shù)定理還是伯努利大數(shù)定律亦或是馬爾可夫大數(shù)定律他們?nèi)叩淖C明都是與切比雪夫不等式有關(guān),因此要求其隨機(jī)變量序列具有方差,但是辛欽大數(shù)定律是與方差無關(guān)的,他至于隨機(jī)變量序列是否獨(dú)立以及各自的數(shù)學(xué)期望是否存在有關(guān).
隨機(jī)變量序列的兩種收斂性:
在大數(shù)定律中我們從頻率的穩(wěn)定性出發(fā),引入了
即隨機(jī)變量序列{}依概率收斂于常數(shù)a的概念,很自然的我們也把他進(jìn)行推廣,即不把它收斂于一個(gè)常數(shù)而是收斂于一個(gè)隨機(jī)變量,于是引入如下定義:
設(shè)有一列隨機(jī)變量如果對(duì)任意的,有
則稱隨機(jī)變量序列{}依概率收斂于記作
大數(shù)定律只是上敘依概率收斂的一種情況特殊情況
如果我們已知那么他們的分布函數(shù)之間會(huì)有什么樣的關(guān)系嘞?
定義:設(shè),是一系列分布函數(shù),如果對(duì)的每個(gè)連續(xù)點(diǎn)都有
則稱分布函數(shù)列{}弱收斂于
定理1:
若隨機(jī)變量序列依概率收斂于隨機(jī)變量,則隨機(jī)變量序列的分布函數(shù)列弱收斂于的分布函數(shù)
一般來說此定理反過來不成立
定理2:
隨機(jī)變量序列其中c為常數(shù)的充要條件為
為退化分布是的分布函數(shù)
此定理說明隨機(jī)變量和的分布弱收斂于退化分布這就是大數(shù)定律
定理3:
分布函數(shù)列{}弱收斂于分布函數(shù)的充要條件書相應(yīng)的特征函數(shù)列{}收斂于的特征函數(shù).
前面我們了解到特征函數(shù)有便于減少求獨(dú)立隨機(jī)變量和的分布的計(jì)算量,而且可以很方便的求出和的分布的一些特征數(shù),有了這個(gè)定理之后我們將極大的拓寬特征函數(shù)的使用范圍,當(dāng)求獨(dú)立分布和的極限問題的時(shí)候這個(gè)工具將發(fā)揮出巨大的威能
中心極限定理:
之前曾經(jīng)提到過高斯在研究誤差理論的時(shí)候曾經(jīng)利用了正態(tài)分布,那么大家有沒有想過為什么會(huì)選著正態(tài)分布來研究誤差嘞?那么現(xiàn)在我們來研究一下誤差到底是一個(gè)什么樣的隨機(jī)變量,以我國(guó)的東風(fēng)導(dǎo)彈為例,設(shè)靶心為原點(diǎn),則導(dǎo)彈的彈著點(diǎn)為,現(xiàn)在我們已經(jīng)知道都服從正態(tài)分布,可以看做是導(dǎo)彈射擊的橫向誤差要和縱向誤差,而造成產(chǎn)生誤差的原因是有無數(shù)個(gè)微小的因數(shù)積累總和而成的,比如空氣的阻力,空氣的濕度,炮彈的火藥差異,發(fā)射站的具體情況等等一系列原因造成的,我們不妨假設(shè)這一系列的因素造成的橫向誤差和為誤差為,即,我們暫且先把這一系列誤差隨機(jī)變量看做是獨(dú)立同分布的,現(xiàn)在我們來研究隨機(jī)變量和的分布,數(shù)學(xué)家們發(fā)現(xiàn),當(dāng)?shù)臅r(shí)候可能趨向于無窮這時(shí)候其方差越來越大,均值也越來越大,造成分布極其的不穩(wěn)定,而且求其分布函數(shù)越來越困難,此時(shí)我們研究這種情形就沒有什么現(xiàn)實(shí)意義,我們只討論取有限值時(shí)候的隨機(jī)變量,伯努利大數(shù)定律告訴我們:
這是因?yàn)橄冗M(jìn)行了隨機(jī)變量和的去中心化讓后比上一個(gè)增長(zhǎng)因子,這樣我們才能使得使得其分布函數(shù)序列弱收斂于一個(gè)分布函數(shù),然后我們用近似分布區(qū)代替和的分布,使得其特征函數(shù)序列也收斂于一個(gè)特征函數(shù),這樣我們就能夠運(yùn)用特征函數(shù)去求出隨機(jī)變量和的分布問題:
回顧一下我們之前的標(biāo)準(zhǔn)化我們不妨將隨機(jī)變量和中心化之后再比上其標(biāo)準(zhǔn)差進(jìn)行標(biāo)準(zhǔn)化
有這樣就能夠使得不論n為多少,使得的分布能夠大致穩(wěn)定下來即依照概率能夠使得當(dāng)收斂于某一個(gè),其分布函數(shù)也弱收斂于一個(gè)分布函數(shù).
當(dāng)是服從參數(shù)為的兩點(diǎn)分布的時(shí)候,則有下述歷史上著名的
棣莫弗(DeMoivre)—拉普拉斯(Laplace)定理:?
在n重伯努利試驗(yàn)中,事件A在每次試驗(yàn)中出現(xiàn)的概率為,為n此試驗(yàn)中事件A出現(xiàn)的次數(shù),則
此定理的說明‘’二項(xiàng)分布收斂于正態(tài)分布‘’,當(dāng)n很大的時(shí)候可以用來近似計(jì)算二項(xiàng)分布的取值
而且此定理還可以用來計(jì)算伯努利大數(shù)定律事件發(fā)生的概率,而伯努利大數(shù)定律只是說明頻率收斂于概率并沒有說事件發(fā)生的概率是多少,由此可知此定理比伯努利大數(shù)定律更強(qiáng).
此定理的發(fā)明由棣莫弗首先研究,而后由拉普拉斯推廣,這個(gè)定理的提出就是正態(tài)分布出現(xiàn)的雛形,但遺憾的是兩位數(shù)學(xué)家并沒有把正態(tài)分布當(dāng)成一回事情,只是把它用來近似計(jì)算二項(xiàng)分布,以前我們提到過二項(xiàng)分布收斂于泊松分布但是這里又提二項(xiàng)分布收斂于正態(tài)分布這是不是沖突嘞?這其實(shí)不沖突,二則收斂的條件不同罷了,收斂于泊松分布是要求,而正態(tài)分布則是要求,經(jīng)過其他數(shù)學(xué)家的推廣,然后高斯才用正態(tài)分布來計(jì)算誤差,而后拉普拉斯又整合中心極限定理發(fā)現(xiàn)隨機(jī)誤差正是滿足中心極限定理的.
將上面的定理推廣之后就能夠得到更加一般的定理即林德貝格—勒維(Lindeberg-Levy)定理:
若諸是一系列獨(dú)立同分布的隨機(jī)變量,且
則有
上面的定理我們是在獨(dú)立同分布的情形下提出的,但在現(xiàn)實(shí)環(huán)境中眾多的微小元素雖然是獨(dú)立的但是卻未必是同分布的,因此我們要考慮獨(dú)立但是未必同分布的的隨機(jī)變量序列的分布問題,為解決這一問題就有了林德貝格定理:
設(shè)隨機(jī)變量序列滿足林德貝格條件(這個(gè)定理主要是保證能夠穩(wěn)定下來不趨向于無窮)則當(dāng)是對(duì)任意的x,有
故此定理證明了由大量的微小且獨(dú)立的隨機(jī)因素并且積累而形成的變量,將會(huì)是一個(gè)正態(tài)隨機(jī)變量,這樣就能夠理解為什么誤差理論可以用正態(tài)分布來描述了.說白了中心極限定理就是用來描敘正態(tài)分何以成為正態(tài)分布,什么樣的隨機(jī)變量服從正態(tài)分布的一個(gè)定理.
概率論總結(jié)介紹第2篇1估測(cè)方差用卡方,估測(cè)均值,用正太或t,,方差已知用N,未知用T。
假設(shè)檢驗(yàn):
根據(jù)樣本,估計(jì)關(guān)于總體的某假設(shè)H0的真?zhèn)危瑧?yīng)該拒絕還是接受
u檢驗(yàn):總體標(biāo)準(zhǔn)差σ已知
t檢驗(yàn):用于樣本含量較小(如n<60),總體標(biāo)準(zhǔn)差σ未知,呈正態(tài)分布的計(jì)量資料
F檢驗(yàn):用來檢驗(yàn)兩總體的方差是否相等,如果相等,則樣本方差的比值符合F分布。
概率論總結(jié)介紹第3篇這個(gè)理解了都不用特意去記要用的時(shí)候信手捏來,我是個(gè)很勤快的人其他公式都懶得記懶得寫了。。。。下面只分析條件概率、全概率公式、貝葉斯公式:
條件概率:
所謂條件概率就是在事件A發(fā)生的情況下B發(fā)生的概率,即AB為樣本空間中兩兩事件若P(B)>0則稱:
為在B發(fā)生的前提下A發(fā)生的條件概率,簡(jiǎn)稱條件概率。
這個(gè)公式不難理解,實(shí)際上上面公式也就是說“在B發(fā)生的條件下A發(fā)生的概率等于事件A與事件B共有的樣本點(diǎn)的個(gè)數(shù)比上B的樣本點(diǎn)的個(gè)數(shù)”,而且可以驗(yàn)證此條件概率滿足概率的三條公理化定義。
乘法公式:
全概率公式:
設(shè)為樣本空間的一個(gè)分割,即互不相容,且,如果則對(duì)任一事件A有:
這個(gè)公式也是很好理解的因?yàn)橹T互不相容而且其和事件為樣本空間,故A事件中的樣本點(diǎn)的個(gè)數(shù)等于A與諸_有樣本點(diǎn)的和。
貝葉斯公式:
貝葉斯公式是在全概率公式和乘法公式的基礎(chǔ)上推得的。
設(shè)若為樣本空間的一個(gè)分割,即互不相容,且如果則:
公式的證明是根據(jù)條件概率來的,然后在把分子分母分別用乘法公式和全概率公式代替即可,公式中的一般為已知概率稱之為先驗(yàn)概率公式中則稱之為后驗(yàn)概率,全概率公式和乘法公式為由原因推結(jié)果,而貝葉斯公式則為由結(jié)果推原因。
事件獨(dú)立性:
上面我們介紹了條件概率這個(gè)概念,在條件A下條件B發(fā)生的概率為,如果B的發(fā)生不受A的影響嘞?直覺上來講這就將意味著
故引入如下定義對(duì)任意兩個(gè)事件A,B若則稱事件A與事件B相互獨(dú)立
除了兩個(gè)隨機(jī)事件相互獨(dú)立滿足的定義當(dāng)然也會(huì)有多個(gè)隨機(jī)事件獨(dú)立滿足的定義,對(duì)N隨機(jī)事件相互獨(dú)立則要求對(duì)事件中的任意個(gè)隨機(jī)事件都相互獨(dú)立.
伯努利概型:
定義:如果實(shí)驗(yàn)E只有兩種可能的結(jié)果:,然后把這個(gè)試驗(yàn)重復(fù)n次就構(gòu)成了n重伯努利試驗(yàn)或稱之為伯努利概型.顯然每次伯努利試驗(yàn)事件結(jié)果之間是相互獨(dú)立互不影響的,則伯努利試驗(yàn)顯然是服從二項(xiàng)分布的,之后再介紹二項(xiàng)分布。
概率論總結(jié)介紹第4篇二維分布函數(shù)(聯(lián)合分布函數(shù)):F(x,y)=P\{X\lex,Y\ley\},\\x,y\inR??.基本性質(zhì):
(邊緣分布函數(shù)):F_X(x)=F(x,+\infty),F_Y(y)=F(+\infty,y)?.(條件分布函數(shù)):F_{X|Y}(x\|\y)=P\{X\lex\|\Y=y\}=\int_{-\infty}^x\dfrac{f(x,y)}{f_Y(y)}dx?,?F_{Y|X}(y\|\x)=P\{Y\ley\|\X=x\}=\int_{-\infty}^y\dfrac{f(x,y)}{f_X(x)}dy.
一維(分布律):P\{X=x_k\}=p_k,\\k=1,2,\cdots?.
二維
(聯(lián)合分布律):P\{X=X_i,Y=Y_i\}=p_{ij},\\i,j=1,2,\cdots????.
(邊緣分布律):p_{i\cdot}=P\{X=x_i\},p_{\cdotj}=P\{Y=y_i\}?.
(條件分布律):P(X=x_i\|\Y=y_i)=\dfrac{p_{ij}}{p_{\cdotj}},P(Y=y_j\|\X=x_i)=\dfrac{p_{ij}}{p_{i\cdot}}.
方差D(X)=E[X-E(X)]^2=E(X^2)-E^2(X)??.
標(biāo)準(zhǔn)差\sigma(X)=\sqrt{D(X)}.協(xié)方差Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y).
相關(guān)系數(shù)\rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{D(x)}\sqrt{D(Y)}}?.
矩
10-1分布(兩點(diǎn)分布)
2二項(xiàng)分布
3泊松(Poisson)分布
4幾何分布
5超幾何分布
1均勻分布
2指數(shù)分布
3正態(tài)分布
4卡方分布
5t分布
6F分布
*7\Gamma分布
1Y=g(X)的分布
設(shè)隨機(jī)變量X?的密度函數(shù)為f_X(x),x\inR?,Y=g(X)?存在反函數(shù)X=h(Y)?,則Y?的密度函數(shù)為
f_Y(y)=\begin{cases}f_X[h(y)]|h^\prime(y)|,&\alpha<y<\beta,\\0,&其它,\end{cases}\\
其中\(zhòng)alpha,\beta為常數(shù),視情況確定.
2Z=X+Y的分布
f_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)dy=\int_{-\infty}^{+\infty}f(x,z-x)dx.\\
若X,Y相互獨(dú)立,可得卷積公式.
3Z_1=\dfracYX,Z_2=XY?的分布
f_{Z_1}(z)=\int_{-\infty}^{+\infty}|x|f(x,xz)dx.\\f_{Z_2}(z)=\int_{-\infty}^{+\infty}\dfrac{1}{|x|}f(x,\dfraczx)dx.\\
4M=max\{X,Y\},N=min\{X,Y\}的分布
設(shè)X,Y相互獨(dú)立,則:
\begin{align}&F_M(z)=F_X(z)F_Y(z).\\&F_N(z)=1-\big[1-F_X(z)\big]\big[1-F_Y(z)\big].\end{align}\\
概率論總結(jié)介紹第5篇離散型隨機(jī)變量函數(shù)的分布:
隨機(jī)變量函數(shù)指是定義在X上的一個(gè)函數(shù)而X是一個(gè)隨機(jī)變量則顯然也可看做是一個(gè)隨機(jī)變量,對(duì)于離散型隨機(jī)變量函數(shù)的分布列只需要把隨機(jī)變量替換成隨機(jī)變量的函數(shù)就可以了,數(shù)學(xué)期望和方差也按照定義求之即可不做過多敘述
連續(xù)型隨機(jī)變量的函數(shù):
求離散型隨機(jī)變量函數(shù)的分布列是很容易的一件事情,而對(duì)連續(xù)型隨機(jī)變量我們不能直接把隨機(jī)變量的函數(shù)帶入密度函數(shù)求出隨機(jī)變量函數(shù)的分布列的,而需要從隨機(jī)變量的分布函數(shù)推得隨機(jī)變量函數(shù)的分布函數(shù)然后對(duì)隨機(jī)變量函數(shù)的分布函數(shù)求導(dǎo)即可得到隨機(jī)變量函數(shù)的密度函數(shù),我們可以將此問題分為兩種情況討論。
一、當(dāng)Y=g(X)單調(diào)的時(shí)候:
定理1.
設(shè)X是連續(xù)型隨機(jī)變量,其密度函數(shù)為.是另一個(gè)隨機(jī)變量.若嚴(yán)格單調(diào),其反函數(shù)有連續(xù)的導(dǎo)函數(shù),則的密度函數(shù)為:
因?yàn)槲覀冎繶的密度函數(shù)所以可以求出其分布函數(shù),然后有X的分布函數(shù)推出的分布而后求導(dǎo)即可得到隨機(jī)變量函數(shù)的密度函數(shù).
定理2.
設(shè)隨機(jī)變量則.
定理3.
設(shè)隨機(jī)變量X服從伽馬分布,則當(dāng)時(shí),有
二、當(dāng)g(X)為其他形式的時(shí)候:
為其他形式也即不單調(diào)的時(shí)候不能用上面的公式只能依靠X的分布函數(shù)去推的密度函數(shù).
分布函數(shù)的其他特征數(shù):
數(shù)學(xué)期望和方差是隨機(jī)變量重要的兩個(gè)特征數(shù),隨機(jī)變量還有其他的特征數(shù),下面做一一給出其定義和介紹.
K階矩:
k階原點(diǎn)矩:
將稱之為X的k階原點(diǎn)矩,顯然當(dāng)k=1是即為數(shù)學(xué)期望
k階中心矩:
將稱之為k階中心距,顯然當(dāng)k=2的時(shí)候即為方差
k階原點(diǎn)矩的意義為隨機(jī)變量偏離原點(diǎn)的數(shù)學(xué)期望
k階中心距的意義為隨機(jī)變量偏離中心的數(shù)學(xué)期望
變異系數(shù):
方差反映了隨機(jī)變量取值的波動(dòng)程度,但比較兩個(gè)隨機(jī)變量的波動(dòng)大小時(shí),如果僅看方差有時(shí)候是不好做比較的,原因有兩個(gè).
其一:隨機(jī)變量的取值有量綱,不同的隨機(jī)變量?jī)H僅用方差去(或者標(biāo)準(zhǔn)差去衡量)顯然是不太合理的.
其二:即使是在相同量綱的條件下,隨機(jī)變量的取值有一個(gè)相對(duì)性問題,隨機(jī)變量取值較大的通常情況下其方差也更大
因此為了消除量綱與隨機(jī)變量取值的相對(duì)性對(duì)隨機(jī)變量取值的影響,我們引入一個(gè)一個(gè)新的特征數(shù)即變異系數(shù).
設(shè)隨機(jī)變量的方差和數(shù)學(xué)期望都存在則稱:
為X的變異系數(shù),通過變異系數(shù)的表達(dá)式我們看到標(biāo)準(zhǔn)差比上數(shù)學(xué)期望消除了量綱的影響即變異系數(shù)是一個(gè)無量綱的量,而且也把數(shù)學(xué)期望作為單位去度量隨機(jī)變量取值的波動(dòng)性.
如果還不能理解變異系數(shù)的表達(dá)式給大家打個(gè)淺顯的比方譬如,有甲乙丙丁四位IT從業(yè)人員,甲乙兩位是普通程序員,甲的收入的月薪20K,乙的收入是月薪30K,在甲乙的階層平均收入是月薪25K.丙丁兩位是高管,丙的收入是月薪24W,乙的收入是月薪27W,丙丁階層都是CTO(ChiefTechnologyOfficer)的平均收入是月薪25W.現(xiàn)在問是甲和乙的收入差距大些還是丙和丁的收入差距大些,一般人肯定會(huì)認(rèn)為是丙和丁的差距大些,為什么嘞?因?yàn)樗麄冋J(rèn)為丙和丁相差3W而甲和乙只相差1W那么顯然是前者相差大一些.謬也!因?yàn)槭紫燃滓液捅蓚€(gè)人不在同一條水平線上,他們的收入的量綱一個(gè)是K(即一千RMB)后者的量綱是W(即一萬RMB),如果僅僅只是比較經(jīng)濟(jì)收益差異的大小那么顯然前者是要小于后者的,但是這樣片面的比較是不科學(xué)的,就像我拿自己身上穿的10塊錢一雙的休閑鞋和別人幾萬塊錢一雙的名牌鞋去比較一樣,結(jié)果顯而易見但是沒有什么意義.其次,甲乙和丙丁因?yàn)椴辉谕粋€(gè)階層甲乙之間的收入差距1W在丙丁階層看來是無足輕重的,就像我如果現(xiàn)在一天賺了1KRMB我會(huì)相當(dāng)高興但是如果馬云一天只賺1KRMB在他看來跟阿里巴巴沒有賺錢是一個(gè)意思,甚至還要虧錢,因?yàn)榘⒗锇桶兔刻斓倪\(yùn)營(yíng)成本都遠(yuǎn)大于這個(gè)值.因此要比較甲乙和丙丁的收入差距我們就得消除以上的影響,必須要相對(duì)性的比較也就是說把甲乙間的比較放在甲乙的那個(gè)階層進(jìn)行度量,把丙丁間的收入差異放在丙丁的階層進(jìn)行度量,得到一個(gè)與階層無關(guān)的系數(shù),把他們的差異放到同一個(gè)標(biāo)準(zhǔn)下這樣就能夠比較甲乙和丙丁到底是前者間的差異大還是后者間的差異大.因此我們只需要把甲和乙的收入差距10K比上他們那個(gè)階層收入的平均值25K的比例系數(shù),丙丁之間也做同樣的處理得比例系數(shù)顯然甲乙得到的系數(shù)大于丙丁得到的差異系數(shù)因此甲乙之間的收入差距是要大于丙丁之間的收入差距的.
上面的變異系數(shù)的表達(dá)式的原理就是我所打比方的原理.
分位數(shù):
設(shè)連續(xù)型隨機(jī)變量X的分布函數(shù)為,密度函數(shù)為,對(duì)任意的,稱滿足條件
的為此分布的p分位數(shù),若則稱為此分布的中位數(shù).
偏度系數(shù):
一說到這個(gè)偏度系數(shù)我就很納悶了,明明是個(gè)很簡(jiǎn)單的特征數(shù)為什么就是有那么多人理解不了,有些學(xué)弟學(xué)妹們問過我有些考研的研友也問過我,說他們做題目的時(shí)候雖然會(huì)做但是就是不能理解這個(gè)偏度系數(shù)到底是個(gè)什么意思,我雖然告訴他們這個(gè)特征數(shù)的含義,但是并不能確定他們是否理解了,因?yàn)檎Z言表達(dá)和書面表達(dá)是不能劃等號(hào)的,就像筆者本人看起來就是吊兒郎當(dāng)?shù)膭e人不罵我做流氓我就心滿意足了,但是我內(nèi)心深處其實(shí)是個(gè)很正經(jīng)很內(nèi)向的人(肯定有自己的同學(xué)要罵我不要臉了O(∩∩)O哈哈~),現(xiàn)在我將他詳細(xì)的寫出來并且配上圖片說明,要是在不懂是個(gè)什么意思我把電話號(hào)碼居住地址告訴你你過來干脆打死我算了O(∩∩)O~,有些人還問過我其他的特征數(shù)比如協(xié)方差與協(xié)方差矩陣,相關(guān)系數(shù),不急后面我都會(huì)一一做解釋的:
設(shè)隨機(jī)變量X的前三階矩都存在,則比值
稱為X的偏度系數(shù),簡(jiǎn)稱偏度.當(dāng)時(shí),則稱該分布為正偏,又稱右偏;當(dāng)時(shí),則稱該分布為負(fù)偏或者左偏
偏度是描敘一個(gè)分布對(duì)稱性程度的一個(gè)特征數(shù),這個(gè)可以從以下幾個(gè)方面進(jìn)行解釋
當(dāng)密度函數(shù)p(x)關(guān)于數(shù)學(xué)期望對(duì)稱的時(shí)候這時(shí)候有即隨機(jī)變量取值在均值左邊的概率等于隨機(jī)變量取值在均值右邊的概率故其三階中心矩必等于零,從而其偏度系數(shù)必定為零,這表明關(guān)于對(duì)稱的分布其偏度系數(shù)為零,如正態(tài)分布是關(guān)于對(duì)稱的分布其偏度系數(shù)為零.
當(dāng)偏度時(shí)候,該分布為偏態(tài)分布,當(dāng)時(shí)候?yàn)樽笃?當(dāng)時(shí)為右偏,左偏右偏的含義下面配圖更加直觀形象的進(jìn)行解釋.
上面圖像是當(dāng)偏度系數(shù)大于零的時(shí)候即右偏的時(shí)候分布函數(shù)的大致圖像輪廓,黃色的線表示均值分割線,現(xiàn)在我們來根據(jù)圖像理解偏度系數(shù)的表達(dá)式偏度系數(shù),在上面的圖像中,意味著,其分布函數(shù)有如下特性:
均值右邊的概率即分布函數(shù)以均值為分割線右邊區(qū)域的面積大于左邊區(qū)域的面積或者右邊圖像曲線的尾巴拖得很長(zhǎng)很長(zhǎng)或者兩者兼而有之,那如何解釋這樣的分布函數(shù)圖像的性質(zhì)嘞?這還得從表達(dá)式中的來分析因?yàn)榈臎Q定的正負(fù)情況,右偏的時(shí)候,因?yàn)榫底筮叺闹凳菦Q定的主要因素,均值右邊的值是決定的主要因素,當(dāng)時(shí)候,這意味著取得大于均值的X的值比取得小于X的值要多(當(dāng)樣本總數(shù)固定的時(shí)候即取得均值右側(cè)值的概率(均值右側(cè)分布函數(shù)曲線的面積)要大于取得左側(cè)值的概率(均值左側(cè)分布函數(shù)曲線的面積))或者當(dāng)取得X的值大于均值的數(shù)量小于取得X值小于均值的數(shù)量的時(shí)候,取得大于均值的X的值偏離均值的程度就要大于取得均值左邊的值,這種情況就造成了分布函數(shù)的尾部拖得很長(zhǎng)很長(zhǎng)或者兩者兼而有之如上面的分布函數(shù)圖像所示.
當(dāng)?shù)臅r(shí)候依上類推即可.這就是偏度系數(shù)表達(dá)式分子的意義所在,下面繼續(xù)解釋分母的意義.
偏度系數(shù)分母的也與變異系數(shù)的分母有著相同的作用都是為了消去量綱,使得各個(gè)分布的偏度系數(shù)具有相同的量綱,但是這里有一個(gè)問題不知道大家到底想沒有想過,為什么偏度系數(shù)的分子不用或者而改用,在理論上來講使用前者也是行得通的,但是為什么要用后者嘞?這很奇怪耶,難道是數(shù)學(xué)家們吃飽了撐的硬是要給你整個(gè)三次方出來顯得更專業(yè)更加高大上?顯然高尚的數(shù)學(xué)家們是不會(huì)這樣無聊的,那么為什么不用前者而用后者嘞?其實(shí)前面在均值部分我們就提到過平均值是穩(wěn)定于均值的,而的平均值是等于零的因此對(duì)任何分布而言都是恒等于零的這顯然不能用作偏度系數(shù)的分子,那為什么不用嘞?因?yàn)槲覀兪谴蛩氵x用標(biāo)準(zhǔn)差來度量偏度系數(shù)消去量綱,二次方的分子就是方差如果要消去量綱的話那豈不是所有的偏度系數(shù)都恒等于一了?因此選擇三次方是最理想的.
峰度系數(shù):
設(shè)隨機(jī)變量X的前四階原點(diǎn)矩存在,則:
稱為X的峰度系數(shù),簡(jiǎn)稱峰度.
峰度系數(shù)是描述分布尖峭程度或尾部粗細(xì)程度或二者兼述的一個(gè)特征數(shù)
想要描述一個(gè)分布函數(shù)的尖峭程度以及尾部粗細(xì)程度顯然這是一個(gè)兩個(gè)分布之間的特征數(shù),因?yàn)橐粋€(gè)分布函數(shù)的尖峭程度與尾部粗細(xì)其實(shí)并不像偏度系數(shù)那樣可以判定一個(gè)分布是左偏還是右偏,一個(gè)分布的對(duì)稱程度是好判定的但是一個(gè)分布函數(shù)的尖峭程度你如何去判定?如何才算是尖峭?如何擦算是尾部很粗?這個(gè)必須得通過比較兩個(gè)分布之間的尖鞘程度和尾部粗細(xì)程度才能夠?qū)崿F(xiàn),但是各種各樣的分布都有,在分布空間里任選兩個(gè)分布進(jìn)行比較組合方式多種多樣因此這使得比較的系數(shù)也會(huì)多種多樣,那我們可不可以選取一個(gè)分布為參考分布將所有的分布都與其進(jìn)行比較?答案是肯定的,設(shè)定了比較的參考分布之后我們就能夠想辦法構(gòu)造統(tǒng)一的峰度系數(shù)來進(jìn)行尖峭程度的比較,但是我們應(yīng)該選取一個(gè)怎樣的參考分布嘞?這個(gè)得先認(rèn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 攝影工作室裝修免租合同
- 二零二五年度辦公室文員工作責(zé)任與獎(jiǎng)勵(lì)合同
- 科技園區(qū)房產(chǎn)居間合同模板
- 餐飲連鎖居間合同
- 車輛長(zhǎng)期租賃合同協(xié)議
- 代簽合同委托書
- 企業(yè)知識(shí)產(chǎn)權(quán)保護(hù)與管理策略研究項(xiàng)目名稱
- 項(xiàng)目策劃與執(zhí)行流程指南
- 農(nóng)業(yè)災(zāi)害防治技術(shù)研究與應(yīng)用方案
- 終止合同協(xié)議書
- 2025年高考數(shù)學(xué)模擬卷(一)含答案及解析
- 大單元教學(xué)理念及其定義、特點(diǎn)與實(shí)施策略
- 屋頂分布式光伏發(fā)電項(xiàng)目光伏組件技術(shù)要求
- GB/T 44510-2024新能源汽車維修維護(hù)技術(shù)要求
- 高中英語新課程標(biāo)準(zhǔn)解讀課件
- 骨髓增生異常綜合征教學(xué)查房
- DBJ15 31-2016建筑地基基礎(chǔ)設(shè)計(jì)規(guī)范(廣東省標(biāo)準(zhǔn))
- 2023年江蘇省鹽城市中考數(shù)學(xué)試卷及答案
- 2024新高考英語1卷試題及答案(含聽力原文)
- G -B- 43068-2023 煤礦用跑車防護(hù)裝置安全技術(shù)要求(正式版)
- 2024年4月浙江省00015英語二試題及答案含評(píng)分參考
評(píng)論
0/150
提交評(píng)論