概率統(tǒng)計簡明教程_第1頁
概率統(tǒng)計簡明教程_第2頁
概率統(tǒng)計簡明教程_第3頁
概率統(tǒng)計簡明教程_第4頁
概率統(tǒng)計簡明教程_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

概率統(tǒng)計簡明教程contents目錄概率論基本概念一維隨機變量及其分布多維隨機變量及其分布數(shù)字特征與極限定理統(tǒng)計量及其抽樣分布參數(shù)估計與假設(shè)檢驗CHAPTER概率論基本概念01隨機事件與概率隨機事件概率概率的性質(zhì)描述隨機事件發(fā)生的可能性大小的數(shù)值。非負(fù)性、規(guī)范性、可加性。在一定條件下并不總是發(fā)生的現(xiàn)象。古典概型每個樣本點等可能出現(xiàn),且樣本空間有限。兩者區(qū)別主要在于樣本空間的構(gòu)成方式不同。幾何概型樣本點無限且連續(xù)出現(xiàn),通過幾何度量(長度、面積、體積等)來刻畫概率。古典概型與幾何概型在已知某一事件發(fā)生的條件下,另一事件發(fā)生的概率。條件概率兩個事件相互獨立,即一個事件的發(fā)生不影響另一個事件的發(fā)生概率。獨立性若兩事件相互獨立,則它們之間的條件概率等于各自的無條件概率之積。條件概率與獨立性的關(guān)系條件概率與獨立性CHAPTER一維隨機變量及其分布02離散型隨機變量01定義:取值可數(shù)的隨機變量,如投擲骰子的點數(shù)。02概率分布列:描述離散型隨機變量取各個值的概率,滿足非負(fù)性和歸一性。常見離散型隨機變量分布:二項分布、泊松分布等。03定義取值充滿某個區(qū)間的隨機變量,如測量誤差。常見連續(xù)型隨機變量分布正態(tài)分布、均勻分布、指數(shù)分布等。概率密度函數(shù)描述連續(xù)型隨機變量在某個值附近的概率分布情況,滿足非負(fù)性和歸一性。連續(xù)型隨機變量010203一維隨機變量的函數(shù)分布:通過已知隨機變量的分布,求解其函數(shù)的分布。離散型隨機變量的函數(shù)分布:根據(jù)概率分布列求解。連續(xù)型隨機變量的函數(shù)分布:根據(jù)概率密度函數(shù)求解,可能涉及到積分變換等方法。隨機變量的函數(shù)分布CHAPTER多維隨機變量及其分布03二維隨機變量的定義設(shè)$X$和$Y$是兩個隨機變量,則稱$(X,Y)$為二維隨機變量。聯(lián)合分布函數(shù)對于任意實數(shù)$x,y$,二元函數(shù)$F(x,y)=P{Xleqx,Yleqy}$稱為二維隨機變量$(X,Y)$的聯(lián)合分布函數(shù)。聯(lián)合概率密度函數(shù)如果存在非負(fù)函數(shù)$f(x,y)$,使得對于任意實數(shù)$x,y$,有$F(x,y)=int_{-infty}^{x}int_{-infty}^{y}f(u,v)dudv$,則稱$f(x,y)$為二維隨機變量$(X,Y)$的聯(lián)合概率密度函數(shù)。010203二維隨機變量及其聯(lián)合分布邊緣分布函數(shù)二維隨機變量$(X,Y)$關(guān)于$X$和關(guān)于$Y$的分布函數(shù)分別稱為$(X,Y)$關(guān)于$X$和關(guān)于$Y$的邊緣分布函數(shù),記作$F_X(x)$和$F_Y(y)$。邊緣概率密度函數(shù)設(shè)二維隨機變量$(X,Y)$的概率密度函數(shù)為$f(x,y)$,則稱$f_X(x)=int_{-infty}^{infty}f(x,y)dy$和$f_Y(y)=int_{-infty}^{infty}f(x,y)dx$分別為$(X,Y)$關(guān)于$X$和關(guān)于$Y$的邊緣概率密度函數(shù)。條件分布函數(shù)設(shè)二維隨機變量$(X,Y)$的分布函數(shù)為$F(x,y)$,且對于固定的$y$,$F_Y(y)>0$,則稱$frac{F(x,y)}{F_Y(y)}$為在$Y=y$條件下,$X$的條件分布函數(shù),記作$F_{X|Y}(x|y)$。條件概率密度函數(shù)設(shè)二維隨機變量$(X,Y)$的概率密度函數(shù)為$f(x,y)$,且對于固定的$y$,$f_Y(y)>0$,則稱$frac{f(x,y)}{f_Y(y)}$為在$Y=y$條件下,$X$的條件概率密度函數(shù),記作$f_{X|Y}(x|y)$。邊緣分布與條件分布相互獨立的定義設(shè)二維隨機變量$(X,Y)$的聯(lián)合分布函數(shù)為$F(x,y)$,邊緣分布函數(shù)分別為$F_X(x)$和$F_Y(y)$。如果對于所有的實數(shù)$x,y$,都有$F(x,y)=F_X(x)F_Y(y)$,則稱隨機變量$X$和$Y$是相互獨立的。相互獨立的性質(zhì)如果隨機變量$X$和$Y$是相互獨立的,那么對于任意實數(shù)集合${x_i}$和${y_j}$,事件${Xin{x_i}}$和${Yin{y_j}}$也是相互獨立的。相互獨立與條件獨立的區(qū)別相互獨立是指兩個事件同時發(fā)生的概率等于各自發(fā)生的概率的乘積;而條件獨立是指在給定某些條件下,兩個事件同時發(fā)生的概率等于各自發(fā)生的概率的乘積。條件獨立并不意味著相互獨立。相互獨立的隨機變量CHAPTER數(shù)字特征與極限定理04數(shù)學(xué)期望描述隨機變量取值的“平均水平”,是概率加權(quán)下的平均值。對于離散型隨機變量,數(shù)學(xué)期望是所有可能取值與其對應(yīng)概率的乘積之和;對于連續(xù)型隨機變量,數(shù)學(xué)期望則是通過積分計算得到。方差衡量隨機變量取值與其數(shù)學(xué)期望的偏離程度。方差越大,說明隨機變量取值的波動性或分散程度越大;方差越小,則說明隨機變量取值的穩(wěn)定性或集中程度越高。數(shù)學(xué)期望與方差衡量兩個隨機變量變化趨勢的相似程度。如果兩個隨機變量同時向相反方向變化(即一個增大另一個減小),則它們的協(xié)方差為負(fù)值;如果兩個隨機變量同時向相同方向變化(即同時增大或同時減小),則它們的協(xié)方差為正值;如果兩個隨機變量變化趨勢不相關(guān),則它們的協(xié)方差為零。協(xié)方差是協(xié)方差的標(biāo)準(zhǔn)化形式,用于消除量綱影響并更直觀地反映兩個隨機變量之間的線性相關(guān)程度。相關(guān)系數(shù)的取值范圍為[-1,1],其中-1表示完全負(fù)相關(guān),1表示完全正相關(guān),0表示不相關(guān)。相關(guān)系數(shù)協(xié)方差與相關(guān)系數(shù)VS揭示了當(dāng)試驗次數(shù)足夠多時,隨機事件發(fā)生的頻率將趨于其概率。這意味著在實際應(yīng)用中,我們可以通過大量重復(fù)試驗來近似地確定某一隨機事件的概率。中心極限定理指出當(dāng)樣本量足夠大時,樣本均值的分布將趨近于正態(tài)分布,無論原始總體分布是什么形狀。這一定理在統(tǒng)計學(xué)中具有重要地位,因為它允許我們使用正態(tài)分布的性質(zhì)來推斷樣本均值的分布,并進(jìn)而進(jìn)行參數(shù)估計和假設(shè)檢驗等統(tǒng)計分析。大數(shù)定律大數(shù)定律與中心極限定理CHAPTER統(tǒng)計量及其抽樣分布05統(tǒng)計量與抽樣分布概念統(tǒng)計量由樣本數(shù)據(jù)計算出來的量,用于描述樣本特征或推斷總體特征。抽樣分布由樣本統(tǒng)計量形成的概率分布,用于描述樣本統(tǒng)計量的波動情況。常用統(tǒng)計量及其性質(zhì)中位數(shù)方差將數(shù)據(jù)分為兩半的數(shù),對異常值不敏感。反映數(shù)據(jù)的離散程度,值越大波動越大。均值眾數(shù)標(biāo)準(zhǔn)差反映數(shù)據(jù)的平均水平,對異常值敏感。出現(xiàn)次數(shù)最多的數(shù),反映數(shù)據(jù)的集中趨勢。方差的平方根,用于標(biāo)準(zhǔn)化處理。由于抽樣導(dǎo)致的樣本統(tǒng)計量與總體參數(shù)之間的差異。抽樣誤差用于估計總體參數(shù)的一個區(qū)間,具有一定的置信水平。置信區(qū)間反映置信區(qū)間包含總體參數(shù)真實值的概率大小。置信水平樣本量越大,置信區(qū)間越窄,估計精度越高。樣本量對置信區(qū)間的影響抽樣誤差與置信區(qū)間CHAPTER參數(shù)估計與假設(shè)檢驗06點估計與區(qū)間估計方法通過樣本數(shù)據(jù)直接計算出一個具體的數(shù)值作為參數(shù)的估計值,例如樣本均值、樣本方差等。點估計根據(jù)樣本數(shù)據(jù)構(gòu)造一個包含參數(shù)真值的置信區(qū)間,并給出該區(qū)間對應(yīng)的置信水平。常見的區(qū)間估計方法有置信區(qū)間法、最大似然法等。區(qū)間估計原假設(shè)與備擇假設(shè)在假設(shè)檢驗中,通常需要設(shè)立兩個相互對立的假設(shè),即原假設(shè)($H_0$)和備擇假設(shè)($H_1$)。原假設(shè)通常是研究者想要推翻的假設(shè),而備擇假設(shè)則是研究者希望證實的假設(shè)。為了進(jìn)行假設(shè)檢驗,需要構(gòu)造一個合適的檢驗統(tǒng)計量,并根據(jù)該統(tǒng)計量的分布確定一個拒絕域。當(dāng)檢驗統(tǒng)計量的觀測值落入拒絕域時,我們拒絕原假設(shè),否則接受原假設(shè)。顯著性水平($alpha$)是事先設(shè)定的一個概率值,用于控制第一類錯誤(即錯誤地拒絕原假設(shè))的發(fā)生概率。通常取$alpha=0.05$或$alpha=0.01$。檢驗統(tǒng)計量與拒絕域顯著性水平與第一類錯誤假設(shè)檢驗基本原理參數(shù)檢驗方法是在總體分布已知的情況下,對總體參數(shù)進(jìn)行推斷的方法。常見的參數(shù)檢驗方法有t檢驗、F檢驗、方差分析等。這

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論