數(shù)理統(tǒng)計總復(fù)習_第1頁
數(shù)理統(tǒng)計總復(fù)習_第2頁
數(shù)理統(tǒng)計總復(fù)習_第3頁
數(shù)理統(tǒng)計總復(fù)習_第4頁
數(shù)理統(tǒng)計總復(fù)習_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一章 統(tǒng)計量及其分布總體與樣本統(tǒng)計量與抽樣分布次序統(tǒng)計量及其分布常用的統(tǒng)計分布第一節(jié) 總體與樣本總體與個體樣本與樣本分布從樣本去認識總體2. 獨立性: X1,X2,Xn是相互獨立的隨機變量. 最常用的一種抽樣方法叫作“簡單隨機抽樣”,它要求抽取的樣本滿足下面兩點:1. 代表性: X1,X2,Xn中每一個與所考察的總體有相同的分布.抽樣方式若總體的分布函數(shù)為F(x),則其簡單隨機樣本的聯(lián)合分布函數(shù)為樣本分布解例解例樣本數(shù)據(jù)的整理與顯示 一、頻數(shù)頻率分布表 二、樣本數(shù)據(jù)的圖形顯示 三、經(jīng)驗分布函數(shù)第二節(jié) 統(tǒng)計量與抽樣分布一、統(tǒng)計量與抽樣分布二、樣本均值及其抽樣分布三、樣本方差與樣本標準差四、樣本

2、矩及其函數(shù)1. 統(tǒng)計量的定義一、統(tǒng)計量與抽樣分布是不是實例12. 幾個常用統(tǒng)計量的定義1) 樣本均值其觀察值(1) 樣本矩可用于推斷:E(X).它反映了總體均值的信息定義 設(shè) 為取自某總體的樣本觀察,其算術(shù)平均值稱為樣本均值,一般用表示,即 在分組樣本場合,樣本均值的近似公式為 其中k為組數(shù),xi為第i組中值,fi為第i組的頻數(shù)。樣本均值及其抽樣分布定理 若把樣本中的數(shù)據(jù)與樣本均值之差稱為偏差,則樣本所用偏差之和為0,即定理 數(shù)據(jù)觀察值與均值的偏差平方和最小,即在形如 的函數(shù)中, 最小,其中c為任意給定常數(shù)。證明 定理:設(shè)總體X的均值為,方差為 ,(X1,X2,Xn)是X的一個樣本,則有 設(shè)X

3、1,X2,Xn為來自某個總體的樣本, 為樣本均值。 則n較大時 的漸近分布為 ,常記為 這里漸近分布是指n較大時的近似分布。(1)若總體分布為 則 的分布為 ; (2)若總體分布未知或不是正態(tài)分布,但 2) 樣本方差其觀察值它反映了總體方差的信息可用于推斷:D(X).3) 樣本標準差其觀察值4) 修正樣本方差 X 1,X2,Xn為從該總體得到的樣本, 和分別是樣本均值和樣本方差,則 .定理 設(shè)總體X具有二階矩,即5) 樣本 k 階(原點)矩其觀察值6)樣本 k 階中心矩其觀察值特例:特例: 樣本偏度 樣本峰度峰度與偏度第三節(jié) 次序統(tǒng)計量及其分布次序統(tǒng)計量的概念次序統(tǒng)計量的抽樣分布分位數(shù)箱線圖次

4、序統(tǒng)計量特別地,例如,有 5 個樣本: X1, X2 , X3 , X4 , X5觀察值: 1, 3, 0, 3, 2 排序成: 0, 1, 2, 3, 3順序統(tǒng)計量: X(1) ,X(2) ,X(3) ,X(4) ,X(5)定理極差特征R反映了樣本觀察值取值范圍的大小R刻畫數(shù)據(jù)的離散程度不穩(wěn)健,易受極端值的影響當總體為正態(tài)總體時,在小樣本情況下,R可用于估計總體標準差。 樣本分位數(shù)與樣本中位數(shù)樣本中位數(shù)是樣本按大小次序排列后處在中間位置上的次序統(tǒng)計量。設(shè)X(1),X (n)是有序樣本,則樣本中位數(shù)m0.5定義為譬如,若n=5,則m0.5 =X(3) ,n=6,則m0.5 =(X(3) + X

5、(4) )。中位數(shù)的特點1. 不受極端值的影響2. 各變量值與中位數(shù)的離差絕對值之和最小,即箱線圖(box plot)箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me 和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接 第四節(jié) 三大抽樣分布卡方分布T分布F分布標準正態(tài)分布的上 分位數(shù) z設(shè) X N (0,1) , 0 1, 稱滿足的點 z 為X 的上 分位數(shù) z常用的幾個數(shù)據(jù)1.(175)性質(zhì)1性質(zhì)2定理t 分布又稱學(xué)生氏(Student)分布.2.(3

6、11)定理 定理 4 (兩總體均值差的分布) 分別是這兩個樣本的且X與Y獨立,X1,X2,是取自X的樣本,取自Y的樣本,分別是這兩個樣本的樣本方差,均值,則有Y1,Y2,是樣本3.(321) 定理 5 (兩總體方差比的分布) 分別是這兩個樣本的且X與Y獨立,X1, X2,是取自X的樣本,取自Y的樣本,分別是這兩個樣本的樣本方差,均值,則有Y1,Y2,是樣本若Tt(n), 問T2服從什么分布?解因為Tt(n), 可以認為其中UN(0,1), V2(n), U22(1), F(1, n). 一個正態(tài)總體的抽樣分布設(shè)X1,X2,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有兩個正態(tài)總體的抽

7、樣分布試確定Z的分布. 試確定Z的分布. 例 若Tt(n), 問T2服從什么分布?解因為Tt(n), 可以認為其中UN(0,1), V2(n), U22(1), F(1, n). 第二章 參數(shù)估計點估計點估計優(yōu)劣的評價標準區(qū)間估計單側(cè)置信限比例的區(qū)間估計第一節(jié) 點估計矩估計極大似然估計1. 矩估計法 其基本思想是用樣本矩估計總體矩 . 理論依據(jù): 或格列汶科定理 它是基于一種簡單的“替換”思想建立起來的一種估計方法 .是英國統(tǒng)計學(xué)家K.皮爾遜最早提出的 .大數(shù)定律 矩估計法是英國統(tǒng)計學(xué)家K.皮爾遜最早提出來的 .由辛欽定理 ,若總體 的數(shù)學(xué)期望 有限,則有解 總體X的期望為 從而得到方程 所以

8、的矩估計量為 例 : 設(shè)某炸藥廠一天中發(fā)生著火現(xiàn)象的次數(shù)X服從 解 解得到矩估計量分別為例3一般的,若總體的k階中心距 存在時,其矩法估計為樣本的k階中心矩矩估計法的具體做法如下 設(shè)總體的分布函數(shù)中含有k個未知參數(shù) , 它的前k階矩 ,i=1,2, ,k從這 k 個方程中解出j=1,2,kj=1,2,k(3)用諸 的估計量 Ai 分別代替上式中的諸 , 即可得諸 的矩估計量 :(4)矩估計量的觀察值稱為矩估計值 .(1) 求出(2)解 由于 所以由矩法估計,得 解得 所以,參數(shù) 的矩估計量為 例5 對容量為n的子樣,求下列密度函數(shù)中參數(shù) 的矩估計量。解 設(shè) 是總體 的一個樣本, 設(shè)總體服從區(qū)間

9、上的均勻分布,求參數(shù)的矩估計量.例6(1)(2)(3)幾個常見分布的矩估計泊松分布 () 二項分布 B (N,p),N 已知參數(shù)為 的指數(shù)總體 正態(tài)總體 N (,2 )均勻分布 U (a,b) 極大似然估計法 思想方法:一次試驗就出現(xiàn)的事件有較大的概率 例如: 有兩外形相同的箱子,各裝100個球 一箱 99個白球 1 個紅球 一箱 1 個白球 99個紅球現(xiàn)從兩箱中任取一箱, 并從箱中任取一球,結(jié)果所取得的球是白球.答: 第一箱.問: 所取的球來自哪一箱?既然在一次試驗中得到的樣本值 , 那么樣本取該樣本值的概率應(yīng)較大,所以選取使 這似然函數(shù) 達到最大的參數(shù)值作為估計值 , 稱為最大似然估計法.

10、 是樣本的一個觀測值, 設(shè)總體的分布律為 的概率為則樣本極大似然估計法的具體作法求極大似然估計的一般步驟歸納如下: 解例這一估計量與矩估計量是相同的。解 總體X服從參數(shù)為的指數(shù)分布,則有 所以似然函數(shù)為 取對數(shù) 令 解得的極大似然估計值為 極大似然估計量為 例 設(shè)總體 X N (, 2), X1, X2, Xn 是 X的樣本值, 求 , 2 的極大似然估計。7-26 , 2 的極大似然估計量分別為似然方程組為7-27極大似然估計的不變性設(shè) 是 的極大似然估計值, u( )( )是 的連續(xù)函數(shù), 則 是 u( ) 的極大似然估計值。 7-35如 在正態(tài)總體N (, 2)中, 2的極大似然估計值為

11、是 2的連續(xù)函數(shù)故 的極大似然估計值為lg 的極大似然估計值為幾個常見分布的最大似然估計泊松分布 () 二項分布 B (N,p),N 已知參數(shù)為 的指數(shù)總體 正態(tài)總體 N (,2 )均勻分布 U (a,b)X(1) 、X(n)第二節(jié) 點估計的評價標準 對于同一個未知參數(shù), 不同的方法得到的估計量可能不同,于是提出問題應(yīng)該選用哪一種估計量?用什么標準來評價一個估計量的好壞?常用標準(3) 一致性(2) 有效性(1) 無偏性無偏性則稱 為 的無偏估計 .設(shè)是未知參數(shù) 的估計量,若證明: 不論 X 服從什么分布,是的無偏估計量。證是總體X 的樣本,例1 設(shè)總體X 的 k 階矩存在因而由于2有效性D(

12、 ) D( )則稱 較 有效 .都是參數(shù) 的無偏估計量,若有設(shè)和 例4:設(shè)(X1,X2, X3)是來自總體X的一個樣本,證明下面的三個估計量都是總體均值E(X)的無偏估計量證明估計量。若對于任意的 ,當n 時, 定義 設(shè) 是總體參數(shù) 的則稱是總體參數(shù) 的相合估計量。依概率收斂于 , 即 一致性),(21nXXXLqq=0)(lim=-eqqPn均方誤差 設(shè) 是 的估計量.稱 為 的均方誤差.注意到:定義第三節(jié) 區(qū)間估計區(qū)間估計的概念一個總體的區(qū)間估計兩個總體的區(qū)間估計 一、 置信區(qū)間定義:滿足設(shè) 是 一個待估參數(shù),給定若由樣本X1,X2,Xn確定的兩個統(tǒng)計量則稱隨機區(qū)間 是 的置信水平(置信度

13、)為 的置信區(qū)間.分別稱為置信下限和置信上限. 由圖1可以看出,這100個區(qū)間中有91個包含參數(shù)真值15,另外9個不包含參數(shù)真值。 圖1 的置信水平為0.90的置信區(qū)間 置信區(qū)間的意義可以解釋如下:如果進行N次隨機抽樣,每次得到的樣本值記為 , k=1,2,.,N ;則我們隨機地得到N個區(qū)間( , ),k=1,2,.,N.這N個區(qū)間中,有的包含參數(shù)的真值,有的不包含.但是,這些區(qū)間中,包含參數(shù)的真值的區(qū)間大約占100( )%.1.設(shè)法構(gòu)造一個樣本和 的函數(shù) 使得G的分布不依賴于未知參數(shù)。一般稱具有這種性質(zhì)的G為樞軸量。2.適當?shù)剡x擇兩個常數(shù) 、 ,使對給定的 ,有 p樞軸量法3.假如能將 進行

14、不等式等價變形化為 ,則有 這表明 , 是 的 同等置信區(qū)間。一、正態(tài)總體方差已知時均值的區(qū)間估計由總體服從正態(tài)分布可得 二、正態(tài)總體方差未知時均值的區(qū)間估計均值未知時方差的區(qū)間估計一個總體的區(qū)間估計兩個正態(tài)總體均值差的區(qū)間估計 1.樞軸量 1.樞軸量 置信區(qū)間為 兩個正態(tài)總體方差之比的區(qū)間估計(均值未知) 兩個正態(tài)總體的區(qū)間估計均值的估計方差和標準差的估計(均值未知)第三章 假設(shè)檢驗假設(shè)檢驗的基本概念正態(tài)總體參數(shù)的假設(shè)檢驗比率p的檢驗p值正態(tài)概率紙 1.假設(shè)(原假設(shè)和備擇假設(shè))假設(shè)是指有一定的理由提出,但有沒有充足證據(jù)的有關(guān)總體分布參數(shù)的一種看法,在分析之前就必須陳述。原假設(shè):待檢驗的假設(shè),

15、又稱“0假設(shè)”,記為備擇假設(shè):與原假設(shè)對立的假設(shè),記為其中原假設(shè):沒有充分理由不能拒絕備擇假設(shè):沒有充分理由不能輕易接受一般來說,零假設(shè)總是“受到保護的假設(shè)”,沒有充分的證據(jù)是不能拒絕零假設(shè)的。 例如,對一家信譽很好的工廠的產(chǎn)品進行檢驗,零假設(shè)就應(yīng)該是“產(chǎn)品合格”;在醫(yī)學(xué)界,如果希望推出一種新藥替代原來長期使用的藥品,零假設(shè)就是“新藥不比舊藥好”,.單側(cè)假設(shè)的習慣規(guī)定 1. 檢驗質(zhì)量是否合格, H0取合格情形. 2. 在技術(shù)革新后, 檢驗參數(shù)是否變大(或變小), H0 取不變大(或不變小)情形, 即保守情形.例 一項研究表明,改進生產(chǎn)工藝后,會使產(chǎn)品的廢品率降低到2%以下。檢驗這一結(jié)論是否成立

16、建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: 2% H1: 2%雙側(cè)檢驗(原假設(shè)與備擇假設(shè)的確定)例如,某種零件的尺寸,要求其平均長度為10cm,大于或小于10cm均屬于不合格建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0: = 10 H1: 10雙側(cè)檢驗與單側(cè)檢驗 (假設(shè)的形式)假設(shè)研究的問題雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗H0m = m0m m0m m0H1m m0m m02.確定檢驗統(tǒng)計量,給出拒絕域形式檢驗:利用樣本信息,依據(jù)一定的準則,對原假設(shè)做出是否成立的判斷。檢驗統(tǒng)計量:用于做決策的統(tǒng)計量一個檢驗實際上就是對樣本空間的一次劃分:三、假設(shè)檢驗的一般步驟2. 確定檢驗統(tǒng)計量以及拒絕域形式;假設(shè)檢驗基本思想(補充)反

17、證法小概率原理概率事件發(fā)生,則否認假設(shè)H0 ;否則,不拒絕假設(shè)H0 .小概率推斷原理:小概率事件2. 基本思想方法采用概率性質(zhì)的反證法: 1. 基本原理(概率接近0的事件),在一次試驗中,實際上可認為不會發(fā)生(這是人們長期積累起的普遍經(jīng)驗!).據(jù)一次抽樣所得到的樣本值進行計算. 若導(dǎo)致小先假設(shè)H0 成立, 再根第二節(jié) 正態(tài)總體參數(shù)的假設(shè)檢驗均值的檢驗方差的檢驗一、正態(tài)總體的檢驗(2 已知)1. H0 : 0 ; H1 : 0 4.求出臨界值和拒絕域P(拒絕H0|H0為真)所以本檢驗的拒絕域為W :U 檢驗法H0 : 0 ; H1 : 00a/2za/2a/2-za/2 0 0 0 0 0U 檢

18、驗法 (2 已知)原假設(shè) H0備擇假設(shè) H1檢驗統(tǒng)計量及其H0為真時的分布拒絕域2azUazU-azU 0 0 0 0 0T 檢驗法 (2 未知)原假設(shè) H0備擇假設(shè) H1檢驗統(tǒng)計量及其H0為真時的分布拒絕域)1(0-=ntnSXTm2atTatT-atT 表: 一個正態(tài)總體均值的假設(shè)檢驗(顯著性水平為) 表: 一個正態(tài)總體方差的假設(shè)檢驗(顯著性水平為)表: 兩個正態(tài)總體均值的假設(shè)檢驗(顯著性水平為) 表: 兩個正態(tài)總體方差的假設(shè)檢驗(顯著性水平為) 解 建立假設(shè) 拒絕域應(yīng)取作 由樣本求得 故應(yīng)拒絕H0,不能接受這批玻璃紙. 定義 在一個假設(shè)檢驗問題中,利用觀測值能夠做出拒絕原假設(shè)的最小顯著性水平稱為檢驗的p 值。 如果 p,則在顯著性水平 下拒絕 H0; 如果 9.78,故我們可認為各水平間有顯著差異。 第 5章 相關(guān)與回歸分析PowerPoint統(tǒng)計學(xué)相關(guān)系數(shù) (計算公式) 樣本相關(guān)系數(shù)的計算公式或化簡為相關(guān)系數(shù)(取值及其意義) r 的取值范圍是 -1,1 -1r0,為負相關(guān) 0r1,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論