《應用數理統(tǒng)計》 課件 4 分布與參數估計_第1頁
《應用數理統(tǒng)計》 課件 4 分布與參數估計_第2頁
《應用數理統(tǒng)計》 課件 4 分布與參數估計_第3頁
《應用數理統(tǒng)計》 課件 4 分布與參數估計_第4頁
《應用數理統(tǒng)計》 課件 4 分布與參數估計_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

§1統(tǒng)計量與統(tǒng)計量的分布4.1.1統(tǒng)計量的定義隨機樣本的不含未知參數的函數稱為統(tǒng)計量。對于正態(tài)總體,統(tǒng)計量通常是用來估計總體的期望和方差的。4.1.2基于標準正態(tài)分布的幾個重要統(tǒng)計量的分布1、分布設是來自正態(tài)總體N(0,1)的一個隨機樣本,則

(4.1)即n個相互獨立的標準正態(tài)分布的隨機變量的平方和服從n個自由度的分布,其圖形見圖4.1。第四章分布與參數估計0第四章分布與參數估計2、分布設X~N(0,1),Y~,且X與Y相互獨立,則

(4.2)即自由度為n的t分布是由N(0,1)和,見圖4.2。t分布的圖形和正態(tài)分布的圖形有些像,可以證明,當n充分大時,t分布近似于標準正態(tài)分布N(0,1)。第四章分布與參數估計3、F分布設,,則

(4.3)圖形見4.3。第四章分布與參數估計4.1.3基于一般正態(tài)分布的幾個重要統(tǒng)計量的分布設是正態(tài)總體的一個隨機樣本,則樣本均值函數和樣本方差函數滿足如下性質:(1),其中不全為0,則

(4.4)由于樣本彼此之間獨立且和總體的分布一致,而正態(tài)分布的隨機變量之和仍然服從正態(tài)分布,因此樣本的線性函數仍然服從正態(tài)分布,而正態(tài)分布隨機變量Y的數學期望和方差可以通過概率論里數學期望和方差的性質求得。第四章分布與參數估計4.1.3基于一般正態(tài)分布的幾個重要統(tǒng)計量的分布(2)

(4.5)這個結論是為了解決這樣的問題,當總體服從正態(tài)分布時,樣本均值也服從正態(tài)分布,甚至當總體是任意分布時,根據中心極限定理,在大樣本的情況下,也近似服從正態(tài)分布,因此可查正態(tài)分布表來確定落在各個區(qū)間里的概率。第四章分布與參數估計4.1.3基于一般正態(tài)分布的幾個重要統(tǒng)計量的分布(3)

(4.6)這個結論的用處是,通常都用來估計總體的方差,而既然知道了,就可以通過查分布表,求落在某些區(qū)域的概率。(4)

(4.7)此結論的意義在于,當總體為正態(tài)總體時,由于

這樣我們希望用公式將其轉換為標準正態(tài)分布后查標準正態(tài)分布表來求解概率問題,但在實際情況下,總體方差經常是未知的,因此就可以利用這個定理,用樣本方差來代替總體方差,查t分布表來確定T落在一些區(qū)域內的概率。第四章分布與參數估計4.1.3基于一般正態(tài)分布的幾個重要統(tǒng)計量的分布(5)

(4.8)

是容量為的總體X的樣本方差,是容量為的總體Y的樣本方差。此結論的意義在于,當我們需要比較兩個總體的方差時,此時無論是否已知兩個總體的均值,都可以借助這個定理,計算樣本方差,查F分布表來確定上面的F統(tǒng)計量落在一些區(qū)域內的概率。第四章分布與參數估計§2參數估計:點估計許多統(tǒng)計推斷問題都可以歸為以下三類:點估計、區(qū)間估計(前兩者統(tǒng)稱為參數估計)和假設檢驗。這一章我們先來討論參數估計中的點估計和區(qū)間估計。4.2.1SPSS的點估計示例點擊【分析】→【描述統(tǒng)計】→【頻率】,就可以進入到頻次分析模塊。這個模塊上一章我們已經詳細介紹過了,比如可以輸出樣本均值、樣本方差和樣本標準差。這一章,讓我們看看還有什么新的理解。例1某高校從近15年報告會中隨機抽查了32次關于考研或關于就業(yè)的報告會,聽眾人數見數據文件“CH4例1報告會”。求該校報告會的平均聽眾人數。1、頻次分析模塊的SPSS操作示例:(1)在調入數據后,按照前面的介紹,點擊:【分析】→【描述統(tǒng)計】→【頻率】,進入頻率分析模塊。(2)在頻率分析模塊的主窗口中,選擇默認的左下角的“顯示頻率表格”復選框,然后把“聽眾人數”變量送入分析窗口,點擊右上角的【Statistics】按鈕。系統(tǒng)彈出頻率模塊的統(tǒng)計子窗口(圖4.4),選擇“平均值”、“標準偏差”和“方差”。如上一章的圖3.10所示。第四章分布與參數估計§2參數估計:點估計(3)點擊【繼續(xù)】,然后點擊【確定】,系統(tǒng)輸出結果,如表4.1所示。表4.1聽眾人數均值、方差的估計N有效32缺失0平均值173.4063標準偏差7.83647方差61.410第四章分布與參數估計§2參數估計:點估計2、描述統(tǒng)計模塊的SPSS操作示例:(1)在調入數據后,按照前面的介紹,點擊:【分析】→【描述統(tǒng)計】→【描述】,進入描述統(tǒng)計模塊。(2)在此窗口中,用箭頭把“聽眾人數”變量送入分析窗口,點擊右上角的【選項】按鈕。系統(tǒng)彈出描述模塊的統(tǒng)計子窗口,選擇“平均值”、“標準差”和“方差”。如圖4.5所示。(3)點擊【繼續(xù)】,然后點擊【確定】,系統(tǒng)輸出結果,如表4.2所示。表4.2聽眾人數均值、方差的估計值

數字平均值標準偏差方差聽眾人數32173.417.83661.410有效N(成列)32

上面這個例子可以看為把全校所有報告的聽眾人數視為總體,而所面對的數據可以理解為從該校的報告中抽樣的結果,樣本均值和樣本方差可以作為總體均值和總體方差來對待。下面我們從理論上來看什么是點估計。第四章分布與參數估計4.2.2點估計與判斷點估計的優(yōu)劣標準1、點估計的概念設待估計的參數為,例如,總體分布中的均值、方差等,現在從總體中得到一個隨機樣本,如何根據樣本信息估計?記估計的統(tǒng)計量為,是關于樣本的函數,簡記為,我們稱為的估計量。2、統(tǒng)計量的優(yōu)劣標準由樣本觀察值出發(fā),通過點估計的方法可以獲得若干個的估計值,那么哪個估計值更好一些呢?這就需要有一些恰當的標準來判別。(一)無偏估計根據樣本推得的估計值與真值可能不同,然而,如果有一系列抽樣構成各個估計,很合理地會要求這些估計的期望值與未知參數的真值相等,它的直觀意義是樣本估計值在參數的真值周圍擺動,而無系統(tǒng)誤差。定義1如果成立,則稱估計值為參數的無偏估計。第四章分布與參數估計例2從總體X中抽取樣本,,。試證明及分別是及的無偏估計量。證明:由數學期望和方差的性質,可以證得,是的無偏估計量。而即

其中因此所以,得證。第四章分布與參數估計(二)有效估計定義2設和都是的無偏估計,若它們的樣本容量均為n,而的方差小于的方差,則稱是比有效的估計量。(三)一致估計一般情況下,統(tǒng)計量,但希望當時,。這就是說,希望當樣本容量n無限增大時,估計值在真值附近的概率趨近于1。定義3如果當時,依概率收斂于,即任給,則稱統(tǒng)計量為參數的一致估計。第四章分布與參數估計3、獲得點估計量的極大似然估計法根據從總體X中抽到的樣本,對總體分布中的未知參數θ進行估計。極大似然估計法是要選取這樣的值,當它作為θ的估計值時,使觀察結果出現的可能性最大。一般情況下,可以利用極大似然估計法估計離散型總體的概率函數中的參數θ,和連續(xù)型總體的概率密度函數中的參數θ。定義4設X為離散型隨機變量,有概率函數,為待估參數,則似然函數對每一取定的常數樣本值,L是參數θ的函數,則稱L為樣本的似然函數(如果θ是一個向量,則L是多元函數)。第四章分布與參數估計定義5設X的概率密度是,其中θ是未知參數,可以是一個值,也可以是一個向量,由于樣本的獨立性,則樣本的聯合概率密度函數是定義6如果在處達到最大值,則是θ的極大似然估計值。為了計算方便,只求的最大值。即計算,解出θ的估計值。如果待估計的參數θ是一個向量,即,則解如下的方程組,求出。

第四章分布與參數估計例3某電子管的使用壽命(從開始使用到初次失效為止)服從指數分布,概率密度函數如下

為X的一組樣本觀察值,今抽取一組樣本,其具體數據如下:16,29,50,68,100,130,140,270,280,340,410,450,520,620,190,210,800,1100。問如何求θ的極大似然估計值?解:似然函數求得

解得

就是θ的極大似然估計。因此參數θ的估計值為(小時)第四章分布與參數估計§3參數估計:區(qū)間估計4.3.1SPSS的區(qū)間估計示例點擊【分析】→【描述統(tǒng)計】→【頻率】,有時候樣本無法給出足夠正確的結果。前面講到如何用點估計量估計總體均值、方差或一定比例的精確值。問題在于,你怎么能肯定自己的估計完全正確?畢竟,你僅僅依靠一個樣本對總體做出假設,如果這個樣本出問題怎么辦?本節(jié)將介紹另一種估計總體統(tǒng)計量的方法:一種考慮了不確定性的方法。例4仍以例1的樣本值為例,根據隨機選取出來的32場報告會的聽眾人數數據,估計覆蓋全校多年來500場報告會的平均聽眾人數的95%的置信區(qū)間。數據文件見“CH4例1報告會”。1、頻次分析模塊的SPSS操作示例:(1)在調入數據后,按照前面的介紹,點擊:【分析】→【描述統(tǒng)計】→【探索】,進入探索分析模塊。(2)用箭頭把“聽眾人數”變量,送入“因變量列表”窗口(可同時分析多個變量)。圖4.6中,左下角的輸出小框的默認值是同時輸出統(tǒng)計量和圖形。可以接受它,也可以改變它。本例選擇輸出“統(tǒng)計量”。第四章分布與參數估計§3參數估計:區(qū)間估計4.3.1SPSS的區(qū)間估計示例

(3)點擊右上角的【統(tǒng)計量】按鈕,系統(tǒng)彈出一個窗口(探索:統(tǒng)計),見圖4.7。該窗口的系統(tǒng)默認值,正是輸出均值的95%的置信區(qū)間,我們可以接受它,也可以改變它為99%的置信區(qū)間,或其他百分點的置信區(qū)間。(4)點擊【繼續(xù)】,返回主窗口。點出【確定】,輸出結果,見表4.3。從該表可以讀出,均值的估計值為173.4063(厘米),覆蓋總體均値的95%隨機區(qū)間的一個觀察區(qū)間是(170.5809,176.2316)。從該表格還可以讀出,總體方差和總體標準差的估計值,這對應上一節(jié)講的極大似然估計法。表4.3聽眾人數均值的95%的置信區(qū)間

統(tǒng)計標準錯誤聽眾人數平均值173.40631.38531平均值的95%置信區(qū)間下限值170.5809

上限176.2316

5%截尾平均值173.4236

中位數174.0000

方差61.410

標準偏差7.83647

偏度-.081.414峰度-.201.809第四章分布與參數估計§3參數估計:區(qū)間估計4.3.2區(qū)間估計的理論分析用點估計來估計總體參數,即使是無偏、有效的估計量,也會由于樣本的隨機性,從一個樣本算得估計量的值偏離所要估計的參數真值。而且,即使真正相等,由于參數值本身是未知的,也無從肯定這種相等。到底二者相差多少呢?這個問題換一種提法就是,根據估計量的分布,在一定的可靠程度下,指出被估計的總體參數所在的可能數值范圍。這就是參數的區(qū)間估計問題。區(qū)間估計的具體做法是,找兩個統(tǒng)計量使其中,一般取0.05或0.01,則稱隨機區(qū)間為的的置信區(qū)間。百分數稱為置信度或置信水平。第四章分布與參數估計§3參數估計:區(qū)間估計(一)正態(tài)總體均值的區(qū)間估計1、方差已知,對總體均值進行區(qū)間估計例5假設某節(jié)能燈燈泡的壽命服從正態(tài)分布,從中抽取了10個進行壽命試驗,得數據如下(單位:小時):1050、1100、1080、1120、1200、1250、1040、1130、1300、1200,試找出平均壽命區(qū)間(=0.05)。解:設樣本來自正態(tài)總體,則

選取含有已知變量最多的統(tǒng)計量來對未知參數進行區(qū)間估計,由于正態(tài)總體的方差已知,則根據式(4.5)第四章分布與參數估計查表可求得,使得

觀察上式,我們可以通過左側括號中的運算,求得的一個置信區(qū)間。那么這里變量是未知的,怎樣查表求得?的下角標有什么含義?在上式左側中,為了求得的區(qū)間范圍,交換一下絕對值運算中分子上兩項的位置

展開絕對值,整理得解得在這個公式里,只有是未知的,怎么辦呢?由公式查表獲得。在本題中=0.05,可查表求得(若=0.01,可查表求得)。又由n=10,,可算出,則進一步計算可得即的置信區(qū)間為(1145.25,1148.75)。第四章分布與參數估計§3參數估計:區(qū)間估計2、用SPSS從x查和從p查x下面我們來看一下怎樣從已知概率用SPSS查表求臨界值,以及怎樣由求概率值。任意打開一個數據文件,在數據窗口中,點擊:【轉換】→【計算變量】,系統(tǒng)彈出“計算變量”窗口,參見圖4.9。在這個窗口的右邊中部,有一個“函數組”框,在這個框中的有很多函數組,從中選出你所需要的函數組,完成相應的計算。例如,可以從隨機變量X的取值邊界x,計算出的概率值。也可以反過來,從概率值p,計算出x的值。這樣,就免去了查表的麻煩。第四章分布與參數估計例如,要計算服從N(0,1)分布的x=1.96的概率值,就在圖4.9的窗口中的“函數組”框中,選中函數組【CDF&與非中心CDF】(累積密度函數)。此時,該窗口右下方的“函數與特殊變量”框中出現大量的可供選擇的“累積概率密度函數”,見圖4.9。在這個“函數與特殊變量”框中選擇【Cdf.Noml】函數,這時,這個框左側的框中出現對這個函數的解釋。用向上的箭頭把這個函數送到上面的“數字表達式”框中。此時,“數字表達式”框中,出現函數CDF.NORMAL(?,?,?),這兩步操作的結果,見圖4.10。按照中下框里的文字解釋,在“數字表達式”框中把函數CDF.NORMAL(?,?,?)的第一個問號改為1.96(即的值),第二個問號改為0(即標準正態(tài)分布的均值),第三個問號改為1(標準正態(tài)分布的標準差),即改為CDF.NORMAL(1.96,0,1)。第四章分布與參數估計左上角的“目標變量”框中,送入你希望的變量名,例如a、b、aa等,點擊【確定】。數據窗口中就出現變量的值是0.975。也就是。從概率值反求x的點擊方法類似上述過程。例如,假設X服從分布,已知概率值,要計算x的值,就可以按類似于上述的過程點擊。在剛才的窗口中,點擊【重置】,清空剛才的操作。然后,在圖4.9的窗口的“函數組”框中,選中函數組【逆DF】,點擊。此時,該窗口右下方的“函數和特殊變量”框中出現大量的可供選擇的“反概率密度函數”。選中正態(tài)分布的反函數【Idf.Normal】,并用向上的帶頭把這個函數送到上面的“數字表達式”框中。并把該框中的函數IDF.NORMAL(?,?,?),改為IDF.NORMAL(0.975,0,1)。然后,在左上角的“目標變量”框中,送入你希望的變量名,例如b、ab等。點擊【確定】。數據窗口中就出現變量b的值是1.96。同樣,也可以計算其它分布函數(如t分布)的概率值和反函數的概率值。這樣可以省去查表的工作了。第四章分布與參數估計2、方差未知,對總體均值進行區(qū)間估計例6假定初生嬰兒(男孩)的體重服從正態(tài)分布,隨機抽取12名嬰兒,測體重為3100、2520、3000、3000、3600、3160、3560、3320、2880、2600、3400、2540。試以95%的置信水平估計新生男嬰兒的平均體重區(qū)間(單位:克)。解:設樣本來自正態(tài)總體,由于未知,且

查表可求得,使得

即解得所以,在這道題中,設新生男嬰兒體重為X,由于X服從正態(tài)分布,方差未知,因此借助t分布。對a=0.05,因樣本數n=12,則用上面講過的SPSS求值法,或者查自由度為11的t分布表,得。再計算因此,新生男嬰兒的平均體重的95%的置信區(qū)間為

第四章分布與參數估計例7結合上一節(jié)講的SPSS操作的例4,再從公式計算的角度分析一下。根據隨機選取出來的32場報告會的聽眾人數數據,估計覆蓋全校500場報告會的平均聽眾人數的95%的置信區(qū)間。數據文件見“CH4例1報告會”。解:設32場報告會聽眾人數的數據,即樣本來自正態(tài)總體,由于未知,則利用

可求出置信區(qū)間。其中樣本觀察值可由表4.3讀出,,,利用SPSS求出,【轉換】→【計算變量】→【逆DF】→【IDF.T(0.975,31)】,得出,代入區(qū)間的計算公式,四舍五入,保留兩位小數,可得

這樣,我們從理論計算和SPSS軟件操作兩方面都能求出置信區(qū)間了。3.一般總體大樣本下總體均值的區(qū)間估計根據中心極限定理,對于不是正態(tài)分布的一般總體,當樣本容量相當大時,漸近地服從正態(tài)分布,故大樣本情況下,對于一般總體仍可用正態(tài)總體的辦法對總體均值進行較精確的區(qū)間估計。在n=30時,就可把總體看作近似服從正態(tài)分布,當然n越大越好。第四章分布與參數估計(二)未知總體均值,正態(tài)總體方差的區(qū)間估計例8假定初生男嬰兒的體重服從正態(tài)分布,隨機抽取12名嬰兒,測得體重為3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540,對嬰兒體重的方差進行區(qū)間估計(a=0.05)。解:設樣本來自正態(tài)總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論