數(shù)理統(tǒng)計(jì)講義.doc

上傳人：1*** IP屬地：浙江上傳時(shí)間：2020-03-10 格式：DOC 頁(yè)數(shù)：52 大?。?.10MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩47頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

學(xué)習(xí)資料收集于網(wǎng)絡(luò)，僅供參考數(shù)理統(tǒng)計(jì)教案學(xué)習(xí)資料第一章統(tǒng)計(jì)量及其抽樣分布第一節(jié)總體與樣本教學(xué)目的：要求學(xué)生理解數(shù)理統(tǒng)計(jì)的兩個(gè)基本概念:總體和樣本，以及與這兩個(gè)基本概念相關(guān)的統(tǒng)計(jì)基本思想和樣本分布。教學(xué)重點(diǎn): 掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想.教學(xué)難點(diǎn)：掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想.一、總體與個(gè)體在一個(gè)統(tǒng)計(jì)問(wèn)題中，我們把研究對(duì)象的全體稱為總體，構(gòu)成總體的每個(gè)成員稱為個(gè)體。對(duì)多數(shù)實(shí)際問(wèn)題。總體中的個(gè)體是一些實(shí)在的人或物。比如，我們要研究某大學(xué)的學(xué)生身高情況，則該大學(xué)的全體學(xué)生構(gòu)成問(wèn)題的總體，而每一個(gè)學(xué)生即是一個(gè)個(gè)體。事實(shí)上，每個(gè)學(xué)生有許多特征：性別、年齡、身高、體重、民族、籍貫等。而在該問(wèn)題中，我們關(guān)心的只是該校學(xué)生的身高如何，對(duì)其他的特征暫不予以考慮。這樣，每個(gè)學(xué)生（個(gè)體）所具有的數(shù)量指標(biāo)值身高就是個(gè)體，而將所有身高全體看成總體。這樣一來(lái)，若拋開(kāi)實(shí)際背景，總體就是一堆數(shù)，這堆數(shù)中有大有小，有的出現(xiàn)的機(jī)會(huì)多，有的出現(xiàn)的機(jī)會(huì)少，因此用一個(gè)概率分布去描述和歸納總體是恰當(dāng)?shù)?。從這個(gè)意義上看，總體就是一個(gè)分布，而其數(shù)量指標(biāo)就是服從這個(gè)分布的隨機(jī)變量。以后說(shuō)“從總體中抽樣”與“從某分布中抽樣”是同一個(gè)意思。例1.考察某廠的產(chǎn)品質(zhì)量，將其產(chǎn)品只分為合格品與不合格品，并以0記合格品，以1記不合格品，則總體該廠生產(chǎn)的全部合格品與不合格品由0或1組成的一堆數(shù)。若以p表示這堆數(shù)中1的比例（不合格品率），則該總體可由一個(gè)二點(diǎn)分布表示：不同的p反映了總體間的差異。例如，兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為：我們可以看到，第一個(gè)工廠的產(chǎn)品質(zhì)量?jī)?yōu)于第二個(gè)工廠。實(shí)際中，分布中的不合格品率是未知的，如何對(duì)之進(jìn)行估計(jì)是統(tǒng)計(jì)學(xué)要研究的問(wèn)題。二、樣本為了了解總體的分布，我們從總體中隨機(jī)地抽取n個(gè)個(gè)體，記其指標(biāo)值為x1，x2，xn，則x1，x2，xn稱為總體的一個(gè)樣本，n稱為樣本容量，或簡(jiǎn)稱樣本量，樣本中的個(gè)體稱為樣品。我們首先指出，樣本具有所謂的二重性：一方面，由于樣本是從總體中隨機(jī)抽取的，抽取前無(wú)法預(yù)知它們的數(shù)值，因此，樣本是隨機(jī)變量，用大寫字母X1，X2，Xn表示；另一方面，樣本在抽取以后經(jīng)觀測(cè)就有確定的觀測(cè)值，因此，樣本又是一組數(shù)值。此時(shí)用小寫字母x1，x2，xn表示是恰當(dāng)?shù)摹：?jiǎn)單起見(jiàn)，無(wú)論是樣本還是其觀測(cè)值，本書中樣本一般均用x1，x2，xn表示，讀者應(yīng)能從上下文中加以區(qū)別。例2.啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g，由于隨機(jī)性，事實(shí)上不可能使得所有的啤酒凈含量均為640g ,現(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測(cè)定其凈含量，得到如下結(jié)果： 641635640637642638645643639640這是一個(gè)容量為10的樣本的觀測(cè)值。對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。從總體中抽取樣本時(shí)，為使樣本具有代表性，抽樣必須是隨機(jī)抽樣。通常可以用隨機(jī)數(shù)表來(lái)實(shí)現(xiàn)隨機(jī)抽樣。還要求抽樣必須是獨(dú)立的，即每次的結(jié)果互不影響。在概率論中，在有限總體（只有有限個(gè)個(gè)體的總體）中進(jìn)行有放回抽樣，是獨(dú)立的隨機(jī)抽樣；然而，若為不放回抽樣，則是不獨(dú)立的抽樣。但當(dāng)總體容量N很大但樣本容量n較小時(shí)，不放回抽樣可以近似地看做放回抽樣，即可近似看做獨(dú)立隨機(jī)抽樣。下面，我們假定抽樣方式總滿足獨(dú)立隨機(jī)抽樣的條件。從總體中抽取樣本可以有不同的抽法，為了能由樣本對(duì)總體做出較可靠的推斷，就希望樣本能很好地代表總體。這就需要對(duì)抽樣方法提出一些要求，最常用的 “簡(jiǎn)單隨機(jī)抽樣”有如下兩個(gè)要求：（1）樣本具有隨機(jī)性，即要求總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本，這便意味著每一樣品xi與總體X有相同的分布。（2）樣本要有獨(dú)立性，即要求樣本中每一樣品的取值不影響其他樣品的取值，這意味著x1，x2，xn相互獨(dú)立。用簡(jiǎn)單隨機(jī)抽樣方法得到的樣本稱為簡(jiǎn)單隨機(jī)樣本，也簡(jiǎn)稱樣本。除非特別指明，本書中的樣本皆為簡(jiǎn)單隨機(jī)樣本。于是，樣本x1，x2，xn可以看成是相互獨(dú)立的具有同一分布的隨機(jī)變量，其共同分布即為總體分布。設(shè)總體X具有分布函數(shù)F（x）, x1，x2，xn為取自該總體的容量為n的樣本，則樣本聯(lián)合分布函數(shù)為：若總體具有密度函數(shù)f（x），則樣本的聯(lián)合密度函數(shù)為若總體X為離散型隨機(jī)變量，則樣本的（聯(lián)合）概率函數(shù)為顯然，通常說(shuō)的樣本分布是指多維隨機(jī)變量（x1，x2，xn）的聯(lián)合分布。例3.為估計(jì)一物件的重量，用一架天平重復(fù)測(cè)量n次，得樣本x1，x2，xn，由于是獨(dú)立重復(fù)測(cè)量，x1，x2，xn是簡(jiǎn)單隨機(jī)樣本。總體的分布即x1的分布（x1，x2，xn分布相同）。由于稱量誤差是均值（期望）為零的正態(tài)變量，所以x1可認(rèn)為服從正態(tài)分布N（，2）（X1等于物件重量）加上稱量誤差，即x1的概率密度為這樣，樣本分布密度為。例4.設(shè)某種電燈泡的壽命X服從指數(shù)分布E（），其概率密度為：則來(lái)自這一總體的簡(jiǎn)單隨機(jī)樣本x1，x2，xn的樣本分布密度為例5.考慮電話交換臺(tái)一小時(shí)內(nèi)的呼喚次數(shù)X。求來(lái)自這一總體的簡(jiǎn)單隨機(jī)樣本x1，x2，xn的樣本分布。解由概率論知識(shí)，X服從泊松分布P（），其概率函數(shù)，（其中x是非負(fù)整數(shù)0，1，2，k，中的一個(gè)）。從而，簡(jiǎn)單隨機(jī)樣本x1，x2，xn的樣本分布為：第二節(jié) 統(tǒng)計(jì)量及其分布教學(xué)目的：要求學(xué)生理解數(shù)理統(tǒng)計(jì)的基本概念：統(tǒng)計(jì)量，熟練掌握樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的計(jì)算公式，掌握次序統(tǒng)計(jì)量及其抽樣分布。能用R軟件來(lái)計(jì)算這些常用統(tǒng)計(jì)量，能用R軟件來(lái)產(chǎn)生分布的隨機(jī)數(shù)以進(jìn)行隨機(jī)模擬。教學(xué)重點(diǎn)：樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的求法；次序統(tǒng)計(jì)量的抽樣分布。教學(xué)難點(diǎn)：次序統(tǒng)計(jì)量的抽樣分布。一、統(tǒng)計(jì)量與抽樣分布樣本來(lái)自總體，樣本的觀測(cè)值中含有總體各方面的信息，但這些信息較為分散，有時(shí)顯得雜亂無(wú)章。為將這些分散在樣本中有關(guān)總體的信息集中起來(lái)以反映總體的各種特征，需要對(duì)樣本進(jìn)行加工。最常用的加工方法是構(gòu)造樣本的函數(shù)，不同的函數(shù)反映總體的不同特征。定義1.設(shè)x1，x2，xn為取自某總體的樣本，若樣本函數(shù)TT（x1，x2，xn）中不含有任何未知參數(shù)，則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。按照這一定義，若x1，x2，xn為樣本，則，都是統(tǒng)計(jì)量，而當(dāng)，2未知時(shí)，等均不是統(tǒng)計(jì)量。二、樣本均值及其抽樣分布定義2.設(shè)x1，x2，xn為取自某總體的樣本，其算術(shù)平均值稱為樣本均值，一般用表示，即。例6.某單位收集到20名青年人某月的娛樂(lè)支出費(fèi)用數(shù)據(jù)：7984 8488 92 93 94 97 98 99100 101101102102 108110113118125 則該月這20名青年的平均娛樂(lè)支出為對(duì)于樣本均值的抽樣分布，我們有下面的定理。定理1.設(shè)x1，x2，xn是來(lái)自某個(gè)總體X的樣本，為樣本均值。（1）若總體分布為N（，2），則的精確分布為；（2）若總體X分布未知（或不是正態(tài)分布），且E（X）=，D（X）=2，則當(dāng)樣本容量n較大時(shí)，的漸近分布為，這里的漸近分布是指n較大時(shí)的近似分布。證明（1）由于為獨(dú)立正態(tài)變量線性組合，故仍服從正態(tài)分布。另外，故（2）易知為獨(dú)立、同分布的隨機(jī)變量之和，且。由中心極限定理，，其中（x）為標(biāo)準(zhǔn)正態(tài)分布。這表明n較大時(shí)的漸近分布為。三、樣本方差與樣本標(biāo)準(zhǔn)差定義3.設(shè)x1，x2，xn為取自某總體的樣本，則它關(guān)于樣本均值的平均偏差平方和稱為樣本方差，其算術(shù)根稱為樣本標(biāo)準(zhǔn)差。相對(duì)樣本方差而言，樣本標(biāo)準(zhǔn)差通常更有實(shí)際意義，因?yàn)樗c樣本均值具有相同的度量單位。在上面定義中，n為樣本容量，稱為偏差平方和，它有3個(gè)不同的表達(dá)式：事實(shí)上，偏差平方和的這3個(gè)表達(dá)式都可用來(lái)計(jì)算樣本方差。例7.在例6中，我們已經(jīng)算得，其樣本方差與樣本標(biāo)準(zhǔn)差為，。方法二 s=11.57 31通常用第二種方法計(jì)算s2方便許多。下面的定理給出樣本均值的數(shù)學(xué)期望和方差以及樣本方差的數(shù)學(xué)期望，它不依賴于總體的分布形式。這些結(jié)果在后面的討論中是有用的。定理2.設(shè)總體X具有二階矩，即E（x）=,D（X）=2+x1，x2，xn為從該總體得到的樣本，和s2分別是樣本均值和樣本方差，則此定理表明，樣本均值的均值與總體均值相同，而樣本均值的方差是總體方差的。證明由于（1）（2）且有：，而，于是，兩邊各除以n-1，即得證。值得讀者注意的是：本定理的結(jié)論與總體服從什么分布無(wú)關(guān)。四、樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推廣是樣本矩，這是一類常見(jiàn)的統(tǒng)計(jì)量。定義4.設(shè)x1，x2，xn是樣本，則統(tǒng)計(jì)量稱為樣本k階原點(diǎn)矩，特別地，樣本一階原點(diǎn)矩就是樣本均值。統(tǒng)計(jì)量稱為樣本k階中心矩。常見(jiàn)的是k=2的場(chǎng)合，此時(shí)稱為二階樣本中心矩。本書中我們將其記為sn2，以區(qū)別樣本方差S2。五、極大順序統(tǒng)計(jì)量和極小順序統(tǒng)計(jì)量定義5.設(shè)總體X具有分布函數(shù)F（x），分布密度f(wàn)（x）, x1，x2，xn為其樣本，我們分別稱X（1）=minx1,x2,xn,x（n）=maxx1,x2,xn為極小順序統(tǒng)計(jì)量和極大順序統(tǒng)計(jì)量。定理3.若x(1),x(n)分別為極小、極大順序統(tǒng)計(jì)量，則（1）x(1)的分布函數(shù)F1(x)=1-(1-F（x)n,x（1）的分布密度f(wàn)1(x)=n-(1-F(x)n-1f(x) （2）x（n）的分布函數(shù)Fn(x)=F(x)n,x(n)的分布密度f(wàn)n(x)=nF(x)n-1f(x) 證明先求出x（1）及x（n）的分布函數(shù)F1（x）及Fn（x）：，分別對(duì)F1（x），F(xiàn)n（x）求導(dǎo)即得六、正態(tài)總體的抽樣分布有很多統(tǒng)計(jì)推斷是基于正態(tài)總體的假設(shè)的，以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量（其抽樣分布分別為x2分布，t分布和F分布）在實(shí)踐中有著廣泛的應(yīng)用。這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景，而且其抽樣分布的密度函數(shù)有“明確的表達(dá)式”，它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”。1. x2分布（卡方分布）定義6.設(shè)X1，X2，Xn獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布N（0，1），則x2=x12+xn2的分布稱為自由度為n的x2分布，記為x2x2（n）。x2（n）分布的密度函數(shù)見(jiàn)圖1-4當(dāng)隨機(jī)變量x2 x2（n）時(shí)，對(duì)給定的（0x2（n）= 的x2（n）是自由度為n的開(kāi)方分布的分位數(shù)。分位數(shù)x2（n）可以從附表4中查到。例如n=10，=0.05，那么從附表4中查得x2(10)=18.307p(x)2x20.05(10)=px218.307=0.05注：請(qǐng)讀者注意x2x2（n）時(shí)，n是自由度，不是容量。2.F分布定義7.設(shè)x1x2(m)，x2x2(n)X1與X2獨(dú)立，則稱的分布是自由度為m與n的F分布，記為FF（m，n），其中m稱為分子自由度，n稱為分母自由度。自由度為m與n的F分布的密度函數(shù)的圖像是一個(gè)只取非負(fù)值的偏態(tài)分布（見(jiàn)圖6-5）。當(dāng)隨機(jī)變量FF（m，n）時(shí)，對(duì)給定的（0F（m,n）=的數(shù)F（m,n）是自由度為m與n的F分布的分位數(shù)。當(dāng)FF（m，n）時(shí)，有下面性質(zhì)（不證），這說(shuō)明對(duì)小的，分位為F（m,n）可以從附表5中查到，而分位數(shù)F1-（m,n）則可通過(guò)上式得到。例8.若取m=10,則n=5,=0.05，那么從附表5上（m=n1,n=n2）查得F0.05（10,5）=4.74利用（6.3.8 ）式可得到3.t分布定義8.設(shè)隨機(jī)變量與X1與X2獨(dú)立且X1N（0，1），X2X2（n），則稱的分布為自由度為n的t的分布，記為tt（n）.t分布密度函數(shù)的圖像是一個(gè)關(guān)于縱軸對(duì)稱的分布（如下圖），與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形態(tài)類似，只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些，尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。t分布與N（0,1）的密度函數(shù)當(dāng)隨機(jī)變量tt（n）時(shí)，稱滿足Ptt（n）=的t（n）是自由度為n的t分布的分位數(shù)，分位數(shù)t（n）可以從附表3中查到，例如當(dāng)n=10, =0.05時(shí)，從附表3上查得t0.05（10）=1.8125由于t分布的密度函數(shù)關(guān)于0對(duì)稱，故其分位數(shù)有如下關(guān)系：t1-（n）=- t（n）例如，t0.95（10）=-t0.05（10）=-1.8125當(dāng)n很大時(shí)，（n30）,t分布可以用N（0，1）近似P（t-t）=1-,p（tt1-）=1-，t1-=-t4.一些重要結(jié)論來(lái)自一般正態(tài)總體的樣本均值和樣本方差S2的抽樣分布是應(yīng)用最廣的抽樣分布，下面我們加以介紹。定理4.設(shè)X1,X2,Xn是來(lái)自正態(tài)總體N（,2）的樣本，其樣本均值和樣本方差分別為：則有（1）與s2相互獨(dú)立；（2）特別，若（不證）推論：設(shè)，21=22=2并記則（不證）本章小結(jié)本章的基本要求：（一）知道總體、樣本、簡(jiǎn)單樣本和統(tǒng)計(jì)量的概念（二）知道統(tǒng)計(jì)量和s2的下列性質(zhì)：E（s2）=2（三）若x的分布函數(shù)為F（x），分布函數(shù)為f（x），則樣本（x1,x2,xn）的聯(lián)合分布函數(shù)為F（x1）F（x2）F（xn）樣本（x1,x2,xn）的聯(lián)合分布密度為f（x1） f（x2）f（xn），樣本（x1,x2,xn）的概率函數(shù)，p（x1,x 2 ,xn）=p（X=x1）p（X=x2）p（X=xn）因而順序統(tǒng)計(jì)量x（1），x （n）中X（1）的分布函數(shù)為1-（1-F（x）nX（n）的分布函數(shù)為F（x）n（四）掌握正態(tài)總體的抽樣分布若XN（，2）則有（1）（2）（3）（4）若=當(dāng)時(shí)，。（五）知道樣本原點(diǎn)矩與樣本中心矩的概念第二章參數(shù)估計(jì)從本章開(kāi)始我們介紹統(tǒng)計(jì)推斷，所謂統(tǒng)計(jì)推斷就是由樣本推斷總體，統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分，它們是統(tǒng)計(jì)推斷最基本而且是互相有聯(lián)系的兩部分，本章介紹統(tǒng)計(jì)推斷的第一部分參數(shù)估計(jì)。參數(shù)通常指總體分布中的特征值和和各種分布中的參數(shù)，例如二點(diǎn)分布B（1，P）中的p，泊松分布P（）中的，正態(tài)分布N（、）的、等，習(xí)慣用表示參數(shù)，通常參數(shù)是未知的。參數(shù)估計(jì)的形式有兩類，設(shè)x1,x2,xn是來(lái)自總體的樣本。我們用一個(gè)統(tǒng)計(jì)量的取值作為參數(shù)的估計(jì)值，則稱為的點(diǎn)估計(jì)（量），就是參數(shù)的點(diǎn)估計(jì)，如果對(duì)參數(shù)的估計(jì)需要對(duì)估計(jì)作出可靠性判斷，就需要對(duì)這一可靠性給出可靠性區(qū)間或置信區(qū)間，叫區(qū)間估計(jì)。下面首先介紹點(diǎn)估計(jì) 第一節(jié) 點(diǎn)估計(jì)教學(xué)目的：要求學(xué)生了解參數(shù)點(diǎn)估計(jì)的基本思想，理解參數(shù)點(diǎn)估計(jì)的基本概念，熟練運(yùn)用替換原理、矩法估計(jì)和最大似然估計(jì)對(duì)參數(shù)進(jìn)行估計(jì)。教學(xué)重點(diǎn)：矩法估計(jì)、最大似然估計(jì).教學(xué)難點(diǎn)：運(yùn)用矩法估計(jì)、最大似然估計(jì)對(duì)參數(shù)進(jìn)行估計(jì).直接用來(lái)估計(jì)未知參數(shù)的統(tǒng)計(jì)量稱為參數(shù)的點(diǎn)估計(jì)量，簡(jiǎn)稱為點(diǎn)估計(jì)，人們可以運(yùn)用各種方法構(gòu)造出很多的估計(jì)，本節(jié)介紹兩種最常用的點(diǎn)估計(jì)方法。它們是：矩法和極大似然法。一、替換原理和矩法估計(jì)用下面公式表示的方法叫矩法例1.對(duì)某型號(hào)的20輛汽車記錄每5L汽油的行駛里程（km），觀測(cè)數(shù)據(jù)如下：29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9這是一個(gè)容量為20的樣本觀測(cè)值，對(duì)應(yīng)總體是該型號(hào)汽車每5L汽油的行駛里程，其分布形式尚不清楚，可用矩法估計(jì)其均值，方差，本例中經(jīng)計(jì)算有28.695，0.9185由此給出總體均值，方差的估計(jì)分別為即矩法估計(jì)的統(tǒng)計(jì)思想（替換原理）十分簡(jiǎn)單明確，眾人都能接受，使用場(chǎng)合甚廣。例2.設(shè)總體為指數(shù)分布，其密度函數(shù)為x1,xn是樣本，由于，亦即，故的矩法估計(jì)為例3.設(shè)x1,xn是來(lái)自服從區(qū)間（0，）上的均勻分布的樣本，0為未知參數(shù)。求的矩估計(jì)。解：易知總體X的均值為由矩法的矩估計(jì)為比如，若樣本值為0.1，0.7，0.2，1，1.9，1.3，1.8，則的估計(jì)值2（0.1+0.7+0.2+1+1.9+1.3+1.8）2例4.在一批產(chǎn)品取樣n件，發(fā)現(xiàn)其中有m件次品，試用此樣本求該批產(chǎn)品的次品率p的矩估計(jì)。解：因?yàn)槔绯闃涌倲?shù)n=100，其中次品m=5.則例5.電話總機(jī)在一分鐘間隔內(nèi)接到呼喚次數(shù)XP（）。觀察一分種接到呼喚次數(shù)共觀察40次，結(jié)果如下接到呼喚次數(shù)012345觀察次數(shù)51012832求未知參數(shù)的矩估計(jì)解：（1）XP（）EX=由矩法（2）計(jì)算（05+110+212+38+43+52）22二、極大似然估計(jì)為了敘述極大似然原理的直觀想法，先看例6例6.設(shè)有外表完全相同的兩個(gè)箱子，甲箱中有99個(gè)白球和1個(gè)黑球，乙箱中有99個(gè)黑球和1個(gè)白球，現(xiàn)隨機(jī)地抽取一箱，并從中隨機(jī)抽取一球，結(jié)果取得白球，問(wèn)這球是從哪一個(gè)箱子中取出的？解：不管是哪一個(gè)箱子，從箱子中任取一球都有兩個(gè)可能的結(jié)果：A表示取出白球，B表示取出黑球，如果我們?nèi)〕龅氖羌紫?，則A發(fā)生的概率為0.99，而如果取出的是乙箱，則A發(fā)生的概率為0.01，現(xiàn)在一次試驗(yàn)中結(jié)果A發(fā)生了，人們的第一印象就是：“此白球（A）最像從甲箱取出的”，或者是說(shuō)，應(yīng)該認(rèn)為試驗(yàn)條件對(duì)事件A出現(xiàn)有利，從而可以推斷這球是從甲箱中取出的，這個(gè)推斷很符合人們的經(jīng)驗(yàn)事實(shí)，這里“最像”就是“極大似然”之意。本例中假設(shè)的數(shù)據(jù)很極端，一般地，我們可以這樣設(shè)想，在兩個(gè)箱子中各有100個(gè)球，甲箱中白球的比例是P1，乙箱中白球的比例是P2，已知P1 P2，現(xiàn)隨機(jī)地抽取一個(gè)箱子并從中抽取一球，假定取到的是白球，如果我們要在兩個(gè)箱子中進(jìn)行選擇，由于甲箱中白球的比例高于乙箱，根據(jù)極大似然原理，我們應(yīng)該推斷該球來(lái)自甲箱。下面分別給出離散型隨機(jī)變量和連續(xù)型隨機(jī)變量的極大似然估計(jì)求未知參數(shù) 的估計(jì) 的步驟（一）離散型隨機(jī)變量第一步，從總體X取出樣本x1,x2,xn第二步，構(gòu)造似然函數(shù) L（x1,x2,xn，）P（Xx1）P（Xx2）P（Xxn）第三步，計(jì)算ln L（x1,x2,xn，）并化簡(jiǎn)第四步，當(dāng)時(shí)ln L（x1,x2,xn，）取最大值則取常用方法是微積分求最值的方法。（二）連續(xù)型隨機(jī)變量若Xf（x,）第一步從總體X取出樣本x1,x2,xn第二步構(gòu)造似然函數(shù)L（x1,x2,xn，）f（x1，）f（x2，）f（xn，）第三步計(jì)算ln L（x1,x2,xn，）并化簡(jiǎn)第四步當(dāng)時(shí)ln L（x1,x2,xn，）取最大值則取常用方法是微積分求最值的方法例7.設(shè)總體XB（1，P）即設(shè)P（A），從總體X中抽樣x1,x2,xn，問(wèn)最大似然法求解：當(dāng)XB（1，P）時(shí)，應(yīng)有P（X1）P，P（X0）=1P第一步構(gòu)造似然函數(shù)L（x1,x2,xn，P）P（Xx1）P（Xx2）P（Xxn）第二步計(jì)算ln L（x1,x2,xn，P）并化簡(jiǎn)（x1+xn）lnp+（n-（x1+xn）ln（1-p）第三步求駐點(diǎn)為化簡(jiǎn)為（x1+xn）（1-p）=pn-（x1+xn）（x1+xn）=np駐點(diǎn)因?yàn)橹挥幸粋€(gè)駐點(diǎn)是最大點(diǎn)取例抽樣n次A發(fā)生m次，則在x1，x2xn中有m個(gè)1，其余為0，例8.（1）設(shè)總體X服從泊松分布p（），求的極大似然估計(jì)；（2）設(shè)總體X服從指數(shù)分布E（），求的極大似然估計(jì)解：（1）XP（）p（X=k）=從總體X中取樣本x1 ，x2xn。駐點(diǎn)解得的極大似然估計(jì)易知的矩估計(jì)亦為（2）XE（）第一步，從中取樣本值x1 ，x2xn，應(yīng)有x10，x20xn0似然函數(shù)L（x1 ，x2xn）f（x1）f（x2）f（xn）=第二步計(jì)算第三步求駐點(diǎn)是最大點(diǎn)取在例2中用矩法估計(jì)也是同樣結(jié)果。例9.設(shè)，即從中取樣x1 ，x2xn，試用最大似然法求解：因?yàn)闃颖緓1 ，x2xn已經(jīng)取出。所以應(yīng)有0x1,0x2,0xn所以的取值范圍為第一步構(gòu)造似然函數(shù)0，很明顯，似然函數(shù)是的單調(diào)減函數(shù)，因此當(dāng)最小時(shí)，似然函數(shù) 最大，由條件知的最小值為所以時(shí)最大。取這一結(jié)果與用矩法估計(jì)（例73）的結(jié)果不同。例10.若,從中抽樣x1，x2xn，試用最大似然估計(jì)法求：，解：X的似然函數(shù)將分別關(guān)于兩個(gè)分量求偏導(dǎo)并令其為0即得到似然方程組，（1），（2）解此方程組，由（1）可得駐點(diǎn)，的極大似然估計(jì)為，將之代入（2）給出的極大似然估計(jì)第二節(jié) 點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)教學(xué)目的：要求學(xué)生了解相合性、無(wú)偏性、有效性和均方誤差的基本思想，理解相合性、無(wú)偏性、有效性和均方誤差的基本概念，熟練掌握相合性、無(wú)偏性和有效性的判別方法。教學(xué)重點(diǎn)：相合估計(jì)、無(wú)偏估計(jì)和有效性。教學(xué)難點(diǎn)：如何確定相合估計(jì)、無(wú)偏估計(jì)和有效性。我們已經(jīng)看到，點(diǎn)估計(jì)有各種不同的求法，為了在不同的點(diǎn)估計(jì)間進(jìn)行比較選擇，就必須對(duì)各種點(diǎn)估計(jì)的好壞給出評(píng)價(jià)標(biāo)準(zhǔn)。數(shù)理統(tǒng)計(jì)中給出了眾多的估計(jì)量評(píng)價(jià)標(biāo)準(zhǔn)，對(duì)同一估計(jì)量使用不同的評(píng)價(jià)標(biāo)準(zhǔn)可能會(huì)得到完全不同的結(jié)論，因此，在評(píng)價(jià)某一個(gè)估計(jì)好壞時(shí)首先要說(shuō)明是在哪一個(gè)標(biāo)準(zhǔn)下，否則所論好壞毫無(wú)意義。但在諸多標(biāo)準(zhǔn)中，有一個(gè)基本標(biāo)準(zhǔn)是所有的估計(jì)都應(yīng)該滿足的，它是衡量一個(gè)估計(jì)是否可行的必要條件，這就是估計(jì)的相合性，我們就從相合性開(kāi)始介紹。一、相合性我們知道，點(diǎn)估計(jì)是一個(gè)統(tǒng)計(jì)量，因此它是一個(gè)隨機(jī)變量，在樣本量一定的條件下，我們不可能要求完全等同于參數(shù)的真實(shí)取值，但如果我們有足夠的觀測(cè)值，根據(jù)格里紋科定理，隨著樣本量的不斷增大，經(jīng)驗(yàn)分布函數(shù)逼近真實(shí)分布函數(shù)，因此完全可以要求估計(jì)量隨著樣本量的不斷增大而逼近參數(shù)真值，這就是相合性，嚴(yán)格定義如下，定義2.設(shè)為未知參數(shù)，是的一個(gè)估計(jì)量，n是樣本容量，若對(duì)任何一個(gè)，有則稱為參數(shù)的相合估計(jì)相合性被認(rèn)為是對(duì)估計(jì)的一個(gè)最基本要求，如果一個(gè)估計(jì)量，在樣本量不斷增大時(shí)，它都不能把被估參數(shù)估計(jì)到任意指定的精度，那么這個(gè)估計(jì)是很值得懷疑的，通常，不滿足相合性要求的估計(jì)一般不予考慮，證明估計(jì)的相合性一般可應(yīng)用大數(shù)定律或直接由定義來(lái)證。例11.用大數(shù)定律證明是的相合估計(jì)證：由切比雪夫大數(shù)定律即是的相合估計(jì)為了避免用定義判斷相合性的困難，下面介紹一個(gè)判斷相合性很有用的定理：定量：設(shè)是的估計(jì)量若（1）（2）則是的相合估計(jì)。例12.證明是的相合估計(jì)證：在前面我們已經(jīng)證明（1）（2）是的相合估計(jì)二、無(wú)偏性相合性是大樣本下估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)，對(duì)小樣本而言，需要一些其他的評(píng)價(jià)標(biāo)準(zhǔn)，無(wú)偏性便是一個(gè)常用的評(píng)價(jià)標(biāo)準(zhǔn)。設(shè)是的一個(gè)估計(jì)，的參數(shù)空間為，若對(duì)任意的，有則稱是的無(wú)偏估計(jì)，否則稱為有偏估計(jì)。例13.對(duì)任一總體而言，樣本均值是總體均值的無(wú)偏估計(jì)，當(dāng)總體k階矩存在時(shí)，樣本k階原點(diǎn)矩是總體k階原點(diǎn)矩的無(wú)偏估計(jì)，但對(duì)k階中心矩則不一樣，例如，二階樣本中心矩就不是總體方差的無(wú)偏估計(jì)，事實(shí)上，對(duì)此，有如下兩點(diǎn)說(shuō)明（1）當(dāng)樣本量趨于無(wú)究時(shí)，有，我們稱為的漸近無(wú)偏估計(jì)，這表明當(dāng)樣本量較大時(shí)，可近似看作的無(wú)偏估計(jì) （2）若對(duì)作如下修正：則是總體方差的無(wú)偏估計(jì)，這種簡(jiǎn)章的修正方法在一些場(chǎng)合常被采用，它比更常用，這是因?yàn)樵趎2時(shí)，因此用估計(jì)有偏小的傾向，特別在小樣本場(chǎng)合要使用估計(jì)。無(wú)偏性不具有不變性。即若是的無(wú)偏估計(jì)，一般而言，g（）不是g（）的無(wú) 偏估計(jì)，除非g（）是的線性函數(shù)，例如，是的無(wú)偏估計(jì)，但s不是的無(wú)偏估計(jì)例14.證明是的無(wú)偏估計(jì)。其中是X的樣本證：特別情形是的無(wú)偏估計(jì)例15.證明是的無(wú)偏估計(jì)證三、有效性參數(shù)的無(wú)偏估計(jì)可以有很多，那么如何在無(wú)偏估計(jì)中進(jìn)行選擇？直觀的想法是希望該估計(jì)圍繞參數(shù)真值的波動(dòng)越小越好，波動(dòng)的大小可以用方差來(lái)衡量，因此人們常用無(wú)偏估計(jì)的方差的大小作為度量無(wú)偏估計(jì)優(yōu)劣的標(biāo)準(zhǔn)，這就是有效性。定義4.設(shè)，是的兩個(gè)無(wú)偏估計(jì)，如果對(duì)任意的有則稱比有效例16.設(shè)x1,xn是取自某總體的樣本，記總體均值為，總體方差為，則都是的無(wú)偏估計(jì)，但顯然，只要n1，比有效，這表明，用全部數(shù)據(jù)的平均估計(jì)總體均值要比只使用部分?jǐn)?shù)據(jù)更有效。例17.比較與誰(shuí)有效解：（1）與都是的無(wú)偏估計(jì)（2）比有效例18.設(shè)，從總體中取樣證明是的無(wú)偏估計(jì)和相合估計(jì)解：（1）是的無(wú)偏估計(jì)是的相合估計(jì)第三節(jié) 參數(shù)的區(qū)間估計(jì)教學(xué)目的：要求學(xué)生了解置信區(qū)間的基本思想，理解置信區(qū)間的基本概念，掌握求置信區(qū)間的樞軸量法方法，熟練掌握正態(tài)總體參數(shù)置信區(qū)間的計(jì)算公式和大樣本置信區(qū)間。能用R軟件計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)重點(diǎn)：置信區(qū)間的思想、概念和樞軸量法方法，計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)難點(diǎn)：計(jì)算單個(gè)正態(tài)總體的置信區(qū)間以及兩個(gè)正態(tài)總體下的置信區(qū)間。用點(diǎn)估計(jì)去估計(jì)總體的參數(shù)，即使是無(wú)偏且有效的，也會(huì)由于樣本的隨機(jī)性，使得從一個(gè)樣本x1，x2，x3，xn算得的估計(jì)值不一定是被估計(jì)的參數(shù)的真實(shí)值，而且估計(jì)值的可靠性并不知道，這是一個(gè)重大的問(wèn)題，因此，必須解決根據(jù)估計(jì)量的分布，在一定可靠性的程度下指出被估計(jì)的總體參數(shù)的取值范圍，這正是本節(jié)要介紹的參數(shù)的區(qū)間估計(jì)問(wèn)題。一、置信區(qū)間概念為了引入置信區(qū)間的概念，請(qǐng)看下面的引例。引例設(shè)某種絕緣子抗扭強(qiáng)度X服從正態(tài)分布，其中未知，已知（=45公斤米），試對(duì)總體均值作區(qū)間估計(jì)。對(duì)于區(qū)間估計(jì)，要選擇一個(gè)合適的統(tǒng)計(jì)量，若在該總體取一個(gè)容量為n的樣本x1，x2，x3，xn，樣本均值為的點(diǎn)估計(jì)即，然而我們要給出的一個(gè)區(qū)間估計(jì)，以體現(xiàn)出估計(jì)的誤差，我們知道。在區(qū)間估計(jì)問(wèn)題中，要選取一個(gè)合適的估計(jì)函數(shù)。這時(shí)，可取，它是的標(biāo)準(zhǔn)化隨機(jī)變量，且具備下面兩個(gè)特點(diǎn)：（1）u中包含所要估計(jì)的未知參數(shù)（其中已知）；（2）u的分布為 N（0，1），它與未知參數(shù)無(wú)關(guān)。因?yàn)閡N（0，1），因而有，根據(jù)uN（0，1）的概率密度的對(duì)稱性（見(jiàn)下圖）可得。當(dāng)=0.05時(shí)，1-=0.095，=1.96，將不等式轉(zhuǎn)化為，亦即，因此有。當(dāng)=0.05時(shí)，。。說(shuō)明未知參數(shù)包含在區(qū)間中的概率是95%，這里，不僅給出了的區(qū)間估計(jì)，還給出了這一區(qū)間估計(jì)的置信度（或置信概率）。事實(shí)上，當(dāng)置信度為1-時(shí)，區(qū)間估計(jì)為在引例中，若=160，=40，n=16。則有說(shuō)明該絕緣子抗扭強(qiáng)度X的期望在（140.4，179.6）內(nèi)的可靠度為0.95。下面，引出置信區(qū)間的概念。定義5.設(shè)為總體的未知參數(shù)是由樣本定出的兩個(gè)統(tǒng)計(jì)量，若對(duì)于給定的概率1-（01），有，則隨機(jī)區(qū)間稱為參數(shù)的置信度為1-的置信區(qū)間，稱為置信下限，稱為置信上限。置信區(qū)間的意義可作如下解釋：包含在隨機(jī)區(qū)間中的概率為100（1-）%；或者說(shuō)，隨機(jī)區(qū)間以100（1-）%的概率包含。粗略地說(shuō)，當(dāng)=0.05時(shí)，在100次的抽樣中，大致有95次包含在中，而其余5次可能不在該區(qū)間中。常取的數(shù)值為0.05，0.01，此時(shí)置信度1-分別為0.95，0.99。置信區(qū)間的長(zhǎng)度可視為區(qū)間估計(jì)的精度，下面分析置信度與精度的關(guān)系。（1）當(dāng)置信度1-增大，又樣本容量n固定時(shí)，置信區(qū)間長(zhǎng)度增大，即區(qū)間估計(jì)精度減低；當(dāng)置信度1-減小，又樣本容量n固定，置信區(qū)間長(zhǎng)度減小，即區(qū)間估計(jì)精度提高。（2）設(shè)置信度1-固定。當(dāng)樣本容量n增大時(shí)，置信區(qū)間減?。ㄈ缫?，置信區(qū)間長(zhǎng)度為），區(qū)間估計(jì)精度提高。二、單個(gè)正態(tài)總體參數(shù)的置信區(qū)間正態(tài)總體是最常見(jiàn)的分布，本小節(jié)中我們討論它的兩個(gè)參數(shù)的置信區(qū)間。1.已知時(shí)的置信區(qū)間設(shè)總體X服從正態(tài)分布，其中已知，而未知，求的置信度1-的置信區(qū)間。這一問(wèn)題實(shí)際上已在引例中的討論中解決，得到。所以的置信度1-的置信區(qū)間為。當(dāng)=0.05，=1.96；當(dāng)=0.01，=2.576。例1.某車間生產(chǎn)滾珠，從長(zhǎng)期實(shí)踐知道，滾珠直徑X服從正態(tài)分布。從某天產(chǎn)品里隨機(jī)抽取6個(gè)，測(cè)得直徑為（單位：毫米）：14.6，15.1，14.9，14.8，15.2，15.1。若總體方差=0.06，求總體均值的置信區(qū)間（=0.05，=0.01）。解，=0.05時(shí)，置信度為95%的置信區(qū)間為=0.01時(shí)，置信度為99%的置信區(qū)間為。從此例知，在樣本容量n固定時(shí)，當(dāng)置信度1-較大時(shí)，置信區(qū)間長(zhǎng)度較大；當(dāng)置信度1-較小時(shí)，置信區(qū)間較小。例2.用天平稱量某物體的質(zhì)量9次，得平均值為=15.4（g），已知天平稱量結(jié)果為正態(tài)分布，其標(biāo)準(zhǔn)差為0.1g，試求該物體質(zhì)量的0.95置信區(qū)間。解此處1-=0.95，=0.05，查表知u0.025=1.96, 于是該物體質(zhì)量的0.95的置信區(qū)間為，從而該物體質(zhì)量的0.95置信區(qū)間為15.3347，15.4653。例3.設(shè)總體為正態(tài)分布，為得到的置信水平為0.95的置信區(qū)間長(zhǎng)度不超過(guò)1.2，樣本容量應(yīng)為多大？解由題設(shè)條件知的0.95置信區(qū)間為，其區(qū)間長(zhǎng)度為，它僅依賴于樣本容量n而與樣本具體取值無(wú)關(guān)?，F(xiàn)要求，即有?，F(xiàn)1-=0.95，故=1.96，從而。即樣本容量至少為11時(shí)才能使得的置信水平為0.95的置信區(qū)間長(zhǎng)度不超過(guò)1.2。2.未知時(shí)的置信區(qū)間這時(shí)可用t統(tǒng)計(jì)量，因?yàn)?，完全類似于上一小?jié)由于t（n-1）分布的概率密度f(wàn)（x）的對(duì)稱性有（見(jiàn)下圖）解得其中是的無(wú)偏估計(jì)。例4.假設(shè)輪胎的壽命服從正態(tài)分布。為估計(jì)某種輪胎的平均壽命，現(xiàn)隨機(jī)地抽12只輪胎試用，測(cè)得它們的壽命（單位：萬(wàn)千米）如下：4.684.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70試求平均壽命的0.95置信區(qū)間。解此處正態(tài)總體標(biāo)準(zhǔn)差未知，可使用t分布求均值的置信區(qū)間。本例中經(jīng)計(jì)算有=4.7092，s2=0.0615。取=0.05，查表知t0.025（11）=2.2010，于是平均壽命的0.95置信區(qū)間為（單位：萬(wàn)千米）。3.的置信區(qū)間此時(shí)雖然也可以就是否已知分兩種情況討論的置信區(qū)間，但在實(shí)際問(wèn)題中未知時(shí)已知的情況是極為罕見(jiàn)的，所以我們只在未知的條件下討論的置信區(qū)間。設(shè)x1，x2，x3，xn為來(lái)自總體X的樣本，樣本方差s2可作為的點(diǎn)估計(jì)。由，中包含未知參數(shù)，又它的分布與無(wú)關(guān)，以作為估計(jì)函數(shù)，可用于的區(qū)間估計(jì)。由于分布是偏態(tài)分布，尋找平均長(zhǎng)度最短區(qū)間很難實(shí)現(xiàn)，一般都改為尋找等尾置信區(qū)間：把平分為兩部分，在分布兩側(cè)各截面積為的部分，即采用的的兩個(gè)分位數(shù)它們滿足。（見(jiàn)下圖）將上式開(kāi)方即可得標(biāo)準(zhǔn)差的置信區(qū)間。例5.某廠生產(chǎn)的零件質(zhì)量X服從正態(tài)分布?，F(xiàn)從該廠生產(chǎn)的零件中抽取9個(gè)，測(cè)得其質(zhì)量為（單位：g）45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6試求總體標(biāo)準(zhǔn)差的0.95置信區(qū)間。解由數(shù)據(jù)可算得s2=0.0325，（n-1）s2=80.0325=0.26，這里=0.95，查表知代入公式可得的0.95置信區(qū)間為。從而的0.95置信區(qū)間為0.1218，0.3454。以上關(guān)于正態(tài)總體參數(shù)的區(qū)間估計(jì)的討論列表如下表所示。本章小結(jié)本章考核要求：（一）點(diǎn)估計(jì)（1）知道點(diǎn)估計(jì)的概念（2）會(huì)用矩法求總體參數(shù)的矩估計(jì)值，主要依據(jù)是（3）會(huì)用最大似然估計(jì)法求總體參數(shù)的估計(jì)值?；痉椒ㄊ怯蓸颖緓1，x2，x3，xn構(gòu)造一個(gè)似然函數(shù)或似然函數(shù)的對(duì)數(shù)L（x1，x2，x3，xn，）=P（X=x1）P（X=x2）P（X=xn）L（x1，x2，x3，xn，）=f（x1）f（x2）f（xn）然后由ln L（x1，x2，x3，xn，）取最大的值時(shí)的值為的值，即。是L的最大值點(diǎn)。（二）點(diǎn)估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)（1）若，則是的無(wú)偏估計(jì)。（2）若都是的無(wú)偏估計(jì)，且就說(shuō)有效。（3）若。就說(shuō)是的相合估計(jì)以上三條標(biāo)準(zhǔn)中主要掌握無(wú)偏估計(jì)和有效估計(jì)（三）區(qū)間估計(jì)（1）知道區(qū)間估計(jì)的概念（2）會(huì)求一個(gè)正態(tài)總體的參數(shù)的置信區(qū)間。公式見(jiàn)表7-1第三章假設(shè)檢驗(yàn)本章主要介紹統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想和概念以及參數(shù)的假設(shè)檢驗(yàn)方法。第一節(jié) 假設(shè)檢驗(yàn)的基本思想和概念教學(xué)目的：要求學(xué)生了解假設(shè)檢驗(yàn)的基本思想，理解假設(shè)檢驗(yàn)的基本概念，認(rèn)識(shí)假設(shè)檢驗(yàn)問(wèn)題，熟悉假設(shè)檢驗(yàn)的基本步驟。教學(xué)重點(diǎn)：基本概念，假設(shè)檢驗(yàn)的基本步驟.教學(xué)難點(diǎn)：基本概念的理解.一、統(tǒng)計(jì)假設(shè)的概念為了引入統(tǒng)計(jì)假設(shè)的概念，先請(qǐng)看例8-1。例1.味精廠用一臺(tái)包裝機(jī)自動(dòng)包裝味精，已知袋裝味精的重量，機(jī)器正常時(shí)，其均值=0.5（0.5，0.015的單位都是公斤）。某日開(kāi)工后隨機(jī)抽取9袋袋裝味精，其凈重（公斤）為：0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512問(wèn)這臺(tái)包裝機(jī)是否正常？此例隨機(jī)抽樣取得的9袋味精的重量都不正好是0.5公斤，這種實(shí)際重量和標(biāo)準(zhǔn)重量不完全一致的現(xiàn)象，在實(shí)際中是經(jīng)常出現(xiàn)的。造成這種差異不外乎有兩種原因：一是偶然因素的影響，二由于偶然因素而發(fā)生的（例如電網(wǎng)電壓的波動(dòng)、金屬部件的不時(shí)伸縮、衡量?jī)x器的誤差而引起的）差異稱為隨機(jī)誤差；由于條件因素（生產(chǎn)設(shè)備的缺陷、機(jī)械部件的過(guò)度損耗）而產(chǎn)生的差異稱為條件誤差。若只存在隨機(jī)誤差，我們就沒(méi)有理由懷疑標(biāo)準(zhǔn)重量不是0.5公斤；如果我們有十足的理由斷定標(biāo)準(zhǔn)重量已不是0.5公斤，那么造成這種現(xiàn)象的主要原因是條件誤差，即包裝機(jī)工作不正常，那么，怎樣判斷包裝機(jī)工作是否正常呢？我們通過(guò)解例1 來(lái)找出解假設(shè)檢驗(yàn)問(wèn)題的思想方法。解已知袋裝味精重，假設(shè)現(xiàn)在包裝機(jī)工作正常，即提出如下假設(shè)：，這是兩個(gè)對(duì)立的假設(shè)，我們的任務(wù)就是要依據(jù)樣本對(duì)這樣的假設(shè)之一作出是否拒絕的判斷。由于樣本均值是的一個(gè)很好的估計(jì)，故當(dāng)為真時(shí)，應(yīng)很小。當(dāng)過(guò)分大時(shí)，我們就應(yīng)當(dāng)懷疑不正確而拒絕。怎樣給出的具體界限值呢？當(dāng)為真時(shí)，由于，對(duì)于給定的很小的數(shù)01，例如取=0.05，考慮，其中是標(biāo)準(zhǔn)正態(tài)分布上側(cè)分位數(shù)，而事件是一個(gè)小概率事件，小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。我們查附表1得,又n=9,=0.015，由樣本算得，又由上式得：小概率事件居然發(fā)生了，這與實(shí)際推斷原理相矛盾，于是拒絕，而認(rèn)為這臺(tái)包裝機(jī)工作不正常。從上面的例1中，我們看出為了對(duì)總體的某一參數(shù)進(jìn)行檢驗(yàn)，通常提出兩個(gè)假設(shè)：。然后引入一個(gè)與被檢參數(shù)有關(guān)的服從某種分布的統(tǒng)計(jì)量，根據(jù)事先給出的一概率標(biāo)準(zhǔn)（叫顯著水平）用反證法進(jìn)行判斷，由于小概率事件一般是不會(huì)發(fā)生的，如果引進(jìn)的樣本是一個(gè)小概率事件，因?yàn)樗拇_出現(xiàn)了，則可認(rèn)為假設(shè)不能接受，否則便接受。（二）假設(shè)檢驗(yàn)的程序根據(jù)以上的討論與分析，可將假設(shè)檢驗(yàn)的基本步驟概括如下：（1）根據(jù)實(shí)際問(wèn)題提出原假設(shè)及備擇假設(shè)。這里要求與有且僅有一個(gè)為真。（2）選取合適的統(tǒng)計(jì)量，即要求所選的統(tǒng)計(jì)量與假設(shè)無(wú)關(guān)且服從某種分布，常見(jiàn)的有標(biāo)準(zhǔn)正態(tài)分布t（n-1）分布，（n-1）分布及F（m,n）公布。（3）規(guī)定小概率標(biāo)準(zhǔn)的大小，也叫顯著水平，通?？扇?0.01，=0.05或=0.1。（4）在顯著水平下，根據(jù)統(tǒng)計(jì)量的分布將樣本空間劃分為兩部分，其一是接受的叫接受域，另一個(gè)是拒絕的叫拒絕域，記為W。（5）根據(jù)樣本值計(jì)算統(tǒng)計(jì)量的大小。（6）作出判斷：若統(tǒng)計(jì)量的觀測(cè)值落在拒絕域W內(nèi)。則知小概率事件發(fā)生了，拒絕，接受。若統(tǒng)計(jì)量的觀測(cè)值落在接受域則認(rèn)為小概率事件沒(méi)有發(fā)生，可以接受拒絕。第二節(jié) 總體均值的假設(shè)檢驗(yàn)教學(xué)目的：理解和掌握單個(gè)以及兩個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)的方法與思想，掌握正態(tài)總體方差檢驗(yàn)的方法，能用R軟件來(lái)完成這些檢驗(yàn)。教學(xué)重點(diǎn)：檢驗(yàn)方法的掌握，檢驗(yàn)方法思想的理解。教學(xué)難點(diǎn)：檢驗(yàn)方法的掌握。本節(jié)討論的總體均值的假設(shè)檢驗(yàn)，多數(shù)是在正態(tài)總體下進(jìn)行的。一、 u檢驗(yàn)1. 方差已知時(shí)，單個(gè)正態(tài)總體均值檢驗(yàn)設(shè)x1,xn是從正態(tài)總體中抽取的一個(gè)樣本,是已知常數(shù),欲檢驗(yàn)假設(shè)：，其中為已知數(shù)，它的程序：（1）提出假設(shè)（2）引入統(tǒng)計(jì)量（3）規(guī)定顯著水平，查標(biāo)準(zhǔn)正態(tài)分布表求的上側(cè)分位數(shù)為臨界值，寫出相應(yīng)的拒絕域其中常用的有=0.1時(shí)，=0.05時(shí)，=0.01時(shí)，（4）根據(jù)樣本值x1，x2，xn計(jì)算統(tǒng)計(jì)量u。（5）判斷：若u落入拒絕域W內(nèi)時(shí)，則拒絕接受，若u落入接受域內(nèi)時(shí)，則接受，拒絕。例2.某產(chǎn)品的重量XN（12，1）（單位：克），更新設(shè)備后，從新生產(chǎn)的產(chǎn)品中抽樣100件，測(cè)試樣本均值（克），如果產(chǎn)品的方差沒(méi)有改變，請(qǐng)問(wèn)更新設(shè)備后，產(chǎn)品的平均重量是否有明顯變化？（=0.01）解（1）設(shè)（2）引入（3）根據(jù)=0.01，查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表，得的上側(cè)分位數(shù)拒絕域?yàn)椋?，-2.58）,（2.58，+）（4）計(jì)算（5）u落入拒絕域W中，故拒絕，即有明顯差別。 2.方差已知時(shí)，兩個(gè)正態(tài)總體值差的檢驗(yàn)設(shè)，其中為已知常數(shù)。x1，xm和y1，yn分別是取自X和Y的樣本且相互獨(dú)立。欲檢驗(yàn)假設(shè)：檢驗(yàn)假設(shè)，等價(jià)于檢驗(yàn)假設(shè)。而是的一個(gè)好估計(jì)量，且當(dāng)為真時(shí)，有（8.2.1）于是對(duì)給定的水平，查附表1，可得臨界值，使，（8.2.2）從而得拒絕域，若uW，則拒絕；否則接受。由上述討論可知，由服從標(biāo)準(zhǔn)正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量作檢驗(yàn)的方法稱為u檢驗(yàn)法

人人文庫(kù)> 全部分類> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)理統(tǒng)計(jì)講義.doc

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)理統(tǒng)計(jì)講義.doc

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔