數(shù)理統(tǒng)計(jì)講義.doc_第1頁(yè)
數(shù)理統(tǒng)計(jì)講義.doc_第2頁(yè)
數(shù)理統(tǒng)計(jì)講義.doc_第3頁(yè)
數(shù)理統(tǒng)計(jì)講義.doc_第4頁(yè)
數(shù)理統(tǒng)計(jì)講義.doc_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考數(shù)理統(tǒng)計(jì)教 案學(xué)習(xí)資料第一章 統(tǒng)計(jì)量及其抽樣分布第一節(jié)總體與樣本教學(xué)目的:要求學(xué)生理解數(shù)理統(tǒng)計(jì)的兩個(gè)基本概念:總體和樣本,以及與這兩個(gè)基本概念相關(guān)的統(tǒng)計(jì)基本思想和樣本分布。教學(xué)重點(diǎn): 掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想.教學(xué)難點(diǎn):掌握數(shù)理統(tǒng)計(jì)的基本概念和基本思想.一、總體與個(gè)體在一個(gè)統(tǒng)計(jì)問(wèn)題中,我們把研究對(duì)象的全體稱為總體,構(gòu)成總體的每個(gè)成員稱為個(gè)體。對(duì)多數(shù)實(shí)際問(wèn)題。總體中的個(gè)體是一些實(shí)在的人或物。比如,我們要研究某大學(xué)的學(xué)生身高情況,則該大學(xué)的全體學(xué)生構(gòu)成問(wèn)題的總體,而每一個(gè)學(xué)生即是一個(gè)個(gè)體。事實(shí)上,每個(gè)學(xué)生有許多特征:性別、年齡、身高、體重、民族、籍貫等。而在該問(wèn)題中,我們關(guān)心的只是該校學(xué)生的身高如何,對(duì)其他的特征暫不予以考慮。這樣,每個(gè)學(xué)生(個(gè)體)所具有的數(shù)量指標(biāo)值身高就是個(gè)體,而將所有身高全體看成總體。這樣一來(lái),若拋開(kāi)實(shí)際背景,總體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)的機(jī)會(huì)多,有的出現(xiàn)的機(jī)會(huì)少,因此用一個(gè)概率分布去描述和歸納總體是恰當(dāng)?shù)?。從這個(gè)意義上看,總體就是一個(gè)分布,而其數(shù)量指標(biāo)就是服從這個(gè)分布的隨機(jī)變量。以后說(shuō)“從總體中抽樣”與“從某分布中抽樣”是同一個(gè)意思。例1.考察某廠的產(chǎn)品質(zhì)量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則總體該廠生產(chǎn)的全部合格品與不合格品由0或1組成的一堆數(shù)。若以p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示:不同的p反映了總體間的差異。例如,兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為:我們可以看到,第一個(gè)工廠的產(chǎn)品質(zhì)量?jī)?yōu)于第二個(gè)工廠。實(shí)際中,分布中的不合格品率是未知的,如何對(duì)之進(jìn)行估計(jì)是統(tǒng)計(jì)學(xué)要研究的問(wèn)題。二、樣本為了了解總體的分布,我們從總體中隨機(jī)地抽取n個(gè)個(gè)體,記其指標(biāo)值為x1,x2,xn,則x1,x2,xn稱為總體的一個(gè)樣本,n稱為樣本容量,或簡(jiǎn)稱樣本量,樣本中的個(gè)體稱為樣品。我們首先指出,樣本具有所謂的二重性:一方面,由于樣本是從總體中隨機(jī)抽取的,抽取前無(wú)法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī)變量,用大寫字母X1,X2,Xn表示;另一方面,樣本在抽取以后經(jīng)觀測(cè)就有確定的觀測(cè)值,因此,樣本又是一組數(shù)值。此時(shí)用小寫字母x1,x2,xn表示是恰當(dāng)?shù)摹:?jiǎn)單起見(jiàn),無(wú)論是樣本還是其觀測(cè)值,本書中樣本一般均用x1,x2,xn表示,讀者應(yīng)能從上下文中加以區(qū)別。例2.啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g,由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒凈含量均為640g ,現(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測(cè)定其凈含量,得到如下結(jié)果: 641635640637642638645643639640這是一個(gè)容量為10的樣本的觀測(cè)值。對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。從總體中抽取樣本時(shí),為使樣本具有代表性,抽樣必須是隨機(jī)抽樣。通常可以用隨機(jī)數(shù)表來(lái)實(shí)現(xiàn)隨機(jī)抽樣。還要求抽樣必須是獨(dú)立的,即每次的結(jié)果互不影響。在概率論中,在有限總體(只有有限個(gè)個(gè)體的總體)中進(jìn)行有放回抽樣,是獨(dú)立的隨機(jī)抽樣;然而,若為不放回抽樣,則是不獨(dú)立的抽樣。但 當(dāng)總體容量N很大但樣本容量n較小時(shí),不放回抽樣可以近似地看做放回抽樣,即可近似看做獨(dú)立隨機(jī)抽樣。下面,我們假定抽樣方式總滿足獨(dú)立隨機(jī)抽樣的條件。從總體中抽取樣本可以有不同的抽法,為了能由樣本對(duì)總體做出較可靠的推斷,就希望樣本能很好地代表總體。這就需要對(duì)抽樣方法提出一些要求,最常用的 “簡(jiǎn)單隨機(jī)抽樣”有如下兩個(gè)要求:(1)樣本具有隨機(jī)性,即要求總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本,這便意味著每一樣品xi與總體X有相同的分布。(2)樣本要有獨(dú)立性,即要求樣本中每一樣品的取值不影響其他樣品的取值,這意味著x1,x2,xn相互獨(dú)立。用簡(jiǎn)單隨機(jī)抽樣方法得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,也簡(jiǎn)稱樣本。除非特別指明,本書中的樣本皆為簡(jiǎn)單隨機(jī)樣本。于是,樣本x1,x2,xn可以看成是相互獨(dú)立的具有同一分布的隨機(jī)變量,其共同分布即為總體分布。 設(shè)總體X具有分布函數(shù)F(x), x1,x2,xn為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為:若總體具有密度函數(shù)f(x),則樣本的聯(lián)合密度函數(shù)為若總體X為離散型隨機(jī)變量,則樣本的(聯(lián)合)概率函數(shù)為顯然,通常說(shuō)的樣本分布是指多維隨機(jī)變量(x1,x2,xn)的聯(lián)合分布。例3.為估計(jì)一物件的重量,用一架天平重復(fù)測(cè)量n次,得樣本x1,x2,xn,由于是獨(dú)立重復(fù)測(cè)量,x1,x2,xn是簡(jiǎn)單隨機(jī)樣本。總體的分布即x1的分布(x1,x2,xn分布相同)。由于稱量誤差是均值(期望)為零的正態(tài)變量,所以x1可認(rèn)為服從正態(tài)分布N(,2)(X1等于物件重量)加上稱量誤差,即x1的概率密度為這樣,樣本分布密度為。 例4.設(shè)某種電燈泡的壽命X服從指數(shù)分布E(),其概率密度為:則來(lái)自這一總體的簡(jiǎn)單隨機(jī)樣本x1,x2,xn的樣本分布密度為例5.考慮電話交換臺(tái)一小時(shí)內(nèi)的呼喚次數(shù)X。求來(lái)自這一總體的簡(jiǎn)單隨機(jī)樣本x1,x2,xn的樣本分布。解由概率論知識(shí),X服從泊松分布P(),其概率函數(shù),(其中x是非負(fù)整數(shù)0,1,2,k,中的一個(gè))。從而,簡(jiǎn)單隨機(jī)樣本x1,x2,xn的樣本分布為:第二節(jié) 統(tǒng)計(jì)量及其分布教學(xué)目的:要求學(xué)生理解數(shù)理統(tǒng)計(jì)的基本概念:統(tǒng)計(jì)量,熟練掌握樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的計(jì)算公式,掌握次序統(tǒng)計(jì)量及其抽樣分布。能用R軟件來(lái)計(jì)算這些常用統(tǒng)計(jì)量,能用R軟件來(lái)產(chǎn)生分布的隨機(jī)數(shù)以進(jìn)行隨機(jī)模擬。教學(xué)重點(diǎn):樣本均值、樣本方差、樣本原點(diǎn)矩、樣本中心矩等常用統(tǒng)計(jì)量的求法;次序統(tǒng)計(jì)量的抽樣分布。教學(xué)難點(diǎn):次序統(tǒng)計(jì)量的抽樣分布。一、統(tǒng)計(jì)量與抽樣分布樣本來(lái)自總體,樣本的觀測(cè)值中含有總體各方面的信息,但這些信息較為分散,有時(shí)顯得雜亂無(wú)章。為將這些分散在樣本中有關(guān)總體的信息集中起來(lái)以反映總體的各種特征,需要對(duì)樣本進(jìn)行加工。最常用的加工方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。 定義1.設(shè)x1,x2,xn為取自某總體的樣本,若樣本函數(shù)TT(x1,x2,xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。按照這一定義,若x1,x2,xn為樣本,則,都是統(tǒng)計(jì)量,而當(dāng),2未知時(shí), 等均不是統(tǒng)計(jì)量。二、樣本均值及其抽樣分布 定義2.設(shè)x1,x2,xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用表示,即。例6.某單位收集到20名青年人某月的娛樂(lè)支出費(fèi)用數(shù)據(jù):7984 8488 92 93 94 97 98 99100 101101102102 108110113118125 則該月這20名青年的平均娛樂(lè)支出為對(duì)于樣本均值的抽樣分布,我們有下面的定理。 定理1.設(shè)x1,x2,xn是來(lái)自某個(gè)總體X的樣本, 為樣本均值。(1)若總體分布為N(,2),則的精確分布為;(2)若總體X分布未知(或不是正態(tài)分布),且E(X)=,D(X)=2,則當(dāng)樣本容量n較大時(shí),的漸近分布為,這里的漸近分布是指n較大時(shí)的近似分布。證明(1)由于為獨(dú)立正態(tài)變量線性組合,故仍服從正態(tài)分布。另外, 故 (2)易知為獨(dú)立、同分布的隨機(jī)變量之和,且 。由中心極限定理, ,其中(x)為標(biāo)準(zhǔn)正態(tài)分布。這表明n較大時(shí)的漸近分布為。三、樣本方差與樣本標(biāo)準(zhǔn)差 定義3.設(shè)x1,x2,xn為取自某總體的樣本,則它關(guān)于樣本均值的平均偏差平方和 稱為樣本方差,其算術(shù)根稱為樣本標(biāo)準(zhǔn)差。相對(duì)樣本方差而言,樣本標(biāo)準(zhǔn)差通常更有實(shí)際意義,因?yàn)樗c樣本均值具有相同的度量單位。在上面定義中,n為樣本容量,稱為偏差平方和,它有3個(gè)不同的表達(dá)式:事實(shí)上,偏差平方和的這3個(gè)表達(dá)式都可用來(lái)計(jì)算樣本方差。例7.在例6中,我們已經(jīng)算得,其樣本方差與樣本標(biāo)準(zhǔn)差為,。方法二 s=11.57 31通常用第二種方法計(jì)算s2方便許多。下面的定理給出樣本均值的數(shù)學(xué)期望和方差以及樣本方差的數(shù)學(xué)期望,它不依賴于總體的分布形式。這些結(jié)果在后面的討論中是有用的。 定理2.設(shè)總體X具有二階矩,即E(x)=,D(X)=2+x1,x2,xn為從該總體得到的樣本,和s2分別是樣本均值和樣本方差,則 此定理表明,樣本均值的均值與總體均值相同,而樣本均值的方差是總體方差的。證明由于(1)(2)且有: ,而 ,于是 ,兩邊各除以n-1,即得證。值得讀者注意的是:本定理的結(jié)論與總體服從什么分布無(wú)關(guān)。四、樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見(jiàn)的統(tǒng)計(jì)量。 定義4.設(shè)x1,x2,xn是樣本,則統(tǒng)計(jì)量稱為樣本k階原點(diǎn)矩,特別地,樣本一階原點(diǎn)矩就是樣本均值。統(tǒng)計(jì)量 稱為樣本k階中心矩。常見(jiàn)的是k=2的場(chǎng)合,此時(shí)稱為二階樣本中心矩。本書中我們將其記為sn2,以區(qū)別樣本方差S2。 五、極大順序統(tǒng)計(jì)量和極小順序統(tǒng)計(jì)量 定義5.設(shè)總體X具有分布函數(shù)F(x),分布密度f(wàn)(x), x1,x2,xn為其樣本,我們分別稱X(1)=minx1,x2,xn,x(n)=maxx1,x2,xn為極小順序統(tǒng)計(jì)量和極大順序統(tǒng)計(jì)量。定理3.若x(1),x(n)分別為極小、極大順序統(tǒng)計(jì)量,則(1)x(1)的分布函數(shù)F1(x)=1-(1-F(x)n,x(1)的分布密度f(wàn)1(x)=n-(1-F(x)n-1f(x) (2)x(n)的分布函數(shù)Fn(x)=F(x)n,x(n)的分布密度f(wàn)n(x)=nF(x)n-1f(x) 證明 先求出x(1)及x(n)的分布函數(shù)F1(x)及Fn(x):,分別對(duì)F1(x),F(xiàn)n(x)求導(dǎo)即得六、正態(tài)總體的抽樣分布有很多統(tǒng)計(jì)推斷是基于正態(tài)總體的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量(其抽樣分布分別為x2分布,t分布和F分布)在實(shí)踐中有著廣泛的應(yīng)用。這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有“明確的表達(dá)式”,它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”。1. x2分布(卡方分布) 定義6.設(shè)X1,X2,Xn獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布N(0,1),則x2=x12+xn2的分布稱為自由度為n的x2分布,記為x2x2(n)。x2(n)分布的密度函數(shù)見(jiàn)圖1-4當(dāng)隨機(jī)變量x2 x2(n)時(shí),對(duì)給定的(0x2(n)= 的x2(n)是自由度為n的開(kāi)方分布的分位數(shù)。分位數(shù)x2(n)可以從附表4中查到。例如n=10,=0.05,那么從附表4中查得x2(10)=18.307p(x)2x20.05(10)=px218.307=0.05注:請(qǐng)讀者注意x2x2(n)時(shí),n是自由度,不是容量。2.F分布定義7.設(shè)x1x2(m),x2x2(n)X1與X2獨(dú)立,則稱的分布是自由度為m與n的F分布,記為FF(m,n),其中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F分布的密度函數(shù)的圖像是一個(gè)只取非負(fù)值的偏態(tài)分布(見(jiàn)圖6-5)。當(dāng)隨機(jī)變量FF(m,n)時(shí),對(duì)給定的(0F(m,n)=的數(shù)F(m,n)是自由度為m與n的F分布的分位數(shù)。當(dāng)FF(m,n)時(shí),有下面性質(zhì)(不證),這說(shuō)明對(duì)小的,分位為F(m,n)可以從附表5中查到,而分位數(shù)F1-(m,n)則可通過(guò)上式得到。例8.若取m=10,則n=5,=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用(6.3.8 )式可得到3.t分布 定義8.設(shè)隨機(jī)變量與X1與X2獨(dú)立且X1N(0,1),X2X2(n),則稱的分布為自由度為n的t的分布,記為tt(n).t分布密度函數(shù)的圖像是一個(gè)關(guān)于縱軸對(duì)稱的分布(如下圖),與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形態(tài)類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些,尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。t分布與N(0,1)的密度函數(shù)當(dāng)隨機(jī)變量tt(n)時(shí),稱滿足Ptt(n)=的t(n)是自由度為n的t分布的分位數(shù),分位數(shù)t(n)可以從附表3中查到,例如當(dāng)n=10, =0.05時(shí),從附表3上查得t0.05(10)=1.8125由于t分布的密度函數(shù)關(guān)于0對(duì)稱,故其分位數(shù)有如下關(guān)系:t1-(n)=- t(n)例如,t0.95(10)=-t0.05(10)=-1.8125當(dāng)n很大時(shí),(n30),t分布可以用N(0,1)近似P(t-t)=1-,p(tt1-)=1-,t1-=-t4.一些重要結(jié)論來(lái)自一般正態(tài)總體的樣本均值 和樣本方差S2的抽樣分布是應(yīng)用最廣的抽樣分布,下面我們加以介紹。 定理4.設(shè)X1,X2,Xn是來(lái)自正態(tài)總體N(,2)的樣本,其樣本均值和樣本方差分別為:則有(1)與s2相互獨(dú)立;(2)特別,若(不證)推論:設(shè),21=22=2并記則(不證)本章小結(jié)本章的基本要求:(一)知道總體、樣本、簡(jiǎn)單樣本和統(tǒng)計(jì)量的概念(二)知道統(tǒng)計(jì)量和s2的下列性質(zhì):E(s2)=2(三)若x的分布函數(shù)為F(x),分布函數(shù)為f(x),則樣本(x1,x2,xn)的聯(lián)合分布函數(shù)為F(x1)F(x2)F(xn)樣本(x1,x2,xn)的聯(lián)合分布密度為f(x1) f(x2)f(xn),樣本(x1,x2,xn)的概率函數(shù),p(x1,x 2 ,xn)=p(X=x1)p(X=x2)p(X=xn)因而順序統(tǒng)計(jì)量x(1),x (n)中X(1)的分布函數(shù)為1-(1-F(x)nX(n)的分布函數(shù)為F(x)n(四)掌握正態(tài)總體的抽樣分布若XN(,2)則有(1)(2)(3)(4)若=當(dāng)時(shí),。(五)知道樣本原點(diǎn)矩與樣本中心矩的概念第二章 參數(shù)估計(jì)從本章開(kāi)始我們介紹統(tǒng)計(jì)推斷,所謂統(tǒng)計(jì)推斷就是由樣本推斷總體,統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分,它們是統(tǒng)計(jì)推斷最基本而且是互相有聯(lián)系的兩部分,本章介紹統(tǒng)計(jì)推斷的第一部分參數(shù)估計(jì)。參數(shù)通常指總體分布中的特征值和和各種分布中的參數(shù),例如二點(diǎn)分布B(1,P)中的p,泊松分布P()中的,正態(tài)分布N(、)的、等,習(xí)慣用表示參數(shù),通常參數(shù)是未知的。參數(shù)估計(jì)的形式有兩類,設(shè)x1,x2,xn是來(lái)自總體的樣本。我們用一個(gè)統(tǒng)計(jì)量的取值作為參數(shù)的估計(jì)值,則稱為的點(diǎn)估計(jì)(量),就是參數(shù)的點(diǎn)估計(jì),如果對(duì)參數(shù)的估計(jì)需要對(duì)估計(jì)作出可靠性判斷,就需要對(duì)這一可靠性給出可靠性區(qū)間或置信區(qū)間,叫區(qū)間估計(jì)。下面首先介紹點(diǎn)估計(jì) 第一節(jié) 點(diǎn)估計(jì)教學(xué)目的:要求學(xué)生了解參數(shù)點(diǎn)估計(jì)的基本思想,理解參數(shù)點(diǎn)估計(jì)的基本概念,熟練運(yùn)用替換原理、矩法估計(jì)和最大似然估計(jì)對(duì)參數(shù)進(jìn)行估計(jì)。教學(xué)重點(diǎn):矩法估計(jì)、最大似然估計(jì).教學(xué)難點(diǎn):運(yùn)用矩法估計(jì)、最大似然估計(jì)對(duì)參數(shù)進(jìn)行估計(jì).直接用來(lái)估計(jì)未知參數(shù)的統(tǒng)計(jì)量稱為參數(shù)的點(diǎn)估計(jì)量,簡(jiǎn)稱為點(diǎn)估計(jì),人們可以運(yùn)用各種方法構(gòu)造出很多的估計(jì),本節(jié)介紹兩種最常用的點(diǎn)估計(jì)方法。它們是:矩法和極大似然法。一、替換原理和矩法估計(jì)用下面公式表示的方法叫矩法例1.對(duì)某型號(hào)的20輛汽車記錄每5L汽油的行駛里程(km),觀測(cè)數(shù)據(jù)如下:29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9這是一個(gè)容量為20的樣本觀測(cè)值,對(duì)應(yīng)總體是該型號(hào)汽車每5L汽油的行駛里程,其分布形式尚不清楚,可用矩法估計(jì)其均值,方差,本例中經(jīng)計(jì)算有28.695,0.9185由此給出總體均值,方差的估計(jì)分別為即矩法估計(jì)的統(tǒng)計(jì)思想(替換原理)十分簡(jiǎn)單明確,眾人都能接受,使用場(chǎng)合甚廣。例2.設(shè)總體為指數(shù)分布,其密度函數(shù)為x1,xn是樣本,由于,亦即,故的矩法估計(jì)為例3.設(shè)x1,xn是來(lái)自服從區(qū)間(0,)上的均勻分布的樣本,0為未知參數(shù)。求的矩估計(jì)。解:易知總體X的均值為由矩法的矩估計(jì)為比如,若樣本值為0.1,0.7,0.2,1,1.9,1.3,1.8,則的估計(jì)值2(0.1+0.7+0.2+1+1.9+1.3+1.8)2例4.在一批產(chǎn)品取樣n件,發(fā)現(xiàn)其中有m件次品,試用此樣本求該批產(chǎn)品的次品率p的矩估計(jì)。解:因?yàn)槔绯闃涌倲?shù)n=100,其中次品m=5.則例5.電話總機(jī)在一分鐘間隔內(nèi)接到呼喚次數(shù)XP()。觀察一分種接到呼喚次數(shù)共觀察40次,結(jié)果如下接到呼喚次數(shù)012345觀察次數(shù)51012832求未知參數(shù)的矩估計(jì)解:(1)XP()EX=由矩法(2)計(jì)算(05+110+212+38+43+52)22二、極大似然估計(jì)為了敘述極大似然原理的直觀想法,先看例6例6.設(shè)有外表完全相同的兩個(gè)箱子,甲箱中有99個(gè)白球和1個(gè)黑球,乙箱中有99個(gè)黑球和1個(gè)白球,現(xiàn)隨機(jī)地抽取一箱,并從中隨機(jī)抽取一球,結(jié)果取得白球,問(wèn)這球是從哪一個(gè)箱子中取出的? 解:不管是哪一個(gè)箱子,從箱子中任取一球都有兩個(gè)可能的結(jié)果:A表示取出白球,B表示取出黑球,如果我們?nèi)〕龅氖羌紫?,則A發(fā)生的概率為0.99,而如果取出的是乙箱,則A發(fā)生的概率為0.01,現(xiàn)在一次試驗(yàn)中結(jié)果A發(fā)生了,人們的第一印象就是:“此白球(A)最像從甲箱取出的”,或者是說(shuō),應(yīng)該認(rèn)為試驗(yàn)條件對(duì)事件A出現(xiàn)有利,從而可以推斷這球是從甲箱中取出的,這個(gè)推斷很符合人們的經(jīng)驗(yàn)事實(shí),這里“最像”就是“極大似然”之意。本例中假設(shè)的數(shù)據(jù)很極端,一般地,我們可以這樣設(shè)想,在兩個(gè)箱子中各有100個(gè)球,甲箱中白球的比例是P1,乙箱中白球的比例是P2,已知P1 P2,現(xiàn)隨機(jī)地抽取一個(gè)箱子并從中抽取一球,假定取到的是白球,如果我們要在兩個(gè)箱子中進(jìn)行選擇,由于甲箱中白球的比例高于乙箱,根據(jù)極大似然原理,我們應(yīng)該推斷該球來(lái)自甲箱。下面分別給出離散型隨機(jī)變量和連續(xù)型隨機(jī)變量的極大似然估計(jì)求未知參數(shù) 的估計(jì) 的步驟(一) 離散型隨機(jī)變量第一步,從總體X取出樣本x1,x2,xn第二步,構(gòu)造似然函數(shù) L(x1,x2,xn,)P(Xx1)P(Xx2)P(Xxn)第三步,計(jì)算ln L(x1,x2,xn,)并化簡(jiǎn)第四步,當(dāng)時(shí)ln L(x1,x2,xn,)取最大值則取常用方法是微積分求最值的方法。(二)連續(xù)型隨機(jī)變量若Xf(x,)第一步從總體X取出樣本x1,x2,xn第二步構(gòu)造似然函數(shù)L(x1,x2,xn,)f(x1,)f(x2,)f(xn,)第三步計(jì)算ln L(x1,x2,xn,)并化簡(jiǎn)第四步當(dāng)時(shí)ln L(x1,x2,xn,)取最大值則取常用方法是微積分求最值的方法例7.設(shè)總體XB(1,P)即設(shè)P(A),從總體X中抽樣x1,x2,xn,問(wèn)最大似然法求解:當(dāng)XB(1,P)時(shí),應(yīng)有P(X1)P,P(X0)=1P第一步構(gòu)造似然函數(shù)L(x1,x2,xn,P)P(Xx1)P(Xx2)P(Xxn)第二步計(jì)算ln L(x1,x2,xn,P)并化簡(jiǎn)(x1+xn)lnp+(n-(x1+xn)ln(1-p)第三步求駐點(diǎn)為化簡(jiǎn)為(x1+xn)(1-p)=pn-(x1+xn)(x1+xn)=np駐點(diǎn)因?yàn)橹挥幸粋€(gè)駐點(diǎn)是最大點(diǎn)取例抽樣n次A發(fā)生m次,則在x1,x2xn中有m個(gè)1,其余為0,例8.(1)設(shè)總體X服從泊松分布p(),求的極大似然估計(jì);(2)設(shè)總體X服從指數(shù)分布E(),求的極大似然估計(jì)解:(1)XP()p(X=k)=從總體X中取樣本x1 ,x2xn。駐點(diǎn)解得的極大似然估計(jì)易知的矩估計(jì)亦為(2)XE()第一步,從中取樣本值x1 ,x2xn,應(yīng)有x10,x20xn0似然函數(shù)L(x1 ,x2xn)f(x1)f(x2)f(xn)=第二步計(jì)算第三步求駐點(diǎn)是最大點(diǎn)取在例2中用矩法估計(jì)也是同樣結(jié)果。例9.設(shè),即從中取樣x1 ,x2xn,試用最大似然法求解:因?yàn)闃颖緓1 ,x2xn已經(jīng)取出。所以應(yīng)有0x1,0x2,0xn所以的取值范圍為第一步構(gòu)造似然函數(shù)0,很明顯,似然函數(shù)是的單調(diào)減函數(shù),因此當(dāng)最小時(shí),似然函數(shù) 最大,由條件知的最小值為所以時(shí)最大。取這一結(jié)果與用矩法估計(jì)(例73)的結(jié)果不同。例10.若,從中抽樣x1,x2xn,試用最大似然估計(jì)法求:,解:X的似然函數(shù)將分別關(guān)于兩個(gè)分量求偏導(dǎo)并令其為0即得到似然方程組,(1),(2)解此方程組,由(1)可得駐點(diǎn),的極大似然估計(jì)為,將之代入(2)給出的極大似然估計(jì)第二節(jié) 點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)教學(xué)目的:要求學(xué)生了解相合性、無(wú)偏性、有效性和均方誤差的基本思想,理解相合性、無(wú)偏性、有效性和均方誤差的基本概念,熟練掌握相合性、無(wú)偏性和有效性的判別方法。教學(xué)重點(diǎn):相合估計(jì)、無(wú)偏估計(jì)和有效性。教學(xué)難點(diǎn):如何確定相合估計(jì)、無(wú)偏估計(jì)和有效性。我們已經(jīng)看到,點(diǎn)估計(jì)有各種不同的求法,為了在不同的點(diǎn)估計(jì)間進(jìn)行比較選擇,就必須對(duì)各種點(diǎn)估計(jì)的好壞給出評(píng)價(jià)標(biāo)準(zhǔn)。數(shù)理統(tǒng)計(jì)中給出了眾多的估計(jì)量評(píng)價(jià)標(biāo)準(zhǔn),對(duì)同一估計(jì)量使用不同的評(píng)價(jià)標(biāo)準(zhǔn)可能會(huì)得到完全不同的結(jié)論,因此,在評(píng)價(jià)某一個(gè)估計(jì)好壞時(shí)首先要說(shuō)明是在哪一個(gè)標(biāo)準(zhǔn)下,否則所論好壞毫無(wú)意義。但在諸多標(biāo)準(zhǔn)中,有一個(gè)基本標(biāo)準(zhǔn)是所有的估計(jì)都應(yīng)該滿足的,它是衡量一個(gè)估計(jì)是否可行的必要條件,這就是估計(jì)的相合性,我們就從相合性開(kāi)始介紹。一、相合性我們知道,點(diǎn)估計(jì)是一個(gè)統(tǒng)計(jì)量,因此它是一個(gè)隨機(jī)變量,在樣本量一定的條件下,我們不可能要求完全等同于參數(shù)的真實(shí)取值,但如果我們有足夠的觀測(cè)值,根據(jù)格里紋科定理,隨著樣本量的不斷增大,經(jīng)驗(yàn)分布函數(shù)逼近真實(shí)分布函數(shù),因此完全可以要求估計(jì)量隨著樣本量的不斷增大而逼近參數(shù)真值,這就是相合性,嚴(yán)格定義如下, 定義2.設(shè)為未知參數(shù),是的一個(gè)估計(jì)量,n是樣本容量, 若對(duì)任何一個(gè),有則稱為參數(shù)的相合估計(jì)相合性被認(rèn)為是對(duì)估計(jì)的一個(gè)最基本要求,如果一個(gè)估計(jì)量,在樣本量不斷增大時(shí),它都不能把被估參數(shù)估計(jì)到任意指定的精度,那么這個(gè)估計(jì)是很值得懷疑的,通常,不滿足相合性要求的估計(jì)一般不予考慮,證明估計(jì)的相合性一般可應(yīng)用大數(shù)定律或直接由定義來(lái)證。例11.用大數(shù)定律證明是的相合估計(jì)證:由切比雪夫大數(shù)定律即是的相合估計(jì)為了避免用定義判斷相合性的困難,下面介紹一個(gè)判斷相合性很有用的定理: 定量:設(shè)是的估計(jì)量若(1)(2)則是的相合估計(jì)。例12.證明是的相合估計(jì)證:在前面我們已經(jīng)證明(1)(2)是的相合估計(jì)二、無(wú)偏性相合性是大樣本下估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn),對(duì)小樣本而言,需要一些其他的評(píng)價(jià)標(biāo)準(zhǔn),無(wú)偏性便是一個(gè)常用的評(píng)價(jià)標(biāo)準(zhǔn)。 設(shè)是的一個(gè)估計(jì),的參數(shù)空間為,若對(duì)任意的,有 則稱是的無(wú)偏估計(jì),否則稱為有偏估計(jì)。例13.對(duì)任一總體而言,樣本均值是總體均值的無(wú)偏估計(jì),當(dāng)總體k階矩存在時(shí),樣本k階原點(diǎn)矩是總體k階原點(diǎn)矩的無(wú)偏估計(jì),但對(duì)k階中心矩則不一樣,例如,二階樣本中心矩就不是總體方差的無(wú)偏估計(jì),事實(shí)上,對(duì)此,有如下兩點(diǎn)說(shuō)明 (1)當(dāng)樣本量趨于無(wú)究時(shí),有,我們稱為的漸近無(wú)偏估計(jì),這表明 當(dāng)樣本量較大時(shí),可近似看作的無(wú)偏估計(jì) (2)若對(duì)作如下修正: 則是總體方差的無(wú)偏估計(jì),這種簡(jiǎn)章的修正方法在一些場(chǎng)合常被采用,它比更常用,這是因?yàn)樵趎2時(shí),因此用估計(jì)有偏小的傾向,特別在小樣本場(chǎng)合要使用估計(jì)。 無(wú)偏性不具有不變性。即若是的無(wú)偏估計(jì),一般而言,g()不是g()的無(wú) 偏估計(jì),除非g()是的線性函數(shù),例如,是的無(wú)偏估計(jì),但s不是的無(wú)偏估計(jì)例14.證明是的無(wú)偏估計(jì)。其中是X的樣本證:特別情形是的無(wú)偏估計(jì)例15.證明是的無(wú)偏估計(jì)證三、有效性參數(shù)的無(wú)偏估計(jì)可以有很多,那么如何在無(wú)偏估計(jì)中進(jìn)行選擇?直觀的想法是希望該估計(jì)圍繞參數(shù)真值的波動(dòng)越小越好,波動(dòng)的大小可以用方差來(lái)衡量,因此人們常用無(wú)偏估計(jì)的方差的大小作為度量無(wú)偏估計(jì)優(yōu)劣的標(biāo)準(zhǔn),這就是有效性。 定義4.設(shè),是的兩個(gè)無(wú)偏估計(jì),如果對(duì)任意的有則稱比 有效例16.設(shè)x1,xn是取自某總體的樣本,記總體均值為,總體方差為,則都是的無(wú)偏估計(jì),但顯然,只要n1,比有效,這表明,用全部數(shù)據(jù)的平均估計(jì)總體均值要比只使用部分?jǐn)?shù)據(jù)更有效。例17.比較與誰(shuí)有效解:(1)與都是的無(wú)偏估計(jì)(2) 比有效例18.設(shè),從總體中取樣證明是的無(wú)偏估計(jì)和相合估計(jì)解:(1)是的無(wú)偏估計(jì)是的相合估計(jì)第三節(jié) 參數(shù)的區(qū)間估計(jì)教學(xué)目的:要求學(xué)生了解置信區(qū)間的基本思想,理解置信區(qū)間的基本概念,掌握求置信區(qū)間的樞軸量法方法,熟練掌握正態(tài)總體參數(shù)置信區(qū)間的計(jì)算公式和大樣本置信區(qū)間。能用R軟件計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)重點(diǎn):置信區(qū)間的思想、概念和樞軸量法方法,計(jì)算正態(tài)總體參數(shù)的置信區(qū)間。教學(xué)難點(diǎn):計(jì)算單個(gè)正態(tài)總體的置信區(qū)間以及兩個(gè)正態(tài)總體下的置信區(qū)間。用點(diǎn)估計(jì)去估計(jì)總體的參數(shù),即使是無(wú)偏且有效的,也會(huì)由于樣本的隨機(jī)性,使得從一個(gè)樣本x1,x2,x3,xn算得的估計(jì)值不一定是被估計(jì)的參數(shù)的真實(shí)值,而且估計(jì)值的可靠性并不知道,這是一個(gè)重大的問(wèn)題,因此,必須解決根據(jù)估計(jì)量的分布,在一定可靠性的程度下指出被估計(jì)的總體參數(shù)的取值范圍,這正是本節(jié)要介紹的參數(shù)的區(qū)間估計(jì)問(wèn)題。一、置信區(qū)間概念為了引入置信區(qū)間的概念,請(qǐng)看下面的引例。引例設(shè)某種絕緣子抗扭強(qiáng)度X服從正態(tài)分布 ,其中 未知, 已知(=45公斤米),試對(duì)總體均值作區(qū)間估計(jì)。對(duì)于區(qū)間估計(jì),要選擇一個(gè)合適的統(tǒng)計(jì)量,若在該總體取一個(gè)容量為n的樣本x1,x2,x3,xn,樣本均值為的點(diǎn)估計(jì)即,然而我們要給出的一個(gè)區(qū)間估計(jì),以體現(xiàn)出估計(jì)的誤差,我們知道。在區(qū)間估計(jì)問(wèn)題中,要選取一個(gè)合適的估計(jì)函數(shù)。這時(shí),可取,它是的標(biāo)準(zhǔn)化隨機(jī)變量,且具備下面兩個(gè)特點(diǎn):(1)u中包含所要估計(jì)的未知參數(shù)(其中已知);(2)u的分布為 N(0,1),它與未知參數(shù)無(wú)關(guān)。 因?yàn)閡N(0,1),因而有,根據(jù)uN(0,1)的概率密度的對(duì)稱性(見(jiàn)下圖)可得。當(dāng)=0.05時(shí),1-=0.095,=1.96,將不等式轉(zhuǎn)化為,亦即,因此有。當(dāng)=0.05時(shí),。 。說(shuō)明未知參數(shù)包含在區(qū)間中的概率是95%,這里,不僅給出了的區(qū)間估計(jì),還給出了這一區(qū)間估計(jì)的置信度(或置信概率)。事實(shí)上,當(dāng)置信度為1-時(shí),區(qū)間估計(jì)為在引例中,若=160,=40,n=16。則有 說(shuō)明該絕緣子抗扭強(qiáng)度X的期望在(140.4,179.6)內(nèi)的可靠度為0.95。下面,引出置信區(qū)間的概念。定義5.設(shè)為總體的未知參數(shù)是由樣本定出的兩個(gè)統(tǒng)計(jì)量,若對(duì)于給定的概率1-(01),有,則隨機(jī)區(qū)間稱為參數(shù)的置信度為1-的置信區(qū)間,稱為置信下限,稱為置信上限。置信區(qū)間的意義可作如下解釋:包含在隨機(jī)區(qū)間中的概率為100(1-)%;或者說(shuō),隨機(jī)區(qū)間以100(1-)%的概率包含。粗略地說(shuō),當(dāng)=0.05時(shí),在100次的抽樣中,大致有95次包含在中,而其余5次可能不在該區(qū)間中。常取的數(shù)值為0.05,0.01,此時(shí)置信度1-分別為0.95,0.99。置信區(qū)間的長(zhǎng)度可視為區(qū)間估計(jì)的精度,下面分析置信度與精度的關(guān)系。(1)當(dāng)置信度1-增大,又樣本容量n固定時(shí),置信區(qū)間長(zhǎng)度增大,即區(qū)間估計(jì)精度減低;當(dāng)置信度1-減小,又樣本容量n固定,置信區(qū)間長(zhǎng)度減小,即區(qū)間估計(jì)精度提高。(2)設(shè)置信度1-固定。當(dāng)樣本容量n增大時(shí),置信區(qū)間減?。ㄈ缫?,置信區(qū)間長(zhǎng)度為),區(qū)間估計(jì)精度提高。二、單個(gè)正態(tài)總體參數(shù)的置信區(qū)間正態(tài)總體是最常見(jiàn)的分布,本小節(jié)中我們討論它的兩個(gè)參數(shù)的置信區(qū)間。1.已知時(shí)的置信區(qū)間設(shè)總體X服從正態(tài)分布,其中已知,而未知,求的置信度1-的置信區(qū)間。這一問(wèn)題實(shí)際上已在引例中的討論中解決,得到。所以的置信度1-的置信區(qū)間為。當(dāng)=0.05,=1.96;當(dāng)=0.01,=2.576。 例1.某車間生產(chǎn)滾珠,從長(zhǎng)期實(shí)踐知道,滾珠直徑X服從正態(tài)分布。從某天產(chǎn)品里隨機(jī)抽取6個(gè),測(cè)得直徑為(單位:毫米):14.6,15.1,14.9,14.8,15.2,15.1。若總體方差=0.06,求總體均值的置信區(qū)間(=0.05,=0.01)。解,=0.05時(shí),置信度為95%的置信區(qū)間為=0.01時(shí),置信度為99%的置信區(qū)間為。從此例知,在樣本容量n固定時(shí),當(dāng)置信度1-較大時(shí),置信區(qū)間長(zhǎng)度較大;當(dāng)置信度1-較小時(shí),置信區(qū)間較小。例2.用天平稱量某物體的質(zhì)量9次,得平均值為=15.4(g),已知天平稱量結(jié)果為正態(tài)分布,其標(biāo)準(zhǔn)差為0.1g,試求該物體質(zhì)量的0.95置信區(qū)間。解 此處1-=0.95,=0.05,查表知u0.025=1.96, 于是該物體質(zhì)量的0.95的置信區(qū)間為,從而該物體質(zhì)量的0.95置信區(qū)間為15.3347,15.4653。例3.設(shè)總體為正態(tài)分布,為得到的置信水平為0.95的置信區(qū)間長(zhǎng)度不超過(guò)1.2,樣本容量應(yīng)為多大? 解 由題設(shè)條件知的0.95置信區(qū)間為,其區(qū)間長(zhǎng)度為,它僅依賴于樣本容量n而與樣本具體取值無(wú)關(guān)?,F(xiàn)要求,即有?,F(xiàn)1-=0.95,故=1.96,從而。即樣本容量至少為11時(shí)才能使得的置信水平為0.95的置信區(qū)間長(zhǎng)度不超過(guò)1.2。2.未知時(shí)的置信區(qū)間這時(shí)可用t統(tǒng)計(jì)量,因?yàn)?,完全類似于上一小?jié)由于t(n-1)分布的概率密度f(wàn)(x)的對(duì)稱性有(見(jiàn)下圖)解得 其中是的無(wú)偏估計(jì)。例4.假設(shè)輪胎的壽命服從正態(tài)分布。為估計(jì)某種輪胎的平均壽命,現(xiàn)隨機(jī)地抽12只輪胎試用,測(cè)得它們的壽命(單位:萬(wàn)千米)如下:4.684.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70試求平均壽命的0.95置信區(qū)間。解 此處正態(tài)總體標(biāo)準(zhǔn)差未知,可使用t分布求均值的置信區(qū)間。本例中經(jīng)計(jì)算有=4.7092,s2=0.0615。取=0.05,查表知t0.025(11)=2.2010,于是平均壽命的0.95置信區(qū)間為(單位:萬(wàn)千米)。3.的置信區(qū)間此時(shí)雖然也可以就是否已知分兩種情況討論的置信區(qū)間,但在實(shí)際問(wèn)題中未知時(shí)已知的情況是極為罕見(jiàn)的,所以我們只在未知的條件下討論的置信區(qū)間。設(shè)x1,x2,x3,xn為來(lái)自總體X的樣本,樣本方差s2可作為的點(diǎn)估計(jì)。由,中包含未知參數(shù),又它的分布與無(wú)關(guān),以作為估計(jì)函數(shù),可用于的區(qū)間估計(jì)。由于分布是偏態(tài)分布,尋找平均長(zhǎng)度最短區(qū)間很難實(shí)現(xiàn),一般都改為尋找等尾置信區(qū)間:把平分為兩部分,在分布兩側(cè)各截面積為的部分,即采用的的兩個(gè)分位數(shù)它們滿足。(見(jiàn)下圖)將上式開(kāi)方即可得標(biāo)準(zhǔn)差的置信區(qū)間。例5.某廠生產(chǎn)的零件質(zhì)量X服從正態(tài)分布?,F(xiàn)從該廠生產(chǎn)的零件中抽取9個(gè),測(cè)得其質(zhì)量為(單位:g)45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6試求總體標(biāo)準(zhǔn)差的0.95置信區(qū)間。解 由數(shù)據(jù)可算得s2=0.0325,(n-1)s2=80.0325=0.26,這里=0.95,查表知代入公式可得的0.95置信區(qū)間為。從而的0.95置信區(qū)間為0.1218,0.3454。以上關(guān)于正態(tài)總體參數(shù)的區(qū)間估計(jì)的討論列表如下表所示。 本章小結(jié)本章考核要求:(一)點(diǎn)估計(jì)(1)知道點(diǎn)估計(jì)的概念(2)會(huì)用矩法求總體參數(shù)的矩估計(jì)值,主要依據(jù)是(3)會(huì)用最大似然估計(jì)法求總體參數(shù)的估計(jì)值?;痉椒ㄊ怯蓸颖緓1,x2,x3,xn構(gòu)造一個(gè)似然函數(shù)或似然函數(shù)的對(duì)數(shù)L(x1,x2,x3,xn,)=P(X=x1)P(X=x2)P(X=xn)L(x1,x2,x3,xn,)=f(x1)f(x2)f(xn)然后由ln L(x1,x2,x3,xn,)取最大的值時(shí)的值為的值,即 。是L的最大值點(diǎn)。(二)點(diǎn)估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)(1)若,則是的無(wú)偏估計(jì)。(2)若都是的無(wú)偏估計(jì),且就說(shuō)有效。(3)若。就說(shuō)是的相合估計(jì)以上三條標(biāo)準(zhǔn)中主要掌握無(wú)偏估計(jì)和有效估計(jì)(三)區(qū)間估計(jì)(1)知道區(qū)間估計(jì)的概念(2)會(huì)求一個(gè)正態(tài)總體的參數(shù)的置信區(qū)間。公式見(jiàn)表7-1第三章 假設(shè)檢驗(yàn)本章主要介紹統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本思想和概念以及參數(shù)的假設(shè)檢驗(yàn)方法。第一節(jié) 假設(shè)檢驗(yàn)的基本思想和概念教學(xué)目的:要求學(xué)生了解假設(shè)檢驗(yàn)的基本思想,理解假設(shè)檢驗(yàn)的基本概念,認(rèn)識(shí)假設(shè)檢驗(yàn)問(wèn)題,熟悉假設(shè)檢驗(yàn)的基本步驟。教學(xué)重點(diǎn):基本概念,假設(shè)檢驗(yàn)的基本步驟.教學(xué)難點(diǎn):基本概念的理解.一、統(tǒng)計(jì)假設(shè)的概念為了引入統(tǒng)計(jì)假設(shè)的概念,先請(qǐng)看例8-1。例1.味精廠用一臺(tái)包裝機(jī)自動(dòng)包裝味精,已知袋裝味精的重量,機(jī)器正常時(shí),其均值=0.5(0.5,0.015的單位都是公斤)。某日開(kāi)工后隨機(jī)抽取9袋袋裝味精,其凈重(公斤)為:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512問(wèn)這臺(tái)包裝機(jī)是否正常? 此例隨機(jī)抽樣取得的9袋味精的重量都不正好是0.5公斤,這種實(shí)際重量和標(biāo)準(zhǔn)重量不完全一致的現(xiàn)象,在實(shí)際中是經(jīng)常出現(xiàn)的。造成這種差異不外乎有兩種原因:一是偶然因素的影響, 二由于偶然因素而發(fā)生的(例如電網(wǎng)電壓的波動(dòng)、金屬部件的不時(shí)伸縮、衡量?jī)x器的誤差而引起的)差異稱為隨機(jī)誤差;由于條件因素(生產(chǎn)設(shè)備的缺陷、機(jī)械部件的過(guò)度損耗)而產(chǎn)生的差異稱為條件誤差。若只存在隨機(jī)誤差,我們就沒(méi)有理由懷疑標(biāo)準(zhǔn)重量不是0.5公斤;如果我們有十足的理由斷定標(biāo)準(zhǔn)重量已不是0.5公斤,那么造成這種現(xiàn)象的主要原因是條件誤差,即包裝機(jī)工作不正常,那么,怎樣判斷包裝機(jī)工作是否正常呢?我們通過(guò)解例1 來(lái)找出解假設(shè)檢驗(yàn)問(wèn)題的思想方法。解 已知袋裝味精重,假設(shè)現(xiàn)在包裝機(jī)工作正常,即提出如下假設(shè):,這是兩個(gè)對(duì)立的假設(shè),我們的任務(wù)就是要依據(jù)樣本對(duì)這樣的假設(shè)之一作出是否拒絕的判斷。由于樣本均值是的一個(gè)很好的估計(jì),故當(dāng)為真時(shí),應(yīng)很小。當(dāng)過(guò)分大時(shí),我們就應(yīng)當(dāng)懷疑不正確而拒絕。怎樣給出的具體界限值呢? 當(dāng)為真時(shí),由于,對(duì)于給定的很小的數(shù)01,例如取=0.05,考慮,其中是標(biāo)準(zhǔn)正態(tài)分布上側(cè)分位數(shù),而事件 是一個(gè)小概率事件,小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。我們查附表1得,又n=9,=0.015,由樣本算得,又由上式得:小概率事件居然發(fā)生了,這與實(shí)際推斷原理相矛盾,于是拒絕,而認(rèn)為這臺(tái)包裝機(jī)工作不正常。從上面的例1中,我們看出為了對(duì)總體的某一參數(shù)進(jìn)行檢驗(yàn),通常提出兩個(gè)假設(shè):。然后引入一個(gè)與被檢參數(shù)有關(guān)的服從某種分布的統(tǒng)計(jì)量,根據(jù)事先給出的一概率標(biāo)準(zhǔn)(叫顯著水平)用反證法進(jìn)行判斷,由于小概率事件一般是不會(huì)發(fā)生的,如果引進(jìn)的樣本是一個(gè)小概率事件,因?yàn)樗拇_出現(xiàn)了,則可認(rèn)為假設(shè)不能接受,否則便接受。(二)假設(shè)檢驗(yàn)的程序根據(jù)以上的討論與分析,可將假設(shè)檢驗(yàn)的基本步驟概括如下:(1)根據(jù)實(shí)際問(wèn)題提出原假設(shè)及備擇假設(shè)。這里要求與有且僅有一個(gè)為真。(2)選取合適的統(tǒng)計(jì)量,即要求所選的統(tǒng)計(jì)量與假設(shè)無(wú)關(guān)且服從某種分布,常見(jiàn)的有標(biāo)準(zhǔn)正態(tài)分布t(n-1)分布,(n-1)分布及F(m,n)公布。(3)規(guī)定小概率標(biāo)準(zhǔn)的大小,也叫顯著水平,通??扇?0.01,=0.05或=0.1。(4)在顯著水平下,根據(jù)統(tǒng)計(jì)量的分布將樣本空間劃分為兩部分,其一是接受的叫接受域,另一個(gè)是拒絕的叫拒絕域,記為W。(5)根據(jù)樣本值計(jì)算統(tǒng)計(jì)量的大小。(6)作出判斷:若統(tǒng)計(jì)量的觀測(cè)值落在拒絕域W內(nèi)。則知小概率事件發(fā)生了,拒絕,接受。若統(tǒng)計(jì)量的觀測(cè)值落在接受域則認(rèn)為小概率事件沒(méi)有發(fā)生,可以接受拒絕。第二節(jié) 總體均值的假設(shè)檢驗(yàn)教學(xué)目的:理解和掌握單個(gè)以及兩個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)的方法與思想,掌握正態(tài)總體方差檢驗(yàn)的方法,能用R軟件來(lái)完成這些檢驗(yàn)。教學(xué)重點(diǎn):檢驗(yàn)方法的掌握,檢驗(yàn)方法思想的理解。教學(xué)難點(diǎn):檢驗(yàn)方法的掌握。本節(jié)討論的總體均值的假設(shè)檢驗(yàn),多數(shù)是在正態(tài)總體下進(jìn)行的。一、 u檢驗(yàn)1. 方差已知時(shí),單個(gè)正態(tài)總體均值檢驗(yàn)設(shè)x1,xn是從正態(tài)總體中抽取的一個(gè)樣本,是已知常數(shù),欲檢驗(yàn)假設(shè):,其中為已知數(shù),它的程序:(1)提出假設(shè)(2)引入統(tǒng)計(jì)量(3)規(guī)定顯著水平,查標(biāo)準(zhǔn)正態(tài)分布表求的上側(cè)分位數(shù)為臨界值,寫出相應(yīng)的拒絕域其中常用的有=0.1時(shí),=0.05時(shí),=0.01時(shí),(4)根據(jù)樣本值x1,x2,xn計(jì)算統(tǒng)計(jì)量u。(5)判斷:若u落入拒絕域W內(nèi)時(shí),則拒絕接受, 若u落入接受域內(nèi)時(shí),則接受,拒絕。例2.某產(chǎn)品的重量XN(12,1)(單位:克),更新設(shè)備后,從新生產(chǎn)的產(chǎn)品中抽樣100件,測(cè)試樣本均值(克),如果產(chǎn)品的方差沒(méi)有改變,請(qǐng)問(wèn)更新設(shè)備后,產(chǎn)品的平均重量是否有明顯變化?(=0.01)解 (1)設(shè)(2)引入(3)根據(jù)=0.01,查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,得的上側(cè)分位數(shù)拒絕域?yàn)椋?,-2.58),(2.58,+)(4)計(jì)算(5)u落入拒絕域W中,故拒絕,即有明顯差別。 2.方差已知時(shí),兩個(gè)正態(tài)總體值差的檢驗(yàn)設(shè),其中為已知常數(shù)。x1,xm和y1,yn分別是取自X和Y的樣本且相互獨(dú)立。欲檢驗(yàn)假設(shè):檢驗(yàn)假設(shè),等價(jià)于檢驗(yàn)假設(shè)。而是的一個(gè)好估計(jì)量,且當(dāng)為真時(shí),有(8.2.1)于是對(duì)給定的水平,查附表1,可得臨界值,使, (8.2.2)從而得拒絕域,若uW,則拒絕;否則接受。由上述討論可知,由服從標(biāo)準(zhǔn)正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量作檢驗(yàn)的方法稱為u檢驗(yàn)法

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論