高等工程數(shù)學(xué)-第7章-估計與檢驗_第1頁
高等工程數(shù)學(xué)-第7章-估計與檢驗_第2頁
高等工程數(shù)學(xué)-第7章-估計與檢驗_第3頁
高等工程數(shù)學(xué)-第7章-估計與檢驗_第4頁
高等工程數(shù)學(xué)-第7章-估計與檢驗_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、現(xiàn)代高等工程數(shù)學(xué)電子教案,第7章 估計理論與假設(shè)檢驗 數(shù)學(xué)學(xué)院應(yīng)用數(shù)學(xué)系 王國富 2012年9月,問題提出 某廠有一批產(chǎn)品,須經(jīng)檢驗后方可出廠。按規(guī)定標(biāo)準(zhǔn),次品率不得超過1%。今在其中隨機抽取100件進(jìn)行檢查,結(jié)果發(fā)現(xiàn)有2件次品,問這批產(chǎn)品的次品率是多少?能否出廠?,引進(jìn)變量X,當(dāng)抽取一件產(chǎn)品是次品,記為X=1,當(dāng)抽取一件產(chǎn)品不是次品,記為X=0;PX=1=p, PX=0=1-p P就是產(chǎn)品的次品率。這批產(chǎn)品的次品率是多少就是對p的取值作出一個推斷,稱為估計。能不能出廠,就看p的值是超過1%還是沒有超過1%,這就是檢驗。,數(shù)理統(tǒng)計其實質(zhì)就是利用樣本對總體進(jìn)行統(tǒng)計推斷,而總體可以看作是一個隨機變

2、量,要知道一個隨機變量的取值規(guī)律性就是要對它的分布作出一個推斷。當(dāng)我們對總體一無所知的時候,可以利用樣本對分布作出估計,通??梢杂妙l率分布表來估計離散型總體的分布率;用直方圖估計連續(xù)性總體的分布密度;用經(jīng)驗分布函數(shù)估計總體的分布函數(shù)。當(dāng)我們對總體的分布類型有了一定的了解,但分布中含有未知參數(shù)時,可以利用參數(shù)估計方法對參數(shù)的取值作出估計,其中包括點估計和區(qū)間估計。當(dāng)我們對總體已經(jīng)有了比較全面的了解,但實際中可能出現(xiàn)一些大的改變,這些改變會不會影響總體的分布,那就需要進(jìn)行假設(shè)檢驗了。估計理論與假設(shè)檢驗是數(shù)理統(tǒng)計中兩個最基本和最重要的內(nèi)容,總體與個體 我們把所研究對象的全體稱為總體或母體。組成總體的

3、每個單元稱為個體 總體X可看作一個隨機變量 ,稱X的概率分布為總體分布,稱X的數(shù)字特征為總體的數(shù)字特征 ,對總體進(jìn)行研究就是對總體的分布或?qū)傮w的數(shù)字特征進(jìn)行研究 . 樣本 從總體中抽取的一部分個體稱為樣本或者子樣,其中所含個體的個數(shù)稱為樣本容量 . 樣本具有二重性:隨機性和確定性,簡單隨機樣本: 設(shè)總體X的樣本滿足 獨立性:每次觀測結(jié)果既不影響其它結(jié)果,也不受其它結(jié)果的影響;即相互獨立; 代表性:樣本中每一個個體都與總體X有相同分布。 則稱此樣本為簡單隨機樣本。 進(jìn)行有放回抽樣就是簡單隨機樣本 ,無放回抽樣就不是簡單隨機樣本。但N很大,n相對較小時無放回抽樣得到的樣本可以近似看作簡單隨機樣本

4、.,統(tǒng)計量 統(tǒng)計量的定義 定義1.2 設(shè) 為總體X的一個樣本, 為 的連續(xù)函數(shù),且不含有任何未知參數(shù),則稱T為一個統(tǒng)計量。 注:1.統(tǒng)計量是完全由樣本確定的一個量,即樣本有一個觀測值時,統(tǒng)計量就有一個唯一確定的值 ; 2.統(tǒng)計量是一個隨機變量,它將高維隨機變量問題轉(zhuǎn)化為一維隨機變量來處理 ,但不會損失所討論問題的信息量.,常見的統(tǒng)計量 1.樣本均值 2.樣本方差 3.k 階原點矩 4.k 階中心矩 5.順序統(tǒng)計量 6.樣本極差 與中位數(shù),抽樣分布 我們稱統(tǒng)計量的分布為抽樣分布 ,不同的統(tǒng)計量其分布不一定相同. 常見的分布類型有: 正態(tài)分布 伽瑪分布 卡方分布 t 分布 F分布,伽瑪分布 定義1

5、.4 如果連續(xù)型隨機變量X的密度函數(shù)為 其中 為 函數(shù),則稱X為服從參數(shù)是 的伽瑪分布,記為,伽瑪分布的性質(zhì) (1) 由此可得,(2) 如果 ,并且X和Y相互獨立,容易求得 這個性質(zhì)稱為可加性,即伽瑪分布具有可加性.,卡方分布 用構(gòu)造性的方式定義是 定義1.5 設(shè) 為相互獨立的隨機變量,且均服從 ,則它們的平方和 也是一個隨機變量,它所服從的分布稱為自由度為n的 分布,記為,它的密度函數(shù)為 其密度函數(shù)與參數(shù)n有關(guān),它的圖形也有一定差異,卡方分布的性質(zhì) 若,則 即卡方分布是一種伽瑪分布,因此具有伽瑪分布的性質(zhì) () () 如果,并且X和Y相互獨立,有 卡方分布也具有可加性,t 分布 構(gòu)造性的方式

6、定義 定義1.6 設(shè),且X與Y相互獨立,記 則也是一個隨機變量,它所服從的分布稱為自由度為n的t分布,記為,它的密度函數(shù)為 與參數(shù)n有關(guān),不同的n其圖形也有差異,性質(zhì) 若則 ()當(dāng)時,t分布是柯西分布,柯西分布不存在數(shù)學(xué)期望和方差參數(shù)為2的t分布也不存在數(shù)學(xué)期望和方差 ()時,,()可以證明 這是標(biāo)準(zhǔn)正態(tài)分布的分布密度,即當(dāng)n充分大時,T近似服從標(biāo)準(zhǔn)正態(tài)分布,分布 構(gòu)造性的方式定義 定義1. 設(shè),且X與Y相互獨立,記 則也是一個隨機變量,它所服從的分布稱為自由度為(m,n)的F分布,記為,它的密度函數(shù)為 它與m,n有關(guān),其圖形也有一定差異,容易得到 若,則,分位數(shù): 定義1.6 設(shè)X為連續(xù)型隨

7、機變量,其分布函數(shù)為 ,對,如果存在數(shù) 滿足 則稱為此分布的分位數(shù) 分位數(shù)的幾何意義 可用圖形表示,它的值可查表得到,不同的分布有不同的分位數(shù),有不同的表可查,常見的分位數(shù)有 它們的值可以通過附表1、附表2、附表3、附表4 查得,分位數(shù)具有性質(zhì) (1) (2) (3)當(dāng)n 足夠大時(一般n 45)有近似公式,例1:查表求下列分位數(shù)的值,抽樣分布定理 定理7.2.1 設(shè)總體 , 為X的一個簡單隨機樣本, 為樣本均值與樣本方差,則有: (1) (2),(3) 相互獨立; (4),定理7.2.2 設(shè)有兩個總體與, ,從兩個總體與中分別獨立抽取容量為m,n的簡單隨機樣本 記為樣本的樣本均值與方差,為樣

8、本的樣本均值與方差,則 (),() ()若則 其中,定理7.2.3 設(shè)總體X為任意總體,存在有限的數(shù)學(xué)期望與方差,為X的一個樣本,當(dāng)n充分大時(稱之為大樣本),有 () (),定理7.2.4 設(shè)事件A發(fā)生的概率為p,在n次重復(fù)試驗中事件A發(fā)生的次數(shù)為m,當(dāng)n充分大時,近似地有 () (),定理7.2.5 設(shè)總體X服從參數(shù)為 的指數(shù)分布, 為X的一個簡單隨機樣本, 為樣本均值,則,例2 設(shè)總體,分別從X中抽取容量為10與15的兩個獨立樣本,求它們的均值之差的絕對值大于0.3的概率,例3 設(shè)總體, 是從總體中抽取的簡單隨機樣本,選取常數(shù)c,d使得 并求出n.,一、估計理論,1.參數(shù)點估計 參數(shù)點估

9、計是對參數(shù)取哪一個值作出估計 定義:設(shè)總體的分布已知,但其中含有未知參數(shù)(可以是一個向量),點估計就是依據(jù)某種原理,根據(jù)樣本來構(gòu)造統(tǒng)計量(可以是一個向量)作為的估計量,記為,當(dāng)樣本取定一個觀察值時,估計量也有一個值,這個值稱為估計值,不同的抽樣,有不同的估計值,它與真值會有差異,這種差異除了抽樣帶來的誤差外,與估計量的形式有關(guān)因此,選取統(tǒng)計量也是非常重要的我們介紹兩種統(tǒng)計量的方法:矩法與極大似然法,矩法估計 假設(shè)樣本為簡單隨機樣本,則 由大數(shù)定律,有,其中 當(dāng)n比較大時,利用這種近似相等關(guān)系的思想,得到矩法估計的定義 定義:用樣本原點矩去代替總體相應(yīng)的原點矩得到的參數(shù)的估計量的方法稱為矩法,稱

10、這種估計為矩法估計量,例4總體的分布密度為 其中為未知參數(shù),現(xiàn)從中抽取一個樣本,試求的矩法估計量 解:,由于 故令 得到估計量 通常我們是采用下面的方法,另解 我們可認(rèn)為 而 由矩法,我們令 得到,極大似然估計 極大似然估計是利用小概率原理作出估計的 小概率原理:一個概率非常小的一個事件在一次試驗中幾乎是不可能發(fā)生的;也就是說,如果一個事件在一次試驗中居然發(fā)生了,那么這個事件發(fā)生的概率不可能很小,而應(yīng)認(rèn)為其概率會盡可能地大,例5設(shè)總體,現(xiàn)從中抽取一個樣本觀察值(500,300,600,400,700),試估計 的值 解:,這里,n是5,設(shè)為樣本,在一次試驗中事件 發(fā)生了,而,是參數(shù)的函數(shù),由小

11、概率原理,這個概率不會太小,應(yīng)盡可能大,即求這個概率的最大值利用求導(dǎo)可得到當(dāng)時,這個概率達(dá)到最大因此,我們有理由認(rèn)為參數(shù) 為500.這就是極大似然估計,一般地,當(dāng)總體為離散型總體,其分布中含有未知參數(shù)(可以是向量), 為一個樣本,為一次觀察值,稱 為似然函數(shù),稱 對數(shù)似然函數(shù)稱滿足 的為極大似然估計值,記為,而稱 為極大似然估計量簡稱估計 上例的一般情況是,例6:設(shè)總體服從參數(shù)為的泊松分布,求 的極大似然估計,解:總體的分布為 似然函數(shù)為,對數(shù)似然函數(shù)為 這兩個函數(shù)的極值點相同,對對數(shù)似然函數(shù)求導(dǎo),并令其為,得,得到 從而極大似然估計為,當(dāng)總體是連續(xù)型總體時,我們定義似然函數(shù)為 對數(shù)似然函數(shù)為

12、,例7設(shè)總體,試求 的極大似然估計. 解:,解:似然函數(shù)為 對數(shù)似然函數(shù)為,對 求導(dǎo)并令其為0,得 從而解得 的極大似估計,2.區(qū)間估計 點估計方法有兩個缺陷: (1)不能說明估計值與真值的偏差到底有多大(精確性); (2)不能說明這個估計有多大的可信度(可靠性);,需要指出: 區(qū)間估計中的精確性與可靠性是相互矛盾的. 當(dāng)樣本容量一定時,提高估計的可靠度,將降低估計的精度,相反,提高估計的精度,將降低估計的可靠度.,例9:在某次選舉前的一次民意測驗中,隨機地抽取了400名選民進(jìn)行民意測驗,結(jié)果有240人支持某個指定的候選人。求在所有的選民中,這位候選人的支持率的95%的置信區(qū)間,例10:在甲、

13、乙兩市進(jìn)行的職工家計調(diào)查結(jié)果表明:甲市抽取的500戶中平均每戶消費支出 元,標(biāo)準(zhǔn)差元;乙市抽取的1000戶中平均每戶消費支出元,標(biāo)準(zhǔn)差元,試求:兩市職工家庭每戶平均年消費支出之間差別的置信水平為0.95的置信區(qū)間。,例11:設(shè)總體服從 上的均勻分布,求 的區(qū)間估計。,解:由極大似然估計得 容易得到 的分布函數(shù)為 對給定的置信度 令 從而得到的置信區(qū)間為,假設(shè)檢驗 問題提出 某廠有一批產(chǎn)品,須經(jīng)檢驗后方可出廠。按規(guī)定標(biāo)準(zhǔn),次品率不得超過1%。今在其中隨機抽取100件進(jìn)行檢查,結(jié)果發(fā)現(xiàn)有2件次品,能否出廠?,分析:我們可算得,不合格品出現(xiàn)的頻率為0.02。由于我們不可能對所有生產(chǎn)的產(chǎn)品進(jìn)行檢驗,因

14、此即使可以出廠,不合格率不超過0.01,在隨機抽樣檢驗中,不合格品出現(xiàn)的頻率也有可能比0.01大. 如果記“X=1”表示生產(chǎn)出來的產(chǎn)品為不合格品;“X=0”表示生產(chǎn)出來的產(chǎn)品為合格品,我們有 這里參數(shù) 為不合格率。那么產(chǎn)品可以出廠等價于總體X的分布為0-1分布,參數(shù) ;產(chǎn)品不可以出廠等價于總體的分布為0-1分布,參數(shù) 。關(guān)于產(chǎn)品能否可以出廠的兩種假設(shè)就轉(zhuǎn)化為關(guān)于總體分布的兩種假設(shè),所謂假設(shè)檢驗問題,就是要判斷原假設(shè)是否正確,也就是要作出一個決定,是接受還是拒絕原假設(shè),如何作出選擇,需要我們從總體中抽取樣本,然后根據(jù)樣本的觀測值作出決定。這就需要我們給出一個規(guī)則,此規(guī)則告訴我們,在有了樣本觀測值

15、后,我們可以作出是接受還是拒絕原假設(shè)。 我們把這樣的規(guī)則稱為檢驗。要給出一個有實際使用價值的檢驗,需要有豐富的統(tǒng)計思想。我們首先對樣本進(jìn)行加工,把樣本中包含的關(guān)于未知參數(shù)的信息集中起來,構(gòu)造出一個適合于假設(shè)檢驗的統(tǒng)計量T。,上面例子中,我們?nèi)?它表示所檢驗的100件產(chǎn)品中不合格品的總數(shù)。是p的充分統(tǒng)計量,服從參數(shù)是100, p的二項分布。一般說來,在 為真即生產(chǎn)過程穩(wěn)定時,T的值應(yīng)比較??;而在 不真即生產(chǎn)過程不穩(wěn)定時,T的值應(yīng)相對地比較大。因此,我們可以根據(jù)T值的大小來制定檢驗法則。對樣本的每個觀測值,當(dāng)統(tǒng)計量的觀測值較大時就拒絕 ,而當(dāng)T較小時就接受 。這就是說,按照規(guī)則,當(dāng) 時,拒絕原假設(shè)

16、; 當(dāng) 時,接受原假設(shè); 其中c是一個待定的常數(shù)。不同的c值表示不同的檢驗,如何確定c,需要有熟練的計算技巧和豐富的統(tǒng)計思想,我們稱T為檢驗統(tǒng)計量;c為檢驗臨界值; 為拒絕域; 為接受域。,兩類錯誤 每一個檢驗都會不同程度地犯兩類錯誤。上面例子中,原假設(shè)本來正確,由于樣本的隨機性,檢驗統(tǒng)計量的觀測值落入了拒絕域,就拒絕原假設(shè),這時稱假設(shè)檢驗過程中犯了第一類錯誤,也稱“棄真錯誤”;原假設(shè)本來不正確,由于樣本的隨機性,檢驗統(tǒng)計量的觀測值落入了接受域,就接受原假設(shè),這時稱假設(shè)檢驗過程中犯了第二類錯誤,也稱“存?zhèn)五e誤”。,一個檢驗的好壞可由犯這兩類錯誤的概率來度量。常把犯第一類錯誤的概率記為,犯第二類

17、錯誤的概率記為。由于它們常依賴于總體中未知參數(shù),故又常記為。上面例子中,可見,犯兩類錯誤的概率均為參數(shù)p的函數(shù)。犯第一類錯誤的概率是 的函數(shù);犯第二類錯誤的概率是 的函數(shù)。犯兩類錯誤的概率也是c的函數(shù),c的值越大,犯第一類錯誤的概率就越小,而犯第二類錯誤的概率就越大;相反, c的值越小,犯第一類錯誤的概率就越大,而犯第二類錯誤的概率就越??;因此,犯兩類錯誤的概率是相互制約的 ,奈曼(Neyman)和皮爾遜(Pearson)提出,首先控制犯第一類錯誤的概率,即選定一個數(shù),使得檢驗中犯第一類錯誤的概率不超過。然后,在滿足這個約束條件的檢驗中,尋找犯第二類錯誤的概率盡可能小的檢驗。這就是假設(shè)檢驗理論

18、中的奈曼-皮爾遜原則。尋找犯第二類錯誤的概率盡可能小的檢驗,在理論和計算中都并非容易。為簡單起見,在樣本容量n固定時,我們著重對犯第一類錯誤的概率加以控制,適當(dāng)考慮犯第二類錯誤的概率的大小。稱控制犯第一類錯誤的概率不超過的檢驗為顯著性檢驗。稱為顯著性水平,假設(shè)檢驗的一般步驟 (1)根據(jù)實際問題提出原假設(shè)和備擇假設(shè); (2)確定檢驗統(tǒng)計量; (3)取適當(dāng)?shù)娘@著性水平,并由顯著性水平和統(tǒng)計量的分布確定拒絕域,使得檢驗中犯第一類錯誤的概率的最大值 盡可能的接近,特別在總體為連續(xù)型總體時,往往要使它等于 拒絕域有單側(cè)和雙側(cè)兩種形式 (4)由樣本觀測值算得統(tǒng)計量的觀測值,并與拒絕域中臨界值比較,如果觀測

19、值落入拒絕域,則拒絕原假設(shè),否則接受原假設(shè),例13: 由點估計,可用 ,因此,我們可選取統(tǒng)計量 來檢驗,顯然它的值太大或者太小都應(yīng)拒絕 ,因此,拒絕域的形式為,由 來確定,而在為真時 , 由標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)可知 因此拒絕域為,例14 某工廠生產(chǎn)的一種產(chǎn)品的強度長期以來一直服從正態(tài)分布(55,0.01),,現(xiàn)采用新的工藝進(jìn)行生產(chǎn)后,抽取n=100的樣本,測得有樣本均值為56。假設(shè)方差保持不變,問在新的工藝下,產(chǎn)品的強度是否有所變化?(取 ),解:假設(shè)采用新的工藝進(jìn)行生產(chǎn)后,產(chǎn)品的強度仍服從正態(tài)分布 作假設(shè) 選取統(tǒng)計量 在原假設(shè)為真的條件下 拒絕域為,經(jīng)計算,統(tǒng)計量的觀測值 u=100,查表得

20、 。從而 ,說明樣本觀測值落入了拒絕域中,應(yīng)該拒絕 ,即在新的工藝下,產(chǎn)品的強度已經(jīng)發(fā)生了變化。,正態(tài)分布中參數(shù)假設(shè)檢驗可列表正態(tài)分布的假設(shè)檢驗.doc,例15某種食品在處理前后含脂率抽樣數(shù)據(jù)如下: 處理前: 0.19 0.18 0.21 0.30 0.41 0.12 0.27 處理后: 0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12 假定處理前后的含脂率均服從正態(tài)分布,且標(biāo)準(zhǔn)差保持不變,問在0.05顯著性水平下,處理前后的含脂率有無顯著變化?,解:我們采用t檢驗。設(shè)處理前后含脂率分別為X、Y, ,作假設(shè),例16 某廠有一批產(chǎn)品,共1000件,須經(jīng)檢驗后方可出廠。按規(guī)定標(biāo)準(zhǔn),次品率不得超過1%。今在其中隨機抽取100件進(jìn)行檢查,結(jié)果發(fā)現(xiàn)有2件次品,問這批產(chǎn)品能否出廠?( ),解:設(shè)這一批產(chǎn)品的次品率為p,我們作假設(shè),例17.某市對某項決定需要全市市民表決才能執(zhí)行,并規(guī)定表決同意此項決定的人數(shù)所占比例超過50%時就可以執(zhí)行此決定。今在表決前隨機地抽取了400名市民進(jìn)行民意調(diào)查,結(jié)果有220名同意此項決定。問此項決定能否執(zhí)行?,解:設(shè)表決同意此項決定的人數(shù)所占比例為p,作如下假設(shè),沒落入到拒絕域,即此項決定在顯著性水平0.01之下不能執(zhí)行,分布假設(shè)檢驗 參數(shù)的假設(shè)檢驗中,總體分布的類型是已知的。然而在許多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論