




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、簡單隨機(jī)抽樣簡單隨機(jī)抽樣:1.1.代表性代表性: 中每一個(gè)與所考察的總中每一個(gè)與所考察的總 體有體有相同的分布相同的分布。2.2.獨(dú)立性獨(dú)立性: 是是相互獨(dú)立相互獨(dú)立的隨機(jī)變量。的隨機(jī)變量。 nXXX,21nXXX,21第六章第六章 樣本及抽樣分布樣本及抽樣分布 假如總體的分布函數(shù)為假如總體的分布函數(shù)為)(xF簡單隨機(jī)樣本的簡單隨機(jī)樣本的聯(lián)合分布函數(shù)聯(lián)合分布函數(shù)為為)()()(21nxFxFxF. )(),(*121niinxFxxxF概率密度概率密度為:為:. )(),(*121niinxfxxxf 樣本平均值樣本平均值:niiXnX1;1樣本方差樣本方差:;11)(11122122niin
2、iiXnXnXXnS 統(tǒng)計(jì)量:統(tǒng)計(jì)量:由樣本由樣本構(gòu)造構(gòu)造的一些函數(shù),的一些函數(shù),不含任何不含任何未知參數(shù)。未知參數(shù)。完全由樣本決定的量。完全由樣本決定的量。 樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差:niiXXnSS122;11樣本樣本k k階階(原點(diǎn))(原點(diǎn))矩矩:nikikkXnA1;, 2 , 1,1樣本樣本k k階中心矩階中心矩:., 3 , 2,11kXXnBnikik經(jīng)驗(yàn)分布函數(shù)經(jīng)驗(yàn)分布函數(shù)定義:設(shè)定義:設(shè)nXXX,21是取自總體是取自總體X XF F(x x)的一個(gè)樣本,把)的一個(gè)樣本,把樣本觀樣本觀察值察值從小到大排列從小到大排列為為 nxxx21稱函數(shù)稱函數(shù) nkknxxxxxnkxxxF若若
3、若, 1,011為總體為總體X X的的經(jīng)驗(yàn)分布函數(shù)經(jīng)驗(yàn)分布函數(shù)。 格里汶科(格里汶科(GlivenkoGlivenko)在)在19331933年證明了以年證明了以下的結(jié)果:下的結(jié)果:對(duì)于任一實(shí)數(shù)對(duì)于任一實(shí)數(shù)x,當(dāng),當(dāng)n時(shí)時(shí))(xFn以概率以概率1 1一致收斂于一致收斂于分布函數(shù)分布函數(shù))(xF 10| )(|suplimxFxFPnxn 例:從一批標(biāo)準(zhǔn)重量為例:從一批標(biāo)準(zhǔn)重量為500g500g的罐頭中,的罐頭中,隨機(jī)抽取隨機(jī)抽取8 8聽,測得誤差如下(單位:聽,測得誤差如下(單位:g g): : 8 8,4 4,6 6,7 7,2 2,1 1,0 0,1 1求求經(jīng)驗(yàn)分布函數(shù)經(jīng)驗(yàn)分布函數(shù),并作出
4、,并作出圖形圖形。 解:將樣本值按大小順序排列為解:將樣本值按大小順序排列為 7 74 42 20 01 11 16 68 8則樣本經(jīng)驗(yàn)分布函數(shù)為則樣本經(jīng)驗(yàn)分布函數(shù)為 8186,8761,8610,8402,8324,8247,817, 0)(8xxxxxxxxxF 抽樣分布抽樣分布:統(tǒng)計(jì)量的分布稱為:統(tǒng)計(jì)量的分布稱為“抽樣分布抽樣分布”。 精確抽樣分布:精確抽樣分布: 總體總體X X的分布已知,如對(duì)于任一的分布已知,如對(duì)于任一n,n,都能導(dǎo)出統(tǒng)都能導(dǎo)出統(tǒng)計(jì)量的明顯表達(dá)式,這種分布稱為精確抽樣分布。計(jì)量的明顯表達(dá)式,這種分布稱為精確抽樣分布。它常用于它常用于小樣本小樣本的統(tǒng)計(jì)推斷問題。的統(tǒng)計(jì)推
5、斷問題。 漸近分布漸近分布: 在樣本容量在樣本容量n n無限大時(shí),能獲得統(tǒng)計(jì)量的極限無限大時(shí),能獲得統(tǒng)計(jì)量的極限分布,這種分布稱為漸近分布。它常用于分布,這種分布稱為漸近分布。它常用于大樣本大樣本的統(tǒng)計(jì)推斷問題。的統(tǒng)計(jì)推斷問題。幾個(gè)常用統(tǒng)計(jì)量的分布幾個(gè)常用統(tǒng)計(jì)量的分布(1 1)2分分布布nXXX,21N N(0 0,1 1),則稱統(tǒng)計(jì)量),則稱統(tǒng)計(jì)量222212nXXX服從服從自由度自由度為為n n的的2分布,記為分布,記為)(22n自由度自由度為上式右端包含的為上式右端包含的獨(dú)立變量的個(gè)數(shù)獨(dú)立變量的個(gè)數(shù)。設(shè)設(shè)概率密度概率密度圖形圖形。 2分布的分布的可加性可加性:設(shè):設(shè) ,22221221n
6、n并且并且2221,獨(dú)立,則有:獨(dú)立,則有: .2122221nn 分布的分布的數(shù)學(xué)期望數(shù)學(xué)期望和和方差方差:若若)(22n.2)(,22nDnE22分布的分布的分位點(diǎn)分位點(diǎn): 222axadyyfnP表只詳列到表只詳列到n n=45=45為止。為止。費(fèi)歇費(fèi)歇曾證明,當(dāng)曾證明,當(dāng)n n充分大時(shí),近似地有:充分大時(shí),近似地有: ,122122nZna(2 2)t t 分布分布 設(shè)設(shè)),(),1 , 0(2nYNX且且X,YX,Y獨(dú)立,則稱隨機(jī)變量:獨(dú)立,則稱隨機(jī)變量: nYXt/服從服從自由度為自由度為n n的的t t分布分布,記為,記為t tt(nt(n) )。 圖形圖形關(guān)于關(guān)于t=0t=0對(duì)
7、稱,當(dāng)對(duì)稱,當(dāng)n n充分大時(shí)充分大時(shí)其圖形類其圖形類似于似于標(biāo)準(zhǔn)正態(tài)標(biāo)準(zhǔn)正態(tài)概率密度的圖形。概率密度的圖形。 t t分布的分布的分位點(diǎn):分位點(diǎn): )()()(ntadtthnttP由圖形的由圖形的對(duì)稱性對(duì)稱性知知)()(1ntntaa45naaznt)((3 3)F F分布分布 設(shè)設(shè),2212nVnU且且VU ,獨(dú)立,則稱隨機(jī)變量獨(dú)立,則稱隨機(jī)變量21/nVnUF 服從自由度為服從自由度為21,nn的的F F分布分布,記為,記為),(21nnFF),(21nnF 的的圖形圖形。由定義可知。由定義可知1212,/1nnFnUnVFF F分布的分布的分位點(diǎn)分位點(diǎn) dyynnFFPaFnnn21,2
8、1),(.),(1),(12211nnFnnFaa定理定理一:設(shè)一:設(shè)nXXX,21是來自正態(tài)總體是來自正態(tài)總體2,N的樣本,的樣本,X是樣本均值,則有:是樣本均值,則有:nNX/,2(4 4)正態(tài)總體正態(tài)總體的樣本均值與樣本方差的的樣本均值與樣本方差的抽樣分布抽樣分布 定理定理二:設(shè)二:設(shè)nXXX,21是總體是總體2,N的樣本,的樣本,X, ,2S分別是樣本均值和樣本方差,分別是樣本均值和樣本方差,;11222nSn2 2X與與2S獨(dú)立。獨(dú)立。 則有:則有:1 定理定理三:設(shè)三:設(shè)nXXX,21是總體是總體2,N的樣本,的樣本,X, ,2S分別是樣本均值和樣本方差,分別是樣本均值和樣本方差,
9、.1/ntnSX則有:則有:定理定理四:設(shè)四:設(shè)21,2121nnYYYXXX與分別是來自正態(tài)總體分別是來自正態(tài)總體222211,NN和的樣本,且這兩個(gè)樣本相互獨(dú)立。設(shè)的樣本,且這兩個(gè)樣本相互獨(dú)立。設(shè)2112111,1niiniiYnYXnX分別是這兩個(gè)樣本的樣本均值,分別是這兩個(gè)樣本的樣本均值,21122222112111,11niiniiYYnSXXnS分別是這兩個(gè)樣本的樣本方差,則有分別是這兩個(gè)樣本的樣本方差,則有 1 1;1, 1/2122212221nnFSS 2 2,22121當(dāng),211212121nntnnSYXw其中其中 .,2112212222112wwwSSnnSnSnS例
10、例 設(shè)總體設(shè)總體X X服從正態(tài)分布服從正態(tài)分布),2 , 0(2N1521,XXX是來自總體是來自總體X X的簡單隨機(jī)樣本,則隨機(jī)變量的簡單隨機(jī)樣本,則隨機(jī)變量)(221521121021XXXXY服從服從什么什么分布,自由度是多少。分布,自由度是多少。 分析分析 根據(jù)簡單隨機(jī)樣本的性質(zhì)根據(jù)簡單隨機(jī)樣本的性質(zhì),151,XX相互獨(dú)立,服從同分布相互獨(dú)立,服從同分布),2 , 0(2N易見易見21521121021XXXX與也相互獨(dú)立,并且由于也相互獨(dú)立,并且由于),2 , 0(2NXi故故2152112210212102)2()2(),10()(41)2()2(XXXXXXi)5()(41221
11、5211XX從而有從而有)5 ,10(25/ )(4110/ )(412152112102121521121021FXXXXXXXX即即)5 ,10( FY 估計(jì)量優(yōu)良性常用的幾條估計(jì)量優(yōu)良性常用的幾條標(biāo)準(zhǔn)標(biāo)準(zhǔn): 無偏心無偏心、有效性有效性、相合性相合性。 (1 1)無偏性無偏性 ,E 21DD(2)有效性有效性(3)相合性相合性1limnP第七章第七章 參數(shù)估計(jì)參數(shù)估計(jì)兩種基本方法兩種基本方法:點(diǎn)估計(jì)點(diǎn)估計(jì)、區(qū)間估計(jì)區(qū)間估計(jì)。 X是總體均值是總體均值樣本樣本方差方差 21211niiXXnS是總體方差是總體方差 2 2的無偏估計(jì)。的無偏估計(jì)。 樣本樣本均值均值的無偏估計(jì);的無偏估計(jì);樣本二階
12、中心矩樣本二階中心矩niiXXn121不是不是 2 2的無偏估計(jì),的無偏估計(jì),S S也不是也不是 的無偏估計(jì)。的無偏估計(jì)。 最小方差無偏估計(jì)最小方差無偏估計(jì): ,E為為),()(DD的任一無偏估計(jì)。的任一無偏估計(jì)。 尋求尋求估計(jì)量的方法估計(jì)量的方法: : 矩估計(jì)法矩估計(jì)法 最大似然估計(jì)法最大似然估計(jì)法 (1 1)矩估計(jì)法矩估計(jì)法: : 用用樣本各階矩去估計(jì)總體各階矩樣本各階矩去估計(jì)總體各階矩。概率密度為概率密度為),;(21kxfpxXP),;(21kx分布律為分布律為它的前它的前k k階矩階矩k,21.,2121222111kkkkk可以解出可以解出k,21.,2121222111kkkkk
13、以以樣本矩樣本矩iA分別代替上式中的分別代替上式中的kii, 2 , 1,就有就有kiAAAkii, 2 , 1,21分別作為分別作為kii, 2 , 1, 的估計(jì)量。的估計(jì)量。例例5 5:設(shè)總體:設(shè)總體X X的均值的均值2及方差都存在,且有都存在,且有02。但。但2,均為未知,又設(shè)均為未知,又設(shè)nXXX,21是來自總體是來自總體X X的一個(gè)樣本,求的一個(gè)樣本,求2,的的矩估計(jì)量矩估計(jì)量。 解:總體一階矩:解:總體一階矩: XE1總體二階矩:總體二階矩: 22222XEXDXE由矩法,由矩法,用樣本矩去估計(jì)總體矩用樣本矩去估計(jì)總體矩,令,令: : A A1 1 222A解得:解得:niniii
14、XXnXXnAAXA1122221221.11, 所得結(jié)果表明,所得結(jié)果表明,總體均值總體均值與與方差方差的的矩估矩估計(jì)量計(jì)量的表達(dá)式的表達(dá)式不因總體分布不同而異不因總體分布不同而異。 總結(jié)總結(jié):l 矩估計(jì)法的矩估計(jì)法的優(yōu)點(diǎn)優(yōu)點(diǎn)是簡便易行,并是簡便易行,并不需要事先知道不需要事先知道 總體的分布總體的分布;l 缺點(diǎn)缺點(diǎn)是:在總體分布類型已知的場合,沒有充分是:在總體分布類型已知的場合,沒有充分 利用分布提供的信息。利用分布提供的信息。l 一般場合下,矩估計(jì)量一般場合下,矩估計(jì)量不具有唯一性不具有唯一性。 由費(fèi)希爾(由費(fèi)希爾(R.A.FisherR.A.Fisher)引進(jìn)的最大似然估計(jì)法,就是固
15、)引進(jìn)的最大似然估計(jì)法,就是固定樣本觀察值定樣本觀察值nxxx,21,在,在取值的可能范圍取值的可能范圍內(nèi)挑選內(nèi)挑選使似然函數(shù)使似然函數(shù);,21nxxxL達(dá)到最大達(dá)到最大的參數(shù)值的參數(shù)值,作為參數(shù),作為參數(shù)的估計(jì)值,即取的估計(jì)值,即取使使.;,max;,2121nnxxxLxxxLnxxx,21稱為參數(shù)稱為參數(shù)的的最大似然估計(jì)值最大似然估計(jì)值,而相應(yīng)的統(tǒng)計(jì)量,而相應(yīng)的統(tǒng)計(jì)量nXXX,21稱為參數(shù)稱為參數(shù)的的最大似然估計(jì)量最大似然估計(jì)量。 (2)最大似然估計(jì)法最大似然估計(jì)法 設(shè)設(shè)nXXX,21是來自總體是來自總體X X的一個(gè)樣本,則的一個(gè)樣本,則nXXX,21的的聯(lián)合密度聯(lián)合密度為:為:niix
16、f1,設(shè)設(shè)nxxx,21是相應(yīng)于樣本是相應(yīng)于樣本nXXX,21的一個(gè)樣本值,則隨機(jī)點(diǎn)的一個(gè)樣本值,則隨機(jī)點(diǎn)),(21nXXX落在點(diǎn)落在點(diǎn)),(21nxxx的鄰域(邊長分別為的鄰域(邊長分別為ndxdxdx,21的的n n維立方體)內(nèi)的概率近似地為維立方體)內(nèi)的概率近似地為.;1iniidxxf其值隨其值隨的取值而變化。與離散型的情況一樣,取的取值而變化。與離散型的情況一樣,取的估計(jì)值的估計(jì)值使使概率取到最大值概率取到最大值。 niinxfxxxLL121;,的最大值。這里的最大值。這里 L稱為樣本的稱為樣本的似然函數(shù)似然函數(shù)。若:。若:,;,max;,2121nnxxxLxxxL則稱則稱nxx
17、x,21為為的的最大似然估計(jì)值最大似然估計(jì)值,稱,稱nXXX,21為為的的最大似然估計(jì)量最大似然估計(jì)量。考慮函數(shù):考慮函數(shù):可從方程:可從方程: 0Ldd解得。解得。也可以從方程:也可以從方程: 0lnLdd求得。求得。從后一方程求解往往比較方便從后一方程求解往往比較方便,稱為,稱為對(duì)數(shù)似對(duì)數(shù)似然方程然方程。 例:設(shè)例:設(shè)nXXXpbX,., 121試求參數(shù)試求參數(shù)P P的最大似然估計(jì)量。的最大似然估計(jì)量。nxxx,21是樣本是樣本nXXX,21的一個(gè)樣本值。的一個(gè)樣本值。X X的分布律為:的分布律為:. 1 , 0,11xppxXPxx似然函數(shù)似然函數(shù)為:為: niiniiiixnxxnix
18、pppppL11)1 (111取對(duì)數(shù)取對(duì)數(shù) ,1lnlnln11pxnpxpLniinii是來自總體是來自總體X的一個(gè)樣本,的一個(gè)樣本,解:設(shè)解:設(shè)令令 , 01ln11pxnpxpLdpdniinii解得解得p p的最大似然估計(jì)值:的最大似然估計(jì)值:.11xxnpniip p的最大似然估計(jì)量為:的最大似然估計(jì)量為:.11XXnpnii這一估計(jì)量與矩估計(jì)量是相同的。這一估計(jì)量與矩估計(jì)量是相同的。例:設(shè)例:設(shè)22,NX為未知參數(shù)為未知參數(shù)nxxx,21是來自總體是來自總體X X的一個(gè)樣本值。求的一個(gè)樣本值。求2,的最大似然估計(jì)量。的最大似然估計(jì)量。解:解:X X的概率密度為:的概率密度為:,21
19、exp21,;222xxf似然函數(shù)為:似然函數(shù)為:.21exp221exp21,1222/22/2212niinninixxL取對(duì)數(shù)取對(duì)數(shù) niixnnL1222.21ln22ln2ln令令 niiniixnLnxL12222212. 0212ln, 01ln解得解得niixxn1/1212/1niixxn得得2,的最大似然估計(jì)量為:的最大似然估計(jì)量為:niiXXnAX1222.1,它們與相應(yīng)的矩估計(jì)量相同。它們與相應(yīng)的矩估計(jì)量相同。 求最大似然估計(jì)值的求最大似然估計(jì)值的一般步驟一般步驟是:是:1.1.由總體分布導(dǎo)出樣本的由總體分布導(dǎo)出樣本的聯(lián)合分布律函數(shù)聯(lián)合分布律函數(shù)(或聯(lián)合概率密(或聯(lián)合概
20、率密 度);度);2.2.把樣本聯(lián)合分布律函數(shù)(或聯(lián)合概率密度)中自變量看把樣本聯(lián)合分布律函數(shù)(或聯(lián)合概率密度)中自變量看 成已知常數(shù),而把參數(shù)成已知常數(shù),而把參數(shù)看作自變量,得到似然函數(shù)看作自變量,得到似然函數(shù) L3.3.求似然函數(shù)求似然函數(shù) L的的最大值點(diǎn)最大值點(diǎn)(常常轉(zhuǎn)化為求(常常轉(zhuǎn)化為求 Lln 的最大值點(diǎn));的最大值點(diǎn));4.在最大值點(diǎn)的表達(dá)式中,用樣本值代入就得參數(shù)的最在最大值點(diǎn)的表達(dá)式中,用樣本值代入就得參數(shù)的最 大似然估計(jì)值。大似然估計(jì)值。 一般,用一般,用最大似然法最大似然法所得的估計(jì)的性質(zhì)所得的估計(jì)的性質(zhì)比比用用矩法矩法所得的要好,故通常多用最大似然法。所得的要好,故通常多
21、用最大似然法。 由所有產(chǎn)品的失效時(shí)間由所有產(chǎn)品的失效時(shí)間nttt210所組成的樣本。所組成的樣本。完全樣本完全樣本:2 基于基于截尾樣本截尾樣本的最大似然估計(jì)的最大似然估計(jì) 常用的常用的兩種兩種截尾壽命試驗(yàn):截尾壽命試驗(yàn):1.1.一種是一種是定時(shí)定時(shí)截尾壽命試驗(yàn)截尾壽命試驗(yàn),0021ttttm此時(shí)此時(shí)mm是一個(gè)是一個(gè)隨機(jī)變量隨機(jī)變量,所得的樣本,所得的樣本mttt,21稱為稱為定時(shí)截尾樣本定時(shí)截尾樣本。 2. 2. 另一種是另一種是定數(shù)定數(shù)截尾壽命試驗(yàn)截尾壽命試驗(yàn),21mttto所得的樣本所得的樣本mttt,21稱為稱為定數(shù)截尾樣本定數(shù)截尾樣本。 有二個(gè)要求有二個(gè)要求:1.1.要求要求以以很大
22、的可能很大的可能被包含在區(qū)間被包含在區(qū)間,P2.2.估計(jì)的估計(jì)的精度精度要要盡可能高盡可能高,即要求,即要求區(qū)間的長度區(qū)間的長度內(nèi),即:概率內(nèi),即:概率要要盡可能大盡可能大。盡可能小盡可能小。3 3 區(qū)間估計(jì)區(qū)間估計(jì) 置信區(qū)間置信區(qū)間: ,1,2121nnXXXXXXP稱稱隨機(jī)隨機(jī)區(qū)間區(qū)間,是是的的置信水平置信水平為為1的的置信區(qū)間置信區(qū)間。 和和置信和置信上限上限,1稱為稱為置信水平置信水平。 分別稱為分別稱為雙側(cè)置信區(qū)間雙側(cè)置信區(qū)間的置信的置信下限下限l 可以得到未知參數(shù)的可以得到未知參數(shù)的任何任何置信水平置信水平小于小于1 1的置信區(qū)的置信區(qū) 間間l 置信水平置信水平愈高愈高,相應(yīng)的區(qū)間
23、平均長度,相應(yīng)的區(qū)間平均長度愈長愈長(在(在 同樣的樣本容量下)。同樣的樣本容量下)。l 在在同樣同樣的置信水平下,樣本容量的置信水平下,樣本容量愈大愈大,區(qū)間平均長,區(qū)間平均長 度度愈短愈短。 求置信區(qū)間的求置信區(qū)間的步驟步驟如下:如下:1.1.明確問題,求明確問題,求什么參數(shù)什么參數(shù)的置信區(qū)間?的置信區(qū)間?置信水平置信水平1 是多少?是多少?2.2.尋找尋找參數(shù)的一個(gè)良好的參數(shù)的一個(gè)良好的點(diǎn)估計(jì)點(diǎn)估計(jì)WW。3.3.尋找(或?qū)ふ遥ɑ驑?gòu)造構(gòu)造)一個(gè))一個(gè)待估待估參數(shù)參數(shù) 和和估計(jì)量估計(jì)量WW的的函數(shù)函數(shù) S(W, ),S(W, ),其其分布為已知分布為已知,并且,并且不依賴于任何未知數(shù)。不依賴
24、于任何未知數(shù)。 稱稱S(W, )S(W, )為為樞軸量樞軸量。如。如 .1 , 0/NnX4. 4. 對(duì)于給定的置信水平對(duì)于給定的置信水平1分布,確定常數(shù)分布,確定常數(shù)a,ba,b使得使得1),(bWSaP5.5.對(duì)對(duì)“bWSa),(”作作等價(jià)變形等價(jià)變形,得到如下形式:,得到如下形式:1),(),(2121nnXXXXXXP則則,就是參數(shù)就是參數(shù)的置信水平為的置信水平為1,根據(jù),根據(jù)S(W, )S(W, )的的的的置信區(qū)間置信區(qū)間。4 4 正態(tài)總體正態(tài)總體均值與方差的區(qū)間估計(jì)均值與方差的區(qū)間估計(jì)(一)(一)單個(gè)單個(gè)總體總體2,N1 1均值均值(1 1)22/aznX的情況的情況的置信區(qū)間的置
25、信區(qū)間為已知為已知.1 , 0/NnX,1/2/aznXPa(2 2)2考慮到考慮到2S是是2的的無偏估計(jì)無偏估計(jì),將上式中的,將上式中的換成換成2SS ,取,取樞軸量樞軸量1/ntnSX對(duì)給定的置信水平對(duì)給定的置信水平1,查,查t t分布分位數(shù)表的分布分位數(shù)表的2/t使使antnSXPa11/2/為未知為未知即即antnSXntnSXPaa1) 1() 1(2/2/于是,得到了于是,得到了的一個(gè)置信水平為的一個(gè)置信水平為a1的的置信區(qū)間置信區(qū)間.) 1(),1(2/2/ntnSXntnSXaa或或).1(2/ntnSXa在實(shí)際問題中,總體方差在實(shí)際問題中,總體方差2未知的情況居多。未知的情況
26、居多。(3 3)總體分布未知,但)總體分布未知,但樣本容量樣本容量n n很大很大此時(shí)由中心極限定理,知此時(shí)由中心極限定理,知nX/因此若總體方差因此若總體方差2已知時(shí),得到已知時(shí),得到的一個(gè)置信水平為的一個(gè)置信水平為a1的近似置信區(qū)間的近似置信區(qū)間.,2/2/aaznXznX但但一般未知,用一般未知,用S S近似代替,這樣得到近似代替,這樣得到的一個(gè)置信水平為的一個(gè)置信水平為a1的近似置信區(qū)間的近似置信區(qū)間.,2/2/aaznSXznSX近似服從近似服從N(0,1)2 2方差方差2例:設(shè)例:設(shè)nXXX,21為總體為總體2,N的樣本,的樣本,未知,求參數(shù)未知,求參數(shù)2的置信水平為的置信水平為1
27、解:解:2的無偏點(diǎn)估計(jì)為樣本方差的無偏點(diǎn)估計(jì)為樣本方差S S2 2。已知。已知) 1(1222nSn的置信區(qū)間的置信區(qū)間的置信區(qū)間。的置信區(qū)間。對(duì)給定的置信水平對(duì)給定的置信水平1,查,查2分布上分布上分位點(diǎn)分位點(diǎn)表可得表可得) 1(2/21na) 1(22/naanSnnPaa1) 1(1) 1(22/222/21即即anSnnSnPaa1) 1(1) 1(122/222/212得到方差得到方差2的一個(gè)置信水平為的一個(gè)置信水平為a1的的置信區(qū)間置信區(qū)間) 1(1,) 1(12/21222/2nSnnSnaa標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的一個(gè)置信水平為的一個(gè)置信水平為a1的置信區(qū)間的置信區(qū)間) 1(1,) 1(
28、122/122/nSnnSnaa(二)(二)兩個(gè)總體兩個(gè)總體222211,NN1 1兩個(gè)兩個(gè)總體均值差總體均值差21的情況的情況 的置信區(qū)間的置信區(qū)間具體步驟為:具體步驟為: (1) (1) 兩總體均為正態(tài),兩總體均為正態(tài),2221,設(shè)設(shè)222211,NYNX,YX,分別為分別為21,的無偏估計(jì),故的無偏估計(jì),故21的的無偏估計(jì)量無偏估計(jì)量是是YX 由由YX,的獨(dú)立性以及的獨(dú)立性以及22221211/,/,nNYnNX得:得:22212121,nnNYX或或 ),1 ,0(22212121NnnYX已知已知。對(duì)給定的置信水平對(duì)給定的置信水平1 1,查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表得,查標(biāo)準(zhǔn)正態(tài)分布函數(shù)表得
29、2/Z使使12/22212121ZnnYXP即得即得21的一個(gè)置信水平為的一個(gè)置信水平為1 1的的置信區(qū)間置信區(qū)間:.2221212/nnZYXa(2) (2) 兩總體均為正態(tài),兩總體均為正態(tài),,22221但但2為為未知未知。 ).2(11212121nntnnSYXw其中,其中,.,2112212222112wwwSSnnSnSnS從而可得從而可得21的一個(gè)置信水平為的一個(gè)置信水平為1 1的的置信區(qū)間置信區(qū)間為:為: .11221212/nnSnntYXwa (3) (3) 兩兩總體分布未知總體分布未知,但,但21,nn用用222121/nSnS去估計(jì)去估計(jì)222121nn根據(jù)中心極限定理,
30、近似有根據(jù)中心極限定理,近似有),1 , 0(22212121NnSnSYX類似可得類似可得21的一個(gè)置信水平為的一個(gè)置信水平為1 1的的近似置信區(qū)間近似置信區(qū)間為:為:.2221212/nSnSZYXa很大。很大。2 2兩個(gè)總體兩個(gè)總體方差比方差比2221/由第六章定理四:由第六章定理四:,1, 1/2122212221nnFSS不依賴任何未知參數(shù)。由此得:不依賴任何未知參數(shù)。由此得:,11, 1/) 1, 1(212/22212221212/1annFSSnnFPaa即:即:1.1, 111, 11212/122212221212/2221nnFSSnnFSSPaa的置信區(qū)間的置信區(qū)間對(duì)于
31、任意對(duì)于任意滿足滿足1P隨機(jī)區(qū)間隨機(jī)區(qū)間,是是的置信水平為的置信水平為a1的單側(cè)置信區(qū)間,的單側(cè)置信區(qū)間,稱為稱為的置信水平為的置信水平為a1的的單側(cè)置信下限單側(cè)置信下限。 6 單側(cè)置信區(qū)間單側(cè)置信區(qū)間又若統(tǒng)計(jì)量又若統(tǒng)計(jì)量nXXX,21,對(duì)于任意,對(duì)于任意滿足滿足1P稱隨機(jī)區(qū)間稱隨機(jī)區(qū)間,是是的置信水平為的置信水平為a1的單側(cè)置信區(qū)間,的單側(cè)置信區(qū)間,稱為稱為的置信水平為的置信水平為a1的的單側(cè)置信上限單側(cè)置信上限。 概率反證法的概率反證法的邏輯邏輯是:假設(shè)原假設(shè)成立,如果小概率是:假設(shè)原假設(shè)成立,如果小概率事件在一次試驗(yàn)中發(fā)生,就可以有很大的把握否定原假設(shè)。事件在一次試驗(yàn)中發(fā)生,就可以有很大
32、的把握否定原假設(shè)。 在假設(shè)檢驗(yàn)中,稱這個(gè)在假設(shè)檢驗(yàn)中,稱這個(gè)小概率小概率為為顯著性水平顯著性水平。第八章第八章 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) 具體有具體有兩類假設(shè)檢驗(yàn)兩類假設(shè)檢驗(yàn)問題:問題:(1 1)對(duì)參數(shù)的假設(shè)檢驗(yàn)對(duì)參數(shù)的假設(shè)檢驗(yàn)。(2 2)對(duì)總體分布的假設(shè)檢驗(yàn)對(duì)總體分布的假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)的假設(shè)檢驗(yàn)的一般步驟一般步驟:(1 1)提出提出原假設(shè)原假設(shè)0H及備擇假設(shè)(對(duì)立假設(shè))及備擇假設(shè)(對(duì)立假設(shè))1H(2 2)選取選取一個(gè)適當(dāng)?shù)囊粋€(gè)適當(dāng)?shù)慕y(tǒng)計(jì)量統(tǒng)計(jì)量T T,在,在0H(3 3)根據(jù)給定)根據(jù)給定顯著性水平顯著性水平(4 4)算出統(tǒng)計(jì)量)算出統(tǒng)計(jì)量T T的的實(shí)測值實(shí)測值,將實(shí)測值與拒絕域,將實(shí)測值與拒絕域
33、對(duì)照對(duì)照 ,若實(shí)測值落入拒絕域,則否定原假設(shè),若實(shí)測值落入拒絕域,則否定原假設(shè)0H否則,就認(rèn)為差異不顯著而不能否定原假設(shè)。否則,就認(rèn)為差異不顯著而不能否定原假設(shè)。 成立的條件下成立的條件下求出它的分布(或近似分布);求出它的分布(或近似分布);,求出,求出拒絕域拒絕域C C;兩類錯(cuò)誤兩類錯(cuò)誤及其概率及其概率 第一類錯(cuò)誤第一類錯(cuò)誤:為真否定00HHP第二類錯(cuò)誤第二類錯(cuò)誤:第二類錯(cuò)誤為假不否定PHHP00 顯著性檢驗(yàn)顯著性檢驗(yàn) 控制犯第控制犯第1 1類錯(cuò)誤的概率加以,類錯(cuò)誤的概率加以,使它不大于使它不大于 ,而而不考慮犯第不考慮犯第II II類錯(cuò)誤的概率的檢驗(yàn),稱為類錯(cuò)誤的概率的檢驗(yàn),稱為顯著性檢
34、驗(yàn)顯著性檢驗(yàn)。 不管在什么情況下,為了保證不管在什么情況下,為了保證都都不應(yīng)太小不應(yīng)太小。 不致太大,不致太大,樣本容量樣本容量 雙側(cè)雙側(cè)檢驗(yàn)與檢驗(yàn)與單側(cè)單側(cè)檢驗(yàn)檢驗(yàn) 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) 0100:,:HH其中,其中,1H表示表示可能大于可能大于0,也可能小于,也可能小于0的的拒絕域分別在兩側(cè)拒絕域分別在兩側(cè)。在上述例。在上述例1 1中,拒絕域?yàn)橹?,拒絕域?yàn)椋?/Z),),(2/Z,在很多情況下,會(huì)提出如下形式的原假設(shè):在很多情況下,會(huì)提出如下形式的原假設(shè):0000:,:HH或?qū)?yīng)的備擇假設(shè)是對(duì)應(yīng)的備擇假設(shè)是0101:,:HH或稱這類假設(shè)檢驗(yàn)為稱這類假設(shè)檢驗(yàn)為單側(cè)單側(cè)假設(shè)檢驗(yàn)或假設(shè)檢驗(yàn)或單邊單邊
35、假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)。 ,這類檢驗(yàn),這類檢驗(yàn)(),),稱這類假設(shè)檢驗(yàn)為稱這類假設(shè)檢驗(yàn)為雙側(cè)雙側(cè)假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)。正態(tài)總體均值、方差的檢驗(yàn)法(顯著性水平為正態(tài)總體均值、方差的檢驗(yàn)法(顯著性水平為)已知2000nXZ/00002/aaazzzzzz未知2000nSXt/0000) 1(112/nttnttnttaaa已知2221212121,222121nnYXZ2121212/aaazzzzzz原假設(shè)原假設(shè)H H0 0檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量備擇假設(shè)備擇假設(shè)H H1 1拒絕域拒絕域原假設(shè)原假設(shè)H H0 0檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量備擇假設(shè)備擇假設(shè)H H1 1拒絕域拒絕域未知2222121212121111
36、21222211221nnSnSnSnnSYXtww212121)2(22212/2121nnttnnttnnttaaa未知2022022022022) 1(Sn 202202202111122/1222/221222nnnnaaaa或未知21222122212221,2221SSF 2222222221111, 11, 11, 11, 1212/1212/21121nnFFnnFFnnFFnnFFaaaa或)(000成對(duì)數(shù)據(jù)DDDnSDtD/0000DDD) 1() 1() 1(2/nttnttnttaaa例題例題:例例1 1:某種元件的壽命:某種元件的壽命X X(以小時(shí)計(jì))服從正態(tài)分布(以
37、小時(shí)計(jì))服從正態(tài)分布22,),(N159 280 101 212 224 379 179 264159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170222 362 168 250 149 260 485 170問是否有理由認(rèn)為元件的平均壽命大于問是否有理由認(rèn)為元件的平均壽命大于225225(小時(shí))?(小時(shí))?(05. 0解:檢驗(yàn)假設(shè)(原假設(shè)取與題意相反的假設(shè))解:檢驗(yàn)假設(shè)(原假設(shè)取與題意相反的假設(shè)).225:,225:100HH因?yàn)橐驗(yàn)?,均未知均未知,用,用t t檢驗(yàn)法檢驗(yàn)法,其拒絕域?yàn)椋?,其拒絕域?yàn)椋?1/0ntnsx
38、ta均未知。現(xiàn)測得均未知?,F(xiàn)測得16只元件的壽命如下:只元件的壽命如下:).7531. 1)15(,1605. 0tn算得算得,7259.98, 5 .241sx即有:即有:.7531. 16685. 0/0nsxt t t沒有落在拒絕域中,故接受沒有落在拒絕域中,故接受HH0 0,即認(rèn)為元件的平,即認(rèn)為元件的平均壽命不大于均壽命不大于225225小時(shí)。小時(shí)。 3 3 分布擬合檢驗(yàn)分布擬合檢驗(yàn)l 皮爾遜皮爾遜的的2l 專用于專用于檢驗(yàn)分布是否檢驗(yàn)分布是否為為正態(tài)正態(tài)的的“偏度、峰度檢驗(yàn)法偏度、峰度檢驗(yàn)法”。 檢驗(yàn)法檢驗(yàn)法(一)(一)2檢驗(yàn)法檢驗(yàn)法2檢驗(yàn)法是在總體的檢驗(yàn)法是在總體的分布未知分布未
39、知時(shí),根據(jù)它的時(shí),根據(jù)它的n n個(gè)樣本個(gè)樣本nXXX,21:0H xF:1H總體總體X X的分布函數(shù)不是的分布函數(shù)不是 xF若總體若總體X X為為離散型離散型,則,則0H: :總體總體X X的的分布律分布律為為., 2 , 1,iptXPii若總體若總體X X為為連續(xù)型連續(xù)型,則,則:0H總體總體X X的的概率密度概率密度為為 xf來檢驗(yàn)總體分布假設(shè)的一種方法。來檢驗(yàn)總體分布假設(shè)的一種方法。原假設(shè)為:原假設(shè)為:總體總體X的的分布函數(shù)分布函數(shù)為為(可以不寫出)(可以不寫出)分布擬合的分布擬合的2(1 1)將總體)將總體X X的可能取值范圍或全體的可能取值范圍或全體的小區(qū)間或子集,記作的小區(qū)間或子
40、集,記作.,21kAAA(2 2)把)把落入落入第第i i個(gè)小區(qū)間個(gè)小區(qū)間iA的樣本值的的樣本值的個(gè)數(shù)個(gè)數(shù)記作記作), 2 , 1(kifi稱為稱為實(shí)測頻數(shù)實(shí)測頻數(shù)。所有。所有實(shí)測頻數(shù)實(shí)測頻數(shù)之之和和kfff21(3 3)當(dāng))當(dāng)0H為真時(shí),可以根據(jù)為真時(shí),可以根據(jù)0H計(jì)算事件計(jì)算事件iA的的概率概率,得到,得到kiAPpii, 2 , 1),(,于是,于是inp就是落入就是落入iA的樣本值的的樣本值的理論頻數(shù)理論頻數(shù)。 檢驗(yàn)法檢驗(yàn)法基本思想基本思想和和步驟步驟如下:如下:分成分成k個(gè)個(gè)互不重迭互不重迭等于樣本等于樣本容量容量n。所假設(shè)的所假設(shè)的X的分布函數(shù)來的分布函數(shù)來顯然,顯然,實(shí)測頻數(shù)實(shí)測
41、頻數(shù)if與與理論頻數(shù)理論頻數(shù)inp 皮爾遜皮爾遜引進(jìn)了如下引進(jìn)了如下統(tǒng)計(jì)量統(tǒng)計(jì)量表示經(jīng)驗(yàn)分布與理論分布表示經(jīng)驗(yàn)分布與理論分布之間的差異:之間的差異:kiiiinpnpf122)(其中其中if是是隨機(jī)變量隨機(jī)變量,在理論分布已給定的情況下,在理論分布已給定的情況下,inp之間的之間的差差標(biāo)志著標(biāo)志著經(jīng)驗(yàn)分布經(jīng)驗(yàn)分布與與理論分布理論分布之間的之間的差異差異的大小。的大小。是是常量常量。皮爾遜證明了如下皮爾遜證明了如下定理定理: 如原假設(shè)中的理論分布如原假設(shè)中的理論分布)(xF已經(jīng)完全給定,那么當(dāng)已經(jīng)完全給定,那么當(dāng)n時(shí),統(tǒng)計(jì)量時(shí),統(tǒng)計(jì)量kiiiiikiiiiiikiiiinpfnpfnpnpnpf
42、fnpnpf121221222)(2)( kiikikikiiiiiiiiiifnpffnpfnfnfnpf11112222nnpfkiii12的分布的分布近似服從近似服從) 1( k個(gè)個(gè)自由度自由度的的2分布。分布。 如果理論分布如果理論分布)(xF估計(jì)量來代替(一般估計(jì)量來代替(一般用最大似然估計(jì)值用最大似然估計(jì)值來代替)。那么當(dāng)來代替)。那么當(dāng)n時(shí),統(tǒng)計(jì)量時(shí),統(tǒng)計(jì)量2的分布近似服從的分布近似服從) 1(rk由度的由度的2根據(jù)這個(gè)定理,對(duì)于給定的根據(jù)這個(gè)定理,對(duì)于給定的顯著性水平顯著性水平a,查,查2分布分位數(shù)表可得臨界值分布分位數(shù)表可得臨界值2,使得,使得22aP即即22a122rka中
43、有中有r個(gè)未知參數(shù)個(gè)未知參數(shù),則需用相應(yīng)的,則需用相應(yīng)的個(gè)自個(gè)自分布。分布。為小概率事件。為小概率事件。得得拒絕域拒絕域?yàn)闉楦鶕?jù)所給樣本值根據(jù)所給樣本值nXXX,21計(jì)算計(jì)算2,如果,如果2的值大于的值大于2,則否定假設(shè),則否定假設(shè)0H;否則認(rèn)為差異不夠顯著而接受;否則認(rèn)為差異不夠顯著而接受0H。這就是。這就是2注意注意,皮爾遜定理是在,皮爾遜定理是在n n無限大時(shí)無限大時(shí)推導(dǎo)出來的,因而在使用推導(dǎo)出來的,因而在使用時(shí)要注意時(shí)要注意n n要足夠大要足夠大以及以及iipnnp或根據(jù)計(jì)算根據(jù)計(jì)算實(shí)踐經(jīng)驗(yàn)實(shí)踐經(jīng)驗(yàn),要求,要求50n,以及每一個(gè),以及每一個(gè)iipnnp或都都不小于不小于5 5。iipn
44、np或滿足這個(gè)條件。滿足這個(gè)條件。 擬合檢驗(yàn)法擬合檢驗(yàn)法。不太小不太小這兩個(gè)條件。這兩個(gè)條件。否則應(yīng)適當(dāng)否則應(yīng)適當(dāng)合并合并區(qū)間,使區(qū)間,使 一元回歸分析:一元回歸分析:在回歸分析中,在回歸分析中,變量只有兩個(gè)變量只有兩個(gè); 多元回歸分析:多元回歸分析:變量在二個(gè)以上;變量在二個(gè)以上; 線性回歸:線性回歸:變量間呈線性關(guān)系;變量間呈線性關(guān)系; 非線性回歸:非線性回歸:變量間不具有線性關(guān)系。變量間不具有線性關(guān)系。 回歸分析回歸分析就是研究相關(guān)關(guān)系的一種重要的數(shù)理統(tǒng)計(jì)就是研究相關(guān)關(guān)系的一種重要的數(shù)理統(tǒng)計(jì)方法。即方法。即從數(shù)量的角度去研究這種關(guān)系從數(shù)量的角度去研究這種關(guān)系。第九章第九章 回歸分析與方差
45、分析回歸分析與方差分析1 1一元線性回歸分析一元線性回歸分析 對(duì)一組對(duì)一組X X的值的值nxxx,21Y Y相應(yīng)的觀察值相應(yīng)的觀察值nyyy,21 這這n n對(duì)數(shù)據(jù)可作出一個(gè)對(duì)數(shù)據(jù)可作出一個(gè)散點(diǎn)圖散點(diǎn)圖,可,可直觀地描述直觀地描述兩變量兩變量之間的關(guān)系。根據(jù)散點(diǎn)圖,有以下幾個(gè)問題:之間的關(guān)系。根據(jù)散點(diǎn)圖,有以下幾個(gè)問題:(1 1)兩變量之間的關(guān)系)兩變量之間的關(guān)系是否密切是否密切,或者說能否由,或者說能否由X X來估來估 計(jì)計(jì)Y Y;(2 2)兩變量之間的關(guān)系是呈一條)兩變量之間的關(guān)系是呈一條直線直線還是某種還是某種曲線曲線;(3 3)是否存在)是否存在其他規(guī)律其他規(guī)律。 作獨(dú)立觀察,得到隨機(jī)
46、變量作獨(dú)立觀察,得到隨機(jī)變量,構(gòu)成構(gòu)成n對(duì)數(shù)據(jù)對(duì)數(shù)據(jù)。(一)(一)一元線性回歸一元線性回歸為了研究為了研究x和和y之間的關(guān)系,之間的關(guān)系,假定假定有以下結(jié)構(gòu):有以下結(jié)構(gòu):bxay其中其中a a和和b b是未知常數(shù),稱為是未知常數(shù),稱為回歸系數(shù)回歸系數(shù),得率的影響。得率的影響。 表示表示隨機(jī)因素隨機(jī)因素對(duì)對(duì)實(shí)際中常假定實(shí)際中常假定服從正態(tài)分布服從正態(tài)分布), 0(2N,即,即未知220)(0)(DE通常稱通常稱), 0(,2NbxaY上式表明,上式表明,Y Y由兩部分組成:由兩部分組成:l 一部分是一部分是x x的的線性函數(shù)線性函數(shù)bxal 另一部分另一部分2, 0N是是隨機(jī)誤差隨機(jī)誤差,是人們
47、不可控制的。,是人們不可控制的。 (1.1)為為一元線性回歸模型一元線性回歸模型。bxay回歸方程:回歸方程:),( ,),(),(2211nnYxYxYx),( ,),(),(2211nnyxyxyx該樣本的構(gòu)造可由方程該樣本的構(gòu)造可由方程), 2 , 1(nibxayiii來描述,這里,來描述,這里,i它是不能觀察的。它是不能觀察的。 n次獨(dú)立次獨(dú)立觀察,得一樣本:觀察,得一樣本:對(duì)應(yīng)的對(duì)應(yīng)的樣本值樣本值記為:記為:是是第第i次次觀察時(shí)觀察時(shí)隨機(jī)誤差隨機(jī)誤差所取的值,所取的值, 回歸分析的回歸分析的任務(wù)任務(wù)是利用是利用n n組獨(dú)立觀察數(shù)據(jù)組獨(dú)立觀察數(shù)據(jù)),( ,),(),(2211nnyx
48、yxyx來來估計(jì)估計(jì)a a和和b b, ,以估計(jì)值的以估計(jì)值的b和a代替代替a a,b b,xbay稱其為稱其為經(jīng)驗(yàn)回歸方程經(jīng)驗(yàn)回歸方程。 得回歸方程得回歸方程1 1用用最小二乘法最小二乘法估計(jì)估計(jì)ba,偏差的平方和偏差的平方和niixx12) (最小二乘法認(rèn)為最小二乘法認(rèn)為:尋找尋找x 這就是最小二乘法的基本思想。這就是最小二乘法的基本思想。 ,使上述平方和達(dá)到最小。,使上述平方和達(dá)到最小。對(duì)對(duì)),(yx作了作了n n次觀察或試驗(yàn),得到次觀察或試驗(yàn),得到n n對(duì)數(shù)據(jù)對(duì)數(shù)據(jù)),( ,),(),(2211nnyxyxyx找一條直線找一條直線xbay當(dāng)當(dāng)x取值取值ix時(shí),時(shí),y 應(yīng)取值應(yīng)取值ibx
49、a 而而實(shí)際觀察到的實(shí)際觀察到的為為iy,這樣,形成了,這樣,形成了偏差偏差(圖圖))(iiibxay盡可能地?cái)M合這些數(shù)據(jù)。盡可能地?cái)M合這些數(shù)據(jù)。 根據(jù)最小二乘法思想,類似地提出了如下的根據(jù)最小二乘法思想,類似地提出了如下的目標(biāo)量目標(biāo)量niiibxayQ12)(它是所有它是所有實(shí)測值實(shí)測值iy與與回歸值回歸值iy 設(shè)法求出設(shè)法求出ba,的估計(jì)值的估計(jì)值ba, ,使,使Q得到的回歸直線得到的回歸直線xbay是在所有直線中是在所有直線中Q最小的一條。最小的一條。 的偏差平方和。的偏差平方和。達(dá)到達(dá)到最小最小,由此,由此用求極值法,求出使用求極值法,求出使Q達(dá)到最小的達(dá)到最小的ba, 。即解方程。即
50、解方程niiiiniiixbxaybQbxayaQ11. 02, 02得得,1,111212112111niniiiniiniiiniiniiniiniiniiixbyxnbynaxxyyxxxxnyxyxnb其中:其中:.1,111niiniiynyxnx得到回歸方程得到回歸方程xbay(1.8)為了計(jì)算上的方便,引入下述記號(hào):為了計(jì)算上的方便,引入下述記號(hào):niniiniiiiniiixyniniiniiiyyniniiniiixxyxnyxyyxxSynyyySxnxxxS1111121122121122.1,11這樣,這樣,ba,的估計(jì)值可寫成的估計(jì)值可寫成.11,11bxnynaSS
51、bniiniixxxy(1.10) (1.9)求出回歸方程,求出回歸方程,問題尚未結(jié)束問題尚未結(jié)束。由于。由于xbay是從是從觀察觀察得到的回歸方程,它會(huì)隨觀察結(jié)果的不同而改得到的回歸方程,它會(huì)隨觀察結(jié)果的不同而改變,并且它變,并且它只反映了由只反映了由x的變化引起的的變化引起的y(1 1)回歸方程是否)回歸方程是否有意義有意義?即?即x的變化是否真的對(duì)的變化是否真的對(duì)y(2 2)如果方程真有意義,用它預(yù)測)如果方程真有意義,用它預(yù)測y的偏差能否估計(jì)?的偏差能否估計(jì)? 的變化,的變化,沒有包含誤差項(xiàng)沒有包含誤差項(xiàng)。因此會(huì)問這樣的問題:。因此會(huì)問這樣的問題:有影響?因此,要對(duì)有影響?因此,要對(duì)回
52、歸效果回歸效果作出檢驗(yàn)。作出檢驗(yàn)。時(shí),預(yù)測值與真值時(shí),預(yù)測值與真值2 2回歸方程的回歸方程的顯著性檢驗(yàn)顯著性檢驗(yàn)l 對(duì)任意的一組觀察值對(duì)任意的一組觀察值), 2 , 1)(,(niyxii最小二乘法,最小二乘法,形式上形式上求得求得y對(duì)對(duì)xl 如果如果y與與xl 因此,需要考察因此,需要考察y與與x是否確有線性關(guān)系是否確有線性關(guān)系,這就是,這就是,都可以用,都可以用的回歸方程。的回歸方程。沒有線性關(guān)系,這種形式的回歸沒有線性關(guān)系,這種形式的回歸方程就沒有意義。方程就沒有意義?;貧w效果的檢驗(yàn)問題回歸效果的檢驗(yàn)問題。 2回S與與殘差平方和殘差平方和2S殘niniiiyySyyS112222) (,
53、)(殘回2回Sl 反映了由于反映了由于x的變化引起的的變化引起的y的差異,體現(xiàn)了的差異,體現(xiàn)了x對(duì)對(duì)y的影響;的影響;2S殘l 反映了自變量以外的隨機(jī)因素對(duì)反映了自變量以外的隨機(jī)因素對(duì)y的影響。的影響。22/殘回SS為為xl 若它若它不是顯著地大不是顯著地大,表明所選的,表明所選的x并不是一個(gè)重要的并不是一個(gè)重要的 回歸平方和回歸平方和的影響部分與隨機(jī)因素影響部分的比值的影響部分與隨機(jī)因素影響部分的比值;因素,因素,它的作用與隨機(jī)因素的作用相當(dāng)它的作用與隨機(jī)因素的作用相當(dāng),于是得到的回,于是得到的回歸方程就歸方程就沒有意義沒有意義。 l 如果它如果它顯著地大顯著地大,表明,表明x關(guān)于關(guān)于回歸方
54、程回歸方程的的顯著性檢驗(yàn)問題顯著性檢驗(yàn)問題 可以證明,當(dāng)可以證明,當(dāng)bxaY的關(guān)系中的關(guān)系中b=0b=0時(shí),有時(shí),有2222)2()(,)(nSESE殘回 2)-nF(1,2)-/(nSSF22殘回的作用是顯著地比隨機(jī)因素大,的作用是顯著地比隨機(jī)因素大,這樣方程才這樣方程才有意義有意義。b是否等于是否等于0的檢驗(yàn)問題的檢驗(yàn)問題用用2222SS2)-(n2)-/(nSSF殘回殘回來檢驗(yàn)來檢驗(yàn)b b的絕對(duì)值是否大于的絕對(duì)值是否大于0 0; ;或者說檢驗(yàn)回歸方程或者說檢驗(yàn)回歸方程xbay給定顯著性水平給定顯著性水平便可判斷回歸方程是否有意義。即要檢驗(yàn)假設(shè)便可判斷回歸方程是否有意義。即要檢驗(yàn)假設(shè). 0
55、:, 0:10bHbH檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量為為)2, 1 (SS2)-(n2)-/(nSSF2222nF殘回殘回是否有意義。是否有意義。,查,查F分布分位數(shù)表,求出分布分位數(shù)表,求出否定域否定域,拒絕域?yàn)榫芙^域?yàn)?2, 1 (nFF xyniniiiSbxxbyyS2112222) ()(回 xyyyniiSbSSSyyS) (22122回總殘也也可用可用t t檢驗(yàn)法檢驗(yàn)法來檢驗(yàn)回歸方程是否有意義,假設(shè)來檢驗(yàn)回歸方程是否有意義,假設(shè). 0:, 0:10bHbH./,2xxSbNb),2(222222nSn殘且且b與與2殘S獨(dú)立(見附錄獨(dú)立(見附錄5 5),故有),故有),()2(2/222sn
56、tnnSbbxx即即).2(ntSbbxx這里這里.2又又使用使用t檢驗(yàn)法檢驗(yàn)法來進(jìn)行檢驗(yàn)。有(見附錄來進(jìn)行檢驗(yàn)。有(見附錄2):):當(dāng)當(dāng)H H0 0為真時(shí)為真時(shí)b=0b=0,此時(shí),此時(shí)),2(ntSbtxx即得即得H H0 0的拒絕域?yàn)榈木芙^域?yàn)?22/ntSbtaxx當(dāng)假設(shè)當(dāng)假設(shè)0:0bH就認(rèn)為回歸效果不顯著。就認(rèn)為回歸效果不顯著。 被拒絕時(shí),認(rèn)為回歸效果是顯著的,反之,被拒絕時(shí),認(rèn)為回歸效果是顯著的,反之,3. 3. 預(yù)測預(yù)測(2我們無法確切知道我們無法確切知道yy的值。因此,只能估計(jì)的值。因此,只能估計(jì)yy的范圍。通常的范圍。通常假定假定), 0(2Nyy 這樣通過對(duì)這樣通過對(duì)2的估計(jì)
57、,就可知道的估計(jì),就可知道yy 的估計(jì))的估計(jì))當(dāng)檢驗(yàn)認(rèn)為回歸方程確有意義,則可用來預(yù)測或控制。當(dāng)檢驗(yàn)認(rèn)為回歸方程確有意義,則可用來預(yù)測或控制。的取值范圍。的取值范圍。假定假定),(00yx), 0(,(2NbxaY00 yy 是在模型是在模型的條件下進(jìn)行的一次試驗(yàn)結(jié)果,可以證明的條件下進(jìn)行的一次試驗(yàn)結(jié)果,可以證明有:有:2200011, 0SxxxxnNyy.1 , 0112000NSxxnyyxx )2(2222nn因此,因此,.2, 1)11 ()(202200nFSxxnyyxx 給定的給定的置信水平置信水平a1,有,有anFSxxnyyPxx12, 1)11 ()(2022000y的
58、的置信區(qū)間置信區(qū)間為為),(00yy其中其中xxSxxnnFx202011)2, 1 ()(于是于是根據(jù)根據(jù)書上書上(用相關(guān)系數(shù)檢驗(yàn)法),也有(用相關(guān)系數(shù)檢驗(yàn)法),也有.22/211222000ntnnSxxnyyxx即即.2112000ntSxxnyyxx給定給定置信水平置信水平a1antSxxnyyPaxx12112/2000,有,有aSxxnntYYSxxnntYPxxaxxa1112112202/00202/0,0yxxaSxxnntx202/0112)( 讓讓x(x換為換為0 x)變動(dòng),有:)變動(dòng),有:xxSxxnnFx2211)2, 1 ()(或或xxaSxxnntx22/112)
59、(置信區(qū)間置信區(qū)間其中其中事實(shí)上,當(dāng)事實(shí)上,當(dāng)n n很大且很大且0 x靠近靠近x時(shí),有時(shí),有2)(, 111122220nyySxxnniixx即即0yy 服從服從), 0(2N,用正態(tài)分布的性質(zhì)有,用正態(tài)分布的性質(zhì)有99. 033000yyyP或或95. 022000yyyP作為實(shí)際應(yīng)用時(shí)的作為實(shí)際應(yīng)用時(shí)的近似預(yù)報(bào)近似預(yù)報(bào)。 總結(jié):總結(jié):1.1.回歸方程計(jì)算回歸方程計(jì)算,.11niixnx niiyny11 niiiniiixyniniiiyyniniiixxyxnyxyyxxSynyyySxnxxxS111212212122., .,xbyaSSbxxxyxyniniiiSbxxbyyS2
60、112222) ()(回 xyyyniiSbSSSyyS) (22122回總殘 2222SS2)-(n2)-/(nSSF殘回殘回(2 2)進(jìn)行統(tǒng)計(jì))進(jìn)行統(tǒng)計(jì)檢驗(yàn)檢驗(yàn): 對(duì)給定對(duì)給定的臨界值的臨界值F,如果,如果FF 則拒絕假設(shè)則拒絕假設(shè)0H,說明一元線性回歸成立。如果,說明一元線性回歸成立。如果FF 則接受假設(shè)則接受假設(shè)0H,說明一元線性回歸不成立。,說明一元線性回歸不成立。,由,由F分布表查出自由度為(分布表查出自由度為(1,n-2)(3 3)對(duì)回歸直線進(jìn)行)對(duì)回歸直線進(jìn)行預(yù)測預(yù)測。xxSxxnnFx2211)2, 1 ()( )(xyy其中:其中:xbay4可線性化可線性化的一元的一元非線
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 河北軟件職業(yè)技術(shù)學(xué)院《獸醫(yī)臨床病理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇聯(lián)合職業(yè)技術(shù)學(xué)院《電子設(shè)計(jì)與創(chuàng)新基礎(chǔ)A》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海震旦職業(yè)學(xué)院《BM概論》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025屆山東省青島李滄區(qū)四校聯(lián)考初三第一次診斷性考試試題化學(xué)試題試卷含解析
- 浙江經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院《醫(yī)學(xué)統(tǒng)計(jì)學(xué)(包括SPSS軟件、科研設(shè)計(jì))》2023-2024學(xué)年第二學(xué)期期末試卷
- 武漢理工大學(xué)《測量與遙感》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海市嘉定二中2025屆高三第九次月考英語試題含解析
- 山西中醫(yī)藥大學(xué)《互換性與技術(shù)測量實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年江蘇省南通市如東縣高頻錯(cuò)題卷(十二)英語試題含答案
- 內(nèi)蒙古自治區(qū)烏蘭察布市集寧區(qū)2025年高三高考最后一卷化學(xué)試題含解析
- 辦公室平面圖模板
- 分包商資格申請(qǐng)表(全套)
- 三年級(jí)數(shù)學(xué)下冊(cè)蘇教版《解決問題的策略-從問題想起》教學(xué)反思(區(qū)級(jí)公開課)
- 計(jì)量經(jīng)濟(jì)學(xué)期末考試題庫(完整版)及答案
- 移動(dòng)機(jī)器人機(jī)械臂的設(shè)計(jì)
- 加 工 貿(mào) 易 手 冊(cè)
- 高通量測序技術(shù)在微生物基因組學(xué)中的應(yīng)用
- 復(fù)方地蒽酚軟膏(克顯龍)蒽林軟膏說明書副作用不良反應(yīng)高低濃度的使用方法
- 浙江省建設(shè)工程施工取費(fèi)定額(2003版)完整版
- 04_微生物農(nóng)藥
- AA7000系列原子吸收光譜儀基本操作手冊(cè)
評(píng)論
0/150
提交評(píng)論