線性回歸與方差分析學(xué)習(xí)教案_第1頁
線性回歸與方差分析學(xué)習(xí)教案_第2頁
線性回歸與方差分析學(xué)習(xí)教案_第3頁
線性回歸與方差分析學(xué)習(xí)教案_第4頁
線性回歸與方差分析學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩107頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、會計(jì)學(xué)1第一頁,共112頁。的函數(shù)式來表示。第1頁/共111頁第二頁,共112頁。對于具有相關(guān)關(guān)系的變量,雖然不能找到他們之間的確定(qudng)表達(dá)式,但是通過大量的觀測數(shù)據(jù),可以發(fā)現(xiàn)他們之間存在一定的統(tǒng)計(jì)規(guī)律,數(shù)理統(tǒng)計(jì)中研究變量之間相關(guān)關(guān)系的一種有效方法就是回歸分析。第2頁/共111頁第三頁,共112頁。 其中yi是x=xi時(shí)隨機(jī)變量Y的觀測結(jié)果(ji gu).將n對觀測結(jié)果(ji gu)(xi,yi)(i=1,n)在直角坐標(biāo)系中進(jìn)行描點(diǎn),這種描點(diǎn)圖稱為散點(diǎn)圖.散點(diǎn)圖可以幫助我們精略地看出Y與x之間的某種關(guān)系. 假定我們(w men)要考慮自變量x與因變量Y之間的相關(guān)關(guān)系假設(shè)x為可以控制或

2、可以精確觀察的變量,即x為普通的變量。由于自變量x給定后,因變量Y并不能確定,從而Y是一個(gè)與x有關(guān)的隨機(jī)變量我們對于可控制變量x取定一組不完全相同的值x1,xn,作n次獨(dú)立試驗(yàn),得到n對觀測結(jié)果:(x1,y1) ,(x2,y2),(xn, yn)第3頁/共111頁第四頁,共112頁。廠 家123456789廣告費(fèi)6102140626290100120銷售額3158124220299190320406380 廣告費(fèi)與銷售額之間不可能存在一個(gè)明確的函數(shù)關(guān)系,事實(shí)上,即使不同的廠家投入了相同的廣告費(fèi),其銷售額也不會是完全相同的。影響銷售額的因素是多種多樣的,除了廣告投入的影響,還與廠家產(chǎn)品的特色、定

3、價(jià)(dng ji)、銷售渠道、售后服務(wù)以及其他一些偶然因素有關(guān)。第4頁/共111頁第五頁,共112頁。這樣,Y可以看成是由兩部分疊加而成,一部分是x的線性函數(shù)a+bx,另一部分是隨機(jī)因素引起的誤差 ,即Y=a+bx+oxy10020030040050020406080100120L*這就是所謂的這就是所謂的一元線性回歸模型一元線性回歸模型 圖9-1第5頁/共111頁第六頁,共112頁。 相互獨(dú)立niiiiNnibxay,), 0(, 112一般地,假設(shè)x與Y之間的相關(guān)(xinggun)關(guān)系可表示為bxaY(1)其中(qzhng):a, b為未知常數(shù)2),0(2N為隨機(jī)誤差且未知,x與Y的這種關(guān)

4、系(gun x)稱為一元線性回歸模型y=a+bx稱為回歸直線 b稱為回歸系數(shù)),(2bxaNY此時(shí)對于(x, Y)的樣本(x1,y1),(xn,yn)有:第6頁/共111頁第七頁,共112頁。一元線性回歸主要解決下列一些問題: (1)利用樣本對未知參數(shù)a、b、 進(jìn)行估計(jì); (2)對回歸模型作顯著性檢驗(yàn); (3)當(dāng)x=x0時(shí)對Y的取值作預(yù)測,即對Y作區(qū)間估計(jì). 2ba, xbay如果由樣本得到式(1)中,a, b的估計(jì)值 ,則稱 為擬合直線或經(jīng)驗(yàn)回歸直線,它可作為回歸直線的估計(jì)第7頁/共111頁第八頁,共112頁。最小二乘法就是選擇a,b的估計(jì) ,使得Q(a, b)為最?。▓D9-2) ba, 2

5、現(xiàn)在我們(w men)用最小二乘法來估計(jì)模型(1)中的未知參數(shù)a,b.niniiiibxaybaQQ1122)(),(記稱Q(a, b)為偏差(pinch)平方和第8頁/共111頁第九頁,共112頁。圖9-2第9頁/共111頁第十頁,共112頁。0)2( )(),(0)2( )(),(11iniiiniiixbxaybaQbbxaybaQa為了(wi le)求Q(a, b)的最小值,分別求Q關(guān)于a,b的偏導(dǎo)數(shù),并令它們等于零:經(jīng)整理(zhngl)后得到式(2)稱為(chn wi)正規(guī)方程組. niiiniiniiniiniiyxbxaxbbxna112111(2)第10頁/共111頁第十一頁,

6、共112頁。niiiniixxyyxxb121)()()(xbyaniniiiynyxnx111,1由正 規(guī)方程組解得其中(qzhng)第11頁/共111頁第十二頁,共112頁。用最小二乘法求出的估計(jì) 、 分別稱為a、b的最小二乘估計(jì)a bya bx 此時(shí),擬合直線為()yyb xx或擬合直線(zhxin)也稱為y關(guān)于x的經(jīng)驗(yàn)回歸方程、有時(shí)也稱為y關(guān)于x的一元線性回歸方程第12頁/共111頁第十三頁,共112頁。22211111112221111()1()().1()nnnxxiiiiiinnnnxyiiiiiiiiiinnnyyiiiiiiSxxxxnSxxyyx yxynSyyyyn 第1

7、3頁/共111頁第十四頁,共112頁。1111xyxxnniiiiSbSayxbnn 第14頁/共111頁第十五頁,共112頁。由矩估計(jì)法,可用 估計(jì) 2Eniin1212下面再用矩法求 的估計(jì) 22DE由于,a、b分別由 、 代入iiiya bx a b而2niiixbayn122)(1故 可用作估計(jì)第15頁/共111頁第十六頁,共112頁。2為了計(jì)算,引入下述殘差平方和,iix xiiiiyyabxyyx記則稱為處的殘差2211nneiiiiiiQyyyabx平方和稱為殘差平方和第16頁/共111頁第十七頁,共112頁。22112112221()()()2()()( )()2( )22.n

8、neiiiiiinniiiiiniyyxyxxixyyyxyxxyyxyxyxxeyyxyQyyyyb xxyybxxyybxxSbSbSSSbSbSSbSbSSQSbS最后得第17頁/共111頁第十八頁,共112頁。222(2),2,eQnQEn于是21.22eyyxyQSbSnn第18頁/共111頁第十九頁,共112頁。對于估計(jì)量 、 、 的分布,有:a b2定理定理(dngl)1niinixxnxaNa121212)(,(1)niixxbNb122)(,(2)) 2(222nn(3)2a b(4)分別與 、 獨(dú)立。第19頁/共111頁第二十頁,共112頁。323. 0b37. 4 a06

9、4. 422 在例1中可分別求出a、b、 的估計(jì)值為:故經(jīng)驗(yàn)回歸(hugu)直線為:x例2 就例1試求出y關(guān)于x的一元線性回歸方程及 的估計(jì)2第20頁/共111頁第二十一頁,共112頁。xyx2y2xy631369611861058100336458021124441153762604402201600484008800622993844894011853862190384436100117809032081001024002880010040610000164836406001203801440014440045600511202842365605238157488第21頁/共111頁第二十

10、二頁,共112頁。214236551113351.5691157488511 202842342.6793.1714112028511 3.171445.25899xxxyxyxxSSbSSa故故得得45.2583.1714 .225.333.1714(56.78).yxyx或或第22頁/共111頁第二十三頁,共112頁。2122eyyxyQSbSnn221122116052382028148262942342.67,3.1714,13976.46(2)13976.46/ 71996.64nnyyiiiixyeyyxyeSyynSbQSbSQn 又又已已知知即即得得第23頁/共111頁第二十四

11、頁,共112頁。溫度x(C)100110120130140150160170180190得率Y(%)45515461667074788589406080100100120140160180200第24頁/共111頁第二十五頁,共112頁。xyx2y2xy10045100002025450011051121002601561012054144002916648013061169003721793014066196004356924015070225004900105001607425600547611840170782890060841326018085324007225153001908936

12、100792116910 145067321850047225101570第25頁/共111頁第二十六頁,共112頁。2121850014508250,1011015701450 6733985,100.48303,116731450 0.483032.73935,1010 xxxyxyxxSSbSSa 故得故得2.739350.48303 .67.30.48303(145).yxyx 或或第26頁/共111頁第二十七頁,共112頁。2231121147225673101932.0.3985,0.48303,7.23,(2)7.23 / 80.90.nnyyiiiixyeyyxyeSyynSb

13、QSbSQn 又又已已知知即即得得第27頁/共111頁第二十八頁,共112頁。在實(shí)際問題中,事先我們并不能斷定Y與x確有線性關(guān)系,Y=a+bx+ 只是一種假設(shè).下面說明(shumng)這一檢驗(yàn)的方法.當(dāng)然,這個(gè)假設(shè)不是沒有根據(jù)的,我們(w men)可以通過專業(yè)知識和散點(diǎn)圖來作出粗略判斷.但在求出經(jīng)驗(yàn)回歸方程后,還需對這種線性回歸方程同實(shí)際觀測數(shù)據(jù)擬合的效果進(jìn)行檢驗(yàn).第28頁/共111頁第二十九頁,共112頁。若假設(shè)Y=a+bx+ 符合實(shí)際,則b不應(yīng)為零因?yàn)槿绻鸼=0,則Y=a+意味著Y與x無關(guān)所以Y=a+bx是否合理(hl),歸結(jié)為對假設(shè):0:1bHH0: b=0進(jìn)行(jnxng)檢驗(yàn)下面介紹

14、檢驗(yàn)假設(shè)(jish)H0的二種常用方法.第29頁/共111頁第三十頁,共112頁。)1 ,0()(12Nxxbnii)2(222nn且 與 獨(dú)立b21t檢驗(yàn)法檢驗(yàn)法若H0成立(chngl),即b=0,由定理知,第30頁/共111頁第三十一頁,共112頁。)2(|2ntT)2(2/)(2212ntnnxxbTnii因而)2(|2ntTP故為顯著性水平即得H0的拒絕域?yàn)榈?1頁/共111頁第三十二頁,共112頁。niiniiniiiYYxxYYxxR12121)()()(2 2相關(guān)系數(shù)檢驗(yàn)法相關(guān)系數(shù)檢驗(yàn)法取檢驗(yàn)(jinyn)統(tǒng)計(jì)量通常(tngchng)稱R為樣本相關(guān)系數(shù).類似于隨機(jī)變量(su j

15、bin lin)間的相關(guān)系數(shù),R的取值r反映了自變量x與因變量Y之間的線性相關(guān)關(guān)系.可以推出:在顯著性水平 下,當(dāng)|rr時(shí)拒絕H0r其中臨界值 在附表8中給出相關(guān)系數(shù)檢驗(yàn)法相關(guān)系數(shù)檢驗(yàn)法是工程技術(shù)中廣是工程技術(shù)中廣泛應(yīng)用的一種檢泛應(yīng)用的一種檢驗(yàn)方法驗(yàn)方法第32頁/共111頁第三十三頁,共112頁。當(dāng)假設(shè) 被拒絕時(shí),就認(rèn)為Y與x存在線性關(guān)系,從而認(rèn)為回歸效果顯著;0:0bH若接受(jishu)H0,則認(rèn)為Y與x的關(guān)系不能用一元線性回歸模型來描述,即回歸效果不顯著.此時(shí),可能有如下(rxi)幾種情形:因此,在接受H0的同時(shí),需要進(jìn)一步查明原因分別處理,此時(shí),專業(yè)知識往往起著重要作用. 第33頁/共

16、111頁第三十四頁,共112頁。000bxay), 0(20N00 xbay當(dāng)經(jīng)過檢驗(yàn)發(fā)現(xiàn)回歸效果顯著時(shí),通過回歸模型可對Y的取值進(jìn)行(jnxng)預(yù)測.即當(dāng)x=x0時(shí),對Y作區(qū)間(q jin)估計(jì).設(shè)當(dāng)x=x0時(shí)Y的取值為y0,有可以取經(jīng)驗(yàn)回歸值第34頁/共111頁第三十五頁,共112頁。) 2()()(112122000ntxxxxnnnyyTnii1)2(|2ntTP作為(zuwi)y0的預(yù)測值.可以證明從而(cng r)可得第35頁/共111頁第三十六頁,共112頁。)(),(0000 xyxyniixxxxnnnntx122020)()(112) 2()(1所以,給定置信概率 ,Y0

17、的置信區(qū)間為其中(qzhng)(20 x可以看出在x0處y的置信區(qū)間的長度為xx0當(dāng) 時(shí)置信區(qū)間的長度最短,估計(jì)最精確,置信區(qū)間愈長,估計(jì)的精度愈差。第36頁/共111頁第三十七頁,共112頁。22) 2(untxx012nn) , (2020uyuyx當(dāng)n很大且x0位于 附近時(shí),有1于是y0的置信概率為 的預(yù)測區(qū)間近似為第37頁/共111頁第三十八頁,共112頁。)05. 0(例3 檢驗(yàn)例2中的回歸效果是否顯著,當(dāng)x0=80時(shí),求出Y0的預(yù)測區(qū)間。解解 經(jīng)計(jì)算經(jīng)計(jì)算(j sun) T=16.9 r查表,得t(9)=2.26 r易見,t檢驗(yàn)法、相關(guān)系數(shù)檢驗(yàn)法都拒絕(jju)H0,即回歸效果顯著

18、。21.310y于是,當(dāng)x0=80時(shí),y0的預(yù)測值為y0的95%的預(yù)測(yc)區(qū)間為(,)第38頁/共111頁第三十九頁,共112頁。 或者,用線性回歸方程描述變量(binling)間的關(guān)系計(jì)算的結(jié)果與樣本值誤差較大,這表明變量(binling)之間不存在線性相關(guān)關(guān)系,而是一種非線性的相關(guān)關(guān)系.下面舉例說明對這類問題用線性化處理的方法。第39頁/共111頁第四十頁,共112頁。xi0.050.060.070.100.140.200.250.310.380.430.47yi0.100.140.230.370.590.791.001.121.191.251.29解解 根據(jù)這根據(jù)這11個(gè)樣本個(gè)樣本(

19、yngbn)數(shù)數(shù)據(jù)點(diǎn)據(jù)點(diǎn)(xi,yi)作出散點(diǎn)圖(圖)作出散點(diǎn)圖(圖9-3).圖9-3從散點(diǎn)圖上看出,這些數(shù)據(jù)點(diǎn)在一條(y tio)曲線L周圍.第40頁/共111頁第四十一頁,共112頁。xy1lnln根據(jù)有關(guān)的專業(yè)知識,結(jié)合散點(diǎn)圖,可以(ky)認(rèn)為曲線L大致為:xey)0,(對上式兩邊(lingbin)取對數(shù):yylnxx1lnab令xbay即有:第41頁/共111頁第四十二頁,共112頁。0.250.220.170.110.00-0.24-0.53-0.99-1.47-1.97-2.302.132.332.633.234.005.007.1410.0014.2916.6720.00 xx1

20、yyln于是數(shù)據(jù)( )相應(yīng)地變換成( )iiyx ,iiyx,將變換后的數(shù)據(jù)點(diǎn)( )畫出散點(diǎn)圖(圖9-4)iiyx,從散點(diǎn)圖可以看出 與 具有線性相關(guān)關(guān)系,因此用一元線性回歸分析.xy利用一元線性回歸的方法可以計(jì)算出 與 的經(jīng)驗(yàn)回歸方程為xy15. 058. 0 xy圖9-4第42頁/共111頁第四十三頁,共112頁??汕蟮脁與y之間相關(guān)關(guān)系的一個(gè)經(jīng)驗(yàn)(jngyn)公式:79. 158. 0eea15. 0bxey15.079.1這里(zhl)a,b所以(suy)第43頁/共111頁第四十四頁,共112頁。332.1213.9142.443.8619.729.95時(shí)間時(shí)間t(分(分秒秒)150

21、01000800400200100距離距離x(米)(米)例例2 賽跑是大家熟知的一種體育活動。下表給出了截至1997年底在6個(gè)不同的距離上中短跑成績的世界記錄:試根據(jù)這些記錄數(shù)據(jù)分析出運(yùn)動員的賽跑成績與所跑距離間的相關(guān)關(guān)系。第44頁/共111頁第四十五頁,共112頁。解解 根據(jù)記錄根據(jù)記錄(jl)數(shù)據(jù)點(diǎn)(數(shù)據(jù)點(diǎn)(xi,ti)作出散點(diǎn)圖)作出散點(diǎn)圖 (圖圖9-5)圖9-5從散點(diǎn)圖上看出,全部點(diǎn)(xi,ti)分布在一條曲線附近,因而x與t之間可以存在(cnzi)一種線性關(guān)系。我們用一無線性回歸分析(fnx),可計(jì)算出x與t間的線性回歸模型為 tx第45頁/共111頁第四十六頁,共112頁。由此模型

22、(mxng),當(dāng)x=100,200,400,800,1000,1500(米)時(shí),t的理論值分別(fnbi)為:4.56, 19.10,48.20,146.4,215.5,328.2可以(ky)看出t的理論值與實(shí)際記錄數(shù)據(jù)多數(shù)都比較接近。仔細(xì)分析,可發(fā)現(xiàn)線性回歸模型的一些不合理之處。如:當(dāng)賽跑距離小于68米時(shí),所需時(shí)間為負(fù)值;當(dāng)賽跑距離為100米時(shí)所需時(shí)間只須4.56.再仔細(xì)分析,發(fā)現(xiàn):短距離100米、200米及長距離1500米需要的時(shí)間實(shí)際值均高于線性模型的理論值,而中間的400米、800米、1000米需要的時(shí)間實(shí)際值均低于線性模型的理論值.它告訴我們x與t的關(guān)系可能為一曲線,且曲線是下凸的。

23、具有這種性質(zhì)的最簡單曲線當(dāng)屬冪函數(shù):t=axb 第46頁/共111頁第四十七頁,共112頁。它告訴我們x與t的關(guān)系(gun x)可能為一曲線,且曲線是下凸的。對上式二邊取對數(shù)(du sh)lnt=lna+blnx令t=lnt a=lna x=lnx得t= a+bx為一線性關(guān)系具有(jyu)這種性質(zhì)的最簡單曲線當(dāng)屬冪函數(shù):t=axb第47頁/共111頁第四十八頁,共112頁。aea用一元線性回歸分析估計(jì)a、b,從而算出最后(zuhu)可得t與x間的冪函數(shù)模型: tx當(dāng)x=100,200,400,800,1000,1500(米)時(shí),利用(lyng)冪函數(shù)模型算出t的理論值分別為:9.39,20.7

24、8,45.96,141.68, 211.29,328.88比較計(jì)算結(jié)果可知:冪函數(shù)模型(mxng)比線性回歸模型(mxng)更能確切地反映t與x間的關(guān)系。第48頁/共111頁第四十九頁,共112頁。其中b0,b1,bp, 為與x1,xp無關(guān)的未知參數(shù)。2假定要考察(koch)p個(gè)自變量x1,x2,xp與因變量Y之間的相關(guān)關(guān)系。 ppxbxbbY110), 0(2N設(shè)這就是(jish)p元線性回歸模型第49頁/共111頁第五十頁,共112頁。iippiixbxbby 110), 0(2Ni對變量x1,xp,Y作n次觀測得到(d do)樣本值:iipyxx;,1 ( ) i=1,,n這里y1,yn

25、獨(dú)立(dl)、同分布,且有nyyyY21npnnppxnxxxxxxxX212222111211111pbbbb10n21為了(wi le)簡化數(shù)學(xué)處理,引進(jìn)矩陣表示,記第50頁/共111頁第五十一頁,共112頁。 XbY則等式(dngsh)iippiixbxbby110i=1,,n可表示(biosh)為pbbb,10用最小二乘法求未知參數(shù)的估計(jì),即參數(shù) niTippiiXbYXbYxbxbbyQ12110)()()(應(yīng)使為最小第51頁/共111頁第五十二頁,共112頁。YXXXbbbbTTp110)(ppxbxbbY110根據(jù)(gnj)高等數(shù)學(xué)中求最小值的方法,可求得b0,b1,bp的估計(jì):

26、從而(cng r)得到Y(jié)與x1,xp的經(jīng)驗(yàn)回歸方程:第52頁/共111頁第五十三頁,共112頁。 類似于一元線性回歸,多元線性回歸模型(mxng)的假設(shè)是否符合實(shí)際,同時(shí)需要進(jìn)行假設(shè)檢驗(yàn)。 另外,在實(shí)際問題中,影響因變量Y的因素往往很多.如果(rgu)將它們都取作自變量,必然會導(dǎo)致所得到的回歸方程很復(fù)雜。 因而,我們應(yīng)剔除那些對Y影響較小的自變量,保留對Y有顯著影響的自變量,以便(ybin)我們對變量間的相關(guān)變化有更明確的認(rèn)識。 在此我們對多元性回歸分析作一簡單介紹.在實(shí)際問題中多元線性回歸的應(yīng)用非常廣泛,有興趣的讀者可以查閱有關(guān)的專門書籍。第53頁/共111頁第五十四頁,共112頁。bxY)

27、, 0(2N第54頁/共111頁第五十五頁,共112頁。01. 00:0bHxi0.100.300.400.550.700.800.95yi1518192122.623.826第55頁/共111頁第五十六頁,共112頁。01. 005. 0 xi289298316327329329331250yi43.542.942.139.138.538.038.037.0第56頁/共111頁第五十七頁,共112頁。vi1.6210.750.620.520.46pi0.511.522.53第57頁/共111頁第五十八頁,共112頁。x1X2x3x4x5111120.21-11-18.011-1-19.21-

28、1-111.4第58頁/共111頁第五十九頁,共112頁。一、單因素(yn s)方差分析第59頁/共111頁第六十頁,共112頁。在試驗(yàn)中,將要考察(koch)的指標(biāo)稱為試驗(yàn)指標(biāo),影響試驗(yàn)指標(biāo)的條件稱為因素因素所處的狀態(tài)稱為(chn wi)該因素的水平如果試驗(yàn)僅考慮一個(gè)(y )因素,則稱為單因素試驗(yàn),否則稱為多因素試驗(yàn).我們先討論單因素試驗(yàn)第60頁/共111頁第六十一頁,共112頁。報(bào)警器型號報(bào)警器型號反反 應(yīng)應(yīng) 時(shí)時(shí) 間間A1(甲型)(甲型)5.26.34.93.26.8A2(乙型)(乙型)7.48.15.96.54.9A3(丙型)(丙型)3.96.47.99.24.1A4(丁型)(丁型)1

29、2.39.47.810.88.5這里,試驗(yàn)(shyn)的指標(biāo)是報(bào)警器的反應(yīng)時(shí)間,報(bào)警器為因素。第61頁/共111頁第六十二頁,共112頁。4種不同型號的報(bào)警器是因素的4個(gè)不同水平。這是一個(gè)(y )單因素試驗(yàn).我們(w men)要考察:各種型號的報(bào)警器的反應(yīng)時(shí)間有無(yu w)顯著性差異?如果各種型號的報(bào)警器的反應(yīng)時(shí)間有顯著性差異,那么何種型號的報(bào)警器最優(yōu)? 第62頁/共111頁第六十三頁,共112頁。4321,43210:H43211,:H上表中數(shù)據(jù)可看作來自4個(gè)不同總體(每個(gè)水平(shupng)對應(yīng)一個(gè)總體)的樣本值,將各個(gè)總體均值依記為則各型號報(bào)警器的反應(yīng)時(shí)間有無(yu w)顯著性差異的問

30、題相當(dāng)于需檢驗(yàn)假設(shè)不全相等(xingdng)。第63頁/共111頁第六十四頁,共112頁。若再假定各總體均值為正態(tài)總體,且各總體方差(fn ch)相等,那么這是一個(gè)檢驗(yàn)同方差的多個(gè)正態(tài)總體均值(jn zh)是否相等的問題。顯然,檢驗(yàn)假設(shè)(jish)H0可以用前面所講的t檢驗(yàn)法,只要檢驗(yàn)任何二個(gè)總體均值相等就可以了。下面所要討論的方差分析法就是解決這類問題的一種檢驗(yàn)方法。但是這樣做要檢驗(yàn)3次,比較繁瑣.第64頁/共111頁第六十五頁,共112頁??傮w均值總體均值樣本均值樣本均值Xs2X22X12Xs1X21X11AsA2A1 水平水平觀測值觀測值 .SX1S2.2X22nX.1XssnX11nX

31、設(shè)影響(yngxing)指標(biāo)值的因素A有s個(gè)水平A1,A2,As)2(iinn在水平Ai(i=1,s)下,進(jìn)行 次獨(dú)立試驗(yàn),得樣本Xij,j=1,ni:第65頁/共111頁第六十六頁,共112頁。injijiiXnX11si, 1sinjijiXnX111siinn1假定水平Ai下的樣本來自正態(tài)總體 , 未知,且不同水平Ai下的樣本獨(dú)立),(2iN2,i記),(2iijNX有j=1,,ni i=1,sXij相互(xingh)獨(dú)立第66頁/共111頁第六十七頁,共112頁。), 0(2Nij于是(ysh)ijiijXij為隨機(jī)誤差由假設(shè)(jish)在方差分析中,為了便于推廣到多因素試驗(yàn)的情形(q

32、ng xing),習(xí)慣上又有下列表示式:ijiijXj=1,,ni i=1,s iisiiin10siiinn11其中稱 為總平均is,1稱 為水平Ai的效應(yīng)效應(yīng),滿足第67頁/共111頁第六十八頁,共112頁。0:210sHs21現(xiàn)在,要檢驗(yàn)等價(jià)(dngji)于檢驗(yàn)sH,:211不全為零下面從平方和的分解著手(zhushu),導(dǎo)出上述假設(shè)H0的檢驗(yàn)方案sinjijTiXXS112)(記ST能反映全部試驗(yàn)數(shù)據(jù)(shj)之間的差異,因此稱ST為總偏差平方和第68頁/共111頁第六十九頁,共112頁。sinjijTiXXS112)(sinjiiijiXXXX112)()(sinjiiijiXXXX

33、112)()(sinjsinjiiijiijiiXXXXXX11112)(2)(sinjiiXX112)(sinjisiiiijiXXnXX11212)()(由于(yuy)第69頁/共111頁第七十頁,共112頁。sinjiijEiXXS112)(siiiAXXnS12)(于是(ysh)有平方和分解式:ST=SE+SA其中(qzhng)稱SE為誤差(wch)平方和,SA為因素A的平方和SE反映了各水平Ai內(nèi)由于隨機(jī)誤差而引起的抽樣誤差SA反映了因素A的水平不同而引起的誤差外加隨機(jī)誤差第70頁/共111頁第七十一頁,共112頁。定理定理(dngl)1)(122snSE(1)(2)SE與ST相互(

34、xingh)獨(dú)立;01s) 1(122sSA(3)當(dāng) 時(shí), 。第71頁/共111頁第七十二頁,共112頁。0:10sH)() 1(snSsSFEA為了(wi le)檢驗(yàn)取FF(s-1,n-s)當(dāng)H0成立(chngl)時(shí),由定理1,直觀上,當(dāng)H0成立時(shí),由因素水平的不同引起的偏差(pinch)相對于隨機(jī)誤差而言可以忽略不計(jì),即F的值應(yīng)較?。环粗?,若F值較大,自然認(rèn)為H0不成立。第72頁/共111頁第七十三頁,共112頁。), 1(snsFF若檢驗(yàn)結(jié)果認(rèn)為假設(shè)H0不成立,則可用 作為 的點(diǎn)估計(jì),或者對 進(jìn)行區(qū)間估計(jì)。iXii), 1(snsFFP由得到:在顯著性水平 下H0的拒絕域:計(jì)算(j su

35、n)F的值可用表9-1所示的方差分析表第73頁/共111頁第七十四頁,共112頁。n-1ST總和總和n-sSE誤差誤差s-1SA因素因素AF值值均方和均方和自由度自由度平方和平方和偏差來源偏差來源1sSSAAsnSSEEEASSF 表表9-1 9-1 單因素單因素(yn s)(yn s)方差方析表方差方析表第74頁/共111頁第七十五頁,共112頁。11,2,iniijjTxis記11inSijijTx 22221111iinnssTijijijijTSxnxxn則22211ssiiAiiiiTTSn xnxnnETASSS在實(shí)際 中 ,我們可 以按 以下較簡的 公式來計(jì)算,.TAESSS在實(shí)

36、際中,我們可以按以下較簡的公式來計(jì)算第75頁/共111頁第七十六頁,共112頁。0121121.:,SSHH 假設(shè)不全相等12.AESsFSns選取檢驗(yàn)統(tǒng)計(jì)量3.1,11,AEFFsnsSsFFsnsSns在水平 下查 分布表求的值定出拒絕域?yàn)榈?6頁/共111頁第七十七頁,共112頁。 22211114.1,iinnSiiiijijjijiTTTxTxn列表求等數(shù)據(jù) 2,TAETASSSSS根據(jù)表中數(shù)據(jù)求的值11,2,iniijjTxis記11inSijijTx 22221111iinnssTijijijijTSxnxxn其中22211ssiiAjjiiTTSn xnxnnETASSS第77

37、頁/共111頁第七十八頁,共112頁。5.將以上所求結(jié)果列成“方差分析表”方差來源平方和自由度均方F比因素誤差總和AS1s1AASSsAESFSESTSn s1nEESSns方 差 分 析 表第78頁/共111頁第七十九頁,共112頁。006.11,AESsFFsnsSnsHH判斷并作出結(jié)論:若則拒絕原假設(shè)否則就接受原假設(shè)第79頁/共111頁第八十頁,共112頁。機(jī)器機(jī)器I機(jī)器機(jī)器II機(jī)器機(jī)器III0.2360.2570.2580.2380.2530.2640.2480.2550.2590.2450.2540.2670.2430.2610.262補(bǔ)充例題: 設(shè)有三臺機(jī)器, 生產(chǎn)規(guī)格相同的鋁合金

38、薄板(bo bn). 取樣,測量薄板(bo bn)的厚度得結(jié)果如下表所示:試考察各臺機(jī)器所生產(chǎn)的的薄板的厚度有無(yu w)顯著的差異?第80頁/共111頁第八十一頁,共112頁。 012311231:,HH :設(shè)解假不全相等 12AESsFSns選取檢驗(yàn)統(tǒng)計(jì)量 0.051,2,123.89FFsnsF3在水平 下查 分布表0.0512,123.89AESsFFSns則拒絕域?yàn)?4列表計(jì)算所需各值如下:第81頁/共111頁第八十二頁,共112頁。 水平觀察值機(jī)器機(jī)器機(jī)器0.2360.2570.2580.2380.2530.2640.2480.2550.2590.2450.2540.2670.2

39、430.2610.2621.211.281.3101.46411.63841.71610.2930.3280.3430.9640.2420.2560.2620.292920.327720.343274iT21iiTn2iTix21jnijix3.8T 2110.963912jnsijjix第82頁/共111頁第八十三頁,共112頁。222113.80.9639120.0012453315jnsTijjiTSxn則22213.80.963720.0010533315sjAjjTTSnn0.001245330.001053330.000192ETASSS第83頁/共111頁第八十四頁,共112頁。

40、方差來源平方和自由度均方F比因素0.0010533320.0005266732.92誤差0.000192120.000015總和0.0012453314ASESTSASES=AESS第84頁/共111頁第八十五頁,共112頁。 00.050632.923.892,120.05.AESFFSH結(jié)論:因?yàn)槁淙刖芙^域。所以在水平下,拒絕原假設(shè)即認(rèn)為各臺機(jī)器生產(chǎn)的薄板的厚度有顯著的差異。第85頁/共111頁第八十六頁,共112頁。來源來源平方和平方和自由度自由度均方和均方和F值值因素因素A56.29318.76F=6.15誤差誤差48.77163.05在實(shí)際應(yīng)用中,一般在 下若仍不能拒絕H0時(shí)則接受原

41、假設(shè)H010. 0例例2 在例在例1中,中,s=4,n1=n2=n3=n4=5,n=20,經(jīng)計(jì)算,經(jīng)計(jì)算(j sun)列方差分析表如下:列方差分析表如下:查表,得F(),F(xiàn)()10. 00.05從而在顯著性水平下檢驗(yàn)結(jié)果拒絕H0第86頁/共111頁第八十七頁,共112頁。28. 51X56. 62X30. 63X76. 94X28. 5156. 6230. 6376. 94由方差分析可知,4種型號(xngho)的報(bào)警器的反應(yīng)時(shí)間確有顯著性差異計(jì)算(j sun):故即反應(yīng)時(shí)間較短的是甲,丙次之第87頁/共111頁第八十八頁,共112頁。假定要考察兩個(gè)(lin )因素A、B對某項(xiàng)指標(biāo)值的影響因素(

42、yn s)A取s個(gè)水平A1,A2,As因素B取r個(gè)水平B1,B2,Br在A、B的每對組合水平(Ai,Bj)上作一次試驗(yàn),試驗(yàn)結(jié)果為Xij,i=1,s;j=1,r。所有Xij獨(dú)立,數(shù)據(jù)列于下表:第88頁/共111頁第八十九頁,共112頁。XsrXs2Xs1AsX2rX22X21A2X1rX12X11A1BrB2B1 因素因素B因素因素ArX2 X1 XjX sX 2X 1X iXsiXrXrjiji, 2 , 111rjXsXriijj, 2 , 111其中(qzhng)要考察因素A、B是否指標(biāo)值產(chǎn)生(chnshng)顯著性影響?第89頁/共111頁第九十頁,共112頁。),(2ijijNX設(shè)i

43、jijijX則有), 0 (2Nij為隨機(jī)誤差,且ij相互獨(dú)立 i=1,s j=1,, r再假定在水平組合(Ai, Bj)下的效應(yīng)可以用水平Ai下的效應(yīng)(記為 )與水平Bj下的效應(yīng)(記為 )之和來表示,ij即jiij其中sirjijrs111sii10rjj10第90頁/共111頁第九十一頁,共112頁。0:2101sH0:2102rH作假設(shè)(jish)ij如果H01成立,那么 與i無關(guān)這表明因素A對指標(biāo)值無顯著(xinzh)影響同樣(tngyng),作假設(shè)ij如果H02成立,則 與i無關(guān)這表明因素B對指標(biāo)值無顯著影響第91頁/共111頁第九十二頁,共112頁。sirjijXrsX111rsj

44、iijTXXS12)(siiAXXrS12)(rjjBXXsS12)(sirjjiijEXXXXS112)(類似于單因素方差分析,通過下面(xi mian)的平方和分解式可以檢驗(yàn)假設(shè)H01,H02記第92頁/共111頁第九十三頁,共112頁。EBATSSSS通過(tnggu)簡單推導(dǎo)可以證明下列平方和分解式:2SA是由因素A的不同效應(yīng)和 引起的偏差2SB是由因素B的不同效應(yīng)和 引起的偏差而SE表示由 引起的偏差2因此,可用比較(bjio)SA與SE的值來檢驗(yàn)假設(shè)H01用比較SB與SE的值來檢驗(yàn)(jinyn)假設(shè)H02第93頁/共111頁第九十四頁,共112頁。)1)(1(122rsSE 定理定

45、理(dngl)2(dngl)2(1)ST,SA,SB相互(xingh)獨(dú)立,且) 1(122sSA(2)當(dāng)H01成立時(shí),) 1(122rSB(3)當(dāng)H01成立時(shí),第94頁/共111頁第九十五頁,共112頁。) 1)(1(),1() 1)(1/(1/rssFrsSsSFEAA)1)(1( , 1(rssFFA由定理(dngl)2)1)(1( , 1(rssFFPA于是有所以(suy)H01的拒絕域?yàn)闉轱@著性水平類似(li s)地,可給出H02的拒絕域:)1)(1( , 1(rsrFFB其中) 1)(1(1rsSrSFEBB第95頁/共111頁第九十六頁,共112頁??偤涂偤驼`差誤差因素因素B因素

46、因素AF值值均方和均方和自由度自由度平平 方方 和和偏差偏差來源來源rsjiijTXXS.1.2)() 1)(1(rsESEE) 1)(1(rs1rSSBBAAASSF rsjijiijEXXXXS,1.2)(1sSSAArjjsBXXS12)(siiAXXrS12)(1rEBBSSF 1ssr表表9-2 9-2 雙因素雙因素(yn s)(yn s)方差分析表方差分析表第96頁/共111頁第九十七頁,共112頁。4339.537.536A339.53836.533.5A238.535.53532A1B4B3B2B1氧化鋅氧化鋅B促進(jìn)劑促進(jìn)劑A例例3 在某種橡膠的配方中,考慮了3種不同的促進(jìn)劑,

47、4種不同的氧化鋅.各種配方試驗(yàn)一次,測得300%定強(qiáng)如下:問不同促進(jìn)劑、不同份量氧化鋅分別對定強(qiáng)有無顯著性影響?第97頁/共111頁第九十八頁,共112頁。來源來源平方和平方和自由度自由度均方和均方和F值值因素因素A28.3214.15FA=36.3因素因素B66.1322.03FB=56.5誤差誤差2.3560.39總和總和96.7511解解 由題意由題意(t y),影響定強(qiáng)這一指標(biāo)值的因素有二個(gè):促進(jìn),影響定強(qiáng)這一指標(biāo)值的因素有二個(gè):促進(jìn)劑劑A、氧化劑、氧化劑Bs=4,r=3,列出如下(rxi)的方差分析表:取05. 0查表,得F0.05(2,6)=5.14 F0.05(3,6)=4.76比較(bjio)可知 FA5.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論