回歸與相關(guān)分析_第1頁
回歸與相關(guān)分析_第2頁
回歸與相關(guān)分析_第3頁
回歸與相關(guān)分析_第4頁
回歸與相關(guān)分析_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

回歸與相關(guān)分析第一頁,共三十三頁,編輯于2023年,星期五第七章要點提示本章對兩個變量的相互關(guān)系進行分析,是多元統(tǒng)計分析的基石。學習時①首先要求區(qū)分“回歸”術(shù)語古今含義的不同之處,充分認識一元線性回歸與相關(guān)分析的基礎(chǔ)地位;②熟悉回歸關(guān)系與相關(guān)關(guān)系的本質(zhì)區(qū)別及兩者在統(tǒng)計表述方法上的聯(lián)系(如r與b在數(shù)學意義上的統(tǒng)一性)和各自的側(cè)重點;③重點掌握直線回歸與相關(guān)分析的顯著性檢驗方法和雙變量回歸模型的協(xié)方差分析技術(shù),以便將統(tǒng)計控制手段與試驗控制手段一起綜合運用到試驗設(shè)計和統(tǒng)計分析中去。涉及教材內(nèi)容:第九章全五節(jié),第十章、第十一章各一節(jié)。作業(yè)布置:教材第十、十一章所余三節(jié)內(nèi)容自習;

教材P191T5、T6、T9;

P224T7。第二頁,共三十三頁,編輯于2023年,星期五第一節(jié)直線回歸一、回歸的含義“回歸”原文為regression,該術(shù)語最先由英國的F.Galton于1886年左右研究人類身高遺傳的規(guī)律時所作的“高爾頓解釋”中使用,詳情如右圖所示:高爾頓對此所作的解釋是:大自然有一種約束機制,使人類身高分布保持某種穩(wěn)定形態(tài)而不作兩極分化,也就是有回歸于中心的作用,這個中心值μ即該種族身高在一定歷史時期的平均值?,F(xiàn)在就“回歸”所作的定義是:如果兩個變量X和Y,總是Y隨著X的變化而變化,且這種變化關(guān)系不可逆,則稱X和Y為回歸關(guān)系。其中:

X叫自變量dependentvariable;Y叫因變量或依變量independentvariable。高:xg

71

72?gμ(69)

64?a矮:xa

67

調(diào)查n=1074個家庭,統(tǒng)計結(jié)果:X=68英寸?=69英寸得:?=X+1(1英寸=2.54cm)

但分組統(tǒng)計的結(jié)果卻并非如此父母為高個子組時,?g<72+1父母為矮個子組時,?a>64+1

走向指回歸的本意走向指回歸的今義第三頁,共三十三頁,編輯于2023年,星期五第一節(jié)直線回歸二、建立直線回歸方程例7.1一些夏季害蟲的盛發(fā)期遲早與春季溫度高低有關(guān)。江蘇武進縣觀察1956-1964年3月下旬至4月中旬的3段旬均溫累積值X和一代三化螟盛發(fā)期Y(5月10日起算)所得結(jié)果如下,試予分析。解㈠描散點圖本例已知害蟲盛發(fā)期遲早隨春季氣溫的變化而變化,且不可逆,又據(jù)散點圖反映的趨勢來看,在30—45℃的溫度范圍,盛發(fā)期天數(shù)隨值呈下降的線性變化關(guān)系。故可假定直線回歸方程為:

y=a+bx讀作“Y依x直線回歸”30354045年份195619571958195919601961196219631964ΣX(℃)35.534.131.740.336.840.231.739.244.2333.7Y(d)12169273139-170y=a+bx第四頁,共三十三頁,編輯于2023年,星期五第一節(jié)直線回歸㈡數(shù)據(jù)整理由原始數(shù)據(jù)算出一級數(shù)據(jù)6個:ΣX=333.7ΣY=70ΣXY=2436.4ΣX2=12517.49ΣY2=794n=9

再由一級數(shù)據(jù)算出二級數(shù)據(jù)5個:SSX=ΣX2

-(ΣX)2/n=144.64SSY=ΣY2

-(ΣY)2/n=249.56SP=ΣXY-ΣXΣY/n=-159.04X=ΣX/n=37.08?=ΣY/n=7.78㈢計算三級數(shù)據(jù)

b=SP/SSX

=-1.10

=(-159.04)÷144.64a=?-bX=48.55

=7.78-(-1.10)×37.08

得所求直線回歸方程為:

y=48.55-1.10xy=48.55-1.10x3035404531.744.2第五頁,共三十三頁,編輯于2023年,星期五第一節(jié)直線回歸三、直線回歸關(guān)系的顯著性檢驗將a=?-bx代入Y=a+bx得:

y=?+b(x-x)及y-?=b(x-x)于是由因變量離均差的兩個線性分量:Σ(Y-?)2=Σ〔(Y-y)+(y

-?)〕2

可推導出因變量總SS的如下分解公式:Σ(Y-?)2=Σ(Y-y)2+Σ(y

-?)2

簡寫成:SSY=SSQ+

SSU=Q+U分別叫“離回歸平方和”與“回歸平方和”其計算公式及本例分解結(jié)果:

SSU=SP2/

SSX=159.042/144.64=174.89SSQ=SSY-

SSU=249.56-174.89=74.67

故F=MSU/MSQ

=16.4**

(F0.01,1,7=12.25)

=(174.89÷1)/(74.67÷7)

表明雙變量直線回歸關(guān)系極顯著,所得方程y=48.55-1.10x可用于預測。也可對回歸系數(shù)進行t-test來證實。只是要利用df(分子)=1時,F(xiàn)=t2的關(guān)系推導出回歸系數(shù)的標準誤Sb=Se/√SSX其中,Se2=SSQ/dfQ=74.67÷7

=10.67于是t-test的步驟如下:

H0:β=0(β為回歸系數(shù)b的真值)Sb=√Se2/SSX

=0.2715

=√10.67÷144.64t=(b-β)÷Sb=(-1.1)÷0.2715=-4.05(3)按自由度ν=7查得兩尾t0.01=3.50(4)推斷:t>t0.01H0

不成立??梢妕-test與F-test的效果完全一致。若顯著性檢驗結(jié)果不顯著,則三選一:⑴Y與X沒有回歸關(guān)系;⑵Y與X有回歸關(guān)系,但不是直線回歸;⑶Y與X有回歸關(guān)系,但不是簡單回歸,而是多元回歸。第六頁,共三十三頁,編輯于2023年,星期五第二節(jié)直線相關(guān)一、相關(guān)的含義如果兩個變量X和Y,總是X和Y相互制約、平行變化,則稱X和Y為相關(guān)關(guān)系。此時,X和Y沒有嚴格意義上的自變量和因變量之分,既可以說Y隨著X的變化而變化,也可以講X隨著Y的變化而變化。即不存在誰決定誰或誰依賴誰的問題。如人或動物的胸圍和體重,作物的生物產(chǎn)量和經(jīng)濟產(chǎn)量,樹干的胸徑與材積等??梢?,相關(guān)關(guān)系以雙向、平行為特征。但相關(guān)關(guān)系如果僅從數(shù)學角度看,和回歸關(guān)系是統(tǒng)一的,因為其雙變量變化規(guī)律如果是線性關(guān)系的話,也可以由根據(jù)“最小二乘法”原理得出的直線方程來表述,所以有些文獻不區(qū)分回歸關(guān)系和相關(guān)關(guān)系,將二者籠統(tǒng)地稱之“回歸”或者“相關(guān)”。從統(tǒng)計上講,相關(guān)分析的側(cè)重點和回歸分析不完全一樣。二、相關(guān)系數(shù)前已述及,具有線性回歸關(guān)系的雙變量中,Y變量的總變異量分解為:

SSY=SSQ+

SSU=Q+U

對于具有線性相關(guān)關(guān)系的雙變量,Y變量的總平方和也可以分解成同樣的兩個分量,只是分別改稱為“非相關(guān)平方和”與“相關(guān)平方和”于是有:r=±√SSU/SSY

=SP/√SSXSSY

“r”叫相關(guān)系數(shù),其絕對值越大,

SSU所占的比重就越大,在散點圖上就表現(xiàn)為各散點越靠近直線;反之,即SSQ所占的比重越大,各散點越遠離直線。并且有以下性質(zhì):⑴r的正負和b一樣取決于SP的正負;r>0,正相關(guān);r<0,負相關(guān)⑵r∈〔-1,1〕或r∈(-1,1);⑶決定系數(shù)

r2=b·b`或r=±√b·b`第七頁,共三十三頁,編輯于2023年,星期五第二節(jié)直線相關(guān)三、相關(guān)分析舉例例7.2為研究綿羊胸圍(cm)和體重(kg)的相互關(guān)系,調(diào)查了10只綿羊胸圍和體重的對應(yīng)觀察值X和Y,所得結(jié)果如下表,試予分析。解㈠描散點圖本例已知綿羊胸圍(X)和體重(Y)為相關(guān)關(guān)系,散點圖也顯示兩者的變化規(guī)律呈線性正相關(guān),SP>0。故可假定直線相關(guān)方程為:

y=a+bx或x=a`

+b`y后一個方程也可寫成:y=a`

+b`x綿羊12345678910ΣX(cm)68707071717173747676720Y(kg)50606865697271737577680y=a+bx807468625650第八頁,共三十三頁,編輯于2023年,星期五第二節(jié)直線相關(guān)㈡數(shù)據(jù)整理由原始數(shù)據(jù)算出一級數(shù)據(jù)6個:ΣX=720ΣY=680ΣXY=49123ΣX2=51904ΣY2=46818n=10

再由一級數(shù)據(jù)算出二級數(shù)據(jù)5個:SSX=ΣX2

-(ΣX)2/n=64SSY=ΣY2

-(ΣY)2/n=578SP=ΣXY-ΣXΣY/n=163X=ΣX/n=72?=ΣY/n=68㈢計算三級數(shù)據(jù)

b=SP/SSX

=163÷64=2.547a=72-2.547×68=-115.4b`

=SP/SSY

=163÷578=0.282a`

=68-0.282×72=52.82

即所求相關(guān)方程可以有兩個(如右圖)r=SP/√SSXSSY

0.8475r2=b·b`=2.547×0.282=0.7192y=52.82+0.282x767268405060708080706050y=2.547x-115.4第九頁,共三十三頁,編輯于2023年,星期五第二節(jié)直線相關(guān)㈣、直線相關(guān)關(guān)系的顯著性檢驗和直線回歸關(guān)系的顯著性檢驗原理一樣,直線相關(guān)關(guān)系的雙變量也可導出Y變量總SS的如下分解公式:Σ(Y-?)2=Σ(Y-y)2+Σ(y

-?)2

簡寫成:SSY=SSQ+

SSU=Q+U分別叫“非相關(guān)平方和”與“相關(guān)平方和”其計算公式引用三級數(shù)據(jù)后簡化為:

SSY=(1-r2)SSY+r2

SSY或者SSX=(1-r2)SSX+r2

SSXSSU=r2SSY=0.7182×

578=415SSQ=(1-r2)SSY=0.2818×

578=163

故F=MSU/MSQ

=20.4**

(F0.01,1,8=11.26)

=(n-2)

r2

/(1-r2)

表明雙變量直線相關(guān)關(guān)系極其顯著,所得兩個直線相關(guān)方程都可用于預測。也可對回歸系數(shù)進行t-test來證實。只是要利用df(分子)=1時,F(xiàn)=t2的關(guān)系推導出相關(guān)系數(shù)的標準誤:Sr=√(1-r2)

/(n-2)

并且Se2=SSQ/dfQ=163÷8

=20.4于是t-test的步驟如下:

H0:ρ=0(ρ為相關(guān)系數(shù)r的真值)Sr=√0.2818÷8=0.1877t=(r-ρ)÷Sr=0.8475÷0.1877=4.516(3)按自由度ν=8查得兩尾t0.01=3.355(4)推斷:t>t0.01H0

不成立。可見t-test與F-test的效果完全一致。若顯著性檢驗結(jié)果不顯著,則三選一:⑴Y與X沒有相關(guān)關(guān)系;⑵Y與X有相關(guān)關(guān)系,但不是直線相關(guān);⑶Y與X有相關(guān)關(guān)系,但不是簡單相關(guān),而是復相關(guān)。第十頁,共三十三頁,編輯于2023年,星期五第二節(jié)直線相關(guān)四、回歸與相關(guān)關(guān)系的統(tǒng)一性既然相關(guān)關(guān)系和回歸關(guān)系的顯著性檢驗原理一樣,那么,不論回歸還是相關(guān)關(guān)系,其檢驗都可用“相關(guān)系數(shù)”r

進一步簡化如下:即由t2=F=(n-2)r2/(1-r2)

解得:r=√t2/(n-2+t2)

于是利用這一關(guān)系將各個自由度下的t臨界值t0.05和t0.01換算出相關(guān)系數(shù)r的臨界值r0.05和r0.01,從而得到直接用于檢驗回歸或者是相關(guān)關(guān)系顯著性的臨界值表(附表10)。如從教材P376查得M=2,dfQ=8時

r0.05

=0.632,r0.01

=0.765今得r=0.8475**>r0.01

再由例7.1從P376查得M=2,dfQ=7時

r0.05

=0.666,r0.01

=0.798算得“r”

=0.8371**>r0.01

檢驗效果與F-test或者是t-test完全一樣。例7.2關(guān)于體重(Y)的ANOVA表:SOVDFSSYMSFF0.01相關(guān)141541520.4**

11.26非相關(guān)816320.4總9578也可針對胸圍(X)做ANOVA表:SOVDFSSXMSFF0.01相關(guān)1464620.4**

11.26非相關(guān)8182.25總964例7.1只對盛發(fā)期(Y)做ANOVA表:SOVDFSSYMSFF0.01回歸117517516.4**

12.25離回歸77510.7總8250第十一頁,共三十三頁,編輯于2023年,星期五第三節(jié)多項式回歸例7.3觀測n=7塊小麥田孕穗期的葉面積指數(shù)(x)和每667m2的籽粒產(chǎn)量(y)的關(guān)系,得結(jié)果如下,試就其數(shù)量變化特點建立多項式回歸方程并予以分析。解先描散點圖;初步判斷為二次多項式通常稱之為拋物線;這種變化關(guān)系在農(nóng)業(yè)和生物學領(lǐng)域普遍存在;完成這類實例分析的方法是將曲線單回歸的問題通過變量代換轉(zhuǎn)化為二元線性回歸的問題來解決,這也是完成更高次多項式回歸分析的基本點。田塊1234567Σ

X3.374.124.875.626.377.127.8739.34Y(kg)3493743883954013973842688第十二頁,共三十三頁,編輯于2023年,星期五y2=a+b1x+b2x2的圖象一、確定多項式方程次數(shù)的方法b2<0

b2>0當兩個變數(shù)間的曲線關(guān)系很難確定時,可以使用多項式去逼近,稱為多項式回歸(polynomialregression)。最簡單的多項式是二次多項式,其方程為:y2=a+b1x+b2x2

它的圖象是拋物線。當b2>0時,曲線凹向上,有一個極小值;b2<0時,曲線凸向上,有一個極大值,見右圖。

本例(x,y)的散點圖呈單鋒趨勢,沒有明顯的其它凹凸變化,故預期可用二次式配合。但多項式回歸方程通常只能用于描述試驗范圍內(nèi)Y依X的變化關(guān)系,外推一般不可靠,這一點首先必須明確。第十三頁,共三十三頁,編輯于2023年,星期五三次多項式的方程為:y3=a+b1x+b2x+b3x3它的圖形是具有兩個彎曲(一個極大值和一個極小值)和一個拐點的曲線。當b3>0時,這類曲線由凸向上轉(zhuǎn)為凹向上;當b3<0時,這類曲線由凹向上轉(zhuǎn)為凸向上,見右圖。

多項式方程的一般形式:

y=a+b1x+b2x2+......+bkxk

這是k-1個具有個彎曲(k-1個極值)和k-2

個拐點的曲線;兩個變數(shù)的n對觀察值最多可配到k=n–1次多項式;k越大,包含的統(tǒng)計數(shù)越多,計算和解釋越復雜;一個多項式回歸方程應(yīng)取多少次為宜,可根據(jù)資料的散點圖作出初步選擇;散點圖趨勢所表現(xiàn)的曲線的

峰數(shù)+谷數(shù)+1,即為多項式回歸方程次數(shù)。散點波動較大或峰谷兩側(cè)不對稱,可再高一次。一、確定多項式方程次數(shù)的方法b3>0b3<0y3=a+b1x+b2x2+b3x3

的圖象第十四頁,共三十三頁,編輯于2023年,星期五二、建立多項式回歸方程㈠變量代換(代換得到的變量個數(shù)以m表示)設(shè)例7.3的二次多項式方程為:y2=a+b1x+b2x2

令x1=x,x2=x2

則方程線性化為:y2=a+b1x1+b2x2㈡數(shù)據(jù)整理由原始數(shù)據(jù)算出一級數(shù)據(jù)9個:

ΣX1=ΣX=39.34ΣY=2688ΣX1Y=ΣXY=15229.56ΣX2

=ΣX2=236.8408ΣY2=1034112.00ΣX1X2=ΣX3=1508.0760n=7ΣX22=ΣX4=10029.7617ΣX2Y=ΣX2Y=92170.76

再由一級數(shù)據(jù)算出二級數(shù)據(jù)9個:

SS1=ΣX2

-(ΣX)2/n=15.75SS2=ΣX22

-(ΣX2)2/n=2016.39556SP10=ΣX1Y-ΣX1ΣY/n=123SP20=ΣX2Y-ΣX2ΣY/n=1223.8928

SP12=SP21=ΣX1X2

-ΣX1ΣX2/n=177.030704SSY=1920?=ΣY/n=384x1=ΣX1/n=5.62x2=ΣX2/n=33.8344㈢仍按“最小二乘方”原理計算三級數(shù)據(jù)bi

例7.1已知a=?-bx,則二次多項式可類推,即:a=?-b1x1

-b2x2

也就是列方程組求算各回歸系數(shù)時,不必把常數(shù)項列為未知數(shù)求解,這樣一來,就可用階數(shù)更少的矩陣運算來減少解方程的工作量。第十五頁,共三十三頁,編輯于2023年,星期五二、建立多項式回歸方程

1、只將bi列為未知數(shù)求解的方法;對于任意次多項式,y=a+b1x+b2x2+......+bkxk

若令x1=x,x2=x2,……,xk=xk,則該式可化為:yk=a+b1x1+b2x2+......+bkxk

這時多元線性方程采用矩陣方法只需求m=k元方程組的解。

SS11SP12

…SP1k

b1

SP10SP21SS22…SP1k

b2

SP20A

..…

.,b=.Z=.

SPm1SPm2

…SSmkbk

SPm0

也就是說,以二級數(shù)據(jù)為元素構(gòu)建的矩陣Ab=Z階數(shù)只有m×m

。求得A-1,并由b=A-1Z

可獲得相應(yīng)的多項式回歸方程中k個回歸系數(shù)bi的解,本例m=k=2,求解過程如下:A=

SS11SP12

15.750000177.030704

,Z=SP10

=123.0000

SP21SS22177.0307042016.395336SP20

1223.8926第十六頁,共三十三頁,編輯于2023年,星期五二、建立多項式回歸方程

1、只將bi列為未知數(shù)求解的方法;采用矩陣方法求解的關(guān)鍵在于求逆矩陣,這屬于線性代數(shù)范圍的知識,教材分別在P171和P195提示了逆矩陣求算方法,本例用二級數(shù)據(jù)構(gòu)建兩個矩陣后簡化了計算,只需對二階矩陣求逆(Cij叫高斯乘數(shù)),結(jié)果如下:A-1=

SS11SP12

-1

4.819803-0.42315765=

C11

C12

SP21SS22-0.423157650.03764733C21C22

b=A-1Z=4.819803-0.42315765123.0000

74.936168-0.423157650.037647331223.8926-5.972095

于是獲得本例多項式回歸方程中兩個回歸系數(shù):b1=74.9,b2=-5.97a=?-b1x1

-b2x2

=384-74.9×5.62-(-5.97)×33.8344=165.05I=A-1A=1.0000005680.000000346≈10(單位矩陣)0.0000063801.000003942

01第十七頁,共三十三頁,編輯于2023年,星期五二、建立多項式回歸方程

2、把常數(shù)項a列為未知數(shù)求解的方法;對于任意次多項式,y=a+b1x+b2x2+......+bkxk

若令x1=x,x2=x2,……,xk=xk,則該式可化為:yk=a+b1x1+b2x2+......+bkxk

一般的多元線性方程,采用矩陣方法需求m+1

元方程組的解。

1x12x22…xk21x12x122…x12ky11x11x21…xk11x11x112

…x11ky2X

...….=

...…

.,Y=.

1x1nx2n

…xkn1x1nx1n2

…x1nyn

求得X`X,X`Y和(X`X)-1,并由b=(X`X)-1(X`Y)

獲得相應(yīng)的多項式回歸方程中k個回歸系數(shù)bi和一個常數(shù)項a的解。教材從直線回歸的內(nèi)容開始就介紹了利用矩陣計算三級數(shù)據(jù)a和b并進行顯著性檢驗的方法,以此作為用矩陣進行多元回歸與相關(guān)分析的鋪墊。這在當今電腦普及的時代意義非同小可,因為用矩陣進行回歸與相關(guān)分析可一石三鳥:⑴更容易理解計算機解方程的程序;⑵其中的m+1階(或m=k階)逆矩陣可驗證所得方程組的解是否正確包括其精度是否足夠;⑶該逆矩陣的對角線上的元素用于檢驗回歸與相關(guān)關(guān)系的顯著性非常方便。第十八頁,共三十三頁,編輯于2023年,星期五

13.3711.356934914.1216.9744374X=∶∶∶Y=∶

17.8761.9369384739.34236.8408X`X=39.34236.84081508.0760

236.84081508.076010029.76172688X`Y=

15229.5692170.76E:\matlabR12\bin\win32\matlab.exe165.03532698b=

74.89269841

-5.96825397

圖11.13小麥孕穗期葉面積指數(shù)與產(chǎn)量的關(guān)系至此即獲得了二元線性回歸方程y2=165.03532698+74.89269841x1

-5.96825397x2y2=165.04+74.89x-5.97x2二、建立多項式回歸方程第十九頁,共三十三頁,編輯于2023年,星期五本例互逆矩陣驗算結(jié)果

(m+1)×(m+1)

34.52472939-12.762465601.10370464(X`X)-1=

-12.762465604.81693498

-0.422904171.10370464-0.422904170.037624930.99926016-0.00000296-0.00001274

(X`X)(X`X)-1=-0.023255000.99990676

-0.00040240

-0.04719600-0.000188300.99919211

1

00

I

0

1

0

0

0

1

739.34236.8408X`X=

39.34236.84081508.0760236.84081508.076010029.7617第二十頁,共三十三頁,編輯于2023年,星期五多項式回歸分析中,Y變量的總平方和SSY亦可分解為回歸和離回歸兩部分,即:SSY=SSU+SSQ

上式中,SSU為k次多項式的總回歸效應(yīng)平方和,即Y變量總變異中能被X的k次多項式所說明的部分,計算過程用矩陣表述為:SSY=Y(jié)`Y-(1`Y)2/n

=1034112.00-26882/7=1920.00SSQ為k次多項式的離回歸平方和,其中:SSQ=Y(jié)`Y-b`(X`Y)=12.7143

=1034112.00-(165.0353269874.89269841–5.96825397)(X`Y)SSU

=SSY-SSQ=1920.00-12.7143=1907.2857

也可利用二、三級數(shù)據(jù)直接計算總回歸效應(yīng)平方和SSU:

SSU

=b1SP10+b2SP20=1907.9436

=74.9362×123.0000+(-5.9721)×1223.8928SSQ

=SSY-SSU=1920.00-1907.9436=12.0564三、多項式回歸的假設(shè)測驗第二十一頁,共三十三頁,編輯于2023年,星期五㈠總回歸關(guān)系的F-test將Y變量的總平方和SSy分解成多項式回歸(SSU)和離回歸(SSQ)兩部分。前者由X的各次分量項的引起,包括一次回歸效應(yīng)和二次回歸效應(yīng),具有自由度df=k;后者與X的不同無關(guān),具有自由度df=n-(k+1),也就是誤差效應(yīng)。于是:

F=(SSU/k)/(SSQ/[n-(k+1)])可測驗多項式回歸關(guān)系的真實性。根據(jù)本例已算得的結(jié)果,可作成方差分析表于下。該表的F測驗結(jié)果極其顯著,表明用所得二次多項式來描述葉面積指數(shù)與畝產(chǎn)量是可行的。二次多項式回歸關(guān)系的F-test表

變異來源DFSSMSFF0.01

多項式回歸

21907.2857953.6429300.02**

18.00

離回歸

412.71433.1786

總61920.00第二十二頁,共三十三頁,編輯于2023年,星期五㈡總回歸關(guān)系的R-test同多元相關(guān)系數(shù)Ry.12..m相類似,k次多項式的回歸平方和占Y總平方和的比率的平方根值(記作Ry.x.x2,….,xk),可用來表示Y與X的多項式的相關(guān)密切程度,即有:Ry.x.x2,….,xk

=√SSU/SSY

上式中的Ry.x.x2,….,xk叫相關(guān)指數(shù)。和線性相關(guān)的情況一樣:R2y.x.x2,….,xk=SSU/SSY

表示k次多項式的決定系數(shù),即在Y的總平方和SSY中,可由X的k次多項式引起的平方和SSU所占的比率。

Ry.x.x2,….,xk的顯著性可通過查表直接獲知。如本例查附表10,當df=4,k=2(即附表10中的M=k+1=3)時,R0.01=0.949,于是:Ry.x.x2,….,xk=√1907.2857÷1920.00=0.9967**>

R0.01

故Y與X的二次多項式的“復相關(guān)”(總回歸)關(guān)系極顯著。對于Ry.x.x2,….,xk的測驗和本例F-test結(jié)論完全一致,擇一即可。但不論F-test還是R-test都只是一個綜合性測驗,表明葉面積指數(shù)與畝產(chǎn)量需要一個多項式來描述,并不能證實k次項或者其它各次項的顯著性。第二十三頁,共三十三頁,編輯于2023年,星期五㈢各次分量項偏回歸關(guān)系的F-test本例總回歸效應(yīng)極顯著既然不能排除多項式方程中個別乃至若干個分量項不顯著的可能性,就有必要分別對各次分量項進行偏回歸關(guān)系的F-test。這與多元線性回歸中偏回歸關(guān)系的假設(shè)測驗相類似,亦需先計算各次分量項的偏回歸平方和SSbi,即:SSbi=bi2/C(i+1)(i+1)

此時SSbi具有自由度df=1,故由:F=SSbi/(SSQ/[n-(k+1)])可測驗第i次分量是否顯著。本例由逆矩陣對角線上的元素算得Y對各次分量項的偏回歸平方和為:

SSb1=74.892698412/4.81693498=1164.4160SSb2=(-5.96825397)2/0.03762493=946.7142變異來源DFSSMSFF0。01一次分量11164.41601164.4160366.33**21.20二次分量1946.7142946.7142297.84**離回歸412.71433.1786

總61920.00

結(jié)果表明,在用二次多項式描述葉面積指數(shù)與畝產(chǎn)量時,二次分量和一次分量均應(yīng)保留(但SSU≠SSb1+SSb2

!

)。第二十四頁,共三十三頁,編輯于2023年,星期五各次分量項的F測驗表變異來源DFSSMSFF0。01一次分量11164.41601164.4160366.33**21.20二次分量1946.7142946.7142297.84**離回歸412.71433.1786

結(jié)果表明,在用二次多項式描述教材表11.4資料時,二次分量和一次分量均應(yīng)保留。㈢各次分量項偏回歸關(guān)系的F-test第二十五頁,共三十三頁,編輯于2023年,星期五課后習題以光呼吸抑制劑亞硫酸氫鈉的不同濃度溶液(x,100mg/L)噴射滬選19水稻,2小時后測定劍葉的光合強度(y,co2mg/dm/h),得結(jié)果于下表。試計算(1)光合強度依亞硫酸氫鈉濃度的多項式回歸方程及離回歸標準差。(2)光合強度最高時的亞硫酸氫鈉濃度。X012345Y19.1023.0523.3321.3320.0519.35第二十六頁,共三十三頁,編輯于2023年,星期五第四節(jié)協(xié)方差分析例7.4有一大豆浸種試驗研究結(jié)果,k=10,隨機區(qū)組設(shè)計,n=3,每個試驗小區(qū)(1.5m2)點播的種子粒數(shù)均等。以各小區(qū)大豆收獲時的籽粒干重(10g)為試驗指標進行觀察記載。考慮到每個小區(qū)結(jié)莢株數(shù)只占小區(qū)總株數(shù)的一部分,并且與該小區(qū)試驗指標之間可能存在著回歸關(guān)系,故在稱量小區(qū)干重y的同時,對其結(jié)莢株數(shù)x一并予以記載(見下圖),試進行協(xié)方差分析。N6.5J176.5E206.8I157.3D1210.8G198.0B1910.5H2010.1F228.0C149.7A2513.0B2117.5F2313.3J2418.4H2216.5C2816.0A2017.2D2414.0I2318.8G2615.5E2115.0A2619.5C3020.6D2914.3E2623.2G3714.8F2815.5I2915.4J2820.5H2616.4B27肥力梯度第二十七頁,共三十三頁,編輯于2023年,星期五一、數(shù)據(jù)整理處理XYXYXYTxtTytXt?t?t`A259.72016.02615.07140.723.6713.5713.49B198.02113.02716.46737.422.3312.4712.75C148.02816.53019.57244.024.0014.6714.50D127.32417.22920.66545.121.6715.0315.49E206.52115.52614.36736.322.3312.1012.38F2210.12317.52814.87342.424.3314.1313.87G1910.82618.83723.28252.827.3317.6016.53H2010.52218.42920.56849.422.6716.4716.66I156.82314.02615.56736.322.3312.1012.38J176.52413.32815.46935.223.0011.7311.83Txr183232286701ΣXΣY419.623.37x?13.99Tyr84.2160.2175.2Cx=(ΣX)2/nk=16380SSx=ΣX2

-Cx=816.97Cy=(ΣY)2/nk=5868.8SSy=ΣY2

-Cy=628.69Cxy=ΣXΣY/nk=9804.7SPT=ΣXY-Cxy=574.16第二十八頁,共三十三頁,編輯于2023年,星期五二、dfT、SPT、SSx、SSy的分解dfT=dft+dfr

+dfe29

=9

+2+18SPT=SPt

+SPr+SPeSPt=ΣTxt·Tyt/n-Cxy=52.68=71×40.7+67×37.4+…+69×35.2SPr=ΣTxr·Tyr/k-Cxy=463.57

=183×84.2+232×160.2+286×175.2SPe=SPT-SPt-SPr

=57.91SSxt=ΣTxt2/n-Cx=71.64=(712+672+……+692)/3-16380SSxr=ΣTxr2/k-Cx=530.87=(1832+2322+2862)/10-16380SSxe=SSx

-SSxt-SSxr=214.46SSyt=ΣTyt2/n-Cy=106.41=(40.72+37.42+…+35.22)/3-5868.8SSyr=ΣTyr2/k-Cy=476.07=(84.22+160.22+175.22)/10-5868.8SSye=SSy

-SSyt-SSyr=46.21三、SSye、dfye

的再分解與F-testSSue=SPe2/SSxe=15.64

=57.912/214.46SSQe=SSye-SSue=30.57

=46.21-15.64dfye=dfue+dfQe18

=1+17得檢驗回歸關(guān)系的ANOVA表如下:SOVDFSSMSFF0.01回歸115.6415.648.69**

8.41離回歸1730.571.80總1846.21

本例因為結(jié)莢株數(shù)與籽粒干重的直線回歸關(guān)系極其顯著,必須將試驗指標的方差分析過程與回歸分析結(jié)合起來,也就是要做協(xié)方差分析。否則(即回歸關(guān)系的F-test不顯著),就可不必理睬協(xié)變量而直接對干重指標進行方差分析。第二十九頁,共三十三頁,編輯于2023年,星期五四、列協(xié)方差分析表,修正部分數(shù)據(jù)后再進行F-testSOVDFSSxSPSSySSy`DF`MS`FF0.01

處理t971.6452.68106.4179.3098.894.89**3.68

誤差e18214.4657.9146.2130.57171.80t+e27286.10110.59152.62109.8726

區(qū)組2530.87463.57476.07

總29816.97574.16628.69

既然協(xié)變量x與試驗結(jié)果y之間的回歸關(guān)系極其顯著,各誤差項或包含有誤差項的數(shù)據(jù)(平方和)就必須再分解為回歸效

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論