版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1 第第10章章 一元回歸及簡單相關(guān)分析一元回歸及簡單相關(guān)分析 2 10.1 回歸與相關(guān)的基本概念回歸與相關(guān)的基本概念 10.2 一元線性回歸方程一元線性回歸方程 10.3 一元線性回歸的檢驗一元線性回歸的檢驗 10.4 一元非線性回歸一元非線性回歸 10.5 相關(guān)相關(guān) 3 前面討論的問題都只涉及一種變量,盡管方差分析檢 驗的是多個平均數(shù)間的差異是否顯著。 客觀世界中的許多事物彼此間都存在有機(jī)的聯(lián)系,它 們之間互相依賴、互相制約、互相作用。從數(shù)學(xué)的角度, 可將這種聯(lián)系用變量間的關(guān)系來描述。兩個變量或多個變 量間的關(guān)系問題,在環(huán)境與生態(tài)研究中很常見。 兩變量或多變量之間的關(guān)系,總起來說可以分為兩
2、類: 一類是確定的函數(shù)關(guān)系,例如圓面積和半徑的關(guān)系、氣體 定律pV= RT中的各個量的關(guān)系,一個量可由其余量按公式 準(zhǔn)確求出;另一類為非確定的關(guān)系。 10.1 回歸與相關(guān)的基本概念回歸與相關(guān)的基本概念 4 多個變量具有確定關(guān)系的例子, 在自然界中很少見, 大量存在的是非確定的關(guān)系:一種變量受另一種變量影響, 兩者之間既有關(guān)系,但又不存在完全確定的函數(shù)關(guān)系。知 道其中一個變量,不能精確求出另一變量。例如: (1)單位面積的產(chǎn)量與施肥量、播種量的關(guān)系。施肥量 與播種量適合時,產(chǎn)量較高;施肥量與播種量不適合時, 產(chǎn)量較低。 但是這種關(guān)系并不是完全確定的,即使在施 肥量與播種量完全相同的情況下,產(chǎn)量也
3、并不確定。 (2)人類血壓與年齡的關(guān)系。通常年齡越大血壓越高。 但是影響血壓的因素很多,并不能根據(jù)一個人的年齡得出 他的血壓值。 5 (3)森林中,樹木胸徑與高度的關(guān)系。一般胸徑越大, 樹木越高;胸徑越小,樹木越矮,但這種關(guān)系也不是確定 的,僅僅依據(jù)樹木的胸徑,并不能確定其高度。 (4)玉米的穗長與穗重的關(guān)系。一般穗越長,越重,但 僅憑穗長,并不能得出穗重。 (5)人的身高與體重的關(guān)系。通常身體越高,體重越重, 但身高與體重并不存在嚴(yán)格的函數(shù)關(guān)系,即知道身高并不 能得知準(zhǔn)確體重。 大量測量身高、體重時會發(fā)現(xiàn):同樣身高下,體重并 不完全一樣,但每一身高下,都有一個確定的體重分布有一個確定的體重分
4、布; 反之,每一體重下,也都有一個身高分布有一個身高分布與之相對應(yīng)。統(tǒng) 計學(xué)將這種非確定關(guān)系稱為統(tǒng)計相關(guān)關(guān)系(relationship)。 6 設(shè)有兩個隨機(jī)變量X和Y,對于任一隨機(jī)變量的每一個 可能的值,另一個隨機(jī)變量都有一個確定的分布與之相對 應(yīng),則稱這兩個隨機(jī)變量間存在相關(guān)相關(guān)(correlation)關(guān)系。 因此,血壓與年齡、樹木的胸徑與高度、玉米穗長與穗重 之間都存在相關(guān)關(guān)系。 在環(huán)境與生態(tài)學(xué)中,研究兩變量間的關(guān)系,主要是為 了探求兩變量的內(nèi)在聯(lián)系(相關(guān)),或者是從一個變量X (可以是隨機(jī)變量,也可以是一般的變量)去推測另一個 隨機(jī)變量Y (回歸)。例如,我們希望通過施肥量X推測 產(chǎn)量
5、Y。施肥量是可以嚴(yán)格地人為控制的,因此它只是一 個一般的變量。在由穗長(X)去推測穗重(Y)的情況中,因 為穗長并不能人為控制,所以它是一個隨機(jī)變量。 7 若變量X的每一個可能值xi,都有隨機(jī)變量Y的一個分 布相對應(yīng),稱Y對X存在回歸回歸(regression)關(guān)系,X稱自變量自變量 (independent variable),Y稱因變量因變量(dependent variable)。 “回歸”一詞由英國統(tǒng)計學(xué)家F Galton首先提出。他在 研究父親身高與兒子身高間的關(guān)系時發(fā)現(xiàn):高個子父親 (高于群體平均數(shù))的兒子比他更高的概率小于比他矮的 概率;矮個子父親(矮于群體平均數(shù))的兒子比他更矮
6、的 概率小于比他高的概率。換句話說, 兒子的身高有向群 體平均身高回歸的趨勢。這是為什么呢? Pearson做了一個 解釋:任何一個兒子都不僅僅是他父親的產(chǎn)物,也是過去 祖先的產(chǎn)物,如果往上追溯10代,他的祖先的個數(shù)為2的 10次方,即有1 024個祖先,他就是這1 024個祖先的平均 值的產(chǎn)物,而這個平均數(shù)應(yīng)接近群體平均數(shù),所以出現(xiàn)了 回歸現(xiàn)象。 8 在回歸關(guān)系中,我們要研究的是自變量發(fā)生一定量的 變化時,可期望因變量會相應(yīng)發(fā)生多大變化,即要利用自 變量的取值來對因變量的取值做出估計或預(yù)測。 有回歸關(guān)系的兩變量,對于任一xi都不會有一個確切 yi的相對應(yīng),但為了描述兩變量的數(shù)量關(guān)系,可選當(dāng)X
7、=xi 時Y的平均數(shù)YX=xi與之相對應(yīng),YX稱為Y的條件平均數(shù)條件平均數(shù) (conditional mean)。如何估計YX,就是一元回歸問題。 若X也是隨機(jī)變量,Y對X存在回歸關(guān)系、X對Y也存在 回歸關(guān)系,我們不關(guān)心兩個變量是誰影響誰即誰是因、誰 是果,兩個變量是對等的,這時稱X和Y間存在相關(guān) (correlation)關(guān)系。很多時候并不嚴(yán)格區(qū)分相關(guān)與回歸。 9 10.2 一元線性回歸方程一元線性回歸方程 10.2.1 散點圖散點圖 10.2.2 一元正態(tài)線性回歸模型一元正態(tài)線性回歸模型 10.2.3 參數(shù)參數(shù) 和和 的估計的估計 10.2.4 回歸方程的計算回歸方程的計算 10 10.2
8、.1 散點圖散點圖 研究兩個變量的關(guān)系,首先要收集數(shù)據(jù)。從變量X中 得到x1,從Y中得到y(tǒng)1,x1和y1這一對數(shù)據(jù)必須是有內(nèi)在聯(lián) 系的。例如,從同一種材料、同一個人或同一頭動物中, 獲得的兩個不同的特征。在身高與體重的研究中,一定要 用同一個人的身高與體重作一對數(shù)據(jù), 決不能用A的身高 與B的體重配成一對數(shù)據(jù)。在收集到許多對數(shù)據(jù)之后,最 好先作出一個散點圖,直觀地描述一下兩變量之間的關(guān)系。 用自變量X為橫軸,因變量Y為縱軸,在XY平面內(nèi)標(biāo)出(x1, y1),(x2, y2),.,(xn, yn)這些點,就構(gòu)成一幅散點圖幅散點圖 (scatter diagram)。 11 例如,土壤中NaCl含
9、量對植物的生長有很大的影響。 NaCl含量過高,將增加組織內(nèi)無機(jī)鹽的累積, 抑制植物 的生長。表10-1中的數(shù)據(jù),是每1000 g土壤中所含NaCl的 不同克數(shù)(X)對植物單位葉面積干物重(是葉片肉質(zhì)化的 指標(biāo),可反映植物生理干旱程度)的影響(Y)。 表表10-1 不同不同NaCl含量對單位葉面積干物重的影響含量對單位葉面積干物重的影響 土壤NaCl含量X/(gkg-1)00.81.62.43.244.8 干物重Y/(mgdm-2)809095115130 115 135 圖10-1是用以上7對數(shù)據(jù)作出的散點圖。 12 根據(jù)散點圖考慮以下幾個問題: (1) 兩變量之間的關(guān)系是否密切,或者說,我
10、們能否 由X來估計Y。 (2) 兩變量之間的關(guān)系是呈一條直線(即線性的), 還 是呈某種曲線(即非線性的)。 (3) 是否存在某個點偏離過大。 (4) 是否存在其他規(guī)律。 13 從圖10-1可看出,干物重與NaCl含量間呈直線關(guān)系。 但這些點并不在一條直線上。若增加在每一NaCl含量下的 觀測次數(shù),這種線性關(guān)系可以更明朗些。表10-2是每一 NaCl含量下干物重的10次重復(fù)觀測值。 表表10-2 每一每一NaCl含量下干物重的含量下干物重的10次重復(fù)觀測值次重復(fù)觀測值 土壤NaCl含量X/(gkg-1) 00.81.62.43.24.04.8 干物重 Y/(mgdm-2) 重復(fù)觀測值 1809
11、095115130115135 2100858994106125137 375107115103103128128 4899392110110143127 591103115113128132155 67992120108131121132 71017895121117129148 88510595110121112117 98393105108114120134 10798598111116130132 14 圖10-2 每一NaCI含量下干物重10 次重復(fù)觀測的散點 圖,“”表示在各xi處y的平均值;“+” 是圖10-1中的各 點,即表10-2中第1次觀測的數(shù)據(jù)。 15 圖10-2是用以上
12、數(shù)據(jù)繪成的散點圖??梢钥闯?,增加 觀測次數(shù),并求出每一xi 處Y的平均數(shù),用這些平均數(shù)作 出來的點比圖10-1中的7個散點更接近于直線。如果繼續(xù) 增加觀測次數(shù),它們的平均數(shù)就更趨于直線,我們就用這 樣一條直線描述兩變量間存在的數(shù)量關(guān)系。 在實際應(yīng)用時,不可能無限重復(fù)實驗,在散點圖上, 只能作出少數(shù)有限個點。在點比較少的情況下(圖10-1), 表示兩變量之間關(guān)系的直線可以畫出許多條,其中哪一條 是最好的呢?這是一元線性回歸的重要問題。 16 10.2.2 一元正態(tài)線性回歸模型一元正態(tài)線性回歸模型 若X是可控的變量,如表10-2中的 數(shù)據(jù),在實驗無限重復(fù)之后,可得到 在各xi上的Y的條件平均數(shù)YX
13、,這些 平均數(shù)構(gòu)成一條直線。 為直線的截距,為斜率,統(tǒng)稱回歸參數(shù)。 上式含義: 對于變量X的每一個值,都有一個Y的分布,這個分布的平 均數(shù)(數(shù)學(xué)期望)是該式給出的線性函數(shù)。Y的每一個分 布的方差都必須是2,它完全獨立于X。對于每一給定的X, Y始終服從正態(tài)分布。該模型可理解為:對于X的每個特定 取值Xi,Y都有一個服從正態(tài)分布的取值范圍與之對應(yīng), 這個正態(tài)分布的期望是+Xi,方差是2,如上圖。 線性回歸模型示意圖。 17 由(10.2)式得出的回歸模型回歸模型(regression model),只包 含一個自變量(X)且具有正態(tài)性,所以稱為一元正態(tài)線一元正態(tài)線 性回歸模型性回歸模型(simp
14、le normal linear regression model)。 另外,記為對于給定的X,Y的觀測值與直線YX的 離差,該離差為一隨機(jī)誤差,它獨立于X且服從同一正態(tài) 分布N(0, 2)。 18 10.2.3 參數(shù)參數(shù) 和和 的估計的估計 一般情況下,只能通過實驗或調(diào)查獲得有限對數(shù)據(jù)。 因此,得不到真正的和。只能求出它們的估計值a和b, 從而得到一條估計的直線,即 用 估計YX ,即對每一個固定的X的值x0,用 做Y 的總體平均數(shù) 的估計值。“”的意思是“估計 值”。(10.3)式稱為Y對X的回歸方程回歸方程(regression equation)。 根據(jù)回歸方程畫出的直線稱為回歸線回歸
15、線(regression line)。b 是直線的斜率,稱為回歸系數(shù)回歸系數(shù)(regression coefficient)。現(xiàn) 在的問題是怎樣通過實際數(shù)據(jù),得到總體回歸和的最好 點估計a和b 。 19 平均數(shù)有一個特性,即在各種離差平方和中,以距平 均數(shù)的離差平方和最小。在回歸問題中,則在 xi 處 Y 的實 際觀測yi對它們的條件平均數(shù) 離差平方和最小。 因此,我們就把 yi 距 的估計值 的離差 平方和為最小的直線作為最好的回歸線。通過 實際調(diào)查,得到n對數(shù)據(jù):(x1, y1), (x2, y2), , (xn, yn)。其中 每一個xi都可能得到一個 , 。于是把觀測值與 回歸估計值之
16、間的離差平方和 達(dá)到最小時的 回歸線作為最好的回歸線。求出使L達(dá)到最小時的a和b, 這種方法稱為最小二乘法最小二乘法(method of least square)。圖10-3 是最小二乘法示意圖。 20 圖10-3 最小二乘法示意圖 21 為使 達(dá)到最小,令則可得到以下一組聯(lián)立方程: 整理成以下形式: 22 (10.5)式稱為正規(guī)方程正規(guī)方程(normal equation)。解正規(guī)方程,得 到的最小二乘估計: 及a的最小二乘估計: 其中, , 。(10.6)式的分子稱為X和Y的 校正交叉乘積和校正交叉乘積和(corrected sum of cross products),用SXY 表示。
17、 23 (10.6)式分母,稱為X的校正平方和校正平方和(corrected sum of squares),用SXX表示。 另外,SYY稱為關(guān)于Y的總校正平方和。 用以上符號表示時,回歸系數(shù)b可以寫成: 24 10.2.4 回歸方程的計算回歸方程的計算 不論自變量是可控的變量,還是隨機(jī)變量,均可按上 述方法求出回歸方程。 例例10.1 根據(jù)表10-1的數(shù)據(jù),計算干物重關(guān)于NaCl含量 的回歸方程。將表10-1的數(shù)據(jù)編碼后,整理成表10-3: 表表10-3 NaCl含量對葉子干物重影響的回歸方程計算表含量對葉子干物重影響的回歸方程計算表 XX=X-2.4 X 2 YY=Y-110 Y 2 XY
18、 0-2.45.7680-3090072 0.8-1.62.5690-2040032 1.6-0.80.6495-1522512 2.4001155250 3.20.80.641302040016 41.62.561155258 4.82.45.761352562560 和017.92-102 600200 25 分別求出SXY, SXX, SYY: 從而回歸方程為: 26 回歸系數(shù)b11.16的含義:當(dāng)自變量X每變動1個單位,因 變量Y平均變動11.16個單位。圖10-4為該例的散點圖及回 歸線。 27 10.3 一元線性回歸的檢驗一元線性回歸的檢驗 10.3.1 b和和a的數(shù)學(xué)期望與方差的
19、數(shù)學(xué)期望與方差 10.3.2 b和和a的顯著性檢驗的顯著性檢驗 10.3.3 兩個回歸方程的比較兩個回歸方程的比較 10.3.4 一元回歸的方差分析一元回歸的方差分析 10.3.5 點估計與區(qū)間估計點估計與區(qū)間估計 10.3.6 一元回歸分析的意義一元回歸分析的意義 28 10.3.1 b和和a的數(shù)學(xué)期望與方差的數(shù)學(xué)期望與方差 一元線性回歸實測值可以表示為: 因無法得到真正的和,故每個實測值只能由下式描述: 用a估計,b估計,ei估計i。下面分別給出這幾個量的 數(shù)學(xué)期望和方差。從a和b的數(shù)學(xué)期望可以看出,a和b分別 是和的無偏估計量。先計算回歸系數(shù)b的數(shù)學(xué)期望: 29 a的數(shù)學(xué)期望: 由此可見
20、,b是的無偏估計量。下面計算b的方差: a的方差: 30 除了求出以上兩個估計量之外,還需要求出2的估計 量。為了得到2,需要收集大量的,由(10.11)式得 由于和都是未知的,因此不可能得到i的值,而只 能通過和的估計值a和b得到i的估計值ei。由( 10.12 ) 式 得 ei稱為殘差殘差或剩余剩余(residual),它是實測點到回歸估計 點的距離,或者說是實測值與回歸值之間的離差。 稱 為誤差平方和誤差平方和或剩余平方和剩余平方和(residual sum of squares),用 SSE表示: 31 可以證明 MSE為剩余均方,是2的無偏估計量,從而得出樣本回歸 系數(shù)b的方差 和a
21、的方差 故 32 10.3.2 b和和a的顯著性檢驗的顯著性檢驗 1. b的顯著性檢驗 兩變量之間的線性回歸的顯著程度是由決定的。當(dāng) 0時,兩變量間不存在線性關(guān)系。由于b有自己的分 布 ,在得到樣本回歸系數(shù)b之后,還必須對H0: 0的假設(shè)做檢驗。如果不能拒絕H0:0,就沒有足夠 理由認(rèn)為Y和X之間存在線性關(guān)系。這時線性模型簡化為 Y+。因無法得到b2,只能用sb2估計,所以回歸系數(shù)的 顯著性需用t檢驗。零假設(shè)H0:0,備擇假設(shè)0。因sb 是回歸系數(shù)的標(biāo)準(zhǔn)誤差,因此,使用的統(tǒng)計量: 33 服從n-2自由度的t分布。因HA:0,故為雙側(cè)檢驗,當(dāng) 時拒絕H0。 例例10.2以例10.1的數(shù)據(jù)為例檢驗
22、H0:0;HA:0。 解:解:在=0的假設(shè)下,檢驗統(tǒng)計量為: 計算MSE: t5, 0.0054.032,tt0.005,即P0.01,拒絕H0,結(jié)論是干 物重關(guān)于NaCl含量的回歸極顯著。 34 另外,使用t檢驗,還可檢驗具有某一給定值的假設(shè)。 這時H0:0,HA:0。檢驗統(tǒng)計量 例例10.3利用例10.1中的數(shù)據(jù)檢驗H0:7;HA:7。 解:解:用(10.22)式所給出的統(tǒng)計量做檢驗。 t5, 0.0252.571,t0.05,接受H0。結(jié)論是, b很可能抽自=7的總體。 35 2. a的顯著性檢驗 對a的處理類似于b。可以對H0:0做檢驗,也可以 對H0:0做檢驗。當(dāng)0的假設(shè)真實時,模型
23、將變?yōu)?YX+。在H0:0時,因sa是a的標(biāo)準(zhǔn)誤差,故檢驗統(tǒng) 計量為: 在H0:0時,檢驗統(tǒng)計量: 36 例例10.4利用例10.1 中的數(shù)據(jù)檢驗H0:0;HA:0 解:解:根據(jù)備擇假設(shè),本例為雙側(cè)檢驗,檢驗統(tǒng)計量由 (10.23) 式給出。其中的sa為: 其中的MSE已經(jīng)在例10.2計算出。統(tǒng)計量的值: t5, 0.0252.571,tt5, 0.025,結(jié)論是拒絕H0:0。 37 例例10.5 利用例10.1數(shù)據(jù)檢驗H0:100;HA:100 解:解:由(10.24)式所給出的統(tǒng)計量做檢驗,統(tǒng)計量 的值為: t5, 0.0252.571,|t| t0.025,結(jié)論是拒絕H0:100的假 設(shè)
24、 。 38 10.3.3 兩個回歸方程的比較兩個回歸方程的比較 使用t檢驗,還可以檢驗假設(shè)H0:1-20和H0:1- 20。在對兩個回歸方程的b和a的差異顯著性檢驗之后, 就能判斷他們是否來自同一總體。若抽自同一總體,則可 以將它們合并為一個回歸方程。這個檢驗過程常常稱為兩 個回歸方程或兩條回歸線的比較。 例例10.6 優(yōu)質(zhì)育種工作中為快速篩選優(yōu)良原始材料, 用染料(DBC)法測定種子中的堿性氨基酸含量。它的原理 是:一種染料orange G與堿性氨基酸結(jié)合,使原來染料濃 度降低。再通過測定染料減少的量,來估計堿性氨基酸的 含量。已經(jīng)計算出堿性氨基酸含量與DBC法測得結(jié)果之間 有顯著回歸。實驗
25、測定了大麥和黑麥每千克(kg)試樣的染 料結(jié)合力(DBC)與堿性氨基酸含量,結(jié)果見表10-4: 39 表表10-4 使用使用DBC法測定的大麥和黑麥堿性氨基酸含量法測定的大麥和黑麥堿性氨基酸含量 大麥 X(每kg試樣中DBC的mmol數(shù))9193949698102 105 108 Y(每kg試樣中堿性氨基酸的mmol數(shù))6668697173788285 黑麥 X(每kg試樣中DBC的mmol數(shù))80828587899195 Y(每kg試樣中堿性氨基酸的mmol數(shù))55576062646771 將以上數(shù)據(jù)計算的結(jié)果列成表(10-5): 表表10-5 10-5 計算大麥和黑麥回歸方程的相關(guān)數(shù)據(jù)表計
26、算大麥和黑麥回歸方程的相關(guān)數(shù)據(jù)表 大麥(1)黑麥(2) n87 98.487.0 74.062.3 SXX257.9162.0 SYY336.0187.4 SXY294.0174.0 MSE0.1400.244 -38.16+1.14X-31.16+1.07X 40 檢驗兩回歸線有無顯著差異。 解:解:(1)檢驗MSE1和MSE2有無顯著差異: F5, 6, 0.0255.99,F(xiàn)F0.025,結(jié)論是兩者有一共同的總體方差, 它的估計值為: 41 (2) 檢驗回歸系數(shù)b1和b2有無顯著差異: 檢驗統(tǒng)計量: 具有(n1-2)+(n2-2)自由度。 t11, 0.05(雙側(cè))2.201,t0.05
27、,結(jié)論是兩者有一 共同的總體回歸系數(shù)。它的估計值為: 檢驗統(tǒng)計量: 42 (3)檢驗a1和a2有無顯著差異: 結(jié)論是兩者差異顯著。 檢驗統(tǒng)計量: 43 若檢驗的結(jié)果是兩者差異不顯著,這時可將a1和a2合 并起來,作為一個共同的a。首先應(yīng)求出 和 : 從而得出合并的 。由合井的b和合并的a得出合 并的回歸方程 44 10.3.4 一元回歸的方差分析一元回歸的方差分析 兩邊平方,然后對全部n個點求和: 1.無重復(fù)時的情況 對H0:0的假設(shè)做檢驗,除可用t檢驗之外,還可以 用方差分析來檢驗。 首先考慮總平方和的分解。圖10-5是yi- 分解??煽?出,每個觀測點距平均數(shù) 的離差yi- 均可分解為:
28、45 (10.30)式左邊的一項是因變量Y平方和,即Y的總校正平方 和SYY。右邊的第一項,是觀測值距回歸估計值離差的平 方和,即誤差平方和或稱為剩余平方和SSE。剩余平方和 是除了X對Y的線性影響外的一切因素對Y的變差的作用, 包括X對Y的非線性影響及實驗誤差等。等號右邊的第二項 稱為回歸平方和回歸平方和( regression sum of squares) SSR,回歸平 方和是由于X對Y的線性貢獻(xiàn)而產(chǎn)生的平方和。因此(10.30) 式可以寫成: 46 SYY具n-1自由度,SSR和SSE分別具有1和n-2自由度。因此, 均方分別為: 檢驗統(tǒng)計量: 其中 若FF1, n-2, ,則拒絕H
29、0:=0。 由(10.6), (10.19), (10.32)和(10.21) 得: 其中t是由(10.21) 式?jīng)Q定的統(tǒng)計量。由此可見,這里的方 差分析法與10.3.2的t檢驗是一致的。 47 下面以例10.1中的數(shù)據(jù)為例,做回歸顯著性的方差分 析。在10.2.4中已經(jīng)計算出 SYY 2585.71,SXY 200,b11.16 從而得出回歸平方和: SSRbSXY 11.162002 232 剩余平方和 SSRSYY -bSXY2585.71 - 2232353.71 將以上結(jié)果列成表10-6: FF1, 5, 0.01,結(jié)論是回歸極顯著。 表表10-6 例例10.1回歸方程的方差分析表回
30、歸方程的方差分析表 變差來源平方和自由度均方F 回歸2 23212 23231.55* 剩余353.71570.74 總和2 585.716 注:*0.01。 48 2.有重復(fù)時的情況 如果對于同一個自變量, 因變量重復(fù)觀測兩次以上, 則可以把實驗誤差從剩余平方和中分解出來。總校正平方 和可做如下分解: SYYSSR+SSLOF+SSPE(10.33) 其中,SSPE是純實驗誤差平方和(pure experimental error sum of squares),SSLOF為失擬平方和失擬平方和(lack of fit sum of squares),是模型選擇不當(dāng)造成的。 設(shè)實驗共收集i1
31、, 2, ., n對數(shù)據(jù),在每一xi下做了j1, 2, ., m次重復(fù)觀測。總校正平方和為: 回歸平方和: 49 純誤差平方和可以通過重復(fù)間的離差獲得: 失擬平方和是由于非線性因素等原因所引起的平方和: 自由度分別為:回歸項的自由度為1,失擬項的自由 度為n-2,純誤差項的自由度mn-n,總自由度為mn-1。從 而可以得到各項的均方。 用純誤差均方對失擬均方做檢驗: 若結(jié)果不顯著,說明失擬平方和基本上是由實驗誤差 造成。這時可以將失擬平方和與純誤差平方和合并,用合 并后的平方和對回歸平方和做檢驗: 50 若第二次檢驗的結(jié)果仍不顯著,可能的原因有兩個: (1)X與Y不存在線性關(guān)系。 (2)實驗誤
32、差過大。 若第一次F檢驗是顯著的,可能有以下幾個原因: (1)除X外還有其他影響Y的因素。 (2)模型選擇不當(dāng)。 (3)X和Y無關(guān)。 這時沒有必要用MSLOF對MSR做檢驗,即使檢驗的結(jié) 果是顯著的,也不能證明該回歸方程是最好的回歸方程。 這時應(yīng)找出造成SSLOF過大的原因, 做進(jìn)一步的分析。 51 例例10.7 以表10-2中的前兩次重復(fù)數(shù)據(jù)為例,說明在 有重復(fù)實驗情況下,回歸方程的計算及檢驗回歸顯著性的 方差分析方法。 表表10-7 表表10-2中的前兩次重復(fù)數(shù)據(jù)中的前兩次重復(fù)數(shù)據(jù) 計算有重復(fù)的回歸方程,并利用有重復(fù)方差分析方法, 檢驗回歸的顯著性。 NaCl含量X/(gkg-1) 00.
33、81.62.43.244.8 干物重 Y/(mgd m-2) 重復(fù)I809095115130115135 重復(fù)II100858994106125137 52 解:首先解:首先計算回歸方程。計算回歸方程。以NaCl含量X為自變量,干 物重Y為因變量(2次重復(fù)) ,數(shù)據(jù)整理如下表: NaCl含量含量X/(gkg-1) 00.81.62.43.244.8 干物重干物重 Y/(mg dm-2) 重復(fù)重復(fù)I809095115130115135 重復(fù)重復(fù)II100858994106125137 xy 0140294.4501.6 755.2 9601305.6 3956.8 x 2=2x2 01.285.
34、1211.52 20.483246.08116.48 y 1801751842092362402721496 x=2x01.6 3.24.86.489.633.6 y21640015325 16946 22061 2813628850 36994 164712 ( y)23240030625 33856 43681 5569657600 73984 327842 53 計算平方和: 計算a, b,得出回歸方程: 計算回歸平方和:SSR=bSXY=10.22366.40=3744.61 54 或通過或通過干物重干物重均值均值計算回歸方程:計算回歸方程:以NaCl含量X為自 變量,干物重均值為因變
35、量,數(shù)據(jù)整理如下表: NaCl含量X/(gkg-1) 00.81.62.43.244.816.8 干物重 Y/(mgd m-2) 重復(fù)I809095115130115135 重復(fù)II100858994106125137 9087.592104.5118120136748 xi200.642.565.7610.241623.0458.24 81007656.25846410920.25 13924144001849681960.5 070147.2250.8377.6480652.81978.4 計算平方和: 計算a,b,得出 回歸方程: 55 表表10-8 例例10.7有重復(fù)數(shù)據(jù)之回歸方程的方
36、差分析表有重復(fù)數(shù)據(jù)之回歸方程的方差分析表 變差來源平方和自由度均方F 回歸3 744.6113 744.6140.52 失擬318.10563.620.56 純誤差791.007113.00 總和4 853.7113 第2步把失擬平方和與誤差平方和合并計算均方,對回歸 均方做檢驗:F=3744.61/(318.10+791.00)/(5+7)=40.52 F1, 12, 0.019.33,F(xiàn)F0.01,Y與X的回歸關(guān)系極顯著。 計算純實驗誤差平方和及失擬平方和: 第1步用MSPE對MSLOF做檢驗:F=63.62/113.00=0.56,差異 不顯著,失擬平方和基本上是試驗誤差造成的。 再用有
37、重復(fù)方差分析方法檢驗回歸的顯著性:再用有重復(fù)方差分析方法檢驗回歸的顯著性: 56 10.3.5 點估計與區(qū)間估計點估計與區(qū)間估計 (1)對和的估計 在10.3.1中已經(jīng)指出,E(a),E(b),因此a和b 分別是和的點估計。下面討論和的區(qū)間估計。 i是獨立正態(tài)分布的,所以 都服從自由度為n-2的t分布。由此可以得出的1-的 置信區(qū)間為: 的1-置信區(qū)間為: 57 例例10.8 計算例10.1回歸方程: 的 和的0.95置信區(qū)間(n=7, MSE=70.74, SXX=17.92, =2.4)。 解解: 據(jù)(10.38)式,的0.95置信區(qū)間為(t5, 0.025=2.571): 據(jù)(10.39
38、) 式,可以計算出的0.95置信區(qū)間為: 10.3.2的b和a的顯著性檢驗中,曾檢驗H0:7的假 設(shè),結(jié)論是接受H0。本節(jié)計算出的0.95置信區(qū)間為(6.05, 16.27),其中包括7,結(jié)論同樣是接受7的假設(shè)。對于, 在10.3.2中得到的結(jié)論是拒絕H0:100。區(qū)間估計所 得到的結(jié)果是的0.95置信區(qū)間為(67.06, 96.52),該區(qū)間不 包括100,結(jié)論同樣是拒絕H0:100。可見,區(qū)間估計 與顯著性檢驗的結(jié)果是一致的。 58 因為a和b都是服從正態(tài)分布的,所以 亦服從正態(tài)分布 。標(biāo)準(zhǔn)化變量中2未知,用誤差均方 MSE代替,則 (2)對回歸線YX的估計 當(dāng)自變量X為某一指定值x0時,
39、所得到的回歸值 是 的點估計。證明如下: 為了得到 的1-置信曲線,先計算 方差。 59 服從自由度為n-2的t分布。因此在Xx0時,總回歸線 的1-置信區(qū)間為: 從(10.43)式可看出, 的1-置信區(qū)間與x0有關(guān): x0取不同的值時,得到的 的置信區(qū)間不同;區(qū) 間長度也與x0有關(guān), 時,區(qū)間長度最??; 和 時,區(qū)間長度都大于 時的區(qū)間長度。 下面具體計算例10.1總體回歸線YX的0.95置信區(qū)間, 進(jìn)一步解釋上述情況。由(10.43)式可得 x0取不同值及其相應(yīng) 和 的0.95置信區(qū)間見表10-9。 60 表表10-9 例例10.1總體回歸線總體回歸線 的的0.95置信區(qū)間置信區(qū)間 x00
40、0.81.62.43.24.04.8 81.7990.7299.65108.57117.50126.43135.36 置信區(qū)間14.7311.569.148.179.1411.5614.73 可以看出:x0不同, 的置信區(qū)間不同,如x00時, 的0.95置信區(qū)間為81.7914.73,x04.8, 的0.95置信 區(qū)間為135.3614.76;x0不同, 的0.95置信區(qū)間長 度不同,如x0=0時,置信區(qū)間長度為29.46,x02.4時,置 信區(qū)間長度為16.34,x0 2.4時,區(qū)間長度最小,x0大于 和小于 時,區(qū)間長度都變大,由此可見,YX的1-置信 區(qū)間是兩條對稱的弧線(圖10-6),
41、在x0 處,兩弧線的 距離最小。 YX的0.95置信區(qū)間的意義:由于抽樣誤差所造成的總體 回歸線的波動,平均每抽樣100次有95次是在該區(qū)間內(nèi)。 61 62 (3)對y0的估計 上面講過 是 的無偏估計量,也可以用 的值 作為 的估計值。同時,還可以用 的值作為因變量 取得的值y0的估計值。證明如下: 其中,Y0和 均為正態(tài)變量, 亦為正態(tài)變量,服從正 態(tài)分布 。用MSE估計2時,可以得到: 所以, 亦是y0的無偏估計量。 的方差為: 63 服從t(n-2)分布。于是,在Xx0處y0的1-置信區(qū)間為: 從(10.46)式看出,y0的置信區(qū)間也與x0有關(guān)。當(dāng)x0= 時,區(qū)間長度最?。划?dāng)x0遠(yuǎn)離
42、時,區(qū)間長度將變大。 下面計算例10.1中各x0處y0的0.95置信區(qū)間,根據(jù) (10.46) 式可得 x0及相應(yīng) 和y0的0.95置信區(qū)間列在表10-10中: 64 表表10-10 例例10.1中中y0的的0.95置信區(qū)間置信區(qū)間 x000.81.62.43.24.04.8 81.7990.7299.65108.57 117.50126.43135.36 置信區(qū)間26.1724.52 23.48 23.12 23.4824.5226.17 y0的1-置信區(qū)間亦為兩條對稱的弧線。由于(10.46)式 的根號內(nèi)比(10. 43)式的根號內(nèi)多1個MSE,所以y0的1-置 信區(qū)間在各x0處都比 的1
43、-置信區(qū)間寬。這可通過 比較表10-10和表10-9明顯看出。表10-10的結(jié)果也畫在圖 10-6中:最外側(cè)的兩條虛線即為各x0處y0的0.95置信區(qū)間。 表表10-9 例例10.1總體回歸線總體回歸線 的的0.95置信區(qū)間置信區(qū)間 x000.81.62.43.24.04.8 81.7990.7299.65108.57117.50126.43135.36 置信區(qū)間14.7311.569.148.179.1411.5614.73 65 例例10.9 計算例10.1,當(dāng)土壤中NaCl含量為1.5 gkg-1時, 和y0的估計值及相應(yīng)的0.95置信區(qū)間。 解:解:把x0=1.5代入回歸方程 , 得
44、出 。98.53即x01.5時 的點估計,同時它又 是y0的點估計值。此時 的0.95置信區(qū)間可由(10.43) 式求出,結(jié)果為89.15107.91。y0的0.95置信區(qū)間可由 (10.46)式求出,結(jié)果為74.96122.10。 66 10.3.6 一元回歸分析的意義一元回歸分析的意義 (1)預(yù)報 兩變量間關(guān)系的研究,可揭示其內(nèi)在聯(lián)系,也可以由 一個變量去預(yù)報另一個變量。 例如,測定作物籽粒蛋白質(zhì)含量的標(biāo)準(zhǔn)方法是凱氏定 氮法。但凱氏定氮法的測定過程很繁雜,不適宜對大量實 驗材料做篩選工作。DBC法(見例10.6) 是測定籽粒中堿性 氨基酸含量的方法,適合于大量測定。回歸分析表明,籽 粒中的
45、蛋白質(zhì)含量與籽粒中的堿性氨基酸含量有顯著的回 歸關(guān)系。因此,可以求出籽粒中蛋白質(zhì)含量Y對籽粒中堿 性氨基酸含量X的回歸方程,根據(jù)回歸方程,可由DBC法 測得的結(jié)果預(yù)報籽粒中的蛋白質(zhì)含量。 所謂預(yù)報就是估計,點預(yù)報就是點估計,區(qū)間預(yù)報就 是區(qū)間估計,但預(yù)報通常是指區(qū)間預(yù)報。 67 在做預(yù)報時應(yīng)特別注意,由X預(yù)報Y不能隨意超出計算 回歸方程時所研究的范圍。 如在例10.1中,計算回歸方程時所使用的數(shù)據(jù),是 NaCl含量04.8 gkg-1范圍內(nèi)測得的干物重,則回歸方程僅 適用于這個范圍,不得隨意外推,因為如果將NaCl含量進(jìn) 一步提高,則很難保證干物重與NaCl含量仍然呈線性關(guān)系。 若兩者呈曲線關(guān)
46、系,上述方程便失去意義,預(yù)報值也就不 可靠了。因此在土壤中NaCl含量超過4.8 gkg-1時,不能輕 易使用上述方程做預(yù)報。 68 (2)減少實驗誤差 例例10.10 以下為10名嬰兒身長(cm):49.8, 55.4, 58.4, 60.6, 62.6, 63.9, 65.8, 68.7, 71.4, 73.9。計算得到平均身長 為 63.05,s254.40。嬰兒的身長與年齡有關(guān),隨年齡 增加身長增加,因此s2中包含兩個分量:一個是由于抽樣 引起的變差,另一個是由于年齡對身高影響而引起的變差。 年齡對身長的影響可以通過回歸方程獲得。一般來說年齡 與身長并不呈線性關(guān)系, 但在嬰兒期,身長在
47、年齡上的 回歸基本是線性的。設(shè)上述10名嬰兒的年齡(月)分別是 0.03, 1, 2, 3, 4, 5, 6, 8, 10, 12,計算得到回歸方程: 69 SYY是總平方和,自由度為n-1,因此s2489.57/954.40。由 于引進(jìn)了回歸,總平方和可分解為由于回歸引起的平方和 (在這里即由于年齡不同所造成的身長不同而引起的平方 和)+由于誤差引起的平方和(見10.3.4)。 從總平方和中除去由于回歸引起的平方和以后,就大大降 低了誤差平方和。誤差平方和: 誤差均方只有26.31/83.29,約為s2的1/16。 因此,只有在引進(jìn)自變量以后得到的實驗誤差,才是更真 實的實驗誤差。 70 1
48、0.4 一元非線性回歸一元非線性回歸 10.4.1 處理一元非線性回歸的原則處理一元非線性回歸的原則 10.4.2 對數(shù)變換對數(shù)變換 10.4.3 概率對數(shù)變換概率對數(shù)變換 10.4.4 多項式回歸多項式回歸 10.4.5 曲線擬合狀況的檢驗曲線擬合狀況的檢驗 71 10.4.1 處理一元非線性回歸的原則處理一元非線性回歸的原則 一元線性回歸是最簡單的回歸(因此也叫簡單回歸), 但在實際工作中遇到的卻很多,因為任何一種曲線回歸曲線回歸 (curvilinear regression)在一個很小的區(qū)間內(nèi),都可以認(rèn)為 是直線回歸。當(dāng)然,直線回歸不能代替曲線回歸。 兩變量間呈曲線關(guān)系的例子很多,如:
49、細(xì)菌生長的數(shù) 量與時間的關(guān)系,人的年齡與身高的關(guān)系,作物種植密度 與產(chǎn)量的關(guān)系,輻射強(qiáng)度或藥物濃度與致死率的關(guān)系等。 這時需通過變換變換(transformation)將曲線化為直線,再 按直線回歸處理。為了將回歸曲線直線化,首先要確定兩 變量的函數(shù)關(guān)系,判斷方法有:(1)根據(jù)專業(yè)知識確定, 例如,培養(yǎng)基上細(xì)菌生長的數(shù)量(Y)在一定時期內(nèi)與時間(X) 呈指數(shù)函數(shù)Y=aebx關(guān)系。 72 再如,生物體的生長不論是整體還是它們的體重、表 面積、高度、細(xì)胞數(shù),甚至蛋白質(zhì)含量的增長與時間都呈 “S”形曲線關(guān)系。 如果從專業(yè)知識上不能確定變量間的函數(shù)關(guān)系,就要 (2)將實際測得數(shù)據(jù)作成散點圖,根據(jù)散點圖
50、上點散布 的情況,選擇適當(dāng)?shù)那€來配合實驗數(shù)據(jù)。屬于曲線的函 數(shù)關(guān)系很多,如冪函數(shù)Y=dXb,指數(shù)函數(shù)Y=debX,對數(shù)函 數(shù)Y=a+blgX等。 確定了兩變量的函數(shù)關(guān)系以后,經(jīng)適當(dāng)變換,便可將 曲線化為直線,再按直線回歸處理。 73 10.4.2 對數(shù)變換對數(shù)變換 如從專業(yè)知識可確定兩變量呈函數(shù)關(guān)系,則可直接將 曲線化為直線。如細(xì)菌生長數(shù)量(Y)與時間(X)呈YaebX關(guān) 系,等式兩邊取對數(shù),則lnYln(aebX) 即lnYlna+bX 令YlnY,alna,則變換為線性回歸方程Ya+bX 或等式兩邊取常用對數(shù),lgYlga+bXlge 令YlgY, alga, bblge,可變換為線性方
51、程Ya+bX 若兩變量呈冪函數(shù)YdXb關(guān)系,也可將等式兩邊取對 數(shù),則lgYlgd+blgX 令YlgY,algd,XlgX,則方程變?yōu)閅a+bX 至于對數(shù)函數(shù),令XlgX即化為線性方程Ya+bX 74 這些變換稱對數(shù)變換對數(shù)變換(logarithmic transformation)。 若根據(jù)專業(yè)知識不能判斷變量間的函數(shù)關(guān)系時,必須經(jīng)過 多次嘗試,才能將曲線化為直線。具體做法是:在得到一 組數(shù)據(jù)之后,作成散點圖,若這些散點的分布呈曲線就要 考慮進(jìn)行變換。在各種曲線中,除S型曲線及拋物線外, 首先可嘗試對數(shù)變換。 生物學(xué)中兩個量的關(guān)系,有很多可通過對數(shù)變換變?yōu)?直線。對數(shù)變換最簡單的方法是:先
52、算出lgX(或lnX)和 lgY(或lgY),分別以lgX(InX)和Y,X和lgY(lnY)以及l(fā)gX(lnX) 和lgY(lnY) 作圖,觀察直線化的情況。有時,也可取 lg(X+a)和lg(Y+b)作變換(a, b為任一常數(shù))。比較這些散點 圖,從中選出直線化最好的那種變換。若經(jīng)以上各種變換 均不能直線化,則應(yīng)考慮用其他方法作變換。 75 例例10.11 在突變實驗中,用不同劑量的射線照射植物 的種子,發(fā)現(xiàn)苗期高度與成活株之間有一定的關(guān)系。用X 線照射大麥的種子,記處理株第一葉平均高度占對照株高 度的百分?jǐn)?shù)為X,存活百分?jǐn)?shù)為Y,得到結(jié)果: 表表10-11 例例10.11的原始數(shù)據(jù)表的原始
53、數(shù)據(jù)表 X283240506072808085 Y81218283055618580 先作成散點圖(圖10-7),并按Y和X呈線性關(guān)系做出回 歸線??梢姡c并不是均勻地分布在回歸線的兩側(cè),而是 集中在回歸線右下側(cè)的中段及左上側(cè)的兩端。因此Y和X是 非線性關(guān)系。 76 表表10-12 表表10-11中的數(shù)據(jù)做雙對數(shù)變換后的結(jié)果中的數(shù)據(jù)做雙對數(shù)變換后的結(jié)果 lgX1.451.511.601.701.781.861.901.901.93 lgY0.901.081.261.451.481.741.791.931.90 為找出適當(dāng)?shù)淖儞Q方法,將X和Y分別作對數(shù)變換,然后作 圖觀察直線化的效果。lgX和l
54、gY列于表10-12: 77 圖10-8、10-9和10-10是分別用lgX 和Y,X 和lgY以及 lgX和lgY 所作的圖。 78 可看出,三種變換中l(wèi)gX和lgY變換的直線化最好,因此令 XlgX ,YlnY 則 lgYlga+blgX 即 Ya+bX 可按一元線性回歸進(jìn)行分析,數(shù)據(jù)列在表10-13 中: 79 計算過程如下: Y對X的回歸方程為 其中 80 將lgY和lgX代入Y對X的回歸方程中, 則 于是,Y對X的回歸方程為 則大麥經(jīng)X線照射后,存活株百分?jǐn)?shù)Y與第一葉平均高度 占對照高度的百分?jǐn)?shù)X之間的回歸方程為 81 10.4.3 概率對數(shù)變換概率對數(shù)變換 在環(huán)境毒理學(xué)實驗中,常遇
55、到尋找半致死劑量問題。 致死率與劑量間的關(guān)系曲線往往呈S形。在半致死劑量處, 曲線的斜率最大,與死亡率的交點最清楚。在全致死處, 曲線與死亡率已近于平行,交點不清,劑量也就不好確定 了。因此在實際工作中,常常采用半致死劑量這一標(biāo)準(zhǔn)。 確定半致死劑量,最常用的方法是對數(shù)據(jù)進(jìn)行概率對數(shù)變概率對數(shù)變 換換(probability-logarithmic transformation)。 例例10.12 用不同劑量射線照射小麥品種“庫斑克”, 調(diào)查死苗率,得到表10-14中的結(jié)果: 表表10-14 例例10.12的原始數(shù)據(jù)表的原始數(shù)據(jù)表 劑量X/kR14161820222426 死苗率Y/%61040
56、70809395 82 將以上數(shù)據(jù)作圖(圖10-11),可見死亡率與劑量呈S 形 曲線,但曲線并不對稱,在相當(dāng)于死亡率50%以下的曲線 比較陡,而在死亡率50%以上的部分比較平緩。為此,將 劑量X作對數(shù)變換,變換后的圖形(圖10-12)成為勻稱的S形 曲線。仔細(xì)比較圖10-12與正態(tài)分布的累積分布曲線(見圖 3-3),可以發(fā)現(xiàn)兩者的圖形是一樣的。因此可以將累積面 積(u)看成死亡率,則每一死亡率均有一對應(yīng)的u值,以u 值代替死亡率,S形曲線便化為直線了。如死亡率為50% 時,u0;死亡率為5%時,u -1.645;死亡率為95%時, u1.645 。因此,當(dāng)死亡率低于50% 時,經(jīng)概率坐標(biāo)變換
57、 后的死亡率Y為負(fù)值,高于50% 時為正值。Y可從正態(tài)分 布表中查出,為使用方便,已將其整理成獨立的表,見附 表11。 83 84 85 有時為了防止出現(xiàn)負(fù)值,可將每一個u都加上5,稱為 概率單位(概率單位(probit)。 在一般研究工作中,習(xí)慣將劑量作為橫坐標(biāo),死亡率 作為縱坐標(biāo),而在尋找半致死劑量時是估計當(dāng)死亡率為 50%時劑量的總體平均數(shù)。因此,在這里將劑量作為縱坐 標(biāo),死亡率作為橫坐標(biāo)。若把實驗所得的死亡率X 按概率 坐標(biāo)變換為X,劑量Y變換為Y= lgY, 則回歸方程為: 在半致死劑量處:X50,X0?;貧w方程變?yōu)椋?即 , 。 因此,半致死劑量LD50的估計量為10a。 將例10
58、.12中的劑量X調(diào)換為Y,死亡率Y調(diào)換為X。再 將死亡率X作概率變換得X,劑量Y作對數(shù)變換得Y。數(shù)據(jù) 整理成表10-15: 86 用變換后的數(shù)值X和Y作成的散點圖基本成一條直線(圖 10-13) ,可按線性回歸計算。 87 88 回歸系數(shù) 得Y 對X的回歸方程: 半致死劑量處死亡率50%,相應(yīng)的X0。其劑量估計為: 在這種處理條件下,小麥品種“庫斑克”的半致死劑量為 18.92 kR。 89 10.4.4 多項式回歸多項式回歸 將曲線化為直線,需事先明確兩變量間的函數(shù)關(guān)系。 但有時這種關(guān)系很難確定,這時可用多項式多項式(polynomial) 去逼近,稱多項式回歸多項式回歸(polynomia
59、l regression)。最簡單的 多項式是二次多項式二次多項式(quadratic polynomial): 它的圖像是拋物線拋物線(parabola)。 多項式的一般形式: 則(10.48)式變?yōu)槎嘣貧w方程: 再按多元回歸計算(見11.1)。 90 10.4.5 曲線擬合狀況的檢驗曲線擬合狀況的檢驗 (1)通過比較剩余均方來判斷曲線擬合好壞 一般情況可用剩余均方的大小來判斷擬合的優(yōu)劣,剩 余均方愈小,擬合得愈好。但計算剩余平方和時,必須用 實際觀測值與回歸估計值之差的平方和 計算,不 能用(10.17)式 計算。 例例10.13 假設(shè)有以下一組數(shù)據(jù): X1.01.01.52.02.03
60、.03.04.04.05.06.06.0 Y3032221615111087655 考慮做兩種變換: 令 91 通過Y 對X的線性回歸,得回歸方程: 圖10-14是上列數(shù) 據(jù)的散點圖。 92 剩余平方和 根據(jù)回歸方程計算出 及 并且列成表10-16: 剩余均方 令 通過Y 對X的線性回歸,得回歸方程: 根據(jù)回歸方程計算出 及 并且列成表10-17: 93 剩余平方和 剩余均方 第種變換的剩余均方遠(yuǎn)遠(yuǎn)小于第種變換的剩余均 方。因此,第種變換比第種變換擬合得更好。為了得 到最理想的變換方式,最好多作幾種變換,從中選出最優(yōu) 者。 94 (2)根據(jù)失擬均方的大小來判斷曲線擬合好壞 若實驗結(jié)果中有部分重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版投資擔(dān)保合同風(fēng)險控制條款3篇
- 如何記憶更多的知識點
- 二零二五年度鋰離子蓄電池銷售合同范本3篇
- 二零二五年度個人間家庭農(nóng)場貸款合同3篇
- 零擔(dān)貨物運輸合同三篇
- 教師行業(yè)安全生產(chǎn)工作總結(jié)
- 二零二五年度影視制作公司演員個人聘用合同2篇
- 二零二五個人住宅租賃合同(含租賃保證金退還條件)2篇
- 二零二五年度個人擔(dān)保合同書范本:珠寶首飾抵押擔(dān)保
- 二零二五年度綠色快遞柜場地租賃與快遞代收協(xié)議書3篇
- 國際貿(mào)易地理 全套課件
- GB/T 20878-2024不銹鋼牌號及化學(xué)成分
- 某房屋建筑工程監(jiān)理大綱
- 英語考綱詞匯表3500詞
- 主題一:人文之美 第7課《天下第一大佛-樂山大佛》 課件
- 印度與阿拉伯的數(shù)學(xué)
- 會陰切開傷口裂開的護(hù)理查房
- 《鋼鐵是怎樣煉成的》選擇題100題(含答案)
- 2024年國新國際投資有限公司招聘筆試參考題庫含答案解析
- 食堂餐廳服務(wù)方案投標(biāo)方案(技術(shù)標(biāo))
- Creo-7.0基礎(chǔ)教程-配套課件
評論
0/150
提交評論