食品實驗設(shè)計與數(shù)據(jù)分析_第1頁
食品實驗設(shè)計與數(shù)據(jù)分析_第2頁
食品實驗設(shè)計與數(shù)據(jù)分析_第3頁
食品實驗設(shè)計與數(shù)據(jù)分析_第4頁
食品實驗設(shè)計與數(shù)據(jù)分析_第5頁
已閱讀5頁,還剩119頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

食品實驗設(shè)計與數(shù)據(jù)分析第1頁/共124頁12.1回歸設(shè)計的基本概念

回歸設(shè)計(也稱為響應(yīng)曲面設(shè)計)目的是尋找試驗指標與各因子間的定量規(guī)律,考察的因子都是定量的。它是在多元線性回歸的基礎(chǔ)上用主動收集數(shù)據(jù)的方法獲得具有較好性質(zhì)的回歸方程的一種試驗設(shè)計方法。

本章主要介紹Box的回歸設(shè)計方法及其應(yīng)用,并假定讀者已具有多元線性回歸分析的基礎(chǔ)知識。為了符號上的統(tǒng)一,在12.1.2中列出了回歸分析中的主要公式。第2頁/共124頁12.1.1多項式回歸模型

在一些試驗中希望建立指標y與各定量因子(又稱變量)間相關(guān)關(guān)系的定量表達式,即回歸方程,以便通過該回歸方程找出使指標滿足要求的各因子的范圍

??梢约俣▂與間有如下關(guān)系:

這里是的一個函數(shù),常稱為響應(yīng)函數(shù),其圖形也稱為響應(yīng)曲面;是隨機誤差,通常假定它服從均值為0,方差為的正態(tài)分布。在上述假定下,可以看作為在給定后指標的均值,即

第3頁/共124頁

稱z的可能取值的空間為因子空間。我們的任務(wù)便是從因子空間中尋找一個點z0使E(y)滿足質(zhì)量要求。

當f的函數(shù)形式已知時,可以通過最優(yōu)化的方法去尋找z0。在許多情況下f的形式并不知道,這時常常用一個多項式去逼近它,即假定:

這里各為未知參數(shù),也稱為回歸系數(shù),通常需要通過收集到的數(shù)據(jù)對它們進行估計。若用表示相應(yīng)的估計,則稱

為y關(guān)于的多項式回歸方程。

第4頁/共124頁

在實際中常用的是如下的一次與二次回歸方程(也稱一階與二階模型):一般p個自變量的d次回歸方程的系數(shù)個數(shù)為

第5頁/共124頁12.1.2多元線性回歸

(12.1.1)是一個多項式回歸模型,在對變量作了變換并重新命名后也可以看成是一個多元線性回歸模型。

1.回歸模型

設(shè)所收集到的n組數(shù)據(jù)為假定回歸模型為:

第6頁/共124頁記隨機變量的觀察向量為未知參數(shù)向量為不可觀察的隨機誤差向量為結(jié)構(gòu)矩陣那么上述模型可以表示為:或第7頁/共124頁

2.回歸系數(shù)的最小二乘估計

估計回歸模型中回歸系數(shù)的方法是最小二乘法。記回歸系數(shù)的最小二乘估計(LSE)為,應(yīng)滿足如下正規(guī)方程組:

當存在時,最小二乘估計為

在求得了最小二乘估計后,可以寫出回歸方程:今后稱為正規(guī)方程組的系數(shù)矩陣,為正規(guī)方程組的常數(shù)項向量,為相關(guān)矩陣。在模型(12.1.5)下,有

第8頁/共124頁若記,那么在通常的回歸分析中,由于C非對角陣,所以各回歸系數(shù)間是相關(guān)的:

第9頁/共124頁

3.對回歸方程的顯著性檢驗

對回歸方程的顯著性檢驗是指檢驗如下假設(shè):

H0:

H1:不全為0檢驗方法是作方差分析。記則有平方和分解式

其中為殘差平方和,自由度為為回歸平方和,自由度為當H0為真時,有

對于給定的顯著性水平,拒絕域為。

第10頁/共124頁

若記p+1維向量,那么

第11頁/共124頁

4.失擬檢驗

當在某些點有重復(fù)試驗數(shù)據(jù)的話,可以在檢驗回歸方程顯著性之前,先對y

的期望是否是的線性函數(shù)進行檢驗,這種檢驗稱為失擬檢驗,它要檢驗如下假設(shè):

H0:

H1:當在上有重復(fù)試驗或觀察時,將數(shù)據(jù)記為

其中至少有一個,記。此時殘差平方和可進一步分解為組內(nèi)平方和與組間平方和,其中組內(nèi)平方和就是誤差平方和,記為,組間平方和稱為失擬平方和,記為,即:

第12頁/共124頁,,,,

檢驗統(tǒng)計量為

在H0為真時,,對于給定的顯著性水平,拒絕域為

當拒絕H0時,需要尋找原因,改變模型,否則認為線性回歸模型合適,可以將Se與SLf合并作為SE檢驗方程是否顯著。其中第13頁/共124頁

5.對回歸系數(shù)的顯著性檢驗

當回歸方程顯著時,可進一步檢驗?zāi)硞€回歸系數(shù)是否為0,也即檢驗如下假設(shè):

此種檢驗應(yīng)對j=1,2,…,p逐一進行。常用的檢驗方法是t檢驗或等價的F檢驗,F(xiàn)檢驗統(tǒng)計量為:其中是中的第j+1個對角元。記分子為,即,它是因子的偏回歸平方和分母是模型中的無偏估計。,也稱為的標準誤,即其標準差的估計。

第14頁/共124頁

當H0j為真時,有。給定的顯著性水平,當時拒絕假設(shè)H0j,即認為顯著不為零,否則可以將對應(yīng)的變量從回歸方程中刪除。

注:當有不顯著的系數(shù)時,一般情況下一次只能刪除一個F值最小的變量,重新計算回歸系數(shù),再重新檢驗。通常要到余下的系數(shù)都顯著時為止。

第15頁/共124頁12.1.3回歸分析對數(shù)據(jù)的處理由被動變主動

古典的回歸分析方法只是被動地處理已有的試驗數(shù)據(jù),對試驗的安排不提任何要求,對如何提高回歸方程的精度研究很少。后果:(1)盲目增加試驗次數(shù),而這些試驗結(jié)果還不能提供充分的信息,以致在許多多因子試驗問題中達不到試驗?zāi)康?。?)對模型的合適性有時無法檢驗,因為在被動處理數(shù)據(jù)時在同一試驗點上不一定存在重復(fù)試驗數(shù)據(jù)。為了適應(yīng)尋求最佳工藝、最佳配方、建立生產(chǎn)過程的數(shù)學(xué)模型等的需要,人們就要求以較少的試驗次數(shù)建立精度較高的回歸方程。

第16頁/共124頁

為此,要求擺脫古典回歸分析的被動局面,主動把試驗的安排、數(shù)據(jù)的處理和回歸方程的精度統(tǒng)一起來考慮,即根據(jù)試驗?zāi)康暮蛿?shù)據(jù)分析的要求來選擇試驗點,不僅使得在每一個試驗點上獲得的數(shù)據(jù)含有最大的信息,從而減少試驗次數(shù),而且使數(shù)據(jù)的統(tǒng)計分析具有一些較好的性質(zhì)。這就是二十世紀五十年代發(fā)展起來的“回歸設(shè)計”所研究的問題。回歸設(shè)計的分類:根據(jù)建立的回歸方程的次數(shù)不同,回歸設(shè)計有一次回歸設(shè)計、二次回歸設(shè)計、三次回歸設(shè)計等;根據(jù)設(shè)計的性質(zhì)又有正交設(shè)計、旋轉(zhuǎn)設(shè)計等。本章僅介紹一次回歸的正交設(shè)計與二次回歸的組合設(shè)計(包括正交設(shè)計與旋轉(zhuǎn)設(shè)計)。第17頁/共124頁12.1.4因子水平的編碼

在回歸問題中各因子的量綱不同,其取值的范圍也不同,為了數(shù)據(jù)處理的方便,對所有的因子作一個線性變換,使所有因子的取值范圍都轉(zhuǎn)化為中心在原點的一個“立方體”中,這一變換稱為對因子水平的編碼。方法如下:設(shè)因子的取值范圍為:

,

與分別稱為因子的下水平與上水平。其中心也稱為零水平:

,

因子的變化半徑為

,

,此變換式就稱為“編碼式”。

第18頁/共124頁

例12.1.1

為提高某橡膠制品的撕裂強度,考察橡膠中某成分的百分比、樹脂成分的百分比及改良劑的百分比三個因子對其的影響,這三個因子的取值范圍分別為:

對其作編碼,令

通過上述變換后,編碼空間為中心在原點的立方體,其邊長為2。在后面我們將會看到,在編碼時,有時立方體的邊長可以大于2。第19頁/共124頁

今后稱x的可能取值的空間為編碼空間。我們可以先在編碼空間中尋找一個點x0使E(y)滿足質(zhì)量要求,然后通過編碼式尋找到z0。

第20頁/共124頁12.2一次回歸正交設(shè)計

12.2.1一次回歸正交設(shè)計

建立一次回歸方程的回歸設(shè)計方法有多種,這里介紹一種常用的方法,它是利用二水平正交表來安排試驗的設(shè)計方法。其主要步驟如下:

1.確定因子水平的變化范圍

設(shè)影響指標y的因子有p個,希望通過試驗建立y關(guān)于的一次回歸方程,那么首先要確定每個因子的變化范圍,設(shè)因子的取值范圍為:

,

這里與分別是因子的下水平與上水平。

第21頁/共124頁

2.對每一因子的水平進行編碼

記因子的零水平為

其變化半徑為

那么采用如下編碼式,即

,對因子的水平進行編碼,常列成如下的因子水平編碼表:第22頁/共124頁

3.選擇適當?shù)亩秸槐戆才旁囼?/p>

在用二水平正交安排試驗時,要用“-1”代換通常二水平正交表中的“2”,以適應(yīng)因子水平編碼的需要。這樣一來,正交表中的“1”與“-1”不僅表示因子水平的不同狀態(tài),也表示了因子水平的數(shù)量大小。經(jīng)過這樣的代換后,正交表的交互作用列可以由表中相應(yīng)列的對應(yīng)元素相乘得到,從而交互作用列表也不需要了。

表12.2.2就是一張代換后的L8(27),與原來的正交表沒有本質(zhì)區(qū)別,仍然用L8(27)表示。

第23頁/共124頁

表的選擇仍然同正交設(shè)計一樣,既要考慮因子的個數(shù),有時還要考慮交互作用的個數(shù)。

第24頁/共124頁在改造后的正交表中,若用表示第i號試驗第j個因子xj的取值,那么

稱具有上述性質(zhì)的設(shè)計稱為正交設(shè)計。

第25頁/共124頁12.2.2數(shù)據(jù)分析

在一次回歸的正交設(shè)計中記第i號試驗結(jié)果為yi,i=1,2,…,n,此時我們假定的模型是

我們要建立y關(guān)于的一次回歸方程

可采用回歸分析中的最小二乘估計去估計各個回歸系數(shù),并對回歸方程及回歸系數(shù)進行顯著性檢驗,最后給出回歸方程。在一次回歸的正交設(shè)計中有關(guān)計算十分簡單,可以用列表的方法完成。

第26頁/共124頁

1.求回歸系數(shù)的估計用最小二乘估計求回歸系數(shù)的估計。結(jié)構(gòu)矩陣

由于X中的元素不是1就是-1,所以每列元素的平方和為n,又考慮到此為正交設(shè)計,故正規(guī)方程組的系數(shù)矩陣為對角陣:第27頁/共124頁從而又記,其中那么回歸系數(shù)的最小二乘估計為即

由于C是對角陣,所以各回歸系數(shù)間不相關(guān)。這將為回歸方程與系數(shù)的檢驗帶來方便,并且在刪除變量后回歸系數(shù)不需重新計算。具體計算可以列表進行(見表12.2.2)。

第28頁/共124頁

2.回歸方程的顯著性檢驗

對回歸方程的顯著性檢驗的統(tǒng)計量是

其中

考慮到,故

具體計算與檢驗見表12.2.3與表12.2.4。第29頁/共124頁

3.回歸系數(shù)的顯著性檢驗

可以采用統(tǒng)計量檢驗是否為零。其分母是的無偏估計分子是的偏回歸平方和,記為那么

注意到回歸平方和的計算公式,有

具體計算與檢驗見表12.2.3與表12.2.4。第30頁/共124頁第31頁/共124頁第32頁/共124頁

例12.2.1

硝基蒽醌中某物質(zhì)的含量y與以下三個因子有關(guān):

z1:亞硝酸鈉(單位:克)

z2:大蘇打(單位:克)

z3:反應(yīng)時間(單位:小時)為提高該物質(zhì)的含量,需建立y關(guān)于變量z1,z2,z3的回歸方程。

1.試驗設(shè)計(1)確定因子取值范圍,并對它們的水平進行編碼本例的因子水平編碼見表12.2.5。表12.2.5因子水平編碼表

因子水平編碼值z1z2z3

上水平+19.04.53

下水平-15.02.51

零水平07.03.52

變化半徑Δj211第33頁/共124頁

(2)利用二水平正交表安排試驗本例有三個因子,即p=3,為今后可能需要考察因子間的交互作用方便起見,因此選用L8(27),將三個因子分別置于第一、二、四列上,從而可得試驗計劃,并按計劃進行試驗。試驗計劃及試驗結(jié)果見表12.2.6。第34頁/共124頁

2.數(shù)據(jù)分析

本例的計算見表12.2.7,有關(guān)方程與系數(shù)的檢驗見表12.2.8。在本例中n=8。第35頁/共124頁

根據(jù)表12.2.7,可以寫出y關(guān)于x1,x2,x3的回歸方程為:若取顯著性水平為0.05,有,由于F>6.59,所以上述求得的回歸方程是有意義的。

在顯著性水平為0.05時,,由表12.2.8知因子x2不顯著,其它因子顯著。第36頁/共124頁

在正交回歸設(shè)計中,當某一變量不顯著時,可以直接將它刪去,此時不會改變其它的回歸系數(shù),也不會改變這些變量的偏回歸平方和,這是正交回歸設(shè)計的一個優(yōu)點。

現(xiàn)在將x2從回歸方程中刪去,最后得各因子均為顯著的回歸方程是:將編碼式:

代入,得y關(guān)于z1,z3的回歸方程為:

從方程知,當z1,z3增加時,y也會相應(yīng)增加。

第37頁/共124頁

我們把不顯著變量的偏回歸平方和加到殘差平方和中,從而獲得方程對應(yīng)的的估計。在本例中殘差平方和變成因此的估計為。

第38頁/共124頁12.2.3零水平處的失擬檢驗

上述用一次回歸正交設(shè)計方法求得一次回歸方程是簡單、易行的,但是否能真實反映實際呢?由于試驗是在各因子的上水平(+1)與下水平(-1)處進行的,即使模型在這些邊界點上擬合得很好,但是在因子編碼空間的中心擬合是否也好呢?這可用在零水平處增加若干重復(fù)試驗,再通過檢驗來判斷。設(shè)在各因子均取零水平時進行了m

次試驗,記其試驗結(jié)果為,其平均值為,其偏差平方和及其自由度為,

利用在零水平處的重復(fù)試驗的檢驗有兩種方法。

第39頁/共124頁

方法1:當一次回歸模型在整個編碼空間上都適宜時,則按一次回歸方程應(yīng)有如今在零水平上進行了m次重復(fù)試驗,其平均值為這相當于存在兩個正態(tài)分布:

要檢驗這兩個正態(tài)分布的均值是否相等,即檢驗

為此可采用t統(tǒng)計量去檢驗。第40頁/共124頁

由于與獨立,因此有

此外且兩者也獨立,從而并且與獨立。令

其中第41頁/共124頁在時,有對給定的顯著性水平,當時認為模型在編碼空間的中心也合適,不存在因子的非線性效應(yīng),否則需要另外尋找合適的模型,譬如建立二次回歸方程,這將在12.3中介紹。第42頁/共124頁

方法2:由于在各因子均取零水平時進行了m

次重復(fù)試驗,因此可以采用12.1.2中的失擬檢驗,將n+m次試驗結(jié)果合并在一起進行數(shù)據(jù)分析,并檢驗

采用統(tǒng)計量

對給定的顯著性水平,當時認為模型合適,否則需要另外尋找合適的模型。第43頁/共124頁12.2.4含交互作用的模型

當變量間存在交互作用時,我們可以更一般地考慮建立含兩個因子間交互作用的模型,其交互作用用兩個因子的編碼值的乘積表示,即可假定有如下的回歸模型:

只要在回歸的一次正交設(shè)計中,

n大于就可以將其看成是k元線性回歸,并且這k項仍然是相互正交的,因此可以在表12.2.3中加上諸列,按同樣的計算便可求得諸回歸系數(shù),并對它們進行檢驗。第44頁/共124頁

譬如對例12.2.1來講,我們可以建立如下回歸方程:

系數(shù)的估計可以按表12.2.9計算。第45頁/共124頁對系數(shù)與方程的檢驗見表12.2.10。

若取顯著性水平為0.10,那么,此時所有交互效應(yīng)與因子x2不顯著,結(jié)論同上。第46頁/共124頁12.2.5快速登高法

我們進行回歸設(shè)計目的是要尋找最好的條件,但是在開始進行試驗時,可能與最優(yōu)條件相距甚遠,此時需要尋找一條進行試驗的路徑,使指標值很快達到最大(或最?。焖俚歉叻ū闶沁@樣一種快速向最優(yōu)點逼近的方法(若要求指標值小的話,也稱最速下降法)。

第47頁/共124頁1.快速登高法的基本想法是:根據(jù)微分學(xué)原理,任一多元函數(shù)在局部區(qū)域內(nèi)總可以用一個多維平面去近似。利用一次回歸正交設(shè)計可以建立一次回歸方程,此時如果要在編碼空間中尋找一個點使指標y達到最大(或最小),那么這個點總是位于邊界上。當點越出邊界后,指標值是否會更大(或更?。┠??為回答這一問題,我們可以采用如下的方法:先在一個小區(qū)域上擬合一次回歸方程

(12.2.11)再從編碼空間的中心出發(fā),沿著(12.2.11)的“梯度方向”選擇若干個試驗點進行試驗,以便觀察指標y的變化,從而尋找使y達到更大(或更?。┑狞c。這種從編碼空間的中心出發(fā),在(12.2.11)的梯度方向上安排若干試驗點的方法稱為快速登高法。第48頁/共124頁2.梯度方向一個多元函數(shù)在點的梯度是一個p維向量,其第j個分量是y關(guān)于xj的偏導(dǎo)在該點的值,這一向量所決定的方向便是該點的梯度方向,它是多元函數(shù)y增長最快的方向。對(12.2.11)來講,任意一點的梯度方向是(b1,b2,…,bp)’。如果因子間存在交互作用,這時建立的回歸方程為:

那么在編碼中心(0,0,…,0)的梯度方向仍為(b1,b2,…,bp)’。

第49頁/共124頁3.快速登高法的試驗點

記因子的零水平為,變化半徑為,編碼值的回歸系數(shù)為,沿梯度方向的試驗點取為,這里m是在梯度方向上進行試驗的點數(shù)。在因子空間中,,稱為步長。為實施試驗方便,設(shè)置一個步長變化系數(shù)d,那么實際試驗中的步長變化為,d的具體確定方法參見例12.2.2。快速登高法的具體試驗點見表12.2.11,其示意圖見圖12.3.1。

第50頁/共124頁

圖12.2.1快速登高的示意圖第51頁/共124頁

例12.2.2

一位化學(xué)工程師需要確定化工產(chǎn)品收率最大的操作條件。他認為影響收率有兩個因子(變量):反應(yīng)時間z1與反應(yīng)溫度z2,當前的運行條件是z1=35(分鐘),z2=155(℉),而收率約是40%。試驗與分析的步驟如下:

1.擬合一次回歸模型,即建立一次方程:

(1)給出兩個因子在試驗中的變化范圍:因子水平表

第52頁/共124頁(2)用二水平正交表L4(23)安排試驗,試驗方案與結(jié)果如下:

第53頁/共124頁(3)建立一次回歸方程:

所得一次回歸方程為:第54頁/共124頁對回歸方程與回歸系數(shù)作顯著性檢驗的方差分析表如下:若取,那么,所以方程在顯著性水平0.05上是顯著的,又,則兩個系數(shù)也是顯著的。第55頁/共124頁2.檢驗一次方程的合適性為了了解是否存在因子間的交互作用,是否有因子的高次效應(yīng),在中心點進行了m=5次試驗,結(jié)果為:

40.3,40.5,40.7,40.2,40.6其平均值為,偏差平方和為,其自由度=4。采用方法1中的檢驗統(tǒng)計量t作檢驗。現(xiàn)在,,n=4,m=5,將它們代入后有

若取,那么,由于|t|<2.5706,因此在0.05水平認為所得到的一次方程是合適的。

第56頁/共124頁

若采用方法2,我們可以將九個試驗結(jié)果合并在一起建立方程,用12.1.2中的公式,可得到如下方程:

此方程的殘差平方和為SE=0.1772,再將它分解為純誤差與失擬兩個偏差平方和:

它們的自由度分別為4與2,作F檢驗得FLf=0.06,取,那么,由于FLf<19.2,這表明回歸函數(shù)是線性的,再用殘差平方和對方程作檢驗,得到F=47.82,取,那么,由于F>5.14,說明方程是合適的。

第57頁/共124頁

3.給出快速登高的方向與試驗點:在本例中,z1的變化以5作步長變化為方便,則步長系數(shù)d可取為:

那么各因子步長變化及其修勻值見表12.2.16,試驗計劃及試驗結(jié)果見表12.2.17。表12.2.16快速登高參數(shù)第58頁/共124頁第59頁/共124頁

從上面的試驗結(jié)果可以看出,在z1=85(分鐘),z2=175(℉)附近結(jié)果較好,那么可以以該點為中心,重新設(shè)計一個一次回歸的正交設(shè)計,重復(fù)上述過程,直到找到最佳的或滿意的最大值為止;也可以該試驗條件作為中心點,安排二次回歸設(shè)計,關(guān)于二次回歸設(shè)計方法見下一節(jié)。注:在列出快速登高計劃后,不一定按順序一一試驗,可選做其中的若干個,只要y在不斷增大即可。第60頁/共124頁12.2.6一次回歸正交設(shè)計的旋轉(zhuǎn)性

1.旋轉(zhuǎn)性:若一個設(shè)計在離設(shè)計中心距離相等的點上,其預(yù)測值的方差相等,則稱該設(shè)計為旋轉(zhuǎn)設(shè)計。

由于方差相等可減少對預(yù)測的干擾,因此旋轉(zhuǎn)性頗受人們的關(guān)注。

2.一次回歸的正交設(shè)計具有旋轉(zhuǎn)性在上面介紹的設(shè)計中,利用(12.1.10)與(12.1.11)有

且互不相關(guān),因此預(yù)測值的方差為:

現(xiàn)在編碼空間中心點的坐標為(0,0,…,0),記點(x1,x2,…,xp)離中心的距離記為,則

從而在離中心距離為的點上預(yù)測值的方差相等,僅與有關(guān),其值為:

這就表明一次回歸的正交設(shè)計具有旋轉(zhuǎn)性。

第61頁/共124頁12.3二次回歸的中心組合設(shè)計

一、中心組合設(shè)計方案

中心組合設(shè)計中的試驗點由三部分組成:(1)將編碼值-1與1看成每個因子的兩個水平,如同一次回歸的正交設(shè)計那樣,采用二水平正交表安排試驗,可以是全因子試驗,也可以是其1/2實施,1/4實施等。記其試驗次數(shù)為mc,則mc=,或(1/2實施)、(1/4實施)等。(2)在每一因子的坐標軸上取兩個試驗點,該因子的編碼值分別為-與,其它因子的編碼值為0。由于有p個因子,因此這部分試驗點共有2p個。常稱這種試驗點為星號點。(3)在試驗區(qū)域的中心進行m0次重復(fù)試驗,這時每個因子的編碼值均為0。第62頁/共124頁

譬如p=2的中心組合設(shè)計方案是:第63頁/共124頁試驗點分布的圖示為:第64頁/共124頁二、中心組合設(shè)計方案的特點該方案總試驗次數(shù)n為:

每個因子(變量)都可取5個水平,故該方案所布的試驗點范圍較廣。該方案還有較大的靈活性,因為在方案中留有兩個待定參數(shù)m0(中心點的試驗次數(shù))和(星號點的位置),這給人們留下活動余地,使二次回歸設(shè)計具有正交性、旋轉(zhuǎn)性等成為可能。中心點處的m0次重復(fù),使試驗誤差較為準確估計成為可能,從而使對方程與系數(shù)的檢驗有了可靠依據(jù)。第65頁/共124頁12.4二次回歸正交設(shè)計

如果一個設(shè)計具有正交性,則數(shù)據(jù)分析將是十分方便的,又由于所得的回歸系數(shù)的估計間互不相關(guān),因此刪除某些因子時不會影響其它的回歸系數(shù)的估計,從而很容易寫出所有系數(shù)為顯著的回歸方程。我們可以適當選擇m0與

使二次回歸中心組合設(shè)計具有正交性。第66頁/共124頁12.4.1二次中心組合設(shè)計的結(jié)構(gòu)矩陣X與系數(shù)矩陣

p=2的中心組合設(shè)計回歸模型的結(jié)構(gòu)式為

結(jié)構(gòu)矩陣如下:

x0x1x2x1x2(x1)2(x2)2

第67頁/共124頁這里mc=4,2p=4,則n=mc+2p+m0=8+m0,再記那么

第68頁/共124頁一般情況下有其中,表示元素均為1的u維列向量,表示為行向量,表示u階單位陣,表示u行v列的矩陣,其元素均為1,,G是p階對稱方陣,其對角元均為,非對角元均為mc,即

第69頁/共124頁12.4.2正交性的實現(xiàn)

要使中心組合設(shè)計具有正交性,就要求為對角陣。首先利用“中心化”變換使諸平方項列的和為0,為此把列的元素減去該列的均值,即令

從而此時的陣為:

這里GG是p階對稱方陣:

第70頁/共124頁其中的對角元為列元素的平方和,且都相等,記為:

非對角元g為與()對應(yīng)元素的乘積和,

(12.4.7)為使設(shè)計成為正交的只要設(shè)法使g=0。由于在g中mc是給定的,,n=mc+2p+m0,所以在給定了m0后,g只是的函數(shù):

因此可以適當選取使g=0。對不同的因子個數(shù)p與中心點重復(fù)次數(shù)m0,對應(yīng)的值見表12.4.1。

第71頁/共124頁表12.4.1二次回歸正交設(shè)計的參數(shù)值表

第72頁/共124頁12.4.3統(tǒng)計分析

1.回歸系數(shù)的估計

在對列作了中心化變換后,我們可以首先建立y

關(guān)于諸的回歸方程:

現(xiàn)在為對角陣,從而其逆矩陣十分簡單:

第73頁/共124頁再記,其中

具體計算見表12.4.2。

第74頁/共124頁

2.對回歸方程與回歸系數(shù)的檢驗

由于是正交設(shè)計,有諸的偏回歸平方和為

回歸平方和為,仍然用表示總平方和,其自由度為,則殘差平方和為,其檢驗可在表12.4.3上進行。第75頁/共124頁第76頁/共124頁第77頁/共124頁

若在中心點上有重復(fù)試驗的話,還可以進一步對進行分解:,記在中心點上的試驗結(jié)果為,其平均值,則

可對二次回歸模型的合適性進行檢驗。第78頁/共124頁

例12.4.1

為提高鉆頭的壽命,在數(shù)控機床上進行試驗,考察鉆頭的壽命與鉆頭軸向振動頻率F及振幅A的關(guān)系。在試驗中,F(xiàn)與A的變動范圍分別為:[125Hz,375Hz]與[1.5,5.5],采用二次回歸正交組合設(shè)計,并在中心點重復(fù)進行三次試驗。

第79頁/共124頁

1.對因子的取值進行編碼現(xiàn)在有兩個因子,即p=2,現(xiàn)在中心點進行三次試驗,即m0=3,則有表12.4.1上查得此二次回歸正交組合設(shè)計中的=1.148。若因子zj的取值范圍為[],則令的編碼值分別為-,,那么零水平為:

變化半徑為:

編碼值-1與1分別對應(yīng)于:

在本例中因子F與A的零水平分別是250,3.5;它們的變化半徑分別是109,1.74.

因子編碼值見表12.4.4。第80頁/共124頁第81頁/共124頁

2.試驗計劃與試驗結(jié)果本例的試驗計劃見表12.4.5,在試驗隨機化后所得試驗結(jié)果列在該表的最右邊一列。表12.4.5試驗計劃與試驗結(jié)果

第82頁/共124頁

3.參數(shù)估計為求出y關(guān)于的二次回歸方程,首先將與列中心化,即令。在本例中:

則,(12.4.16)此時?;貧w系數(shù)的估計見表12.4.6。第83頁/共124頁第84頁/共124頁4.模型、方程及系數(shù)的檢驗

本例中由于在中心點有3次重復(fù)試驗,所以在給出所得到的回歸方程之前,先對模型的合適性、方程及系數(shù)作顯著性

檢驗:中心點上3次試驗結(jié)果的平均值為=206,由此求得純誤差平方和

Se=1026,從而失擬平方和為:

SLf=1281.53-1026=255.53,失擬檢驗的統(tǒng)計量為:

在時,,所以認為模型合適。有關(guān)方程與系數(shù)的檢驗見表12.4.7。第85頁/共124頁

由于,所以認為方程顯著。又,。所以與的系數(shù)在顯著性水平0.05上是顯著的,x2的系數(shù)在顯著性水平0.10上是顯著的。第86頁/共124頁5.寫出二次回歸方程并求最佳條件我們可以寫出在0.10水平上各系數(shù)都顯著的回歸方程為:再將(12.4.16)代入,即可得y關(guān)于x1,x2的二次回歸方程:

最后再將編碼式代入,即可得y關(guān)于F,A的二次回歸方程:為延長壽命,可以將回歸方程對F與A分別求導(dǎo),并令其為零以解出最佳水平組合為F=291.58,A=3.50,在該水平組合下,平均壽命的估計是211.6。

第87頁/共124頁12.5二次回歸旋轉(zhuǎn)設(shè)計12.5.1旋轉(zhuǎn)性條件與非退化條件回歸正交設(shè)計的最大優(yōu)點是試驗次數(shù)較少,計算簡便,又消除了回歸系數(shù)間的相關(guān)性。但是其缺點是預(yù)測值的方差依賴于試驗點在因子空間中的位置。由于誤差的干擾,試驗者不能根據(jù)預(yù)測值直接尋找最優(yōu)區(qū)域。若能使二次設(shè)計具有旋轉(zhuǎn)性,即能使與試驗中心距離相等的點上預(yù)測值的方差相等,那就有助于克服上述缺點。所以試驗者常常希望犧牲部分的正交性而獲得旋轉(zhuǎn)性,特別在計算機軟件發(fā)展的今天,計算的不便之處可以交由計算機幫助處理。

第88頁/共124頁一、旋轉(zhuǎn)性條件

在一般的p元d次回歸中,共有項,此時正規(guī)方程的系數(shù)矩陣是階對稱方陣,其中元素的一般形式是

其中指數(shù)分別可取等非負整數(shù),且還要滿足

A中的元素也可分成兩類:一類元素,它的所有指數(shù)都是偶數(shù)或零,另一類元素,它的所有指數(shù)中至少有一個為奇數(shù)。

在旋轉(zhuǎn)設(shè)計中,對這兩類元素是有要求的,下面的定理便給出了A中元素的具體結(jié)構(gòu),是旋轉(zhuǎn)設(shè)計的基本要求,稱為旋轉(zhuǎn)性條件。第89頁/共124頁

定理12.5.1

在p元d次回歸的旋轉(zhuǎn)設(shè)計中對應(yīng)的A中的元素

其中指數(shù)如上所述,n是試驗次數(shù),,是待定參數(shù),下標a

必為偶數(shù),且。第90頁/共124頁特例:對d=1,2的旋轉(zhuǎn)性條件具體化。(1)d=1的情況:在一次回歸旋轉(zhuǎn)設(shè)計,此時A中滿足

且都是偶數(shù)或零這些條件的,應(yīng)有

而A中其它元素都是0,此時

其中是p+1階單位陣。在12.2中給出的一次回歸正交設(shè)計便是的一次旋轉(zhuǎn)設(shè)計。

第91頁/共124頁

(2)d=2的情況:在二次回歸旋轉(zhuǎn)設(shè)計,此時A中滿足

且都是偶數(shù)或零這些條件的,有以下幾種情況這時

這是一個階對稱方陣,其中,是一個p階對稱方陣,是元素全為1的p維列向量,空白處為零矩陣,與可以根據(jù)具體的設(shè)計確定。

第92頁/共124頁二、非退化條件

為獲得二次回歸方程中的回歸系數(shù)的最小二乘估計,需要求,因此還要求。由于

要使,必須要

它提供了作旋轉(zhuǎn)設(shè)計時應(yīng)該避免的情況,稱為二次設(shè)計的非退化條件。

第93頁/共124頁12.5.2二次旋轉(zhuǎn)設(shè)計

這一小節(jié)我們具體給出一個中心組合設(shè)計要成為二次旋轉(zhuǎn)設(shè)計的條件。

1.二次設(shè)計的旋轉(zhuǎn)性條件按定理可以具體給出二次設(shè)計的旋轉(zhuǎn)性條件為:第94頁/共124頁若設(shè)第i個試驗點位于半徑為的球面上,那么

從而

所以

第95頁/共124頁另一方面

所以

第96頁/共124頁這表明與平方的比值不僅與因子數(shù)p、試驗次數(shù)n有關(guān),還與n個試驗點所在球面的半徑()有關(guān)。第97頁/共124頁2.二次中心組合設(shè)計的非退化條件:為使設(shè)計是非退化的,就要求試驗點的分布滿足第98頁/共124頁我們可以證明在二次中心組合設(shè)計中有:

等號成立的唯一條件是n個試驗點都在同一球面上。

證明:由于對任意實數(shù)有這表明如下二次三項式是非負的:

所以判別式即

第99頁/共124頁

這表明只要n個試驗點不在同一球面上就有可能獲得旋轉(zhuǎn)設(shè)計方案。在中心組合設(shè)計方案中n個試驗點分布在三個不同半徑的球面上,其中:個點分布在半徑為的球面上;

2p個點分布在半徑為的球面上;個點分布在半徑為的球面上。它不會使矩陣A退化。第100頁/共124頁3.的選取為使設(shè)計滿足旋轉(zhuǎn)性條件只要適當選取參數(shù),在中心組合設(shè)計中有:

因此,,為使設(shè)計具有旋轉(zhuǎn)性,則要求

即只要:

從中便可求得。

當對中心組合設(shè)計提出進一步的要求時,可以確定設(shè)計中的另一個參數(shù)m0。

第101頁/共124頁12.5.3二次回歸正交旋轉(zhuǎn)設(shè)計

當要求一個設(shè)計不僅具有旋轉(zhuǎn)性,還要求保持正交性,或至少是近似正交的。這時需要使的非對角線元素全為0,那么只需要(12.4.7)給出的g=0,現(xiàn)在

在g的表達式中,mc是給定的,現(xiàn)在也已確定,,從而g只是m0的函數(shù),所以可令g=0解出m0。如果解得的m0是整數(shù),則所得設(shè)計為正交旋轉(zhuǎn)設(shè)計;如果所得解不是整數(shù),則取最接近的整數(shù),這時的設(shè)計是近似正交的旋轉(zhuǎn)設(shè)計。

第102頁/共124頁

二次回歸正交(或近似正交)旋轉(zhuǎn)組合設(shè)計的參數(shù)與m0見表12.5.1。

表12.5.1二次回歸正交旋轉(zhuǎn)組合設(shè)計參數(shù)第103頁/共124頁12.5.4二次回歸通用旋轉(zhuǎn)設(shè)計

所謂一個設(shè)計具有通用性是指在與編碼中心距離小于1的任意點(x1,x2,…,xp)上的預(yù)測值的方差近似相等。

由于一個旋轉(zhuǎn)設(shè)計各點預(yù)測值的方差僅與該點到中心的距離ρ有關(guān),則Var()=f(ρ),通用設(shè)計要求當ρ<1時,f(ρ)基本為一個常數(shù)。根據(jù)這一要求,可以通過數(shù)值的方法來確定m0。當一個設(shè)計既要具有旋轉(zhuǎn)性又要具有通用性時,設(shè)計中的參數(shù)與m0見表12.5.2。

第104頁/共124頁第105頁/共124頁12.5.5數(shù)據(jù)分析

由于正交旋轉(zhuǎn)設(shè)計的數(shù)據(jù)分析同前面12.4.3一樣,所以下面僅對通用旋轉(zhuǎn)組合設(shè)計的數(shù)據(jù)分析作一介紹

1.回歸系數(shù)的估計要估計回歸系數(shù)必須先求出X’X的逆矩陣,在二次回歸組合設(shè)計中,可求得:

第106頁/共124頁

根據(jù)不同的p與實施方案,其中的K,E,F(xiàn),G的值已列成表格供使用(見表12.5.3)。第107頁/共124頁如果記X’Y陣中的元素為:

則回歸系數(shù)的估計為:第108頁/共124頁

2.對回歸方程的檢驗

由于在回歸系數(shù)的估計中未進行中心化變換,因此各類偏差平方和的計算要用下面的公式:

現(xiàn)在殘差平方和的計算可以如下進行:

從而回歸平方和為:

各類自由度分別為:

第109頁/共124頁

由于在中心點有m0次重復(fù)試驗,因此還可將SE分解為:

其自由度分別為:

這樣可先檢驗?zāi)P偷暮线m性,所用統(tǒng)計量為

當模型合適時,再用統(tǒng)計量:

檢驗方程的顯著性。第110頁/共124頁

3.對回歸系數(shù)的顯著性檢驗

為對回歸系數(shù)進行顯著性檢驗,需要諸項的偏回歸平方和及σ2的估計,其公式如下:從而檢驗諸項系數(shù)的統(tǒng)計量依次為:

第111頁/共124頁

如果有不顯著的項,要刪去該項,一次只能剔除一項,由于這里不是正交設(shè)計,所以回歸系數(shù)間具有相關(guān)性,刪除一個變量后,回歸系數(shù)需要重新計算。由于求回歸系數(shù)的正規(guī)方程組的系數(shù)矩陣階數(shù)較高,求逆矩陣相當麻煩,通常將這項工作交給計算機協(xié)助完成。

第112頁/共124頁

例12.5.1

超聲波換能器設(shè)計中要求靈敏度余量y

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論