數(shù)據(jù)擬合方法研究_第1頁(yè)
數(shù)據(jù)擬合方法研究_第2頁(yè)
數(shù)據(jù)擬合方法研究_第3頁(yè)
數(shù)據(jù)擬合方法研究_第4頁(yè)
數(shù)據(jù)擬合方法研究_第5頁(yè)
已閱讀5頁(yè),還剩80頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選文檔數(shù)據(jù)擬合方法研究中文摘要在我們實(shí)際的實(shí)驗(yàn)和勘探中,都會(huì)產(chǎn)生大量的數(shù)據(jù)。為了解釋這些數(shù)據(jù)或者根據(jù)這些數(shù)據(jù)做出預(yù)測(cè)、判斷,給決策者提供重要的依據(jù)。需要對(duì)測(cè)量數(shù)據(jù)進(jìn)行擬合,尋找一個(gè)反映數(shù)據(jù)變化規(guī)律的函數(shù)。本文介紹了幾種常用的數(shù)據(jù)擬合方法,線性擬合、二次函數(shù)擬合、數(shù)據(jù)的n次多項(xiàng)式擬合等。并著重對(duì)曲線擬合進(jìn)行了研究,介紹了線性與非線性模型的曲線擬合方法,最小二乘法、牛頓迭代法等。在傳統(tǒng)的曲線擬合基礎(chǔ)上,為了提高曲線擬合精度,本文還研究了多項(xiàng)式的擺動(dòng)問(wèn)題,從實(shí)踐的角度分析了產(chǎn)生這些擺動(dòng)及偏差的因素和特點(diǎn),總結(jié)了在實(shí)踐中減小這些偏差的處理方法。采用最小二乘法使變量轉(zhuǎn)換后所得新變量離均差平方和最小,并

2、不一定能使原響應(yīng)變量的離均差平方和最小,所以其模型的擬合精度仍有提高的空間。本文以殘數(shù)法與最小二乘法相結(jié)合,采用非線性最小二乘法來(lái)得到擬合效果更好的曲線模型。隨著計(jì)算機(jī)技術(shù)的發(fā)展,實(shí)驗(yàn)數(shù)據(jù)處理越來(lái)越方便。但也提出了新的課題,就是在選擇數(shù)據(jù)處理方法時(shí)應(yīng)該比以往更為慎重。因?yàn)樯杂胁簧鳎蜁?huì)非常方便地根據(jù)正確的實(shí)驗(yàn)數(shù)據(jù)得出不確切的乃至錯(cuò)誤的結(jié)論。所以提高擬合的準(zhǔn)確度是非常有必要的關(guān)鍵詞:數(shù)據(jù)擬合、最小二乘法、曲線擬合、多項(xiàng)式擺動(dòng)、殘數(shù)法Data Fitting MethodAbstractIn our experiments and exploration, it will produce larg

3、e amounts of data. In order to explain these data to make predictions based on these data to determine, provide an important basis for policy makers . Need to fit the measured data to find a function to reflect data changes in the law. This article describes several commonly used data fitting method

4、s, and focused on a nonlinear curve fitting of the model.This paper introduces some commonly used data fitting method, linear fitting, secondary function fitting, data n times polynomial fitting etc. T And focuses on the curve fitting, introduced the linear and nonlinear model of curve fitting metho

5、d, the least square method, Newton iterative method, etc. In the traditional curve fitting basis, in order to improve the curve fitting precision, this paper also studies the polynomial swing, from the perspective of the practice the oscillation and deviation of factors and characteristics, and summ

6、arizes the decrease in practice the treatment method of these deviations. The least square method to variable after converting from new variables are the sum of squared residuals minimum, not necessarily make the original response from all the variables of the sum of squared residuals minimum, so th

7、e model fitting precision still has room to improve. Based on the number of residual method and least square method, and the combination of nonlinear least square method to get better fitting effect of curve model. With the development of computer technology, the experiment data processing more and

8、more convenient. But also put forward the new subject, which is in the data processing method of choice should be more careful than ever before. Because carelessly a bit, it can be very easily according to the correct experimental data that not the exact and even the wrong conclusion. Therefore, to

9、raise the fitting accuracy is very necessaryKey words: Data Fitting ; Least square method; Curve fitting; Polynomial swing; Residual method目 錄中文摘要IAbstractII第一章緒論111數(shù)據(jù)簡(jiǎn)介11.1.1名詞解釋11.1.2數(shù)據(jù)屬性11.2 曲線擬合簡(jiǎn)介2第二章數(shù)據(jù)擬合方法分類32.1 線性擬合42.2 二次函數(shù)擬合62.3 數(shù)據(jù)的n次多項(xiàng)式擬合82.4 點(diǎn)集x1,x2,xm上的正交多項(xiàng)式系92.5 用正交多項(xiàng)式系組成擬合函數(shù)的多項(xiàng)式擬合102.6

10、指數(shù)函數(shù)的數(shù)據(jù)擬合112.7 多元線性函數(shù)的數(shù)據(jù)擬合12第三章曲線擬合特性143.1 線性模型的曲線擬合143.1.1 最小二乘法及其計(jì)算143.1.2 用正交多項(xiàng)式作最小二乘擬合203.2 非線性模型的曲線擬合233.2.1 牛頓迭代233.2.2 常見(jiàn)非線性模型24第四章多項(xiàng)式的擺動(dòng)294.1 多項(xiàng)式擺動(dòng)介紹294.2 影響多項(xiàng)式擬合偏差的因素324.2.1 實(shí)驗(yàn)數(shù)據(jù)的不均勻性324.2.2 數(shù)據(jù)的密度334.2.3 擬合曲線的適用區(qū)間334.3 使用多項(xiàng)式擬合的注意事項(xiàng)334.3.1盡量避免高階多項(xiàng)式的擬合334.3.2保持密度344.3.3在實(shí)驗(yàn)數(shù)據(jù)走向比較明確的前提下,可以考慮其他的

11、非線性擬合方法34第五章殘數(shù)法與最小二乘法結(jié)合365.1 二項(xiàng)指數(shù)曲線原理與方法365.2 資料與分析395.3 殘數(shù)法與最小二乘法結(jié)合總結(jié)42第六章總結(jié)44結(jié)束語(yǔ)44參考文獻(xiàn)47附錄1 英文原文51附錄2 中文翻譯65附錄3 程序78精選文檔第一章 緒論在我們實(shí)際的實(shí)驗(yàn)和勘探中,都會(huì)產(chǎn)生大量的數(shù)據(jù)。為了解釋這些數(shù)據(jù)或者根據(jù)這些數(shù)據(jù)做出預(yù)測(cè)、判斷,給決策者提供重要的依據(jù)。需要對(duì)測(cè)量數(shù)據(jù)進(jìn)行擬合,尋找一個(gè)反映數(shù)據(jù)變化規(guī)律的函數(shù)。11數(shù)據(jù)簡(jiǎn)介科學(xué)實(shí)驗(yàn)、檢驗(yàn)、統(tǒng)計(jì)等所獲得的和用于科學(xué)研究、技術(shù)設(shè)計(jì)、查證、決策等的數(shù)值。1.1.1名詞解釋研究數(shù)據(jù)就是對(duì)數(shù)據(jù)進(jìn)行采集、分類、錄入、儲(chǔ)存、統(tǒng)計(jì)分析,統(tǒng)計(jì)檢驗(yàn)

12、等一系列活動(dòng)的統(tǒng)稱。1.1.2數(shù)據(jù)屬性柯巖奇異的書簡(jiǎn)船長(zhǎng):“ 貝漢廷 分析著各個(gè)不同的數(shù)據(jù),尋找著規(guī)律,終于抓住了矛盾的牛鼻子?!睌?shù)據(jù)是載荷或記錄信息的按一定規(guī)則排列組合的物理符號(hào)??梢允菙?shù)字、文字、圖像,也可以是計(jì)算機(jī)代碼。對(duì)信息的接收始于對(duì)數(shù)據(jù)的接收,對(duì)信息的獲取只能通過(guò)對(duì)數(shù)據(jù)背景的解讀。數(shù)據(jù)背景是接收者針對(duì)特定數(shù)據(jù)的信息準(zhǔn)備,即當(dāng)接收者了解物理符號(hào)序列的規(guī)律,并知道每個(gè)符號(hào)和符號(hào)組合的指向性目標(biāo)或含義時(shí),便可以獲得一組數(shù)據(jù)所載荷的信息。亦即數(shù)據(jù)轉(zhuǎn)化為信息,可以用公式“數(shù)據(jù)+背景=信息”表示。數(shù)據(jù)擬合在很多地方都有應(yīng)用,主要用來(lái)處理實(shí)驗(yàn)或觀測(cè)的原始離散數(shù)據(jù)。通過(guò)擬合可以更好的分析和解釋數(shù)據(jù)

13、。1.2 曲線擬合簡(jiǎn)介曲線擬合,俗稱拉曲線,是一種把現(xiàn)有數(shù)據(jù)透過(guò)數(shù)學(xué)方法來(lái)代入一條數(shù)式的表示方式??茖W(xué)和工程問(wèn)題可以通過(guò)諸如采樣、實(shí)驗(yàn)等方法獲得若干離散的數(shù)據(jù),根據(jù)這些數(shù)據(jù),我們往往希望得到一個(gè)連續(xù)的函數(shù)(也就是曲線)或者更加密集的離散方程與已知數(shù)據(jù)相吻合,這過(guò)程就叫做擬合。 在科學(xué)實(shí)驗(yàn)或社會(huì)活動(dòng)中,人們常常需要觀測(cè)很多數(shù)據(jù)的規(guī)律, 通過(guò)實(shí)驗(yàn)或者觀測(cè)得到量x與y的一組數(shù)據(jù)對(duì)(xi,yi)(i=1,2, ,N),其中xi是彼此不同的。人們希望用一類與數(shù)據(jù)本質(zhì)規(guī)律相適應(yīng)的解析表達(dá)式,y=fx ,c來(lái)反映量x與y之間的依賴關(guān)系,即在一定意義下“最佳”地逼近或擬合已知數(shù)據(jù)。fx ,c常稱作擬合模型,當(dāng)

14、c在f中線性出現(xiàn)時(shí),稱為線性模型,否者稱為非線性模型。線性模型是回歸模型中最常見(jiàn)的一種,但在實(shí)際中,許多現(xiàn)象之間的關(guān)系往往并不是線性的,而是呈現(xiàn)某種曲線關(guān)系。如服藥后血藥濃度與時(shí)間的關(guān)系;病毒劑量與致死率的關(guān)系;化學(xué)反應(yīng)的反應(yīng)物濃度與反應(yīng)速度的關(guān)系。這就產(chǎn)生的曲線擬合,用連續(xù)曲線近似地刻畫或比擬平面上離散點(diǎn)組所表示的坐標(biāo)之間的函數(shù)關(guān)系。用解析表達(dá)式逼近離散數(shù)據(jù)的一種方法。第二章 數(shù)據(jù)擬合方法分類 在實(shí)驗(yàn)中,實(shí)驗(yàn)和戡測(cè)常常會(huì)產(chǎn)生大量的數(shù)據(jù)。為了解釋這些數(shù)據(jù)或者根據(jù)這些數(shù)據(jù)做出預(yù)測(cè)、判斷,給決策者提供重要的依據(jù)。需要對(duì)測(cè)量數(shù)據(jù)進(jìn)行擬合,尋找一個(gè)反映數(shù)據(jù)變化規(guī)律的函數(shù)。數(shù)據(jù)擬合方法與數(shù)據(jù)插值方法不同

15、,它所處理的數(shù)據(jù)量大而且不能保證每一個(gè)數(shù)據(jù)沒(méi)有誤差,所以要求一個(gè)函數(shù)嚴(yán)格通過(guò)每一個(gè)數(shù)據(jù)點(diǎn)是不合理的。數(shù)據(jù)擬合方法求擬合函數(shù),插值方法求插值函數(shù)。這兩類函數(shù)最大的不同之處是,對(duì)擬合函數(shù)不要求它通過(guò)所給的數(shù)據(jù)點(diǎn),而插值函數(shù)則必須通過(guò)每一個(gè)數(shù)據(jù)點(diǎn)。例如,在某化學(xué)反應(yīng)中,測(cè)得生成物的質(zhì)量濃度y (10 3 g/cm3)與時(shí)間t (min)的關(guān)系如表所示t12346810121416y4.006.418.018.799.539.8610.3310.4210.5310.61顯然,連續(xù)函數(shù)關(guān)系y(t)是客觀存在的。但是通過(guò)表中的數(shù)據(jù)不可能確切地得到這種關(guān)系。何況,由于儀器和環(huán)境的影響,測(cè)量數(shù)據(jù)難免有誤差。因

16、此只能尋求一個(gè)近擬表達(dá)式y(tǒng) = (t)尋求合理的近擬表達(dá)式,以反映數(shù)據(jù)變化的規(guī)律,這種方法就是數(shù)據(jù)擬合方法。數(shù)據(jù)擬合需要解決兩個(gè)問(wèn)題:第一,選擇什么類型的函數(shù)作為擬合函數(shù)(數(shù)學(xué)模型);第二,對(duì)于選定的擬合函數(shù),如何確定擬合函數(shù)中的參數(shù)。數(shù)學(xué)模型應(yīng)建立在合理假設(shè)的基礎(chǔ)上,假設(shè)的合理性首先體現(xiàn)在選擇某種類型的擬合函數(shù)使之符合數(shù)據(jù)變化的趨勢(shì)(總體的變化規(guī)律)。擬合函數(shù)的選擇比較靈活,可以選擇線性函數(shù)、多項(xiàng)式函數(shù)、指數(shù)函數(shù)、三角函數(shù)或其它函數(shù),這應(yīng)根據(jù)數(shù)據(jù)分布的趨勢(shì)作出選擇。為了問(wèn)題敘述的方便,將例1的數(shù)據(jù)表寫成一般的形式tx1x2x3x4x5x6x7x8x9x10yy1y2y3y4y5y6y7y8y

17、9y102.1 線性擬合假設(shè)擬合函數(shù)是線性函數(shù),即擬合函數(shù)的圖形是一條平面上的直線。而表中的數(shù)據(jù)點(diǎn)未能精確地落在一條直線上的原因是實(shí)驗(yàn)數(shù)據(jù)的誤差。則下一步是確定函數(shù)y= a + b x中系數(shù)a和bt 各等于多少?從幾何背景來(lái)考慮,就是要以a和b作為待定系數(shù),確定一條平面直線使得表中數(shù)據(jù)所對(duì)應(yīng)的10個(gè)點(diǎn)盡可能地靠近這條直線。一般來(lái)講,數(shù)據(jù)點(diǎn)將不會(huì)全部落在這條直線上,如果第k個(gè)點(diǎn)的數(shù)據(jù)恰好落在這條直線上,則這個(gè)點(diǎn)的坐標(biāo)滿足直線的方程,即a + b xk = y k如果這個(gè)點(diǎn)不在直線上,則它的坐標(biāo)不滿足直線方程,有一個(gè)絕對(duì)值為的差異(殘差)。于是全部點(diǎn)處的總誤差是這是關(guān)于a和b的一個(gè)二元函數(shù),合理的

18、做法是選取a和b ,使得這個(gè)函數(shù)取極小值。但是在實(shí)際求解問(wèn)題時(shí)為了操作上的方便,常常是求a和b使得函數(shù)達(dá)到極小。為了求該函數(shù)的極小值點(diǎn),令,得, 這是關(guān)于未知數(shù)a和b的線性方程組。它們被稱為法方程,又可以寫成求解這個(gè)二元線性方程組便得待定系數(shù)a和b,從而得線性擬合函數(shù) y = a + b x。下圖中直線是數(shù)據(jù)的線性擬合的結(jié)果。2.2 二次函數(shù)擬合假設(shè)擬合函數(shù)不是線性函數(shù),而是一個(gè)二次多項(xiàng)式函數(shù)。即擬合函數(shù)的圖形是一條平面上的拋物線,而表中的數(shù)據(jù)點(diǎn)未能精確地落在這條拋物線上的原因是實(shí)驗(yàn)數(shù)據(jù)的誤差。則下一步是確定函數(shù)y = a0 + a1 x + a2 x 2中系數(shù)a0、a1和a2t 各等于多少?

19、從幾何背景來(lái)考慮,就是要以a0、a1和a2為待定系數(shù),確定二次曲線使得表中數(shù)據(jù)所對(duì)應(yīng)的10個(gè)點(diǎn)盡可能地靠近這條曲線。一般來(lái)講,數(shù)據(jù)點(diǎn)將不會(huì)全部落在這條曲線上,如果第k個(gè)點(diǎn)的數(shù)據(jù)恰好落在曲線上,則這個(gè)點(diǎn)的坐標(biāo)滿足二次曲線的方程,即a0 + a1 xk + a2 xk 2 = yk如果這個(gè)點(diǎn)不在曲線上,則它的坐標(biāo)不滿足曲線方程,有一個(gè)誤差(殘差)。于是全部點(diǎn)處的總誤差用殘差平方和表示這是關(guān)于a0、a1和a2的一個(gè)三元函數(shù),合理的做法是選取a0、a1和a2 ,使得這個(gè)函數(shù)取極小值。為了求該函數(shù)的極小值點(diǎn),令,得這是關(guān)于待定系數(shù)a0、a1和a2的線性方程組,寫成等價(jià)的形式為這就是法方程,求解這一方程組

20、可得二次擬合函數(shù)中的三個(gè)待定系數(shù)。下圖反映了例題所給數(shù)據(jù)的二次曲線擬合的結(jié)果2.3 數(shù)據(jù)的n次多項(xiàng)式擬合 x x1 x2 xm f(x) y1 x2 ym已知函數(shù)在個(gè)離散點(diǎn)處的函數(shù)值,假設(shè)擬合函數(shù)是n次多項(xiàng)式,則需要用所給數(shù)據(jù)來(lái)確定下面的函數(shù)y = a0 + a1 x + a2 x 2 + + an x n這里要做一個(gè)假設(shè),即多項(xiàng)式的階數(shù)n應(yīng)小于題目所給數(shù)據(jù)的數(shù)目m(例題中m = 10)。類似前面的推導(dǎo),可得數(shù)據(jù)的n次多項(xiàng)式擬合中擬合函數(shù)的系數(shù)應(yīng)滿足的正規(guī)方程組如下從這一方程組可以看出,線性擬合方法和二次擬合方法是多項(xiàng)式擬合的特殊情況。從算法上看,數(shù)據(jù)最小二乘擬合的多項(xiàng)式方法是解一個(gè)超定方程組

21、( m n)的最小二乘解。而多項(xiàng)式擬合所引出的正規(guī)方程組恰好是用超定方程組的系數(shù)矩陣的轉(zhuǎn)置矩陣去左乘超定方程組左、右兩端所得。正規(guī)方程組的系數(shù)矩陣是一個(gè)病態(tài)矩陣,這類方程組被稱為病態(tài)方程組。當(dāng)系數(shù)矩陣或者是右端向量有微小的誤差時(shí),可能引起方程組準(zhǔn)確解有很大的誤差。為了避免求解這樣的線性方程組,在做多項(xiàng)式擬合時(shí)可以將多項(xiàng)式中的各次冪函數(shù)做正交化變換,使得所推出的正規(guī)方程的系數(shù)矩陣是對(duì)角矩陣。2.4 點(diǎn)集x1,x2,xm上的正交多項(xiàng)式系多項(xiàng)式q0(x),q1(x),q2(x),qn(x)在點(diǎn)集x1,x2,xm上的正交 正交多項(xiàng)式系可以認(rèn)為是冪函數(shù)系:1,x,x 2,x n通過(guò)正交變換而得到的一組函

22、數(shù)。正交多項(xiàng)式系構(gòu)造的方法如下:q0(x)=1,q0(x) = x a1 ,(a1 = ),qk(x) = (x - ak) qk -1(x) - bk qk-2(x) ,( k = 2,3,n)其中,2.5 用正交多項(xiàng)式系組成擬合函數(shù)的多項(xiàng)式擬合考慮擬合函數(shù):,將數(shù)據(jù)表 x x1 x2 xm f(x) y1 x2 ym中的數(shù)據(jù)代入,得超定方程(m n)其系數(shù)矩陣為由于多項(xiàng)式q0(x),q1(x),q2(x),qn(x)在點(diǎn)集x1,x2,xm上的正交,所以超定方程組的系數(shù)矩陣中不同列的列向量是相互正交的向量組。于是用這一矩陣的轉(zhuǎn)置矩陣去左乘超定方程組左、右兩端得正規(guī)方程組 = 其中,。因?yàn)檎?guī)

23、方程組中每一個(gè)方程都是一元一次方程可以直接寫出原超方程組的最小二乘解,所以擬合函數(shù)為這一結(jié)果與用次多項(xiàng)式擬合所得結(jié)果在理論是完全一樣的,只是形式上不同、算法實(shí)現(xiàn)上避免了解病態(tài)方程組。2.6 指數(shù)函數(shù)的數(shù)據(jù)擬合問(wèn)題1:世界人中預(yù)測(cè)問(wèn)題 下表給出了本世紀(jì)六十年代世界人口的統(tǒng)計(jì)數(shù)據(jù)(單位:億)年196019611962196319641965196619671968人口29.7230.6131.5132.1332.3432.8533.5634.2034.83有人根據(jù)表中數(shù)據(jù),預(yù)測(cè)公元2000年世界人口會(huì)超過(guò) 60億。這一結(jié)論在六十年代末令人難以置信,但現(xiàn)在已成為事實(shí)。試建立數(shù)學(xué)模型并根據(jù)表中數(shù)據(jù)推算

24、出2000年世界人口的數(shù)量。根據(jù)馬爾薩斯人口理論,人口數(shù)量按指數(shù)遞增的規(guī)律發(fā)展。記人口數(shù)為 N(t),則有指數(shù)函數(shù)?,F(xiàn)需要根據(jù)六十年代的人口數(shù)據(jù)確定函數(shù)表達(dá)式中兩個(gè)常數(shù)a、b。為了計(jì)算方便,對(duì)表達(dá)式兩邊取對(duì)數(shù),得 ,令 。于是。(1)計(jì)算出表中人口數(shù)據(jù)的對(duì)數(shù)值yk = ln Nk ( k = 1,2,9)(2) 根據(jù)表中數(shù)據(jù)寫出關(guān)于兩個(gè)未知數(shù)a 、b的9個(gè)方程的超定方程組(方程數(shù)多于未知數(shù)個(gè)數(shù)的方程組)a + b t k = y k ( k = 1,2,9)其中,t1 =1960,t2 =1961,t3 =1962,t9 =1968; y1= ln29.72,y2 = ln 30.61,y9

25、= ln34.83。(3) 利用MATLAB解線性方程組Ax=c的命令A(yù)c計(jì)算出a 、b的值,并寫出人口增長(zhǎng)函數(shù)。利用人口增長(zhǎng)函數(shù)計(jì)算出2000年世界人口數(shù)據(jù):N(2000) 2.7 多元線性函數(shù)的數(shù)據(jù)擬合問(wèn)題2 人的耗氧能力的數(shù)據(jù)擬合。人的耗氧能力y (ml/minkg)與下列變量有關(guān)x1 年齡x2 體重x3 1.5英里跑步所用時(shí)間x4 靜止時(shí)心速x5 跑步時(shí)最大心速某健身中心對(duì)31個(gè)自愿者進(jìn)行測(cè)試,得到31組數(shù)據(jù)(每一組數(shù)據(jù)有6個(gè)數(shù))yk x1k x2k x3k x4k x5k (k=1,31)令耗氧能力為因變量,其它的指標(biāo)為自變量,建立線性模型y=a0+a1x1+a2x2+a3x3+a4

26、x4+a5x5為了確定6個(gè)系數(shù),利用已記錄的數(shù)據(jù)得超定方程組a0+a1x1k+a2x2k+a3x3k+a4x4k+a5x5k=yk (k=1,2,31)這一方程組包含6個(gè)未知數(shù)a0,a1,a2,a3,a4,a5,但卻有31個(gè)方程。寫出超定方程組的系數(shù)矩陣和右端向量如下,由最小二乘法可得正規(guī)方程組其中,X=a0,a1,a2,a3,a4,a5T第三章 曲線擬合特性在科學(xué)實(shí)驗(yàn)或社會(huì)活動(dòng)中,人們常常需要觀測(cè)很多數(shù)據(jù)的規(guī)律, 通過(guò)實(shí)驗(yàn)或者觀測(cè)得到量x與y的一組數(shù)據(jù)對(duì)(xi,yi)(i=1,2, ,N),其中xi是彼此不同的。人們希望用一類與數(shù)據(jù)本質(zhì)規(guī)律相適應(yīng)的解析表達(dá)式,y=fx ,c來(lái)反映量x與y之間

27、的依賴關(guān)系,即在一定意義下“最佳”地逼近或擬合已知數(shù)據(jù)。fx ,c常稱作擬合模型,當(dāng)c在f中線性出現(xiàn)時(shí),稱為線性模型,否者稱為非線性模型。3.1 線性模型的曲線擬合 已知某函數(shù)的若干離散函數(shù)值f1,f2,fn,通過(guò)調(diào)整該函數(shù)中若干待定系數(shù)f(1, 2,m), 使得該函數(shù)與已知點(diǎn)集的差別(最小二乘意義)最小。如果待定函數(shù)是線性,就叫線性擬合。下面介紹計(jì)算線性擬合的基本方法。3.1.1 最小二乘法及其計(jì)算在函數(shù)的最佳平方逼近中fxCa,b,如果fx 只在一組離散點(diǎn)集xi,i=0,1,m 上給出,這就是科學(xué)實(shí)驗(yàn)中常見(jiàn)的實(shí)驗(yàn)數(shù)據(jù)xi ,yi ,i=0,1,m的曲線擬合,這里yi=f(xi)(i=0,1

28、,m),要求一個(gè)函數(shù)y=S*(x)與所給數(shù)據(jù)xi ,yi ,i=0,1,m擬合,若記i=S*(xi)-yi i=0,1,m,=(0,1,m)T,設(shè)0 x,1x, mx是Ca,b上線性無(wú)關(guān)函數(shù)族,在=span0 x,1x, mx中找一個(gè)函數(shù)S*(x)C,使誤差平方和22=i=0mi2=i=0mS*xi-yi 2=minS(x)i=0mSxi-yi 2, (3.1)這里Sx=a00 x+a11x+annx n0, j=k, (3.8)則法方程(2.6)的解為ak*=(f,k)(k.k)=i=0m(xi)j(xi)k(xi)i=0mxik2(xi) , k=0,1,n, (3.9) 且平方誤差為22

29、=f22-k=0nAkak*2 .現(xiàn)在我們根據(jù)給定節(jié)點(diǎn)x0,x1, ,xm及權(quán)函數(shù)(x)0,造出帶權(quán)(x)正交的多項(xiàng)式Pn(x),注意nm,用遞推公司表示Pn(x),即P0 x=1, P1x=x-a1P0 x, Pk+1(x)=x-ak+1Pkx-kPk-1x, k=0,1,n-1 . (3.10)這里Pk(x)是首項(xiàng)系數(shù)為1的k次多項(xiàng)式,根據(jù)Pk(x)的正交性,得k+1=i=0mxixiPk2xii=0mxiPk2xi=xPkx,PkxPkx,Pkx =(xPk,Pk)(Pk,Pk),k=0,1,n-1 k=i=0mxiPk2xii=0mxiPk-12xi=(Pk,Pk)(Pk-1,Pk-1

30、),k=0,1,n-1 (3.11)下面用歸納法證明這樣給出的Pkx是正交的,由(3.10)式第二次及(3.11)式中1的表達(dá)式,有P0,P1=P0,xP0-1P0,P0=P0,xP0-xP0,P0P0,P0P0,P0=0.現(xiàn)假定Pl,Ps=0ls對(duì)s=0,1,l-1及l(fā)=0,1,k(kn)均成立,要證Pk+1,Ps=0對(duì)s=0,1,k均成立。由(3.10)式有Pk+1,Ps=x-k+1Pk,Ps-kPk-1,Ps =xPk,Ps-k+1Pk,Ps-kPk-1,Ps (3.12) 由歸納法假定0sk-2時(shí),Pk,Ps=0, Pk-1,Ps=0. 另外,xPs(x)是首項(xiàng)系數(shù)為1的s+1次多項(xiàng)式

31、,它可由P0,P1,Ps+1的線性組合表示,而s+1k-1,故由歸納法假定又有xPk,PsPk,xPs=0于是由(3.12)式,當(dāng)sk-2時(shí)Pk+1,Ps=0。再看Pk+1,Pk-1=xPk,Pk-1-k+1Pk,Pk-1-kPk-1,Pk-1, (3.13)由假定有Pk,Pk-1=0,xPk,Pk-1=Pk,xPk-1=Pk,Pk+j=0k-1cjPj=Pk,Pk.利用(3.11)式中k表達(dá)式及以上結(jié)果,得Pk+1,Pk-1=xPk,Pk-1-kPk-1,Pk-1=Pk,Pk-Pk,Pk=0.最后,由(3.11)式有 Pk+1,Pk=xPk,Pk-k+1Pk,Pk-kPk,Pk-1 =xPk

32、,Pk-xPk,PkPk,PkPk,Pk=0 至此已證明了由(3.10)式及(3.11)式確定的多項(xiàng)式Pkx(k=0,1,n,nm)組成一個(gè)關(guān)于點(diǎn)集xi的正交系。用正交多項(xiàng)式Pkx的線性組合作最小二乘曲線擬合,只要根據(jù)公司(3.10)及(3.11)逐步求Pkx的同時(shí),相應(yīng)計(jì)算出系數(shù)ak*=(f,Pk)(Pk,Pk)=i=0m(xi)j(xi)Pk(xi)i=0mxiPk2(xi) , k=0,1,n,并逐步把a(bǔ)k*Pk(x)累加到S(x)中去,最后就可得到所求的擬合曲線y=Sx=a0*P0 x+a1*P1x+an*Pnx .這里n可事先給定或在計(jì)算過(guò)程中根據(jù)誤差確定。用這種方法編程序不用解線性

33、方程組,只用遞推公式,并且當(dāng)逼近次數(shù)增加一次時(shí),只要把程序中循環(huán)數(shù)加1,其余不用改變。這就是目前用多項(xiàng)式作曲線擬合最后的計(jì)算方法。3.2 非線性模型的曲線擬合當(dāng)前研究的非線性模型主要是指參數(shù)或自變量是非線性的,形式復(fù)雜多樣,常見(jiàn)的有多項(xiàng)式形式、雙曲線形式、對(duì)數(shù)形式、冪函數(shù)形式等等,更復(fù)雜的有修正指數(shù)曲線、Compterz曲線以及Logistic曲線等。如何根據(jù)數(shù)據(jù)的大致規(guī)律來(lái)選擇合適的模型,是擬合的關(guān)鍵。總的來(lái)說(shuō)有兩中可參考的方法:一是根據(jù)散點(diǎn)圖來(lái)確定類型,即由散點(diǎn)圖的形狀大體確定模型類型;二是根據(jù)專業(yè)知識(shí)和經(jīng)驗(yàn),判斷研究的數(shù)據(jù)曲線屬于什么類型。現(xiàn)在研究非線性模型的方法用得最多的就是最小二乘法

34、。3.2.1 牛頓迭代無(wú)論采取什么方式變換都不可能實(shí)現(xiàn)線性化,這樣的模型稱為不可線性化模型。對(duì)于不可線性化模型,一般采用高斯一牛頓迭代法進(jìn)行參數(shù)估計(jì),即借助于泰勒級(jí)數(shù)展開(kāi)式進(jìn)行逐次的線性近似估計(jì)。第一步:做Logit-Ln線性回歸,求A1, A0, x和p的初值。此時(shí)x不能為0值,若輸入的x有0值,則將其設(shè)為一小值(例如:0.00001)。首選將原方程變形為如下線性形式: 將A0初值設(shè)為輸入的y值的最大值加1,A1的初值設(shè)為輸入的y值的最小值減0.1。通過(guò)簡(jiǎn)單的直線擬合即可求出p和x0的初值。第二步:對(duì)Logistic方程四個(gè)參數(shù)求偏微分,得到y(tǒng)對(duì)給定系數(shù)的增量(A1, A2, x, p)的泰

35、勒級(jí)數(shù)展開(kāi)式。 泰勒級(jí)數(shù)展開(kāi)式為:由此,將曲線回歸轉(zhuǎn)化為多元線性回歸,通過(guò)迭代計(jì)算,得到四個(gè)參數(shù)的變量A1, A2, x, p,逐步修正四參數(shù)的值。多元線性回歸與多項(xiàng)式擬合方法相同。每一次迭代可計(jì)算出參數(shù)變量值,新的參數(shù)值為原參數(shù)值與變量值的疊加。第三步:為保證迭代收斂,在計(jì)算相關(guān)系數(shù)時(shí),引入一系數(shù)a,初值設(shè)為2,將a與參數(shù)的變量矩陣相乘,計(jì)算相關(guān)系數(shù)。a=a/2,循環(huán)10次,每次a的值減半。取循環(huán)中得到的相關(guān)系數(shù)最大的變量矩陣A1, A2, x, p。第四步:默認(rèn)總的迭代次數(shù)為1000次,或者當(dāng)相關(guān)系數(shù)不再減小時(shí),則迭代停止。返回得到的四參數(shù)值。3.2.2 常見(jiàn)非線性模型對(duì)于解釋變量是非線性

36、的,但參數(shù)之間是線性的模型,可以利用變量直接代換的方法將模型線性化,通過(guò)線性擬合來(lái)計(jì)算。1.多項(xiàng)式函數(shù)模型多項(xiàng)式函數(shù)形式令 原模型可化為線性形式即可利用多元線性回歸分析的方法處理了。這類模型廣泛地用于生產(chǎn)和成本函數(shù)。例如總成本函數(shù)可表示為:其中,y表示總成本,表示產(chǎn)出。2雙曲線模型 雙曲線函數(shù)形式3.雙對(duì)數(shù)函數(shù)模型函數(shù)形式 所以彈性為一常數(shù)。它表示x變動(dòng)1%,y變動(dòng) 了。由于這個(gè)特殊的性質(zhì),雙對(duì)數(shù)模型又稱為不變彈性模型。4.半對(duì)數(shù)函數(shù)模型 函數(shù)形式 對(duì)于線性-對(duì)數(shù)模型 它表示x變動(dòng)1%,y將變動(dòng) 個(gè)單位的絕對(duì)量。即y的絕對(duì)變化量等于 乘以x的相對(duì)變化量。5.邏輯斯蒂(Logistic)曲線函數(shù)

37、形式 令則有 6.指數(shù)曲線函數(shù)形式 兩邊取對(duì)數(shù)得:令 則有 7.冪函數(shù)曲線 函數(shù)形式 兩邊取對(duì)數(shù)得: 令 則有8. 龔伯茲(Gompertz)曲線函數(shù)形式 兩邊取對(duì)數(shù)得:令則有第四章 多項(xiàng)式的擺動(dòng)在實(shí)驗(yàn)科學(xué)中,常常會(huì)遇到這樣的問(wèn)題,用一組給定的非線性實(shí)驗(yàn)數(shù)據(jù)xi,yi(i=1,2,m)得出指導(dǎo)性的經(jīng)驗(yàn)公式,即自變量x與因變量y的函數(shù)關(guān)系y=f(x),這就是曲線擬合。在曲線擬合中最小二乘法多項(xiàng)式擬合的應(yīng)用非常普遍,在許多科學(xué)文獻(xiàn)中,實(shí)驗(yàn)結(jié)果都以多項(xiàng)式y(tǒng)=k=0nakxk的形式給出以供參考。雖然多項(xiàng)式的擬合適用普遍,通過(guò)適當(dāng)?shù)臄M合多項(xiàng)式的階數(shù)改善曲線逼近實(shí)驗(yàn)數(shù)據(jù)點(diǎn)的程度,但同時(shí)也帶來(lái)不利的一面。提

38、高擬合多項(xiàng)式的階數(shù),曲線在某些區(qū)間往往會(huì)產(chǎn)生非期望的起伏,這使得曲線的參考價(jià)值大打折扣。4.1 多項(xiàng)式擺動(dòng)介紹已知實(shí)驗(yàn)數(shù)據(jù)xi,yi(i=1,2,m),當(dāng)使用xkk=0n為基作多項(xiàng)式y(tǒng)=k=0nakxk形式擬合時(shí)當(dāng)冪次升高時(shí),即使采用正交化的處理,格蘭姆矩陣的條件數(shù)往往很大,這時(shí)正規(guī)方程是病態(tài)的,這可能導(dǎo)致求解的結(jié)果嚴(yán)重的失真,使多項(xiàng)式曲線在某些區(qū)間產(chǎn)生振蕩,這就是多項(xiàng)式的擺動(dòng)。實(shí)踐的結(jié)果也表明,這種情況常有發(fā)生。例如:表3-1數(shù)據(jù)是以y=lnx產(chǎn)生的一組數(shù)據(jù)。表3-1x0.251.252.253.258.25y-1.386290.2231440.810931.1786552.110213分別

39、用二、三、四階多項(xiàng)式擬合得函數(shù)關(guān)系式: y1=-0.09x2+1.1711x-1.4495 y2=0.0365x3-0.5089x2+2.198x-1.8812 y3=-0.0153x4+0.2405x3-1.2543x2+3.0621x-2.0771(a) y=lnx(b) y1=-0.09x2+1.1711x-1.4495(c) y2=0.0365x3-0.5089x2+2.198x-1.8812(d) y3=-0.0153x4+0.2405x3-1.2543x2+3.0621x-2.0771 圖3-1 原函數(shù)及多階函數(shù)圖線圖3-1(a)是原函數(shù)的圖線,圖3-1(b,c,d)分別是。y1、

40、y2、y3。與原函數(shù)比較結(jié)果表明,提高擬合的階數(shù),曲線通過(guò)實(shí)驗(yàn)數(shù)據(jù)點(diǎn)的個(gè)數(shù)增加了,但在一定的區(qū)間,曲線的走向出現(xiàn)了與原函數(shù)較大的偏差。如果用擬合曲線作原函數(shù)關(guān)系參考顯然是不準(zhǔn)確的。4.2 影響多項(xiàng)式擬合偏差的因素從理論上講,使用高階多項(xiàng)式擬合,上述擺動(dòng)更容易發(fā)生。從實(shí)踐上講上述擺動(dòng)產(chǎn)生的擬合曲線偏差由三方面產(chǎn)生。4.2.1 實(shí)驗(yàn)數(shù)據(jù)的不均勻性例如,同樣以y=lnx在同樣的區(qū)間等問(wèn)隔產(chǎn)生一組數(shù)據(jù)如表3-2。使用四階多項(xiàng)式擬得:y=-0.003x4+0.0669x3-0.5419x2+2.1121x-1.8815 表3-2x0.252.254.256.258.25y-1.386290.810931

41、.4469191.8325812.110213函數(shù)曲線如圖3-2,比較圖3-1(d),圖3-2的擺動(dòng)大大減小。y=-0.003x4+0.0669x3-0.5419x2+2.1121x-1.8815圖3-2 四階函數(shù)圖線4.2.2 數(shù)據(jù)的密度顯然增加數(shù)據(jù)的密度,增強(qiáng)對(duì)曲線的約束,擬合曲線在實(shí)驗(yàn)數(shù)據(jù)的區(qū)間偏差變小。4.2.3 擬合曲線的適用區(qū)間在實(shí)驗(yàn)數(shù)據(jù)的區(qū)間偏差一般較小,而在外推區(qū)間隨著擬合階次的提高,往往難以預(yù)測(cè)。4.3 使用多項(xiàng)式擬合的注意事項(xiàng)隨著計(jì)算機(jī)技術(shù)的發(fā)展,實(shí)驗(yàn)數(shù)據(jù)處理越來(lái)越方便。但也提出了新的課題,就是在選擇數(shù)據(jù)處理方法時(shí)應(yīng)該比以往更為慎重。因?yàn)樯杂胁簧?,就?huì)非常方便地根據(jù)正確的實(shí)

42、驗(yàn)數(shù)據(jù)得出不確切的乃至錯(cuò)誤的結(jié)論。在使用多項(xiàng)式擬合非線性實(shí)驗(yàn)數(shù)據(jù)時(shí),要考慮它的局限性,避免由于處理方法不當(dāng)給實(shí)驗(yàn)帶來(lái)更大的誤差。4.3.1盡量避免高階多項(xiàng)式的擬合事實(shí)上雖然高階多項(xiàng)式的擬合在實(shí)驗(yàn)區(qū)間內(nèi)與實(shí)驗(yàn)數(shù)據(jù)能盡可能地接近,但它的使用存在兩大弊端。首先,應(yīng)用計(jì)算困難,實(shí)踐應(yīng)用價(jià)值不高。其次,外推誤差大,對(duì)擬合在實(shí)驗(yàn)區(qū)間內(nèi)與實(shí)驗(yàn)數(shù)據(jù)吻合得較好,而在區(qū)間外的擺動(dòng)常會(huì)產(chǎn)生不可預(yù)期的走向,不能正確反映自變量和因變量之間的函數(shù)關(guān)系的變化趨勢(shì)。例如,根據(jù)表3-2數(shù)據(jù)的四階擬合函數(shù)關(guān)系計(jì)算相應(yīng)點(diǎn)的函數(shù)值與原函數(shù)相比較,如表3-3。從表中可以看出,當(dāng)x=12.25時(shí)時(shí)已經(jīng)與原函數(shù)相去甚遠(yuǎn)。因此這個(gè)擬合表達(dá)式

43、對(duì)實(shí)踐的指導(dǎo)意義是局限的。表3-3x0.252.254.256.258.2510.2512.25ln(x)-1.38630.81091.44691.83262.11022.32732.5055y-1.38630.81251.46371.90652.32811.7638-1.9034y-1.30460.77951.41221.82482.14032.39952.62174.3.2保持密度如果確實(shí)有必要采用多項(xiàng)式擬合,要保持適當(dāng)?shù)臄?shù)據(jù)密度同時(shí),盡量采用等間距采樣的實(shí)驗(yàn)數(shù)據(jù)。如圖3-2.4.3.3在實(shí)驗(yàn)數(shù)據(jù)走向比較明確的前提下,可以考慮其他的非線性擬合方法在這個(gè)例子中最好是擬合成的形式。但如果在有些

44、函數(shù)關(guān)系不明的情況下可根據(jù)散點(diǎn)分布特點(diǎn)考慮其它形式的擬合。例如:表3-2的數(shù)據(jù)根據(jù)數(shù)據(jù)的散點(diǎn)分布特點(diǎn)可擬合成y=Axn+Bxn的形式,下面是n=15時(shí)擬合出的函數(shù):y=-1.3759x15+1.3962x15圖3-3 擬合函數(shù)圖線描繪的函數(shù)關(guān)系圖線如圖3-3。把表3中對(duì)應(yīng)的x值代入y中求出y 填入表中。比較y、y 和原函數(shù)ln(x)值,這種擬合方法函數(shù)的外推走向與原函數(shù)更為接近。第五章 殘數(shù)法與最小二乘法結(jié)合二項(xiàng)型指數(shù),是由兩個(gè)指數(shù)項(xiàng)相加而構(gòu)成的函數(shù)表達(dá)式。此函數(shù)表達(dá)式所描繪出的曲線稱為二項(xiàng)型指數(shù)曲線。此曲線在藥代動(dòng)力學(xué)中具有重要的應(yīng)用價(jià)值,常用于研究二室模型藥物靜脈注射后血藥濃度與時(shí)間的關(guān)系

45、。目前,擬合二項(xiàng)型指數(shù)曲線常用的方法為殘數(shù)法,它是把一條曲線分解成若干指數(shù)成分,然后對(duì)這些指數(shù)成分通過(guò)曲線直線化的方式得到相應(yīng)指數(shù)成分的參數(shù)估計(jì)值。而曲線直線化是采用最小二乘法使變量轉(zhuǎn)換后所得新變量離均差平方和最小,并不一定能使原響應(yīng)變量的離均差平方和最小,所以其模型的擬合精度仍有提高的空間。以殘數(shù)法和非線性最小二乘法相結(jié)合,即以殘數(shù)法計(jì)算所得的參數(shù)估計(jì)值為初始值,借助于SAS軟件中的NLIN過(guò)程,采用非線性最小二乘法來(lái)得到擬合效果更好的曲線模型。此做法可解決殘數(shù)法擬合精度不高、非線性最小二乘法不便使用的問(wèn)題。5.1 二項(xiàng)指數(shù)曲線原理與方法二項(xiàng)型指數(shù)曲線參數(shù)個(gè)數(shù)一般為指數(shù)項(xiàng)數(shù)目的2倍,分析時(shí)常

46、用的方法是殘數(shù)法,它把一條曲線分解成兩個(gè)指數(shù)成分,每次分析一個(gè)指數(shù)項(xiàng)。藥物靜脈注射后,在體內(nèi)的代謝和分布規(guī)律比較復(fù)雜,其規(guī)律因藥物的性質(zhì)和作用部位不同而異,人們通常嘗試采用較為簡(jiǎn)單的模型來(lái)描述,即藥物靜脈注射后的二室模型,其藥一時(shí)曲線模型為:y=Ae-t+Be-t (5.1)其中,為分布速度常數(shù),為消除速度常數(shù),。當(dāng)時(shí)間t充分大時(shí),Ae-t將趨向于0 。所以,式(5.1)就可簡(jiǎn)化為:y=Be-t (5.2)兩邊取以10為底的對(duì)數(shù)得:logy=logB-2.303t (5.3)作logy_t圖,取尾端幾個(gè)近似呈直線關(guān)系的點(diǎn)擬合回歸直線。直線的斜率為-2.303,由斜率可求出值;直線的截距為log

47、B,由截距可求出B值。對(duì)式(5.1)進(jìn)行移項(xiàng)整理,得:y-Be-t=Ae-t (5.4)其中,y為實(shí)測(cè)濃度,Be-t為外推濃度,前者與后者之差為殘數(shù)濃度,記為y殘。對(duì)其余點(diǎn)(也稱外推點(diǎn))作logy殘_t圖,由尾端向前取幾個(gè)近似呈直線關(guān)系的點(diǎn),擬合一條回歸直線,得殘數(shù)線的截距l(xiāng)ogA和斜率-2.303,據(jù)此可計(jì)算出和A。需要注意的是,有時(shí)尾端多個(gè)外推點(diǎn)計(jì)算所得的外推濃度Be-t會(huì)大于實(shí)測(cè)濃度y。此時(shí),式(5.4)需進(jìn)行相應(yīng)轉(zhuǎn)化,Be-t-y=-Ae-t (5.5)然后,作logy殘_t圖,由尾端向前,選取合適的散點(diǎn)擬合回歸直線后,所得的殘數(shù)線的截距應(yīng)為log(-A)。有時(shí)也會(huì)遇到部分外推點(diǎn)的外推

48、濃度大于實(shí)測(cè)濃度而另外一些外推點(diǎn)的外推濃度小于實(shí)測(cè)濃度的情形,此時(shí)可根據(jù)二者之差的大小來(lái)選擇部分點(diǎn)進(jìn)行分析。若超過(guò)1/2的外推點(diǎn)外推濃度與實(shí)測(cè)濃度之差大于0,則可舍棄另一部分外推點(diǎn),僅以二者之差大于0的這些外推點(diǎn)按照式(5.5)進(jìn)行分析;反之,若超過(guò)1/2的外推點(diǎn)外推濃度與實(shí)測(cè)濃度之差小于或等于0,則可僅以二者之差小于或等于0的這些外推點(diǎn)按照式(5.4)進(jìn)行分析。采用殘數(shù)法,可求得參數(shù)、A、B的值。然后以殘數(shù)法計(jì)算所得的參數(shù)估計(jì)值為初始值,借助于SAS軟件中的NLIN過(guò)程,采用非線性最小二乘法來(lái)得到擬合效果更好的曲線模型。評(píng)價(jià)曲線模型的擬合效果,可使用殘差平方和、相關(guān)指數(shù)等指標(biāo)。殘差平方和的計(jì)

49、算公式為:SS殘=y-y2 (5.6)其中y為響應(yīng)變量的實(shí)際觀測(cè)值,y為由回歸方程算得的響應(yīng)變量的估計(jì)值。相關(guān)指數(shù)的計(jì)算公式為:R2=1-SS殘SS總 (5.7)如果SS殘占SS總的比例很小,說(shuō)明估計(jì)值與實(shí)際觀察值很接近,曲線擬合得較好,即R2越接近于1,曲線擬合得越好。SS殘的計(jì)算公式同式(5.6)。5.2 資料與分析根據(jù)有關(guān)專業(yè)知識(shí),已知某藥物為雙室模型藥物,靜脈注射100 mg后,測(cè)得各時(shí)間點(diǎn)的血藥濃度結(jié)果見(jiàn)表4-1。試擬合該藥物的藥-時(shí)曲線。表4-1 某藥物靜脈注射后各時(shí)間點(diǎn)的血藥濃度時(shí)間(h)血藥濃度(ug/ml)時(shí)間(h)血藥濃度(ug/ml)0.16565.033.0002.29

50、0.50028.695.0001.361.00010.047.5000.711.5004.9310.0000.38已知此藥物是雙室模型藥物,且采用靜脈注射,所以其藥一時(shí)曲線應(yīng)為二項(xiàng)型指數(shù)曲線。具體分析時(shí),可將所有的散點(diǎn)劃分成兩段,分別用來(lái)計(jì)算兩個(gè)指數(shù)項(xiàng)的參數(shù)。在計(jì)算指數(shù)項(xiàng)參數(shù)的值時(shí),所得回歸直線的斜率和截距對(duì)參數(shù)值的最終確定有重要影響。而回歸直線的斜率和截距依賴于散點(diǎn)的選擇,所以在不同計(jì)算階段,選擇合適的散點(diǎn)個(gè)數(shù)尤為重要。第一步,借助SAS語(yǔ)言的宏功能,將不同計(jì)算階段各種可能選取的散點(diǎn)個(gè)數(shù)組合都考慮進(jìn)去,采用殘數(shù)法進(jìn)行分析,由計(jì)算所得的截距和斜率推導(dǎo)出指數(shù)項(xiàng)參數(shù)的值,這樣每種散點(diǎn)個(gè)數(shù)組合都可以

51、得到一組參數(shù)估計(jì)值。第二步,將殘數(shù)法所得曲線模型參數(shù)的估計(jì)值代入NLIN過(guò)程作為初值,每種散點(diǎn)個(gè)數(shù)組合情形下均可得到一個(gè)局部最優(yōu)的曲線模型。第三步,從多個(gè)局部最優(yōu)的曲線模型中,選取擬合效果最好的曲線模型,選取的標(biāo)準(zhǔn)是殘差平方和最小。SAS程序見(jiàn)附錄本資料共有8個(gè)散點(diǎn),兩階段可能的散點(diǎn)個(gè)數(shù)組合有6種,即:33、34、35、43、44、53。散點(diǎn)組合中的兩個(gè)數(shù)字,依次表示在logy_t圖和logy殘_t圖上由尾端向前選取的散點(diǎn)個(gè)數(shù)。以散點(diǎn)組合34為例,其含義為先選取logy_t圖上的后三個(gè)散點(diǎn)(即原6-8號(hào)散點(diǎn)),然后以剩余散點(diǎn)作logy殘_t圖后,再選取logy殘_t圖上的后四個(gè)散點(diǎn)(即原25號(hào)

52、散點(diǎn))。SAS輸出結(jié)果顯示:這6種散點(diǎn)個(gè)數(shù)組合,最終所得到的回歸方程擬合本資料的殘差平方和均為0.000945。這里,可以任選一種組合情形,根據(jù)NLIN過(guò)程擬合的參數(shù)的值,就可寫出曲線的回歸方程了。以下是6種散點(diǎn)組合情形下殘數(shù)法擬合的曲線模型以及非線性最小二乘法擬合的曲線模型,它們對(duì)資料的擬合效果見(jiàn)表4-2。表4-2 殘數(shù)法與非線性最小二乘法擬合的回歸方程擬合方法 散點(diǎn)組合 回歸方程殘 差平方和 相關(guān)指數(shù)殘數(shù)法33y=81.6329e-2.5898t+4.8472e-0.2551t55.216000.984562殘數(shù)法34y=86.6542e-2.6149t+4.8472e-0.2551t17

53、.753100.995036殘數(shù)法35y=89.5426e-2,6302t+4.8472e-0.2551t5.783900.998383殘數(shù)法43y=95.7515e-2.7353t+4.9234e-0.2569t0.439500.999877殘數(shù)法44y=94.9814e-2.7286t+4.9234e-0.2569t0.065600.999982殘數(shù)法53y=96.3489e-2.8922t+6.3325e-0.2892t1.25600.999649非線性最小二乘法 y=94.3687e-2.7010t+4.7954e-0.2525t 0.00095 1.000000圖4-1 最終曲線回歸

54、方程對(duì)資料的擬合效果根據(jù)殘差平方和的大小,可知非線性最小二乘法所得曲線模型擬合效果最好,殘數(shù)法中以散點(diǎn)組合44情形下擬合效果較好。所以,以殘數(shù)法得到的參數(shù)估計(jì)值為初始值,再用非線性最小二乘法進(jìn)一步擬合資料,兩法結(jié)合應(yīng)用,所得曲線模型擬合效果更優(yōu)。最終的曲線回歸方程對(duì)資料的擬合效果見(jiàn)圖4-1,所得模型對(duì)該資料的擬合效果令人非常滿意。5.3 殘數(shù)法與最小二乘法結(jié)合總結(jié)殘數(shù)法求解二項(xiàng)型指數(shù)曲線,其手工計(jì)算較為繁雜,不便使用。借助SAS軟件的強(qiáng)大功能,以編程的方式實(shí)現(xiàn)了殘數(shù)法的參數(shù)估計(jì)。SAS軟件中的NLIN過(guò)程可實(shí)現(xiàn)對(duì)曲線模型參數(shù)的非線性最小二乘估計(jì),所得曲線模型較殘數(shù)法得到的曲線模型擬合效果更佳。

55、但NLIN過(guò)程對(duì)參數(shù)初始值較為敏感,為保證程序能夠快速得到一組較優(yōu)的模型估計(jì)值,采用殘數(shù)法的結(jié)果作為初始值,通過(guò)迭代運(yùn)算,得到更合理的模型參數(shù)估計(jì)值。當(dāng)然,應(yīng)用殘數(shù)法時(shí),其結(jié)果較為依賴于每個(gè)指數(shù)成分參數(shù)估計(jì)時(shí)的散點(diǎn)選擇。因此,分析本資料時(shí)在程序中引入宏,運(yùn)行了所有的散點(diǎn)組合可能,從而得到殘差平方和最小的曲線模型。需要說(shuō)明的是,并非所有的散點(diǎn)組合都是可行的。因?yàn)檫x取散點(diǎn)準(zhǔn)備擬合回歸直線時(shí),還需計(jì)算某些變量的對(duì)數(shù)值。若選點(diǎn)不合適,則這些變量取值可能為負(fù),這樣其對(duì)數(shù)值就無(wú)法計(jì)算了,后續(xù)的結(jié)果也就不準(zhǔn)確了。此時(shí),不適合以宏的方式來(lái)選取所有散點(diǎn)組合進(jìn)行相應(yīng)計(jì)算,可根據(jù)散點(diǎn)趨勢(shì)進(jìn)行人工選點(diǎn)。極限原理在其中

56、起著重要作用。所以,根據(jù)極限原理的應(yīng)用條件,必須在多個(gè)時(shí)間點(diǎn)上取樣,尤其是藥物吸收中末期應(yīng)多次取樣,且取樣時(shí)間應(yīng)充分大。否則,在取點(diǎn)進(jìn)行直線回歸分析時(shí),結(jié)果很不穩(wěn)定。取點(diǎn)的多少,較大程度上影響到斜率和截距的值,取點(diǎn)較少將導(dǎo)致殘數(shù)值誤差較大,一般每一個(gè)計(jì)算階段應(yīng)選取3個(gè)以上(含3個(gè))的散點(diǎn)。此外,要正確進(jìn)行曲線擬合,尤其要注意: (1)曲線在理論上能否得到適當(dāng)解釋;(2)資料所具備的特征與觀察點(diǎn)的趨勢(shì)有無(wú)矛盾;(3)擬合的曲線本身是否最優(yōu)或較優(yōu)。第六章 總結(jié)在我們實(shí)際的實(shí)驗(yàn)和勘探中,都會(huì)產(chǎn)生大量的數(shù)據(jù)。為了解釋這些數(shù)據(jù)或者根據(jù)這些數(shù)據(jù)做出預(yù)測(cè)、判斷,給決策者提供重要的依據(jù)。需要對(duì)測(cè)量數(shù)據(jù)進(jìn)行擬合

57、,尋找一個(gè)反映數(shù)據(jù)變化規(guī)律的函數(shù)。本文介紹了幾種常用的數(shù)據(jù)擬合方法,線性擬合、二次函數(shù)擬合、數(shù)據(jù)的n次多項(xiàng)式擬合等。并著重對(duì)曲線擬合進(jìn)行了研究,介紹了線性與非線性模型的曲線擬合方法,最小二乘法、牛頓迭代法等。在傳統(tǒng)的曲線擬合基礎(chǔ)上,為了提高曲線擬合精度,本文還研究了多項(xiàng)式的擺動(dòng)問(wèn)題,從實(shí)踐的角度分析了產(chǎn)生這些擺動(dòng)及偏差的因素和特點(diǎn),總結(jié)了在實(shí)踐中減小這些偏差的處理方法。采用最小二乘法使變量轉(zhuǎn)換后所得新變量離均差平方和最小,并不一定能使原響應(yīng)變量的離均差平方和最小,所以其模型的擬合精度仍有提高的空間。本文以殘數(shù)法與最小二乘法相結(jié)合,采用非線性最小二乘法來(lái)得到擬合效果更好的曲線模型。隨著計(jì)算機(jī)技術(shù)

58、的發(fā)展,實(shí)驗(yàn)數(shù)據(jù)處理越來(lái)越方便。但也提出了新的課題,就是在選擇數(shù)據(jù)處理方法時(shí)應(yīng)該比以往更為慎重。因?yàn)樯杂胁簧?,就?huì)非常方便地根據(jù)正確的實(shí)驗(yàn)數(shù)據(jù)得出不確切的乃至錯(cuò)誤的結(jié)論。所以提高擬合的準(zhǔn)確度是非常有必要的。結(jié)束語(yǔ)經(jīng)過(guò)兩個(gè)多月的努力,灰色系統(tǒng)分析方法研究論文終于完成,在整個(gè)設(shè)計(jì)過(guò)程中,出現(xiàn)過(guò)很多的難題,但都在老師和同學(xué)的幫助下順利解決了,在不斷的學(xué)習(xí)過(guò)程中我體會(huì)到寫論文是一個(gè)不斷學(xué)習(xí)的過(guò)程,從最初剛寫論文時(shí)對(duì)灰色系統(tǒng)的分析方法模糊認(rèn)識(shí)到最后能夠?qū)υ搯?wèn)題有深刻的認(rèn)知,我體會(huì)到實(shí)踐對(duì)于學(xué)習(xí)的重要性,以前只是明白理論,沒(méi)有經(jīng)過(guò)實(shí)踐考察,對(duì)知識(shí)的理解不夠明確,通過(guò)這次的做,真正做到理論實(shí)踐相結(jié)合。總之,

59、通過(guò)畢業(yè)設(shè)計(jì),我深刻體會(huì)到要做好一個(gè)完整的事情,需要有系統(tǒng)的思維方式和方法,對(duì)待要解決的問(wèn)題,要耐心、要善于運(yùn)用已有的資源來(lái)充實(shí)自己。同時(shí)我也深刻的認(rèn)識(shí)到,在對(duì)待一個(gè)新事物時(shí),一定要從整體考慮,完成一步之后再作下一步,這樣才能更加有效。致 謝 四年的讀書生活在這個(gè)季節(jié)即將劃上一個(gè)句號(hào),而于我的人生卻只是一個(gè)逗號(hào),我將面對(duì)又一次征程的開(kāi)始。四年的求學(xué)生涯在師長(zhǎng)、親友的大力支持下,走得辛苦卻也收獲滿囊,在論文即將付梓之際,思緒萬(wàn)千,心情久久不能平靜。 偉人、名人為我所崇拜,可是我更急切地要把我的敬意和贊美獻(xiàn)給一位平凡的人,我的導(dǎo)師。我不是您最出色的學(xué)生,而您卻是我最尊敬的老師。您治學(xué)嚴(yán)謹(jǐn),學(xué)識(shí)淵博

60、,思想深邃,視野雄闊,為我營(yíng)造了一種良好的精神氛圍。授人以魚不如授人以漁,置身其間,耳濡目染,潛移默化,使我不僅接受了全新的思想觀念,樹(shù)立了宏偉的學(xué)術(shù)目標(biāo),領(lǐng)會(huì)了基本的思考方式,從論文題目的選定到論文寫作的指導(dǎo),經(jīng)由您悉心的點(diǎn)撥,再經(jīng)思考后的領(lǐng)悟,常常讓我有“山重水復(fù)疑無(wú)路,柳暗花明又一村”。 感謝我的爸爸媽媽,焉得諼草,言樹(shù)之背,養(yǎng)育之恩,無(wú)以回報(bào),你們永遠(yuǎn)健康快樂(lè)是我最大的心愿。在論文即將完成之際,我的心情無(wú)法平靜,從開(kāi)始進(jìn)入課題到論文的順利完成,有多少可敬的師長(zhǎng)、同學(xué)、朋友給了我無(wú)言的幫助,在這里請(qǐng)接受我誠(chéng)摯謝意! 同時(shí)也感謝學(xué)院為我提供良好的做畢業(yè)設(shè)計(jì)的環(huán)境。 最后再一次感謝所有在畢業(yè)設(shè)計(jì)中曾

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論