




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、最小二乘法及其應用1 引言最小二乘法在19世紀初發(fā)明后,很快得到歐洲一些國家的天文學家和測地學家的廣泛關注。據不完全統計,自1805年至1864年的60年間,有關最小二乘法的研究論文達256篇,一些百科全書包括1837年出版的大不列顛百科全書第7版,亦收入有關方法的介紹。同時,誤差的分布是“正態(tài)”的,也立刻得到天文學家的關注及大量經驗的支持。如貝塞爾( F. W. Bessel, 17841846)對幾百顆星球作了三組觀測,并比較了按照正態(tài)規(guī)律在給定范圍內的理論誤差值和實際值,對比表明它們非常接近一致。拉普拉斯在1810年也給出了正態(tài)規(guī)律的一個新的理論推導并寫入其分析概論中。正態(tài)分布作為一種統
2、計模型,在19世紀極為流行,一些學者甚至把19世紀的數理統計學稱為正態(tài)分布的統治時代。在其影響下,最小二乘法也脫出測量數據意義之外而發(fā)展成為一個包羅極大,應用及其廣泛的統計模型。到20世紀正態(tài)小樣本理論充分發(fā)展后,高斯研究成果的影響更加顯著。最小二乘法不僅是19世紀最重要的統計方法,而且還可以稱為數理統計學之靈魂。相關回歸分析、方差分析和線性模型理論等數理統計學的幾大分支都以最小二乘法為理論基礎。正如美國統計學家斯蒂格勒( S. M. Stigler)所說,“最小二乘法之于數理統計學猶如微積分之于數學”。最小二乘法是參數回歸的最基本得方法所以研究最小二乘法原理及其應用對于統計的學習有很重要的意
3、義。2. 最小二乘法所謂最小二乘法就是:選擇參數,使得全部觀測的殘差平方和最小. 用數學公式表示為:為了說明這個方法,先解釋一下最小二乘原理,以一元線性回歸方程為例. (一元線性回歸方程)由于總體回歸方程不能進行參數估計,我們只能對樣本回歸函數來估計即: 從上面的公式可以看出:殘差是的真實值與估計值之差,估計總體回歸函數最優(yōu)方法是,選擇的估計量,使得殘差盡可能的小.總之,最小二乘原理就是選擇樣本回歸函數使得所有Y的估計值與真實值差的平方和為最小,這種確定的方法叫做最小二乘法。最小二乘法是回歸分析中的最基本的方法?;貧w方程一般分為2類,線性回歸方程和非線性回歸方程。2.1 線性回歸最小二乘法最小
4、二乘法是由實驗或調查的數據,建立線性型公式的一種常用方法. 在建立線性型公式中,雖然有很多種不同的方法來求樣本回歸函數(即真實總體回歸函數的估計值),但是在回歸分析中最廣泛應用的方法是最小二乘法.如果變量有精確的線性關系比如說,那么即觀測值與回歸值是相等的.事實上現實世界中的諸多變量的關系未必都是如此,由于受諸多隨機因數的干擾使得物與物之間沒有那種很明確的對應關系.比如說人的身高和體重就是一個對應,我們都知道長的高的人不一定就重,同理長的矮的人也不一定就輕.但身高和體重的確存在著一定的關系,而這種關系并非是所能確定的.那么我們要尋求身高和體重之間的關系就需要通過數學的方法.首先調查統計得出數據
5、;其次把數據描繪出來;然后擬合一條跟已有的圖象最接近的曲線,這樣就可以相對地將身高和體重之間的關系表示出來.在處理類似的事情中常常用到最小二乘法.2.2 非線性回歸最小二乘法非線性回歸的種類很多,常用的有拋物線方程()、指數方程()等。設已知列表函數,并且我們想用一個通常的次多項式 (1)去近似它。問題是應該如何選擇 使能較好地近似列表函數。按最小二乘法,應該選擇使得 (2)取最小。注意到S是非負的,且是的2次多項式,它必有最小值。求S 對 的偏導數,并令其等于零,得到 進一步,可以將它們寫成 引進記號則上述方程組為 (3)它的系數行列式是由 的定義及行列式性質,可以斷言 (4)此處符號W 表
6、Vandermonde行列式,而是對所有可能的 求和(每個 可以取值并且當時。由(4)式及Vandermonde 行列式的性質可知,當互異時,從而,方程組(3)有唯一解 ,且它們使(2)取極小值如此,我們應用最小二乘法找到了的近似多項式.在利用最小二乘法組成和式(2)時,所有點都起到了同樣的作用,但是有時依據某種理由認為中的某些項的作用大些,而另外一些作用小些(例如,一些是由精度較高的儀器或操作上比較熟練的人員獲得的,自然應該予以較大的信任),這在數學上表現為用和 (5)替代和(2)取最小值.,且,通常稱之為權;而(5)為加權和.用多項式去近似一個給定的列表函數(即給出的一組觀測值時。需要確定
7、的參數是;而可以看成是的線性函數.但是有時在利用觀測或實驗數據去確定一個經驗公式時,往往要確定的函數和待定參數之間不具有線性形式的關系.這樣問題就變得有些復雜.然而,常??梢酝ㄟ^變量替換使其線性化.最小二乘法原理是用來求解線性方程組的,非線性方程經線性化后方可應用該原理. 通常在測量中遇到的問題不一定都是線性問題, 必須先把非線性問題線性化, 然后求解. 例如:(i)有時,我們希望用如下類型的函數: (6)去近似一個由一組觀測數據(列表)所描繪的函數,其中p 和q 是待定的兩個參數.顯然s已非p和q的線性函數.怎樣線性化呢?為此,我們在(6)式兩端取對數,得到記則 (6)式變成 .這是一個一次
8、多項式,它的系數和可以用最小二乘法求得.(ii) 我們經常希望用函數 (7)去近似一個以給定的列表函數,其中A、C是待定的參數.這時,我們可以(7)的兩端取對數:記,則(1.7)式變成這樣仍可用最小二乘法定出(從而也就定出了A,C ),得到近似函數 .下面列出幾種常用的線性處理方法,利用最小二乘法的原理對直線型、拋物線型和指數曲線型的方程的參數估計方法,介紹如下:(1)直線型直線方程的一般形式為令為最小值,分別為a和b求偏導數,并令導數等于0,得到聯立方程組。解方程組,即可得到參數的計算公式 。 (2)拋物線型拋物線方程的一般形式為 令為最小值,分別為 a、b、c求偏導數,并令導數等于0,得到
9、聯立方程組解方程組,即可得到參數的計算公式。 (3)指數曲線型 指數曲線的一般形式為 取對數,將指數曲線轉化成對數直線形式 用最小二乘法估計參數a,b,可有如下方程組 解此方程組,可得參數的對數值,查其反對數,即可得參數值。3最小二乘法原理的應用3.1最小二乘法原理在線性回歸中應用例1.已知2009年3月到2010年4月居民收入與物價信心的滿意指數如下圖,求出當期物價滿意指數x與時間t的曲線擬合。T123456X29.5028.2025.9021.7021.9013.80解:t=1 2 3 4 5 6;x=29.50 28.2025.90 21.70 21.90 13.80;plot(t,x,
10、o);polyfit(t,x,1)ans = -2.9029 33.6600則所得到的近似方程為y=-2.9029+33.6600x.3.2 最小二乘法原理在非線性回歸中的應用例2 設已知函數f (x)的表列值為X0.20.50.70.851Y1.2211.6492.0142.3402.718試按最小二乘法構造f (x)的二次近似多項式.解:下面用Matlab程序來求參數和.程序如下:x=0.20.50.70.851;y=1.2211.6492.0142.3402.718;plot(x,y,o);polyfit(x,y,2)ans =0.9248 0.7553 1.0346 即所求=0.924
11、8,=0.7553,=1.0346.所求的近似多項式為 .例3、在某冶煉過程中,根據統計數據的含碳量與時間關系,試求含碳量y與時間t的擬合曲線。t05 10152025303540455055y01.272.162.863.443.874.154.374.514.584.024.64解:實驗程序如下:t=0510152025303540455055;y=01.272.162.863.443.874.154.374.514.584.024.64;plot(t,y,o);p=polyfit(t,y,2)p = -0.0024 0.2037 0.2305綜上,y與t的擬合曲線是y=-0.0024+0
12、.2037t+0.0.2305。例2 設已知如下一組實驗數據:t =2.2 2.7 3.5 4.1S =65 60 53 50試求一個型的函數去近似它.解: 計算以緊湊的形式表示如下:xy10.34240.11721.81290.620710.43140.18611.77820.767110.54410.29601.72430.938210.61280.37551.69901.041141.93070.97487.01443.3671由此得方程組解之得從而。4.小結應用最小二乘法的幾個問題:最小二乘法雖然在數據處理方面具有顯著的效果,但如果使用不當會導致很大的誤差,甚至錯誤的結果。因此,在應用
13、時必須注意以下幾個問題:(1) 慎重選擇擬合關系式。在實際問題中,適當選擇擬合關系式是一項十分謹慎的工作,它將直接影響計算的工作量和結論。(2) 自變量的選擇。在實際工作中,對一組實驗數據按不同的擬合形式,結果會不一樣。特別注意當兩個變量都有一定誤差時,應當使用雙變量最小二乘法進行處理,否則可以使用單變量最小二乘法。(3) 加權最小二乘法。此法是應用于實驗測量值 非等精度的情況下的擬合方法。它不同程度的消除誤差因素,結果更準確可靠。設擬合函數為,當x值取時y的實測值為,取。加權偏差平方和,式中為第i個實驗點的權重因子。選取合適的權重因子可獲得高精度的擬合參數。(4)最小二乘原理在很多領域有著廣
14、泛應用,利用MATLAB求解非常方便,但一定要組要問題的類型,尤其是數據大且復雜時,來更好的突出Matlab計算出線性參數的最佳估計值,提高了效率和精度。(5)非線性參數的最小二乘法處理程序可歸結為:首先根據具體問題將非線性問題線性化,列出誤差方程;再按最小二乘法原理,利用求極值的方法將誤差方程轉化為正規(guī)方程;然后求解正規(guī)方程,得到待求的估計量;最后給出精度估計。上面例題利用程序求解組合測量問題,用Matlab進行曲線的擬合。致謝:長江之濱,青山湖畔,是我美麗的校園。轉眼間,我已經在美麗的湖師度過了四個年頭。四年,這是我人生中非常重要的四年,我有幸能夠接觸到這些不僅傳授我知識、學問,而且從更高層次指導我的人生與價值追求的良師。他們使我堅定了人生的方向,獲得了追求的動力,留下了大學生活的美好回憶。在此,我真誠地向我尊敬的老師們和母校表達我深深的謝意! 這篇論文是在我的導師胡宏昌教授的多次指導下完成的。從論文的選題到結構安排,從內容到文字潤飾,都凝聚了他大量的心血。在這篇論文的寫作過程中,胡老師不辭辛勞,不惜在百忙的工作學習中抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國舞蹈服裝市場行情動態(tài)分析及發(fā)展前景趨勢預測報告
- 2025年度金融產品研發(fā)保密與競業(yè)限制合作協議
- 2025年度二手車交易保險代理合同范本下載
- 中國毀形器的項目投資可行性研究報告
- 氧化鋯結構陶瓷項目可行性研究報告
- 2025年度電熱鍋產品出口退稅與貿易融資合同
- 2025年度環(huán)保產業(yè)園區(qū)建設運營管理服務合同
- 2025年度飯店員工勞動爭議處理勞動合同
- 簡單理發(fā)合同范本
- 《人的正確思想是從哪里來的?》教學設計 2023-2024學年統編版高中語文選擇性必修中冊
- 媒介經營與管理-課件
- 2022年四川甘孜州州屬事業(yè)單位考調工作人員沖刺卷貳(3套)答案詳解
- 超星爾雅學習通《民俗資源與旅游》2020章節(jié)測試含答案
- 勞務投標書技術標
- 尿碘檢測臨床意義
- 2022年山東司法警官職業(yè)學院單招語文試題及答案解析
- 2023版北京協和醫(yī)院重癥醫(yī)學科診療常規(guī)
- 鋼網驗收報告
- 防水補漏工程合同(合同版本)
- 鐵路局中間站管理手冊
- H3C-CAS虛擬化平臺詳細介紹
評論
0/150
提交評論