優(yōu)控制第七章動態(tài)規(guī)劃法.ppt

上傳人：x*** IP屬地：四川上傳時間：2020-02-10 格式：PPT 頁數(shù)：68 大?。?34.31KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩63頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

第七章動態(tài)規(guī)劃法動態(tài)規(guī)劃是貝爾曼在50年代作為多段決策過程研究出來的現(xiàn)已在許多技術(shù)領(lǐng)域中獲得廣泛應(yīng)用動態(tài)規(guī)劃是一種分段最優(yōu)化方法它既可用來求解約束條件下的函數(shù)極值問題也可用于求解約束條件下的泛函極值問題它與極小值原理一樣是處理控制矢量被限制在一定閉集內(nèi) 求解最優(yōu)控制問題的有效數(shù)學(xué)方法之一動態(tài)最優(yōu)的核心是最優(yōu)性原理它首先將一個多段決策問題轉(zhuǎn)化為一系列單段決策問題然后從最后一段狀態(tài)開始逆向遞推到初始段狀態(tài)為止的一套求解最優(yōu)策略的完整方法下面先介紹動態(tài)規(guī)劃的基本概念然后討論連續(xù)型動態(tài)規(guī)劃一多段決策問題動態(tài)規(guī)劃是解決多段決策過程優(yōu)化問題的一種強有力的工具所謂多段決策過程是指把一個過程按時間或空間順序分為若干段然后給每一步作出決策或控制以使整個過程取得最優(yōu)的效果如圖1所示對于中間的任意一段例如第k 1段作出相應(yīng)的決策或控制 uk后才能確定該段輸入狀態(tài)與輸出狀態(tài)間的關(guān)系即從xk變化到xk 1的狀態(tài)轉(zhuǎn)移規(guī)律在選擇好每一段的決策或控制 uk以后那么整個過程的狀態(tài)轉(zhuǎn)移規(guī)律從x0經(jīng)xk一直到xN也就被完全確定全部決策的總體稱為策略當(dāng)然如果對每一段的決策都是按照使某種性能指標為最優(yōu)的原則作出的那么這就是一個多段最優(yōu)決策過程圖1多段決策過程示意圖容易理解在多段決策過程中每一段如第k 1段的輸出狀態(tài) xk 1 都僅僅與該段的決策 uk 及該段的初始狀態(tài) xk 有關(guān) 而與其前面各段的決策及狀態(tài)的轉(zhuǎn)移規(guī)律無關(guān) 這種性質(zhì)稱為無后效性下面以最優(yōu)路線問題為例來討論動態(tài)規(guī)劃求解多段決策問題設(shè)汽車從A城出發(fā)到B城途中需穿越三條河流它們各有兩座橋P Q可供選擇通過如圖2所示各段間的行車時間或里程費用等已標注在相應(yīng)段旁問題是要確定一條最優(yōu)行駛路線使從A城出發(fā)到B城的行車時間最短現(xiàn)將A到B分成四段每一段都要作一最優(yōu)決策使總過程時間為最短所以這是一個多段最優(yōu)決策問題由圖2可知所有可能的行車路線共有8條如果將各條路線所需的時間都一一計算出來并作一比較便可求得最優(yōu)路線是AQ1P2Q3B 歷時12 這種一一計算的方法稱為窮舉算法這種方法計算量大如本例就要做3 23 24次加法和7次比較如果決策一個n段過程則共需 n 1 2n 1次加法和 2n 1 1 次比較可見隨著段數(shù)的增多計算量將急劇增加應(yīng)用動態(tài)規(guī)劃法可使計算量減少許多動態(tài)規(guī)劃法遵循一個最優(yōu)化原則即所選擇的最優(yōu)路線必須保證其后部子路線是最優(yōu)的例如在圖2中如果AQ1P2Q3B是最優(yōu)路線那么從這條路線上任一中間點到終點之間的一段路線必定也是最優(yōu)的否則AQ1P2Q3B就不能是最優(yōu)路線了根據(jù)這一原則求解最優(yōu)路線問題最好的辦法就是從終點開始按時間最短為目標逐段向前逆推依次計算出各站至終點之間的時間最優(yōu)值并據(jù)此決策出每一站的最優(yōu)路線如在圖2中從終點B開始逆推最后一段第四段終點B的前站是P3或Q3 不論汽車先從哪一站始發(fā) 行駛路線如何在這最后一段總不外乎是從P3到B 歷時為4 或從Q3到B 歷時為2 將其標明在圖3中相應(yīng)的圓圈內(nèi) 比較P3與Q3這一最后一段最優(yōu)決策為Q3B 最后一段第四段終點B的前站是P3或Q3 不論汽車先從哪一站始發(fā) 行駛路線如何在這最后一段總不外乎是從P3到B 歷時為4 或從Q3到B 歷時為2 將其標明在圖3中相應(yīng)的圓圈內(nèi) 比較P3與Q3這一最后一段最優(yōu)決策為Q3B 第三段 P3 Q3的前站是P2 Q2 在這一段也不論其先后的情況如何只需對從P2或Q2到B進行最優(yōu)決策從P2到B有兩條路線 P2P3B 歷時為6 P2Q3B 歷時為4 取最短歷時4 標注在P2旁從Q2到B也有兩條路線 Q2P3B 歷時為7 Q2Q3B 歷時為5 取最短歷時5 標注在Q2旁比較P2與Q2的最優(yōu)值可知這一段的最優(yōu)路線是P2Q3B 第二段 P2 Q2的前站是P1 Q1 同樣不管汽車是如何到達的P1 Q1 重要的是保證從P1或Q1到B要構(gòu)成最優(yōu)路線從P1到B的兩條路線中 P1P2Q3B 歷時為11 P1Q2Q3B 歷時為11 取最短歷時11 標注在P1旁從Q1到B的也有兩條路線中 Q1P2Q3B 歷時為8 Q1Q2Q3B 歷時為13 取最短歷時8 標注在Q1旁比較P1與Q1的最優(yōu)值可知這一段的最優(yōu)路線是Q1P2Q3B 第一段 P1 Q1的前站是始發(fā)站A 顯見從A到B的最優(yōu)值為12 故得最優(yōu)路線為AQ1P2Q3B 綜上可見動態(tài)規(guī)劃法的特點是 1 與窮舉算法相比可使計算量大大減少如上述最優(yōu)路線問題用動態(tài)規(guī)劃法只須做10次加法和6次比較如果過程為n段則需做加法以上例為例用窮舉法需作4608次加法而后者只需做34次加法 2 最優(yōu)路線的整體決策是從終點開始采用逆推方法通過計算比較各段性能指標逐段決策逐步延伸完成的全部最優(yōu)路線的形成過程已充分表達在圖3中從最后一段開始通過比較P3 Q3 得到Q3B 倒數(shù)第二段通過比較P2 Q2 得到P2Q3B 倒數(shù)第三段通過比較P1 Q1 得到最優(yōu)決策為Q1P2Q3B 直至最后形成最優(yōu)路線AQ1P2Q3B 象這樣將一個多段決策問題轉(zhuǎn)化為多個單段決策的簡單問題來處理正是動態(tài)規(guī)劃法的重要特點之一 3 動態(tài)規(guī)劃法體現(xiàn)了多段最優(yōu)決策的一個重要規(guī)律即所謂最優(yōu)性原理它是動態(tài)規(guī)劃的理論基礎(chǔ) 對圖4所示的N段決策過程如果在第k 1段處把全過程看成前k段子過程和后N k段子過程兩部分對于后部子過程來說 xk可看作是由x0及前k段初始決策或控制 u0 u1 uk 1所形成的初始狀態(tài) 那么多段決策的最優(yōu)決策略具有這樣的性質(zhì) 不論初始狀態(tài)和初始決策如何其余后段決策或控制對于由初始決策所形成的狀態(tài)來說必定也是一個最優(yōu)策略這個性質(zhì)稱為最優(yōu)性原理圖4N段決策過程設(shè)圖5中x t 是連續(xù)系統(tǒng)的一條最優(yōu)軌線 x t1 是最優(yōu)軌線上的一點那么最優(yōu)性原理說明不管t t1 t0 t1 tf時系統(tǒng)是怎樣轉(zhuǎn)移到狀態(tài)x t1 的但從x t1 到x tf 這段軌線必定是最優(yōu)的因為最優(yōu)軌線的后一段從x t1 到x tf 如果還有另一條軌線是最優(yōu)的話那么原來從x t0 到x tf 的軌線就不是最優(yōu)的這與假設(shè)矛盾因此最優(yōu)性原理成立應(yīng)用最優(yōu)性原理可以將一個N段最優(yōu)決策問題轉(zhuǎn)化為N個一段最優(yōu)決策問題從而大大減少求解最優(yōu)決策問題的計算量圖5連續(xù)系統(tǒng)的狀態(tài)轉(zhuǎn)移過程圖5連續(xù)系統(tǒng)的狀態(tài)轉(zhuǎn)移過程二連續(xù)系統(tǒng)的動態(tài)規(guī)劃利用動態(tài)規(guī)劃最優(yōu)性原理可以推導(dǎo)出性能泛函為極小應(yīng)滿足的條件哈密爾頓雅可比方程它是動態(tài)規(guī)劃的連續(xù)形式解此方程可求得最優(yōu)控制u t 現(xiàn)在來推導(dǎo)這一方程設(shè)連續(xù)方程為 1 終端約束使性能泛函求最優(yōu)控制u t 或u任意初始狀態(tài) 2 3 4 根據(jù)最優(yōu)性原理如果x t 是以x t0 為初始狀態(tài)的最優(yōu)軌線如圖6所示圖6連續(xù)系統(tǒng)最優(yōu)軌線 5 設(shè)t t t0 t tf 時狀態(tài)為x t 它將軌線分成前后兩半斷那么以x t 為初始狀態(tài)的后半段也必是最優(yōu)軌線而與系統(tǒng)先前如何到達x t 無關(guān) 若取t0 t t t t 式 4 可寫成根據(jù)最優(yōu)性原理如果t到tf的過程是最優(yōu)的則從t t到tf的后部子過程也是最優(yōu)的其中t t t tf 因此可寫成 6 7 當(dāng) t很小時有式 5 可近似表示為 8 5 將x t t 進行泰勒展開取一次近似有 9 10 11 將上式在 x t 領(lǐng)域展成泰勒級數(shù) 考慮到J x x t t 既是x的函數(shù) 也與t有關(guān) 所以 12 8 代入式 8 得 13 12 8 考察上式因為J x t 與u無關(guān) 故J x t 與可提到min號外面經(jīng)整理可得式 14 稱為連續(xù)系統(tǒng)動態(tài)規(guī)劃基本方程或貝爾曼方程 14 貝爾曼方程它是一個關(guān)于J x t 的偏微分方程解此方程可求得最優(yōu)控制使J為極小它的邊界條件為 15 14 如果令哈密爾頓函數(shù)為式中則式 14 可寫成 17 16 當(dāng)控制矢量u t 不受限制時則有上兩式稱為哈密爾頓雅可比方程上式說明在最優(yōu)軌線上最優(yōu)控制必須使H達全局最小實際上這就是極小值原理的另一種形式 18 由貝爾曼方程可推導(dǎo)出協(xié)態(tài)方程和橫截條件式 14 可寫成對x求偏導(dǎo)數(shù) 得 20 19 14 由于對t的全導(dǎo)數(shù) 為 22 21 代入式 20 可寫成 20 令則上式可寫成 23 這就是所求的協(xié)態(tài)方程與以前結(jié)果完全一致 22 在t tf時在終端處性能泛函為式中與N同維的乘子矢量 24 對x tf 求偏導(dǎo)數(shù) 得 25 26 即 24 將式 24 對tf求偏導(dǎo)數(shù) 得 27 24 考慮式 17 式 20 得上述結(jié)果與極小值原理中推導(dǎo)的完全一致上述推導(dǎo)過程實際上等于用動態(tài)規(guī)劃方法間接證明了極小值原理 28 17 20 27 應(yīng)當(dāng)指出與極小值原理相比動態(tài)規(guī)劃法需要解偏微分方程式 14 它要求J x t 具有連續(xù)的偏導(dǎo)數(shù) 但在實際工程中這一點常常不能滿足因而限制了動態(tài)規(guī)劃法的使用范圍例1 設(shè) 求最優(yōu)控制u t 使解構(gòu)造哈密爾頓函數(shù) 根據(jù)哈密爾頓雅可比方程有考慮控制u不受限制得故邊界條件因 x tf tf 0 故J x tf 0如果令則得這正是應(yīng)用極小值原理所得的結(jié)果二者完全一致例2 設(shè)受控系統(tǒng)狀態(tài)方程為初始狀態(tài)為性能泛函為試求在u無限制情況下使J取極小時的最優(yōu)控制解構(gòu)造哈密爾頓函數(shù) 由哈密爾頓雅可比方程因u無限制可從求得代入上式并注意到J 與t無關(guān) 因而有為求解此偏微分方程設(shè)其解為滿足方程得各項系數(shù)為可得解為最優(yōu)控制最優(yōu)控制可由狀態(tài)反饋實現(xiàn) 如圖7所示進一步考察系統(tǒng)的狀態(tài)軌線系統(tǒng)的狀態(tài)方程為齊次方程它的解為于是最優(yōu)控制為性能泛函最優(yōu)值為例3 設(shè)受控系統(tǒng)的微分方程為使性能指標即要求快速響應(yīng) 求最優(yōu)控制u 且滿足解若選可得系統(tǒng)的狀態(tài)方程根據(jù)哈密爾頓貝爾曼方程為使取全局最小可得在所論情況下因J 與t無關(guān) 故哈密爾頓貝爾曼方程為這是一個非線性偏微分方程需借助電子計算機求解J 再求J 對x2的偏導(dǎo)數(shù)便可求得最優(yōu)控制綜上所述

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

優(yōu)控制第七章動態(tài)規(guī)劃法.ppt

文檔簡介

溫馨提示

最新文檔

評論

優(yōu)控制第七章動態(tài)規(guī)劃法.ppt

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔