第三章變分法泛函極值問題_第1頁
第三章變分法泛函極值問題_第2頁
第三章變分法泛函極值問題_第3頁
第三章變分法泛函極值問題_第4頁
第三章變分法泛函極值問題_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

章用變分法解最優(yōu)控制

—泛函極值問題

2021/6/271本章主要內(nèi)容3.1變分法基礎3.2無約束條件的泛函極值問題3.3有約束條件的泛函極值——動態(tài)系 統(tǒng)的最優(yōu)控制問題3.4小結返回主目錄2021/6/272

在動態(tài)系統(tǒng)最優(yōu)控制問題中,性能指標是一個泛函,性能指標最優(yōu)即泛函達到極值。解決泛函極值問題的有力工具是變分法。所以下面就來列出變分法中的一些主要結果,大部分不加證明,但讀者可對照微分學中的結果來理解。2021/6/2733.1變分法基礎

如果對某一類函數(shù)中的每一個函數(shù),有一個實數(shù)值與之相對應,則稱為依賴于函數(shù)的泛函,記為粗略來說,泛函是以函數(shù)為自變量的函數(shù)。1、泛函:先來給出下面的一些定義。2021/6/274

若對任給的,存在當時,就有則稱在處是連續(xù)的。

2、泛函的連續(xù)性:

2021/6/275

滿足下面條件的泛函稱為線性泛函這里是實數(shù),和是函數(shù)空間中的函數(shù)。

3、線性泛函:

2021/6/2764、自變量函數(shù)的變分:

自變量函數(shù)的變分是指同屬于函數(shù)類中兩個函數(shù)、之差

這里,t看作為參數(shù)。當為一維函數(shù)時,可用圖3-1來表示。2021/6/277圖3-1自變量函數(shù)的變分2021/6/278

這里,是的線性泛函,若時,有,則稱是泛函的變分。是的線性主部。

當自變量函數(shù)有變分時,泛函的增量為

5、泛函的變分:2021/6/2796、泛函的極值:

若存在,對滿足的 一切X, 具有同一符號,則稱在處有極值。2021/6/2710

定理:

在處有極值的必要條件是對于所有容許的增量函數(shù)(自變量的變分),泛函在處的變分為零為了判別是極大還是極小,要計算二階變分。但在實際問題中根據(jù)問題的性質容易判別是極大還是極小,故一般不計算。2021/6/27113.2無約束條件的泛函極值問題3.2.1泛函的自變量函數(shù)為標量函數(shù)的情況

為簡單起見,先討論自變量函數(shù)為標量函數(shù)(一維)的情況。我們要尋求極值曲線,使下面的性能泛函取極值(3-1)2021/6/2712于是泛函J的增量可計算如下(以下將*號省去)上式中是高階項。為此,讓自變量函數(shù)、在極值曲線、附近發(fā)生微小變分、,即2021/6/2713

根據(jù)定義,泛函的變分是的線性主部,即對上式第二項作分部積分,按公式可得(3-2)2021/6/2714

J取極值的必要條件是等于零。因是任意的,要使(3-2)中第一項(積分項)為零,必有(3-3)上式稱為歐拉——拉格朗日方程。(3-2)式中第二項為零的條件要分兩種情況來討論:2021/6/2715

1、固定端點的情況

這時,它們不發(fā)生變化,所以。而(3-2)中第二項可寫成當時,(3-4)式自然為零。(3-4)2021/6/27162、自由端點的情況

這時和可以發(fā)生化,,而且可以獨立地變化。于是要使(3-2)中第二項為零,由(3-4)式可得(3-6)(3-5)2021/6/2717

因為這里討論是標量函數(shù)的情況,和也是標量,且是任意的,故(3-5)、(3-6)可化為(3-7)、(3-8)稱為橫截條件。(3-8)(3-7)2021/6/2718

當邊界條件全部給定(即固定端點)時,不需要這些橫截條件。當 給定時,不要(3-8)。當 給定時,不要(3-7)。2021/6/27193.2.2泛函的自變量函數(shù)為向量函數(shù)的情況

現(xiàn)在,將上面對是標量函數(shù)時所得到的公式推廣到是n維向量函數(shù)的情況。這時,性能泛函為(3-9)(3-10)式中2021/6/2720

向量歐拉——拉格朗日方程為(3-11)式中泛函變分由(3-2)式改為2021/6/2721

(當和時)橫截條件為(自由端點情況)2021/6/2722

例3-1

取極值的軌跡。求通過點(0,0)及(1,1)且使2021/6/2723

即它的通解形式為

式中:這是固定端點問題,相應的歐拉——拉格朗日方程為2021/6/2724

由初始條件,可得A=0。再由終端條件,可得,因而極值軌跡為2021/6/2725

例3-2

求使指標

取極值的軌跡,并要求,但對沒有限制。2021/6/2726解即常數(shù)于是是常數(shù),則是時間的線性函數(shù),令

由可得,又終端是自由的,由式(3-7)可得橫截條件為這是終端自由的情況。歐拉—拉格朗日方程為2021/6/2727容易驗證時,對應局部極??;時,,對應局部極大。由上式解得或。時的極值軌跡為;時的極值軌跡為。

即2021/6/27283.3有約束條件的泛函極值

——動態(tài)系統(tǒng)的最優(yōu)控制問題前面討論泛函極值問題時,對極值軌跡沒有附加任何約束條件。但在動態(tài)系統(tǒng)最優(yōu)控制問題中,極值軌跡必須滿足系統(tǒng)的狀態(tài)方程,也就是要受到狀態(tài)方程的約束??紤]下列系統(tǒng)(3-13)2021/6/2729這是綜合指標。我們要求出最優(yōu)控制和滿足狀態(tài)方程的極值軌跡,使性能指標取極值。式中,為維狀態(tài)向量,為維控制向量(這里假定不受限制.否則不能用變分法求解,而要用極小值原理或動態(tài)規(guī)劃法求解)是n維連續(xù)可微的向量函數(shù)。性能指標如下:(3-14)2021/6/2730

在下面的討論中,假定初始時刻和初始狀態(tài) 是給定的,終端則可能有幾種情況。我們將就幾種常見的情況來討論,即給定,自由和自由,屬于一個約束集。2021/6/27313.3.1終端時刻給定,終端狀態(tài)自由(3-16)(3-15)與有約束條件的函數(shù)極值情況類似,引入待定的n維拉格朗日乘子向量函數(shù)

將狀態(tài)方程(3-13)寫成等式約束方程的形式2021/6/2732

與以前不同的是,在動態(tài)問題中拉格朗日乘子向量是時間函數(shù)。在最優(yōu)控制中經(jīng)常將稱為伴隨變量,協(xié)態(tài)(協(xié)狀態(tài)向量)或共軛狀態(tài)。引入后可作出下面的增廣泛函(3-17)2021/6/2733

于是有約束條件的泛函的極值問題化為無約束條件的增廣泛函的極值問題。(3-18)再引入一個標量函數(shù)它稱為哈密頓(Hamilton)函數(shù),在最優(yōu)控制中起著重要的作用2021/6/2734

于是可寫成(3-19)對上式積分號內(nèi)第二項作分部積分后可得2021/6/2735

設、相對于最優(yōu)值、的變分分別為和 因為自由,故還要考慮變分。下面來計算由這些變分引起的泛函的變分 。2021/6/2736

為極小的必要條件是:對任意的、、,變分等于零。由(3-18)及(3-20)可得下面的一組關系式2021/6/2737(協(xié)態(tài)方程)(3-21)(狀態(tài)方程)(3-22)(控制方程)(3-23)(橫截條件)(3-24)2021/6/2738

(3-21)~(3-24)即為取極值的必要條件,由此即可求得最優(yōu)值,,。

(3-22)式即為狀態(tài)方程,這可由的定義式(3-18)看出,實際解題時無需求,只要直接用狀態(tài)方程即可,這里為形式上對稱而寫成(3-22)式。(3-21)與(3-22)一起稱為哈密頓正則程。2021/6/2739

(3-23)是控制方程,它表示在最優(yōu)控制處取極值。注意,這是在為任意時得出的方程,當有界且在邊界上取得最優(yōu)值時,就不能用這方程,這時要用極小值原理求解。

(3-24)是在固定、自由時得出的橫截條件。當固定時,,就不需要這個橫截條件了。橫截條件表示協(xié)態(tài)終端所滿足的條件。2021/6/2740

在求解(3-21)~(3-24)時,我們只知道初值和由橫截條件(3-24)求得的協(xié)態(tài)終端值,這種問題稱為兩點邊值問題,一般情況下它們是很難求解的。

因為不知道,如果假定一個,然后正向積分(3-21)~(3-24),則在時的值一般與給定的不同,于是要反復修正的值,直至與給定值的差可忽略不計為止。2021/6/2741

非線性系統(tǒng)最優(yōu)控制兩點邊值問題的數(shù)值求解是一個重要的研究領域。對于線性系統(tǒng)兩點邊值問題的求解,則可尋找缺少的邊界條件并只要進行一次積分,下面的例3-4給出了求解過程。

2021/6/2742例3-3

設系統(tǒng)狀態(tài)方程為的邊界條件為。求最優(yōu)控制,使下列性能指標為最小。2021/6/2743

這里、均給定,故不需要橫截條件(3-24)式。作哈密頓函數(shù)則協(xié)態(tài)方程和控制方程為即2021/6/2744

故可得正則方程對正則方程進行拉氏變換,可得(3-25)(3-26)(3-27)由(3-25)式可求得2021/6/2745

于是,解出為(3-28)代入(3-26),即得2021/6/2746(3-29)反變換可求得2021/6/2747

將(3-28)代入(3-26)可得

故2021/6/2748

由,從上式可得把代入(3-29),可得,而最優(yōu)控制為2021/6/2749設系統(tǒng)的狀態(tài)方程為要求確定最優(yōu)控制,使指標泛函例3-4初始條件為取極小值終端條件為自由2021/6/2750

這里是自由的,所以要用到橫截條件(3- 24)式,因終端指標

解:作哈密頓函數(shù)由(3-21)~(3-23)可求得所以(3-30)(3-31)2021/6/2751將代入狀態(tài)方程,可得

即得(3-32)2021/6/2752邊界條件為(3-37)(3-36)(3-35)(3-34)(3-33)2021/6/2753

(3-39)(3-38)(3-40)(3-41)

可見這是兩點邊值問題,對正則方程(3-33)~(3-36)進行拉氏變換,可得2021/6/2754代入初始條件,,可得故由(3-38)~(3-41)可解出2021/6/2755

同樣可解得

利用終端條件,,由(3-42)、(3-43)可得(3-43)(3-42)2021/6/2756

由上二式可解出

由(3-42)式可得最優(yōu)狀態(tài)軌跡2021/6/2757

由(3-43)式可得最優(yōu)協(xié)態(tài)

由(3-32)式可得最優(yōu)控制同理還可求出2021/6/2758圖3-2最優(yōu)控制和最優(yōu)狀態(tài)軌跡解2021/6/2759

注意,這個系統(tǒng)是線性定常系統(tǒng),這種線性兩點邊值問題的解可以通過尋找缺少的邊界條件,并且進行一次積分而求得其解。

對非線性兩點邊值問題,則要借助于迭代方法產(chǎn)生一個序列,來多次修正缺少的初始條件的試探值,直到滿足兩點邊值的條件。圖3-2是最優(yōu)解的軌跡曲線。2021/6/27603.3.2終端時刻自由,終端狀態(tài)受約束

設終端狀態(tài)滿足下面約束方程(3-46)(3-45)(3-44)性能指標為其中2021/6/2761

引入n維拉格朗日乘子向量函數(shù)和維拉格朗日乘子向量,作出增廣性能泛函

將代入(3-47),可得(3-49)(3-48)(3-47)引入哈密頓函數(shù)2021/6/2762

與固定時的情況不同,現(xiàn)在由、、和所引起。這里不再為零,而可計算如下(參見圖3-3):(3-51)則(3-50)令2021/6/2763圖3-3各種變分的表示2021/6/2764(3-52)令2021/6/2765一是在時函數(shù)相對的變化.另一是因的變化所引起的函數(shù)值的變化量后者可用它的線性主部來近似。注意,這里和不同,故*號不能省去。上式表明由兩部分組成:2021/6/2766

現(xiàn)在來計算(只計算到一階小量)。2021/6/2767

上式中方括號外的下標*表示、、是最優(yōu)值、、。是上式的線性主部,故2021/6/2768

對第三項作分部積分,可得2021/6/2769

第四項可表示為(忽略二階小量)2021/6/2770

上式最后一個等號用到了(3-52)式。表示的自變量取最優(yōu)值時的值。根據(jù)上面的結果可得2021/6/2771

取極值的必要條件為因、、、為任意,故得(省去*號)(協(xié)態(tài)方程)(3-53)(狀態(tài)方程)(3-54)(控制方程)(3-55)(橫截方程)(3-56)2021/6/2772

與固定情況相比,這里多了一個方程,,用它可求出最優(yōu)終端時間。

(3-57)2021/6/2773要求確定最優(yōu)控制,使最小。例3-5設系統(tǒng)狀態(tài)方程為邊界條件為自由性能指標為2021/6/2774

解這是自由問題。終端狀態(tài)固定,是滿足約束集的特殊情況,即作哈密頓函數(shù)2021/6/2775正則方程是控制方程是2021/6/2776將代入,可得因邊界條件全部給定,故不用橫截條件。確定最優(yōu)終端時刻的條件(3-57)式為2021/6/2777

因為由正則方程,所以,于是最優(yōu)控制再由正則方程,可得由上式求得2021/6/2778

由初始條件,求得,故最優(yōu)軌跡為以終端條件代入上式,即求得最優(yōu)終端時刻2021/6/2779

火箭發(fā)射最優(yōu)程序問題。設火箭在垂直平面內(nèi)運動,加速度與水平面夾角為,是控制作用,見圖3-4。令

例3-6(水平速度)(垂直速度)(水平距離)(垂直高度)2021/6/2780圖3-4火箭發(fā)射示意圖2021/6/2781

忽略重力和空氣阻力時,系統(tǒng)的狀態(tài)方程和初始條件為(3-58)2021/6/2782要求選擇最優(yōu)控制程序,使性能指標自由終端狀態(tài)為為最小。2021/6/2783

因為要求最小,故是自由問題。由給 定的終端狀態(tài)可得三個約束方程為解(3-59)2021/6/2784

作哈密頓函數(shù)協(xié)態(tài)方程為(3-60)2021/6/2785

橫截條件為即2021/6/2786上式右端矩陣中的自變量已省略。由(3-59)式求出上式中的偏導數(shù),可得協(xié)態(tài)的終值為(3-61)2021/6/2787

常數(shù)積分協(xié)態(tài)方程可得常數(shù)2021/6/2788代入?yún)f(xié)態(tài)終值條件后,得故(3-62)2021/6/2789由控制方程,得(3-63)即2021/6/2790

下面來積分狀態(tài)方程(3-58),為此將自變量變成。由(3-63)式得

為了確定最優(yōu)程序,還需確定拉格朗日未定常數(shù)、。2021/6/2791將上面關系代入狀態(tài)方程,即得積分上面兩式得2021/6/2792由初始條件可求得(3-64)(3-65)2021/6/2793

將上面的和代入狀態(tài)方程(3-58)的后兩式,積分并經(jīng)較復雜運算得

(3-66)(3-67)2021/6/2794

(注:另一解為,但這時由(3-67)式可得出與給定終端條件不符,故略去的解)由終端條件和(3-65)式得

故(3-68)2021/6/2795由(3-63)式得于是(3-70)故(3-69)2021/6/2796

將終端條件和(3-69)式代入(3-64)式,可得(3-71)2021/6/2797

將終端條件,(3-69)式和(3-71)式代入(3-67)式可得(3-72)2021/6/2798

現(xiàn)在歸納一下所得的結果:由(3-72)式可確定,由(3-71)式確定最短時間,由(3-70)式即可求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論