![變分法及其在最優(yōu)控制中的應用_第1頁](http://file4.renrendoc.com/view/e2963283b9b2ae0ad57e4ffa7035ab9a/e2963283b9b2ae0ad57e4ffa7035ab9a1.gif)
![變分法及其在最優(yōu)控制中的應用_第2頁](http://file4.renrendoc.com/view/e2963283b9b2ae0ad57e4ffa7035ab9a/e2963283b9b2ae0ad57e4ffa7035ab9a2.gif)
![變分法及其在最優(yōu)控制中的應用_第3頁](http://file4.renrendoc.com/view/e2963283b9b2ae0ad57e4ffa7035ab9a/e2963283b9b2ae0ad57e4ffa7035ab9a3.gif)
![變分法及其在最優(yōu)控制中的應用_第4頁](http://file4.renrendoc.com/view/e2963283b9b2ae0ad57e4ffa7035ab9a/e2963283b9b2ae0ad57e4ffa7035ab9a4.gif)
![變分法及其在最優(yōu)控制中的應用_第5頁](http://file4.renrendoc.com/view/e2963283b9b2ae0ad57e4ffa7035ab9a/e2963283b9b2ae0ad57e4ffa7035ab9a5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
變分法及其在最優(yōu)控制中的應用第1頁,共94頁,2023年,2月20日,星期三主要內(nèi)容§1.1泛函的變分§1.2歐拉方程§1.3橫截條件§1.4泛函局部極值的充分條件§1.5等式約束條件下的變分問題§1.6利用變分法求解最優(yōu)控制問題課外習題返回目錄第2頁,共94頁,2023年,2月20日,星期三§1.1泛函的變分一、泛函的定義如果變量J對于某一函數(shù)類中的每一個函數(shù)x(t),都有一個與之對應,那么就稱變量J為依賴于函數(shù)x(t)的泛函,記為:J=J[x(t)]。確定的值說明:由于函數(shù)的值是由自變量的選取而確定的,而泛函的值是由自變量的函數(shù)的選取而確定的,所以將泛函理解為“函數(shù)的函數(shù)”。例1.1.1函數(shù)的定積分是泛函。因為變量J的值是由函數(shù)的選取而確定的。第3頁,共94頁,2023年,2月20日,星期三例1.1.2在平面上連接給定兩點A(ta,xa)和B(tb,xb)的曲線的弧長J是一個泛函,如圖1-1所示。當曲線方程x=x(t)(滿足x(ta)=xa,x(tb)=xb)給定后,可算出它在A、B兩點間的弧長為:例1.1.3函數(shù)的不定積分不是泛函。泛函的上述概念,可以推廣到含有幾個函數(shù)的泛函的情況,例如:第4頁,共94頁,2023年,2月20日,星期三從例1.1.2可以知道,連接A、B兩點的曲線之弧長的泛函,其被積函數(shù)是未知函數(shù)導數(shù)的函數(shù)。在一般情況下,被積函數(shù)是自變量t,未知函數(shù)x(t)及其導數(shù)的函數(shù)。所以最簡單的一類泛函可表示為:
求函數(shù)的極值時,微分或?qū)?shù)起著重要的作用。求泛函的極值時,變分起著類似的作用。我們將求泛函的極值問題稱為變分問題,其相應的方法稱為變分法。(1.1.1)如圖1-2所示。二、泛函宗量的變分泛函J[x(t)]的宗量是函數(shù)x(t),其變分是指在同一函數(shù)類中的兩個函數(shù)間的差:第5頁,共94頁,2023年,2月20日,星期三三、泛函的連續(xù)性函數(shù)相近當函數(shù)x(t)與x0(t)之差的絕對值,即∣x(t)-x0(t)∣,t1t
t2(1.1.2)
對于x(t)的定義域中的一切t(t1
t
t2
)都很小時,稱函數(shù)x(t)與函數(shù)x0(t)是相近的,也稱為零階相近。如圖1-3所示。第6頁,共94頁,2023年,2月20日,星期三一階相近當函數(shù)x(t)與x0(t)之差的絕對值以及它們的一階導數(shù)和之差的絕對值,即
t1
tt2(1.1.3)
都很小,稱函數(shù)x(t)與函數(shù)x0(t)是一階相近的,如圖1-4所示。注意:一階相近的兩個函數(shù),必然是零階相近,反之不成立。第7頁,共94頁,2023年,2月20日,星期三k階接近當t1
t
t2(1.1.4)都很小時,稱函數(shù)x(t)與函數(shù)x0(t)是k階相近的。函數(shù)間距離
在不同的函數(shù)空間,函數(shù)間的距離定義也不同。在函數(shù)空間C[a,b](在區(qū)間[a,b]上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間)中,通常采用下式定義距離:
(1.1.5)在函數(shù)空間Ck[a,b](在區(qū)間[a,b]上連續(xù)且具有連續(xù)的k階導數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間)中,任意兩個函數(shù)間的距離定義為:
(1.1.6)顯然,式(1.1.5)定量地表示兩個函數(shù)之間的零階相近度,而式(1.1.6)定量地表示兩個函數(shù)之間的k階相近度。第8頁,共94頁,2023年,2月20日,星期三泛函的連續(xù)性如果對于任意給定的正數(shù),可以找到這樣一個>0,當
d[x(t),x0(t)]<(1.1.7)時,存在∣J[x(t)]-J[x0(t)]<(1.1.8)
那么,就說泛函J在點x0(t)處是連續(xù)的。根據(jù)所采用的函數(shù)之間距離定義的不同,是按式(1.1.5)還是式(1.1.6),其對應的泛函分別稱為零階連續(xù)泛函或k階連續(xù)泛函。四、線性泛函連續(xù)泛函如果滿足下列條件:(1)J[x1(t)+x2(t)]=J[x1(t)]+J[x2(t)](2)J[cx(t)]=c
J[x(t)]第9頁,共94頁,2023年,2月20日,星期三其中,c是任意常數(shù),就稱為線性泛函。例如都滿足上述兩個條件,故均為線性泛函。五、泛函的變分如果連續(xù)泛函J[x(t)]的增量可以表示為:(泰勒級數(shù))其中,L[x(t),x(t)]是關于x(t)的線性連續(xù)泛函,而r[x(t),x(t)]是關于x(t)的高階無窮小。L[x(t),x(t)]稱為泛函的變分,記為(1.1.9)第10頁,共94頁,2023年,2月20日,星期三(1.1.10)也就是說,泛函的變分是泛函增量的線性主部。當一個泛函具有變分時,即泛函的增量可以用式(1.1.9)來表示時,稱該泛函是可微的。例如,泛函的增量為:于是,其變分為:第11頁,共94頁,2023年,2月20日,星期三可以證明,泛函的變分是唯一的。因為,若泛函的變分不是唯一的,則泛函的增量可以寫為:引理1.1.1泛函J[x(t)]的變分為:證明:如上所述,泛函J[x(t)]的增量為:其中,(0≤≤1)是一個參變量。由于L[x(t),
x(t)]是關于
x(t)的線性連續(xù)泛函,根據(jù)線性泛函的性質(zhì)(2),有(1.1.11)第12頁,共94頁,2023年,2月20日,星期三又由于r[x(t),
x(t)]是關于
x(t)的高階無窮小,所以利用上述兩點結(jié)論,便得根據(jù)偏微分的定義第13頁,共94頁,2023年,2月20日,星期三因為泛函J[x(t)]的變分為:所以Q.E.D第14頁,共94頁,2023年,2月20日,星期三例1.1.4求泛函的變分。根據(jù)式(1.1.11),該泛函的變分為:第15頁,共94頁,2023年,2月20日,星期三例1.1.5求泛函的變分根據(jù)式(1.1.11),所求泛函的變分為:第16頁,共94頁,2023年,2月20日,星期三若設則六、泛函的極值如果泛函J[x(t)]在函數(shù)空間中點x=x0(t)的鄰域內(nèi),其增量為:就稱泛函J[x(t)]在點x0(t)處達到極小值;如果泛函J[x(t)]在函數(shù)空間中點x=x0(t)的鄰域內(nèi),其增量為:就稱泛函J[x(t)]在點x0(t)處達到極大值;x0(t)的鄰域包含滿足條件:的所有點x(t)的球(即以x0(t)為圓心,以為半徑的球)。第17頁,共94頁,2023年,2月20日,星期三注意:所采用的函數(shù)間的距離的定義的不同,點x0(t)的鄰域內(nèi)所包含的函數(shù)也不同。
*若→強極值*若→弱極值
顯然,如果泛函J[x(t)]在點x0(t)處達到強極值,那么它在點x0(t)處也一定達到弱極值。反之不成立。定理1.1.1(必要條件)若泛函J[x(t)]是連續(xù)可微的,并且在點x0(t)處達到極值,則泛函在點x0(t)處的變分等于零,即(1.1.12)第18頁,共94頁,2023年,2月20日,星期三證明:對于任意給定的x(t),J[x0(t)+x(t)]既是函數(shù)x(t)的泛函,又是變量的函數(shù)。泛函J[x0(t)+x(t)]在x0(t)處達到極值,也可看成是函數(shù)J[x0(t)+x(t)]在=0處達到極值,所以函數(shù)J[x0(t)+x(t)]對變量的偏導數(shù)在=0處應等于零,即而由式(1.1.11)有比較上面兩式,又考慮x(t)是任意給定的,所以,Q.E.D.第19頁,共94頁,2023年,2月20日,星期三從定理1.1.1的推證中可見,泛函達到強極值與弱極值的必要條件是相同的。應當指出:本節(jié)所討論的定義、引理和定理,稍加變動就可以應用于含有多個未知函數(shù)的泛函:J[x1(t),x2(t),…,xn(t)]第20頁,共94頁,2023年,2月20日,星期三拉格朗日(Lagrange)問題—基本問題(1.2.1)麥耶耳(Mayer)問題(1.2.2)波爾扎(Bolza)問題(1.2.3)§1.2歐拉方程最優(yōu)控制問題中,根據(jù)性能指標的類型(積分型性能指標、終值型性能指標、復合型性能指標)的不同,分別對應了古典變分法中的三類基本問題。第21頁,共94頁,2023年,2月20日,星期三固定端點的Lagrange問題問題描述:假定點A(t0,x0)和B(tf,xf)是所要尋求的泛函(1.2.1)的極值曲線x(t)的兩個固定端點,如圖1-5所示,其坐標為:(1.2.4)現(xiàn)在的問題是:從滿足邊界條件(1.2.4)的二階可微的函數(shù)中,選擇使泛函(1.2.1)達到極小值的函數(shù)x(t)。
解:設x*(t)是使泛函(1.2.1)達到極小值且滿足邊界條件(1.2.4)的極值條件?,F(xiàn)用表示滿足邊界條件(1.2.4)的極值曲線x*(t)的鄰域曲線。其中(1.2.5)第22頁,共94頁,2023年,2月20日,星期三x(t)是泛函宗量x(t)的變分,(01)是一參變量。為使x(t)是滿足邊界條件(1.2.4)的極值曲線x*(t)的鄰域曲線,x(t)應具有連續(xù)導數(shù)且滿足條件:x(t0)=x(tf)=0(1.2.6)于是,由式(1.2.5)得到(1.2.7)由于x*(t)是極值曲線,所以泛函(1.2.1)在極值曲線x*(t)上的變分等于零(定理1.1.1),即由引理1.1.1知,泛函的變分為(1.2.8)(1.2.9)第23頁,共94頁,2023年,2月20日,星期三將式(1.2.1)代入式(1.2.9),得(1.2.10)第24頁,共94頁,2023年,2月20日,星期三對式(1.2.10)右端第二項進行分部積分(1.2.12)將式(1.2.11)代入式(1.2.10),并考慮式(1.2.8)得利用條件(1.2.6),則上式變?yōu)椋?.2.13)(1.2.11)考慮到泛函宗量的變分x(t)是任意的函數(shù),不妨選擇(1.2.14)其中w(t)是任一滿足下列條件的函數(shù):第25頁,共94頁,2023年,2月20日,星期三將式(1.2.14)代入式(1.2.13),可得由上式可見,一個非負的函數(shù)的定積分為零,只能是被積函數(shù)恒等于零,因此有(1.2.15)將上式左端第二項展開,可得(1.2.16)歐拉(Euler)方程歐拉方程第26頁,共94頁,2023年,2月20日,星期三式中若時,歐拉方程是一個二階微分方程。定理1.2.1若給定曲線x(t)的始端x(t0)=x0和終端x(tf)=xf,則泛函達到極值的必要條件是,曲線x(t)滿足歐拉方程其中x(t)應有連續(xù)的二階導數(shù),則至少應是二次連續(xù)可微的。第27頁,共94頁,2023年,2月20日,星期三幾種特殊的歐拉方程(可以得到封閉形式的解)被積函數(shù)L不依賴于,即被積函數(shù)L不依賴于x,即
被積函數(shù)L不依賴于t,即
在這種情況下,歐拉方程的首次積分為
(1.2.17)
其中c是待定的積分常數(shù)。實際上,將上式左邊對t求全導數(shù),有被積函數(shù)L
線性地依賴于,即式(1.2.16)第28頁,共94頁,2023年,2月20日,星期三
對于向量空間的泛函,也存在著歐拉方程,不過是歐拉方程組(即向量歐拉方程)。定理1.2.2在n維函數(shù)空間中,若極值曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T和終端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是給定的,則泛函達到極值的必要條件是曲線X(t)滿足向量歐拉方程其中X(t)應有連續(xù)的二階導數(shù),而則至少應是二次連續(xù)可微的。(1.2.18)第29頁,共94頁,2023年,2月20日,星期三例1.2.1求泛函滿足邊界條件的極值函數(shù)。解:由式(1.2.18)得:其特征方程為:特征根為:從而得第30頁,共94頁,2023年,2月20日,星期三由給定的邊界條件得于是得極值函數(shù):可以利用MATLAB符號工具箱求解,求解過程如下:symsx1x2;s=dsolve('D2x1-x2=0,D2x2-x1=0','x1(0)=0,x1(pi/2)=1,x2(0)=0,x2(pi/2)=-1','t');x1=s.x1x2=s.x2運行結(jié)果如下:x1=sin(t)x1=-sin(t)第31頁,共94頁,2023年,2月20日,星期三例1.2.2
最速降線(又稱捷線)問題所謂最速降線問題是:設在豎直平面內(nèi)有兩點A和B,它們不在同一條鉛垂線上,現(xiàn)有一質(zhì)點受重力的作用自較高的A點向較低的B點滑動,如果不考慮各種阻力的影響,問應取怎樣的路徑,才能使所經(jīng)歷的時間最短?解:在A、B兩點所在的豎直平面內(nèi)選擇一坐標系,如圖1-6所示。A點為坐標原點,水平線為x軸,鉛垂線為y軸。設質(zhì)點的初速度為零,則由力學的知識可知,質(zhì)點在重力的作用下,不考慮各種阻力的影響,從A點向B點下滑的速度的大小為(1.2.19)第32頁,共94頁,2023年,2月20日,星期三由圖1-6得(1.2.20)將式(1.2.20)代入式(1.2.19)中,并變換,得對上式兩邊進行積分,可得質(zhì)點自點A(0,0)滑動到點B(xf,yf)所需的時間為(1.2.21)
設y=y(x)是連接點A(0,0)和點B(xf,yf)的任一光滑曲線,則最速降線問題的數(shù)學提法是:在XOY平面上確定一條滿足邊界條件(1.2.22)第33頁,共94頁,2023年,2月20日,星期三的極值曲線y=y(x),使泛函(1.2.23)達到極小值。這時被積函數(shù)為:不顯含自變量x,由(1.2.17)知,它的首次積分為化簡上式得第34頁,共94頁,2023年,2月20日,星期三這種方程宜于利用參數(shù)法求解,為此,令于是,又由對上式積分,得由邊界條件y(0)知,c2=0,于是第35頁,共94頁,2023年,2月20日,星期三令最后得這是圓滾線的參數(shù)方程。式中r是滾動圓半徑,其值由另一邊界條件y(xf)=yf確定。所以,最速降線是一條圓滾線。第36頁,共94頁,2023年,2月20日,星期三§1.3橫截條件當極值曲線x*(t)的端點變化時,要使泛函達到極小值,x*(t)首先應當滿足歐拉方程:若端點固定,可以利用端點條件:確定歐拉方程中的兩個待定的積分常數(shù)。問題:若端點可變,如何確定這兩個積分常數(shù)?第37頁,共94頁,2023年,2月20日,星期三橫截條件推導過程問題描述:假定極值曲線的始端A(t0,x0)是固定的,而終端B(tf,xf)是可變的,并沿著給定的曲線(1.3.1)變動,如圖1-7所示?,F(xiàn)在的問題是需要確定一條從給定的點A(t0,x0)到給定的曲線(1.3.1)上的某一點B(tf,xf)的連續(xù)可微的曲線x(t),使得泛函達到極小值。(1.3.2)第38頁,共94頁,2023年,2月20日,星期三解:設x*(t)是泛函(1.3.2)的極值曲線。x*(t)的鄰域曲線可表示為:(1.3.3)(1.3.4)由圖1-7可見,每一條鄰域曲線x(t)都對應一個終端時刻tf,設極值曲線x*(t)所對應的終端時刻為tf*,則鄰域曲線x(t)所對應的終端時刻tf可以表示為:(1.3.5)將式(1.3.3)~(1.3.5)代入式(1.3.2),得(1.3.6)第39頁,共94頁,2023年,2月20日,星期三根據(jù)泛函達到極值的必要條件則有:(1.3.7)式(1.3.7)左邊第一項相當于tf固定時的泛函的變分,按照上一節(jié)推導的結(jié)果可得(1.3.8)第40頁,共94頁,2023年,2月20日,星期三式(1.3.7)左邊第二項先利用中值定理,然后求導,則得(1.3.9)將式(1.3.8)和式(1.3.9)代入式(1.3.7),得考慮到歐拉方程和始端固定所以(1.3.10)若x(t*f)與dtf互不相關,則由上式得第41頁,共94頁,2023年,2月20日,星期三(1.3.11)但是,終端點沿曲線(1.3.1)變動,所以x(t*f)與dtf相關。為了進一步簡化式(1.3.10),應當求出x(t*f)與dtf之間的關系。根據(jù)終端約束條件(1.3.1),應有將上式對取偏導數(shù),并令=0,利用式(1.3.4),整理得將上式代入式(1.3.10),可得第42頁,共94頁,2023年,2月20日,星期三由于dtf是任意的,所以(1.3.12)橫截條件定理1.3.1
若曲線x(t)由一給定的點(t0,x0)到給定的曲線x(tf)=(tf)上的某一點(tf,xf),則泛函達到極值的必要條件是,x(t)滿足歐拉方程和橫截條件其中x(t)應有連續(xù)的二階導數(shù),則至少應是二次連續(xù)可微的,而(t)則應有連續(xù)的一階導數(shù)。第43頁,共94頁,2023年,2月20日,星期三若極值曲線的始端不是固定的,并沿著曲線(1.3.13)變動,則同樣可以推導出始端的橫截條件(1.3.14)根據(jù)定理1.3.1和式(1.3.14),可得到端點可變時,Lagrange問題的解,除有歐拉方程外,還有橫截條件:(1)始端、終端可變,即x(t0)=(t0),x(tf)=(tf),則橫截條件為:(2)當t0、
tf
可變,而x(t0)與x(tf)固定時,則橫截條件為:第44頁,共94頁,2023年,2月20日,星期三(3)當t0、
tf
固定,而x(t0)與x(tf)可變時,即始端與終端分別在t=t0、t=tf上滑動,則橫截條件為:定理1.3.1和以上幾種情況的橫截條件,都可以將其推廣到n維函數(shù)向量X(t)=[x1(t),x2(t),…,xn(t)]T的泛函的情形。定理1.3.2在n維函數(shù)空間中,若曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T是固定的,而終端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是可變的,且在曲面X(tf)=(tf)上變動,則泛函達到極值的必要條件是,曲線X(t)滿足向量歐拉方程第45頁,共94頁,2023年,2月20日,星期三其中X(t)應有連續(xù)的二階導數(shù),而則至少應是二次連續(xù)可微的,而(t)=[1(t),2(t),,n(t)]T則應有連續(xù)的一階導數(shù)。和橫截條件若曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端不是固定的,而是可變的,并在給定的曲面上變動,其中,則同樣可以推導出始端的橫截條件為:第46頁,共94頁,2023年,2月20日,星期三例1.3.1求t-x平面上由給定A(0,1)至給定直線x=2-t的弧長最短的曲線方程。解:由圖1-8,弧長根據(jù)題意,目標泛函應選為:這是一個始端固定,終端可變的泛函的變分問題。由于泛函的被積函數(shù)中不顯含x(t),所以Euler方程為:第47頁,共94頁,2023年,2月20日,星期三由初始條件x(0)=1,得c2=1,從而有由橫截條件(1.3.12),得經(jīng)整理得,所以c1=1。最優(yōu)軌線方程為:最優(yōu)軌線與給定直線垂直。第48頁,共94頁,2023年,2月20日,星期三§1.4泛函局部極值的充分條件泛函二階變分推導過程:給定泛函為其一階變分為(1.4.1)(1.4.2)第49頁,共94頁,2023年,2月20日,星期三而二階變分為第50頁,共94頁,2023年,2月20日,星期三(1.4.3)于是,為使泛函(1.4.1)在曲線x(t)上達到極?。ɑ驑O大)值,其一階變分(1.4.2)應為零,而其二階變分(1.4.3)必須為正(或負)。由此,得到下面的定理。第51頁,共94頁,2023年,2月20日,星期三定理1.4.1若泛函的一階變分則J[x(t)]達到極小值的充分條件是二階型矩陣(1.4.4)是正定的或半正定的;而J[x(t)]達到極大值的充分條件是式(1.4.4)是負定的或半負定的。
定理1.4.1可以推廣到含有n個未知函數(shù)的泛函的情形。第52頁,共94頁,2023年,2月20日,星期三§1.5等式約束條件下的變分問題一、回顧等式約束條件下函數(shù)極值問題的解法設有函數(shù)(1.5.2)現(xiàn)在需要求函數(shù)Z在約束條件為(1.5.1)情況下的極值。(1)消元法:從約束條件(1.5.2)中將y解出來。用x表示y,即y=y(x)然后將y(x)代入f(x,y)中,得到
Z=f[x,y(x)](1.5.3)這樣,函數(shù)Z就只含有一個自變量x了,在等式(1.5.2)約束條第53頁,共94頁,2023年,2月20日,星期三件下的函數(shù)(1.5.1)的極值問題,就變成無約束條件的函數(shù)(1.5.3)的極值問題了。但是,消元法存在兩個問題:①從方程(1.5.2)中將y解出來往往是很困難的;②對x和y這兩個自變量未能平等看待。(2)拉格朗日乘子法(Lagrangefactor)
步驟如下:①作一個輔助函數(shù)F=f(x,y)+g(x,y)式中,是待定的常數(shù),稱為拉格朗日乘子;②求輔助函數(shù)F的無條件極值,即令(1.5.4)
③聯(lián)立求解方程(1.5.2)和(1.5.4),求出駐點(x0,y
0)和待定常數(shù)值;④判斷(x0,y
0)是否是函數(shù)f(x,y)的極值點。第54頁,共94頁,2023年,2月20日,星期三拉格朗日乘子法對于求n元函數(shù)
y=f(x1,x2,…,xn)在多個約束方程gi(x1,x2,…,xn)=0,i=1,2,…,m;m<n條件下的極值問題,同樣適用。二、等式約束條件下泛函極值問題的解法求泛函(1.5.5)在約束方程為(1.5.6)和端點條件為(1.5.7)第55頁,共94頁,2023年,2月20日,星期三利用拉格朗日乘子法求解上述等式約束條件下的泛函極值問題,其具體步驟為構(gòu)造輔助泛函
其中(t)=[
1(t),
2(t),…,
m(t)]T是m維待定向量乘子。于是,就將有約束條件(1.5.6)的泛函(1.5.5)的極值問題轉(zhuǎn)化成無約束條件的泛函(1.5.8)的極值問題。令(1.5.9)寫出向量形式的歐拉方程(1.5.10)情況下的極值曲線。這里X(t)=[x1(t),x2(t),…,xn(t)]T,f=[f1,f2,…,fm]T,m<n。而是x1(t),x2(t),…,xn(t)和t的標量函數(shù)。(1.5.8)第56頁,共94頁,2023年,2月20日,星期三聯(lián)立求解歐拉方程(1.5.10)和約束方程(1.5.6),可以得到n維向量函數(shù)X(t)和m維向量乘子
(t)。利用端點條件(1.5.7)確定歐拉方程解中的2n個積分常數(shù),得到候選函數(shù)X(t)。檢驗候選函數(shù)X(t)是否使泛函(1.5.8)達到極值以及是極大值還是極小值。說明:
①利用拉格朗日乘子法求得的函數(shù)X(t),如果(1.5.8)達到極值,就一定是原泛函(1.5.5)的極值函數(shù)。因為由約束方程(1.5.6)和歐拉方程(1.5.10)聯(lián)立解出的向量函數(shù)X(t)和(t)一定滿足約束方程(1.5.6),所以必有J0=J,另外,當將所解出的(t)代入輔助泛函(1.5.8)時,函數(shù)X(t)將使輔助泛函(1.5.8)達到無條件極值,因為函數(shù)X(t)是輔助泛函(1.5.8)的歐拉方程(1.5.10)的解。第57頁,共94頁,2023年,2月20日,星期三②上面的論述僅僅指出了利用拉格朗日乘子法求出的輔助泛函(1.5.8)的無條件的極值函數(shù),一定是原泛函(1.5.5)在等式(1.5.6)約束條件下的極值函數(shù)。但是,卻沒有說明原泛函(1.5.5)在等式(1.5.6)約束條件下的所有極值函數(shù)是否都能利用拉格朗日乘子法求出來?下面的定理將回答這個問題。定理1.5.1如果n維向量函數(shù)X(t)=[x1(t),x2(t),…,xn(t)]T(1.5.11)能使泛函(1.5.15)在等式約束(1.5.12)條件下達到極值,這里f是m維向量函數(shù),m<n,必存在適當?shù)膍維向量函數(shù)(t)=[
1(t),
2(t),…,
m(t)]T(1.5.14)使泛函(1.5.13)第58頁,共94頁,2023年,2月20日,星期三達到無條件極值。即函數(shù)X(t)是泛函(1.5.15)的歐拉方程的解,其中(1.5.16)而X(t)和(t)由歐拉方程(1.5.16)和約束方程(1.5.13)共同確定。說明:①定理1.5.1表明,泛函(1.5.12)在等式(1.5.13)約束條件下的極值函數(shù)X(t),同時也使泛函(1.5.15)達到無條件極值。這就進一步說明泛函(1.5.12)在等式(1.5.13)約束條件下的極值函數(shù)X(t)都可通過拉格朗日乘子法求得。②如果不僅將X(t),而且連函數(shù)(t)在內(nèi),都看成是泛函(1.5.15)的宗量,那么,約束方程(1.5.13)也可以看成是泛函(1.5.15)的歐拉方程。方程(1.5.13)和(1.5.16)共有n+m個方程,恰好可以解出n維和m維未知函數(shù)X(t)和(t)。③當約束方程中(1.5.13)中的函數(shù)f不包括有X(t)的導數(shù)時,則式(1.5.13)便成為一種代數(shù)方程約束。定理1.5.1仍然成立。第59頁,共94頁,2023年,2月20日,星期三例1.5.1已知受控系統(tǒng)的動態(tài)結(jié)構(gòu)如圖1-9所示。求最優(yōu)控制u*(t),使目標泛函取極小值。給定的邊界條件為解:令則得系統(tǒng)的狀態(tài)方程為:現(xiàn)在的目標泛函為應用拉格朗日乘子法,構(gòu)造輔助泛函(1.5.17)第60頁,共94頁,2023年,2月20日,星期三令則向量形式的歐拉方程為根據(jù)狀態(tài)方程(1.5.17),得第61頁,共94頁,2023年,2月20日,星期三利用邊界條件,可得所以,最優(yōu)控制第62頁,共94頁,2023年,2月20日,星期三§1.6利用變分法求解最優(yōu)控制問題
對于最優(yōu)控制問題來說,當狀態(tài)變量和控制變量均不受約束,即X(t)Rn,U(t)
Rm時,是個在等式約束條件下求泛函極值的變分問題,因此,可以利用在上一節(jié)中介紹的拉格朗日乘子法來求解。在這一節(jié)中,利用拉格朗日乘子法求解最優(yōu)控制問題時,將引入哈密頓(Hamilton)函數(shù),推導出幾種典型的最優(yōu)控制問題應滿足的必要條件。1.6.1
拉格朗日問題的解問題1.6.1給定系統(tǒng)狀態(tài)方程(1.6.2)初始條件(1.6.1)終端條件:tf固定,X(tf)自由和性能泛函(1.6.3)第63頁,共94頁,2023年,2月20日,星期三要求從容許控制U(t)
Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(1.6.1)從給定的初態(tài)X(t0)轉(zhuǎn)移到某個終態(tài)X(tf),并使性能泛函(1.6.3)達到極小值。這是拉格朗日問題,又稱為積分型最優(yōu)控制問題。
解:將狀態(tài)方程(1.6.1)改寫為(1.6.4)于是,上述最優(yōu)控制問題就變成為在微分方程(1.6.4)約束條件下求泛函(1.6.3)極值的變分問題。利用拉格朗日乘子法,引入n維拉格朗日乘子向量
(t)=[
1(t),
2(t),…,
n(t)]T
(t)稱為協(xié)態(tài)變量,以便與狀態(tài)變量相對應。構(gòu)造輔助泛函(1.6.5)第64頁,共94頁,2023年,2月20日,星期三其中,(1.6.6)于是,求泛函(1.6.3)在等式(1.6.1)約束條件下的極值問題,就轉(zhuǎn)變成為求泛函(1.6.5)的無約束條件的極值問題。定義哈密頓(Hamilton)函數(shù)為(1.6.7)它是一標量函數(shù),則式(1.6.6)變?yōu)槔米兎址梢詫懗鲚o助泛函(1.6.5)的歐拉方程(1.6.8)第65頁,共94頁,2023年,2月20日,星期三將式(1.6.8)代入上式,得(1.6.11)(1.6.10)(1.6.9)協(xié)態(tài)方程(或共軛方程)狀態(tài)方程規(guī)范方程(或正則方程)控制方程第66頁,共94頁,2023年,2月20日,星期三(1.6.12)初始狀態(tài)為由于終端時刻tf固定,終端狀態(tài)X(tf)自由,所以橫截條件為考慮式(1.6.8),得(1.6.13)式(1.6.9)~(1.6.13)就是式(1.6.1)~(1.6.3)所給定的最優(yōu)控制問題的解應滿足的必要條件。這些條件也可以由求輔助泛函J0對狀態(tài)變量X(t)和控制變量U(t)的變分中推導出來。聯(lián)立求解規(guī)范方程(1.6.9)和(1.6.10)可以得到兩個未知函數(shù)X(t)和
(t),其一個邊界在始端(1.6.12),另一個邊界在終端(1.6.13),故稱為混合邊界問題或兩點邊界值問題。第67頁,共94頁,2023年,2月20日,星期三求解兩點邊界值問題步驟由控制方程(1.6.11)求得
U=U[X(t),(t),t](1.6.14)將式(1.6.14)代入規(guī)范方程(1.6.9)和(1.6.10)消去其中的U(t),得到(1.6.15)(1.6.16)
利用邊界條件(1.6.12)和(1.6.13)聯(lián)立求解方程(1.6.15)和(1.6.16),可得唯一確定的解X(t)和(t)。將所求得的X(t)和(t)代入式(1.6.14)中,可求得相應的U(t)。第68頁,共94頁,2023年,2月20日,星期三說明:(1)對于兩點邊界值問題,一般難以求得其解析解,通常需要采用數(shù)值計算方法求其數(shù)值解。(2)利用引入哈密頓函數(shù)的方法求解拉格朗日型最優(yōu)控制問題,是將求泛函(1.6.3)在等式(1.6.1)約束條件下對控制函數(shù)U(t)的條件極值問題轉(zhuǎn)化為求哈密頓函數(shù)H對控制變量U(t)的無條件極值問題。這種方法稱為哈密頓方法。定理1.6.1設系統(tǒng)的狀態(tài)方程則為將系統(tǒng)從給定的初態(tài)轉(zhuǎn)移到終端時刻tf固定,終端狀態(tài)X(tf)自由的某個終態(tài),并使性能泛函第69頁,共94頁,2023年,2月20日,星期三達到極小值的最優(yōu)控制應滿足的必要條件是(1)設U*(t)是最優(yōu)控制,X*(t)是對應于U*(t)的最優(yōu)軌線,則必存在一與U*(t)和X*(t)相對應的n維協(xié)態(tài)變量(t),使得X(t)與(t)滿足規(guī)范方程其中(2)邊界條件為第70頁,共94頁,2023年,2月20日,星期三(3)哈密頓函數(shù)H對控制變量U(t)(t0ttf)取極值,即*沿著最優(yōu)控制和最優(yōu)軌線,哈密頓函數(shù)H對時間t求全導數(shù),得若H不顯含t時,則有
H(t)=常數(shù)t[t0,tf];
也就是說,當H不顯含t時,哈密頓函數(shù)H是不依賴于t的常數(shù)。第71頁,共94頁,2023年,2月20日,星期三例1.6.1已知系統(tǒng)方程和邊界條件為求使性能泛函為極小值的最優(yōu)控制函數(shù)與最優(yōu)軌線。解:這是一個最小能量控制問題。其哈密頓函數(shù)為由控制方程得第72頁,共94頁,2023年,2月20日,星期三協(xié)態(tài)方程為解協(xié)態(tài)方程,得于是由狀態(tài)方程解得第73頁,共94頁,2023年,2月20日,星期三利用邊界條件求得積分常數(shù)為于是,最優(yōu)控制與最優(yōu)軌線分別為第74頁,共94頁,2023年,2月20日,星期三可以利用MATLAB符號工具箱求解上述微分方程,程序如下:symsl1l2x1x2;s=dsolve('D1l1=0,D1l2=-l1-l2,D1x1=x2,D1x2=x2-l2','x1(0)=1,x2(0)=1,x1(1)=0,x2(1)=0','t')l1=s.l1,l2=s.l2,x1=s.x1,x2=s.x2運行結(jié)果為:s=l1:[1x1sym]l2:[1x1sym]x1:[1x1sym]x2:[1x1sym]第75頁,共94頁,2023年,2月20日,星期三l1=-2*exp(1)/(exp(1)-3)l2=2*exp(1)/(exp(1)-3)-2*exp(1)/(exp(1)-3)*exp(-t)-2*exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)x1=-exp(1)/(exp(1)-3)*exp(t)+2*exp(1)/(exp(1)-3)*t+exp(1)/(exp(1)-3)*exp(-t)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)-2*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(t)x2=2*exp(1)/(exp(1)-3)-exp(1)/(exp(1)-3)*exp(-t)-exp(1)/(exp(1)-3)*exp(t)-exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(t)例1.6.2問題同例1.6.1,只是終端條件為x1(1)=0,x2(1)自由,求該最優(yōu)控制問題。解:問題的規(guī)范方程和控制方程均與例1.6.1相同,但邊界條件變?yōu)榈?6頁,共94頁,2023年,2月20日,星期三由這些邊界條件求得的積分常數(shù)為于是,所求得的最優(yōu)解為
由例1.6.1和例1.6.2可見,對于兩個相同的最優(yōu)控制問題,只是部分終端狀態(tài)不相同,所得到的最優(yōu)解則完全不同。第77頁,共94頁,2023年,2月20日,星期三1.6.2
波爾扎問題的解問題1.6.2給定系統(tǒng)狀態(tài)方程(1.6.18)初始條件(1.6.17)和性能泛函(1.6.19)要求從容許控制U(t)
Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(1.6.17)從給定的初態(tài)X(t0)轉(zhuǎn)移到某個終態(tài)X(tf),并使性能泛函(1.6.19)達到極小值。這是波爾扎問題,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑材料進口物流合同樣本
- 礦產(chǎn)開采用地中介服務合同
- 二零二五年度包裝機械遠程監(jiān)控與維修服務合同
- 家禽養(yǎng)殖合同禽類采購合同
- 房屋買賣合同詳情
- 農(nóng)業(yè)工程綜合實施方案
- 軟件技術服務合同書
- 國際酒店服務管理手冊
- 工程監(jiān)理規(guī)范實務手冊
- 牛羊肉供貨協(xié)議書
- 人教版PEP五年級英語下冊單詞表與單詞字帖 手寫體可打印
- 如果歷史是一群喵
- 抖音房產(chǎn)直播敏感詞匯表
- 2024屆山東省青島市市北區(qū)八年級物理第二學期期末質(zhì)量檢測試題含解析
- 2022-2023年人教版九年級化學(上冊)期末試題及答案(完整)
- 中華民族共同體概論課件專家版2第二講 樹立正確的中華民族歷史觀
- 蔚來用戶運營分析報告-數(shù)字化
- 中學生低碳生活調(diào)查報告
- 游泳池經(jīng)營合作方案
- 擘畫未來技術藍圖
- 基于情報基本理論的公安情報
評論
0/150
提交評論