最優(yōu)控制理論讀書(shū)報(bào)告_第1頁(yè)
最優(yōu)控制理論讀書(shū)報(bào)告_第2頁(yè)
最優(yōu)控制理論讀書(shū)報(bào)告_第3頁(yè)
最優(yōu)控制理論讀書(shū)報(bào)告_第4頁(yè)
最優(yōu)控制理論讀書(shū)報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、最優(yōu)控制理論讀書(shū)報(bào)告 第一章 最優(yōu)控制問(wèn)題與極大值原理最優(yōu)控制問(wèn)題具有廣泛性、多樣性及重要性,它可以應(yīng)用到不同的領(lǐng)域中,例如升降機(jī)的最快升降問(wèn)題、防天攔截問(wèn)題、雷達(dá)跟蹤問(wèn)題及生產(chǎn)庫(kù)存控制問(wèn)題等等。通過(guò)對(duì)這些問(wèn)題的研究,我們可以看出它們都具有如下共同的特點(diǎn):(1) 都有一個(gè)被控對(duì)象。它通常是由常微分方程組描述的動(dòng)態(tài)模型來(lái)表征的,即 (1.1)其中是狀態(tài)量,是控制量,是時(shí)間變量,是描述被控對(duì)象動(dòng)態(tài)特征的矢值函數(shù),分別是初始和終端時(shí)刻,通常為定值,而可為定值,也可待求。通常假設(shè):對(duì)有限時(shí)間區(qū)間給定的任一分段連續(xù)矢值函數(shù),(1.1)都存在唯一解。(2) 都要求把被控系統(tǒng)的初態(tài)通過(guò)控制作用,在某個(gè)終端時(shí)

2、刻引導(dǎo)到某個(gè)終端狀態(tài)。通常要求終端狀態(tài)屬于中某個(gè)點(diǎn)集,稱(chēng)為目標(biāo)集,且 (1.2)(3) 都有一個(gè)容許控制集合。容許控制集合為是定義在上的分段連續(xù)函數(shù),且把(1.1)的初態(tài)在終端時(shí)刻引導(dǎo)到目標(biāo)集上 (1.3)(4) 都有一個(gè)表征系統(tǒng)品質(zhì)優(yōu)劣的性能指標(biāo)。由于它是一個(gè)依賴(lài)控制函數(shù)的“函數(shù)”,又稱(chēng)為性能指標(biāo)泛函或代價(jià)泛函。記為,它是一個(gè)依賴(lài)于控制的有限實(shí)數(shù),即一般說(shuō)的表達(dá)式中既應(yīng)包含依賴(lài)于終端時(shí)刻和終端狀態(tài)的末值型項(xiàng),又應(yīng)包含依賴(lài)于整個(gè)控制過(guò)程的積分型項(xiàng),即 (1.4)其中,即皆為標(biāo)量函數(shù)。是(1.1)和對(duì)應(yīng)于控制的解,又稱(chēng)為軌線。歸納起來(lái)最優(yōu)控制問(wèn)題可敘述為:尋求一個(gè)容許控制,使得系統(tǒng)(1.1)在該

3、控制作用下從初態(tài)出發(fā),在某個(gè)大于的終端時(shí)刻達(dá)到目標(biāo)集上,且使性能指標(biāo)達(dá)到極?。ㄈ粢笮阅苤笜?biāo)達(dá)到極大時(shí),只要討論的極小便可)。如果最優(yōu)控制有解即使(1.4)達(dá)到極小的控制函數(shù)存在,記為。稱(chēng)為最優(yōu)控制,與相對(duì)應(yīng)的系統(tǒng)(1.1)的解稱(chēng)為最優(yōu)軌線,相應(yīng)的性能指標(biāo)稱(chēng)為最優(yōu)性能指標(biāo),稱(chēng)為最優(yōu)控制問(wèn)題(1.1)(1.4)的最優(yōu)解。從最優(yōu)控制問(wèn)題的敘述可知。 在最優(yōu)控制問(wèn)題中,根據(jù)涉及的函數(shù)的不同,有幾種不同的稱(chēng)謂。例如時(shí)為快速控制問(wèn)題;當(dāng)都不顯含時(shí)為定常系統(tǒng)的最優(yōu)控制問(wèn)題,否則為時(shí)變系統(tǒng)的最優(yōu)控制問(wèn)題;當(dāng)目標(biāo)集僅含一個(gè)固定點(diǎn)時(shí)為固定端點(diǎn)問(wèn)題;當(dāng)時(shí)為自由端點(diǎn)問(wèn)題;當(dāng)固定時(shí)為固定終端時(shí)刻問(wèn)題,否則為終端時(shí)刻自

4、由問(wèn)題;當(dāng)時(shí)為末值指標(biāo);當(dāng)時(shí)為積分型指標(biāo);當(dāng)時(shí)為混合型指標(biāo)。雖然最優(yōu)控制問(wèn)題的指標(biāo)有混合型、末值型和積分型三種,但在某些條件下,三種指標(biāo)是可以相互轉(zhuǎn)換的,這種相互轉(zhuǎn)換在理論研究上是很有意義的,例如在最優(yōu)控制問(wèn)題的幾何解釋時(shí)就會(huì)用到這種轉(zhuǎn)換。以下我們分別介紹不同條件下的最優(yōu)控制問(wèn)題。一 控制量不受約束的最優(yōu)控制問(wèn)題控制量不受約束的最優(yōu)控制問(wèn)題是指在前面最優(yōu)控制問(wèn)題的敘述中,控制量的取值范圍不受約,即或?yàn)橹械拈_(kāi)集。設(shè)最優(yōu)控制問(wèn)題敘述中所涉及的函數(shù)關(guān)于變?cè)际嵌芜B續(xù)可微的。1 終端時(shí)刻固定,終端狀態(tài)自由終端時(shí)刻固定是指是已知的,終端狀態(tài)自由是指不受任何約束,即。然后利用來(lái)討論最優(yōu)控制所應(yīng)滿(mǎn)足的必要

5、條件,即如果最優(yōu)解存在,所應(yīng)滿(mǎn)足的條件。通過(guò)引入拉格朗日乘子矢值函數(shù),將求的條件極小問(wèn)題化為求的無(wú)條件極小值問(wèn)題。其中為待定的矢值函數(shù)。利用分部積分,并且取哈密頓函數(shù)。通過(guò)對(duì)的變分計(jì)算,我們得到最優(yōu)控制問(wèn)題中所應(yīng)滿(mǎn)足的必要條件:(1) ,。(2) 在的一切連續(xù)時(shí)刻上皆有,故哈密頓函數(shù)作為的函數(shù)在處取得極大。當(dāng)不顯含時(shí),有常量。2 終端時(shí)刻固定,終端狀態(tài)受約束設(shè),即。此時(shí)的最優(yōu)控制問(wèn)題是在約束(1.1)和(1.2)條件下求(1.4)的極小問(wèn)題。如前,通過(guò)引進(jìn)拉格朗日乘子矢值函數(shù)和拉格朗日乘子,將求的條件極小問(wèn)題化為求的無(wú)條件極小值問(wèn)題。同樣取哈密頓函數(shù)。重復(fù)以上過(guò)程可得到最優(yōu)控制問(wèn)題中所應(yīng)滿(mǎn)足的

6、必要條件:(1) ,。(2) ,。(3) 在的一切連續(xù)時(shí)刻上皆有, 。(4)3 終端時(shí)刻自由與控制量不受約束的極大值原理3.1終端狀態(tài)自由用類(lèi)似于1中的方法,可得到該條件下最優(yōu)控制問(wèn)題中所應(yīng)滿(mǎn)足的必要條件:(1) ,(2) ,。(3) 在的一切連續(xù)時(shí)刻上皆有, 。(4) 故哈密頓函數(shù)沿最優(yōu)軌線有 當(dāng)不顯依賴(lài)于時(shí)間時(shí),有。3.2終端狀態(tài)受約束用類(lèi)似于2中的方法,可得到該條件下最優(yōu)控制問(wèn)題中所應(yīng)滿(mǎn)足的必要條件;除了將3.1.2中的橫截條件改為和其余均與3.1中的相同。將以上結(jié)果綜合到一起,可得到如下控制量不受約束的極大值原理:定理1 給定時(shí)變最優(yōu)控制問(wèn)題(1.1)(1.4)。設(shè)關(guān)于變?cè)际嵌芜B續(xù)

7、可微的,且。記哈密頓函數(shù)為。若為最優(yōu)解,則一定存在矢值函數(shù)和矢值常量,使得一起滿(mǎn)足:(1) ,(2) ,(3) 在的一切連續(xù)時(shí)刻上皆有, 。(4)(5) 若自由時(shí),有。當(dāng)不顯依賴(lài)于時(shí)間時(shí),有常量,若固定時(shí)這個(gè)常數(shù)可能不為零,但當(dāng)自由時(shí),這個(gè)常數(shù)一定為零。二 控制量受約束的最優(yōu)控制問(wèn)題龐德里亞金極大值原理控制變量受約束是指是有界閉集。由于最優(yōu)控制的改變量特別是其取值不能是任意的,因此不可能按以上所討論方法來(lái)獲得最優(yōu)控制所應(yīng)滿(mǎn)足的必要條件。雖如此,但其處理問(wèn)題的思路和某些技巧,仍然可以被用來(lái)獲得控制量受約束條件下最優(yōu)控制應(yīng)滿(mǎn)足的必要條件。由于時(shí)變最優(yōu)控制問(wèn)題都可以通過(guò)引入新的狀態(tài)變量將其化為定常最

8、優(yōu)控制問(wèn)題,故我們只給出了定常最優(yōu)控制問(wèn)題的極大值原理。定常最優(yōu)控制問(wèn)題可敘述如下:狀態(tài)方程為 (1.5)其中是狀態(tài),是控制,。 目標(biāo)集為 自由 (1.6)容許控制集合的分量為分段連續(xù)函數(shù),且為有界閉集。 (1.7)記與對(duì)應(yīng)的軌線,它滿(mǎn)足性能指標(biāo)為 (1.8)關(guān)于定常最優(yōu)控制問(wèn)題(1.5)(1.8)作如下假設(shè):設(shè)(1)關(guān)于變?cè)沁B續(xù)的,而關(guān)于是連續(xù)可微的。(2)都是有界的。我們分別就終端時(shí)刻固定與自由兩種情況進(jìn)行了討論,從而得到定常最優(yōu)控制問(wèn)題的極大值原理(龐德里亞金極大值原理)。1定常最優(yōu)控制問(wèn)題的極大值原理(龐德里亞金極大值原理)給定定常最優(yōu)控制問(wèn)題(1.5)(1.8)和目標(biāo)集。設(shè)為有界閉

9、集且(1) 關(guān)于其變?cè)沁B續(xù)的,關(guān)于是連續(xù)可微的。(2) 都是有界的。記哈密頓函數(shù)為若是最優(yōu)解,則必存在維矢值函數(shù)和維常矢值,使得和一起滿(mǎn)足:(1) (2) (3) 對(duì)在上的一切連續(xù)時(shí)刻上有 (4) 作為的函數(shù)沿著最優(yōu)控制恒為常數(shù),即 常量, 當(dāng)終端時(shí)刻固定時(shí),這個(gè)常數(shù)可能不為零;但當(dāng)自由時(shí),這個(gè)常數(shù)必為零。由于時(shí)變最優(yōu)控制問(wèn)題都可以通過(guò)引入新的狀態(tài)變量將其化為定常最優(yōu)控制問(wèn)題,故我們可直接給出時(shí)變最優(yōu)控制問(wèn)題的極大值原理。2時(shí)變最優(yōu)控制問(wèn)題的極大值原理(龐德里亞金極大值原理)給定時(shí)變最優(yōu)控制問(wèn)題:。設(shè):(1) 關(guān)于其變?cè)沁B續(xù)的,關(guān)于變?cè)沁B續(xù)可微的。(2) 都是有界的。記哈密頓函數(shù)為如果為

10、有界閉集且是最優(yōu)解,則一定存在矢值函數(shù)和常值矢量,使得一起滿(mǎn)足:(1) (2) (3) 對(duì)在上的一切連續(xù)時(shí)刻上有(4) 哈密頓函數(shù)沿最優(yōu)解具有性質(zhì)當(dāng)終端時(shí)刻自由時(shí)有當(dāng)終端時(shí)刻固定時(shí)無(wú)明確解析表達(dá)式。三 與極大值原理應(yīng)用有關(guān)的幾個(gè)問(wèn)題通常稱(chēng)滿(mǎn)足極大值原理的控制和軌線為極值控制和極值軌線。極值控制和極值軌線稱(chēng)為極值解。如果已知最優(yōu)控制存在且唯一,而極值控制又只有一個(gè),則這個(gè)極值解就是最優(yōu)解。但是極大值原理只是最優(yōu)控制應(yīng)滿(mǎn)足的必要條件,因此極值控制不一定是最優(yōu)控制。所以需要討論最優(yōu)控制的充分條件。1最優(yōu)控制的充分條件定理2 給定最優(yōu)控制問(wèn)題 狀態(tài)方程 (1.9)容許控制集合的分量為的分段連續(xù)函數(shù),為

11、有界閉集 (1.10)性能指標(biāo) (1.11)其中和分別是已知的連續(xù)陣值和矢值函數(shù);是常矢量,和關(guān)于變?cè)沁B續(xù)的,關(guān)于是連續(xù)可微的;是固定的。記設(shè),相應(yīng)軌線為,且滿(mǎn)足 而滿(mǎn)足 如果一起滿(mǎn)足即滿(mǎn)足極大值原理的所有條件,則必是最優(yōu)控制。對(duì)給定的最優(yōu)控制問(wèn)題,能利用極大值原理求解其最優(yōu)控制的先決條件是其最優(yōu)控制的存在性,但并不是所有的最優(yōu)控制問(wèn)題都存在最優(yōu)控制。實(shí)際上在所有的最優(yōu)控制問(wèn)題中,最優(yōu)控制不存在的情況可分為兩類(lèi):(1) 給定狀態(tài)方程、目標(biāo)集和控制約束后,通過(guò)分析可得其容許控制集合。由于容許控制不存在,當(dāng)然就不會(huì)存在最優(yōu)控制了。它反映了關(guān)于最優(yōu)控制問(wèn)題的提法是不合理的。(2) 雖然控制問(wèn)題的提

12、法是合理的,即容許控制集合,但最優(yōu)控制確實(shí)不存在。2極小值原理最優(yōu)控制所應(yīng)滿(mǎn)足的必要條件,除了極大值原理原理外,還有極小值原理。實(shí)際上,只要注意到兩種敘述中哈密頓函數(shù)和共軛方程的終端條件的區(qū)別,可知這兩種敘述是等價(jià)的?,F(xiàn)在我們以時(shí)變最優(yōu)控制問(wèn)題的極大值原理為例來(lái)敘述其相對(duì)應(yīng)的極小值原理。定理3 最優(yōu)控制所應(yīng)滿(mǎn)足的必要條件極小值原理給定時(shí)變最優(yōu)控制問(wèn)題:。設(shè):(1) 關(guān)于其變?cè)沁B續(xù)的,而關(guān)于變?cè)沁B續(xù)可微的。(2) 都是有界的。記哈密頓函數(shù)為如果為有界閉集,且為最優(yōu)解,則一定存在矢量函數(shù)和常矢量,使得一起滿(mǎn)足:(1)(2)(3) 對(duì)在上的一切連續(xù)時(shí)刻均有(4) 哈密頓函數(shù)沿最優(yōu)解具有性質(zhì)當(dāng)終端

13、時(shí)刻自由時(shí),有當(dāng)終端時(shí)刻固定時(shí),無(wú)明確表達(dá)式。3 奇異控制由極大值原理可知,若最優(yōu)控制存在,則哈密頓函數(shù)作為控制的函數(shù)在最優(yōu)控制處取得極大值,但是如果存在一個(gè)容許控制和其相應(yīng)的軌線及共軛變量一起使得哈密頓變量作為控制的函數(shù)取極值時(shí)提供不出最優(yōu)控制的任何信息,則這個(gè)容許控制稱(chēng)為奇異控制,顯然奇異控制可能是最優(yōu)控制也可能不是最優(yōu)控制。因此尋求奇異控制是最優(yōu)控制的必要條件是很有必要的。四 動(dòng)態(tài)規(guī)劃方法與極大值原理 所謂最優(yōu)性原理,就是一個(gè)最優(yōu)過(guò)程的任何最后一段過(guò)程都是最優(yōu)的。顯然最優(yōu)性原理是最優(yōu)過(guò)程應(yīng)滿(mǎn)足的一個(gè)必要條件。通過(guò)分析可知,如果且為最優(yōu)解,為最優(yōu)終端時(shí)刻,且關(guān)于變?cè)沁B續(xù)可微的,那么貝爾曼

14、方程也是最優(yōu)控制應(yīng)滿(mǎn)足的一個(gè)必要條件。其實(shí)如果貝爾曼方程式存在關(guān)于變?cè)芜B續(xù)可微的解,那么就可以得出極大值原理的全部?jī)?nèi)容。雖然從理論上講通過(guò)求解帶終端條件的貝爾曼方程可獲得最優(yōu)綜合函數(shù),然而求解一個(gè)非線性偏微分方程的解,特別是解析解是非常困難的,也就是說(shuō)只有當(dāng)最優(yōu)控制問(wèn)題比較簡(jiǎn)單時(shí),我們才能求得其最優(yōu)綜合函數(shù)??傊?,第一章我們對(duì)不同條件下的最優(yōu)控制問(wèn)題進(jìn)行了相應(yīng)的討論,綜合討論結(jié)果我們得到了不同的極大值原理,但是這些極大值原理都是最優(yōu)控制的必要條件,而非充分條件。然而若使得極大值原理是最優(yōu)控制的充要條件的最優(yōu)控制問(wèn)題一定具有某些特殊的性質(zhì),包括其狀態(tài)方程、性能指標(biāo)和目標(biāo)集的特殊性。接下來(lái)我們

15、研究了一類(lèi)特殊的最優(yōu)控制問(wèn)題的充分條件。其實(shí)利用極大值原理或者最優(yōu)控制的另外一個(gè)必要條件貝爾曼方程求解最優(yōu)控制問(wèn)題都是一個(gè)非常復(fù)雜的過(guò)程,而我們知道并不是任何最優(yōu)控制問(wèn)題都存在最優(yōu)控制,故如果能判斷出其最優(yōu)控制不存在也是很有意義的事情。本章所討論的最優(yōu)控制,無(wú)論是狀態(tài)方程、控制取值約束還是性能指標(biāo)、目標(biāo)集的描述都是非常一般的。但是對(duì)給定的一個(gè)具體最優(yōu)控制問(wèn)題,如何應(yīng)用極大值原理具體求解出其最優(yōu)控制將是我們接下來(lái)兩章所要討論的問(wèn)題。所謂利用極大值原理求解最優(yōu)控制,原則上講就是利用最優(yōu)控制所應(yīng)滿(mǎn)足的必要條件,從容許控制集合中把最優(yōu)控制“挑出”來(lái),這就涉及到最優(yōu)控制是否存在,若存在是否唯一以及是否有

16、顯式表達(dá)式等問(wèn)題。由此可知,為了具體確定出最優(yōu)控制問(wèn)題的最優(yōu)控制,必須對(duì)具體的最優(yōu)控制問(wèn)題的“極值控制”和最優(yōu)控制的一些特殊性質(zhì)進(jìn)行深入的了解。第二章 快速控制問(wèn)題所謂快速控制問(wèn)題,是指最優(yōu)控制問(wèn)題的性能指標(biāo)取為狀態(tài)方程從初始狀態(tài)開(kāi)始運(yùn)動(dòng)第一次到達(dá)目標(biāo)集所用的時(shí)間,即其性能指標(biāo)為。為了引進(jìn)快速控制問(wèn)題中的一些基本概念,我們首先討論一類(lèi)仿射非線性狀態(tài)方程的快速控制問(wèn)題。一 一類(lèi)仿射非線性系統(tǒng)的快速控制問(wèn)題一類(lèi)仿射非線性系統(tǒng)的快速控制問(wèn)題可以敘述為:狀態(tài)方程 (2.1)其中 控制約束 (2.2)目標(biāo)集 (2.3)性能指標(biāo) (2.4)假設(shè):(1) 關(guān)于其變?cè)际沁B續(xù)可微的。(2) 都是有界的。對(duì)于快

17、速控制問(wèn)題(2.1)(2.4),我們可將其分為兩類(lèi):一類(lèi)為正則快速控制問(wèn)題(每個(gè)都不存在零聚點(diǎn));另一類(lèi)為奇異快速控制問(wèn)題(存在零聚點(diǎn))。記是快速控制,是相應(yīng)軌線,是共軛變量;為最優(yōu)終端時(shí)刻,那么利用極大值原理可求得正則快速控制問(wèn)題的快速控制。而奇異快速控制問(wèn)題的快速控制亦可能存在且滿(mǎn)足極大值原理的諸項(xiàng)條件,只是不能從極大值原理的諸條件中將它確定出而已。故在利用極大值原理求解快去控制問(wèn)題時(shí),人們必須從理論上回答三個(gè)問(wèn)題:快速控制是否存在,若存在是否唯一,快速控制問(wèn)題是否是正則的。但是對(duì)一般的,上述三個(gè)問(wèn)題沒(méi)有有效的回答。然而當(dāng)狀態(tài)方程為線性時(shí),特別是線性定常時(shí),我們得到了為回答上述問(wèn)題的重要結(jié)

18、果。接下來(lái)我們將分別研究線性時(shí)變快速控制問(wèn)題、線性定??焖倏刂茊?wèn)題與奇異快速控制問(wèn)題。二 線性時(shí)變快速控制問(wèn)題 線性時(shí)變快速控制問(wèn)題是指線性時(shí)變狀態(tài)方程的快速控制問(wèn)題。狀態(tài)方程為 , (2.5)其中且是的連續(xù)或分段連續(xù)函數(shù)。容許控制集合為是的分段連續(xù)函數(shù)且 (2.6)目標(biāo)集為 (2.7)性能指標(biāo)為 (2.8)設(shè)且關(guān)于有直到階的連續(xù)導(dǎo)數(shù)。如果對(duì)空間中平行于坐標(biāo)軸的單位矢量和皆有即最廣位置條件,則線性時(shí)變快速控制問(wèn)題(2.5)(2.8)是正則的,其中那么由正則快速控制問(wèn)題的結(jié)論可知,此時(shí)最優(yōu)控制為。三 線性定??焖倏刂茊?wèn)題 線性定??焖倏刂茊?wèn)題可敘述為:狀態(tài)方程 , (2.9)其中是常矢量。容許控

19、制集合是的分段連續(xù)函數(shù)且 (2.10)目標(biāo)集 (2.11)性能指標(biāo)為 (2.12)記,則該線性快速控制問(wèn)題是正則的的充要條件是。如果該線性快速控制問(wèn)題是正則的,且其快速控制存在,那么快速控制必是唯一的,且快速控制為,其中有三種取值:使從1變成-1或由-1變成1的時(shí)刻稱(chēng)為開(kāi)關(guān)時(shí)刻。所有的開(kāi)關(guān)次數(shù)之和稱(chēng)為快速控制的開(kāi)關(guān)次數(shù)。從工程實(shí)用考慮,由于快速控制的開(kāi)關(guān)都是通過(guò)一個(gè)裝置來(lái)實(shí)現(xiàn)的,顯然裝置的造價(jià)和具體的開(kāi)關(guān)次數(shù)的多少有關(guān)。因此每個(gè)開(kāi)關(guān)分量的開(kāi)關(guān)次數(shù)的上限在工程實(shí)現(xiàn)快速控制時(shí)是一個(gè)很重要的指標(biāo)要求。在此我們有開(kāi)關(guān)次數(shù)定理:線性定??焖倏刂剖钦齽t的且快速控制存在及快速控制的第個(gè)分量的開(kāi)關(guān)次數(shù)為,若的

20、特征值皆為實(shí)的,則,其中為線性定常控制系統(tǒng)(2.9)的階數(shù)。對(duì)于線性定??焖倏刂茊?wèn)題(2.9)(2.12),其快速控制的存在性有如下定理:1對(duì)于線性定??焖倏刂茊?wèn)題(2.9)(2.12),如果存在一個(gè)容許控制在有限時(shí)間內(nèi)能把引導(dǎo)到坐標(biāo)原點(diǎn),則一定存在一個(gè)在最短時(shí)間內(nèi)把引導(dǎo)到坐標(biāo)原點(diǎn)的容許控制函數(shù),即快速控制存在。2設(shè)線性定常系統(tǒng)是完全能控的,即,且的所有特征值都具有負(fù)實(shí)部,則對(duì)任一,一定存在容許控制,在有限時(shí)間內(nèi)把引導(dǎo)到中的坐標(biāo)原點(diǎn)。3設(shè)線性定常系統(tǒng)是完全能控的,即,的所有特征值都具有非正實(shí)部,且至少存在一個(gè)具有零實(shí)部的特征值,則對(duì)于任一,一定存在容許控制,在有限時(shí)間內(nèi)把引導(dǎo)到中的坐標(biāo)原點(diǎn)。4

21、設(shè)線性定常系統(tǒng)是正則的,的所有特征值皆具有非正實(shí)部,且至少存在一個(gè)具有零實(shí)部的特征值,則對(duì)任一初態(tài),皆存在著快速控制,且的分量皆為的分段常值函數(shù)。線性定??焖倏刂茊?wèn)題的最優(yōu)性能指標(biāo)只依賴(lài)于初態(tài),而與初始時(shí)刻無(wú)關(guān),即 。如果能求得快速控制和最優(yōu)軌線以及初態(tài)函數(shù)的最優(yōu)性能指標(biāo),那么用哈密頓-雅可比-貝爾曼方程來(lái)判斷由極大值原理得到的結(jié)果是否正確時(shí)很有用的。四 快速控制問(wèn)題的奇異性由第一節(jié)知道:(1)若快速控制問(wèn)題(2.1)(2.4)是奇異的,必存在一個(gè)整數(shù),使得開(kāi)關(guān)函數(shù)在上有零聚點(diǎn)。(2) 快速控制問(wèn)題(2.1)(2.4)的奇異性和其快速控制的存在性是兩個(gè)范疇內(nèi)的問(wèn)題,它們是互相無(wú)關(guān)的。(3) 即

22、使奇異快速控制問(wèn)題(2.1)(2.4)存在快速控制,它也不能通過(guò)極大值原理來(lái)求得,得另外尋求必要條件。然而關(guān)于奇異快速控制問(wèn)題的性質(zhì)和其快速控制的存在性,目前只有一些離散的而不是系統(tǒng)的理論結(jié)果,這里我們僅對(duì)單輸入快速控制問(wèn)題進(jìn)行了討論。本章我們對(duì)一類(lèi)特殊的最優(yōu)控制問(wèn)題快速控制問(wèn)題進(jìn)行了討論,得到如果快速控制問(wèn)題是正則的,就有快速控制為。接下來(lái)分別就時(shí)變快速控制問(wèn)題和定常快速控制問(wèn)題進(jìn)行了研究,分別得到快速控制存在的一些定理。而奇異快速控制問(wèn)題的快速控制亦可能存在且滿(mǎn)足極大值原理的諸項(xiàng)條件,只是不能從極大值原理的諸條件中將它確定出而已。故在利用極大值原理求解快速控制問(wèn)題時(shí),人們必須從理論上回答三

23、個(gè)問(wèn)題:快速控制是否存在,若存在是否唯一,快速控制問(wèn)題是否是正則的。目前就奇異快速控制問(wèn)題,我們僅有一些離散的而沒(méi)有系統(tǒng)的理論,這里僅就單輸入快速控制問(wèn)題為例進(jìn)行了討論。第三章 線性二次最優(yōu)控制作為最優(yōu)控制問(wèn)題的另一特殊情況線性二次最優(yōu)控制,它不但在工程實(shí)踐中經(jīng)常碰到,而且它也是處理一類(lèi)非線性控制問(wèn)題的一種方法。我們分別就線性系統(tǒng)二次最優(yōu)調(diào)節(jié)問(wèn)題、具有指數(shù)衰減速度的最優(yōu)調(diào)節(jié)問(wèn)題、線性系統(tǒng)的最優(yōu)輸出跟蹤問(wèn)題及線性系統(tǒng)的受限奇異最優(yōu)調(diào)節(jié)問(wèn)題進(jìn)行了研究?,F(xiàn)將線性時(shí)變二次指標(biāo)的最優(yōu)控制問(wèn)題敘述如下:狀態(tài)方程, (3.1)性能指標(biāo) (3.2)其中的元皆為的連續(xù)或分段連續(xù)函數(shù),且對(duì)任意的,。 控制約束,即

24、控制取值不受約束,且是固定的。通過(guò)考查線性時(shí)變最優(yōu)跟蹤問(wèn)題,可以進(jìn)一步了解了指標(biāo)中的含義以及選取的標(biāo)準(zhǔn)。給定線性時(shí)變系統(tǒng) (3.3)其中是狀態(tài),是控制,是輸出。的元都是的連續(xù)或分段連續(xù)函數(shù)。一般有。所謂最優(yōu)跟蹤問(wèn)題就是使系統(tǒng)(3.3)的輸出盡量跟上一個(gè)已知信號(hào)。為跟蹤誤差。直觀上講,選擇控制應(yīng)使跟蹤誤差盡量小,為了避免所獲得的最優(yōu)控制取值“過(guò)大”,通常在性能指標(biāo)中要引進(jìn)對(duì)控制取值的約束。通常我們?nèi)⌒阅苤笜?biāo)為: (3.4)其中。一個(gè)跟蹤系統(tǒng)的二次性能指標(biāo),不但反映了跟蹤誤差“小”的要求,而且也反映了能量省的要求。一般我們要求和不同時(shí)為零。如果在(3.3)中取,且跟蹤信號(hào),那么(3.3)和(3.4

25、)就變?yōu)?3.1)和(3.2)。一 線性系統(tǒng)二次最優(yōu)調(diào)節(jié)問(wèn)題若固定,就稱(chēng)上述特殊的最優(yōu)跟蹤問(wèn)題稱(chēng)為有限時(shí)間的(二次)最優(yōu)調(diào)節(jié)問(wèn)題;若將終端時(shí)刻的限制去掉,就變?yōu)闊o(wú)窮時(shí)間的最優(yōu)調(diào)節(jié)問(wèn)題。這一部分我們就將分別對(duì)不同情況的最優(yōu)調(diào)節(jié)器問(wèn)題進(jìn)行討論。1 時(shí)變系統(tǒng)有限時(shí)間最優(yōu)調(diào)節(jié)器問(wèn)題所謂時(shí)變系統(tǒng)有限時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題是指,狀態(tài)方程為(3.1)而性能指標(biāo)為(3.2)且固定,控制取值不受約束即的最優(yōu)控制問(wèn)題。對(duì)于該類(lèi)最優(yōu)調(diào)節(jié)問(wèn)題,我們利用極大值原理求解最優(yōu)調(diào)節(jié)器(即最優(yōu)綜合函數(shù))的結(jié)構(gòu)形式,最后得到如下關(guān)于最優(yōu)綜合函數(shù)及最優(yōu)性能指標(biāo)的定理。定理3.1 對(duì)于線性時(shí)變系統(tǒng)(3.1)(3.2),其中的元皆為的連續(xù)或

26、分段連續(xù)函數(shù),且對(duì)任意的,。如果固定且,則最優(yōu)綜合函數(shù)存在且唯一,可表達(dá)為,其中為如下黎卡提矩陣微分方程 的唯一非負(fù)定解,而最優(yōu)性能指標(biāo)為 。 在該定理中,我們并沒(méi)有要求狀態(tài)方程(3.1)完全能控,這是因?yàn)樵诰€性時(shí)變有限時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題中,只要狀態(tài)盡量接近零狀態(tài)而非,且其不能控狀態(tài)對(duì)性能指標(biāo)的貢獻(xiàn)是有限值的原因。在下面將會(huì)看到,如果要求或,就必須對(duì)狀態(tài)方程(3.1)加上完全能控的假設(shè)。2 時(shí)變系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)器問(wèn)題若將線性時(shí)變系統(tǒng)(3.1)(3.2)中的矩陣改為定常矩陣,可知此時(shí)狀態(tài)方程是定常的,而性能指標(biāo)中的加權(quán)陣也與時(shí)間無(wú)關(guān),只要是固定的有限值,其反饋增益陣仍是時(shí)變的,在此我們將對(duì)終端

27、時(shí)刻的限制去掉,也就變?yōu)榱藷o(wú)窮時(shí)間的最優(yōu)調(diào)節(jié)問(wèn)題。對(duì)于這種問(wèn)題,我們可將其視為其相應(yīng)線性時(shí)變有限時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題的最優(yōu)調(diào)節(jié)器的一個(gè)極限過(guò)程。為了保證最優(yōu)調(diào)節(jié)器存在,我們假設(shè)線性時(shí)變系統(tǒng)在任意都是完全能控的。通過(guò)討論我們可得到關(guān)于線性時(shí)變系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題的定理。定理3.2 對(duì)于時(shí)變系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題,設(shè)任取線性時(shí)變系統(tǒng)都是能控的,則時(shí)變系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題的最優(yōu)解存在唯一,其最優(yōu)調(diào)節(jié)器為,其中為如下黎卡提微分方程 的極限解。3 定常系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題由以上兩部分可以看到,對(duì)于時(shí)變系統(tǒng)有限時(shí)間和無(wú)窮時(shí)間的最優(yōu)調(diào)節(jié)問(wèn)題,它們的反饋增益陣都是時(shí)變的,這就給工程實(shí)現(xiàn)造成了很大的麻

28、煩。然而對(duì)于定常系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題,其反饋增益陣是定常的,因此對(duì)研究定常系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題是很有必要的。在此我們有關(guān)于定常系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題的定理。定理3.3 對(duì)于定常系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題。設(shè)線性定常系統(tǒng)是完全能控的,即,若,則定常系統(tǒng)無(wú)窮時(shí)間的最優(yōu)調(diào)節(jié)器存在唯一,其表達(dá)式為,其中滿(mǎn)足如下黎卡提代數(shù)方程, 且以為初態(tài)的最優(yōu)性能指標(biāo)為。由于對(duì)任意都有,故。對(duì)于定常系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題除了討論最優(yōu)控制,我們還討論了其最優(yōu)閉環(huán)的穩(wěn)定性,為了保證最優(yōu)閉環(huán)是漸近穩(wěn)定的,必須對(duì)權(quán)陣加上某些條件,假設(shè)有分解。我們有如下關(guān)于定常系統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題的定理。定理3.4 對(duì)于定常系統(tǒng)

29、無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題。設(shè)是完全能控(即),且對(duì)有分解,完全能觀測(cè)(即),則最優(yōu)閉環(huán)系統(tǒng),一定是漸近穩(wěn)定的,其中是黎卡提代數(shù)方程的唯一正定解。定理3.5 對(duì)于定常統(tǒng)無(wú)窮時(shí)間最優(yōu)調(diào)節(jié)問(wèn)題。設(shè)能穩(wěn)定 (即),且對(duì)有分解,能檢測(cè)(即),則最優(yōu)閉環(huán)系統(tǒng),一定是漸近穩(wěn)定的,其中是黎卡提代數(shù)方程的唯一非負(fù)定解。4 黎卡提代數(shù)方程的求解方法綜上可知,在求解最優(yōu)調(diào)節(jié)器時(shí),都用到了黎卡提方程的解,所以如何求黎卡提方程的解就顯得很重要了。在此我們給出一些求解黎卡提代數(shù)方程的解的方法。(1) 直接展開(kāi)法,這適用于結(jié)構(gòu)簡(jiǎn)單且維數(shù)較小的系統(tǒng)。(2) 利用,即求黎卡提微分方程解的極限。(3) 將化為若爾當(dāng)型,若,則。(4)

30、 解線性代數(shù)方程組。(5) 迭代逼近算法我們可根據(jù)黎卡提方程的形式的不同,采用不同的方法求解。雖然我們討論了最優(yōu)閉環(huán)系統(tǒng)的漸近穩(wěn)定性,但是卻不能保證其狀態(tài)有事先指定的衰減速度,然而在實(shí)際工程中,我們總希望最優(yōu)閉環(huán)系統(tǒng)具有事先給定的衰減速度,故研究具有指定衰減速度的最優(yōu)調(diào)節(jié)問(wèn)題就顯得尤為重要,這就是我們接下來(lái)要介紹的問(wèn)題。二 具有指定衰減速度的最優(yōu)調(diào)節(jié)問(wèn)題所謂為線性定常系統(tǒng)設(shè)計(jì)具有指定衰減速度(即),指如下最優(yōu)控制問(wèn)題。狀態(tài)方程 (3.5)性能指標(biāo) (3.6)其中。如果能控,對(duì)的任意分解完全能觀測(cè),則存在唯一的具有指定衰減速度的最優(yōu)調(diào)節(jié)器,使得最優(yōu)閉環(huán)系統(tǒng),的解滿(mǎn)足。其中為如下黎卡提代數(shù)方程的唯一正定解。三 線性系統(tǒng)的最優(yōu)輸出跟蹤問(wèn)題在前面我們已經(jīng)給出了線性系統(tǒng)的最優(yōu)跟蹤問(wèn)題(3.3)(3.4),我們?nèi)岳脴O大值原理來(lái)求解,得到如下結(jié)論。對(duì)于線性系統(tǒng) (3.7)和性能指標(biāo) (3.8)其中固定,是已知的被

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論