版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
新能源汽車與智能網(wǎng)聯(lián)技術(shù)第5章
決策規(guī)劃“十四五”時(shí)期國(guó)家重點(diǎn)出版物出版專項(xiàng)規(guī)劃項(xiàng)目新能源與智能網(wǎng)聯(lián)汽車新技術(shù)系列叢書(shū)中國(guó)機(jī)械工業(yè)教育協(xié)會(huì)“十四五”普通高等教育規(guī)劃教材本章內(nèi)容5.1決策方法概述5.2全局軌跡規(guī)劃5.3局部軌跡規(guī)劃5.4車輛運(yùn)動(dòng)軌跡本章內(nèi)容5.1決策方法概述5.2全局軌跡規(guī)劃5.3局部軌跡規(guī)劃5.4車輛運(yùn)動(dòng)軌跡5.1決策方法概述自動(dòng)駕駛高精地圖概述正確的決策方法是智能汽車行駛安全性及合理性的重要保障,其目的是接收最新的本車狀態(tài)信息以及環(huán)境感知信息,結(jié)合交通規(guī)則,決策產(chǎn)生一個(gè)能夠完成駕駛?cè)蝿?wù)的行駛行為,作為下層軌跡規(guī)劃的目標(biāo)。典型的行駛行為包括與道路相關(guān)的交叉口行駛、換道,以及與其他車輛相關(guān)的跟隨、超車、避讓等。顯然,行為決策一方面取決于當(dāng)前客觀環(huán)境信息以及相應(yīng)交通規(guī)則的潛在影響,另一方面,如果想要在動(dòng)態(tài)交通環(huán)境中安全、高效地行駛,其他交通參與物對(duì)智能汽車的影響也是必須考慮的。同時(shí),因?yàn)樾枰鶕?jù)實(shí)時(shí)獲得的傳感信息決策出合理的行駛行為,智能汽車行為決策模塊需要具備較高的實(shí)時(shí)性。決策方法分類目前的自動(dòng)駕駛決策規(guī)劃技術(shù)方案主要分為兩類,即分解式?jīng)Q策方案和集中式?jīng)Q策方案。兩種方案的決策過(guò)程不同,優(yōu)缺點(diǎn)各異,都有著各自的研究方法和實(shí)車應(yīng)用5.1決策方法概述表1兩類自動(dòng)駕駛決策規(guī)劃技術(shù)方案比較分解式?jīng)Q策方案將決策過(guò)程分解為相互獨(dú)立的子過(guò)程,一般分為交通情景理解、參與者運(yùn)動(dòng)預(yù)測(cè)、駕駛行為選擇、駕駛軌跡規(guī)劃4個(gè)部分。分解式?jīng)Q策方案各子過(guò)程獨(dú)立求解,因而決策代碼開(kāi)發(fā)的可控性好。集中式?jīng)Q策方案采用類似人類的駕駛決策過(guò)程,以環(huán)境感知結(jié)果為輸入,直接以期望路徑或執(zhí)行器控制命令為輸出,將決策過(guò)程視作一個(gè)不可分解的黑箱,體系框架相對(duì)簡(jiǎn)潔明了。5.1決策方法概述決策方法常用的智能汽車行為決策方法包括有限狀態(tài)機(jī)法、層次狀態(tài)機(jī)法、博弈論法和概率圖模型法等。有限狀態(tài)機(jī)(FiniteStateMachine,FSM)是一種描述特定對(duì)象的數(shù)學(xué)模型,它是由有限狀態(tài)組成的,決策過(guò)程根據(jù)當(dāng)前狀態(tài)以及接收事件產(chǎn)生相應(yīng)的動(dòng)作從而引起狀態(tài)的變換,適用于具有復(fù)雜控制邏輯系統(tǒng)(即事件響應(yīng)系統(tǒng))的建模。有限狀態(tài)機(jī)的基本組成元素包括事件、狀態(tài)、轉(zhuǎn)換和動(dòng)作:①事件是引起狀態(tài)機(jī)狀態(tài)變更的輸入條件,通常由系統(tǒng)的定性或定量數(shù)據(jù)輸入轉(zhuǎn)換而來(lái);②狀態(tài)是對(duì)象的一種形態(tài),可以由其屬性值、執(zhí)行特定的動(dòng)作或等待特定的事件來(lái)確定;③轉(zhuǎn)換表示狀態(tài)之間可能存在的路徑,在某個(gè)特定事件發(fā)生或者完成既定動(dòng)作后,轉(zhuǎn)移至對(duì)象的其他狀態(tài);④動(dòng)作表示有限狀態(tài)機(jī)中的一些基本“原子操作”,即在操作過(guò)程中不能被中斷的操作。按照結(jié)構(gòu)可將有限狀態(tài)機(jī)分為串聯(lián)式、并聯(lián)式和混聯(lián)式3種。5.1決策方法概述應(yīng)用有限狀態(tài)機(jī)解決智能汽車的行為決策問(wèn)題時(shí),可將自動(dòng)駕駛過(guò)程分解為幾種基本的駕駛行為模式,例如可以分為以下幾種:1)車道保持行為(A):自動(dòng)駕駛系統(tǒng)的默認(rèn)模式,是指智能汽車始終沿所在車道行駛的行為,按照所在的車道可分為主車道車道保持行為“A(主)”和超車道車道保持行為“A(超)”。2)車輛跟隨行為(B):是指智能汽車按照當(dāng)前車道前車行駛狀態(tài)自適應(yīng)調(diào)節(jié)自身行駛狀態(tài),使其以安全車距跟蹤前方車輛。3)車道變換行為(C):是指智能汽車當(dāng)前車道不具備通行條件或相鄰車道具有更高的通行效率時(shí),從當(dāng)前車道切換至相鄰車道行駛的過(guò)程。按照目標(biāo)車道的不同,車道變換行為可分為從主車道切換至超車道行為“C(主)”和從超車道切換至主車道行為“C(超)”。4)制動(dòng)避障行為(D):當(dāng)智能汽車前方出現(xiàn)緊急情況或意外危險(xiǎn)且不具備換道條件時(shí),智能汽車只能通過(guò)緊急制動(dòng)降低車速或停車,以避免與前方車輛或障礙物發(fā)生碰撞。智能汽車的各種駕駛行為之間是相互關(guān)聯(lián)的,通過(guò)設(shè)置合理的駕駛行為觸發(fā)和轉(zhuǎn)化條件,能夠在簡(jiǎn)單的結(jié)構(gòu)化道路上實(shí)現(xiàn)自動(dòng)駕駛功能。5.1決策方法概述現(xiàn)階段,基于有限狀態(tài)機(jī)的智能汽車行為決策已經(jīng)在實(shí)車應(yīng)用中得到了驗(yàn)證,是基于機(jī)理和規(guī)則的代表性方法。但是該方法在實(shí)現(xiàn)功能復(fù)雜度和應(yīng)用場(chǎng)景復(fù)雜度上的上限較低,功能越復(fù)雜,意味著對(duì)應(yīng)的駕駛行為即狀態(tài)集合越龐大,且對(duì)于城市道路這種具有復(fù)雜、隨機(jī)、不確定性約束的場(chǎng)景,建立應(yīng)對(duì)所有工況的駕駛行為集合以及與其對(duì)應(yīng)的完備的觸發(fā)條件和狀態(tài)轉(zhuǎn)移函數(shù)是十分困難的,極易引起“狀態(tài)機(jī)爆炸”問(wèn)題,給設(shè)計(jì)者帶來(lái)很大的不便。此外,基于有限狀態(tài)機(jī)的決策方法在劃分駕駛行為即狀態(tài)時(shí)需要有明顯的劃分邊界,但實(shí)際駕駛過(guò)程中,駕駛行為之間存在某些“灰色地帶”,即同一場(chǎng)景下可能有一個(gè)以上合理的行為選擇,使駕駛狀態(tài)存在沖突。對(duì)于決策系統(tǒng)而言,一方面要避免沖突狀態(tài)強(qiáng)行劃分而造成智能汽車行為不連貫,另一方面要能夠判斷處于“灰色地帶”的智能汽車不同行為的最優(yōu)性。通過(guò)在決策系統(tǒng)中引入其他決策理論,如決策仲裁機(jī)制、博弈論法、狀態(tài)機(jī)與學(xué)習(xí)算法結(jié)合等方法可幫助解決該問(wèn)題。本章內(nèi)容5.1決策方法概述5.2全局軌跡規(guī)劃5.3局部軌跡規(guī)劃5.4車輛運(yùn)動(dòng)軌跡5.2全局軌跡規(guī)劃全局軌跡規(guī)劃是指在全局地圖指導(dǎo)下,根據(jù)駕駛?cè)蝿?wù)等先驗(yàn)信息,基于車輛起點(diǎn)、終點(diǎn)及其他全局約束條件,在全局地圖上規(guī)劃出從起點(diǎn)到終點(diǎn)的路徑,無(wú)關(guān)時(shí)間序列和車輛動(dòng)力學(xué)。全局軌跡規(guī)劃主要是對(duì)局部路徑規(guī)劃起到導(dǎo)向和約束作用,使車輛沿著導(dǎo)航系統(tǒng)提供的一系列期望局部目標(biāo)點(diǎn)行駛。全局軌跡規(guī)劃在規(guī)劃時(shí)沒(méi)有考慮環(huán)境的現(xiàn)場(chǎng)約束,例如障礙物的形狀位置、道路的寬度、道路的曲率半徑等。根據(jù)算法原理的不同,全局軌跡規(guī)劃方法包括路徑搜索算法、智能仿生算法等。路徑搜索算法路徑搜索算法是一類重要的規(guī)劃和決策方法。常見(jiàn)的搜索算法有寬度優(yōu)先搜索(BreadthFirstSearch,BFS)、深度優(yōu)先搜索(DepthFirstSearch,DFS)、代價(jià)一致搜索、貪婪最佳優(yōu)先搜索、A?搜索、Dijkstra算法等。5.2全局軌跡規(guī)劃路徑搜索的評(píng)價(jià)特性主要有:1)完備性:當(dāng)問(wèn)題有解時(shí),該算法是否能保證找到解。2)最優(yōu)解:搜索策略能否找到最優(yōu)解。3)時(shí)間復(fù)雜度T(n):找到解需要花費(fèi)多長(zhǎng)時(shí)間。4)空間復(fù)雜度S(n):在執(zhí)行搜索的過(guò)程中需要多少內(nèi)存。對(duì)于時(shí)間復(fù)雜度,通常取一個(gè)算法需要進(jìn)行乘法的次數(shù),因?yàn)樵谟?jì)算機(jī)中,乘法運(yùn)行的時(shí)間明顯大于加法運(yùn)行的時(shí)間,記作T(n)=O(f(n)),其中O(f(n))代表最壞情況的復(fù)雜度,可以理解為復(fù)雜度的上限。對(duì)于空間復(fù)雜度,通常取算法運(yùn)行過(guò)程中臨時(shí)占用儲(chǔ)存空間的大小,記作S(n)=O(f(n))。搜索策略分為無(wú)信息搜索策略和有信息搜索策略,其差別在于是否使用了搜索問(wèn)題以外的信息。5.2全局軌跡規(guī)劃寬度優(yōu)先搜索寬度優(yōu)先搜索屬于無(wú)信息搜索策略,其搜索順序是遍歷完淺層的節(jié)點(diǎn)以后再遍歷深層的節(jié)點(diǎn)。該搜索策略因其枚舉法特性具有完備性,不具有最優(yōu)解特性,其空間復(fù)雜度和時(shí)間復(fù)雜度均為O(bd)。深度優(yōu)先搜索深度優(yōu)先搜索與寬度優(yōu)先搜索相反,從一個(gè)節(jié)點(diǎn)開(kāi)始往深層遍歷,直到找到目標(biāo)節(jié)點(diǎn)或者沒(méi)有子節(jié)點(diǎn)的節(jié)點(diǎn)。使用該搜索策略,若不加以相關(guān)限制,極有可能陷入死循環(huán),即該算法沒(méi)有完備性,與寬度優(yōu)先搜索類似,因?yàn)闆](méi)有使用任何信息,因此所得到的解也不是最優(yōu)解。代價(jià)一致搜索評(píng)估函數(shù)是用來(lái)評(píng)估研究對(duì)象整體以及局部性能的數(shù)學(xué)函數(shù)模型。在搜索策略中,評(píng)估函數(shù)起到為下一個(gè)節(jié)點(diǎn)選取提供擴(kuò)展依據(jù)的作用。5.2全局軌跡規(guī)劃圖1節(jié)點(diǎn)擴(kuò)展在搜索策略中,評(píng)估函數(shù)起到為下一個(gè)節(jié)點(diǎn)選取提供擴(kuò)展依據(jù)的作用。如圖1所示,當(dāng)擴(kuò)展到黑色節(jié)點(diǎn)時(shí),根據(jù)兩個(gè)評(píng)估函數(shù)的大小,選取最佳節(jié)點(diǎn)。代價(jià)一致搜索策略仍然屬于無(wú)信息搜索,但這并不代表它與寬度優(yōu)先搜索或者深度優(yōu)先搜索一樣不使用任何信息,它使用了每次遍歷后的節(jié)點(diǎn)的代價(jià)作為評(píng)估函數(shù),f(n)=g(n)。代價(jià)一致搜索每次遍歷到黑色節(jié)點(diǎn)之后,都會(huì)比較之后可以遍歷的節(jié)點(diǎn)已消耗的總代價(jià),從而遍歷最小代價(jià)消耗的節(jié)點(diǎn)。貪婪最佳優(yōu)先搜索有信息搜索指的是搜索策略會(huì)使用問(wèn)題以外的信息。貪婪最佳優(yōu)先搜索和Dijkstra算法搜索等用到了啟發(fā)式函數(shù),即預(yù)測(cè)終點(diǎn)到當(dāng)前節(jié)點(diǎn)所需要的代價(jià)。啟發(fā)式函數(shù)是一種用來(lái)估算當(dāng)前狀態(tài)和目標(biāo)狀態(tài)之間距離的函數(shù),用于路徑?jīng)Q策。該函數(shù)直接決定了尋找路徑的快慢和準(zhǔn)確度。5.2全局軌跡規(guī)劃A?搜索A?搜索的評(píng)估函數(shù)結(jié)合了代價(jià)一致搜索與貪婪最佳優(yōu)先搜索,其評(píng)估函數(shù)由一致路徑耗散代價(jià)和啟發(fā)式函數(shù)組成,f(n)=g(n)+h(n),A?搜索算法具有貪婪最佳優(yōu)先搜索的快速性,也具有代價(jià)一致搜索的完備性與最優(yōu)解特性。若啟發(fā)式函數(shù)計(jì)算得當(dāng),A?搜索算法為最佳搜索算法。表2各類算法優(yōu)缺點(diǎn)各算法優(yōu)缺點(diǎn)對(duì)比見(jiàn)下表。5.2全局軌跡規(guī)劃Dijkstra算法Dijkstra算法由荷蘭數(shù)學(xué)家迪杰斯特拉(Dijkstra)于1959年提出,適用于非負(fù)權(quán)值網(wǎng)絡(luò)的單源最短路徑搜索,是目前求解最短路徑問(wèn)題理論上最完備的方法。Dijkstra算法以起始點(diǎn)為中心向外層擴(kuò)展,直至擴(kuò)展到終點(diǎn)為止,其本質(zhì)上屬于貪心算法,即在選出最優(yōu)量度標(biāo)準(zhǔn)的情況下,根據(jù)最優(yōu)量度標(biāo)準(zhǔn)做出在當(dāng)前看來(lái)最好的選擇,但不是從整體角度得出最優(yōu)解,因此其產(chǎn)生的結(jié)果不一定達(dá)到全局最優(yōu)。Dijkstra算法的核心思想是,設(shè)置兩個(gè)點(diǎn)的集合S和U。集合S中存放已找到最短路徑的節(jié)點(diǎn),U集合中存放當(dāng)前還未找到最短路徑的節(jié)點(diǎn)。初始狀態(tài)時(shí),集合S中只包含起始點(diǎn),然后不斷從集合中選擇到起始點(diǎn)路徑長(zhǎng)度最短的節(jié)點(diǎn)加入集合S中。5.2全局軌跡規(guī)劃集合S中每加入一個(gè)新的節(jié)點(diǎn),都要修改從起始點(diǎn)到集合U中剩余節(jié)點(diǎn)的當(dāng)前最短路徑長(zhǎng)度值,集合S中各節(jié)點(diǎn)新的當(dāng)前最短路徑長(zhǎng)度值為原來(lái)最短路徑長(zhǎng)度值與從起始點(diǎn)過(guò)新加入節(jié)點(diǎn)到該節(jié)點(diǎn)的路徑長(zhǎng)度中的較小值。不斷重復(fù)上述過(guò)程,直至集合U中所有節(jié)點(diǎn)全部加入集合S為止。Dijkstra算法的時(shí)間復(fù)雜度為O(n2),其時(shí)間復(fù)雜度與節(jié)點(diǎn)數(shù)目相關(guān),當(dāng)節(jié)點(diǎn)數(shù)目較大時(shí),Dijkstra算法的時(shí)間復(fù)雜度將急劇增加。因此在較大、較復(fù)雜的城市交通路網(wǎng)中,直接應(yīng)用Dijkstra算法進(jìn)行最短路徑規(guī)劃并不是十分合理的選擇,其計(jì)算效率、實(shí)時(shí)性、準(zhǔn)確性都很難得到保證。智能仿生算法各種模擬自然界生物行為規(guī)律的智能仿生算法也可以應(yīng)用于智能汽車的路徑規(guī)劃。智能仿生算法具有自學(xué)習(xí)、自決定功能,典型的智能仿生算法包括蟻群優(yōu)化(AntColonyOptimization,ACO)算法等。本章內(nèi)容5.1決策方法概述5.2全局軌跡規(guī)劃5.3局部軌跡規(guī)劃5.4車輛運(yùn)動(dòng)軌跡5.3局部軌跡規(guī)劃局部軌跡規(guī)劃是在全局路徑的基礎(chǔ)上,結(jié)合環(huán)境感知系統(tǒng)獲取的信息(道路及障礙物信息)計(jì)算出在換道、轉(zhuǎn)彎、躲避障礙物等情況下,局部范圍內(nèi)安全、平順、精確的行駛軌跡。局部軌跡規(guī)劃不僅要考慮空間,還要考慮時(shí)間序列。局部軌跡規(guī)劃要求算法具有較高的實(shí)時(shí)性,以應(yīng)對(duì)實(shí)時(shí)變化的環(huán)境信息,這對(duì)傳感器、算法的效率和處理器的運(yùn)算能力都是極大的挑戰(zhàn)。局部軌跡規(guī)劃方法可分為基于機(jī)理與規(guī)則的方法和基于數(shù)據(jù)驅(qū)動(dòng)的方法等?;跈C(jī)理與規(guī)則的方法基于機(jī)理與規(guī)則的軌跡規(guī)劃算法原理簡(jiǎn)單、參數(shù)少、易實(shí)現(xiàn),具有較強(qiáng)的魯棒性,并已得到廣泛應(yīng)用,主要包括曲線插值法、人工勢(shì)場(chǎng)法等。曲線插值法通過(guò)事先給定一系列先驗(yàn)路點(diǎn),擬合出一條滿足可行性、舒適性、車輛動(dòng)力學(xué)及其他約束條件的路徑,常用的軌跡規(guī)劃采用的曲線包括多項(xiàng)式曲線、B樣條曲線、回轉(zhuǎn)曲線等。5.3局部軌跡規(guī)劃多項(xiàng)式曲線主要通過(guò)起點(diǎn)與終點(diǎn)的位置、速度和加速度信息以及最小轉(zhuǎn)彎半徑、障礙物尺寸等約束,來(lái)確定擬合曲線的參數(shù)。在上述約束條件下,構(gòu)建一個(gè)n階多項(xiàng)式,在擬合曲線的各個(gè)節(jié)點(diǎn)上滿足對(duì)車輛位姿的要求,同時(shí)在指定時(shí)間間隔內(nèi)保證狀態(tài)信息的連續(xù)性。多項(xiàng)式曲線構(gòu)建流程一般根據(jù)已知信息求解n階多項(xiàng)式方程中的未知量。通過(guò)聯(lián)立方程組的形式得到未知量,也就是說(shuō),如果汽車想要依次通過(guò)起點(diǎn)、終點(diǎn)以及某個(gè)中間點(diǎn),那么每一段末端求解出的邊界位姿信息都可以作為下一階段行駛的初始條件。多項(xiàng)式擬合的階數(shù)一般為3~6階,擬合階數(shù)越高,算法復(fù)雜度越高,收斂速度越慢,并且容易出現(xiàn)過(guò)擬合的情況。通常認(rèn)為,光滑的軌跡更符合車輛實(shí)際運(yùn)動(dòng)狀態(tài)。為確保軌跡的光滑程度,需要軌跡至少具有連續(xù)的速度和加速度,因此軌跡通常至少由時(shí)間的3次多項(xiàng)式函數(shù)定義。5.3局部軌跡規(guī)劃然而,在實(shí)際中經(jīng)常使用高階多項(xiàng)式,尤其是5次多項(xiàng)式來(lái)獲得平滑的軌跡,主要因?yàn)?次多項(xiàng)式能夠解決3次多項(xiàng)式的速度變化不平滑和加速度跳變的情況,而且可以指定軌跡兩端位置、速度和加速度,提高車輛的機(jī)動(dòng)性與行車安全性。5次多項(xiàng)式軌跡規(guī)劃示意圖如圖2所示。將車輛起始點(diǎn)作為坐標(biāo)原點(diǎn),建立直角坐標(biāo)系OXY,其縱向前進(jìn)方向作為X軸正向,Y軸表示車輛的橫向運(yùn)動(dòng)。圖25次多項(xiàng)式軌跡規(guī)劃示意圖5.3局部軌跡規(guī)劃B樣條曲線是一種廣泛應(yīng)用于建模和設(shè)計(jì)等領(lǐng)域的曲線。高次B樣條曲線在滿足曲率連續(xù)要求的同時(shí)還具備局部性,即單個(gè)控制點(diǎn)的變化僅影響局部曲線的形狀,因此非常適合用作軌跡曲線。可利用5次B樣條曲線進(jìn)行換道軌進(jìn)規(guī)劃。車輛換道過(guò)程可以劃為扭角、靠攏、收角和調(diào)整4個(gè)階段。其中在扭角和收角階段內(nèi),駕駛?cè)送ㄟ^(guò)轉(zhuǎn)動(dòng)轉(zhuǎn)向盤(pán)調(diào)整,而在靠攏階段內(nèi),車輛前輪轉(zhuǎn)角幾乎為0。人工勢(shì)場(chǎng)法是一種虛擬力法,通過(guò)模仿引力、斥力下的物體運(yùn)動(dòng)來(lái)規(guī)劃路徑。地點(diǎn)與運(yùn)動(dòng)物體之間的作用假設(shè)為引力,障礙物與運(yùn)動(dòng)物體之間的作用假設(shè)為斥力,那么物體被力場(chǎng)作用向目標(biāo)地點(diǎn)運(yùn)動(dòng),并通過(guò)建立引力場(chǎng)和斥力場(chǎng)的勢(shì)場(chǎng)函數(shù)來(lái)進(jìn)行路徑的尋優(yōu)。5.3局部軌跡規(guī)劃基于數(shù)據(jù)驅(qū)動(dòng)的方法隨著人工智能技術(shù)的不斷發(fā)展,機(jī)器學(xué)習(xí)算法越來(lái)越多地應(yīng)用到智能汽車研究領(lǐng)域中,監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)在解決智能汽車決策規(guī)劃的某些問(wèn)題上展現(xiàn)出了比基于機(jī)理和規(guī)則的傳統(tǒng)軌跡規(guī)則方法更優(yōu)異的性能。該類方法普遍采用端到端(EndtoEnd)架構(gòu),基于訓(xùn)練數(shù)據(jù)建立從狀態(tài)到動(dòng)作的映射模型,極大地簡(jiǎn)化了智能汽車決策規(guī)劃架構(gòu),且在駕駛場(chǎng)景深度遍歷上具有良好的性能,在處理復(fù)雜場(chǎng)景和高級(jí)別自動(dòng)駕駛?cè)蝿?wù)上頗具潛力。從數(shù)據(jù)驅(qū)動(dòng)方法原理角度,可大體將該方法分為基于強(qiáng)化學(xué)習(xí)的方法和基于監(jiān)督學(xué)習(xí)的方法。基于強(qiáng)化學(xué)習(xí)的方法智能汽車的局部路徑規(guī)劃本質(zhì)上是一種復(fù)雜、隨機(jī)、不確定性約束下的動(dòng)態(tài)多目標(biāo)協(xié)同優(yōu)化問(wèn)題,強(qiáng)化學(xué)習(xí)(ReinforcementLearning,RL)作為一種自學(xué)習(xí)算法在處理該類問(wèn)題上具有原理性優(yōu)勢(shì)。5.3局部軌跡規(guī)劃強(qiáng)化學(xué)習(xí)方法建立在馬爾可夫決策過(guò)程(MarkovDecision
Process,MDP)的基礎(chǔ)上,其框架如圖3所示,算法從真實(shí)駕駛環(huán)境或者模擬駕駛數(shù)值調(diào)整強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的參數(shù),從而不斷收斂得到最優(yōu)策略。環(huán)境中獲得狀態(tài)觀測(cè)量,輸出一個(gè)決策量或控制量。根據(jù)算法輸出的結(jié)果,可以從環(huán)境中獲得一個(gè)獎(jiǎng)勵(lì)(或者懲罰)值。在訓(xùn)練的過(guò)程中,可以根據(jù)獎(jiǎng)懲函數(shù)值調(diào)整強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的參數(shù),從而不斷收斂得到的最優(yōu)策略。圖3強(qiáng)化學(xué)習(xí)框架5.3局部軌跡規(guī)劃強(qiáng)化學(xué)習(xí)作為一種端到端的車輛控制方法,可以同時(shí)對(duì)感知、決策、規(guī)劃、控制部分進(jìn)行優(yōu)化,即可以完成綜合駕駛場(chǎng)景的特征表征、良好的時(shí)機(jī)判斷和決策輸出、精確的軌跡規(guī)劃和穩(wěn)定的控制。強(qiáng)化學(xué)習(xí)算法按照其求解最優(yōu)策略的方式可分為值函數(shù)近似法、策略優(yōu)化法、策略梯度法等。在智能汽車決策規(guī)劃中,常用的值函數(shù)近似法包括Sarsa算法、Q學(xué)習(xí)(Q-Learning)、深度Q學(xué)習(xí)網(wǎng)絡(luò)(DeepQ-LearningNetwork,DQN)算法等;常用的策略優(yōu)化法包括置信域策略優(yōu)化(TrustRegionPolicyOptimization,TRPO)算法等;常用的策略梯度法包括深度確定性策略梯度(DeepDeterministicPolicyGradient,DDPC)、近端策略優(yōu)化(ProximalPolicyOptimization,PPO)算法等。5.3局部軌跡規(guī)劃基于監(jiān)督學(xué)習(xí)的方法監(jiān)督學(xué)習(xí)需要通過(guò)大量帶有標(biāo)簽(Labe)的訓(xùn)練數(shù)據(jù)訓(xùn)練監(jiān)督學(xué)習(xí)模型,從而建立從指定輸入到輸出的黑箱映射模型。在智能汽車決策規(guī)劃領(lǐng)域,常用的監(jiān)督學(xué)習(xí)方法包括模仿學(xué)習(xí)(ImitationLearning,IL)和深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetwork,DNN)等。模仿學(xué)習(xí)又稱為示教學(xué)習(xí)(LearningFromDemonstrations),可以分為直接模仿學(xué)習(xí)和間接模仿學(xué)習(xí)。直接模仿學(xué)習(xí)相比于間接模仿學(xué)習(xí)邏輯較為簡(jiǎn)單,本質(zhì)上是采用監(jiān)督學(xué)習(xí)的方式學(xué)習(xí)人類駕駛?cè)嘶蚱渌麄鹘y(tǒng)機(jī)理規(guī)則算法的專家示教軌跡,從而得到狀態(tài)-動(dòng)作映射模型。間接模仿學(xué)習(xí)通常定義為逆向優(yōu)化控制(InverseOptimalControl,IOC)問(wèn)題,通常與強(qiáng)化學(xué)習(xí)結(jié)合轉(zhuǎn)化為逆強(qiáng)化學(xué)習(xí)(InverseReinforcementLearning,IRL)問(wèn)題。5.3局部軌跡規(guī)劃神經(jīng)網(wǎng)絡(luò)模型是監(jiān)督學(xué)習(xí)(SupervisedLearning)中的重要內(nèi)容。通過(guò)建立一定結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,基于人類駕駛?cè)藬?shù)據(jù)或傳統(tǒng)規(guī)劃算法產(chǎn)生的數(shù)據(jù)通過(guò)誤差反向傳播(BackPropagation,BP)和梯度下降(GradientDescent)等方法訓(xùn)練神經(jīng)網(wǎng)絡(luò)參數(shù),從而實(shí)現(xiàn)根據(jù)當(dāng)前交通態(tài)勢(shì)和車輛狀態(tài)進(jìn)行車輛軌跡規(guī)劃與預(yù)測(cè),且基于人類駕駛?cè)藬?shù)據(jù)訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型具有較好的擬人性,便于在決策規(guī)劃架構(gòu)中嵌入駕駛?cè)藗€(gè)性化風(fēng)格,提升智能汽車的駕駛習(xí)性適應(yīng)度。智能汽車軌跡規(guī)劃中常用的神經(jīng)網(wǎng)絡(luò)模型包括BP神經(jīng)網(wǎng)絡(luò)模型、循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)模型等。本章內(nèi)容5.1決策方法概述5.2全局軌跡規(guī)劃5.3局部軌跡規(guī)劃5.4車輛運(yùn)動(dòng)軌跡5.4車輛運(yùn)動(dòng)規(guī)劃動(dòng)態(tài)規(guī)劃算法動(dòng)態(tài)規(guī)劃(DynamicProgramming,DP)算法是運(yùn)籌學(xué)的一個(gè)分支,是求解多階段決策過(guò)程最優(yōu)化問(wèn)題的數(shù)學(xué)方法。各個(gè)階段決策的選取是任意確定的,它依賴于當(dāng)前面臨的狀態(tài),又影響以后的發(fā)展。當(dāng)各個(gè)階段的決策確定后,它們組成一個(gè)決策序列,也就決定了整個(gè)過(guò)程的一條活動(dòng)路線,這樣一個(gè)前后關(guān)聯(lián)、具有鏈狀結(jié)構(gòu)的多階段過(guò)程稱為多階段決策問(wèn)題。動(dòng)態(tài)規(guī)劃在車輛工程技術(shù)領(lǐng)域有著廣泛的應(yīng)用,如“兩檔變速器最優(yōu)換檔規(guī)律”“混合動(dòng)力汽車最優(yōu)能量管理策略”“柵格地圖最優(yōu)路徑搜索”等。其搜索策略主要是將問(wèn)題分成若干個(gè)子問(wèn)題,通過(guò)求解每個(gè)子問(wèn)題的最優(yōu)解,自下而上地組成整個(gè)問(wèn)題的最優(yōu)解。DP算法的求解過(guò)程為逆向?qū)?yōu)、正向求解的過(guò)程,其算法結(jié)構(gòu)主要由3層嵌套的循環(huán)組成:第1層為遍歷搜索過(guò)程的每個(gè)子階段;第2層為遍歷第i個(gè)階段的每個(gè)可能的狀態(tài);第3層為遍歷第i+1個(gè)階段的每個(gè)狀態(tài)。5.4車輛運(yùn)動(dòng)規(guī)劃車輛速度規(guī)劃運(yùn)動(dòng)規(guī)劃作為自動(dòng)駕駛的核心環(huán)節(jié)之一,其功能是生成自動(dòng)駕駛車輛的運(yùn)動(dòng)軌跡,以躲避行駛路線上的障礙物。該軌跡包含了車輛行駛的路徑和以何種速度(加速度)運(yùn)動(dòng)的信息。如上圖所示,1車是本車,2車和3車是交通車。1車前方有障礙物,必須在此前換左車道,2車欲換右車道,3車欲直行。圖4車輛變道示意圖5.4車輛運(yùn)動(dòng)規(guī)劃2車在P1位置時(shí),車輛右前方的投影點(diǎn)F剛好觸碰到1車軌跡,占據(jù)軌跡長(zhǎng)度為0;當(dāng)2車到達(dá)P2位置時(shí),2車在1車軌跡的投影點(diǎn)分別為G1和G2,G1和G2占據(jù)軌跡長(zhǎng)度為L(zhǎng)G;當(dāng)2車到達(dá)P3位置后車輛左后方的投影點(diǎn)H剛好離開(kāi)軌跡,占據(jù)軌跡長(zhǎng)度又變?yōu)?。而3車則在C點(diǎn)剛好與1車的行駛線觸碰,行駛過(guò)一定距離后,3車便一直處在1車行駛線的軌跡上。將1車的行駛軌跡按照時(shí)間與距離A點(diǎn)的行駛路程作為橫坐標(biāo)軸與縱坐標(biāo)軸表示,則上述過(guò)程可以用“占據(jù)軌跡長(zhǎng)度-時(shí)間”二維圖表達(dá),即S-T圖。5.4車輛運(yùn)動(dòng)規(guī)劃圖5S-T圖以2車為例,2車在t3時(shí)刻到達(dá)P1位置時(shí),體現(xiàn)在S-T圖則是F點(diǎn);當(dāng)2車在t4時(shí)刻行駛到P2點(diǎn)時(shí),體現(xiàn)在S-T圖中則是一段長(zhǎng)度為L(zhǎng)G的線段。因此,當(dāng)把時(shí)間離散化后,2車從P1位置到P3位置的軌跡占據(jù)過(guò)程,映射到S-T圖則是一個(gè)二維區(qū)域。只要繞開(kāi)障礙物區(qū)域任意規(guī)劃一條單調(diào)遞增軌跡曲線,即可保證1車安全換道,該軌跡曲線的導(dǎo)數(shù)即為速度序列曲線,因此在S-T圖搜索避道曲線的過(guò)程就是速度規(guī)劃過(guò)程。謝
謝新能源汽車與智能網(wǎng)聯(lián)技術(shù)第6章
智能線控底盤(pán)“十四五”時(shí)期國(guó)家重點(diǎn)出版物出版專項(xiàng)規(guī)劃項(xiàng)目新能源與智能網(wǎng)聯(lián)汽車新技術(shù)系列叢書(shū)中國(guó)機(jī)械工業(yè)教育協(xié)會(huì)“十四五”普通高等教育規(guī)劃教材本章內(nèi)容6.1智能車輛控制6.2PID控制6.3MPC6.4OPC本章內(nèi)容6.1智能車輛控制6.2PID控制6.3MPC6.4OPC6.1車輛智能控制橫向控制智能車輛的分層系統(tǒng)包括感知、決策和控制3個(gè)模塊??刂颇K將感知到的道路信息和決策層面做出的行為判斷落到實(shí)處,使車輛的行為模式盡量符合預(yù)期,其性能直接影響智能車輛智能行為的執(zhí)行能力。如何使車輛的控制能減少來(lái)自外界環(huán)境和自身動(dòng)力學(xué)參數(shù)變化帶來(lái)的影響,并保持控制系統(tǒng)的快速響應(yīng)能力,是需要重點(diǎn)研究的內(nèi)容。智能車輛的運(yùn)動(dòng)控制主要分為橫向控制和縱向控制。智能車輛路徑跟蹤橫向控制系統(tǒng)是指智能車輛的自動(dòng)轉(zhuǎn)向控制,主要表現(xiàn)為車輛的路徑跟隨。根據(jù)期望路徑和當(dāng)前位置或航向角之間的偏差,通過(guò)直接或間接的方法得到該偏差與轉(zhuǎn)向盤(pán)轉(zhuǎn)角之間的函數(shù)關(guān)系,進(jìn)而控制車輛轉(zhuǎn)向盤(pán)轉(zhuǎn)角來(lái)調(diào)整車輛航向。橫向控制的主要目的是跟蹤道路,使車輛始終沿著期望路徑行駛,同時(shí)保證車輛的行駛安全性和乘坐舒適性。6.1車輛智能控制根據(jù)使用的傳感器不同,道路跟蹤系統(tǒng)分為預(yù)瞄式和非預(yù)瞄式參考系統(tǒng)。道路跟蹤參考系統(tǒng)的控制方法歸納為兩種:①基于車輛當(dāng)前位置與期望路徑之間的橫向偏差(或航向偏差)的反饋控制系統(tǒng);②首先通過(guò)期望路徑產(chǎn)生描述車輛運(yùn)動(dòng)的動(dòng)力學(xué)物理量,然后通過(guò)反饋系統(tǒng)進(jìn)行跟蹤。第1種是以車輛前方或當(dāng)前位置的道路曲率作為輸入,根據(jù)車輛與期望路徑之間的橫向偏差或航向偏差為控制目標(biāo),通過(guò)各種反饋控制方法如參數(shù)空間法、增益調(diào)度法、滑??刂品椒ǖ?設(shè)計(jì)對(duì)車輛動(dòng)力學(xué)參數(shù)魯棒的反饋控制系統(tǒng)。該方法理論上能得到較高精度的道路跟蹤效果,但必須提前得到前方道路的曲率信息,因此對(duì)于非標(biāo)準(zhǔn)化的道路(如鄉(xiāng)村道路或自然災(zāi)害下的應(yīng)急物流)上的預(yù)瞄參考系來(lái)說(shuō)難以實(shí)現(xiàn)。6.1車輛智能控制第2種是根據(jù)期望路徑通過(guò)車輛運(yùn)動(dòng)學(xué)模型計(jì)算出車輛運(yùn)動(dòng)的物理控制量,如車輛橫擺角速度,然后利用反饋控制對(duì)輸出結(jié)果進(jìn)行跟蹤。該方法的控制器參數(shù)需要在實(shí)際場(chǎng)景下的實(shí)車試驗(yàn)中進(jìn)行調(diào)整。由于智能車輛行駛速度變化較大,控制參數(shù)的調(diào)整較為困難??v向控制智能車輛速度跟蹤控制系統(tǒng)主要是將期望車速和實(shí)際車速之間的誤差經(jīng)過(guò)計(jì)算得到期望加速度并轉(zhuǎn)化成車輛執(zhí)行系統(tǒng)的控制量。典型的汽車縱向動(dòng)力學(xué)控制系統(tǒng)如圖1所示。圖1典型的汽車縱向動(dòng)力學(xué)控制系統(tǒng)本章內(nèi)容6.1智能車輛控制6.2PID控制6.3MPC6.4OPC6.2PID控制基本原理PID調(diào)節(jié)器及其改進(jìn)型是在工業(yè)過(guò)程控制中最常見(jiàn)的控制器(至今在全球過(guò)程控制中84%仍采用純PID調(diào)節(jié)器,若改進(jìn)型包含在內(nèi)則超過(guò)95%)。它具有結(jié)構(gòu)簡(jiǎn)單、對(duì)模型誤差具有魯棒性及易于操作等優(yōu)點(diǎn)。盡管自1940年以來(lái)許多先進(jìn)控制方法不斷推出,但PID控制器仍被廣泛應(yīng)用于冶金、化工、電力、輕工和機(jī)械等工業(yè)過(guò)程控制中。PID控制的基本方程是:(6-1)式中,e(t)為系統(tǒng)的跟蹤誤差;r(t)為期望輸出值;y(t)為實(shí)際輸出值;KP為比例系數(shù);TI為積分時(shí)間常數(shù);TD為微分時(shí)間常數(shù)。6.2PID控制縱向控制中的PID縱向控制主要表現(xiàn)為車輛的速度跟隨??刂破魍ㄟ^(guò)將期望車速和實(shí)際車速之間的誤差進(jìn)行計(jì)算輸出期望加速度,并利用建立的車輛縱向動(dòng)力學(xué)逆模型將加速度轉(zhuǎn)化成執(zhí)行機(jī)構(gòu)的控制期望值,使得車輛實(shí)際車速準(zhǔn)確、快速地跟隨期望車速,同時(shí)保證駕駛操作過(guò)程的平順性和乘員的舒適性。縱向控制PID的應(yīng)用形式為位置式PID和增量式PID,相較于PID控制的標(biāo)準(zhǔn)型,實(shí)際車輛控制中需要將包含連續(xù)函數(shù)微分的控制方程轉(zhuǎn)化為離散系統(tǒng)差分方程,并考慮積分項(xiàng)的實(shí)現(xiàn)。位置式PID的數(shù)學(xué)模型為(6-2)6.2PID控制在位置式PID中,各調(diào)節(jié)器結(jié)構(gòu)清晰、作用分明,參數(shù)調(diào)整簡(jiǎn)單明了。因此控制器的設(shè)計(jì)和輸出值的測(cè)試都較為方便。但是為計(jì)算第k拍的輸出值a(k),需要儲(chǔ)存e(0)~e(k)的每一份偏差值,當(dāng)k較大時(shí)會(huì)占用很大的內(nèi)存空間,并且增加計(jì)算所需的時(shí)間。為了解決位置式PID的內(nèi)存占用問(wèn)題,可用增量式數(shù)字PID代替。增量式PID的基本數(shù)學(xué)模型為(6-3)增量式PID的特點(diǎn)是其計(jì)算得到的結(jié)果并不是直接的輸出值,而是對(duì)應(yīng)第k拍時(shí)位置式PID調(diào)節(jié)器在這次的實(shí)際值與上一次的實(shí)際值的差量,輸出結(jié)果a(k)需通過(guò)與上一拍的輸出結(jié)果相加得到對(duì)控制系統(tǒng)的實(shí)際輸出量。6.2PID控制橫向控制中的PID智能汽車的橫向控制主要表現(xiàn)在車輛的路徑跟隨,需要根據(jù)車輛的期望路徑與實(shí)際位置或航向角的偏差值之間的函數(shù)關(guān)系,計(jì)算得到車輛轉(zhuǎn)向盤(pán)偏角,使車輛能夠準(zhǔn)確跟隨期望路徑,同時(shí)考慮過(guò)程的舒適性和穩(wěn)定性。橫向控制PID的應(yīng)用形式與縱向控制類似。
以位置式為例,由比例環(huán)節(jié)、
積分環(huán)節(jié)和微分環(huán)節(jié)共同構(gòu)成的基本方程為:(6-4)σ為車輛轉(zhuǎn)向角;比例環(huán)節(jié)中eP為航距偏離誤差,;微分環(huán)節(jié)中eD為航距偏差率,反映汽車相對(duì)于期望軌跡運(yùn)動(dòng)的垂向速率;積分環(huán)節(jié)中eI為航距偏差和,是過(guò)去航距偏離誤差的累計(jì)。6.2PID控制PID控制中各環(huán)節(jié)的控制增益選擇是決定控制效果的關(guān)鍵。比例增益KP用于調(diào)節(jié)系統(tǒng)控制的強(qiáng)度,其增益值的提高通常能改善控制性能,但在增益值較高且開(kāi)始調(diào)節(jié)位置偏移量較大時(shí)易造成系統(tǒng)失去控制,并且使控制器反復(fù)超調(diào)實(shí)際軌跡而跟隨效果不佳。如果微分增益KD太低,則為欠阻尼,會(huì)導(dǎo)致不斷振蕩;如果微分增益KD過(guò)高,則為過(guò)阻尼,需要很長(zhǎng)的時(shí)間來(lái)校正偏移。如果積分增益KI過(guò)低,則對(duì)于動(dòng)態(tài)變化的響應(yīng)速度需要時(shí)間過(guò)長(zhǎng);如果積分增益KI過(guò)高,則控制器會(huì)不穩(wěn)定,這是因?yàn)檎5目刂破鞑▌?dòng)會(huì)被放大。工業(yè)PID控制車輛速度算法一般會(huì)選擇P+I的形式,即僅采用比例項(xiàng)和積分項(xiàng)而不加入微分項(xiàng)。從頻域響應(yīng)角度來(lái)看,微分環(huán)節(jié)隨著頻率的增加,增益會(huì)變大。因此微分環(huán)節(jié)對(duì)量測(cè)噪聲非常敏感,即微分環(huán)節(jié)會(huì)放大噪聲,而實(shí)際應(yīng)用過(guò)程中噪聲通常較大且難以避免,容易對(duì)輸出結(jié)果產(chǎn)生較大影響。實(shí)際車輛測(cè)試也說(shuō)明比例項(xiàng)和積分項(xiàng)的組合形式已經(jīng)可以很好地控制系統(tǒng)。6.2PID控制PID控制的改進(jìn)設(shè)計(jì)前饋控制前饋控制能夠給轉(zhuǎn)向盤(pán)提供一個(gè)可快速響應(yīng)的控制輸入,通常在控制系統(tǒng)中加入前饋補(bǔ)償用于抑制系統(tǒng)靜差。對(duì)于一般的時(shí)滯系統(tǒng)來(lái)說(shuō),設(shè)定值的變動(dòng)會(huì)產(chǎn)生較大的滯后才能反映在被控變量上,從而產(chǎn)生合理的調(diào)節(jié)。而前饋控制系統(tǒng)是根據(jù)擾動(dòng)或給定值的變化按補(bǔ)償原理來(lái)工作的控制系統(tǒng),其特點(diǎn)是當(dāng)擾動(dòng)產(chǎn)生后,被控變量還未變化以前,根據(jù)擾動(dòng)作用的大小進(jìn)行控制,以補(bǔ)償擾動(dòng)作用對(duì)被控變量的影響,使被控變量不會(huì)因擾動(dòng)作用或給定值變化而產(chǎn)生偏差,它相對(duì)反饋控制能更加及時(shí)地進(jìn)行控制,并且不受系統(tǒng)滯后的影響。前饋控制在PID中較為典型的例子就是車輛遇到有坡度的道路,在PID計(jì)算輸出的扭矩中再加入一個(gè)前饋補(bǔ)償值來(lái)補(bǔ)償斜坡路上車輛的重力分量值。6.2PID控制抗飽和積分一般需要在PID后加上飽和極限和一旦監(jiān)測(cè)到達(dá)到積分上限就使積分項(xiàng)的值自動(dòng)減少的抗飽和積分措施。當(dāng)汽車由于外界因素較長(zhǎng)時(shí)間位于偏差較大的位置時(shí),隨著時(shí)間的增加,每次累積較大的誤差,很容易造成積分飽和并產(chǎn)生較大的過(guò)沖,而且當(dāng)誤差變?yōu)樨?fù)時(shí),其過(guò)沖仍維持一段時(shí)間后才恢復(fù)正常的情形,此時(shí)車輛控制處于較長(zhǎng)時(shí)間的超調(diào)狀態(tài),進(jìn)而造成較長(zhǎng)時(shí)間內(nèi)對(duì)于反向調(diào)節(jié)的反應(yīng)遲緩。(6-5)以定速巡航功能為例,對(duì)司機(jī)設(shè)定的巡航速度值進(jìn)行PI控制,如式(6-5)所示,根據(jù)汽車動(dòng)力學(xué)模型計(jì)算合適的轉(zhuǎn)矩值提供給發(fā)動(dòng)機(jī)。本章內(nèi)容6.1智能車輛控制6.2PID控制6.3MPC6.4OPC6.3MPCMPC概述模型預(yù)測(cè)控制(ModelPredictiveControl,MPC)理論作為一種有較強(qiáng)工業(yè)應(yīng)用背景的優(yōu)化控制算法,具有控制性能好、魯棒性強(qiáng)、有效處理約束等特點(diǎn),因而在石油、化工、電力等領(lǐng)域均有較為廣泛的應(yīng)用。在智能汽車控制中,MPC在處理約束和求解最優(yōu)控制序列方面都有較為明顯的應(yīng)用。模型預(yù)測(cè)控制器也稱作滾動(dòng)時(shí)域控制器,其基本原理是根據(jù)控制系統(tǒng)的動(dòng)力學(xué)模型,考慮系統(tǒng)中各執(zhí)行器的動(dòng)態(tài)特性約束和狀態(tài)特性約束,預(yù)測(cè)未來(lái)一段時(shí)間內(nèi)系統(tǒng)的輸出行為,進(jìn)而求解帶約束的最優(yōu)控制問(wèn)題,從而得到最優(yōu)的控制輸入,使未來(lái)一段時(shí)間內(nèi)的跟蹤誤差最小。MPC的控制流程可以概括為3個(gè)環(huán)節(jié):模型預(yù)測(cè)、滾動(dòng)優(yōu)化和反饋調(diào)節(jié)。模型預(yù)測(cè)環(huán)節(jié)是指根據(jù)系統(tǒng)狀態(tài)方程預(yù)測(cè)系統(tǒng)未來(lái)動(dòng)態(tài)。6.3MPC在MPC算法中,需要一個(gè)描述對(duì)象動(dòng)態(tài)行為的模型,這個(gè)模型的作用是預(yù)測(cè)系統(tǒng)未來(lái)的動(dòng)態(tài),即能夠根據(jù)系統(tǒng)k時(shí)刻的狀態(tài)和控制輸入,預(yù)測(cè)到k+1時(shí)刻的輸出。在這里k時(shí)刻的輸入正是用來(lái)控制系統(tǒng)k+1時(shí)刻的輸出,使其最大限度地接近k+1時(shí)刻的期望值。所以此環(huán)節(jié)強(qiáng)調(diào)的是該模型的預(yù)測(cè)作用,而不是模型的形式圖2MPC的控制系統(tǒng)6.3MPC滾動(dòng)優(yōu)化環(huán)節(jié)中,系統(tǒng)通過(guò)當(dāng)前的測(cè)量信息在線求解一個(gè)有限時(shí)域的開(kāi)環(huán)優(yōu)化問(wèn)題。因?yàn)橥獠扛蓴_和模型失配的影響,系統(tǒng)的預(yù)測(cè)輸出和實(shí)際輸出存在著偏差,如果能測(cè)到這個(gè)偏差,那么能根據(jù)這個(gè)測(cè)量到的偏差值在線求解下一時(shí)刻的控制輸入,即優(yōu)化掉這個(gè)偏差值。若將求解的控制輸出的全部序列作用于系統(tǒng),那么k+1時(shí)刻的測(cè)量值不能影響控制動(dòng)作,也就是說(shuō)測(cè)量值所包括的外部干擾或模型誤差信息得不到有效利用。所以將每個(gè)采樣時(shí)刻的優(yōu)化解的第一個(gè)分量作用于系統(tǒng),在下一個(gè)采樣時(shí)刻,將新個(gè)時(shí)刻的優(yōu)化解的第一個(gè)分量作用于系統(tǒng),這樣重復(fù)至無(wú)窮。因此,預(yù)測(cè)控制不是采用一個(gè)不變的全局優(yōu)化目標(biāo),而是采用時(shí)間向前滾動(dòng)式的有限時(shí)域優(yōu)化策略,這意味著優(yōu)化過(guò)程不是一次離線進(jìn)行的,而是反復(fù)在線進(jìn)行的。6.3MPC反饋調(diào)節(jié)環(huán)節(jié)中,系統(tǒng)將最優(yōu)解序列的第一個(gè)分量,即下一時(shí)刻的最優(yōu)輸入量作用于被控系統(tǒng)。雖然在求解優(yōu)化問(wèn)題中MPC采用的是開(kāi)環(huán)優(yōu)化的方法,但其k+1時(shí)刻的輸出值始終來(lái)源于k時(shí)刻的控制輸出量和狀態(tài)量,并作用于修正系統(tǒng)偏差,因此MPC整體為閉環(huán)控制。MPC在車輛控制中的應(yīng)用智能車輛的軌跡跟隨包括橫向和縱向控制,都可以通過(guò)MPC實(shí)現(xiàn)。以圖3為例,假定汽車從坐標(biāo)原點(diǎn)駛出,期望軌跡和實(shí)際軌跡如圖所示,實(shí)際軌跡為離散取樣點(diǎn)擬合的曲線。針對(duì)每個(gè)取樣點(diǎn),模型預(yù)測(cè)控制器都規(guī)劃了未來(lái)N步的最佳輸入量,預(yù)測(cè)最優(yōu)軌跡如圖3所示。由于車輛本身和路面條件的約束,預(yù)測(cè)的最優(yōu)路徑與實(shí)際路徑始終有差異。圖3MPC縱向控制的應(yīng)用6.3MPCMPC理論模型建立模型預(yù)測(cè)控制器,首先需要建立車輛縱橫向耦合的車輛運(yùn)動(dòng)模型,如圖4所示,包括車輛的動(dòng)力學(xué)模型、轉(zhuǎn)向盤(pán)轉(zhuǎn)角模型和汽車加速度控制模型。根據(jù)建立的物理學(xué)公式,對(duì)車輛的模型和傳感器輸入的參量進(jìn)行離散化后可得到離散化系統(tǒng)模型為:圖4車輛運(yùn)動(dòng)模型(6-6)式中,x(t)為t時(shí)刻的系統(tǒng)預(yù)測(cè)輸出量;y(t)為t時(shí)刻的理論輸出量;u(t)為系統(tǒng)的控制輸入;C為用于最優(yōu)化求解的Hessian矩陣。6.3MPC為了使智能汽車路徑和速度的跟隨過(guò)程中路徑誤差和速度誤差最小,建立如下目標(biāo)函數(shù),即:(6-7)式中,在標(biāo)準(zhǔn)MPC描述里,Δut=[Δut,t,…,Δut+Hc-1,t]表示t時(shí)刻下的優(yōu)化控制輸入,yt+i,t表示t時(shí)刻時(shí)t+i時(shí)刻的預(yù)測(cè)輸出。Hp和Hc分別代表了預(yù)測(cè)步長(zhǎng)和控制步長(zhǎng)。當(dāng)步長(zhǎng)i滿足Hp<i<Hc時(shí),控制輸入為定值,即Δu=0,?i>Hc。Q和R分別代表各部分的權(quán)重系數(shù)矩陣。每一個(gè)步長(zhǎng)之內(nèi),控制器在約束條件下求解式(6-9)所示的優(yōu)化問(wèn)題,根據(jù)前一時(shí)刻的控制輸入ut-1求解得到Δut=[Δut,t,…,Δut+Hc-1,t],并將預(yù)測(cè)的第一個(gè)時(shí)刻的最優(yōu)控制增量Δut,t計(jì)算出最優(yōu)控制輸入u(t)=u(t-1)+Δut,t。(6-8)6.3MPC二次規(guī)劃問(wèn)題模型預(yù)測(cè)控制器的最優(yōu)化求解與最終建立的目標(biāo)函數(shù)有很大關(guān)系,由于上述優(yōu)化問(wèn)題的優(yōu)化目標(biāo)是一個(gè)二次函數(shù),因此可以看成是一個(gè)二次規(guī)劃(QuadraticProgramming,QP)問(wèn)題進(jìn)行求解。(6-9)式(6-9)為二次規(guī)劃的基本型,目標(biāo)是求解函數(shù)q(x)在限制條件下的最小值。設(shè)變量個(gè)數(shù)為n,限制條件數(shù)量m,則c是一個(gè)n維向量,b為一個(gè)m維向量,A為一個(gè)m×n矩陣。G是n×n的Hessian矩陣,G是否正定決定二次規(guī)劃是否為凸二次規(guī)劃。二次規(guī)劃的求解方法有拉格朗日(Lagrange)法、Lemke方法、內(nèi)點(diǎn)法等。具有線性約束的二次規(guī)劃可以在MATLAB中調(diào)用函數(shù)x=quadprog(G,c,A,b,Aeq,Beq)求解。6.3MPC模型預(yù)測(cè)控制器實(shí)現(xiàn)車輛縱向控制自適應(yīng)巡航控制(AdaptiveCruiseControl,ACC)又稱主動(dòng)巡航控制,其在傳統(tǒng)定速巡航控制基礎(chǔ)上結(jié)合了車距保持功能,利用車載雷達(dá)探測(cè)前方行駛環(huán)境,通過(guò)控制節(jié)氣門(mén)和制動(dòng)系統(tǒng)自動(dòng)調(diào)整車速,提高駕駛舒適性和安全性。ACC的基本功能示意圖如圖5所示。圖5ACC的基本功能示意圖6.3MPCACC的基本功能包括速度控制(定速巡航)和距離控制(車距保持)。為了保證行車的安全性,設(shè)定引導(dǎo)車輛和跟隨車輛之間的安全距離Dsafe=Ddef+TgapVego。其中,Ddef和Tgap為設(shè)定的最小距離和時(shí)間間隔,Vego為跟隨車輛的行車速度。當(dāng)跟隨車輛與引導(dǎo)車輛的相對(duì)距離大于該車速時(shí)的安全距離時(shí),跟隨車輛進(jìn)入定速巡航模式,車速保持在巡航速度Vset;當(dāng)跟隨車輛與引導(dǎo)車輛的相對(duì)距離小于該車速時(shí)的安全距離時(shí),車輛進(jìn)入距離控制模式,跟隨車輛依據(jù)兩車的相對(duì)速度和距離制定合適的減速策略,使車輛在保證舒適性和控制性的情況下盡快使相對(duì)距離Drel滿足關(guān)系Drel≥Dsafe。
距離控制根據(jù)行車工況的不同,分為穩(wěn)態(tài)跟車、前車急減速、前車急加速、
旁車切人、
前車切出、
遠(yuǎn)處接近前車、主動(dòng)避撞7種模式。
本章內(nèi)容6.1智能車輛控制6.2PID控制6.3MPC6.4OPC6.4OPC穩(wěn)態(tài)預(yù)瞄動(dòng)態(tài)校正假說(shuō)“預(yù)瞄-跟隨”理論描述了系統(tǒng)中參考未來(lái)輸入信息而進(jìn)行的控制方法,從系統(tǒng)角度來(lái)看此系統(tǒng)可理解為是由預(yù)瞄器和跟隨器兩者串聯(lián)組成的系統(tǒng)。最優(yōu)預(yù)瞄控制(OptimalPreviewControl,OPC)的理論依據(jù)是駕駛?cè)笋{駛車輛過(guò)程中,通過(guò)對(duì)道路前方信息進(jìn)行預(yù)估,使得車輛實(shí)際軌跡與理論軌跡的偏差最小,從而得到一個(gè)最優(yōu)的轉(zhuǎn)向盤(pán)轉(zhuǎn)角輸入。駕駛?cè)朔€(wěn)態(tài)預(yù)瞄動(dòng)態(tài)校正假說(shuō)是在“預(yù)瞄-跟隨”理論的基礎(chǔ)上,針對(duì)汽車動(dòng)力學(xué)控制強(qiáng)非線性的特點(diǎn),同時(shí)借鑒廣義預(yù)測(cè)控制理論的思想而提出的應(yīng)用于駕駛?cè)瞬倏v行為建模的理論。其基本內(nèi)容為:駕駛?cè)送耆闷噭?dòng)力學(xué)穩(wěn)態(tài)響應(yīng)特性進(jìn)行可行預(yù)期軌跡點(diǎn)的預(yù)測(cè),并由此進(jìn)行理想預(yù)期軌跡的決策;
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版中英文二手房買賣合同范本
- 2024年物業(yè)管理服務(wù)采購(gòu)合同
- 17 爬天都峰 說(shuō)課稿-2024-2025學(xué)年語(yǔ)文四年級(jí)上冊(cè)統(tǒng)編版
- 專業(yè)繪畫(huà)合作合同2024版版B版
- 19 懷疑與學(xué)問(wèn)2024-2025學(xué)年九年級(jí)語(yǔ)文上冊(cè)同步說(shuō)課稿(河北專版)
- 【呼吸內(nèi)科】為了患者健康的呼吸
- 福建省南平市武夷山上梅中學(xué)2021-2022學(xué)年高二化學(xué)上學(xué)期期末試題含解析
- 2025年度國(guó)際工程項(xiàng)目承包合同5篇
- 2024年魚(yú)池生態(tài)旅游租賃合同3篇
- 七夕運(yùn)動(dòng)情緣盛宴
- 綿陽(yáng)市高中2022級(jí)(2025屆)高三第二次診斷性考試(二診)歷史試卷(含答案)
- 四年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)及答案
- 期末測(cè)試卷(試題)-2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)滬教版
- GB/T 6672-2001塑料薄膜和薄片厚度測(cè)定機(jī)械測(cè)量法
- 挖掘機(jī)專業(yè)詞語(yǔ)中英對(duì)照表2014-12-04
- 中考必備高頻詞匯2600詞(單詞版)
- SSB變槳系統(tǒng)的基礎(chǔ)知識(shí)
- GB∕T 27552-2021 金屬材料焊縫破壞性試驗(yàn) 焊接接頭顯微硬度試驗(yàn)
- 外貿(mào)中常見(jiàn)付款方式的英文表達(dá)及簡(jiǎn)要說(shuō)明
- 抗壓偏壓混凝土柱承載力計(jì)算表格
- 初次申領(lǐng)《南京市建筑業(yè)企業(yè)信用管理手冊(cè)(電子版)》辦事
評(píng)論
0/150
提交評(píng)論