




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
智能網(wǎng)聯(lián)汽車技術基礎項目三智能網(wǎng)聯(lián)汽車決策規(guī)劃決策規(guī)劃整體認知任務一任務二決策規(guī)劃方法認知決策規(guī)劃整體認知1學習目標
1.掌握決策規(guī)劃的概念2.掌握決策規(guī)劃的分類和要求3.了解路徑規(guī)劃的一般步驟智能網(wǎng)聯(lián)汽車決策規(guī)劃理論知識一、決策規(guī)劃的概念二、決策規(guī)劃的分類三、決策規(guī)劃的要求智能網(wǎng)聯(lián)汽車決策規(guī)劃1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃一、決策規(guī)劃的概念決策規(guī)劃是智能網(wǎng)聯(lián)汽車自動駕駛的關鍵部分之一,它首先融合多傳感信息,對周圍可能存在障礙物的目標狀態(tài)進行預測,然后根據(jù)駕駛需求進行行為決策,規(guī)劃出兩點間多條可選安全路徑,并在這些路徑中規(guī)劃選取一條最優(yōu)的路徑作為車輛行駛軌跡。1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃決策規(guī)劃的基本效果如圖3-1-1所示。和人類駕駛員一樣,機器在做駕駛決定時需要回答幾個問題。我在哪兒?周圍的環(huán)境怎么樣?接下來會發(fā)生什么?我該做什么?這是一個基于信息感知進行決策的過程,具體如何決定需要自動駕駛的決策層完成。圖3-1-1自動駕駛決策規(guī)劃效果圖1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃決策層包括環(huán)境認知和決策規(guī)劃兩部分,主要完成工作具體來說可分為兩個步驟:第一步認知理解,即依據(jù)感知層不同傳感器采集的信息,通過高精度地圖對智能網(wǎng)聯(lián)汽車自身的位置精確定位,同時對車輛周圍的環(huán)境信息和目標狀態(tài)進行精確感知;第二步?jīng)Q策規(guī)劃包含目標狀態(tài)預測、行為決策和路徑規(guī)劃,依據(jù)對智能網(wǎng)聯(lián)汽車周圍的目標狀態(tài)精確感知,準確預測未來可能發(fā)生的情況,對下一步行為進行正確判斷和決策,規(guī)劃并選擇適宜的路徑達到目標,如圖3-1-2所示。1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃圖3-1-2決策層實施步驟1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃二、決策規(guī)劃的分類從軌跡決策的角度考慮,根據(jù)事先對環(huán)境信息的已知程度,可把路徑規(guī)劃劃分為基于先驗完全信息的全局路徑規(guī)劃和基于傳感器信息的局部路徑規(guī)劃。1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃全局路徑規(guī)劃是全局環(huán)境已知,按照一定的算法搜尋一條最優(yōu)或者近似最優(yōu)的無碰撞路徑。例如,從上海到北京有很多條路,規(guī)劃出一條最優(yōu)行駛路線,即為全局規(guī)劃,如圖3-1-3所示。圖3-1-3全局路徑規(guī)劃(1)全局路徑規(guī)劃1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃局部路徑規(guī)劃是對環(huán)境局部未知或完全未知,隨著自主車輛的運動,通過傳感器為自主車輛提供有用的信息,從而能夠確定出障礙物和目標點的位置,規(guī)劃出一條由起始點到目標點的路徑,如圖3-1-4所示。例如,在全局規(guī)劃好的上海到北京的那條路線上會有其他車輛或者障礙物,想要避過這些障礙物或者車輛,需要轉向調整車道,這就是局部路徑規(guī)劃。圖3-1-4局部路徑規(guī)劃(2)局部路徑規(guī)劃1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃從獲取障礙物信息是靜態(tài)或是動態(tài)的角度看,全局路徑規(guī)劃屬于靜態(tài)規(guī)劃(又稱離線規(guī)劃),局部路徑規(guī)劃屬于動態(tài)規(guī)劃(又稱在線規(guī)劃)。全局路徑規(guī)劃需要掌握所有的環(huán)境信息,是高精度地圖下的車道級尋徑問題,解決的是起點到終點的最佳道路行駛序列;局部路徑規(guī)劃只需要由傳感器實時采集環(huán)境信息,了解環(huán)境地圖信息,然后確定出所在地圖的位置及其局部的障礙物分布情況,從而可以選出從當前結點到某一子目標結點的最優(yōu)路徑。1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃根據(jù)所研究環(huán)境的信息特點,路徑規(guī)劃還可分為離散域范圍內的路徑規(guī)劃問題和連續(xù)域范圍內的路徑規(guī)劃問題。離散域范圍內的路徑規(guī)劃問題屬于一維靜態(tài)優(yōu)化問題,相當于環(huán)境信息簡化后的路線優(yōu)化問題;而連續(xù)域范圍內的路徑規(guī)劃問題則是連續(xù)性多維動態(tài)環(huán)境下的問題。1、決策規(guī)劃整體認知智能網(wǎng)聯(lián)汽車決策規(guī)劃三、決策規(guī)劃的要求決策規(guī)劃是自動駕駛進行行為決策和路徑規(guī)劃過程,該過程要完全符合人類對于駕駛性的預期,并且滿足安全、舒適、高效等性能和品質的要求。具體表現(xiàn)在以下幾個方面:(1)車輛應該在自動避開所有障礙物的前提下,到達指定的目的地。(2)車輛安全到達目的地所用的時間最短,路程最短。(3)采用的路徑簡單可靠,以便簡單實現(xiàn)對無人車的控制。(4)車輛行駛的路徑盡量不重復或者少重復。(5)車輛選用合適的行駛策略,減少車輛的能量消耗。學習小結1.決策規(guī)劃是智能網(wǎng)聯(lián)汽車自動駕駛的關鍵部分之一,它首先融合多傳感信息,對周圍可能存在障礙物的目標狀態(tài)進行預測,然后根據(jù)駕駛需求進行行為決策,規(guī)劃出兩點間多條可選安全路徑,并在這些路徑中規(guī)劃選取一條最優(yōu)的路徑作為車輛行駛軌跡。2.從軌跡決策的角度考慮,根據(jù)事先對環(huán)境信息的已知程度,可把路徑規(guī)劃劃分為基于先驗完全信息的全局路徑規(guī)劃和基于傳感器信息的局部路徑規(guī)劃。3.決策規(guī)劃要完全符合人類對于駕駛性的預期,并且滿足安全、舒適、高效等性能和品質要求。智能網(wǎng)聯(lián)汽車決策規(guī)劃決策規(guī)劃方法認知2學習目標
1.了解目標狀態(tài)預測的常用方法2.了解行為決策的常用方法3.了解路徑規(guī)劃的常用算法和一般步驟智能網(wǎng)聯(lián)汽車決策規(guī)劃理論知識一、目標狀態(tài)預測二、行為決策三、路徑規(guī)劃四、路徑規(guī)劃的一般步驟智能網(wǎng)聯(lián)汽車決策規(guī)劃2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃一、目標狀態(tài)預測目標狀態(tài)預測,是對智能網(wǎng)聯(lián)汽車周邊的目標(人、車、物等)進行未來比較短時間內的行為和軌跡預測,該預測信息可附加在目標感知結果中,與環(huán)境感知信息一并發(fā)送給下層的決策端,為汽車安全決策規(guī)劃提供信息依據(jù)。目標狀態(tài)預測主要解決兩大類問題:一是目標的行為預測(包括靜止、左行、右行或直行等);二是目標的軌跡預測(包含位置、時間戳、速度、角度、加速度等信息)。通過辨識目標的行為和擬合運動軌跡,實現(xiàn)對目標的狀態(tài)預測。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃當前主流的目標狀態(tài)預測方法主要包括三種:(1)基于運動模型的卡爾曼濾波方法(2)基于馬爾可夫鏈的預測方法(3)基于數(shù)據(jù)的神經(jīng)網(wǎng)絡方法2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(1)基于運動模型的卡爾曼濾波方法基于卡爾曼濾波的目標狀態(tài)預測算法,考慮了目標運動狀態(tài)的不確定性變化,在恒速模型中實現(xiàn)了目標的運動軌跡預測。這種預測方法的優(yōu)點在于計算速度快,但預測的前提是假設目標的速度與行駛方向不變,這與實際的情況并不相符,所以實際應用效果并不理想。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(2)基于馬爾可夫鏈的預測方法馬爾可夫鏈是指一個滿足馬爾可夫性質的隨機過程,馬爾可夫性質是指t+k時刻的狀態(tài)與t時刻的狀態(tài)有關而與t時刻以前的狀態(tài)無關。該方法實現(xiàn)了對目標狀態(tài)的高效預測。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(3)基于數(shù)據(jù)的神經(jīng)網(wǎng)絡方法神經(jīng)網(wǎng)絡方法主要基于對大數(shù)據(jù)的收集和分析,根據(jù)道路采集的環(huán)境信息和跟蹤目標的運動信息,預測周圍人、車以及物的運動位置。與人的大腦類似,神經(jīng)網(wǎng)絡具有很強的自學性和記憶性,對于復雜的非線性系統(tǒng)具有很強的函數(shù)逼近能力,其特性正好可以解決目標狀態(tài)預測上傳統(tǒng)方法所不能解決的問題。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃二、行為決策智能網(wǎng)聯(lián)汽車行為決策系統(tǒng)指通過傳感器感知得到交通環(huán)境信息,考慮周邊環(huán)境、動靜態(tài)障礙物、車輛匯入以及讓行規(guī)則等,與智能駕駛庫中的經(jīng)驗知識等進行匹配,進而選擇適合當前交通環(huán)境下的駕駛策略。這種駕駛策略一般指的是在某個特定狀態(tài)下,是變道、跟隨還是超車等宏觀意義上的駕駛行為。行為決策的目標主要是保證智能網(wǎng)聯(lián)汽車可以像人類一樣產生安全的駕駛行為,滿足車輛安全性能、遵守交通法規(guī)等原則。智能網(wǎng)聯(lián)汽車的行為決策方法包括基于規(guī)則的行為決策方法和基于強化學習的行為決策方法。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(1)基于規(guī)則的行為決策方法智能網(wǎng)聯(lián)汽車基于規(guī)則的行為決策方法是最常用的。如圖3-2-1所示,該方法主要是將無人車的運動行為進行劃分,根據(jù)當前任務路線、交通環(huán)境、交通法規(guī)以及駕駛規(guī)則知識庫等建立行為規(guī)則庫,對不同的環(huán)境狀態(tài)進行行為決策邏輯推理,輸出駕駛行為,同時接受運動規(guī)劃層對當前執(zhí)行情況的反饋情況進行實時動態(tài)調整。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃圖3-2-1基于規(guī)則的行為決策方法架構2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃有限狀態(tài)機是一種離散的數(shù)學模型,用來研究有限個狀態(tài)以及狀態(tài)之間的轉移。其主要包括有限狀態(tài)集合、輸入集合和狀態(tài)轉移規(guī)則集合三部分。狀態(tài)、轉移、事件和動作是有限狀態(tài)機的四大要素。以基于規(guī)則的超車行為決策為例,主要分為頂層狀態(tài)機和超車頂層狀態(tài)下的子狀態(tài)機,如圖3-2-2所示。圖3-2-2基于規(guī)則的超車行為決策2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃在超車頂層狀態(tài)機下設置了超車子狀態(tài)機,對超車過程中不同駕駛階段下的轉換進行邏輯建模。超車行為決策與人類駕駛行為類似,在超車子狀態(tài)機下分別包括左換道準備、左換道、并行超越等。左換道準備為超車子狀態(tài)機的默認初始狀態(tài),在左右換向狀態(tài)下,智能網(wǎng)聯(lián)汽車將開啟相應的轉向信號燈,產生一定的轉向偏移,以此來提示后方車輛。同時,智能網(wǎng)聯(lián)汽車會根據(jù)其左后或右后車輛是否避讓的狀態(tài)來決定是否進行下一步的超車計劃。并行超越主要用于車輛進行超車的階段,指導車輛在超車過程中的速度變化、方向盤角度變化等,并指導車輛在超車完成后及時返回原來的車道,減少在整個超車過程中的安全風險。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(2)基于強化學習的行為決策方法基于強化學習算法的行為決策方法主要是利用各種學習算法來進行決策,利用智能網(wǎng)聯(lián)汽車配備的各種傳感器,來感知周邊的環(huán)境信息,傳遞給強化學習決策系統(tǒng),此時強化學習決策系統(tǒng)的作用就相當于人腦,來對各類信息進行分析和處理,并結合經(jīng)驗來對無人駕駛汽車做出行為決策。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃基于強化學習的行為決策方法近年來發(fā)展迅速,主要有馬爾可夫決策、神經(jīng)網(wǎng)絡學習算法等。這些行為決策方法可以通過大量的數(shù)據(jù)更容易覆蓋全部的工況以及不同的場景。如自動駕駛汽車公司W(wǎng)aymo就通過模擬駕駛及道路測試來獲取了大量的數(shù)據(jù)對其基于學習算法的行為決策系統(tǒng)進行訓練,使得該系統(tǒng)對物體的檢測性能得到了極大地提高,還可以對障礙物進行語義理解等。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃三、路徑規(guī)劃路徑規(guī)劃是智能網(wǎng)聯(lián)汽車實現(xiàn)自主駕駛的基礎,其作用是在當前工作環(huán)境中按照某種性能指標搜索出一條從起點到終點的最優(yōu)或次優(yōu)路徑。嚴格意義上講,路徑規(guī)劃是將行為決策的宏觀指令解釋成一條帶有時間信息的軌跡曲線,包括軌跡規(guī)劃和速度規(guī)劃。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃根據(jù)車輛導航系統(tǒng)的研究歷程,智能網(wǎng)聯(lián)汽車路徑規(guī)劃算法可分為靜態(tài)路徑規(guī)劃算法和動態(tài)路徑算法。靜態(tài)路徑規(guī)劃是以物理地理信息和交通規(guī)則等條件為約束來尋求最短路徑,靜態(tài)路徑規(guī)劃算法已日趨成熟,相對比較簡單,但對于實際的交通狀況來說,其應用意義不大。動態(tài)路徑規(guī)劃是在靜態(tài)路徑規(guī)劃的基礎上,結合實時的交通信息對預先規(guī)劃好的最優(yōu)行車路線進行適時的調整直至到達目的地最終得到最優(yōu)路徑。下面介紹幾種常見的車輛路徑規(guī)劃方法。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(1)A*算法A*算法是一種啟發(fā)式搜索算法,其是由Hart、Nilsson、Raphael等人率先提出,算法通過引入估價損失函數(shù),加快算法收斂速度,提高了局部搜索算法的搜索精度,進而得到廣泛的應用,是當今較為流行的最短路算法。同時,A*算法運算所消耗的存儲空間少于Dijkstra算法。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃如圖3-2-3所示,其會根據(jù)柵格地圖上的障礙物信息(非白色柵格),建立從起點到目標點的路徑評估函數(shù)表達式,并依據(jù)尋找最少的損失函數(shù)為依據(jù),規(guī)劃最短可行路徑。圖3-2-3A*算法最短路徑尋優(yōu)柵格效果圖2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(2)Dijkstra算法Dijkstra(迪杰斯特拉)算法是經(jīng)典的最短路算法的算法之一,由E.W.Dijkstra在20世紀60年代提出。此外,其他的較常用的規(guī)劃算法還包括Floyd算法、雙向搜索算法、蟻群算法、基于分層路網(wǎng)的搜索算法、神經(jīng)網(wǎng)絡、實時啟發(fā)式搜索算法、模糊控制以及遺傳算法及等,需要根據(jù)不同的實際需求設計和優(yōu)化不同的規(guī)劃算法。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃如圖3-2-4所示,該算法適用于計算道路權值均為非負的最短路徑問題,能夠給出柵格圖中某一節(jié)點到其他所有節(jié)點的最短路徑,以搜索準確,思路清晰見長。相對的,由于輸入為大型稀疏矩陣限定性,又具有占用空間大,耗時長等缺陷。圖3-2-4Dijkstra權值計算策略示意圖2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃四、路徑規(guī)劃的一般步驟在目標狀態(tài)預測之后,需要對智能網(wǎng)聯(lián)汽車路徑進行規(guī)劃。路徑規(guī)劃的基本思路是:把需要解決的最短時間、最短距離、最少花費等問題轉變成求解最短路徑,因為只有找到了最短路徑,以上問題都將得到解決。其一般步驟主要包括環(huán)境建模、路徑搜索和路徑平滑三個環(huán)節(jié)。環(huán)境建模路徑搜索路徑平滑2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(1)環(huán)境建模。環(huán)境建模是路徑規(guī)劃的重要環(huán)節(jié),目的是建立一個便于計算機進行路徑規(guī)劃所使用的環(huán)境模型,即將實際的物理空間抽象成算法能夠處理的抽象空間,實現(xiàn)相互間的映射。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(2)路徑搜索。路徑搜索階段是在環(huán)境模型的基礎上應用相應算法尋找一條行走路徑,使預定的性能函數(shù)獲得最優(yōu)值。2、決策規(guī)劃方法認知智能網(wǎng)聯(lián)汽車決策規(guī)劃(3)路徑平滑。通過相應算法搜索出的路徑并不一定是一條運動體可以行走的可行路徑,需要作進一步處理與平滑才能使其成為一條實際可行的路徑。對于離散域范圍內的路徑規(guī)劃問題,或者在環(huán)境建?;蚵窂剿阉髑凹航?jīng)做好路徑可行性分析的問題,路徑平滑環(huán)節(jié)可以省去。學習小結1.目標狀態(tài)預測,是對智能網(wǎng)聯(lián)汽車周邊的目標(人、車、物等)進行未來比較短時間內的行為和軌跡預測,該預測信息可附加在目標感知結果中,與環(huán)境感知信息一并發(fā)送給下層的決策端,為汽車安全決策規(guī)劃提供信息依據(jù)。當前主流的目標狀態(tài)預測方法包括運動模型的卡爾曼濾波法、基于馬爾可夫鏈的預測法和基于數(shù)據(jù)的神經(jīng)網(wǎng)絡法;2.智能網(wǎng)聯(lián)汽車行為決策系統(tǒng)指通過傳感器感知得到交通環(huán)境信息,考慮周邊環(huán)境、動靜態(tài)障礙物、車輛匯入以及讓行規(guī)則等,與智能駕駛庫中的經(jīng)驗知識等進行匹配,進而選擇適合當前交通環(huán)境下的駕駛策略。智能網(wǎng)聯(lián)汽車的行為決策方法包括基于規(guī)則的行為決策方法和基于強化學習的行為決策方法。具體包括有限狀態(tài)機、馬爾可夫決策、神經(jīng)網(wǎng)絡學習算法等。3.路徑規(guī)劃是智能網(wǎng)聯(lián)汽車實現(xiàn)自主駕駛的基礎,其作用是在當前工作環(huán)境中按照某種性能指標搜索出一條從起點到終點的最優(yōu)或次優(yōu)路徑。嚴格意義上講,路徑規(guī)劃是將行為決策的宏觀指令解釋成一條帶有時間信息的軌跡曲線,包括軌跡規(guī)劃和速度規(guī)劃。常見的車輛路徑規(guī)劃方法包括A*算法、Dijkstra算法、Floyd算法、雙向搜索算法、蟻群算法等。智能網(wǎng)聯(lián)汽車決策規(guī)劃習題一、不定項選擇題1.智能網(wǎng)聯(lián)汽車決策規(guī)劃主要包含()。A.目標狀態(tài)預測B.行為決策C.路徑規(guī)劃D.控制執(zhí)行2.從上海到北京有很多條路,智能網(wǎng)聯(lián)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年酒店管理實務操作能力考試試卷及答案
- 疾病用藥規(guī)范化指導
- 顳下頜關節(jié)疾病診療要點
- 心肺復蘇急救措施
- 新生兒與新生兒疾病的護理
- 健康丹頂鶴課件
- 長沙明德教育2022年九年級《道德》上學期期中試題與參考答案
- 雅禮教育集團2025年九年級《化學》上冊期中試題與參考答案
- 新生兒機械通氣實施要點
- 藝術設計讀書筆記
- 導截流驗收報告匯編
- 大班科學《神奇的中草藥》課件
- 信用修復申請書
- 全過程造價控制流程全圖
- 溫州7.23動車事故調查報告介紹課件
- RAL 勞爾色卡電子版
- 造價咨詢質量控制保證措施及服務質量
- 跳棋教學(課堂PPT)
- 火車過橋問題四年級(課堂PPT)
- MSA偏倚分析報告樣本
- 中國顱腦創(chuàng)傷顱內壓監(jiān)測專家共識
評論
0/150
提交評論