深海集礦機實時避障bp神經(jīng)網(wǎng)絡建模與仿真_第1頁
深海集礦機實時避障bp神經(jīng)網(wǎng)絡建模與仿真_第2頁
深海集礦機實時避障bp神經(jīng)網(wǎng)絡建模與仿真_第3頁
深海集礦機實時避障bp神經(jīng)網(wǎng)絡建模與仿真_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

深海集礦機實時避障bp神經(jīng)網(wǎng)絡建模與仿真

近年來,隨著科學技術的不斷創(chuàng)新和進步,在處理未知和多變環(huán)境下移動發(fā)病機的局部路徑規(guī)劃方面取得了很大進展,提出了幾種方法,如基于模型反應法(apf)的人工勢場法(fl)、基于行為反應法的模糊邏輯控制方法(fl)、遺傳算法方法(ga)和神經(jīng)網(wǎng)絡法(nn)等。深海富鈷結殼及熱液硫化物調(diào)查區(qū)水深為800~4000m,包括洋中脊、海山、海盆等地質(zhì)單元;海底底質(zhì)類型為基巖(變質(zhì)玄武巖、火山巖、沉積巖、玻璃質(zhì)碎屑巖和結殼等硬基底)、砂(松散有孔蟲砂等)和泥(未固結的深海軟泥等),礦體地形崎嶇不平,多見突起和斷裂,抗壓強度為0.08~68.2MPa,地形坡度一般在5?~35?之間。因此,深海集礦機所面臨作業(yè)環(huán)境存在高復雜性和不可預測性。基于模型的控制算法,從海底環(huán)境模型的建立到集礦機局部路徑規(guī)劃的算法實現(xiàn),都需要考慮到各方面的影響因素,計算量大,實時性較差。而基于行為的反應式方法通過人的知識來指導機器人的行為,反應快,實時性好,且允許存在一定程度的噪聲。為此,本文作者提出基于遺傳算法的集礦機BP神經(jīng)網(wǎng)絡避障模型,將2種基于行為的反應式方法結合應用。重點放在神經(jīng)網(wǎng)絡對傳感器輸入信息的融合和擬人輸出行為控制上,充分發(fā)揮神經(jīng)網(wǎng)絡高度的非線性逼近能力和自適應能力。并利用遺傳算法的全局搜索能力調(diào)整BP神經(jīng)網(wǎng)絡的初始化權值和閾值,從而克服其局部極小值問題。1遺傳算法神經(jīng)網(wǎng)絡權值處理人工神經(jīng)網(wǎng)絡(簡稱ANN)是指用大量的簡單計算單元(即神經(jīng)元)構成的非線性系統(tǒng),是基于模仿人腦高度的獨立信息處理能力而建立的一種高層次擬人信息融合和處理系統(tǒng),具有高度的并行性、非線性全局性和自適應能力。反向傳播算法是用來學習神經(jīng)網(wǎng)絡權值最常用的方法,該算法通過目標輸出和實際輸出的均方誤差不斷調(diào)整權值,以達到最佳擬合實際函數(shù)的目標。但對于較為復雜的網(wǎng)絡模型,容易出現(xiàn)局部極小值問題。遺傳算法是一種通過模擬自然進化過程搜索全局最優(yōu)解的算法,該算法同時考慮搜索空間上的多點,并使用概率法則來引導其搜索,避免局部極小的可能性很大。本文將遺傳算法應用于神經(jīng)網(wǎng)絡中,首先,將擬人信息融合技術用于分析障礙物環(huán)境,建立深海集礦機避障的神經(jīng)網(wǎng)絡模型;其次,應用遺傳算法調(diào)整網(wǎng)絡的權值,執(zhí)行遺傳操作;最后,將執(zhí)行遺傳算法所采用的二進制代碼譯成十進制,輸出優(yōu)化結果解決實際問題。這樣,既繼承了遺傳算法“很強的宏觀搜索能力和良好的全局優(yōu)化能力”,又發(fā)揚了神經(jīng)網(wǎng)絡“較強的非線性逼近能力”,可以應用于海底這一復雜的非線性多變量環(huán)境的系統(tǒng)控制。1.1嬰兒網(wǎng)絡設計1.1.1bp神經(jīng)網(wǎng)絡的輸入集礦機在海底800~4000m工作,周圍環(huán)境采用水下聲納傳感器來檢測,分別在車體正前方、左前方、右前方、左方和右方安裝5個聲納傳感器(本文所設傳感器分布僅用于提出思路,實際情況中可以根據(jù)需要改變傳感器的數(shù)目及方向),以判斷在車體上述方向的障礙物。各方向聲波束與障礙物的相交程度,經(jīng)傳感器融合技術處理作為神經(jīng)網(wǎng)絡的輸入。傳感器及障礙物分布如圖1所示。在圖1中:1個扇形區(qū)域代表1個傳感器可檢測的最大區(qū)域(因為聲納傳感器是以一定角度發(fā)射聲波來檢測目標的);L為傳感器可測最遠距離;陰影區(qū)域代表障礙物區(qū)域;扇形區(qū)域與陰影區(qū)域重疊則表示傳感器檢測到障礙物。圖1所示為集礦機在行進過程中,全部障礙物區(qū)域及其任意組合經(jīng)傳感器檢測后需要轉向時的所有可能情況(2號和3號傳感器同時檢測到障礙物,與1,2和3號傳感器同時檢測到障礙物視為同種環(huán)境類型)。設定超聲波傳感器檢測到障礙物時返回“1”信號,反之,返回“0”信號,那么,5個傳感器將分別產(chǎn)生5個返回信號,將這5個信號采用多傳感器融合技術處理后即可作為避障神經(jīng)網(wǎng)絡模型的輸入。利用BP神經(jīng)網(wǎng)絡對其進行信息融合,在實驗中,對于采集到的信息,去掉相同的環(huán)境信息,則剩下的信息就為代表網(wǎng)絡全部輸入特征的模式,這樣,本文所設計BP神經(jīng)網(wǎng)絡含有32種輸入模式。例如向量(1,0,0,0,0)表示只有1號傳感器檢測到障礙物的輸入模式。1.1.2導師信號訓練網(wǎng)絡根據(jù)實際避障控制要求,將神經(jīng)網(wǎng)絡的輸出設置為3個,用來更新集礦機的注視向量、轉向角和轉向速度,如圖2所示。在圖2中:向量m為注視向量,它始終指向垂直車體的正方向(集礦機前進的方向)或反方向(本文規(guī)定轉向角大于90?時為非前進方向);v為速度;ω為集礦機避開障礙物所需要的轉向角。以傳感器返回信號為依據(jù),確定與之相對應的障礙物分布情況,對已經(jīng)設定的3個輸出量,分別采取人為設置的方法,逐個設置導師信號。為了與輸入模式匹配,首先將抽象的輸出數(shù)值化,設定如下:對于注視向量而言,“1”表示正方向;“-1”則表示反方向。對于轉向角而言,“1”表示不轉向,即轉向角為0?;“-2”表示向左轉φ?;“2”表示向右轉φ?(φ根據(jù)集礦機實際情況而定,本文仿真中選取45?);“-3”表示向左轉90?;“3”表示向右轉90?;“4”則表示向右轉向180?。對于速度而言,“1”表示集礦機正常工作速度;“2”表示轉向時減速后的速度。以輸入模式為(0,1,0,0,0)為例,(0,1,0,0,0,1,2,2)代表其對應的網(wǎng)絡訓練導師信號,即當僅有2號傳感器檢測到障礙物時,集礦機右轉一定角度即可實現(xiàn)避障。結合集礦機的實際行進情況,并綜合人的行走經(jīng)驗,對全部典型環(huán)境構成的向量一一制定相應的導師信號訓練網(wǎng)絡,網(wǎng)絡訓練的完成就意味著整組非線性關系已確定。也就是說,網(wǎng)絡已經(jīng)對人的獨立思維處理能力進行了一定程度的模擬,可以針對采集到的任意信息給出合理的輸出,進而使集礦機達到實時避障的目的。1.1.3神經(jīng)網(wǎng)絡結構本文設計的BP神經(jīng)網(wǎng)絡為3層,各層神經(jīng)元設置分別為:輸入層神經(jīng)元為5個,隱藏層神經(jīng)元為10個,輸出層神經(jīng)元為3個,網(wǎng)絡中所有的權值設定在[-1,1]區(qū)間內(nèi),由遺傳算法進行學習更新。網(wǎng)絡整體組織結構如圖3所示。神經(jīng)網(wǎng)絡訓練參數(shù)包括訓練樣本、最大循環(huán)次數(shù)、訓練期望誤差和學習速率。已劃分的32種輸入模式為本文所需訓練樣本;最大循環(huán)次數(shù)設定為50,期望誤差值選取0.001,學習速率選取1.0。1.2遺傳算法初始權值的確定在神經(jīng)網(wǎng)絡中,權值的初始化是網(wǎng)絡最終輸出優(yōu)劣程度最重要的決定因素之一,同時,也在很大程度上影響著網(wǎng)絡本身的訓練效果。不同的初始權值可能會對訓練時間、收斂性、泛化誤差造成很大的差異。為了更好地解決神經(jīng)網(wǎng)絡初始權值的確定問題,本文利用遺傳算法的宏觀搜索和全局優(yōu)化能力來確定初始權值和閾值,將遺傳算法的初始種群規(guī)模設定為50,遺傳代數(shù)選取100代,執(zhí)行遺傳操作。圖4所示為本文所采用方法的具體流程。2遺傳算法適應值根據(jù)上述模型,應用Matlab神經(jīng)網(wǎng)絡工具箱和遺傳工具箱進行仿真分析。為了更清楚地說明遺傳算法在神經(jīng)網(wǎng)絡應用中的優(yōu)勢,首先對沒有引入遺傳算法的BP神經(jīng)網(wǎng)絡進行訓練。經(jīng)多次訓練觀察,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡會出現(xiàn)圖5所示情況,即在誤差達到訓練目標之前,陷入局部極小,從而導致訓練失敗。將遺傳算法引入BP神經(jīng)網(wǎng)絡后,發(fā)現(xiàn)網(wǎng)絡會在較小的訓練代數(shù)內(nèi)達到所要求誤差,在很大程度上克服了局部極小值問題。其中,達到要求誤差精度所需訓練代數(shù)為10~50代,本文選取訓練代數(shù)為15代時的情況加以說明,如圖6所示。適應值的度量是遺傳算法群體演化的依據(jù)。在GA-BP神經(jīng)網(wǎng)絡權值優(yōu)化過程中,適應值設置為網(wǎng)絡均方誤差平方和的倒數(shù),用來描述網(wǎng)絡對所求權值的滿意度。圖7所示為遺傳算法的適應值。從圖7可以看出:適應值函數(shù)曲線呈單調(diào)上升狀態(tài),并在短期訓練時間內(nèi)趨于穩(wěn)定,表明網(wǎng)絡實現(xiàn)所期望輸出的能力越來越強,并快速完成了訓練任務,達到穩(wěn)定狀態(tài),使得輸出盡大可能地逼近網(wǎng)絡的設計目標。并且適應值趨于穩(wěn)定后,其值可達到約88%,從而表明神經(jīng)網(wǎng)絡訓練是較成功的。本文建立了不同的不確定障礙物環(huán)境和集礦機預定行走路徑,以全面檢驗避障效果。仿真參數(shù)如下:障礙物環(huán)境尺寸(長×寬)為50m×50m;集礦機外形尺寸(長×寬)為2m×2m;行走速度為1m/s(正常行走速度)和0.5m/s(轉向速度);傳感器測量最大距離為2m。避障實驗仿真結果如圖8和圖9所示。其中:點型矩陣區(qū)域代表所設定隨機障礙物區(qū)域;方塊代表模擬集礦機;x和y分別為海底局部區(qū)域經(jīng)、緯度坐標;虛線所示線路為方塊避障行走軌跡(考慮到圖片清晰度,行進路線由每隔0.2s所取集礦機的中心點組成)??梢?應用本文所述方法,可以使集礦機在不同的障礙物分布環(huán)境中,根據(jù)預定路徑,實時調(diào)整自身的運行軌跡,從而較好地實現(xiàn)避障與路徑規(guī)劃。3小值問題的處理(1)結合深海集礦機的實際作業(yè)環(huán)境,建立集礦機的避障BP神經(jīng)網(wǎng)絡模型,并將遺傳算法引入神經(jīng)網(wǎng)絡訓練過程的學習方法,克服了BP神經(jīng)網(wǎng)絡的局部極小值問題,從而使得GA-BP避障神經(jīng)網(wǎng)絡模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論