版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
人-機(jī)器人交互技術(shù)人-機(jī)器人交互概述可以將人機(jī)交互簡單地理解為“人如何與機(jī)器或某個復(fù)雜系統(tǒng)的溝通和互動過程”。Schmidtler等人認(rèn)為人-機(jī)器人交互是人類和機(jī)器人之間所有交互形式的總稱。人機(jī)交互實(shí)現(xiàn)的過程中存在三個不可忽略的關(guān)鍵主題:意圖檢測、角色分配和信息反饋。面向接觸式人機(jī)交互,研究者提出人與機(jī)器人共享控制的框架,包括三個關(guān)鍵思想:意圖檢測、意圖識別與行為響應(yīng)。協(xié)作機(jī)器人是下一代機(jī)器人的重要發(fā)展方向,其柔順控制技術(shù)對于實(shí)現(xiàn)安全穩(wěn)定的協(xié)作交互至關(guān)重要。人-機(jī)器人交互接口可以將人機(jī)交互簡單地理解為“人如何與機(jī)器或某個復(fù)雜系統(tǒng)的溝通和互動過程”。Schmidtler等人認(rèn)為人-機(jī)器人交互是人類和機(jī)器人之間所有交互形式的總稱。人機(jī)交互實(shí)現(xiàn)的過程中存在三個不可忽略的關(guān)鍵主題:意圖檢測、角色分配和信息反饋。面向接觸式人機(jī)交互,研究者提出人與機(jī)器人共享控制的框架,包括三個關(guān)鍵思想:意圖檢測、意圖識別與行為響應(yīng)。常用人機(jī)交互設(shè)備和方式相機(jī)深度相機(jī)比普通相機(jī)多出深度維度,提供更多信息。應(yīng)用:微軟Kinect(人體骨骼追蹤)、英特爾RealSense、LeapMotion(手勢識別)。VR眼鏡HTCVivePro系列:六自由度交互、高刷新率與高分辨率。應(yīng)用:游戲與娛樂領(lǐng)域,減少眩暈感,增強(qiáng)沉浸感。語音交互代表技術(shù):Siri。肌電信號通過表面肌電信號反映肌肉運(yùn)動狀態(tài),通過對手臂上的表面肌電信號進(jìn)行放大濾波、提取特征值和模式識別等處理后,可用于判斷手部的動作意圖。常用人機(jī)交互設(shè)備和方式腦電信號腦電信號解讀人體運(yùn)動意圖。腦機(jī)接口可以幫助用戶與機(jī)器人之間實(shí)現(xiàn)更好更自然的交互。手控器交互通過位姿指令控制機(jī)器人,分為三自由度和六自由度手控器,機(jī)械結(jié)構(gòu)上有串聯(lián)和并聯(lián)手控器。應(yīng)用:醫(yī)療手術(shù)、空間遙操作等。缺點(diǎn):交互不自然,易引起疲勞。腦電信號靈活、高效,適合精細(xì)操控機(jī)器人。主要設(shè)備:穿戴式數(shù)據(jù)手套、外骨骼等。腦電接口圖數(shù)據(jù)手套ForceDimension手控器人機(jī)交互方式分類根據(jù)人機(jī)交互過程中人體動作控制信息的獲取方式,可分為:1.外設(shè)附著方式:即附著在人肢體上的感應(yīng)設(shè)備對人體動作信息進(jìn)行采集。優(yōu)點(diǎn):響應(yīng)速度快、識別精度高。缺點(diǎn):需要額外設(shè)備,增加成本,交互不夠自然,不易普及,主要應(yīng)用于快速響應(yīng)和精確控制的工業(yè)領(lǐng)域。2.計算機(jī)視覺方式:通過視頻捕捉設(shè)備采集人體動作信息,分析RGB圖像、紅外圖像等數(shù)據(jù),提取動作信息。優(yōu)點(diǎn):無需佩戴設(shè)備,設(shè)備要求低,輕便且易于普及。缺點(diǎn):對環(huán)境和光照要求較高,處理速度可能受到限制。人機(jī)交互方式分類按自然交互的方式分類,可分為:1.體態(tài)語言交互:通過肢體語言和姿勢來與機(jī)器進(jìn)行互動。手勢識別:通過具有符號功能的手勢來進(jìn)行信息交流和控制機(jī)器人。肢體動作識別:多關(guān)節(jié)協(xié)同動作,通過全身動作與機(jī)器人交互。姿態(tài)行為理解:識別整體身體姿態(tài)及行為,理解用戶意圖。2.語音交互:通過語音指令與機(jī)器進(jìn)行交流,實(shí)現(xiàn)控制與反饋。應(yīng)用:如智能助手(Siri、Alexa)、智能家居控制等。優(yōu)點(diǎn):交互自然,不需要物理接觸,適合遠(yuǎn)程操作。3.其他交互方式:如眼球、意念、表情、唇讀等,針對不同的應(yīng)用和人群,在特殊情況下更為有效。應(yīng)用:面部識別、情感識別、增強(qiáng)現(xiàn)實(shí)(AR)互動等。人-機(jī)器人協(xié)作控制被動協(xié)作控制:機(jī)器人沒有自己的運(yùn)動意圖或期望運(yùn)動軌跡,只是強(qiáng)調(diào)對外部交互力的響應(yīng),以順應(yīng)其伙伴,如人類伙伴的運(yùn)動意圖。應(yīng)用:人-機(jī)器人拖動示教。例子:Ficuciello等采用被動阻抗調(diào)制策略,在KUKALWR4機(jī)器人上進(jìn)行試驗(yàn),機(jī)器人順應(yīng)接觸力,但仍表現(xiàn)出負(fù)載特性。共享協(xié)作控制:機(jī)器人和人類伙伴都有各自的運(yùn)動意圖或目標(biāo)軌跡。機(jī)器人在外部干預(yù)下平衡自身運(yùn)動意圖與環(huán)境順應(yīng)之間的關(guān)系。例子:Li等使用博弈論實(shí)現(xiàn)自然交互,Kucukyilmaz研究動態(tài)角色交換機(jī)制,Wang等提出參考軌跡自適應(yīng)方法。主動協(xié)作控制:機(jī)器人主動估計、預(yù)測或?qū)W習(xí)合作伙伴的運(yùn)動意圖、任務(wù)分配、協(xié)作角色、動力學(xué)參數(shù)和成本函數(shù),增強(qiáng)協(xié)作的靈活性和自然性。人-機(jī)器人協(xié)作控制人類意圖理解行為識別:指檢測和分類給定輸入信息中的人類活動,從而理解人的行為。在人機(jī)協(xié)作中,行為識別幫助判斷人的意圖,并影響機(jī)器人的反應(yīng)。早期研究:主要聚焦于簡單行為(如跑步、行走)在固定背景下的識別,重點(diǎn)在設(shè)計運(yùn)動特征和描述符。當(dāng)前挑戰(zhàn):人機(jī)協(xié)作的特殊需求:在協(xié)作中,不同行為之間差異小且無明顯時間間隔,需要識別相似度高的行為。實(shí)時處理問題:現(xiàn)有算法仍主要處理整段數(shù)據(jù),無法實(shí)時處理片段數(shù)據(jù),限制了其在人機(jī)交互中的應(yīng)用。未來方向:需要開發(fā)適應(yīng)動態(tài)場景的實(shí)時行為檢測與識別算法。人-機(jī)器人協(xié)作控制人類意圖理解基于運(yùn)動預(yù)測的意圖理解:通過識別人類當(dāng)前的動作意圖,預(yù)測未來運(yùn)動,幫助機(jī)器人動態(tài)理解人的意圖,完成互適應(yīng)的協(xié)作任務(wù)。在動態(tài)、不確定的情境下,機(jī)器人通過預(yù)測人的運(yùn)動,實(shí)現(xiàn)更準(zhǔn)確的協(xié)作。知識網(wǎng)絡(luò)與意圖理解:建立層次化的知識網(wǎng)絡(luò),機(jī)器人利用結(jié)構(gòu)化知識“讀取”人的意圖。手臂軌跡分析:通過神經(jīng)網(wǎng)絡(luò)建模動態(tài)運(yùn)動信息,分析手臂軌跡,推理目標(biāo)位置。使用Kinect數(shù)據(jù),在3D空間建模目標(biāo)位置,并通過近似EM算法進(jìn)行在線學(xué)習(xí)。建立意圖導(dǎo)向動態(tài)模型:利用貝葉斯理論推斷運(yùn)動生成過程,并結(jié)合意圖理解,支持機(jī)器人的學(xué)習(xí)與協(xié)作。人-機(jī)器人協(xié)作控制人機(jī)交互安全性隨著老齡化社會和人力資源短缺,機(jī)器人從工廠擴(kuò)展到家庭和辦公室等有人環(huán)境。安全性和可靠性是機(jī)器人成功融入有人環(huán)境的關(guān)鍵。機(jī)器人應(yīng)減少人類疲勞、提高力量、速度和精度,同時提供經(jīng)驗(yàn)和理解力。然而,機(jī)器人在非結(jié)構(gòu)化環(huán)境中的自主行為可能帶來安全風(fēng)險,特別是物理人機(jī)交互(pHRI)中的潛在傷害。目前,機(jī)器人安全標(biāo)準(zhǔn)尚不明確,尤其在實(shí)際應(yīng)用中仍需解決安全性問題。人-機(jī)器人協(xié)作控制1.安全框架擬人感知:人們期望機(jī)器人具備類似人類的品質(zhì)和能力,尤其在物理交互中,機(jī)器人設(shè)計類似人類機(jī)械臂更易理解。認(rèn)知與任務(wù)執(zhí)行:機(jī)器人服務(wù)員側(cè)重任務(wù)執(zhí)行,而機(jī)器人同伴更注重認(rèn)知交互。交互方式因人而異,機(jī)器人反應(yīng)也有所不同。交互界面設(shè)計:有效的溝通依賴共同理解領(lǐng)域,界面設(shè)計確保機(jī)器人始終處于控制之下。pHRI安全性:關(guān)注機(jī)器人與用戶的碰撞風(fēng)險,評估機(jī)器人傳遞的能量和功率對用戶的潛在傷害。人-機(jī)器人協(xié)作控制2.安全pHRI中的力學(xué)和控制問題被動安全性限制:簡單添加被動順應(yīng)性覆蓋物不足以解決高沖擊載荷問題。大慣性機(jī)械臂難以根本解決此問題??刂撇呗裕哼m當(dāng)控制律和復(fù)雜的軟件架構(gòu)能改善安全性,盡管無法完全彌補(bǔ)機(jī)械設(shè)計缺陷。力/阻抗控制:可以使用外部感知設(shè)備,用于監(jiān)控任務(wù)執(zhí)行,降低意外風(fēng)險,但依然存在系統(tǒng)故障和不可預(yù)測行為的威脅。運(yùn)動控制的局限:當(dāng)前工業(yè)機(jī)器人多為位置控制,單一運(yùn)動控制無法應(yīng)對非結(jié)構(gòu)化環(huán)境中的交互任務(wù)。力/阻抗控制的優(yōu)勢:提供柔順性,減少意外接觸力,實(shí)現(xiàn)更自然的物理交互。機(jī)器人動態(tài)行為控制阻抗控制:廣泛應(yīng)用于機(jī)器人與環(huán)境的物理交互,阻抗參數(shù)描述交互力與運(yùn)動之間的關(guān)系。能夠調(diào)節(jié)交互點(diǎn)的動態(tài)行為,但僅為動態(tài)行為控制的一種方法。多點(diǎn)交互控制:在多點(diǎn)交互中,接觸點(diǎn)的行為與其他點(diǎn)的狀態(tài)相關(guān),傳統(tǒng)的阻抗模型無法完全描述,需要用更為一般的動態(tài)行為模型來描述。主動人-機(jī)器人協(xié)作人機(jī)協(xié)作在個性化制造中具有重要應(yīng)用,結(jié)合人的靈活性與機(jī)器人的精度優(yōu)勢。為了實(shí)現(xiàn)更好的協(xié)作,機(jī)器人需要實(shí)時感知、分析工作場景,并主動做出決策。當(dāng)前的人機(jī)協(xié)作研究主要集中在人類認(rèn)知上,但缺乏對工作場景中其他元素的全面考慮,尤其是當(dāng)向主動協(xié)作發(fā)展時。隨著深度學(xué)習(xí)和計算機(jī)視覺技術(shù)的發(fā)展,人機(jī)協(xié)作系統(tǒng)正向多模態(tài)通信和上下文感知發(fā)展,從反應(yīng)式機(jī)器人輔助向更智能的協(xié)同任務(wù)執(zhí)行轉(zhuǎn)變。主動式人機(jī)協(xié)作的目標(biāo)是實(shí)現(xiàn)人類操作員和機(jī)器人之間的自組織、雙向協(xié)作,以應(yīng)對復(fù)雜的工業(yè)任務(wù)。主動人-機(jī)器人協(xié)作主動場景理解:實(shí)現(xiàn)人機(jī)主動協(xié)作,全面理解人機(jī)協(xié)作場景,提取環(huán)境信息并轉(zhuǎn)化為決策與規(guī)劃知識。三個層次的視覺理解:對象層次:識別任務(wù)相關(guān)物體。人類層次:識別人類動作、意圖。環(huán)境層次:分析環(huán)境的影響因素。環(huán)境智能感知:獲取場景中物體屬性(如位置、狀態(tài)),并篩選與任務(wù)相關(guān)的信息(例如水杯的位置,排除無關(guān)數(shù)據(jù)如背景墻壁)。視覺注意力選擇性機(jī)制:模仿人類選擇性注意力,聚焦與任務(wù)相關(guān)的視覺信息,濾除干擾,提升場景理解效率。通過選擇性注意機(jī)制與語義分割技術(shù),精準(zhǔn)提取關(guān)鍵物體,增強(qiáng)任務(wù)執(zhí)行成功率。主動人-機(jī)器人協(xié)作主動對象感知對象識別1)簡單地將物體分類為不同的類別,如扳手、螺釘、齒輪等;使用激光掃描、KNN、SVM等方法進(jìn)行物體分類。2)根據(jù)利用率或?qū)傩裕ㄈ缱ノ瘴恢谩⒐ぞ吖δ艿龋┚淖R別物體的功能可用性。以表示物體的交互特性,例如抓握點(diǎn)在哪里以及可以對物體執(zhí)行什么動作。對象定位1)檢測,它用對象周圍的邊界框表示對象位置;2)分割,基于對象的幾何信息定位對象并輸出像素級分割結(jié)果;3)其他,其主要依賴于先驗(yàn)知識或幾何信息來定位對象。主動人-機(jī)器人協(xié)作主動對象感知目標(biāo)姿態(tài)估計物體姿態(tài)估計是自主機(jī)器人操作的一塊缺失的拼圖,因?yàn)樗梢砸?D物體模型和感官觀察之間映射的形式提供精確的物體姿態(tài),根據(jù)主要輸入或特征源將其進(jìn)一步分為兩類。1)2D特征:僅使用2D圖像作為輸入源來解決6自由度姿態(tài)估計。2)點(diǎn)云:盡管只使用2DRGB相機(jī)有好處,但深度信息在精確的6D姿態(tài)估計過程中仍然很重要。利用深度信息的常用方法是將深度或RGB-D圖像轉(zhuǎn)換為點(diǎn)云。主動人-機(jī)器人協(xié)作主動人員識別1.人員定位:為了實(shí)現(xiàn)有效的人-機(jī)器人協(xié)作,應(yīng)首先定位人類在人機(jī)協(xié)作場景中的位置,以便機(jī)器人能夠在不與人體碰撞的情況下主動規(guī)劃其協(xié)作動作。1)人體檢測:安全性是人機(jī)協(xié)作系統(tǒng)設(shè)計中的關(guān)鍵,防撞方法通過圖像處理技術(shù)(如邊緣檢測、形狀濾波)在RGB-D圖像中分割并檢測人體,從而計算危險指數(shù),但此方法在非受控環(huán)境中存在局限性。2)人臉檢測:人機(jī)協(xié)作利用人臉檢測來檢索人體位置信息,并獲得識別操作員的機(jī)會。2.人類活動1)識別:機(jī)器人應(yīng)該通過攝像機(jī)或其他傳感器了解一個人過去和現(xiàn)在的狀態(tài),從而了解人類從事的活動。2)預(yù)測:一些研究人員傾向于預(yù)測人類操作員的預(yù)期行為。主動人-機(jī)器人協(xié)作主動人員識別3.人體姿勢1)身體姿勢:人體姿勢通常被表述為從傳感器數(shù)據(jù)推斷出的骨骼或關(guān)節(jié)圖,以支持人機(jī)協(xié)作中的細(xì)粒度機(jī)器人規(guī)劃。Kinect相機(jī)和CNN模型廣泛用于靜態(tài)姿勢估計,如PoseNet和OpenPose用于關(guān)節(jié)位置估計和人體工程學(xué)分析。過融合傳感器數(shù)據(jù)和分類器(如CNN、KNN、SVM),可以識別工人的站立姿勢。2)手勢識別:早期方法依賴手工特征(如HOG、Hu矩)和分類器(如隨機(jī)森林、SVM)進(jìn)行手勢分類,用于機(jī)器人控制和遙操作。近年來,基于深度學(xué)習(xí)的手勢識別逐漸取代傳統(tǒng)方法,提升了魯棒性。此外,還使用肌電圖(EMG)和腦電圖(EEG)等非視覺手段用于手勢識別和機(jī)器人控制。主動人-機(jī)器人協(xié)作主動環(huán)境分析為了處理更復(fù)雜的任務(wù),例如導(dǎo)航到看不見的地方以獲取人機(jī)協(xié)作組裝過程中所需的特定工具,機(jī)器人應(yīng)具備更全面地感知和建模整個工作環(huán)境的技能。1.場景圖:將環(huán)境的感知結(jié)果轉(zhuǎn)換為拓?fù)鋱D結(jié)構(gòu)。2.2D地圖:為了能夠表示場景元素的詳細(xì)幾何關(guān)系,2D地圖是遵循人類實(shí)踐經(jīng)驗(yàn)的自然選擇,通常采用俯視圖的形式。3.3D表示:精細(xì)的3D信息(如點(diǎn)云和體素圖)被用來表示環(huán)境,支持更復(fù)雜的操作并避免碰撞。主動人-機(jī)器人協(xié)作主動視覺推理對物體、人和環(huán)境的感知可以提供對人機(jī)協(xié)作工作場景的整體理解。為了彌合場景理解和主動決策之間的差距,機(jī)器人在與人類操作員協(xié)作時需要一種推理機(jī)制。視覺推理是指通過對人機(jī)協(xié)作場景的視覺觀察,對視覺線索的潛在含義或未來機(jī)器人動作的指示進(jìn)行推理。1.視覺提示基于視覺線索的推理是協(xié)作機(jī)器人更高層次認(rèn)知智能的基本要求。早期工作包括使用貝葉斯決策方法推理裝配零件檢測的傳感模式和利用卷積變分自編碼(ConvVAE)與LSTM模型進(jìn)行目標(biāo)圖像推理,幫助機(jī)器人自動選擇零件。2.視覺和語言提示結(jié)合視覺和語言線索進(jìn)行推理能提供更準(zhǔn)確的信息。早期工作通過數(shù)學(xué)模型和知識庫模型結(jié)合視覺和語言信息,增強(qiáng)推理能力,例如集成對象定位、人類活動識別與語音識別進(jìn)行推理。挑戰(zhàn)和未來方向1.基于功能可用性的智能物體認(rèn)知機(jī)器人應(yīng)具備智能的認(rèn)知能力,不僅識別物體類別,還能理解與后續(xù)動作相關(guān)的物體固有價值。在復(fù)雜的人機(jī)協(xié)作任務(wù)中,機(jī)器人可能面對未知對象,但依然需要根據(jù)已識別對象的功能進(jìn)行拆卸規(guī)劃。2.協(xié)同操作對象的精確建模盡管計算機(jī)視覺在物體檢測和分類中廣泛應(yīng)用,人機(jī)協(xié)作中的精確物體建模仍存在挑戰(zhàn)。尤其在裝配任務(wù)中,實(shí)時的6-DoF目標(biāo)姿態(tài)估計技術(shù)對精確建模至關(guān)重要,但受到依賴CAD模型、遮擋問題和計算效率等限制,影響了其實(shí)際應(yīng)用。3.更精細(xì)的人體感知計算機(jī)視覺中的密集人體姿勢和手勢建模趨勢,為更精細(xì)的人體感知提供了新的可能,尤其適用于主動式人機(jī)協(xié)作場景。挑戰(zhàn)和未來方向4.分層和混合工作空間建模傳統(tǒng)的工作空間建模方法(如場景圖、2D地圖、3D表示)無法滿足未來人機(jī)協(xié)作系統(tǒng)的需求,特別是在靈活制造車間中。為支持精細(xì)協(xié)作和中長導(dǎo)航任務(wù),分層和混合環(huán)境表示成為優(yōu)選方案,具備動態(tài)交替和交互機(jī)制,適應(yīng)不同粒度的應(yīng)用。5.視覺語言推理視覺和語言推理是實(shí)現(xiàn)人機(jī)協(xié)作中人機(jī)無縫協(xié)作的關(guān)鍵。盡管已有大量研究利用視覺和語言線索進(jìn)行推理,但大多數(shù)工作忽視了知識庫的整合,并主要關(guān)注固定機(jī)械臂推理,而非移動機(jī)器人在更長時間和物理距離上的推理需求。6.基于視覺場景理解的延遲問題視覺傳感器在人機(jī)協(xié)作場景中的應(yīng)用受限于延遲問題,主要由低采樣率、大數(shù)據(jù)流和計算復(fù)雜性引起。隨著5G和Wi-Fi等技術(shù)的發(fā)展,數(shù)據(jù)流問題有所緩解,但如何減少算法級別的計算延遲仍是挑戰(zhàn)。利用神經(jīng)架構(gòu)搜索技術(shù)來搜索特定任務(wù)和硬件平臺的有效模型結(jié)構(gòu),希望自動獲得輕量級和低延遲模型。謝謝機(jī)器人-環(huán)境交互技術(shù)機(jī)器人-環(huán)境交互分類依據(jù)機(jī)器人與其環(huán)境之間交互的性質(zhì),可分為兩類:非接觸任務(wù)和接觸任務(wù)。第一種即自由空間中的無約束運(yùn)動,如機(jī)器人攜帶攝像頭進(jìn)行巡檢等,機(jī)器人對環(huán)境沒有任何的影響。在非接觸任務(wù)中,機(jī)器人自身的動力學(xué)對其性能有著至關(guān)重要的影響。與這些任務(wù)相反,許多復(fù)雜的高級機(jī)器人應(yīng)用屬于接觸任務(wù),如裝配和加工,需要機(jī)械臂與其他物體進(jìn)行力耦合。機(jī)器人-環(huán)境交互建模剛性機(jī)械臂與環(huán)境交互的動力學(xué)模型由以下形式的向量微分方程描述:使用機(jī)器人雅可比矩陣,我們可以將機(jī)器人動力學(xué)模型從關(guān)節(jié)坐標(biāo)系轉(zhuǎn)換為末端執(zhí)行器坐標(biāo)系:由于力相互作用過程通常非常復(fù)雜,很難用精確的數(shù)學(xué)方法進(jìn)行描述,因此不得不引入某些簡化,從而部分地將問題理想化。在實(shí)踐中,交互力
通常建模為機(jī)器人動力學(xué)的函數(shù),即末端執(zhí)行器的運(yùn)動(位置、速度和加速度)和控制輸入的函數(shù):(1)(2)(3)機(jī)器人-環(huán)境交互控制對柔順運(yùn)動控制中遇到的問題進(jìn)行了廣泛的研究,提出并闡述了幾種控制策略和方案。這些方法可以根據(jù)柔順的種類進(jìn)行初步的系統(tǒng)化。根據(jù)該標(biāo)準(zhǔn),可以區(qū)分柔順運(yùn)動的兩組基本控制概念,如下所示:被動柔順,由于機(jī)械手結(jié)構(gòu)、伺服或特殊柔順裝置中固有的柔順性,末端執(zhí)行器位置由接觸力本身調(diào)節(jié);主動柔順,其中柔順性通過構(gòu)建力反饋閉環(huán)來實(shí)現(xiàn),以便通過控制交互力或通過在機(jī)器人末端生成特定于任務(wù)的順應(yīng)性來實(shí)現(xiàn)可編程機(jī)器人反應(yīng)。主動柔順控制方法可分為力控制和阻抗控制。主動柔順控制方法力控制,即通常的位置/力控制,其中所需的交互力和機(jī)器人位置都受到控制。在力控制中,給定期望的力軌跡,并測量力以實(shí)現(xiàn)反饋控制。力控制方法可以分為力位混合控制、統(tǒng)一力/位置控制、并聯(lián)位置/力控制等。阻抗控制,它使用作用力和末端執(zhí)行器位置之間的不同關(guān)系來調(diào)整末端執(zhí)行器對外力的機(jī)械阻抗。阻抗控制問題可以定義為設(shè)計控制器的要求,以便交互力根據(jù)目標(biāo)阻抗定律控制末端執(zhí)行器的標(biāo)稱位置和實(shí)際位置之間的差異。阻抗控制可以分為基于力控制的阻抗控制和基于位置控制的阻抗控制。機(jī)器人-環(huán)境交互控制發(fā)展趨勢通過分析國內(nèi)外研究現(xiàn)狀,不難發(fā)現(xiàn)機(jī)器人-環(huán)境交互控制技術(shù)還不能滿足要求。在機(jī)器人-環(huán)境交互控制領(lǐng)域還有許多問題亟待解決:首先,對于機(jī)器人-環(huán)境交互問題,目前很多研究只考慮機(jī)器人的阻抗控制參數(shù),并未考慮環(huán)境模型參數(shù)。這使得系統(tǒng)模型并不完整。當(dāng)機(jī)器人與環(huán)境相互作用時,將機(jī)器人與環(huán)境作為一個整體來考慮是很自然的。其次,對于機(jī)器人-環(huán)境交互問題,目前許多研究假設(shè)環(huán)境參數(shù)是已知的,這在實(shí)際應(yīng)用中通常無法實(shí)現(xiàn)。第三,對于機(jī)器人-環(huán)境交互問題,目前許多研究都假設(shè)交互只發(fā)生在單個接觸點(diǎn)上,而機(jī)器人-環(huán)境多點(diǎn)交互問題非常常見,但目前關(guān)于這方面的研究很少。第四,對于機(jī)器人-環(huán)境交互問題,通常采用阻抗控制方法。但是阻抗控制只是動態(tài)行為控制的一種特殊情況,其在很多復(fù)雜場合的應(yīng)用受到限制。為此,需要進(jìn)一步研究更為一般的動態(tài)行為控制模型和框架來解決這類問題。展望
對于環(huán)境動力學(xué)模型和位置參數(shù)未知的機(jī)器人-環(huán)境交互問題,如何獲得優(yōu)化的交互性能是一個非常重要和復(fù)雜的問題。對于這類問題,強(qiáng)化學(xué)習(xí)方法提供了非常合適的工具。在強(qiáng)化學(xué)習(xí)方法中,系統(tǒng)與環(huán)境之間相互作用產(chǎn)生的強(qiáng)化信號是對當(dāng)前行為的評價,然后根據(jù)強(qiáng)化信號更新控制策略以適應(yīng)環(huán)境。在機(jī)器人-環(huán)境交互中,交互作用力是對當(dāng)前機(jī)器人-環(huán)境交互行為的一個評價標(biāo)準(zhǔn),基于這一指標(biāo)可以對阻抗行為進(jìn)行更新以獲得優(yōu)化的交互性能。這兩種情況非常類似,因此可以使用強(qiáng)化學(xué)習(xí)方法解決機(jī)器人-未知環(huán)境交互控制問題。謝謝協(xié)作機(jī)器人操作控制目錄CONtants操作任務(wù)分類010203操作任務(wù)建模操作技能學(xué)習(xí)操作任務(wù)分類從是否需要進(jìn)行力控制可以分為力控制操作任務(wù)和不需要力控制的操作任務(wù);從被操作環(huán)境的動力學(xué)特性可以分為剛性接觸、柔性接觸、塑性接觸、摩擦接觸等;
從機(jī)器人-環(huán)境耦合特性可以分為瞬時耦合、松耦合和緊耦合三種,瞬時耦合包括拾取并放置任務(wù),松耦合包括按壓按鈕、軸孔裝配或插入任務(wù),緊耦合包括開關(guān)門、轉(zhuǎn)動閥門等;從機(jī)器人-環(huán)境接觸狀態(tài)是否可變分為定接觸狀態(tài)任務(wù)和變接觸狀態(tài)任務(wù);從任務(wù)階段可分為單階段任務(wù)和多階段任務(wù);從環(huán)境是否可變可分為定常操作任務(wù)和變化操作任務(wù);從環(huán)境結(jié)構(gòu)性特點(diǎn)可分為結(jié)構(gòu)性操作任務(wù)和非結(jié)構(gòu)性操作任務(wù)。操作任務(wù)建模機(jī)器人-環(huán)境接觸動力學(xué)模型如下所示:技能學(xué)習(xí)意義隨著機(jī)器人技術(shù)的發(fā)展,人們期望機(jī)器人具備更強(qiáng)的自主操作能力,在更多領(lǐng)域代替人類完成更加復(fù)雜的操作任務(wù);在人工分析機(jī)器人行為特性和工作任務(wù)要求的基礎(chǔ)上,采用傳統(tǒng)復(fù)雜編程、遙操作或示教編程等常規(guī)方法可使機(jī)器人具備一定的操作技能,較好地勝任諸多結(jié)構(gòu)化工作環(huán)境和單一固定任務(wù)的工作場景,完成快速、準(zhǔn)確、可重復(fù)位置和力控制的任務(wù);
采用傳統(tǒng)常規(guī)方法設(shè)計的機(jī)器人操作技能不能動態(tài)地適應(yīng)非結(jié)構(gòu)化工作環(huán)境或場景多變的工作場合,且機(jī)器人操作技能開發(fā)過程中存在著周期長、效率低、工作量大及不能滿足需求的多樣性等諸多難題;采用機(jī)器學(xué)習(xí)方法設(shè)計具備一定自主決策和學(xué)習(xí)能力的機(jī)器人操作技能學(xué)習(xí)系統(tǒng),使機(jī)器人在復(fù)雜、動態(tài)的環(huán)境中學(xué)習(xí)并獲取操作技能,能彌補(bǔ)傳統(tǒng)編程等常規(guī)方法的缺陷,極大提高機(jī)器人對環(huán)境的適應(yīng)能力。研究現(xiàn)狀近年來,機(jī)器人操作技能學(xué)習(xí)研究正逐漸成為機(jī)器人研究領(lǐng)域的前沿和熱點(diǎn),新的學(xué)習(xí)方法被逐漸應(yīng)用于機(jī)器人的操作技能學(xué)習(xí)中,諸多著名研究機(jī)構(gòu)和公司,如DeepMind、加州大學(xué)伯克利分校、OpenAI、GoogleBrain、清華大學(xué)、等在此領(lǐng)域取得了一定的成果,但仍面臨著巨大挑戰(zhàn)??捎枚喾N機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)機(jī)器人操作技能學(xué)習(xí),機(jī)器人訓(xùn)練數(shù)據(jù)的產(chǎn)生方式?jīng)Q定了機(jī)器人學(xué)習(xí)所要采用的具體方法。機(jī)器人操作技能學(xué)習(xí)所需數(shù)據(jù)大致可由機(jī)器人與環(huán)境交互產(chǎn)生或由專家提供。因此,機(jī)器人操作技能學(xué)習(xí)方法分為基于強(qiáng)化學(xué)習(xí)的方法,基于示教學(xué)習(xí)的方法和基于小樣本數(shù)據(jù)學(xué)習(xí)的方法。基于強(qiáng)化學(xué)習(xí)的方法馬爾科夫過程MDP(S,A,R,P,r)優(yōu)化目標(biāo)值函數(shù)基于值函數(shù)的方法分為基于模型學(xué)習(xí)的值函數(shù)方法和無模型的值函數(shù)方法??傮w而言,基于無模型的值函數(shù)方法不需對系統(tǒng)建模,計算量小,但價值函數(shù)的獲取需要通過機(jī)器人與環(huán)境的不斷交互采樣估計得到?;趯W(xué)習(xí)模型的值函數(shù)方法首先需要依據(jù)機(jī)器人與環(huán)境的交互數(shù)據(jù)學(xué)習(xí)得到系統(tǒng)模型,并基于該模型采用仿真形式得到最優(yōu)策略,故其在真實(shí)環(huán)境中所需的樣本少,但計算量大?;趶?qiáng)化學(xué)習(xí)的方法使用參數(shù)化策略
時,強(qiáng)化學(xué)習(xí)的優(yōu)化目標(biāo)為:策略梯度的計算公式如下:策略參數(shù)更新公式如下:在機(jī)器人操作技能學(xué)習(xí)領(lǐng)域,策略搜索比基于價值函數(shù)的強(qiáng)化學(xué)習(xí)更具優(yōu)勢,主要體現(xiàn)在:1)采用策略搜索方法可以較為方便的融入專家知識,可依據(jù)獲取的專家策略對神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行初始化,以加速策略優(yōu)化的收斂過程;2)策略函數(shù)比價值函數(shù)具有更少的學(xué)習(xí)參數(shù),基于策略搜索的強(qiáng)化學(xué)習(xí)算法更加高效?;趶?qiáng)化學(xué)習(xí)的方法基于參數(shù)化策略的方法基于強(qiáng)化學(xué)習(xí)的方法基于深度神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的新分支,其通過組合低層特征形成更加抽象的高層表示,以得到數(shù)據(jù)的分布式特征。近年來,諸多學(xué)者將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合得到的深度強(qiáng)化學(xué)習(xí)算法成功應(yīng)用于視頻游戲、圍棋等領(lǐng)域。與常規(guī)強(qiáng)化學(xué)習(xí)方法相比,深度強(qiáng)化學(xué)習(xí)算法將具有強(qiáng)表征能力的深度神經(jīng)網(wǎng)絡(luò)用于強(qiáng)化學(xué)習(xí)中價值函數(shù)和策略函數(shù)的表達(dá),避免了人為手工設(shè)計特征,同時也易融入環(huán)境中的圖像感知信息,較適合于機(jī)器人操作技能學(xué)習(xí)。DQN網(wǎng)絡(luò)結(jié)構(gòu)示意圖基于深度強(qiáng)化學(xué)習(xí)的方法基于人機(jī)交互強(qiáng)化學(xué)習(xí)的方法使用人機(jī)交互式強(qiáng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版班班通設(shè)備與物聯(lián)網(wǎng)結(jié)合合同2篇
- 二零二五年綠色生態(tài)住宅小區(qū)消防工程設(shè)計與施工合同3篇
- 二零二五版股份制企業(yè)股份自愿轉(zhuǎn)讓與投資者關(guān)系維護(hù)合同3篇
- 二零二五年度監(jiān)理合同延期補(bǔ)充協(xié)議-責(zé)任劃分與風(fēng)險承擔(dān)3篇
- 二零二五版中央空調(diào)清洗保養(yǎng)及能耗管理服務(wù)合同3篇
- 二零二五年度國有資產(chǎn)管理委托服務(wù)合同2篇
- 二零二五版股票質(zhì)押擔(dān)保合同范本編制與解析3篇
- 二零二五年度風(fēng)力發(fā)電項目融資合同2篇
- 二零二五年美發(fā)師國際交流聘用合同2篇
- 二零二五年度酒店地毯翻新與維護(hù)服務(wù)合同范本3篇
- 五年級上冊小數(shù)乘除豎式計算題200道及答案
- 2024年東南亞工業(yè)氣瓶市場深度研究及預(yù)測報告
- 棉花良種選育與遺傳育種
- 簡易勞務(wù)承包合同范本
- SH/T 3078-2024 立式圓筒形料倉工程設(shè)計規(guī)范(正式版)
- 快遞驛站承包協(xié)議書
- 基于視覺果蔬識別的稱重系統(tǒng)設(shè)計
- 體育初中學(xué)生學(xué)情分析總結(jié)報告
- 部編版語文中考必背文言文7-9年級
- 農(nóng)藥合成研發(fā)項目流程
- 國家職業(yè)技術(shù)技能標(biāo)準(zhǔn) 4-04-04-02 網(wǎng)絡(luò)與信息安全管理員(數(shù)據(jù)安全管理員)S 2024年版
評論
0/150
提交評論