20250509-民生證券-機械一周解一惑系列_第1頁
20250509-民生證券-機械一周解一惑系列_第2頁
20250509-民生證券-機械一周解一惑系列_第3頁
20250509-民生證券-機械一周解一惑系列_第4頁
20250509-民生證券-機械一周解一惑系列_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGE1本公司具備證券投資咨詢業(yè)務資格,請務必閱讀最后一頁免責聲明證券研究報告PAGE1本公司具備證券投資咨詢業(yè)務資格,請務必閱讀最后一頁免責聲明證券研究報告一周解一惑系列:機器人大腦算法迭代對視覺方案的影響 2025年05月09日本周關注:奧比中光、浙江榮泰、杰克股份、法蘭泰克、雷迪克主要應用場景:3D3D了巨大的應用潛力。3DRGB和RGB-D方法,無論從頭開始訓練還是利用預訓練,都能展現(xiàn)出更強的性能和泛3DVLA這種能力使得機器人在執(zhí)行任務時能夠做出更準確的決策和動作規(guī)劃,解決了2D2DVLA能夠利用3D點云數(shù)據(jù)準確感知物體的實際位置和高度,從而在面對不同高度的桌子或物體時,做出相應的調整動作,成功完成任務,如在“placebread”任務中,PointVLA能夠適應訓練數(shù)據(jù)中未見過的更高桌面高2D3D提高少樣本多任務學習能力3)增強泛化能力:實驗結果顯示,在相機動態(tài)變化機器人視覺圖像數(shù)據(jù)獲取與3D傳感器技術應用:近年來,隨著3D視覺3D視覺傳感器已成為人形機器人“感知-決策-執(zhí)行”鏈路的核心,其重要性體現(xiàn)在環(huán)2D視覺難以應對復雜三維場景,而3D通過語義視覺導航技術提取高層語義信息(如車間設備布局,實現(xiàn)自主任務調H1的激光雷達結合3DSLAM(最高達360N?m3D在柔性裝配場景中,優(yōu)必選機器人利用3D視覺識別遮擋條件下的汽車密封條安裝位,結合仿人五指手完成精細化操作。宇樹H1通過AI強化學習訓練跳躍、舞蹈等動作,依賴3D激光SLAM實現(xiàn)動作的穩(wěn)定性。3D主要包括IntelRealSense2.0AR投資建議:3D奧比中光。變化,視覺算法的選擇可能還會迭代。

推薦 維持級分析師李哲執(zhí)業(yè)證書:S0100521110006郵箱:lizhe_yj@相關研究2025/04/212025/04/13一周解一惑系列:SEMICON新品百花齊2025/04/012025/03/242025/03/16行業(yè)專題研究/機械行業(yè)專題研究/機械PAGE10本公司具備證券投資咨詢業(yè)務資格,請務必閱讀最后一頁免責聲明證券研究報告PAGE10本公司具備證券投資咨詢業(yè)務資格,請務必閱讀最后一頁免責聲明證券研究報告目錄TOC\o"1-2"\h\z\u商業(yè)應用——3D視覺工作原理及應用場景 3主要任務 3工作原理 3應用場景 113D視覺算法 163D點云數(shù)據(jù)在機器人大模型中的優(yōu)勢 16機器人視覺圖像數(shù)據(jù)獲取與3D傳感器技術應用 193D傳感器算法框架 21投資建議 24風險提示 24插圖目錄 25商業(yè)應用——3D3D識別與理解。主要任務3D3D3D位姿感知對相機或物體在三維物理空間中的位置和朝向的計算、以及實時跟蹤。3D物體的檢測、識別、檢索,以及對場景或者物體的分割和語義標記等。工作原理3D學成像方法。目前應用最多的還是光學方法。飛行時間法O(OF和間接O(-OFOF通常用于單點測距系統(tǒng),實現(xiàn)面積范圍3D成像常需掃描技術;I-TOF從光強度的時間選通測量相機的電子和光混圖像采集,在智能無人系統(tǒng)(如機器人、無人車、無人機等)中用于環(huán)境感知。圖1:飛行時間法工作原理 資料來源:中國機器視覺網(wǎng),民生證券研究院3D3D(3D建模等領域,能夠快速獲取物體(C(DLP(DMD))圖案直接投影。根據(jù)結構光投影次數(shù)劃分,結構光投影三維成像可以分成單3D3D單次投影結構光主要采用空間復用編碼和頻率復用編碼形式實現(xiàn),常用的編3D圖2:偽隨機斑點投影3D成像工作原理資料來源:中國機器視覺網(wǎng),民生證券研究院3Dτ35(如格雷碼十相移條紋3D(如CCDCMOS3D圖3:多次投影3D成像工作原理資料來源:中國機器視覺網(wǎng),民生證券研究院反射率光滑表面和鏡面物體3D3D圖4:光亮表面偏折測量方法 資料來源:中國機器視覺網(wǎng),民生證券研究院3D掃描3D成像方法可分為掃描測距、主動三角法、色散共焦法等。3D測距、(激光雷達干涉散斑干涉等原理的干涉儀;共焦法,如色散共焦、自聚焦等。3D3D3DLED圖5:主動三角法掃描成像工作原理資料來源:中國機器視覺網(wǎng),民生證券研究院3D3D分辨率的完整致密的三維曲面模型。圖6:多線掃描方法工作原理資料來源:中國機器視覺網(wǎng),民生證券研究院明玻璃面等,目前在手機蓋板三維檢測等領域廣受歡迎。STILMPLS180,采用180個陣列點形成一條線,最大線長4.039mm(測量點11.5pm,點與點間距為22.5pm,另一款產品是芬蘭的FOCALSPECUULA,采用的是色散共焦三角法技術。圖7:色散共焦掃描工作原理 資料來源:中國機器視覺網(wǎng),民生證券研究院3D立體視覺一般情況下是指從不同的視點獲取兩幅或多幅圖像重構目標物體3Docularcues雙目視差3D3D1shapefromX10實現(xiàn)。用兩個相機從兩個視點對同一個目標場景獲取兩個視點圖像再計算兩個視點圖像3D圖8:雙目視覺成像工作原理資料來源:中國機器視覺網(wǎng),民生證券研究院多目視覺成像即多視點立體成像,用單個或多個相機從多個視點獲取同一個目標場景的多幅圖像,重構目標場景的三維信息。其基本原理如下圖所示。圖9:多目視覺成像工作原理資料來源:中國機器視覺網(wǎng),民生證券研究院(SM)的技術,使用同一相機在其內參數(shù)不變的條件下,3D光場成像與傳統(tǒng)相機成像原理不同,傳統(tǒng)相機成像是光線穿過鏡頭在后續(xù)成像平面上直接形成2D于提供更真實的視覺體驗,實現(xiàn)對場景更精確的三維感知和交互。光場3D成像的原理與傳統(tǒng)CCD和CMOS相機成像原理在結構原理上有所2D圖10:光場3D成像相機內部結構 資料來源:中國機器視覺網(wǎng),民生證券研究院3D類3DEye-in-Hand3DEye-inHand3DRaytrix3D3D被動立體視覺3D成像,日前在工業(yè)領域也得到較好應用,但應用場合有限。因為單目立體視覺實現(xiàn)有難度,雙目和多目立體視覺要求目標物體紋理或幾何特征清晰。3D3Dθ(通常大于15°)才能實現(xiàn)測(結構光光源Eye-In-handEye-In-Hand3D應用場景3D應用。3D3D采集、產品定制設計等多個領域。VEGA圖11:先臨三維VEGA在戶外三維掃描的表現(xiàn) 資料來源:3D視覺工坊微信公眾號,民生證券研究院2025422OptimScan3D53C域具有重要作用。在面對制造業(yè)規(guī)模化生產需求時,OptimScanQ12支持與RobotScan機器人智能3D圖12:先臨三維OptimScanQ12高精度還原細節(jié) 資料來源:先臨三維官網(wǎng),民生證券研究院圖13:先臨三維RobotScanQ12應用流程 資料來源:先臨三維官網(wǎng),民生證券研究院機器人領域智能優(yōu)化升級3D3D圖14:奧比中光3D視覺感知運用于工業(yè)機器人資料來源:奧比中光官網(wǎng),民生證券研究院物體抓取與操作、人機交互等功能。圖15:開源3D定位算法資料來源:3D視覺工坊微信公眾號,民生證券研究院在近期進行的人形機器人半程馬拉松比賽中,北京人形機器人創(chuàng)新中心自研Ultra2時40分42秒跑完21.09753D335L圖16:奧比中光335示意圖 資料來源:天工通用人形機器人(Pro)用戶使用手冊,民生證券研究院智能物流與倉儲管理(器人場景中實現(xiàn)了深度視覺技術的規(guī)?;涞兀⒁曈X解決方案應用于物流倉3DAIRGB-D3D視覺相機,實現(xiàn)了1-3厘米的高精度定位,在復雜環(huán)境中保障作業(yè)安全。圖17:邁爾微視3D視覺方案的應用場景 資料來源:邁爾微視MRDVS微信公眾號,民生證券研究院生物識別3D3D2D奧比中光將真3D結構光方案運用到智能門鎖/門禁系統(tǒng)中,通過3D法與人臉活體檢測技術,為用戶提供了安全可靠的門禁解決圖18:內嵌于支付寶刷臉支付終端的奧比中光AstraProS型號3D傳感攝像頭 圖19:奧比中光3D刷臉門鎖門禁示意圖 資料來源:奧比中光官網(wǎng),民生證券研究院資料來源:奧比中光官網(wǎng),民生證券研究院3D3D2D3D2D2DRGB3D3D云數(shù)據(jù)作為一種能夠提供豐富空間信息的觀測形式,在機器人學習領域展現(xiàn)出巨大潛力。增強空間推理能力,提升任務成功率3DRGBRGB-DOBSBench圖20:不同策略下不同觀測空間的結果 資料來源:Zhu,H.,Wang,Y.,Huang,D.,Ye,W.,Ouyang,W.,&He,T.(2024).《PointCloudMatters:RethinkingtheImpactofDifferentObservationSpacesonRobotLearning》.,民生證券研究院3DVLA模型中,能夠為模型提供更全面的空間2D空間感知上的局限性,提高了任務的成功率。2DVLAPointVLA3Dbread”任務中,PointVLA能夠適應訓練數(shù)據(jù)中未2D3D數(shù)據(jù)為模型提供了更精準的深度感知和空間定位能力,有助于機器人更精確地操作物體,提高任務的成功率。圖21:PointVLA的高度適應性 資料來源:Li,C.,Wen,J.,Peng,Y.,Peng,Y.,Feng,F.,&Zhu,Y.(2025).《PointVLA:Injectingthe3DWorldintoVision-Language-ActionModels》.,民生證券研究院提高少樣本多任務學習能力PointVLA益于點云數(shù)據(jù)提供的豐富信息,使得模型能夠更有效地利用有限的樣本進行學習20高的平均成功率,驗證了其在少樣本多任務學習場景下的優(yōu)勢。具備實際與照片區(qū)分能力PointVLA3D2D無法區(qū)分的情況。圖22:實景與照片辨別的實驗裝置 CWen,PengPengFeng&Zhu,(2025).《PointVLAInjectingthe3DWorldintoVision-Language-ActionModels》.,民生證券研究院增強泛化能力3DPointVLA圖23:點云在相機視圖和視覺變化上具有更好的零樣本泛化能力 資料來源:Zhu,H.,Wang,Y.,Huang,D.,Ye,W.,Ouyang,W.,&He,T.(2024).《PointCloudMatters:RethinkingtheImpactofDifferentObservationSpacesonRobotLearning》.,民生證券研究院3D更加廣闊。機器人視覺圖像數(shù)據(jù)獲取與3D傳感器技術應用機器人視覺數(shù)據(jù)獲取方式與形式機器人視覺系統(tǒng)的核心在于通過傳感器獲取環(huán)境信息,并將其轉化為可處理的數(shù)據(jù)形式。近年來,隨著3D視覺傳感器技術的突破,數(shù)據(jù)采集方式逐漸向高精度、多模態(tài)方向發(fā)展。數(shù)據(jù)來源與采集工具包括多模態(tài)傳感器集成、開源數(shù)據(jù)集與仿真平臺。(普遍采用3D(如RGB-D相境信息。例如,宇樹H1機器人搭載的大疆覽沃Mid-360激光雷達通過多線掃開源數(shù)據(jù)集為算法訓練提供了標準化測試環(huán)境。例如,OpenLORIS-Object數(shù)據(jù)集通過RGB-D攝像頭在真實環(huán)境中采集包含光照變化、遮擋、復雜背景等主要的數(shù)據(jù)形式與特征主要的數(shù)據(jù)形式有3D點云與深度圖、RGB-D圖像等。3D視覺傳感器(如結構光、ToF、激光雷達)生成的點云數(shù)據(jù)可精確還原物體三維結構。宇樹H1的激光雷達通過360°全景深度感知技術,實時構建環(huán)境模型,支持動態(tài)環(huán)境下的穩(wěn)定動作。奧比中光的3D視覺傳感器被用于宇樹機器人,提供高精度點云數(shù)據(jù),確保操作的精準性。結合顏色與深度信息的RGB-D數(shù)據(jù)是機器人視覺的主流輸入形式。優(yōu)必選度達到0.5mm。多模態(tài)傳感器融合成為趨勢。戴盟機器人提出通過觸覺外骨骼采集毫米級運動追蹤數(shù)據(jù),構建視覺-觸覺-語言-動作(VTLA)大模型,提升靈巧操作能力。深圳行動計劃明確支持多模態(tài)感知技術攻關,推動觸覺-視覺融合算法研發(fā)。視覺數(shù)據(jù)驅動的機器人訓練流程與優(yōu)化、部署與實時控制幾個階段。宇樹H1(100Hz以上如OpenLORIS的多難度級別樣本)擴充訓練集,提升模AI動作穩(wěn)定性;OpenLORIS數(shù)據(jù)集支持9問題。VTLA大模型整合視覺、觸覺與語言指令等通過高精度觸覺數(shù)據(jù)優(yōu)化抓取5G網(wǎng)絡確保數(shù)據(jù)同步,并通過在線學習(如進廠實訓)持續(xù)更新模型,適應產線變化。3D視覺傳感器在機器人中的核心作用3D視覺傳感器已成為人形機器人“感知-決策-執(zhí)行”鏈路的核心,其重要性體現(xiàn)在環(huán)境感知與建模、動作規(guī)劃與執(zhí)行、市場驅動與技術趨勢幾方面。傳統(tǒng)2D3D傳感器通過深度信息增強環(huán)境(如車間設備布局H1的激光雷達結合3DSLAM算法,實時調整關節(jié)扭矩(最高達360N?m,確保動態(tài)平衡。3D數(shù)據(jù)為機器人提供精確的空間坐標,優(yōu)化路徑規(guī)劃。在柔性裝配場景中,優(yōu)必選機器人利用3D視覺識別遮擋條件下的汽車密封條安裝位,結合仿人五指手完成精細化操作。宇樹H1通過AI強化學習訓練跳躍、舞蹈等動作,依賴3D激光SLAM實現(xiàn)動作的穩(wěn)定性。2027模將達1000億元,必選X采用多目立體視覺與激光雷達結合,波士頓動力Spot機器人依賴技術實現(xiàn)動態(tài)避障。3DIntelRealSenseIntelRealSense的算法框架以開源SDK2.0(librealsense)為核心,通過于跨平臺兼容性與靈活的生態(tài)整合。(D435i在0.3-2米范圍內深度誤差<1mm(5cm(EKF融合UoF(如L515)0.5-10器人避障等場景。IntelRealSense整個框架支持WindowsLinuxAndroidROS、等主流框架深度集成,開發(fā)者可通過統(tǒng)一接口獲取預處理后的深度、IMUAR圖24:IntelRealSense深度相機D435i資料來源:IntelRealsense官網(wǎng),民生證券研究院奧比中光:硬件級整合的場景化定制框架奧比中光的3D傳感器算法框架以自研MX系列芯片(如MX6800)為核心構建起“傳感器-芯片-算法”垂直整合的閉環(huán)體系,其核心競爭力源于硬件級深度處理與多模態(tài)融合技術的深度協(xié)同。MX6800芯片內置結構光解碼、雙目匹配及多模態(tài)數(shù)據(jù)同步等核心模塊,在結構光技術中采用格雷碼與四步相移混合編碼方案,通過單幀圖像即可完成全局唯一編碼與亞像素級相位解算——格雷碼解決遮擋區(qū)域的編碼唯一性問題,四步米范圍內精度可達0.1mm,解碼速度較純軟件方案提升2倍且功耗降低60%CensusSGMIMU2XL0.1-20在場景化應用中,奧比中光通過硬件級優(yōu)化與算法定制展現(xiàn)出強大的環(huán)境適33020KLux0.01mm實現(xiàn)毫米級精度的3D形貌重建;戶外場景中,Gemini335Lg的窄帶濾光片與Census100KLux5%以下;消費電子領域,Astra2別算法基于CNN實時檢測15個關節(jié)點,延遲低于,滿足AR交互的低延遲需求。圖25:奧比中光深度相機D335和D335L資料來源:奧比中光官網(wǎng),民生證券研究院核心技術差異與場景適配性分析RealSenseROSCensusRealSenseAR中表現(xiàn)優(yōu)異,例如UR協(xié)作機器人集成D435i實現(xiàn)動態(tài)物體抓取,誤差控制在2mmGemini335Lg50KLux105mm。投資建議3D3D關注3D視覺領域的領先公司奧比中光。風險提示具身智能相關模型算法進步不及預期機器人領域和大模型相結合的算法提升并沒有嚴格可預測的路徑,算法性能整體的提升及落實到實際應用中會有一定的不確定性。機器人技術迭代路線出現(xiàn)變化,視覺算法的選擇可能還會迭代機器人當前的應用場景和產品技術路線還沒有成熟定型,算法模型迭代過程需要結合實際應用場景的需要,最終造成視覺算法的路線選擇隨之迭代插圖目錄圖1:飛行時間法工作原理 4圖2:偽隨機斑點投影3D成像工作原理 5圖3:多次投影3D成像工作原理 5圖4:光亮表面偏折測量方法 6圖5:主動三角法掃描成像工作原理 7圖6:多線掃描方法工作原理 7圖7:色散共焦掃描工作原理 8圖8:雙目視覺成像工作原理 9圖9:多目視覺成像工作原理 9圖10:光場3D成像相機內部結構 10圖11:先臨三維VEGA在戶外三維掃描的表現(xiàn) 11圖12:先臨三維OptimScanQ12高精度還原細節(jié) 12圖13:先臨三維RobotScanQ12應用流程 12圖14:奧比中光3D視覺感知運用于工業(yè)機器人 13圖15:開源3D定位算法 13圖16:奧比中光335示意圖 14圖17:邁爾微視3D視覺方案的應用場景 15圖18:內嵌于支付寶刷臉支付終端的奧比中光AstraProS型號3D傳感攝像頭 15圖19:奧比中光3D刷臉門鎖門禁示意圖 15圖20:不同策略下不同觀測空間的結果 16圖21:PointVLA的高度適應性 17圖22:實景與照片辨別的實驗裝置 18圖23:點云在相機視圖和視覺變化上具有更好的零樣本泛化能力 19圖24:IntelRealSense深度相機D435i 21圖25:奧比中光深度相機D335和D335L 22分析師承諾何形式的補償。評級說明投資建議評級標準評級說明推薦相對基準指數(shù)漲幅15%以上12(指數(shù))相對同期基準指數(shù)的漲跌幅為基準。其中:A300公司評級謹慎推薦相對基準指數(shù)漲幅5%~15%之間中性相對基準指數(shù)漲幅-5%~5%之間回避相對基準指數(shù)跌幅5%以上推薦相對基準指數(shù)漲幅5%以上行業(yè)評級中性相對基準指數(shù)漲幅-5%~5%之間回避相對基準指數(shù)跌幅5%以上免責聲明民生證券股份有限公司()具有中國證監(jiān)會許可的證券投資咨詢業(yè)務資

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論