特征判別增強(qiáng)的高效圖像語義分割方法

上傳人：策*** IP屬地：山西上傳時(shí)間：2023-08-21 格式：DOCX 頁數(shù)：3 大小：789.65KB 積分：20 舉報(bào) 版權(quán)申訴

免費(fèi)預(yù)覽已結(jié)束，剩余1頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

特征判別增強(qiáng)的高效圖像語義分割方法高常鑫華中科技大學(xué)圖像語義分割對(duì)圖像中每個(gè)像素進(jìn)行分類，是圖像深度理解的基礎(chǔ)，方法應(yīng)用于自動(dòng)駕駛、無人智能系統(tǒng)等領(lǐng)域。現(xiàn)有圖像語義分割方法還面臨兩個(gè)問題：1）準(zhǔn)確的語義分割即需要高層語義特征和低層細(xì)節(jié)特征，也需要同類特征和異類特征，但是他們兩兩之間都存在一定程度的沖突，但是現(xiàn)有方法忽略了這種耦合，導(dǎo)致特征判別性有限；2）語義分割很大程度上依賴于上下文信息，但是現(xiàn)有方法通常傾向于采用所有的上下文信息，一方面部分上下文信息對(duì)語義分割沒有幫助甚至導(dǎo)致特征區(qū)分能力下降，另一方面還增加了運(yùn)算量。如何解決耦合特征之間的沖突和選擇有效的上下文信息對(duì)語義理解至關(guān)重要，因此特征判別增強(qiáng)的高效圖像理解框架是圖像語義理解的關(guān)鍵科學(xué)問題。針對(duì)高層-低層、同類-異類特征耦合問題，研究特征解耦的語義理解框架，實(shí)現(xiàn)了準(zhǔn)確高效的語義分割。主要工作如下：（1）提出了雙通路的場景圖像的實(shí)時(shí)像素級(jí)語義分割方法，為高精度的實(shí)時(shí)語義分割提供了基準(zhǔn)算法基于深度學(xué)習(xí)的圖像語義分割方法已經(jīng)取得了不錯(cuò)的效果，但是受限于網(wǎng)絡(luò)的規(guī)模，其速度遠(yuǎn)不能達(dá)到實(shí)時(shí)的要求。同時(shí)，語義分割需要定位精度和語義兩個(gè)方面的信息，網(wǎng)絡(luò)越深提取語義越準(zhǔn)確，但定位精度越差。因此，在目前的深度網(wǎng)絡(luò)模型中定位精度和語義對(duì)于網(wǎng)絡(luò)的需求是有沖突的。針對(duì)上述難點(diǎn)，深入研究了不同網(wǎng)絡(luò)深度對(duì)于定位精度和分類兩個(gè)方面的影響，提出一種雙通路的場景圖像語義分割方法。通過網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)為雙通路，將定位和分類兩個(gè)任務(wù)解耦，分別解決定位精度和分類的問題，利用一個(gè)較淺且通道數(shù)多的通路來獲取高精度的定位信息，并利用一個(gè)較深且通道數(shù)少的通路來獲取準(zhǔn)確的語義信息，有效解決了兩者之間的矛盾，并大幅提高運(yùn)算速度，實(shí)現(xiàn)了實(shí)時(shí)語義分割。在單張NVIDIAGeForceGTX1080Ti的GPU卡上，速度達(dá)到了156FPS，提升了算法適應(yīng)性，成為了不同領(lǐng)域的基準(zhǔn)算法。圖8雙通路的場景圖像的實(shí)時(shí)像素級(jí)語義分割方法及性能（2）提出了基于自主特征選擇的圖像分割方法，提升算法性能的同時(shí)大幅減少了計(jì)算量目前主流的圖像語義分割方法依賴于大范圍的上下文關(guān)系建模，有利于推理分割場景要素，當(dāng)前場景分割方法往往利用自注意力機(jī)制建模遠(yuǎn)距離關(guān)系。但是自注意力機(jī)制中存在大量冗余計(jì)算，導(dǎo)致復(fù)雜度較高，限制了它的應(yīng)用；同時(shí)，大量冗余信息也降低了特征的判別性。針對(duì)上述難點(diǎn)，通過學(xué)習(xí)的方式選擇少量“重要”上下文信息，提出基于自主特征選擇的圖像分割方法。采用基于相似性關(guān)系引導(dǎo)特征選擇的思路，提出了代表圖分割算法，通過學(xué)習(xí)特征相似性關(guān)系，引導(dǎo)特征選擇過程，使其選擇有代表性的特征，進(jìn)而有效建模遠(yuǎn)距離關(guān)系，提高特征判別性。該方法提出了一種高效的上下文建模策略，大幅減少自注意力機(jī)制的冗余計(jì)算，提升分割性能與效率。實(shí)驗(yàn)表明，性能提高的同時(shí)，該方法GLOPS和推理速度約分別為自注意力機(jī)制的1/17和1/6。在“特征判別增強(qiáng)的高效圖像理解框架”方面取得了一些理論成果，論文發(fā)表于計(jì)算機(jī)視覺頂級(jí)期刊IJCV、頂級(jí)會(huì)議CVPR、ECCV等。成果取得了廣泛的關(guān)注。提出的BiSeNet入選ECCV2018最具影響力20篇論文，入選ESI熱點(diǎn)論文、ESI高被引論文，谷歌學(xué)術(shù)引用1200余次。BiSeNet已經(jīng)被集成到百度paddlepaddle、商湯mmseg等知名深度學(xué)習(xí)平臺(tái)，廣泛應(yīng)用于人臉屬性編輯、3D人臉合成、非接觸心率估計(jì)等領(lǐng)域。發(fā)布的圖像語義理解工具torchseg在Github點(diǎn)贊1400余次。該成果發(fā)表學(xué)術(shù)論文5篇、授權(quán)發(fā)明專利2項(xiàng)：[1]ChangqianYu,ChangxinGao*,JingboWang,GangYu,ChunhuaShen,NongSang,"BiSeNetV2:BilateralNetworkwithGuidedAggregationforReal-timeSemanticSegmentation,"InternationalJournalofComputerVision(IJCV),vol.129,pp.3051-3068,2021.[2]BeibeiYang,ChangqianYu,Jin-GangYu,ChangxinGao*,NongSang,"Pose-GuidedHierarchicalSemanticDecompositionandCompositionforHumanParsing,"IEEETransactionsonCybernetics(TCYB),2021.[3]ChangqianYu,JingboWang,ChangxinGao*,GangYu,ChunhuaShen,NongSang,"ContextPriorforSceneSegmentation,"CVPR,2020.[4]ChangqianYu,JingboWang,ChaoPeng,ChangxinGao*,GangYu,NongSang,"LearningaDiscriminativeFeatureNetworkforSemanticSegmentation,"CVPR,2018.[5]ChangqianYu#,JingboWang#,ChaoPeng,ChangxinGao*,GangYu,NongSang,"BiSeNet:BilateralSegmentationNetworkforReal-timeSemanticSegmentation,"ECCV,2018.[6]高常鑫，何兆華，余昌黔，桑農(nóng)。一種基于雙邊分割網(wǎng)絡(luò)的車載圖像語義分割系統(tǒng)，發(fā)明專利，專利號(hào)：ZL2018108496573，授權(quán)公告日：2020-10-30[7]劉佳惠，高常鑫，桑農(nóng)。一種弱監(jiān)督語義分割方法及其應(yīng)用，發(fā)明專利，專利號(hào)：ZL2020100046015，專利授權(quán)日：2022-10-14[8]余昌黔，高常鑫，桑農(nóng)。一種基于上下文先驗(yàn)的

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

特征判別增強(qiáng)的高效圖像語義分割方法

文檔簡介

溫馨提示

最新文檔

評(píng)論

特征判別增強(qiáng)的高效圖像語義分割方法

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔