2022年AI工業(yè)視覺解決方案白皮書

上傳人：b*** IP屬地：境外上傳時(shí)間：2023-11-27 格式：DOCX 頁數(shù)：60 大?。?.79MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩55頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2022AI工業(yè)視覺解決方案白皮書AIINDUSTRIALVISIONSOLUTIONS2022Microvision.Allrightsreserved.COPYRIGHT版權(quán)聲明本白皮書出品方為維視智造科技股份有限公司，版權(quán)受法律保護(hù)。轉(zhuǎn)載、摘編或利用其他方式使用本白皮書文字或者觀點(diǎn)，應(yīng)注明“來源”：“維視智造科技股份有限公司”。違反上述聲明者，出品方將追究其相關(guān)法律責(zé)任。CONTENTS目錄工業(yè)視覺技術(shù)發(fā)展趨勢工業(yè)視覺技術(shù)概述 05工業(yè)視覺典型應(yīng)用場景 06工業(yè)視覺面臨的挑戰(zhàn)及發(fā)展趨勢 07深度學(xué)習(xí)技術(shù)發(fā)展趨勢深度學(xué)習(xí)技術(shù)概述 10工業(yè)視覺深度學(xué)習(xí)技術(shù)發(fā)展趨勢 12AI工業(yè)視覺落地痛點(diǎn)及關(guān)鍵技術(shù)AI工業(yè)視覺落地痛點(diǎn) 18額外的硬件 18發(fā)熱量和功耗 18大量的訓(xùn)練數(shù)據(jù) 18大量的人工標(biāo)注工作 19AI工業(yè)視覺落地關(guān)鍵技術(shù)解析 20基于CPU進(jìn)行訓(xùn)練及推理 20缺陷檢測深度學(xué)習(xí)過濾及圖像自動采集標(biāo)注技術(shù) 20小樣本訓(xùn)練及神經(jīng)網(wǎng)絡(luò)模型再訓(xùn)練技術(shù) 21AI工業(yè)視覺解決方案AI工業(yè)視覺解決方案架構(gòu)及組成 24基于本地算力的AI工業(yè)視覺解決方案 24基于邊緣側(cè)的AI工業(yè)視覺解決方案 25基于5G+云端的AI工業(yè)視覺解決方案 26AI工業(yè)視覺解決方案實(shí)施流程 27數(shù)據(jù)收集 27分類及數(shù)據(jù)標(biāo)記 28模型訓(xùn)練 32在線推理及優(yōu)化 33AI工業(yè)視覺解決方案典型應(yīng)用場景 34缺陷檢測 34圖像分類 43字符識別 47深度學(xué)習(xí)與傳統(tǒng)算法的融合 48AI工業(yè)視覺解決方案發(fā)展前景預(yù)測 57工業(yè)視覺技術(shù)發(fā)展趨勢AI工業(yè)視覺解決方案白皮書

工業(yè)視覺技術(shù)概述工業(yè)視覺也稱機(jī)器視覺，是人工智能正在快速發(fā)展的一個(gè)分支，是在工業(yè)上為自動檢查、過程控制和機(jī)器人引導(dǎo)等應(yīng)用提供基于圖像的自動檢查和分析的技術(shù)及方法。機(jī)器視覺系統(tǒng)是通過機(jī)器視覺產(chǎn)品（CMOS和CCD）將被攝取目標(biāo)轉(zhuǎn)換成圖像信號，傳送給專用的圖像處理系統(tǒng)，得到被攝目標(biāo)的形態(tài)信息，根據(jù)像素分布和亮度、顏色等信息，轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征，進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。如果我們將1969年CCD芯片的產(chǎn)生作為機(jī)器視覺技術(shù)的起點(diǎn)，該項(xiàng)技術(shù)的發(fā)展已經(jīng)有半個(gè)世紀(jì)的歷史，經(jīng)過長時(shí)間的發(fā)展，機(jī)器視覺技術(shù)日益取得重大突破和廣泛應(yīng)用，當(dāng)前已經(jīng)遍布工業(yè)生產(chǎn)的各個(gè)環(huán)節(jié)，在一些不適合于人工作業(yè)的危險(xiǎn)工作環(huán)境或人工視覺難以滿足要求的場合，常用機(jī)器視覺來替代人工視覺；同時(shí)在大批量工業(yè)生產(chǎn)過程中，用人工視覺檢查產(chǎn)品質(zhì)量效率低且精度不高，用機(jī)器視覺檢測方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。而且機(jī)器視覺易于實(shí)現(xiàn)自動化集成，軟件集成，是實(shí)現(xiàn)智能制造的基礎(chǔ)技術(shù)。根據(jù)不完全統(tǒng)計(jì)，目前廣泛應(yīng)用工業(yè)視覺的工業(yè)生產(chǎn)行業(yè)5

AI工業(yè)視覺解決方案白皮書工業(yè)視覺典型應(yīng)用場景機(jī)器視覺在工業(yè)領(lǐng)域應(yīng)用廣泛，按功能和場景主要分為四大類：識別、定位、測量、檢測。識別包括有無、顏色和條碼/二維碼識別，主要通過甄別目標(biāo)物體的物體特征來進(jìn)行判定，在工業(yè)應(yīng)用場景中占比約24%。定位功能是在識別出物體的基礎(chǔ)上，經(jīng)過測量準(zhǔn)確的給出目標(biāo)物體的坐標(biāo)位置，制造業(yè)自動生產(chǎn)裝配過程中，機(jī)器人需要知道來料的位置，才能完成后續(xù)的加工、裝配、搬運(yùn)等一系列動作。在工業(yè)應(yīng)用場景中，定位需求占比約為16%。測量泛指利用被測物體特征進(jìn)行全局或局部尺寸數(shù)據(jù)獲取的應(yīng)用，包括：長度、平行度、角度、圓弧長、圓直徑、半徑、點(diǎn)到線的距離、點(diǎn)點(diǎn)距離等等，尺寸測量既可以用于產(chǎn)品生產(chǎn)過程中的尺寸數(shù)據(jù)管控，也可以用于數(shù)據(jù)的獲取，在工業(yè)應(yīng)用場景中占比約為10%。檢測指的是對目標(biāo)物體表面的缺陷進(jìn)行檢出。產(chǎn)品生產(chǎn)制造過程中產(chǎn)生的表面缺陷會影響其性能及客戶體驗(yàn)，傳統(tǒng)人工檢測的方法需要耗費(fèi)大量的人力，且無法滿足現(xiàn)代生產(chǎn)工藝和節(jié)奏的要求，利用機(jī)器視覺的方法進(jìn)行智能化檢測可以有效的解決這一問題，同時(shí)節(jié)省成本、提高產(chǎn)能。因此，表面缺陷檢測是機(jī)器視覺最重要的應(yīng)用方向之一，在整個(gè)工業(yè)應(yīng)用場景中占比約為50%。6AI工業(yè)視覺解決方案白皮書

工業(yè)視覺面臨的挑戰(zhàn)及發(fā)展趨勢總體來說，工業(yè)視覺在定位、測量、識別、檢測等各個(gè)方向上的應(yīng)用都面臨著精度越1.缺陷檢測OKNG難點(diǎn)：缺陷特征被隨機(jī)的螺牙背景干擾，難以獨(dú)立分割出缺陷區(qū)域1.缺陷檢測OKNG難點(diǎn)：缺陷特征被隨機(jī)的螺牙背景干擾，難以獨(dú)立分割出缺陷區(qū)域2.特征分割難點(diǎn)：缺陷區(qū)域呈現(xiàn)隨機(jī)灰度等級的黑色或白色，難以提取全部缺陷區(qū)域3.特征定位難點(diǎn)：待定位的特征呈現(xiàn)相對隨機(jī)的輪廓，無法以特定模板匹配4.產(chǎn)品分類好爛難點(diǎn)：不同類別的棗無任何歸一的特征規(guī)律，無法基于特征參數(shù)區(qū)分7AI工業(yè)視覺解決方案白皮書此類問題在工業(yè)現(xiàn)場是普遍存在且用戶需求迫切希望得到解決的，這為工業(yè)視覺的算法發(fā)展提出了新的挑戰(zhàn)。同時(shí)，如果這些問題得到解決，那么工業(yè)視覺的應(yīng)用邊界，將會得到極大的拓展，由原來只能在產(chǎn)品標(biāo)準(zhǔn)化、一致性極高的場景，變成幾乎可以替代人眼進(jìn)行任意場景下的視覺檢測應(yīng)用，而且不止是工業(yè)生產(chǎn)方面，在農(nóng)業(yè)、民用等領(lǐng)域也可以取得良好的應(yīng)用效果。解決這一問題的最核心關(guān)鍵點(diǎn)，就是深度學(xué)習(xí)技術(shù)的發(fā)展和應(yīng)用。8深度學(xué)習(xí)技術(shù)發(fā)展趨勢userid:497168,docid:144116,date:2023-10-29,AI工業(yè)視覺解決方案白皮書(3)通過設(shè)計(jì)建立適量的神經(jīng)元計(jì)算節(jié)點(diǎn)和多層運(yùn)算層次結(jié)構(gòu)，選擇合適的輸入層和輸出層，通過網(wǎng)絡(luò)的學(xué)習(xí)和調(diào)優(yōu)，建立起從輸入到輸出的函數(shù)關(guān)系，雖然不能100%找到輸入與輸出的函數(shù)關(guān)系，但是可以盡可能的逼近現(xiàn)實(shí)的關(guān)聯(lián)關(guān)系。使用訓(xùn)練成功的網(wǎng)絡(luò)模型，就可以實(shí)現(xiàn)我們對復(fù)雜事務(wù)處理的自動化要求。convolutionalneuralnetwork)、DBN碼網(wǎng)絡(luò)(stackedauto-encodernetwork)模型等。11°?0NAI工業(yè)視覺解決方案白皮書缺陷檢測:部區(qū)域的缺陷，是工業(yè)場景中進(jìn)行質(zhì)量檢查最典型的應(yīng)用之一。13AI工業(yè)視覺解決方案白皮書物體定位:臉識別。14 15AI工業(yè)視覺解決方案白皮書其次，當(dāng)檢測不同的物體和特征時(shí)，深度學(xué)習(xí)方法的優(yōu)勢是能夠檢測以不同形式出現(xiàn)再次，經(jīng)過適當(dāng)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以很好地識別出變量環(huán)境（如變化的背景、不同的分辨率或光源條件）中的物體，無需針對每個(gè)可能的特性進(jìn)行專門訓(xùn)練。但是需要大量的圖片數(shù)據(jù)。當(dāng)然，深度學(xué)習(xí)工業(yè)視覺的實(shí)施也需要具備一定的條件和成本。在硬件配置方面，通常需要增加額外的GPU作為算力支撐，在實(shí)施方面，需要準(zhǔn)備大量的訓(xùn)練樣本數(shù)據(jù)，大量的人工標(biāo)注工作量等，但是，考慮到期在識別能力上，算法的適應(yīng)力上和特征提取和分類的流程上的優(yōu)勢，隨著市場需求、行業(yè)技術(shù)水平的發(fā)展，硬件性能提升，成本有所下降之后，深度學(xué)習(xí)在工業(yè)視覺的應(yīng)用一定會更加的普及。16AI工業(yè)視覺落地痛點(diǎn)及發(fā)展趨勢

AI工業(yè)視覺解決方案白皮書AI工業(yè)視覺落地痛點(diǎn)與傳統(tǒng)方法相比，為了在應(yīng)用中充分發(fā)揮純深度學(xué)習(xí)方法的優(yōu)勢，往往需要對使用的硬件進(jìn)行額外投資，并需要大量的示例圖像來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。額外的硬件深度學(xué)習(xí)架構(gòu)復(fù)雜精巧、功能強(qiáng)大，其突出特點(diǎn)在于它是由大量的神經(jīng)網(wǎng)絡(luò)層構(gòu)成。因此，運(yùn)行深度學(xué)習(xí)的應(yīng)用程序需要用到大量的內(nèi)存和計(jì)算能力。通常只有將計(jì)算任務(wù)轉(zhuǎn)移到額外的處理器（如GPU顯卡）上同時(shí)執(zhí)行計(jì)算，才能在可接受的短時(shí)間內(nèi)完成處理工作。在目前的市場條件下，增加GPU顯卡對于很多用戶來說是一項(xiàng)不小的成本開支。發(fā)熱量和功耗大型神經(jīng)網(wǎng)絡(luò)對計(jì)算能力的要求較高，因此增加了應(yīng)用的功耗，并相應(yīng)地增加了發(fā)熱量。這尤其會對嵌入式系統(tǒng)造成問題，因?yàn)橥ǔＰ枰獙η度胧较到y(tǒng)的低功耗和熱管理方面進(jìn)行優(yōu)化。大量的訓(xùn)練數(shù)據(jù)要想可靠地識別物體，首先需要大量的訓(xùn)練圖像，這些圖像會描述和標(biāo)記所有物體和屬性，以便讓系統(tǒng)能在盡可能多的不同變量和環(huán)境中完成識別。用于訓(xùn)練的不同圖像數(shù)據(jù)量越多，深度學(xué)習(xí)網(wǎng)絡(luò)就越容易學(xué)會如何識別物體。在開發(fā)機(jī)器視覺應(yīng)用時(shí)，要獲取成百上千幅所需的圖像往往是一項(xiàng)艱巨的任務(wù)。更多的時(shí)候，工廠可能根本就不具備條件產(chǎn)生足夠多的訓(xùn)練樣本，尤其是負(fù)樣本。18AI工業(yè)視覺解決方案白皮書大量的人工標(biāo)注工作獲取到的大量數(shù)據(jù)是不能立即使用的，需要人給這些數(shù)據(jù)進(jìn)行標(biāo)注，對于圖像分割，需要精準(zhǔn)的標(biāo)準(zhǔn)圖像中要分割的區(qū)域，這樣才能在推理圖片的時(shí)候得到精準(zhǔn)的區(qū)域。這些標(biāo)注工作都只能是人工手動完成，所以在數(shù)據(jù)大的時(shí)候，還需要檢測是否有標(biāo)注錯(cuò)誤的問題。上述幾個(gè)應(yīng)用的條件正是深度學(xué)習(xí)工業(yè)視覺項(xiàng)目落地的阻礙，也是用戶的痛點(diǎn)，相對的，在技術(shù)上能夠解決這些痛點(diǎn)的算法，將能夠得到更好的推廣和應(yīng)用。額外的硬件：思路之一是實(shí)現(xiàn)基于平價(jià)的CPU進(jìn)行訓(xùn)練和推理。發(fā)熱量和功耗：思路之一能將深度學(xué)習(xí)與傳統(tǒng)算法進(jìn)行深度融合，采用傳統(tǒng)算法解決一部分問題后交接給深度學(xué)習(xí)處理。大量的訓(xùn)練數(shù)據(jù)：行業(yè)內(nèi)通用的解決方案是采用小樣本訓(xùn)練，然后在推理過程中不斷迭代。大量的人工標(biāo)注：自動標(biāo)注工具的研發(fā)將有助于該問題的解決和落地。19

AI工業(yè)視覺解決方案白皮書AI工業(yè)視覺落地關(guān)鍵技術(shù)解析對應(yīng)3.1提出的用戶痛點(diǎn)問題及解決思路，結(jié)合實(shí)際落地的項(xiàng)目經(jīng)驗(yàn)，目前AI工業(yè)視覺落地的關(guān)鍵技術(shù)包括如下幾個(gè)方面：基于CPU進(jìn)行訓(xùn)練及推理深度學(xué)習(xí)算法對計(jì)算資源的需求是確定的，如何提高深度學(xué)習(xí)應(yīng)用部署效率，降低運(yùn)行成本，幫助算法及業(yè)務(wù)團(tuán)隊(duì)快速落地應(yīng)用和服務(wù)，讓AI發(fā)揮真正的生產(chǎn)力，是深度學(xué)習(xí)算法平臺努力的目標(biāo)。由于工業(yè)領(lǐng)域深度學(xué)習(xí)應(yīng)用的特殊性，可以把訓(xùn)練與推理分開實(shí)施，模型訓(xùn)練完畢后的運(yùn)行機(jī)往往裝在設(shè)備上交付給終端用戶，不再需要大規(guī)模的持續(xù)訓(xùn)練和升級，這就使得深度學(xué)習(xí)在CPU上運(yùn)行具備了基礎(chǔ)條件。由于大量的算法訓(xùn)練及推理服務(wù)需求，使用CPU進(jìn)行的推理服務(wù)常常由于性能問題，無法滿足服務(wù)指標(biāo)。然而通過提升推理服務(wù)在CPU上的性能，可以幫助實(shí)現(xiàn)GPU遷移到CPU目的。目前在Intel的處理器上使用OpenVINO，在Arm的處理器上使用NCNN/MNN等，在NvidiaGPU上使用TensorRT均可以大幅提升深度學(xué)習(xí)推理的效率，使用CPU進(jìn)行推理的設(shè)想得以實(shí)現(xiàn)，并且變成了各大廠家角逐的關(guān)鍵技術(shù)點(diǎn)之一。缺陷檢測深度學(xué)習(xí)過濾及圖像自動采集標(biāo)注技術(shù)針對一些代表性的場景如特征明顯但存在異物干擾的情況，使用傳統(tǒng)算法唯一的問題是會造成一定程度的過殺，但是其實(shí)施效率高、消耗的算力和功耗少，是深度學(xué)習(xí)無法比擬的優(yōu)勢。在這種場景下，使用傳統(tǒng)算法進(jìn)行過殺，然后對NG的圖片進(jìn)行深度學(xué)習(xí)標(biāo)注和訓(xùn)練，將傳統(tǒng)算法與深度學(xué)習(xí)有機(jī)的結(jié)合在一起，可以實(shí)現(xiàn)事半功倍的效果稱之為缺陷檢測深度學(xué)習(xí)過濾技術(shù)。此外，傳統(tǒng)軟件和深度學(xué)習(xí)的結(jié)合還可以用于圖20AI工業(yè)視覺解決方案白皮書像的自動采集、自動標(biāo)注等方向，為深度學(xué)習(xí)的實(shí)施提供了更好的落地條件。案例：鍵盤表面缺陷，會有毛發(fā)、指紋、灰塵等異物干擾小樣本訓(xùn)練及神經(jīng)網(wǎng)絡(luò)模型再訓(xùn)練技術(shù)目前大部分的深度學(xué)習(xí)模型，都是監(jiān)督學(xué)習(xí)的方式進(jìn)行的，需要海量的數(shù)據(jù)支持。而現(xiàn)實(shí)生產(chǎn)環(huán)境中，數(shù)據(jù)集通常較小，只有幾萬甚至幾百個(gè)樣本。此時(shí)，通常我們采用以下兩種技術(shù)進(jìn)行解決。第一：利用預(yù)訓(xùn)練模型進(jìn)行遷移微調(diào)（?ne-tuning），預(yù)訓(xùn)練模型通常在特征上擁有很好的語義表達(dá)。此時(shí)，只需將模型在小數(shù)據(jù)集上進(jìn)行微調(diào)就能取得不錯(cuò)的效果。這也是目前大部分小數(shù)據(jù)集常用的訓(xùn)練方式。視覺領(lǐng)域內(nèi)，通常會ImageNet上訓(xùn)練完成的模型。第二：單樣本或者小樣本學(xué)習(xí)（one-shot，few-shotlearning），這種方式適用于樣本類別遠(yuǎn)遠(yuǎn)大于樣本數(shù)量的情況等極端數(shù)據(jù)集。例如有1000個(gè)類別，每個(gè)類別只提供1-5個(gè)樣本。少樣本學(xué)習(xí)同樣也需要借助預(yù)訓(xùn)練模型，但有別于微調(diào)的點(diǎn)在于，微調(diào)通常仍然在學(xué)習(xí)不同類別的語義，而少樣本學(xué)習(xí)通常需要學(xué)習(xí)樣本之間的距離度量。例21AI工業(yè)視覺解決方案白皮書如孿生網(wǎng)絡(luò)（SiameseNeuralNetworks）有些常用的方式：數(shù)據(jù)集增強(qiáng)、正則或者半監(jiān)督學(xué)習(xí)等方式來解決小樣本數(shù)據(jù)集的訓(xùn)練問題。此外，也有深度學(xué)習(xí)廠家研發(fā)了一些幫助用戶進(jìn)行樣本圖片生成的工具，可以將收集到的少量NG圖片進(jìn)行算法加工，生成近似真實(shí)的樣本圖片用于深度學(xué)習(xí)訓(xùn)練。22AI工業(yè)視覺解決方案AI工業(yè)視覺解決方案白皮書AI工業(yè)視覺解決方案架構(gòu)及組成基于本地算力的AI工業(yè)視覺解決方案1、圖像采集部分：通常由一套或者多套這樣的成像系統(tǒng)組成，包括工業(yè)相機(jī)、工業(yè)鏡頭等。成像系統(tǒng)包含的部件種類繁多，需要根據(jù)應(yīng)用需求進(jìn)行選擇；2、照明光源：光源是影響機(jī)器視覺系統(tǒng)輸入的重要因素，它直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果；3、控制單元：控制單元一般包含光電傳感器、I/O、運(yùn)動控制、電平轉(zhuǎn)化單元等，用以判斷被測對象的位置和狀態(tài)，告知圖像傳感器進(jìn)行正確的采集或根據(jù)圖像處理結(jié)果完成對生產(chǎn)過程的控制；24AI工業(yè)視覺解決方案白皮書4、圖像處理算力設(shè)備：工控機(jī)或GPU服務(wù)器，是視覺系統(tǒng)的核心算力，部署于靠近相機(jī)的端側(cè)，完成圖像數(shù)據(jù)的處理和絕大部分的控制邏輯，對于檢測識別類型或采用深度學(xué)習(xí)算法的應(yīng)用，通常都需要高性能的CPU/GPU，減少處理的時(shí)間。工控機(jī)內(nèi)的機(jī)器視覺軟件用來完成輸入的圖像數(shù)據(jù)的處理，通過圖像識別得出結(jié)果，這個(gè)輸出的結(jié)果可能是PASS/FAIL信號、坐標(biāo)位置、字符串等。5、執(zhí)行機(jī)構(gòu)：可能是機(jī)械臂、氣動裝置等，用于執(zhí)行運(yùn)算結(jié)構(gòu)后進(jìn)行相應(yīng)的剔除、抓取、裝配等工作?；诒镜厮懔Φ腁I工業(yè)視覺解決方案是目前主流的方案類型?；谶吘墏?cè)的AI工業(yè)視覺解決方案邊緣學(xué)習(xí)將基于規(guī)則的高效機(jī)器視覺嵌入到一套預(yù)先訓(xùn)練的深度學(xué)習(xí)算法中，以創(chuàng)建針對工廠自動化優(yōu)化過的一個(gè)集成工具集。該技術(shù)無需機(jī)器視覺和深度學(xué)習(xí)方面的專業(yè)知識。相反，生產(chǎn)線工程師可以基于其對所需解決任務(wù)的現(xiàn)有了解來訓(xùn)練邊緣學(xué)習(xí)技術(shù)。邊緣學(xué)習(xí)與現(xiàn)有深度學(xué)習(xí)框架的不同之處在于，其并非通用的解決方案，而是專門為工業(yè)自動化應(yīng)用量身定制的。邊緣學(xué)習(xí)與其他深度學(xué)習(xí)產(chǎn)品的不同之處在于，其專注于確保在應(yīng)用部署的所有階段都易于使用。舉例來說，邊緣學(xué)習(xí)僅需更少的圖像即可實(shí)現(xiàn)概念驗(yàn)證，圖像設(shè)置和采集時(shí)間也更少，并且無需專門編程。邊緣側(cè)AI工業(yè)視覺解決方案的優(yōu)勢是其易用性和低成本，但是受制于算力，單品適用的場景非常受限，復(fù)用性和擴(kuò)展性都比較差。25AI工業(yè)視覺解決方案白皮書基于5G+云端的AI工業(yè)視覺解決方案云平臺，實(shí)現(xiàn)了26AI工業(yè)視覺解決方案白皮書

AI工業(yè)視覺解決方案實(shí)施流程數(shù)據(jù)收集數(shù)據(jù)收集是AI工業(yè)視覺解決方案落地的第一步。首先我們要關(guān)注AI算法對數(shù)據(jù)數(shù)量和質(zhì)量的要求，然后在實(shí)際生產(chǎn)中去收集足夠的對應(yīng)樣本數(shù)據(jù)。通常情況下，訓(xùn)練用的數(shù)據(jù)集必須要有足夠的代表性，需要包含實(shí)際生產(chǎn)中各種可能的情況，而且對應(yīng)各種情況的圖像數(shù)量分布要均勻。在數(shù)量方面，訓(xùn)練用的數(shù)據(jù)集樣本一定要相對較多，根據(jù)模型的復(fù)雜程度，高質(zhì)量的圖片數(shù)量，以及負(fù)樣本的數(shù)量必須足夠。樣本圖片的收集往往可以借助工廠搭建好的機(jī)器視覺硬件系統(tǒng)自動進(jìn)行采集和存儲。27AI工業(yè)視覺解決方案白皮書圖像數(shù)據(jù)的收集工作在某些場景下需要耗費(fèi)大量的人力以及時(shí)間，且往往對深度學(xué)習(xí)項(xiàng)目最終能否成功實(shí)施、或最終的檢出率是否達(dá)標(biāo)具有至關(guān)重要的意義。因此在評估深度學(xué)習(xí)項(xiàng)目時(shí)，要格外關(guān)注此部分工作的實(shí)現(xiàn)難度，對工作量做出客觀和準(zhǔn)確的評估，并入系統(tǒng)成本考量維度。另外值得注意的是，負(fù)樣本的收集往往是瓶頸站點(diǎn)，因?yàn)楣S自動化生產(chǎn)過程中NG產(chǎn)品的比例是相對較低且無法人為制造的，但是檢出所有NG產(chǎn)品恰恰是上線深度學(xué)習(xí)項(xiàng)目的目的，因此必須要有足夠的負(fù)樣本數(shù)量。分類及數(shù)據(jù)標(biāo)記在獲取了足夠的圖像數(shù)據(jù)之后，依據(jù)圖像的屬性進(jìn)行準(zhǔn)確的分類，如果是缺陷檢測目的，通常只需要劃分為OK/NG兩類，如果是圖像分類，則需要根據(jù)特征劃分為對應(yīng)的類別，方便接下來的數(shù)據(jù)標(biāo)記工作開展。不同的深度學(xué)習(xí)軟件提供不同的標(biāo)記方式，目前AI工業(yè)視覺領(lǐng)域比較典型的有兩種，一種是全圖標(biāo)記（也稱全圖分類），一種是像素分割。典型的全圖分類模式下標(biāo)記主界28Aiтi?t?^y?:e?eaжкРая4@Ф??2/?<..1?уйlъБЛ:зgzt;?й?ъау,?%Т??тZ??J?????Тт??????%(8?ЁzлaJt??,L—?ii?Зc'O,йт29AI工業(yè)視覺解決方案白皮書這種方法可以解決兩個(gè)難點(diǎn)問題：不明顯的裂紋第一、如上圖所示的不明顯裂紋，利用傳統(tǒng)算法很難分割出來，就算分割出來了，也會同時(shí)把其他的一些干擾因素分割出來，造成誤檢?；谏疃葘W(xué)習(xí)像素分割，可以不通過閾值等傳統(tǒng)方法分割，而是通過大量類似的數(shù)據(jù)訓(xùn)練出類腦模型后，進(jìn)行裂紋區(qū)域推理，從而找到缺陷的位置。基于像素分割模型的推理效果30AI工業(yè)視覺解決方案白皮書第二、當(dāng)干擾因素和缺陷類似，或干擾因素的層次感比缺陷還高時(shí)，用傳統(tǒng)分割算法就很容易造成誤檢。但是用深度學(xué)習(xí)像素分割模型進(jìn)行推理，就可以根據(jù)訓(xùn)練的“經(jīng)驗(yàn)數(shù)據(jù)”進(jìn)行類腦判斷，從而準(zhǔn)確的只檢測出真實(shí)缺陷。盡管右下角的臟污比中間的裂紋更明顯，但是依然只準(zhǔn)確的檢測出裂紋隱約的裂紋缺陷也不會和其他非裂紋特征混淆盡管“纖維”的灰度等級更高，模型依然可以智能的只推理出裂紋缺陷。31 AйИJr@,..32AI工業(yè)視覺解決方案白皮書在模型訓(xùn)練的過程中，我們往往比較關(guān)注訓(xùn)練時(shí)間、準(zhǔn)確率/損失值等數(shù)據(jù)。訓(xùn)練時(shí)間的長短主要取決于廠家算法性能、訓(xùn)練用圖片分辨率、樣本數(shù)量、計(jì)算機(jī)提供的算力等。而準(zhǔn)確率/損失值數(shù)據(jù)，跟圖片標(biāo)注的準(zhǔn)確率、樣本質(zhì)量、算法性能、訓(xùn)練輪數(shù)等有較大關(guān)系。對于支持小樣本訓(xùn)練的算法軟件，通?？梢韵仁褂蒙倭繕颖具M(jìn)行標(biāo)注和訓(xùn)練多輪次，將準(zhǔn)確率提升至一定程度后進(jìn)行試運(yùn)行，過程中將檢測錯(cuò)誤的圖片進(jìn)行重新標(biāo)注和訓(xùn)練，以快速、高效的提升模型準(zhǔn)確率。支持繼續(xù)訓(xùn)練也是這一方法可以實(shí)施的必要條件。使用大量圖片進(jìn)行驗(yàn)證、校驗(yàn)原有的標(biāo)注數(shù)據(jù)準(zhǔn)確性，也是模型訓(xùn)練必須要進(jìn)行的工作之一。在線推理及優(yōu)化完成訓(xùn)練得到模型之后，深度學(xué)習(xí)項(xiàng)目即具備了上線運(yùn)行的基本條件，此時(shí)需要專門的人員進(jìn)行一定時(shí)長的跟機(jī)工作，在推理過程中，進(jìn)行模型準(zhǔn)確度的驗(yàn)證，實(shí)時(shí)發(fā)現(xiàn)誤檢、漏檢的圖片案例并進(jìn)行收集、再訓(xùn)練，不斷完善模型的準(zhǔn)確率，直至達(dá)到驗(yàn)收要求。通常需要預(yù)設(shè)一定的時(shí)間或樣本的數(shù)量，來驗(yàn)證項(xiàng)目是否達(dá)到了需求中的識別率、準(zhǔn)確率等數(shù)據(jù)，因?yàn)橹挥性谡鎸?shí)的在線生產(chǎn)過程中滿足了這些指標(biāo)要求，深度學(xué)習(xí)才能真正替代傳統(tǒng)算法或者人工，完成質(zhì)量檢查的工作。在工業(yè)生產(chǎn)中用戶經(jīng)常面臨的痛苦之一，是由于產(chǎn)品的種類更換、設(shè)備本身磨損帶來的產(chǎn)品一致性問題，會有新的種類及不良類型不斷產(chǎn)生，相比傳統(tǒng)視覺，使用深度學(xué)習(xí)帶來的額外好處是，在這種情況下，只需要在原來模型的基礎(chǔ)上進(jìn)行簡單的操作，繼續(xù)訓(xùn)練對模型進(jìn)行優(yōu)化即可完成檢測工作。33缺陷檢測

AI工業(yè)視覺解決方案白皮書AI工業(yè)視覺解決方案典型應(yīng)用場景缺陷檢測顯然是AI工業(yè)視覺解決方案最大的用武之地，機(jī)器視覺技術(shù)誕生以來，最大的使命就是執(zhí)行檢查任務(wù)，例如檢測制造產(chǎn)品中的缺陷、污染物、功能缺陷等異常。相比人類視覺，機(jī)器視覺因其速度、準(zhǔn)確性和可重復(fù)性而在結(jié)構(gòu)化場景的定量測量中具有優(yōu)勢。利用適當(dāng)?shù)南鄼C(jī)分辨率和光學(xué)件配置制造的機(jī)器視覺系統(tǒng)可以輕松檢測人眼難以看到的物體細(xì)節(jié)，并且檢測的可靠性較高，錯(cuò)誤也較少。在生產(chǎn)線上，機(jī)器視覺系統(tǒng)可以可靠且重復(fù)地每分鐘檢查數(shù)百或數(shù)千個(gè)部件，遠(yuǎn)遠(yuǎn)超過人類的檢測能力。但是與傳統(tǒng)的機(jī)器視覺不同，人類擅長區(qū)分細(xì)微的表面和功能缺陷，以及區(qū)分可能影響感知質(zhì)量的部分外觀變化。雖然人類處理信息的速度有限，但人類有特殊的概念化和概括的能力。人類擅長通過實(shí)例學(xué)習(xí)，并且在部件有小異常時(shí)，能夠區(qū)分真正重要的部分。在很多情況下，這使人類視覺成為定性解釋復(fù)雜、非結(jié)構(gòu)化場景的理想選擇，尤其是那些有微小缺陷和不可預(yù)測缺陷的場景。而深度學(xué)習(xí)技術(shù)的出現(xiàn)使得在這些場景下使用機(jī)器替代人眼變成了可能。以下是幾個(gè)AI工業(yè)視覺技術(shù)進(jìn)行缺陷檢測的具體案例。案例一、螺紋裂紋檢測項(xiàng)目背景：在螺紋的生產(chǎn)加工過程中，因?yàn)楦鞣N原因會產(chǎn)生一定比例的不合格品，如果不能夠?qū)⒉缓细衿窓z測出來，會對產(chǎn)品本身的強(qiáng)度造成嚴(yán)重影響，采用傳統(tǒng)的視覺檢測方法對螺紋進(jìn)行檢測，因?yàn)槁菁y本身的紋理干擾等因素，在檢測的過程中無法檢34AiШüjЛ^üx@Щea@@ NG’a o a ? ? e s a a e35 HaasI36AiШüt1^ü@:ДCea@@37iIütA^üУт:A1?B?èAI工業(yè)視覺解決方案白皮書第六步、啟用深度學(xué)習(xí)推理案例二、鍵盤缺陷檢測項(xiàng)目背景：在電腦鍵盤字符印刷的過程中，經(jīng)常會產(chǎn)生各種印刷不良，采用傳統(tǒng)的視覺檢測方法進(jìn)行檢測，粉塵、毛屑、指紋等如果殘留在鍵盤上，就會對視覺檢測造成干擾，在檢測過程中將其誤檢為字符的印刷不良，使合格品被誤檢為不合格品，從而影響產(chǎn)線的生產(chǎn)效率，針對以上存在的問題，使用深度學(xué)習(xí)功能對鍵盤進(jìn)行檢測，使產(chǎn)線的誤檢率大大的降低，從而提高了產(chǎn)線的檢測生產(chǎn)效率和產(chǎn)品質(zhì)量。鍵盤缺陷檢測實(shí)施步驟：第一步、采集圖像：對樣品（包含OK品和NG品的圖片）的圖片進(jìn)行采集并保存。39D*?.ü%(ü#Rw'€??m%?Gtr?Z?7%f8)40Aiz t1^ я@Сеа@@iIütA^ütT?Я1?B?442AI工業(yè)視覺解決方案白皮書第六步、啟用深度學(xué)習(xí)推理圖像分類43AI工業(yè)視覺解決方案白皮書調(diào)用“模型分類”工具并加載訓(xùn)練好的表情識別模型基于深度學(xué)習(xí)的表情識別歸一化44AI工業(yè)視覺解決方案白皮書基于深度學(xué)習(xí)的表情識別相對于工業(yè)場景的分類來說，實(shí)現(xiàn)難度是比較小的，因?yàn)楸砬椴町惖奶卣髟趫D片上的數(shù)據(jù)差異是非常大的。以1000萬像素的手機(jī)圖片來說，同一個(gè)人的“高興”和“哭泣”圖像的差別可以達(dá)到800萬個(gè)像素點(diǎn)。如果用傳統(tǒng)算法是無法承受之重，但是對于神經(jīng)網(wǎng)絡(luò)模型來說卻是大有可為的。而真正的難點(diǎn)是工業(yè)領(lǐng)域的分類。以目前算法比較成熟的紅棗分類檢測舉例，以500萬像素的工業(yè)相機(jī)來說，不同類型紅棗之間的特征差異，可能只有幾百個(gè)像素，而且差異的像素深度很低。這個(gè)時(shí)候要準(zhǔn)確的進(jìn)行分類，就很難了。首先我們要選取合適的標(biāo)注方式，結(jié)合前文的介紹，紅棗的分類顯然更適合全圖分類方式進(jìn)行：1、使用自動圖片采集工具針對不同的樣品采集足夠的分類樣本。45AiI?kyЛ?Я:АПО@342.fBi8fi%IИй?ARiI%dl]Axi?%Шtc(AlB$'1':i?:%:Ш%(t,?%;1й%tr??AfwèèB146AI工業(yè)視覺解決方案白皮書3、進(jìn)行圖像標(biāo)注及模型訓(xùn)練，即可得到可用的深度學(xué)習(xí)分類模型。采用這種標(biāo)注方式實(shí)現(xiàn)深度學(xué)習(xí)圖像分類的好處是顯而易見的，首先缺陷過濾模型相對輕量級，模型訓(xùn)練用的圖片是“可能存在”缺陷的區(qū)域，相對于使用全局圖像訓(xùn)練，正負(fù)樣本的差異性會大很多，訓(xùn)練成熟網(wǎng)絡(luò)模型需要的圖像數(shù)量相對較少，模型復(fù)雜程度相對較低。其次數(shù)據(jù)標(biāo)注相對容易，效率更高，因?yàn)閿?shù)據(jù)標(biāo)注時(shí)都是針對指定區(qū)域截取的圖像塊，是否有缺陷是很明確的，不容易出錯(cuò)。字符識別47AI工業(yè)視覺解決方案白皮書基于深度學(xué)習(xí)的字符識別可以比較有效的解決這一問題，字符識別也是深度學(xué)習(xí)技術(shù)典型的應(yīng)用場景之一。在工業(yè)生產(chǎn)尤其是包裝生產(chǎn)線上，存在大量的包裝袋、包裝盒體上的生產(chǎn)日期、批號字符需要進(jìn)行檢測，利用深度學(xué)習(xí)進(jìn)行小樣本的訓(xùn)練即可獲得一個(gè)比較理想的深度學(xué)習(xí)模型，可以獲得良好的落地效果。深度學(xué)習(xí)與傳統(tǒng)算法的融合缺陷顏色比背景“深”48AI工業(yè)視覺解決方案白皮書缺陷顏色比背景“淺”對于背景單一，真實(shí)缺陷和干擾因素比較明顯的缺陷，可以用傳統(tǒng)BLOB分析的方法檢測出感興趣的缺陷區(qū)域?；凇白赃m應(yīng)缺陷檢測”的所有異常黑色區(qū)域上圖為金屬產(chǎn)品的表面碰傷檢測，基于傳統(tǒng)BLOB分析工具，可以把“真實(shí)缺陷”、“過真實(shí)缺陷”和“干擾因素”的差異。下圖是按照面積大小篩選后的結(jié)果，可以發(fā)現(xiàn)只有真實(shí)缺陷被檢測出來。49AI工業(yè)視覺解決方案白皮書基于“斑塊面積”過濾后的缺陷區(qū)域但是還有一些場景，通過傳統(tǒng)BLOB分析檢測出來的缺陷，很難通過如下可以量化的斑塊參數(shù)進(jìn)行過濾，這個(gè)時(shí)候就可以訓(xùn)練一個(gè)專門用來區(qū)分這些真實(shí)缺陷和干擾因素的模型來進(jìn)行過濾。基于傳統(tǒng)量化參數(shù)過濾缺陷斑塊50AI工業(yè)視覺解決方案白皮書基于傳統(tǒng)BLOB分析得出的所有異常區(qū)域上圖所示的真實(shí)缺陷和干擾因素很難通過面積、周長等可量化的斑塊指標(biāo)進(jìn)行過濾，這個(gè)時(shí)候就可以基于深度學(xué)習(xí)訓(xùn)練“斑塊過濾”模型來過濾干擾因素，從而只檢測出真實(shí)缺陷。相關(guān)步驟如下：51AI工業(yè)視覺解決方案白皮書訓(xùn)練用數(shù)據(jù)塊3、基于以上數(shù)據(jù)塊進(jìn)行“Y/N”標(biāo)注，將真實(shí)缺陷標(biāo)記為Y，不是缺陷標(biāo)記為N，訓(xùn)練過濾網(wǎng)絡(luò)模型。圖像標(biāo)記及訓(xùn)練52AI工業(yè)視覺解決方案白皮書4、再在傳統(tǒng)的自適應(yīng)缺陷檢測工具中啟用“深度學(xué)習(xí)”過濾模型，從而將干擾因素過濾掉。啟用深度學(xué)習(xí)過濾模型5、基于深度學(xué)習(xí)模型過濾后的圖像檢測結(jié)果，幾乎就和人眼判斷結(jié)果一致了。53AI工業(yè)視覺解決方

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2022年AI工業(yè)視覺解決方案白皮書

文檔簡介

溫馨提示

最新文檔

評論

2022年AI工業(yè)視覺解決方案白皮書

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔