版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)標(biāo)注行業(yè)分析報(bào)告 2022年數(shù)據(jù)標(biāo)注行業(yè)發(fā)展前景及規(guī)模分析數(shù)據(jù)標(biāo)注在人工智能產(chǎn)業(yè)中的地位人工智能作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力,將進(jìn)一步創(chuàng)造新的引擎,重構(gòu)生產(chǎn)、分配、交換、消費(fèi)等經(jīng)濟(jì)活動(dòng)各環(huán)節(jié),催生新技術(shù)、新產(chǎn)品、新產(chǎn)業(yè)、新業(yè)態(tài)、新模式。近年來(lái),我國(guó)政府高度重視人工智能的技術(shù)進(jìn)步與產(chǎn)業(yè)發(fā)展,目前人工智能已上升國(guó)家戰(zhàn)略。在全國(guó)人大常委會(huì)中提到要加強(qiáng)立法理論研究,重視對(duì)人工智能、區(qū)塊鏈、基因編輯等新技術(shù)新領(lǐng)域相關(guān)法律問(wèn)題的研究。人工智能技術(shù)的應(yīng)用正在改變著我們的生活。而在人工智能產(chǎn)業(yè)高速發(fā)展的背后,數(shù)據(jù)標(biāo)注師這個(gè)新職業(yè)的需求及人數(shù)也正在壯大。數(shù)據(jù)標(biāo)注行業(yè)流行著一句話,“有多少智能,就有多少人工
2、”。目前AI算法能學(xué)習(xí)的數(shù)據(jù),必須通過(guò)人力逐一標(biāo)注,這些人力被稱為“人工智能的老師”為人工智能搭建基礎(chǔ)。 目前,人工智能應(yīng)用主要以有監(jiān)督的深度學(xué)習(xí)算法為主,對(duì)于標(biāo)注數(shù)據(jù)有著強(qiáng)依賴性需求。相關(guān)數(shù)據(jù)顯示,到了2025年產(chǎn)生的數(shù)據(jù)量將高達(dá)163ZB,其中90%為非結(jié)構(gòu)化數(shù)據(jù),這些非結(jié)構(gòu)化的數(shù)據(jù)只有經(jīng)過(guò)清洗與標(biāo)注后才能被喚醒價(jià)值,這就產(chǎn)生了源源不斷的數(shù)據(jù)清洗與數(shù)據(jù)標(biāo)注需求。行業(yè)監(jiān)管體系及機(jī)構(gòu)介紹中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)(以下簡(jiǎn)稱中電標(biāo)協(xié)),是全國(guó)電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化組織和標(biāo)準(zhǔn)化工作者自愿組成的社會(huì)團(tuán)體。我國(guó)的電子信息行業(yè)的相關(guān)標(biāo)準(zhǔn)大多由該單位裁定。中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)(以下簡(jiǎn)稱中電標(biāo)協(xié)),是全國(guó)
3、電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化組織和標(biāo)準(zhǔn)化工作者自愿組成的社會(huì)團(tuán)體。中電標(biāo)協(xié)的對(duì)外英文名稱是:Chinese Electronics Standardization Association(英文縮寫為:CESA)。 中電標(biāo)協(xié)的性質(zhì)是:由全國(guó)電子信息產(chǎn)業(yè)各有關(guān)部門、各地區(qū)企、事業(yè)單位,各級(jí)標(biāo)準(zhǔn)化管理機(jī)構(gòu)、技術(shù)組織,廣大標(biāo)準(zhǔn)化工作者和科技人員自愿組成的行業(yè)性團(tuán)體,屬非營(yíng)利性社會(huì)組織。數(shù)據(jù)標(biāo)注行業(yè)流程分析1業(yè)務(wù)分析產(chǎn)品經(jīng)理與算法工程師要對(duì)業(yè)務(wù)進(jìn)行理解,明確原始數(shù)據(jù)的意義與數(shù)據(jù)標(biāo)注的價(jià)值。業(yè)務(wù)理解是所有產(chǎn)品工作的基礎(chǔ)。2確定原始數(shù)據(jù)與標(biāo)注結(jié)果產(chǎn)品經(jīng)理需要與算法工程師共同確認(rèn)原始數(shù)據(jù)及數(shù)據(jù)標(biāo)準(zhǔn)結(jié)果,并確定標(biāo)注工具。
4、數(shù)據(jù)標(biāo)注的結(jié)果必須得到算法工程師確認(rèn),確保后續(xù)建模過(guò)程的順利開展。3撰寫標(biāo)注教程在確認(rèn)原始數(shù)據(jù)與標(biāo)注結(jié)果后,產(chǎn)品經(jīng)理需要撰寫標(biāo)注教程。標(biāo)注教程就好像軟件說(shuō)明書,需要將標(biāo)注過(guò)程按順序一一列出。標(biāo)注教程包含4個(gè)要素:標(biāo)注軟件(平臺(tái))標(biāo)注要求、標(biāo)注對(duì)象、標(biāo)注流程。撰寫的標(biāo)注教程同樣需要得到算法工程師確認(rèn)。4數(shù)據(jù)標(biāo)注該過(guò)程為數(shù)據(jù)標(biāo)注過(guò)程,產(chǎn)品經(jīng)理需要不定時(shí)進(jìn)行標(biāo)注結(jié)果抽查。5標(biāo)注結(jié)果驗(yàn)收產(chǎn)品經(jīng)理與算法工程師共同對(duì)標(biāo)注結(jié)果進(jìn)行質(zhì)量驗(yàn)收,驗(yàn)收不合格需要搞清異常原因并重新標(biāo)注。對(duì)于有行業(yè)壁壘的數(shù)據(jù),標(biāo)準(zhǔn)準(zhǔn)確性需要行業(yè)專家進(jìn)行判斷。針對(duì)不同的數(shù)據(jù)類型有不同的標(biāo)注工具。圖像類標(biāo)注可以使用LabelMe,文本標(biāo)注
5、可以使用Brat或DeepDive等,當(dāng)然還有很多后期的標(biāo)注平臺(tái)可以使用。圖表:數(shù)據(jù)標(biāo)注的流程通常分為五個(gè)步驟資料來(lái)源:中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模分析數(shù)據(jù)表明,中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模逐年增長(zhǎng)。2016年中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模為11.18億元。2020年中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模為36.30億元增長(zhǎng)了17.48 %。由此可見(jiàn),中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模呈現(xiàn)逐年增長(zhǎng)的態(tài)勢(shì),但每年的增長(zhǎng)率不穩(wěn)定。2016-2021中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模如下:圖表:2016-2021年中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模走勢(shì)中國(guó)數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)痛點(diǎn)分析目前中國(guó)數(shù)據(jù)標(biāo)注行業(yè)面臨的主要問(wèn)題為本身的局限性、平臺(tái)管理水平落后、供應(yīng)鏈整合
6、度低、行業(yè)服務(wù)無(wú)序化與研發(fā)設(shè)計(jì)能力不足。圖表:數(shù)據(jù)標(biāo)注行業(yè)面臨的問(wèn)題分析資料來(lái)源:中國(guó)數(shù)據(jù)標(biāo)注行業(yè)發(fā)展趨勢(shì)預(yù)判數(shù)據(jù)標(biāo)注行業(yè)目前正處于野蠻生長(zhǎng)時(shí)代,在高速發(fā)展的同時(shí),也面臨著諸多挑戰(zhàn),比如人機(jī)協(xié)作能力欠缺,依賴眾包、轉(zhuǎn)包模式,標(biāo)注結(jié)果質(zhì)量參差不齊,隱私泄露風(fēng)險(xiǎn)較大等。隨著AI商業(yè)化落地進(jìn)程的加快以及數(shù)據(jù)服務(wù)商的需求變化,數(shù)據(jù)標(biāo)注行業(yè)也逐步從幼兒期步入成長(zhǎng)期,并將在未來(lái)呈現(xiàn)出新的發(fā)展趨勢(shì):一是場(chǎng)景化、定制化將成為主流。精細(xì)化、場(chǎng)景化、專業(yè)化的數(shù)據(jù)采集標(biāo)注才能滿足日益增長(zhǎng)的人工智能細(xì)分場(chǎng)景、專業(yè)垂直的賦能需求,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)將不斷向著專業(yè)服務(wù)化方向發(fā)展。二是,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)將由單模態(tài)向多模態(tài)標(biāo)注發(fā)展。多模態(tài)是指對(duì)多維時(shí)間、空間、環(huán)境數(shù)據(jù)的感知與融合,比如我們熟知的“以圖搜圖”功能就是使用了圖像、文本和高層語(yǔ)義屬性等多模態(tài)下的信息融合才得以實(shí)現(xiàn)的。未來(lái),數(shù)據(jù)標(biāo)注服務(wù)企業(yè)要基于AI技術(shù)發(fā)展的多模態(tài)特征要求,掌握對(duì)多維傳感器融合的數(shù)據(jù)采集與標(biāo)注的能力,才能在更多場(chǎng)景、更多業(yè)務(wù)上輔助人類工作。三是,人機(jī)耦合新型標(biāo)注
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 年度藥物運(yùn)載系統(tǒng)藥品市場(chǎng)分析及競(jìng)爭(zhēng)策略分析報(bào)告
- 2024版?zhèn)€體運(yùn)輸戶與大車司機(jī)合作協(xié)議
- 墊層防水施工方案
- 2025年度個(gè)人醫(yī)療借款擔(dān)保合同模板2篇
- 2025年度社區(qū)便利店酒水新品引進(jìn)及銷售合作協(xié)議3篇
- 2025年新型打樁技術(shù)勞務(wù)分包合同范本4篇
- 二零二五版藥品質(zhì)量檢驗(yàn)試劑定制研發(fā)合同3篇
- CECT品牌定位及傳播策略
- 2024中考模擬考試語(yǔ)文試卷(一模)含答案
- 2025年模具行業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化建設(shè)合同4篇
- 安徽省淮南四中2025屆高二上數(shù)學(xué)期末統(tǒng)考模擬試題含解析
- 2025屆重慶南開中學(xué)數(shù)學(xué)高二上期末教學(xué)質(zhì)量檢測(cè)試題含解析
- 2024年重點(diǎn)信訪人員穩(wěn)控實(shí)施方案
- 保險(xiǎn)專題課件教學(xué)課件
- 常見(jiàn)癥狀腹痛課件
- 《生活垃圾的回收與利用》(教案)-2024-2025學(xué)年四年級(jí)上冊(cè)綜合實(shí)踐活動(dòng)教科版
- 汽車租賃行業(yè)的利潤(rùn)空間分析
- 電商代運(yùn)營(yíng)合作協(xié)議書2024年
- 2024年中考英語(yǔ)閱讀理解D篇真題匯編(附答案)0117
- 牛津上海版小學(xué)英語(yǔ)一年級(jí)上冊(cè)同步練習(xí)試題(全冊(cè))
- 多數(shù)據(jù)中心數(shù)據(jù)同步保存
評(píng)論
0/150
提交評(píng)論