信息技術(shù) 人工智能 面向機(jī)器學(xué)習(xí)的系統(tǒng)框架和功能要求_第1頁
信息技術(shù) 人工智能 面向機(jī)器學(xué)習(xí)的系統(tǒng)框架和功能要求_第2頁
信息技術(shù) 人工智能 面向機(jī)器學(xué)習(xí)的系統(tǒng)框架和功能要求_第3頁
信息技術(shù) 人工智能 面向機(jī)器學(xué)習(xí)的系統(tǒng)框架和功能要求_第4頁
信息技術(shù) 人工智能 面向機(jī)器學(xué)習(xí)的系統(tǒng)框架和功能要求_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

ICS35.240在提交反饋意見時,請將您知道的相關(guān)專利連同

L70支持性文件一并附上

團(tuán)體標(biāo)準(zhǔn)

T/CESAXXXX—XXXX

信息技術(shù)人工智能面向機(jī)器學(xué)習(xí)的系統(tǒng)

框架和功能要求

Informationtechnology-Artificialintelligence-Frameworkandfunctional

requirementsofsystemformachinelearning

(征求意見稿)

XXXX-XX-XX發(fā)布XXXX-XX-XX實施

中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會發(fā)布

T/XXXXXXXX—XXXX

前??言

本部分按照GB/T1.1—2009給出的規(guī)則起草。

請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別這些專利的責(zé)任。

本標(biāo)準(zhǔn)由中國電子技術(shù)標(biāo)準(zhǔn)化研究院提出并歸口。

本標(biāo)準(zhǔn)起草單位:

本標(biāo)準(zhǔn)主要起草人:

III

T/XXXXXXXX—XXXX

信息技術(shù)人工智能面向機(jī)器學(xué)習(xí)的系統(tǒng)框架和功能要求

1范圍

本標(biāo)準(zhǔn)給出了面向機(jī)器學(xué)習(xí)的人工智能系統(tǒng)框架,規(guī)定了系統(tǒng)整體及各組件的功能要求。

本標(biāo)準(zhǔn)適用于各領(lǐng)域人工智能系統(tǒng)及解決方案的規(guī)劃、設(shè)計,可作為評估、選型及驗收的依據(jù)。

2規(guī)范性引用文件

下列文件對于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機(jī)器學(xué)習(xí)

GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)

3術(shù)語和定義

3.1

機(jī)器學(xué)習(xí)引擎machinelearningengine

提供機(jī)器學(xué)習(xí)開發(fā)及運(yùn)行的計算組件。

3.2

算法服務(wù)algorithmservice

算法在推理部署后的運(yùn)行態(tài)。

注:算法服務(wù)接受用戶的應(yīng)用請求,對輸入數(shù)據(jù)進(jìn)行處理,返回處理結(jié)果。

3.3

作業(yè)job

機(jī)器學(xué)習(xí)訓(xùn)練或推理任務(wù)的邏輯組合。

注:一個作業(yè)屬于且僅屬于某一個資源池,一個作業(yè)包括一個或多個任務(wù)。

3.4

任務(wù)task

被調(diào)度的訓(xùn)練/推理對象。

注:任務(wù)用于完成一個相對獨立的業(yè)務(wù)功能。一個任務(wù)屬于且僅屬于一個作業(yè)。

3.5

資源池ResourcePool

1

T/XXXXXXXX—XXXX

各類資源的集合。

4縮略語

下列縮略語適用于本文件。

AI:人工智能(ArtificialIntelligence)

ASIC:專用集成電路(Application-SpecificIntegratedCircuit)

CPU:中央處理器(CentralProcessingUnit)

DAG:有向無環(huán)圖(DirectedAcyclicGraph)

FPGA:現(xiàn)場可編程邏輯門陣列(FieldProgrammableGateArray)

GPU:圖形處理器(GraphicProcessingUnit)

IDE:集成開發(fā)環(huán)境(IntegratedDevelopmentEnvironment)

NLP:自然語言處理(NaturalLanguageProcessing)

REST:表現(xiàn)層狀態(tài)轉(zhuǎn)換(RepresentationalStateTransfer)

5系統(tǒng)概述與框架

5.1概述

面向機(jī)器學(xué)習(xí)的系統(tǒng)包括機(jī)器學(xué)習(xí)、多算法管理、異構(gòu)資源調(diào)度等核心能力,提供數(shù)據(jù)預(yù)處理、特

征工程、模型開發(fā)、模型訓(xùn)練、模型推理服務(wù)發(fā)布的端到端能力。

系統(tǒng)提供應(yīng)用場景所需的各類基礎(chǔ)設(shè)施,包括各種異構(gòu)計算單元(例如CPU、GPU、FPGA、ASIC等),

存儲(例如分布式云存儲),網(wǎng)絡(luò)等資源,結(jié)合實際任務(wù)進(jìn)行分布式調(diào)度,提供按需分配、統(tǒng)一智能編

排、動態(tài)調(diào)度、彈性伸縮及自動管理等能力。通過統(tǒng)一管理、動態(tài)更新模型庫,提供機(jī)器學(xué)習(xí)算法的開

發(fā)、訓(xùn)練、部署、運(yùn)行和管理能力。各類機(jī)器學(xué)習(xí)算法通過有效組合,構(gòu)成視頻、圖像、語音、自然語

言處理等領(lǐng)域的算法服務(wù),支持各領(lǐng)域AI應(yīng)用。

面向機(jī)器學(xué)習(xí)的系統(tǒng)應(yīng)具備數(shù)據(jù)管理(數(shù)據(jù)輸入、輸出、元數(shù)據(jù)管理、數(shù)據(jù)生命周期管理等)和運(yùn)

維管理等能力(多用戶管理、多租戶管理、監(jiān)控告警等),提供各組件及子模塊間的標(biāo)準(zhǔn)化接口。

5.2系統(tǒng)框架

面向機(jī)器學(xué)習(xí)的人工智能系統(tǒng)框架見圖1。

2

T/XXXXXXXX—XXXX

圖1面向機(jī)器學(xué)習(xí)的AI系統(tǒng)框架

5.2.1數(shù)據(jù)管理

數(shù)據(jù)的全生命周期管理,包含收集、預(yù)處理、分析、可視化及訪問過程。數(shù)據(jù)管理包括各類數(shù)據(jù)源

(結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù))的接入,中間數(shù)據(jù)的管理、最終數(shù)據(jù)的管理、元數(shù)據(jù)的管理、數(shù)

據(jù)質(zhì)量管理、數(shù)據(jù)的標(biāo)注,并提供統(tǒng)一的數(shù)據(jù)管理工具等。

5.2.2異構(gòu)資源池

異構(gòu)資源池統(tǒng)籌管理機(jī)器學(xué)習(xí)所需的各類計算、存儲和網(wǎng)絡(luò)資源。計算資源可包含不同類別的計算

硬件,如CPU、GPU、FPGA、ASIC等,提供適合與應(yīng)用場景的運(yùn)算資源(如高效節(jié)能的處理器)。存儲資

源包括不限于緩存、主存、輔存等各級存儲。網(wǎng)絡(luò)資源包括不限于異構(gòu)單元間、計算節(jié)點間或集群間的

互聯(lián)網(wǎng)絡(luò)。異構(gòu)資源可以不同形態(tài),如服務(wù)器、一體機(jī)、邊緣計算節(jié)點、計算集群和云基礎(chǔ)設(shè)施等方式

提供。

異構(gòu)資源池支持資源的動態(tài)調(diào)度、按需(數(shù)據(jù)規(guī)模、算法模型、實時性要求等)分配,滿足計算任

務(wù)的資源需求。資源池能夠靈活集成各類計算單元并發(fā)揮其各自特性,構(gòu)建異構(gòu)計算節(jié)點,節(jié)點內(nèi)實現(xiàn)

多粒度并行和任務(wù)調(diào)度,節(jié)點間實現(xiàn)協(xié)同調(diào)度,基于網(wǎng)絡(luò)提供系統(tǒng)擴(kuò)展并優(yōu)化互聯(lián)性能,支撐部署大規(guī)

模AI計算框架和相關(guān)算法。

5.2.3分布式計算調(diào)度

分布式計算調(diào)度分為任務(wù)調(diào)度和資源調(diào)度。任務(wù)調(diào)度是根據(jù)應(yīng)用特性和運(yùn)算需求將應(yīng)用負(fù)載分解成

任務(wù),并配置任務(wù)執(zhí)行的順序和優(yōu)先級。資源調(diào)度依據(jù)應(yīng)用對資源的需求,將合適的異構(gòu)資源分配給特

定任務(wù),滿足任務(wù)對運(yùn)算性能和時間的要求。多任務(wù)應(yīng)共享資源以優(yōu)化資源使用率。

3

T/XXXXXXXX—XXXX

分布式計算調(diào)度是人工智能系統(tǒng)的重要能力,在對計算、存儲、網(wǎng)絡(luò)等異構(gòu)資源的統(tǒng)一納管的基礎(chǔ)

上,系統(tǒng)根據(jù)資源標(biāo)簽將任務(wù)優(yōu)化調(diào)度,以容器形式支持任務(wù)的大規(guī)模部署。

5.2.4機(jī)器學(xué)習(xí)引擎

機(jī)器學(xué)習(xí)引擎基于各類機(jī)器學(xué)習(xí)算法(例如統(tǒng)計機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等)進(jìn)

行模型訓(xùn)練、優(yōu)化、推理。機(jī)器學(xué)習(xí)引擎支持開源的計算框架、算法庫,兼容開源的主流接口,可根據(jù)

商用的要求在企業(yè)版本中增強(qiáng)或優(yōu)化。

機(jī)器學(xué)習(xí)算法庫為算法提供安全可靠的管理功能,包括算法的注冊、存儲、下載、評價、優(yōu)化以及

用戶鑒權(quán)、多版本管理、升級維護(hù)、運(yùn)行監(jiān)控等。

按算法需求,機(jī)器學(xué)習(xí)引擎提供特征數(shù)據(jù)的選擇、提取、構(gòu)建等功能。

5.2.5模型庫

模型庫提供對機(jī)器學(xué)習(xí)模型開發(fā)和存儲管理能力。

模型管理包括預(yù)置常用的AI模型,以及支持模型導(dǎo)入、導(dǎo)出、更新、發(fā)布、遷移、版本控制等功能。

模型開發(fā)通過可視化輔助開發(fā)工具、多模型融合開發(fā)、模型二次訓(xùn)練等方式支持模型的開發(fā)與部署。

5.2.6算法服務(wù)

算法服務(wù)是AI應(yīng)用訪問、利用機(jī)器學(xué)習(xí)能力和資源的主要方式。為滿足應(yīng)用場景的需求,系統(tǒng)提供

各類通用算法服務(wù)(例如視頻、圖像、語音、自然語言處理等)。系統(tǒng)提供統(tǒng)一算法服務(wù)框架,進(jìn)行服

務(wù)管理、服務(wù)運(yùn)行狀態(tài)監(jiān)控、服務(wù)上線等,并提供一致性的服務(wù)接口,供各領(lǐng)域上層應(yīng)用調(diào)用。

5.2.7運(yùn)維管理

運(yùn)維管理提供系統(tǒng)所需的基本運(yùn)維(例如安裝部署、擴(kuò)展、監(jiān)控、告警、健康檢查、問題及故障定

位、升級和補(bǔ)丁、備份恢復(fù)、操作審計等)及管理功能(例如資源管理、權(quán)限管理、用戶管理、日志管

理、配置管理、安全管理等)。

5.2.8應(yīng)用層

面向機(jī)器學(xué)習(xí)的AI系統(tǒng)可為各類應(yīng)用(例如智慧交通、智能制造、智慧家庭、智慧城市、車聯(lián)網(wǎng)等)

提供支持,按應(yīng)用需求提供系統(tǒng)資源,支持企業(yè)級、商業(yè)級的AI應(yīng)用。

5.2.9接口

面向機(jī)器學(xué)習(xí)的AI系統(tǒng)在應(yīng)用層、算法服務(wù)、機(jī)器學(xué)習(xí)引擎、模型庫、分布式計算調(diào)度、異構(gòu)資源

池、數(shù)據(jù)管理、運(yùn)維管理等模塊間、及模塊內(nèi)提供接口支持信息傳遞及互操作。

接口應(yīng)遵循業(yè)界常見的架構(gòu)和協(xié)議(例如REST),兼容主流開源框架的接口。

6功能要求

6.1總體要求

面向機(jī)器學(xué)習(xí)的AI系統(tǒng)應(yīng)支持各領(lǐng)域不同場景AI應(yīng)用對機(jī)器學(xué)習(xí)引擎、模型庫、數(shù)據(jù)管理、異構(gòu)資

源池、分布式計算調(diào)度、算法服務(wù)、運(yùn)維管理及接口等方面的要求。

系統(tǒng)從功能設(shè)計上應(yīng)符合開放性(分層解耦、各層級可獨立演進(jìn))、高可靠和可用性(避免單點故

障、保證服務(wù)等級協(xié)議要求等)、統(tǒng)一性(統(tǒng)一的算法服務(wù)框架和接口框架)、可擴(kuò)展性(從算法服務(wù)、

4

T/XXXXXXXX—XXXX

機(jī)器學(xué)習(xí)引擎、資源供給、接口等各層面支持業(yè)務(wù)的靈活部署與彈性擴(kuò)展)、易管理及運(yùn)維、安全等核

心要求。應(yīng)支持業(yè)界主流的AI算法、編程模型、計算框架,針對各類使用場景設(shè)計應(yīng)用層,并提供符合

用戶習(xí)慣的分析、開發(fā)和交互接口和開發(fā)文檔支持。

6.2數(shù)據(jù)管理

數(shù)據(jù)管理的要求包括:

a)應(yīng)支持各類數(shù)據(jù)源,包括結(jié)構(gòu)化數(shù)據(jù)(例如傳統(tǒng)關(guān)系型數(shù)據(jù)庫),半結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)

據(jù)(例如圖片、音頻、視頻等);

b)應(yīng)支持引入和解析常見文件和數(shù)據(jù)格式(例如parquet、carbondata等);

c)應(yīng)支持對數(shù)據(jù)進(jìn)行標(biāo)注;

d)應(yīng)提供數(shù)據(jù)生命周期管理,可以對中間數(shù)據(jù)及產(chǎn)出數(shù)據(jù)進(jìn)行增刪改查及數(shù)據(jù)檢索等操作;

e)應(yīng)提供數(shù)據(jù)訪問及權(quán)限控制;

f)應(yīng)提供數(shù)據(jù)IDE工具,支持?jǐn)?shù)據(jù)可視化;

g)宜支持多種元數(shù)據(jù)管理方法(例如數(shù)據(jù)元信息生成、增刪改查、元數(shù)據(jù)分類、血緣管理等);

h)宜支持多種數(shù)據(jù)預(yù)處理手段(例如數(shù)據(jù)的聚合、過濾、排序等);

i)宜支持常見的多媒體文件格式的元數(shù)據(jù)信息獲取與管理。

6.3異構(gòu)資源池

異構(gòu)資源池的要求包括:

a)應(yīng)支持CPU加異構(gòu)計算單元的架構(gòu),通過異構(gòu)計算顯著提升計算性能;

b)應(yīng)支持異構(gòu)資源池化,對異構(gòu)資源模塊進(jìn)行統(tǒng)一管理、配置、編排,提升資源利用率;

c)應(yīng)支持以容器化提供資源,利用容器技術(shù)對異構(gòu)資源提供統(tǒng)一調(diào)度和管理,支持對接主流深度

學(xué)習(xí)計算框架;

d)應(yīng)支持資源池內(nèi)CPU和異構(gòu)計算單元的不同配比;

e)應(yīng)支持中心集群與邊緣節(jié)點的統(tǒng)一管理;

f)應(yīng)支持本地與遠(yuǎn)程計算資源的統(tǒng)一管理;

g)宜支持大規(guī)模高性能計算集群的資源管理;

h)宜支持異構(gòu)資源的高性能互聯(lián)。

6.4分布式計算調(diào)度

6.4.1任務(wù)調(diào)度

任務(wù)調(diào)度的要求包括:

a)應(yīng)支持模型訓(xùn)練和推理的任務(wù)調(diào)度,支持基于主流開源框架的計算任務(wù);

b)應(yīng)支持大規(guī)模任務(wù)容器化調(diào)度,支持系統(tǒng)在物理機(jī)或虛擬機(jī)上的部署;

c)應(yīng)支持任務(wù)跨集群調(diào)度,本地任務(wù)可調(diào)度到另一個集群中計算;

d)應(yīng)支持基于任務(wù)的有向無環(huán)圖進(jìn)行計算調(diào)度;

e)應(yīng)提供任務(wù)調(diào)度及資源使用的視圖;

f)宜支持定義作業(yè)的優(yōu)先級,支持定時作業(yè)、超時作業(yè)、重試作業(yè)設(shè)置。

6.4.2資源調(diào)度

資源調(diào)度的要求包括:

a)應(yīng)支持對異構(gòu)資源池統(tǒng)一調(diào)度,支持資源池的動態(tài)伸縮;

5

T/XXXXXXXX—XXXX

b)應(yīng)支持根據(jù)資源標(biāo)簽調(diào)度及下發(fā)任務(wù);

c)應(yīng)支持統(tǒng)一的調(diào)度接口,調(diào)度不同類型的異構(gòu)資源;

d)應(yīng)支持多級資源池靈活調(diào)度和共享;

e)應(yīng)提供GPU池化,支持分時復(fù)用GPU資源。

6.5機(jī)器學(xué)習(xí)引擎

6.5.1訓(xùn)練與推理

訓(xùn)練與推理的要求包括:

a)應(yīng)支持主流開源計算框架(例如Tensorflow,Caffe,PyTorch);

b)應(yīng)支持多種類型的統(tǒng)計機(jī)器學(xué)習(xí)算法:

1)監(jiān)督學(xué)習(xí)算法(例如邏輯回歸,支持向量機(jī),梯度提升決策樹);

2)非監(jiān)督學(xué)習(xí)算法(例如聚類算法,關(guān)聯(lián)規(guī)則學(xué)習(xí));

c)應(yīng)支持多種類型的深度學(xué)習(xí)算法(例如卷積神經(jīng)網(wǎng)絡(luò),遞歸神經(jīng)網(wǎng)絡(luò)等);

d)應(yīng)支持主流深度學(xué)習(xí)框架模型鏡像的發(fā)布管理、版本管理,以及服務(wù)實例、資源的動態(tài)伸縮調(diào)

度;

e)宜根據(jù)算法需求,支持特征的選擇、提取和構(gòu)建。

6.5.2機(jī)器學(xué)習(xí)算法庫

機(jī)器學(xué)習(xí)算法庫的要求包括:

a)應(yīng)支持算法的統(tǒng)一注冊和管理;

b)應(yīng)提供算法訓(xùn)練的日志及中間結(jié)果分析功能;

c)應(yīng)提供多種形式的建模方式(例如拖拽式DAG圖、Notebook等);

d)應(yīng)為集成提供標(biāo)準(zhǔn)接口(例如REST);

e)宜支持算法的分布式訓(xùn)練,提供高性能運(yùn)算能力;

f)宜支持算法優(yōu)化;

g)宜支持算法參數(shù)調(diào)節(jié)功能,提供推薦參數(shù)幫助用戶進(jìn)行調(diào)參。

6.6模型庫

模型庫提供適用于應(yīng)用場景的模型功能,包括:

a)應(yīng)具備模型的導(dǎo)入導(dǎo)出、更新、版本管理、權(quán)限控制等基礎(chǔ)功能;

b)應(yīng)預(yù)置常用AI模型,集成典型機(jī)器學(xué)習(xí)模型,支持模型的二次訓(xùn)練,提升模型在應(yīng)用場景下

的效果;

c)工作流應(yīng)支持多模型的融合開發(fā);

d)應(yīng)提供可視化開發(fā)和管理界面;

e)應(yīng)基于多租戶的權(quán)限控制,實現(xiàn)模型的安全管控;

f)應(yīng)提供模型封裝和發(fā)布的能力,通過統(tǒng)一的接口提供模型服務(wù)的調(diào)用。

6.7算法服務(wù)

算法服務(wù)的要求包括:

a)應(yīng)提供一種或多種算法服務(wù)(例如圖像、視頻、語音、自然語言處理等);

b)應(yīng)支持在不影響現(xiàn)有算法服務(wù)能力的前提下,部署新的算法服務(wù);

c)應(yīng)支持算法服務(wù)的增刪啟停、服務(wù)版本管理、服務(wù)歷史記錄、服務(wù)當(dāng)前狀態(tài)的查詢等;

6

T/XXXXXXXX—XXXX

d)應(yīng)支持一種或多種離線服務(wù)(例如模型自學(xué)習(xí)服務(wù)、批量推理服務(wù)等);

e)應(yīng)支持一種或多種在線實時服務(wù)(例如實時推理服務(wù)等);

f)應(yīng)支持多用戶同時使用算法服務(wù);

g)應(yīng)支持配置用戶權(quán)限,控制用戶所能調(diào)用的算法服務(wù);

h)應(yīng)支持同一算法服務(wù)的多實例部署;

i)應(yīng)支持不同算法服務(wù)并發(fā)調(diào)用,各服務(wù)獨立運(yùn)行;

j)應(yīng)支持在多用戶、高并發(fā)情況下的流量負(fù)載均衡,保證服務(wù)穩(wěn)定運(yùn)行;

k)應(yīng)提供通用簡便的服務(wù)上線流程,提供統(tǒng)一服務(wù)框架;

l)應(yīng)提供統(tǒng)一、易用的算法服務(wù)接口框架。

6.8運(yùn)維管理

運(yùn)維管理的要求包括:

a)應(yīng)提供多用戶管理,支持多用戶的權(quán)限管理(例如增刪改查),及支持常用的認(rèn)證系統(tǒng);

b)應(yīng)提供多租戶管理,支持租戶間的應(yīng)用隔離、數(shù)據(jù)隔離、資源隔離、運(yùn)行隔離;

c)應(yīng)提供安裝與升級能力,支持分發(fā)安裝包、數(shù)據(jù)或模型參數(shù)文件,進(jìn)行安裝、升級、擴(kuò)展和回

滾;

d)應(yīng)提供備份與恢復(fù)能力,支持安裝包、數(shù)據(jù)或模型參數(shù)文件的備份,以供故障后的系統(tǒng)恢復(fù);

e)應(yīng)提供運(yùn)行環(huán)境的監(jiān)控能力,包括底層資源的統(tǒng)一監(jiān)控(例如CPU利用率、系統(tǒng)負(fù)載等);

f)應(yīng)提供日志管理,可以根據(jù)日志進(jìn)行故障定位及排查;

g)應(yīng)提供針對監(jiān)控指標(biāo)及日志的告警能力;

h)宜提供主要監(jiān)控指標(biāo)的可視化展示功能。

_________________________________

7

T/XXXXXXXX—XXXX

中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(CESA)是全國電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化組織和標(biāo)準(zhǔn)化工作者自愿組成的

社會團(tuán)體。廣泛聯(lián)系全國電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化機(jī)構(gòu)和標(biāo)準(zhǔn)化工作者,協(xié)助政府部門搞好電子信息產(chǎn)業(yè)標(biāo)

準(zhǔn)化工作,開拓信息技術(shù)領(lǐng)域的標(biāo)準(zhǔn)化工作是中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會的主要工作內(nèi)容之一。中國

境內(nèi)從事科研開發(fā)、制造、營銷和服務(wù)的企事業(yè)單位、高等院校、社會組織和個人均可隨時向中國電子

工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會團(tuán)體標(biāo)準(zhǔn)工作部提出團(tuán)體標(biāo)準(zhǔn)項目建議。

中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會標(biāo)準(zhǔn)按照《電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會協(xié)會團(tuán)體標(biāo)準(zhǔn)管理辦法》進(jìn)行制

定和管理。

在本標(biāo)準(zhǔn)實施過程中,如發(fā)現(xiàn)需要修改或補(bǔ)充之處,請將意見和有關(guān)資料寄至中國電子工業(yè)標(biāo)準(zhǔn)化

技術(shù)協(xié)會,以便修訂時參考。

本標(biāo)準(zhǔn)版權(quán)歸中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會所有。

中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會地址:北京市海淀區(qū)萬壽路27號

電話子郵箱:standards@

網(wǎng)址:

8

T/XXXXXXXX—XXXX

目??次

前??言.............................................................................................................................................................III

1范圍...................................................................................................................................................................1

2規(guī)范性引用文件...............................................................................................................................................1

3術(shù)語和定義.......................................................................................................................................................1

4縮略語...............................................................................................................................................................2

5系統(tǒng)概述與框架...............................................................................................................................................2

5.1概述...........................................................................................................................................................2

5.2系統(tǒng)框架...................................................................................................................................................2

6功能要求...........................................................................................................................................................4

6.1總體要求...................................................................................................................................................4

6.2數(shù)據(jù)管理...................................................................................................................................................5

6.3異構(gòu)資源池...............................................................................................................................................5

6.4分布式計算調(diào)度.......................................................................................................................................5

6.5機(jī)器學(xué)習(xí)引擎...........................................................................................................................................6

6.6模型庫.......................................................................................................................................................6

6.7算法服務(wù)...................................................................................................................................................6

6.8運(yùn)維管理...................................................................................................................................................7

II

T/XXXXXXXX—XXXX

信息技術(shù)人工智能面向機(jī)器學(xué)習(xí)的系統(tǒng)框架和功能要求

1范圍

本標(biāo)準(zhǔn)給出了面向機(jī)器學(xué)習(xí)的人工智能系統(tǒng)框架,規(guī)定了系統(tǒng)整體及各組件的功能要求。

本標(biāo)準(zhǔn)適用于各領(lǐng)域人工智能系統(tǒng)及解決方案的規(guī)劃、設(shè)計,可作為評估、選型及驗收的依據(jù)。

2規(guī)范性引用文件

下列文件對于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機(jī)器學(xué)習(xí)

GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)

3術(shù)語和定義

3.1

機(jī)器學(xué)習(xí)引擎machinelearningengine

提供機(jī)器學(xué)習(xí)開發(fā)及運(yùn)行的計算組件。

3.2

算法服務(wù)algorithmservice

算法在推理部署后的運(yùn)行態(tài)。

注:算法服務(wù)接受用戶的應(yīng)用請求,對輸入數(shù)據(jù)進(jìn)行處理,返回處理結(jié)果。

3.3

作業(yè)job

機(jī)器學(xué)習(xí)訓(xùn)練或推理任務(wù)的邏輯組合。

注:一個作業(yè)屬于且僅屬于某一個資源池,一個作業(yè)包括一個或多個任務(wù)。

3.4

任務(wù)task

被調(diào)度的訓(xùn)練/推理對象。

注:任務(wù)用于完成一個相對獨立的業(yè)務(wù)功能。一個任務(wù)屬于且僅屬于一個作業(yè)。

3.5

資源池ResourcePool

1

T/XXXXXXXX—XXXX

各類資源的集合。

4縮略語

下列縮略語適用于本文件。

AI:人工智能(ArtificialIntelligence)

ASIC:專用集成電路(Application-SpecificIntegratedCircuit)

CPU:中央處理器(CentralProcessingUnit)

DAG:有向無環(huán)圖(DirectedAcyclicGraph)

FPGA:現(xiàn)場可編程邏輯門陣列(FieldProgrammableGateArray)

GPU:圖形處理器(GraphicProcessingUnit)

IDE:集成開發(fā)環(huán)境(IntegratedDevelopmentEnvironment)

NLP:自然語言處理(NaturalLanguageProcessing)

REST:表現(xiàn)層狀態(tài)轉(zhuǎn)換(RepresentationalStateTransfer)

5系統(tǒng)概述與框架

5.1概述

面向機(jī)器學(xué)習(xí)的系統(tǒng)包括機(jī)器學(xué)習(xí)、多算法管理、異構(gòu)資源調(diào)度等核心能力,提供數(shù)據(jù)預(yù)處理、特

征工程、模型開發(fā)、模型訓(xùn)練、模型推理服務(wù)發(fā)布的端到端能力。

系統(tǒng)提供應(yīng)用場景所需的各類基礎(chǔ)設(shè)施,包括各種異構(gòu)計算單元(例如CPU、GPU、FPGA、ASIC等),

存儲(例如分布式云存儲),網(wǎng)絡(luò)等資源,結(jié)合實際任務(wù)進(jìn)行分布式調(diào)度,提供按需分配、統(tǒng)一智能編

排、動態(tài)調(diào)度、彈性伸縮及自動管理等能力。通過統(tǒng)一管理、動態(tài)更新模型庫,提供機(jī)器學(xué)習(xí)算法的開

發(fā)、訓(xùn)練、部署、運(yùn)行和管理能力。各類機(jī)器學(xué)習(xí)算法通過有效組合,構(gòu)成視頻、圖像、語音、自然語

言處理等領(lǐng)域的算法服務(wù),支持各領(lǐng)域AI應(yīng)用。

面向機(jī)器學(xué)習(xí)的系統(tǒng)應(yīng)具備數(shù)據(jù)管理(數(shù)據(jù)輸入、輸出、元數(shù)據(jù)管理、數(shù)據(jù)生命周期管理等)和運(yùn)

維管理等能力(多用戶管理、多租戶管理、監(jiān)控告警等),提供各組件及子模塊間的標(biāo)準(zhǔn)化接口。

5.2系統(tǒng)框架

面向機(jī)器學(xué)習(xí)的人工智能系統(tǒng)框架見圖1。

2

T/XXXXXXXX—XXXX

圖1面向機(jī)器學(xué)習(xí)的AI系統(tǒng)框架

5.2.1數(shù)據(jù)管理

數(shù)據(jù)的全生命周期管理,包含收集、預(yù)處理、分析、可視化及訪問過程。數(shù)據(jù)管理包括各類數(shù)據(jù)源

(結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù))的接入,中間數(shù)據(jù)的管理、最終數(shù)據(jù)的管理、元數(shù)據(jù)的管理、數(shù)

據(jù)質(zhì)量管理、數(shù)據(jù)的標(biāo)注,并提供統(tǒng)一的數(shù)據(jù)管理工具等。

5.2.2異構(gòu)資源池

異構(gòu)資源池統(tǒng)籌管理機(jī)器學(xué)習(xí)所需的各類計算、存儲和網(wǎng)絡(luò)資源。計算資源可包含不同類別的計算

硬件,如CPU、GPU、FPGA、ASIC等,提供適合與應(yīng)用場景的運(yùn)算資源(如高效節(jié)能的處理器)。存儲資

源包括不限于緩存、主存、輔存等各級存儲。網(wǎng)絡(luò)資源包括不限于異構(gòu)單元間、計算節(jié)點間或集群間的

互聯(lián)網(wǎng)絡(luò)。異構(gòu)資源可以不同形態(tài),如服務(wù)器、一體機(jī)、邊緣計算節(jié)點、計算集群和云基礎(chǔ)設(shè)施等方式

提供。

異構(gòu)資源池支持資源的動態(tài)調(diào)度、按需(數(shù)據(jù)規(guī)模、算法模型、實時性要求等)分配,滿足計算任

務(wù)的資源需求。資源池能夠靈活集成各類計算單元并發(fā)揮其各自特性,構(gòu)建異構(gòu)計算節(jié)點,節(jié)點內(nèi)實現(xiàn)

多粒度并行和任務(wù)調(diào)度,節(jié)點間實現(xiàn)協(xié)同調(diào)度,基于網(wǎng)絡(luò)提供系統(tǒng)擴(kuò)展并優(yōu)化互聯(lián)性能,支撐部署大規(guī)

模AI計算框架和相關(guān)算法。

5.2.3分布式計算調(diào)度

分布式計算調(diào)度分為任務(wù)調(diào)度和資源調(diào)度。任務(wù)調(diào)度是根據(jù)應(yīng)用特性和運(yùn)算需求將應(yīng)用負(fù)載分解成

任務(wù),并配置任務(wù)執(zhí)行的順序和優(yōu)先級。資源調(diào)度依據(jù)應(yīng)用對資源的需求,將合適的異構(gòu)資源分配給特

定任務(wù),滿足任務(wù)對運(yùn)算性能和時間的要求。多任務(wù)應(yīng)共享資源以優(yōu)化資源使用率。

3

T/XXXXXXXX—XXXX

分布式計算調(diào)度是人工智能系統(tǒng)的重要能力,在對計算、存儲、網(wǎng)絡(luò)等異構(gòu)資源的統(tǒng)一納管的基礎(chǔ)

上,系統(tǒng)根據(jù)資源標(biāo)簽將任務(wù)優(yōu)化調(diào)度,以容器形式支持任務(wù)的大規(guī)模部署。

5.2.4機(jī)器學(xué)習(xí)引擎

機(jī)器學(xué)習(xí)引擎基于各類機(jī)器學(xué)習(xí)算法(例如統(tǒng)計機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等)進(jìn)

行模型訓(xùn)練、優(yōu)化、推理。機(jī)器學(xué)習(xí)引擎支持開源的計算框架、算法庫,兼容開源的主流接口,可根據(jù)

商用的要求在企業(yè)版本中增強(qiáng)或優(yōu)化。

機(jī)器學(xué)習(xí)算法庫為算法提供安全可靠的管理功能,包括算法的注冊、存儲、下載、評價、優(yōu)化以及

用戶鑒權(quán)、多版本管理、升級維護(hù)、運(yùn)行監(jiān)控等。

按算法需求,機(jī)器學(xué)習(xí)引擎提供特征數(shù)據(jù)的選擇、提取、構(gòu)建等功能。

5.2.5模型庫

模型庫提供對機(jī)器學(xué)習(xí)模型開發(fā)和存儲管理能力。

模型管理包括預(yù)置常用的AI模型,以及支持模型導(dǎo)入、導(dǎo)出、更新、發(fā)布、遷移、版本控制等功能。

模型開發(fā)通過可視化輔助開發(fā)工具、多模型融合開發(fā)、模型二次訓(xùn)練等方式支持模型的開發(fā)與部署。

5.2.6算法服務(wù)

算法服務(wù)是AI應(yīng)用訪問、利用機(jī)器學(xué)習(xí)能力和資源的主要方式。為滿足應(yīng)用場景的需求,系統(tǒng)提供

各類通用算法服務(wù)(例如視頻、圖像、語音、自然語言處理等)。系統(tǒng)提供統(tǒng)一算法服務(wù)框架,進(jìn)行服

務(wù)管理、服務(wù)運(yùn)行狀態(tài)監(jiān)控、服務(wù)上線等,并提供一致性的服務(wù)接口,供各領(lǐng)域上層應(yīng)用調(diào)用。

5.2.7運(yùn)維管理

運(yùn)維管理提供系統(tǒng)所需的基本運(yùn)維(例如安裝部署、擴(kuò)展、監(jiān)控、告警、健康檢查、問題及故障定

位、升級和補(bǔ)丁、備份恢復(fù)、操作審計等)及管理功能(例如資源管理、權(quán)限管理、用戶管理、日志管

理、配置管理、安全管理等)。

5.2.8應(yīng)用層

面向機(jī)器學(xué)習(xí)的AI系統(tǒng)可為各類應(yīng)用(例如智慧交通、智能制造、智慧家

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論