版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
DB14/T2527—2022
云平臺人工智能建模系統(tǒng)功能要求
1范圍
本文件規(guī)定了云平臺人工智能建模系統(tǒng)的各組件功能要求。
本文件適用于云平臺上人工智能建模系統(tǒng)及解決方案的數(shù)據(jù)處理、算法設(shè)計、模型訓(xùn)練、模型管理
等功能要求,可作為云平臺上人工智能建模系統(tǒng)的規(guī)劃、設(shè)計、建設(shè)、評估及驗收的依據(jù)。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機(jī)器學(xué)習(xí)
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
3術(shù)語和定義
GB/T5271.31-2006,GB/T5271.34-2006界定的以及下列術(shù)語和定義適用于本文件。
3.1
云平臺
本文件所指云平臺是面向全省域,為政府、社會團(tuán)體和企事業(yè)組織提供專業(yè)化服務(wù)的一體化云服務(wù)
體系。
3.2
人工智能建模系統(tǒng)
為數(shù)據(jù)分析人員、業(yè)務(wù)建模人員和模型管理人員提供數(shù)據(jù)處理、模型構(gòu)建與訓(xùn)練、模型部署與管理
解決方案的模型平臺。
3.3
算子
構(gòu)成人工智能建模算法的計算單元。
3.4
特征工程
利用領(lǐng)域知識從原始數(shù)據(jù)中提取特征的過程。
1
DB14/T2527—2022
4縮略語
下列縮略語適用于本文件。
AI:人工智能(ArtificialIntelligence)
DAG:有向無環(huán)圖(DirectedAcyclicGraph)
NLP:自然語言處理(NaturalLanguageProcessing)
JDBC:Java數(shù)據(jù)庫連接(JavaDatabaseConnectivity)
HDFS:Hadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem)
SQL:結(jié)構(gòu)化查詢語言(StructuredQueryLanguage)
API:應(yīng)用程序接口(ApplicationProgrammingInterface)
ROC:接收者操作特征(ReceiverOperatingCharacteristic)
PR:查全率(Precision-Recall)
REST:表述性狀態(tài)轉(zhuǎn)移(RepresentationalStateTransfer)
5功能要求
5.1概述
云平臺人工智能建模系統(tǒng)的功能框架見圖1,包括數(shù)據(jù)導(dǎo)入導(dǎo)出、數(shù)據(jù)預(yù)覽與探索、數(shù)據(jù)預(yù)處理、
特征工程、算法選擇、模型訓(xùn)練與評估、模型管理、模型市場、工作流調(diào)度等核心能力。
圖1云平臺人工智能建模系統(tǒng)的功能框架
5.2數(shù)據(jù)導(dǎo)入導(dǎo)出
5.2.1數(shù)據(jù)導(dǎo)入
支持多種數(shù)據(jù)源包括關(guān)系型數(shù)據(jù)庫、Hive、HBase、ElasticSearch、HDFS、文件格式、JDBC等,同
時支持?jǐn)?shù)據(jù)導(dǎo)入時轉(zhuǎn)換數(shù)據(jù)類型。數(shù)據(jù)源接入使用統(tǒng)一視圖及規(guī)范。
5.2.2數(shù)據(jù)導(dǎo)出
2
DB14/T2527—2022
支持將結(jié)果數(shù)據(jù)導(dǎo)出至關(guān)系型數(shù)據(jù)庫、Hive、HDFS、JDBC等,同時支持結(jié)果數(shù)據(jù)導(dǎo)出至數(shù)據(jù)源。
5.2.3數(shù)據(jù)樣例
人工智能平臺應(yīng)提供不同類型的樣例數(shù)據(jù)以供測試。
5.3數(shù)據(jù)預(yù)覽與探索
5.3.1數(shù)據(jù)質(zhì)量分析
支持對臟數(shù)據(jù),數(shù)據(jù)缺失值、異常值等的檢查。
5.3.2數(shù)據(jù)統(tǒng)計分析
支持查看數(shù)據(jù)的分布情況和統(tǒng)計學(xué)指標(biāo)。支持圖形化自定義統(tǒng)計分析數(shù)據(jù)。
5.3.3數(shù)據(jù)特征分析
支持在數(shù)據(jù)集合進(jìn)行分布分析,對比分析,統(tǒng)計量分析和相關(guān)分析,為數(shù)據(jù)建模人員提供基本的特
征描述。
5.3.4復(fù)雜數(shù)據(jù)特征分析
支持交互式分析和探索的編程環(huán)境。包括R、Python等編程環(huán)境,用于復(fù)雜的數(shù)據(jù)特征分析。
5.4數(shù)據(jù)預(yù)處理
5.4.1數(shù)據(jù)清洗
支持按照預(yù)定義的清洗模式對全量數(shù)據(jù)進(jìn)行原始無效異常數(shù)據(jù)過濾和缺失數(shù)據(jù)補(bǔ)齊。
5.4.2數(shù)據(jù)變換
提供包括數(shù)據(jù)屬性轉(zhuǎn)換、新屬性生成在內(nèi)的處理能力。
5.4.3數(shù)據(jù)規(guī)約
提供對基本數(shù)據(jù)屬性的歸一化處理能力。
5.4.4自動化預(yù)處理
支持?jǐn)?shù)據(jù)預(yù)處理自動化,包括自動填充、自動清理、自動轉(zhuǎn)換以及自動歸一化等。
5.4.5預(yù)處理行業(yè)模板
人工智能平臺應(yīng)提供預(yù)處理操作算子樣例及常用模板。
5.5特征工程
5.5.1特征工程流程
特征工程流程包括特征變換、特征重要性評估、特征選擇、特征生成等。
5.5.2特征工程自動化
特征工程自動化包括自動多表擴(kuò)展、自動特征變換、自動特征選擇以及自動特征生成等。
3
DB14/T2527—2022
5.5.3特征提取模板
支持特征提取算子和模板配置。
5.6算法選擇
5.6.1基礎(chǔ)能力
支持多種優(yōu)化算法,算法參數(shù)可配置。
5.6.2支持但不限于以下的算法類型
特征權(quán)重、流處理、預(yù)處理、表操作、機(jī)器學(xué)習(xí)、圖嵌入、驗證與評估、NLP、時間序列、統(tǒng)計、
集成學(xué)習(xí)、深度學(xué)習(xí)、圖計算、圖像處理、強(qiáng)化學(xué)習(xí)等。
5.6.3自定義算法
支持通過Python,R等實現(xiàn)自定義算法,支持用戶自定義持久化擴(kuò)展算子庫。
5.6.4實用工具庫
提供支持子流程、添加宏、提取宏、生成宏、刪除宏、循環(huán),支持子流程的自定義封裝和命名,支
持自定義單機(jī)腳本算子快速實現(xiàn)分布式化等功能的實用工具。
5.6.5算法樣例庫
提供章節(jié)5.6.2、5.6.3所列算法的使用樣例。
5.7模型訓(xùn)練與評估
5.7.1訓(xùn)練過程
可以啟動和停止訓(xùn)練任務(wù),可以查看運(yùn)行日志。訓(xùn)練過程中支持調(diào)試功能,可進(jìn)行單步調(diào)試,斷點(diǎn)
調(diào)試。支持訓(xùn)練過程中間數(shù)據(jù)查看、導(dǎo)出。
5.7.2資源共享
支持多個用戶分組管理和共享計算資源。
5.7.3資源管控
支持對物理資源進(jìn)行虛擬化管控,可以動態(tài)進(jìn)行資源的申請或釋放。
5.7.4復(fù)雜任務(wù)依賴
支持多任務(wù)之間圖形化構(gòu)建依賴,以構(gòu)建復(fù)雜的模型訓(xùn)練任務(wù)及數(shù)據(jù)分析任務(wù)。
5.7.5自動調(diào)參與自動建模
支持自動調(diào)參和搜索網(wǎng)格,包括在給定命中率和覆蓋率的要求下搜索參數(shù)輸出結(jié)果,及在給定參數(shù)
下搜索最優(yōu)結(jié)果。
支持自動建模,自動選擇算法及參數(shù)。
5.7.6交叉驗證
4
DB14/T2527—2022
支持按比例隨機(jī)分配訓(xùn)練與測試集,支持交叉檢驗。
5.7.7評估指標(biāo)
支持多種評估指標(biāo),如混淆矩陣,ROC曲線,PR曲線,加權(quán)召回率等。對于二分類,輸出包括評價
指標(biāo)的數(shù)目表格;對于多分類,輸出混淆矩陣。
5.7.8評估樣例庫
提供所有評估算子樣例。
5.8模型管理
5.8.1模型的版本管理
支持歷史、新建及外部導(dǎo)入模型的保存和版本管理,支持模型詳細(xì)查看,模型結(jié)果查看。
5.8.2模型導(dǎo)入導(dǎo)出
支持多種模型格式。支持導(dǎo)出Json模型,包括聚類、分類、回歸等類型。
5.8.3深度學(xué)習(xí)模型管理
支持深度學(xué)習(xí)模型導(dǎo)入導(dǎo)出和可視化查看,支持實驗應(yīng)用。
5.9模型市場
5.9.1模型用戶管理
支持管理員對其所屬普通用戶項目情況及權(quán)限進(jìn)行管理。
5.9.2模型服務(wù)上架
支持任務(wù)/實驗、代碼、自定義鏡像等在模型市場上架。
5.9.3模型服務(wù)上、下線
支持模型服務(wù)的上、下線與列表查看。
5.9.4模型服務(wù)更新
支持滾動更新及灰度更新,且灰度升級支持分配流量權(quán)重。
5.9.5模型服務(wù)測試
支持服務(wù)上線后的API測試。
5.9.6模型服務(wù)管理
支持自定義模型部署,生成相應(yīng)RESTAPI,手動增加實例數(shù)量提高服務(wù)的負(fù)載均衡;可查看當(dāng)前導(dǎo)
入平臺的API列表。
5.9.7模型服務(wù)監(jiān)控
支持線上模型服務(wù)監(jiān)控,可查看模型服務(wù)內(nèi)容、運(yùn)行狀態(tài)、實例詳情、資源設(shè)置等,后臺可以統(tǒng)計
API的調(diào)用情況和結(jié)果統(tǒng)計。
5
DB14/T2527—2022
5.9.8模型服務(wù)使用
API服務(wù)上線后,可通過RESTAPI調(diào)用,傳入?yún)?shù)并獲得預(yù)測值。
5.10工作流調(diào)度
5.10.1任務(wù)配置
支持可視化建模、代碼建模、特征和模型上架、上線等任務(wù)類型。支持對單個任務(wù)進(jìn)行資源配置,
如可視化建模、代碼建模等。
5.10.2設(shè)計工作流
任務(wù)定義成功后,確定各任務(wù)彼此間的邏輯依賴關(guān)系,任務(wù)會自上而下執(zhí)行。支持通過Cron表達(dá)式,
來設(shè)置整個工作流的調(diào)度周期。
5.10.3執(zhí)行工作流
支持對工作流進(jìn)行調(diào)試,確保整體流程可執(zhí)行,再進(jìn)行調(diào)度。設(shè)置工作流的調(diào)度周期后,工作流會
按照設(shè)置的周期定時調(diào)度。
5.10.4工作流上、下線
支持對工作流進(jìn)行上線、下線操作。
5.10.5工作流導(dǎo)入導(dǎo)出
支持從外部導(dǎo)入工作流,支持工作流導(dǎo)出到本地,導(dǎo)入導(dǎo)出文件為JSON格式。
5.10.6工作流詳情
支持查看單個工作流每次的執(zhí)行時間和執(zhí)行狀態(tài)。支持查看工作流下的單個任務(wù)每次的執(zhí)行時間、
狀態(tài)和日志詳情。
6
DB14/T2527—2022
參考文獻(xiàn)
[1]《國家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》國標(biāo)委聯(lián)﹝2020﹞35
7
ICS35.080
CCSL76
14
山西省地方標(biāo)準(zhǔn)
DB14/T2527—2022
云平臺人工智能建模系統(tǒng)框架及功能要求
2022-08-18發(fā)布2022-11-18實施
山西省市場監(jiān)督管理局??發(fā)布
DB14/T2527—2022
云平臺人工智能建模系統(tǒng)功能要求
1范圍
本文件規(guī)定了云平臺人工智能建模系統(tǒng)的各組件功能要求。
本文件適用于云平臺上人工智能建模系統(tǒng)及解決方案的數(shù)據(jù)處理、算法設(shè)計、模型訓(xùn)練、模型管理
等功能要求,可作為云平臺上人工智能建模系統(tǒng)的規(guī)劃、設(shè)計、建設(shè)、評估及驗收的依據(jù)。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機(jī)器學(xué)習(xí)
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
3術(shù)語和定義
GB/T5271.31-2006,GB/T5271.34-2006界定的以及下列術(shù)語和定義適用于本文件。
3.1
云平臺
本文件所指云平臺是面向全省域,為政府、社會團(tuán)體和企事業(yè)組織提供專業(yè)化服務(wù)的一體化云服務(wù)
體系。
3.2
人工智能建模系統(tǒng)
為數(shù)據(jù)分析人員、業(yè)務(wù)建模人員和模型管理人員提供數(shù)據(jù)處理、模型構(gòu)建與訓(xùn)練、模型部署與管理
解決方案的模型平臺。
3.3
算子
構(gòu)成人工智能建模算法的計算單元。
3.4
特征工程
利用領(lǐng)域知識從原始數(shù)據(jù)中提取特征的過程。
1
DB14/T2527—2022
4縮略語
下列縮略語適用于本文件。
AI:人工智能(ArtificialIntelligence)
DAG:有向無環(huán)圖(DirectedAcyclicGraph)
NLP:自然語言處理(Natural
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《診斷性試驗》課件
- 2025年全球新型穿戴設(shè)備行業(yè)概況及應(yīng)用領(lǐng)域調(diào)研報告
- 2024年農(nóng)業(yè)局上半年工作總結(jié)
- 稅務(wù)知識普及總結(jié)
- 小暑節(jié)氣消費(fèi)解讀
- 雙十一:餐飲行業(yè)的轉(zhuǎn)型新機(jī)遇
- 汽車電商營銷蛻變
- 小學(xué)六年級畢業(yè)演講稿范文合集8篇
- 2023年-2024年項目部安全管理人員安全培訓(xùn)考試題【考點(diǎn)梳理】
- 2023年-2024年項目部安全培訓(xùn)考試題附完整答案(考點(diǎn)梳理)
- 修理廠合伙人合同協(xié)議書模板
- 大學(xué)生醫(yī)療創(chuàng)新創(chuàng)業(yè)
- 危險化學(xué)品無倉儲經(jīng)營單位生產(chǎn)安全事故應(yīng)急救援預(yù)案(新導(dǎo)則版)
- MOOC 企業(yè)內(nèi)部控制-山西省財政稅務(wù)專科學(xué)校 中國大學(xué)慕課答案
- 質(zhì)量管理體系知識培訓(xùn)課件
- 人機(jī)交互技術(shù)智慧樹知到期末考試答案2024年
- GB/T 144-2024原木檢驗
- YS-T 650-2020 醫(yī)用氣體和真空用無縫銅管
- 心靈養(yǎng)生的療愈之道
- 建筑設(shè)計公司的商業(yè)計劃書
- 建筑景觀設(shè)計勞務(wù)合同
評論
0/150
提交評論