《電力人工智能知識(shí)圖譜組件功能及接口規(guī)范》_第1頁
《電力人工智能知識(shí)圖譜組件功能及接口規(guī)范》_第2頁
《電力人工智能知識(shí)圖譜組件功能及接口規(guī)范》_第3頁
《電力人工智能知識(shí)圖譜組件功能及接口規(guī)范》_第4頁
《電力人工智能知識(shí)圖譜組件功能及接口規(guī)范》_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ICS號(hào)

中國(guó)標(biāo)準(zhǔn)文獻(xiàn)分類號(hào)

T/CESXXX?XXXX

CES

團(tuán)體標(biāo)準(zhǔn)

T/CESXXX?XXXX

電力人工智能知識(shí)圖譜組件功能及接口規(guī)范

Functionandintegererfacespecificationofpowerartificial

integerelligenceknowledgeatlascomponent

(征求意見稿)

XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施

中國(guó)電工技術(shù)學(xué)會(huì)發(fā)布

1范圍

本文件規(guī)定了知識(shí)圖譜組件的系統(tǒng)架構(gòu)、功能模塊、服務(wù)接口及性能指標(biāo)規(guī)范要求等內(nèi)容。

本文件適用于知識(shí)圖譜組件的規(guī)劃、設(shè)計(jì)、開發(fā)、建設(shè)、運(yùn)維等環(huán)節(jié),各單位自建知識(shí)圖譜工具應(yīng)

參照?qǐng)?zhí)行。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。

凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)

GB/T35295-2017信息技術(shù)大數(shù)據(jù)術(shù)語

CESA-2020-2-020人工智能知識(shí)圖譜性能評(píng)估與測(cè)試規(guī)范

CESA-2020-2-019人工智能知識(shí)圖譜分類分級(jí)規(guī)范

3術(shù)語和定義

GB/T37722-2019、GB/T28821-2012、CESA-2020-2-020、CESA-2020-2-019界定的以及下列術(shù)語和

定義適用于本文件。為了便于使用,以下重復(fù)列出了Q/GDW12118.2—2021中的某些術(shù)語和定義。

3.1知識(shí)圖譜knowledgegraph

知識(shí)圖譜最早由Google提出,是用于增強(qiáng)其搜索的知識(shí)庫(kù);其本質(zhì)上是一種語義網(wǎng)絡(luò)(semantic

network);網(wǎng)絡(luò)中的結(jié)點(diǎn)代表實(shí)體(entity)或者概念(concept),邊代表實(shí)體/概念之間的各種語義關(guān)

系。

[Q/GDW12118.2—2021,定義3.7]

3.2知識(shí)knowledge

經(jīng)維護(hù)、處理和解釋后的信息。知識(shí)是一種經(jīng)過驗(yàn)證為真的共同信念,是人對(duì)客觀規(guī)律的認(rèn)知。知

識(shí)是經(jīng)過選擇的信息,具有一定的目的性。知識(shí)是人對(duì)客觀規(guī)律的認(rèn)識(shí)與掌握,是通過人的思維重新組

合和系統(tǒng)化的信息。

3.3本體Ontology

語義數(shù)據(jù)模型,用于定義事物的類型以及可用于描述它們的屬性,是廣義的數(shù)據(jù)模型,并不包含有

關(guān)具體個(gè)體的信息。

3.4本體模型OntologyPattern

本體的形式化描述。

3.5知識(shí)建模knowledgemodeling

建立知識(shí)圖譜的概念模型和知識(shí)層次的活動(dòng),通過知識(shí)建模,知識(shí)圖譜構(gòu)建任務(wù)能夠明確知識(shí)圖譜

的本體結(jié)構(gòu)。

3.6資源描述框架ResourceDescriptionFramework

使用XML語法來表示的資料模型(Resourcemodel),用來描述Web資源的特性,及資源與資源之間的

關(guān)系,其本質(zhì)是一個(gè)數(shù)據(jù)模型(DataModel),由W3C在1999年2月22日頒布。

1

3.7資源描述框架模型RDFSchemaRDFS

用于定義元數(shù)據(jù)屬性元素(例如“創(chuàng)建者”),以描述資源的一種定義語言。它在RDF的基礎(chǔ)上提

供了一個(gè)術(shù)語、概念的定義方式,以及哪些屬性可以應(yīng)用到哪些對(duì)象上,為RDF模型提供了一個(gè)基本的

類型系統(tǒng)。

3.8網(wǎng)絡(luò)本體語言WebOntologyLanguage

W3C提出的對(duì)RDFS擴(kuò)展語言,用于對(duì)本體進(jìn)行語義描述。

3.9神經(jīng)網(wǎng)絡(luò)NeuralNetworks

由加權(quán)鏈路且權(quán)值可調(diào)整連接的基本處理元素的網(wǎng)絡(luò),通過把非線性函數(shù)作用到其輸入值上使每個(gè)

單元產(chǎn)生一個(gè)值,并把它傳送給其他單元或把它表示成輸出值。

4縮略語

API:應(yīng)用程序接口(ApplicationProgrammingintegererface)

https:超文本傳輸安全協(xié)議(HyperTextTransferProtocoloverSecureSocketLayer)

NoSQL:非關(guān)系型的數(shù)據(jù)庫(kù)(NotOnlySQL)

OWL:網(wǎng)絡(luò)本體語言(WebOntologyLanguage)

TPS:事務(wù)數(shù)/秒(TransactionsPerSecond)

XML:可擴(kuò)展標(biāo)記語言(ExtensibleMarkupLanguage)

5系統(tǒng)架構(gòu)

5.1電力知識(shí)圖譜

電力知識(shí)圖譜以結(jié)構(gòu)化方式刻畫電力系統(tǒng)中的概念、實(shí)體、事件及其間的關(guān)系,充分利用電力物聯(lián)

網(wǎng)所承載的數(shù)據(jù)信息,為電力行業(yè)產(chǎn)業(yè)鏈提供一種更為有效的跨媒體大數(shù)據(jù)組織、管理、認(rèn)知能力。由

于電力領(lǐng)域知識(shí)廣泛來源于傳統(tǒng)的電力知識(shí)工程系統(tǒng)、專家經(jīng)驗(yàn)知識(shí)庫(kù)等結(jié)構(gòu)化數(shù)據(jù)與電力標(biāo)準(zhǔn)、制度、

法律、法規(guī)以及專家、技術(shù)人員的經(jīng)驗(yàn)等半/非結(jié)構(gòu)化數(shù)據(jù),涉及多個(gè)業(yè)務(wù)領(lǐng)域,因而其知識(shí)也可按照

復(fù)用程度的差異劃分為通用知識(shí)和專用知識(shí)2大部分。例如部分電力設(shè)備的名稱、電壓等級(jí)、容量以及

單位組織架構(gòu)等信息在客服、調(diào)度、運(yùn)檢、安質(zhì)等多個(gè)業(yè)務(wù)領(lǐng)域均有需求,就屬于電力領(lǐng)域通用知識(shí)范

疇;例如客服領(lǐng)域中的用戶名稱、電費(fèi)、電價(jià)等信息相對(duì)專用,在調(diào)度、運(yùn)檢、安質(zhì)等業(yè)務(wù)領(lǐng)域涉及概

率很小,甚至完全不會(huì)出現(xiàn),就屬于電力領(lǐng)域?qū)S弥R(shí)范疇。但是力領(lǐng)域通用知識(shí)與專用知識(shí)之間的界

限具有模糊性,實(shí)際操作時(shí)需要根據(jù)實(shí)際業(yè)務(wù)進(jìn)行統(tǒng)計(jì)分析以判定通用、專用知識(shí)之間的邊界。電力領(lǐng)

域中的知識(shí)本體主要包括實(shí)體、概念、關(guān)系、屬性、屬性值、函數(shù)以及約束等方面內(nèi)容。由于不同層次

的知識(shí)在表示復(fù)雜程度上有所差異,大部分領(lǐng)域知識(shí)圖譜優(yōu)先對(duì)實(shí)體、概念、關(guān)系、屬性進(jìn)行知識(shí)建模。

其本體架構(gòu)可簡(jiǎn)約劃分為概念層和實(shí)例層。實(shí)際的電力業(yè)務(wù)中存在大量諸如繳費(fèi)、倒閘、消缺等詞語,

既不屬于概念范疇也不屬于實(shí)例范疇,作為一種跟業(yè)務(wù)強(qiáng)相關(guān)的動(dòng)作、事件、規(guī)范邊界的業(yè)務(wù)名詞,無

法準(zhǔn)確的融合到概念層或是實(shí)例層。針對(duì)上述情況,本文在研究電力領(lǐng)域知識(shí)本體建模時(shí)采用3層電

力領(lǐng)域知識(shí)表示架構(gòu),如圖1所示,業(yè)務(wù)層作為概念層與實(shí)例層之間的橋梁,與動(dòng)作、事件等知識(shí)要

素進(jìn)行映射,形成3層電力領(lǐng)域知識(shí)表示架構(gòu)。在電力業(yè)務(wù)垂直領(lǐng)域進(jìn)行本體遷移時(shí),需要根據(jù)業(yè)務(wù)

領(lǐng)域知識(shí)同時(shí)更新概念層、業(yè)務(wù)層以及實(shí)例層的專用數(shù)據(jù)。

2

圖1電力領(lǐng)域知識(shí)表示架構(gòu)圖

5.2總體架構(gòu)

知識(shí)圖譜組件應(yīng)滿足服務(wù)化建設(shè)原則,提供包括知識(shí)建模、知識(shí)存儲(chǔ)、知識(shí)獲取、知識(shí)融合等通用

知識(shí)圖譜服務(wù),應(yīng)采用RESTfulAPI對(duì)外服務(wù),實(shí)現(xiàn)知識(shí)圖譜共性化服務(wù)建設(shè),形成統(tǒng)一標(biāo)準(zhǔn)服務(wù)體系,

支撐各類業(yè)務(wù)應(yīng)用。知識(shí)圖譜組件總體架構(gòu)如下圖所示。

業(yè)務(wù)應(yīng)用主設(shè)備知識(shí)庫(kù)客戶知識(shí)問答項(xiàng)目圖譜分析知識(shí)推薦可視化分析…

應(yīng)用反饋服務(wù)調(diào)用

中臺(tái)/業(yè)務(wù)系統(tǒng)組件服務(wù)

知識(shí)圖譜通用組件其他組件

服務(wù)調(diào)用

業(yè)務(wù)中臺(tái)數(shù)據(jù)接入

知識(shí)建模知識(shí)存儲(chǔ)知識(shí)獲取

總部?jī)蓭?kù)一平臺(tái)

數(shù)據(jù)中臺(tái)模型調(diào)用

數(shù)據(jù)接入知識(shí)融合知識(shí)計(jì)算知識(shí)應(yīng)用樣本庫(kù)訓(xùn)練環(huán)境

…標(biāo)注樣本模型庫(kù)運(yùn)行環(huán)境

總部云平臺(tái)(計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等資源)

服務(wù)調(diào)用成果共享

服務(wù)調(diào)用

中臺(tái)/業(yè)務(wù)系統(tǒng)

省側(cè)知識(shí)

省側(cè)設(shè)備圖譜應(yīng)用營(yíng)銷圖譜應(yīng)用……

省側(cè)中臺(tái)圖譜應(yīng)用

數(shù)據(jù)接入

…省側(cè)云平臺(tái)(計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等資源)

圖2知識(shí)圖譜組件總體框架

5.3功能架構(gòu)

知識(shí)圖譜組件功能包括知識(shí)建模組件、知識(shí)存儲(chǔ)組件、知識(shí)計(jì)算組件、知識(shí)融合組件、知識(shí)獲取組

件及知識(shí)應(yīng)用組件。知識(shí)圖譜組件功能架構(gòu)如下圖所示。

服務(wù)接口圖譜探索接口圖譜問答接口知識(shí)推薦接口知識(shí)卡片接口圖譜語句解析接口

知識(shí)計(jì)算組件知識(shí)融合組件知識(shí)獲取組件知識(shí)應(yīng)用組件

圖譜查詢可視化編輯實(shí)例編輯

知識(shí)存儲(chǔ)組件

關(guān)系編輯同義編輯數(shù)據(jù)導(dǎo)入導(dǎo)出

知識(shí)建模組件概念定義屬性定義關(guān)系定義導(dǎo)入導(dǎo)出

圖3知識(shí)圖譜組件功能功能框架

3

5.4知識(shí)圖譜的構(gòu)建方式

知識(shí)圖譜的構(gòu)建需要原始的數(shù)據(jù)進(jìn)行抽象表達(dá)。按照數(shù)據(jù)的結(jié)構(gòu)化程度來分,可以分為結(jié)構(gòu)化數(shù)據(jù)、

半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),根據(jù)數(shù)據(jù)的不同的結(jié)構(gòu)化形式,采用不同的方法,將數(shù)據(jù)轉(zhuǎn)換為三元組

的形式,然后對(duì)三元組的數(shù)據(jù)進(jìn)行知識(shí)融合,主要是實(shí)體對(duì)齊,以及和數(shù)據(jù)模型進(jìn)行結(jié)合,經(jīng)過融合之

后,會(huì)形成標(biāo)準(zhǔn)的數(shù)據(jù)表示,為了發(fā)現(xiàn)新知識(shí),可以依據(jù)一定的推理規(guī)則,產(chǎn)生隱含的知識(shí),所有形成

的知識(shí)經(jīng)過一定的質(zhì)量評(píng)估,最終進(jìn)入知識(shí)圖譜,依據(jù)知識(shí)圖譜這個(gè)數(shù)據(jù)平臺(tái),可以實(shí)現(xiàn)語義搜索,智

能問答,推薦系統(tǒng)等一些應(yīng)用。下圖展示了知識(shí)圖譜的構(gòu)建方式。

圖4知識(shí)圖譜的構(gòu)建方式

6功能模塊

6.1知識(shí)建模組件能力

知識(shí)建模組件應(yīng)具備輔助用戶建立知識(shí)圖譜數(shù)據(jù)模型的能力,應(yīng)支持多層級(jí)知識(shí)體系建模,應(yīng)支持

自頂向下建模方式,應(yīng)支持概念、屬性的批量導(dǎo)入,并且能夠及時(shí)的響應(yīng)數(shù)據(jù)的變化,避免大量的模型

變更。知識(shí)圖譜本體建模工具宜具備的功能見附錄A。

6.2知識(shí)存儲(chǔ)組件能力

知識(shí)存儲(chǔ)組件應(yīng)具備圖譜數(shù)據(jù)接入與管理功能。針對(duì)圖譜數(shù)據(jù)接入,應(yīng)提供在線編輯、文件導(dǎo)入等

服務(wù),并可實(shí)現(xiàn)知識(shí)圖譜增量式構(gòu)建;針對(duì)圖譜數(shù)據(jù)管理,應(yīng)提供圖譜數(shù)據(jù)查看、圖譜語言查詢、知識(shí)

溯源等功能。

6.3知識(shí)計(jì)算組件能力

知識(shí)計(jì)算組件應(yīng)提供知識(shí)標(biāo)引、知識(shí)推理等圖譜數(shù)據(jù)計(jì)算功能,可通過實(shí)體標(biāo)引多模態(tài)數(shù)據(jù)、實(shí)體

屬性與關(guān)系推理方式擴(kuò)展知識(shí)范圍,應(yīng)具備通過手工/批量?jī)煞N方式將資源型數(shù)據(jù)與圖譜數(shù)據(jù)的鏈接功

能,應(yīng)支持概念、實(shí)體的知識(shí)標(biāo)引及標(biāo)引關(guān)系的再利用,且應(yīng)具備通過業(yè)務(wù)規(guī)則配置方式,推理產(chǎn)生新

的關(guān)系,并接入圖譜,實(shí)現(xiàn)知識(shí)補(bǔ)全。

6.4知識(shí)融合組件能力

知識(shí)融合組件應(yīng)實(shí)現(xiàn)將圖譜中冗余知識(shí)進(jìn)行融合,可通過自動(dòng)計(jì)算或業(yè)務(wù)專家的干預(yù)等方式實(shí)現(xiàn)知

識(shí)融合,提升知識(shí)圖譜的數(shù)據(jù)質(zhì)量。

6.5知識(shí)獲取組件能力

知識(shí)獲取組件應(yīng)實(shí)現(xiàn)將不同來源、不同結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)化成知識(shí),再到知識(shí)圖譜的過程,應(yīng)包括對(duì)結(jié)

4

構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的處理,應(yīng)支持從數(shù)據(jù)庫(kù)進(jìn)行源數(shù)據(jù)接入。

6.6知識(shí)應(yīng)用組件能力

知識(shí)應(yīng)用組件應(yīng)具備圖譜可視化分析及意圖識(shí)別配置的能力,應(yīng)以可視化的方式提供知識(shí)圖譜可視

化、網(wǎng)絡(luò)結(jié)構(gòu)分析、統(tǒng)計(jì)分析、推理分析等應(yīng)用。

7服務(wù)接口

7.1接口總體規(guī)范

接口總體規(guī)范從接口協(xié)議、域名、版本控制、路徑規(guī)則、請(qǐng)求方式、命名規(guī)范六個(gè)方面進(jìn)行規(guī)范和

要求。內(nèi)容包括:

a)接口協(xié)議:API與客戶端用戶的通信協(xié)議,應(yīng)使用https協(xié)議,以確保交互數(shù)據(jù)的傳輸安全;

b)域名:應(yīng)盡量將API部署在專用域名之下,例如,如果確定API很

簡(jiǎn)單,不會(huì)有進(jìn)一步擴(kuò)展,可以考慮放在主域名下,例如/api;

c)版本控制:應(yīng)將API的版本號(hào)放入U(xiǎn)RL中,例如/v{n},n代表版本

號(hào),分為整型和浮點(diǎn)型,整型代表大功能版本,如v1、v2、v3等,浮點(diǎn)型代表補(bǔ)充功能版本,如v1.1、

v1.2、v2.1、v2.2等。采用多版本并存,增量發(fā)布的方式。對(duì)于一個(gè)API或服務(wù),應(yīng)在生產(chǎn)中至少保

留3個(gè)最詳細(xì)的版本;

d)路徑規(guī)則:路徑表示API的具體地址,每個(gè)路徑地址代表一種資源,所以路徑地址中不能有動(dòng)

詞,只能有名詞。數(shù)據(jù)庫(kù)中的表一般都是同種記錄的集合,所以API中的名稱也應(yīng)該為復(fù)數(shù)。例如

/v1/users、/v1/schemas等;

e)請(qǐng)求方式:API接口的請(qǐng)求方式包括GET、POST;

f)命名規(guī)范:API接口的方法命名,要符合一定規(guī)范。命名應(yīng)使用中綴上限風(fēng)格。以小寫字母開

頭,后面子單詞的首字母也要大寫,所有其他字母均為小寫。不要使用下劃線將單詞隔開。例如:add{XXX}。

7.2接口列表及能力描述

接口列表對(duì)服務(wù)接口名稱和能力進(jìn)行定義與描述,詳見表1。

表1接口列表

序號(hào)接口名稱接口能力描述

讀取知識(shí)圖譜的實(shí)體關(guān)系數(shù)據(jù),支持按照節(jié)點(diǎn)類型、邊類型過濾。接口

1圖譜探索接口

請(qǐng)求參數(shù)及接口返回值詳見附錄B。

基于給定的知識(shí)圖譜,進(jìn)行圖譜庫(kù)中知識(shí)的問答,包括實(shí)體屬性問答、

2圖譜問答接口實(shí)體關(guān)系問答、屬性約束問答、屬性最值問答及多跳問答。接口請(qǐng)求參

數(shù)及接口返回值詳見附錄B。

為某一實(shí)體進(jìn)行特定多種關(guān)系的實(shí)體推薦,一般見于搜索引擎的右側(cè)推

3知識(shí)推薦接口

薦區(qū)域。接口請(qǐng)求參數(shù)及接口返回值詳見附錄B。

讀取實(shí)體的知識(shí)卡片,用于搜索引擎或百科的實(shí)體卡片。接口請(qǐng)求參數(shù)

4知識(shí)卡片接口

及接口返回值詳見附錄B。

可根據(jù)輸入的語句,返回該語句的實(shí)體、屬性、關(guān)系等信息。輸入應(yīng)為

5圖譜語句解析接口

自然語句。接口請(qǐng)求參數(shù)及接口返回值詳見附錄B。

5

8性能指標(biāo)

8.1知識(shí)建模性能指標(biāo)

8.1.1知識(shí)建模工具性能指標(biāo)

知識(shí)建模工具性能指標(biāo)要求參見表2。

表2知識(shí)建模工具性能指標(biāo)

功能模塊指標(biāo)要求前置條件

建模工具平均響應(yīng)時(shí)間<2秒/

知識(shí)建模支持100人同時(shí)開展在線編輯,同步

/

更新周期<3秒

8.2知識(shí)存儲(chǔ)性能指標(biāo)

8.2.1知識(shí)存儲(chǔ)數(shù)據(jù)量級(jí)指標(biāo)

知識(shí)存儲(chǔ)數(shù)據(jù)量級(jí)指標(biāo)要求參見表3。

表3知識(shí)存儲(chǔ)數(shù)據(jù)量級(jí)指標(biāo)。

功能模塊指標(biāo)要求前置條件

支持億級(jí)別節(jié)點(diǎn)、百億以內(nèi)三元組

/

知識(shí)存儲(chǔ)知識(shí)的存儲(chǔ)

支持TB級(jí)圖譜數(shù)據(jù)存儲(chǔ)/

8.2.2知識(shí)寫入性能指標(biāo)

知識(shí)寫入性能指標(biāo)要求參見表4。

表4知識(shí)寫入性能指標(biāo)

功能模塊指標(biāo)要求前置條件

知識(shí)存儲(chǔ)批量寫入速度≥5萬三元組每秒/

8.2.3知識(shí)基礎(chǔ)查詢性能指標(biāo)

知識(shí)基礎(chǔ)查詢性能指標(biāo)要求參見表5。

表5知識(shí)基礎(chǔ)查詢性能指標(biāo)

功能模塊指標(biāo)要求前置條件

實(shí)體基礎(chǔ)檢索,返回節(jié)點(diǎn)總數(shù)不超

億級(jí)別節(jié)點(diǎn)

過1萬個(gè),時(shí)間≤1秒

實(shí)體屬性檢索,返回節(jié)點(diǎn)總數(shù)≤1萬

億級(jí)別節(jié)點(diǎn)、十億級(jí)別屬性

個(gè),響應(yīng)時(shí)間≤1秒

知識(shí)存儲(chǔ)

多屬性條件(≤2個(gè)條件),返回節(jié)

點(diǎn)總數(shù)不超過1萬個(gè),檢索響應(yīng)時(shí)間億級(jí)別節(jié)點(diǎn)、十億級(jí)別屬性

≤2秒

知識(shí)圖譜中單節(jié)點(diǎn)圖譜探索響應(yīng)時(shí)億級(jí)別節(jié)點(diǎn)、十億級(jí)別關(guān)系

6

間<1秒

知識(shí)圖譜中4步以內(nèi)兩節(jié)點(diǎn)路徑發(fā)

億級(jí)別節(jié)點(diǎn)、十億級(jí)別關(guān)系

現(xiàn)平均響應(yīng)時(shí)間<1分鐘

知識(shí)圖譜中4步以內(nèi)多節(jié)點(diǎn)關(guān)聯(lián)分

億級(jí)別節(jié)點(diǎn)、十億級(jí)別關(guān)系

析平均響應(yīng)時(shí)間<2分鐘

8.3知識(shí)抽取性能指標(biāo)

8.3.1結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)

結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)要求參見表6。

表6結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)

功能模塊指標(biāo)要求前置條件

在數(shù)據(jù)源(接口)性能滿足條件下,

知識(shí)抽取結(jié)構(gòu)化知識(shí)抽取速度>10000三元組/

每秒

8.3.2非結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)

實(shí)體抽取性能指標(biāo)

實(shí)體抽取性能指標(biāo)要求參見表7。

表7實(shí)體抽取性能指標(biāo)

功能模塊指標(biāo)要求前置條件

實(shí)體抽取,抽取結(jié)果平均準(zhǔn)確

知識(shí)抽取在標(biāo)注語料數(shù)量>1000時(shí)

率>90%,平均召回率>75%

關(guān)系分類性能指標(biāo)

關(guān)系分類性能指標(biāo)要求參見表8。

表8關(guān)系分類性能指標(biāo)

功能模塊指標(biāo)要求前置條件

關(guān)系抽取,抽取結(jié)果平均準(zhǔn)確

知識(shí)抽取在標(biāo)注語料數(shù)量>1000時(shí)

率>85%,平均召回率>75%

屬性抽取性能指標(biāo)

屬性抽取性能指標(biāo)要求參見表9。

表9屬性抽取性能指標(biāo)

功能模塊指標(biāo)要求前置條件

屬性抽取,抽取結(jié)果平均準(zhǔn)確

知識(shí)抽取在標(biāo)注語料數(shù)量>1000時(shí)

率>85%,平均召回率>75%

7

事件抽取性能指標(biāo)

事件抽取性能指標(biāo)要求參見表10。

表10事件抽取性能指標(biāo)

功能模塊指標(biāo)要求前置條件

事件抽取中觸發(fā)詞抽取的準(zhǔn)確

知識(shí)抽取/

率>90%,召回率>75%

8.4知識(shí)融合性能指標(biāo)

8.4.1實(shí)體對(duì)齊性能指標(biāo)

實(shí)體對(duì)齊性能指標(biāo)要求參見表11。

表11實(shí)體對(duì)齊性能指標(biāo)

功能模塊指標(biāo)要求前置條件

知識(shí)融合實(shí)體對(duì)齊算法的準(zhǔn)確率>90%/

8.4.2屬性融合性能指標(biāo)

屬性融合性能指標(biāo)要求參見表12。

表12屬性融合性能指標(biāo)

功能模塊指標(biāo)要求前置條件

知識(shí)融合屬性融合準(zhǔn)確率>85%/

8.5知識(shí)計(jì)算性能指標(biāo)

8.5.1知識(shí)鏈接性能指標(biāo)

知識(shí)鏈接性能指標(biāo)要求參見表13。

表13知識(shí)鏈接性能指標(biāo)

功能模塊指標(biāo)要求前置條件

知識(shí)計(jì)算知識(shí)鏈接準(zhǔn)確率>90%,召回率>75%/

8.5.2知識(shí)推理性能指標(biāo)

知識(shí)推理性能指標(biāo)要求參見表14。

表14知識(shí)推理性能指標(biāo)

8

功能模塊指標(biāo)要求前置條件

規(guī)則推理的準(zhǔn)確度>95%(給定推理

的規(guī)則集及圖譜中的事實(shí),對(duì)推理/

結(jié)果進(jìn)行人工驗(yàn)證)

知識(shí)計(jì)算在知識(shí)圖譜基本完備(即包含推理

目標(biāo)需要的事實(shí)支撐)的基礎(chǔ)上,

/

神經(jīng)網(wǎng)絡(luò)推理的準(zhǔn)確率>80%(對(duì)推

理結(jié)果進(jìn)行人工驗(yàn)證)

8.6知識(shí)應(yīng)用性能指標(biāo)

8.6.1知識(shí)搜索性能指標(biāo)

知識(shí)搜索性能指標(biāo)要求參見表15。

表15知識(shí)搜索性能指標(biāo)

功能模塊指標(biāo)要求前置條件

搜索吞吐量(TPS)為100,單次搜

記錄數(shù)不高于1000w(無索引寫入)

索響應(yīng)時(shí)間<0.5秒

基礎(chǔ)搜索的召回率和準(zhǔn)確率不低于

/

知識(shí)應(yīng)用85%,top3準(zhǔn)確率不低于90%0

語義搜索的召回率和準(zhǔn)確率不低于

/

85%,top3準(zhǔn)確率不低于90%

詞庫(kù)的數(shù)量不少于1萬/

8.6.2知識(shí)問答性能指標(biāo)

知識(shí)問答性能指標(biāo)要求參見表16。

表16知識(shí)問答性能指標(biāo)

功能模塊指標(biāo)要求前置條件

實(shí)體識(shí)別準(zhǔn)確率>85%,需識(shí)別文本

中的數(shù)字、時(shí)間、人名、地名、機(jī)/

構(gòu)名等信息

針對(duì)知識(shí)圖譜中的知識(shí)查詢問答準(zhǔn)

/

確率>80%

知識(shí)應(yīng)用知識(shí)圖譜中基礎(chǔ)問答(實(shí)體屬性、

億級(jí)別

實(shí)體關(guān)系問答)響應(yīng)時(shí)間≤1秒

知識(shí)圖譜中約束類問答響應(yīng)時(shí)間≤

億級(jí)別

1秒

知識(shí)圖譜中多跳查詢類問答響應(yīng)時(shí)

億級(jí)別

間≤2秒

9

8.6.3知識(shí)卡片性能指標(biāo)

知識(shí)卡片性能指標(biāo)要求參見表17.

表17知識(shí)卡片性能指標(biāo)

功能模塊指標(biāo)要求前置條件

知識(shí)卡片將與實(shí)體相關(guān)、經(jīng)過梳理

/

的知識(shí)提供給用戶的正確率>85%

用戶滿意度評(píng)價(jià)維度包括響應(yīng)時(shí)

知識(shí)卡片/

間、用戶負(fù)擔(dān)、搜索結(jié)果的價(jià)值等

內(nèi)容與結(jié)構(gòu)包括對(duì)知識(shí)卡片提供的

/

實(shí)體屬性數(shù)量和實(shí)體屬性的內(nèi)容

10

附錄A

(資料性附錄)

知識(shí)圖譜本體建模工具

本體建模工具需要實(shí)現(xiàn)對(duì)RDF/RDFS/OWL知識(shí)表示技術(shù)的支持與封裝,并實(shí)現(xiàn)如下功能,從而有效地

為本體建模提供支撐。

A.1模型定義

基于“概念-實(shí)體-屬性-關(guān)系-事件-規(guī)則-鏈接”統(tǒng)一知識(shí)表示模型,應(yīng)具備圖譜模型構(gòu)建功能,應(yīng)

支持在線定義概念、屬性、關(guān)系、邊屬性。

A.2模型引入

模型發(fā)布可用于圖譜模型共享;模型引入功能應(yīng)具備通過引用其他圖譜模型,從而實(shí)現(xiàn)快速構(gòu)建目

標(biāo)圖譜模型。

A.3模型視圖

模型視圖應(yīng)包含概念可視化與關(guān)系可視化。概念可視化應(yīng)具備展示概念的上下位關(guān)系、數(shù)值屬性、

對(duì)象屬性,并應(yīng)具備模型報(bào)告導(dǎo)出功能。關(guān)系可視化應(yīng)展示圖譜模型中概念之間的關(guān)聯(lián)關(guān)系,并支持可

視化結(jié)果的圖片導(dǎo)出。

A.4屬性分組

屬性分組應(yīng)支持對(duì)圖譜模型的數(shù)值屬性、對(duì)象屬性建立自定義分組,輔助業(yè)務(wù)應(yīng)用。

A.5導(dǎo)入導(dǎo)出

應(yīng)提供圖譜模型的批量導(dǎo)入導(dǎo)出能力,支持的格式應(yīng)包含Excel、RDF、OWL。應(yīng)可采用標(biāo)準(zhǔn)的資源

描述框架RDF與網(wǎng)絡(luò)本體語言O(shè)WL格式進(jìn)行模型的導(dǎo)入導(dǎo)出;并可通過Excel模板文件導(dǎo)入進(jìn)行圖譜概念、

數(shù)值屬性、對(duì)象屬性的批量定義。

11

附錄B

(資料性附錄)

服務(wù)接口參數(shù)及返回值說明

B.1圖譜探索接口

B.1.1接口請(qǐng)求參數(shù)

接口請(qǐng)求參數(shù)見表1。

附表1接口請(qǐng)求參數(shù)

參數(shù)類型是否必填描述

graphIdstring是圖譜ID

idstring否實(shí)體id

kwString否實(shí)效體名稱,當(dāng)id為空時(shí)生

distanceinteger否讀取層數(shù)

第二層以上節(jié)點(diǎn)查詢個(gè)數(shù),如果指定,

highLevelSizeinteger否第2層及第2層以上返回的節(jié)點(diǎn)以此數(shù)

為限

查詢邊關(guān)系的方向,0表示雙向,1表

directioninteger否

示出發(fā),2表示到達(dá)

查詢指定的屬性,格式為json數(shù)組,

allowAttsstring否

默認(rèn)為查詢?nèi)?/p>

查詢指定的概念,格式為json數(shù)組,

allowTypesstring否

默認(rèn)為查詢?nèi)?/p>

需要被替換后的classId列表,格式為

replaceClassIdsstring否

json數(shù)組。

屬性唯一標(biāo)識(shí)key列表,當(dāng)allowAtts

allowAttsKeystring否為空時(shí)生效,數(shù)據(jù)將被轉(zhuǎn)換為

allowAtts參數(shù)

概念唯一標(biāo)識(shí)key列表,當(dāng)allowTypes

allowTypesKeystring否為空時(shí)生效,數(shù)據(jù)將被轉(zhuǎn)換為

allowTypes參數(shù)

概念唯一標(biāo)識(shí)key列表,當(dāng)

replaceClassIdsK

string否replaceClassIds為空時(shí)生效,數(shù)據(jù)將

ey

被轉(zhuǎn)換為replaceClassIds參數(shù)

查詢指定的屬性分組,格式為json數(shù)

allowAttrGroupsstring否

組,默認(rèn)為不按照屬性分組查詢

attAttFiltersstring否邊附加屬性過濾條件,json數(shù)組格式

attSortsstring否邊序按,照默邊認(rèn)的不附排件序?qū)傩耘?/p>

reservedAttFilte

string否保留邊屬性過濾條件,json數(shù)組格式

rs

isInheritbool否allowTypes字段指定的概念是否繼承

isRelationMergebool否是否進(jìn)行關(guān)系合并

privateAttReadbool否是讀否取讀取私有屬性,默認(rèn)

pageNointeger否頁數(shù),0表示不分頁

pageSizeinteger否每頁數(shù)量

hyponymyDistanceinteger否上下位關(guān)系的讀取層數(shù),0表示不讀取

12

圖數(shù)探時(shí)索其業(yè)他務(wù)篩規(guī)選則條,件有

graphRulestring否

無此效參

entityQuerystring否節(jié)點(diǎn)過濾條件

在指定的圖譜范圍內(nèi)進(jìn)行

graphBeanstring否

圖探索

B.1.2接口返回值

接口返回值見附表2。

附表2接口返回值

參數(shù)類型必需詳細(xì)說明

整體返回狀態(tài)碼

statusinteger是200=全部成功

500=失敗

msgstring是返回消息信息

arrayof

data是返回結(jié)果

objects

arrayof是

+graph實(shí)例的詳細(xì)信息

objects

B.2圖譜問答接口

B.2.1接口請(qǐng)求參數(shù)

接口請(qǐng)求參數(shù)見附表3。

附表3接口請(qǐng)求參數(shù)

參數(shù)類型是否必填描述

graphIdstring是圖譜ID

querystring是查詢問題

pageNointegereger否當(dāng)前頁數(shù)

pageSizeintegereger否每頁數(shù)量

B.2.2接口返回值

接口返回值見附表4。

附表4接口返回值

參數(shù)類型必需詳細(xì)說明

整體返回狀態(tài)碼

statusinteger是200=全部成功

500=失敗

msgstring是返回消息信息

dataarrayofobjects是返回結(jié)果

+answersarrayofobjects是答案

13

B.3知識(shí)推薦接口

B.3.1接口請(qǐng)求參數(shù)

接口請(qǐng)求參數(shù)見附表5。

附表5接口請(qǐng)求參數(shù)

參數(shù)類型是否必填描述

graphIdstring是圖譜ID

entityIdlong否實(shí)體id

kwstring否實(shí)體名稱

directiointegere關(guān)系方向。默認(rèn)正向,0表示雙向,1表示出發(fā),

nger2表示到達(dá),默認(rèn)0

allowAtt

string否推薦范圍,格式為屬性id的json數(shù)組

s

allowAtt

string否屬性定義生唯一key,allowAtts為空是生效

sKey

integere

pageSize否allowAtts中每個(gè)id返回結(jié)果的數(shù)量

ger

B.3.2接口返回值

接口返回值見附表6。

附表6接口返回值

參數(shù)類型必需詳細(xì)說明

整體返回狀態(tài)碼

statusinteger是200=全部成功

500=失敗

msgstring是返回消息信息

dataarrayofobjects是返回結(jié)果

+e

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論