




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
ICS號
中國標(biāo)準(zhǔn)文獻(xiàn)分類號
T/CESXXX?XXXX
CES
團(tuán)體標(biāo)準(zhǔn)
T/CESXXX?XXXX
電力人工智能知識圖譜組件功能及接口規(guī)范
Functionandintegererfacespecificationofpowerartificial
integerelligenceknowledgeatlascomponent
(征求意見稿)
XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施
中國電工技術(shù)學(xué)會發(fā)布
Ⅱ
1范圍
本文件規(guī)定了知識圖譜組件的系統(tǒng)架構(gòu)、功能模塊、服務(wù)接口及性能指標(biāo)規(guī)范要求等內(nèi)容。
本文件適用于知識圖譜組件的規(guī)劃、設(shè)計(jì)、開發(fā)、建設(shè)、運(yùn)維等環(huán)節(jié),各單位自建知識圖譜工具應(yīng)
參照執(zhí)行。
2規(guī)范性引用文件
下列文件對于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
GB/T35295-2017信息技術(shù)大數(shù)據(jù)術(shù)語
CESA-2020-2-020人工智能知識圖譜性能評估與測試規(guī)范
CESA-2020-2-019人工智能知識圖譜分類分級規(guī)范
3術(shù)語和定義
GB/T37722-2019、GB/T28821-2012、CESA-2020-2-020、CESA-2020-2-019界定的以及下列術(shù)語和
定義適用于本文件。為了便于使用,以下重復(fù)列出了Q/GDW12118.2—2021中的某些術(shù)語和定義。
3.1知識圖譜knowledgegraph
知識圖譜最早由Google提出,是用于增強(qiáng)其搜索的知識庫;其本質(zhì)上是一種語義網(wǎng)絡(luò)(semantic
network);網(wǎng)絡(luò)中的結(jié)點(diǎn)代表實(shí)體(entity)或者概念(concept),邊代表實(shí)體/概念之間的各種語義關(guān)
系。
[Q/GDW12118.2—2021,定義3.7]
3.2知識knowledge
經(jīng)維護(hù)、處理和解釋后的信息。知識是一種經(jīng)過驗(yàn)證為真的共同信念,是人對客觀規(guī)律的認(rèn)知。知
識是經(jīng)過選擇的信息,具有一定的目的性。知識是人對客觀規(guī)律的認(rèn)識與掌握,是通過人的思維重新組
合和系統(tǒng)化的信息。
3.3本體Ontology
語義數(shù)據(jù)模型,用于定義事物的類型以及可用于描述它們的屬性,是廣義的數(shù)據(jù)模型,并不包含有
關(guān)具體個體的信息。
3.4本體模型OntologyPattern
本體的形式化描述。
3.5知識建模knowledgemodeling
建立知識圖譜的概念模型和知識層次的活動,通過知識建模,知識圖譜構(gòu)建任務(wù)能夠明確知識圖譜
的本體結(jié)構(gòu)。
3.6資源描述框架ResourceDescriptionFramework
使用XML語法來表示的資料模型(Resourcemodel),用來描述Web資源的特性,及資源與資源之間的
關(guān)系,其本質(zhì)是一個數(shù)據(jù)模型(DataModel),由W3C在1999年2月22日頒布。
1
3.7資源描述框架模型RDFSchemaRDFS
用于定義元數(shù)據(jù)屬性元素(例如“創(chuàng)建者”),以描述資源的一種定義語言。它在RDF的基礎(chǔ)上提
供了一個術(shù)語、概念的定義方式,以及哪些屬性可以應(yīng)用到哪些對象上,為RDF模型提供了一個基本的
類型系統(tǒng)。
3.8網(wǎng)絡(luò)本體語言WebOntologyLanguage
W3C提出的對RDFS擴(kuò)展語言,用于對本體進(jìn)行語義描述。
3.9神經(jīng)網(wǎng)絡(luò)NeuralNetworks
由加權(quán)鏈路且權(quán)值可調(diào)整連接的基本處理元素的網(wǎng)絡(luò),通過把非線性函數(shù)作用到其輸入值上使每個
單元產(chǎn)生一個值,并把它傳送給其他單元或把它表示成輸出值。
4縮略語
API:應(yīng)用程序接口(ApplicationProgrammingintegererface)
https:超文本傳輸安全協(xié)議(HyperTextTransferProtocoloverSecureSocketLayer)
NoSQL:非關(guān)系型的數(shù)據(jù)庫(NotOnlySQL)
OWL:網(wǎng)絡(luò)本體語言(WebOntologyLanguage)
TPS:事務(wù)數(shù)/秒(TransactionsPerSecond)
XML:可擴(kuò)展標(biāo)記語言(ExtensibleMarkupLanguage)
5系統(tǒng)架構(gòu)
5.1電力知識圖譜
電力知識圖譜以結(jié)構(gòu)化方式刻畫電力系統(tǒng)中的概念、實(shí)體、事件及其間的關(guān)系,充分利用電力物聯(lián)
網(wǎng)所承載的數(shù)據(jù)信息,為電力行業(yè)產(chǎn)業(yè)鏈提供一種更為有效的跨媒體大數(shù)據(jù)組織、管理、認(rèn)知能力。由
于電力領(lǐng)域知識廣泛來源于傳統(tǒng)的電力知識工程系統(tǒng)、專家經(jīng)驗(yàn)知識庫等結(jié)構(gòu)化數(shù)據(jù)與電力標(biāo)準(zhǔn)、制度、
法律、法規(guī)以及專家、技術(shù)人員的經(jīng)驗(yàn)等半/非結(jié)構(gòu)化數(shù)據(jù),涉及多個業(yè)務(wù)領(lǐng)域,因而其知識也可按照
復(fù)用程度的差異劃分為通用知識和專用知識2大部分。例如部分電力設(shè)備的名稱、電壓等級、容量以及
單位組織架構(gòu)等信息在客服、調(diào)度、運(yùn)檢、安質(zhì)等多個業(yè)務(wù)領(lǐng)域均有需求,就屬于電力領(lǐng)域通用知識范
疇;例如客服領(lǐng)域中的用戶名稱、電費(fèi)、電價等信息相對專用,在調(diào)度、運(yùn)檢、安質(zhì)等業(yè)務(wù)領(lǐng)域涉及概
率很小,甚至完全不會出現(xiàn),就屬于電力領(lǐng)域?qū)S弥R范疇。但是力領(lǐng)域通用知識與專用知識之間的界
限具有模糊性,實(shí)際操作時需要根據(jù)實(shí)際業(yè)務(wù)進(jìn)行統(tǒng)計(jì)分析以判定通用、專用知識之間的邊界。電力領(lǐng)
域中的知識本體主要包括實(shí)體、概念、關(guān)系、屬性、屬性值、函數(shù)以及約束等方面內(nèi)容。由于不同層次
的知識在表示復(fù)雜程度上有所差異,大部分領(lǐng)域知識圖譜優(yōu)先對實(shí)體、概念、關(guān)系、屬性進(jìn)行知識建模。
其本體架構(gòu)可簡約劃分為概念層和實(shí)例層。實(shí)際的電力業(yè)務(wù)中存在大量諸如繳費(fèi)、倒閘、消缺等詞語,
既不屬于概念范疇也不屬于實(shí)例范疇,作為一種跟業(yè)務(wù)強(qiáng)相關(guān)的動作、事件、規(guī)范邊界的業(yè)務(wù)名詞,無
法準(zhǔn)確的融合到概念層或是實(shí)例層。針對上述情況,本文在研究電力領(lǐng)域知識本體建模時采用3層電
力領(lǐng)域知識表示架構(gòu),如圖1所示,業(yè)務(wù)層作為概念層與實(shí)例層之間的橋梁,與動作、事件等知識要
素進(jìn)行映射,形成3層電力領(lǐng)域知識表示架構(gòu)。在電力業(yè)務(wù)垂直領(lǐng)域進(jìn)行本體遷移時,需要根據(jù)業(yè)務(wù)
領(lǐng)域知識同時更新概念層、業(yè)務(wù)層以及實(shí)例層的專用數(shù)據(jù)。
2
圖1電力領(lǐng)域知識表示架構(gòu)圖
5.2總體架構(gòu)
知識圖譜組件應(yīng)滿足服務(wù)化建設(shè)原則,提供包括知識建模、知識存儲、知識獲取、知識融合等通用
知識圖譜服務(wù),應(yīng)采用RESTfulAPI對外服務(wù),實(shí)現(xiàn)知識圖譜共性化服務(wù)建設(shè),形成統(tǒng)一標(biāo)準(zhǔn)服務(wù)體系,
支撐各類業(yè)務(wù)應(yīng)用。知識圖譜組件總體架構(gòu)如下圖所示。
業(yè)務(wù)應(yīng)用主設(shè)備知識庫客戶知識問答項(xiàng)目圖譜分析知識推薦可視化分析…
應(yīng)用反饋服務(wù)調(diào)用
中臺/業(yè)務(wù)系統(tǒng)組件服務(wù)
知識圖譜通用組件其他組件
服務(wù)調(diào)用
業(yè)務(wù)中臺數(shù)據(jù)接入
知識建模知識存儲知識獲取
總部兩庫一平臺
數(shù)據(jù)中臺模型調(diào)用
數(shù)據(jù)接入知識融合知識計(jì)算知識應(yīng)用樣本庫訓(xùn)練環(huán)境
…標(biāo)注樣本模型庫運(yùn)行環(huán)境
總部云平臺(計(jì)算、存儲、網(wǎng)絡(luò)、安全等資源)
服務(wù)調(diào)用成果共享
服務(wù)調(diào)用
中臺/業(yè)務(wù)系統(tǒng)
省側(cè)知識
省側(cè)設(shè)備圖譜應(yīng)用營銷圖譜應(yīng)用……
省側(cè)中臺圖譜應(yīng)用
數(shù)據(jù)接入
…省側(cè)云平臺(計(jì)算、存儲、網(wǎng)絡(luò)、安全等資源)
圖2知識圖譜組件總體框架
5.3功能架構(gòu)
知識圖譜組件功能包括知識建模組件、知識存儲組件、知識計(jì)算組件、知識融合組件、知識獲取組
件及知識應(yīng)用組件。知識圖譜組件功能架構(gòu)如下圖所示。
服務(wù)接口圖譜探索接口圖譜問答接口知識推薦接口知識卡片接口圖譜語句解析接口
知識計(jì)算組件知識融合組件知識獲取組件知識應(yīng)用組件
圖譜查詢可視化編輯實(shí)例編輯
知識存儲組件
關(guān)系編輯同義編輯數(shù)據(jù)導(dǎo)入導(dǎo)出
知識建模組件概念定義屬性定義關(guān)系定義導(dǎo)入導(dǎo)出
圖3知識圖譜組件功能功能框架
3
5.4知識圖譜的構(gòu)建方式
知識圖譜的構(gòu)建需要原始的數(shù)據(jù)進(jìn)行抽象表達(dá)。按照數(shù)據(jù)的結(jié)構(gòu)化程度來分,可以分為結(jié)構(gòu)化數(shù)據(jù)、
半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),根據(jù)數(shù)據(jù)的不同的結(jié)構(gòu)化形式,采用不同的方法,將數(shù)據(jù)轉(zhuǎn)換為三元組
的形式,然后對三元組的數(shù)據(jù)進(jìn)行知識融合,主要是實(shí)體對齊,以及和數(shù)據(jù)模型進(jìn)行結(jié)合,經(jīng)過融合之
后,會形成標(biāo)準(zhǔn)的數(shù)據(jù)表示,為了發(fā)現(xiàn)新知識,可以依據(jù)一定的推理規(guī)則,產(chǎn)生隱含的知識,所有形成
的知識經(jīng)過一定的質(zhì)量評估,最終進(jìn)入知識圖譜,依據(jù)知識圖譜這個數(shù)據(jù)平臺,可以實(shí)現(xiàn)語義搜索,智
能問答,推薦系統(tǒng)等一些應(yīng)用。下圖展示了知識圖譜的構(gòu)建方式。
圖4知識圖譜的構(gòu)建方式
6功能模塊
6.1知識建模組件能力
知識建模組件應(yīng)具備輔助用戶建立知識圖譜數(shù)據(jù)模型的能力,應(yīng)支持多層級知識體系建模,應(yīng)支持
自頂向下建模方式,應(yīng)支持概念、屬性的批量導(dǎo)入,并且能夠及時的響應(yīng)數(shù)據(jù)的變化,避免大量的模型
變更。知識圖譜本體建模工具宜具備的功能見附錄A。
6.2知識存儲組件能力
知識存儲組件應(yīng)具備圖譜數(shù)據(jù)接入與管理功能。針對圖譜數(shù)據(jù)接入,應(yīng)提供在線編輯、文件導(dǎo)入等
服務(wù),并可實(shí)現(xiàn)知識圖譜增量式構(gòu)建;針對圖譜數(shù)據(jù)管理,應(yīng)提供圖譜數(shù)據(jù)查看、圖譜語言查詢、知識
溯源等功能。
6.3知識計(jì)算組件能力
知識計(jì)算組件應(yīng)提供知識標(biāo)引、知識推理等圖譜數(shù)據(jù)計(jì)算功能,可通過實(shí)體標(biāo)引多模態(tài)數(shù)據(jù)、實(shí)體
屬性與關(guān)系推理方式擴(kuò)展知識范圍,應(yīng)具備通過手工/批量兩種方式將資源型數(shù)據(jù)與圖譜數(shù)據(jù)的鏈接功
能,應(yīng)支持概念、實(shí)體的知識標(biāo)引及標(biāo)引關(guān)系的再利用,且應(yīng)具備通過業(yè)務(wù)規(guī)則配置方式,推理產(chǎn)生新
的關(guān)系,并接入圖譜,實(shí)現(xiàn)知識補(bǔ)全。
6.4知識融合組件能力
知識融合組件應(yīng)實(shí)現(xiàn)將圖譜中冗余知識進(jìn)行融合,可通過自動計(jì)算或業(yè)務(wù)專家的干預(yù)等方式實(shí)現(xiàn)知
識融合,提升知識圖譜的數(shù)據(jù)質(zhì)量。
6.5知識獲取組件能力
知識獲取組件應(yīng)實(shí)現(xiàn)將不同來源、不同結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)化成知識,再到知識圖譜的過程,應(yīng)包括對結(jié)
4
構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的處理,應(yīng)支持從數(shù)據(jù)庫進(jìn)行源數(shù)據(jù)接入。
6.6知識應(yīng)用組件能力
知識應(yīng)用組件應(yīng)具備圖譜可視化分析及意圖識別配置的能力,應(yīng)以可視化的方式提供知識圖譜可視
化、網(wǎng)絡(luò)結(jié)構(gòu)分析、統(tǒng)計(jì)分析、推理分析等應(yīng)用。
7服務(wù)接口
7.1接口總體規(guī)范
接口總體規(guī)范從接口協(xié)議、域名、版本控制、路徑規(guī)則、請求方式、命名規(guī)范六個方面進(jìn)行規(guī)范和
要求。內(nèi)容包括:
a)接口協(xié)議:API與客戶端用戶的通信協(xié)議,應(yīng)使用https協(xié)議,以確保交互數(shù)據(jù)的傳輸安全;
b)域名:應(yīng)盡量將API部署在專用域名之下,例如,如果確定API很
簡單,不會有進(jìn)一步擴(kuò)展,可以考慮放在主域名下,例如/api;
c)版本控制:應(yīng)將API的版本號放入URL中,例如/v{n},n代表版本
號,分為整型和浮點(diǎn)型,整型代表大功能版本,如v1、v2、v3等,浮點(diǎn)型代表補(bǔ)充功能版本,如v1.1、
v1.2、v2.1、v2.2等。采用多版本并存,增量發(fā)布的方式。對于一個API或服務(wù),應(yīng)在生產(chǎn)中至少保
留3個最詳細(xì)的版本;
d)路徑規(guī)則:路徑表示API的具體地址,每個路徑地址代表一種資源,所以路徑地址中不能有動
詞,只能有名詞。數(shù)據(jù)庫中的表一般都是同種記錄的集合,所以API中的名稱也應(yīng)該為復(fù)數(shù)。例如
/v1/users、/v1/schemas等;
e)請求方式:API接口的請求方式包括GET、POST;
f)命名規(guī)范:API接口的方法命名,要符合一定規(guī)范。命名應(yīng)使用中綴上限風(fēng)格。以小寫字母開
頭,后面子單詞的首字母也要大寫,所有其他字母均為小寫。不要使用下劃線將單詞隔開。例如:add{XXX}。
7.2接口列表及能力描述
接口列表對服務(wù)接口名稱和能力進(jìn)行定義與描述,詳見表1。
表1接口列表
序號接口名稱接口能力描述
讀取知識圖譜的實(shí)體關(guān)系數(shù)據(jù),支持按照節(jié)點(diǎn)類型、邊類型過濾。接口
1圖譜探索接口
請求參數(shù)及接口返回值詳見附錄B。
基于給定的知識圖譜,進(jìn)行圖譜庫中知識的問答,包括實(shí)體屬性問答、
2圖譜問答接口實(shí)體關(guān)系問答、屬性約束問答、屬性最值問答及多跳問答。接口請求參
數(shù)及接口返回值詳見附錄B。
為某一實(shí)體進(jìn)行特定多種關(guān)系的實(shí)體推薦,一般見于搜索引擎的右側(cè)推
3知識推薦接口
薦區(qū)域。接口請求參數(shù)及接口返回值詳見附錄B。
讀取實(shí)體的知識卡片,用于搜索引擎或百科的實(shí)體卡片。接口請求參數(shù)
4知識卡片接口
及接口返回值詳見附錄B。
可根據(jù)輸入的語句,返回該語句的實(shí)體、屬性、關(guān)系等信息。輸入應(yīng)為
5圖譜語句解析接口
自然語句。接口請求參數(shù)及接口返回值詳見附錄B。
5
8性能指標(biāo)
8.1知識建模性能指標(biāo)
8.1.1知識建模工具性能指標(biāo)
知識建模工具性能指標(biāo)要求參見表2。
表2知識建模工具性能指標(biāo)
功能模塊指標(biāo)要求前置條件
建模工具平均響應(yīng)時間<2秒/
知識建模支持100人同時開展在線編輯,同步
/
更新周期<3秒
8.2知識存儲性能指標(biāo)
8.2.1知識存儲數(shù)據(jù)量級指標(biāo)
知識存儲數(shù)據(jù)量級指標(biāo)要求參見表3。
表3知識存儲數(shù)據(jù)量級指標(biāo)。
功能模塊指標(biāo)要求前置條件
支持億級別節(jié)點(diǎn)、百億以內(nèi)三元組
/
知識存儲知識的存儲
支持TB級圖譜數(shù)據(jù)存儲/
8.2.2知識寫入性能指標(biāo)
知識寫入性能指標(biāo)要求參見表4。
表4知識寫入性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識存儲批量寫入速度≥5萬三元組每秒/
8.2.3知識基礎(chǔ)查詢性能指標(biāo)
知識基礎(chǔ)查詢性能指標(biāo)要求參見表5。
表5知識基礎(chǔ)查詢性能指標(biāo)
功能模塊指標(biāo)要求前置條件
實(shí)體基礎(chǔ)檢索,返回節(jié)點(diǎn)總數(shù)不超
億級別節(jié)點(diǎn)
過1萬個,時間≤1秒
實(shí)體屬性檢索,返回節(jié)點(diǎn)總數(shù)≤1萬
億級別節(jié)點(diǎn)、十億級別屬性
個,響應(yīng)時間≤1秒
知識存儲
多屬性條件(≤2個條件),返回節(jié)
點(diǎn)總數(shù)不超過1萬個,檢索響應(yīng)時間億級別節(jié)點(diǎn)、十億級別屬性
≤2秒
知識圖譜中單節(jié)點(diǎn)圖譜探索響應(yīng)時億級別節(jié)點(diǎn)、十億級別關(guān)系
6
間<1秒
知識圖譜中4步以內(nèi)兩節(jié)點(diǎn)路徑發(fā)
億級別節(jié)點(diǎn)、十億級別關(guān)系
現(xiàn)平均響應(yīng)時間<1分鐘
知識圖譜中4步以內(nèi)多節(jié)點(diǎn)關(guān)聯(lián)分
億級別節(jié)點(diǎn)、十億級別關(guān)系
析平均響應(yīng)時間<2分鐘
8.3知識抽取性能指標(biāo)
8.3.1結(jié)構(gòu)化知識抽取性能指標(biāo)
結(jié)構(gòu)化知識抽取性能指標(biāo)要求參見表6。
表6結(jié)構(gòu)化知識抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
在數(shù)據(jù)源(接口)性能滿足條件下,
知識抽取結(jié)構(gòu)化知識抽取速度>10000三元組/
每秒
8.3.2非結(jié)構(gòu)化知識抽取性能指標(biāo)
實(shí)體抽取性能指標(biāo)
實(shí)體抽取性能指標(biāo)要求參見表7。
表7實(shí)體抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
實(shí)體抽取,抽取結(jié)果平均準(zhǔn)確
知識抽取在標(biāo)注語料數(shù)量>1000時
率>90%,平均召回率>75%
關(guān)系分類性能指標(biāo)
關(guān)系分類性能指標(biāo)要求參見表8。
表8關(guān)系分類性能指標(biāo)
功能模塊指標(biāo)要求前置條件
關(guān)系抽取,抽取結(jié)果平均準(zhǔn)確
知識抽取在標(biāo)注語料數(shù)量>1000時
率>85%,平均召回率>75%
屬性抽取性能指標(biāo)
屬性抽取性能指標(biāo)要求參見表9。
表9屬性抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
屬性抽取,抽取結(jié)果平均準(zhǔn)確
知識抽取在標(biāo)注語料數(shù)量>1000時
率>85%,平均召回率>75%
7
事件抽取性能指標(biāo)
事件抽取性能指標(biāo)要求參見表10。
表10事件抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
事件抽取中觸發(fā)詞抽取的準(zhǔn)確
知識抽取/
率>90%,召回率>75%
8.4知識融合性能指標(biāo)
8.4.1實(shí)體對齊性能指標(biāo)
實(shí)體對齊性能指標(biāo)要求參見表11。
表11實(shí)體對齊性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識融合實(shí)體對齊算法的準(zhǔn)確率>90%/
8.4.2屬性融合性能指標(biāo)
屬性融合性能指標(biāo)要求參見表12。
表12屬性融合性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識融合屬性融合準(zhǔn)確率>85%/
8.5知識計(jì)算性能指標(biāo)
8.5.1知識鏈接性能指標(biāo)
知識鏈接性能指標(biāo)要求參見表13。
表13知識鏈接性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識計(jì)算知識鏈接準(zhǔn)確率>90%,召回率>75%/
8.5.2知識推理性能指標(biāo)
知識推理性能指標(biāo)要求參見表14。
表14知識推理性能指標(biāo)
8
功能模塊指標(biāo)要求前置條件
規(guī)則推理的準(zhǔn)確度>95%(給定推理
的規(guī)則集及圖譜中的事實(shí),對推理/
結(jié)果進(jìn)行人工驗(yàn)證)
知識計(jì)算在知識圖譜基本完備(即包含推理
目標(biāo)需要的事實(shí)支撐)的基礎(chǔ)上,
/
神經(jīng)網(wǎng)絡(luò)推理的準(zhǔn)確率>80%(對推
理結(jié)果進(jìn)行人工驗(yàn)證)
8.6知識應(yīng)用性能指標(biāo)
8.6.1知識搜索性能指標(biāo)
知識搜索性能指標(biāo)要求參見表15。
表15知識搜索性能指標(biāo)
功能模塊指標(biāo)要求前置條件
搜索吞吐量(TPS)為100,單次搜
記錄數(shù)不高于1000w(無索引寫入)
索響應(yīng)時間<0.5秒
基礎(chǔ)搜索的召回率和準(zhǔn)確率不低于
/
知識應(yīng)用85%,top3準(zhǔn)確率不低于90%0
語義搜索的召回率和準(zhǔn)確率不低于
/
85%,top3準(zhǔn)確率不低于90%
詞庫的數(shù)量不少于1萬/
8.6.2知識問答性能指標(biāo)
知識問答性能指標(biāo)要求參見表16。
表16知識問答性能指標(biāo)
功能模塊指標(biāo)要求前置條件
實(shí)體識別準(zhǔn)確率>85%,需識別文本
中的數(shù)字、時間、人名、地名、機(jī)/
構(gòu)名等信息
針對知識圖譜中的知識查詢問答準(zhǔn)
/
確率>80%
知識應(yīng)用知識圖譜中基礎(chǔ)問答(實(shí)體屬性、
億級別
實(shí)體關(guān)系問答)響應(yīng)時間≤1秒
知識圖譜中約束類問答響應(yīng)時間≤
億級別
1秒
知識圖譜中多跳查詢類問答響應(yīng)時
億級別
間≤2秒
9
8.6.3知識卡片性能指標(biāo)
知識卡片性能指標(biāo)要求參見表17.
表17知識卡片性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識卡片將與實(shí)體相關(guān)、經(jīng)過梳理
/
的知識提供給用戶的正確率>85%
用戶滿意度評價維度包括響應(yīng)時
知識卡片/
間、用戶負(fù)擔(dān)、搜索結(jié)果的價值等
內(nèi)容與結(jié)構(gòu)包括對知識卡片提供的
/
實(shí)體屬性數(shù)量和實(shí)體屬性的內(nèi)容
10
附錄A
(資料性附錄)
知識圖譜本體建模工具
本體建模工具需要實(shí)現(xiàn)對RDF/RDFS/OWL知識表示技術(shù)的支持與封裝,并實(shí)現(xiàn)如下功能,從而有效地
為本體建模提供支撐。
A.1模型定義
基于“概念-實(shí)體-屬性-關(guān)系-事件-規(guī)則-鏈接”統(tǒng)一知識表示模型,應(yīng)具備圖譜模型構(gòu)建功能,應(yīng)
支持在線定義概念、屬性、關(guān)系、邊屬性。
A.2模型引入
模型發(fā)布可用于圖譜模型共享;模型引入功能應(yīng)具備通過引用其他圖譜模型,從而實(shí)現(xiàn)快速構(gòu)建目
標(biāo)圖譜模型。
A.3模型視圖
模型視圖應(yīng)包含概念可視化與關(guān)系可視化。概念可視化應(yīng)具備展示概念的上下位關(guān)系、數(shù)值屬性、
對象屬性,并應(yīng)具備模型報告導(dǎo)出功能。關(guān)系可視化應(yīng)展示圖譜模型中概念之間的關(guān)聯(lián)關(guān)系,并支持可
視化結(jié)果的圖片導(dǎo)出。
A.4屬性分組
屬性分組應(yīng)支持對圖譜模型的數(shù)值屬性、對象屬性建立自定義分組,輔助業(yè)務(wù)應(yīng)用。
A.5導(dǎo)入導(dǎo)出
應(yīng)提供圖譜模型的批量導(dǎo)入導(dǎo)出能力,支持的格式應(yīng)包含Excel、RDF、OWL。應(yīng)可采用標(biāo)準(zhǔn)的資源
描述框架RDF與網(wǎng)絡(luò)本體語言O(shè)WL格式進(jìn)行模型的導(dǎo)入導(dǎo)出;并可通過Excel模板文件導(dǎo)入進(jìn)行圖譜概念、
數(shù)值屬性、對象屬性的批量定義。
11
附錄B
(資料性附錄)
服務(wù)接口參數(shù)及返回值說明
B.1圖譜探索接口
B.1.1接口請求參數(shù)
接口請求參數(shù)見表1。
附表1接口請求參數(shù)
參數(shù)類型是否必填描述
graphIdstring是圖譜ID
idstring否實(shí)體id
kwString否實(shí)效體名稱,當(dāng)id為空時生
distanceinteger否讀取層數(shù)
第二層以上節(jié)點(diǎn)查詢個數(shù),如果指定,
highLevelSizeinteger否第2層及第2層以上返回的節(jié)點(diǎn)以此數(shù)
為限
查詢邊關(guān)系的方向,0表示雙向,1表
directioninteger否
示出發(fā),2表示到達(dá)
查詢指定的屬性,格式為json數(shù)組,
allowAttsstring否
默認(rèn)為查詢?nèi)?/p>
查詢指定的概念,格式為json數(shù)組,
allowTypesstring否
默認(rèn)為查詢?nèi)?/p>
需要被替換后的classId列表,格式為
replaceClassIdsstring否
json數(shù)組。
屬性唯一標(biāo)識key列表,當(dāng)allowAtts
allowAttsKeystring否為空時生效,數(shù)據(jù)將被轉(zhuǎn)換為
allowAtts參數(shù)
概念唯一標(biāo)識key列表,當(dāng)allowTypes
allowTypesKeystring否為空時生效,數(shù)據(jù)將被轉(zhuǎn)換為
allowTypes參數(shù)
概念唯一標(biāo)識key列表,當(dāng)
replaceClassIdsK
string否replaceClassIds為空時生效,數(shù)據(jù)將
ey
被轉(zhuǎn)換為replaceClassIds參數(shù)
查詢指定的屬性分組,格式為json數(shù)
allowAttrGroupsstring否
組,默認(rèn)為不按照屬性分組查詢
attAttFiltersstring否邊附加屬性過濾條件,json數(shù)組格式
attSortsstring否邊序按,照默邊認(rèn)的不附排件序?qū)傩耘?/p>
reservedAttFilte
string否保留邊屬性過濾條件,json數(shù)組格式
rs
isInheritbool否allowTypes字段指定的概念是否繼承
isRelationMergebool否是否進(jìn)行關(guān)系合并
privateAttReadbool否是讀否取讀取私有屬性,默認(rèn)
pageNointeger否頁數(shù),0表示不分頁
pageSizeinteger否每頁數(shù)量
hyponymyDistanceinteger否上下位關(guān)系的讀取層數(shù),0表示不讀取
12
圖數(shù)探時索其業(yè)他務(wù)篩規(guī)選則條,件有
graphRulestring否
無此效參
entityQuerystring否節(jié)點(diǎn)過濾條件
在指定的圖譜范圍內(nèi)進(jìn)行
graphBeanstring否
圖探索
B.1.2接口返回值
接口返回值見附表2。
附表2接口返回值
參數(shù)類型必需詳細(xì)說明
整體返回狀態(tài)碼
statusinteger是200=全部成功
500=失敗
msgstring是返回消息信息
arrayof
data是返回結(jié)果
objects
arrayof是
+graph實(shí)例的詳細(xì)信息
objects
B.2圖譜問答接口
B.2.1接口請求參數(shù)
接口請求參數(shù)見附表3。
附表3接口請求參數(shù)
參數(shù)類型是否必填描述
graphIdstring是圖譜ID
querystring是查詢問題
pageNointegereger否當(dāng)前頁數(shù)
pageSizeintegereger否每頁數(shù)量
B.2.2接口返回值
接口返回值見附表4。
附表4接口返回值
參數(shù)類型必需詳細(xì)說明
整體返回狀態(tài)碼
statusinteger是200=全部成功
500=失敗
msgstring是返回消息信息
dataarrayofobjects是返回結(jié)果
+answersarrayofobjects是答案
13
B.3知識推薦接口
B.3.1接口請求參數(shù)
接口請求參數(shù)見附表5。
附表5接口請求參數(shù)
參數(shù)類型是否必填描述
graphIdstring是圖譜ID
entityIdlong否實(shí)體id
kwstring否實(shí)體名稱
directiointegere關(guān)系方向。默認(rèn)正向,0表示雙向,1表示出發(fā),
否
nger2表示到達(dá),默認(rèn)0
allowAtt
string否推薦范圍,格式為屬性id的json數(shù)組
s
allowAtt
string否屬性定義生唯一key,allowAtts為空是生效
sKey
integere
pageSize否allowAtts中每個id返回結(jié)果的數(shù)量
ger
B.3.2接口返回值
接口返回值見附表6。
附表6接口返回值
參數(shù)類型必需詳細(xì)說明
整體返回狀態(tài)碼
statusinteger是200=全部成功
500=失敗
msgstring是返回消息信息
dataarrayofobjects是返回結(jié)果
+e
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川幼兒師范高等??茖W(xué)?!段⑸锇l(fā)酵技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024年護(hù)理質(zhì)量安全核心管理制度考試題
- 新疆工程學(xué)院《美術(shù)學(xué)科教育學(xué)教學(xué)論》2023-2024學(xué)年第二學(xué)期期末試卷
- 長安大學(xué)《機(jī)器視覺技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安科技大學(xué)《小學(xué)作文教法指導(dǎo)》2023-2024學(xué)年第二學(xué)期期末試卷
- 長春大學(xué)《園林建筑結(jié)構(gòu)與構(gòu)造》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北北方學(xué)院《網(wǎng)頁制作與設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 哈爾濱金融學(xué)院《造紙植物資源化學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 山東電子職業(yè)技術(shù)學(xué)院《信息處理技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 鶴壁能源化工職業(yè)學(xué)院《企業(yè)經(jīng)營實(shí)戰(zhàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 學(xué)校生均占地面積
- 《康復(fù)醫(yī)學(xué)》第四章 常見疾病的康復(fù) 第二節(jié) 腫瘤康復(fù)課件
- 2016年度高考全國3卷文綜地理試題(解析版)
- SIPOC培訓(xùn)教材學(xué)習(xí)教案
- 2019年重慶江津小升初數(shù)學(xué)真題及答案
- 《菱形的判定》教學(xué)設(shè)計(jì)(共3頁)
- 配電箱系統(tǒng)圖
- 電纜井工程量計(jì)算
- 初中音樂--人聲的分類--(1)pptppt課件
- 育種學(xué) 第6章雜交育種
- 鋼芯鋁絞線參數(shù)
評論
0/150
提交評論