07領(lǐng)域目標(biāo)知識圖譜系統(tǒng)_第1頁
07領(lǐng)域目標(biāo)知識圖譜系統(tǒng)_第2頁
07領(lǐng)域目標(biāo)知識圖譜系統(tǒng)_第3頁
07領(lǐng)域目標(biāo)知識圖譜系統(tǒng)_第4頁
07領(lǐng)域目標(biāo)知識圖譜系統(tǒng)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

領(lǐng)域目標(biāo)知識圖譜系統(tǒng)1?簡介領(lǐng)域目標(biāo)知識圖譜既可以理解為一種技術(shù),也可以是一種成果。知識圖譜最初是由谷歌提出用來優(yōu)化搜索引擎的技術(shù)。隨著近年來的不斷發(fā)展,知識圖譜應(yīng)用于人工智能的多種場景,例如語音助手、聊天機器人、智能問答等。人工智能可以劃分為感知智能(主要對圖片、視頻、語音的能力的探究)和認(rèn)知智能(涉及知識推理、因果分析等)。知識圖譜是認(rèn)知智能領(lǐng)域中主要的技術(shù)之一。知識圖譜圖譜分為通用知識圖譜和領(lǐng)域知識圖譜。通用知識圖譜主要應(yīng)用于而向互聯(lián)網(wǎng)的搜索、推薦、問答等業(yè)務(wù)場景。通用知識圖譜強調(diào)的是廣度,數(shù)拯不一且多來自于互聯(lián)網(wǎng),很難形成完整的全局性的針對本體層的統(tǒng)一管理。在越來越多的垂直領(lǐng)域中,知識圖譜也被廣泛應(yīng)用,已經(jīng)成為基礎(chǔ)數(shù)據(jù)服務(wù),為上層智能應(yīng)用提供數(shù)據(jù)支撐。領(lǐng)域目標(biāo)知識圖譜針對企業(yè)或者政府機構(gòu)現(xiàn)存數(shù)據(jù)可用性差,無法自動提取有價值知識或者資源的問題,提供一種通過數(shù)拯智能淸洗、智能融合、數(shù)據(jù)可視化等技術(shù)將數(shù)據(jù)轉(zhuǎn)化為知識或者資源的方式。在知識圖譜構(gòu)建技術(shù)中,領(lǐng)域內(nèi)知識表示建模、實體識別與實體鏈接、關(guān)系事件抽取、隱形關(guān)系發(fā)現(xiàn)為領(lǐng)域目標(biāo)知識圖譜研究的方向。I提供各類服務(wù)接口,支撐業(yè)務(wù)場景I?■■?????鱷挖堀與機器學(xué)習(xí)業(yè)務(wù)模型?自然語言處理,全量數(shù)據(jù)機器學(xué)習(xí)鱷挖堀與機器學(xué)習(xí)業(yè)務(wù)模型?自然語言處理,全量數(shù)據(jù)機器學(xué)習(xí)?提供功能三?卞視t£昇這靈£丄行為建模領(lǐng)域目標(biāo)知識圖譜應(yīng)用平臺上用戶畫像3:石乞耳芯冬:行力匯務(wù)〉三?卞視t£昇這靈£丄行為建模領(lǐng)域目標(biāo)知識圖譜應(yīng)用平臺上用戶畫像3:石乞耳芯冬:行力匯務(wù)〉F石乞呈丈密會基礎(chǔ)數(shù)據(jù)管理龍土二笑M運法庁|?領(lǐng)威知識圖譜]「歩實鞏1+-花過分F-$-?use?基礎(chǔ)數(shù)據(jù)管理及數(shù)據(jù)采集一方而通過分布式爬蟲技術(shù)爬取互聯(lián)網(wǎng)公開數(shù)據(jù)源,包括新聞、微信公眾號、微博、移動客戶端、貼吧、論壇等公開數(shù)據(jù)源信息,存儲到數(shù)據(jù)倉庫中。列一方而也可以使用業(yè)務(wù)方直接提供的數(shù)據(jù)接口。數(shù)據(jù)整理與數(shù)據(jù)淸洗將采集的數(shù)據(jù)進行標(biāo)準(zhǔn)化的淸洗,可以根據(jù)智能比對完成數(shù)據(jù)的查漏補缺。也可以人工淸洗采集數(shù)據(jù)。最終將淸洗后的數(shù)據(jù)按照統(tǒng)一標(biāo)準(zhǔn)格式存儲到泛目標(biāo)庫當(dāng)中。數(shù)據(jù)融合數(shù)據(jù)融合分為智能自動融合和手動融合。智能自動融合是對同一目標(biāo)的多條記錄進行屬性合并和信息合并,使多條雜亂的數(shù)據(jù)融合成一條相對完整的融合目標(biāo),并對目標(biāo)與目標(biāo)之間建立關(guān)聯(lián)。手動融合是將相似度較高但機器無法百分百判定是同一目標(biāo)的記錄,采取人工稽核的方式進行手動融合。專題圖譜構(gòu)建根據(jù)用戶實際需求可針對某一行業(yè)或某一領(lǐng)域的積累的大量數(shù)據(jù),通過淸洗和融合后梳理成為相對完成的知識網(wǎng)絡(luò)專題圖譜,并以數(shù)據(jù)可視化的手段進行展示,提供用戶方便快捷的獲取該領(lǐng)域的知識。?系統(tǒng)特點系統(tǒng)靈活、易擴展開發(fā)了一套靈活性髙、擴展性強的數(shù)據(jù)轉(zhuǎn)化及導(dǎo)入工具。可在短時間內(nèi),根據(jù)用戶現(xiàn)有數(shù)據(jù)的格式、特點開發(fā)轉(zhuǎn)換插件,支持各類結(jié)構(gòu)化、非結(jié)構(gòu)化、文件等格式的數(shù)據(jù)導(dǎo)入。(2)完整的數(shù)據(jù)處理周期通過采集、淸洗、提取/加工、融合、關(guān)聯(lián)、分析等步驟,涵蓋了數(shù)據(jù)轉(zhuǎn)化為知識的各個環(huán)節(jié),為用戶真正將數(shù)據(jù)轉(zhuǎn)化為資產(chǎn)和知識提供了一套完整的解決方案。?技術(shù)指標(biāo)(1) 提供針對結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化、文件等多種數(shù)據(jù)格式的轉(zhuǎn)化導(dǎo)入方式。(2) 命需實體識別準(zhǔn)確率在90$以上,且可根據(jù)需要,提取用戶指左的元數(shù)據(jù)。(3) 系統(tǒng)具備較高的靈活性和可擴展性。(4) 提供自動發(fā)現(xiàn)相似目標(biāo)、自動發(fā)現(xiàn)關(guān)聯(lián)目標(biāo)的功能:提供手動融合、自動融合兩種數(shù)據(jù)融合方式。(5) 可伸縮性。具備根據(jù)需求和數(shù)據(jù)量變化,擴充(或縮減)系統(tǒng)規(guī)模的能力。(6) 可擴展性。能夠隨需求變化,增加、刪除、修改系統(tǒng)功能。(7) 可靠性和可用性。針對系統(tǒng)關(guān)鍵數(shù)據(jù),根據(jù)需要可提供冗余備份支持。根據(jù)應(yīng)用需要可提供雙機或集群備份機制,以應(yīng)對高負(fù)載和單點失效。(8) 安全性。具有完善的身份認(rèn)證和授權(quán)功能,具備基于日志的安全審訃能力:具備符合應(yīng)用需要的高敏感數(shù)據(jù)存儲安全和傳輸安全保障策略。?應(yīng)用領(lǐng)域1) 分散數(shù)據(jù)整合企業(yè),政府(各行業(yè))現(xiàn)存數(shù)據(jù)以“煙囪”式分布,橫向關(guān)聯(lián)性小,耦合度低,無法從整體視角,全面快速分析關(guān)鍵問題,無法發(fā)揮數(shù)據(jù)應(yīng)有的價值。2) 數(shù)據(jù)標(biāo)準(zhǔn)化沒有完整的數(shù)拯治理體系,企業(yè)級數(shù)據(jù)治理體系和整介機制不健全,沒有泄義企業(yè)統(tǒng)一標(biāo)準(zhǔn)數(shù)據(jù)字典,數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范未及時更新,與現(xiàn)狀不符。3) 數(shù)據(jù)智能化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論