從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)課件_第1頁
從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)課件_第2頁
從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)課件_第3頁
從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)課件_第4頁
從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)科大訊飛研究院胡國平2014年10月17日武漢11:25:28從應(yīng)用角度來看科大訊飛研究院胡國平15:24:261第二屆全國中文知識圖譜研討會本次知識圖譜研討會著重探討中文知識圖譜的構(gòu)建的資源、技術(shù)、方案、策略以及待研究問題和挑戰(zhàn)促進(jìn)研究單位之間以及研究界和產(chǎn)業(yè)界之間的學(xué)術(shù)交流探索今后大規(guī)模中文知識圖譜構(gòu)建的研討與合作機(jī)制第二屆全國中文知識圖譜研討會本次知識圖譜研討會2訊飛研究院簡介科大訊飛公司(中文信息領(lǐng)域的三個上市公司之一)下設(shè)的專門從事語音及語言核心技術(shù)研究的部門指導(dǎo)思想:用正確的方法,做有用的研究訊飛研究院簡介科大訊飛公司(中文信息領(lǐng)域的三個上市公司之一)3訊飛發(fā)展史上“有用的研究”1999~語音合成引擎廠商2002~語音評測教育學(xué)習(xí)2005~語音識別運(yùn)營商&安全2011~語音交互移動互聯(lián)訊飛發(fā)展史上“有用的研究”1999~語音合成引擎廠商20024交流內(nèi)容一、訊飛在知識圖譜領(lǐng)域的一些嘗試二、從應(yīng)用看知識圖譜的價值和挑戰(zhàn)從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)交流內(nèi)容一、訊飛在知識圖譜領(lǐng)域的一些嘗試二、從應(yīng)用看知識圖譜5什么是知識圖譜(KnowledgeGraph)?知識圖譜旨在描述真實(shí)世界中存在的各種實(shí)體或概念及其關(guān)系,一般用三元組表示知識圖譜亦可被看作是一張巨大的圖,節(jié)點(diǎn)表示實(shí)體或概念,邊則由屬性或關(guān)系構(gòu)成中國國家美國日本英國北京9,634,057平方公里13.5404億2069.3萬北緯38°56'東經(jīng)116°20'3.1525億華盛頓9,629,091平方公里北緯38°53′西經(jīng)77°02'178平方公里16410平方公里1.26億377835平方公里東京2188平方公里東經(jīng)140°50'北緯35°44'……面積人口首都緯度經(jīng)度面積人口什么是知識圖譜(KnowledgeGraph)?知識圖譜旨6知識圖譜構(gòu)建后臺的技術(shù)族Web字典,術(shù)語表,百科,書本知識獲取++已有知識庫知識融合知識驗(yàn)證知識圖譜知識圖譜構(gòu)建后臺的技術(shù)族Web字典,術(shù)語表,知++已有知7現(xiàn)有的大規(guī)模知識名稱規(guī)模Yago1千萬實(shí)體,35萬類別,1.8億事實(shí),100種屬性,100語言Dbpedia4千萬實(shí)體,250類別,5億事實(shí),6000種屬性,F(xiàn)reebase2千5百萬實(shí)體,2000主題,1億事實(shí),4000種屬性谷歌知識圖譜5億實(shí)體名字,35億條事實(shí)NELL3百萬實(shí)體名字,300類別500屬性,100萬事實(shí)1千5百萬學(xué)習(xí)規(guī)則現(xiàn)有的大規(guī)模知識名稱規(guī)模Yago1千萬實(shí)體,35萬類別,Db8中文知識庫傳統(tǒng)的語言類知識庫,基于人工編寫方式,構(gòu)建了一系列的中小規(guī)模中文知識庫知網(wǎng)(HowNet)[董振東和董強(qiáng),1999]《同義詞詞林》[梅家駒等,1996]概念層次網(wǎng)絡(luò)(HNC)[黃曾陽,1997]大規(guī)模事實(shí)類知識庫,針對自身業(yè)務(wù)需要建立百度知心,優(yōu)化搜索搜狗知立方,優(yōu)化搜索阿里巴巴知識庫(商品知識庫)中文知識庫傳統(tǒng)的語言類知識庫,基于人工編寫方式,構(gòu)建了一系列9訊飛的一些初步嘗試音樂領(lǐng)域重點(diǎn)探索了如何基于互聯(lián)網(wǎng)構(gòu)建高質(zhì)量的大規(guī)模音樂知識庫10086客服領(lǐng)域重點(diǎn)探索了如何基于知識庫改進(jìn)自動客服系統(tǒng)訊飛的一些初步嘗試音樂領(lǐng)域重點(diǎn)探索了如何基于互聯(lián)網(wǎng)構(gòu)建高質(zhì)量10音樂領(lǐng)域任務(wù)定義:想聽什么,想問什么,直接說放一首王力宏的歌(王力宏_歌手)我想聽江南style神曲(江南style_歌曲)來一首他一定很愛你,阿杜的(阿杜_歌手_他一定很愛你_歌曲)來首兒歌(兒歌_標(biāo)簽)我想聽一首歌吻吻的幸福(穩(wěn)穩(wěn)的幸福_歌曲,需容錯)播放周杰倫的新歌(周杰倫_歌手,歌曲屬性為“新”)周董和費(fèi)玉清合作的那首歌(周杰倫_歌手&費(fèi)玉清_歌手)周杰倫和哪些臺灣女歌手合作過(知識問答)神話是孫楠和誰合唱的(知識問答)語音識別的突破,大大激發(fā)了語音理解的需求音樂領(lǐng)域任務(wù)定義:想聽什么,想問什么,直接說語音識別的突破,11歌手6萬歌曲260萬專輯44萬標(biāo)簽2000類系統(tǒng)實(shí)現(xiàn)互聯(lián)網(wǎng)各種音樂相關(guān)信息下載融合語義理解曲庫查詢語音識別基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建+基于人工規(guī)則的語義理解結(jié)果生成歌手6萬系統(tǒng)實(shí)現(xiàn)互聯(lián)網(wǎng)下載融合語義曲庫語12基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題同一個歌曲有多個歌手演唱過的版本,甚至多個完全不同的歌曲,網(wǎng)上信息比較混亂同庾澄慶版另一首歌同庾澄慶版,但是沒有人聲,何真真是演奏者基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題同庾澄慶版另一首歌13基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題同一個歌曲有多個歌手演唱過的版本,,甚至多個完全不同的歌曲,網(wǎng)上信息比較亂歌曲的標(biāo)簽體系比較亂,需要融合“藍(lán)調(diào)”“布魯斯”(對應(yīng)的英文都是Blues)“慢搖”“R&B”“HIP&HOP”“戲曲”“京劇”“昆曲”“黃梅戲”(相互平行)“純音樂”“鋼琴曲”“古箏”“薩克斯”歌曲名、歌手名很隨意我想給我的朋友點(diǎn)首我愛你中國這首歌基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題14音樂曲庫重構(gòu)音樂曲庫重構(gòu)以事件本體為依據(jù)重構(gòu)音樂本體庫,替換三元組方案三元組:(那英_Subject,演唱_Predicate,春暖花開_Object)事件本體:(那英_主體,演唱_動作,春暖花開_客體,蛇年春晚_場合,2013年2月9日_時間)音樂曲庫重構(gòu)音樂曲庫重構(gòu)三元組:(那英_Subject,15音樂曲庫重構(gòu)細(xì)化細(xì)化新增音樂曲庫重構(gòu)細(xì)化細(xì)化新增16基于人工規(guī)則的語義理解神話是孫楠和誰合唱的?文法解析知識庫查詢SPARQL查詢語句生成答案生成孫楠和韓紅合唱了神話韓紅歌手6萬歌曲260萬專輯44萬標(biāo)簽2000類param:singer孫楠#param:song神話#predicate:chorusWith神話是孫楠和誰合唱的查詢神話這首歌曲的演唱者,演唱者要包括孫楠,輸出還包括的另外一個演唱者文法規(guī)則模板基于人工規(guī)則的語義理解神話是孫楠和誰合唱的?文法知識庫SPA17基于曲庫資源的理解和糾錯識別結(jié)果:我是你的安東尼演唱的文法規(guī)則:{歌曲名}{歌手名}演唱的容錯結(jié)果:倪安東(歌手名)我是你的(歌曲名)識別結(jié)果:汪峰的北京青年文法規(guī)則:{歌手名}的{歌曲名}容錯結(jié)果:汪峰(歌手名)北京北京(歌曲名)基于曲庫資源的理解和糾錯識別結(jié)果:我是你的安東尼演唱的識別結(jié)18訊飛的一些初步嘗試音樂領(lǐng)域10086客服領(lǐng)域訊飛的一些初步嘗試音樂領(lǐng)域19智能客服領(lǐng)域智能客服:改變傳統(tǒng)的按鍵式自助服務(wù),用戶使用自然語音與系統(tǒng)交互,實(shí)現(xiàn)菜單扁平化,提升用戶滿意度,減輕人工服務(wù)壓力,降低運(yùn)營成本。10086智能客服1.幫我查詢話費(fèi)。2.辦理彩鈴業(yè)務(wù)。3.開通5元30M套餐。4.我要交100元話費(fèi)1.怎樣退訂國內(nèi)移動數(shù)據(jù)5元?2.辦兩城一家后給省內(nèi)打電話,是怎么收費(fèi)的?3.怎么辦理10元100M流量包?4.我要到新加坡去旅游,需要辦什么手續(xù)?業(yè)務(wù)辦理類:業(yè)務(wù)咨詢類:智能客服領(lǐng)域智能客服:改變傳統(tǒng)的按鍵式自助服務(wù),用戶使用自然20總體思路結(jié)構(gòu)化知識庫移動作業(yè)手冊總體思路結(jié)構(gòu)化知識庫移動作業(yè)手冊21原始文檔知識庫安徽移動Web版知識庫原始文檔知識庫安徽移動Web版知識庫22人工參與的本體知識庫構(gòu)建領(lǐng)域?qū)<椅臋n知識庫本體概念設(shè)計ontology標(biāo)注模板人工標(biāo)注標(biāo)注結(jié)果實(shí)例化本體知識庫人工參與的本體知識庫構(gòu)建領(lǐng)域?qū)<椅臋n本體ontology標(biāo)注23知識庫結(jié)構(gòu)個人業(yè)務(wù)描述框架知識庫結(jié)構(gòu)個人業(yè)務(wù)描述框架24知識庫結(jié)構(gòu)個人信息描述框架知識庫結(jié)構(gòu)個人信息描述框架25知識庫結(jié)構(gòu)主套餐描述框架知識庫結(jié)構(gòu)主套餐描述框架26知識庫結(jié)構(gòu)當(dāng)前規(guī)模:106屬性,100業(yè)務(wù),3102個三元組完整知識庫結(jié)構(gòu)知識庫結(jié)構(gòu)當(dāng)前規(guī)模:106屬性,100業(yè)務(wù),3102個三元組27基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于SparQL答案生成語義框架表示咨詢類問題問題:怎么辦理10元100M流量包?答案答案:對不起,沒有找到10元100M的流量套餐,但是有以下套餐:10元70M;5元30M;50元500M.Select?money?amount?open_way{?busihas_name“流量”.?busicontain_pack?pack.?packhas_money?money.?packhas_amount?amount.?packhas_open_way?open_way}問題焦點(diǎn)

開通方式問題類型

怎么操作

開通業(yè)務(wù)

流量金額

10元數(shù)量

100M

詞匯級句子級基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于Spar28基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于SparQL答案生成語義框架表示咨詢類問題問句:辦兩城一家后給省內(nèi)打電話,是怎么收費(fèi)的?答案答案:開通后省內(nèi)定點(diǎn)市打電話每分鐘0.29元Select?money?amount?open_way{?busihas_name“兩城一家”…….問題焦點(diǎn)

開通方式問題類型

怎么操作

開通業(yè)務(wù)

流量金額

10元數(shù)量

100M

詞匯級句子級業(yè)務(wù)名稱:兩城一家省內(nèi)套餐關(guān)鍵動詞:是、撥打、收費(fèi)參數(shù):地區(qū)-省內(nèi)關(guān)鍵名詞:兩城一家、電話問題類型:how問題焦點(diǎn):資費(fèi)基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于Spar29題目(改編自2012年海南省高考文綜地理試卷)7月1日下列城市白晝最長的是?A.悉尼B.上海C.雅加達(dá)D.莫斯科題目理解知識庫檢索邏輯推理7月1日左右,北半球晝長夜短緯度越高晝越長悉尼南緯33度55分上海北緯31度11分雅加達(dá)南緯6度10分莫斯科北緯55度45分莫斯科北緯度最高莫斯科白晝最長,選D常識知識獲取考察四個城市,按daytime(city,7月1日)排序,取最大值的一個答案863類人答題任務(wù)難度分析類人答題系統(tǒng)的研發(fā)需要多種知識庫的支撐!題目(改編自2012年海南省高考文綜地理試卷)題目理解知識庫30交流內(nèi)容一、訊飛在知識圖譜領(lǐng)域的一些嘗試二、從應(yīng)用看知識圖譜的價值和挑戰(zhàn)從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)交流內(nèi)容一、訊飛在知識圖譜領(lǐng)域的一些嘗試二、從應(yīng)用看知識圖譜31人工智能的三個階段計算智能感知智能認(rèn)知智能能存會算能聽會說、能看會認(rèn)能理解會思考人工智能的三個階段計算智能感知智能認(rèn)知智能能存會算能聽會說、32一、知識圖譜研發(fā)需區(qū)分并針對應(yīng)用應(yīng)用場景搜索:展示及優(yōu)化搜索結(jié)果音樂:難在構(gòu)建曲庫客服:對自動客服的幫助有限和NLP一樣,不同應(yīng)用場景,對知識圖譜的需求點(diǎn)和難點(diǎn)差別很大潛在應(yīng)用價值的發(fā)現(xiàn),能拉動知識圖譜的研究水平和投入的提升答題:需要各種常識和學(xué)科知識庫一、知識圖譜研發(fā)需區(qū)分并針對應(yīng)用應(yīng)搜索:展示及優(yōu)化搜索結(jié)果音33二、積極探索知識圖譜對理解的價值知識圖譜對語義理解本身的幫助有限列表型資源的利用基于知識圖譜的糾錯記憶超出任何人,但理解不及5歲小孩給你一個蘋果,再給你一個蘋果,你有幾個蘋果了給你一個蘋果,你吃了一個蘋果,你有幾個蘋果了語義理解正是人類知識積累的渠道烏龍球:踢進(jìn)自家球門的球高鐵:就是很快的火車二、積極探索知識圖譜對理解的價值知識圖譜對語義理解本身的幫助34三、直面當(dāng)前知識圖譜技術(shù)方案的問題研究范圍語言知識庫何謂“坐”事實(shí)類知識庫專業(yè)領(lǐng)域知識庫表示能力三元組的方式,表達(dá)能力不足知識圖譜表示是離散型的,沒有連續(xù)、模糊的概念收獲了七八斤蘋果應(yīng)用模式串行的知識圖譜如何追趕人類是高度并行“跑”比“走”快從北京到天津不用坐飛機(jī)知識圖譜上的推理能力,也還太弱“深”比“廣”難三、直面當(dāng)前知識圖譜技術(shù)方案的問題研究范圍語言知識庫何謂“坐35一個哲學(xué)問題僅用文字描述的世界,是不是“假”的世界?沒有視覺、沒有聽覺、沒有觸覺沒有情感、沒有信仰格?;ㄒ环N生長在高原上的花朵,桿細(xì)瓣小,花為復(fù)葉羽狀,五瓣花,顏色鮮艷而美麗,隨著季節(jié)變化而逐漸變換顏色。花徑長約1.5~3cm,為落葉喬木。一個哲學(xué)問題僅用文字描述的世界,是不是“假”的世界?格?;?6總結(jié)和建議“用正確的方法,做有用的研究”,知識圖譜的研究應(yīng)該與實(shí)際應(yīng)用相結(jié)合,應(yīng)該與語義理解、知識學(xué)習(xí)相結(jié)合訊飛公司針對音樂和客服兩個領(lǐng)域做了一些知識圖譜相關(guān)的嘗試,目前還都不太成功“深”比“廣”難,現(xiàn)有知識圖譜的解決方案和應(yīng)用價值都面臨諸多挑戰(zhàn),是一個很值得深入和廣泛合作研究的領(lǐng)域總結(jié)和建議“用正確的方法,做有用的研究”,知識圖譜的研究應(yīng)該37謝謝謝謝38演講完畢,謝謝觀看!演講完畢,謝謝觀看!39從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)科大訊飛研究院胡國平2014年10月17日武漢11:25:28從應(yīng)用角度來看科大訊飛研究院胡國平15:24:2640第二屆全國中文知識圖譜研討會本次知識圖譜研討會著重探討中文知識圖譜的構(gòu)建的資源、技術(shù)、方案、策略以及待研究問題和挑戰(zhàn)促進(jìn)研究單位之間以及研究界和產(chǎn)業(yè)界之間的學(xué)術(shù)交流探索今后大規(guī)模中文知識圖譜構(gòu)建的研討與合作機(jī)制第二屆全國中文知識圖譜研討會本次知識圖譜研討會41訊飛研究院簡介科大訊飛公司(中文信息領(lǐng)域的三個上市公司之一)下設(shè)的專門從事語音及語言核心技術(shù)研究的部門指導(dǎo)思想:用正確的方法,做有用的研究訊飛研究院簡介科大訊飛公司(中文信息領(lǐng)域的三個上市公司之一)42訊飛發(fā)展史上“有用的研究”1999~語音合成引擎廠商2002~語音評測教育學(xué)習(xí)2005~語音識別運(yùn)營商&安全2011~語音交互移動互聯(lián)訊飛發(fā)展史上“有用的研究”1999~語音合成引擎廠商200243交流內(nèi)容一、訊飛在知識圖譜領(lǐng)域的一些嘗試二、從應(yīng)用看知識圖譜的價值和挑戰(zhàn)從應(yīng)用角度來看知識圖譜的價值和挑戰(zhàn)交流內(nèi)容一、訊飛在知識圖譜領(lǐng)域的一些嘗試二、從應(yīng)用看知識圖譜44什么是知識圖譜(KnowledgeGraph)?知識圖譜旨在描述真實(shí)世界中存在的各種實(shí)體或概念及其關(guān)系,一般用三元組表示知識圖譜亦可被看作是一張巨大的圖,節(jié)點(diǎn)表示實(shí)體或概念,邊則由屬性或關(guān)系構(gòu)成中國國家美國日本英國北京9,634,057平方公里13.5404億2069.3萬北緯38°56'東經(jīng)116°20'3.1525億華盛頓9,629,091平方公里北緯38°53′西經(jīng)77°02'178平方公里16410平方公里1.26億377835平方公里東京2188平方公里東經(jīng)140°50'北緯35°44'……面積人口首都緯度經(jīng)度面積人口什么是知識圖譜(KnowledgeGraph)?知識圖譜旨45知識圖譜構(gòu)建后臺的技術(shù)族Web字典,術(shù)語表,百科,書本知識獲取++已有知識庫知識融合知識驗(yàn)證知識圖譜知識圖譜構(gòu)建后臺的技術(shù)族Web字典,術(shù)語表,知++已有知46現(xiàn)有的大規(guī)模知識名稱規(guī)模Yago1千萬實(shí)體,35萬類別,1.8億事實(shí),100種屬性,100語言Dbpedia4千萬實(shí)體,250類別,5億事實(shí),6000種屬性,F(xiàn)reebase2千5百萬實(shí)體,2000主題,1億事實(shí),4000種屬性谷歌知識圖譜5億實(shí)體名字,35億條事實(shí)NELL3百萬實(shí)體名字,300類別500屬性,100萬事實(shí)1千5百萬學(xué)習(xí)規(guī)則現(xiàn)有的大規(guī)模知識名稱規(guī)模Yago1千萬實(shí)體,35萬類別,Db47中文知識庫傳統(tǒng)的語言類知識庫,基于人工編寫方式,構(gòu)建了一系列的中小規(guī)模中文知識庫知網(wǎng)(HowNet)[董振東和董強(qiáng),1999]《同義詞詞林》[梅家駒等,1996]概念層次網(wǎng)絡(luò)(HNC)[黃曾陽,1997]大規(guī)模事實(shí)類知識庫,針對自身業(yè)務(wù)需要建立百度知心,優(yōu)化搜索搜狗知立方,優(yōu)化搜索阿里巴巴知識庫(商品知識庫)中文知識庫傳統(tǒng)的語言類知識庫,基于人工編寫方式,構(gòu)建了一系列48訊飛的一些初步嘗試音樂領(lǐng)域重點(diǎn)探索了如何基于互聯(lián)網(wǎng)構(gòu)建高質(zhì)量的大規(guī)模音樂知識庫10086客服領(lǐng)域重點(diǎn)探索了如何基于知識庫改進(jìn)自動客服系統(tǒng)訊飛的一些初步嘗試音樂領(lǐng)域重點(diǎn)探索了如何基于互聯(lián)網(wǎng)構(gòu)建高質(zhì)量49音樂領(lǐng)域任務(wù)定義:想聽什么,想問什么,直接說放一首王力宏的歌(王力宏_歌手)我想聽江南style神曲(江南style_歌曲)來一首他一定很愛你,阿杜的(阿杜_歌手_他一定很愛你_歌曲)來首兒歌(兒歌_標(biāo)簽)我想聽一首歌吻吻的幸福(穩(wěn)穩(wěn)的幸福_歌曲,需容錯)播放周杰倫的新歌(周杰倫_歌手,歌曲屬性為“新”)周董和費(fèi)玉清合作的那首歌(周杰倫_歌手&費(fèi)玉清_歌手)周杰倫和哪些臺灣女歌手合作過(知識問答)神話是孫楠和誰合唱的(知識問答)語音識別的突破,大大激發(fā)了語音理解的需求音樂領(lǐng)域任務(wù)定義:想聽什么,想問什么,直接說語音識別的突破,50歌手6萬歌曲260萬專輯44萬標(biāo)簽2000類系統(tǒng)實(shí)現(xiàn)互聯(lián)網(wǎng)各種音樂相關(guān)信息下載融合語義理解曲庫查詢語音識別基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建+基于人工規(guī)則的語義理解結(jié)果生成歌手6萬系統(tǒng)實(shí)現(xiàn)互聯(lián)網(wǎng)下載融合語義曲庫語51基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題同一個歌曲有多個歌手演唱過的版本,甚至多個完全不同的歌曲,網(wǎng)上信息比較混亂同庾澄慶版另一首歌同庾澄慶版,但是沒有人聲,何真真是演奏者基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題同庾澄慶版另一首歌52基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題同一個歌曲有多個歌手演唱過的版本,,甚至多個完全不同的歌曲,網(wǎng)上信息比較亂歌曲的標(biāo)簽體系比較亂,需要融合“藍(lán)調(diào)”“布魯斯”(對應(yīng)的英文都是Blues)“慢搖”“R&B”“HIP&HOP”“戲曲”“京劇”“昆曲”“黃梅戲”(相互平行)“純音樂”“鋼琴曲”“古箏”“薩克斯”歌曲名、歌手名很隨意我想給我的朋友點(diǎn)首我愛你中國這首歌基于互聯(lián)網(wǎng)的音樂曲庫構(gòu)建遇到了一系列的問題53音樂曲庫重構(gòu)音樂曲庫重構(gòu)以事件本體為依據(jù)重構(gòu)音樂本體庫,替換三元組方案三元組:(那英_Subject,演唱_Predicate,春暖花開_Object)事件本體:(那英_主體,演唱_動作,春暖花開_客體,蛇年春晚_場合,2013年2月9日_時間)音樂曲庫重構(gòu)音樂曲庫重構(gòu)三元組:(那英_Subject,54音樂曲庫重構(gòu)細(xì)化細(xì)化新增音樂曲庫重構(gòu)細(xì)化細(xì)化新增55基于人工規(guī)則的語義理解神話是孫楠和誰合唱的?文法解析知識庫查詢SPARQL查詢語句生成答案生成孫楠和韓紅合唱了神話韓紅歌手6萬歌曲260萬專輯44萬標(biāo)簽2000類param:singer孫楠#param:song神話#predicate:chorusWith神話是孫楠和誰合唱的查詢神話這首歌曲的演唱者,演唱者要包括孫楠,輸出還包括的另外一個演唱者文法規(guī)則模板基于人工規(guī)則的語義理解神話是孫楠和誰合唱的?文法知識庫SPA56基于曲庫資源的理解和糾錯識別結(jié)果:我是你的安東尼演唱的文法規(guī)則:{歌曲名}{歌手名}演唱的容錯結(jié)果:倪安東(歌手名)我是你的(歌曲名)識別結(jié)果:汪峰的北京青年文法規(guī)則:{歌手名}的{歌曲名}容錯結(jié)果:汪峰(歌手名)北京北京(歌曲名)基于曲庫資源的理解和糾錯識別結(jié)果:我是你的安東尼演唱的識別結(jié)57訊飛的一些初步嘗試音樂領(lǐng)域10086客服領(lǐng)域訊飛的一些初步嘗試音樂領(lǐng)域58智能客服領(lǐng)域智能客服:改變傳統(tǒng)的按鍵式自助服務(wù),用戶使用自然語音與系統(tǒng)交互,實(shí)現(xiàn)菜單扁平化,提升用戶滿意度,減輕人工服務(wù)壓力,降低運(yùn)營成本。10086智能客服1.幫我查詢話費(fèi)。2.辦理彩鈴業(yè)務(wù)。3.開通5元30M套餐。4.我要交100元話費(fèi)1.怎樣退訂國內(nèi)移動數(shù)據(jù)5元?2.辦兩城一家后給省內(nèi)打電話,是怎么收費(fèi)的?3.怎么辦理10元100M流量包?4.我要到新加坡去旅游,需要辦什么手續(xù)?業(yè)務(wù)辦理類:業(yè)務(wù)咨詢類:智能客服領(lǐng)域智能客服:改變傳統(tǒng)的按鍵式自助服務(wù),用戶使用自然59總體思路結(jié)構(gòu)化知識庫移動作業(yè)手冊總體思路結(jié)構(gòu)化知識庫移動作業(yè)手冊60原始文檔知識庫安徽移動Web版知識庫原始文檔知識庫安徽移動Web版知識庫61人工參與的本體知識庫構(gòu)建領(lǐng)域?qū)<椅臋n知識庫本體概念設(shè)計ontology標(biāo)注模板人工標(biāo)注標(biāo)注結(jié)果實(shí)例化本體知識庫人工參與的本體知識庫構(gòu)建領(lǐng)域?qū)<椅臋n本體ontology標(biāo)注62知識庫結(jié)構(gòu)個人業(yè)務(wù)描述框架知識庫結(jié)構(gòu)個人業(yè)務(wù)描述框架63知識庫結(jié)構(gòu)個人信息描述框架知識庫結(jié)構(gòu)個人信息描述框架64知識庫結(jié)構(gòu)主套餐描述框架知識庫結(jié)構(gòu)主套餐描述框架65知識庫結(jié)構(gòu)當(dāng)前規(guī)模:106屬性,100業(yè)務(wù),3102個三元組完整知識庫結(jié)構(gòu)知識庫結(jié)構(gòu)當(dāng)前規(guī)模:106屬性,100業(yè)務(wù),3102個三元組66基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于SparQL答案生成語義框架表示咨詢類問題問題:怎么辦理10元100M流量包?答案答案:對不起,沒有找到10元100M的流量套餐,但是有以下套餐:10元70M;5元30M;50元500M.Select?money?amount?open_way{?busihas_name“流量”.?busicontain_pack?pack.?packhas_money?money.?packhas_amount?amount.?packhas_open_way?open_way}問題焦點(diǎn)

開通方式問題類型

怎么操作

開通業(yè)務(wù)

流量金額

10元數(shù)量

100M

詞匯級句子級基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于Spar67基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于SparQL答案生成語義框架表示咨詢類問題問句:辦兩城一家后給省內(nèi)打電話,是怎么收費(fèi)的?答案答案:開通后省內(nèi)定點(diǎn)市打電話每分鐘0.29元Select?money?amount?open_way{?busihas_name“兩城一家”…….問題焦點(diǎn)

開通方式問題類型

怎么操作

開通業(yè)務(wù)

流量金額

10元數(shù)量

100M

詞匯級句子級業(yè)務(wù)名稱:兩城一家省內(nèi)套餐關(guān)鍵動詞:是、撥打、收費(fèi)參數(shù):地區(qū)-省內(nèi)關(guān)鍵名詞:兩城一家、電話問題類型:how問題焦點(diǎn):資費(fèi)基于本體庫的咨詢問答服務(wù)基于槽信息抽取的問題理解基于Spar68題目(改編自2012年海南省高考文綜地理試卷)7月1日下列城市白晝最長的是?A.悉尼B.上海C.雅加達(dá)D.莫斯科題目理解知識庫檢索邏輯推理7月1日左右,北半球晝長夜短緯度越高晝越長悉尼南緯33度55分上海北緯31度11分雅加達(dá)南緯6度10分莫斯科北緯55度45分莫斯科北緯度最高莫斯科白晝最長,選D常識知識獲取考察四個城市,按daytime(cit

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論