




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1問題解決型實現(xiàn)技術(shù)解決方案架構(gòu)及開發(fā)流程小Y(智能機器人)2問題解決型機器人3問題解決型機器人,存在的目的是為了幫用戶解決具體問題,例如:售前咨詢、售后報修、訂機票、酒店、餐廳座位等等需要提供給用戶自己都不知道的信息-知識庫1.理解用戶問題,知道用戶在問什么2.將用戶的問題轉(zhuǎn)化為對知識庫的查詢4問題理解查詢知識庫構(gòu)建知識庫查詢多輪對話的上下文管理提問:今天北京多少度啊?回答:35度提問:有霧霾嗎? (北京有霧霾嗎?)回答:空氣質(zhì)量優(yōu)。提問:那上海呢?(上海有霧霾嗎?)回答:空氣質(zhì)量也是優(yōu)。結(jié)合上下文5聊天機器人解決方案6自然語言處理、文本挖掘、知識圖譜7知識庫中存儲的是一對對的“問題-答案”
2、對(QA Pair)。這些Pair可以是人工構(gòu)建的,源于客戶系統(tǒng)或者舊有知識庫的,也可以是從互聯(lián)網(wǎng)上爬取下來的。當用戶輸入問題后,將其和知識庫現(xiàn)有的標準問題進行一一比對,尋找與用戶問題最相近的標準問題,然后將該問題組對的答案返回給用戶。用戶問題-標準問題-答案解決方案一8用戶問題-標準問題的匹配方法可以是關(guān)鍵詞匹配(包括正則表達式匹配);也可以是先將用戶問題和標準問題都轉(zhuǎn)化為向量,再計算兩者之間的距離(余弦距離、歐氏距離、交叉熵、Jaccard距離等),找到距離最近且距離值低于預設閾值的那個標準問題,作為查找結(jié)果。但關(guān)鍵字匹配覆蓋面太小。距離計算的話,在實踐中比對出來的最近距離的兩句話,可能在
3、語義上毫無關(guān)聯(lián),甚至滿擰(比如一個比另一個多了一個否定詞)“關(guān)鍵詞”9解決方案二知識庫中存儲的不是問題-答案對,而僅存儲答案(文檔)。當接收到用戶問題后,直接拿問題去和知識庫中的一篇篇文檔比對,找到在內(nèi)容上關(guān)聯(lián)最緊密的那篇,作為答案返回給用戶。用戶問題-答案10解決方案三從用戶的問題當中識別出用戶的意圖,并抽取這個意圖針對的實體。相應的,知識庫內(nèi)存儲的知識,除了包含知識內(nèi)容本身之外,還應該在結(jié)構(gòu)上能夠表示知識之間的關(guān)聯(lián)關(guān)系。在提取了意圖和實體后,構(gòu)造出對知識庫的查詢(Query),實施查詢,得出結(jié)果后生成回答,回復給用戶。用戶問題-語義理解-知識庫查詢-查詢結(jié)果生成答案11聊天機器人實現(xiàn)技術(shù)1
4、2語義理解NLU意圖識別實體抽取用來識別用戶所提問題的意圖,也就是用戶希望做一件什么事用于提取用戶對話中所提供的和意圖相關(guān)的參數(shù)(實體),例如時間、地點等13Case1:有粉色的手機殼嗎? 意圖:商品推薦;實體:商品類型-手機,商品顏色-粉色 。Case2:00183號商品快遞到伊犁郵費多少? 意圖:查詢郵費;實體:目的地-伊犁,商品Id-00183。Case3:02465號商品有保修嗎?意圖:保修查詢;實體:商品Id-02465。舉個例子,小明是一家小淘寶店主,他要為自己的淘寶店開發(fā)一款客服機器人,主要回答和商品屬性(品牌、價格、郵費、售后等)相關(guān)的問題。Case2:00183號商品快遞到伊
5、犁郵費多少? 意圖:商品查詢;實體:目的地-伊犁,商品Id-00183,商品屬性-郵費。Case3:02465號商品有保修嗎?意圖:商品查詢;實體:商品Id-02465,商品屬性-保修。具體怎么定義,要與知識庫的結(jié)構(gòu)及中間控件(語義理解+對話管理)結(jié)合起來決定,怎么簡單怎么來14 意圖識別-分類模型分類模型和 seq2seq 判別模型的訓練都屬于有監(jiān)督學習,因此,所有的訓練數(shù)據(jù)都是標注數(shù)據(jù)。因此,在進入訓練階段前必須要經(jīng)過一個步驟:人工標注。如果大家真的在工作中應用機器學習,標注就是無法逾越的臟活累活。實體抽取-Seq2Seq判別模型15人工標記語料(Utterance)意圖(Intent)0
6、0183商品Id號商品快遞到伊犁目的地郵費商品屬性多少?商品查詢02465商品Id號商品有保修商品屬性嗎?商品查詢訂一張數(shù)量2018.12.1號時間北京出發(fā)地到南京目的地的機票訂機票16知識庫、知識查詢和結(jié)果返回知識庫類型構(gòu)造查詢回答生成關(guān)系型數(shù)據(jù)庫根據(jù)意圖和實體,確定tabmeName,where條件,和目標column等要素,構(gòu)建SQL Query將SQL Query的結(jié)果填注到答案模板中,生成回答問題的自然語言API根據(jù)意圖和實體,確定要調(diào)用的API類型和參數(shù),構(gòu)造Http Request將API返回的結(jié)果填注到答案模板中,生成回答問題的自然語言文本文件(json/xml等)根據(jù)意圖和實
7、體,確定對應的文件路徑和對其中存儲數(shù)據(jù)結(jié)構(gòu)的查詢將獲取的內(nèi)容填注到模板中,生成回答問題的自然語言17例如,我們選擇 MySQL 作為小明的淘寶店小助手的知識庫。則商品相關(guān)數(shù)據(jù)都存儲在 table 中。知識庫里有一個 Table,名字叫product_query,其中每一個 row 對應一種產(chǎn)品,每個 column 對應一個屬性。Case2:00183號商品快遞到伊犁郵費多少? 意圖:商品查詢;實體:目的地-伊犁,商品Id-00183,商品屬性-郵費。Case3:02465號商品有保修嗎?意圖:商品查詢;實體:商品Id-02465,商品屬性-保修。table_name: product_quer
8、ycolumn:目的地-destination商品Id-product_id郵費-postage保修-guaranteeCase2:SELECT postage FROM product_query WHERE product_id = 00183 AND destination= 伊犁Case3:SELECT guarantee FROM product_query WHERE product_id = 02465Query 在 MySQL 中運行的結(jié)果(比如是26元),被放到一個預置的針對商品查詢的答案模板里,生成答案。預置模板 : $商品Id號商品的$商品屬性是$Query_Result
9、。生成答案 : 00183號商品的郵費是26元。18上下文管理例如:在商品查詢的目標屬性為郵費時,目的地缺失,這時候就需要主動要求用戶輸入對應的值。思路:1.在配置意圖和實體模板時,需設置郵費相依賴的實體(商品ID、目的地)2.創(chuàng)建意圖表,實體表,建立意圖表與實體表間的關(guān)系,實體與實體間的關(guān)系3.識別出意圖后,提取實體,如果發(fā)現(xiàn)缺失,則一個接一個提示用戶輸入對應的指(配置回答模板)機器人反問每次用戶新輸入的信息都要先進行語言理解,再結(jié)合目前已經(jīng)存儲的上下文信息,或更新 Context,或讀取之前的 Context 作為補充信息??梢詫⒁鈭D,和幾種實體類型對應的實體值存儲在 Context 中。
10、當新的用戶語句輸入后,若能從中提取出新的意圖或?qū)嶓w值,則用新值更新 Context,否則,讀入現(xiàn)有的對應實體值,作為本次語言理解的補充。19架構(gòu)及開發(fā)流程20問答咨詢.知識主力銷售引導業(yè)務辦理Web微信APP聊天工具.中控調(diào)度策略第三方系統(tǒng)行業(yè)知識互聯(lián)網(wǎng)數(shù)據(jù)用戶畫像搜索引擎(語義檢索/文檔檢索.)靜態(tài)知識FAQFAQ管理動態(tài)知識KGKG構(gòu)建管理意圖訓練實體抽取流程設計高頻問題突增問題滿意度NLP知識包智能知識庫會話管理數(shù)據(jù)監(jiān)控產(chǎn)品架構(gòu)21用戶問題AIML格式常見問題模板匹配構(gòu)建查詢意圖識別實體抽取語義理解查詢知識庫填注模板答案處理關(guān)鍵詞提取自然語言處理ES文檔查詢構(gòu)造Jena查詢構(gòu)建知識圖譜22語料獲取網(wǎng)絡爬取開源語料庫用戶日志語料人工編寫語料預處理人工標記模板配置業(yè)務咨詢閱讀用戶日志模型訓練分詞Word2Vec卷積神經(jīng)網(wǎng)絡Keras文本分類命名實體識別詞性標注TensorFlow語義理解NLU保存模型23知識圖譜Knowledge Graph本體構(gòu)建網(wǎng)絡爬取客戶文檔本體庫實體詞典語義解析本體查詢查詢陳述構(gòu)造查詢語句執(zhí)行查詢語句謂語消歧陳述本體庫命名實體識別歧義陳述構(gòu)建依存句法分析實體消歧陳述語義圖構(gòu)建語義圖陳述構(gòu)建謂
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 穴位貼敷護理培訓
- 腎炎腎炎護理查房
- 消防安全知識幼兒課件
- 護士診所勞務合同范本
- 2025至2030年中國斗式連續(xù)預煮機數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國手牽皮帶數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國平面水牌數(shù)據(jù)監(jiān)測研究報告
- 賣買黃牛合同范本
- 演員服裝定制合同范本
- 2025至2030年中國多功能帶餡面條機數(shù)據(jù)監(jiān)測研究報告
- Mob研究院識具-2024年文創(chuàng)行業(yè)報告
- 房地產(chǎn)估價方法-比較法及其運用
- “德能勤績廉”考核測評表
- 新概念英語青少版入門 A-Unit-1課件(共37張)
- 長途汽車客運站調(diào)研報告
- 陜西各市(精確到縣區(qū))地圖PPT課件(可編輯版)
- 酒店住宿水單標準模板
- 尺寸鏈的計算表格
- 夏玉米套種辣椒技術(shù)
- 學術(shù)規(guī)范與寫作課件
- 絕緣電阻測試儀安全操作規(guī)程
評論
0/150
提交評論