智能問答系統(tǒng)設(shè)計(jì)與開發(fā)中國軟件杯_第1頁
智能問答系統(tǒng)設(shè)計(jì)與開發(fā)中國軟件杯_第2頁
智能問答系統(tǒng)設(shè)計(jì)與開發(fā)中國軟件杯_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、智能問答系統(tǒng)設(shè)計(jì)與開發(fā)-中國軟件杯智能問答系統(tǒng)設(shè)計(jì)與開發(fā)-中國軟件杯3/3智能問答系統(tǒng)設(shè)計(jì)與開發(fā)-中國軟件杯第七屆“中國軟件杯”大學(xué)生軟件設(shè)計(jì)大賽賽題名稱:智能問答系統(tǒng)設(shè)計(jì)與開發(fā)組類:A本科及以上賽題簡介:介紹整個(gè)賽題的思路和整體要求賽題業(yè)務(wù)場景:描繪賽題有關(guān)的真切公司業(yè)務(wù)背景。從真切場景中,合適簡化或許提煉出合適競賽的賽題場景功能性需求智能客服系統(tǒng)是在大規(guī)模知識辦理基礎(chǔ)上發(fā)展起來的一項(xiàng)面向行業(yè)應(yīng)用的,合用大規(guī)模知識辦理、自然語言理解、知識管理、自動(dòng)問答系統(tǒng)、推理等技術(shù)行業(yè)。針對自動(dòng)問答系統(tǒng),我們希望開發(fā)一套智能問答系統(tǒng),該系統(tǒng)能夠鑒于給定文檔,提取知識并自動(dòng)生成問答知識庫,并能現(xiàn)問答系統(tǒng)(前

2、、后臺功能)基本能力。知識庫是智能客服/智能問答系統(tǒng)的重點(diǎn)競爭力之一,高質(zhì)量的知識庫建立是業(yè)界難題之一。當(dāng)前業(yè)界大多數(shù)智能客服的知識庫(QA對問答對)建立都是經(jīng)過人工建立,一個(gè)完美的知識庫建立,需要耗資大批的人力。急迫需要有一套自動(dòng)化方案,能夠依據(jù)給定的文檔(如產(chǎn)品手冊、事例文檔、用戶指南等)等自動(dòng)建立知識庫(QA對)。本次智能問答系統(tǒng)設(shè)計(jì),分為前臺、后臺、知識庫建立三個(gè)主要功能模塊,此中前臺是為問答操作供應(yīng)界面,后臺實(shí)現(xiàn)產(chǎn)品文檔錄入、知識庫管理以及與前臺通訊、知識庫建立依據(jù)錄入文檔實(shí)現(xiàn)“QA對”自動(dòng)化生成。后臺:請?jiān)O(shè)計(jì)一個(gè)程序從文檔中提取盡可能多且質(zhì)量高的問答對,問題能夠是由主題、重點(diǎn)詞、短

3、語構(gòu)成,答案能夠直接一個(gè)段落活語句構(gòu)成。文檔:格式html,數(shù)目大體是5w左右,全部文檔種類都是用戶指南、常有問題、產(chǎn)品手冊知識庫QA對格式:彈性云服務(wù)器的價(jià)錢怎么計(jì)算的?我們有按需、包年/包月兩種計(jì)費(fèi)方式,您能夠依據(jù)您的實(shí)質(zhì)狀況選擇不一樣的計(jì)費(fèi)方式。知識庫管理:實(shí)現(xiàn)基本QA對刪除、增添、查問等操作功能。2.前臺:請?jiān)O(shè)計(jì)一個(gè)程序,實(shí)現(xiàn)QA對話界面,該界面能夠鑒于用戶發(fā)問,自動(dòng)連結(jié)后臺、并從知識庫找尋答案,并體現(xiàn)給用戶,前臺問題能夠是由主題、重點(diǎn)詞、短語構(gòu)成。知識庫建立:請?jiān)O(shè)計(jì)一個(gè)程序,實(shí)現(xiàn)依據(jù)錄入文檔自動(dòng)化生成知識庫“QA對”,在盡可能多的提取問答對的前提下,使得問題的質(zhì)量更高同時(shí)答案更正確,

4、知識庫內(nèi)QA對不一樣意出現(xiàn)兩個(gè)同樣的問題。本部分為本賽題核心觀察點(diǎn):核心觀察知識庫實(shí)現(xiàn)正確性(詳見任務(wù)評論指標(biāo)),實(shí)現(xiàn)方非功能性需求其余限制條件:開發(fā)環(huán)境、實(shí)驗(yàn)平臺、開發(fā)語言、數(shù)據(jù)庫、編譯器等限制條件(請盡量明確)測試數(shù)據(jù)或平臺:供應(yīng)給參賽者的測試環(huán)境和測試數(shù)據(jù)。(可供應(yīng)電子檔)法不限,可選擇使用以下三種方式:鑒于規(guī)則的QA對生成鑒于NLP方法的QA對生成鑒于機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的QA對生成注:鑒于NLP的QA對生成,建議考慮一下技術(shù)點(diǎn):文檔構(gòu)造樹,主題/段落/語句切割實(shí)體提取、重點(diǎn)詞提取、語義特點(diǎn)提取語句構(gòu)造剖析:同位語構(gòu)造、動(dòng)詞修飾名詞構(gòu)造、句型剖析綱要提取、語句壓縮和交融問題模式分類問題生

5、成(語義模板法、ML生成法、深度學(xué)習(xí))問句泛化:重點(diǎn)詞替代句法轉(zhuǎn)變:WH挪動(dòng)、主謂倒置等將陳說句變換為問句問題語義達(dá)成度剖析文本閱讀理解模型整個(gè)系統(tǒng)應(yīng)當(dāng)能比較快的響應(yīng),前、后臺應(yīng)當(dāng)能夠流利使用UI的設(shè)計(jì)應(yīng)當(dāng)切合慣例的使用習(xí)慣;需要供應(yīng)完美的文檔說明,如系統(tǒng)設(shè)計(jì)文檔、知識庫建立核心規(guī)則或算法設(shè)計(jì)文檔等知識庫建立使用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法時(shí),建議采納華為云機(jī)器學(xué)習(xí)、深度學(xué)習(xí)服務(wù)。為了方便選手參賽,華為公司云從18年3月起,將為參數(shù)選手供應(yīng)云上高性能機(jī)器學(xué)習(xí)、深度學(xué)習(xí)云環(huán)境,先到先得。前、后臺采納服務(wù)器端+挪動(dòng)端模式,服務(wù)器端可為Web服務(wù)器,挪動(dòng)端為APP(Android、IOS不限,一種即可)測試數(shù)據(jù)和平臺:供應(yīng)開發(fā)和測試所需的原始產(chǎn)品文檔及考證所需配套QA對(測試數(shù)據(jù)于18年3月初供應(yīng))同意使用選手經(jīng)過其余數(shù)據(jù)訓(xùn)練調(diào)優(yōu)模型任務(wù)評論指標(biāo)前臺+后臺基本功能實(shí)現(xiàn)、文檔:50%知識庫建立成效:50%賽題評論時(shí),使用另一組N測試文檔以及若干個(gè)備選的QA對,測試知識庫建立狀況,主要評論標(biāo)準(zhǔn)以下:命中問答對數(shù):給定問題答案會(huì)合,在完整般配的狀況

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論