




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、人工智能:,關于計算機理解自然查詢語言的研究,摘要,自然語言理解現(xiàn)在己成為人工智能研究中最活躍的領域之一。在自然語言處理的研究中,最有希望的應用領域之一是自然語言接口。計算機對自然語言中的查詢語言理解的正確程度是自然語言接口質量好壞的關鍵。本文基于建立通用模型的概念,設計了一個通用的數(shù)據(jù)庫自然語言接口系統(tǒng)模型,深入地研究了實現(xiàn)該模型的原理,同時建立了一個具體的實現(xiàn)系統(tǒng),并希望該系統(tǒng)很容易地移植到其他應用領域。,緒論:研究情況和發(fā)展趨勢;研究的目的和意義,第一章:數(shù)據(jù)庫漢語通用接口模型及其知識庫的構造,第二章:詞語切分與詞性標注軟件系統(tǒng)的研究,第三章:查詢句語義自動分析與中間語言生成的研究,第四
2、章:產生程序語句及應答生成的研究,人工智能,目錄,總結與展望,第一章,第二章,第三章,第四章,自然語言處理NLP(NaturalLanguageProeessing)是研究如何能讓計算機理解和生成人們日常使用的語言(如漢語、英語等),使得計算機懂得自然語言的含義,并對人們給計算機提出的問題,通過對話的方式,用自然語言進行回答。在自然語言處理的研究中,最有希望的應用領域之一是自然語言接口。所謂自然語言接口就是允許人們用某種自然語言的子集在限制領域內同計算機進行通訊。,數(shù)據(jù)庫自然語言接口是人工智能與數(shù)據(jù)庫技術相結合的產物,涉及到人工智能、自然語言處理、數(shù)據(jù)庫技術、人機接口等方面的研究。隨著計算機語
3、音識別技術的逐步趨向實用,人們越來越希望通過自然語言直接與計算機進行溝通。因此,人們非常希望有一種方便的數(shù)據(jù)庫人機界面,以便更好地查詢數(shù)據(jù)庫。,緒論,人工智能,目的和意義,【緒論】,我們知道,目前所用的人機接口大多是以窗口、菜單為主的圖形用戶接口GUI。這種接口簡潔、直觀,用戶只用鼠標點擊以及少量的鍵盤操作就能從數(shù)據(jù)庫中獲取所需的信息。但我們會發(fā)現(xiàn)有些問題是無法或難以用這種方式表達的,例如“找出明年退休的所有教師”;再者,隨著計算機語音識別技術的逐步趨向實用,人們越來越希望通過自然語言直接與計算機進行溝通。因此,人們非常希望有一種方便的數(shù)據(jù)庫人機界面,以便更好地查詢數(shù)據(jù)庫。但通用的自然語言理解
4、往往是低效的和難以實現(xiàn)的,而作為數(shù)據(jù)庫人機接口的自然語言界面具有語用目的單一、用詞范圍有限等特點,在數(shù)據(jù)庫查詢意義上實現(xiàn)自然語言理解是完全可行的。,優(yōu)勢,【緒論】,與數(shù)據(jù)庫系統(tǒng)本身提供的形式化查詢語言(如SQL)相比,用自然語言查詢數(shù)據(jù)庫的優(yōu)勢在: (l)用戶只以應用領域的概念訪問數(shù)據(jù)庫,無需了解數(shù)據(jù)庫的邏輯和存儲結構; (2)用戶不需要或者只需要很少的培訓就能夠直接查詢數(shù)據(jù)庫信息,大大減輕了用戶的培訓負擔 (3)用戶可以簡單明了地提出查詢請求川,比如若要在人事信息庫中查找年齡最大的人,用形式化查詢語言就有些麻煩,不如“年齡最大”表述簡潔。,緒論,第一章,第二章,第三章,第四章,數(shù)據(jù)庫漢語通用
5、接口模型及其知識庫的構造: 要使計算機理解漢語自然查詢語言,先必須構造一個系統(tǒng)模型。,本文的模型是將漢語自然查詢語言的計算機理解與知識庫分開各自獨立進行設計。理解部分分為詞法分析、句法分析與語義分析、自然語言轉中間語言、中間語言轉計算機語言、應答生成幾個相對獨立模塊。知識庫部分從一般到特殊又分為三個層面,即自然語言理解通用知識庫、漢語查詢句理解知識庫和應用領域專用知識庫。這樣模型設計使系統(tǒng)拋開具體應用領域而獨立設計,便于系統(tǒng)的移植和擴充。,第一章,人工智能,緒論,第一章,第二章,第三章,第四章,詞語切分與詞性標注軟件系統(tǒng)的研究: 基于統(tǒng)計和基于規(guī)則是自然語言理解的兩大基本方法。,本部分結合使用
6、統(tǒng)計和規(guī)則設計并實現(xiàn)了一個對通用的漢語自然語言進行詞語切分和詞性標注子系統(tǒng)。重點研究了切分歧義的發(fā)現(xiàn)和消除、人名的識別等幾個部分,提出了先用基于詞典的最大匹配法匹配出最長詞和次長詞,然后用檢測跨段的方法發(fā)現(xiàn)切分歧義,其次判斷出切分歧義類型,最后根據(jù)切分歧義類型的不同分別進行切分歧義的消除一套有效方法。,第二章,人工智能,緒論,第一章,第二章,第三章,第四章,查詢句語義自動分析與中間語言生成的研究: 本部分對應模型中的句法分析與語義分析、自然語言轉中間語言兩個模塊。,在句法分析中研究了查詢句指代消解和省略補充規(guī)律和程序實現(xiàn)算法;在語義分析中深入研究了漢語查詢句語義形式,提出了查詢目標的三層結構,
7、查詢條件的分類組合;同時給出了中間語言結構形式;在自然語言轉中間語言模塊給出了具體的轉換算法。,第三章,人工智能,緒論,第一章,第二章,第三章,第四章,產生程序語句與應答生成的研究: 本部分對應模型中的中間語言轉程序語句、應答生成兩個模塊。,三個層面的查詢目標的中間語言結構是不同的,中間語言轉程序語句模塊給出了它們的實現(xiàn)算法,直接查詢目標和查詢條件的中間語言分別轉換為SQL語句的SELECE子句和WHERE子句,該模塊實現(xiàn)程序輸出結果為回答用戶目標。應答生成模塊根據(jù)查詢句和回答用戶目標,模擬人回答問題的習慣,生成答句,完成一次人機問答的處理過程。,第四章,人工智能,總結,本文是基于建立通用模型的思想,構造了一個通用的數(shù)據(jù)庫自然語言接口系統(tǒng)模型,研究了實現(xiàn)該模型的原理,建立了一個具體的實現(xiàn)系統(tǒng),并希望該系統(tǒng)較容易地移植到其他應用領域。通過對漢語自然語言數(shù)據(jù)庫接口系統(tǒng)的研究,本文設計并建立了一套漢語查詢語言的理解和應答生成系統(tǒng)。創(chuàng)新如下: 1.構造了一個程序設計與知識庫相分離的通用的數(shù)據(jù)庫自然語言接口系統(tǒng)模型。 2.構造了一套即適合查詢語言語義表示又利于轉換計算機執(zhí)行語句的中間語言,并給出了自然語言轉中間語言的處理轉換算法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綠色建筑材料市場發(fā)展趨勢
- 2025至2030中國脫芳族溶劑行業(yè)市場占有率及投資前景評估規(guī)劃報告
- 2025至2030中國腦膠質瘤的診斷和治療行業(yè)產業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國胸飾行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 2025至2030中國胰島素行業(yè)市場發(fā)展分析及競爭格局與投資前景報告
- 2025至2030中國腫瘤營養(yǎng)行業(yè)產業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國肘關節(jié)矯形器行業(yè)產業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 橋梁工程材料采購管理流程要點他
- 2025至2030中國羊肉行業(yè)發(fā)展研究與產業(yè)戰(zhàn)略規(guī)劃分析評估報告
- 2025至2030中國網(wǎng)絡連接設備行業(yè)市場深度調研及前景趨勢與投資報告
- 天津醫(yī)院節(jié)能管理制度
- 軟件服務運維合同范本
- 無創(chuàng)血流動力學監(jiān)測
- GB/T 28583-2025供電服務規(guī)范
- 恩施市2025屆數(shù)學三年級第一學期期末達標測試試題含解析
- 安全注射檢查規(guī)范與實施要點
- 裝修售后維修合同協(xié)議
- 活禽定點屠宰宰殺場項目可行性報告
- 醫(yī)學臨床“三基”訓練-護士分冊-自測及答案
- 智能樂器演奏輔助系統(tǒng)-全面剖析
- 第30課 在線安全防范-2024-2025學年三年級全一冊《信息技術》教案
評論
0/150
提交評論