人工智能論文_第1頁
人工智能論文_第2頁
人工智能論文_第3頁
人工智能論文_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人工智能技術在搜索引擎中的應用[關鍵詞]搜索引擎人工智能智能代理自然語言查詢人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。一種是希望找到人類智力的數學解釋,只要找到了數學解釋,那么人工智能就可以得到實現了;另一種是用一種軟件或硬件的結構來模擬人腦的結構,通過類似仿生學的方法來模擬人類思維。人工智能模擬人類的思維過程,對工業(yè)設計產品或更多的藝術設計進行思維的創(chuàng)新和創(chuàng)造,目前已經取得了一些進展。使人工智能走進了一個嶄新的領域,而智能化的概念設計軟件正在開發(fā)與完善中。在數字化時代,我們設計師的眼光也要適時地放遠拉長,讓各種形式的設計都參與進來,做到工業(yè)設計真正與科技和智能相結合。搜索引擎(searchengines)是對互聯(lián)網上的信息資源進行搜集整理,然后供你查詢的系統(tǒng),它包括信息搜集、信息整理和用戶查詢三部分。搜索引擎的工作原理是:由一個Robot盡可能多地收集WWW上的網頁,按照每個網頁的文本內容建立單詞到網頁的反向索引,用戶在查詢感興趣的主題時,輸入該主題的關鍵字作為查詢條件,搜索引擎利用事先建立好的網頁庫和單詞索引,檢索出符合條件的網頁返回給用戶。搜索引擎的工作原理是:由一個Robot盡可能多地收集WWW上的網頁,按照每個網頁的文本內容建立單詞到網頁的反向索引,用戶在查詢感興趣的主題時,輸入該主題的關鍵字作為查詢條件,搜索引擎利用事先建立好的網頁庫和單詞索引,檢索出符合條件的網頁返回給用戶。搜索引擎是一個為你提供信息“檢索”服務的網站,它使用某些程序把因特網上的所有信息歸類以幫助人們在茫茫網海中搜尋到所需要的信息。早期的搜索引擎是把因特網中的資源服務器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進行分類。人們要找自己想要的信息可按他們的分類一層層進入,就能最后到達目的地,找到自己想要的信息。這其實是最原始的方式,只適用于因特網信息并不多的時候。隨著因特網信息按幾何式增長,出現了真正意義上的搜索引擎,這些搜索引擎知道網站上每一頁的開始,隨后搜索因特網上的所有超級鏈接,把代表超級鏈接的所有詞匯放入一個數據庫。這就是現在搜索引擎的原型。搜索引擎的分類分為:目錄式搜索引擎,基于Robot的搜索引擎和Meta搜索引擎三種。在目前所存在的搜索引擎中,沒有一個搜索引擎能夠覆蓋所有的WWW資源,大部分的搜索引擎都只能涉及到整個資源的一小部分,并且各類搜索引擎的信息來源差異較大,因此集成多個搜索引擎而產生的Meta搜索引擎具有比傳統(tǒng)引擎覆蓋面大,搜索效果更好且具有可擴展性等優(yōu)點。它的缺點是有一定的局限性,不能夠充分使用所使用搜索引擎的功能。人工智能技術及其在搜索引擎中的應用研究Internet迅速的發(fā)展,使得網上的信息呈現指數級增長,Internet的問題已經從“提供信息”轉到“如何從浩如煙海的信息中提取對自己有用的信息資源”?,F有的搜索引擎存在著返回的無用信息太多、搜索效率低下、信息組織混亂等缺陷。起源于20世紀50年代的人工智能(AI)技術,可以在Internet中導引用戶,不僅在用戶進行搜索、瀏覽時給予直接的支持,而且能夠提供具有獨立搜索功能的智能體的幕后支持。因此人工智能已經在Internet中扮演越來越重要的角色。先看一下傳統(tǒng)搜索技術又有諸多局限。首先信息丟失,一般來說,目錄式的搜索引擎由于目錄只在對站點的描述中進行搜索,因此站點本身的動態(tài)變化不會反映到搜索結果中來,對網站的描述也十分簡略,其描述能力不能深入網站的內部細節(jié),因此用戶不能查詢網站內部的重要信息,造成了信息丟失。其次,返回信息太多?;跈C器人的搜索引擎由于應用了全文檢索技術,能夠解決對網頁細節(jié)的檢索問題。從理論上說,只要網頁上出現了某個關鍵詞,就能夠使用全文檢索用關鍵詞匹配把該網頁查出來,但是這又導致了它的缺陷——返回的信息太多。再次,信息無關。返回信息過多只是全文檢索給人直觀感覺到的問題。除此之外,它還有兩個不很直觀的深層次問題也給信息檢索帶來了不少困難。因此,很多情況下,用戶很難簡單地用關鍵詞或關鍵詞串來忠實地表達他所真正需要檢索的內容,表達困難導致檢索困難。造成上述信息檢索困難的原因的實質在于傳統(tǒng)的搜索引擎對要檢索的信息僅僅采用機械的關鍵詞匹配來實現,缺乏知識處理能力和理解能力,也就是說搜索引擎無法處理在用戶看來是非常普通的常識性知識,更不能處理隨用戶不同而變化的個性化知識、隨地域不同而變化的區(qū)域性知識以及隨領域不同而變化的專業(yè)性知識等等。因此,結合人工智能技術的智能搜索引擎把信息檢索從目前基于關鍵詞層面提高到基于知識(或概念)層面,是解決問題的根本和關鍵。智能代理技術智能代理又稱智能體,是人工智能研究的新成果,近幾年的發(fā)展非常迅速。它使用自動獲得的領域模型、用戶知識進行信息搜集、索引、過濾,并自動地將用戶感興趣的、對用戶有用的信息提交給用戶智能代理的特點是具有不斷學習、適應信息和適應用戶興趣動態(tài)變化的能力,從而能夠提供個性化的服務。智能代理的優(yōu)勢智能性:具有豐富的知識和一定的推理能力,能分析用戶的需求和揣測用戶的意圖,以便能完成較復雜的任務,而且它可以從經驗中不斷學習,以提高自己處理問題的能力。代理性:顧名思義智能代理是用戶的某種代理,它可以代替用戶完成一些任務,并主動將結果反饋給用戶。主動性:它能根據用戶的需求和環(huán)境的變化,主動向用戶報告并提供服務協(xié)作性:它能通過各種通信協(xié)議和其他智能代理進行信息交流,并可以相互協(xié)調共同完成復雜的任務。搜索引擎中的客戶端智能代理和服務器端智能代理客戶端智能代理技術以智能搜索代理技術為主,結合搜索引擎“面向主題”的檢索模式,在密切關注個體需求、提高信息與用戶需求相關系統(tǒng),彼此間可以通過統(tǒng)一的傳輸協(xié)議進行溝通,交換信息,從而使更多的信息得以挖掘,以彌補智能代理信息搜索范圍有限的缺陷。服務器端智能代理引入用戶反饋機制來完善檢索機制,提高檢索命中率,同時也可以提供面向個人的特殊檢索服務。這種方式是記錄該用戶的查詢蹤跡,從而在用戶再次登錄時結合以往的用戶檢索記錄來配合提供相關的檢索服務。并且可以通過對用戶的反饋意見進行跟蹤,獲取用戶對結果的評價,以便提高檢索質量。搜索引擎中查詢接口的智能化1.基于關鍵詞匹配搜索技術當用戶提出查詢請求時,用戶最關心的是搜索結果是否能夠滿足自己的需要。目前采取的一種常見的策略是將用戶的查詢請求分解成若干關鍵詞,根據這些關鍵詞計算Web文檔跟用戶請求的匹配程度,從而挑出若干匹配的文檔。匹配程度的衡量準則很多:一種是根據關鍵詞在文檔中出現的頻率確定它對用戶請求的匹配程度;另一種是計算關鍵詞出現次數和頁面總詞數之比。但是基于關鍵詞匹配的搜索技術有較大的局限性。它不能區(qū)分同形異義,也不能聯(lián)想到關鍵詞的同義詞。2?自然語言查詢?yōu)榱颂岣咚阉饕鎸τ脩舨樵冋埱蟮睦斫?,就必須有一個好的檢索提問語言,為了克服關鍵詞檢索和目錄查詢的缺點,應用自然語言理解技術進行自然語言智能答詢。它將信息檢索從目前基于關鍵詞層面提高到基于知識(或概念)層面,對知識有一定的理解與處理能力,能夠實現分詞技術、同義詞技術、概念搜索、短語識別以及機器翻譯技術等。因而具有信息服務的智能化、人性化特征。它允許用戶采用自然語言進行信息的檢索,為用戶提供更方便、更確切的搜索服務。與傳統(tǒng)的目錄查詢、關鍵詞查詢模式相比,自然語言查詢的優(yōu)勢體現在由于自然語言查詢具有智能分詞功能,因此使得查詢變得更為簡單、易于操作。采用知識(概念)檢索技術,明確和縮小了搜索范圍,減少了對無用信息的搜索。由于有綜合知識庫為背景,使得信息檢索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論