Internet搜索引擎概述摘要_第1頁(yè)
Internet搜索引擎概述摘要_第2頁(yè)
Internet搜索引擎概述摘要_第3頁(yè)
Internet搜索引擎概述摘要_第4頁(yè)
Internet搜索引擎概述摘要_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Internet搜索引擎概述摘要:對(duì)基于Internet的搜索引擎的含義及分類、基本構(gòu)成、工作原理及性能評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行了概述,并進(jìn)一步分析了利用搜索引擎檢索網(wǎng)絡(luò)信息的局限,對(duì)其未來的發(fā)展趨勢(shì)作了相應(yīng)的分析。關(guān)鍵詞:搜索引擎,網(wǎng)絡(luò)信息檢索,發(fā)展趨勢(shì)1搜索引擎的含義及其分類搜索引擎,即searchengine,這一詞在國(guó)內(nèi)外因特網(wǎng)領(lǐng)域中被廣泛的使用,然而。它的含義卻不盡相同。在美國(guó)。搜索引擎通常指的是基于因特網(wǎng)的搜索引擎,它們收集因特網(wǎng)上幾千萬到幾億個(gè)網(wǎng)頁(yè),并且每一個(gè)網(wǎng)頁(yè)上的每一個(gè)詞都被搜索引擎所收錄,也就是我們所說的全文檢索,典型的如Goog|e,In[oseek,HotBot。在中國(guó),搜索引擎通常指的是基于網(wǎng)站目錄的搜索服務(wù)或者是特定網(wǎng)站的搜索服務(wù),前者如搜狐、新浪等公司開發(fā)的網(wǎng)站搜索服務(wù),后者如Chinaren網(wǎng)站提供的全文檢索服務(wù)。而本文研究的搜索引擎是指一種基于Intemet的信息查詢工具,即一種基于Internet的信息查詢系統(tǒng),包括信息采集、信息標(biāo)引和信息檢索三個(gè)主要部分?,F(xiàn)有的搜索引擎基本上分為三類:singlesearchengine(獨(dú)立搜索引擎)它的特點(diǎn)是僅在搜索引擎自身的數(shù)據(jù)庫(kù)檢索信息,比如Yahoo。Metasearchengine(元搜索引擎)它在檢索信息時(shí)通過調(diào)用其它多個(gè)獨(dú)立的搜索引擎來完成檢索功能,并且能夠?qū)亩鄠€(gè)獨(dú)立搜索引擎查詢的結(jié)果進(jìn)行不同程度的處理,比如刪除重復(fù)結(jié)果、校驗(yàn)連接、結(jié)果按照相關(guān)度排序等。元搜索引擎本身可以有也可以沒有自己的數(shù)據(jù)庫(kù)。由于不同的元搜索引擎掛接的獨(dú)立搜索引擎各不相同,且各自獨(dú)立的搜索引擎在查詢語(yǔ)法上的差別較大,使得元搜索引擎本身僅支持AND、OR、NOT等簡(jiǎn)單的語(yǔ)法操作,返回的結(jié)果只能滿足“最低常用分母”,即不能提高搜索結(jié)果的準(zhǔn)確性。Netsearchengine(網(wǎng)絡(luò)搜索軟件)就是網(wǎng)絡(luò)用戶可以將相應(yīng)的搜索軟件下載至本地的計(jì)算機(jī)上,安裝查詢,這是一種具有網(wǎng)絡(luò)查詢功能的離線瀏覽器。相對(duì)于元搜索引擎,它可以靈活地控制輸出結(jié)果,其最大特點(diǎn)是方便用戶使用和能快速地查詢網(wǎng)絡(luò)相關(guān)資源。2網(wǎng)絡(luò)搜索引擎的工作原理及其基本構(gòu)成用戶檢索信息時(shí),搜索引擎是根據(jù)用戶的查詢要求,按照一定的算法從索引數(shù)據(jù)庫(kù)中查找對(duì)應(yīng)的信息返回給用戶。為了保證用戶查找信息的精度和新鮮度。對(duì)于獨(dú)立的搜索引擎而言.還需要建立并維護(hù)一個(gè)龐大的數(shù)據(jù)庫(kù)。獨(dú)立搜索引擎中的索引數(shù)據(jù)庫(kù)中的信息是通過一種叫做網(wǎng)絡(luò)蜘蛛(spider)的程序軟件定期在網(wǎng)上爬行,通過訪問公共網(wǎng)絡(luò)中公開區(qū)域的每一個(gè)站點(diǎn)采集網(wǎng)頁(yè),對(duì)網(wǎng)絡(luò)信息資源進(jìn)行收集,然后利用索引軟件對(duì)收集的信息進(jìn)行自動(dòng)標(biāo)引,創(chuàng)建一個(gè)可供用戶按照關(guān)鍵字等進(jìn)行查詢的web頁(yè)索引數(shù)據(jù)庫(kù),搜索軟件通過索引數(shù)據(jù)庫(kù)為用戶提供查詢服務(wù)。所以,一般的搜索引擎主要由網(wǎng)絡(luò)蜘蛛、索引和搜索軟件三部分組成.網(wǎng)絡(luò)蜘蛛。是一個(gè)功能很強(qiáng)的程序,它會(huì)定期根據(jù)預(yù)先設(shè)定的地址去查看對(duì)應(yīng)的網(wǎng)頁(yè),如網(wǎng)頁(yè)發(fā)生變化則重新獲取該網(wǎng)頁(yè),否則根據(jù)該網(wǎng)頁(yè)中的鏈接繼續(xù)去訪問。網(wǎng)絡(luò)蜘蛛訪問頁(yè)面的過程是對(duì)互連網(wǎng)上信息遍歷的過程。為了保證網(wǎng)絡(luò)蜘蛛遍歷信息的廣度,一般事先設(shè)定_些重要的鏈接,然后進(jìn)行遍歷。在遍歷的過程中不斷記錄網(wǎng)頁(yè)中的鏈接,不斷地遍歷下去,直到訪問完所有的鏈接。索引軟件。網(wǎng)絡(luò)蜘蛛將遍歷搜索集得到的網(wǎng)頁(yè)存放在數(shù)據(jù)庫(kù)中。為了提高檢索的效率,需要建立索引。索引一般為倒排檔索引。搜索軟件。該軟件用于篩選索引數(shù)據(jù)庫(kù)中無數(shù)的網(wǎng)頁(yè)信息,選擇出符合用戶檢索要求的網(wǎng)頁(yè)并對(duì)它們進(jìn)行分級(jí)排序。然后將分級(jí)排序后的結(jié)果顯示給用戶。3搜索引擎的主要性能評(píng)價(jià)指標(biāo)3.1搜索引擎建立索引的方法數(shù)據(jù)庫(kù)中的索引一般是按照倒排文檔的文件格式存放,在建立例排索引的時(shí)候,不同的搜索引擎有不同的選項(xiàng)。有些搜索引擎對(duì)于信息頁(yè)面建立全文索引;而有些只建立摘要部分,或者是段落前面部分的索引;還有些搜索引擎,比如Google建立索引的時(shí)候,同時(shí)還考慮超文本的不同標(biāo)記所表示的不同含義。如粗體、大字體顯示的東西往往比較重要;放在錨鏈中的信息往往是它所指向頁(yè)面的信息的概括,所以用它來作為所指向的頁(yè)面的重要信息。Google、infoseek還在建立索引的過程中收集頁(yè)面中的超鏈接。這些超鏈接反映了收集到的信息之間的空間結(jié)構(gòu),利用這些結(jié)果信息可以提高頁(yè)面相關(guān)度判別時(shí)的準(zhǔn)確度。由于索引不同,在檢索信息時(shí)產(chǎn)生的結(jié)果會(huì)不同。3.2搜索引擎的檢索功能搜索引擎所支持的檢索功能的多少及其實(shí)現(xiàn)的優(yōu)劣,直接決定了檢索效果的好壞,所以網(wǎng)絡(luò)檢索工具除了要支持諸如布爾檢索、鄰近檢索、截詞檢索、字段檢索等基本的檢索功能之外,更應(yīng)該根據(jù)網(wǎng)上信息資源的變化,及時(shí)地應(yīng)用新技術(shù)、新方法,提高高級(jí)檢索功能。另外,由于中文信息特有的編碼不統(tǒng)一問題,所以如果搜索引擎能夠?qū)崿F(xiàn)不同內(nèi)碼之間的自動(dòng)轉(zhuǎn)換,用戶就會(huì)全面檢索大陸、港臺(tái)乃至全世界的中文信息。這樣不但提高了搜索引擎的質(zhì)量,而且會(huì)得到用戶的支持。3.3搜索引擎的檢索效果檢索效果可以從響應(yīng)時(shí)間、查全率、查準(zhǔn)率和相關(guān)度方面來衡量。響應(yīng)時(shí)間是用戶輸入檢索式開始查詢到檢出結(jié)果的時(shí)間。查全率是指一次搜索結(jié)果中符合用戶要求的數(shù)目與和用戶查詢相關(guān)的總數(shù)之比;查準(zhǔn)率是指一次搜索結(jié)果集中符合用戶要求的數(shù)目與該次搜索結(jié)果總數(shù)之比;相似度是指用戶查詢與搜索結(jié)果之間相似度的一種度量。雖然由于無法估計(jì)網(wǎng)絡(luò)上與某個(gè)檢索提問相關(guān)的所有信息數(shù)量。所以目前尚沒有定量計(jì)算查全率的更好方法,但是它作為評(píng)價(jià)檢索效果的指標(biāo)還是值得保留。查準(zhǔn)率也是一個(gè)復(fù)雜的概念,一方面表示搜索引擎對(duì)搜索結(jié)果的排序,另一方面卻體現(xiàn)了搜索引擎對(duì)垃圾網(wǎng)頁(yè)的抗干擾能力。總之,一個(gè)好的搜索引輦應(yīng)該具有較快的響應(yīng)速度和高的查全率和查準(zhǔn)率,或者有極大的相似度。3.4搜索引擎的受歡迎程度搜索引擎的受歡迎程度體現(xiàn)了用戶對(duì)于搜索引擎的偏愛程度,知名度高、性能穩(wěn)定和搜索質(zhì)量好的搜索引擎很受用戶的青睞。搜索引擎的受歡迎程度也會(huì)隨著它的知名度和服務(wù)水平的變化而動(dòng)態(tài)的變化。搜索引擎的服務(wù)水平和它所收集的信息量、信息的新鮮度和查詢的精度相關(guān)。隨著各種新的搜索技術(shù)的出現(xiàn),智能化的、支持多媒體檢索的搜索引擎將越來越受用戶的歡迎。另外,搜索引擎的信息占有量也可以作為評(píng)價(jià)搜索引擎性能的指標(biāo)。綜上所述,評(píng)價(jià)搜索引擎的性能指標(biāo)可以概括為:a.建立索引的方法(全文索引,部分索引,按重要程度索引等);b.檢索功能(支持的檢索技術(shù),多媒體檢索,內(nèi)碼處理等);C.查詢效果(響應(yīng)時(shí)間,查全率,查準(zhǔn)率,相關(guān)度);d.受歡迎程度;e.信息占有量。4搜索引擎檢索信息的局限2001年Roper的調(diào)查指出,36%的互連網(wǎng)用戶一個(gè)星期花超過2個(gè)小時(shí)的時(shí)間在網(wǎng)上搜索;71%的用戶在使用搜索引擎時(shí)遇到過麻煩;平均搜索12分鐘以后發(fā)現(xiàn)搜索受挫。另一項(xiàng)由Keen所做的調(diào)查顯示,31%的人使用搜索引擎尋找答案,網(wǎng)上查找答案的半數(shù)以上都不成功。從這些調(diào)查數(shù)據(jù)中不難看出。目前的搜索引擎仍然存在不少的局限性。概括起來大致有以下幾個(gè)方面。1搜索引擎對(duì)信息的標(biāo)引深度不夠目前,搜索引擎檢索的結(jié)果往往只提供一些線形的網(wǎng)址和包括關(guān)鍵詞的網(wǎng)頁(yè)信息,與人們對(duì)它的預(yù)期存在較大的距離,或者返回過多的無用信息,或者信息丟失,特別是對(duì)特定的文獻(xiàn)數(shù)據(jù)庫(kù)的檢索顯得無能為力。2搜索引擎的信息量占有不足作為搜索引擎必須占有相當(dāng)大的信息量才能具有一定的查全率和實(shí)用性。目前還沒有一種覆蓋整個(gè)因特網(wǎng)信息資源的搜索引擎。3搜索引擎的查準(zhǔn)率不高分析起來,這是因?yàn)椋阂环矫嬗捎诰W(wǎng)上信息數(shù)量巨大、內(nèi)容龐大、良莠不齊,信息的質(zhì)量得不到保障;另一方面是由于大多數(shù)搜索引擎的索引工作由程序自動(dòng)完成,根據(jù)網(wǎng)頁(yè)中詞頻及詞的位置等因素確定關(guān)鍵詞,有的網(wǎng)站為了提高點(diǎn)擊率,將一些與網(wǎng)頁(yè)主題并不相關(guān)的熱門詞匯以隱含方式放在頁(yè)面上,并重復(fù)多次,從而造成查準(zhǔn)率低。4.4檢索功能單一,缺乏靈活性目前許多搜索引擎的查詢方法比較單一,一般只提供分類查詢方式和關(guān)鍵詞查詢方式。不能從文獻(xiàn)的多個(gè)方面對(duì)檢索提問進(jìn)行限制,只能就某一關(guān)鍵詞或者概念進(jìn)行籠統(tǒng)的檢索。4.5搜索引擎自身的技術(shù)局限像目前部分搜索引擎還不能支持對(duì)多媒體信息的檢索。造成上述信息檢索困難的原因?qū)嵸|(zhì)在于搜索引擎對(duì)要檢索的信息僅僅采用機(jī)械的詞語(yǔ)匹配來實(shí)現(xiàn),缺乏知識(shí)處理能力和理解能力。也就是說搜索引擎無法處理用戶看來是非常普通的常識(shí)性知識(shí),更不能處理隨用戶不同而變化的個(gè)性化知識(shí)、隨地域不同而變化的區(qū)域性知識(shí)以及隨領(lǐng)域不同而變化的專業(yè)性知識(shí)等等。5搜索引擎未來的發(fā)展趨勢(shì)新一代搜索引擎的發(fā)展目標(biāo)就是采用新興的搜索技術(shù)為用戶提供更方便易用、更精確的搜索工具來滿足用戶的信息查詢需要。技術(shù)上,應(yīng)該在自然語(yǔ)言理解技術(shù)上有所突破,以XML可擴(kuò)展標(biāo)記語(yǔ)言為主,并使用向?qū)Ъ夹g(shù)。下面就搜索引擎的發(fā)展趨勢(shì)談幾點(diǎn)看法。vstrong>答案補(bǔ)充</strong>5.1垂直化專業(yè)領(lǐng)域搜索由于社會(huì)分工的加大,用戶從事的職業(yè)有所不同,不同用戶對(duì)信息搜索也往往有自己的專業(yè)要求。由于綜合性的搜索引擎收錄各方面、各學(xué)科、各行業(yè)的信息,因而搜索不相關(guān)的信息太多,專業(yè)垂直引擎則可以解決這個(gè)問題,垂直類搜索引擎是只面向某一特定的領(lǐng)域,專注于自己的特長(zhǎng)和核心技術(shù),能夠保證對(duì)該領(lǐng)域信息的完全收錄與及時(shí)更新。因此,基于專業(yè)領(lǐng)域的“垂直搜索引擎”開始成為搜索引擎發(fā)展的一個(gè)新趨勢(shì)。5.2智能化搜索傳統(tǒng)的搜索引擎使用方法是被動(dòng)搜索,而準(zhǔn)確的搜索應(yīng)建立在對(duì)收錄信息和搜索請(qǐng)求的理解之上。顯然,基于自然語(yǔ)言理解技術(shù)的搜索引擎由于可以同用戶使用自然語(yǔ)言交談,并深刻理解用戶的搜索請(qǐng)求,則查詢的結(jié)果更加準(zhǔn)確。5.3關(guān)聯(lián)式的綜合搜索所謂關(guān)聯(lián)式綜合搜索,是這樣一種一站式的搜索服務(wù),它使得用戶在搜索時(shí)只需要輸入一次查詢目標(biāo),即可以在同一界面得到各種有關(guān)聯(lián)的查詢結(jié)果,這種服務(wù)的關(guān)鍵在于有一架構(gòu)在XML基礎(chǔ)上的整合資訊平臺(tái)。vstrong>答案補(bǔ)充v/strong>5.4個(gè)性化搜索提高搜索精確度的另一個(gè)途徑是提供個(gè)性化的搜索,也就是將搜索建立在個(gè)性化的搜索環(huán)境之下,其核心是跟蹤用戶的搜索行為,通過對(duì)用戶的不斷了解、分析,積累用戶的搜索個(gè)性化數(shù)據(jù)來提高用戶的搜索效率。5結(jié)構(gòu)化搜索所謂結(jié)構(gòu)化搜索,是指充分利用XML等技術(shù)使信息結(jié)構(gòu)化,同時(shí)使用查詢結(jié)構(gòu)化,從而使搜索的準(zhǔn)確度大大提高。6本土化的搜索世界上許多著名的搜索引擎都在美國(guó),它們以英語(yǔ)為基礎(chǔ),完全按他們的思維方式和觀點(diǎn)搜集和檢索資料,這對(duì)于全球不同國(guó)家的用戶來說是顯然不合適的。各國(guó)的文化傳統(tǒng)、思維方式和生活習(xí)慣不同,在對(duì)于網(wǎng)站的內(nèi)容的搜索要求上也就存在差異。搜索結(jié)果要符合當(dāng)?shù)赜脩舻囊螅阉饕婢捅仨毐就粱?多媒體搜索。隨著寬帶技術(shù)的發(fā)展,未來的互聯(lián)網(wǎng)是多媒體數(shù)據(jù)的時(shí)代,開發(fā)出可查詢圖像、聲音、圖片和電影的搜索引擎是一個(gè)新的方向,這也將極大地滿足用戶的需求。未來的搜索引擎應(yīng)該信息量更大、搜索速度更快、搜索精度更高和更能夠滿足用戶的信息查詢需求。vstrong>答案補(bǔ)充v/strong>參考文獻(xiàn)1張衛(wèi)豐.徐保文等.Web搜索引擎綜述.計(jì)算機(jī)科學(xué),2001;(9)2王忠?周士渡.Internet英文搜索引擎評(píng)析.情報(bào)學(xué)報(bào),1999;(5)張軍.搜索引擎的功能及其局限性探討.情報(bào)科學(xué),2001;(5)張莉揚(yáng).網(wǎng)絡(luò)檢索工具性能評(píng)價(jià)標(biāo)準(zhǔn)淺議.情報(bào)科學(xué),2001網(wǎng)絡(luò)搜索引擎21世紀(jì)是信息時(shí)代,隨著信息科學(xué)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)已成為人們生活中的重要組成部分,網(wǎng)上信息呈幾何級(jí)數(shù)增長(zhǎng),面對(duì)眾多繁雜無序的信息,如何能快速、準(zhǔn)確、經(jīng)濟(jì)地查找到所需要的信息,成為人們迫切需要解決的問題。搜索引擎是為滿足人們對(duì)網(wǎng)絡(luò)信息的搜索需求而新興的一種網(wǎng)絡(luò)工具,它利用網(wǎng)絡(luò)自動(dòng)搜索功能,對(duì)各種信息資源分門別類地進(jìn)行標(biāo)引、建庫(kù),并對(duì)信息進(jìn)行理解、提取、組織和處理,從而起到信息導(dǎo)航的作用,幫助人們從不同形式的數(shù)字化信息中進(jìn)行搜索。搜索引擎起源于傳統(tǒng)的信息全文檢索理論。狹義上的搜索引擎僅指基于因特網(wǎng)的搜索引擎;廣義上的搜索引擎除此之外還包括基于目錄的信息檢索服務(wù)。搜索引擎的研究極具綜合性和挑戰(zhàn)性,它涉及到信息檢索、人工智能、計(jì)算機(jī)網(wǎng)絡(luò)、分布式處理、數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、數(shù)字圖書館、自然語(yǔ)言處理等多領(lǐng)域的關(guān)鍵理論和技術(shù),其核心問題是數(shù)據(jù)庫(kù)的規(guī)模、索引數(shù)據(jù)庫(kù)的質(zhì)量和標(biāo)引質(zhì)量。搜索引擎的工作原理及分類搜索引擎由搜索器、索引器、檢索器和用戶接口四部分。它利用一個(gè)名為“蜘蛛”的機(jī)器人程序以一定的策略自動(dòng)進(jìn)行信息搜索,然后由索引器對(duì)信息進(jìn)行理解、處理,從中抽取索引項(xiàng),建立索引庫(kù),再由檢索器根據(jù)用戶的查詢?cè)谒饕龓?kù)中快速檢索文檔,進(jìn)行相關(guān)度評(píng)價(jià),將要輸出的結(jié)果排序,并按用戶的查詢需求合理反饋信息,由用戶接口來接納用戶查詢,顯示查詢結(jié)果,提供個(gè)性化查詢項(xiàng)。按照信息搜集的方法和服務(wù)提供方式的不同,搜索引擎可以分為:全文搜索引擎全文搜索引擎是從各個(gè)網(wǎng)站提取信息,建立數(shù)據(jù)庫(kù),檢索與用戶查詢條件相匹配的記錄后,按照一定的排列順序返回結(jié)果,是名副其實(shí)的搜索引擎。全文搜索引擎的自動(dòng)信息搜集功能分2種:一種是定期搜索,即每隔一段時(shí)間,搜索引擎主動(dòng)派出“蜘蛛”程序,對(duì)一定IP地址范圍的互聯(lián)網(wǎng)站進(jìn)行檢索,一旦發(fā)現(xiàn)新的網(wǎng)站,它會(huì)自動(dòng)提取網(wǎng)站的信息和網(wǎng)址加入自己的數(shù)據(jù)庫(kù);另一種是提交網(wǎng)站搜索,即網(wǎng)站擁有者主動(dòng)向搜索引擎提交網(wǎng)址,它在一定時(shí)間內(nèi)(2天到數(shù)月不等)定向向你的網(wǎng)站派出“蜘蛛”程序。全文搜索引擎中最具代表性的有國(guó)外著名的Google及國(guó)內(nèi)的百度搜索。2.目錄索引目錄索引是一種人工方式或半自動(dòng)方式的搜索引擎,由編輯人員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。由于目錄索引只是一個(gè)按目錄分類的網(wǎng)站鏈接列表,因此不能稱為嚴(yán)格意義上的搜索引擎。由于目錄索引中加入了人的智能,所以導(dǎo)航質(zhì)量高,信息更準(zhǔn)確,但也正因?yàn)槿绱?使得維護(hù)費(fèi)用偏大,信息更新不及時(shí)。目錄索引中最具代表性的為yahoo、新浪。3.元搜索引擎元搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果處理后,作為自己的結(jié)果返回給用戶。元搜索引擎返回結(jié)果的信息量更大、更全,但是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。元搜索引擎的代表是WebCrawler、infomarket等。搜索引擎的發(fā)展現(xiàn)狀及技術(shù)展望目前,搜索引擎一般提供的是關(guān)鍵詞的全文檢索和分類瀏覽的查詢方式,檢索方式單一。分類目錄瀏覽常常檢索到很多無關(guān)的信息,查全率、查準(zhǔn)率不高;關(guān)鍵詞檢索僅僅是機(jī)械的詞語(yǔ)匹配,缺乏知識(shí)處理能力和理解能力,信息檢索質(zhì)量不高。此外,數(shù)據(jù)庫(kù)檢索功能和應(yīng)用上的局限性、排序技術(shù)指標(biāo)單一、分類目標(biāo)體系缺乏規(guī)范、信息加工深度不夠,這些都嚴(yán)重影響著搜索引擎的發(fā)展。因此,必須增加檢索途徑,加強(qiáng)網(wǎng)絡(luò)信息資源的科學(xué)標(biāo)引和組織,推動(dòng)網(wǎng)絡(luò)資源標(biāo)準(zhǔn)化進(jìn)程,積極推進(jìn)搜索引擎的發(fā)展。1.精確搜索技術(shù)采用基于自然語(yǔ)言理解技術(shù)的智能化搜索引擎,加深理解用戶搜索請(qǐng)求;通過對(duì)用戶的不斷了解、分析,提供個(gè)性化搜索;利用XML等技術(shù)使信息結(jié)構(gòu)化,查詢結(jié)構(gòu)化,提高檢索的速度和性能;針對(duì)某一行業(yè),某一主題和某一地區(qū)的信息而建立專業(yè)化搜索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論