網(wǎng)絡(luò)信息檢索工具的比較研究.doc_第1頁(yè)
網(wǎng)絡(luò)信息檢索工具的比較研究.doc_第2頁(yè)
網(wǎng)絡(luò)信息檢索工具的比較研究.doc_第3頁(yè)
網(wǎng)絡(luò)信息檢索工具的比較研究.doc_第4頁(yè)
網(wǎng)絡(luò)信息檢索工具的比較研究.doc_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)絡(luò)信息檢索工具的比較研究摘要隨著Internet的迅速發(fā)展,網(wǎng)絡(luò)上的信息越來(lái)越多,但由于這些信息缺乏合理有效的組織,使得許多用戶面對(duì)浩瀚的信息顯得手足無(wú)措,無(wú)法準(zhǔn)確地獲取自己所需要的信息。針對(duì)這種情況有些組織和個(gè)人開發(fā)出多種用以查找網(wǎng)絡(luò)信息的檢索工具.對(duì)目前廣為使用的網(wǎng)絡(luò)信息檢索工具進(jìn)行功能比較,選擇其綜合性的網(wǎng)絡(luò)信息檢索工具。以便用戶能夠更快捷地找到所需信息。關(guān)鍵詞:檢索工具,搜索引擎,Google,百度NETWORK INFORMATION RETRIEVAL TOOLS FOR COMPARATIVE STUDAY ENGLISH AbstractAlong with Internet rapidly expand, In the network information are getting more and more But because these information lack the reasonable effective organization Causes many users appears helpless facing the vast information Is unable information which gains itself to need accurately Somewhat organizes in view of this kind of situation and develops personally many kinds of uses to search the network information the retrieval tool the current widely used by the network information retrieval search engine tools are compared functionally through comparing to found the respective merits and demerits users can more quickly find the information needed.Key words: Tool Of Retrieves, Search Engine, Google,Baidu目 錄摘要 IAbstractII緒論一網(wǎng)絡(luò)信息檢索工具概述 1(一)網(wǎng)絡(luò)信息檢索工具的概念1(二)網(wǎng)絡(luò)信息檢索工具的特點(diǎn) 2二 網(wǎng)絡(luò)信息檢索工具的分類.3(一)檢索型網(wǎng)絡(luò)信息檢索工具(二)目錄型檢索工具.(三) 元搜索引擎. .三、網(wǎng)絡(luò)信息檢索工具的比較6(一)檢索型網(wǎng)絡(luò)信息檢索工具與目錄型檢索工具的比較.6(二)目錄型網(wǎng)絡(luò)信息檢索工具與元搜索引擎的比較7(三)元搜索引擎檢索工具 .7結(jié)束語(yǔ)8參考文獻(xiàn)8謝辭8緒論隨著Internet的迅速發(fā)展,網(wǎng)絡(luò)上的信息越來(lái)越多,但由于這些信息缺乏合理有效的組織,使得許多用戶面對(duì)浩瀚的信息顯得手足無(wú)措,無(wú)法準(zhǔn)確地獲取自己所需要的信息。針對(duì)這種情況有些組織和個(gè)人開發(fā)出多種用以查找網(wǎng)絡(luò)信息的檢索工具。對(duì)目前廣為使用的網(wǎng)絡(luò)信息檢索工具進(jìn)行功能比較,通過(guò)比較找到各自的優(yōu)點(diǎn)和缺點(diǎn),以便用戶能夠快捷找到所需信息。了解網(wǎng)絡(luò)信息檢索工具,熟悉其功能,將大大提高我們的檢索效率。網(wǎng)絡(luò)檢索系統(tǒng)擁有全世界數(shù)量眾多的用戶,吸引了大量的廣告,為電子信息的增值服務(wù)提供了廣闊的空間。網(wǎng)絡(luò)檢索系統(tǒng)已成為新的投資熱點(diǎn)。網(wǎng)絡(luò)檢索系統(tǒng)不再僅僅是一種檢索工具,而且成為一項(xiàng)產(chǎn)業(yè),它的商業(yè)利益成為推動(dòng)系統(tǒng)完善和擴(kuò)展的主要?jiǎng)恿ΓW(wǎng)絡(luò)信息的檢索與利用由公用性轉(zhuǎn)向商業(yè)化。美國(guó)著名的數(shù)字媒體評(píng)估公司Jupiter Media Metrix日前發(fā)布研究報(bào)告稱,“搜索引擎公司推出的付費(fèi)添加服務(wù)是一個(gè)正在興起的、前景光明的因特網(wǎng)領(lǐng)域,相對(duì)于目前低迷的在線廣告市場(chǎng)來(lái)說(shuō),它的發(fā)展?jié)摿κ欠浅>薮蟮摹!本W(wǎng)絡(luò)信息檢索工具是信息檢索效率的關(guān)鍵因素。傳統(tǒng)的檢索工具已不能適合新的網(wǎng)絡(luò)和信息發(fā)展的需要。目前開發(fā)的能在廣域網(wǎng)環(huán)境下運(yùn)行的信息檢索工具,對(duì)于網(wǎng)絡(luò)的檢索者來(lái)說(shuō),最重要的是熟悉這些工具的性能,并且運(yùn)用有效的檢索策略,只有這樣才能避免淹沒(méi)在大量的無(wú)關(guān)信息中。一、網(wǎng)絡(luò)信息檢索工具概述(一)網(wǎng)絡(luò)信息檢索工具的概念隨著Internet的迅速發(fā)展,網(wǎng)絡(luò)上的信息越來(lái)越多,但由于這些信息缺乏合理有效的組織,使得許多用戶面對(duì)浩瀚的信息顯得手足無(wú)措,無(wú)法準(zhǔn)確地獲取自己所需要的信息。針對(duì)這種情況有些組織和個(gè)人開發(fā)出多種用以查找網(wǎng)絡(luò)信息的檢索工具。早期的Internet檢索工具有針對(duì)FTP資源的Archive,針對(duì)Gopher資源的Veronica和Jughead,以及針對(duì)整個(gè)Internet網(wǎng)上文本信息資源的WAIS等。隨著WWW的發(fā)展,針對(duì)WWW資源的各種檢索工具已成為網(wǎng)絡(luò)檢索工具中的主流,它們有Yahoo、AltaVista、Excite、HotBot、Lycos、OpenText、WebCrawler和MetaCrawler等.這些檢索工具大多是由非圖書館專業(yè)技術(shù)人員設(shè)計(jì)的,由于缺乏統(tǒng)一的網(wǎng)頁(yè)描述標(biāo)準(zhǔn),所以在各自對(duì)自己的數(shù)據(jù)庫(kù)進(jìn)行檢索時(shí)的方法各不相同,各有自身的優(yōu)缺點(diǎn)。本文選擇了其中六種檢索工具,它們分別是Lycos、Alta Vista、Excite、Open Text、Yahoo和Magellan,分析了它們?cè)谛畔⑹占椒ā⑺饕秶c檢索方法和檢索結(jié)果格式三個(gè)方面的異同,并在此基礎(chǔ)上,從圖書館員的角度出發(fā),對(duì)未來(lái)網(wǎng)絡(luò)檢索工具的改進(jìn)進(jìn)行了探討。(二)網(wǎng)絡(luò)信息檢索工具的特點(diǎn)1 交互式作業(yè)方式 所有的網(wǎng)絡(luò)信息檢索工具都具有交互式作業(yè)的特點(diǎn),因此具有良好的信息反饋功能和瞬間反應(yīng)功能。這兩個(gè)指標(biāo)在傳輸信息檢索系統(tǒng)性能的最重要指標(biāo),在網(wǎng)絡(luò)環(huán)境下也具有同樣的意義。2 用戶透明度網(wǎng)絡(luò)信息檢索對(duì)用戶屏蔽了網(wǎng)絡(luò)的各種物理差異,使用戶在使用這些服務(wù)時(shí)感受到明顯的系統(tǒng)透明度。這里所指的物理差異包括主機(jī)的硬件平臺(tái)、操作系統(tǒng)等軟件上的差異、客戶程序和服務(wù)程序版本上的差異、主機(jī)的地理位置、信息的存儲(chǔ)方式甚至通信協(xié)議的差別(如WWW客戶程序可以通過(guò)多種協(xié)議使用各種不同的信息資源)等。這一特點(diǎn)對(duì)網(wǎng)絡(luò)環(huán)境下的信息檢索來(lái)說(shuō)是十分關(guān)鍵的。3 信息檢索空間的拓寬信息檢索空間是衡量信息檢索工具的重要指標(biāo)之一。網(wǎng)絡(luò)信息檢索在這方面具有傳統(tǒng)信息檢索和Internet基本信息服務(wù)所不具備的優(yōu)勢(shì)。以FTP為例,盡管使用FTP可以檢索所有的FTP服務(wù)器,但是用戶必須預(yù)先知道這些服務(wù)器所在的主機(jī)地址,而且在某一時(shí)刻只能使用一個(gè)FTP服務(wù)器。網(wǎng)絡(luò)信息檢索工具的工作方式則與此不同,它們可以同時(shí)使用多個(gè)主機(jī)甚至是所有主機(jī)的某種資源而且用戶不必知道它們的具體地址。這一特點(diǎn)為用戶帶來(lái)的好處上顯而易見(jiàn)的。4 友好的用戶界面與Internet的三大基本信息服務(wù)相比,網(wǎng)絡(luò)信息檢索系統(tǒng)的用戶界面要友好得多,特別是一些商業(yè)化軟件(如Internet Explorer和Netscape Navigator)。即使是Internet上的一些免費(fèi)軟件(如MS Windows和Unix下的各種服務(wù)程序和客戶程序)也設(shè)計(jì)得相當(dāng)不錯(cuò)。對(duì)于有一定微機(jī)使用經(jīng)驗(yàn)的人來(lái)說(shuō),學(xué)會(huì)使用這些軟件是輕而易舉的事情。Internet的普及在很大程度上是得益于這些設(shè)計(jì)精良的軟件。詳細(xì)描述文獻(xiàn)的內(nèi)容特征,外表特征;每條文獻(xiàn)記錄必須有檢索標(biāo)識(shí);文獻(xiàn)條目按一定順序形成一個(gè)有機(jī)整體;能夠提供多種檢索途徑。二 網(wǎng)絡(luò)信息檢索工具的分類(一)檢索型網(wǎng)絡(luò)信息檢索工具在這里我們要向網(wǎng)絡(luò)用戶提供一些世界上有名的網(wǎng)絡(luò)搜索引擎。這些專業(yè)搜索引擎要比國(guó)內(nèi)中文網(wǎng)站的搜索引擎起步早,更加完善。起初上網(wǎng),我主要是利用百度、谷歌等的搜索引擎,但隨著對(duì)搜索引擎理解的深入,便發(fā)現(xiàn)我們自己的搜索引擎還有許多的問(wèn)題。比如說(shuō)百度網(wǎng),其搜索引擎不夠精確,有時(shí)也不完全按照用戶的設(shè)定條件來(lái)完成搜索任務(wù),形成了許多資源垃圾,為查閱增添了許多麻煩。國(guó)內(nèi)其它搜索引擎也存在著這樣的問(wèn)題,這說(shuō)明我們的網(wǎng)上引擎服務(wù)正處在發(fā)展階段,還不夠完善。一些外國(guó)著名的搜索引擎服務(wù)公司看準(zhǔn)了中國(guó)網(wǎng)絡(luò)市場(chǎng)這種缺陷,及時(shí)地打入中國(guó)的市場(chǎng)。目前,幾個(gè)著名的國(guó)際搜索引擎公司都有中文檢索搜尋功能,這極大地方便了我們獲取重要資料。這些有名的搜索引擎公司服務(wù)質(zhì)量好、服務(wù)完善、精確匹配高,大大提高了文獻(xiàn)提取的效率。更為重要的是,我們要獲得國(guó)際上的資源,就更離不開它們了。前些日子,我和一位美國(guó)史學(xué)專家探討如何搜索到有用的中外資料時(shí),他毫不猶豫地向我提供了GOOGLE搜索引擎。我打開一看,這真是一個(gè)方便、快捷而又個(gè)人化的搜索引擎。它的搜索功能和結(jié)果列表篩選是國(guó)內(nèi)網(wǎng)站無(wú)法比擬的。因此,我建議大家在以后進(jìn)行搜索時(shí),應(yīng)該使中外的搜索引擎兼顧使用,這樣才能達(dá)到預(yù)想的效果。 檢索型搜索引擎是提供給用戶輸入檢索式代替用戶在互聯(lián)網(wǎng)上進(jìn)行網(wǎng)絡(luò)搜索查詢的工具。了解搜索引擎的基礎(chǔ)知識(shí)與使用技巧,可以大大提高搜索信息的效率。目前世界上最大的搜索引擎是Google、MSN和雅虎,MSN主要是美國(guó)商業(yè)目錄搜索引擎,主要為用戶提供教育、新聞、媒體及娛樂(lè)信息。中文綜合性搜索引擎有:百度、Google、中國(guó)搜索聯(lián)盟、新浪、搜狐、網(wǎng)易、雅虎、TOM、3721等,其中百度是目前最具影響力的中文搜索引擎。綜合性搜索引擎針對(duì)任何用戶,收錄各個(gè)方面、各個(gè)學(xué)科、各個(gè)行業(yè)的信息,包括不同媒體的、正式與非正式出版的、社會(huì)科學(xué)的和自然科學(xué)的、生活性的和娛樂(lè)性的、系統(tǒng)的和零散的信息,用起來(lái)非常方便,但其所涵蓋信息的內(nèi)容比較寬泛,檢準(zhǔn)率不高,一搜就是幾千甚至上萬(wàn)條記錄,必須對(duì)這些記錄進(jìn)行二次檢索,才能滿足一般用戶的瀏覽性檢索需要。專業(yè)性搜索引擎則不同,可以就某一專業(yè)進(jìn)行專門檢索,其檢準(zhǔn)率比較高,如專門用于搜索新聞的Deja News、搜索中國(guó)企業(yè)定制產(chǎn)品的中國(guó)制造網(wǎng),搜索全球企業(yè)站點(diǎn)的陽(yáng)光之路國(guó)際商務(wù)網(wǎng),搜索中國(guó)建筑的中國(guó)砌體等等。 公認(rèn)較好的搜索引擎有: 中文搜索引擎:網(wǎng)易、搜狐、網(wǎng)絡(luò)指南針、亞洲搜索、若比鄰、中文雅虎; 英文搜索引擎: YAHOO、EXCITE、INFOSEEK GUIDE、LYCOS。(二)目錄型檢索工具 目錄式搜索引擎是以人工或半人工方式收集信息,建立數(shù)據(jù)庫(kù),由編輯人員在訪問(wèn)了某個(gè)web站點(diǎn)后,對(duì)該站點(diǎn)進(jìn)行描述,并根據(jù)站點(diǎn)的內(nèi)容和性質(zhì)將其歸為一個(gè)預(yù)先分好的類別。由于目錄式搜索引擎的信息分類和信息搜集有人的參與,其搜索的準(zhǔn)確度較高,導(dǎo)航質(zhì)量也不錯(cuò)。但因其人工的介入,維護(hù)量大,信息量少,信息更新不及時(shí)都使得人們利用它的程度有限。國(guó)內(nèi)著名的新浪、搜狐、中文雅虎都屬于這種類型。一個(gè)網(wǎng)絡(luò)目錄包括許多層,最高層(一級(jí))目錄頁(yè)總是將因特網(wǎng)資源分成最大范圍、最普通的主題范疇。這些主題范疇一般有1020個(gè),主題鏈接到第二層目錄(另一個(gè)頁(yè)面),然后在第二層目錄再分出子目錄,一般到第四級(jí)。逐層點(diǎn)擊,它將會(huì)羅列出一層層的目錄清單,所有的選擇只用鼠標(biāo)點(diǎn)擊鏈接來(lái)實(shí)現(xiàn)。網(wǎng)絡(luò)資源數(shù)不勝數(shù),任何分類目錄都不可能包羅所有的網(wǎng)頁(yè),多數(shù)網(wǎng)絡(luò)目錄都包括下列典型的一級(jí)類目,如商業(yè)貿(mào)易(business and commercial)、計(jì)算機(jī)和網(wǎng)絡(luò)(computer and Internet)、時(shí)事(current events)、娛樂(lè)和休閑(entertainment and recreation)、體育(sports)等等,遇到交叉的主題,網(wǎng)絡(luò)目錄會(huì)在相關(guān)的類目下顯示不同的路徑。(三)元搜索引擎檢索工具元搜索引擎是一種調(diào)用其他搜索引擎的引擎。它是通過(guò)一個(gè)統(tǒng)一的用戶界面,幫助用戶在多個(gè)搜索引擎中選擇和利用合適的搜索引擎來(lái)實(shí)現(xiàn)檢索。中文元搜索引擎開發(fā)較少,較成熟的則更少,萬(wàn)緯搜索是目前有一定影響的中文元搜索引擎。 元搜索引擎彌補(bǔ)了獨(dú)立搜索引擎不全的特點(diǎn),提高了檢索的全面性?,F(xiàn)開發(fā)出的中文元搜索引擎的數(shù)目很少,還有諸多缺陷,需在各方面進(jìn)一步改進(jìn)。 元搜索引擎要對(duì)各獨(dú)立的信息特色進(jìn)行較細(xì)致的調(diào)查,以確定自己要收錄的范圍;在對(duì)目標(biāo)搜索引擎的組織中突出獨(dú)立搜索引擎的檢索特色,并設(shè)計(jì)各搜索引擎之間的檢索方式的轉(zhuǎn)換算法,提高用戶檢索行為的針對(duì)性;建立更為靈活的,面向用戶的信息檢索服務(wù)。檢索界面要統(tǒng)一和友好,檢索方法的設(shè)置要提供給用戶更多的自由空間,使用戶可以按照自己的意愿合理的組織檢索式;在檢索結(jié)果的顯示中要開發(fā)出一個(gè)有效的檢索結(jié)果去重、選擇、排序和優(yōu)化算法,這是中文搜索引擎開發(fā)中的一個(gè)重點(diǎn)和難點(diǎn)。 三 網(wǎng)絡(luò)信息檢索工具比較(一)檢索型網(wǎng)絡(luò)信息檢索工具與目錄型檢索工具的比較 檢索型檢索工具通過(guò)用戶直接輸入檢索詞,查找索引數(shù)據(jù)庫(kù)中用檢索詞標(biāo)引的索引記錄來(lái)查找用戶所需要信息資源,檢索方便直接,而且可以使用布爾邏輯,短語(yǔ)或鄰近等基本檢索和模糊,自然語(yǔ)言,概念等高級(jí)檢索方式。可以限定檢索對(duì)象的地區(qū),網(wǎng)絡(luò)范圍,數(shù)據(jù)類型,時(shí)間等,可以滿足特定條件的資源準(zhǔn)確定位。以信息查詢、檢索為主,不太重視信息的整理,收錄的網(wǎng)站和網(wǎng)頁(yè)數(shù)量大,分類目錄為輔。用戶查找信息的時(shí)候比較麻煩,要先打開網(wǎng)頁(yè)還要輸入關(guān)鍵字才能查出自己想要的信息。浪費(fèi)時(shí)間,但它的優(yōu)點(diǎn)就是對(duì)某一問(wèn)題分析的很透徹,輸關(guān)鍵字會(huì)有很多相關(guān)的文獻(xiàn)和信息,提供用戶查找和使用。而目錄型檢索工具支持多種語(yǔ)言,對(duì)包含關(guān)鍵詞的熱門搜索在最上方,其他的排序多采用相關(guān)性的排序,相關(guān)度很高。比如我們國(guó)家的百度。百度圖書搜索正式上線,其數(shù)據(jù)來(lái)源于圖書館(如北大圖書館、中科院圖書館、中山圖書館)、電子書數(shù)據(jù)庫(kù)(超星、方正等)和網(wǎng)上書店(如卓越、蔚藍(lán)等),所以數(shù)據(jù)量比GOOGLE大。由于GOOGLE容全文或部分預(yù)覽,考慮到圖書版權(quán)的問(wèn)題,因此走的是出版商路線;而百度的目的是放在圖書書目數(shù)據(jù)上,而不提供圖書內(nèi)容,因此在搜索結(jié)果數(shù)量大大超出GOOGLE搜索可以作為一個(gè)較好的導(dǎo)購(gòu)平臺(tái),但是在信息的整合(如加入圖書館藏書信息),仍有所欠缺。這方面,GOOGLE的較好,不僅學(xué)術(shù)搜索進(jìn)行了很好的整合,而且還開展了圖書館鏈接計(jì)劃,讓所有的圖書館網(wǎng)上數(shù)據(jù)庫(kù)都可以加入到其中。目前,百度圖書搜索雖然僅限于書目搜索,但內(nèi)容或者說(shuō)全文掃描作為搜索引擎公司安身立命并確立壟斷性話語(yǔ)權(quán)的關(guān)鍵,必然會(huì)成為百度的下一個(gè)戰(zhàn)略目標(biāo)。Google也是一個(gè)相對(duì)比較簡(jiǎn)單的搜索引擎,但結(jié)果處理也有獨(dú)到之處。Google經(jīng)過(guò)幾年的發(fā)展,現(xiàn)在已經(jīng)成為登錄用戶較多、服務(wù)比較完備、比較簡(jiǎn)潔實(shí)用的一個(gè)搜索引擎,我現(xiàn)在就一直用它。還有Google公司在2004年10月、11月分別推出了的“Google Scholar”和“Google Print”項(xiàng)目?!癎oogle Scholar”項(xiàng)目主要是收集各學(xué)科領(lǐng)域內(nèi)的連續(xù)出版物、預(yù)訂本、論文和專題報(bào)告等內(nèi)容。“google print主要是用于提供與出版商的鏈接。2004年12月又推出的“Google Library”則主要側(cè)重于將一些大型圖書館的館藏進(jìn)行數(shù)字化后納人到其檢索引擎中,方便讀者通過(guò)互聯(lián)網(wǎng)使用。這3個(gè)項(xiàng)目都繼承了Google檢索引擎一貫的頁(yè)面風(fēng)格,可以方便快捷地為檢索者提供所需的相關(guān)鏈接。“Google Library”項(xiàng)目的一期計(jì)劃主要是與哈佛大學(xué)圖書館、牛津大學(xué)圖書館、斯坦福大學(xué)圖書館、密歇根大學(xué)圖書館以及紐約公共圖書館這5家頂級(jí)研究性圖書館合作并簽署協(xié)議,由圖書館提供其豐富的館藏,而Google負(fù)責(zé)提供經(jīng)費(fèi)與技術(shù),將這些館的館藏掃描成電子版并鏈接到它的檢索引擎中。在www檢索工具當(dāng)中,檢索型檢索工具的索引數(shù)據(jù)庫(kù)比分類檢索工具的索引數(shù)據(jù)庫(kù)要大點(diǎn)多,在檢索效果方面,檢索型檢索工具占很大的優(yōu)勢(shì),如果二者配合使用效果會(huì)更好。在檢索中高級(jí)檢索方式的應(yīng)用有可能降低檢索效果,中文Yahoo覆蓋的中文信息量較大,查準(zhǔn)率也比Cseek(英文檢索工具)高,網(wǎng)上中文信息資源太貧乏,現(xiàn)有的信息當(dāng)中有學(xué)術(shù)價(jià)值的不多,網(wǎng)絡(luò)信息檢索工具還存在著許多不足,尤其是中文檢索工具還有待提高。(二)目錄型檢索工具與元搜索引擎的比較目錄型檢索工具通過(guò)用戶瀏覽層次型類別目錄來(lái)尋找符合需要的信息資源,目錄按一定的主題分類體系組織,并輔之以年代,地區(qū)等分類。用戶一般采取逐層瀏覽目錄,逐步細(xì)化來(lái)尋找合適的類別直至具體資源。常用的目錄型檢索工具有新浪,雅虎,搜狐等檢索工具。目錄式檢索工具給用戶的感覺(jué)就是清晰,打開網(wǎng)站各個(gè)方面的信息和知識(shí)都有,比檢索型工具更醒目。但也有它的不足。給出的各個(gè)信息不夠全面,沒(méi)有檢索型工具全面,透徹,解釋的清楚。以分類目錄導(dǎo)航為主,搜索引擎相輔或并重,類目精致且相對(duì)較深,收錄網(wǎng)站和網(wǎng)頁(yè)往往經(jīng)過(guò)人工選擇,數(shù)量相對(duì)較少,質(zhì)量相對(duì)較高。目錄型檢索工具與之元搜索引擎比較差別很大,元引擎是一種起檢索中介作用的搜索引擎 它是網(wǎng)絡(luò)開發(fā)者將網(wǎng)絡(luò)資源收集后,以某種分類法進(jìn)行組織整理并和檢索集成法在一起的信息查詢方式,網(wǎng)絡(luò)資源目錄一般采用人工采集和存儲(chǔ)網(wǎng)絡(luò)信息,它通常按照網(wǎng)絡(luò)資源的主體性質(zhì)進(jìn)行分類。以某種分類體系為依據(jù)將信息資源分為若干領(lǐng)域的主體范疇,然后再細(xì)分為各學(xué)科專題目錄,形成一個(gè)有信息鏈組成的樹狀結(jié)構(gòu)。網(wǎng)絡(luò)目錄的分類往往采用主題分類法,學(xué)科分類法,體系分類法,在這一切劃分基礎(chǔ)上,一個(gè)目錄包括許多層最高層將網(wǎng)絡(luò)資源分為若干范圍大,普通的主題。新浪網(wǎng)是面向全球華人的網(wǎng)上資源查詢系統(tǒng),所收資源十分豐富,分類規(guī)范,細(xì)致。該目錄原分階段16大類,一萬(wàn)多個(gè)細(xì)目和20余萬(wàn)個(gè)網(wǎng)站。分類檢索是按照首頁(yè)的樹型分類主題逐層點(diǎn)擊來(lái)查找所需信息的。 網(wǎng)易提供多種語(yǔ)言檢索。其分類目錄是一種開放式管理目錄,業(yè)余編輯多。(三)元搜索引擎檢索工具 元引擎是一種起檢索中介作用的搜索引擎。多元引擎本身沒(méi)有存放網(wǎng)頁(yè)信息的數(shù)據(jù)庫(kù)。當(dāng)用戶查詢一個(gè)關(guān)鍵詞時(shí),它把查詢請(qǐng)求轉(zhuǎn)換成其他數(shù)個(gè)搜索引擎能夠接受的命令格式,并行地或者有選擇性地訪問(wèn)這些搜索引擎并查詢這個(gè)關(guān)鍵詞,處理這些搜索引擎返回的結(jié)果,然后再返回給用戶??梢源嫒∈澜绺鞯氐某襟w文件,內(nèi)容包括文字、圖形、聲音、動(dòng)畫、資料庫(kù)、以及各式各樣的軟件。 多元搜索引擎是將多個(gè)搜索引擎集成在一起,并提供一個(gè)統(tǒng)一的檢索界面,且將一個(gè)檢索提問(wèn)的同時(shí)發(fā)送給多個(gè)搜索引擎,同時(shí)檢索多個(gè)數(shù)據(jù)庫(kù),再經(jīng)過(guò)聚合,去重之后輸出檢索結(jié)果。其優(yōu)點(diǎn)是省時(shí),缺點(diǎn)是由于不同的搜索引擎的檢索機(jī)制,所支持的檢索算法,對(duì)提問(wèn)式的接讀等均不相同,導(dǎo)致檢索結(jié)果的準(zhǔn)確性差。常用的多元搜索引擎有Dogpile Inferen等。元搜索引擎以超連接的方式,實(shí)行對(duì)獨(dú)立搜索引擎的數(shù)據(jù)庫(kù)選擇,查詢,分析,提煉整合出相關(guān)的數(shù)據(jù),并把這些搜索引擎返回的結(jié)果經(jīng)過(guò)處理后再返回給用戶。元搜索引擎是建立于獨(dú)立搜索引擎之上的搜索引擎,可以靈活地選擇所要采用的獨(dú)立搜索引擎,充分發(fā)揮各個(gè)獨(dú)立搜索引擎在某個(gè)搜索領(lǐng)域的功能與優(yōu)勢(shì),彌補(bǔ)獨(dú)立搜索引擎信息覆蓋面上的局限性,保證了搜索結(jié)果的準(zhǔn)確性和有效性,在查詢,檢索相關(guān)的信息或全文

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論