信息檢索概述_第1頁
信息檢索概述_第2頁
信息檢索概述_第3頁
信息檢索概述_第4頁
信息檢索概述_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信息檢索概述第一頁,共五十二頁,2022年,8月28日一、介紹幾個與信息相關(guān)的概念

1知識經(jīng)濟:“知識經(jīng)濟”是指建立在知識信息的生產(chǎn)、分配、使用之上的經(jīng)濟。“知識經(jīng)濟”是和農(nóng)業(yè)經(jīng)濟、工業(yè)經(jīng)濟相對應(yīng)的一個概念,它指的是當今世界一種新類型的,富有生命力的經(jīng)濟。

第二頁,共五十二頁,2022年,8月28日2信息高速公路(InformationHighway)

是美國國家信息基礎(chǔ)設(shè)施(NationalInformationInfrastructure,簡稱NII)的代稱。它實際上是一條很寬的信息通道,可供人們大量地,并行地,高速地傳輸信息。具體地說,它是一個巨型的交互式多媒體高速計算機通信網(wǎng)絡(luò)系統(tǒng),將原來分散的電話,計算機,電視,廣播,傳真,數(shù)據(jù)庫等傳輸系統(tǒng)集成為一體,形成以現(xiàn)代計算機網(wǎng)絡(luò)通信技術(shù)為基礎(chǔ),以光導(dǎo)纖維通信和衛(wèi)星通信為骨干,以數(shù)據(jù)庫為信息源,跨越全國乃至世界的雙向大容量,高速度的電子數(shù)據(jù)(數(shù)字化數(shù)據(jù)-DigitalData)傳輸系統(tǒng)。由于這種交互式電腦網(wǎng)絡(luò)如同交通基礎(chǔ)設(shè)施的高速公路網(wǎng),所以被人們形象的稱為“信息高速公路”。

第三頁,共五十二頁,2022年,8月28日目前有:

(1)美國信息高速公路計劃(NII)最早是1979年由戈爾提出,1992年克林頓競選美國總統(tǒng)時正式提出這個構(gòu)想。后來成為克林頓上臺后大力推崇的重振美國經(jīng)濟計劃的重要組成部分。它的提出不僅在美國社會產(chǎn)生了強烈的反響,而且也在全球范圍內(nèi)引起巨大的震動。

(2)全球信息高速公路計劃(GII)是美國政府NII計劃的擴大與延伸。目的是把各國光纖和衛(wèi)星通訊網(wǎng)連接在一起,發(fā)展擴大到全世界范圍的“全球信息高速公路”計劃。

第四頁,共五十二頁,2022年,8月28日(3)法國的“電子信息高速公路”:以多媒體取代家用電腦的龐大工程,將把電話同通信網(wǎng)絡(luò)相連接,最終形成一個光纖電視網(wǎng),從而實現(xiàn)法國境內(nèi)文字、聲音和圖象的快速傳遞(4)韓國也準備用21年的時間,投資550億美元,建立本國的超高速信息通信網(wǎng)。

(5)新加坡的智能島——東南亞信息中心(6)日本的曼佗羅計劃(1992/5)與NII相抗衡的全面戰(zhàn)略計劃(7)中國信息高速公路計劃(信息準高速國道或信息中速國道):“三金”工程,即“金橋”,“金關(guān)”,“金卡”工程。(十二金工程)

第五頁,共五十二頁,2022年,8月28日三金工程是中國“信息高速公路)的起步工程金橋工程是一項規(guī)模巨大的系統(tǒng)工程,是以電子郵件(E-MAIL)和電子數(shù)據(jù)交換(EDI)作為信息交換平臺,主要目標是建立一個覆蓋全國與國務(wù)院各部委使用網(wǎng)相聯(lián),并與各省、直轄市、自治區(qū)中心城市、大中型企業(yè)連接的國家公用信息通訊網(wǎng)。金卡工程也稱電子貨幣工程。我國始與1993年,上海等12個城市為首批試點城市。武漢市列為第二批試點城市,1997年啟動后,得到中國人民銀行總行批準。金關(guān)工程是我國實現(xiàn)對外貿(mào)易無紙化的信息網(wǎng)絡(luò)工程。第六頁,共五十二頁,2022年,8月28日3、InternetInternet又稱因特網(wǎng)或“互聯(lián)網(wǎng)”,他是從英文InterconnectedNetworks這兩個詞中,各取前半部合成的。其中文意思是指跨國的網(wǎng)絡(luò),是一群橫跨世界的各種相互連接的計算機網(wǎng)絡(luò)的統(tǒng)稱,這些網(wǎng)絡(luò)集合采用一種共同的標準通信協(xié)議來溝通,以進行信息資源的交換和共享。Internet是由美國ARPANET發(fā)展起來的一個國際性的計算機互聯(lián)網(wǎng)絡(luò),它的特點是(1)異種計算機互聯(lián)(2)互聯(lián)網(wǎng)絡(luò)部分遭到破壞時,其他部分仍可以繼續(xù)應(yīng)用。Internet可以總結(jié)為:是遵從TCP/IP協(xié)議,遍布全世界的大大小小的計算機網(wǎng)絡(luò)連接起來構(gòu)成的全球性計算機網(wǎng)絡(luò)的總稱,是目前全球最大的計算機網(wǎng)絡(luò),也是全球最大的信息資源網(wǎng)。是“信息高速公路”的典范。Internet網(wǎng)的主要功能就是進行科技信息的傳遞。第七頁,共五十二頁,2022年,8月28日特點:

信息廣泛、傳播速度快、方便實用應(yīng)用:

信息查詢、收發(fā)E-MAIL、傳送文件、WWW應(yīng)用、Gopher-信息檢索Telnet-遠程登錄、BBS公告牌服務(wù)

第八頁,共五十二頁,2022年,8月28日Gopher是美國明尼蘇達大學研制的菜單式信息查詢軟件。WALS(廣域服務(wù)器)是供用戶查詢分布在Internet網(wǎng)上各類數(shù)據(jù)庫的一個通用接口軟件,實現(xiàn)遠程查詢。WWW是一個超文本式信息查詢工具,它可以把Internet網(wǎng)上不同地點的相關(guān)數(shù)據(jù)信息有機的組織在一起。用戶只要提供查詢要求就可以了。第九頁,共五十二頁,2022年,8月28日四大骨干網(wǎng)目前我國已建成Chinanet、CERnet、CSTnet與ChinaGBN四大骨干網(wǎng)。各部門與單位紛紛建立了與四大骨干網(wǎng)互聯(lián)的內(nèi)部網(wǎng)或局域網(wǎng)。

第十頁,共五十二頁,2022年,8月28日

Chinanet(中國公用計算機互聯(lián)網(wǎng))是中國第一個商業(yè)化全國性計算機網(wǎng)絡(luò),該網(wǎng)由信息產(chǎn)業(yè)部(原郵電部)管理CERnet(中國教育與科研計算機網(wǎng)絡(luò))由教育部主持,網(wǎng)控中心設(shè)在清華大學,網(wǎng)絡(luò)分為全國主干網(wǎng)、地區(qū)網(wǎng)與校園網(wǎng)三層結(jié)構(gòu)。主干網(wǎng)連著八大區(qū)、十個節(jié)點,所有主干網(wǎng)節(jié)點采用11條DDN專線連接。是目前中國與Internet連接最大的學術(shù)網(wǎng)。第十一頁,共五十二頁,2022年,8月28日CSTnet(中國科技網(wǎng))由中國科學院主管,以中國科學院的中國國家計算機和網(wǎng)絡(luò)設(shè)施NCFC與全國性網(wǎng)絡(luò)CASnet為基礎(chǔ),連接中國科學院以外的國內(nèi)科技單位而構(gòu)成的網(wǎng)絡(luò)。ChinaGBN(中國金橋網(wǎng))即國家經(jīng)濟信息通訊網(wǎng),是一個商業(yè)化信息網(wǎng)絡(luò),由中國電子工業(yè)總公司(原電子工業(yè)部)主管。

第十二頁,共五十二頁,2022年,8月28日4、信息社會的基本內(nèi)容:3I、3C、3A、3R

3I:Information(信息)、Intelligence(智能)、Integration(集成、綜合)3C:Computer(計算機)、Communication(通訊)、Control(控制)3A:FactoryAutomation(工廠自動化)、OfficeAutomation(辦公自動化)HomeAutomation(家庭自動化)3R:MaterialRevolution(材料革命)、EnergyRevolution(能源革命)、InformationRevolution(信息革命)

第十三頁,共五十二頁,2022年,8月28日5、信息、知識、情報、文獻的基本含義

信息:在中國歷史文獻中最早見于唐詩,拉丁詞源是Information。每個人每天都在不斷地通過感覺器官從外界接受信息。書刊報紙、電視、收音機、交談中不斷獲得信息。

信息的準確概念,尚未定論,眾說紛紜。

信息存在于人類社會以及人的思維活動,也存在于自然界。

第十四頁,共五十二頁,2022年,8月28日信息的特點:

(1)時效性:重要特點。如果信息傳遞很慢,那么有用的信息也會失去應(yīng)有的價值。如新聞、預(yù)告。

(2)可擴散性:在時間或空間上從一點轉(zhuǎn)移到另一點?!耙粋魇畟靼佟?。

(3)可擴充性:人們對世界認識是無無限的,因此信息資源的擴充與累積也是無限的。

(4)共享性:信息可以多次傳播,不失其內(nèi)容,與實物交易不同。第十五頁,共五十二頁,2022年,8月28日

知識:知識是人類認識的成果和結(jié)晶,是人類在認識和改造世界和社會實踐中獲得的對事物本質(zhì)的認識。知識僅存在于人類社會。

個人知識:存在于大腦、筆記或書信中,只能為個人所用。

社會知識:存在于文獻中或人類的傳說中。

知識的屬性:意識性、實踐性、規(guī)律性、繼承性,滲透性。

第十六頁,共五十二頁,2022年,8月28日情報:是一種人工信息,信息與知識都是它的來源。激活了的,活化了的知識。

情報與信息在英文中同為Information,但信息的外延比情報廣,信息是包含情報的。情報就是人們在一定時間內(nèi)為一定目的而傳遞的有使用價值的知識或信息,它有明確的接收對象。

情報的屬性:知識與信息性、動態(tài)性、效用性、社會性、語言性、可塑性、時間性。第十七頁,共五十二頁,2022年,8月28日文獻:記錄有知識的一切載體。即用文字、圖形、符號、聲頻、視頻等技術(shù)手段記錄人類知識的一種載體。屬性:知識性、記錄性、物質(zhì)性。

文獻的范圍很廣。古代:甲骨文、碑刻、竹簡、帛書是文獻。

現(xiàn)代:圖書、報紙、期刊

現(xiàn)今:機讀資料、縮微制品、電子出版物。

文獻的功能1)存貯知識的功能;

2)傳遞和交流信息的功能;

3)保存知識的功能。

第十八頁,共五十二頁,2022年,8月28日二、信息檢索的基本內(nèi)容1、概念:1)信息檢索(informationretrieval)是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的需要找出有關(guān)信息的過程。所以,它的全稱又叫信息存儲與檢索(informationstorageandretrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過程的后一步,即從信息集合中找出所需要信息的過程。相當于我們所說的信息查詢(informationsearch)。第十九頁,共五十二頁,2022年,8月28日2)檢索語言:檢索語言是把信息的存儲與檢索聯(lián)系起來,把標引人員與用戶聯(lián)系起來,以便取得共同的理解、實現(xiàn)交流的語言。有人工語言(主題語言和分類語言)、自然語言之分。(第三章詳細介紹)

3)檢索方法:常用法、追溯法和循環(huán)法

(第四章詳細介紹)第二十頁,共五十二頁,2022年,8月28日檢索詞、檢索式、檢索策略(第四章詳細介紹)

檢索詞是用戶或檢索人員給出的字、詞、字符或短語,用于查找含有它(它們)的記錄。

檢索式也稱檢索提問式,是要求系統(tǒng)執(zhí)行的檢索語句。簡單的檢索式由一個檢索詞和一個字段名構(gòu)成,復(fù)雜的檢索式由多個檢索詞和字段名通過關(guān)系算符連接而成。如:要利用英文搜索引擎查找網(wǎng)絡(luò)信息檢索方面的資料,檢索式為(WebORInternetORWWW)AND(Search*ORRetrieval*)。

第二十一頁,共五十二頁,2022年,8月28日檢索策略:

所謂檢索策略,就是在分析課題內(nèi)容具有哪些概念單元的基礎(chǔ)上,確定檢索系統(tǒng)、學科領(lǐng)域、檢索文檔、檢索途徑和檢索詞,并科學安排各檢索詞之間的位置關(guān)系和邏輯關(guān)系以及查找步驟等。也就是為滿足信息需求所制定的一系列檢索方案。

第二十二頁,共五十二頁,2022年,8月28日5)檢中結(jié)果、查全率、查準率(第四章詳細介紹)

檢中結(jié)果又稱檢索結(jié)果集,是數(shù)據(jù)庫中滿足(檢索式(即符合檢索條件)的那些記錄的集合

查全率:是指檢出文獻中合乎需要的文獻數(shù)量占數(shù)據(jù)庫中存在的合乎該需要的所有文獻的比例

查準率:是指檢出文獻中合乎需要的文獻數(shù)量占檢出文獻全部數(shù)量的比例

第二十三頁,共五十二頁,2022年,8月28日2、信息檢索的類型:

(1)根據(jù)檢索手段的不同,分為手工檢索、計算機檢索(光盤檢索、聯(lián)機檢索和網(wǎng)絡(luò)檢索)

(2)根據(jù)檢索對象、

形式的不同,分為文獻型信息檢索、數(shù)據(jù)型信息檢索、事實型信息檢索。

第二十四頁,共五十二頁,2022年,8月28日

文獻型信息檢索(DocumentRetrieval):以文獻(包括題錄、文摘)為檢索對象的檢索。凡是查找某一主題、時代、地區(qū)、著者、文種的有關(guān)文獻,以及回答這些文獻的出處和收藏處所等,都屬于文獻型信息檢索的范疇。完成文獻型信息檢索主要借助于各種書目型數(shù)據(jù)庫。

第二十五頁,共五十二頁,2022年,8月28日數(shù)據(jù)型信息檢索(DataRetrieval):以數(shù)值或數(shù)據(jù)為對象的一種檢索,包括文獻中的某一數(shù)據(jù)、公式、圖表,以及某一物質(zhì)的化學分子式等,數(shù)據(jù)檢索分為數(shù)值型與非數(shù)值型。完成數(shù)據(jù)型信息檢索主要借助于各種數(shù)值數(shù)據(jù)庫和統(tǒng)計數(shù)據(jù)庫。

第二十六頁,共五十二頁,2022年,8月28日事實型信息檢索(FactRetrieval):以某一客觀事實為檢索對象,查找某一事物發(fā)生的時間、地點及過程的檢索,其檢索結(jié)果主要是客觀事實或為說明事實而提供的相關(guān)資料。如:2001年7月通過的奧運會主辦城市的結(jié)果與過程。完成事實型信息檢索主要借助于各種指南數(shù)據(jù)庫和全文數(shù)據(jù)庫。

第二十七頁,共五十二頁,2022年,8月28日

3、信息檢索的發(fā)展歷程

3.1基本方向:手工檢索向計算機檢索(如穿孔、縮微、自動化)發(fā)展,但是手工檢索與計算機檢索將長期并存。因為計算機檢索有其缺陷:(1)硬件條件不足:沒有計算機,不能上網(wǎng),(2)數(shù)據(jù)庫不完善,(3)網(wǎng)絡(luò)慢或網(wǎng)絡(luò)故障等等。

第二十八頁,共五十二頁,2022年,8月28日

3.2計算機信息檢索的的產(chǎn)生和發(fā)展,分為五個階段:

(1)脫機批處理檢索:1954一64。定期由專職檢索人員把許多用戶課題匯總,批量處理提問要求,并把結(jié)果提供給用戶。直接在計算機旁檢索,不需要遠程終端設(shè)備及通信網(wǎng)絡(luò)。用戶在計算機處理成批檢索課題之后才知道檢索結(jié)果,不能直接、及時修改檢索策略,查全率和查準率受到一定限制。

第二十九頁,共五十二頁,2022年,8月28日(2)聯(lián)機情報檢索:20世紀70年代投入商業(yè)運營。用戶在計算機檢索系統(tǒng)的終端上,通過通信網(wǎng)絡(luò),使用特定的指令和算符,以人機對話方式,查詢遠程計算機檢索系統(tǒng)核心的數(shù)據(jù)庫,從中獲取所需信息的計算機檢索系統(tǒng)。

第三十頁,共五十二頁,2022年,8月28日聯(lián)機檢索系統(tǒng)由三個部分組成:主機系統(tǒng)、通訊系統(tǒng)和終端設(shè)備

主機系統(tǒng)是聯(lián)機檢索系統(tǒng)的核心,它具備處理速度快、多道程序和分時功能,內(nèi)存容量大,多樣化的輸入輸出設(shè)備。

通訊系統(tǒng)是指終端設(shè)備與主機系統(tǒng)進行通信的設(shè)備。通信線路分為兩種:專用的直達線路;通過撥號選擇對方的交換線路。前者是特定通信線路,后者使用電話網(wǎng)和用戶電報網(wǎng),聯(lián)機系統(tǒng)使用的通信線路就屬于后一種。

終端系統(tǒng)是人與系統(tǒng)的接口設(shè)備。它能將字符、聲音以及人類的信息表現(xiàn)形式轉(zhuǎn)換成系統(tǒng)的機器代碼。反之,將系統(tǒng)的結(jié)果還原成字符、聲音等形式,傳送給終端用戶。第三十一頁,共五十二頁,2022年,8月28日

(3)國際聯(lián)機檢索:70年代中后期國際聯(lián)機檢索是指用戶利用終端設(shè)備,通過通信網(wǎng)與地球上任何地方的大型計算機信息檢索系統(tǒng)的主機進行直接人機對話式的計算機檢索。

第三十二頁,共五十二頁,2022年,8月28日國際聯(lián)機檢索系統(tǒng)一般由通信網(wǎng)絡(luò)、國際聯(lián)機檢索中心、用戶終端等三部分組成。國際聯(lián)機檢索系統(tǒng)的服務(wù)方式有:回溯檢索、定題服務(wù)、聯(lián)機訂購原文、電子郵件服務(wù)以及光盤服務(wù)五種方式。

第三十三頁,共五十二頁,2022年,8月28日幾種主要的國際聯(lián)機檢索系統(tǒng)Dialog國際聯(lián)機檢索系統(tǒng)ESA/IRS國際聯(lián)機檢索系統(tǒng)ORBIT國際聯(lián)機檢索系統(tǒng)STN國際聯(lián)機檢索系統(tǒng)OCLC國際聯(lián)機檢索系統(tǒng)

這是目前世界著名的五大聯(lián)機檢索系統(tǒng)第三十四頁,共五十二頁,2022年,8月28日

目前世界上最大的國際聯(lián)機檢索信息系統(tǒng)??偛吭O(shè)在美國舊金山附近的帕洛阿爾托市。此系統(tǒng)現(xiàn)有近600個數(shù)據(jù)庫,信息總量超過5億條,其中包括50多種語言、6萬多種期刊,數(shù)據(jù)庫內(nèi)容涉及綜合性學科、自然科學、應(yīng)用科學和社會科學等,文獻類型有圖書、報紙、期刊、學位論文、會議錄研究報告、政府文件、專利文獻、標準文獻、年鑒、市場行情和廠商名錄等。DIALOG第三十五頁,共五十二頁,2022年,8月28日ORBIT

ORBIT的全稱為onlineretrievalofbibliographicinformationtimeshared即文獻目錄信息分時聯(lián)機檢索。是第二大國際聯(lián)機檢索系統(tǒng),擁有200多個數(shù)據(jù)庫。以化工、石油、生物、化學、環(huán)境科學、醫(yī)學、運動科學和安全科學等深入文獻比較齊全而著稱。其特色數(shù)據(jù)庫有SAE(汽車、飛機等交通工具)TULSA(石油、天然氣開采與勘探)等30多個數(shù)據(jù)庫,為該系統(tǒng)獨有。第三十六頁,共五十二頁,2022年,8月28日ESA/IRS是歐洲最大的聯(lián)機檢索中心。也是世界上大型的國際聯(lián)機檢索系統(tǒng)之一,僅次于美國的DIALOG和ORBIT聯(lián)機檢索系統(tǒng)。涉及的專業(yè)范圍有:科技、農(nóng)業(yè)、衛(wèi)生、管理、社會科學和宇航工程及技術(shù)等方面。有120多個數(shù)據(jù)庫,其中,酸雨(ACIDRAIN)、鑄造(BIIPAM-CTIF)、原材料價格(PRICEDATA)、衛(wèi)星遙感圖象(LEDA)、宇航及高技術(shù)軟件(SPACESOFT)等為特色數(shù)據(jù)庫。第三十七頁,共五十二頁,2022年,8月28日STN

STN(TheScientificandTechnicalInformationNetworkInternational)是國際科學技術(shù)信息網(wǎng)絡(luò)系統(tǒng)的簡稱。是由德國卡爾斯魯厄能源、物理、數(shù)學專業(yè)信息中心(FIT)、美國化學文摘社(CAS)和日本國際化學信息協(xié)會(JAICI)三家合作經(jīng)營的國際聯(lián)機檢索系統(tǒng)。涉及的專業(yè)范圍:化學、化工、生物、醫(yī)學、數(shù)學、物理、能源、冶金、建筑等方面。其特色數(shù)據(jù)庫有:CAS化學物質(zhì)結(jié)構(gòu)圖形數(shù)據(jù)庫(REGISTRY)、德國專利數(shù)據(jù)庫(PATDPA)、碳13核磁共振和紅外光譜數(shù)值圖形數(shù)據(jù)庫(C13-NMR/IR)。第三十八頁,共五十二頁,2022年,8月28日STN的特點合作建網(wǎng),分布式管理多文檔檢索,方便實用字段限定檢索時,只使用后綴碼,無前綴碼擁有世界上第一批聯(lián)機圖象數(shù)據(jù)庫第三十九頁,共五十二頁,2022年,8月28日OCLC

OCLC(OnlineComputerLibraryCenter)即聯(lián)機計算機圖書館中心。是世界上最大的文獻信息服務(wù)機構(gòu)之一??偛吭O(shè)在美國俄亥俄州,1971年建成聯(lián)機系統(tǒng),擁有370多種語言、3400多萬條聯(lián)合書目記錄數(shù)據(jù)庫,OCLC的“第一檢索系統(tǒng)”(FirstSearch)提供聯(lián)機信息檢索系統(tǒng)目前有70多個數(shù)據(jù)庫,涉及13個主題領(lǐng)域。不僅有書目信息而且絕大部分可以直接獲取全文。第四十頁,共五十二頁,2022年,8月28日(4)光盤檢索:80年代初期,其全稱為高密度光盤(CompactDisk),主要是利用激光、計算機及光電集成等技術(shù)實現(xiàn)信息存儲的數(shù)字化。以光盤為介質(zhì)的光盤數(shù)據(jù)庫檢索系統(tǒng)由于信息存儲量大,簡單易用而取勝。

第四十一頁,共五十二頁,2022年,8月28日

(5)網(wǎng)絡(luò)信息檢索:

網(wǎng)絡(luò)信息檢索是通過標準通信方式將世界各地的計算機網(wǎng)絡(luò)連接起來,形成一個基于客戶機-服務(wù)器模式的網(wǎng)絡(luò)分布數(shù)據(jù)庫結(jié)構(gòu)。它在全球范圍內(nèi)把科技信息、商貿(mào)信息、經(jīng)濟信息、時事新聞以及日常生活信息通過互聯(lián)網(wǎng)絡(luò)合在一起,向億萬聯(lián)網(wǎng)用戶提供廣泛的信息檢索與服務(wù)。它是信息化社會應(yīng)用最廣泛、最活躍的領(lǐng)域。

第四十二頁,共五十二頁,2022年,8月28日網(wǎng)絡(luò)信息檢索服務(wù)的特點:

1)信息檢索服務(wù)的開放性。網(wǎng)絡(luò)信息系統(tǒng)中包含信息資源、信息設(shè)備、信息通道、信息檢索軟件及信息終端等子系統(tǒng),各個子系統(tǒng)都是開放的,其信息資源面向所有用戶。

2)超文本的多鏈接性。以超文本技術(shù)為基礎(chǔ)鏈結(jié)構(gòu)將不同地方的相關(guān)信息有機聯(lián)系起來,使用戶可通過點擊文本或圖表中的超文本鏈接點訪問另一個相關(guān)的文檔。

3)操作的簡易性。采用客戶機/服務(wù)器結(jié)構(gòu),通過交互式的圖形界面,為用戶提供友好的信息查詢要求,系統(tǒng)就會自動向適當?shù)姆?wù)器提出請求。正是這一特點,使Internet能廣泛深入學校、家庭、辦公室乃至每一個人。

第四十三頁,共五十二頁,2022年,8月28日

4、網(wǎng)絡(luò)信息檢索的發(fā)展趨勢

智能化

可視化

簡單化

多樣化

個性化

商業(yè)化

第四十四頁,共五十二頁,2022年,8月28日(1)智能化

智能化是網(wǎng)絡(luò)信息檢索未來主要的發(fā)展方向。智能檢索是基于自然語言的檢索形式,機器根據(jù)用戶所提供的以自然語言表述的檢索要求進行分析,而后形成檢索策略進行搜索。

目前已有一些搜索引擎支持智能檢索,但其智能化程度不高。而近年來internet上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理、知識共享智能體等,都將提高網(wǎng)絡(luò)信息檢索的智能化程度。第四十五頁,共五十二頁,2022年,8月28日(2)可視化

可視化的優(yōu)點在于圖象的表達方式生動、形象、準確、效果更高,能從多角度揭示,而純文字的表達方式是模糊、一維的。

信息檢索中的可視化是將數(shù)據(jù)庫中不可見的語義關(guān)系用圖象形式可視化顯示并表達用戶檢索過程。在可視化空間展示的信息可以看見它們是二維的或三維的。(信息檢索中,實現(xiàn)語義控制是人們的理想,而現(xiàn)實的信息檢索是基于“字符串”的檢索、匹配與表達)

第四十六頁,共五十二頁,2022年,8月28日(3)簡單化

未來家用電腦將朝著智能化、網(wǎng)絡(luò)化、人性化和綠色環(huán)保的方向發(fā)展;操作系統(tǒng)的用戶友好性將不斷增加,如微軟和蘋果公司都在致力于操作系統(tǒng)網(wǎng)絡(luò)化研究,以便使其中的任意應(yīng)用程序都能“連接”進行“網(wǎng)絡(luò)檢索”,并與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論