信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第1頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第2頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第3頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第4頁
信息管理學(xué)基礎(chǔ)-第6章-信息檢索課件_第5頁
已閱讀5頁,還剩165頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

信息檢索主講人:孫祥經(jīng)濟(jì)信息管理教研室信息檢索Page

2第六章信息檢索信息檢索的基本概念與原理信息檢索的發(fā)展歷程信息檢索的技術(shù)與方法信息檢索的步驟與策略網(wǎng)絡(luò)信息檢索Page2第六章信息檢索信息檢索的基本概念與原理Page

3內(nèi)容提要本章介紹了信息檢索的基本概念和原理,并以信息技術(shù)發(fā)展為主線,梳理了信息檢索的發(fā)展歷程及階段,討論了信息檢索的步驟和策略的制定,以及信息檢索語言和信息檢索效率評(píng)價(jià),同時(shí)介紹了網(wǎng)絡(luò)信息檢索的特點(diǎn)及網(wǎng)絡(luò)檢索工具。第六章信息檢索Page3內(nèi)容提要第六章信息檢索Page

4學(xué)習(xí)重點(diǎn)

掌握信息檢索的基本概念和原理,掌握信息檢索的步驟和策略,熟悉信息檢索的發(fā)展歷程和網(wǎng)絡(luò)信息檢索的特點(diǎn)。第六章信息檢索Page4學(xué)習(xí)重點(diǎn)第六章信息檢索56.1信息檢索的基本概念和原理6.1.1信息檢索的含義

為什么要學(xué)習(xí)信息檢索,掌握信息檢索工具的使用?

可以充分發(fā)揮人類知識(shí)寶庫的作用,有利于開發(fā)智力資源;

協(xié)助有關(guān)人員選擇正確的科技策略,提高效率、減少人力或投資方面的浪費(fèi);

可以節(jié)省科技人員的寶貴時(shí)間;

促進(jìn)專業(yè)學(xué)習(xí)。信息檢索的基本概念和原理56.1信息檢索的基本概念和原理6.1.1信息檢索的含義6信息檢索的概念(廣義)將信息按一定的方式組織和存儲(chǔ)起來,并根據(jù)用戶的需要檢出所需信息的過程。(狹義,單從信息用戶的角度)從已存儲(chǔ)的信息資源中找出與用戶提問相關(guān)的文獻(xiàn)、知識(shí)、事實(shí)、數(shù)據(jù)的邏輯運(yùn)算和技術(shù)操作過程。信息檢索的基本概念和原理6信息檢索的概念信息檢索的基本概念和原理7信息檢索的本質(zhì)

匹配,將用戶提問與信息集合中的數(shù)據(jù)進(jìn)行比較和選擇的結(jié)果。信息檢索的基本概念和原理

提問(檢索)語言

文獻(xiàn)標(biāo)識(shí)語言匹配7信息檢索的本質(zhì)信息檢索的基本概念和原理提問(檢索)8信息檢索的基本特征有確定的目標(biāo);有一個(gè)可能的信息解的集合;有一定的線索可依;搜索的過程是針對(duì)一定的目標(biāo)、遵循一定的線索、不斷縮小搜索范圍的求解過程。信息檢索的基本概念和原理8信息檢索的基本特征信息檢索的基本概念和原理9信息檢索的兩個(gè)子系統(tǒng)信息檢索的基本概念和原理9信息檢索的兩個(gè)子系統(tǒng)信息檢索的基本概念和原理106.1.2信息檢索的分類

按照內(nèi)容劃分文獻(xiàn)檢索(DocumentRetrieval)數(shù)據(jù)檢索(DataRetrieval)事實(shí)檢索(FactRetrieval)信息檢索的基本概念和原理106.1.2信息檢索的分類信息檢索的基本概11文獻(xiàn)檢索文獻(xiàn)檢索是以文獻(xiàn)為檢索對(duì)象的一種檢索,凡是查找某一主題、某一學(xué)科、某一著者的有關(guān)文獻(xiàn)均屬于文獻(xiàn)檢索的范疇。文獻(xiàn)檢索是相關(guān)性檢索,即檢索系統(tǒng)不直接解答用戶所提出的技術(shù)問題本身,只提供與之相關(guān)的文獻(xiàn)供用戶參考。如:查找經(jīng)濟(jì)信息處理流程方面的相關(guān)論文.信息檢索的基本概念和原理11文獻(xiàn)檢索信息檢索的基本概念和原理12注意:

信息檢索(InformationRetrieval)與文獻(xiàn)檢索(DocumentRetrieval)是兩個(gè)不同的概念,文獻(xiàn)檢索是信息檢索的一種最基本的、最主要的形式。信息檢索的基本概念和原理12注意:信息檢索的基本概念和原理13數(shù)據(jù)檢索(DataRetrieval):是以數(shù)據(jù)為檢索對(duì)象,從已收藏?cái)?shù)據(jù)資料中查找出特定數(shù)據(jù)的過程。數(shù)據(jù)檢索是一種確定性檢索,系統(tǒng)要直接回答用戶提出的問題,即直接提供用戶所需要的確切的數(shù)據(jù)。如:某種材料的電阻;某變壓器的參數(shù);化學(xué)分子式、數(shù)據(jù)圖表等。信息檢索的基本概念和原理13數(shù)據(jù)檢索(DataRetrieval):信息檢索的基本14事實(shí)檢索(FactRetrieval)事實(shí)檢索即通過對(duì)信息集合中已有的基本事實(shí)或數(shù)據(jù)進(jìn)行處理(邏輯推理),然后得出新的(即未直接存入信息集合中的)事實(shí)的過程。如:某產(chǎn)品是哪個(gè)廠家生產(chǎn),第一顆人造衛(wèi)星是什么時(shí)候升空的,按高考分?jǐn)?shù)劃分,每個(gè)段的新生有多少人?信息檢索的基本概念和原理14事實(shí)檢索(FactRetrieval)信息檢索的基本15數(shù)據(jù)和事實(shí)檢索是要檢索出包含在文獻(xiàn)中的具體情報(bào);文獻(xiàn)檢索則是要檢索出包含所需情報(bào)的文獻(xiàn)。信息檢索的基本概念和原理15信息檢索的基本概念和原理16按照信息的組織方式劃分全文檢索多媒體檢索超媒體檢索依信息存儲(chǔ)與檢索方式劃分手工檢索計(jì)算機(jī)檢索信息檢索的基本概念和原理16按照信息的組織方式劃分信息檢索的基本概念和原理17信息檢索的特性信息檢索的相關(guān)性相關(guān)性表明用戶是否認(rèn)為一文獻(xiàn)與一提問吻合。信息檢索的不確定性標(biāo)引的不確定性是指不同標(biāo)引員在給同一篇信息對(duì)象進(jìn)行標(biāo)引時(shí)會(huì)選用不同的標(biāo)引詞,即標(biāo)引詞選用的不一致性。檢索詞選用的不確定性是指候選檢索詞集不止一個(gè),檢索過程具有試探性。信息檢索的邏輯性檢索語言、檢索策略(處理信息檢索提問的邏輯與查找步驟的科學(xué)安排)信息檢索的基本概念和原理17信息檢索的特性信息檢索的基本概念和原理186.1.3信息檢索的基本原理

對(duì)信息資源集合與信息需求集合的匹配和選擇。一方面是用戶的信息需求,一方面是組織有序的文獻(xiàn)信息集合,檢索就是從用戶特定的信息需求出發(fā),對(duì)特定的信息集合采用一定的方法、技術(shù)手段,根據(jù)一定的線索與規(guī)則從中找出相關(guān)的信息。匹配有其匹配標(biāo)準(zhǔn),這里涉及到兩者一致性、相關(guān)度等問題,按一定的標(biāo)準(zhǔn)篩選出符合要求的信息。信息檢索的基本概念和原理186.1.3信息檢索的基本原理信息檢索的基本概念和原理196.1.4信息檢索的模型布爾邏輯檢索模型向量空間檢索模型概率檢索模型

模糊檢索模型信息檢索的基本概念和原理196.1.4信息檢索的模型信息檢索的基本概念和原理20信息檢索的模型信息檢索的模型,就是運(yùn)用數(shù)學(xué)的語言和工具,對(duì)信息檢索系統(tǒng)中的信息及其處理過程加以翻譯和抽象,表述為某種數(shù)學(xué)公式,再經(jīng)過演繹、推斷、解釋和實(shí)際檢驗(yàn),反過來指導(dǎo)信息檢索實(shí)踐。信息檢索的基本概念和原理20信息檢索的模型信息檢索的基本概念和原理21信息檢索模型的組成(1)用戶的需求表示:用戶查詢的獲取與表示。(2)文檔的表示:文檔內(nèi)容的識(shí)別與表示。(3)匹配機(jī)制:用戶需求表示與文檔表示之間的查詢機(jī)制,以及它們之間相關(guān)性排序的準(zhǔn)則和函數(shù)表示。(4)反饋修正:對(duì)檢索結(jié)果進(jìn)行優(yōu)化。信息檢索的基本概念和原理21信息檢索模型的組成信息檢索的基本概念和原理22布爾檢索(精確匹配檢索)假設(shè)檢索到的集合中,所有文檔關(guān)于相關(guān)性都是等價(jià)的,也假設(shè)了相關(guān)性是二元的。對(duì)于檢索評(píng)價(jià)有2種輸出結(jié)果:TRUEandFALSE查詢項(xiàng)被描述為布爾邏輯操作符

AND,OR,NOT例一個(gè)文檔當(dāng)且僅當(dāng)它能夠滿足布爾查詢式時(shí),才將其檢索出來信息檢索的基本概念和原理22布爾檢索(精確匹配檢索)信息檢索的基本概念和原理23小例子簡單查詢項(xiàng)為“林肯”,會(huì)返回大量包含林肯汽車和林肯總統(tǒng)的文檔。不管“林肯”這個(gè)詞出現(xiàn)多少次,也不管上下文,所有這些文檔根據(jù)布爾檢索模型的排序性質(zhì)都是等價(jià)的。查詢項(xiàng)“總統(tǒng)AND林肯”,會(huì)返回一組同時(shí)包含這兩個(gè)查詢?cè)~的文檔查詢項(xiàng)“總統(tǒng)AND林肯ANDNot(汽車OR轎車)”,會(huì)去除包含“汽車OR轎車”的文檔信息檢索的基本概念和原理23小例子信息檢索的基本概念和原理24優(yōu)點(diǎn)簡單、易于理解;能處理結(jié)構(gòu)化查詢,易于表示同義關(guān)系和詞組;速度快。缺點(diǎn)嚴(yán)格,使用的限制性強(qiáng);結(jié)果不易控制;難以進(jìn)行定量比較;無法滿足特殊查詢。信息檢索的基本概念和原理24優(yōu)點(diǎn)信息檢索的基本概念和原理25向量空間模型相比于布爾模型要求的準(zhǔn)確匹配,Salton在60年代末提出的向量空間模型采用了“部分匹配”的檢索策略(即:出現(xiàn)部分索引詞也可以出現(xiàn)在檢索結(jié)果中);這個(gè)模型對(duì)于查詢與文檔的相關(guān)度有較強(qiáng)的可計(jì)算性和可操作性,并且被廣泛應(yīng)用于文本檢索、自動(dòng)文摘、關(guān)鍵詞自動(dòng)提取、文本分類等方面。信息檢索的基本概念和原理25向量空間模型信息檢索的基本概念和原理26優(yōu)點(diǎn)使得對(duì)查詢向量中關(guān)鍵詞權(quán)重的賦值成為可能;可根據(jù)相似度大小對(duì)查詢結(jié)果進(jìn)行排序并控制輸出數(shù)量;相比布爾模型要求的準(zhǔn)確匹配,VSM模型采用“部分匹配”檢索策略。實(shí)驗(yàn)表明:向量空間模型比布爾模型檢索效果更好。信息檢索的基本概念和原理26優(yōu)點(diǎn)信息檢索的基本概念和原理27缺點(diǎn)在模型中,特征項(xiàng)被假設(shè)為相互獨(dú)立,而實(shí)際上一個(gè)文檔中的特征項(xiàng)之間可能存著一定的聯(lián)系;不能像布爾模型一樣支持布爾結(jié)構(gòu)化查詢;基于向量空間模型的檢索系統(tǒng)較基于布爾模型的檢索系統(tǒng)而言,要復(fù)雜得多,在大型商業(yè)檢索系統(tǒng)中使用較少。信息檢索的基本概念和原理27缺點(diǎn)信息檢索的基本概念和原理28概率模型概率排序原則-Robertson(1977)如果一個(gè)參考檢索排序系統(tǒng)對(duì)每個(gè)查詢的反饋都是數(shù)據(jù)集中所有文檔根據(jù)和用戶查詢的相關(guān)性概率值降序排序的結(jié)果并且其中的概率值都被盡可能精確地估計(jì)出來那么該系統(tǒng)對(duì)于用戶的整體效果就是基于這些數(shù)據(jù)能夠獲得的最好結(jié)果給定一個(gè)新的文檔,搜索引擎的任務(wù)是判定這個(gè)文檔是否屬于相關(guān)文檔集合或者非相關(guān)集合。也就是說,系統(tǒng)應(yīng)該判斷文檔是相關(guān)的還是非相關(guān)的,如果相關(guān)就返回文檔。信息檢索的基本概念和原理28概率模型信息檢索的基本概念和原理29優(yōu)點(diǎn)文檔可以按照他們相關(guān)概率遞減的順序來排序。缺點(diǎn)開始時(shí)需要猜想把文檔分為相關(guān)和不相關(guān)的兩個(gè)集合,一般來說很難實(shí)際上這種模型沒有考慮索引術(shù)語在文檔中的頻率(因?yàn)樗械臋?quán)重都是二值的)假設(shè)索引詞獨(dú)立信息檢索的基本概念和原理29優(yōu)點(diǎn)信息檢索的基本概念和原理306.2信息檢索的發(fā)展歷程手工信息檢索階段機(jī)械信息檢索階段計(jì)算機(jī)信息檢索階段網(wǎng)絡(luò)信息檢索階段信息檢索的發(fā)展歷程306.2信息檢索的發(fā)展歷程信息檢索的發(fā)展歷程316.2.1手工信息檢索階段信息檢索起源于參考咨詢工作,參考咨詢工作產(chǎn)生的標(biāo)志是1876年召開的美國圖書館協(xié)會(huì)第一屆大會(huì)。1883年,波士頓公共圖書館首次設(shè)置了專職參考館員和參考閱覽室;20世紀(jì)初,多數(shù)圖書館成立了參考咨詢部門,主要利用圖書館的書目工具來幫助讀者查找圖書、期刊或現(xiàn)成答案。逐漸發(fā)展到從多種文獻(xiàn)源中查找、分析、評(píng)價(jià)和重新組織信息;“索引”突破了以前的狹隘范疇,成為獨(dú)立的檢索工具;信息檢索的發(fā)展歷程316.2.1手工信息檢索階段信息檢索的發(fā)展歷程3240年代進(jìn)一步包括回答事實(shí)性咨詢,編制書目、文摘,進(jìn)行專題文獻(xiàn)檢索,提供文獻(xiàn)代譯等?!靶畔z索”從此成為一項(xiàng)獨(dú)立的用戶服務(wù)工作,并逐漸從單純的經(jīng)驗(yàn)工作向?qū)I(yè)化方向發(fā)展。信息檢索的發(fā)展歷程3240年代進(jìn)一步包括回答事實(shí)性咨詢,編制書336.2.2機(jī)械信息檢索階段機(jī)械信息檢索兩種基本類型機(jī)電信息檢索系統(tǒng)光電信息檢索系統(tǒng)

機(jī)械信息檢索并沒有發(fā)展信息檢索語言,只是采用單一的方法對(duì)固定的存貯形式進(jìn)行檢索,而且過分依賴于設(shè)備,檢索復(fù)雜,成本較高,檢索效率和質(zhì)量都不理想。信息檢索的發(fā)展歷程336.2.2機(jī)械信息檢索階段信息檢索的發(fā)展歷程346.2.3計(jì)算機(jī)信息檢索階段1971年以前建立的信息檢索系統(tǒng),是傳統(tǒng)的批處理檢索方式。1971年以后,產(chǎn)生并發(fā)展的聯(lián)機(jī)信息檢索系統(tǒng),如OCLC、Dialog在線數(shù)據(jù)庫聯(lián)機(jī)檢索系統(tǒng)。信息檢索的發(fā)展歷程346.2.3計(jì)算機(jī)信息檢索階段信息檢索的發(fā)展歷程356.2.4網(wǎng)絡(luò)信息檢索階段20世紀(jì)90年代以來,產(chǎn)生并發(fā)展的網(wǎng)絡(luò)信息檢索階段。信息檢索的發(fā)展歷程356.2.4網(wǎng)絡(luò)信息檢索階段信息檢索的發(fā)展歷程366.3信息檢索的技術(shù)與方法信息檢索技術(shù)兩個(gè)發(fā)展方向:傳統(tǒng)信息檢索向全文文本、多媒體、多載體等新型信息檢索的發(fā)展,在深度上提高管理和組織信息的能力;信息資源的網(wǎng)絡(luò)化和分布化,面向互聯(lián)網(wǎng)中海量的信息資源,在廣度上提高管理和組織的能力。信息檢索的技術(shù)與方法366.3信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法376.3信息檢索的技術(shù)與方法從檢索手段看,信息檢索分為:手工信息檢索機(jī)械信息檢索計(jì)算機(jī)信息檢索網(wǎng)絡(luò)信息檢索信息檢索的技術(shù)與方法376.3信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法386.3.1手工信息檢索的技術(shù)與方法手工信息檢索工具主要是各種類型的工具書。工具書是根據(jù)一定的需要,比較完備地匯集某一方面的資料,并按特定的方法加以編排,專供讀者查考檢索有關(guān)知識(shí)、資料、事實(shí)的書籍。據(jù)工具書的體例和功能,可分為檢索型工具書、參考性工具書、詞語性工具書、表譜性工具書、圖錄性工具書和邊緣性工具書6種類型。信息檢索的技術(shù)與方法386.3.1手工信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法39手工信息檢索工具目錄:它是圖書、期刊等單位出版物外表特征的揭示和報(bào)道,它以一個(gè)完整的出版或收藏單位為著錄的基本單位,多按類或題名編排,強(qiáng)調(diào)有具體的收藏單位。是以某一“種”文獻(xiàn)為一個(gè)記錄款目。包括:國家書目、出版社目錄、館藏目錄、專題目錄、聯(lián)合目錄等。信息檢索的技術(shù)與方法39手工信息檢索工具信息檢索的技術(shù)與方法40索引:是對(duì)一組文獻(xiàn)集合有系統(tǒng)的指引。一般只起指引特定信息內(nèi)容及其存儲(chǔ)地址的作用。是檢索工具的輔助工具。它對(duì)文獻(xiàn)的外表特征和內(nèi)容特征用各種檢索標(biāo)識(shí)符(字母、數(shù)字、漢字等)進(jìn)行描述,并將它們按一定的規(guī)則及排列方式組織起來,然后用文摘號(hào)來注明它在文獻(xiàn)信息集合中的位。信息檢索的技術(shù)與方法40索引:信息檢索的技術(shù)與方法41文摘它也是以“篇”為著錄單元,但卻是在對(duì)文獻(xiàn)外部特征進(jìn)行著錄的基礎(chǔ)上,還將文獻(xiàn)的內(nèi)容加以濃縮,以最精煉最概括的文字報(bào)道文獻(xiàn)的主題、方法和結(jié)論,并將這些外部特征和內(nèi)容摘要的記錄按一定順序排列起來所形成的一種文獻(xiàn)檢索工具。它是檢索工具的主體,二次文獻(xiàn)的核心。信息檢索的技術(shù)與方法41文摘信息檢索的技術(shù)與方法42文摘按其目的和用途可分為:●指示性文摘這是旨在把原文的主題范圍、目的和方法概括的指示給讀者的一種文摘,幫助讀者判斷原文是否與自己相關(guān)以及是否需要閱讀原文。字?jǐn)?shù)一般限制在幾十個(gè)字(中文50~100個(gè)字,外文30~50個(gè)詞),也有人將其稱為簡介或簡介性文摘。閱讀指示性文摘不能代表原文。信息檢索的技術(shù)與方法42文摘按其目的和用途可分為:信息檢索的技術(shù)與方法43報(bào)道性文摘

又稱敘述性文摘,它是用來概括原文的內(nèi)容要點(diǎn),向讀者提供原文中的定量信息和定性信息的一種文摘,基本能反映原文的技術(shù)內(nèi)容,一般數(shù)字為200~300字(西文250個(gè)實(shí)詞)。評(píng)論性文摘評(píng)論性文摘插入有文摘員個(gè)人的看法或分析,評(píng)論性文摘的價(jià)值如何,主要取決于文摘員的專業(yè)水平。信息檢索的技術(shù)與方法43報(bào)道性文摘信息檢索的技術(shù)與方法44年鑒

年鑒是以全面、系統(tǒng)、準(zhǔn)確地記述上年度事物運(yùn)動(dòng)、發(fā)展?fàn)顩r為主要內(nèi)容的資料性工具書。匯輯一年內(nèi)的重要時(shí)事、文獻(xiàn)和統(tǒng)計(jì)資料,按年度連續(xù)出版的工具書。它具有資料權(quán)威、反應(yīng)及時(shí)、連續(xù)出版、功能齊全的特點(diǎn)。屬信息密集型工具書。信息檢索的技術(shù)與方法44年鑒信息檢索的技術(shù)與方法45手冊(cè)手冊(cè)是匯集某一學(xué)科或某一主題等需要經(jīng)常查考的資料,供讀者隨時(shí)翻檢的工具書。手冊(cè)的類型:數(shù)據(jù)性手冊(cè)條目性手冊(cè)圖表性手冊(cè)綜合性手冊(cè)信息檢索的技術(shù)與方法45手冊(cè)信息檢索的技術(shù)與方法46百科全書

百科全書是概要記述人類一切知識(shí)門類或某一知識(shí)門類的工具書。

信息檢索的技術(shù)與方法46百科全書信息檢索的技術(shù)與方法47手工信息檢索工具的排檢技術(shù)字順排檢技術(shù):將檢索工具的內(nèi)容按字、詞的一定順序或規(guī)律,有系統(tǒng)地組織排列起來的技術(shù)。分類排檢技術(shù):將信息素材按學(xué)科或事物性質(zhì)系統(tǒng)地加以排列。主題排檢技術(shù):以規(guī)范化的自然語言為標(biāo)識(shí)符號(hào)來標(biāo)引信息內(nèi)容的排檢技術(shù)。時(shí)序排檢技術(shù):按時(shí)間的順序組合信息素材的技術(shù),多用于編制年表、年譜等檢索工具。如:《國內(nèi)外大事記》地序排檢技術(shù):按一定時(shí)期的行政區(qū)域來排列信息素材的技術(shù)。如:《中國名勝詞典》

信息檢索的技術(shù)與方法47手工信息檢索工具的排檢技術(shù)信息檢索的技術(shù)與方法48手工信息檢索方法順查法:時(shí)間上,由遠(yuǎn)至近,查全率高,費(fèi)時(shí)費(fèi)力。倒查法:時(shí)間上,由近至遠(yuǎn),查準(zhǔn)率高,漏檢率高。抽查法:集中于學(xué)科的興旺階段,檢索效率高。追溯法:

A.一次文獻(xiàn)參考文獻(xiàn)一次信息參考文獻(xiàn)……由近至遠(yuǎn)

B.一次文獻(xiàn)引用該一次信息的文獻(xiàn)新的一次文獻(xiàn)……實(shí)際是由“遠(yuǎn)近”越查文獻(xiàn)越新,擴(kuò)大信息源,效率低,檢全率低,漏檢率高。信息檢索的技術(shù)與方法48手工信息檢索方法信息檢索的技術(shù)與方法49循環(huán)法:先利用檢索工具查出一批有用文獻(xiàn),然后再利用這些文獻(xiàn)末尾所附參考文獻(xiàn)的線索進(jìn)行追溯查找。信息檢索的技術(shù)與方法49循環(huán)法:先利用檢索工具查出一批有用文獻(xiàn),然后再利用這些文506.3.2機(jī)械信息檢索的技術(shù)與方法機(jī)電信息檢索系統(tǒng)繼手檢穿孔卡片之后,出現(xiàn)了機(jī)檢穿孔卡片和選卡機(jī)。這就形成了機(jī)電信息檢索系統(tǒng)。光電信息檢索系統(tǒng)主要是以縮微膠卷(片)檢索方式出現(xiàn)的。縮微膠卷(片)的檢索方式大致可以分為兩種類型:①尋址檢索方式②編碼檢索方式信息檢索的技術(shù)與方法506.3.2機(jī)械信息檢索的技術(shù)與方法信息檢索的技術(shù)與方516.3.3計(jì)算機(jī)信息檢索的技術(shù)與方法聯(lián)機(jī)信息檢索信息用戶利用終端設(shè)備,通過通訊網(wǎng)絡(luò)與世界各地的信息檢索系統(tǒng)聯(lián)機(jī),進(jìn)行人機(jī)對(duì)話,從檢索系統(tǒng)的數(shù)據(jù)庫中查找出用戶所需信息的全過程。優(yōu)點(diǎn):①檢索速度快;②檢索范圍廣而全面;③檢索途徑多、質(zhì)量高;④檢索內(nèi)容新、實(shí)時(shí)性強(qiáng);⑤檢索輔助功能完善、使用方便,檢索結(jié)果輸出方式靈活、實(shí)用。缺陷:①主機(jī)負(fù)擔(dān)重,一旦出現(xiàn)故障,則整個(gè)網(wǎng)絡(luò)都將癱瘓;②信息組織方式以線性為主,不夠靈活;③聯(lián)機(jī)檢索不像Internet是面向最終用戶的,操作也沒有后者方便。信息檢索的技術(shù)與方法516.3.3計(jì)算機(jī)信息檢索的技術(shù)與方法信息檢索的技術(shù)與方52聯(lián)機(jī)信息檢索系統(tǒng)的結(jié)構(gòu)

由檢索服務(wù)機(jī)構(gòu)(聯(lián)機(jī)存取中心)、國際通訊網(wǎng)絡(luò)及終端三部分構(gòu)成。

終端設(shè)備用于輸入檢索程序、顯示檢索過程、控制打印檢索結(jié)果。

通訊網(wǎng)絡(luò)用于實(shí)現(xiàn)遠(yuǎn)程人機(jī)對(duì)話。

檢索服務(wù)機(jī)構(gòu)(聯(lián)機(jī)存取中心)是存儲(chǔ)和檢索信息的核心。由中央計(jì)算機(jī)、數(shù)據(jù)庫檢索與管理軟件、聯(lián)機(jī)數(shù)據(jù)庫以及相應(yīng)的檢索服務(wù)體制組成。信息檢索的技術(shù)與方法52聯(lián)機(jī)信息檢索系統(tǒng)的結(jié)構(gòu)信息檢索的技術(shù)與方法53聯(lián)機(jī)信息檢索的技術(shù)原理一個(gè)典型的計(jì)算機(jī)信息系統(tǒng),能完成數(shù)據(jù)收集、分析、加工處理、存儲(chǔ)、傳遞通信和檢索信息的全過程。聯(lián)機(jī)信息檢索的服務(wù)方式定題信息提供(SDI)專題回溯檢索(RS)聯(lián)機(jī)訂購原文電子郵件信息檢索的技術(shù)與方法53聯(lián)機(jī)信息檢索的技術(shù)原理信息檢索的技術(shù)與方法54我國聯(lián)機(jī)存取服務(wù)始于1974年,比較有影響的聯(lián)機(jī)存取系統(tǒng)有:

(1)萬方數(shù)據(jù)資源系統(tǒng)

/(2)CNKI數(shù)據(jù)資源系統(tǒng)

(3)維普數(shù)據(jù)資訊系統(tǒng)

/信息檢索的技術(shù)與方法54我國聯(lián)機(jī)存取服務(wù)始于1974年,比較有影55光盤信息檢索光盤信息檢索的特點(diǎn):光盤存貯容量大、耐用。檢索成本低。一次購買可多次使用,節(jié)省了電訊費(fèi)和聯(lián)機(jī)系統(tǒng)使用費(fèi)。操作簡單,檢索效果好。用戶按提示或幫助功能使用檢索系統(tǒng)。運(yùn)行速度快。單機(jī)檢索,不受線路影響。安全性能高。只讀光盤,一般局域網(wǎng)用戶使用。信息檢索的技術(shù)與方法55光盤信息檢索信息檢索的技術(shù)與方法56光盤信息檢索的缺陷:如果光盤數(shù)據(jù)庫量不夠多,則信息資源就顯得有限,購買大量光盤數(shù)據(jù)庫,又要受到經(jīng)費(fèi)限制更新周期長。一般的光盤數(shù)據(jù)庫更新要1個(gè)月或更長,而網(wǎng)絡(luò)數(shù)據(jù)庫的更新周期一般是1周或更短。檢索時(shí)需不斷換盤。一個(gè)大型數(shù)據(jù)庫,一般都是幾張光盤,特別是全文數(shù)據(jù)庫,如中國學(xué)術(shù)期刊全文光盤數(shù)據(jù)庫,每年都有一百多張光盤,檢索時(shí)需要不斷更換光盤。信息檢索的技術(shù)與方法56光盤信息檢索的缺陷:信息檢索的技術(shù)與方法57光盤信息檢索方法光盤檢索系統(tǒng)的功能和指令與聯(lián)機(jī)檢索沒有很大區(qū)別,但更方便。功能鍵:Help(幫助)、Index(索引)、History(查閱歷史)、Display(顯示)、Print(打印)、SelectDatabase(選擇數(shù)據(jù)庫)、FormatWindow(格式窗)、Quit(退出)等。檢索信息時(shí)可用單元詞、多元詞(短語)、數(shù)字及布爾運(yùn)算符和位置運(yùn)算符把幾個(gè)檢索術(shù)語組配成一個(gè)提問邏輯式。用戶可以在任何時(shí)刻回顧其查找的歷史,重新使用或修改以前的任何提問。屏幕幫助是光盤數(shù)據(jù)庫最常用也是重要的功能之一。信息檢索的技術(shù)與方法57光盤信息檢索方法信息檢索的技術(shù)與方法586.3.4網(wǎng)絡(luò)信息檢索的技術(shù)與方法網(wǎng)絡(luò)信息檢索模式廣義:從根本上解決有效利用網(wǎng)絡(luò)信息資源問題的關(guān)鍵。如何對(duì)網(wǎng)絡(luò)上的海量多態(tài)信息進(jìn)行組織,如何對(duì)這些信息建立索引,如何對(duì)索引及時(shí)更新;如何設(shè)計(jì)檢索算法以使檢索提問在檢全、檢準(zhǔn)、響應(yīng)時(shí)間、檢索結(jié)果控制與顯示方面表現(xiàn)良好;如何為用戶設(shè)計(jì)一個(gè)簡單易用的友好界面。信息檢索的技術(shù)與方法586.3.4網(wǎng)絡(luò)信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法59網(wǎng)絡(luò)信息檢索模式狹義:在現(xiàn)實(shí)世界中有效利用網(wǎng)絡(luò)資源的核心只是以網(wǎng)絡(luò)(如互聯(lián)網(wǎng))為媒介,利用網(wǎng)上已提供的一些信息檢索工具,探索如何使用這些工具及如何綜合各工具,使它們揚(yáng)長避短,最后能實(shí)現(xiàn)對(duì)信息提問的檢索查詢的一種方法與技術(shù)。信息檢索的技術(shù)與方法59網(wǎng)絡(luò)信息檢索模式信息檢索的技術(shù)與方法606.4信息檢索的步驟與策略6.4.1信息檢索的步驟(1)分析檢索課題,明確信息需求明確信息檢索課題所涉及的領(lǐng)域和范圍;明確所需信息的內(nèi)容及其內(nèi)容特征;明確所需信息的類型,包括文獻(xiàn)媒體、出版類型、所需文獻(xiàn)量、年代范圍、涉及的語種、有關(guān)著者及機(jī)構(gòu)等;明確信息檢索課題對(duì)查新、查準(zhǔn)和查全的指標(biāo)要求。信息檢索的步驟與策略606.4信息檢索的步驟與策略信息檢索的步驟與策略61(2)選擇檢索工具,了解檢索系統(tǒng)信息檢索工具是人們?yōu)榱顺浞?、?zhǔn)確、有效地利用已有的信息資源而加工編制的用來報(bào)道、揭示、存貯和查找信息資源的卡片、表冊(cè)、計(jì)算機(jī)信息系統(tǒng)和特定出版物。(3)確定檢索途經(jīng),選定檢索方法每一種信息檢索方法都有自己的特點(diǎn),在實(shí)踐中可以根據(jù)信息檢索要求選擇使用或配合使用,以快速、準(zhǔn)確地完成信息檢索任務(wù),實(shí)現(xiàn)預(yù)期的目標(biāo)。信息檢索的步驟與策略61(2)選擇檢索工具,了解檢索系統(tǒng)信息檢索的步驟與策略62(4)掌握獲取原始信息的線索在獲取信息線索時(shí)要仔細(xì)閱讀,判斷所檢出的信息是否符合檢索的要求,不僅看篇名,還要閱讀整個(gè)著錄格式,進(jìn)行綜合分析。(5)獲取原始信息判斷文獻(xiàn)的出版類型。整理文獻(xiàn)出處。根據(jù)出版類型在圖書館或信息機(jī)構(gòu)查找館藏目錄或聯(lián)合目錄確定館藏。盡可能多渠道、多方式地獲取原始信息。

信息檢索的步驟與策略62(4)掌握獲取原始信息的線索信息檢索的步驟與策略636.4.2信息檢索策略

檢索策略是科學(xué)地運(yùn)用檢索詞和邏輯運(yùn)算符正確地構(gòu)造邏輯提問式的原則和方法。其核心內(nèi)容在于檢索策略的構(gòu)造與檢索的步驟。

常用信息檢索策略包括:分塊概念組配檢索策略、逐步組配檢索策略、對(duì)偶組配檢索策略、增長組配檢索策略等。

信息檢索的步驟與策略636.4.2信息檢索策略信息檢索的步驟與策略646.4.3信息檢索語言

信息檢索語言就是信息組織和信息檢索時(shí)所使用的語言(包括自然語言)。

信息檢索語言是文獻(xiàn)信息標(biāo)引的規(guī)則和標(biāo)準(zhǔn),標(biāo)引人員可用它來標(biāo)引文獻(xiàn)以便將文獻(xiàn)整理、加工、存儲(chǔ)于檢索系統(tǒng)中,同時(shí),檢索人員可用它來表達(dá)檢索課題信息的內(nèi)容,以便把特定文獻(xiàn)從檢索系統(tǒng)中檢索出來。因此,檢索語言就是一種把文獻(xiàn)的存儲(chǔ)與檢索聯(lián)系起來,把標(biāo)引人員和檢索人員溝通起來的約定人工語言。

信息檢索的步驟與策略646.4.3信息檢索語言信息檢索的步驟與策略65信息檢索語言主要功能:對(duì)文獻(xiàn)的信息內(nèi)容及其外表特征加以規(guī)范化的標(biāo)引。對(duì)內(nèi)容相同及相關(guān)的文獻(xiàn)信息加以集中或揭示其相關(guān)性可使文獻(xiàn)信息的存儲(chǔ)集中化、系統(tǒng)化、組織化,便于檢索者按一定的排列次序進(jìn)行有序化檢索。便于將標(biāo)引用語和檢索用語進(jìn)行相符性比較。信息檢索的步驟與策略65信息檢索語言主要功能:信息檢索的步驟與策略66信息檢索語言的作用信息檢索的步驟與策略66信息檢索語言的作用信息檢索的步驟與策略67信息檢索語言的分類信息檢索的步驟與策略67信息檢索語言的分類信息檢索的步驟與策略686.4.4信息檢索效率的評(píng)價(jià)

檢索效率是指全、準(zhǔn)、快、便、省(檢全率、檢準(zhǔn)率、檢索速度、檢索方便性、檢索成本與效益),最主要的是全和準(zhǔn)。在評(píng)價(jià)信息檢索效率過程中,主要通過檢全率、檢準(zhǔn)率、漏檢率和誤檢率四個(gè)評(píng)價(jià)指標(biāo)進(jìn)行評(píng)價(jià),其中重點(diǎn)是檢全率和檢準(zhǔn)率。

信息檢索的步驟與策略686.4.4信息檢索效率的評(píng)價(jià)信息檢索的步驟與策略69檢全率=檢出的相關(guān)文獻(xiàn)量/系統(tǒng)中的相關(guān)文獻(xiàn)總量檢準(zhǔn)率=檢出的相關(guān)文獻(xiàn)量/檢出的文獻(xiàn)總量漏檢率=未檢出的相關(guān)文獻(xiàn)量/系統(tǒng)中的相關(guān)文獻(xiàn)總量誤檢率=檢出的非相關(guān)文獻(xiàn)量/檢出的文獻(xiàn)總量

信息檢索的步驟與策略69檢全率=檢出的相關(guān)文獻(xiàn)量/系統(tǒng)中的相關(guān)文獻(xiàn)總量信息檢索的70信息檢索的步驟與策略檢全率與檢準(zhǔn)率的互逆相互曲線70信息檢索的步驟與策略檢全率與檢準(zhǔn)率的互逆相互曲線716.5網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索6.5.1網(wǎng)絡(luò)信息檢索特點(diǎn)信息豐富,檢索空間拓寬信息資源的異構(gòu)式分布檢索趨于簡單方便,適合非專業(yè)用戶網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索716.5網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索726.5.2網(wǎng)絡(luò)信息檢索工具非WEB檢索工具FTP類的檢索工具.如Archie(文檔查詢服務(wù))Telnet類的檢索工具.Gopher(菜單式檢索服務(wù))WEB檢索工具

關(guān)鍵詞檢索工具

目錄型檢索工具

混合型檢索工具網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索726.5.2網(wǎng)絡(luò)信息檢索工具網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索736.5.3搜索引擎及其應(yīng)用搜索引擎

是提供給用戶進(jìn)行關(guān)鍵詞、詞組或自然語言檢索的工具,簡言之,就是一種在互聯(lián)網(wǎng)上查找信息的工具?;竟ぷ髟?/p>

用戶提出檢索要求,搜索引擎代替用戶在數(shù)據(jù)庫中進(jìn)行檢索,并將檢索結(jié)果反饋給用戶。檢索的結(jié)果

WWW上的主頁、新聞組中的文章、軟件的存放地址及其作者、企業(yè)網(wǎng)站、個(gè)人主頁等。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索736.5.3搜索引擎及其應(yīng)用網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索74搜索引擎的分類綜合型獨(dú)立搜索引擎用戶可以利用此類工具檢索幾乎所有方面的網(wǎng)絡(luò)資源。垂直型獨(dú)立搜索引擎(專業(yè)、專用搜索引擎)專門收錄某一方面、某一行業(yè)或某一主題的信息,單一垂直搜索引擎、綜合型搜索引擎垂直化、門戶網(wǎng)站引擎垂直化網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索74搜索引擎的分類網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索75元搜索引擎

元搜索引擎又稱集合型搜索引擎,將多個(gè)單一搜索引擎集成在一起,提供統(tǒng)一的檢索界面,將用戶的檢索提問同時(shí)提交給多個(gè)獨(dú)立的搜索引擎,同時(shí)檢索多個(gè)數(shù)據(jù)庫;并根據(jù)多個(gè)獨(dú)立搜索引擎的檢索結(jié)果進(jìn)行二次加工,如對(duì)檢索結(jié)果去重、排序等,輸出給用戶。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索75元搜索引擎網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索76移動(dòng)搜索引擎移動(dòng)搜索是基于移動(dòng)網(wǎng)絡(luò)的搜索技術(shù)的總稱,用戶可以通過SMS(短信息)、WAP(無線應(yīng)用協(xié)議)、語音搜索等多種接入方式進(jìn)行搜索,獲取互聯(lián)網(wǎng)信息、移動(dòng)增值服務(wù)及本地信息等信息服務(wù)內(nèi)容。

網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索76移動(dòng)搜索引擎網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索77SMS搜索短信搜索是利用電信運(yùn)營商的短信服務(wù)平臺(tái)通過短信的方式向搜索引擎或數(shù)據(jù)系統(tǒng)發(fā)送搜索請(qǐng)求,搜索或查詢結(jié)果同樣通過短信的方式提供給用戶。示例:無線音樂短信搜索是中國移動(dòng)為您提供的最快捷的音樂搜索引擎。無需申請(qǐng),編輯短信就可以免費(fèi)獲取相關(guān)歌曲的彩鈴音樂、來電鈴聲音樂、音樂全曲相關(guān)內(nèi)容資源。

網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索77SMS搜索網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索78WAP搜索基于無線網(wǎng)絡(luò)引用協(xié)議的移動(dòng)搜索,用戶通過移動(dòng)終端登錄搜索引擎進(jìn)行相關(guān)內(nèi)容的搜索,訪問的多為移動(dòng)網(wǎng)站。

網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索78WAP搜索網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索79IVR網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索79IVR網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索806.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢多媒體信息檢索多媒體:把不同的但相互關(guān)聯(lián)的媒體集成在一起而產(chǎn)生的一種存儲(chǔ)、傳播和表現(xiàn)信息的載體,通常包括文本、音頻、圖形、圖像、動(dòng)畫和視頻。多媒體信息:是各種媒體的組合體,即將音頻、視頻、圖像和計(jì)算機(jī)技術(shù)、通信技術(shù)集成到同一數(shù)字環(huán)境中,以協(xié)同表示更豐富和復(fù)雜的信息。多媒體信息檢索是根據(jù)用戶的要求,對(duì)圖形、圖像、文本、聲音、動(dòng)畫等多媒體信息進(jìn)行檢索,得到用戶所需的信息。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索806.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索816.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢跨語言信息檢索跨語言檢索即可用一種提問語言檢索出用另一種語言書寫的信息,也就是一種跨越語言界限進(jìn)行檢索的問題??缯Z言信息檢索研究涉及了語言學(xué)、情報(bào)學(xué)、計(jì)算機(jī)科學(xué)等多門學(xué)科知識(shí),是一個(gè)綜合性強(qiáng)、嶄新的研究領(lǐng)域??缯Z言檢索技術(shù)的實(shí)現(xiàn)應(yīng)用了信息檢索、文字處理、和機(jī)器翻譯等技術(shù),如文字切分技術(shù)、詞匯翻譯、詞頻技術(shù)、索引技術(shù)等。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索816.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索826.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢智能信息檢索智能信息檢索能理解自然語言,允許用自然語言提出各種詢問。具有推理能力,能根據(jù)存儲(chǔ)的事實(shí),演繹出所需的答案。智能信息檢索系統(tǒng)應(yīng)具有如下的功能:允許用自然語言提出各種詢問;具有推理能力,能根據(jù)存儲(chǔ)的事實(shí),演繹出所需答案;系統(tǒng)具有一定常識(shí)性知識(shí),以補(bǔ)充學(xué)科范圍的專業(yè)知識(shí)。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索826.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索836.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢信息檢索可視化信息檢索可視化是信息可視化技術(shù)在信息檢索中的應(yīng)用,是指把文獻(xiàn)信息、用戶提問、各類情報(bào)檢索模型以及利用檢索模型進(jìn)行信息檢索的過程中不可見的內(nèi)部語義關(guān)系轉(zhuǎn)換成圖形,在一個(gè)二維或三維的可視化空間中顯示出來,并向用戶提供信息檢索的技術(shù)。網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索836.5.4網(wǎng)絡(luò)信息檢索發(fā)展趨勢網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索84WEB2.0環(huán)境下的信息檢索網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索84WEB2.0環(huán)境下的信息檢索網(wǎng)絡(luò)應(yīng)用:網(wǎng)絡(luò)信息檢索851.信息檢索的基本原理是什么?2.信息檢索包括哪些主要步驟?作業(yè)851.信息檢索的基本原理是什么?作業(yè)信息檢索主講人:孫祥經(jīng)濟(jì)信息管理教研室信息檢索Page

87第六章信息檢索信息檢索的基本概念與原理信息檢索的發(fā)展歷程信息檢索的技術(shù)與方法信息檢索的步驟與策略網(wǎng)絡(luò)信息檢索Page2第六章信息檢索信息檢索的基本概念與原理Page

88內(nèi)容提要本章介紹了信息檢索的基本概念和原理,并以信息技術(shù)發(fā)展為主線,梳理了信息檢索的發(fā)展歷程及階段,討論了信息檢索的步驟和策略的制定,以及信息檢索語言和信息檢索效率評(píng)價(jià),同時(shí)介紹了網(wǎng)絡(luò)信息檢索的特點(diǎn)及網(wǎng)絡(luò)檢索工具。第六章信息檢索Page3內(nèi)容提要第六章信息檢索Page

89學(xué)習(xí)重點(diǎn)

掌握信息檢索的基本概念和原理,掌握信息檢索的步驟和策略,熟悉信息檢索的發(fā)展歷程和網(wǎng)絡(luò)信息檢索的特點(diǎn)。第六章信息檢索Page4學(xué)習(xí)重點(diǎn)第六章信息檢索906.1信息檢索的基本概念和原理6.1.1信息檢索的含義

為什么要學(xué)習(xí)信息檢索,掌握信息檢索工具的使用?

可以充分發(fā)揮人類知識(shí)寶庫的作用,有利于開發(fā)智力資源;

協(xié)助有關(guān)人員選擇正確的科技策略,提高效率、減少人力或投資方面的浪費(fèi);

可以節(jié)省科技人員的寶貴時(shí)間;

促進(jìn)專業(yè)學(xué)習(xí)。信息檢索的基本概念和原理56.1信息檢索的基本概念和原理6.1.1信息檢索的含義91信息檢索的概念(廣義)將信息按一定的方式組織和存儲(chǔ)起來,并根據(jù)用戶的需要檢出所需信息的過程。(狹義,單從信息用戶的角度)從已存儲(chǔ)的信息資源中找出與用戶提問相關(guān)的文獻(xiàn)、知識(shí)、事實(shí)、數(shù)據(jù)的邏輯運(yùn)算和技術(shù)操作過程。信息檢索的基本概念和原理6信息檢索的概念信息檢索的基本概念和原理92信息檢索的本質(zhì)

匹配,將用戶提問與信息集合中的數(shù)據(jù)進(jìn)行比較和選擇的結(jié)果。信息檢索的基本概念和原理

提問(檢索)語言

文獻(xiàn)標(biāo)識(shí)語言匹配7信息檢索的本質(zhì)信息檢索的基本概念和原理提問(檢索)93信息檢索的基本特征有確定的目標(biāo);有一個(gè)可能的信息解的集合;有一定的線索可依;搜索的過程是針對(duì)一定的目標(biāo)、遵循一定的線索、不斷縮小搜索范圍的求解過程。信息檢索的基本概念和原理8信息檢索的基本特征信息檢索的基本概念和原理94信息檢索的兩個(gè)子系統(tǒng)信息檢索的基本概念和原理9信息檢索的兩個(gè)子系統(tǒng)信息檢索的基本概念和原理956.1.2信息檢索的分類

按照內(nèi)容劃分文獻(xiàn)檢索(DocumentRetrieval)數(shù)據(jù)檢索(DataRetrieval)事實(shí)檢索(FactRetrieval)信息檢索的基本概念和原理106.1.2信息檢索的分類信息檢索的基本概96文獻(xiàn)檢索文獻(xiàn)檢索是以文獻(xiàn)為檢索對(duì)象的一種檢索,凡是查找某一主題、某一學(xué)科、某一著者的有關(guān)文獻(xiàn)均屬于文獻(xiàn)檢索的范疇。文獻(xiàn)檢索是相關(guān)性檢索,即檢索系統(tǒng)不直接解答用戶所提出的技術(shù)問題本身,只提供與之相關(guān)的文獻(xiàn)供用戶參考。如:查找經(jīng)濟(jì)信息處理流程方面的相關(guān)論文.信息檢索的基本概念和原理11文獻(xiàn)檢索信息檢索的基本概念和原理97注意:

信息檢索(InformationRetrieval)與文獻(xiàn)檢索(DocumentRetrieval)是兩個(gè)不同的概念,文獻(xiàn)檢索是信息檢索的一種最基本的、最主要的形式。信息檢索的基本概念和原理12注意:信息檢索的基本概念和原理98數(shù)據(jù)檢索(DataRetrieval):是以數(shù)據(jù)為檢索對(duì)象,從已收藏?cái)?shù)據(jù)資料中查找出特定數(shù)據(jù)的過程。數(shù)據(jù)檢索是一種確定性檢索,系統(tǒng)要直接回答用戶提出的問題,即直接提供用戶所需要的確切的數(shù)據(jù)。如:某種材料的電阻;某變壓器的參數(shù);化學(xué)分子式、數(shù)據(jù)圖表等。信息檢索的基本概念和原理13數(shù)據(jù)檢索(DataRetrieval):信息檢索的基本99事實(shí)檢索(FactRetrieval)事實(shí)檢索即通過對(duì)信息集合中已有的基本事實(shí)或數(shù)據(jù)進(jìn)行處理(邏輯推理),然后得出新的(即未直接存入信息集合中的)事實(shí)的過程。如:某產(chǎn)品是哪個(gè)廠家生產(chǎn),第一顆人造衛(wèi)星是什么時(shí)候升空的,按高考分?jǐn)?shù)劃分,每個(gè)段的新生有多少人?信息檢索的基本概念和原理14事實(shí)檢索(FactRetrieval)信息檢索的基本100數(shù)據(jù)和事實(shí)檢索是要檢索出包含在文獻(xiàn)中的具體情報(bào);文獻(xiàn)檢索則是要檢索出包含所需情報(bào)的文獻(xiàn)。信息檢索的基本概念和原理15信息檢索的基本概念和原理101按照信息的組織方式劃分全文檢索多媒體檢索超媒體檢索依信息存儲(chǔ)與檢索方式劃分手工檢索計(jì)算機(jī)檢索信息檢索的基本概念和原理16按照信息的組織方式劃分信息檢索的基本概念和原理102信息檢索的特性信息檢索的相關(guān)性相關(guān)性表明用戶是否認(rèn)為一文獻(xiàn)與一提問吻合。信息檢索的不確定性標(biāo)引的不確定性是指不同標(biāo)引員在給同一篇信息對(duì)象進(jìn)行標(biāo)引時(shí)會(huì)選用不同的標(biāo)引詞,即標(biāo)引詞選用的不一致性。檢索詞選用的不確定性是指候選檢索詞集不止一個(gè),檢索過程具有試探性。信息檢索的邏輯性檢索語言、檢索策略(處理信息檢索提問的邏輯與查找步驟的科學(xué)安排)信息檢索的基本概念和原理17信息檢索的特性信息檢索的基本概念和原理1036.1.3信息檢索的基本原理

對(duì)信息資源集合與信息需求集合的匹配和選擇。一方面是用戶的信息需求,一方面是組織有序的文獻(xiàn)信息集合,檢索就是從用戶特定的信息需求出發(fā),對(duì)特定的信息集合采用一定的方法、技術(shù)手段,根據(jù)一定的線索與規(guī)則從中找出相關(guān)的信息。匹配有其匹配標(biāo)準(zhǔn),這里涉及到兩者一致性、相關(guān)度等問題,按一定的標(biāo)準(zhǔn)篩選出符合要求的信息。信息檢索的基本概念和原理186.1.3信息檢索的基本原理信息檢索的基本概念和原理1046.1.4信息檢索的模型布爾邏輯檢索模型向量空間檢索模型概率檢索模型

模糊檢索模型信息檢索的基本概念和原理196.1.4信息檢索的模型信息檢索的基本概念和原理105信息檢索的模型信息檢索的模型,就是運(yùn)用數(shù)學(xué)的語言和工具,對(duì)信息檢索系統(tǒng)中的信息及其處理過程加以翻譯和抽象,表述為某種數(shù)學(xué)公式,再經(jīng)過演繹、推斷、解釋和實(shí)際檢驗(yàn),反過來指導(dǎo)信息檢索實(shí)踐。信息檢索的基本概念和原理20信息檢索的模型信息檢索的基本概念和原理106信息檢索模型的組成(1)用戶的需求表示:用戶查詢的獲取與表示。(2)文檔的表示:文檔內(nèi)容的識(shí)別與表示。(3)匹配機(jī)制:用戶需求表示與文檔表示之間的查詢機(jī)制,以及它們之間相關(guān)性排序的準(zhǔn)則和函數(shù)表示。(4)反饋修正:對(duì)檢索結(jié)果進(jìn)行優(yōu)化。信息檢索的基本概念和原理21信息檢索模型的組成信息檢索的基本概念和原理107布爾檢索(精確匹配檢索)假設(shè)檢索到的集合中,所有文檔關(guān)于相關(guān)性都是等價(jià)的,也假設(shè)了相關(guān)性是二元的。對(duì)于檢索評(píng)價(jià)有2種輸出結(jié)果:TRUEandFALSE查詢項(xiàng)被描述為布爾邏輯操作符

AND,OR,NOT例一個(gè)文檔當(dāng)且僅當(dāng)它能夠滿足布爾查詢式時(shí),才將其檢索出來信息檢索的基本概念和原理22布爾檢索(精確匹配檢索)信息檢索的基本概念和原理108小例子簡單查詢項(xiàng)為“林肯”,會(huì)返回大量包含林肯汽車和林肯總統(tǒng)的文檔。不管“林肯”這個(gè)詞出現(xiàn)多少次,也不管上下文,所有這些文檔根據(jù)布爾檢索模型的排序性質(zhì)都是等價(jià)的。查詢項(xiàng)“總統(tǒng)AND林肯”,會(huì)返回一組同時(shí)包含這兩個(gè)查詢?cè)~的文檔查詢項(xiàng)“總統(tǒng)AND林肯ANDNot(汽車OR轎車)”,會(huì)去除包含“汽車OR轎車”的文檔信息檢索的基本概念和原理23小例子信息檢索的基本概念和原理109優(yōu)點(diǎn)簡單、易于理解;能處理結(jié)構(gòu)化查詢,易于表示同義關(guān)系和詞組;速度快。缺點(diǎn)嚴(yán)格,使用的限制性強(qiáng);結(jié)果不易控制;難以進(jìn)行定量比較;無法滿足特殊查詢。信息檢索的基本概念和原理24優(yōu)點(diǎn)信息檢索的基本概念和原理110向量空間模型相比于布爾模型要求的準(zhǔn)確匹配,Salton在60年代末提出的向量空間模型采用了“部分匹配”的檢索策略(即:出現(xiàn)部分索引詞也可以出現(xiàn)在檢索結(jié)果中);這個(gè)模型對(duì)于查詢與文檔的相關(guān)度有較強(qiáng)的可計(jì)算性和可操作性,并且被廣泛應(yīng)用于文本檢索、自動(dòng)文摘、關(guān)鍵詞自動(dòng)提取、文本分類等方面。信息檢索的基本概念和原理25向量空間模型信息檢索的基本概念和原理111優(yōu)點(diǎn)使得對(duì)查詢向量中關(guān)鍵詞權(quán)重的賦值成為可能;可根據(jù)相似度大小對(duì)查詢結(jié)果進(jìn)行排序并控制輸出數(shù)量;相比布爾模型要求的準(zhǔn)確匹配,VSM模型采用“部分匹配”檢索策略。實(shí)驗(yàn)表明:向量空間模型比布爾模型檢索效果更好。信息檢索的基本概念和原理26優(yōu)點(diǎn)信息檢索的基本概念和原理112缺點(diǎn)在模型中,特征項(xiàng)被假設(shè)為相互獨(dú)立,而實(shí)際上一個(gè)文檔中的特征項(xiàng)之間可能存著一定的聯(lián)系;不能像布爾模型一樣支持布爾結(jié)構(gòu)化查詢;基于向量空間模型的檢索系統(tǒng)較基于布爾模型的檢索系統(tǒng)而言,要復(fù)雜得多,在大型商業(yè)檢索系統(tǒng)中使用較少。信息檢索的基本概念和原理27缺點(diǎn)信息檢索的基本概念和原理113概率模型概率排序原則-Robertson(1977)如果一個(gè)參考檢索排序系統(tǒng)對(duì)每個(gè)查詢的反饋都是數(shù)據(jù)集中所有文檔根據(jù)和用戶查詢的相關(guān)性概率值降序排序的結(jié)果并且其中的概率值都被盡可能精確地估計(jì)出來那么該系統(tǒng)對(duì)于用戶的整體效果就是基于這些數(shù)據(jù)能夠獲得的最好結(jié)果給定一個(gè)新的文檔,搜索引擎的任務(wù)是判定這個(gè)文檔是否屬于相關(guān)文檔集合或者非相關(guān)集合。也就是說,系統(tǒng)應(yīng)該判斷文檔是相關(guān)的還是非相關(guān)的,如果相關(guān)就返回文檔。信息檢索的基本概念和原理28概率模型信息檢索的基本概念和原理114優(yōu)點(diǎn)文檔可以按照他們相關(guān)概率遞減的順序來排序。缺點(diǎn)開始時(shí)需要猜想把文檔分為相關(guān)和不相關(guān)的兩個(gè)集合,一般來說很難實(shí)際上這種模型沒有考慮索引術(shù)語在文檔中的頻率(因?yàn)樗械臋?quán)重都是二值的)假設(shè)索引詞獨(dú)立信息檢索的基本概念和原理29優(yōu)點(diǎn)信息檢索的基本概念和原理1156.2信息檢索的發(fā)展歷程手工信息檢索階段機(jī)械信息檢索階段計(jì)算機(jī)信息檢索階段網(wǎng)絡(luò)信息檢索階段信息檢索的發(fā)展歷程306.2信息檢索的發(fā)展歷程信息檢索的發(fā)展歷程1166.2.1手工信息檢索階段信息檢索起源于參考咨詢工作,參考咨詢工作產(chǎn)生的標(biāo)志是1876年召開的美國圖書館協(xié)會(huì)第一屆大會(huì)。1883年,波士頓公共圖書館首次設(shè)置了專職參考館員和參考閱覽室;20世紀(jì)初,多數(shù)圖書館成立了參考咨詢部門,主要利用圖書館的書目工具來幫助讀者查找圖書、期刊或現(xiàn)成答案。逐漸發(fā)展到從多種文獻(xiàn)源中查找、分析、評(píng)價(jià)和重新組織信息;“索引”突破了以前的狹隘范疇,成為獨(dú)立的檢索工具;信息檢索的發(fā)展歷程316.2.1手工信息檢索階段信息檢索的發(fā)展歷程11740年代進(jìn)一步包括回答事實(shí)性咨詢,編制書目、文摘,進(jìn)行專題文獻(xiàn)檢索,提供文獻(xiàn)代譯等?!靶畔z索”從此成為一項(xiàng)獨(dú)立的用戶服務(wù)工作,并逐漸從單純的經(jīng)驗(yàn)工作向?qū)I(yè)化方向發(fā)展。信息檢索的發(fā)展歷程3240年代進(jìn)一步包括回答事實(shí)性咨詢,編制書1186.2.2機(jī)械信息檢索階段機(jī)械信息檢索兩種基本類型機(jī)電信息檢索系統(tǒng)光電信息檢索系統(tǒng)

機(jī)械信息檢索并沒有發(fā)展信息檢索語言,只是采用單一的方法對(duì)固定的存貯形式進(jìn)行檢索,而且過分依賴于設(shè)備,檢索復(fù)雜,成本較高,檢索效率和質(zhì)量都不理想。信息檢索的發(fā)展歷程336.2.2機(jī)械信息檢索階段信息檢索的發(fā)展歷程1196.2.3計(jì)算機(jī)信息檢索階段1971年以前建立的信息檢索系統(tǒng),是傳統(tǒng)的批處理檢索方式。1971年以后,產(chǎn)生并發(fā)展的聯(lián)機(jī)信息檢索系統(tǒng),如OCLC、Dialog在線數(shù)據(jù)庫聯(lián)機(jī)檢索系統(tǒng)。信息檢索的發(fā)展歷程346.2.3計(jì)算機(jī)信息檢索階段信息檢索的發(fā)展歷程1206.2.4網(wǎng)絡(luò)信息檢索階段20世紀(jì)90年代以來,產(chǎn)生并發(fā)展的網(wǎng)絡(luò)信息檢索階段。信息檢索的發(fā)展歷程356.2.4網(wǎng)絡(luò)信息檢索階段信息檢索的發(fā)展歷程1216.3信息檢索的技術(shù)與方法信息檢索技術(shù)兩個(gè)發(fā)展方向:傳統(tǒng)信息檢索向全文文本、多媒體、多載體等新型信息檢索的發(fā)展,在深度上提高管理和組織信息的能力;信息資源的網(wǎng)絡(luò)化和分布化,面向互聯(lián)網(wǎng)中海量的信息資源,在廣度上提高管理和組織的能力。信息檢索的技術(shù)與方法366.3信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法1226.3信息檢索的技術(shù)與方法從檢索手段看,信息檢索分為:手工信息檢索機(jī)械信息檢索計(jì)算機(jī)信息檢索網(wǎng)絡(luò)信息檢索信息檢索的技術(shù)與方法376.3信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法1236.3.1手工信息檢索的技術(shù)與方法手工信息檢索工具主要是各種類型的工具書。工具書是根據(jù)一定的需要,比較完備地匯集某一方面的資料,并按特定的方法加以編排,專供讀者查考檢索有關(guān)知識(shí)、資料、事實(shí)的書籍。據(jù)工具書的體例和功能,可分為檢索型工具書、參考性工具書、詞語性工具書、表譜性工具書、圖錄性工具書和邊緣性工具書6種類型。信息檢索的技術(shù)與方法386.3.1手工信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法124手工信息檢索工具目錄:它是圖書、期刊等單位出版物外表特征的揭示和報(bào)道,它以一個(gè)完整的出版或收藏單位為著錄的基本單位,多按類或題名編排,強(qiáng)調(diào)有具體的收藏單位。是以某一“種”文獻(xiàn)為一個(gè)記錄款目。包括:國家書目、出版社目錄、館藏目錄、專題目錄、聯(lián)合目錄等。信息檢索的技術(shù)與方法39手工信息檢索工具信息檢索的技術(shù)與方法125索引:是對(duì)一組文獻(xiàn)集合有系統(tǒng)的指引。一般只起指引特定信息內(nèi)容及其存儲(chǔ)地址的作用。是檢索工具的輔助工具。它對(duì)文獻(xiàn)的外表特征和內(nèi)容特征用各種檢索標(biāo)識(shí)符(字母、數(shù)字、漢字等)進(jìn)行描述,并將它們按一定的規(guī)則及排列方式組織起來,然后用文摘號(hào)來注明它在文獻(xiàn)信息集合中的位。信息檢索的技術(shù)與方法40索引:信息檢索的技術(shù)與方法126文摘它也是以“篇”為著錄單元,但卻是在對(duì)文獻(xiàn)外部特征進(jìn)行著錄的基礎(chǔ)上,還將文獻(xiàn)的內(nèi)容加以濃縮,以最精煉最概括的文字報(bào)道文獻(xiàn)的主題、方法和結(jié)論,并將這些外部特征和內(nèi)容摘要的記錄按一定順序排列起來所形成的一種文獻(xiàn)檢索工具。它是檢索工具的主體,二次文獻(xiàn)的核心。信息檢索的技術(shù)與方法41文摘信息檢索的技術(shù)與方法127文摘按其目的和用途可分為:●指示性文摘這是旨在把原文的主題范圍、目的和方法概括的指示給讀者的一種文摘,幫助讀者判斷原文是否與自己相關(guān)以及是否需要閱讀原文。字?jǐn)?shù)一般限制在幾十個(gè)字(中文50~100個(gè)字,外文30~50個(gè)詞),也有人將其稱為簡介或簡介性文摘。閱讀指示性文摘不能代表原文。信息檢索的技術(shù)與方法42文摘按其目的和用途可分為:信息檢索的技術(shù)與方法128報(bào)道性文摘

又稱敘述性文摘,它是用來概括原文的內(nèi)容要點(diǎn),向讀者提供原文中的定量信息和定性信息的一種文摘,基本能反映原文的技術(shù)內(nèi)容,一般數(shù)字為200~300字(西文250個(gè)實(shí)詞)。評(píng)論性文摘評(píng)論性文摘插入有文摘員個(gè)人的看法或分析,評(píng)論性文摘的價(jià)值如何,主要取決于文摘員的專業(yè)水平。信息檢索的技術(shù)與方法43報(bào)道性文摘信息檢索的技術(shù)與方法129年鑒

年鑒是以全面、系統(tǒng)、準(zhǔn)確地記述上年度事物運(yùn)動(dòng)、發(fā)展?fàn)顩r為主要內(nèi)容的資料性工具書。匯輯一年內(nèi)的重要時(shí)事、文獻(xiàn)和統(tǒng)計(jì)資料,按年度連續(xù)出版的工具書。它具有資料權(quán)威、反應(yīng)及時(shí)、連續(xù)出版、功能齊全的特點(diǎn)。屬信息密集型工具書。信息檢索的技術(shù)與方法44年鑒信息檢索的技術(shù)與方法130手冊(cè)手冊(cè)是匯集某一學(xué)科或某一主題等需要經(jīng)常查考的資料,供讀者隨時(shí)翻檢的工具書。手冊(cè)的類型:數(shù)據(jù)性手冊(cè)條目性手冊(cè)圖表性手冊(cè)綜合性手冊(cè)信息檢索的技術(shù)與方法45手冊(cè)信息檢索的技術(shù)與方法131百科全書

百科全書是概要記述人類一切知識(shí)門類或某一知識(shí)門類的工具書。

信息檢索的技術(shù)與方法46百科全書信息檢索的技術(shù)與方法132手工信息檢索工具的排檢技術(shù)字順排檢技術(shù):將檢索工具的內(nèi)容按字、詞的一定順序或規(guī)律,有系統(tǒng)地組織排列起來的技術(shù)。分類排檢技術(shù):將信息素材按學(xué)科或事物性質(zhì)系統(tǒng)地加以排列。主題排檢技術(shù):以規(guī)范化的自然語言為標(biāo)識(shí)符號(hào)來標(biāo)引信息內(nèi)容的排檢技術(shù)。時(shí)序排檢技術(shù):按時(shí)間的順序組合信息素材的技術(shù),多用于編制年表、年譜等檢索工具。如:《國內(nèi)外大事記》地序排檢技術(shù):按一定時(shí)期的行政區(qū)域來排列信息素材的技術(shù)。如:《中國名勝詞典》

信息檢索的技術(shù)與方法47手工信息檢索工具的排檢技術(shù)信息檢索的技術(shù)與方法133手工信息檢索方法順查法:時(shí)間上,由遠(yuǎn)至近,查全率高,費(fèi)時(shí)費(fèi)力。倒查法:時(shí)間上,由近至遠(yuǎn),查準(zhǔn)率高,漏檢率高。抽查法:集中于學(xué)科的興旺階段,檢索效率高。追溯法:

A.一次文獻(xiàn)參考文獻(xiàn)一次信息參考文獻(xiàn)……由近至遠(yuǎn)

B.一次文獻(xiàn)引用該一次信息的文獻(xiàn)新的一次文獻(xiàn)……實(shí)際是由“遠(yuǎn)近”越查文獻(xiàn)越新,擴(kuò)大信息源,效率低,檢全率低,漏檢率高。信息檢索的技術(shù)與方法48手工信息檢索方法信息檢索的技術(shù)與方法134循環(huán)法:先利用檢索工具查出一批有用文獻(xiàn),然后再利用這些文獻(xiàn)末尾所附參考文獻(xiàn)的線索進(jìn)行追溯查找。信息檢索的技術(shù)與方法49循環(huán)法:先利用檢索工具查出一批有用文獻(xiàn),然后再利用這些文1356.3.2機(jī)械信息檢索的技術(shù)與方法機(jī)電信息檢索系統(tǒng)繼手檢穿孔卡片之后,出現(xiàn)了機(jī)檢穿孔卡片和選卡機(jī)。這就形成了機(jī)電信息檢索系統(tǒng)。光電信息檢索系統(tǒng)主要是以縮微膠卷(片)檢索方式出現(xiàn)的??s微膠卷(片)的檢索方式大致可以分為兩種類型:①尋址檢索方式②編碼檢索方式信息檢索的技術(shù)與方法506.3.2機(jī)械信息檢索的技術(shù)與方法信息檢索的技術(shù)與方1366.3.3計(jì)算機(jī)信息檢索的技術(shù)與方法聯(lián)機(jī)信息檢索信息用戶利用終端設(shè)備,通過通訊網(wǎng)絡(luò)與世界各地的信息檢索系統(tǒng)聯(lián)機(jī),進(jìn)行人機(jī)對(duì)話,從檢索系統(tǒng)的數(shù)據(jù)庫中查找出用戶所需信息的全過程。優(yōu)點(diǎn):①檢索速度快;②檢索范圍廣而全面;③檢索途徑多、質(zhì)量高;④檢索內(nèi)容新、實(shí)時(shí)性強(qiáng);⑤檢索輔助功能完善、使用方便,檢索結(jié)果輸出方式靈活、實(shí)用。缺陷:①主機(jī)負(fù)擔(dān)重,一旦出現(xiàn)故障,則整個(gè)網(wǎng)絡(luò)都將癱瘓;②信息組織方式以線性為主,不夠靈活;③聯(lián)機(jī)檢索不像Internet是面向最終用戶的,操作也沒有后者方便。信息檢索的技術(shù)與方法516.3.3計(jì)算機(jī)信息檢索的技術(shù)與方法信息檢索的技術(shù)與方137聯(lián)機(jī)信息檢索系統(tǒng)的結(jié)構(gòu)

由檢索服務(wù)機(jī)構(gòu)(聯(lián)機(jī)存取中心)、國際通訊網(wǎng)絡(luò)及終端三部分構(gòu)成。

終端設(shè)備用于輸入檢索程序、顯示檢索過程、控制打印檢索結(jié)果。

通訊網(wǎng)絡(luò)用于實(shí)現(xiàn)遠(yuǎn)程人機(jī)對(duì)話。

檢索服務(wù)機(jī)構(gòu)(聯(lián)機(jī)存取中心)是存儲(chǔ)和檢索信息的核心。由中央計(jì)算機(jī)、數(shù)據(jù)庫檢索與管理軟件、聯(lián)機(jī)數(shù)據(jù)庫以及相應(yīng)的檢索服務(wù)體制組成。信息檢索的技術(shù)與方法52聯(lián)機(jī)信息檢索系統(tǒng)的結(jié)構(gòu)信息檢索的技術(shù)與方法138聯(lián)機(jī)信息檢索的技術(shù)原理一個(gè)典型的計(jì)算機(jī)信息系統(tǒng),能完成數(shù)據(jù)收集、分析、加工處理、存儲(chǔ)、傳遞通信和檢索信息的全過程。聯(lián)機(jī)信息檢索的服務(wù)方式定題信息提供(SDI)專題回溯檢索(RS)聯(lián)機(jī)訂購原文電子郵件信息檢索的技術(shù)與方法53聯(lián)機(jī)信息檢索的技術(shù)原理信息檢索的技術(shù)與方法139我國聯(lián)機(jī)存取服務(wù)始于1974年,比較有影響的聯(lián)機(jī)存取系統(tǒng)有:

(1)萬方數(shù)據(jù)資源系統(tǒng)

/(2)CNKI數(shù)據(jù)資源系統(tǒng)

(3)維普數(shù)據(jù)資訊系統(tǒng)

/信息檢索的技術(shù)與方法54我國聯(lián)機(jī)存取服務(wù)始于1974年,比較有影140光盤信息檢索光盤信息檢索的特點(diǎn):光盤存貯容量大、耐用。檢索成本低。一次購買可多次使用,節(jié)省了電訊費(fèi)和聯(lián)機(jī)系統(tǒng)使用費(fèi)。操作簡單,檢索效果好。用戶按提示或幫助功能使用檢索系統(tǒng)。運(yùn)行速度快。單機(jī)檢索,不受線路影響。安全性能高。只讀光盤,一般局域網(wǎng)用戶使用。信息檢索的技術(shù)與方法55光盤信息檢索信息檢索的技術(shù)與方法141光盤信息檢索的缺陷:如果光盤數(shù)據(jù)庫量不夠多,則信息資源就顯得有限,購買大量光盤數(shù)據(jù)庫,又要受到經(jīng)費(fèi)限制更新周期長。一般的光盤數(shù)據(jù)庫更新要1個(gè)月或更長,而網(wǎng)絡(luò)數(shù)據(jù)庫的更新周期一般是1周或更短。檢索時(shí)需不斷換盤。一個(gè)大型數(shù)據(jù)庫,一般都是幾張光盤,特別是全文數(shù)據(jù)庫,如中國學(xué)術(shù)期刊全文光盤數(shù)據(jù)庫,每年都有一百多張光盤,檢索時(shí)需要不斷更換光盤。信息檢索的技術(shù)與方法56光盤信息檢索的缺陷:信息檢索的技術(shù)與方法142光盤信息檢索方法光盤檢索系統(tǒng)的功能和指令與聯(lián)機(jī)檢索沒有很大區(qū)別,但更方便。功能鍵:Help(幫助)、Index(索引)、History(查閱歷史)、Display(顯示)、Print(打印)、SelectDatabase(選擇數(shù)據(jù)庫)、FormatWindow(格式窗)、Quit(退出)等。檢索信息時(shí)可用單元詞、多元詞(短語)、數(shù)字及布爾運(yùn)算符和位置運(yùn)算符把幾個(gè)檢索術(shù)語組配成一個(gè)提問邏輯式。用戶可以在任何時(shí)刻回顧其查找的歷史,重新使用或修改以前的任何提問。屏幕幫助是光盤數(shù)據(jù)庫最常用也是重要的功能之一。信息檢索的技術(shù)與方法57光盤信息檢索方法信息檢索的技術(shù)與方法1436.3.4網(wǎng)絡(luò)信息檢索的技術(shù)與方法網(wǎng)絡(luò)信息檢索模式廣義:從根本上解決有效利用網(wǎng)絡(luò)信息資源問題的關(guān)鍵。如何對(duì)網(wǎng)絡(luò)上的海量多態(tài)信息進(jìn)行組織,如何對(duì)這些信息建立索引,如何對(duì)索引及時(shí)更新;如何設(shè)計(jì)檢索算法以使檢索提問在檢全、檢準(zhǔn)、響應(yīng)時(shí)間、檢索結(jié)果控制與顯示方面表現(xiàn)良好;如何為用戶設(shè)計(jì)一個(gè)簡單易用的友好界面。信息檢索的技術(shù)與方法586.3.4網(wǎng)絡(luò)信息檢索的技術(shù)與方法信息檢索的技術(shù)與方法144網(wǎng)絡(luò)信息檢索模式狹義:在現(xiàn)實(shí)世界中有效利用網(wǎng)絡(luò)資源的核心只是以網(wǎng)絡(luò)(如互聯(lián)網(wǎng))為媒介,利用網(wǎng)上已提供的一些信息檢索工具,探索如何使用這些工具及如何綜合各工具,使它們揚(yáng)長避短,最后能實(shí)現(xiàn)對(duì)信息提問的檢索查詢的一種方法與技術(shù)。信息檢索的技術(shù)與方法59網(wǎng)絡(luò)信息檢索模式信息檢索的技術(shù)與方法1456.4信息檢索的步驟與策略6.4.1信息檢索的步驟(1)分析檢索課題,明確信息需求明確信息檢索課題所涉及的領(lǐng)域和范圍;明確所需信息的內(nèi)容及其內(nèi)容特征;明確所需信息的類型,包括文獻(xiàn)媒體、出版類型、所需文獻(xiàn)量、年代范圍、涉及的語種、有關(guān)著者及機(jī)構(gòu)等;明確信息檢索課題對(duì)查新、查準(zhǔn)和查全的指標(biāo)要求。信息檢索的步驟與策略606.4信息檢索的步驟與策略信息檢索的步驟與策略146(2)選擇檢索工具,了解檢索系統(tǒng)信息檢索工具是人們?yōu)榱顺浞?、?zhǔn)確、有效地利用已有的信息資源而加工編制的用來報(bào)道、揭示、存貯和查找信息資源的卡片、表冊(cè)、計(jì)算機(jī)信息系統(tǒng)和特定出版物。(3)確定檢索途經(jīng),選定檢索方法每一種信息檢索方法都有自己的特點(diǎn),在實(shí)踐中可以根據(jù)信息檢索要求選擇使用或配合使用,以快速、準(zhǔn)確地完成信息檢索任務(wù),實(shí)現(xiàn)預(yù)期的目標(biāo)。信息檢索的步驟與策略61(2)選擇檢索工具,了解檢索系統(tǒng)信息檢索的步驟與策略147(4)掌握獲取原始信息的線索在獲取信息線索時(shí)要仔細(xì)閱讀,判斷所檢出的信息是否符合檢索的要求,不僅看篇名,還要閱讀整個(gè)著錄格式,進(jìn)行綜合分析。(5)獲取原始信息判斷文獻(xiàn)的出版類型。整理文獻(xiàn)出處。根據(jù)出版類型在圖書館或信息機(jī)構(gòu)查找館藏目錄或聯(lián)合目錄確定館藏。盡可能多渠道、多方式地獲取原始信息。

信息檢索的步驟與策略62(4)掌握獲取原始信息的線索信息檢索的步驟與策略1486.4.2信息檢索策略

檢索策略是科學(xué)地運(yùn)用檢索詞和邏輯運(yùn)算符正確地構(gòu)造邏輯提問式的原則和方法。其核心內(nèi)容在于檢索策略的構(gòu)造與檢索的步驟。

常用信息檢索策略包括:分塊概念組配檢索策略、逐步組配檢索策略、對(duì)偶組配檢索策略、增長組配檢索策略等。

信息檢索的步驟與策略636.4.2信息檢索策略信息檢索的步驟與策略1496.4.3信息檢索語言

信息檢索語言就是信息組織和信息檢索時(shí)所使用的語言(包括自然語言)。

信息檢索語言是文獻(xiàn)信息標(biāo)引的規(guī)則和標(biāo)準(zhǔn),標(biāo)引人員可用它來標(biāo)引文獻(xiàn)以便將文獻(xiàn)整理、加工、存儲(chǔ)于檢索系統(tǒng)中,同時(shí),檢索人員可用它來表達(dá)檢索課題信息的內(nèi)容,以便把特定文獻(xiàn)從檢索系統(tǒng)中檢索出來。因此,檢索語言就是一種把文獻(xiàn)的存儲(chǔ)與檢索聯(lián)系起來,把標(biāo)引人員和檢索人員溝通起來的約定人工語言。

信息檢索的步驟與策略646.4.3信息檢索語言信息檢索的步驟與策略150信息檢索語言主要功能:對(duì)文獻(xiàn)的信息內(nèi)容及其外表特征加以規(guī)范化的標(biāo)引。對(duì)內(nèi)容相同及相關(guān)的文獻(xiàn)信息加以集中或揭示其相關(guān)性可使文獻(xiàn)信息的存儲(chǔ)集中化、系統(tǒng)化、組織化,便于檢索者按一定的排列次序進(jìn)行有序化檢索。便于將標(biāo)引用語和檢索用語進(jìn)行相符性比較。信息檢索的步驟與策略65信息檢索語言主要功能:信息檢索的步驟與策略151信息檢索語言的作用信息檢索的步驟與策略66信息檢索語言的作用信息檢索的步驟與策略152信息檢索語言的分類信息檢索的步驟與策略67信息檢索語言的分類信息檢索的步驟與策略

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論