信息檢索的基本方法和基本技術(shù)課件_第1頁
信息檢索的基本方法和基本技術(shù)課件_第2頁
信息檢索的基本方法和基本技術(shù)課件_第3頁
信息檢索的基本方法和基本技術(shù)課件_第4頁
信息檢索的基本方法和基本技術(shù)課件_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章信息檢索的基本方法和基本技術(shù)第二章1第一節(jié)現(xiàn)代信息檢索的概念與類型一、信息檢索概念

信息檢索(廣義):是從任何信息集合中識(shí)別和獲取所需信息的過程及其所采取的一系列方法和策略。它包括存儲(chǔ)與檢索兩個(gè)方面。

信息檢索(狹義):即從檢索工具和檢索系統(tǒng)中查找出所需信息的過程。第一節(jié)現(xiàn)代信息檢索的概念與類型2二、

現(xiàn)代信息檢索的類型1、

按存儲(chǔ)和檢索內(nèi)容劃分(1)

文獻(xiàn)信息檢索

即查找出用戶所需文獻(xiàn)線索或原文的檢索。其檢索結(jié)果是文獻(xiàn)信息。如查找某一研究課題一定年限內(nèi)的有關(guān)文獻(xiàn),或?qū)σ豁?xiàng)發(fā)明創(chuàng)造進(jìn)行文獻(xiàn)查新等。(2)

數(shù)據(jù)信息檢索

是指查找出用戶所需特定數(shù)據(jù)、公式或圖表形式的檢索。其檢索結(jié)果是數(shù)據(jù)信息。如查找某一數(shù)據(jù)、公式、圖表、價(jià)格,某種物質(zhì)的化學(xué)分子式,某種設(shè)備的型號(hào)與參數(shù)等。數(shù)據(jù)檢索是一種確定性檢索。(3)

事實(shí)信息檢索

是指以特定的事實(shí)作為檢索對(duì)象的一種信息檢索。其檢索結(jié)果是基本事實(shí)。如某個(gè)人或某個(gè)組織的基本情況,某一件事發(fā)生的時(shí)間、地點(diǎn)、過程等。二、現(xiàn)代信息檢索的類型3

文獻(xiàn)、事實(shí)、數(shù)據(jù)檢索關(guān)系圖文獻(xiàn)、事實(shí)、數(shù)據(jù)檢索關(guān)系圖4

2、

按信息組織方式劃分(1)

全文檢索

是指檢索系統(tǒng)中存儲(chǔ)的是整篇文章或整本書。檢索時(shí),用戶可以根據(jù)自己的需要從中獲取有關(guān)的文章、段、句、節(jié)等信息,還可以進(jìn)行各種頻率統(tǒng)計(jì)和內(nèi)容分析。(2)

超文本檢索

是指信息在系統(tǒng)中的組織方式不同而言的。從組織結(jié)構(gòu)上看,超文本的基本組織元素是節(jié)點(diǎn)和節(jié)點(diǎn)間的邏輯聯(lián)接鏈。與傳統(tǒng)文本的線性順序不同,超文本檢索強(qiáng)調(diào)中心節(jié)點(diǎn)之間的語義聯(lián)接結(jié)構(gòu)。其檢索模式是“哪里”到“什么”。(3)

超媒體檢索是對(duì)超文本檢索的補(bǔ)充。其存儲(chǔ)對(duì)象超出了文本范疇,融入了靜、動(dòng)態(tài)圖像(形)以及聲音等多種媒體信息。信息的存儲(chǔ)結(jié)構(gòu)從單維發(fā)展到多維,存儲(chǔ)空間范圍在不斷擴(kuò)大。

2、

按信息組織方式劃分53、按使用不同的工具和手段劃分(1)手工檢索是指人們通過手工的方式來存儲(chǔ)和檢索信息,其使用的檢索工具主要是書本式、卡片式的信息系統(tǒng),如目錄、索引、文摘等。(2)計(jì)算機(jī)檢索是指人們?cè)谟?jì)算機(jī)檢索網(wǎng)絡(luò)或終端上,使用特定的檢索指令、檢索詞和檢索策略,從計(jì)算機(jī)檢索系統(tǒng)的數(shù)據(jù)庫中檢索出所需要的信息的過程,其檢索是在人機(jī)的協(xié)同作用下完成的。3、按使用不同的工具和手段劃分6第三節(jié)現(xiàn)代信息檢索語言、工具及檢索工具的編排結(jié)構(gòu)

一、信息檢索語言1、信息檢索語言概念:應(yīng)文獻(xiàn)信息的加工、存儲(chǔ)和檢索的共同需要而編制的專門語言,是表達(dá)一系列概括文獻(xiàn)信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標(biāo)識(shí)系統(tǒng)。分為規(guī)范化語言和非規(guī)范化語言(自然語言)兩類。2、信息檢索語言主要作用:(略)第三節(jié)現(xiàn)代信息檢索語言、工具及73、信息檢索語言的類型按照標(biāo)識(shí)的性質(zhì)與原理劃分:(1)分類語言——是以數(shù)字、字母(即分類號(hào))或字母與數(shù)字結(jié)合作為基本字符,采用字符直接連接并以圓點(diǎn)(或其他符號(hào))作為分隔符的書寫法,以基本類目作為基本詞匯,以類目的從屬關(guān)系來表達(dá)復(fù)雜概念的一類檢索語言。分類表基本結(jié)構(gòu):正表、附表、說明、索引組成。其中正表是主要部分,它由類號(hào)、類名、注釋三部分組成。如:《中圖法》正表之一項(xiàng)為:

TP24機(jī)器人技術(shù)

機(jī)器人工程學(xué)入此。機(jī)器人語言入TP313、信息檢索語言的類型8

圖書館分類法簡(jiǎn)介圖書分類法是在一定的哲學(xué)思想指導(dǎo)下,運(yùn)用知識(shí)分類的原理,結(jié)合圖書的特點(diǎn),采用邏輯方法編制出來的對(duì)圖書文獻(xiàn)進(jìn)行分類的體系分類表。圖書分類法是圖書分類的依據(jù),是組織藏書的工具。目前我國(guó)圖書情報(bào)單位常用的分類法主要有《中國(guó)圖書館分類法》(簡(jiǎn)稱《中圖法》)、《中國(guó)科學(xué)院圖書館圖書分類法》、(簡(jiǎn)稱《科圖法》)及《中國(guó)人民大學(xué)圖書館圖書分類法》(簡(jiǎn)稱《人大法》)等。圖書館分類法簡(jiǎn)介9《中圖法》分類法簡(jiǎn)介《中國(guó)圖書館分類法》(簡(jiǎn)稱《中圖法》)是我國(guó)圖書情報(bào)部門通行的分類方法,也是許多國(guó)內(nèi)檢索刊物用以組織文獻(xiàn)的主要分類法。這個(gè)分類法1971年由北京圖書館、中國(guó)科技情報(bào)所等單位編制的。目前使用的是第四版。

“中圖法”的體系結(jié)構(gòu)是以科學(xué)分類為基礎(chǔ),結(jié)合圖書文獻(xiàn)的特點(diǎn)進(jìn)行劃分,遵循從總到分,從一般到具體,從理論到應(yīng)用,從簡(jiǎn)單到復(fù)雜,全表共劃分為五大部類,往下展開成22個(gè)大類。在每一大類下再層層展開為二級(jí)、三級(jí)、四級(jí)……類目,形成一個(gè)等級(jí)列舉式的分類體系。在“中圖法”這樣層層細(xì)分的分類體系中,處于被區(qū)分的類稱為上位類,相應(yīng)地說,區(qū)分出來的類就是下位類?!爸袌D法”總共設(shè)置了53811個(gè)類目?!吨袌D法》由編制說明、類目表、標(biāo)記符號(hào)、說明和注釋、索引五個(gè)部分組成。類目表是整個(gè)《中圖法》的主體,是類分圖書的依據(jù)。它由5個(gè)基本部類、22個(gè)基本大類、簡(jiǎn)表、詳表和復(fù)分表五個(gè)部分組成。如下表所示:

《中圖法》分類法簡(jiǎn)介《中國(guó)圖書館分類法》(簡(jiǎn)稱《中圖法10

一、馬克思主義、列寧主義、毛澤東思想

............A

馬克思主義、列寧主義、毛澤東思想

二、哲學(xué)..................B

哲學(xué)

三、社會(huì)科學(xué)...............C

社會(huì)科學(xué)總論

D

政治

E

軍事

F

經(jīng)濟(jì)

G

文化、科學(xué)、教育、體育

H

語言、文字

I

文學(xué)

J

藝術(shù)

K

歷史、地理

四、自然科學(xué).............N

自然科學(xué)總論

O

數(shù)理科學(xué)和化學(xué)

P

天文學(xué)、地球科學(xué)

Q

生物科學(xué)

R

醫(yī)藥、衛(wèi)生

S

農(nóng)業(yè)科學(xué)

T

工業(yè)技術(shù)

U

交通運(yùn)輸

V

航空、宇宙飛行

X

環(huán)境科學(xué)

五、綜合性圖書...................Z

綜合性圖書

一、馬克思主義、列寧主義、毛澤東思想11

“中圖法”的類目配號(hào)采用漢語拼音和阿拉伯?dāng)?shù)字相結(jié)合的混合號(hào)碼制,即一個(gè)字母標(biāo)識(shí)表示一個(gè)大類,以字母的順序反映大類的序列,在字母后用數(shù)字表示大類下的類目劃分。如I247.57為適應(yīng)“工業(yè)技術(shù)”領(lǐng)域中的圖書文獻(xiàn)分類的需要,對(duì)其下一級(jí)類目的復(fù)分,也采用了字母標(biāo)志,即工業(yè)技術(shù)(T)類下細(xì)分了16個(gè)二級(jí)類目(采用雙字母標(biāo)識(shí))。

T

工業(yè)技術(shù)

TB

一般工業(yè)技術(shù)

TL

原子能技術(shù)

TD

礦業(yè)工程

TM

電工技術(shù)

TE

石油、天然氣工業(yè)

TN

無線電電子學(xué)、電訊技術(shù)

TF

冶金工業(yè)

TP

自動(dòng)化技術(shù)、計(jì)算機(jī)

TG

金屬學(xué)、金屬工藝

TQ

化學(xué)工業(yè)

TH

機(jī)械、儀表

TS

輕工業(yè)、手工業(yè)

TJ

武器工業(yè)

TU

建筑科學(xué)

TK

動(dòng)力工程

TV

水利工程

“中圖法”的類目配號(hào)采用漢語拼音和阿拉伯?dāng)?shù)字相結(jié)合的混12(2)主題語言

是以自然語言的字符為字符,以名詞術(shù)語為基本詞匯,用一組名詞術(shù)語作為檢索標(biāo)識(shí)的一類檢索檢索語言。分為標(biāo)題詞、元詞、敘詞和關(guān)鍵詞。(3)代碼語言

是指對(duì)事物的某方面特征,用某種代碼系統(tǒng)來表示和排列事物概念,從而提供檢索的檢索語言。如化學(xué)分子式。(2)主題語言13按照表達(dá)文獻(xiàn)的特征劃分:(1)表達(dá)文獻(xiàn)外部特征的檢索語言——題名、責(zé)任者、文獻(xiàn)編號(hào)等。(2)表達(dá)文獻(xiàn)內(nèi)容特征的檢索語言——分類語言、主題語言、代碼語言三大類型。文獻(xiàn)的外表特征與文獻(xiàn)是一一對(duì)應(yīng)的,而文獻(xiàn)的內(nèi)容特征與文獻(xiàn)卻是一種模糊的對(duì)應(yīng)關(guān)系。按照表達(dá)文獻(xiàn)的特征劃分:14二、信息檢索工具檢索工具是指用于報(bào)道、存儲(chǔ)和查找文獻(xiàn)信息資源線索的工具和設(shè)備的總稱,是以一次文獻(xiàn)為基礎(chǔ),在廣泛收集并經(jīng)過嚴(yán)格篩選后,對(duì)其進(jìn)行描述、標(biāo)引或匯集,充分揭示其物質(zhì)外部特征和內(nèi)容特征,并按一定的規(guī)則組織而成的。(一)檢索工具的特點(diǎn)

豐富的文獻(xiàn)記錄。檢索工具收錄的文獻(xiàn)信息量大,學(xué)科知識(shí)全面、系統(tǒng),專業(yè)性強(qiáng)。

必要的檢索標(biāo)識(shí)。檢索工具能提供各種檢索標(biāo)識(shí),如學(xué)科分類號(hào)、主題詞、著者名稱、漢語拼音等。

多途經(jīng)的檢索手段。檢索工具能提供多樣化的檢索途徑和檢索方法,如分類索引、主題索引、著者索引和專門索引等。二、信息檢索工具15

(二)檢索工具的基本類型1、按檢索手段,可分為手工檢索工具、機(jī)械檢索工具和計(jì)算機(jī)檢索工具。2、按出版形式,可分為印刷型、縮微型和電子型。3、按著錄方式,可分為目錄型、題錄型(索引型)文摘型和索引型。4、按收錄范圍,可分為綜合性檢索工具、??菩詸z索工具。5、按其載體形式,可分為書本式工具書、卡片檢索工具、機(jī)讀型檢索工具及縮微型檢索工具。

(二)檢索工具的基本類型16三、信息檢索方法和途徑(一)信息檢索的方法所謂信息檢索的方法,即查找文獻(xiàn)信息的方法。信息檢索的方法往往與文獻(xiàn)信息檢索的課題、性質(zhì)和所檢索的文獻(xiàn)類型有關(guān)。歸納起來一般有以下幾種。如圖所示:檢索方法直接法追溯法綜合法順查法倒查法抽查法三、信息檢索方法和途徑檢索方法直接法追溯法綜合法順查法倒查法17

1、直接法

直接法又稱為工具法或常用法,是直接利用文獻(xiàn)信息檢索工具來查找文獻(xiàn)的方法。其常用方法分為順查法、倒查法和抽查法。(1)順查法

是以研究課題所要求的起始年代為起點(diǎn),由遠(yuǎn)及近,利用信息檢索工具逐年進(jìn)行查找的信息檢索方法。檢索的時(shí)間跨度一般規(guī)定為10年,檢索范圍要根據(jù)研究課題的具體情況而定。這種方法的特點(diǎn)是文獻(xiàn)的查全率高,但費(fèi)時(shí)、工作量大。(2)倒查法

與順查法相反,是由近及遠(yuǎn)逐年進(jìn)行查找的信息檢索方法。這種方法檢索效率較高,省時(shí)省力,但查全率相對(duì)來說不如順查法。(3)抽查法

這是一種針對(duì)研究課題發(fā)展的特點(diǎn),抓住學(xué)科發(fā)展迅速、發(fā)表文獻(xiàn)較多的年代進(jìn)行查找的方法。此種方法花費(fèi)時(shí)間較少,卻能獲得較多文獻(xiàn),但使用抽查法要求檢索者必須熟悉學(xué)科的發(fā)展情況,熟悉學(xué)科文獻(xiàn)較為集中的時(shí)間范圍,以便正確地選擇抽查的時(shí)間跨度。

1、直接法18

2、追溯法

追溯法又稱回溯法,是利用文獻(xiàn)末尾所附的參考文獻(xiàn)線索,進(jìn)行追溯查找的方法,這是一種傳統(tǒng)的獲取文獻(xiàn)信息的方法,是在沒有檢索工具或檢索工具不全的情況下使用的一種方法,這種方法查找的文獻(xiàn)不全。

2、追溯法193、綜合法綜合法又稱為分段法或交替法,是順查法、倒查法、抽查法與追溯法交替使用的一種方法。這種方法既利用檢索工具檢索文獻(xiàn),又利用文獻(xiàn)后邊的參考文獻(xiàn)進(jìn)行追溯,兩種方法交替使用,直到結(jié)果滿意為止。3、綜合法20(二)信息檢索的途徑

1、分類途徑2、主題途徑3、著者途徑4、其它途徑(二)信息檢索的途徑21四、信息檢索的程序信息檢索一般可按照下面程序來進(jìn)行檢索。如圖所示:

分析研究檢索課題

選擇檢索工具

確定檢索途徑和標(biāo)識(shí)

索取原始文獻(xiàn)

掌握獲取原文的線索

確定檢索方法構(gòu)建檢索表達(dá)式檢索并調(diào)整檢索策略

四、信息檢索的程序分析研究選擇確定檢221、分析研究信息檢索課題(1)明確信息檢索課題所涉及的學(xué)科范圍。(2)明確所需信息的類型,包括文獻(xiàn)媒體、出版類型、所需文獻(xiàn)量、年代范圍、涉及的語種、有關(guān)著者、機(jī)構(gòu)等。(3)明確信息檢索課題對(duì)查新、查準(zhǔn)和查全的指標(biāo)要求。1、分析研究信息檢索課題232、選擇信息檢索工具

選擇恰當(dāng)?shù)臋z索工具,是成功實(shí)施檢索的關(guān)鍵。選擇檢索工具一定要根據(jù)待查項(xiàng)目的內(nèi)容、性質(zhì)來確定。選擇的檢索工具要注意其所報(bào)道的學(xué)科專業(yè)范圍、所包括的語種及其所收錄的文獻(xiàn)類型等。在選擇中,要以專業(yè)性檢索工具為主,再通過綜合型檢索工具相配合。

2、選擇信息檢索工具243、確定信息檢索途徑和標(biāo)識(shí)一般來說,每種信息檢索工具都為檢索者提供多條檢索途徑,歸納起來主要有分類途徑、主題途徑、題名途徑等。(1)分類檢索途徑。是按文獻(xiàn)所屬的學(xué)科類別來檢索文獻(xiàn)的途徑。主要運(yùn)用于檢索課題要求的是泛指性較強(qiáng)的文獻(xiàn)信息。(2)主題檢索途徑。是從文獻(xiàn)的主題概念出發(fā),按確定的主題詞來檢索文獻(xiàn)的一種途徑。(3)題名檢索途徑。是根據(jù)文獻(xiàn)名稱來檢索文獻(xiàn)的途徑。文獻(xiàn)題名主要指書名、刊名、篇名等。(4)著者檢索途徑。是通過已知著者(個(gè)人著者、團(tuán)體著者)的名稱來檢索文獻(xiàn)的途徑。(5)號(hào)碼檢索途徑。是通過已知號(hào)碼(專利號(hào)、標(biāo)準(zhǔn)號(hào)、報(bào)告號(hào))來檢索文獻(xiàn)的途徑。(6)其它檢索途徑。在檢索某些學(xué)科或?qū)I(yè)的文獻(xiàn)時(shí),有一些特殊的檢索途徑。如美國(guó)《化學(xué)文摘》中有分子式索引,從分子式入手來查找有關(guān)文獻(xiàn)。3、確定信息檢索途徑和標(biāo)識(shí)254、確定信息檢索方法檢索方法的選擇可根據(jù)課題性質(zhì)、檢索的對(duì)象、檢索的范圍和實(shí)際可能,確定某個(gè)具體課題的檢索方法,如采用直接法、追溯法、綜合法等。4、確定信息檢索方法265、構(gòu)建檢索表達(dá)式

檢索表達(dá)式是計(jì)算機(jī)檢索中用來表達(dá)用戶提問的邏輯表達(dá)式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成,是檢索策略的具體體現(xiàn)。6、檢索并調(diào)整檢索策略

通過檢索表達(dá)式對(duì)檢出的檢索結(jié)果進(jìn)行分析,分析檢索結(jié)果是否與檢索要求一致,不時(shí)要修改檢索詞和檢索表達(dá)式,直到得到滿意的結(jié)果。5、構(gòu)建檢索表達(dá)式277、掌握獲取原文的線索在獲取信息線索時(shí)要仔細(xì)閱讀,判斷所檢出的信息是否符合檢索的要求,不僅看篇名,還要閱讀整個(gè)著錄格式,進(jìn)行綜合分析。7、掌握獲取原文的線索288、索取原始文獻(xiàn)索取原始文獻(xiàn)是信息檢索的最后一步,根據(jù)出版類型在圖書館或情報(bào)機(jī)構(gòu)查找館藏目錄或聯(lián)合目錄確定館藏。原則上說,應(yīng)該按“由近及遠(yuǎn)”的順序逐步擴(kuò)大查找館藏目錄或聯(lián)合目錄確定館藏;也盡可能多渠道、多方式地獲取原文,如利用與國(guó)外圖書館的館際互借,大型國(guó)際聯(lián)機(jī)信息檢索系統(tǒng)的聯(lián)機(jī)訂購,Internet上的電子郵件和下載服務(wù),或者與出版商直接聯(lián)系等。8、索取原始文獻(xiàn)29五、手工、機(jī)械和計(jì)算機(jī)信息檢索簡(jiǎn)介1、手工信息檢索手工信息檢索工具的檢索方法,從編制的角度,是指使內(nèi)容有序化的編排方法;從使用者的角度,是指查考內(nèi)容的檢索方法。目前比較常用的方法有形序排檢法、音序排檢法、分類排檢法、主題排檢法、時(shí)序排檢法和地序排檢法等。(1)形序排檢法。將檢索工具的內(nèi)容依據(jù)漢字的形體特點(diǎn)設(shè)計(jì)制定的排列順序的方法,主要包括部首法、筆畫法。(漢字常用的檢字法)(2)漢語拼音音序排檢法。將檢索工具的內(nèi)容依據(jù)漢字的讀音設(shè)計(jì)制定的排列順序的方法。主要包括純音序排列法和音序形序排列法兩種。(漢字常用的檢字法)五、手工、機(jī)械和計(jì)算機(jī)信息檢索簡(jiǎn)介30(3)分類排檢法。是將詞目、條目或文獻(xiàn)按知識(shí)內(nèi)容、學(xué)科屬性分門別類地加以歸并集中,按邏輯原則排列順序的一種排檢方法。基本形式是:按知識(shí)系統(tǒng)、學(xué)科體系層層分類,每一類目下集中同類子目或文獻(xiàn);按類目、子目、或文獻(xiàn)的內(nèi)在聯(lián)系排列順序。(4)主題排檢法。是指以規(guī)范化的自然語言為標(biāo)識(shí)符號(hào),來標(biāo)引文獻(xiàn)中心內(nèi)容的一種排檢方法。主題排檢法的一般形式為:主題詞提示文獻(xiàn)記錄的中心內(nèi)容或?qū)ο?,主題詞本身則按首字讀音或筆畫等順序排列。(5)時(shí)序排檢法。是指按時(shí)間的順序組合文獻(xiàn)信息素材,主要用于編制年譜、年表等檢索工具。(6)地序排檢法。是指按一定時(shí)期的行政區(qū)域來排列文獻(xiàn)信息素材,這種可以把同一地區(qū)的有關(guān)信息素材集中在一起,全面地反映某一地區(qū)、某一國(guó)家的歷史和現(xiàn)狀。(3)分類排檢法。是將詞目、條目或文獻(xiàn)按知識(shí)內(nèi)容、學(xué)科屬性分312、機(jī)械信息檢索可分為機(jī)電信息檢索和光電信息檢索兩種。機(jī)械信息檢索最初是從簡(jiǎn)單的穿孔卡片逐步發(fā)展起來的。機(jī)電信息檢索系統(tǒng):手檢穿孔卡片、機(jī)檢穿孔卡片、選卡機(jī)光電信息檢索系統(tǒng):縮微膠卷、膠片及檢索機(jī)等。3、計(jì)算機(jī)信息檢索現(xiàn)已形成了聯(lián)機(jī)信息檢索、多媒體信息檢索、光盤信息檢索與網(wǎng)絡(luò)信息檢索并存的局面。

特點(diǎn):檢索速度快、檢索途徑多、更新快、資源共享、檢索方便靈活、檢索結(jié)果可以直接輸出。2、機(jī)械信息檢索32計(jì)算機(jī)檢索的基本技術(shù)(方法)可分為:(一)布爾(邏輯)檢索布爾邏輯檢索是建立最早的檢索理論,也是檢索系統(tǒng)中應(yīng)用最廣泛的檢索技術(shù)。它通過對(duì)布爾邏輯運(yùn)算符進(jìn)行組配,形成檢索式,用以表達(dá)用戶的檢索需求,并通過一定的算法和手段進(jìn)行檢索。布爾邏輯運(yùn)算符及其關(guān)系

常用的布爾邏輯運(yùn)算符有三種:邏輯或(OR)、邏輯與(AND)、邏輯非(NOT)

AORB(+)AANDB(*)ANOTB(-)BNOTA計(jì)算機(jī)檢索的基本技術(shù)(方法)可分為:AORB(33(二)截詞檢索截詞檢索是指對(duì)含有相同詞干的檢索詞,檢索時(shí)僅用該詞干在數(shù)據(jù)庫中進(jìn)行檢索,凡與之匹配的字符串均屬于命中范圍。有相應(yīng)的截詞符號(hào),有一定的詞形變化。由檢索詞的不變部分和允許的任何變化形式共同構(gòu)成的主題詞均為合法檢索詞,且通過檢索詞具有邏輯與關(guān)系,截詞符號(hào)有“*”“?”,分別表示無限截?cái)嗪陀邢藿財(cái)?。按截?cái)嗖课豢煞譃椋鹤螅ㄇ埃┙財(cái)唷⒂遥ê螅┙財(cái)?、中間截?cái)嗟阮愋汀#ǘ┙卦~檢索34(三)全文(位置)檢索技術(shù)全文檢索是指以一次文獻(xiàn)的全部信息作為存儲(chǔ)和檢索對(duì)象的方法。全文檢索是以原始記錄中詞與詞之間特定位置關(guān)系為檢索對(duì)象的運(yùn)算,它不依賴主題詞表而直接使用原文中的自由詞進(jìn)行檢索,它通過位置算符來確定詞與詞之間的特定的位置關(guān)系。全文檢索可分為文章節(jié)段檢索(可檢索到文獻(xiàn)中的每個(gè)章節(jié)或段落)和文句檢索(可檢索到文獻(xiàn)中的每個(gè)句子。

(三)全文(位置)檢索技術(shù)35(四)字段限制檢索字段限制檢索是一種限定檢索詞或檢索方式,在數(shù)據(jù)庫內(nèi)查找區(qū)域的聯(lián)機(jī)檢索技巧。當(dāng)用戶從主題或物質(zhì)外部特征的角度檢索文獻(xiàn)信息資源時(shí),可以利用文獻(xiàn)類型、語種、出版年等輔助條件限定檢索詞的檢索范圍。這一技術(shù)可以控制文獻(xiàn)檢索的范圍,提高文獻(xiàn)的查準(zhǔn)率。

(四)字段限制檢索36(五)自然語言檢索就是一種直接采用自然語言中的字、詞甚至整個(gè)句子作為提問式進(jìn)行檢索的方法。

這種檢索技術(shù)適合于還不太熟悉網(wǎng)絡(luò)信息檢索技術(shù)的人使用。(五)自然語言檢索37檢索結(jié)果存儲(chǔ)過程

文獻(xiàn)信息處理人員

原始信息

信息分析、處理和標(biāo)引

檢索語言(主題詞/分類號(hào))檢索過程

檢索課題用戶課題分析檢索工具

檢索

檢出

原文的獲取檢索結(jié)果存文獻(xiàn)信息處理人員原始信息信息分析、處理和標(biāo)引38

第三章中文檢索工具第三章39第一節(jié)中文檢索工具概述及結(jié)構(gòu)體系一、概述目前中國(guó)的檢索刊物約有200種。按刊物著錄編輯形式可分為:目錄、索引、文摘三大系列。按刊物報(bào)道信息內(nèi)容范圍可分為:國(guó)內(nèi)、國(guó)外兩大系列。第一節(jié)中文檢索工具概述及結(jié)構(gòu)體系40二、中文檢索工具體系查國(guó)內(nèi)文獻(xiàn)查國(guó)外文獻(xiàn)圖書全國(guó)新書目、全國(guó)總書目國(guó)外新書通報(bào)報(bào)刊全國(guó)報(bào)刊索引國(guó)外報(bào)刊目錄期刊中文科技資料目錄、中國(guó)**文摘國(guó)外科技資料目錄、國(guó)外**文摘標(biāo)準(zhǔn)國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)各國(guó)標(biāo)準(zhǔn)目錄專利專利公報(bào)專利文獻(xiàn)通報(bào)中文檢索工具體系表二、中文檢索工具體系查國(guó)內(nèi)文獻(xiàn)查國(guó)外文獻(xiàn)圖書全國(guó)新書目、全國(guó)41第二節(jié)中文檢索工具編排及其檢索途徑一、中文檢索工具結(jié)構(gòu)

檢索工具雖然多種多樣,但一種完整的文獻(xiàn)檢索工具一般由五部分組成,如圖所示。

題錄、文摘使用說明編輯內(nèi)容著錄標(biāo)準(zhǔn)代號(hào)說明使用方法目錄正文題錄文摘索引主題、分類著者、機(jī)構(gòu)各種號(hào)碼特殊號(hào)碼

文獻(xiàn)來源期刊圖書會(huì)議文獻(xiàn)第二節(jié)中文檢索工具編排及其檢索途徑42二、中文檢索工具的編排中文檢索工具的正文都按分類編排,并按照國(guó)家標(biāo)準(zhǔn)(GB3793-83)《檢索期刊條目著錄規(guī)則》規(guī)定的統(tǒng)一格式進(jìn)行著錄。分類號(hào)順序號(hào)中文題名=外文題名[刊,文種]/著者/刊名(國(guó)別或地名)-年,卷(期).-所在頁碼提要.圖×表×參×(文摘員)主題詞索取號(hào)分類號(hào)順序號(hào)中文書名=外文書名卷(冊(cè)、編)次:卷(冊(cè)、編)的書名[著,文種]/著者或編者.-版本/與版本有關(guān)的責(zé)任者.-(叢書項(xiàng)).-附注項(xiàng)-文獻(xiàn)標(biāo)準(zhǔn)書號(hào)提要。圖×表×參×(文摘員)主題詞索取號(hào)期刊論文著錄格式

圖書專著著錄格式檢索工具統(tǒng)一著錄格式二、中文檢索工具的編排分類號(hào)分類號(hào)期刊論文著錄格式圖書43

圖書專著簡(jiǎn)單著錄格式圖書專著簡(jiǎn)單著錄格式44三、中文檢索工具檢索途徑主要檢索途徑有三種:著者途徑主題途徑分類途徑已知學(xué)科類目類目表、目次查類目表獲知類目所在正文頁碼已知主題詞主題索引查主題索此獲取文獻(xiàn)號(hào)已知著者姓名著者索引按著者姓名獲取文獻(xiàn)號(hào)由文摘(題錄)正文獲取文獻(xiàn)出處根據(jù)文獻(xiàn)出處,獲取原文三、中文檢索工具檢索途徑著者途徑主題途徑分類途徑已知45第三節(jié)國(guó)內(nèi)科技文獻(xiàn)檢索工具見教材第三節(jié)國(guó)內(nèi)科技文獻(xiàn)檢索工具46

第二章信息檢索的基本方法和基本技術(shù)第二章47第一節(jié)現(xiàn)代信息檢索的概念與類型一、信息檢索概念

信息檢索(廣義):是從任何信息集合中識(shí)別和獲取所需信息的過程及其所采取的一系列方法和策略。它包括存儲(chǔ)與檢索兩個(gè)方面。

信息檢索(狹義):即從檢索工具和檢索系統(tǒng)中查找出所需信息的過程。第一節(jié)現(xiàn)代信息檢索的概念與類型48二、

現(xiàn)代信息檢索的類型1、

按存儲(chǔ)和檢索內(nèi)容劃分(1)

文獻(xiàn)信息檢索

即查找出用戶所需文獻(xiàn)線索或原文的檢索。其檢索結(jié)果是文獻(xiàn)信息。如查找某一研究課題一定年限內(nèi)的有關(guān)文獻(xiàn),或?qū)σ豁?xiàng)發(fā)明創(chuàng)造進(jìn)行文獻(xiàn)查新等。(2)

數(shù)據(jù)信息檢索

是指查找出用戶所需特定數(shù)據(jù)、公式或圖表形式的檢索。其檢索結(jié)果是數(shù)據(jù)信息。如查找某一數(shù)據(jù)、公式、圖表、價(jià)格,某種物質(zhì)的化學(xué)分子式,某種設(shè)備的型號(hào)與參數(shù)等。數(shù)據(jù)檢索是一種確定性檢索。(3)

事實(shí)信息檢索

是指以特定的事實(shí)作為檢索對(duì)象的一種信息檢索。其檢索結(jié)果是基本事實(shí)。如某個(gè)人或某個(gè)組織的基本情況,某一件事發(fā)生的時(shí)間、地點(diǎn)、過程等。二、現(xiàn)代信息檢索的類型49

文獻(xiàn)、事實(shí)、數(shù)據(jù)檢索關(guān)系圖文獻(xiàn)、事實(shí)、數(shù)據(jù)檢索關(guān)系圖50

2、

按信息組織方式劃分(1)

全文檢索

是指檢索系統(tǒng)中存儲(chǔ)的是整篇文章或整本書。檢索時(shí),用戶可以根據(jù)自己的需要從中獲取有關(guān)的文章、段、句、節(jié)等信息,還可以進(jìn)行各種頻率統(tǒng)計(jì)和內(nèi)容分析。(2)

超文本檢索

是指信息在系統(tǒng)中的組織方式不同而言的。從組織結(jié)構(gòu)上看,超文本的基本組織元素是節(jié)點(diǎn)和節(jié)點(diǎn)間的邏輯聯(lián)接鏈。與傳統(tǒng)文本的線性順序不同,超文本檢索強(qiáng)調(diào)中心節(jié)點(diǎn)之間的語義聯(lián)接結(jié)構(gòu)。其檢索模式是“哪里”到“什么”。(3)

超媒體檢索是對(duì)超文本檢索的補(bǔ)充。其存儲(chǔ)對(duì)象超出了文本范疇,融入了靜、動(dòng)態(tài)圖像(形)以及聲音等多種媒體信息。信息的存儲(chǔ)結(jié)構(gòu)從單維發(fā)展到多維,存儲(chǔ)空間范圍在不斷擴(kuò)大。

2、

按信息組織方式劃分513、按使用不同的工具和手段劃分(1)手工檢索是指人們通過手工的方式來存儲(chǔ)和檢索信息,其使用的檢索工具主要是書本式、卡片式的信息系統(tǒng),如目錄、索引、文摘等。(2)計(jì)算機(jī)檢索是指人們?cè)谟?jì)算機(jī)檢索網(wǎng)絡(luò)或終端上,使用特定的檢索指令、檢索詞和檢索策略,從計(jì)算機(jī)檢索系統(tǒng)的數(shù)據(jù)庫中檢索出所需要的信息的過程,其檢索是在人機(jī)的協(xié)同作用下完成的。3、按使用不同的工具和手段劃分52第三節(jié)現(xiàn)代信息檢索語言、工具及檢索工具的編排結(jié)構(gòu)

一、信息檢索語言1、信息檢索語言概念:應(yīng)文獻(xiàn)信息的加工、存儲(chǔ)和檢索的共同需要而編制的專門語言,是表達(dá)一系列概括文獻(xiàn)信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標(biāo)識(shí)系統(tǒng)。分為規(guī)范化語言和非規(guī)范化語言(自然語言)兩類。2、信息檢索語言主要作用:(略)第三節(jié)現(xiàn)代信息檢索語言、工具及533、信息檢索語言的類型按照標(biāo)識(shí)的性質(zhì)與原理劃分:(1)分類語言——是以數(shù)字、字母(即分類號(hào))或字母與數(shù)字結(jié)合作為基本字符,采用字符直接連接并以圓點(diǎn)(或其他符號(hào))作為分隔符的書寫法,以基本類目作為基本詞匯,以類目的從屬關(guān)系來表達(dá)復(fù)雜概念的一類檢索語言。分類表基本結(jié)構(gòu):正表、附表、說明、索引組成。其中正表是主要部分,它由類號(hào)、類名、注釋三部分組成。如:《中圖法》正表之一項(xiàng)為:

TP24機(jī)器人技術(shù)

機(jī)器人工程學(xué)入此。機(jī)器人語言入TP313、信息檢索語言的類型54

圖書館分類法簡(jiǎn)介圖書分類法是在一定的哲學(xué)思想指導(dǎo)下,運(yùn)用知識(shí)分類的原理,結(jié)合圖書的特點(diǎn),采用邏輯方法編制出來的對(duì)圖書文獻(xiàn)進(jìn)行分類的體系分類表。圖書分類法是圖書分類的依據(jù),是組織藏書的工具。目前我國(guó)圖書情報(bào)單位常用的分類法主要有《中國(guó)圖書館分類法》(簡(jiǎn)稱《中圖法》)、《中國(guó)科學(xué)院圖書館圖書分類法》、(簡(jiǎn)稱《科圖法》)及《中國(guó)人民大學(xué)圖書館圖書分類法》(簡(jiǎn)稱《人大法》)等。圖書館分類法簡(jiǎn)介55《中圖法》分類法簡(jiǎn)介《中國(guó)圖書館分類法》(簡(jiǎn)稱《中圖法》)是我國(guó)圖書情報(bào)部門通行的分類方法,也是許多國(guó)內(nèi)檢索刊物用以組織文獻(xiàn)的主要分類法。這個(gè)分類法1971年由北京圖書館、中國(guó)科技情報(bào)所等單位編制的。目前使用的是第四版。

“中圖法”的體系結(jié)構(gòu)是以科學(xué)分類為基礎(chǔ),結(jié)合圖書文獻(xiàn)的特點(diǎn)進(jìn)行劃分,遵循從總到分,從一般到具體,從理論到應(yīng)用,從簡(jiǎn)單到復(fù)雜,全表共劃分為五大部類,往下展開成22個(gè)大類。在每一大類下再層層展開為二級(jí)、三級(jí)、四級(jí)……類目,形成一個(gè)等級(jí)列舉式的分類體系。在“中圖法”這樣層層細(xì)分的分類體系中,處于被區(qū)分的類稱為上位類,相應(yīng)地說,區(qū)分出來的類就是下位類?!爸袌D法”總共設(shè)置了53811個(gè)類目?!吨袌D法》由編制說明、類目表、標(biāo)記符號(hào)、說明和注釋、索引五個(gè)部分組成。類目表是整個(gè)《中圖法》的主體,是類分圖書的依據(jù)。它由5個(gè)基本部類、22個(gè)基本大類、簡(jiǎn)表、詳表和復(fù)分表五個(gè)部分組成。如下表所示:

《中圖法》分類法簡(jiǎn)介《中國(guó)圖書館分類法》(簡(jiǎn)稱《中圖法56

一、馬克思主義、列寧主義、毛澤東思想

............A

馬克思主義、列寧主義、毛澤東思想

二、哲學(xué)..................B

哲學(xué)

三、社會(huì)科學(xué)...............C

社會(huì)科學(xué)總論

D

政治

E

軍事

F

經(jīng)濟(jì)

G

文化、科學(xué)、教育、體育

H

語言、文字

I

文學(xué)

J

藝術(shù)

K

歷史、地理

四、自然科學(xué).............N

自然科學(xué)總論

O

數(shù)理科學(xué)和化學(xué)

P

天文學(xué)、地球科學(xué)

Q

生物科學(xué)

R

醫(yī)藥、衛(wèi)生

S

農(nóng)業(yè)科學(xué)

T

工業(yè)技術(shù)

U

交通運(yùn)輸

V

航空、宇宙飛行

X

環(huán)境科學(xué)

五、綜合性圖書...................Z

綜合性圖書

一、馬克思主義、列寧主義、毛澤東思想57

“中圖法”的類目配號(hào)采用漢語拼音和阿拉伯?dāng)?shù)字相結(jié)合的混合號(hào)碼制,即一個(gè)字母標(biāo)識(shí)表示一個(gè)大類,以字母的順序反映大類的序列,在字母后用數(shù)字表示大類下的類目劃分。如I247.57為適應(yīng)“工業(yè)技術(shù)”領(lǐng)域中的圖書文獻(xiàn)分類的需要,對(duì)其下一級(jí)類目的復(fù)分,也采用了字母標(biāo)志,即工業(yè)技術(shù)(T)類下細(xì)分了16個(gè)二級(jí)類目(采用雙字母標(biāo)識(shí))。

T

工業(yè)技術(shù)

TB

一般工業(yè)技術(shù)

TL

原子能技術(shù)

TD

礦業(yè)工程

TM

電工技術(shù)

TE

石油、天然氣工業(yè)

TN

無線電電子學(xué)、電訊技術(shù)

TF

冶金工業(yè)

TP

自動(dòng)化技術(shù)、計(jì)算機(jī)

TG

金屬學(xué)、金屬工藝

TQ

化學(xué)工業(yè)

TH

機(jī)械、儀表

TS

輕工業(yè)、手工業(yè)

TJ

武器工業(yè)

TU

建筑科學(xué)

TK

動(dòng)力工程

TV

水利工程

“中圖法”的類目配號(hào)采用漢語拼音和阿拉伯?dāng)?shù)字相結(jié)合的混58(2)主題語言

是以自然語言的字符為字符,以名詞術(shù)語為基本詞匯,用一組名詞術(shù)語作為檢索標(biāo)識(shí)的一類檢索檢索語言。分為標(biāo)題詞、元詞、敘詞和關(guān)鍵詞。(3)代碼語言

是指對(duì)事物的某方面特征,用某種代碼系統(tǒng)來表示和排列事物概念,從而提供檢索的檢索語言。如化學(xué)分子式。(2)主題語言59按照表達(dá)文獻(xiàn)的特征劃分:(1)表達(dá)文獻(xiàn)外部特征的檢索語言——題名、責(zé)任者、文獻(xiàn)編號(hào)等。(2)表達(dá)文獻(xiàn)內(nèi)容特征的檢索語言——分類語言、主題語言、代碼語言三大類型。文獻(xiàn)的外表特征與文獻(xiàn)是一一對(duì)應(yīng)的,而文獻(xiàn)的內(nèi)容特征與文獻(xiàn)卻是一種模糊的對(duì)應(yīng)關(guān)系。按照表達(dá)文獻(xiàn)的特征劃分:60二、信息檢索工具檢索工具是指用于報(bào)道、存儲(chǔ)和查找文獻(xiàn)信息資源線索的工具和設(shè)備的總稱,是以一次文獻(xiàn)為基礎(chǔ),在廣泛收集并經(jīng)過嚴(yán)格篩選后,對(duì)其進(jìn)行描述、標(biāo)引或匯集,充分揭示其物質(zhì)外部特征和內(nèi)容特征,并按一定的規(guī)則組織而成的。(一)檢索工具的特點(diǎn)

豐富的文獻(xiàn)記錄。檢索工具收錄的文獻(xiàn)信息量大,學(xué)科知識(shí)全面、系統(tǒng),專業(yè)性強(qiáng)。

必要的檢索標(biāo)識(shí)。檢索工具能提供各種檢索標(biāo)識(shí),如學(xué)科分類號(hào)、主題詞、著者名稱、漢語拼音等。

多途經(jīng)的檢索手段。檢索工具能提供多樣化的檢索途徑和檢索方法,如分類索引、主題索引、著者索引和專門索引等。二、信息檢索工具61

(二)檢索工具的基本類型1、按檢索手段,可分為手工檢索工具、機(jī)械檢索工具和計(jì)算機(jī)檢索工具。2、按出版形式,可分為印刷型、縮微型和電子型。3、按著錄方式,可分為目錄型、題錄型(索引型)文摘型和索引型。4、按收錄范圍,可分為綜合性檢索工具、??菩詸z索工具。5、按其載體形式,可分為書本式工具書、卡片檢索工具、機(jī)讀型檢索工具及縮微型檢索工具。

(二)檢索工具的基本類型62三、信息檢索方法和途徑(一)信息檢索的方法所謂信息檢索的方法,即查找文獻(xiàn)信息的方法。信息檢索的方法往往與文獻(xiàn)信息檢索的課題、性質(zhì)和所檢索的文獻(xiàn)類型有關(guān)。歸納起來一般有以下幾種。如圖所示:檢索方法直接法追溯法綜合法順查法倒查法抽查法三、信息檢索方法和途徑檢索方法直接法追溯法綜合法順查法倒查法63

1、直接法

直接法又稱為工具法或常用法,是直接利用文獻(xiàn)信息檢索工具來查找文獻(xiàn)的方法。其常用方法分為順查法、倒查法和抽查法。(1)順查法

是以研究課題所要求的起始年代為起點(diǎn),由遠(yuǎn)及近,利用信息檢索工具逐年進(jìn)行查找的信息檢索方法。檢索的時(shí)間跨度一般規(guī)定為10年,檢索范圍要根據(jù)研究課題的具體情況而定。這種方法的特點(diǎn)是文獻(xiàn)的查全率高,但費(fèi)時(shí)、工作量大。(2)倒查法

與順查法相反,是由近及遠(yuǎn)逐年進(jìn)行查找的信息檢索方法。這種方法檢索效率較高,省時(shí)省力,但查全率相對(duì)來說不如順查法。(3)抽查法

這是一種針對(duì)研究課題發(fā)展的特點(diǎn),抓住學(xué)科發(fā)展迅速、發(fā)表文獻(xiàn)較多的年代進(jìn)行查找的方法。此種方法花費(fèi)時(shí)間較少,卻能獲得較多文獻(xiàn),但使用抽查法要求檢索者必須熟悉學(xué)科的發(fā)展情況,熟悉學(xué)科文獻(xiàn)較為集中的時(shí)間范圍,以便正確地選擇抽查的時(shí)間跨度。

1、直接法64

2、追溯法

追溯法又稱回溯法,是利用文獻(xiàn)末尾所附的參考文獻(xiàn)線索,進(jìn)行追溯查找的方法,這是一種傳統(tǒng)的獲取文獻(xiàn)信息的方法,是在沒有檢索工具或檢索工具不全的情況下使用的一種方法,這種方法查找的文獻(xiàn)不全。

2、追溯法653、綜合法綜合法又稱為分段法或交替法,是順查法、倒查法、抽查法與追溯法交替使用的一種方法。這種方法既利用檢索工具檢索文獻(xiàn),又利用文獻(xiàn)后邊的參考文獻(xiàn)進(jìn)行追溯,兩種方法交替使用,直到結(jié)果滿意為止。3、綜合法66(二)信息檢索的途徑

1、分類途徑2、主題途徑3、著者途徑4、其它途徑(二)信息檢索的途徑67四、信息檢索的程序信息檢索一般可按照下面程序來進(jìn)行檢索。如圖所示:

分析研究檢索課題

選擇檢索工具

確定檢索途徑和標(biāo)識(shí)

索取原始文獻(xiàn)

掌握獲取原文的線索

確定檢索方法構(gòu)建檢索表達(dá)式檢索并調(diào)整檢索策略

四、信息檢索的程序分析研究選擇確定檢681、分析研究信息檢索課題(1)明確信息檢索課題所涉及的學(xué)科范圍。(2)明確所需信息的類型,包括文獻(xiàn)媒體、出版類型、所需文獻(xiàn)量、年代范圍、涉及的語種、有關(guān)著者、機(jī)構(gòu)等。(3)明確信息檢索課題對(duì)查新、查準(zhǔn)和查全的指標(biāo)要求。1、分析研究信息檢索課題692、選擇信息檢索工具

選擇恰當(dāng)?shù)臋z索工具,是成功實(shí)施檢索的關(guān)鍵。選擇檢索工具一定要根據(jù)待查項(xiàng)目的內(nèi)容、性質(zhì)來確定。選擇的檢索工具要注意其所報(bào)道的學(xué)科專業(yè)范圍、所包括的語種及其所收錄的文獻(xiàn)類型等。在選擇中,要以專業(yè)性檢索工具為主,再通過綜合型檢索工具相配合。

2、選擇信息檢索工具703、確定信息檢索途徑和標(biāo)識(shí)一般來說,每種信息檢索工具都為檢索者提供多條檢索途徑,歸納起來主要有分類途徑、主題途徑、題名途徑等。(1)分類檢索途徑。是按文獻(xiàn)所屬的學(xué)科類別來檢索文獻(xiàn)的途徑。主要運(yùn)用于檢索課題要求的是泛指性較強(qiáng)的文獻(xiàn)信息。(2)主題檢索途徑。是從文獻(xiàn)的主題概念出發(fā),按確定的主題詞來檢索文獻(xiàn)的一種途徑。(3)題名檢索途徑。是根據(jù)文獻(xiàn)名稱來檢索文獻(xiàn)的途徑。文獻(xiàn)題名主要指書名、刊名、篇名等。(4)著者檢索途徑。是通過已知著者(個(gè)人著者、團(tuán)體著者)的名稱來檢索文獻(xiàn)的途徑。(5)號(hào)碼檢索途徑。是通過已知號(hào)碼(專利號(hào)、標(biāo)準(zhǔn)號(hào)、報(bào)告號(hào))來檢索文獻(xiàn)的途徑。(6)其它檢索途徑。在檢索某些學(xué)科或?qū)I(yè)的文獻(xiàn)時(shí),有一些特殊的檢索途徑。如美國(guó)《化學(xué)文摘》中有分子式索引,從分子式入手來查找有關(guān)文獻(xiàn)。3、確定信息檢索途徑和標(biāo)識(shí)714、確定信息檢索方法檢索方法的選擇可根據(jù)課題性質(zhì)、檢索的對(duì)象、檢索的范圍和實(shí)際可能,確定某個(gè)具體課題的檢索方法,如采用直接法、追溯法、綜合法等。4、確定信息檢索方法725、構(gòu)建檢索表達(dá)式

檢索表達(dá)式是計(jì)算機(jī)檢索中用來表達(dá)用戶提問的邏輯表達(dá)式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成,是檢索策略的具體體現(xiàn)。6、檢索并調(diào)整檢索策略

通過檢索表達(dá)式對(duì)檢出的檢索結(jié)果進(jìn)行分析,分析檢索結(jié)果是否與檢索要求一致,不時(shí)要修改檢索詞和檢索表達(dá)式,直到得到滿意的結(jié)果。5、構(gòu)建檢索表達(dá)式737、掌握獲取原文的線索在獲取信息線索時(shí)要仔細(xì)閱讀,判斷所檢出的信息是否符合檢索的要求,不僅看篇名,還要閱讀整個(gè)著錄格式,進(jìn)行綜合分析。7、掌握獲取原文的線索748、索取原始文獻(xiàn)索取原始文獻(xiàn)是信息檢索的最后一步,根據(jù)出版類型在圖書館或情報(bào)機(jī)構(gòu)查找館藏目錄或聯(lián)合目錄確定館藏。原則上說,應(yīng)該按“由近及遠(yuǎn)”的順序逐步擴(kuò)大查找館藏目錄或聯(lián)合目錄確定館藏;也盡可能多渠道、多方式地獲取原文,如利用與國(guó)外圖書館的館際互借,大型國(guó)際聯(lián)機(jī)信息檢索系統(tǒng)的聯(lián)機(jī)訂購,Internet上的電子郵件和下載服務(wù),或者與出版商直接聯(lián)系等。8、索取原始文獻(xiàn)75五、手工、機(jī)械和計(jì)算機(jī)信息檢索簡(jiǎn)介1、手工信息檢索手工信息檢索工具的檢索方法,從編制的角度,是指使內(nèi)容有序化的編排方法;從使用者的角度,是指查考內(nèi)容的檢索方法。目前比較常用的方法有形序排檢法、音序排檢法、分類排檢法、主題排檢法、時(shí)序排檢法和地序排檢法等。(1)形序排檢法。將檢索工具的內(nèi)容依據(jù)漢字的形體特點(diǎn)設(shè)計(jì)制定的排列順序的方法,主要包括部首法、筆畫法。(漢字常用的檢字法)(2)漢語拼音音序排檢法。將檢索工具的內(nèi)容依據(jù)漢字的讀音設(shè)計(jì)制定的排列順序的方法。主要包括純音序排列法和音序形序排列法兩種。(漢字常用的檢字法)五、手工、機(jī)械和計(jì)算機(jī)信息檢索簡(jiǎn)介76(3)分類排檢法。是將詞目、條目或文獻(xiàn)按知識(shí)內(nèi)容、學(xué)科屬性分門別類地加以歸并集中,按邏輯原則排列順序的一種排檢方法?;拘问绞牵喊粗R(shí)系統(tǒng)、學(xué)科體系層層分類,每一類目下集中同類子目或文獻(xiàn);按類目、子目、或文獻(xiàn)的內(nèi)在聯(lián)系排列順序。(4)主題排檢法。是指以規(guī)范化的自然語言為標(biāo)識(shí)符號(hào),來標(biāo)引文獻(xiàn)中心內(nèi)容的一種排檢方法。主題排檢法的一般形式為:主題詞提示文獻(xiàn)記錄的中心內(nèi)容或?qū)ο?,主題詞本身則按首字讀音或筆畫等順序排列。(5)時(shí)序排檢法。是指按時(shí)間的順序組合文獻(xiàn)信息素材,主要用于編制年譜、年表等檢索工具。(6)地序排檢法。是指按一定時(shí)期的行政區(qū)域來排列文獻(xiàn)信息素材,這種可以把同一地區(qū)的有關(guān)信息素材集中在一起,全面地反映某一地區(qū)、某一國(guó)家的歷史和現(xiàn)狀。(3)分類排檢法。是將詞目、條目或文獻(xiàn)按知識(shí)內(nèi)容、學(xué)科屬性分772、機(jī)械信息檢索可分為機(jī)電信息檢索和光電信息檢索兩種。機(jī)械信息檢索最初是從簡(jiǎn)單的穿孔卡片逐步發(fā)展起來的。機(jī)電信息檢索系統(tǒng):手檢穿孔卡片、機(jī)檢穿孔卡片、選卡機(jī)光電信息檢索系統(tǒng):縮微膠卷、膠片及檢索機(jī)等。3、計(jì)算機(jī)信息檢索現(xiàn)已形成了聯(lián)機(jī)信息檢索、多媒體信息檢索、光盤信息檢索與網(wǎng)絡(luò)信息檢索并存的局面。

特點(diǎn):檢索速度快、檢索途徑多、更新快、資源共享、檢索方便靈活、檢索結(jié)果可以直接輸出。2、機(jī)械信息檢索78計(jì)算機(jī)檢索的基本技術(shù)(方法)可分為:(一)布爾(邏輯)檢索布爾邏輯檢索是建立最早的檢索理論,也是檢索系統(tǒng)中應(yīng)用最廣泛的檢索技術(shù)。它通過對(duì)布爾邏輯運(yùn)算符進(jìn)行組配,形成檢索式,用以表達(dá)用戶的檢索需求,并通過一定的算法和手段進(jìn)行檢索。布爾邏輯運(yùn)算符及其關(guān)系

常用的布爾邏輯運(yùn)算符有三種:邏輯或(OR)、邏輯與(AND)、邏輯非(NOT)

AORB(+)AANDB(*)ANOTB(-)BNOTA計(jì)算機(jī)檢索的基本技術(shù)(方法)可分為:AORB(79(二)截詞檢索截詞檢索是指對(duì)含有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論