第2講 文獻信息檢索基本原理課件_第1頁
第2講 文獻信息檢索基本原理課件_第2頁
第2講 文獻信息檢索基本原理課件_第3頁
第2講 文獻信息檢索基本原理課件_第4頁
第2講 文獻信息檢索基本原理課件_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第2講文獻信息檢索

基本理論第2講文獻信息檢索基本原理學習目的要求了解信息檢索系統(tǒng)概念了解手工信息檢索系統(tǒng)的類型掌握手工信息檢索系統(tǒng)的著錄格式和常用的手工信息檢索系統(tǒng)的信息檢索方法掌握信息檢索語言掌握信息檢索語言的基本類型掌握信息檢索的基本方法第2講文獻信息檢索基本原理一、信息的搜集與選擇

1、確定收集的原則收集的學科范圍(如機械、物理、化學等),主題范圍(機床,刀具),覆蓋面,信息種類,文種,時間跨度,收集的數(shù)量,摘儲率

2、收集的途徑

3、選擇所需信息2.1文獻信息存儲過程第2講文獻信息檢索基本原理二、信息的著錄加工1、著錄目的:是把一篇文獻變成一條著錄,壓縮后必須能體現(xiàn)文獻的外表特征和內(nèi)容特征。外部特征——指文獻上顯而易見的,一般情況下不反映文獻實質(zhì)意義的那些特征,如書名、人名、各種符號標識(專利號,標準號,文獻號等)、機構(gòu)名等。內(nèi)容特征——指表征文獻實質(zhì)意義的特征,如主題詞(敘詞,單元詞、關(guān)鍵詞)、分類號、化學符號等。2、著錄內(nèi)容外表特征:篇名,作者,工作單位,號碼,文種出處:發(fā)表在什么刊物,刊號,卷,期,頁數(shù)內(nèi)容特征:摘要3、著錄格式第2講文獻信息檢索基本原理

圖書著錄館藏號: 文摘類型: RISBN號: 92-828-556-S語種: Ger中圖類號: TD94文獻題名: NMR——SpekeropiezurstofflichenCharakterisierungvonBraunkohlenbeiderhydrierendenVeredlung作者: Michel,D…團體作者: EuropeanCommission國別: BE縮稱: CEC出版日期: 1999頁: 164S第2講文獻信息檢索基本原理

期刊著錄記錄標識: 記錄來源: JX文獻類型: 刊文獻題名: 機械零件組成編碼頻率分析及設計規(guī)范化通用標準化作者: 鮑子強作者單位: 長沙重型機器廠母體文獻: 礦山機械卷期頁碼: 1997,No.12,p.39~42出版單位: 洛陽礦山機械研究所分類號: 97*TD-3*12主題詞: 標準化,成組技術(shù),機械零件,設計文摘: (略)第2講文獻信息檢索基本原理

專利著錄發(fā)明名稱: 蓖麻脫皮篩選機范疇: B07B1/20范疇分類: 27F33A13A國別: 省市: 12申請人: 劉國喜通訊地址: (300011)天津市河西區(qū)三水南里126幢發(fā)明人: 劉國喜代理人: 閆俊芬代理機構(gòu): 12100天津市專利事務所專利代理服務部代理機構(gòu)地址: (300051)天津市和平區(qū)成都道116號法律狀態(tài): 授權(quán)說明書頁數(shù): 003附圖頁數(shù): 02權(quán)項數(shù): 003文摘:(略)第2講文獻信息檢索基本原理

會議文獻著錄論文題名: 從更寬闊的視野觀察與思考冶金反應工程學問題作者: 曲英<地址>:北京科技大學,李士琦<地址>:北京科技大學會議名稱: 第七屆全國冶金反應工程學術(shù)會議會議屆次: 7會議時間: 會議地點: 沈陽會議主辦者: 東北大學母體文獻: 東北大學學報(自然科學版)(第19卷增刊)出版地: 沈陽出版單位: 《東北大學學報》編輯部出版時間: 頁碼: 1~3館藏號: H043339分類號: TF01,N94關(guān)鍵詞: 反映工程@,冶金@,系統(tǒng)工程,可持續(xù)發(fā)展文摘: (略)第2講文獻信息檢索基本原理

標準文獻著錄標準號: GB/T1990.2-98發(fā)布日期: 1998-11-13標準狀態(tài): ST實施日期: 1999-05-01起草單位: 中國標準化與信息分類編碼研究所標準名稱: 質(zhì)量管理和質(zhì)量保證標準第2部分:GB/T19001、GB/T19002和GB/T19003實施通用指南正文語種: 漢語英文名稱: Qualitymanagementandqualityassurancestandards-part2:GenericguidelinesfortheapplicationofGB/T19001、GB/T19002andGB/T19003稽核項: 0中國標準分類號: A00第2講文獻信息檢索基本原理標準文獻著錄(續(xù))采用關(guān)系: ISO9000-2-97.IDT主題詞: 質(zhì)量管理,質(zhì)量保證,質(zhì)量英文主題詞: QUALITYASSURANCEQUALITYMANAGEMENTQUALITY國別: 中國申請?zhí)枺?公告號: 申請日: 公告日: 審定公告日: 授權(quán)日: 授權(quán)公告日: 第2講文獻信息檢索基本原理

學位論文著錄論文題目: 自控式同步電機機端電壓位置監(jiān)測器數(shù)字控制作者: 劉波授予學位: 碩士導師姓名: 李永東授予學位單位: 清華大學分類號: TM762.3館藏號: Y248534論文頁數(shù): 97出版時間: 1999.3主題詞: 自控式同步電機機端電壓位置監(jiān)測器數(shù)字控制文摘: (略)第2講文獻信息檢索基本原理

科技報告著錄TITLE: Humanfactorsinaviationmaintenance,phase4DocumentID: 19950021275N(95N27696): NASATechnicalReportsReportNumber: DOT/FAA/AM-95/14SalesAgency&Price: CASIHardcopyA09CASIMicroficheA02Authors: Shepherd,WilliamT.(FederalAviationAdministration)Published: May01,1995CorporateSource: FederalAviationAdministration(Washington,DC,UnitedStates)GalaxyScientificCorp.(Atlanta,GA,Unitedstates)Pages: 176ContractNumber: DTFA01-94-C-01013NASASubjectCategory: MAN/SYSTEMTECHNOLOGYANDLIFESUPPORT第2講文獻信息檢索基本原理三、信息的標引加工1、定義把文獻的主要內(nèi)容用非常簡明的標識(即標志)表示出來。標識可以是號碼(分類號),也可以是科技名詞或詞組(主題詞),也可以是其它的。2、作用

1)、相同內(nèi)容的文獻集中在一起,不同內(nèi)容的區(qū)分開來

2)、形成有序的序列,即按一定規(guī)律排列,把存儲進檢索工具的著錄按照一定的規(guī)律排列起來,形成有序的排檢系統(tǒng),這樣可以提供檢索途徑。3、標引加工的類型分類法標引用分類號作為標識主題法標引用代表文獻主題內(nèi)容的實質(zhì)性的詞匯作為標識

第2講文獻信息檢索基本原理四、信息的結(jié)構(gòu)編排一般有三種排列方式

1、一條著錄給一個順序編碼,號碼是唯一的,按號碼順序排列。號碼可以表示存儲地址,但通過號碼文獻的邏輯內(nèi)容體現(xiàn)不出來

2、分類編排,按分類號的順序

3、按主題詞的字母順序第2講文獻信息檢索基本原理一、檢索概念將信息按一定的方式組織和存儲起來,并從任何信息集合中識別和獲取所需信息的過程及其所采取的一系列方法和策略。信息檢索包括:存儲與檢索檢索的本質(zhì):從已存儲的文獻資源中找出與需求相關(guān)的文獻。2.2文獻信息檢索基本原理第2講文獻信息檢索基本原理二、文獻檢索的基本原理將檢索提問標識與存貯在檢索工具中的標引標識相比較,兩者一致或信息標識包含著檢索提問標識,則含有該標識的信息就從檢索工具中輸出;對信息的著錄是按一定規(guī)則對信息的外表特征和內(nèi)容特征加以簡單明確的表述,信息的標引是對其內(nèi)容按一定的分類表或主題詞表給出分類號或主題詞;檢索過程則是按同樣的主題詞表或分類表及組配原則分析課題,形成檢索提問標識,根據(jù)檢索工具所提供的檢索途徑,從信息集合中查找與檢索提問標識相符的信息特征標識的過程。第2講文獻信息檢索基本原理原始信息信息分析、著錄和標引信息檢索系統(tǒng)檢索課題課題分析檢索語言檢索結(jié)果信息存貯信息檢索提問標識標引標識第2講文獻信息檢索基本原理

從信息資源管理的角度講,信息檢索是從已存儲的信息資源中檢索出與用戶提問相關(guān)的文獻、知識、事實、數(shù)據(jù)的邏輯運算和技術(shù)操作過程的總和,以文獻檢索為本源。

是一種從大量集合的文獻中查找出主題及其屬性符合用戶要求的情報過程。查找的對象不一定就是文獻,有時也可能是正在研究中的項目,或正在進行某項工作的人員與機構(gòu),或圖書館的藏書目錄等,但基本原理是一致的。第2講文獻信息檢索基本原理用戶的檢索提問詞與數(shù)據(jù)庫文獻記錄中的標引詞進行對比,當提問詞與標引詞匹配一致時,即為命中,檢索成功。能否準確地檢索出用戶所需的信息,關(guān)鍵在于能否準確地選擇檢索詞。

如何保證存儲和檢索聯(lián)系一致?(檢索語言)第2講文獻信息檢索基本原理三、信息檢索的類型1按檢索對象分①數(shù)值檢索

特征:以特定的數(shù)值為檢索對象。比如,查找某一統(tǒng)計數(shù)據(jù),某一數(shù)學公式,某一材料的成分、性能,某種元件的型號、參數(shù)等。解決方案:利用手冊、年鑒等參考工具書或數(shù)值型數(shù)據(jù)庫來檢索。

第2講文獻信息檢索基本原理

②事實檢索特征:以特定的事實為檢索對象。比如,查找名詞術(shù)語的解釋,了解某人或某機構(gòu)的簡況,或考證某一事件發(fā)生的前因后果等。解決方案:利用辭典、百科全書、年鑒、名錄等參考工具書或事實型數(shù)據(jù)庫來檢索。第2講文獻信息檢索基本原理③文獻檢索特征:以特定的文獻為檢索對象。比如,查找有關(guān)某一研究課題的一定年限內(nèi)的相關(guān)文獻,或從事一項發(fā)明創(chuàng)造而需要文獻查新等。解決方案:利用文摘、題錄等各種手檢工具書或書目文獻型數(shù)據(jù)庫來檢索。第2講文獻信息檢索基本原理2按檢索手段分手工檢索計算機檢索

--光盤檢索

--聯(lián)機檢索

--網(wǎng)絡檢索第2講文獻信息檢索基本原理四、檢索語言為溝通文獻標引與文獻檢索而編制的人工語言,是連接信息存儲和檢索兩個過程中標引人員與檢索人員雙方思路的渠道,是用于文獻標引和檢索提問的約定語言。如果沒有檢索語言作為標引人員和檢索人員的共同語言,就很難使得標引人員對文獻信息內(nèi)容的表達和檢索人員對相同文獻信息內(nèi)容需求時的表達取得一致,信息檢索也就不可能順利實現(xiàn)。編制檢索語言的目的:不但能夠保證不同的標引人員描述文獻特征的一致性,而且能夠保證檢索提問詞與文獻標引詞的一致性。第2講文獻信息檢索基本原理檢索語言:標引員與檢索員之間的約定語言。提供檢索所需的文獻特征。檢索標識:描述文獻特征,且專門用于情報檢索的符號。標引:把文獻的主題內(nèi)容和某些具有檢索意義的特征,用檢索標識表示出來的過程。第2講文獻信息檢索基本原理檢索標識(檢索語言)反映文獻外部特征檢索標識反映文獻內(nèi)容特征檢索標識著者文獻號(如:專利號、標準號、報告號、ISBN號、ISSN號)其他(如:題名)分類號主題詞關(guān)鍵詞單元詞標題詞敘詞規(guī)范語言自然語言主題詞語言分類語言第2講文獻信息檢索基本原理1分類語言以學科體系為基礎(chǔ),用號碼作為概念標識,按分類編排的檢索語言。國內(nèi)外比較重要的分類語言表:《國際專利分類表》《杜威十進分類法》《中國圖書館圖書分類法》《中國科學院圖書分類法》等。第2講文獻信息檢索基本原理主要特點:按學科專業(yè)性質(zhì)集中圖書區(qū)分不同性質(zhì)的圖書;集中性質(zhì)相同的圖書性質(zhì);相近的放在相近的位置;按照遠近親疏的關(guān)系把圖書組成為一個有條理的體系;提供從學科分類查找圖書的途徑。第2講文獻信息檢索基本原理(1)分類法—中圖法將圖書分為社會科學、自然科學、綜合三大類。類目展開之式見下圖。分類標識即分類號,由字母和數(shù)字組成采用等級列舉表達從屬關(guān)系上位類目與下位類目的關(guān)系:上位類目一定能包含其各個下位類目,而下位類目一定帶有上位類目的屬性。分類號越長,表示的學科范圍越窄。為了清楚醒目,通常在分類號的第三位數(shù)字后,隔以,如F279.712,TQ032.4第2講文獻信息檢索基本原理《中圖法》的分類原則

根據(jù)當前社會科學和自然科學所包括的學科多、發(fā)展快等特點,按圖書學科內(nèi)容作為分類的主要標準與依據(jù)。將圖書在五個基本部類的基礎(chǔ)上分為22個大類,分別以拉丁字母A—Z表示。第2講文獻信息檢索基本原理C社會科學總論D政治、法律E軍事F經(jīng)濟G文教、科學、體育H語言J文學I藝術(shù)K歷史、地理

自然科學總論NRSTO數(shù)理化P天文學、地球科學Q生物科學醫(yī)藥、衛(wèi)生農(nóng)業(yè)科學工業(yè)技術(shù)U交通運輸V航空、航天X環(huán)境科學Z綜合性圖書社會科學自然科學機械、儀表建筑科學

馬列主義、毛澤東思想A馬列B哲學哲學綜合TBTDTETFTGTHTJTLTKTMTNTPTQTSTUTV一般工業(yè)技術(shù)礦業(yè)工程石油冶金工業(yè)無線電、電子學、電訊技術(shù)自動化計算化學工業(yè)輕工業(yè)、手工業(yè)金屬學武器工業(yè)動力工程原子能技術(shù)電工技術(shù)水利工程第2講文獻信息檢索基本原理實例:按中圖分類法檢索1檢索各類期刊目錄(北京國圖書刊)2檢索圖書

(贏海書店)第2講文獻信息檢索基本原理(2)中圖法-索書號(callnumber)反映了圖書的具體排列次序和存放位置組成:分類號+書次號分類號:按學科分類圖書書次號:區(qū)分同類圖書,兩種取法:種次號:按圖書到館的先后順序給予號碼。缺點:會使同一著者的同一類著作排放在不同位置。著者號:按著者名稱(代碼)來區(qū)分同一分類號下的不同文獻。第2講文獻信息檢索基本原理索書號是識別一種圖書的唯一標識,圖書館同一分類號的文獻數(shù)量很多,為了區(qū)別相同類號的文獻,在分類號的基礎(chǔ)上,又給了一個區(qū)分符號,這個符號稱之為書次號。書次號與分類號一起共同構(gòu)成索書號。圖書館的文獻就是按照索書號的順序排架管理的。中文書索書號如:TP312/

39,西文書索書號如:O6/FC56第2講文獻信息檢索基本原理(3)中圖法-圖書的排架順序

按索書號排架

先順序分類號,對位排列

再順序書次號種次號:由數(shù)字構(gòu)成,按數(shù)字大小順序著者號:由字母和數(shù)字構(gòu)成,對位排列第2講文獻信息檢索基本原理2主題詞語言

用文字符號表示文獻主題的檢索標識。三個基本特征著眼于從事物的特性方面去提示文獻主題采用文字符號按字順排列第2講文獻信息檢索基本原理(1)主題詞語言種類關(guān)鍵詞語言——直接從文獻題名、文摘或正文中抽取出來的未經(jīng)規(guī)范化處理的詞。是一種用自然語言做標識的檢索語言。單元詞語言——是從文獻內(nèi)容中抽選出來的最基本的詞匯,將代表最一般、最基本的、不可再分割的概念單元的詞作為單獨標引文獻的單位。敘詞語言——從自然語言中優(yōu)選出來并經(jīng)過規(guī)范化處理的名詞術(shù)語。采用表示單元概念的規(guī)范化語詞的組配來對文獻內(nèi)容主題進行描述的檢索語言,是目前使用最廣泛的主題語言。標題詞語言——最早使用的一種主題語言。以規(guī)范化的自然語義作為標識,來表達文獻涉及的主題概念,并將全部標識按字母順序排列。表達主題的詞語稱為標題詞。第2講文獻信息檢索基本原理(2)與分類語言區(qū)別第2講文獻信息檢索基本原理(3)關(guān)鍵詞(keyword)

直接來源于從文獻篇名、正文和文摘為具有實際意義的詞語,禁用詞(stop-term)如冠詞,介詞,副詞等除外關(guān)鍵詞法屬自然語言第2講文獻信息檢索基本原理關(guān)鍵詞—問題問題一:同義詞標引--引起漏檢主題檢索體系是按主題詞字順排列的,而用于標引的關(guān)鍵詞呈現(xiàn)出多種字面形式-同義詞時,將使同一主題的文獻分散到不同的字順位置,使查全率受到影響。例:飛機

AirplaneAircraftPlanes第2講文獻信息檢索基本原理問題二:多義詞標引--引起誤檢多義詞cell

電池兩個完全不同的概念

細胞檢索詞cell查找細胞方面的文獻結(jié)果:電池、細胞兩方面的文獻同時被檢出第2講文獻信息檢索基本原理關(guān)鍵詞—問題的解決方案—主題詞的規(guī)范化

為了避免上述現(xiàn)象,采用規(guī)范化的詞進行標引。所謂規(guī)范化,即詞和概念一一對應,一個詞表達一個概念。第2講文獻信息檢索基本原理(4)單元詞

詞義已是單元概念不可再分規(guī)范詞例:單元詞-汽車,溫度表,電動機非單元詞-載重汽車

載重工具

汽車第2講文獻信息檢索基本原理(5)標題詞

一組固定組配的規(guī)范化主題詞組配:是指將兩個或多個主題概念,按一定的規(guī)則復合起來,以表達一個更專指的主題概念標題詞有兩級:主標題詞:表示事物、概念副標題詞:限定修飾主標題詞,說明主標題所涉及的方面。例:計算機科學-發(fā)展趨勢第2講文獻信息檢索基本原理主標題詞除用單個名詞或動名詞外,還有下列三種形式:正敘式倒敘式并列式第2講文獻信息檢索基本原理主標題詞-正敘式正敘式:直接采用事物的名稱、現(xiàn)象、方法或過程等詞。例如:

COMPUTERPROGRAMMINGLANGUAGES(計算機程序語言)

ELECTRICPOWERSYSTEMS(電力系統(tǒng))ELECTRONGUNS(電子槍)

IMAGEPROCESSING(圖像處理)

MATERIALSSCIENCE(材料科學)第2講文獻信息檢索基本原理主標題詞-倒敘式倒敘式:將事物的名稱放在前,后加修飾性的詞說明其范圍。例如:

COMPUTER,ANALOG(模擬計算機)COMPUTER,DIGITAL(數(shù)字計算機)OSCILLATORS,MICROWAVE(微波振蕩器)第2講文獻信息檢索基本原理主標題詞-并列式并列式:將各自獨立但又有某些聯(lián)系的事物或概念并列起來。例如:

PATENTSANDINVENTION(專利與發(fā)明)

ROCKETANDMISSILES(火箭與導彈)

SILICONANDALLOYS(硅和硅合金)第2講文獻信息檢索基本原理標題詞與關(guān)鍵詞、單元詞的不同標題詞與關(guān)鍵詞和單元詞都有明顯的不同,它不是用一個詞而是用一對詞來表現(xiàn)主題概念,而且這一對詞的組配關(guān)系是固定的。第2講文獻信息檢索基本原理(6)敘詞指采用表示單元概念的規(guī)范化詞語的組合來對信息主題或內(nèi)容進行描述。從自然語言中優(yōu)選出來的經(jīng)過規(guī)范化出來的名詞術(shù)語。

來源:是指一些以概念為基礎(chǔ)、經(jīng)過規(guī)范化處理、具有組配功能的動態(tài)性的詞或詞組。敘詞語言的最主要的特征:

規(guī)范化概念組配

第2講文獻信息檢索基本原理國內(nèi)外常用的敘詞表主國有:1.英國《科學文摘》使用的《INSPEC敘詞表》2.美國《工程索引》使用的《COMPENDEX敘詞表》3.我國的《漢語主題詞表》第2講文獻信息檢索基本原理(7)主題標引賦予二次文獻檢索標識-主題詞主題標引的步驟:分析文獻內(nèi)容

形成主題概念

標引主題詞

將標引主題詞按字順排列使論述同一主題內(nèi)容的文獻集中在一起

顯然,一篇文獻所要表達的主題概念或要涉及的問題通常不止一個,所以與分類號不同,標引一篇文獻的主題詞通常不止一個。第2講文獻信息檢索基本原理(8)主題詞表圖書分類法

分類表主題標引

主題詞表

單元詞表、標題表、敘詞表在敘詞法中,文獻的主題概念可以用多個敘詞表示,因此可以形成任意合乎邏輯的組配和眾多的檢索途徑。很適用于計算機情報檢索。依據(jù)第2講文獻信息檢索基本原理利用分類途徑查找信息的步驟分析研究所需要查找信息的內(nèi)容主題;判斷該主題在分類法中屬于哪一大類,然后再從大類一級一級往下尋找,直到查到具體類目(或有關(guān)類目),記下類號為止;根據(jù)檢索到的類號在檢索工具中檢索,便可查得所需信息。第2講文獻信息檢索基本原理利用主題途徑查找信息的方法和步驟對研究課題進行分析主題分析;將所得出的主題概念轉(zhuǎn)化成主題詞,利用主題詞表找出相應的主題詞;再按查出的主題詞字順去翻檢目錄、索引或輸入計算機數(shù)據(jù)庫;要注意選取最專指的主題詞,再利用主題詞找出相應的主題詞;應將主標題與副標題,說明語聯(lián)系起來;在使用關(guān)鍵詞檢索信息時,除了使用某一常用的關(guān)鍵詞外,還應當使用該詞的同義詞、近義詞作為檢索入口。第2講文獻信息檢索基本原理五、文獻檢索方法1追溯法(回溯法)以文獻后面所附的參考文獻為線索的查找方法;缺點:方法查全率低,目前罕有人用。

第2講文獻信息檢索基本原理追溯法實施方法:從已有的文獻后面所附的參考文獻入手,逐一查找全文,再從這些原文后面所列的參考文獻逐一追查,不斷擴大檢索線索,從而獲得一批相關(guān)文獻信息的查找方法。第2講文獻信息檢索基本原理2工具法(常用法)利用文摘、題錄或索引等檢索工具來查找文獻的方法,也稱工具法。按所查文獻的順序,可分為:順查法倒查法抽查法手頭文獻日期過去————

————現(xiàn)在

倒查順查

第2講文獻信息檢索基本原理(1)順查法以檢索課題的起始年代為起點,按時間順序由遠及近的查找方法,直到查得的文獻可以滿足要求為止。適用于無綜述性文獻可參考時使用。特點:查的文獻較完整,查全率較高,但工作量大,效率不高。第2講文獻信息檢索基本原理(2)倒查法由近到遠,重點放在近期的文獻,以便掌握最近一段時間該課題所達到的水平及方向。多用于新課題,或老技術(shù)的新發(fā)展,從新情況開始查到一定的基本資料時為止。特點:省時,查全率不高。第2講文獻信息檢索基本原理(3)抽查法針對學科發(fā)展特點,抽出其發(fā)展迅速、發(fā)表文獻較多一段時期,逐年進行檢索的一種方法。(選查發(fā)展旺盛時期的文獻。)適用于:對該學科或課題的發(fā)展熟悉的情況。特點:節(jié)約時間,但可能會漏檢。第2講文獻信息檢索基本原理3交替法(綜合法)結(jié)合追溯法和常用法,先利用檢索工具查出一定時期內(nèi)的一批有用文獻,在利用這些文獻后面的參考文獻,追溯查出前一時期內(nèi)的文獻,如此循環(huán)交替的使用兩種方法直到滿足要求為止。特點:檢索效率高,檢索效果好。第2講文獻信息檢索基本原理4檢索方法的選擇原則檢索條件如果沒有檢索工具可供使用,宜采用追溯法;如果有現(xiàn)成檢索工具可供使用,宜采用工具法。檢索要求如果檢索時間充裕,可采用順查法;如果檢索時間緊迫,宜采用倒查法。學科特點新興學科,一般采用順查法;年代久遠(或無法查考)的學科,只能采用倒查法。第2講文獻信息檢索基本原理5文獻檢索四點要求(l)準,高的查準率。(2)全,高的查全率。搜集的資料不僅有正面的,也有反面的,既有縱向的也有橫向的,既有中文的也有外文的,既全面又系統(tǒng)。(3)深,占有情報的多樣性及內(nèi)容的專深。(4)快,要迅速。一個準確度高、有價值的情報資料,如果檢索速度慢了,耽誤了時機,就會失去它的應有價值。

第2講文獻信息檢索基本原理六、文獻檢索途徑(檢索點)1題名途徑利用圖書、期刊、資料等的題目名稱對文獻進行檢索的途徑。

包括文獻篇名、圖書書名、期刊刊名。常見的題名索引主要有篇名索引、書名索引、刊名索引等。題名索引通常按字順排檢方式,因此,檢索也應該采取相應的途徑。一般多用于查找圖書、期刊、會議名稱。常用于目錄性檢索工具/系統(tǒng),如《書名目錄》《期刊目錄》《期刊聯(lián)合目錄》等。

第2講文獻信息檢索基本原理2著者途徑用文獻的著作者、編者、譯者的姓名或機構(gòu)團體名稱編制檢索特定的個人或團體所生產(chǎn)的文獻。

檢索中,著者是一個廣義的概念,是對文獻內(nèi)容負有責任的作者、編者、譯者等,可以是個人、團體、機構(gòu)、組織,甚至還包括著者的單位。通過著者途徑進行檢索,主要可利用著者索引。所有著者索引都采用字順排列方式,如果著者是個人,就以個人姓名字順排列,如果著者是機構(gòu),就以機構(gòu)名稱字順排列。因此,檢索也應該按相應的途徑。第2講文獻信息檢索基本原理一般檢索系統(tǒng)都有著者(個人)索引,有的還有團體著者(機構(gòu))索引,均按字順編排,其下為記錄個數(shù)或文摘號。在利用內(nèi)容途徑查文獻有困難時,如一些新近發(fā)展起來的學科或技術(shù),往往難于確定類目或檢索詞,使用著者途徑查找文獻就顯出其優(yōu)越性,但該方法不能滿足全面檢索某一課題文獻的需要。第2講文獻信息檢索基本原理

使用著者途徑應注意:書寫格式:姓前(全稱)、名后(縮寫,即用首字母)

WillianHenryHarrisonHarrisonWH第2講文獻信息檢索基本原理3分類途徑以文獻的內(nèi)容在分類體系中的位置作為文獻的檢索途徑,它的檢索標志就是所給定的分類號碼。

大多數(shù)檢索工具都采用分類語言作為正文編排體系的依據(jù),分類目次通常不采用字順排列類目和檢索類目,而是按照學科專業(yè)角度的層層邏輯劃分建立分類類目體系。檢索時要選擇合適的分類類目。

第2講文獻信息檢索基本原理第2講文獻信息檢索基本原理第2講文獻信息檢索基本原理4主題途徑通過表達文獻的內(nèi)容實質(zhì),經(jīng)過規(guī)范化的名詞或詞組來檢索文獻,檢索時直接按主題詞的字順,像查字典一樣,即可查到某個特定主題的文獻。

主題索引大多按字母排列方式。第2講文獻信息檢索基本原理EI主題詞表第2講文獻信息檢索基本原理5關(guān)鍵詞途徑按照文獻題目或內(nèi)容中具有實際意義并能表述文獻的主要內(nèi)容、起關(guān)鍵作用的詞或詞組,從關(guān)鍵詞的字順檢索系統(tǒng)中檢索的途徑。

關(guān)鍵詞是指表示文獻主題意義的由作者使用的名詞或詞組。第2講文獻信息檢索基本原理示例第2講文獻信息檢索基本原理6序號途徑通過已知號碼查找文獻的途徑,如報告號、專利號、標準號、會議號等。

序號索引一般按照文獻序號的大小順序排列,如文獻序號純粹由數(shù)字組成,就按數(shù)字大小生序排列,如果序號包含數(shù)字和字母,就按數(shù)字大小和字母順序升序排列。如果前面是字母后面是數(shù)字混合組成的序號,就先按字母順序排列,字母相同,再按后面的數(shù)字大小排列。因此,序號檢索也應按照同樣方法。第2講文獻信息檢索基本原理7引文途徑文獻所附參考文獻或引用文獻,是文獻的外表特征之一。利用這種引文而編制的索引系統(tǒng),稱之為引文系統(tǒng)。它提供從被引論文去檢索引用論文的一種途徑。第2講文獻信息檢索基本原理8專門項目途徑

從文獻信息所包含的或有關(guān)的名詞術(shù)語、地名、人名、機構(gòu)名、商品名、生物屬名、年代等的特定順序進行檢索,可以解決某些特別的問題。

第2講文獻信息檢索基本原理七、文獻檢索的常用途徑1

題名:注意題名關(guān)鍵詞的排序特征2作者:通常按姓在前名在后方式檢索3分類:我國高校與公共圖書館的文獻資料,一般采用《中國圖書館圖書分類法》(簡稱《中圖法》)進行分類。4主題詞:主題是指表征文獻內(nèi)容特征、經(jīng)過規(guī)范化的名詞術(shù)語。檢索者通過檢索這些規(guī)范的詞語來找到所要的文獻和情報?!痘瘜W化工主題詞表》第2講文獻信息檢索基本原理5關(guān)鍵詞:直接從文獻的篇名或文摘或全文中抽取出來的非規(guī)范化檢索詞。6順序號檢索:專利號,標準號,研究報告號。7全文檢索

8引文檢索第2講文獻信息檢索基本原理八、選擇檢索途徑的原則1從已知文獻特征選擇檢索途徑

如已知文獻題名、作者姓名或文獻代碼等條件,則選擇相應的檢索途徑。2從課題檢索要求選擇檢索途徑

根據(jù)課題檢索的專指程度要求來選定檢索途徑。第2講文獻信息檢索基本原理九、文獻檢索工具含義:用來報道,存儲和查找文獻的印刷型出版物或數(shù)據(jù)庫系統(tǒng)。文獻檢索工具是指對體積龐大、無序的一次文獻經(jīng)過加工壓縮而成體積較小的二次文獻,再根據(jù)一定的原理和規(guī)則編制而成的工具??蓾M足各種用戶的不同層次的檢索需求。

是科學家和文獻專家對原始文獻進行收集、加工、分析,并給出有效的檢索途徑而形成的工具。第2講文獻信息檢索基本原理1檢索工具類型檢索工具可以依據(jù)不同的標準來劃分,根據(jù)著錄內(nèi)容可劃分為以下四種:

1)目錄(catalog)

目錄是對一批相關(guān)文獻外部特征的揭示和報道。通常以一個完整的出版或收藏單位為著錄的基本單位來報道和記錄文獻。只記錄文獻外部特征(如名稱,著者,出版事項等)。目錄一般按分類或字順編排,主要供人們了解出版或收藏機構(gòu)是否擁有所需圖書、期刊等出版物。

目錄類型:

館藏目錄:反映一個圖書館文獻收藏情況的目錄。

中國國家圖書館

聯(lián)合目錄:反映一個地區(qū)或一個系統(tǒng)甚至全國或世界范圍的圖書館、信息服務機構(gòu)文獻收藏情況的一種統(tǒng)一目錄。

全國中西文期刊聯(lián)合目錄

CALIS聯(lián)機公共數(shù)據(jù)庫

第2講文獻信息檢索基本原理按出版類型劃分:圖書目錄、期刊目錄、會議論文目錄。按物質(zhì)形式劃分:卡片目錄、書本目錄、機讀目錄(MARC)、聯(lián)機公共檢索目錄(OPAC,OnlinePublicAccessCatalog)等。

目錄示例:可參照圖書館主頁熟悉了解。

OPAC:是指以計算機編碼形式存貯在計算機系統(tǒng)內(nèi),供讀者通過終端設備進行聯(lián)機檢索的圖書館目錄,即書目數(shù)據(jù)庫的一種形式。第2講文獻信息檢索基本原理

2)題錄(bibliography、bibliographic、citation)

題錄是單篇文獻外表特征的揭示和報導,即對某一文獻外部特征的描述,由一組著錄項目構(gòu)成一條文獻記錄。題錄的著錄項目一般有著者,篇名及出處等,常以一個內(nèi)容上獨立的文獻單元(如一篇文章,圖書中的一部分,有時也可以是整本出版物)為基本著錄單位。題錄在揭示文獻內(nèi)容的深度方面,比目錄深入,但又比文摘簡單。示例1:第2講文獻信息檢索基本原理題錄示例2:EiCPXWeb(《工程索引》網(wǎng)絡版記錄題錄顯示格式)第2講文獻信息檢索基本原理文摘示例1:

3)文摘(abstract)

文摘是指對一份文獻(或稱一個文獻單元)的內(nèi)容所做的簡略、準確的描述,文摘的著錄項目除了著者,篇名及出處等外,還有表示文獻內(nèi)容特征的摘要。第2講文獻信息檢索基本原理文摘示例2:EiCPXWeb(《工程索引》網(wǎng)絡版記錄文摘顯示格式)第2講文獻信息檢索基本原理4)索引

(index)

索引是對一組信息集合的有系統(tǒng)的指引。索引是一種附屬性的檢索工具,通常稱為輔助索引。索引具有便于檢索,揭示事物比較深入、全面、明細等方面的優(yōu)點。索引的用途在文獻檢索中體現(xiàn)得極為突出,科技文獻數(shù)量龐大、內(nèi)容復雜多樣,使用面廣且頻繁。雖然已將其中絕大部分加工壓縮成文摘或題錄等。但如果沒索引,查檢起來還是很不方便。嚴格地說,沒有索引的檢索工具不能稱為完善的檢索工具。最常用的索引是主題索引、分類索引和著者索引等。第2講文獻信息檢索基本原理索引示例:EiCPXWeb(《工程索引》網(wǎng)絡版索引顯示格式)第2講文獻信息檢索基本原理目錄:以一件或一種完整的出版物,如一本書、一份科技報告、一種期刊等作為著錄基本單位的檢索工具。一般目錄主要揭示、報道這些單位出版物的外表特征。題錄:以單篇或單份文獻為著錄的基本單位的檢索工具,題錄也主要揭示、報道文獻的外表特征,但其著錄格式于目錄有所不同。文摘:在題錄的基礎(chǔ)上,在每條著錄款目后邊再加上文獻內(nèi)容的摘要。索引:一種廣泛存在于各種檢索工具以及各種文獻中的附屬檢索工具。第2講文獻信息檢索基本原理

網(wǎng)絡信息檢索工具—

搜索引擎(SearchEngine)

含義:就是這樣一些Internet上的網(wǎng)站,它們有自己的數(shù)據(jù)庫,保存了WEB上的很多的網(wǎng)頁的信息,用戶可以訪問它們的主頁,通過輸入和提交一些有關(guān)你想查找的信息的關(guān)鍵字,讓它們在自己的數(shù)據(jù)庫中檢索,并返回給你可能感興趣的網(wǎng)頁地址和內(nèi)容描述。與普通網(wǎng)站不同的是,搜索引擎網(wǎng)站的主要資源是它的索引數(shù)據(jù)庫,收集了全世界成百萬上千萬個網(wǎng)站和網(wǎng)頁的信息,存儲在可供檢索的大型服務器中,建立索引和目錄服務。主要功能:是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論