版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 計算機檢索策略計算機檢索策略 一、計算機檢索概述一、計算機檢索概述 1. 1. 計算機檢索定義計算機檢索定義 2. 2. 計算機檢索系統(tǒng)的構成計算機檢索系統(tǒng)的構成 3. 3. 計算機信息檢索的分類計算機信息檢索的分類1.1.計算機檢索定義計算機檢索定義 (1)計算機檢索定義計算機檢索定義 計算機信息檢索就是在計算機和人的共同作計算機信息檢索就是在計算機和人的共同作用下,按照一定的方法組織和存儲信息,并通過用下,按照一定的方法組織和存儲信息,并通過人人- -機對話從計算機存儲的大量數(shù)據(jù)中自動輸出用機對話從計算機存儲的大量數(shù)據(jù)中自動輸出用戶所需的那部分信息的過程。戶所需的那部分信息的過程。 (2
2、)(2)計算機信息檢索過程計算機信息檢索過程 信息存儲過程信息存儲過程 信息檢索過程信息檢索過程(3)(3)計算機信息檢索的本質計算機信息檢索的本質 是信息用戶的提問標識和信息集合數(shù)據(jù)庫特是信息用戶的提問標識和信息集合數(shù)據(jù)庫特征標識匹配的過程。征標識匹配的過程。 檢索提問字符串檢索提問字符串 匹配匹配 數(shù)據(jù)庫中特征標識字符串數(shù)據(jù)庫中特征標識字符串(4)(4)計算機檢索的特點計算機檢索的特點 檢索速度快;檢索功能強;檢索速度快;檢索功能強; 檢索途徑多;檢索范圍廣;檢索途徑多;檢索范圍廣; 資源能共享;能直接輸出。資源能共享;能直接輸出。 2. 2. 計算機檢索系統(tǒng)的構成計算機檢索系統(tǒng)的構成 (
3、1)(1)計算機計算機 (2)(2)通信網(wǎng)絡通信網(wǎng)絡 (3)(3)數(shù)據(jù)庫數(shù)據(jù)庫 數(shù)據(jù)庫就是在計算機存儲設備上按一定數(shù)據(jù)庫就是在計算機存儲設備上按一定方式存儲的相互關聯(lián)的數(shù)據(jù)集合。是檢索方式存儲的相互關聯(lián)的數(shù)據(jù)集合。是檢索系統(tǒng)的信息源,也是用戶檢索的對象。系統(tǒng)的信息源,也是用戶檢索的對象。 數(shù)據(jù)庫的基本類型數(shù)據(jù)庫的基本類型書目數(shù)據(jù)庫書目數(shù)據(jù)庫:是機讀的目錄、索引和文摘檢索工具檢索是機讀的目錄、索引和文摘檢索工具檢索結果是文獻的線索而非原文。如許多圖書館提供的基于網(wǎng)結果是文獻的線索而非原文。如許多圖書館提供的基于網(wǎng)絡的聯(lián)機公共檢索目錄絡的聯(lián)機公共檢索目錄OPACOPAC系統(tǒng)。系統(tǒng)。全文數(shù)據(jù)庫全文數(shù)
4、據(jù)庫 :是存儲文獻全文或其中主要部分的數(shù)據(jù)是存儲文獻全文或其中主要部分的數(shù)據(jù)庫,有的是印刷版的電子(網(wǎng)絡)版,有的則是純電子出庫,有的是印刷版的電子(網(wǎng)絡)版,有的則是純電子出版物。版物。 例如:例如:中國期刊網(wǎng)中國期刊網(wǎng)、ElsevierElsevier數(shù)據(jù)庫數(shù)據(jù)庫等等。等等。事實數(shù)據(jù)庫:事實數(shù)據(jù)庫:指包含大量數(shù)據(jù)、事實,直接提供原始資指包含大量數(shù)據(jù)、事實,直接提供原始資料的數(shù)據(jù)庫。又可分為數(shù)值數(shù)據(jù)庫、指南數(shù)據(jù)庫、術語數(shù)料的數(shù)據(jù)庫。又可分為數(shù)值數(shù)據(jù)庫、指南數(shù)據(jù)庫、術語數(shù)據(jù)庫等。例如美國醫(yī)生數(shù)據(jù)咨詢庫據(jù)庫等。例如美國醫(yī)生數(shù)據(jù)咨詢庫PDQPDQ(Physician Data Physician
5、Data QueryQuery)。)。多媒體數(shù)據(jù)庫:多媒體數(shù)據(jù)庫:是存儲聲音、圖象和文字等多種信息是存儲聲音、圖象和文字等多種信息的數(shù)據(jù)庫。如各種多媒體學習學習資料。的數(shù)據(jù)庫。如各種多媒體學習學習資料。 如如知識世知識世界界。數(shù)據(jù)庫結構數(shù)據(jù)庫結構( (以書目數(shù)據(jù)庫為例以書目數(shù)據(jù)庫為例) )$ 由文檔記錄字段組成由文檔記錄字段組成$文檔(文檔(filefile):):$ 數(shù)據(jù)庫中一部分記錄的有序集合數(shù)據(jù)庫中一部分記錄的有序集合$記錄(記錄(recordrecord):):$ 數(shù)據(jù)庫的信息單元,每條記錄描述了一數(shù)據(jù)庫的信息單元,每條記錄描述了一 個原始信息的外部特征和內(nèi)部特征。個原始信息的外部特征
6、和內(nèi)部特征。$字段(字段(fieldfield):):$ 比記錄更小的單位,是組成記錄的數(shù)據(jù)比記錄更小的單位,是組成記錄的數(shù)據(jù)項目項目3.3.計算機信息檢索的分類計算機信息檢索的分類根據(jù)檢索方式分:根據(jù)檢索方式分: (1)(1)脫機檢索脫機檢索(1954-1964)(1954-1964) (2) (2)聯(lián)機檢索聯(lián)機檢索(1965-1972)(1965-1972) (3) (3)國際聯(lián)機檢索國際聯(lián)機檢索(1972-1994)(1972-1994) (4) (4)光盤檢索光盤檢索 (5)(5)網(wǎng)絡檢索網(wǎng)絡檢索(1995-(1995-今今) ) 世界上最著名的國際聯(lián)機檢索系統(tǒng)世界上最著名的國際聯(lián)機檢
7、索系統(tǒng)DIALOG:有900多個數(shù)據(jù)庫,其中廣泛使用的有600多個,內(nèi)容涉及多個學科領域,文獻存儲量超過3億篇。OCLC:聯(lián)機計算機圖書館中心,是世界上最大的為讀者提供文獻信息機構。有60個數(shù)據(jù)庫,提供會議錄、工業(yè)通告、圖書評論等信息。CNKI:中國知識基礎設施工程 二、計算機檢索技術二、計算機檢索技術 1.1.布爾邏輯檢索功能布爾邏輯檢索功能 2.2.位置檢索功能位置檢索功能 3.3.截詞檢索功能截詞檢索功能 4.4.字段限定檢索功能字段限定檢索功能 1. 1.布爾邏輯檢索功能布爾邏輯檢索功能 所謂布爾邏輯檢索,指用布爾邏輯算符來組所謂布爾邏輯檢索,指用布爾邏輯算符來組配檢索詞以確定文獻的命
8、中與否。布爾邏輯式的配檢索詞以確定文獻的命中與否。布爾邏輯式的原理與檢索方法取自于布爾代數(shù)與集合運算。其原理與檢索方法取自于布爾代數(shù)與集合運算。其算符的相互匹配方式基本有算符的相互匹配方式基本有4 4種。種。 邏輯與(邏輯乘)邏輯與(邏輯乘) 邏輯或邏輯或 邏輯非邏輯非 邏輯異或邏輯異或 A AND B A B(1)(1)邏輯與邏輯與( (邏輯乘邏輯乘) ) 運算符號運算符號“and“and“或或”* *”作為連接詞,是一作為連接詞,是一種用于交叉概念或限定關系的組配,它可以縮小種用于交叉概念或限定關系的組配,它可以縮小檢索范圍,有利于提高檢索的專指性。檢索范圍,有利于提高檢索的專指性。 上圖
9、檢出上圖檢出同時含有同時含有“A”A”和和“B”B”文獻。文獻。 例:例:“有關計算機在圖書館工作中應用有關計算機在圖書館工作中應用”的文的文獻獻 檢索式檢索式= =計算機計算機* *圖書館圖書館例: 腸炎與腸病毒關系的文獻。腸炎與腸病毒關系的文獻。 檢索式檢索式= = 腸炎腸炎 * * 腸病毒腸病毒 生物學中的計算機圖象處理。生物學中的計算機圖象處理。 檢索式檢索式= = 生物學生物學 * * 計算機計算機 * * 圖象處理圖象處理(2)(2)邏輯或邏輯或 運算符號運算符號“or”or”或或”+”+”作為連接詞,是一種作為連接詞,是一種用于具有并列概念關系的組配。這種組配可以擴用于具有并列概
10、念關系的組配。這種組配可以擴大檢索范圍,提高查全率。檢索出既含有大檢索范圍,提高查全率。檢索出既含有“A”A”又又有有“B”B” 例:例:查查“計算機或機器人計算機或機器人”方面的文獻方面的文獻 。 檢索式檢索式= =計算機計算機 + + 機器人機器人 A B檢索式檢索式= =流行性感冒流行性感冒+ +咳嗽咳嗽查查“流行性感冒或者咳嗽流行性感冒或者咳嗽”方面的文獻方面的文獻 再如要查有關計算機方面的文獻,為了擴大檢再如要查有關計算機方面的文獻,為了擴大檢索面可以用檢索式:索面可以用檢索式:“微機微機 + + 電腦電腦 + PC+ PC機機”、 “微機微機 or or 電腦電腦 or PCor
11、PC機機”(3)(3)邏輯邏輯“非非” 用運算符號用運算符號“NOT”NOT”或或“”連接兩檢索詞,連接兩檢索詞,用于具有排除概念關系的組配。用于具有排除概念關系的組配。例:查例:查“玉米但不是甜玉米玉米但不是甜玉米”方面的文獻。方面的文獻。 檢索式檢索式= =玉米玉米甜玉米甜玉米 查找有關查找有關“關節(jié)炎關節(jié)炎”但不包括但不包括“類風濕性關節(jié)類風濕性關節(jié)炎炎”的文獻。的文獻。 檢索式檢索式= =關節(jié)炎關節(jié)炎類風濕性關節(jié)炎類風濕性關節(jié)炎 A B(4 4)“異或異或”關系關系 具有排除概念關系的組配,排除了具有排除概念關系的組配,排除了 A AND BA AND B的那部分,與的那部分,與A -
12、 B A - B 是有區(qū)別的是有區(qū)別的 。 (A OR B (A OR B )NOT NOT (A AND B A AND B )例例 A A= =水上運輸工具,水上運輸工具,B B= =陸上運輸工具陸上運輸工具 即即“水陸兩棲運輸工具水陸兩棲運輸工具”不能被命中。不能被命中。 A B運算順序運算順序 優(yōu)先級運算即檢索式中先后順序 ( ) NOT AND OR 如果一個提問式中含有多個邏輯算符,則它們的執(zhí)行順如果一個提問式中含有多個邏輯算符,則它們的執(zhí)行順序將是序將是NOTNOT,ANDAND,OROR,需先執(zhí)行的部分可用括號標出,需先執(zhí)行的部分可用括號標出 如:如:A+BA+B* *C C
13、運算順序為運算順序為B B* *C C然后在然后在+A+A (A+B) (A+B)* *C C 運算順序為運算順序為A+BA+B然后再是然后再是* *C C例如:例例1 1:查找關于微波和毫米波雷達的信息:查找關于微波和毫米波雷達的信息 ( (微波微波+ +毫米波毫米波) )* *雷達雷達例例2 2: ( (心臟瓣膜病心臟瓣膜病 OR OR 心力衰竭心力衰竭) AND ) AND 手術并發(fā)癥手術并發(fā)癥布爾邏輯檢索特點:布爾邏輯檢索特點: 布爾邏輯檢索是把任何檢索課題加工成可以進布爾邏輯檢索是把任何檢索課題加工成可以進行邏輯運算的表達式,行邏輯運算的表達式, 這是計算機檢索的一種被這是計算機檢索
14、的一種被廣泛采用的匹配方式。布爾邏輯運算的優(yōu)點是簡單廣泛采用的匹配方式。布爾邏輯運算的優(yōu)點是簡單明確、易于理解、符合人們的思維習慣。明確、易于理解、符合人們的思維習慣。2.2.位置檢索功能位置檢索功能 位置檢索又稱鄰近檢索,是表示所連接的位置檢索又稱鄰近檢索,是表示所連接的各個檢索詞之間的位置關系的一種檢索技巧。各個檢索詞之間的位置關系的一種檢索技巧。位置檢索多用于西文的全文檢索。位置算符位置檢索多用于西文的全文檢索。位置算符一般只使用兩個:一般只使用兩個: with with 用用(W)(W)或或()()表示、表示、 nearnear用用(N)(N)表示表示 (W)(W)詞序不能顛倒,中間除
15、符號不能插詞詞序不能顛倒,中間除符號不能插詞 (nW(nW) )詞序不能顛倒,中間可插詞序不能顛倒,中間可插(0-N)(0-N)個詞個詞 (N)(N)詞序可顛倒,中間不能插詞詞序可顛倒,中間不能插詞 (nN(nN) )詞序可顛倒,中間可插詞序可顛倒,中間可插(0-N)(0-N)個詞個詞例1:CDCD(W W)ROMROM將命中將命中CDCDROMROM或或CDCDROM;ROM;如:如:high(W)classhigh(W)class命中的記錄中出現(xiàn)的匹配詞可能命中的記錄中出現(xiàn)的匹配詞可能有:有:high class high class 或或high-classhigh-class。例2:檢
16、索檢索“材料磨損材料磨損“(wear of materialswear of materials )方面的文獻。方面的文獻。檢索式:檢索式: wearwear(1W1W)materialsmaterials例3:cross(N)sectioncross(N)section(部分交叉部分交叉) 可以檢索出可以檢索出crosscrosssectionsection和和section cross(section cross(交交叉部分)叉部分)3.3.截詞檢索功能截詞檢索功能 所謂截詞,就是指在檢索詞的適當位置截斷。所謂截詞,就是指在檢索詞的適當位置截斷。用用“?、?、* *”表示表示 。 前截斷前
17、截斷(后方一致檢索)?(后方一致檢索)?ChemistryChemistry chemistrychemistry、biochemistrybiochemistry、 electrochemistry electrochemistry physicochemistryphysicochemistry 中間截斷中間截斷( (中間屏蔽中間屏蔽) ) “t“t?thth” ” ,“tooth”tooth”和和“teeth”teeth” 后截斷后截斷(前方一致檢索)(前方一致檢索) computcomput? ? 可查出可查出 compute compute , computer computer ,
18、 computingcomputing,computationcomputation,computerisationcomputerisation 4. 4. 字段限定檢索功能字段限定檢索功能 將檢索詞限定在某一字段中,檢索時,將檢索詞限定在某一字段中,檢索時,計算機只對限定字段進行運算,以提高檢索計算機只對限定字段進行運算,以提高檢索效果。效果。 關鍵詞:醫(yī)藥限定在關鍵詞:醫(yī)藥限定在健康報健康報(機構報(機構報刊名)關鍵詞醫(yī)藥刊名)關鍵詞醫(yī)藥andand機構機構健康報健康報作者常亞平作者常亞平andand機構機構武漢科技學院學報武漢科技學院學報 常有的字段:常有的字段: 篇(題)名字段篇(題
19、)名字段 TI=Title TI=Title 文摘字段文摘字段 AB=AbstractAB=Abstract 主題詞字段主題詞字段 DE=DescriptorDE=Descriptor 關鍵詞字段關鍵詞字段 ID=IdentifiedID=Identified 著者字段著者字段 AU=AuthorAU=Author 著者機構字段著者機構字段 CS=Corporate SourceCS=Corporate Source 刊名字段刊名字段 JN=Journal JN=Journal 出版年字段出版年字段 PY=publication YearPY=publication Year 文獻類型字段文獻
20、類型字段 DT=Document TypeDT=Document Type 語種字段語種字段 LA=LanguageLA=Language 分類號字段分類號字段 CC=Classification CC=Classification 計算機檢索技術綜合練習計算機檢索技術綜合練習 (smoking+tobacco)*heart(w)disease三、計算機信息檢索步驟三、計算機信息檢索步驟 1.1.分析課題分析課題 2.2.制定檢索策略制定檢索策略 3.3.選擇檢索詞須注意的問題選擇檢索詞須注意的問題 4.4.檢索舉例檢索舉例 5.5.檢索技巧檢索技巧 1. 1.分析課題分析課題 對用戶提出的檢
21、索課題進行全面的分析研究,對用戶提出的檢索課題進行全面的分析研究,為選擇檢索詞,編寫檢索式作好準備,然后根據(jù)為選擇檢索詞,編寫檢索式作好準備,然后根據(jù)檢索課題的要求選擇合適的數(shù)據(jù)庫和檢索系統(tǒng),檢索課題的要求選擇合適的數(shù)據(jù)庫和檢索系統(tǒng),開始檢索后,要根據(jù)檢索的具體情況及時調整檢開始檢索后,要根據(jù)檢索的具體情況及時調整檢索策略,使檢索結果符合用戶的要求索策略,使檢索結果符合用戶的要求 。 2.2.制定檢索策略制定檢索策略 (1)(1)列出待檢課題的學科范圍、主題范圍等。列出待檢課題的學科范圍、主題范圍等。 (2 2)確定檢索詞和詞的截斷部位,調整詞之間的)確定檢索詞和詞的截斷部位,調整詞之間的位置
22、關系及組配關系。位置關系及組配關系。 (3 3)選擇相關數(shù)據(jù)庫,確定檢索途徑。)選擇相關數(shù)據(jù)庫,確定檢索途徑。 (4 4)擬定檢索式。)擬定檢索式。 (5 5)實檢與反饋調節(jié))實檢與反饋調節(jié) 。 3.3.選擇檢索須注意的問題選擇檢索須注意的問題(1)(1)該詞的廣義詞、狹義詞、相關詞及多義詞等該詞的廣義詞、狹義詞、相關詞及多義詞等(2)(2)該詞的最佳截斷部位該詞的最佳截斷部位(3)(3)對于泛指的主題概念詞,應選用其包容特性的具體內(nèi)容來對于泛指的主題概念詞,應選用其包容特性的具體內(nèi)容來表達:表達: 例:水果貯藏方面的文獻例:水果貯藏方面的文獻 (apple or pear or apple or pear or )and storageand storage (4)(4)當課題面窄,提問專指度高,而數(shù)據(jù)庫中對文獻的標引深當課題面窄,提問專指度高,而數(shù)據(jù)庫中對文獻的標引深度可能不足時,對檢索詞可進行粗化,取其上位檢索詞度可能不足時,對檢索詞可進行粗化,取其上位檢索詞 例:例: 玉米同功酶方面的文獻:玉米同功酶方面的文獻: isozymesisozymes ( (同功酶同功酶) enzymes() enzymes(生化酶生化酶)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國脈動微震袋式除塵器數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國土人參數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國半掛粉粒物料運輸車數(shù)據(jù)監(jiān)測研究報告
- 二零二五年度環(huán)保型倉庫出租合同4篇
- 二零二四年信用借款逾期利率調整合同3篇
- 2025年度互聯(lián)網(wǎng)金融平臺數(shù)據(jù)安全保護合同4篇
- 2025年度個人債務擔保合同范本與風險控制策略
- 二零二四年度園林綠化養(yǎng)護私人承包合同范本3篇
- 二零二五年度畜牧業(yè)農(nóng)業(yè)綜合開發(fā)項目合作協(xié)議4篇
- 2025版存量房買賣合同(含智能家居娛樂系統(tǒng)定制)3篇
- 中醫(yī)診療方案腎病科
- 人教版(2025新版)七年級下冊數(shù)學第七章 相交線與平行線 單元測試卷(含答案)
- 完整2024年開工第一課課件
- 從跨文化交際的角度解析中西方酒文化(合集5篇)xiexiebang.com
- 中藥飲片培訓課件
- 醫(yī)院護理培訓課件:《早產(chǎn)兒姿勢管理與擺位》
- 《論文的寫作技巧》課件
- 空氣自動站儀器運營維護項目操作說明以及簡單故障處理
- 2022年12月Python-一級等級考試真題(附答案-解析)
- T-CHSA 020-2023 上頜骨缺損手術功能修復重建的專家共識
- Hypermesh lsdyna轉動副連接課件完整版
評論
0/150
提交評論