文獻(xiàn)檢索技術(shù)培訓(xùn)課件_第1頁
文獻(xiàn)檢索技術(shù)培訓(xùn)課件_第2頁
文獻(xiàn)檢索技術(shù)培訓(xùn)課件_第3頁
文獻(xiàn)檢索技術(shù)培訓(xùn)課件_第4頁
文獻(xiàn)檢索技術(shù)培訓(xùn)課件_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

文獻(xiàn)檢索技術(shù)一、布爾邏輯檢索技術(shù)

在檢索實際中,檢索提問涉及的概念往往不止一個,而同一個概念又往往涉及多個同義詞或相關(guān)詞。為了正確地表達(dá)檢索提問,系統(tǒng)中采用布爾邏輯運算符將不同的檢索詞組配起來,使一些具有簡單概念的檢索單元通過組配成為一個具有復(fù)雜概念的檢索式,用以表達(dá)用戶的信息檢索要求。2文獻(xiàn)檢索技術(shù)

1邏輯“與”

含義:檢出的記錄必須同時含有所有的檢索詞?;咀饔茫阂环N用于交叉概念或限定關(guān)系的組配,可以縮小檢索范圍,有利于提高檢索的專指性。用and或*表示例如:查找同時含有概念A(yù)和概念B的文獻(xiàn),可表示為:“AandB”或“A*B”3文獻(xiàn)檢索技術(shù)

2邏輯“或”

含義:檢出的記錄中,至少含有兩個檢索詞中的一個?;咀饔茫河糜诰哂胁⒘懈拍铌P(guān)系的組配。這種組配可以擴大檢索范圍,提高查全率。可以避免了命中文獻(xiàn)的重復(fù)出現(xiàn)。用OR或“+”表示例如:檢索含有檢索項A或檢索項B的文獻(xiàn),可表示為:“AORB”或“A+B”4文獻(xiàn)檢索技術(shù)

3邏輯“非”

含義:排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其后的詞。基本作用:用于從某一檢索范圍中排除不需要的概念。這種組配可以縮小檢索范圍。用“NOT”或“-”表示,但在檢索時建議使用NOT,以避免與詞間的分隔符“-”混淆。例如:在含有概念A(yù)的文獻(xiàn)集合中,排除同時含有概念B的文獻(xiàn),可表示為:“ANOTB”或“A-B”。5文獻(xiàn)檢索技術(shù)4運算優(yōu)先級運算優(yōu)選級順序為(),NOT,OR,AND;可以用括號改變它們之間的運算順序。通常在有括號的情況下,括號內(nèi)的邏輯運算先執(zhí)行,有多層括號時,先執(zhí)行最內(nèi)層的括號。例如:(AORD)ANDB,表示先執(zhí)行“AORD”的檢索,再與B進(jìn)行AND運算。6文獻(xiàn)檢索技術(shù)5注意事項1)有的檢索工具以符號形象地表達(dá)布爾檢索的功能,如“+”表示邏輯與,“-”表示邏輯非。有的檢索工具直接把布爾邏輯隱含在菜單中,例如,Lycos以“matchallterms”表示邏輯與,以“matchanyterm”表示邏輯或。絕大多數(shù)檢索工具的高級檢索完全用表格和文字來表達(dá)布爾關(guān)系,如,Excite以“必須包括(MUSTcontain)”表示邏輯與,用“一定不含”(MUSTNOTcontain)表示邏輯非。有的檢索工具部分支持布爾關(guān)系,如Yahoo!尚不支持邏輯非。7文獻(xiàn)檢索技術(shù)2)用布爾邏輯表達(dá)檢索要求,除要掌握檢索課題的相關(guān)因素外,還應(yīng)在布爾算符對檢索結(jié)果的影響方面引起注意。布爾算符使用正確但卻不能達(dá)到應(yīng)有檢索效果的例子很多。OR邏輯有些檢索詞表達(dá)的概念,存在整體與部分的關(guān)系。在檢索中,這類關(guān)系如果處理不好,就不能得到滿意的檢索效果。對此,一般原則是,如果檢索詞涉及到表達(dá)整體的概念,就要針對具體情況分別列出每一個表達(dá)部分概念的檢索詞,否則將出現(xiàn)漏檢。NOT邏輯在檢索邏輯中使用NOT,能排除含有由NOT指定的檢索詞的文獻(xiàn),協(xié)助檢索出更準(zhǔn)確的文獻(xiàn)。但是,使用NOT必須慎重。因為,如果兩個關(guān)系緊密的檢索詞同在一個檢索邏輯中,對其中一個使用NOT邏輯會導(dǎo)致含另一個詞的文獻(xiàn)也被排除。8文獻(xiàn)檢索技術(shù)6小結(jié)檢索中邏輯算符使用是最頻繁的,對邏輯算符使用的技巧決定檢索結(jié)果的滿意程度。用布爾邏輯表達(dá)檢索要求,除要掌握檢索課題的相關(guān)因素外,還應(yīng)在布爾算符對檢索結(jié)果的影響方面引起注意。另外,對同一個布爾邏輯提問式來說,不同的運算次序會有不同的檢索結(jié)果。布爾算符使用正確但不能達(dá)到應(yīng)有檢索效果的事情是很多的。9文獻(xiàn)檢索技術(shù)示例:使用布爾邏輯運算符表明查詢結(jié)果中必須同時包含intelligentrobot和control表明查詢結(jié)果中至少包含兩個檢索詞中的任意一個,intelligentrobot或control表明檢索結(jié)果包含intelligentrobot,但同時必須去掉和control相關(guān)的內(nèi)容Intelligentrobotandcontrol(intelligentrobot*control)Intelligentrobotorcontrol(intelligentrobot+control)Intelligentrobotnotcontrol(intelligentrobot-control)注:英文數(shù)據(jù)庫通常用字母,中文數(shù)據(jù)庫要用符號。10文獻(xiàn)檢索技術(shù)二、位置檢索(鄰近檢索)技術(shù)表明兩或多個檢索詞之間關(guān)系的符號。適用于兩個檢索詞以指定間隔距離或者指定的順序出現(xiàn)的場合??梢钥闯商厥夤δ艿腁ND算符。AND算符不限制兩個檢索詞的位置和出現(xiàn)順序。例如:communicationANDsatellite命中的文獻(xiàn)可能有

communicationsatellite;

satellitecommunication;communicaticndevicesforsatellites;communicaticnlinkswithoutsatellites;

位置算符可以改進(jìn)AND算符的這種不足,它是特殊功能的AND算符。按照兩個檢索詞出現(xiàn)的順序和距離,可以有多種位置算符,而且對同一位置算符,檢索系統(tǒng)不同,規(guī)定的位置算符也不同。11文獻(xiàn)檢索技術(shù)1)“(W)”

含義:“(W)”算符中的W含義為“With”。表示其兩側(cè)的檢索詞必須緊密相連,除開空格和標(biāo)點號外,不得插入其他詞或字母,兩詞的詞序不可顛倒。其簡略形式為()。例如:

communication(W)satellitecommunication()satellite兩者相同

12文獻(xiàn)檢索技術(shù)2)“(nw)”

“(nW)”中的“W”的含義為“Word”,它允許兩詞間插入最多為n個其他詞,包括實詞和系統(tǒng)禁用詞,詞序不變。例如:

communication(2W)satellite則會檢出

communicationsatellitecommunicationthoughsatellitecommunicationonthesatellite13文獻(xiàn)檢索技術(shù)3)“(N)”

含義:“(N)”中的N含義為“Near”。表示其兩側(cè)的檢索詞必須緊密相連,除開空格和標(biāo)點符號外,不得插入其他詞或字母,兩詞的詞序可以顛倒。14文獻(xiàn)檢索技術(shù)4)“(nN)”含義:“(nN)”是“(N)”算符的變形,不同之處為允許兩詞間插入最多為n個其他詞,包括實詞和系統(tǒng)禁用詞。例如:

COTTON(2N)PROCESSING則命中:

Cottonprocessing;processingofcotton;processingofEgyptiancotton15文獻(xiàn)檢索技術(shù)5)“(F)”——同字段檢索含義:“(F)”算符中F的含義為“Field”。這個算符表示其兩側(cè)的檢索詞必須在同一個詞段中出現(xiàn),(例如;同在題目字段或文摘字段)詞序不限,中間可插任意檢索詞項。例如:

POLLUTION(F)CONTRON可命中

Contronandmanagementofindustrialpollution同在題目中(F)鄰近算符與AND布爾邏輯主要區(qū)別在于:(F)使兩個檢索項在同一字段,AND布爾邏輯中兩個檢索詞會發(fā)生在不同字段中。16文獻(xiàn)檢索技術(shù)6)“(s)”——同句檢索含義:“(s)”算符中的S含義為“Sentence”。這個算符表示其兩側(cè)的檢索詞必須在同一自然句子(子字段)中出現(xiàn),兩詞的詞序可以顛倒。放寬了詞位置檢索的要求,使表達(dá)同一概念但不滿足詞位置條件的文獻(xiàn)也可以被檢索出來,從而提高了查全率。

17文獻(xiàn)檢索技術(shù)

以上介紹的各種位置算符,按照限制程度的大小,(W)、(nW)最強,(N)、(nN)次之,(S)再次之。當(dāng)(nN)的n≥10時,其作用已經(jīng)相當(dāng)于(S)。18文獻(xiàn)檢索技術(shù)19文獻(xiàn)檢索技術(shù)

三、截詞檢索技術(shù)

含義:用截斷的詞(詞的片段)的一個局部進(jìn)行的檢索,并認(rèn)為凡滿足這個詞局部中的所有字符(串)的文獻(xiàn),都為命中的文獻(xiàn)。檢索者將檢索詞在合適的地方截斷,然后截出的片斷進(jìn)行檢索。20文獻(xiàn)檢索技術(shù)截詞的方式

(1)按截斷的字符數(shù)量來分:有限截斷和無限截斷有限截斷:有具體截去的字符數(shù)。無限截斷:不指明具體截去的字符數(shù)。(2)按截斷的位置區(qū)分:后截斷、前截斷以及中間截斷。(3)截斷常使用截斷符號,各檢索系統(tǒng)所使用的截斷符號有所不同,常用的符號有“?”,“$”,“?!币约啊?”。以下舉例中用“?”來表示有限截斷,用“*”表示無限截斷。注意:不同的數(shù)據(jù)庫所用的截詞符不一樣,使用應(yīng)先查一下各數(shù)據(jù)庫的幫助加以確認(rèn)。22文獻(xiàn)檢索技術(shù)

1后方截詞(前方一致或右截斷)

含義:將截詞符放在一串字符的后面,用以表示以相同字符串開頭,而結(jié)尾不同的所有詞。(1)詞尾的有限截斷相同字符串后可能變化一個字符時,則在其后使用一個“?”、空格、再加一個“?”,常用來表示檢索詞的單復(fù)數(shù)變化。例如:用system??可以查出sytem和systems的文獻(xiàn)。相同字符串后可能變化兩個以上字符時,則在其后連續(xù)使用若干個“?”代替可能變化的字符。例如:??表示兩個字符,???表示三個字符,以此類推。23文獻(xiàn)檢索技術(shù)

(2)詞尾的無限截斷

相同字符串后可能變化任何字符串時,則在其后使用一個“?”。這種方法可以查找出含有相同字符串的所有檢索詞。例如:

comput?可查出compute,computer,computing,computation,computerisation等。24文獻(xiàn)檢索技術(shù)(3)后截詞主要使用在如下4個方面詞的單復(fù)數(shù),如book?,potato??;年代,如198?(80年代),19??(20世紀(jì));作者,如用Lancaster*可檢出所有姓Lancaster的作者;同根詞,如用biolog*,可檢出biological、biologist、biology等同根詞。25文獻(xiàn)檢索技術(shù)注意(1)有限截斷比較精確,只檢索出用戶需要的詞匯;(2)使用時無限截斷必須注意:詞干不要太短,否則會檢出許多無關(guān)的文獻(xiàn);(3)應(yīng)盡量選用不會引起誤檢的截斷詞。26文獻(xiàn)檢索技術(shù)

2中間截詞(中間屏蔽)

將提問字符串中間的字符用符號代替,主要用于英式美式不同拼法的英文單詞,或單復(fù)數(shù)不同的單詞。截詞符具有“OR”運算符的功能,能夠擴大檢索范圍,而且減少了輸入檢索詞的時間,節(jié)約了機時。例如:“

woman”

和“

women”

,可用“

wom?n”

代替;

defence”

和“

defense”

可用“defen?e”代替。檢索時為防止漏檢可用中間屏蔽的檢索方法:

m?nwom?norgani?ationdefen?e

當(dāng)然使用中間屏蔽的方法也要注意是否可能誤檢其它詞匯的文獻(xiàn)。27文獻(xiàn)檢索技術(shù)3

前截斷(后方一致或左截斷)前截斷檢索常用于復(fù)合詞。例如:?computer表示minicomputer,microcomputers等。前截斷與后截斷也可以組合起來使用。例如:*chemi*可以檢出下列詞匯

chemical、chemistry、chemist、

eletrochemical、electrochemistry、

physicochemistry、thermochemistry等。28文獻(xiàn)檢索技術(shù)

四、字段限定檢索

含義:限定檢索詞在數(shù)據(jù)庫記錄中的一個或幾個字段范圍內(nèi)查找的一種檢索方法。(規(guī)定的字段范圍內(nèi)出現(xiàn)的信息方為命中信息的一種檢索方法。)適用于在已有一定數(shù)量輸出記錄的基礎(chǔ)上,通過指定字段的方法,減少輸出篇數(shù),提高檢索結(jié)果的查準(zhǔn)率。由于字段限制采用前綴和后綴的形式,又可稱為前綴限制和后綴限制。29文獻(xiàn)檢索技術(shù)限制檢索主要有兩種方式:字段檢索——利用字段進(jìn)行限制,如題名、摘要、全文等通常的字段限制范圍的大小順序是:題名<關(guān)鍵詞<摘要<全文二次檢索——在前一次檢索的結(jié)果中進(jìn)行另一概念的檢索30文獻(xiàn)檢索技術(shù)通常數(shù)據(jù)庫中可供檢索的字段分為主題字段和非主題字段。主題字段:題名(Title)、敘詞(Descriptor)、標(biāo)識詞(Identifier)、文摘(Abstract)等;非主題字段:作者(Author)、文獻(xiàn)類型(DocumentType)、語種(Language)、出版年份(PublicationYear)等。注意:各個檢索系統(tǒng)所設(shè)立的字段是互不相同的,即使使用同一字段,也可能采用不同的字段代碼,在進(jìn)行字段檢索時,應(yīng)事先參閱系統(tǒng)及有關(guān)數(shù)據(jù)庫的說明。31文獻(xiàn)檢索技術(shù)實例:字段限定在DIALOG聯(lián)機檢索系統(tǒng)中應(yīng)用1)基本字段限制含義:基本字段主要是指題目、敘詞、識別詞和文摘四個字段?;咀侄蜗拗频挠梅ㄊ窃谛枰付ㄗ侄蔚臋z索詞后加上后綴運算符“/”和段碼。例如:

OPTICAL/TIANDFIBER/TI指在題目字段中含這兩個詞的記錄。字段段碼可以多個連用,中間加“,”例如:

FIB?/TI,DE指在題目和敘詞中查找“fib”為詞干的所有記錄。32文獻(xiàn)檢索技術(shù)2)輔助字段限制

除基本字段以外的可檢索字段都可成為輔助字段。輔助字段運算符的用法是在需要指定字段的檢索詞(有時檢索詞須放在雙引號內(nèi))之前加上段碼和前綴運算符“=”。例如:

AU=“Robert,S”在作者字段中含人名為Robert,S的記錄。

CS=作者單位字段;

LA=語言字段,例如LA=ENGLISH英語字段

JN=刊物名稱字段;

PY=年份字段例如PY=199933文獻(xiàn)檢索技術(shù)字段限定符in對某一指定數(shù)據(jù)項進(jìn)行檢索如:computerin

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論