《信息檢索實踐基礎(chǔ)》PPT課件.ppt_第1頁
《信息檢索實踐基礎(chǔ)》PPT課件.ppt_第2頁
《信息檢索實踐基礎(chǔ)》PPT課件.ppt_第3頁
《信息檢索實踐基礎(chǔ)》PPT課件.ppt_第4頁
《信息檢索實踐基礎(chǔ)》PPT課件.ppt_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章 信息檢索實踐基礎(chǔ),第一節(jié) 信息檢索的類型 第二節(jié) 信息檢索的策略與方法,第一節(jié) 信息檢索的類型,1按信息檢索手段可分為手工檢索、機械化檢索、計算機檢索 手工檢索。它是歷史最悠久的一種信息檢索方式,手工檢索是利用手翻、眼看、筆錄等手段,利用檢索工具查找所需特定信息的過程。 機械化檢索,即利用某種機械裝置來查找文獻的方式 計算機檢索,又稱自動化檢索,是利用計算機、光盤等現(xiàn)代技術(shù)設(shè)備處理、檢索所需信息的檢索方式。,第一節(jié) 信息檢索的類型,2按檢索的信息的學(xué)科范圍,信息檢索可分為社科信息檢索和科技信息檢索 社科信息檢索,是檢索社會科學(xué)領(lǐng)域的信息;科技信息檢索,是檢索科學(xué)技術(shù)領(lǐng)域的信息。兩者的檢

2、索原理相同,只是檢索內(nèi)容不同罷了。此外,由于社會科學(xué)和科學(xué)技術(shù)學(xué)科性質(zhì)不同,決定了兩者在文獻分布范圍、文獻的時效性等方面存在著較大差別。,3按照檢索的信息類型,信息檢索可以分為數(shù)據(jù)檢索、事實檢索、書目檢索和全文檢索 數(shù)據(jù)檢索(Data Retrieval),又稱數(shù)值檢索,是以具有數(shù)量性質(zhì)、并以數(shù)值形式表示的數(shù)據(jù)為檢索內(nèi)容的信息檢索。 事實檢索(Fact Retrieval),又稱事項檢索,是以從文獻中抽取的事項為檢索內(nèi)容的信息檢索。 書目檢索(Catalog Retrieval),以文獻線索為檢索對象的信息檢索。 全文檢索(Document Retrieval,F(xiàn)ull-text Retrie

3、val),以文獻所含的全部信息作為檢索內(nèi)容的文獻檢索。,第二節(jié) 信息檢索的策略與方法,1.信息檢索途徑 檢索途徑(Approach),也被稱為檢索點(Access Point),是進行檢索的路線和出發(fā)點。,1.1 作者(Author)檢索途徑,或稱為著者途徑,是從文獻的作者姓名出發(fā)來檢索其文獻。 1.1.1 外國著者姓名的倒置和取舍規(guī)則 1.1.2 不同語種之間著者姓名的字譯系統(tǒng),1.2 題名(Title)途徑。 題名是表達、象征、隱喻文獻內(nèi)容及特征的詞或短語,是文獻的標(biāo)題或名稱,包括書名刊名、篇名等。許多檢索系統(tǒng)是依文獻題名編制的,如圖書館的書名目錄、刊名目錄以及篇名索引等等。 1.2.1

4、排檢規(guī)則。 1.2.2 簡稱縮寫。 1.2.3 與著者相同的字譯問題。,1.3 分類(Classified)途徑。 在檢索系統(tǒng)采用分類語言表達文獻信息內(nèi)容并依此組織文獻信息的基礎(chǔ)上,檢索者用分類語言的標(biāo)識(分類號)表達待查課題進行檢索,就是從分類途徑檢索。這是一種常用的檢索途徑。,1.4 主題(Subject)途徑。 即利用檢索系統(tǒng)中用于表達文獻內(nèi)容的主題標(biāo)識(標(biāo)題、敘詞、關(guān)鍵詞)進行檢索。其關(guān)鍵就是選準(zhǔn)能夠表達檢索課題、并且正好是檢索系統(tǒng)所采用的主題標(biāo)識形式。主題途徑也是一種常用的檢索途徑。,1.5 序號(Number)途徑 文獻序號對于識別一定的文獻,具有明確、簡短、唯一的特點。 在對圖書

5、和期刊檢索時常用到兩個號碼:國際標(biāo)準(zhǔn)書號ISBN(International Standard Book Number)及國際標(biāo)準(zhǔn)刊號ISSN(International Standard Serial Number),1.6代碼(Code/Coden)途徑 利用事物的某種代碼編成的索引,如分子式索引、環(huán)系索引等,可以從特定代碼順序進行檢索。 1.7 引文(Cited)途徑 文獻所附參考文獻或引用文獻,是文獻的外表特征之一。利用引文而編制的索引系統(tǒng),稱為引文索引系統(tǒng),它提供從被引論文去檢索引用論文的一種途徑,稱為引文途徑。最早出現(xiàn)的美國科學(xué)引文索引是提供這種途徑的典型。,1.8 文獻信息所包含

6、的專門項目途徑 從文獻信息所包含的或有關(guān)的名詞術(shù)語、地名、人名、機構(gòu)名、商品名、生物屬名、年代等的特定順序進行檢索,可以解決某些特定問題。,2信息檢索的策略與信息檢索式的構(gòu)造,2.1 廣義檢索策略 是指在分析課題的基礎(chǔ)上,選擇檢索系統(tǒng)、檢索文檔、檢索途徑,確定檢索詞及其相互間的邏輯關(guān)系,直到檢索出結(jié)果的一系列科學(xué)措施。 2.2 狹義檢索策略 是指就一個問題檢索一個或多個數(shù)據(jù)庫所輸入的全部檢索式的集合,是為滿足檢索需求所制定的一系列檢索式。也即檢索提問式的編寫。,例如, 對“微藻生長因子”這一課題來說,檢索策略可編為: (algae+algal+microalgal) * growth()fac

7、tor? ? 實檢后調(diào)整(考慮提高檢準(zhǔn)率)、優(yōu)化(低頻詞和關(guān)鍵詞前置)為: (microalgal+algae+algal)(s)growth()factor? ? (microalgal+algae+algal)(3n)growth()factor? ?,3.構(gòu)成檢索提問式的基本要素,3. 1 布爾邏輯檢索(Boolean logic) 邏輯“與” A AND B(A*B) 邏輯“或” A OR B(A+B) 邏輯“非” A NOT B(A-B) AND OR NOT,3.2 字段限制檢索 組成數(shù)據(jù)庫的最小單位稱為記錄。 一篇完整記錄中的每一個著錄事項稱為字段。 一篇記錄中主要用來表達文獻內(nèi)

8、容特征的字段稱為基本索引字段(basic index fields),如篇名字段 、敘詞字段、自由詞字段。 表達文獻外部特征的字段稱為輔助索引字段(additional index fields),包括著者字段、文獻類型字段、語種字段等。,3.3 截詞檢索 指在檢索標(biāo)識中保留相同部分,用相應(yīng)的截詞符代替可變化部分。 3.3.1 詞尾的有限截詞 3.3.2 詞尾的無限截詞 3.3.3 中間截詞,3.4 關(guān)系算符檢索 數(shù)據(jù)庫的輔助索引中,有些是數(shù)值型字段,可使用關(guān)系算符來限定范圍,如: : 包含范圍(由低到高的數(shù)字) PY=2000: 2005 大于 PY2000 小于 PY2000 3.5 短語

9、檢索 3.6 括號檢索,4、信息檢索方法,信息檢索方法有四種,即直接檢索法、間接檢索法、追溯法、循環(huán)法。 4.1 直接檢索法 又稱直查法,是指不利用檢索工具或檢索系統(tǒng),通過直接瀏覽或查閱原始文獻,來獲取所需信息的一種檢索方法。,4.2 間接檢索法 又稱常用法,是指借助于檢索工具或檢索系統(tǒng)獲取所需信息的一種檢索方法。它又分為順查法、例查法和抽查法。 4.3 追溯檢索法 簡稱追溯法,又稱擴展法、追蹤法,是指不利用檢索工具,而是利用文獻后面所列的參考文獻,逐一追查原文(被引用文獻),然后再從這些原文后所列的參考文獻目錄逐一擴大文獻信息范圍,一環(huán)扣一環(huán)地追查下去的方法。,4.4 循環(huán)檢索法 簡稱循環(huán)法、又稱分段法、綜合法。實際上是上述間接法和循環(huán)法兩種方法的綜合使用。兩者相互配合,可以取長補短,取得更好的檢索結(jié)果。,5.信息檢索步驟,5.1 分析檢索課題 5.2 制定檢索策略 5.3 試驗性檢索和修改檢索策略 5.4 正式檢索 5.5 整理、說明檢索結(jié)果,按要求給予答復(fù),或者進一步提供原文。,5.2 制定檢索策略 所謂檢索策略,是為完成檢索課題,實現(xiàn)檢索目的,對檢索的全過程進行謀劃之后所制定的全盤檢索方案。 5.2.1 選擇檢索方式 5.2.2 選擇檢索工具或檢索系統(tǒng)及數(shù)據(jù)庫 5.2.3 選擇檢索方法 5.2.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論