科技信息素養(yǎng)教程 第三章-技能裝備:有關檢索你不可不知的那些事兒_第1頁
科技信息素養(yǎng)教程 第三章-技能裝備:有關檢索你不可不知的那些事兒_第2頁
科技信息素養(yǎng)教程 第三章-技能裝備:有關檢索你不可不知的那些事兒_第3頁
科技信息素養(yǎng)教程 第三章-技能裝備:有關檢索你不可不知的那些事兒_第4頁
科技信息素養(yǎng)教程 第三章-技能裝備:有關檢索你不可不知的那些事兒_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、科技信息素養(yǎng)教程Science and Technology Information Literacy 數字化生存和終身學習的必修課01THREE技能裝備:有關檢索你不可不知的那些事兒第三章 在網絡出現之前,人們就有信息檢索的行為,例如遇到不認識的文字,可以查閱字典、辭書。進入信息爆炸的互聯網時代,每個人都在自覺或不自覺地進行檢索,最常見的就是利用百度、谷歌等通用搜索引擎尋找相關信息;隨著移動互聯網的崛起和網絡應用的深度場景化,即便不使用搜索引擎,我們也離不開信息檢索,如在淘寶、京東購物時,用美團、餓了么訂購外賣時,采用12306(即中國鐵路客戶服務中心)購買火車票時以上種種行為,其實都包含了

2、信息檢索的過程。但對許多人而言,這個過程可能是無意識的,他們可能根本就沒有意識到自己在進行信息檢索,更不知道如何精準獲取所需信息,如何提高檢索效率,如何辨別信息真?zhèn)魏驮u價檢索結果。搞清下面幾件事兒,能夠大大提高查找信息的效率和質量。目 錄1 信息檢索原理3 信息檢索技術&數據庫常用檢索功能2 信息檢索語言4 信息檢索策略01信息檢索原理廣義的信息檢索,全稱又叫信息存貯與檢索(information storage and retrieval),指通過特定的方法將信息組織并存儲,再結合具體的用戶需求找到相關信息的過程。狹義的信息檢索,僅僅指的是這個過程的后半部分,就是從所有信息中找出與用戶需求相

3、匹配的信息的過程。信息存貯過程包括對信息按照一定標準進行選擇與收集;對信息單元表達的概念進行分析,并對單元信息按一定規(guī)則和方式進行標引;形成信息檢索系統。 信息檢索過程則包括用戶對所需查找的信息內容進行特征描述,并構成檢索式或檢索指令向信息檢索系統進行提問;按照一定的檢索技術將檢索式與信息源單元進行比較、匹配;以一定標準對匹配程度較高者作為檢索結果輸出。這一部分即狹義的信息檢索。本課程所稱信息檢索主要指狹義信息檢索。 02信息檢索語言分類檢索語言中圖法,如分類號F251.1 物資管理主題檢索語言主題詞表,例如醫(yī)學MeSH表信息檢索語言是根據信息檢索的需要創(chuàng)造出來的一種人工語言,是在信息檢索領域

4、用來描述信息特征和表達信息檢索提問的一種專用語言。它是一種受控語言,是根據一定的規(guī)則對自然語言進行規(guī)范化后的語言。信息檢索語言可以分為描述信息外部特征的檢索語言和描述信息內容特征的檢索語言。描述信息外部特征的檢索語言包括題名、著者、出版者等。描述信息內容特征的檢索語言主要包括分類檢索語言和主題檢索語言。舉例:文獻 A Model of multimedia information retrieval在信息存貯過程中,對這篇文獻內容進行分析,并使用檢索語言對其進行標引,標引結果為: 篇名(title): A Model of multimedia information retrieval 主題

5、(subject): information retrieval, multimedia computer applications標引后這篇文獻被存儲進數據庫。在信息檢索過程中:用戶輸入“information retrieval”一詞,并將檢索范圍限定在篇名中,可以檢索出該文獻。用戶輸入“information retrieval”一詞,并將檢索范圍限定在主題中,可以檢索出該文獻。用戶輸入“multimedia computer applications”一詞,如果將檢索范圍限定在主題中,可以檢索出該文獻;如果檢索范圍限定在篇名中,就檢索不到該文獻。在上述例子中,“information

6、retrieval”、“multimedia computer applications”都是檢索語言。由此可以看出,檢索語言的主要作用就是對文獻的外部特征和內容進行多層次描述,提供多種檢索途徑,以方便用戶從不同角度檢索查找。(1)分類檢索語言分類法即分類檢索語言(或稱標引語言)。它是通過號碼作為標記符號來表達各種概念,并將各種概念按學科性質進行分類和系統排列的概念標識系統。它的表現形式是分類表。故人們也常稱各種具體的分類表為分類法。常用的分類法是體系分類法,其主要優(yōu)點是能按學科、專業(yè)集中文獻,并從知識分類角度揭示各類文獻在內容上的區(qū)別與聯系,提供從學科、專業(yè)角度檢索文獻的途徑;類目體系的單線

7、排列易于掌握,實用性強。典型代表有杜威十進分類法DDC、中國圖書館分類法(中圖法)等。中國圖書館分類法(中圖法)是國家推薦統一使用的分類法,被許多檢索工具采用或改編,分5大部類22基本大類。標記符號采用漢語拼音字母與阿拉伯數字的混合號碼,即用一個字母表示一個大類,以字母的順序反映大類的序列,字母后用數字表示大類以下類目的劃分,數字的設置盡可能代表類的級位,并基本上遵從層累制的原則。 類目越細,專指度越高中圖法詳表示例中圖法簡表示例(2)主題檢索語言opportunitiesactivitiesstrategysuccessideasperformanceThe a teammarketingg

8、oalsmarketplananalysisrainboworangecompetitorsmarketingplanbusiness主題檢索語言,是將經過選擇并且能夠表達信息內容的詞語作為概念標識,并將概念標識按字順排列組織起來的一種檢索語言。根據詞語的選詞原則、組配方式、詞語規(guī)范,主題檢索語言可以分為標題詞檢索語言(標題法)、單元詞檢索語言(元詞法)、關鍵詞檢索語言(關鍵詞法)、敘詞檢索語言(敘詞法)等。標題法是以詞表預先確定的經過規(guī)范化處理的自然語言語詞表達主題概念的主題法。元詞法是以概念上不能再分解的元詞作為標引和檢索依據,通過字面組配的方式揭示文獻主題的主題法。關鍵詞法是直接采用文獻

9、中的語詞來表達主題概念的一種主題法。敘詞法是以經過規(guī)范化處理的自然語言語詞的概念組配來表達主題概念的一種主題法。(2)主題檢索語言(2)主題檢索語言醫(yī)學主題詞表(Medical Subject Headings,簡稱MeSH),是由美國國立醫(yī)學圖書館(NLM)編制的主題詞表。該表收錄了敘詞18000多個,副主題詞80余個。是將敘詞款目、非敘詞款目和副主題詞一起按照字順排列的一覽表。其款目要素有四個部分:敘詞和非敘詞、樹形結構號、注釋信息和參照。漢語主題詞表簡稱漢表,是中國科學技術情報研究所和北京圖書館主持和組織編制的一個大型綜合性敘詞表,該詞表為中文文獻檢索系統提供了一個綜合性的處理工具。全書

10、共有3卷10個分冊。MeSH表03信息檢索技術 & 數據庫常用檢索功能布爾邏輯檢索(Boolean Search)AND OR NOT截詞檢索(Truncation Search)?代表一個字符 *代表一個或多個字符(1)信息檢索技術布爾邏輯檢索(Boolean Search)布爾邏輯檢索,是利用布爾邏輯算符進行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種技術。邏輯算符邏輯“與”邏輯“或”邏輯“非”檢索式A AND BA*BA OR BA + BA NOT BA - B命中A和B都出現的記錄A和B任一出現的記錄只出現A不出現B的記錄邏輯“與”:縮小檢索范圍。邏輯“或”:常用于針對一

11、個概念的同/近義詞檢索,可以擴大檢索范圍。 如查找“腫瘤”的檢索式為:cancer or tumor or carcinoma邏輯“非”:排除不需要的內容。 如想了解“圖書館”的相關信息,但對“大學圖書館”不感興趣,檢索式為:圖書館 NOT 大學截詞檢索(Truncation Search)截詞檢索一般是在可能發(fā)生變化的字符處用截詞符號?或 *代替字符進行檢索。常用于英文檢索時,檢索一組概念相關或同一詞根但有不同變化形式的詞??梢院喕瘷z索步驟,擴大檢索范圍,避免漏查信息。?代表一個字符,*代表一個或多個字符。 按截斷的位置分三種: 前截斷、中間截斷、后截斷 前截斷保證檢索詞后方的一致性,如*w

12、ave可以檢索出shortwave,microwave等 中間截斷檢索詞中有一部分不一致。如organi?ation可以檢索出organization 和organisation 后截斷保證檢索詞前方的一致性,如librar*可以檢索出library,librarian,librarianship等(2)數據庫常用檢索功能比較通用的檢索功能有:瀏覽檢索、簡單檢索、高級檢索、專家檢索、二次檢索、索引、詞表等。(2)數據庫常用檢索功能 瀏覽檢索(2)數據庫常用檢索功能 簡單檢索 簡單檢索又稱基本檢索。即為用戶提供一個簡單的檢索界面,類似于搜索引擎。由于不能構造比較復雜、精細的檢索式,因此檢索結果不

13、是很準確。(2)數據庫常用檢索功能 高級檢索 高級檢索可利用組配檢索和字段檢索來構造比較細致的檢索式,幫助用戶進行精確檢索。使檢索更為靈活,檢索結果更加準確。(2)數據庫常用檢索功能 專家檢索 專家檢索可為專業(yè)用戶、資深用戶提供比較復雜的檢索界面。專家檢索多為命令式檢索方式,適合熟悉檢索指令、檢索經驗豐富的用戶使用。用戶可將編制好的檢索式填到檢索框中,即可進行檢索。使用專家檢索可構造較復雜的檢索式,達到較高的查全率和查準率,一般查新人員大多采用這種方式。例如:(EI數據庫) 在文摘中查找“Laser beam cutting” 可以表示為“Laser beam cutting” wn AB;

14、在題名中查找seatbelts OR seat belts可表示為:(seatbelts OR seat belts) wn TI ,以此類推。 查找深圳大學牛憨笨的文獻,檢索式為:niu hb wn AU AND shenzhen univ wn AF(2)數據庫常用檢索功能 二次檢索 二次檢索是指在當前這次檢索結果范圍內,再次輸入不同的檢索詞,運用布爾邏輯檢索、截詞檢索等方式進行檢索。經過多次的二次檢索,逐漸縮小文獻范圍,使檢索結果更符合您的查詢目標。 (2)數據庫常用檢索功能 索引檢索 一些數據庫常將其文獻記錄的一個或幾個字段中具有實際檢索意義的詞,按字順排成一個表單式的索引,供用戶選擇

15、檢索。索引的種類很多,如人名索引、出版物索引、地名索引、主題索引、機構索引等。 如圖所示的作者索引(取自EI數據庫),在不清楚作者名稱是全稱還是縮寫的情況下使用作者索引可節(jié)省檢索時間和保障查全率和查準率。 (2)數據庫常用檢索功能 詞表檢索 詞表檢索是主題檢索途徑。一些檢索系統把自己的詞表編入檢索系統。用戶在確定檢索用主題詞的同時,可以直接進行檢索。檢索實例:用戶要進行有關“激光”的主題檢索;進入Academic Search Ultimate(EBSCO)數據庫后,選擇主題詞語,然后輸入檢索詞“Laser” 系統出現的檢索結果如下,用戶可根據系統列出的有關主題詞按自己的需求進行選擇04信息檢

16、索策略檢索課題分析選擇檢索字段制定檢索式檢索結果評價及策略調整信息檢索策略選擇信息資源執(zhí)行一個課題的檢索是按過程、分步來完成的檢索步驟的科學安排稱為檢索策略(search strategy) 它是為實現檢索目標而制定的全盤計劃或方案 檢索課題的分析,即主題分析,明確課題所包含的概念成份及其相互關系。這是檢索策略制定的根本出發(fā)點,也是影響檢索效率高低或成敗的關鍵。 要明確以下問題: 分析課題的主要內容及其所涉及的學科范圍。 所需文獻的類型、語種、年代及文獻量的范圍。 對查新、查準、查全的指標要求,及其側重。(1) 檢索課題分析選擇信息源首先應明確選擇的目的和要求,確定研究性質,了解所需信息的學科

17、及文獻類型等。通常在選擇信息源時所涉及的具體內容如下:(1)檢索目的(如:課題申報、開題報告、學術論文、科技查新、課程論文、商業(yè)需求及其它需求類型等)(2)確定課題學科、專業(yè)、關鍵點(3)確定所需信息的時間范圍(如要求檢索1998-2002年的文獻)(4)明確所需信息類型;圖書、期刊、會議論文還是專利、標準;(5)確定與檢索主題相關的學科范圍的信息源(如:自然科學還是社會科學等等)(6)確定目標信息源的結果形式(全文、索引還是文摘)(7)確定所需信息源的語種(中文或外文)總之,范圍越具體、目標信息源越明確,已知條件越多,檢索效果越好。(2) 選擇信息資源 (3)選擇檢索字段檢索字段的功能是什么

18、?檢索字段主要用于限定檢索詞在數據庫記錄中出現的區(qū)域。由于檢索詞出現的區(qū)域對檢索結果的相關性有一定的影響,因此,利用字段檢索可以用來控制檢索結果的相關性,以提高檢索效果。檢索字段又分為以下2種:1.基本檢索字段: 基本檢索字段反映文獻內容特征;由篇名、文摘、主題詞等字段中所有有意義的檢索詞構成。例如:檢索時選擇題名字段進行檢索,則意味著檢索詞會出現在檢索結果的題名中。一般而言,在一些常用的數據庫中選擇“主題”檢索字段,就表示凡是“題名、關鍵詞、摘要”中包含有檢索詞的文獻都會被檢出(具體參見數據庫說明)2.輔助檢索字段:輔助檢索字段反映文獻外部特征;由作者、機構、文獻類型、分類號、語種、出版年等

19、字段構成。常用檢索字段英文說明題名TI文獻標題主題SU題名、關鍵詞、摘要摘要AB論文摘要作者AU作者姓名單位CS作者單位來源SO發(fā)表論文的期刊名稱(學位授予單位、會議錄名稱)關鍵詞Key word用于表達主題內容的單詞或詞組期刊JN期刊名稱全文Full Text整篇文獻檢索式 是檢索策略的具體體現,它用檢索算符將檢索詞組合起來,并正確表達檢索詞之間的邏輯關系和位置關系。檢索式的好壞決定了檢索質量。檢索詞可以是一個單元詞、表達單一的概念;如:Computer; 也可以是一個或多個詞組,表達多個概念。例如:Computer Memory Test 等等。檢索詞可由用戶提出,也可在數據庫的受控詞表(主題詞表、分類表等)中選擇。例如檢索課題為:計算機內存管理機制分析 其檢索式為:computer AND (memory management) AND mechanism AND ( analysis OR analyze)在這個檢索式中,包含了4個概念,這4個概念用單元詞或詞組表示,將這4個概念用布爾邏輯算符AND 和OR以及括號()連接起來,即構成一個檢索式。檢索式并不是唯一的。 (4)制定檢索式 (5) 檢索結果評價及策略調整檢索文獻其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論