信息檢索與檢索工具知識培訓(xùn)_第1頁
信息檢索與檢索工具知識培訓(xùn)_第2頁
信息檢索與檢索工具知識培訓(xùn)_第3頁
信息檢索與檢索工具知識培訓(xùn)_第4頁
信息檢索與檢索工具知識培訓(xùn)_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信息檢索與檢索工具

英國學(xué)者約翰遜曾說過

知識分為兩類:一類是我們所知道的學(xué)科知識,另一類是關(guān)于在哪兒可以獲得這些知識的知識?!拔墨I(xiàn)檢索”就是打開知識寶庫的一把鑰匙。一、信息檢索的原理

1、信息檢索(InformationRetrieval)概念定義:就是查找文獻(xiàn),即以科學(xué)的方法利用專門的工具,從大量的文獻(xiàn)資料中迅速、準(zhǔn)確、完整地查找到文獻(xiàn)資料的過程。

文獻(xiàn)檢索也可稱為信息檢索。一種搜索過程從已存儲的文獻(xiàn)資源中找出與用戶提問相關(guān)的文獻(xiàn)2、信息檢索過程包括兩個部分:一是信息存儲,即把大量分散的無序的信息集中起來,經(jīng)過加工,使之有序化、系統(tǒng)化,成為有功能的檢索工具或檢索系統(tǒng)。二是信息檢索,利用已組織好的檢索工具或檢索系統(tǒng),按照課題的要求將所需信息查找出來。信息檢索全過程示意圖3、信息檢索的類型劃分的依據(jù)檢索的類型對象文獻(xiàn)檢索,事實(shí)檢索,數(shù)據(jù)檢索內(nèi)容書目、數(shù)據(jù)、全文、事實(shí)、聲像檢索檢索技術(shù)全文文本、多媒體、超文本、網(wǎng)絡(luò)檢索

根據(jù)檢索對象的不同,文獻(xiàn)(信息)檢索可分為三種類型:數(shù)據(jù)檢索(DataRetrieval)--特定的數(shù)據(jù),查找文獻(xiàn)中的人名、地名、化學(xué)組成、某個參數(shù)、某個數(shù)學(xué)公式等數(shù)據(jù)。

事實(shí)檢索(FactRetrieval)--特定的事實(shí)(各種史實(shí)、結(jié)果、現(xiàn)狀)。文獻(xiàn)檢索(DocumentRetrieval)--特定的文獻(xiàn)。狹義范圍的文獻(xiàn)檢索。僅指查找相關(guān)的文獻(xiàn)(文章或論著等)。二、信息檢索工具1、概念:檢索工具是指根據(jù)檢索語言,將無序的文獻(xiàn)按一定方式有系統(tǒng)的組織起來,用以報道、存儲和檢索文獻(xiàn)的工具。二次文獻(xiàn)又稱為檢索工具,它提供文獻(xiàn)的線索。如果按著錄內(nèi)容劃分,可將檢索工具分為目錄、題錄、文摘、索引、搜索引擎、全文數(shù)據(jù)庫。1.手工檢索:利用紙介質(zhì)文獻(xiàn)進(jìn)行的檢索。主要包括檢索性期刊(索引期刊、文摘期刊);書本式目錄、索引、文摘;卡片式目錄等。手工檢索可利用的工具是指印刷型檢索工具,它包括檢索性工具書:目錄、索引、文摘。參考性工具書:百科全書、年鑒、手冊、名錄、字典、詞典、表譜、圖錄。2.機(jī)器檢索:又稱“計算機(jī)情報檢索”、“自動化情報檢索”。是利用電子計算機(jī)存貯和檢索情報的過程。它包括數(shù)據(jù)庫檢索、聯(lián)機(jī)檢索、網(wǎng)上搜索(利用搜索引擎)等。檢索工具的類型傳統(tǒng)型檢索工具目錄索引文摘電子型檢索工具數(shù)據(jù)庫參考數(shù)據(jù)庫源數(shù)據(jù)庫混合數(shù)據(jù)庫計算機(jī)信息網(wǎng)絡(luò)分類目錄型搜索引擎型混合型目錄(Catalogue)含義:目錄是對文獻(xiàn)的外表特征的著錄。以單獨(dú)出版物為報道單位,即以完整出版物(如一本書或一種刊或一個會議錄的名稱)作為著錄的基本單位來報道和記錄文獻(xiàn)。著錄內(nèi)容:文獻(xiàn)名稱(篇名目錄)、著者、出版項(xiàng)與館藏信息等內(nèi)容。索引(Index):揭示具有重要檢索意義的內(nèi)容特征標(biāo)識或外部特征標(biāo)識,按照一定順序排列,并注明文獻(xiàn)條目線索的工具。分類索引、主題索引、生物體索引、著者索引等。索引是一種附屬性的檢索工具,主要起檢索作用,常附于檢索工具的后部,但也有的工具本身就是由索引構(gòu)成。索引由索引款目和參照系統(tǒng)組成。索引款目包括:標(biāo)目、說明語、材料出處或地址。題錄(Title)概念:揭示文獻(xiàn)外部特征的檢索工具。以單篇文獻(xiàn)為報道單位,題錄報道信息的深度比目錄大,報道周期短,收錄范圍廣,著錄較簡單。例:沈則民.《武威漢代醫(yī)簡》中瘀方的臨床應(yīng)用[J].浙江中醫(yī)雜志,2002,(8):353.張延昌.武威漢代醫(yī)簡中的民間外治法[J].中國民間療法,2002,10(9):61.著者、論文題目、文獻(xiàn)出處(刊名、發(fā)表年月、卷、期、頁碼)及文種等。如:《CNKI》免費(fèi)題錄等。文摘(Abstract,Excerpta,Digest)含義:文摘是指對文獻(xiàn)內(nèi)容選擇重要部分以簡練的形式作為摘要,并按一定的原則和方法編排而成的一種檢索工具。以單篇文獻(xiàn)為報道單位,揭示文獻(xiàn)外部特征和內(nèi)容特征的檢索工具??梢钥醋饕环N帶有摘要的題錄,它是二次文獻(xiàn)的核心。如美國的《化學(xué)文摘》,中國醫(yī)學(xué)文摘,中國藥學(xué)文摘,中國生物學(xué)文摘,EDLINE/PubMed等。《全國報刊索引》正文款目TQ174①

陶瓷工業(yè)②000814421③

界面相對碳纖維增韌碳化硅復(fù)合材料性能的影響④/尹洪峰⑤(西北工業(yè)大學(xué)凝固技術(shù)國家重點(diǎn)實(shí)驗(yàn)室)⑥徐永東、成來飛等⑤∥硅酸鹽學(xué)報⑦—2000,28(1)⑧-1-5⑨說明:①《中圖法》分類號。②類名。③順序號。④論文題名。⑤作者。⑥第一作者單位。⑦刊名。⑧年、卷(期)。⑨起訖頁碼。目錄與索引的異同:相同點(diǎn):都是記錄文獻(xiàn)線索的工具;不同點(diǎn):目錄著錄的是一個完整的出版單位、一種圖書、一種期刊等;而索引著錄的是一個完整出版物的某一部門、某一觀點(diǎn)、某一知識單元等,索引揭示文獻(xiàn)內(nèi)容比目錄更深入和細(xì)致。目錄與題錄的異同:共同點(diǎn):是它們都只限于描述文獻(xiàn)的外部特征。不同點(diǎn):在于著錄的對象不同。目錄的著錄對象是完整出版單元,而題錄的著錄對象通常是完整出版單元的個別內(nèi)容。三、檢索語言1、檢索語言(RetrievalLanguage)檢索語言(檢索標(biāo)識系統(tǒng)、情報語言、標(biāo)引語言、索引語言)是一種在文獻(xiàn)存儲和檢索過程中共同使用的語言。它的用途是描述文獻(xiàn)特征,表達(dá)情報提問,并使兩者能相互溝通。2、檢索語言介紹其中表述文獻(xiàn)內(nèi)容特征的檢索語言有:(1)分類檢索語言(2)主題檢索語言(1)《中國圖書館分類法》(簡稱中圖法)

《中圖法》是在科學(xué)分類的基礎(chǔ)上,結(jié)合圖書的特性所編制的分類法。它將所有學(xué)科分為5個基本部類、22個(L、M、W、Y除外)大類。采用漢語拼音字母與阿拉伯?dāng)?shù)字相結(jié)合的混合號碼,用一個字母代表一個大類,以字母順序反映大類的次序,在字母后用數(shù)字作標(biāo)記。為適應(yīng)工業(yè)技術(shù)發(fā)展及該類文獻(xiàn)的分類,對工業(yè)技術(shù)二級類目,采用雙字母。

R醫(yī)藥衛(wèi)生、R28中藥學(xué)、R5內(nèi)科學(xué)、R9藥學(xué)A馬克思主義、列寧主義、

毛澤東思想、鄧小平理論TD礦業(yè)工程B哲學(xué)、宗教TE石油、天然氣工業(yè)C社會科學(xué)總論TF冶金工業(yè)D政治、法律

TG金屬學(xué)與金屬工藝E軍事TH機(jī)械、儀表工業(yè)F經(jīng)濟(jì)TJ武器工業(yè)G文化、科學(xué)、教育、體育TK能源與動力工程H語言、文字TL原子能技術(shù)I文學(xué)TM電工技術(shù)J藝術(shù)TN無線電電子學(xué)、電信技術(shù)K歷史、地理TP自動化技術(shù)、計算機(jī)技術(shù)N自然科學(xué)總論TQ化學(xué)工業(yè)O數(shù)理科學(xué)和化學(xué)TS輕工業(yè)、手工業(yè)P天文學(xué)、地球科學(xué)TU建筑科學(xué)Q生物科學(xué)TV水利工程R醫(yī)藥、衛(wèi)生U交通運(yùn)輸S農(nóng)業(yè)科學(xué)V航空、航天T工業(yè)技術(shù)X環(huán)境科學(xué)、安全科學(xué)TB一般工業(yè)技術(shù)Z綜合性圖書(2)主題語言也稱為主題法,由受控的自然語詞組成。它也是一套人工的符號系統(tǒng),是在一定程度上達(dá)成共識或成為標(biāo)準(zhǔn)的一套主題規(guī)則。其具體(表現(xiàn))形式是主題詞表。主題詞表規(guī)定了哪些詞在主題標(biāo)引或主題檢索時可以作為正式詞,哪些是非規(guī)范化的詞,不能用來標(biāo)引或檢索。如:《實(shí)用機(jī)床維修技術(shù)匯編》

主題詞:實(shí)用機(jī)床維修技術(shù)匯編關(guān)鍵詞語言關(guān)鍵詞,是一種準(zhǔn)主題檢索語言,也是檢索語言的發(fā)展的趨勢。出現(xiàn)在文獻(xiàn)標(biāo)題、文摘、正文中,對表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的語詞,對揭示和描述文獻(xiàn)主題內(nèi)容是重要的、關(guān)鍵性的語詞

如:《實(shí)用機(jī)床維修技術(shù)匯編》

提取關(guān)鍵詞:機(jī)床維修技術(shù)

四、文獻(xiàn)檢索方法與步驟文獻(xiàn)檢索的方法(1)常用法直接利用各種檢索工具查找文獻(xiàn)的方法。如圖書目次、期刊目次、后附關(guān)鍵詞索引、主題詞索引、著者索引等。順查法:從遠(yuǎn)及近查,用于了解某一事物發(fā)展的全過程。逆查法:由近及遠(yuǎn)查,重點(diǎn)為近期。(2)追溯法(引文法)利用已掌握的原始文獻(xiàn)所附的參考文獻(xiàn),追蹤查找參考文獻(xiàn)的原文獲得新的“引文”,從“引文”追溯到新的“引文”,獲得更多的相關(guān)文獻(xiàn)。缺點(diǎn):查全率、查準(zhǔn)率較低,易誤檢漏檢(3)綜合法又稱循環(huán)法,將上述二種方法綜合運(yùn)用。對于新的課題,一般從文獻(xiàn)的內(nèi)容特征入手,按分類途徑或主題途徑查找。如果在查找過程中,發(fā)現(xiàn)某著者發(fā)表的文章較多或有獨(dú)創(chuàng)見解,便可利用著者途徑追溯該著者的文章文獻(xiàn)信息檢索途徑1、從文獻(xiàn)外表特征2、從文獻(xiàn)內(nèi)容特征題名途徑-TitleIndex分類途徑-ClassifiedIndex著者途徑-AuthorIndex關(guān)鍵詞途徑-KeywordIndex號碼途徑-NumberIndex主題詞途徑-SubjectIndex

分類主題途徑-ClassifiedandSubjectIndex

其他-FormularIndex…

(1)篇名(題名)(2)著者:包括個人著者,團(tuán)體著者,專利發(fā)明人,專利受讓人,研究合同戶,學(xué)術(shù)會議主辦單位等(3)文獻(xiàn)序號:編號唯一,互不重復(fù),這個序號即為該文獻(xiàn)的代表。對于技術(shù)標(biāo)準(zhǔn)、科技報告、專利文獻(xiàn)都可以用序號作為檢索途徑(4)分類途徑:利用分類目錄和分類索引查找(5)主題途徑:用表征文獻(xiàn)主題思想的詞或詞組來檢索檢索步驟分析研究課題,明確查閱要求選擇檢索工具和檢索方法確定檢索途徑和檢索語言查找文獻(xiàn)線索獲取原文獻(xiàn)文獻(xiàn)檢索的一般流程分析研究課題,制定檢索方案分析研究課題的主題內(nèi)容、所屬學(xué)科,從而析出主題概念、提取關(guān)鍵詞和分子式、號碼等作為檢索詞,然后確定課題所需查找文獻(xiàn)的時間范圍、國家范圍和文獻(xiàn)類型范圍等。制定比較明確的檢索方案。

選擇檢索工具與方法根據(jù)課題的學(xué)科性質(zhì)和專業(yè)性質(zhì),選擇檢索工具。首先確定是采用手工檢索方式,還是計算機(jī)檢索方式。如采用手工檢索方式,使用哪種工具書;如采用計算機(jī)檢索,確定是到Internet查找網(wǎng)絡(luò)數(shù)據(jù)庫還是到信息服務(wù)部門檢索光盤數(shù)據(jù)庫,準(zhǔn)備檢索哪個數(shù)據(jù)庫。常用法(順查法、倒查法或抽查法)、追溯法或綜合法。確定檢索途徑和檢索語言采用分類、主題等揭示文獻(xiàn)內(nèi)容特征的檢索途徑,還是采用著者、號碼、題名等反映文獻(xiàn)外表特征的檢索途徑。如需采用分類途徑,利用檢索工具所采用的分類表,確定分類號;如需采用規(guī)范化的主題詞檢索,利用檢索工具所采用的主題詞表,將第1步中提出的關(guān)鍵詞轉(zhuǎn)換成規(guī)范化的主題詞。查找文獻(xiàn)線索按選定的檢索途徑,采用前幾步確定的檢索用詞(或計算機(jī)檢索用的檢索式)對檢索工具一定年份范圍內(nèi)的文獻(xiàn)進(jìn)行檢索,可得文獻(xiàn)線索(文獻(xiàn)出處)。手工檢索時,還應(yīng)對來源出版物名稱縮寫進(jìn)行還原,找出來源出版物的全稱。獲取原始文獻(xiàn)用戶檢索出相關(guān)文獻(xiàn)的線索,并進(jìn)行來源出版物名稱縮寫的還原后,即可依照由近及遠(yuǎn)或易獲得性原則向收藏單位索取原文;也可上網(wǎng)下載原文。檢索效果與評價

所謂檢索效果(retrieval

effectiveness)是指檢索結(jié)果的有效程度。常用的檢索效果的評價指標(biāo)有:收錄范圍、查全率、查準(zhǔn)率、響應(yīng)時間、用戶負(fù)擔(dān)和輸出形式等。其中主要的指標(biāo)是查全率和查準(zhǔn)率。

查全率、查準(zhǔn)率、漏檢率、誤檢率

提高檢索效果的措施

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論