信息檢索技術(shù)(第五版)(微課版)第1章 緒論_第1頁(yè)
信息檢索技術(shù)(第五版)(微課版)第1章 緒論_第2頁(yè)
信息檢索技術(shù)(第五版)(微課版)第1章 緒論_第3頁(yè)
信息檢索技術(shù)(第五版)(微課版)第1章 緒論_第4頁(yè)
信息檢索技術(shù)(第五版)(微課版)第1章 緒論_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

LOGO信息檢索技術(shù)緒論第一章01了解信息的特征、信息檢索的概念、信息檢索的目的和意義。02理解檢索工具的結(jié)構(gòu)及目錄、索引、文摘3種主要檢索工具的特點(diǎn)及作用。03熟悉信息檢索的原理、類型和基本工具的使用。04了解信息檢索的基本途徑,掌握信息檢索的方法和步驟。學(xué)習(xí)目標(biāo)目錄信息與文獻(xiàn)基本知識(shí)1.1信息檢索基礎(chǔ)1.2信息檢索的途徑1.3信息檢索的步驟和方法1.41.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類1.2.1信息檢索的原理 1.2.2信息檢索的類型 1.2.3信息檢索的工具 1.2.4信息檢索的意義1.3.1外部特征途徑1.3.2內(nèi)容特征途徑1.4.1信息檢索的步驟1.4.2信息檢索的方法 1.4.3計(jì)算機(jī)信息檢索基礎(chǔ)213從信息到文獻(xiàn)信息的分類文獻(xiàn)的分類1.1信息與文獻(xiàn)基本知識(shí)信息的定義:

國(guó)家標(biāo)準(zhǔn)《信息與文獻(xiàn)術(shù)語(yǔ)》(GB/T4894—2009)中信息的定義為:被交流的知識(shí)。信息涉及事實(shí)、概念、對(duì)象、事件、觀念、過(guò)程。信息是物質(zhì)存在的一種方式、形態(tài)或運(yùn)動(dòng)狀態(tài),也是事物的一種普遍屬性。1.信息(Information)客觀性共享性價(jià)值相對(duì)性多態(tài)性時(shí)效性依附性增長(zhǎng)性傳遞性信息的基本屬性1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類知識(shí)的定義:韋伯斯特(Webster)詞典1997年的定義,知識(shí)是通過(guò)實(shí)踐、研究、聯(lián)系或調(diào)查獲得的關(guān)于事物的事實(shí)和狀態(tài)的認(rèn)識(shí),是對(duì)科學(xué)、藝術(shù)或技術(shù)的理解,是人類獲得的關(guān)于真理和原理的認(rèn)識(shí)的總和。國(guó)家標(biāo)準(zhǔn)《信息與文獻(xiàn)術(shù)語(yǔ)》(GB/T4894—2009)中知識(shí)的定義為:基于推理并經(jīng)過(guò)證實(shí)的認(rèn)識(shí)。2.知識(shí)(Knowledge)從信息的觀念看,知識(shí)來(lái)源于信息,是理性化、優(yōu)化、系統(tǒng)化了的信息。從反映的內(nèi)容而言,知識(shí)是客觀事物的屬性與聯(lián)系的反映,是客觀世界在人腦中的相對(duì)正確的反映。從反映的活動(dòng)形式而言,知識(shí)有時(shí)表現(xiàn)為主體對(duì)事物的感性知覺(jué)或表象,屬于感性知識(shí),有時(shí)表現(xiàn)為關(guān)于事物的概念或規(guī)律,屬于理性知識(shí)。知識(shí)具有共享性、傳遞性、非損耗性及再生性等特點(diǎn)1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類3.情報(bào)(Intelligence)

情報(bào)的定義:

情報(bào)是作為交流對(duì)象的有用的知識(shí)。

情報(bào)是判斷、意志、決心、行動(dòng)需要的能指引方向的知識(shí)和智慧。

情報(bào)是解決問(wèn)題所需要的知識(shí)。

情報(bào)是激活了的知識(shí)。效用性(判斷的標(biāo)準(zhǔn))知識(shí)性傳遞性情報(bào)的基本屬性1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類4.文獻(xiàn)(Literature/Document)文獻(xiàn)的定義:

國(guó)家標(biāo)準(zhǔn)《文獻(xiàn)著錄第1部分-總則》(GB/T3792.1-2009)給出的文獻(xiàn)定義為:文獻(xiàn)是記錄有知識(shí)的一切載體。

國(guó)家標(biāo)準(zhǔn)《信息與文獻(xiàn)術(shù)語(yǔ)》(GB/T4894-2009)指出:文獻(xiàn)是在文獻(xiàn)工作過(guò)程中作為一個(gè)單位處理的記錄信息或?qū)嵨飳?duì)象。文獻(xiàn)工作是指為了存儲(chǔ)、分類、檢索、利用或傳遞,而對(duì)記錄信息所進(jìn)行的連續(xù)和系統(tǒng)的匯編和處理。

《文獻(xiàn)情報(bào)術(shù)語(yǔ)國(guó)際標(biāo)準(zhǔn)》對(duì)文獻(xiàn)的定義:文獻(xiàn)是存貯、檢索、利用或傳遞記錄信息的過(guò)程中,可作為一個(gè)單元處理的,在載體內(nèi)、載體上或依附載體而存貯有信息或數(shù)據(jù)的載體。1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類知識(shí)和信息即文獻(xiàn)的內(nèi)容1234物質(zhì)載體如竹簡(jiǎn)、紙張、膠片、磁盤等記錄知識(shí)和信息的符號(hào)如文字、圖表、聲音、圖像等記錄的方式或手段如書寫、印刷、復(fù)制、錄音、錄像等,即將知識(shí)和信息固化到載體上的手段文獻(xiàn)4要素1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類5.信息、知識(shí)、情報(bào)與文獻(xiàn)知識(shí)是對(duì)信息加工、吸收、提取、評(píng)價(jià)的結(jié)果,即系統(tǒng)化的信息成為知識(shí),知識(shí)記錄下來(lái)成為文獻(xiàn),文獻(xiàn)經(jīng)傳遞并加以應(yīng)用成為情報(bào),情報(bào)體現(xiàn)了人運(yùn)用知識(shí)的能力。文獻(xiàn)是記錄有知識(shí)和信息的一切載體,或稱為固化在某種物質(zhì)載體上的知識(shí)和信息,當(dāng)文獻(xiàn)中記錄的知識(shí)傳遞給用戶,并為用戶所利用時(shí),文獻(xiàn)中的知識(shí)就轉(zhuǎn)化為情報(bào)。

1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類按信息的內(nèi)容劃分科學(xué)技術(shù)信息社會(huì)科學(xué)信息按產(chǎn)生信息的客體的性質(zhì)來(lái)劃分自然信息生物信息機(jī)器信息社會(huì)信息按信息所依附的載體來(lái)劃分文獻(xiàn)信息口頭信息1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類按照文獻(xiàn)的加工層次分類零次文獻(xiàn)(ZerothLiterature)一次文獻(xiàn)(PrimaryLiterature)二次文獻(xiàn)(SecondaryLiterature)三次文獻(xiàn)(TertiaryLiterature)按照文獻(xiàn)的載體分類印刷型文獻(xiàn)(PaperLiterature)縮微型文獻(xiàn)(Microform)電子型文獻(xiàn)(Electroniciterature)音像型文獻(xiàn)(Audio-Visualiterature)按照文獻(xiàn)的出版形式分類印刷型文獻(xiàn)(PaperLiterature)縮微型文獻(xiàn)(Microform)電子型文獻(xiàn)(Electroniciterature)音像型文獻(xiàn)(Audio-Visualiterature)1.1.1從信息到文獻(xiàn)1.1.2信息的分類1.1.3文獻(xiàn)的分類1.2信息檢索基礎(chǔ)214信息檢索的原理信息檢索的類型信息檢索的意義3信息檢索的工具廣義的信息檢索“InformationRetrieval”是指將信息按照一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用戶的需要揭示、查找、傳遞相關(guān)信息的過(guò)程,包括了信息的存儲(chǔ)過(guò)程和查找過(guò)程。1.信息檢索的概念狹義的信息檢索僅指信息的查找,是指從存儲(chǔ)信息中獲得特定信息的過(guò)程。狹義的信息檢索包括3個(gè)方面的含義:了解用戶的信息需求、掌握信息檢索的技術(shù)或方法、滿足信息用戶的需求。1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義信息檢索的基本原理:就是在對(duì)信息進(jìn)行整理排序形成檢索工具的基礎(chǔ)上,按照用戶的要求利用檢索工具或檢索系統(tǒng),將用戶檢索提問(wèn)標(biāo)識(shí)(檢索詞)與已形成的或存儲(chǔ)在系統(tǒng)中的信息的存儲(chǔ)標(biāo)識(shí)(文獻(xiàn)特征標(biāo)識(shí)、標(biāo)引詞)進(jìn)行匹配比較,若取得一致,則為匹配,即達(dá)到了用戶的檢索需求,如圖1.1所示。2.信息檢索的原理圖1.1信息檢索原理圖1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義按信息存儲(chǔ)和檢索的內(nèi)容分類文獻(xiàn)檢索數(shù)據(jù)檢索事實(shí)檢索按照檢索系統(tǒng)中信息的組織方式分類全文檢索多媒體檢索按照信息存儲(chǔ)的載體和實(shí)現(xiàn)查找的技術(shù)手段分類手工檢索機(jī)械檢索計(jì)算機(jī)檢索1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義信息檢索工具是指為檢索需要而組織的文獻(xiàn)檢索系統(tǒng),它是收集、加工、標(biāo)引、組織文獻(xiàn)的結(jié)果,是檢索工作賴以生存的手段和條件,包含目錄、索引、文摘等。主體輔助索引使用說(shuō)明典型的檢索工具通常由3部分組成1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義目錄的定義:

國(guó)家標(biāo)準(zhǔn)《文獻(xiàn)著錄第1部分-總則》(GB/T3792.1-2009)中定義目錄為“將一批款目按照一定的次序編排而成的一種文獻(xiàn)報(bào)道和檢索工具”。目錄包括卡片目錄、書本式目錄等印刷型目錄,也包括機(jī)器可讀目錄(如MARC目錄)。1.目錄目錄的著錄款目(1)書名(刊名)項(xiàng)。(2)著者(編者)項(xiàng)。(3)出版項(xiàng):包括出版地點(diǎn)、出版者、出版期、版次等。(4)稽核項(xiàng):包括頁(yè)數(shù)、圖表、開本、裝訂形式、定價(jià)等。(5)附注項(xiàng):對(duì)上述各項(xiàng)的補(bǔ)充或說(shuō)明。(6)提要項(xiàng):內(nèi)容簡(jiǎn)介。(7)業(yè)務(wù)注記:指圖書館或保存單位在目錄上做的業(yè)務(wù)記載,包括索取號(hào)、登錄號(hào)、分類號(hào)、主題詞、存儲(chǔ)地點(diǎn)等。1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義目錄的排檢:

1)書名目錄

2)著者目錄

3)分類目錄

4)主題目錄1.目錄目錄的作用:

(1)推薦作用

(2)檢索工具

(3)文獻(xiàn)工作

(4)提供出處1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義索引的定義:

中華人民共和國(guó)新聞出版行業(yè)標(biāo)準(zhǔn)(CY/T235.7—2020)中定義索引為:“匯集書刊中包含的字詞、語(yǔ)句、名詞、事件、編號(hào)等主題,以適當(dāng)方式編排,指引讀者查找的檢索工具。”2.索引索引的作用:

索引可以將文獻(xiàn)所包含的若干信息分析摘錄出來(lái),作為排檢標(biāo)識(shí),這種標(biāo)識(shí)可以根據(jù)需要,在一定的范圍內(nèi)進(jìn)行任意深度的選擇和標(biāo)引,從而滿足更深層次或更多途徑的查找要求。索引可以方便用戶更快地達(dá)到檢索目標(biāo),是依附在目錄或文摘等檢索工具之上的輔助性工具,不能獨(dú)立存在。常用索引①主題索引②分類索引③著者索引④其他:?jiǎn)挝凰饕?或團(tuán)體著者索引)、化學(xué)分子式索引、引用刊物索引、出版單位索引等。1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義文摘的定義:

國(guó)家標(biāo)準(zhǔn)《文摘編寫規(guī)則》(GB6447—86)中定義文摘為“以提供文摘內(nèi)容梗概為目的,不加評(píng)論和補(bǔ)充解釋,簡(jiǎn)明、確切地記述文獻(xiàn)重要內(nèi)容的短文?!?.文摘文摘的作用:1)幫助讀者快速判斷文獻(xiàn)內(nèi)容2)節(jié)省閱讀時(shí)間3)減少語(yǔ)言障礙4)替代原文1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義按信息加工的手段或設(shè)備劃分手工檢索工具機(jī)械檢索工具計(jì)算機(jī)檢索工具檢索工具按編制方法劃分目錄型檢索工具題錄型檢索工具文摘型檢索工具索引型檢索工具按信息載體形態(tài)劃分書本式檢索工具卡片式檢索工具縮微式檢索工具磁性材料式檢索工具按收錄范圍劃分綜合性檢索工具??菩詸z索工具專題性檢索工具全面性檢索工具單一性檢索工具按時(shí)間范圍劃分預(yù)告性檢索工具現(xiàn)期通報(bào)性檢索工具回溯性檢索工具4.檢索工具類型1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義掌握獲取知識(shí)的捷徑,提高信息利用的效率提高信息素質(zhì),培養(yǎng)終身學(xué)習(xí)的能力科學(xué)研究的向?qū)В萍疾樾碌幕A(chǔ)1.2.1信息檢索的原理1.2.2信息檢索的類型1.2.3信息檢索的工具1.2.4信息檢索的意義1.3信息檢索的途徑1外部特征途徑2內(nèi)部特征途徑

根據(jù)信息的基本特征,可以把信息檢索途徑分為外部特征檢索途徑(題名途徑、著者途徑、引文途徑等)和內(nèi)容特征檢索途徑(分類途徑、主題途徑等)兩大類。外部特征途徑題名途徑:刊名、書名、篇名等著者途徑:作者、編者、譯者、專利權(quán)人、出版機(jī)構(gòu)等引文途徑:其他途徑:專利號(hào)、報(bào)告號(hào)、合同號(hào)、標(biāo)準(zhǔn)號(hào)、國(guó)際標(biāo)準(zhǔn)書號(hào)和刊號(hào)等內(nèi)容特征途徑分類途徑:是指按照文獻(xiàn)所屬學(xué)科(專業(yè))屬性(類別)進(jìn)行檢索的途徑。主題途徑:是按照文獻(xiàn)信息的主題內(nèi)容進(jìn)行檢索的途徑,利用主題詞、關(guān)鍵詞、敘詞,并按字順排列實(shí)現(xiàn)檢索。1.3.1外部特征途徑1.3.2內(nèi)部特征途徑213信息檢索的步驟信息檢索的方法計(jì)算機(jī)信息檢索基礎(chǔ)1.4信息檢索的步驟的方法圖1.2信息檢索的步驟1.4.1信息檢索的步驟1.4.2信息檢索的方法1.4.3計(jì)算機(jī)信息檢索基礎(chǔ)1.順查法:指按照時(shí)間的順序,由遠(yuǎn)及近地利用檢索系統(tǒng)進(jìn)行文獻(xiàn)信息檢索的方法。2.逆查法:是由近及遠(yuǎn)地查找,逆著時(shí)間的順序利用檢索工具進(jìn)行文獻(xiàn)信息檢索的方法。

3.抽查法:是針對(duì)檢索課題的特點(diǎn),選擇有關(guān)該課題的文獻(xiàn)信息最可能出現(xiàn)或最多出現(xiàn)的時(shí)間段,利用檢索工具進(jìn)行重點(diǎn)檢索的方法。4.追溯法(引文法):是指利用已經(jīng)掌握的文獻(xiàn)末尾所列的參考文獻(xiàn),進(jìn)行逐一追溯查找“引文”的一種最簡(jiǎn)便的擴(kuò)大情報(bào)來(lái)源的方法。5.綜合法:又稱循環(huán)法,這是把上述方法加以綜合運(yùn)用的方法。1.4.1信息檢索的步驟1.4.2信息檢索的方法1.4.3計(jì)算機(jī)信息檢索基礎(chǔ)計(jì)算機(jī)信息檢索過(guò)程實(shí)際上是將檢索提問(wèn)詞與文獻(xiàn)記錄標(biāo)引詞進(jìn)行對(duì)比匹配的過(guò)程。為了提高檢索效率,計(jì)算機(jī)檢索系統(tǒng)經(jīng)常采用一些運(yùn)算方法,從概念相關(guān)性、位置相關(guān)性等方面對(duì)檢索提問(wèn)進(jìn)行技術(shù)處理。020301檢索數(shù)據(jù)庫(kù)的選擇布爾邏輯檢索檢索詞的選擇1.4.1信息檢索的步驟1.4.2信息檢索的方法1.4.3計(jì)算機(jī)信息檢索基礎(chǔ)1.檢索詞的選擇檢索詞是能概括要檢索內(nèi)容的相關(guān)詞匯。檢索詞是表達(dá)信息需求和檢索課題內(nèi)容的基本單元,也是與系統(tǒng)中有關(guān)據(jù)庫(kù)進(jìn)行匹配運(yùn)算的基本單元,檢索詞選擇恰當(dāng)與否,直接影響檢索效果。從語(yǔ)言的規(guī)范性方面來(lái)劃分,檢索詞又可以劃分為兩類:(1)受控詞是事先規(guī)范化的檢索語(yǔ)言,取自主題詞表、敘詞表、分類表等。(2)非受控詞是指非規(guī)范化的自然語(yǔ)言詞匯,又稱自由詞。從詞的性質(zhì)來(lái)劃分,檢索詞可以劃分為四類:

(1)表示主題的檢索詞:如標(biāo)題詞、單元詞、敘詞、關(guān)鍵詞。(2)表示作者的檢索詞。如作者姓名、機(jī)構(gòu)名。(3)表示分類的檢索詞。如分類號(hào)(4)表示特殊意義的檢索詞。如ISBN、ISSN、引文標(biāo)引詞等。1.4.1信息檢索的步驟1.4.2信息檢索的方法1.4.3計(jì)算機(jī)信息檢索基礎(chǔ)2.布爾邏輯檢索將多個(gè)檢索詞用布爾運(yùn)算符(簡(jiǎn)稱檢索算符)連接在一起來(lái)進(jìn)行檢索,稱之為布爾邏輯檢索。將選定的檢索詞用系統(tǒng)規(guī)定的檢索算符連接起來(lái),就成為一個(gè)體現(xiàn)檢索策略的檢索表達(dá)式。1.4.1信息檢索的步驟1.4.2信息檢索的方法1.4.3計(jì)算機(jī)信息檢索基礎(chǔ)邏輯或邏輯與邏輯非邏輯與用“AND”或“*”來(lái)表達(dá)。檢索式寫作“AANDB”或“A*B”,表明數(shù)據(jù)庫(kù)中同時(shí)有檢索詞“A”和“B”的記錄才為命中記錄。邏輯與可增強(qiáng)檢索的專指性,縮小檢索范圍。邏輯或用“OR”或“+”來(lái)表達(dá)。檢索式寫作“AORB”或“A+B”,表明數(shù)據(jù)庫(kù)中凡有檢索詞“A”或者“B”,或同時(shí)有“A”和“B”的記錄均為命中記錄。邏輯非用“NOT”或“-”來(lái)表達(dá)。檢索式寫作“ANOTB”或“A-B”,表明數(shù)據(jù)庫(kù)中凡有檢索詞“A”而不含檢索詞“B”的記錄才為命中記錄。1.4.1信息檢索的步驟1.4.2信息檢索的方法1.4.3計(jì)算機(jī)信息檢索基礎(chǔ)3.檢索數(shù)據(jù)庫(kù)的選擇(1)檢索數(shù)據(jù)庫(kù)的類型是否滿足檢索需要對(duì)于專業(yè)性強(qiáng)的,特別是科技信息檢索,使用專業(yè)數(shù)據(jù)庫(kù)更能反映專業(yè)發(fā)展全貌,且使用專業(yè)數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論