信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結(jié)構(gòu)、評(píng)價(jià)及劃分_第1頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結(jié)構(gòu)、評(píng)價(jià)及劃分_第2頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結(jié)構(gòu)、評(píng)價(jià)及劃分_第3頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結(jié)構(gòu)、評(píng)價(jià)及劃分_第4頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結(jié)構(gòu)、評(píng)價(jià)及劃分_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章檢索系統(tǒng)的結(jié)構(gòu)、評(píng)價(jià)指標(biāo)及內(nèi)容劃分檢索系統(tǒng)的結(jié)構(gòu)檢索系統(tǒng)的衡量指標(biāo)檢索內(nèi)容的劃分一、檢索系統(tǒng)的構(gòu)成(一)結(jié)構(gòu)圖文獻(xiàn)源被選文獻(xiàn)概念分析將概念翻譯成系統(tǒng)語言文獻(xiàn)款目的集合(書目數(shù)據(jù)庫)提問表達(dá)式將概念翻譯成系統(tǒng)語言概念分析情報(bào)提問情報(bào)用戶情報(bào)存儲(chǔ)輸入情報(bào)檢索輸出標(biāo)引匹配檢索策略系統(tǒng)詞表一、檢索系統(tǒng)的構(gòu)成1、按文獻(xiàn)選擇子系統(tǒng)的特征來分,可分為:書目檢索系統(tǒng)數(shù)據(jù)檢索系統(tǒng)文本檢索系統(tǒng)綜合性檢索系統(tǒng)??菩詸z索系統(tǒng)2、按照詞表子系統(tǒng)的特征來分,可分為:控制詞匯的檢索系統(tǒng)非控制詞匯的檢索系統(tǒng)3、按照查詢子系統(tǒng)的特征來分,可分為:布爾邏輯檢索系統(tǒng)人工查詢系統(tǒng)二、檢索系統(tǒng)的衡量指標(biāo)為了說明與衡量檢索效率,目前在文獻(xiàn)檢索理論中流行著幾個(gè)指標(biāo):即檢全率(recallfactor)檢準(zhǔn)率(pertinencyfactor)漏檢率(omissionfactor)誤檢率(noisefactor)N

收錄的文獻(xiàn)總量X

有關(guān)文獻(xiàn)量M

檢出的文獻(xiàn)量W

檢出的有關(guān)文獻(xiàn)量二、檢索系統(tǒng)的衡量指標(biāo)檢全率(recallfactor)=WX=檢出的有關(guān)文獻(xiàn)量有關(guān)文獻(xiàn)量檢準(zhǔn)率(pertinencyfactor)=WM=檢出的有關(guān)文獻(xiàn)量檢出的文獻(xiàn)量漏檢率(omissionfactor)=1—WX誤檢率(noisefactor)=1—WM查全率與查準(zhǔn)率彼此有反變的關(guān)系。在同一個(gè)檢索系統(tǒng)中,查全率提高,檢準(zhǔn)率就會(huì)降低,反之亦然。查全100507525255075100查準(zhǔn)三、檢索內(nèi)容的劃分

文獻(xiàn)的類型是多種多樣的,而人們檢索文獻(xiàn)的角度、深度和廣度更是復(fù)雜多樣。不同的檢索需求,不可能由一種檢索內(nèi)容來解決。為適應(yīng)人們的多種信息查詢要求就產(chǎn)生了多種多樣的檢索內(nèi)容。

一般來講,分為以下幾種類型:(一)目錄(Bibliography)目錄是對(duì)圖書或者其他出版的文獻(xiàn)特征的記載和描述,其特點(diǎn)是:按種為單位進(jìn)行記錄與報(bào)道,對(duì)文獻(xiàn)的描述比較簡單,只記錄其外部特征,按一定的方法組織排列成各種不同種類的目錄。比較重要的目錄有:國家書目出版社與書店目錄館藏目錄

聯(lián)合目錄專題文獻(xiàn)目錄1、國家書目這是對(duì)一個(gè)國家出版的全部圖書所作的登記統(tǒng)計(jì)性書目,可以反映一個(gè)國家文化、科學(xué)和出版事業(yè)的水平。2、館藏書目包括圖書館、情報(bào)部門的文獻(xiàn)館、資料室等等的藏書目錄,它不僅包含從市場采購的公開發(fā)行的資料,也包括用交換等方式得到的非賣品資料不僅包括現(xiàn)在發(fā)行的新書刊,而且包括一定歷史時(shí)期累積起來的全部資料,這對(duì)廣泛地檢索文獻(xiàn)是很重要的3、聯(lián)合書目是匯總?cè)舾蓚€(gè)圖書館或其他收藏單位所藏文獻(xiàn)的目錄,從檢索角度來說,它可以免去分別查閱各個(gè)館藏目錄的麻煩,擴(kuò)大文獻(xiàn)的獲取范圍。(二)索引(Index)所謂索引,就是將書籍、期刊等文獻(xiàn)中所刊載的論文題目、作者以及所討論的或者涉及到的學(xué)科主題、人名、地名、名詞術(shù)語、分子式、所引用的參考文獻(xiàn)等等,根據(jù)一定的需要,經(jīng)過分析,分別摘錄出來,著名其所在書刊中的頁碼并按一定的原則排列起來的工具。索引大致可以分為兩種:1、篇目索引:主要揭示的是期刊,報(bào)紙等文獻(xiàn)中的文章,并把文章的著者、篇名按字順排列起來。2、內(nèi)容索引:是將圖書、文章中所包含的事物、人名、地名、學(xué)術(shù)名詞等內(nèi)容要項(xiàng)摘錄出來而編成的索引。(三)文摘(Abstract)文摘是通過描述文獻(xiàn)的外部特征和簡明深入地摘錄文獻(xiàn)內(nèi)容的要點(diǎn)來報(bào)道文獻(xiàn)的一種檢索工具,其特點(diǎn)是以簡練的形式,將某一學(xué)科或?qū)I(yè)的原始文獻(xiàn)的主題范圍、目的、方法等作簡略、準(zhǔn)確的摘錄。文摘的類型主要有以下兩種:1、報(bào)道性文摘(informativeabstract)

是對(duì)文獻(xiàn)中情報(bào)的濃縮,,它基本上客觀地反映原文創(chuàng)造性本分的全部內(nèi)容。例如,各種研究方法和數(shù)據(jù)。2、指示性文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論