版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、群號:群號:回顧:回顧: 信息、知識、情報、文獻(xiàn)的概念及關(guān)系 文獻(xiàn)的種類按文獻(xiàn)的載體:印刷型、微縮型、聲像型、機讀型按文獻(xiàn)的加工:零次文獻(xiàn)、一次文獻(xiàn)、二次文獻(xiàn)和三次文獻(xiàn)按文獻(xiàn)的出版:圖書、期刊、報紙、學(xué)位論文、會議文獻(xiàn)、專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、科技報告、政府出版物、產(chǎn)品資料在德國柏林大學(xué)圖書館的大門上刻著這樣的一名言:這把金鑰匙就是信息檢索方法?,F(xiàn)代信息社會,科技信息數(shù)量急劇增長,不僅數(shù)量龐大,而且增長的速度也令人驚嘆!據(jù)統(tǒng)計:非科技內(nèi)容的文獻(xiàn)每3050年才增長1倍;科技文獻(xiàn)平均每科技文獻(xiàn)平均每7 78 8年增長年增長1 1倍;倍;如計算機科學(xué)的文獻(xiàn),每如計算機科學(xué)的文獻(xiàn),每2 23 3年就翻一番
2、年就翻一番;科技文獻(xiàn)內(nèi)容交叉重復(fù)、文獻(xiàn)失效加快、文獻(xiàn)出版分散等內(nèi)容交叉重復(fù)、文獻(xiàn)失效加快、文獻(xiàn)出版分散等都給文獻(xiàn)的利用帶來不便。但是但是,現(xiàn)代信息傳播技術(shù)的進(jìn)步,使信息檢索,電子原文傳遞現(xiàn)代信息傳播技術(shù)的進(jìn)步,使信息檢索,電子原文傳遞等現(xiàn)代化信息傳播方式得以實現(xiàn),人們可以利用互聯(lián)網(wǎng)多途徑、等現(xiàn)代化信息傳播方式得以實現(xiàn),人們可以利用互聯(lián)網(wǎng)多途徑、多選擇、多層次地檢索所需文獻(xiàn)信息多選擇、多層次地檢索所需文獻(xiàn)信息催生了信息檢索技術(shù)。催生了信息檢索技術(shù)。 信息檢索的概念及類型信息檢索的概念及類型 檢索途徑與檢索語言檢索途徑與檢索語言 檢索系統(tǒng)與檢索方法檢索系統(tǒng)與檢索方法 檢索步驟與檢索策略檢索步驟與檢
3、索策略 檢索技術(shù)與檢索效果檢索技術(shù)與檢索效果 學(xué)習(xí)目的學(xué)習(xí)目的 了解信息檢索原理了解信息檢索原理 掌握信息檢索技術(shù)掌握信息檢索技術(shù) 了解檢索步驟了解檢索步驟 了解檢索效果評價及調(diào)整方法了解檢索效果評價及調(diào)整方法 熟悉檢索語言和途徑熟悉檢索語言和途徑一、信息檢索的概念一、信息檢索的概念1 1、信息檢索的含義、信息檢索的含義(廣義的信息檢索)(廣義的信息檢索)(information storage & information storage & Information Retrieval)全稱為“信息存儲與檢索”,是指將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要找出有關(guān)信息
4、的過程。(狹義的信息檢索)(狹義的信息檢索)(Information Retrieval)為“信息存儲與檢索”的后半部分,通常稱為“信息查找”或“信息搜索”,是指從信息集合中找出用戶所需要的有關(guān)信息的過程。2. 2. 信息檢索的實質(zhì)信息檢索的實質(zhì) 信息檢索的實質(zhì)是將描述用戶所需信息信息檢索的實質(zhì)是將描述用戶所需信息的提問特征,與信息存儲的檢索標(biāo)識進(jìn)行比的提問特征,與信息存儲的檢索標(biāo)識進(jìn)行比較,從中找出與提問特征一致或基本一致的較,從中找出與提問特征一致或基本一致的信息。信息。 信息檢索是對信息集合與需求集合的匹信息檢索是對信息集合與需求集合的匹配與選擇。配與選擇。3. 3. 信息存儲與信息檢索
5、的關(guān)系信息存儲與信息檢索的關(guān)系 信息存儲與信息檢索是密不可分的兩個信息存儲與信息檢索是密不可分的兩個過程,同時又是互逆的。存儲是為了檢索,過程,同時又是互逆的。存儲是為了檢索,而檢索必須先要存儲。沒有存儲檢索就無從而檢索必須先要存儲。沒有存儲檢索就無從談起。這是存儲與檢索相輔相成、相互依存談起。這是存儲與檢索相輔相成、相互依存的辯證關(guān)系。的辯證關(guān)系。 原理示意圖如下圖所示。1. 1. 存儲存儲的存儲過程的存儲過程。是把描述“一次文獻(xiàn)”特征信息按照檢索語言規(guī)則,進(jìn)行規(guī)范標(biāo)引按照檢索語言規(guī)則,進(jìn)行規(guī)范標(biāo)引形成“二次文獻(xiàn)二次文獻(xiàn)”,并存儲在“文獻(xiàn)檢索系統(tǒng)”中,這就是對一次文獻(xiàn)組織加工和記錄的過程,即
6、建立建立“文獻(xiàn)檢索系統(tǒng)文獻(xiàn)檢索系統(tǒng)”2. 2. 檢索過程檢索過程是讀者根據(jù)“檢索課題”,分析出檢索提問詞檢索提問詞與與數(shù)據(jù)庫文獻(xiàn)記錄中的數(shù)據(jù)庫文獻(xiàn)記錄中的標(biāo)引詞標(biāo)引詞進(jìn)行對比,當(dāng)進(jìn)行對比,當(dāng)提問詞與標(biāo)引詞匹配一致時,即為命中,檢索成提問詞與標(biāo)引詞匹配一致時,即為命中,檢索成功。功。4. 4. 信息檢索的作用信息檢索的作用 1) 1) 避免重復(fù)研究或走彎路避免重復(fù)研究或走彎路 2) 2) 節(jié)省學(xué)習(xí)者的時間節(jié)省學(xué)習(xí)者的時間 3) 3) 是獲取新知識的捷徑是獲取新知識的捷徑 二、信息檢索的類型二、信息檢索的類型 按檢索內(nèi)容可分為:按檢索內(nèi)容可分為:數(shù)據(jù)信息檢索(Data Information Re
7、trieval) 、事實信息檢索(Fact Information Retrieval)和文獻(xiàn)信息檢索(Document Information Retrieval)按組織方式可分為:按組織方式可分為:全文檢索(Full-Text Retrieval) 、超文本檢索(Hyper-Text Retrieval )和超媒體檢索(Hyper-Media Retrieval)按檢索手段可分為:按檢索手段可分為:有手工檢索、機械檢索和計算機檢索按檢索內(nèi)容或檢索目標(biāo)分 1) 文獻(xiàn)型信息檢索 文獻(xiàn)型信息檢索是指利用檢索工具或檢文獻(xiàn)型信息檢索是指利用檢索工具或檢索系統(tǒng)查找文獻(xiàn)的過程,索系統(tǒng)查找文獻(xiàn)的過程,包括
8、文獻(xiàn)線索檢索包括文獻(xiàn)線索檢索和文獻(xiàn)全文檢索。和文獻(xiàn)全文檢索。 文獻(xiàn)線索檢索是指利用檢索工具或檢索文獻(xiàn)線索檢索是指利用檢索工具或檢索系統(tǒng)查找文獻(xiàn)的出處,檢索結(jié)果是文獻(xiàn)線索。系統(tǒng)查找文獻(xiàn)的出處,檢索結(jié)果是文獻(xiàn)線索。 文獻(xiàn)全文檢索是以文獻(xiàn)所含的全部信息文獻(xiàn)全文檢索是以文獻(xiàn)所含的全部信息作為檢索內(nèi)容,即檢索系統(tǒng)存儲的是整篇文作為檢索內(nèi)容,即檢索系統(tǒng)存儲的是整篇文章或整部圖書的全部內(nèi)容。文獻(xiàn)全文檢索是章或整部圖書的全部內(nèi)容。文獻(xiàn)全文檢索是當(dāng)前計算機信息檢索的發(fā)展方向之一。當(dāng)前計算機信息檢索的發(fā)展方向之一。2) 事實型信息檢索 事實型信息檢索是以特定客觀事實為事實型信息檢索是以特定客觀事實為檢索對象,借助
9、于提供事實檢索的檢索工具檢索對象,借助于提供事實檢索的檢索工具與數(shù)據(jù)庫進(jìn)行撿索。其檢索結(jié)果為基本事實。與數(shù)據(jù)庫進(jìn)行撿索。其檢索結(jié)果為基本事實。如某個字、詞的查找,某一詩詞文句的查找,如某個字、詞的查找,某一詩詞文句的查找,某一年、月、日的查找,某一地名的查找,某一年、月、日的查找,某一地名的查找,某一人物的查找,某一機構(gòu)的查找某一事某一人物的查找,某一機構(gòu)的查找某一事件的查找,某一法規(guī)制度的查找,某一圖像件的查找,某一法規(guī)制度的查找,某一圖像的查找,某一數(shù)據(jù)、參數(shù)、公式或化學(xué)分子的查找,某一數(shù)據(jù)、參數(shù)、公式或化學(xué)分子式的查找等。式的查找等。 3) 數(shù)據(jù)型信息檢索 數(shù)據(jù)型信息檢索是一種確定性檢索
10、,數(shù)據(jù)型信息檢索是一種確定性檢索,是以數(shù)值或圖表形式表示的數(shù)據(jù)為檢索對象是以數(shù)值或圖表形式表示的數(shù)據(jù)為檢索對象的信息檢索,又稱的信息檢索,又稱“數(shù)值檢索數(shù)值檢索”。檢索系統(tǒng)。檢索系統(tǒng)中存儲的是大量的數(shù)據(jù),這些數(shù)據(jù)既包括物中存儲的是大量的數(shù)據(jù),這些數(shù)據(jù)既包括物質(zhì)的各種參數(shù)、電話號碼、銀行賬號、觀測質(zhì)的各種參數(shù)、電話號碼、銀行賬號、觀測數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等數(shù)字?jǐn)?shù)據(jù),也包括圖表、數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等數(shù)字?jǐn)?shù)據(jù),也包括圖表、圖譜、市場行情、化學(xué)分子式、物質(zhì)的各種圖譜、市場行情、化學(xué)分子式、物質(zhì)的各種特性等非數(shù)字?jǐn)?shù)據(jù)。特性等非數(shù)字?jǐn)?shù)據(jù)。按系統(tǒng)中信息的組織方式分 1) 全文檢索 指檢索系統(tǒng)中存儲的是整篇文章乃至指檢
11、索系統(tǒng)中存儲的是整篇文章乃至整本圖書。用戶根據(jù)個人的需求從中獲取有整本圖書。用戶根據(jù)個人的需求從中獲取有關(guān)的章、節(jié)、段、句等信息,并且還可以做關(guān)的章、節(jié)、段、句等信息,并且還可以做各種統(tǒng)計和分析。各種統(tǒng)計和分析。2) 超文本檢索 超文本結(jié)構(gòu)類似于人類的聯(lián)想記憶結(jié)超文本結(jié)構(gòu)類似于人類的聯(lián)想記憶結(jié)構(gòu),它采用了一種非線性的網(wǎng)狀結(jié)構(gòu)組織塊構(gòu),它采用了一種非線性的網(wǎng)狀結(jié)構(gòu)組織塊狀信息,沒有固定的順序也不要求讀者必狀信息,沒有固定的順序也不要求讀者必須按照某個順序來閱讀。采用這種網(wǎng)狀結(jié)構(gòu),須按照某個順序來閱讀。采用這種網(wǎng)狀結(jié)構(gòu),各信息塊很容易按照信息的原始結(jié)構(gòu)或人們各信息塊很容易按照信息的原始結(jié)構(gòu)或人們的
12、的“聯(lián)想聯(lián)想”關(guān)系加以組織。關(guān)系加以組織。3) 超媒體檢索 由于把多媒體信息引入超文本里產(chǎn)由于把多媒體信息引入超文本里產(chǎn)生了多媒體超文本,也即超媒體。它是對超生了多媒體超文本,也即超媒體。它是對超文本檢索的補充,其存儲對象超出了文本范文本檢索的補充,其存儲對象超出了文本范疇,融入了靜態(tài)、動態(tài)圖像及聲音等多媒體疇,融入了靜態(tài)、動態(tài)圖像及聲音等多媒體信息。信息存儲結(jié)構(gòu)從單維發(fā)展到多維,存信息。信息存儲結(jié)構(gòu)從單維發(fā)展到多維,存儲空間范圍不斷擴大。儲空間范圍不斷擴大。按檢索手段可分為:按檢索手段可分為:手工檢索:是人直接用手、眼、手工檢索:是人直接用手、眼、 腦組織、查找印刷型文獻(xiàn)的檢索。具有直腦組織
13、、查找印刷型文獻(xiàn)的檢索。具有直觀、靈活、無需各種設(shè)備和上機費用的優(yōu)點。觀、靈活、無需各種設(shè)備和上機費用的優(yōu)點。 機械信息檢索:機械信息檢索:2020世紀(jì)世紀(jì)5050年代開始年代開始, ,過渡階段過渡階段, ,分機電信息檢索和光電信息分機電信息檢索和光電信息檢索。檢索。 機電:使用諸如打孔機、驗孔機、分類機等機電設(shè)備記錄二次文獻(xiàn),用機電:使用諸如打孔機、驗孔機、分類機等機電設(shè)備記錄二次文獻(xiàn),用電刷作為檢索元件的信息檢索系統(tǒng)。電刷作為檢索元件的信息檢索系統(tǒng)。 光電:使用縮微照相記錄二次文獻(xiàn),以膠卷或膠片邊緣部分若干黑白小光電:使用縮微照相記錄二次文獻(xiàn),以膠卷或膠片邊緣部分若干黑白小方塊的不同組合做
14、檢索標(biāo)志,利用光電檢索元件查找文獻(xiàn)的系統(tǒng)。方塊的不同組合做檢索標(biāo)志,利用光電檢索元件查找文獻(xiàn)的系統(tǒng)。計算機檢索:將檢索提問標(biāo)識與存儲在數(shù)據(jù)庫中的標(biāo)引標(biāo)識自動進(jìn)行比較,計算機檢索:將檢索提問標(biāo)識與存儲在數(shù)據(jù)庫中的標(biāo)引標(biāo)識自動進(jìn)行比較,含有該標(biāo)識選出相匹配的信息就會從數(shù)據(jù)庫中并通過計算機輸出的過程。含有該標(biāo)識選出相匹配的信息就會從數(shù)據(jù)庫中并通過計算機輸出的過程。第二節(jié)第二節(jié) 檢索途徑與檢索語言檢索途徑與檢索語言一、檢索途徑一、檢索途徑 1. 1. 以文獻(xiàn)的外部特征為檢索途徑以文獻(xiàn)的外部特征為檢索途徑 1) 1) 題名途徑題名途徑 文獻(xiàn)題名是指文獻(xiàn)的名稱,如圖書的書名、期刊文獻(xiàn)題名是指文獻(xiàn)的名稱,如
15、圖書的書名、期刊的刊名、報紙的報紙名稱、光盤的光盤名稱等。它的刊名、報紙的報紙名稱、光盤的光盤名稱等。它是認(rèn)識一篇文獻(xiàn)的起點。通過題名途徑可查找圖書、是認(rèn)識一篇文獻(xiàn)的起點。通過題名途徑可查找圖書、期刊、單篇文獻(xiàn)。檢索工具中的書名索引、會議名期刊、單篇文獻(xiàn)。檢索工具中的書名索引、會議名稱索引、書目索引、刊名索引等都提供了從題名進(jìn)稱索引、書目索引、刊名索引等都提供了從題名進(jìn)行文獻(xiàn)檢索的途徑。行文獻(xiàn)檢索的途徑。 2) 2) 著者途徑著者途徑 文獻(xiàn)著者是指對文獻(xiàn)內(nèi)容負(fù)有責(zé)任的個人或機文獻(xiàn)著者是指對文獻(xiàn)內(nèi)容負(fù)有責(zé)任的個人或機關(guān)團體,也就是我們常說的作者、編者、譯者等。關(guān)團體,也就是我們常說的作者、編者、
16、譯者等。著者途徑也是人們檢索文獻(xiàn)經(jīng)常使用的一條途徑,著者途徑也是人們檢索文獻(xiàn)經(jīng)常使用的一條途徑,包含個人著者、團體著者、專利發(fā)明人、專利權(quán)人、包含個人著者、團體著者、專利發(fā)明人、專利權(quán)人、合同戶、學(xué)術(shù)會議主辦單位等。利用責(zé)任者途徑檢合同戶、學(xué)術(shù)會議主辦單位等。利用責(zé)任者途徑檢索文獻(xiàn),主要利用的是作者索引、作者目錄、個人索文獻(xiàn),主要利用的是作者索引、作者目錄、個人作者索引、團體作者索引、專利權(quán)人索引等。作者索引、團體作者索引、專利權(quán)人索引等。 3) 代碼途徑 很多文獻(xiàn)因其本身特點有特定序號,如科技報很多文獻(xiàn)因其本身特點有特定序號,如科技報告號、專利號、標(biāo)準(zhǔn)號、信息收藏單位的入藏號、告號、專利號、
17、標(biāo)準(zhǔn)號、信息收藏單位的入藏號、ISBNISBN、ISSNISSN等。代碼途徑就是依據(jù)文獻(xiàn)信息出版時等。代碼途徑就是依據(jù)文獻(xiàn)信息出版時所編的代碼順序來檢索文獻(xiàn)信息的途徑。這些序號所編的代碼順序來檢索文獻(xiàn)信息的途徑。這些序號往往具有唯一性,可以據(jù)此識別特定的文獻(xiàn)信息。往往具有唯一性,可以據(jù)此識別特定的文獻(xiàn)信息。依據(jù)這些序號數(shù)字順序可編制序號索引,提供序號依據(jù)這些序號數(shù)字順序可編制序號索引,提供序號檢索途徑。同時,許多檢索系統(tǒng)利用事物本身具有檢索途徑。同時,許多檢索系統(tǒng)利用事物本身具有的某種符號代碼編制成分子式、元素符號、結(jié)構(gòu)式的某種符號代碼編制成分子式、元素符號、結(jié)構(gòu)式等索引,提供從特定符號代碼順
18、序進(jìn)行檢索的途徑,等索引,提供從特定符號代碼順序進(jìn)行檢索的途徑,如化合物索引。如化合物索引。2. 以文獻(xiàn)的內(nèi)容特征為檢索途徑 1) 分類途徑 分類途徑是以課題的學(xué)科屬性為出發(fā)點,分類途徑是以課題的學(xué)科屬性為出發(fā)點,按學(xué)科分類體系來查找文獻(xiàn)信息,以分類作按學(xué)科分類體系來查找文獻(xiàn)信息,以分類作為檢索點,利用學(xué)科分類表、分類目錄、分為檢索點,利用學(xué)科分類表、分類目錄、分類索引等按學(xué)科體系編排的檢索工具來查找類索引等按學(xué)科體系編排的檢索工具來查找有關(guān)某一學(xué)科或相關(guān)學(xué)科領(lǐng)域的文獻(xiàn)信息。有關(guān)某一學(xué)科或相關(guān)學(xué)科領(lǐng)域的文獻(xiàn)信息。它能滿足族性檢索的需求。它能滿足族性檢索的需求。 2) 主題途徑 主題途徑是利用信
19、息的主題內(nèi)容進(jìn)行檢主題途徑是利用信息的主題內(nèi)容進(jìn)行檢索的途徑,即利用從自然語言中抽象出來的,索的途徑,即利用從自然語言中抽象出來的,或者經(jīng)過人工規(guī)范化的、能夠代表信息內(nèi)容或者經(jīng)過人工規(guī)范化的、能夠代表信息內(nèi)容的標(biāo)引詞來檢索。它沖破了按學(xué)科分類的束的標(biāo)引詞來檢索。它沖破了按學(xué)科分類的束縛,使分散在各個學(xué)科領(lǐng)域里的有關(guān)同一課縛,使分散在各個學(xué)科領(lǐng)域里的有關(guān)同一課題的信息集中于同一主題,使用時就如同查題的信息集中于同一主題,使用時就如同查字典一樣方便和快捷。其最大優(yōu)點是把同性字典一樣方便和快捷。其最大優(yōu)點是把同性質(zhì)的事物集中于一處,使用戶在檢索時便于質(zhì)的事物集中于一處,使用戶在檢索時便于選取,而且將
20、同類事物集中在一起的方法符選取,而且將同類事物集中在一起的方法符合人們的工作和生活習(xí)慣,直接而準(zhǔn)確。合人們的工作和生活習(xí)慣,直接而準(zhǔn)確。 二、檢索語言 1. 檢索語言的含義 檢索語言是根據(jù)信息檢索的需要而創(chuàng)造的專供信檢索語言是根據(jù)信息檢索的需要而創(chuàng)造的專供信息存儲和信息檢索使用的一種人工語言。息存儲和信息檢索使用的一種人工語言。 檢索語言是在文獻(xiàn)信息檢索過程中使用的特定語檢索語言是在文獻(xiàn)信息檢索過程中使用的特定語言形式,它的作用在于促成信息檢索系統(tǒng)與檢索用言形式,它的作用在于促成信息檢索系統(tǒng)與檢索用戶的溝通。戶的溝通。 u當(dāng)存儲信息時,當(dāng)存儲信息時,檢索系統(tǒng)對文獻(xiàn)內(nèi)容進(jìn)檢索系統(tǒng)對文獻(xiàn)內(nèi)容進(jìn)行分
21、析,概括分析出若干能代表文獻(xiàn)內(nèi)行分析,概括分析出若干能代表文獻(xiàn)內(nèi)容的語詞并賦于一定的標(biāo)識,如題名、容的語詞并賦于一定的標(biāo)識,如題名、作者、主題詞等,作為存儲與檢索的依作者、主題詞等,作為存儲與檢索的依據(jù),然后納入到數(shù)據(jù)庫中。據(jù),然后納入到數(shù)據(jù)庫中。u當(dāng)檢索信息時,當(dāng)檢索信息時,檢索人員首先要對檢索檢索人員首先要對檢索課題進(jìn)行分析,同樣形成若干能代表信課題進(jìn)行分析,同樣形成若干能代表信息需求的語詞,然后通過檢索系統(tǒng)在數(shù)息需求的語詞,然后通過檢索系統(tǒng)在數(shù)據(jù)庫中匹配具有同樣語詞和標(biāo)識的文獻(xiàn),據(jù)庫中匹配具有同樣語詞和標(biāo)識的文獻(xiàn),找到自己所需的信息找到自己所需的信息。2. 檢索語言的類型 1)描述文獻(xiàn)外
22、部特征的語言 (1 1)題名語言)題名語言 (2 2)著者語言)著者語言 (3 3)代碼語言)代碼語言 (1 1)分類語言)分類語言按照學(xué)科范疇及知識之間的關(guān)系列出類目,并用數(shù)字、字母符號對類目按照學(xué)科范疇及知識之間的關(guān)系列出類目,并用數(shù)字、字母符號對類目進(jìn)行標(biāo)識的一種語言體系,也稱分類法。使用這種檢索語言建立的信息進(jìn)行標(biāo)識的一種語言體系,也稱分類法。使用這種檢索語言建立的信息檢索系統(tǒng)可以反映知識的從屬、派生、重合、交叉、并列等關(guān)系,用戶檢索系統(tǒng)可以反映知識的從屬、派生、重合、交叉、并列等關(guān)系,用戶因此可以鳥瞰全貌、觸類旁通,系統(tǒng)地掌握和利用一個學(xué)科或?qū)I(yè)范圍因此可以鳥瞰全貌、觸類旁通,系統(tǒng)地
23、掌握和利用一個學(xué)科或?qū)I(yè)范圍的知識相信息。的知識相信息。 分類語言是用分類號表達(dá)學(xué)科體系的各種概念,將各種概念按學(xué)科性質(zhì)分類語言是用分類號表達(dá)學(xué)科體系的各種概念,將各種概念按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列。進(jìn)行分類和系統(tǒng)排列。2 2)描述文獻(xiàn)內(nèi)部特征的語言)描述文獻(xiàn)內(nèi)部特征的語言例:例:中國圖書館分類法 中國科學(xué)院圖書館圖書分類法中國人民大學(xué)圖書館圖書分類法杜威十進(jìn)分類法DDC國會圖書館分類法LCC(2 2)主題語言)主題語言 主題主題“是一組具有共性事物的總稱,是一組具有共性事物的總稱,用以表達(dá)文獻(xiàn)所論述和研究的具體對象和問用以表達(dá)文獻(xiàn)所論述和研究的具體對象和問題題”,即文獻(xiàn)的,即文獻(xiàn)的“中心內(nèi)
24、容中心內(nèi)容”。每種文獻(xiàn)都。每種文獻(xiàn)都包含著若干主題,研究或闡述一個或多個問包含著若干主題,研究或闡述一個或多個問題。主題詞就是表達(dá)主題概念的詞匯。題。主題詞就是表達(dá)主題概念的詞匯。 人工語言人工語言自然語言自然語言標(biāo)引工作量大標(biāo)引工作量大自動標(biāo)引完成自動標(biāo)引完成需要不斷維護,管理成需要不斷維護,管理成本高本高靈活、檢索入口多、靈活、檢索入口多、管理和維護成本低管理和維護成本低用戶不易掌握用戶不易掌握用戶易掌握,但不易用戶易掌握,但不易精確精確查全率不高查全率不高查準(zhǔn)率不高查準(zhǔn)率不高第三節(jié) 檢索系統(tǒng)與檢索方法一、檢索系統(tǒng) 1. 檢索系統(tǒng)的概念 信息檢索系統(tǒng)是為滿足信息用戶的檢索需求而建立起信息檢
25、索系統(tǒng)是為滿足信息用戶的檢索需求而建立起來的、以提供信息檢索為目的的信息存儲與檢索系統(tǒng)。來的、以提供信息檢索為目的的信息存儲與檢索系統(tǒng)。 可以說,一個信息檢索系統(tǒng)便是一定范圍文獻(xiàn)、信息可以說,一個信息檢索系統(tǒng)便是一定范圍文獻(xiàn)、信息的全部記錄的有序集合。的全部記錄的有序集合。2. 檢索系統(tǒng)的類型 (1) (1) 按加工手段和技術(shù)設(shè)備的不同,可將檢索系按加工手段和技術(shù)設(shè)備的不同,可將檢索系統(tǒng)分為:手工檢索系統(tǒng)、機械檢索系統(tǒng)、計算機檢統(tǒng)分為:手工檢索系統(tǒng)、機械檢索系統(tǒng)、計算機檢索系統(tǒng)。索系統(tǒng)。 (2) (2) 按載體形式不同,可分為卡片式、書本式、按載體形式不同,可分為卡片式、書本式、縮微式、磁性材
26、料式等檢索系統(tǒng)??s微式、磁性材料式等檢索系統(tǒng)。 (3) (3) 按著錄格式不同,可將檢索系統(tǒng)分為目錄、按著錄格式不同,可將檢索系統(tǒng)分為目錄、題錄、文摘、索引、全文檢索系統(tǒng)。題錄、文摘、索引、全文檢索系統(tǒng)。二、檢索方法 1. 常用法 常用法是利用檢索工具查找信息的一種方法,常用法是利用檢索工具查找信息的一種方法,因為這種方法是目前查找信息中最常使用的,故亦因為這種方法是目前查找信息中最常使用的,故亦稱常用法。稱常用法。 (1) (1) 順查法順查法 (2) (2) 倒查法倒查法 (3) (3) 抽查法抽查法 (1) (1) 順查法順查法 是指按年代由遠(yuǎn)及近的順序進(jìn)行查找的是指按年代由遠(yuǎn)及近的順序
27、進(jìn)行查找的方法,如檢索方法,如檢索“電視文化電視文化”這一課題,首先這一課題,首先要弄清起始時間,即要弄清起始時間,即“電視文化電視文化”產(chǎn)生的時產(chǎn)生的時間是哪一年,然后從這一年開始查起,一直間是哪一年,然后從這一年開始查起,一直查到當(dāng)前查到當(dāng)前“電視文化電視文化”方面的相關(guān)信息為止。方面的相關(guān)信息為止。這樣,這樣,“電視文化電視文化”課題就檢索完畢。這種課題就檢索完畢。這種方法的查全率和查準(zhǔn)率都較高,但是檢索整方法的查全率和查準(zhǔn)率都較高,但是檢索整個課題較費時費力。個課題較費時費力。 (2) (2) 倒查法倒查法 是指按年代由近及遠(yuǎn)的逆時間查找方法,是指按年代由近及遠(yuǎn)的逆時間查找方法,這種方
28、法多用于新課題、新觀點、新理論、這種方法多用于新課題、新觀點、新理論、新技術(shù)的檢索,檢索的重點在近期信息上,新技術(shù)的檢索,檢索的重點在近期信息上,只需查到基本滿足需要時為止。使用這種方只需查到基本滿足需要時為止。使用這種方法可以最快地獲得新資料,而且近期資料總法可以最快地獲得新資料,而且近期資料總是既概括、引用前期的成果,又反映最新的是既概括、引用前期的成果,又反映最新的水平和動向,因此這種方法比較省力,但查水平和動向,因此這種方法比較省力,但查全率不高。全率不高。 (3) (3) 抽查法抽查法 是一種針對學(xué)科發(fā)展特點,抓住該學(xué)科是一種針對學(xué)科發(fā)展特點,抓住該學(xué)科發(fā)展迅速、信息發(fā)表較多的年代發(fā)
29、展迅速、信息發(fā)表較多的年代( (信息的高峰信息的高峰期期) ),抽出一段時間,抽出一段時間( (幾年或十幾年幾年或十幾年) ),再進(jìn)行,再進(jìn)行逐年檢索的方法。這種方法費時較少,獲得逐年檢索的方法。這種方法費時較少,獲得信息較多,檢索效率較高。但是這種方法的信息較多,檢索效率較高。但是這種方法的成功率和有效率必須建立在熟悉學(xué)科發(fā)展特成功率和有效率必須建立在熟悉學(xué)科發(fā)展特點的基礎(chǔ)上。也就是說,只有對該學(xué)科或課點的基礎(chǔ)上。也就是說,只有對該學(xué)科或課題的發(fā)展熟悉的情況下,才適合使用。題的發(fā)展熟悉的情況下,才適合使用。2. 追溯法 追溯法是一種跟蹤查找的方法,即以文追溯法是一種跟蹤查找的方法,即以文獻(xiàn)后
30、面所附的參考文獻(xiàn)為線索,逐一追溯查獻(xiàn)后面所附的參考文獻(xiàn)為線索,逐一追溯查找相關(guān)文獻(xiàn)的方法。找相關(guān)文獻(xiàn)的方法。3. 循環(huán)法 循環(huán)法是常用法和追溯法的結(jié)合,檢循環(huán)法是常用法和追溯法的結(jié)合,檢索時,先利用檢索工具查出一批文獻(xiàn),然后索時,先利用檢索工具查出一批文獻(xiàn),然后選擇出與檢索課題針對性較強的文獻(xiàn),再按選擇出與檢索課題針對性較強的文獻(xiàn),再按文獻(xiàn)后所附的參考文獻(xiàn)回溯查找,不斷擴大文獻(xiàn)后所附的參考文獻(xiàn)回溯查找,不斷擴大檢索線索,分期分段地交替進(jìn)行,循環(huán)下去,檢索線索,分期分段地交替進(jìn)行,循環(huán)下去,直到滿意為止。直到滿意為止。4. 檢索方法的選擇原則 (1) (1) 檢索條件檢索條件 (2) (2) 檢
31、索要求檢索要求 (3) (3) 學(xué)科特點學(xué)科特點 第四節(jié)第四節(jié) 檢索技術(shù)與檢索效果檢索技術(shù)與檢索效果一、常用檢索技術(shù) 1. 布爾邏輯檢索 1) 邏輯與“AND” 邏輯與(邏輯與(ANDAND或或“”)是反映概念之間)是反映概念之間交叉和限定關(guān)系的一種組配方式,用以縮小交叉和限定關(guān)系的一種組配方式,用以縮小檢索范圍,減少輸出結(jié)果,提高查準(zhǔn)率。檢索范圍,減少輸出結(jié)果,提高查準(zhǔn)率。 A AND B A AND B表示同時含有表示同時含有A A、B B兩檢索項兩檢索項的才為檢索結(jié)果的才為檢索結(jié)果 2) 邏輯或“OR” 邏輯或(邏輯或(OROR或或“+”+”)是反映概念之間)是反映概念之間并列關(guān)系的一種
32、組配方式,使用它相當(dāng)于增并列關(guān)系的一種組配方式,使用它相當(dāng)于增加檢索詞主題的同義詞與近義詞,可擴大檢加檢索詞主題的同義詞與近義詞,可擴大檢索范圍、增加輸出結(jié)果,提高查全率。索范圍、增加輸出結(jié)果,提高查全率。 A OR B A OR B表示文獻(xiàn)信息中凡含有檢索表示文獻(xiàn)信息中凡含有檢索詞詞A A或者檢索詞或者檢索詞B B或者同時含有檢索詞或者同時含有檢索詞A A和和B B的的即為命中結(jié)果即為命中結(jié)果 3) 邏輯非“NOT” 邏輯非(邏輯非(NOTNOT或或“”)可以用來排除)可以用來排除不希望出現(xiàn)的檢索詞,它與邏輯與不希望出現(xiàn)的檢索詞,它與邏輯與“AND”AND”的的作用類似,能夠縮小命中信息的范
33、圍,提高作用類似,能夠縮小命中信息的范圍,提高檢索的查準(zhǔn)率。檢索的查準(zhǔn)率。 A NOT B A NOT B用于從包含用于從包含A A的文獻(xiàn)信息范的文獻(xiàn)信息范圍中減去含有圍中減去含有B B的內(nèi)容的內(nèi)容布爾邏輯檢索布爾邏輯檢索: 即運用布爾邏輯算符對檢索詞進(jìn)行邏輯組配即運用布爾邏輯算符對檢索詞進(jìn)行邏輯組配,表達(dá)表達(dá)兩個概念之間的邏輯關(guān)系兩個概念之間的邏輯關(guān)系 ,有三種,有三種:布爾邏輯用在何處?布爾邏輯用在何處?布爾邏輯用在何處?布爾邏輯用在何處?布爾邏輯檢索詞之間的邏輯關(guān)系?檢索詞之間的邏輯關(guān)系?布爾邏輯布爾邏輯And, or, notCNK高級檢索界面高級檢索界面EBSCO高級檢索界面高級檢索
34、界面AB4.4.) 布爾邏輯算符的運算及次序布爾邏輯算符的運算及次序 ,如:如:car and industry ,檢中結(jié)果中必須檢中結(jié)果中必須同時含同時含有有 car 和和 industry 才符合要求。才符合要求。運算符為運算符為AndAnd、* *、& &表示;檢索時表示;檢索時, ,命中信息同時含有兩個概念命中信息同時含有兩個概念, ,專指專指性強性強. .可以縮小檢索范圍可以縮小檢索范圍, ,提高查準(zhǔn)率。提高查準(zhǔn)率。 如:如:college or university ,檢中結(jié)果中檢中結(jié)果中 含有含有 college 或或 university 任一個就符合檢索要求任
35、一個就符合檢索要求. .運算符為運算符為 Or Or 、或、或“+ +”表示。檢索時,命中信息包含所有關(guān)于邏輯表示。檢索時,命中信息包含所有關(guān)于邏輯A A或邏輯或邏輯B B或同時有或同時有A A和和B B的,可以擴大檢索范圍,提高查全率。的,可以擴大檢索范圍,提高查全率。如如 television not cable, 檢中結(jié)果中檢中結(jié)果中出現(xiàn)出現(xiàn) television 但不能出現(xiàn)但不能出現(xiàn) cable 電纜電纜.運算符(運算符( Not Not 、或、或“- -”表示,命中信息包含邏輯表示,命中信息包含邏輯A A,不包含邏輯,不包含邏輯B,B, 可以排除不必要的信息,提高查準(zhǔn)率??梢耘懦槐?/p>
36、要的信息,提高查準(zhǔn)率。4.4.優(yōu)先級運算優(yōu)先級運算:(:( ) Not And Or (EBSCO 規(guī)則)規(guī)則) 2、截詞檢索、截詞檢索在西文數(shù)據(jù)庫中廣泛用。在西文數(shù)據(jù)庫中廣泛用。截詞檢索是用截斷詞的一個局部進(jìn)行的檢索,凡是滿足這個截詞檢索是用截斷詞的一個局部進(jìn)行的檢索,凡是滿足這個截詞所有字符截詞所有字符( (串串) )的記錄,系統(tǒng)都為命中。的記錄,系統(tǒng)都為命中。 * *、?、?均可以均可以 表示截詞的截斷符號,各檢索系統(tǒng)有不同的表示截詞的截斷符號,各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。分為:分為:有限截詞有限截詞即一個截詞符只代表一個字符;即一個截詞符只代表一個字符;無
37、限截詞無限截詞即即一個截詞符可代表多個字符。一個截詞符可代表多個字符。按截詞的位置劃分為:按截詞的位置劃分為: 前截、中截、后截:前截、中截、后截:前截斷(后方一致):又稱左截斷,前截斷(后方一致):又稱左截斷,截詞符在詞的左邊,例截詞符在詞的左邊,例將截詞符將截詞符“* *”置于詞干的左邊。置于詞干的左邊。 如:如:* *computer,其含義為:其含義為:computer、microcomputers等詞皆為命中詞。等詞皆為命中詞。中截斷中截斷(通配符或屏蔽通配符或屏蔽)是把截斷符號置于一個檢索詞的中間,是把截斷符號置于一個檢索詞的中間,“?” 只替代一個字符,只替代一個字符, (EBS
38、CO規(guī)則)規(guī)則)例如:輸入例如:輸入ne?t,可檢索出,可檢索出neat, nest,next 。后截斷是前方一致檢索,又稱右截斷,后截斷是前方一致檢索,又稱右截斷,截詞符放在被截詞的右截詞符放在被截詞的右邊,是最常用的檢索技術(shù)邊,是最常用的檢索技術(shù),例如:,例如:“*” 可以替代一個以上字符串,(可以替代一個以上字符串,(EBSCO規(guī)則)規(guī)則)例如:輸入例如:輸入comput* * ,可檢出,可檢出computer,computing 等等。等等。限制截斷:限制截斷:是在檢索詞詞干后面加若干個截詞符,表示限制是在檢索詞詞干后面加若干個截詞符,表示限制可變化的字符數(shù)??勺兓淖址麛?shù)。例:例:e
39、ducat* 相當(dāng)于相當(dāng)于educated 教育,教育,Educator 教育家,教育家,根據(jù)截斷的數(shù)量不同可分為:根據(jù)截斷的數(shù)量不同可分為:無限截斷:不限制被截斷的字符數(shù)量;無限截斷:不限制被截斷的字符數(shù)量;有限截斷:限制被截斷的字符數(shù)量,有限截斷:限制被截斷的字符數(shù)量,例如例如educat*,可以檢索,可以檢索educator,educated。各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。使用時要注意看使用時要注意看3. 限制檢索 1) 檢索系統(tǒng)中的限制檢索 在檢索系統(tǒng)中,使用縮小和限定檢索范在檢索系統(tǒng)中,使用縮小和限定檢索范圍的方法稱為限制檢索。限定檢索條件
40、多種圍的方法稱為限制檢索。限定檢索條件多種多樣,主要和常用的是字段限制。多樣,主要和常用的是字段限制。 其中,主題字段如題名(其中,主題字段如題名(TitleTitle)、敘)、敘詞(詞(DescriptorDescriptor)、標(biāo)識詞()、標(biāo)識詞(IdentifierIdentifier)、)、文摘(文摘(AbstractAbstract)等;非主題字段如作者)等;非主題字段如作者(AuthorAuthor)、文獻(xiàn)類型()、文獻(xiàn)類型(Document TypeDocument Type)、)、語種(語種(LanguageLanguage)、出版年份()、出版年份(Publication P
41、ublication YearYear)等。)等。 2) 搜索引擎中的限制檢索 搜索引擎中的字段檢索多表現(xiàn)為前綴符搜索引擎中的字段檢索多表現(xiàn)為前綴符限制形式,其中,表示內(nèi)容特征的主題字段限制形式,其中,表示內(nèi)容特征的主題字段有有TitleTitle,KeywordsKeywords,SubjectSubject,SummarySummary等;等;表示外部特征的非主題字段限制有表示外部特征的非主題字段限制有imageimage,texttext,appletapplet等;此外,搜索引擎還提供了等;此外,搜索引擎還提供了帶有典型網(wǎng)絡(luò)檢索特征的字段限制類型。帶有典型網(wǎng)絡(luò)檢索特征的字段限制類型。
42、限定字段檢索限定字段檢索是指在是指在限定的字段范圍檢索限定的字段范圍檢索 (range searching) ,達(dá)到優(yōu)化檢索結(jié),達(dá)到優(yōu)化檢索結(jié)果的方法。特別在使用自由詞進(jìn)行全文檢索時,需要用字段限制檢果的方法。特別在使用自由詞進(jìn)行全文檢索時,需要用字段限制檢索的范圍。被指定的字段也稱檢索入口,檢索時,系統(tǒng)只對指定字索的范圍。被指定的字段也稱檢索入口,檢索時,系統(tǒng)只對指定字段進(jìn)行匹配運算,提高了效率和查準(zhǔn)率,字段檢索常用代碼來表示,段進(jìn)行匹配運算,提高了效率和查準(zhǔn)率,字段檢索常用代碼來表示,常用的字段代碼如下表常用的字段代碼如下表 所示:所示:檢索字段檢索字段檢索入口檢索入口檢索途徑檢索途徑位置
43、檢索位置檢索位置算符檢索在西文數(shù)據(jù)庫中廣泛使用,能提高檢索的準(zhǔn)確性位置算符檢索在西文數(shù)據(jù)庫中廣泛使用,能提高檢索的準(zhǔn)確性,當(dāng)要求兩個檢索詞在記錄中位置當(dāng)要求兩個檢索詞在記錄中位置相鄰相鄰/ /相連相連時,可使用位置算符。時,可使用位置算符。下面介紹幾種數(shù)據(jù)庫經(jīng)常使用的位置運算符:下面介紹幾種數(shù)據(jù)庫經(jīng)常使用的位置運算符:1.W - WithW W 算符是算符是WithWith的縮寫,表示在此算符兩側(cè)的檢索詞必須按輸入時的前兩側(cè)的檢索詞必須按輸入時的前后順序排列,不能顛倒。后順序排列,不能顛倒。例:例:intelligent (W) robot? (智能機器人智能機器人 ) (Ei Compend
44、ex Plus)Wn( 或或nW) 表示在此算符表示在此算符兩側(cè)的檢索詞必須按輸入時的前后順序排列,兩側(cè)的檢索詞必須按輸入時的前后順序排列,不能顛倒。但允許在連接的兩個詞之間最多插入不能顛倒。但允許在連接的兩個詞之間最多插入n n個單元詞個單元詞。 例:例:intelligent w1 robot* (OCLC FirstSearch) 2. N NearN算符是算符是Near的縮寫,表示此算符的縮寫,表示此算符兩側(cè)的檢索詞必須緊密相連,所連兩側(cè)的檢索詞必須緊密相連,所連接的詞之間不允許插入任何其他單詞或字母。但詞序可以顛倒。接的詞之間不允許插入任何其他單詞或字母。但詞序可以顛倒。例:例: i
45、ntelligent Near robot* ( Ei CPX Web)算符算符作用作用表達(dá)式表達(dá)式檢索結(jié)果檢索結(jié)果W、W/N、WITH兩詞相鄰,兩詞相鄰,詞語詞語出現(xiàn)次序固定出現(xiàn)次序固定Education(w)schoolEducation WITH schoolEducation schoolEducation schoolsnW兩詞相鄰,按順兩詞相鄰,按順序排列,詞間可序排列,詞間可插入插入n個詞個詞Education(1w)schoolEducation schoolEducation schoolsEducation and music schoolPRE兩詞相鄰兩詞相鄰,詞語詞語出
46、現(xiàn)次序固定出現(xiàn)次序固定Education PRE schoolEducation schoolEducation schools算符算符作用作用表達(dá)式表達(dá)式檢索結(jié)果檢索結(jié)果N、NEAR、ADJ兩詞相鄰,順兩詞相鄰,順序可顛倒序可顛倒Education(N)schoolEducation NEAR schoolEducation schoolEducation schoolsSchool of educationnN兩詞相鄰,順兩詞相鄰,順序可顛倒序可顛倒,兩詞兩詞間可插入間可插入n個個詞詞Education (1N) schoolEducation schoolSchool of educat
47、ionSchool of music and educationF兩詞同在一個兩詞同在一個字段中字段中Education (F) schoolSAME兩詞同在一個段兩詞同在一個段落中落中Education SAME school3 3)文獻(xiàn)檢索新分法)文獻(xiàn)檢索新分法目前信息檢索類型出現(xiàn)一種新的三分法:即文本檢索、數(shù)值檢目前信息檢索類型出現(xiàn)一種新的三分法:即文本檢索、數(shù)值檢索、聲頻與視頻檢索。索、聲頻與視頻檢索。1. 1. 文本檢索文本檢索文本檢索文本檢索(Text Retrieval)是文獻(xiàn)信息檢索的一部分,是指是文獻(xiàn)信息檢索的一部分,是指根據(jù)文本內(nèi)容,如關(guān)鍵字、語意等對文本集合進(jìn)行檢索、分類
48、、根據(jù)文本內(nèi)容,如關(guān)鍵字、語意等對文本集合進(jìn)行檢索、分類、過濾等。過濾等。如:如:.DOC.DOC、.PDF.PDF、.PPT.PPT、.XLS.XLS、.TXT.TXT等等格式。格式。2. 2. 數(shù)值(數(shù)據(jù))檢索數(shù)值(數(shù)據(jù))檢索狹義的數(shù)值檢索僅指從某數(shù)據(jù)集合中查出所需要的數(shù)據(jù)。狹義的數(shù)值檢索僅指從某數(shù)據(jù)集合中查出所需要的數(shù)據(jù)?;卮穑夯卮穑骸笆澜缟献铋L的鐵路大橋有多長?世界上最長的鐵路大橋有多長?”之類的問題。之類的問題。3. 3. 事實檢索事實檢索事實檢索是以文獻(xiàn)中抽取的事項為檢索內(nèi)容的檢索,或稱事實檢索是以文獻(xiàn)中抽取的事項為檢索內(nèi)容的檢索,或稱“事事項檢索項檢索”?;卮穑夯卮穑骸笆澜缟献铋L
49、的鐵路大橋是哪一條?世界上最長的鐵路大橋是哪一條?”之類的問題。之類的問題。4. 4. 聲頻與視頻檢索聲頻與視頻檢索1 1)對于音頻信息來說,其基于內(nèi)容檢索的主要類型有:)對于音頻信息來說,其基于內(nèi)容檢索的主要類型有: 語音檢索; 音樂檢索; 其他音頻檢索。2 2)其基于內(nèi)容檢索的主要類型有:)其基于內(nèi)容檢索的主要類型有: 基于顏色特征的檢索; 基于形狀特征的檢索; 基于紋理特征的檢索; 忌與視頻動態(tài)特征的檢索; 其他檢索,二、檢索效果 1. 檢索效果評價 1) 檢索效果評價的指標(biāo) 檢索效果是指檢索系統(tǒng)檢索信息的有檢索效果是指檢索系統(tǒng)檢索信息的有效程度,反映了檢索系統(tǒng)的檢索能力。效程度,反映了
50、檢索系統(tǒng)的檢索能力。 (1) (1) 質(zhì)量標(biāo)準(zhǔn)質(zhì)量標(biāo)準(zhǔn) (2) (2) 費用標(biāo)準(zhǔn)費用標(biāo)準(zhǔn) (3) (3) 時間標(biāo)準(zhǔn)時間標(biāo)準(zhǔn)1) 檢索效果評價的指標(biāo)表2.2 檢索效果評價22表 a檢出的相關(guān)文獻(xiàn)量;檢出的相關(guān)文獻(xiàn)量; c未檢出的相關(guān)文獻(xiàn)量;未檢出的相關(guān)文獻(xiàn)量; ac系統(tǒng)相關(guān)文獻(xiàn)總量。系統(tǒng)相關(guān)文獻(xiàn)總量。b檢出的非相關(guān)文獻(xiàn)量;檢出的非相關(guān)文獻(xiàn)量;ab檢出的文獻(xiàn)總量;檢出的文獻(xiàn)總量;d未檢出的非相關(guān)文獻(xiàn)量未檢出的非相關(guān)文獻(xiàn)量2) 查全率和查準(zhǔn)率 (1) 查全率 查全率是指檢索出的相關(guān)信息量與系統(tǒng)查全率是指檢索出的相關(guān)信息量與系統(tǒng)中的相關(guān)信息總量之比。中的相關(guān)信息總量之比。 (2) 查準(zhǔn)率 查準(zhǔn)率是指檢
51、索出的相關(guān)信息量與檢索查準(zhǔn)率是指檢索出的相關(guān)信息量與檢索出的信息總量之比。出的信息總量之比。2. 檢索效果優(yōu)化 (1) (1) 提高檢索系統(tǒng)的質(zhì)量提高檢索系統(tǒng)的質(zhì)量 (2) (2) 提高用戶利用檢索系統(tǒng)的能力提高用戶利用檢索系統(tǒng)的能力 (3) (3) 制定優(yōu)化的檢索策略制定優(yōu)化的檢索策略 (3) (3) 制定優(yōu)化的檢索策略制定優(yōu)化的檢索策略 提高查全率的方法提高查全率的方法 為了提高查全率,往往通過采用提高為了提高查全率,往往通過采用提高檢索詞的泛指度,選全同義詞、近義詞,多檢索詞的泛指度,選全同義詞、近義詞,多用截詞符;減少使用邏輯用截詞符;減少使用邏輯“與與”、邏輯、邏輯“非非”運算符,增
52、加使用邏輯運算符,增加使用邏輯“或或”運算符;取消運算符;取消某些限制符,在多字段或全文中檢索;采用某些限制符,在多字段或全文中檢索;采用分類號檢索等多種方法。分類號檢索等多種方法。 (3) (3) 制定優(yōu)化的檢索策略制定優(yōu)化的檢索策略 提高查準(zhǔn)率的方法提高查準(zhǔn)率的方法 為了提高查準(zhǔn)率,往往通過采用提高為了提高查準(zhǔn)率,往往通過采用提高檢索詞的專指度,增加或者使用下位詞及專檢索詞的專指度,增加或者使用下位詞及專指性較強的自由詞,少用截詞符;增加使用指性較強的自由詞,少用截詞符;增加使用邏輯邏輯“與與”、邏輯、邏輯“非非”運算符,減少邏輯運算符,減少邏輯“或或”運算符;多用限制符或限制字段;用運算
53、符;多用限制符或限制字段;用文獻(xiàn)的外部特征限制等多種方法。文獻(xiàn)的外部特征限制等多種方法。 第五節(jié)第五節(jié) 檢索步驟與檢索策略檢索步驟與檢索策略一、檢索步驟 1 1分析檢索課題分析檢索課題 2 2選擇檢索系統(tǒng)選擇檢索系統(tǒng) 3 3確定檢索途徑和檢索方法確定檢索途徑和檢索方法 4 4構(gòu)建檢索式構(gòu)建檢索式 5 5檢索并調(diào)整檢索策略檢索并調(diào)整檢索策略 6 6獲取原文獲取原文在進(jìn)行資料檢索之前,必須分析研究課題,制定檢索需求描在進(jìn)行資料檢索之前,必須分析研究課題,制定檢索需求描述,索取原始文獻(xiàn),學(xué)習(xí)了解新知識,調(diào)整檢索策略。述,索取原始文獻(xiàn),學(xué)習(xí)了解新知識,調(diào)整檢索策略。第一步、分析檢索課題第一步、分析檢索
54、課題1. 分析檢索課題,明確以下問題:分析檢索課題,明確以下問題: 分析課題分析課題:課題的主要內(nèi)容以及所涉及的知識點?課題的主要內(nèi)容以及所涉及的知識點? 明確需要的文獻(xiàn)特征:明確需要的文獻(xiàn)特征:即需要的文獻(xiàn)種類,語種,年代以即需要的文獻(xiàn)種類,語種,年代以及文獻(xiàn)量?及文獻(xiàn)量? 明確查詢的側(cè)重點:明確查詢的側(cè)重點:對查新,查準(zhǔn),查全的指標(biāo)要求?對查新,查準(zhǔn),查全的指標(biāo)要求? 確定所需的文獻(xiàn)應(yīng)該具備的外部特征?確定所需的文獻(xiàn)應(yīng)該具備的外部特征? 確定所需的文獻(xiàn)應(yīng)該具備的內(nèi)部特征確定所需的文獻(xiàn)應(yīng)該具備的內(nèi)部特征?一般課題檢索分析一般課題檢索分析(1 1)是找具體問題的準(zhǔn)確答案?)是找具體問題的準(zhǔn)確答
55、案?使用目的是解決問題,或作為論據(jù)和引證。查找事實或數(shù)值使用目的是解決問題,或作為論據(jù)和引證。查找事實或數(shù)值型信息大多屬于此類。型信息大多屬于此類。(2 2)是查找特定文獻(xiàn)?)是查找特定文獻(xiàn)?根據(jù)某一篇文獻(xiàn)的線索查找原文;根據(jù)某一篇文獻(xiàn)的線索查找原文;或報考某導(dǎo)師的研究生,查詢其所有發(fā)表的文章?;驁罂寄硨?dǎo)師的研究生,查詢其所有發(fā)表的文章。對這種檢索課題、類型很簡單,只要正確選擇了檢索工具和對這種檢索課題、類型很簡單,只要正確選擇了檢索工具和參考資源,便可以一步到位查到所需要的信息,很快地達(dá)到參考資源,便可以一步到位查到所需要的信息,很快地達(dá)到檢索目的。檢索目的。(3 3)是對某一問題的大致了解
56、?)是對某一問題的大致了解?對于這種類型的檢索課題,只需要瀏覽一些簡短的摘要或者對于這種類型的檢索課題,只需要瀏覽一些簡短的摘要或者參考幾篇概論性文章就可以了。參考幾篇概論性文章就可以了。有的課題則需要搜集各種翔實、深入的信息,才能圓滿完成。有的課題則需要搜集各種翔實、深入的信息,才能圓滿完成。研究課題檢索分析研究課題檢索分析研究課題通常是學(xué)術(shù)水平較高,專業(yè)較深的課題研究課題通常是學(xué)術(shù)水平較高,專業(yè)較深的課題.撰寫綜述、研究報告撰寫綜述、研究報告查全查全撰寫綜述或研究報告,講求系統(tǒng)全面,必須以時間為軸做縱向、深撰寫綜述或研究報告,講求系統(tǒng)全面,必須以時間為軸做縱向、深度的考察。對課題做全面的調(diào)
57、查研究,了解整個發(fā)展過程。度的考察。對課題做全面的調(diào)查研究,了解整個發(fā)展過程。包括書包括書籍、期刊、報紙、報告、政府出版物。籍、期刊、報紙、報告、政府出版物。撰寫研究報告、學(xué)術(shù)論文撰寫研究報告、學(xué)術(shù)論文查準(zhǔn)查準(zhǔn)撰寫研究報告、學(xué)術(shù)論文,需要在具體細(xì)微的專業(yè)問題做深入的專撰寫研究報告、學(xué)術(shù)論文,需要在具體細(xì)微的專業(yè)問題做深入的專題研究,在充分掌握材料和該領(lǐng)域重要研究成果的基礎(chǔ)上,提出創(chuàng)題研究,在充分掌握材料和該領(lǐng)域重要研究成果的基礎(chǔ)上,提出創(chuàng)新性的觀點或論斷,這是基本要求。新性的觀點或論斷,這是基本要求。做新技術(shù)、新理論的研究做新技術(shù)、新理論的研究動態(tài)動態(tài)在做新技術(shù)、新理論的研究時,需要查閱某一專
58、題的最前沿和最新在做新技術(shù)、新理論的研究時,需要查閱某一專題的最前沿和最新資料,了解研究動態(tài)、發(fā)展趨勢。資料,了解研究動態(tài)、發(fā)展趨勢。做同類研究項目比較做同類研究項目比較查新查新在做同類研究項目比較時,或做創(chuàng)新性的課題項目、研究成果或要在做同類研究項目比較時,或做創(chuàng)新性的課題項目、研究成果或要求較高的學(xué)位論文,求較高的學(xué)位論文,必須保證取材的數(shù)量和學(xué)術(shù)質(zhì)量達(dá)到一定的深必須保證取材的數(shù)量和學(xué)術(shù)質(zhì)量達(dá)到一定的深度和廣度,重點參考各種學(xué)術(shù)品質(zhì)較高的期刊論文、會議論文、研度和廣度,重點參考各種學(xué)術(shù)品質(zhì)較高的期刊論文、會議論文、研究報告、學(xué)位論文、重要專著等;究報告、學(xué)位論文、重要專著等;明確課題明確課
59、題對文獻(xiàn)的需求量?對文獻(xiàn)的需求量?在確定了檢索課題的類型之后,在此基礎(chǔ)上,還要在確定了檢索課題的類型之后,在此基礎(chǔ)上,還要考慮下面幾個問題:考慮下面幾個問題:(1)該課題需要的)該課題需要的文獻(xiàn)量?文獻(xiàn)量?(2)該課題查檢文獻(xiàn)的)該課題查檢文獻(xiàn)的廣度與深度如何?廣度與深度如何?(3)該課題對)該課題對時效性時效性有什么要求?有什么要求?(4)該課題對文獻(xiàn)資料的數(shù)據(jù)類型是否有所限定或)該課題對文獻(xiàn)資料的數(shù)據(jù)類型是否有所限定或側(cè)重?側(cè)重?第二步、選擇檢索工具或數(shù)據(jù)庫第二步、選擇檢索工具或數(shù)據(jù)庫目前,常用文獻(xiàn)類型及選擇檢索的數(shù)據(jù)庫如下:目前,常用文獻(xiàn)類型及選擇檢索的數(shù)據(jù)庫如下:1. 1. 數(shù)字圖書館
60、數(shù)字圖書館(1)超星數(shù)字圖書館:)超星數(shù)字圖書館:http:/ http:/ 2. 數(shù)字期刊、特種文獻(xiàn)數(shù)字期刊、特種文獻(xiàn)(1)讀秀學(xué)術(shù)搜索:)讀秀學(xué)術(shù)搜索:http:/ EBSCOhost http:/ 確定檢索途徑確定檢索途徑1. 1. 以文獻(xiàn)的以文獻(xiàn)的內(nèi)容特征內(nèi)容特征為檢索途徑為檢索途徑分類檢索途徑:分類檢索途徑:是是從學(xué)科分類角度來查找文獻(xiàn)的一種途徑。從學(xué)科分類角度來查找文獻(xiàn)的一種途徑。 特點:族性檢索,特點:族性檢索,會檢索到一批相關(guān)文獻(xiàn)。會檢索到一批相關(guān)文獻(xiàn)。主題檢索途徑:主題檢索途徑:是從是從文獻(xiàn)主題內(nèi)容角度來檢索文獻(xiàn)的一種途徑。文獻(xiàn)主題內(nèi)容角度來檢索文獻(xiàn)的一種途徑。 特點:特性檢索,特點:特性檢索,適合比較具體專深
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版屋頂廣告位租賃及物業(yè)管理合同4篇
- 二零二五年度魯0832執(zhí)恢255號環(huán)保污染治理項目承包合同4篇
- 二零二五年度綠色環(huán)保車庫買賣合同范本4篇
- 二零二五年度留守兒童關(guān)愛志愿者招募合同3篇
- 專屬競業(yè)限制及知識產(chǎn)權(quán)保密合同規(guī)范版B版
- 2025年度商業(yè)地產(chǎn)拆遷補償與商業(yè)重建承包合同樣本4篇
- 2025年度畜牧獸醫(yī)災(zāi)害應(yīng)急響應(yīng)服務(wù)合同4篇
- 2025年車輛掛靠車輛拆解回收合同模板3篇
- 2025年度智能家居系統(tǒng)設(shè)計與安裝服務(wù)承包合同范本2篇
- 二零二五年度木材行業(yè)知識產(chǎn)權(quán)保護合同大全4篇
- 三角形與全等三角形復(fù)習(xí)教案 人教版
- 2024年1月高考適應(yīng)性測試“九省聯(lián)考”英語 試題(學(xué)生版+解析版)
- 《朝天子·詠喇叭-王磐》核心素養(yǎng)目標(biāo)教學(xué)設(shè)計、教材分析與教學(xué)反思-2023-2024學(xué)年初中語文統(tǒng)編版
- 成長小說智慧樹知到期末考試答案2024年
- 紅色革命故事《王二小的故事》
- 海洋工程用高性能建筑鋼材的研發(fā)
- 英語48個國際音標(biāo)課件(單詞帶聲、附有聲國際音標(biāo)圖)
- GB/T 6892-2023一般工業(yè)用鋁及鋁合金擠壓型材
- 冷庫安全管理制度
- 2023同等學(xué)力申碩統(tǒng)考英語考試真題
- 家具安裝工培訓(xùn)教案優(yōu)質(zhì)資料
評論
0/150
提交評論