網(wǎng)絡(luò)信息檢索基礎(chǔ)知識楊青蘭州大學(xué)圖書館查新中心2011.3_第1頁
網(wǎng)絡(luò)信息檢索基礎(chǔ)知識楊青蘭州大學(xué)圖書館查新中心2011.3_第2頁
網(wǎng)絡(luò)信息檢索基礎(chǔ)知識楊青蘭州大學(xué)圖書館查新中心2011.3_第3頁
網(wǎng)絡(luò)信息檢索基礎(chǔ)知識楊青蘭州大學(xué)圖書館查新中心2011.3_第4頁
網(wǎng)絡(luò)信息檢索基礎(chǔ)知識楊青蘭州大學(xué)圖書館查新中心2011.3_第5頁
已閱讀5頁,還剩139頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)信息檢索基礎(chǔ)知識 楊青 蘭州大學(xué)圖書館查新中心 2011.3.15.導(dǎo) 言 文獻(xiàn)檢索是一門既古老又年輕的學(xué)科 約4000年前,人類就開始有目的地組織信息,一個典型的例子就是圖書中的目錄。 隨后,逐漸出現(xiàn)索引的概念,即從一些詞和概念指向相關(guān)信息或者文檔的指針。 到了1948年,C. N. Mooers在其MIT的碩士論文中第一次創(chuàng)造了“Information Retrieval”這個術(shù)語。文獻(xiàn)檢索是一門既古老又年輕的學(xué)科 信息檢索發(fā)端于19世紀(jì)前期,主要以手工檢索方式為主,其發(fā)展速度較為緩慢,檢索效率普遍不高。到20世紀(jì)50年代,1951年世界上出現(xiàn)了最早的計(jì)算機(jī)系統(tǒng),這可稱得上是信息檢索發(fā)

2、展史上的一個里程碑。隨著計(jì)算機(jī)技術(shù)的不斷進(jìn)步,進(jìn)入 20世紀(jì)90年代,網(wǎng)絡(luò)技術(shù)開始進(jìn)入社會生活各個領(lǐng)域,計(jì)算機(jī)檢索也逐步由脫機(jī)檢索、聯(lián)機(jī)檢索發(fā)展到如今Internet環(huán)境下網(wǎng)絡(luò)檢索。網(wǎng)絡(luò)信息檢索是文獻(xiàn)檢索面對的新課題網(wǎng)絡(luò)檢索以其低廉的費(fèi)用、迅速的存取等多種功能對傳統(tǒng)的檢索造成了強(qiáng)力的沖擊,與此同時,一些新的理論、新的課題也應(yīng)運(yùn)而生,加速了現(xiàn)代情報(bào)學(xué)和信息學(xué)的發(fā)展。 網(wǎng)絡(luò)信息檢索是指對利用Internet信息發(fā)布技術(shù),通過Internet發(fā)布的信息進(jìn)行的檢索,主要利用搜索引擎、網(wǎng)絡(luò)機(jī)器人和門戶站點(diǎn)等來完成。隨著Internet的迅速發(fā)展,網(wǎng)上信息以爆炸性的速度不斷豐富和擴(kuò)展,其信息數(shù)量之大、類型

3、之多,已經(jīng)給人們的工作、學(xué)習(xí)和生活方式帶來了巨大影響。網(wǎng)絡(luò)信息檢索是文獻(xiàn)檢索面對的新課題 為了充分發(fā)揮網(wǎng)絡(luò)信息的重要作用,并能迅速在上百萬個網(wǎng)站中快速有效地查找到想要得到的信息,必須對網(wǎng)絡(luò)檢索的特性進(jìn)行研究分析,并掌握網(wǎng)絡(luò)信息資源的特點(diǎn)、基本方法和檢索技巧與檢索工具等重要內(nèi)容。網(wǎng)絡(luò)信息資源的分布主要以網(wǎng)站為單位,數(shù)以千計(jì)的網(wǎng)站在Internet上形成了犬牙交錯的信息資源庫。網(wǎng)絡(luò)信息檢索是文獻(xiàn)檢索面對的新課題 因特網(wǎng)的發(fā)展,逐漸改變了信息資源原有的屬性,將文獻(xiàn)信息數(shù)字化、應(yīng)用環(huán)境網(wǎng)絡(luò)化、技術(shù)手段多媒體化;運(yùn)用情報(bào)學(xué)的理論與方法組織無序的網(wǎng)絡(luò)信息,為用戶服務(wù);研究中文數(shù)據(jù)庫的組織與檢索技術(shù)將是我國

4、情報(bào)學(xué)界必須重視的問題。 網(wǎng)絡(luò)信息資源開發(fā)利用是我國信息化建設(shè)的核心內(nèi)容。在我國信息基礎(chǔ)設(shè)施建設(shè)已初具規(guī)模的今天,網(wǎng)絡(luò)信息資源建設(shè)顯得極為重要與迫切。這需要情報(bào)工作者認(rèn)真研究解決。 文獻(xiàn)、信息基本知識 信息檢索語言 檢索工具 信息檢索技術(shù)文獻(xiàn)檢索概述第一節(jié) 文獻(xiàn)、信息基本知識一、基本概念二、文獻(xiàn)的構(gòu)成要素三、文獻(xiàn)的類型四、現(xiàn)代文獻(xiàn)的整體特點(diǎn)五、文獻(xiàn)檢索的類型六、網(wǎng)絡(luò)信息資源一、基本概念1、信息:消除對客觀事物認(rèn)識的不定性的東西,是符號、信號或消息所包含的內(nèi)容。2、知識:人們對自然和社會的認(rèn)識和描述的總和。3、文獻(xiàn):記載有知識的載體。4、 情報(bào):主要指“信息、資訊、消息”情報(bào)是指被傳遞的知識或事

5、實(shí),是知識的激活,是運(yùn)用一定的媒體(載體),越過空間和時間傳遞給特定用戶,解決科研,生產(chǎn)中的具體問題所需要的特定知識和信息情報(bào)應(yīng)具有個基本屬性:一是知識或信息;二是要經(jīng)過傳遞;三是要經(jīng)過用戶使用產(chǎn)生效益情報(bào)不僅取決于情報(bào)源,也取決于情報(bào)用戶 5、出版物:可以理解為文獻(xiàn)的表現(xiàn)形式或承載物,大多 數(shù)情況下等同于文獻(xiàn)。 6、信息源:產(chǎn)生信息的事物,在本課程中,指文獻(xiàn)信息源。7、信息資源:可以理解為信息源所含的信息本身,是信息源的內(nèi)含。在大多數(shù)場合,信息源、信息資源、文獻(xiàn)信息資源是同義的。8、信息檢索:利用一定的工具從大量的信息資源中迅速、準(zhǔn)確地查找出與特定的要求有關(guān)的信息。本課程中,信息檢索、文獻(xiàn)檢

6、索、文獻(xiàn)信息檢索視為同一概念。 情報(bào)信息知識文獻(xiàn)信息、知識、文獻(xiàn) 、 情報(bào)之間的關(guān)系信息是生產(chǎn)知識的原料;知識來源于信息,是信息的一部分,文獻(xiàn)是存貯、傳遞信息的載體。二、文獻(xiàn)的構(gòu)成要素知識內(nèi)容文獻(xiàn)中記錄信息和知識,這是文獻(xiàn)的靈魂。符號系統(tǒng) 表達(dá)知識信息的手段,包括語言、文字、圖畫、表格、公式、編碼、音響、圖象、聲像等 。文獻(xiàn)載體 信息內(nèi)容存儲的依附體,包括印刷型文獻(xiàn)、音像制品、機(jī)讀資料等。記錄方式刻劃、手寫、機(jī)械印刷、拍攝和電腦錄入、掃描等生產(chǎn)方式。 三、文獻(xiàn)的類型:按載體劃分 按載體劃分印刷型文獻(xiàn)感光型文獻(xiàn)機(jī)讀型文獻(xiàn)說明:多數(shù)著作把文獻(xiàn)分為印刷型、縮微型、視聽型、機(jī)讀型四種,而以甲骨、竹簡、

7、金石、帛等為載體的文獻(xiàn)較少見,這里不討論。 印刷型文獻(xiàn)(紙本文獻(xiàn))載體:紙張實(shí)例:圖書、雜志、報(bào)紙記錄手段:印刷、抄寫特點(diǎn):可直接閱讀,方便使用;不利于檢索和保存;收藏文獻(xiàn)占用空間大。 感光型文獻(xiàn)載體:感光材料 實(shí)例:縮微平片、電影膠片、幻燈片記錄手段:縮微技術(shù)、攝影技術(shù)特點(diǎn):體積小;價格低;不能直接閱讀 機(jī)讀型文獻(xiàn)(電子文獻(xiàn))載體:磁性材料、光盤實(shí)例:磁盤、光盤、磁帶記錄手段:磁記錄、編碼技術(shù)特點(diǎn):存儲密度高、速度快;便于遠(yuǎn)距離傳輸;易復(fù)制;成本高;不能直接閱讀。 按出版形式的不同 圖 書*連續(xù)出版物 特種文獻(xiàn)研究報(bào)告*會議文獻(xiàn)*專利文獻(xiàn)*技術(shù)標(biāo)準(zhǔn)*學(xué)位論文*產(chǎn)品樣本*技術(shù)檔案*期刊*報(bào)紙*

8、三、文獻(xiàn)的類型:按出版形式劃分 (十大信息源)圖書的含義 凡篇幅達(dá)49頁以上并構(gòu)成一個書目單元的文獻(xiàn)稱為圖書。未達(dá)到49頁的,可稱為小冊子。圖書的特征 * 主題突出,內(nèi)容系統(tǒng)全面,論述全面深入,知識成熟穩(wěn)定。適合于學(xué)習(xí)型讀者 * 出版的周期長,因而其內(nèi)容一般就缺乏最新的研究成果。 期 刊定義 期刊又稱雜志,它是指圍繞某個專題的定期或不定期連續(xù)出版的出版物。名稱統(tǒng)一、開本固定、有連續(xù)的序號、匯集了多位作者分別撰寫的多篇文章。期刊的特點(diǎn)A、期刊以品種為單位形成知識流;B、出版周期短,內(nèi)容新穎、及時、廣泛,專深;C、內(nèi)容不全面系統(tǒng),不成熟,論題窄;D、文獻(xiàn)中數(shù)量最多,使用量最大。 核心期刊 * 少數(shù)

9、刊載某一學(xué)科大量高質(zhì)量專業(yè)論文的期刊。 * 特點(diǎn) (1)刊載專業(yè)文獻(xiàn)密度高,信息含量高; (2)水平較高,代表本學(xué)科的最新發(fā)展水平; (3)出版相對穩(wěn)定,所載文獻(xiàn)壽命較長; (4)利用率和被引率較高。 目前,許多單位核心期刊的判定是以 中文核心期刊要目總覽為標(biāo)準(zhǔn)形式特征:有統(tǒng)一的名稱,定期連續(xù)出版,每期匯集許多篇文章、報(bào)道、消息等,多為對開或四開,以單張散頁形式出版。 報(bào) 紙內(nèi)容特征:時間性強(qiáng),能以最快的速度報(bào)道國內(nèi)外發(fā)生的最新事件和科學(xué)技術(shù)的最新研究成果,內(nèi)容廣泛。類型:按出版周期分,有日報(bào)、雙日報(bào)、周報(bào)、旬報(bào)等;按范圍劃分,有全國性報(bào)紙、地方性報(bào)紙、系統(tǒng)性報(bào)紙等;按內(nèi)容劃分,有綜合性報(bào)紙、

10、專業(yè)性報(bào)紙。 報(bào) 紙 研究報(bào)告 研究報(bào)告是單位和個人向上級或委托單位撰寫的關(guān)于某個課題研究成果的正式報(bào)告。 科技報(bào)告的特點(diǎn) (1)內(nèi)容新穎,選題尖端實(shí)用; (2)不公開發(fā)行或少量發(fā)行; (3)質(zhì)量參差不齊; (4)保密性強(qiáng); (5)每份報(bào)告獨(dú)立成冊,有連續(xù)編號。會議文獻(xiàn)會議文獻(xiàn)是指在各種會議上宣讀、交流的論文、報(bào)告、會議錄等文獻(xiàn)。定期召開的會議錄或論文集其實(shí)相當(dāng)于連續(xù)出版物。專利文獻(xiàn)專利的特點(diǎn)1、包括發(fā)明專利、實(shí)用新型專利和外觀設(shè)計(jì)專利三種。2、內(nèi)容比較具體,有的還有附圖,通過它可以了解該項(xiàng)專利的主要技術(shù)內(nèi)容。 3、新穎性、創(chuàng)造性和實(shí)用性 ,有重大參考價值。4、經(jīng)審核可向全世界發(fā)行,獲取容易。

11、專利文獻(xiàn)主要由專利說明書構(gòu)成。所謂專利說明書是指專利申請人向?qū)@诌f交的有關(guān)發(fā)明目的、構(gòu)成和效果的技術(shù)文件。 標(biāo)準(zhǔn)文獻(xiàn)標(biāo)準(zhǔn)具有一定的法律約束力,對技術(shù)的規(guī)定詳盡、完整、可靠,更新頻繁。檢索時必須注意是否最新標(biāo)準(zhǔn)。標(biāo)準(zhǔn)是按規(guī)定程序制訂,經(jīng)權(quán)威機(jī)構(gòu)公認(rèn)或主管部門批準(zhǔn)的在特定范圍內(nèi)執(zhí)行的規(guī)格、規(guī)則、技術(shù)要求等規(guī)范性文件。學(xué)位論文學(xué)位論文是指高等院校和科研單位中的本科生、研究生為獲得學(xué)位,在導(dǎo)師指導(dǎo)下完成的科學(xué)研究、科學(xué)試驗(yàn)成果的書面報(bào)告。 *學(xué)位論文一般不對外發(fā)行,印數(shù)少,不容易獲得。 *質(zhì)量參差不齊,其中碩士、博士論文較為專深,對研究工作有較大參考價值。按文獻(xiàn)的級別一次文獻(xiàn)二次文獻(xiàn)三次文獻(xiàn)零次文獻(xiàn)

12、三、文獻(xiàn)的類型:按文獻(xiàn)級別劃分 1、一次文獻(xiàn)*作者以自己的研究成果為基礎(chǔ)創(chuàng)作或撰寫的文獻(xiàn);*對知識的第一次加工;具有創(chuàng)造性;*大多數(shù)期刊論文、科技報(bào)告、學(xué)術(shù)論文 *對一次文獻(xiàn)進(jìn)行加工整理而成的具有報(bào)道和檢索 作用的文獻(xiàn); *對知識的第二次加工;有序化;提供一次文獻(xiàn)線索; *目錄、題錄、文摘等檢索工具。2、二次文獻(xiàn) * 利用二次文獻(xiàn)系統(tǒng)地檢索出一批有關(guān)的文獻(xiàn),對 其內(nèi)容進(jìn)行比較分析,綜合述評而編撰的文獻(xiàn)。 * 對知識的再加工;提供文獻(xiàn)檢索; * 綜述、專著;字詞典、百科全書3、三次文獻(xiàn) * 還未形成一次文獻(xiàn)的非出版物; * 論文草稿、談話記錄、實(shí)驗(yàn)記錄、書信4、零次文獻(xiàn) 一次文獻(xiàn)是檢索的對象(目

13、標(biāo)) 二次文獻(xiàn)是檢索的工具(手段) 三次文獻(xiàn)是情報(bào)研究的成果(檢索目標(biāo)+檢索手段)從檢索的角度來看: 一次文獻(xiàn)是對知識的第一次加工(創(chuàng)造性) 二次文獻(xiàn)是對知識的第二次加工(有序化) 三次文獻(xiàn)是對知識的再加工(有序化+創(chuàng)造性)從知識加工角度來看:四、現(xiàn)代文獻(xiàn)的整體特點(diǎn)1、數(shù)量激增2、類型復(fù)雜3、文種多樣4、內(nèi)容交叉重復(fù)5、文獻(xiàn)聚散有序6、新陳代謝頻繁五、文獻(xiàn)檢索的類型(一)按檢索內(nèi)容劃分文獻(xiàn)檢索數(shù)據(jù)檢索 事實(shí)檢索概念檢索信息檢索的主要形式,通過二次文獻(xiàn),包括手工檢索工具和計(jì)算機(jī)檢索系統(tǒng),找出所需的一次文獻(xiàn)或三次文獻(xiàn)。以數(shù)據(jù)為對象的檢索,如查找數(shù)學(xué)公式、數(shù)據(jù)圖表、某一材料的成分、性能等,是一種確定

14、性檢索。是以特定的事實(shí)為檢索對象。事實(shí)內(nèi)容包括大量的科學(xué)事件和社會事件。 就是查找特定概念的含義、作用、原理或使用范圍等解釋性內(nèi)容或說明。全文檢索圖像檢索 多媒體檢索檢索系統(tǒng)存儲的是整篇文章或整本圖書。還有另一層意義:即從文獻(xiàn)的全文中進(jìn)行某項(xiàng)檢索。即以圖形、圖像或圖文信息為檢索內(nèi)容的信息檢索。是以文字、圖像、聲音等多媒體信息為檢索內(nèi)容的信息檢索。 (二)按是否使用檢索工具劃分 1、直接檢索 就是指利用一次文獻(xiàn)進(jìn)行檢索,這是以前比較常用的一種查找方法。所花時間多和精力大,檢出文獻(xiàn)少。 2、間接檢索 就是指利用各種檢索工具獲得文獻(xiàn)線索,再根據(jù)線索去查找原始文獻(xiàn)線索的方法。 (三)按檢索手段劃分 1

15、、傳統(tǒng)信息檢索 就是手工信息檢索,是利用各種印刷型檢索工具來查找文獻(xiàn)的一種方法。 2、現(xiàn)代信息檢索 現(xiàn)代信息檢索即計(jì)算機(jī)信息檢索,是指利用計(jì)算機(jī)和網(wǎng)絡(luò)來處理和查找文獻(xiàn)信息的檢索方式。第二節(jié) 文獻(xiàn)檢索語言一、檢索語言的含義及作用二、檢索語言的類型一、檢索語言的含義及作用檢索語言:是根據(jù)檢索需要而創(chuàng)造的一種人工語言。 檢索語言又稱標(biāo)引語言、索引語言等,是信息檢索系統(tǒng)存儲和檢索信息時共同使用的一種共同語言。即在文獻(xiàn)存儲時,文獻(xiàn)的內(nèi)容特征(分類、主題)和外表特征(書名、著者)按照一定的語言來描述,檢索文獻(xiàn)時的提問也按照一定的語言來加以表達(dá),這種在文獻(xiàn)存儲和檢索過程中,共同使用、共同遵循的語言就是檢索語

16、言。檢索語言的含義 信息檢索語言實(shí)質(zhì)上是標(biāo)引和檢索之間的約定語言,是人與檢索系統(tǒng)對話的基礎(chǔ)。檢索的匹配就是通過檢索語言的匹配來實(shí)現(xiàn)的,使用檢索工具和檢索系統(tǒng)必須掌握檢索語言,它是掌握和提高檢索技能的基礎(chǔ)。檢索語言的作用: 1、保證不同標(biāo)引人員表征文獻(xiàn)信息的一致性。 2、使內(nèi)容相同及相關(guān)的文獻(xiàn)集中化。 3、保證檢索提問與文獻(xiàn)信息標(biāo)引的一致性。 4、保證檢索者按不同需求檢索文獻(xiàn)信息時, 都能獲得最高的查全率和查準(zhǔn)率。二、檢索語言的類型檢索語言的類型表述文獻(xiàn)外表特征的語言表述文獻(xiàn)內(nèi)容特征的語言題名責(zé)任者號碼引文分類法主題法標(biāo)題詞法敘詞法關(guān)鍵詞法檢索語言的分類按文獻(xiàn)信息的特征:描述信息內(nèi)容特征的語言和

17、描述信息外部特征的語言;按檢索工具編排體系:分類語言和主題詞語言;按詞匯的類型:關(guān)鍵詞語言、單元詞語言、標(biāo)題詞語言和敘詞語言。按其規(guī)范的情況:人工語言 (規(guī)范語言)和自然語言(非規(guī)范語言);代碼語言按檢索語言的詞匯組配方式:先組式語言和后組式語言。 不同的檢索語言構(gòu)成不同的標(biāo)目及其索引系統(tǒng),提供各種檢索點(diǎn)。 人工語言 (規(guī)范語言) 和自然語言(非規(guī)范語言)規(guī)范語言:人工語言的規(guī)范處理重在兩個方面:一是使一個概念只用一個詞匯來表達(dá),這樣就避免了多詞一義的情況;二是使一個標(biāo)引詞只能表達(dá)一個概念,這樣就排除了一詞多義現(xiàn)象。自然語言:自然語言是取其自然形態(tài),不受控,使用非規(guī)范詞或稱自由詞。自然語言極其

18、豐富、復(fù)雜和多樣,存在著一詞多義、多詞一義及詞義交叉的現(xiàn)象。常見的有同義詞、近義詞、同型異義詞等。 分類語言和主題語言分類語言也屬于主題語言。是按照一定的觀點(diǎn),以學(xué)科分類為基礎(chǔ),用邏輯分類的原理,結(jié)合信息的內(nèi)容特征,運(yùn)用概念劃分的方法,按知識門類從總到分,從上到下,層層劃分,由類目號碼及名稱作為檢索語言,構(gòu)成分類類目表,如圖書分類表、專利分類表用的都是分類語言。 主題詞語言包括:關(guān)鍵詞語言、單元詞語言、標(biāo)題詞語言、敘詞語言等,它們有不同的主題詞表。主題詞表達(dá)概念本身,在主題詞表中通過參照系統(tǒng)來指示詞匯之間的關(guān)系。 目前,國際上通用的體系分類表有: 中國圖書館圖書分類法(簡稱中圖法)。 美國國會

19、圖書館分類法 杜威十進(jìn)位分類法 (簡稱UDC), IPC國際專利分類法 中國圖書館分類法 簡介中圖法是我國當(dāng)代具有代表性的圖書分類法,是一部大型的綜合性的圖書分類法。它是根據(jù)文獻(xiàn)各級類目之間的邏輯關(guān)系(如從屬關(guān)系、并列關(guān)系、相關(guān)關(guān)系、交叉關(guān)系等)編排而成的一個逐級展開的排列表。中圖法由五大基本部類和22個基本大類、簡表、詳表、通用復(fù)分表組成。中圖法的標(biāo)記符號,采用拉丁字母與阿拉伯?dāng)?shù)字相結(jié)合的混合號碼制,拉丁字母用來表示大類,其他各級類目則用阿拉伯?dāng)?shù)字表示?;静款惢敬箢惢敬箢惢敬箢惱纾骸熬W(wǎng)絡(luò)瀏覽器”類號、類目展開示例T 工業(yè)技術(shù)TP 自動化技術(shù)、計(jì)算機(jī)技術(shù)TP3 計(jì)算技術(shù)、計(jì)算機(jī)技術(shù)

20、.TP39 計(jì)算機(jī)的應(yīng)用 TP393 計(jì)算機(jī)網(wǎng)絡(luò) TP393.0 一般性問題 TP393.09 計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用程序 TP393.092 網(wǎng)絡(luò)瀏覽器 網(wǎng)址資源、WWW、Netscape、主頁制作等如此。 關(guān)鍵詞語言 所謂關(guān)鍵詞是指那些出現(xiàn)在文獻(xiàn)的標(biāo)題(篇名、章節(jié)名)以至摘要、正文中,對表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的語詞,亦即對揭示和描述文獻(xiàn)主題內(nèi)容來說是重要的、帶關(guān)鍵性的(可作為檢索“入口”的)那些詞語。也可看成是一種自然語言。即直接從文獻(xiàn)信息的標(biāo)題、摘要或內(nèi)容本身抽取出來的用于揭示信息主題內(nèi)容的自由詞。例:“科技文獻(xiàn)信息檢索”中的關(guān)鍵詞很多,它包括:“科技”、“科技文獻(xiàn)”、“文獻(xiàn)”、“文獻(xiàn)信息

21、”、“信息”、“信息檢索”、“文獻(xiàn)檢索”和“檢索” 敘詞語言 是以表達(dá)文獻(xiàn)主題內(nèi)容的概念單元為基礎(chǔ),經(jīng)過規(guī)范化處理,可以進(jìn)行邏輯組配的一種主語語言。第三節(jié) 檢索工具 檢索工具:是在不同學(xué)科范圍內(nèi)對某階段出版的有關(guān)文獻(xiàn)進(jìn)行收集、整理或?qū)π挛墨I(xiàn)加以及時報(bào)道的二次文獻(xiàn)。一、檢索工具的作用二、檢索工具的特點(diǎn)三、檢索工具的類型一、檢索工具的作用1、報(bào)道作用2、存儲作用3、檢索作用二、檢索工具的特點(diǎn)1、詳細(xì)而又完整地記錄了文獻(xiàn)的外部特征和內(nèi)部特征。2、對所著錄的文獻(xiàn),標(biāo)引了可供檢索的檢索標(biāo)示。3、提供必要的檢索手段,配備各種體系的索引。三、檢索工具的類型1、目錄2、題錄3、文摘4、索引目 錄 目錄是著錄一

22、批相關(guān)文獻(xiàn)并按照一定的次序編排而成的一種揭示與報(bào)道文獻(xiàn)的工具。目錄又稱書目,目錄的著錄項(xiàng)目一般有:書、刊名、卷、期數(shù)、作者、出版年月、出版地及書、刊收藏情況等。按目錄的編制目的可分為:登記書目、科學(xué)通報(bào)書目、推薦書目、書目之書目(指南)五種。按目錄收錄文獻(xiàn)內(nèi)容范圍分為:綜合書目,專題書目,地方文獻(xiàn)書目和個人著述書目等。按照目錄反映文獻(xiàn)收藏情況,可以劃分為:館藏目錄和聯(lián)合目錄。按照文獻(xiàn)的出版時間與書目編制的時間的關(guān)系可以分為:現(xiàn)行書目、回溯書目和與預(yù)告書目。題 錄 題錄是將圖書和報(bào)刊中論文的篇目按照一定的排檢方法編排,供人們查找篇目出處的工具。它按照論文的篇名順序排列,按“篇”報(bào)道,不論是否收藏

23、原文,只要是已出版發(fā)行的文獻(xiàn)都收錄,具有“廣”、“全”、“快”的特點(diǎn)。文 摘 文摘是以簡明扼要的文字摘述文獻(xiàn)的主要內(nèi)容,是文獻(xiàn)資料的摘要。作為一種檢索工具,它以精練的語言把文獻(xiàn)的重要內(nèi)容、學(xué)術(shù)觀點(diǎn)、數(shù)據(jù)及結(jié)構(gòu)準(zhǔn)確地摘錄下來,并按一定的著錄規(guī)則與排列方式編排起來,供讀者查閱使用。按文摘的編寫方式分為:報(bào)道性文摘和指示性文摘。按出版形式分為:期刊式文摘、單卷式文摘、附錄式文摘和卡片式文摘等。索 引 索引將書刊內(nèi)容中所論及的篇名、語詞、主題等項(xiàng)目,按照一定的排檢方法加以編制,注明出處,供讀者查檢使用的檢索工具。索引是對文獻(xiàn)內(nèi)容較深入的揭示。索引的種類繁多,按照索引的對象可分為篇目索引、分類索引、主題

24、索引、著者索引、引文索引等。常用的索引有:篇名索引、主題索引、輔助索引等。第四節(jié) 檢索技術(shù)一、概念檢索二、布爾邏輯運(yùn)算符組配檢索三、截詞檢索四、字段限制檢索五、位置運(yùn)算符六、檢索技巧和方法一、概念檢索 檢索標(biāo)識是具體的檢索詞或詞組,每個檢索詞表達(dá)一個概念,具體檢索時,將檢索詞與數(shù)據(jù)庫中的文獻(xiàn)特征標(biāo)識進(jìn)行類比,兩者相同,則該記錄為命中文獻(xiàn)。二、 布爾邏輯算符組配檢索 布爾邏輯組配運(yùn)算是采用布爾代數(shù)中的邏輯“與”邏輯“或”、邏輯“非”等算符,將檢索提問式轉(zhuǎn)換成邏輯表達(dá)式,限定檢索詞在記錄中必須存在的條件或不能出現(xiàn)的條件。凡符合布爾邏輯所規(guī)定的條件的文獻(xiàn),既為命中文獻(xiàn)。 布爾邏輯運(yùn)算符1、邏輯“或”

25、2、邏輯“與”3、邏輯“非” 1、邏輯“或”(和)AB用符號“or”或“+”表示,其邏輯表達(dá)式為: A or B 或 A+B 表示提問要求命中文獻(xiàn)包含A、B兩個特征中的任何一個即可 例:數(shù)據(jù)挖掘在信息檢索與信息分析中的應(yīng)用 提問式:數(shù)據(jù)挖掘 * (信息檢索 + 信息分析) 2、邏輯“與”AB用符號“and”或“*”表示,其邏輯表達(dá)式為: A * B 或 A and B表示提問要求命中文獻(xiàn)同時包含A、B兩個特征。 例:圖書館信息資源建設(shè) 提問式:圖書館 *信息資源 * 建設(shè) 3、邏輯“非” AB用符號“not”或“-”,其邏輯表達(dá)式為: A not B 或 A-B 其意義為:檢索記錄中含有檢索詞

26、A,但不能含有檢索詞B的文獻(xiàn),才算命中文獻(xiàn)。例:自由分配方面的文獻(xiàn)(排除天水師范學(xué)院師生的著作)提問式:(關(guān)鍵詞=自由分配) not (單位=天水師范學(xué)院) 三、截詞檢索 截詞檢索主要是利用檢索詞的詞干或不完整的詞形進(jìn)行檢索。其方法是在詞干后可能變化的字符處加上通配符,可減少檢索詞的輸入量,簡化檢索步驟,提高查全率。 截詞符一般用“?”、“ :”、“#”表示1、后方截詞:用于前方一致的派生詞檢索。 如:信息? 則表示在數(shù)據(jù)庫中含有信息、信息技術(shù)、信息檢索等方面的文獻(xiàn)記錄均為命中文獻(xiàn)。如“apple?”可代替(apple + apples + apple-pie + applesauce);2、

27、前方截詞:用于后方一致的派生詞檢索。 如:?經(jīng)濟(jì) 則數(shù)據(jù)庫中含有經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)、農(nóng)業(yè)經(jīng)濟(jì)等方面的文獻(xiàn)均為命中文獻(xiàn)。 3、有限截詞 在檢索詞后面加上一個或一個以上(最多4個)的“?”,空一格,再加一個“?”。如: Comput? ? 可檢索出: Computer,Computers,Computing 截詞檢索在不同的計(jì)算機(jī)檢索系統(tǒng)中規(guī)定不同,請使用時注意。 注意:由于文字結(jié)構(gòu)方面的原因,中文檢索系統(tǒng)極少使用截詞檢索和位置算符檢索。四、字段限制檢索 為了縮小檢索范圍,在命令式檢索中,通常要用字段代碼來限定檢索的字段,以提高檢索速度和命中率。不同的數(shù)據(jù)庫使用的字段代碼略有不同。 如:rice in

28、 ti(表示只在題目字段中查找文獻(xiàn)) rice in de(只在主題詞中查找) rice in ab(只在文摘中查找) au = Smith,J.C (查作者為Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查語種為中文的文獻(xiàn)) 限制檢索“全國報(bào)刊索引”的字段標(biāo)識為:A=分類 ,B=題名, C=著者 ,D=單位, E=刊名, F=年份, G=主題, H=文摘 ,I=全字段 例:B=圖書館 * D=海南大學(xué) “DIALOG”的基本索引字段標(biāo)識為:AB(文摘),DE(敘詞),ID(自由詞),SH(分類標(biāo)題),TI(題目), CO(公司),檢索

29、形式為“檢索詞/字段代碼”。輔助索引有:AU(著作),JN(期刊),PY(年代),檢索形式為“字段標(biāo)識符=檢索詞”。例:(personal (w) computer/de or network/ti) and py = 2002或( personal (w) computer/de, ti, id or network/ti, ab) and la = english and py = 2002CNKI直接用字段名稱標(biāo)識,如:題名 = “計(jì)算機(jī)” and “機(jī)構(gòu)”海南大學(xué)”五、位置運(yùn)算符With:設(shè)定需檢索的兩個詞或詞組在同一字段中,但不限制位置的先后。Near:設(shè)定需檢索的兩個詞或詞組在同一

30、語句中,相對于“with”更接近。此外,在使用“near”運(yùn)算符時,還可以在該運(yùn)算符后添加一個數(shù)字以便進(jìn)一步限定兩個詞之間的鄰近程度,如“near3” 設(shè)定需檢索的兩個詞或詞組在同一句子中且相隔不超過3個單詞。 位置算符: 在檢索詞之間使用,規(guī)定算符兩邊的檢索詞出現(xiàn)在記錄中的的位置,以提高檢準(zhǔn)率。位置算符表示方法說 明with(W)或( )兩個詞在命中結(jié)果中相鄰(可有空格、標(biāo)點(diǎn)和連字符),詞序不得顛倒。(nW)兩個詞之間最多可夾入n個詞,詞序不得顛倒。near(N)兩個詞在命中結(jié)果中相鄰,詞序可顛倒。(nN)兩個詞之間最多可夾入n個詞,詞序可顛倒。field(F)兩個詞在同一字段出現(xiàn),位置不固

31、定。subfield(S)兩個詞在同一子字段出現(xiàn),位置不固定。link(L)兩個詞在同一規(guī)范詞單元內(nèi)出現(xiàn),位置不固定。:常見的位置算符如下網(wǎng)絡(luò)信息資源一、網(wǎng)絡(luò)信息資源的特點(diǎn)二、網(wǎng)絡(luò)信息資源的類型三、常見網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng)一、網(wǎng)絡(luò)信息資源的特點(diǎn) 總體來講,網(wǎng)絡(luò)信息資源相比其他信息資源具有如下主要特點(diǎn) :1.離散性與共享性2.動態(tài)性和及時性3.不均勻性4.潛在的失控性網(wǎng)絡(luò)信息資源的特點(diǎn) 1.離散性與共享性是受/支持的應(yīng)用協(xié)議集,它采用,和進(jìn)行信息定位、存取和顯示。在靜態(tài)上,是一個全球范圍內(nèi)的相互鏈接的多媒體信息網(wǎng),同時在邏輯上它也可被看作是用書寫的分布式超文本結(jié)構(gòu)。這種超文本結(jié)構(gòu)使得文檔之間用熱鍵

32、連接,這種自由度使得信息交換與分享潛力無窮。也正是由于這種離散性,使得網(wǎng)絡(luò)信息資源能為所有網(wǎng)絡(luò)用戶共享,這一優(yōu)越性是其他信息資源所不具備的。網(wǎng)絡(luò)信息資源的特點(diǎn) 2.動態(tài)性和及時性: 網(wǎng)上信息資源的瞬息萬變,極其豐富,信息的更新也很迅速。 3.不均勻性有兩重含義,一是網(wǎng)絡(luò)信息的質(zhì)量不均勻,二是網(wǎng)絡(luò)信息分布不均勻。 4.潛在的失控性任何個人團(tuán)體只需具備上網(wǎng)條件能夠使用,就可以把任何信息放到網(wǎng)上,這種信息經(jīng)過種種檢索工具的標(biāo)引,就可供用戶檢索,中間沒有任何形式的質(zhì)量控制,勢必影響檢索效果的查準(zhǔn)率,從而導(dǎo)致檢索效率的失控。二、網(wǎng)絡(luò)信息資源的類型 從文獻(xiàn)信息檢索角度看,我們可以把網(wǎng)絡(luò)信息資源分成以下幾種

33、類型:1、網(wǎng)上圖書信息2、電子期刊 3、專利信息 4、網(wǎng)上數(shù)據(jù)庫 5、網(wǎng)上其它科技信息1、網(wǎng)上圖書信息 Internet上提供的圖書信息主要包括書目信息和電子圖書這些信息我們可從以下幾個方面來獲?。?(1) 出版商提供的書目信息。國內(nèi)外許多出版社都有自己的網(wǎng)站, 通過Internet發(fā)布其出版物的目錄、最新圖書內(nèi)容簡介、價格等信息。(2) 數(shù)字圖書館提供的電子圖書。數(shù)字圖書館是數(shù)字化生存時代的重要文化基礎(chǔ)設(shè)施。利用這些圖書館,記載人類文明成果的圖書資料就會方便地進(jìn)入人們的生活 網(wǎng)上圖書信息 (3) 圖書館、文獻(xiàn)情報(bào)中心提供的聯(lián)機(jī)圖書館館藏目錄。目前全球至少有15000個大型圖書館的聯(lián)機(jī)目錄24

34、小時對外開放,通過OPAC我們可以查詢到大量的書目信息,確定某本書是否在館,能否通過館際互借加以利用等,有些聯(lián)機(jī)目錄不但提供書目及摘要, 還提供其它的信息資源。2、網(wǎng)上電子期刊信息 電子期刊是非常重要的網(wǎng)絡(luò)資源。網(wǎng)上電子期刊時效性強(qiáng)、內(nèi)容豐富、檢索途徑多樣,已成為利用率非常高的網(wǎng)絡(luò)信息源,特別是免費(fèi)的電子期刊。網(wǎng)上電子期刊包括與印刷版同時發(fā)行和僅在網(wǎng)上發(fā)行的兩種,其主要來源渠道有: (1)出版商和文摘索引服務(wù)商提供的期刊檢索服務(wù)。目前,國際上大多數(shù)主要的期刊出版都建立了全文數(shù)字化期刊數(shù)據(jù)庫。并通過Internet提供其服務(wù)。網(wǎng)上電子期刊信息(2) 網(wǎng)絡(luò)數(shù)據(jù)庫信息服務(wù)商提供的服務(wù)。存儲在網(wǎng)絡(luò)服務(wù)

35、器上的網(wǎng)絡(luò)數(shù)據(jù)庫品種多、質(zhì)量高、大多由信息服務(wù)商或大型圖書館機(jī)構(gòu)創(chuàng)建維護(hù)。(3) 網(wǎng)絡(luò)版期刊提供的服務(wù)。目前,許多期刊正在網(wǎng)上建立自已的網(wǎng)站,便于讀者上網(wǎng)檢索或提供免費(fèi)的電子郵件現(xiàn)刊目錄服務(wù)網(wǎng)上電子期刊信息 (4) 文獻(xiàn)情報(bào)部門或?qū)W術(shù)性機(jī)構(gòu)提供的服務(wù)。文獻(xiàn)情報(bào)部門或?qū)W術(shù)性機(jī)構(gòu)通過自己的網(wǎng)站提供期刊或其它類型文獻(xiàn)的網(wǎng)上檢索服務(wù),用戶在有的網(wǎng)站檢索二次文獻(xiàn)信息的同時,還可以訂購原始文獻(xiàn),原文可通過E-mail、傳真、瀏覽、下載和聯(lián)機(jī)打印等方式獲取。3、網(wǎng)上專利信息 網(wǎng)上的專利信息資源可從以下幾個方面來獲?。?(1) 利用專利管理機(jī)構(gòu)網(wǎng)站提供的信息。專利管理機(jī)構(gòu)網(wǎng)站主要是指各國(地區(qū))或地方專利局的

36、主頁或者由它們及其下屬機(jī)構(gòu)開發(fā)的網(wǎng)站。這類網(wǎng)站提供的專利信息全面、權(quán)威、新穎。例如美國、加拿大、日本等國的專利數(shù)據(jù)庫在INTERNET上均可得到免費(fèi)使用。網(wǎng)上專利信息 (2) 利用聯(lián)機(jī)檢索系統(tǒng)中的專利數(shù)據(jù)庫。一些知名的聯(lián)機(jī)檢索系統(tǒng)中都包含與專利有關(guān)的數(shù)據(jù)庫。如Dialog系統(tǒng)(http:/)、STN (/stn.html)系統(tǒng)等。(3) 利用數(shù)據(jù)庫出版機(jī)構(gòu)提供的信息。主要有Derwent公司、英國IEE公司(INSPEC)。4、網(wǎng)上數(shù)據(jù)庫信息 這是最有價值的信息資源之一,一般以商業(yè)性數(shù)據(jù)庫或政務(wù)數(shù)據(jù)庫的形式出現(xiàn),需要通過購買或用戶授權(quán)才能使用。網(wǎng)上數(shù)據(jù)庫有全文型、文摘型、題錄型、事實(shí)和數(shù)值型、

37、多媒體型等。Internet上也有大量、有價值的免費(fèi)數(shù)據(jù)庫,只要我們要善于發(fā)現(xiàn)、搜集,往往會得到意外的驚喜。網(wǎng)上數(shù)據(jù)庫信息 數(shù)據(jù)庫可以分為五種類型 (1)文獻(xiàn)書目數(shù)據(jù)庫 :Bibliographic Database (2)全文數(shù)據(jù)庫 :Complete Text Databases(3)信息指南數(shù)據(jù)庫 :Dictionary Databases(4)數(shù)值型數(shù)據(jù)庫 :Numeric Databases(5)其他類型的數(shù)據(jù)庫(1)文獻(xiàn)書目數(shù)據(jù)庫 文獻(xiàn)書目數(shù)據(jù)庫是存儲某個領(lǐng)域原始文獻(xiàn)的書目,即二次文獻(xiàn)數(shù)據(jù)庫,記錄內(nèi)容包括文獻(xiàn)的題目、著者、原文出處、文摘、主題詞等大多數(shù)是印刷本檢索工具的機(jī)讀版,如美

38、國工程索引數(shù)據(jù)庫(EI)英國科學(xué)文摘數(shù)據(jù)庫(INSPEC)美國化學(xué)文摘數(shù)據(jù)庫(CA)(2)全文數(shù)據(jù)庫 全文數(shù)據(jù)庫是存儲文獻(xiàn)內(nèi)容全文或其中主要部分的數(shù)據(jù)庫,簡稱全文庫.是將信息的全部文字和非文字內(nèi)容轉(zhuǎn)換成計(jì)算機(jī)可讀形式. 全文數(shù)據(jù)庫可以解決用戶獲取一次文獻(xiàn)所遇到的困難,能向用戶提供一步到位的查找原始文獻(xiàn)的信息服務(wù)。據(jù)統(tǒng)計(jì),在美國,全文數(shù)據(jù)庫從1985年的28%增加到1995年的52%,其數(shù)量是書目型數(shù)據(jù)庫的一倍,而書目型數(shù)據(jù)庫則從57%下降到24% 我國已有中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、書生之家數(shù)字圖書館和超星數(shù)字圖書館等全文數(shù)據(jù)庫產(chǎn)品(3)信息指南數(shù)據(jù)庫 信息指南數(shù)據(jù)庫主要是記錄一些機(jī)構(gòu)、人物、產(chǎn)品

39、、項(xiàng)目簡述等事實(shí)數(shù)據(jù),通過該類數(shù)據(jù)庫可以查到公司、機(jī)構(gòu)地址、電話、產(chǎn)品目錄、研究項(xiàng)目或名人簡歷等信息,這類數(shù)據(jù)庫也稱為事實(shí)數(shù)據(jù)庫(4)數(shù)值數(shù)據(jù)庫 數(shù)值數(shù)據(jù)庫是專門提供以數(shù)據(jù)形式表示信息的一種源數(shù)據(jù)庫,主要記錄科學(xué)研究中試驗(yàn)、測量、計(jì)算、工程設(shè)計(jì)、經(jīng)濟(jì)分析和工業(yè)規(guī)劃等方面的數(shù)據(jù)這類數(shù)據(jù)庫主要包含數(shù)值數(shù)據(jù),有的也包含文字,文字是用來定義數(shù)據(jù)所需的最小量的文字,有時稱為文本數(shù)值數(shù)據(jù)庫(Textual-numeric Databases)(5)其他類型的數(shù)據(jù)庫 除了上述四種基本的數(shù)據(jù)庫類型之外,還有多種混合型的數(shù)據(jù)庫形式特別是隨著多媒體技術(shù)的迅速發(fā)展和廣泛應(yīng)用,將多媒體數(shù)據(jù)結(jié)構(gòu)結(jié)合為一體,并統(tǒng)一進(jìn)行存

40、取、管理和應(yīng)用的多媒體數(shù)據(jù)庫已經(jīng)問世.5、網(wǎng)上其它科技信息Internet上除了網(wǎng)上圖書信息、電子期刊、專利信息、數(shù)據(jù)庫信息外,還有大量的會議信息、科技政策法規(guī)、學(xué)位論文、技術(shù)標(biāo)準(zhǔn)、產(chǎn)品樣本目錄、科技報(bào)告、統(tǒng)計(jì)數(shù)據(jù)、科技新聞、組織機(jī)構(gòu)、電子論壇、通訊討論組和數(shù)據(jù)庫等,這些資源的實(shí)用性也很強(qiáng)。 三、常見網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng)1.Ei 美國工程索引2.SCI Expanded( 科學(xué)引文索引擴(kuò)展)3.ISI Proceedings (科學(xué)會議錄索引)4.CSSCI (中文社會科學(xué)引文索引)5.ASTP ( 威爾遜應(yīng)用科學(xué)與技術(shù)數(shù)據(jù)庫)6.CSA (劍橋科學(xué)文摘)7.OCLC First Search(

41、聯(lián)機(jī)計(jì)算機(jī)圖書館中心)常見網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng) 8.PQDD(國際學(xué)位論文文摘) 9.USPTO(美國專利與商標(biāo)辦公室) 10.CNKI11.維普信息資源系統(tǒng)12.萬方數(shù)據(jù)資源系統(tǒng)13.其他數(shù)據(jù)庫資源七、 科技信息檢索的基本流程信息檢索課程目的:讓你以最有效的方法收集及篩選所需數(shù)據(jù)以提高科學(xué)研究能力 1.檢索步驟 檢索步驟:根據(jù)既定課題要求,利用檢索工具查找有關(guān)文獻(xiàn)資料的具體過程,實(shí)際是信息檢索的具體化。主要有以下步驟: 1、分析檢索課題 2、選擇檢索系統(tǒng)和數(shù)據(jù)庫 3、確定檢索途徑和檢索詞 4、構(gòu)建檢索式 5、檢索并調(diào)整檢索策略 檢索步驟1.進(jìn)行課題分析,明確課題需求。 檢索文獻(xiàn)信息前對課題內(nèi)容

42、進(jìn)行分析,明確文獻(xiàn)檢索的目的。課題需求可以分為三種類型:a、普查型:需要全面收集有關(guān)某一主題的文獻(xiàn)資料,如以課題開題、教材編寫等。具有普查、回溯的特點(diǎn),要求盡可能高的查全率。b、攻關(guān)型:需要收集有關(guān)某一主題某一特定方面的文獻(xiàn),其目的在于解決科研、生產(chǎn)中的關(guān)鍵問題,這類需求不強(qiáng)調(diào)查詢的文獻(xiàn)數(shù)量,但需要查得的文獻(xiàn)具有較強(qiáng)的專指性。c、學(xué)習(xí)型:需要了解掌握某一領(lǐng)域的研究動向、研究成果或相關(guān)知識,要求查到的文獻(xiàn)具有新穎及時的特點(diǎn),而對查全率和查準(zhǔn)率不一定有很高的要求。2、選擇檢索工具(系統(tǒng))和數(shù)據(jù)庫選擇檢索工具時要考慮是否與文獻(xiàn)需求緊密結(jié)合、學(xué)科專業(yè)對口、覆蓋信息面廣、報(bào)道及時、揭示信息內(nèi)容準(zhǔn)確、有一

43、定深度的工具以及檢索系統(tǒng)的檢索功能是否完善等,主要有幾個方面:全面性,即是否與課題相關(guān)的內(nèi)容都要檢索,包括的工具有一次文獻(xiàn)和二次文獻(xiàn)數(shù)據(jù)庫,以及網(wǎng)上相關(guān)資源等。針對性,保證選擇的檢索工具與檢索課題的學(xué)科一致;專業(yè)性,即選擇與學(xué)科專業(yè)相關(guān)的工具,特別注意跨學(xué)科領(lǐng)域內(nèi)容;權(quán)威性,盡量選用該學(xué)科的權(quán)威性檢索工具;了解檢索工具收錄的范圍,包括時間跨度、地理范圍、文獻(xiàn)語種、類型等;檢索工具的檢索方法和系統(tǒng)功能是否全面有效。選擇檢索工具 目前,檢索工具和數(shù)據(jù)庫的數(shù)量不斷增多,每種檢索工具和數(shù)據(jù)庫均有自己的特色和側(cè)重點(diǎn),檢索時,應(yīng)根據(jù)課題需求加以選擇。 對于工具書和數(shù)據(jù)庫特點(diǎn)的了解,一是可以通過學(xué)習(xí)檢索課了

44、解和掌握自己專業(yè)的主要檢索工具及數(shù)據(jù)庫;二是通過相應(yīng)的信息機(jī)構(gòu)收藏的檢索工具和數(shù)據(jù)庫,直接瀏覽或使用過程逐步了解和掌握;三是通過各種檢索工具指南和數(shù)據(jù)庫目錄了解,只有在了解檢索工具和數(shù)據(jù)庫的基礎(chǔ)上,才能有效地進(jìn)行選擇。檢索工具的選擇通常有兩種方法:(1)從常用檢索工具中選擇 (2)從檢索工具指南中選取 可利用中國科學(xué)技術(shù)情報(bào)研究所編輯出版的 國外科技文獻(xiàn)檢索工具書選介 國外科技文獻(xiàn)單卷檢索工具書簡介國內(nèi)科技文獻(xiàn)檢索工具書簡介等選取。 重要專業(yè)信息資源選介一、 公共學(xué)術(shù)站點(diǎn)1. 中國國家圖書館(2. 中國科學(xué)院文獻(xiàn)信息中心()3. 萬方數(shù)據(jù)資源系統(tǒng)()4. 國家科技圖書文獻(xiàn)中心()5. 中國高校

45、科研網(wǎng) ()6. 中國學(xué)術(shù)期刊網(wǎng) ()二、專業(yè)學(xué)會、研究機(jī)構(gòu)及專業(yè)站三、提供學(xué)術(shù)站點(diǎn)的導(dǎo)航網(wǎng)站點(diǎn)3、確定檢索途徑和檢索詞 檢索途徑的含義:檢索途徑也稱檢索入口,文獻(xiàn)的特征是存儲文獻(xiàn)的依據(jù),也是檢索文獻(xiàn)的依據(jù),因此,文獻(xiàn)特征便構(gòu)成了檢索途徑。數(shù)據(jù)庫由一條一條記錄集合而成,而一條記錄又劃分為若干字段。如中國學(xué)術(shù)期刊全文數(shù)據(jù)庫存貯了我國自1994年以來發(fā)表在近萬種報(bào)刊上的文獻(xiàn)。一篇文獻(xiàn)用一條記錄來揭示,一條記錄又劃分為分類、題名、著者、出處、年份、(題中)人名、主題等字段。其中大部分字段都是可檢索字段,這些可檢索字段,我們就稱之為檢索途徑。 一般來說,每個數(shù)據(jù)庫都有多個檢索途徑(入口),常用的有:篇

46、名、作者、關(guān)鍵詞、摘要、全文、出處、分類等。檢索前用戶要告訴計(jì)算機(jī),以什么檢索途徑來進(jìn)行檢索。如果要查找篇名中含有某個詞的文獻(xiàn),則檢索途徑選擇“篇名”;如果要按文獻(xiàn)的分類來檢索,則檢索途徑選擇“分類”。檢索詞的選擇與確定要注意:根據(jù)檢索課題所涉及的學(xué)科專業(yè)和技術(shù)內(nèi)容選詞;根據(jù)檢索目的選詞。如:“屠宰場含脂水的處理”,目的是富含脂肪的污水處理,因此并不在乎是屠宰廠還是肉聯(lián)廠。再如:鹽堿地改良。進(jìn)一步和讀者溝通后得知鹽堿地改良是通過生物技術(shù)實(shí)現(xiàn)的,所以,加上生物技術(shù)更能體現(xiàn)出檢索目的??紤]相應(yīng)的同義詞。對同一事物,人們對其有不同的稱呼和表達(dá),如“計(jì)算機(jī)”又稱“電腦”、“圖形圖像與圖形圖象“,“污水

47、處理、污水控制與水凈化”,“電動機(jī)與馬達(dá)“等。要用邏輯或進(jìn)行檢索,如(電動機(jī) or 馬達(dá)),( 圖形圖像 or 圖形圖象)。上位詞、下位詞:檢索詞有上位詞下位詞之分,如在EBSCO中,我們檢索“芭蕾舞服裝”,必須同時檢索“芭蕾舞裙”、“芭蕾舞鞋”,才能得到滿意的查全率。不同外來詞譯定的變化:如:“歐幾里德”、“歐幾里得”、“歐基里德”、“歐幾理德 ”、“Euclid”。 “aspirin”、“阿斯匹林”, “阿司匹林”, “乙酰水楊酸”??s寫和中外文:如在CNKI中,用世界貿(mào)易組織檢出875條數(shù)據(jù),而用“世界貿(mào)易組織 or 世貿(mào) or WTO”檢出27337 條數(shù)據(jù)。4、構(gòu)建檢索表達(dá)式檢索式又

48、稱檢索策略,由檢索詞和和各種布爾邏輯算符、位置算符、截詞算符及其它鏈接組配符號組成。在命令式檢索中可根據(jù)檢索式進(jìn)行高級組配檢索。撰寫檢索式時,就要選擇檢索點(diǎn)。檢索點(diǎn)正確與否決定著檢索結(jié)果的數(shù)量和質(zhì)量,如使用全文檢索,結(jié)果數(shù)量大,但相關(guān)性差;使用題名或文摘檢索,結(jié)果數(shù)量少但較準(zhǔn)確。如在CNKI中,在題名中檢索“南斯拉夫 and 自治”檢出文獻(xiàn)33條,用主題=南斯拉夫 and 題名=自治檢出文獻(xiàn)48條,用主題“南斯拉夫 and 自治檢出文獻(xiàn)175條。檢索式可一次完成,也可分步完成,檢索式的表達(dá)對一個課題不是唯一的,有多種選擇、組配、限定。 例1:查找“造紙廢水處理技術(shù)”的外文文獻(xiàn)A、抽詞:造紙(p

49、aper making, paper pulp ) 廢水(waste water) 處理(treat, treatment) B、檢索式(paper ( ) making or paper ( ) pulp) and waste and (treat or treatment)例2:赤潮對海洋貝類的危害A、抽詞:海洋貝類的下位詞有:牡蠣、貽貝、珍珠貝、扇貝、蚶、鮑魚、蛤仔、縊蟶、海螺、蚌等。B、檢索式:赤潮 *(貝 or 牡蠣 or 蚶 or 鮑 or 蛤 or 縊蟶 or 螺 or 蚌) * 危害5、分析檢索結(jié)果不滿意滿 意檢索技巧和提示1、廣泛瀏覽數(shù)據(jù)庫2、 選擇合適的數(shù)據(jù)庫試查3、調(diào)整策

50、略的考慮4、利用檢出文獻(xiàn)的信息,拓寬檢索5、充分利用各種資源各種導(dǎo)航工具、虛擬圖書館(網(wǎng)絡(luò)專題資源的有序集合)A、擴(kuò)大檢索范圍3、檢索技巧和方法* 概念的擴(kuò)大。* 范圍的擴(kuò)大。* 增加同義詞、近義詞、相關(guān)詞和縮略詞。* 用“or”、”?”、敘詞表* 年代的擴(kuò)大。* 去掉連字符可擴(kuò)大檢索范圍。* 換另外的數(shù)據(jù)庫或是另外的光盤繼續(xù)進(jìn)行檢索。* 核心概念的限定。* 核心期刊的限定。* 語種的限定。* 用布爾邏輯算符“and”或者“not”組配檢索詞* 使用位置算符“near”和字段算符“in”提高查準(zhǔn)率。* 使用“Index”和敘詞表,選擇確切的檢索 詞縮小檢索范圍B、縮小檢索范圍的方法八、專題文獻(xiàn)

51、檢索專題文獻(xiàn)檢索程序?qū)n}文獻(xiàn)檢索是一個復(fù)雜的過程,它是由多個環(huán)節(jié)組成,各個環(huán)節(jié)之間存在許多內(nèi)在聯(lián)系。因此,必須依一定程序進(jìn)行。(一)主題分析階段1、明確檢索目的(1)明確檢索需求的性質(zhì)(性質(zhì)檢索工具、檢索對象)(2)明確檢索需求的主要內(nèi)容、主題概念(3)明確檢索需求學(xué)科、專業(yè)、專題范圍2、明確檢索需求的分類標(biāo)識、主題標(biāo)識3、明確檢索范圍(1)時間范圍(2)文獻(xiàn)類型范圍(3)語種范圍(二)檢索策略制定階段1、選擇檢索手段:主要是根據(jù)客觀條件及檢索者的要求選擇手工檢索、計(jì)算機(jī)檢索、網(wǎng)絡(luò)檢索。2、選擇檢索工具(1)根據(jù)檢索需求性質(zhì): 理論性圖書類目錄型工具; 應(yīng)用技術(shù)性學(xué)術(shù)期刊、專利文獻(xiàn)、會議文獻(xiàn)類

52、文 摘型工具(2)根據(jù)專業(yè)學(xué)科屬性選擇檢索工具。3、選擇檢索方法:系統(tǒng)查找文獻(xiàn)資料時選擇順查法; 檢索課題的最新資料時選擇倒查法。4、選擇檢索途徑: 要求檢索文獻(xiàn)系統(tǒng)性強(qiáng)、檢全率高是采用分類途徑; 要求檢索文獻(xiàn)的專指性強(qiáng)、檢準(zhǔn)率高時采用主題途徑(三)檢索實(shí)施階段1、利用制定的檢索策略檢索適合檢索需求的文獻(xiàn)(線索)2、詳細(xì)記錄符合檢索需求的文獻(xiàn)線索文獻(xiàn)名稱、作者、時間、文獻(xiàn)出處、文獻(xiàn)類型等。3、根據(jù)文獻(xiàn)線索查找原始文獻(xiàn)。如果為畢業(yè)設(shè)計(jì)檢索查找文獻(xiàn)信息,要依據(jù)檢索課題的要求,使用檢索工具或檢索信息系統(tǒng)。為了快速有效地獲取研究課題的各類資料,可以按以下環(huán)節(jié)來檢索文獻(xiàn)1分析檢索課題學(xué)科范圍、時間范圍、

53、語種范圍是否是多學(xué)科或跨學(xué)科?檢索類型是事實(shí)類、數(shù)據(jù)類還是文獻(xiàn)類?2選擇檢索系統(tǒng) 選擇高質(zhì)量的檢索系統(tǒng);根據(jù)課題選擇檢索工具。3選定檢索方法直接檢索法間接檢索法追溯檢索法循環(huán)檢索法4確定檢索途徑 分類、主題、關(guān)鍵詞、著者、題名、機(jī)構(gòu)、基金、引文等5編制檢索策略檢索詞的選擇;檢索提問式的擬定;檢索策略的調(diào)整。6索取原文全文數(shù)據(jù)庫可打印或下載;如果僅有線索,可根據(jù)線索找館藏;如館藏未收,可通過互借系統(tǒng)復(fù)制、訂閱或訂購信息的搜集與整理傳統(tǒng)信息源包括紙媒體信息源和廣播電視傳播信息源按學(xué)術(shù)領(lǐng)域分非正式出版物電子函件、專題討論組、電子論壇、電子會議、電子公告版等按資源的提供形式分信息資源網(wǎng)絡(luò)信息資源自然科

54、學(xué)社會科學(xué)按出版物性質(zhì)分半正式出版物來自各學(xué)術(shù)團(tuán)體、國際組織、政府機(jī)構(gòu)、行業(yè)協(xié)會等正式出版物各種數(shù)據(jù)庫、專利電子期刊、音樂、電影等有償資源無償資源(四)結(jié)果分析及重新調(diào)整階段1、檢索結(jié)果的分析(1)檢索結(jié)果的質(zhì)量分析(2)檢索結(jié)果的數(shù)量分析2、檢索過程的重新調(diào)整(1)對檢索需求做進(jìn)一步分析:把握主題概念、學(xué)科專業(yè)專題范圍,重新確定檢索標(biāo)識。(2)調(diào)整檢索策略重新選擇檢索工具重新選擇檢索方法重新選擇檢索途徑資料的分類整理與提煉經(jīng)過各種途徑收集來的資料,需做進(jìn)一步的有序化處理,從而獲得高度濃縮和有序的信息。這一環(huán)節(jié)主要分為兩步:分類整理一般作法就是將選擇后的文獻(xiàn)資料按照論題的需要進(jìn)行分類、分析、比

55、較,形成一個寶塔式的分類體系或者說信息集合。通常是按照一定的標(biāo)準(zhǔn)進(jìn)行分類,比如對某一課題資料,可以按歷史線索分類;可以按不同的觀點(diǎn)分類;可以按研究的問題的性質(zhì)分類;還可以按子課題分類等等。分類后,使得紛繁復(fù)雜的零散資料形成脈絡(luò)分明、層次清晰的有機(jī)整體。在此基礎(chǔ)上,為構(gòu)造論文提綱打下基礎(chǔ)。擬訂提綱的方法有很多,一般說來應(yīng)考慮以下內(nèi)容,一是題目;二是中心論點(diǎn);三是分論點(diǎn)及主要論據(jù)的要點(diǎn);四是結(jié)論。二、專題文獻(xiàn)檢索實(shí)例檢索題目:果蔬保鮮劑(一)主題分析1、明確檢索目的:(1)檢索內(nèi)容的主要內(nèi)容:具有防腐保鮮作用的或人工合成的天然的藥劑種類及其在果蔬保鮮上的應(yīng)用情況(2)檢索課題的性質(zhì):應(yīng)用技術(shù)與理論

56、結(jié)合型。(3)檢索課題的特點(diǎn):專指性強(qiáng)(4)檢索課題的主題概念:保鮮(5)學(xué)科、專業(yè)、專題:農(nóng)業(yè)園藝貯藏保鮮(6)確定檢索標(biāo)識:分類標(biāo)識:S主題標(biāo)識:保鮮劑 果蔬2、明確檢索范圍(1)時間范圍:19802009,(2)語種范圍:中文、英文(3)文獻(xiàn)類型范圍:期刊論文、科技報(bào)告、會議文獻(xiàn)3、明確檢索者要求(1)系統(tǒng)性強(qiáng)(2)檢全率高(二)檢索策略制定1、檢索手段: (1)手工檢索: (2)計(jì)算機(jī)檢索:2、檢索工具(系統(tǒng)) (1)農(nóng)業(yè)文摘、園藝文摘、中國學(xué)術(shù)會議文獻(xiàn)通報(bào) (2)中國期刊全文數(shù)據(jù)庫3、檢索途徑 (1)主要途徑:由于課題專指性強(qiáng),選擇主題途徑 (2)輔助途徑:分類途徑4、檢索方法 (1)主要方法:順查法和循環(huán)檢索法。 (2)次要方法:倒查法(三)檢索實(shí)施階段1、利用農(nóng)業(yè)文摘、園藝文摘、中國學(xué)術(shù)會文獻(xiàn)通報(bào)中國期刊全文數(shù)據(jù)庫的主題索引,從主題途徑進(jìn)行順查,(19802009)2、詳細(xì)記錄與檢索課題有關(guān)的文獻(xiàn)線索(名稱、作者、文獻(xiàn)出處、時間)。結(jié)果為:(1)農(nóng)業(yè)文摘 、園藝文摘 110條(2)中國學(xué)術(shù)會文獻(xiàn)通報(bào):17條(3)中國期刊全文數(shù)據(jù)庫:85條3、索取原始文獻(xiàn)。(四)結(jié)果分析及策略調(diào)整1、檢索結(jié)果分析:從檢索出的223篇文獻(xiàn),經(jīng)過用戶分析,有45篇符合檢索的要求。但是屬于理論方面的文獻(xiàn)有32篇。應(yīng)用性13篇,這

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論