第一章 數(shù)字文獻(xiàn)檢索基礎(chǔ)庫課件_第1頁
第一章 數(shù)字文獻(xiàn)檢索基礎(chǔ)庫課件_第2頁
第一章 數(shù)字文獻(xiàn)檢索基礎(chǔ)庫課件_第3頁
第一章 數(shù)字文獻(xiàn)檢索基礎(chǔ)庫課件_第4頁
第一章 數(shù)字文獻(xiàn)檢索基礎(chǔ)庫課件_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫第1章數(shù)字文獻(xiàn)檢索基礎(chǔ)1.1數(shù)字文獻(xiàn)及其檢索概述1.2數(shù)字文獻(xiàn)的檢索技術(shù)1.3數(shù)字文獻(xiàn)的檢索策略1.4檢索效果評價2024/10/292第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.1數(shù)字文獻(xiàn)及其檢索概述1.1.1文獻(xiàn)及數(shù)字文獻(xiàn)概述1.文獻(xiàn)的概念2.文獻(xiàn)的類型3.數(shù)字文獻(xiàn)的概念4.數(shù)字文獻(xiàn)的特點1.1.2數(shù)字文獻(xiàn)的檢索語言1.數(shù)字文獻(xiàn)檢索2.數(shù)字文獻(xiàn)檢索語言2024/10/293第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.文獻(xiàn)的概念世界上最早的文獻(xiàn):產(chǎn)生于距今大約10000~40000年前的舊石器時代。最古老的文獻(xiàn):石刻圖像、楔形文字文獻(xiàn)、紙草文獻(xiàn)、克里特線性文字文獻(xiàn)、甲骨文獻(xiàn)等。文獻(xiàn)定義:記錄有知識的一切載體。文獻(xiàn)構(gòu)成:由知識、載體和記錄方式3個要素構(gòu)成,知識是內(nèi)容,載體是形態(tài),記錄方式是構(gòu)成文獻(xiàn)的手段,三者不可分割。2024/10/294第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫2.文獻(xiàn)的類型文獻(xiàn)有多種分類方式

(1)按文獻(xiàn)出版形式和內(nèi)容劃分①圖書

②報刊③科技報告④政府出版物⑤會議文獻(xiàn)

⑥學(xué)位論文

⑦專利文獻(xiàn)⑧標(biāo)準(zhǔn)文獻(xiàn)

⑨產(chǎn)品樣本

⑩其他零散資料

(2)按文獻(xiàn)載體形式劃分①印刷型文獻(xiàn)②縮微型文獻(xiàn)③視聽型文獻(xiàn)④機讀文獻(xiàn)(3)按文獻(xiàn)加工層次分①零次文獻(xiàn)②一次文獻(xiàn)

③二次文獻(xiàn)④三次文獻(xiàn)

2024/10/295第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫3.數(shù)字文獻(xiàn)的概念數(shù)字文獻(xiàn)指以數(shù)字形式把文字、圖像、聲音和動畫等多種形式的信息,存儲在光、磁等非紙介質(zhì)的載體中,并通過網(wǎng)絡(luò)通信、計算機或終端等方式再現(xiàn)出來的資源。主要的類型有:按表現(xiàn)形式:數(shù)據(jù)庫、電子圖書、電子期刊、電子報紙等按性質(zhì)和功能:一次數(shù)字文獻(xiàn)、二次數(shù)字文獻(xiàn)和三次數(shù)字文獻(xiàn)按生產(chǎn)途徑和發(fā)布:商用電子資源、網(wǎng)絡(luò)公開學(xué)術(shù)資源和特色資源按生產(chǎn)方式:原生數(shù)字文獻(xiàn)和復(fù)合數(shù)字文獻(xiàn)按數(shù)據(jù)傳播范圍:網(wǎng)絡(luò)信息資源和單機信息資源按存儲介質(zhì):磁介質(zhì)和光介質(zhì)2024/10/296第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫全文數(shù)據(jù)庫1)數(shù)據(jù)庫,是以一定的組織方式存儲在一起的相關(guān)數(shù)據(jù)的集合,是數(shù)字文獻(xiàn)最早的形式,也是數(shù)字文獻(xiàn)的主要構(gòu)成部分,包括全文數(shù)據(jù)庫、文摘/題錄數(shù)據(jù)庫和參考數(shù)據(jù)庫等類型。①全文數(shù)據(jù)庫,即收錄有原始文獻(xiàn)全文的數(shù)據(jù)庫,以期刊論文、會議論文、政府出版物、研究報告、法律條文和案例以及商業(yè)信息等為主。如國內(nèi)著名的全文數(shù)據(jù)庫有中國知網(wǎng)的中國期刊全文數(shù)據(jù)庫、重慶維普的中文科技期刊數(shù)據(jù)庫等;國外有ProQuest系統(tǒng)、EBSCOhost系統(tǒng)以及SpringerLink系統(tǒng)等2024/10/297第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫文摘/題錄數(shù)據(jù)庫是指包含各種數(shù)據(jù)、信息或知識的原始來源和屬性的數(shù)據(jù)庫。它報道文獻(xiàn)信息的存在,揭示文獻(xiàn)信息的內(nèi)容。按數(shù)據(jù)庫內(nèi)容,可劃分為書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫和索引(題錄)數(shù)據(jù)庫。書目數(shù)據(jù)庫主要是針對圖書進(jìn)行內(nèi)容及存儲地址的報道與揭示的,如各圖書館的館藏機讀目錄數(shù)據(jù)庫;文摘和索引數(shù)據(jù)庫則相對期刊論文、會議論文、專利文獻(xiàn)和學(xué)位論文等進(jìn)行內(nèi)容和屬性的認(rèn)識與加工,它提供確定的文獻(xiàn)來源信息,供人們查閱和檢索??茖W(xué)引文索引(SCI)、社會科學(xué)引文索引(SSCI)、工程索引(EI)和科學(xué)技術(shù)會議錄索引(ISTP)是世界上最權(quán)威的四大索引,均屬文摘/題錄數(shù)據(jù)庫。2024/10/298第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫參考數(shù)據(jù)庫是指包含大量事實、數(shù)據(jù),以及其他類型文獻(xiàn)信息的數(shù)據(jù)庫,具體有數(shù)值數(shù)據(jù)庫、指南數(shù)據(jù)庫、術(shù)語數(shù)據(jù)庫、視頻數(shù)據(jù)庫、英語學(xué)習(xí)數(shù)據(jù)庫和考試系統(tǒng)等。數(shù)值數(shù)據(jù)庫,指以數(shù)值為主要內(nèi)容的數(shù)據(jù)庫,如統(tǒng)計數(shù)據(jù)庫、化學(xué)反應(yīng)數(shù)據(jù)庫等;指南數(shù)據(jù)庫,是有關(guān)機構(gòu)、人物等相關(guān)信息的簡要描述,如公司名錄、產(chǎn)品目錄等;術(shù)語數(shù)據(jù)庫,即專門存儲名詞術(shù)語信息、詞語信息等的數(shù)據(jù)庫,如電子版百科全書、網(wǎng)絡(luò)詞典等。視頻數(shù)據(jù)庫,是指能夠以多媒體方式播放的相關(guān)信息內(nèi)容的數(shù)據(jù)庫,如愛迪科森網(wǎng)上報告廳、超星學(xué)術(shù)視頻等;英語學(xué)習(xí)系統(tǒng),主要是指以英語學(xué)習(xí)為主要內(nèi)容的數(shù)據(jù)庫,如新東方多媒體學(xué)習(xí)庫、冰果英語和EBSCO的學(xué)生英語學(xué)習(xí)中心(SRC)等;考試系統(tǒng)是指提供試題和模擬考試的數(shù)據(jù)庫系統(tǒng),如銀符考試系統(tǒng)、起點考試系統(tǒng)等。2024/10/299第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫電子圖書、電子期刊和電子報紙電子圖書:直接以數(shù)字形式出版的圖書或印刷型圖書的數(shù)字化形式,是以電子版的方式(其載體主要為光盤或網(wǎng)絡(luò)等)呈現(xiàn)的,并通過計算機或電子圖書閱讀器進(jìn)行閱讀的一種電子文獻(xiàn)。如國外的NetLibrary、Ebrary;國內(nèi)的超星電子圖書、書生電子圖書和方正Apabi電子圖書等。電子期刊:是指所有以電子形式存在的期刊,包括印刷型期刊的電子版、無印刷版的網(wǎng)絡(luò)型電子期刊。與紙本期刊并行的電子期刊,如著名的《科學(xué)》(Science)、《自然》(Nature)、Elsevier/Wiley/Springer/Kluwer等出版商的電子期刊等;純電子期刊,如《數(shù)字圖書館雜志》(D-LibMagazine)。電子報紙:指綜合運用多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)和通信技術(shù),完成出版、發(fā)行、利用全過程的新聞媒體。電子報紙的內(nèi)容可以是文字、表格、彩色圖形、圖像,甚至是聲音、動畫等的多媒體信息。

2024/10/2910第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫4.數(shù)字文獻(xiàn)的特點1)高度的共享性。2)類型的多樣性。3)檢索的便利性。4)信息的時效性。5)信息的不安全性。2024/10/2911第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.1.2數(shù)字文獻(xiàn)的檢索語言1.數(shù)字文獻(xiàn)檢索:是指通過檢索系統(tǒng),采用一定的技術(shù)手段,根據(jù)一定的原則,在數(shù)據(jù)庫或其他形式的數(shù)字文獻(xiàn)中自動找出用戶所需相關(guān)信息的過程。廣義的檢索包括信息的存儲和檢索兩個過程,狹義的檢索僅包括用戶的信息檢索過程。在數(shù)字文獻(xiàn)檢索發(fā)展過程中,先后經(jīng)歷脫機檢索、聯(lián)機檢索、光盤檢索和網(wǎng)絡(luò)檢索四個階段。目前,網(wǎng)絡(luò)檢索已成為廣大用戶獲取信息的主要方式。2024/10/2912第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫廣義的信息檢索過程2024/10/2913第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫2.?dāng)?shù)字文獻(xiàn)檢索語言檢索語言,是信息存儲與檢索過程中用于描述文獻(xiàn)特征和表達(dá)用戶信息提問的一種專門語言。所謂檢索的運算匹配就是通過檢索語言的匹配來實現(xiàn)的。

文獻(xiàn)具有外部特征和內(nèi)容特征。外部特征有題名(書名、篇名和刊名)、著者(個人、團(tuán)體)、號碼(專利號、標(biāo)準(zhǔn)號、國際標(biāo)準(zhǔn)書號ISBN和國際標(biāo)準(zhǔn)刊號ISSN等)、機構(gòu)名(責(zé)任者所屬機構(gòu)、出版發(fā)表機構(gòu))以及時間等;內(nèi)部特征指文獻(xiàn)內(nèi)容所屬的學(xué)科和文獻(xiàn)內(nèi)容的研究對象。2024/10/2914第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫文獻(xiàn)檢索語言與檢索途徑關(guān)系2024/10/2915第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫《中圖法》結(jié)構(gòu)2024/10/2916第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫TB一般工業(yè)技術(shù)TD礦業(yè)工程TE石油、天然氣工業(yè)TF冶金工業(yè)TG金屬學(xué)與金屬工藝TH機械、儀表工業(yè)TJ武器工業(yè)TK能源與動力工程TL原子能技術(shù)TM電工技術(shù)TN無線電電子學(xué)、電信技術(shù)TP自動化技術(shù)、計算機技術(shù)TQ化學(xué)工業(yè)TS輕工業(yè)、手工業(yè)TU建筑科學(xué)TV水利工程工業(yè)技術(shù)所含學(xué)科較多,其下位類用二個大寫英文字母表示2024/10/2917第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫

H31英語

H32/H37各種常用外國語均可仿H31分

H32法語

H33德語

H34西班牙語

H35俄語

H36日語

H37阿拉伯語H3常用外國語2024/10/2918第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫H311語音H311.9朗誦法、演講術(shù)H312文字H313語義、詞匯、詞義H313.1基本詞匯H313.2同義詞、多義詞、反義詞H313.3熟語、俗語H313.5外來語H313.6略語H313.9詞源H314語法H314.1構(gòu)詞法H314.2詞類H314.3句法H315寫作、修辭H315.9翻譯H316詞典H317方言H319語文教學(xué)H31英語2024/10/2919第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫H319.1教學(xué)改革H319.2教學(xué)計劃、教學(xué)大綱H319.3教學(xué)法英語學(xué)習(xí)方法入此。仿H193分H319.4讀物以提高閱讀能力為目的各科簡易讀物、對照讀物、注釋讀物入此。H319.6習(xí)題、試題H319.9會話口語、會話教材、聽說讀練習(xí)、視聽教學(xué)入此H319語文教學(xué)2024/10/2920第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫

R1預(yù)防醫(yī)學(xué)、衛(wèi)生學(xué)

R2中國醫(yī)學(xué)

R3基礎(chǔ)醫(yī)學(xué)

R4臨床醫(yī)學(xué)

R5內(nèi)科學(xué)

R6外科學(xué)

R71婦產(chǎn)科學(xué)

R72兒科學(xué)

R73腫瘤科學(xué)

R74神經(jīng)病學(xué)與精神病學(xué)

R75皮膚病學(xué)與性病學(xué)

R76耳鼻咽喉科學(xué)

R77眼科學(xué)

R78口腔科學(xué)

R79外國民族科學(xué)

R8特種醫(yī)學(xué)

R9藥學(xué)R醫(yī)藥、衛(wèi)生2024/10/2921第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫R2中國醫(yī)學(xué)

R21中醫(yī)預(yù)防、衛(wèi)生學(xué)

R22中醫(yī)基礎(chǔ)理論

R24中醫(yī)臨床學(xué)

R25中醫(yī)內(nèi)科

R26中醫(yī)外科

R271中醫(yī)婦產(chǎn)科

R272中醫(yī)兒科

R273中醫(yī)腫瘤科

R274中醫(yī)骨傷科

R275中醫(yī)皮科

R276中醫(yī)五官科

R277中醫(yī)其他學(xué)科

R278中醫(yī)急癥學(xué)

R28中藥學(xué)

R29中國少數(shù)民族醫(yī)學(xué)2024/10/2922第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫R3基礎(chǔ)醫(yī)學(xué)

R31醫(yī)用一般科學(xué)

R32人體形態(tài)學(xué)

R33人體生理學(xué)

[R34]人體生物化學(xué)、分子生物學(xué)

[R35]人體生物物理學(xué)

R36病理學(xué)

R38醫(yī)學(xué)寄生蟲學(xué)

R392醫(yī)學(xué)免疫學(xué)

R394醫(yī)學(xué)遺傳學(xué)

R395醫(yī)學(xué)心理學(xué)、病理心理學(xué)2024/10/2923第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫R4臨床醫(yī)學(xué)

R44診斷學(xué)

R45治療學(xué)

R47護(hù)理學(xué)

R48臨終關(guān)懷學(xué)

R49康復(fù)醫(yī)學(xué)2024/10/2924第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.2數(shù)字文獻(xiàn)的檢索技術(shù)1.2.1布爾邏輯檢索技術(shù)1.2.2截詞檢索技術(shù)1.2.3位置檢索技術(shù)1.2.4字段檢索技術(shù)2024/10/2925第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.2.1布爾邏輯檢索技術(shù)檢索詞:是單字匹配?還是詞組匹配?或者是句子匹配?舉例:《私營企業(yè)人力資源研究》如何檢索?布爾邏輯檢索是指通過標(biāo)準(zhǔn)的布爾邏輯關(guān)系算符來表達(dá)檢索詞與檢索詞間的邏輯關(guān)系的檢索方法主要的布爾邏輯關(guān)系詞有:邏輯與(AND)、邏輯或(OR)、邏輯非(NOT)2024/10/2926第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫邏輯與邏輯與也稱邏輯乘:使用符號“and”

或“*”表示所連接的兩個檢索詞必須同時出現(xiàn)在結(jié)果中才滿足檢索條件。檢索式可表達(dá)為:AandB或A*B。如“圖書館and服務(wù)”,要求結(jié)果必須同時包含“圖書館”和“服務(wù)”。使用“邏輯與”技術(shù),可以增加限制條件,縮小檢索范圍,增強檢索的專指性,提高信息檢索的查準(zhǔn)率。檢索式中,邏輯與連接的檢索詞越多,檢索結(jié)果就越少。2024/10/2927第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫邏輯或邏輯或也稱邏輯和:使用符號“or”或“+”表示所連接的兩個檢索詞中任意一個出現(xiàn)在結(jié)果中就滿足檢索條件。檢索式可表達(dá)為:AorB或A+B如“文獻(xiàn)or知識”,要求結(jié)果包含“文獻(xiàn)”或包含“知識”或同時包含“文獻(xiàn)”和“知識”。使用“邏輯或”技術(shù),常用于連接同義詞、相關(guān)詞等,可以擴(kuò)大檢索范圍,防止漏檢,提高信息檢索的查全率。2024/10/2928第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫邏輯非邏輯非也稱邏輯差:使用符號“not”或“-”表示所連接的兩個檢索詞中應(yīng)從第一個概念中排除第二個概念。檢索式可表達(dá)為:AnotB或A-B如“文獻(xiàn)not圖書”,要求結(jié)果必須包含“文獻(xiàn)”但不包含“圖書”。使用“邏輯非”技術(shù),可以剔除不需要的概念,縮小檢索范圍,提高信息檢索的查準(zhǔn)率;但這種方式也會排除掉相關(guān)信息,影響檢索信息的查全率。2024/10/2929第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫舉例例如檢索:“打印機驅(qū)動程序”查詢關(guān)鍵詞:打印機、驅(qū)動程序檢索表達(dá)式:打印機*驅(qū)動程序例如檢索:“微型計算機”方面的有關(guān)信息查詢關(guān)鍵詞:微型計算機、微機檢索表達(dá)式:微型計算機+微機2024/10/2930第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫舉例例:檢索“唐宋詩歌”的有關(guān)信息關(guān)鍵詞:唐、宋、詩歌;檢索表達(dá)式:(唐+宋)*詩歌;唐*詩歌+宋*詩歌;錯誤表達(dá)式:唐+宋*詩歌;唐*宋*詩歌;唐+宋+詩歌;唐*宋+詩歌;2024/10/2931第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫注意布爾邏輯檢索技術(shù)應(yīng)用非常廣泛,但在實現(xiàn)方式上有所差異,即所使用的邏輯符號可能是不同的。一些檢索工具會完全省略任何符號和關(guān)系,直接把布爾邏輯關(guān)系隱含在菜單中。一些搜索引擎甚至用“︺、,、-”(即空格、逗號、減號)來表示。一般情況下請按以下規(guī)則使用邏輯符號,但并非所有數(shù)據(jù)庫和搜索引擎都是如此,具體請參考所用數(shù)字資源。中文數(shù)據(jù)庫用:*+-andornot西文數(shù)據(jù)庫用:andornot搜索引擎用:︺,-2024/10/2932第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.2.2截詞檢索技術(shù)主要應(yīng)用于西文數(shù)字資源的檢索定義:是指在檢索式中用專門的符號(截詞符號)表示檢索詞的某一部分允許有一定的詞形變化。原因:在檢索中,常會遇到一些詞干相同、詞義相近的檢索詞或有英、美不同拼寫法的詞。作用:為使檢索時不遺漏相關(guān)詞,擴(kuò)大檢索范圍,提高查全率,常使用截詞檢索。截詞符一般用“?”、“*”、“$”和“!”等,不同的系統(tǒng),不同的數(shù)據(jù)庫,其代表的含義可能有所不同。截詞方式根據(jù)截詞的位置不同,分為前截斷、后截斷、前后截斷和中截斷;根據(jù)截斷的數(shù)量不同,分為有限截斷和無限截斷。2024/10/2933第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫截詞位置前截斷(左截斷、后方一致):允許檢索詞前有若干變化。如*physics就可檢索到physics、astrophysics、biophysics、chemophysics、geophysics等詞的結(jié)果。后截斷(右截斷、前方一致):允許檢索詞尾有若干變化。如comput*將檢索出computer、computing、computerised、computerized、computerization等結(jié)果。前后截斷(中間一致):詞干的前后各有一個截詞符,允許檢索詞的前端和尾部各有若干變化形式。如*computer*可檢索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等結(jié)果。中間截斷(前后一致):允許檢索詞中間有若干變化。例如wom*n可檢索出woman、women。英美的不同拼法,defen*e可檢索出defence、和defense的結(jié)果。2024/10/2934第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫請注意在不同的數(shù)據(jù)庫和聯(lián)機檢索系統(tǒng)中,所使用的截詞符號沒有統(tǒng)一的標(biāo)準(zhǔn),有的用“?”,有的用“*”,有的用“#”,用的用“$”等。即便常用的“?”和“*”在不同的數(shù)據(jù)庫中其用法也是不一定相同的。在允許截詞的檢索工具中,一般是指后截斷,部分支持中間截斷,左截斷比較少見。我們將要使用的一些數(shù)據(jù)庫,一般用“?”代表一個字符,用“*”代表任意一個字符串。2024/10/2935第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.2.3鄰近檢索技術(shù)

鄰近檢索又稱位置檢索,主要是通過檢索式中的專門符號來規(guī)定檢索詞在結(jié)果中的相對位置。例如檢索“生物防治”的文獻(xiàn),若用檢索式:

“biologicalandcontrol”檢索,則會將“抑制生物”

“controlbiological”的文獻(xiàn)也查出來,這顯然不是所需文獻(xiàn)。主要有相鄰位置算符(W)、(nW)、(N),(nN)2024/10/2936第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.(W)算符(W)算符:表示此算符兩側(cè)的檢索詞必須按此前后順序相鄰排列,詞序不可變,且兩詞之間不許有其他的詞或字母,但允許有一空格或標(biāo)點符號。如biological(W)control

相當(dāng)于檢索biologicalcontrolCD(W)ROM相當(dāng)于檢索CDROM或CD-ROM。

2024/10/2937第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫2.(nW)算符(nW)算符:(nW)是nwords的縮寫,表示此算符兩側(cè)的檢索詞之間允許插入最多n個詞,且詞序不可變。如wear(1W)material相當(dāng)于檢索wearmaterials、wearofmaterials等詞。2024/10/2938第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫3.(N)和(nN)算符(N)是near的縮寫,表示此算符兩側(cè)的檢索詞必須緊密相連,詞序可變,詞間不允許插入其他詞或字母,但允許有一空格或標(biāo)點符號。(nN)表示兩詞間可插入最多n個詞,詞序可變,如檢索式environment(2N)protection就可檢索出包含“environmentprotection”、“environmentoftheprotection”、“environmentofwaterprotection”、“protectionofforestenvironment”等內(nèi)容的結(jié)果Information(1N)retrieval

可檢出:informationretrievalretrivealofinformation2024/10/2939第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫請注意

鄰近檢索對提高檢索的查全率和查準(zhǔn)率有重要作用。不同的系統(tǒng),不同的數(shù)據(jù)庫,截詞符號雖然含義相同,但形式可能有所不同。①有的可能有括號,有的可能沒有。②小寫n有時在大寫的W、N前面,有時在大寫的W、N后面。③常見的形式有:(W)、W、();(N)、N;(nW)、nW、(Wn)、Wn;(nN)、nN、(Nn)、Nn;2024/10/2940第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.2.4字段檢索技術(shù)字段檢索是限定檢索詞在記錄中出現(xiàn)的字段范圍,檢索時,計算機只對限定字段進(jìn)行查找。基本檢索字段及代碼主要有:如題名(TI)、主題詞/敘詞(DE)、文摘(AB)和ID(標(biāo)識詞)等,適用于所有數(shù)據(jù)庫。一般基本檢索字段放在檢索詞(或檢索式)后,用“/”、“:”或“in”等連接。輔助檢索字段及代碼主要有:作者(AU)、語種(LA)、刊名(JN)、來源出版物(SO)、出版年代(PY)和文獻(xiàn)類型(DT)等。輔助檢索字段放在檢索詞(或檢索式)前,用“=”、“>=”、“<=”、“>”或“<”等連接。注意:不同的數(shù)據(jù)庫其字段代碼可能不同。2024/10/2941第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫字段代碼表西文數(shù)據(jù)庫常用字段字段代碼中文數(shù)據(jù)庫常用字段AbstractsAB文摘、摘要Author/CorporateSourceAU/CS作者、著者/機構(gòu)Descriptor、Subject、TopicDE、SU、TO敘詞/主題詞DocumentType、PublicationTypeDT、PT文獻(xiàn)類型、出版物類型Full-textFT全文ISBN、ISSNBN、SN國際標(biāo)準(zhǔn)書號、刊號JournalNameJN刊名KeywordKW、KY關(guān)鍵詞LanguageLA語種PublicationYearPY出版年SourceSO來源TitleTI題名、標(biāo)題2024/10/2942第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.3數(shù)字文獻(xiàn)的檢索策略檢索策略就是在分析信息需求內(nèi)容實質(zhì)的基礎(chǔ)上,為實現(xiàn)檢索目標(biāo)而制定的一個合理的檢索方案。1.3.1信息需求分析1.3.2數(shù)據(jù)庫的選擇1.3.3檢索詞的確定1.3.4檢索表達(dá)式的構(gòu)造2024/10/2943第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.3.1信息需求分析1.明確檢索目的2.分析所需信息學(xué)科屬性和主題概念3.確定檢索的信息類型和時間范圍2024/10/2944第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.3.2數(shù)據(jù)庫的選擇數(shù)據(jù)庫選擇要考慮所選擇數(shù)據(jù)庫是否與信息需求結(jié)合緊密、學(xué)科專業(yè)對口、覆蓋信息面廣、報道及時、揭示信息內(nèi)容準(zhǔn)確以及檢索功能是否完善等問題。具體選擇數(shù)據(jù)庫可借鑒國外稱之為“4C”的原則:①內(nèi)容(Content)。②范圍(Coverago)。③時效(Currency)。④費用(Cost),了解所選數(shù)據(jù)庫的收費標(biāo)準(zhǔn)。2024/10/2945第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.3.3檢索詞的確定確定檢索詞要考慮滿足課題檢索要求和數(shù)據(jù)庫輸入詞的要求,檢索詞選擇得恰當(dāng)與否,會直接影響檢索效果。檢索詞可分為四類:一是表示主題的檢索詞,如標(biāo)題詞、單元詞、敘詞或關(guān)鍵詞。二是表示作者的檢索詞,如作者姓名、機構(gòu)名等。三是表示分類的檢索詞,如分類號等。四是表示特殊意義的檢索詞。如專利號、ISBN號、ISSN號或分子式等。檢索詞的選擇與確定需要遵循下列兩個原則。第一,根據(jù)檢索課題所涉及的學(xué)科內(nèi)容選詞。第二,對檢索詞進(jìn)行處理。2024/10/2946第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.3.4檢索表達(dá)式的構(gòu)造檢索表達(dá)式是檢索策略的邏輯表達(dá)式,是用來表達(dá)用戶檢索提問的,由基于檢索概念產(chǎn)生的檢索詞和各種檢索算符組配構(gòu)成,確定檢索詞之間的概念關(guān)系和位置關(guān)系,準(zhǔn)確表達(dá)課題需求的內(nèi)容。檢索表達(dá)式需要能夠完整而準(zhǔn)確地反映用戶需求的主題內(nèi)容,適應(yīng)所查數(shù)據(jù)庫的索引體系和檢索用詞規(guī)則,同時必須符合檢索系統(tǒng)的概念及限制條件的規(guī)定。在檢索式的構(gòu)造中,檢索算符主要包括前面提到過的布爾邏輯算符、截詞算符、位置算符、字段算符以及括號等。不同的數(shù)據(jù)庫往往采用不同的符號或文字來描述詞與詞之間的組配關(guān)系。2024/10/2947第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.4檢索效果評價1.4.1概述1.4.2查全率1.4.3查準(zhǔn)率2024/10/2948第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.4.1概述一個理想的檢索系統(tǒng),應(yīng)該是用戶需要什么信息,它就能向用戶提供什么信息;用戶需要多少信息,它就能提供多少信息;其檢索結(jié)果不多也不少,而又使用方便,反饋信息的速度也很快。但是,目前實現(xiàn)這樣的檢索系統(tǒng)還存在許多困難。實際上,檢索效果就是看檢索出的相關(guān)文獻(xiàn)或信息有多少。不同的檢索系統(tǒng),其檢索效果是不一樣的。同樣的檢索系統(tǒng),如果具有不同的檢索能力,其檢索效果也是不一樣的。對檢索效果進(jìn)行評價,就能為改善檢索系統(tǒng)性能提供明確的參考依據(jù),進(jìn)而更有效地滿足用戶的信息需求。對檢索系統(tǒng)進(jìn)行評價時,其判定檢索效果的主要指標(biāo)是查全率和查準(zhǔn)率。2024/10/2949第一章數(shù)字文獻(xiàn)檢索基礎(chǔ)庫1.4.2查全率查全率,是指檢索系統(tǒng)檢出的與某課題相關(guān)的文獻(xiàn)信息數(shù)量與檢索系統(tǒng)中實際與該課題相關(guān)的文獻(xiàn)信息總量之比。當(dāng)進(jìn)行檢索時,檢索系統(tǒng)把文獻(xiàn)分成兩部分,一部分是與檢索策略相匹配的文獻(xiàn),并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論