計算機檢索2月新版_第1頁
計算機檢索2月新版_第2頁
計算機檢索2月新版_第3頁
計算機檢索2月新版_第4頁
計算機檢索2月新版_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1計算機文獻信息檢索計算機文獻信息檢索 概論概論陳路平老師主講陳路平老師主講(授課新版授課新版3)2016.2.05 2計算機文獻信息檢索發(fā)展簡介計算機文獻信息檢索發(fā)展簡介 計算機文獻信息檢索計算機文獻信息檢索始于始于50年代,年代,1954年美國年美國海軍武器實驗所(海軍武器實驗所(NOTS)使用)使用IBM701型電子型電子管計算機建成了管計算機建成了世界上第一個世界上第一個信息檢索系統(tǒng),信息檢索系統(tǒng), 利用利用IBM701型電子管計算機把文獻號碼和型電子管計算機把文獻號碼和少量索引詞存貯在計算機中,少量索引詞存貯在計算機中,(1).檢索結果檢索結果是是文獻號碼,后在文獻號碼,后在1958

2、年經(jīng)過改進,年經(jīng)過改進,(2).檢索結果檢索結果可以是可以是文摘、題錄文摘、題錄和和作者等項目。作者等項目。3從從20世紀世紀50年代初計算機文獻信息檢索經(jīng)歷了年代初計算機文獻信息檢索經(jīng)歷了 以下以下四個四個階段階段。1.實驗研究階段實驗研究階段 (1950-1954年年)2.脫機檢索階段脫機檢索階段 (1954-1964年)年)3.聯(lián)機檢索階段聯(lián)機檢索階段 (1965-1972年年4.國際網(wǎng)絡檢索階段(國際網(wǎng)絡檢索階段(1973年年-至今)至今) (一)(一)實驗研究階段(實驗研究階段(1950-1954年)年) 這段時期圖書情報界利用計算機進行編制索引、這段時期圖書情報界利用計算機進行編制

3、索引、自動分類等研究,其自動分類等研究,其目的目的是使圖書館工作自動化。是使圖書館工作自動化。4(二)(二)脫機檢索階段脫機檢索階段(1954-1964年)年) 這一階段通過計算機這一階段通過計算機貯存貯存二次文獻二次文獻和和收錄文獻的范收錄文獻的范圍越來越廣,如書目索引圍越來越廣,如書目索引和和累計索引等數(shù)據(jù)庫,用戶可累計索引等數(shù)據(jù)庫,用戶可以對已存入計算機中以對已存入計算機中文獻信息文獻信息進行進行定題檢索定題檢索和和回溯檢索回溯檢索 當時這種定題檢索當時這種定題檢索和和回溯檢索為回溯檢索為脫機檢索脫機檢索也稱為也稱為批批處理檢索。處理檢索。 特點特點:只能由:只能由專業(yè)人員專業(yè)人員 操作

4、操作 缺點缺點:(1)檢索人員為了節(jié)約費用,每隔二至三檢索人員為了節(jié)約費用,每隔二至三周才做一次檢索,用戶不能及時拿到檢索結果。周才做一次檢索,用戶不能及時拿到檢索結果。 (2)批處理檢索是一種封閉式檢索,用戶批處理檢索是一種封閉式檢索,用戶與檢索人員之間無任何反饋信息,并無法和計算機對話。與檢索人員之間無任何反饋信息,并無法和計算機對話。專業(yè)人員專業(yè)人員5 (三(三)聯(lián)機檢索階段)聯(lián)機檢索階段(1965-1972年)年) 這一階段,由于第三代集成電路計算機這一階段,由于第三代集成電路計算機 的產(chǎn)生與發(fā)展和高的產(chǎn)生與發(fā)展和高密度大容量貯存器密度大容量貯存器-硬磁盤硬磁盤及及磁盤機磁盤機的出現(xiàn),

5、再加上數(shù)字通訊的出現(xiàn),再加上數(shù)字通訊技術的發(fā)展和分組交換公用數(shù)據(jù)通信網(wǎng)的普及,使得情報檢索技術的發(fā)展和分組交換公用數(shù)據(jù)通信網(wǎng)的普及,使得情報檢索從脫機、批處理階段從脫機、批處理階段進入進入聯(lián)機檢索階段。聯(lián)機檢索階段。 與與脫機檢索階段相脫機檢索階段相比較比較,聯(lián)機檢索階段,聯(lián)機檢索階段具有具有以下以下特征特征: (1)采用大、中型計算機,文獻檢索)采用大、中型計算機,文獻檢索 實行分時實行分時 處理,人機可直接對處理,人機可直接對話,能及時得到檢索結果話,能及時得到檢索結果; (2)終端用戶可以檢索)終端用戶可以檢索到到多個文獻數(shù)據(jù)庫多個文獻數(shù)據(jù)庫; (3)雖然在該階段出現(xiàn)了計算機網(wǎng)絡,但規(guī)模

6、不夠大,大多是集中式)雖然在該階段出現(xiàn)了計算機網(wǎng)絡,但規(guī)模不夠大,大多是集中式的,聯(lián)機檢索的,聯(lián)機檢索受到受到地區(qū)的限制。地區(qū)的限制。 6(四)四)國際網(wǎng)絡檢索階段國際網(wǎng)絡檢索階段(1973年年-至今)至今) 隨著空間技術隨著空間技術和和遠程通信技術的發(fā)展,計算機文獻信息檢遠程通信技術的發(fā)展,計算機文獻信息檢索進入了新階段,由于衛(wèi)星通訊技術索進入了新階段,由于衛(wèi)星通訊技術和和光纖通訊技術的實用化,光纖通訊技術的實用化,使得計算機文獻檢索沖破時間和空間的限制,為快速全面地獲使得計算機文獻檢索沖破時間和空間的限制,為快速全面地獲取全球性科技文獻信息資料提供了非常方便的條件,從而極大取全球性科技文獻

7、信息資料提供了非常方便的條件,從而極大地提高了文獻資料的可獲得性和利用價值,實現(xiàn)文獻資料共享地提高了文獻資料的可獲得性和利用價值,實現(xiàn)文獻資料共享性。性。 國際網(wǎng)絡檢索階段具有以下國際網(wǎng)絡檢索階段具有以下特點特點: (1)最顯著特征是網(wǎng)絡性質不再是集中式的,而是分布網(wǎng)絡結構;)最顯著特征是網(wǎng)絡性質不再是集中式的,而是分布網(wǎng)絡結構; (2)實現(xiàn)了真正意義上的資源共享,任何一個終端上的用戶都可檢索)實現(xiàn)了真正意義上的資源共享,任何一個終端上的用戶都可檢索到網(wǎng)絡中的任何一個數(shù)據(jù)庫,提高了文獻信息的利用率;到網(wǎng)絡中的任何一個數(shù)據(jù)庫,提高了文獻信息的利用率; (3)計算機儲存容量的不斷增大,使得文獻信息

8、存貯量增多,能節(jié)約)計算機儲存容量的不斷增大,使得文獻信息存貯量增多,能節(jié)約資金投資。資金投資。 7 信息高速公路信息高速公路 20世紀世紀50年代,美國建成了遍布全國的高速公路網(wǎng),對加年代,美國建成了遍布全國的高速公路網(wǎng),對加速美國商品、勞務人員流通發(fā)揮了極其巨大的作用,推動了美速美國商品、勞務人員流通發(fā)揮了極其巨大的作用,推動了美國和周邊國家的經(jīng)濟發(fā)展,至今高速公路網(wǎng)仍是美國現(xiàn)代經(jīng)濟國和周邊國家的經(jīng)濟發(fā)展,至今高速公路網(wǎng)仍是美國現(xiàn)代經(jīng)濟的基礎。的基礎。1993年克林頓就任美國總統(tǒng)后,提出建立年克林頓就任美國總統(tǒng)后,提出建立“國家信息國家信息基礎設施(基礎設施(National Inform

9、ation Infrasture)計劃)計劃”, 簡稱簡稱NII。其計劃歸納為三點其計劃歸納為三點: (1)鋪設覆蓋美國的光纖網(wǎng)絡。鋪設覆蓋美國的光纖網(wǎng)絡。 (2)用光纖網(wǎng)絡連接所有的通信系統(tǒng)、計算機資料庫和電用光纖網(wǎng)絡連接所有的通信系統(tǒng)、計算機資料庫和電信消費設施。信消費設施。 (3)讓光纖網(wǎng)絡能傳輸視頻、音頻、數(shù)字、圖象等多媒體讓光纖網(wǎng)絡能傳輸視頻、音頻、數(shù)字、圖象等多媒體信息。信息。 信息高速公路信息高速公路主要主要由:由:通信網(wǎng)絡、通信設備通信網(wǎng)絡、通信設備和和通信資源通信資源三部分組成。三部分組成。 通信網(wǎng)絡通信網(wǎng)絡和和通信設備通信設備構成構成寬廣平坦的路面寬廣平坦的路面,信息資源,

10、信息資源就是公路上行駛的車輛就是公路上行駛的車輛,三者構成一個有機的整體三者構成一個有機的整體。8信息高速公路主要由信息高速公路主要由(三部分組成三部分組成)1.通信網(wǎng)絡、通信網(wǎng)絡、2.通信設備、通信設備、3.通信資源、通信資源、 通信網(wǎng)絡通信網(wǎng)絡 和和 通信設備通信設備 -構成寬廣平坦的路面,構成寬廣平坦的路面, 信息資源就是公路上行駛的車輛,信息資源就是公路上行駛的車輛, 三者構成一個有機的整體三者構成一個有機的整體。 信息高速公路將對社會經(jīng)濟,人們的工作和社會模式以及信息高速公路將對社會經(jīng)濟,人們的工作和社會模式以及教育、科研等產(chǎn)生深遠的影響教育、科研等產(chǎn)生深遠的影響。9計算機檢索基礎計

11、算機檢索基礎一、計算機文獻信息檢索的定義計算機文獻信息檢索的定義 計算機文獻信息檢索計算機文獻信息檢索: 就是利用計算機對信息的存貯和檢索。 或者說,利用計算機對信息和數(shù)據(jù)的高速處理能力來存貯數(shù)據(jù),并從中查找、取出數(shù)據(jù)這樣一個過程。 存貯檢索檢索與10(1)信息信息的的存貯過程存貯過程: 就是將大量分散的文獻資料進行收集、整理、評價、選擇、標引、編寫文摘、著錄等,直到輸入計算機,建立起計算機可以閱讀和分析處理的數(shù)據(jù)庫的過程。 (2)信息信息的的檢索過程檢索過程: 就是將用戶提出的查詢要求,賦予一定的檢索標識,按照一定的要求輸入 到計算機中,由計算機系統(tǒng)對其進行處理,并與已存貯在計算機中的信息進

12、行運算、匹配,最后將檢索結果按用戶要求輸出。11 文獻收集文獻收集文獻加工文獻加工 文獻輸入文獻輸入數(shù)據(jù)庫數(shù)據(jù)庫計算機文獻信息檢索系統(tǒng)計算機文獻信息檢索系統(tǒng)檢檢索索結結果果提問文獻提問文獻提問輸入提問輸入提問表述提問表述用戶查詢用戶查詢示意圖示意圖存存 貯貯 檢索檢索12二、計算機文獻信息檢索系統(tǒng)的構計算機文獻信息檢索系統(tǒng)的構成成 計算機文獻信息檢索系統(tǒng)計算機文獻信息檢索系統(tǒng)主要由主要由:計算機硬件,軟件,數(shù)據(jù)庫:計算機硬件,軟件,數(shù)據(jù)庫構成構成。 (一)(一)硬件硬件 計算機計算機硬件硬件是指進行信息輸入、輸出、存貯、運算和傳遞是指進行信息輸入、輸出、存貯、運算和傳遞的實體(包括以計算機為中

13、心的一系列機器設備),它可以的實體(包括以計算機為中心的一系列機器設備),它可以是大、中、小型計算機,也可以是微機、打印機及電源設備是大、中、小型計算機,也可以是微機、打印機及電源設備和通信設備及網(wǎng)絡系統(tǒng)等,其中影響檢索系統(tǒng)功能的是和通信設備及網(wǎng)絡系統(tǒng)等,其中影響檢索系統(tǒng)功能的是CPU的運算速度,內外存容量。的運算速度,內外存容量。 (二)(二)軟件軟件 計算機計算機軟件軟件又叫計算機程序,是指控制計算機進行各種作又叫計算機程序,是指控制計算機進行各種作業(yè)的一系列指令和進行業(yè)的一系列指令和進行“人機對話人機對話”及各種數(shù)據(jù)的存貯和傳及各種數(shù)據(jù)的存貯和傳輸?shù)妮數(shù)摹胺g翻譯”規(guī)則。計算機軟件包括系

14、統(tǒng)軟件和應用系統(tǒng)軟規(guī)則。計算機軟件包括系統(tǒng)軟件和應用系統(tǒng)軟件等。件等。 13(三)電子信息源電子信息源 1、數(shù)據(jù)庫(數(shù)據(jù)庫(Database)- 重點掌握重點掌握 (1)數(shù)據(jù)庫的定義數(shù)據(jù)庫的定義 數(shù)據(jù)庫數(shù)據(jù)庫: 是一種計算機能夠閱讀并處理的文字型是一種計算機能夠閱讀并處理的文字型或或數(shù)字型數(shù)據(jù)數(shù)字型數(shù)據(jù)的的集合體集合體。 或者說或者說: 數(shù)據(jù)庫是以特定的組織方式將相互關聯(lián)的數(shù)據(jù)集合、數(shù)據(jù)庫是以特定的組織方式將相互關聯(lián)的數(shù)據(jù)集合、存貯的總匯存貯的總匯。 計算機文獻信息檢索系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)庫是一定專業(yè)范圍內信息記錄及其索引的集合體。 一個一個 數(shù)據(jù)庫數(shù)據(jù)庫 相當于相當于 一種一種 書本式書本式 手工

15、檢索手工檢索工具工具。 數(shù)據(jù)庫記錄字段14文獻數(shù)據(jù)庫結構文獻數(shù)據(jù)庫結構:存取號 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .標題著者刊名 卷期 頁碼 出版年 類型 文種 主題詞 文摘010001010002010003Han qdMa dlHan jsEngEngChina 腫瘤基因心血管neoplasm cancer tumor carcinoma15計算機檢索原理計算機檢索原理順排文檔順排文檔:數(shù)據(jù)庫中全部記錄按一定順序排列而成的文獻記錄集合。順排文檔順排文檔(Sequential File)是大量記錄)

16、是大量記錄(Records)的集合,的集合,按文獻紀錄按文獻紀錄入編的存取入編的存取號號從小從小到到大依次排列大依次排列的的目錄式文檔。目錄式文檔。它相當于它相當于印刷型手工檢索工具的正文題錄印刷型手工檢索工具的正文題錄或或文摘部分。文摘部分。16倒排文檔倒排文檔:將數(shù)據(jù)庫中記錄的全部文獻特征特征標識按一 定順序排列而成的文獻記錄集合。倒排文檔倒排文檔(Inverted File) 是是從從順排文檔記錄中順排文檔記錄中抽出抽出的的每一個每一個文獻特征文獻特征的標識的標識作為作為存貯單元,存貯單元,并按某種順序排列并按某種順序排列(字順、分類號、(字順、分類號、序號)排列,同時在每一個標識后面注

17、明相應的文獻序號)排列,同時在每一個標識后面注明相應的文獻紀錄存取號。紀錄存取號。不同類型的標識可形成不同的倒排文檔,不同類型的標識可形成不同的倒排文檔,-如如著者著者倒排文檔倒排文檔(即著者索引)、(即著者索引)、 主題主題倒排文檔倒排文檔(即主題索引)等等。(即主題索引)等等。17倒排文檔:倒排文檔:著者倒排文檔著者文種主題詞010001010002Ma dlHan jsEngEngChina腫瘤心血管基因Han qd存取號010003 . . . . . . . . . . . . . . . . . . 010001010002存取號010003010001010002存取號01000

18、3主題主題詞倒排文檔文種文種倒排文檔18 數(shù)據(jù)庫是計算機信息檢索系統(tǒng)中的重要組成部分數(shù)據(jù)庫是計算機信息檢索系統(tǒng)中的重要組成部分,是信息源,是檢索的是信息源,是檢索的對象。對象。 (2)數(shù)據(jù)庫的結構數(shù)據(jù)庫的結構:(文檔文檔.、字段字段、) 數(shù)據(jù)庫數(shù)據(jù)庫由由1至至數(shù)個數(shù)個文檔文檔構成,構成,文檔文檔(File)是由存貯在磁)是由存貯在磁帶、磁盤或光盤等帶、磁盤或光盤等載體上載體上的一條條記錄組成。的一條條記錄組成。 就就書目數(shù)據(jù)庫書目數(shù)據(jù)庫而言,一條文獻記錄(而言,一條文獻記錄(Record)就是一篇)就是一篇文章,一本書或一種雜志文章,一本書或一種雜志 的的 描述體。描述體。 構成構成記錄記錄的

19、的基本基本單位單位為為字段字段。 記錄由一系列記錄由一系列字段字段組成,組成,如如主題詞、文摘、著者等。主題詞、文摘、著者等。 紀錄紀錄( Records )是數(shù)據(jù)庫中一個完整的信息單元,由)是數(shù)據(jù)庫中一個完整的信息單元,由一系列字段一系列字段(Fields)構成。)構成。-相當于手檢工具的題錄相當于手檢工具的題錄或或文摘文摘。 構成記錄的基本單位為字段。構成記錄的基本單位為字段。19字段字段(Field)是數(shù)據(jù)庫的基本元件)是數(shù)據(jù)庫的基本元件, 也叫數(shù)據(jù)元也叫數(shù)據(jù)元(Data Element)。)。 字段字段的實體就是文獻著錄中的的實體就是文獻著錄中的“項項”,它反映一條記錄,它反映一條記錄

20、中中各著錄項的屬性,各著錄項的屬性,如如:著者著者項項、篇名、篇名項項、出處、出處項項等。等。有些字段有些字段還被分為還被分為-幾個幾個子字段子字段(Subfield),), 如如來源(來源(Source)字段,)字段,被劃分被劃分為為刊名,出版年、頁碼刊名,出版年、頁碼等等子字段。子字段。子字段子字段: 刊名,出版年、頁碼等刊名,出版年、頁碼等為為子字段。子字段。20字段字段(Fields) 是著錄文獻各項的名稱及其內容,是著錄文獻各項的名稱及其內容,是描述文獻內容外特征的各項標識內容。是描述文獻內容外特征的各項標識內容。字段字段 相當于題錄相當于題錄或或文摘中的各項目名稱文摘中的各項目名稱

21、, 如如: 題名題名(TI)、)、著者著者(AU )、地址地址(AD)、出處出處(SO)、主題詞主題詞(MESH主要主題詞主要主題詞(MMH,MJMH)、 關鍵詞關鍵詞(KW)、特征詞、特征詞(TG)、 出版年出版年(PY)、語種語種(LA)、摘要(摘要(AB)等等。等等。CBMDISC光盤檢索光盤檢索(CBMLARS的使用的使用)標識符標識符字段名稱字段名稱 注釋注釋 屬性屬性AA 著者文摘著者文摘AB 文摘文摘 AD 地址地址 (第一著者地址第一著者地址)AD1 國省市名國省市名 (第一著者省市名第一著者省市名)AF 原文出處原文出處 (譯文原文出處譯文原文出處)AU 著者著者CA 索取號

22、索取號 (醫(yī)情所會議、匯編內部編碼醫(yī)情所會議、匯編內部編碼)CN 國內代碼國內代碼 (國內期刊代碼國內期刊代碼) 22標識符標識符字段名稱字段名稱 注釋注釋 屬性屬性CL 分類號分類號CT 特征詞特征詞 FS 資助類別資助類別ID 資助編號資助編號IS ISSN (國際期刊代碼國際期刊代碼)JC 內部代碼內部代碼 (醫(yī)情所期刊內部代碼醫(yī)情所期刊內部代碼)LA 語種語種 (缺省值為中文缺省值為中文)MA 會議地點會議地點MH 主題詞主題詞標識符標識符字段名稱字段名稱 注釋注釋 屬屬性性(MMH) MMH (主要概念主題詞主要概念主題詞)NI 團體著者團體著者PA 分冊分冊PG 頁碼頁碼IP 期期

23、PP 出版地出版地 (期刊出版地期刊出版地)PY 出版年出版年PT 文獻類型文獻類型24標識符標識符字段名稱字段名稱 注釋注釋 屬性屬性RF 參文數(shù)參文數(shù) (參考文獻數(shù)參考文獻數(shù))(SO) 出處出處 (復合字段復合字段:TA,PY,VI,IP,PG)SU 增刊增刊TA 期刊名稱期刊名稱 TI 中文題目中文題目 TT 英文題目英文題目TW 關鍵詞關鍵詞 VI 卷卷UI 流水號流水號25 標識符標識符 字段名稱字段名稱 屬性屬性 TI Title(篇名) AU Author(著者) AD Address of Author(著者通訊地址) SO Source(文獻來源) PY Publicatio

24、n Year(出版年) * LA Language(文獻語種) * CP Country of Publication(出版國家) * AB Abstract(摘要) 26 XREC Record Features(記錄特征記錄特征) * MESH Medical Subject Headings(醫(yī)學主題詞醫(yī)學主題詞) MIME Minor MeSH Headings(次要次要MeSH詞詞) MJME Major MeSH Headings(主要主要MeSH詞詞) SH Subheadings(副主題詞副主題詞) * PS Personal Name as Subject(人名作為主題詞人名

25、作為主題詞) CN Contract or Grant Numbers(合同號或資助號合同號或資助號) RN CAS Registry Number(化學物質登記號或酶號化學物質登記號或酶號)27 標識符標識符 字段名稱字段名稱 屬性屬性 NM Name of Substance(物質名稱物質名稱) IS International Standard Serial Number (國際標準刊號國際標準刊號) * TG Checktags(特征詞特征詞) * AN Accession Number(存取號存取號) * UD Update code(更新代碼更新代碼) * SI Secondary

26、 Source Identifier(第二文獻來源標識第二文獻來源標識) SB Subset(MEDLINE子集子集) * CM Comments(評論評論) GS Gene Symbol(基因符號基因符號) PT Publication Type(出版類型出版類型) *帶帶*號為限制性字段,其它為號為限制性字段,其它為“基本字段或默認字段基本字段或默認字段”28= (等于等于) PY=1992 (小于小于) PY ( 大于大于) PY1992 出版年出版年1992= (小于等于小于等于) PY=1984 出版年出版年= (大于等于大于等于) PY=1992 出版年出版年=1992 (指定范圍

27、指定范圍) PY=1990-1992 出版年出版年=1990-199229限制檢索限制檢索: 全部字段全部字段: 腫瘤腫瘤 in all 限定符限定符 in 和和 = 的使用:的使用: in 可用于可用于全部字段全部字段 = 只能用于只能用于某些字段某些字段30計算機檢索的基本知識計算機檢索的基本知識數(shù)據(jù)庫數(shù)據(jù)庫記錄與字段記錄與字段數(shù)據(jù)庫類型數(shù)據(jù)庫類型31基本知識基本知識:數(shù)據(jù)庫數(shù)據(jù)庫l存儲在計算機相關設備的數(shù)據(jù)集合。存儲在計算機相關設備的數(shù)據(jù)集合。l設備:磁帶、磁盤(硬盤、軟盤)、設備:磁帶、磁盤(硬盤、軟盤)、光盤等。光盤等。32數(shù)據(jù)庫結構數(shù)據(jù)庫結構l記錄:構成數(shù)據(jù)庫的信息單元記錄:構成數(shù)

28、據(jù)庫的信息單元l字段:一條記錄字段:一條記錄中中各個數(shù)據(jù)項。各個數(shù)據(jù)項。標題:標題:作者:作者:地址:地址:文摘:文摘:各個字段各個字段33 (3)數(shù)據(jù)庫的分類數(shù)據(jù)庫的分類 據(jù)統(tǒng)計,目前世界上有近萬種數(shù)據(jù)庫。數(shù)據(jù)一般依存貯對象區(qū)分為:據(jù)統(tǒng)計,目前世界上有近萬種數(shù)據(jù)庫。數(shù)據(jù)一般依存貯對象區(qū)分為: 數(shù)值型數(shù)據(jù)庫、事實型數(shù)據(jù)庫、文獻型數(shù)據(jù)庫。數(shù)值型數(shù)據(jù)庫、事實型數(shù)據(jù)庫、文獻型數(shù)據(jù)庫。 (A)數(shù)值型數(shù)據(jù)庫數(shù)值型數(shù)據(jù)庫: 是以數(shù)值為主要內容的數(shù)據(jù)庫是以數(shù)值為主要內容的數(shù)據(jù)庫,除存貯各類數(shù)值外,還存貯運算公式,規(guī)劃(如貨幣兌換算)等。金融、證券系統(tǒng)數(shù)據(jù)庫大多屬于此類。 (B)事實型數(shù)據(jù)庫事實型數(shù)據(jù)庫: 是

29、指既有數(shù)字又有文字的數(shù)據(jù)庫是指既有數(shù)字又有文字的數(shù)據(jù)庫,如人口數(shù)據(jù)庫、名錄數(shù)據(jù)庫、自然資源數(shù)據(jù)庫,社會調查數(shù)據(jù)庫等,總是以特定的事實或數(shù)字回答用戶的查詢。 (C)文獻型數(shù)據(jù)庫文獻型數(shù)據(jù)庫: 是指以各類型文獻為內容的數(shù)據(jù)庫是指以各類型文獻為內容的數(shù)據(jù)庫,包括最為常見的二次文獻數(shù)據(jù)庫,如書目、索引、文摘等。隨著計算機技術進步,全文數(shù)據(jù)庫、超文本型數(shù)據(jù)庫等不斷出現(xiàn)新型數(shù)據(jù)庫。如中國生物醫(yī)學文獻數(shù)據(jù)庫、中藥藥典數(shù)據(jù)庫、法律數(shù)據(jù)庫、人民日報數(shù)據(jù)庫、MEDLINE數(shù)據(jù)庫等等。 34實例說明實例說明:1).書目檢索書目檢索,例如例如“有關海底隧道有些什么文有關海底隧道有些什么文獻?獻?”(見文獻檢索見文獻檢

30、索); 2).事實檢索事實檢索,例如例如“世界最長的海底隧道是哪一世界最長的海底隧道是哪一條?條?”; 3).數(shù)值檢索數(shù)值檢索,例如,例如“某海底隧道有多長?某海底隧道有多長?”;4).文獻全文檢索文獻全文檢索,所檢索出來的是有關文獻的全文,所檢索出來的是有關文獻的全文,可能回答可能回答-例如例如“某文獻某文獻全文中全文中有哪些句子提到了海有哪些句子提到了海底隧道?底隧道?”的問題。的問題。35由于數(shù)據(jù)庫內信息存在形態(tài)不同和物理存放位置不同,數(shù)據(jù)庫還可分為:層次型數(shù)據(jù)庫、網(wǎng)狀型數(shù)據(jù)庫、關系數(shù)據(jù)庫或分為集中型數(shù)據(jù)庫系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)。 (4)數(shù)據(jù)庫的發(fā)展趨勢數(shù)據(jù)庫的發(fā)展趨勢 a)數(shù)據(jù)庫與In

31、ternet結合,即數(shù)據(jù)庫上網(wǎng)運行; b)將相關數(shù)據(jù)庫集合在一起,組成數(shù)據(jù)倉庫(Data Warehouse); c)隨著全球信息高速公路的發(fā)展,聯(lián)機數(shù)據(jù)庫將占據(jù)數(shù)據(jù)庫媒體的統(tǒng)治地位,光盤數(shù)據(jù)庫數(shù)量將逐漸減少。 (四)網(wǎng)絡電子信息源網(wǎng)絡電子信息源 由于Internet的發(fā)展,傳統(tǒng)的聯(lián)機網(wǎng)絡的局限性顯得越來越明顯,以致目前世界上許多的聯(lián)機系統(tǒng)如American Online,DIALOG,STN等都上了網(wǎng)絡,成為Internet網(wǎng)絡的一部分。、網(wǎng)絡電子信息源的特點有網(wǎng)絡電子信息源的特點有:()以網(wǎng)絡為傳播媒體;36 ()以多媒體為內容特征;()傳播方式具有多樣性,交互性。2、網(wǎng)絡電子信息源的類型

32、分為:網(wǎng)絡電子信息源的類型分為: a)聯(lián)機數(shù)據(jù)庫;聯(lián)機數(shù)據(jù)庫; b)聯(lián)機館藏目錄庫;聯(lián)機館藏目錄庫; c)電子圖書;電子圖書; d)電子期刊;電子期刊; e)電子報紙;電子報紙; f)軟件與娛樂游戲類;軟件與娛樂游戲類; g)教育培訓類;教育培訓類; h)動態(tài)性信息類。動態(tài)性信息類。37計算機檢索文獻信息的步驟與方法計算機檢索文獻信息的步驟與方法計算機檢索和手工檢索的目的一致,所使用的檢索計算機檢索和手工檢索的目的一致,所使用的檢索工具的內容一致,兩者之間的區(qū)別僅僅由于文獻信息載工具的內容一致,兩者之間的區(qū)別僅僅由于文獻信息載體的不同而引起的一些操作方法上的不同。體的不同而引起的一些操作方法上

33、的不同。計算機檢索文獻信息步驟如下:計算機檢索文獻信息步驟如下:一、一、分析檢索課題,明確檢索要求分析檢索課題,明確檢索要求二、二、選擇數(shù)據(jù)庫選擇數(shù)據(jù)庫 三、制定檢索策略制定檢索策略38目前全世界有近萬種數(shù)據(jù)庫,目前全世界有近萬種數(shù)據(jù)庫,選擇數(shù)據(jù)庫時應選擇數(shù)據(jù)庫時應注意以下幾點:以下幾點: 、數(shù)據(jù)庫收錄的文獻內容;、數(shù)據(jù)庫收錄的文獻內容;、數(shù)據(jù)庫收錄文獻的出版類型;、數(shù)據(jù)庫收錄文獻的出版類型;、是否能索取到原文;、是否能索取到原文;、數(shù)據(jù)庫的收費標準;、數(shù)據(jù)庫的收費標準;、數(shù)據(jù)庫中收錄文獻的時間范圍;、數(shù)據(jù)庫中收錄文獻的時間范圍;、數(shù)據(jù)庫的更新情況。、數(shù)據(jù)庫的更新情況。39 制定檢索策略制定檢

34、索策略包括包括: 選擇選擇檢索詞檢索詞、確定確定檢索詞檢索詞之間之間的邏輯、位置的邏輯、位置關系關系。 制定檢索策略的制定檢索策略的兩個兩個重要概念是重要概念是: 查準率查準率,查全率查全率。 (1)申請科研項目)申請科研項目或或鑒定科研成果檢索文獻,要求有較高的鑒定科研成果檢索文獻,要求有較高的查全率查全率; (2)搶救一個危重病、疑難病作特殊治療方案需檢索文獻時,)搶救一個危重病、疑難病作特殊治療方案需檢索文獻時,要求有較高的要求有較高的查準率查準率。 40檢索效率檢索效率,張琪玉教授在張琪玉教授在情報語言學基礎情報語言學基礎一書中,一書中,概括概括為為“全、準、快、便、省全、準、快、便、

35、省”五五個字,個字,“全全”指指檢全率檢全率,“準準”指指檢準率檢準率,“快快”指檢索速度快,指檢索速度快,“便便”指檢索方便性,指檢索方便性,“省省”指檢索成本與效益。指檢索成本與效益。其主要是其主要是全全和和準準。檢全率檢全率和和檢準率可用下列檢準率可用下列公式公式表示:表示:4142與與檢全率檢全率對應的是對應的是漏檢率漏檢率,即未被檢出的相關文獻,即未被檢出的相關文獻數(shù)與檢索系統(tǒng)中相關文獻總數(shù)的百分比數(shù)與檢索系統(tǒng)中相關文獻總數(shù)的百分比;與與檢準率檢準率對應的是對應的是誤檢率誤檢率,即指那些帶出的無關文,即指那些帶出的無關文獻與檢出文獻總數(shù)的百分比。獻與檢出文獻總數(shù)的百分比。檢全率檢全率

36、和和漏檢率漏檢率、檢準率、檢準率和和誤檢率誤檢率分別是分別是同一問題同一問題的的兩個相對兩個相對的概念。的概念。43一一、分類索引分類索引 產(chǎn)生產(chǎn)生 漏檢漏檢 和和 誤檢誤檢 的原因的原因1 、 檢索范圍檢索范圍大于大于檢索要求檢索要求 例如例如:要檢索的只是要檢索的只是“關于肺原性心臟病關于肺原性心臟病”的文獻,的文獻,其實其實只要查只要查“R541.5肺原性心臟病肺原性心臟病”就可以了,就可以了,但讀者往往翻遍所有但讀者往往翻遍所有“R54心臟、血管(循環(huán)系)疾病心臟、血管(循環(huán)系)疾病”或或“R541心臟疾病心臟疾病”,浪費了時間,增加了誤檢。,浪費了時間,增加了誤檢。“關于肺原性心臟病

37、關于肺原性心臟病” R 541.5三三級類目級類目-查找就可以了查找就可以了 R54為二級類目為二級類目442、 檢索范圍檢索范圍小于小于檢索要求檢索要求 例如例如 要檢索要檢索:“關于腎疾病關于腎疾病”的文獻,應當查的文獻,應當查“R692【腎疾病】【腎疾病】”、“R527.1【腎結核】【腎結核】”、“R737.11【腎、腎盂腫瘤】【腎、腎盂腫瘤】”等類目,如等類目,如包括包括小兒腎疾病,還需查小兒腎疾病,還需查“R726.92【小兒腎疾病】【小兒腎疾病】”?!癛726.92【小兒腎疾病】【小兒腎疾病】”如果只查了如果只查了R692及其及其下位類下位類,就會產(chǎn)生漏檢。,就會產(chǎn)生漏檢。需查需查

38、:四個類目:四個類目 R692 ; R527.1 ; R737.11; R726.92 ;四類目都四類目都需要查到需要查到453 、檢索范圍與實際文獻需要不符檢索范圍與實際文獻需要不符,產(chǎn)生漏檢和誤檢,產(chǎn)生漏檢和誤檢. 如如檢索檢索: “糖尿病糖尿病 并發(fā)并發(fā)青光眼青光眼” 的文獻,的文獻,誤到誤到 “R775.3繼發(fā)性青光眼繼發(fā)性青光眼” -類目下查找,結果產(chǎn)生類目下查找,結果產(chǎn)生-漏檢?漏檢?應到應到 “R587.1糖尿病糖尿病”和和 “R587.2糖尿病性昏迷及其他糖尿病性昏迷及其他并發(fā)癥并發(fā)癥”這兩個專這兩個專類類中查找才是恰如其分的。中查找才是恰如其分的。 (參閱張琪玉:(參閱張琪玉

39、:分類目錄產(chǎn)生漏檢和誤檢的原因分類目錄產(chǎn)生漏檢和誤檢的原因, 刊載于刊載于圖書情報知識圖書情報知識1980年第一期)。)。463 、檢索范圍檢索范圍與與實際文獻需要不符實際文獻需要不符,產(chǎn)生漏檢和誤檢,產(chǎn)生漏檢和誤檢.糖尿病糖尿病 并發(fā)并發(fā) 青光眼青光眼R775.3繼發(fā)性青光眼繼發(fā)性青光眼”類目下查找類目下查找,結果產(chǎn)生漏檢,結果產(chǎn)生漏檢R587.1R587.2糖尿病糖尿病糖尿病性昏迷糖尿病性昏迷及其他及其他并發(fā)癥并發(fā)癥47一、一、主題索引主題索引 產(chǎn)生產(chǎn)生 漏檢漏檢 和和 誤檢誤檢 的原因的原因1 、 檢索范圍大于檢索要求檢索范圍大于檢索要求 如要如要查閱查閱: “腭裂的外科手術腭裂的外科手

40、術”文獻,文獻, 只要檢索只要檢索 “腭裂腭裂/外科手術外科手術”(CLEFT PALATE / SURGERY)就可以了,就可以了,檢索者卻檢索者卻沒有組配沒有組配,用,用“腭裂腭裂”查找,甚至用查找,甚至用“外科外科手手術術”,“口腔口腔”(SURGERY,ORAL)來檢索,檢索來檢索,檢索出出不不少少無關文獻,無關文獻,增加了增加了誤檢。誤檢。482 、 檢索范圍小于檢索要求檢索范圍小于檢索要求 如要查如要查:“關于血壓關于血壓”的文獻,的文獻,只檢索了只檢索了“血壓血壓”(BLOOD PRESSURE)這一主題,而這一主題,而未未檢索檢索-“高血壓高血壓”(HYPERTENSION)和

41、和“低血壓低血壓”(HYPOTENSION)這兩個主題,這兩個主題, 而而產(chǎn)生產(chǎn)生漏檢。漏檢。493 、 檢索范圍檢索范圍與與檢索需要不符檢索需要不符 如要查幽門梗阻的文獻,詞表中沒有這個詞,如要查幽門梗阻的文獻,詞表中沒有這個詞,靠靠題題標引為標引為“幽門狹窄幽門狹窄”,結果,結果 一無所獲一無所獲 或或 收效收效 甚微。甚微。其實其實詞表詞表中有中有“胃出口梗阻胃出口梗阻”, 由于未查到由于未查到專指詞專指詞使漏檢增加。使漏檢增加。504、 不適當?shù)乩貌紶栠壿嫳磉_式不適當?shù)乩貌紶栠壿嫳磉_式 邏輯(邏輯(AND)用的太多,使檢索范圍縮小,使檢全)用的太多,使檢索范圍縮小,使檢全率降低;率

42、降低;邏輯或(邏輯或(OR)用的太多,必然查出一些不相關文獻,)用的太多,必然查出一些不相關文獻,導致檢準率降低;導致檢準率降低;邏輯非(邏輯非(NOT)用的越多,檢全率越低。)用的越多,檢全率越低。515 、 截詞檢索截詞檢索 截詞檢索可擴大檢索的網(wǎng)羅度(即標引深度),截詞檢索可擴大檢索的網(wǎng)羅度(即標引深度),提高提高檢全率,但檢準率檢全率,但檢準率下降下降,因此,切忌將詞干截得,因此,切忌將詞干截得過短。過短。人們總希望有參考價值的文獻全部被檢出,被檢出的人們總希望有參考價值的文獻全部被檢出,被檢出的文獻都是有參考價值的,即檢全率是文獻都是有參考價值的,即檢全率是100%,檢準率,檢準率也

43、為也為100%。但實際上,不僅不可能達到這種理想的檢索效率,甚但實際上,不僅不可能達到這種理想的檢索效率,甚至要達到較高的檢索效率也不是很容易的。至要達到較高的檢索效率也不是很容易的。 52(一)(一)選擇檢索詞選擇檢索詞 注意使用規(guī)范化的醫(yī)學術語并能計算機識別。注意使用規(guī)范化的醫(yī)學術語并能計算機識別。(二)(二)選擇布爾邏輯運算符選擇布爾邏輯運算符 運算符在計算機檢索中起著十分重要的作用它能用運算符在計算機檢索中起著十分重要的作用它能用來組合檢索詞,構成檢索語句,達到擴大或縮小檢索來組合檢索詞,構成檢索語句,達到擴大或縮小檢索范圍,提高檢索效果的目的。范圍,提高檢索效果的目的。 該算符由英國

44、數(shù)學家喬治該算符由英國數(shù)學家喬治布爾提出,布爾提出, 也稱作布爾算符。也稱作布爾算符。 布爾邏輯符有布爾邏輯符有三三種:種: (1)邏輯乘(用)邏輯乘(用“AND”或或“”表示)表示) (2)邏輯加(用)邏輯加(用“OR”或或“+”表示)表示) (3)邏輯非(用)邏輯非(用“NOT”或或“-”表示表示53541、AND邏輯乘,通常也用邏輯乘,通常也用“”表示表示。 AND是是:具有概念交叉關系和限定關系的一種組配。具有概念交叉關系和限定關系的一種組配。 檢出文獻檢出文獻-需同時含有兩個或多個檢索詞。需同時含有兩個或多個檢索詞。 特點特點:常用來縮小檢索范圍,常用來縮小檢索范圍,提高提高查準率查

45、準率。 例如:檢索式例如:檢索式Viruses AND Infection 邏輯與邏輯與 檢出的文獻檢出的文獻 特點特點是,凡是,凡 在同一篇文獻中在同一篇文獻中包括包括 有病毒有病毒同時也同時也包括包括傳染這兩個概念的文獻為命中文獻。傳染這兩個概念的文獻為命中文獻。邏輯乘示意圖邏輯乘示意圖55 例如:檢索由例如:檢索由 流行性感冒流行性感冒 引起引起 咳嗽咳嗽 的有關文獻的有關文獻 邏輯與邏輯與檢出的文獻特點是,凡在同一篇文獻中(用檢出的文獻特點是,凡在同一篇文獻中(用邏輯與邏輯與“AND”聯(lián)接),聯(lián)接),包括包括有流行性感冒有流行性感冒同時同時也包括也包括咳嗽這兩個概念的文獻為命中文獻咳嗽

46、這兩個概念的文獻為命中文獻,下面兩圓的相重下面兩圓的相重疊部分為命中文獻:疊部分為命中文獻: 邏輯乘示意圖邏輯乘示意圖56簡例:邏輯運算簡例:邏輯運算 AND糖尿病的飲食治療糖尿病的飲食治療糖尿病糖尿病飲食治療飲食治療572、OR 邏輯和,通常用邏輯和,通常用“+”表示表示。 OR 是具有概念并列關系的一種組配是具有概念并列關系的一種組配。 檢出文獻可同時或只含其中任何一個檢索詞。 特點特點:常用來擴大檢索范圍,提高查全率常用來擴大檢索范圍,提高查全率。 例如例如:檢索式檢索式Hepatitis A OR Hepatitis B 用這一檢索式可檢索出所有有關肝炎用這一檢索式可檢索出所有有關肝炎

47、A的文獻和所有有的文獻和所有有關肝炎關肝炎B的文獻的文獻。邏輯和(或)示意圖邏輯和(或)示意圖58 2、OR 邏輯和,通常用邏輯和,通常用“+”表示表示。 例如:檢索有關例如:檢索有關“流行性感冒流行性感冒或者或者咳嗽咳嗽”的一些文章,的一些文章,用邏輯或(也叫邏輯和)聯(lián)接。用邏輯或(也叫邏輯和)聯(lián)接??蓹z索出可檢索出所有所有有關有關流行性感冒流行性感冒的文獻和的文獻和所有所有有關有關咳嗽的文獻咳嗽的文獻,即兩圓非重疊部分的文獻。即兩圓非重疊部分的文獻。還可以檢索出那些還可以檢索出那些涉及涉及流行性感冒,流行性感冒,又涉及又涉及咳嗽的文獻,即圖咳嗽的文獻,即圖中兩圓相重疊部分的文獻。中兩圓相重

48、疊部分的文獻。邏輯和(或)示意圖邏輯和(或)示意圖59簡例:邏輯運算簡例:邏輯運算 ORl微量元素微量元素 與與 克山病克山病 的關系的關系ABC603、NOT 邏輯非邏輯非也叫也叫邏輯差,通常用邏輯差,通常用“-”或或“”表示表示。 “NOT”具有具有不不包含包含某種概念關系某種概念關系的一種的一種組配。組配。 或者說用于表達概念的排斥關系。從檢出文獻中剔除部分文獻?;蛘哒f用于表達概念的排斥關系。從檢出文獻中剔除部分文獻。特點特點:一般用來縮小檢索范圍,增強專指性:一般用來縮小檢索范圍,增強專指性。例如:檢索式例如:檢索式Diarrhea NOT Vomiting這種檢索式可將文獻中排除即含

49、這種檢索式可將文獻中排除即含 腹瀉腹瀉 與與 嘔吐嘔吐 的文獻,的文獻, 檢出只帶檢出只帶-腹瀉文獻腹瀉文獻邏輯非示意圖邏輯非示意圖排斥排斥 2、3、需要、需要1文獻文獻61 3、NOT 邏輯非邏輯非也叫邏輯差也叫邏輯差,通常用,通常用“-”或或“”表示表示。例如:流行性感冒例如:流行性感冒; 流行性感冒引起咳嗽癥狀流行性感冒引起咳嗽癥狀; 咳嗽癥狀咳嗽癥狀要檢索有關要檢索有關不帶有不帶有咳嗽的流行性感冒的文獻,用邏輯非咳嗽的流行性感冒的文獻,用邏輯非“NOT”聯(lián)接,聯(lián)接,檢索檢索或或可將所有不帶有咳嗽的流行性感冒的文獻檢索出可將所有不帶有咳嗽的流行性感冒的文獻檢索出來來。但是在用但是在用邏輯

50、非邏輯非檢索時,需要注意邏輯非還能把那些檢索時,需要注意邏輯非還能把那些既論既論流流行性感冒行性感冒又論又論咳嗽的文獻咳嗽的文獻 排斥掉。排斥掉。邏輯非示意圖邏輯非示意圖62簡例:簡例:邏輯運算邏輯運算 NOTl非病毒性肝炎(非病毒性肝炎(除除 病毒性肝炎病毒性肝炎 之外之外 的其它的其它 肝炎)肝炎)A NOT BA:各種肝炎:各種肝炎 B:病毒性肝炎:病毒性肝炎63布爾邏輯檢索(布爾邏輯檢索(Boolean searching) 布爾邏輯運算符主要有三種:布爾邏輯運算符主要有三種:表達方式布爾邏輯運算符表達方式布爾邏輯運算符邏輯邏輯“與與”(AND)、)、 - 邏輯與(并且)、邏輯與(并且

51、)、“*”星星號;號; 邏輯邏輯“或或” (OR)、)、 -邏輯或(或者)、邏輯或(或者)、“+”號;號;邏輯邏輯“非非”(NOT)、)、- 邏輯非(不包含)邏輯非(不包含) 、“-”減減號號布爾邏輯運算符的運算次序:布爾邏輯運算符的運算次序:(刮號)(刮號)NOTANDOR 重點記憶重點記憶64(三)(三)選擇位置運算符選擇位置運算符 (1)“NEAR” 兩個兩個詞在同一個句子中出現(xiàn)詞在同一個句子中出現(xiàn); near表示表示:檢索詞存在于同一句子中,詞序可以顛倒。檢索詞存在于同一句子中,詞序可以顛倒。 例如:例如:information NEAR retrieval NEAR后后加正整數(shù)加正整

52、數(shù) 表示表示檢索詞之間檢索詞之間最多允許最多允許插入幾個詞。插入幾個詞。 例如:例如:acute NEAR 2 infarction 表示兩詞之間最多表示兩詞之間最多允許允許插插入一個其他單詞,可檢出入一個其他單詞,可檢出acute myocardial infarction。 NEAR3 NEAR4 表示檢索詞之間表示檢索詞之間最多允許最多允許插入插入3個單詞或個單詞或4個單詞,以此類推。個單詞,以此類推。65位置算符位置算符near: 檢索式檢索式:A near B表示表示:檢索詞檢索詞A和檢索詞和檢索詞B不僅同時出現(xiàn)在一條字段里,還要同時出現(xiàn)不僅同時出現(xiàn)在一條字段里,還要同時出現(xiàn)在一個句

53、子里。在一個句子里。 Near n表示表示0n-1個間隔。個間隔。66同句檢索同句檢索 nearnear同句檢索:同句檢索:即在兩個詞之間用即在兩個詞之間用nearnear的一種檢索的一種檢索技術。技術。同句相鄰詞檢索同句相鄰詞檢索:用用 near near 加加數(shù)字數(shù)字, 把兩個詞連起來,如把兩個詞連起來,如 Diagnosis Diagnosis nearnear 3 3 virus,virus,就是凡在同一字段中有就是凡在同一字段中有DiagnosisDiagnosis與與virusvirus之間相隔之間相隔3 3個個詞以內的文獻即為命中文獻詞以內的文獻即為命中文獻。如如diagnosi

54、s of HB Virus infectiondiagnosis of HB Virus infection67(2)“WITH” with表示表示: 連接兩個詞檢索,凡是在同一記錄的連接兩個詞檢索,凡是在同一記錄的同一字段中出現(xiàn)兩個詞;同一字段中出現(xiàn)兩個詞;表示表示 檢索詞存在于檢索詞存在于同一同一字段字段,如如篇名、摘要等,篇名、摘要等,詞詞序可顛倒序可顛倒,檢索詞之間的位置要求,檢索詞之間的位置要求 比比 “near” 寬寬。 例如:例如:women WITH hepatoma 用用with連接兩個詞檢索,連接兩個詞檢索,其檢索結果為其檢索結果為:凡是在:凡是在同一記錄的同一字段中出現(xiàn)這

55、兩個檢索詞的文獻,同一記錄的同一字段中出現(xiàn)這兩個檢索詞的文獻,都都算是命中算是命中文獻,且不論這兩個詞次序如何。文獻,且不論這兩個詞次序如何。68位置算符with: 檢索式:A with B 表示表示:檢索詞A和檢索詞B不僅同時出現(xiàn)在一條記錄中,還要同時出現(xiàn)在一個字段里。69同字段檢索同字段檢索with同字段檢索同字段檢索:即在兩個詞之間用即在兩個詞之間用with的一的一種檢索技術。種檢索技術。凡文獻中,只要所要求的兩個詞在同一句凡文獻中,只要所要求的兩個詞在同一句子中即為命中文獻子中即為命中文獻,如,如G with H。只要只要G和和 H 在同一句中即可檢出。在同一句中即可檢出。如如coug

56、h (咳嗽咳嗽) with asthms (哮喘哮喘)。70vNear、 with 指定兩個檢索詞之間的位置指定兩個檢索詞之間的位置With的含義:的含義:兩個檢索詞在同一字段中出現(xiàn)。兩個檢索詞在同一字段中出現(xiàn)。With的用法:檢索詞的用法:檢索詞A with 檢索詞檢索詞BNear的含義:的含義:兩個檢索詞不僅在同一字段中出現(xiàn)。兩個檢索詞不僅在同一字段中出現(xiàn)。 而且而且可限定可限定兩個詞之間的間隔距離。兩個詞之間的間隔距離。71v是一種指定檢索詞在某一字段中出現(xiàn)的限定是一種指定檢索詞在某一字段中出現(xiàn)的限定v性檢索。性檢索。vin 是一種包含(相似)關系。是一種包含(相似)關系。v= 為精確的

57、比較。為精確的比較。in 的用法:的用法: 檢索詞檢索詞 in 字段名稱字段名稱= 的用法:的用法: 字段名稱字段名稱=檢索詞檢索詞特別提示特別提示:需要注意的是在特定的數(shù)據(jù)庫中,需要注意的是在特定的數(shù)據(jù)庫中,哪些字段可以運用哪些字段可以運用=,哪些只能用,哪些只能用in。721 包含檢索包含檢索 (in)檢索詞包含于檢索字符串中,檢索詞包含于檢索字符串中,如如: 檢索作者檢索作者馬智,馬智,可可檢索檢索出出作者為馬智、馬智明、馬智慧等的文獻。作者為馬智、馬智明、馬智慧等的文獻。2 精確檢索精確檢索(=)檢索詞檢索詞與與檢索字符串檢索字符串 完全完全 相等,相等,如如:檢索作者馬檢索作者馬智,

58、智,僅僅檢索出作者為馬智的文獻,而不會將作者名中含有馬智檢索出作者為馬智的文獻,而不會將作者名中含有馬智片段的文獻代出。片段的文獻代出。3 所有字段均可進行包含檢索,所有字段均可進行包含檢索,精確檢索精確檢索僅限于作者、作者、期刊、卷、期、期刊、卷、期、ISSN、出版地、主題詞、特征詞、關鍵詞、出版地、主題詞、特征詞、關鍵詞、人名主題、分類號字段。人名主題、分類號字段。73(3)“in” 指定在某個字段進行檢索指定在某個字段進行檢索;指定指定-字段檢索符字段檢索符 用用“in”指定指定-在某個字段進行檢索。這種在某個字段進行檢索。這種檢索可節(jié)約系統(tǒng)在其他字段的搜索時間,檢索的檢索可節(jié)約系統(tǒng)在其

59、他字段的搜索時間,檢索的結果比較精確結果比較精確。檢域限定檢索檢域限定檢索或或稱稱=限定字段檢索限定字段檢索是指檢索詞限定出現(xiàn)在某一特定字段者,為命中文獻。就是是指檢索詞限定出現(xiàn)在某一特定字段者,為命中文獻。就是在檢索詞之后用限定符號在檢索詞之后用限定符號 inin,再加字段簡稱。,再加字段簡稱。如如arrhythmia in TI,就是在題名中,就是在題名中arrhythmia(心律不齊心律不齊)的的文獻即為命中文獻。文獻即為命中文獻??上薅z索的字段有可限定檢索的字段有TI、AU、 CP、 LA 、SO、 AD、 MeSH、 MMH,等。等。限定字段檢索限定字段檢索是一種縮小檢索范圍的檢索

60、技術,而且是一種縮小檢索范圍的檢索技術,而且使檢檢出的文獻非常準確、切題。出的文獻非常準確、切題。74常用的常用的限制性字段限制性字段1.篇名:chemistry in ti2.文摘:cancer in ab3.出版年:2000 in py4.出版類型或文獻類型:review in pt,pt=editorial5.作者:han-j-s in au6.通訊地址:beijing in ad75( 四)四)運算符的排列次序運算符的排列次序 在實際檢索工作中,有時為了表達各種邏輯位在實際檢索工作中,有時為了表達各種邏輯位置關系,在一個檢索式中很可能要使用多種運算符。置關系,在一個檢索式中很可能要使用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論