已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
文 獻(xiàn) 信 息 檢 索 基 礎(chǔ),2007-05-17,2,如何開始:文獻(xiàn)信息檢索必備,須對文獻(xiàn)信息檢索的一些概念有一個(gè)基本的了解; 須了解所處的文獻(xiàn)信息環(huán)境,有哪些文獻(xiàn)信息源可供檢索利用; 須掌握一些基本的檢索技術(shù)和方法;,3,4,第一部分:基本知識,5,1.1 什么是文獻(xiàn)?,文獻(xiàn)是記錄知識的一切載體。 具體地說,文獻(xiàn)是將知識、信息用文字、符號、圖像、音頻等記錄在一定的物質(zhì)載體上的結(jié)合體。由此定義我們可以看出,文獻(xiàn)具有三個(gè)基本屬性,即文獻(xiàn)的知識性、記錄性和物質(zhì)性。它具有存貯知識、傳遞和交流信息的功能。,6,1.2 具體什么是文獻(xiàn)?,文獻(xiàn)按照出版類型: 常見文獻(xiàn) 1.圖書 2.期刊 3.報(bào)紙 更多,特種文獻(xiàn) 4.專利文獻(xiàn) 5.會議文獻(xiàn) 6.科技報(bào)告 7.學(xué)位論文 8.標(biāo)準(zhǔn)文獻(xiàn) 9.技術(shù)檔案 10.產(chǎn)品資料,7,1.3 什么是文獻(xiàn)深度,零次文獻(xiàn):實(shí)驗(yàn)記錄、手稿、原始錄音、檔案 一次文獻(xiàn):全文!期刊論文、圖書等 二次文獻(xiàn):非全文!檢索工具,目錄、題錄、文摘,比如圖書館書目檢索系統(tǒng)、搜索引擎、中文社會科學(xué)引文索引 三次文獻(xiàn):工具性!綜述、進(jìn)展報(bào)告、百科全書、手冊、年鑒、辭典等,8,1.4 什么是文獻(xiàn)信息檢索?,就是查找文獻(xiàn)信息,即以科學(xué)的方法利用專門的工具,從大量的文獻(xiàn)資料中迅速、準(zhǔn)確、完整地查找到文獻(xiàn)資料的過程。 核心:是用戶信息需求與文獻(xiàn)信息集合的比較和選擇, 是兩者匹配(match)的過程。通過檢索語言匹配,9,1.5 檢索與查找、搜索有什么區(qū)別?,10,1.6 什么是檢索途徑?,檢索點(diǎn)或說檢索字段 信息組織方法=檢索途徑,外部特征 1 題名途徑 2 著者途徑 3 序號途徑 4 引文途徑,內(nèi)部特征 5 關(guān)鍵詞途徑 6 分類途徑 7 主題途徑 8 其他,11,1.7 什么是關(guān)鍵詞,所謂關(guān)鍵詞是指那些出現(xiàn)在文獻(xiàn)的標(biāo)題(篇名、章節(jié)名)以至摘要、正文中,對表達(dá)文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的語詞,亦即對揭示和描述文獻(xiàn)主題內(nèi)容來說是重要的、帶關(guān)鍵性的(可作為檢索“入口”的)那些詞語。 概括地說,能描述其主題概念的那些具有關(guān)鍵性的詞抽出。,12,1.8 什么是檢索詞?,就是您輸入檢索框中的文字或字符,也就是您想讓系統(tǒng)為您尋找的東西。 通常需要能表達(dá)一個(gè)主題概念。我們一般用關(guān)鍵詞作為檢索詞進(jìn)行檢索。 比如: 1.檢索課題:網(wǎng)絡(luò)資源的知識產(chǎn)權(quán)保護(hù) 關(guān) 鍵 詞:網(wǎng)絡(luò)資源、網(wǎng)絡(luò)信息資源、知識產(chǎn)權(quán)、版權(quán)、著作權(quán)限、合理使用 參閱:檢索課題分析舉要,13,1.9 為什么校外不能訪問數(shù)據(jù)庫?,數(shù)據(jù)庫采用IP地址控制對這些資源的利用。也就是說,一個(gè)學(xué)校或單位訂購了網(wǎng)絡(luò)數(shù)據(jù)庫時(shí)都會登記一些IP地址。從這些登記過的IP地址登錄該網(wǎng)絡(luò)數(shù)據(jù)庫的用戶有權(quán)使用。 有些數(shù)據(jù)庫是整體銷售,那么從這些登記過的IP地址 登錄該網(wǎng)絡(luò)數(shù)據(jù)庫的用戶有權(quán)使用整個(gè)數(shù)據(jù)庫。 但大部分?jǐn)?shù)據(jù)庫采用零售方式,這時(shí),從這些登記過的IP地址登錄該網(wǎng)絡(luò)數(shù)據(jù)庫的用戶有權(quán)使用你訂購的那部分?jǐn)?shù)據(jù)。,14,1.10 什么是檢索策略?,就是在分析檢索提問的基礎(chǔ)上,根據(jù)所處的信息環(huán)境,確定檢索的數(shù)據(jù)庫、檢索用詞,并明確檢索詞之間的邏輯關(guān)系和查找步驟的科學(xué)安排。,檢索目的是什么?【簡單瀏覽、深入研究】 檢索的用途是什么?【研究型、技術(shù)型、商貿(mào)型、大眾型】 需要什么類型的信息?【全文型、目錄型、指南型、數(shù)值型】 有一些知道的信息源嗎?【作者信息、期刊名、論文、會議】,15,有什么樣的語言限制?【中文、英文、其它語言】 對文獻(xiàn)信息有什么樣的時(shí)間要求? 【近2年、近5年、全部】 對檢索結(jié)果有什么要求? 【信息條數(shù)、打印/復(fù)制/掃描/數(shù)字格式等、按照年代排序】 概念分析(學(xué)科分類、同義詞、近義詞、上位類詞、下位類詞、英文詞語) 編制檢索式 根據(jù)信息環(huán)境選擇數(shù)據(jù)源,16,第二部分:了解信息環(huán)境,數(shù)字資源整合服務(wù)系統(tǒng),17,如何了解一個(gè)數(shù)據(jù)庫?,服務(wù)形式(WEB、光盤、聯(lián)機(jī)檢索、單機(jī)) 校內(nèi)、國內(nèi)、國外。鏡像 涵蓋學(xué)科或主題范圍 文獻(xiàn)類型(出版形式、內(nèi)容層次) 收錄年限,收錄對象 數(shù)據(jù)量(記錄數(shù)) 文種、更新頻率 訪問模式(口令,IP控制) 其它信息:幫助信息、出版者、發(fā)行者、在同行中的地位。,18,如何了解一個(gè)數(shù)據(jù)庫樣例: 書生數(shù)字圖書,服務(wù)形式:WEB/鏡像 涵蓋學(xué)科或主題范圍:所有學(xué)科 文獻(xiàn)類型(出版形式、內(nèi)容層次等): 電子圖書,全文(一次文獻(xiàn)) 收錄年限,收錄對象: 20012003,紙本圖書的數(shù)字化 數(shù)據(jù)量(記錄數(shù)):11.4萬 文種:中文,19,如何了解一個(gè)數(shù)據(jù)庫樣例(續(xù)):,更新頻率:目前沒有更新 訪問模式(口令,IP控制) 口令+IP控制 知識點(diǎn):數(shù)據(jù)庫的訪問模式 數(shù)據(jù)庫的其它信息:出版者、發(fā)行者、在同行中的地位。 重要的中文數(shù)字圖書數(shù)據(jù)庫之一,20,第三部分:計(jì)算機(jī)檢索技術(shù) 布爾邏輯 截詞檢索 限定檢索 詞位置限制檢索 下面以DIALOG系統(tǒng)為例來學(xué)習(xí)計(jì)算機(jī)的基本檢索技術(shù)。,21,布爾檢索 布爾邏輯組配是現(xiàn)行計(jì)算機(jī)檢索的基本技術(shù),主要通過“與(and,*)”、“或(or,+)”、 “非(not,-)”將檢索詞聯(lián)絡(luò)起來,對、兩詞而言其AND、OR、NOT的邏輯含義用圖表示是:AND*&空格 A and B 邏輯與。A和B都為真時(shí),結(jié)果才為真 ,即:A*B,22,OR +| A or B 邏輯或。A或B中只要有一個(gè)為真時(shí),結(jié)果就為真,即:A+B NOT-! A not B 邏輯非。A為真、B為假時(shí),結(jié)果才為真,即:A-B,23,布爾邏輯運(yùn)算符的運(yùn)算次序 括號優(yōu)先與計(jì)算機(jī)編程中一樣 (A OR B) AND C NOT D 不同的系統(tǒng)次序有差別,但總的來說一般次序?yàn)椋?NOT AND OR,24,例A:查找有關(guān)信息檢索的非英文文獻(xiàn) 信息information 檢索retrieval 英文english (信息 and 檢索 ) not 英文 (information and retriever) not english,25,上海零售業(yè)的現(xiàn)狀與發(fā)展趨勢 上海 零售業(yè) 現(xiàn)狀 發(fā)展趨勢 上海 and 零售業(yè) and (現(xiàn)狀 or 發(fā)展趨勢),26,截詞檢索 截詞包括后截、中截、前截等。用?作為截詞符(有些系統(tǒng)用*),主要包括下列情形: ? 中截一字符,后截?cái)鄋個(gè)字符 如 wom?n 可以檢索出: woman, women 如 coumput? 可以檢索出Compute, Computer, Computing, computable,27,補(bǔ)充:通配符 % ?* 前方一致: “%國慶” 將檢索出所有字段為張國慶、歐陽國慶、國慶等的記錄。 后方一致: 如:“熱電材料% ”將檢索出熱電材料梯度化、熱電材料及其梯度化等的記錄。,28,第四部分:數(shù)據(jù)庫檢索,如果你要求不高,檢索,就這么簡單! 只要在檢索框中輸入關(guān)鍵詞,并按一下“檢索”按鈕,系統(tǒng)就會在數(shù)據(jù)庫中自動找出符合檢索條件的信息。,29,4.1 一般檢索步驟是怎么樣的?,明確需求,分析主題,顯示檢索結(jié)果,完成,選擇檢索工具|數(shù)據(jù)庫,確定檢索詞,構(gòu)造檢索表達(dá)式|檢索,修改檢索式,不滿意,激發(fā)新的需求,30,4.2 如何檢索一個(gè)特定的數(shù)據(jù)庫,了解數(shù)據(jù)庫,熟悉界面。 利用數(shù)據(jù)庫提供的檢索指南(幫助、FAQ)。 了解檢索與瀏覽模式(一般檢索、高級檢索、分類檢索、特色檢索等;按主題瀏覽、按出版物字順瀏覽等)。 檢索結(jié)果的獲得 全文閱讀工具(PDF、專用閱讀器),31,4.3 如何編制檢索式,例A:查找有關(guān)信息檢索的非英文文獻(xiàn) 信息information 檢索re
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年人教版(2024)一年級數(shù)學(xué)上冊階段測試試卷
- 2025年粵教版七年級科學(xué)上冊階段測試試卷
- 2025年華東師大版七年級化學(xué)下冊階段測試試卷含答案
- 如何預(yù)防花粉癥
- 癌痛患者的護(hù)理要點(diǎn)新進(jìn)展
- 幼兒園流鼻血預(yù)防方案
- 2025年度城市地下綜合管廊建設(shè)項(xiàng)目采購合同協(xié)議3篇
- 《遇到陌生人教案小班安全》
- 2025年度行業(yè)居間服務(wù)規(guī)范:居間費(fèi)最高5%居間合同細(xì)則3篇
- 2024年設(shè)備安裝安全規(guī)范協(xié)議版B版
- SIEMENS西門子SIMATICET200SP分布式I-O系統(tǒng)手冊
- 床旁教學(xué)方法
- 果膠與腸道菌群關(guān)聯(lián)
- DB11T 356-2017 公共廁所運(yùn)行管理規(guī)范
- 急診進(jìn)修護(hù)士匯報(bào)
- 信息安全意識培訓(xùn)課件
- 中學(xué)食堂食品安全保障機(jī)制輿情管理方案
- 江蘇省南京市2025屆高三第一次調(diào)研考試(一模)英語試題含解析
- 企業(yè)供應(yīng)鏈管理軟件使用合同
- 全國英語等級考試三級閱讀真題
- 數(shù)據(jù)庫原理-期末考試復(fù)習(xí)題及答案
評論
0/150
提交評論