計算機檢索技術(shù)概述課件_第1頁
計算機檢索技術(shù)概述課件_第2頁
計算機檢索技術(shù)概述課件_第3頁
計算機檢索技術(shù)概述課件_第4頁
計算機檢索技術(shù)概述課件_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四講計算機檢索技術(shù)概述第四講計算機檢索技術(shù)概述13.1計算機檢索簡況3.2計算機檢索的相關(guān)概念3.3檢索式的擬訂3.4檢索步驟3.1計算機檢索簡況23.1計算機檢索簡況計算機檢索指利用計算機及相關(guān)設(shè)備進行的文獻信息檢索。信息檢索技術(shù)正向兩個方向迅速發(fā)展:一是在深度上提高管理和組織信息的能力傳統(tǒng)信息檢索向全文文本、多媒體、多載體、多原理等新型信息檢索的發(fā)展.二是在廣度上提高管理和組織信息的能力文獻資源的網(wǎng)絡(luò)化和分布化,面向Internet中浩瀚無垠的資源。

3.1計算機檢索簡況計算機檢索指利用計算機及相31.檢索系統(tǒng)信息檢索系統(tǒng)包括兩個子系統(tǒng):存儲子系統(tǒng)和檢索子系統(tǒng)。2.聯(lián)機檢索利用與檢索系統(tǒng)或信息中心的主機連接,在中央處理機控制下查詢系統(tǒng)內(nèi)的數(shù)據(jù)庫,并能夠與系統(tǒng)實時對話,隨時調(diào)整檢索策略。3.數(shù)據(jù)庫是在計算機存儲設(shè)備上按一定方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。3.2計算機檢索的相關(guān)概念1.檢索系統(tǒng)3.2計算機檢索的相關(guān)概念4字段(field):如在數(shù)據(jù)庫中題名、作者、作者單位、期刊名、摘要、全文等等均是字段;一條記錄由多個字段值組成;對計算機檢索來說字段相當于檢索入口。字段(Field)記錄(Record)文檔(File)數(shù)據(jù)庫字段(field):如在數(shù)據(jù)庫中題名、作者、作者單位、期刊名5

常用字段縮寫:TI——Title文章題目AB——Abstract文章摘要KW——KeyWord關(guān)鍵詞AU——Author作者AF——Affiliation作者單位SO——Source文章來源(刊名信息等)ISSN(ISBN)——InternationalstandardSerial(book)NumberPY——Publicationyear出版年LA——Language語種常用字段縮寫:6計算機檢索技術(shù)概述課件7記錄(Record)——由若干字段組成的文獻單元,在全文數(shù)據(jù)庫中,一條記錄相當于一篇完整的文獻,在書目數(shù)據(jù)庫中,一條記錄相當于一條文摘或題錄。文檔(File)——由若干個邏輯記錄構(gòu)成的信息集合,是數(shù)據(jù)庫的基本內(nèi)容,分為順排文檔和倒排文檔。順排文擋是數(shù)據(jù)庫的主體內(nèi)容,倒排文檔是將記錄中的一切可檢字段或?qū)傩灾堤崛〕鰜?,按某種順序重新加以組織所得到的文檔。

順排文檔(記錄)倒排文檔(索引)數(shù)據(jù)庫(database)——由計算機進行處理的一定數(shù)量同類信息的有序集合,是用來存儲和查找文獻信息的電子化檢索工具。記錄(Record)——由若干字段組成的文獻單元,在全文數(shù)據(jù)8計算機檢索技術(shù)概述課件9計算機檢索技術(shù)概述課件10數(shù)據(jù)庫的類型書目數(shù)據(jù)庫全文數(shù)據(jù)庫文摘數(shù)據(jù)庫按信息處理層次劃分期刊論文數(shù)據(jù)庫書目及圖書全文數(shù)據(jù)庫專利數(shù)據(jù)庫學位論文數(shù)據(jù)庫產(chǎn)品數(shù)據(jù)庫按收錄的文獻類型劃分圖像數(shù)據(jù)庫文本數(shù)據(jù)庫數(shù)值數(shù)據(jù)庫聲音數(shù)據(jù)庫視頻數(shù)據(jù)庫多媒體數(shù)據(jù)庫按媒體信息劃分綜合性數(shù)據(jù)庫專業(yè)性數(shù)據(jù)庫按收錄文獻信息的范圍劃分單機數(shù)據(jù)庫聯(lián)機數(shù)據(jù)庫網(wǎng)絡(luò)數(shù)據(jù)庫按服務(wù)模式劃分數(shù)據(jù)庫的類型書目數(shù)據(jù)庫全文數(shù)據(jù)庫文摘數(shù)據(jù)庫按信息處理層次劃分113.3檢索式的擬訂3.3.1布爾邏輯檢索算符3.3.2位置檢索算符3.3.3截詞檢索算符3.3.4字段揭示及限制算符3.3.5其它符號3.3.6注意事項3.3檢索式的擬訂3.3.1布爾邏輯檢索算符12精確與模糊檢索

基本技術(shù)詞間位置檢索

加權(quán)檢索

布爾邏輯檢索

限定字段檢索

限定范圍檢索截詞檢索1234567精確與模糊檢索基本技術(shù)131.邏輯“與”(AND),表示為AandB或A*B2.邏輯“或”(OR),表示為AorB或A+B3.邏輯“非”(NOT),表示為AnotB或A-B

3.3.1布爾邏輯檢索算符1.邏輯“與”(AND),表示為AandB14邏輯“與”用“and”、“*”或者空格表示。在網(wǎng)絡(luò)搜索引擎中習慣用空格代替“and”。表示檢出的記錄必須同時包含所有的檢索詞,可以縮小檢索范圍,減少命中文獻量,提高查準率。ABAandB例:檢索“太陽能”文獻太陽能源邏輯“與”ABAandB例:檢索“太陽能”文獻太陽能15【實例】檢索“中國人民政府”這個網(wǎng)站,可以輸入“中國*政府”、“中國and政府”、“中國政府”等?!緦嵗繖z索課題“中國外匯儲備規(guī)模的研究”不是一篇文章,需要檢索有關(guān)的期刊文章,其檢索式宜表達為“中國and外匯and儲備and規(guī)模”【實例】檢索“中國人民政府”這個網(wǎng)站,可以輸入“中國*政府”16邏輯“或”

用“or”、“+”或逗號表示。在網(wǎng)絡(luò)搜索引擎中習慣用逗號代替“OR”。表示檢出的記錄中至少含有多個檢索詞中的任何一個,可以擴大檢索范圍,增加命中文獻量,防止漏檢。常用于連接同義詞,相關(guān)詞等。ABAorB例:檢索“光盤和磁盤”文獻光盤磁盤邏輯“或”ABAorB例:檢索“光盤和磁盤”文獻光盤17【實例】在搜索引擎中輸入“計算機OR多媒體ORWindows98”則查詢至少包含“計算機”、“多媒體”、“Windows98”三者之一的信息?!緦嵗吭谒阉饕嬷休斎搿坝嬎銠COR多媒體ORWindow18

邏輯“非”(NOT)表示檢索結(jié)果中排除含有某些詞的記錄,可以縮小檢索范圍,減少文獻輸出量,但并不一定能提高查準率。ABAnotB例:檢索“除核能以外有關(guān)能源”文獻能源核能邏輯“非”(NOT)ABAnotB例:檢索“除19【實例】輸入“automobilenotcar”,就要求查詢的結(jié)果中包含automobile(汽車),但同時不能包含car(小汽車)?!緦嵗吭谒阉饕嬷休斎搿半娨暸_-中央電視臺”,查詢結(jié)果不包含“中央電視臺”。【實例】輸入“automobilenotcar”,就要求20相同的檢索詞在不同的字段中檢索到的結(jié)果不同?!緦嵗坑谩吨形目萍计诳瘮?shù)據(jù)庫》檢索機械產(chǎn)品采用計算機輔助設(shè)計的論文。用不同字段作為途徑,如下所示:選擇”u=任意字段”輸入“計算機輔助*產(chǎn)品”,查出2902篇;選擇”m=題名或關(guān)鍵詞”輸入“計算機輔助*產(chǎn)品”,查出626篇;選擇“t=題名”輸入“計算機輔助*產(chǎn)品”,查出139篇;選擇“k=關(guān)鍵詞”輸入“計算機輔助*產(chǎn)品”,查出545篇;

檢索入口選擇“c=分類號”輸入“機械產(chǎn)品”的分類號“TH122”年限設(shè)定,查到11206條。

相同的檢索詞在不同的字段中檢索到的結(jié)果不同。【實例】用《中文21

也叫“鄰接檢索”,

表示兩個或多個檢索詞之間的關(guān)系檢索方式,常用的位置算符有:

1.w(with)

表示兩個檢索詞前后次序固定,二者之間只能間隔連字符、空格或者是逗號。

【實例】在OCLC中輸入communicationwsatellite;2.wN(withN)表示兩個檢索詞前后次序固定,二者之間最多間隔N個字符。

【實例】在EBSCO中輸入communicationw3satellite;3.3.2位置檢索算符也叫“鄰接檢索”,表示兩個或多個檢223.n(Near)表示兩個檢索詞可以互換順,二者之間只能間隔連字符、空格或者是逗號?!緦嵗吭贠CLC中輸入communicationnsatellite;4.nN(NearN)表示兩個檢索詞可以互換順,二者之間最多間隔N個字符。【實例】在EBSCO中輸入communicationn3satellite;比較:在EBSCO中輸入sourceandlaw、sourcew2law3.n(Near)表示兩個檢索詞可以互換順,二者之間只233.3.3截詞檢索算符檢索color檢索computer、microcomputer、minicomputer截詞符(通配符)——提高查全率,防止漏檢的有力手段,也可以簡化輸入,包括有限截詞和無限截詞,常用的截詞符有:*,?,#,!,$3.3.3截詞檢索算符檢索color24

有限截詞——一個符號表示一個字符,一般使用“?”(英文半角問號)代表0-1個字符。比如:chip?可檢索出:chips(右截斷)無限截詞——一個符號表示任意多個字符,標準符號是“*”,代表0-n個字符,也稱為通配符。比如:comput*可檢出:compute,Computer,computers,computing,Computerize等.注:不同的數(shù)據(jù)庫所用的截詞符不一樣,使用應(yīng)先查一下各數(shù)據(jù)庫的幫助加以確認3.3.3截詞檢索算符3.3.3截詞檢索算符25后截斷無限截斷如:physic??截詞檢索與截詞檢索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截斷中文數(shù)據(jù)庫里面習慣稱為“前方一致”后截斷無限截斷如:physic??截詞檢索與截詞檢索算符P26中截斷前截斷如:m?nmanmen如:*computerminicomputercomputermicrocomputer中文數(shù)據(jù)庫里面習慣稱為“后方一致”中截斷前截斷如:m?nmanmen如:*computer27Title(ti):computerPy>=2008La=english限定網(wǎng)站:site:link:限定網(wǎng)頁:inurl:midi滄海一聲笑限定文件類型:filetype:3.3.4字段限制檢索Title(ti):computer3.3.4字段限制283.3.5其它符號1.括號括在其中的操作符先起作用。三聚氰胺*(農(nóng)產(chǎn)品+雞蛋+牛奶+大米)

2.引號引號內(nèi)的檢索項以整體形式出現(xiàn)。如:informationretrieval表示informationANDretrieval

而“informationretrieval”則表示一個詞組3.個別數(shù)據(jù)庫使用的特殊符號某些搜索引擎使用加號(+)表示該單詞必須出現(xiàn)。在某些搜索引擎中輸入“+電腦+電話+傳真”就表示要查找的內(nèi)容必須要同時包含“電腦、電話、傳真”這三個關(guān)鍵詞。個別數(shù)據(jù)庫例如“國研網(wǎng)”、山東標準網(wǎng)使用“&”代替“and”;歐洲專利局光盤數(shù)據(jù)庫的“without”、美國專利商標局數(shù)據(jù)庫的“andnot”就是通用的“not”。3.3.5其它符號1.括號29

4.英語或漢語中都有許多虛詞,不能作為檢索詞。如:漢語中“的、地、得、了”等助詞;英語中的aaboutalsoandanyasatbebetweenbybothforsomesonotthiswith等介詞或冠詞等4.英語或漢語中都有許多虛詞,不能作為檢索詞。30

檢索策略是對檢索的全面策劃,在操作上主要指檢索式的編制和數(shù)據(jù)庫的選擇。檢索策略在計算機檢索中直接決定檢索結(jié)果的準與全。3.3.6檢索策略

檢索策略是對檢索的全面策劃,在操作上主要指檢索式31確定檢索詞切分:是對課題的語句以詞為單位進行切分,轉(zhuǎn)換為檢索的最小單元。例:檢索“吸煙與肺癌的關(guān)系研究”相關(guān)文獻。例:檢索“肺氣腫病人的血氧測定法”方面的相關(guān)文獻。注意:應(yīng)保持詞意義的完整。刪除:對不具有檢索意思的虛詞或過分寬泛的限定詞應(yīng)予以刪除。確定檢索詞32替換:是對表達不清晰或容易造成檢索誤差的詞用更明確、更具體的詞予以替換。如公交—>公共交通,綠色包裝->環(huán)保包裝等增加:針對一詞多義或者在檢索結(jié)果中有很多干擾信息時,可采用增加檢索詞達到“限義”的手段。替換:是對表達不清晰或容易造成檢索誤差的詞用更明確、更具體的33例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機械故障診斷中的應(yīng)用研究

1.本課題包含“神經(jīng)網(wǎng)絡(luò)”“旋轉(zhuǎn)機械”“故障診斷”三個概念,“應(yīng)用”和“研究”屬于意義過于寬泛的詞,不應(yīng)該作為檢索詞。2.擴展

神經(jīng)網(wǎng)絡(luò):相關(guān)的上位詞有人工智能旋轉(zhuǎn)機械故障診斷:相關(guān)詞有故障定位、故障檢測,上位詞有容錯技術(shù)3.檢索式:(神經(jīng)網(wǎng)絡(luò)OR人工智能)AND(旋轉(zhuǎn)機械)AND(故障診斷OR故障定位OR故障檢測OR容錯技術(shù))例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機械故障診斷中的應(yīng)用研究34檢索式示例1.檢索關(guān)于研究魯迅的論文,應(yīng)選擇什么檢索字段?!绢}解】必須選擇標題或者關(guān)鍵詞,不能選擇為作者途徑。2.“知識產(chǎn)權(quán)”一詞還可析出哪些隱含概念。【題解】“專利權(quán)”、“版權(quán)”、“著作權(quán)”等概念。3.用《中文科技期刊數(shù)據(jù)庫》檢索著名經(jīng)濟學家胡鞍鋼在《公共管理學報

》上面發(fā)表的論文?!绢}解】“A=胡鞍鋼*J=公共管理學報

”。4.寫出“研究法律與經(jīng)濟和政治的關(guān)系“的課題的檢索式?!绢}解】“法律*(經(jīng)濟+政治)”5.檢索有關(guān)“中國國內(nèi)商業(yè)銀行的信貸管理或信貸風險的研究”方面的相關(guān)文獻?!绢}解】(商業(yè)銀行-外資銀行)*(信貸管理+信貸風險)檢索式示例1.檢索關(guān)于研究魯迅的論文,應(yīng)選擇什么檢索字段。353.4檢索步驟1.檢索準備2.選擇合適的檢索工具3.選擇檢索途徑4.擬訂檢索式5.實施檢索6.篩選文獻7.索取原文

3.4檢索步驟1.檢索準備361.弄清課題學科屬性、專業(yè)范圍及其相關(guān)內(nèi)容首先明白是單一學科還是涉及多學科或跨學科。當課題涉及多學科時,以主要學科為檢索重點,次要學科為補充。例:超聲波技術(shù)在獸醫(yī)上的應(yīng)用。3.4.1檢索準備1.弄清課題學科屬性、專業(yè)范圍及其相關(guān)內(nèi)容3.4.1檢索準備372.弄清檢索課題的信息類型和時間要求

時間要求上,研究層次低、學科發(fā)展快的,則檢索的時段可以適當縮短。例如:查“超聲波技術(shù)在醫(yī)學上的應(yīng)用”和查國內(nèi)外研究社會保障制度的文章。3.考慮課題的特殊要求4.明確用戶自身的信息需求2.弄清檢索課題的信息類型和時間要求38

1.要從概念入手,而不是從字面意思入手;

2.概念擴展時要考慮同義詞、相關(guān)詞、上位詞/下位詞等(既詞表中提到的用、代、分、屬、參、族),還要注意中英文混用的現(xiàn)象;3.當課題比較生疏時,應(yīng)當首先利用百科全書、圖書等弄清楚概念,了解課題的有關(guān)專業(yè)知識,弄清楚課

題的內(nèi)容和要解決的問題以及解決該問題的初步設(shè)想等,進而確定檢索的主題范圍。

4.人文社會科學的檢索,如果是回溯檢索,應(yīng)該熟悉不同年代所使用的概念和術(shù)語

5.忽略那些意義過于寬泛、通用的詞,比如:“研究”、“應(yīng)用”“探討”等。

分析課題時須注意的問題分析課題時須注意的問題39

明確檢索要求,選擇數(shù)據(jù)庫選擇數(shù)據(jù)庫要考慮以下因素:1.檢索目的:檢索的時間范圍、文獻類型、檢索深度為題錄、文摘還是全文等等2.檢索結(jié)果:對于研究生做學位論文來說,做課題前應(yīng)充分了解一下本課題國內(nèi)外的研究現(xiàn)狀(即論文的綜述部分),這時應(yīng)對該課題進行較全面的檢索,包括綜述性的文章,要求全面;對于該課題的核心部分,即該課題所要解決的具體問題,創(chuàng)新的地方,則需要準,技術(shù)細節(jié)越細越好。3.檢索內(nèi)容所屬學科,對與自己相關(guān)的數(shù)據(jù)庫要有一個全面的了解.明確檢索要求,選擇數(shù)據(jù)庫選擇數(shù)據(jù)庫要考慮以下因素:403.4.6篩選文獻

應(yīng)當根據(jù)課題的科學技術(shù)要點,將檢索結(jié)果分為密切相關(guān)文獻和一般相關(guān)文獻。對相關(guān)文獻情況及對相關(guān)文獻的主要論點進行對比分析。3.4.6篩選文獻應(yīng)當根據(jù)課題的科學技術(shù)要點,將檢41

1.網(wǎng)上下載原文2.就近借閱3.文獻傳遞

收獲3.4.7獲取原文

1.網(wǎng)上下載原文收獲3.4.7獲取原文42【例題】華中科技大學學生已知一些理工科類大學學位論文題目,如何獲得原文?

【題解】方法1:使用華中科技大學圖書館的館藏目錄查詢到圖書形式的學位論文,直接借閱:方法2:使用圖書館購買的學位論文數(shù)據(jù)庫檢索,可以直接查看近年來的原文。方法3:本地沒有的則通過網(wǎng)上檢索得到題目后,再從高校圖書館、國家科技圖書文獻中心(NSTL)通過館際互借尋找全文,收費較低,時差也短。方法4:外文圖書可以通過OCLC獲取?!纠}】華中科技大學學生已知一些理工科類大學學位論文題目,如43

檢索效率

查全率和查準率是判定檢索效果的主要指標。查全率:

(RecallRatio)指系統(tǒng)在進行某一檢索時,檢索出的相關(guān)文獻量與系統(tǒng)文獻庫中相關(guān)文獻總量的比率。用公式表示為:檢出的相關(guān)文獻量

系統(tǒng)數(shù)據(jù)庫中的相關(guān)文獻總量

R=

X100%檢索效率查全率:(RecallRatio)指44擴大檢索范圍,提高查全率的方法1、跨庫檢索2、選擇較大檢索范圍的字段如摘要3、外文單詞使用截詞符4、使用上位詞(如飛行器____航天飛機____載人航天飛機)5、考慮同義詞或近義詞(使用布爾邏輯符or連接)6、逐步擴大算符的檢索范圍,逐步提高查全率的算符依次是:位置算符wwnnear邏輯算符andor擴大檢索范圍,提高查全率的方法45查準率:

(PrecisionRatio)指系統(tǒng)在進行某一檢索時,檢出的相關(guān)文獻量與檢出文獻總量的比率。用公式表示為:

檢出的相關(guān)文獻量

檢出的文獻總量

P=

X100%查準率:(PrecisionRatio)指系統(tǒng)在進行某一46縮小檢索范圍,提高查準率的方法1、選擇專業(yè)性檢索工具如使用產(chǎn)品數(shù)據(jù)庫、特種搜索引擎。2、選擇檢索范圍較小的字段3、逐步縮小算符的檢索范圍,逐步提高查準率的算符依次是:邏輯算符orand位置算符near

wnw;使用算符not排除干擾信息。4、使用二次檢索5、使用下位詞縮小檢索范圍,提高查準率的方法47OCLC檢索結(jié)果OCLC檢索結(jié)果48EBSCO檢索結(jié)果EBSCO檢索結(jié)果49OCLC檢索結(jié)果OCLC檢索結(jié)果50EBSCO檢索結(jié)果EBSCO檢索結(jié)果51EBSCO檢索結(jié)果EBSCO檢索結(jié)果52EBSCO檢索結(jié)果EBSCO檢索結(jié)果53第四講計算機檢索技術(shù)概述第四講計算機檢索技術(shù)概述543.1計算機檢索簡況3.2計算機檢索的相關(guān)概念3.3檢索式的擬訂3.4檢索步驟3.1計算機檢索簡況553.1計算機檢索簡況計算機檢索指利用計算機及相關(guān)設(shè)備進行的文獻信息檢索。信息檢索技術(shù)正向兩個方向迅速發(fā)展:一是在深度上提高管理和組織信息的能力傳統(tǒng)信息檢索向全文文本、多媒體、多載體、多原理等新型信息檢索的發(fā)展.二是在廣度上提高管理和組織信息的能力文獻資源的網(wǎng)絡(luò)化和分布化,面向Internet中浩瀚無垠的資源。

3.1計算機檢索簡況計算機檢索指利用計算機及相561.檢索系統(tǒng)信息檢索系統(tǒng)包括兩個子系統(tǒng):存儲子系統(tǒng)和檢索子系統(tǒng)。2.聯(lián)機檢索利用與檢索系統(tǒng)或信息中心的主機連接,在中央處理機控制下查詢系統(tǒng)內(nèi)的數(shù)據(jù)庫,并能夠與系統(tǒng)實時對話,隨時調(diào)整檢索策略。3.數(shù)據(jù)庫是在計算機存儲設(shè)備上按一定方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。3.2計算機檢索的相關(guān)概念1.檢索系統(tǒng)3.2計算機檢索的相關(guān)概念57字段(field):如在數(shù)據(jù)庫中題名、作者、作者單位、期刊名、摘要、全文等等均是字段;一條記錄由多個字段值組成;對計算機檢索來說字段相當于檢索入口。字段(Field)記錄(Record)文檔(File)數(shù)據(jù)庫字段(field):如在數(shù)據(jù)庫中題名、作者、作者單位、期刊名58

常用字段縮寫:TI——Title文章題目AB——Abstract文章摘要KW——KeyWord關(guān)鍵詞AU——Author作者AF——Affiliation作者單位SO——Source文章來源(刊名信息等)ISSN(ISBN)——InternationalstandardSerial(book)NumberPY——Publicationyear出版年LA——Language語種常用字段縮寫:59計算機檢索技術(shù)概述課件60記錄(Record)——由若干字段組成的文獻單元,在全文數(shù)據(jù)庫中,一條記錄相當于一篇完整的文獻,在書目數(shù)據(jù)庫中,一條記錄相當于一條文摘或題錄。文檔(File)——由若干個邏輯記錄構(gòu)成的信息集合,是數(shù)據(jù)庫的基本內(nèi)容,分為順排文檔和倒排文檔。順排文擋是數(shù)據(jù)庫的主體內(nèi)容,倒排文檔是將記錄中的一切可檢字段或?qū)傩灾堤崛〕鰜?,按某種順序重新加以組織所得到的文檔。

順排文檔(記錄)倒排文檔(索引)數(shù)據(jù)庫(database)——由計算機進行處理的一定數(shù)量同類信息的有序集合,是用來存儲和查找文獻信息的電子化檢索工具。記錄(Record)——由若干字段組成的文獻單元,在全文數(shù)據(jù)61計算機檢索技術(shù)概述課件62計算機檢索技術(shù)概述課件63數(shù)據(jù)庫的類型書目數(shù)據(jù)庫全文數(shù)據(jù)庫文摘數(shù)據(jù)庫按信息處理層次劃分期刊論文數(shù)據(jù)庫書目及圖書全文數(shù)據(jù)庫專利數(shù)據(jù)庫學位論文數(shù)據(jù)庫產(chǎn)品數(shù)據(jù)庫按收錄的文獻類型劃分圖像數(shù)據(jù)庫文本數(shù)據(jù)庫數(shù)值數(shù)據(jù)庫聲音數(shù)據(jù)庫視頻數(shù)據(jù)庫多媒體數(shù)據(jù)庫按媒體信息劃分綜合性數(shù)據(jù)庫專業(yè)性數(shù)據(jù)庫按收錄文獻信息的范圍劃分單機數(shù)據(jù)庫聯(lián)機數(shù)據(jù)庫網(wǎng)絡(luò)數(shù)據(jù)庫按服務(wù)模式劃分數(shù)據(jù)庫的類型書目數(shù)據(jù)庫全文數(shù)據(jù)庫文摘數(shù)據(jù)庫按信息處理層次劃分643.3檢索式的擬訂3.3.1布爾邏輯檢索算符3.3.2位置檢索算符3.3.3截詞檢索算符3.3.4字段揭示及限制算符3.3.5其它符號3.3.6注意事項3.3檢索式的擬訂3.3.1布爾邏輯檢索算符65精確與模糊檢索

基本技術(shù)詞間位置檢索

加權(quán)檢索

布爾邏輯檢索

限定字段檢索

限定范圍檢索截詞檢索1234567精確與模糊檢索基本技術(shù)661.邏輯“與”(AND),表示為AandB或A*B2.邏輯“或”(OR),表示為AorB或A+B3.邏輯“非”(NOT),表示為AnotB或A-B

3.3.1布爾邏輯檢索算符1.邏輯“與”(AND),表示為AandB67邏輯“與”用“and”、“*”或者空格表示。在網(wǎng)絡(luò)搜索引擎中習慣用空格代替“and”。表示檢出的記錄必須同時包含所有的檢索詞,可以縮小檢索范圍,減少命中文獻量,提高查準率。ABAandB例:檢索“太陽能”文獻太陽能源邏輯“與”ABAandB例:檢索“太陽能”文獻太陽能68【實例】檢索“中國人民政府”這個網(wǎng)站,可以輸入“中國*政府”、“中國and政府”、“中國政府”等?!緦嵗繖z索課題“中國外匯儲備規(guī)模的研究”不是一篇文章,需要檢索有關(guān)的期刊文章,其檢索式宜表達為“中國and外匯and儲備and規(guī)?!薄緦嵗繖z索“中國人民政府”這個網(wǎng)站,可以輸入“中國*政府”69邏輯“或”

用“or”、“+”或逗號表示。在網(wǎng)絡(luò)搜索引擎中習慣用逗號代替“OR”。表示檢出的記錄中至少含有多個檢索詞中的任何一個,可以擴大檢索范圍,增加命中文獻量,防止漏檢。常用于連接同義詞,相關(guān)詞等。ABAorB例:檢索“光盤和磁盤”文獻光盤磁盤邏輯“或”ABAorB例:檢索“光盤和磁盤”文獻光盤70【實例】在搜索引擎中輸入“計算機OR多媒體ORWindows98”則查詢至少包含“計算機”、“多媒體”、“Windows98”三者之一的信息?!緦嵗吭谒阉饕嬷休斎搿坝嬎銠COR多媒體ORWindow71

邏輯“非”(NOT)表示檢索結(jié)果中排除含有某些詞的記錄,可以縮小檢索范圍,減少文獻輸出量,但并不一定能提高查準率。ABAnotB例:檢索“除核能以外有關(guān)能源”文獻能源核能邏輯“非”(NOT)ABAnotB例:檢索“除72【實例】輸入“automobilenotcar”,就要求查詢的結(jié)果中包含automobile(汽車),但同時不能包含car(小汽車)?!緦嵗吭谒阉饕嬷休斎搿半娨暸_-中央電視臺”,查詢結(jié)果不包含“中央電視臺”?!緦嵗枯斎搿癮utomobilenotcar”,就要求73相同的檢索詞在不同的字段中檢索到的結(jié)果不同?!緦嵗坑谩吨形目萍计诳瘮?shù)據(jù)庫》檢索機械產(chǎn)品采用計算機輔助設(shè)計的論文。用不同字段作為途徑,如下所示:選擇”u=任意字段”輸入“計算機輔助*產(chǎn)品”,查出2902篇;選擇”m=題名或關(guān)鍵詞”輸入“計算機輔助*產(chǎn)品”,查出626篇;選擇“t=題名”輸入“計算機輔助*產(chǎn)品”,查出139篇;選擇“k=關(guān)鍵詞”輸入“計算機輔助*產(chǎn)品”,查出545篇;

檢索入口選擇“c=分類號”輸入“機械產(chǎn)品”的分類號“TH122”年限設(shè)定,查到11206條。

相同的檢索詞在不同的字段中檢索到的結(jié)果不同?!緦嵗坑谩吨形?4

也叫“鄰接檢索”,

表示兩個或多個檢索詞之間的關(guān)系檢索方式,常用的位置算符有:

1.w(with)

表示兩個檢索詞前后次序固定,二者之間只能間隔連字符、空格或者是逗號。

【實例】在OCLC中輸入communicationwsatellite;2.wN(withN)表示兩個檢索詞前后次序固定,二者之間最多間隔N個字符。

【實例】在EBSCO中輸入communicationw3satellite;3.3.2位置檢索算符也叫“鄰接檢索”,表示兩個或多個檢753.n(Near)表示兩個檢索詞可以互換順,二者之間只能間隔連字符、空格或者是逗號?!緦嵗吭贠CLC中輸入communicationnsatellite;4.nN(NearN)表示兩個檢索詞可以互換順,二者之間最多間隔N個字符?!緦嵗吭贓BSCO中輸入communicationn3satellite;比較:在EBSCO中輸入sourceandlaw、sourcew2law3.n(Near)表示兩個檢索詞可以互換順,二者之間只763.3.3截詞檢索算符檢索color檢索computer、microcomputer、minicomputer截詞符(通配符)——提高查全率,防止漏檢的有力手段,也可以簡化輸入,包括有限截詞和無限截詞,常用的截詞符有:*,?,#,!,$3.3.3截詞檢索算符檢索color77

有限截詞——一個符號表示一個字符,一般使用“?”(英文半角問號)代表0-1個字符。比如:chip?可檢索出:chips(右截斷)無限截詞——一個符號表示任意多個字符,標準符號是“*”,代表0-n個字符,也稱為通配符。比如:comput*可檢出:compute,Computer,computers,computing,Computerize等.注:不同的數(shù)據(jù)庫所用的截詞符不一樣,使用應(yīng)先查一下各數(shù)據(jù)庫的幫助加以確認3.3.3截詞檢索算符3.3.3截詞檢索算符78后截斷無限截斷如:physic??截詞檢索與截詞檢索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截斷中文數(shù)據(jù)庫里面習慣稱為“前方一致”后截斷無限截斷如:physic??截詞檢索與截詞檢索算符P79中截斷前截斷如:m?nmanmen如:*computerminicomputercomputermicrocomputer中文數(shù)據(jù)庫里面習慣稱為“后方一致”中截斷前截斷如:m?nmanmen如:*computer80Title(ti):computerPy>=2008La=english限定網(wǎng)站:site:link:限定網(wǎng)頁:inurl:midi滄海一聲笑限定文件類型:filetype:3.3.4字段限制檢索Title(ti):computer3.3.4字段限制813.3.5其它符號1.括號括在其中的操作符先起作用。三聚氰胺*(農(nóng)產(chǎn)品+雞蛋+牛奶+大米)

2.引號引號內(nèi)的檢索項以整體形式出現(xiàn)。如:informationretrieval表示informationANDretrieval

而“informationretrieval”則表示一個詞組3.個別數(shù)據(jù)庫使用的特殊符號某些搜索引擎使用加號(+)表示該單詞必須出現(xiàn)。在某些搜索引擎中輸入“+電腦+電話+傳真”就表示要查找的內(nèi)容必須要同時包含“電腦、電話、傳真”這三個關(guān)鍵詞。個別數(shù)據(jù)庫例如“國研網(wǎng)”、山東標準網(wǎng)使用“&”代替“and”;歐洲專利局光盤數(shù)據(jù)庫的“without”、美國專利商標局數(shù)據(jù)庫的“andnot”就是通用的“not”。3.3.5其它符號1.括號82

4.英語或漢語中都有許多虛詞,不能作為檢索詞。如:漢語中“的、地、得、了”等助詞;英語中的aaboutalsoandanyasatbebetweenbybothforsomesonotthiswith等介詞或冠詞等4.英語或漢語中都有許多虛詞,不能作為檢索詞。83

檢索策略是對檢索的全面策劃,在操作上主要指檢索式的編制和數(shù)據(jù)庫的選擇。檢索策略在計算機檢索中直接決定檢索結(jié)果的準與全。3.3.6檢索策略

檢索策略是對檢索的全面策劃,在操作上主要指檢索式84確定檢索詞切分:是對課題的語句以詞為單位進行切分,轉(zhuǎn)換為檢索的最小單元。例:檢索“吸煙與肺癌的關(guān)系研究”相關(guān)文獻。例:檢索“肺氣腫病人的血氧測定法”方面的相關(guān)文獻。注意:應(yīng)保持詞意義的完整。刪除:對不具有檢索意思的虛詞或過分寬泛的限定詞應(yīng)予以刪除。確定檢索詞85替換:是對表達不清晰或容易造成檢索誤差的詞用更明確、更具體的詞予以替換。如公交—>公共交通,綠色包裝->環(huán)保包裝等增加:針對一詞多義或者在檢索結(jié)果中有很多干擾信息時,可采用增加檢索詞達到“限義”的手段。替換:是對表達不清晰或容易造成檢索誤差的詞用更明確、更具體的86例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機械故障診斷中的應(yīng)用研究

1.本課題包含“神經(jīng)網(wǎng)絡(luò)”“旋轉(zhuǎn)機械”“故障診斷”三個概念,“應(yīng)用”和“研究”屬于意義過于寬泛的詞,不應(yīng)該作為檢索詞。2.擴展

神經(jīng)網(wǎng)絡(luò):相關(guān)的上位詞有人工智能旋轉(zhuǎn)機械故障診斷:相關(guān)詞有故障定位、故障檢測,上位詞有容錯技術(shù)3.檢索式:(神經(jīng)網(wǎng)絡(luò)OR人工智能)AND(旋轉(zhuǎn)機械)AND(故障診斷OR故障定位OR故障檢測OR容錯技術(shù))例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機械故障診斷中的應(yīng)用研究87檢索式示例1.檢索關(guān)于研究魯迅的論文,應(yīng)選擇什么檢索字段?!绢}解】必須選擇標題或者關(guān)鍵詞,不能選擇為作者途徑。2.“知識產(chǎn)權(quán)”一詞還可析出哪些隱含概念?!绢}解】“專利權(quán)”、“版權(quán)”、“著作權(quán)”等概念。3.用《中文科技期刊數(shù)據(jù)庫》檢索著名經(jīng)濟學家胡鞍鋼在《公共管理學報

》上面發(fā)表的論文?!绢}解】“A=胡鞍鋼*J=公共管理學報

”。4.寫出“研究法律與經(jīng)濟和政治的關(guān)系“的課題的檢索式。【題解】“法律*(經(jīng)濟+政治)”5.檢索有關(guān)“中國國內(nèi)商業(yè)銀行的信貸管理或信貸風險的研究”方面的相關(guān)文獻。【題解】(商業(yè)銀行-外資銀行)*(信貸管理+信貸風險)檢索式示例1.檢索關(guān)于研究魯迅的論文,應(yīng)選擇什么檢索字段。883.4檢索步驟1.檢索準備2.選擇合適的檢索工具3.選擇檢索途徑4.擬訂檢索式5.實施檢索6.篩選文獻7.索取原文

3.4檢索步驟1.檢索準備891.弄清課題學科屬性、專業(yè)范圍及其相關(guān)內(nèi)容首先明白是單一學科還是涉及多學科或跨學科。當課題涉及多學科時,以主要學科為檢索重點,次要學科為補充。例:超聲波技術(shù)在獸醫(yī)上的應(yīng)用。3.4.1檢索準備1.弄清課題學科屬性、專業(yè)范圍及其相關(guān)內(nèi)容3.4.1檢索準備902.弄清檢索課題的信息類型和時間要求

時間要求上,研究層次低、學科發(fā)展快的,則檢索的時段可以適當縮短。例如:查“超聲波技術(shù)在醫(yī)學上的應(yīng)用”和查國內(nèi)外研究社會保障制度的文章。3.考慮課題的特殊要求4.明確用戶自身的信息需求2.弄清檢索課題的信息類型和時間要求91

1.要從概念入手,而不是從字面意思入手;

2.概念擴展時要考慮同義詞、相關(guān)詞、上位詞/下位詞等(既詞表中提到的用、代、分、屬、參、族),還要注意中英文混用的現(xiàn)象;3.當課題比較生疏時,應(yīng)當首先利用百科全書、圖書等弄清楚概念,了解課題的有關(guān)專業(yè)知識,弄清楚課

題的內(nèi)容和要解決的問題以及解決該問題的初步設(shè)想等,進而確定檢索的主題范圍。

4.人文社會科學的檢索,如果是回溯檢索,應(yīng)該熟悉不同年代所使用的概念和術(shù)語

5.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論