文獻(xiàn)檢索課件第一章0911_第1頁(yè)
文獻(xiàn)檢索課件第一章0911_第2頁(yè)
文獻(xiàn)檢索課件第一章0911_第3頁(yè)
文獻(xiàn)檢索課件第一章0911_第4頁(yè)
文獻(xiàn)檢索課件第一章0911_第5頁(yè)
已閱讀5頁(yè),還剩107頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)信息檢索根底知識(shí)哈工大圖書館信息咨詢部學(xué)習(xí)文獻(xiàn)檢索課的目的以最少的時(shí)間、精力獲取自己需要的信息學(xué)習(xí)文獻(xiàn)檢索課的目的Whereisit?獲取信息的總路線如何判斷自己已具備了信息素質(zhì)美國(guó)大學(xué)與研究圖書館協(xié)會(huì)(ACRL)制定的高等教育信息素質(zhì)教育標(biāo)準(zhǔn)能夠獨(dú)立決定所需要信息的種類和程度能夠高效的獲取需要的信息能夠根據(jù)現(xiàn)有的知識(shí)背景和評(píng)價(jià)標(biāo)準(zhǔn)對(duì)信息及其來(lái)源評(píng)價(jià)及遴選能夠有效的利用信息到達(dá)某一特定的目的能夠在信息利用過(guò)程中遵守相關(guān)的法律法規(guī)計(jì)算機(jī)信息檢索根底知識(shí)知識(shí)的定義知識(shí)是人類在認(rèn)識(shí)和改造世界的社會(huì)實(shí)踐中獲得的對(duì)事物本質(zhì)認(rèn)識(shí)的成果和結(jié)晶,即人類通過(guò)有目的、有區(qū)別、有選擇地利用信息,對(duì)自然界、人類社會(huì)及思維方式與運(yùn)動(dòng)規(guī)律的認(rèn)識(shí)、分析與掌握,并通過(guò)人的大腦進(jìn)行思維整合使信息系統(tǒng)化而構(gòu)成知識(shí),因此,知識(shí)僅存在于人類社會(huì)。

文獻(xiàn)的定義記錄有知識(shí)的一切載體如:甲骨文、碑刻、圖書、連續(xù)出版物、錄音磁帶、電影片、光盤等。

文獻(xiàn)的類型按文獻(xiàn)的加工程度劃分零次文獻(xiàn)〔RawLiterature):未以公開形式出版或未經(jīng)正式渠道流通的文獻(xiàn),如文章草稿、私人筆記、實(shí)驗(yàn)記錄、會(huì)議記錄等。一次文獻(xiàn)〔PrimaryLiterature〕:是作者以生產(chǎn)或研究成果為依據(jù)而創(chuàng)作的原始文獻(xiàn)。如,期刊論文、學(xué)位論文、專利文獻(xiàn)、會(huì)議文獻(xiàn)、研究報(bào)告、專著、譯文等。

文獻(xiàn)的類型按文獻(xiàn)的加工程度劃分二次文獻(xiàn)〔SecondaryLiterature〕:將無(wú)序的一次文獻(xiàn)進(jìn)行收集、整理,著錄其特征并以規(guī)定的格式編制成為便于管理和查找文獻(xiàn)的工具,即檢索工具。如目錄、題錄或索引、文摘等。三次文獻(xiàn)〔TertiaryLiterature〕:是指在利用二次文獻(xiàn)的根底上,對(duì)一次文獻(xiàn)的內(nèi)容經(jīng)閱讀研究,濃縮提煉而編寫成的文獻(xiàn)。如科技動(dòng)態(tài)、專題綜述、決策參考指南、進(jìn)展等。

事物運(yùn)動(dòng)信息知識(shí)新的信息文獻(xiàn)產(chǎn)生人腦有序化用于實(shí)踐記錄在載體上傳遞運(yùn)用后信息、知識(shí)、文獻(xiàn)的關(guān)系信息檢索的根本原理存儲(chǔ)過(guò)程--對(duì)文獻(xiàn)進(jìn)行標(biāo)引,使之有序化、系統(tǒng)化,成為有功能的檢索工具或檢索系統(tǒng)。檢索過(guò)程--根據(jù)需求,確定提問式,查找到所需要信息檢索是信息組織的反變換過(guò)程。信息組織的目的是將零散的信息組成一個(gè)有序的體系,檢索的目的那么是迅速?gòu)倪@個(gè)體系中搜尋所需的信息。

信息檢索原理可從信息檢索過(guò)程得到很好的詮釋,如以下圖

檢索提問匹配計(jì)算數(shù)據(jù)庫(kù)〔檢索工具〕

信息檢索語(yǔ)言

是信息組織與信息檢索時(shí)所用的語(yǔ)言,也稱文獻(xiàn)檢索語(yǔ)言、情報(bào)語(yǔ)言等?!惨弧撤诸悪z索語(yǔ)言用分類法來(lái)表達(dá)各種信息資源的概念,將各種概念按照學(xué)科、專業(yè)性質(zhì)進(jìn)行分類和系統(tǒng)排列。集中表達(dá)學(xué)科的系統(tǒng)性,反映事物的附屬、派生關(guān)系,由上至下,從總到分層層展開,是一種等級(jí)體系?!惨弧撤诸悪z索語(yǔ)言廣泛用于圖書資料的是圖書分類法中國(guó)圖書分類法中國(guó)科學(xué)院圖書分類法杜威十進(jìn)制分類法國(guó)際十進(jìn)制分類法中國(guó)圖書館分類法類目簡(jiǎn)表5個(gè)基本部類22個(gè)基本大類馬列、毛澤東思想A馬列、毛澤東思想哲學(xué)B哲學(xué)、宗教社會(huì)科學(xué)C社會(huì)科學(xué)總論;D政治、法律;E軍事;F經(jīng)濟(jì)G文化、科學(xué)、教育、體育;H語(yǔ)言、文字;I文學(xué);J藝術(shù);K歷史、地理自然科學(xué)N自然科學(xué)總論;O數(shù)理科學(xué)和化學(xué);P天文學(xué)、地球科學(xué);Q生物科學(xué);R醫(yī)學(xué)、衛(wèi)生;S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù);U交通運(yùn)輸;V航空、航天;X環(huán)境科學(xué)、勞動(dòng)保護(hù)科學(xué)(安全科學(xué))綜合性圖書Z綜合性圖書〔一〕分類檢索語(yǔ)言

〔二〕主題法檢索語(yǔ)言是利用詞語(yǔ)來(lái)表達(dá)信息資源中論述的主題概念。用來(lái)表達(dá)信息內(nèi)容的詞語(yǔ)稱為主題詞。用主題詞匯表達(dá)各種概念,按字母順序排列。包括控制詞語(yǔ)言、敘詞語(yǔ)言等?!捕持黝}法檢索語(yǔ)言三個(gè)根本特征著眼于從事物的特性方面去提示文獻(xiàn)主題采用文字符號(hào)按字順排列關(guān)鍵詞、敘詞的比較關(guān)鍵詞Keyword敘詞(單元詞)Descriptor未經(jīng)規(guī)范化的名詞規(guī)范化的名詞必須是文獻(xiàn)或標(biāo)題中抽出的詞匯可以是文獻(xiàn)中的詞匯,也可以不是1〕邏輯與AND〔*〕邏輯與AND〔*〕:這是一種用于交叉概念或限定關(guān)系的組配,可以縮小檢索范圍,提高查準(zhǔn)率?!纠坎檎摇案邚?qiáng)度低合金鋼〞方面的文獻(xiàn),可以將概念分解為:“highstrength〞、“l(fā)owalloy〞和“steel〞三個(gè)根本概念。如用A、B、C三個(gè)圓分別代表“steel〞、“highstrength〞和“l(fā)owalloy〞,那么三圓交叉的斜線局部才是三個(gè)檢索詞同時(shí)存在的文獻(xiàn)記錄。2〕邏輯或OR〔+〕邏輯或OR〔+〕:這是一種用于并列概念的組配,可以擴(kuò)大檢索范圍,防止漏檢,提高了查全率?!纠坎檎矣嘘P(guān)“太陽(yáng)能〞方面的文獻(xiàn),不能確定主題詞用“sun〞或“solar〞,那么采用“或〞組配。如用A、B兩圓分別代表“sun〞或“solar〞,那么斜線局部為其中任何一個(gè)詞或兩個(gè)詞同時(shí)存在的文獻(xiàn)記錄。3〕邏輯非NOT〔–〕邏輯非NOT〔–〕:用于從原來(lái)的檢索范圍中排除不需要的概念或影響檢索結(jié)果的概念。用邏輯非,能夠縮小命中文獻(xiàn)范圍,提高查準(zhǔn)率。【例】查找“不包括核能的能源〞的文獻(xiàn),用A、B兩圓分別代表“energy〞、“nuclear〞,斜線局部從energy中排除了nuclear的文獻(xiàn)。1〕后截?cái)嗬?,輸入computer*,那么前8個(gè)字符為computer的所有詞均滿足條件。因而能檢出含有computers、computered等相關(guān)詞。輸入computer??可檢出含有computer、computers、computered的文獻(xiàn)。注意:使用后截?cái)嘤锌赡軝z索出無(wú)關(guān)詞匯,尤其是在使用無(wú)限后截?cái)鄷r(shí),所選詞干不能太短,否那么將造成大量誤檢,或發(fā)生溢出,導(dǎo)致檢索失敗。2〕前截?cái)嗨鼘⒔卦~符號(hào)置于一個(gè)字符串左方,表示其左面的有限或無(wú)限個(gè)字符不影響該字符串的檢索,也稱為左截?cái)唷臋z索性質(zhì)上講,前截?cái)嗍乔胺揭恢聶z索。例如,輸入*computer可以檢索出microcomputer、minicomputer、computer等詞匯。3〕中間截?cái)嗨鼘⒔卦~符號(hào)置于一個(gè)檢索詞的中間。它對(duì)于解決英、美不同拼法、不規(guī)那么的單、復(fù)數(shù)變化等很有用。例如,analy?e表示analyze和analyse,wom?n表示woman和women等。4〕前后截?cái)嗨菍⑶敖財(cái)嗪秃蠼財(cái)嘟Y(jié)合使用。例如,*Computer??表示minicomputers。3.位置檢索位置檢索又稱鄰近檢索,用位置算符表示檢索詞之間的位置鄰近關(guān)系。常用的位置算符有以下幾種:(W)算符、(nW)算符、(N)算符、(nN)算符、(S)算符、(F)算符。1〕(W)算符W是With的縮寫,(W)表示其兩側(cè)的檢索詞必須按前后順序出現(xiàn)在記錄中,在兩詞之間不能插入其他詞,只可能有空格或一個(gè)標(biāo)點(diǎn)符號(hào)。(W)算符嚴(yán)密性較強(qiáng),它根本等價(jià)于詞組檢索,可以簡(jiǎn)寫為()。例如,online()information()retrieval2〕(nW)算符W是Words的縮寫,n為自然數(shù)。(nW)表示其兩側(cè)的檢索詞之間允許最多插入n個(gè)詞,但它們之間的位置不能顛倒。如laser(1W)priter可檢出“l(fā)aserpriter〞、“l(fā)asercolourpriter〞和“l(fā)aserandpriter〞3〕(N)算符N是near的縮寫,(N)表示其兩側(cè)的檢索詞必須彼此相鄰,并且這兩個(gè)檢索詞的次序任意。如factory(N)automation可檢出factoryautomation和automationfactory的信息。4〕(nN)算符表示在其兩側(cè)的檢索詞之間允許最多插入n個(gè)單詞,且兩詞詞序可以改變。例如,information(1N)retrieval可檢出informationretrieval或retrievalofinformation的信息5〕(S)算符S是subfield的縮寫,(S)表示其兩側(cè)的檢索詞必須出現(xiàn)在同一子字段,即一個(gè)句子或短語(yǔ)中,詞序不限,并且夾在其間的詞量不限。例如,computer(S)application只要computer和application在一個(gè)句子或短語(yǔ)中即為命中文獻(xiàn)。6〕(F)算符F是field的縮寫,(F)表示其兩側(cè)的檢索詞必須出現(xiàn)在同一個(gè)字段中,如篇名字段、敘詞字段、文摘字段等,詞序不限,并且夾在其間的詞量不限。例如,Pollution(F)control表示一篇標(biāo)題為ControlandManagementofIndustrialPollution的文獻(xiàn)記錄為命中文獻(xiàn)。4.字段限定檢索字段限定檢索是利用檢索字段符來(lái)限定檢索字段,即指定檢索詞在記錄中出現(xiàn)的字段。檢索時(shí),計(jì)算機(jī)只對(duì)限定字段進(jìn)行運(yùn)算,這是提高檢索效率的措施之一檢索字段符分為兩類,即后綴方式和前綴方式。前者對(duì)應(yīng)于根本索引,反映文獻(xiàn)的主題內(nèi)容;后者對(duì)應(yīng)于輔助索引,反映文獻(xiàn)的外部特征。4.字段限定檢索1〕后綴方式后綴方式在檢索詞后加上指定檢索字段的后綴字段代碼,反映文獻(xiàn)的主題內(nèi)容。常用的代碼有/TI〔篇名〕、/AB〔文摘〕、/DE〔敘詞〕。例如,information()retrieval/TI表示僅在TI字段中檢索information()retrieval。4.字段限定檢索2〕前綴方式前綴方式是在檢索詞之前加上指定檢索字段的前綴字段代碼,反映文獻(xiàn)的外部特征。常用的代碼有AU=(作者)、ISBN=(ISBN號(hào))、CC=(分類號(hào)或類目名稱)、CD=(會(huì)議日期)、CS=(機(jī)構(gòu)名稱)、DT=(文獻(xiàn)類型)、JN=(刊名)、PY=(出版年)等。4.字段限定檢索2〕前綴方式例如,AU=Yu,XiaoyangANDCS=(GuiLINCollegeofAerospaceTechnology)表示查找桂林航天工業(yè)高等??茖W(xué)校的Yu,Xiaoyang的文獻(xiàn)。計(jì)算機(jī)信息檢索的

常用方法與步驟1、信息檢索方法基于數(shù)據(jù)庫(kù)的常用檢索方法:計(jì)算機(jī)檢索方法沒有固定模式,主要?dú)w納為以下幾種:

〔1〕根本檢索:是一種最簡(jiǎn)單的檢索方法,多數(shù)數(shù)據(jù)庫(kù)只提供一個(gè)檢索框且只能輸一詞或一個(gè)詞組檢索,但也有的數(shù)據(jù)庫(kù)可對(duì)兩詞或多詞進(jìn)行邏輯組配檢索。計(jì)算機(jī)信息檢索的

常用方法與步驟基于數(shù)據(jù)庫(kù)的常用檢索方法:〔2〕高級(jí)檢索:用戶可通過(guò)點(diǎn)選檢索系統(tǒng)給定的檢索算符對(duì)多詞進(jìn)行邏輯組配。高級(jí)檢索提供的檢索框也較多,一般一個(gè)檢索框只能輸一詞或一個(gè)詞組,檢索框經(jīng)??刂圃?-5個(gè)。計(jì)算機(jī)信息檢索的

常用方法與步驟計(jì)算機(jī)信息檢索的

常用方法與步驟2、信息檢索步驟科研人員的檢索課題和需要雖各不相同,但為了到達(dá)檢索目的,都要利用一定的檢索工具和數(shù)據(jù)庫(kù),按照一定的途徑與方法才能檢索出需要的文獻(xiàn)。一般要經(jīng)過(guò)以下步驟:計(jì)算機(jī)信息檢索的

常用方法與步驟2、信息檢索步驟“用戶→研究課題→主題分析→選擇檢索系統(tǒng)或數(shù)據(jù)庫(kù)→選擇檢索途徑:主題詞、作者、機(jī)構(gòu)等→制定檢索策略和檢索方式→檢索操作→初始檢索結(jié)果輸出→用戶結(jié)果評(píng)價(jià):滿意→檢索結(jié)果→索取原文;不滿意:返回主題分析重新檢索〞。計(jì)算機(jī)信息檢索的

常用方法與步驟

2、信息檢索步驟計(jì)算機(jī)信息檢索的

常用方法與步驟3、信息檢索效果評(píng)價(jià)對(duì)計(jì)算機(jī)網(wǎng)絡(luò)信息檢索的效果評(píng)價(jià),應(yīng)該從質(zhì)量、費(fèi)用和時(shí)間這三個(gè)方面進(jìn)行。質(zhì)量標(biāo)準(zhǔn)主要通過(guò)查全率與查準(zhǔn)率進(jìn)行評(píng)價(jià)。費(fèi)用標(biāo)準(zhǔn)即檢索費(fèi)用,是指用戶為檢索課題所投入的費(fèi)用。

時(shí)間標(biāo)準(zhǔn)是指花費(fèi)時(shí)間,包括檢索準(zhǔn)備時(shí)間、檢索過(guò)程時(shí)間、獲取文獻(xiàn)時(shí)間等。查全率和查準(zhǔn)率是判定檢索效果的主要標(biāo)準(zhǔn)。計(jì)算機(jī)信息檢索的

常用方法與步驟查全率是指系統(tǒng)在進(jìn)行某一檢索時(shí),檢出的相關(guān)文獻(xiàn)量與系統(tǒng)文獻(xiàn)庫(kù)中相關(guān)文獻(xiàn)總量的比率,它反映該系統(tǒng)文獻(xiàn)庫(kù)中實(shí)有的相關(guān)文獻(xiàn)量在多大程度上被檢索出來(lái)。查全率=[檢出相關(guān)文獻(xiàn)量/文獻(xiàn)庫(kù)內(nèi)相關(guān)文獻(xiàn)總量]×100%例如,要利用某個(gè)檢索系統(tǒng)查某課題。假設(shè)在該系統(tǒng)文獻(xiàn)庫(kù)中共有40篇相關(guān)文獻(xiàn),而只檢索出30篇,那么查全率就等于75%。計(jì)算機(jī)信息檢索的

常用方法與步驟查準(zhǔn)率是指系統(tǒng)在進(jìn)行某一檢索時(shí),檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率,它反映每次從該系統(tǒng)文獻(xiàn)庫(kù)中實(shí)際檢出的全部文獻(xiàn)中有多少是相關(guān)的。查準(zhǔn)率=[檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量]×100%計(jì)算機(jī)信息檢索的

常用方法與步驟例如,檢出的文獻(xiàn)總篇數(shù)為50篇,經(jīng)審查確定其中與工程相關(guān)的只有40篇,另外10篇與該課題無(wú)關(guān),這次檢索的查準(zhǔn)率就等于80%。顯然,查準(zhǔn)率是用來(lái)描述系統(tǒng)拒絕不相關(guān)文獻(xiàn)的能力,有人也稱查準(zhǔn)率為“相關(guān)率〞。查準(zhǔn)率和查全率結(jié)合起來(lái),描述了系統(tǒng)的檢索成功率。計(jì)算機(jī)信息檢索的

常用方法與步驟實(shí)際上,影響檢索效果的因素是非常復(fù)雜的。根據(jù)國(guó)外有關(guān)專家所做的實(shí)驗(yàn)說(shuō)明,查全率與查準(zhǔn)率是呈互逆關(guān)系的。要想做到查全,勢(shì)必會(huì)對(duì)檢索范圍和限制逐步放寬,那么結(jié)果是把很多不相關(guān)的文獻(xiàn)也帶進(jìn)來(lái),影響了查準(zhǔn)率。網(wǎng)絡(luò)信息資源1、網(wǎng)絡(luò)信息資源的特點(diǎn)1〕數(shù)據(jù)量大、傳播廣泛網(wǎng)絡(luò)信息資源極為豐富。報(bào)告?數(shù)字宇宙膨脹:到2021年全球信息增長(zhǎng)預(yù)測(cè)?指出2021年,全球數(shù)字信息量為9880億GB。網(wǎng)絡(luò)信息資源1、網(wǎng)絡(luò)信息資源的特點(diǎn)2〕檢索方便、本錢低廉網(wǎng)絡(luò)信息資源可以使用自然語(yǔ)言檢索,便于信息資源的獲取和信息利用。很多信息對(duì)于公眾來(lái)說(shuō)都是免費(fèi)的。因此,相對(duì)于其他形式的信息資源,網(wǎng)絡(luò)信息資源無(wú)疑是低本錢、高回報(bào)的資源。網(wǎng)絡(luò)信息資源1、網(wǎng)絡(luò)信息資源的特點(diǎn)3〕分散無(wú)序、缺乏管理網(wǎng)上信息資源具有分布式特點(diǎn),處于一種無(wú)中心控制、混亂無(wú)序的分布狀態(tài)。網(wǎng)站軟硬件變動(dòng)和更新頻繁,更新周期不一。4〕分布不均、質(zhì)量不一網(wǎng)絡(luò)信息資源在不同學(xué)科專業(yè)領(lǐng)域、不同行業(yè)、不同地理位置上的分布差異很大,數(shù)量和質(zhì)量的差異也很大。網(wǎng)絡(luò)信息資源1、網(wǎng)絡(luò)信息資源的特點(diǎn)5〕內(nèi)容豐富、形式多樣互聯(lián)網(wǎng)信息資源在形式上沒有一個(gè)統(tǒng)一的體系和結(jié)構(gòu),處于非結(jié)構(gòu)化狀況,其內(nèi)容包羅萬(wàn)象,覆蓋了不同學(xué)科、不同領(lǐng)域的信息資源。網(wǎng)絡(luò)信息資源2、搜索引擎檢索和利用1〕搜索引擎概念搜索引擎是一種能夠通過(guò)Internet接收用戶的查詢指令,并向用戶提供符合其查詢要求的信息資源網(wǎng)址的系統(tǒng)。它是一些在Web中主動(dòng)搜索信息〔網(wǎng)頁(yè)上的單詞和特定的描述內(nèi)容〕并將其自動(dòng)索引的Web網(wǎng)站,其索引內(nèi)容存儲(chǔ)在可供檢索的大型數(shù)據(jù)庫(kù)中,建立索引和目錄效勞。網(wǎng)絡(luò)信息資源2、搜索引擎檢索和利用2〕搜索引擎的根本原理搜索引擎的原理可以看成三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè)→建立索引數(shù)據(jù)庫(kù)→在索引數(shù)據(jù)庫(kù)中搜索排序。網(wǎng)絡(luò)信息資源2、搜索引擎檢索和利用3〕搜索引擎的檢索技巧a〕使用關(guān)鍵詞的技巧關(guān)鍵詞〔Keywords〕是文獻(xiàn)作者在標(biāo)題、摘要、正文中所用的原詞,是對(duì)表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的詞語(yǔ),或?qū)沂竞兔枋鑫墨I(xiàn)主題內(nèi)容來(lái)說(shuō)是重要的詞語(yǔ)。選取準(zhǔn)確的關(guān)鍵詞,對(duì)提高檢索命中率的影響較大。網(wǎng)絡(luò)信息資源3〕搜索引擎的檢索技巧a〕使用關(guān)鍵詞的技巧使用關(guān)鍵詞檢索時(shí),首先應(yīng)從復(fù)雜的搜索目標(biāo)中提煉出最具代表性的關(guān)鍵詞。其次,搜索條件越具體,搜索引擎返回的結(jié)果就越精確,有時(shí)多輸入一兩個(gè)關(guān)鍵詞,效果就完全不同,因此在搜索中應(yīng)學(xué)會(huì)使用兩個(gè)以上的關(guān)鍵詞搜索的方法。網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源3〕搜索引擎的檢索技巧b〕減號(hào)“〞的運(yùn)用“〞的作用是為了去除包含特定的關(guān)鍵詞但與檢索目標(biāo)無(wú)關(guān)的搜索結(jié)果,提高搜索結(jié)果相關(guān)性。假設(shè)在搜索結(jié)果中有很多不相關(guān)的結(jié)果,那么可用“〞減掉不相關(guān)結(jié)果的關(guān)鍵詞網(wǎng)絡(luò)信息資源3〕搜索引擎的檢索技巧b〕減號(hào)“〞的運(yùn)用例,檢索小說(shuō)“水滸傳〞,輸入“水滸傳電視劇〞來(lái)進(jìn)行搜索,查詢的結(jié)果里就不會(huì)有水滸傳電視劇的信息。需要注意的是,前一個(gè)關(guān)鍵詞和減號(hào)之間必須有空格,否那么,減號(hào)會(huì)被當(dāng)成連字符處理,而失去減號(hào)語(yǔ)法功能。減號(hào)和后一個(gè)關(guān)鍵詞之間,有無(wú)空格均可。網(wǎng)絡(luò)信息資源3〕搜索引擎的檢索技巧c〕利用雙引號(hào)“〞進(jìn)行精確匹配搜索使用雙引號(hào)進(jìn)行精確匹配檢索,能縮小檢索結(jié)果范圍,提高查準(zhǔn)率,得到的信息結(jié)果最少最精確。如,輸入“黑龍江大學(xué)〞,可以得到與輸入詞完全匹配的結(jié)果否那么,搜索引擎就會(huì)將“黑龍江〞或“大學(xué)〞等詞分別檢索出來(lái)。網(wǎng)絡(luò)信息資源3〕搜索引擎的檢索技巧d〕停用詞的應(yīng)用停用詞〔StopWords〕主要常見于英文搜索引擎中,指的是使用過(guò)于頻繁的單詞,如who、I、what、it、and、how、的、地等。搜索引擎不支持停用詞的檢索。如果在搜索的檢索詞中必須使用停用詞,可以用加號(hào)“+〞來(lái)解決。如搜索影片名稱“WhoamI〞時(shí),其中“Who〞和“I〞是停用詞,用“+〞號(hào)強(qiáng)制對(duì)其進(jìn)行搜索,此時(shí)的搜索條件即+Who+am+I或?qū)⑷繖z索詞用“〞引起來(lái),進(jìn)行精確匹配搜索。網(wǎng)絡(luò)信息資源4〕常用的搜索引擎常用的中文搜索引擎a〕百度〔〕百度是全球最大的中文搜索引擎。2000年1月1日,百度公司創(chuàng)始人李彥宏、徐勇以120萬(wàn)美元投資創(chuàng)立了百度公司。同年10月,百度搜索引擎正式發(fā)布。百度采用基于內(nèi)容和基于超鏈接分析相結(jié)合的方法進(jìn)行相關(guān)度評(píng)價(jià),能夠客觀分析網(wǎng)頁(yè)所包含的信息,從而最大限度地保證了檢索結(jié)果相關(guān)性。網(wǎng)絡(luò)信息資源百度的網(wǎng)頁(yè)搜索特色功能包括以下方面。〔1〕百度快照。每個(gè)未被禁止搜索的網(wǎng)頁(yè),在百度上都會(huì)自動(dòng)生成臨時(shí)緩存頁(yè)面,稱為“百度快照〞。當(dāng)網(wǎng)站效勞器暫時(shí)出現(xiàn)故障或網(wǎng)絡(luò)傳輸堵塞時(shí),可以通過(guò)“百度快照〞快速瀏覽頁(yè)面文本內(nèi)容。因?yàn)榘俣瓤煺罩慌R時(shí)緩存網(wǎng)頁(yè)的文本內(nèi)容,所以那些圖片、音樂等非文本信息,仍是存儲(chǔ)于原網(wǎng)頁(yè)。網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源百度的網(wǎng)頁(yè)搜索特色功能包括以下方面?!?〕專業(yè)文檔搜索。很多有價(jià)值的資料,在互聯(lián)網(wǎng)上并非是普通的網(wǎng)頁(yè),而是以Word、PowerPoint、PDF等格式存在。百度支持對(duì)Office文檔〔包括Word、Excel、PowerPoint〕、AdobePDF文檔進(jìn)行的全文搜索。要搜索這類文檔,在普通的檢索詞后,加一個(gè)“filetype:〞文檔類型限定,“filetype:〞后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。網(wǎng)絡(luò)信息資源〔6〕專業(yè)文檔搜索例如,查找厲以寧關(guān)于經(jīng)濟(jì)改革方面的經(jīng)濟(jì)學(xué)論文,輸入“經(jīng)濟(jì)改革厲以寧filetype:doc〞,單擊檢索結(jié)果的標(biāo)題,就可以直接下載該Word文檔。也可通過(guò)百度文檔搜索界面〔〕直接使用專業(yè)文檔搜索功能。網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源d〕天網(wǎng)搜索〔〕。由北京大學(xué)網(wǎng)絡(luò)實(shí)驗(yàn)室開發(fā)的天網(wǎng)搜索引擎是國(guó)家“九五〞重點(diǎn)科技攻關(guān)工程“中文編碼和分布式中英文信息發(fā)現(xiàn)〞的研究成果,于1997年10月29日正式在CERNET上提供效勞。2000年年初,成立天網(wǎng)搜索引擎新課題組,由國(guó)家973重點(diǎn)根底研究開展規(guī)劃工程基金資助開發(fā)。網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源常用的英文搜索引擎a〕Google〔〕1998年9月,Google創(chuàng)始人——美國(guó)斯坦福大學(xué)博士生LarryPage和SergeyBrin在斯坦福大學(xué)學(xué)生宿舍內(nèi)共同開發(fā)了全新的在線搜索引擎〔Google〕,并于1999年創(chuàng)立Google公司。英語(yǔ)中沒有Google這個(gè)詞,它是數(shù)學(xué)名詞googol的諧音,表示一個(gè)1后面跟著100個(gè)零。LarryPage和SergeyBrin選擇了這個(gè)詞,使它成為世界上最大、最快的搜索引擎。網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源Google特色功能如下:〔1〕新詞和生僻詞定義效勞功能。Google表示,一些時(shí)髦的新詞幾乎總是先在網(wǎng)絡(luò)上出現(xiàn),因此推出了這一相應(yīng)的俚語(yǔ)和新詞搜索定義功能。在進(jìn)行新詞定義搜索時(shí),輸入單詞“define〞〔定義〕后按空格鍵,之后是想要搜索定義的詞語(yǔ)。英文單詞“define〞也可用“whatis〞或“definition〞代替。網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源〔2〕單詞糾錯(cuò)。Google對(duì)英文單詞拼寫錯(cuò)誤有糾錯(cuò)功能。例在寫上文的時(shí)候,要用到英文單詞“tutorial〞,記得好似是“tutorial〞,但不肯定,用Google一查,它馬上提醒:“您要找的會(huì)不會(huì)是:tutorial〞,正是這個(gè)單詞。網(wǎng)絡(luò)信息資源〔3〕在線的英文活字典。Google可以幫助查找英語(yǔ)單詞的解釋或用法,在檢索欄中只要輸入查找的單詞并單擊“Google搜索〞按鈕或按回車鍵,瀏覽器就會(huì)顯示有關(guān)該單詞的鏈接,單擊這些鏈接,就會(huì)出現(xiàn)有關(guān)的信息內(nèi)容,是一種真正方便、快捷的在線英文活字典。網(wǎng)絡(luò)信息資源常用的英文搜索引擎b〕Scirus〔〕。Scirus是專門用于科技信息檢索的目前互聯(lián)網(wǎng)上最全面、綜合性最強(qiáng)的搜索引擎之一,由荷蘭Elsevier科學(xué)出版社開發(fā),目前有1.67億個(gè)網(wǎng)頁(yè)。Scirus引擎的信息源主要有兩局部:網(wǎng)頁(yè)和期刊。網(wǎng)絡(luò)信息資源Scirus搜索引擎的特點(diǎn)過(guò)濾非科學(xué)方面的信息

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論