第一講信息檢索原理_第1頁(yè)
第一講信息檢索原理_第2頁(yè)
第一講信息檢索原理_第3頁(yè)
第一講信息檢索原理_第4頁(yè)
第一講信息檢索原理_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

課程性質(zhì)1、一門技術(shù),一門素質(zhì)教育課。2、操作性強(qiáng)。3、實(shí)用性強(qiáng)。核心提高信息素質(zhì)!第一頁(yè),共90頁(yè)。信息素質(zhì)信息意識(shí)信息能力信息道德第二頁(yè),共90頁(yè)。教材書(shū)名:信息檢索與利用·工學(xué)主編:汪育健呂先競(jìng)鄧發(fā)云世界圖書(shū)出版公司第三頁(yè),共90頁(yè)。教學(xué)安排總學(xué)時(shí):24學(xué)時(shí)上機(jī)實(shí)習(xí):16學(xué)時(shí)考查成績(jī):平時(shí):30%、考核:70%考核方式:圍繞一個(gè)課題(自擬或命題)進(jìn)行多種信息資源的檢索,并提交檢索報(bào)告。第四頁(yè),共90頁(yè)。第一講

科技信息與檢索原理第五頁(yè),共90頁(yè)。第一章信息與文獻(xiàn)信息與文獻(xiàn)信息的類型第六頁(yè),共90頁(yè)。第一節(jié)信息與文獻(xiàn)信息人們對(duì)外部世界感知、認(rèn)識(shí)過(guò)程之中的一切數(shù)據(jù)、事實(shí)和消息。自然界與人類社會(huì)存在的事實(shí)與變化及人類對(duì)它們形成的認(rèn)識(shí)和創(chuàng)造是信息的內(nèi)容組成;載體記錄和媒體傳播是信息的存在形式。第七頁(yè),共90頁(yè)。知識(shí)人們對(duì)事物運(yùn)動(dòng)現(xiàn)象和規(guī)律的認(rèn)識(shí)。是升華為理性認(rèn)識(shí)的信息。文獻(xiàn)文獻(xiàn)是記錄有知識(shí)的一切載體,是信息最主要的一種物化形式。知識(shí)、載體和記錄是構(gòu)成文獻(xiàn)的三個(gè)要素。第八頁(yè),共90頁(yè)。第二節(jié)信息資源及其類型從不同的角度出發(fā)有不同的分類方法。按記錄形式劃分按組織形式劃分按載體制作形式劃分按文獻(xiàn)出版形式劃分按文獻(xiàn)時(shí)序形式劃分第九頁(yè),共90頁(yè)。一、按記錄形式分1.文字類信息資源。主要用文字記錄的信息資源??稍俜譃闈h文、藏文、英文、法文、德文、日文、俄文信息資源。2.圖表類信息資源。主要用圖、表記錄的信息資源。如各種圖形、圖譜、圖片、圖紙、圖畫(huà)、圖表等。3.代碼類信息資源。用特定的符號(hào)、代碼記錄知識(shí)。如樂(lè)譜、電報(bào)碼、數(shù)學(xué)符號(hào)、化合物的代號(hào)、軟件源程序等等。4.語(yǔ)音類信息資源。用聲音記錄的信息資源。第十頁(yè),共90頁(yè)。5.影像類信息資源。用影像記錄信息資源。6.多媒體信息資源。既用文字、圖、表、特定符號(hào),也用聲音、影像等記錄知識(shí)。是集文字、聲音、影像于一體的信息資源。7.?dāng)?shù)字化信息資源。用數(shù)碼設(shè)備將所有文字、圖、表、特定符號(hào)、聲音、影像等均轉(zhuǎn)化為“0”、“1”數(shù)碼存取,實(shí)現(xiàn)各種形式的信息資源數(shù)字化。第十一頁(yè),共90頁(yè)。二、按知識(shí)組織形式劃分1.文本信息資源。信息資源(如一種圖書(shū))內(nèi)知識(shí)各單元按線形順序排列。2.超文本信息資源。信息資源(仍如一種圖書(shū))內(nèi)各知識(shí)單元間、及其信息資源內(nèi)各知識(shí)單元與信息資源外相關(guān)各知識(shí)單元間的關(guān)系呈網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)鏈接把有關(guān)的信息(包括文字、圖片、圖形、表格等)聯(lián)結(jié)起來(lái)。3.超媒體信息資源。是多媒體信息資源與超文本信息資源的結(jié)合。信息資源集文字、聲音、圖像于一體,某一信息資源內(nèi)各知識(shí)單元間、及其信息資源內(nèi)各知識(shí)單元與其外相關(guān)各知識(shí)單元間采用超文本方式鏈接。第十二頁(yè),共90頁(yè)。三、按載體制作形式劃分1.刻寫(xiě)型包括古代的甲骨卜辭、金石簡(jiǎn)牘、帛書(shū)等,也含現(xiàn)代的篆刻、雕刻、雕塑等等。2.印刷型也稱紙介型,是以紙張為載體,以手寫(xiě)和印刷技術(shù)為記錄手段形成的文獻(xiàn)。

第十三頁(yè),共90頁(yè)。3.縮微型以感光材料為載體,利用光學(xué)技術(shù)將文字、圖形、影像等信息符號(hào)按比例縮小的文獻(xiàn)形式。常見(jiàn)的縮微型文獻(xiàn)有縮微平片和縮微膠卷兩種。第十四頁(yè),共90頁(yè)。4.聲像型亦稱視聽(tīng)型,指通過(guò)特定設(shè)備,使用聲、光、磁、電等技術(shù)將信息表現(xiàn)為聲音、圖象、影視和動(dòng)畫(huà)等(sound,image,video&animation)形式,給人以直觀、形象的感受。5.電子型其前身稱機(jī)讀型(machinereadableform),它通過(guò)計(jì)算機(jī)對(duì)電子格式的信息進(jìn)行存取和處理。即采用高技術(shù)手段,將信息存儲(chǔ)在磁盤、磁帶或光盤等媒體中,形成多種類型的電子出版物。第十五頁(yè),共90頁(yè)。6.網(wǎng)絡(luò)信息資源利用計(jì)算機(jī)技術(shù)、通信技術(shù)及多媒體技術(shù)相互融合而形成的網(wǎng)絡(luò)上出版、流通和傳播的各種信息資源的總和,是電子出版的高級(jí)形式。從網(wǎng)絡(luò)信息資源的使用形式上來(lái)看,網(wǎng)絡(luò)信息資源的類型目前又可以分為兩種:一是產(chǎn)生時(shí)期較早的聯(lián)機(jī)檢索系統(tǒng)中的信息資源;二是因特網(wǎng)信息資源。第十六頁(yè),共90頁(yè)。四、按文獻(xiàn)形式劃分1.圖書(shū)圖書(shū)主要包括專著、教科書(shū)、工具書(shū)、圖冊(cè)、讀物和文集等。聯(lián)合國(guó)教科文組織1961年規(guī)定:5~49頁(yè)印刷品為小冊(cè)子,50頁(yè)以上印刷品為圖書(shū)。

第十七頁(yè),共90頁(yè)。2.期刊又稱連續(xù)出版物,指有固定名稱、統(tǒng)一開(kāi)本、有編號(hào)或年月標(biāo)志、定期或不定期連續(xù)出版、每期內(nèi)容不重復(fù)并由多名責(zé)任者撰寫(xiě)不同文章的出版物,又稱為雜志。第十八頁(yè),共90頁(yè)。3.報(bào)紙報(bào)紙(Paper,Newspaper)在國(guó)外被稱為新聞報(bào)紙。專門刊載新聞報(bào)道和時(shí)事評(píng)論為主的定期出版物;但有些報(bào)紙同時(shí)也刊載學(xué)術(shù)論文和其它信息。第十九頁(yè),共90頁(yè)。4.會(huì)議文獻(xiàn)在學(xué)術(shù)會(huì)議上宣讀或書(shū)面交流的報(bào)告、論文、會(huì)議記錄、會(huì)議紀(jì)要等有關(guān)資料。各種學(xué)術(shù)會(huì)議,是科學(xué)交流的一條重要渠道,是科學(xué)工作者了解學(xué)科發(fā)展動(dòng)態(tài),獲取學(xué)科最新信息的窗口。第二十頁(yè),共90頁(yè)。5.學(xué)位論文學(xué)位論文是指為申請(qǐng)學(xué)士、碩士、博士等學(xué)位而提交的學(xué)術(shù)論文。第二十一頁(yè),共90頁(yè)。6.政府出版物指國(guó)家政府機(jī)關(guān)頒布的各種文件,如政府公報(bào)、政府會(huì)議文件、法律匯編、條約集、公告等,國(guó)家黨政機(jī)關(guān)為開(kāi)展日常工作而印刷的文件、參考資料也屬此類。第二十二頁(yè),共90頁(yè)。7.標(biāo)準(zhǔn)文獻(xiàn)是以科學(xué)、技術(shù)和社會(huì)實(shí)踐經(jīng)驗(yàn)的綜合成果為基礎(chǔ)擬定,經(jīng)主管機(jī)構(gòu)批準(zhǔn),以特定形式發(fā)布的對(duì)重復(fù)性事物和概念所作統(tǒng)一規(guī)定的法定性文獻(xiàn)。第二十三頁(yè),共90頁(yè)。8.科技報(bào)告科技報(bào)告是指國(guó)家政府部門或科研生產(chǎn)單位關(guān)于某項(xiàng)研究成果的總結(jié)報(bào)告,或是研究過(guò)程中的階段進(jìn)展報(bào)告。報(bào)告的出版特點(diǎn)是各篇單獨(dú)成冊(cè),統(tǒng)一編號(hào),由主管機(jī)構(gòu)連續(xù)出版。在內(nèi)容方面,報(bào)告比期刊論文等專深、詳盡、可靠,是一種不可多得的信息源。第二十四頁(yè),共90頁(yè)。四大報(bào)告PB報(bào)告(PublishingBoard)AD報(bào)告(ASTIADocuments)NASA報(bào)告(NationalAeronaticsandSpaceAdministration)DOE報(bào)告(DepartmentofEnergy)??萍紙?bào)告主要在情報(bào)所或收藏科技報(bào)告的院校、研究所圖書(shū)館查閱。九院收藏有大量的科技報(bào)告。第二十五頁(yè),共90頁(yè)。9.專利文獻(xiàn)與專利制度有關(guān)的所有專利文件,包括專利說(shuō)明書(shū)、專利公報(bào)、專利分類表、專利檢索工具以及專利的法律性文件。專利說(shuō)明書(shū)應(yīng)在國(guó)家專利局或收藏專利文獻(xiàn)的情報(bào)所查閱。四川省情報(bào)所收藏國(guó)內(nèi)外專利。第二十六頁(yè),共90頁(yè)。專利文獻(xiàn)主要由專利說(shuō)明書(shū)構(gòu)成。專利說(shuō)明書(shū)的內(nèi)容比較具體,有的還有附圖,通過(guò)它可以了解該項(xiàng)專利的主要技術(shù)內(nèi)容。由于只有符合新穎性、創(chuàng)造性和實(shí)用性的發(fā)明創(chuàng)造才能獲得專利權(quán),所以專利說(shuō)明書(shū)對(duì)于工程技術(shù)人員,特別是產(chǎn)品工藝設(shè)計(jì)人員來(lái)說(shuō),是一種切合實(shí)際、啟迪思維的重要信息源。第二十七頁(yè),共90頁(yè)。10.檔案指各級(jí)政府機(jī)構(gòu)、企事業(yè)單位和某些個(gè)人在實(shí)踐工作中形成立卷歸檔、集中保管、有歷史價(jià)值的原始文獻(xiàn)資料,它是科技、政治、經(jīng)濟(jì)、歷史的真實(shí)記錄,是科技工作者進(jìn)行科研的重要參考資料。第二十八頁(yè),共90頁(yè)。11.產(chǎn)品技術(shù)資料指產(chǎn)品目錄、產(chǎn)品樣本和產(chǎn)品說(shuō)明書(shū)一類的產(chǎn)品宣傳和使用資料。其內(nèi)容主要是對(duì)產(chǎn)品的規(guī)格、性能、特點(diǎn)、構(gòu)造、用途、使用方法等的介紹和說(shuō)明,所介紹的產(chǎn)品多是已投產(chǎn)和正在行銷的產(chǎn)品,反映的技術(shù)比較成熟,數(shù)據(jù)也較為可靠,內(nèi)容具體、通俗易懂,常附較多的外觀照片和結(jié)構(gòu)簡(jiǎn)圖,形象、直觀。第二十九頁(yè),共90頁(yè)。

第二章

信息檢索原理第三十頁(yè),共90頁(yè)。信息檢索概念信息檢索類型信息檢索手段檢索工具檢索語(yǔ)言檢索途徑檢索步驟第三十一頁(yè),共90頁(yè)。第一節(jié)

信息檢索的概念信息檢索(InformationRetrieval)將信息按一定方式組織和存貯

起來(lái),并針對(duì)用戶的需求找出所需要的信息的過(guò)程。21又稱為“信息存貯與檢索”(InformationStorageandRrtrieval)。第三十二頁(yè),共90頁(yè)。信息源信息分析、著錄、標(biāo)引信息的表示檢索語(yǔ)言用戶需求分析

用戶檢索提問(wèn)匹配過(guò)程輸出檢索結(jié)果數(shù)據(jù)庫(kù)第三十三頁(yè),共90頁(yè)?!捌ヅ洹蹦P?。由文獻(xiàn)特征構(gòu)成的文獻(xiàn)檢索標(biāo)志被認(rèn)為完全反映了文獻(xiàn)內(nèi)容,而由提問(wèn)特征構(gòu)成的檢索提問(wèn)則反映了信息用戶需求,因此二者的匹配程度就是文獻(xiàn)的相關(guān)程度,相關(guān)文獻(xiàn)就是在某種程度上匹配的文獻(xiàn)第三十四頁(yè),共90頁(yè)。第二節(jié)信息檢索類型文獻(xiàn)檢索事實(shí)檢索數(shù)據(jù)檢索第三十五頁(yè),共90頁(yè)。數(shù)據(jù)檢索事實(shí)檢索文獻(xiàn)檢索參考工具搜索引擎書(shū)目、文摘類數(shù)據(jù)庫(kù)搜索引擎第三十六頁(yè),共90頁(yè)。第三節(jié)

信息檢索手段手檢機(jī)檢檢索方式優(yōu)點(diǎn)

缺點(diǎn)人工查找利用計(jì)算機(jī)等通信設(shè)備直觀、靈活速度快,效率高查準(zhǔn)率高查全率高速度慢成本費(fèi)用高第三十七頁(yè),共90頁(yè)。第四節(jié)信息檢索工具載體分書(shū)刊型卡片型縮微型計(jì)算機(jī)光盤數(shù)據(jù)庫(kù)聯(lián)機(jī)數(shù)據(jù)庫(kù)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)著錄信息特征分目錄題錄文摘參考工具書(shū)全文數(shù)據(jù)庫(kù)搜索引擎一、概念存儲(chǔ)、報(bào)道和檢索信息的工具第三十八頁(yè),共90頁(yè)。(一)手工檢索工具結(jié)構(gòu)檢索工具使用說(shuō)明目次表正文輔助索引附錄二、檢索工具的結(jié)構(gòu)第三十九頁(yè),共90頁(yè)。數(shù)據(jù)庫(kù)字段記錄文檔幫助順排文檔倒排文檔(二)計(jì)算機(jī)檢索工具結(jié)構(gòu)第四十頁(yè),共90頁(yè)。第五節(jié)信息檢索語(yǔ)言檢索語(yǔ)言是用于描述信息的內(nèi)部特征和外部特征及其表達(dá)信息用戶需求的一種專門語(yǔ)言。按內(nèi)容性質(zhì)分為分類語(yǔ)言和主題語(yǔ)言。第四十一頁(yè),共90頁(yè)。較有影響的有:《中國(guó)圖書(shū)館圖書(shū)分類法》簡(jiǎn)稱《中圖法》《國(guó)際十進(jìn)分類法》《杜威分類法》等。一、分類語(yǔ)言:將各種概念按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列。有利于系統(tǒng)掌握和利用某一專業(yè)范圍的信息。第四十二頁(yè),共90頁(yè)?!吨袊?guó)圖書(shū)館圖書(shū)分類法》大類A馬列主義、毛澤東思想、鄧小平理論B哲學(xué)、宗教C社會(huì)科學(xué)總論D政治、法律E軍事F經(jīng)濟(jì)G文化、科學(xué)、教育、體育H語(yǔ)言、文字I文學(xué)J藝術(shù)K歷史、地理N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué)R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)U交通運(yùn)輸V航空、航天X環(huán)境科學(xué)、安全科學(xué)Z綜合性圖書(shū)第四十三頁(yè),共90頁(yè)。TP31類細(xì)分TP31計(jì)算機(jī)軟件311程序設(shè)計(jì)、軟件工程312程序語(yǔ)言、算法語(yǔ)言313匯編程序314編譯程序、解釋程序315管理程序、管理系統(tǒng)316 操作系統(tǒng) .1 分時(shí)操作系統(tǒng) .2 實(shí)時(shí)操作系統(tǒng) .3 批處理第四十四頁(yè),共90頁(yè)。二、主題語(yǔ)言直接以代表信息內(nèi)容特征和科學(xué)概念的概念詞作為檢索標(biāo)識(shí),并按字順組織起來(lái)的一種檢索語(yǔ)言。分為規(guī)范主題語(yǔ)言與非規(guī)范主題語(yǔ)言第四十五頁(yè),共90頁(yè)。第六節(jié)

信息檢索的途徑指用戶進(jìn)行信息檢索的出發(fā)點(diǎn)和依據(jù)。

由信息的內(nèi)部特征和外部特征構(gòu)成的。分類途徑和主題途徑著者、名稱、機(jī)構(gòu)、號(hào)碼等等第四十六頁(yè),共90頁(yè)。

一、根據(jù)文獻(xiàn)內(nèi)容特征的檢索途徑分類途徑以學(xué)科性質(zhì)和內(nèi)容的相應(yīng)類目、類號(hào)為特征標(biāo)識(shí)的檢索方法。檢索時(shí)根據(jù)所需課題內(nèi)容的學(xué)科屬性,利用相應(yīng)檢索工具的“分類目錄”或“分類索引”檢索到相關(guān)信息內(nèi)容。第四十七頁(yè),共90頁(yè)。主題途徑根據(jù)學(xué)科內(nèi)容的主題性質(zhì)而進(jìn)行的檢索,檢索入口能反映所需課題的主題詞。注意利用詞表利用概念之間的屬種關(guān)系和相關(guān)關(guān)系統(tǒng)第四十八頁(yè),共90頁(yè)。關(guān)鍵詞途徑把表達(dá)信息主題內(nèi)容起關(guān)鍵作用的詞組或單詞抽取出來(lái),編制成“關(guān)鍵詞”索引,利用它查找所需信息。關(guān)鍵詞是一種很靈活的詞組或單詞,它不需規(guī)范化詞表,使用比較方便。在計(jì)算機(jī)檢索系統(tǒng)中應(yīng)用較廣。第四十九頁(yè),共90頁(yè)。二、根據(jù)文獻(xiàn)外部特征的檢索途徑著者途徑利用著者(個(gè)人或單位著者)目錄和著者索引進(jìn)行檢索的途徑。題名途徑利用信息的題名查找所需信息的方法。題名包括篇名、圖書(shū)名、刊名、標(biāo)準(zhǔn)名、文檔名、數(shù)據(jù)庫(kù)名等等檢索時(shí)可使用“題名索引”或“題名目錄”,在計(jì)算機(jī)檢索系統(tǒng)中應(yīng)用較多。第五十頁(yè),共90頁(yè)。機(jī)構(gòu)途徑通過(guò)機(jī)構(gòu)名稱獲取相關(guān)信息的方法。機(jī)構(gòu)名稱包括著者所在單位、圖書(shū)或期刊的出版社或發(fā)行單位名稱等等。代碼途徑利用信息的代碼獲取相關(guān)信息的方法。包括專利號(hào)、報(bào)告號(hào)、合同號(hào)、電子元件型號(hào)、標(biāo)準(zhǔn)書(shū)號(hào)、標(biāo)準(zhǔn)刊號(hào)、館藏號(hào)、文檔號(hào)、IP地址代碼等第五十一頁(yè),共90頁(yè)。信息源類型途徑將具體信息所屬的選定信息集合的類型作為檢索入口的方法。其它途徑根據(jù)某些信息的特殊標(biāo)識(shí)進(jìn)行檢索的方法。包括化學(xué)分子式、地域名稱、生物屬種、圖案色彩、聲音強(qiáng)度等等。第五十二頁(yè),共90頁(yè)。第七節(jié)

信息檢索步驟用戶信息需求信息分析選擇檢索手段確定檢索工具選擇檢索途徑制定檢索策略式檢索匹配輸出結(jié)果用戶評(píng)價(jià)檢索結(jié)束滿意不滿意第五十三頁(yè),共90頁(yè)。一、分析研究課題,明確檢索要求(一)分析課題的主題內(nèi)容(二)確定課題的文獻(xiàn)類型(三)確定檢索時(shí)間范圍(四)分析用戶的檢索評(píng)價(jià)要求第五十四頁(yè),共90頁(yè)。二、選擇檢索工具選擇最能滿足檢索要求的檢索工具書(shū)。從內(nèi)容上和時(shí)間上,考慮檢索工具對(duì)課題的覆蓋和一致性,比如綜合考慮數(shù)據(jù)庫(kù)收錄的齊全、編制的質(zhì)量、使用的方便等因素。在手段上和技術(shù)上,有機(jī)檢條件一般就不選擇手檢工具,機(jī)檢無(wú)疑有較高的效率。考慮價(jià)格和可獲性,選擇容易獲得的檢索工具,注意數(shù)據(jù)庫(kù)的價(jià)格,權(quán)衡價(jià)格效益比。第五十五頁(yè),共90頁(yè)。三、確定檢索途徑(一)確定檢索點(diǎn),以便具體進(jìn)行檢索。(二)制定檢索策略如果我們檢索有關(guān)電子科技大學(xué)發(fā)表的有關(guān)數(shù)字電視的文獻(xiàn),在ProQuest的檢索系統(tǒng)中,其檢索式為:cs(univ?Pre/1elect?Sci?Pre/1tech?)and(digitalw/2(televisionortv))第五十六頁(yè),共90頁(yè)。四、檢索方案的調(diào)整確定了具體的檢索方法后,就要利用所用檢索工具的索引,在一定的年代范圍內(nèi)具體查找,以獲得文獻(xiàn)線索。手工檢索時(shí)可以一邊檢索一邊分析取舍,獲得符合需要的文獻(xiàn)。計(jì)算機(jī)檢索時(shí),在輸出最終結(jié)果之前,檢索可能要經(jīng)過(guò)多次反復(fù)的過(guò)程。用戶對(duì)每次檢索結(jié)果作出判斷,并對(duì)檢索策略(檢索式)作出相應(yīng)的修改和調(diào)整,直到得到比較滿意的結(jié)果。第五十七頁(yè),共90頁(yè)。五、獲取原文(一)利用全文數(shù)據(jù)庫(kù)直接獲取(二)利用文獻(xiàn)傳遞系統(tǒng)獲取 中國(guó)國(guó)家科技圖書(shū)文獻(xiàn)中心(簡(jiǎn)稱NSTL)(/index.html)(三)利用文摘數(shù)據(jù)庫(kù)的原文服務(wù)(四)利用OPAC檢索系統(tǒng),進(jìn)行館際互借第五十八頁(yè),共90頁(yè)。第三章計(jì)算機(jī)檢索技術(shù)檢索算符制定檢索策略第五十九頁(yè),共90頁(yè)。一、常用檢索算符布爾邏輯算符截詞符字段符位置算符檢索算符:是指在計(jì)算機(jī)檢索中,用以連接檢索用詞而表達(dá)不同的檢索含義的符號(hào)。第六十頁(yè),共90頁(yè)。(一)布爾邏輯算符由一為名為布爾的科學(xué)家創(chuàng)建,最通用的檢索運(yùn)算符,幾乎所有的檢索工具都支持。第六十一頁(yè),共90頁(yè)。1.邏輯“與”—AND查找檢索結(jié)果中同時(shí)含有所有關(guān)鍵詞的信息,用于交叉概念或限定關(guān)系的組配??梢钥s小檢索范圍,提高查準(zhǔn)率。對(duì)應(yīng)的符號(hào)為“*”號(hào)例:

microwaveandradar

查找出同時(shí)含有microwave和radar兩個(gè)詞的信息

信息and檢索第六十二頁(yè),共90頁(yè)。2.

邏輯“或”—OR查找檢索結(jié)果中同時(shí)含有檢索式中任意一個(gè)關(guān)鍵詞的信息。用于并列概念的組配,可以擴(kuò)大檢索范圍,提高查全率。對(duì)應(yīng)的符號(hào)為乘號(hào)“+”例:broadbandorwideband查找出包含有其中一個(gè)詞的信息即:查找出環(huán)行器或者是隔離器的信息第六十三頁(yè),共90頁(yè)。3.邏輯“非”—NOT

查找檢索結(jié)果中從原來(lái)的檢索范圍中排除不需要的概念,或影響檢索結(jié)果的概念。對(duì)應(yīng)的符號(hào)為減號(hào)“-”例:電子科技大學(xué)-西安氣體傳感器-金屬氧化物第六十四頁(yè),共90頁(yè)。

如果一個(gè)提問(wèn)式中含有多個(gè)邏輯算符,則它們的執(zhí)行順序?qū)⑹荖OT,AND,OR,需先執(zhí)行的部分可用括號(hào)標(biāo)出(A+B)*C運(yùn)算順序?yàn)锳+B然后再是*CA+B*C運(yùn)算順序?yàn)锽*C然后在+A例:查找關(guān)于微波和毫米波雷達(dá)的信息

(微波+毫米波)*雷達(dá)第六十五頁(yè),共90頁(yè)。

用于代替檢索詞的詞尾或其它部位的字符。各個(gè)系統(tǒng)的規(guī)范詞不同,可用?、*、$、#等表示。截詞檢索用于命令檢索中,對(duì)一個(gè)詞語(yǔ)有單、復(fù)數(shù)的不同表示,有英美的不同拼寫(xiě),更有許多詞尾的變化形式,使用截詞可以減少檢索詞的輸入量,并能防止漏檢,提高檢索效率。(二)截詞符第六十六頁(yè),共90頁(yè)。截詞可分有限截詞與無(wú)限截詞無(wú)限截詞如comput?表示允許在詞干后出現(xiàn)的字符數(shù)不限,有的系統(tǒng)也用“*”或者“$”符號(hào)來(lái)表示無(wú)限截詞comput*有限截詞:

一般采用?問(wèn)號(hào)的個(gè)數(shù)表示允許出現(xiàn)的字符個(gè)數(shù)。在詞尾時(shí),可用??表示。第六十七頁(yè),共90頁(yè)。后截詞

也稱為右截?cái)唷@?computer?表示computer和computers,comput?表示compute,computed,computer,computing,computers,computation,computerize,等相關(guān)詞。前截詞

也稱為左截?cái)?。??computer表示macrocomputer,minicomputer,microcomputer,computer等相關(guān)詞。第六十八頁(yè),共90頁(yè)。中間截詞

將截詞符號(hào)置于一個(gè)檢索詞的中間,表示這個(gè)位置上的有限個(gè)字符,也稱為屏蔽。它對(duì)于解決英、美不同拼法、不規(guī)則的單復(fù)數(shù)變化等很有用。例:analy?er表示analyzer和analyser。前后截詞

將前截?cái)嗪秃蠼財(cái)嘟Y(jié)合使用。例:?comput?表示microcomputer第六十九頁(yè),共90頁(yè)。(三)字段符

字段符主要用于限定查找的范圍,比如查找某個(gè)著者的文章,就可以限定在著者字段中來(lái)檢索,目前大部分的檢索工具中都支持字段檢索。

第七十頁(yè),共90頁(yè)。最常用的字段限制符第七十一頁(yè),共90頁(yè)。各檢索系統(tǒng)的字段檢索表達(dá)方式不同字段名=檢索詞如:au=xiao,xianci字段名(檢索詞)如:ti(radar)檢索詞in字段名如:radarinti第七十二頁(yè),共90頁(yè)。例:A(W)B或A()B表示A之后緊跟B

WnW

A(nW)BA與B之間最多可插入n個(gè)單詞,位置不能顛倒NnN例:A(N)BA、B位置可顛倒,中間不能插詞

A(nN)BA、B位置可顛倒,中間可插n個(gè)詞(四)位置算符注:這里的小寫(xiě)n在具體的檢索中表示數(shù)字第七十三頁(yè),共90頁(yè)。例:計(jì)算機(jī)(2W)網(wǎng)絡(luò)

查找出結(jié)果中在兩個(gè)詞中可以插入兩個(gè)字的信息,如計(jì)算機(jī)局域網(wǎng)絡(luò)computer(W)network=computernetwork查找出結(jié)果中兩個(gè)詞中不可以插詞而且順序不能顛倒的信息,如中國(guó)北京Computer(2N)network查找出結(jié)果中在兩個(gè)詞中可以插入兩個(gè)字的信息,computer與network的前后的次序可以顛倒。第七十四頁(yè),共90頁(yè)。常用檢索檢索算符一覽表第七十五頁(yè),共90頁(yè)。提取檢索詞限定檢索字段組配檢索詞二制定檢索式技巧第七十六頁(yè),共90頁(yè)。(一)選取檢索詞原則1、切分切分到詞對(duì)課題語(yǔ)句進(jìn)行切分,即以詞為單位劃分句子,切分一定要徹底,必須到詞為止,同時(shí)也要適度,不能因切分而改變語(yǔ)義。第七十七頁(yè),共90頁(yè)。確定核心詞在一組檢索詞中,往往只有一個(gè)詞或少數(shù)幾個(gè)是核心詞,是必須使用的關(guān)鍵詞,而其它的詞是限定這個(gè)核心詞的?;趞被動(dòng)|攻擊|技術(shù)|的|入侵|檢測(cè)|系統(tǒng)-----被動(dòng)攻擊,入侵檢測(cè)系統(tǒng)第七十八頁(yè),共90頁(yè)。2、刪除刪除虛詞刪除不具有檢索意義的實(shí)詞刪除存在蘊(yùn)涵關(guān)系的可合并詞YBCO超導(dǎo)薄膜YBCO第七十九頁(yè),共90頁(yè)。3、補(bǔ)充同義詞、近義詞同族詞縮寫(xiě)詞(毫米波MMW)增加限義詞

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論