第四講信息檢索原理方法策略演示文稿_第1頁(yè)
第四講信息檢索原理方法策略演示文稿_第2頁(yè)
第四講信息檢索原理方法策略演示文稿_第3頁(yè)
第四講信息檢索原理方法策略演示文稿_第4頁(yè)
第四講信息檢索原理方法策略演示文稿_第5頁(yè)
已閱讀5頁(yè),還剩72頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講信息檢索原理方法策略演示文稿目前一頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)優(yōu)選第四講信息檢索原理方法策略目前二頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.1信息檢索概述2.信息檢索的作用獲取知識(shí)的途徑,學(xué)習(xí)的助手管理和決策的依據(jù)-全面、準(zhǔn)確、及時(shí)的信息——切合實(shí)際、正確無(wú)誤決策科學(xué)研究的工具和指南信息控制的手段目前三頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.1信息檢索概述3.信息檢索原理即檢索者的檢索提問(wèn)詞與存儲(chǔ)在檢索系統(tǒng)中的檢索標(biāo)引詞進(jìn)行匹配對(duì)比、取得一致,即為檢索命中,命中結(jié)果可從檢索系統(tǒng)中以各種方式輸出。檢索者可據(jù)此線索對(duì)原文進(jìn)行判斷、篩選,以獲取自己所需要的信息。廣義和狹義(p160)見(jiàn)信息檢索原理圖目前四頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.1信息檢索概述信息檢索原理即檢索者的檢索提問(wèn)詞與存儲(chǔ)在檢索系統(tǒng)中的檢索標(biāo)引詞進(jìn)行匹配對(duì)比、取得一致,即為檢索命中,命中結(jié)果可從檢索系統(tǒng)中以各種方式輸出。檢索者可據(jù)此線索對(duì)原文進(jìn)行判斷、篩選,以獲取自己所需要的信息。

信息檢索原理圖目前五頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.1信息檢索概述4.信息檢索途徑(p161)所謂檢索途徑就是檢索時(shí)切入信息群體的路徑。檢索途徑有兩大類,一類是用信息的外部特征,如題名、責(zé)任者、某種序號(hào)、機(jī)構(gòu)名等作為檢索標(biāo)識(shí);另一類是用能夠描述信息內(nèi)容的分類號(hào)、關(guān)鍵詞、主題詞等作為檢索標(biāo)識(shí)。在數(shù)據(jù)庫(kù)中檢索時(shí),幾乎所有的字段都可以作為檢索的途徑。1)分類途徑:分類語(yǔ)言,“分類目錄”“分類索引”,便于族性檢索2)主題途徑:主題語(yǔ)言

,“主題索引”

“關(guān)鍵詞索引”

“敘詞索引”

,便于特性檢索

3)著者途徑:“著者目錄”、“著者索引”4)其他途徑篇名途徑包括書(shū)名、刊名和篇名

序號(hào)途徑包括報(bào)告號(hào)、標(biāo)準(zhǔn)號(hào)、專利號(hào)、登記號(hào)等分子式途徑目前六頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.2.信息的組織與標(biāo)引1.信息組織信息組織是為了方便人們檢索獲取信息,將大量、龐雜、無(wú)序的信息進(jìn)行系統(tǒng)化和有序化的過(guò)程。它包括信息的描述(外部特征),信息的標(biāo)引(內(nèi)容),信息的整序等過(guò)程。

2.信息標(biāo)引標(biāo)引是指根據(jù)一定的規(guī)則和程序?qū)ξ墨I(xiàn)內(nèi)容進(jìn)行分析,然后賦予每篇文獻(xiàn)以一定數(shù)量的內(nèi)容標(biāo)識(shí)(分類號(hào)、主題詞、關(guān)鍵詞等),作為存儲(chǔ)與檢索的依據(jù)。標(biāo)引的第一步叫“概念標(biāo)引”,目前自動(dòng)標(biāo)引正成為一種新的發(fā)展方向:其流程主要包括:自動(dòng)分詞——選出標(biāo)引詞——轉(zhuǎn)換。目前七頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.3信息檢索語(yǔ)言1.信息檢索語(yǔ)言的概念又稱為標(biāo)引語(yǔ)言、引索語(yǔ)言、文獻(xiàn)檢索語(yǔ)言、信息存儲(chǔ)與檢索語(yǔ)言等,它是用于描述信息系統(tǒng)中信息的內(nèi)部特征和外部特征及表達(dá)信息用戶需求提問(wèn)的一種專門(mén)語(yǔ)言。是一種把文獻(xiàn)的存儲(chǔ)與檢索聯(lián)系起來(lái)、把標(biāo)引人員和檢索人員溝通起來(lái)的約定人工語(yǔ)言2.檢索語(yǔ)言的種類按是否受控劃分為人工語(yǔ)言和自然語(yǔ)言按內(nèi)容性質(zhì)劃分為分類語(yǔ)言和主題語(yǔ)言目前八頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.3信息檢索語(yǔ)言(p163-177自學(xué),考點(diǎn))2.1分類語(yǔ)言用分類號(hào)和相應(yīng)分類款目來(lái)表達(dá)各種概念,它以學(xué)科體系為基礎(chǔ)將各種概念按學(xué)科性質(zhì)和邏輯層次結(jié)構(gòu)進(jìn)行分類和系統(tǒng)排序。按照分類方式又分為體系分類語(yǔ)言、組配分類語(yǔ)言和混合分類語(yǔ)言。2.2主題語(yǔ)言對(duì)表達(dá)信息主題內(nèi)容特征的主題詞匯概念經(jīng)規(guī)范化處理所形成的檢索語(yǔ)言。按照主題性質(zhì)的不同,又分為標(biāo)題詞語(yǔ)言、單元詞語(yǔ)言、敘詞語(yǔ)言、關(guān)鍵詞語(yǔ)言和引文語(yǔ)言。

目前九頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.4分類檢索語(yǔ)言1.分類的思想文獻(xiàn)分類的實(shí)質(zhì)是按照知識(shí)體系分類和概念邏輯方法,對(duì)文獻(xiàn)信息進(jìn)行區(qū)分和歸類。類目是組成分類語(yǔ)言的基本單元,每一個(gè)類目都是一個(gè)相同事物構(gòu)成的集合。根據(jù)文獻(xiàn)信息的內(nèi)容特征和分類詞表,把相同內(nèi)容的文獻(xiàn)信息集中起來(lái),又把不同內(nèi)容的文獻(xiàn)信息區(qū)別開(kāi)來(lái),以實(shí)現(xiàn)相關(guān)集中的功能。目前十頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.4分類檢索語(yǔ)言2.分類語(yǔ)言的基本原則類目劃分的依據(jù)只有一個(gè);上位類可按照一定的標(biāo)準(zhǔn)劃分為若干個(gè)同級(jí)的下位類,任何一個(gè)下位類都有而且只能有一個(gè)上位類;同位類之間互相排斥。3.分類語(yǔ)言的性能分類語(yǔ)言的主要特點(diǎn)是按學(xué)科、專業(yè)集中相關(guān)文獻(xiàn)信息,從知識(shí)分類的角度揭示文獻(xiàn)信息之間的區(qū)別和聯(lián)系,提供從學(xué)科專業(yè)領(lǐng)域檢索文獻(xiàn)信息的途徑。目前十一頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.4分類檢索語(yǔ)言4.分類語(yǔ)言的性能分類語(yǔ)言的符號(hào)——利用字母或數(shù)字的號(hào)碼作為分類標(biāo)識(shí)分類語(yǔ)言的詞語(yǔ)——語(yǔ)義表達(dá)、詞間關(guān)系、文獻(xiàn)信息的集散分類語(yǔ)言的語(yǔ)法——先組配式的信息檢索語(yǔ)言分類語(yǔ)言的使用——主題范圍較大的文獻(xiàn)(如圖書(shū)),類號(hào)的確定較為容易;對(duì)于細(xì)小、復(fù)雜主題的文獻(xiàn)(期刊論文),類號(hào)的選擇相對(duì)較難。目前十二頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.4分類檢索語(yǔ)言5.典型的分類語(yǔ)言——《中國(guó)圖書(shū)館分類法》《中國(guó)圖書(shū)館分類法》(原稱《中國(guó)圖書(shū)館圖書(shū)分類法》)是我國(guó)建國(guó)后編制出版的一部具有代表性的大型綜合性分類法,是當(dāng)今國(guó)內(nèi)圖書(shū)館使用最廣泛的分類法體系,是用的最廣泛的分類語(yǔ)言。目前十三頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.5主題語(yǔ)言1.構(gòu)成原理利用自然語(yǔ)言表達(dá)文獻(xiàn)和提問(wèn)內(nèi)容的主題標(biāo)識(shí)即主題詞。利用各種參照系統(tǒng)等顯示主題標(biāo)識(shí)之間各種關(guān)系利用主題詞的字順序列排列與檢索文獻(xiàn)信息。目前十四頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.5主題語(yǔ)言2.主題語(yǔ)言的性能符號(hào)

——直接利用自然語(yǔ)言的詞語(yǔ)主題語(yǔ)言的詞語(yǔ)

——語(yǔ)義表達(dá)和它在自然語(yǔ)言中的含義一致,詞間關(guān)系通過(guò)主題詞表不同的參照系統(tǒng)和各種注釋等來(lái)加以展示。

主題語(yǔ)言的語(yǔ)法

——有先組配式的信息檢索語(yǔ)言,如標(biāo)題語(yǔ)言;也有后組配式的信息檢索語(yǔ)言,如敘詞語(yǔ)言主題語(yǔ)言的使用

——主題范圍復(fù)雜、細(xì)小的、研究特定對(duì)象的文獻(xiàn),利用主題語(yǔ)言進(jìn)行標(biāo)引和檢索,可以充分發(fā)揮主題語(yǔ)言的優(yōu)勢(shì)主題詞表

——同義詞互見(jiàn)和對(duì)檢索標(biāo)引用詞規(guī)范;上位詞、下位詞的顯示來(lái)擴(kuò)檢或縮檢;通過(guò)有關(guān)聯(lián)主題詞的“參見(jiàn)”提高查全率目前十五頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.5主題語(yǔ)言3.主題語(yǔ)言的種類標(biāo)題語(yǔ)言——基本構(gòu)成單元是主標(biāo)題、副標(biāo)題;標(biāo)題表主要由主表和附表兩大部分組成。

元詞語(yǔ)言——是一種后組式的信息檢索語(yǔ)言;基本構(gòu)成單元是元詞,從文獻(xiàn)中選出來(lái)無(wú)法再拆分的詞匯。敘詞語(yǔ)言——敘詞(descriptor)是指以概念為基礎(chǔ)、經(jīng)規(guī)范化且具有組配功能并可以顯示詞間關(guān)系的動(dòng)態(tài)性詞或詞組。敘詞表是敘詞語(yǔ)言的詞典。敘詞表通常由字順主表、范疇表、詞族表或其他附表組成。關(guān)鍵詞語(yǔ)言——雖然也屬主題語(yǔ)言的范疇,但沒(méi)有經(jīng)過(guò)規(guī)范化處理,屬非受控語(yǔ)言(Uncontrolledterm)。類型:題內(nèi)關(guān)鍵詞索引、題外關(guān)鍵詞索引、雙重關(guān)鍵詞索引。目前十六頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.1信息檢索及其原理4.1.6自然語(yǔ)言自然語(yǔ)言就是我們說(shuō)話或?qū)懳恼聲r(shí)候使用的書(shū)面語(yǔ)言,比較自由。自然語(yǔ)言檢索計(jì)算機(jī)技術(shù)迅速發(fā)展的情況下,自然語(yǔ)言作為檢索語(yǔ)言是一種必然的趨勢(shì)。目前十七頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)一條完整的CNMARC數(shù)據(jù)包含分類和主題兩種語(yǔ)言主題語(yǔ)言分類語(yǔ)言分類語(yǔ)言主題語(yǔ)言目前十八頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.2計(jì)算機(jī)信息檢索原理與技術(shù)4.2.1計(jì)算機(jī)信息檢索的發(fā)展概況脫機(jī)檢索階段、聯(lián)機(jī)檢索階段、光盤(pán)檢索階段、網(wǎng)絡(luò)化聯(lián)機(jī)檢索階段4.2.2計(jì)算機(jī)檢索原理和技術(shù)計(jì)算機(jī)信息檢索原理實(shí)質(zhì)就是由計(jì)算機(jī)將輸入的檢索策略與系統(tǒng)中存儲(chǔ)的文獻(xiàn)的特征標(biāo)識(shí)及其邏輯組配關(guān)系進(jìn)行類比、匹配的過(guò)程。

目前十九頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.2計(jì)算機(jī)信息檢索原理與技術(shù)4.2.2計(jì)算機(jī)檢索原理和技術(shù)數(shù)據(jù)庫(kù)的結(jié)構(gòu)和類型數(shù)據(jù)庫(kù)定義——是至少由一種文檔組成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。數(shù)據(jù)庫(kù)的類型參考數(shù)據(jù)庫(kù)——書(shū)目數(shù)據(jù)庫(kù)(BibliographicDatabases)、指南數(shù)據(jù)庫(kù)(ReferenceDatabases)源數(shù)據(jù)庫(kù)——數(shù)值數(shù)據(jù)庫(kù)、事實(shí)數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)、術(shù)語(yǔ)數(shù)據(jù)庫(kù)、圖像數(shù)據(jù)庫(kù)。目前二十頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.2計(jì)算機(jī)信息檢索原理與技術(shù)4.2.2計(jì)算機(jī)檢索原理和技術(shù)數(shù)據(jù)庫(kù)的結(jié)構(gòu)及全文檢索數(shù)據(jù)庫(kù)主要由文檔、記錄、字段三個(gè)層次存取號(hào)一般由6-9位數(shù)字組成基本索引字段主要包括篇名字段、文摘、敘詞、自由標(biāo)引詞。輔助索引字段用來(lái)描述文獻(xiàn)外表特征的字段。P182頁(yè)目前二十一頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)數(shù)據(jù)庫(kù)的結(jié)構(gòu)圖數(shù)據(jù)庫(kù)是由若干個(gè)互有聯(lián)系的文檔(file)組成的,文檔是書(shū)目數(shù)據(jù)庫(kù)數(shù)據(jù)組織的基本形式,文檔里的數(shù)據(jù)被稱為記錄,一個(gè)記錄又包含若干個(gè)字段。數(shù)據(jù)庫(kù)文檔字、詞記錄字段目前二十二頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)1.文檔數(shù)據(jù)庫(kù)是由若干個(gè)互有聯(lián)系的文檔(file)組成的,信息檢索數(shù)據(jù)庫(kù)的文檔包括主文檔、索引文檔和幫助系統(tǒng)文檔三部分。目前二十三頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)主文檔(順排文檔)記錄按時(shí)間順序存放,記錄之間的邏輯順序與物理順序是一致的,是一種線形文檔,文檔的記錄按文獻(xiàn)信息獲得的先后順序排列,故又名為順排文檔。但對(duì)于所存儲(chǔ)數(shù)據(jù)的某一方面屬性,如作者、關(guān)鍵詞等,則是無(wú)序的,即不能按關(guān)鍵詞的字順查詢。目前二十四頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)索引文檔(倒排文檔)

將順排文檔中各個(gè)記錄中含有主題性質(zhì)的字段(如主題詞字段、標(biāo)題字段、敘詞字段等)和非主題性質(zhì)字段(如作者字段、機(jī)構(gòu)字段、來(lái)源字段等)分別提取出來(lái),按某種順序重新組織得到的一種文檔。

目前二十五頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)幫助系統(tǒng)文檔凡是比較成熟的信息檢索系統(tǒng),還配有完善的在線檢索幫助,包括系統(tǒng)使用的檢索算符、組配規(guī)則、以及使用實(shí)例說(shuō)明性文檔,以網(wǎng)頁(yè)的形式提供給在線用戶。目前二十六頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)2.記錄記錄是數(shù)據(jù)庫(kù)中數(shù)據(jù)集合的一個(gè)單位,是組成文檔的基本數(shù)據(jù)單位。在書(shū)目數(shù)據(jù)庫(kù)中,一個(gè)記錄相當(dāng)于一條題錄或文摘記錄又由字段構(gòu)成,字段則是組成記錄的基本數(shù)據(jù)單位。一個(gè)記錄通常由標(biāo)題字段、作者字段、來(lái)源字段、文摘字段、主題詞字段、分類號(hào)字段、語(yǔ)種字段等組成。目前二十七頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)CNKI中的一條記錄題名字段作者字段文摘字段關(guān)鍵詞字段來(lái)源字段目前二十八頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)EI

中的一條記錄

主題字段輔助字段12目前二十九頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)3.字段字段是組成記錄的基本數(shù)據(jù)單位。字段通常有標(biāo)題字段、作者字段、來(lái)源字段、文摘字段、主題詞字段、分類號(hào)字段、語(yǔ)種字段等。按照字段所代表記錄的性質(zhì)不同,字段通常分為基本字段和輔助字段兩類?;咀侄斡蓄}名字段、文摘字段、主題詞字段等。輔助字段有作者、作者工作單位,文獻(xiàn)來(lái)源,出版事項(xiàng)等。目前三十頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)基本字段輔助字段字段名稱字段代碼字段名稱字段代碼標(biāo)題T/TI記錄號(hào)AN文摘R/AB作者A/AU敘詞DE機(jī)構(gòu)S/OG標(biāo)識(shí)詞ID來(lái)源SO關(guān)鍵詞K/KW出版年P(guān)Y

控制詞CT國(guó)家CU

非控制詞UT語(yǔ)種LA

字段類型與代碼目前三十一頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)CNKI數(shù)據(jù)庫(kù)常用的字段目前三十二頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.3檢索詞的確定與選擇4.3.1相同概念的檢索詞擴(kuò)展1.同義詞擴(kuò)展法

即在同一概念的范圍內(nèi),從語(yǔ)言學(xué)角度選擇不同的名稱、不同的拼寫(xiě)方法和單復(fù)數(shù)形式,不同的名稱包括學(xué)名俗名簡(jiǎn)稱和全稱商品名稱和產(chǎn)品名、事物的代碼和事物學(xué)名的。例.“超聲波在污水處理中的應(yīng)用”超聲波是指頻率介于20kHz—2MHz,人耳聽(tīng)不到的聲波。以往超聲波只用于醫(yī)療診斷、清洗、探測(cè)等方面。目前,超聲波在飲用水,工業(yè)污水污泥處理中具有巨大的應(yīng)用潛力。中文關(guān)鍵詞:超聲波、污水檢索策略1:超聲波and污水----會(huì)漏檢很多文獻(xiàn)檢索策略2:(超聲波or聲化學(xué))and(污水or廢水),檢索結(jié)果較多,較全面。目前三十三頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.3檢索詞的確定與選擇4.3.1相同概念的檢索詞擴(kuò)展2.截詞法檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化,可以采用截詞方法擴(kuò)展檢索詞。目前三十四頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)截詞法舉例:檢索“微型熱管的研究進(jìn)展”這一課題,就可以使用截詞。案例分析:隨著計(jì)算機(jī)芯片中電路數(shù)目的增加,其產(chǎn)生熱量的散逸變得越來(lái)越困難。微型熱管作為一項(xiàng)很有前途的技術(shù),可用于計(jì)算機(jī)芯片以獲得高的熱量導(dǎo)出率及溫度均勻化。即微型熱管成為電子芯片內(nèi)部的一部分,直接將熱量從最大熱量區(qū)域中取出。微型:miniature,minitype,微型的:micro,mini,miniature熱管:heatpipe*檢索策略1:microheatpipe*orminiatureheatpipe*檢索策略2:(microormini*)andheatpipe*檢索策略3:(microormini*)and“heatpipe*”

這樣就能把以“mi”為詞根的所有詞語(yǔ)檢索出來(lái),再通過(guò)邏輯算符的組配,實(shí)現(xiàn)準(zhǔn)確檢索。目前三十五頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.3檢索詞的確定與選擇4.3.1相同概念的檢索詞擴(kuò)展3.主題詞表有時(shí)候用戶會(huì)使用自由詞,也就是自然語(yǔ)言,但數(shù)據(jù)庫(kù)標(biāo)引時(shí)用的是規(guī)范詞。EI數(shù)據(jù)庫(kù)中就有詞表例:自由詞:維生素C(vitaminC);標(biāo)引詞:抗壞血酸(ASCORBICACID)自由詞(直譯):supermolecular;標(biāo)引詞:macromolecular例如:檢索“六行程發(fā)動(dòng)機(jī)”的資料,把“六行程”作主題詞時(shí),就不能找到相關(guān)資料,而用六沖程作為主題詞就可以找到。目前三十六頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.3檢索詞的確定與選擇4.3.2檢索詞的使用要恰當(dāng)1.檢索詞要使用單元詞使用概念上不可再分的詞語(yǔ),如要檢索“建筑物防災(zāi)與減災(zāi)”這一課題,這一課題包含的基本概念,建筑物,災(zāi)害,防治,減災(zāi)等都是單元詞目前三十七頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.3檢索詞的確定與選擇4.3.2檢索詞的使用要恰當(dāng)2.概念不能太大也不能太小例1:“煤脫硫的最新工藝與技術(shù)”,若用“煤脫硫”作為主題概念,有1000多篇——概念太大。這時(shí)候就要選擇更具體的概念“微波煤脫硫”,有10多篇——概念定位恰當(dāng)。目前三十八頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.3檢索詞的確定與選擇4.3.2檢索詞的使用要恰當(dāng)3.多主題概念的選詞以“簡(jiǎn)”為主

例:課題“利用基因工程的手段提高植物中淀粉的含量”

檢索策略:“基因工程”

AND“植物”AND“淀粉”AND“含量”——檢索結(jié)果為零。對(duì)于本課題,只有2個(gè)主題概念最為關(guān)鍵---“基因”AND“淀粉”。4.詞語(yǔ)要規(guī)范化俗名“六六六”檢索,檢索結(jié)果很不理想,應(yīng)該用“六氯環(huán)己烷”、“六氯化苯”、“BHC”目前三十九頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.1布爾邏輯算符組配檢索1.邏輯與用符號(hào)“and”

“*”表示其邏輯表達(dá)式為:AandB或A*B其意義為檢索記錄中必須同時(shí)含有檢索詞A和B的文獻(xiàn),才算命中文獻(xiàn)。AB目前四十頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)邏輯與示例例如你想在題名中檢索有關(guān)新聞美學(xué)的文獻(xiàn),如只輸入“新聞”或“美學(xué)”,則命中文獻(xiàn)太多,且有許多不是自己所要的。如果輸入“新聞*美學(xué)”,則檢索出題名中同時(shí)含有“新聞”和“美學(xué)”的文獻(xiàn),檢索結(jié)果大大縮小。目前四十一頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)邏輯與在CNKI中的應(yīng)用目前四十二頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.1布爾邏輯算符組配檢索2.邏輯或用符號(hào)“or”或“+”表示,其邏輯表達(dá)式為:AorB或A+B其意義為檢索記錄中凡含有檢索詞A或檢索詞B,或同時(shí)含有檢索詞A和B的,均為命中文獻(xiàn)。AB目前四十三頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.1布爾邏輯算符組配檢索3.邏輯非用符號(hào)“not”或“-”表示其邏輯表達(dá)式為:AnotB或A–B其意義為:檢索記錄中含有檢索詞A,但不能含有檢索詞B的文獻(xiàn),才算命中文獻(xiàn)。例如我需要中國(guó)旅游方面的資料,但不包括地圖,檢索式為:中國(guó)*旅游-地圖AB目前四十四頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.2截詞符利用檢索詞的詞干或不完整的詞形進(jìn)行檢索,在檢索詞的適當(dāng)位置進(jìn)行截?cái)?,?jié)省輸入的字符,達(dá)到較高的查全率。包括無(wú)限截?cái)嗪陀邢藿財(cái)?,無(wú)限截?cái)嘤职ê蠓浇財(cái)嗪颓胺浇財(cái)?。把截詞符放在字根的右邊,如“Comput*”則Computer、Computers、Computerise、Computerize等均為命中把截詞符放在字根的左邊,如*Computer,那么在計(jì)算機(jī)檢索時(shí),索引詞Microcomputer均算命中。

若干個(gè)限制截詞符“?”放在詞干上,向系統(tǒng)表示在此位置上允許出現(xiàn)相應(yīng)數(shù)目的字母。三個(gè)截詞符“?”代表可增加0-3個(gè)字母,例如:plant???,相當(dāng)于查找plant,plants,planted,planter等詞。

目前四十五頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符位置算符(W)與(nW)算符表示其兩側(cè)的檢索詞必須按前后順序出現(xiàn)在記錄中,而且兩詞之間不允許插入其他字符和單詞,只允許有空格或一個(gè)標(biāo)點(diǎn)符號(hào)。實(shí)例:sdouble(W)digit等價(jià)于sdoubledigit檢索出doubledigit和double-digit。(nW)中的n表示兩檢索詞中間允許插入的單詞數(shù)目少于或等于n個(gè),算符兩側(cè)檢索詞的詞序不能顛倒。實(shí)例:asolar(1W)energy,檢出solarenergy,solarradiantenergy,solarelectricenergy。目前四十六頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)位置算符(N)與(nN)算符(N)表示其兩側(cè)的檢索詞位置可以倒置,但在兩詞之間不能插入其他字符;實(shí)例:sfiber?(N)optic,檢出fiberoptic,fiberoptics,opticalfiber,opticalfibers。(nN)中的n表示允許插入單詞的數(shù)目量少于或等于n個(gè),兩檢索詞的詞序可以顛倒。實(shí)例:sallergic(2N)reaction?檢出allergicreactions,allergicdrugreactions,allergiccross-reactions,reactionsofthoseallergic目前四十七頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)位置算符(X)算符與(nX)算符A(X)B,表示A和B檢索詞出現(xiàn)完全一致,并以指定的順序相鄰,且中間不允許任何其他單詞和字母;nX含義同上,就是兩詞之間字符數(shù)小于等于n。(L)算符(link)A(L)B表示A和B有主從關(guān)系,A為主,B為副。此算符對(duì)于用標(biāo)題詞進(jìn)行標(biāo)引的文獻(xiàn)。(S)算符A(s)B,表A和B必須同時(shí)出現(xiàn)在記錄的同一個(gè)句子或短語(yǔ)中,但次序可能隨意改變,A與B之間可以有若干個(gè)其他的詞。

(F)算符A(F)B,表示A和B必須同時(shí)出現(xiàn)在記錄的同一個(gè)字段之中,但位置和次序不限,兩者之間還可以任意加詞。如Rice(F)Genetics/Ti要求Rice和Genetics必在同時(shí)出現(xiàn)在篇名之中。目前四十八頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.4字段限制符1)后綴限定(/)electron/TI2)前綴限定(=)AU=Rankin,K.M.LA=English3)時(shí)間限制符(:)PY=1990:1999

4)限定網(wǎng)站site:【實(shí)例】輸入“金庸古龍site:”搜索包含“金庸”和“古龍”的中文新浪網(wǎng)站頁(yè)面。目前四十九頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.4字段限制符5)限定網(wǎng)頁(yè)【實(shí)例】輸入“inurl:midi滄海一聲笑”查找MIDI曲“滄海一聲笑”?!緦?shí)例】輸入inurl:"plog/register.php",搜索plog注冊(cè)文件(現(xiàn)在用的很普遍的一套PHP博客程序,在其安裝說(shuō)明中明確說(shuō)明希望用戶安裝后刪除register.php文件)?!緦?shí)例】輸入“inurlecuritywindows2000site:”查找微軟網(wǎng)站上關(guān)于windows2000的安全課題資料。目前五十頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.4字段限制符6)限定標(biāo)題【實(shí)例】輸入“intitle:張娜拉寫(xiě)真”查找韓國(guó)張娜拉的照片集。

7)限定文件類型【實(shí)例】輸入filetype:litlit(books|ebooks),搜索網(wǎng)絡(luò)圖書(shū)(FILETYPE可以更換)?!緦?shí)例】利用后綴名來(lái)搜索電子書(shū),輸入“存在與虛無(wú)chm”、“菜根譚exe”、“水煮三國(guó)chm”。

8)其他類型限定目前五十一頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.4檢索詞組配算符4.4.5加權(quán)檢索根據(jù)檢索詞在需求中的重要程度給定一個(gè)權(quán)值。在檢索中,由系統(tǒng)先查找存在這些檢索詞的文獻(xiàn),并計(jì)算它們的權(quán)值總和。然后,檢索者再給定一個(gè)閾值大于或等于該閾值時(shí),才算命中。4.4.6聚類檢索主題相近、內(nèi)容相關(guān)的文獻(xiàn)便聚在一起,而相異的則被區(qū)分開(kāi)來(lái)4.4.7跨文檔檢索用一個(gè)檢索式可以同時(shí)檢索多個(gè)文檔,如CNKI的跨庫(kù)檢索目前五十二頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)、概念檢索同時(shí)對(duì)同義詞、近義詞、廣義詞、狹義詞進(jìn)行檢索。例,輸入“土豆”,檢出結(jié)果不多,還可以再次輸入“馬鈴薯,洋芋”等同義詞,就可檢索更多結(jié)果。、深入檢索(二次檢索)例:查找“信息檢索”,會(huì)出來(lái)很多結(jié)果,這時(shí)候需要“在結(jié)果中進(jìn)一步檢索”以得到更精確的結(jié)果。4.4檢索詞組配算符目前五十三頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.5信息檢索方法和步驟□分析課題□選擇檢索系統(tǒng)□確定檢索詞□構(gòu)造檢索式□調(diào)整檢索策略□輸出檢索結(jié)果□獲取原始文獻(xiàn)目前五十四頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)

信息檢索的基本步驟圖分析檢索課題1.主題概念2.信息類型3.時(shí)間范圍4.檢索目的構(gòu)造檢索式(試驗(yàn)性檢索)1.簡(jiǎn)單提問(wèn)式2.上下文提問(wèn)式3.復(fù)合提問(wèn)式4.結(jié)構(gòu)性提問(wèn)式調(diào)整檢索策略(正式檢索)1,信息量過(guò)多時(shí)2.信息量太少時(shí)輸出檢索結(jié)果1.文摘2.全文選擇檢索系統(tǒng)1.學(xué)科范圍2.系統(tǒng)類型3.系統(tǒng)功能

確定檢索詞

1.切分2.刪除3.替補(bǔ)4.組合5.增加用戶評(píng)價(jià)

目前五十五頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)算符使用,檢索時(shí)使用邏輯算符,位置算符,截詞算符使用系統(tǒng)的基本檢索和高級(jí)檢索選擇相應(yīng)的檢索字段:題名,著者,關(guān)鍵詞檢索相關(guān)詞:有些系統(tǒng)自動(dòng)提示相關(guān)詞,可以選擇4.5信息檢索方法和步驟4.5.1檢索規(guī)則目前五十六頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)1.檢索式的含義所謂的檢索提問(wèn)式(query,searchformulation),是信息檢索中用來(lái)表達(dá)用戶檢索提問(wèn)的邏輯表達(dá)式,主要是使用各種布爾邏輯算符、位置算符、截詞符、限制算符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)將檢索詞進(jìn)行組配,確定檢索詞之間的概念關(guān)系或位置關(guān)系。4.5信息檢索方法和步驟4.5.2檢索式的表達(dá)目前五十七頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)2.構(gòu)造檢索式要注意的用詞技巧:少用或不用對(duì)課題檢索意義不大的詞詞義泛指過(guò)大(不用)、詞義延伸過(guò)大(少用)、規(guī)范詞是可優(yōu)先考慮使用

充分利用所選主題表達(dá)的上位或下位概念縮小主題范疇明確課題的“學(xué)科歸屬”4.5.2檢索式的表達(dá)4.5信息檢索方法和步驟目前五十八頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)3.檢索表達(dá)式構(gòu)造課題:地震序列分析的工具和方法研究要完成本項(xiàng)檢索課題,必須使用如下的檢索式:(“sequenceanalysis”INTI)AND((method*ORtool*ORinstrument*)INAB))

AND(SeismicORearthquake)4.5.2檢索式的表達(dá)4.5信息檢索方法和步驟目前五十九頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)課題1:建筑節(jié)能與集中供熱新技術(shù)研究(設(shè)備)constructionconservesenergy,centralheating,study;research4.5.3檢索實(shí)例4.5信息檢索方法和步驟目前六十頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)課題2:高層建筑結(jié)構(gòu)優(yōu)化設(shè)計(jì)

1.信息需求分析(1)明確檢索目的與要求

1)檢索目的:碩士學(xué)位論文開(kāi)題查新

2)檢索要求:國(guó)內(nèi)外關(guān)于高層建筑結(jié)構(gòu)優(yōu)化設(shè)計(jì)方面的相關(guān)信息

3)確定檢索類型:屬書(shū)目及全文信息檢索(2)主題分析第一概面:高層建筑第二概面

結(jié)構(gòu)設(shè)計(jì)第三概面

:優(yōu)化設(shè)計(jì)4.5.3檢索實(shí)例4.5信息檢索方法和步驟目前六十一頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)檢索課題2:高層建筑結(jié)構(gòu)優(yōu)化設(shè)計(jì)2.制定檢索策略選擇檢索詞根據(jù)主題分析確定的主題范圍,選擇檢索詞如下:

高層建筑tallbuilding*

高層建筑highrisebuilding*

高層建筑highrisebuilding*

結(jié)構(gòu)設(shè)計(jì)structuraldesign

優(yōu)化設(shè)計(jì)optimization目前六十二頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)檢索課題2:高層建筑結(jié)構(gòu)優(yōu)化設(shè)計(jì)3.編寫(xiě)檢索提問(wèn)式檢索式1

高層建筑and結(jié)構(gòu)設(shè)計(jì)

檢索式2

高層建筑and結(jié)構(gòu)設(shè)計(jì)and優(yōu)化檢索式3(tallbuilding*orhighrisebuilding*orhighrisebuilding*)andstructuraldesign檢索式4

building*and(tallorhighriseorhighrise)andstructuraldesign檢索式5

building*and(tallorhighriseorhighrise)andstructuraldesignandoptimization檢索式6[building*and(tallorhighriseorhighrise)andstructuraldesignandoptimization]/AB檢索式7[building*and(tallorhighriseorhighrise)andstructuraldesignandoptimization]/TI目前六十三頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.選擇檢索系統(tǒng),輸入檢索式5.查看檢索結(jié)果,優(yōu)化檢索式6.篩選檢索結(jié)果檢索課題2:高層建筑結(jié)構(gòu)優(yōu)化設(shè)計(jì)目前六十四頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.6原始文獻(xiàn)分析4.6.1課題思路的調(diào)整重新選擇檢索詞使用網(wǎng)絡(luò)搜索引擎原始文獻(xiàn)的評(píng)價(jià)和篩選原始文獻(xiàn)的閱讀與分析評(píng)價(jià)檢索到的原始文獻(xiàn)觀點(diǎn)的歸納與總結(jié)創(chuàng)新性觀點(diǎn)的形成目前六十五頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.7檢索結(jié)果及全文索取原始文獻(xiàn)的評(píng)價(jià)和篩選

檢索到的文獻(xiàn)有的存在問(wèn)題,要辨證的認(rèn)識(shí)所獲文獻(xiàn),批判繼承原文獲取途徑館際互借與全文傳遞聯(lián)機(jī)檢索中心,提供全文信息檢索(DIALOG)網(wǎng)絡(luò)環(huán)境下的圖書(shū)館區(qū)域合作:天津的高校數(shù)字圖書(shū)館聯(lián)盟,免費(fèi)全文傳遞目前六十六頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)4.8信息檢索技巧總結(jié)當(dāng)我們遇到一個(gè)課題,應(yīng)該從哪些方面入手?如何完成一個(gè)準(zhǔn)確而全面的檢索?目前六十七頁(yè)\總數(shù)七十七頁(yè)\編于十八點(diǎn)第一步先分析課題的詞義,獲取關(guān)鍵詞1.1.分析課題查找詞語(yǔ)的意義,可以借助字典詞典百科全書(shū),或者工具書(shū)手冊(cè)等,明確課題的意義和學(xué)科歸屬。1.2關(guān)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論