




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2022/12/111第二章計(jì)算機(jī)信息檢索技術(shù)
鄭州大學(xué)信息檢索教研室2022/12/81第二章計(jì)算機(jī)信息檢索技術(shù)鄭州大22022/12/11第1節(jié)計(jì)算機(jī)檢索概述第2節(jié)計(jì)算機(jī)信息檢索系統(tǒng)組成第3節(jié)計(jì)算機(jī)信息檢索的分類(lèi)第4節(jié)計(jì)算機(jī)信息檢索技術(shù)第5節(jié)信息檢索的方法*第6節(jié)信息檢索的策略*22022/12/8第1節(jié)計(jì)算機(jī)檢索概述32022/12/111.1國(guó)內(nèi)外計(jì)算機(jī)信息檢索發(fā)展階段1975年,從國(guó)外引進(jìn)數(shù)據(jù)庫(kù)開(kāi)展機(jī)檢服務(wù);1980年,建立國(guó)際聯(lián)機(jī)終端開(kāi)展檢索服務(wù);20世紀(jì)80年代中后期,自建數(shù)據(jù)庫(kù);90年代初,發(fā)展光盤(pán)檢索;90年代中期,Internet網(wǎng)絡(luò)化檢索階段。32022/12/81.1國(guó)內(nèi)外計(jì)算機(jī)信息檢索發(fā)展階段1942022/12/11國(guó)外計(jì)算機(jī)信息檢索發(fā)展階段(P5)脫機(jī)檢索階段(20世紀(jì)50-60年代)聯(lián)機(jī)檢索階段(20世紀(jì)60-80年代)光盤(pán)檢索階段(20世紀(jì)80年代中-90年代)網(wǎng)絡(luò)信息檢索階段(1995-)42022/12/8國(guó)外計(jì)算機(jī)信息檢索發(fā)展階段(P5)脫機(jī)檢52022/12/111.2計(jì)算機(jī)信息檢索的定義計(jì)算機(jī)信息檢索的實(shí)質(zhì)就是由計(jì)算機(jī)將輸入的檢索策略與系統(tǒng)中存儲(chǔ)的文獻(xiàn)特征標(biāo)識(shí)及其邏輯組配關(guān)系進(jìn)行類(lèi)比、匹配的過(guò)程,需要人——機(jī)協(xié)同作用來(lái)完成。信息存貯是將文獻(xiàn)、數(shù)值、事實(shí)等按一定的格式輸入到計(jì)算機(jī)中,加工處理成可供檢索的數(shù)據(jù)庫(kù)。信息檢索是將檢索提問(wèn)式按一定的要求輸入計(jì)算機(jī)中,經(jīng)計(jì)算機(jī)系統(tǒng)與已存貯在計(jì)算機(jī)中的數(shù)據(jù)庫(kù)進(jìn)行匹配運(yùn)算,然后將符合檢索提問(wèn)的數(shù)據(jù)按要求的格式輸出。52022/12/81.2計(jì)算機(jī)信息檢索的定義計(jì)算機(jī)信息1.3計(jì)算機(jī)信息檢索特點(diǎn)檢索速度快,效益高;檢索功能強(qiáng),數(shù)量大;檢索途徑多,手段靈活;檢索范圍廣;服務(wù)方式多。1.3計(jì)算機(jī)信息檢索特點(diǎn)檢索速度快,效益高;72022/12/111.4計(jì)算機(jī)信息檢索的原理(P8-11)
信息存儲(chǔ)
原始信息
信息主題
數(shù)據(jù)庫(kù)記錄及信息特征標(biāo)識(shí)
信息檢索
信息需求
檢索主題
檢索提問(wèn)式及提問(wèn)標(biāo)識(shí)
計(jì)算機(jī)
檢索結(jié)果
主題分析著錄標(biāo)引類(lèi)比輸出主題分析選定編制檢索語(yǔ)言(主題詞表)72022/12/81.4計(jì)算機(jī)信息檢索的原理(P8-1182022/12/11信息存儲(chǔ)過(guò)程信息存儲(chǔ)就是按照一定標(biāo)準(zhǔn),將收集到的原始文獻(xiàn)進(jìn)行主題概念分析,用系統(tǒng)規(guī)定的語(yǔ)言(主題詞、分類(lèi)號(hào))進(jìn)行標(biāo)引,形成信息的特征標(biāo)識(shí),進(jìn)行整理與排序,構(gòu)成可供檢索的數(shù)據(jù)庫(kù),主要包括:信息的采集、著錄、標(biāo)引和整序等過(guò)程。82022/12/8信息存儲(chǔ)過(guò)程信息存儲(chǔ)就是按照一定標(biāo)準(zhǔn),將92022/12/11信息的著錄對(duì)所收集的原始信息的外表特征(如題名、著者、文獻(xiàn)出處等)和內(nèi)容特征(如分類(lèi)號(hào)、主題詞、摘要等)進(jìn)行描述,形成一條條款目或記錄的過(guò)程。在數(shù)據(jù)庫(kù)中,其外表特征和內(nèi)容特征通常稱(chēng)之為字段,一條記錄由若干個(gè)不同字段構(gòu)成。92022/12/8信息的著錄對(duì)所收集的原始信息的外表特征(102022/12/11信息的標(biāo)引標(biāo)引:根據(jù)一定的規(guī)則和程序(主題詞典或詞表),對(duì)文獻(xiàn)的主題內(nèi)容進(jìn)行分析,給予每篇文獻(xiàn)主題詞、關(guān)鍵詞作為存儲(chǔ)和檢索標(biāo)識(shí);或者根據(jù)文獻(xiàn)的學(xué)科歸屬,采用某種文獻(xiàn)資料分類(lèi)法,給予分類(lèi)號(hào)作為檢索標(biāo)識(shí)。102022/12/8信息的標(biāo)引標(biāo)引:根據(jù)一定的規(guī)則和程序(112022/12/11信息檢索過(guò)程用戶(hù)對(duì)檢索課題加以分析,明確檢索范圍,弄清主題概念,然后用系統(tǒng)檢索語(yǔ)言來(lái)表示主題概念,形成檢索標(biāo)識(shí)及檢索策略,輸入到計(jì)算機(jī)進(jìn)行檢索。計(jì)算機(jī)按照用戶(hù)的要求將檢索策略轉(zhuǎn)換成一系列提問(wèn),在專(zhuān)用程序的控制下進(jìn)行邏輯運(yùn)算,選出符合要求的信息輸出。計(jì)算機(jī)檢索的過(guò)程實(shí)際上是一個(gè)比較、匹配的過(guò)程,檢索提問(wèn)只要與數(shù)據(jù)庫(kù)中的信息的特征標(biāo)識(shí)及其邏輯組配關(guān)系相一致,則屬“命中”,即找到了符合要求的信息。112022/12/8信息檢索過(guò)程用戶(hù)對(duì)檢索課題加以分析,明2計(jì)算機(jī)信息檢索系統(tǒng)組成2.1系統(tǒng)設(shè)備硬件:運(yùn)算器、控制器、存儲(chǔ)器、輸入輸出裝置等軟件:系統(tǒng)操作程序、數(shù)據(jù)庫(kù)管理程序、聯(lián)機(jī)控制程序、應(yīng)用程序等。通訊線路:電話通訊網(wǎng)、數(shù)據(jù)通訊網(wǎng)、衛(wèi)星通訊網(wǎng)等。檢索終端:信息用戶(hù)與檢索系統(tǒng)主機(jī)進(jìn)行人機(jī)對(duì)話,實(shí)現(xiàn)聯(lián)機(jī)檢索的設(shè)備。包括上網(wǎng)設(shè)備、調(diào)制解調(diào)器等。數(shù)據(jù)庫(kù):是計(jì)算機(jī)檢索的對(duì)象。是由一個(gè)或數(shù)個(gè)文檔構(gòu)成,并能夠滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。2計(jì)算機(jī)信息檢索系統(tǒng)組成2.1系統(tǒng)設(shè)備132022/12/112.2數(shù)據(jù)庫(kù)的構(gòu)成一定專(zhuān)業(yè)范圍內(nèi)的信息記錄及其索引的集合體,是計(jì)算機(jī)信息檢索系統(tǒng)的重要組成部分,是信息資源,是檢索對(duì)象。一定專(zhuān)業(yè)范圍內(nèi)的信息記錄及其索引的集合體,是計(jì)算機(jī)信息檢索系統(tǒng)的重要組成部分,是信息資源,是檢索對(duì)象。構(gòu)成數(shù)據(jù)庫(kù)的三大要素:
文檔——記錄——字段檢索時(shí),計(jì)算機(jī)按輸入檢索詞的字順先從指定的倒排文檔中找到相匹配的索引詞,然后根據(jù)索引詞后的記錄順序號(hào)到順排檔中調(diào)出相應(yīng)的記錄。132022/12/82.2數(shù)據(jù)庫(kù)的構(gòu)成一定專(zhuān)業(yè)范圍內(nèi)的142022/12/11文檔(File)數(shù)據(jù)庫(kù)中一部分記錄的集合,文檔由若干記錄構(gòu)成。數(shù)據(jù)庫(kù)是由一個(gè)順排文檔和若干個(gè)倒排文檔所構(gòu)成
順排文檔是數(shù)據(jù)庫(kù)的主體,又稱(chēng)主文檔,按每條記錄的順序號(hào)大小排列,檢索結(jié)果都來(lái)自于順排文檔。
倒排文檔是從順排檔中抽取有檢索意義的檢索標(biāo)識(shí),如主題詞、著者姓名、化學(xué)物質(zhì)名、刊名等,并按索引詞的字順排列,同時(shí)在檢索標(biāo)識(shí)后注明入藏順序號(hào),這就是常見(jiàn)的數(shù)據(jù)庫(kù)中的主題詞索引、著者索引、刊名索引。142022/12/8文檔(File)數(shù)據(jù)庫(kù)中一部分記錄的集152022/12/11152022/12/8162022/12/11由若干字段組成的文獻(xiàn)單元,是數(shù)據(jù)庫(kù)中的基本文獻(xiàn)單元,每條記錄描述了原始信息的外部和內(nèi)部特征。數(shù)據(jù)庫(kù)中的一條記錄通常代表一篇文獻(xiàn)。例如:在書(shū)目型數(shù)據(jù)庫(kù)中,一條記錄相當(dāng)于一條題錄或文摘;在全文型數(shù)據(jù)庫(kù)中,一條記錄相當(dāng)于一篇完整的文獻(xiàn);在其它類(lèi)型數(shù)據(jù)庫(kù)中,一條記錄則代表一個(gè)信息單元。記錄越多,數(shù)據(jù)庫(kù)的容量就越大。記錄(Record)162022/12/8由若干字段組成的文獻(xiàn)單元,是數(shù)據(jù)庫(kù)中的172022/12/11172022/12/8182022/12/11字段(Field)字段是構(gòu)成記錄的基本單元,是對(duì)文獻(xiàn)某一方面的特征(包括外表特征和內(nèi)容特征)進(jìn)行描述的結(jié)果。
例如:題名、作者、作者地址、出版年、來(lái)源(出處)、主題詞、文摘等字段是書(shū)目數(shù)據(jù)庫(kù)中必備字段。為識(shí)別每一個(gè)字段所表達(dá)的文獻(xiàn)特征,通常每個(gè)字段都有固定的名稱(chēng)和縮寫(xiě)(或稱(chēng)字段標(biāo)識(shí)符),如,題名字段的標(biāo)識(shí)符為T(mén)I,作者字段的標(biāo)識(shí)符為AU等。
182022/12/8字段(Field)字段是構(gòu)成記錄的基本192022/12/112.3數(shù)據(jù)庫(kù)的類(lèi)型*(P3-4)參考(文獻(xiàn)書(shū)目型)數(shù)據(jù)庫(kù)全文數(shù)據(jù)庫(kù)事實(shí)數(shù)據(jù)庫(kù)數(shù)值數(shù)據(jù)庫(kù)192022/12/82.3數(shù)據(jù)庫(kù)的類(lèi)型*(P3-4)參202022/12/11參考(文獻(xiàn)書(shū)目型)數(shù)據(jù)庫(kù)是指包含各種數(shù)據(jù)、信息或知識(shí)的原始來(lái)源和屬性的數(shù)據(jù)庫(kù);是機(jī)讀的目錄、索引和文摘檢索工具,檢索結(jié)果是文獻(xiàn)的線索而非原文。存儲(chǔ)的是二次文獻(xiàn),包括文獻(xiàn)的外部特征、題錄、文摘和主題詞等。這類(lèi)數(shù)據(jù)庫(kù)占用很大的比例,其代表性的數(shù)據(jù)庫(kù)有《EICompendexPlus》(工程索引)、《INSPEC》(科學(xué)文摘)和《全國(guó)報(bào)刊索引》等。圖書(shū)館提供的基于網(wǎng)絡(luò)的聯(lián)機(jī)公共檢索目錄(OPAC)系統(tǒng)202022/12/8參考(文獻(xiàn)書(shū)目型)數(shù)據(jù)庫(kù)是指包含各種數(shù)212022/12/11
事實(shí)數(shù)據(jù)庫(kù)存儲(chǔ)的是用來(lái)描述人物、機(jī)構(gòu)、事物等信息的情況、過(guò)程、現(xiàn)象的事實(shí)數(shù)據(jù)。如名人錄、機(jī)構(gòu)指南、大事記、百科全書(shū)、手冊(cè)、地圖集、企事業(yè)名錄、計(jì)算機(jī)程序、音樂(lè)等,均可歸入事實(shí)數(shù)據(jù)庫(kù)。例如:中國(guó)咨詢(xún)行、國(guó)研網(wǎng)、萬(wàn)方數(shù)據(jù)(中國(guó)企業(yè)、公司及產(chǎn)品、中國(guó)科技名人、中國(guó)科研機(jī)構(gòu)等等)212022/12/8事實(shí)數(shù)據(jù)庫(kù)存儲(chǔ)的是用來(lái)描述人物、機(jī)222022/12/11數(shù)值數(shù)據(jù)庫(kù)主要包含的是數(shù)字?jǐn)?shù)據(jù),如各種統(tǒng)計(jì)數(shù)據(jù)、科學(xué)實(shí)驗(yàn)數(shù)據(jù)、科學(xué)測(cè)量數(shù)據(jù)等。氣像數(shù)據(jù)、地質(zhì)資料、化學(xué)或物理化合物特性的文獻(xiàn)數(shù)據(jù)、人口統(tǒng)計(jì)資料、市場(chǎng)調(diào)研數(shù)據(jù)等。222022/12/8數(shù)值數(shù)據(jù)庫(kù)主要包含的是數(shù)字?jǐn)?shù)據(jù),如各種232022/12/11全文數(shù)據(jù)庫(kù)存儲(chǔ)的是原始文獻(xiàn)的全文,如雜志論文、報(bào)紙新聞、法院案例等。全文檢索可直接獲取原始資料,而不是書(shū)目檢索時(shí)的線索,提高了用戶(hù)的檢索效率。如:中國(guó)知網(wǎng)(CNKI)、萬(wàn)方、維普、
Elsevier等全文數(shù)據(jù)庫(kù)。232022/12/8全文數(shù)據(jù)庫(kù)存儲(chǔ)的是原始文獻(xiàn)的全文,如雜3計(jì)算機(jī)信息檢索的分類(lèi)1按信息資源的存儲(chǔ)形式分2按信息訪問(wèn)模式分
3計(jì)算機(jī)信息檢索的分類(lèi)1按信息資源的存儲(chǔ)形式分252022/12/113.1按信息資源的存儲(chǔ)形式分*
(P7-8)(1)全文檢索。以全文數(shù)據(jù)庫(kù)存儲(chǔ)為基礎(chǔ)的檢索方式,所謂全文數(shù)據(jù)庫(kù)是將一個(gè)完整的信息源的全部?jī)?nèi)容轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別、處理的信息單元而形成的數(shù)據(jù)集合。全文檢索系統(tǒng)對(duì)全文數(shù)據(jù)庫(kù)進(jìn)行詞(字)、句、段落等深層次的編輯、加工,同時(shí)允許用戶(hù)采用自然語(yǔ)言表達(dá),借助邏輯組配、截詞、鄰詞匹配等檢索手段直接查閱文獻(xiàn)原文信息。全文檢索的應(yīng)用范圍包括:各種科技期刊、專(zhuān)利文獻(xiàn)、新聞報(bào)紙、年鑒、百科、手冊(cè)、圖書(shū)等全文數(shù)據(jù)庫(kù),例如:我國(guó)引進(jìn)的OCLC的firstsearch、IEL、SpringerLink、EBSCO等全文數(shù)據(jù)庫(kù)以及我國(guó)CNKI的中國(guó)期刊全文數(shù)據(jù)庫(kù)、重慶維普的中文科技期刊數(shù)據(jù)庫(kù)、超星數(shù)字圖書(shū)館、萬(wàn)方資源系統(tǒng)的數(shù)字化期刊、學(xué)位論文、會(huì)議論文等。
252022/12/83.1按信息資源的存儲(chǔ)形式分*(P262022/12/11(2)二次文獻(xiàn)檢索*是針對(duì)全文檢索而言,也就是分別將文獻(xiàn)的內(nèi)部特征(題名、分類(lèi)等)和外部特征(作者、出處、年代、ISSN、語(yǔ)言等)作為存儲(chǔ)和檢索的匹配標(biāo)識(shí)而形成的數(shù)據(jù)集合,利用檢索系統(tǒng)的檢索結(jié)果是文獻(xiàn)信息的題錄及文摘。學(xué)科領(lǐng)域覆蓋面廣,信息量大,可以利用文獻(xiàn)線索獲取到一次文獻(xiàn)。例如:COMPENDEX、INSPEC、SCI等國(guó)外數(shù)據(jù)庫(kù);萬(wàn)方數(shù)據(jù)的學(xué)位論文、會(huì)議論文數(shù)據(jù)庫(kù)、全國(guó)報(bào)刊索引、Calis西文期刊目次數(shù)據(jù)庫(kù)等262022/12/8(2)二次文獻(xiàn)檢索*是針對(duì)全文檢索而言272022/12/11(3)多媒體檢索就是把文字、聲音、圖像(形)等多種信息的傳播載體通過(guò)計(jì)算機(jī)進(jìn)行數(shù)字化加工、處理而形成的一種綜合存儲(chǔ)技術(shù)。利用多媒體檢索系統(tǒng)可分別進(jìn)行視頻檢索、聲音檢索、圖像檢索。多媒體信息檢索系統(tǒng)有著廣闊的應(yīng)用前景,它將廣泛用于電子會(huì)議、遠(yuǎn)程教學(xué)、遠(yuǎn)程醫(yī)療、電子圖書(shū)館、藝術(shù)收藏和地球資源管理、天氣預(yù)報(bào)、時(shí)裝設(shè)計(jì)、智能群體決策、計(jì)算機(jī)支持協(xié)同工作、金融市場(chǎng)、軍事指揮系統(tǒng)、防汛指揮系統(tǒng)等方面。各大網(wǎng)站均可進(jìn)行多媒體信息的檢索,如:GOOGLE、百度等搜索引擎、新華社多媒體數(shù)據(jù)庫(kù)是國(guó)內(nèi)最大規(guī)模的多媒體、多文種新聞信息綜合性數(shù)據(jù)庫(kù)。272022/12/8(3)多媒體檢索就是把文字、聲音、圖像282022/12/11(4)超文本檢索超文本(Hypertext)是利用計(jì)算機(jī)將多介質(zhì)信息按照一定的邏輯聯(lián)接關(guān)系加工、貯存起來(lái),構(gòu)成可任意連接的、有層次的網(wǎng)狀結(jié)構(gòu)數(shù)據(jù)庫(kù),是一種聯(lián)想式的綜合信息管理系統(tǒng)。其中的某些字、符號(hào)或短語(yǔ)、圖形和圖像起著“熱鏈路”(Hotlink)的作用,在顯示出來(lái)時(shí)其字體或顏色變化或者標(biāo)有下橫線、以區(qū)別于一般的正文。當(dāng)鼠標(biāo)器的光標(biāo)移到某個(gè)熱鏈路上,并且按了一下鼠標(biāo)鍵之后,鼠標(biāo)器光標(biāo)便沿著這條鏈路跳到該文件的另一處或另一個(gè)文件。計(jì)算機(jī)信息檢索在經(jīng)歷了傳統(tǒng)信息檢索、全文文本檢索之后,隨著多媒體技術(shù)的發(fā)展和應(yīng)用,出現(xiàn)目前這種超文本檢索方式。可用于檢索人物、新聞、文檔、文藝小說(shuō)、旅游景點(diǎn)、繪畫(huà)、古文物、生物等內(nèi)容廣泛的各種信息。282022/12/8(4)超文本檢索超文本(Hypert292022/12/113.2按信息訪問(wèn)模式分(P5)根據(jù)檢索方式分:(1)脫機(jī)檢索(2)聯(lián)機(jī)檢索(3)國(guó)際聯(lián)機(jī)檢索(4)光盤(pán)檢索(5)鏡像檢索(6)網(wǎng)絡(luò)檢索292022/12/83.2按信息訪問(wèn)模式分(P5)根據(jù)檢(1)脫機(jī)信息檢索是六十年代發(fā)展起來(lái)的批次檢索,用戶(hù)不與檢索系統(tǒng)發(fā)生直接聯(lián)系,只需把檢索要求送往檢索中心,由檢索人員在計(jì)算機(jī)主機(jī)進(jìn)行文獻(xiàn)檢索的一種方式。優(yōu)點(diǎn):價(jià)格便宜,無(wú)網(wǎng)絡(luò)通訊費(fèi),檢索費(fèi)用由用戶(hù)平攤,隨機(jī)存儲(chǔ)。缺點(diǎn):一次機(jī)會(huì)檢索,檢索結(jié)果延誤,委托性檢索。(1)脫機(jī)信息檢索是六十年代發(fā)展起來(lái)的批次檢索,用戶(hù)不與(2)聯(lián)機(jī)信息檢索聯(lián)機(jī)檢索是用戶(hù)利用終端設(shè)備,通過(guò)通信網(wǎng)絡(luò)或通信線路與檢索系統(tǒng)聯(lián)機(jī),進(jìn)行“人機(jī)對(duì)話”,從檢索中心的數(shù)據(jù)庫(kù)查找所需要的文獻(xiàn)信息過(guò)程。特點(diǎn):檢索的速度快,檢索結(jié)果可以得到及時(shí)修改。缺點(diǎn):檢索費(fèi)用高。(2)聯(lián)機(jī)信息檢索聯(lián)機(jī)檢索是用戶(hù)利用終端設(shè)備,通過(guò)通信網(wǎng)(3)國(guó)際聯(lián)機(jī)檢索*該系統(tǒng)是70年代出現(xiàn)的一門(mén)現(xiàn)代化情報(bào)檢索手段,目前已發(fā)展到相當(dāng)高的水平,計(jì)算機(jī)聯(lián)機(jī)網(wǎng)絡(luò)和檢索終端已遍及世界所有主要國(guó)家和地區(qū)。優(yōu)點(diǎn):(1)可以實(shí)現(xiàn)資源共享;(2)檢索速度快;(3)信息資源專(zhuān)業(yè)化;(4)查全率和查準(zhǔn)率較高。(3)國(guó)際聯(lián)機(jī)檢索*該系統(tǒng)是70年代出現(xiàn)的一門(mén)現(xiàn)代化情報(bào)檢索2022/12/1133國(guó)際聯(lián)機(jī)檢索的缺點(diǎn)
檢索費(fèi)用高;對(duì)檢索系統(tǒng)及其文檔(數(shù)據(jù)庫(kù))的收錄、標(biāo)引、特點(diǎn)等問(wèn)題較難了解、熟悉;檢索技術(shù)和技巧不易掌握2022/12/833國(guó)際聯(lián)機(jī)檢索的缺點(diǎn)檢索費(fèi)用高;世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)1、DIALOG系統(tǒng)*是世界最大的國(guó)際聯(lián)機(jī)檢索系統(tǒng)1963年,原屬美國(guó)洛克希德公司,系統(tǒng)設(shè)在加洲PaloAlto市,1988年轉(zhuǎn)讓給美國(guó)Knight-Ridder公司。2000年又轉(zhuǎn)入DIALOG公司經(jīng)營(yíng)。目前,該系統(tǒng)的聯(lián)機(jī)服務(wù)網(wǎng)遍布世界70多個(gè)國(guó)家和地區(qū)的200多個(gè)城市,共設(shè)有聯(lián)機(jī)檢索終端25000余臺(tái)。系統(tǒng)中各類(lèi)型數(shù)據(jù)庫(kù)數(shù)量的發(fā)展速度相當(dāng)快,擁有數(shù)據(jù)庫(kù)約900多個(gè),占全世界機(jī)存總量的60%,內(nèi)容涉及自然科學(xué)、社會(huì)科學(xué)、經(jīng)濟(jì)、商業(yè)等各個(gè)領(lǐng)域。世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)1、DIALOG系統(tǒng)*352022/12/11352022/12/8362022/12/11DIALOGWEB系統(tǒng)檢索平臺(tái)362022/12/8DIALOGWEB系統(tǒng)檢索平臺(tái)2022/12/1137世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)2、ORBIT系統(tǒng):是世界是第二大聯(lián)機(jī)檢索系統(tǒng),他建于1965年,總部設(shè)在美國(guó)費(fèi)吉尼亞洲的馬庫(kù)林。提供專(zhuān)利、化學(xué)、能源、市場(chǎng)、工程和電子等方面的信息,約有100個(gè)數(shù)據(jù)庫(kù),占全世界機(jī)存文獻(xiàn)量的25%。主要提供補(bǔ)充DIALOG系統(tǒng)而不是與其競(jìng)爭(zhēng)的數(shù)據(jù),特別是在專(zhuān)利、商標(biāo)和科技信息等領(lǐng)域具有獨(dú)特優(yōu)勢(shì)。2022/12/837世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)2、OR2022/12/1138世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)3、BRS系統(tǒng):內(nèi)容涉及醫(yī)學(xué)、生物科學(xué)、教育、健康、物理和社會(huì)科學(xué)及其它綜合性學(xué)科。有154個(gè)公用數(shù)據(jù)庫(kù)和40多個(gè)私人數(shù)據(jù)庫(kù)。4、ESA-IRS系統(tǒng):是歐洲最大的、也是世界第三大聯(lián)機(jī)情報(bào)檢索系統(tǒng),1964年成立于法國(guó),1973年遷移至意大利,目前有100多個(gè)數(shù)據(jù)庫(kù)。提供有原材料價(jià)格、宇航及高技術(shù)軟件、美國(guó)化學(xué)數(shù)據(jù)、綜合性數(shù)據(jù)庫(kù)等。5、STN系統(tǒng):由美國(guó)化學(xué)文摘社、德國(guó)Karlsruhl專(zhuān)業(yè)信息中心、日本科技信息中心聯(lián)合開(kāi)發(fā)的國(guó)際間網(wǎng)絡(luò)系統(tǒng),約有200多個(gè)數(shù)據(jù)庫(kù):其中包括各具特色的美、德、日三國(guó)專(zhuān)利數(shù)據(jù)庫(kù)、化學(xué)全文數(shù)據(jù)庫(kù)、化學(xué)物質(zhì)結(jié)構(gòu)圖形數(shù)據(jù)庫(kù)及部分醫(yī)藥數(shù)據(jù)庫(kù)等。2022/12/838世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)3、BR(4)光盤(pán)數(shù)據(jù)庫(kù)檢索光盤(pán):80年代發(fā)展起來(lái)的激光存儲(chǔ)載體,繼紙張感光材料、磁性載體之后問(wèn)世的又一種新型的信息存儲(chǔ)介質(zhì)。能存儲(chǔ)數(shù)據(jù)、文字、圖形、圖像、聲音、動(dòng)畫(huà)等各種信息。一張普通的光盤(pán)、信息存儲(chǔ)量約為650兆。光盤(pán)的分類(lèi):按存儲(chǔ)方式分為
(1)只讀型光盤(pán):CD-ROM(2)寫(xiě)讀光盤(pán):WORM(3)可擦寫(xiě)型光盤(pán):ERM(4)光盤(pán)數(shù)據(jù)庫(kù)檢索光盤(pán):80年代發(fā)展起來(lái)的激光存儲(chǔ)載體,光盤(pán)檢索的定義和特點(diǎn)定義:是一種用激光技術(shù)在特制圓盤(pán)上記錄信息的檢索方式。特點(diǎn):
(1)投資成本低;
(2)價(jià)格低;
(3)運(yùn)行速度快;
(4)檢索效果好;
(5)下載方便;
(6)安全性能高。光盤(pán)檢索的定義和特點(diǎn)定義:是一種用激光技術(shù)在特制圓盤(pán)上光盤(pán)檢索的系統(tǒng)組成單機(jī)光盤(pán)檢索系統(tǒng)組成:
(1)數(shù)據(jù)庫(kù):光盤(pán)
(2)軟件:系統(tǒng)軟件和檢索軟件
(3)硬件:計(jì)算機(jī)、光盤(pán)驅(qū)動(dòng)器、顯示屏、打印機(jī)等網(wǎng)絡(luò)光盤(pán)檢索系統(tǒng)組成:
(1)光盤(pán)塔
(2)光盤(pán)組網(wǎng)軟件
(3)光盤(pán)塔服務(wù)器光盤(pán)檢索的系統(tǒng)組成單機(jī)光盤(pán)檢索系統(tǒng)組成:422022/12/11(5)鏡像數(shù)據(jù)庫(kù)檢索*鏡像:最原始的含義是在鏡子里看到的你自己的像,在IT界中,將“鏡像”這個(gè)詞的含義進(jìn)行了擴(kuò)展,指的是完全一樣的兩個(gè)東西。鏡像數(shù)據(jù)庫(kù):就是將光盤(pán)版、網(wǎng)絡(luò)版數(shù)據(jù)庫(kù)或主網(wǎng)站資源的數(shù)據(jù)復(fù)制到不同的地理位置(某地或本地)的鏡像服務(wù)器上,成為該服務(wù)器的鏡像數(shù)據(jù)庫(kù),并為網(wǎng)絡(luò)用戶(hù)提供檢索服務(wù)。目的是分擔(dān)訪問(wèn)流量;如,CNKI、維普、萬(wàn)方數(shù)據(jù)、超星等422022/12/8(5)鏡像數(shù)據(jù)庫(kù)檢索*鏡像:最原始的含432022/12/11通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)可以連接世界上各種公用數(shù)據(jù)庫(kù)和商用數(shù)據(jù)庫(kù),可以幫助用戶(hù)獲取希望得到的信息。網(wǎng)絡(luò)化信息檢索系統(tǒng)的特點(diǎn)是:一般基于客戶(hù)機(jī)/服務(wù)器,客戶(hù)與服務(wù)器是同等關(guān)系,只要遵循共同協(xié)議(TCP/IP協(xié)議是目前最成功的網(wǎng)絡(luò)體系結(jié)構(gòu)和協(xié)議規(guī)范),一個(gè)服務(wù)器可被多個(gè)客戶(hù)訪問(wèn),一個(gè)客戶(hù)可訪問(wèn)多個(gè)服務(wù)器。網(wǎng)絡(luò)的用戶(hù)數(shù)量不受到限制,它是一個(gè)開(kāi)放系統(tǒng)而不是封閉式系統(tǒng)網(wǎng)絡(luò)化信息檢索將在全球范圍內(nèi)實(shí)現(xiàn)信息資源共享,全球網(wǎng)絡(luò)是信息存貯與檢索進(jìn)一步發(fā)展的方向。常見(jiàn)檢索有:GOOGLE、百度、多媒體、咨詢(xún)行及所有的外文數(shù)據(jù)庫(kù)(6)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索*432022/12/8通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)可以連接世界上各種公4計(jì)算機(jī)信息檢索技術(shù)*(P11)1.布爾邏輯檢索2.截詞檢索3.位置運(yùn)算檢索4.字段限定檢索4計(jì)算機(jī)信息檢索技術(shù)*(P11)1.布爾邏輯檢索4.1布爾邏輯檢索*(P11)布爾邏輯檢索(Booleanlogical):是用布爾邏輯算符將檢索詞、短語(yǔ)或代碼進(jìn)行邏輯組配,指定文獻(xiàn)的命中條件和組配次序,凡符合邏輯組配所規(guī)定條件的為命中文獻(xiàn),否則為非命中。布爾邏輯運(yùn)算符:在檢索過(guò)程中用于表達(dá)詞與詞之間的邏輯關(guān)系的算符。分為三種邏輯關(guān)系:邏輯與(AND)(*)、邏輯或(OR)(+)、邏輯非(NOT)(—)表示。4.1布爾邏輯檢索*(P11)布爾邏輯檢索(Boolea462022/12/11邏輯與AANDB:檢索詞A和檢索詞B同時(shí)出現(xiàn)在一條記錄中,例如:汽車(chē)和飛機(jī)發(fā)動(dòng)機(jī)。其作用是縮小檢索范圍,提高查準(zhǔn)率。A=汽車(chē)發(fā)動(dòng)機(jī)B=飛機(jī)發(fā)動(dòng)機(jī)汽車(chē)與飛機(jī)發(fā)動(dòng)機(jī)ABAandB邏輯“與”運(yùn)算462022/12/8邏輯與AANDB:檢索詞A和檢472022/12/11邏輯或(OR)AORB:記錄中出現(xiàn)檢索詞A或檢索詞B或兩詞同時(shí)出現(xiàn)在一條記錄中。其作用是擴(kuò)大檢索范圍,提高查全率汽車(chē)發(fā)動(dòng)機(jī)或飛機(jī)發(fā)動(dòng)機(jī)AB邏輯“或”運(yùn)算472022/12/8邏輯或(OR)AORB:記錄中出現(xiàn)482022/12/11邏輯非(NOT)ANOTB:記錄必須包含檢索詞A但不能包含檢索詞B。即在含有A檢索詞的文獻(xiàn)中去除含有B檢索詞的文獻(xiàn)。其作用是縮小檢索范圍,提高查準(zhǔn)率。A汽車(chē)發(fā)動(dòng)機(jī)汽車(chē)、飛機(jī)發(fā)動(dòng)機(jī)飛機(jī)發(fā)動(dòng)機(jī)BAnotB邏輯“非”運(yùn)算482022/12/8邏輯非(NOT)ANOTB:記錄必492022/12/11布爾邏輯算符的運(yùn)算次序用布爾邏輯算符組配檢索詞構(gòu)成的檢索提問(wèn)式,邏輯算符AND、OR、NOT的運(yùn)算次序,在不同的檢索系統(tǒng)中有不同的規(guī)定。在有括號(hào)的情況下,括號(hào)內(nèi)的邏輯運(yùn)算先執(zhí)行。在無(wú)括號(hào)的情況下,有下列幾種處理順序:
NOT最先執(zhí)行,AND其次執(zhí)行,OR最后執(zhí)行。AND最先執(zhí)行,NOT其次執(zhí)行,OR最后執(zhí)行。OR最先執(zhí)行,AND其次執(zhí)行,NOT最后執(zhí)行。按自然順序,AND、OR、NOT誰(shuí)在先就先執(zhí)行誰(shuí)。檢索時(shí),要事先了解檢索系統(tǒng)的規(guī)定,避免邏輯運(yùn)算次序處理不當(dāng)而造成錯(cuò)誤的檢索結(jié)果。因?yàn)椋瑢?duì)同一個(gè)布爾邏輯提問(wèn)式,不同的運(yùn)算次序會(huì)有不同的檢索結(jié)果。492022/12/8布爾邏輯算符的運(yùn)算次序用布爾邏輯算符組4.2截詞檢索截詞檢索就是把檢索詞截?cái)啵∑渲械囊徊糠?,在加上截詞符號(hào)一起進(jìn)行檢索。主要用于檢索詞的單復(fù)數(shù)、詞性的詞尾變化、詞根相同的一類(lèi)詞,以及同一詞的拼法變異等。常用的截詞符有:“?”、“*”、“$”、“#”4.2截詞檢索截詞檢索就是把檢索詞截?cái)?,取其中的一部分,?12022/12/11截詞的作用:采用截詞檢索表達(dá)式,既能防止漏檢,又能節(jié)省時(shí)間,能有效提高檢索效率。
截詞符的使用:利用截詞檢索時(shí),注意截詞的部位,一定不能截的太深,否則誤檢率會(huì)很大。512022/12/8截詞的作用:采用截詞檢索表達(dá)式,既能防522022/12/11截詞方法無(wú)限截?cái)啵杭丛撛~根后可跟任何字符,且字符數(shù)不限;如:child*,可查到child,children,childish,childhood等所有以child開(kāi)頭的單詞。如:coumput?,可檢出Compute,Computer,Computing,computable
有限截?cái)啵杭丛撛~根后至多可跟n個(gè)字符,如需要n個(gè)有限詞符截詞,請(qǐng)輸入n個(gè)?即可;如,輸入stud???表示截3個(gè)字母,可檢出帶有study、studies、studing等的文獻(xiàn)。中間截?cái)啵河址Q(chēng)前后方一致,允許檢索詞中間有若干變化。如,wom?n可以檢索出:woman,women
522022/12/8截詞方法4.3位置運(yùn)算檢索位置算符:表示其連接的兩個(gè)檢索詞之間的位置關(guān)系,不同的系統(tǒng)有不同的位置算符,以DIALOG系統(tǒng)為例:(W)與(nW)算符—with的縮寫(xiě)。表示其連接的兩個(gè)檢索詞必須按序出現(xiàn),中間不允許插詞,只能有一空格或標(biāo)點(diǎn)、符號(hào)。如:high(W)class(N)與(nN)算符—near的縮寫(xiě)。表示其連接的兩個(gè)檢索詞的順序可以互易,但兩詞間不允許插詞。(nN)中的n表示允許插詞量少于或等于n個(gè)。
如:internet(N)accessing
命中記錄中匹配詞可能有:internetaccessing,accessinginternet。4.3位置運(yùn)算檢索位置算符:表示其連接的兩個(gè)檢索詞之間的位542022/12/11(S)算符—Subfield的縮寫(xiě)。表示其連接的兩個(gè)檢索詞必須出現(xiàn)在同一子字段中。子字段是指字段中的一部分,如一句句子,一個(gè)詞組、短語(yǔ)。字段不限,詞序不限。
如:silicon(S)sensor
命中記錄出現(xiàn)的匹配情況如:
Avacuummagneticsensor(VMS)usingasiliconfieldemittertipwasfabricatedanddemonstrated.(F)算符—Field的縮寫(xiě)。表示其連接的兩個(gè)檢索詞必須出現(xiàn)在同一字段中,字段不限,詞序不限。542022/12/8(S)算符—Subfield的縮寫(xiě)。表552022/12/11
4.4字段限制針對(duì)特定年代、特定類(lèi)別、特定檢索點(diǎn)等作限制,包括前綴限制符和后綴限制符后綴限制符例如:
/TI限在題目中查
/AB限在文摘中查
/DE限在敘詞標(biāo)引中查前綴限制符例如:
AU=限查特定作者
JN=限查特定刊名
LA=限查特定語(yǔ)種
PN=限查特定專(zhuān)利號(hào)
PY=限查特定年代552022/12/84.4字段限制針對(duì)特定年代、特定類(lèi)562022/12/115信息檢索的方法檢索方法是指查尋文獻(xiàn)信息的具體方法。選擇科學(xué)有效的檢索方法,對(duì)廣、快、精、準(zhǔn)地獲取文獻(xiàn)信息,提高檢索效率,是非常重要的。文獻(xiàn)的檢索方法主要有以下幾種類(lèi)型。562022/12/85信息檢索的方法檢索方法是指查尋文572022/12/115.1.直查法是指直接從有關(guān)的一次文獻(xiàn)中獲取所需信息的檢索方法。利用直查法雖然可以較快地獲取最新文獻(xiàn),能切實(shí)地掌握文獻(xiàn)內(nèi)容和實(shí)質(zhì),但面對(duì)大量的、無(wú)序的文獻(xiàn),存在著很大的盲目性、分散性、偶然性,很難查全,費(fèi)工費(fèi)時(shí)。許多文獻(xiàn)用戶(hù)都有利用直查法的經(jīng)歷,在長(zhǎng)期實(shí)踐中也摸索出一定的經(jīng)驗(yàn)。
572022/12/85.1.直查法是指直接從有關(guān)的一次文獻(xiàn)582022/12/115.2.追溯法是指利用引文關(guān)系獲取所需文獻(xiàn)信息的檢索方法。被引用的參考文獻(xiàn)多出自知名作者的論文、專(zhuān)著,所以通過(guò)追溯法檢索到的文獻(xiàn)大都具有較高的學(xué)術(shù)價(jià)值。但是被引用的文獻(xiàn)在全部發(fā)表的文獻(xiàn)中只占少數(shù),有些引文與作者所寫(xiě)著作的主題關(guān)系也不大,所以追溯法會(huì)漏檢和誤檢。追溯法有兩種情況(1)由新及舊的追溯法。當(dāng)查到一篇適用文獻(xiàn)后,根據(jù)其后面所附的引文、注釋等,向前追溯出一個(gè)專(zhuān)題的文獻(xiàn),再根據(jù)檢出文獻(xiàn)提供的線索(參考文獻(xiàn)),繼續(xù)追溯。如此一環(huán)扣一環(huán)地?cái)U(kuò)檢,有可能找到一系列對(duì)口文獻(xiàn)。這是一種人們常用的方法,比較方便,但文獻(xiàn)信息越檢越舊。(2)由舊及新的追溯法。一篇有價(jià)值的論文被誰(shuí)引用過(guò)?評(píng)論如何?有否發(fā)展?有否更新?利用引文索引便可解決這個(gè)問(wèn)題,而且檢索的文獻(xiàn)越來(lái)越新。582022/12/85.2.追溯法是指利用引文關(guān)系獲取所需592022/12/115.3.工具法是指利用一定的檢索工具或檢索系統(tǒng)獲取所需文獻(xiàn)信息的檢索方法。這是科學(xué)的正規(guī)的文獻(xiàn)信息檢索方法,它節(jié)約檢索時(shí)間,獲取文獻(xiàn)全面。工具法在具體應(yīng)用時(shí)還可分為以下三種方式:順查法倒查法抽查法592022/12/85.3.工具法是指利用一定的檢索工具或602022/12/11順查法
這是一種以課題起始年代為起點(diǎn)從遠(yuǎn)到近按時(shí)間順序的查法。順查法適應(yīng)于主題復(fù)雜,研究范圍較大,研究時(shí)間較長(zhǎng)的課題。602022/12/8順查法這是一種以課題起始年代為起點(diǎn)612022/12/11倒查法
倒查法又稱(chēng)逆查法,與順查法相反。這是利用選定的檢索工具,由近而遠(yuǎn)的按時(shí)間逆序的查法。逆查法適用于新興的學(xué)科或課題。612022/12/8倒查法倒查法又稱(chēng)逆查法,與順查法相622022/12/11抽查法抽查法就是針對(duì)學(xué)科發(fā)展特點(diǎn),抓住該學(xué)科發(fā)展迅速及文獻(xiàn)發(fā)表較多的年代,抽出一段時(shí)間再進(jìn)行逐年檢索的方法。使用這種方法檢索效率較高,但必須在熟悉學(xué)科發(fā)展特點(diǎn)的情況下才能使用。622022/12/8抽查法抽查法就是針對(duì)學(xué)科發(fā)展特點(diǎn),抓住632022/12/114.綜合法綜合法,又稱(chēng)循環(huán)法,是指將直查法、追溯法、工具法綜合運(yùn)用的檢索方法。綜合法在具體應(yīng)用時(shí)還可以分為以下三種方式:交替檢索分段檢索間隔檢索
632022/12/84.綜合法綜合法,又稱(chēng)循環(huán)法,是指將直642022/12/11(1)交替檢索。在檢索某個(gè)課題的文獻(xiàn)時(shí),同時(shí)交互使用不同的檢索方法。例如,某人在接受了某個(gè)課題后,首先利用直查法在核心期刊中查到兩篇文章,再根據(jù)其后所附參考文獻(xiàn)利用追溯法檢索出一批文章,而后發(fā)現(xiàn)一位著者的文章被多次引用,他又利用工具法從某專(zhuān)業(yè)性檢索工具的累積著者索引中,檢索出這位著者關(guān)于該課題的數(shù)篇有價(jià)值文章。642022/12/8(1)交替檢索。在檢索某個(gè)課題的文獻(xiàn)時(shí)652022/12/11(2)分段檢索。即在檢索某個(gè)課題的文獻(xiàn)時(shí),不同階段使用不同的檢索方法。例如,某人在接受了某個(gè)課題后,首先利用倒查法對(duì)該課題的文獻(xiàn)進(jìn)行了全面檢索;當(dāng)課題進(jìn)行到中期時(shí)又利用抽查法檢索了近期有關(guān)該課題的文獻(xiàn);在課題即將完成時(shí)還利用追溯法對(duì)他在課題進(jìn)展中發(fā)表的有關(guān)文章進(jìn)行了檢索,以調(diào)查社會(huì)上對(duì)該課題的反映。652022/12/8(2)分段檢索。即在檢索某個(gè)課題的文獻(xiàn)662022/12/11(3)間隔檢索。由于引用文獻(xiàn)有一個(gè)規(guī)律,就是最近五年之內(nèi)發(fā)表的重要文獻(xiàn)一般都會(huì)被近期文獻(xiàn)所引用。所以在利用檢索工具檢索相關(guān)文獻(xiàn)時(shí),可以間隔五年分段進(jìn)行。662022/12/8(3)間隔檢索。由于引用文獻(xiàn)有一個(gè)規(guī)律672022/12/11第6節(jié)信息檢索的策略信息檢索是一項(xiàng)實(shí)踐性很強(qiáng)的活動(dòng)。俗話說(shuō):“熟能生巧”,只有在較長(zhǎng)期的檢索活動(dòng)中舍得花氣力,才能逐步掌握檢索規(guī)律,使自己成為信息的主人。文獻(xiàn)信息檢索過(guò)程,是根據(jù)課題的要求,使用一定的工具,按照可行的步驟、方法、途徑,查尋文獻(xiàn)線索或事實(shí)、數(shù)據(jù),獲取所需信息的過(guò)程。手工檢索與計(jì)算機(jī)檢索在步驟與方法上有共性,但也各有特點(diǎn)。672022/12/8第6節(jié)信息檢索的策略信息檢索是一項(xiàng)實(shí)682022/12/116.1信息檢索步驟*分析課題,確定檢索目標(biāo)選擇檢索詞,制定檢索策略選擇數(shù)據(jù)庫(kù)上機(jī)檢索及調(diào)整檢索策略輸出和分析結(jié)果682022/12/86.1信息檢索步驟*分析課題,確定692022/12/11
明確檢索的目的
明確用戶(hù)是要查新、查參考資料還是查詢(xún)論文被收錄或引用情況等,以便對(duì)檢索的查準(zhǔn)、查全和時(shí)間范圍的指標(biāo)要求有一個(gè)大致的了解,從而制定出符合情況的檢索策略。
課題分析
對(duì)課題內(nèi)容進(jìn)行分析,找出核心概念和隱含概念,排除無(wú)關(guān)的概念,明確概念之間相互的邏輯關(guān)系。1、分析課題,確定檢索目標(biāo)692022/12/8
明確檢索的目的1、分析課題,702022/12/11具體可從以下幾方面著手:(1)分析主題內(nèi)容。通過(guò)主題分析,形成檢索需要的主題概念,以便確定檢索途徑。(2)分析課題所涉及的內(nèi)容及學(xué)科范圍,以便確定有關(guān)檢索標(biāo)識(shí)(分類(lèi)號(hào))及選擇合適的檢索工具或檢索文檔。(3)分析課題所需信息的類(lèi)型,包括文獻(xiàn)媒體、出版類(lèi)型、所需文獻(xiàn)量、年代范圍、涉及語(yǔ)種、有關(guān)著者、機(jī)構(gòu)等。702022/12/8具體可從以下幾方面著手:712022/12/11(4)確定課題對(duì)查新、查準(zhǔn)和查全的指標(biāo)要求。若要了解某學(xué)科理論、課題、工藝過(guò)程等最新進(jìn)展和動(dòng)態(tài),則要檢索最近的文獻(xiàn)信息,強(qiáng)調(diào)“新”字;若要解決研究中某具體問(wèn)題,找出技術(shù)方案,則要檢索有針對(duì)性、能解決實(shí)際問(wèn)題的文獻(xiàn)信息,強(qiáng)調(diào)“準(zhǔn)”字;若要撰寫(xiě)綜述、述評(píng)或?qū)V?,要了解課題、事件的前因后果、歷史和發(fā)展,則要檢索詳盡、全面、系統(tǒng)的文獻(xiàn)信息,強(qiáng)調(diào)“全”字。712022/12/8(4)確定課題對(duì)查新、查準(zhǔn)和查全的指標(biāo)722022/12/112、選擇檢索詞、制定檢索式(1)檢索詞:是表達(dá)文獻(xiàn)信息需求的基本元素,是計(jì)算機(jī)檢索系統(tǒng)中有關(guān)數(shù)據(jù)庫(kù)進(jìn)行匹配的基本單元。具體說(shuō):對(duì)課題進(jìn)行主題分析,掌握課題的內(nèi)容實(shí)質(zhì),找出最能代表主題概念的若干檢索詞。(2)檢索式:就是指計(jì)算機(jī)信息檢索系統(tǒng)中用來(lái)表達(dá)檢索提問(wèn)的邏輯表達(dá)式,由檢索詞和各種運(yùn)算符及系統(tǒng)規(guī)定的其它組配符構(gòu)成。722022/12/82、選擇檢索詞、制定檢索式(1)檢索詞732022/12/11(1)該詞的所有拼寫(xiě)形式和方法(包括同義詞,
元素和元素符號(hào)、縮寫(xiě)和全稱(chēng)等)(2)該詞的廣義詞、狹義詞、相關(guān)詞及多義詞等。(3)確定檢索詞和詞的截?cái)嗖课?,調(diào)整詞之間的位置關(guān)系及組配關(guān)系。(4)對(duì)于泛指的主題概念詞,應(yīng)選用其包容特性的具體內(nèi)容來(lái)表達(dá)。選擇檢索詞應(yīng)注意問(wèn)題732022/12/8(1)該詞的所有拼寫(xiě)形式和方法(包括同742022/12/11制定檢索式合理運(yùn)用邏輯運(yùn)算符構(gòu)造檢索式。符號(hào)的使用一定要正確、符合概念邏輯,并力求簡(jiǎn)潔、優(yōu)化,還應(yīng)注意運(yùn)算符的優(yōu)先級(jí)和括號(hào)的使用。例如:纖維混凝土與既有混凝土粘結(jié)性能及施工技術(shù)
1.(纖維混凝土+新混凝土)*(既有混凝土+老混凝土)*粘結(jié)*(剪切+劈拉+抗?jié)B+抗凍+斷裂+收縮)
2.(fiberornew)(2w)old(3w)concrete??(7n)(bond?????oradherenceoradhesi??)and(shear????orsplit?????orcleavageorfractureorruptureorshrinkageorcontractionorfrostorfreez????orpermeability)
742022/12/8制定檢索式合理運(yùn)用邏輯運(yùn)算符構(gòu)造檢索式752022/12/113、選擇數(shù)據(jù)庫(kù)或檢索工具根據(jù)檢索目標(biāo),確定檢索目的、涉及的學(xué)科范圍和信息類(lèi)型,選擇合適的數(shù)據(jù)庫(kù)。具體選擇過(guò)程中還應(yīng)考慮數(shù)據(jù)庫(kù)的類(lèi)型(參考、全文還是電子期刊)、內(nèi)容(專(zhuān)利、標(biāo)準(zhǔn)、會(huì)議)、收錄的數(shù)據(jù)學(xué)科范圍、數(shù)據(jù)庫(kù)的更新周期,收錄文獻(xiàn)的語(yǔ)種等因素。例如,要看全文就要選用全文數(shù)據(jù)庫(kù)或電子期刊;要查標(biāo)準(zhǔn)或?qū)@鸵x擇標(biāo)準(zhǔn)庫(kù)或?qū)@麕?kù)752022/12/83、選擇數(shù)據(jù)庫(kù)或檢索工具根據(jù)檢索目標(biāo),762022/12/114.確定檢索途徑進(jìn)行信息檢索時(shí),總是以文獻(xiàn)的某種特征作為出發(fā)點(diǎn),按一定的途徑進(jìn)行的。一般地說(shuō),文獻(xiàn)的內(nèi)容特征和外表特征都可以成為檢索的出發(fā)點(diǎn)。4.1內(nèi)部特征途徑(根據(jù)課題內(nèi)容特征查找有關(guān)文獻(xiàn)資料)與文獻(xiàn)信息主題內(nèi)容密切相關(guān)的檢索標(biāo)識(shí)稱(chēng)為文獻(xiàn)信息的內(nèi)部特征。表達(dá)文獻(xiàn)信息內(nèi)容特征的檢索標(biāo)識(shí)主要有各種形式的主題詞和分類(lèi)號(hào)。文獻(xiàn)內(nèi)容特征的檢索途徑包括:分類(lèi)途徑、主題途徑(標(biāo)題、關(guān)鍵詞、主題詞、文摘、全文)762022/12/84.確定檢索途徑進(jìn)行信息檢索時(shí),總是以772022/12/114.2外部特征途徑與文獻(xiàn)信息主題內(nèi)容沒(méi)有關(guān)系或關(guān)系不大的信息稱(chēng)為文獻(xiàn)信息的外表特征表達(dá)文獻(xiàn)外部特征的檢索標(biāo)識(shí)有:著者、著者單位、文獻(xiàn)出處、專(zhuān)利號(hào)、報(bào)告號(hào)等。1)題名途徑:根據(jù)文獻(xiàn)題名來(lái)檢索文獻(xiàn)的途徑2)作者途徑:根據(jù)已知作者姓名查找文獻(xiàn)的途徑3)文獻(xiàn)出處:根據(jù)期刊名稱(chēng)、年、卷、期號(hào)途徑772022/12/84.2外部特征途徑與文獻(xiàn)信息主題內(nèi)782022/12/115、實(shí)際檢索調(diào)整檢索策略
在手工檢索條件下,通過(guò)手翻、眼看、思考作出判斷,尋找相應(yīng)的分類(lèi)號(hào)、主題詞、著者姓名、代碼等,瀏覽其中著錄的文獻(xiàn),選出對(duì)口文獻(xiàn)。在計(jì)算機(jī)檢索條件下,需輸入檢索邏輯表達(dá)式,由計(jì)算機(jī)進(jìn)行查找和掃描,并打印或顯示出命中結(jié)果。聯(lián)機(jī)檢索時(shí),需要在終端呼叫通訊線路,用口令字表明自己是合法用戶(hù),進(jìn)入檢索系統(tǒng)并開(kāi)始檢索對(duì)話。在這些過(guò)程中都需要使用檢索系統(tǒng)認(rèn)可的“檢索指令”。782022/12/85、實(shí)際檢索調(diào)整檢索策略在手工檢索條792022/12/115、實(shí)際檢索及調(diào)整檢索策略
檢索后通過(guò)查看文獻(xiàn)檢索結(jié)果數(shù)量的多少或相關(guān)程度的高低,可以評(píng)價(jià)檢索策略的好壞。通常情況下,需要多次修改檢索策略,直到檢索結(jié)果滿意為止。在實(shí)際檢索中,當(dāng)放寬檢索以提高查全率時(shí),就會(huì)降低查準(zhǔn)率;反之,當(dāng)縮小檢索范圍以提高查準(zhǔn)率時(shí),就會(huì)降低查全率。因此要正確分析誤檢、漏檢原因,及時(shí)調(diào)整策略。792022/12/85、實(shí)際檢索及調(diào)整檢索策略檢索后通過(guò)802022/12/11調(diào)整檢索策略的具體方法擴(kuò)大檢索范圍的措施降低檢索詞的專(zhuān)指度,可從詞表或檢出文獻(xiàn)中選擇泛指詞。調(diào)節(jié)檢索式的網(wǎng)羅度,如刪除某個(gè)不重要的檢索詞。進(jìn)行族性檢索,可用分類(lèi)號(hào)或用OR連接一組同義詞和近義詞。取消某些限制過(guò)嚴(yán)的限制符。802022/12/8調(diào)整檢索策略的具體方法擴(kuò)大檢索范圍的措812022/12/11縮小檢索范圍的措施提高檢索詞的專(zhuān)指度。增加AND連接,進(jìn)一步限定主題詞。把檢索詞限定在主要字段,如標(biāo)題字段、主題詞字段等。縮短檢索年限,或限定某些刊物。812022/12/8822022/12/116、輸出和分析結(jié)果
檢索完成后,采用一定的輸出方式(套錄或打印)和格式輸出檢索結(jié)果。各個(gè)數(shù)據(jù)庫(kù)提供了多種輸出格式,每種格式能得到的文獻(xiàn)內(nèi)容特征和外表特征都不一樣,一般情況下,文獻(xiàn)檢索中篇名、作者、出處、文摘等字段是不可缺少的,因?yàn)檫@些字段有一定的參考意義。結(jié)束檢索后,對(duì)結(jié)果進(jìn)行分析,也是完整檢索過(guò)程中不可缺少的一步,有助于提高檢索質(zhì)量。822022/12/86、輸出和分析結(jié)果檢索完成后,采用一832022/12/116.2實(shí)例:廣播、電視在網(wǎng)絡(luò)傳播中的采集技術(shù)主題概念:廣播、電視、網(wǎng)絡(luò)技術(shù)主題分類(lèi):G文化、科學(xué)、教育、體育(中圖法)
G0文化理論
G1世界各國(guó)文化與文化事業(yè)
G2信息與知識(shí)傳播
G20
信息與傳播理論
G21
新聞學(xué)、新聞事業(yè)
電子技術(shù)及信息科學(xué)——新聞與傳媒——信息與傳播理論,新聞學(xué)、新聞事業(yè),廣播電視
注意:不同的檢索工具或數(shù)據(jù)庫(kù)有不同的分類(lèi)主題條件:網(wǎng)絡(luò)主題要求:方法、手段、內(nèi)容等832022/12/86.2實(shí)例:廣播、電視在網(wǎng)絡(luò)傳播中842022/12/11檢索詞:廣播、電視;傳播、傳媒;網(wǎng)絡(luò)、采集、傳輸檢索式:(廣播OR電視)and(傳播OR主傳媒)and(網(wǎng)絡(luò))and(采集OR傳輸)途徑:電子技術(shù)及信息科學(xué)——新聞與傳媒檢索工具:中國(guó)期刊全文數(shù)據(jù)庫(kù)
842022/12/8檢索詞:廣播、電視;傳播、傳媒852022/12/11
檢索結(jié)果:1、題名:手持電視傳播模式與運(yùn)營(yíng)模式分析
作者:靳一;
單位清華大學(xué)文化產(chǎn)業(yè)研究中心北京100084
刊名:河南社會(huì)科學(xué)
年2007
期022、題名:基于NDK的數(shù)字電視傳輸流(TS)網(wǎng)絡(luò)采集系統(tǒng)
作者:陳耀華;
單位廣州大學(xué)信息與機(jī)電工程學(xué)院,
刊名:世界電子元器件
年2007
期05
3、題名:淺議數(shù)字電視的網(wǎng)絡(luò)傳輸技術(shù)
作者:李莉容;
單位漳州廣播電視網(wǎng)絡(luò)中心
刊名:科技資訊
年2007
期19
4、題名:有線電視信號(hào)傳輸中的趨膚效應(yīng)分析
作者:趙凱華;張柳健;
單位中廣有線啟東分公司,
刊名:中國(guó)有線電視
年2006
期Z1
5、題名數(shù)字電視在有線電視網(wǎng)中的傳輸
作者:胡恒如;
單位宜豐廣電網(wǎng)絡(luò)分公司,
刊名:聲屏世界
年2006
期05
6、題名:以P2P技術(shù)構(gòu)建電視節(jié)目的互聯(lián)網(wǎng)傳播平臺(tái)
作者:徐志斌;
單位安徽電視臺(tái)技術(shù)辦公室,
刊名:視聽(tīng)界(廣播電視技術(shù))
年2006
期04852022/12/8檢索結(jié)果:862022/12/116.3文獻(xiàn)傳遞*是信息檢索中的一種新的服務(wù)形式。是指圖書(shū)館或文獻(xiàn)傳遞中心通過(guò)一定的方式,從異地獲取讀者所需的文獻(xiàn),提供給讀者的服務(wù)。通過(guò)文獻(xiàn)傳遞服務(wù),可以實(shí)現(xiàn)文獻(xiàn)資源共享,高效地利用現(xiàn)有文獻(xiàn)資源。提供傳遞文獻(xiàn)的類(lèi)型一般包括:期刊論文、會(huì)議論文、圖書(shū)、學(xué)位論文、技術(shù)報(bào)告、專(zhuān)利、標(biāo)準(zhǔn)和其它文獻(xiàn)資料。
862022/12/86.3文獻(xiàn)傳遞*是信息檢索中的一種新872022/12/11文獻(xiàn)傳遞的流程圖(中國(guó)高校人文社會(huì)科學(xué)文獻(xiàn)中心(CASHL)872022/12/8文獻(xiàn)傳遞的流程圖(中國(guó)高校人文社會(huì)科學(xué)882022/12/11中國(guó)高校人文社會(huì)科學(xué)文獻(xiàn)中心(CASHL)簡(jiǎn)介是教育部根據(jù)高校人文社會(huì)科學(xué)的發(fā)展和文獻(xiàn)資源建設(shè)的需要引進(jìn)專(zhuān)項(xiàng)經(jīng)費(fèi)建立的。其宗旨是組織若干所具有學(xué)科優(yōu)勢(shì)、文獻(xiàn)資源優(yōu)勢(shì)和服務(wù)條件優(yōu)勢(shì)的高等學(xué)校圖書(shū)館,有計(jì)劃、有系統(tǒng)地引進(jìn)國(guó)外人文社會(huì)科學(xué)期刊,借助現(xiàn)代化的服務(wù)手段,為全國(guó)高校的人文社會(huì)科學(xué)教學(xué)和科研提供高水平的文獻(xiàn)保障。是全國(guó)性的唯一的人文社會(huì)科學(xué)外文期刊保障體系。
882022/12/8中國(guó)高校人文社會(huì)科學(xué)文獻(xiàn)中心(CAS892022/12/11CASHL的文獻(xiàn)傳遞服務(wù)
收錄7500多種人文社會(huì)科學(xué)外文期刊,涉及地理、法律、教育、經(jīng)濟(jì)/商業(yè)/管理、軍事、歷史、區(qū)域?qū)W、人物/傳記、社會(huì)科學(xué)、社會(huì)學(xué)、體育、統(tǒng)計(jì)學(xué)、圖書(shū)館學(xué)/信息科學(xué)、文化、文學(xué)、心理學(xué)、藝術(shù)、語(yǔ)言/文字、哲學(xué)/宗教、政治等學(xué)科??商峁┠看蔚姆诸?lèi)瀏覽和檢索查詢(xún),以及基于目次的文獻(xiàn)原文傳遞服務(wù)。其中帶有“核心”標(biāo)識(shí)的期刊為核心期刊。892022/12/8CASHL的文獻(xiàn)傳遞服務(wù)收錄7500902022/12/11高校人文社科外文期刊目次數(shù)據(jù)庫(kù)902022/12/8高校人文社科外文期刊目次數(shù)據(jù)庫(kù)912022/12/11CALIS文獻(xiàn)傳遞網(wǎng)簡(jiǎn)介CALIS是中國(guó)高等教育文獻(xiàn)保障系統(tǒng),實(shí)現(xiàn)信息資源共建、共知、共享,以發(fā)揮最大的社會(huì)效益和經(jīng)濟(jì)效益,為中國(guó)的高等教育提供優(yōu)質(zhì)的信息服務(wù)。讀者可以通過(guò)文獻(xiàn)傳遞的方式獲取CALIS文獻(xiàn)傳遞網(wǎng)成員館豐富的文獻(xiàn)收藏??蓹z索的2個(gè)數(shù)據(jù)庫(kù)
CALIS聯(lián)合目錄中心數(shù)據(jù)庫(kù)
CCC西文期刊篇名目次
912022/12/8CALIS文獻(xiàn)傳遞網(wǎng)簡(jiǎn)介CALIS是922022/12/11922022/12/8932022/12/11CCC西文期刊篇名目次數(shù)據(jù)庫(kù)具備了強(qiáng)大、準(zhǔn)確的揭示功能、完善的鏈接功能和各種統(tǒng)計(jì)分析功能。CCC西文期刊篇名目次數(shù)據(jù)庫(kù)綜合服和平臺(tái)的應(yīng)用將對(duì)資源進(jìn)行科學(xué)、全面的整合調(diào)度,為各類(lèi)讀者提供更深層次的文獻(xiàn)服務(wù),大大促進(jìn)全國(guó)范圍內(nèi)的西文期刊文獻(xiàn)資源共享。綜合服務(wù)系統(tǒng)包含了2.3萬(wàn)種西文學(xué)術(shù)類(lèi)期刊;涵蓋9種著名二次文獻(xiàn)的期刊收錄數(shù)據(jù);包括100多個(gè)大型圖書(shū)館的館藏?cái)?shù)據(jù)和15個(gè)已在國(guó)內(nèi)聯(lián)合采購(gòu)的電子全文期刊數(shù)據(jù)庫(kù)的全文鏈接(覆蓋8000種以上期刊);具備篇名目次檢索、館藏期刊的OPAC鏈接、電子全文期刊鏈接;揭示了九種二次文獻(xiàn)收錄情況、國(guó)內(nèi)館藏情況以及提供各種分類(lèi)統(tǒng)計(jì)數(shù)據(jù);無(wú)縫鏈搠了館際互借和文獻(xiàn)傳遞系統(tǒng)(需另購(gòu)CALIS館際互借和文獻(xiàn)傳遞系統(tǒng)即可實(shí)現(xiàn)其功能);932022/12/8CCC西文期刊篇名目次數(shù)據(jù)庫(kù)具備了強(qiáng)大942022/12/11942022/12/8952022/12/11作業(yè)題計(jì)算機(jī)檢索有哪些特點(diǎn)?數(shù)據(jù)庫(kù)的類(lèi)型有哪幾種?信息檢索的方法和步驟?952022/12/8作業(yè)題計(jì)算機(jī)檢索有哪些特點(diǎn)?2022/12/1196第二章計(jì)算機(jī)信息檢索技術(shù)
鄭州大學(xué)信息檢索教研室2022/12/81第二章計(jì)算機(jī)信息檢索技術(shù)鄭州大972022/12/11第1節(jié)計(jì)算機(jī)檢索概述第2節(jié)計(jì)算機(jī)信息檢索系統(tǒng)組成第3節(jié)計(jì)算機(jī)信息檢索的分類(lèi)第4節(jié)計(jì)算機(jī)信息檢索技術(shù)第5節(jié)信息檢索的方法*第6節(jié)信息檢索的策略*22022/12/8第1節(jié)計(jì)算機(jī)檢索概述982022/12/111.1國(guó)內(nèi)外計(jì)算機(jī)信息檢索發(fā)展階段1975年,從國(guó)外引進(jìn)數(shù)據(jù)庫(kù)開(kāi)展機(jī)檢服務(wù);1980年,建立國(guó)際聯(lián)機(jī)終端開(kāi)展檢索服務(wù);20世紀(jì)80年代中后期,自建數(shù)據(jù)庫(kù);90年代初,發(fā)展光盤(pán)檢索;90年代中期,Internet網(wǎng)絡(luò)化檢索階段。32022/12/81.1國(guó)內(nèi)外計(jì)算機(jī)信息檢索發(fā)展階段19992022/12/11國(guó)外計(jì)算機(jī)信息檢索發(fā)展階段(P5)脫機(jī)檢索階段(20世紀(jì)50-60年代)聯(lián)機(jī)檢索階段(20世紀(jì)60-80年代)光盤(pán)檢索階段(20世紀(jì)80年代中-90年代)網(wǎng)絡(luò)信息檢索階段(1995-)42022/12/8國(guó)外計(jì)算機(jī)信息檢索發(fā)展階段(P5)脫機(jī)檢1002022/12/111.2計(jì)算機(jī)信息檢索的定義計(jì)算機(jī)信息檢索的實(shí)質(zhì)就是由計(jì)算機(jī)將輸入的檢索策略與系統(tǒng)中存儲(chǔ)的文獻(xiàn)特征標(biāo)識(shí)及其邏輯組配關(guān)系進(jìn)行類(lèi)比、匹配的過(guò)程,需要人——機(jī)協(xié)同作用來(lái)完成。信息存貯是將文獻(xiàn)、數(shù)值、事實(shí)等按一定的格式輸入到計(jì)算機(jī)中,加工處理成可供檢索的數(shù)據(jù)庫(kù)。信息檢索是將檢索提問(wèn)式按一定的要求輸入計(jì)算機(jī)中,經(jīng)計(jì)算機(jī)系統(tǒng)與已存貯在計(jì)算機(jī)中的數(shù)據(jù)庫(kù)進(jìn)行匹配運(yùn)算,然后將符合檢索提問(wèn)的數(shù)據(jù)按要求的格式輸出。52022/12/81.2計(jì)算機(jī)信息檢索的定義計(jì)算機(jī)信息1.3計(jì)算機(jī)信息檢索特點(diǎn)檢索速度快,效益高;檢索功能強(qiáng),數(shù)量大;檢索途徑多,手段靈活;檢索范圍廣;服務(wù)方式多。1.3計(jì)算機(jī)信息檢索特點(diǎn)檢索速度快,效益高;1022022/12/111.4計(jì)算機(jī)信息檢索的原理(P8-11)
信息存儲(chǔ)
原始信息
信息主題
數(shù)據(jù)庫(kù)記錄及信息特征標(biāo)識(shí)
信息檢索
信息需求
檢索主題
檢索提問(wèn)式及提問(wèn)標(biāo)識(shí)
計(jì)算機(jī)
檢索結(jié)果
主題分析著錄標(biāo)引類(lèi)比輸出主題分析選定編制檢索語(yǔ)言(主題詞表)72022/12/81.4計(jì)算機(jī)信息檢索的原理(P8-111032022/12/11信息存儲(chǔ)過(guò)程信息存儲(chǔ)就是按照一定標(biāo)準(zhǔn),將收集到的原始文獻(xiàn)進(jìn)行主題概念分析,用系統(tǒng)規(guī)定的語(yǔ)言(主題詞、分類(lèi)號(hào))進(jìn)行標(biāo)引,形成信息的特征標(biāo)識(shí),進(jìn)行整理與排序,構(gòu)成可供檢索的數(shù)據(jù)庫(kù),主要包括:信息的采集、著錄、標(biāo)引和整序等過(guò)程。82022/12/8信息存儲(chǔ)過(guò)程信息存儲(chǔ)就是按照一定標(biāo)準(zhǔn),將1042022/12/11信息的著錄對(duì)所收集的原始信息的外表特征(如題名、著者、文獻(xiàn)出處等)和內(nèi)容特征(如分類(lèi)號(hào)、主題詞、摘要等)進(jìn)行描述,形成一條條款目或記錄的過(guò)程。在數(shù)據(jù)庫(kù)中,其外表特征和內(nèi)容特征通常稱(chēng)之為字段,一條記錄由若干個(gè)不同字段構(gòu)成。92022/12/8信息的著錄對(duì)所收集的原始信息的外表特征(1052022/12/11信息的標(biāo)引標(biāo)引:根據(jù)一定的規(guī)則和程序(主題詞典或詞表),對(duì)文獻(xiàn)的主題內(nèi)容進(jìn)行分析,給予每篇文獻(xiàn)主題詞、關(guān)鍵詞作為存儲(chǔ)和檢索標(biāo)識(shí);或者根據(jù)文獻(xiàn)的學(xué)科歸屬,采用某種文獻(xiàn)資料分類(lèi)法,給予分類(lèi)號(hào)作為檢索標(biāo)識(shí)。102022/12/8信息的標(biāo)引標(biāo)引:根據(jù)一定的規(guī)則和程序(1062022/12/11信息檢索過(guò)程用戶(hù)對(duì)檢索課題加以分析,明確檢索范圍,弄清主題概念,然后用系統(tǒng)檢索語(yǔ)言來(lái)表示主題概念,形成檢索標(biāo)識(shí)及檢索策略,輸入到計(jì)算機(jī)進(jìn)行檢索。計(jì)算機(jī)按照用戶(hù)的要求將檢索策略轉(zhuǎn)換成一系列提問(wèn),在專(zhuān)用程序的控制下進(jìn)行邏輯運(yùn)算,選出符合要求的信息輸出。計(jì)算機(jī)檢索的過(guò)程實(shí)際上是一個(gè)比較、匹配的過(guò)程,檢索提問(wèn)只要與數(shù)據(jù)庫(kù)中的信息的特征標(biāo)識(shí)及其邏輯組配關(guān)系相一致,則屬“命中”,即找到了符合要求的信息。112022/12/8信息檢索過(guò)程用戶(hù)對(duì)檢索課題加以分析,明2計(jì)算機(jī)信息檢索系統(tǒng)組成2.1系統(tǒng)設(shè)備硬件:運(yùn)算器、控制器、存儲(chǔ)器、輸入輸出裝置等軟件:系統(tǒng)操作程序、數(shù)據(jù)庫(kù)管理程序、聯(lián)機(jī)控制程序、應(yīng)用程序等。通訊線路:電話通訊網(wǎng)、數(shù)據(jù)通訊網(wǎng)、衛(wèi)星通訊網(wǎng)等。檢索終端:信息用戶(hù)與檢索系統(tǒng)主機(jī)進(jìn)行人機(jī)對(duì)話,實(shí)現(xiàn)聯(lián)機(jī)檢索的設(shè)備。包括上網(wǎng)設(shè)備、調(diào)制解調(diào)器等。數(shù)據(jù)庫(kù):是計(jì)算機(jī)檢索的對(duì)象。是由一個(gè)或數(shù)個(gè)文檔構(gòu)成,并能夠滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。2計(jì)算機(jī)信息檢索系統(tǒng)組成2.1系統(tǒng)設(shè)備1082022/12/112.2數(shù)據(jù)庫(kù)的構(gòu)成一定專(zhuān)業(yè)范圍內(nèi)的信息記錄及其索引的集合體,是計(jì)算機(jī)信息檢索系統(tǒng)的重要組成部分,是信息資源,是檢索對(duì)象。一定專(zhuān)業(yè)范圍內(nèi)的信息記錄及其索引的集合體,是計(jì)算機(jī)信息檢索系統(tǒng)的重要組成部分,是信息資源,是檢索對(duì)象。構(gòu)成數(shù)據(jù)庫(kù)的三大要素:
文檔——記錄——字段檢索時(shí),計(jì)算機(jī)按輸入檢索詞的字順先從指定的倒排文檔中找到相匹配的索引詞,然后根據(jù)索引詞后的記錄順序號(hào)到順排檔中調(diào)出相應(yīng)的記錄。132022/12/82.2數(shù)據(jù)庫(kù)的構(gòu)成一定專(zhuān)業(yè)范圍內(nèi)的1092022/12/11文檔(File)數(shù)據(jù)庫(kù)中一部分記錄的集合,文檔由若干記錄構(gòu)成。數(shù)據(jù)庫(kù)是由一個(gè)順排文檔和若干個(gè)倒排文檔所構(gòu)成
順排文檔是數(shù)據(jù)庫(kù)的主體,又稱(chēng)主文檔,按每條記錄的順序號(hào)大小排列,檢索結(jié)果都來(lái)自于順排文檔。
倒排文檔是從順排檔中抽取有檢索意義的檢索標(biāo)識(shí),如主題詞、著者姓名、化學(xué)物質(zhì)名、刊名等,并按索引詞的字順排列,同時(shí)在檢索標(biāo)識(shí)后注明入藏順序號(hào),這就是常見(jiàn)的數(shù)據(jù)庫(kù)中的主題詞索引、著者索引、刊名索引。142022/12/8文檔(File)數(shù)據(jù)庫(kù)中一部分記錄的集1102022/12/11152022/12/81112022/12/11由若干字段組成的文獻(xiàn)單元,是數(shù)據(jù)庫(kù)中的基本文獻(xiàn)單元,每條記錄描述了原始信息的外部和內(nèi)部特征。數(shù)據(jù)庫(kù)中的一條記錄通常代表一篇文獻(xiàn)。例如:在書(shū)目型數(shù)據(jù)庫(kù)中,一條記錄相當(dāng)于一條題錄或文摘;在全文型數(shù)據(jù)庫(kù)中,一條記錄相當(dāng)于一篇完整的文獻(xiàn);在其它類(lèi)型數(shù)據(jù)庫(kù)中,一條記錄則代表一個(gè)信息單元。記錄越多,數(shù)據(jù)庫(kù)的容量就越大。記錄(Record)162022/12/8由若干字段組成的文獻(xiàn)單元,是數(shù)據(jù)庫(kù)中的1122022/12/11172022/12/81132022/12/11字段(Field)字段是構(gòu)成記錄的基本單元,是對(duì)文獻(xiàn)某一方面的特征(包括外表特征和內(nèi)容特征)進(jìn)行描述的結(jié)果。
例如:題名、作者、作者地址、出版年、來(lái)源(出處)、主題詞、文摘等字段是書(shū)目數(shù)據(jù)庫(kù)中必備字段。為識(shí)別每一個(gè)字段所表達(dá)的文獻(xiàn)特征,通常每個(gè)字段都有固定的名稱(chēng)和縮寫(xiě)(或稱(chēng)字段標(biāo)識(shí)符),如,題名字段的標(biāo)識(shí)符為T(mén)I,作者字段的標(biāo)識(shí)符為AU等。
182022/12/8字段(Field)字段是構(gòu)成記錄的基本1142022/12/112.3數(shù)據(jù)庫(kù)的類(lèi)型*(P3-4)參考(文獻(xiàn)書(shū)目型)數(shù)據(jù)庫(kù)全文數(shù)據(jù)庫(kù)事實(shí)數(shù)據(jù)庫(kù)數(shù)值數(shù)據(jù)庫(kù)192022/12/82.3數(shù)據(jù)庫(kù)的類(lèi)型*(P3-4)參1152022/12/11參考(文獻(xiàn)書(shū)目型)數(shù)據(jù)庫(kù)是指包含各種數(shù)據(jù)、信息或知識(shí)的原始來(lái)源和屬性的數(shù)據(jù)庫(kù);是機(jī)讀的目錄、索引和文摘檢索工具,檢索結(jié)果是文獻(xiàn)的線索而非原文。存儲(chǔ)的是二次文獻(xiàn),包括文獻(xiàn)的外部特征、題錄、文摘和主題詞等。這類(lèi)數(shù)據(jù)庫(kù)占用很大的比例,其代表性的數(shù)據(jù)庫(kù)有《EICompendexPlus》(工程索引)、《INSPEC》(科學(xué)文摘)和《全國(guó)報(bào)刊索引》等。圖書(shū)館提供的基于網(wǎng)絡(luò)的聯(lián)機(jī)公共檢索目錄(OPAC)系統(tǒng)202022/12/8參考(文獻(xiàn)書(shū)目型)數(shù)據(jù)庫(kù)是指包含各種數(shù)1162022/12/11
事實(shí)數(shù)據(jù)庫(kù)存儲(chǔ)的是用來(lái)描述人物、機(jī)構(gòu)、事物等信息的情況、過(guò)程、現(xiàn)象的事實(shí)數(shù)據(jù)。如名人錄、機(jī)構(gòu)指南、大事記、百科全書(shū)、手冊(cè)、地圖集、企事業(yè)名錄、計(jì)算機(jī)程序、音樂(lè)等,均可歸入事實(shí)數(shù)據(jù)庫(kù)。例如:中國(guó)咨詢(xún)行、國(guó)研網(wǎng)、萬(wàn)方數(shù)據(jù)(中國(guó)企業(yè)、公司及產(chǎn)品、中國(guó)科技名人、中國(guó)科研機(jī)構(gòu)等等)212022/12/8事實(shí)數(shù)據(jù)庫(kù)存儲(chǔ)的是用來(lái)描述人物、機(jī)1172022/12/11數(shù)值數(shù)據(jù)庫(kù)主要包含的是數(shù)字?jǐn)?shù)據(jù),如各種統(tǒng)計(jì)數(shù)據(jù)、科學(xué)實(shí)驗(yàn)數(shù)據(jù)、科學(xué)測(cè)量數(shù)據(jù)等。氣像數(shù)據(jù)、地質(zhì)資料、化學(xué)或物理化合物特性的文獻(xiàn)數(shù)據(jù)、人口統(tǒng)計(jì)資料、市場(chǎng)調(diào)研數(shù)據(jù)等。222022/12/8數(shù)值數(shù)據(jù)庫(kù)主要包含的是數(shù)字?jǐn)?shù)據(jù),如各種1182022/12/11全文數(shù)據(jù)庫(kù)存儲(chǔ)的是原始文獻(xiàn)的全文,如雜志論文、報(bào)紙新聞、法院案例等。全文檢索可直接獲取原始資料,而不是書(shū)目檢索時(shí)的線索,提高了用戶(hù)的檢索效率。如:中國(guó)知網(wǎng)(CNKI)、萬(wàn)方、維普、
Elsevier等全文數(shù)據(jù)庫(kù)。232022/12/8全文數(shù)據(jù)庫(kù)存儲(chǔ)的是原始文獻(xiàn)的全文,如雜3計(jì)算機(jī)信息檢索的分類(lèi)1按信息資源的存儲(chǔ)形式分2按信息訪問(wèn)模式分
3計(jì)算機(jī)信息檢索的分類(lèi)1按信息資源的存儲(chǔ)形式分1202022/12/113.1按信息資源的存儲(chǔ)形式分*
(P7-8)(1)全文檢索。以全文數(shù)據(jù)庫(kù)存儲(chǔ)為基礎(chǔ)的檢索方式,所謂全文數(shù)據(jù)庫(kù)是將一個(gè)完整的信息源的全部?jī)?nèi)容轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別、處理的信息單元而形成的數(shù)據(jù)集合。全文檢索系統(tǒng)對(duì)全文數(shù)據(jù)庫(kù)進(jìn)行詞(字)、句、段落等深層次的編輯、加工,同時(shí)允許用戶(hù)采用自然語(yǔ)言表達(dá),借助邏輯組配、截詞、鄰詞匹配等檢索手段直接查閱文獻(xiàn)原文信息。全文檢索的應(yīng)用范圍包括:各種科技期刊、專(zhuān)利文獻(xiàn)、新聞報(bào)紙、年鑒、百科、手冊(cè)、圖書(shū)等全文數(shù)據(jù)庫(kù),例如:我國(guó)引進(jìn)的OCLC的firstsearch、IEL、SpringerLink、EBSCO等全文數(shù)據(jù)庫(kù)以及我國(guó)CNKI的中國(guó)期刊全文數(shù)據(jù)庫(kù)、重慶維普的中文科技期刊數(shù)據(jù)庫(kù)、超星數(shù)字圖書(shū)館、萬(wàn)方資源系統(tǒng)的數(shù)字化期刊、學(xué)位論文、會(huì)議論文等。
252022/12/83.1按信息資源的存儲(chǔ)形式分*(P1212022/12/11(2)二次文獻(xiàn)檢索*是針對(duì)全文檢索而言,也就是分別將文獻(xiàn)的內(nèi)部特征(題名、分類(lèi)等)和外部特征(作者、出處、年代、ISSN、語(yǔ)言等)作為存儲(chǔ)和檢索的匹配標(biāo)識(shí)而形成的數(shù)據(jù)集合,利用檢索系統(tǒng)的檢索結(jié)果是文獻(xiàn)信息的題錄及文摘。學(xué)科領(lǐng)域覆蓋面廣,信息量大,可以利用文獻(xiàn)線索獲取到一次文獻(xiàn)。例如:COMPENDEX、INSPEC、SCI等國(guó)外數(shù)據(jù)庫(kù);萬(wàn)方數(shù)據(jù)的學(xué)位論文、會(huì)議論文數(shù)據(jù)庫(kù)、全國(guó)報(bào)刊索引、Calis西文期刊目次數(shù)據(jù)庫(kù)等262022/12/8(2)二次文獻(xiàn)檢索*是針對(duì)全文檢索而言1222022/12/11(3)多媒體檢索就是把文字、聲音、圖像(形)等多種信息的傳播載體通過(guò)計(jì)算機(jī)進(jìn)行數(shù)字化加工、處理而形成的一種綜合存儲(chǔ)技術(shù)。利用多媒體檢索系統(tǒng)可分別進(jìn)行視頻檢索、聲音檢索、圖像檢索。多媒體信息檢索系統(tǒng)有著廣闊的應(yīng)用前景,它將廣泛用于電子會(huì)議、遠(yuǎn)程教學(xué)、遠(yuǎn)程醫(yī)療、電子圖書(shū)館、藝術(shù)收藏和地球資源管理、天氣預(yù)報(bào)、時(shí)裝設(shè)計(jì)、智能群體決策、計(jì)算機(jī)支持協(xié)同工作、金融市場(chǎng)、軍事指揮系統(tǒng)、防汛指揮系統(tǒng)等方面。各大網(wǎng)站均可進(jìn)行多媒體信息的檢索,如:GOOGLE、百度等搜索引擎、新華社多媒體數(shù)據(jù)庫(kù)是國(guó)內(nèi)最大規(guī)模的多媒體、多文種新聞信息綜合性數(shù)據(jù)庫(kù)。272022/12/8(3)多媒體檢索就是把文字、聲音、圖像1232022/12/11(4)超文本檢索超文本(Hypertext)是利用計(jì)算機(jī)將多介質(zhì)信息按照一定的邏輯聯(lián)接關(guān)系加工、貯存起來(lái),構(gòu)成可任意連接的、有層次的網(wǎng)狀結(jié)構(gòu)數(shù)據(jù)庫(kù),是一種聯(lián)想式的綜合信息管理系統(tǒng)。其中的某些字、符號(hào)或短語(yǔ)、圖形和圖像起著“熱鏈路”(Hotlink)的作用,在顯示出來(lái)時(shí)其字體或顏色變化或者標(biāo)有下橫線、以區(qū)別于一般的正文。當(dāng)鼠標(biāo)器的光標(biāo)移到某個(gè)熱鏈路上,并且按了一下鼠標(biāo)鍵之后,鼠標(biāo)器光標(biāo)便沿著這條鏈路跳到該文件的另一處或另一個(gè)文件。計(jì)算機(jī)信息檢索在經(jīng)歷了傳統(tǒng)信息檢索、全文文本檢索之后,隨著多媒體技術(shù)的發(fā)展和應(yīng)用,出現(xiàn)目前這種超文本檢索方式。可用于檢索人物、新聞、文檔、文藝小說(shuō)、旅游景點(diǎn)、繪畫(huà)、古文物、生物等內(nèi)容廣泛的各種信息。282022/12/8(4)超文本檢索超文本(Hypert1242022/12/113.2按信息訪問(wèn)模式分(P5)根據(jù)檢索方式分:(1)脫機(jī)檢索(2)聯(lián)機(jī)檢索(3)國(guó)際聯(lián)機(jī)檢索(4)光盤(pán)檢索(5)鏡像檢索(6)網(wǎng)絡(luò)檢索292022/12/83.2按信息訪問(wèn)模式分(P5)根據(jù)檢(1)脫機(jī)信息檢索是六十年代發(fā)展起來(lái)的批次檢索,用戶(hù)不與檢索系統(tǒng)發(fā)生直接聯(lián)系,只需把檢索要求送往檢索中心,由檢索人員在計(jì)算機(jī)主機(jī)進(jìn)行文獻(xiàn)檢索的一種方式。優(yōu)點(diǎn):價(jià)格便宜,無(wú)網(wǎng)絡(luò)通訊費(fèi),檢索費(fèi)用由用戶(hù)平攤,隨機(jī)存儲(chǔ)。缺點(diǎn):一次機(jī)會(huì)檢索,檢索結(jié)果延誤,委托性檢索。(1)脫機(jī)信息檢索是六十年代發(fā)展起來(lái)的批次檢索,用戶(hù)不與(2)聯(lián)機(jī)信息檢索聯(lián)機(jī)檢索是用戶(hù)利用終端設(shè)備,通過(guò)通信網(wǎng)絡(luò)或通信線路與檢索系統(tǒng)聯(lián)機(jī),進(jìn)行“人機(jī)對(duì)話”,從檢索中心的數(shù)據(jù)庫(kù)查找所需要的文獻(xiàn)信息過(guò)程。特點(diǎn):檢索的速度快,檢索結(jié)果可以得到及時(shí)修改。缺點(diǎn):檢索費(fèi)用高。(2)聯(lián)機(jī)信息檢索聯(lián)機(jī)檢索是用戶(hù)利用終端設(shè)備,通過(guò)通信網(wǎng)(3)國(guó)際聯(lián)機(jī)檢索*該系統(tǒng)是70年代出現(xiàn)的一門(mén)現(xiàn)代化情報(bào)檢索手段,目前已發(fā)展到相當(dāng)高的水平,計(jì)算機(jī)聯(lián)機(jī)網(wǎng)絡(luò)和檢索終端已遍及世界所有主要國(guó)家和地區(qū)。優(yōu)點(diǎn):(1)可以實(shí)現(xiàn)資源共享;(2)檢索速度快;(3)信息資源專(zhuān)業(yè)化;(4)查全率和查準(zhǔn)率較高。(3)國(guó)際聯(lián)機(jī)檢索*該系統(tǒng)是70年代出現(xiàn)的一門(mén)現(xiàn)代化情報(bào)檢索2022/12/11128國(guó)際聯(lián)機(jī)檢索的缺點(diǎn)
檢索費(fèi)用高;對(duì)檢索系統(tǒng)及其文檔(數(shù)據(jù)庫(kù))的收錄、標(biāo)引、特點(diǎn)等問(wèn)題較難了解、熟悉;檢索技術(shù)和技巧不易掌握2022/12/833國(guó)際聯(lián)機(jī)檢索的缺點(diǎn)檢索費(fèi)用高;世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)1、DIALOG系統(tǒng)*是世界最大的國(guó)際聯(lián)機(jī)檢索系統(tǒng)1963年,原屬美國(guó)洛克希德公司,系統(tǒng)設(shè)在加洲PaloAlto市,1988年轉(zhuǎn)讓給美國(guó)Knight-Ridder公司。2000年又轉(zhuǎn)入DIALOG公司經(jīng)營(yíng)。目前,該系統(tǒng)的聯(lián)機(jī)服務(wù)網(wǎng)遍布世界70多個(gè)國(guó)家和地區(qū)的200多個(gè)城市,共設(shè)有聯(lián)機(jī)檢索終端25000余臺(tái)。系統(tǒng)中各類(lèi)型數(shù)據(jù)庫(kù)數(shù)量的發(fā)展速度相當(dāng)快,擁有數(shù)據(jù)庫(kù)約900多個(gè),占全世界機(jī)存總量的60%,內(nèi)容涉及自然科學(xué)、社會(huì)科學(xué)、經(jīng)濟(jì)、商業(yè)等各個(gè)領(lǐng)域。世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)1、DIALOG系統(tǒng)*1302022/12/11352022/12/81312022/12/11DIALOGWEB系統(tǒng)檢索平臺(tái)362022/12/8DIALOGWEB系統(tǒng)檢索平臺(tái)2022/12/11132世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)2、ORBIT系統(tǒng):是世界是第二大聯(lián)機(jī)檢索系統(tǒng),他建于1965年,總部設(shè)在美國(guó)費(fèi)吉尼亞洲的馬庫(kù)林。提供專(zhuān)利、化學(xué)、能源、市場(chǎng)、工程和電子等方面的信息,約有100個(gè)數(shù)據(jù)庫(kù),占全世界機(jī)存文獻(xiàn)量的25%。主要提供補(bǔ)充DIALOG系統(tǒng)而不是與其競(jìng)爭(zhēng)的數(shù)據(jù),特別是在專(zhuān)利、商標(biāo)和科技信息等領(lǐng)域具有獨(dú)特優(yōu)勢(shì)。2022/12/837世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)2、OR2022/12/11133世界上最著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)3、BRS系統(tǒng):內(nèi)容涉及醫(yī)學(xué)、生物科學(xué)、教育、健康、物理和社會(huì)科學(xué)及其它綜合性學(xué)科。有154個(gè)公用數(shù)據(jù)庫(kù)和
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 1 北京的春節(jié) 教學(xué)設(shè)計(jì)-2024-2025學(xué)年語(yǔ)文六年級(jí)下冊(cè)統(tǒng)編版
- 6人大代表為人民(教學(xué)設(shè)計(jì))-2024-2025學(xué)年統(tǒng)編版道德與法治六年級(jí)上冊(cè)
- 5 一個(gè)豆莢里的五粒豆(教學(xué)設(shè)計(jì))-2024-2025學(xué)年統(tǒng)編版語(yǔ)文四年級(jí)上冊(cè)
- 6《景陽(yáng)岡》教學(xué)設(shè)計(jì)-2023-2024學(xué)年統(tǒng)編版語(yǔ)文五年級(jí)下冊(cè)
- 11《別傷著自己》 第二課時(shí)(教學(xué)設(shè)計(jì))2023-2024學(xué)年統(tǒng)編版道德與法治一年級(jí)上冊(cè)
- 2023二年級(jí)語(yǔ)文上冊(cè) 第二單元 4 田家四季歌配套教學(xué)實(shí)錄 新人教版
- 鐵路運(yùn)輸業(yè)智能化調(diào)度及維護(hù)管理方案
- 2《我向國(guó)旗敬個(gè)禮》(教學(xué)設(shè)計(jì))2024-2025學(xué)年統(tǒng)編版(2024)道德與法治一年級(jí)上冊(cè)
- 2025年碳纖維正交三向織物項(xiàng)目合作計(jì)劃書(shū)
- 9日益重要的國(guó)際組織 第二課時(shí) 教學(xué)設(shè)計(jì)-2023-2024學(xué)年道德與法治六年級(jí)下冊(cè)統(tǒng)編版
- 2024年世界職業(yè)院校技能大賽高職組“研學(xué)旅行組”賽項(xiàng)參考試題庫(kù)(含答案)
- 《金融科技概論》完整全套課件
- 2025年新疆生產(chǎn)建設(shè)兵團(tuán)興新職業(yè)技術(shù)學(xué)院高職單招高職單招英語(yǔ)2016-2024年參考題庫(kù)含答案解析
- 2024年陜西警官職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫(kù)含答案解析
- 圍棋入門(mén)基本知識(shí)
- 2024年新疆生產(chǎn)建設(shè)兵團(tuán)興新職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(kù)(頻考版)含答案解析
- 2025年貴州蔬菜集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 醫(yī)院設(shè)施日常巡查管理制度
- 急性心房顫動(dòng)中國(guó)急診管理指南(2024)解讀
- 人教版四年級(jí)下冊(cè)數(shù)學(xué)第二單元觀察物體(二) 單元測(cè)試
- 建筑工程公司績(jī)效考核制度范本
評(píng)論
0/150
提交評(píng)論