計(jì)算機(jī)檢索的基本原理及過(guò)程_第1頁(yè)
計(jì)算機(jī)檢索的基本原理及過(guò)程_第2頁(yè)
計(jì)算機(jī)檢索的基本原理及過(guò)程_第3頁(yè)
計(jì)算機(jī)檢索的基本原理及過(guò)程_第4頁(yè)
計(jì)算機(jī)檢索的基本原理及過(guò)程_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)檢索

的基本原理及過(guò)程

wangxin@

?文獻(xiàn)數(shù)據(jù)庫(kù)的概念

?文獻(xiàn)數(shù)據(jù)庫(kù)檢索步驟

?主題詞關(guān)鍵詞的選取

?文獻(xiàn)數(shù)據(jù)庫(kù)的字段檢索

?檢索效果評(píng)價(jià)

?常用檢索技術(shù)

?計(jì)算機(jī)信息檢索實(shí)例

文故數(shù)據(jù)庫(kù)基本知識(shí)

1丈故數(shù)據(jù)埠

?文故數(shù)據(jù)庫(kù)是將各個(gè)學(xué)科領(lǐng)域、

各種專(zhuān)業(yè)技術(shù)方面的丈故信息匯集

在?起,經(jīng)過(guò)分門(mén)別類(lèi)的組織、加

工、編排后形成的數(shù)據(jù)庫(kù)。它能夠

提供人們方便而快速地,更具針對(duì)

性地查找各種文故咨料的線(xiàn)索或者

全文。

文故數(shù)據(jù)庫(kù)基本知識(shí)

1.1丈故數(shù)據(jù)庫(kù)的類(lèi)型

按收錄文獻(xiàn)的類(lèi)型劃分按提供信息的詳略劃分

2、文獻(xiàn)數(shù)據(jù)庫(kù)檢索步驟

■確定檢索要求和目標(biāo)擬定檢索對(duì)象范圍主題詞

?選擇數(shù)據(jù)庫(kù)及檢索途徑

實(shí)施檢索并顯示檢索結(jié)果用檢索技術(shù)優(yōu)化檢索結(jié)果

選擇輸出(打印、拷貝或發(fā)送至電子郵箱)

2.1選擇檢索詞

?利用主題詞表

-選取規(guī)范化的主題詞或詞組

?利用印刷版的檢索工具書(shū)

-手工試檢,根據(jù)檢出文獻(xiàn)的主題詞標(biāo)引情

?選用自由詞

-由于詞表規(guī)模的限制,不可能對(duì)某一專(zhuān)業(yè)

作全面檢索時(shí),應(yīng)考慮選用自由詞,盡可

能多地選用與課題有關(guān)的同義詞,以防漏檢。

檢索詞選取時(shí)應(yīng)注意的問(wèn)題

冷僻詞

找出隱性概念

使用核心概念

注意同義詞近義詞詞型變化

2.2檢奈途桎

作者(文章的責(zé)任者)

篇名(或題名)

機(jī)構(gòu)(如浙江工業(yè)大學(xué))

關(guān)鍵詞(如污水處理、高層建筑)

主題詞(規(guī)范化的主題概念,如用激光不用雷射)

文摘(論文或圖書(shū)的摘要或內(nèi)容提要)

引文(即參考文獻(xiàn))

基金(如國(guó)家自然科學(xué)基金項(xiàng)目)

刊名(期刊的名稱(chēng))

全文(或者全記錄)一

2.3常用檢索技術(shù)一常用其二妗付

?邏輯算符

?位置算符

?截詞符

?常用命令

邏輯檢索概念示意

BnotA

常用算符-正科算符

?與、AND、*

-用于概念交叉和限定。起縮小檢索范圍和

提高文獻(xiàn)查準(zhǔn)率的作用。

?例Solar*Energy

常用算符-逐料算符

?或、OR、+

-用于概念之間并列關(guān)系的組配。增加主題

的同義詞,

-以擴(kuò)大檢索范圍,避免文獻(xiàn)漏檢。

?例www+internet+network

,常用算符-近輯算符

?非、NOT、-

-從原檢索范圍中剔除一部分不需要的內(nèi)容。

?例Energy-Nuclear

-除核能以外的有關(guān)能源方面的文獻(xiàn)才被命

中。

,常用算符-住置算符

布爾算符中的邏輯“與”只要求兩個(gè)

檢索詞必須同時(shí)出現(xiàn)在同一篇文獻(xiàn)中,

而沒(méi)有限定算符兩側(cè)檢索詞之間的位置

關(guān)系,有時(shí)難免造成誤檢。

常用算符-住置算符

例如,查找“細(xì)菌對(duì)染料破壞”方面的文

獻(xiàn)-Hh,

檢索詞:細(xì)菌、破壞、染料

邏輯“與”組配

檢索結(jié)果:命中同時(shí)用這三個(gè)詞標(biāo)引的文獻(xiàn)

-有“細(xì)菌對(duì)染料的破壞”方面的文獻(xiàn),

-也會(huì)有“染料對(duì)細(xì)菌的破壞”方面的文獻(xiàn),

?要排除后一部分的文獻(xiàn),就需用位置算符限定詞

與詞之間的位置關(guān)系。

常用算符-蒞置算符

?(W)或()算符:“With”的縮寫(xiě)

-詞序不許顛倒

-兩詞之間不許插詞,只許空格或連字符號(hào)

?例CD(W)ROM將命中CDROM或CD-

ROM

?solar()energy檢出solarenergy

常用算符-蒞置算符

?(nW)算符:“nwords”的縮寫(xiě)

-(nW)是從(W)算符引伸出來(lái)

-檢索詞之間允許插入0—n個(gè)詞

-詞序不許顛倒

?例anticorrosion(1W)paint

可檢出anticorrosionpaint和anticorrosionofpaint

?例檢索“材料磨損”(WEAROF

MATERIALS)方面的文獻(xiàn),

檢索式:WEAR(1W)MATERIALS

常用算符-蒞置算符

?(N)算符:“Near”的縮寫(xiě)

-詞序可以顛倒

-兩詞之間不許插詞

?例cross(N)section

可檢出crosssection和sectioncross

常用算符-核置算符

?(nN)算符:

-(nN)是從(N)算符引伸出來(lái)

-檢索詞之間允許插入0—n個(gè)詞

-詞序可以顛倒

,常用算符-住置算符

?(F)算符:“Field”的縮寫(xiě)

-算符兩側(cè)的檢索詞必須在同一字段內(nèi)

-詞序及兩詞間插入的詞數(shù)不限

?彳列digital(F)computer/TI,AB

常用算符-住置算符

?(S)算符:“Sentenc鏟和“Sub-field”的

縮寫(xiě)

-算符兩側(cè)的檢索詞必須在同一句子

-詞序及兩詞間插入的詞數(shù)不限

,常用算符-住置算符

上述位置算符可以混合用于同一檢索

式中,由于檢索系統(tǒng)是按從左到右的順

序處理檢索式,因此,應(yīng)將限制最嚴(yán)的

算符放在最左邊。

84,

常用6二付就詞符

?非限制性截詞:“?”加在詞干或不

完整的詞上,對(duì)詞的完整意義進(jìn)行檢

索。

computer?代表Computer,computers,

computerized等

?限制性截詞:analy?er命中記錄中將出

現(xiàn)analyzer和analyser;work???命中記

錄中將出現(xiàn),work,works5worker,

workers5working

3、檢索效率

?檢索系統(tǒng)進(jìn)行檢索時(shí)產(chǎn)生的有效結(jié)果

?它直接反映了檢索系統(tǒng)性能的好壞。

?衡量檢索效果的指標(biāo)

一查全率(recallratio)

一查準(zhǔn)率(precisionratio)

檢索出的相關(guān)文獻(xiàn)量

杳且全王至率R=-數(shù)-據(jù)--庫(kù)--中-的--全--部--相-關(guān)--文--獻(xiàn)--xlOO%

氐/、+檢索出的相關(guān)文獻(xiàn)量

查準(zhǔn)率P=-4A山.-M閆一X100%

檢出的文獻(xiàn)總量

最理想的檢索結(jié)果是查全率和查準(zhǔn)率都達(dá)到100%。

R—100%表示數(shù)據(jù)庫(kù)中收錄的全部相關(guān)文獻(xiàn)都被檢索出來(lái)

P—100%表示檢索出來(lái)的文獻(xiàn)全部都是相關(guān)文獻(xiàn)

但事實(shí)上,檢索中有許多因素使這個(gè)指標(biāo)很難達(dá)到。

C.W.Cleverdon(英)進(jìn)行

Granfield試驗(yàn),得出

查全率R與查準(zhǔn)率P曲線(xiàn)。R

?R—P之間存在著互逆關(guān)系

點(diǎn)

?A總翥詞數(shù)量多,泛指性強(qiáng),

查全率較高但查準(zhǔn)率卻非常低

?B點(diǎn)

M索詞專(zhuān)指性較強(qiáng),查準(zhǔn)率就高

查全率因此降低

?C,D兩點(diǎn)

兩種極端的折衷。

查全率一般在60%——70%查全與查準(zhǔn)率P的關(guān)系曲線(xiàn)

查準(zhǔn)率一般在40%——50%

?無(wú)論怎樣調(diào)整檢索策略和改進(jìn)系

統(tǒng)效率,都無(wú)法使P和R同時(shí)接近100%。

4、計(jì)算機(jī)檢索實(shí)例

課題名稱(chēng):高層建筑的抗震結(jié)構(gòu)設(shè)計(jì)

?課題分析

該課題涉及的主要概念有:高層、建筑、

抗震問(wèn)題和結(jié)構(gòu)設(shè)計(jì)等方面。

作業(yè)

1、信息素質(zhì)包括哪幾個(gè)方面?

2、信息檢索活動(dòng)的功用有哪些?

3、丈故按加工深度、出版形式和載體形點(diǎn)分別可分成哪幾類(lèi)?

4、文技檢索的工具有哪些?文故數(shù)據(jù)庫(kù)可分成哪幾種類(lèi)型?請(qǐng)列舉

五種檢索途徑。

5、請(qǐng)查詢(xún)本校圖書(shū)稔的稔箴目錄,寫(xiě)出5本有關(guān)“計(jì)算機(jī)應(yīng)用”或

“國(guó)際貿(mào)易”的圖書(shū)的素書(shū)號(hào)并簡(jiǎn)要說(shuō)明素書(shū)號(hào)的構(gòu)成。

6、什么是檢索語(yǔ)言,檢索語(yǔ)言有幾種?請(qǐng)?jiān)敿?xì)列舉并進(jìn)行比較。

文故檢索的方法有哪些?各自的優(yōu)缺點(diǎn)是什么?

?8、如何提高檢索丈故的效率并查會(huì)查準(zhǔn)丈故?

潮9、檢索詞選取時(shí)應(yīng)注意的問(wèn)題有哪些?

110、國(guó)際商業(yè)經(jīng)濟(jì)活動(dòng)中應(yīng)了解的信息有哪些?(非經(jīng)貿(mào)專(zhuān)業(yè)不做)

■11、請(qǐng)說(shuō)明計(jì)算機(jī)檢索系統(tǒng)的基本原理及檢索過(guò)程。

12、布東正科檢素

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論