數(shù)字信息資源檢索與利用_第1頁
數(shù)字信息資源檢索與利用_第2頁
數(shù)字信息資源檢索與利用_第3頁
數(shù)字信息資源檢索與利用_第4頁
數(shù)字信息資源檢索與利用_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)字信息資源檢索與利用山東大學(xué)威海分校圖書館第二章信息檢索原理第一節(jié)信息檢索及系統(tǒng)第二節(jié)信息檢索語言第三節(jié)數(shù)據(jù)庫的構(gòu)成與信息檢索技術(shù)

檢索:是指面向信息需求而進(jìn)行高度選擇性的查找過程。存儲:是對信息進(jìn)行著錄、標(biāo)引、整序,編制檢索工具和建立檢索系統(tǒng)的過程。存儲檢索信息檢索一、信息檢索信息檢索(InformationRetrieval)是指將信息(主要指文獻(xiàn)信息)按一定的方式組織和存儲起來,并根據(jù)用戶的需要找出相關(guān)信息的過程。

第一節(jié)信息檢索及系統(tǒng)原始文獻(xiàn)著錄標(biāo)引數(shù)據(jù)庫提問檢索輸出存儲檢索典藏模塊編目模塊流通模塊采訪模塊期刊模塊系統(tǒng)模塊后臺數(shù)據(jù)庫OPAC數(shù)據(jù)數(shù)據(jù)我校圖書館匯文文獻(xiàn)信息服務(wù)系統(tǒng)二信息檢索的類型(一)按檢索內(nèi)容劃分1書目檢索

是以書目文獻(xiàn)為檢索內(nèi)容的信息檢索。提供的一般為圖書、期刊等的線索。2

數(shù)據(jù)檢索

是以數(shù)據(jù)為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲的大量原始調(diào)查數(shù)據(jù)和其它統(tǒng)計數(shù)據(jù)中查出所需的數(shù)字資料。3、事實檢索

是以具體事項為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲的各種原始信息資源中查出專門的事實材料。4、全文檢索

即檢索系統(tǒng)存儲的是整篇文章或整本圖書。5、圖像檢索

即以圖形、圖像或圖文信息為檢索內(nèi)容的信息檢索。6、多媒體檢索

是以文字、圖像、聲音等多媒體信息為檢索內(nèi)容的信息檢索。(二)按信息檢索手段劃分

1、傳統(tǒng)信息檢索

就是手工信息檢索,是利用各種印刷型檢索工具來查找文獻(xiàn)的一種方法。

2、現(xiàn)代信息檢索

現(xiàn)代信息檢索即計算機(jī)信息檢索,是指利用計算機(jī)和網(wǎng)絡(luò)來處理和查找文獻(xiàn)信息的檢索方式。三檢索系統(tǒng)系統(tǒng)構(gòu)成:計算機(jī)、通信網(wǎng)絡(luò)、檢索終端、數(shù)據(jù)庫組成。計算機(jī)通信網(wǎng)絡(luò)檢索終端數(shù)據(jù)庫核心橋梁四檢索系統(tǒng)的檢索功能檢索功能是指檢索系統(tǒng)在檢索界面上提供給用戶的基本功能。它與系統(tǒng)的檢索技術(shù)是緊密結(jié)合的。比較通用的檢索功能有瀏覽、索引、簡單檢索、復(fù)雜檢索、自然然語言檢索等。(1)瀏覽Browse由系統(tǒng)提供一個樹狀結(jié)構(gòu)的概念等級體系,分層次按其屬性及相互從屬關(guān)系對知識進(jìn)行并行或樹狀排列,逐級展開到最小知識單元。(2)索引Index索引是一個線性表單,可以將任何一個標(biāo)引字段中的概念按字母順序不分級地線性排列起來。索引的種類很多,如人名索引、出版物索引、地名索引、主題索引、機(jī)構(gòu)索引、分子式索引等。(3)簡單檢索SimpleSearch、BasicSearch、QuickSearch即為用戶提供一個簡單的檢索界面,幫助非專業(yè)或初入門用戶方便地提交檢索式。(4)復(fù)雜檢索AdvancedSearch、GuidedSearch、ExpertSearch為專業(yè)用戶、資深用戶提供比較復(fù)雜的檢索界面,可以構(gòu)造比較細(xì)致的檢索式,幫助用戶進(jìn)行精確檢索。高級檢索(5)自然語言檢索NaturalLanguageSearch、IntelligentSearch直接采用自然語言中的字、詞甚至整個句子作為提問式進(jìn)行檢索的方法。如:什么是厄爾尼諾現(xiàn)象?大西洋和太平洋的颶風(fēng)

(6)命令檢索此又稱指令檢索,由檢索用戶自行輸入各種檢索命令進(jìn)行檢索。例如:DIALOG聯(lián)機(jī)檢索系統(tǒng)B34,434說明:B為begin的縮寫,此指令意即打開34,434號數(shù)據(jù)庫文檔。Scomputer/TI說明:S為select的縮寫,此指令意即在題名檢索字段中檢索“computer”一詞。(7)二次檢索在檢索結(jié)果內(nèi)進(jìn)一步檢索,使結(jié)果更精煉、準(zhǔn)確。五檢索系統(tǒng)的評價(1)檢索功能:主要指系統(tǒng)提供給用戶的各種檢索途徑和檢索入口,可供選擇的越多,相對用戶就越方便。(2)檢索技術(shù):即系統(tǒng)是否允許用戶使用各種檢索技巧,以便更準(zhǔn)確和快速地找到自己所需的信息。(3)檢索結(jié)果:即用戶是否得到了內(nèi)容全面、下載和使用均比較方便的檢索結(jié)果。(4)用戶服務(wù):主要是指在檢索功能之外,系統(tǒng)還為用戶提供了哪些服務(wù)。第二節(jié)信息檢索語言一、檢索語言的含義及作用二、檢索語言的類型1檢索語言的概念檢索語言(informationretrievallanguage),是信息存儲與檢索過程中用于描述信息特征和表達(dá)用戶信息提問的一種專門語言。所謂檢索的運(yùn)算匹配就是通過檢索語言的匹配來實現(xiàn)的。檢索語言是人與檢索系統(tǒng)對話的基礎(chǔ)。一、檢索語言的含義及作用2

檢索語言的工作原理存儲:檢索系統(tǒng)對文獻(xiàn)內(nèi)容進(jìn)行分析,概括分析出若干能代表文獻(xiàn)內(nèi)容的語詞,并賦予一定的標(biāo)識,如題名、作者、主題詞等,作為存儲與檢索的依據(jù),然后納入到數(shù)據(jù)庫中。檢索:檢索人員首先要對檢索課題進(jìn)行分析,同樣形成若干能代表信息需求的語詞,然后通過檢索系統(tǒng)在數(shù)據(jù)庫中匹配具有同樣語詞和標(biāo)識的文獻(xiàn),找到自己所需的信息。保證不同標(biāo)引人員表征文獻(xiàn)信息的一致性。使內(nèi)容相同及相關(guān)的文獻(xiàn)集中化。保證檢索提問與文獻(xiàn)信息標(biāo)引的一致性。保證檢索者按不同需求檢索文獻(xiàn)信息時都能獲得較高的查全率和查準(zhǔn)率。3檢索語言的作用舉例1篇名:跨國并購對企業(yè)的影響關(guān)鍵詞:跨國并購,財務(wù)風(fēng)險,財務(wù)整合摘要:闡述了當(dāng)前跨國并購的特征以及對企業(yè)而言的機(jī)遇和挑戰(zhàn),分析了跨國并購所帶來的財務(wù)問題,對跨國并購對企業(yè)的影響進(jìn)行了探討。中圖分類號:F271作者:房玲刊名:科技情報開發(fā)與經(jīng)濟(jì)年:2007期:14作者單位:太原供電分公司保護(hù)自動化所舉例2文獻(xiàn)1:Amodelofmultimediainformationretrieval文獻(xiàn)2:TheInformationretrieval

inchemistryWWWserver文獻(xiàn)3:ERICresources文獻(xiàn)1:篇名:Amodelofmultimediainformationretrieval

主題:informationretrieval,multimediacomputerapplication文獻(xiàn)2:篇名:TheInformationretrieval

inchemistryWWWserver

主題:chemistry,educationalmaterials文獻(xiàn)3:篇名:ERICresources

主題:educationalmaterials在對信息存儲過程中,對這三篇文獻(xiàn)內(nèi)容分別進(jìn)行了分析,并使用檢索語言對其進(jìn)行標(biāo)引,標(biāo)引結(jié)果為:二檢索語言的類型檢索語言的類型自然語言人工語言題名責(zé)任者關(guān)鍵詞引文分類語言代碼語言主題語言1自然語言(naturallanguage)檢索用詞是從信息內(nèi)容本身抽取的,主要依賴于計算機(jī)自動抽詞技術(shù)完成,輔以人工自由標(biāo)引(非依據(jù)詞表的標(biāo)引方法),是非規(guī)范詞(uncontrolledterm)。(1)關(guān)鍵詞(keyword):直接從信息資源名稱、正文或文摘中抽出的代表信息主要內(nèi)容的重要語詞。(2)題名:信息資源的名稱,如論文篇名、圖書書名、網(wǎng)站名稱等。(3)全文:從資源的內(nèi)部內(nèi)容中自動抽取、查找,是目前網(wǎng)上各類搜索引擎使用的最多的方法。(4)引文(quotation):將文獻(xiàn)所引用的參考文獻(xiàn)的作者、篇名、來源出版物抽取出來進(jìn)行標(biāo)引。優(yōu)點新穎性強(qiáng)檢索方便標(biāo)引準(zhǔn)確度高缺點詞匯量太大,給詞匯的存儲、加工和檢索帶來許多操作性方面的困難。當(dāng)文獻(xiàn)的主題很明白清楚地在標(biāo)題或主題詞中表達(dá)出來時,檢索才會較成功,反之則失效。詞匯具有模糊性,另外多義、近義、同義現(xiàn)象較多,給標(biāo)引和檢索帶來困難。自然語言的優(yōu)缺點2人工語言由人工創(chuàng)制的,采用規(guī)范詞,用來專指某個概念或與之相應(yīng)的概念??梢詫⑼x詞、近義詞、相關(guān)詞、多義詞及縮略詞規(guī)范在一起,由人工控制。分類檢索語言主題檢索語言代碼檢索語言(1)分類檢索語言

按學(xué)科范疇及知識之間的關(guān)系列出類目,并用數(shù)字、字母符號對類目進(jìn)行標(biāo)識的一種語言體系,也稱分類法。

中國圖書館圖書分類法美國國會圖書館分類法杜威十進(jìn)位分類法

IPC國際專利分類表《中圖法》分類語言舉例

《中圖法》按學(xué)科體系,劃分為二十二個大類,每個大類都用一個英文字母表示。如下所示:

A馬克思主義、列寧主義、毛澤東思想、鄧小平理論

B哲學(xué)宗教

C社會科學(xué)總論

D政治法律

E軍事

F經(jīng)濟(jì)

G文化科學(xué)教育體育

H語言文字

I文學(xué)

J藝術(shù)

《中圖法》分類語言舉例

K歷史地理

N自然科學(xué)總論

O數(shù)理科學(xué)化學(xué)

P天文學(xué)地球科學(xué)

Q生物科學(xué)

R醫(yī)藥衛(wèi)生

S農(nóng)業(yè)科學(xué)

T工業(yè)技術(shù)

U交通運(yùn)輸

V航空航天

X環(huán)境科學(xué)勞動保護(hù)

Z綜合性圖書

TEXTTEXT《中圖法》分類語言舉例

Q生物科學(xué)

Q1普通生物學(xué)

Q2細(xì)胞生物學(xué)

Q21細(xì)胞的形成與演化

Q23細(xì)胞遺傳學(xué)

Q24細(xì)胞形態(tài)學(xué)

Q25細(xì)胞生理學(xué)

Q26細(xì)胞生物化學(xué)

Q27細(xì)胞生物物理學(xué)

Q3遺傳學(xué)

Q4生理學(xué)

Q5生物化學(xué)

(2)主題檢索語言:

主題檢索語言是以詞語作為表達(dá)主題概念的標(biāo)識,按字順編排的檢索語言。標(biāo)題詞語言是最早使用的一種主題語言。它以規(guī)范化的自然語義作為標(biāo)識來表達(dá)文獻(xiàn)涉及的主題概念,表達(dá)主題的詞語稱為標(biāo)題。單元詞語言

是從文獻(xiàn)內(nèi)容中抽選出來的最基本的詞匯、將代表最一般、最基本的、不可再分割的概念的詞作為單獨標(biāo)引文獻(xiàn)的單位。敘詞語言

是從自然語言中優(yōu)選出來并經(jīng)過規(guī)范化處理的名詞術(shù)語。采用表示單元概念的規(guī)范化語詞的組配對文獻(xiàn)內(nèi)容主題進(jìn)行描述,也是目前使用最廣泛的主題語言。主題語言舉例:下例為EBSCO出版公司BusinessSource中選定“建議主題語”(據(jù)2008年數(shù)據(jù))(3)代碼檢索語言

就事物的某一方面特征,用某種代碼系統(tǒng)來加以標(biāo)引和排列,目前主要應(yīng)用于化學(xué)領(lǐng)域。例如?;衔锏姆肿邮剿饕到y(tǒng)、環(huán)狀化合物的環(huán)系索引系統(tǒng)等。3人工語言與自然語言的關(guān)系檢索效率管理成本用戶使用人工語言高高難度大自然語言低低更便捷人工語言和自然語言并不是互相對立的,比較成熟的檢索系統(tǒng),通常是兩種檢索語言并用,互為補(bǔ)充,以保證較高的檢索效率。第三節(jié):數(shù)據(jù)庫的構(gòu)成與信息檢索技術(shù)1數(shù)據(jù)庫的定義

至少由一種文檔(file)組成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的數(shù)據(jù)集合?!蓖ㄋ椎卣f,數(shù)據(jù)庫就是在計算機(jī)存儲設(shè)備上按一定方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。數(shù)據(jù)庫的構(gòu)成文檔記錄字段順排文檔倒排文檔

2數(shù)據(jù)庫的構(gòu)成記錄記錄字段字段2數(shù)據(jù)庫的構(gòu)成

文檔是書目數(shù)據(jù)庫和文獻(xiàn)檢索系統(tǒng)中數(shù)據(jù)組成的基本形式,是由若干個邏輯記錄構(gòu)成的信息集合。從數(shù)據(jù)庫的內(nèi)部結(jié)構(gòu)來看,通常一個數(shù)據(jù)庫至少包括一個順排文檔和一個倒排文檔。2數(shù)據(jù)庫的構(gòu)成記錄

是數(shù)據(jù)庫文檔的基本單元,是對某一實體屬性進(jìn)行描述的結(jié)果。一個數(shù)據(jù)庫可能包含幾千條甚至幾十萬條記錄。在全文數(shù)據(jù)庫中,一個記錄相當(dāng)于一篇完整的文獻(xiàn);在書目數(shù)據(jù)庫中,一個記錄相當(dāng)于一條文摘或題錄。2數(shù)據(jù)庫的構(gòu)成字段

字段是構(gòu)成記錄的最小信息單元。一條記錄包含著若干個字段。例如原始文獻(xiàn)的篇名、著者、文獻(xiàn)出處、出版時間、文摘、主題詞、語種等。數(shù)據(jù)庫記錄的著錄項目(字段)往往比手工檢索多得多,這就決定了計算機(jī)檢索能夠提供比手工檢索更豐富的檢索途徑。以中國期刊全文數(shù)據(jù)庫為例:【篇名】科技人員薪酬滿意度研究【英文篇名】EmpiricalResearchontheImpactFactorsofPaySatisfactionoftheScientificandTechnologicalPersonnel【作者】張俊琴;來鵬;【英文作者】ZhangJunqin;etal(SoutheastUniversity;Nanjing210096;China);【作者單位】東南大學(xué)經(jīng)濟(jì)管理學(xué)院;南京信息工程大學(xué)數(shù)理學(xué)院;【刊名】河海大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),JournalofHohaiUniversity(PhilosophyandSocialSciences),2008年04期

【關(guān)鍵詞】薪酬;滿意度;科技人員;【英文關(guān)鍵詞】pay;satisfaction;scientificandtechnologicalpersonnel;decision-tree;【摘要】薪酬滿意度是影響科技人員工作績效的重要因素。筆者基于中國科協(xié)"科技人員收入差距調(diào)查研究及政策建議"課題組對江蘇省科技人員的大范圍調(diào)查數(shù)據(jù),從薪酬的兩個維度(經(jīng)濟(jì)性薪酬和非經(jīng)濟(jì)性薪酬)研究科技人員薪酬滿意度的影響因素,并結(jié)合實證調(diào)研數(shù)據(jù)進(jìn)行了深入分析,探討提高薪酬滿意度及工作績效的政策建議?!居⑽恼縋aysatisfactionisanimportantfactorwhichhasimpactontheperformanceofscientificandtechnologicalpersonnel.BasedonthequestionnairesurveyofthescientificandtechnologicalpersonnelinJiangsuProvince,thispaperr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論