第1章 信息組織引論.ppt_第1頁
第1章 信息組織引論.ppt_第2頁
第1章 信息組織引論.ppt_第3頁
第1章 信息組織引論.ppt_第4頁
第1章 信息組織引論.ppt_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余42頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第1章 信息組織引論,1.1 信息資源在知識經(jīng)濟(jì)中的地位與作用,信息:是物質(zhì)存在的一種方式、形態(tài)或運(yùn)動狀態(tài),是標(biāo)記在通訊系統(tǒng)中的信號,是構(gòu)成知識的原料。 信息與物資、能源已成為現(xiàn)代社會的三大支柱。,1.1.1 信息在我國經(jīng)濟(jì)和社會發(fā)展中的作用,哈佛大學(xué)的丹尼爾提出“后工業(yè)社會”的概念(信息社會)(前工業(yè)社會依靠原始勞動力并從自然界提取初級資源;工業(yè)社會圍繞生產(chǎn)和機(jī)器這個(gè)軸心并為制造商品而組織起來;后工業(yè)社會圍繞知識組織起來)。 上世紀(jì)八十年代托夫勒預(yù)言:隨著西方社會進(jìn)入信息時(shí)代,社會的主宰力量將由金錢轉(zhuǎn)向知識。,? =,1.1.2 信息組織在信息資源開發(fā)中的地位與作用,現(xiàn)代信息技術(shù)的發(fā)展,導(dǎo)致

2、信息量急劇增長。人類面對兩個(gè)新問題,即: 知識和信息的海量性和無限性與人的精力、時(shí)間的有限性形成了尖銳的矛盾; 知識和信息的無序性和污染性與人類使用的選擇性同樣是尖銳的對立。 失去控制和無組織的信息不再是一種資源。 信息組織是信息資源建設(shè)的中心環(huán)節(jié),是建立信息系統(tǒng)的重要條件,是信息檢索與咨詢的基礎(chǔ),是開展用戶服務(wù)的有力保證。,1.1.3 信息組織的驅(qū)動力-信息環(huán)境,信息爆炸 信息超載 信息的特性:越消費(fèi)越多 梅特卡夫定律:隨著上網(wǎng)人數(shù)的增長,網(wǎng)上資源將呈幾何級數(shù)的增長。 信息污染嚴(yán)重(垃圾信息、虛假信息、冗余信息、反動信息等),1.1.3 信息組織的驅(qū)動力-信息檢索需求的多樣化,文獻(xiàn)檢索(以文

3、獻(xiàn)為檢索對象,檢索到文獻(xiàn)線索或原文) 數(shù)據(jù)檢索(以數(shù)值或圖表形式表示的數(shù)據(jù)為檢索對象) 事實(shí)檢索(以從文獻(xiàn)中抽取的事項(xiàng)為檢索內(nèi)容??赏ㄟ^人工或自動抽取事實(shí)形成資源庫,例如:公交線路搜索,名人事跡搜索, 事實(shí)抽取,組織與檢索 總的說來,信息檢索需求向著個(gè)性化、用戶情景敏感、以知識而不是信息為檢索單元、信息之間的關(guān)系檢索等方向發(fā)展,1.1.3 信息組織的驅(qū)動力-信息檢索機(jī)制的變化,手工檢索 聯(lián)機(jī)檢索 例如:redwood(3n)deck?(s)(swimming(w)pool?) 網(wǎng)絡(luò)檢索 信息檢索機(jī)制的變化源于信息組織方式的變化,也影響到信息組織的發(fā)展。,1.1.3 信息組織的驅(qū)動力-信息檢索工

4、具的變化,按加工信息的手段分為: 手工檢索工具(目錄、索引) 機(jī)械檢索工具(卡片分揀等) 計(jì)算機(jī)檢索工具(檢索系統(tǒng)、數(shù)據(jù)庫) 按載體形式分為: 書本型 卡片型 縮微型 磁性材料型 光盤型,1.1.3 信息組織的驅(qū)動力-信息檢索工具的變化,網(wǎng)絡(luò)檢索工具按檢索機(jī)制分: 檢索型 目錄型 混合型(例如:yahoo、intute等) 按數(shù)據(jù)內(nèi)容分: 綜合型 專題型(例如:博客檢索、專業(yè)檢索) 特殊型(圖片、地圖、ftp等) 按是否組織數(shù)據(jù)分: 單獨(dú)型檢索工具 集合型檢索工具(例如dogpile、,1.1.3 信息組織的驅(qū)動力-信息檢索技術(shù)的進(jìn)步,網(wǎng)絡(luò)檢索結(jié)合多種技術(shù)(布爾檢索、截詞檢索、鄰近檢索、短語檢

5、索、字段檢索、區(qū)分大小寫檢索、限制檢索、二次檢索、自然語言檢索、多語種檢索等) AltaVista的翻譯檢索( 例如:檢索“人民”),內(nèi)容提要,什么是信息組織? 為什么要進(jìn)行信息組織? 如何進(jìn)行信息組織? 思想 方法 技術(shù)手段,什么是信息組織,信息組織,也叫信息整序,是利用一定的規(guī)則、方法和技術(shù)對信息的外部特征和內(nèi)容特征進(jìn)行揭示和描述,并按給定的參數(shù)和序列公式排列,使信息從無序集合轉(zhuǎn)換為有序集合的過程。 外部特征:信息的物理載體直接反映的信息對象,構(gòu)成信息的外在的、形式的特征(題名、作者、出版社、日期等) 內(nèi)部特征:信息包含的內(nèi)容,由主題詞、關(guān)鍵詞或其它知識單元表達(dá),什么是信息組織?,信息組織

6、的基本內(nèi)容,信息選擇 從采集到的無序的信息流中甄別出有用的信息,剔除無 用信息 信息分析 按一定邏輯關(guān)系對選擇過的信息內(nèi)、外部特征進(jìn)行細(xì)化、挖掘、加工整理并歸類,信息描述和揭示 根據(jù)信息組織和檢索的需要,對信息的主題內(nèi)容、形式 特征、物質(zhì)形態(tài)等進(jìn)行分析和記錄 信息存儲 將經(jīng)過加工整理序化后的信息按一定格式與順序存儲在 特定的載體中,信息組織的基本內(nèi)容,信息組織的類型,按信息表現(xiàn)形式劃分 文字信息組織、圖像信息組織、 聲音信息組織、視頻信息組織 按信息加工程度劃分 一次信息組織、二次信息組織、三次信息組織 按信息的傳播載體劃分 文獻(xiàn)信息組織、非文獻(xiàn)信息組織,信息組織的理論基礎(chǔ),語言學(xué) 組織符號系

7、統(tǒng)(語法、詞匯) 邏輯學(xué) 演繹推理、歸納推理、綜合、分析 知識分類 知識體系結(jié)構(gòu),圖書館的信息組織,物理陳列:分類號、索書號、上架、更新,圖書館的信息組織,館藏書目檢索庫 題名、作者、出版時(shí)間、分類號、 國際標(biāo)準(zhǔn)書號、索書號、主題詞,信息組織的兩大思想,1、分類方法 根據(jù)信息的學(xué)科體系特征來序列信息的一種方法 體系、類目關(guān)系 中國圖書館分類法 2、主題方法 根據(jù)文獻(xiàn)主題特征來組織排列信息的一種方法, 由受控的自然語言語詞直接表達(dá)主題概念,應(yīng)用 分類法: Yahoo分類目錄 門戶網(wǎng)站分類頻道 分類搜索瀏覽 主題法: 百度,Google 搜索引擎,信息組織的兩大思想,比較分析 分類法系統(tǒng)性強(qiáng),滿足

8、族性檢索,符合人們的思維與檢索習(xí)慣,分類目錄瀏覽 主題法直觀,滿足特性檢索,提供了一種直接面向?qū)ο?、事?shí)或概念的信息組織方法,信息組織的兩大思想,3、分類主題一體化 族性檢索與特性檢索相結(jié)合 搜索引擎在分類檢索的同時(shí)添加了關(guān)鍵詞索引手 段,而一些主題檢索的搜索引擎也輔助以分類索引 功能 CNKI中的組織法 搜索引擎的分類搜索,信息組織的兩大思想,信息的描述與揭示工具,1、過程 著錄:編制文獻(xiàn)目錄時(shí),對文獻(xiàn)內(nèi)容和形式特征 進(jìn)行分析、選擇和記錄的過程 標(biāo)引:指分析文獻(xiàn)的內(nèi)容屬性及相關(guān)外表屬性, 并用特定語言表達(dá)分析出的屬性或特征,從而賦 予文獻(xiàn)檢索標(biāo)識的過程,2、工具 語言標(biāo)識系統(tǒng) 標(biāo)引語言 分類

9、語言:用分類號表達(dá)主題概念,依據(jù)知識分 類將主題概念組織、排列成類目體系,主要以類 目體系的自身結(jié)構(gòu)顯示概念之間關(guān)系的標(biāo)引語言 主題語言:由受控的自然語言直接表達(dá)主題概 念,按語詞字順排列主題概念,主要用參照顯示 概念之間關(guān)系的標(biāo)引語言,信息的描述與揭示工具,網(wǎng)絡(luò)信息組織,1、元數(shù)據(jù)(metadata) 關(guān)于數(shù)據(jù)的數(shù)據(jù)(data about data) 元數(shù)據(jù)(Medadata)是組織信息的基本工具,是為標(biāo)引和著錄網(wǎng)上信息資源而產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù),它是用來描述網(wǎng)上信息資源,加強(qiáng)對網(wǎng)上信息資源的搜集、開發(fā)、組織與利用的網(wǎng)絡(luò)數(shù)據(jù)集合元數(shù)據(jù)是組織數(shù)據(jù)、各種數(shù)據(jù)域及它們之間相互關(guān)系的信息,1、元數(shù)據(jù) 數(shù)

10、據(jù)類型 元素名稱 (Element names) 元素描述( Element description) 元素標(biāo)識( Element representation) 元素代碼( Element coding) 元素語義( Element semantics) 元素分類( Element classification),網(wǎng)絡(luò)信息組織,2、網(wǎng)絡(luò)信息資源描述的相關(guān)標(biāo)準(zhǔn) (1)MARC(Machine Readable Catalogue),機(jī)器可讀 目錄,是一種計(jì)算機(jī)能夠識別和閱讀的目錄 特點(diǎn):伸縮性強(qiáng),適應(yīng)面廣 包括001999個(gè)字段 字段內(nèi)容著錄詳盡,作用強(qiáng)化 USMARC(美國國會圖書館機(jī)讀目錄

11、通信格式) UNIMARC(國際機(jī)讀目錄通信格式) CNMARC(中國機(jī)讀目錄格式),網(wǎng)絡(luò)信息組織,2、網(wǎng)絡(luò)信息資源描述的相關(guān)標(biāo)準(zhǔn) (2)Dublin Core(都柏林核心集),描述網(wǎng)絡(luò)信息資 源的一種簡單元數(shù)據(jù),其目的是提供一種 Internet資源的描述規(guī)范,以便發(fā)掘西文電子資 源,包括15個(gè)數(shù)據(jù)單元(element) 特點(diǎn): 通俗易懂,運(yùn)用靈活,國際通用,可擴(kuò)展性,網(wǎng)絡(luò)信息組織,2、網(wǎng)絡(luò)信息資源描述的相關(guān)標(biāo)準(zhǔn) (3)通用標(biāo)記語言 通用置標(biāo)語言標(biāo)準(zhǔn) SGML (Standard Generalized Markup Language) 超文本置標(biāo)語言 HTML( Hyper-text Ma

12、rkup Language) 可擴(kuò)展的置標(biāo)語言 XML (eXtensible Markup Language),網(wǎng)絡(luò)信息組織,3、技術(shù)與方法 a.文件方式:適用于非結(jié)構(gòu)化信息,不涉及信息 之間的內(nèi)在邏輯聯(lián)系,無法處理海量信息 b.數(shù)據(jù)庫方式:將所有已獲得的網(wǎng)絡(luò)信息資源以 固定的記錄格式存貯,用戶通過關(guān)鍵詞及其組 配查詢,網(wǎng)絡(luò)信息組織,3、技術(shù)與方法 c.主題樹方式:按事先確定的概念體系結(jié)構(gòu)分類進(jìn) 行組織,用戶以瀏覽方式層層遍歷 d.超媒體方式:超文本多媒體 資源形成網(wǎng)狀結(jié)構(gòu) 如網(wǎng)絡(luò)過于龐雜和復(fù)雜,用戶易迷航,網(wǎng)絡(luò)信息組織,知識組織,知識組織 狹義:文獻(xiàn)的分類、標(biāo)引、編目、文摘、索引等 廣義:針對知識的兩要素進(jìn)行組織,知識因子(結(jié) 點(diǎn))的有序化和知識關(guān)聯(lián)(結(jié)點(diǎn)間的聯(lián)系) 布魯克斯提出的“知識地圖”: 對文獻(xiàn)內(nèi)容進(jìn)行知識分析與組織,找到人們在知識創(chuàng) 造過程中相互影響及聯(lián)系的結(jié)點(diǎn),從而深入揭示知識的有 機(jī)結(jié)構(gòu),為用戶提供情報(bào)。,學(xué)科知識地圖,Don R. Swanson基于非相關(guān)文獻(xiàn)的知識發(fā)現(xiàn),知識組織的技術(shù)與方法,客觀知識組織的基本工具: 分類法、主題法 主觀知識組織的工具: 數(shù)據(jù)倉庫、知識挖掘(DM,Data Mining)、 數(shù)據(jù)庫中的知識發(fā)現(xiàn)(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論