信息資源組織基礎(chǔ)ppt課件.ppt_第1頁(yè)
信息資源組織基礎(chǔ)ppt課件.ppt_第2頁(yè)
信息資源組織基礎(chǔ)ppt課件.ppt_第3頁(yè)
信息資源組織基礎(chǔ)ppt課件.ppt_第4頁(yè)
信息資源組織基礎(chǔ)ppt課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一講 信息資源組織基礎(chǔ),元數(shù)據(jù)與信息資源組織,1,啤酒與尿布的故事,美國(guó)沃爾瑪超市建立數(shù)據(jù)倉(cāng)庫(kù),按周期統(tǒng)計(jì)產(chǎn)品的銷(xiāo)售信息,經(jīng)過(guò)科學(xué)建模后提煉決策層數(shù)據(jù)。結(jié)果,他們發(fā)現(xiàn):每逢周末,位于某地區(qū)的沃爾瑪超市連鎖店的啤酒和尿布的銷(xiāo)售量很大,而且單張發(fā)票中同時(shí)購(gòu)買(mǎi)尿布和啤酒的記錄非常普遍。分析人員經(jīng)過(guò)深入分析得知,通常周末購(gòu)買(mǎi)尿布的是男士,他們?cè)谕瓿闪颂唤o的任務(wù)后,經(jīng)常會(huì)順便買(mǎi)一些啤酒。得出這樣的結(jié)果后,沃爾瑪超市的工作人員嘗試著將啤酒和尿布擺放在一起銷(xiāo)售,結(jié)果,尿布與啤酒的銷(xiāo)售額雙雙增長(zhǎng) 。,2,生活中的信息組織,你怎么組織你的 書(shū)籍或資料 衣物或任何其他生活雜物 電腦文件 大腦中的信息,3,你

2、怎么組織,藏書(shū) 按用途:興趣愛(ài)好的(小說(shuō)、旅游、烹調(diào)),學(xué)習(xí)類的,收藏類,工具書(shū)類 按載體:刊物、報(bào)紙、圖書(shū)、畫(huà)冊(cè) 按學(xué)科或?qū)n}:(藏書(shū)家) ,4,你怎么整理,CD/DVD 按類型:古典、流行、爵士、藍(lán)調(diào).或故事片、文藝片、MTV、動(dòng)畫(huà)片、紀(jì)錄片; 按人物:貝多芬、柴可夫斯基或布魯斯威利斯、李連杰、007 綜合方法 ,5,你怎么整理,衣物 類型; 季節(jié); 面料; 喜歡程度; 上述綜合,6,你怎么整理,計(jì)算機(jī)文件? 你頭腦中的信息?,7,總結(jié),分類方法是人類最本能認(rèn)識(shí)世界的方法,因而也應(yīng)用于任何資源的組織; 按使用方便(多數(shù)是內(nèi)容)分類而不是按物理順序(或字順等)排列; 用于類分事物的性質(zhì)叫做“

3、屬性”,試行分內(nèi)部屬性和外部屬性; 不作索引或簡(jiǎn)單的書(shū)本式索引; 憑記憶查找,因而強(qiáng)調(diào)助記性。,8,總結(jié):信息資源組織常用方法,分類法 主題法 字順?lè)?號(hào)碼法(賦予號(hào)碼后的字順?lè)ǎ?時(shí)空法(例如大事記,年鑒等) 序列法(大小/多少/好壞/貴賤) 超文本法(鏈接法),9,相關(guān)因素,信息資源組織與下列因素有關(guān): 信息資源組織的對(duì)象是什么? 信息資源組織的目的是什么? 信息資源組織對(duì)象有什么顯著特性? 如何更方便的使用(達(dá)到目的),10,第二章信息資源組織的基本問(wèn)題,11,基本問(wèn)題,什么是信息? 什么是信息資源? 什么是信息資源組織? 信息資源組織的對(duì)象是什么?(數(shù)據(jù)、信息、知識(shí)、智慧及其他相關(guān)概念

4、的關(guān)系是什么?) 信息資源組織的目的是什么? 信息資源組織的相關(guān)應(yīng)用領(lǐng)域 傳統(tǒng)圖書(shū)館(博物館/檔案館)的信息資源組織 現(xiàn)代信息資源組織面臨的問(wèn)題與挑戰(zhàn),12,數(shù)據(jù):離散、互不關(guān)聯(lián)的客觀事實(shí),孤立的文字、數(shù)據(jù)和符號(hào),缺乏關(guān)聯(lián)和目的性 信息:人們對(duì)數(shù)據(jù)進(jìn)行系統(tǒng)組織、整理和分析,使其產(chǎn)生相關(guān)性,但沒(méi)有與特定用戶行動(dòng)相關(guān)聯(lián) 知識(shí):與行動(dòng)和決策密切相關(guān),人們做決策的行動(dòng)能力,知識(shí)創(chuàng)造與環(huán)境相關(guān) 智慧:對(duì)事務(wù)發(fā)展的前瞻性看法,智慧得益于人的內(nèi)在價(jià)值觀和信仰,什么是數(shù)據(jù)、信息、知識(shí)、智慧,13,什么是數(shù)據(jù)、信息、知識(shí)、智慧,Data:數(shù)據(jù)= 沒(méi)有加工的事實(shí)數(shù)據(jù) 對(duì)應(yīng)于人、物理對(duì)象、事件或其它實(shí)體的原始事實(shí)。

5、 單獨(dú)的數(shù)據(jù)沒(méi)有意義 計(jì)算機(jī)中表示為數(shù)字或其它符號(hào)形式(不僅是數(shù)字形式。Number強(qiáng)調(diào)數(shù)字的內(nèi)容,Digital強(qiáng)調(diào)數(shù)的形式) 例如10000 Information:信息= 數(shù)據(jù)+語(yǔ)境 將數(shù)據(jù)放到一個(gè)語(yǔ)境(context)中,從而給予它一定的含義,它就成為信息 經(jīng)過(guò)處理的有用的數(shù)據(jù),用來(lái)回答Who/What/Where/When的問(wèn)題 信息是經(jīng)人組織的數(shù)據(jù)組成 例如¥10000 Knowledge:知識(shí)= 信息+判斷 是一種由人創(chuàng)造的,并且反映他們是如何來(lái)進(jìn)行判斷、選擇并且采取行動(dòng)的know-how,知識(shí)一般與人們所受的教育、經(jīng)驗(yàn)、思考方法、決策及其他能力相關(guān)。 信息被閱讀、告知或可視與理

6、解等等 例如¥10000是上海外環(huán)線附近2005年房產(chǎn)的單價(jià) Wisdom:智慧= 知識(shí)+整合 對(duì)知識(shí)進(jìn)行組合、創(chuàng)造以及理解知識(shí)要義的能力 Wisdom is not a product of schooling but of the lifelong attempt to acquire it. (Albert Einstein) 例如”以¥10000的單價(jià)購(gòu)買(mǎi)外環(huán)線的房子肯定虧本” 文獻(xiàn)Document:記錄有知識(shí)的一切載體。信息資源的一種形式;,14,其他有關(guān)信息的定義,信息如同反饋指機(jī)器利用其行為造成的結(jié)果作為自適應(yīng)信息以調(diào)整自身,作為正在進(jìn)行的過(guò)程的一個(gè)部分 維納控制論1949年In

7、formation as feedback-the ability of a machine to use the results of its own performance as self-regulating information and adjust itself as part of its ongoing process -Norbert Weiner, Cybernetics, 1949 信息是能夠被編碼而通過(guò)連接信源和信宿的通道進(jìn)行傳輸?shù)臇|西申農(nóng)1949年Information is whatever can be coded for transmission through

8、 a mechanical channel connecting a source with a receiver-Shannon, 1949 “Information is commonly used to denote some population of objects to which some significant probability of being usefully informative in the future has been attributed.” - Buckland, 1991. Unlike knowledge or belief “the concept

9、 of information has connotations of neutrality-it is homogeneous and noncontroversial. The reality, of course, is more complicated”-Agre, 1995 信息是負(fù)熵(申農(nóng)信息論),15,什么是知識(shí)?,知識(shí)是能夠指導(dǎo)思考、行為和交流的正確和真實(shí)的觀察、經(jīng)驗(yàn)和過(guò)程的總結(jié)。知識(shí)包含真理和信念,觀點(diǎn)和概念,判斷和預(yù)期,方法和訣竅等內(nèi)容,也可以理解為用于解決問(wèn)題的結(jié)構(gòu)化信息。,16,Worlds of Knowledge (from Poppers Objective Kn

10、owledge),World 1 is the physical world World 2 is subjective knowledge or experience-mental states and processes. World 3 is objective knowledge-recorded knowledge, public knowledge-created by people.,17,Knowledge Hierarchy, Source: Karl Sveiby, Tacit Knowledge in KM Yearbook 1999-2000 ,18,數(shù)據(jù)、信息、知識(shí)、

11、智慧之間的關(guān)系,19,知識(shí)的類型,事實(shí)知識(shí)(Know-what) 原理知識(shí)(Know-why) 技能知識(shí)(Know-how) 人力知識(shí)(know-who) 檢索知識(shí)( know-where ),20,再舉一例,“8,000 和 10,000- 數(shù)據(jù) 10,000 米的高山與 8,000 米的飛機(jī)飛行最大高度 是信息 “飛機(jī)無(wú)法飛越這座高山” 是知識(shí) 必須飛得比地形高 是智慧,21,什么是信息資源,信息資源即“作為資源的信息”,可以理解為有價(jià)值的信息。然而信息的價(jià)值是體現(xiàn)在使用中的,對(duì)于不同的使用者,信息可以有不同的價(jià)值,而且信息的不同組合、不同的關(guān)聯(lián)也能使信息具有不同的價(jià)值。這反映了信息的特性

12、:信息是具有語(yǔ)境(context,也譯成“上下文”)的數(shù)據(jù)。 從計(jì)算機(jī)操作的角度來(lái)看,“信息資源是具有標(biāo)識(shí)的任何東西”。其價(jià)值由用戶去判斷。信息資源組織的目的就是以靈活的方式揭示信息之間的關(guān)聯(lián)(包括結(jié)構(gòu)關(guān)聯(lián)和語(yǔ)義關(guān)聯(lián)),滿足不同用戶的需要,使其成為“資源”。 世間萬(wàn)物,只要人能夠識(shí)別出來(lái)的東西,給它一個(gè)標(biāo)識(shí)(最常用的標(biāo)識(shí)就是名稱),它就成了“資源” 作為元數(shù)據(jù)描述的對(duì)象,DCMI和W3C強(qiáng)調(diào),其“資源”只是在互聯(lián)網(wǎng)上,由命名域給出URI標(biāo)識(shí)的實(shí)體。,22,什么是信息資源組織?,即信息資源的有序化的活動(dòng):對(duì)于信息資源有序化的規(guī)律的認(rèn)識(shí),以及應(yīng)用認(rèn)識(shí)得來(lái)的規(guī)律從事有序化工作 知識(shí)組織=信息資源組織

13、 利用一定科學(xué)規(guī)則和方法,通過(guò)對(duì)信息外在特征和內(nèi)容特征的描述和序化,實(shí)現(xiàn)無(wú)需信息流向有序信息流的轉(zhuǎn)換,從而保證用戶對(duì)信息的有效獲取和利用及信息的有效流通和組合。 信息的外在特征:信息的(物質(zhì))載體所直接反應(yīng)的特征; 信息的內(nèi)容特征:信息所包含和承載的具體內(nèi)容,即通過(guò)信息載體所傳遞和交流的具體內(nèi)容。,23,信息資源組織的目的,查找Find 標(biāo)識(shí)Identify 選擇Select 獲取Obtain,24,信息資源組織體系,根據(jù)對(duì)象區(qū)分信息組織的不同領(lǐng)域: 哲學(xué)認(rèn)識(shí)論以知識(shí)的抽象本質(zhì)組織知識(shí); 圖書(shū)情報(bào)機(jī)構(gòu)傳統(tǒng)上結(jié)合實(shí)物載體組織信息資源; 數(shù)字圖書(shū)館以數(shù)字化的信息形式組織資源; 情報(bào)檢索系統(tǒng)可以看成

14、是DL中的一個(gè)部分,通過(guò)數(shù)字化信息內(nèi)容的各種結(jié)構(gòu)組織資源, 人為標(biāo)注的結(jié)構(gòu); 本身的結(jié)構(gòu)被人發(fā)現(xiàn)而利用; 企業(yè)知識(shí)管理圍繞企業(yè)管理中信息的利用組織資源; 搜索引擎的信息組織; 語(yǔ)義萬(wàn)維網(wǎng)中的信息組織; 其他各種領(lǐng)域知識(shí)根據(jù)領(lǐng)域的特點(diǎn)組織知識(shí),25,圖書(shū)館的信息資源組織,圖書(shū)館學(xué)的目的宗旨:信息資源整序 圖書(shū)館工作的組成(采分編典流)的目的 主要方法: 目錄學(xué)(關(guān)于傳統(tǒng)圖書(shū)館信息組織的科學(xué)) 分類法 主題法 文摘與索引 圖書(shū)編目 無(wú)數(shù)的經(jīng)驗(yàn),26,圖書(shū)館如何組織/整理圖書(shū)?,由于數(shù)量和體積龐大,引入圖書(shū)代用品:目錄卡片;(書(shū)、卡的分離圖書(shū)館管理上的一大進(jìn)步。博物館、檔案館等任何涉及載體管理的機(jī)構(gòu)

15、莫不如此) 泥版、羊皮卷、紙莎草、竹簡(jiǎn)乃至半導(dǎo)體零件、各類倉(cāng)儲(chǔ)物資,在計(jì)算機(jī)發(fā)明之前,卡片目錄是最先進(jìn)管理方式。其意義甚至不亞于結(jié)繩記事、文字發(fā)明、書(shū)籍產(chǎn)生 目錄是館藏的縮影和“代用品”;為了達(dá)到方便存取的目的,多套目錄卡片提供多種查詢途徑; 圖書(shū)采取唯一方式排架,目錄卡片指引到唯一的圖書(shū)排架號(hào); 每種途徑反映了圖書(shū)的某一屬性,例如先按載體類型或語(yǔ)種分,再按學(xué)科分類,或其他屬性分,如著者目錄; 卡片目錄/圖書(shū)典藏的排列是分類與字順等多種方式的結(jié)合; 目錄卡片的種類有限,不可能窮盡用戶認(rèn)識(shí)的角度和使用需求與習(xí)慣; 圖書(shū)是知識(shí)的載體,部分目錄反映館藏知識(shí)體系,圖書(shū)館通過(guò)管理知識(shí)載體,間接地整理知識(shí)

16、。,27,圖書(shū)館的信息資源組織(續(xù)),連續(xù)出版物有一點(diǎn)不同 二次文獻(xiàn)(情報(bào))服務(wù)有很大不同 電子資源使傳統(tǒng)圖書(shū)館的信息組織方寸大亂,28,信息資源組織面臨的數(shù)字環(huán)境,傳統(tǒng)情報(bào)檢索的挑戰(zhàn) 處理單元變?yōu)椤扒閳?bào)載體”:期刊論文、科研報(bào)告、報(bào)紙文章、專利文獻(xiàn); 解決方案:文獻(xiàn)數(shù)據(jù)庫(kù)+原文提供; 數(shù)字化浪潮的挑戰(zhàn) 處理單元復(fù)雜化,包含書(shū)本、期刊、論文、報(bào)告、以及“事實(shí)”、“數(shù)據(jù)”(傳統(tǒng)的事實(shí)數(shù)據(jù)以工具書(shū)形式存在) 并且需要整合利用 需要研究信息/知識(shí)整個(gè)生命周期的完整過(guò)程,甚至包括部分認(rèn)知過(guò)程 需要從數(shù)據(jù)、信息層面上升到“知識(shí)”層面 這個(gè)過(guò)程是正在進(jìn)行時(shí),隨著技術(shù)的發(fā)展正在變化。,29,Collecti

17、ons grid 信息資源類型,high,low,low,high,Stewardship 權(quán)威性,Uniqueness 稀缺性,Books Journals Newspapers Gov. docs CD, DVD Maps Scores,Special collectionsArchives Rare books Local history materials Archives & Manuscripts Theses & dissertations,Freely-accessible web resources,Research and learning materials ePrint

18、s/tech reports Learning objects Courseware E-portfolios Research data Untransferred records,From: Lorcan Dempsey,30,Web上的信息,Google當(dāng)前索引80多億網(wǎng)頁(yè),每天平均收到2000萬(wàn)個(gè)查詢。 中國(guó)的公開(kāi)網(wǎng)頁(yè)在3-4億,百度每天大概收到500萬(wàn)個(gè)查詢 每篇網(wǎng)頁(yè)的平均大小在12KB左右,于是總共約40TB容量(10年) 人類的1億種書(shū),每本算10萬(wàn)字,200KB,總共約20TB容量。(5000年),31,搜索引擎,搜索引擎(Search Engines)是對(duì)互聯(lián)網(wǎng)上的信息資源(

19、主要是網(wǎng)頁(yè))進(jìn)行搜集整理,然后提供查詢服務(wù)的系統(tǒng),通常包括信息搜集、信息整理和用戶查詢?nèi)糠?,但提供給用戶的往往只是一個(gè)查詢界面。 兩類搜索服務(wù) Google Yahoo,32,網(wǎng)絡(luò)信息資源的挑戰(zhàn),數(shù)量巨大 沒(méi)有一個(gè)搜索引擎能夠覆蓋萬(wàn)維網(wǎng)的16% 網(wǎng)站; 所有搜索引擎加起來(lái)覆蓋了萬(wàn)維網(wǎng)的42% 極端異質(zhì) 信息值不同 長(zhǎng)度不同 語(yǔ)法或輸入錯(cuò)誤 內(nèi)容錯(cuò)誤、過(guò)時(shí)或不可靠 多種格式 多語(yǔ)種 速度問(wèn)題 每分鐘需要接受15,000 20,000次查詢請(qǐng)求,33,數(shù)字化信息量舉例,音樂(lè)作品(莫扎特):約100MB 報(bào)紙(華爾街雜志):100MB/年(文本) 卡片目錄(美國(guó)國(guó)會(huì)圖書(shū)館):17GB 廣播(WAB

20、C) :270GB/年(未經(jīng)壓縮) 網(wǎng)絡(luò)論壇(Netnews):300GB/年 地區(qū)圖書(shū)館(加州大學(xué)圖書(shū)館):1.4TB(圖書(shū)掃描版) Internet出版(WWW):1997年約4TB 電視(CNN新聞):1GB/1小時(shí), 6TB/年(經(jīng)壓縮) 錄像帶出租(Blockbuster Video):9TB 科研圖書(shū)館(美國(guó)會(huì)圖書(shū)館):全部圖書(shū)館數(shù)字化20TB 來(lái)源:美國(guó)伯克利加州大學(xué)教授Peter Lyman和Alex Internet公司總裁Brewster Kahle所著文化制品數(shù)字化存檔行動(dòng)綱要。,34,信息檢索的問(wèn)題,查找非結(jié)構(gòu)信息有困難 多數(shù)數(shù)據(jù)庫(kù)在結(jié)構(gòu)化字段上工作 多數(shù)商業(yè)信息是非結(jié)構(gòu)化的. 報(bào)告、電子郵件、來(lái)往公函 . 美國(guó)商業(yè)每年產(chǎn)生4500億份文件 波音747文件比飛機(jī)重量還重 索引是主觀的 索引者之間不一致, 經(jīng)驗(yàn)統(tǒng)計(jì)表明索引者之間僅20% 相同. 作者與索引者之間、檢索者與用戶之間不一致. 信息超載 信息太多

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論