數(shù)字圖書館與元數(shù)據(jù)及多媒體_第1頁
數(shù)字圖書館與元數(shù)據(jù)及多媒體_第2頁
數(shù)字圖書館與元數(shù)據(jù)及多媒體_第3頁
數(shù)字圖書館與元數(shù)據(jù)及多媒體_第4頁
數(shù)字圖書館與元數(shù)據(jù)及多媒體_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)字圖書館與元數(shù)據(jù)上海圖書館系統(tǒng)網(wǎng)絡(luò)中心 趙亮概念與要點數(shù)字圖書館的定義從不同的概念演化而來電子圖書館、網(wǎng)絡(luò)圖書館、虛擬圖書館、沒有圍墻的圖書館、圖書館數(shù)字化等等尚無一個全球范圍公認(rèn)的定義數(shù)字圖書館的定義定義一:利用數(shù)字技術(shù)獲取、存儲、存取、發(fā)布信息的圖書館定義二:數(shù)字圖書館為國家信息根底設(shè)備提供關(guān)鍵性信息管理技術(shù),同時提供其主要的信息庫和資源庫。換句話說,數(shù)字圖書館是國家信息根底設(shè)備的中心。數(shù)字圖書館的定義美國研討圖書館協(xié)會的定義1、 數(shù)字圖書館并不是一個單一的實體;2、 數(shù)字圖書館需求技術(shù)支持;鏈接許多信息資源;3、 多個數(shù)字圖書館及信息機構(gòu)之間的鏈接對終端用戶透明;4、 全球范圍的對數(shù)字

2、圖書館與信息效力的獲取是一個目的;5、 數(shù)字圖書館的收藏不僅限于文獻(xiàn)的替身,她還把不能以印刷方式替代和傳播的人工印刷品數(shù)字化,加以收藏。DefinitionThe digital library is not a single entityThe digital library requires technology to link the resources of manyThe linkages between the many digital libraries and information services are transparent to the end usersUniver

3、sal access to digital libraries and information services is a goalDigital library collections are not limited to document surrogates: they extend to digital artifacts that cannot be represented or distributed in printed formats(ARL, 1995)數(shù)字圖書館的定義中國數(shù)圖工程規(guī)劃的定義:是采用現(xiàn)代高新技術(shù)所支持的數(shù)字信息資源系統(tǒng),將成為下一代互聯(lián)網(wǎng)網(wǎng)上信息資源的管理方式

4、,可從根本上改動目前網(wǎng)上信息分散、不便運用的現(xiàn)狀??梢哉f,數(shù)字圖書館是運轉(zhuǎn)在互聯(lián)網(wǎng)上超大規(guī)模的、便于運用的、沒有時空限制的知識中心。數(shù)字圖書館的要點數(shù)字化資源(多媒體)網(wǎng)絡(luò)化分布化的體系構(gòu)造一致的透明的用戶接口全球化非單一實體元數(shù)據(jù)與對象管理新的效力體系與方式數(shù)字圖書館的構(gòu)造KW構(gòu)造數(shù)字對象Digital Object)鍵元數(shù)據(jù)、數(shù)字資料、調(diào)度碼數(shù)字對象倉庫(Repositories)元對象Meta Object)圖書館自動化系統(tǒng)管理/效力方式書刊資料庫物理館藏書目索引等二次文獻(xiàn)圖書館管員讀者 圖書館自動化系統(tǒng)人工獲取索引與對象間無完好性保證數(shù)字圖書館的構(gòu)造-IBM 檢索數(shù)據(jù) (Search

5、Data)LibraryServer 查詢(SEARCH)訪問入口客戶端(ACCESSClient) 存儲(STORE) 對象內(nèi)容(Content Objects)IBMDigitalLibrary讀者光盤庫或磁帶庫數(shù)字圖書館的構(gòu)造體系國家圖書館數(shù)字圖書館的實際國際數(shù)字圖書館先導(dǎo)方案DLI 1、2美國回想和美國國家數(shù)字圖書館方案NDLP國內(nèi)中國實驗型數(shù)字圖書館工程中國數(shù)字圖書館工程美國DLI方案由美國科學(xué)基金會NSF、國防部高等技術(shù)開發(fā)署DARPA、美國航空航天總署NASA等單位結(jié)合資助DLI-1 ($24M, 1994.91998.9)DLI-2 ($40M$50M, 19992003)環(huán)境

6、規(guī)劃與多媒體信息系統(tǒng)加州大學(xué)伯克利分校圖象和空間參考信息綜合效力的分布式數(shù)字圖書館加州大學(xué)圣巴巴拉分校集成聲音、圖象和言語了解技術(shù), 創(chuàng)建和搜索數(shù)字視頻圖書館-Informedia(卡內(nèi)基梅隆大學(xué)) 綜合性科學(xué)文獻(xiàn)數(shù)字圖書館(伊利諾大學(xué)厄爾巴那分校)智能信息搜索引擎密歇根大學(xué)各類數(shù)字圖書館網(wǎng)絡(luò)綜合集成機制-InfoBus (斯坦福大學(xué))DLI1研討工程DLI-2在規(guī)模、范圍、內(nèi)容和方向上的顯著變化受資助單位大幅度添加在過去純研討的風(fēng)格外,添加了面向?qū)嵺`問題的研討和開發(fā)除保管了傳統(tǒng)的體系構(gòu)造、信息檢索、互操作主題之外,一些新的研討主題遭到關(guān)注,如:信息保藏、添加聲音、建立和維護(hù)數(shù)字圖書館的實踐問

7、題、與醫(yī)療有關(guān)的電子病歷、醫(yī)學(xué)圖象等與情報學(xué)的聯(lián)絡(luò)親密地理信息核醫(yī)學(xué)情報是眾多工程的交匯點美國回想與NDLP方案美國回想American Memory由美國國會圖書館實施,主要內(nèi)容為特征歷史資源數(shù)字化。1989-1995)美國國家數(shù)字圖書館工程NDLP是美國回想的后續(xù)工程,目的是2000年數(shù)字化美國國會圖書館的500萬件藏品。1994-)方案總投資6000萬美圓。數(shù)字圖書館的實際國內(nèi)中國實驗型數(shù)字圖書館工程1996年倡導(dǎo),1997年立項,2001年結(jié)題國家圖書館、上海圖書館、南京圖書館、深圳圖書館、遼寧省圖書館、中山圖書館、桂林圖書館數(shù)字圖書館的實際國內(nèi)中國數(shù)字圖書館工程一期規(guī)劃2000-20

8、05指點思想:統(tǒng)籌規(guī)劃,需求牽引,科技創(chuàng)新,滾動開展。建立原那么:公益性為主、資源建立為中心、一致規(guī)范規(guī)范、開放建立與利益共享、開發(fā)與引進(jìn)相結(jié)合數(shù)字圖書館的實際國內(nèi)中國數(shù)字圖書館工程建立目的:在互聯(lián)網(wǎng)上構(gòu)成超大規(guī)模的、高質(zhì)量的中文數(shù)字資源庫群,并經(jīng)過國家骨干通訊網(wǎng)向全國及全球提供高效效力;總體技術(shù)與國際主流技術(shù)接軌。建立一批中文多媒體資源庫,總?cè)萘坎坏陀?0TB;結(jié)合引進(jìn)假設(shè)干國內(nèi)需求的國外專題資源庫;實現(xiàn)全國大部分地域圖書館文獻(xiàn)資源的結(jié)合采編及館際互借;完成開發(fā)具有中國特征的數(shù)字圖書館智能運用系統(tǒng);培育一批高程度的專業(yè)人才隊伍,繼續(xù)開展中國數(shù)字圖書館工程。實施步驟:預(yù)備和實驗階段2000年初

9、步適用階段2001-2002年規(guī)模型生長階段2003-2005年數(shù)字圖書館五大功能IBM內(nèi)容發(fā)布內(nèi)容查詢&訪問內(nèi)容創(chuàng)建&提取存儲&管理?Right Managment權(quán)限管理數(shù)字圖書館主要技術(shù)內(nèi)容館藏資源數(shù)字化海量數(shù)據(jù)的建庫與維護(hù)數(shù)字對象的存取和獲得圖書館效力的網(wǎng)絡(luò)提供版權(quán)管理數(shù)字資源標(biāo)識體系文件系統(tǒng)URLPURLURNDOI其他.DOI的實例 ./ 10.156 / catalog-96 Publisher IDassigned byDOI AgencyItem IDassigned byPublisher 10.1048 / 872 10.1532 / PII 10.18698 / SIC

10、I 用戶HandleSystem出版者或其他資源提供者DOIDOI和URN等的操作模型基于內(nèi)容的檢索文本- 最成熟, 適用化圖象- 經(jīng)過顏色, 底紋, 外形視頻- 自動偵測析出關(guān)鍵幀音頻- 語音識別Query By Image ContentSearch images as human sees themcolor mixtureshapepositionaverage colortextureOr use an image as an example-show me more like this組合檢索ultisearch“Cardin or DiorQueryType = suitPric

11、e $450Text Content SearchCatalog SearchPatternColorImage Content SearchImageFull TextCatalogThis beautiful suit by Cardin is available in our new winter collection.Item #: 12345Type: suitPrice: $450Size: L, M, S多媒體信息檢索 Informedia自動分析視頻、音頻、隱含的標(biāo)題、場景變換和其它信息其特征在于:雖然個別方式的分析只能得到不完美的信息,但是組合一切方式提供的信息卻能得到非常優(yōu)

12、良的效果向Informedia數(shù)字圖書館館藏中添加新的素材將視頻素材分割到各主題部分中經(jīng)過音軌語音的識別、視頻流隱含標(biāo)題的識別來標(biāo)識每個部分相關(guān)的文本各種自然言語處置工具產(chǎn)生適宜的索引紀(jì)錄用戶可以用多方式中的任何一種方式提出查詢要求多方式信息檢索表達(dá)優(yōu)良的效果電視節(jié)目的智能閱讀Excerpted from Dr, Zhnag Hongjiangs 新一代多媒體檢索自動分類文本總結(jié)電視臺發(fā)出的或經(jīng)語音識別得到的文本關(guān)鍵幀檢測人臉檢測和識別數(shù)字圖書館建立所涉及的規(guī)范數(shù)字對象及存儲規(guī)范字符集、編碼規(guī)范、媒體格式等信息構(gòu)造表達(dá)與交換規(guī)范元數(shù)據(jù)規(guī)范信息查詢與顯示規(guī)范Z39.50、虛擬結(jié)合目錄及館際互借協(xié)

13、議信息平安與運用效力規(guī)范元數(shù)據(jù)簡介:什么是元數(shù)據(jù)數(shù)據(jù)的數(shù)據(jù) (Data about data)構(gòu)造化數(shù)據(jù) (Structured data)資源的信息 (Information about a resource)編目信息 (Cataloguing information)管理、控制信息Administrative information)元數(shù)據(jù)的種類管理型元數(shù)據(jù)構(gòu)外型元數(shù)據(jù)描畫型元數(shù)據(jù)描畫性元數(shù)據(jù)的層級描畫才干低高常用的描畫型元數(shù)據(jù)規(guī)范或規(guī)范MARCDCTEIEADFGDCCIMIGILS編碼與著錄SGMLHTMLXMLRDF其他方式標(biāo)志言語SGML 構(gòu)造化、規(guī)范、復(fù)雜、描畫才干強、需求DTD

14、HTML 半構(gòu)造化、不斷變化開展、描畫才干差、單一DTDXML 構(gòu)造化、規(guī)范、簡約、描畫才干強、DTD可選標(biāo)志言語實例HTML實例: 張三 系統(tǒng)網(wǎng)絡(luò)中心 上海圖書館結(jié)果顯示:張三系統(tǒng)網(wǎng)絡(luò)中心上海圖書館XML實例:張三系統(tǒng)網(wǎng)絡(luò)中心上海圖書館標(biāo)志言語實例更復(fù)雜的XML實例:陳伯鈞陳國懋523173918.jpg1910年11月26日1974年2月6日四川省達(dá)縣河市鄉(xiāng)北京高等軍事學(xué)院院長上將1955年1955年一級解放勛章陳 伯 鈞(1910-1974)陳伯鈞,原名陳國懋,字少達(dá)。中國人民解放軍高級將領(lǐng)。1955年被授予上將軍銜,榮獲一級八一勛章、一級獨立自在勛章、一級解放勛章。標(biāo)志言語實例SGML

15、MARC Exampledata omitted Fosdick, Howard.Computer basics for libraries and information scientists/Howard Fosdick; with a forward by F. Wilfrid Lancaster (Adapted from “SGML and the USMARC Standard, Technical Services Quarterly (15(3), 21ff) SGMLTEI ExampleModified from TEI header created by the Univ

16、ersity of Virginia Library Cataloging Services Department:A summary view of the rights of British America: a machine-readable transcriptionJefferson.Thomas, 1743-1826Approx. 44 KilobytesUniversity of Virginia LibraryCharlottesville, Va.Available from: Oxford Text ArchiveURL:/19

17、93XML言語的三要素style sheetrenderingsoftwaredocument with XML markupformatteddocument DTD ClientServer(s)XML言語的三要素DTD或XML SchemaDocument Type Definition文件類型定義XSLeXtensible Stylesheet Language可擴展款式言語XLINKeXtensible Link可擴展鏈接言語The XML Namespace 命名域Definition Form:Example namespace definition:Meaning: When

18、you see “ddc, interpret it according to the explanation offered at the site Example Use 025.316 互操作性與RDF互操作性:由元數(shù)據(jù)語義及構(gòu)造不同所引起的難題。處理方法:根據(jù)元數(shù)據(jù)之間的對應(yīng)關(guān)系mapping)進(jìn)展相互轉(zhuǎn)換中心元數(shù)據(jù)集 - 如Dublin Core支持異構(gòu)的資源檢索RDF資源描畫框架(Resource Description Framework)數(shù)據(jù)描畫方式而且采用基于 XML的句法提供語義、構(gòu)造、句法三個層次的互操作才干模塊化的互操作才干有些數(shù)據(jù)化信息需求不同的元數(shù)據(jù)描

19、畫,RDF對集成這些元數(shù)據(jù)非常有用什么是RDF?RDF是一個與任何特定語法無關(guān)的籠統(tǒng)的資源表達(dá)方式,用來反映資源Resource、屬性Property與屬性值Value資源resource屬性property屬性值value語句statement什么是RDF?換言之“張三是由以下網(wǎng)址所標(biāo)識的資源的libnet.sh/tsgzz/99-3/p22.htm libnet.sh/tsgzz/99-3/p22.htm 作者author張三什么是RDF?libnet.sh/tsgzz/99-3/p22.htm 作者author張三 張三 RDF基于XML的描畫實例:RDF描畫實例libnet.sh/ts

20、gzz/99-3/p22.htmDC:Creator張三Dublin Core基于RDF的描畫: 張三 基于RDF的DC描畫實例Warwick Framework ContainerMetadata ContainerPackage (Dublin Core)Package (Geospatial)Package (Indirect)Package (Access Terms)URIFrom: Daniel, Lagoze什么是Dublin Core元數(shù)據(jù) 1995年3月,由OCLC與國家超級計算運用中心NCSA結(jié)合發(fā)起,52位來自圖書館界、電腦網(wǎng)絡(luò)界專家共同研討產(chǎn)生。目的是希望建立一套描畫網(wǎng)

21、絡(luò)電子文獻(xiàn)的方法,以便網(wǎng)上信息檢索。其中心議題是如何用一個簡單的元數(shù)據(jù)記錄來描畫種類繁多的電子資源,使非圖書館專業(yè)人員都可以了解和運用著錄格式,來描畫網(wǎng)上資源。 至今已開過七次研討會,第九次將于2001年在日本舉行。每次會議都有一些詳細(xì)的成果和決議。如第四次會議在澳大利亞堪培拉舉行,會上發(fā)布3種修飾詞,故稱為堪培拉修飾詞。 十五個根本元素 簡單明晰的語義定義 運用面廣 DLO對象 易于伸縮與擴展 擴展的DCTYPE(Subelement),SCHEME,LANGUAGE 三種方式 現(xiàn)實上的工業(yè)規(guī)范 - RFC2413 廣泛的支持與運用已成為美國國家規(guī)范Z39.85)什么是Dublin Core

22、元數(shù)據(jù)DC元素 (都柏林中心集)內(nèi)容描畫 知識產(chǎn)權(quán) 外形描畫題名 Title 創(chuàng)建者 Creator 日期 Date主題 Subject 出版者 Publisher 類型 Type闡明 Description 其他責(zé)任者 Contributor 款式 Format來源 Source 權(quán)限 Rights 標(biāo)識 Identifier語種 Language關(guān)聯(lián) Relation覆蓋范圍 CoverageDC的特點一切的元素都是可選的一切的元素都是可反復(fù)的元素的陳列沒有先后次序具有良好的擴展性全球化DC擴展 (都柏林中心集)旨在經(jīng)過運用修飾詞進(jìn)一步明確元數(shù)據(jù)的特性比如一個日期可以作進(jìn)一步的描畫,如發(fā)表

23、日期和修正日期DC允許各個地方運用系統(tǒng)在15個根本元素的根底上添加新的元素或新的修飾詞,但應(yīng)堅持互操作性的原那么,同時提請DC大家庭留意,以便納入新的DC規(guī)范DC:Title題名A name given to the resource賦于資源的稱號DC:Creator創(chuàng)建者An entity primarily responsible for making the content of the resource創(chuàng)建資源內(nèi)容的主要責(zé)任者DC:Contributor其他責(zé)任者An entity responsible for making contributions to the content

24、of the resource對資源內(nèi)容創(chuàng)建作出奉獻(xiàn)的其他責(zé)任者DC:Publisher出版者An entity responsible for making the resource available使資源成為可獲得形狀的責(zé)任者DC:Date日期A date associated with an event in the life cycle of the resource與資源本身生命周期中的一個事件相關(guān)的日期DC:Relation關(guān)聯(lián)A reference to a related resource對相關(guān)資源的參照DC:Source來源A reference to a resource

25、 from which the present resource is derived對一個資源的參照,當(dāng)前資源源自這一參照資源DC:Description描畫An account of the content of the resource對資源內(nèi)容的闡明DC: Subject主題The topic of the content of the resource有關(guān)資源內(nèi)容的主題描畫DC:Type類型Nature or genre of the content of the resource有關(guān)資源內(nèi)容的特征和類型DC:Format格式Physical or digital manifesta

26、tion of the resource資源的物理或數(shù)字表現(xiàn)方式DC:Identifier標(biāo)識符An unambiguous reference to the resource within a given context在特定范圍內(nèi)給予資源的一個明確的標(biāo)識DC:Language語種A language of the intellectual content of the resource 描畫資源知識內(nèi)容所運用的語種DC:Coverage覆蓋范圍Extent or scope of the content of the resource資源內(nèi)容所涉及的范圍DC:Rights權(quán)限Informa

27、tion about rights held in and over the resource有關(guān)資源本身一切的或被賦予的權(quán)限信息多媒體與數(shù)字化上海圖書館系統(tǒng)網(wǎng)絡(luò)中心 趙亮概念與要點多媒體的根本概念多媒體定義指可以同時獲取、處置、編輯、存儲和展現(xiàn)兩個以上不同類型信息媒體的技術(shù)。多媒體技術(shù)計算機綜合處置多種媒體信息,文本、圖形、圖像、音頻和視頻,使多種信息建立邏輯銜接,集成為一個系統(tǒng)并具有交互性。多媒體類型:文本、圖形、圖像、音頻、視頻、三維建模虛擬現(xiàn)實等等多媒體格式總結(jié)文本編碼中文編碼、不同平臺編碼特殊標(biāo)志、格式圖象緊縮存儲有損緊縮和非有損緊縮TIFF,JPEG,GIF,BMP多級存儲音頻WA

28、V,MP3,REAL AUDIO視頻AVI,QUICK TIME,MPEG I,MPEG II,MPEG IV,REAL VIDEO其他三維實體VRML等等多媒體格式總結(jié)數(shù)字化方法文本錄入員錄入對掃描文件進(jìn)展OCR圖象掃描數(shù)碼照相音頻利用聲卡采集電腦合成視頻利用視頻采集卡采集硬件緊縮轉(zhuǎn)換或軟件緊縮轉(zhuǎn)換海量數(shù)據(jù)實例Text (1 page) : 5K / 1KImage (1024x768) : 2.3M / 300KVoice (1 min) : 480K / 60KMusic (1 min, CD) : 10.2M / 1MVideo (1 min, VHS) : 400M / 10MVid

29、eo (1 min, NTSC) : 1.6G / 35MVideo (1 min, HDTV) : 4.8G / 200M掃描或照相要點掃描方式分辨率resolution, 多少DPI)顏色深度 (bit depth, 多少bit)顏色管理 顏色復(fù)原修正去網(wǎng)紋,校正緊縮存儲人工修正去污點,對比度,亮度系統(tǒng)才干內(nèi)存等等四種掃描方式BitonalGrayscaleColorSpecial Treatment各種分辨率的效果600 dpi300 dpi200 dpi在二值掃描中調(diào)整閾值defines the point on a scale from 0 to 255 at which gray

30、values will be interpreted either as black or whiteEffects of Thresholdthreshold = 100threshold = 60Bit Depthnumber of bits used to represent each pixel, typically 8 bits or more per channelrepresenting 256 (28) levels for grayscale and 16.7 million (224) levels for color example: 8-bit grayscale pixel 00000000 = black 11111111 = whiteBit Depthincreasing bit d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論