文物數(shù)字化技術及數(shù)字化文物系統(tǒng)初探_第1頁
文物數(shù)字化技術及數(shù)字化文物系統(tǒng)初探_第2頁
文物數(shù)字化技術及數(shù)字化文物系統(tǒng)初探_第3頁
文物數(shù)字化技術及數(shù)字化文物系統(tǒng)初探_第4頁
文物數(shù)字化技術及數(shù)字化文物系統(tǒng)初探_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1 文物數(shù)字化的背景、定義、意義文物數(shù)字化的背景、定義、意義2 文物數(shù)字化的關鍵技術文物數(shù)字化的關鍵技術 3 文物數(shù)字化應用系統(tǒng)組成文物數(shù)字化應用系統(tǒng)組成4 文物數(shù)字化應用系統(tǒng)的關鍵技術文物數(shù)字化應用系統(tǒng)的關鍵技術5 文物數(shù)字化應用項目文物數(shù)字化應用項目6 討論討論北京理工大學軟件學院數(shù)字圖書館實驗室 1.1 文物數(shù)字化的定義定義 1.2 文物數(shù)字化的背景及意義北京理工大學軟件學院數(shù)字圖書館實驗室 利用最新的數(shù)字技術如數(shù)字化掃描、攝影、數(shù)字化編輯、三維動畫、虛擬現(xiàn)實以及網(wǎng)絡等再現(xiàn)、保存、傳播文物,對文物進行數(shù)字化加工處理; 涉及多學科的技術北京理工大學軟件學院數(shù)字圖書館實驗室計算機網(wǎng)絡、通信、

2、計算機等技術的計算機網(wǎng)絡、通信、計算機等技術的發(fā)展提供了發(fā)展基礎發(fā)展提供了發(fā)展基礎是文物保護、保存、文化傳播的需要是文物保護、保存、文化傳播的需要 * 文物的唯一性、不可共享和不可再生性相比;文物的唯一性、不可共享和不可再生性相比; * 數(shù)字化的文物信息是無限的、可共享的、可再生的數(shù)字化的文物信息是無限的、可共享的、可再生的 是是NII建設的重要組成部分,急需大規(guī)建設的重要組成部分,急需大規(guī)模有嚴密組織的信息資源庫模有嚴密組織的信息資源庫北京理工大學軟件學院數(shù)字圖書館實驗室360 Million用戶用戶 綜綜 合合數(shù)字圖書館數(shù)字圖書館Tiny(小型)(小型)Moderate (中型)中型)Im

3、mense (巨型)巨型)Content Scale(內容規(guī)模)(內容規(guī)模)Distribution(地域范圍)地域范圍)Wide Area(廣域廣域)Regional(區(qū)域)區(qū)域)(本地)(本地)LocalHours/Days(數(shù)時(數(shù)時/數(shù)天)數(shù)天)Months/Years(數(shù)月(數(shù)月/數(shù)年)數(shù)年)Decades/Centuries(數(shù)世紀)數(shù)世紀)/ (數(shù)十年(數(shù)十年)GeneralDigitalLibraryGlobalDesignDecisionNetworkLocalDesignDecisionNetwork應急管理應急管理知識網(wǎng)絡知識網(wǎng)絡 全全 球球決策網(wǎng)絡決策網(wǎng)絡 本本 地地決

4、策網(wǎng)絡決策網(wǎng)絡Lifetime(生命周期)(生命周期)美國美國NFS(國家科學基金會)關于知識聯(lián)網(wǎng)的白皮書附圖(國家科學基金會)關于知識聯(lián)網(wǎng)的白皮書附圖.圖像拍攝技術、掃描技術2.2 虛擬現(xiàn)實2. 數(shù)字對象表示2. 數(shù)字化加工編輯處理技術 北京理工大學軟件學院數(shù)字圖書館實驗室 選擇感光材料的傳統(tǒng)相機為主,或數(shù)碼相機 圖像信息的數(shù)字化非數(shù)字化的圖像經(jīng)過光學信號轉變成數(shù)字信號再存入計算機;分辯率和色深度是圖像信息化的兩個主要技術指標 提高圖像的分辯率和突出主題是文物的要點 掃描儀 虛擬現(xiàn)實技術是20世紀末發(fā)展起來的一門涉及眾多學科的高新技術,從本質上說是一種先進的計算機用戶接口技術,給用戶提供視覺

5、,聽覺,觸覺,嗅覺,味覺等各種直觀而又自然的實時感知交互手段。 Virtual Reality Markup Language 1994年3月在日內瓦召開的第一屆WWW大會上,首次正式提出了VRML這個名字。 1994年10月在芝加哥召開的第二屆WWW大會上公布了規(guī)范的草案。 1996年8月在新奧爾良召開的優(yōu)秀3D圖形技術會議-Siggraph96上公布通過了規(guī)范的第一版。它在 VRML1.0的基礎上進行了很大的補充和完善。 1997年12月VRML作為國際標準正式發(fā)布, 1998年1月正式獲得國際標準化組織ISO批準簡稱VRML97。VRML97只是在VRML2.0基礎進行上進行了少量的修正

6、。 1998年。VRML組織把自己改名為Web3D組織,同時制訂了一個新的標準,Extensible 3D (X3D),到了2000年春天,Web3D組織完成了VRML到X3D的轉換。X3D整合正在發(fā)展的XML、JAVA、流技術等先進技術,包括了更強 大、更高效的3D計算能力、渲染質量和傳輸速度。 VRML文件描述的基于時間的三維空間稱為虛擬境界(Virtual World),它由對象構成,而對象及其屬性用節(jié)點描述,節(jié)點是VRML的基本單元。每個節(jié)點由類型、域、事件、實現(xiàn)、名字組成,節(jié)點按一定規(guī)則構成場景圖(Scenegraph)。 存在感。 多感知性。 交互性。 動態(tài)顯示。 立體感的視覺與聽

7、覺效果。 腳本功能。數(shù)字信息管理的基本術語:1 數(shù)字對象:數(shù)字信息庫中表示信息的基本邏輯單位。如文章,圖片,一部音樂作品。2 元數(shù)據(jù):描述對象實體的信息。元數(shù)據(jù)中可包含數(shù)字對象的唯一句柄。數(shù)字對象頭數(shù)字對象體A1A2A3An元數(shù)據(jù)句柄 數(shù)字資源加工主要涉及元數(shù)據(jù)標準的制定與資源的元數(shù)據(jù)加工、工業(yè)化的OCR技術、自動標引、自動文摘、知識概念體系、網(wǎng)上資源的獲取與處理、數(shù)據(jù)壓縮、數(shù)字版權的管理等。 北京理工大學軟件學院數(shù)字圖書館實驗室 建立元數(shù)據(jù)標準和規(guī)范:建立元數(shù)據(jù)標準和規(guī)范:提高數(shù)字資源的可訪問性和可檢索性;為搜索結果提供更加有效的關聯(lián)度排序;作為某些資源的替代品,如需要花費大量時間下載或瀏覽

8、的大型文件,需要進行解釋才能理解的原始數(shù)據(jù),甚至某些無法以電子方式獲得的資源;有助于解決知識產(chǎn)權的辨認、跟蹤和管理問題。 工業(yè)化的工業(yè)化的OCR技術:技術:為完成大批量的數(shù)字化工作,需要可靠的不依靠人工校對的圖像處理和OCR技術,該技術要支持漢字大字符集下的工業(yè)化掃描和識別,其識別精確度要在99.99%以上。 自動標引、自動文摘生成、自動篇名生成自動標引、自動文摘生成、自動篇名生成技術:技術:以現(xiàn)有的主題和分類詞表為基礎,具有自學習的能力,學習成熟人員的經(jīng)驗,為標引人員自動生成或輔助生成主題和分類,并對人工標引進行必要的校對。同時,要求具有智能化的自動文摘生成技術及自動篇名生成技術來大批量地生

9、成文摘數(shù)據(jù)和篇名數(shù)據(jù)。 知識概念體系:知識概念體系:建立基于人工智能知識表達的知識概念體系,提供智能化的信息服務。 Web挖掘技術:挖掘技術:Web內容的挖掘是對Web中包含的文本、圖像、視頻等數(shù)據(jù)元素進行挖掘;Web結構的挖掘是從Web的鏈結構中發(fā)現(xiàn)知識;Web使用的挖掘是追隨用戶對Web頁的交互和操縱,從中挖掘出有價值的用戶存取模式。 北京理工大學軟件學院數(shù)字圖書館實驗室 多媒體挖掘技術:多媒體挖掘技術:基于多媒體的內容特性以及這些特性相關的語義,從大型多媒體數(shù)據(jù)集(不僅僅是多媒體數(shù)據(jù)庫)中發(fā)現(xiàn)和分析出隱含的、有效的、有價值的、可理解的模式,使多媒體的處理和管理從信息存取上升到知識獲取層次

10、,使多媒體內容的利用達到新的高度。 北京理工大學軟件學院數(shù)字圖書館實驗室 壓縮、解壓縮技術:壓縮、解壓縮技術:在數(shù)字資源的建設與使用的過程中,資源的加工必須是一次性的,而經(jīng)過加工的資源應適應多種不同的用途。 數(shù)字版權管理技術:數(shù)字版權管理技術:通過對數(shù)字資源進行處理,有效地管理所有數(shù)字資源內容的知識產(chǎn)權,其中包括文字、圖像、音頻、視頻等各種形式的數(shù)字對象。綜合運用各種加密手段保證數(shù)字對象在網(wǎng)絡傳輸過程中的安全,并建立網(wǎng)上授權認證機制,防止傳播中的數(shù)字資源被非法使用,同時與精確的計費功能結合,提供安全可靠的信息交易平臺。 數(shù)字版權管理技術:數(shù)字版權管理技術:通過對數(shù)字資源進行處理,有效地管理所有

11、數(shù)字資源內容的知識產(chǎn)權,其中包括文字、圖像、音頻、視頻等各種形式的數(shù)字對象。綜合運用各種加密手段保證數(shù)字對象在網(wǎng)絡傳輸過程中的安全,并建立網(wǎng)上授權認證機制,防止傳播中的數(shù)字資源被非法使用,同時與精確的計費功能結合,提供安全可靠的信息交易平臺。 文物數(shù)字化應用系統(tǒng)文物數(shù)字化應用系統(tǒng)定義文物數(shù)字化應用系統(tǒng)體系結構文物數(shù)字化應用系統(tǒng)體系結構 根據(jù)需求不同,文物數(shù)字化應用系統(tǒng)定義多根據(jù)需求不同,文物數(shù)字化應用系統(tǒng)定義多樣樣 本報告討論的是一種具有開放式體系結構的、本報告討論的是一種具有開放式體系結構的、有組織管理的網(wǎng)絡數(shù)字文物藏品系統(tǒng)及信息有組織管理的網(wǎng)絡數(shù)字文物藏品系統(tǒng)及信息服務系統(tǒng);服務系統(tǒng); 它

12、支持大范圍、分布式的數(shù)字化文物的信息它支持大范圍、分布式的數(shù)字化文物的信息服務,用戶可在網(wǎng)絡上橫跨異構的支持知識服務,用戶可在網(wǎng)絡上橫跨異構的支持知識關聯(lián)的文物資源庫,高效訪問以多種數(shù)字格關聯(lián)的文物資源庫,高效訪問以多種數(shù)字格式存儲在其中的多媒體知識信息。式存儲在其中的多媒體知識信息。 支持基于局域、互連網(wǎng)的服務支持基于局域、互連網(wǎng)的服務 與其它應用系統(tǒng)或資源庫的關連與其它應用系統(tǒng)或資源庫的關連元數(shù)據(jù)服務器對象數(shù)據(jù)服務器內容管理WEB PORTAL用戶權限認證收費管理Web客戶端管理工具存儲管理北京理工大學軟件學院數(shù)字圖書館實驗室存儲與調度庫數(shù)字資源管理體系用戶信息服務體系數(shù)字資源建設體系存儲

13、與調度庫數(shù)字資源管理體系用戶信息服務體系數(shù)字資源建設體系資源創(chuàng)建互連網(wǎng)資源元數(shù)據(jù)結構定義用戶管理數(shù)據(jù)加工加工資源庫用戶管理數(shù)據(jù)加工加工資源庫調度注冊數(shù)據(jù)裝入數(shù)據(jù)輸入輸出XML文件調度注冊數(shù)據(jù)裝入數(shù)據(jù)輸入輸出XML文件調度庫發(fā)布資源庫調度庫發(fā)布資源庫抓取整理加工文獻數(shù)字化資源原有資源庫標引整合構成子系統(tǒng)用戶界面數(shù)字化資源加工系統(tǒng)數(shù)字信息的存儲管理資源調度系統(tǒng)信息訪問和查詢安全認證版權保護 用戶界面1 為用戶服務的界面瀏覽器:與用戶交互作用客戶服務:瀏覽器與系統(tǒng)其它部份的中介服務。2 為系統(tǒng)管理員提供的界面。q 數(shù)字化資源加工系統(tǒng)1、對文本、圖像、音頻和視頻等信息的數(shù)字化采集,加工,處理。2、實現(xiàn)

14、信息資源的一次加工,多次使用。3、信息的表示格式與對系統(tǒng)升級的影響如一幅圖像的表示:高分辨率;中分辨;低分辨;元數(shù)據(jù)q 數(shù)字化資源加工系統(tǒng)4、數(shù)字化標準 XML/SGMLSGML:標準通用標識語言XML:可括充的標識語言XML工具軟件:編譯,轉換,編輯等5、從MARC到DC的輔助轉換數(shù)字信息的存儲管理實現(xiàn)對所有數(shù)據(jù)的存儲管理,包括標準化的元數(shù)據(jù)和數(shù)字對象的存儲格式、存儲協(xié)議、元數(shù)據(jù)和對象數(shù)據(jù)的一致性、分布環(huán)境下數(shù)據(jù)的查詢 數(shù)字信息的存儲管理 LAN/WAN/INTERNET圖書館服務器對象服務器客戶 數(shù)字信息的存儲管理異地存儲技術更新 資源調度系統(tǒng)1、建立統(tǒng)一的資源命名規(guī)則2、建立調度機制3、

15、為資源加工和用戶服務提供調度服務功能信息查詢系統(tǒng) 查詢界面匹配系統(tǒng)/搜索引擎信息庫信息庫信息庫信息查詢系統(tǒng)1、統(tǒng)一檢索功能:采取單一界面實現(xiàn)數(shù)據(jù)的統(tǒng)一檢索。2、檢索結果的顯示過濾功能;信息選擇,復雜檢索功能;對多數(shù)據(jù)庫的檢索功能(結果合并等)3、影像數(shù)據(jù)的檢索 對影像數(shù)據(jù)進行詳細檢索的功能。 信息查詢系統(tǒng)4、人工標引,自動標引,半自動標引,標引轉換生成5、多語言處理系統(tǒng)6、自然語言處理,基于語義的檢索分類安全認證1、用戶身份認證2、訪問權限認證版權保護軟件系統(tǒng)實現(xiàn)基于分布式環(huán)境下垮單位垮庫環(huán)境下的版權保護和電子商務系統(tǒng)。登記;認證;記費;結算分布式有償服務的記費模型4.1 數(shù)字資源加工編輯相關

16、技術數(shù)字資源加工編輯相關技術4.2 應用平臺和資源管理應用平臺和資源管理4.3 用戶服務相關技術用戶服務相關技術4.4 應該遵循的相關標準規(guī)范應該遵循的相關標準規(guī)范見提供對數(shù)字資源的管理和開發(fā)利用,是為用戶提供各種信息與知識服務的后臺系統(tǒng)。 檢索技術:檢索技術:包括純文本的全文檢索、概念檢索、圖像檢索、視頻檢索、音頻檢索技術等。 智能型全文檢索技術。智能型全文檢索技術。主要解決跨地區(qū)、跨數(shù)據(jù)庫的信息資源檢索問題。檢索軟件應該能夠根據(jù)用戶的信息需求,幫助用戶分析和制定檢索策略,并能智能化地在不同地點、不同數(shù)據(jù)庫中進行搜索,將用戶所需信息準確地檢索顯示出來。 命名系統(tǒng):命名系統(tǒng):系統(tǒng)中的資源需要具

17、備一個長期的、全球唯一的、獨立于地址的標識名,以便于用戶對資源的檢索。 資源調度技術:資源調度技術:主要負責從唯一的資源名到資源的網(wǎng)絡地址的解析過程。 多媒體處理技術:多媒體處理技術:適于網(wǎng)絡傳輸、多媒體的檢索。 系統(tǒng)的互操作技術:系統(tǒng)的互操作技術:通過元數(shù)據(jù)的互操作,促進資源的共享;通過中間件、Agent以及Web Services解決分布式異構系統(tǒng)之間的互操作。 數(shù)字化信息資源管理技術:數(shù)字化信息資源管理技術:主要解決信息資源數(shù)字化后海量信息的存儲和管理問題,一方面要保證海量信息存儲有序,另一方面還要保證不影響信息的讀取速度和效果。 l 水印技術與密鑰技術:水印技術與密鑰技術:通過這種技術

18、將對數(shù)字資源進行有效的知識產(chǎn)權保護。主要涉及人機交互方面的技術,為用戶提供簡單、便捷、靈活的友好界面。 多語言技術:多語言技術:要保證系統(tǒng)支持多語言技術,同時為滿足更大范圍的用戶的需求,系統(tǒng)要通過機器翻譯、多語言瀏覽等功能為用戶提供跨語言的支持。 個性化定制服務技術:個性化定制服務技術:根據(jù)不同用戶的不同需求,向他們提供個性化界面,以便高效、準確的知識服務。 北京理工大學軟件學院數(shù)字圖書館實驗室 ISO 10646 信息技術通用多個8比特編碼字符集 ISO 14721 / OAIS 空間數(shù)據(jù)和信息傳送系統(tǒng)開放檔案信息系統(tǒng)參考模型使用場所:數(shù)字資源組織、管理、預發(fā)布參考模型 ISO 15836

19、信息和文檔都柏林核心元數(shù)據(jù)元素集 Open Archives Initiative 用于元數(shù)據(jù)收獲的開放檔案主動協(xié)議使用場所:不同系統(tǒng)元數(shù)據(jù)收獲處理北京理工大學軟件學院數(shù)字圖書館實驗室數(shù)據(jù)字典對于數(shù)字靜止圖象的技術元數(shù)據(jù)使用場所:數(shù)字圖書館系統(tǒng)中,數(shù)字靜止圖象加工技術元數(shù)據(jù)參考對于關系敏感服務的開放唯一資源定位的框架GB2312 / GB18030 國家中文信息編碼標準使用場所:系統(tǒng)中,表現(xiàn)層信息編碼中圖分類法:中圖分類法:中國國家圖書館分類方法使用場所:數(shù)據(jù)分類規(guī)范,數(shù)據(jù)檢索開關控制,參加關聯(lián)檢索北京理工大學軟件學院數(shù)字圖書館實驗室 Adobe PDF使用場所:電子文檔表現(xiàn)格式,插件需要嵌入

20、在標準瀏覽器中 中文圖書主題規(guī)范數(shù)據(jù)中文圖書主題規(guī)范數(shù)據(jù) / 中文圖書名稱規(guī)范數(shù)據(jù)中文圖書名稱規(guī)范數(shù)據(jù) / 題名規(guī)范題名規(guī)范 / 著者規(guī)范著者規(guī)范 / 地名規(guī)范地名規(guī)范 /團體單位名稱規(guī)范數(shù)據(jù):團體單位名稱規(guī)范數(shù)據(jù):知識庫體系規(guī)范數(shù)據(jù) 其他主流流媒體格式:其他主流流媒體格式:主流的asf、mpeg、wav、mp3、rm等格式使用場所:系統(tǒng)中,用于流媒體數(shù)據(jù)對象格式或者流媒體轉換格式,流媒體表現(xiàn)格式,插件需要嵌入在標準瀏覽器中 應該遵守W3C、ISO、GB相應的標準和規(guī)范; 應該參考相關的計算機、網(wǎng)絡、安全、信息、軟件設計等的標準規(guī)范。 北京理工大學軟件學院數(shù)字圖書館實驗室 美國:美國: 英國英國 法國法國 其他國家其他國家 中國中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論