




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、多媒體元數(shù)據(jù)研究,1、多媒體資源 Audio Visual Metadata ECHO (European Chronicles On-line,歐洲編年史在線) MEPG-7 MPEG-21 VRA Core Categories EAD(編碼文檔描述),2、數(shù)字圖像資源 MOA (the Making of American) 2 數(shù)字圖像元數(shù)據(jù) CDL數(shù)字圖像元數(shù)據(jù) Dig35 NISO/CLIR/RLG的圖像技術(shù)元數(shù)據(jù),3、元數(shù)據(jù)編碼與傳輸標(biāo)準(zhǔn)METS Metadata Encoding and Transmission Standard /stand
2、ards/mets 由數(shù)字圖書館聯(lián)盟(Digital Library Federation)發(fā)起研發(fā),現(xiàn)由美國圖書館代表大會網(wǎng)絡(luò)發(fā)展與MARC標(biāo)準(zhǔn)辦公室負(fù)責(zé)維護(hù) 目標(biāo): 期望能針對數(shù)字圖書館對象的編碼敘述、管理與元數(shù)據(jù)構(gòu)建提供一個以XML為基礎(chǔ)的框架 內(nèi)容涵蓋四個方面: 描述性元數(shù)據(jù)(Descriptive Metadata) 管理性元數(shù)據(jù)(Administrative Metadata) 文件群組(File Groups) 結(jié)構(gòu)地圖(Structural Map) METS除可以作為對象間交換的標(biāo)準(zhǔn)外,還可以作為對象保存、訪問、展示的編碼機(jī)制,4、MPEG系列標(biāo)準(zhǔn)(1、2、4、7、21) M
3、PEG是專門從事多媒體音、視頻壓縮技術(shù)標(biāo)準(zhǔn)制定的國際組織,成員包括來自近30個國家、200多個公司的400多位專家。該組織自1988年以來,已經(jīng)制定了一系列國際標(biāo)準(zhǔn),其中MPEG-1、MPEG-2已為人們所熟知,它們?yōu)閂CD、DVD及數(shù)字電視等產(chǎn)業(yè)的發(fā)展奠定了基礎(chǔ)。目前正在制定的MPEG-4、MPEG-7和MPEG-21將為多媒體數(shù)據(jù)壓縮和基于內(nèi)容檢索的數(shù)據(jù)庫應(yīng)用提供一個更為通用的平臺,必將對下一代視、音頻系統(tǒng)和網(wǎng)絡(luò)應(yīng)用產(chǎn)生深遠(yuǎn)的影響。,MPEG-1:存儲和回放 MPEG-1制定于1993年,是針對1.5Mbps以下數(shù)據(jù)傳輸率的數(shù)字存儲媒介運動圖像及其伴音編碼的國際標(biāo)準(zhǔn),主要用于在CD-ROM
4、上存儲同步和彩色運動視頻信號。 MPEG-2:數(shù)字電視 MPEG-2出臺于1995年,它是針對HDTV和DVD等制定的3Mbps10Mbps的運動圖像及其伴音的編碼標(biāo)準(zhǔn)。它的出現(xiàn)使得基于CD-ROM的交互式電視和數(shù)字電視成為了可能。,MPEG-4:基于對象的存取 MPEG-4于1999年成為國際標(biāo)準(zhǔn)。它和MPEG-1和MPEG-2的重點在于編碼效率上不同的是,MPEG-4的目標(biāo)是提出一種新的方式來傳輸、訪問和操作數(shù)字視聽數(shù)據(jù)。MPEG-4計劃為多種通訊規(guī)范提供一種普遍的技術(shù)解決方案,最終消除它們之間的差別。與MPEG-1和MPEG-2的另一點不同是,MPEG-1和MPEG-2是基于幀的規(guī)范,而
5、MPEG-4則是基于對象的規(guī)范。,4.1 MPEG-7:多媒體內(nèi)容描述 隨著Internet的普及和網(wǎng)絡(luò)帶寬的增加,產(chǎn)生了大量的多媒體數(shù)據(jù),如何在浩如煙海的信息中快速、容易地獲得自己所需的內(nèi)容則成為當(dāng)前必須解決的問題。在此需求下,MPEG-7應(yīng)運而出。MPEG-7力求能夠快速且有效地搜索出用戶所需的不同類型的多媒體信息。該標(biāo)準(zhǔn)主要致力于視聽數(shù)據(jù)的信息編碼表達(dá),換句話說也就是集中在對多媒體材料描述的通用接口的標(biāo)準(zhǔn)化上。 MPEG-7的功能與其他MPEG標(biāo)準(zhǔn)互為補(bǔ)充。MPEG-1、 MPEG-2和MPEG-4是內(nèi)容本身的表示,而MPEG-7是有關(guān)內(nèi)容的信息,是比特的比特。,MPEG-7中的主要概念
6、 數(shù)據(jù)(Data) 是用MPEG-7描述的視聽資料,不考慮它們的存儲、編碼、顯示、傳輸、媒介或技術(shù)。該定義非常廣泛,包含圖形、靜止圖像、視頻、影片、音樂、語音、聲音、文本和其他相關(guān)的AV媒體。 - 特征(Feature) 指數(shù)據(jù)的特性。特征本身不能比較,而要用有意義的特征表示(描述子)和它的實例(描述值)。如圖像的顏色、語音的聲調(diào)、音頻的旋律等。 - 描述子(Descriptor,D) 是特征的表示。它定義特征表示的句法和語義,可以賦予描述值。一個特征可能有多個描述子,如顏色特征可能的描述子有:顏色直方圖、頻率分量的平均值、運動的場描述、標(biāo)題文本等。 - 描述值(Descriptor Valu
7、e) 是描述子的實例。描述值與描述模式結(jié)合,形成描述。 -,描述模式(Description Scheme,DS) 說明其成員之間的關(guān)系結(jié)構(gòu)和語義。成員可以是描述子和描述模式。DS和D的區(qū)別是:D僅僅包含基本的數(shù)據(jù)類型,不引用其他D或DS。如對于影片,時間結(jié)構(gòu)化為場景和鏡頭,在場景級包括一些文本描述子,在鏡頭級包含顏色、運動和一些音頻描述子。 - 描述(Description) 一個描述由一個描述模式(結(jié)構(gòu))和一組描述值組成。 - 編碼的描述(Coded Description) 是對已完成編碼的描述,滿足諸如壓縮效率、差錯恢復(fù)和隨機(jī)存取的相關(guān)要求。 - 描述定義語言(Description
8、Definition Language,DDL) 是一種允許產(chǎn)生新的描述模式和描述子的語言,允許擴(kuò)展和修改現(xiàn)有的描述機(jī)制。 -,為了更好地理解這些術(shù)語,請參看圖1。圖中解釋了 MPEG-7在實際系統(tǒng)中的位置。圓角框表示處理工具,矩形框表示靜態(tài)元素,陰影部分包含MPEG-7標(biāo)準(zhǔn)的規(guī)范元素:DDL提供建立描述模式的機(jī)制,然后將描述模式作為基礎(chǔ),產(chǎn)生一個描述。,MPEG-7的范圍 下圖是MPEG-7處理鏈的一種高度抽象示意圖,用于解釋MPEG-7的范圍。它包括特征抽取(分析)、描述本身和搜索引擎(應(yīng)用)。,MPEG-7對視覺數(shù)據(jù)的描述 MPEG-7具體對視覺方面的描述子和描述模式有以下方面的要求:
9、(1) 特征類型 - 視覺描述允許以下特征(與查詢中使用的信息類型有關(guān)):顏色、視覺對象、紋理、輪廓(草圖)、形狀、靜止和動態(tài)圖像、體積、空間關(guān)系(相對于圖像和圖像序列中的對象空間和拓?fù)潢P(guān)系,這個關(guān)系是空間合成關(guān)系)、運動(如視頻鏡頭中的運動,用于利用時間合成信息來檢索等方面)、變形(如對象的彎曲)、視覺對象的源和它的特性(如源對象、源事件、源屬性、事件、事件屬性等)、模型(如MPEG-4 SNHC)。 (2) 利用描述進(jìn)行數(shù)據(jù)可視化 - MPEG-7數(shù)據(jù)描述應(yīng)該容許被索引數(shù)據(jù)或多或少地粗略可視化。 (3) 可視數(shù)據(jù)的格式 - 支持以下可視數(shù)據(jù)格式:數(shù)字視頻和電影(例如MPEG- 1/2/4)
10、、模擬視頻和電影、電子形式的靜態(tài)圖像(如JPEG)或紙上的圖像、圖形、3D模型以及與視頻關(guān)聯(lián)的編輯數(shù)據(jù)。 (4) 可視數(shù)據(jù)類型 - 可以是自然視頻、靜態(tài)圖像、圖形、動畫、三維模型、編輯信息。,MPEG-7對聽覺數(shù)據(jù)的描述 (1) 特征類型 - 頻率輪廓線、音頻對象、音色、和聲、頻率特征、振幅包絡(luò)、時間結(jié)構(gòu)(包括節(jié)奏)、文本內(nèi)容(語音或歌詞)、聲波近似值(通過哼唱一段旋律或發(fā)出一種聲音效果來生成)、原型聲音(典型的用于示例查詢)、空間結(jié)構(gòu)(用于多通道聲源,如立體聲、5.1通道等,每個聲道有特定的映像)、聲源和它的特性(例如源對象、源時間、源屬性、事件、事件屬性和典型的關(guān)聯(lián)場景)、模型(如MPEG
11、-4 SAOL)。 - (2) 描述數(shù)據(jù)的聽覺化 - 類似視覺數(shù)據(jù)的要求。 - (3) 聽覺數(shù)據(jù)格式 - 數(shù)字音頻(如MPEG-1音頻、CD)、模擬音頻(如錄音帶介質(zhì))、MIDI(包括一般的MIDI和Karaoke格式)、基于模型的音頻、產(chǎn)品數(shù)據(jù)。 - (4) 聽覺數(shù)據(jù)類 - 聲音軌跡(自然音頻場景)、音樂、原子聲音效果(如掌聲)、語音、符號音頻表示(MIDI、SNHC音頻)、混音信息(包括效果)。,4.2 MPEG-7的“拉”應(yīng)用 1)視頻數(shù)據(jù)庫的存儲和檢索 - 電視和電影檔案中保存有大量的各種格式的多媒體資料,如數(shù)字、模擬磁帶和膠片、CD等,這些資料不一定有描述信息(元數(shù)據(jù)),即使有也大都
12、是簡單的文本描述,它們以專用的格式存儲在數(shù)據(jù)庫中,因此,需要按照國際標(biāo)準(zhǔn)格式進(jìn)行存儲和交換。另外,要對大量舊的模擬視聽資料進(jìn)行數(shù)字化,在數(shù)字化和壓縮階段,可以在數(shù)據(jù)庫中使其包含基于內(nèi)容的索引特征。對于新的視聽媒體,在視頻生產(chǎn)的各個階段可以把描述信息附加在視頻流上,從而極大地提高了用手工進(jìn)行有限詞匯注釋的質(zhì)量和生產(chǎn)率。,“拉”應(yīng)用 2)專業(yè)媒體制作方面的圖片和視頻提交 - 演播室需要向電視頻道提交適當(dāng)?shù)囊曨l,另外還需要編輯一段庫中的視頻,如編輯記錄片和廣告片等。 - 在這個應(yīng)用中,用戶是專業(yè)性的。演播人員可以基于元數(shù)據(jù)和視頻片段來提交一個完整的視頻,可以基于客觀特性和主觀特性來查詢出想要的視頻片
13、段并用于編輯。查詢也可以作用于分布數(shù)據(jù)庫,以獲得視覺、版權(quán)和價格信息,以及源視頻資料的技術(shù)質(zhì)量數(shù)據(jù)。 - 在設(shè)計方面,靜止圖片也具有相似的應(yīng)用和需求。Web 設(shè)計人員并不都是做新的設(shè)計,有時也在網(wǎng)絡(luò)上選擇現(xiàn)有的圖片用于Web站點的設(shè)計。在網(wǎng)絡(luò)上,設(shè)計人員可以通過基于內(nèi)容的檢索方法挑選想要的素材。其他設(shè)計領(lǐng)域具有相似的可視搜索用途。,“拉”應(yīng)用 3)商業(yè)音樂應(yīng)用(卡拉OK和音樂銷售) - 卡拉OK在亞洲極其流行。一般是根據(jù)歌名和原唱者姓名檢索,但也常有記不清歌名的情況。這時可以利用音頻內(nèi)容檢索技術(shù),業(yè)余歌手哼幾句記憶的曲調(diào),讓計算機(jī)查找相應(yīng)的歌曲(或給出相似歌曲的列表)。 - 相似的與音樂銷售有
14、關(guān)的應(yīng)用是把可選擇的音樂庫擴(kuò)展到用戶家里。人們可以容易地訪問在線數(shù)據(jù)庫,用基于內(nèi)容的方式(結(jié)合歌手名、風(fēng)格、歌名、創(chuàng)作年代等),查找感興趣的歌曲和音樂作品,并付費下載。,“拉”應(yīng)用 4)聲音效果庫 - 對于要使用大容量聲音效果數(shù)據(jù)庫的藝術(shù)家和聲音設(shè)計人員,常規(guī)的數(shù)據(jù)庫管理和搜索方法是不夠的。一個聲音設(shè)計人員要求從聲音效果庫中選擇出要求的聲音效果,其選擇方式可能是由設(shè)計人員提供原型化的聲音和音頻特征,甚至可以發(fā)出類似要查找的聲音,通過擬聲方式查詢。 - 5)歷史語音數(shù)據(jù)庫 - 可以通過口頭關(guān)鍵詞、關(guān)鍵事件、說話人、地點、日期,或以上屬性的組合來搜索歷史數(shù)據(jù)庫中的音頻錄音和視聽演講。這種應(yīng)用也可以
15、輔助教育或新聞業(yè)應(yīng)用。例如,用戶說一句關(guān)鍵詞:I have a dream, 系統(tǒng)把語音轉(zhuǎn)換為文本關(guān)鍵詞,查找出馬丁路德金的錄音和演講文本。,“拉”應(yīng)用 6)通過聽覺事件進(jìn)行電影場景檢索 - 許多視覺場景是與聲音事件相關(guān)的。例如在喜劇電影或電視場景中,人們可以通過記憶的對話和臺詞來檢索電影的場景。另外,還可以通過明顯的聲音事件來檢索,例如通過觀眾的歡呼聲和解說員的解說詞檢索足球進(jìn)球的場景,通過爆炸聲檢索戰(zhàn)斗和破壞場景等。音軌中的聽覺事件也同樣具有這樣的檢索能力。該應(yīng)用利用語音的描述和聲音效果的描述來實現(xiàn)檢索。 7)商標(biāo)庫的注冊和檢索 - 通常情況下,商標(biāo)是二維圖像,包含文本、圖畫或圖片以及象征
16、性的顏色。二維商標(biāo)可以分為三類:文字商標(biāo)(僅僅包含文字,適合用文本注釋來描述)、圖案商標(biāo)(僅僅包含圖形或象征性標(biāo)志,需要形狀描述)、組合形式的商標(biāo)(包含字符和圖形)。,4.3 MPEG-7的“推”應(yīng)用 與以上的“拉”應(yīng)用相反,下面的“推”應(yīng)用類似于廣播和Web廣播?!巴啤睉?yīng)用用到“選擇”和“過濾”,而不是“索引”和“檢索”,因此有非常不同的要求。通常它們涉及到流描述,而不是存儲在數(shù)據(jù)庫中的靜態(tài)描述。,“推”應(yīng)用 1)用戶代理驅(qū)動的媒體選擇和過濾 - - 過濾與搜索正好相反。搜索涉及“拉”信息,而過濾意味著“推”信息。搜索請求“包含”那些信息,而過濾“排斥”指定的數(shù)據(jù),但二者都從相同的元信息中獲
17、得好處。廣播媒體這種形式正向WWW轉(zhuǎn)移,使WWW這種典型的 “拉”媒體同時具有廣播的能力。 - 面向消費者的選擇技術(shù)可以用于個人化視聽節(jié)目的應(yīng)用。在收集與個人相關(guān)的新聞節(jié)目方面,這甚至可以做到比典型的VOD更進(jìn)一步。例如,一個面向內(nèi)容生產(chǎn)商的選擇技術(shù)可以在片段和鏡頭級從數(shù)據(jù)庫中收集原始資料。,“推”應(yīng)用 2)個人化電視服務(wù) - 在廣播領(lǐng)域,內(nèi)容的描述可以輔助廣播數(shù)據(jù)的選擇,所選擇的廣播數(shù)據(jù)形式可以是即時的或以后要觀看的,或錄像形式的。對于個人化廣播,提供給用戶的數(shù)據(jù)可以按照用戶自己的喜好來對廣播流進(jìn)行過濾,其形式可以是自動方式的,例如根據(jù)地理位置、年齡、性別或以前的選擇行為自動選擇,或是半自動
18、方式(基于預(yù)定的設(shè)置)。結(jié)合NVOD(準(zhǔn)視頻點播)服務(wù),可以基于關(guān)鍵幀實現(xiàn)步進(jìn)/后退操作,加速節(jié)目的表現(xiàn)。對于未來的廣播服務(wù),與節(jié)目中特定事件相關(guān)的交互功能也很重要。 3)智能多媒體表現(xiàn) - 隨著可獲取信息的大量增加,人們正在尋找一種新的方式,自動地表現(xiàn)這些數(shù)據(jù)。它可以通過把上下文、用戶、應(yīng)用和設(shè)計原則的知識與顯示信息的知識結(jié)合起來完成。靈活地應(yīng)用這些知識,就可以設(shè)計一種智能多媒體表現(xiàn)系統(tǒng)。,“推”應(yīng)用 4)個人化瀏覽、過濾和搜索 - 這種應(yīng)用背景是在消費者的家里。使用一種靈巧裝置將瀏覽、過濾和搜索功能集于一體。平常,這個靈巧裝置按照主人的設(shè)置(愛好)自動過濾廣播數(shù)據(jù),錄下感興趣的節(jié)目,等到主
19、人有空的時候觀看。觀看過程中可以充分利用內(nèi)容描述能力,快速地基于內(nèi)容瀏覽,或搜索出感興趣的片段。 5)特別的信息存取 - 這種應(yīng)用滿足殘疾人的信息存取要求,提供主動的信息表現(xiàn)形式,可以幫助他們克服信息獲取的問題。關(guān)鍵問題是允許用多模態(tài)通信來表現(xiàn)信息。例如,一個搜索代理不僅為盲人排除圖像顯示,而且獲得MPEG7的元數(shù)據(jù)。在元數(shù)據(jù)的輔助下,可以通過發(fā)聲和觸覺的形式表現(xiàn)信息。相似的元數(shù)據(jù)可以幫助其他方面有障礙的殘疾人。,4.4 MPEG-7特殊的專業(yè)應(yīng)用和控制 1)遠(yuǎn)程購物 - 越來越多的商品是通過在線商品目錄銷售的。如果目錄限制為文本形式,效果就不好。視覺的印象要比文本的印象深刻得多。用常規(guī)的方法
20、可以檢索到商品,但是對于要買的商品,往往是許多用戶僅僅知道一些模糊的概念,“看到了才知道”。因此,需要提供視覺查找方法,以及逐步調(diào)整搜索要求,最終找到所要的商品。例如,“我要查找棕色的鞋子,像這樣的鞋子,但是后跟要高一些”,或者是 “我在找這種花樣的窗簾,但是顏色要更鮮艷一點”。這樣的可視搜索還適合地毯、布料、內(nèi)裝修、建筑等方面的商品選購。它需要一種集中更新的圖像數(shù)據(jù)庫系統(tǒng)支持分布的銷售點的信息存取。,2)生物醫(yī)學(xué)應(yīng)用 - 醫(yī)學(xué)是視覺識別技術(shù)的用武之地之一。醫(yī)學(xué)資料充滿了大量的圖像,以不同的縮放比例,表示身體各部分正常和病變的狀況。診斷中通常需要調(diào)用這些資料,而僅僅用基于文本的描述是不夠的。因
21、此,需要能夠響應(yīng)圖像查詢的搜索引擎。醫(yī)生調(diào)用醫(yī)療數(shù)據(jù)庫中的病例記錄,比較X光照片以判斷病變組織。醫(yī)學(xué)中的 3D成像技術(shù)越來越重要,因此,圖像查詢要能夠處理2D和3D數(shù)據(jù)。有些病例資料包含聲音描述,例如胸透X光照片結(jié)合咳嗽聲,這時需要交叉模型的搜索方法支持查詢。,3)遙感應(yīng)用 - 遙感應(yīng)用基于衛(wèi)星圖像數(shù)據(jù)庫。數(shù)以百萬計的圖像是按照全色、多頻譜、超頻譜等方法獲得的。直到現(xiàn)在,圖像庫中的搜索還是基于文本信息的,例如現(xiàn)場名、幾何、頻譜和地物信息。一種挑戰(zhàn)是為在線數(shù)據(jù)庫系統(tǒng)提供以下功能:文本查詢、基于整體和部分參考圖像(一個和多個頻譜邊帶)的圖像查詢、基于內(nèi)容的檢索和瀏覽、保密性和數(shù)據(jù)保護(hù)。 4)半自動
22、多媒體編輯 - 在擁有足夠的內(nèi)容信息條件下,多媒體對象可以干些什么?擁有足夠的自身結(jié)構(gòu)信息,再結(jié)合操縱這些結(jié)構(gòu)的方法,一段“靈巧”的多媒體數(shù)據(jù)片段能夠自己編輯自己,以適應(yīng)鄰接的多媒體數(shù)據(jù)。例如,來自不同信息源的一段音樂和視頻片段可以自動結(jié)合并同步在指定的同步點。,5)教育應(yīng)用 - 在教育軟件中使用多媒體所面臨的挑戰(zhàn)是盡量利用媒體內(nèi)在的信息支持各種教學(xué)方法,諸如小結(jié)、問答、對錯誤理解和非理解的反應(yīng)檢測等。通過提供對大型數(shù)據(jù)庫中視頻序列和圖像、圖形、動畫媒體的基于內(nèi)容存取,MPEG7 可以促進(jìn)教育領(lǐng)域采用音頻和視頻等媒體資料進(jìn)行形象直觀的教學(xué)和培訓(xùn)。應(yīng)用的方式主要是通過在線的視聽資料的檢索和比較,
23、在課堂里生動形象地展示教學(xué)內(nèi)容。例如歷史課、表演藝術(shù)課、音樂課等。 6)監(jiān)測應(yīng)用 - 在監(jiān)測應(yīng)用中,攝像機(jī)監(jiān)視敏感區(qū)域,如果某事件發(fā)生,系統(tǒng)即觸發(fā)行動。系統(tǒng)可以建立數(shù)據(jù)庫,積累視頻數(shù)據(jù)和元數(shù)據(jù)信息。元數(shù)據(jù)的提取(在編碼器端)和元數(shù)據(jù)的使用(在解碼器端) 采用相同的數(shù)據(jù)庫。對采集的數(shù)據(jù)庫可以進(jìn)行為指定的事件搜索音頻/視頻數(shù)據(jù)庫、查找相似的事件、判斷和決策。,7)基于視覺的控制 - 在控制領(lǐng)域,基于視覺的控制不是用基于文本的方法控制程序,而是采用圖像、視覺對象和圖像序列來指定控制行為,形成完整的控制環(huán)。這里要求多媒體對象的描述中包含豐富的對象時空關(guān)系描述,以及任意對象之間的關(guān)系描述。在這些標(biāo)準(zhǔn)的關(guān)
24、系描述基礎(chǔ)上可以實現(xiàn)基于視覺的控制系統(tǒng)。,4.5 -21多媒體框架標(biāo)準(zhǔn) 數(shù)字圖書館是采用現(xiàn)代高新技術(shù)的數(shù)字信息資源系統(tǒng),它不受時間和空間的限制,是一個多功能、易于使用、超大規(guī)模的信息資源庫。在數(shù)字圖書館的資源建設(shè)中,多媒體信息占據(jù)了信息資源的很大一部分。如何獲取數(shù)字視頻/音頻及合成圖形等信息,如何傳送各種不同類型的媒體并為用戶提供透明的信息服務(wù),以及如何進(jìn)行內(nèi)容的管理、內(nèi)容的重定位、各種權(quán)利的保護(hù)、非授權(quán)存取和修改的保護(hù)等問題,日益受到數(shù)字圖書館建設(shè)者的重視。目前已經(jīng)建立的傳輸和數(shù)字媒體的基礎(chǔ)結(jié)構(gòu)、要素、規(guī)范之間還沒有一個明確的關(guān)系描述方法。如果有一種結(jié)構(gòu)或者框架能夠保證數(shù)字媒體消費的簡單性,
25、并在一定的情況下自動完成交易,那么它就能夠處理好數(shù)字項消費中諸要素之間的關(guān)系。-21就是在這種背景下提出的。 -21總體上來講是一個支持通過異構(gòu)網(wǎng)絡(luò)和設(shè)備使用戶透明而廣泛地使用多媒體資源的標(biāo)準(zhǔn),其目標(biāo)是建立一個交互的多媒體框架。-21是一個針對實現(xiàn)具有知識產(chǎn)權(quán)管理和保護(hù)能力的數(shù)字多媒體內(nèi)容的技術(shù)標(biāo)準(zhǔn)。,-21的基本概念 -21是由通過數(shù)字而相互作用的用戶組成的。-21的行為主體是用戶,規(guī)范的動作是“使用”,作用的客體是數(shù)字項,-21作用的過程中形成了多媒體內(nèi)容傳送鏈和價值傳送鏈。以下是-21的三個基本概念。1用戶()-21中的用戶是一個廣義的概念,可以是世界各地的個人、消費者、團(tuán)體、組織、公司
26、、政府以及其他標(biāo)準(zhǔn)化組織和主體。從技術(shù)上講,-21認(rèn)為內(nèi)容的提供者和消費者同樣都是-21的用戶。用戶可以各種方式“使用”內(nèi)容,包括對內(nèi)容進(jìn)行發(fā)布、遞送和消費等。 2使用()-21提供了一個多媒體框架供一個用戶與另一用戶進(jìn)行以數(shù)字信息為目標(biāo)相互作用,相互作用所涉及的各方均為用戶。這里所指的相互作用即為對內(nèi)容的“使用”,它包括內(nèi)容創(chuàng)建、內(nèi)容提供、內(nèi)容存檔、內(nèi)容定級、內(nèi)容增強(qiáng)和遞送、內(nèi)容聚集、內(nèi)容傳輸、內(nèi)容發(fā)表、內(nèi)容零售、內(nèi)容消費、內(nèi)容提交、內(nèi)容管制、以上各項交易的簡化及管制等。 3數(shù)字項()-21的數(shù)字項是一個結(jié)構(gòu)化的數(shù)字對象,是按標(biāo)準(zhǔn)進(jìn)行表達(dá)、標(biāo)記并帶有描述性的數(shù)據(jù)。數(shù)字項是數(shù)字資源及其相關(guān)內(nèi)容
27、(圖像、數(shù)據(jù)文件、音頻、視頻等)的集合。它是-21框架中傳送和交易的最基本單元,是用戶之間發(fā)生關(guān)系的目的。,-21的結(jié)構(gòu)組成-21多媒體框架是一個結(jié)構(gòu)化的框架,從結(jié)構(gòu)上可分成七大要素:.數(shù)字項聲明():數(shù)字項聲明的目的是建立數(shù)字項統(tǒng)一和靈活的摘要和數(shù)字項的可互操作性方案。對于同一內(nèi)容有許多描述方法,因此希望能有一個強(qiáng)大的、方便的數(shù)字項模型來表示無數(shù)種形式中的數(shù)字項的描述。 .內(nèi)容展現(xiàn)手法():它是不同媒體的數(shù)據(jù)展現(xiàn)方式,如音頻、視頻的播放。-21提供的內(nèi)容表示可以通過分級的和錯誤恢復(fù)方法有效地表示任何數(shù)據(jù)類型??蚣苤械膬?nèi)容可以編碼、描述、存儲、傳送、保護(hù)、交易、消費等。在-21中,多媒體內(nèi)容表
28、示可完成對-21基本對象的表示。 .數(shù)字項的標(biāo)記和描述():這是對不同自然屬性、類型的數(shù)字項進(jìn)行統(tǒng)一標(biāo)記和描述的結(jié)構(gòu)。 .內(nèi)容的管理和使用():-21的目的是通過各種不同的網(wǎng)絡(luò)和設(shè)備透明地使用網(wǎng)絡(luò)內(nèi)容,所以對于內(nèi)容的檢索、定位、存檔、跟蹤、發(fā)布、使用顯得越來越重要。,.知識產(chǎn)權(quán)的管理和保護(hù)():-21可通過大范圍的網(wǎng)絡(luò)和設(shè)備對這些權(quán)利、興趣和認(rèn)定事項提供可靠的管理和保護(hù),同時在某種程度上獲得、編輯、發(fā)布相關(guān)的政策、法規(guī)、準(zhǔn)則。 .終端和網(wǎng)絡(luò)():-21通過屏蔽網(wǎng)絡(luò)和終端的安裝、管理和實現(xiàn)問題,使用戶能夠透明地操作和發(fā)布高級多媒體內(nèi)容。 .事件報告( ):它可以使用戶準(zhǔn)確了解框架中所有可報告事件
29、的接口和計量。事件報告將為用戶提供特定交互的執(zhí)行方法,同樣允許大量超范圍的處理,允許其他框架和模型與-21實現(xiàn)互操作。,-21的關(guān)鍵問題 1網(wǎng)絡(luò)部分的關(guān)鍵問題 .網(wǎng)絡(luò)傳送:包括傳送帶寬和速度、網(wǎng)絡(luò)的一致性和可靠性、數(shù)據(jù)流控制、延遲、差錯率、存取時間、移動性、性能價格比以及連通性等問題。 .服務(wù)和設(shè)備的易用性:涉及到智能化、綜合連接、設(shè)備兼容、不同平臺之間的互操作性、國際間兼容性、設(shè)備設(shè)計上對民族文化的沖擊以及設(shè)備之間的分布式智能化等問題。 .物理媒體格式的互操作性:包括與內(nèi)容無關(guān)的格式、后向兼容格式、媒體的壽命、不同平臺的標(biāo)準(zhǔn)存儲媒質(zhì)以及媒質(zhì)間的內(nèi)容傳輸?shù)取?.多平臺的解碼和繪制:在不同類型或
30、不同參數(shù)的平臺(設(shè)備)上回放內(nèi)容,并保證一定的質(zhì)量,另外還包括保證不同編解碼模式對用戶的透明性等問題。2內(nèi)容和質(zhì)量方面的關(guān)鍵問題 .服務(wù)質(zhì)量和靈活性:包括可靠性、質(zhì)量檢測、用戶感知的質(zhì)量、信息集成、評價、易用性、對用戶需求的動態(tài)響應(yīng)、點播、有效平滑的繪制、可預(yù)測性和連續(xù)性,以及服務(wù)的可接入性等問題。,-21的關(guān)鍵問題 .內(nèi)容表示的質(zhì)量:包括權(quán)限和完整性、保真性和用戶感知質(zhì)量(智能質(zhì)量)檢測、價格的一致性、真實性、持續(xù)性和時效性等問題。 .內(nèi)容藝術(shù)性方面的質(zhì)量:涉及品牌、來源、豐富性、評論、一致性等問題。 .內(nèi)容的過濾、定位、檢索和存儲:包括一致的內(nèi)容標(biāo)記、描述和查詢的反應(yīng)時間、在內(nèi)容選擇上的個
31、性化服務(wù)、搜索的完整性、有效性、可信性、內(nèi)容真實性的認(rèn)證、等級與分類、更新,以及對內(nèi)容的組織管理等方面問題。 3消費者方面的關(guān)鍵問題 .付費/訂購:包括免費服務(wù)、以收聽廣告或給出個人數(shù)據(jù)的免費服務(wù)、收費的獎賞模型、租借、分類付費、獎賞的復(fù)制件、點播、每項服務(wù)的簽署、簡單明了的收費模型、支付的驗證等等; .消費者信息發(fā)布:包括內(nèi)容的保護(hù)和管理、自創(chuàng)內(nèi)容的可存取性、版權(quán)購買等; .消費者使用權(quán)限:包括消費者對內(nèi)容的擁有、使用、復(fù)制、編輯等權(quán)限的管理; .消費者隱私保護(hù):在消費者和服務(wù)提供商或第三方之間保證個人交易隱私的協(xié)商能力。,-21的最終目標(biāo)是為多媒體信息的用戶提供透明而有效的電子交易和使用環(huán)
32、境。-21最近完成的兩項數(shù)字版權(quán)技術(shù)規(guī)范也將給數(shù)字圖書館多媒體信息資源的版權(quán)管理提供新的思路。相信隨著-21標(biāo)準(zhǔn)的不斷發(fā)展和完善,它將在數(shù)字圖書館的多媒體信息服務(wù)中發(fā)揮重要的作用。 MPEG官方網(wǎng)址 ,5、國外多媒體元數(shù)據(jù)研究 ECHO (European Chronicles On-line) http:/pc-r.it/echo/# 為數(shù)字影音文件提供長期可重復(fù)使用的軟件結(jié)構(gòu) 支持服務(wù)擴(kuò)展性 以IFLA的數(shù)目記錄功能需求模型(FRBR model)為基礎(chǔ),將影音資料分成四種層次: Work 作品 Expression 內(nèi)容版本 Manifestation
33、 載體版本 item 條目,ECHO元數(shù)據(jù)模型圖,書目記錄功能需求FRBR模型 Functional Requirements for Bibliographic Records 研究小組成立于1991年,成員來自IFLA Section on Cataloguing與Section on Classification and Indexing 目標(biāo): 提供清晰的聯(lián)接書目編目資料的結(jié)構(gòu)化架構(gòu) 建立國家資料庫的概念性架構(gòu) 建議國家書目記錄的核心層 實體的四種表現(xiàn)層次: Work 作品 Expression 內(nèi)容版本 Manifestation 載體版本 item 條目 影響眾多標(biāo)準(zhǔn)的發(fā)展、再完善,為當(dāng)前國際書目研究所矚目 ISBD AACR MARC21 ,VRA核心類目 /vracore3.htm 最初的描述對象是為網(wǎng)絡(luò)環(huán)境下藝術(shù)、建筑、史前古器物、民間文化等藝術(shù)類可視化資源,主要用于博物館的收藏,后來擴(kuò)展應(yīng)用到非藝術(shù)類領(lǐng)域 組成: 作品著錄類目 用于作品實體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/IEC TR 18720:2024 EN Information technology - User interfaces - Use cases of serviced offices
- 【正版授權(quán)】 ISO 19642-7:2019 EN Road vehicles - Automotive cables - Part 7: Dimensions and requirements for 30 V a.c. or 60 V d.c. round,sheathed,screened or unscreened multi or singl
- 2025至2030中國男士針織服裝行業(yè)發(fā)展研究與產(chǎn)業(yè)戰(zhàn)略規(guī)劃分析評估報告
- 2025至2030中國甲型流感病毒H3N2亞型感染藥物行業(yè)產(chǎn)業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國珠寶租賃行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 心理健康在班級管理中的重要性探討
- 政策效果評估中的數(shù)據(jù)挖掘與處理技術(shù)
- 智慧教室在特殊教育中的應(yīng)用探索
- 智慧城市燈光秀創(chuàng)新與技術(shù)的結(jié)合
- 設(shè)備維修知識培訓(xùn)
- 黨課課件含講稿:《關(guān)于加強(qiáng)黨的作風(fēng)建設(shè)論述摘編》輔導(dǎo)報告
- 國家開放大學(xué)行管專科《監(jiān)督學(xué)》期末紙質(zhì)考試總題庫2025春期版
- 亞科科技(安慶)有限公司高端生物緩沖劑及配套項目(一期)環(huán)境影響報告書
- GB/T 4857.4-2008包裝運輸包裝件基本試驗第4部分:采用壓力試驗機(jī)進(jìn)行的抗壓和堆碼試驗方法
- GB/T 3280-2015不銹鋼冷軋鋼板和鋼帶
- GB/T 24816-2009起重用短環(huán)鏈吊鏈等用8級普通精度鏈
- GB/T 17187-2009農(nóng)業(yè)灌溉設(shè)備滴頭和滴灌管技術(shù)規(guī)范和試驗方法
- ERAS快速康復(fù)理念在胃腸外科應(yīng)用課件
- 17025檢測和校準(zhǔn)實驗室認(rèn)可準(zhǔn)則解析
- 工業(yè)廢水處理工(中級工)理論試題庫匯總-上(單選、多選題)
- 潛水泵操作JSA分析表
評論
0/150
提交評論