多媒體技術(shù)原理及應(yīng)用(馬華東第二版)6第六章_第1頁
多媒體技術(shù)原理及應(yīng)用(馬華東第二版)6第六章_第2頁
多媒體技術(shù)原理及應(yīng)用(馬華東第二版)6第六章_第3頁
多媒體技術(shù)原理及應(yīng)用(馬華東第二版)6第六章_第4頁
多媒體技術(shù)原理及應(yīng)用(馬華東第二版)6第六章_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第6章 多媒體數(shù)據(jù)庫及基于內(nèi)容檢索 n多媒體數(shù)據(jù)管理 n多媒體數(shù)據(jù)庫管理系統(tǒng)n面向?qū)ο蠹夹g(shù)與MDBMSn基于內(nèi)容的檢索技術(shù)6.1 多媒體數(shù)據(jù)管理環(huán)境 多媒體應(yīng)用系統(tǒng)關(guān)鍵問題就是對系統(tǒng)中數(shù)據(jù)進(jìn)行有效地管理:n對多媒體數(shù)據(jù)的有效管理能盡量減少開發(fā)費(fèi)用;n便于綜合利用、數(shù)據(jù)共享,降低成本、提高效益;n對提高多媒體應(yīng)用程序的執(zhí)行效率和運(yùn)行質(zhì)量也具有十分重要的意義。1.多媒體數(shù)據(jù)的存儲環(huán)境n對多媒體數(shù)據(jù)的存儲環(huán)境總的要求是: 容量大、質(zhì)量好、存取速度快、價格合適。n主要有4類存儲介質(zhì): (1)可更換的硬盤; (2)磁帶備份介質(zhì); (3)光盤檔案介質(zhì); (4)磁盤陣列。2.多媒體數(shù)據(jù)的傳輸環(huán)境 一般有3種

2、傳輸方法:(1)使用可更換的介質(zhì)進(jìn)行人工傳輸。使用軟盤、磁帶、光盤、可更換硬盤等工具;(2)使用串行端口實(shí)行點(diǎn)對點(diǎn)傳輸。成本低, 但難以實(shí)現(xiàn)多臺計算機(jī)之間數(shù)據(jù)傳輸;(3)使用網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)計算機(jī)之間傳輸。3.多媒體數(shù)據(jù)管理的軟件環(huán)境 對多媒體數(shù)據(jù)資源的有效管理方法:(1)文件管理系統(tǒng) 。(2)建立特定的邏輯目錄。 (3)傳統(tǒng)的字符、數(shù)值數(shù)據(jù)庫管理系統(tǒng)。(4)多媒體數(shù)據(jù)庫管理系統(tǒng) 。(5)超文本和超媒體 。圖6.1 用傳統(tǒng)的DBMS管理多媒體數(shù)據(jù)6.2 多媒體數(shù)據(jù)庫管理系統(tǒng) 6.2.1 多媒體數(shù)據(jù)庫管理系統(tǒng)特點(diǎn) n依據(jù)獨(dú)立性原則, DBMS按層次劃分為3種模式: 物理模式、概念模式和外部模式。n

3、物理模式定義數(shù)據(jù)存儲組織方法, 如數(shù)據(jù)庫文件的格式、索引文件組織方法、數(shù)據(jù)庫在網(wǎng)絡(luò)上的分布方法等(存儲模式)。n概念模式借助數(shù)據(jù)模型來描述,它定義抽象現(xiàn)實(shí)世界的方法。數(shù)據(jù)庫模型先后經(jīng)歷了網(wǎng)狀模型、關(guān)系模型和面向?qū)ο竽P偷入A段。n外部模式又叫視圖,它是概念模式對用戶有用的那一部分。 圖6.2 DBMS的3層模式 數(shù)據(jù)庫物理模式概念模式外部模式用戶用戶用戶多媒體數(shù)據(jù)對數(shù)據(jù)庫的影響(1)數(shù)據(jù)量大且媒體之間差異也極大,從而影響數(shù)據(jù)庫中的組織和存儲方法。(2)媒體種類增多增加了數(shù)據(jù)處理困難。 (3)多媒體不僅改變了數(shù)據(jù)庫的接口,使其聲、文、圖并茂,而且也改變了數(shù)據(jù)庫的操作形式,其中最重要的是查詢機(jī)制和查

4、詢方法。(4)傳統(tǒng)的事務(wù)一般都是短小精悍,在多媒體數(shù)據(jù)庫管理系統(tǒng)中也應(yīng)盡可能采用短事務(wù)。為保證播放不致中斷,MDBMS應(yīng)增加這種處理長事務(wù)的能力。(5)多媒體數(shù)據(jù)庫管理還有考慮版本控制的問題。6.2.2 MDBMS的功能要求 (1) MDBMS必須能表示和處理各種媒體數(shù)據(jù),重點(diǎn)是不規(guī)則數(shù)據(jù)如圖形、圖像、聲音的表示方法。 (2) MDBMS必須能反映和管理各種媒體數(shù)據(jù)的特性,或各種媒體數(shù)據(jù)之間的空間或時間的關(guān)聯(lián)。 (3) MDBMS除必須滿足物理數(shù)據(jù)獨(dú)立性和邏輯數(shù)據(jù)獨(dú)立性外,還應(yīng)滿足媒體數(shù)據(jù)獨(dú)立性。 物理數(shù)據(jù)獨(dú)立性指當(dāng)物理數(shù)據(jù)組織改變時,不影響概念數(shù)據(jù)組織。 邏輯數(shù)據(jù)獨(dú)立性指概念數(shù)據(jù)組織改變時,

5、不影響用戶程序使用的視圖。媒體數(shù)據(jù)獨(dú)立性指在MDBMS的設(shè)計和實(shí)現(xiàn)時,要求系統(tǒng)能保持各種媒體獨(dú)立性和透明性。(4) MDBMS的數(shù)據(jù)操作功能。(5) MDBMS的網(wǎng)絡(luò)功能。應(yīng)解決分布在網(wǎng)絡(luò)上的多媒體數(shù)據(jù)庫中數(shù)據(jù)的定義、存儲、操作問題,并對數(shù)據(jù)一致性、安全性、并發(fā)性進(jìn)行管理。(6)MDBMS應(yīng)具有開放功能,提供MDB的應(yīng)用程序接口API,并提供獨(dú)立于外設(shè)和格式的接口。(7) MDBMS還應(yīng)提供事務(wù)和版本管理功能。 6.2.3 MDBMS的組織結(jié)構(gòu) MDBMS的組織結(jié)構(gòu)一般可分為3種:n集中型。n主從型。n協(xié)作型 。1. 集中型MDBMSn由單獨(dú)一個MDBMS來管理和建立不同媒體的數(shù)據(jù)庫,并由這個

6、MDBMS來管理對象空間及目的數(shù)據(jù)的集成。MDBMS 圖像數(shù)據(jù)庫 圖形數(shù)據(jù)庫 音頻數(shù)據(jù)庫 文本數(shù)據(jù)庫 視頻數(shù)據(jù)庫圖6.4 集中型MDBMS的組織結(jié)構(gòu)2. 主從型MDBMS n每個數(shù)據(jù)庫都有自己的管理系統(tǒng), 稱為從數(shù)據(jù)庫管理系統(tǒng),它們各自管理自己的數(shù)據(jù)庫。n這些從數(shù)據(jù)庫管理系統(tǒng)又受一個稱為主數(shù)據(jù)庫管理系統(tǒng)的控制和管理 。從MDBMS從MDBMS從MDBMS從MDBMSMDBMSMDBMS某種MDB某種MDB某種MDB某種MDB多媒體數(shù)據(jù)庫圖6.5 主從型MDBMS的組織結(jié)構(gòu) 3. 協(xié)作型MDBMS n協(xié)作型MDBMS也是由多個數(shù)據(jù)庫管理系統(tǒng)來組成, 每個數(shù)據(jù)庫管理系統(tǒng)之間沒有主從之分。n要求系統(tǒng)

7、中每個數(shù)據(jù)庫管理系統(tǒng)(稱為成員MDBMS)能協(xié)調(diào)地工作,但因每一成員MDBMS彼此有差異, 所以在通信中必須首先解決這個問題。 成員 MDBMS 成員 MDBMS 成員 MDBMSMDBMS 某種MDB 某種MDB 某種MDB 附加軟件 附加軟件 附加軟件 多媒體數(shù)據(jù)庫圖6.6 協(xié)作型MDBMS的組織結(jié)構(gòu)6.2.4 MDBMS的數(shù)據(jù)模型 n數(shù)據(jù)模型的概念n擴(kuò)充的關(guān)系數(shù)據(jù)模型n應(yīng)用實(shí)例1. 數(shù)據(jù)模型的概念 n數(shù)據(jù)模型通常由數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作和完整性約束三部分組成, 也稱數(shù)據(jù)模型三要素。n數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)結(jié)構(gòu)是對數(shù)據(jù)庫系統(tǒng)靜態(tài)特性的描述,是所研究的對象類型的集合。這些對象是數(shù)據(jù)庫的組成成分。n數(shù)據(jù)庫系

8、統(tǒng)通常按數(shù)據(jù)結(jié)構(gòu)的類型來命名數(shù)據(jù)類型, 如層次模型、網(wǎng)狀模型、關(guān)系模型和面向?qū)ο竽P汀?n數(shù)據(jù)操作數(shù)據(jù)操作是對數(shù)據(jù)庫系統(tǒng)動態(tài)特性的描述,如數(shù)據(jù)庫中各種對象的實(shí)例、允許執(zhí)行的操作集合。n數(shù)據(jù)的約束條件約束條件是實(shí)現(xiàn)數(shù)據(jù)庫完整性規(guī)則的集合,所謂完整性規(guī)則是指給定的數(shù)據(jù)模型中數(shù)據(jù)及它們之間關(guān)聯(lián)所具有的制約和依存規(guī)則,用以限定符合數(shù)據(jù)模型的數(shù)據(jù)庫狀態(tài)以及狀態(tài)的變化, 以保證數(shù)據(jù)庫數(shù)據(jù)的正確、有效、相容和一致。n數(shù)據(jù)模型應(yīng)該提供定義數(shù)據(jù)完整性約束條件的機(jī)制,以反映數(shù)據(jù)必須遵守的特定的語義約束條件。 2.常用的數(shù)據(jù)模型 n早期DBMS采用層次模型,它利用樹型結(jié)構(gòu)來表示實(shí)體及實(shí)體之間聯(lián)系。模型中節(jié)點(diǎn)為記錄型

9、,表示某種類型的實(shí)體;節(jié)點(diǎn)之間的連線表示它們之間的關(guān)系。 n 層次模型構(gòu)造簡單,易于實(shí)現(xiàn)。典型的應(yīng)用如公司、大學(xué)的行政架構(gòu)表示。n 基于層次模型的數(shù)據(jù)庫稱為層次數(shù)據(jù)庫,它支持用戶以瀏覽方式完成對數(shù)據(jù)訪問,對子節(jié)點(diǎn)記錄的訪問需經(jīng)過父節(jié)點(diǎn)。n 層次模型的限制是:任何非根節(jié)點(diǎn)的節(jié)點(diǎn)有且僅有一個父節(jié)點(diǎn); 父子節(jié)點(diǎn)只能是1:n關(guān)系, 不能表示兩類實(shí)體間的m:n關(guān)系。 n利用網(wǎng)狀結(jié)構(gòu)來表示實(shí)體與實(shí)體之間聯(lián)系的數(shù)據(jù)模型稱為網(wǎng)狀模型, 其節(jié)點(diǎn)為記錄型, 用于表示某類實(shí)體。n允許節(jié)點(diǎn)有多個父節(jié)點(diǎn), 比層次模型更通用。基于網(wǎng)狀模型的網(wǎng)狀數(shù)據(jù)庫管理系統(tǒng)也主要支持用戶以瀏覽的方式完成對數(shù)據(jù)記錄的訪問,但由于節(jié)點(diǎn)可有多

10、個父節(jié)點(diǎn), 對網(wǎng)狀數(shù)據(jù)庫中某節(jié)點(diǎn)的訪問路徑可以有多條。 n層次和網(wǎng)狀數(shù)據(jù)庫管理系統(tǒng)均不支持?jǐn)?shù)據(jù)獨(dú)立性。數(shù)據(jù)庫結(jié)構(gòu)的調(diào)整將使應(yīng)用隨之變化,這就限制了數(shù)據(jù)庫系統(tǒng)及其應(yīng)用的可擴(kuò)展性、可重用性及可移植性。n關(guān)系模型克服了上述兩種模型的缺陷, 利用二維的表來表示實(shí)體及實(shí)體之間的關(guān)系, 每張二維表又稱為一個關(guān)系。n二維表每一列代表實(shí)體以及實(shí)體之間關(guān)系的某種屬性。屬性名的集合如C1, C2, , Cn表示某種記錄類型。每一列除了具有屬性名外, 還具有類型特征, 該特征決定了屬性的取值范圍,稱為域。這種表可直接描述兩個實(shí)體類型間的m: n關(guān)系。 n關(guān)系模型可通過關(guān)系代數(shù)嚴(yán)格定義。一張二維表可定義為一組域的笛卡

11、兒積的子積。域D1, D2, , Dn的笛卡兒積定義為: D1D2Dn=(C1,C2, , Cn)|CiDi, i=1,2,nn關(guān)系R可表示為: R D1D2Dn, n為關(guān)系的度。一個關(guān)系的結(jié)構(gòu)可表示為 R:(C1:D1, C2:D2,Cn:Dn) 其中Ci(i=1,2,n)為屬性名。 nRDBMS對數(shù)據(jù)的各種操作歸結(jié)為各種集合運(yùn)算。n除了支持傳統(tǒng)的集合運(yùn)算之外, 還定義了專門的關(guān)系運(yùn)算,如投影、選擇、連接等。n它還利用一階謂詞邏輯來判斷表中元組是否滿足用戶定義的條件。用戶定義的條件由邏輯運(yùn)算符(and)、(or)、(not)連接各算術(shù)表達(dá)式組成。n關(guān)系代數(shù)和一階謂詞演算構(gòu)成了RDBMS支持的

12、數(shù)據(jù)庫接口語言SQL的基礎(chǔ) n擴(kuò)充的原因: 傳統(tǒng)的關(guān)系模型結(jié)構(gòu)簡單,是單一的二維表, 數(shù)據(jù)類型和長度也被局限在一個較小的子集中,又不支持新的數(shù)據(jù)類型和數(shù)據(jù)結(jié)構(gòu), 很難實(shí)現(xiàn)空間數(shù)據(jù)和時態(tài)數(shù)據(jù),缺乏演繹和推理操作, 因此表達(dá)數(shù)據(jù)特性的能力受到限制。n在MDBMS中使用關(guān)系模型, 必須對現(xiàn)有的關(guān)系模型進(jìn)行擴(kuò)充,使它不但能支持格式化數(shù)據(jù),也能處理非格式化數(shù)據(jù)。 n模型擴(kuò)充主要有3種策略:(1)使關(guān)系數(shù)據(jù)庫管理技術(shù)和操作系統(tǒng)中文件系統(tǒng)功能相結(jié)合, 實(shí)現(xiàn)對非格式化數(shù)據(jù)的管理。其主要方法是以存放非格式化數(shù)據(jù)的文件名代替。 (2)將關(guān)系元組中格式化數(shù)據(jù)和非格式化數(shù)據(jù)裝在一起形成一個完整的元組,存放在數(shù)據(jù)頁面或

13、數(shù)據(jù)頁面組中,統(tǒng)一管理(大系統(tǒng)采用)。 (3)將元組中非格式化數(shù)據(jù)分成兩部分,一部分是格式化數(shù)據(jù)本身,另一部分是對非格式化數(shù)據(jù)的引用(小系統(tǒng)采用)。n3種策略的關(guān)鍵是要擴(kuò)充數(shù)據(jù)類型, 解決非格式化數(shù)據(jù)的語義解釋。 n Paradox是由Borland公司開發(fā)的,Paradox增加了4種數(shù)據(jù)類型: 動態(tài)注釋、格式注釋、圖形和大二進(jìn)制對象(Blob)。 OLE類型是Blob的一種特殊格式, 可使Paradox用作一個OLE主機(jī)。 nFoxPro是Microsoft公司的產(chǎn)品,它是在DBase基礎(chǔ)上發(fā)展起來的。為了處理多媒體數(shù)據(jù),F(xiàn)oxPro2.5引入一個新的屬性類型General,它可以容納任何一

14、種多媒體數(shù)據(jù),包括文本、圖形、圖像或聲音數(shù)據(jù)。在Windows中, FoxPro相當(dāng)于一個OLE客戶,通過在表中定義一個類型為General的字段,可以為鏈接或嵌入任何對象預(yù)留空間。 6.2.5 關(guān)系型多媒體數(shù)據(jù)庫的應(yīng)用 n某公司需要用Oracle8.1.6數(shù)據(jù)庫管理雇員資料, 雇員信息包括工號、年齡、性別、月工資、所在部門、該部門經(jīng)理、雇員的免冠照片等屬性。 n對這樣比較復(fù)雜結(jié)構(gòu)的實(shí)體(雇員),關(guān)系數(shù)據(jù)庫需要把它分解成最簡單實(shí)用的關(guān)系(雇員和部門)表示,實(shí)體的結(jié)構(gòu)語義隱性地包含在兩個關(guān)系的相同屬性中, 只有通過聯(lián)結(jié)、投影等操作才能體現(xiàn)出結(jié)構(gòu)語義 。n此例中雇員照片屬性的存儲可利用Oracle

15、數(shù)據(jù)庫提供的LOB屬性類型實(shí)現(xiàn)的。LOB (Large Object)就是存儲大對象的屬性類型, 當(dāng)數(shù)據(jù)量過大不能直接存入數(shù)據(jù)庫中時, 可以使用LOB屬性類型。 圖6.9 關(guān)系實(shí)例 工號姓名 年齡 性別月工資部門編號雇員照片001張三28男1500001ZHANG部門編號部門名稱部門經(jīng)理001銷售科004關(guān)系雇員關(guān)系部門6.3 面向?qū)ο蠹夹g(shù)與MDBMS n面向?qū)ο蟮幕靖拍頽面向?qū)ο蟮臄?shù)據(jù)庫模型 n面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的實(shí)現(xiàn)方法 6.3.1 面向?qū)ο蟮幕靖拍?1)對象對象 是問題領(lǐng)域中的事物的表示或描述,世界上任何事物都是對象。對象具有名字標(biāo)識,并具有自身的狀態(tài)和功能。(2)屬性屬性 組成對象

16、的數(shù)據(jù)稱為對象的屬性。對象的屬性可以是系統(tǒng)或用戶定義的數(shù)據(jù)類型,也可以是抽象數(shù)據(jù)類型。狀態(tài)由屬性描述。(3)方法方法 定義在對象屬性上的一組操作稱為對象的方法,方法體現(xiàn)了對象的行為功能。(4)對象類對象類 類描述的是具有相似性質(zhì)(屬性)的一組對象, 這組對象具有一般行為(操作), 一般關(guān)系(對象之間的)及一般語義. (5)子類和超類子類和超類 類可以分成若干子類,這個被分成若干子類的類稱為超類,子類和超類在層次上可理解為“被概括”與“概括”的關(guān)系。(6)消息消息 在面向?qū)ο笙到y(tǒng)中,對象間的通訊和請求對象完成某種處理工作是通過消息傳遞實(shí)現(xiàn)的,消息傳遞相當(dāng)于一個間接的過程調(diào)用。(7)繼承性繼承性

17、子類不僅可以繼承超類對象的部分或全部屬性和方法, 還可以擁有自己的屬性和方法。繼承性具有雙重作用,一是可以減少代碼冗余; 二是可以通過協(xié)調(diào)性來減少相互之間的接口。 6.3.2 面向?qū)ο蟮臄?shù)據(jù)庫模型 (1)面向?qū)ο竽P椭С帧熬酆稀迸c“概括”的概念,從而更好地處理多媒體數(shù)據(jù)等復(fù)雜對象的結(jié)構(gòu)語義。(2)而向?qū)ο竽P椭С殖橄髷?shù)據(jù)類型和用戶定義的方法,便于系統(tǒng)支持定義新的數(shù)據(jù)類型和操作。(3)面向?qū)ο笙到y(tǒng)的數(shù)據(jù)抽象、功能抽象與消息傳遞的特點(diǎn)使對象在系統(tǒng)中是獨(dú)立的, 具有良好的封閉性, 封閉了多媒體數(shù)據(jù)之間的類型及其他方面的巨大差異, 并且容易實(shí)現(xiàn)并行處理, 也便于系統(tǒng)模式的擴(kuò)充和修改。 (4)面向?qū)ο笙?/p>

18、統(tǒng)的對象類、類層次和繼承性的特點(diǎn),不僅減少了冗余和由此引起的一系列問題,還非常有利于版本控制。(5)面向?qū)ο笙到y(tǒng)中實(shí)體是獨(dú)立于值存在的,因而避免了關(guān)系數(shù)據(jù)庫中討論的各種異常。(6)面向?qū)ο笙到y(tǒng)的查詢語言通常是沿著系統(tǒng)提供的內(nèi)部固有聯(lián)系進(jìn)行的,避免了大量的查詢優(yōu)化工作。6.3.3 面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的實(shí)現(xiàn)方法 面向?qū)ο髷?shù)據(jù)庫和擴(kuò)展關(guān)系數(shù)據(jù)庫系統(tǒng)不同,它傾向于以數(shù)據(jù)模型入手,重新考慮不同于傳統(tǒng)DBMS的系統(tǒng)整體結(jié)構(gòu)、對象類層次的存儲結(jié)構(gòu)、存取方法和繼承性的實(shí)現(xiàn)方法、用戶定義的數(shù)據(jù)類型和方法的處理策略、必要的版本控制和友好的用戶界面,建立一個全新的 DBMS。1. 對象類型的建立 圖6.10 多媒體

19、類型系統(tǒng)2. 面向?qū)ο髷?shù)據(jù)庫系統(tǒng)結(jié)構(gòu) n根據(jù)系統(tǒng)模型的功能,設(shè)計適當(dāng)?shù)南到y(tǒng)結(jié)構(gòu)是面向?qū)ο蟮腄BMS實(shí)現(xiàn)的重要環(huán)節(jié)。 n由MCC公司研制的ORION系統(tǒng)由4個子系統(tǒng)構(gòu)成:(1)消息處理子系統(tǒng) ;(2)對象子系統(tǒng) ;(3)存儲子系統(tǒng) ;(4)事務(wù)管理子系統(tǒng)。 2. 面向?qū)ο髷?shù)據(jù)庫系統(tǒng)結(jié)構(gòu) 圖6.11 ORION系統(tǒng)結(jié)構(gòu)圖 消息處理子系統(tǒng)對象子系統(tǒng)事務(wù)子系統(tǒng) 存儲子系統(tǒng)ORION nORION-1SX是一個客戶機(jī)/服務(wù)器數(shù)據(jù)庫系統(tǒng),它有一個專用的服務(wù)器管理整個數(shù)據(jù)庫系統(tǒng),而應(yīng)用系統(tǒng)運(yùn)行的所有其他節(jié)點(diǎn)(客戶)同這個服務(wù)器進(jìn)行通信來存取數(shù)據(jù)庫。n對象子系統(tǒng)和消息子系統(tǒng)完全放置在客戶機(jī)上。另一方面,通訊子

20、系統(tǒng)以及部分事務(wù)和存儲子系統(tǒng)既放置于客戶機(jī)又放置于服務(wù)器中,通訊子系統(tǒng)負(fù)責(zé)打開、關(guān)閉和控制連接, 接收和傳遞客戶機(jī)和服務(wù)器之間的消息。 nORION-2是一個基于網(wǎng)絡(luò)的分布式數(shù)據(jù)庫系統(tǒng), 它由一個以上的節(jié)點(diǎn)進(jìn)行管理,使得數(shù)據(jù)庫的物理布局對用戶來說是透明的。圖6.12 ORION系統(tǒng)的功能單元 消息處理子系統(tǒng) 對象子系統(tǒng) 事務(wù)子系統(tǒng) 存儲子系統(tǒng)通信子系統(tǒng)服務(wù)器事務(wù)子系統(tǒng)服務(wù)器存儲子系統(tǒng)服務(wù)器客戶機(jī)面向?qū)ο笙到y(tǒng)Irisn除了一般的數(shù)據(jù)永久性、控制共享、后緩和恢復(fù)的需求之外,新需求的功能包括:豐富的數(shù)據(jù)建模結(jié)構(gòu)、對推理的直接數(shù)據(jù)庫支持、新的數(shù)據(jù)類型、長事務(wù)處理以及數(shù)據(jù)的多版本。n數(shù)據(jù)共享必須在對象級

21、別上以并行共享和串行共享兩者的意義上實(shí)現(xiàn),允許一個給定的對象能夠由用不同的面向?qū)ο蟮木幊陶Z言編寫的應(yīng)用來操作。Iris正是面向上述需要進(jìn)行設(shè)計。 圖6.13 Iris系統(tǒng)結(jié)構(gòu) 對象 SQL 圖形編輯器C對象CirisLisp對象LispIris對象管理器存儲管理器結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)3.面向?qū)ο蟮臄?shù)據(jù)庫系統(tǒng)的存儲結(jié)構(gòu)和存取方法 (1) 基于關(guān)系系統(tǒng)的方法。 (2) 更適合多媒體數(shù)據(jù)特點(diǎn)的存儲結(jié)構(gòu)和存取方法 。比較適合多媒體數(shù)據(jù)特點(diǎn)的存儲結(jié)構(gòu)和存取方法有EXODUS系統(tǒng)的B+樹索引結(jié)構(gòu)、適合多維空間對象的R+樹索引結(jié)構(gòu)等。 6.4 基于內(nèi)容的檢索技術(shù) 6.4.1 相關(guān)概念 n數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)

22、檢索是一種頻繁使用的任務(wù)。多媒體數(shù)據(jù)庫數(shù)據(jù)量大,數(shù)據(jù)種類多,給數(shù)據(jù)檢索帶來了新的問題。n多媒體數(shù)據(jù)庫包含大量的圖像、聲音、視頻等非格式化數(shù)據(jù),對它們的查詢或檢索比較復(fù)雜,往往要根據(jù)媒體中表達(dá)的情節(jié)內(nèi)容進(jìn)行檢索。n基于內(nèi)容的檢索(CBR)就是針對多媒體信息檢索使用的一種重要技術(shù) 。1.基于內(nèi)容的檢索技術(shù)的特點(diǎn) (1) 從媒體內(nèi)容中提取信息線索, 直接對媒體進(jìn)行分析, 抽取特征(如基于表達(dá)式)。(2) 提取特征方法多種多樣。如圖像特征有形狀、顏色、紋理、輪廓等特征。(3) 人機(jī)交互。人能迅速分辨要查找的信息, 但難以記住信息, 人工大量查詢費(fèi)時、重復(fù), 而這正是計算機(jī)的長處, 人機(jī)交互檢索可大大提

23、高多媒體數(shù)據(jù)檢索的效率。(4) 基于內(nèi)容的檢索采用一種近似的匹配技術(shù)。提取媒體對象內(nèi)容屬性的方式一般有手工方式、自動方式和混合方式。2. 媒體特征n音頻音頻 常利用的音頻特征包括基音,共振峰,線性預(yù)測倒譜系數(shù)、Mel倒譜系數(shù)(基于高斯混合模型的語音識別)等音頻低層特征,和聲紋、關(guān)鍵詞等高層特征。n靜態(tài)圖像靜態(tài)圖像 其底層特征包括顏色,紋理,幾何形狀,灰度統(tǒng)計特征; 高層特征包括人臉部特征,表情特征,物體和景物特征。n視頻視頻 包含的信息最豐富復(fù)雜,其底層特征包括鏡頭切換類型,特技效果,攝像機(jī)運(yùn)動,物體運(yùn)動軌跡,代表幀,全景圖等;高層特征包括描述鏡頭內(nèi)容的事件等。n文本文本 關(guān)鍵詞常被選為文本對

24、象的內(nèi)容屬性。n圖形圖形 幾何體各種形狀特征、周長、面積、位置、幾何體間空間關(guān)系的類型等,常被選為圖形內(nèi)容屬性。6.4.2 基于內(nèi)容的檢索實(shí)現(xiàn)方法 n一是基于傳統(tǒng)的數(shù)據(jù)庫檢索方法,即采用人工方法將多媒體信息內(nèi)容并表達(dá)為屬性(關(guān)鍵詞)集合,再在傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)框架內(nèi)處理。這種方法對信息采用了高度抽象,留給用戶選擇余地小,查詢方式和范圍有所限制。n二是基于信號處理理論, 即采用特征抽取和模式識別的方法來克服基于數(shù)據(jù)庫方法的局限性,但全自動地抽取特征和識別時間開銷太大,并且過分依賴于領(lǐng)域知識,識別難度大。 系統(tǒng)實(shí)現(xiàn) n在CRB系統(tǒng)中采用的有效方法包括相似性、模糊值、分段化等技術(shù),下面以視覺信息管

25、理系統(tǒng)(VIMS)為例介紹CRB系統(tǒng)的實(shí)現(xiàn) 。圖6.14 基于內(nèi)容的檢索系統(tǒng)結(jié)構(gòu)交互查詢 模塊 查詢 格式化新的圖像插入模塊數(shù)據(jù)(圖像) 處理模塊知識模塊圖像DB特征DB用戶圖6.15 檢索方法 視覺例程圖像插入查詢圖像被存儲的特征值查詢特征 計算相似性圖6.16 基于內(nèi)容的檢索過程6.4.3 圖像內(nèi)容分析及其檢索n 基于顏色直方圖檢索n 基于輪廓的檢索n 基于紋理的檢索n 視頻檢索6.4.4 MPEG-7標(biāo)準(zhǔn)nMPEG-1,2,4解決在多媒體高效存儲、傳輸和處理聲音圖像信息問題。但還沒有能解決多媒體信息檢索問題的工具。nMPEG-7標(biāo)準(zhǔn)即“多媒體內(nèi)容描述接口”。其目標(biāo)就是產(chǎn)生一種描述多媒體信

26、息的標(biāo)準(zhǔn), 滿足實(shí)時、非實(shí)時以及推-拉應(yīng)用的需求。并將該描述與所描述的內(nèi)容相聯(lián)系, 以實(shí)現(xiàn)快速有效的檢索。 nMPEG-7標(biāo)準(zhǔn)可獨(dú)立于其他MPEG標(biāo)準(zhǔn)使用,但MPEG-4所定義的音頻、視頻對象的描述適用于MPEG-7。MPEG-7適用范圍廣泛, 既可應(yīng)用于存儲,也可用于流式應(yīng)用。可在實(shí)時或非實(shí)時環(huán)境應(yīng)用。1. MPEG-7的相關(guān)概念n數(shù)據(jù)(Data) MPEG-7描述的多媒體信息, 包含圖形、靜止圖像、視頻、音樂、語音、文本和其他相關(guān)的媒體。n特征(Feature) 指數(shù)據(jù)的特性。特征本身不能比較,而要用有意義的特征表示(描述子)和它的實(shí)例(描述值)。如圖像的顏色、語音的聲調(diào)、音頻的旋律等。

27、n描述子(Descriptor,D) 是特征的表示。它定義特征表示的句法和語義,可以賦予描述值。一個特征可能有多個描述子,如顏色特征可能的描述子有:顏色直方圖、頻率分量的平均值、運(yùn)動的場描述、標(biāo)題文本等。 n描述值(Descriptor Value) 是描述子的實(shí)例。描述值與描述模式結(jié)合, 形成描述。 n描述模式(Description Scheme,DS) 說明其成員之間的關(guān)系結(jié)構(gòu)和語義。成員可以是描述子和描述模式。DS和D的區(qū)別是:D僅僅包含基本的數(shù)據(jù)類型,不引用其他D或DS。如影片從時間上結(jié)構(gòu)化為場景和鏡頭,在場景級包括一些文本描述子,在鏡頭級包含顏色、運(yùn)動和一些音頻描述子。 n描述(Description) 由一個描述模式和一組描述值組成。 n編碼的描述(Coded Description) 是對已

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論