數(shù)字化后的視頻和音頻等媒體信息具有海量性

上傳人：卓*** IP屬地：廣東上傳時(shí)間：2023-07-24 格式：PPT 頁(yè)數(shù)：80 大?。?.83MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩75頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字化后的視頻和音頻等媒體信息具有海量性第1頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.1數(shù)據(jù)壓縮的基本原理和方法

根據(jù)多媒體不同的表現(xiàn)形式和不同場(chǎng)合以及質(zhì)量方面的應(yīng)用需求，必須有針對(duì)性地進(jìn)行設(shè)計(jì)。而各種壓縮方法應(yīng)該符合一定范圍內(nèi)的性能指標(biāo)，以滿(mǎn)足實(shí)際應(yīng)用的領(lǐng)域的需要。

第2頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.1.1數(shù)據(jù)壓縮方法的分類(lèi)

數(shù)據(jù)壓縮技術(shù)自從1948年提出以來(lái)，經(jīng)過(guò)50多年的發(fā)展。

根據(jù)解碼后的數(shù)據(jù)與壓縮之前的原始數(shù)據(jù)是否完全一致，可以分為無(wú)損壓縮編碼和有損壓縮編碼。無(wú)損壓縮編碼具有可恢復(fù)性和可逆性。該編碼在壓縮時(shí)不丟失任何數(shù)據(jù)，即把所有的數(shù)據(jù)都作為比特序列，解壓后的數(shù)據(jù)與原始數(shù)據(jù)完全一致。

有損壓縮編碼不具有可恢復(fù)性和可逆性，該編碼在壓縮時(shí)舍棄冗余的數(shù)據(jù)，例如人眼較難分辨的顏色或人耳難以分辨的方向源信號(hào)，實(shí)際取決于初始信號(hào)的類(lèi)型、信號(hào)的相關(guān)性以及語(yǔ)義等內(nèi)容。這些被舍去的信息值是無(wú)法再找回的，所以還原后的數(shù)據(jù)與原始數(shù)據(jù)存在差異。

第3頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月統(tǒng)計(jì)編碼：屬于無(wú)失真編碼。根據(jù)信源符號(hào)出現(xiàn)概率的分布特性進(jìn)行編碼，讓概率大的信源符號(hào)用短碼字表示，讓概率小的信源符號(hào)用長(zhǎng)碼字表示，從而去除數(shù)據(jù)之間的冗余而達(dá)到壓縮的目的。預(yù)測(cè)編碼：根據(jù)離散信號(hào)之間存在一定的相關(guān)性特點(diǎn)，利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè)，然后對(duì)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行編碼。

如果所有的信源符號(hào)出現(xiàn)的概率相同，則說(shuō)明平均信息量最大，也就不存在信源的冗余。根據(jù)數(shù)據(jù)壓縮的原理可以分為：統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、變換編碼、分析-合成編碼和其他編碼。

第4頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月變換編碼：屬于有失真的編碼。變換編碼是將原始數(shù)據(jù)從初始空間或時(shí)間域進(jìn)行數(shù)學(xué)變換，變換為更適合于壓縮的抽象域。關(guān)鍵的是要尋找一個(gè)最佳變換，使信息中最重要的部分易于識(shí)別。變換本身是可逆的無(wú)損的，為了取得更好的效果，忽略了一些編碼位數(shù)較長(zhǎng)的系數(shù)而成為了有損編碼。變換編碼一般經(jīng)過(guò)變換、變換域采樣和量化三個(gè)步驟分析/合成編碼：是基于某種模型的編碼方法，這些模型可以是聲道模型、語(yǔ)音模型、人體模型等。通過(guò)分析模型的具體特征，確定與之匹配的編碼。

第5頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月其他編碼方法常見(jiàn)的有：混合編碼（HybridCoding）、矢量量化（VectorQuantize，VQ）、

LZW算法等。還有近年來(lái)新出現(xiàn)的編碼方法：人工神經(jīng)元網(wǎng)絡(luò)（ArtificialNeuralNetwork，ANN）算法、分形（Fractal）算法、小波（Wavelet）算法、基于對(duì)象（Object-Based）的算法、基于模型（Model-Based）的算法等。

第6頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.1.2數(shù)據(jù)壓縮的性能指標(biāo)

衡量一種數(shù)據(jù)壓縮技術(shù)的重要性能指標(biāo)有壓縮比、壓縮速度、壓縮質(zhì)量和計(jì)算量。

壓縮比

壓縮比是指原始數(shù)據(jù)量和壓縮后數(shù)據(jù)量的比值。有損壓縮有很高的壓縮比采用不同的壓縮編碼可得到不同的壓縮比。無(wú)損壓縮能實(shí)現(xiàn)的壓縮比，一般只有數(shù)倍，而且與被壓縮的對(duì)象有關(guān)。文字、圖像普遍采用無(wú)損壓縮。例如，MPGE是一種包含音頻和圖像在內(nèi)的壓縮技術(shù)，利用MPEG-1、MPEG-2、MPEG-4三個(gè)方案，對(duì)音頻的感知編碼中，MPEG-1方案的音頻壓縮比是1:4，MPEG-2方案的音頻壓縮比是1:6…1:8，MPEG-4方案的音頻壓縮比是1:10…1:12。但是MPEG對(duì)圖像的壓縮算法，所提供的壓縮比可以高達(dá)200:1。利用JPEG也可以有多種圖像的壓縮比，甚至可以減小到原圖像的百分之一（壓縮比100:1）。

第7頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月壓縮速度壓縮速度指編碼或解碼的快慢程度。不同的應(yīng)用場(chǎng)合，對(duì)壓縮速度要求是不同的。對(duì)于一個(gè)壓縮系統(tǒng)而言，有對(duì)稱(chēng)壓縮和非對(duì)稱(chēng)壓縮之分。

所謂對(duì)稱(chēng)壓縮，就是壓縮和解壓縮都需要實(shí)時(shí)進(jìn)行的。例如：電視會(huì)議的圖形傳輸。

非對(duì)稱(chēng)壓縮常常在解壓縮方面要求是實(shí)時(shí)的，但壓縮可以不是實(shí)時(shí)的。例如，多媒體CD-ROM的制作過(guò)程可以不是實(shí)時(shí)的，但解壓縮必須是實(shí)時(shí)的，否則用戶(hù)看到的就不是連續(xù)的圖像。

第8頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月壓縮質(zhì)量

壓縮質(zhì)量是指壓縮以后對(duì)媒體的感知效果。有損壓縮才可能影響人對(duì)媒體的感知效果。壓縮質(zhì)量的好壞與壓縮算法、數(shù)據(jù)內(nèi)容和壓縮比有密切的關(guān)系。

例如，使用JPEG編碼時(shí)，當(dāng)壓縮比為20:1時(shí)，能看到圖像稍微有點(diǎn)變化，當(dāng)壓縮比大于20:1時(shí)，一般圖像質(zhì)量開(kāi)始變壞。但使用MPEG編碼時(shí)，可以得到很好的數(shù)據(jù)壓縮而依然保持CD聲音質(zhì)量的原樣。在較高的壓縮比下，也能獲得較好的圖像質(zhì)量。

第9頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月計(jì)算量

圖像數(shù)據(jù)壓縮需要進(jìn)行大量計(jì)算，從目前的技術(shù)來(lái)看，壓縮的計(jì)算量比解壓縮計(jì)算量要大，例如動(dòng)態(tài)圖象的壓縮編碼計(jì)算量約為解壓縮的計(jì)算量的4倍。

第10頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.2統(tǒng)計(jì)編碼

統(tǒng)計(jì)編碼屬于一種無(wú)失真的編碼，具體實(shí)現(xiàn)的方法有多種，包括行程編碼、LZW編碼、Huffman編碼、算術(shù)編碼。本節(jié)在介紹了統(tǒng)計(jì)編碼的基本思想之后，為讀者引見(jiàn)LZW編碼、Huffman編碼、算術(shù)編碼等幾種實(shí)現(xiàn)方法。

統(tǒng)計(jì)編碼又稱(chēng)熵編碼。根據(jù)信息論的原理，我們可以找到最佳的壓縮編碼方法，數(shù)據(jù)壓縮的理論極限是信息熵。也就是說(shuō)，信息中可能存在著冗余信息，要去除信息的冗余部分，使編碼后單位數(shù)據(jù)量等于其信息源的熵，就達(dá)到了壓縮極限。

第11頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月信息論指出，如果一個(gè)事件（例如收到一個(gè)信號(hào)）有n個(gè)等可能性的結(jié)局，那么結(jié)局未出現(xiàn)前的不確定程度H與n的自然對(duì)數(shù)成正比，即有：H=Clnn(C為常數(shù))

如果一個(gè)消息有10個(gè)可能的結(jié)果，不確定程度就是Cln10。當(dāng)人們收到這個(gè)消息后，就消除了這種“不確定”性。這樣，一個(gè)消息中所含有的信息量，就用表示有多少個(gè)不確定程度的H來(lái)定義，申農(nóng)（香農(nóng)）把這個(gè)不確定程度H稱(chēng)為信息熵。信息論認(rèn)為信源中存在的冗余度來(lái)自于信源本身的相關(guān)性和信源概率分布的不均勻性。熵編碼要解決的問(wèn)題，是如何利用信息熵理論減少數(shù)據(jù)在存儲(chǔ)和傳輸中的冗余度。也就是要找到去除信源的相關(guān)性和概率分布的不均勻性的方法。

第12頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月事件間的統(tǒng)計(jì)特性與熵有這樣的關(guān)系。事件發(fā)生的概率越小，則其熵值越大，表示信息量越大，而發(fā)生的概率越大，則其熵值越小。統(tǒng)計(jì)編碼就是根據(jù)信源符號(hào)出現(xiàn)概率的分布特性而進(jìn)行工作的。統(tǒng)計(jì)編碼需要在信源符號(hào)和碼字之間確定嚴(yán)格的一一對(duì)應(yīng)關(guān)系，以便準(zhǔn)確無(wú)誤地在先原來(lái)信源，同時(shí)使平均碼長(zhǎng)盡量小。統(tǒng)計(jì)編碼對(duì)于出現(xiàn)概率比較高的數(shù)據(jù)分配短碼，而對(duì)那些出現(xiàn)概率比較低的數(shù)據(jù)則分配長(zhǎng)碼。該方法使總數(shù)據(jù)量降低，達(dá)到數(shù)據(jù)壓縮的目的。常用的統(tǒng)計(jì)編碼有LZW編碼、Huffman編碼和算術(shù)編碼。第13頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.2.2LZW編碼

LZW（LempelZivWelch）壓縮編碼是一種壓縮效率較高的無(wú)損數(shù)據(jù)壓縮技術(shù)。1977年，兩位以色列教授Lempel和Ziv提出了查找冗余字符和用較短的符號(hào)標(biāo)記替代冗余字符的概念，稱(chēng)為L(zhǎng)empel-Ziv壓縮技術(shù)。1985年，美國(guó)人Welch將Lempel-Ziv壓縮技術(shù)從概念發(fā)展到實(shí)際運(yùn)用階段，因而被命名為“LempelZivWelch”壓縮技術(shù)，簡(jiǎn)稱(chēng)“LZW”技術(shù)。LZW被廣泛用于圖像壓縮領(lǐng)域。第14頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月LZW壓縮基本原理LZW壓縮的基本原理是：LZW壓縮把每一個(gè)第一次出現(xiàn)的字符串用一個(gè)數(shù)值來(lái)編碼，在還原程序中再將這個(gè)數(shù)值還成原來(lái)的字符串。

轉(zhuǎn)換表是在壓縮或解壓縮過(guò)程中動(dòng)態(tài)生成的表，該轉(zhuǎn)換表只在進(jìn)行壓縮或解壓縮過(guò)程中需要，一旦壓縮或解壓縮結(jié)束，該表將不再起任何作用。壓縮過(guò)程生成的轉(zhuǎn)換表，記錄了代碼和數(shù)據(jù)的對(duì)應(yīng)關(guān)系，并且只用于壓縮過(guò)程。在解壓縮過(guò)程中，LZW壓縮編碼會(huì)生成另一個(gè)用于解壓縮的轉(zhuǎn)換表，該表與壓縮時(shí)產(chǎn)生的轉(zhuǎn)換表完全相同，數(shù)據(jù)以嚴(yán)格對(duì)應(yīng)的無(wú)損方式被還原。

例如用數(shù)值0x100代替字符串“abccddeee”這樣每當(dāng)出現(xiàn)該字符串時(shí)，都用0x100代替。把數(shù)據(jù)流中復(fù)雜的數(shù)據(jù)用簡(jiǎn)單的代碼來(lái)表示，就起到了壓縮的作用。并把代碼和數(shù)據(jù)的對(duì)應(yīng)關(guān)系建立一個(gè)轉(zhuǎn)換表，又叫“字符串表”或“編碼對(duì)照表”。

第15頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月LZW壓縮的特點(diǎn)

LZW壓縮技術(shù)的處理過(guò)程比其他壓縮過(guò)程復(fù)雜，但過(guò)程完全可逆。對(duì)于簡(jiǎn)單圖像和平滑且噪音小的信號(hào)源具有較高的壓縮比，并且有較高的壓縮和解壓縮速度。對(duì)機(jī)器硬件條件要求不高。

LZW壓縮技術(shù)可壓縮任何類(lèi)型和格式的數(shù)據(jù)。對(duì)于任意寬度和像素位長(zhǎng)度的圖像，都具有穩(wěn)定的壓縮過(guò)程。常用于GIF格式的圖像壓縮，其平均壓縮比在2：1以上，最高壓縮比可達(dá)到3：1。LZW壓縮技術(shù)還可以被用于文本程序等數(shù)據(jù)壓縮領(lǐng)域，對(duì)于數(shù)據(jù)流中連續(xù)重復(fù)出現(xiàn)的字節(jié)和字串，LZW壓縮技術(shù)具有很高的壓縮比。值得注意的是，規(guī)則數(shù)據(jù)具有可預(yù)測(cè)性，即從一個(gè)數(shù)據(jù)可預(yù)測(cè)到下一個(gè)將可能是什么數(shù)據(jù)。但LZW壓縮技術(shù)對(duì)于可預(yù)測(cè)性不大的數(shù)據(jù)具有較好的處理效果

第16頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.2.3Huffman編碼

Huffman（哈夫曼）編碼是統(tǒng)計(jì)編碼的一種，屬于無(wú)損壓縮編碼。該編碼是在1952年為文本文件建立的，編碼方法簡(jiǎn)單且有效，因而得到廣泛的應(yīng)用。現(xiàn)在已經(jīng)派生出很多變體。

Huffman編碼基本原理

Huffman編碼的基本原理是用較短的代碼代替出現(xiàn)概率較高的數(shù)據(jù)，用較長(zhǎng)的代碼代替出現(xiàn)概率較低的數(shù)據(jù)，所有代碼都采用二進(jìn)制碼，其碼的長(zhǎng)度是可變的，且每個(gè)數(shù)據(jù)的代碼各不相同。

例如，對(duì)于原始數(shù)據(jù)序列A、B、C、E、D這五個(gè)字母，假定對(duì)應(yīng)于每個(gè)字母出現(xiàn)的概率分別為0.30、0.25、0.22、0.15、和0.08，則可以編碼為A(00)、B(01)、C(10)、(D110)、(D111)，壓縮后為000110110111。由此產(chǎn)生的全部信息的總碼長(zhǎng)將小于實(shí)際信息的符號(hào)長(zhǎng)度，從而達(dá)到壓縮的目的。

第17頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月整個(gè)編碼過(guò)程實(shí)際上建立二叉樹(shù)的過(guò)程，所以編碼時(shí)需要對(duì)原始數(shù)據(jù)掃描兩遍，第一遍掃描要精確地統(tǒng)計(jì)出原始數(shù)據(jù)中的每個(gè)值出現(xiàn)的頻率，第二遍是通過(guò)合并最小概率來(lái)建立霍夫曼樹(shù)，同時(shí)還要進(jìn)行編碼。由于需要對(duì)多層次的二叉樹(shù)節(jié)點(diǎn)進(jìn)行編碼，因此數(shù)據(jù)壓縮和還原速度都較慢。

第18頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月編碼過(guò)程

根據(jù)以上編碼原理，Huffman編碼的實(shí)際編碼過(guò)程如下：

1.將信源符號(hào)按照出現(xiàn)概率遞減的順序排列。

2.將最小的兩個(gè)概率進(jìn)行相加合并，得到的結(jié)果作為新符號(hào)的出現(xiàn)的概率。

3.重復(fù)進(jìn)行1和2，直到概率的和值等于1。

4.在進(jìn)行消息概率合并運(yùn)算時(shí)，可以對(duì)概率大的符號(hào)用編碼0表示，概率小的符號(hào)用編碼1表示。也可以相反表示，可以對(duì)概率大的符號(hào)用編碼1表示，概率小的符號(hào)用編碼0表示。

5.最后，記錄下從概率為1處開(kāi)始到當(dāng)前信源符號(hào)之間的0、1序列，從而得到每個(gè)符號(hào)的編碼。

第19頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月設(shè)信號(hào)源為：x={x1，x2，x3，x4，x5}對(duì)應(yīng)的概率為：p={0.30，0.25，0.22，0.15，0.08}則編碼過(guò)程如圖7-2所示，其中第一次將0.15和0.08概率進(jìn)行合并，結(jié)果為0.23。繼續(xù)此過(guò)程，歷遍所有信號(hào)，直到概率和為1.0。

第20頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月當(dāng)前信號(hào)源

X1X2X3X4X5概率

0.30

0.25

0.22

0.15

0.080.230.450.551.0000001111碼字

110

111字長(zhǎng)

3第21頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月課后習(xí)題：設(shè)輸入圖像的灰度級(jí){a1,a2,a3,a4,a5,a6}出現(xiàn)的概率分別是0.4、0.2、0.12、0.15、0.1、0.03。試進(jìn)行哈夫曼編碼，并計(jì)算平均碼長(zhǎng)、編碼效率。

第22頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月Avg==0.30×2+0.25×2+0.22×2+0.15×3+0.08×3=2.08

計(jì)算該編碼的平均字長(zhǎng)為2.08，信息熵H（5）為1.6（假如常數(shù)C為1），那么編碼效率約為77%?？梢?jiàn)霍夫曼編碼是一種效率較高的編碼方案。但要指出的是，由于“0”和“1”的指定可以是任意的，所以上面所得到的編碼不是唯一的。

Huffman提出的這種編碼也稱(chēng)為最佳變長(zhǎng)碼，其優(yōu)點(diǎn)是編碼的效率高，但這種編碼依賴(lài)于源的統(tǒng)計(jì)特性，同時(shí)我們看到，Huffman編碼只能通過(guò)查表的方法建立消息和碼字之間的關(guān)系，所以如果消息數(shù)很大，需要存儲(chǔ)的碼表也需很大，從而會(huì)影響存儲(chǔ)量、編碼以及譯碼速度等各個(gè)方面的性能。

第23頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.2.4算術(shù)編碼

算術(shù)編碼屬于無(wú)損壓縮的統(tǒng)計(jì)編碼，常用于圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG，JBIG)中。

算術(shù)編碼基本原理

算術(shù)編碼的基本原理是將出現(xiàn)概率較多的“事件”(可以是字符或字符串)，用盡可能少的位或字節(jié)來(lái)表示。算術(shù)編碼是一種變長(zhǎng)碼，主要針對(duì)出現(xiàn)的概率高的事件序列標(biāo)識(shí)的信息進(jìn)行壓縮。

在算術(shù)編碼中，將信源符號(hào)表示成實(shí)數(shù)軸上0和1之間的間隔，例如一個(gè)信源符號(hào)“10

”可表示成[0.5,0.7]。信息越長(zhǎng)，這個(gè)間隔就越小，例如一個(gè)較長(zhǎng)的信源符號(hào)可表示成[0.514384,0.51442]，顯然表示這一間隔所需的二進(jìn)制位數(shù)就越多。也就是說(shuō)，算術(shù)編碼用到兩個(gè)基本的參數(shù)是符號(hào)的概率和它的編碼間隔。信源符號(hào)的概率決定壓縮編碼的效率，也決定編碼過(guò)程中信源符號(hào)的間隔，間隔則決定了符號(hào)壓縮后的輸出。

算術(shù)編碼區(qū)別于霍夫曼編碼的是，它是根據(jù)信源符號(hào)估計(jì)出各個(gè)元素的概率，然后進(jìn)行迭代計(jì)算。而不象霍夫曼編碼必須預(yù)先得知信源的出現(xiàn)概率。

第24頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.3預(yù)測(cè)編碼

預(yù)測(cè)編碼是一種有失真的編碼，DPCM編碼和ADPCM編碼是兩種較典型的預(yù)測(cè)編碼，它們比較適用于聲音和圖像數(shù)據(jù)的壓縮，下面我們就來(lái)了解一下預(yù)測(cè)的基本概念，以及DPCM編碼、ADPCM編碼基本原理。

7.3.1預(yù)測(cè)編碼

預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在一定的相關(guān)性的特點(diǎn)，利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè)，然后對(duì)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行編碼。預(yù)測(cè)編碼根據(jù)預(yù)測(cè)器的設(shè)計(jì)分為線(xiàn)性預(yù)測(cè)和非線(xiàn)性預(yù)測(cè)。但為了預(yù)測(cè)的效率，大多采用線(xiàn)性預(yù)測(cè)。

第25頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月預(yù)測(cè)編碼非常適用于聲音和圖像方面的壓縮。對(duì)于聲音來(lái)講，預(yù)測(cè)的對(duì)象是聲波的下一個(gè)幅度、下一個(gè)音色。對(duì)于圖像而言，預(yù)測(cè)的對(duì)象是下一個(gè)像點(diǎn)、下一條線(xiàn)或下一幀。聲音和圖像中通常都存在冗余的信號(hào)，而且在相鄰的音色或相鄰像點(diǎn)之間的相關(guān)性比較強(qiáng)，它們的差值比較小，這樣任何音色或像點(diǎn)都可以通過(guò)已知樣本值進(jìn)行預(yù)測(cè)。對(duì)于連續(xù)的多幀圖像，上下幀通常具有一些相同的部分內(nèi)容，如背景和靜止的物體，可以預(yù)計(jì)在一定的時(shí)間內(nèi)將不會(huì)發(fā)生變化。主要對(duì)其差值進(jìn)行編碼，可以達(dá)到壓縮的目的。

預(yù)測(cè)編碼時(shí)首先要存儲(chǔ)的是當(dāng)前內(nèi)容，接著以把當(dāng)前內(nèi)容作為樣板，預(yù)測(cè)下一個(gè)信號(hào)，將預(yù)測(cè)所得的不同內(nèi)容進(jìn)行存儲(chǔ)或傳輸，如內(nèi)容相同則是數(shù)據(jù)冗余，予以剔除。這樣數(shù)據(jù)量將會(huì)大幅度減少，達(dá)到壓縮效果。

第26頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月預(yù)測(cè)編碼常見(jiàn)的方法有DPCM、ADPCM、ΔM、Δ－∑M調(diào)制編碼。預(yù)測(cè)編碼主要采用壓縮圖像數(shù)據(jù)的空間冗余和時(shí)間冗余的方法，簡(jiǎn)捷且易于實(shí)現(xiàn)，但要求數(shù)據(jù)傳輸速度很高。另外，預(yù)測(cè)編碼方法的壓縮能力有限。為了進(jìn)一步提高數(shù)據(jù)壓縮的能力，可采用其它編碼方法，例如變換編碼。

7.3.2DPCM編碼

PCM是脈沖編碼調(diào)制，它首先對(duì)原始的模擬數(shù)據(jù)進(jìn)行采樣、量化，然后作為數(shù)字信號(hào)傳輸。DPCM（DifferentialPulseCodeModulation）是差分脈沖編碼調(diào)制算法。

第27頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月差分脈沖編碼的抽樣速率通常是與PCM相同，因此在編碼器中的帶限濾波器和解碼器中的平滑濾波器基本上與PCM系統(tǒng)中的濾波器是一樣的，但是它不是對(duì)每個(gè)采樣值進(jìn)行量化的，而是根據(jù)前一個(gè)樣值預(yù)測(cè)下一個(gè)樣值，并量化實(shí)際值和預(yù)測(cè)值之間的差值。差分脈沖編碼的基本原理如圖7-3所示，在發(fā)送端輸入的采樣信號(hào)，經(jīng)量化器后傳送到編碼器，DPCM編碼器將產(chǎn)生不同抽樣值，簡(jiǎn)單的抽樣方法就是將前一個(gè)輸入抽樣直接存儲(chǔ)在抽樣保持電路中，并使用模擬減法器來(lái)測(cè)試抽樣有無(wú)變化。如果信號(hào)有變化，則差值被量化、被編碼和傳輸。

差分脈沖編碼的基本原理

第28頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月其中有關(guān)的參數(shù)含義如下：Xn——輸入信號(hào)，為每個(gè)即時(shí)時(shí)刻的樣本值；

——預(yù)測(cè)值，根據(jù)時(shí)刻之前的采樣值x1，x2，…xn-1得到En——xn-En’——En經(jīng)過(guò)量化器量化后的輸入信號(hào)Qn——量化器的量化誤差產(chǎn)生的誤差為：Xn-Xn’=Xn-(

+En’)=(Xn-

)-En’=En

-En’=qn

量化器預(yù)測(cè)器XnEnEn’Xn’XnXnXnXnXn第29頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月qn恰好就是發(fā)送端的量化誤差。所以，DCPM系統(tǒng)中，量化器和預(yù)測(cè)器的設(shè)計(jì)是關(guān)鍵，好的預(yù)測(cè)器編碼應(yīng)能根據(jù)信號(hào)的局部特性，調(diào)整量化器的步長(zhǎng)和預(yù)測(cè)器的參數(shù)，使得許多預(yù)測(cè)值和實(shí)際值之間差值為最小。在接收端，經(jīng)過(guò)和發(fā)信端的預(yù)測(cè)完全相同的操作，可以得到量化的原信號(hào)，然后再通過(guò)低通濾波便可恢復(fù)與原信號(hào)近似的波形。這里就不再給出原理圖了。

第30頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.3.3ADPCM編碼

ADPCM（AdaptiveDifferentialPulseCodeModulation）自適應(yīng)差分編碼，它具有自適應(yīng)編碼的特性，該編碼包括自適應(yīng)量化和自適應(yīng)預(yù)測(cè)兩種形式。ADPCM編碼的方法是針對(duì)輸入樣值進(jìn)行自適應(yīng)預(yù)測(cè)，然后對(duì)預(yù)測(cè)誤差進(jìn)行量化編碼。

綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性，是一種性能比較好的波形編碼。它的核心想法是：①利用自適應(yīng)的思想改變量化階的大小，即使用小的量化階(step-size)去編碼小的差值，使用大的量化階去編碼大的差值,②使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值，使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。它的編碼簡(jiǎn)化框圖如圖3-10所示。第31頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月ADPCM主要用于對(duì)中等質(zhì)量的音頻信號(hào)進(jìn)行高效率壓縮。例如語(yǔ)音的壓縮、調(diào)幅廣播音質(zhì)的信號(hào)壓縮等。CCITT的32kbit／s語(yǔ)音編碼標(biāo)準(zhǔn)G.721采用ADPCM編碼方式，每個(gè)語(yǔ)音樣值相當(dāng)于用4個(gè)二進(jìn)制位進(jìn)行編碼。

第32頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.4變換編碼

變換編碼是一種有失真編碼，所謂變換主要是將原始數(shù)據(jù)的原來(lái)的時(shí)間或空間域進(jìn)行數(shù)學(xué)變換，使得通過(guò)變換后能夠突出原始數(shù)據(jù)中的重要部分，以便重點(diǎn)處理。變換編碼中的較為典型的是最佳變換（K-L變換）編碼和離散余弦變換（DCT）編碼，其中K-L變換是在均方誤差最小意義下導(dǎo)出的，其基向量是輸入數(shù)據(jù)向量協(xié)方差矩陣的特征向量，這種變換矩陣將隨著輸入數(shù)據(jù)的不同而不同，因此難于實(shí)現(xiàn)。

而離散余弦變換（DCT）編碼可對(duì)某個(gè)固定的像素塊進(jìn)行變換，變換以后的數(shù)據(jù)稱(chēng)為DCT系數(shù)，由于離散余弦變換的變換核心可固定，使得變換容易實(shí)現(xiàn)，而且變換的性能近次于K-L變換，目前已廣泛用于多媒體壓縮標(biāo)準(zhǔn)JPEG、MPEG、H.261、H.263等算法中。

第33頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.4.1變換編碼

變換編碼是一種重要的編碼類(lèi)型，屬于有失真的編碼，變換編碼技術(shù)起源比較早，理論上和技術(shù)上都比較成熟，被廣泛應(yīng)用于單色圖像、彩色圖像、靜止圖像、運(yùn)動(dòng)圖像，以及多媒體計(jì)算機(jī)技術(shù)中的電視幀內(nèi)圖像壓縮和幀間圖像壓縮中。

變換編碼是指將給定的圖像變換到另一個(gè)數(shù)據(jù)域（變換域或頻域）上，使得大量的信息能用較少的數(shù)據(jù)來(lái)表示。

第34頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月變換編碼原理如圖7-4所示。圖中，輸入信號(hào)經(jīng)過(guò)適當(dāng)?shù)恼蛔儞Q到另一個(gè)頻域空間，相關(guān)性就會(huì)明顯減少，能量集中在頻域的少數(shù)低頻系數(shù)上，這樣就達(dá)到了數(shù)據(jù)壓縮的效果。如果保留頻域中系數(shù)大的元素，忽略小的系數(shù)，然后輔以非線(xiàn)性量化來(lái)提高壓縮程度，最后進(jìn)行編碼，可獲得很高的壓縮比。

也就是說(shuō)，它不是直接對(duì)空間域圖像信號(hào)編碼，而是首先將當(dāng)前所表達(dá)的空間域圖像信號(hào)經(jīng)過(guò)變換映射到另一個(gè)正交矢量空間，將得到一系列變換系數(shù)，然后對(duì)這些變換系數(shù)進(jìn)行編碼處理。結(jié)果是重要的系數(shù)在變換到其他空間域后，其編碼的精確度高于次重要的系數(shù)。變換本身是一種無(wú)損且可逆的技術(shù)，為了能獲得更好的編碼效果，忽略了一些不重要的系數(shù)，由此成為了有損的技術(shù)。

第35頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.5音頻數(shù)據(jù)壓縮標(biāo)準(zhǔn)

音頻信號(hào)可分為電話(huà)質(zhì)量的語(yǔ)音、調(diào)幅廣播質(zhì)量的音頻、高保真立體聲信號(hào)，它們分別對(duì)應(yīng)著不同的頻率范圍。音頻中的聲波文件所占有大量的空間容量，極大地影響著數(shù)字音頻的存儲(chǔ)和傳輸，因此，壓縮音頻極其重要?？紤]到聲波中分有語(yǔ)音和一般聲音，又考慮到不同應(yīng)用場(chǎng)合的不同要求，壓縮音頻可以采用不同方式的編碼。

音頻編碼常采用有損的編碼，主要分為波形編碼、參數(shù)編碼和混合編碼：

第36頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月波形編碼方式是能夠忠實(shí)地表現(xiàn)波形的編碼方式。語(yǔ)音信號(hào)的波形編碼力圖使重建的語(yǔ)音波形保持原語(yǔ)音信號(hào)的波形狀態(tài)。這類(lèi)編碼器通常是將語(yǔ)音信號(hào)作為一般的波形信號(hào)來(lái)處理,比如：脈沖編碼調(diào)制（PCM）、自適應(yīng)增量調(diào)制（ADM或ΔM編碼）、自適應(yīng)差分編碼（ADPCM）、自適應(yīng)預(yù)測(cè)編碼（APC）、自適應(yīng)子帶編碼（ASBC）、自適應(yīng)變換編碼（ATC）等都屬于這類(lèi)編碼器。以上幾種波形編碼方式分別在64kb/s～16kb/s的速率上能給出高的編碼質(zhì)量。當(dāng)速率進(jìn)一步降低時(shí),其性能會(huì)下降較快。由于這類(lèi)編碼器通常將語(yǔ)音信號(hào)作為一般的波形信號(hào)來(lái)處理,所以它具有適應(yīng)能力強(qiáng)、話(huà)音質(zhì)量好、抗噪抗誤碼的能力強(qiáng)等特點(diǎn),但所需的編碼速率高,其中64kb/sPCM的語(yǔ)音質(zhì)量成為一個(gè)編碼質(zhì)量的參照標(biāo)準(zhǔn)。第37頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月參數(shù)編碼是根據(jù)聲音的形成模型,把聲音變換成參數(shù)的編碼方式。其基本方法是通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取及編碼,力圖使重建語(yǔ)音信號(hào)具有盡可能的可懂性,即保持原語(yǔ)音的語(yǔ)義。而重建的信號(hào)的波形同原語(yǔ)音信號(hào)的波形可能會(huì)有相當(dāng)大的差別。參數(shù)編碼的優(yōu)點(diǎn)是：編碼速率低,編碼速率通常小于4.8kb/s,可以低至600b/s至2.4kb/s。缺點(diǎn)是：合成語(yǔ)音質(zhì)量差,特別是自然度較低,連熟人之間都不一定能聽(tīng)出講話(huà)人是誰(shuí);另外,這類(lèi)編碼器對(duì)講話(huà)環(huán)境噪聲較敏感,需要安靜的講話(huà)環(huán)境才能給出較高的可懂度,且時(shí)延大參數(shù)編碼的典型例子語(yǔ)音信號(hào)的線(xiàn)性預(yù)測(cè)編碼（LPC）已被公認(rèn)為是目前參數(shù)編碼中最有效的方法,它能夠在2.4kb/s的低比特速率下獲得清晰、可懂的合成音。并且易于硬件實(shí)現(xiàn)。這種方法的優(yōu)點(diǎn)是不但能極為精確地估計(jì)參數(shù),還在于它的計(jì)算速度比較快。另外多帶激勵(lì)（MBE）編碼,余弦變換編碼（STC）均屬參數(shù)編碼。由于參數(shù)編碼是保護(hù)語(yǔ)聲模型,重建清晰可識(shí)別的語(yǔ)聲,而不注重波形的擬合,所以這類(lèi)編碼技術(shù)實(shí)現(xiàn)的是合成語(yǔ)聲質(zhì)量下的低速或極低速的編碼。第38頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月混合編碼是將波形編碼與參數(shù)編碼結(jié)合而產(chǎn)生的一種編碼方式。使語(yǔ)音編碼技術(shù)有了突破性的進(jìn)展。其中提出了一些非常有效的處理方法,產(chǎn)生了新一代的參數(shù)編碼算法,構(gòu)成了新一代的聲碼器。混合編碼克服了原有波形編碼器與聲碼器的弱點(diǎn),而結(jié)合了它們的優(yōu)點(diǎn),在4～16kb/s速率上能夠得到高質(zhì)量合成語(yǔ)音。在本質(zhì)上具有波形編碼的優(yōu)點(diǎn),有一定抗噪和抗誤碼的性能,但時(shí)延較大?；旌暇幋a結(jié)合了以上兩種編碼方式的優(yōu)點(diǎn),采用線(xiàn)性技術(shù)構(gòu)成聲道模型,不只傳輸預(yù)測(cè)參數(shù)和清濁音信息,而是將預(yù)測(cè)誤差信息和預(yù)測(cè)參數(shù)同時(shí)傳輸,在接收端構(gòu)成新的激勵(lì)參數(shù)去激勵(lì)預(yù)測(cè)參數(shù)構(gòu)成的合成濾波器,使得合成濾波器輸出的信號(hào)波形與原始語(yǔ)聲信號(hào)的波形最大程度的擬合,從而獲得自然度較高的語(yǔ)聲。這種編碼技術(shù)的關(guān)鍵是：如何高效地傳輸預(yù)測(cè)誤差信息。依據(jù)對(duì)激勵(lì)信息的不同處理,這類(lèi)編碼主要有：多脈沖線(xiàn)性預(yù)測(cè)編碼（MPLPC）、規(guī)則脈沖激勵(lì)線(xiàn)性預(yù)測(cè)編碼（RPELPC）、碼激勵(lì)線(xiàn)性預(yù)測(cè)編碼（CELPC）、低時(shí)延的碼激勵(lì)線(xiàn)性預(yù)測(cè)編碼（LD-CELPC）。第39頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.5.1電話(huà)語(yǔ)音壓縮標(biāo)準(zhǔn)

信號(hào)頻率規(guī)定在300Hz～3.4kHz，采用標(biāo)準(zhǔn)的脈沖編碼調(diào)制(PCM)，當(dāng)采樣頻率為8kHz，進(jìn)行8bit量化時(shí)，所得數(shù)據(jù)速率為64kb/s，即一個(gè)數(shù)字電話(huà)。1972年CCITT為電話(huà)質(zhì)量和語(yǔ)音壓縮制定了PCM標(biāo)準(zhǔn)G.711，其速率為64Kb／s，使用非線(xiàn)性量化技術(shù)，主要用于公共電話(huà)網(wǎng)中。

在ISO公布的ITU-T一系列音頻編碼標(biāo)準(zhǔn)中，用于電話(huà)語(yǔ)音壓縮的有G.711、G.721、G.723、G.728、G.729和G.729A等標(biāo)準(zhǔn)。在選擇語(yǔ)音壓縮標(biāo)準(zhǔn)時(shí)，應(yīng)綜合考慮帶寬、時(shí)延、算法復(fù)雜度等各種因素。第40頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月標(biāo)準(zhǔn)編碼類(lèi)型比特率（kbps）MOS復(fù)雜性時(shí)延(ms)G.711PCM644.310.125G.721ADPCM324.0100.125G.728LD-CELP164.0500.625GSMRPE_LPT133.7520G.729G.729ACSA-CELP84.030、1515G.723.1ACPLP6.33.82537.5G.723.1MP-MLQ5.3

USDodLPC-102.4合成語(yǔ)音1022.5表7-2給出了幾個(gè)語(yǔ)音編碼標(biāo)準(zhǔn)的比特率、MOS（長(zhǎng)話(huà)質(zhì)量的語(yǔ)音平均意見(jiàn)得分）、復(fù)雜性（以G.711為基準(zhǔn)）和時(shí)延（幀大小，即語(yǔ)音流量的時(shí)間長(zhǎng)度及前視時(shí)間）。

表7-2中的GSM編碼標(biāo)準(zhǔn)是1983年歐洲數(shù)字移動(dòng)特別工作組（GSM）制定的一種移動(dòng)電話(huà)的壓縮標(biāo)準(zhǔn)，它壓縮的音質(zhì)不如G.711系統(tǒng)。在GSM-6.10標(biāo)準(zhǔn)中，采用RPL-LTP算法，壓縮后的一路話(huà)音數(shù)碼率為13Kbps。

第41頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月G.723協(xié)議G.723協(xié)議是一個(gè)雙速率語(yǔ)音編碼建議,其兩種速率分別是5.3kb/s和6.3kb/s。此協(xié)議是一個(gè)數(shù)字傳輸系統(tǒng)概況協(xié)議,適用于低速率多媒體服務(wù)中語(yǔ)音或音頻信號(hào)的壓縮算法。它作為完整的H.324系列標(biāo)準(zhǔn)的一部分,是其中語(yǔ)音編碼建議,主要配合低速率圖像編碼H.263標(biāo)準(zhǔn)。在IP電話(huà)網(wǎng)中,G.723協(xié)議被用來(lái)實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音編碼解碼處理。G.723.1協(xié)議的編解碼算法中兩種速率的編解碼基本原理是一樣的,只是激勵(lì)信號(hào)的量化方法有差別。對(duì)高速率（6.3kbit/s）編碼器,其激勵(lì)信號(hào)采用多脈沖最大似然量化（MP-MLQ）法進(jìn)行量化,對(duì)低速率（5.3kbit/s）編碼器,其激勵(lì)信號(hào)采用代數(shù)碼激碼線(xiàn)性預(yù)測(cè)（ACELP）法量化。第42頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月2．調(diào)幅廣播質(zhì)量的音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)

頻率在50Hz一7kHz范圍。ITU于1986年通過(guò)G.722標(biāo)準(zhǔn)。

G.722標(biāo)準(zhǔn)是采用16kHz采樣，16bit量化，信號(hào)數(shù)據(jù)速率為224kbit／s，采用子帶編碼方法，將輸入音頻信號(hào)經(jīng)濾波器分成高子帶和低子帶兩個(gè)部分，分別進(jìn)行ADPCM編碼，再混合形成輸出碼流，224kbit／s可以被壓縮成64kbit／s，最后進(jìn)行數(shù)據(jù)插入(最高插入速率達(dá)16kbit／s)，因此利用G.722標(biāo)準(zhǔn)可以在窄帶綜合服務(wù)數(shù)據(jù)網(wǎng)N-ISDN中的一個(gè)B信道上傳送調(diào)幅廣播質(zhì)量的音頻信號(hào)。

第43頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月G.722.1標(biāo)準(zhǔn)中，采樣率為16kHz和16bit量化時(shí)，能夠在24或32kbps速率下提供7kHz的音頻帶寬，是普通電話(huà)呼叫質(zhì)量的兩倍多，所用速率僅為先前標(biāo)準(zhǔn)的一半，并可提供了近于FM廣播的音頻質(zhì)量。適合于一些重要應(yīng)用領(lǐng)域包括：IP電話(huà)、第三代移動(dòng)通信、PSTN高品質(zhì)電話(huà)會(huì)議和商務(wù)應(yīng)用(包括點(diǎn)到點(diǎn)和多點(diǎn))、語(yǔ)音流、ISDN寬帶技術(shù)、ISDN可視電話(huà)和會(huì)議電視等。

G.722.2主要采用代數(shù)編碼激勵(lì)線(xiàn)性預(yù)測(cè)技術(shù)，符合此標(biāo)準(zhǔn)的編解碼器也被稱(chēng)為AMR-WB編解碼器，已被3GPP采用，作為應(yīng)用于GSM和第三代無(wú)線(xiàn)W-CDMA的寬帶編解碼器。這標(biāo)志著無(wú)線(xiàn)與有線(xiàn)業(yè)務(wù)首次得以采用同一編解碼器。AMR-WB編解碼器在語(yǔ)音質(zhì)量方面取得了突破性進(jìn)展，意味著3G與IP固定網(wǎng)絡(luò)之間的互通更加容易。

第44頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.5.3高保真立體聲音頻壓縮標(biāo)準(zhǔn)

高保真立體聲音頻范圍是50Hz~20kHz。由ISO和ITU-T聯(lián)合制訂的標(biāo)準(zhǔn)被稱(chēng)為MPEG-音頻，它是動(dòng)態(tài)圖像編碼的國(guó)際標(biāo)準(zhǔn)MPEG中的一個(gè)部分。MPEG音頻和視頻已廣泛用于VCD、CD-I、多媒體、PC中。

MPEG音頻標(biāo)準(zhǔn)基于人的聽(tīng)覺(jué)心理模型，它利用編碼技術(shù)對(duì)源文件重新進(jìn)行編碼壓縮，編碼時(shí)刪除了聽(tīng)覺(jué)中不敏感的部分，從而縮減了文件的大小，由此會(huì)造成一些失真。

第45頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月MPEG-1音頻技術(shù)

MPEG-1音頻的壓縮原理如圖7-5所示。采用的方案是子帶壓縮技術(shù)（見(jiàn)7.5.2），采用多相正交分解濾波器組將數(shù)字化的寬帶音頻信號(hào)分成32個(gè)子帶，同時(shí)對(duì)信號(hào)進(jìn)行頻譜分析。通過(guò)子帶信號(hào)與頻譜同步計(jì)算，得出對(duì)各子帶的掩蔽特性，然后分配不同的量化比特?cái)?shù)。加上CRC校驗(yàn)碼，得到標(biāo)準(zhǔn)的MPEG碼流。解碼端的過(guò)程是：解幀、子帶樣值解碼、映射還原和輸出標(biāo)準(zhǔn)PCM碼流。

第46頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月MP1壓縮比為1：4，典型的位率為每通道192Kbit/s。是VCD的音頻壓縮的方案。

MP2壓縮比為1：6～1：8，典型的位率為每通道128Kbit/s，即稱(chēng)掩蔽模式通用子帶集成編碼與多路復(fù)用，廣泛應(yīng)用于數(shù)字音頻廣播、數(shù)字演播室等數(shù)字音頻專(zhuān)業(yè)的制作、交流、存儲(chǔ)和傳送。

MP3壓縮比率可以達(dá)到1：10～1：12。典型位率為64Kbit/s，它綜合了MP2和ASPEC的優(yōu)點(diǎn)，可以48kHz、44.1kHz、32kHz取樣，每聲道的數(shù)碼率32Kbps~448Kbps。適合CD-DA。由于MP3格式的復(fù)雜度相對(duì)較高，因而不適合進(jìn)行實(shí)時(shí)編碼，只有在數(shù)碼率較低的情況下才具有較高品質(zhì)的音質(zhì)。

根據(jù)需要的不同，人們又定義了不同的壓縮比率。MPEG-1壓縮格式分為3層，分別是MPEGAudioLayer-1、Layer-2和Layer-3（簡(jiǎn)寫(xiě)為MP1、MP2、MP3）。

第47頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月MPEG-2音頻技術(shù)

MPEG-2音頻和MPEG-2視頻標(biāo)準(zhǔn)并行開(kāi)發(fā)，于1994年11月完成。實(shí)質(zhì)上是在MPEG-1音頻基礎(chǔ)上增加了多通道MC和多語(yǔ)音ML編碼。

MPEG-2音頻增加了5.1通道的多通道功能MC，即可以支持最多5個(gè)主音頻通道（左，中，右，左環(huán)繞，右環(huán)繞），其中C（中置）、LS（左環(huán)繞）和RS（右環(huán)繞）三個(gè)通道是在立體聲的基礎(chǔ)上增加的。同時(shí)附加一個(gè)額外的“低頻增強(qiáng)（LowFrequencyExtension）”通道，專(zhuān)供傳送低音信號(hào)。

MPEG-2音頻還增加的多語(yǔ)音ML技術(shù)，多語(yǔ)音是獨(dú)立于5個(gè)通道的解說(shuō)（輔助聲音）通道，最多允許包括高達(dá)7個(gè)以上的音頻通道。

第48頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月為了適應(yīng)于非常低的比特率和有限帶寬需要的應(yīng)用，MPEG-2標(biāo)準(zhǔn)進(jìn)行了“低采樣率擴(kuò)展”，新的LSF（低采樣頻率）增加了24kHz、22.05kHz、16kHz的采樣頻率三種，由此可以提高數(shù)據(jù)的壓縮率，使數(shù)據(jù)比特率更加低，可以低到8Kbps。

MPEG2音頻的最大特征是“向后兼容性”。MPEG-2解碼器必須接受任何MPEG-1音頻流。一種用MC／ML編碼的數(shù)據(jù)，即使使用了不具有MC／ML功能的MPEG音頻解碼器，這種數(shù)據(jù)也可以作為2通道的立體聲進(jìn)行重放。

另一方面，MPEG-1解碼器可以解碼MPEG-2音頻流主數(shù)據(jù)區(qū)中的音頻信號(hào)，這被稱(chēng)為“向前兼容性”。所以，MPEG-2音頻與MPEG-1音頻具有很好的互換性，并與MPEG-2視頻廣泛用于數(shù)字視頻、高清晰電視HDTV和高質(zhì)量數(shù)字音頻廣播。

第49頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.6圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)

在國(guó)際標(biāo)準(zhǔn)化協(xié)會(huì)ISO批準(zhǔn)制定的多媒體國(guó)際標(biāo)準(zhǔn)中，用于圖像數(shù)據(jù)壓縮的重要標(biāo)準(zhǔn)有JPEG、MPEG和H（H.261H.263）系列三種。從圖像壓縮編碼的發(fā)展過(guò)程來(lái)說(shuō)，可以分成三個(gè)階段：第一階段著重于圖像信息冗余度的壓縮方法，第二階段著重于圖像視覺(jué)冗余信息的壓縮方法，第三階段基于模型的圖像壓縮方法。

7.6.1靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)

靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)主要指JPEG（JointPhotographicExpertGroup）標(biāo)準(zhǔn)，它是由聯(lián)合圖形專(zhuān)家組開(kāi)發(fā)的，該專(zhuān)家小組由國(guó)際標(biāo)準(zhǔn)化組織（ISO）和國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì)（CCITT）兩家聯(lián)合成立的。該小組一直致力于建立研究適用于彩色和單色的，多灰度連續(xù)色調(diào)的，靜態(tài)數(shù)字圖像壓縮的國(guó)際標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)是于1991年提出的，并在1992年后被廣泛采納后成為國(guó)際標(biāo)準(zhǔn)。

第50頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月1.JPEG標(biāo)準(zhǔn)

JPEG是一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)，不僅適用于靜止圖像的壓縮，也常常被用于電視圖像序列的幀內(nèi)圖像壓縮編碼。目前JPEG專(zhuān)家組開(kāi)發(fā)了兩種基本的壓縮算法：

一種是采用以離散余弦變換DCT為基礎(chǔ)的有損壓縮算法；另一種是采用以預(yù)測(cè)技術(shù)為基礎(chǔ)的無(wú)損壓縮算法。

使用有損壓縮算法時(shí)，在壓縮比為25:1的情況下，壓縮后還原得到的圖像和原始圖像相比較，非圖像專(zhuān)家難以找到它們之間的區(qū)別，因此得到了廣泛的應(yīng)用。例如在V-CD和DVD-Video電視圖像壓縮技術(shù)中，就使用JPEG的有損壓縮算法來(lái)取消空間方向上的冗余數(shù)據(jù)。

第51頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月JPEG標(biāo)準(zhǔn)它的具體目標(biāo)是：

1).用戶(hù)可以對(duì)壓縮比、質(zhì)量效果進(jìn)行選擇。2).算法能適應(yīng)不同的數(shù)字圖像參數(shù)、大小、圖像內(nèi)容、彩色空間、統(tǒng)計(jì)特性等，但二值圖像除外。3).壓縮比高，圖像質(zhì)量保真程度好。4).算法的復(fù)雜程度應(yīng)能夠滿(mǎn)足硬、軟件實(shí)現(xiàn)的計(jì)算需求。5).支持多種操作方式。

第52頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月JPEG壓縮是有損壓縮，它利用了人的視角系統(tǒng)的特性，使用量化和無(wú)損壓縮編碼相結(jié)合來(lái)去掉視角的冗余信息和數(shù)據(jù)本身的冗余信息。JPEG算法框圖如圖4-9所示，壓縮編碼大致分成三個(gè)步驟：（1）使用正向離散余弦變換（ForwardDiscreteCosineTransform，F(xiàn)DCT）把空間域表示的圖變換成頻率域表示的圖。（2）使用加權(quán)函數(shù)對(duì)DCT系數(shù)進(jìn)行量化，這個(gè)加權(quán)函數(shù)對(duì)于人的視覺(jué)系統(tǒng)是最佳的。（3）使用哈夫曼可變字長(zhǎng)編碼器對(duì)量化系數(shù)進(jìn)行編碼。JPEG編碼的壓縮過(guò)程

第53頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月譯碼或者叫做解壓縮的過(guò)程與壓縮編碼過(guò)程正好相反。JPEG算法與彩色空間無(wú)關(guān)，因此“RGB到Y(jié)UV變換”和“YUV到RGB變換”不包含在JPEG算法中。JPEG算法處理的彩色圖像是單獨(dú)的彩色分量圖像，因此它可以壓縮來(lái)自不同彩色空間的數(shù)據(jù)，如RGB、YCbCr和CMYK。第54頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月為了能用單一的壓縮碼流提供多種性能、滿(mǎn)足范圍更為廣泛的應(yīng)用，JPEG工作組于1996年開(kāi)始探索一種新的靜止圖像壓縮編碼標(biāo)準(zhǔn)，并且稱(chēng)它為JPEG2000。JPEG2000是JPEG工作組制定的并于2000年底陸續(xù)公布的基于JPEG標(biāo)準(zhǔn)的最新的靜止圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn)，它之所以比JPEG標(biāo)準(zhǔn)優(yōu)越，主要是不再采用離散傅立葉變換DCT算法為主的編碼方法，改用以DWT（DiscreteWaveletTransformation，離散小波變換算法）為主的多解析編碼方法。

2.JPEG2000標(biāo)準(zhǔn)

第55頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月JPEG-2000（ISO15444）標(biāo)準(zhǔn)技術(shù)的目標(biāo)是“高壓縮、低比特速率”。它基于小波變換的靜止圖像壓縮標(biāo)準(zhǔn)，不僅有更優(yōu)秀的壓縮性能，而且有更豐富的處理功能。JPEG-2000可提供更高的解像度（相當(dāng)于圖像分辨率，如：解像度為852×480,41萬(wàn)像素），其伸縮能力可以為一個(gè)文件提供從無(wú)損到有損的多種畫(huà)質(zhì)和解像選擇。因此，它被認(rèn)為是互聯(lián)網(wǎng)和無(wú)線(xiàn)接入應(yīng)用的理想影像編碼解決方案。

第56頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月JPEG-2000特點(diǎn)

它與JPEG的基本系統(tǒng)相比有以下的優(yōu)點(diǎn)：（1）既支持有損壓縮，也支持無(wú)損壓縮方式。（2）在壓縮時(shí)，可指定圖片感興趣的區(qū)域，并指定壓縮質(zhì)量；在解壓縮時(shí)，對(duì)這些區(qū)域指定解壓縮順序及解壓縮質(zhì)量。（3）在高壓縮比下，仍能保持較高的圖像質(zhì)量。在類(lèi)似質(zhì)量的前提下，JPEG2000的壓縮比比JPEG高10%～30%。（4）支持漸進(jìn)式傳輸，即開(kāi)始時(shí)顯示一個(gè)模糊、不清晰且質(zhì)量低的圖像，隨著數(shù)據(jù)進(jìn)一步被接收，圖像清晰度和質(zhì)量逐步提高，最后顯示出一個(gè)高清晰度且高質(zhì)量的圖像。JPEG2000在節(jié)約和充分利用有限帶寬方面顯得更加優(yōu)越。（5）在有限帶寬上進(jìn)行文件傳輸時(shí)，有很強(qiáng)的糾錯(cuò)能力，在用戶(hù)指定文件尺寸時(shí)，能保證較高的再現(xiàn)圖像質(zhì)量，以致在無(wú)線(xiàn)領(lǐng)域得到廣泛應(yīng)用。（6）可對(duì)編碼流進(jìn)行隨機(jī)訪(fǎng)問(wèn)和處理，因?yàn)樗膲K編碼是獨(dú)立的，且編碼流具有包裹式結(jié)構(gòu)。（7）使用Alpha通道，以滿(mǎn)足圖形藝術(shù)和Internet的發(fā)展和需求；（8）在彩色圖像處理方面，JPEG2000可處理256個(gè)通道的信息。第57頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月JPEG-2000的重點(diǎn)技術(shù)

在編碼算法上，JPEG-2000采用以小波變換為主的多解析編碼方式，包括離散小波變換（DWT）和bitplain位簡(jiǎn)易算術(shù)編碼（MQcoder）。JPEG-2000在技術(shù)上之所以主要采用新的小波變換，原因是因?yàn)橛嘞易儞Q考察的是全局特征。即考察整個(gè)時(shí)域過(guò)程的頻域特征或整個(gè)頻域過(guò)程的時(shí)域特征，因此比較適合于平穩(wěn)過(guò)程，但不適合于非平穩(wěn)過(guò)程。在JPEG中是靠丟棄頻率信息來(lái)實(shí)現(xiàn)壓縮的，因而圖像的壓縮率越高，頻率信息被丟棄的越多。在極端情況下，JPEG只保留了反映圖像輪廓的基本信息，而損失精細(xì)全部的圖像細(xì)節(jié)。而小波變換考察的是局部特征。既能考察局部時(shí)域過(guò)程的頻域特征，又能考察局部頻域過(guò)程的時(shí)域特征，因此也適合于非平穩(wěn)過(guò)程。它能將圖像變換為一系列小波系數(shù)，這些系數(shù)可以被高效壓縮和存儲(chǔ)，此外，小波的粗略邊緣可以更好地表現(xiàn)圖像，因?yàn)樗薉CT壓縮普遍具有的方塊效應(yīng)。第58頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月7.6.2動(dòng)態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)

動(dòng)態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)主要包括MPEG、H（H.261H.263）、DVI。

MPEG（MovingPictureExportsGroup）是活動(dòng)圖像專(zhuān)家組，由ISO與IEC于1988年成立，致力于運(yùn)動(dòng)圖像(MPEG視頻)及其伴音編碼(MPEG音頻)標(biāo)準(zhǔn)化工作。MPEG組織制定的各個(gè)標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用，目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標(biāo)準(zhǔn)。

第59頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月H系列是由CCITT（國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì)）通過(guò)的標(biāo)準(zhǔn)，這種標(biāo)準(zhǔn)與JPEG及MPEG標(biāo)準(zhǔn)間有明顯的相似性，但關(guān)鍵區(qū)別是它是為動(dòng)態(tài)使用設(shè)計(jì)的，并提供完全包含的組織和高水平的交互控制。

DVI（DigitalVideoInteractive）是一種工業(yè)標(biāo)準(zhǔn)，其視頻圖像的壓縮算法的性能與MPEG-1相當(dāng)，即圖像質(zhì)量可達(dá)到VHS的水平，壓縮后的圖像數(shù)據(jù)率約為1.5Mb/s。為了擴(kuò)大DVI技術(shù)的應(yīng)用，Intel公司又推出了DVI算法的軟件解碼算法，稱(chēng)為Indeo技術(shù)，它能將為壓縮的數(shù)字視頻文件壓縮為五分之一到十分之一。

第60頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月下面將主要介紹MPEG和H標(biāo)準(zhǔn)。

MPEG-1

MPEG-1標(biāo)準(zhǔn)（ISO/IEC11172）于制定于1992年，1993年8月公布，用于多媒體和廣播電視，這種編碼一般可以以1.5Mbps左右的數(shù)據(jù)傳輸率傳送數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音。MPEG-1的壓縮率相當(dāng)高，例如它可以把221Mbit/秒的NTSC圖像壓縮到1.2Mbit/秒，壓縮率為200:1。

第61頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月由五個(gè)部分組成：（1）MPEG-1系統(tǒng)：規(guī)定了運(yùn)動(dòng)圖像數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步。（2）MPEG-1視頻：規(guī)定了視頻數(shù)據(jù)的編碼和解碼。（3）MPEG-1音頻：規(guī)定了聲音數(shù)據(jù)的編碼和解碼。（4）MPEG-1一致性測(cè)試：說(shuō)明如何測(cè)試比特?cái)?shù)據(jù)流和解碼器是否滿(mǎn)足MPEG-1前3個(gè)部分中所規(guī)定的要求。（5）MPEG-1軟件模擬：這部分內(nèi)容是一個(gè)技術(shù)報(bào)告，給出了用軟件執(zhí)行MPEG-1標(biāo)準(zhǔn)前3個(gè)部分的結(jié)果。MPEG-1標(biāo)準(zhǔn)簡(jiǎn)介

第62頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月MPEG-1的應(yīng)用領(lǐng)域包括：光盤(pán)、數(shù)字音頻磁帶（DAT）、磁帶設(shè)備以及通信網(wǎng)絡(luò)（如ISDN和局域網(wǎng)等）。其典型的應(yīng)用是VCD，99%的VCD都是用MPEG-1格式壓縮的，使用MPEG-1的壓縮算法，可以把一部120分鐘長(zhǎng)的電影（未壓縮視頻文件）壓縮到1.2GB左右大小。為了支持多種應(yīng)用，可由用戶(hù)來(lái)規(guī)定多種輸入?yún)?shù)，包括靈活的圖像尺寸和幀頻。MPEG-1標(biāo)準(zhǔn)提供了一些錄像機(jī)的功能，包括正放、圖像凍結(jié)、快進(jìn)、快倒和慢放，此外，還提供了隨機(jī)存取的功能。MPEG-1的應(yīng)用領(lǐng)域第63頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月MPEG-2標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)MPEG工作組制定的第二個(gè)國(guó)際標(biāo)準(zhǔn)，標(biāo)準(zhǔn)號(hào)是ISO/IEC13818。它是一個(gè)直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標(biāo)準(zhǔn)。特別適用于廣播級(jí)的數(shù)字電視的編碼和傳送，被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn)和MPEG-1相比增加了隔行掃描電視的編碼，提供了位速率的可變性能（scalability）功能。MPEG-2要達(dá)到的最基本目標(biāo)是：位速率為4Mb/s～9Mb/s，最高達(dá)15Mb/s。MPEG-2在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善。MPEG-2是針對(duì)3～10Mbps的數(shù)據(jù)傳輸率制定的的運(yùn)動(dòng)圖像及其伴音編碼的國(guó)際標(biāo)準(zhǔn)。。第64頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月MPEG-2包含9個(gè)部分：（1）MPEG-2系統(tǒng)（1994年）規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步。（2）MPEG-2視頻（1994年）規(guī)定了視頻數(shù)據(jù)的編碼和解碼算法。（3）MPEG-2音頻規(guī)定了聲音數(shù)據(jù)的編碼和解碼，是MPEG-1Audio的擴(kuò)充，支持多個(gè)聲道。（4）MPEG-2一致性測(cè)試。（5）MPEG-2參考軟件。（6）MPEG-2數(shù)字存儲(chǔ)媒體命令和控制擴(kuò)展協(xié)議。第65頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月（9）MPEG-2DSM-CC一致性擴(kuò)展測(cè)試。（7）MPEG-2高級(jí)音頻編碼是多聲道聲音編碼算法標(biāo)準(zhǔn)。（8）MPEG-2系統(tǒng)解碼器實(shí)時(shí)接口擴(kuò)展標(biāo)準(zhǔn)。這是與傳輸數(shù)據(jù)流的實(shí)時(shí)接口（Real-TimeInterface，RTI）標(biāo)準(zhǔn)，它可以用來(lái)適應(yīng)來(lái)自網(wǎng)絡(luò)的傳輸數(shù)據(jù)流，如圖。第66頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月與MPEG-1標(biāo)準(zhǔn)相比，MPEG-2的不同特性主要表現(xiàn)在：（1）MPEG-2有“按幀編碼”和“按場(chǎng)編碼”兩種模式。在MPEG-1中是沒(méi)有電視幀的概念，只支持逐行掃描，不支持隔行掃描。在MPEG-2中，針對(duì)隔行掃描的常規(guī)電視圖像專(zhuān)門(mén)設(shè)置了“按幀編碼”模式，相應(yīng)的運(yùn)動(dòng)補(bǔ)償算法也有擴(kuò)充，分為“按幀運(yùn)動(dòng)補(bǔ)償”和“按場(chǎng)運(yùn)動(dòng)補(bǔ)償”，其編碼效率顯著提高。第67頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月4個(gè)等級(jí)由低到高為低等級(jí)（LowLevel）、主等級(jí)（MainLevel）、1440等級(jí)（High–1440Level）和高等級(jí)（HighLevel）。配置和等級(jí)之間可能的組合如表。配置等級(jí)簡(jiǎn)單配置主要配置信噪比可變配置空間可變配置高級(jí)配置高等級(jí)##1440等級(jí)###主等級(jí)####低等級(jí)##（2）MPEG-2的類(lèi)與等級(jí)。MPEG-2提出了類(lèi)與等級(jí)的概念。類(lèi)是按視頻編碼技術(shù)的簡(jiǎn)單還是復(fù)雜而確定的；對(duì)每個(gè)類(lèi)，根據(jù)編碼參數(shù)的不同，即圖像格式的簡(jiǎn)單還是復(fù)雜，進(jìn)一步劃分為不同的等級(jí)。MPEG-2標(biāo)準(zhǔn)中規(guī)定了5種類(lèi)4個(gè)等級(jí)。5個(gè)類(lèi)依次為簡(jiǎn)單類(lèi)、主類(lèi)（MainProfile）、信噪比可伸縮類(lèi)（SNRProfile）、空間分辨率可伸縮類(lèi)（SimpleProfile）、高級(jí)類(lèi)（HighProfile）。第68頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月（3）MPEG-2增加了分層編碼。MPEG-2可伸縮性體現(xiàn)在：空間分層編碼：提供空間分辨率不同的圖像。時(shí)間分層編碼：提供空間分辨率相同，但幀速率不同的視頻信號(hào)。信噪比分層編碼：提供具有相同空間分辨率，但編碼質(zhì)量不同的視頻比特流。數(shù)據(jù)分割編碼：將編碼比特流分成兩個(gè)優(yōu)先級(jí)不同的部分。（4）MPEG-2擴(kuò)充了系統(tǒng)層語(yǔ)法。MPEG-2對(duì)系統(tǒng)層語(yǔ)法有了較大的擴(kuò)充，包含了兩類(lèi)數(shù)據(jù)碼流：傳輸碼流（

TS）和節(jié)目碼流（PS）。MPEG-2的應(yīng)用領(lǐng)域很廣，它不僅支持面向存儲(chǔ)媒介的應(yīng)用，而且還支持各種通信環(huán)境下數(shù)字視頻信號(hào)的編碼和傳輸。如數(shù)字電視、TV機(jī)頂盒和DVD（數(shù)字視頻光盤(pán)），此外還可以應(yīng)用于信息存儲(chǔ)、Internet、衛(wèi)星通信、視頻會(huì)議和多媒體郵件等，其典型的應(yīng)用是DVD和HDTV（高清晰度電視）。為了適應(yīng)不同的應(yīng)用環(huán)境，MPEG-2中有很多可以選擇的參數(shù)和選項(xiàng)，改變這些參數(shù)和選項(xiàng)可以得到不同的圖像質(zhì)量，滿(mǎn)足不同的需求。第69頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月

MPEG-4是針對(duì)低速率（≤64kb/s）的視頻壓縮編碼標(biāo)準(zhǔn)，同時(shí)還注重基于視頻和音頻對(duì)象的交互性。主要應(yīng)用于視像電話(huà)(VideoPhone)，視像電子郵件(VideoEmail)和電子新聞(ElectronicNews)等，其傳輸速率要求較低，在4800-64000bits/sec之間，分辨率為176X144。MPEG-4利用很窄的帶寬，通過(guò)幀重建技術(shù)，壓縮和傳輸數(shù)據(jù)，以求以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。與MPEG-1和MPEG-2相比，MPEG-4的特點(diǎn)是其更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。MPEG-4是一個(gè)使你由被動(dòng)變?yōu)橹鲃?dòng)(不再只是觀看，允許你加入其中，即有交互性)的動(dòng)態(tài)圖像標(biāo)準(zhǔn)；它的另一個(gè)特點(diǎn)是其綜合性；從根源上說(shuō)，MPEG-4試圖將自然物體與人造物體相溶合(視覺(jué)效果意義上的)。MPEG-4的設(shè)計(jì)目標(biāo)還有更廣的適應(yīng)性和可擴(kuò)展性。MPEG4試圖達(dá)到兩個(gè)目標(biāo)：1.低比特率下的多媒體通信；2.是多工業(yè)的多媒體通信的綜合。據(jù)此目標(biāo)，MPEG4引入AV對(duì)象（Audio/VisaulObjects），使得更多的交互操作成為可能。

MPEG-4標(biāo)準(zhǔn)"AV對(duì)象"可以是一個(gè)孤立的人，也可以是這個(gè)人的語(yǔ)音或一段背景音樂(lè)等。它具有高效編碼、高效存儲(chǔ)與傳播及可交互操作的特性。

MPEG－4對(duì)AV對(duì)象的操作主要有：采用AV對(duì)象來(lái)表示聽(tīng)覺(jué)、視覺(jué)或者視聽(tīng)組合內(nèi)容；組合已有的AV對(duì)象來(lái)生成復(fù)合的AV對(duì)象，并由此生成AV場(chǎng)景；對(duì)AV對(duì)象的數(shù)據(jù)靈活地多路合成與同步，以便選擇合適的網(wǎng)絡(luò)來(lái)傳輸這些AV對(duì)象數(shù)據(jù)；允許接收端的用戶(hù)在AV場(chǎng)景中對(duì)AV對(duì)象進(jìn)行交互操作等。第70頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月與MPEG－1和MPEG－2相比，MPEG－4更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控，它的設(shè)計(jì)目標(biāo)使其具有更廣的適應(yīng)性和可擴(kuò)展性：MPEG－4傳輸速率在4800－64000bps之間，分辨率為176×144，可以利用很窄的帶寬通過(guò)幀重建技術(shù)壓縮和傳輸數(shù)據(jù)，從而能以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。因此，它將在數(shù)字電視、動(dòng)態(tài)圖像、互聯(lián)網(wǎng)、實(shí)時(shí)多媒體監(jiān)控、移動(dòng)多媒體通信、Internet/Intranet上的視頻流與可視游戲、DVD上的交互多媒體應(yīng)用等方面大顯身手。當(dāng)然，對(duì)于普通用戶(hù)來(lái)說(shuō)，MPEG－4在目前來(lái)說(shuō)最有吸引力的地方還在于它能在普通CD－ROM上基本實(shí)現(xiàn)DVD的質(zhì)量：用MPEG－4壓縮算法的ASF（AdvancedStreamingformat，高級(jí)格式流）可以將120分鐘的電影壓縮為300MB左右的視頻流；采用MPEG－4壓縮算法的DIVX視頻編碼技術(shù)可以將120分鐘的電影壓縮600MB左右，也可以將一部DVD影片壓縮到2張CD－ROM上！也就是說(shuō)，有了MPEG－4，你不需要購(gòu)買(mǎi)DVD－ROM就可以享受到和它差不多的視頻質(zhì)量！播放這種編碼的影片對(duì)機(jī)器的要求并不高：只要你的電腦有300MHz以上(無(wú)論是哪種型號(hào))的CPU、64MB內(nèi)存、8MB的顯卡就可以流暢地播放。不過(guò)，和DVD相比，MPEG－4屬于一種高比率有損壓縮算法，其圖像質(zhì)量始終無(wú)法和DVD的MPEG－2相比，畢竟DVD的存儲(chǔ)容量比較大。此外，要想保證高速運(yùn)動(dòng)的圖像畫(huà)面不失真，必須有足夠的碼率，目前MPEG－4的碼率雖然可以調(diào)到和DVD差不多，但總體效果還有不小的差距。因此，現(xiàn)在的MPEG－4只能面向娛樂(lè)、欣賞方面的市場(chǎng)，那些對(duì)圖像質(zhì)量要求較高的專(zhuān)業(yè)視頻領(lǐng)域暫時(shí)還不能采用。第71頁(yè)，課件共80頁(yè)，創(chuàng)作于2023年2月MPEG-7

MPEG-7標(biāo)準(zhǔn)于1998年10月提出，2001年完成并公布。MPEG-7也稱(chēng)為多媒體內(nèi)容描述接口（MultimediaContentDescriptionInterface），目的是

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)字化后的視頻和音頻等媒體信息具有海量性

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)字化后的視頻和音頻等媒體信息具有海量性

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔