




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)字化后的視頻和音頻等媒體信息具有海量性第1頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.1數(shù)據(jù)壓縮的基本原理和方法
根據(jù)多媒體不同的表現(xiàn)形式和不同場(chǎng)合以及質(zhì)量方面的應(yīng)用需求,必須有針對(duì)性地進(jìn)行設(shè)計(jì)。而各種壓縮方法應(yīng)該符合一定范圍內(nèi)的性能指標(biāo),以滿(mǎn)足實(shí)際應(yīng)用的領(lǐng)域的需要。
第2頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.1.1數(shù)據(jù)壓縮方法的分類(lèi)
數(shù)據(jù)壓縮技術(shù)自從1948年提出以來(lái),經(jīng)過(guò)50多年的發(fā)展。
根據(jù)解碼后的數(shù)據(jù)與壓縮之前的原始數(shù)據(jù)是否完全一致,可以分為無(wú)損壓縮編碼和有損壓縮編碼。無(wú)損壓縮編碼具有可恢復(fù)性和可逆性。該編碼在壓縮時(shí)不丟失任何數(shù)據(jù),即把所有的數(shù)據(jù)都作為比特序列,解壓后的數(shù)據(jù)與原始數(shù)據(jù)完全一致。
有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時(shí)舍棄冗余的數(shù)據(jù),例如人眼較難分辨的顏色或人耳難以分辨的方向源信號(hào),實(shí)際取決于初始信號(hào)的類(lèi)型、信號(hào)的相關(guān)性以及語(yǔ)義等內(nèi)容。這些被舍去的信息值是無(wú)法再找回的,所以還原后的數(shù)據(jù)與原始數(shù)據(jù)存在差異。
第3頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月統(tǒng)計(jì)編碼:屬于無(wú)失真編碼。根據(jù)信源符號(hào)出現(xiàn)概率的分布特性進(jìn)行編碼,讓概率大的信源符號(hào)用短碼字表示,讓概率小的信源符號(hào)用長(zhǎng)碼字表示,從而去除數(shù)據(jù)之間的冗余而達(dá)到壓縮的目的。預(yù)測(cè)編碼:根據(jù)離散信號(hào)之間存在一定的相關(guān)性特點(diǎn),利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行編碼。
如果所有的信源符號(hào)出現(xiàn)的概率相同,則說(shuō)明平均信息量最大,也就不存在信源的冗余。根據(jù)數(shù)據(jù)壓縮的原理可以分為:統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、變換編碼、分析-合成編碼和其他編碼。
第4頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月變換編碼:屬于有失真的編碼。變換編碼是將原始數(shù)據(jù)從初始空間或時(shí)間域進(jìn)行數(shù)學(xué)變換,變換為更適合于壓縮的抽象域。關(guān)鍵的是要尋找一個(gè)最佳變換,使信息中最重要的部分易于識(shí)別。變換本身是可逆的無(wú)損的,為了取得更好的效果,忽略了一些編碼位數(shù)較長(zhǎng)的系數(shù)而成為了有損編碼。變換編碼一般經(jīng)過(guò)變換、變換域采樣和量化三個(gè)步驟分析/合成編碼:是基于某種模型的編碼方法,這些模型可以是聲道模型、語(yǔ)音模型、人體模型等。通過(guò)分析模型的具體特征,確定與之匹配的編碼。
第5頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月其他編碼方法常見(jiàn)的有: 混合編碼(HybridCoding)、 矢量量化(VectorQuantize,VQ)、
LZW算法等。還有近年來(lái)新出現(xiàn)的編碼方法: 人工神經(jīng)元網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)算法、 分形(Fractal)算法、小波(Wavelet)算法、 基于對(duì)象(Object-Based)的算法、 基于模型(Model-Based)的算法等。
第6頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.1.2數(shù)據(jù)壓縮的性能指標(biāo)
衡量一種數(shù)據(jù)壓縮技術(shù)的重要性能指標(biāo)有壓縮比、壓縮速度、壓縮質(zhì)量和計(jì)算量。
壓縮比
壓縮比是指原始數(shù)據(jù)量和壓縮后數(shù)據(jù)量的比值。有損壓縮有很高的壓縮比采用不同的壓縮編碼可得到不同的壓縮比。無(wú)損壓縮能實(shí)現(xiàn)的壓縮比,一般只有數(shù)倍,而且與被壓縮的對(duì)象有關(guān)。文字、圖像普遍采用無(wú)損壓縮。例如,MPGE是一種包含音頻和圖像在內(nèi)的壓縮技術(shù),利用MPEG-1、MPEG-2、MPEG-4三個(gè)方案,對(duì)音頻的感知編碼中,MPEG-1方案的音頻壓縮比是1:4,MPEG-2方案的音頻壓縮比是1:6…1:8,MPEG-4方案的音頻壓縮比是1:10…1:12。但是MPEG對(duì)圖像的壓縮算法,所提供的壓縮比可以高達(dá)200:1。利用JPEG也可以有多種圖像的壓縮比,甚至可以減小到原圖像的百分之一(壓縮比100:1)。
第7頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月壓縮速度壓縮速度指編碼或解碼的快慢程度。不同的應(yīng)用場(chǎng)合,對(duì)壓縮速度要求是不同的。對(duì)于一個(gè)壓縮系統(tǒng)而言,有對(duì)稱(chēng)壓縮和非對(duì)稱(chēng)壓縮之分。
所謂對(duì)稱(chēng)壓縮,就是壓縮和解壓縮都需要實(shí)時(shí)進(jìn)行的。例如:電視會(huì)議的圖形傳輸。
非對(duì)稱(chēng)壓縮常常在解壓縮方面要求是實(shí)時(shí)的,但壓縮可以不是實(shí)時(shí)的。例如,多媒體CD-ROM的制作過(guò)程可以不是實(shí)時(shí)的,但解壓縮必須是實(shí)時(shí)的,否則用戶(hù)看到的就不是連續(xù)的圖像。
第8頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月壓縮質(zhì)量
壓縮質(zhì)量是指壓縮以后對(duì)媒體的感知效果。有損壓縮才可能影響人對(duì)媒體的感知效果。壓縮質(zhì)量的好壞與壓縮算法、數(shù)據(jù)內(nèi)容和壓縮比有密切的關(guān)系。
例如,使用JPEG編碼時(shí),當(dāng)壓縮比為20:1時(shí),能看到圖像稍微有點(diǎn)變化,當(dāng)壓縮比大于20:1時(shí),一般圖像質(zhì)量開(kāi)始變壞。但使用MPEG編碼時(shí),可以得到很好的數(shù)據(jù)壓縮而依然保持CD聲音質(zhì)量的原樣。在較高的壓縮比下,也能獲得較好的圖像質(zhì)量。
第9頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月計(jì)算量
圖像數(shù)據(jù)壓縮需要進(jìn)行大量計(jì)算,從目前的技術(shù)來(lái)看,壓縮的計(jì)算量比解壓縮計(jì)算量要大,例如動(dòng)態(tài)圖象的壓縮編碼計(jì)算量約為解壓縮的計(jì)算量的4倍。
第10頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.2統(tǒng)計(jì)編碼
統(tǒng)計(jì)編碼屬于一種無(wú)失真的編碼,具體實(shí)現(xiàn)的方法有多種,包括行程編碼、LZW編碼、Huffman編碼、算術(shù)編碼。本節(jié)在介紹了統(tǒng)計(jì)編碼的基本思想之后,為讀者引見(jiàn)LZW編碼、Huffman編碼、算術(shù)編碼等幾種實(shí)現(xiàn)方法。
統(tǒng)計(jì)編碼又稱(chēng)熵編碼。根據(jù)信息論的原理,我們可以找到最佳的壓縮編碼方法,數(shù)據(jù)壓縮的理論極限是信息熵。也就是說(shuō),信息中可能存在著冗余信息,要去除信息的冗余部分,使編碼后單位數(shù)據(jù)量等于其信息源的熵,就達(dá)到了壓縮極限。
第11頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月信息論指出,如果一個(gè)事件(例如收到一個(gè)信號(hào))有n個(gè)等可能性的結(jié)局,那么結(jié)局未出現(xiàn)前的不確定程度H與n的自然對(duì)數(shù)成正比,即有:H=Clnn(C為常數(shù))
如果一個(gè)消息有10個(gè)可能的結(jié)果,不確定程度就是Cln10。當(dāng)人們收到這個(gè)消息后,就消除了這種“不確定”性。這樣,一個(gè)消息中所含有的信息量,就用表示有多少個(gè)不確定程度的H來(lái)定義,申農(nóng)(香農(nóng))把這個(gè)不確定程度H稱(chēng)為信息熵。信息論認(rèn)為信源中存在的冗余度來(lái)自于信源本身的相關(guān)性和信源概率分布的不均勻性。熵編碼要解決的問(wèn)題,是如何利用信息熵理論減少數(shù)據(jù)在存儲(chǔ)和傳輸中的冗余度。也就是要找到去除信源的相關(guān)性和概率分布的不均勻性的方法。
第12頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月事件間的統(tǒng)計(jì)特性與熵有這樣的關(guān)系。事件發(fā)生的概率越小,則其熵值越大,表示信息量越大,而發(fā)生的概率越大,則其熵值越小。統(tǒng)計(jì)編碼就是根據(jù)信源符號(hào)出現(xiàn)概率的分布特性而進(jìn)行工作的。統(tǒng)計(jì)編碼需要在信源符號(hào)和碼字之間確定嚴(yán)格的一一對(duì)應(yīng)關(guān)系,以便準(zhǔn)確無(wú)誤地在先原來(lái)信源,同時(shí)使平均碼長(zhǎng)盡量小。統(tǒng)計(jì)編碼對(duì)于出現(xiàn)概率比較高的數(shù)據(jù)分配短碼,而對(duì)那些出現(xiàn)概率比較低的數(shù)據(jù)則分配長(zhǎng)碼。該方法使總數(shù)據(jù)量降低,達(dá)到數(shù)據(jù)壓縮的目的。常用的統(tǒng)計(jì)編碼有LZW編碼、Huffman編碼和算術(shù)編碼。第13頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.2.2LZW編碼
LZW(LempelZivWelch)壓縮編碼是一種壓縮效率較高的無(wú)損數(shù)據(jù)壓縮技術(shù)。1977年,兩位以色列教授Lempel和Ziv提出了查找冗余字符和用較短的符號(hào)標(biāo)記替代冗余字符的概念,稱(chēng)為L(zhǎng)empel-Ziv壓縮技術(shù)。1985年,美國(guó)人Welch將Lempel-Ziv壓縮技術(shù)從概念發(fā)展到實(shí)際運(yùn)用階段,因而被命名為“LempelZivWelch”壓縮技術(shù),簡(jiǎn)稱(chēng)“LZW”技術(shù)。LZW被廣泛用于圖像壓縮領(lǐng)域。第14頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月LZW壓縮基本原理LZW壓縮的基本原理是:LZW壓縮把每一個(gè)第一次出現(xiàn)的字符串用一個(gè)數(shù)值來(lái)編碼,在還原程序中再將這個(gè)數(shù)值還成原來(lái)的字符串。
轉(zhuǎn)換表是在壓縮或解壓縮過(guò)程中動(dòng)態(tài)生成的表,該轉(zhuǎn)換表只在進(jìn)行壓縮或解壓縮過(guò)程中需要,一旦壓縮或解壓縮結(jié)束,該表將不再起任何作用。壓縮過(guò)程生成的轉(zhuǎn)換表,記錄了代碼和數(shù)據(jù)的對(duì)應(yīng)關(guān)系,并且只用于壓縮過(guò)程。在解壓縮過(guò)程中,LZW壓縮編碼會(huì)生成另一個(gè)用于解壓縮的轉(zhuǎn)換表,該表與壓縮時(shí)產(chǎn)生的轉(zhuǎn)換表完全相同,數(shù)據(jù)以嚴(yán)格對(duì)應(yīng)的無(wú)損方式被還原。
例如用數(shù)值0x100代替字符串“abccddeee”這樣每當(dāng)出現(xiàn)該字符串時(shí),都用0x100代替。把數(shù)據(jù)流中復(fù)雜的數(shù)據(jù)用簡(jiǎn)單的代碼來(lái)表示,就起到了壓縮的作用。并把代碼和數(shù)據(jù)的對(duì)應(yīng)關(guān)系建立一個(gè)轉(zhuǎn)換表,又叫“字符串表”或“編碼對(duì)照表”。
第15頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月LZW壓縮的特點(diǎn)
LZW壓縮技術(shù)的處理過(guò)程比其他壓縮過(guò)程復(fù)雜,但過(guò)程完全可逆。對(duì)于簡(jiǎn)單圖像和平滑且噪音小的信號(hào)源具有較高的壓縮比,并且有較高的壓縮和解壓縮速度。對(duì)機(jī)器硬件條件要求不高。
LZW壓縮技術(shù)可壓縮任何類(lèi)型和格式的數(shù)據(jù)。對(duì)于任意寬度和像素位長(zhǎng)度的圖像,都具有穩(wěn)定的壓縮過(guò)程。常用于GIF格式的圖像壓縮,其平均壓縮比在2:1以上,最高壓縮比可達(dá)到3:1。LZW壓縮技術(shù)還可以被用于文本程序等數(shù)據(jù)壓縮領(lǐng)域,對(duì)于數(shù)據(jù)流中連續(xù)重復(fù)出現(xiàn)的字節(jié)和字串,LZW壓縮技術(shù)具有很高的壓縮比。值得注意的是,規(guī)則數(shù)據(jù)具有可預(yù)測(cè)性,即從一個(gè)數(shù)據(jù)可預(yù)測(cè)到下一個(gè)將可能是什么數(shù)據(jù)。但LZW壓縮技術(shù)對(duì)于可預(yù)測(cè)性不大的數(shù)據(jù)具有較好的處理效果
第16頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.2.3Huffman編碼
Huffman(哈夫曼)編碼是統(tǒng)計(jì)編碼的一種,屬于無(wú)損壓縮編碼。該編碼是在1952年為文本文件建立的,編碼方法簡(jiǎn)單且有效,因而得到廣泛的應(yīng)用。現(xiàn)在已經(jīng)派生出很多變體。
Huffman編碼基本原理
Huffman編碼的基本原理是用較短的代碼代替出現(xiàn)概率較高的數(shù)據(jù),用較長(zhǎng)的代碼代替出現(xiàn)概率較低的數(shù)據(jù),所有代碼都采用二進(jìn)制碼,其碼的長(zhǎng)度是可變的,且每個(gè)數(shù)據(jù)的代碼各不相同。
例如,對(duì)于原始數(shù)據(jù)序列A、B、C、E、D這五個(gè)字母,假定對(duì)應(yīng)于每個(gè)字母出現(xiàn)的概率分別為0.30、0.25、0.22、0.15、和0.08,則可以編碼為A(00)、B(01)、C(10)、(D110)、(D111),壓縮后為000110110111。由此產(chǎn)生的全部信息的總碼長(zhǎng)將小于實(shí)際信息的符號(hào)長(zhǎng)度,從而達(dá)到壓縮的目的。
第17頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月整個(gè)編碼過(guò)程實(shí)際上建立二叉樹(shù)的過(guò)程,所以編碼時(shí)需要對(duì)原始數(shù)據(jù)掃描兩遍,第一遍掃描要精確地統(tǒng)計(jì)出原始數(shù)據(jù)中的每個(gè)值出現(xiàn)的頻率,第二遍是通過(guò)合并最小概率來(lái)建立霍夫曼樹(shù),同時(shí)還要進(jìn)行編碼。由于需要對(duì)多層次的二叉樹(shù)節(jié)點(diǎn)進(jìn)行編碼,因此數(shù)據(jù)壓縮和還原速度都較慢。
第18頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月編碼過(guò)程
根據(jù)以上編碼原理,Huffman編碼的實(shí)際編碼過(guò)程如下:
1.將信源符號(hào)按照出現(xiàn)概率遞減的順序排列。
2.將最小的兩個(gè)概率進(jìn)行相加合并,得到的結(jié)果作為新符號(hào)的出現(xiàn)的概率。
3.重復(fù)進(jìn)行1和2,直到概率的和值等于1。
4.在進(jìn)行消息概率合并運(yùn)算時(shí),可以對(duì)概率大的符號(hào)用編碼0表示,概率小的符號(hào)用編碼1表示。也可以相反表示,可以對(duì)概率大的符號(hào)用編碼1表示,概率小的符號(hào)用編碼0表示。
5.最后,記錄下從概率為1處開(kāi)始到當(dāng)前信源符號(hào)之間的0、1序列,從而得到每個(gè)符號(hào)的編碼。
第19頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月設(shè)信號(hào)源為:x={x1,x2,x3,x4,x5}對(duì)應(yīng)的概率為:p={0.30,0.25,0.22,0.15,0.08}則編碼過(guò)程如圖7-2所示,其中第一次將0.15和0.08概率進(jìn)行合并,結(jié)果為0.23。繼續(xù)此過(guò)程,歷遍所有信號(hào),直到概率和為1.0。
第20頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月當(dāng)前信號(hào)源
X1X2X3X4X5概率
0.30
0.25
0.22
0.15
0.080.230.450.551.0000001111碼字
00
01
10
110
111字長(zhǎng)
2
2
2
3
3第21頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月課后習(xí)題:設(shè)輸入圖像的灰度級(jí){a1,a2,a3,a4,a5,a6}出現(xiàn)的概率分別是0.4、0.2、0.12、0.15、0.1、0.03。試進(jìn)行哈夫曼編碼,并計(jì)算平均碼長(zhǎng)、編碼效率。
第22頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月Avg==0.30×2+0.25×2+0.22×2+0.15×3+0.08×3=2.08
計(jì)算該編碼的平均字長(zhǎng)為2.08,信息熵H(5)為1.6(假如常數(shù)C為1),那么編碼效率約為77%??梢?jiàn)霍夫曼編碼是一種效率較高的編碼方案。但要指出的是,由于“0”和“1”的指定可以是任意的,所以上面所得到的編碼不是唯一的。
Huffman提出的這種編碼也稱(chēng)為最佳變長(zhǎng)碼,其優(yōu)點(diǎn)是編碼的效率高,但這種編碼依賴(lài)于源的統(tǒng)計(jì)特性,同時(shí)我們看到,Huffman編碼只能通過(guò)查表的方法建立消息和碼字之間的關(guān)系,所以如果消息數(shù)很大,需要存儲(chǔ)的碼表也需很大,從而會(huì)影響存儲(chǔ)量、編碼以及譯碼速度等各個(gè)方面的性能。
第23頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.2.4算術(shù)編碼
算術(shù)編碼屬于無(wú)損壓縮的統(tǒng)計(jì)編碼,常用于圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG,JBIG)中。
算術(shù)編碼基本原理
算術(shù)編碼的基本原理是將出現(xiàn)概率較多的“事件”(可以是字符或字符串),用盡可能少的位或字節(jié)來(lái)表示。算術(shù)編碼是一種變長(zhǎng)碼,主要針對(duì)出現(xiàn)的概率高的事件序列標(biāo)識(shí)的信息進(jìn)行壓縮。
在算術(shù)編碼中,將信源符號(hào)表示成實(shí)數(shù)軸上0和1之間的間隔,例如一個(gè)信源符號(hào)“10
”可表示成[0.5,0.7]。信息越長(zhǎng),這個(gè)間隔就越小,例如一個(gè)較長(zhǎng)的信源符號(hào)可表示成[0.514384,0.51442],顯然表示這一間隔所需的二進(jìn)制位數(shù)就越多。也就是說(shuō),算術(shù)編碼用到兩個(gè)基本的參數(shù)是符號(hào)的概率和它的編碼間隔。信源符號(hào)的概率決定壓縮編碼的效率,也決定編碼過(guò)程中信源符號(hào)的間隔,間隔則決定了符號(hào)壓縮后的輸出。
算術(shù)編碼區(qū)別于霍夫曼編碼的是,它是根據(jù)信源符號(hào)估計(jì)出各個(gè)元素的概率,然后進(jìn)行迭代計(jì)算。而不象霍夫曼編碼必須預(yù)先得知信源的出現(xiàn)概率。
第24頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.3預(yù)測(cè)編碼
預(yù)測(cè)編碼是一種有失真的編碼,DPCM編碼和ADPCM編碼是兩種較典型的預(yù)測(cè)編碼,它們比較適用于聲音和圖像數(shù)據(jù)的壓縮,下面我們就來(lái)了解一下預(yù)測(cè)的基本概念,以及DPCM編碼、ADPCM編碼基本原理。
7.3.1預(yù)測(cè)編碼
預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在一定的相關(guān)性的特點(diǎn),利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行編碼。預(yù)測(cè)編碼根據(jù)預(yù)測(cè)器的設(shè)計(jì)分為線(xiàn)性預(yù)測(cè)和非線(xiàn)性預(yù)測(cè)。但為了預(yù)測(cè)的效率,大多采用線(xiàn)性預(yù)測(cè)。
第25頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月預(yù)測(cè)編碼非常適用于聲音和圖像方面的壓縮。對(duì)于聲音來(lái)講,預(yù)測(cè)的對(duì)象是聲波的下一個(gè)幅度、下一個(gè)音色。對(duì)于圖像而言,預(yù)測(cè)的對(duì)象是下一個(gè)像點(diǎn)、下一條線(xiàn)或下一幀。聲音和圖像中通常都存在冗余的信號(hào),而且在相鄰的音色或相鄰像點(diǎn)之間的相關(guān)性比較強(qiáng),它們的差值比較小,這樣任何音色或像點(diǎn)都可以通過(guò)已知樣本值進(jìn)行預(yù)測(cè)。對(duì)于連續(xù)的多幀圖像,上下幀通常具有一些相同的部分內(nèi)容,如背景和靜止的物體,可以預(yù)計(jì)在一定的時(shí)間內(nèi)將不會(huì)發(fā)生變化。主要對(duì)其差值進(jìn)行編碼,可以達(dá)到壓縮的目的。
預(yù)測(cè)編碼時(shí)首先要存儲(chǔ)的是當(dāng)前內(nèi)容,接著以把當(dāng)前內(nèi)容作為樣板,預(yù)測(cè)下一個(gè)信號(hào),將預(yù)測(cè)所得的不同內(nèi)容進(jìn)行存儲(chǔ)或傳輸,如內(nèi)容相同則是數(shù)據(jù)冗余,予以剔除。這樣數(shù)據(jù)量將會(huì)大幅度減少,達(dá)到壓縮效果。
第26頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月預(yù)測(cè)編碼常見(jiàn)的方法有DPCM、ADPCM、ΔM、Δ-∑M調(diào)制編碼。預(yù)測(cè)編碼主要采用壓縮圖像數(shù)據(jù)的空間冗余和時(shí)間冗余的方法,簡(jiǎn)捷且易于實(shí)現(xiàn),但要求數(shù)據(jù)傳輸速度很高。另外,預(yù)測(cè)編碼方法的壓縮能力有限。為了進(jìn)一步提高數(shù)據(jù)壓縮的能力,可采用其它編碼方法,例如變換編碼。
7.3.2DPCM編碼
PCM是脈沖編碼調(diào)制,它首先對(duì)原始的模擬數(shù)據(jù)進(jìn)行采樣、量化,然后作為數(shù)字信號(hào)傳輸。DPCM(DifferentialPulseCodeModulation)是差分脈沖編碼調(diào)制算法。
第27頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月差分脈沖編碼的抽樣速率通常是與PCM相同,因此在編碼器中的帶限濾波器和解碼器中的平滑濾波器基本上與PCM系統(tǒng)中的濾波器是一樣的,但是它不是對(duì)每個(gè)采樣值進(jìn)行量化的,而是根據(jù)前一個(gè)樣值預(yù)測(cè)下一個(gè)樣值,并量化實(shí)際值和預(yù)測(cè)值之間的差值。差分脈沖編碼的基本原理如圖7-3所示,在發(fā)送端輸入的采樣信號(hào),經(jīng)量化器后傳送到編碼器,DPCM編碼器將產(chǎn)生不同抽樣值,簡(jiǎn)單的抽樣方法就是將前一個(gè)輸入抽樣直接存儲(chǔ)在抽樣保持電路中,并使用模擬減法器來(lái)測(cè)試抽樣有無(wú)變化。如果信號(hào)有變化,則差值被量化、被編碼和傳輸。
差分脈沖編碼的基本原理
第28頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月其中有關(guān)的參數(shù)含義如下:Xn——輸入信號(hào),為每個(gè)即時(shí)時(shí)刻的樣本值;
——預(yù)測(cè)值,根據(jù)時(shí)刻之前的采樣值x1,x2,…xn-1得到En——xn-En’——En經(jīng)過(guò)量化器量化后的輸入信號(hào)Qn——量化器的量化誤差產(chǎn)生的誤差為:Xn-Xn’=Xn-(
+En’)=(Xn-
)-En’=En
-En’=qn
量化器預(yù)測(cè)器XnEnEn’Xn’XnXnXnXnXn第29頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月qn恰好就是發(fā)送端的量化誤差。所以,DCPM系統(tǒng)中,量化器和預(yù)測(cè)器的設(shè)計(jì)是關(guān)鍵,好的預(yù)測(cè)器編碼應(yīng)能根據(jù)信號(hào)的局部特性,調(diào)整量化器的步長(zhǎng)和預(yù)測(cè)器的參數(shù),使得許多預(yù)測(cè)值和實(shí)際值之間差值為最小。在接收端,經(jīng)過(guò)和發(fā)信端的預(yù)測(cè)完全相同的操作,可以得到量化的原信號(hào),然后再通過(guò)低通濾波便可恢復(fù)與原信號(hào)近似的波形。這里就不再給出原理圖了。
第30頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.3.3ADPCM編碼
ADPCM(AdaptiveDifferentialPulseCodeModulation)自適應(yīng)差分編碼,它具有自適應(yīng)編碼的特性,該編碼包括自適應(yīng)量化和自適應(yīng)預(yù)測(cè)兩種形式。ADPCM編碼的方法是針對(duì)輸入樣值進(jìn)行自適應(yīng)預(yù)測(cè),然后對(duì)預(yù)測(cè)誤差進(jìn)行量化編碼。
綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。它的核心想法是:①利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值,②使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。它的編碼簡(jiǎn)化框圖如圖3-10所示。第31頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月ADPCM主要用于對(duì)中等質(zhì)量的音頻信號(hào)進(jìn)行高效率壓縮。例如語(yǔ)音的壓縮、調(diào)幅廣播音質(zhì)的信號(hào)壓縮等。CCITT的32kbit/s語(yǔ)音編碼標(biāo)準(zhǔn)G.721采用ADPCM編碼方式,每個(gè)語(yǔ)音樣值相當(dāng)于用4個(gè)二進(jìn)制位進(jìn)行編碼。
第32頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.4變換編碼
變換編碼是一種有失真編碼,所謂變換主要是將原始數(shù)據(jù)的原來(lái)的時(shí)間或空間域進(jìn)行數(shù)學(xué)變換,使得通過(guò)變換后能夠突出原始數(shù)據(jù)中的重要部分,以便重點(diǎn)處理。變換編碼中的較為典型的是最佳變換(K-L變換)編碼和離散余弦變換(DCT)編碼,其中K-L變換是在均方誤差最小意義下導(dǎo)出的,其基向量是輸入數(shù)據(jù)向量協(xié)方差矩陣的特征向量,這種變換矩陣將隨著輸入數(shù)據(jù)的不同而不同,因此難于實(shí)現(xiàn)。
而離散余弦變換(DCT)編碼可對(duì)某個(gè)固定的像素塊進(jìn)行變換,變換以后的數(shù)據(jù)稱(chēng)為DCT系數(shù),由于離散余弦變換的變換核心可固定,使得變換容易實(shí)現(xiàn),而且變換的性能近次于K-L變換,目前已廣泛用于多媒體壓縮標(biāo)準(zhǔn)JPEG、MPEG、H.261、H.263等算法中。
第33頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.4.1變換編碼
變換編碼是一種重要的編碼類(lèi)型,屬于有失真的編碼,變換編碼技術(shù)起源比較早,理論上和技術(shù)上都比較成熟,被廣泛應(yīng)用于單色圖像、彩色圖像、靜止圖像、運(yùn)動(dòng)圖像,以及多媒體計(jì)算機(jī)技術(shù)中的電視幀內(nèi)圖像壓縮和幀間圖像壓縮中。
變換編碼是指將給定的圖像變換到另一個(gè)數(shù)據(jù)域(變換域或頻域)上,使得大量的信息能用較少的數(shù)據(jù)來(lái)表示。
第34頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月變換編碼原理如圖7-4所示。圖中,輸入信號(hào)經(jīng)過(guò)適當(dāng)?shù)恼蛔儞Q到另一個(gè)頻域空間,相關(guān)性就會(huì)明顯減少,能量集中在頻域的少數(shù)低頻系數(shù)上,這樣就達(dá)到了數(shù)據(jù)壓縮的效果。如果保留頻域中系數(shù)大的元素,忽略小的系數(shù),然后輔以非線(xiàn)性量化來(lái)提高壓縮程度,最后進(jìn)行編碼,可獲得很高的壓縮比。
也就是說(shuō),它不是直接對(duì)空間域圖像信號(hào)編碼,而是首先將當(dāng)前所表達(dá)的空間域圖像信號(hào)經(jīng)過(guò)變換映射到另一個(gè)正交矢量空間,將得到一系列變換系數(shù),然后對(duì)這些變換系數(shù)進(jìn)行編碼處理。結(jié)果是重要的系數(shù)在變換到其他空間域后,其編碼的精確度高于次重要的系數(shù)。變換本身是一種無(wú)損且可逆的技術(shù),為了能獲得更好的編碼效果,忽略了一些不重要的系數(shù),由此成為了有損的技術(shù)。
第35頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.5音頻數(shù)據(jù)壓縮標(biāo)準(zhǔn)
音頻信號(hào)可分為電話(huà)質(zhì)量的語(yǔ)音、調(diào)幅廣播質(zhì)量的音頻、高保真立體聲信號(hào),它們分別對(duì)應(yīng)著不同的頻率范圍。音頻中的聲波文件所占有大量的空間容量,極大地影響著數(shù)字音頻的存儲(chǔ)和傳輸,因此,壓縮音頻極其重要??紤]到聲波中分有語(yǔ)音和一般聲音,又考慮到不同應(yīng)用場(chǎng)合的不同要求,壓縮音頻可以采用不同方式的編碼。
音頻編碼常采用有損的編碼,主要分為波形編碼、參數(shù)編碼和混合編碼:
第36頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月波形編碼方式是能夠忠實(shí)地表現(xiàn)波形的編碼方式。語(yǔ)音信號(hào)的波形編碼力圖使重建的語(yǔ)音波形保持原語(yǔ)音信號(hào)的波形狀態(tài)。這類(lèi)編碼器通常是將語(yǔ)音信號(hào)作為一般的波形信號(hào)來(lái)處理,比如:脈沖編碼調(diào)制(PCM)、自適應(yīng)增量調(diào)制(ADM或ΔM編碼)、自適應(yīng)差分編碼(ADPCM)、自適應(yīng)預(yù)測(cè)編碼(APC)、自適應(yīng)子帶編碼(ASBC)、自適應(yīng)變換編碼(ATC)等都屬于這類(lèi)編碼器。以上幾種波形編碼方式分別在64kb/s~16kb/s的速率上能給出高的編碼質(zhì)量。當(dāng)速率進(jìn)一步降低時(shí),其性能會(huì)下降較快。由于這類(lèi)編碼器通常將語(yǔ)音信號(hào)作為一般的波形信號(hào)來(lái)處理,所以它具有適應(yīng)能力強(qiáng)、話(huà)音質(zhì)量好、抗噪抗誤碼的能力強(qiáng)等特點(diǎn),但所需的編碼速率高,其中64kb/sPCM的語(yǔ)音質(zhì)量成為一個(gè)編碼質(zhì)量的參照標(biāo)準(zhǔn)。第37頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月參數(shù)編碼是根據(jù)聲音的形成模型,把聲音變換成參數(shù)的編碼方式。其基本方法是通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取及編碼,力圖使重建語(yǔ)音信號(hào)具有盡可能的可懂性,即保持原語(yǔ)音的語(yǔ)義。而重建的信號(hào)的波形同原語(yǔ)音信號(hào)的波形可能會(huì)有相當(dāng)大的差別。參數(shù)編碼的優(yōu)點(diǎn)是:編碼速率低,編碼速率通常小于4.8kb/s,可以低至600b/s至2.4kb/s。缺點(diǎn)是:合成語(yǔ)音質(zhì)量差,特別是自然度較低,連熟人之間都不一定能聽(tīng)出講話(huà)人是誰(shuí);另外,這類(lèi)編碼器對(duì)講話(huà)環(huán)境噪聲較敏感,需要安靜的講話(huà)環(huán)境才能給出較高的可懂度,且時(shí)延大參數(shù)編碼的典型例子語(yǔ)音信號(hào)的線(xiàn)性預(yù)測(cè)編碼(LPC)已被公認(rèn)為是目前參數(shù)編碼中最有效的方法,它能夠在2.4kb/s的低比特速率下獲得清晰、可懂的合成音。并且易于硬件實(shí)現(xiàn)。這種方法的優(yōu)點(diǎn)是不但能極為精確地估計(jì)參數(shù),還在于它的計(jì)算速度比較快。另外多帶激勵(lì)(MBE)編碼,余弦變換編碼(STC)均屬參數(shù)編碼。由于參數(shù)編碼是保護(hù)語(yǔ)聲模型,重建清晰可識(shí)別的語(yǔ)聲,而不注重波形的擬合,所以這類(lèi)編碼技術(shù)實(shí)現(xiàn)的是合成語(yǔ)聲質(zhì)量下的低速或極低速的編碼。第38頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月混合編碼是將波形編碼與參數(shù)編碼結(jié)合而產(chǎn)生的一種編碼方式。使語(yǔ)音編碼技術(shù)有了突破性的進(jìn)展。其中提出了一些非常有效的處理方法,產(chǎn)生了新一代的參數(shù)編碼算法,構(gòu)成了新一代的聲碼器。混合編碼克服了原有波形編碼器與聲碼器的弱點(diǎn),而結(jié)合了它們的優(yōu)點(diǎn),在4~16kb/s速率上能夠得到高質(zhì)量合成語(yǔ)音。在本質(zhì)上具有波形編碼的優(yōu)點(diǎn),有一定抗噪和抗誤碼的性能,但時(shí)延較大?;旌暇幋a結(jié)合了以上兩種編碼方式的優(yōu)點(diǎn),采用線(xiàn)性技術(shù)構(gòu)成聲道模型,不只傳輸預(yù)測(cè)參數(shù)和清濁音信息,而是將預(yù)測(cè)誤差信息和預(yù)測(cè)參數(shù)同時(shí)傳輸,在接收端構(gòu)成新的激勵(lì)參數(shù)去激勵(lì)預(yù)測(cè)參數(shù)構(gòu)成的合成濾波器,使得合成濾波器輸出的信號(hào)波形與原始語(yǔ)聲信號(hào)的波形最大程度的擬合,從而獲得自然度較高的語(yǔ)聲。這種編碼技術(shù)的關(guān)鍵是:如何高效地傳輸預(yù)測(cè)誤差信息。依據(jù)對(duì)激勵(lì)信息的不同處理,這類(lèi)編碼主要有:多脈沖線(xiàn)性預(yù)測(cè)編碼(MPLPC)、規(guī)則脈沖激勵(lì)線(xiàn)性預(yù)測(cè)編碼(RPELPC)、碼激勵(lì)線(xiàn)性預(yù)測(cè)編碼(CELPC)、低時(shí)延的碼激勵(lì)線(xiàn)性預(yù)測(cè)編碼(LD-CELPC)。第39頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.5.1電話(huà)語(yǔ)音壓縮標(biāo)準(zhǔn)
信號(hào)頻率規(guī)定在300Hz~3.4kHz,采用標(biāo)準(zhǔn)的脈沖編碼調(diào)制(PCM),當(dāng)采樣頻率為8kHz,進(jìn)行8bit量化時(shí),所得數(shù)據(jù)速率為64kb/s,即一個(gè)數(shù)字電話(huà)。1972年CCITT為電話(huà)質(zhì)量和語(yǔ)音壓縮制定了PCM標(biāo)準(zhǔn)G.711,其速率為64Kb/s,使用非線(xiàn)性量化技術(shù),主要用于公共電話(huà)網(wǎng)中。
在ISO公布的ITU-T一系列音頻編碼標(biāo)準(zhǔn)中,用于電話(huà)語(yǔ)音壓縮的有G.711、G.721、G.723、G.728、G.729和G.729A等標(biāo)準(zhǔn)。在選擇語(yǔ)音壓縮標(biāo)準(zhǔn)時(shí),應(yīng)綜合考慮帶寬、時(shí)延、算法復(fù)雜度等各種因素。第40頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月標(biāo)準(zhǔn)編碼類(lèi)型比特率(kbps)MOS復(fù)雜性時(shí)延(ms)G.711PCM644.310.125G.721ADPCM324.0100.125G.728LD-CELP164.0500.625GSMRPE_LPT133.7520G.729G.729ACSA-CELP84.030、1515G.723.1ACPLP6.33.82537.5G.723.1MP-MLQ5.3
USDodLPC-102.4合成語(yǔ)音1022.5表7-2給出了幾個(gè)語(yǔ)音編碼標(biāo)準(zhǔn)的比特率、MOS(長(zhǎng)話(huà)質(zhì)量的語(yǔ)音平均意見(jiàn)得分)、復(fù)雜性(以G.711為基準(zhǔn))和時(shí)延(幀大小,即語(yǔ)音流量的時(shí)間長(zhǎng)度及前視時(shí)間)。
表7-2中的GSM編碼標(biāo)準(zhǔn)是1983年歐洲數(shù)字移動(dòng)特別工作組(GSM)制定的一種移動(dòng)電話(huà)的壓縮標(biāo)準(zhǔn),它壓縮的音質(zhì)不如G.711系統(tǒng)。在GSM-6.10標(biāo)準(zhǔn)中,采用RPL-LTP算法,壓縮后的一路話(huà)音數(shù)碼率為13Kbps。
第41頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月G.723協(xié)議G.723協(xié)議是一個(gè)雙速率語(yǔ)音編碼建議,其兩種速率分別是5.3kb/s和6.3kb/s。此協(xié)議是一個(gè)數(shù)字傳輸系統(tǒng)概況協(xié)議,適用于低速率多媒體服務(wù)中語(yǔ)音或音頻信號(hào)的壓縮算法。它作為完整的H.324系列標(biāo)準(zhǔn)的一部分,是其中語(yǔ)音編碼建議,主要配合低速率圖像編碼H.263標(biāo)準(zhǔn)。在IP電話(huà)網(wǎng)中,G.723協(xié)議被用來(lái)實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音編碼解碼處理。G.723.1協(xié)議的編解碼算法中兩種速率的編解碼基本原理是一樣的,只是激勵(lì)信號(hào)的量化方法有差別。對(duì)高速率(6.3kbit/s)編碼器,其激勵(lì)信號(hào)采用多脈沖最大似然量化(MP-MLQ)法進(jìn)行量化,對(duì)低速率(5.3kbit/s)編碼器,其激勵(lì)信號(hào)采用代數(shù)碼激碼線(xiàn)性預(yù)測(cè)(ACELP)法量化。第42頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月2.調(diào)幅廣播質(zhì)量的音頻壓縮編碼技術(shù)標(biāo)準(zhǔn)
頻率在50Hz一7kHz范圍。ITU于1986年通過(guò)G.722標(biāo)準(zhǔn)。
G.722標(biāo)準(zhǔn)是采用16kHz采樣,16bit量化,信號(hào)數(shù)據(jù)速率為224kbit/s,采用子帶編碼方法,將輸入音頻信號(hào)經(jīng)濾波器分成高子帶和低子帶兩個(gè)部分,分別進(jìn)行ADPCM編碼,再混合形成輸出碼流,224kbit/s可以被壓縮成64kbit/s,最后進(jìn)行數(shù)據(jù)插入(最高插入速率達(dá)16kbit/s),因此利用G.722標(biāo)準(zhǔn)可以在窄帶綜合服務(wù)數(shù)據(jù)網(wǎng)N-ISDN中的一個(gè)B信道上傳送調(diào)幅廣播質(zhì)量的音頻信號(hào)。
第43頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月G.722.1標(biāo)準(zhǔn)中,采樣率為16kHz和16bit量化時(shí),能夠在24或32kbps速率下提供7kHz的音頻帶寬,是普通電話(huà)呼叫質(zhì)量的兩倍多,所用速率僅為先前標(biāo)準(zhǔn)的一半,并可提供了近于FM廣播的音頻質(zhì)量。適合于一些重要應(yīng)用領(lǐng)域包括:IP電話(huà)、第三代移動(dòng)通信、PSTN高品質(zhì)電話(huà)會(huì)議和商務(wù)應(yīng)用(包括點(diǎn)到點(diǎn)和多點(diǎn))、語(yǔ)音流、ISDN寬帶技術(shù)、ISDN可視電話(huà)和會(huì)議電視等。
G.722.2主要采用代數(shù)編碼激勵(lì)線(xiàn)性預(yù)測(cè)技術(shù),符合此標(biāo)準(zhǔn)的編解碼器也被稱(chēng)為AMR-WB編解碼器,已被3GPP采用,作為應(yīng)用于GSM和第三代無(wú)線(xiàn)W-CDMA的寬帶編解碼器。這標(biāo)志著無(wú)線(xiàn)與有線(xiàn)業(yè)務(wù)首次得以采用同一編解碼器。AMR-WB編解碼器在語(yǔ)音質(zhì)量方面取得了突破性進(jìn)展,意味著3G與IP固定網(wǎng)絡(luò)之間的互通更加容易。
第44頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.5.3高保真立體聲音頻壓縮標(biāo)準(zhǔn)
高保真立體聲音頻范圍是50Hz~20kHz。由ISO和ITU-T聯(lián)合制訂的標(biāo)準(zhǔn)被稱(chēng)為MPEG-音頻,它是動(dòng)態(tài)圖像編碼的國(guó)際標(biāo)準(zhǔn)MPEG中的一個(gè)部分。MPEG音頻和視頻已廣泛用于VCD、CD-I、多媒體、PC中。
MPEG音頻標(biāo)準(zhǔn)基于人的聽(tīng)覺(jué)心理模型,它利用編碼技術(shù)對(duì)源文件重新進(jìn)行編碼壓縮,編碼時(shí)刪除了聽(tīng)覺(jué)中不敏感的部分,從而縮減了文件的大小,由此會(huì)造成一些失真。
第45頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月MPEG-1音頻技術(shù)
MPEG-1音頻的壓縮原理如圖7-5所示。采用的方案是子帶壓縮技術(shù)(見(jiàn)7.5.2),采用多相正交分解濾波器組將數(shù)字化的寬帶音頻信號(hào)分成32個(gè)子帶,同時(shí)對(duì)信號(hào)進(jìn)行頻譜分析。通過(guò)子帶信號(hào)與頻譜同步計(jì)算,得出對(duì)各子帶的掩蔽特性,然后分配不同的量化比特?cái)?shù)。加上CRC校驗(yàn)碼,得到標(biāo)準(zhǔn)的MPEG碼流。解碼端的過(guò)程是:解幀、子帶樣值解碼、映射還原和輸出標(biāo)準(zhǔn)PCM碼流。
第46頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月MP1壓縮比為1:4,典型的位率為每通道192Kbit/s。是VCD的音頻壓縮的方案。
MP2壓縮比為1:6~1:8,典型的位率為每通道128Kbit/s,即稱(chēng)掩蔽模式通用子帶集成編碼與多路復(fù)用,廣泛應(yīng)用于數(shù)字音頻廣播、數(shù)字演播室等數(shù)字音頻專(zhuān)業(yè)的制作、交流、存儲(chǔ)和傳送。
MP3壓縮比率可以達(dá)到1:10~1:12。典型位率為64Kbit/s,它綜合了MP2和ASPEC的優(yōu)點(diǎn),可以48kHz、44.1kHz、32kHz取樣,每聲道的數(shù)碼率32Kbps~448Kbps。適合CD-DA。由于MP3格式的復(fù)雜度相對(duì)較高,因而不適合進(jìn)行實(shí)時(shí)編碼,只有在數(shù)碼率較低的情況下才具有較高品質(zhì)的音質(zhì)。
根據(jù)需要的不同,人們又定義了不同的壓縮比率。MPEG-1壓縮格式分為3層,分別是MPEGAudioLayer-1、Layer-2和Layer-3(簡(jiǎn)寫(xiě)為MP1、MP2、MP3)。
第47頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月MPEG-2音頻技術(shù)
MPEG-2音頻和MPEG-2視頻標(biāo)準(zhǔn)并行開(kāi)發(fā),于1994年11月完成。實(shí)質(zhì)上是在MPEG-1音頻基礎(chǔ)上增加了多通道MC和多語(yǔ)音ML編碼。
MPEG-2音頻增加了5.1通道的多通道功能MC,即可以支持最多5個(gè)主音頻通道(左,中,右,左環(huán)繞,右環(huán)繞),其中C(中置)、LS(左環(huán)繞)和RS(右環(huán)繞)三個(gè)通道是在立體聲的基礎(chǔ)上增加的。同時(shí)附加一個(gè)額外的“低頻增強(qiáng)(LowFrequencyExtension)”通道,專(zhuān)供傳送低音信號(hào)。
MPEG-2音頻還增加的多語(yǔ)音ML技術(shù),多語(yǔ)音是獨(dú)立于5個(gè)通道的解說(shuō)(輔助聲音)通道,最多允許包括高達(dá)7個(gè)以上的音頻通道。
第48頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月為了適應(yīng)于非常低的比特率和有限帶寬需要的應(yīng)用,MPEG-2標(biāo)準(zhǔn)進(jìn)行了“低采樣率擴(kuò)展”,新的LSF(低采樣頻率)增加了24kHz、22.05kHz、16kHz的采樣頻率三種,由此可以提高數(shù)據(jù)的壓縮率,使數(shù)據(jù)比特率更加低,可以低到8Kbps。
MPEG2音頻的最大特征是“向后兼容性”。MPEG-2解碼器必須接受任何MPEG-1音頻流。一種用MC/ML編碼的數(shù)據(jù),即使使用了不具有MC/ML功能的MPEG音頻解碼器,這種數(shù)據(jù)也可以作為2通道的立體聲進(jìn)行重放。
另一方面,MPEG-1解碼器可以解碼MPEG-2音頻流主數(shù)據(jù)區(qū)中的音頻信號(hào),這被稱(chēng)為“向前兼容性”。所以,MPEG-2音頻與MPEG-1音頻具有很好的互換性,并與MPEG-2視頻廣泛用于數(shù)字視頻、高清晰電視HDTV和高質(zhì)量數(shù)字音頻廣播。
第49頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.6圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)
在國(guó)際標(biāo)準(zhǔn)化協(xié)會(huì)ISO批準(zhǔn)制定的多媒體國(guó)際標(biāo)準(zhǔn)中,用于圖像數(shù)據(jù)壓縮的重要標(biāo)準(zhǔn)有JPEG、MPEG和H(H.261H.263)系列三種。從圖像壓縮編碼的發(fā)展過(guò)程來(lái)說(shuō),可以分成三個(gè)階段:第一階段著重于圖像信息冗余度的壓縮方法,第二階段著重于圖像視覺(jué)冗余信息的壓縮方法,第三階段基于模型的圖像壓縮方法。
7.6.1靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)
靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)主要指JPEG(JointPhotographicExpertGroup)標(biāo)準(zhǔn),它是由聯(lián)合圖形專(zhuān)家組開(kāi)發(fā)的,該專(zhuān)家小組由國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì)(CCITT)兩家聯(lián)合成立的。該小組一直致力于建立研究適用于彩色和單色的,多灰度連續(xù)色調(diào)的,靜態(tài)數(shù)字圖像壓縮的國(guó)際標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)是于1991年提出的,并在1992年后被廣泛采納后成為國(guó)際標(biāo)準(zhǔn)。
第50頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月1.JPEG標(biāo)準(zhǔn)
JPEG是一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),不僅適用于靜止圖像的壓縮,也常常被用于電視圖像序列的幀內(nèi)圖像壓縮編碼。目前JPEG專(zhuān)家組開(kāi)發(fā)了兩種基本的壓縮算法:
一種是采用以離散余弦變換DCT為基礎(chǔ)的有損壓縮算法;另一種是采用以預(yù)測(cè)技術(shù)為基礎(chǔ)的無(wú)損壓縮算法。
使用有損壓縮算法時(shí),在壓縮比為25:1的情況下,壓縮后還原得到的圖像和原始圖像相比較,非圖像專(zhuān)家難以找到它們之間的區(qū)別,因此得到了廣泛的應(yīng)用。例如在V-CD和DVD-Video電視圖像壓縮技術(shù)中,就使用JPEG的有損壓縮算法來(lái)取消空間方向上的冗余數(shù)據(jù)。
第51頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月JPEG標(biāo)準(zhǔn)它的具體目標(biāo)是:
1).用戶(hù)可以對(duì)壓縮比、質(zhì)量效果進(jìn)行選擇。2).算法能適應(yīng)不同的數(shù)字圖像參數(shù)、大小、圖像內(nèi)容、彩色空間、統(tǒng)計(jì)特性等,但二值圖像除外。3).壓縮比高,圖像質(zhì)量保真程度好。4).算法的復(fù)雜程度應(yīng)能夠滿(mǎn)足硬、軟件實(shí)現(xiàn)的計(jì)算需求。5).支持多種操作方式。
第52頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月JPEG壓縮是有損壓縮,它利用了人的視角系統(tǒng)的特性,使用量化和無(wú)損壓縮編碼相結(jié)合來(lái)去掉視角的冗余信息和數(shù)據(jù)本身的冗余信息。JPEG算法框圖如圖4-9所示,壓縮編碼大致分成三個(gè)步驟:(1)使用正向離散余弦變換(ForwardDiscreteCosineTransform,F(xiàn)DCT)把空間域表示的圖變換成頻率域表示的圖。(2)使用加權(quán)函數(shù)對(duì)DCT系數(shù)進(jìn)行量化,這個(gè)加權(quán)函數(shù)對(duì)于人的視覺(jué)系統(tǒng)是最佳的。(3)使用哈夫曼可變字長(zhǎng)編碼器對(duì)量化系數(shù)進(jìn)行編碼。JPEG編碼的壓縮過(guò)程
第53頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月譯碼或者叫做解壓縮的過(guò)程與壓縮編碼過(guò)程正好相反。JPEG算法與彩色空間無(wú)關(guān),因此“RGB到Y(jié)UV變換”和“YUV到RGB變換”不包含在JPEG算法中。JPEG算法處理的彩色圖像是單獨(dú)的彩色分量圖像,因此它可以壓縮來(lái)自不同彩色空間的數(shù)據(jù),如RGB、YCbCr和CMYK。第54頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月為了能用單一的壓縮碼流提供多種性能、滿(mǎn)足范圍更為廣泛的應(yīng)用,JPEG工作組于1996年開(kāi)始探索一種新的靜止圖像壓縮編碼標(biāo)準(zhǔn),并且稱(chēng)它為JPEG2000。JPEG2000是JPEG工作組制定的并于2000年底陸續(xù)公布的基于JPEG標(biāo)準(zhǔn)的最新的靜止圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn),它之所以比JPEG標(biāo)準(zhǔn)優(yōu)越,主要是不再采用離散傅立葉變換DCT算法為主的編碼方法,改用以DWT(DiscreteWaveletTransformation,離散小波變換算法)為主的多解析編碼方法。
2.JPEG2000標(biāo)準(zhǔn)
第55頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月JPEG-2000(ISO15444)標(biāo)準(zhǔn)技術(shù)的目標(biāo)是“高壓縮、低比特速率”。它基于小波變換的靜止圖像壓縮標(biāo)準(zhǔn),不僅有更優(yōu)秀的壓縮性能,而且有更豐富的處理功能。JPEG-2000可提供更高的解像度(相當(dāng)于圖像分辨率,如:解像度為852×480,41萬(wàn)像素),其伸縮能力可以為一個(gè)文件提供從無(wú)損到有損的多種畫(huà)質(zhì)和解像選擇。因此,它被認(rèn)為是互聯(lián)網(wǎng)和無(wú)線(xiàn)接入應(yīng)用的理想影像編碼解決方案。
第56頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月JPEG-2000特點(diǎn)
它與JPEG的基本系統(tǒng)相比有以下的優(yōu)點(diǎn):(1)既支持有損壓縮,也支持無(wú)損壓縮方式。(2)在壓縮時(shí),可指定圖片感興趣的區(qū)域,并指定壓縮質(zhì)量;在解壓縮時(shí),對(duì)這些區(qū)域指定解壓縮順序及解壓縮質(zhì)量。(3)在高壓縮比下,仍能保持較高的圖像質(zhì)量。在類(lèi)似質(zhì)量的前提下,JPEG2000的壓縮比比JPEG高10%~30%。(4)支持漸進(jìn)式傳輸,即開(kāi)始時(shí)顯示一個(gè)模糊、不清晰且質(zhì)量低的圖像,隨著數(shù)據(jù)進(jìn)一步被接收,圖像清晰度和質(zhì)量逐步提高,最后顯示出一個(gè)高清晰度且高質(zhì)量的圖像。JPEG2000在節(jié)約和充分利用有限帶寬方面顯得更加優(yōu)越。(5)在有限帶寬上進(jìn)行文件傳輸時(shí),有很強(qiáng)的糾錯(cuò)能力,在用戶(hù)指定文件尺寸時(shí),能保證較高的再現(xiàn)圖像質(zhì)量,以致在無(wú)線(xiàn)領(lǐng)域得到廣泛應(yīng)用。(6)可對(duì)編碼流進(jìn)行隨機(jī)訪(fǎng)問(wèn)和處理,因?yàn)樗膲K編碼是獨(dú)立的,且編碼流具有包裹式結(jié)構(gòu)。(7)使用Alpha通道,以滿(mǎn)足圖形藝術(shù)和Internet的發(fā)展和需求;(8)在彩色圖像處理方面,JPEG2000可處理256個(gè)通道的信息。第57頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月JPEG-2000的重點(diǎn)技術(shù)
在編碼算法上,JPEG-2000采用以小波變換為主的多解析編碼方式,包括離散小波變換(DWT)和bitplain位簡(jiǎn)易算術(shù)編碼(MQcoder)。JPEG-2000在技術(shù)上之所以主要采用新的小波變換,原因是因?yàn)橛嘞易儞Q考察的是全局特征。即考察整個(gè)時(shí)域過(guò)程的頻域特征或整個(gè)頻域過(guò)程的時(shí)域特征,因此比較適合于平穩(wěn)過(guò)程,但不適合于非平穩(wěn)過(guò)程。在JPEG中是靠丟棄頻率信息來(lái)實(shí)現(xiàn)壓縮的,因而圖像的壓縮率越高,頻率信息被丟棄的越多。在極端情況下,JPEG只保留了反映圖像輪廓的基本信息,而損失精細(xì)全部的圖像細(xì)節(jié)。而小波變換考察的是局部特征。既能考察局部時(shí)域過(guò)程的頻域特征,又能考察局部頻域過(guò)程的時(shí)域特征,因此也適合于非平穩(wěn)過(guò)程。它能將圖像變換為一系列小波系數(shù),這些系數(shù)可以被高效壓縮和存儲(chǔ),此外,小波的粗略邊緣可以更好地表現(xiàn)圖像,因?yàn)樗薉CT壓縮普遍具有的方塊效應(yīng)。第58頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月7.6.2動(dòng)態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)
動(dòng)態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)主要包括MPEG、H(H.261H.263)、DVI。
MPEG(MovingPictureExportsGroup)是活動(dòng)圖像專(zhuān)家組,由ISO與IEC于1988年成立,致力于運(yùn)動(dòng)圖像(MPEG視頻)及其伴音編碼(MPEG音頻)標(biāo)準(zhǔn)化工作。MPEG組織制定的各個(gè)標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標(biāo)準(zhǔn)。
第59頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月H系列是由CCITT(國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì))通過(guò)的標(biāo)準(zhǔn),這種標(biāo)準(zhǔn)與JPEG及MPEG標(biāo)準(zhǔn)間有明顯的相似性,但關(guān)鍵區(qū)別是它是為動(dòng)態(tài)使用設(shè)計(jì)的,并提供完全包含的組織和高水平的交互控制。
DVI(DigitalVideoInteractive)是一種工業(yè)標(biāo)準(zhǔn),其視頻圖像的壓縮算法的性能與MPEG-1相當(dāng),即圖像質(zhì)量可達(dá)到VHS的水平,壓縮后的圖像數(shù)據(jù)率約為1.5Mb/s。為了擴(kuò)大DVI技術(shù)的應(yīng)用,Intel公司又推出了DVI算法的軟件解碼算法,稱(chēng)為Indeo技術(shù),它能將為壓縮的數(shù)字視頻文件壓縮為五分之一到十分之一。
第60頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月下面將主要介紹MPEG和H標(biāo)準(zhǔn)。
MPEG-1
MPEG-1標(biāo)準(zhǔn)(ISO/IEC11172)于制定于1992年,1993年8月公布,用于多媒體和廣播電視,這種編碼一般可以以1.5Mbps左右的數(shù)據(jù)傳輸率傳送數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音。MPEG-1的壓縮率相當(dāng)高,例如它可以把221Mbit/秒的NTSC圖像壓縮到1.2Mbit/秒,壓縮率為200:1。
第61頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月由五個(gè)部分組成:(1)MPEG-1系統(tǒng):規(guī)定了運(yùn)動(dòng)圖像數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步。(2)MPEG-1視頻:規(guī)定了視頻數(shù)據(jù)的編碼和解碼。(3)MPEG-1音頻:規(guī)定了聲音數(shù)據(jù)的編碼和解碼。(4)MPEG-1一致性測(cè)試:說(shuō)明如何測(cè)試比特?cái)?shù)據(jù)流和解碼器是否滿(mǎn)足MPEG-1前3個(gè)部分中所規(guī)定的要求。(5)MPEG-1軟件模擬:這部分內(nèi)容是一個(gè)技術(shù)報(bào)告,給出了用軟件執(zhí)行MPEG-1標(biāo)準(zhǔn)前3個(gè)部分的結(jié)果。MPEG-1標(biāo)準(zhǔn)簡(jiǎn)介
第62頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月MPEG-1的應(yīng)用領(lǐng)域包括:光盤(pán)、數(shù)字音頻磁帶(DAT)、磁帶設(shè)備以及通信網(wǎng)絡(luò)(如ISDN和局域網(wǎng)等)。其典型的應(yīng)用是VCD,99%的VCD都是用MPEG-1格式壓縮的,使用MPEG-1的壓縮算法,可以把一部120分鐘長(zhǎng)的電影(未壓縮視頻文件)壓縮到1.2GB左右大小。為了支持多種應(yīng)用,可由用戶(hù)來(lái)規(guī)定多種輸入?yún)?shù),包括靈活的圖像尺寸和幀頻。MPEG-1標(biāo)準(zhǔn)提供了一些錄像機(jī)的功能,包括正放、圖像凍結(jié)、快進(jìn)、快倒和慢放,此外,還提供了隨機(jī)存取的功能。MPEG-1的應(yīng)用領(lǐng)域第63頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月MPEG-2標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)MPEG工作組制定的第二個(gè)國(guó)際標(biāo)準(zhǔn),標(biāo)準(zhǔn)號(hào)是ISO/IEC13818。它是一個(gè)直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標(biāo)準(zhǔn)。特別適用于廣播級(jí)的數(shù)字電視的編碼和傳送,被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn)和MPEG-1相比增加了隔行掃描電視的編碼,提供了位速率的可變性能(scalability)功能。MPEG-2要達(dá)到的最基本目標(biāo)是:位速率為4Mb/s~9Mb/s,最高達(dá)15Mb/s。MPEG-2在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善。MPEG-2是針對(duì)3~10Mbps的數(shù)據(jù)傳輸率制定的的運(yùn)動(dòng)圖像及其伴音編碼的國(guó)際標(biāo)準(zhǔn)。。第64頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月MPEG-2包含9個(gè)部分:(1)MPEG-2系統(tǒng)(1994年)規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步。(2)MPEG-2視頻(1994年)規(guī)定了視頻數(shù)據(jù)的編碼和解碼算法。(3)MPEG-2音頻規(guī)定了聲音數(shù)據(jù)的編碼和解碼,是MPEG-1Audio的擴(kuò)充,支持多個(gè)聲道。(4)MPEG-2一致性測(cè)試。(5)MPEG-2參考軟件。(6)MPEG-2數(shù)字存儲(chǔ)媒體命令和控制擴(kuò)展協(xié)議。第65頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月(9)MPEG-2DSM-CC一致性擴(kuò)展測(cè)試。(7)MPEG-2高級(jí)音頻編碼是多聲道聲音編碼算法標(biāo)準(zhǔn)。(8)MPEG-2系統(tǒng)解碼器實(shí)時(shí)接口擴(kuò)展標(biāo)準(zhǔn)。這是與傳輸數(shù)據(jù)流的實(shí)時(shí)接口(Real-TimeInterface,RTI)標(biāo)準(zhǔn),它可以用來(lái)適應(yīng)來(lái)自網(wǎng)絡(luò)的傳輸數(shù)據(jù)流,如圖。第66頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月與MPEG-1標(biāo)準(zhǔn)相比,MPEG-2的不同特性主要表現(xiàn)在:(1)MPEG-2有“按幀編碼”和“按場(chǎng)編碼”兩種模式。在MPEG-1中是沒(méi)有電視幀的概念,只支持逐行掃描,不支持隔行掃描。在MPEG-2中,針對(duì)隔行掃描的常規(guī)電視圖像專(zhuān)門(mén)設(shè)置了“按幀編碼”模式,相應(yīng)的運(yùn)動(dòng)補(bǔ)償算法也有擴(kuò)充,分為“按幀運(yùn)動(dòng)補(bǔ)償”和“按場(chǎng)運(yùn)動(dòng)補(bǔ)償”,其編碼效率顯著提高。第67頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月4個(gè)等級(jí)由低到高為低等級(jí)(LowLevel)、主等級(jí)(MainLevel)、1440等級(jí)(High–1440Level)和高等級(jí)(HighLevel)。配置和等級(jí)之間可能的組合如表。配置等級(jí)簡(jiǎn)單配置主要配置信噪比可變配置空間可變配置高級(jí)配置高等級(jí)##1440等級(jí)###主等級(jí)####低等級(jí)##(2)MPEG-2的類(lèi)與等級(jí)。MPEG-2提出了類(lèi)與等級(jí)的概念。類(lèi)是按視頻編碼技術(shù)的簡(jiǎn)單還是復(fù)雜而確定的;對(duì)每個(gè)類(lèi),根據(jù)編碼參數(shù)的不同,即圖像格式的簡(jiǎn)單還是復(fù)雜,進(jìn)一步劃分為不同的等級(jí)。MPEG-2標(biāo)準(zhǔn)中規(guī)定了5種類(lèi)4個(gè)等級(jí)。5個(gè)類(lèi)依次為簡(jiǎn)單類(lèi)、主類(lèi)(MainProfile)、信噪比可伸縮類(lèi)(SNRProfile)、空間分辨率可伸縮類(lèi)(SimpleProfile)、高級(jí)類(lèi)(HighProfile)。第68頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月(3)MPEG-2增加了分層編碼。MPEG-2可伸縮性體現(xiàn)在:空間分層編碼:提供空間分辨率不同的圖像。時(shí)間分層編碼:提供空間分辨率相同,但幀速率不同的視頻信號(hào)。信噪比分層編碼:提供具有相同空間分辨率,但編碼質(zhì)量不同的視頻比特流。數(shù)據(jù)分割編碼:將編碼比特流分成兩個(gè)優(yōu)先級(jí)不同的部分。(4)MPEG-2擴(kuò)充了系統(tǒng)層語(yǔ)法。MPEG-2對(duì)系統(tǒng)層語(yǔ)法有了較大的擴(kuò)充,包含了兩類(lèi)數(shù)據(jù)碼流:傳輸碼流(
TS)和節(jié)目碼流(PS)。MPEG-2的應(yīng)用領(lǐng)域很廣,它不僅支持面向存儲(chǔ)媒介的應(yīng)用,而且還支持各種通信環(huán)境下數(shù)字視頻信號(hào)的編碼和傳輸。如數(shù)字電視、TV機(jī)頂盒和DVD(數(shù)字視頻光盤(pán)),此外還可以應(yīng)用于信息存儲(chǔ)、Internet、衛(wèi)星通信、視頻會(huì)議和多媒體郵件等,其典型的應(yīng)用是DVD和HDTV(高清晰度電視)。為了適應(yīng)不同的應(yīng)用環(huán)境,MPEG-2中有很多可以選擇的參數(shù)和選項(xiàng),改變這些參數(shù)和選項(xiàng)可以得到不同的圖像質(zhì)量,滿(mǎn)足不同的需求。第69頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月
MPEG-4是針對(duì)低速率(≤64kb/s)的視頻壓縮編碼標(biāo)準(zhǔn),同時(shí)還注重基于視頻和音頻對(duì)象的交互性。主要應(yīng)用于視像電話(huà)(VideoPhone),視像電子郵件(VideoEmail)和電子新聞(ElectronicNews)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率為176X144。MPEG-4利用很窄的帶寬,通過(guò)幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。與MPEG-1和MPEG-2相比,MPEG-4的特點(diǎn)是其更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。MPEG-4是一個(gè)使你由被動(dòng)變?yōu)橹鲃?dòng)(不再只是觀看,允許你加入其中,即有交互性)的動(dòng)態(tài)圖像標(biāo)準(zhǔn);它的另一個(gè)特點(diǎn)是其綜合性;從根源上說(shuō),MPEG-4試圖將自然物體與人造物體相溶合(視覺(jué)效果意義上的)。MPEG-4的設(shè)計(jì)目標(biāo)還有更廣的適應(yīng)性和可擴(kuò)展性。MPEG4試圖達(dá)到兩個(gè)目標(biāo):1.低比特率下的多媒體通信;2.是多工業(yè)的多媒體通信的綜合。據(jù)此目標(biāo),MPEG4引入AV對(duì)象(Audio/VisaulObjects),使得更多的交互操作成為可能。
MPEG-4標(biāo)準(zhǔn)"AV對(duì)象"可以是一個(gè)孤立的人,也可以是這個(gè)人的語(yǔ)音或一段背景音樂(lè)等。它具有高效編碼、高效存儲(chǔ)與傳播及可交互操作的特性。
MPEG-4對(duì)AV對(duì)象的操作主要有:采用AV對(duì)象來(lái)表示聽(tīng)覺(jué)、視覺(jué)或者視聽(tīng)組合內(nèi)容;組合已有的AV對(duì)象來(lái)生成復(fù)合的AV對(duì)象,并由此生成AV場(chǎng)景;對(duì)AV對(duì)象的數(shù)據(jù)靈活地多路合成與同步,以便選擇合適的網(wǎng)絡(luò)來(lái)傳輸這些AV對(duì)象數(shù)據(jù);允許接收端的用戶(hù)在AV場(chǎng)景中對(duì)AV對(duì)象進(jìn)行交互操作等。第70頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月與MPEG-1和MPEG-2相比,MPEG-4更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控,它的設(shè)計(jì)目標(biāo)使其具有更廣的適應(yīng)性和可擴(kuò)展性:MPEG-4傳輸速率在4800-64000bps之間,分辨率為176×144,可以利用很窄的帶寬通過(guò)幀重建技術(shù)壓縮和傳輸數(shù)據(jù),從而能以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。因此,它將在數(shù)字電視、動(dòng)態(tài)圖像、互聯(lián)網(wǎng)、實(shí)時(shí)多媒體監(jiān)控、移動(dòng)多媒體通信、Internet/Intranet上的視頻流與可視游戲、DVD上的交互多媒體應(yīng)用等方面大顯身手。當(dāng)然,對(duì)于普通用戶(hù)來(lái)說(shuō),MPEG-4在目前來(lái)說(shuō)最有吸引力的地方還在于它能在普通CD-ROM上基本實(shí)現(xiàn)DVD的質(zhì)量:用MPEG-4壓縮算法的ASF(AdvancedStreamingformat,高級(jí)格式流)可以將120分鐘的電影壓縮為300MB左右的視頻流;采用MPEG-4壓縮算法的DIVX視頻編碼技術(shù)可以將120分鐘的電影壓縮600MB左右,也可以將一部DVD影片壓縮到2張CD-ROM上!也就是說(shuō),有了MPEG-4,你不需要購(gòu)買(mǎi)DVD-ROM就可以享受到和它差不多的視頻質(zhì)量!播放這種編碼的影片對(duì)機(jī)器的要求并不高:只要你的電腦有300MHz以上(無(wú)論是哪種型號(hào))的CPU、64MB內(nèi)存、8MB的顯卡就可以流暢地播放。不過(guò),和DVD相比,MPEG-4屬于一種高比率有損壓縮算法,其圖像質(zhì)量始終無(wú)法和DVD的MPEG-2相比,畢竟DVD的存儲(chǔ)容量比較大。此外,要想保證高速運(yùn)動(dòng)的圖像畫(huà)面不失真,必須有足夠的碼率,目前MPEG-4的碼率雖然可以調(diào)到和DVD差不多,但總體效果還有不小的差距。因此,現(xiàn)在的MPEG-4只能面向娛樂(lè)、欣賞方面的市場(chǎng),那些對(duì)圖像質(zhì)量要求較高的專(zhuān)業(yè)視頻領(lǐng)域暫時(shí)還不能采用。第71頁(yè),課件共80頁(yè),創(chuàng)作于2023年2月MPEG-7
MPEG-7標(biāo)準(zhǔn)于1998年10月提出,2001年完成并公布。MPEG-7也稱(chēng)為多媒體內(nèi)容描述接口(MultimediaContentDescriptionInterface),目的是
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度手房銀行按揭購(gòu)房服務(wù)合同
- 2025年吉林市貨運(yùn)車(chē)從業(yè)考試題
- 高三家長(zhǎng)會(huì)發(fā)言稿
- 小紅書(shū)用戶(hù)互動(dòng)營(yíng)銷(xiāo)與粉絲管理合同
- 2025年焦作貨運(yùn)從業(yè)資格模擬考試題
- 泰戈?duì)柵c普世哲理:飛鳥(niǎo)集研讀教學(xué)教案九年級(jí)語(yǔ)文
- 高效工作指導(dǎo)手冊(cè)
- 《愛(ài)因斯坦光電效應(yīng)定律詳解:高中物理教案》
- 三農(nóng)產(chǎn)品市場(chǎng)調(diào)研方案集錦
- 《圓的性質(zhì)定理證明:高二數(shù)學(xué)教學(xué)教案》
- ISO9001-2015質(zhì)量手冊(cè)及程序文件模板
- 2022年新高考天津英語(yǔ)高考真題(含答案)
- xx學(xué)校課后延時(shí)服務(wù)公示制度
- 鋼結(jié)構(gòu)施工組織設(shè)計(jì)方案4篇
- 高考臨界生輔導(dǎo)一生一策
- 中國(guó)思想史馬工程課件第二篇 秦漢篇
- GB/T 1885-1998石油計(jì)量表
- GB/T 10125-2021人造氣氛腐蝕試驗(yàn)鹽霧試驗(yàn)
- GA 923-2011公安特警專(zhuān)用車(chē)輛外觀制式涂裝規(guī)范
- 【統(tǒng)編】最新部編版五年級(jí)下冊(cè)道德與法治《我們的公共生活》課件
- 教學(xué)課件:《連鎖門(mén)店運(yùn)營(yíng)管理》(第二版)
評(píng)論
0/150
提交評(píng)論