視頻壓縮國際標(biāo)準(zhǔn)

上傳人：卓*** IP屬地：廣東上傳時間：2023-06-06 格式：PPT 頁數(shù)：131 大?。?.83MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩126頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

視頻壓縮國際標(biāo)準(zhǔn)第一頁，共一百三十一頁，編輯于2023年，星期一3.2H.26 x 標(biāo)準(zhǔn)

3.2.1H.261標(biāo)準(zhǔn)一.概述

1、1990年12月CCITT（國際電報電話咨詢委員會）（后改為IUT-國際電信聯(lián)盟）通過。2、為P×64kb/s視聽業(yè)務(wù)的視頻編碼器

P=1，2……30，又稱P×64標(biāo)準(zhǔn)3、應(yīng)用H．261為N-ISDN上開展可視通信業(yè)務(wù)而提出。

可視電話，會議電視。第二頁，共一百三十一頁，編輯于2023年，星期一二、圖像格式

1、CIF和QCIF格式

CIFCommonIntermediateFormat,通用中間格式

QCIFQuarterCIF

第三頁，共一百三十一頁，編輯于2023年，星期一2、主要參數(shù)

CIFQCIFY抽樣頻率6.75MHz3.375MHzCr，Cb抽樣頻率3.375MHz1.6875MHzY有效樣點/行352176Cr，Cb有效樣點/行17688Y有效行/幀288144Cr，Cb有效行/幀14472Y：亮度信號Cr：紅色差信號Cb：蘭色差信號由上表可見，QCIF是取CIF縱橫像素的各一半。第四頁，共一百三十一頁，編輯于2023年，星期一3、Y、C樣點位置

第五頁，共一百三十一頁，編輯于2023年，星期一4、幀結(jié)構(gòu)

（1）一幀CIF由12個組塊（GOB-GROUPOFBLOCK）

組成，（QCIF由3個組塊組成）

A.圖CIF

QCIFGOB1GOB2GOB3B．GOB編號：從左到右，從上到下第六頁，共一百三十一頁，編輯于2023年，星期一（2）每個塊組（GOB）由33個宏塊（MB-MACROBLOCK）組成

A.圖

B．MB編號：從左到右，到上到下C．MB是運動補償?shù)幕締卧?/p>

第七頁，共一百三十一頁，編輯于2023年，星期一（3）每個宏塊（MB）由6塊（B-BLOCK）組成。（其中：4個Y塊和2個色差塊——一個Cb，一個Cr組成）

A．圖

B．B編號如圖所示

C．B是DCT的基本單元，即基本編碼單元

D．每塊（B）由8×8像素組成，像素編號：從左到右，從上到下。4個Y塊和Cb，Cr對應(yīng)圖面上的同一區(qū)域。第八頁，共一百三十一頁，編輯于2023年，星期一三、數(shù)據(jù)結(jié)構(gòu)

1、分四層圖象層：PLayer（picturelayer）塊組層：GOBLayer

宏塊層：MBLayer

塊層：BLayer第九頁，共一百三十一頁，編輯于2023年，星期一

P圖像標(biāo)題（幀頭）主要內(nèi)容：（1）幀開始碼，（2）幀計數(shù)碼，（3）幀類型碼，如CIF或QCIF等，（4）備用插入信息碼

GOB標(biāo)題主要內(nèi)容：(1)塊組開始，（2）塊組編號，（3）塊組量化步長，（4）備份信息碼，

MB標(biāo)題主要內(nèi)容：（1）地址碼，（2）類型碼（幀內(nèi)，幀間，運動補償，濾波器用否，等）,(3)量化步長，（4）運動矢量…第十頁，共一百三十一頁，編輯于2023年，星期一四、源編碼器

1.方框圖

q：量化變換系數(shù)qZ：量化步長指示P：幀內(nèi)/幀間指示v：運動矢量F：環(huán)路濾波開關(guān)指示t：宏塊圖像發(fā)送與否指示第十一頁，共一百三十一頁，編輯于2023年，星期一（1）混合編碼方式：以運動補償幀間預(yù)測和分塊DCT為基礎(chǔ)的混合編碼算法。

A．幀內(nèi)，幀間模式

a、幀內(nèi)模式：k1,k2上位置對原圖像進行DCTQ熵編碼。

b、幀間模式：k1,k2下位置（運動補償預(yù)測編碼），對幀間預(yù)測誤差上進行

DCTQ熵編碼

B．量化：對DCT變換系數(shù)進行量化。壓縮

C．熵編碼：游程編碼（RLC），變長編碼（VLC），對符號冗余度進行無損壓縮編碼。（2）傳輸緩沖器協(xié)調(diào)編碼器輸出和傳輸網(wǎng)絡(luò)位率，充分利用網(wǎng)絡(luò)傳輸位率，對于恒定輸出碼率：

第十二頁，共一百三十一頁，編輯于2023年，星期一（3）編碼器控制器

A．根據(jù)緩沖器來的信息控制量化步長

B．控制編碼模式（幀內(nèi)，幀間）

C．宏塊傳送與否。（4）熵編碼器除了對量化后的DCT系數(shù)編碼外，還要把許多附加信息組織到（復(fù)用）數(shù)據(jù)流中去，這些信息包括：

A．幀內(nèi)/幀間編碼標(biāo)志（P）

B．宏塊發(fā)送與否標(biāo)志（t）

C．使用量化表（q）

D．運動矢量（v）

E．環(huán)路濾波器用與否（f）∴這里熵編碼也被稱為：多路編碼器，復(fù)用編碼器。第十三頁，共一百三十一頁，編輯于2023年，星期一2、幀內(nèi)、幀間編碼判斷方法：以MB為單位，比較前后兩幀圖像的相關(guān)性，通常相關(guān)性小采用幀內(nèi)，相關(guān)性強采用幀間模式。下面給出一種幀內(nèi)、幀間編碼判斷方法。設(shè)P（x，y）為前幀MB像素值，C（x，y）為當(dāng)前幀MB像素值。前幀MB亮度信號方差VAROR為：前后幀像素差方值，VAR

第十四頁，共一百三十一頁，編輯于2023年，星期一

1）當(dāng)VAR≤64，或VAR＞64且VAROR≥VAR時，用幀間；

2）當(dāng)VAR＞64，且VAR＞VAROR時，用幀內(nèi)。

該判據(jù)可用下圖表示：

值得說明的是H。261標(biāo)準(zhǔn)，沒有包括上述判定方法，因此可以使用其它判定方法。

第十五頁，共一百三十一頁，編輯于2023年，星期一.

3、量化：

1)采用均勻量化

2)直流系數(shù)量化步長固定為83)其它系數(shù)，不同MB可用不同步長，但每個MB步長相同。第十六頁，共一百三十一頁，編輯于2023年，星期一

4熵編碼由行程編碼和Huffman編碼二部分組成。（1）行程編碼

A、對8×8量化系數(shù)（塊）采用Z字形掃描處理，得到一維量化系數(shù)序列。使低頻系數(shù)數(shù)據(jù)排在高頻系數(shù)之前，增加連零的個數(shù)，以利于熵編碼。如圖所示：

第十七頁，共一百三十一頁，編輯于2023年，星期一B．將一維量化系數(shù)序列變成若干對數(shù)據(jù)（行程/幅值）行程：指連零的個數(shù);幅值：連零后的非零系數(shù)數(shù)值。

例子：設(shè)塊量化系數(shù)入圖所示。第十八頁，共一百三十一頁，編輯于2023年，星期一

A.05303–100……10B．（1/5），（0/3），（2/-1），（56/1）（2）對（行程/幅值）進行Huffman編碼第十九頁，共一百三十一頁，編輯于2023年，星期一6、附加信息的復(fù)用規(guī)定

從前H.261方框圖（源編碼器中）可知，編碼數(shù)據(jù)流中除了塊數(shù)據(jù)外，與原始圖像的幀，塊組和宏塊相對應(yīng)，還需傳幀，塊組和宏塊的結(jié)構(gòu)信息以及宏塊量化編碼的有關(guān)其它信息，例如量化表地址、運動矢量等附加信息，現(xiàn)介紹附加信息的復(fù)用規(guī)定：

(1)圖像層（picturelayer）

A．PSC圖像啟動碼

20bit其值為：00000000000000010000

第二十頁，共一百三十一頁，編輯于2023年，星期一

B．TR時間參考

5bit，表示幀號，形成方法是將前面的圖像頭的值增1，再加上自最近一次發(fā)送后未發(fā)送的圖像數(shù)目。（即在抽幀情況下，在計算幀號時應(yīng)計入未編碼傳送的數(shù)目）

C．PTYPE形成信息，6bitBit1，分裂屏幕指示，“0”非“1”是

Bit2，文件攝像機指示

Bit3凝固圖像釋放指示

Bit4圖像格式指示，“0”為QCIF，“1”為CIFBit5，6備用

D．PEI附加插入信息指示：當(dāng)PEI=1時，其后跟9bit，其中前8bit是PARE(即圖像層附加信息)，1bit為另一個PEI，若它仍為為1，則后面再接著傳送個一個8bit附加信息，直至PEI=0，后面沒有PSPARE為止。

E．PSPARE附加信息，8bit。第二十一頁，共一百三十一頁，編輯于2023年，星期一（2）塊組層（GOBLayer）

A.塊組啟動碼GBSC16bit，碼字為0000000000000001B.組號GN4bit,表示塊組的號碼（1~12），

C.量化器信息QUANTD．

5bit，表示1－31各量化系數(shù)中的某一個量化系數(shù)。它在任何后續(xù)的QUANTD取代前都指示宏塊組所使用的量化器。

D.附加插如信息指示GEI，及附加信息GSAPRE，與圖像層PEI和PAPARE相似，只是這些附加信息嵌在塊碼流中。第二十二頁，共一百三十一頁，編輯于2023年，星期一（3）宏塊（MBLayer）宏塊的數(shù)目較多，為了節(jié)省碼字，基本上采用可變長編碼（VLC）

A．宏塊地址MBAMBA總是含在發(fā)送宏塊中，若某些宏塊所在的圖像部分沒有信息，則該宏塊將不發(fā)送。

B．形成信息MTYPE

可變長碼字該宏塊的有關(guān)信息。

C．量化器MQUANa）僅當(dāng)MTYPE指出MQUANT存在時才有MQUANTb）5bit，MQUANT碼字與GQUANT相同

D．碼塊圖案CBP用以說明當(dāng)前MB哪幾塊編碼傳送。第二十三頁，共一百三十一頁，編輯于2023年，星期一

（4）塊層（BLayer）由變換系數(shù)（TCOFEE）和跟隨其后的塊終止標(biāo)號（EOB）組成。

7、BCH編碼：（1）BCH（n，k），循環(huán)冗余校驗碼

n=511碼長

k=493信息碼元長

n-k=18校驗碼元長第二十四頁，共一百三十一頁，編輯于2023年，星期一（2）糾錯幀安排

A．幀群；8幀組成一幀群（a）一幀：幀首數(shù)據(jù)校驗碼

149318

（b）幀首：每個幀首僅一位，用于同步，八個幀首為S1到S8,各幀首碼位規(guī)定為：（S1S2……S8=00011011）第二十五頁，共一百三十一頁，編輯于2023年，星期一

B．?dāng)?shù)據(jù)結(jié)構(gòu)：（a）FiL：1位，稱為填滿指示

FiL=1，表明其后有492位數(shù)據(jù)

FiL=0，表明后面無數(shù)據(jù)，此時492位全取1。（b）492位有效數(shù)據(jù)（3）BCH碼糾錯能力

BCH碼的碼長n，信息碼元k和糾錯個數(shù)t之間的關(guān)系

n-k≤mtn=2m-1

式中，m為大于3的整數(shù)，能糾正所有不大于t個隨機錯誤?，F(xiàn)在：n=511=29-1∴m=9n-k=18≤9tt=2即可糾正2位誤錯。每幀的511位到達(dá)解碼器后，解出信息碼元493，當(dāng)發(fā)現(xiàn)2位或2位以下的錯誤，可以自動糾正。第二十六頁，共一百三十一頁，編輯于2023年，星期一3.2.3H.263標(biāo)準(zhǔn)

H.263標(biāo)準(zhǔn)制定于1995年，是ITU-T針對64kbit/s以下的低比特速率視頻應(yīng)用而制定的標(biāo)準(zhǔn)。它的基本算法與H.261基本相同，但進行了許多改進，使得H.263標(biāo)準(zhǔn)獲得了更好的編碼性質(zhì)。改進主要包括支持更多的圖像格式、更有效的運動預(yù)測、效率更高的三維可變長編碼代替二維可變長編碼以及增加了4個可選模式。第二十七頁，共一百三十一頁，編輯于2023年，星期一1、支持的圖像格式和數(shù)據(jù)組織

1）支持5種數(shù)據(jù)格式參數(shù)Sub-QCIFQCIFCIF4CIF16CIFY有效取樣點數(shù)/行1281763527041408U，V有效取樣點數(shù)/行6488176352704Y有效行數(shù)/幀961442885761152U，V有效行數(shù)/幀4872144288576第二十八頁，共一百三十一頁，編輯于2023年，星期一

2）所有的解碼器必須支持Sub-QCIF和QCIF格式，所有的編碼器必須支持Sub-QCIF和QCIF格式中的一種，是否支持其他格式由用戶決定。

3）與H.261相同，H.263仍然采用圖像層P、塊組層GOB、宏塊層MB和塊層B四個層次的數(shù)據(jù)結(jié)構(gòu)。第二十九頁，共一百三十一頁，編輯于2023年，星期一4）H.263的編碼器框圖

H.263編碼器中沒有環(huán)路濾波器。這是因為H.263采取了更為有效的半像素精度運動矢量預(yù)測，環(huán)路濾波器作用已經(jīng)不明顯。第三十頁，共一百三十一頁，編輯于2023年，星期一2、運動預(yù)測

1）半像素精度運動矢量預(yù)測所謂半像素預(yù)測，就是在整像素精度預(yù)測后再執(zhí)行半像素精度預(yù)測。即首在搜索窗中以整像素精度進行塊全匹配搜索，獲得最佳匹配塊后，再以半像素的精度在最佳匹配塊±1像素的范圍內(nèi)執(zhí)行搜索。第三十一頁，共一百三十一頁，編輯于2023年，星期一進行半像素精度運動預(yù)測需要獲得半像素位置的幅度值，H.263通過線性插值獲得。如圖3－16所示。第三十二頁，共一百三十一頁，編輯于2023年，星期一2）運動矢量預(yù)測編碼對運動矢量采用預(yù)測編碼。預(yù)測編碼采用與當(dāng)前宏塊相鄰的三個宏塊的運動矢量的均值作為預(yù)測值，如圖3.－17所示。當(dāng)相鄰宏塊不在當(dāng)前塊組時，按照下列規(guī)則處理：如果只有一個相鄰宏塊在塊組外，則令該宏塊運動矢量為零計算預(yù)測值；如果有兩個宏塊在塊組外，則直接取剩下的宏塊的運動矢量作為預(yù)測值。第三十三頁，共一百三十一頁，編輯于2023年，星期一MV：當(dāng)前宏運動矢量MV1，MV2，MV3：用來預(yù)測的相鄰宏塊運動矢量————：GOB邊界第三十四頁，共一百三十一頁，編輯于2023年，星期一3、四種可選模式無限制運動矢量模式、基于語法的算術(shù)編碼模式、先進預(yù)測模式和PB圖像模式。1）無限制運動矢量模式在此種模式下，運動矢量可以指向圖像以外的區(qū)域，這種模式可以改善邊緣宏塊的預(yù)測效果，尤其適合較小的圖像格式（比如QCIF）。采用這種模式時。指向圖像外部的參考像素用最近的邊緣像素替代。如圖3.－18所示。第三十五頁，共一百三十一頁，編輯于2023年，星期一PA有一部分位于預(yù)測幀之外，將該部分分為1，2，4三個小部分。1中的像素點的像素值由預(yù)測幀上邊緣的相應(yīng)像素點的像素值代替。2中的像素點的像素值由預(yù)測幀右上角的相應(yīng)像素點的像素值代替。4中的像素點的像素值由預(yù)測幀右邊緣的相應(yīng)像素點的像素值代替。第三十六頁，共一百三十一頁，編輯于2023年，星期一2）基于語法的算術(shù)編碼模式在相同圖像質(zhì)量下，基于語法的算術(shù)編碼模式可以把比特率降低5%左右

3）先進預(yù)測模式先進預(yù)測模式包含兩方面的內(nèi)容，一方面，在編碼端它允許將一個宏塊分成四個塊分別進行運動估計和補償，使估計更為精確；另一方面，在解碼端它還允許采用重疊塊的運動補償方法（OBMC），這樣可以明顯地消除由塊編碼所帶來的方塊效應(yīng)第三十七頁，共一百三十一頁，編輯于2023年，星期一在先進預(yù)測模式中，既可以對一個宏塊使用一個運動矢量，也可以對宏塊的每個亮度塊各使用一個運動矢量。當(dāng)一個宏塊使用4個運動矢量時，色度塊的運動矢量是4個亮度塊運動矢量和的1/8。哪些宏塊采用4個運動矢量取決于編碼器。對運動矢量仍采用預(yù)測編碼，取三個預(yù)測矢量的均值作為預(yù)測值。不過預(yù)測矢量MV1、MV2、MV3的位置有所變化，如圖3－19所示，其中，粗線代表宏塊邊界。第三十八頁，共一百三十一頁，編輯于2023年，星期一預(yù)測矢量MV1、MV2、MV3的位置有所變化，如圖3－19所示，其中，粗線代表宏塊邊界。第三十九頁，共一百三十一頁，編輯于2023年，星期一采用OBMC時，解碼端的亮度預(yù)測值是由三個運動矢量計算得到的三個預(yù)測值的加權(quán)和。這三個運動矢量是：當(dāng)前宏塊的運動矢量、最靠近當(dāng)前像素的兩個宏塊（上下取一個，左右取一個）的運動矢量。如果一個宏塊采用四個運動矢量，這三個運動矢量是：當(dāng)前塊的運動矢量、最靠近當(dāng)前像素的運動矢量。色度預(yù)測值不采用OBMC技術(shù)。第四十頁，共一百三十一頁，編輯于2023年，星期一下面舉例說明OBMC技術(shù)。設(shè)最靠近預(yù)測樣點的兩個塊分別位于當(dāng)前塊的上方和左方，它們的運動矢量分別是（x1，y1）、（x2，y2），它們確定的樣點亮度預(yù)測值分別為s1，s2；設(shè)當(dāng)前塊的運動矢量為（x0，y0），它確定的樣點亮度預(yù)測值為s0，則待預(yù)測樣點亮度的預(yù)測值為：式中：（i，j）為當(dāng)前樣點的坐標(biāo)；H0、H1、H2分別是加權(quán)矩陣第四十一頁，共一百三十一頁，編輯于2023年，星期一第四十二頁，共一百三十一頁，編輯于2023年，星期一4）PB圖像模式PB幀，一個PB幀由一個P幀和一個B幀組成，一起編碼。其中P幀即在缺省模式中采用幀間編碼的幀，P幀由前面已經(jīng)編碼的P幀或者I幀來預(yù)測。而B幀在時間上處于前一P幀（或者I幀）和當(dāng)前P幀之間，由二者進行雙向預(yù)測，這種關(guān)系如圖3－21所示。第四十三頁，共一百三十一頁，編輯于2023年，星期一

B幀的前項運動矢量MVF和后向運動矢量MVB由下式獲得。MV為當(dāng)前P幀的運動矢量，TR0為前P幀與前一P幀的時間間隔，TRB為B幀與前一P幀的時間間隔，MVD為矢量修正值第四十四頁，共一百三十一頁，編輯于2023年，星期一1995年制定H.263標(biāo)準(zhǔn)后，ITU-T于1998年和2000年相繼通過了H.263的第二版和第三版，稱為H.263+和H.263++。在這兩個版本中，一共添加了15個新的可選模式，并修改了一個H.263的已有模式，有效的提高了編碼效果。第四十五頁，共一百三十一頁，編輯于2023年，星期一3.3JPEG標(biāo)準(zhǔn)

3.3.1JPEG一.概述

1、JPEGJointPhotographicExpertsGroup聯(lián)合圖片專家組的縮寫

2、時間：1988年提出標(biāo)準(zhǔn)草案，1990年3月通過，并命名為JPEG。

1992年正式成立國際標(biāo)準(zhǔn)

3、應(yīng)用：連續(xù)色調(diào)靜止圖像壓縮（只要處理速度足夠快，也可以用于實時視頻壓縮）

JPEG應(yīng)用面廣，可以適應(yīng)各種不同的應(yīng)用場合第四十六頁，共一百三十一頁，編輯于2023年，星期一采用JPEG算法對全活動視頻圖像進行壓縮編碼的另一種方法，是運動JPEG(MotionJPEG),簡稱M-JPEG，它是通過對JPEG標(biāo)準(zhǔn)進行擴展來支持活動圖像的壓縮。M-JPEG首先通過對相鄰幀圖像進行簡單的幀間預(yù)測得到預(yù)測誤差，然后利用JPEG算法對預(yù)測誤差進行編碼。第四十七頁，共一百三十一頁，編輯于2023年，星期一

4、四種運行模式：（1）基于DCT的順序工作模式（2）基于DCT的漸進工作模式（3）無失真編碼工作模式（4）多分辨工作模式

5、二種編碼方法（1）Huffman碼（2）算術(shù)編碼

6、三種工作系統(tǒng)（1）基本系統(tǒng)（2）擴展系統(tǒng)（3）信息保持系統(tǒng)是不同編碼方法和工作模式的不同組合。

JPEG編解碼器必須支持基本系統(tǒng)，其他系統(tǒng)作為選擇項，根據(jù)不同應(yīng)用目的進行取舍。第四十八頁，共一百三十一頁，編輯于2023年，星期一二.基本系統(tǒng)簡介

1、編、解碼方框圖基本壓縮編碼方法與H.261幀內(nèi)模式類似。第四十九頁，共一百三十一頁，編輯于2023年，星期一

2、DCT系數(shù)量化（1）均勻量化（2）不同位置采用不同的量化步長→利用人眼視覺特性進行量化→是JPEG標(biāo)準(zhǔn)的一個特點（例如：附表2，表3）分亮度量化表（表2）和色度量化表（表3）其量化計算公式：

F（U，V）為DCT系數(shù)；S（U，V）量化步長，Q（U，V）量化系數(shù)

3、熵編碼：（1）對直流系數(shù)采用DPCM編碼

A．直流系數(shù)DC：

Q（0，0）為直流系數(shù)，用DC表示，如圖3.2-1。代表本塊的平均亮度。第五十頁，共一百三十一頁，編輯于2023年，星期一

B．DPCM：（對相鄰子塊直流系數(shù)進行DPCM編碼

D=DCi-DCi-1DCi：當(dāng)前塊圖像的直流系數(shù)

DCi-1：為前一塊圖像的直流系數(shù)（2）對交流系數(shù)進行行程編碼：

A．交流系數(shù)ACij

除直流系數(shù)外的63個系數(shù)為交流系數(shù)，用ACij表示。

B．交流系數(shù)進行行程編碼第五十一頁，共一百三十一頁，編輯于2023年，星期一（3）編碼過程（與H.261類似）

A．對經(jīng)Z形掃描形成的一維AC系數(shù)序列構(gòu)成若干符號對（中間符號序列）；對直流差分?jǐn)?shù)構(gòu)成符號對；符號對由符號1和符號2組成。符號1符號2

（行程，位長）（振幅）行程：連續(xù)0的個數(shù)非零系數(shù)大小（DC：差分值，

AC：非0系數(shù)）位長：后續(xù)AC（非0）系數(shù)的編碼位長

第五十二頁，共一百三十一頁，編輯于2023年，星期一

B．對上述符號對進行變長編碼（Huffman編碼），通過查相應(yīng)編碼表得到。

(a)由符號1查編碼表得一編碼對直流系數(shù)符號查直流差分表。對交流系數(shù)查交流系數(shù)表。（b）由符號2查表得一編碼，查正負(fù)值幅度表得（補：表10）（c）由符號1和符號2查得編碼，組成該符號對的碼子。第五十三頁，共一百三十一頁，編輯于2023年，星期一（4）例子設(shè)某一亮度子圖像DCT系數(shù)量化后的系數(shù)如圖3.2-2所示，求該子圖像JPEG編碼后的數(shù)據(jù)，（設(shè)前一個子圖像的DC系數(shù)量化值為12）解：a)經(jīng)Z形掃描得一維系數(shù)序列,（150–2-1–1–100–1EOB）

b)符號對：對于DC系數(shù)，其D=DCi-DCi-1=15-12=3第五十四頁，共一百三十一頁，編輯于2023年，星期一第五十五頁，共一百三十一頁，編輯于2023年，星期一3.3MPEG標(biāo)準(zhǔn)一、概述1、MPEG：是MovingPictureExpertsGroup(活動圖像專家組——1988年ISO設(shè)立)的縮寫。（其任務(wù)是研究視頻，音頻壓縮）為制定動態(tài)圖像壓縮標(biāo)準(zhǔn)而設(shè)立的專家組。2、主要三種標(biāo)準(zhǔn)（1）MPGE-1A．1992年通過B．以壓縮碼速率為0.9-1.5Mb/s的視頻信號為目標(biāo)。D．應(yīng)用：數(shù)字存儲媒體第五十六頁，共一百三十一頁，編輯于2023年，星期一（2）MPEG-2A．1994.11通過B．為MPEG-1標(biāo)準(zhǔn)的擴展C．支持2-100Mb/s速率的數(shù)字視頻D．應(yīng)用：高品質(zhì)廣播電視，DVD，DVB，CATV，HDTV等。（3）MPEG-4A．1998.11通過B．位率<64Kb/s，超低碼率視頻壓縮標(biāo)準(zhǔn)。C．主要應(yīng)用：移動多媒體通信第五十七頁，共一百三十一頁，編輯于2023年，星期一3、主要由三部分組成：(1)MPEG視頻(2)MPEG音頻(3)MPEG系統(tǒng)：信號格式，壓縮視頻、音頻數(shù)據(jù)流的復(fù)合和同步。4、MPEG視頻壓縮算法，必須具備與存儲相適應(yīng)的性質(zhì)：(1)能夠隨機訪問(2)快進/快退檢索，倒放(3)音像同步(4)可編輯性(5)靈活的視頻格式第五十八頁，共一百三十一頁，編輯于2023年，星期一3.3.1MPEG-1

MPEG-1采用SIF視頻格式，SIF（SourceInputFormat）稱為源輸入格式,也稱作標(biāo)準(zhǔn)交換格式（StandardInterchangeFormat）,有352×288×25和352×240×30兩種選擇。1、視頻碼流結(jié)構(gòu)公分6個層次（1）圖像序列層（seguence）指整個一個被處理的連續(xù)圖像（MPEG-1：逐行掃描。）由序列頭，一個或若干圖像組和序列結(jié)束標(biāo)志組成序列頭給出圖像尺寸，幀率碼率，幀組數(shù)等信息，比特率、緩沖器容量大小等解碼器所需信息。插入附加序列頭有助于實現(xiàn)隨機訪問和編輯第五十九頁，共一百三十一頁，編輯于2023年，星期一（2）圖像組層（GOP—GroupofPicture）由圖像組頭和一系列圖像幀組成。第一幀必須是I幀。頭給出組內(nèi)幀數(shù)，幀的順序，等信息時間、圖像組終止碼、編輯斷點連接碼等參數(shù)。圖像組進行隨機存取單元第六十頁，共一百三十一頁，編輯于2023年，星期一（3）圖像層（picture）是圖像組的基本單元，為獨立的顯示單元亮度和色度之間的格式：4：1：1由頭和片層數(shù)據(jù)組成頭給出幀（圖像）類型（I.P.B），幀編號，幀內(nèi)片數(shù)等。第六十一頁，共一百三十一頁，編輯于2023年，星期一（4）片層（

Slice）目的，防止錯誤擴散片層最大相當(dāng)于每幅圖像的宏塊總數(shù)，最小時只有一個唯一的宏塊。同一片內(nèi)宏塊的次序從左到右，從上到下。是進行再同步的單元，在每條開始，對運動矢量和DCT系數(shù)值作DPCM的預(yù)測值，都重新置到零，這可防止解碼時的錯誤積累。頭給出同步，片編號，片內(nèi)宏塊數(shù)等信息。第六十二頁，共一百三十一頁，編輯于2023年，星期一（5）宏塊層（MB）由4個8×8像素組成的Y塊和兩個8×8像素組成的色度塊組成。是進行運動補償?shù)幕締卧?。?）塊層（B）8×8像素組成，為最小圖像處理單元，進行DCT的單元。數(shù)據(jù)結(jié)構(gòu)圖：第六十三頁，共一百三十一頁，編輯于2023年，星期一第六十四頁，共一百三十一頁，編輯于2023年，星期一第六十五頁，共一百三十一頁，編輯于2023年，星期一2、三種編碼圖像幀（1）I幀（IntroCodedFrame，內(nèi)幀）類似于H.261的幀內(nèi)編碼模式。A．對像素塊進行二維DCT（類似JPEG）B．作為其它圖像幀編碼的參考幀C．作為隨機存取點D．壓縮比不高，但沒有誤碼擴散。（8倍左右）（2）P幀（PredictivelyCodedFrame,預(yù)測幀）類似于H.261的幀間模式。A．利用前面的I幀或P幀進行預(yù)測編碼，（即對預(yù)測誤差進行編碼傳送。）B．是預(yù)測B幀或下一個P幀的參考幀C．壓縮比較I幀高，但誤碼會擴散。（30倍左右）第六十六頁，共一百三十一頁，編輯于2023年，星期一（3）B幀（BidirectiondlyPredictivelyCodedFrame,雙方預(yù)測幀IBBPBBPA．B幀插在I-P或P-P幀之間。B．同時利用前面和后面（P幀或I幀）圖像進行預(yù)測。C．不作為參考幀D．與H.261相比，是MPEG的特點，提高了壓縮比，改善了圖像質(zhì)量。（50倍左右）第六十七頁，共一百三十一頁，編輯于2023年，星期一（3）I、B幀數(shù)目A、I幀使用頻率和在視頻流的位置的選擇，是根據(jù)滿足圖像序列中隨機存取和景物切換的需要而定。典型每秒鐘2次，即在15幀中案排1次。B、B幀在I、P幀間安排的數(shù)目，基于編碼器中存儲器的數(shù)量和正在編碼圖像的性質(zhì)等a)B幀數(shù)壓縮比圖像質(zhì)量實時性b)典型數(shù)：插入2個B幀。第六十八頁，共一百三十一頁，編輯于2023年，星期一3、編碼器

(1)方框圖。其中V：運動矢量q：量化系數(shù)I：幀內(nèi)/幀間指示p：圖像類型第六十九頁，共一百三十一頁，編輯于2023年，星期一與H.261相似主要不同之處：A．兩個幀存儲器B．幀重排輸入：IBBPBBP……輸出：IPBBPBB……∵B幀編碼需要兩個參考幀。C．有三個控制開關(guān)。第七十頁，共一百三十一頁，編輯于2023年，星期一（2）I幀編碼（A）S1，S2，S3，開關(guān)處于I位置。(B)第七十一頁，共一百三十一頁，編輯于2023年，星期一（C）要求精量化幀內(nèi)編碼塊的信號頻率范圍較寬，則應(yīng)采用細(xì)粗量化器進行精確編碼，否則，對于哪些光滑的塊，很小的誤差都會產(chǎn)生可觀察的塊邊界（即塊效應(yīng)）采用多種專用量化表，按圖像內(nèi)容分類制定量化表：a)≧0.5系數(shù)保留b)按宏塊圖像反差調(diào)整量化表：宏塊反差：c)按輸出碼率高低，調(diào)整量化表。第七十二頁，共一百三十一頁，編輯于2023年，星期一（3）P幀編碼（A）S1，S2，S3開關(guān)處于P位置（B）找出運動矢量：以I幀（或P幀）圖像作為參考（C）運動補償預(yù)測（D）計算預(yù)測誤差（E）對預(yù)測誤差編碼（F）用粗量化。由于預(yù)測誤差主要是高頻信號，可采用粗粒度量化器。第七十三頁，共一百三十一頁，編輯于2023年，星期一（4）B幀編碼幀重排后，輸出幀序為IPBBPB，對B幀編碼時，前面的I，P幀（或P，P幀）已存入編碼器圖中的I，P幀存儲器。A．S1，S2，S3開關(guān)處于B位置。B．找出運動矢量（以I，P為參考幀）C．運動補償預(yù)測D．計算預(yù)測誤差E．預(yù)測誤差編碼：由于S3斷開，,輸出，不存入存儲器，不作為參考幀。F．粗量化第七十四頁，共一百三十一頁，編輯于2023年，星期一4、解碼器(1)方框圖第七十五頁，共一百三十一頁，編輯于2023年，星期一(2)I幀解碼第七十六頁，共一百三十一頁，編輯于2023年，星期一(3.)P幀解碼(4).B幀解碼第七十七頁，共一百三十一頁，編輯于2023年，星期一3.3.2MPEG-2標(biāo)準(zhǔn)1、概述（1）向下兼容MPEG-1和H.261標(biāo)準(zhǔn)。（由MPEG-1發(fā)展而來）（2）作為通用標(biāo)準(zhǔn)，適用于更廣泛的應(yīng)用場合，能滿足廣播、通信、計算機到家庭電子產(chǎn)品。

第七十八頁，共一百三十一頁，編輯于2023年，星期一（3）與MPEG-1相比，在視頻方面進行的擴展和改進主要包括：

(A)擴大了重要的參數(shù)值，允許更大的畫面格式，比特率和運動矢量長度。（B）考慮到電視信號隔行掃描特性，專門設(shè)置了“按幀編碼”和“按場編碼”兩種模式，（對幀/場運動補償、幀/場DCT進行選擇）成為改進圖像質(zhì)量的關(guān)鍵措施之一。（C）定義了檔次和級別的概念，作為其完整句法流的一個子集，使用戶根據(jù)不同的應(yīng)用情況進行選擇。（D）引入了可伸縮（可分級）視頻編碼方式。第七十九頁，共一百三十一頁，編輯于2023年，星期一可伸縮的（SCABLE）視頻編碼是指編碼所產(chǎn)生的碼流具有以下特性：對碼流的一部分進行解碼和對碼流的全部進行解碼能夠獲得不同質(zhì)量的重建圖像。對部分解碼所獲得的圖像比對全部碼流解碼獲得的圖像分辨率(或幀率、或信噪比等)要低。有：空間可伸縮，時間可伸縮，信噪比可伸縮和數(shù)據(jù)分割（Datapartitioning）四種。第八十頁，共一百三十一頁，編輯于2023年，星期一2、類（檔次，配置）/級（等級、級別）結(jié)構(gòu)（profile/level）“類”是集成后的完整碼流的一個子集，而每個類的“級”是對編碼參數(shù)的進一步限制（圖像參數(shù)——格式，采樣高等）。類/級是通過確定碼流中相應(yīng)標(biāo)題信息和附加信息中的有關(guān)參數(shù)來給定。第八十一頁，共一百三十一頁，編輯于2023年，星期一1）五個類（porfile）A)無B幀的簡單類（SimpleProfile）B)允許B幀的主類（MainProfile）C)在主類基礎(chǔ)上加上SNR分級的SNR可分級類（SNRScalableProfile）D)在C基礎(chǔ)上空域可分級類（SpatialyScalableProfile）E)在D基礎(chǔ)上加上時間域可分級的高類（HighScalableProfile）第八十二頁，共一百三十一頁，編輯于2023年，星期一2)四級

A)MPEG-1格式的低級（LowLevel）(352*288*30)B)標(biāo)準(zhǔn)清晰度電視的主級（MainLevel）(720×480×30,720×576×25)C)每行1440取樣的HDTV的高級(High-1440Level)(1440×1080×30,1440×1152×25)D)每行1920取樣的HDTV的高級(HighLevel)(1920×1080×30,1920×1152×25)第八十三頁，共一百三十一頁，編輯于2023年，星期一第八十四頁，共一百三十一頁，編輯于2023年，星期一

實際應(yīng)用中，有些組合不大可能出現(xiàn)，因而未予規(guī)定。如HighProfile，LowLevel就不會出現(xiàn)。其中，SP@ML,MP@ML,MP@HL和MP@H1440被認(rèn)為是最重要的技術(shù)規(guī)范。

MP@ML，是最早有集成電路的解碼器，應(yīng)用于多種場合，圖像質(zhì)量超過現(xiàn)有電視信號，美國150個衛(wèi)星直播采用，也被采用數(shù)字視盤，DVD。

MP@HL：美國HDTV大聯(lián)盟方案。MP@H1440：歐洲HDTV方案

第八十五頁，共一百三十一頁，編輯于2023年，星期一3、基于幀/場編碼模式（1）幀/場DCTDCT變換是在場內(nèi)，還是在幀內(nèi)進行，是基于景物的局部空間內(nèi)容與空間相關(guān)性有關(guān)。雖然場的行距是幀的行距的兩倍，但前者的相關(guān)性并不是總比后者小。若景物中有相當(dāng)大的運動，幀DCT的效果不如場DCT，這是幀DCT中隔行產(chǎn)生的邊緣效應(yīng)，會使大的DCT系數(shù)出現(xiàn)在左下角，而不是右上角。第八十六頁，共一百三十一頁，編輯于2023年，星期一在作DCT之前，要作幀/場編碼的選擇。選擇的方法是對16×16的原圖像或?qū)α炼茸鬟\動補償后的差值作幀的行間和場的行間的相關(guān)系數(shù)的計算。如果幀行的相關(guān)系數(shù)大于場行的相關(guān)系數(shù)，就選幀DCT編碼，否則就選場DCT編碼。一般情況小，對細(xì)節(jié)多，運動部分少的圖像，選幀DCT；對細(xì)節(jié)少，運動部分多的圖像，選場DCT。第八十七頁，共一百三十一頁，編輯于2023年，星期一(a)幀DCT編碼的亮度宏塊結(jié)構(gòu)第八十八頁，共一百三十一頁，編輯于2023年，星期一

(b)場DCT編碼的亮度宏塊結(jié)構(gòu)第八十九頁，共一百三十一頁，編輯于2023年，星期一(2)幀/場的運動補償運動補償，MPEG-1是按幀進行的。MPEG-2考慮到視頻信號隔行掃描的特點，增加了按場補償?shù)姆椒?，以便更有效的提高運動補償?shù)男Ч?，并可能部分解決運動物體遮掩/露出的問題。下面給出具體的混合預(yù)測/內(nèi)插運動補償算法第九十頁，共一百三十一頁，編輯于2023年，星期一（A）P幀運動補償是以過去幀為參考幀，根據(jù)當(dāng)前幀和參考幀的兩種屬性，奇場和偶場，可以組成四種運動補償方式，與幀補償方式一起共五種不同的補償方式。通過MSE準(zhǔn)則選擇P幀最佳運動補償方式。第九十一頁，共一百三十一頁，編輯于2023年，星期一（B）B幀運動補償以過去幀和未來幀為參考幀，可分為前向、后向和雙向預(yù)測三種方式。前兩種方式與P幀運動補償方式相同，分別得五種預(yù)測。第三種預(yù)測利用雙向平均值做運動補償。從以上多種組合中以MSE準(zhǔn)則，選出最佳運動補償方式。第九十二頁，共一百三十一頁，編輯于2023年，星期一場圖像的場預(yù)測示意圖第九十三頁，共一百三十一頁，編輯于2023年，星期一

3、可分級編碼技術(shù)目前常用的分級編碼方法有信噪比、空間、時間域分級等。這里介紹信噪比和空間域分級編碼技術(shù)。（1）信噪比可分級編碼技術(shù)主要考慮，是隨接收條件變差圖像質(zhì)量“適度降級”，以避免數(shù)字廣播所特有的“鄰戶突變”現(xiàn)象，即在廣播覆蓋邊緣附近突然一點也沒有信號。第九十四頁，共一百三十一頁，編輯于2023年，星期一（A）方框圖第九十五頁，共一百三十一頁，編輯于2023年，星期一編碼器產(chǎn)生兩個數(shù)據(jù)流，從中可建立兩個視頻信號，其建立圖像尺寸相同，只是圖像質(zhì)量不同，即信噪比的不同。通過可分級改變DCT系數(shù)的量化步長。（B）底層碼流底層碼流MPEG-2基本編碼環(huán)路得到，對DCT系數(shù)粗量化(量化器Q)，解碼得到較低質(zhì)量的視頻信號。第九十六頁，共一百三十一頁，編輯于2023年，星期一（C）頂層碼流頂層碼流是通過對底層DCT系數(shù)粗量化的噪聲再進行細(xì)量化（Q2）,經(jīng)編碼傳輸?shù)玫?。（D）底層碼流以高優(yōu)先級傳輸，頂層碼流以低優(yōu)先級傳輸。這樣，在接收邊緣地區(qū)，仍可解出低層碼流，重建較低質(zhì)量的視頻信號。在正常接收地區(qū)，接收機可同時解出底層和頂層碼流，產(chǎn)生正常質(zhì)量的視頻信號，從而實現(xiàn)不同質(zhì)量的可分級視頻信號傳輸。第九十七頁，共一百三十一頁，編輯于2023年，星期一（2）空間域可分級編碼技術(shù)空間域可分級的主要目的是實現(xiàn)不同大小的圖像即SDTV和HDTV服務(wù)的兼容性。它的實現(xiàn)框圖如圖3－43所示。第九十八頁，共一百三十一頁，編輯于2023年，星期一（A）方框圖第九十九頁，共一百三十一頁，編輯于2023年，星期一利用對圖像象素的抽取與內(nèi)插來實現(xiàn)不同級別的轉(zhuǎn)換。（B）底層碼流輸入圖像經(jīng)分辨率下抽樣（水平、垂直分別2:1取樣），得到SDTV圖像，經(jīng)過獨立的編碼環(huán)路產(chǎn)生底層碼流。（C）頂層碼流通過內(nèi)插、加權(quán)，對全質(zhì)圖像與底層圖像的差值編碼，形成頂層碼流。第一百頁，共一百三十一頁，編輯于2023年，星期一5、MPEG-2系統(tǒng)運輸層MPEG-2標(biāo)準(zhǔn)的系統(tǒng)部分是如何將音頻、視頻以及數(shù)據(jù)的基本碼流組成一個或多個適合存儲或傳送的碼流的規(guī)定。1）系統(tǒng)運輸層的結(jié)構(gòu)第一百零一頁，共一百三十一頁，編輯于2023年，星期一

A）視頻和音頻數(shù)據(jù)經(jīng)編碼器后分別得到視頻、音頻基本碼流(ES—Elementarybitstream)B)經(jīng)過打包器按一定的長度分段，切割成一個個單元，并加入必要的信息。將ES打包為打包基本碼流PES(PacketElementarystream)。

PES的數(shù)據(jù)長度，最大可以216字節(jié)，但一般是一個存取單元的長度。一個存取單元相當(dāng)一幅視頻圖像，或是一個音頻幀。在PES的頭部含有許多信息，借此可識別是視頻還是音頻、數(shù)據(jù)，也可以知道小包的長度等。第一百零二頁，共一百三十一頁，編輯于2023年，星期一C）將PES打包為兩類不同的碼流輸出到信道：一種叫節(jié)目碼流(ProgramStream),另一種叫運輸碼流（TransportStream）。節(jié)目碼流適用于相對無誤碼的環(huán)境，如交互式多媒體、CATV中。節(jié)目碼流中小包的長度相對較長，并且是可變的。運輸碼流適合于易發(fā)生錯誤的環(huán)境下，例如網(wǎng)絡(luò)傳輸，衛(wèi)星信道、地面電視廣播等運用環(huán)境中。運輸碼流中的小包長度固定，為188字節(jié)，這對處理誤碼有好處。

第一百零三頁，共一百三十一頁，編輯于2023年，星期一

2）PES組成每一個PES分組由PES起始碼、PES頭標(biāo)志、PES頭域以及凈荷組成，如圖3－45所示。第一百零四頁，共一百三十一頁，編輯于2023年，星期一在PES數(shù)據(jù)塊的前面有一個PES頭，它包含了許多信息。PES包起始碼（packetStartCode）：3Byte,共23個“0”和一個“1”，即“000000000000000000000001”。PES的比特構(gòu)成格式是專用的，在碼流中不會有這種組合代表別的意思，它起同步作用。包標(biāo)識（StreamID）：說明這個包碼流的性質(zhì)（視頻、音頻或數(shù)據(jù)）及序號。例如：

110×××××——表示音頻碼流，序號為×××××1111××××——表示視頻碼流，序號為××××第一百零五頁，共一百三十一頁，編輯于2023年，星期一PES包長度（PESPacketLength）：說明這個字段后面有多少個字節(jié)。PES頭標(biāo)志（PESHeaderflags）：它有14個bit，包含有很多內(nèi)容，如圖3－46所示第一百零六頁，共一百三十一頁，編輯于2023年，星期一SC：表示加擾指示。

PR:表示優(yōu)先級。

DA:表示數(shù)據(jù)匹配指示。

CR:表示有無版權(quán)指示。

OC:表示原版或拷貝。PD:表示是否有PTS（PresentationTimeStamp，顯示時間標(biāo)志，告訴解碼器一個顯示單元應(yīng)該顯示的時間）或DTS(DecodingTimeStamp,指示一個存儲單元進行解碼的時間)。ESCR:標(biāo)識PES包頭部是否有ElementaryStreamClockReference,即基本碼流的時鐘基準(zhǔn)信息。第一百零七頁，共一百三十一頁，編輯于2023年，星期一RATE:表示PES包頭是否有ElementaryStreamRate,即基本碼流速率信息。TM:表示指示是否有8個比特的字段說明DMS（DigitalStorageMedia）的模式。AC;未定義。CRC：表示是否有CRC字段。EXT：說明是否有擴展標(biāo)志。第一百零八頁，共一百三十一頁，編輯于2023年，星期一PES分組與一個圖像序列、一個GOP或一幅圖像的起始碼對齊，即PES分組凈荷的第一個字節(jié)要么是圖像序列的起始碼，要么是GOP的起始碼，要么是圖像的起始碼第一百零九頁，共一百三十一頁，編輯于2023年，星期一3）運輸小包運輸小包的結(jié)構(gòu)如圖3－47所示。

(1)固定長度：188字節(jié)

(2)一個新的PES包數(shù)據(jù)總是開始一個新的運輸小包，如果PES包在運輸小包的中間結(jié)束，那么運輸小包的余下長度內(nèi)就用填充字（stuffingbytes）放進去。第一百一十頁，共一百三十一頁，編輯于2023年，星期一(3)運輸小包由包頭和凈負(fù)荷數(shù)據(jù)組成，其的頭部分為兩層，一層是固定長的的連接層“LinkLayer”，另一層是可變長長度的適配層“AdaptationLayer

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

視頻壓縮國際標(biāo)準(zhǔn)

文檔簡介

溫馨提示

最新文檔

評論

視頻壓縮國際標(biāo)準(zhǔn)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔