視頻壓縮國際標(biāo)準(zhǔn)_第1頁
視頻壓縮國際標(biāo)準(zhǔn)_第2頁
視頻壓縮國際標(biāo)準(zhǔn)_第3頁
視頻壓縮國際標(biāo)準(zhǔn)_第4頁
視頻壓縮國際標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩126頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

視頻壓縮國際標(biāo)準(zhǔn)第一頁,共一百三十一頁,編輯于2023年,星期一3.2H.26 x 標(biāo)準(zhǔn)

3.2.1H.261標(biāo)準(zhǔn)一.概述

1、1990年12月CCITT(國際電報電話咨詢委員會)(后改為IUT-國際電信聯(lián)盟)通過。2、為P×64kb/s視聽業(yè)務(wù)的視頻編碼器

P=1,2……30,又稱P×64標(biāo)準(zhǔn)3、應(yīng)用H.261為N-ISDN上開展可視通信業(yè)務(wù)而提出。

可視電話,會議電視。第二頁,共一百三十一頁,編輯于2023年,星期一二、圖像格式

1、CIF和QCIF格式

CIFCommonIntermediateFormat,通用中間格式

QCIFQuarterCIF

第三頁,共一百三十一頁,編輯于2023年,星期一2、主要參數(shù)

CIFQCIFY抽樣頻率6.75MHz3.375MHzCr,Cb抽樣頻率3.375MHz1.6875MHzY有效樣點/行352176Cr,Cb有效樣點/行17688Y有效行/幀288144Cr,Cb有效行/幀14472Y:亮度信號Cr:紅色差信號Cb:蘭色差信號由上表可見,QCIF是取CIF縱橫像素的各一半。第四頁,共一百三十一頁,編輯于2023年,星期一3、Y、C樣點位置

第五頁,共一百三十一頁,編輯于2023年,星期一4、幀結(jié)構(gòu)

(1)一幀CIF由12個組塊(GOB-GROUPOFBLOCK)

組成,(QCIF由3個組塊組成)

A.圖CIF

QCIFGOB1GOB2GOB3B.GOB編號:從左到右,從上到下第六頁,共一百三十一頁,編輯于2023年,星期一(2)每個塊組(GOB)由33個宏塊(MB-MACROBLOCK)組成

A.圖

B.MB編號:從左到右,到上到下C.MB是運動補償?shù)幕締卧?/p>

第七頁,共一百三十一頁,編輯于2023年,星期一(3)每個宏塊(MB)由6塊(B-BLOCK)組成。(其中:4個Y塊和2個色差塊——一個Cb,一個Cr組成)

A.圖

B.B編號如圖所示

C.B是DCT的基本單元,即基本編碼單元

D.每塊(B)由8×8像素組成,像素編號:從左到右,從上到下。4個Y塊和Cb,Cr對應(yīng)圖面上的同一區(qū)域。第八頁,共一百三十一頁,編輯于2023年,星期一三、數(shù)據(jù)結(jié)構(gòu)

1、分四層圖象層:PLayer(picturelayer)塊組層:GOBLayer

宏塊層:MBLayer

塊層:BLayer第九頁,共一百三十一頁,編輯于2023年,星期一

P圖像標(biāo)題(幀頭)主要內(nèi)容:(1)幀開始碼,(2)幀計數(shù)碼,(3)幀類型碼,如CIF或QCIF等,(4)備用插入信息碼

GOB標(biāo)題主要內(nèi)容:(1)塊組開始,(2)塊組編號,(3)塊組量化步長,(4)備份信息碼,

MB標(biāo)題主要內(nèi)容:(1)地址碼,(2)類型碼(幀內(nèi),幀間,運動補償,濾波器用否,等),(3)量化步長,(4)運動矢量…第十頁,共一百三十一頁,編輯于2023年,星期一四、源編碼器

1.方框圖

q:量化變換系數(shù)qZ:量化步長指示P:幀內(nèi)/幀間指示v:運動矢量F:環(huán)路濾波開關(guān)指示t:宏塊圖像發(fā)送與否指示第十一頁,共一百三十一頁,編輯于2023年,星期一(1)混合編碼方式:以運動補償幀間預(yù)測和分塊DCT為基礎(chǔ)的混合編碼算法。

A.幀內(nèi),幀間模式

a、幀內(nèi)模式:k1,k2上位置對原圖像進行DCTQ熵編碼。

b、幀間模式:k1,k2下位置(運動補償預(yù)測編碼),對幀間預(yù)測誤差上進行

DCTQ熵編碼

B.量化:對DCT變換系數(shù)進行量化。壓縮

C.熵編碼:游程編碼(RLC),變長編碼(VLC),對符號冗余度進行無損壓縮編碼。(2)傳輸緩沖器協(xié)調(diào)編碼器輸出和傳輸網(wǎng)絡(luò)位率,充分利用網(wǎng)絡(luò)傳輸位率,對于恒定輸出碼率:

第十二頁,共一百三十一頁,編輯于2023年,星期一(3)編碼器控制器

A.根據(jù)緩沖器來的信息控制量化步長

B.控制編碼模式(幀內(nèi),幀間)

C.宏塊傳送與否。(4)熵編碼器除了對量化后的DCT系數(shù)編碼外,還要把許多附加信息組織到(復(fù)用)數(shù)據(jù)流中去,這些信息包括:

A.幀內(nèi)/幀間編碼標(biāo)志(P)

B.宏塊發(fā)送與否標(biāo)志(t)

C.使用量化表(q)

D.運動矢量(v)

E.環(huán)路濾波器用與否(f)∴這里熵編碼也被稱為:多路編碼器,復(fù)用編碼器。第十三頁,共一百三十一頁,編輯于2023年,星期一2、幀內(nèi)、幀間編碼判斷方法:以MB為單位,比較前后兩幀圖像的相關(guān)性,通常相關(guān)性小采用幀內(nèi),相關(guān)性強采用幀間模式。下面給出一種幀內(nèi)、幀間編碼判斷方法。設(shè)P(x,y)為前幀MB像素值,C(x,y)為當(dāng)前幀MB像素值。前幀MB亮度信號方差VAROR為:前后幀像素差方值,VAR

第十四頁,共一百三十一頁,編輯于2023年,星期一

1)當(dāng)VAR≤64,或VAR>64且VAROR≥VAR時,用幀間;

2)當(dāng)VAR>64,且VAR>VAROR時,用幀內(nèi)。

該判據(jù)可用下圖表示:

值得說明的是H。261標(biāo)準(zhǔn),沒有包括上述判定方法,因此可以使用其它判定方法。

第十五頁,共一百三十一頁,編輯于2023年,星期一.

3、量化:

1)采用均勻量化

2)直流系數(shù)量化步長固定為83)其它系數(shù),不同MB可用不同步長,但每個MB步長相同。第十六頁,共一百三十一頁,編輯于2023年,星期一

4熵編碼由行程編碼和Huffman編碼二部分組成。(1)行程編碼

A、對8×8量化系數(shù)(塊)采用Z字形掃描處理,得到一維量化系數(shù)序列。使低頻系數(shù)數(shù)據(jù)排在高頻系數(shù)之前,增加連零的個數(shù),以利于熵編碼。如圖所示:

第十七頁,共一百三十一頁,編輯于2023年,星期一B.將一維量化系數(shù)序列變成若干對數(shù)據(jù)(行程/幅值)行程:指連零的個數(shù);幅值:連零后的非零系數(shù)數(shù)值。

例子:設(shè)塊量化系數(shù)入圖所示。第十八頁,共一百三十一頁,編輯于2023年,星期一

A.05303–100……10B.(1/5),(0/3),(2/-1),(56/1)(2)對(行程/幅值)進行Huffman編碼第十九頁,共一百三十一頁,編輯于2023年,星期一6、附加信息的復(fù)用規(guī)定

從前H.261方框圖(源編碼器中)可知,編碼數(shù)據(jù)流中除了塊數(shù)據(jù)外,與原始圖像的幀,塊組和宏塊相對應(yīng),還需傳幀,塊組和宏塊的結(jié)構(gòu)信息以及宏塊量化編碼的有關(guān)其它信息,例如量化表地址、運動矢量等附加信息,現(xiàn)介紹附加信息的復(fù)用規(guī)定:

(1)圖像層(picturelayer)

A.PSC圖像啟動碼

20bit其值為:00000000000000010000

第二十頁,共一百三十一頁,編輯于2023年,星期一

B.TR時間參考

5bit,表示幀號,形成方法是將前面的圖像頭的值增1,再加上自最近一次發(fā)送后未發(fā)送的圖像數(shù)目。(即在抽幀情況下,在計算幀號時應(yīng)計入未編碼傳送的數(shù)目)

C.PTYPE形成信息,6bitBit1,分裂屏幕指示,“0”非“1”是

Bit2,文件攝像機指示

Bit3凝固圖像釋放指示

Bit4圖像格式指示,“0”為QCIF,“1”為CIFBit5,6備用

D.PEI附加插入信息指示:當(dāng)PEI=1時,其后跟9bit,其中前8bit是PARE(即圖像層附加信息),1bit為另一個PEI,若它仍為為1,則后面再接著傳送個一個8bit附加信息,直至PEI=0,后面沒有PSPARE為止。

E.PSPARE附加信息,8bit。第二十一頁,共一百三十一頁,編輯于2023年,星期一(2)塊組層(GOBLayer)

A.塊組啟動碼GBSC16bit,碼字為0000000000000001B.組號GN4bit,表示塊組的號碼(1~12),

C.量化器信息QUANTD.

5bit,表示1-31各量化系數(shù)中的某一個量化系數(shù)。它在任何后續(xù)的QUANTD取代前都指示宏塊組所使用的量化器。

D.附加插如信息指示GEI,及附加信息GSAPRE,與圖像層PEI和PAPARE相似,只是這些附加信息嵌在塊碼流中。第二十二頁,共一百三十一頁,編輯于2023年,星期一(3)宏塊(MBLayer)宏塊的數(shù)目較多,為了節(jié)省碼字,基本上采用可變長編碼(VLC)

A.宏塊地址MBAMBA總是含在發(fā)送宏塊中,若某些宏塊所在的圖像部分沒有信息,則該宏塊將不發(fā)送。

B.形成信息MTYPE

可變長碼字該宏塊的有關(guān)信息。

C.量化器MQUANa)僅當(dāng)MTYPE指出MQUANT存在時才有MQUANTb)5bit,MQUANT碼字與GQUANT相同

D.碼塊圖案CBP用以說明當(dāng)前MB哪幾塊編碼傳送。第二十三頁,共一百三十一頁,編輯于2023年,星期一

(4)塊層(BLayer)由變換系數(shù)(TCOFEE)和跟隨其后的塊終止標(biāo)號(EOB)組成。

7、BCH編碼:(1)BCH(n,k),循環(huán)冗余校驗碼

n=511碼長

k=493信息碼元長

n-k=18校驗碼元長第二十四頁,共一百三十一頁,編輯于2023年,星期一(2)糾錯幀安排

A.幀群;8幀組成一幀群(a)一幀:幀首數(shù)據(jù)校驗碼

149318

(b)幀首:每個幀首僅一位,用于同步,八個幀首為S1到S8,各幀首碼位規(guī)定為:(S1S2……S8=00011011)第二十五頁,共一百三十一頁,編輯于2023年,星期一

B.?dāng)?shù)據(jù)結(jié)構(gòu):(a)FiL:1位,稱為填滿指示

FiL=1,表明其后有492位數(shù)據(jù)

FiL=0,表明后面無數(shù)據(jù),此時492位全取1。(b)492位有效數(shù)據(jù)(3)BCH碼糾錯能力

BCH碼的碼長n,信息碼元k和糾錯個數(shù)t之間的關(guān)系

n-k≤mtn=2m-1

式中,m為大于3的整數(shù),能糾正所有不大于t個隨機錯誤?,F(xiàn)在:n=511=29-1∴m=9n-k=18≤9tt=2即可糾正2位誤錯。每幀的511位到達(dá)解碼器后,解出信息碼元493,當(dāng)發(fā)現(xiàn)2位或2位以下的錯誤,可以自動糾正。第二十六頁,共一百三十一頁,編輯于2023年,星期一3.2.3H.263標(biāo)準(zhǔn)

H.263標(biāo)準(zhǔn)制定于1995年,是ITU-T針對64kbit/s以下的低比特速率視頻應(yīng)用而制定的標(biāo)準(zhǔn)。它的基本算法與H.261基本相同,但進行了許多改進,使得H.263標(biāo)準(zhǔn)獲得了更好的編碼性質(zhì)。改進主要包括支持更多的圖像格式、更有效的運動預(yù)測、效率更高的三維可變長編碼代替二維可變長編碼以及增加了4個可選模式。第二十七頁,共一百三十一頁,編輯于2023年,星期一1、支持的圖像格式和數(shù)據(jù)組織

1)支持5種數(shù)據(jù)格式參數(shù)Sub-QCIFQCIFCIF4CIF16CIFY有效取樣點數(shù)/行1281763527041408U,V有效取樣點數(shù)/行6488176352704Y有效行數(shù)/幀961442885761152U,V有效行數(shù)/幀4872144288576第二十八頁,共一百三十一頁,編輯于2023年,星期一

2)所有的解碼器必須支持Sub-QCIF和QCIF格式,所有的編碼器必須支持Sub-QCIF和QCIF格式中的一種,是否支持其他格式由用戶決定。

3)與H.261相同,H.263仍然采用圖像層P、塊組層GOB、宏塊層MB和塊層B四個層次的數(shù)據(jù)結(jié)構(gòu)。第二十九頁,共一百三十一頁,編輯于2023年,星期一4)H.263的編碼器框圖

H.263編碼器中沒有環(huán)路濾波器。這是因為H.263采取了更為有效的半像素精度運動矢量預(yù)測,環(huán)路濾波器作用已經(jīng)不明顯。第三十頁,共一百三十一頁,編輯于2023年,星期一2、運動預(yù)測

1)半像素精度運動矢量預(yù)測所謂半像素預(yù)測,就是在整像素精度預(yù)測后再執(zhí)行半像素精度預(yù)測。即首在搜索窗中以整像素精度進行塊全匹配搜索,獲得最佳匹配塊后,再以半像素的精度在最佳匹配塊±1像素的范圍內(nèi)執(zhí)行搜索。第三十一頁,共一百三十一頁,編輯于2023年,星期一進行半像素精度運動預(yù)測需要獲得半像素位置的幅度值,H.263通過線性插值獲得。如圖3-16所示。第三十二頁,共一百三十一頁,編輯于2023年,星期一2)運動矢量預(yù)測編碼對運動矢量采用預(yù)測編碼。預(yù)測編碼采用與當(dāng)前宏塊相鄰的三個宏塊的運動矢量的均值作為預(yù)測值,如圖3.-17所示。當(dāng)相鄰宏塊不在當(dāng)前塊組時,按照下列規(guī)則處理:如果只有一個相鄰宏塊在塊組外,則令該宏塊運動矢量為零計算預(yù)測值;如果有兩個宏塊在塊組外,則直接取剩下的宏塊的運動矢量作為預(yù)測值。第三十三頁,共一百三十一頁,編輯于2023年,星期一MV:當(dāng)前宏運動矢量MV1,MV2,MV3:用來預(yù)測的相鄰宏塊運動矢量————:GOB邊界第三十四頁,共一百三十一頁,編輯于2023年,星期一3、四種可選模式無限制運動矢量模式、基于語法的算術(shù)編碼模式、先進預(yù)測模式和PB圖像模式。1)無限制運動矢量模式在此種模式下,運動矢量可以指向圖像以外的區(qū)域,這種模式可以改善邊緣宏塊的預(yù)測效果,尤其適合較小的圖像格式(比如QCIF)。采用這種模式時。指向圖像外部的參考像素用最近的邊緣像素替代。如圖3.-18所示。第三十五頁,共一百三十一頁,編輯于2023年,星期一PA有一部分位于預(yù)測幀之外,將該部分分為1,2,4三個小部分。1中的像素點的像素值由預(yù)測幀上邊緣的相應(yīng)像素點的像素值代替。2中的像素點的像素值由預(yù)測幀右上角的相應(yīng)像素點的像素值代替。4中的像素點的像素值由預(yù)測幀右邊緣的相應(yīng)像素點的像素值代替。第三十六頁,共一百三十一頁,編輯于2023年,星期一2)基于語法的算術(shù)編碼模式在相同圖像質(zhì)量下,基于語法的算術(shù)編碼模式可以把比特率降低5%左右

3)先進預(yù)測模式先進預(yù)測模式包含兩方面的內(nèi)容,一方面,在編碼端它允許將一個宏塊分成四個塊分別進行運動估計和補償,使估計更為精確;另一方面,在解碼端它還允許采用重疊塊的運動補償方法(OBMC),這樣可以明顯地消除由塊編碼所帶來的方塊效應(yīng)第三十七頁,共一百三十一頁,編輯于2023年,星期一在先進預(yù)測模式中,既可以對一個宏塊使用一個運動矢量,也可以對宏塊的每個亮度塊各使用一個運動矢量。當(dāng)一個宏塊使用4個運動矢量時,色度塊的運動矢量是4個亮度塊運動矢量和的1/8。哪些宏塊采用4個運動矢量取決于編碼器。對運動矢量仍采用預(yù)測編碼,取三個預(yù)測矢量的均值作為預(yù)測值。不過預(yù)測矢量MV1、MV2、MV3的位置有所變化,如圖3-19所示,其中,粗線代表宏塊邊界。第三十八頁,共一百三十一頁,編輯于2023年,星期一預(yù)測矢量MV1、MV2、MV3的位置有所變化,如圖3-19所示,其中,粗線代表宏塊邊界。第三十九頁,共一百三十一頁,編輯于2023年,星期一采用OBMC時,解碼端的亮度預(yù)測值是由三個運動矢量計算得到的三個預(yù)測值的加權(quán)和。這三個運動矢量是:當(dāng)前宏塊的運動矢量、最靠近當(dāng)前像素的兩個宏塊(上下取一個,左右取一個)的運動矢量。如果一個宏塊采用四個運動矢量,這三個運動矢量是:當(dāng)前塊的運動矢量、最靠近當(dāng)前像素的運動矢量。色度預(yù)測值不采用OBMC技術(shù)。第四十頁,共一百三十一頁,編輯于2023年,星期一下面舉例說明OBMC技術(shù)。設(shè)最靠近預(yù)測樣點的兩個塊分別位于當(dāng)前塊的上方和左方,它們的運動矢量分別是(x1,y1)、(x2,y2),它們確定的樣點亮度預(yù)測值分別為s1,s2;設(shè)當(dāng)前塊的運動矢量為(x0,y0),它確定的樣點亮度預(yù)測值為s0,則待預(yù)測樣點亮度的預(yù)測值為:式中:(i,j)為當(dāng)前樣點的坐標(biāo);H0、H1、H2分別是加權(quán)矩陣第四十一頁,共一百三十一頁,編輯于2023年,星期一第四十二頁,共一百三十一頁,編輯于2023年,星期一4)PB圖像模式PB幀,一個PB幀由一個P幀和一個B幀組成,一起編碼。其中P幀即在缺省模式中采用幀間編碼的幀,P幀由前面已經(jīng)編碼的P幀或者I幀來預(yù)測。而B幀在時間上處于前一P幀(或者I幀)和當(dāng)前P幀之間,由二者進行雙向預(yù)測,這種關(guān)系如圖3-21所示。第四十三頁,共一百三十一頁,編輯于2023年,星期一

B幀的前項運動矢量MVF和后向運動矢量MVB由下式獲得。MV為當(dāng)前P幀的運動矢量,TR0為前P幀與前一P幀的時間間隔,TRB為B幀與前一P幀的時間間隔,MVD為矢量修正值第四十四頁,共一百三十一頁,編輯于2023年,星期一1995年制定H.263標(biāo)準(zhǔn)后,ITU-T于1998年和2000年相繼通過了H.263的第二版和第三版,稱為H.263+和H.263++。在這兩個版本中,一共添加了15個新的可選模式,并修改了一個H.263的已有模式,有效的提高了編碼效果。第四十五頁,共一百三十一頁,編輯于2023年,星期一3.3JPEG標(biāo)準(zhǔn)

3.3.1JPEG一.概述

1、JPEGJointPhotographicExpertsGroup聯(lián)合圖片專家組的縮寫

2、時間:1988年提出標(biāo)準(zhǔn)草案,1990年3月通過,并命名為JPEG。

1992年正式成立國際標(biāo)準(zhǔn)

3、應(yīng)用:連續(xù)色調(diào)靜止圖像壓縮(只要處理速度足夠快,也可以用于實時視頻壓縮)

JPEG應(yīng)用面廣,可以適應(yīng)各種不同的應(yīng)用場合第四十六頁,共一百三十一頁,編輯于2023年,星期一采用JPEG算法對全活動視頻圖像進行壓縮編碼的另一種方法,是運動JPEG(MotionJPEG),簡稱M-JPEG,它是通過對JPEG標(biāo)準(zhǔn)進行擴展來支持活動圖像的壓縮。M-JPEG首先通過對相鄰幀圖像進行簡單的幀間預(yù)測得到預(yù)測誤差,然后利用JPEG算法對預(yù)測誤差進行編碼。第四十七頁,共一百三十一頁,編輯于2023年,星期一

4、四種運行模式:(1)基于DCT的順序工作模式(2)基于DCT的漸進工作模式(3)無失真編碼工作模式(4)多分辨工作模式

5、二種編碼方法(1)Huffman碼(2)算術(shù)編碼

6、三種工作系統(tǒng)(1)基本系統(tǒng)(2)擴展系統(tǒng)(3)信息保持系統(tǒng)是不同編碼方法和工作模式的不同組合。

JPEG編解碼器必須支持基本系統(tǒng),其他系統(tǒng)作為選擇項,根據(jù)不同應(yīng)用目的進行取舍。第四十八頁,共一百三十一頁,編輯于2023年,星期一二.基本系統(tǒng)簡介

1、編、解碼方框圖基本壓縮編碼方法與H.261幀內(nèi)模式類似。第四十九頁,共一百三十一頁,編輯于2023年,星期一

2、DCT系數(shù)量化(1)均勻量化(2)不同位置采用不同的量化步長→利用人眼視覺特性進行量化→是JPEG標(biāo)準(zhǔn)的一個特點(例如:附表2,表3)分亮度量化表(表2)和色度量化表(表3)其量化計算公式:

F(U,V)為DCT系數(shù);S(U,V)量化步長,Q(U,V)量化系數(shù)

3、熵編碼:(1)對直流系數(shù)采用DPCM編碼

A.直流系數(shù)DC:

Q(0,0)為直流系數(shù),用DC表示,如圖3.2-1。代表本塊的平均亮度。第五十頁,共一百三十一頁,編輯于2023年,星期一

B.DPCM:(對相鄰子塊直流系數(shù)進行DPCM編碼

D=DCi-DCi-1DCi:當(dāng)前塊圖像的直流系數(shù)

DCi-1:為前一塊圖像的直流系數(shù)(2)對交流系數(shù)進行行程編碼:

A.交流系數(shù)ACij

除直流系數(shù)外的63個系數(shù)為交流系數(shù),用ACij表示。

B.交流系數(shù)進行行程編碼第五十一頁,共一百三十一頁,編輯于2023年,星期一(3)編碼過程(與H.261類似)

A.對經(jīng)Z形掃描形成的一維AC系數(shù)序列構(gòu)成若干符號對(中間符號序列);對直流差分?jǐn)?shù)構(gòu)成符號對;符號對由符號1和符號2組成。符號1符號2

(行程,位長)(振幅)行程:連續(xù)0的個數(shù)非零系數(shù)大小(DC:差分值,

AC:非0系數(shù))位長:后續(xù)AC(非0)系數(shù)的編碼位長

第五十二頁,共一百三十一頁,編輯于2023年,星期一

B.對上述符號對進行變長編碼(Huffman編碼),通過查相應(yīng)編碼表得到。

(a)由符號1查編碼表得一編碼對直流系數(shù)符號查直流差分表。對交流系數(shù)查交流系數(shù)表。(b)由符號2查表得一編碼,查正負(fù)值幅度表得(補:表10)(c)由符號1和符號2查得編碼,組成該符號對的碼子。第五十三頁,共一百三十一頁,編輯于2023年,星期一(4)例子設(shè)某一亮度子圖像DCT系數(shù)量化后的系數(shù)如圖3.2-2所示,求該子圖像JPEG編碼后的數(shù)據(jù),(設(shè)前一個子圖像的DC系數(shù)量化值為12)解:a)經(jīng)Z形掃描得一維系數(shù)序列,(150–2-1–1–100–1EOB)

b)符號對:對于DC系數(shù),其D=DCi-DCi-1=15-12=3第五十四頁,共一百三十一頁,編輯于2023年,星期一第五十五頁,共一百三十一頁,編輯于2023年,星期一3.3MPEG標(biāo)準(zhǔn)一、概述1、MPEG:是MovingPictureExpertsGroup(活動圖像專家組——1988年ISO設(shè)立)的縮寫。(其任務(wù)是研究視頻,音頻壓縮)為制定動態(tài)圖像壓縮標(biāo)準(zhǔn)而設(shè)立的專家組。2、主要三種標(biāo)準(zhǔn)(1)MPGE-1A.1992年通過B.以壓縮碼速率為0.9-1.5Mb/s的視頻信號為目標(biāo)。D.應(yīng)用:數(shù)字存儲媒體第五十六頁,共一百三十一頁,編輯于2023年,星期一(2)MPEG-2A.1994.11通過B.為MPEG-1標(biāo)準(zhǔn)的擴展C.支持2-100Mb/s速率的數(shù)字視頻D.應(yīng)用:高品質(zhì)廣播電視,DVD,DVB,CATV,HDTV等。(3)MPEG-4A.1998.11通過B.位率<64Kb/s,超低碼率視頻壓縮標(biāo)準(zhǔn)。C.主要應(yīng)用:移動多媒體通信第五十七頁,共一百三十一頁,編輯于2023年,星期一3、主要由三部分組成:(1)MPEG視頻(2)MPEG音頻(3)MPEG系統(tǒng):信號格式,壓縮視頻、音頻數(shù)據(jù)流的復(fù)合和同步。4、MPEG視頻壓縮算法,必須具備與存儲相適應(yīng)的性質(zhì):(1)能夠隨機訪問(2)快進/快退檢索,倒放(3)音像同步(4)可編輯性(5)靈活的視頻格式第五十八頁,共一百三十一頁,編輯于2023年,星期一3.3.1MPEG-1

MPEG-1采用SIF視頻格式,SIF(SourceInputFormat)稱為源輸入格式,也稱作標(biāo)準(zhǔn)交換格式(StandardInterchangeFormat),有352×288×25和352×240×30兩種選擇。1、視頻碼流結(jié)構(gòu)公分6個層次(1)圖像序列層(seguence)指整個一個被處理的連續(xù)圖像(MPEG-1:逐行掃描。)由序列頭,一個或若干圖像組和序列結(jié)束標(biāo)志組成序列頭給出圖像尺寸,幀率碼率,幀組數(shù)等信息,比特率、緩沖器容量大小等解碼器所需信息。插入附加序列頭有助于實現(xiàn)隨機訪問和編輯第五十九頁,共一百三十一頁,編輯于2023年,星期一(2)圖像組層(GOP—GroupofPicture)由圖像組頭和一系列圖像幀組成。第一幀必須是I幀。頭給出組內(nèi)幀數(shù),幀的順序,等信息時間、圖像組終止碼、編輯斷點連接碼等參數(shù)。圖像組進行隨機存取單元第六十頁,共一百三十一頁,編輯于2023年,星期一(3)圖像層(picture)是圖像組的基本單元,為獨立的顯示單元亮度和色度之間的格式:4:1:1由頭和片層數(shù)據(jù)組成頭給出幀(圖像)類型(I.P.B),幀編號,幀內(nèi)片數(shù)等。第六十一頁,共一百三十一頁,編輯于2023年,星期一(4)片層(

Slice)目的,防止錯誤擴散片層最大相當(dāng)于每幅圖像的宏塊總數(shù),最小時只有一個唯一的宏塊。同一片內(nèi)宏塊的次序從左到右,從上到下。是進行再同步的單元,在每條開始,對運動矢量和DCT系數(shù)值作DPCM的預(yù)測值,都重新置到零,這可防止解碼時的錯誤積累。頭給出同步,片編號,片內(nèi)宏塊數(shù)等信息。第六十二頁,共一百三十一頁,編輯于2023年,星期一(5)宏塊層(MB)由4個8×8像素組成的Y塊和兩個8×8像素組成的色度塊組成。是進行運動補償?shù)幕締卧?。?)塊層(B)8×8像素組成,為最小圖像處理單元,進行DCT的單元。數(shù)據(jù)結(jié)構(gòu)圖:第六十三頁,共一百三十一頁,編輯于2023年,星期一第六十四頁,共一百三十一頁,編輯于2023年,星期一第六十五頁,共一百三十一頁,編輯于2023年,星期一2、三種編碼圖像幀(1)I幀(IntroCodedFrame,內(nèi)幀)類似于H.261的幀內(nèi)編碼模式。A.對像素塊進行二維DCT(類似JPEG)B.作為其它圖像幀編碼的參考幀C.作為隨機存取點D.壓縮比不高,但沒有誤碼擴散。(8倍左右)(2)P幀(PredictivelyCodedFrame,預(yù)測幀)類似于H.261的幀間模式。A.利用前面的I幀或P幀進行預(yù)測編碼,(即對預(yù)測誤差進行編碼傳送。)B.是預(yù)測B幀或下一個P幀的參考幀C.壓縮比較I幀高,但誤碼會擴散。(30倍左右)第六十六頁,共一百三十一頁,編輯于2023年,星期一(3)B幀(BidirectiondlyPredictivelyCodedFrame,雙方預(yù)測幀IBBPBBPA.B幀插在I-P或P-P幀之間。B.同時利用前面和后面(P幀或I幀)圖像進行預(yù)測。C.不作為參考幀D.與H.261相比,是MPEG的特點,提高了壓縮比,改善了圖像質(zhì)量。(50倍左右)第六十七頁,共一百三十一頁,編輯于2023年,星期一(3)I、B幀數(shù)目A、I幀使用頻率和在視頻流的位置的選擇,是根據(jù)滿足圖像序列中隨機存取和景物切換的需要而定。典型每秒鐘2次,即在15幀中案排1次。B、B幀在I、P幀間安排的數(shù)目,基于編碼器中存儲器的數(shù)量和正在編碼圖像的性質(zhì)等a)B幀數(shù)壓縮比圖像質(zhì)量實時性b)典型數(shù):插入2個B幀。第六十八頁,共一百三十一頁,編輯于2023年,星期一3、編碼器

(1)方框圖。其中V:運動矢量q:量化系數(shù)I:幀內(nèi)/幀間指示p:圖像類型第六十九頁,共一百三十一頁,編輯于2023年,星期一與H.261相似主要不同之處:A.兩個幀存儲器B.幀重排輸入:IBBPBBP……輸出:IPBBPBB……∵B幀編碼需要兩個參考幀。C.有三個控制開關(guān)。第七十頁,共一百三十一頁,編輯于2023年,星期一(2)I幀編碼(A)S1,S2,S3,開關(guān)處于I位置。(B)第七十一頁,共一百三十一頁,編輯于2023年,星期一(C)要求精量化幀內(nèi)編碼塊的信號頻率范圍較寬,則應(yīng)采用細(xì)粗量化器進行精確編碼,否則,對于哪些光滑的塊,很小的誤差都會產(chǎn)生可觀察的塊邊界(即塊效應(yīng))采用多種專用量化表,按圖像內(nèi)容分類制定量化表:a)≧0.5系數(shù)保留b)按宏塊圖像反差調(diào)整量化表:宏塊反差:c)按輸出碼率高低,調(diào)整量化表。第七十二頁,共一百三十一頁,編輯于2023年,星期一(3)P幀編碼(A)S1,S2,S3開關(guān)處于P位置(B)找出運動矢量:以I幀(或P幀)圖像作為參考(C)運動補償預(yù)測(D)計算預(yù)測誤差(E)對預(yù)測誤差編碼(F)用粗量化。由于預(yù)測誤差主要是高頻信號,可采用粗粒度量化器。第七十三頁,共一百三十一頁,編輯于2023年,星期一(4)B幀編碼幀重排后,輸出幀序為IPBBPB,對B幀編碼時,前面的I,P幀(或P,P幀)已存入編碼器圖中的I,P幀存儲器。A.S1,S2,S3開關(guān)處于B位置。B.找出運動矢量(以I,P為參考幀)C.運動補償預(yù)測D.計算預(yù)測誤差E.預(yù)測誤差編碼:由于S3斷開,,輸出,不存入存儲器,不作為參考幀。F.粗量化第七十四頁,共一百三十一頁,編輯于2023年,星期一4、解碼器(1)方框圖第七十五頁,共一百三十一頁,編輯于2023年,星期一(2)I幀解碼第七十六頁,共一百三十一頁,編輯于2023年,星期一(3.)P幀解碼(4).B幀解碼第七十七頁,共一百三十一頁,編輯于2023年,星期一3.3.2MPEG-2標(biāo)準(zhǔn)1、概述(1)向下兼容MPEG-1和H.261標(biāo)準(zhǔn)。(由MPEG-1發(fā)展而來)(2)作為通用標(biāo)準(zhǔn),適用于更廣泛的應(yīng)用場合,能滿足廣播、通信、計算機到家庭電子產(chǎn)品。

第七十八頁,共一百三十一頁,編輯于2023年,星期一(3)與MPEG-1相比,在視頻方面進行的擴展和改進主要包括:

(A)擴大了重要的參數(shù)值,允許更大的畫面格式,比特率和運動矢量長度。(B)考慮到電視信號隔行掃描特性,專門設(shè)置了“按幀編碼”和“按場編碼”兩種模式,(對幀/場運動補償、幀/場DCT進行選擇)成為改進圖像質(zhì)量的關(guān)鍵措施之一。(C)定義了檔次和級別的概念,作為其完整句法流的一個子集,使用戶根據(jù)不同的應(yīng)用情況進行選擇。(D)引入了可伸縮(可分級)視頻編碼方式。第七十九頁,共一百三十一頁,編輯于2023年,星期一可伸縮的(SCABLE)視頻編碼是指編碼所產(chǎn)生的碼流具有以下特性:對碼流的一部分進行解碼和對碼流的全部進行解碼能夠獲得不同質(zhì)量的重建圖像。對部分解碼所獲得的圖像比對全部碼流解碼獲得的圖像分辨率(或幀率、或信噪比等)要低。有:空間可伸縮,時間可伸縮,信噪比可伸縮和數(shù)據(jù)分割(Datapartitioning)四種。第八十頁,共一百三十一頁,編輯于2023年,星期一2、類(檔次,配置)/級(等級、級別)結(jié)構(gòu)(profile/level)“類”是集成后的完整碼流的一個子集,而每個類的“級”是對編碼參數(shù)的進一步限制(圖像參數(shù)——格式,采樣高等)。類/級是通過確定碼流中相應(yīng)標(biāo)題信息和附加信息中的有關(guān)參數(shù)來給定。第八十一頁,共一百三十一頁,編輯于2023年,星期一1)五個類(porfile)A)無B幀的簡單類(SimpleProfile)B)允許B幀的主類(MainProfile)C)在主類基礎(chǔ)上加上SNR分級的SNR可分級類(SNRScalableProfile)D)在C基礎(chǔ)上空域可分級類(SpatialyScalableProfile)E)在D基礎(chǔ)上加上時間域可分級的高類(HighScalableProfile)第八十二頁,共一百三十一頁,編輯于2023年,星期一2)四級

A)MPEG-1格式的低級(LowLevel)(352*288*30)B)標(biāo)準(zhǔn)清晰度電視的主級(MainLevel)(720×480×30,720×576×25)C)每行1440取樣的HDTV的高級(High-1440Level)(1440×1080×30,1440×1152×25)D)每行1920取樣的HDTV的高級(HighLevel)(1920×1080×30,1920×1152×25)第八十三頁,共一百三十一頁,編輯于2023年,星期一第八十四頁,共一百三十一頁,編輯于2023年,星期一

實際應(yīng)用中,有些組合不大可能出現(xiàn),因而未予規(guī)定。如HighProfile,LowLevel就不會出現(xiàn)。其中,SP@ML,MP@ML,MP@HL和MP@H1440被認(rèn)為是最重要的技術(shù)規(guī)范。

MP@ML,是最早有集成電路的解碼器,應(yīng)用于多種場合,圖像質(zhì)量超過現(xiàn)有電視信號,美國150個衛(wèi)星直播采用,也被采用數(shù)字視盤,DVD。

MP@HL:美國HDTV大聯(lián)盟方案。MP@H1440:歐洲HDTV方案

第八十五頁,共一百三十一頁,編輯于2023年,星期一3、基于幀/場編碼模式(1)幀/場DCTDCT變換是在場內(nèi),還是在幀內(nèi)進行,是基于景物的局部空間內(nèi)容與空間相關(guān)性有關(guān)。雖然場的行距是幀的行距的兩倍,但前者的相關(guān)性并不是總比后者小。若景物中有相當(dāng)大的運動,幀DCT的效果不如場DCT,這是幀DCT中隔行產(chǎn)生的邊緣效應(yīng),會使大的DCT系數(shù)出現(xiàn)在左下角,而不是右上角。第八十六頁,共一百三十一頁,編輯于2023年,星期一在作DCT之前,要作幀/場編碼的選擇。選擇的方法是對16×16的原圖像或?qū)α炼茸鬟\動補償后的差值作幀的行間和場的行間的相關(guān)系數(shù)的計算。如果幀行的相關(guān)系數(shù)大于場行的相關(guān)系數(shù),就選幀DCT編碼,否則就選場DCT編碼。一般情況小,對細(xì)節(jié)多,運動部分少的圖像,選幀DCT;對細(xì)節(jié)少,運動部分多的圖像,選場DCT。第八十七頁,共一百三十一頁,編輯于2023年,星期一(a)幀DCT編碼的亮度宏塊結(jié)構(gòu)第八十八頁,共一百三十一頁,編輯于2023年,星期一

(b)場DCT編碼的亮度宏塊結(jié)構(gòu)第八十九頁,共一百三十一頁,編輯于2023年,星期一(2)幀/場的運動補償運動補償,MPEG-1是按幀進行的。MPEG-2考慮到視頻信號隔行掃描的特點,增加了按場補償?shù)姆椒?,以便更有效的提高運動補償?shù)男Ч?,并可能部分解決運動物體遮掩/露出的問題。下面給出具體的混合預(yù)測/內(nèi)插運動補償算法第九十頁,共一百三十一頁,編輯于2023年,星期一(A)P幀運動補償是以過去幀為參考幀,根據(jù)當(dāng)前幀和參考幀的兩種屬性,奇場和偶場,可以組成四種運動補償方式,與幀補償方式一起共五種不同的補償方式。通過MSE準(zhǔn)則選擇P幀最佳運動補償方式。第九十一頁,共一百三十一頁,編輯于2023年,星期一(B)B幀運動補償以過去幀和未來幀為參考幀,可分為前向、后向和雙向預(yù)測三種方式。前兩種方式與P幀運動補償方式相同,分別得五種預(yù)測。第三種預(yù)測利用雙向平均值做運動補償。從以上多種組合中以MSE準(zhǔn)則,選出最佳運動補償方式。第九十二頁,共一百三十一頁,編輯于2023年,星期一場圖像的場預(yù)測示意圖第九十三頁,共一百三十一頁,編輯于2023年,星期一

3、可分級編碼技術(shù)目前常用的分級編碼方法有信噪比、空間、時間域分級等。這里介紹信噪比和空間域分級編碼技術(shù)。(1)信噪比可分級編碼技術(shù)主要考慮,是隨接收條件變差圖像質(zhì)量“適度降級”,以避免數(shù)字廣播所特有的“鄰戶突變”現(xiàn)象,即在廣播覆蓋邊緣附近突然一點也沒有信號。第九十四頁,共一百三十一頁,編輯于2023年,星期一(A)方框圖第九十五頁,共一百三十一頁,編輯于2023年,星期一編碼器產(chǎn)生兩個數(shù)據(jù)流,從中可建立兩個視頻信號,其建立圖像尺寸相同,只是圖像質(zhì)量不同,即信噪比的不同。通過可分級改變DCT系數(shù)的量化步長。(B)底層碼流底層碼流MPEG-2基本編碼環(huán)路得到,對DCT系數(shù)粗量化(量化器Q),解碼得到較低質(zhì)量的視頻信號。第九十六頁,共一百三十一頁,編輯于2023年,星期一(C)頂層碼流頂層碼流是通過對底層DCT系數(shù)粗量化的噪聲再進行細(xì)量化(Q2),經(jīng)編碼傳輸?shù)玫?。(D)底層碼流以高優(yōu)先級傳輸,頂層碼流以低優(yōu)先級傳輸。這樣,在接收邊緣地區(qū),仍可解出低層碼流,重建較低質(zhì)量的視頻信號。在正常接收地區(qū),接收機可同時解出底層和頂層碼流,產(chǎn)生正常質(zhì)量的視頻信號,從而實現(xiàn)不同質(zhì)量的可分級視頻信號傳輸。第九十七頁,共一百三十一頁,編輯于2023年,星期一(2)空間域可分級編碼技術(shù)空間域可分級的主要目的是實現(xiàn)不同大小的圖像即SDTV和HDTV服務(wù)的兼容性。它的實現(xiàn)框圖如圖3-43所示。第九十八頁,共一百三十一頁,編輯于2023年,星期一(A)方框圖第九十九頁,共一百三十一頁,編輯于2023年,星期一利用對圖像象素的抽取與內(nèi)插來實現(xiàn)不同級別的轉(zhuǎn)換。(B)底層碼流輸入圖像經(jīng)分辨率下抽樣(水平、垂直分別2:1取樣),得到SDTV圖像,經(jīng)過獨立的編碼環(huán)路產(chǎn)生底層碼流。(C)頂層碼流通過內(nèi)插、加權(quán),對全質(zhì)圖像與底層圖像的差值編碼,形成頂層碼流。第一百頁,共一百三十一頁,編輯于2023年,星期一5、MPEG-2系統(tǒng)運輸層MPEG-2標(biāo)準(zhǔn)的系統(tǒng)部分是如何將音頻、視頻以及數(shù)據(jù)的基本碼流組成一個或多個適合存儲或傳送的碼流的規(guī)定。1)系統(tǒng)運輸層的結(jié)構(gòu)第一百零一頁,共一百三十一頁,編輯于2023年,星期一

A)視頻和音頻數(shù)據(jù)經(jīng)編碼器后分別得到視頻、音頻基本碼流(ES—Elementarybitstream)B)經(jīng)過打包器按一定的長度分段,切割成一個個單元,并加入必要的信息。將ES打包為打包基本碼流PES(PacketElementarystream)。

PES的數(shù)據(jù)長度,最大可以216字節(jié),但一般是一個存取單元的長度。一個存取單元相當(dāng)一幅視頻圖像,或是一個音頻幀。在PES的頭部含有許多信息,借此可識別是視頻還是音頻、數(shù)據(jù),也可以知道小包的長度等。第一百零二頁,共一百三十一頁,編輯于2023年,星期一C)將PES打包為兩類不同的碼流輸出到信道:一種叫節(jié)目碼流(ProgramStream),另一種叫運輸碼流(TransportStream)。節(jié)目碼流適用于相對無誤碼的環(huán)境,如交互式多媒體、CATV中。節(jié)目碼流中小包的長度相對較長,并且是可變的。運輸碼流適合于易發(fā)生錯誤的環(huán)境下,例如網(wǎng)絡(luò)傳輸,衛(wèi)星信道、地面電視廣播等運用環(huán)境中。運輸碼流中的小包長度固定,為188字節(jié),這對處理誤碼有好處。

第一百零三頁,共一百三十一頁,編輯于2023年,星期一

2)PES組成每一個PES分組由PES起始碼、PES頭標(biāo)志、PES頭域以及凈荷組成,如圖3-45所示。第一百零四頁,共一百三十一頁,編輯于2023年,星期一在PES數(shù)據(jù)塊的前面有一個PES頭,它包含了許多信息。PES包起始碼(packetStartCode):3Byte,共23個“0”和一個“1”,即“000000000000000000000001”。PES的比特構(gòu)成格式是專用的,在碼流中不會有這種組合代表別的意思,它起同步作用。包標(biāo)識(StreamID):說明這個包碼流的性質(zhì)(視頻、音頻或數(shù)據(jù))及序號。例如:

110×××××——表示音頻碼流,序號為×××××1111××××——表示視頻碼流,序號為××××第一百零五頁,共一百三十一頁,編輯于2023年,星期一PES包長度(PESPacketLength):說明這個字段后面有多少個字節(jié)。PES頭標(biāo)志(PESHeaderflags):它有14個bit,包含有很多內(nèi)容,如圖3-46所示第一百零六頁,共一百三十一頁,編輯于2023年,星期一SC:表示加擾指示。

PR:表示優(yōu)先級。

DA:表示數(shù)據(jù)匹配指示。

CR:表示有無版權(quán)指示。

OC:表示原版或拷貝。PD:表示是否有PTS(PresentationTimeStamp,顯示時間標(biāo)志,告訴解碼器一個顯示單元應(yīng)該顯示的時間)或DTS(DecodingTimeStamp,指示一個存儲單元進行解碼的時間)。ESCR:標(biāo)識PES包頭部是否有ElementaryStreamClockReference,即基本碼流的時鐘基準(zhǔn)信息。第一百零七頁,共一百三十一頁,編輯于2023年,星期一RATE:表示PES包頭是否有ElementaryStreamRate,即基本碼流速率信息。TM:表示指示是否有8個比特的字段說明DMS(DigitalStorageMedia)的模式。AC;未定義。CRC:表示是否有CRC字段。EXT:說明是否有擴展標(biāo)志。第一百零八頁,共一百三十一頁,編輯于2023年,星期一PES分組與一個圖像序列、一個GOP或一幅圖像的起始碼對齊,即PES分組凈荷的第一個字節(jié)要么是圖像序列的起始碼,要么是GOP的起始碼,要么是圖像的起始碼第一百零九頁,共一百三十一頁,編輯于2023年,星期一3)運輸小包運輸小包的結(jié)構(gòu)如圖3-47所示。

(1)固定長度:188字節(jié)

(2)一個新的PES包數(shù)據(jù)總是開始一個新的運輸小包,如果PES包在運輸小包的中間結(jié)束,那么運輸小包的余下長度內(nèi)就用填充字(stuffingbytes)放進去。第一百一十頁,共一百三十一頁,編輯于2023年,星期一(3)運輸小包由包頭和凈負(fù)荷數(shù)據(jù)組成,其的頭部分為兩層,一層是固定長的的連接層“LinkLayer”,另一層是可變長長度的適配層“AdaptationLayer

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論