[計(jì)算機(jī)]H263基本原理_第1頁
[計(jì)算機(jī)]H263基本原理_第2頁
[計(jì)算機(jī)]H263基本原理_第3頁
[計(jì)算機(jī)]H263基本原理_第4頁
[計(jì)算機(jī)]H263基本原理_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、.H263基本原理1. H.263 簡介    H.263 由 ITU 定義,為視頻會議和視頻電話應(yīng)用程序提供圖象壓縮(譯碼)。H.263 基于 H.261,并且其帶寬是由小于 20K 到 24K bit/sec 的視頻流形成。作為一種一般規(guī)則,H.263 要求其半帶寬要于 H.261 的對應(yīng)帶寬達(dá)到相同的視頻質(zhì)量,所以在很大程度上 H.263 取代了 H.261。H.263 使用傳輸視頻流。 H.263 的譯碼算法和 H.261 中的類似,但它在 H.261 的基礎(chǔ)上有了提高和改變,從而增強(qiáng)了性能和錯(cuò)誤恢復(fù)能力。H.263 中運(yùn)動(dòng)補(bǔ)償采用的是半象素精確

2、度,而在 H.261 中采用的是全象素精確度和環(huán)路濾波器。數(shù)據(jù)流中分層結(jié)構(gòu)的某些部分是可選的,如此可以通過一個(gè)較低的數(shù)據(jù)率或較好的錯(cuò)誤恢復(fù)能力來配置視頻編譯碼。目前有四種能夠提高性能的可選協(xié)商選項(xiàng):無限制運(yùn)動(dòng)向量、基于語法的算法譯碼、前向預(yù)測和前后幀預(yù)測,類似于 MPEG,叫做 P-B 幀。2視頻壓縮中的一些基本概念1 有損和無損壓縮在視頻壓縮中有損(Lossy)和無損(Lossless)的概念與靜態(tài)圖像中基本類似。無損壓縮也即壓縮前和解壓縮后的數(shù)據(jù)完全一致。有損壓縮意味著解壓縮后的數(shù)據(jù)與壓縮前的數(shù)據(jù)不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復(fù)。丟

3、失的數(shù)據(jù)率與壓縮比有關(guān),壓縮比越小,丟失的數(shù)據(jù)越多,解壓縮后的效果一般越差。此外,某些有損壓縮算法采用多次重復(fù)壓縮的方式,這樣還會引起額外的數(shù)據(jù)丟失。2 幀內(nèi)和幀間壓縮幀內(nèi)(Intraframe)壓縮也稱為空間壓縮(Spatial compression)。當(dāng)壓縮一幀圖像時(shí),僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息,這實(shí)際上與靜態(tài)圖像壓縮類似。幀內(nèi)壓縮一般達(dá)不到很高的壓縮。                  &#

4、160;    采用幀間(Interframe)壓縮是基于許多視頻或動(dòng)畫的連續(xù)前后兩幀具有很大的相關(guān)性,或者說前后兩幀信息變化很小的特點(diǎn)。也即連續(xù)的視頻其相鄰幀之間具有冗余信息,根據(jù)這一特性,壓縮相鄰幀之間的冗余量就可以進(jìn)一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時(shí)間壓縮(Temporal compression),它通過比較時(shí)間軸上不同幀之間的數(shù)據(jù)進(jìn)行壓縮。幀間壓縮一般是無損的。3 對稱和不對稱編碼對稱性(symmetric)是壓縮編碼的一個(gè)關(guān)鍵特征。對稱意味著壓縮和解壓縮占用相同的計(jì)算處理能力和時(shí)間,對稱算法適合于實(shí)時(shí)壓縮和傳送視頻,如視頻會議應(yīng)用就以采用對稱

5、的壓縮編碼算法為好。不對稱或非對稱意味著壓縮時(shí)需要花費(fèi)大量的處理能力和時(shí)間,而解壓縮時(shí)則能較好地實(shí)時(shí)回放,也即以不同的速度進(jìn)行壓縮和解壓縮。一般地說,壓縮一段視頻的時(shí)間比回放(解壓縮)該視頻的時(shí)間要多得多4 H.263 幀類型A 內(nèi)碼幀(I幀)不能由任何其它幀構(gòu)造出來,包含所有可顯示它的信息。    I幀編碼過程: l         每個(gè)光亮度和色差平面被分成88的塊 l         各塊使用DCT轉(zhuǎn)

6、換成頻率域 l         利用量化表進(jìn)行量化。 l         對各塊中最重要系數(shù)序列(DC系數(shù))用DPCM技術(shù)進(jìn)行編碼,且僅編碼兩個(gè)相鄰DC值的差 l         各塊中的系數(shù)是按鋸齒形次序進(jìn)行行程編碼 l         最后進(jìn)行類哈夫曼編碼  

7、60;                        預(yù)測幀(P幀):由前面的幀構(gòu)造所得。     P幀編碼:     P幀編碼過程: l         在基準(zhǔn)幀中對每個(gè)宏塊均查找其最正確匹配宏塊 l   &

8、#160;     計(jì)算實(shí)際宏塊和最正確匹配宏塊的差,作為運(yùn)動(dòng)向量 l         誤差項(xiàng)用DCT進(jìn)行轉(zhuǎn)換 l         接著進(jìn)行量化步,形成“鋸齒形次序”行程編碼,最后進(jìn)行類哈夫曼平均信息量編碼。注意量化表與I幀所用的不同,DC系數(shù)的編碼與其他系數(shù)的編碼方式相同   3. H.263的內(nèi)容和特點(diǎn)    H.263 視頻編碼標(biāo)準(zhǔn)

9、是專為中高質(zhì)量運(yùn)動(dòng)圖像壓縮所設(shè)計(jì)的低碼率圖像壓縮標(biāo)準(zhǔn)。與H.261 的p×64K 的傳輸碼率相比,H.263的碼率更低,單位碼率可以小于 64K,且支持的原始圖像格式更多,包括了在視頻和電視信號中常見的QCIF,CIF,EDTV,ITUR 601,ITUR 709 等等。    H.263 采用運(yùn)動(dòng)視頻編碼中常見的編碼方法,將編碼過程分為幀內(nèi)編碼和幀間編碼兩個(gè)部分。埃幀內(nèi)用改進(jìn)的DCT 變換并量化,在幀間采用1/2 象素運(yùn)動(dòng)矢量預(yù)測補(bǔ)償技術(shù),使運(yùn)動(dòng)補(bǔ)償更加精確,量化后適用改進(jìn)的變長編碼表(VLC)地量化數(shù)據(jù)進(jìn)行熵編碼,得到最終的編碼系數(shù)。 &#

10、160;  H.263的編碼速度快,其設(shè)計(jì)編碼延時(shí)不超過150ms;碼率低,在512 K 乃至 384K 帶寬下仍可得到相當(dāng)滿意的圖像效果,十分適用于需要雙向編解碼并傳輸?shù)膱龊希ㄈ?可視電話)和網(wǎng)絡(luò)條件不是很好的場合(如:遠(yuǎn)程監(jiān)控)    如下是H263的編解碼圖:         為了達(dá)到這些目標(biāo),H.263采用如下方法:    1)信源編碼器基于通用中間格式(CIF),使其可以同時(shí)應(yīng)用于625線和525線兩種電視標(biāo)準(zhǔn)。視頻編碼器對圖象的取樣次數(shù)為視頻信號場線的整

11、數(shù)倍,取樣時(shí)鐘和數(shù)字網(wǎng)之間的關(guān)系是異步關(guān)系,提供可以和其它各種設(shè)備信號相結(jié)合的獨(dú)立的數(shù)字比特流。    2)采用可減少時(shí)間冗余的幀間預(yù)測和可減少空間冗余的殘留信號編碼方法。解碼器具有運(yùn)動(dòng)補(bǔ)償?shù)哪芰Γ⒃试S可選擇地在編碼器中增加這種技術(shù)。H263運(yùn)動(dòng)補(bǔ)償采用的是半象素精度,而不是H.261建議中的全象素精度和循環(huán)濾波器。而對待傳送的符號采用了游程編碼。    3)允許采用無限制運(yùn)動(dòng)矢量模式,在該模式中,運(yùn)動(dòng)矢量被允許指到圖片的外部,可使用更大的運(yùn)動(dòng)矢量。允許采用基于句法的算術(shù)編碼模式代替游程編碼,可將最終的比特?cái)?shù)顯著降低。允許采用高級預(yù)

12、測模式,對P幀的亮度部分采用了塊重疊運(yùn)動(dòng)補(bǔ)償。對圖片中的某些宏塊采用4個(gè)8x8矢量來代替原來的1個(gè)16x16矢量。編碼器必須決定使用哪一種矢量。允許采用PB幀模式,一個(gè)PB幀包含一個(gè)由前面的解得的P幀圖象預(yù)測得出的P幀和一個(gè)由前一個(gè)P幀和當(dāng)前解碼的P幀共同預(yù)測得出的B幀。使用這種模式可以在比特率增加幅度很小的情況下大幅度增加幀頻。    4)信源編碼器的主要原理是預(yù)測,塊變換和量化。信源格式信源編碼器對每秒發(fā)生30000/1001(大約29.97)次的圖象進(jìn)行操作。對圖象頻率的允許誤差為±50 ppm。采用五種圖象格式,圖象被編碼為一個(gè)亮度信號和兩個(gè)色差

13、成分(Y,CB和CR)。五種標(biāo)準(zhǔn)圖象格式為: sub-QCIF, QCIF, CIF, 4CIF和16CIF。對每種圖象格式而言,在正交排列時(shí),亮度的取樣結(jié)構(gòu)都是dx個(gè)象素每行,dy行每幅圖象。兩個(gè)色差成分的取樣都是dx/2個(gè)象素每行,dy/2行每幅圖象。dx, dy, dx/2和dy/2的值在下表給出。    H.263各種圖象格式的象素個(gè)數(shù)圖象格式 亮度取樣的象素個(gè)數(shù)(dx) 亮度取樣的行數(shù) (dy) 色度取樣的象素個(gè)數(shù)(dx/2) 色度取樣的行數(shù)(dy/2)     sub-QCIF    

14、;  128 96 64 48    QCIF            176 144 88 72    CIF                352 288 176 144    4CIF     &

15、#160;        704 576 352 288    16CIF           1408 1152 704 576    對每種圖象格式,色差取樣被定位在和亮度塊邊界一致的塊上。取樣象素的縱橫比和圖象格式的縱橫比一致,也和H.261建議中定義的QCIF和CIF一致:(4/3)*(288/352)。除了sub-QCIF格式的 縱橫比為4:3。  

16、;  解碼器使用sub-QCIF以及QCIF格式等。編碼器可對sub-QCIF和QCIF中的一種進(jìn)行操作。    /H.263 支持五種分辨率。除了 H.261 支持的 QCIF 和 CIF 外,還有 SQCIF、4CIF 和 16CIF。SQCIF 的分辨率大約是 QCIF 的一半,而 4CIF 和 16CIF 的分辨率分別是 CIF 的4倍和16倍。 在譯碼算法上,H.261 與 H.263 的不同點(diǎn)列表如下: 圖畫格式象素亮度線條亮度H.261是否支持H.263是否支持非壓縮比特率(Mbits/s)10 frames/s30 f

17、rames/s灰色彩色灰色彩色SQ_CIF12896 是1.01.53.04.4Q_CIF176144是是2.03.06.19.1CIF352288可選可選8.112.224.336.54CIF704576 可選32.448.797.3146.016CIF14081152 可選129.8194.6389.3583.9 4、編解碼原理圖   5、h263編解碼數(shù)據(jù)結(jié)構(gòu)H.263采用句法和語義學(xué)的方法對多路視頻來管理的。 句法被劃分為四層,四個(gè)層(從上到下)分別是圖象(Picture)、塊組(Group of Blocks)、宏

18、塊(Macroblock)、塊(Block)。圖象層每幀圖象的數(shù)據(jù)包含一個(gè)圖象頭(a picture header),并緊跟著塊組數(shù)據(jù)(Group of Blocks),最后是一個(gè)end-of-sequence碼和填塞位。其中包括有圖象開始碼(PSC) (22 bits)、時(shí)域參照(TR)(8 bits)、類型信息 (PTYPE) (13 bits) 和量化器信息 (PQUANT) (5 bits)等十三個(gè)選項(xiàng)。  PSC TR PTYPE PQUANT CPM PSBI TRB DBQUANT PEI PSPARE PEI Group of Blocks ESTUF EOS PST

19、UF22   8  1      5       5   1    2    3         2    0/8/16             &#

20、160;   Vari    22 Vari           (structure of Picture Lay)每個(gè)塊組層(GOB)包含了一個(gè)塊組層頭(a GOB header),緊跟著宏塊數(shù)據(jù)(Macroblocks)。每個(gè)GOB包含了一行或多行宏塊。對于每幀圖象的第一個(gè)GOB(0號),不需要傳送GOB頭。而對于其它的GOB,GOB頭可以為空,這決定于編碼策略。譯碼器可以通過外部手段發(fā)送信號給遠(yuǎn)程變碼器要求只傳送非空GOB頭,例如建議H.

21、245。 GSTUF GBSC GN GSBI GFID GQUANT Macroblock Data                     (structure of GOB Lay)  每個(gè)宏塊(Macroblocks)中包含了一個(gè)宏塊頭(a macroblock header)和后續(xù)的塊數(shù)據(jù)(data for blocks)。COD只出現(xiàn)在用PTYPE指定為"

22、INTER"的圖象幀中,對于這些圖象中的宏塊,當(dāng)COD指定或PTYPE指示為"INTRA"時(shí)會出現(xiàn)宏塊類型 & 色度的編碼塊樣式(MCPBC)。如果PTYPE指示了"PB幀",對于B塊的宏塊 (MODB)會出現(xiàn)。只有在MODB中指定時(shí)才會出現(xiàn)CBPB(指示將傳送宏塊的B系數(shù))和B宏塊的運(yùn)動(dòng)矢量數(shù)據(jù) (MVDB) (變長)。當(dāng)MCPBC和CBPY中指定時(shí)會出現(xiàn)"塊數(shù)據(jù)"。 COD MCBPC MODB CBPB CBPY DQUANT MVD MVD2 MVD3 MVD4 MVDB  Block Data&#

23、160;                         (structure of macroblock layer)塊層如果不在PB幀模式,一個(gè)宏塊包含四個(gè)亮度塊和兩個(gè)色差塊。在PB幀模式下,一個(gè)宏塊包含12個(gè)塊。在缺省H.263模式下,首先傳送6個(gè)P塊數(shù)據(jù),然后是6個(gè)B塊數(shù)據(jù)。 5、RTP  PAYLOAD FOR H263 STREAM 協(xié)

24、議結(jié)構(gòu)(在RTP中傳輸h263數(shù)據(jù)流) 當(dāng)在網(wǎng)絡(luò)中傳輸H263視頻數(shù)據(jù)流時(shí),可直接封裝編碼器的輸出數(shù)據(jù),對于每一視頻幀,H263數(shù)據(jù)比特流無改變的封裝在RTP中被傳輸,包括圖片開始處理、整個(gè)圖片頭,還有混合長度處理,可變長度處理。被編碼后的數(shù)據(jù)并沒有加上裝幀信息,所以多元的音頻、視頻信號不適合被封裝在同一個(gè)包中,UDP和RTP提供了一個(gè)更加有效的方法來處理多元化。RTP并不能提供一個(gè)可靠的、有次序的數(shù)據(jù)傳輸,因此數(shù)據(jù)包有可能丟失。為了使丟包得到最大程度的恢復(fù),解碼器必須能夠處理已經(jīng)到達(dá)的數(shù)據(jù)包。因而,能夠獨(dú)立處理每一個(gè)數(shù)據(jù)包是符合要求的。一些幀信息包含在每個(gè)數(shù)據(jù)包中,例如:sourc

25、e format 和 flag for optional features 能夠幫助解碼器在丟失數(shù)據(jù)包的情況下正確、高效的處理幀。在RTP中H263視頻數(shù)據(jù)流將被裝載成payload data,一個(gè)新的H263載荷頭部被定義在載荷頭部第5個(gè)區(qū)域(section 5),這個(gè)區(qū)域定義了RTP頭和H263視頻數(shù)據(jù)包結(jié)構(gòu)。 每一個(gè)RTP封包都有一個(gè)復(fù)合的RTP頭,下面是H263視頻數(shù)據(jù)的RTP封包的混合頭部:Marker bit (M bit)、Payload Type(PT)、Timestamp.一個(gè)H263的TRP包如下:0      &

26、#160;            1                   2                   3 0

27、 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |                             &

28、#160;  RTP header                      | |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |            

29、0;       H.263 payload header                        | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |     

30、60;               H.263 bitstream                            |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

31、-+-+-+-+-+-+-+-+-+-+-+-+ 每一個(gè)RTP包中只有一個(gè)H263 Video packet,H263 payload header 與 H263 video packet 一一對應(yīng)。H.263 有效載荷頭定義了三種格式(模式 A、模式 B 和模式 C)。在模式 A 中,在實(shí)際壓縮 H.263 視頻比特流之前存在4字節(jié)的 H.263 有效載荷頭。這樣允許在 GOB 邊界有分段。在模式 B 中,使用的是8字節(jié)的 H.263 有效載荷頭,且每個(gè)數(shù)據(jù)包從 MB 邊界開始,沒有 PB 幀選項(xiàng)。最后,模式 C 中使用的是12字節(jié)的 H.263 有效載荷頭,采用 PB 幀選項(xiàng)支持

32、在 MB 邊界的幀分段。 H.263 有效載荷頭定義了三種格式(模式 A、模式 B 和模式 C)。在模式 A 中,在實(shí)際壓縮 H.263 視頻比特流之前存在4字節(jié)的 H.263 有效載荷頭。這樣允許在 GOB 邊界有分段。在模式 B 中,使用的是8字節(jié)的 H.263 有效載荷頭,且每個(gè)數(shù)據(jù)包從 MB 邊界開始,沒有 PB 幀選項(xiàng)。最后,模式 C 中使用的是12字節(jié)的 H.263 有效載荷頭,采用 PB 幀選項(xiàng)支持在 MB 邊界的幀分段。模式 A 中的頭格式如下所示:    1258111213141516 bitFPSBITEBITSRCIUS

33、ARR (cont.)DBQTRBTR · F 標(biāo)志位,表示有效載荷頭的模式,具有以下幾個(gè)值:0 模式 A;1 模式 B 或模式 C,取決于 P 位。 · P P 指定可選的 PB 幀模式。 · SBIT 起始位,指定最重要位(在第一個(gè)數(shù)據(jù)字節(jié)中忽略)的編號。 · EBIT 結(jié)束位,指定最不重要位(在最后一個(gè)數(shù)據(jù)字節(jié)中忽略)的編號。 · SRC 源格式(在 H.263 標(biāo)準(zhǔn)中 PTYPE 的位6、7和8壓縮比特流)表示當(dāng)前圖片解析。 · I 圖片編碼類型(在 H.263 標(biāo)準(zhǔn)中 PTYPE 的位9壓縮比特流)。 · U 在當(dāng)前圖片頭中,如果無限制運(yùn)動(dòng)向量選項(xiàng)值為1,那么該值設(shè)置為1(在 H.263 標(biāo)準(zhǔn)中 PTYPE 的位10壓縮比特流),否則該值為0。 · S 在當(dāng)前圖片頭中,如果基于語法的算法編碼選項(xiàng)值為1,那么該值設(shè)置為1(在 H.263 標(biāo)準(zhǔn)中 PTYPE 的位11壓縮比特流),否則該值為0。 · A 在當(dāng)前圖片頭中,如果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論