《數(shù)字視頻處理及應(yīng)用》課件第6章

上傳人：1*** IP屬地：廣東上傳時間：2024-12-03 格式：PPT 頁數(shù)：137 大小：1.40MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩132頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

第6章視頻編碼標(biāo)準(zhǔn)6.1視頻圖像編碼標(biāo)準(zhǔn)概述6.2圖像編碼標(biāo)準(zhǔn)

6.3H.26X系列視頻壓縮編碼標(biāo)準(zhǔn)6.4MPEG-X系列視頻編碼標(biāo)準(zhǔn)6.5視頻編碼的國家標(biāo)準(zhǔn)(AVS)6.6本章小結(jié)

6.1視頻圖像編碼標(biāo)準(zhǔn)概述

近年來，視頻圖像編碼技術(shù)得到了迅速發(fā)展和廣泛應(yīng)用，并且日臻成熟。一些國際組織也相繼制定了關(guān)于視頻圖像的編碼標(biāo)準(zhǔn)。例如，ITU-T制定的H.26X系列標(biāo)準(zhǔn)、ISO／IEC制定的關(guān)于靜態(tài)圖像的編碼標(biāo)準(zhǔn)JPEG和JPEG2000以及活動圖像的編碼標(biāo)準(zhǔn)MPEG系列等。這些標(biāo)準(zhǔn)圖像的編碼算法融合了各種性能優(yōu)良的圖像編碼方法，代表了目前圖像編碼的發(fā)展水平。表6-1給出了視頻圖像編碼的國際標(biāo)準(zhǔn)及其應(yīng)用。視頻編碼標(biāo)準(zhǔn)的發(fā)展分為三個階段：競爭、集中和驗證。在競爭階段，定義標(biāo)準(zhǔn)的應(yīng)用范圍和需求。通常一旦定義了需求，標(biāo)準(zhǔn)化組織就發(fā)出一個征求建議通知，以便征求整個社會的進入，這個階段的特點是獨立地進行競爭性實驗。集中階段的目的是合作實驗以便達成編碼方法的一致。當(dāng)對標(biāo)準(zhǔn)的一個公共框架達成一致時，考慮如編碼效率、主觀質(zhì)量、實現(xiàn)復(fù)雜度及兼容性等問題，在不同的實驗室實現(xiàn)這個框架，并且精煉其描述，直到不同的實現(xiàn)達到相同的效果。在驗證階段，檢查是否有差錯和歧義，確定出正確編碼和解碼的方法步驟。

6.2圖像編碼標(biāo)準(zhǔn)

JPEG是聯(lián)合圖像專家組(JointPhotographicExpertsGroup)的縮寫，該專家組隸屬于ISO/IEC的聯(lián)合技術(shù)第1委員會第29研究委員會的第1工作組(ISO/IECJTC1/SC29/WGl)，WGl已經(jīng)制定了幾種圖像壓縮編碼的國際標(biāo)準(zhǔn)，其中包括JPEG和JPEG2000。6.2.1JPEG

JPEG標(biāo)準(zhǔn)于1992年正式通過，它的正式名稱為信息技術(shù)連續(xù)色調(diào)靜止圖像的數(shù)字壓縮編碼。在JPEG算法中，共包含四種運行模式，其中一種是基于DPCM(差分脈沖編碼調(diào)制)的無損壓縮算法，另外三種是基于DCT(離散余弦變換)的有損壓縮算法。其要點如下：

·無損壓縮編碼模式。這種模式采用預(yù)測法和哈夫曼編碼(或算術(shù)編碼)以保證重建圖像與原圖像完全相同(設(shè)均方誤差為零)，是無失真的。

·基于DCT的順序編碼模式。這種模式根據(jù)DCT變換原理，從上到下、從左到右順序地對圖像數(shù)據(jù)進行壓縮編碼。當(dāng)信息傳送到接收端時，首先按照上述規(guī)律進行解碼，從而還原圖像。在此過程中存在信息丟失，因此這是一種有損圖像壓縮編碼。

·基于DCT的累進編碼模式。這種模式也是以DCT變換為基礎(chǔ)的，但是其掃描過程不同。它通過多次掃描的方法來對一幅圖像進行數(shù)據(jù)壓縮。其描述過程采取由粗到細(xì)逐步累加的方式進行。圖像還原時，在屏幕上首先看到的是圖像的大致情況，而后逐步地細(xì)化，直到全部還原出來為止。

·基于DCT的分層編碼模式。這種模式是以圖像分辨率為基準(zhǔn)進行圖像編碼的。它首先是從低分辯率開始，逐步提高分辨率，直至與原圖像的分辨率相同為止。圖像重建時也是如此?？梢娖湫Чc基于DCT累進編碼模式相似，但其處理起來更復(fù)雜，所獲得的壓縮比也更高一些。

1.無損壓縮編碼模式

在傳真機、靜止畫面的電話電視會議應(yīng)用中，根據(jù)其特點，JPEG采用DPCM無損壓縮編碼方案，其編碼過程如圖6-1所示。

圖6-2給出了DPCM鄰域預(yù)測模型，其中，A、B、C分別表示與當(dāng)前取樣點X相鄰的三個相鄰點的取樣值，其預(yù)測規(guī)律如式(6-1)所示。圖6-1JPEG無損壓縮編碼過程圖6-2DPCM鄰域預(yù)測模型

(6-1)在實際應(yīng)用中，可根據(jù)圖像的統(tǒng)計規(guī)律，選擇適當(dāng)?shù)臏y試方式。按上述預(yù)測模型求出預(yù)測誤差，然后對其進行無失真熵編碼，編碼方法可以采用哈夫曼編碼，也可以采用算術(shù)編碼。

2.基于DCT的順序編碼模式

圖6-3表示了一種基于DCT的順序編碼與解碼過程的系統(tǒng)框圖。

圖中源圖像采用8×8子塊DCT變換算法，從而獲得F(u,v)變換系數(shù)矩陣，這樣便實現(xiàn)了空間域到頻率域的變換，然后經(jīng)過根據(jù)視覺特性而設(shè)計的自適應(yīng)量化器，對DCT系數(shù)矩陣進行量化，并進行差分編碼和游程長度編碼，最后再進行熵編碼。解碼過程是編碼的逆過程。這里需要說明的是，圖6-3表示的是單一分量的壓縮編碼與解碼的過程。對于彩色圖像系統(tǒng)而言，所傳輸?shù)氖荵、U、V三個分量，因此是一個多分量系統(tǒng)。它們的壓縮與解壓縮原理相同。圖6-3基于DCT的順序編/解碼過程的系統(tǒng)框圖

1)DCT變換

JPEG將源圖像的每個8×8子塊進行DCT變換，以消除圖像塊各像素在空間域的相關(guān)性。在變換之前，除了要對原始圖像進行分割(一般是從上到下、從左到右)之外，還要將數(shù)字圖像采樣數(shù)據(jù)從無符號整數(shù)轉(zhuǎn)換到帶正負(fù)號的整數(shù)，即把范圍為[0，28－1]的整數(shù)映射為[－28－1，28－1－1]范圍內(nèi)的整數(shù)，目的是為了降低DCT運算時的內(nèi)部精度要求。二維8×8子塊的DCT/IDCT分別定義為

(6-2)(6-3)其中，m，n，u，v=0，1，…7；f(m，n)為源圖像的像素值；F(u，v)為相應(yīng)DCT系數(shù)，而C(s)則定義為(6-4)

DCT變換可以看作是把8×8的子圖像塊分解為64個正交的基信號，變換后輸出的64個系數(shù)就是這64個基信號的幅值，其中第1個F(0，0)是直流系數(shù)，其他63個都是交流系數(shù)。圖6-4表示了8×8大小的子圖像DCT變換時空域像素和頻域變換系數(shù)的對應(yīng)關(guān)系。圖6-48×8大小的子圖像DCT變換時空域像素和頻域變換系數(shù)的對應(yīng)關(guān)系

2)量化

DCT變換輸出的數(shù)據(jù)F(u，v)還必須進行量化處理。這里所說的量化是指從一個數(shù)值到另一個數(shù)值范圍的映射，其目的是為了減少DCT系數(shù)的幅值，增加零值，以達到壓縮數(shù)據(jù)的目的。JPEG采用線性均勻量化器，將64個DCT系數(shù)分別除以它們各自相應(yīng)的量化步長(量化步長范圍是1～255)，四舍五入取整數(shù)。64個量化步長構(gòu)成一張量化步長表，供用戶選用。量化的作用是在圖像質(zhì)量達到一定保真度的前提下，忽略一些次要信息。由于不同頻率的基信號(余弦函數(shù))對人眼視覺的作用不同，因此可以根據(jù)不同頻率的視覺范圍值來選擇不同的量化步長。通常人眼總是對低頻成分比較敏感，所以量化步長較小；對高頻成分人眼不太敏感，所以量化步長較大。量化處理的結(jié)果一般都是低頻成分的系數(shù)比較大，高頻成分的系數(shù)比較小，甚至大多數(shù)是0。圖6-5給出了JPEG推薦的亮度和色度量化步長表。量化處理是壓縮編碼過程中圖像信息產(chǎn)生失真的主要原因。圖6-5JPEG推薦的亮度和色度量化步長表

3)編碼

JPEG壓縮算法的最后部分是對量化后的圖像進行編碼。這一部分由三步組成。

(1)直流系數(shù)(DC)編碼:經(jīng)過DCT變換后，低頻分量集中在左上角，其中F(0，0)(即第一行第一列元素)代表了直流(DC)系數(shù)，即8×8子塊的平均值。由于直流(DC)系數(shù)的數(shù)值比較大，兩個相鄰的8×8子塊的DC系數(shù)相差很小，所以JPEG算法使用差分脈沖調(diào)制編碼(DPCM)技術(shù)，對相鄰圖像塊之間量化DC系數(shù)的差值進行編碼。

(2)交流系數(shù)(AC)編碼:DCT變換矩陣中有63個元素是交流(AC)系數(shù)，它們包含有許多“0”系數(shù)，并且許多“0”是連續(xù)的，可采用行程編碼進行壓縮。這63個元素采用了“之”字形(Zig-Zag)的排列方法，稱為Z形掃描。

Z形掃描算法能夠?qū)崿F(xiàn)高效壓縮的原因之一是:經(jīng)過量化后，大量的DCT矩陣元素被截成0，且零值通常是從左上角開始沿對角線方向分布的，采用行程編碼算法(RLE)沿Z形路徑可有效地累積圖像中的0的個數(shù)，所以這種編碼的壓縮效率非常高。8×8子塊的DC值及Z形掃描的過程如圖6-6所示。圖6-68×8子塊的DC值及Z形掃描的過程

(3)熵編碼:為了進一步達到壓縮數(shù)據(jù)的目的，需要對DPCM編碼后的直流系數(shù)(DC)和行程編碼后的交流系數(shù)(AC)再做基于統(tǒng)計特性的熵編碼(EntropyCoding)。這當(dāng)中使用了哈夫曼(Huffman)編碼。哈夫曼編碼可以使用很簡單的查表(LookupTable)方法進行編碼。在壓縮數(shù)據(jù)符號時，哈夫曼編碼對出現(xiàn)頻度比較高的符號分配比較短的代碼，而對出現(xiàn)頻度較低的符號分配比較長的代碼。最后，JPEG將各種標(biāo)記代碼和編碼后的圖像數(shù)據(jù)按幀組成數(shù)據(jù)流，用于保存、傳輸和應(yīng)用。

3.基于DCT的累進編碼模式

前面已經(jīng)介紹了按順序掃描方式來完成編碼，這樣從左到右、從上到下的掃描便能一次完成整幅圖像的編碼。而累進編碼模式與順序編碼模式不同，它是經(jīng)過多次掃描才能完成每個圖像分量的編碼，每次掃描都僅傳輸其中部分DCT系數(shù)。這樣，第一次掃描后，所編碼傳輸?shù)膱D像只是一個粗糙的圖像，接收端據(jù)此所重建的圖像質(zhì)量很低，但尚可識別；而在第二次的掃描中，則對圖像的一些進一步細(xì)節(jié)信息進行壓縮編碼傳輸，這時接收端將根據(jù)所接收的信息，在首次重建圖像的基礎(chǔ)上添加所接收的細(xì)節(jié)信息，此時重建圖像的質(zhì)量得到提高。這樣逐步累進，重建的圖像質(zhì)量也隨之逐步提高，直至完整地接收一幅圖像(若忽略量化的影響，則接收圖像質(zhì)量與發(fā)送的原圖像質(zhì)量相同)。根據(jù)上述分析，采用累進編碼模式的系統(tǒng)結(jié)構(gòu)與圖6-3基本相同，只是在量化器與熵編碼之間應(yīng)增加一個緩沖存儲器，以供存放一幅圖像數(shù)字化后的全部DCT系數(shù)。這樣，系統(tǒng)便可以多次對緩沖器中存儲的DCT系數(shù)進行掃描，并分批進行熵編碼。

4.基于DCT的分層編碼模式

在分層編碼模式中，一幅原始圖像被分成多個低分辨率的圖像，然后分別針對每個低分辨率的圖像進行編碼，具體過程如下：首先把一幅圖像分成若干低分辨率的圖像，然后對單獨的一個低分辨率的圖像進行壓縮編碼，其編碼方法可以選用無失真編碼，也可以采用基于DCT的順序編碼，或基于DCT的累進編碼。根據(jù)不同的用戶要求，采用不同的編碼方法。當(dāng)接收端接收上述發(fā)送信息后，進行解碼，進而重建圖像，然后將恢復(fù)的下一層低分辨率的圖像插入已重建圖像之中，以此來提高圖像的分辨率，直至圖像分辨率達到原圖像的質(zhì)量水平。必須說明的是，基于DCT的JPEG壓縮算法，其壓縮效果與圖像的內(nèi)容有關(guān)，一般高頻分量少的圖像可以獲得較高的壓縮比。6.2.2JPEG2000

JPEG標(biāo)準(zhǔn)以其優(yōu)良的品質(zhì)，使得它在短短的幾年內(nèi)就獲得極大的成功。然而，隨著多媒體應(yīng)用領(lǐng)域的不斷擴展，傳統(tǒng)JPEG壓縮技術(shù)已無法滿足人們對多媒體影像資料的要求。JPEG中采用的DCT將圖像壓縮為8×8的小塊，然后依次放入文件中，這種算法靠丟棄頻率信息實現(xiàn)壓縮，因而圖像的壓縮率越高，頻率信息被丟棄的越多。在極端情況下，JFEG圖像只保留了反映圖像的基本信息，精細(xì)的圖像細(xì)節(jié)都損失了。為此，JPEG制定了新一代靜止圖像壓縮標(biāo)準(zhǔn)JPEG2000。

JPEG2000與傳統(tǒng)JPEG最大的不同在于它放棄了JPEG所采用的以離散余弦變換(DCT)為主的區(qū)塊編碼方式，而采用以小波變換為主的多解析編碼方式，其主要目的是要將影像的頻率成分抽取出來。小波變換將一幅圖像作為一個整行變換和編碼，很好地保存了圖像信息中的相關(guān)性，達到了更好的壓縮編碼效果。JPEG2000編解碼系統(tǒng)的編碼器和解碼器的框圖如圖6-7所示。圖6-7JPEG2000編解碼系統(tǒng)的編碼器和解碼器的框圖編碼過程主要分為以下幾個過程：預(yù)處理、核心處理和碼流組織。預(yù)處理部分包括對圖像分片、直流電平(DC)位移和分量變換。核心處理部分由離散小波變換、量化和熵編碼組成。碼流組織部分則包括區(qū)域劃分、碼塊、層和包的組織。

下面說明JPEG2000的特點。

1.高壓縮率

由于在離散小波變換算法中，圖像可以轉(zhuǎn)換成一系列可更加有效存儲像素模塊的“小波”，因此，JPEG2000格式的圖片壓縮比可在現(xiàn)在的JPEG基礎(chǔ)上再提高10%~30%，而且壓縮后的圖像顯得更加細(xì)膩平滑，這一特征在互聯(lián)網(wǎng)和遙感等圖像傳輸領(lǐng)域有著廣泛的應(yīng)用。圖6-8所示就是JPEG和JPEG2000分別采用同樣壓縮率(27∶1)時的對比效果，可以很明顯地看到，JPEG壓縮的圖像存在方塊效應(yīng)，而JPEG2000壓縮的圖像則更加細(xì)膩平滑，兩者差距是十分明顯的，JPEG2000壓縮的圖像明顯優(yōu)于JPEG。圖6-8JPEG和JPEG2000分別采用同樣壓縮率(27∶1)時的對比效果

2.無損壓縮和有損壓縮

JPEG2000提供無損和有損兩種壓縮方式，無損壓縮在許多領(lǐng)域是必須的，例如醫(yī)學(xué)圖像和檔案圖像等對圖像質(zhì)量要求比較高的情況。同時JPEG2000提供的是嵌入式碼流，允許從有損到無損的漸進解壓。

3.漸進傳輸

現(xiàn)在網(wǎng)絡(luò)上的JPEG圖像下載時是按“塊”傳輸?shù)?，因此只能一行一行地顯示，而采用JPEG2000格式的圖像支持漸進傳輸。所謂漸進傳輸，就是先傳輸圖像的輪廓數(shù)據(jù)，然后再逐步傳輸其他數(shù)據(jù)來不斷提高圖像質(zhì)量?；ヂ?lián)網(wǎng)、打印機和圖像文檔是這一特性的主要應(yīng)用場合。

4.感興趣區(qū)域壓縮

使用JEPG2000可以指定圖片上感興趣區(qū)域，然后在壓縮時對這些區(qū)域指定壓縮質(zhì)量，或在恢復(fù)時指定某些區(qū)域的解壓縮要求。這是因為小波變換在空間和頻率域上具有局域性，要完全恢復(fù)圖像中的某個局部，并不需要所有編碼都被精確保留，只要對應(yīng)它的一部分編碼沒有誤差就可以了。這樣就可以很方便地突出重點。

5.碼流的隨機訪問和處理

使用JEPG2000允許用戶在圖像中隨機地定義感興趣區(qū)域，使得這一區(qū)域的圖像質(zhì)量高于其他圖像區(qū)域。碼流的隨機處理允許用戶進行旋轉(zhuǎn)、移動、濾波和特征提取等操作。

6.容錯性

JPEG2000在碼流中提供了容錯措施，在無線等傳輸誤碼很高的通信信道中傳輸圖像時，必須采取容錯措施才能達到一定的重建圖像質(zhì)量。

7.開放的框架結(jié)構(gòu)

為了在不同的圖像類型和應(yīng)用領(lǐng)域優(yōu)化編碼系統(tǒng)，JPEG2000提供了一個開放的框架結(jié)構(gòu)，在這種開放的結(jié)構(gòu)中編碼器只實現(xiàn)核心的工具算法和碼流的解析，如果解碼器需要，可以要求數(shù)據(jù)源發(fā)送未知的工具算法。

8.基于內(nèi)容的描述

圖像文檔、圖像索引和搜索在圖像處理中是一個重要的領(lǐng)域，MPEG-7就是支持用戶對其感興趣的各種“資料”進行快速、有效地檢索的一個國際標(biāo)準(zhǔn)?；趦?nèi)容的描述在JPEG2000中是壓縮系統(tǒng)的特性之一。

雖然JPEG2000在技術(shù)上有一定的優(yōu)勢，但到目前為止，實際應(yīng)用系統(tǒng)和互聯(lián)網(wǎng)上采用JPEG2000技術(shù)制作的圖像文件數(shù)量仍然很少。但是，由于JPEG2000在無損壓縮下仍然能有比較好的壓縮率，JPEG2000在圖像品質(zhì)要求比較高的醫(yī)學(xué)圖像的分析和處理中已經(jīng)有了一定程度的應(yīng)用。

6.3H.26X系列視頻壓縮編碼標(biāo)準(zhǔn)

H.26X是ITU-T(國際電信聯(lián)盟)及其前身CCITT(國際電報電話咨詢委員會)研究和制定的一系列視頻編碼的國際標(biāo)準(zhǔn)。其中，應(yīng)用最為廣泛的是H.261、H.263和H.264。H.261產(chǎn)生于20世紀(jì)90年代，可以說是視頻編碼的老前輩，如今已經(jīng)逐漸退出歷史舞臺。H.263是視頻會議領(lǐng)域所采用的主流編碼。H.264是近幾年出現(xiàn)的視頻編碼標(biāo)準(zhǔn)，屬于MPEG-4的第10部分。在相同的圖像質(zhì)量的情況下，H.264有更高的壓縮率，并逐漸得到應(yīng)用。6.3.1H.261

1.視頻編碼系統(tǒng)

H.261是ITU-T制定的視頻壓縮編碼標(biāo)準(zhǔn)，也是世界上第一個得到廣泛承認(rèn)、針對動態(tài)圖像的視頻壓縮標(biāo)準(zhǔn)，而且其后出現(xiàn)的MPEG系列標(biāo)準(zhǔn)、H.262以及H.263等數(shù)字視頻壓縮標(biāo)準(zhǔn)的核心都是H.261?？梢?，在圖像數(shù)據(jù)壓縮方面該標(biāo)準(zhǔn)占據(jù)非常重要的地位，其系統(tǒng)結(jié)構(gòu)如圖6-9所示。圖6-9H.261標(biāo)準(zhǔn)的視頻編/解碼系統(tǒng)結(jié)構(gòu)

2.視頻編碼器原理

1)幀內(nèi)編碼

H.261標(biāo)準(zhǔn)的視頻信源編碼器原理如圖6-10所示，而解碼器的工作原理與編碼器中的本地解碼電路完全相同，這里著重介紹視頻編碼器。圖6-10H.261標(biāo)準(zhǔn)的視頻信源編碼器原理圖從圖6-10中可以看出，視頻編碼器是由幀間預(yù)測、幀內(nèi)預(yù)測、DCT變換和量化等部件組成。其工作原理如下：對圖像序列中的第一幅圖像或景物變換后的第一幅圖像，采用幀內(nèi)變換編碼。

圖中的雙向選擇開關(guān)同時接上路，這樣輸入信號直接進行DCT變換，在該變換過程中采用了8×8子塊來完成運算，然后各DCT系數(shù)經(jīng)過Z形掃描展開成一維數(shù)據(jù)序列，再經(jīng)游程編碼后送至量化單元，系統(tǒng)中所采用的量化器工作于線性工作狀態(tài)，其量化步長由編碼控制。量化輸出信號就是一幅圖像的輸出數(shù)據(jù)流，此時編碼器處于幀內(nèi)編碼模式。

2)幀間預(yù)測編碼

當(dāng)雙向選擇開關(guān)同時接下路時，輸入信號將與預(yù)測信號相減，從而獲得預(yù)測誤差，然后對預(yù)測誤差進行DCT變換，再對DCT變換系數(shù)進行量化輸出，此時編碼器工作于幀間編碼模式。其中的預(yù)測信號是經(jīng)過如下路徑所獲得的:首先量化輸出經(jīng)反量化和反離散余弦變換(IDCT)后，直接送至帶有運動估值和運動補償?shù)膸鎯ζ髦?，其輸出為運動補償?shù)念A(yù)測值，該值經(jīng)過環(huán)形濾波器，再與輸入數(shù)據(jù)信號相減，由此得到預(yù)測誤差。

應(yīng)注意的是，濾波器開關(guān)在此起到濾除高頻噪聲的作用，以達到提高圖像質(zhì)量的目的。

3)工作狀態(tài)的確定

在將量化器輸出數(shù)據(jù)流傳至對端之外，還要傳送一些輔助信息，其中包括運動估值、幀內(nèi)/幀間編碼標(biāo)志、量化器指示、傳送與否的標(biāo)志和濾波器開關(guān)指示等，這樣可以清楚地說明編碼器所處的工作狀態(tài)，即是采用幀內(nèi)編碼還是采用幀間編碼，是否需要傳送運動矢量，是否要改變量化器的量化步長等。這里需要作如下說明：

(1)在編碼過程中應(yīng)盡可能多地消除時間上的冗余度，因而必須將最佳運動矢量與數(shù)據(jù)碼流一起傳輸，這樣接收端才能準(zhǔn)確地根據(jù)此矢量重建圖像。

(2)在H.261編碼器中，并不是總對帶運動補償?shù)膸g預(yù)測DCT進行編碼，它是根據(jù)一定的判斷標(biāo)準(zhǔn)來決定是否傳送DCT8×8像素塊信息。例如當(dāng)運動補償?shù)膸g誤差很小時，使得DCT系數(shù)量化后全為零，這樣可不傳此信息。對于傳送塊而言，它又可分為幀間編碼傳送塊和幀內(nèi)編碼傳送塊兩種。為了減少誤碼擴散給系統(tǒng)帶來的影響，最多只能連續(xù)進行132次幀間編碼，其后必須進行一次幀內(nèi)編碼。

(3)由于在經(jīng)過線性量化、變長編碼后，數(shù)據(jù)將被存放在緩沖器中。通常是根據(jù)緩沖器的占空度來調(diào)節(jié)量化器的步長，以控制視頻編碼數(shù)據(jù)流，使其與信道速率相匹配。

H.261標(biāo)準(zhǔn)采用的混合編碼方法，同時利用圖像在空間和時間上的冗余度進行壓縮，可以獲得較高的壓縮率。這個視頻編碼方案對以后各種視頻編碼標(biāo)準(zhǔn)都產(chǎn)生了深遠(yuǎn)影響，其影響直至現(xiàn)在。

3.H.261標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)

在H.261標(biāo)準(zhǔn)中采用層次化的數(shù)據(jù)結(jié)構(gòu)，它包括圖像層(P)、塊組層(GOB)、宏塊層(MB)和像素塊(B)四層，如圖6-11所示。

編碼的最小單元為8×8的像素塊；4個亮度塊和對應(yīng)的兩個色度塊構(gòu)成一個宏塊；一定數(shù)量的宏塊(33塊)構(gòu)成一個塊組；若干塊組(對于CIF格式為12個塊組)構(gòu)成一幀圖像。每一個層次都有說明該層次信息的頭，編碼后的數(shù)據(jù)和頭信息逐層復(fù)用就構(gòu)成了H.261的碼流。圖6-11H.261標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)6.3.2H.263

ITU-T于1995年8月公布了低于64Kb/s的窄帶通信信道的視頻編碼標(biāo)準(zhǔn)，即H.263，并于1996年獲得正式通過。

1.H.263與H.261的區(qū)別

H.263以H.261為基礎(chǔ)，其編碼原理和數(shù)據(jù)結(jié)構(gòu)都與H.261相似，但存在下列區(qū)別：

(1)H.263能夠支持更多圖像格式。H.263不僅可以支持CIF和QCIF標(biāo)準(zhǔn)數(shù)據(jù)格式，還可以支持更多原始圖像數(shù)據(jù)格式，如Sub-QCIF、4CIF和16CIF等。

(2)H.263建議兩種運動估值。H.261標(biāo)準(zhǔn)要求對16×16像素的宏塊進行運動估值，而在H.263標(biāo)準(zhǔn)中，不僅可以16×16像素宏塊為單位進行運動估值，同時還可以根據(jù)需要采用8×8像素子塊進行運動估值。

(3)H.263采用半精度像素的預(yù)測值和高效的編碼。在H.261中，運動估值精度范圍為(-16，15)，而在H.263中運動估值精度范圍為(-16.0，+15.5)，可見采用了半像素精度。半精度像素預(yù)測采用雙線性內(nèi)插技術(shù)，所獲得的結(jié)果如圖6-12所示。圖6-12雙線性內(nèi)插預(yù)測半精度像素在H.261中對運動矢量采用一維預(yù)測與VLC相結(jié)合的編碼方式，而在H.263中則采用更復(fù)雜的二維預(yù)測與VLC相結(jié)合的編碼方式。

(4)H.263提高了數(shù)據(jù)壓縮效率。

H.263標(biāo)準(zhǔn)中沒有對每秒幀數(shù)進行限制，這樣可以通過減小幀數(shù)來達到數(shù)據(jù)壓縮的目的。另外，在H.263中取消了H.261中的環(huán)路濾波器，并且改進了運動估值的方法，從而提高了預(yù)測質(zhì)量。同時還精減了部分附加信息以提高編碼效率，采用哈夫曼編碼、算術(shù)編碼來進一步提高壓縮比。

2.四種有效的壓縮編碼方法

在編碼方法上，H.263標(biāo)準(zhǔn)提供了四種可選的編碼模式，即無約束運動矢量算法、基于語法的算術(shù)編碼、高級預(yù)測模式和PB幀模式，從而進一步提高了編碼效率。

1)無約束運動矢量算法

通常運動矢量的范圍被限制在參考幀內(nèi)，而在無約束運動矢量算法中取消了這種限制，運動矢量可以指向圖像之外。這樣，當(dāng)某運動矢量所指的參考像素位于圖像之外時，可以用邊緣圖像值代替這個“不存在的像素”。這種方法能夠幫助改善邊緣有運動物體的圖像質(zhì)量。

2)基于語法的算術(shù)編碼

在H.261中建議采用哈夫曼編碼，但在H.263中所有的變長編／解碼過程均采用算術(shù)編碼，這樣便克服了H.261中每一個符號必須用固定長度整比特數(shù)編碼的缺點，編碼效率得以進一步提高。

3)高級預(yù)測模式

通常運動估值是以16×16像素的宏塊為基本單位進行的，而在H.263中的預(yù)測模式下，編碼器既可以一個宏塊使用一個運動矢量，也可以讓宏塊中的4個8×8子塊各自使用一個運動矢量。盡管使用4個運動矢量需占用較多的比特數(shù)，但能夠獲得較好的預(yù)測精度，特別是在此模式下對P幀的亮度數(shù)據(jù)采用交疊塊運動補償(OBMC)方法，即某一個8×8子塊的運動補償不僅與本塊的運動矢量有關(guān)，而且還與其周圍的運動矢量有關(guān)。這就大大提高了重建圖像的質(zhì)量。

4)PB幀模式

H.263是ITU-T于1995年公布的低碼率的視頻編碼建議。此建議也吸取了部分MPEG(活動圖像專家組)系列標(biāo)準(zhǔn)的優(yōu)點，PB幀的名稱正是出自MPEG標(biāo)準(zhǔn)。在H.263中的一個PB幀單元包含了兩幀。其中的P幀是經(jīng)前一個P幀預(yù)測所得的，而B幀則是經(jīng)前一個P幀和本PB幀單元中的P幀通過雙向預(yù)測所得的結(jié)果。由此可見，P幀的運動估值與一般的P幀的運動估值相同，但B幀則有所不同，它需要利用雙向運動矢量來計算B幀的前后向預(yù)測值。通常是以它們的平均值作為該B幀的預(yù)測值。6.3.3H.264

ISOMPEG和ITU-T的視頻編碼專家組VCEG于2003年聯(lián)合制定了比MPEG和H.263性能更好的視頻壓縮編碼標(biāo)準(zhǔn)，這個標(biāo)準(zhǔn)被稱為ITU-TH.264建議或MPEG-4的第10部分標(biāo)準(zhǔn)，簡稱H.264/AVC(AdvancedVideoCoding)。H.264不僅具有高壓縮比，而且在惡劣的網(wǎng)絡(luò)傳輸條件下，具有較高的抗誤碼性能。H.264支持表6-2所示的三個范疇。和以前的編碼標(biāo)準(zhǔn)相比，H.264/AVC的編碼效率有較大幅度的提高。在相同重建圖像質(zhì)量下，H.264/AVC比MPEG2編碼效率高2~3倍，比H.263和MPEG4高1.5~2倍。H.264/AVC的性能提升是以計算復(fù)雜度的增加為代價的，其編碼的計算復(fù)雜度大約相當(dāng)于H.263的3倍，解碼復(fù)雜度大約相當(dāng)于H.263的2倍。

為了更好地支持網(wǎng)絡(luò)傳輸，H.264/AVC引入了面向IP包的編碼機制，將編碼碼流分成視頻編碼層(videocodinglayer，VCL)和網(wǎng)絡(luò)提取層(networkabstractionlayer，NAL)兩個層次。VCL中保存視頻壓縮后的數(shù)據(jù)流，NAL主要是為VCL提供一個與網(wǎng)絡(luò)無關(guān)的統(tǒng)一接口，采用統(tǒng)一的數(shù)據(jù)格式對視頻數(shù)據(jù)進行封裝打包后使其在網(wǎng)絡(luò)中傳送。H.264的編碼結(jié)構(gòu)框圖如圖6-13所示。VCL和NAL之間定義了基于分組方式的接口，它們分別提供高效編碼和良好的網(wǎng)絡(luò)適應(yīng)性。圖6-13H.264的編碼結(jié)構(gòu)框圖

H.264/AVC因其具有更高的壓縮比、更好的IP和無線網(wǎng)絡(luò)信道的適應(yīng)性，在數(shù)字視頻通信和存儲領(lǐng)域得到越來越廣泛的應(yīng)用，如有線電視、衛(wèi)星電視、視頻會議和遠(yuǎn)程視頻監(jiān)控等。H.264/AVC和以前的標(biāo)準(zhǔn)一樣，也是采用差分預(yù)測/變換的編碼框架，即混合編碼結(jié)構(gòu)，其編碼原理如圖6-14所示。圖6-14H.264編碼原理圖但H.264/AVC在混合編碼的框架下引入了新的編碼工具，提高了編碼效率。新的編碼工具主要包括：幀內(nèi)空域預(yù)測、整數(shù)變換、多參考幀預(yù)測、可變塊大小預(yù)測、1/4精度像素運動補償、基于上下文的適應(yīng)性熵編碼和環(huán)路濾波等技術(shù)。與H.263和MPEG-4相比，H.264主要做了如下改進。

1.幀內(nèi)空域預(yù)測

以前的編碼標(biāo)準(zhǔn)，如H.261、MPEG-1、MPEG-2等，對幀內(nèi)編碼塊直接進行變換，經(jīng)過變換后，對DC系數(shù)進行差分預(yù)測編碼。也就是說，對幀內(nèi)編碼塊有一個頻域內(nèi)的DC預(yù)測編碼過程。更進一步，以MPEG-4(Version1.0和2.0)、H.263、H.263+、H.263++為代表的編碼標(biāo)準(zhǔn)在幀內(nèi)預(yù)測方面都采用了頻域內(nèi)的DC/AC預(yù)測技術(shù)，即對變換后的DC/AC系數(shù)進行水平或垂直方向的預(yù)測，進一步提高了幀內(nèi)編碼塊的編碼效率。

H.264采用幀內(nèi)預(yù)測模式。幀內(nèi)預(yù)測編碼具有運算速度快、高壓縮效率的優(yōu)點。幀內(nèi)預(yù)測編碼就是用周圍鄰近的像素值來預(yù)測當(dāng)前的像素值，然后對預(yù)測誤差進行編碼。對于亮度分量，幀內(nèi)預(yù)測可以用于4×4子塊和16×16宏塊，4×4子塊的預(yù)測模式有9種(模式0到模式8，其中模式2是DC預(yù)測)，16×16宏塊的預(yù)測模式有4種(Vertical、Horizontal、DC和Plane)；對于色度分量，預(yù)測是對整個8×8塊進行的，有4種預(yù)測模式(Vertical、Horizontal、DC和Plane)。除了DC預(yù)測外，其他每種預(yù)測模式對應(yīng)不同方向上的預(yù)測。

此外還有一種幀內(nèi)編碼模式，稱為I-PCM編碼模式。在該模式中，編碼器直接傳輸圖像的像素值，而不經(jīng)過預(yù)測和變換。在一些特殊的情況下，特別是圖像內(nèi)容不規(guī)則或者量化參數(shù)非常低時，該模式的編碼效率更高。

2.幀間預(yù)測

H.264采用7種樹狀宏塊結(jié)構(gòu)作為幀間預(yù)測的基本單元，每種結(jié)構(gòu)模式下塊的大小和形狀都不相同，這樣更有利于貼近實際，實現(xiàn)最佳的塊匹配，提高運動補償精度。

在H.264中，亮度分量的運動矢量使用1/4像素精度，色度分量的運動

矢量使用1/8像素精度，并詳細(xì)定義了相應(yīng)更小分?jǐn)?shù)像素的插值實現(xiàn)算法。因此，H.264中幀間運動矢量估值精度的提高，使搜索到的最佳匹配點(塊或宏塊中心)盡可能接近原圖，減小了運動估計的殘差，提高了運動視頻的時域壓縮效率。

H.264支持多參考幀預(yù)測，即通過在當(dāng)前幀之前解碼的多個參考幀中進行運動搜索，尋找出當(dāng)前編碼塊或宏塊的最佳匹配。在出現(xiàn)復(fù)雜形狀和紋理的物體、快速變化的景物、物體互相遮擋或攝像機快速地場景切換等一些特定情況下，多參考幀的使用會體現(xiàn)更好的時域壓縮效果。

3.SP/SI幀技術(shù)

視頻編碼標(biāo)準(zhǔn)主要包括三種幀類型：I幀、P幀和B幀。H.264為了順應(yīng)視頻流的帶寬自適應(yīng)性和抗誤碼性能的需求，定義了兩種新的幀類型：SP幀和SI幀。

SP幀編碼的基本原理同P幀相似，仍是基于幀間預(yù)測的運動補償預(yù)測編碼，兩者之間的區(qū)別在于SP幀能夠參照不同參考幀重構(gòu)出相同的圖像幀。利用這一特性，SP幀可取代I幀，廣泛應(yīng)用于流間切換、拼接、隨機接入、快進、快退和錯誤恢復(fù)等中，同時大大降低了碼率的開銷。與SP幀相對應(yīng)，SI幀是基于幀內(nèi)預(yù)測的編碼技術(shù)，其重構(gòu)圖像的方法與SP幀完全相同。

SP幀的編碼效率略低于P幀，但遠(yuǎn)遠(yuǎn)高于I幀，使得H.264可支持靈活的流媒體應(yīng)用，具有很強的抗誤碼能力，適用于在無線信道中通信。

SP幀分為主SP幀(PrimarySP-Frame)和輔SP幀(SecondarySP-Frame)。其中，前者的參考幀和當(dāng)前幀屬于同一個碼流，而后者不屬于同一個碼流。主SP幀作為切換插入點，不切換時，碼流進行正常的編碼傳輸；切換時，輔SP幀取代主SP幀進行傳輸。

4.整數(shù)變換與量化

H.264對幀內(nèi)或幀間預(yù)測的殘差進行DCT變換編碼。為了克服浮點運算帶來的復(fù)雜的硬件設(shè)計，新標(biāo)準(zhǔn)對DCT定義作了修改，使用變換時僅使用整數(shù)加減法和移位操作即可實現(xiàn)。這樣，在不考慮量化影響的情況下，解碼端的輸出可以準(zhǔn)確地恢復(fù)編碼端的輸人。該變換是針對4×4塊進行的，也有助于減少方塊效應(yīng)。

為了進一步利用圖像的空間相關(guān)性，在對色度的預(yù)測殘差和16×16幀內(nèi)預(yù)測的預(yù)測殘差進行整數(shù)DCT變換后，H.264標(biāo)準(zhǔn)還將每個4×4變換系數(shù)塊中的DC系數(shù)組成2×2或4×4大小的塊，進一步做哈達碼(Hadamard)變換。

5.熵編碼

H.264標(biāo)準(zhǔn)采用兩種高性能的熵編碼方式：基于上下文的自適應(yīng)可變長編碼(Context-basedAdaptiveVariableLengthCoding，CAVLC)和基于上下文的自適應(yīng)二進制算術(shù)編碼(Context-basedAdaptiveBinaryArithmeticCoding，CABAC)。

CAVLC用于亮度和色度殘差數(shù)據(jù)的編碼。經(jīng)過變換量化后的殘差數(shù)據(jù)有如下特性：4×4塊數(shù)據(jù)經(jīng)過預(yù)測、變換和量化后，非零系數(shù)主要集中在低頻部分，而高頻系數(shù)大部分是零；量化后的數(shù)據(jù)經(jīng)過Zig-Zag掃描后，DC系數(shù)附近的非零系數(shù)值較大，而高頻位置的非零系數(shù)值大部分是1或-1，且相鄰的4×4塊的非零系數(shù)之間是相關(guān)的。CAVLC采用了若干碼表，不同的碼表對應(yīng)不同的概率模型。編碼器能夠根據(jù)上下文，如周圍塊的非零系數(shù)或系數(shù)的絕對值大小，在這些碼表中自動地選擇，盡可能地與當(dāng)前數(shù)據(jù)的概率模型匹配，從而實現(xiàn)上下文自適應(yīng)的功能。

CABAC根據(jù)過去的觀測內(nèi)容，選擇適當(dāng)?shù)纳舷挛哪Ｐ?，提供?shù)據(jù)符號的條件概率的估計，并根據(jù)編碼時數(shù)據(jù)符號的比特數(shù)出現(xiàn)的頻率動態(tài)地修改概率模型。數(shù)據(jù)符號可以近似熵率進行編碼，以提高編碼效率。CABAC主要是通過三個方面來實現(xiàn)的，即上下文建模、自適應(yīng)概率估計和二進制算術(shù)編碼。

6.對傳輸錯誤的魯棒性和對不同網(wǎng)絡(luò)的適應(yīng)性

H.264在視頻編碼和網(wǎng)絡(luò)傳輸層之間定義了一個網(wǎng)絡(luò)抽象層(NetworkAbstractLayer，NAL)，將視頻碼流封裝進NAL單元，可以靈活地與不同的網(wǎng)絡(luò)相適配。同時，H.264支持靈活宏塊排序(FlexibleMacroblockOrdering，F(xiàn)MO)、任意條帶排序和數(shù)據(jù)分割等方式，增強了碼流抵抗誤碼和丟包的魯棒性。

近兩年，H.264在技術(shù)實現(xiàn)方面有著突飛猛進的進步，其優(yōu)越的編碼壓縮效率正在逐步表現(xiàn)出來。在2006年初，采用H.264編碼的HDTV信號的碼率在10Mbps，而僅在一年之后，傳輸一路HDTV信號的碼率只需要6Mbps，H.264編碼技術(shù)真正進入了大規(guī)模商業(yè)應(yīng)用階段。目前，H.264的優(yōu)越編碼效率使其在許多環(huán)境中得到應(yīng)用。其中，由于電信線路的帶寬的限制，在開展IPTV和手機電視時，無法采用MPEG-2/H.263編碼標(biāo)準(zhǔn)，需要H.264這樣的更高效的編碼技術(shù)。世界各國計劃在2010年到2015年之間停止模擬電視廣播，全部采用數(shù)字電視廣播，到時HDTV必然會獲得迅猛發(fā)展，必須要降低成本，而采用H.264可使傳輸費用降低為原來的1/4，所以這是個十分誘人的前景。我們相信隨著H.264編碼效率的進一步提高，相關(guān)解碼產(chǎn)品的成本進一步降低，在今后視頻編碼的各個應(yīng)用領(lǐng)域，H.264必將成為視頻的主流編碼標(biāo)準(zhǔn)。

H.264標(biāo)準(zhǔn)的推出，是視頻編碼標(biāo)準(zhǔn)的一次重要進步，它與先前的標(biāo)準(zhǔn)相比具有明顯的優(yōu)越性，特別是在編碼效率上的提高，使之能用于許多新的領(lǐng)域。盡管H.264的算法復(fù)雜度是編碼壓縮標(biāo)準(zhǔn)的四倍以上，但隨著半導(dǎo)體技術(shù)的發(fā)展，芯片的處理能力和存儲器的容量都將會有很大的提高，所以今后H.264必然煥發(fā)出蓬勃的生命力，逐漸成為市場的主角。

6.4MPEG-X系列視頻編碼標(biāo)準(zhǔn)

MPEG是活動圖像專家組(MovingPictureExpertsGroup)的縮寫，成立于1988年。與H.26X系列標(biāo)準(zhǔn)單純對視頻進行壓縮編碼不同，MPEG-X是一組由IEC和ISO制定發(fā)布的視頻、音頻、數(shù)據(jù)的壓縮標(biāo)準(zhǔn)。MPEG系列標(biāo)準(zhǔn)已成為國際上影響最大的多媒體技術(shù)標(biāo)準(zhǔn)，對數(shù)字電視、視聽消費電子、多媒體通信等信息產(chǎn)業(yè)的發(fā)展產(chǎn)生了巨大而深遠(yuǎn)的影響。它具有三方面優(yōu)勢：首先，作為國際標(biāo)準(zhǔn)，具有很好的兼容性；其次，能夠比其他壓縮編碼算法提供更高的壓縮比；最后，能夠保證在提供高壓縮比的同時，使數(shù)據(jù)損失很小。

MPE-X系列中現(xiàn)在常用的版本是：MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21、它們能夠適用于不同信道帶寬和數(shù)字影像質(zhì)量的要求。6.4.1MPEG-1

MPEG-1于1992年11月成為國際標(biāo)準(zhǔn)，其任務(wù)是在一種可接受的質(zhì)量下，把視頻信號和伴音信號壓縮到速率大約為1.5Mb/s的單一MPEG數(shù)據(jù)流。MPEG-1標(biāo)準(zhǔn)由三部分構(gòu)成，第一部分是系統(tǒng)部分，主要描述了幾種伴音和圖像壓縮數(shù)據(jù)的復(fù)用以及加入同步信號后的整個系統(tǒng)，編號為11172-1。第二部分為視頻部分，主要規(guī)定了圖像壓縮編碼方法，編號為11172-2。第三部分為音頻部分，主要規(guī)定了數(shù)字伴音壓縮編碼，編號為11172-3。MPEG-1標(biāo)準(zhǔn)的基本任務(wù)就是將視頻與其伴音統(tǒng)一起來進行數(shù)據(jù)壓縮，使其碼率可以壓縮到1.5Mb/s左右，同時具有可接收的視頻效果和保持視音頻的同步關(guān)系。在此主要對系統(tǒng)部分和視頻部分進行介紹。

1.系統(tǒng)部分

MPEG-1標(biāo)準(zhǔn)的系統(tǒng)部分主要按定時信息的指示，將視頻和音頻數(shù)據(jù)流同步復(fù)合成一個完整的MPEG-1比特流，從而便于信息的存儲與傳輸。在此過程將向數(shù)據(jù)流中加入相關(guān)的識別與同步信息，這樣，在接收端可以根據(jù)這些信息從接收數(shù)據(jù)流中分離出視頻與音頻數(shù)據(jù)流，并分別送往各自的視頻、音頻解碼器進行同步解碼和播放。

2.視頻部分

與H.261標(biāo)準(zhǔn)相似，MPEG-1標(biāo)準(zhǔn)也采用帶運動補償?shù)膸g預(yù)測DCT變換和VLC技術(shù)相結(jié)合的混合編碼方式。但MPEG-1在H.261的基礎(chǔ)上進行了重大的改進，具體如下：

1)輸入視頻格式

MPEG-1視頻編碼器要求其輸入視頻信號應(yīng)為逐行掃描的SIF格式，如果輸入視頻信號采用其他格式，如ITU-RBT601，則必須轉(zhuǎn)換成SIF格式才能作為MPEG-1的輸入。

2)預(yù)測與運動補償

與H.261標(biāo)準(zhǔn)相同，MPEG-1也采用幀間預(yù)測和幀內(nèi)預(yù)測相結(jié)合的壓縮編碼方案，以此來滿足高壓縮比和隨機存取的要求。為此在MPEG-1標(biāo)準(zhǔn)中定義了三種類型的幀，分別是I圖像幀、P圖像幀和B圖像幀。

·I圖像幀是一種幀內(nèi)編碼圖像幀。它是利用一幀圖像中的像素信息,通過去除其空間冗余度而達到數(shù)據(jù)壓縮的目的。

·P圖像幀是一種預(yù)測編碼圖像幀。它是利用前一個I圖像幀或P圖像幀,采用帶運動補償?shù)膸g預(yù)測的方法進行編碼。該圖像幀可以為后續(xù)的P幀或B幀進行圖像編碼提供參考。

·B圖像幀是一種雙向預(yù)測編碼圖像幀。它是利用其前后的圖像幀(I幀或P幀)進行帶運動補償?shù)碾p向預(yù)測編碼而得到的，如圖6-15所示，它本身不作為參考使用，所以不需要進行傳送，但需傳送運動補償信息。圖6-15MPEG-1圖象組及其幀間編碼方式在MPEG-1中是以宏塊16×16像素為單位進行雙向估值。假設(shè)一個活動圖像中有三個彼此相鄰的宏塊I0、I1和I2，如果已知宏塊I1相對于宏塊I0的運動矢量為mv01，則前向預(yù)測I1′(x)=I0(x+mv01)，其中，x代表像素坐標(biāo)；同理，若已知宏塊I1相對于宏塊I2的運動矢量為mv21，那么后向預(yù)測I1″(x)=I2(x+mv21)，這樣便可獲得雙向預(yù)測公式：(6-5)這里需要說明的是，在MPEG中，對于P幀和B幀的使用并未加以任何的限制。一個典型的實驗序列的結(jié)果表明：對SIF分辨率，在采用IPBBPBBPBBPBBPBBP結(jié)構(gòu)的、速率為1.15Mb/s的MPEG-1視頻序列中，其I幀、P幀和B幀的平均碼率大小分別為156kb/s、62kb/s和15kb/s?？梢夿幀的速率要遠(yuǎn)小于I幀和P幀的速率。然而僅通過增加I幀和P幀之間的B幀數(shù)量無法獲得更好的壓縮比。這是因為盡管增加了B幀的數(shù)量，但致使B幀與相應(yīng)的I幀和P幀的時間距離增加，從而導(dǎo)致它們之間的時間相關(guān)性下降，也就使運動補償預(yù)測能力下降。

3)視頻碼流的分層結(jié)構(gòu)

MPEG-1數(shù)據(jù)碼流也同樣采用層次結(jié)構(gòu)，其結(jié)構(gòu)如圖6-16所示?？梢娖渥罨締卧菈K，下面分別進行介紹。

·塊：一個塊是由8×8像素構(gòu)成的。亮度信號、色差信號都采用這種結(jié)構(gòu)。它是DCT變換的最基本單元。

·宏塊：一個宏塊是由附加數(shù)據(jù)與4個8×8亮度塊和2個8×8色差塊組成的。其中附加數(shù)據(jù)包含宏塊的編碼類型、量化參數(shù)、運動矢量等。宏塊是進行運動補償運算的基本單元。圖6-16MPEG-1視頻碼流的分層結(jié)構(gòu)

·片：一個片是由附加數(shù)據(jù)與若干個宏塊組成的。附加數(shù)據(jù)包括該片在整個圖像中的位置、默認(rèn)的全局量化參數(shù)等。片是進行圖像同步的基本單元。應(yīng)該說明的是，在一幀圖像中，片越多，其編碼效率越低，但處理誤碼的操作更容易，只需跳過出現(xiàn)誤碼的片即可。

·圖像：一幅圖像是由數(shù)據(jù)頭和若干片構(gòu)成的。其中數(shù)據(jù)頭包含該圖像的編碼類型及碼表選擇信息等。它是最基本的顯示單元，通常被稱為幀。

·圖像組：一個圖像組是由數(shù)據(jù)頭和若干圖像構(gòu)成的。數(shù)據(jù)頭中包含時間代碼等信息。圖像組中每一幅圖像既可以是I幀，也可以是P幀或B幀。但需說明的是，GOP中第一幅圖像必須是I幀，這樣便于提供圖像接入點。

·圖像序列：一串圖像序列是由數(shù)據(jù)頭和若干圖像組構(gòu)成的。數(shù)據(jù)頭中包含圖像的大小、量化矩陣等信息。

4)MPEG-1視頻編/解碼原理

MPEG-1視頻編/解碼器的原理如圖6-17所示。從圖中可以看出，其功能包含幀內(nèi)/幀間預(yù)測、量化和VLC編碼等。

(1)幀內(nèi)編碼:由于輸入圖像序列的第一幀一定是I幀，因而無需對其進行運動估值和補償，只需要將輸入圖像塊信號進行8×8變換，然后對DCT變換系數(shù)進行量化，再對量化系數(shù)進行VLC編碼和多路復(fù)用，最后存放在幀緩沖器之中，其輸出便形成編碼比特流。解碼過程是編碼的逆過程。圖6-17MPEG-1視頻編/解碼器的原理圖

(2)幀間編碼:從輸入圖像序列的第二幀開始進行幀間預(yù)測編碼，因而由量化器輸出的數(shù)據(jù)序列一方面被送往VLC及多路復(fù)用器的同時，還被送往反量化器和IDCT變換(DCT反變換)，從而獲得重建圖像，以此作為預(yù)測器的參考幀。該過程與接收端的解碼過程相同。

此時首先求出預(yù)測圖像與輸入圖像之間的預(yù)測誤差，當(dāng)預(yù)測誤差大于閾值時，則對預(yù)測誤差進行量化和VLC編碼，否則不傳該塊信息，但需將前向和后向運動矢量信息傳輸?shù)浇邮斩恕Ｔ趯嶋H的信道中傳輸?shù)闹挥袃煞N幀，即I幀和P幀，這樣，在接收端便可以重建I幀和P幀，同時根據(jù)所接收的運動矢量采用雙向預(yù)測的方式恢復(fù)B幀。值得注意的是，對于B幀的運動估值過程要進行兩次，一次用過去幀來進行預(yù)測，另一次則要用將來幀進行預(yù)測，因此可求得兩個運動矢量。同時，在編碼器中可以利用這兩個宏塊(過去幀和將來幀)中的任何一個或兩者的平均值和當(dāng)前輸入圖像的宏塊相減，從而得到預(yù)測差。這種編碼方式就是前面介紹的幀間內(nèi)插編碼。6.4.2MPEG-2

1995年出臺的MPEG-2(ISO/IEC13818)標(biāo)準(zhǔn)正式名稱為“通用的活動圖像及其伴音編碼”。MPEG-2是一個通用多媒體編碼標(biāo)準(zhǔn)，具有更廣闊的應(yīng)用范圍和更高的編碼質(zhì)量，其碼率范圍為1.5~100Mb/s。MPEG-2在NTSC制式下的分辨率可達720×486，MPEG-2還可提供廣播級的視頻和CD級的音質(zhì)。MPEG-2的音頻編碼可提供左、右、中聲道及兩個環(huán)繞聲道，以及一個重低音聲道和多達7個伴音聲道(DVD可有8種語言配音的原因)。同時，由于MPEG-2性能的出色表現(xiàn)，已能適用于HDTV，使得原打算為HDTV設(shè)計的MPEG-3，還沒出世就被拋棄了。

MPEG-2的另一特點是，可提供一個范圍較廣的可變壓縮比，以適應(yīng)不同的畫面質(zhì)量、存儲容量以及帶寬的要求。其應(yīng)用范圍除了作為DVD的指定標(biāo)準(zhǔn)外，還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級的數(shù)字視頻。目前，歐、美、日等國家在視頻方面采用MPEG-2標(biāo)準(zhǔn)，而在音頻方面則采用AC-3標(biāo)準(zhǔn)，數(shù)字視頻廣播(DigitalVideoBroadcasting，DVB)標(biāo)準(zhǔn)中的視頻壓縮標(biāo)準(zhǔn)也確定采用MPEC-2，音頻壓縮標(biāo)準(zhǔn)采用MPEG音頻。

MPEG-2標(biāo)準(zhǔn)分為九個部分。第一部分為MPEG-2系統(tǒng)，描述多個視頻流和音頻流合成節(jié)目流或傳輸流的方法。第二部分是MPEG-2視頻，描述視頻編碼方法。第三部分為MPEG-2音頻，描述音頻編碼方法。第四部分是一致性，描述測試一個編碼碼流是否符合MPEG-2碼流的方法。第五部分為參考軟件，描述第一、二和三部分的軟件實現(xiàn)方法。第六部分是數(shù)字存儲媒體的命令和控制DSM-CC，描述交互式多媒體網(wǎng)絡(luò)中服務(wù)器和用戶之間的會話信令集。第七部分是高級音頻編碼AAC，規(guī)定了不兼容MPEG-1音頻的多通道音頻編碼。第八部分是一致性DSM-CC。第九部分為實時接口，描述傳送碼流的實時接口規(guī)范。與MPEG-1相比，MPEG-2增加了許多新的特征，主要體現(xiàn)在以下五個方面：

1.MPEG-2標(biāo)準(zhǔn)的圖像規(guī)范

MPEG-2要求具有向下兼容性(和MPEG-1兼容)和處理各種視頻信號的能力。為了達到這個目的，在MPEG-2中，視頻圖像編碼是既分“檔次”又分“等級”的。按照編碼技術(shù)的難易程度，將各類應(yīng)用分為不同“檔次”，包括簡單檔次(SP)、主要檔次(MP)、信噪比可分檔次(SNP)、空間域可分檔次(SSP)、高檔次(HP)5個檔次。其中每個檔次都是MPEG-2語法的一個子集。按照圖像格式的難易程度，每個檔次又劃分為不同“等級”，每種等級都對有關(guān)參數(shù)規(guī)定約束條件。MPEG-2定義了低級別(LL)、主要級別(ML)、高1440級別(H1440)和高級別(HL)4個不同級別。其中主要檔次/主要等級(MP@ML)涉及的正是數(shù)字常規(guī)電視，使用價值最大。具體的分檔、分級見表6-3，表中給出的速率值僅是上限值。大體上說，低等級相當(dāng)于ITU-T的H.261的CIF或MPEG-1的SIF；主要等級與常規(guī)電視對應(yīng)；高1440等級粗略地與每掃描行1440樣點的HDTV對應(yīng)；高等級大體上與每掃描行1920樣點的HDTV對應(yīng)。從表中也可以看出MPEG-2視頻編碼覆蓋范圍之廣。

2.場和幀的區(qū)分

在MPEG-2編碼中為了更好地處理隔行掃描的電視信號，分別設(shè)置了按幀編碼和按場編碼兩種模式，并相應(yīng)地對運動補償作了擴展。這樣，常規(guī)隔行掃描電視圖像的壓縮編碼與單純的按幀編碼相比，其效率顯著提高。例如，在某些場合中，場間運動補償可能比幀間運動補償好，而在另外一些場合則相反。類似地，在某些情況下，用于場數(shù)據(jù)的DCT的質(zhì)量比用于幀數(shù)據(jù)的DCT的質(zhì)量可能有所改進。由此可見，在MPEG-2中，對于場/幀運動補償和場/幀DCT進行選擇(自適應(yīng)或非自適應(yīng))就成為改進圖像質(zhì)量的一個關(guān)鍵措施。

3.MPEG-2的分級編碼

在表6-3中，同一檔次不同級別間的圖像分辨率和視頻碼率相差很大，例如主要型這一檔次，它包含的四個等級對應(yīng)的速率分別為：80Mb/s、60Mb/s、15Mb/s和4Mb/s。為了保持解碼器的向上兼容性，MPEG-2采用了分級編碼。表6-3中的兩種可分級類型即為兩類不同的分級編碼方法。

(1)信噪比可分級：可以分級改變DCT系數(shù)的量化階距，它指的是對DCT系數(shù)使用不同的量化階距后的可解碼能力。對DCT系數(shù)進行粗量化后可獲得粗糙的視頻圖像，它和輸入的視頻圖像在同一時空分辨率下。增強層簡單地說是指粗糙視頻圖像和初始的輸入視頻圖像間的差值。

(2)空間域可分級：利用對像素的抽取和內(nèi)插來實現(xiàn)不同級別的轉(zhuǎn)換。它是指在沒有先對整幀圖像解碼和抽取的情況下，以不同的空間分辨率解碼視頻圖像的能力。例如從送給SSP@H1440解碼的60Mb/s碼流中分出MP@ML解碼器所需的15Mb/s的數(shù)據(jù)，使其能解碼出符合現(xiàn)行常規(guī)電視質(zhì)量要求的圖像序列。

4.擴展系統(tǒng)層語法

MPEG-2中有兩類數(shù)據(jù)碼流：傳送數(shù)據(jù)流和節(jié)目數(shù)據(jù)流。兩者都是由壓縮后的視頻數(shù)據(jù)或音頻數(shù)據(jù)(還有輔助數(shù)據(jù))組成的分組化單元數(shù)據(jù)流所構(gòu)成的。基本流將在同步情況下進行解碼，其長度是可變的，一般相對傳送流而言，長度較長，可應(yīng)用于無誤碼的場合。傳送流長度是固定的，共有188字節(jié)，可應(yīng)用于有誤碼的場合。而節(jié)目數(shù)據(jù)流的運行環(huán)境則極少出現(xiàn)差錯。由于在字頭上作了很多詳細(xì)規(guī)定，使用起來較為方便和靈活，因此可對每個分組設(shè)置優(yōu)先級、加密/解密或加擾、插入多語種解說聲音和字幕等。

5.其他特點

(1)交替掃描:MPEG-2標(biāo)準(zhǔn)除了對DCT系數(shù)采用“Z”字形掃描外，還采用了交替掃描方案，如圖6-18所示。交替掃描更適合隔行掃描的視頻圖像。

(2)DCT系數(shù)更細(xì)量化:在MPEG-2視頻的幀內(nèi)宏塊中，直流系數(shù)的量化加權(quán)可以是8、4、2或1。也就是說，直流系數(shù)允許有11位(即全部)的分辨率，交流系數(shù)的量化范圍為[-2048，2047]，非幀內(nèi)宏塊中所有系數(shù)量化都在[-2048，2047]；而對于MPEG-1標(biāo)準(zhǔn)，直流系數(shù)的量化加權(quán)固定為8，交流系數(shù)的量化范圍為

[-256，255]，非幀內(nèi)宏塊所有系數(shù)量化在[-256，255]。

(3)量化器量化因子調(diào)整更細(xì):量化因子的值除了是1～31之間的整數(shù)外，還提供了一組(31個)可選值，范圍是0.5~56.0之間的實數(shù)。圖6-18交替掃描示意圖6.4.4MPEG-4

MPEG-4于1999年2月公布，正式命名為“信息技術(shù)：音視頻對象通用編碼算法(ISO/IEC14496)”，它針對的是一定比特率下的視頻、音頻編碼，更加注重多媒體系統(tǒng)的交互性和靈活性。這個標(biāo)準(zhǔn)主要應(yīng)用于可視電話、可視電子郵件等，對傳輸速率要求較低，在4.8～64kb/s之間，分辨率為176×144。MPEG-4利用很窄的帶寬，通過幀重建技術(shù)以及數(shù)據(jù)壓縮技術(shù)，以求用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。

MPEG-4比MPEG-2的應(yīng)用更廣泛，最終希望建立一種能被多媒體傳輸、多媒體存儲、多媒體檢索等應(yīng)用領(lǐng)域普遍采納的統(tǒng)一的多媒體數(shù)據(jù)格式。由于所要覆蓋的應(yīng)用范圍廣闊，同時應(yīng)用本身的要求又各不相同，因此，MPEG-4不同于過去的MPEG-2或H.26X系列標(biāo)準(zhǔn)，其壓縮方法不再是限定的某種算法，而是可以根據(jù)不同的應(yīng)用，進行系統(tǒng)裁剪，選取不同的算法。例如對Intra幀的壓縮就提供了DCT和小波兩種變換。MPEG-4比起MPEG-2及H.26X系列，新變化中最重要的三個技術(shù)特征是：基于內(nèi)容的壓縮、更高的壓縮比和時空可伸縮性。

1.MPEG-4標(biāo)準(zhǔn)的構(gòu)成

MPEG-4標(biāo)準(zhǔn)由七個部分構(gòu)成。第一部分是系統(tǒng)，MPEG-4系統(tǒng)把音/視頻對象及其組合復(fù)用成一個場景，提供與場景互相作用的工具，使用戶具有交互能力。第二部分是視頻，描述基于對象的視頻編碼方法，支持對自然和合成視頻對象的編碼。第三部分是音頻，描述對自然聲音和合成聲音的編碼。第四部分為一致性測試標(biāo)準(zhǔn)。第五部分是參考軟件。第六部分是多媒體傳送整體框架(DeliveryMultimediaIntegrationFramework，DMIF)，主要解決交互網(wǎng)絡(luò)中、廣播環(huán)境下以及磁盤應(yīng)用中多媒體應(yīng)用的操作問題，通過DMIF，MPEG-4可以建立具有特殊服務(wù)質(zhì)量的信道，并面向每個基本流分配帶寬。第七部分是MPEG-4工具優(yōu)化軟件，提供一系列工具描述組成場景的一組對象，這些場景描述可以以二進制表示，與音/視頻對象一起編碼和傳輸。

2.MPEG-4編碼特性

MPEG-4采用了對象的概念。不同的數(shù)據(jù)源被視作不同的對象，而數(shù)據(jù)的接收者不再是被動的，他可以對不同的對象進行刪除、添加、移動等操作。這種基于對象的操作方法是MPEG-4與MPEG-1、MPEG-2的不同之處。語音、圖像、視頻等可以作為單獨存在的對象，也可以集合成一個更高層的對象，稱之為場景。MPEG-4用來描述其場景的語言叫BinaryFormatforScenes(BIFS)。BIFS語言不僅允許場景中對象的刪除和添加，而且可以對對象進行屬性改變，可以控制對象的行為——即可以進行交互式應(yīng)用。整個MPEG-4就是圍繞如何高效編碼AV(音視頻)對象，如何有效組織、傳輸AV對象而編制的。因此，AV對象的編碼是MPEG-4的核心編碼技術(shù)。AV對象的提出，使多媒體通信具有高度的交互能力和很高的編碼效率。MPEG-4用運動補償消除時域冗余，用DCT消除空域冗余。與以往視頻編碼標(biāo)準(zhǔn)相同，為支持基于對象的編碼，MPEG-4還采用形狀編碼和與之相關(guān)的形狀自適應(yīng)DCT(SA-DCT)技術(shù)來支持任意形狀視頻對象的編碼。與H.263相比，MPEG-4的視頻編碼標(biāo)準(zhǔn)要復(fù)雜的多，支持的應(yīng)用要廣泛的多。MPEG-4視頻標(biāo)準(zhǔn)的目標(biāo)是在多媒體環(huán)境中允許視頻數(shù)據(jù)的有效存取、傳輸和操作。為達到這一廣泛應(yīng)用目標(biāo)，MPEG-4提供了一組工具與算法，通過這些工具與算法，從而支持諸如高效壓縮、視頻對象伸縮性、空域和時域伸縮性、對誤碼的恢復(fù)能力等功能。因此，MPEG-4視頻標(biāo)準(zhǔn)就是提供上述功能的一個標(biāo)準(zhǔn)化“工具箱”。

MPEG-4提供技術(shù)規(guī)范滿足多媒體終端用戶和多媒體服務(wù)提供者的需要。對于技術(shù)人員，MPEG-4提供關(guān)于數(shù)字電視、圖像動畫、Web頁面相應(yīng)的技術(shù)支持；對于網(wǎng)絡(luò)服務(wù)提供者，MPEG-4提供的信息，能被翻譯成各種網(wǎng)絡(luò)所用的信令消息；對于終端用戶，MPEG-4提供較高的交互訪問能力。具體標(biāo)準(zhǔn)概括如下：

·提供音頻、視頻或者音視頻內(nèi)容單元的表述形式，這種形式即AVO對象(AVO：音視頻對象)，這些AVO可以是自然內(nèi)容和合成內(nèi)容，這些內(nèi)容可以用相機或麥克風(fēng)記錄，也可用計算機生成。

·將基本AVO對象合成為音視頻對象，形成音視場景。

·將與AVO相連的數(shù)據(jù)復(fù)合、同步。

·使用戶端和所產(chǎn)生的音視場景交互。

MPEG-4提供一個組成的場景的標(biāo)準(zhǔn)方式，允許：

·將AVO放在給定坐標(biāo)系統(tǒng)中的任意位置。

·將AVO重新組合成合成AVO(CompoundAVO)

·為了修改AVO屬性(例如，移動一個對象的紋理，通過發(fā)送一個動畫參數(shù)模擬一個運動的頭部)，應(yīng)將流式數(shù)據(jù)應(yīng)用于AVO。

·交互式的改變用戶在場景中的視點和聽點。

3.MPEG-4標(biāo)準(zhǔn)的視頻編碼

1)基于視頻對象面的編碼

在視頻低碼率壓縮方面，MPEG-4引入了視頻對象面(VideoObjectPlane，VOP)的概念，其在無線視頻傳輸系統(tǒng)中達到10kb/s的低速率。為此它使用了多種技術(shù)來克服不可修復(fù)的錯誤來保證解碼器的正常工作，比如再同步標(biāo)記和可逆可變長度編碼技術(shù)。同時編碼端提供了多層次質(zhì)量的編碼以適應(yīng)解碼端在比特率方面的限制。當(dāng)場景含有不同的對象時，允許傳送最重要的對象或?qū)Σ煌膶ο髮嵤┎煌膫鬏斮|(zhì)量保證。MEPG-4在傳送不變的背景時所采用的技術(shù)可以使其在接收端改變視角時背景只傳送一次，從而節(jié)省比特率。另外，MPEG-4針對視頻對象還采用了計算機建模技術(shù)，通過此技術(shù)可以使用對象的參數(shù)化操作來代替物體的具體運動，而且，其計算由本地端完成。例如事先定好的人臉模型可以通過少數(shù)的表情狀態(tài)和獨立的模型運動來模仿人臉的具體動作。在預(yù)期的MPEG-4語音合成界面中，人臉模型和人臉中唇、眼等特征模型有其特定的操作命令，使之與語音同步。圖6-19所示為MPEG-4標(biāo)準(zhǔn)基于VOP的視頻編解碼框圖。圖6-19MPEG-4標(biāo)準(zhǔn)基于VOP的視頻編解碼框圖

MPEG-4針對自然對象和合成對象的紋理特性提供了不同的解決方案。

2)自然對象的紋理與視頻

MPEG-4用視頻對象(VideoObject，VO)來表述視頻內(nèi)容的基本單元，如一個站立的人(脫離背景)就是一個VO，VO與其他的AVO(音視頻對象)組合成一個特定的場景，傳統(tǒng)的矩形圖像只能被認(rèn)為是將整個圖像作為一個對象，是這種視頻對象的一種特例。

MPEG-4標(biāo)準(zhǔn)的可視信息部分提供一個包含各種工具與算法的工具箱(為了更廣泛的適用性)，對于下列各項要求提供解決方案：

·各種圖片與視頻的高效壓縮；

·在2D和3D網(wǎng)格上進行紋理映射的各種紋理的高效壓縮；

·各種動畫網(wǎng)格的時變幾何數(shù)據(jù)流的有效壓縮；

·對各種視頻對象的有效隨機訪問；

·對各種視頻與圖像序列的擴展操作；

·基于內(nèi)容的圖像和視頻信息編碼；

·基于內(nèi)容的紋理、圖像都可以升級(可升級性)；

·時間、空間、質(zhì)量的可擴展性；

·在易于產(chǎn)生誤碼的環(huán)境下，對誤碼的指示和恢復(fù)能力。

3)合成對象的紋理與圖像

合成對象是計算機圖形學(xué)的一個子集，MPEG-4標(biāo)準(zhǔn)的合成對象主要有：

·參數(shù)化描述人體的合成及相應(yīng)的動畫數(shù)據(jù)流；

·對紋理映射的靜態(tài)和動態(tài)網(wǎng)格編碼；

·依賴于視點的紋理編碼。

4.MPEG-4音頻編碼

MPEG-4音頻對象可以分為兩類：自然音頻對象和合成音頻對象。MPEG-4自然音頻對象包括了從2kb/s到64kb/s的各種傳輸質(zhì)量的編碼。MPEG-4定義了三種編碼器(參數(shù)編碼、CELP編碼和時頻編碼)來協(xié)調(diào)工作，以在整個碼率范圍內(nèi)都得到高質(zhì)量的音頻。自然音頻對象的編碼支持各種分級編碼功能和錯誤恢復(fù)功能。合成音頻對象包括結(jié)構(gòu)音頻(StructuredAudio，SA)和文語轉(zhuǎn)換(TextToSpeech，TTS)。結(jié)構(gòu)音頻類似MIDI語言，它采用描述語音的方法來代替壓縮語音。TTS接受文本輸入并輸出相應(yīng)的合成語音，在應(yīng)用時通常與臉部動畫、唇語合成等技術(shù)結(jié)合起來使用。此外，音頻對象還含有對象的空間化特征，不同的空間定位決定了音源的空間位置，這樣可以使用人工或自然音源來營造人工聲音環(huán)境。

5.其他有關(guān)內(nèi)容

1)關(guān)于對象的分割

MPEG-4中不對如何從活動視頻中分割VO做具體定義，應(yīng)用中可根據(jù)實際情況處理，例如，對典型的可視電話圖像有可能實現(xiàn)全自動的算法，其他還可能采用“ColorKeying”和人機交互等方式。

視頻對象分割算法研究是一個非常吸引人的課題，因為它還能對三維圖像編碼起關(guān)鍵性作用?，F(xiàn)在的視頻對象分割算法可分為基于空間分割、基于時間分割以及時空聯(lián)合分割三種主要方法，其中時空聯(lián)合分割算法應(yīng)用最為廣泛，在MPEG-4的核心試驗中獲得較好的結(jié)果。

2)關(guān)于碼率控制

碼率控制在標(biāo)準(zhǔn)中依舊是開放的，它是提高編碼效率的一個重要環(huán)節(jié)，包括對不同VO分配不同的數(shù)碼率，對同一VO進行內(nèi)容更新的優(yōu)化控制，以及對全局?jǐn)?shù)碼率的控制等。

總之，從編碼方案上說，MPEG-4仍是以子塊為基礎(chǔ)的混合編碼，這與其初衷及大多數(shù)人的預(yù)計相差很大，但對畫面的描述引入了VO的觀念，是以內(nèi)容為基礎(chǔ)的描述方法，在進行畫面組合、操作上更符合人的心理特點，提供了現(xiàn)有的以像素為基礎(chǔ)的標(biāo)準(zhǔn)不能提供的功能，這是它的重要標(biāo)志。

6.5視頻編碼的國家標(biāo)準(zhǔn)(AVS)

AVS(AudioVideocodingStandard)是我國具有自主知識產(chǎn)權(quán)的音視頻編碼國家標(biāo)準(zhǔn)，其適用面十分廣闊。AVS工作組成立于2002年，其目的是建立中國獨立知識產(chǎn)權(quán)的音視頻國家標(biāo)準(zhǔn)，包括壓縮、解壓、在數(shù)字音視頻系統(tǒng)或設(shè)備下的操作與顯示等。AVS視頻編碼標(biāo)準(zhǔn)于2006年被采納為國家標(biāo)準(zhǔn)，它的推出是全球音視頻技術(shù)以及產(chǎn)業(yè)發(fā)展

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《數(shù)字視頻處理及應(yīng)用》課件第6章

文檔簡介

溫馨提示

最新文檔

評論

《數(shù)字視頻處理及應(yīng)用》課件第6章

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔