《數(shù)字視頻處理及應(yīng)用》課件第6章_第1頁
《數(shù)字視頻處理及應(yīng)用》課件第6章_第2頁
《數(shù)字視頻處理及應(yīng)用》課件第6章_第3頁
《數(shù)字視頻處理及應(yīng)用》課件第6章_第4頁
《數(shù)字視頻處理及應(yīng)用》課件第6章_第5頁
已閱讀5頁,還剩132頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第6章視頻編碼標(biāo)準(zhǔn)6.1視頻圖像編碼標(biāo)準(zhǔn)概述6.2圖像編碼標(biāo)準(zhǔn)

6.3H.26X系列視頻壓縮編碼標(biāo)準(zhǔn)6.4MPEG-X系列視頻編碼標(biāo)準(zhǔn)6.5視頻編碼的國家標(biāo)準(zhǔn)(AVS)6.6本章小結(jié)

6.1視頻圖像編碼標(biāo)準(zhǔn)概述

近年來,視頻圖像編碼技術(shù)得到了迅速發(fā)展和廣泛應(yīng)用,并且日臻成熟。一些國際組織也相繼制定了關(guān)于視頻圖像的編碼標(biāo)準(zhǔn)。例如,ITU-T制定的H.26X系列標(biāo)準(zhǔn)、ISO/IEC制定的關(guān)于靜態(tài)圖像的編碼標(biāo)準(zhǔn)JPEG和JPEG2000以及活動圖像的編碼標(biāo)準(zhǔn)MPEG系列等。這些標(biāo)準(zhǔn)圖像的編碼算法融合了各種性能優(yōu)良的圖像編碼方法,代表了目前圖像編碼的發(fā)展水平。表6-1給出了視頻圖像編碼的國際標(biāo)準(zhǔn)及其應(yīng)用。視頻編碼標(biāo)準(zhǔn)的發(fā)展分為三個階段:競爭、集中和驗證。在競爭階段,定義標(biāo)準(zhǔn)的應(yīng)用范圍和需求。通常一旦定義了需求,標(biāo)準(zhǔn)化組織就發(fā)出一個征求建議通知,以便征求整個社會的進入,這個階段的特點是獨立地進行競爭性實驗。集中階段的目的是合作實驗以便達成編碼方法的一致。當(dāng)對標(biāo)準(zhǔn)的一個公共框架達成一致時,考慮如編碼效率、主觀質(zhì)量、實現(xiàn)復(fù)雜度及兼容性等問題,在不同的實驗室實現(xiàn)這個框架,并且精煉其描述,直到不同的實現(xiàn)達到相同的效果。在驗證階段,檢查是否有差錯和歧義,確定出正確編碼和解碼的方法步驟。

6.2圖像編碼標(biāo)準(zhǔn)

JPEG是聯(lián)合圖像專家組(JointPhotographicExpertsGroup)的縮寫,該專家組隸屬于ISO/IEC的聯(lián)合技術(shù)第1委員會第29研究委員會的第1工作組(ISO/IECJTC1/SC29/WGl),WGl已經(jīng)制定了幾種圖像壓縮編碼的國際標(biāo)準(zhǔn),其中包括JPEG和JPEG2000。6.2.1JPEG

JPEG標(biāo)準(zhǔn)于1992年正式通過,它的正式名稱為信息技術(shù)連續(xù)色調(diào)靜止圖像的數(shù)字壓縮編碼。在JPEG算法中,共包含四種運行模式,其中一種是基于DPCM(差分脈沖編碼調(diào)制)的無損壓縮算法,另外三種是基于DCT(離散余弦變換)的有損壓縮算法。其要點如下:

·無損壓縮編碼模式。這種模式采用預(yù)測法和哈夫曼編碼(或算術(shù)編碼)以保證重建圖像與原圖像完全相同(設(shè)均方誤差為零),是無失真的。

·基于DCT的順序編碼模式。這種模式根據(jù)DCT變換原理,從上到下、從左到右順序地對圖像數(shù)據(jù)進行壓縮編碼。當(dāng)信息傳送到接收端時,首先按照上述規(guī)律進行解碼,從而還原圖像。在此過程中存在信息丟失,因此這是一種有損圖像壓縮編碼。

·基于DCT的累進編碼模式。這種模式也是以DCT變換為基礎(chǔ)的,但是其掃描過程不同。它通過多次掃描的方法來對一幅圖像進行數(shù)據(jù)壓縮。其描述過程采取由粗到細(xì)逐步累加的方式進行。圖像還原時,在屏幕上首先看到的是圖像的大致情況,而后逐步地細(xì)化,直到全部還原出來為止。

·基于DCT的分層編碼模式。這種模式是以圖像分辨率為基準(zhǔn)進行圖像編碼的。它首先是從低分辯率開始,逐步提高分辨率,直至與原圖像的分辨率相同為止。圖像重建時也是如此??梢娖湫Чc基于DCT累進編碼模式相似,但其處理起來更復(fù)雜,所獲得的壓縮比也更高一些。

1.無損壓縮編碼模式

在傳真機、靜止畫面的電話電視會議應(yīng)用中,根據(jù)其特點,JPEG采用DPCM無損壓縮編碼方案,其編碼過程如圖6-1所示。

圖6-2給出了DPCM鄰域預(yù)測模型,其中,A、B、C分別表示與當(dāng)前取樣點X相鄰的三個相鄰點的取樣值,其預(yù)測規(guī)律如式(6-1)所示。圖6-1JPEG無損壓縮編碼過程圖6-2DPCM鄰域預(yù)測模型

(6-1)在實際應(yīng)用中,可根據(jù)圖像的統(tǒng)計規(guī)律,選擇適當(dāng)?shù)臏y試方式。按上述預(yù)測模型求出預(yù)測誤差,然后對其進行無失真熵編碼,編碼方法可以采用哈夫曼編碼,也可以采用算術(shù)編碼。

2.基于DCT的順序編碼模式

圖6-3表示了一種基于DCT的順序編碼與解碼過程的系統(tǒng)框圖。

圖中源圖像采用8×8子塊DCT變換算法,從而獲得F(u,v)變換系數(shù)矩陣,這樣便實現(xiàn)了空間域到頻率域的變換,然后經(jīng)過根據(jù)視覺特性而設(shè)計的自適應(yīng)量化器,對DCT系數(shù)矩陣進行量化,并進行差分編碼和游程長度編碼,最后再進行熵編碼。解碼過程是編碼的逆過程。這里需要說明的是,圖6-3表示的是單一分量的壓縮編碼與解碼的過程。對于彩色圖像系統(tǒng)而言,所傳輸?shù)氖荵、U、V三個分量,因此是一個多分量系統(tǒng)。它們的壓縮與解壓縮原理相同。圖6-3基于DCT的順序編/解碼過程的系統(tǒng)框圖

1)DCT變換

JPEG將源圖像的每個8×8子塊進行DCT變換,以消除圖像塊各像素在空間域的相關(guān)性。在變換之前,除了要對原始圖像進行分割(一般是從上到下、從左到右)之外,還要將數(shù)字圖像采樣數(shù)據(jù)從無符號整數(shù)轉(zhuǎn)換到帶正負(fù)號的整數(shù),即把范圍為[0,28-1]的整數(shù)映射為[-28-1,28-1-1]范圍內(nèi)的整數(shù),目的是為了降低DCT運算時的內(nèi)部精度要求。二維8×8子塊的DCT/IDCT分別定義為

(6-2)(6-3)其中,m,n,u,v=0,1,…7;f(m,n)為源圖像的像素值;F(u,v)為相應(yīng)DCT系數(shù),而C(s)則定義為(6-4)

DCT變換可以看作是把8×8的子圖像塊分解為64個正交的基信號,變換后輸出的64個系數(shù)就是這64個基信號的幅值,其中第1個F(0,0)是直流系數(shù),其他63個都是交流系數(shù)。圖6-4表示了8×8大小的子圖像DCT變換時空域像素和頻域變換系數(shù)的對應(yīng)關(guān)系。圖6-48×8大小的子圖像DCT變換時空域像素和頻域變換系數(shù)的對應(yīng)關(guān)系

2)量化

DCT變換輸出的數(shù)據(jù)F(u,v)還必須進行量化處理。這里所說的量化是指從一個數(shù)值到另一個數(shù)值范圍的映射,其目的是為了減少DCT系數(shù)的幅值,增加零值,以達到壓縮數(shù)據(jù)的目的。JPEG采用線性均勻量化器,將64個DCT系數(shù)分別除以它們各自相應(yīng)的量化步長(量化步長范圍是1~255),四舍五入取整數(shù)。64個量化步長構(gòu)成一張量化步長表,供用戶選用。量化的作用是在圖像質(zhì)量達到一定保真度的前提下,忽略一些次要信息。由于不同頻率的基信號(余弦函數(shù))對人眼視覺的作用不同,因此可以根據(jù)不同頻率的視覺范圍值來選擇不同的量化步長。通常人眼總是對低頻成分比較敏感,所以量化步長較小;對高頻成分人眼不太敏感,所以量化步長較大。量化處理的結(jié)果一般都是低頻成分的系數(shù)比較大,高頻成分的系數(shù)比較小,甚至大多數(shù)是0。圖6-5給出了JPEG推薦的亮度和色度量化步長表。量化處理是壓縮編碼過程中圖像信息產(chǎn)生失真的主要原因。圖6-5JPEG推薦的亮度和色度量化步長表

3)編碼

JPEG壓縮算法的最后部分是對量化后的圖像進行編碼。這一部分由三步組成。

(1)直流系數(shù)(DC)編碼:經(jīng)過DCT變換后,低頻分量集中在左上角,其中F(0,0)(即第一行第一列元素)代表了直流(DC)系數(shù),即8×8子塊的平均值。由于直流(DC)系數(shù)的數(shù)值比較大,兩個相鄰的8×8子塊的DC系數(shù)相差很小,所以JPEG算法使用差分脈沖調(diào)制編碼(DPCM)技術(shù),對相鄰圖像塊之間量化DC系數(shù)的差值進行編碼。

(2)交流系數(shù)(AC)編碼:DCT變換矩陣中有63個元素是交流(AC)系數(shù),它們包含有許多“0”系數(shù),并且許多“0”是連續(xù)的,可采用行程編碼進行壓縮。這63個元素采用了“之”字形(Zig-Zag)的排列方法,稱為Z形掃描。

Z形掃描算法能夠?qū)崿F(xiàn)高效壓縮的原因之一是:經(jīng)過量化后,大量的DCT矩陣元素被截成0,且零值通常是從左上角開始沿對角線方向分布的,采用行程編碼算法(RLE)沿Z形路徑可有效地累積圖像中的0的個數(shù),所以這種編碼的壓縮效率非常高。8×8子塊的DC值及Z形掃描的過程如圖6-6所示。圖6-68×8子塊的DC值及Z形掃描的過程

(3)熵編碼:為了進一步達到壓縮數(shù)據(jù)的目的,需要對DPCM編碼后的直流系數(shù)(DC)和行程編碼后的交流系數(shù)(AC)再做基于統(tǒng)計特性的熵編碼(EntropyCoding)。這當(dāng)中使用了哈夫曼(Huffman)編碼。哈夫曼編碼可以使用很簡單的查表(LookupTable)方法進行編碼。在壓縮數(shù)據(jù)符號時,哈夫曼編碼對出現(xiàn)頻度比較高的符號分配比較短的代碼,而對出現(xiàn)頻度較低的符號分配比較長的代碼。最后,JPEG將各種標(biāo)記代碼和編碼后的圖像數(shù)據(jù)按幀組成數(shù)據(jù)流,用于保存、傳輸和應(yīng)用。

3.基于DCT的累進編碼模式

前面已經(jīng)介紹了按順序掃描方式來完成編碼,這樣從左到右、從上到下的掃描便能一次完成整幅圖像的編碼。而累進編碼模式與順序編碼模式不同,它是經(jīng)過多次掃描才能完成每個圖像分量的編碼,每次掃描都僅傳輸其中部分DCT系數(shù)。這樣,第一次掃描后,所編碼傳輸?shù)膱D像只是一個粗糙的圖像,接收端據(jù)此所重建的圖像質(zhì)量很低,但尚可識別;而在第二次的掃描中,則對圖像的一些進一步細(xì)節(jié)信息進行壓縮編碼傳輸,這時接收端將根據(jù)所接收的信息,在首次重建圖像的基礎(chǔ)上添加所接收的細(xì)節(jié)信息,此時重建圖像的質(zhì)量得到提高。這樣逐步累進,重建的圖像質(zhì)量也隨之逐步提高,直至完整地接收一幅圖像(若忽略量化的影響,則接收圖像質(zhì)量與發(fā)送的原圖像質(zhì)量相同)。根據(jù)上述分析,采用累進編碼模式的系統(tǒng)結(jié)構(gòu)與圖6-3基本相同,只是在量化器與熵編碼之間應(yīng)增加一個緩沖存儲器,以供存放一幅圖像數(shù)字化后的全部DCT系數(shù)。這樣,系統(tǒng)便可以多次對緩沖器中存儲的DCT系數(shù)進行掃描,并分批進行熵編碼。

4.基于DCT的分層編碼模式

在分層編碼模式中,一幅原始圖像被分成多個低分辨率的圖像,然后分別針對每個低分辨率的圖像進行編碼,具體過程如下:首先把一幅圖像分成若干低分辨率的圖像,然后對單獨的一個低分辨率的圖像進行壓縮編碼,其編碼方法可以選用無失真編碼,也可以采用基于DCT的順序編碼,或基于DCT的累進編碼。根據(jù)不同的用戶要求,采用不同的編碼方法。當(dāng)接收端接收上述發(fā)送信息后,進行解碼,進而重建圖像,然后將恢復(fù)的下一層低分辨率的圖像插入已重建圖像之中,以此來提高圖像的分辨率,直至圖像分辨率達到原圖像的質(zhì)量水平。必須說明的是,基于DCT的JPEG壓縮算法,其壓縮效果與圖像的內(nèi)容有關(guān),一般高頻分量少的圖像可以獲得較高的壓縮比。6.2.2JPEG2000

JPEG標(biāo)準(zhǔn)以其優(yōu)良的品質(zhì),使得它在短短的幾年內(nèi)就獲得極大的成功。然而,隨著多媒體應(yīng)用領(lǐng)域的不斷擴展,傳統(tǒng)JPEG壓縮技術(shù)已無法滿足人們對多媒體影像資料的要求。JPEG中采用的DCT將圖像壓縮為8×8的小塊,然后依次放入文件中,這種算法靠丟棄頻率信息實現(xiàn)壓縮,因而圖像的壓縮率越高,頻率信息被丟棄的越多。在極端情況下,JFEG圖像只保留了反映圖像的基本信息,精細(xì)的圖像細(xì)節(jié)都損失了。為此,JPEG制定了新一代靜止圖像壓縮標(biāo)準(zhǔn)JPEG2000。

JPEG2000與傳統(tǒng)JPEG最大的不同在于它放棄了JPEG所采用的以離散余弦變換(DCT)為主的區(qū)塊編碼方式,而采用以小波變換為主的多解析編碼方式,其主要目的是要將影像的頻率成分抽取出來。小波變換將一幅圖像作為一個整行變換和編碼,很好地保存了圖像信息中的相關(guān)性,達到了更好的壓縮編碼效果。JPEG2000編解碼系統(tǒng)的編碼器和解碼器的框圖如圖6-7所示。圖6-7JPEG2000編解碼系統(tǒng)的編碼器和解碼器的框圖編碼過程主要分為以下幾個過程:預(yù)處理、核心處理和碼流組織。預(yù)處理部分包括對圖像分片、直流電平(DC)位移和分量變換。核心處理部分由離散小波變換、量化和熵編碼組成。碼流組織部分則包括區(qū)域劃分、碼塊、層和包的組織。

下面說明JPEG2000的特點。

1.高壓縮率

由于在離散小波變換算法中,圖像可以轉(zhuǎn)換成一系列可更加有效存儲像素模塊的“小波”,因此,JPEG2000格式的圖片壓縮比可在現(xiàn)在的JPEG基礎(chǔ)上再提高10%~30%,而且壓縮后的圖像顯得更加細(xì)膩平滑,這一特征在互聯(lián)網(wǎng)和遙感等圖像傳輸領(lǐng)域有著廣泛的應(yīng)用。圖6-8所示就是JPEG和JPEG2000分別采用同樣壓縮率(27∶1)時的對比效果,可以很明顯地看到,JPEG壓縮的圖像存在方塊效應(yīng),而JPEG2000壓縮的圖像則更加細(xì)膩平滑,兩者差距是十分明顯的,JPEG2000壓縮的圖像明顯優(yōu)于JPEG。圖6-8JPEG和JPEG2000分別采用同樣壓縮率(27∶1)時的對比效果

2.無損壓縮和有損壓縮

JPEG2000提供無損和有損兩種壓縮方式,無損壓縮在許多領(lǐng)域是必須的,例如醫(yī)學(xué)圖像和檔案圖像等對圖像質(zhì)量要求比較高的情況。同時JPEG2000提供的是嵌入式碼流,允許從有損到無損的漸進解壓。

3.漸進傳輸

現(xiàn)在網(wǎng)絡(luò)上的JPEG圖像下載時是按“塊”傳輸?shù)?,因此只能一行一行地顯示,而采用JPEG2000格式的圖像支持漸進傳輸。所謂漸進傳輸,就是先傳輸圖像的輪廓數(shù)據(jù),然后再逐步傳輸其他數(shù)據(jù)來不斷提高圖像質(zhì)量?;ヂ?lián)網(wǎng)、打印機和圖像文檔是這一特性的主要應(yīng)用場合。

4.感興趣區(qū)域壓縮

使用JEPG2000可以指定圖片上感興趣區(qū)域,然后在壓縮時對這些區(qū)域指定壓縮質(zhì)量,或在恢復(fù)時指定某些區(qū)域的解壓縮要求。這是因為小波變換在空間和頻率域上具有局域性,要完全恢復(fù)圖像中的某個局部,并不需要所有編碼都被精確保留,只要對應(yīng)它的一部分編碼沒有誤差就可以了。這樣就可以很方便地突出重點。

5.碼流的隨機訪問和處理

使用JEPG2000允許用戶在圖像中隨機地定義感興趣區(qū)域,使得這一區(qū)域的圖像質(zhì)量高于其他圖像區(qū)域。碼流的隨機處理允許用戶進行旋轉(zhuǎn)、移動、濾波和特征提取等操作。

6.容錯性

JPEG2000在碼流中提供了容錯措施,在無線等傳輸誤碼很高的通信信道中傳輸圖像時,必須采取容錯措施才能達到一定的重建圖像質(zhì)量。

7.開放的框架結(jié)構(gòu)

為了在不同的圖像類型和應(yīng)用領(lǐng)域優(yōu)化編碼系統(tǒng),JPEG2000提供了一個開放的框架結(jié)構(gòu),在這種開放的結(jié)構(gòu)中編碼器只實現(xiàn)核心的工具算法和碼流的解析,如果解碼器需要,可以要求數(shù)據(jù)源發(fā)送未知的工具算法。

8.基于內(nèi)容的描述

圖像文檔、圖像索引和搜索在圖像處理中是一個重要的領(lǐng)域,MPEG-7就是支持用戶對其感興趣的各種“資料”進行快速、有效地檢索的一個國際標(biāo)準(zhǔn)?;趦?nèi)容的描述在JPEG2000中是壓縮系統(tǒng)的特性之一。

雖然JPEG2000在技術(shù)上有一定的優(yōu)勢,但到目前為止,實際應(yīng)用系統(tǒng)和互聯(lián)網(wǎng)上采用JPEG2000技術(shù)制作的圖像文件數(shù)量仍然很少。但是,由于JPEG2000在無損壓縮下仍然能有比較好的壓縮率,JPEG2000在圖像品質(zhì)要求比較高的醫(yī)學(xué)圖像的分析和處理中已經(jīng)有了一定程度的應(yīng)用。

6.3H.26X系列視頻壓縮編碼標(biāo)準(zhǔn)

H.26X是ITU-T(國際電信聯(lián)盟)及其前身CCITT(國際電報電話咨詢委員會)研究和制定的一系列視頻編碼的國際標(biāo)準(zhǔn)。其中,應(yīng)用最為廣泛的是H.261、H.263和H.264。H.261產(chǎn)生于20世紀(jì)90年代,可以說是視頻編碼的老前輩,如今已經(jīng)逐漸退出歷史舞臺。H.263是視頻會議領(lǐng)域所采用的主流編碼。H.264是近幾年出現(xiàn)的視頻編碼標(biāo)準(zhǔn),屬于MPEG-4的第10部分。在相同的圖像質(zhì)量的情況下,H.264有更高的壓縮率,并逐漸得到應(yīng)用。6.3.1H.261

1.視頻編碼系統(tǒng)

H.261是ITU-T制定的視頻壓縮編碼標(biāo)準(zhǔn),也是世界上第一個得到廣泛承認(rèn)、針對動態(tài)圖像的視頻壓縮標(biāo)準(zhǔn),而且其后出現(xiàn)的MPEG系列標(biāo)準(zhǔn)、H.262以及H.263等數(shù)字視頻壓縮標(biāo)準(zhǔn)的核心都是H.261??梢?,在圖像數(shù)據(jù)壓縮方面該標(biāo)準(zhǔn)占據(jù)非常重要的地位,其系統(tǒng)結(jié)構(gòu)如圖6-9所示。圖6-9H.261標(biāo)準(zhǔn)的視頻編/解碼系統(tǒng)結(jié)構(gòu)

2.視頻編碼器原理

1)幀內(nèi)編碼

H.261標(biāo)準(zhǔn)的視頻信源編碼器原理如圖6-10所示,而解碼器的工作原理與編碼器中的本地解碼電路完全相同,這里著重介紹視頻編碼器。圖6-10H.261標(biāo)準(zhǔn)的視頻信源編碼器原理圖從圖6-10中可以看出,視頻編碼器是由幀間預(yù)測、幀內(nèi)預(yù)測、DCT變換和量化等部件組成。其工作原理如下:對圖像序列中的第一幅圖像或景物變換后的第一幅圖像,采用幀內(nèi)變換編碼。

圖中的雙向選擇開關(guān)同時接上路,這樣輸入信號直接進行DCT變換,在該變換過程中采用了8×8子塊來完成運算,然后各DCT系數(shù)經(jīng)過Z形掃描展開成一維數(shù)據(jù)序列,再經(jīng)游程編碼后送至量化單元,系統(tǒng)中所采用的量化器工作于線性工作狀態(tài),其量化步長由編碼控制。量化輸出信號就是一幅圖像的輸出數(shù)據(jù)流,此時編碼器處于幀內(nèi)編碼模式。

2)幀間預(yù)測編碼

當(dāng)雙向選擇開關(guān)同時接下路時,輸入信號將與預(yù)測信號相減,從而獲得預(yù)測誤差,然后對預(yù)測誤差進行DCT變換,再對DCT變換系數(shù)進行量化輸出,此時編碼器工作于幀間編碼模式。其中的預(yù)測信號是經(jīng)過如下路徑所獲得的:首先量化輸出經(jīng)反量化和反離散余弦變換(IDCT)后,直接送至帶有運動估值和運動補償?shù)膸鎯ζ髦?,其輸出為運動補償?shù)念A(yù)測值,該值經(jīng)過環(huán)形濾波器,再與輸入數(shù)據(jù)信號相減,由此得到預(yù)測誤差。

應(yīng)注意的是,濾波器開關(guān)在此起到濾除高頻噪聲的作用,以達到提高圖像質(zhì)量的目的。

3)工作狀態(tài)的確定

在將量化器輸出數(shù)據(jù)流傳至對端之外,還要傳送一些輔助信息,其中包括運動估值、幀內(nèi)/幀間編碼標(biāo)志、量化器指示、傳送與否的標(biāo)志和濾波器開關(guān)指示等,這樣可以清楚地說明編碼器所處的工作狀態(tài),即是采用幀內(nèi)編碼還是采用幀間編碼,是否需要傳送運動矢量,是否要改變量化器的量化步長等。這里需要作如下說明:

(1)在編碼過程中應(yīng)盡可能多地消除時間上的冗余度,因而必須將最佳運動矢量與數(shù)據(jù)碼流一起傳輸,這樣接收端才能準(zhǔn)確地根據(jù)此矢量重建圖像。

(2)在H.261編碼器中,并不是總對帶運動補償?shù)膸g預(yù)測DCT進行編碼,它是根據(jù)一定的判斷標(biāo)準(zhǔn)來決定是否傳送DCT8×8像素塊信息。例如當(dāng)運動補償?shù)膸g誤差很小時,使得DCT系數(shù)量化后全為零,這樣可不傳此信息。對于傳送塊而言,它又可分為幀間編碼傳送塊和幀內(nèi)編碼傳送塊兩種。為了減少誤碼擴散給系統(tǒng)帶來的影響,最多只能連續(xù)進行132次幀間編碼,其后必須進行一次幀內(nèi)編碼。

(3)由于在經(jīng)過線性量化、變長編碼后,數(shù)據(jù)將被存放在緩沖器中。通常是根據(jù)緩沖器的占空度來調(diào)節(jié)量化器的步長,以控制視頻編碼數(shù)據(jù)流,使其與信道速率相匹配。

H.261標(biāo)準(zhǔn)采用的混合編碼方法,同時利用圖像在空間和時間上的冗余度進行壓縮,可以獲得較高的壓縮率。這個視頻編碼方案對以后各種視頻編碼標(biāo)準(zhǔn)都產(chǎn)生了深遠(yuǎn)影響,其影響直至現(xiàn)在。

3.H.261標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)

在H.261標(biāo)準(zhǔn)中采用層次化的數(shù)據(jù)結(jié)構(gòu),它包括圖像層(P)、塊組層(GOB)、宏塊層(MB)和像素塊(B)四層,如圖6-11所示。

編碼的最小單元為8×8的像素塊;4個亮度塊和對應(yīng)的兩個色度塊構(gòu)成一個宏塊;一定數(shù)量的宏塊(33塊)構(gòu)成一個塊組;若干塊組(對于CIF格式為12個塊組)構(gòu)成一幀圖像。每一個層次都有說明該層次信息的頭,編碼后的數(shù)據(jù)和頭信息逐層復(fù)用就構(gòu)成了H.261的碼流。圖6-11H.261標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)6.3.2H.263

ITU-T于1995年8月公布了低于64Kb/s的窄帶通信信道的視頻編碼標(biāo)準(zhǔn),即H.263,并于1996年獲得正式通過。

1.H.263與H.261的區(qū)別

H.263以H.261為基礎(chǔ),其編碼原理和數(shù)據(jù)結(jié)構(gòu)都與H.261相似,但存在下列區(qū)別:

(1)H.263能夠支持更多圖像格式。H.263不僅可以支持CIF和QCIF標(biāo)準(zhǔn)數(shù)據(jù)格式,還可以支持更多原始圖像數(shù)據(jù)格式,如Sub-QCIF、4CIF和16CIF等。

(2)H.263建議兩種運動估值。H.261標(biāo)準(zhǔn)要求對16×16像素的宏塊進行運動估值,而在H.263標(biāo)準(zhǔn)中,不僅可以16×16像素宏塊為單位進行運動估值,同時還可以根據(jù)需要采用8×8像素子塊進行運動估值。

(3)H.263采用半精度像素的預(yù)測值和高效的編碼。在H.261中,運動估值精度范圍為(-16,15),而在H.263中運動估值精度范圍為(-16.0,+15.5),可見采用了半像素精度。半精度像素預(yù)測采用雙線性內(nèi)插技術(shù),所獲得的結(jié)果如圖6-12所示。圖6-12雙線性內(nèi)插預(yù)測半精度像素在H.261中對運動矢量采用一維預(yù)測與VLC相結(jié)合的編碼方式,而在H.263中則采用更復(fù)雜的二維預(yù)測與VLC相結(jié)合的編碼方式。

(4)H.263提高了數(shù)據(jù)壓縮效率。

H.263標(biāo)準(zhǔn)中沒有對每秒幀數(shù)進行限制,這樣可以通過減小幀數(shù)來達到數(shù)據(jù)壓縮的目的。另外,在H.263中取消了H.261中的環(huán)路濾波器,并且改進了運動估值的方法,從而提高了預(yù)測質(zhì)量。同時還精減了部分附加信息以提高編碼效率,采用哈夫曼編碼、算術(shù)編碼來進一步提高壓縮比。

2.四種有效的壓縮編碼方法

在編碼方法上,H.263標(biāo)準(zhǔn)提供了四種可選的編碼模式,即無約束運動矢量算法、基于語法的算術(shù)編碼、高級預(yù)測模式和PB幀模式,從而進一步提高了編碼效率。

1)無約束運動矢量算法

通常運動矢量的范圍被限制在參考幀內(nèi),而在無約束運動矢量算法中取消了這種限制,運動矢量可以指向圖像之外。這樣,當(dāng)某運動矢量所指的參考像素位于圖像之外時,可以用邊緣圖像值代替這個“不存在的像素”。這種方法能夠幫助改善邊緣有運動物體的圖像質(zhì)量。

2)基于語法的算術(shù)編碼

在H.261中建議采用哈夫曼編碼,但在H.263中所有的變長編/解碼過程均采用算術(shù)編碼,這樣便克服了H.261中每一個符號必須用固定長度整比特數(shù)編碼的缺點,編碼效率得以進一步提高。

3)高級預(yù)測模式

通常運動估值是以16×16像素的宏塊為基本單位進行的,而在H.263中的預(yù)測模式下,編碼器既可以一個宏塊使用一個運動矢量,也可以讓宏塊中的4個8×8子塊各自使用一個運動矢量。盡管使用4個運動矢量需占用較多的比特數(shù),但能夠獲得較好的預(yù)測精度,特別是在此模式下對P幀的亮度數(shù)據(jù)采用交疊塊運動補償(OBMC)方法,即某一個8×8子塊的運動補償不僅與本塊的運動矢量有關(guān),而且還與其周圍的運動矢量有關(guān)。這就大大提高了重建圖像的質(zhì)量。

4)PB幀模式

H.263是ITU-T于1995年公布的低碼率的視頻編碼建議。此建議也吸取了部分MPEG(活動圖像專家組)系列標(biāo)準(zhǔn)的優(yōu)點,PB幀的名稱正是出自MPEG標(biāo)準(zhǔn)。在H.263中的一個PB幀單元包含了兩幀。其中的P幀是經(jīng)前一個P幀預(yù)測所得的,而B幀則是經(jīng)前一個P幀和本PB幀單元中的P幀通過雙向預(yù)測所得的結(jié)果。由此可見,P幀的運動估值與一般的P幀的運動估值相同,但B幀則有所不同,它需要利用雙向運動矢量來計算B幀的前后向預(yù)測值。通常是以它們的平均值作為該B幀的預(yù)測值。6.3.3H.264

ISOMPEG和ITU-T的視頻編碼專家組VCEG于2003年聯(lián)合制定了比MPEG和H.263性能更好的視頻壓縮編碼標(biāo)準(zhǔn),這個標(biāo)準(zhǔn)被稱為ITU-TH.264建議或MPEG-4的第10部分標(biāo)準(zhǔn),簡稱H.264/AVC(AdvancedVideoCoding)。H.264不僅具有高壓縮比,而且在惡劣的網(wǎng)絡(luò)傳輸條件下,具有較高的抗誤碼性能。H.264支持表6-2所示的三個范疇。和以前的編碼標(biāo)準(zhǔn)相比,H.264/AVC的編碼效率有較大幅度的提高。在相同重建圖像質(zhì)量下,H.264/AVC比MPEG2編碼效率高2~3倍,比H.263和MPEG4高1.5~2倍。H.264/AVC的性能提升是以計算復(fù)雜度的增加為代價的,其編碼的計算復(fù)雜度大約相當(dāng)于H.263的3倍,解碼復(fù)雜度大約相當(dāng)于H.263的2倍。

為了更好地支持網(wǎng)絡(luò)傳輸,H.264/AVC引入了面向IP包的編碼機制,將編碼碼流分成視頻編碼層(videocodinglayer,VCL)和網(wǎng)絡(luò)提取層(networkabstractionlayer,NAL)兩個層次。VCL中保存視頻壓縮后的數(shù)據(jù)流,NAL主要是為VCL提供一個與網(wǎng)絡(luò)無關(guān)的統(tǒng)一接口,采用統(tǒng)一的數(shù)據(jù)格式對視頻數(shù)據(jù)進行封裝打包后使其在網(wǎng)絡(luò)中傳送。H.264的編碼結(jié)構(gòu)框圖如圖6-13所示。VCL和NAL之間定義了基于分組方式的接口,它們分別提供高效編碼和良好的網(wǎng)絡(luò)適應(yīng)性。圖6-13H.264的編碼結(jié)構(gòu)框圖

H.264/AVC因其具有更高的壓縮比、更好的IP和無線網(wǎng)絡(luò)信道的適應(yīng)性,在數(shù)字視頻通信和存儲領(lǐng)域得到越來越廣泛的應(yīng)用,如有線電視、衛(wèi)星電視、視頻會議和遠(yuǎn)程視頻監(jiān)控等。H.264/AVC和以前的標(biāo)準(zhǔn)一樣,也是采用差分預(yù)測/變換的編碼框架,即混合編碼結(jié)構(gòu),其編碼原理如圖6-14所示。圖6-14H.264編碼原理圖但H.264/AVC在混合編碼的框架下引入了新的編碼工具,提高了編碼效率。新的編碼工具主要包括:幀內(nèi)空域預(yù)測、整數(shù)變換、多參考幀預(yù)測、可變塊大小預(yù)測、1/4精度像素運動補償、基于上下文的適應(yīng)性熵編碼和環(huán)路濾波等技術(shù)。與H.263和MPEG-4相比,H.264主要做了如下改進。

1.幀內(nèi)空域預(yù)測

以前的編碼標(biāo)準(zhǔn),如H.261、MPEG-1、MPEG-2等,對幀內(nèi)編碼塊直接進行變換,經(jīng)過變換后,對DC系數(shù)進行差分預(yù)測編碼。也就是說,對幀內(nèi)編碼塊有一個頻域內(nèi)的DC預(yù)測編碼過程。更進一步,以MPEG-4(Version1.0和2.0)、H.263、H.263+、H.263++為代表的編碼標(biāo)準(zhǔn)在幀內(nèi)預(yù)測方面都采用了頻域內(nèi)的DC/AC預(yù)測技術(shù),即對變換后的DC/AC系數(shù)進行水平或垂直方向的預(yù)測,進一步提高了幀內(nèi)編碼塊的編碼效率。

H.264采用幀內(nèi)預(yù)測模式。幀內(nèi)預(yù)測編碼具有運算速度快、高壓縮效率的優(yōu)點。幀內(nèi)預(yù)測編碼就是用周圍鄰近的像素值來預(yù)測當(dāng)前的像素值,然后對預(yù)測誤差進行編碼。對于亮度分量,幀內(nèi)預(yù)測可以用于4×4子塊和16×16宏塊,4×4子塊的預(yù)測模式有9種(模式0到模式8,其中模式2是DC預(yù)測),16×16宏塊的預(yù)測模式有4種(Vertical、Horizontal、DC和Plane);對于色度分量,預(yù)測是對整個8×8塊進行的,有4種預(yù)測模式(Vertical、Horizontal、DC和Plane)。除了DC預(yù)測外,其他每種預(yù)測模式對應(yīng)不同方向上的預(yù)測。

此外還有一種幀內(nèi)編碼模式,稱為I-PCM編碼模式。在該模式中,編碼器直接傳輸圖像的像素值,而不經(jīng)過預(yù)測和變換。在一些特殊的情況下,特別是圖像內(nèi)容不規(guī)則或者量化參數(shù)非常低時,該模式的編碼效率更高。

2.幀間預(yù)測

H.264采用7種樹狀宏塊結(jié)構(gòu)作為幀間預(yù)測的基本單元,每種結(jié)構(gòu)模式下塊的大小和形狀都不相同,這樣更有利于貼近實際,實現(xiàn)最佳的塊匹配,提高運動補償精度。

在H.264中,亮度分量的運動矢量使用1/4像素精度,色度分量的運動

矢量使用1/8像素精度,并詳細(xì)定義了相應(yīng)更小分?jǐn)?shù)像素的插值實現(xiàn)算法。因此,H.264中幀間運動矢量估值精度的提高,使搜索到的最佳匹配點(塊或宏塊中心)盡可能接近原圖,減小了運動估計的殘差,提高了運動視頻的時域壓縮效率。

H.264支持多參考幀預(yù)測,即通過在當(dāng)前幀之前解碼的多個參考幀中進行運動搜索,尋找出當(dāng)前編碼塊或宏塊的最佳匹配。在出現(xiàn)復(fù)雜形狀和紋理的物體、快速變化的景物、物體互相遮擋或攝像機快速地場景切換等一些特定情況下,多參考幀的使用會體現(xiàn)更好的時域壓縮效果。

3.SP/SI幀技術(shù)

視頻編碼標(biāo)準(zhǔn)主要包括三種幀類型:I幀、P幀和B幀。H.264為了順應(yīng)視頻流的帶寬自適應(yīng)性和抗誤碼性能的需求,定義了兩種新的幀類型:SP幀和SI幀。

SP幀編碼的基本原理同P幀相似,仍是基于幀間預(yù)測的運動補償預(yù)測編碼,兩者之間的區(qū)別在于SP幀能夠參照不同參考幀重構(gòu)出相同的圖像幀。利用這一特性,SP幀可取代I幀,廣泛應(yīng)用于流間切換、拼接、隨機接入、快進、快退和錯誤恢復(fù)等中,同時大大降低了碼率的開銷。與SP幀相對應(yīng),SI幀是基于幀內(nèi)預(yù)測的編碼技術(shù),其重構(gòu)圖像的方法與SP幀完全相同。

SP幀的編碼效率略低于P幀,但遠(yuǎn)遠(yuǎn)高于I幀,使得H.264可支持靈活的流媒體應(yīng)用,具有很強的抗誤碼能力,適用于在無線信道中通信。

SP幀分為主SP幀(PrimarySP-Frame)和輔SP幀(SecondarySP-Frame)。其中,前者的參考幀和當(dāng)前幀屬于同一個碼流,而后者不屬于同一個碼流。主SP幀作為切換插入點,不切換時,碼流進行正常的編碼傳輸;切換時,輔SP幀取代主SP幀進行傳輸。

4.整數(shù)變換與量化

H.264對幀內(nèi)或幀間預(yù)測的殘差進行DCT變換編碼。為了克服浮點運算帶來的復(fù)雜的硬件設(shè)計,新標(biāo)準(zhǔn)對DCT定義作了修改,使用變換時僅使用整數(shù)加減法和移位操作即可實現(xiàn)。這樣,在不考慮量化影響的情況下,解碼端的輸出可以準(zhǔn)確地恢復(fù)編碼端的輸人。該變換是針對4×4塊進行的,也有助于減少方塊效應(yīng)。

為了進一步利用圖像的空間相關(guān)性,在對色度的預(yù)測殘差和16×16幀內(nèi)預(yù)測的預(yù)測殘差進行整數(shù)DCT變換后,H.264標(biāo)準(zhǔn)還將每個4×4變換系數(shù)塊中的DC系數(shù)組成2×2或4×4大小的塊,進一步做哈達碼(Hadamard)變換。

5.熵編碼

H.264標(biāo)準(zhǔn)采用兩種高性能的熵編碼方式:基于上下文的自適應(yīng)可變長編碼(Context-basedAdaptiveVariableLengthCoding,CAVLC)和基于上下文的自適應(yīng)二進制算術(shù)編碼(Context-basedAdaptiveBinaryArithmeticCoding,CABAC)。

CAVLC用于亮度和色度殘差數(shù)據(jù)的編碼。經(jīng)過變換量化后的殘差數(shù)據(jù)有如下特性:4×4塊數(shù)據(jù)經(jīng)過預(yù)測、變換和量化后,非零系數(shù)主要集中在低頻部分,而高頻系數(shù)大部分是零;量化后的數(shù)據(jù)經(jīng)過Zig-Zag掃描后,DC系數(shù)附近的非零系數(shù)值較大,而高頻位置的非零系數(shù)值大部分是1或-1,且相鄰的4×4塊的非零系數(shù)之間是相關(guān)的。CAVLC采用了若干碼表,不同的碼表對應(yīng)不同的概率模型。編碼器能夠根據(jù)上下文,如周圍塊的非零系數(shù)或系數(shù)的絕對值大小,在這些碼表中自動地選擇,盡可能地與當(dāng)前數(shù)據(jù)的概率模型匹配,從而實現(xiàn)上下文自適應(yīng)的功能。

CABAC根據(jù)過去的觀測內(nèi)容,選擇適當(dāng)?shù)纳舷挛哪P?,提供?shù)據(jù)符號的條件概率的估計,并根據(jù)編碼時數(shù)據(jù)符號的比特數(shù)出現(xiàn)的頻率動態(tài)地修改概率模型。數(shù)據(jù)符號可以近似熵率進行編碼,以提高編碼效率。CABAC主要是通過三個方面來實現(xiàn)的,即上下文建模、自適應(yīng)概率估計和二進制算術(shù)編碼。

6.對傳輸錯誤的魯棒性和對不同網(wǎng)絡(luò)的適應(yīng)性

H.264在視頻編碼和網(wǎng)絡(luò)傳輸層之間定義了一個網(wǎng)絡(luò)抽象層(NetworkAbstractLayer,NAL),將視頻碼流封裝進NAL單元,可以靈活地與不同的網(wǎng)絡(luò)相適配。同時,H.264支持靈活宏塊排序(FlexibleMacroblockOrdering,F(xiàn)MO)、任意條帶排序和數(shù)據(jù)分割等方式,增強了碼流抵抗誤碼和丟包的魯棒性。

近兩年,H.264在技術(shù)實現(xiàn)方面有著突飛猛進的進步,其優(yōu)越的編碼壓縮效率正在逐步表現(xiàn)出來。在2006年初,采用H.264編碼的HDTV信號的碼率在10Mbps,而僅在一年之后,傳輸一路HDTV信號的碼率只需要6Mbps,H.264編碼技術(shù)真正進入了大規(guī)模商業(yè)應(yīng)用階段。目前,H.264的優(yōu)越編碼效率使其在許多環(huán)境中得到應(yīng)用。其中,由于電信線路的帶寬的限制,在開展IPTV和手機電視時,無法采用MPEG-2/H.263編碼標(biāo)準(zhǔn),需要H.264這樣的更高效的編碼技術(shù)。世界各國計劃在2010年到2015年之間停止模擬電視廣播,全部采用數(shù)字電視廣播,到時HDTV必然會獲得迅猛發(fā)展,必須要降低成本,而采用H.264可使傳輸費用降低為原來的1/4,所以這是個十分誘人的前景。我們相信隨著H.264編碼效率的進一步提高,相關(guān)解碼產(chǎn)品的成本進一步降低,在今后視頻編碼的各個應(yīng)用領(lǐng)域,H.264必將成為視頻的主流編碼標(biāo)準(zhǔn)。

H.264標(biāo)準(zhǔn)的推出,是視頻編碼標(biāo)準(zhǔn)的一次重要進步,它與先前的標(biāo)準(zhǔn)相比具有明顯的優(yōu)越性,特別是在編碼效率上的提高,使之能用于許多新的領(lǐng)域。盡管H.264的算法復(fù)雜度是編碼壓縮標(biāo)準(zhǔn)的四倍以上,但隨著半導(dǎo)體技術(shù)的發(fā)展,芯片的處理能力和存儲器的容量都將會有很大的提高,所以今后H.264必然煥發(fā)出蓬勃的生命力,逐漸成為市場的主角。

6.4MPEG-X系列視頻編碼標(biāo)準(zhǔn)

MPEG是活動圖像專家組(MovingPictureExpertsGroup)的縮寫,成立于1988年。與H.26X系列標(biāo)準(zhǔn)單純對視頻進行壓縮編碼不同,MPEG-X是一組由IEC和ISO制定發(fā)布的視頻、音頻、數(shù)據(jù)的壓縮標(biāo)準(zhǔn)。MPEG系列標(biāo)準(zhǔn)已成為國際上影響最大的多媒體技術(shù)標(biāo)準(zhǔn),對數(shù)字電視、視聽消費電子、多媒體通信等信息產(chǎn)業(yè)的發(fā)展產(chǎn)生了巨大而深遠(yuǎn)的影響。它具有三方面優(yōu)勢:首先,作為國際標(biāo)準(zhǔn),具有很好的兼容性;其次,能夠比其他壓縮編碼算法提供更高的壓縮比;最后,能夠保證在提供高壓縮比的同時,使數(shù)據(jù)損失很小。

MPE-X系列中現(xiàn)在常用的版本是:MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21、它們能夠適用于不同信道帶寬和數(shù)字影像質(zhì)量的要求。6.4.1MPEG-1

MPEG-1于1992年11月成為國際標(biāo)準(zhǔn),其任務(wù)是在一種可接受的質(zhì)量下,把視頻信號和伴音信號壓縮到速率大約為1.5Mb/s的單一MPEG數(shù)據(jù)流。MPEG-1標(biāo)準(zhǔn)由三部分構(gòu)成,第一部分是系統(tǒng)部分,主要描述了幾種伴音和圖像壓縮數(shù)據(jù)的復(fù)用以及加入同步信號后的整個系統(tǒng),編號為11172-1。第二部分為視頻部分,主要規(guī)定了圖像壓縮編碼方法,編號為11172-2。第三部分為音頻部分,主要規(guī)定了數(shù)字伴音壓縮編碼,編號為11172-3。MPEG-1標(biāo)準(zhǔn)的基本任務(wù)就是將視頻與其伴音統(tǒng)一起來進行數(shù)據(jù)壓縮,使其碼率可以壓縮到1.5Mb/s左右,同時具有可接收的視頻效果和保持視音頻的同步關(guān)系。在此主要對系統(tǒng)部分和視頻部分進行介紹。

1.系統(tǒng)部分

MPEG-1標(biāo)準(zhǔn)的系統(tǒng)部分主要按定時信息的指示,將視頻和音頻數(shù)據(jù)流同步復(fù)合成一個完整的MPEG-1比特流,從而便于信息的存儲與傳輸。在此過程將向數(shù)據(jù)流中加入相關(guān)的識別與同步信息,這樣,在接收端可以根據(jù)這些信息從接收數(shù)據(jù)流中分離出視頻與音頻數(shù)據(jù)流,并分別送往各自的視頻、音頻解碼器進行同步解碼和播放。

2.視頻部分

與H.261標(biāo)準(zhǔn)相似,MPEG-1標(biāo)準(zhǔn)也采用帶運動補償?shù)膸g預(yù)測DCT變換和VLC技術(shù)相結(jié)合的混合編碼方式。但MPEG-1在H.261的基礎(chǔ)上進行了重大的改進,具體如下:

1)輸入視頻格式

MPEG-1視頻編碼器要求其輸入視頻信號應(yīng)為逐行掃描的SIF格式,如果輸入視頻信號采用其他格式,如ITU-RBT601,則必須轉(zhuǎn)換成SIF格式才能作為MPEG-1的輸入。

2)預(yù)測與運動補償

與H.261標(biāo)準(zhǔn)相同,MPEG-1也采用幀間預(yù)測和幀內(nèi)預(yù)測相結(jié)合的壓縮編碼方案,以此來滿足高壓縮比和隨機存取的要求。為此在MPEG-1標(biāo)準(zhǔn)中定義了三種類型的幀,分別是I圖像幀、P圖像幀和B圖像幀。

·I圖像幀是一種幀內(nèi)編碼圖像幀。它是利用一幀圖像中的像素信息,通過去除其空間冗余度而達到數(shù)據(jù)壓縮的目的。

·P圖像幀是一種預(yù)測編碼圖像幀。它是利用前一個I圖像幀或P圖像幀,采用帶運動補償?shù)膸g預(yù)測的方法進行編碼。該圖像幀可以為后續(xù)的P幀或B幀進行圖像編碼提供參考。

·B圖像幀是一種雙向預(yù)測編碼圖像幀。它是利用其前后的圖像幀(I幀或P幀)進行帶運動補償?shù)碾p向預(yù)測編碼而得到的,如圖6-15所示,它本身不作為參考使用,所以不需要進行傳送,但需傳送運動補償信息。圖6-15MPEG-1圖象組及其幀間編碼方式在MPEG-1中是以宏塊16×16像素為單位進行雙向估值。假設(shè)一個活動圖像中有三個彼此相鄰的宏塊I0、I1和I2,如果已知宏塊I1相對于宏塊I0的運動矢量為mv01,則前向預(yù)測I1′(x)=I0(x+mv01),其中,x代表像素坐標(biāo);同理,若已知宏塊I1相對于宏塊I2的運動矢量為mv21,那么后向預(yù)測I1″(x)=I2(x+mv21),這樣便可獲得雙向預(yù)測公式:(6-5)這里需要說明的是,在MPEG中,對于P幀和B幀的使用并未加以任何的限制。一個典型的實驗序列的結(jié)果表明:對SIF分辨率,在采用IPBBPBBPBBPBBPBBP結(jié)構(gòu)的、速率為1.15Mb/s的MPEG-1視頻序列中,其I幀、P幀和B幀的平均碼率大小分別為156kb/s、62kb/s和15kb/s??梢夿幀的速率要遠(yuǎn)小于I幀和P幀的速率。然而僅通過增加I幀和P幀之間的B幀數(shù)量無法獲得更好的壓縮比。這是因為盡管增加了B幀的數(shù)量,但致使B幀與相應(yīng)的I幀和P幀的時間距離增加,從而導(dǎo)致它們之間的時間相關(guān)性下降,也就使運動補償預(yù)測能力下降。

3)視頻碼流的分層結(jié)構(gòu)

MPEG-1數(shù)據(jù)碼流也同樣采用層次結(jié)構(gòu),其結(jié)構(gòu)如圖6-16所示??梢娖渥罨締卧菈K,下面分別進行介紹。

·塊:一個塊是由8×8像素構(gòu)成的。亮度信號、色差信號都采用這種結(jié)構(gòu)。它是DCT變換的最基本單元。

·宏塊:一個宏塊是由附加數(shù)據(jù)與4個8×8亮度塊和2個8×8色差塊組成的。其中附加數(shù)據(jù)包含宏塊的編碼類型、量化參數(shù)、運動矢量等。宏塊是進行運動補償運算的基本單元。圖6-16MPEG-1視頻碼流的分層結(jié)構(gòu)

·片:一個片是由附加數(shù)據(jù)與若干個宏塊組成的。附加數(shù)據(jù)包括該片在整個圖像中的位置、默認(rèn)的全局量化參數(shù)等。片是進行圖像同步的基本單元。應(yīng)該說明的是,在一幀圖像中,片越多,其編碼效率越低,但處理誤碼的操作更容易,只需跳過出現(xiàn)誤碼的片即可。

·圖像:一幅圖像是由數(shù)據(jù)頭和若干片構(gòu)成的。其中數(shù)據(jù)頭包含該圖像的編碼類型及碼表選擇信息等。它是最基本的顯示單元,通常被稱為幀。

·圖像組:一個圖像組是由數(shù)據(jù)頭和若干圖像構(gòu)成的。數(shù)據(jù)頭中包含時間代碼等信息。圖像組中每一幅圖像既可以是I幀,也可以是P幀或B幀。但需說明的是,GOP中第一幅圖像必須是I幀,這樣便于提供圖像接入點。

·圖像序列:一串圖像序列是由數(shù)據(jù)頭和若干圖像組構(gòu)成的。數(shù)據(jù)頭中包含圖像的大小、量化矩陣等信息。

4)MPEG-1視頻編/解碼原理

MPEG-1視頻編/解碼器的原理如圖6-17所示。從圖中可以看出,其功能包含幀內(nèi)/幀間預(yù)測、量化和VLC編碼等。

(1)幀內(nèi)編碼:由于輸入圖像序列的第一幀一定是I幀,因而無需對其進行運動估值和補償,只需要將輸入圖像塊信號進行8×8變換,然后對DCT變換系數(shù)進行量化,再對量化系數(shù)進行VLC編碼和多路復(fù)用,最后存放在幀緩沖器之中,其輸出便形成編碼比特流。解碼過程是編碼的逆過程。圖6-17MPEG-1視頻編/解碼器的原理圖

(2)幀間編碼:從輸入圖像序列的第二幀開始進行幀間預(yù)測編碼,因而由量化器輸出的數(shù)據(jù)序列一方面被送往VLC及多路復(fù)用器的同時,還被送往反量化器和IDCT變換(DCT反變換),從而獲得重建圖像,以此作為預(yù)測器的參考幀。該過程與接收端的解碼過程相同。

此時首先求出預(yù)測圖像與輸入圖像之間的預(yù)測誤差,當(dāng)預(yù)測誤差大于閾值時,則對預(yù)測誤差進行量化和VLC編碼,否則不傳該塊信息,但需將前向和后向運動矢量信息傳輸?shù)浇邮斩恕T趯嶋H的信道中傳輸?shù)闹挥袃煞N幀,即I幀和P幀,這樣,在接收端便可以重建I幀和P幀,同時根據(jù)所接收的運動矢量采用雙向預(yù)測的方式恢復(fù)B幀。值得注意的是,對于B幀的運動估值過程要進行兩次,一次用過去幀來進行預(yù)測,另一次則要用將來幀進行預(yù)測,因此可求得兩個運動矢量。同時,在編碼器中可以利用這兩個宏塊(過去幀和將來幀)中的任何一個或兩者的平均值和當(dāng)前輸入圖像的宏塊相減,從而得到預(yù)測差。這種編碼方式就是前面介紹的幀間內(nèi)插編碼。6.4.2MPEG-2

1995年出臺的MPEG-2(ISO/IEC13818)標(biāo)準(zhǔn)正式名稱為“通用的活動圖像及其伴音編碼”。MPEG-2是一個通用多媒體編碼標(biāo)準(zhǔn),具有更廣闊的應(yīng)用范圍和更高的編碼質(zhì)量,其碼率范圍為1.5~100Mb/s。MPEG-2在NTSC制式下的分辨率可達720×486,MPEG-2還可提供廣播級的視頻和CD級的音質(zhì)。MPEG-2的音頻編碼可提供左、右、中聲道及兩個環(huán)繞聲道,以及一個重低音聲道和多達7個伴音聲道(DVD可有8種語言配音的原因)。同時,由于MPEG-2性能的出色表現(xiàn),已能適用于HDTV,使得原打算為HDTV設(shè)計的MPEG-3,還沒出世就被拋棄了。

MPEG-2的另一特點是,可提供一個范圍較廣的可變壓縮比,以適應(yīng)不同的畫面質(zhì)量、存儲容量以及帶寬的要求。其應(yīng)用范圍除了作為DVD的指定標(biāo)準(zhǔn)外,還可用于為廣播、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級的數(shù)字視頻。目前,歐、美、日等國家在視頻方面采用MPEG-2標(biāo)準(zhǔn),而在音頻方面則采用AC-3標(biāo)準(zhǔn),數(shù)字視頻廣播(DigitalVideoBroadcasting,DVB)標(biāo)準(zhǔn)中的視頻壓縮標(biāo)準(zhǔn)也確定采用MPEC-2,音頻壓縮標(biāo)準(zhǔn)采用MPEG音頻。

MPEG-2標(biāo)準(zhǔn)分為九個部分。第一部分為MPEG-2系統(tǒng),描述多個視頻流和音頻流合成節(jié)目流或傳輸流的方法。第二部分是MPEG-2視頻,描述視頻編碼方法。第三部分為MPEG-2音頻,描述音頻編碼方法。第四部分是一致性,描述測試一個編碼碼流是否符合MPEG-2碼流的方法。第五部分為參考軟件,描述第一、二和三部分的軟件實現(xiàn)方法。第六部分是數(shù)字存儲媒體的命令和控制DSM-CC,描述交互式多媒體網(wǎng)絡(luò)中服務(wù)器和用戶之間的會話信令集。第七部分是高級音頻編碼AAC,規(guī)定了不兼容MPEG-1音頻的多通道音頻編碼。第八部分是一致性DSM-CC。第九部分為實時接口,描述傳送碼流的實時接口規(guī)范。與MPEG-1相比,MPEG-2增加了許多新的特征,主要體現(xiàn)在以下五個方面:

1.MPEG-2標(biāo)準(zhǔn)的圖像規(guī)范

MPEG-2要求具有向下兼容性(和MPEG-1兼容)和處理各種視頻信號的能力。為了達到這個目的,在MPEG-2中,視頻圖像編碼是既分“檔次”又分“等級”的。按照編碼技術(shù)的難易程度,將各類應(yīng)用分為不同“檔次”,包括簡單檔次(SP)、主要檔次(MP)、信噪比可分檔次(SNP)、空間域可分檔次(SSP)、高檔次(HP)5個檔次。其中每個檔次都是MPEG-2語法的一個子集。按照圖像格式的難易程度,每個檔次又劃分為不同“等級”,每種等級都對有關(guān)參數(shù)規(guī)定約束條件。MPEG-2定義了低級別(LL)、主要級別(ML)、高1440級別(H1440)和高級別(HL)4個不同級別。其中主要檔次/主要等級(MP@ML)涉及的正是數(shù)字常規(guī)電視,使用價值最大。具體的分檔、分級見表6-3,表中給出的速率值僅是上限值。大體上說,低等級相當(dāng)于ITU-T的H.261的CIF或MPEG-1的SIF;主要等級與常規(guī)電視對應(yīng);高1440等級粗略地與每掃描行1440樣點的HDTV對應(yīng);高等級大體上與每掃描行1920樣點的HDTV對應(yīng)。從表中也可以看出MPEG-2視頻編碼覆蓋范圍之廣。

2.場和幀的區(qū)分

在MPEG-2編碼中為了更好地處理隔行掃描的電視信號,分別設(shè)置了按幀編碼和按場編碼兩種模式,并相應(yīng)地對運動補償作了擴展。這樣,常規(guī)隔行掃描電視圖像的壓縮編碼與單純的按幀編碼相比,其效率顯著提高。例如,在某些場合中,場間運動補償可能比幀間運動補償好,而在另外一些場合則相反。類似地,在某些情況下,用于場數(shù)據(jù)的DCT的質(zhì)量比用于幀數(shù)據(jù)的DCT的質(zhì)量可能有所改進。由此可見,在MPEG-2中,對于場/幀運動補償和場/幀DCT進行選擇(自適應(yīng)或非自適應(yīng))就成為改進圖像質(zhì)量的一個關(guān)鍵措施。

3.MPEG-2的分級編碼

在表6-3中,同一檔次不同級別間的圖像分辨率和視頻碼率相差很大,例如主要型這一檔次,它包含的四個等級對應(yīng)的速率分別為:80Mb/s、60Mb/s、15Mb/s和4Mb/s。為了保持解碼器的向上兼容性,MPEG-2采用了分級編碼。表6-3中的兩種可分級類型即為兩類不同的分級編碼方法。

(1)信噪比可分級:可以分級改變DCT系數(shù)的量化階距,它指的是對DCT系數(shù)使用不同的量化階距后的可解碼能力。對DCT系數(shù)進行粗量化后可獲得粗糙的視頻圖像,它和輸入的視頻圖像在同一時空分辨率下。增強層簡單地說是指粗糙視頻圖像和初始的輸入視頻圖像間的差值。

(2)空間域可分級:利用對像素的抽取和內(nèi)插來實現(xiàn)不同級別的轉(zhuǎn)換。它是指在沒有先對整幀圖像解碼和抽取的情況下,以不同的空間分辨率解碼視頻圖像的能力。例如從送給SSP@H1440解碼的60Mb/s碼流中分出MP@ML解碼器所需的15Mb/s的數(shù)據(jù),使其能解碼出符合現(xiàn)行常規(guī)電視質(zhì)量要求的圖像序列。

4.擴展系統(tǒng)層語法

MPEG-2中有兩類數(shù)據(jù)碼流:傳送數(shù)據(jù)流和節(jié)目數(shù)據(jù)流。兩者都是由壓縮后的視頻數(shù)據(jù)或音頻數(shù)據(jù)(還有輔助數(shù)據(jù))組成的分組化單元數(shù)據(jù)流所構(gòu)成的。基本流將在同步情況下進行解碼,其長度是可變的,一般相對傳送流而言,長度較長,可應(yīng)用于無誤碼的場合。傳送流長度是固定的,共有188字節(jié),可應(yīng)用于有誤碼的場合。而節(jié)目數(shù)據(jù)流的運行環(huán)境則極少出現(xiàn)差錯。由于在字頭上作了很多詳細(xì)規(guī)定,使用起來較為方便和靈活,因此可對每個分組設(shè)置優(yōu)先級、加密/解密或加擾、插入多語種解說聲音和字幕等。

5.其他特點

(1)交替掃描:MPEG-2標(biāo)準(zhǔn)除了對DCT系數(shù)采用“Z”字形掃描外,還采用了交替掃描方案,如圖6-18所示。交替掃描更適合隔行掃描的視頻圖像。

(2)DCT系數(shù)更細(xì)量化:在MPEG-2視頻的幀內(nèi)宏塊中,直流系數(shù)的量化加權(quán)可以是8、4、2或1。也就是說,直流系數(shù)允許有11位(即全部)的分辨率,交流系數(shù)的量化范圍為[-2048,2047],非幀內(nèi)宏塊中所有系數(shù)量化都在[-2048,2047];而對于MPEG-1標(biāo)準(zhǔn),直流系數(shù)的量化加權(quán)固定為8,交流系數(shù)的量化范圍為

[-256,255],非幀內(nèi)宏塊所有系數(shù)量化在[-256,255]。

(3)量化器量化因子調(diào)整更細(xì):量化因子的值除了是1~31之間的整數(shù)外,還提供了一組(31個)可選值,范圍是0.5~56.0之間的實數(shù)。圖6-18交替掃描示意圖6.4.4MPEG-4

MPEG-4于1999年2月公布,正式命名為“信息技術(shù):音視頻對象通用編碼算法(ISO/IEC14496)”,它針對的是一定比特率下的視頻、音頻編碼,更加注重多媒體系統(tǒng)的交互性和靈活性。這個標(biāo)準(zhǔn)主要應(yīng)用于可視電話、可視電子郵件等,對傳輸速率要求較低,在4.8~64kb/s之間,分辨率為176×144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù)以及數(shù)據(jù)壓縮技術(shù),以求用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。

MPEG-4比MPEG-2的應(yīng)用更廣泛,最終希望建立一種能被多媒體傳輸、多媒體存儲、多媒體檢索等應(yīng)用領(lǐng)域普遍采納的統(tǒng)一的多媒體數(shù)據(jù)格式。由于所要覆蓋的應(yīng)用范圍廣闊,同時應(yīng)用本身的要求又各不相同,因此,MPEG-4不同于過去的MPEG-2或H.26X系列標(biāo)準(zhǔn),其壓縮方法不再是限定的某種算法,而是可以根據(jù)不同的應(yīng)用,進行系統(tǒng)裁剪,選取不同的算法。例如對Intra幀的壓縮就提供了DCT和小波兩種變換。MPEG-4比起MPEG-2及H.26X系列,新變化中最重要的三個技術(shù)特征是:基于內(nèi)容的壓縮、更高的壓縮比和時空可伸縮性。

1.MPEG-4標(biāo)準(zhǔn)的構(gòu)成

MPEG-4標(biāo)準(zhǔn)由七個部分構(gòu)成。第一部分是系統(tǒng),MPEG-4系統(tǒng)把音/視頻對象及其組合復(fù)用成一個場景,提供與場景互相作用的工具,使用戶具有交互能力。第二部分是視頻,描述基于對象的視頻編碼方法,支持對自然和合成視頻對象的編碼。第三部分是音頻,描述對自然聲音和合成聲音的編碼。第四部分為一致性測試標(biāo)準(zhǔn)。第五部分是參考軟件。第六部分是多媒體傳送整體框架(DeliveryMultimediaIntegrationFramework,DMIF),主要解決交互網(wǎng)絡(luò)中、廣播環(huán)境下以及磁盤應(yīng)用中多媒體應(yīng)用的操作問題,通過DMIF,MPEG-4可以建立具有特殊服務(wù)質(zhì)量的信道,并面向每個基本流分配帶寬。第七部分是MPEG-4工具優(yōu)化軟件,提供一系列工具描述組成場景的一組對象,這些場景描述可以以二進制表示,與音/視頻對象一起編碼和傳輸。

2.MPEG-4編碼特性

MPEG-4采用了對象的概念。不同的數(shù)據(jù)源被視作不同的對象,而數(shù)據(jù)的接收者不再是被動的,他可以對不同的對象進行刪除、添加、移動等操作。這種基于對象的操作方法是MPEG-4與MPEG-1、MPEG-2的不同之處。語音、圖像、視頻等可以作為單獨存在的對象,也可以集合成一個更高層的對象,稱之為場景。MPEG-4用來描述其場景的語言叫BinaryFormatforScenes(BIFS)。BIFS語言不僅允許場景中對象的刪除和添加,而且可以對對象進行屬性改變,可以控制對象的行為——即可以進行交互式應(yīng)用。整個MPEG-4就是圍繞如何高效編碼AV(音視頻)對象,如何有效組織、傳輸AV對象而編制的。因此,AV對象的編碼是MPEG-4的核心編碼技術(shù)。AV對象的提出,使多媒體通信具有高度的交互能力和很高的編碼效率。MPEG-4用運動補償消除時域冗余,用DCT消除空域冗余。與以往視頻編碼標(biāo)準(zhǔn)相同,為支持基于對象的編碼,MPEG-4還采用形狀編碼和與之相關(guān)的形狀自適應(yīng)DCT(SA-DCT)技術(shù)來支持任意形狀視頻對象的編碼。與H.263相比,MPEG-4的視頻編碼標(biāo)準(zhǔn)要復(fù)雜的多,支持的應(yīng)用要廣泛的多。MPEG-4視頻標(biāo)準(zhǔn)的目標(biāo)是在多媒體環(huán)境中允許視頻數(shù)據(jù)的有效存取、傳輸和操作。為達到這一廣泛應(yīng)用目標(biāo),MPEG-4提供了一組工具與算法,通過這些工具與算法,從而支持諸如高效壓縮、視頻對象伸縮性、空域和時域伸縮性、對誤碼的恢復(fù)能力等功能。因此,MPEG-4視頻標(biāo)準(zhǔn)就是提供上述功能的一個標(biāo)準(zhǔn)化“工具箱”。

MPEG-4提供技術(shù)規(guī)范滿足多媒體終端用戶和多媒體服務(wù)提供者的需要。對于技術(shù)人員,MPEG-4提供關(guān)于數(shù)字電視、圖像動畫、Web頁面相應(yīng)的技術(shù)支持;對于網(wǎng)絡(luò)服務(wù)提供者,MPEG-4提供的信息,能被翻譯成各種網(wǎng)絡(luò)所用的信令消息;對于終端用戶,MPEG-4提供較高的交互訪問能力。具體標(biāo)準(zhǔn)概括如下:

·提供音頻、視頻或者音視頻內(nèi)容單元的表述形式,這種形式即AVO對象(AVO:音視頻對象),這些AVO可以是自然內(nèi)容和合成內(nèi)容,這些內(nèi)容可以用相機或麥克風(fēng)記錄,也可用計算機生成。

·將基本AVO對象合成為音視頻對象,形成音視場景。

·將與AVO相連的數(shù)據(jù)復(fù)合、同步。

·使用戶端和所產(chǎn)生的音視場景交互。

MPEG-4提供一個組成的場景的標(biāo)準(zhǔn)方式,允許:

·將AVO放在給定坐標(biāo)系統(tǒng)中的任意位置。

·將AVO重新組合成合成AVO(CompoundAVO)

·為了修改AVO屬性(例如,移動一個對象的紋理,通過發(fā)送一個動畫參數(shù)模擬一個運動的頭部),應(yīng)將流式數(shù)據(jù)應(yīng)用于AVO。

·交互式的改變用戶在場景中的視點和聽點。

3.MPEG-4標(biāo)準(zhǔn)的視頻編碼

1)基于視頻對象面的編碼

在視頻低碼率壓縮方面,MPEG-4引入了視頻對象面(VideoObjectPlane,VOP)的概念,其在無線視頻傳輸系統(tǒng)中達到10kb/s的低速率。為此它使用了多種技術(shù)來克服不可修復(fù)的錯誤來保證解碼器的正常工作,比如再同步標(biāo)記和可逆可變長度編碼技術(shù)。同時編碼端提供了多層次質(zhì)量的編碼以適應(yīng)解碼端在比特率方面的限制。當(dāng)場景含有不同的對象時,允許傳送最重要的對象或?qū)Σ煌膶ο髮嵤┎煌膫鬏斮|(zhì)量保證。MEPG-4在傳送不變的背景時所采用的技術(shù)可以使其在接收端改變視角時背景只傳送一次,從而節(jié)省比特率。另外,MPEG-4針對視頻對象還采用了計算機建模技術(shù),通過此技術(shù)可以使用對象的參數(shù)化操作來代替物體的具體運動,而且,其計算由本地端完成。例如事先定好的人臉模型可以通過少數(shù)的表情狀態(tài)和獨立的模型運動來模仿人臉的具體動作。在預(yù)期的MPEG-4語音合成界面中,人臉模型和人臉中唇、眼等特征模型有其特定的操作命令,使之與語音同步。圖6-19所示為MPEG-4標(biāo)準(zhǔn)基于VOP的視頻編解碼框圖。圖6-19MPEG-4標(biāo)準(zhǔn)基于VOP的視頻編解碼框圖

MPEG-4針對自然對象和合成對象的紋理特性提供了不同的解決方案。

2)自然對象的紋理與視頻

MPEG-4用視頻對象(VideoObject,VO)來表述視頻內(nèi)容的基本單元,如一個站立的人(脫離背景)就是一個VO,VO與其他的AVO(音視頻對象)組合成一個特定的場景,傳統(tǒng)的矩形圖像只能被認(rèn)為是將整個圖像作為一個對象,是這種視頻對象的一種特例。

MPEG-4標(biāo)準(zhǔn)的可視信息部分提供一個包含各種工具與算法的工具箱(為了更廣泛的適用性),對于下列各項要求提供解決方案:

·各種圖片與視頻的高效壓縮;

·在2D和3D網(wǎng)格上進行紋理映射的各種紋理的高效壓縮;

·各種動畫網(wǎng)格的時變幾何數(shù)據(jù)流的有效壓縮;

·對各種視頻對象的有效隨機訪問;

·對各種視頻與圖像序列的擴展操作;

·基于內(nèi)容的圖像和視頻信息編碼;

·基于內(nèi)容的紋理、圖像都可以升級(可升級性);

·時間、空間、質(zhì)量的可擴展性;

·在易于產(chǎn)生誤碼的環(huán)境下,對誤碼的指示和恢復(fù)能力。

3)合成對象的紋理與圖像

合成對象是計算機圖形學(xué)的一個子集,MPEG-4標(biāo)準(zhǔn)的合成對象主要有:

·參數(shù)化描述人體的合成及相應(yīng)的動畫數(shù)據(jù)流;

·對紋理映射的靜態(tài)和動態(tài)網(wǎng)格編碼;

·依賴于視點的紋理編碼。

4.MPEG-4音頻編碼

MPEG-4音頻對象可以分為兩類:自然音頻對象和合成音頻對象。MPEG-4自然音頻對象包括了從2kb/s到64kb/s的各種傳輸質(zhì)量的編碼。MPEG-4定義了三種編碼器(參數(shù)編碼、CELP編碼和時頻編碼)來協(xié)調(diào)工作,以在整個碼率范圍內(nèi)都得到高質(zhì)量的音頻。自然音頻對象的編碼支持各種分級編碼功能和錯誤恢復(fù)功能。合成音頻對象包括結(jié)構(gòu)音頻(StructuredAudio,SA)和文語轉(zhuǎn)換(TextToSpeech,TTS)。結(jié)構(gòu)音頻類似MIDI語言,它采用描述語音的方法來代替壓縮語音。TTS接受文本輸入并輸出相應(yīng)的合成語音,在應(yīng)用時通常與臉部動畫、唇語合成等技術(shù)結(jié)合起來使用。此外,音頻對象還含有對象的空間化特征,不同的空間定位決定了音源的空間位置,這樣可以使用人工或自然音源來營造人工聲音環(huán)境。

5.其他有關(guān)內(nèi)容

1)關(guān)于對象的分割

MPEG-4中不對如何從活動視頻中分割VO做具體定義,應(yīng)用中可根據(jù)實際情況處理,例如,對典型的可視電話圖像有可能實現(xiàn)全自動的算法,其他還可能采用“ColorKeying”和人機交互等方式。

視頻對象分割算法研究是一個非常吸引人的課題,因為它還能對三維圖像編碼起關(guān)鍵性作用?,F(xiàn)在的視頻對象分割算法可分為基于空間分割、基于時間分割以及時空聯(lián)合分割三種主要方法,其中時空聯(lián)合分割算法應(yīng)用最為廣泛,在MPEG-4的核心試驗中獲得較好的結(jié)果。

2)關(guān)于碼率控制

碼率控制在標(biāo)準(zhǔn)中依舊是開放的,它是提高編碼效率的一個重要環(huán)節(jié),包括對不同VO分配不同的數(shù)碼率,對同一VO進行內(nèi)容更新的優(yōu)化控制,以及對全局?jǐn)?shù)碼率的控制等。

總之,從編碼方案上說,MPEG-4仍是以子塊為基礎(chǔ)的混合編碼,這與其初衷及大多數(shù)人的預(yù)計相差很大,但對畫面的描述引入了VO的觀念,是以內(nèi)容為基礎(chǔ)的描述方法,在進行畫面組合、操作上更符合人的心理特點,提供了現(xiàn)有的以像素為基礎(chǔ)的標(biāo)準(zhǔn)不能提供的功能,這是它的重要標(biāo)志。

6.5視頻編碼的國家標(biāo)準(zhǔn)(AVS)

AVS(AudioVideocodingStandard)是我國具有自主知識產(chǎn)權(quán)的音視頻編碼國家標(biāo)準(zhǔn),其適用面十分廣闊。AVS工作組成立于2002年,其目的是建立中國獨立知識產(chǎn)權(quán)的音視頻國家標(biāo)準(zhǔn),包括壓縮、解壓、在數(shù)字音視頻系統(tǒng)或設(shè)備下的操作與顯示等。AVS視頻編碼標(biāo)準(zhǔn)于2006年被采納為國家標(biāo)準(zhǔn),它的推出是全球音視頻技術(shù)以及產(chǎn)業(yè)發(fā)展

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論