《多媒體技術》講稿第4章-3-2003

上傳人：q*** IP屬地：湖北上傳時間：2023-02-04 格式：PPT 頁數：111 大小：630.51KB 積分：28 舉報 版權申訴

已閱讀5頁，還剩106頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

第四章---第三部分數據壓縮標準第4章要點

5.數據壓縮的標準

數據壓縮標準

<1>衡量壓縮效果的技術指標

<2>幾種典型的音頻壓縮標準

<3>幾種典型的圖像壓縮標準

《返回》數據壓縮效果的技術指標一般,人們總是希望壓縮倍數高，壓縮速度快，并且希望壓縮所需資源、時間對用戶來講是透明的。但同時希望確保壓縮的精度。但追求壓縮比率和追求精度往往是矛盾的。從應用的角度看，主要的障礙是實現成本問題。越好的算法，計算復雜性越高，實現成本就越高。數據壓縮技術，大致有如下幾項指標：

（1）壓縮比（數據量?。?）壓縮、解壓算法簡單（3）恢復效果好（4）評價方法

《返回》第4章要點

5.數據壓縮的標準

<1>衡量數據壓縮效果好壞的技術指標

①壓縮比：在保證不失真或允許一定失真的前提下，壓縮前后所需的信息存儲量之比。下面給出兩種定義：定義1：即編碼效率：

η=H/R也用數據壓縮前后比特數之比。通常寫成x：1。

第4章要點

5.數據壓縮的標準

<1>技術指標定義2：

該式可用來衡量被壓縮的數據在原數據中所占的比重。當沒有引起失真時，表明已消除了多少冗余量。通常寫成x%。

②壓縮、解壓算法簡單：做到壓縮、解壓速度快，實現壓縮的軟硬件開銷小，盡量滿足實時壓縮和解壓需求。

③恢復效果好：根據壓縮對象的不同特點，保證不失真或允許一定失真情況下，恢復原始數據。

《返回》

評價方法（4）評價方法主觀評價法：圖像、聲音媒體質量的評價方法被稱為平均主觀打分(MOS)方法。

如下表所示?？陀^評價法：信噪比SNR=10lg(δ2/MSE)

均方誤差法，

MSE=1/N2

(xi-xi’)2

《返回》圖像、聲音媒體質量的評價方法返回5.數據壓縮的標準

<2>幾種典型的音頻壓縮標準

①聲音壓縮標準按質量，音頻信號可分為電話質量的語音、調幅廣播質量的音頻信號和高保真立體聲信號。三種音質壓縮標準對比。如下表所示。三種音質的壓縮標準表頻率范圍

抽樣頻率

量化位數信號速率

電話質量的語音

200Hz～3.4KHz

8KHz

8比特

64Kbps

調幅廣播質量的音頻

50Hz～7KHz

16KHz

14比特

224Kbps

高保真立體聲音頻(調頻廣播)

20Hz～20KHz(20Hz

～15KHz)44.1KHz

16比特

單聲道705Kbps

名稱對比項根據音頻信號是否損失劃分，分為無損壓縮和有損壓縮。無損壓縮法包括不引入任何數據失真的各種熵編碼；有損壓縮法又可分為波形編碼、參數編碼和同時利用這兩種技術的混合編碼方法。波形編碼(預測編碼)參數編碼混合編碼音頻壓縮標準如下表所示。

《返回》音頻編碼算法和國際標準返回幾種典型的音頻壓縮標準G.711PCM,采樣8KHz，->64KbpsG.721ADPCM,64kbps->32kbpdG.722高質量，SB-ADPCM,量化比特14bitG.728參數編碼，矢量量化G.729低碼率的音頻壓縮標準->8kbpsG.723.1->5.3kbps,6.3kbps,用在電話網、移動網、Intenet的語音通信MPEG1AC-3用于音響，HDTV.對6個聲道壓縮->320kbps。采樣48KHz《返回》幾種典型的圖像壓縮標準幾種典型的圖像壓縮標準（1）JPEG靜態(tài)圖像壓縮標準（2）JBIG標準(二值圖像標準)（3）MPEG動態(tài)圖像壓縮標準（4）P×64標準的視頻編碼標準

(5)AVS標準

《返回》第4章要點

5.數據壓縮的標準

<3>幾種典型圖像的壓縮標準

①JPEG靜態(tài)圖像壓縮標準(JointPictureExpertsGroup--聯合圖象專家組)

A.JPEG圖像壓縮的四種工作模式：

a.基于DPCM的無失真壓縮：從左到右、從上到下掃描信號，為每個圖像元素編碼。DPCM，Huffman，無量化。

b.基于DCT順序工作方式：對變換時間長的掃描器，以復合掃描順序進行圖像編碼。

c.累進工作方式：保證準確恢復圖像所有樣本值的圖像編碼。由粗到細，多次掃描，先傳低頻，再傳高頻分量（細節(jié)）。

d.分層工作方式：以多種分辨率進行圖像編碼，可直接獲得低分辨率圖像，重建復原全圖。

JPEG標準B.兩種基本壓縮算法（混合）1?；贒PCM的無失真算法（無量化器）圖2?；贒CT的有失真算法下面介紹JPEG標準的基于DCT的有失真算法壓縮原理：JPEG算法基本步驟：

JPEG算法操作可分成以下三個步驟：通過離散余弦變換(DCT)去除數據冗余；使用量化表對以DCT系數進行量化；對量化后的DCT系數進行編碼使其熵達到最小。

基于離散余弦變換(DCT)的有失真壓縮編碼的編碼過程如下圖所示JPEG標準算法框圖JPEG標準A.離散余弦變換

JPEG采用8×8子塊的二維離散余弦變換算法。1)DCT的實質與特點：①利用正交變換實現圖象數據壓縮的實質，是通過圖象取樣信息從空間域轉到變換域，其能量集中，保持且近似于不相關，從而保留能量集中部分即可使頻帶壓縮。②DCT的均方誤差編碼性能在理論上最接近于在馬爾科夫模型假定下的最佳統(tǒng)計匹配正交變換(KLT)。③DCT可用快速算法來實現?；贒CT的JPEG算法——

離散余弦變換示意圖8×8的子圖像塊的變換示意圖JPEG標準2)DCT過程（DiscreteCosineTransform）對于8×8的FDCT和IDCT數學表達式正交換(正偶數余弦變換的的歸一化形式)上式表明將圖象f從空間域(xy平面)轉換到變換域(uv平面)逆變換圖象譜F從變換域(u,v平面)轉換到空間域(x.y平面)。其中：二維DCT可分成行向一維DCT和列向一維DCT組合運算，二維快速DCT是把8×8塊不斷分成更小的無交疊子塊，直接對數據塊進行運算操作。基于DCT的JPEG算法——

DCT的可分離性圖示JPEG標準FDCT輸出64個基信號的幅值稱作“DCT系數”，即DCT變換系數值。64個變換系數中包括一個代表直流分量的“DC系數”和63個代表交流分量的“AC”系數。IDCT是FDCT的逆過程，它把64個DCT變換系數經逆變換運算，重建一個64點的輸出圖象。在所用設備的計算精足夠高的前提下，且系數未經過量化，原始的64點信號就能夠精確地恢復。3)量化基于DCT編、解碼框圖為了壓縮數據，對DCT系數要作量化處理，量化的作用是在保持一定質量前提下，丟棄圖像中對視覺效果影響不入的信息。量化處理是一個多到1的映射，是造成DCT編解碼信息丟失的根源之一。

JPEG中采用線性非均勻量化器，量化定義為對64個DCT系數除以量化步長，四舍五入取整.JPEG標準量化表的尺寸與64個變換系數一一對應(64個)，量化表元素隨DCT系數的位置和彩色分量的不同有不同值。它可由用戶規(guī)定(JPEG給出參考值)，并作為編碼器的一個輸入。量化表中每個元素值為1到255間任意整數，其值規(guī)定了它所對應的DCT系數的量化器步長。JPEG標準量化的作用是在一定的主觀保真度圖象質量前提下，丟掉那些對視覺影響不大的信息，不同頻率的余弦函數對視覺影響不同，可以根據不同頻率的視覺閾值來選擇量化表中的元素值的大小。這樣通過心理視覺實驗，去確定對應于不同頻率的視覺閾值，以確定不同頻率的量化器步長。JPEG標準JPEG給出量化特性表（示范），根據心理視覺加數函數而得到亮度分量量化矩陣。同時還給出根據心理視覺加權函數而得出的色度分量量化矩陣。這是JPEG給出的參考值?；贒CT的JPEG算法——

亮度量化表和色度量化表亮度分量量化矩陣、色度分量量化矩陣（JPEG中給出的參考值）

低頻分量部分，量化步距較小JPEG標準4)系數編碼

64個變換系數經量化后，坐標U：V=0的DC系數是直流分量，即64個空域圖象采樣值的平均值。相鄰塊(8×8)之間的DC系數相關性強，JPEG對DC系數采用DPCM(差分編碼)方法，即DIFF=DCJ-DCj-1。即對相鄰像素塊之間的L系數的差值進行編碼?；贒CT的JPEG算法——

對DC系數的編碼根據DC系數的特點，JPEG算法使用了差分脈沖調制編碼(DPCM)技術，即對相鄰塊之間的DC系數的差值:DIFF=DCi-DCi-1進行編碼。JPEG標準其余63個交流系數(AC系數)采用行程編碼從左上方Aco1開始，沿對角線方向，以“Z”字形(Zig-Zag)行程掃描，直至AC77掃描結束。量化后的AC系數通常會有許多零值，以“Z”字形路經進行行程編碼，可增加行程中連續(xù)零的個數，63個AC系數行程編碼的碼字甚至可用兩個字節(jié)表示.基于DCT的JPEG算法——

Z字形編排

基于DCT的JPEG算法——

對量化AC系數的Z字形編排編排的方法是按照Z字形的式樣編排。這樣就把一個8×8的矩陣變成一個1×64的矢量，頻率較低的系數放在矢量的頂部。JPEG標準5)熵編碼為了進一步壓縮數據，可對DC和AC行程編碼的碼字再作基于統(tǒng)計特性的熵編碼，JPEG建議用哈夫曼(Huffman)或自適應二進制算術編碼。熵編碼步驟：①熵編碼中的中間格式表示②可變長度熵編碼基于DCT的JPEG算法——

熵編碼的步驟

熵編碼可分成兩步進行，首先把DC碼和行程碼字轉換成中間符號序列；然后給這些符號賦以變長碼字?；贒CT的JPEG算法——

熵編碼的中間格式表示熵編碼的中間格式由兩個符號組成：符號1（行程，尺寸）符號2（幅值）符號1的高4位表示前后兩個非零AC系數之間連續(xù)“0”的個數；符號1的低4位表示對后續(xù)非零系數進行編碼所需要的比特數。符號2表示后續(xù)非零系數的實際值?；贒CT的JPEG算法——

對符號1的進行哈夫曼編碼對DC系數和AC系數中的符號1采用哈夫曼表中的變長碼(VLC)編碼。哈夫曼變長碼表必須作為JPEG編碼器的輸入。需要注意的是在數據流中哈夫曼表的表示格式是一個間接的說明，在解碼時，解碼器利用這一間接說明重構真正的哈夫曼表?；贒CT的JPEG算法——

對符號2做可變長度熵編碼符號2用變長整數(簡稱VLI)碼編碼。VLI是變長碼但不是哈夫曼碼；VLI的碼字是被固化在JPEG建議中，供計算用；JPEG解碼器能夠同時存儲最多4套不同的熵編碼表。JPEG標準6)累進操作方式編碼上述的是DCT順序操作方式。累進操作方式對每個圖象分量的編碼要經過多次掃描未完成，第一次進行1次粗糙的壓縮，以便很快地傳輸粗糙圖象，用它來重建一幅度量較低的可識別圖象；第2次掃描作較細的壓縮，只傳送增加的信息，可重建一幅質量提高了一些的圖象。不斷累進，直到達到較滿意的圖象質量為止。JPEG標準增加一個足以存儲量化DCT系數的緩沖區(qū)，對它們在多次掃描中分批進行編碼。有兩種累進方式：①頻譜選擇法②按位逼近法JPEG標準7)基于DCT的分層操作方式將原始圖象分成多個分辨率進行“錐形”(塔形)編碼方法。水平方向和垂直方向分辨率的下降以2的倍數因子改變。編碼過程為：①把原始圖象空間分辨率降低。②對"小尺寸"圖采用基于DCT的順序方式，累進方式或無失真予測編碼中位一種編碼方法進行編碼。③對低分辨率的圖象解碼，重建圖象，使用插值濾波器，對它插值，恢復圖象的水平和垂直分辨率。④把分辨率已提高的圖象作為原始圖象的預測值，對它們的差值采用基于DCT的順序方式，或累進方式，或無失真方式編碼。⑤重復③、④直到圖象達到完整的分辨率編碼。壓縮比與恢復圖像質量的關系返回針對基于DCT的JPEG壓縮算法，在原始圖像每像素采用8比特編碼條件下，定量描述壓縮比與恢復圖像質量的關系，如下表所示。第4章要點

5.數據壓縮的標準

JPEG2000小波MotionJPEG只進行幀內編碼

《返回》第4章要點

5.數據壓縮的標準

②JBIG標準(JointBilevelImageGroup)

采用無損壓縮技術。適合于在分組網中傳輸高分辨率的二值圖像(1728×2376或2304×2896)，可應用于灰度或彩色圖像。有較高壓縮比(10:1)。而傳真標準G3、G4為2:1～4:1。

《返回》③MPEG動態(tài)圖像壓縮標準(MotionPictureExpertsGroup)——MPEG-1、2、4、7

MPEG-1是一個面向家庭電視質量級的視頻、音頻壓縮標準；如VCD。

MPEG-2是面向演播級的視頻、音頻壓縮標準。該類數據要求的清晰度較高。如DVD、HDTV。

MPEG-4是基于內容的數據壓縮標準。

MPEG-7是基于內容的描述語言和格式的標準。

《返回》MPEG運動圖像編解碼標準標準的內涵

MPEG的國際標準分為三個部分，即Systems，Video，audio。①Systems將分別的audio與Video合成為單一數據流。②Video和Audio的技術指標給出了兩者編碼位流的句法與語義。MPEG流

①MPEG1流結構

MPEG1的流具有兩層：

System層包含定時與其它信息，去解復用audio和Video流，并在回放時同步audio與Video。

壓縮層包括壓縮audio和Video流。下圖表示了MPEG1的解碼系統(tǒng)，系統(tǒng)解復用抽取定時信息，并傳到系統(tǒng)的有關單元去。系統(tǒng)層支持以下五個基本功能：1)解碼時多條壓縮流的同步；2)多條壓縮流交織為一個單一流；3)為啟動解碼而對緩沖區(qū)進行初始化；4)連續(xù)的緩沖區(qū)管理；5)時間標識。系統(tǒng)還解復用video與andio流并傳到相應的解碼器去。

Video解碼器解壓縮的視頻流在MPEG標準的PartI中描述。C-Cube公司目前有CL450，CL480/484和CL9100等解碼器。②MPEG-2流結構

MPEG-2定義了兩類系統(tǒng)流：Program（節(jié)目流）和transport（傳輸流）。兩者的復用流組成了Video與audio的基本的流，兩者均被分別捆包傳送。一個MPEG多路復用比特流可以是傳輸流(TS)或節(jié)目流(PS)。兩種流均由PES分組包或包含其他必要信息的分組構成。兩種流類型均支持來自具有一個共同時間基準節(jié)目的視頻和音頻壓縮流的復用。傳輸流TS還支持來自具有獨立時間基準的多個節(jié)目的視頻和音頻壓縮流的復用。對于幾乎不發(fā)生差錯的環(huán)境而言，節(jié)目流通常更為合適，并且支持節(jié)目信息的軟件處理。傳輸流更適合于可能出錯的環(huán)境。一個傳輸流包括一或多個節(jié)目。視頻與音頻基本流由訪問單元組成。節(jié)目流編碼層允許將具有一個或多個基本流的一個節(jié)目組合成一個單一流。來自于各基本流的數據與那些允許節(jié)目中的基本流同步播放的信息復用一起。一個節(jié)目流包含來自于一個節(jié)目的復用在一起的一個或多個基本流。基本流數據攜帶于PES分組包中，PES分組包由分組頭及其后的分組包數據組成。一個MPEG多路復用比特流，不論是傳輸流還是節(jié)目流，其結構分兩層：最外層是系統(tǒng)層，最內層是壓縮層。系統(tǒng)層提供了使用系統(tǒng)中一個或多個壓縮數據流所必需的功能。MPEG規(guī)范的音頻和視頻部分定義了音頻和視頻數據的壓縮編碼層,并被系統(tǒng)層支持。③

視頻流數據層次

MPEG-1與MPEG-2標準定義了視頻流數據結構的層次如下圖所示。比特流的語法層及其功能其中包括：

VIDEOSequence它由一系列的頭，一個或多個圖片組，和一個序列結束碼組成，它是前面所定義的視頻數據流的另一個術語。

Groupofpictures它是一個或多個圖片系列。允許隨機訪問其序列。

Picture一個視頻序列的基本編碼單元，圖片由三個正交的本色組成，包括亮度Y，兩個色度CbCr的值，Slice一個或多個結構宏塊、在Slice里宏塊的順序是從左到右，從上到下。在差錯處理時Slice是很重要。如果位流有一個錯誤、解碼器可以是下一個Slice的起點，這有利于改善圖像質量。Mocroblock一個16-pixelX16-line的亮度成分區(qū)和相應的色度分量的8-pixelX8-line區(qū)。Block幀間圖像編碼(Inter-PictureCoding)①

圖片類型

MPEG標準專門定義3種圖片類型：intra，predicted和Bidirectional。Intra-Pictures即稱Ⅰ圖，編碼時僅使用本圖信息，Ⅰ圖提供所有可能的隨機訪問點進入壓縮的視頻數據，Ⅰ圖僅使用變換編碼，因此它提供適度的壓縮倍數，典型的約每象素2位為宜。PredictedPictures稱為P圖，它被編碼時考慮最接近的前面的Ⅰ或P圖，這種技術稱之為朝前預測，如下圖BidirectionalPictures稱為B圖，它使用過去的或前面的圖為參考，這種技術稱為雙向預測，如下面圖所示，B類圖提供最大的壓縮并不會產生誤差，因為它從不用為參考圖，雙向預測還減少了噪聲的影響，由于它對兩幀起了平均作用。②

視頻流I.P.B典型布局MPEG算法允許編碼時選擇頻率并定位Ⅰ圖，這種選擇基于對隨機訪問性在應用時的需要，并定位在視頻序列里場景的剪切。在應用中隨機訪問是重要的，I圖典型地用于每秒兩次。編碼器還選擇任意一對(Ⅰ或P)圖片間的雙向圖片數、這一選擇是基于某種因素，比如在編碼器里的存儲量、以及被編碼對象的特性，對于大的一類場景，工作的參數必須有雙向圖片分別作為連續(xù)的參考圖。下圖表示一個典型的I、P和B圖的安排，按顯示順序布局。MPEG編碼器在視頻流里重排圖片順序，提交給解碼器，以最有效的序列方式來表示圖片。實際上，在組合B圖之前Ⅰ圖需要重構B圖來傳送。下圖表示了C-Cube公司的編碼的例子③MotionCompensation運動補償運動補償是用來消除時域冗余,增強P圖與B圖的壓縮效果的一種技術.運動補償算法在宏塊內進行。當一個宏塊由運動補償來壓縮時，壓縮文件包含以下信息：

a)在基準和被編碼的宏塊之間存在的空間差異。

b)在基準和被編碼的宏塊之間存在的內容差異。不是在圖片里的所有的信息都可以由前面的圖片來預測的。例如考慮一個場景打開一扇門：在門后房間里的細節(jié)是不可能由前面的幀來預測的，因為在此之前門是關著的。當在某種情況下宏塊用P圖不能用運動補償來有效的表示。這時要用Ⅰ圖并使用變換編碼技術。B和P圖運動補償之間的差別在于：在P圖里宏塊僅使用前面的參考(I或P-圖)，而在B圖里宏塊編碼使用過去的或將來的圖的任意結合。幀內圖片(變換)編碼MPEG變換編碼算法包括下列步驟；a)離散余弦變換(DCT)b)量化Quantizationc)游程碼RLE編碼圖象塊與預測誤差塊有高的空域冗余度，為了減少冗余，MPEG算法用DCT變換8×8象元塊或8×8的誤差塊到頻域。下一步算法量化頻率系數，量化是估計每個頻率系數為一個允許值的有限數之一的過程。編碼器選擇一個量化矩陣來決定如何量化8X8塊里的每個頻率系數。人類對于高頻的量化誤差感覺是低的，因此高頻比低頻量化得更粗糙些。DCT與量化的結合引起很多頻率系數為零，特別對高頻更是如此。為了發(fā)揮其長處，這些系數被組織為Z順序，用來產生較長的零過程。某些象素塊需要此其它的編碼更精確，例如，較平緩的密度梯度的塊需要精確編碼以避免可看到塊邊緣，為了處理塊之間的這種不均勻性，MPEG算法允許對每個16×16象元塊做一定的量化修正。這一機制還可被用來對特殊的位流提供平滑自適應。同步MPEG標準提供時間同步機制去保證音頻與視頻的同步。MPEG-1標準定義兩個參數用來解碼：Systemclockreference(SCR)與Presentationtimestamp(PTS)。

MPER-2標準增加了programclockreference(PCR)，同時也提供SCR與PCR去解決27MHz的擴展問題。返回MPEG4—Codingofaudio&Visualobjects.1）基于內容（Based-contents）的編碼。2）Integration：考慮單、立體與多通道的音頻，二維、三維單色、立體或多視點的視頻。3）flexibilityandextensibility.MPEG-4編碼器軟件模型框圖返回MPEG-7多媒體內容描述接口，規(guī)定一套可用于描述各種多媒體信息的描述符的標準，它與多媒體信息內容一起，支持用戶對其感興趣的資源快速,有效撿索。應用領域：

1)數字化圖書館（包括圖象分類圖象、音樂字典等）

2)多媒體目錄服務

3)廣播式媒體選擇（包括個人電子新聞服務，媒體著作等）

4)旅游、文化、地理信息系統(tǒng)。返回第4章要點

5.數據壓縮的標準

④P×64標準的視頻編碼標準電話與會議電視業(yè)務的需要視聽業(yè)務視頻編解碼CODEC,H.261建議，俗稱p64Kbit/s(P=1~30).支持實時動態(tài)圖像的壓縮編解碼。標準中P是一個可變參數，取值為1～30。P=1或2時，僅能支持桌面上的面對面直觀通信（即64Kbps或128Kbps）；當P≥6時，支持通用中間格式每秒幀數較高活動圖像的電視會議?！斗祷亍?/p>

H.261建議實際上是H.261標準CIF\QCIF；352*288幀間預測---DCT---Huffman、I幀/P幀；對稱數據流四個層次：塊層、宏塊層、塊組、圖象層為了適應寬帶傳輸需要H.262建議（ISO/IEC13818標準）發(fā)展新的預測法和變換編碼法H.263建議。H.261主要技術參數

1）傳輸速率視頻信號編碼傳輸速率為p64Kbit/s(P=1~30)

建議使用的視頻比特率介于40Kbit/s~2Mbit/s之間。2）圖像尺寸

H.261的圖像尺寸格式如下表（1）H.261建議的圖像尺寸為一幀電視信號就是一幅圖像、視頻編碼圖像格式可歸納如下表：視頻復用編碼器1)視頻復用按4層結構如下圖像層組塊宏塊塊（1）幀圖像層（PICTURELAYER）

每幅圖像的數據由圖像頭構成，GOB的數據緊隨其后，結構如下圖，丟棄的圖像的圖像頭不發(fā)送。（2）塊組層GOB每一幅圖像都被劃分成若干塊組（GOB）。一個塊組由1/12個CIF或1/3個QCIF的圖像區(qū)組成如下圖。一個GOB由176個像素乘4８行構成。（3）宏塊層每個GOB被劃分成33個宏塊，如下圖，一個宏塊為16×16，而Cb,Cr為8×8。宏塊的數據由MB頭組成，其后是塊數據，如下圖。MQUANT，MVD和CBP的存在與否由MYTPE指示。(4)塊層宏塊由4個亮度塊和2個色差塊組成如下圖，塊數據由變換系數碼字和跟隨其后的塊終止標號組成。ITU-TH.263建議

H263是ITU-I標準，于1995年公布，設計來為低比特率通信用，早先的草案指定數據率小于64Kbits/s，后來取消了這一限制，希望能適用于寬范圍的比特率，不僅僅是低比特率應用，在許多應用中H.263取代了H.261。

返回H.263低比特率標準30Kbps用于電信部門，電話線、Modem28.8kbps/33.6Kbps/56Kbps支持多種格式Sub-CIF\QCIF\CIF\4CIF\16CIF效率不高，仍會有馬賽克

H.263的編碼算法類似于H.261，但有某些改進與變化，以利于提高性能和錯誤恢復。H.261與H.263編碼算法的區(qū)別在于：半象素精度（Halfpixelprecision）用于運動補償，而H.261使用全象素精度和循環(huán)濾波。數據的層次結構某些部分是供選擇的，所以Codec能被構成為低數據率或較好的錯誤恢復。有4種選擇的編碼方法用于改善性能H.263支持五種分辨率，它在H.261支持的QCIF和CIF的基礎上增加了SQCIF，4CIF，16CIF。SQCIF是QCIF的半精度，而4CIF與16CIF是CIF的4倍與16倍分辨率。H.324標準ITU從1993年開始著手制造一套新的多媒體通信技術標準。概括如下表：H.324多媒體系統(tǒng)總體結構

(1)首要區(qū)別是增加了數據接口（2）它把數據調制解調器也包括了進去。它的復接和解復接部分H.223比H.221復雜（H.221只是視頻和音信號的復接）。（3）音頻編解碼器G.723主要用來作為語音信號的壓縮和解壓縮。本來采用G.723代號但發(fā)現它已被采用為ADPCM標準。所以改為G.723.1。（4）標準的數據通信應用包括了應用于實時語音圖形會議的T.120,用于簡單的點對點靜止傳輸的T.84，用于簡單的點對點文件傳輸的T.434，用于遠維離攝像機控制的H.224/H.281以及ISO/IECIR9577包括PPP和IP在內的網絡協(xié)議，用戶數據緩存的V.14或LAPM/V.42也包括在內。實測表明，當用28.8kbpsMODEM連接時，其電視畫面不夠連續(xù)，只有在48kbps時，才能得到滿意的圖象。AVS視頻標準AVS視頻標準AVS視頻標準的制定過程方案的討論與確定（02年8月到12月）兩種可能與H.264的基本層兼容完全獨立的方案技術的征集和評估（02年12月至今）AVS視頻標準熵編碼反量化反變換運動補償預測控制數據量化后的變換系數運動數據幀內/幀間編碼控制解碼器運動估計變換/量化-0環(huán)濾波幀內預測返回技術征集技術類型征集技術幀間和幀內預測技術（Inter&IntraPrediction）BFrame（清華）Interlace（清華）Sub-pixelInterpolation（浙大）MVPrediction&Coding（北工大，北航）IntraPrediction（清華）SkipMode變換和量化（Transform&Quantization）WaveletTransform(Integer)（華工）DCT（計算所，北工大）變換系數掃描（CoefficientScan）AlternateScan（計算所）熵編碼器（EntropyCoding）VLC（華工，計算所，北航）CABAC濾波器（Filtering）In-loopdeblockingfilter（華工，浙大，自動化所）文件格式（FileFormat）startcode（華為）High-levelsyntax（華為）AVS視

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《多媒體技術》講稿第4章-3-2003

文檔簡介

溫馨提示

最新文檔

評論

《多媒體技術》講稿第4章-3-2003

文檔簡介

溫馨提示

最新文檔

評論

相關文檔