第三章多媒體數(shù)據(jù)壓縮技術(shù)_第1頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第2頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第3頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第4頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章多媒體數(shù)據(jù)壓縮技術(shù)第一節(jié)多媒體數(shù)據(jù)壓縮技術(shù)概述第二節(jié)靜態(tài)圖像壓縮編碼國際標準—JPEG第三節(jié)運動圖像壓縮編碼國際標準—MPEG一、多媒體數(shù)據(jù)壓縮編碼的必要性二、多媒體數(shù)據(jù)壓縮的可能性

三、數(shù)據(jù)壓縮技術(shù)的分類四、數(shù)據(jù)壓縮技術(shù)的性能指標

第一節(jié)多媒體數(shù)據(jù)壓縮技術(shù)概述

信息時代的重要特征是信息的數(shù)字化。

早期的計算機系統(tǒng)采用模擬方式表示信息,但存在著明顯的缺點:①經(jīng)常會產(chǎn)生噪音和信號丟失,并且在復(fù)制過程中逐步積累噪音和誤差。②模擬信號不適合數(shù)字計算機加工處理。一、多媒體數(shù)據(jù)壓縮編碼的必要性

數(shù)字化后未經(jīng)壓縮的視頻和音頻等媒體信息的數(shù)據(jù)量是非常大的。1.圖像數(shù)據(jù)量的大小可用下面的公式來計算:

圖像數(shù)據(jù)量=圖像的總像素×色彩深度÷8(單位為Byte,簡寫為B)

例如,一幅640×480、24位(bit)真彩色的圖像,其文件大小為:

640×480×24÷8=921.6KB一、多媒體數(shù)據(jù)壓縮編碼的必要性2.雙通道立體聲激光唱盤,采用脈沖碼調(diào)制采樣,采樣頻率為44.1KHz,采樣精度16位,其一秒鐘時間內(nèi)的采樣數(shù)據(jù)量為: 44.1×1000×16×2÷8=176.4KB

一個650MB的CD—ROM,大約可存1小時的音樂。一、多媒體數(shù)據(jù)壓縮編碼的必要性

3.對動態(tài)圖形和視頻圖像。例如對于彩色電視信號,設(shè)代表光強Y的帶寬為4.2MHz、色彩I為1.5MHz和色飽和度Q為0.5MHz,采樣頻率>2倍原始信號頻率,各分量均被數(shù)字量化為8位,從而1秒鐘電視信號的數(shù)據(jù)量為:(4.2+1.5+0.5)×2×8×1000000÷8=12.3MB一、多媒體數(shù)據(jù)壓縮編碼的必要性

容量為650MB的CD—ROM僅能存1分鐘的原始電視數(shù)據(jù)。若為高清晰度電視(HDTV)其1秒鐘數(shù)據(jù)量約為150MB(1.2Gbps÷8),一張CD—ROM還存不下5秒鐘的HDTV圖像。

巨大數(shù)字化信息的數(shù)據(jù)量對計算機存儲資源和網(wǎng)絡(luò)帶寬有很高的要求,解決的辦法就是要對視、音頻的數(shù)據(jù)進行大量的壓縮。播放時,傳輸少量被壓縮的數(shù)據(jù),接收后再對數(shù)據(jù)進行解壓縮并復(fù)原。1.空間冗余

一幅圖像中一般都有連續(xù)的有規(guī)則物體和規(guī)則背景的顏色分布,使圖像數(shù)據(jù)在空間上表現(xiàn)出相關(guān)性,我們可以通過改變物體表面顏色的像素存儲方式來利用空間相關(guān)性,達到減少數(shù)據(jù)量的目的。例:圖象中的“A”是一個規(guī)則物體。光的亮度、飽和度及顏色都一樣,因此,數(shù)據(jù)A有很大的冗余。

二、多媒體數(shù)據(jù)壓縮的可能性2.時間冗余

圖像序列中的相鄰幀圖像往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同。我們把一幀圖像中的某物體或場景可以由其他幀圖像中的物體或場景進行處理后重構(gòu)出來,可以大大減少時間冗余。3.結(jié)構(gòu)冗余

有些圖像從大體上看存在著非常強的紋理結(jié)構(gòu),這些紋理具有較強的相似性稱此為結(jié)構(gòu)冗余。如草席圖結(jié)構(gòu)上存在冗余。二、多媒體數(shù)據(jù)壓縮的可能性4.知識冗余

有許多圖像的理解與某些基礎(chǔ)知識有相當大的相關(guān)性。這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。

例:人臉的圖像有同樣的結(jié)構(gòu):嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上……

5.視覺冗余

人類視覺系統(tǒng)對圖像場的敏感性是非均勻和非線性的,人眼并不能察覺圖像場的所有變化,人類視覺系統(tǒng)的分辨能力約為64灰度等級,而一般圖像量化采用256灰度等級,這類冗余稱視覺冗余。二、多媒體數(shù)據(jù)壓縮的可能性6.聽覺冗余

人耳對不同頻率的聲音的敏感性是不同的,并不能察覺所有頻率的變化,對某些頻率不必特別關(guān)注,因此存在聽覺冗余。

二、多媒體數(shù)據(jù)壓縮的可能性

根據(jù)多媒體數(shù)據(jù)冗余類型的不同,解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致、質(zhì)量有無損失來進行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。

無失真壓縮法也稱無損壓縮,一般是利用數(shù)據(jù)的統(tǒng)計特性來進行數(shù)據(jù)壓縮,對數(shù)據(jù)流中出現(xiàn)的各種數(shù)據(jù)進行概率統(tǒng)計編碼,使得數(shù)據(jù)流經(jīng)壓縮后形成的代碼流總位數(shù)大大減少。無失真壓縮的特點是壓縮比較小,大約在2∶l至5∶l之間,主要用于文本數(shù)據(jù)、程序代碼和某些要求嚴格不丟失信息的環(huán)境中,常用的無失真壓縮編碼有如哈夫曼編碼等。三、數(shù)據(jù)壓縮技術(shù)的分類三、數(shù)據(jù)壓縮技術(shù)的分類

有失真壓縮法也稱有損壓縮,允許一定程度的失真,會丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復(fù),即解壓縮后并不能完全恢復(fù)成原來的數(shù)據(jù),但是根據(jù)人的視覺和聽覺的主觀評價是可以接受的,有失真壓縮法的冗余壓縮取決于初始信號的類型、前后的相關(guān)性、信號的語義內(nèi)容等,壓縮比可以從幾到幾百倍。常用的有失真壓縮編碼技術(shù)有預(yù)測編碼、變換編碼、模型編碼、混合編碼方法等。主要用于壓縮圖像、聲音等信息。

常用的圖像和視頻壓縮方法如圖2-1所示:

哈夫曼編碼行程編碼算術(shù)編碼LZW編碼圖像和視頻壓縮方法DCT編碼小波變換子帶編碼無失真壓縮有失真壓縮預(yù)測編碼變換編碼模型編碼運動補償混合編碼分形編碼JPEGMPEGH.261三、數(shù)據(jù)壓縮技術(shù)的分類四、數(shù)據(jù)壓縮技術(shù)的性能指標節(jié)省圖象或視頻的存儲容量,增加訪問速度,使數(shù)字視頻能在PC機上實現(xiàn),需要進行視頻和圖象的壓縮。有三個關(guān)鍵參數(shù)評價一個壓縮系統(tǒng)壓縮比圖象質(zhì)量壓縮和解壓的速度

另外也必須考慮每個壓縮算法所需的硬件和軟件。

1.壓縮比壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比)例:512×480,

24bit/pixel(bpp)輸出15000byte輸入=737280byte壓縮比=737280/15000=492.圖象質(zhì)量壓縮方法:

無損壓縮

(圖象質(zhì)量不變)有損壓縮有損壓縮:失真情況很難量化,只能對測試的圖象進行估計。模擬圖象質(zhì)量的指標:信噪比、分辨率必須觀察實際圖象以后估計。3.壓縮解壓速度在許多應(yīng)用中,壓縮和解壓可能不同時用,在不同的位置不同的系統(tǒng)中。所以,壓縮、解壓速度分別估計。靜態(tài)圖象中,壓縮速度沒有解壓速度嚴格;動態(tài)圖象中,壓縮、解壓速度都有要求,因為需實時地從攝像機或VCR中抓取動態(tài)視頻。4.硬軟件系統(tǒng)有些壓縮解壓工作可用軟件實現(xiàn)。設(shè)計系統(tǒng)時必須充分考慮:算法復(fù)雜-壓縮解壓過程長算法簡單-壓縮效果差目前有些特殊硬件可用于加速壓縮/解壓。硬接線系統(tǒng)速度快,但各種選擇在初始設(shè)計時已確定,一般不能更改。因此在設(shè)計硬接線壓縮/解壓系統(tǒng)時必須先將算法標準化。2.2靜態(tài)圖像壓縮國際標準--JPEG2.2.1靜態(tài)圖像壓縮編碼JPEG概況

2.2.2JPEG壓縮編碼的基本系統(tǒng)(1)數(shù)據(jù)塊準備(2)離散余弦正變換DCT(3)量化(4)DCT系數(shù)Z形掃描(5)DC系數(shù)編碼(6)AC系數(shù)編碼2.2.3JPEG壓縮編碼的擴展系統(tǒng)2.2.1靜態(tài)圖像壓縮編碼JPEG概況JPEG(JointPhotographicExpertsGroup)是一個由ISO和IEC兩個組織機構(gòu)聯(lián)合組成的一個專家組,負責制定靜態(tài)的數(shù)字圖象數(shù)據(jù)壓縮編碼標準,因此又稱為JPEG標準。JPEG是一個適用范圍很廣的靜態(tài)圖象數(shù)據(jù)壓縮標準,適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標準。

JPEG是國際上彩色、灰度、靜止圖像的第一個國際標準。用來在低分辨率到高分辨率的較寬范圍內(nèi)支持較高的圖像分辨率。它不僅適用于黑白、彩色照片和印刷圖片(高分辨率)等靜止圖像的壓縮,而且適用于傳送彩色傳真、電話會議、新聞圖片(低分辨率)的靜止圖像的壓縮,以及電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標準。2.2.1靜態(tài)圖像壓縮編碼JPEG概況2.2.1靜態(tài)圖像壓縮編碼JPEG概況它滿足以下要求:(1)達到或接近當前壓縮比圖像保真度的技術(shù)水平,能覆蓋一個較寬的圖像質(zhì)量等級范圍,能得到“很好”到“極好”的評估,與原始圖像相比,人的視覺難以區(qū)分。(2)能適用于任何種類的連續(xù)色調(diào)的圖像,且長寬比都不受限制,同時也不受限于景物內(nèi)容、圖像的復(fù)雜程度和統(tǒng)計特性等。(3)計算機的復(fù)雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實現(xiàn)。(4)JPEG算法具有4種操作方式。第一,為順序編碼,每個圖像分量按從左到右,從上到下掃描,一次掃描完成編碼;第二,累進編碼,圖像編碼在多次掃描中完成,接收端收到圖像是一個由粗糙到清晰的過程;第三,無失真編碼;第四,分層編碼,對圖像按多個分辨率編碼,接收端按其顯示分辨率有選擇地解碼。

變換編碼的基本思路:

1.編碼時略去某些能量很小的高頻分量以降低碼率。

2.變換編碼還可以根據(jù)人眼對不同頻率分量的敏感程度而對不同系數(shù)采用不同的量化臺階,以進一步提高壓縮比。

JPEG開發(fā)的壓縮編碼算法有三種工作方式:

1.基本系統(tǒng)(單次掃描)。

2.擴展系統(tǒng)(常采用累進編碼或分層編碼方式)。

3.無損壓縮編碼。2.2.1靜態(tài)圖像壓縮編碼JPEG概況2.2.2JPEG

壓縮編碼的基本系統(tǒng)

下面是一個基于離散余弦正變換DCT的有失真JPEG編碼的工作原理,圖2-11是基于DCT的JPEG編碼的過程框圖。

2.2.2JPEG

壓縮編碼的基本系統(tǒng)

順序編碼運行方式2.2.3JPEG

壓縮編碼的擴展系統(tǒng)1.基于DCT的累進編碼運行方式

累進編碼方式要掃描多次2.2.3JPEG

壓縮編碼的擴展系統(tǒng)2.分層編碼運行方式

水平方向和垂直方向分辨率以2的倍數(shù)因子下降(降低原始圖像的空間分辨率),導出若干低分辨率的原圖像,分層后再采用JPEG的壓縮編碼方法進行編碼,隨后以上重復(fù)步驟,直到圖像達到完整的分辨率編碼為止。2.2.3JPEG壓縮編碼的擴展系統(tǒng)3.無損壓縮預(yù)測編碼運行方式源圖像數(shù)據(jù)表說明預(yù)測器熵編碼器壓縮后圖像數(shù)據(jù)無損壓縮預(yù)測編碼

運行方式Px2.3運動圖像壓縮編碼的國際標準—MPEG2.3.1運動圖像壓縮編碼—MPEG概況

2.3.2MPEG標準簡介

2.3.3MPEG標準化算法幀間編碼技術(shù)運動補償技術(shù)

2.3.4MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)

2.3.5MPEG音頻簡述MPEG本是MovingPicturesExpertsGroup,動態(tài)圖象專家組的英文縮寫,這個專家組始建于1988年,專門負責為CD建立視頻和音頻標準,其成員均為視頻、音頻及系統(tǒng)領(lǐng)域的技術(shù)專家。對于今天我們所范指的MPEG-X版本,是指一組由ITU(InternationalTelecommunicationsUnion)和ISO(InternationalStandardsOrganization)制定發(fā)布的視頻、音頻、數(shù)據(jù)的壓縮標準。

2.3.1運動圖像壓縮編碼—MPEG概況2.3.1運動圖像壓縮編碼—MPEG概況MPEG的締造者們原先打算開發(fā)四個版本:MPEG1-MPEG4,以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。后由于MPEG3被放棄,所以現(xiàn)存只有三個版本的MPEG:MPEG-1,MPEG-2,MPEG-4。總體來說,MPEG在三方面優(yōu)于其他壓縮/解壓縮方案。首先,它做為一個國際化的標準,MPEG具有很好的兼容性。其次,MPEG能夠比其他算法提供更好的壓縮比,最高可達200:1。再次,MPEG在提供高壓縮比的同時,對數(shù)據(jù)的損失很小。2.3.1運動圖像壓縮編碼—MPEG概況

MPEG專家組工作將整個過程分為三步:

①要求

提出要求有雙重的目的:目標,競爭的原則。

②竟爭

提出了14個不同的方案。

③集中

測試和評價,并綜合出一個最佳方案。2.3.2MPEG

標準簡介MPEG標準有:MPEG-1:1992年正式發(fā)布的數(shù)字電視標準;MPEG-2:數(shù)字電視標準;MPEG-3:于1992年合并到高清晰度電視(HDTV)工作組;MPEG-4:1999年發(fā)布的多媒體應(yīng)用標準;MPEG-7:多媒體內(nèi)容描述接口標準,活動圖像專家組在91年11月提出了“用于數(shù)據(jù)速率大約高達1.5MB/s的數(shù)字存儲媒體的電視圖像和伴音編碼”,作為ISO11172號建議,于92年通過,習慣上通稱MPEG-1標準。此標準主要是針對當時具有這種數(shù)據(jù)輿率的CD-ROM開發(fā)的,用于在CD-ROM上存儲數(shù)字影視和上傳輸數(shù)字影。PAL制為352×288pixel/frame×25frame/sNTSC制為352×240pixel/frame×30frame/s。1.MPEG—1標準MPEG-1主要用于活動圖像的數(shù)字存儲,它包括MPEG-1系統(tǒng)、MPEG-1視頻、MPEG-1音頻三個部分MPEG-1系統(tǒng):將視頻信號及其伴音以可接收的重建質(zhì)量壓縮到約1.5MB/s的碼率,并復(fù)合成一個單一的MPEG位流,同時保證視頻和音頻的同步。MPEG-1視頻:用于滿足日益增長的多媒體存儲與表現(xiàn)的需要,即以一種通用格式在不同的數(shù)字存儲介質(zhì)如VCD、CD、DAT、硬盤和光盤中表示壓縮的視頻。該壓縮算法采用三個基本技術(shù):運動補償預(yù)測編碼、DCT技術(shù)和變字長編碼技術(shù)。MPEG-1音頻:規(guī)定聲音數(shù)據(jù)的編碼和解碼。1.MPEG—1標準1.MPEG—1

標準

設(shè)計目標是把每秒傳送30幀、分辨率為360×240的亮度信號,分辨率為180×120的色度信號的電視圖像壓縮成數(shù)據(jù)率為1.2Mbps的編碼圖像。

MPEG—1電視圖像的壓縮算法采用兩種基本壓縮技術(shù):①為減少時間冗余度,采用16×16個像素組成的圖像塊的運動補償技術(shù)。②為了減少空間冗余度,采用8×8圖像化的DCT變換技術(shù)。1.MPEG—1

標準

聲音壓縮編碼技術(shù)支持高壓縮的音頻數(shù)據(jù)流,其采樣率為48,44.l或22KHz,量化精度為16位的聲音壓縮(如CD-DA音頻1.4Mbps壓縮為0.192Mbps)。支持兩個聲道,可設(shè)置成單聲道(mono)、雙聲道(dual)或立體聲(stereo)。例如采用MPEG—1算法可以把位速率降到0.192Mbps。

MPEG—1系統(tǒng)采用多路復(fù)合技術(shù),把數(shù)字電視圖像和聲音復(fù)合成單一數(shù)據(jù)位流,MPEG—1的數(shù)據(jù)位流分成內(nèi)外兩層,外層為系統(tǒng)層,內(nèi)層為壓縮層。2.MPEG—2

標準MPEG-2的標準號為ISO/IEC13818,標準名稱為“信息技術(shù)—電視圖像和伴音信息通用編碼”。它是聲音和圖像信號數(shù)字化的基礎(chǔ)標準,將廣泛用于數(shù)字電視(包括HDTV)及數(shù)字聲音廣播、數(shù)字圖像與聲音信號的傳輸,多媒體等領(lǐng)域。MPEG-2標準是一個直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標準,MPEG-2視頻利用網(wǎng)絡(luò)提供的更高的寬帶來支持具有更高分辨率圖像的壓縮和更高的圖像質(zhì)量。

2.MPEG—2

標準

設(shè)計目標是把以166Mbps速度傳送每秒30幀、幀分辨率為720×572高分辨率的廣播級視頻圖像,壓縮后的傳送數(shù)據(jù)率約為3Mbps。

MPEG—2標準是HDTV、DVD以及新型數(shù)字式交互有線網(wǎng)所采用的數(shù)字視頻壓縮標準。

MPEG—2標準是MPEG—1標準的擴充、豐富和完善,并與MPEG—1標準相兼容。2.MPEG—2

標準

MPEG—2標準主要分為四部分:

第一部分:系統(tǒng)。第二部分:視頻。第三部分:音頻。第四部分:一致性測試。

MPEG—2標準使計算機處理全彩色、全屏幕、全動態(tài)的視頻圖像,同時也能使有線、無線、CD-ROM等傳輸和存儲介質(zhì)有效地傳送視頻圖像,并且具有CD的音質(zhì),使多媒體技術(shù)與通信和廣播等技術(shù)結(jié)合起來。2.MPEG—2

標準MPEG-2系統(tǒng):規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步性。MPEG-2視頻:定義了不同的功能檔次,每個檔次又分為幾個等級,來適應(yīng)不同應(yīng)用的要求,并保證數(shù)據(jù)的可交換性。目前共有5個檔次,依功能增強逐次為:簡單型、基本型、信噪比可調(diào)型、空間可調(diào)型、增強型。4個等級為:(1)低級(352×288×29.79,面向VCR并與MPEG-1兼容)。(2)基本級(720×460×29.79或720×576×25,面向NTSC制式的視頻廣播信號)。(3)高1440級(1400×1080×30或1400×1152×25,面向HDTV)。(4)高級(1920×1080×30或1920×1152×25,面向HDTV)MPEG-2音頻:MPEG-2音頻的基本特性之一是與MPEG-1音頻向后兼容,并且支持5.1或7.1通道的環(huán)繞立體聲。3.MPEG—4

標準

用來支持低比特率下的多媒體通信(公用電信網(wǎng)14.4~19.2Kbps),還支持用于通信、訪問和數(shù)字視聽數(shù)據(jù)處理的新方法。注重多媒體系統(tǒng)的交互性和靈活性,以最少量的數(shù)據(jù)、極低的音頻/視頻壓縮碼率來顯示建立精確的畫面,達到具有高效編碼、高效存儲與傳播以及可交互操作的特性。3.MPEG—4

標準它是為視聽數(shù)據(jù)的編碼和交互播放開發(fā)算法和工具,是一個數(shù)據(jù)速率很低的多媒體通信標準。其目標是要在異構(gòu)網(wǎng)絡(luò)環(huán)境下能夠高度可靠地工作,并且具有很強的交互功能。為此它引入了對象基表達的要領(lǐng),用來表達視聽對象(AVO),并擴充了編碼的數(shù)據(jù)類型,由自然數(shù)據(jù)對象擴展到計算機生成的合成數(shù)據(jù)對象,采用合成對象、自然對象混合編碼算法。在實現(xiàn)交互功能和重用對象中引入了組合,合成和編排等重要要領(lǐng)4.MPEG—7

標準

正式名稱為多媒體內(nèi)容描述接口。

MPEG—7標準只規(guī)定信息內(nèi)容描述格式,而不規(guī)定如何從原始的多媒體資料中抽取內(nèi)容描述和查詢、檢索方法。MPEG—7標準不針對特定的應(yīng)用領(lǐng)域,而是盡可能支持廣泛的應(yīng)用領(lǐng)域。下圖表示了MPEG-7的處理鏈(ProcessingChain),這是高度抽象的方框圖。MPEG-7的應(yīng)用領(lǐng)域很廣,包括:數(shù)字圖書館。例如,圖像目錄、音樂詞典等。多媒體目錄服務(wù)。例如,黃頁等。廣播式媒體的選擇。例如,無線電頻道、TV頻道等。個人電子新聞服務(wù)、多媒體創(chuàng)作等。教育、娛樂、新聞、旅游、醫(yī)療和電子商務(wù)等。視頻壓縮算法用到了三項基本技術(shù):①幀間編碼技術(shù)和基于塊的運動補償技術(shù)。②空間壓縮(也稱為幀內(nèi)壓縮)JPEG技術(shù)。③熵編碼,使用Huffman編碼技術(shù)。MPEG標準所用的編碼模型與JPEG的編碼模型類似,分為5個階段:

幀間編碼和運動補償、變換編碼、量化、直流分量DC及交流分量AC的編碼和熵編碼。2.3.3MPEG標準化算法1.幀間編碼技術(shù)

利用的時間相關(guān)性可進一步消除視頻其相鄰幀之間具有冗余信息,提高壓縮比。

將圖像分成三種類型:

1.參考幀(I)(JPEG編碼)以自身圖像的相關(guān)性進行壓縮處理,必須要傳送。

2.預(yù)測幀(P)

用前面的參考幀或預(yù)測幀作為參照圖像信息進行預(yù)測編碼,并可作為下一個預(yù)測幀(B幀圖像或P幀圖像)的參照圖像信息。但因此可能引起預(yù)測誤差。1.幀間編碼技術(shù)3.雙向預(yù)測幀(B)

又稱插補幀,在預(yù)測時,既可以使用前面或后面的視頻幀(I參考幀,P預(yù)測幀)進行雙向預(yù)測,也可以同時使用前后兩個視頻幀進行預(yù)測編碼,但本身不能作為下一個預(yù)測幀的參照圖像信息。(200∶1)在編碼時,先對參考幀進行變換編碼,然后對預(yù)測幀進行編碼,再對兩者之間的雙向預(yù)測幀進行編碼,這個過程對隨后的下一個預(yù)測幀和雙向預(yù)測幀重復(fù),直到完成所有幀的編碼為止。1.幀間編碼技術(shù)

采用下述四種預(yù)測技術(shù):①幀內(nèi)編碼

②前向預(yù)測③后向預(yù)測④雙向預(yù)測

圖3-20顯示一個典型的視頻圖像序列次序。

IBBPBBPBBPBBPBBIBB123456789101112131415161718

I幀和P幀間有兩個B幀每十五幀有一幅I幀圖像(0.5秒)1.幀間編碼技術(shù)

編碼器的輸出視頻圖像序列排列順序。1423756108IPBBPBBPB9131112161415……

BPBBIBB……

發(fā)送端編碼器的輸出到接收端解碼器的輸入端,經(jīng)解碼器的輸出,又恢復(fù)為圖3-12編碼器輸入順序顯示。2.運動補償技術(shù)(塊)

運動矢量選擇二維16×16像素塊作為一個的運動矢量處理。運動矢量又稱為宏塊,它有不同的類型:可以是I幀內(nèi)型,F(xiàn)前向預(yù)測型、B后向預(yù)測型和A平均值(雙向預(yù)測)型。

概念:

當前圖像可看作是前一幀圖像位移后的結(jié)果,其位移的內(nèi)容包括運動方向和運動幅度。運動補償方法是跟蹤畫面內(nèi)的運動情況并對其加以補償后,與當前的圖像宏塊值相減得到預(yù)測誤差,再進行編碼、傳送。2.運動補償技術(shù)(塊)

討論預(yù)測器計算表達式,設(shè)前一參照幀為I0,后一參照幀為I2,當前幀為I1的示意圖,求預(yù)測值。

F前向B后向2.運動補償技術(shù)(塊)

表3-13給出了I幀內(nèi)塊、F前向預(yù)測塊、B后向預(yù)測塊和A平均值塊的預(yù)測器的計算表達式。為當前幀I1的值,預(yù)測誤差I(lǐng)FBA

2.3.4

MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)圖像序列頭圖像組圖像組序列尾

圖像組圖像組頭圖象I、P、B圖象I、P、B圖像頭宏塊片宏塊片宏塊片頭宏塊宏塊18×828×838×848×858×868×88×8視頻序列層圖像組層宏塊片層宏塊層YCbCr圖像層塊層幀間編碼運動補償JPEGMPEG—2視頻數(shù)據(jù)流的六層結(jié)構(gòu)圖視頻數(shù)據(jù)流之間的關(guān)系圖圖像組層宏塊層8×8像素塊層

宏塊片層視頻序列層圖像層2.3.4

MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)1.視頻序列層:

圖像序列頭包含了圖像寬度、高度、像素長寬比、幀率、位率、緩沖區(qū)尺寸、量化矩陣等信息。

2.圖像組層:

圖像組頭包含時間代碼等信息,圖像組中的第一個圖像總是I圖像幀。

3.圖像層:

由圖像頭及多個宏塊片構(gòu)成的。圖像頭包含該圖像的編碼類型及碼表選擇等信息。2.3.4

MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)4.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論