視頻壓縮標(biāo)準(zhǔn)_第1頁
視頻壓縮標(biāo)準(zhǔn)_第2頁
視頻壓縮標(biāo)準(zhǔn)_第3頁
視頻壓縮標(biāo)準(zhǔn)_第4頁
視頻壓縮標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

視頻壓縮標(biāo)準(zhǔn)1第一頁,共七十四頁,編輯于2023年,星期四主要內(nèi)容視頻壓縮標(biāo)準(zhǔn)發(fā)展歷史H.26X系列壓縮標(biāo)準(zhǔn)簡介MPEG系列壓縮標(biāo)準(zhǔn)簡介2第二頁,共七十四頁,編輯于2023年,星期四視頻壓縮標(biāo)準(zhǔn)發(fā)展歷史ITU:ISO/IEC:H.261H.262H.263H.263+H.264MPEG1MPEG2MPEG4(Part2)MPEG7MPEG21MPEG4(Part10)3第三頁,共七十四頁,編輯于2023年,星期四視頻壓縮標(biāo)準(zhǔn)對比H.261p×64kb/s視頻編碼標(biāo)準(zhǔn)

時間1990年12月輸入176×144(QCIF)352×288(CIF)幀速率可變<=30輸出p×64kb/s(p=1,2,…,32)壓縮率20~30小于MPEG1壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測與分塊DCT相結(jié)合的混合編碼應(yīng)用可視電話、視頻會議等對稱應(yīng)用4第四頁,共七十四頁,編輯于2023年,星期四視頻壓縮標(biāo)準(zhǔn)對比(續(xù))MPEG1數(shù)據(jù)傳輸速率為1.5Mb/s的數(shù)字存儲媒體運(yùn)動圖像及其伴音編碼標(biāo)準(zhǔn)時間1993年8月輸入視頻:352×240×30,352×288×25音頻:32、44.1、48kHz的線性PCM輸出1.5Mb/s、32-384Kb/s(音頻)壓縮率20~30壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測(單向預(yù)測+雙向預(yù)測)+DCT應(yīng)用VCD、MP3、局域網(wǎng)視頻傳輸5第五頁,共七十四頁,編輯于2023年,星期四視頻壓縮標(biāo)準(zhǔn)對比(續(xù))MPEG2H.262運(yùn)動圖像及其伴音通用編碼標(biāo)準(zhǔn)

時間1994年11月輸入352×288~1920×1152采用頻率為16、22.05、24、32、44.1、48kHz的線性PCM、支持5.1聲道

輸出1.5-80Mb/s、8-640Kb/s(音頻)壓縮率30-40壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測(單雙向預(yù)測)+DCT、可伸縮性、前向兼容應(yīng)用DVD、DVB、HDTV6第六頁,共七十四頁,編輯于2023年,星期四視頻壓縮標(biāo)準(zhǔn)對比(續(xù))H.263H.263+甚低碼率通信的視頻編碼標(biāo)準(zhǔn)時間1996年3月、1998年1月輸入QCIF、CIF、128×96(SubQCIF)、704×576(4CIF)、1408×1152(16CIF)輸出30kb/s~壓縮率H.263+>H.263>MPEG2壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測(單雙向預(yù)測)+DCT局部算法改進(jìn)可伸縮性應(yīng)用通用電話交換網(wǎng)、局域網(wǎng)的視頻通信7第七頁,共七十四頁,編輯于2023年,星期四視頻壓縮標(biāo)準(zhǔn)對比(續(xù))MPEG4(Part2)MPEG4Visual甚低碼率活動圖像及其伴音編碼標(biāo)準(zhǔn)時間1999年輸入≧176×144的多種分辨率格式輸出4.6Kb/s~64Kb/s壓縮率≧100壓縮算法基于對象的新一代編碼技術(shù),注重交互性,即可包含自然對象,又可包含人工合成對象應(yīng)用可應(yīng)用范圍很廣、目前多用于因特網(wǎng)視頻傳輸、流媒體應(yīng)用8第八頁,共七十四頁,編輯于2023年,星期四視頻壓縮標(biāo)準(zhǔn)對比(續(xù))H.264MPEG4(Part10)MPEG4AVC時間2003年5月輸入多種分辨率格式輸出壓縮率壓縮率最高的視頻壓縮標(biāo)準(zhǔn),比MPEG4Visual節(jié)約50%的碼率壓縮算法基于傳統(tǒng)框架的混合編碼系統(tǒng),只是做了局部優(yōu)化。更注重編碼效率和可靠性應(yīng)用視頻廣播、視頻通信和存儲媒體(CDDVD)等多種應(yīng)用9第九頁,共七十四頁,編輯于2023年,星期四MPEG-1視頻壓縮標(biāo)準(zhǔn)

MPEG-1標(biāo)準(zhǔn)號為ISO/IEC11172,它由五部分組成:MPEG-1系統(tǒng)(MPEG-1Systems):規(guī)定視頻數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步合成技術(shù)MPEG-1視頻編碼標(biāo)準(zhǔn)(MPEG-1Video)MPEG-1音頻編碼標(biāo)準(zhǔn)(MPEG-1Audio)MPEG-1一致性測試:詳細(xì)說明如何測試比特數(shù)據(jù)流和解碼器是否滿足MPEG-1前3個部分(Part1,2和3)中所規(guī)定的要求。MPEG-1軟件模擬:一個技術(shù)報告,給出了軟件執(zhí)行MPEG1前3個部分的運(yùn)行結(jié)果。10第十頁,共七十四頁,編輯于2023年,星期四MPEG-1視頻壓縮標(biāo)準(zhǔn)輸入、輸出指標(biāo):MPEG視頻編碼器352×288×25×8×1.5352×240×30×8×1.530Mb/s1.15Mb/s26:111第十一頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測(temporal)+DCT(spatial)12第十二頁,共七十四頁,編輯于2023年,星期四Frame113第十三頁,共七十四頁,編輯于2023年,星期四Frame214第十四頁,共七十四頁,編輯于2023年,星期四ResidualFrame15第十五頁,共七十四頁,編輯于2023年,星期四象素運(yùn)動軌跡16第十六頁,共七十四頁,編輯于2023年,星期四Block-basedMotionEstimationandCompensation17第十七頁,共七十四頁,編輯于2023年,星期四Block-basedMotionEstimationandCompensation18第十八頁,共七十四頁,編輯于2023年,星期四16×16BlockSize19第十九頁,共七十四頁,編輯于2023年,星期四8×8BlockSize20第二十頁,共七十四頁,編輯于2023年,星期四4×4BlockSize21第二十一頁,共七十四頁,編輯于2023年,星期四Sub-pixelMotionEstimationandCompensation子像素運(yùn)動估值與補(bǔ)償22第二十二頁,共七十四頁,編輯于2023年,星期四Sub-pixelMotionEstimationandCompensation23第二十三頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼器框架24第二十四頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼器框架分塊25第二十五頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運(yùn)動圖像序列圖片組(GOP)IBBPBBP…圖片條(Slice)宏塊MacroBlock1616塊(Block)88分割:26第二十六頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法GOP的組成:一個內(nèi)幀是一個隨機(jī)訪問點(diǎn)。B圖像不能作為其它圖像的參考幀。I:內(nèi)幀P:單向預(yù)測幀B:雙向預(yù)測幀27第二十七頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法視頻類型IPB平均MPEG-1CIF150000b50000b20000b38000bMPEG-2601400000b200000b80000b130000b為了在圖像質(zhì)量和數(shù)據(jù)速率之間作出調(diào)整,MPEG編碼器允許(1)選擇內(nèi)幀I的頻率和位置,(2)選擇I和P之間雙向預(yù)測幀B的數(shù)目。28第二十八頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運(yùn)動補(bǔ)償技術(shù)在宏塊一級工作。宏塊分為四類:幀內(nèi)宏塊,簡稱I塊前向預(yù)測宏塊,簡稱F塊后向預(yù)測宏塊,簡稱B塊平均宏塊,簡稱A塊

I圖像只包含I塊,P圖像只包含I塊和F塊,B圖像可以包含4種類型的宏塊。29第二十九頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法I圖像幀的壓縮算法:在空間方向上(內(nèi)幀),MPEG-1壓縮采用JPEG壓縮算法來去掉冗余信息。30第三十頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法P圖像幀的壓縮算法:對于P宏塊,MPEG-1采用運(yùn)動補(bǔ)償幀間預(yù)測算法來去掉時間軸上的冗余信息。31第三十一頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運(yùn)動矢量的概念32第三十二頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法基于塊的運(yùn)動矢量估值算法——塊匹配法33第三十三頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法塊匹配法(BlockMatchingAlgorithm)需要解決兩個關(guān)鍵問題:(1)匹配準(zhǔn)則(2)搜索算法34第三十四頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA中常用的匹配準(zhǔn)則:絕對值:均方誤差:平均絕對幀差:35第三十五頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA常用搜索算法—二維對數(shù)搜索法:36第三十六頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA常用搜索算法—三步搜索法:37第三十七頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA常用搜索算法—對偶搜索法:38第三十八頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法B圖像幀的壓縮算法:39第三十九頁,共七十四頁,編輯于2023年,星期四40第四十頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮標(biāo)準(zhǔn)輸入、輸出指標(biāo):MPEG音頻編碼器32kHz,44.1kHz,48kHz16位PCM32kb/s~384kb/s層次壓縮率數(shù)據(jù)速率kb/s延遲(ms)14:138419/5026:1~8:1192~25635/100310:1~12:1112~12859/15041第四十一頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性:聽閾-頻率曲線42第四十二頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性:一個強(qiáng)純音會掩蔽在其附近同時發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時掩蔽43第四十三頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性:一個強(qiáng)純音會掩蔽在其附近同時發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時掩蔽在時間上相鄰的聲音之間也有掩蔽現(xiàn)象,稱為時域掩蔽。時域掩蔽又分為超前掩蔽和滯后掩蔽。44第四十四頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法感知子帶壓縮算法算法以心理聲學(xué)模型為基礎(chǔ),主要利用了聽覺閾值和聽覺掩蔽特性45第四十五頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法感知子帶壓縮算法1、將音頻信號用濾波器組分成32個子帶;2、用FFT將子帶變換到頻率域3、根據(jù)心理聲學(xué)模型估計各個子帶的感知閾值4、根據(jù)對感知閾值的估計對各個子帶進(jìn)行比特分配和量化。MP3采用了與MP1、MP2不同的濾波器和心理聲學(xué)模型。46第四十六頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法MPEG-1Audio層1和層2編碼器和解碼器的結(jié)構(gòu)47第四十七頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法MPEG-1Audio層3編碼器和解碼器的結(jié)構(gòu)48第四十八頁,共七十四頁,編輯于2023年,星期四H.261概述H.261也稱P×64,這是ITU-T(前身為CCITT)最早制定的關(guān)于視頻編碼的國際標(biāo)準(zhǔn)。考慮到ISDN的傳輸碼率以64kbps為單位,因此以p×64kbps(p=1~30)作為為H.261的標(biāo)準(zhǔn)碼率。H.261標(biāo)準(zhǔn)主要用于電視電話和電視會議。它支持QCIF(p=1、2)、CIF(p>2)兩種圖像輸入格式。49第四十九頁,共七十四頁,編輯于2023年,星期四H.261解決的問題第一是編碼算法問題。確立了一種合理的、保證圖像質(zhì)量且為各國圖像編碼專家所公認(rèn)的統(tǒng)一的算法。算法必須能夠?qū)崟r操作,解碼延時要短。第二是與PCM標(biāo)準(zhǔn)兼容的問題。編解碼器以64~1920kb/s的工作速率去覆蓋N-ISDN或PCM一次群的通道。第三,解決電視制式不同的問題。為了使同一標(biāo)準(zhǔn)既能用于PAL(625)和NTSC(525)兩種電視制式系統(tǒng),源編碼基于中間格式CIF格式,所以輸入輸必須經(jīng)轉(zhuǎn)換到CIF或QCIF格式再進(jìn)行源編碼。50第五十頁,共七十四頁,編輯于2023年,星期四視頻編碼圖像格式一覽表51第五十一頁,共七十四頁,編輯于2023年,星期四H.261的信源編碼框架52第五十二頁,共七十四頁,編輯于2023年,星期四H.261的信源編碼算法一、將預(yù)測誤差或輸入圖像劃分成為8*8的象素塊。進(jìn)一步,將4個亮度像塊和兩個在空間位置上與之重疊的色差像塊符合成一個16*16的宏塊(MB)。二、對于幀序列中的第一副圖像或景物變換后的第一副圖像,采用幀內(nèi)變換編碼:利用8*8的DCT實現(xiàn)。各DCT系數(shù)經(jīng)過線性量化、變長編碼后進(jìn)入緩沖器,根據(jù)緩沖器的上溢和下溢,來反饋調(diào)節(jié)量化器的量化步長,以控制視頻編碼位流使之與信倒速率相匹配。53第五十三頁,共七十四頁,編輯于2023年,星期四H.261的信源編碼算法幀間預(yù)測采用混合方法:利用運(yùn)動補(bǔ)償預(yù)測,當(dāng)預(yù)測誤差超過某個門限后,對誤差做DCT、視覺加權(quán)量化及熵編碼。運(yùn)動矢量信息編碼后也送到緩沖器中。DCT去除空間冗余度,而使用有運(yùn)動補(bǔ)償?shù)膸g預(yù)測來去除時間上的冗余。這是一個典型的幀內(nèi)/幀間自適應(yīng)預(yù)測加DCT變換的混合算法。54第五十四頁,共七十四頁,編輯于2023年,星期四H.261的圖像復(fù)用編碼H.261源編碼后進(jìn)行圖像復(fù)用編碼,實際上是把比特流分成圖像(Picture),像塊組(GOB:Groupofblocks),宏塊(MB:Macroblock)和像塊(Block),并附加相應(yīng)的信息。按照CIF格式,每幀CIF圖像包含12個GOB,每個GOB包含33個MB,每個MB包含4個亮度數(shù)據(jù)塊和各1個Cb、Cr色度塊,每個B包含8*8象素。55第五十五頁,共七十四頁,編輯于2023年,星期四H.261的圖像復(fù)用編碼H.261數(shù)據(jù)流結(jié)構(gòu)56第五十六頁,共七十四頁,編輯于2023年,星期四H.261視頻壓縮算法利用二維DCT減少圖像的空間域的冗余度;利用運(yùn)動補(bǔ)償預(yù)測減少圖像的時間域冗余度;利用視覺加權(quán)量化減少圖像"灰度域"的冗余度;利用熵編碼來減少圖像的"頻率域"的冗余度。57第五十七頁,共七十四頁,編輯于2023年,星期四H.261與MPEG-1的對比58第五十八頁,共七十四頁,編輯于2023年,星期四MPEG-2通用視頻壓縮標(biāo)準(zhǔn)

MPEG-2的標(biāo)準(zhǔn)號為ISO/IEC13818,它主要由以下幾部分組成:MPEG-2系統(tǒng)(MPEG-1Systems)MPEG-2視頻編碼標(biāo)準(zhǔn)(MPEG-2Video)MPEG-2音頻編碼標(biāo)準(zhǔn)(MPEG-2Audio)MPEG-2高級音頻編碼標(biāo)準(zhǔn)(MPEG-2AAC)與MPEG-1一樣,MPEG-2只規(guī)定了碼流結(jié)構(gòu)和解碼器算法規(guī)則,而把實際編碼器模型向設(shè)計者開放,以提供更多的選擇性和自由度。59第五十九頁,共七十四頁,編輯于2023年,星期四MPEG-2Video

MPEG-2Video與MPEG-1的基本編碼算法相同,只是增加了如下功能:(1)能夠在很寬的范圍內(nèi)對不同分辨率和不同輸出比特率的圖像信號有效的進(jìn)行壓縮。(2)處理隔行掃描的視頻信號的能力。(3)多樣化的取樣模式:4:2:0,4:2:2,4:4:4(4)可伸縮(Scalable)的視頻編碼模式:

編碼時可以在圖像質(zhì)量和數(shù)據(jù)速率之間作出調(diào)整Ⅱ

解碼時只對碼流的一部分進(jìn)行解碼和對碼流的全部進(jìn)行解碼能夠分別獲得不同質(zhì)量的重建圖像。60第六十頁,共七十四頁,編輯于2023年,星期四可伸縮性編碼模式(1)信噪比伸縮性(Signal-to-NoiseScalability)(2)空間分辨率伸縮性(SpatialScalability)(3)時間分辨率伸縮性(TemporalScalability)61第六十一頁,共七十四頁,編輯于2023年,星期四MPEG-2Video為了適應(yīng)不同應(yīng)用的需要,MPEG-2引入了配置(profiles)和等級(levels)的概念,每種配置定義一套新的算法,而每一個等級指定一套參數(shù)范圍(如圖像大小、幀速率和位速率)。62第六十二頁,共七十四頁,編輯于2023年,星期四MPEG-2VideoMPEG-2的配置配置(profile)特征簡單(Simple)4:2:0取樣,僅用I、P幀,支持隨機(jī)存取,不支持可伸縮性基本(Main)以上參數(shù),加上支持B幀信噪比可變以上參數(shù),加上信噪比可變性空間分辨率可變以上參數(shù),加上空間分辨率可變性高檔(High)以上參數(shù),4:2:2采樣方式63第六十三頁,共七十四頁,編輯于2023年,星期四MPEG-2VideoMPEG-2的等級等級(level)特征低級(Low)352×288,30幀/s,1.2Mb/s基本級(Main)720×576,30幀/s,4~15Mb/s高級(High)14401440×1152,60幀/s,60Mb/s高級(High)1920×1152,60幀/s,80Mb/s64第六十四頁,共七十四頁,編輯于2023年,星期四MPEG-2VideoMPEG-2的配置與等級的組合配置Profile等級低中高1440高1920簡單●

基本●

信噪比●

空間●

高●

65第六十五頁,共七十四頁,編輯于2023年,星期四MPEG-2Audio

MPEG-2標(biāo)準(zhǔn)委員會定義了兩種聲音數(shù)據(jù)壓縮格式:(1)MPEG-2Audio,或者稱為MPEG-2多通道(Multichannel)聲音,它與MPEG-1Audio是兼容的,所以又稱為MPEG-2BC(BackwardCompatible)。(2)另一種稱為MPEG-2AAC(AdvancedAudioCoding),因為它與MPEG-1聲音格式不兼容,因此通常稱為非后向兼容MPEG-2NBC(Non-Backward-Compatible)標(biāo)準(zhǔn)。66第六十六頁,共七十四頁,編輯于2023年,星期四MPEG-2BCAudio(1)增加了16kHz,22.05kHz和24kHz采樣頻率(2)擴(kuò)展了編碼器的輸出速率范圍,由32~384kb/s擴(kuò)展到8~640kb/s(3)增加了聲道數(shù),支持5.1聲道和7.1聲道的環(huán)繞聲。(4)MPEG-2還支持LinearPCM(線性PCM)和DolbyAC-3(AudioCodeNumber3)編碼MPEG-2BCAudio和MPEG-1Audio標(biāo)準(zhǔn)都使用相同種類的編譯碼器,層-1,-2和-3的結(jié)構(gòu)也相同。MPEG-2聲音標(biāo)準(zhǔn)與MPEG-1標(biāo)準(zhǔn)相比,MPEG-2做了如下擴(kuò)充:67第六十七頁,共七十四頁,編輯于2023年,星期四MPEG-2AACAAC支持的采用頻率可從8kHz到96kHz,AAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標(biāo)準(zhǔn)可支持48個主聲道、16個低頻音效加強(qiáng)通道LFE(lowfrequencyeffects)、16個配音聲道(overdubchannel)或者叫做多語言聲道(multilingualchannel)和16個數(shù)據(jù)流。MPEG-2AAC在壓縮比為11:1,即每個聲道的數(shù)據(jù)率為(44.1×16)/11=64kb/s,而5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論