視頻壓縮標(biāo)準(zhǔn)

上傳人：石*** IP屬地：廣東上傳時間：2023-06-13 格式：PPT 頁數(shù)：74 大?。?.69MB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩69頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

視頻壓縮標(biāo)準(zhǔn)1第一頁，共七十四頁，編輯于2023年，星期四主要內(nèi)容視頻壓縮標(biāo)準(zhǔn)發(fā)展歷史H.26X系列壓縮標(biāo)準(zhǔn)簡介MPEG系列壓縮標(biāo)準(zhǔn)簡介2第二頁，共七十四頁，編輯于2023年，星期四視頻壓縮標(biāo)準(zhǔn)發(fā)展歷史ITU:ISO/IEC:H.261H.262H.263H.263+H.264MPEG1MPEG2MPEG4(Part2)MPEG7MPEG21MPEG4(Part10)3第三頁，共七十四頁，編輯于2023年，星期四視頻壓縮標(biāo)準(zhǔn)對比H.261p×64kb/s視頻編碼標(biāo)準(zhǔn)

時間1990年12月輸入176×144(QCIF)352×288(CIF)幀速率可變<=30輸出p×64kb/s(p=1,2,…,32)壓縮率20~30小于MPEG1壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測與分塊DCT相結(jié)合的混合編碼應(yīng)用可視電話、視頻會議等對稱應(yīng)用4第四頁，共七十四頁，編輯于2023年，星期四視頻壓縮標(biāo)準(zhǔn)對比（續(xù)）MPEG1數(shù)據(jù)傳輸速率為1.5Mb/s的數(shù)字存儲媒體運(yùn)動圖像及其伴音編碼標(biāo)準(zhǔn)時間1993年8月輸入視頻：352×240×30，352×288×25音頻：32、44.1、48kHz的線性PCM輸出1.5Mb/s、32-384Kb/s(音頻)壓縮率20~30壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測（單向預(yù)測＋雙向預(yù)測）＋DCT應(yīng)用VCD、MP3、局域網(wǎng)視頻傳輸5第五頁，共七十四頁，編輯于2023年，星期四視頻壓縮標(biāo)準(zhǔn)對比（續(xù)）MPEG2H.262運(yùn)動圖像及其伴音通用編碼標(biāo)準(zhǔn)

時間1994年11月輸入352×288～1920×1152采用頻率為16、22.05、24、32、44.1、48kHz的線性PCM、支持5.1聲道

輸出1.5－80Mb/s、8-640Kb/s(音頻)壓縮率30－40壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測（單雙向預(yù)測）＋DCT、可伸縮性、前向兼容應(yīng)用DVD、DVB、HDTV6第六頁，共七十四頁，編輯于2023年，星期四視頻壓縮標(biāo)準(zhǔn)對比（續(xù)）H.263H.263+甚低碼率通信的視頻編碼標(biāo)準(zhǔn)時間1996年3月、1998年1月輸入QCIF、CIF、128×96(SubQCIF)、704×576(4CIF)、1408×1152(16CIF)輸出30kb/s～壓縮率H.263+>H.263>MPEG2壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測（單雙向預(yù)測）＋DCT局部算法改進(jìn)可伸縮性應(yīng)用通用電話交換網(wǎng)、局域網(wǎng)的視頻通信7第七頁，共七十四頁，編輯于2023年，星期四視頻壓縮標(biāo)準(zhǔn)對比（續(xù)）MPEG4(Part2)MPEG4Visual甚低碼率活動圖像及其伴音編碼標(biāo)準(zhǔn)時間1999年輸入≧176×144的多種分辨率格式輸出4.6Kb/s～64Kb/s壓縮率≧100壓縮算法基于對象的新一代編碼技術(shù)，注重交互性，即可包含自然對象，又可包含人工合成對象應(yīng)用可應(yīng)用范圍很廣、目前多用于因特網(wǎng)視頻傳輸、流媒體應(yīng)用8第八頁，共七十四頁，編輯于2023年，星期四視頻壓縮標(biāo)準(zhǔn)對比（續(xù)）H.264MPEG4(Part10)MPEG4AVC時間2003年5月輸入多種分辨率格式輸出壓縮率壓縮率最高的視頻壓縮標(biāo)準(zhǔn)，比MPEG4Visual節(jié)約50％的碼率壓縮算法基于傳統(tǒng)框架的混合編碼系統(tǒng)，只是做了局部優(yōu)化。更注重編碼效率和可靠性應(yīng)用視頻廣播、視頻通信和存儲媒體（CDDVD）等多種應(yīng)用9第九頁，共七十四頁，編輯于2023年，星期四MPEG-1視頻壓縮標(biāo)準(zhǔn)

MPEG-1標(biāo)準(zhǔn)號為ISO/IEC11172，它由五部分組成：MPEG-1系統(tǒng)（MPEG-1Systems）：規(guī)定視頻數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步合成技術(shù)MPEG-1視頻編碼標(biāo)準(zhǔn)（MPEG-1Video）MPEG-1音頻編碼標(biāo)準(zhǔn)（MPEG-1Audio）MPEG-1一致性測試：詳細(xì)說明如何測試比特數(shù)據(jù)流和解碼器是否滿足MPEG-1前3個部分(Part1，2和3)中所規(guī)定的要求。MPEG-1軟件模擬：一個技術(shù)報告，給出了軟件執(zhí)行MPEG1前3個部分的運(yùn)行結(jié)果。10第十頁，共七十四頁，編輯于2023年，星期四MPEG-1視頻壓縮標(biāo)準(zhǔn)輸入、輸出指標(biāo)：MPEG視頻編碼器352×288×25×8×1.5352×240×30×8×1.530Mb/s1.15Mb/s26:111第十一頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法運(yùn)動補(bǔ)償幀間預(yù)測(temporal)＋DCT(spatial)12第十二頁，共七十四頁，編輯于2023年，星期四Frame113第十三頁，共七十四頁，編輯于2023年，星期四Frame214第十四頁，共七十四頁，編輯于2023年，星期四ResidualFrame15第十五頁，共七十四頁，編輯于2023年，星期四象素運(yùn)動軌跡16第十六頁，共七十四頁，編輯于2023年，星期四Block-basedMotionEstimationandCompensation17第十七頁，共七十四頁，編輯于2023年，星期四Block-basedMotionEstimationandCompensation18第十八頁，共七十四頁，編輯于2023年，星期四16×16BlockSize19第十九頁，共七十四頁，編輯于2023年，星期四8×8BlockSize20第二十頁，共七十四頁，編輯于2023年，星期四4×4BlockSize21第二十一頁，共七十四頁，編輯于2023年，星期四Sub－pixelMotionEstimationandCompensation子像素運(yùn)動估值與補(bǔ)償22第二十二頁，共七十四頁，編輯于2023年，星期四Sub－pixelMotionEstimationandCompensation23第二十三頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼器框架24第二十四頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼器框架分塊25第二十五頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法運(yùn)動圖像序列圖片組（GOP）IBBPBBP…圖片條（Slice）宏塊MacroBlock1616塊（Block）88分割：26第二十六頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法GOP的組成：一個內(nèi)幀是一個隨機(jī)訪問點(diǎn)。B圖像不能作為其它圖像的參考幀。I：內(nèi)幀P：單向預(yù)測幀B：雙向預(yù)測幀27第二十七頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法視頻類型IPB平均MPEG-1CIF150000b50000b20000b38000bMPEG-2601400000b200000b80000b130000b為了在圖像質(zhì)量和數(shù)據(jù)速率之間作出調(diào)整，MPEG編碼器允許（1）選擇內(nèi)幀I的頻率和位置，（2）選擇I和P之間雙向預(yù)測幀B的數(shù)目。28第二十八頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法運(yùn)動補(bǔ)償技術(shù)在宏塊一級工作。宏塊分為四類：幀內(nèi)宏塊，簡稱I塊前向預(yù)測宏塊，簡稱F塊后向預(yù)測宏塊，簡稱B塊平均宏塊，簡稱A塊

I圖像只包含I塊，P圖像只包含I塊和F塊，B圖像可以包含4種類型的宏塊。29第二十九頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法I圖像幀的壓縮算法：在空間方向上（內(nèi)幀），MPEG－1壓縮采用JPEG壓縮算法來去掉冗余信息。30第三十頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法P圖像幀的壓縮算法：對于P宏塊，MPEG－1采用運(yùn)動補(bǔ)償幀間預(yù)測算法來去掉時間軸上的冗余信息。31第三十一頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法運(yùn)動矢量的概念32第三十二頁，共七十四頁，編輯于2023年，星期四MPEG1視頻壓縮算法基于塊的運(yùn)動矢量估值算法——塊匹配法33第三十三頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼算法塊匹配法（BlockMatchingAlgorithm）需要解決兩個關(guān)鍵問題：（1）匹配準(zhǔn)則（2）搜索算法34第三十四頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼算法BMA中常用的匹配準(zhǔn)則：絕對值：均方誤差：平均絕對幀差：35第三十五頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼算法BMA常用搜索算法—二維對數(shù)搜索法：36第三十六頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼算法BMA常用搜索算法—三步搜索法：37第三十七頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼算法BMA常用搜索算法—對偶搜索法：38第三十八頁，共七十四頁，編輯于2023年，星期四MPEG1視頻編碼算法B圖像幀的壓縮算法：39第三十九頁，共七十四頁，編輯于2023年，星期四40第四十頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮標(biāo)準(zhǔn)輸入、輸出指標(biāo)：MPEG音頻編碼器32kHz,44.1kHz,48kHz16位PCM32kb/s~384kb/s層次壓縮率數(shù)據(jù)速率kb/s延遲（ms）14:138419/5026:1~8:1192~25635/100310:1~12:1112~12859/15041第四十一頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性：聽閾－頻率曲線42第四十二頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性：一個強(qiáng)純音會掩蔽在其附近同時發(fā)聲的弱純音，這種特性稱為頻域掩蔽，也稱同時掩蔽43第四十三頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性：一個強(qiáng)純音會掩蔽在其附近同時發(fā)聲的弱純音，這種特性稱為頻域掩蔽，也稱同時掩蔽在時間上相鄰的聲音之間也有掩蔽現(xiàn)象，稱為時域掩蔽。時域掩蔽又分為超前掩蔽和滯后掩蔽。44第四十四頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮算法感知子帶壓縮算法算法以心理聲學(xué)模型為基礎(chǔ)，主要利用了聽覺閾值和聽覺掩蔽特性45第四十五頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮算法感知子帶壓縮算法1、將音頻信號用濾波器組分成32個子帶；2、用FFT將子帶變換到頻率域3、根據(jù)心理聲學(xué)模型估計各個子帶的感知閾值4、根據(jù)對感知閾值的估計對各個子帶進(jìn)行比特分配和量化。MP3采用了與MP1、MP2不同的濾波器和心理聲學(xué)模型。46第四十六頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮算法MPEG-1Audio層1和層2編碼器和解碼器的結(jié)構(gòu)47第四十七頁，共七十四頁，編輯于2023年，星期四MPEG-1音頻壓縮算法MPEG-1Audio層3編碼器和解碼器的結(jié)構(gòu)48第四十八頁，共七十四頁，編輯于2023年，星期四H.261概述H.261也稱P×64，這是ITU-T（前身為CCITT）最早制定的關(guān)于視頻編碼的國際標(biāo)準(zhǔn)。考慮到ISDN的傳輸碼率以64kbps為單位，因此以p×64kbps（p＝1～30）作為為H.261的標(biāo)準(zhǔn)碼率。H.261標(biāo)準(zhǔn)主要用于電視電話和電視會議。它支持QCIF（p=1、2）、CIF（p>2）兩種圖像輸入格式。49第四十九頁，共七十四頁，編輯于2023年，星期四H.261解決的問題第一是編碼算法問題。確立了一種合理的、保證圖像質(zhì)量且為各國圖像編碼專家所公認(rèn)的統(tǒng)一的算法。算法必須能夠?qū)崟r操作，解碼延時要短。第二是與PCM標(biāo)準(zhǔn)兼容的問題。編解碼器以64～1920kb／s的工作速率去覆蓋N-ISDN或PCM一次群的通道。第三，解決電視制式不同的問題。為了使同一標(biāo)準(zhǔn)既能用于PAL（625）和NTSC（525）兩種電視制式系統(tǒng)，源編碼基于中間格式CIF格式，所以輸入輸必須經(jīng)轉(zhuǎn)換到CIF或QCIF格式再進(jìn)行源編碼。50第五十頁，共七十四頁，編輯于2023年，星期四視頻編碼圖像格式一覽表51第五十一頁，共七十四頁，編輯于2023年，星期四H.261的信源編碼框架52第五十二頁，共七十四頁，編輯于2023年，星期四H.261的信源編碼算法一、將預(yù)測誤差或輸入圖像劃分成為8*8的象素塊。進(jìn)一步，將4個亮度像塊和兩個在空間位置上與之重疊的色差像塊符合成一個16*16的宏塊（MB）。二、對于幀序列中的第一副圖像或景物變換后的第一副圖像，采用幀內(nèi)變換編碼：利用8*8的DCT實現(xiàn)。各DCT系數(shù)經(jīng)過線性量化、變長編碼后進(jìn)入緩沖器，根據(jù)緩沖器的上溢和下溢，來反饋調(diào)節(jié)量化器的量化步長，以控制視頻編碼位流使之與信倒速率相匹配。53第五十三頁，共七十四頁，編輯于2023年，星期四H.261的信源編碼算法幀間預(yù)測采用混合方法：利用運(yùn)動補(bǔ)償預(yù)測，當(dāng)預(yù)測誤差超過某個門限后，對誤差做DCT、視覺加權(quán)量化及熵編碼。運(yùn)動矢量信息編碼后也送到緩沖器中。DCT去除空間冗余度，而使用有運(yùn)動補(bǔ)償?shù)膸g預(yù)測來去除時間上的冗余。這是一個典型的幀內(nèi)／幀間自適應(yīng)預(yù)測加DCT變換的混合算法。54第五十四頁，共七十四頁，編輯于2023年，星期四H.261的圖像復(fù)用編碼H.261源編碼后進(jìn)行圖像復(fù)用編碼，實際上是把比特流分成圖像(Picture)，像塊組(GOB：Groupofblocks)，宏塊(MB：Macroblock)和像塊(Block)，并附加相應(yīng)的信息。按照CIF格式，每幀CIF圖像包含12個GOB，每個GOB包含33個MB，每個MB包含4個亮度數(shù)據(jù)塊和各1個Cb、Cr色度塊，每個B包含8*8象素。55第五十五頁，共七十四頁，編輯于2023年，星期四H.261的圖像復(fù)用編碼H.261數(shù)據(jù)流結(jié)構(gòu)56第五十六頁，共七十四頁，編輯于2023年，星期四H.261視頻壓縮算法利用二維DCT減少圖像的空間域的冗余度；利用運(yùn)動補(bǔ)償預(yù)測減少圖像的時間域冗余度；利用視覺加權(quán)量化減少圖像"灰度域"的冗余度；利用熵編碼來減少圖像的"頻率域"的冗余度。57第五十七頁，共七十四頁，編輯于2023年，星期四H.261與MPEG-1的對比58第五十八頁，共七十四頁，編輯于2023年，星期四MPEG-2通用視頻壓縮標(biāo)準(zhǔn)

MPEG-2的標(biāo)準(zhǔn)號為ISO/IEC13818，它主要由以下幾部分組成：MPEG-2系統(tǒng)（MPEG-1Systems）MPEG-2視頻編碼標(biāo)準(zhǔn)（MPEG-2Video）MPEG-2音頻編碼標(biāo)準(zhǔn)（MPEG-2Audio）MPEG-2高級音頻編碼標(biāo)準(zhǔn)（MPEG-2AAC）與MPEG-1一樣，MPEG-2只規(guī)定了碼流結(jié)構(gòu)和解碼器算法規(guī)則，而把實際編碼器模型向設(shè)計者開放，以提供更多的選擇性和自由度。59第五十九頁，共七十四頁，編輯于2023年，星期四MPEG-2Video

MPEG-2Video與MPEG-1的基本編碼算法相同，只是增加了如下功能：（1）能夠在很寬的范圍內(nèi)對不同分辨率和不同輸出比特率的圖像信號有效的進(jìn)行壓縮。（2）處理隔行掃描的視頻信號的能力。（3）多樣化的取樣模式：4:2:0，4:2:2，4:4:4（4）可伸縮（Scalable）的視頻編碼模式：

Ⅰ

編碼時可以在圖像質(zhì)量和數(shù)據(jù)速率之間作出調(diào)整Ⅱ

解碼時只對碼流的一部分進(jìn)行解碼和對碼流的全部進(jìn)行解碼能夠分別獲得不同質(zhì)量的重建圖像。60第六十頁，共七十四頁，編輯于2023年，星期四可伸縮性編碼模式（1）信噪比伸縮性（Signal-to-NoiseScalability）（2）空間分辨率伸縮性（SpatialScalability）（3）時間分辨率伸縮性（TemporalScalability）61第六十一頁，共七十四頁，編輯于2023年，星期四MPEG-2Video為了適應(yīng)不同應(yīng)用的需要，MPEG-2引入了配置（profiles）和等級（levels）的概念，每種配置定義一套新的算法，而每一個等級指定一套參數(shù)范圍(如圖像大小、幀速率和位速率)。62第六十二頁，共七十四頁，編輯于2023年，星期四MPEG-2VideoMPEG-2的配置配置（profile）特征簡單(Simple)4:2:0取樣，僅用I、P幀，支持隨機(jī)存取，不支持可伸縮性基本(Main)以上參數(shù)，加上支持B幀信噪比可變以上參數(shù)，加上信噪比可變性空間分辨率可變以上參數(shù)，加上空間分辨率可變性高檔(High)以上參數(shù)，4:2:2采樣方式63第六十三頁，共七十四頁，編輯于2023年，星期四MPEG-2VideoMPEG-2的等級等級（level）特征低級（Low）352×288，30幀/s，1.2Mb/s基本級（Main）720×576，30幀/s，4~15Mb/s高級（High）14401440×1152，60幀/s，60Mb/s高級（High）1920×1152，60幀/s，80Mb/s64第六十四頁，共七十四頁，編輯于2023年，星期四MPEG-2VideoMPEG-2的配置與等級的組合配置Profile等級低中高1440高1920簡單●

基本●

●

信噪比●

●

空間●

高●

●

65第六十五頁，共七十四頁，編輯于2023年，星期四MPEG-2Audio

MPEG-2標(biāo)準(zhǔn)委員會定義了兩種聲音數(shù)據(jù)壓縮格式：（1）MPEG-2Audio，或者稱為MPEG-2多通道(Multichannel)聲音，它與MPEG-1Audio是兼容的，所以又稱為MPEG-2BC(BackwardCompatible)。（2）另一種稱為MPEG-2AAC(AdvancedAudioCoding)，因為它與MPEG-1聲音格式不兼容，因此通常稱為非后向兼容MPEG-2NBC(Non-Backward-Compatible)標(biāo)準(zhǔn)。66第六十六頁，共七十四頁，編輯于2023年，星期四MPEG-2BCAudio(1)增加了16kHz,22.05kHz和24kHz采樣頻率(2)擴(kuò)展了編碼器的輸出速率范圍，由32～384kb/s擴(kuò)展到8～640kb/s(3)增加了聲道數(shù)，支持5.1聲道和7.1聲道的環(huán)繞聲。(4)MPEG-2還支持LinearPCM(線性PCM)和DolbyAC-3(AudioCodeNumber3)編碼MPEG-2BCAudio和MPEG-1Audio標(biāo)準(zhǔn)都使用相同種類的編譯碼器，層-1,-2和-3的結(jié)構(gòu)也相同。MPEG-2聲音標(biāo)準(zhǔn)與MPEG-1標(biāo)準(zhǔn)相比，MPEG-2做了如下擴(kuò)充：67第六十七頁，共七十四頁，編輯于2023年，星期四MPEG-2AACAAC支持的采用頻率可從8kHz到96kHz，AAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標(biāo)準(zhǔn)可支持48個主聲道、16個低頻音效加強(qiáng)通道LFE(lowfrequencyeffects)、16個配音聲道(overdubchannel)或者叫做多語言聲道(multilingualchannel)和16個數(shù)據(jù)流。MPEG-2AAC在壓縮比為11:1，即每個聲道的數(shù)據(jù)率為(44.1×16)/11=64kb/s，而5

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

視頻壓縮標(biāo)準(zhǔn)

文檔簡介

溫馨提示

最新文檔

評論

視頻壓縮標(biāo)準(zhǔn)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔