




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、北郵信息理論北郵信息理論與技術(shù)教研中心與技術(shù)教研中心 BUPT Information Theory & Technology Education & Research Center 第四章第四章 信源編碼與數(shù)據(jù)壓縮信源編碼與數(shù)據(jù)壓縮BUPT Information Theory & Technology Education & Research Center 2n 信源編碼是主要利用信源的統(tǒng)計(jì)特性,解除信信源編碼是主要利用信源的統(tǒng)計(jì)特性,解除信源源相關(guān)性相關(guān)性,去掉信源冗余信息,從而達(dá)到壓縮,去掉信源冗余信息,從而達(dá)到壓縮信源輸出的信息率,提高系統(tǒng)有效性的目的
2、。信源輸出的信息率,提高系統(tǒng)有效性的目的。獨(dú)立獨(dú)立概率相同概率相同 n 第二代移動(dòng)通信主要是語音業(yè)務(wù),所以信源編第二代移動(dòng)通信主要是語音業(yè)務(wù),所以信源編碼主要指語音壓縮編碼。碼主要指語音壓縮編碼。n 第三代移動(dòng)通信中的信源編碼將不僅包含語音第三代移動(dòng)通信中的信源編碼將不僅包含語音壓縮編碼,還包含各類圖像壓縮編碼和多媒體壓縮編碼,還包含各類圖像壓縮編碼和多媒體數(shù)據(jù)壓縮等方面內(nèi)容。數(shù)據(jù)壓縮等方面內(nèi)容。 BUPT Information Theory & Technology Education & Research Center 34.1.1引言語音壓縮編碼大致可以分為以下三類:語
3、音壓縮編碼大致可以分為以下三類:n波形編碼波形編碼n參量編碼參量編碼n混和編碼混和編碼波形編碼質(zhì)量最高,其質(zhì)量幾乎與壓縮處理之前相波形編碼質(zhì)量最高,其質(zhì)量幾乎與壓縮處理之前相同,可以適用于公用骨干同,可以適用于公用骨干(固定固定)通信網(wǎng)。通信網(wǎng)。參量編碼質(zhì)量最差,不能用于骨干通信網(wǎng),而僅適參量編碼質(zhì)量最差,不能用于骨干通信網(wǎng),而僅適合于特殊通信系統(tǒng),比如軍事與保密通信系統(tǒng)。合于特殊通信系統(tǒng),比如軍事與保密通信系統(tǒng)?;旌途幋a質(zhì)量介于兩者之間,目前主要用于移動(dòng)通混和編碼質(zhì)量介于兩者之間,目前主要用于移動(dòng)通信網(wǎng)。信網(wǎng)。BUPT Information Theory & Technology
4、Education & Research Center 41. 波形編碼的性能估計(jì)波形編碼的性能估計(jì) 利用信息論中連續(xù)(模擬)有記憶信源的信息率失真R(D)函數(shù)理論可以分析波形編碼的性能。 信息率失真R(D)為:2221(1)( )log2R DD上式的計(jì)算結(jié)果如下表所示 :信噪比信噪比(dB)35322825232017R(D)(bit/樣點(diǎn)樣點(diǎn)) 43.52.52.34 21.51壓縮倍數(shù)壓縮倍數(shù)K22.28 3.23.42 45.38BUPT Information Theory & Technology Education & Research Center 5
5、n 由上述分析結(jié)果可以得到如下結(jié)論:當(dāng)語由上述分析結(jié)果可以得到如下結(jié)論:當(dāng)語音質(zhì)量達(dá)到進(jìn)入公網(wǎng)要求標(biāo)準(zhǔn)時(shí),音質(zhì)量達(dá)到進(jìn)入公網(wǎng)要求標(biāo)準(zhǔn)時(shí),即即 ,其其 倍,倍,n 若進(jìn)一步考慮實(shí)際語音分布與主觀因素的若進(jìn)一步考慮實(shí)際語音分布與主觀因素的影響影響(因?yàn)檎龖B(tài)分布因?yàn)檎龖B(tài)分布R(D)其壓縮倍數(shù)可以進(jìn)其壓縮倍數(shù)可以進(jìn)一步增大,取一步增大,取 (保守值保守值)這時(shí)語音速率這時(shí)語音速率可以從未壓縮的可以從未壓縮的PCM 64Kbps降至降至1/4速率速率的的16Kbps。目前已實(shí)用化的。目前已實(shí)用化的DPCM為為32Kbps。 226dBD3.4K 4K BUPT Information Theory &a
6、mp; Technology Education & Research Center 62. 參量編碼的性能估計(jì)參量編碼的性能估計(jì) 782128 2256 語音可以采用各種不同形式的參量來表達(dá)。為了分析方便,采用最基本的參量“音素”。以英語音素為例進(jìn)行分析。英語中共有音素 。按照通常講話速率,每秒大約平均發(fā)送10個(gè)音素。由信息量計(jì)算公式,對(duì)于等概率事件有: ,N為總組合數(shù),則: 最后可計(jì)算出壓縮比K為:2logIN10122loglog (256)80INbps(上限)10222loglog (128)70INbps(下限)64914 80070 80KbpsKbps倍BUPT Inf
7、ormation Theory & Technology Education & Research Center 73. 混合編碼的性能估計(jì)混合編碼的性能估計(jì) 顯然混合編碼的理論壓縮比是介于上述兩類編碼之間,且與語音質(zhì)量需求有關(guān)。若要求混合編碼偏重于個(gè)性特征,則其壓縮比靠近波形編碼的壓縮比值,若要求混和編碼偏重于共性,則其壓縮比靠近于參量編碼。BUPT Information Theory & Technology Education & Research Center 84.1.2數(shù)字通信中的語音編碼n 高質(zhì)量的混合編碼是移動(dòng)通信中的優(yōu)選方案。高質(zhì)量的混合編碼
8、是移動(dòng)通信中的優(yōu)選方案。n 在低數(shù)據(jù)比特率、高壓縮比的混合編碼中,數(shù)在低數(shù)據(jù)比特率、高壓縮比的混合編碼中,數(shù)據(jù)數(shù)據(jù)比特率、語音質(zhì)量、算法復(fù)雜度與處理據(jù)數(shù)據(jù)比特率、語音質(zhì)量、算法復(fù)雜度與處理時(shí)延是四個(gè)主要參量。時(shí)延是四個(gè)主要參量。BUPT Information Theory & Technology Education & Research Center 91. 數(shù)據(jù)比特率數(shù)據(jù)比特率(bps) 數(shù)據(jù)比特率越低壓縮倍數(shù)就越大,可通信的話路數(shù)數(shù)據(jù)比特率越低壓縮倍數(shù)就越大,可通信的話路數(shù) 也就越多,移動(dòng)通信系統(tǒng)也就越有效。也就越多,移動(dòng)通信系統(tǒng)也就越有效。 數(shù)據(jù)比特率降低,語音質(zhì)量也
9、隨之相應(yīng)降低,為了數(shù)據(jù)比特率降低,語音質(zhì)量也隨之相應(yīng)降低,為了補(bǔ)償質(zhì)量的下降,可采用提高設(shè)備硬件復(fù)雜度和算法補(bǔ)償質(zhì)量的下降,可采用提高設(shè)備硬件復(fù)雜度和算法軟件復(fù)雜度的辦法。軟件復(fù)雜度的辦法。 降低比特速率另一種有效方法是采用降低比特速率另一種有效方法是采用可變速率可變速率的自的自適應(yīng)傳輸,它可以大大降低語音的平均傳送率。適應(yīng)傳輸,它可以大大降低語音的平均傳送率。 還可以進(jìn)一步采用還可以進(jìn)一步采用語音激活技術(shù)語音激活技術(shù),充分利用至少,充分利用至少3/8的有效空隙,可獲得大致約的有效空隙,可獲得大致約2.67dB的有效增益。的有效增益。 BUPT Information Theory &
10、 Technology Education & Research Center 102. 語音質(zhì)量語音質(zhì)量 度量方法不外乎客觀與主觀兩個(gè)角度:度量方法不外乎客觀與主觀兩個(gè)角度: 客觀度量可以采用客觀度量可以采用信噪比信噪比、誤碼率誤碼率、誤幀率誤幀率,相對(duì)而言簡單、可行。相對(duì)而言簡單、可行。 主觀度量是由人耳主觀特性來判斷,比客觀度主觀度量是由人耳主觀特性來判斷,比客觀度量復(fù)雜。目前國際上常采用的主觀評(píng)判方法稱為量復(fù)雜。目前國際上常采用的主觀評(píng)判方法稱為MOS方法方法 。 BUPT Information Theory & Technology Education &
11、Research Center 113. 復(fù)雜度與處理時(shí)延復(fù)雜度與處理時(shí)延 語音編碼硬件復(fù)雜度取決于語音編碼硬件復(fù)雜度取決于DSP處理能力,而軟件復(fù)處理能力,而軟件復(fù)雜度則主要體現(xiàn)在算法復(fù)雜度上。算法復(fù)雜度增大,也雜度則主要體現(xiàn)在算法復(fù)雜度上。算法復(fù)雜度增大,也會(huì)帶來更長的運(yùn)算時(shí)間和更大的處理時(shí)延會(huì)帶來更長的運(yùn)算時(shí)間和更大的處理時(shí)延 。 參數(shù)參數(shù) 指標(biāo)指標(biāo)編碼器類型編碼器類型數(shù)據(jù)比特率數(shù)據(jù)比特率(Kbps)復(fù)雜度復(fù)雜度(MIPS)時(shí)延時(shí)延(ms)質(zhì)量質(zhì)量(MOS)脈碼調(diào)制脈碼調(diào)制PCM640.0104.3自適應(yīng)差分脈碼調(diào)制自適應(yīng)差分脈碼調(diào)制ADPCM320.104.1自適應(yīng)自帶編碼自適應(yīng)自帶編
12、碼161254多脈沖線性預(yù)測編碼多脈沖線性預(yù)測編碼810353.5隨機(jī)激勵(lì)線性預(yù)測編碼隨機(jī)激勵(lì)線性預(yù)測編碼4100353.5線性預(yù)測聲碼器線性預(yù)測聲碼器21353.1 如右所示,我如右所示,我們給出幾種已知們給出幾種已知低數(shù)據(jù)比特率語低數(shù)據(jù)比特率語音編碼的上述四音編碼的上述四個(gè)參數(shù)與性能比個(gè)參數(shù)與性能比較表格。較表格。BUPT Information Theory & Technology Education & Research Center 124.2移動(dòng)通信中的語音編碼n本節(jié)將結(jié)合第二代本節(jié)將結(jié)合第二代(2G)的的GSM與與IS-95系統(tǒng)以及第三代系統(tǒng)以及第三代(3G)的
13、的WCDMA和和CDMA2000等不同系統(tǒng)所采用的語音等不同系統(tǒng)所采用的語音編碼具體方案,著重從原理上來闡述編碼具體方案,著重從原理上來闡述移動(dòng)通信中的語音編碼。移動(dòng)通信中的語音編碼。BUPT Information Theory & Technology Education & Research Center 134.2.1 GSM系統(tǒng)的RPE-LTP聲碼器原理n RPE-LTP聲碼器采用等間隔,相位與幅度優(yōu)化的規(guī)聲碼器采用等間隔,相位與幅度優(yōu)化的規(guī)則脈沖作為激勵(lì)源,以便使合成后的波形更接近原則脈沖作為激勵(lì)源,以便使合成后的波形更接近原始信號(hào)。該方案結(jié)合長期預(yù)測以消除信號(hào)的冗
14、余度,始信號(hào)。該方案結(jié)合長期預(yù)測以消除信號(hào)的冗余度,降低編碼速率,同時(shí)其算法較簡單,計(jì)算量適中且降低編碼速率,同時(shí)其算法較簡單,計(jì)算量適中且易于硬件實(shí)現(xiàn)。易于硬件實(shí)現(xiàn)。 REP-LTP編碼器編碼器包括下包括下 列五個(gè)部列五個(gè)部分:預(yù)處理,線性分:預(yù)處理,線性預(yù)測分析,短時(shí)分預(yù)測分析,短時(shí)分析濾波,長時(shí)預(yù)測析濾波,長時(shí)預(yù)測以及規(guī)則脈沖激勵(lì)以及規(guī)則脈沖激勵(lì)編碼,其編碼器原編碼,其編碼器原理如左圖所示。理如左圖所示。 BUPT Information Theory & Technology Education & Research Center 144.2.2 IS-96系統(tǒng)的QCE
15、LP聲碼器n QCELP聲碼器是聲碼器是Qualcomm公司提出的用公司提出的用于于IS-96系統(tǒng)的語音編碼標(biāo)準(zhǔn)。系統(tǒng)的語音編碼標(biāo)準(zhǔn)。n QCELP方案的編碼原理如下圖所示。方案的編碼原理如下圖所示。BUPT Information Theory & Technology Education & Research Center 15n TIA/EIA IS-96的的QCELP語音編譯碼系統(tǒng)如語音編譯碼系統(tǒng)如下圖所示:下圖所示:BUPT Information Theory & Technology Education & Research Center 164.
16、2.3 CDMA2000系統(tǒng)的EVRC聲碼器n EVRC(Enhanced Variable Rate Codec)即增強(qiáng)即增強(qiáng)型可變速率語音編碼器,是由美國電信工業(yè)協(xié)型可變速率語音編碼器,是由美國電信工業(yè)協(xié)會(huì)會(huì)TIA/EIA于于1996年提出的年提出的CDMA2000系統(tǒng)的系統(tǒng)的語音編碼方案。語音編碼方案。 n EVRC編碼器基于碼激勵(lì)線性預(yù)測,與傳統(tǒng)編碼器基于碼激勵(lì)線性預(yù)測,與傳統(tǒng)CELP算法主要區(qū)別為:它能基于語音能量、算法主要區(qū)別為:它能基于語音能量、背景噪聲和其它語音特性動(dòng)態(tài)調(diào)整編碼速率。背景噪聲和其它語音特性動(dòng)態(tài)調(diào)整編碼速率。 BUPT Information Theory &am
17、p; Technology Education & Research Center 17n EVRC編碼器結(jié)構(gòu)如編碼器結(jié)構(gòu)如右所示,具體由以下右所示,具體由以下幾部分組成:幾部分組成:高通濾波器 線性預(yù)測器的參數(shù)提取模塊 速率確定模塊 參數(shù)量化模塊 參數(shù)編碼模塊 BUPT Information Theory & Technology Education & Research Center 184.2.4 WCDMA系統(tǒng)中的AMR聲碼器n AMR是第三代移動(dòng)通信中是第三代移動(dòng)通信中WCDMA優(yōu)選的語音編優(yōu)選的語音編碼方案,其基本思路是碼方案,其基本思路是聯(lián)合自適應(yīng)調(diào)整信
18、源和信道聯(lián)合自適應(yīng)調(diào)整信源和信道編碼模式來適應(yīng)當(dāng)前信道條件與業(yè)務(wù)量大小編碼模式來適應(yīng)當(dāng)前信道條件與業(yè)務(wù)量大小。 n AMR編碼自適應(yīng)有兩個(gè)方面:信源和信道。對(duì)于編碼自適應(yīng)有兩個(gè)方面:信源和信道。對(duì)于信道存在兩類選擇:信道存在兩類選擇:全速率全速率(FR):22.8Kbps半速率半速率(HR): 11.4Kbps,而對(duì)于而對(duì)于FR和和HR不同信道模式分別有不同信道模式分別有8種和種和6種信源編碼種信源編碼速率速率 。BUPT Information Theory & Technology Education & Research Center 194.2.4 WCDMA系統(tǒng)中的A
19、MR聲碼器AMR編碼器結(jié)構(gòu)如下圖所示:BUPT Information Theory & Technology Education & Research Center 204.3圖像壓縮編碼n在第一、二代移動(dòng)通信中主要是語音業(yè)在第一、二代移動(dòng)通信中主要是語音業(yè)務(wù),從務(wù),從2.5G開始就逐步引入數(shù)據(jù)業(yè)務(wù),開始就逐步引入數(shù)據(jù)業(yè)務(wù),第三代業(yè)務(wù)推廣為含語音、數(shù)據(jù)與圖像第三代業(yè)務(wù)推廣為含語音、數(shù)據(jù)與圖像的多媒體業(yè)務(wù)。為了適應(yīng)第三代業(yè)務(wù)的的多媒體業(yè)務(wù)。為了適應(yīng)第三代業(yè)務(wù)的需求,本節(jié)介紹圖像壓縮編碼。需求,本節(jié)介紹圖像壓縮編碼。 BUPT Information Theory & T
20、echnology Education & Research Center 214.3.1圖像編碼標(biāo)準(zhǔn)簡介n 圖像的信息量遠(yuǎn)大于語圖像的信息量遠(yuǎn)大于語音、文字、傳真和一般音、文字、傳真和一般數(shù)據(jù),它所占用頻帶也數(shù)據(jù),它所占用頻帶也比其它類型業(yè)務(wù)寬。經(jīng)比其它類型業(yè)務(wù)寬。經(jīng)過四十余年的努力,圖過四十余年的努力,圖像編碼已形成了如右所像編碼已形成了如右所示的系列化標(biāo)準(zhǔn)。示的系列化標(biāo)準(zhǔn)。標(biāo)準(zhǔn)標(biāo)準(zhǔn)壓縮比與數(shù)據(jù)比壓縮比與數(shù)據(jù)比特率特率應(yīng)用范圍應(yīng)用范圍JPEG230倍倍有灰度級(jí)的多值靜止有灰度級(jí)的多值靜止圖片圖片JPEG-2000250倍倍移動(dòng)通信中靜止圖片、移動(dòng)通信中靜止圖片、數(shù)字照相與打印、數(shù)字
21、照相與打印、電子商務(wù)電子商務(wù)H.261p64Kbps,其,其中中p=1,2,30ISDN視頻會(huì)議視頻會(huì)議H.2638Kbps1.5MbpsPOTS視頻電話、桌視頻電話、桌面視頻電話、移面視頻電話、移動(dòng)視頻電話動(dòng)視頻電話MPEG-1不超過不超過1.5MbpsVCD、光盤存貯、光盤存貯、視頻監(jiān)控、消費(fèi)視頻監(jiān)控、消費(fèi)視頻視頻MPEG-21.5Mbps35Mbps數(shù)字電視、有線電視、數(shù)字電視、有線電視、衛(wèi)星電視、視頻衛(wèi)星電視、視頻存貯、存貯、HDTVMPEG-48Kbps35Mbps交互式視頻、因特網(wǎng)、交互式視頻、因特網(wǎng)、移動(dòng)視頻、移動(dòng)視頻、2D/3D計(jì)算機(jī)圖計(jì)算機(jī)圖形形BUPT Informatio
22、n Theory & Technology Education & Research Center 22n 目前制定視頻壓縮編譯碼國際標(biāo)準(zhǔn)的有兩大國際組織:目前制定視頻壓縮編譯碼國際標(biāo)準(zhǔn)的有兩大國際組織:一個(gè)是一個(gè)是ITU-T(以前稱以前稱CCITT),即國際電聯(lián)的電信標(biāo)準(zhǔn),即國際電聯(lián)的電信標(biāo)準(zhǔn)部,它制定的標(biāo)準(zhǔn)通常稱為建議標(biāo)準(zhǔn),一般用部,它制定的標(biāo)準(zhǔn)通常稱為建議標(biāo)準(zhǔn),一般用H.26X表示。另一個(gè)是表示。另一個(gè)是ISO/IEC,即國際標(biāo)準(zhǔn)化組織和國際,即國際標(biāo)準(zhǔn)化組織和國際電工委員會(huì),它所制定的一般就稱為標(biāo)準(zhǔn)。通常采用電工委員會(huì),它所制定的一般就稱為標(biāo)準(zhǔn)。通常采用JPEG和和MP
23、EGX表示。表示。n 目前,視頻壓縮編碼大致可以分為兩代,第一代視頻目前,視頻壓縮編碼大致可以分為兩代,第一代視頻壓縮編碼包括壓縮編碼包括JPEG、MPEG-1、MPEG-2、H.261、H.263等等;第二代視頻壓縮編碼包括等等;第二代視頻壓縮編碼包括JPEG-2000、MPEG-4、MPEG-7、H.264等等。等等。 BUPT Information Theory & Technology Education & Research Center 234.3.2靜止圖像壓縮標(biāo)準(zhǔn)JPEGn 對(duì)于靜止圖像,國際標(biāo)準(zhǔn)化組織對(duì)于靜止圖像,國際標(biāo)準(zhǔn)化組織ISO和原來的和原來的國際電報(bào)
24、電話咨詢委員會(huì)國際電報(bào)電話咨詢委員會(huì)CCITT(現(xiàn)改名為現(xiàn)改名為ITU-T)以及國際電工委員會(huì)以及國際電工委員會(huì)IEC共同組織了一共同組織了一個(gè)圖片專家聯(lián)合小組個(gè)圖片專家聯(lián)合小組(Joint Photographic Experts Group)研究制定標(biāo)準(zhǔn),稱它為研究制定標(biāo)準(zhǔn),稱它為JPEG標(biāo)標(biāo)準(zhǔn)。準(zhǔn)。 n JPEG標(biāo)準(zhǔn)分為兩類:基于標(biāo)準(zhǔn)分為兩類:基于DPCM與熵編碼的與熵編碼的無失真編碼系統(tǒng);基于離散余弦變換無失真編碼系統(tǒng);基于離散余弦變換DCT的限的限失真編碼系統(tǒng)。失真編碼系統(tǒng)。 BUPT Information Theory & Technology Education &am
25、p; Research Center 241.基于基于DPCM的無失真編碼的無失真編碼 無失真編碼又稱為無損信源編碼,它是一種不產(chǎn)生信息損失的編碼,一般其壓縮倍數(shù)比較低,為4倍左右。 JPEG無失真編碼的發(fā)送與接收系統(tǒng)實(shí)現(xiàn)原理如右圖所示。 無失真JPEG編碼從原理上看,主要是以DPCM為基礎(chǔ),再加上哈夫曼編碼或者算術(shù)編碼的熵編碼方式。 BUPT Information Theory & Technology Education & Research Center 252.基于離散余弦變換基于離散余弦變換DCT的限失真編碼的限失真編碼 限失真編碼屬于有損信源編碼,以離散余弦變換D
26、CT為基礎(chǔ),再加上限失真量化編碼和熵編碼,它能夠以較少的比特?cái)?shù)獲得較好的圖像質(zhì)量。限失真JPEG編碼器原理如下所示: BUPT Information Theory & Technology Education & Research Center 26n 限失真限失真JPEG譯碼器原理如下所示:譯碼器原理如下所示:BUPT Information Theory & Technology Education & Research Center 274.3.3 準(zhǔn)活動(dòng)圖像視頻壓縮標(biāo)準(zhǔn)H.26Xn 編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)H.26X是由是由ITU-T制定的建議標(biāo)準(zhǔn),制定的建議
27、標(biāo)準(zhǔn),自上世紀(jì)八十年代中期開始現(xiàn)已制定了自上世紀(jì)八十年代中期開始現(xiàn)已制定了H.261、H262、H.263,最近剛完成了,最近剛完成了H.264建議標(biāo)準(zhǔn)。建議標(biāo)準(zhǔn)。其中其中H.262和和MPEG-2視頻編、譯碼標(biāo)準(zhǔn)是同視頻編、譯碼標(biāo)準(zhǔn)是同一個(gè)標(biāo)準(zhǔn),這是兩大國際組織的共同成果。而一個(gè)標(biāo)準(zhǔn),這是兩大國際組織的共同成果。而H.264也是兩大組織聯(lián)手制定的,被稱為也是兩大組織聯(lián)手制定的,被稱為“MPEG-4 Visual Part 10”,也就是,也就是“MPEG-4 AVC(Advanced Video Coding)”,2003年年3月月被正式確定為國際標(biāo)準(zhǔn)。被正式確定為國際標(biāo)準(zhǔn)。 BUPT In
28、formation Theory & Technology Education & Research Center 281. H.261編碼標(biāo)準(zhǔn)簡介編碼標(biāo)準(zhǔn)簡介 H.261主要用于傳輸會(huì)議電話及可視電話信號(hào),它將碼率確定為:p64Kbps,其中p=1,2,30。其對(duì)應(yīng)的數(shù)據(jù)比特率為64Kbps1.92Mbps。 H.261編碼器原理圖如左所示。BUPT Information Theory & Technology Education & Research Center 29n H.261的譯碼器原理如下圖所示:的譯碼器原理如下圖所示: H.261編譯碼中采用的
29、關(guān)鍵技術(shù)有:通過幀間預(yù)測消除圖像在時(shí)間域內(nèi)的相關(guān)性;通過DCT消除圖像在空間域內(nèi)的相關(guān)性;利用人眼視覺特性進(jìn)行可變步長及自適應(yīng)量化;利用變長碼(VLC)實(shí)現(xiàn)與信源統(tǒng)計(jì)特性匹配;利用輸出(入)的緩存實(shí)現(xiàn)平滑數(shù)據(jù)流傳輸。 BUPT Information Theory & Technology Education & Research Center 302. H.263編碼標(biāo)準(zhǔn)簡介編碼標(biāo)準(zhǔn)簡介 H.263系列適合于PSTN、無線網(wǎng)絡(luò)和因特網(wǎng)。H.263信源編碼算法的核心仍然是H.261標(biāo)準(zhǔn)中所采用的編碼算法,其原理框圖也與H.261基本上一樣。 H.263與H.261的區(qū)別如下:H
30、.261只能工作于CIF與QCIF兩類格式,而H.263則可工作于5種格式:CIF、QCIF、SubQCIF、4CIF、16CIFH.263吸收了MPEG等標(biāo)準(zhǔn)中有效、合理的部分H.263在H.261基本編碼算法基礎(chǔ)上又提供了四種可選模式,以進(jìn)一步提高編碼效率BUPT Information Theory & Technology Education & Research Center 314.3.4 活動(dòng)圖像視頻壓縮標(biāo)準(zhǔn)MPEG n 這類標(biāo)準(zhǔn)是由國際標(biāo)準(zhǔn)化組織這類標(biāo)準(zhǔn)是由國際標(biāo)準(zhǔn)化組織ISO和國際電工和國際電工委員會(huì)于委員會(huì)于1998年成立的一個(gè)研究活動(dòng)圖像的專年成立的一個(gè)研
31、究活動(dòng)圖像的專家組家組MPEG(Moving Picture Experts Group)負(fù)負(fù)責(zé)制定的?,F(xiàn)已制定了責(zé)制定的。現(xiàn)已制定了MPEG-1、MPEG-2、MPEG-4以及補(bǔ)充標(biāo)準(zhǔn)以及補(bǔ)充標(biāo)準(zhǔn)MPEG-7與與MPEG-21等,等,其中其中MPEG-2與與MPEG-4是與是與ITU-T聯(lián)合研制聯(lián)合研制的。的。 n 在在MPEG系列標(biāo)準(zhǔn)中,系列標(biāo)準(zhǔn)中,MPEG-1、MPEG-2屬屬于第一代視頻壓縮標(biāo)準(zhǔn),而于第一代視頻壓縮標(biāo)準(zhǔn),而MPEG-4則屬于第則屬于第二代視頻壓縮標(biāo)準(zhǔn)。二代視頻壓縮標(biāo)準(zhǔn)。 BUPT Information Theory & Technology Education
32、 & Research Center 321. MPEG-1編碼標(biāo)準(zhǔn)簡介編碼標(biāo)準(zhǔn)簡介 MPEG-1主要是針對(duì)1.5Mbps速率的數(shù)字存貯媒體運(yùn)動(dòng)圖像及其伴音制定的國際標(biāo)準(zhǔn),用于CD-ROM的數(shù)字視頻以及MP3等。MPEG-1視頻編譯碼系統(tǒng)的原理性框圖如右所示。 BUPT Information Theory & Technology Education & Research Center 33 上述框圖中,核心部件是視頻編譯碼器,視頻編碼器的結(jié)構(gòu)如下圖所示。BUPT Information Theory & Technology Education &
33、Research Center 34分層名稱分層名稱功能功能塊層塊層進(jìn)行離散余弦變換進(jìn)行離散余弦變換DCT的基本單元的基本單元宏塊層宏塊層預(yù)測單元預(yù)測單元分片層分片層同步恢復(fù)單元同步恢復(fù)單元幀幀(圖片圖片)層層基本編碼單元基本編碼單元幀組幀組(圖片組圖片組)層層視頻隨機(jī)存取單元視頻隨機(jī)存取單元視頻序列層視頻序列層節(jié)目內(nèi)容隨機(jī)存取單元節(jié)目內(nèi)容隨機(jī)存取單元n MPEG-1視頻流采用分層式數(shù)據(jù)結(jié)構(gòu),其分層方視頻流采用分層式數(shù)據(jù)結(jié)構(gòu),其分層方法及其功能如上表所示。法及其功能如上表所示。n MPEG-1視頻流分層結(jié)構(gòu)圖如上所示。視頻流分層結(jié)構(gòu)圖如上所示。 BUPT Information Theory
34、& Technology Education & Research Center 35n MPEG-1中視頻圖像分成四種幀類型:中視頻圖像分成四種幀類型:I、P、B與與D幀。幀。 I幀為幀內(nèi)編碼幀(Intracoded frame),編碼時(shí)采用類似H.261的DCT編碼 P幀為預(yù)測編碼幀(Predictively coded frame),采用前向運(yùn)動(dòng)補(bǔ)償預(yù)測和誤差的DCT編碼,由其前面的I幀或P幀進(jìn)行預(yù)測 B幀,為雙向預(yù)測編碼幀(bidirectionally predictively coded frame),采用雙向運(yùn)動(dòng)補(bǔ)償預(yù)測和誤差DCT編碼 D幀為直流編碼器(DC C
35、oded frame),它只包含每個(gè)塊的直流分量 BUPT Information Theory & Technology Education & Research Center 362. MPEG-2編碼標(biāo)準(zhǔn)簡介編碼標(biāo)準(zhǔn)簡介 ISO/IEC的MPEG組織于1995年推出MPEG-2標(biāo)準(zhǔn),它是主要針對(duì)數(shù)字視頻廣播、高清晰度電視HDTV和數(shù)字視盤等制定的49Mbps運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn)。 MPEG-2與MPEG-1的差異如下: MPEG-2專門設(shè)置了“按幀編碼”和“按場編碼”兩類模式,并相應(yīng)地對(duì)運(yùn)動(dòng)補(bǔ)償和DCT方法進(jìn)行了擴(kuò)展 MPEG-2壓縮編碼在一些方面進(jìn)行了擴(kuò)展 空間分
36、辨率、時(shí)間分辨率、信噪比可分為不同等級(jí)以適合不同等級(jí)用途需求,并可給予不同等級(jí)優(yōu)先級(jí) 視頻流結(jié)構(gòu)具有可分級(jí)性 輸出碼率可以是恒定也可以是變化的以適應(yīng)同步與異步傳輸 BUPT Information Theory & Technology Education & Research Center 37n MPEG-2視頻是視頻是一個(gè)多格式系一個(gè)多格式系統(tǒng),允許對(duì)統(tǒng),允許對(duì)4種種源格式進(jìn)行源格式進(jìn)行5種種類型類型11種單獨(dú)技種單獨(dú)技術(shù)規(guī)范進(jìn)行編術(shù)規(guī)范進(jìn)行編碼碼 n 11種單獨(dú)技術(shù)規(guī)種單獨(dú)技術(shù)規(guī)范如右表格所范如右表格所示示 等級(jí)等級(jí) 簡 單 規(guī)簡 單 規(guī)范范(無無B幀,幀,不可縮不可縮
37、放放) 主規(guī)范主規(guī)范(B幀,幀,不可縮不可縮放放) SNR縮縮放放(B幀,幀,SNR縮縮放放) 空間可空間可縮放的縮放的規(guī)范規(guī)范(B幀,空幀,空間或間或SNR可可縮放縮放) 高級(jí)規(guī)高級(jí)規(guī)范范(B幀,幀,空間或空間或SNR可可縮放縮放) 高層高層11920115260 80Mbps 100Mbps 高層高層21440115260 60Mbps 60Mbps 80Mbps 高層高層372057630 15Mbps 15Mbps 15Mbps 20Mbps 低層低層35228830 4Mbps 4Mbps BUPT Information Theory & Technology Educat
38、ion & Research Center 384.3.5第二代視頻壓縮編碼標(biāo)準(zhǔn)n本小節(jié)介紹三類代表性標(biāo)準(zhǔn),即已應(yīng)用本小節(jié)介紹三類代表性標(biāo)準(zhǔn),即已應(yīng)用于移動(dòng)通信的于移動(dòng)通信的JPEG-2000、MPEG-4編碼編碼標(biāo)準(zhǔn)和標(biāo)準(zhǔn)和H.264編碼標(biāo)準(zhǔn)。編碼標(biāo)準(zhǔn)。 BUPT Information Theory & Technology Education & Research Center 391. JPEG-2000編碼標(biāo)準(zhǔn)簡介編碼標(biāo)準(zhǔn)簡介JPEG-2000主要特點(diǎn)如下: 用以小波變換為主的多分辨率編碼方式代替JPEG中采用的傳統(tǒng)DCT變換采用了漸進(jìn)傳輸技術(shù)(progres
39、sive transmission) 用戶在處理圖像時(shí)可以指定感興趣區(qū)域(ROI,region of interest),對(duì)這些區(qū)域可以選取特定的壓縮質(zhì)量和解壓縮質(zhì)量 利用預(yù)測法可以實(shí)現(xiàn)無損壓縮(lossless compression) 具有誤碼魯棒性(Robustness to bit error),抗干擾性好 考慮了人眼的主觀視覺特性,增加了視覺權(quán)重和掩膜 BUPT Information Theory & Technology Education & Research Center 402. MPEG-4編碼標(biāo)準(zhǔn)簡介編碼標(biāo)準(zhǔn)簡介 視頻編碼大體上可以分為兩代:第一代基于像
40、素的方法;第二代基于內(nèi)容的方法。MPEG-4是基于對(duì)象方法。 左圖給出了對(duì)于一個(gè)任意形狀的視頻對(duì)象進(jìn)行通用編碼的原理框架。主要包含三部分:紋理、形狀和運(yùn)動(dòng)三個(gè)編碼模塊。 BUPT Information Theory & Technology Education & Research Center 41n MPEG-4標(biāo)準(zhǔn)中定標(biāo)準(zhǔn)中定義的中心概念是義的中心概念是AV對(duì)象,其編碼機(jī)制對(duì)象,其編碼機(jī)制是基于是基于1616的像的像素宏塊來設(shè)計(jì)的。素宏塊來設(shè)計(jì)的。n MPEG-4視頻碼流視頻碼流提供了對(duì)視頻場景提供了對(duì)視頻場景的分層描述,如右的分層描述,如右圖所示。圖所示。BUPT I
41、nformation Theory & Technology Education & Research Center 42n 下面給出一個(gè)用下面給出一個(gè)用VOP形成模塊在形成模塊在MPEG-4視頻視頻驗(yàn)證模型驗(yàn)證模型VM中的框架構(gòu)成原理:中的框架構(gòu)成原理: BUPT Information Theory & Technology Education & Research Center 43n MPEG-4視頻編譯碼的主要特點(diǎn)包括:視頻編譯碼的主要特點(diǎn)包括:圖像信息處理的基本單元,由第一代像素塊像素幀轉(zhuǎn)變到以紋理、形狀和運(yùn)動(dòng)三類主要數(shù)據(jù)的取樣值構(gòu)成視頻對(duì)象平面VO
42、Pi 視頻編碼基礎(chǔ)轉(zhuǎn)變成既取決于原有的客觀統(tǒng)計(jì)特性,而更重要的則是取決于視頻對(duì)象、內(nèi)容的各種主、客觀以及圖像瞬時(shí)特性 基于對(duì)象、基于內(nèi)容 對(duì)于不同的信源與信道,以及各個(gè)VO以及VOPi在總體圖像中的重要性和地位,可以分別采用不同等級(jí)的保護(hù)與容錯(cuò)措施 圖像處理中具有時(shí)間、空間可伸縮性(尺度變換) BUPT Information Theory & Technology Education & Research Center 443. 新一代的視頻編、譯碼標(biāo)準(zhǔn)新一代的視頻編、譯碼標(biāo)準(zhǔn)H.264 ITU-T與ISO/IEC聯(lián)手成立的VCEG在H.263及其改進(jìn)型與MPEG-4的基礎(chǔ)上
43、進(jìn)行技術(shù)融合、改進(jìn)和優(yōu)化,共同提出H-264建議標(biāo)準(zhǔn) VCEG從圖像質(zhì)量與實(shí)時(shí)性兩方面出發(fā),給出以下幾個(gè)方面要求: 數(shù)據(jù)比特率與圖像質(zhì)量 時(shí)延復(fù)雜性差錯(cuò)恢復(fù) 語法定義 網(wǎng)絡(luò)友好性 BUPT Information Theory & Technology Education & Research Center 45n H.264與以往編碼的主要差異有:與以往編碼的主要差異有:運(yùn)動(dòng)估值和運(yùn)動(dòng)補(bǔ)償 采用內(nèi)部(intra)預(yù)測 采用系數(shù)變換技術(shù) 采用變換系數(shù)量化 熵編碼 在掃描順序、去塊濾波器、新的圖片類型、熵編碼模式和網(wǎng)絡(luò)適應(yīng)層等方向,都有與以往編碼不一樣的自己特色 BUPT Inf
44、ormation Theory & Technology Education & Research Center 464.4 我國音視頻標(biāo)準(zhǔn) n數(shù)字音視頻技術(shù)中,最核心的是音視頻數(shù)字音視頻技術(shù)中,最核心的是音視頻編解碼算法和標(biāo)準(zhǔn)。目前,我國主要采編解碼算法和標(biāo)準(zhǔn)。目前,我國主要采用國外制定的標(biāo)準(zhǔn),如:杜比用國外制定的標(biāo)準(zhǔn),如:杜比AC-3、MPEG-2和和H.264,使用這些標(biāo)準(zhǔn)需要向,使用這些標(biāo)準(zhǔn)需要向國外相關(guān)專利池繳付大量專利費(fèi),直接國外相關(guān)專利池繳付大量專利費(fèi),直接制約我國數(shù)字音視頻產(chǎn)業(yè)的發(fā)展,也會(huì)制約我國數(shù)字音視頻產(chǎn)業(yè)的發(fā)展,也會(huì)影響移動(dòng)通信業(yè)務(wù)的開展。影響移動(dòng)通信業(yè)務(wù)
45、的開展。 n下面簡要介紹近年來我國頒布的下面簡要介紹近年來我國頒布的DRA數(shù)數(shù)字音頻與字音頻與AVS數(shù)字視頻國家標(biāo)準(zhǔn)。數(shù)字視頻國家標(biāo)準(zhǔn)。 BUPT Information Theory & Technology Education & Research Center 474.4 我國音視頻標(biāo)準(zhǔn)n4.4.1 DRA數(shù)字音頻標(biāo)準(zhǔn) nDRA數(shù)字音頻標(biāo)準(zhǔn)全稱為數(shù)字音頻標(biāo)準(zhǔn)全稱為多聲道數(shù)字多聲道數(shù)字音頻編解碼技術(shù)規(guī)范音頻編解碼技術(shù)規(guī)范(國標(biāo)號(hào):國標(biāo)號(hào):GB/T 22726-2008),2009年年2月,由國家質(zhì)量監(jiān)月,由國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局和國家標(biāo)準(zhǔn)化管理委員督檢驗(yàn)檢疫總局和國家標(biāo)準(zhǔn)
46、化管理委員會(huì)正式頒布。會(huì)正式頒布。 nDRA是支持立體聲和多聲道環(huán)繞聲的數(shù)是支持立體聲和多聲道環(huán)繞聲的數(shù)字音頻編解碼,最多可以支持字音頻編解碼,最多可以支持64個(gè)正常個(gè)正常聲道和聲道和3個(gè)低頻效果聲道,擁有壓縮效率個(gè)低頻效果聲道,擁有壓縮效率高,音質(zhì)好,解碼復(fù)雜度低和容錯(cuò)能力高,音質(zhì)好,解碼復(fù)雜度低和容錯(cuò)能力強(qiáng)的優(yōu)點(diǎn)。強(qiáng)的優(yōu)點(diǎn)。 BUPT Information Theory & Technology Education & Research Center 484.4 我國音視頻標(biāo)準(zhǔn)采樣速率范圍采樣速率范圍8-192kHz量化精度量化精度24bit編碼比特率編碼比特率32-23
47、04kbps可支持聲道數(shù)可支持聲道數(shù)正常聲道正常聲道64個(gè),低頻聲道個(gè),低頻聲道(LFE)3個(gè)個(gè)支持編碼模式支持編碼模式VBR、CBR、ABR音頻幀長音頻幀長1024采樣點(diǎn)采樣點(diǎn)算法復(fù)雜度算法復(fù)雜度對(duì)于對(duì)于5.1聲道聲道384kbps碼率數(shù)據(jù),編解碼復(fù)雜度為碼率數(shù)據(jù),編解碼復(fù)雜度為48MIPS。壓縮效果壓縮效果128kbps立體聲,立體聲,MOS評(píng)分評(píng)分4.7;384kbps 5.1環(huán)繞聲,環(huán)繞聲,MOS評(píng)分評(píng)分4.9;達(dá)到;達(dá)到EBU(歐洲廣播聯(lián)盟歐洲廣播聯(lián)盟)定義的定義的“不能識(shí)不能識(shí)別損傷別損傷”音頻質(zhì)量音頻質(zhì)量表4.6 DRA標(biāo)準(zhǔn)性能指標(biāo) BUPT Information Theory
48、 & Technology Education & Research Center 494.4 我國音視頻標(biāo)準(zhǔn)nDRA音頻壓縮算法基于人耳的聽覺特性音頻壓縮算法基于人耳的聽覺特性對(duì)聲音信號(hào)進(jìn)行量化和比特分配,屬于對(duì)聲音信號(hào)進(jìn)行量化和比特分配,屬于感知音頻編碼,采用了變換編碼的路線。感知音頻編碼,采用了變換編碼的路線。nDRA算法實(shí)現(xiàn)了量化與熵編碼獨(dú)立優(yōu)化,算法實(shí)現(xiàn)了量化與熵編碼獨(dú)立優(yōu)化,進(jìn)一步提高了量化與熵編碼的性能,采進(jìn)一步提高了量化與熵編碼的性能,采用了基于人耳聽覺模型的自適應(yīng)分塊標(biāo)用了基于人耳聽覺模型的自適應(yīng)分塊標(biāo)量量化,并對(duì)量化指數(shù)進(jìn)行了量量化,并對(duì)量化指數(shù)進(jìn)行了Huf
49、fman編碼,主要技術(shù)特色在于可變分辨編碼,主要技術(shù)特色在于可變分辨 率濾率濾波器組和熵編碼波器組和熵編碼 。BUPT Information Theory & Technology Education & Research Center 504.4 我國音視頻標(biāo)準(zhǔn)n (1)可變分辨率濾波n 準(zhǔn)穩(wěn)態(tài)片斷具有高頻域分辨率,而對(duì)瞬態(tài)信號(hào)準(zhǔn)穩(wěn)態(tài)片斷具有高頻域分辨率,而對(duì)瞬態(tài)信號(hào)具有高時(shí)域分辨率。傳統(tǒng)算法往往采取折衷方具有高時(shí)域分辨率。傳統(tǒng)算法往往采取折衷方法,但對(duì)于穩(wěn)態(tài)信號(hào)和瞬態(tài)信號(hào)都不是最優(yōu)。法,但對(duì)于穩(wěn)態(tài)信號(hào)和瞬態(tài)信號(hào)都不是最優(yōu)。n DRA算法采取了改進(jìn)方法,對(duì)音頻幀的瞬態(tài)信算法
50、采取了改進(jìn)方法,對(duì)音頻幀的瞬態(tài)信號(hào)范圍進(jìn)行分析,將穩(wěn)態(tài)和瞬態(tài)信號(hào)分別處理。號(hào)范圍進(jìn)行分析,將穩(wěn)態(tài)和瞬態(tài)信號(hào)分別處理。DRA對(duì)于穩(wěn)態(tài)信號(hào)采用了高頻域分辨率的濾波對(duì)于穩(wěn)態(tài)信號(hào)采用了高頻域分辨率的濾波器組,使變換后的子帶樣本能量更加集中,有器組,使變換后的子帶樣本能量更加集中,有利于量化和熵編碼;而對(duì)于瞬態(tài)信號(hào)則引入新利于量化和熵編碼;而對(duì)于瞬態(tài)信號(hào)則引入新的的“瞬態(tài)窗函數(shù)瞬態(tài)窗函數(shù)”,提供了精細(xì)的時(shí)域分辨率,提供了精細(xì)的時(shí)域分辨率,從而保留了足夠聽覺有效信息。從而保留了足夠聽覺有效信息。 BUPT Information Theory & Technology Education &
51、; Research Center 514.4 我國音視頻標(biāo)準(zhǔn)n(2)量化比特分配及熵編碼n與同類音頻編碼器類似,與同類音頻編碼器類似,DRA也采用心也采用心理聲學(xué)模型輸出的量化掩蔽閾值分配量理聲學(xué)模型輸出的量化掩蔽閾值分配量化噪音,使其盡可能被遮蔽而不被感知。化噪音,使其盡可能被遮蔽而不被感知。n在對(duì)量化指數(shù)的熵編碼中,根據(jù)每個(gè)量在對(duì)量化指數(shù)的熵編碼中,根據(jù)每個(gè)量化指數(shù)的特性分配最優(yōu)的碼本指數(shù),然化指數(shù)的特性分配最優(yōu)的碼本指數(shù),然后合并形成較大的段,共享一個(gè)碼本指后合并形成較大的段,共享一個(gè)碼本指數(shù),這樣做可以盡量少的比特?cái)?shù)傳遞碼數(shù),這樣做可以盡量少的比特?cái)?shù)傳遞碼本向量信息。本向量信息。 B
52、UPT Information Theory & Technology Education & Research Center 524.4 我國音視頻標(biāo)準(zhǔn)nDRA已經(jīng)被已經(jīng)被CMMB(China Mobile Multimedia Broadcasting)行業(yè)標(biāo)準(zhǔn)確立行業(yè)標(biāo)準(zhǔn)確立為必選音頻標(biāo)準(zhǔn),為必選音頻標(biāo)準(zhǔn),CMMB主要面向手機(jī)、主要面向手機(jī)、PDA等小屏幕便攜手持終端以及車載電等小屏幕便攜手持終端以及車載電視等終端提供廣播電視服務(wù)。視等終端提供廣播電視服務(wù)。 BUPT Information Theory & Technology Education &
53、Research Center 534.4 我國音視頻標(biāo)準(zhǔn)n4.4.2 AVS數(shù)字視頻標(biāo)準(zhǔn) nAVS是是我國自主制定,基于自主創(chuàng)新是是我國自主制定,基于自主創(chuàng)新和部分公開技術(shù)的視頻標(biāo)準(zhǔn),技術(shù)方案和部分公開技術(shù)的視頻標(biāo)準(zhǔn),技術(shù)方案簡潔,實(shí)現(xiàn)復(fù)雜度低,是一套包含系統(tǒng)、簡潔,實(shí)現(xiàn)復(fù)雜度低,是一套包含系統(tǒng)、視頻、音頻、媒體版權(quán)管理在內(nèi)的完整視頻、音頻、媒體版權(quán)管理在內(nèi)的完整標(biāo)準(zhǔn)體系。標(biāo)準(zhǔn)體系。nAVS通過簡潔的一站式許可政策,解決通過簡潔的一站式許可政策,解決了了AVC專利許可問題死結(jié),為數(shù)字音視專利許可問題死結(jié),為數(shù)字音視頻產(chǎn)業(yè)提供更全面的解決方案。頻產(chǎn)業(yè)提供更全面的解決方案。 BUPT Infor
54、mation Theory & Technology Education & Research Center 544.4 我國音視頻標(biāo)準(zhǔn)nAVS與與MPEG-4、H.264標(biāo)準(zhǔn)具有相同的標(biāo)準(zhǔn)具有相同的編碼框架,但技術(shù)取舍的衡量指標(biāo)各不編碼框架,但技術(shù)取舍的衡量指標(biāo)各不相同,因而編碼效率和復(fù)雜性也各有異相同,因而編碼效率和復(fù)雜性也各有異同。同。n從編碼效率來看,從編碼效率來看,MPEG-4是是MPEG-2的的1.4倍,倍,AVS和和AVC相當(dāng),都是相當(dāng),都是MPEG-2的兩倍以上。從復(fù)雜度來看,的兩倍以上。從復(fù)雜度來看,H.264約為約為MPEG-2的的9倍,倍,AVS大致為大致
55、為MPEG-2的的6倍。倍。AVS的技術(shù)特點(diǎn)總結(jié)如下的技術(shù)特點(diǎn)總結(jié)如下 BUPT Information Theory & Technology Education & Research Center 554.4 我國音視頻標(biāo)準(zhǔn)n(1)自適應(yīng)運(yùn)動(dòng)補(bǔ)償n采用自適應(yīng)宏塊劃分進(jìn)行運(yùn)動(dòng)補(bǔ)償是提高預(yù)采用自適應(yīng)宏塊劃分進(jìn)行運(yùn)動(dòng)補(bǔ)償是提高預(yù)測精度的重要手段之一。測精度的重要手段之一。AVS將宏塊劃分最將宏塊劃分最小限制為小限制為88,這一限制大大降低了編解碼,這一限制大大降低了編解碼器的復(fù)雜度器的復(fù)雜度(30-40%),而整體性能只降低大,而整體性能只降低大概在概在2-4%左右,達(dá)到較好折中
56、。左右,達(dá)到較好折中。 n(2)幀內(nèi)預(yù)測n與與H.264類似,類似,AVS也采用幀內(nèi)預(yù)測技術(shù),但也采用幀內(nèi)預(yù)測技術(shù),但基于基于88宏塊進(jìn)行,并且亮度只有宏塊進(jìn)行,并且亮度只有5種預(yù)測模種預(yù)測模式,大大降低了預(yù)測模式選擇的復(fù)雜度,且式,大大降低了預(yù)測模式選擇的復(fù)雜度,且性能十分接近。性能十分接近。 BUPT Information Theory & Technology Education & Research Center 564.4 我國音視頻標(biāo)準(zhǔn)n (3)多參考幀預(yù)測n 多參考幀預(yù)測使當(dāng)前塊能從前幾幀圖像多參考幀預(yù)測使當(dāng)前塊能從前幾幀圖像尋找更好匹配。尋找更好匹配。AVS限
57、定最多采用兩個(gè)限定最多采用兩個(gè)參考幀,在不增大緩沖區(qū)的條件下提高參考幀,在不增大緩沖區(qū)的條件下提高了編碼效率,實(shí)現(xiàn)方法比了編碼效率,實(shí)現(xiàn)方法比H.264更簡潔。更簡潔。n (4)1/4像素插值n 運(yùn)動(dòng)矢量的精度是提高預(yù)測準(zhǔn)確度的重運(yùn)動(dòng)矢量的精度是提高預(yù)測準(zhǔn)確度的重要手段,其核心是插值濾波器的選擇,要手段,其核心是插值濾波器的選擇,AVS對(duì)對(duì)1/2像素位置插值采用像素位置插值采用4階濾波器階濾波器可達(dá)到與可達(dá)到與H.264的的6階濾波器一致的性能。階濾波器一致的性能。 BUPT Information Theory & Technology Education & Researc
58、h Center 574.4 我國音視頻標(biāo)準(zhǔn)n(5)整數(shù)變換nAVS和和H.264類似,都采用整數(shù)變換代替類似,都采用整數(shù)變換代替DCT變換,前者具有復(fù)雜度低、完全匹配等優(yōu)點(diǎn)。變換,前者具有復(fù)雜度低、完全匹配等優(yōu)點(diǎn)。AVS變換矩陣歸一化在編碼端完成,節(jié)省了變換矩陣歸一化在編碼端完成,節(jié)省了譯碼縮放表。譯碼縮放表。AVS采用了采用了88、44兩種變兩種變換,由于換,由于88變換比變換比44變換的解相關(guān)能力變換的解相關(guān)能力更強(qiáng),因此比只有更強(qiáng),因此比只有44變換的變換的H.264編碼效率編碼效率提高提高2%(約約0.1dB)。n(6)量化技術(shù)nAVS與與H.264都采用了量化與變換歸一化結(jié)合都采用了量化與變換歸一化結(jié)合的簡化技術(shù),由于變換歸一化在編碼端完成,的簡化技術(shù),由于變換歸一化在編碼端完成,因此譯碼器的反量化表與變換系數(shù)位置無關(guān)。因此譯碼器的反量化表與變換系數(shù)位置無關(guān)。 BUPT Information Theory & Technology Education & Research Center 584.4 我國音視頻標(biāo)準(zhǔn)n(7)B幀宏塊模式nAVS的的B幀宏塊采用空幀宏塊采用空/時(shí)域結(jié)合的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年割灌機(jī)合作協(xié)議書
- 強(qiáng)化合規(guī)經(jīng)營管理規(guī)避經(jīng)營風(fēng)險(xiǎn)隱患
- 構(gòu)建智能物流系統(tǒng)優(yōu)化配送效率
- 2025年離合器主缸合作協(xié)議書
- 西安機(jī)械加工生產(chǎn)服務(wù)合同
- 化妝品行業(yè)產(chǎn)品品質(zhì)追溯系統(tǒng)建設(shè)方案
- Perfluoro-2-5-dimethyl-3-6-dioxanonanoic-acid-生命科學(xué)試劑-MCE
- Fumonisin-B1-Standard-生命科學(xué)試劑-MCE
- D-Psicose-Standard-生命科學(xué)試劑-MCE
- 電鍍培訓(xùn)資料
- 數(shù)據(jù)結(jié)構(gòu)英文教學(xué)課件:chapter7 Searching
- 護(hù)理核心制度及重點(diǎn)環(huán)節(jié)-PPT課件
- 夾套管現(xiàn)場施工方法
- 部編版語文五年級(jí)下冊(cè)形近字組詞參考
- 第三章走向混沌的道路
- 化探野外工作方法及要求
- 2006年事業(yè)單位工資改革工資標(biāo)準(zhǔn)表及套改表2
- 幼兒園中班體育活動(dòng)動(dòng)作目標(biāo)及指導(dǎo)要點(diǎn)
- 江蘇省特種設(shè)備安全條例2021
- 加速器控制 中國科學(xué)技術(shù)大學(xué)國家同步輻射實(shí)驗(yàn)室
- 民事庭審筆錄
評(píng)論
0/150
提交評(píng)論