第3章數(shù)據(jù)壓縮的基本技術(shù)_第1頁
第3章數(shù)據(jù)壓縮的基本技術(shù)_第2頁
第3章數(shù)據(jù)壓縮的基本技術(shù)_第3頁
第3章數(shù)據(jù)壓縮的基本技術(shù)_第4頁
第3章數(shù)據(jù)壓縮的基本技術(shù)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第3章數(shù)據(jù)壓縮的基本技術(shù)第3章數(shù)據(jù)壓縮的基本技術(shù)學(xué)習(xí)目標(biāo)了解常見的多媒體數(shù)據(jù)壓縮編碼技術(shù)的核心思想掌握多媒體數(shù)據(jù)壓縮碼的必要性、可能性及分類掌握信息熵的概念掌握信息率失真理論理解預(yù)測編碼和變換編碼目的及原理了解子帶編碼、小波變換編碼基本原理掌握熵編碼的原理和算法掌握量化對壓縮編碼產(chǎn)生的重要影響數(shù)據(jù)壓縮的基本技術(shù)主要內(nèi)容3.1概述3.2數(shù)據(jù)壓縮理論依據(jù)

3.2.1離散信源的信息熵

3.2.2信源的概率分布與熵的關(guān)系

3.2.3信源的相關(guān)性與序列熵的關(guān)系3.3信息率失真理論

3.3.1通信系統(tǒng)的一般模型

3.3.2信息率—失真函數(shù)

3.3.3限失真信源編碼定理

3.5預(yù)測編碼3.6正交變換編碼3.7子帶編碼(了解原理)3.8小波變換編碼(了解原理)3.9量化3.9.1——3.9.63.10熵編碼3.11壓縮編碼算法性能的評價3.1概述第一代編碼技術(shù):基于香農(nóng)的信息論,主要利用數(shù)據(jù)的統(tǒng)計特性來達(dá)到壓縮目的,此類方法稱為“基于像素”的壓縮方法。常用方法:信息熵編碼,預(yù)測編碼,變換編碼第二代編碼技術(shù):考慮人眼的視覺特性,根據(jù)人眼識別圖像的特征構(gòu)造圖像模型。常用方法:結(jié)構(gòu)編碼第三代編碼技術(shù)3.2數(shù)據(jù)壓縮的理論依據(jù)數(shù)據(jù)壓縮原理數(shù)據(jù)壓縮的對象是數(shù)據(jù)。數(shù)據(jù)是信息的載體,用來記錄和傳送信息。真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。大的數(shù)據(jù)量并不代表含有大的信息量。而對于去掉冗余的數(shù)據(jù)對信息沒有本質(zhì)的影響稱為壓縮。3.2.1離散信源的熵1、信息量在信息論中,可以說:信息是用不確定的度量來定義的;一個消息的可能性越小,其信息含量越大;消息的可能性越大,則信息含量越小?!裥畔⒘康拇笮『拖⒂幸欢ǖ年P(guān)系。在數(shù)學(xué)上,消息是其出現(xiàn)概率的單調(diào)下降函數(shù)。信息量越大,消息的可能性越小,反之亦然。1、信息量

定義:一個隨機事件發(fā)生某一結(jié)果所帶來的信息量稱為自信息量,簡稱自信息。表示為概率對數(shù)的負(fù)值。

單位:比特(bit)2、離散信源的信息熵

離散信源:信源發(fā)出的符號取自離散集合,離散信源X可用下式描述:離散信源集合X發(fā)出符號集si(i=1,2,…,n)中各符號信息量統(tǒng)計平均(即求其數(shù)學(xué)期望),從而得到符號集中每個符號的平均信息量:H(X)稱為信源X的“熵”,單位bit/符號2、離散信源的信息熵總括起來,信源熵有三種物理含義:信源熵H(X)表示符號出現(xiàn)后,接收到一個符號獲得的的平均信息量。信源熵H(X)表示符號出現(xiàn)前,符號集中的符號出現(xiàn)的平均不確定度。信源熵H(X)反映了符號出現(xiàn)的隨機性。1233.2.2信源的概率分布與熵的關(guān)系最大離散熵定理定理

對于離散無記憶信源,信源中各符號出現(xiàn)的概率相等,,信源具有最大熵。時熵與概率的關(guān)系3.2.2信源的概率分布與熵的關(guān)系由此可見,數(shù)據(jù)壓縮的方法之一,就是使每個符號所代表的信息量最大,通常通過壓縮各信源符號間的冗余度使信源符號呈現(xiàn)等概分布來達(dá)到各符號所攜帶的信息量最大。

這些冗余度既來自于信源本身的相關(guān)性,又來自于信源概率分布的不均勻性,只要找到去除相關(guān)性或改變概率分布不均勻性的手段和方法,也就找到了信息熵編碼的方法。2.2.3信源的相關(guān)性與序列熵的關(guān)系對于一個離散無記憶信源,如果已知輸出隨機序列包含兩個符號X和Y,其中X取自Y取自因此可用聯(lián)合熵表示接收到該序列后獲得的平均信息量:其中rij為符號si和tj同時發(fā)生的聯(lián)合概率2.2.3信源的相關(guān)性與序列熵的關(guān)系由于X和Y彼此相互獨立,故則前式可改寫成

可見離散無記憶信源所產(chǎn)生的符號序列的熵等于各符號熵之和。但是許多離散信源都是有記憶的,其前一個符號直接對后面所出現(xiàn)的符號構(gòu)成影響,或者說后面出現(xiàn)的符號由前面幾個出現(xiàn)的符號決定。進(jìn)而有:2.2.3信源的相關(guān)性與序列熵的關(guān)系當(dāng)圖像的信息源的輸出序列包含多種相關(guān)符號時,也能得到相同的結(jié)果。序列熵與其可能達(dá)到的最大值之間的差值就是該信息源中所含的冗余度。如果能使信源輸出的各符號之間的冗余度越小,那么每個符號所攜帶的信息量也越大,這樣傳送相同的信息量所需要的序列長度也越短,即所含的比特數(shù)也越少。去除信源各符號間的相關(guān)性,其相關(guān)性去除越多,則信源特性越趨于無記憶信源的特性。3.3信息率失真理論3.3.1通信系統(tǒng)的一般模型圖3-3通信系統(tǒng)模型3.3.1通信系統(tǒng)的一般模型假設(shè)離散信源產(chǎn)生離散隨機過程{Ur},輸出后的輸出序列為隨機過程{Vr}。u是信源符號U的樣,v是V的樣,失真的大小可以用一個量來表示,即失真函數(shù)d(u,v),用來衡量信源每發(fā)出符號u,而在接收端再現(xiàn)成符號v所引起的失真程度。

由于U,V都是隨機變量,所以失真函數(shù)d(u,v)也是隨機變量,將失真函數(shù)的數(shù)學(xué)期望或統(tǒng)計平均值稱為平均失真。長度為N的符號組的平均失真度;3.3.2信息率失真函數(shù)無論是無噪信道還是有噪信道:如果R(信息傳輸率)<C(信道容量),總能找到一種編碼使在信道上能以任意小的錯誤概率、任意接近C的傳輸率來傳送信息。如果R>C,就必須對信源壓縮,使其壓縮后的信息傳輸率R小于信道容量C,但同時要保證壓縮所引入的失真不超過預(yù)先規(guī)定的限度。因此,信息壓縮問題就是對于給定的信源,在滿足平均失真的前提下,使信息率盡可能小。3.3.2信息率失真函數(shù)信息率失真函數(shù)R(D)限定失真為D的條件下,信源輸出的最小信息率。在信源給定后,希望在滿足一定失真的情況下,使信源傳輸給信宿的信息傳輸率R盡可能地小。從信宿來看,就是在滿足保真度準(zhǔn)則下,尋找再現(xiàn)信源消息所必須獲得的最小平均信息量。即在滿足保真度準(zhǔn)則條件下尋找平均互信息的最小值。3.3.3限失真信源編碼定理對于給定的離散平穩(wěn)無記憶信源,若該信源的信息率失真函數(shù)為R(D),選定有限的失真測度,對于任意允許的平均失真度D≥0,和任意小的ε>0,當(dāng)信息率R>R(D),只要信源L足夠長,一定存在一種編碼方式C,使譯碼后的平均失真度

反之,若R<R(D),無論采用任何編碼方式,必有譯碼平均失真度大于允許失真度附:3.4冗余及壓縮編碼分類冗余分類●[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余冗余分類●[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余冗余分類●冗余分類[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余●冗余分類[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余●10110001110010110001110001011010101010111100010111111010冗余分類[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余224色28色●冗余分類[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余●印度金廟泰姬陵冗余分類[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時間冗余——視頻與動畫畫面間的相關(guān)性[3]統(tǒng)計冗余——具有空間冗余和時間冗余[6]視覺冗余——視覺、聽覺敏感度和非線性感覺[7]知識冗余——憑借經(jīng)驗識別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余聲音頻率文字組句色彩漸變主觀意識::●3.4.2數(shù)據(jù)壓縮算法分類●

無損壓縮編碼

——壓縮數(shù)據(jù)還原后,與原始數(shù)據(jù)一致,無損失。(可逆編碼)霍夫曼編碼行程編碼算術(shù)編碼……●

有損壓縮編碼

——壓縮后再還原的數(shù)據(jù)有損失。(不可逆編碼)預(yù)測編碼變換編碼統(tǒng)計編碼……壓縮比:2:1~5:1壓縮比:≤1:1003.4.2數(shù)據(jù)壓縮算法分類視頻壓縮無損壓縮有損壓縮霍夫曼編碼行程編碼算術(shù)編碼預(yù)測編碼變換編碼模型編碼基于重要性混合編碼DPCMADPCM運動編碼DCT變換小波變換子帶編碼分形變換濾波子采樣矢量量化H.261MPEG3.5預(yù)測編碼●預(yù)測編碼——有損壓縮編碼,主要對統(tǒng)計冗余進(jìn)行壓縮。1.預(yù)測編碼的基本原理預(yù)測編碼是一種針對統(tǒng)計冗余進(jìn)行壓縮的方法,它主要是減少數(shù)據(jù)在空間和時間上的相關(guān)性,達(dá)到對數(shù)據(jù)的壓縮。用原樣本值對新樣本進(jìn)行預(yù)測,得到新樣本的預(yù)測值。接著,取新樣本的實際值和預(yù)測值進(jìn)行比較,二者相減得到差值,然后對差值進(jìn)行編碼。預(yù)測編碼可細(xì)分為幀內(nèi)預(yù)測和幀外預(yù)測。2.預(yù)測編碼的應(yīng)用預(yù)測編碼用于圖像的傳輸和存儲。對于連續(xù)的多幀圖像,新一幀通常保留前一幀的部分內(nèi)容。首先存儲當(dāng)前內(nèi)容,如像點、幀或線。然后與下一幀圖像進(jìn)行比較(預(yù)測),把不同點存儲或傳輸,而相同點則是數(shù)據(jù)冗余,予以剔除。3.5.1差分脈沖編碼調(diào)制DPCM●DPCM(DifferentialPulseCodeModulation)差分脈沖編碼調(diào)制算法,主要用于對圖像的像素進(jìn)行預(yù)測、壓縮處理?!窆ぷ髟硎紫缺容^相鄰的像素,如果存在差異,則傳送差異之處的差值;若無差異,則不傳送差值。由于圖像相鄰像素通常是類似的,差異很小,因此,傳送的差值總是少于圖像的像素值,達(dá)到了減少數(shù)據(jù)量的目的。

DPCM方法簡單,易于實現(xiàn),因此得到了廣泛的應(yīng)用。

圖3-13中線性預(yù)測器的輸出為,式中N稱為預(yù)測器的階數(shù),ai為固定的加權(quán)系數(shù),由于等于各輸入樣值的線性疊加,該預(yù)測器稱為線性預(yù)測器。綜上所述,可以得出以下結(jié)論:

①DPCM為空間域預(yù)測:空間域相鄰像素之間有很強的相關(guān)性,利用這些相關(guān)性對當(dāng)前像素進(jìn)行預(yù)測;

②接收端預(yù)測器必須與發(fā)送端的預(yù)測器一致,換句話說就是要保持收發(fā)兩端具有相同的預(yù)測條件。

③預(yù)測值是以前面的N個樣值為依據(jù)做出的,因此要求接收端的預(yù)測器也必須使用同樣的N個樣本,這樣才能保證收、發(fā)之間的同步關(guān)系。

④最佳線性預(yù)測編碼

如果根據(jù)預(yù)測誤差平方值的統(tǒng)計平均最小準(zhǔn)則來獲得的線性預(yù)測則被稱為在最小均方誤差意義下的“最佳線性預(yù)測器”,即確定(i=1,……,m)使的最小均方誤差最小,此時xn相關(guān)性最大,所能達(dá)到的壓縮比也最大.3.5.1差分脈沖編碼調(diào)制DPCM3.5.2序列圖像中運動矢量的估值(幀間預(yù)測)●幀間預(yù)測是指由前一幀或前n幀圖像來預(yù)測當(dāng)前圖像。在采用運動補償技術(shù)后,幀間預(yù)測的準(zhǔn)確度相當(dāng)高。1、運動矢量估值的必要性活動圖像序列中所存在的相關(guān)性大致分為以下幾種:如果場景為靜止畫面,當(dāng)前幀和前一幀的圖像內(nèi)容是完全相同的。對于運動物體而言,如果已知其運動規(guī)律,就可以根據(jù)其前一幀中的位置來推算出該運動物體它在新一幀中的位置。攝像時鏡頭做平移、放大和縮小等操作時,圖像隨時間的變化規(guī)律也是可以推算的。由于上述原因,因而發(fā)送端不需要發(fā)送把每幅圖像中的全部像素,而只要將物體的運動信息告知收端,收端則按所接收到的運動信息和前一幀圖像信息來恢復(fù)當(dāng)前幀圖像??梢娨@得高質(zhì)量的圖像,則要求系統(tǒng)能準(zhǔn)確地從圖像序列中提取相關(guān)運動物體的信息。這一過程就稱為運動估值。具體地說就是t時刻運動物體的像素值bt可以用在此之前τ時間的像素值bt-τ來表示。這兩個像素點之差被稱為位移矢量。bt(z)=bt-τ(z-D)3.5.2序列圖像中運動矢量的估值(幀間預(yù)測)●實際中是比較相距時間τ的兩幀圖像估計出這段時間間隔內(nèi)的位移D,通常采用的運動估值方法主要分為兩大類,分別稱為塊匹配法和像素遞歸法。①像素遞歸法像素遞歸法是針對每個像素逐一地根據(jù)預(yù)測誤差來進(jìn)行位移矢量估算,可見在系統(tǒng)中無需單獨傳送位置信息。②塊匹配法塊匹配法的思路與像素遞歸法的分析思路不同。它是首先將圖像劃分成若干彼此互不重疊的子塊(例如16×16),并認(rèn)為子塊內(nèi)所有像素的位移量相同,或者說它是把整個子塊視為一個“運動物體”,但在實際圖像序列中,一個運動物體的大小不可能恰好完全等于一個子塊的大小,因此當(dāng)一個真實物體運動時,如果仍以子塊作為計量單位,那么嚴(yán)格意義上講,在第k幀和第k+1幀圖像中,不可能存在完全相同的子塊,因此提出了相似性問題——匹配準(zhǔn)則。2、塊匹配法●假設(shè)在圖像序列中,t時刻對應(yīng)于第k幀圖像,t-τ時刻對應(yīng)于k-1幀圖像,對于k幀圖像中的一個塊,在k-1幀中找與其最相似的塊,稱為匹配塊,并認(rèn)為該匹配塊在k-1幀中的位置,就是k幀塊位移前的位置,則經(jīng)過計算可以得到位移矢量D。●為了節(jié)省計算量,k-1幀的匹配搜索只在一定范圍內(nèi)進(jìn)行,假設(shè)τ時間內(nèi)塊的最大水平和垂直位移量為dm個像素,則搜索范圍:SR=(M+2dm)x(N+2dm)目前常用的匹配準(zhǔn)則:歸一化的互相關(guān)函數(shù)(NCCF);塊亮度均方差值(MSE);塊亮度差的絕對值均值(MAD);塊亮度差的絕對值和(SAD)2、塊匹配法SAD越小,相似性越高,當(dāng)SAD最小時,兩個子塊達(dá)到匹配,計算出位移矢量D(i,j),表示在k-1幀該子塊在移動i行j列后與k幀中的子塊相似。塊亮度差的絕對值和定義如下:將當(dāng)前幀劃分為MxN的圖像子塊,其中各像素用bk(m,n)表示,當(dāng)?shù)趉幀中的MxN圖像子塊與第k-1幀中的MxN圖像子塊進(jìn)行比較時,絕對值和為:

dm≤i,j≥dm,(i,j)表示位移矢量,dm表示單方向上水平和垂直位移像素個數(shù)。

Step1:以待匹配塊中心的同位像素(即前一幀中與之位置相同的像素)為中心,在中心點和與其相距4個像素點的8個鄰域點上計算判決函數(shù)SAD值,取SAD最小的點作為下一步搜索的中心。Step2:以該點為中心,對與中心相距2個像素點的未搜索過的鄰域點進(jìn)行搜索。Step3:以上一步SAD值最小的點為中心,對距離中心1個像素的未搜索過的領(lǐng)域點進(jìn)行搜索,最終找到最佳匹配位置。2、塊匹配的快速搜索方法●

三步法搜索過程

3.5.3具有運動補償?shù)膸g預(yù)測1、前向預(yù)測

幀間預(yù)測是指信道中傳輸?shù)牟皇钱?dāng)前幀中的像素值x,而傳送的是x與其前一幀相應(yīng)像素之間的差值,因此如果出現(xiàn)如圖所示的情況,即有一個運動小球,從第k-1幀到第k幀過程中只做了位置平移??梢娺@兩幀圖像的背景相同,這樣如果只簡單地用k-1幀中對應(yīng)位置的像素作為k幀相應(yīng)位置上的像素預(yù)測值,那么在圖(b)中所示的實線和虛線區(qū)域內(nèi)的預(yù)測誤差不為零。圖像劃分:將圖像劃分為靜止部分和運動物體。每個物體可能有不同的位移,但構(gòu)成同一物體的所有像素的位移相同。通過運動估值得到每個物體的位移矢量。1、前向預(yù)測除了對運動補償后的預(yù)測誤差進(jìn)行編碼、傳送外,還需要傳送位移矢量以及如何進(jìn)行運動物體和靜止背景分割等方面的附加信息。利用位移矢量計算經(jīng)運動補償后的預(yù)測值?!窭硐氲倪\動補償預(yù)測編碼應(yīng)由以下三個步驟組成。下圖為預(yù)測器的原理方框圖1、前向預(yù)測3.5.3具有運動補償?shù)膸g預(yù)測2、后向預(yù)測和雙向預(yù)測

后向預(yù)測是指由第k幀來預(yù)測第k-1幀,這種預(yù)測方法稱為后向預(yù)測。如果為了進(jìn)一步提高信道的利用率,則可以采用雙向預(yù)測,即用前、后兩幀來預(yù)測中間幀。正交變換編碼3.6●變換編碼(Transformcoding)

有損壓縮編碼,用于消除圖像序列中的相關(guān)性來進(jìn)行壓縮?!窆ぷ髟硎紫葘r域(空間域)上的信號進(jìn)行函數(shù)運算,并變換到頻域(變換域)上,然后在頻域上對變換后的信號進(jìn)行編碼。在頻域上,信息是按照頻譜的能量和頻率分布進(jìn)行排列的。卡南·洛伊夫變換(KLT)離散傅里葉變換(DFT)離散余弦變換(DTC)與空間域相比,變換域中對圖像的描述相對簡單。變換域中各變換系數(shù)之間的相關(guān)性明顯下降,能量主要集中在低頻部分,因而在進(jìn)行編碼時,可忽略某些能量很小的高頻分量,或者在量化時對方差較小的分分量分配較小的比特數(shù),從而實現(xiàn)數(shù)據(jù)壓縮。最佳線性正交變換3.6.1●工作原理

假設(shè)X是采樣后的N維時間(或空間)信號,選取X的一個正交變換,使Y=TX(3-53)Y為變換向量,T為正交變換矩陣。向量Y是由變換系數(shù)yi構(gòu)成的,Y是X在變換域中的表示。經(jīng)過變換以后,能量會幾種在少數(shù)變換系數(shù)上,因而把能量很小的系數(shù)忽略,達(dá)到數(shù)據(jù)壓縮的目的。

K-L變換(最佳線性正交變換):恢復(fù)X所產(chǎn)生的均方誤差最?。芰繐p失最?。-L變換無快速算法,很難滿足實時性要求。3.6.2離散余弦變換

離散余弦變換(DCT) DCT變換的結(jié)果與K-L變換十分接近,而且變換后具有較高的能量集中度。特別是當(dāng)信源的統(tǒng)計特性偏離一階平穩(wěn)馬爾可夫過程的規(guī)律時,其性能下降并不顯著。同時DCT變換又具有多種快速算法,因此在圖像壓縮編碼中得到了廣泛的應(yīng)用。

系數(shù)選擇

圖像信號在空間域中像素的相關(guān)性很大。當(dāng)它們經(jīng)過DCT變換后,變換系數(shù)之間的相關(guān)性大大下降,并且信號能量主要集中在低頻部分,為了進(jìn)一步壓縮編碼速率,因此忽略那些能量很小的高頻分量,不予以傳輸,而只對少數(shù)能量集中的方差大的變換系數(shù)進(jìn)行量化編碼。由此可見在變換編碼中選擇哪些變換系數(shù)進(jìn)行量化編碼,直接對系統(tǒng)性能構(gòu)成影響。1、DCT定義如果已知S(k)為信號樣值(一維實數(shù)信號序列),則一維DCT的正變換和反變換分別定義為:式中,為信號樣值;為變換系數(shù),且1、DCT定義由于二維DCT變換可以分解成行方向上的和列方向上的一維DCT變換,因此可以借助一維DCT變換推出MxN子塊的二維DCT的正變換和反變換:其中,2、DCT的快速算法基于DFT的DCT算法

令,則k個點的DFT可表示為:最終得到:結(jié)論:一個函數(shù)的DCT系數(shù),可以由該函數(shù)對應(yīng)的偶函數(shù)的DFT系數(shù)的實部得到。3.7子帶編碼●

基本原理

子帶編碼是一種在頻率域中進(jìn)行數(shù)據(jù)壓縮的算法。其指導(dǎo)思想是首先在發(fā)送端將圖像信號在頻率域分成若干子帶,然后分別對這些子帶信號進(jìn)行頻帶搬移,將其轉(zhuǎn)換成基帶信號,再根據(jù)奈奎斯特定理對各基帶信號進(jìn)行取樣、量化和編碼,最后合并成為一個數(shù)據(jù)流進(jìn)行傳送。●

子帶編碼的工作原理流程圖3.7子帶編碼●

采用子帶編碼的優(yōu)點可以利用人眼(或人耳)對不同頻率信號的感知靈敏度不同的特性,在人的聽覺或視覺不敏感的頻段采用較粗糙的量化,從而達(dá)到數(shù)據(jù)壓縮的目的。在子帶編碼中,各個子帶的量化噪聲都被束縛在本子帶內(nèi),這樣就可以避免能量較小的頻帶內(nèi)的信號被其他頻帶中的量化噪聲所掩蓋。3.9量化●3.9.1均勻量化器量化是將具有連續(xù)幅度值的輸入信號轉(zhuǎn)換到只有有限個幅度值的輸出信號的過程。在量化器中從輸入信號x到輸出信號y的轉(zhuǎn)換過程可以表示為:Xi:判決電平,即量化區(qū)間的端點Yi:輸出電平,即量化后的輸出電平均勻量化器的特性都是對稱的,且3.9量化●3.9.1均勻量化器均勻量化器的量化特性包括:中平型中升型具有死區(qū)的中平型量化誤差:式中,p(x)為量化器輸入信號x的概率分布函數(shù),N為量化級數(shù)。3.9量化●3.9.1均勻量化器均勻量化器的量化特性包括:中平型中升型具有死區(qū)的中平型量化誤差:式中,p(x)為量化器輸入信號x的概率分布函數(shù),N為量化級數(shù)。3.9.2最小均方誤差量化器●最小均方量化器——勞依德-麥可思量化器。如果輸入信號的統(tǒng)計特性已知,則可通過使均方量化誤差達(dá)到最小來設(shè)計量化級數(shù)為N的量化器的輸出電平和判決電平?!?/p>

必要條件

對xi和yi的偏導(dǎo)數(shù)均為0。●結(jié)論判決電平應(yīng)取在兩相鄰輸出電平的中間;輸出電平應(yīng)取在兩判決電平間隔對應(yīng)的概率密度函數(shù)的重心;3.9.3-3.9.5其它量化器●

最小熵量化器N足夠大時,采用均勻量化和熵編碼相結(jié)合實現(xiàn)聯(lián)合優(yōu)化?!褡赃m應(yīng)量化器根據(jù)信號特性的動態(tài)變化自動切換到相應(yīng)的量化器?!?/p>

預(yù)測誤差量化預(yù)測誤差引入的失真:顆粒噪聲邊緣忙亂斜率過載DPCM編碼中時常用非均勻(自適應(yīng))量化器●DCT系數(shù)量化DCT變換引入的失真:顆粒噪聲分辨率下降方塊效應(yīng)DCT編碼中時常用自適應(yīng)量化器3.10熵編碼熵編碼——無損壓縮編碼。根據(jù)消息出現(xiàn)的概率分布特性,在消息和碼字之間確定嚴(yán)格的對應(yīng)關(guān)系,以便準(zhǔn)確無誤地恢復(fù)數(shù)據(jù)。一般而言,圖像中某些數(shù)據(jù)出現(xiàn)概率比較高,而另一些出現(xiàn)概率較低。對出現(xiàn)概率高的數(shù)據(jù)分配短碼,對出現(xiàn)概率低的數(shù)據(jù)分配長碼。此種方式不舍棄數(shù)據(jù)冗余,只改變編碼分配的長度,因此總數(shù)據(jù)流量降低。3.10熵編碼熵編碼——

編碼方式分為定長和變長兩種方式。其中變長編碼可以得到更好的壓縮結(jié)果。●3.10.1熵編碼的基本概念若信源符號集A中的符號個數(shù)為M,編碼以后能達(dá)到的最大熵值為,若原信源的熵為H(X),編碼后的平均碼長為,則編碼效率:3.10.2霍夫曼編碼●

赫夫曼編碼——無損編碼?!?/p>

編碼原理——出現(xiàn)頻率高的數(shù)據(jù)編碼長度短,反之亦然。1、排序:按符號出現(xiàn)的概率從大到小進(jìn)行排列。2、賦值:對最后的兩個符號進(jìn)行賦值,概率大的賦“1”,概率小的賦“0”(反之也成立)。3、合并:將上述最后的兩個符號出現(xiàn)概率相加和成一個概率。4、重新排序:將合成后的概率與其它符號概率一起進(jìn)行重新排序(從大到?。H缓笾貜?fù)步驟2的內(nèi)容,直至最后只剩下兩個概率為止。5、碼字分配:從最后一步開始反向進(jìn)行碼字分配,對最后兩個概率中較大的賦“1”。對較小的賦“0”(與第二過程中的規(guī)定相同)。從而形成一個碼字。如下圖中虛線所示的方向?!?/p>

編碼特點①赫夫曼編碼所構(gòu)造的碼并不是惟一的,但其編碼效率是惟一的。②對不同信源其編碼效率是不同的。③存在誤碼傳播問題。3.10.2赫夫曼編碼

例假設(shè)某符號集X中包含6個符號:S1,S2,┈S6,各自出現(xiàn)的概率為X=

試求其赫夫曼編碼及其編碼效率。

解:1、赫夫曼編碼

在圖中給出了赫夫曼編碼過程,其中設(shè)兩個符號中較大的為”1”,較小的為”0”。編碼結(jié)果如表所示。3.10.2霍夫曼編碼3.10.2霍夫曼編碼2、編碼效率根據(jù)式可求出信源熵:=

=2.56可求出平均碼長

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論