第7章 圖像編碼及壓縮_第1頁(yè)
第7章 圖像編碼及壓縮_第2頁(yè)
第7章 圖像編碼及壓縮_第3頁(yè)
第7章 圖像編碼及壓縮_第4頁(yè)
第7章 圖像編碼及壓縮_第5頁(yè)
已閱讀5頁(yè),還剩92頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章

圖像編碼與壓縮李熙瑩副教授stslxy@一、序言1.為什么要進(jìn)行圖像壓縮?圖像的數(shù)據(jù)量巨大,對(duì)計(jì)算機(jī)的處理速度、存儲(chǔ)容量要求高。

——必須減少/壓縮數(shù)據(jù)量傳輸信道帶寬、通信鏈路容量一定,需要減少傳輸數(shù)據(jù)量,提高通信速度——采用編碼壓縮技術(shù)PALColourVideo:768×576×24×25=265.4Mbit/s1.5HourColourVideoImage:265.4Mbit×60×90=1433Gbit高清晰度電視HDTV:12807202460=1327Mbit/s電話通道:28.8Kbit/sISDN通道:10Mbit/s,1.5Mbit/s,64Kbit/s2.

實(shí)現(xiàn)圖像壓縮的依據(jù)——數(shù)據(jù)冗余數(shù)據(jù)冗余的概念 數(shù)據(jù)是信息的載體 同量的數(shù)據(jù)可表達(dá)不同量的信息 同量的信息可用不同量的數(shù)據(jù)表達(dá)冗余 數(shù)據(jù)表達(dá)了無(wú)用的信息 數(shù)據(jù)表達(dá)了已表達(dá)的信息相對(duì)數(shù)據(jù)冗余(數(shù)據(jù)冗余可定量描述)相對(duì)冗余:

壓縮率:

CR

在開(kāi)區(qū)間(0,)中取值

n1和n2代表2個(gè)數(shù)據(jù)集合中的信息載體單位的個(gè)數(shù)數(shù)據(jù)冗余類別(1)編碼冗余 與灰度分布的概率特性有關(guān)(2)像素相關(guān)冗余 空間冗余,幾何冗余(3)心理視覺(jué)冗余 與主觀感覺(jué)有關(guān)減少/消除其中的一種/多種冗余,就能取得數(shù)據(jù)壓縮的效果(1)編碼冗余圖像中灰度出現(xiàn)的概率 不同灰度出現(xiàn)的概率不同

平均比特?cái)?shù) 用較少的比特?cái)?shù)表示出現(xiàn)概率較大的灰度級(jí) 用較多的比特?cái)?shù)表示出現(xiàn)概率較小的灰度級(jí)圖像能量在變換域內(nèi)分布的不均勻性大部分能量集中在低頻部分小部分能量集中在高和較高的頻率部分(2)像素間冗余圖像像素間的相關(guān)性造成信息冗余??臻g冗余:鄰近像素灰度分布的相關(guān)性很強(qiáng)時(shí)間冗余:序列圖像幀間畫面對(duì)應(yīng)像素灰度的相關(guān)性很強(qiáng)頻間冗余:多譜段圖像中各譜段圖像對(duì)應(yīng)像素之間灰度相關(guān)性很強(qiáng)規(guī)則冗余大不規(guī)則冗余小(3)心理視覺(jué)冗余及其他應(yīng)用環(huán)境允許圖像有一定程度失真

——因人而異,因應(yīng)用要求而異心理視覺(jué)冗余 眼睛對(duì)某些視覺(jué)信息更敏感 人對(duì)某些視覺(jué)信息更關(guān)心心理視覺(jué)冗余與實(shí)在的視覺(jué)信息有聯(lián)系,發(fā)生損失不可逆轉(zhuǎn)。接收端圖像設(shè)備分辨率較低,則可降低圖像分辨率。應(yīng)用方關(guān)心圖像區(qū)域有限,可對(duì)其余部分圖像可采用空間和灰級(jí)上的粗化。3.

如何實(shí)現(xiàn)圖像壓縮?編碼是用符號(hào)數(shù)碼元素表示信號(hào)、消息或事件的過(guò)程。圖像編碼 采用對(duì)圖像的新的表達(dá)方法以減小所需的數(shù)據(jù)量

數(shù)據(jù)和信息:數(shù)據(jù)是信息的載體 對(duì)給定量的信息可用不同的數(shù)據(jù)量來(lái)表示 對(duì)給定量的信息,設(shè)法減少表達(dá)這些信息的 數(shù)據(jù)量稱為數(shù)據(jù)壓縮圖像壓縮過(guò)程就是編碼過(guò)程,解壓縮過(guò)程就是解碼過(guò)程。4.

圖像壓縮(編碼)的分類壓縮技術(shù)分為無(wú)損壓縮和有損壓縮。無(wú)損壓縮:在解碼時(shí)可以精確地恢復(fù)原圖像,沒(méi)有任何損失。壓縮比小。有損壓縮:在解碼時(shí)只能近似原圖像,不能無(wú)失真地恢復(fù)原圖像。壓縮比大。失真:編碼輸入圖像與解碼輸出圖像之間的隨機(jī)誤差。壓縮比:指原圖像比特?cái)?shù)與壓縮后圖像比特?cái)?shù)之比。舉例:張三先生現(xiàn)在北京出差,住在友誼賓館,計(jì)劃明天坐飛機(jī)回廣州,收到信息:“你的妻子王女士將于明天晚上7點(diǎn)05分在廣州新白云機(jī)場(chǎng)接你?!焙?jiǎn)化1:你的妻子明晚7點(diǎn)05分在新白云機(jī)場(chǎng)接你。(信息無(wú)損)簡(jiǎn)化2:王女士明晚7點(diǎn)機(jī)場(chǎng)接你。(信息有損)二、圖像壓縮的評(píng)價(jià)1.圖像壓縮的質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)在圖像壓縮編碼中,解碼圖像與原始圖像可能會(huì)有差異,需要評(píng)價(jià)壓縮后圖像的質(zhì)量。保真度(逼真度)準(zhǔn)則:描述解碼圖像相對(duì)原始圖像的偏離程度對(duì)信息損失的測(cè)度常用的準(zhǔn)則可分為兩大類:客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。(1)客觀保真度準(zhǔn)則最常用的客觀保真度準(zhǔn)則是原圖像f(x,y)和解碼圖像 之間的均方根誤差和均方根信噪比兩種。點(diǎn)誤差

圖誤差均方根誤差:均方信噪比:實(shí)際常使用歸一化信噪比(單位:分貝,dB) 其中,峰值信噪比不能很好反映圖像的實(shí)際視覺(jué)失真。因?yàn)榭陀^保真度是—種統(tǒng)計(jì)平均意義下的度量準(zhǔn)則,對(duì)于圖像中的細(xì)節(jié)無(wú)法反映出來(lái)。(2)主觀保真度準(zhǔn)則常用的方法:對(duì)一組(不少于20人)觀察者顯示圖像,并將他們對(duì)該圖像的評(píng)分取平均,用來(lái)評(píng)價(jià)一幅圖像的主觀質(zhì)量。主觀評(píng)價(jià)具有一定的不確定性。2.圖像壓縮算法的編碼效率編碼效率的測(cè)量,往往需要定義一些所謂“標(biāo)準(zhǔn)圖像”。壓縮比:

bpp:bitsperpixel傳輸比:

bps:bitspersecond3.圖像編碼模型信源編碼器的作用是減少或消除圖像中的編碼冗余、像素間冗余及心理視覺(jué)冗余。信道編碼器通過(guò)把可控制的冗余加入信源編碼后的碼字以減少信道噪聲的影響。信道編碼器的作用在信道有噪聲或易產(chǎn)生誤差時(shí),對(duì)整個(gè)編解碼過(guò)程非常重要。圖像編碼主要是研究信源編碼。信源編碼器信道編碼器信道解碼器信源解碼器信道輸入圖輸出圖三、信息論簡(jiǎn)介1.信息量假設(shè):信息的產(chǎn)生是一個(gè)概率過(guò)程一個(gè)發(fā)生概率為P(E)的隨機(jī)事件E

包含的信息是

I(E)稱為E的自信息(隨概率增加而減少)特例:如果P(E)=1(即事件總發(fā)生),則I(E)=0。信息的單位:比特(log以2為底)1個(gè)比特:即2個(gè)相等可能性的事件之一發(fā)生2.信息系統(tǒng)信源:指能夠產(chǎn)生信息的事物。信源通過(guò)信道與信宿(即信息用戶)連通以傳遞自信息數(shù)學(xué)表達(dá):信源是一概率場(chǎng),信源符號(hào)集A={a1,a2,…,aJ}

信源產(chǎn)生事件aj的概率為P(aj)

概率矢量:u=[P(a1)P(a2)…P(aJ

)]T用(A,u)可以完全描述信源信源信宿信道平均信息產(chǎn)生單個(gè)信源符號(hào)的自信息:I(aj)=–logP(aj) (7-1)產(chǎn)生k個(gè)信源符號(hào),符號(hào)aj平均來(lái)說(shuō)將產(chǎn)生kP(aj)次信源的平均信息(熵或不確定性):(7-2)定義了觀察到單個(gè)信源符號(hào)輸出時(shí)所獲得的平均信息量一幅8比特灰度圖像的平均信息:其中p(ai)表示像素u取ai值的概率,ai的取值范圍為0~28-1。信道信息信源的輸出是一個(gè)離散隨機(jī)變量

信道的輸出也是一個(gè)離散隨機(jī)變量

信道符號(hào)集:B={b1,b2,…,bK}概率矢量:v=[P(b1)P(b2)…P(bK)]T用(B,v)可以完全描述信道輸出和用戶接受到的信息信道輸出概率P(bk

)和信源u的概率分布信道傳遞矩陣輸出符號(hào)集的概率分布條件熵平均條件熵互信息信道容量3.互信息四、基本編碼定理定義編碼效率式中分子是信息熵,而分母則表示代碼的平均熵。冗余度為編碼目的:編碼后輸出的平均碼長(zhǎng)盡量最小編碼效率盡量趨近1冗余度Rd趨于零。1.無(wú)失真編碼定理(香農(nóng)第一定理)確定每信源符號(hào)(每像素值)可達(dá)到的最小平均碼字長(zhǎng)度。如果信道和傳輸系統(tǒng)都沒(méi)有誤差,傳輸系統(tǒng)的主要功能就是盡可能緊湊地表達(dá)信源(數(shù)據(jù)壓縮)零記憶信源:具有有限集合,且信源符號(hào)統(tǒng)計(jì)獨(dú)立的信源。可用(A,u)描述。其n階擴(kuò)展信源的的熵為產(chǎn)生塊隨機(jī)變量的(零記憶)信源的熵是對(duì)應(yīng)單符號(hào)信源的n倍n階擴(kuò)展信源的平均碼字長(zhǎng)度為零記憶信源的香農(nóng)第一定理:熵是在不造成信息失真的條件下,編碼的平均碼長(zhǎng)可能的最短值(編碼的下限)。編碼效率2.噪聲編碼定理(信道編碼定理

/香農(nóng)第二定理)如何編碼以保證可靠的傳輸?一種簡(jiǎn)單方法——多次重復(fù)傳輸每個(gè)符號(hào),利用多次投票原則減少解碼錯(cuò)誤概率。零記憶信源的信息產(chǎn)生率(信息單位/符號(hào))等于信源的熵H(u);其n階擴(kuò)展信息源的信息產(chǎn)生率等于H’(u)/n。對(duì)K個(gè)信源符號(hào),每符號(hào)傳輸r次,僅用其中s個(gè)碼字作為有效碼字。當(dāng)這s個(gè)碼字具有相同概率時(shí),可達(dá)到最大信息率(最大速率):香農(nóng)第二定理:對(duì)任意的R<C(信道容量),總存在一個(gè)整數(shù)r和塊長(zhǎng)為r的碼,使得塊解碼誤差的概率小于或等于任意,

>03.信源編碼定理(率失真定理)一個(gè)理想的圖像壓縮器應(yīng)具備:重構(gòu)圖像失真率低、壓縮比高以及設(shè)計(jì)編碼器和解碼器的計(jì)算復(fù)雜度低等?!獙?shí)際互相沖突香農(nóng)的信源編碼理論是建立在平均比特率和平均失真率這一相互沖突的矛盾之上。在比特率和失真率兩者之間取得平衡可以用幾種等價(jià)的方式定義:給定比特率R的約束下,使失真D最小;或給定失真值D的約束下,使所需傳輸?shù)谋忍芈蔙最??;或最小化拉格朗日函數(shù)D+λR,不同的拉格朗日算子λ可以在比特率和失真率之間起著權(quán)衡作用。如果從信源發(fā)出信息uk,經(jīng)過(guò)編、譯碼的組合,接受端得到信息為vl(由信道的噪聲造成),定義信源編碼經(jīng)過(guò)編、譯碼的平均互信息量為:率失真函數(shù):在一定允許的失真D條件下最低的平均互信息量R(D)是在平均失真小于允許失真D以內(nèi)能夠得到的編碼的碼率下界。香農(nóng)的信源編碼定理一個(gè)具有率失真函數(shù)R(D)的信源,若有平均失真D,并有兩個(gè)任意小的正數(shù)ε與δ,則必存在一種信源編碼、譯碼方法使信息率和平均失真率滿足

香農(nóng)信源編碼定理只說(shuō)明了碼率在一個(gè)界限以上編碼的可能性,并沒(méi)有給出具體的編碼方案。圖像也是一種信息,香農(nóng)的信源編碼理論對(duì)圖像編碼起著重要的指導(dǎo)作用。4.舉例編碼器是用符號(hào)集中的符號(hào)構(gòu)成輸出代碼,并建立輸入信號(hào)單元與輸出代碼的對(duì)應(yīng)關(guān)系。如下圖所示:

編碼器

消息集合輸出代碼

符號(hào)集符號(hào)(碼元)

分別表示要傳遞的四種可能 消息,如果我們選擇一符號(hào)集合A={1,2,3,4},每一個(gè)符號(hào)分別代表一種消息,n=4(符號(hào)個(gè)數(shù))則可以求出平均碼長(zhǎng)則

從上例可以看出,這兩種代碼長(zhǎng)度相同的編碼方法沒(méi)有得到最高的編碼效率,即沒(méi)作到用最少的碼字傳遞信源的消息。如何使平均碼長(zhǎng)短到極限?若A={0,1},n=2,選擇編碼方式:0、10、110、111,則平均碼長(zhǎng)則這種方式得到最高的編碼效率,是因?yàn)槊總€(gè)消息碼字長(zhǎng)度不同。由此可見(jiàn)至少有兩種編碼方式,即等長(zhǎng)碼和變長(zhǎng)碼。

五、無(wú)損壓縮編碼方法無(wú)損壓縮可以精確無(wú)誤地從壓縮數(shù)據(jù)中恢復(fù)出原始數(shù)據(jù)。應(yīng)用:醫(yī)療、商業(yè)、衛(wèi)星圖像等不可允許或不希望有數(shù)據(jù)損失的場(chǎng)合。常見(jiàn)的無(wú)損壓縮技術(shù)包括:基于統(tǒng)計(jì)概率的方法依據(jù)信息論中的變長(zhǎng)編碼定理和信息熵有關(guān)知識(shí),用較短代碼代表出現(xiàn)概率大的符號(hào),用較長(zhǎng)代碼代表出現(xiàn)概率小的符號(hào),從而實(shí)現(xiàn)數(shù)據(jù)壓縮?;舴蚵?Huffman)編碼、算術(shù)編碼基于字典技術(shù)的數(shù)據(jù)壓縮技術(shù)游程編碼(RunningLengthCoding,簡(jiǎn)稱為RLC)LZW編碼1.哈夫曼(Huffman)編碼消除編碼冗余最常用的技術(shù)。原理:利用信息符號(hào)概率分布特性的變字長(zhǎng)的編碼方法。對(duì)于出現(xiàn)概率大的信息符號(hào)編以短字長(zhǎng)的碼對(duì)于出現(xiàn)概率小的信息符號(hào)編以長(zhǎng)字長(zhǎng)的碼。優(yōu)點(diǎn):一旦哈夫曼碼獲得,編碼或解碼都可用簡(jiǎn)單的查找表實(shí)現(xiàn)。根據(jù)無(wú)失真編碼定理,哈夫曼編碼對(duì)固定的n值最優(yōu)。步驟:符號(hào)概率排序,并將出現(xiàn)概率最小的兩個(gè)符號(hào)的概率相加,合成一個(gè)概率;第二步把這個(gè)合成概率看成是一個(gè)新組合符號(hào)的概率;重復(fù)上述做法,直到最后只剩下兩個(gè)符號(hào)的概率為止。完成以上概率相加順序排列后,再反過(guò)來(lái)逐步向前進(jìn)行編碼;每一步有二個(gè)分支,各賦予一個(gè)二進(jìn)制碼,可以對(duì)概率大的編碼賦為0,概率小的編碼賦為1。符號(hào)概率

x10.4x20.3x30.1x40.1x50.06x60.041

0.40.30.10.10.120.40.30.20.130.40.30.340.60.4例1:設(shè)有編碼輸入。其頻率分布分別為,,現(xiàn)求其最佳霍夫曼編碼。解:Huffman編碼過(guò)程下圖所示:圖7.1哈夫曼編碼中的信源化簡(jiǎn)表7.1哈夫曼編碼分配過(guò)程x1x2x3x4x5x6符號(hào)概率編碼對(duì)0.6賦0,對(duì)0.4賦1;0.4傳遞到x1,所以x1的編碼是1。0.6傳遞到前一級(jí)是兩個(gè)0.3相加,大值是單獨(dú)一個(gè)元素x2的概率,小值是兩個(gè)元素概率之和,每個(gè)概率都小于0.3,所以x2賦予0,0.2和0.1求和的0.3賦予1。所以x2的編碼是00;剩余元素編碼的前兩個(gè)碼應(yīng)為01。0.1賦予1,0.2賦予0。以此類推,最后得到諸元素的編碼如下:經(jīng)霍夫曼編碼后,平均碼長(zhǎng)為:

= =0.4×1+0.30×2+0.1×3+0.1×4 +0.06×5+0.04×5 =2.20(bit)

該信源的熵為H=2.14bit,編碼后計(jì)算的平均碼長(zhǎng)為2.2bit,非常接近于熵。可見(jiàn)Huffman編碼是—種較好的編碼。優(yōu)點(diǎn):已被證明具有最優(yōu)變長(zhǎng)碼性質(zhì),平均碼長(zhǎng)最短,接近熵值。

缺點(diǎn):碼長(zhǎng)參差不齊,存在輸入、輸出速率匹配問(wèn)題。在存儲(chǔ)或傳輸過(guò)程中,如果出現(xiàn)誤碼,可能會(huì)引起誤碼的連續(xù)傳播。對(duì)不同信源其編碼效率不盡相同。應(yīng)用:需要與其他編碼結(jié)合起來(lái)使用,才能進(jìn)一步提高數(shù)據(jù)壓縮比。Huffman編碼特點(diǎn)2.香農(nóng)-費(fèi)諾編碼霍夫曼編碼法需要多次排序,當(dāng)很多時(shí)十分不便。費(fèi)諾(Fano)和香農(nóng)(Shannon)分別單獨(dú)提出類似的方法,使編碼更簡(jiǎn)單。具體編碼方法如下: (1)把按概率由大到小、從上到下排成一列,然后把分成兩組和,并使得

(2)把兩組分別按0,1賦值。 (3)然后分組、賦值,不斷反復(fù),直到每組只有一種輸入為止。將每個(gè)所賦的值依次排列起來(lái)就是費(fèi)諾—香農(nóng)編碼。以前面哈夫曼編碼的例子進(jìn)行香農(nóng)-費(fèi)諾編碼:輸入概率

x10.400x20.31010x30.11001100x40.111101x50.06101110x60.04111113.算術(shù)編碼算術(shù)編碼是從整個(gè)符號(hào)序列出發(fā),采用遞推形式連續(xù)編碼的方法,信源符號(hào)和碼字之間不存在一一對(duì)應(yīng)關(guān)系。算術(shù)編碼沒(méi)有對(duì)各輸入符號(hào)的信息量為整數(shù)的限制。算術(shù)編碼的基本思想:將要壓縮的數(shù)據(jù)X映射到[0,1)實(shí)數(shù)區(qū)間中的某一區(qū)段上的實(shí)數(shù)Y,該實(shí)數(shù)的二進(jìn)制展開(kāi)式即為原符號(hào)串的壓縮編碼結(jié)果。算術(shù)編碼通過(guò)對(duì)當(dāng)前的概率區(qū)間作迭代分割來(lái)確定實(shí)數(shù)。

算術(shù)編碼是具體構(gòu)造出的用小數(shù)表示信息的方法,因?yàn)樾?shù)隨位數(shù)的增加,它的精度也隨之提高,從信息的角度來(lái)說(shuō),它所含有的信息量也隨之增加。

例2:設(shè)輸入兩種符號(hào)A和B,它們出現(xiàn)的概率分別是3/4和1/4,需要編碼的信息為AABA。算術(shù)編碼過(guò)程如下:從[0,1)開(kāi)始,一個(gè)符號(hào)一個(gè)符號(hào)地迭代分解區(qū)間。第一字符A,取[0,1)區(qū)間的前3/4,即區(qū)間[0,3/4);第二字符A,取[0,3/4)區(qū)間的前3/4,即區(qū)間[0,9/16);第三字符B,取[0,9/16)區(qū)間的后1/4,即區(qū)間[27/64,9/16);第四字符A,取[27/64,9/16)區(qū)間的前3/4,即區(qū)間[27/64,135/64),其二進(jìn)制表示為[0.011011,0.10000111)圖7.2算術(shù)編碼過(guò)程圖解表7.2算術(shù)編碼示例例2:四符號(hào)信源信息a1a2a3a3a4的算術(shù)編碼過(guò)程見(jiàn)圖7.2和表7.2。優(yōu)點(diǎn):不同的輸入符號(hào)一定落入不同的區(qū)間,編碼結(jié)果唯一。信息中所用符號(hào)出現(xiàn)的概率愈大,對(duì)應(yīng)的區(qū)間愈大,愈有機(jī)會(huì)選擇較短的碼字表示。編碼的符號(hào)數(shù)目足夠多時(shí),編碼效率趨于熵值。相比哈夫曼編碼,壓縮率較高。編碼算法與符號(hào)概率統(tǒng)計(jì)是相互獨(dú)立的,更易于實(shí)現(xiàn)自適應(yīng)。缺點(diǎn):不是即時(shí)碼,必須等到所有信息收到后才能解碼。需要幾乎無(wú)限精度的實(shí)數(shù)運(yùn)算,實(shí)際的程序只能是用有限精度的整數(shù)運(yùn)算實(shí)現(xiàn)。算術(shù)編碼特點(diǎn)4.1-D游程編碼

(runlengthcoding,RLC)利用空間冗余度壓縮圖像,屬于統(tǒng)計(jì)編碼類。原理:用一系列描述黑色或白色像素的連續(xù)行程的長(zhǎng)度表示二值圖像或位平面的每一行。對(duì)于圖像編碼,可以定義沿特定方向上具有相同灰度值的相鄰像元為一輪,其延續(xù)長(zhǎng)度稱之為延續(xù)的行程,簡(jiǎn)稱為“游程”。游程終點(diǎn)位置由前一游程終點(diǎn)的相對(duì)距離確定,這樣就可以由(灰度游程)串來(lái)表示圖像數(shù)據(jù)。XSCRL串字符串位置串長(zhǎng)游程編碼分為定長(zhǎng)游程編碼和變長(zhǎng)游程編碼兩種。定長(zhǎng)游程編碼是指編碼的游程所使用的二進(jìn)制位數(shù)固定。變長(zhǎng)游程變碼是指對(duì)不同范圍的游程使用不同位數(shù)的二進(jìn)制位數(shù)進(jìn)行編碼。應(yīng)用:游程編碼一般不直接應(yīng)用于多灰度圖像比較適合于二值圖像的編碼——傳真編碼的標(biāo)準(zhǔn)壓縮方法為了達(dá)到較好的壓縮效果,有時(shí)和其它編碼方法混合使用。四、預(yù)測(cè)編碼統(tǒng)計(jì)冗余數(shù)據(jù)壓縮理論的三個(gè)重要分支之一?;舅枷耄簻p少數(shù)據(jù)在時(shí)間和空間上的相關(guān)性。預(yù)測(cè): 圖像的相鄰像素之間有著較強(qiáng)的相關(guān)性(統(tǒng)計(jì)特性)——某像素的值可根據(jù)以前已知的幾個(gè)像素來(lái)估計(jì)。編碼原理:通過(guò)提取每個(gè)像素中的新增信息并進(jìn)行編碼,以消除像素間的冗余。設(shè)圖像預(yù)測(cè)估計(jì)為:新增信息(即預(yù)測(cè)誤差值):圖像預(yù)測(cè)估計(jì)準(zhǔn)則:最小均方優(yōu)化準(zhǔn)則。(a)預(yù)測(cè)誤差圖像(b)原圖直方圖(c)(a)的直方圖圖7.3圖像的預(yù)測(cè)編碼1.無(wú)損預(yù)測(cè)編碼對(duì)差值信號(hào)不進(jìn)行量化而直接編碼就稱之為無(wú)損預(yù)測(cè)編碼。預(yù)測(cè)器源圖像熵編碼器編碼表壓縮源圖像圖7.4無(wú)損預(yù)測(cè)編碼編碼器工作原理

由先前三點(diǎn)預(yù)測(cè)可以定義為:其中a1、a2、a3稱預(yù)測(cè)系數(shù),都是待定參數(shù)。如果預(yù)測(cè)器中預(yù)測(cè)系數(shù)是固定不變的常數(shù),稱之為線性預(yù)測(cè)。預(yù)測(cè)誤差:2.有損預(yù)測(cè)編碼在預(yù)測(cè)編碼中,對(duì)差值信號(hào)進(jìn)行量化后再進(jìn)行編碼就稱之為有損預(yù)測(cè)編碼。消除心理視覺(jué)冗余數(shù)據(jù)。量化:量化器將預(yù)測(cè)誤差映射進(jìn)有限個(gè)輸出中。確定了有損編碼中的壓縮量和失真量。預(yù)測(cè)器輸入:有損預(yù)測(cè)方法:差分脈沖編碼調(diào)制(DifferentialPulseCodeModulation,簡(jiǎn)稱DPCM)——最典型DM(德?tīng)査{(diào)制)方法——最簡(jiǎn)單(1)DM(德?tīng)査{(diào)制)一種簡(jiǎn)單的有損預(yù)測(cè)編碼方法,預(yù)測(cè)器和量化器分別定義為:預(yù)測(cè)誤差圖像

解碼后圖像,erms=25.5558

圖7.5DM編碼的圖例(失真較為嚴(yán)重)圖7.6DM編碼中的失真示例DM有損預(yù)測(cè)編碼:主要的圖像損傷斜率過(guò)載:圖像掃描行越過(guò)黑白邊界,預(yù)測(cè)誤差可能比最大的量化輸出大得多——復(fù)原圖像的水平/垂直方向分辨能力降低,黑白邊緣變得模糊。顆粒噪聲:如果最小量化輸出(絕對(duì)值)不夠小,在圖像亮度值緩慢變化的區(qū)域(平坦區(qū)域),可能在正負(fù)兩個(gè)最小量化輸出之間來(lái)回振蕩,出現(xiàn)顆粒細(xì)斑——視覺(jué)對(duì)此噪聲敏感度高。偽輪廓圖像:對(duì)于較小(絕對(duì)值)的預(yù)測(cè)誤差的量化區(qū)間太大,即量化特性曲線太粗糙,則在圖像亮度值緩慢增大或下降的區(qū)域,將產(chǎn)生偽輪廓圖像,類似等高線構(gòu)成的圖。(2)差分脈沖編碼調(diào)制(DPCM)預(yù)測(cè)器預(yù)測(cè)器:最優(yōu)準(zhǔn)則:最小化均方預(yù)測(cè)誤差最優(yōu)濾波器設(shè)計(jì):選擇m個(gè)預(yù)測(cè)系數(shù),使下式最小。預(yù)測(cè)系數(shù)為保證預(yù)測(cè)器的輸出落入允許的灰度值范圍,并減少傳輸噪聲的影響(水平條紋)。DPCM系統(tǒng)由編碼器和解碼器組成,它們各有一個(gè)相同的預(yù)測(cè)器。量化器編碼器預(yù)測(cè)器信道傳輸解碼器輸入輸出預(yù)測(cè)器圖7.7DPCM有損編碼系統(tǒng)DPCM系統(tǒng)的工作原理圖預(yù)測(cè)模型特點(diǎn)預(yù)測(cè)模型的復(fù)雜程度取決于線性預(yù)測(cè)中使用以前樣本的數(shù)目,樣本點(diǎn)越多,預(yù)測(cè)器就越復(fù)雜。預(yù)測(cè)器的好壞取決于預(yù)測(cè)系數(shù)。4階線性預(yù)測(cè)器:

(7-1)(7-1)式中的系數(shù)賦值不同,可得到不同的預(yù)測(cè)器:一階:二階:三階:一階自適應(yīng):圖7.8DPCM編碼中不同預(yù)測(cè)器的效果比較上排:不同預(yù)測(cè)器(一階、二階、三階、一階自適應(yīng))編碼后 得到的解碼圖(均采用2級(jí)德?tīng)査炕鳎┫屡牛簩?duì)應(yīng)誤差圖(原圖和編碼解碼圖的差)采用自適應(yīng)系數(shù)預(yù)測(cè)編碼后的重構(gòu)圖像a1=0.340,a2=0.664,a3=-0.005根據(jù)輸入圖像來(lái)確定預(yù)測(cè)系數(shù)另外一種采用的是固定的預(yù)測(cè)系數(shù)采用固定系數(shù)預(yù)測(cè)編碼后的結(jié)果a1=0.5,a2=0.5,a3=-0.5直接采用均勻標(biāo)量量化后的結(jié)果在實(shí)驗(yàn)中采用幾種不同的預(yù)測(cè)系數(shù)

圖7.9DPCM編碼中不同預(yù)測(cè)系數(shù)的效果比較預(yù)測(cè)編碼的效果圖

預(yù)測(cè)誤差圖預(yù)測(cè)編碼的誤差圖

圖7.10DPCM編碼中不同量化器量化的效果比較(一階線性預(yù)測(cè)器,Lloyd-Max量化器)第一列:2級(jí)量化,均方根誤差erms=21.5608;第二列:4級(jí)量化,均方根誤差erms=10.6673;第三列:8級(jí)量化,均方根誤差erms=5.8239。預(yù)測(cè)編碼壓縮數(shù)據(jù)的基礎(chǔ):如果模型足夠好且樣本序列在時(shí)間上相關(guān)性較強(qiáng),那么誤差信號(hào)的幅度將遠(yuǎn)遠(yuǎn)小于原始信號(hào)——預(yù)測(cè)誤差分布更加集中,即熵值比原來(lái)圖像小。由于量化和傳送的僅是誤差信號(hào),可用較少的單位像素比特率進(jìn)行編碼,使得圖像數(shù)據(jù)得以壓縮。應(yīng)用:對(duì)于視頻信號(hào),預(yù)測(cè)編碼充分利用了連續(xù)幀之間的統(tǒng)計(jì)冗余性,是當(dāng)今主流技術(shù)并且還會(huì)流行于未來(lái)。對(duì)于靜止圖像,預(yù)測(cè)編碼將被圖像變換編碼所取代。五、變換編碼1.變換編碼的基本原理圖像變換會(huì)使圖像信號(hào)能量在空間重新分布,總能量不變。(例)像素之間的相關(guān)性下降;能量集中在變換域中少數(shù)的變換系數(shù)上根據(jù)統(tǒng)計(jì)編碼的原理,能量分布集中,熵值最小,可實(shí)現(xiàn)平均碼長(zhǎng)最短。在正交空間中用變換系數(shù)來(lái)表示原始圖像,并對(duì)變換系數(shù)進(jìn)行編碼。在接收端進(jìn)行反變換就可以得到重構(gòu)圖像。例:給定Lena圖像的一個(gè)平坦區(qū)域(8×8子塊)如下:6971757984899169707376839095777476748589957173767986919374777782889193787680848892957678808593949574798185869494給出DCT變換系數(shù)量化過(guò)程。解:如下是它的DCT變換系數(shù),可以看到能量集中在少數(shù)低頻系數(shù):

660.1250﹣47.049625.998010.39937.87508.48665.60251.3176﹣17.3267﹣2.67495.2236﹣1.32340.52220.29140.2800﹣2.2810.0280﹣0.6463﹣0.95450.96202.47301.9783﹣0.3162.17412.30030.4542﹣2.24033.55591.2907﹣1.00240.15800.9747﹣2.37500.1038﹣3.22200.96531.37502.22580.38753.52360.9294﹣1.3282﹣2.42560.9828﹣1.9317﹣0.69720.1253﹣1.8560.39432.6640﹣0.5669﹣3.4168﹣0.8891﹣1.6182﹣2.545﹣1.7322.16661.7238﹣0.3335﹣0.4808﹣2.6253﹣0.96991.4854﹣1.183用JPEG的亮度量化矩陣式對(duì)每個(gè)系數(shù)進(jìn)行均勻量化,量化器輸出為:

41﹣431000010000000000000000000000000000000000000000000000000000000反量化后,進(jìn)行DCT反變換,得到的解碼圖像為:

8075717278858990 8075717278858990 8076727379869091 8177727480879192 8277737481879193 8378747581889293 8379757682899394 84797576828993942.變換編碼系統(tǒng)圖7.11一個(gè)典型的變換編碼系統(tǒng)(a)編碼器;(b)解碼器編碼部分:子圖像分解、變換、量化和編碼自適應(yīng)變換編碼:任一步驟都可以根據(jù)圖像局部?jī)?nèi)容調(diào)整非自適應(yīng)變換編碼:所有步驟對(duì)所有子圖像都固定3.變換選擇各種二維離散(正交)變換都可用于變換編碼。不同變換的信息集中能力、重建誤差和計(jì)算復(fù)雜度不同。信息集中能力:

KLT(卡胡南-列夫變換)>DCT>DFT>WHT所需計(jì)算量:

KLT>>DCT>DFT>WHTDCT是較好的(綜合)選擇,塊效應(yīng)最小,應(yīng)用多。主要算法:基于塊的DCT變換+量化+熵編碼數(shù)據(jù)壓縮不是在變換步驟取的,而是在量化變換的系數(shù)時(shí)取得的。圖7.12使用(a)DFT,(c)Hadamard變換,(e)DCT對(duì)右上圖的近似,以及對(duì)應(yīng)的標(biāo)定后的誤差圖像4.子圖像尺寸選擇圖像分塊:在DCT為主要方法的變換編碼中,將M×N的一幅圖像分成不重疊的M/K×N/K個(gè)塊(每塊大小K×K),分別進(jìn)行變換。主要好處:第一,降低運(yùn)算量,如對(duì)一幅512×512圖像,分塊變換僅需約1/3的運(yùn)算量;其次,后續(xù)的量化和掃描處理可以得到明顯的簡(jiǎn)化;第三,容易將傳輸誤差引起的錯(cuò)誤控制在一個(gè)塊內(nèi),而不是整個(gè)圖像擴(kuò)散。子圖像尺寸影響變換編碼誤差和計(jì)算復(fù)雜度。多數(shù)情況將圖像分割成尺寸滿足以下兩個(gè)條件的子圖像:相鄰子圖像之間的相關(guān)(冗余)減少到某個(gè)可接受的水平;子圖像的長(zhǎng)和寬都是2的整數(shù)次冪(減少子圖像變換的計(jì)算量),最常用尺寸是8×8和16×16。圖7.13

重構(gòu)誤差與子圖像尺寸的關(guān)系圖7.14

使用25%的DCT系數(shù)對(duì)標(biāo)準(zhǔn)圖的近似。

(a)和(b)為8×8大小的子圖像結(jié)果,

(c)放大的原圖像

(d)2×2大小的結(jié)果

(e)4×4大小的結(jié)果

(f)8×8大小的結(jié)果5.比特分配截?cái)嗾`差和2個(gè)因素有關(guān):截除的變換系數(shù)的數(shù)量和相對(duì)重要性;用來(lái)表示所保留系數(shù)的精度。多數(shù)變換編碼系統(tǒng)中保留的系數(shù)根據(jù)下列2個(gè)準(zhǔn)則之一選擇確定:最大方差準(zhǔn)則——區(qū)域編碼最大幅度準(zhǔn)則——閾值編碼整個(gè)對(duì)變換子圖像的系數(shù)截?cái)?、量化和編碼的全過(guò)程稱為比特分配?!獢?shù)據(jù)壓縮的關(guān)鍵圖7.15使用8×8DCT系數(shù)的12.5%對(duì)標(biāo)準(zhǔn)圖的近似。(a),(c)和(e)為閾值編碼結(jié)果,(b),(d)和(f)是區(qū)域編碼結(jié)果六、圖像壓縮標(biāo)準(zhǔn)圖像編碼標(biāo)準(zhǔn)制定主要由國(guó)際標(biāo)準(zhǔn)化組織ISO(internationalstadardizationorganization和國(guó)際電信聯(lián)盟(internationaltelecommunicationunion)進(jìn)行。ITU的前身是國(guó)際電話電報(bào)咨詢委員會(huì)CCITT(consultativecommitteeoftheinternationaltelephoneandtelegrah)。有關(guān)圖像編碼的國(guó)際標(biāo)準(zhǔn)處理圖像類型包括:二值圖像靜止灰度(和彩色)圖像序列(連續(xù)幀)灰度(和彩色)圖像(視頻圖像)1.二值圖像壓縮標(biāo)準(zhǔn)G3和G4:最初是CCITT為傳真應(yīng)用設(shè)計(jì)的。G3采用了非自適應(yīng)、1-D游程編碼技術(shù),對(duì)標(biāo)準(zhǔn)試驗(yàn)圖的壓縮率約為15:1。G4是G3的一種簡(jiǎn)化版本,比G3壓縮率高1倍。JBIG:由ISO、ITU的二值圖聯(lián)合組(jointbelevelimaginggroup,JBIG)于1991年制定。采用自適應(yīng)技術(shù),壓縮比相對(duì)G3、G4可提高1.1~1.5倍。2.靜止圖像壓縮標(biāo)準(zhǔn)——JPEGJPEG(JointPhotographicExpertGroup,簡(jiǎn)稱JPEG)是聯(lián)合圖像專家小組的英文縮寫。其中“聯(lián)合”的含意是指,國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)和國(guó)際標(biāo)淮化協(xié)會(huì)(ISO)聯(lián)合組成的一個(gè)圖像專家小組。國(guó)際上彩色、灰度、靜止圖像的第一個(gè)國(guó)際標(biāo)準(zhǔn)。電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標(biāo)準(zhǔn)(M-JPEG)。實(shí)際定義了三種編碼系統(tǒng):基于DCT的有損編碼基本系統(tǒng),可用于絕大多數(shù)壓縮應(yīng)用場(chǎng)合;用于高壓縮比、高精確度或漸進(jìn)重建應(yīng)用的擴(kuò)展編碼系統(tǒng);用于無(wú)失真應(yīng)用場(chǎng)合無(wú)損系統(tǒng)。JPEG的工作模式JPEG對(duì)每一個(gè)圖像分量單獨(dú)編碼。JPEG對(duì)每個(gè)不同的圖像分量可以采用不同的量化參數(shù)和熵編碼的碼表對(duì)于一個(gè)圖像分量,JPEG提供4種工作模式。順序編碼:每一個(gè)圖像分量按從左到右,從上到下掃描,一次掃描完成編碼。(JPEG2000)累進(jìn)編碼:圖像編碼在多次掃描中完成。(JPEG2000)無(wú)失真編碼:解碼后能精確地恢復(fù)源圖像采樣值,其壓縮比低于有失真壓縮編碼方法。分層編碼:圖像在多個(gè)空間分辨率進(jìn)行編碼。JPEG標(biāo)準(zhǔn)算法的基本步驟圖像分塊(8×8),用DCT變換去除圖像相關(guān)信息冗余度;對(duì)變換系數(shù)按一定準(zhǔn)則(如人眼最佳效果)進(jìn)行量化;對(duì)數(shù)據(jù)進(jìn)行熵編碼(變長(zhǎng)碼)。編碼器的輸入端:把原始圖像順序地分割成一系列8×8的子塊,設(shè)原始圖像的采樣精度為P位,是無(wú)符號(hào)整數(shù),輸入時(shí)把[0,2P]范圍的無(wú)符號(hào)整數(shù)變成[-2P-1,2P-1-1]范圍的有符號(hào)整數(shù),以此作為離散余弦正變換的輸入。解碼器的輸出端:經(jīng)離散余弦逆變換(IDCT)后,得到一系列8×8的圖像數(shù)據(jù)塊,需將其數(shù)值范圍由[-2P-1

,2P-1-1]再變回到[0,2P]范圍內(nèi)的無(wú)符號(hào)整數(shù),來(lái)獲得重構(gòu)圖像。為了達(dá)到壓縮數(shù)據(jù)的目的,對(duì)DCT系數(shù)需作量化處理,即在一定的主觀保真度圖像質(zhì)量前提下,丟掉那些對(duì)視覺(jué)效果影響不大的信息。在JPEG中采用線性均勻量化器,量化定義為對(duì)64個(gè)DCT系數(shù)除以量化步長(zhǎng),四舍五入取整。量化處理是一個(gè)多到一的映射,它是造成DCT編解碼信息損失的根源。解碼器逆變換(IDCT)反量化器熵解碼器量化表熵編碼器恢復(fù)的圖像數(shù)據(jù)圖7.17JPEG解編過(guò)程框圖

8×8塊編碼器DCT正變換量化器熵編碼器量化表熵編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)圖7.16JPEG基本系統(tǒng)編碼器框圖圖7.18JPEG編碼效果示例(a)標(biāo)準(zhǔn)測(cè)試圖(256x256,256灰度級(jí))(b)~(h)選擇壓縮比為48、32、22、15、11、8和2.2進(jìn)行編碼又解碼得到的結(jié)果圖(i)~(l)分別對(duì)應(yīng)壓縮比為48、22、11和2.2的誤差圖JPEG2000提高了圖像壓縮質(zhì)量,尤其是低碼率時(shí)的壓縮質(zhì)量。增加許多功能。編碼變換采用小波變換。小波變換編解碼系統(tǒng)中沒(méi)有圖像分塊的模塊。小波變換的計(jì)算效率很高,且本質(zhì)上具有局部性,不會(huì)產(chǎn)生使用DCT變換在高壓縮比時(shí)的塊效應(yīng)。圖7.19小波編碼解編過(guò)程框圖

3.序列圖像(視頻)壓縮標(biāo)準(zhǔn)視頻信號(hào)的壓縮包括兩個(gè)主要方面:幀內(nèi)(Intraframe)壓縮:僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息。也稱空間壓縮(Spatialcompression)。幀間(Interframe)壓縮:通過(guò)比較時(shí)間軸上不同幀之間的數(shù)據(jù)進(jìn)行壓縮。也稱為時(shí)間壓縮(Temporalcompression)。視頻圖像在時(shí)域上呈現(xiàn)出的相關(guān)性比空域相關(guān)性要深得多。物體的運(yùn)動(dòng)是構(gòu)成幀差別的主要原因。運(yùn)動(dòng)補(bǔ)償和運(yùn)動(dòng)估計(jì)技術(shù)——各種視頻壓縮編碼中的關(guān)鍵技術(shù)。視頻灰度/彩色圖像壓縮的國(guó)際標(biāo)準(zhǔn)主要有:H.261、H.263、H.264MPEG-1、MPEG-2、MPEG-4、MPEG-7圖7.20

序列灰度圖像壓縮國(guó)際標(biāo)準(zhǔn)編碼器基本框圖(1)H.261~H.264ITU-T視頻編碼標(biāo)準(zhǔn)系列主要應(yīng)用于實(shí)時(shí)視頻通信領(lǐng)域,如會(huì)議電視。H.261:序列灰度圖像壓縮標(biāo)準(zhǔn),1990年制定。為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開(kāi)展雙向聲像業(yè)務(wù)(可視電話、視頻會(huì)議)而制定的速率為64kb/s的整數(shù)倍只對(duì)CIF和QCIF兩種圖像格式進(jìn)行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來(lái)處理。擴(kuò)展了基于DCT的壓縮方法,包含了減少幀間冗余的方法。序列中的第1幀(或某參考幀,I-frame)圖用類似JPEG的DCT壓縮,以減少幀內(nèi)冗余度;估計(jì)目標(biāo)運(yùn)動(dòng),減少幀間冗余度(預(yù)測(cè)幀,P-frame)。H.263為低于64kb/s的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn)標(biāo)準(zhǔn)輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論