第10章 圖像壓縮編碼_第1頁
第10章 圖像壓縮編碼_第2頁
第10章 圖像壓縮編碼_第3頁
第10章 圖像壓縮編碼_第4頁
第10章 圖像壓縮編碼_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第10章圖像壓縮編碼

圖像編碼的研究背景

——

通信方式改變帶來的需求信息傳輸方式發(fā)生了很大的改變通信方式的改變

文字+語音圖像+文字+語音通信對象的改變

人與人人與機器,機器與機器圖像編碼的研究背景

——

通信方式改變帶來的需求由于通信方式和通信對象的改變帶來的最大問題是:

傳輸帶寬、速度、存儲器容量的限制。給我們帶來了一個難題,也給了我們一個機會:

如何用軟件的手段來解決硬件上的物理極限。圖像編碼的研究背景

——

海量數(shù)據(jù)帶來的需求數(shù)碼圖像的普及,導致了數(shù)據(jù)量的龐大。圖像的傳輸與存儲,必須解決圖像數(shù)據(jù)的壓縮問題。彩色視頻數(shù)據(jù)量分析對于電視畫面的分辨率640*480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為:

640*480*24*30=221.12M播放時,需要221Mbps的通信回路。

彩色視頻數(shù)據(jù)量分析實時傳輸:在10M帶寬網(wǎng)上實時傳輸?shù)脑?,需要壓縮到原來數(shù)據(jù)量的0.045,即1.08bit/pixel。存儲:

(按1張光盤可存640M計算)如果不進行壓縮,1張CD則僅可以存放2.89秒的數(shù)據(jù)。存2小時的信息則需要壓縮到原來數(shù)據(jù)量的0.0004,即:0.003bit/pixel。傳真數(shù)據(jù)量分析如果只傳送2值圖像,以200dpi的分辨率傳輸,一張A4稿紙的數(shù)據(jù)量為:

1654*2337*1=3888768bit=3900K按14.4K的電話線傳輸速率,需要傳送的時間是:270秒(4.5分)

圖像通信系統(tǒng)模型圖像信息源圖像預處理圖像信源

編碼信道編碼調(diào)制信道傳輸解調(diào)信道解碼圖像信源

解碼顯示圖像討論的內(nèi)容數(shù)據(jù)的冗余圖像壓縮編碼簡介行程編碼Huffman編碼DCT變換編碼混合編碼數(shù)據(jù)的冗余——

基本概念我們從一個互動游戲來體會數(shù)據(jù)冗余的概念。在下面的例子中,用一種最好的方式來發(fā)送一封電報。數(shù)據(jù)的冗余——

基本概念你的妻子,Helen,將于明天晚上6點零5分在上海的虹橋機場接你。

(23*2+10=56個半角字符)你的妻子將于明天晚上6點零5分在虹橋機場接你

(20*2+2=42個半角字符)

Helen將于明晚6點在虹橋接你

(10*2+6=26個半角字符)結(jié)論:只要接收端不會產(chǎn)生誤解,就可以減少承載信息的數(shù)據(jù)量。數(shù)據(jù)冗余——描述上的冗余描述方式:

1)這是一幅2*2的圖像,圖像的第一個像素是紅的,第二個像素是紅的,第三個像素是紅的,第四個像素是紅的。

2)這是一幅2*2的圖像,整幅圖都是紅色的。由此我們知道,整理圖像的描述方法可以達到壓縮的目的。1234圖像冗余——數(shù)據(jù)冗余的壓縮圖像冗余無損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來的16*3*8=384bits壓縮為:(1+3)*8=32bits壓縮比為:12:1圖像冗余——數(shù)據(jù)冗余的壓縮圖像冗余有損壓縮的原理36353434343434323434333730343434343434343435343431343434343434343434343434343434343434343434343434342534圖像冗余

——

實際圖像中的像素冗余

實際圖像中冗余信息的表現(xiàn)(灰度圖)圖像冗余——視覺冗余的壓縮圖像的視覺冗余(彩色)

R

G

B2488822*2*2=242=16,777,216(248,27,4)(251,32,15)(248,27,4)(248,27,4)

圖像編碼與壓縮從本質(zhì)上來說就是對要處理的圖像源數(shù)據(jù)按一定的規(guī)則進行變換和組合,從而達到以盡可能少的代碼(符號)來表示盡可能多的數(shù)據(jù)信息,壓縮通過編碼來實現(xiàn),或者說編碼帶來壓縮的效果,所以一般把此項處理稱之為壓縮編碼。

圖像壓縮編碼的可能性

數(shù)據(jù)是用來表示信息的,如果不同的方法為表示給定量的信息使用了不同的數(shù)據(jù)量,那么使用較多數(shù)據(jù)量的方法中,有些數(shù)據(jù)必然是代表了無用的信息,或者是重復地表示了其他數(shù)據(jù)已經(jīng)表示的信息,這就是數(shù)據(jù)冗余的概念。由于圖像數(shù)據(jù)本身固有的冗余性和相關(guān)性,使得將一個大的圖像數(shù)據(jù)文件轉(zhuǎn)換成較小的圖像數(shù)據(jù)文件成為可能,圖像數(shù)據(jù)壓縮就是要去掉信號數(shù)據(jù)的冗余性,一般來說,圖像數(shù)據(jù)中存在著以下幾種冗余:

(1)空間冗余(像素間冗余、幾何冗余):這是圖像數(shù)據(jù)中所經(jīng)常存在的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面是有序的而不是完全雜亂無章的排列)的表面物理特性具有相關(guān)性,這些相關(guān)性的光成像結(jié)果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。(2)時間冗余:在序列圖像(電視圖像、運動圖像)中,相鄰兩幀圖像之間有較大的相關(guān)性。如圖所示,F(xiàn)l幀中有一個小汽車和一個路標,在時間T后的F2圖像中仍包含以上兩個物體,只是小車向前行駛了一段路程,此時F1和F2中的路標和背景都是時間相關(guān)的,小車也是時間相關(guān)的,因而F2和Fl具有時間冗余。

(a)F1幀

(b)F2幀時間冗余示例(3)信息熵冗余:也稱為編碼冗余,如果圖像中平均每個像素使用的比特數(shù)大于該圖像的信息熵,則圖像中存在冗余,稱為信息熵冗余。(4)結(jié)構(gòu)冗余:有些圖像存在較強的紋理結(jié)構(gòu),如墻紙、草席等圖像,稱之存在結(jié)構(gòu)冗余。(5)知識冗余:有許多圖像的理解與某些基礎知識有相當大的相關(guān)性,例如人臉的圖像有固定的結(jié)構(gòu),比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等等,這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,稱此類冗余為知識冗余。(6)心理視覺冗余:人類的視覺系統(tǒng)對于圖像場的注意是非均勻和非線性的,特別是視覺系統(tǒng)并不是對于圖像場的任何變化都能感知,即眼睛并不是對所有信息都有相同的敏感度,有些信息在通常的視覺感覺過程中與另外一些信息相比來說并不那么重要,這些信息可認為是心理視覺冗余的,去除這些信息并不會明顯地降低所感受到的圖像的質(zhì)量。心理視覺冗余的存在是與人觀察圖像的方式有關(guān)的,人在觀察圖像時主要是尋找某些比較明顯的目標特征,而不是定量地分析圖像中每個像素的亮度,或至少不是對每個像素等同地分析,人通過在腦子里分析這些特征并與先驗知識結(jié)合以完成對圖像的解釋過程,由于每個人所具有的先驗知識不同,對同一幅圖像的心理視覺冗余也就因人而異。

圖像壓縮原理由于一幅圖像存在數(shù)據(jù)冗余和主觀視覺冗余,所以壓縮方式就可以從這兩方面著手開展。改變圖像信息的描述方式,以壓縮掉圖像中的數(shù)據(jù)冗余。忽略一些視覺不太明顯的微小差異,以壓縮掉圖像中的視覺冗余。圖像的壓縮編碼第一代壓縮編碼

八十年代以前,主要是根據(jù)傳統(tǒng)的信源編碼方法。第二代壓縮編碼

八十年代以后,突破信源編碼理論,結(jié)合分形、模型基、神經(jīng)網(wǎng)絡、小波變換等數(shù)學工具,充分利用視覺系統(tǒng)生理心理特性和圖像信源的各種特性。圖像的壓縮編碼像素編碼變換編碼預測編碼位平面編碼增量調(diào)制熵編碼算術(shù)編碼DCT變換DPCM調(diào)制第一代壓縮編碼其他編碼行程編碼圖像的壓縮編碼子帶編碼模型編碼分層編碼分型編碼第二代壓縮編碼

圖像壓縮編碼的系統(tǒng)評價

在圖像編碼中,編碼質(zhì)量是一個非常重要的概念,怎樣以盡可能少的比特數(shù)來存儲或傳輸一幅圖像,同時又讓接收者感到滿意,這是圖像編碼的目標。對于圖像編碼的質(zhì)量評價主要體現(xiàn)在基于壓縮編碼參數(shù)的評價、基于保真度(逼真度)準則的評價、算法的適用范圍、算法的復雜度等四個方面。

壓縮比:壓縮比是衡量數(shù)據(jù)壓縮程度的指標之一,到目前為止,尚無壓縮比的統(tǒng)一定義,目前常用的壓縮比定義為:

其中:為源代碼長度;為壓縮后的代碼長度。

壓縮比的物理意義是被壓縮掉的數(shù)據(jù)占源數(shù)據(jù)的百分比,一般的講,壓縮比大,則說明被壓縮掉的數(shù)據(jù)量多,當壓縮比接近100%時,壓縮效率最理想。

保真度

在圖像壓縮編碼中,解碼圖像與原始圖像可能會有差異,因此,需要評價壓縮后圖像的質(zhì)量。描述解碼圖像相對原始圖像偏離程度的測度一般稱為保真度(逼真度)準則。常用的準則可分為兩大類:客觀保真度準則和主觀保真度準則。

(1)客觀保真度準則

最常用的客觀保真度準則是原圖像和解碼圖像之間的均方根誤差和均方根信噪比兩種,令f(x,y)表示原圖像,表示f(x,y)先壓縮又解壓縮后得到的的近似,對任意x和y,f(x,y)和之間的誤差定義為:

若f(x,y)和均為M×N,則它們之間的均方根誤差為:

如果將看做原始圖像f(x,y)和噪聲圖像e(x,y)的和,則解壓縮圖像的均方信噪比為:

若對上式求平方根,則得到均方根信噪比。

實際使用時,常將歸一化并用分貝(dB)表示,令

則有

若令,x=0,1,…,M-1,y=0,1,…,N-1,則可以得到峰值信噪比PSNR(2)主觀保真度準則盡管客觀保真度準則提供了一種簡單方便的信息損失的方法,但是很多解壓圖像最終是供人觀看的,有時單用某一個或幾個解析式來度量圖像品質(zhì),甚至得到與主觀評估相反的結(jié)果,這樣就造成采用這些解析公式得到的定量的逼真度的可信度低,造成逼真度不能從理論上完滿解決的根本原因在于人眼視覺感知得到的信息傳輸?shù)缴窠?jīng)系統(tǒng)的處理、判別過程不清楚,而這又涉及到生物物理學、

生物化學以及生態(tài)光學等領(lǐng)域的成就,至今還不能提供這一過程的滿意回答(這也是當今計算機視覺的一個前沿課題,目前正在研究發(fā)展中)。鑒于這樣的原因,目前對圖像品質(zhì)的度量仍停留在主觀評估上。所謂主觀評估就是聘請一些‘外行’或?qū)<?,通過對圖像的觀察來判別好壞。因而這是一種定性的評估。算法的適用范圍特定的圖像編碼算法具有其相應的適用范圍,并不對所有的圖像都有效。一般說來,大多數(shù)基于圖像信息統(tǒng)計特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像;某些算法(如基于對象的圖像壓縮編碼方案),只能用于特定圖像場景(如人的頭肩像場景)的壓縮。算法的復雜度算法的復雜度即指完成圖像壓縮和解壓縮所需的運算量和硬件實現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時一定要考慮圖像信源本身的統(tǒng)計特性、多媒體系統(tǒng)的適應能力、應用環(huán)境以及技術(shù)標準。

行程編碼(RLE編碼)——基本概念行程編碼是一種最簡單的,在某些場合是非常有效的一種無損壓縮編碼方法。雖然這種編碼方式的應用范圍非常有限,但是因為這種方法中所體現(xiàn)出的編碼設計思想非常明確,所以在圖像編碼方法中都會將其作為一種典型的方法來介紹。

行程編碼——

基本原理通過改變圖像的描述方式,來實現(xiàn)圖像的壓縮。將一行中灰度值相同的相鄰像素,用一個計數(shù)值和該灰度值來代替。行程編碼——

實現(xiàn)方法

舉例說明:a=100,b=1,c=23,d=254

aaaa

bbb

cc

d

eeeee

fffffff

432157

(共22*8=176bits)

4a3b2c1d5e7f

(共12*8=96bits)

壓縮比為:176:96=1.83:1行程編碼——傳真中的應用方法傳真件中一般都是白色比較多,而黑色相對比較少。所以可能常常會出現(xiàn)如下的情況:

500W3b470w12b4w

3b3000w

上面的行程編碼所需用的字節(jié)數(shù)為:因為:2048<3000<4096

所以:計數(shù)值必須用12bit來表示行程編碼——傳真中的應用方法對于:500W3b470w12b4w

3b3000w

編碼為:500,3,570,12,4,3,3000

編碼位數(shù)為:12,12,12,12,12,12,12需要的數(shù)據(jù)量為:12*7=84bit壓縮比為:168:84=2:1因為只有白或黑,而且排版中一定要留出頁邊距,因此,一般情況下,可以只傳輸計數(shù)值即可。行程編碼——傳真中的應用方法現(xiàn)在,根據(jù)傳真件的特點,對其進行改進。既然已經(jīng)可以預知白色多黑色少,所以可對白色和黑色的計數(shù)值采用不同的位數(shù)。以這個例子,可以定義:

白色:12bit,黑色:4bit

行程編碼——傳真中的應用方法編碼為:500,3,470,12,4,3,3000

編碼位數(shù)為:12,4,12,4,12,4,12所需字節(jié)數(shù)為:4*12+3*4=60bit壓縮比為:168:60=2.8:1比原來的RLE方式168bit減少到了60bit,相當于又提高了壓縮比為168/60=2.8:1

。二維行程編碼——

基本概念二維行程編碼要解決的核心問題是:

將二維排列的像素,采用某種方式轉(zhuǎn)化成一維排列的方式。之后按照一維行程編碼方式進行編碼。二維行程編碼——

數(shù)據(jù)排序如下圖所示,是兩種典型的二維行程編碼的排列方式:(a)(b)二維行程編碼——例例:數(shù)據(jù)量:64*8=512(bit)二維行程編碼——例

如果按照行掃描的順序排列的話,數(shù)據(jù)分布為:130,130,130,129,134,133,129,130;130,130,130,129,134,133,130,130;

130,130,130,129,132,132,130,130;129,130,130,129,130,130,129,129;127,128,127,129,131,129,131,130;127,128,127,128,127,128,132,132;125,126,129,129,127,129,133,132;127,125,128,128,126,130,131,131二維行程編碼——例一維行程編碼后為:(3,130),(1,129),(1,134),(1,133),(1,129),(4,130),(1,129),(1,134),(1,133),(5,130),(1,129),(2,132),(2,130),(1,129),(2,130),(1,129),(2,130),(2,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,129),(1,131),(1,130),(1,127),(1,128),(1,127),(1,128),(1,127),(1,128),(2,132),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,127),(1,125),(2,128),(1,126),(1,130),(2,131)數(shù)據(jù)量為:46*(3+8)=506(bit)壓縮比為:512:506=1.01:1二維行程編碼——例如果按照列掃描的順序排列的話,數(shù)據(jù)分布為:130,130,130,129,127,127,125,127;130,130,130,130,128,128,126,125;130,130,130,130,127,127,129,128;129,129,129,129,129,128,129,128;134,134,132,130,131,127,127,126;133,133,132,130,129,128,129,130;129,130,130,129,131,132,133,131;130,130,130,129,130,132,132,131二維行程編碼——例一維行程編碼為:數(shù)據(jù)量為:42*(3+8)=462(bit)壓縮比為:512:462=1.11:1(3,130),(1,129),(2,127),(1,125),(1,127),(4,130),(2,128),(1,126),(1,125),(4,130),(2,127),(1,129),(1,128),(5,129),(1,128),(1,129),(1,128),(2,134),(1,132),(1,130),(1,131),(2,127),(1,126),(2,133),(1,132),(1,130),(1,129),(1,128),(1,129),(1,130),(1,129),(2,130),(1,129),(1,131),(1,132),(1,133),(1,131),(3,130),(1,129),(1,130),(2,132),(1,131)二維行程編碼——例如果按照方式(a)掃描的順序排列的話,數(shù)據(jù)分布為:130,130,130,130,130,130,130,130;130;129,129,129,129,130,130,129;127,128,127,129,131,130,132,134;134;133,133,132,130,129,128,127;128,127,128,127,125,126,129,129;127,129,133,132,131,129,130,130;129,130,130,130,129,130,132,132;131,131,130,126,128,128,125,127二維行程編碼——例一維行程編碼為:數(shù)據(jù)量為:44*(3+8)=484(bit)壓縮比為:512:484=1.06:1(7,130),(2,130),(4,129),(2,130),(1,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,130),(1,132),(2,134),(2,133),(1,132),(1,130),(1,129),(1,128),(1,127),(1,128),(1,127),(1,128),(1,127),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,131),(1,129),(2,130),(1,129),(3,130),(1,129),(1,130),(2,132),(2,131),(1,130),(1,126),(2,128),(1,125),(1,127)Huffman編碼(熵編碼)行程編碼要獲得好的壓縮率的前提是有比較長的相鄰像素的值是相同的。熵是指數(shù)據(jù)中承載的信息量。所謂的熵編碼是指在完全不損失信息量前提下最小數(shù)據(jù)量的編碼。Huffman編碼——

基本原理為了達到大的壓縮率,提出了一種方法就是將在圖像中出現(xiàn)頻度大的像素值,給一個比較短的編碼,將出現(xiàn)頻度小的像數(shù)值,給一個比較長的編碼。Huffman編碼——

基本原理例:

aaaa

bbb

cc

d

eeeee

fffffff

432157如果不進行特殊的編碼,按照圖像像素的描述,需要的數(shù)據(jù)量為:

22*8=176bits

Huffman編碼——

基本原理

aaaa

bbb

cc

d

eeeee

fffffff

432157按照熵編碼的原理進行編碼:

f=0e=10a=110b=1111c=11100d=11101這里的編碼規(guī)則是長短不一的異字頭碼Huffman編碼——

基本原理

由:f=0e=10a=110b=1111c=11100d=11101

aaaabbbccdeeeeefffffff11011011011011111111111111100111001110110101010100000000

數(shù)據(jù)量:7*1+5*2+4*3+3*4+2*5+1*5=56bit壓縮比為:176:56=3.14:1Huffman編碼——

算法首先求出圖像中灰度分布的灰度直方圖;根據(jù)該直方圖,對其按照分布概率從小到大的順序進行排列;每一次從中選擇出兩個概率為最小的節(jié)點相加,形成一個新的節(jié)點,構(gòu)造一個稱為“Huffman樹”的二叉樹;對這個二叉樹進行編碼,就獲得了Huffman編碼碼字。Huffman編碼——

例例:對數(shù)據(jù)序列

aaaa

bbb

cc

d

eeeee

fffffff

其概率分布為:

a:4/22b:3/22c:2/22d:1/22e:5/22f:7/22

概率大小的排序為:

d,c,b,a,e,f

1/222/223/224/225/227/22Huffman編碼——

例cbafe7/225/224/222/2210f=11e=01a=00b=101c=1001d=1000d1/223/226/2222/2213/229/223/2210101010Huffman編碼——

壓縮效率對這個例子,計算出經(jīng)過Huffman編碼后的數(shù)據(jù)為:

10101010001001001000100010000111111111101010101010101

共7*2+5*2+4*2+3*3+2*4+1*4=53bit壓縮比為176:53=3.32:1Huffman編碼——

圖像壓縮中的應用我們知道,對一幅圖像進行編碼時,如果圖像的大小大于256時,這幅圖像的不同的碼字就有可能是很大,例如極限為256個不同的碼字。這時如果采用全局Huffman編碼則壓縮效率不高。甚至有可能與原來的等長編碼的數(shù)據(jù)量相同。

Huffman編碼——

圖像壓縮中的應用

常用的且有效的方法是:將圖像分割成若干的小塊,對每塊進行獨立的Huffman編碼。例如:分成

的子塊,就可以大大降低不同灰度值的個數(shù)(最多是64而不是256)。Huffman編碼——

圖像壓縮中的應用8*8分塊的編碼壓縮比為2.12:116*16分塊的編碼壓縮比為1.64:1全圖的編碼壓縮比為1.09:1變換編碼——

問題的提出行程編碼與Huffman編碼的設計思想都是基于對信息表述方法的改變,屬于無損壓縮方式。雖然無損壓縮可以保證接收方獲得的信息與發(fā)送方相同,但是其壓縮率一定有極限。因此,采用忽略視覺不敏感的部分進行有損壓縮是提高壓縮率的一條好的途徑。

變換編碼——

設計思想變換編碼

就是將原來空間域上描述的圖像信號,通過一種數(shù)學變換,變換到變換域中進行描述,達到改變能量分布的目的。

將圖像能量在空間域的分散分布變?yōu)樵谧儞Q域的能量的相對集中分布,達到去除相關(guān)的目的,再經(jīng)過適當?shù)姆绞搅炕幋a,進一步壓縮圖像。

信息論研究表明,正交變換不改變信源的熵值,變換前后圖像的信息量并無損失,完全可以通過反變換得到原來的圖像值。

但統(tǒng)計分析表明,圖像經(jīng)過正交變換后,把原來分散在原空間的圖像數(shù)據(jù)在新的坐標空間中得到集中,對于大多數(shù)圖像,大量的變換系數(shù)很小,只要刪除接近于0的系數(shù),并且對較小的系數(shù)進行粗量化,而保留包含圖像主要信息的系數(shù),以此進行壓縮編碼。變換編碼——

設計思想變換編碼——

方法正交變換逆變換原圖像除以量化系數(shù)取整1)編碼過程:2)解碼過程:壓縮圖像乘以量化系數(shù)取整壓縮圖像解壓圖像變換的選擇

理論上,K-L變換是最有的正交變換,它能完全消除子圖像塊內(nèi)像素間的線性相關(guān)性。但K-L變換的基對不同圖像是不同的,這種不確定性使其應用不方便。

DCT變換的性能僅次于K-L變換,所以被認為是一種準最佳變換。而且DCT變換矩陣與圖像內(nèi)容無關(guān),也有快速算法,所以二維DCT在圖像編碼中常常被使用。

沃爾什變換與DCT變換相比,算法簡單,速度快,適用于高速實時系統(tǒng)以及硬件實現(xiàn),但性能比DCT差一些。子圖像尺寸的選擇在實用中變換編碼并不是對整幅圖像進行變換和編碼,而是將圖像分成若干個nxn的子圖像后分別處理,原因有:

小圖像的變換計算容易;

距離較遠的像素之間的相關(guān)性比距離較近的像素之間的相關(guān)性小。

實踐證明,子圖像取4x4,8x8,16x16適合圖像的壓縮,這是因為:

如果子圖像尺寸取得太小,雖然計算速度快,實現(xiàn)簡單,但壓縮能力有限;

如果子圖像尺寸取得太大,雖然去相關(guān)效果好,但由于圖像本身的相關(guān)性很小,反而使其壓縮效果不明顯,而且增加了計算的復雜度。變換系數(shù)的選擇

對圖像經(jīng)過變換后,保留變換后的哪些系數(shù)用作編碼和傳輸將直接影響信號恢復的質(zhì)量,變換系數(shù)的選擇原則是保留能量集中的、方差大的系數(shù)。

系數(shù)選擇通常有:

變換區(qū)域編碼;

變換閾值編碼變換區(qū)域編碼

對設定形狀的區(qū)域內(nèi)的變換系數(shù)進行量化編碼就,區(qū)域外的系數(shù)被舍去;

變換后的系數(shù)較大的會集中在區(qū)域的左上部,即低頻分量都集中在此部分,保留的也是這一部分。其他部分的系數(shù)被舍去,在恢復信號時再對它們補0;

由于保留了大部分圖像信號能量,恢復信號后,其質(zhì)量不會產(chǎn)生顯著變化;

變換區(qū)域編碼的明顯缺陷,是高頻分量的完全丟失。變換閾值編碼變換閾值編碼是根據(jù)實際情況設定某一大小幅度的閾值,若變換系數(shù)超過該閾值,則保留這些系數(shù)進行編碼傳輸,其余的補0;

多數(shù)低頻成分被編碼輸出,少數(shù)超過閾值的高頻成分也將被保留進行編碼輸出;

需要解決兩個問題:

需要增加“地址”編碼比特數(shù),碼率較高;

“閾值”需要通過實驗來確定,復雜度較高。DCT變換案例分析:cr=0.5;initialimage=imread('baboon512x512.bmp');imshow(initialimage);initialimage=double(initialimage);t=dctmtx(8);dctcoe=blkproc(initialimage,[8,8],'P1*x*P2',t,t');coevar=im2col(dctcoe,[8,8],'distinct');coe=coevar;[y,ind]=sort(coevar);[m,n]=size(coevar);sum=64-64*cr;fori=1:ncoe(ind(1:sum),i)=0;endb2=col2im(coe,[8,8],[512,512],'distinct');i2=blkproc(b2,[8,8],'P1*x*P2',t',t);i2=uint8(i2);figureimshow(i2)原圖DCT壓縮后DCT變換編碼——

例Huffman:42bits;壓縮比為3.05:1Huffman:16bits;壓縮比為:8:1例:原圖像為:DCT變換除以量化系數(shù),取整DCT變換編碼——

例圖原圖解壓圖混合編碼——

設計思想每一種編碼方式都有其擅長的一點,以及局限的一點,混合編碼的思想就是將兩種以上的編碼方式的優(yōu)點進行綜合,達到提高編碼效率的目的?;旌暇幋a——

可能性及有效性分析回顧一下講過的幾個內(nèi)容的特點:行程編碼:擅長于重復數(shù)字的壓縮。Huffman編碼:擅長于像素個數(shù)分布不均勻情況下的編碼。DCT變換:擅長分離視覺敏感

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論