圖像壓縮文獻(xiàn)綜述

上傳人：0*** IP屬地：湖北上傳時(shí)間：2021-12-08 格式：DOCX 頁(yè)數(shù)：48 大?。?.13MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩43頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)字圖像處理和模式識(shí)別期末大作業(yè)題目：圖像壓縮文獻(xiàn)綜述班級(jí)：數(shù)字媒體學(xué)院計(jì)算機(jī)技術(shù) 姓名：徐德榮學(xué)號(hào)： 6141603020 圖像壓縮文獻(xiàn)綜述1 圖像壓縮編碼概述圖像信息的壓縮編碼，是根據(jù)圖像信號(hào)固有的統(tǒng)計(jì)特性和人類的視覺特性進(jìn)行的。圖像信號(hào)固有的統(tǒng)計(jì)特性表明，其相鄰像素之間、相鄰行之間或者相鄰幀之間，都存在較強(qiáng)的相關(guān)特性。利用某種編碼方法在一定程度上消除這些相關(guān)特性，便可實(shí)現(xiàn)圖像信息的數(shù)據(jù)壓縮。這個(gè)過程也就是盡量去除與圖像質(zhì)量無(wú)關(guān)的冗余信息，屬于信息保持（保持有效信息）的壓縮編碼。另一種考慮是，圖像最終是由人眼或經(jīng)過觀測(cè)儀器來觀看或判決的。根據(jù)視覺的生理學(xué)、心理學(xué)特性，可以允許圖

2、像經(jīng)過壓縮編碼后所得的復(fù)原圖像有一定的圖像失真，只要這種失真是一般觀眾難以察覺的。這種壓縮編碼屬于信息非保持編碼，因?yàn)樗箞D像信息有一定程度的丟失。由此可見，圖像壓縮編碼的研究重點(diǎn)是：怎樣利用圖像固有的統(tǒng)計(jì)特性，以及視覺的生理學(xué)、心理學(xué)特性，或者記錄設(shè)備和顯示設(shè)備等的特性，經(jīng)過壓縮編碼從原始圖像信息中提取有效信息，盡量去除那些無(wú)關(guān)的冗余信息，并且在保證質(zhì)量（能從這些數(shù)據(jù)中恢復(fù)出與原圖像差不多的圖像）的前提下，用最低的數(shù)碼率或最少的存儲(chǔ)容量，實(shí)現(xiàn)各類圖像的數(shù)字存儲(chǔ)、數(shù)字記錄或數(shù)字傳輸。2 圖像編碼研究現(xiàn)狀圖像壓縮編碼技術(shù)可以追溯到1948年提出的電視信號(hào)數(shù)字化,到今天己經(jīng)有五十多年的歷史。五十

3、年代和六十年代的圖像壓縮技術(shù)由于受到電路技術(shù)等的制約,僅僅停留在預(yù)測(cè)編碼、亞采樣以及內(nèi)插復(fù)原等技術(shù)的研究,還很不成熟。1969年在美國(guó)召開的第一屆“圖像編碼會(huì)議”標(biāo)志著圖像編碼作為一門獨(dú)立的學(xué)科誕生了。到了70年代和80年代,圖像壓縮技術(shù)的主要成果體現(xiàn)在變換編碼技術(shù)上;矢量量化編碼技術(shù)也有較大發(fā)展,有關(guān)于圖像編碼技術(shù)的科技成果和科技論文與日俱增,圖像編碼技術(shù)開始走向繁榮。自80年代后期以后,由于小波變換理論,分形理論,人工神經(jīng)網(wǎng)絡(luò)理論,視覺仿真理論的建立,人們開始突破傳統(tǒng)的信源編碼理論,例如不再假設(shè)圖像是平穩(wěn)的隨機(jī)場(chǎng)。圖像壓縮編碼向著更高的壓縮比和更好的壓縮質(zhì)量的道路前進(jìn),進(jìn)入了一個(gè)嶄新的、欣

4、欣向榮的大發(fā)展時(shí)期。數(shù)字圖像壓縮技術(shù)可以分為無(wú)損壓縮技術(shù)和有損壓縮技術(shù)。圖像無(wú)損壓縮技術(shù)主要有:位平面編碼、無(wú)損預(yù)測(cè)編碼(DPCM)以及有損編碼與無(wú)損編碼的組合編碼技術(shù)。傳統(tǒng)的數(shù)字圖像有損壓縮技術(shù)主要有預(yù)測(cè)(PCM、DPCM)、方塊化、矢量量化、層次、子頻帶和變換等等。近年來,人們又提出了神經(jīng)網(wǎng)絡(luò)法、幾何模型化、分形和小波變換等編碼技術(shù)。通常認(rèn)為,JBIG、JPEG、JPEG2000、MEPG一l、MPEG一2、MEPG一4、MPEG一7等圖像壓縮國(guó)際標(biāo)準(zhǔn)是針對(duì)不同應(yīng)用的最佳壓縮算法。在這些標(biāo)準(zhǔn)之中成功地采用了以上的一種或多種混合壓縮技術(shù)。3 圖像壓縮編碼的典型方法3.1統(tǒng)計(jì)編碼算法統(tǒng)計(jì)編

5、碼是一類根據(jù)信息熵原理進(jìn)行的信息保持型、變字長(zhǎng)的編碼方式，也稱熵編碼。編碼時(shí)對(duì)出現(xiàn)概率高的被編碼符號(hào)用短碼表示，對(duì)出現(xiàn)概率低的被編碼符號(hào)則用長(zhǎng)碼表示。在目前圖像編碼國(guó)際標(biāo)準(zhǔn)中，常見的熵編碼有霍夫曼（Huffman）編碼和算術(shù)編碼。Huffman 編碼可以實(shí)現(xiàn)圖像的無(wú)損壓縮，壓縮比介于 2:15:1 之間。所得的編碼長(zhǎng)度只是對(duì)信息熵計(jì)算結(jié)果的一種近似，還無(wú)法真正逼近信息熵的極限。因此，現(xiàn)代壓縮技術(shù)通常只將 Huffman 視作最終的編碼手段。實(shí)際的壓縮編碼中，碼率很難達(dá)到熵值（理論上的平均信息量），不過，熵可以作為衡量一種壓縮算法的壓縮比好壞的標(biāo)準(zhǔn)，碼率越接近熵值，壓縮比越高。算術(shù)編碼是到目前為

6、止編碼效率最高的統(tǒng)計(jì)熵編碼方法，它比 Huffman 編碼效率提高10%左右。算術(shù)編碼的一個(gè)重要特點(diǎn)就是可以按分?jǐn)?shù)比特逼近信源熵，突破了Huffman編碼每個(gè)符號(hào)只能按整數(shù)比特逼近信源熵的限制。另外，比較容易實(shí)現(xiàn)動(dòng)態(tài)自適應(yīng)。自適應(yīng)算術(shù)編碼具有實(shí)時(shí)性好、靈活性高、適應(yīng)性強(qiáng)等特點(diǎn)，在圖像壓縮、視頻圖像編碼等領(lǐng)域都得到了廣泛的應(yīng)用。3.2預(yù)測(cè)編碼算法預(yù)測(cè)編碼是利用圖像信號(hào)在局部空間和時(shí)間范圍內(nèi)的高度相關(guān)性，依據(jù)已經(jīng)傳出的近鄰像素的值作為參考，預(yù)測(cè)當(dāng)前的像素值，然后量化、編碼預(yù)測(cè)誤差。在進(jìn)行預(yù)測(cè)編碼時(shí)，不直接傳送圖像樣值本身，而是對(duì)圖像的實(shí)際樣值與它的一個(gè)預(yù)測(cè)值之間的差值進(jìn)行編碼和傳送。如果這一差值，

7、即預(yù)測(cè)誤差不被再次量化而直接傳送，這就是無(wú)損預(yù)測(cè)編碼（信息保持型預(yù)測(cè)編碼）。如果允許壓縮過程中存在客觀信息損失，則可以進(jìn)一步利用人的主觀視覺特性對(duì)預(yù)測(cè)誤差再次量化后再編碼傳送，從而獲得更高的壓縮比，這就是差分脈沖編碼調(diào)制（DPCM, differential pulse code modulation）。如果量化器只有兩個(gè)輸出電平（量化層數(shù)為 2），則稱為增量調(diào)制（M），是 DPCM 的一種特殊形式。由于預(yù)測(cè)編碼的算法較為簡(jiǎn)單，容易用硬件實(shí)現(xiàn)，早年就得到較多的研究和應(yīng)用。1952 年，Oliver 對(duì)圖像的線性預(yù)測(cè)法作了理論研究。1958 年，Graham 首次用計(jì)算機(jī)模擬法研究 DPCM 編

8、碼方法。1966 年，ONeal 依據(jù)最小均方差準(zhǔn)則，用計(jì)算機(jī)模擬5法對(duì)圖像 DPCM 中的線性預(yù)測(cè)器和量化器作了系統(tǒng)討論。1969 年，Mounts 等首次提出幀間預(yù)測(cè)編碼的方法，幀間預(yù)測(cè)編碼應(yīng)用廣泛，在視頻編碼標(biāo)準(zhǔn)（如 H.261，H.263，H.264，MPEG1-4）中得到采用。預(yù)測(cè)編碼在圖像與視頻編碼中占有重要地位，但是它也有弱點(diǎn)，突出表現(xiàn)為對(duì)信道誤碼的敏感性方面。3.3變換編碼算法變換編碼是將一組像素值，經(jīng)過某種形式的正交變換，轉(zhuǎn)換成一組變換系數(shù)，然后根據(jù)人的主觀視覺特性，對(duì)各變換系數(shù)進(jìn)行不同精度的量化后再編碼。正交變換的作用是解除像素值之間的空間相關(guān)性，降低冗余度。用于圖像編碼的

9、正交變換有：離散傅立葉變換（DFT）、沃什（Walsh-Hadamard）變換（WHT）、哈爾變換（HRT）、離散余弦變換（DCT）、K-L 變換（KLT）、斜變換（SLT）等。除了 K-L 變換外，上述變換都有快速算法。K-L 變換是在最小均方誤差準(zhǔn)則下進(jìn)行圖像壓縮的最佳變換，但由于它的變換矩陣隨圖像內(nèi)容而異，所以沒有快速算法，也就不適宜用于實(shí)時(shí)編碼。相比之下，DCT 是性能最接近 KLT 的次最優(yōu)算法，也是目前應(yīng)用最為廣泛的變換編碼方法，而且是 JPEG 標(biāo)準(zhǔn)的核心算法。變換編碼能充分利用圖像所具有的二維或三維相關(guān)性，來得到高于預(yù)測(cè)編碼的編碼效率。正交變換比較容易實(shí)現(xiàn)，已成為圖像編碼算法的

10、主流。DCT 算法突出的問題是：在低比特率編碼時(shí)塊狀編碼失真明顯。這是因?yàn)閷D像信號(hào)從空間域向頻率域變換后，進(jìn)行有效壓縮所采用是的離散余弦變換，它將圖像劃分成方塊域，而后各塊內(nèi)產(chǎn)生的編碼失真在塊邊緣形成了不連續(xù)的狀況。3.3.1 基于DCT變換的圖像編碼算法（1）DCT編碼最小均方誤差條件下得出的最佳正交變換是K一L變換,而離散余弦變換(DCT)是僅次于K一L變換的次最佳變換l0,且已獲得廣泛應(yīng)用,并成為許多圖像編碼國(guó)際標(biāo)準(zhǔn)的核心。離散余弦變換的變換核為余弦函數(shù),計(jì)算速度較快,有利于圖像壓縮和其他處理。在大多數(shù)情況下,離散余弦變換DCT用于圖像的壓縮操作中的基本思路是,將圖像分解為8X8的子塊

11、或16x16的子塊,并對(duì)每一個(gè)子塊進(jìn)行單獨(dú)的DCT變換,然后對(duì)變換結(jié)果進(jìn)行量化、編碼。DCT壓縮編碼是一種正交變換編碼,將二維圖像變換成它的空間頻譜,將其按由低頻到高頻的順序重排。由于圖像頻譜從低到高逐漸衰減,故可在一定量化等級(jí)下進(jìn)行舍棄,從而達(dá)到壓縮的目的。DCT廣泛應(yīng)用于眾多壓縮方案的原因在于其理論、算法和硬件相對(duì)成熟,去相關(guān)性好,適應(yīng)人眼的視覺特性,計(jì)算量不大(沒有復(fù)數(shù)計(jì)算),易于實(shí)現(xiàn)。基于DCT的混合編碼技術(shù)對(duì)于彩色圖像的壓縮倍數(shù)可以達(dá)到幾十倍乃至上百倍,而且重建的圖像又具有較高的質(zhì)量,因此得到廣泛的應(yīng)用。近年來,基于DCT變換域的分析、處理操作的研究十分活躍,其主要原因在于JPEG和

12、MPEG等國(guó)際壓縮標(biāo)準(zhǔn)都是以DCT變換為基礎(chǔ)的,而大量的圖像數(shù)據(jù)都采用國(guó)際標(biāo)準(zhǔn)進(jìn)行壓縮。（2）一維DCT算法長(zhǎng)度為N的一維序列x(n):n=O,1,，,N一1的DCT定義為:其中，為正交化因子,它是為了保證變換基的規(guī)范正交性而引入的。一維DCT反變換(IDCT)為:若以N維矢量x表示原始數(shù)據(jù),N維矢量X表示DCT變換系數(shù),則有如下矩陣形式: 其中變換矩陣u為:可見u是一個(gè)正交矩陣,但不是對(duì)稱矩陣,反變換(IDCT)矩陣除了行、列序號(hào)互換外,形式上與u完全相同。(3)二維DCT算法二維數(shù)據(jù) 的20一DCT定義為:其中定義與一維DCT變換中定義相同,寫成矩陣形式: 其中,u為NxN變換系數(shù)陣列,v

13、J為MxM的變換系數(shù)陣列。也可表示為下列矩陣形式:其中:x輸入數(shù)據(jù)矩陣(NxM)XDCT系數(shù)矩陣（NxM）C(N)N點(diǎn)DCT變換矩陣（NxN）；為其轉(zhuǎn)置。二維DCT的變換核實(shí)可分離的，即二維DCT可以分解成行方向的一維DCT和列方向的一維DCT，可用兩次一維DCT實(shí)現(xiàn)二維DCT，此法稱為”行列法”。（4）層次DCT變換方法一直以來,對(duì)DCT系數(shù)的量化只是局限于每個(gè)圖像子塊中,沒有利用到子塊圖像的相關(guān)性,如果我們用頻帶的觀點(diǎn)來看待DCT系數(shù),組成類似子波變換后的結(jié)構(gòu),就可以把整個(gè)圖像作整體考慮,克服了圖像子塊獨(dú)立處理的缺點(diǎn),為獲得更高的壓縮率打下基礎(chǔ)。首先將輸入圖像進(jìn)行第一層的DCT變換,變換后

14、的圖像可以看成是類似于小波變換的子帶結(jié)構(gòu)。上圖（a）一幅圖像首先被分解為四個(gè)子圖像和,分別分別稱為低頻子圖像,垂直方向子圖像,水平方向子圖像和高頻子圖像。利用DCT變換的能量集中性好的特性,只對(duì)域的頻域系數(shù)做DCT反變換,這樣恢復(fù)到空間域的圖像數(shù)據(jù)再做第二層的DCT變換;同樣變換后的空間域圖像數(shù)據(jù)成為頻域的系數(shù)集,再次利用DCT變換的能量集中性的特性,也只對(duì)域的頻域系數(shù)做第二次DCT反變換,這樣恢復(fù)到空間域的圖像數(shù)據(jù)再做第三層的DCT變換.如圖（b）這樣一幅MxN的原始圖像經(jīng)過第一次DCT變換后,分解成4個(gè)(M/2)x(N/2)的子帶,每個(gè)子帶經(jīng)DCT反變換后都是一幅完整的圖像,只是各自反映了

15、同一幅圖像的不同信息。其中, 是圖像的高頻系數(shù),反映了圖像的細(xì)節(jié)部分。取做DCT反變換,恢復(fù)出一幅完整的圖像,進(jìn)一步對(duì)其分解,做第二次DCT變換,同樣分解成四個(gè)子帶,每個(gè)子帶經(jīng)DCT變換后也都是一幅完整圖像,各自反映了同一幅圖像的不同信息。重復(fù)上述步驟,再做第三次DCT變換,分解出,具體如下圖所示，一幅待編碼的圖像經(jīng)過L級(jí)變換后得到3L+1幅不同尺度的子帶圖像。圖像經(jīng)過層次DCT變換后生成的圖像的數(shù)據(jù)總量與原圖像的數(shù)據(jù)量相等,即DCT變換本身并不進(jìn)行數(shù)據(jù)壓縮,之所以將它用于圖像壓縮,是因?yàn)樯傻腄CT圖像具有與原圖像不同的特性,表現(xiàn)在圖像的能量主要集中于低頻部分,而水平、垂直和對(duì)角線部分的能量

16、則較少;水平、垂直和對(duì)角線部分表征了原圖像在水平、垂直和對(duì)角線部分的邊緣信息,具有明顯的方向特性。低頻部分可以稱作亮度圖像,水平、垂直和對(duì)角線部分可以稱作細(xì)節(jié)圖像。對(duì)所得的四個(gè)子圖,還應(yīng)根據(jù)人類的視覺心理和心理特點(diǎn)分別作不同策略的量化和編碼處理。一直以來,對(duì)DCT系數(shù)的量化只是局限于每個(gè)圖像子塊中,沒有利用到子塊圖像的相關(guān)性,如果我們用頻帶的觀點(diǎn)來看待DCT系數(shù),組成類系子波變換后的機(jī)構(gòu),這樣就可以把整個(gè)圖像作為整體考慮,克服了圖像子塊獨(dú)立處理的缺點(diǎn),為獲得更高的壓縮率打下基礎(chǔ)。加之人眼對(duì)亮度圖像部分的信息特別,對(duì)這一部分的壓縮應(yīng)盡可能減少失真或者無(wú)失真,對(duì)細(xì)節(jié)圖像可以采用壓縮比較高的編碼方案

17、。層次DCT變換的這一特性與小波變換具有相同的特征,但運(yùn)算的復(fù)雜性卻大大降低。3.4矢量量化編碼算法矢量量化編碼的理論基礎(chǔ)是香農(nóng)的率失真理論。Gersho 在 1979 年從理論上證得：當(dāng)矢量量化中的矢量維數(shù)不斷增加時(shí)，編碼性能將無(wú)限接近于稱之為碼率失真界限的信息壓縮極限。矢量量化編碼的突出優(yōu)點(diǎn)是解碼簡(jiǎn)單，主要缺點(diǎn)是編碼過程計(jì)算復(fù)雜，矢量量化編碼所能達(dá)到的圖像質(zhì)量取決于很多因素，包括像素矢量塊的大小、像素之間的相關(guān)性、碼速對(duì)編碼圖像的適應(yīng)性等。該方法主要適合于低碼率圖像編碼。小波變換壓縮算法小波變換彌補(bǔ)了DCT不適合對(duì)寬帶信號(hào)進(jìn)行壓縮的缺陷，是一種不受帶寬約束的數(shù)據(jù)壓縮方法。其基本思想是：用一

18、族小波基去逼近一個(gè)信號(hào)。小波變換的特點(diǎn)是：它具有時(shí)頻分析的能力，能把圖像信號(hào)的能量聚集于某些頻帶中，這一特點(diǎn)有利于壓縮編碼。對(duì)于窄帶信號(hào)，它可以通過縮小的方法使得對(duì)信號(hào)的描述較為精細(xì)；而對(duì)于寬帶信號(hào)，則可以通過放大的方式使刻畫滿足精度的需要。小波變換和逆變換具有形式上的完美的對(duì)稱性，且具有基于卷積和正交鏡像濾波器的塔形快速算法。系數(shù)編碼是小波算法最具特色的部分，常用的有嵌入式小波零樹編碼（EZW）、層次樹分割集（SPIHT）等。這些方法主要是利用了小波分解圖像各頻帶間的繼承關(guān)系，采用門限過濾算法將系數(shù)按其對(duì)于重建圖像貢獻(xiàn)大小依次發(fā)送的思想。小波變換（WT）用于圖像壓縮技術(shù)的一系列優(yōu)點(diǎn)在于：它具

19、有宜與人類視覺系統(tǒng)（Human Visual System，HVS）相結(jié)合的潛力，從而可在同樣的平均碼率下，獲得質(zhì)量更好的重建圖像，或在相同的評(píng)價(jià)條件下，得到更高的圖像壓縮比。但小波變換也存在一定的問題。如到目前為止，成熟的小波基極其有限，利用多分辨分析構(gòu)成的一些類型的小波基，大多無(wú)解析表達(dá)式，多是一些分段函數(shù)的傅氏變換形式；常用的緊支正交小波基不能滿足實(shí)際中對(duì)稱性的要求；平緩信號(hào)的分析不如傅氏變換；正交小波基對(duì)于時(shí)、頻局部性要求都很高的問題顯得力不從心。3.4.1 基于小波變換的 EZW 算法。（1）EZW 原理在EZW算法中，待編碼的小波系數(shù)的重要性一般都是利用閾值來進(jìn)行預(yù)測(cè)的。假設(shè)給定的

20、閾值為 T，若當(dāng)前小波系數(shù)的絕對(duì)值 x 小于閾值 T，則認(rèn)為 x 是關(guān)于閾值 T 的不重要的系數(shù)，假如它的所有的子代系數(shù)關(guān)于 T 也是不重要的，則把 x 稱為閾值 T 的零樹根. 若 x 的絕對(duì)值大于 T 則認(rèn)為是重要的系數(shù).對(duì)于一個(gè)給定的閾值，EZW 算法是按照下面的掃描方式。EZW 的量化編碼是采用逐次逼近量化的方式進(jìn)行的，要對(duì)圖像進(jìn)行多次的掃描。但每一次的掃描均包含以下的幾個(gè)步驟：取閾值對(duì)于一個(gè) L 級(jí)的小波變換來說，算法所采用的是一個(gè)閾值序列：來判斷當(dāng)前小波系數(shù)的重要性。其中：i為掃描的次數(shù)。其中：i=1,2.L-1。一般初始閾值定義為：其中：f(i,j)為小波變換系數(shù)集。- 圖：E

21、ZW算法掃描順序掃描按照如上圖中所示的掃描方式，將當(dāng)前小波系數(shù)與閾值進(jìn)行比較，輸出以下四種編碼符號(hào)： a：若當(dāng)前系數(shù)的絕對(duì)值小于閾值，則該系數(shù)為次要系數(shù)，并且各級(jí)子帶系數(shù)的絕對(duì)值均小于閾值，則輸出符號(hào) T，并將其用特殊的符號(hào)進(jìn)行標(biāo)注，在后續(xù)的編碼中，對(duì)其所有的子系數(shù)都不再處理；b：若當(dāng)前系數(shù)的絕對(duì)值小于閾值，則該系數(shù)為次要系數(shù)，但它的子帶中有重要的系數(shù)，在輸出符號(hào) Z；c：若當(dāng)前系數(shù)的絕對(duì)值大于閾值且為正,則該系數(shù)是正的重要系數(shù)，輸出符號(hào)P；d：若當(dāng)前系數(shù)的絕對(duì)值大于閾值且為負(fù),則該系數(shù)是負(fù)重要系數(shù)，輸出符號(hào) N；在掃描的過程中，這些符號(hào)存儲(chǔ)到一張表中，在第i次掃描后，將重要系數(shù)的位置上的

22、系數(shù)值設(shè)置為 0，在下次掃描過時(shí)則直接跳過這些位置. 輔掃描輔掃描主要是在主掃描中被認(rèn)為是重要系數(shù)的小波系數(shù)進(jìn)行量化編碼。在量化要首先構(gòu)造量化器，量化器具有一個(gè)區(qū)間，區(qū)間的最大值為初始閾值的 2 倍，最小值為當(dāng)前的閾值，所以輸入?yún)^(qū)間為，將輸入?yún)^(qū)間分為兩個(gè)區(qū)間若系數(shù)屬于區(qū)間則量化為“0”，在重構(gòu)時(shí)，重構(gòu)值為 1.25，若屬于區(qū)間則量化為“1”。重構(gòu)值為 1.75。并用一張輔表存儲(chǔ)這些二進(jìn)制符號(hào)流。新排序在下一次的掃描進(jìn)行之前，要將輔表中的重要系數(shù)進(jìn)行排序。排序所用的標(biāo)準(zhǔn)是重要系數(shù)所在的區(qū)間值的大小，即將幅值在中的數(shù)據(jù)排在幅值位于的數(shù)據(jù)之前。因此在本級(jí)的編碼中，被優(yōu)先編碼的是那些排在前面的幅值較

23、大的系數(shù)。出編碼符號(hào)流EZW 編碼算法中，編碼器的輸出主要包括兩個(gè)部分的信息：傳解碼端的信息和編碼端用于下次掃描的信息。其中，解碼端的信息主要有主、輔掃描表和閾值；編碼器端的信息主要是當(dāng)前所用閾值及重新排序過的重要系數(shù)序列。下面2圖分別表示的是系數(shù)類型編碼和圖幅值編碼的流程圖。（2）EZW的算法步驟綜合以上的說明可給出 EZW 算法的主要的步驟如下：1.數(shù)字圖像進(jìn)行邊界嚴(yán)拓；2.尋找合適的小波基，采用二維離散小波變換對(duì)經(jīng)過邊界嚴(yán)拓后的圖像進(jìn)行變換，產(chǎn)生出一系列的子圖像；3.據(jù)初始閾值的計(jì)算公式得出初始閾值；4. 按照上述的主掃描和輔掃描的方法，對(duì)圖像進(jìn)行多次掃描，形成主表和輔表；5. 將輔

24、表中存儲(chǔ)的重要小波系數(shù)量化值的次序進(jìn)行調(diào)整；6. 到達(dá)指定的要求停止編碼，否則重復(fù)和。在解碼端，最先得到恢復(fù)的是最重要的系數(shù)，隨后恢復(fù)的是在閾值減小一半后控制輸出的系數(shù)，如此重復(fù)的進(jìn)行，也可以滿足要求后即結(jié)束解碼。在解碼的過程中，重要系數(shù)的恢復(fù)幅值均是所在區(qū)間的中間值。3.5分形壓縮算法分形壓縮的方法是利用圖形處理技術(shù)把原始圖像分割成若干子圖像，然后為每個(gè)子圖像尋找迭代函數(shù)（Iterated Function），子圖像以迭代函數(shù)的形式存儲(chǔ)。由于這樣的迭代函數(shù)一般只需要幾個(gè)數(shù)據(jù)表示即可，所以分形壓縮可以達(dá)到較高的壓縮比。解壓縮時(shí)，只要調(diào)出每個(gè)子圖像對(duì)應(yīng)的迭代函數(shù)進(jìn)行反復(fù)迭代，就可以恢復(fù)出原來的子

25、圖像。分形壓縮充分考慮人的視覺特性以及自然景物的特點(diǎn)。其優(yōu)點(diǎn)是：壓縮比取決于圖像分割后所產(chǎn)生的子塊的大小，子塊取得越大，壓縮比越高；由于分形變換可把圖像劃分成大得多、形狀復(fù)雜得多的分區(qū)，故壓縮比不受分辨率的影響。缺點(diǎn)有：分形壓縮編碼是非對(duì)稱的，壓縮時(shí)計(jì)算量較大，所需時(shí)間較長(zhǎng)，但是解壓縮速度很快；隨著被壓縮圖像尺寸的增大，運(yùn)算量增長(zhǎng)過快。目前的最大障礙在于它的逆問題，即如何尋找任意一幅自然圖像的分形迭代碼，此方法仍處于不成熟的發(fā)展階段。3.5.1 Jacquin 分形圖像壓縮算法（1）Jacquin 提出的基于方塊劃分的分形圖像壓縮方法是以局部的仿射變換代替全局的仿射變換，此方案為實(shí)現(xiàn)了圖像的自

26、動(dòng)分割，為分形壓縮編碼的研究注入了生機(jī)與活力，使其得到快速發(fā)展。此后，分形圖像編碼引起了世界各國(guó)研究人員的廣泛興趣和關(guān)注，成為目前編碼研究的熱點(diǎn)。（2）局部迭代函數(shù)系統(tǒng)為討論圖像壓縮，應(yīng)首先建立圖像數(shù)學(xué)模型，常用的模型有三種：測(cè)度空間、像素?cái)?shù)據(jù)和函數(shù)。1.當(dāng)以測(cè)度作為圖像模型時(shí)，是把圖像表示成平面上的一種測(cè)度，此時(shí)，明暗度就能由平面子集 A上的度量來表示。2.在像素?cái)?shù)據(jù)模型中，把圖像表示為離散像素的集合。3.函數(shù)模型就是將圖像表示成連續(xù)函數(shù) f ( x, y )，( x, y ) 0,1 × 0,1。對(duì)于一些實(shí)際的圖像，不存在整體與局部的自相似性，但經(jīng)驗(yàn)表明，圖像中一些部分存在不同

27、比例的自相似，這些部分不是它們自身在仿射變換下的恒等復(fù)制品，而是有誤差的。于是產(chǎn)生了局部迭代函數(shù)系統(tǒng)，它是 IFS 的推廣，只是每個(gè)變換的定義域僅為 X 的一部分。定義 12（局部迭代函數(shù)系統(tǒng)LIFS）設(shè)( x, d )是完備度量空間，局部迭代函數(shù)系統(tǒng)是下列壓縮映射集：為了能夠?qū)崿F(xiàn)灰度上的匹配，我們對(duì)二維的平面映射上再加上灰度的映射作為三維，就構(gòu)成了帶映射的局部迭代函數(shù)系統(tǒng)。（3）固定分塊算法原理及分析算法原理本節(jié)主要研究灰度圖像的 Jacquin 的固定分塊分形圖像壓縮編解碼過程。編碼過程可分為如下步驟：1）對(duì)壓縮圖像進(jìn)行分塊：Jacquin 不從整幅圖像作拼貼來尋找 IFS 碼，而

28、是根據(jù)局部迭代函數(shù)系統(tǒng)，把圖像 I 分成為不重疊的N × N個(gè)圖像塊，如8 × 8和4 × 4的方塊，稱為尺寸 R × R的值域塊（range）或子塊。，且，當(dāng) i j時(shí)。是分形壓縮中的一個(gè)編碼單元。2）建立搜索空間：用 D × D截取窗口沿待編碼圖像的水平和垂直方向(即 X Y軸)分別以步長(zhǎng)和移動(dòng)，每一次移動(dòng)后的截取方塊稱為匹配塊 (domain block，也稱定義域塊)，所有構(gòu)成搜索空間。搜索空間的大小即匹配塊個(gè)數(shù)n（），由下式計(jì)算：實(shí)際算法中通常取 D = 2N = 3）搜索最優(yōu)匹配塊：在搜索空間內(nèi)，對(duì)每一個(gè)值域塊，通過

29、MSE 原則尋找誤差最小的匹配塊，使得經(jīng)適當(dāng)?shù)姆律渥儞Q 來逼近即使之滿足：。如圖所示：其中，仿射變換必須是壓縮映射，對(duì)灰度圖像進(jìn)行實(shí)際操作時(shí)，仿射變換一般采用以下三種具體變換的合成： a. 幾何縮小變換 G：主要完成從定義域塊到值域塊的空間收縮映射，通常采用四鄰域平均法，相鄰四個(gè)象素壓縮成一個(gè)象素，其灰度值為四象素灰度值的平均。壓縮成，大小為8 × 8，且相鄰差一個(gè)像素，從而形成了新的D 庫(kù)，使得與具有相同的空間尺度，通常用下式表示此過程： b. 仿射變換 A：通過適當(dāng)?shù)膶?duì)稱變換和旋轉(zhuǎn)變換，使得盡可能具有相近的灰度分布。為了減少變換參數(shù)所需的存儲(chǔ)空間并降低變換的復(fù)雜

30、性，對(duì)一個(gè)方塊象素塊，A 通常采用第二章的 8 種對(duì)稱變換方式之一，使得c. 灰度變換 M：取為線性變換，其形式為：，其中和分別是灰度變換的尺度因子和偏移因子。將得到的新子塊與值域塊的灰度平方誤差記為，則平方誤差可表示為：要求得最佳匹配，即要使變換后得到的新子塊與值域塊最相似，就需要使它們對(duì)應(yīng)像素之間的灰度差值最小，灰度平方誤差也就最小。利用最小方差準(zhǔn)則，可以求得使值最小的s和o。灰度變換尺度因子: 灰度變換偏移因子: 其中為的平均灰度值，為的平均灰度值；此時(shí)，平均誤差的最小值為：將與預(yù)先定義的灰度平方誤差門限L比較，若 < L，則己求得最佳匹配，進(jìn)行步驟 4）。否則，回到步驟

31、2）的對(duì)稱旋轉(zhuǎn)變換 A，從下表中重新選取另外一種變換，并計(jì)算相應(yīng)的和。若下表所示的所有變換都進(jìn)行過，未找到最佳匹配，在搜索空間中選擇另外一個(gè)塊，計(jì)算其與是否匹配。重復(fù)以上過程，若搜索空間中的所有都計(jì)算匹配過，而未能與匹配，即未能找到滿足 < L的，則取前述搜索過程中最小的對(duì)應(yīng)的定義域塊作為最佳匹配塊。4）存儲(chǔ)分形編碼信息：通常需要存儲(chǔ)值域塊與其最佳匹配塊之間的相對(duì)位置，灰度變換尺度因子 s ，灰度偏移因子 o ，對(duì)稱旋轉(zhuǎn)變換序號(hào) n。以 256 ×256大小的灰度圖像為例：分割成8 × 8大小的值域塊，以步長(zhǎng) 1 分成16 × 16大小的定義域塊，采用

32、全局搜索。則個(gè)需要 8bits 表示；s 的范圍基本為 0 1，可用 3bits進(jìn)行保存； o 范圍為 0 255，需要 8bits 表示；n 為 0 7，采用 3bits。8+8+3+8+3=30bits，而8 × 8大小圖像塊原來的灰度信息需要 8 × 8 × 8=512bits 表示，因此，壓縮比。解碼過程如下：分形編碼方法的解碼就是用我們求得的局部迭代函數(shù)系統(tǒng)(LIFS)的吸引子來近似原始圖像。編碼過程中所得到的 LIFS 是緊縮、收斂的，它的吸引子可以通過對(duì)任意的初始圖像的不斷迭代變換得到?；謴?fù)圖像與原始圖有一定誤差，拼貼定理限定了其誤差上限。從嚴(yán)格的數(shù)

33、學(xué)角度上講，這種迭代是無(wú)窮次的，但在實(shí)際的數(shù)字圖像的解碼中，迭代 610 次就可以滿足要求。算法分析 Jacquin 分形圖像算法雖然實(shí)現(xiàn)了全自動(dòng)編碼，整個(gè)過程不需要人工交互，但最大的缺陷就是計(jì)算量太大，不能達(dá)到實(shí)用的階段。這里簡(jiǎn)單分析一下 Jacquin 編碼方案的計(jì)算復(fù)雜度。對(duì)于一個(gè)C × C大小的圖像，假設(shè)值域塊的大小為K × K，定義域塊的大小為2 K × 2K，則該圖像共有個(gè)值域塊，個(gè)定義域塊。在 Jacquin 方案中，一個(gè)值域塊和一個(gè)定義域塊之間相似性的計(jì)算量與成正比，而對(duì)于每一個(gè)值域塊，要與所有的定義域塊進(jìn)行相似性比較，因此每一個(gè)值域塊的編碼計(jì)

34、算量與成線性關(guān)系，所以對(duì)一幅圖像來說，其編碼復(fù)雜度與成正比，考慮到K 為常數(shù)，因此分形圖像編碼的計(jì)算復(fù)雜度為O ( )。若考慮到 8 種將映射到的仿射變換，這意味著對(duì)每個(gè)值域塊中的任一個(gè)都要有8 × O ( )次比較。另外定義域塊中的像素?cái)?shù)目為值域塊中的像素?cái)?shù)目的 4 倍，所以我們還需要進(jìn)行下采樣或者將定義域塊中2 × 2的小塊取平均值后對(duì)應(yīng)于值域塊中的像素。因此，降低分形圖像編碼的復(fù)雜度，提高編碼速度，成為人們研究熱點(diǎn)。從20 世紀(jì) 90 年代起，很多學(xué)者都提出了改進(jìn)算法。3.5.2 改進(jìn)的Fisher 分形圖像壓縮算法（1）自適應(yīng)四叉樹分割Fisher在Jacqui

35、n的分形圖像壓縮算法的基礎(chǔ)上提出了一種改進(jìn)的方法自適應(yīng)四叉樹方法分割值域塊。和經(jīng)典的Jacquin分形圖像編碼相比，四叉樹分割法具有分塊靈活性高，壓縮率高的優(yōu)點(diǎn)。自適應(yīng)四叉樹方法是一種值域塊分塊方法，它將圖像表示成一棵四叉樹，樹根就是原圖像本身。除葉節(jié)點(diǎn)外，樹中每個(gè)節(jié)點(diǎn)均有4個(gè)子節(jié)點(diǎn)，分別對(duì)應(yīng)于原圖像(或圖像塊)4個(gè)象限的子塊。原理如圖所示：圖像自適應(yīng)分塊的目的是將圖像合理地劃分成不同尺寸的R塊，使任意一塊都能找到合適的D塊與之相應(yīng)。這樣圖像中粗糙的部分能以較大的圖像塊進(jìn)行變換壓縮，提高壓縮比；而圖像中精細(xì)的部分以較小的圖像塊進(jìn)行變換壓縮，保證較高的圖像還原質(zhì)量。為保證圖像質(zhì)量同時(shí)減少分塊數(shù)，

36、一般在分割圖像之前，設(shè)定一個(gè)誤差閾值，先把圖像分成尺寸相對(duì)較大的固定塊，按MSE 準(zhǔn)則尋找其最優(yōu)相似快，如果找不到滿足誤差閾值要求的相似塊，則將它細(xì)分為4個(gè)尺寸相同的較小塊，再重復(fù)尋找最優(yōu)相似塊的過程，直到找到所有塊的最優(yōu)相似塊或分割的圖像塊達(dá)到設(shè)定的最小尺寸為止。在實(shí)際操作過程中，常設(shè)定塊尺寸的最大邊長(zhǎng)為，塊尺寸的最小邊長(zhǎng)為，一個(gè)邊長(zhǎng)為圖像塊的四叉樹編碼過程與步驟描述如下：Step 1：設(shè)置一空堆棧，置堆棧指針 j = 0，對(duì)邊長(zhǎng)為的塊按 MSE 準(zhǔn)則尋找其最優(yōu)相似快，若找到滿足誤差閾值要求的最佳相似快，轉(zhuǎn)至Step5，否則進(jìn)入Step2；Step 2：把找不到滿足要求的值域塊，按圖示

37、意分成4個(gè)尺寸相同的較小塊，記成， i = 1, 2,3, 4，依次壓入堆棧，置 j = 4；Step 3：彈出堆棧中的一個(gè)塊， j = j 1，在原圖像中搜索4倍規(guī)模于的匹配塊，對(duì)進(jìn)行伸縮，使得伸縮后的尺寸與值域塊的尺寸相同，對(duì)伸縮后的定義域進(jìn)行仿射變換，進(jìn)而尋找最優(yōu)的對(duì)比度s和亮度o。按下式計(jì)算誤差e：其中（ i = 1, 2, , n； j = 1, 2, , m）是定義域塊經(jīng)過旋轉(zhuǎn)反射和伸縮變換后的像素值，（ i = 1, 2, , n； j = 1, 2, , m）是值域塊的像素值；Step 4：若 e 小于誤差閾值或圖像塊的邊長(zhǎng)已是預(yù)先設(shè)定的，則保存相似塊的像素值，轉(zhuǎn)

38、向Step5；否則把該塊均分成為4，變成4個(gè)更小的區(qū)域塊，依次壓入堆棧, j = j+ 4,轉(zhuǎn)至Step3；Step 5：若 j = 0，編碼結(jié)束；否則轉(zhuǎn)至Step3。經(jīng)過以上方法進(jìn)行分解后，其最終的值域塊的集合可能包含多種不同尺寸的方塊。雖然從理論上來說，如果塊的大小取1×1或2×2或N × N，是可行的，在分形圖像壓縮中顯然是不合適的。因此，在實(shí)際中我們常取最小塊為4×4，最大塊( N / 2 ) × ( N/ 2)。（2）相似塊集合的矩分類為了配合分割法預(yù)處理的自適應(yīng)四叉樹圖像分塊，把經(jīng)過四叉樹分割后的值域塊和定義域塊都分成四個(gè)等大小

39、的子塊，然后分別計(jì)算出這四個(gè)子塊的均值 ( i = 1, 2,3, 4)和方差（ i = 1, 2,3, 4），根據(jù)子塊均值 ( i = 1, 2,3, 4)的排列組合，應(yīng)該有24種不同的類型。但是考慮到前面介紹的塊的8種仿射變換（4種旋轉(zhuǎn)，4種對(duì)折），這24種類型可以歸并為3種主類。這樣就可以先把值域塊和定義域塊分成三個(gè)主類之一（圖3.4表示了3個(gè)主類對(duì)應(yīng)的亮度層次）：其次，再根據(jù)子塊方差（ i = 1, 2,3, 4）的排列組合，也得到24種類型（經(jīng)過仿射變換后，這24種類型不能歸并，即沒有相同的類型）。這樣就又把每個(gè)主類又分成24個(gè)子類，總共可以分成72類。編碼時(shí)，先進(jìn)行預(yù)處理，將所有的

40、定義域按上述方法歸類，然后在對(duì)某一個(gè)給定的值域塊編碼時(shí)，也先對(duì)它進(jìn)行歸類，搜索時(shí)就只在與其同類的定義域塊集中尋找匹配的定義域塊。這樣需要與值域塊進(jìn)行匹配計(jì)算的定義域塊的數(shù)目，即搜索空間就大大減少了，從而可以達(dá)到加快編碼的目的，同時(shí)還能保證解碼圖像質(zhì)量幾乎不變。解碼時(shí)，自適應(yīng)的解碼原理同基本分形圖像壓縮算法解碼原理相同。3.6基于神經(jīng)網(wǎng)絡(luò)的壓縮算法人工神經(jīng)網(wǎng)絡(luò)（Artificial Neural Net，ANN）簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò)，是對(duì)人腦或自然神經(jīng)網(wǎng)絡(luò)若干基本特性的抽象和模擬。人工神經(jīng)網(wǎng)絡(luò)由大量的神經(jīng)元模型所組成，實(shí)際上是一個(gè)超大規(guī)模的非線性連續(xù)時(shí)間動(dòng)力自適應(yīng)信息處理系統(tǒng)。目前人工神經(jīng)網(wǎng)絡(luò)在人工智能

41、、模式識(shí)別、圖像處理等領(lǐng)域都有著重要應(yīng)用?；谏窠?jīng)網(wǎng)絡(luò)的壓縮算法試圖在解決好充分利用人的視覺特性這個(gè)問題上有所突破。目前直接用于圖像壓縮的神經(jīng)網(wǎng)絡(luò)主要有BP（Back Propagation）網(wǎng)絡(luò)和自組織映射神經(jīng)網(wǎng)絡(luò)。BP 網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)，是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。該算法的思想為：把一組輸入模式通過少量的隱節(jié)點(diǎn)映射到一組輸出模式，并使輸出模式盡可能的等同于輸入模式。當(dāng)中間的隱含層節(jié)點(diǎn)數(shù)小于輸入層節(jié)點(diǎn)數(shù)時(shí)，就意味著中間隱含層能更有效地表現(xiàn)輸入模式，并把這種表現(xiàn)傳送到輸出層。在這個(gè)過程中，輸入層和中間層的變換可以看成是壓縮編碼的過程；而中間層和輸出層的變換可

42、以看成是解碼的過程。該算法可以直接用來進(jìn)行數(shù)據(jù)壓縮，實(shí)現(xiàn)起來比較簡(jiǎn)單，但是并不完善，存在學(xué)習(xí)收斂速度太慢、網(wǎng)絡(luò)的學(xué)習(xí)記憶具有不穩(wěn)定性等缺陷。3.6.1基于BP人工神經(jīng)網(wǎng)絡(luò)的圖像壓縮算法（1）傳統(tǒng)的基于BP人工神經(jīng)網(wǎng)絡(luò)的圖像壓縮BP(Back一ProPagation)算法,即為誤差反向傳播算法,在網(wǎng)絡(luò)內(nèi)部有兩種信息!流通:輸入信號(hào)正向傳播和誤差信號(hào)反向傳播兩個(gè)過程,如圖4.1所示"網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)包括輸入層!隱層和輸出層"從外界或者其他神經(jīng)元來的信息進(jìn)入輸入層,經(jīng)過輸入層的運(yùn)算輸出傳給中間隱層神經(jīng)元;隱層神經(jīng)元進(jìn)行信息的處理,包括特征提取等,隱層可以有單層或者多層結(jié)構(gòu),根據(jù)信息

43、表示的需要和變化能力的需求進(jìn)行設(shè)計(jì);輸出層接受最后一個(gè)隱層的輸出作為輸出層的輸入,通過輸出層的運(yùn)算得到整個(gè)神經(jīng)網(wǎng)絡(luò)的輸出,從而完成一次輸入信號(hào)的正向傳播"如果輸出的結(jié)果與期望的結(jié)果,即與“教師”差別超出了能夠容許的范圍,或者網(wǎng)絡(luò)的訓(xùn)練次數(shù)還沒有達(dá)到設(shè)定的最大閡值,則進(jìn)入誤差的反向傳播,從而逐層地按照誤差梯度下降的方式調(diào)整各層的權(quán)值"權(quán)值的改變有兩種方式,一種是對(duì)所有模式的梯度求和,即計(jì)算出權(quán)值誤差,到訓(xùn)練結(jié)束是進(jìn)行累加,然后調(diào)整權(quán)值,將變化量加到原有的權(quán)值上得到新的權(quán)值,這是屬于一種批處理的方式;另一種方式是對(duì)每一個(gè)輸入模式,調(diào)整一次網(wǎng)絡(luò)的權(quán)值,如果模式結(jié)合的可能性比較大,

44、這種處理方式更為有利"在整個(gè)網(wǎng)絡(luò)中,每一層神經(jīng)元只能夠影響其相鄰層的神經(jīng)元狀態(tài)"通過不斷地輸入信自!正向傳播和誤差信息的后向傳播,各層權(quán)值不斷調(diào)整,直到輸出結(jié)果和“教師”之間的誤差減少到可以接受的程度"當(dāng)訓(xùn)練次數(shù)超過設(shè)定的最大值時(shí),網(wǎng)絡(luò)的訓(xùn)練也會(huì)結(jié)束"。傳統(tǒng)的基于BP的人工神經(jīng)網(wǎng)絡(luò)中,對(duì)于一幅MxN的圖像,將其劃分為大小為mxn的子塊,每個(gè)子塊的數(shù)據(jù)按照一定的排列規(guī)則形成一個(gè)向量"訓(xùn)練時(shí),從這些向量中隨機(jī)選取一個(gè)向量作為BP網(wǎng)絡(luò)輸入,并將此向量作為輸出的”教師”假設(shè)隱層神經(jīng)元數(shù)量為k,則要求k<mxn,隱層神經(jīng)元的多少不僅影響壓縮比,而且

45、影響重構(gòu)圖像的質(zhì)量,通過實(shí)驗(yàn)大致上取為為合理"例如,對(duì)于一幅大小512*512像素,每個(gè)像素值在O一255的灰度圖像,可將其劃分為4x4的子模塊,則整幅圖像包含有128x128個(gè)子模塊,每個(gè)子模塊形成一個(gè)向量"由于神經(jīng)網(wǎng)絡(luò)輸入值范圍的特點(diǎn),對(duì)所有向量輸入進(jìn)行歸一化處理,使向量的每個(gè)元素取值都在0,l的范圍內(nèi)"將這些向量輸入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直到滿足要求的誤差精度或者達(dá)到了最大的訓(xùn)練次數(shù)為止,此時(shí)形成了固定的網(wǎng)絡(luò)權(quán)值"每個(gè)輸入向量通過輸入層到隱層的映射,形成對(duì)應(yīng)的壓縮數(shù)據(jù)"在解碼端,通過隱層到輸出層的網(wǎng)絡(luò)映射,將壓縮數(shù)據(jù)進(jìn)行恢復(fù)"最后進(jìn)

46、行反歸一化處理,得到灰度取值在O到255之間的重構(gòu)圖像" 圖：3層的BP神經(jīng)網(wǎng)絡(luò)3.7基于方向?yàn)V波的圖像壓縮算法為了解決小波變換方向缺失的問題，多尺度、多方向和各向異性的多尺度幾何分析(Muti-scale geometric analysis, MGA)理論得到了快速的發(fā)展。MGA 的范疇非常廣泛，其中有一類帶有方向?yàn)V波器組(Directional filter banks, DFB)的圖像方向?yàn)V波算法，可以較好地捕捉圖像的方向信息，達(dá)到比小波變換更優(yōu)的表示效果。Do 和 Vetterli 提出的contourlet 變換就是一種著名的方向?yàn)V波算法。Contourlet 變換通過引

47、入拉普拉斯塔式(Laplacian pyramid，LP)分解和方向?yàn)V波器組，可以最優(yōu)地表示二維圖像的方向信息。但是，contourlet 變換因?yàn)橛?4/3 的冗余度而造成編碼效率偏低，并不是圖像編碼的最佳選擇。Eslami 和 Radha 在 contourlet 變換的基礎(chǔ)上，用二維小波變換取代 LP 分解，提出了小波-contourlet 變換(Wavelet-based contourlet transform, WBCT)。WBCT 是一種無(wú)冗余變換，比 contourlet 更適合圖像編碼。隨后，Eslami 和 Radha 又提出了混合小波-方向?yàn)V波器組 (Hybrid wav

48、elets and directional filter banks, HWD)變換，從而擴(kuò)展了WBCT 的概念。HWD 通過定義了多種 DFB 形式，使方向?yàn)V波器組和小波變換的結(jié)合更加靈活。圖像的這一類方向?yàn)V波算法提出后，受到了很多學(xué)者的關(guān)注和深入研究，期間出現(xiàn)了各種基于方向?yàn)V波的圖像編碼方案，而非冗余的 WBCT 和 HWD 無(wú)疑是這個(gè)分支上最優(yōu)秀的兩種算法。在 WBCT 域做圖像編碼，影響編碼性能的因素有很多，如小波分解級(jí)數(shù)，方向分解級(jí)數(shù)等，都是需要討論的問題。而在 HWD 域中，情況似乎更加復(fù)雜，除了上述幾個(gè)問題，HWD 的分解結(jié)構(gòu)也是至關(guān)重要的一個(gè)因素。另外，雖然基于 WBCT和 H

49、WD 域的圖像編碼方案可以較好地捕捉圖像的方向信息，但是由于變換域系數(shù)的量化，也引入了不可避免的振鈴效應(yīng)。由于方向?yàn)V波器組本身的特性，這種振鈴效應(yīng)要比JPEG2000 編碼方案中的振鈴效應(yīng)嚴(yán)重得多，在尋求較優(yōu)的編碼方案時(shí)，控制好振鈴效應(yīng)也是必須要考慮的重要問題。目前就這些問題討論并提出解決方案的文獻(xiàn)，相對(duì)較少。深入研究 WBCT 和 HWD 變換域的特性，尋求一種高效的圖像編碼方案，具有重要的意義。3.7.1 WBCT 域靜止圖像壓縮算法(1)WBCT 的小波分解級(jí)數(shù) NLA 實(shí)驗(yàn)可以很好地考察變換域的稀疏表達(dá)能力。其主要思想是在變換域保留絕對(duì)值最大的一部分系數(shù)，其他系數(shù)都舍棄(即置零)。用保

50、留的大系數(shù)來重構(gòu)圖像，分析重構(gòu)圖像的質(zhì)量。下表為 barbara 圖像在各個(gè) WBCT 分解向量下的 NLA 實(shí)驗(yàn)結(jié)果，表中數(shù)據(jù)為重構(gòu)圖像和原圖像的 PSNR 值。分析下表的實(shí)驗(yàn)結(jié)果，可以得出，小波變換的分解級(jí)數(shù)對(duì) WBCT 的變換性能有著極大的影響。當(dāng)分解級(jí)數(shù) L 小于一定值時(shí)，在較低碼率下的重構(gòu)圖像質(zhì)量很差，這是因?yàn)?L 較小時(shí)，LL 子帶系數(shù)過多。在低碼率下保留的系數(shù)較少，那些被置為零的系數(shù)有相當(dāng)一部分來自于 LL 子帶，而 LL 子帶攜帶的信息是圖像中最重要的信息，此時(shí)解碼圖像質(zhì)量就會(huì)急劇下降。在 L 大到一定的值后，WBCT 變換的性能得到了一定的保證。但是，方向分解級(jí)數(shù)的不同依然在

51、一定程度上影響著重構(gòu)圖像的質(zhì)量。尋求較優(yōu)的分解向量，從而使 WBCT 發(fā)揮其最優(yōu)的變換性能，將是本文一個(gè)重要的研究要點(diǎn)。（2）WBCT 域編碼的振鈴效應(yīng)1雖然在變換域系數(shù)量化后，各個(gè)頻帶都會(huì)有相應(yīng)的頻率干擾，但是低頻子帶量化引入的振鈴效應(yīng)要比高頻子帶嚴(yán)重得多。所以在 contourlet 變換中，Do 和 Vetterli 先對(duì)原圖像進(jìn)行了 LP 分解，實(shí)現(xiàn)了高頻和低頻的分離，再對(duì)高頻部分作 DFB 分解，從而在一定程度上控制了振鈴效應(yīng)。Contourlet 的過采樣方案雖然可以較好地解決頻率干擾的問題，卻也同時(shí)引入了過多的冗余信息。圖3-1所示為barbara圖像最高頻帶作L級(jí)DFB分解，N

52、LA實(shí)驗(yàn)中重構(gòu)圖像的PSNR隨著 L 的變化而變化的折線圖。其中，L=0 表示小波變換（不做任何方向分解）。圖 3-2和圖 3-3 分別為次高頻帶和第三高頻帶的相應(yīng) L 級(jí) DFB 分解的 NLA 實(shí)驗(yàn)結(jié)果。圖 3-1 和圖 3-2 折線的升降變化，說明了在最高頻和次高頻做適當(dāng)?shù)?DFB 分解，可以提高解碼圖像質(zhì)量。頻率越低，折線峰值所對(duì)應(yīng)的最佳方向分解級(jí)也越低。由圖 3-3可見，在第三高頻上作 DFB 分解，會(huì)導(dǎo)致高碼率下的解碼圖像質(zhì)量下降，而且分解級(jí)數(shù)越高，解碼圖像的 PSNR 越低。因此，在第三高頻子帶上，保持小波系數(shù)不分解是最佳的選擇。對(duì)于更低的頻率子帶，更是如此。（3）振鈴效應(yīng)和方向

53、分解級(jí)數(shù)的關(guān)系在一個(gè)小波子帶內(nèi)，多級(jí)方向?yàn)V波等效于濾波器的卷積。方向分解級(jí)數(shù) L 越大，等效濾波器就越長(zhǎng)，捕捉方向信息的能力越強(qiáng)，所產(chǎn)生的振鈴效應(yīng)也越嚴(yán)重。反之，L 越小，捕捉方向信息的能力越弱，振鈴效應(yīng)也越輕微。從圖 3-3(a)中不難發(fā)現(xiàn)，隨著 DFB分解級(jí)數(shù)的增大，解碼圖像質(zhì)量急劇下降，過于嚴(yán)重的振鈴效應(yīng)是出現(xiàn)這種現(xiàn)象的根本原因。圖 3-4 所示的實(shí)驗(yàn)結(jié)果也可以驗(yàn)證這個(gè)論點(diǎn)。圖 3-4 所示為 NLA 實(shí)驗(yàn)采用五級(jí)小波變換，保留 1/8 大系數(shù)，對(duì)次高頻帶作方向分解，方向分解級(jí)數(shù)為 L=1 和 3 時(shí)的解碼圖像(等效于 WBCT0 1 0 0 0和0 3 0 0 0分解)。比較圖 3-4

54、(b)和圖 3-4(c)可以發(fā)現(xiàn)，L=3 時(shí)的重構(gòu)圖像平滑區(qū)域出現(xiàn)了很多因振鈴效應(yīng)而導(dǎo)致的噪聲，比 L=1 時(shí)的解碼圖像嚴(yán)重得多。（4）WBCT 域最優(yōu)分解條件小波變換的分解級(jí)數(shù)是影響 WBCT 變換性能的最大因素。達(dá)到一定分解級(jí)的小波變換才是比較適合圖像編碼的。JPEG2000 標(biāo)準(zhǔn)程序中采用五級(jí)9-7 小波變換，不管是計(jì)算量還是編碼性能都是較優(yōu)的。在本文接下來的實(shí)驗(yàn)中，全部采用五級(jí) 9-7 小波變換。NLA 實(shí)驗(yàn)驗(yàn)證了 WBCT 變換性能和分解級(jí)數(shù)、小波頻帶之間的關(guān)系。在尋求 WBCT 分解向量的問題上，存在著一個(gè)最優(yōu)解，使 DFB 分解既保持在捕捉方向信息上的優(yōu)勢(shì)，又能較好地控制解碼圖像

55、中的振鈴效應(yīng)。方向分解級(jí)數(shù)，并不是越高越好，也不是越低越好。而且其最佳的分解級(jí)數(shù)和所處的頻率子帶有關(guān)。一般而言，只適合對(duì)小波變換后的最高的兩個(gè)頻帶作 DFB 分解，從第三頻帶開始就保留小波系數(shù)不分解。另外，頻率越低的小波子帶，所對(duì)應(yīng)的最優(yōu)方向分解級(jí)數(shù)也越低，比如選取 V=3 2 0 0 0或者2 1 0 0 0。這就是選取 WBCT 變換最優(yōu)分解向量的限制條件。圖 3-5 所示為五級(jí)小波變換域和 WBCT3 2 0 0 0變換域的 NLA 對(duì)比實(shí)驗(yàn)，可以看到，保留相同數(shù)目大系數(shù)的前提下，WBCT 域的重構(gòu)圖像擁有比小波變換重構(gòu)圖像更高的 PSNR 值。這是因?yàn)榛?DFB 的 WBCT 變換更好地編碼了圖像的方向信息，其對(duì)圖像內(nèi)容的表達(dá)比小波變換更稀疏。（5）子帶方向和子帶頻率的關(guān)系在 WBCT 中，DFB 對(duì)小波變換后的 HL，LH 和 HH 子帶作方向分解，雖然這三個(gè)子帶都是圖像的高頻子帶，但是 HL 只是水平方向上的高頻，LH 只是垂直方向

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

圖像壓縮文獻(xiàn)綜述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

圖像壓縮文獻(xiàn)綜述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔