版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第七講
圖像的編碼與壓縮
第七講
圖像的編碼與壓縮
數(shù)據(jù)壓縮最初是信息論研究中的一個重要課題,在信息論中數(shù)據(jù)壓縮被稱為信源編碼。但近年來,數(shù)據(jù)壓縮不僅限于編碼方法的研究與探討,己逐步形成較為獨立的體系。它主要研究數(shù)據(jù)的表示、傳輸、變換和編碼方法,目的是減少存儲數(shù)據(jù)所需的空間和傳輸所用的時間。一、引言數(shù)據(jù)壓縮最初是信息論研究中的一個重要課題,在信息論中為什么要壓縮?
圖像作為信息的重要表現(xiàn)形式,其具有數(shù)據(jù)量大、帶寬寬等特點。
需要增加信道,但這很有限,因為信道的增加永遠趕不上信息的爆炸式增長,況且還要受到環(huán)境的限制。
必須減少表示圖像的數(shù)據(jù)量,以達到壓縮圖像數(shù)據(jù)的目的。為什么要壓縮?
圖像數(shù)據(jù)的特點之一是信息量大。以像幅為23cm×23cm的航攝影像為例,若按采樣間隔25um、每象素8bit掃描,其數(shù)據(jù)量為84.5MB;一顆衛(wèi)星每半小時發(fā)回—次全波段(五個波段)數(shù)據(jù),每個波段圖像大小為2292×2190字節(jié)約4.90MB,每天的數(shù)據(jù)量高達1.2GB。如此海量數(shù)據(jù)需要巨大的存儲空間。在多媒體中,海量圖像數(shù)據(jù)的存儲和處理是難點之一。根據(jù)計算,一張600M字節(jié)的光盤,能存放20秒左右的640×480像素的圖像畫面信息,如不進行編碼壓縮處理,多媒體信息保存有多么困難是可想而知的。
在現(xiàn)代通信中,圖像傳輸已成為重要內(nèi)容。除要求設(shè)備可靠、圖像保真度高以外,實時性將是重要技術(shù)指標之一。很顯然,在信道帶寬、通信鏈路容量一定的前提下,采用編碼壓縮技術(shù),減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。
沒有圖像編碼壓縮技術(shù)的發(fā)展,大容量圖像信息的存儲與傳輸是難以實現(xiàn)的,多媒體、高速信息公路等新技術(shù)在實際中的應(yīng)用會碰到很大困難。圖像數(shù)據(jù)的特點之一是信息量大。在現(xiàn)代通信中,2.為什么能壓縮?
一般圖像中,存在很大的冗余度。到底能壓縮多少,除了和圖像本身存在的冗余度多少有關(guān)外,很大程度取決于對圖像質(zhì)量的要求。
例如:廣播電視要考慮藝術(shù)欣賞,對圖像質(zhì)量要求就很高,用目前的編碼技術(shù),即使壓縮比達到3∶1都是很困難的。而對可視電話,因畫面活動部分少,對圖像質(zhì)量要求也低,可采用高效編碼技術(shù),使壓縮比高達1500∶1以上。
目前高效圖像壓縮編碼技術(shù)已能用硬件實現(xiàn)實時處理,在廣播電視、工業(yè)電視、電視會議、可視電話、傳真和互連網(wǎng)、遙感等多方面得到應(yīng)用。
2.為什么能壓縮?
空間冗余:圖像內(nèi)部相鄰像素之間存在較強的相關(guān)性所造成的冗余。時間冗余:視頻圖像序列中的不同幀之間的相關(guān)性所造成的冗余。視覺冗余:是指人眼不能感知或不敏感的那部分圖像信息。數(shù)字圖像的冗余主要表現(xiàn)為以下幾種形式:空間冗余、時間冗余、視覺冗余、信息熵冗余、結(jié)構(gòu)冗余。數(shù)字圖像的冗余主要表現(xiàn)為以下幾種形式:信息熵冗余:也稱編碼冗余,如果圖像中平均每個像素使用的比特數(shù)大于該圖像的信息熵,則圖像中存在冗余,這種冗余稱為信息熵冗余。結(jié)構(gòu)冗余:是指圖像中存在很強的紋理結(jié)構(gòu)或自相似性。信息熵冗余:也稱編碼冗余,如果圖像中平均每個像素使用的比特數(shù)圖像數(shù)據(jù)的這些冗余信息為圖像壓縮編碼提供了依據(jù)。
例如,利用人眼對藍光不敏感的視覺特性,在對彩色圖像編碼時,就可以用較低的精度對藍色分量進行編碼。圖像編碼的目的就是充分利用圖像中存在的各種冗余信息,特別是空間冗余、時間冗余以及視覺冗余,以盡量少的比特數(shù)來表示圖像。
利用各種冗余信息,壓縮編碼技術(shù)能夠很好地解決在將模擬信號轉(zhuǎn)換為數(shù)字信號后所產(chǎn)生的帶寬需求增加的問題,它是使數(shù)字信號走上實用化的關(guān)鍵技術(shù)之一,下表中列出了幾種常見應(yīng)用的碼率。
圖像數(shù)據(jù)的這些冗余信息為圖像壓縮編碼提供了依據(jù)。圖像的編碼與壓縮課件圖像壓縮編碼的概念圖像數(shù)據(jù)的壓縮和編碼表示。圖像壓縮編碼系統(tǒng):圖像編碼:對圖像信息進行壓縮和編碼,在存儲、處理和傳輸前進行,也稱圖像壓縮;圖像解碼:對壓縮圖像進行解壓以重建原圖像或其近似圖像。圖像壓縮編碼的概念圖像數(shù)據(jù)的壓縮和編碼表示。二、
圖像編碼評價
隨著眾多圖像壓縮算法的出現(xiàn),如何評價圖像壓縮算法就成為重要的課題。一般說來,評價圖像壓縮算法的優(yōu)劣主要有以下4個參數(shù)。
1)算法的編碼效率算法的編碼效率通常有幾種表現(xiàn)形式:平均碼字長度(R),圖像的壓縮比(rate,r),每秒鐘所需的傳輸比特數(shù)(bitspersecond,bps),圖像熵與平均碼長之比(η)。二、圖像編碼評價
設(shè)一幅灰度級為N的圖像,圖像中第k級灰度出現(xiàn)的概率為Pk,圖像大小為Nx×Ny,每個像素用d比特表示,每兩幀圖像間隔Δt,則按信息論中信息熵的定義,數(shù)字圖像的熵H由下式定義:
由此可見,圖像熵H表示各灰度級比特數(shù)的統(tǒng)計平均值。對于一種圖像編碼方法,設(shè)第k級灰度的碼字長度為Bk,則該圖像的平均碼字長度R為設(shè)一幅灰度級為N的圖像,圖像中第k級灰度出現(xiàn)于是,可定義編碼效率η為
每秒鐘所需的傳輸比特數(shù)bps為壓縮比r為
由于同一壓縮算法對不同圖像的編碼效率會有所不同,因此常需定義一些“標準圖像”,一般通過測量不同壓縮算法對同一組“標準圖像”的編碼性能來評價各圖像壓縮算法的編碼效率。于是,可定義編碼效率η為每秒鐘所需的傳輸比特數(shù)bps為
2)編碼圖像的質(zhì)量圖像質(zhì)量評價可分為客觀質(zhì)量評價和主觀質(zhì)量評價。最常用的客觀質(zhì)量評價指標是均方誤差(MSE)和峰值信噪比(PSNR),其定義如下:
2)編碼圖像的質(zhì)量
主觀質(zhì)量評價是指由一批觀察者對編碼圖像進行觀察并打分,然后綜合所有人的評判結(jié)果,給出圖像的質(zhì)量評價。
客觀質(zhì)量評價能夠快速有效地評價編碼圖像的質(zhì)量,但符合客觀質(zhì)量評價指標的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評價能夠與人的視覺效果相匹配,但其評判過程緩慢費時。主觀質(zhì)量評價是指由一批觀察者對編碼圖像進行觀察
3)算法的適用范圍
特定的圖像編碼算法具有其相應(yīng)的適用范圍,并不對所有圖像都有效。
一般說來,大多數(shù)基于圖像信息統(tǒng)計特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像。
3)算法的適用范圍
4)算法的復(fù)雜度
算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運算量和硬件實現(xiàn)該算法的難易程度。
優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。
選用編碼方法時一定要考慮圖像信源本身的統(tǒng)計特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標準。4)算法的復(fù)雜度三圖像壓縮方法分類
按壓縮前及解壓后的信息保持程度和方法的原理來分類
按照壓縮前及解壓后的信息保持程度分成三類:信息保持(存)型
壓縮、解壓中無信息損失,主要用于圖像存檔,其特點是信息無失真,但壓縮比有限,也稱無失真無損可逆型編碼。信息損失型
犧牲部分信息,來獲取高壓縮比,數(shù)字電視、圖像傳輸和多媒體等應(yīng)用場合常用這類壓縮,其特點是通過忽略人的視覺不敏感的次要信息來提高壓縮比,也稱有損壓縮。特征抽取型
僅對于實際需要的(提?。┨卣餍畔⑦M行編碼,而丟掉其它非特征信息,屬于信息損失型。這里的第三類是針對特殊的應(yīng)用場合,因此,一般就將圖像壓縮編碼分成無損和有損兩大類。圖像的編碼與壓縮課件按照圖像壓縮的方法原理可分成四類像素編碼:編碼時只對每個像素單獨處理。如脈沖編碼調(diào)制、熵編碼、行程編碼等。預(yù)測編碼:通過去除相鄰像素之間的相關(guān)性和冗余性,只對新的信息進行編碼。常用的有差分脈沖編碼調(diào)制。變換編碼:對給定圖像采用某種變換,使得大量的信息能用較少的數(shù)據(jù)來表示。通常采用的變換包括:離散傅立葉變換(DFT(DFT),離散余弦變換),(DCT)(DCT)和離散小波變換(DWT)(DWT)。其它方法:早期的編碼,如混合編碼、矢量量化、LZWLZW算法。
近些年來也出現(xiàn)了很多新的壓縮編碼方法,如使用人工神經(jīng)元網(wǎng)絡(luò)的壓縮編碼算法、分形、小波、基于對象的壓縮編碼算法、基于模型的壓縮編碼算法等。按照圖像壓縮的方法原理可分成四類行程編碼(RLE)
在一個逐行存儲的圖像中,具有相同灰度值的一些象素組成的序列稱為一個行程。在編碼時,對于每個行程只存儲一個灰度值的碼,再緊跟著存儲這個行程的長度。這種按照行程進行的編碼被稱為行程編碼(RunLengthEncoding)。
行程編碼對于僅包含很少幾個灰度級的圖像,特別是二值圖像,比較有效。3.1無損編碼行程編碼(RLE)3.1無損編碼1、行程編碼基本方法行程編碼又稱行程長度編碼,是一種熵編碼,其編碼原理相當簡單,即將具有相同值的連續(xù)串用其串長和一個代表值來代替,該連續(xù)串就稱為行程,串長稱為行程長度。例如,有一字符串“aabbbcddddd”,則經(jīng)行程長度編碼后,該字符串可以只用“2a3b1c5d”來表示。行程編碼分為定長和不定長編碼兩種。定長編碼是指編碼的行程長度所用的二進制位數(shù)固定,而變長行程編碼是指對不同范圍的行程長度使用不同位數(shù)的二進制位數(shù)進行編碼。使用變長行程編碼需要增加標志位來表明所使用的二進制位數(shù)。
1、行程編碼基本方法
行程編碼比較適合于二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場合,用行程來表示連零碼。如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的,那么采用行程編碼可以達到很高的壓縮比。如果圖像中的數(shù)據(jù)非常分散,則行程編碼不但不能壓縮數(shù)據(jù),反而會增加圖像文件的大小。
為了達到較好的壓縮效果,一般不單獨采用行程編碼,而是和其他編碼方法結(jié)合使用。例如,在JPEG中,就綜合使用了行程編碼、DCT、量化編碼以及哈夫曼編碼,先對圖像作分塊處理,再對這些分塊圖像進行離散余弦變換(DCT),對變換后的頻域數(shù)據(jù)進行量化并作Z字形掃描,接著對掃描結(jié)果作行程編碼,對行程編碼后的結(jié)果再作哈夫曼編碼。行程編碼比較適合于二值圖像的編碼,一般用于量2、PCX文件中的行程編碼
PCX文件分為文件頭和圖像壓縮數(shù)據(jù)兩個部分。如果是256色圖像,則還有一個256色調(diào)色板存于文件尾部。文件頭全長128字節(jié),包含了圖像的大小和顏色以及PCX文件的版本標識等信息,圖像壓縮數(shù)據(jù)緊跟在文件頭之后。如果沒有使用調(diào)色板,那么圖像壓縮數(shù)據(jù)存儲的是實際像素值;否則,存儲的是調(diào)色板的索引值。2、PCX文件中的行程編碼
在256色PCX文件中,每個像素占一字節(jié),壓縮數(shù)據(jù)以字節(jié)為單位逐行進行編碼,每行填充到偶數(shù)字節(jié)。PCX文件規(guī)定編碼時的最大行程長度為63,如果行程長度大于63,則必須分多次存儲。
對于長度大于1的行程,編碼時先存入其行程長度(長度L加上192即0xC0),再存入該行程的代表值,行程長度和行程的代表值分別占一字節(jié)。
對于長度為1的行程,即單個像素,如果該像素的值小于或等于0xC0,則編碼時直接存入該像素值,而不存儲長度信息;否則,先存入0xC1,再存入該像素值,這樣做的目的是為了避免該像素值被誤認為長度信息。
在256色PCX文件中,每個像素占一字節(jié),例如,連續(xù)100個灰度值為0x80的像素,其編碼(以十六進制表示)應(yīng)為FF802580。上面的編碼中出現(xiàn)FF的長度信息是由63與0xC0相加所得。對256色PCX文件解碼時,首先從壓縮數(shù)據(jù)部分讀取一個字節(jié),判斷該值是否大于0xC0,如果是,則表明該字節(jié)是行程長度信息,取其低六位(相當于減去0xC0)作為行程長度L,讀取下一個字節(jié)作為像素值并重復(fù)L次存入圖像數(shù)據(jù)緩沖區(qū);否則,直接將該字節(jié)存入圖像數(shù)據(jù)緩沖區(qū)。幾乎所有的圖像應(yīng)用軟件都支持PCX文件格式,但由于它的壓縮比不高,因而現(xiàn)在用得不是很多。
例如,連續(xù)100個灰度值為0x80的像素,其編碼(以十六進制LZW編碼
LZW(Lempel-Ziv&Welch)編碼又稱字串表編碼,屬于一種無損編碼,是Welch將Lempel和Ziv所提出的無損壓縮技術(shù)改進后的壓縮方法。LZW編碼與行程編碼類似,也是對字符串進行編碼從而實現(xiàn)壓縮,但它在編碼的同時還生成了特定字符串以及與之對應(yīng)的索引字符串表。
LZW編碼
LZW編碼的基本思想是:在編碼過程中,將所遇到的字符串建立一個字符串表,表中的每個字符串都對應(yīng)一個索引,編碼時用該字符串在字串表中的索引來代替原始的數(shù)據(jù)串。
例如,一幅8位的灰度圖像,我們可以采用12位來表示每個字符串的索引,前256個索引用于對應(yīng)可能出現(xiàn)的256種灰度,由此可建立一個初始的字符串表,而剩余的3840個索引就可分配給在壓縮過程中出現(xiàn)的新字符串,這樣就生成了一個完整的字符串表,壓縮數(shù)據(jù)就可以只保存它在字符串表中的索引,從而達到壓縮數(shù)據(jù)的目的。
字符串表是在壓縮過程中動態(tài)生成的,不必將它保存在壓縮文件里,因為解壓縮時字符串表可以由壓縮文件中的信息重新生成。LZW編碼的基本思想是:在編碼過程中,將所遇
GIF(GraphicsInterchangeFormat)最初于1987年開發(fā)的一種壓縮位圖格式。它可支持多達256種的顏色,具有極佳的壓縮效率,已成為Internet上一種流行的文件格式。GIF圖像文件采用的是一種改良的LZW壓縮算法,通常稱為GIF-LZW壓縮算法。GIF圖像文件以塊(又稱為區(qū)域結(jié)構(gòu))的方式來存儲圖像相關(guān)的信息。設(shè)S1、S2為兩個存放字符串的臨時變量,LZW_CLEAR和LZW_EOI分別為字符表初始化標志和編碼結(jié)束標志,GIF-LZW的編碼步驟如下:
GIF(GraphicsIntercha
(1)根據(jù)圖像中使用的顏色數(shù)初始化一個字串表,字串表中的每個顏色對應(yīng)一個索引。在初始字串表的末尾再添加兩個符號(LZW_CLEAR和LZW_EOI)的索引。設(shè)置字符串變量S1、S2并初始化為空。(2)接著輸出LZW_CLEAR在字串表中的索引。(3)從圖像數(shù)據(jù)流中第一個字符(假設(shè)數(shù)據(jù)以字符串表示)開始,每次讀取一個字符,將其賦給字符串變量S2。(4)判斷“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,則S1=S1+S2;否則,輸出S1在字串表中的索引,并在字串表末尾為“S1+S2”添加索引,同時,S1=S2。
(1)根據(jù)圖像中使用的顏色數(shù)初始化一個字串表,字串
(5)重復(fù)第3和第4步,直到所有字符讀完為止。(6)輸出S1中的字符串在字串表中的索引,然后輸出結(jié)束標志LZW_EOI的索引,編碼完畢。
GIF-LZW的解碼過程比較復(fù)雜,它和編碼過程正好相反,即將編碼后的碼字轉(zhuǎn)換成對應(yīng)的字符串,重新生成字串表,然后依次輸出對應(yīng)的字符串即可。(5)重復(fù)第3和第4步,直到所有字符讀完為止。LZW編碼實例設(shè)有一來源于4色(以a、b、c、d表示)圖像的數(shù)據(jù)流aabcabbbbd,現(xiàn)對其進行LZW編碼。編碼過程如下:編碼前,首先需要初始化一個字符串表。由于圖像中只有四種顏色,因而我們可以只用4比特表示字符串表中每個字符串的索引,表中的前4項代表4種顏色,后兩項分別表示初始化和圖像結(jié)束標志,建立的初始化字符串表如表所示。接著把S1和S2初始化為空(即NULL),輸出LZW_CLEAR的在字符串表中的索引值4H,接下來是對圖像數(shù)據(jù)的編碼。
LZW編碼實例初始化字符串表字符串索引a0Hb1Hc2Hd3HLZW_CLEAR4HLZW_EOI5H初始化字符串表字符串索引a0Hb1Hc2H
讀取圖像數(shù)據(jù)流的第一個字符“a”,賦給S2,因S1+S2=“a”已存在字串表中,所以S1=S1+S2=“a”。接著讀入下一個字符“a”賦給S2,因S1+S2=“aa”不存在于字串表中,所以輸出S1=“a”的索引0H,同時在字符串表末尾添加新字符串“aa”的索引6H,并使S1=S2=“a”。依次讀取數(shù)據(jù)流中的每個字符,如果S1+S2沒有出現(xiàn)在字符串表中,則輸出S1中的字符串的索引,并在字符串表末尾為新字符串S1+S2添加索引,并使S1=S2;否則,不輸出任何結(jié)果,只是使S1=S1+S2。所有字符處理完畢后,輸出S1中的字符串的索引,最后輸出結(jié)束標志LZW_EOI的索引。至此,編碼完畢,完整的編碼過程如下表所示,最后的編碼結(jié)果為“4001271B35”(以十六進制表示)。
讀取圖像數(shù)據(jù)流的第一個字符“a”,賦給S2,GIF-LZW編碼過程GIF-LZW編碼過程Huffman編碼Huffman編碼是50年代提出的一種基于統(tǒng)計的無損編碼方法,它利用變長的碼來使冗余量達到最小。
Huffman編碼原理:常出現(xiàn)的字符用較短的碼代表,不常出現(xiàn)的字符用較長的碼代表。靜態(tài)Huffman編碼使用一棵依據(jù)字符出現(xiàn)的概率事先生成好的編碼樹進行編碼。而動態(tài)Huffman編碼需要在編碼的過程中建立編碼樹。由于Huffman編碼所得到的平均碼字長度可以接近信源的熵,因此在變長編碼中是最佳的編碼方法,故也稱為熵編碼。Huffman編碼
1、哈夫曼編碼的理論基礎(chǔ)
根據(jù)信息論中信源編碼理論,當平均碼長R大于等于圖像熵H時,總可設(shè)計出一種無失真編碼。當平均碼長等于或很接近于(但不大于)圖像熵時,稱此編碼方法為最佳編碼,此時不會引起圖像失真;當平均碼長大于圖像熵時,壓縮比較高,但會引起圖像失真。
在變長編碼中,如果碼字長度嚴格按照對應(yīng)符號出現(xiàn)的概率大小逆序排列,則其平均碼字長度為最小,這就是變長最佳編碼定理。變長最佳編碼定理是哈夫曼編碼的理論基礎(chǔ)。設(shè)D為編碼所使用的數(shù)制,則變長最佳編碼的平均碼字長度R的范圍為
1、哈夫曼編碼的理論基礎(chǔ)
2、哈夫曼編碼算法(1)首先統(tǒng)計信源中各符號出現(xiàn)的概率,按符號出現(xiàn)的概率從大到小排序。(2)把最小的兩個概率相加合并成新的概率,與剩余的概率組成新的概率集合。(3)對新的概率集合重新排序,再次把其中最小的兩個概率相加,組成新的概率集合。如此重復(fù)進行,直到最后兩個概率的和為1。2、哈夫曼編碼算法
(4)分配碼字。碼字分配從最后一步開始反向進行,對于每次相加的兩個概率,給大的賦“0”,小的賦“1”(也可以全部相反,如果兩個概率相等,則從中任選一個賦“0”,另一個賦“1”即可),讀出時由該符號開始一直走到最后的概率和“1”,將路線上所遇到的“0”和“1”按最低位到最高位的順序排好,就是該符號的哈夫曼編碼。
(4)分配碼字。碼字分配從最后一步開始反向進行
例
設(shè)一幅灰度級為8(分別用S0、S1、S2、S3、S4、S5、S6、S7表示)的圖像中,各灰度所對應(yīng)的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04?,F(xiàn)對其進行哈夫曼編碼編碼過程如圖所示,具體步驟如下:
(1)首先對信源概率從大到小排序,選出最小的兩個概率(0.04和0.05),相加得0.09,與其他概率組成新的概率集合{0.40,0.18,0.10,0.10,0.07,0.06,0.09}。例設(shè)一幅灰度級為8(分別用S0、S1、S(2)對新的概率集合重新排序,選出最小的兩個概率(0.06和0.07),相加得0.13,組成新的概率集合{0.40,0.18,0.10,0.10,0.09,0.13}。
(3)對新的概率集合重新排序,選出最小的兩個概率(0.10和0.09),相加得0.19,組成新的概率集合{0.40,0.18,0.13,0.10,0.19}。
(4)對新的概率集合重新排序,選出最小的兩個概率(0.13和0.10),相加得0.23,組成新的概率集合{0.40,0.19,0.18,0.23}。(2)對新的概率集合重新排序,選出最小的兩(5)對新的概率集合重新排序,選出最小的兩個概率(0.19和0.18),相加得0.37,組成新的概率集合{0.40,0.23,0.37}。
(6)對新的概率集合重新排序,選出最小的兩個概率(0.23和0.37),相加得0.60,組成新的概率集合{0.40,0.60}。
(7)直到最后兩個概率(0.60和0.40)相加和為1。(5)對新的概率集合重新排序,選出最小(8)分配碼字。從最后一步反向進行,首先給最后相加的兩個概率(0.60和0.40)分配碼字,由于0.60大于0.40,于是給0.60賦“0”,給0.40賦“1”。如此依次給每次相加的兩個概率分配碼字。
(9)最后寫出每個符號的哈夫曼編碼。以符號S1(對應(yīng)的概率為0.18)為例,在從0.18到1.0的路徑上,它所遇到的賦值(“0”或“1”)依次為1、0、0,將其反向排列成“001”,于是就形成了符號S1的哈夫曼碼字“001”。(8)分配碼字。從最后一步反向進行,首先哈夫曼編碼過程哈夫曼編碼過程
上述哈夫曼編碼方法形成的碼字是可識別的,即能夠保證一個符號的碼字不會與另一個符號的碼字的前幾位相同。比如說,如果S0的碼字為1,S1的碼字為001,而S2的碼字為011,則當編碼序列中出現(xiàn)0011時,就不能判別它是S2的碼字還是S1的碼字后面跟了一個S0的碼字1。下面來看一下哈夫曼編碼的編碼效率。平均碼長R為上述哈夫曼編碼方法形成的碼字是可識別的,即能夠數(shù)字圖像的熵H為則哈夫曼編碼的編碼效率η為數(shù)字圖像的熵H為則哈夫曼編碼的編碼效率η為
由此可見,哈夫曼編碼的編碼效率是相當高的,其冗余度只有2.2%。如果采用等長編碼,由于有8種灰度級,則每種灰度級別至少需要3比特來表示,對于例中的圖像而言,其編碼的平均碼長為3,編碼效率為85%。
對不同概率分布的信源,哈夫曼編碼的編碼效率有所差別。根據(jù)信息論中信源編碼理論,對于二進制編碼,當信源概率為2的負冪次方時,哈夫曼編碼的編碼效率可達100%,其平均碼字長度也很短,而當信源概率為均勻分布時,其編碼效果明顯降低。在下表中,顯然,第二種情況的概率分布也服從2的負冪次方,故其編碼效率η也可以達到100%,但由于它服從均勻分布,其熵最大,平均編碼長度很大,因此從其他指標看(如,壓縮比r),其編碼效率最低。也就是說,在信源概率接近于均勻分布時,一般不使用哈夫曼編碼。
由此可見,哈夫曼編碼的編碼效率是相當高的,其啥夫曼編碼在不同概率分布下的編碼效果對比啥夫曼編碼在不同概率分布下的編碼效果對比3.2有損編碼
量化將圖像用較少的灰度級別來表示是最簡單的減小數(shù)據(jù)量的方法,這種方法就是標量量化方法。更一般的情況是,針對連續(xù)量的采樣過程,量化是用有限個狀態(tài)來表示連續(xù)值。3.2有損編碼量化預(yù)測編碼
預(yù)測編碼根據(jù)數(shù)據(jù)在時間和空間上的相關(guān)性,根據(jù)統(tǒng)計模型利用已有樣本對新樣本進行預(yù)測,將樣本的實際值與其預(yù)測值相減得到誤差值,再對誤差值進行編碼。由于通常誤差值比樣本值小得多,因而可以達到數(shù)據(jù)壓縮的效果。模擬量到數(shù)字量的轉(zhuǎn)換過程是脈沖編碼調(diào)制過程PCM,也稱PCM編碼。對于圖像而言,直接以PCM編碼,存儲量很大。預(yù)測編碼可以利用相鄰象素之間的相關(guān)性,用前面已出現(xiàn)的象素值估計當前象素值,對實際值與估計值的差值進行編碼。常用的一種線性預(yù)測編碼方法是差分脈沖編碼調(diào)制DPCM。預(yù)測編碼預(yù)測就是根據(jù)過去時刻的樣本序列,運用一種模型,預(yù)測當前的樣本值。預(yù)測就是根據(jù)過去時刻的樣本序列,運用一種模型,預(yù)測當前的樣本預(yù)測編碼通常不直接對信號編碼,而是對預(yù)測誤差編碼。當預(yù)測比較準確,誤差較小時,即可達到編碼壓縮的目的。這種編碼稱之為差分脈沖編碼調(diào)制(DPCM),上圖是原理框圖。在該系統(tǒng)中,xN為tN時刻的亮度取樣值。預(yù)測器根據(jù)tN時刻之前的樣本x1,x2,…,xN-1對xN作預(yù)測,得到預(yù)測值x'N。xN與x'N之間的誤差為預(yù)測編碼通常不直接對信號編碼,而是對預(yù)測誤差編碼。當預(yù)測比較量化器對eN進行量化得到e‘N。編碼器對e’N
進行編碼發(fā)送。接收端解碼時的預(yù)測過程與發(fā)送端相同,所用預(yù)測器亦相同。接收端恢復(fù)的輸出信號是xN的近似值,兩者的誤差是當ΔxN足夠小時,輸入信號xN
和DPCM系統(tǒng)的輸出信號幾乎一致。量化器對eN進行量化得到e‘N。編碼器對e’N進行編碼發(fā)送DCT編碼
DCT變換是圖像壓縮標準中常用的變換方法,如JPEG標準中將圖像按照8x8分塊利用DCT變換編碼實現(xiàn)壓縮。DCT編碼
DCT變換是圖像壓縮標準中常用的變換方法Lena.bmp(原圖)Lena.bmp(原圖)Lenna.jpg(壓縮率9.2)Lenna.jpg(壓縮率9.2)Lenna.jpg(壓縮率18.4)Lenna.jpg(壓縮率18.4)Lenna.jpg(壓縮率51.6)Lenna.jpg(壓縮率51.6)其它變換編碼
變換方法是實現(xiàn)圖像數(shù)據(jù)壓縮的主要手段。其基本原理是:1、通過變換將圖像數(shù)據(jù)投影到另一特征空間,降低數(shù)據(jù)的相關(guān)性,使有效數(shù)據(jù)集中分布;2、采用量化方法離散化,最后通過Huffman等無損壓縮編碼進一步壓縮數(shù)據(jù)的存儲量。DCT是一種常用的變換域壓縮方法,是JPEG,MPEGI-II等圖像及視頻信號壓縮標準的算法基礎(chǔ)。在實際采用DCT編碼時,需要分塊處理,各塊單獨變換編碼,整體圖像編碼后再解壓會出現(xiàn)塊狀人工效應(yīng),特別是當壓縮比較大時非常明顯,使圖像失真。因此,為了獲得更高的圖像壓縮比,人們提出了一些其它方法,如基于小波變換的圖像壓縮算法和基于分形的圖像壓縮算法等。其它變換編碼
基于小波變換的圖像壓縮算法首先使用某種小波基函數(shù)將圖像做小波變換,再根據(jù)四個通道的不同情況,分別量化編碼。
比如對低頻頻段(LL)采用較多的量化級別,而對中間頻段(LH,RH)采用較少量化級別,對高頻頻段(HH)采用很少幾個量化級別,這樣根據(jù)重構(gòu)時對復(fù)原信號的重要程度分別對待的方式可以有效地提高壓縮比而又不產(chǎn)生明顯的失真。
由于小波變換不使用DCT變換方法中的固定大小的塊分別編碼的處理方法,而是通過整體的多級(通常用3-5個級別)變換方法實現(xiàn),沒有塊狀效應(yīng)。小波變換可以獲得10-50倍的壓縮比而沒有明顯的失真。小波變換在靜態(tài)圖像
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 賽車場車位劃線施工合同
- 互聯(lián)網(wǎng)公司誠聘合同銷售經(jīng)理
- 2024年生態(tài)修復(fù)土石方運輸合作協(xié)議3篇
- 2025年度城市綠化工程專用車輛租賃合同3篇
- 2024商鋪租賃意向書-國際時尚品牌合作版3篇
- 2025版班組勞務(wù)分包及質(zhì)量保障合同示范文本3篇
- 2024年棚戶區(qū)改造項目房屋買賣及配套設(shè)施安裝合同3篇
- 2025年白糖行業(yè)風險管理咨詢合同模板3篇
- 2025年度安置房稅費代繳服務(wù)合同3篇
- 2025版高端住宅社區(qū)聯(lián)建合作開發(fā)協(xié)議書附智能家居系統(tǒng)建設(shè)3篇
- 2022年鄭州市惠濟區(qū)事業(yè)單位考試真題及答案
- 西南交大土木工程經(jīng)濟與項目管理課程設(shè)計
- 管井降水施工方案
- 創(chuàng)業(yè)基礎(chǔ)期末考試
- 基站外電引入建設(shè)指導(dǎo)意見
- 廣東省廣州市白云區(qū)八年級(上)期末數(shù)學試卷
- 全過程工程咨詢服務(wù)技術(shù)方案
- 焊機安全技操作規(guī)程15篇
- CMS電子后視鏡遇見未來
- YY/T 0698.6-2009最終滅菌醫(yī)療器械包裝材料第6部分:用于低溫滅菌過程或輻射滅菌的無菌屏障系統(tǒng)生產(chǎn)用紙要求和試驗方法
- GB/T 397-2009煉焦用煤技術(shù)條件
評論
0/150
提交評論