版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第7章圖像編碼與壓縮7.1圖像信息的冗余7.1.1圖像數(shù)據(jù)壓縮的必要性與可能性1.圖像壓縮與編碼:對圖像數(shù)據(jù)按一定的規(guī)則進(jìn)行變換和組合,從而達(dá)到以盡可能少的代碼(符號)來表示盡可能多的信息。主要研究內(nèi)容:
數(shù)據(jù)的表示、傳輸、變換和編碼方法,目的是減少存儲數(shù)據(jù)所需要的空間和傳輸所用的時(shí)間。2.數(shù)字圖像的信息冗余:圖像數(shù)據(jù)本身存在冗余性和相關(guān)性,一般圖像中存在很大的冗余度。因此圖像信息的壓縮是可能的。冗余:從信息論觀點(diǎn)看,描述圖像信源的數(shù)據(jù)由有用數(shù)據(jù)和冗余數(shù)據(jù)兩部分組成。信息中存在的多余的數(shù)據(jù)即為冗余。圖像數(shù)據(jù)冗余主要表現(xiàn)為:空間冗余、時(shí)間冗余、信息熵冗余(編碼冗余)、結(jié)構(gòu)冗余、知識冗余、頻譜冗余(視覺冗余)及其它冗余。
視覺冗余:人的眼睛對圖像細(xì)節(jié)和顏色的辨認(rèn)有一個(gè)極限,人的視覺特性決定了它最多可辨認(rèn)出216
種顏色,而彩色圖像一般每個(gè)像素用24位表示,則可表示出224種顏色,由此而帶來的數(shù)據(jù)冗余即為視覺冗余。(a)圖是256個(gè)灰度級圖像(b)圖是16個(gè)灰度級圖像(c)圖是16個(gè)灰度級圖像(a)圖是灰度圖像(b)圖是二值圖像空間冗余:當(dāng)圖像中的大部分景物表面顏色都是均勻的、連續(xù)的,圖像數(shù)字化后大量相鄰像素的數(shù)據(jù)是完全一樣或十分接近的,這就是空間冗余。知識冗余:在圖像的理解與圖像表達(dá)的數(shù)據(jù)量之間產(chǎn)生的冗余。時(shí)間冗余:在運(yùn)動圖像中,相鄰兩幀圖像之間有較大的相關(guān)性。結(jié)構(gòu)冗余:由圖像存在的紋理或圖元(分塊子圖像)的相似結(jié)構(gòu)上產(chǎn)生的冗余。7.1.2圖像編碼壓縮的分類
根據(jù)解壓重建后的圖像與原始圖像之間是否具有誤差,圖像編碼壓縮分為無損壓縮編碼和有損壓縮編碼。信息熵冗余:由編碼方式而產(chǎn)生的冗余。
編碼冗余說明表:
code1中Lavg=2,code2中Lavg=1.81
rkpr(rk)code1l1(rk)code2l2(rk)
r1
0.1875
0020113r20.5000
01211r30.12501020103r40.1875112002
典型的無損壓縮有Huffman(郝夫曼編碼)、Fano-Shannon(香農(nóng)-范諾)編碼、算術(shù)編碼和游程編碼等。
適用于要求重建后圖像嚴(yán)格的和原始圖像保持一致的場合(如復(fù)制、保存十分珍貴的歷史、文物圖像)。無損壓縮編碼(可逆編碼):算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息,因此解壓縮時(shí)能精確恢復(fù)原圖像,即壓縮是完全可以恢復(fù)的和沒有偏差的,信息沒有損失。
典型的有損壓縮有預(yù)測編碼、變換域編碼等。有損編碼(不可逆編碼)
算法把不相干的信息刪除,允許重構(gòu)數(shù)據(jù)與原始數(shù)據(jù)存在一定誤差,因此只能對原始圖像進(jìn)行近似的重建,不能精確地復(fù)原,但視覺或聽覺效果一般是可被接受的,或能夠滿足用戶要求。適合大多數(shù)用于存儲數(shù)字化了的模擬圖像。7.1.3圖像壓縮的性能評價(jià)
1.數(shù)據(jù)壓縮技術(shù)的重要指標(biāo):(1)壓縮比:圖像原始數(shù)據(jù)所需的比特?cái)?shù)與壓縮編碼后所需的比特?cái)?shù)之比。壓縮比越大越好。(2)失真性:復(fù)原后圖像與原始圖像之間的差別。(3)壓縮算法:利用不同的編碼方法,實(shí)現(xiàn)對圖像的數(shù)據(jù)壓縮。
壓縮算法與壓縮比關(guān)系:無損壓縮能保證完全恢復(fù)原始圖像,但壓縮比較??;有損壓縮時(shí)原始數(shù)據(jù)不能完全恢復(fù),但壓縮比較高。2.圖像保真度準(zhǔn)則:描述解碼圖像相對原始圖像偏離程度的測度稱為保真度(逼真度)準(zhǔn)則。常用的準(zhǔn)則可分為:客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。
客觀保真度準(zhǔn)則:最常用的客觀保真度準(zhǔn)則是原圖像和解碼圖像之間的均方誤差和均方信噪比兩種。均方誤差:壓縮比、均方誤差及信噪比的關(guān)系:
在相同的壓縮比下,均方誤差越小,性能越好。反之,在相同的均方誤差下,壓縮比越大,性能越好。在相同的壓縮比下,信噪比越大,性能越好。反之,在相同的信噪比下,壓縮比越大,性能越好。基本信噪比:用分貝表示壓縮圖像的定量評價(jià)。峰值信噪比:主觀保真度準(zhǔn)則:客觀保真度是一種統(tǒng)計(jì)平均意義下的度量準(zhǔn)則,對于圖像的細(xì)節(jié)無法反映出來。具有相同客觀保真度的不同圖像,人的視覺可能產(chǎn)生不同的視覺效果。因此采用主觀方法測量圖的質(zhì)量更合適。
方法:常用的方法是對一組(不少于20人)觀察者顯示圖像,并將它們對該圖像的評分取平均,來評價(jià)一幅圖像的主觀質(zhì)量。
另一種方法是對照某種絕對尺度進(jìn)行,即根據(jù)圖像的絕對質(zhì)量進(jìn)行打分。例如,有關(guān)電視圖像的絕對評價(jià)打分標(biāo)準(zhǔn)如下表:圖像質(zhì)量的主觀評分表得分評價(jià)說明12345優(yōu)秀良好可用較差差沒有失真感覺感覺到失真,但沒有不舒服的感覺感覺有點(diǎn)不舒服,可接受感覺較差,感覺非常不舒服,幾乎不能使用主觀評價(jià)可用平均感覺分來表示:7.2信息理論技術(shù)與熵編碼設(shè)離散信息源X={x1,x2,…,xN},每個(gè)符號出現(xiàn)的概率是確定的,為pk=p(xk)自信息量:一個(gè)概率小的符號出現(xiàn)將帶來更大的信息量,即信息量與該符號的概率倒數(shù)成正比。信息熵:構(gòu)成的離散信源的每個(gè)符號的平均信息量。例:7.1,7.2,7.3
圖像平均碼長:7.2.1離散信源的熵表示結(jié)論:1)信源的平均碼長大于等于熵,即熵是無失真編碼的下界。2)如果所有的自信息I(xk)都是整數(shù),且與各符號碼長相等,可以使平均碼長等于熵。3)對非等概率分布的信源,采用不等長編碼,其平均碼長小于等長編碼的平均碼長。4)如果信源中各符號出現(xiàn)的概率相等,則信源熵H(X)的值達(dá)到最大。——最大離散熵定理。7.2.2離散信源編碼定理1.香農(nóng)信息保持定理香農(nóng)信息論已證明,信息熵是無失真編碼的理論極限。低于此極限的無失真編碼是不存在的。2.變長編碼定理若一個(gè)離散無記憶信源X具有熵H(X),并有r個(gè)碼元符號集,則總可以找到一種無失真信源編碼,構(gòu)成單義可譯碼,使其平均碼長滿足:3.變長最佳編碼定理對出現(xiàn)概率大的信息符號賦予短字碼,對于出現(xiàn)概率小的信息符號賦予長字碼。變長編碼的平均碼長一定小于任何其他排列形式。7.3熵編碼技術(shù)
1.編碼技術(shù)編碼技術(shù)研究的是如何在滿足一定的圖像保真條件下,壓縮表示原始圖像數(shù)據(jù)的編碼方法。
編碼技術(shù)的分類:根據(jù)解碼后的數(shù)據(jù)與原始圖像數(shù)據(jù)是否完全一致,可分為有損編碼和無損編碼;根據(jù)壓縮原理,可分為信息熵編碼、預(yù)測編碼和變換編碼等。
圖像格式標(biāo)準(zhǔn):采用不同的編碼得到不同的格式,目前流行的格式有:BMP、PCX、TIF、JPEG
等。類型說明BMP未經(jīng)壓縮的格式,MicrosoftWindows格式PCX通用的標(biāo)準(zhǔn)圖像格式TIF掃描儀生成的圖像格式JPG靜止圖像壓縮國際標(biāo)準(zhǔn)格式2.圖像冗余度和編碼效率編碼效率和冗余度是用來衡量編碼方法優(yōu)劣的準(zhǔn)則。
原始圖像平均碼長:
由信息論可知,熵H(X)是離散無記憶信源進(jìn)行無失真編碼時(shí)的基本極限,即找不到平均碼長比其更短的無失真編碼,即:編碼效率定義:
經(jīng)過編碼壓縮后,圖像信息的冗余度接近于零,或編碼效率已接近于1,這是壓縮已接近其下限,成為高效編碼??梢杂蒙鲜鰷?zhǔn)則來衡量編碼方法的優(yōu)劣。3.統(tǒng)計(jì)編碼方法:統(tǒng)計(jì)編碼:根據(jù)數(shù)據(jù)出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼。常用的統(tǒng)計(jì)編碼有變長編碼,包括郝夫曼編碼、香農(nóng)-范諾編碼和算術(shù)編碼等。變長編碼:對圖像的灰度級用自然碼編碼,一般總會產(chǎn)生編碼冗余,為消除這種冗余常采用變長編碼。
方法:如果用較少的比特?cái)?shù)表示出現(xiàn)概率較大的灰度級,而用較多的比特?cái)?shù)表示出現(xiàn)概率較小的灰度級,這種壓縮方法稱為變長編碼。例:1幅8灰度級圖像分別用自然碼和變長碼表示,并計(jì)算它們的平均碼長。結(jié)果:用3bit自然碼進(jìn)行編碼時(shí),平均碼長為3。采用變長編碼時(shí)的平均碼長為2.7。例:設(shè)一離散信源X為可見變長編碼可以達(dá)到較高的編碼效率。郝夫曼(Huffman)編碼:原理:郝夫曼編碼是運(yùn)用信息熵原理的一種無損編碼。壓縮方法是利用變長編碼將圖像中出現(xiàn)概率大的灰度值賦予短碼字;而對出現(xiàn)概率小的灰度值賦予長碼字,從而達(dá)到壓縮數(shù)據(jù)的目的。編碼方法:(1)將圖像灰度值按概率由大到小排列;(2)把兩個(gè)最小的概率加起來作為新符號的概率;(3)重復(fù)步驟(1)、(2),直到概率和達(dá)到1為止;(4)在每次合并符號時(shí),將被合并的符號賦以1和0
(大概率賦1,小概率賦0,或相反);(5)尋找從每一信號源符號到概率為1處的路徑,記錄下路徑上的1和0;(6)對每一符號寫出“1”、“0”序列,序列的順序是從樹根到信號源符號節(jié)點(diǎn)。例:用郝夫曼編碼進(jìn)行二元編碼
元素aia1a2a3a4a5a6
概率P(ai)0.10.40.060.10.040.3
編碼01110101001000101100郝夫曼編碼的特點(diǎn):(1)哈夫曼編碼構(gòu)造出來的編碼值不是唯一的;(2)編碼效率與信源符號概率分布相關(guān)。當(dāng)圖像灰度值分布很不均勻時(shí),哈夫曼編碼的效率就高;而圖像灰度值的概率分布比較均勻時(shí),哈夫曼編碼的效率就很低。Lavg(3)郝夫曼編碼由于碼字不等長,實(shí)時(shí)硬件實(shí)現(xiàn)復(fù)雜,且抗誤碼能力較差。(4)由于只能用近似整數(shù)而不是理想的小數(shù)表示單個(gè)符號,因此無法達(dá)到最理想的壓縮效果。香農(nóng)-范諾(Shannon-Fano)編碼香農(nóng)-范諾分別單獨(dú)提出類似方法,使編碼更簡單。方法:(1)把信源中的消息x1~xn按概率從大到小、從上到下排成一列,然后把x1~xn分成兩組x1~xk,xk+1~xn,并使得它們的概率和盡可能接近,即(2)賦值原則:把兩組的xi賦0和1,設(shè)概率大的一組賦為0,概率小的一組賦為1(或相反)。(3)把兩組分別按(1)、(2)不斷重復(fù)分組、賦值,直到每組只有一種輸出為止。將每個(gè)xi所賦的值依次排列起來就是香儂—范諾編碼。
例:
練習(xí)題:設(shè)某一幅圖像共有8個(gè)灰度級,各灰度級出現(xiàn)的概率分別為:P1=0.20,P2=0.09,P3=0.11,P4=0.13,P5=0.07,P6=0.12,P7=0.08,P8=0.20。試對此圖像進(jìn)行郝夫曼編碼和香儂—范諾編碼,并計(jì)算信源的熵、平均碼長、編碼效率及冗余度。算術(shù)編碼:基本原理:把整個(gè)信源表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間,其長度等于該序列的概率。再在該區(qū)間內(nèi)選擇一個(gè)代表性的小數(shù),轉(zhuǎn)化為二進(jìn)制作為實(shí)際的編碼輸出。采用算術(shù)編碼不再是將單個(gè)信源符號映射成一個(gè)碼字,每個(gè)符號的平均編碼長度可以為小數(shù)。編碼步驟:1)根據(jù)符號概率,沿著“概率線”為每個(gè)符號設(shè)定一個(gè)范圍。設(shè)概率范圍用rang表示,low表示新范圍低端,high表示新范圍高端;rang_low,rang_high分別表示某信源符號給定范圍的低、高端。2)初始化,其概率范圍:
rang=1.0,low=0。3)對每一個(gè)信源符號依次計(jì)算新的概率范圍:
low=low+rang×rang_lowhigh=low+rang×rang_high4)從最后得到的區(qū)間中選擇一個(gè)數(shù)作為編碼輸出。例:設(shè)信源符號為X={00,01,10,11},其中各符號的概率為P(X)={0.1,0.4,0.2,0.3}。假如輸入的消息序列為:10、00、11、00、10、11、01。試將其進(jìn)行算術(shù)編碼。解:1)沿“概率線”為每個(gè)符號設(shè)定概率范圍:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1.0]2)初始化:范圍range為1.0,低端值low為0;符號10的低端符號10的高端00110.7-0.5=0.2符號00的低端符號00的高端1122223333444455566677
由于0.5143876在[0.5,0.7]區(qū)間,則可得出第一個(gè)信源符號為10。得到信源符號10后,由于已知信源符號10的上界和下界,利用編碼可逆性,減去信源符號10的下界0.5,得0.0143876,再用信源符號10的范圍0.2去除,得到0.071938,由于已知0.071938落在信源符號00的區(qū)間,所以得到第二個(gè)信源符號為00。解碼:編碼的逆過程。根據(jù)編碼時(shí)的概率分配表和壓縮后數(shù)據(jù)代碼所在的范圍,確定代碼所對應(yīng)的每一個(gè)數(shù)據(jù)符號。
同樣再減去信源符號00的下界0,除以信源符號00的范圍0.1,得到0.71938,已知0.71938落在信源符號11區(qū)間,所以得到第三個(gè)信源符號為11......已知0.1落在信源符號01的區(qū)間。再減去信源符號01的下界得到0,解碼結(jié)束。解碼操作過程綜合如下:算術(shù)編碼的主要特點(diǎn):優(yōu)點(diǎn):不必預(yù)先定義信源出現(xiàn)的概率模型,而是根據(jù)各個(gè)信源出現(xiàn)的概率自適應(yīng)地調(diào)節(jié)碼長。不足:1)由于實(shí)際的計(jì)算機(jī)的精度不可能無限長,運(yùn)算中會出現(xiàn)溢出問題。2)算術(shù)編碼器對整個(gè)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在[0,1)之間的一個(gè)實(shí)數(shù),因此譯碼器必須在接收到這個(gè)實(shí)數(shù)后才能譯碼。3)算術(shù)編碼也是一種對錯誤很敏感的方法。練習(xí)題:書p189-7.8行程編碼(RLE):利用空間冗余度壓縮圖像。原理:在給定的圖像數(shù)據(jù)中尋找連續(xù)重復(fù)的數(shù)值,然后用兩個(gè)字符值取代這些連續(xù)值。例:一串用字母表示的數(shù)據(jù)為:“aaabbbbccccdddeeddaa”,經(jīng)過行程編碼處理可表示為“3a4b4c3d2e2d2a”。
圖像編碼方法:例:該圖像有8個(gè)灰度級,24個(gè)像素。像素灰度級g4g3g2g1l1l2l3l4i
gi
li1362510342486編碼1:灰度值用3位碼,總比特?cái)?shù)=24×3=72bit行程編碼:灰度值用3位碼,行程長度用4位碼,則每對參數(shù)有7位碼,共4對,總比特?cái)?shù)=7×4=28bit
不同格式的圖像文件采用行程編碼壓縮數(shù)據(jù)圖像時(shí),編碼方法略有不同。BMP的RLE4壓縮算法:
與一般的行程編碼不同的是在第1字節(jié)中所表示的連續(xù)數(shù)據(jù)的個(gè)數(shù)是像素個(gè)數(shù)而不是字節(jié)個(gè)數(shù)。另外它是針對16色圖像數(shù)據(jù)的處理,引進(jìn)了特殊的識別碼。例:數(shù)據(jù)0X080X57RLE編碼:表示將圖像數(shù)據(jù)0X57連續(xù)重復(fù)顯示8個(gè)字節(jié);
RLE4壓縮算法:表示連續(xù)顯示8個(gè)像素。PCX的RLE壓縮算法:只要在圖像數(shù)據(jù)中發(fā)現(xiàn)一串連續(xù)相同的值,就用兩個(gè)字節(jié)代替這串連續(xù)相同的值,存入圖像文件中。這兩個(gè)字節(jié)中的第一字節(jié)代表這串相同數(shù)據(jù)的個(gè)數(shù),第二字節(jié)代表這串?dāng)?shù)據(jù)的值。對于不重復(fù)的數(shù)據(jù)則單獨(dú)處理。LZW(Lempel-Ziv-Welch)編碼
LZW編碼不需要了解信源的概率,對信源符號的可變長度序列分配固定長度的碼字。它能消除或減少圖像中的像素間冗余,是一種信息保存型的編碼方式。該編碼方法是UNIX操作系統(tǒng)中的標(biāo)準(zhǔn)文件壓縮方法。方法:它是一種字典方法,在編碼的開始階段要構(gòu)造一個(gè)對信號源符號進(jìn)行編碼的編碼表(字典),將輸入字符串映射成定長的碼字輸出。算法在產(chǎn)生輸出字符串的同時(shí)更新編碼表。LZW算法執(zhí)行步驟:1)將字典初始化,使其包含所有可能的單字符。初始化前綴P為空。2)當(dāng)前字符C的內(nèi)容為輸入字符流中的下一個(gè)字符。3)判斷P+C是否在字典中:若“是”,則用C擴(kuò)展P,即令P=P+C。若“否”,則:輸出當(dāng)前前綴P的碼字到碼字流;將P+C添加到字典中;令前綴P=C。4)判斷輸入字符流中是否還有碼字要編碼:若“是”返回到步驟2);若“否”則把當(dāng)前前綴P的碼字輸出到碼字流,并結(jié)束。
字典的尺寸(編碼器參數(shù))是重要參數(shù)。如對于8比特灰度圖像,一個(gè)9比特(512個(gè)字)的字典中,前256個(gè)碼字被分配給灰度值0,1,…,255,則位置256~512將用來存放新的字符串。
例:對一個(gè)有三字符A,B,C組成的字符串“ABBABABAC”進(jìn)行LZW編碼。1)初始化編碼表,將A,B,C單字符串存入表中,并分別賦予碼字值1,2,3。設(shè)前綴P并初始化為空;字符C為當(dāng)前輸入的字符。2)將輸入的字符串從左至右逐個(gè)輸入到編碼器。輸入第1個(gè)字符A,即C=A,則P+C=A已在表中,所以P=P+A=A。輸入第2個(gè)字符B,即C=B,字符串P+C=AB。由于串表中沒有字符串AB,則:①由于B是字符串AB的擴(kuò)展字符,A是其前綴,將前綴A的碼字值1輸出;②將AB加入串表中,并依次賦予AB串的碼字值為4;③令P=B。輸入第3個(gè)符號B,即C=B,字符串P+C=BB。由于串表中沒有字符串BB,則:①由于B是字符串BB的擴(kuò)展字符,B是其前綴,將前綴B的碼字值2輸出;②將BB加入串表中,并依次賦予BB串的碼字值為5;③令P=B。輸入第4個(gè)符號A,即C=A,字符串P+C=BA。由于串表中沒有字符串BA,所以:①由于A是字符串BA的擴(kuò)展字符,B是其前綴,將前綴B的碼字值2輸出;②將BA加入串表中,并依次賦予BA串的碼字值為6;③令P=A。輸入第5個(gè)符號B,即C=B,字符串P+C=AB。由于串表中已有AB串,所以前綴P=P+C=AB。輸入第6個(gè)符號A,即C=A,字符串P+C=ABA。由于串表中沒有字符串ABA,所以:①由于A是字符串ABA的擴(kuò)展字符,AB是其前綴,將前綴AB的碼字值4輸出;②將ABA加入串表中,并依次賦予ABA串的碼字值為7;③令P=A。輸入第7個(gè)符號B,即C=B,字符串P+C=AB。由于串表中已有AB串,所以前綴P=P+C=AB。輸入第8個(gè)符號A,即C=A,字符串P+C=ABA。由于串表中已有ABA串,所以前綴P=P+C=ABA。輸入第9個(gè)符號C,即C=C,字符串P+C=ABAC。由于串表中沒有字符串ABAC,所以:①由于C是字符串ABAC的擴(kuò)展字符,ABA是其前綴,將前綴ABA的碼字值7輸出;②將ABAC加入串表中,并依次賦予ABAC串的碼字值為8;③令P=C。步驟字符串表碼字值輸出123456ABCABBBBAABAABAC12345678122473最后將前綴C的碼字值3輸出,形成如表所示的串表和LZW編碼輸出。解碼:由字符串表根據(jù)編碼字串逐一翻譯即可。輸出碼字值串:122473LZW編碼特點(diǎn):1)在編碼的同時(shí)建立了一個(gè)碼本;2)是一種自適應(yīng)的壓縮方法,但它對輸入數(shù)據(jù)的適應(yīng)比較慢,因?yàn)槊看巫值渲械臈l目只增加一個(gè),且這個(gè)條目只比原條目增加一個(gè)字符。步驟字符串表碼字值輸出123456ABCABBBBAABAABAC12345678122473解碼后的字串:ABBABABAC7.4預(yù)測編碼預(yù)測:根據(jù)過去時(shí)刻的樣本序列,運(yùn)用一種模型,預(yù)測當(dāng)前的樣本值。預(yù)測編碼:通常不直接對信號編碼,而是對預(yù)測誤差編碼。當(dāng)預(yù)測比較準(zhǔn)確,誤差比較小時(shí),即可達(dá)到編碼壓縮的目的,它能減少數(shù)據(jù)在時(shí)間和空間上的相關(guān)性。預(yù)測編碼可分為無損預(yù)測編碼和有損預(yù)測編碼。原理:預(yù)測編碼是一種簡單、有效的編碼方法,其基本原理是利用線性預(yù)測技術(shù)去除空間上較為接近的像素間的冗余,對預(yù)測值與實(shí)際值之間的差值(即預(yù)測誤差)進(jìn)行量化編碼。由于預(yù)測誤差的方差遠(yuǎn)遠(yuǎn)小于輸入序列的方差,從而提高編碼效率,實(shí)現(xiàn)圖像壓縮。1.無損預(yù)測編碼通過對每個(gè)像素實(shí)際值與預(yù)測值之間的差異,進(jìn)行提取和編碼,來消除空間上較為接近的像素之間的冗余。原理:
同時(shí),熵是概率分布的函數(shù),分布越均勻,熵越大,其平均碼長的下限越大,從而表示每個(gè)消息所需的比特?cái)?shù)(碼率)就會增高;反之,分布越集中其熵越小,平均碼長的下限越小,從而碼率就會降低。理論簡析:
預(yù)測誤差的方差比原始圖像信號的方差小,其概率分布比原始圖像信號更集中,因此,預(yù)測誤差的熵比原始圖像信號的熵要小。根據(jù)上述原理,預(yù)測編碼不直接對原始數(shù)據(jù)進(jìn)行量化與編碼,而對預(yù)測誤差進(jìn)行量化與編碼,從而提高了編碼效率。
P160-圖7.10誤差預(yù)測模型:1)前值預(yù)測:2)一維預(yù)測:3)二維預(yù)測:常用線性預(yù)測方法:例:差分脈沖編碼調(diào)制(DPCM)是一種最典型的預(yù)測編碼方法。其原理框圖如下:
設(shè)系統(tǒng)中,xN為tN時(shí)刻的亮度取樣值。預(yù)測器根據(jù)tN時(shí)刻之前的樣本x1,x2,…,xN-1對xN作預(yù)測,得到預(yù)測值x’N。xN與x’N之間的誤差為eN=xN-x’N量化器對eN進(jìn)行量化得到e’N。編碼器對e’N進(jìn)行編碼發(fā)送。接收端解碼時(shí)的預(yù)測過程與發(fā)送端相同,所以預(yù)測器也相同。接收端恢復(fù)的輸出信號x’’N是xN的近似值,兩者的誤差是:例:差分脈沖編碼調(diào)制(DPCM)線性預(yù)測編碼:圖像序列{xi}(i=1,2,…,N-1)中,根據(jù)x1,x2,…,xN-1對xN作預(yù)測。令xN的預(yù)測估計(jì)值為x’N,設(shè)x’N是x1,x2,…,xN-1的線性組合,則稱對xN的預(yù)測為線性預(yù)測。最優(yōu)線性預(yù)測:式(6.4.7)在上式非線性預(yù)測編碼:線性預(yù)測系數(shù)ai是一種近似條件下的常數(shù),忽略了像素的個(gè)性,存在不足,影響圖像質(zhì)量。不足:
則上式可表示成:(1)對灰度有突變的地方,會有較大的預(yù)測誤差,致使圖像的邊緣模糊,分辨率降低;(2)對灰度變化緩慢區(qū)域,其差值信號應(yīng)為零,但因其預(yù)測值偏大而使重構(gòu)圖像有顆粒噪聲。非線性預(yù)測特點(diǎn):
非線性預(yù)測編碼充分考慮圖像的統(tǒng)計(jì)特性和個(gè)別變化,盡量使預(yù)測系數(shù)與圖像所處的局部特性相匹配,即預(yù)測系數(shù)隨預(yù)測環(huán)境而變,因此稱為自適應(yīng)預(yù)測編碼。改成:方法:將線性預(yù)測中的預(yù)測值表達(dá)式:式中,k為自適應(yīng)系數(shù)。一般,取k=1,但對灰度變化大的局部,由于預(yù)測偏小,這時(shí)可令k=1.125,以避免局部邊緣被平滑;對灰度變化緩慢區(qū)域,預(yù)測值可能偏大,這時(shí)可令k=0.875,以消除顆粒噪聲的影響。例:
預(yù)測技術(shù)的對比設(shè)量化誤差為零且采用下列四個(gè)預(yù)測器之一:四個(gè)預(yù)測器的誤差圖像分別為圖a,b,c,d,看出:隨著預(yù)測器階數(shù)的增加明顯可見誤差減小。例:一種簡單的有損預(yù)測編碼——德爾塔調(diào)制:例:7.11,7.12,7.13量化器作用:將預(yù)測誤差映射成有限范圍內(nèi)的輸出,表示為2.有損預(yù)測編碼在無損預(yù)測編碼模型中加上一個(gè)量化器構(gòu)成有損預(yù)測編碼。7.5圖像的變換編碼1.變換編碼的基本原理:通過正交變換(如傅里葉變換、離散余弦變換等),把圖像從空間域轉(zhuǎn)換為能量比較集中的變換域(頻域),變換后的結(jié)果產(chǎn)生一批變換系數(shù),然后對這些變換系數(shù)進(jìn)行編碼處理,達(dá)到壓縮圖像的目的。2.正交變換編碼在正交變換編碼中,常用的正交變換有:
DFT,DCT,WHT,KLT等。正交變換具有如下優(yōu)點(diǎn):(1)熵保持。正交變換具有熵保持性質(zhì),即正交變換不丟失信息,從而通過傳輸變換系數(shù)來傳送信息。(2)能量集中。變換域中的能量多集中于少數(shù)變換系數(shù)上,大多數(shù)系數(shù)的數(shù)值都很小。因此對于能量較小的系數(shù)可粗糙量化,分配較小的比特,或完全忽略。對于能量較大的系數(shù),分配較多的比特。從而利用熵編碼來壓縮數(shù)據(jù)。(3)去相關(guān)。正交變換能夠去除像素間的冗余,變換系數(shù)間的相關(guān)性為零或較小。
總之,正交變換能夠去除或減小數(shù)據(jù)間的相關(guān)性,減小信源的信息冗余,實(shí)現(xiàn)數(shù)據(jù)壓縮,提高信息傳輸或存儲系統(tǒng)的有效性。正交變換的選擇:在正交變換編碼中,需要選擇一種合適的正交變換。實(shí)際應(yīng)用中,應(yīng)綜合考慮變換的去相關(guān)能力、能量集中能力和計(jì)算復(fù)雜程度等。一般在性能滿足要求的條件下,盡可能選擇簡單的變換。常用正交變換性能比較:常用的正交變換有:DFT,DCT,WHT,KLT等。
從運(yùn)算量大小和壓縮效果這兩方面比較,其性能比較如下表:(表中是一維N點(diǎn)各種正交變換所需的運(yùn)算次數(shù),從上至下的順序代表了運(yùn)算量大小和壓縮效果)。變換編碼的步驟:(1)確定變換矩陣A和圖像的分塊
在正交變換編碼中,需要把一幅圖像分割成若干個(gè)大小為n×n的子圖像,對各個(gè)子圖像進(jìn)行變換、量化與編碼。常用的子圖像大小為8×8和16×16。
結(jié)論:從表中可以看出,K-L變換的運(yùn)算量最大,WHT變換運(yùn)算量最小,但壓縮效果較差。而綜合比較,DCT的綜合效果較好,因此,在正交變換編碼中,DCT是首要選擇,并已成功應(yīng)用于編碼標(biāo)準(zhǔn)中,如JPEG,MPEG-1,MPEG-2等。
一維變換相當(dāng)于把圖像分成子塊,每一子塊為1×N的一個(gè)N維向量即:子圖像區(qū)域的選擇:子圖像尺寸大小取4×4,8×8,16×16適合圖像壓縮。
圖像尺寸過小,計(jì)算速度較快,但壓縮能力有限;子圖像尺寸過大,去相關(guān)性效果好,但增加計(jì)算的復(fù)雜性,若圖像的相關(guān)性較小,壓縮效果不明顯。例:7.17a)DC分量b)DC和2個(gè)最低AC系數(shù)
c)DC和9個(gè)最低AC系數(shù)d)全部64個(gè)系數(shù)的恢復(fù)結(jié)果區(qū)域編碼實(shí)例b)a)c)d)(2)變換域采樣:即對變換域中的系數(shù)進(jìn)行取舍。系數(shù)選取越多,重構(gòu)圖像效果越好,但壓縮比會下降。區(qū)域編碼法:
選出能量集中的區(qū)域(正交變換中能量多半集中于低頻區(qū)域),并對這一區(qū)域的系數(shù)進(jìn)行編碼傳送,而其他區(qū)域的系數(shù)可以舍棄。在解碼端對舍棄的系數(shù)進(jìn)行補(bǔ)零處理。這樣由于保持了大部分圖像能量,在恢復(fù)圖像中帶來的質(zhì)量劣化并不顯著。在變換編碼中常用的系數(shù)選取方法:區(qū)域編碼:根據(jù)最大方差進(jìn)行選擇;閾值編碼:根據(jù)最大值的量級選擇。
特點(diǎn):
在區(qū)域編碼中,區(qū)域抽樣和區(qū)域編碼的均方誤差都與方塊大小有關(guān)。其顯著缺點(diǎn)是一旦選定某個(gè)區(qū)域就固定不變了,有時(shí)圖像中的能量也會在其他區(qū)域集中較大的數(shù)值,這時(shí)舍棄它們會造成圖像質(zhì)量的較大損失。閾值編碼法:閾值編碼法先設(shè)定一個(gè)門限值T,當(dāng)變換系數(shù)超過T值時(shí),就保留下來并進(jìn)行編碼傳送;當(dāng)系數(shù)值小于T時(shí)就舍棄不用。
變換子圖像選取閾值常用方法:1)對所有子圖像用一個(gè)全局閾值:
壓縮效果不穩(wěn)定,因圖像而異,閾值選擇有困難。2)對各子圖像分別用不同的閾值:每幅子圖像都丟棄相同數(shù)目的系數(shù),其編碼率事先可知。3)根據(jù)各子圖像中各系數(shù)的位置選取閾值
將取閾值和量化結(jié)合,碼率是變化的,有自適應(yīng)性。缺點(diǎn):由于超過門限值的系數(shù)的位置是隨機(jī)的,因此
在編碼中除了對系數(shù)值進(jìn)行編碼外,還要有位置碼,這兩種碼同時(shí)傳送,才能在接收端收到正確恢復(fù)的圖像。所以其壓縮比有時(shí)會下降。特點(diǎn):優(yōu)點(diǎn):有一定的自適應(yīng)能力,可以得到較區(qū)域編碼好的圖像質(zhì)量;(3)系數(shù)量化:變換后的系數(shù)是獨(dú)立的和有序的,利用量化使數(shù)據(jù)得到壓縮。量化是產(chǎn)生有損壓縮的原因,為了使量化失真最小,可采用不同的量化方法(編碼)。(4)解碼與反變換:在接收端對接收到的碼流進(jìn)行解碼,分離出各變換系數(shù),且將舍去的系數(shù)代為“0”,然后求反變換,恢復(fù)各圖像子塊。變換編碼實(shí)例:p170-例:7.14,7.15,7.16例:利用DCT變換來實(shí)現(xiàn)圖像的壓縮%返回DCT變換矩陣4.小波編碼:小波編碼器:小波編碼是變換編碼算法之一,因此同變換編碼器一樣,小波編碼器由三個(gè)部分組成:變換、量化和熵編碼輸出。典型小波編碼系統(tǒng):小波編碼步驟:1)對原始圖像進(jìn)行小波變換,得到小波系數(shù);2)對小波系數(shù)進(jìn)行分析量化;3)編碼。小波編碼特點(diǎn):小波變換能將原始圖像的能量集中到少部分小波系數(shù)上,且分解后的小波系數(shù)在三個(gè)方向的細(xì)節(jié)分量有較高的局部相關(guān)性。因此,小波編碼可以得到較高的壓縮比,且壓縮速度較快。基于DCT的圖像壓縮所產(chǎn)生的塊狀失真b)基于Wavelet的圖像壓縮解碼效果a)b)小波基的選擇:由于小波函數(shù)是不唯一的,不同的小波對同一幅圖像的壓縮效果是有差異的。因此如何選擇最優(yōu)的小波基是首要問題。小波基的選擇一般考慮以下因素:1)小波基的正則性和消失距;正則性是函數(shù)光滑性的一種描述,也反映了函數(shù)頻域能量集中的程度。同時(shí),正則性高的小波重構(gòu)后,圖像失真比較平滑,視覺效果較好。
有較大消失矩的小波基用于圖像編碼,意味著在一個(gè)相當(dāng)平坦的區(qū)域附近小波系數(shù)接近零,這會提高壓縮效率。2)小波基的線性相位(對稱性)如果正交基不具有對稱性,就不能保證線性相位,在圖像編碼應(yīng)用中,會引入相位失真。因此,圖像編碼中一般使用由對稱性的小波基。如雙正交小波基。3)所處理圖像與小波基的相似性當(dāng)小波函數(shù)與待壓縮圖像結(jié)構(gòu)上存在一定的相似性時(shí),也會影響壓縮效果。小波分解等級選擇:4)小波函數(shù)的能量集中性5)綜合考慮壓縮效率和計(jì)算復(fù)雜度小波系數(shù)的分析與量化一幅圖像進(jìn)行小波分解后,得到一系列不同尺度的子圖像,不同尺度的子圖像對應(yīng)不同的頻率。高頻子圖像上小波系數(shù)的絕對值較小,而低頻子圖像上小波系數(shù)的絕對值較大。因此,在圖像編碼中,對高頻系數(shù)分配較小的比特,達(dá)到壓縮的目的。小波編碼(系數(shù)量化設(shè)計(jì)):直接閾值編碼、基于小波樹結(jié)構(gòu)的矢量量化法、嵌入式零樹小波編碼7.6圖像壓縮標(biāo)準(zhǔn)圖像壓縮的國際標(biāo)準(zhǔn)主要由國際標(biāo)準(zhǔn)化組織(InternationalStandardizationOrganization,簡稱ISO)和國際電信聯(lián)盟(InternationalTelecommunicationUnion,簡稱ITN)制定的。由這兩個(gè)組織制定的國際標(biāo)準(zhǔn)可分成三個(gè)部分:靜止(灰度和彩色)圖像壓縮標(biāo)準(zhǔn)、運(yùn)動圖像壓縮標(biāo)準(zhǔn)和二值圖像壓縮標(biāo)準(zhǔn)。圖像編碼國際標(biāo)準(zhǔn)極大地促進(jìn)了全球范圍內(nèi)信息傳輸?shù)陌l(fā)展。1.靜止圖像壓縮標(biāo)準(zhǔn)JPEG:
聯(lián)合專家組建立了靜態(tài)灰度(或彩色)圖像壓縮的公開算法,并于1992年開始通過并公布,1994年3月通過為正式標(biāo)準(zhǔn)。它定義三種編碼系統(tǒng):(1)DCT有損編碼系統(tǒng);(2)擴(kuò)展編碼系統(tǒng);(3)無失真編碼系統(tǒng)。在視覺效果不受到嚴(yán)重?fù)p失的前提下,對灰度圖像壓縮算法可以達(dá)到15到20的壓縮比。如果在圖像質(zhì)量上稍微犧牲一點(diǎn),則壓縮比可以達(dá)到40:1,甚至更高。要求:
該標(biāo)準(zhǔn)適用于各種多媒體存儲和通信應(yīng)用所使用的灰度圖像、攝影圖像及靜止視頻壓縮文件。(1)必須將圖像質(zhì)量控制在可視保真度高的范圍內(nèi),同時(shí)編碼器可被參數(shù)化,允許用戶設(shè)置壓縮或質(zhì)量水平。(2)壓縮標(biāo)準(zhǔn)可以應(yīng)用于任何一類連續(xù)色調(diào)數(shù)字圖像,并不應(yīng)受到維數(shù)、顏色、畫面尺寸、內(nèi)容、影調(diào)的限制。(3)壓縮標(biāo)準(zhǔn)必須從完全無損到有損范圍內(nèi)可選,以適應(yīng)不同的存儲、CPU和顯示要求。JPEG基本系統(tǒng)框圖:反變換2.運(yùn)動圖像壓縮標(biāo)準(zhǔn)MPEG:
運(yùn)動圖像專家小組(MPEG)于1991年提出用于數(shù)字存儲媒介的、速率約1.5MB/s的運(yùn)動圖像及其伴音的壓縮編碼,并于1992年正式通過。運(yùn)動圖像的壓縮包括兩個(gè)主要方面:幀內(nèi)壓縮與幀間壓縮。幀內(nèi)壓縮:刪除空間的數(shù)據(jù)冗余;幀間壓縮:刪除幀與幀之間的時(shí)間冗余。刪除時(shí)間冗余可通過幀間編碼來完成,即僅存儲運(yùn)動圖像從一幀到下一幀的變化部分,而不是存儲全部圖像數(shù),這樣能極大地減少運(yùn)動圖像數(shù)據(jù)的存儲量,達(dá)到幀間壓縮的目的。MPEG-1標(biāo)準(zhǔn):
1990年MPEG組織制定了MPEG-1標(biāo)準(zhǔn)草案,1993年8月正式通過。MPEG-1標(biāo)準(zhǔn)旨在解決多媒體的存儲問題,主要應(yīng)用于數(shù)字存儲媒介中活動圖像及其伴音的編碼表示,數(shù)碼率約為1.5Mbps。MPEG-2標(biāo)準(zhǔn):為滿足數(shù)字存儲媒體、電視廣播以及通信等應(yīng)用領(lǐng)域?qū)τ凇盎顒訄D像及其伴音的通用編碼方法”的日益增長的需求,MPEG組織在1994年推出MPEG-2標(biāo)準(zhǔn),數(shù)碼率高達(dá)10Mbps。MPEG-4標(biāo)準(zhǔn)
MPEG組織于1999年1月公布了全新的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房屋買賣合同補(bǔ)充協(xié)議(包含房屋買賣合同糾紛調(diào)解)3篇
- 二零二五年度圖書館圖書借閱積分兌換與購銷協(xié)議3篇
- 2025年度協(xié)議離婚訴訟全程指導(dǎo)及法律知識3篇
- 二零二五年度夫妻共有公司經(jīng)營權(quán)離婚協(xié)議3篇
- 綜合課程設(shè)計(jì)的原則是
- 二零二五年度新能源車輛質(zhì)押借款擔(dān)保合同2篇
- 2025年度水利項(xiàng)目合同終止及水資源利用協(xié)議3篇
- 海南醫(yī)學(xué)院《數(shù)字電子技術(shù)實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 海南體育職業(yè)技術(shù)學(xué)院《身邊的力學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 二零二五年度夫妻財(cái)產(chǎn)保全不離婚協(xié)議執(zhí)行細(xì)則2篇
- 產(chǎn)褥期的生理變化
- 土壤肥料學(xué)智慧樹知到期末考試答案2024年
- MOOC 氣候變化與人類社會-南京信息工程大學(xué) 中國大學(xué)慕課答案
- 廠區(qū)綠化養(yǎng)護(hù)方案及措施
- (高清版)DZT 0322-2018 釩礦地質(zhì)勘查規(guī)范
- 銀行安全教育培訓(xùn)課件
- 2023年中考語文二輪復(fù)習(xí):詞意表達(dá) 真題練習(xí)題匯編(含答案解析)
- 蒸汽回收方案
- 供應(yīng)鏈管理培訓(xùn)
- 湖南高職單招《綜合素質(zhì)測試》考試題庫(含答案)
- 銅礦的選礦工藝與設(shè)備選擇
評論
0/150
提交評論