第7章圖像編碼與壓縮

上傳人：w*** IP屬地：湖北上傳時(shí)間：2024-03-02 格式：PPT 頁數(shù)：117 大?。?7.45MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩112頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第7章圖像編碼與壓縮7.1圖像信息的冗余7.1.1圖像數(shù)據(jù)壓縮的必要性與可能性1.圖像壓縮與編碼：對圖像數(shù)據(jù)按一定的規(guī)則進(jìn)行變換和組合，從而達(dá)到以盡可能少的代碼（符號）來表示盡可能多的信息。主要研究內(nèi)容：

數(shù)據(jù)的表示、傳輸、變換和編碼方法，目的是減少存儲數(shù)據(jù)所需要的空間和傳輸所用的時(shí)間。2.數(shù)字圖像的信息冗余：圖像數(shù)據(jù)本身存在冗余性和相關(guān)性，一般圖像中存在很大的冗余度。因此圖像信息的壓縮是可能的。冗余：從信息論觀點(diǎn)看，描述圖像信源的數(shù)據(jù)由有用數(shù)據(jù)和冗余數(shù)據(jù)兩部分組成。信息中存在的多余的數(shù)據(jù)即為冗余。圖像數(shù)據(jù)冗余主要表現(xiàn)為：空間冗余、時(shí)間冗余、信息熵冗余（編碼冗余）、結(jié)構(gòu)冗余、知識冗余、頻譜冗余（視覺冗余）及其它冗余。

視覺冗余：人的眼睛對圖像細(xì)節(jié)和顏色的辨認(rèn)有一個(gè)極限，人的視覺特性決定了它最多可辨認(rèn)出216

種顏色，而彩色圖像一般每個(gè)像素用24位表示，則可表示出224種顏色，由此而帶來的數(shù)據(jù)冗余即為視覺冗余。(a)圖是256個(gè)灰度級圖像(b)圖是16個(gè)灰度級圖像(c)圖是16個(gè)灰度級圖像(a)圖是灰度圖像(b)圖是二值圖像空間冗余：當(dāng)圖像中的大部分景物表面顏色都是均勻的、連續(xù)的，圖像數(shù)字化后大量相鄰像素的數(shù)據(jù)是完全一樣或十分接近的，這就是空間冗余。知識冗余：在圖像的理解與圖像表達(dá)的數(shù)據(jù)量之間產(chǎn)生的冗余。時(shí)間冗余：在運(yùn)動圖像中，相鄰兩幀圖像之間有較大的相關(guān)性。結(jié)構(gòu)冗余：由圖像存在的紋理或圖元（分塊子圖像）的相似結(jié)構(gòu)上產(chǎn)生的冗余。7.1.2圖像編碼壓縮的分類

根據(jù)解壓重建后的圖像與原始圖像之間是否具有誤差，圖像編碼壓縮分為無損壓縮編碼和有損壓縮編碼。信息熵冗余：由編碼方式而產(chǎn)生的冗余。

編碼冗余說明表：

code1中Lavg=2，code2中Lavg=1.81

rkpr(rk)code1l1(rk)code2l2(rk)

0.1875

0020113r20.5000

01211r30.12501020103r40.1875112002

典型的無損壓縮有Huffman（郝夫曼編碼）、Fano-Shannon（香農(nóng)-范諾）編碼、算術(shù)編碼和游程編碼等。

適用于要求重建后圖像嚴(yán)格的和原始圖像保持一致的場合（如復(fù)制、保存十分珍貴的歷史、文物圖像）。無損壓縮編碼（可逆編碼）：算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息，因此解壓縮時(shí)能精確恢復(fù)原圖像，即壓縮是完全可以恢復(fù)的和沒有偏差的，信息沒有損失。

典型的有損壓縮有預(yù)測編碼、變換域編碼等。有損編碼（不可逆編碼）

算法把不相干的信息刪除，允許重構(gòu)數(shù)據(jù)與原始數(shù)據(jù)存在一定誤差，因此只能對原始圖像進(jìn)行近似的重建，不能精確地復(fù)原，但視覺或聽覺效果一般是可被接受的，或能夠滿足用戶要求。適合大多數(shù)用于存儲數(shù)字化了的模擬圖像。7.1.3圖像壓縮的性能評價(jià)

1.數(shù)據(jù)壓縮技術(shù)的重要指標(biāo)：（1）壓縮比：圖像原始數(shù)據(jù)所需的比特?cái)?shù)與壓縮編碼后所需的比特?cái)?shù)之比。壓縮比越大越好。（2）失真性：復(fù)原后圖像與原始圖像之間的差別。（3）壓縮算法：利用不同的編碼方法，實(shí)現(xiàn)對圖像的數(shù)據(jù)壓縮。

壓縮算法與壓縮比關(guān)系：無損壓縮能保證完全恢復(fù)原始圖像，但壓縮比較??；有損壓縮時(shí)原始數(shù)據(jù)不能完全恢復(fù)，但壓縮比較高。2.圖像保真度準(zhǔn)則：描述解碼圖像相對原始圖像偏離程度的測度稱為保真度（逼真度）準(zhǔn)則。常用的準(zhǔn)則可分為：客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。

客觀保真度準(zhǔn)則：最常用的客觀保真度準(zhǔn)則是原圖像和解碼圖像之間的均方誤差和均方信噪比兩種。均方誤差：壓縮比、均方誤差及信噪比的關(guān)系：

在相同的壓縮比下，均方誤差越小，性能越好。反之，在相同的均方誤差下，壓縮比越大，性能越好。在相同的壓縮比下，信噪比越大，性能越好。反之，在相同的信噪比下，壓縮比越大，性能越好。基本信噪比：用分貝表示壓縮圖像的定量評價(jià)。峰值信噪比：主觀保真度準(zhǔn)則：客觀保真度是一種統(tǒng)計(jì)平均意義下的度量準(zhǔn)則，對于圖像的細(xì)節(jié)無法反映出來。具有相同客觀保真度的不同圖像，人的視覺可能產(chǎn)生不同的視覺效果。因此采用主觀方法測量圖的質(zhì)量更合適。

方法：常用的方法是對一組（不少于20人）觀察者顯示圖像，并將它們對該圖像的評分取平均，來評價(jià)一幅圖像的主觀質(zhì)量。

另一種方法是對照某種絕對尺度進(jìn)行,即根據(jù)圖像的絕對質(zhì)量進(jìn)行打分。例如，有關(guān)電視圖像的絕對評價(jià)打分標(biāo)準(zhǔn)如下表：圖像質(zhì)量的主觀評分表得分評價(jià)說明12345優(yōu)秀良好可用較差差沒有失真感覺感覺到失真，但沒有不舒服的感覺感覺有點(diǎn)不舒服，可接受感覺較差，感覺非常不舒服，幾乎不能使用主觀評價(jià)可用平均感覺分來表示：7.2信息理論技術(shù)與熵編碼設(shè)離散信息源X={x1,x2,…,xN}，每個(gè)符號出現(xiàn)的概率是確定的，為pk=p(xk)自信息量：一個(gè)概率小的符號出現(xiàn)將帶來更大的信息量，即信息量與該符號的概率倒數(shù)成正比。信息熵：構(gòu)成的離散信源的每個(gè)符號的平均信息量。例：7.1，7.2，7.3

圖像平均碼長：7.2.1離散信源的熵表示結(jié)論：1）信源的平均碼長大于等于熵，即熵是無失真編碼的下界。2）如果所有的自信息I(xk)都是整數(shù)，且與各符號碼長相等，可以使平均碼長等于熵。3）對非等概率分布的信源，采用不等長編碼，其平均碼長小于等長編碼的平均碼長。4）如果信源中各符號出現(xiàn)的概率相等，則信源熵H(X)的值達(dá)到最大。——最大離散熵定理。7.2.2離散信源編碼定理1.香農(nóng)信息保持定理香農(nóng)信息論已證明，信息熵是無失真編碼的理論極限。低于此極限的無失真編碼是不存在的。2.變長編碼定理若一個(gè)離散無記憶信源X具有熵H(X)，并有r個(gè)碼元符號集，則總可以找到一種無失真信源編碼，構(gòu)成單義可譯碼，使其平均碼長滿足：3.變長最佳編碼定理對出現(xiàn)概率大的信息符號賦予短字碼，對于出現(xiàn)概率小的信息符號賦予長字碼。變長編碼的平均碼長一定小于任何其他排列形式。7.3熵編碼技術(shù)

1.編碼技術(shù)編碼技術(shù)研究的是如何在滿足一定的圖像保真條件下，壓縮表示原始圖像數(shù)據(jù)的編碼方法。

編碼技術(shù)的分類：根據(jù)解碼后的數(shù)據(jù)與原始圖像數(shù)據(jù)是否完全一致，可分為有損編碼和無損編碼；根據(jù)壓縮原理，可分為信息熵編碼、預(yù)測編碼和變換編碼等。

圖像格式標(biāo)準(zhǔn)：采用不同的編碼得到不同的格式，目前流行的格式有：BMP、PCX、TIF、JPEG

等。類型說明BMP未經(jīng)壓縮的格式，MicrosoftWindows格式PCX通用的標(biāo)準(zhǔn)圖像格式TIF掃描儀生成的圖像格式JPG靜止圖像壓縮國際標(biāo)準(zhǔn)格式2.圖像冗余度和編碼效率編碼效率和冗余度是用來衡量編碼方法優(yōu)劣的準(zhǔn)則。

原始圖像平均碼長：

由信息論可知，熵H(X)是離散無記憶信源進(jìn)行無失真編碼時(shí)的基本極限，即找不到平均碼長比其更短的無失真編碼，即：編碼效率定義：

經(jīng)過編碼壓縮后，圖像信息的冗余度接近于零，或編碼效率已接近于1，這是壓縮已接近其下限，成為高效編碼?？梢杂蒙鲜鰷?zhǔn)則來衡量編碼方法的優(yōu)劣。3.統(tǒng)計(jì)編碼方法：統(tǒng)計(jì)編碼：根據(jù)數(shù)據(jù)出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼。常用的統(tǒng)計(jì)編碼有變長編碼，包括郝夫曼編碼、香農(nóng)-范諾編碼和算術(shù)編碼等。變長編碼：對圖像的灰度級用自然碼編碼，一般總會產(chǎn)生編碼冗余，為消除這種冗余常采用變長編碼。

方法：如果用較少的比特?cái)?shù)表示出現(xiàn)概率較大的灰度級，而用較多的比特?cái)?shù)表示出現(xiàn)概率較小的灰度級，這種壓縮方法稱為變長編碼。例：1幅8灰度級圖像分別用自然碼和變長碼表示，并計(jì)算它們的平均碼長。結(jié)果：用3bit自然碼進(jìn)行編碼時(shí)，平均碼長為3。采用變長編碼時(shí)的平均碼長為2.7。例：設(shè)一離散信源X為可見變長編碼可以達(dá)到較高的編碼效率。郝夫曼(Huffman)編碼：原理：郝夫曼編碼是運(yùn)用信息熵原理的一種無損編碼。壓縮方法是利用變長編碼將圖像中出現(xiàn)概率大的灰度值賦予短碼字；而對出現(xiàn)概率小的灰度值賦予長碼字，從而達(dá)到壓縮數(shù)據(jù)的目的。編碼方法：（1）將圖像灰度值按概率由大到小排列；（2）把兩個(gè)最小的概率加起來作為新符號的概率；（3）重復(fù)步驟（1）、（2），直到概率和達(dá)到1為止；（4）在每次合并符號時(shí)，將被合并的符號賦以1和0

（大概率賦1，小概率賦0，或相反）；（5）尋找從每一信號源符號到概率為1處的路徑，記錄下路徑上的1和0；（6）對每一符號寫出“1”、“0”序列，序列的順序是從樹根到信號源符號節(jié)點(diǎn)。例：用郝夫曼編碼進(jìn)行二元編碼

元素aia1a2a3a4a5a6

概率P(ai)0.10.40.060.10.040.3

編碼01110101001000101100郝夫曼編碼的特點(diǎn)：（1）哈夫曼編碼構(gòu)造出來的編碼值不是唯一的；（2）編碼效率與信源符號概率分布相關(guān)。當(dāng)圖像灰度值分布很不均勻時(shí)，哈夫曼編碼的效率就高；而圖像灰度值的概率分布比較均勻時(shí)，哈夫曼編碼的效率就很低。Lavg（3）郝夫曼編碼由于碼字不等長，實(shí)時(shí)硬件實(shí)現(xiàn)復(fù)雜，且抗誤碼能力較差。（4）由于只能用近似整數(shù)而不是理想的小數(shù)表示單個(gè)符號，因此無法達(dá)到最理想的壓縮效果。香農(nóng)-范諾(Shannon-Fano)編碼香農(nóng)-范諾分別單獨(dú)提出類似方法，使編碼更簡單。方法：（1）把信源中的消息x1~xn按概率從大到小、從上到下排成一列，然后把x1~xn分成兩組x1~xk，xk+1~xn，并使得它們的概率和盡可能接近，即（2）賦值原則：把兩組的xi賦0和1，設(shè)概率大的一組賦為0，概率小的一組賦為1（或相反）。（3）把兩組分別按（1）、（2）不斷重復(fù)分組、賦值，直到每組只有一種輸出為止。將每個(gè)xi所賦的值依次排列起來就是香儂—范諾編碼。

例：

練習(xí)題：設(shè)某一幅圖像共有8個(gè)灰度級,各灰度級出現(xiàn)的概率分別為：P1=0.20，P2=0.09，P3=0.11，P4=0.13，P5=0.07，P6=0.12，P7=0.08，P8=0.20。試對此圖像進(jìn)行郝夫曼編碼和香儂—范諾編碼，并計(jì)算信源的熵、平均碼長、編碼效率及冗余度。算術(shù)編碼：基本原理：把整個(gè)信源表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間，其長度等于該序列的概率。再在該區(qū)間內(nèi)選擇一個(gè)代表性的小數(shù)，轉(zhuǎn)化為二進(jìn)制作為實(shí)際的編碼輸出。采用算術(shù)編碼不再是將單個(gè)信源符號映射成一個(gè)碼字，每個(gè)符號的平均編碼長度可以為小數(shù)。編碼步驟：1）根據(jù)符號概率，沿著“概率線”為每個(gè)符號設(shè)定一個(gè)范圍。設(shè)概率范圍用rang表示，low表示新范圍低端，high表示新范圍高端；rang_low,rang_high分別表示某信源符號給定范圍的低、高端。2）初始化，其概率范圍：

rang=1.0，low=0。3）對每一個(gè)信源符號依次計(jì)算新的概率范圍：

low=low+rang×rang_lowhigh=low+rang×rang_high4）從最后得到的區(qū)間中選擇一個(gè)數(shù)作為編碼輸出。例：設(shè)信源符號為X={00，01，10，11}，其中各符號的概率為P(X)={0.1，0.4，0.2，0.3}。假如輸入的消息序列為：10、00、11、00、10、11、01。試將其進(jìn)行算術(shù)編碼。解：1）沿“概率線”為每個(gè)符號設(shè)定概率范圍：[0，0.1），[0.1，0.5），[0.5，0.7），[0.7，1.0]2）初始化：范圍range為1.0，低端值low為0；符號10的低端符號10的高端00110.7-0.5=0.2符號00的低端符號00的高端1122223333444455566677

由于0.5143876在[0.5，0.7]區(qū)間，則可得出第一個(gè)信源符號為10。得到信源符號10后，由于已知信源符號10的上界和下界，利用編碼可逆性，減去信源符號10的下界0.5，得0.0143876,再用信源符號10的范圍0.2去除，得到0.071938,由于已知0.071938落在信源符號00的區(qū)間，所以得到第二個(gè)信源符號為00。解碼：編碼的逆過程。根據(jù)編碼時(shí)的概率分配表和壓縮后數(shù)據(jù)代碼所在的范圍，確定代碼所對應(yīng)的每一個(gè)數(shù)據(jù)符號。

同樣再減去信源符號00的下界0，除以信源符號00的范圍0.1，得到0.71938，已知0.71938落在信源符號11區(qū)間，所以得到第三個(gè)信源符號為11......已知0.1落在信源符號01的區(qū)間。再減去信源符號01的下界得到0，解碼結(jié)束。解碼操作過程綜合如下：算術(shù)編碼的主要特點(diǎn)：優(yōu)點(diǎn)：不必預(yù)先定義信源出現(xiàn)的概率模型，而是根據(jù)各個(gè)信源出現(xiàn)的概率自適應(yīng)地調(diào)節(jié)碼長。不足：1)由于實(shí)際的計(jì)算機(jī)的精度不可能無限長，運(yùn)算中會出現(xiàn)溢出問題。2)算術(shù)編碼器對整個(gè)消息只產(chǎn)生一個(gè)碼字，這個(gè)碼字是在[0，1)之間的一個(gè)實(shí)數(shù)，因此譯碼器必須在接收到這個(gè)實(shí)數(shù)后才能譯碼。3)算術(shù)編碼也是一種對錯誤很敏感的方法。練習(xí)題：書p189-7.8行程編碼（RLE）：利用空間冗余度壓縮圖像。原理：在給定的圖像數(shù)據(jù)中尋找連續(xù)重復(fù)的數(shù)值，然后用兩個(gè)字符值取代這些連續(xù)值。例：一串用字母表示的數(shù)據(jù)為：“aaabbbbccccdddeeddaa”，經(jīng)過行程編碼處理可表示為“3a4b4c3d2e2d2a”。

圖像編碼方法：例：該圖像有8個(gè)灰度級，24個(gè)像素。像素灰度級g4g3g2g1l1l2l3l4i

li1362510342486編碼1：灰度值用3位碼，總比特?cái)?shù)=24×3=72bit行程編碼：灰度值用3位碼，行程長度用4位碼，則每對參數(shù)有7位碼，共4對，總比特?cái)?shù)=7×4=28bit

不同格式的圖像文件采用行程編碼壓縮數(shù)據(jù)圖像時(shí)，編碼方法略有不同。BMP的RLE4壓縮算法：

與一般的行程編碼不同的是在第1字節(jié)中所表示的連續(xù)數(shù)據(jù)的個(gè)數(shù)是像素個(gè)數(shù)而不是字節(jié)個(gè)數(shù)。另外它是針對16色圖像數(shù)據(jù)的處理，引進(jìn)了特殊的識別碼。例：數(shù)據(jù)0X080X57RLE編碼：表示將圖像數(shù)據(jù)0X57連續(xù)重復(fù)顯示8個(gè)字節(jié)；

RLE4壓縮算法：表示連續(xù)顯示8個(gè)像素。PCX的RLE壓縮算法：只要在圖像數(shù)據(jù)中發(fā)現(xiàn)一串連續(xù)相同的值，就用兩個(gè)字節(jié)代替這串連續(xù)相同的值，存入圖像文件中。這兩個(gè)字節(jié)中的第一字節(jié)代表這串相同數(shù)據(jù)的個(gè)數(shù)，第二字節(jié)代表這串?dāng)?shù)據(jù)的值。對于不重復(fù)的數(shù)據(jù)則單獨(dú)處理。LZW(Lempel-Ziv-Welch)編碼

LZW編碼不需要了解信源的概率，對信源符號的可變長度序列分配固定長度的碼字。它能消除或減少圖像中的像素間冗余，是一種信息保存型的編碼方式。該編碼方法是UNIX操作系統(tǒng)中的標(biāo)準(zhǔn)文件壓縮方法。方法：它是一種字典方法，在編碼的開始階段要構(gòu)造一個(gè)對信號源符號進(jìn)行編碼的編碼表（字典），將輸入字符串映射成定長的碼字輸出。算法在產(chǎn)生輸出字符串的同時(shí)更新編碼表。LZW算法執(zhí)行步驟：1）將字典初始化，使其包含所有可能的單字符。初始化前綴P為空。2）當(dāng)前字符C的內(nèi)容為輸入字符流中的下一個(gè)字符。3）判斷P+C是否在字典中：若“是”，則用C擴(kuò)展P，即令P=P+C。若“否”，則:輸出當(dāng)前前綴P的碼字到碼字流；將P+C添加到字典中；令前綴P=C。4）判斷輸入字符流中是否還有碼字要編碼：若“是”返回到步驟2）；若“否”則把當(dāng)前前綴P的碼字輸出到碼字流，并結(jié)束。

字典的尺寸（編碼器參數(shù)）是重要參數(shù)。如對于8比特灰度圖像，一個(gè)9比特（512個(gè)字）的字典中，前256個(gè)碼字被分配給灰度值0，1，…，255，則位置256~512將用來存放新的字符串。

例：對一個(gè)有三字符A，B，C組成的字符串“ABBABABAC”進(jìn)行LZW編碼。1）初始化編碼表，將A,B,C單字符串存入表中，并分別賦予碼字值1，2，3。設(shè)前綴P并初始化為空；字符C為當(dāng)前輸入的字符。2）將輸入的字符串從左至右逐個(gè)輸入到編碼器。輸入第1個(gè)字符A，即C=A，則P+C=A已在表中，所以P=P+A=A。輸入第2個(gè)字符B，即C=B，字符串P+C=AB。由于串表中沒有字符串AB，則：①由于B是字符串AB的擴(kuò)展字符，A是其前綴，將前綴A的碼字值1輸出；②將AB加入串表中，并依次賦予AB串的碼字值為4；③令P=B。輸入第3個(gè)符號B，即C=B，字符串P+C=BB。由于串表中沒有字符串BB，則：①由于B是字符串BB的擴(kuò)展字符，B是其前綴，將前綴B的碼字值2輸出；②將BB加入串表中，并依次賦予BB串的碼字值為5;③令P=B。輸入第4個(gè)符號A，即C=A，字符串P+C=BA。由于串表中沒有字符串BA，所以：①由于A是字符串BA的擴(kuò)展字符，B是其前綴，將前綴B的碼字值2輸出；②將BA加入串表中，并依次賦予BA串的碼字值為6;③令P=A。輸入第5個(gè)符號B，即C=B，字符串P+C=AB。由于串表中已有AB串，所以前綴P=P+C=AB。輸入第6個(gè)符號A，即C=A，字符串P+C=ABA。由于串表中沒有字符串ABA，所以：①由于A是字符串ABA的擴(kuò)展字符，AB是其前綴，將前綴AB的碼字值4輸出；②將ABA加入串表中，并依次賦予ABA串的碼字值為7；③令P=A。輸入第7個(gè)符號B，即C=B，字符串P+C=AB。由于串表中已有AB串，所以前綴P=P+C=AB。輸入第8個(gè)符號A，即C=A，字符串P+C=ABA。由于串表中已有ABA串，所以前綴P=P+C=ABA。輸入第9個(gè)符號C,即C=C，字符串P+C=ABAC。由于串表中沒有字符串ABAC,所以：①由于C是字符串ABAC的擴(kuò)展字符，ABA是其前綴，將前綴ABA的碼字值7輸出；②將ABAC加入串表中，并依次賦予ABAC串的碼字值為8;③令P=C。步驟字符串表碼字值輸出123456ABCABBBBAABAABAC12345678122473最后將前綴C的碼字值3輸出，形成如表所示的串表和LZW編碼輸出。解碼：由字符串表根據(jù)編碼字串逐一翻譯即可。輸出碼字值串：122473LZW編碼特點(diǎn)：1）在編碼的同時(shí)建立了一個(gè)碼本；2）是一種自適應(yīng)的壓縮方法，但它對輸入數(shù)據(jù)的適應(yīng)比較慢，因?yàn)槊看巫值渲械臈l目只增加一個(gè)，且這個(gè)條目只比原條目增加一個(gè)字符。步驟字符串表碼字值輸出123456ABCABBBBAABAABAC12345678122473解碼后的字串：ABBABABAC7.4預(yù)測編碼預(yù)測：根據(jù)過去時(shí)刻的樣本序列，運(yùn)用一種模型，預(yù)測當(dāng)前的樣本值。預(yù)測編碼：通常不直接對信號編碼，而是對預(yù)測誤差編碼。當(dāng)預(yù)測比較準(zhǔn)確，誤差比較小時(shí)，即可達(dá)到編碼壓縮的目的，它能減少數(shù)據(jù)在時(shí)間和空間上的相關(guān)性。預(yù)測編碼可分為無損預(yù)測編碼和有損預(yù)測編碼。原理：預(yù)測編碼是一種簡單、有效的編碼方法，其基本原理是利用線性預(yù)測技術(shù)去除空間上較為接近的像素間的冗余，對預(yù)測值與實(shí)際值之間的差值（即預(yù)測誤差）進(jìn)行量化編碼。由于預(yù)測誤差的方差遠(yuǎn)遠(yuǎn)小于輸入序列的方差，從而提高編碼效率，實(shí)現(xiàn)圖像壓縮。1.無損預(yù)測編碼通過對每個(gè)像素實(shí)際值與預(yù)測值之間的差異，進(jìn)行提取和編碼，來消除空間上較為接近的像素之間的冗余。原理：

同時(shí)，熵是概率分布的函數(shù)，分布越均勻，熵越大，其平均碼長的下限越大，從而表示每個(gè)消息所需的比特?cái)?shù)（碼率）就會增高；反之，分布越集中其熵越小，平均碼長的下限越小，從而碼率就會降低。理論簡析：

預(yù)測誤差的方差比原始圖像信號的方差小，其概率分布比原始圖像信號更集中，因此，預(yù)測誤差的熵比原始圖像信號的熵要小。根據(jù)上述原理，預(yù)測編碼不直接對原始數(shù)據(jù)進(jìn)行量化與編碼，而對預(yù)測誤差進(jìn)行量化與編碼，從而提高了編碼效率。

P160-圖7.10誤差預(yù)測模型：1）前值預(yù)測：2）一維預(yù)測：3）二維預(yù)測：常用線性預(yù)測方法：例：差分脈沖編碼調(diào)制（DPCM）是一種最典型的預(yù)測編碼方法。其原理框圖如下：

設(shè)系統(tǒng)中，xN為tN時(shí)刻的亮度取樣值。預(yù)測器根據(jù)tN時(shí)刻之前的樣本ｘ1,x2,…,xN-1對xN作預(yù)測，得到預(yù)測值x’N。xN與x’N之間的誤差為eN=xN-x’N量化器對eN進(jìn)行量化得到e’N。編碼器對e’N進(jìn)行編碼發(fā)送。接收端解碼時(shí)的預(yù)測過程與發(fā)送端相同，所以預(yù)測器也相同。接收端恢復(fù)的輸出信號x’’N是xN的近似值，兩者的誤差是：例：差分脈沖編碼調(diào)制（DPCM）線性預(yù)測編碼：圖像序列{xi}(i=1,2,…,N-1)中，根據(jù)x1,x2,…,xN-1對xN作預(yù)測。令xN的預(yù)測估計(jì)值為x’N，設(shè)x’N是x1,x2,…,xN-1的線性組合，則稱對xN的預(yù)測為線性預(yù)測。最優(yōu)線性預(yù)測：式（6.4.7）在上式非線性預(yù)測編碼：線性預(yù)測系數(shù)ai是一種近似條件下的常數(shù)，忽略了像素的個(gè)性，存在不足，影響圖像質(zhì)量。不足：

則上式可表示成：（1）對灰度有突變的地方，會有較大的預(yù)測誤差，致使圖像的邊緣模糊，分辨率降低；（2）對灰度變化緩慢區(qū)域，其差值信號應(yīng)為零，但因其預(yù)測值偏大而使重構(gòu)圖像有顆粒噪聲。非線性預(yù)測特點(diǎn)：

非線性預(yù)測編碼充分考慮圖像的統(tǒng)計(jì)特性和個(gè)別變化，盡量使預(yù)測系數(shù)與圖像所處的局部特性相匹配，即預(yù)測系數(shù)隨預(yù)測環(huán)境而變，因此稱為自適應(yīng)預(yù)測編碼。改成：方法：將線性預(yù)測中的預(yù)測值表達(dá)式：式中，k為自適應(yīng)系數(shù)。一般，取k=1，但對灰度變化大的局部，由于預(yù)測偏小，這時(shí)可令k=1.125，以避免局部邊緣被平滑；對灰度變化緩慢區(qū)域，預(yù)測值可能偏大，這時(shí)可令k=0.875，以消除顆粒噪聲的影響。例:

預(yù)測技術(shù)的對比設(shè)量化誤差為零且采用下列四個(gè)預(yù)測器之一：四個(gè)預(yù)測器的誤差圖像分別為圖a,b,c,d，看出：隨著預(yù)測器階數(shù)的增加明顯可見誤差減小。例：一種簡單的有損預(yù)測編碼——德爾塔調(diào)制：例：7.11，7.12，7.13量化器作用：將預(yù)測誤差映射成有限范圍內(nèi)的輸出，表示為２.有損預(yù)測編碼在無損預(yù)測編碼模型中加上一個(gè)量化器構(gòu)成有損預(yù)測編碼。7.5圖像的變換編碼1.變換編碼的基本原理：通過正交變換（如傅里葉變換、離散余弦變換等），把圖像從空間域轉(zhuǎn)換為能量比較集中的變換域（頻域），變換后的結(jié)果產(chǎn)生一批變換系數(shù)，然后對這些變換系數(shù)進(jìn)行編碼處理，達(dá)到壓縮圖像的目的。2.正交變換編碼在正交變換編碼中，常用的正交變換有：

DFT,DCT,WHT,KLT等。正交變換具有如下優(yōu)點(diǎn)：（1）熵保持。正交變換具有熵保持性質(zhì)，即正交變換不丟失信息，從而通過傳輸變換系數(shù)來傳送信息。（2）能量集中。變換域中的能量多集中于少數(shù)變換系數(shù)上，大多數(shù)系數(shù)的數(shù)值都很小。因此對于能量較小的系數(shù)可粗糙量化，分配較小的比特，或完全忽略。對于能量較大的系數(shù)，分配較多的比特。從而利用熵編碼來壓縮數(shù)據(jù)。（3）去相關(guān)。正交變換能夠去除像素間的冗余，變換系數(shù)間的相關(guān)性為零或較小。

總之，正交變換能夠去除或減小數(shù)據(jù)間的相關(guān)性，減小信源的信息冗余，實(shí)現(xiàn)數(shù)據(jù)壓縮，提高信息傳輸或存儲系統(tǒng)的有效性。正交變換的選擇：在正交變換編碼中，需要選擇一種合適的正交變換。實(shí)際應(yīng)用中，應(yīng)綜合考慮變換的去相關(guān)能力、能量集中能力和計(jì)算復(fù)雜程度等。一般在性能滿足要求的條件下，盡可能選擇簡單的變換。常用正交變換性能比較：常用的正交變換有：DFT,DCT,WHT,KLT等。

從運(yùn)算量大小和壓縮效果這兩方面比較，其性能比較如下表：（表中是一維N點(diǎn)各種正交變換所需的運(yùn)算次數(shù)，從上至下的順序代表了運(yùn)算量大小和壓縮效果）。變換編碼的步驟：（1）確定變換矩陣A和圖像的分塊

在正交變換編碼中，需要把一幅圖像分割成若干個(gè)大小為n×n的子圖像，對各個(gè)子圖像進(jìn)行變換、量化與編碼。常用的子圖像大小為8×8和16×16。

結(jié)論：從表中可以看出，K-L變換的運(yùn)算量最大，WHT變換運(yùn)算量最小，但壓縮效果較差。而綜合比較，DCT的綜合效果較好，因此，在正交變換編碼中，DCT是首要選擇，并已成功應(yīng)用于編碼標(biāo)準(zhǔn)中，如JPEG,MPEG-1,MPEG-2等。

一維變換相當(dāng)于把圖像分成子塊，每一子塊為1×N的一個(gè)N維向量即：子圖像區(qū)域的選擇：子圖像尺寸大小取4×4，8×8，16×16適合圖像壓縮。

圖像尺寸過小，計(jì)算速度較快，但壓縮能力有限；子圖像尺寸過大，去相關(guān)性效果好，但增加計(jì)算的復(fù)雜性，若圖像的相關(guān)性較小，壓縮效果不明顯。例：7.17a)DC分量b)DC和2個(gè)最低AC系數(shù)

c)DC和9個(gè)最低AC系數(shù)d）全部64個(gè)系數(shù)的恢復(fù)結(jié)果區(qū)域編碼實(shí)例b)a)c)d)（2）變換域采樣：即對變換域中的系數(shù)進(jìn)行取舍。系數(shù)選取越多，重構(gòu)圖像效果越好，但壓縮比會下降。區(qū)域編碼法：

選出能量集中的區(qū)域（正交變換中能量多半集中于低頻區(qū)域），并對這一區(qū)域的系數(shù)進(jìn)行編碼傳送，而其他區(qū)域的系數(shù)可以舍棄。在解碼端對舍棄的系數(shù)進(jìn)行補(bǔ)零處理。這樣由于保持了大部分圖像能量，在恢復(fù)圖像中帶來的質(zhì)量劣化并不顯著。在變換編碼中常用的系數(shù)選取方法：區(qū)域編碼：根據(jù)最大方差進(jìn)行選擇；閾值編碼：根據(jù)最大值的量級選擇。

特點(diǎn)：

在區(qū)域編碼中，區(qū)域抽樣和區(qū)域編碼的均方誤差都與方塊大小有關(guān)。其顯著缺點(diǎn)是一旦選定某個(gè)區(qū)域就固定不變了，有時(shí)圖像中的能量也會在其他區(qū)域集中較大的數(shù)值，這時(shí)舍棄它們會造成圖像質(zhì)量的較大損失。閾值編碼法：閾值編碼法先設(shè)定一個(gè)門限值T，當(dāng)變換系數(shù)超過T值時(shí)，就保留下來并進(jìn)行編碼傳送；當(dāng)系數(shù)值小于T時(shí)就舍棄不用。

變換子圖像選取閾值常用方法：1）對所有子圖像用一個(gè)全局閾值：

壓縮效果不穩(wěn)定，因圖像而異，閾值選擇有困難。2）對各子圖像分別用不同的閾值：每幅子圖像都丟棄相同數(shù)目的系數(shù)，其編碼率事先可知。3）根據(jù)各子圖像中各系數(shù)的位置選取閾值

將取閾值和量化結(jié)合，碼率是變化的，有自適應(yīng)性。缺點(diǎn)：由于超過門限值的系數(shù)的位置是隨機(jī)的，因此

在編碼中除了對系數(shù)值進(jìn)行編碼外，還要有位置碼，這兩種碼同時(shí)傳送，才能在接收端收到正確恢復(fù)的圖像。所以其壓縮比有時(shí)會下降。特點(diǎn)：優(yōu)點(diǎn)：有一定的自適應(yīng)能力，可以得到較區(qū)域編碼好的圖像質(zhì)量；（3）系數(shù)量化：變換后的系數(shù)是獨(dú)立的和有序的，利用量化使數(shù)據(jù)得到壓縮。量化是產(chǎn)生有損壓縮的原因，為了使量化失真最小，可采用不同的量化方法（編碼）。（4）解碼與反變換：在接收端對接收到的碼流進(jìn)行解碼，分離出各變換系數(shù)，且將舍去的系數(shù)代為“0”，然后求反變換，恢復(fù)各圖像子塊。變換編碼實(shí)例：p170-例：7.14，7.15，7.16例：利用DCT變換來實(shí)現(xiàn)圖像的壓縮%返回DCT變換矩陣4.小波編碼：小波編碼器：小波編碼是變換編碼算法之一，因此同變換編碼器一樣，小波編碼器由三個(gè)部分組成：變換、量化和熵編碼輸出。典型小波編碼系統(tǒng)：小波編碼步驟：1）對原始圖像進(jìn)行小波變換，得到小波系數(shù)；2）對小波系數(shù)進(jìn)行分析量化；3）編碼。小波編碼特點(diǎn)：小波變換能將原始圖像的能量集中到少部分小波系數(shù)上，且分解后的小波系數(shù)在三個(gè)方向的細(xì)節(jié)分量有較高的局部相關(guān)性。因此，小波編碼可以得到較高的壓縮比，且壓縮速度較快。基于DCT的圖像壓縮所產(chǎn)生的塊狀失真b)基于Wavelet的圖像壓縮解碼效果a)b)小波基的選擇：由于小波函數(shù)是不唯一的，不同的小波對同一幅圖像的壓縮效果是有差異的。因此如何選擇最優(yōu)的小波基是首要問題。小波基的選擇一般考慮以下因素：1）小波基的正則性和消失距；正則性是函數(shù)光滑性的一種描述，也反映了函數(shù)頻域能量集中的程度。同時(shí)，正則性高的小波重構(gòu)后，圖像失真比較平滑，視覺效果較好。

有較大消失矩的小波基用于圖像編碼，意味著在一個(gè)相當(dāng)平坦的區(qū)域附近小波系數(shù)接近零，這會提高壓縮效率。2）小波基的線性相位（對稱性）如果正交基不具有對稱性，就不能保證線性相位，在圖像編碼應(yīng)用中，會引入相位失真。因此，圖像編碼中一般使用由對稱性的小波基。如雙正交小波基。3）所處理圖像與小波基的相似性當(dāng)小波函數(shù)與待壓縮圖像結(jié)構(gòu)上存在一定的相似性時(shí)，也會影響壓縮效果。小波分解等級選擇：4）小波函數(shù)的能量集中性5）綜合考慮壓縮效率和計(jì)算復(fù)雜度小波系數(shù)的分析與量化一幅圖像進(jìn)行小波分解后，得到一系列不同尺度的子圖像，不同尺度的子圖像對應(yīng)不同的頻率。高頻子圖像上小波系數(shù)的絕對值較小，而低頻子圖像上小波系數(shù)的絕對值較大。因此，在圖像編碼中，對高頻系數(shù)分配較小的比特，達(dá)到壓縮的目的。小波編碼（系數(shù)量化設(shè)計(jì)）：直接閾值編碼、基于小波樹結(jié)構(gòu)的矢量量化法、嵌入式零樹小波編碼7.6圖像壓縮標(biāo)準(zhǔn)圖像壓縮的國際標(biāo)準(zhǔn)主要由國際標(biāo)準(zhǔn)化組織（InternationalStandardizationOrganization,簡稱ISO）和國際電信聯(lián)盟（InternationalTelecommunicationUnion，簡稱ITN)制定的。由這兩個(gè)組織制定的國際標(biāo)準(zhǔn)可分成三個(gè)部分：靜止（灰度和彩色）圖像壓縮標(biāo)準(zhǔn)、運(yùn)動圖像壓縮標(biāo)準(zhǔn)和二值圖像壓縮標(biāo)準(zhǔn)。圖像編碼國際標(biāo)準(zhǔn)極大地促進(jìn)了全球范圍內(nèi)信息傳輸?shù)陌l(fā)展。1.靜止圖像壓縮標(biāo)準(zhǔn)JPEG：

聯(lián)合專家組建立了靜態(tài)灰度（或彩色）圖像壓縮的公開算法，并于1992年開始通過并公布，1994年3月通過為正式標(biāo)準(zhǔn)。它定義三種編碼系統(tǒng)：（1）DCT有損編碼系統(tǒng)；（2）擴(kuò)展編碼系統(tǒng)；（3）無失真編碼系統(tǒng)。在視覺效果不受到嚴(yán)重?fù)p失的前提下，對灰度圖像壓縮算法可以達(dá)到15到20的壓縮比。如果在圖像質(zhì)量上稍微犧牲一點(diǎn)，則壓縮比可以達(dá)到40：1，甚至更高。要求：

該標(biāo)準(zhǔn)適用于各種多媒體存儲和通信應(yīng)用所使用的灰度圖像、攝影圖像及靜止視頻壓縮文件。（1）必須將圖像質(zhì)量控制在可視保真度高的范圍內(nèi)，同時(shí)編碼器可被參數(shù)化，允許用戶設(shè)置壓縮或質(zhì)量水平。（2）壓縮標(biāo)準(zhǔn)可以應(yīng)用于任何一類連續(xù)色調(diào)數(shù)字圖像，并不應(yīng)受到維數(shù)、顏色、畫面尺寸、內(nèi)容、影調(diào)的限制。（3）壓縮標(biāo)準(zhǔn)必須從完全無損到有損范圍內(nèi)可選，以適應(yīng)不同的存儲、CPU和顯示要求。JPEG基本系統(tǒng)框圖：反變換2.運(yùn)動圖像壓縮標(biāo)準(zhǔn)MPEG：

運(yùn)動圖像專家小組（MPEG）于1991年提出用于數(shù)字存儲媒介的、速率約1.5MB/s的運(yùn)動圖像及其伴音的壓縮編碼，并于1992年正式通過。運(yùn)動圖像的壓縮包括兩個(gè)主要方面：幀內(nèi)壓縮與幀間壓縮。幀內(nèi)壓縮：刪除空間的數(shù)據(jù)冗余；幀間壓縮：刪除幀與幀之間的時(shí)間冗余。刪除時(shí)間冗余可通過幀間編碼來完成，即僅存儲運(yùn)動圖像從一幀到下一幀的變化部分，而不是存儲全部圖像數(shù)，這樣能極大地減少運(yùn)動圖像數(shù)據(jù)的存儲量，達(dá)到幀間壓縮的目的。MPEG-1標(biāo)準(zhǔn)：

1990年MPEG組織制定了MPEG-1標(biāo)準(zhǔn)草案，1993年8月正式通過。MPEG-1標(biāo)準(zhǔn)旨在解決多媒體的存儲問題，主要應(yīng)用于數(shù)字存儲媒介中活動圖像及其伴音的編碼表示，數(shù)碼率約為1.5Mbps。MPEG-2標(biāo)準(zhǔn)：為滿足數(shù)字存儲媒體、電視廣播以及通信等應(yīng)用領(lǐng)域?qū)τ凇盎顒訄D像及其伴音的通用編碼方法”的日益增長的需求，MPEG組織在1994年推出MPEG-2標(biāo)準(zhǔn)，數(shù)碼率高達(dá)10Mbps。MPEG-4標(biāo)準(zhǔn)

MPEG組織于1999年1月公布了全新的

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第7章圖像編碼與壓縮

文檔簡介

溫馨提示

最新文檔

評論

第7章圖像編碼與壓縮

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔