圖像處理第8章 圖像編碼基礎(chǔ)_第1頁(yè)
圖像處理第8章 圖像編碼基礎(chǔ)_第2頁(yè)
圖像處理第8章 圖像編碼基礎(chǔ)_第3頁(yè)
圖像處理第8章 圖像編碼基礎(chǔ)_第4頁(yè)
圖像處理第8章 圖像編碼基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三單元圖像編碼本單元包括3章,分別為:

●第8章圖像編碼基礎(chǔ)

●第9章圖像變換編碼

●第10章其他圖像編碼方法

圖象編碼的目的是在保證一定視覺(jué)質(zhì)量的前提下減少數(shù)據(jù)量(從而也減少圖象傳輸所需的時(shí)間),這也可看作使用較少的數(shù)據(jù)量來(lái)獲得較好的視覺(jué)質(zhì)量。圖象編碼以信息論為基礎(chǔ),以壓縮數(shù)據(jù)量為主要目的,所以圖象編碼也常被稱為圖象壓縮。本章主要內(nèi)容圖像壓縮原理編碼定理變長(zhǎng)編碼位平面編碼第8章圖像編碼基礎(chǔ)8.1圖像壓縮原理{在保持圖象中的原有信息或讓信息損失滿足應(yīng)用要求的基礎(chǔ)上盡可能地減少數(shù)據(jù)量}8.1.1數(shù)據(jù)冗余數(shù)據(jù)冗余:表達(dá)了無(wú)用的信息;表達(dá)了已表達(dá)的信息;表達(dá)沒(méi)有最優(yōu)而多使用的信息。數(shù)據(jù)冗余的定量描述。設(shè)n1、n2分別代表表達(dá)相同信息的兩個(gè)數(shù)據(jù)集合中的信息載體單位的個(gè)數(shù),那么第1個(gè)數(shù)據(jù)集合相對(duì)于第2個(gè)數(shù)據(jù)集合的相對(duì)數(shù)據(jù)冗余:RD=1-1/CR其中CR稱為壓縮率:CR=n1/n2CR和RD分別在開(kāi)區(qū)間(0,∞)和(-∞,1)之間取值。圖像中的數(shù)據(jù)冗余主要有三種:①心理視覺(jué)冗余(與主觀感覺(jué)有關(guān));②像素間冗余(空間冗余,幾何冗余);③編碼冗余(與灰度分布的概率特性有關(guān))。1、心理視覺(jué)冗余眼睛并不是對(duì)所有信息有相同的敏感度。對(duì)于那些視覺(jué)過(guò)程中不重要的信息可認(rèn)為是心理視覺(jué)上的冗余,去掉這些信息不會(huì)明顯降低所感受到的圖像質(zhì)量。心理視覺(jué)冗余與人觀察圖像的方式有關(guān),這個(gè)因人而異,因應(yīng)用要求而異。1、心理視覺(jué)冗余心理視覺(jué)冗余與實(shí)際的視覺(jué)信息相聯(lián)系,只有對(duì)正常視感覺(jué)過(guò)程不必要的信息才可能被去除掉,該過(guò)程能導(dǎo)致定量信息的損失,因此也稱為量化,屬不可逆操作,用于數(shù)據(jù)壓縮導(dǎo)致有損壓縮。心理視覺(jué)冗余的存在與人觀察圖像的方式有關(guān),人在觀察圖像時(shí)會(huì)尋找某些比較明顯的目標(biāo),而不是定量的考慮圖像中每一個(gè)像素的亮度,通過(guò)在大腦中分析這些特征并與先驗(yàn)知識(shí)結(jié)合以完成對(duì)圖像的認(rèn)知和解釋過(guò)程,因?yàn)槊總€(gè)人所具有的先驗(yàn)知識(shí)不同,對(duì)同一幅圖的心理視覺(jué)冗余也就因人而異。2、像素間冗余圖8.1.1兩幅圖像和他們沿同一行的自相關(guān)系數(shù)曲線像素間冗余:一種與圖像像素間相關(guān)性直接聯(lián)系著的數(shù)據(jù)冗余。像素間冗余常稱為空間冗余或集合冗余。圖像(a)中各像素的值可以比較方便地由其鄰近像素的值預(yù)測(cè)出來(lái),每個(gè)像素所攜帶的獨(dú)立信息相對(duì)較少。換句話說(shuō),單個(gè)像素對(duì)圖像的視覺(jué)貢獻(xiàn)有很多冗余,因?yàn)槠浠叶瘸D芙柚溧徑袼氐闹祦?lái)推斷。連續(xù)序列圖像或視頻中,考慮時(shí)間因素,像素間冗余也稱為時(shí)間冗余或幀間冗余。abcd規(guī)則

冗余大不規(guī)則冗余小3、編碼冗余編碼:建立碼本來(lái)表達(dá)數(shù)據(jù);碼本:用來(lái)表達(dá)一定量的信息或一組事件所需的一系列符號(hào)(如字母、數(shù)字等);碼字:對(duì)每個(gè)信息或事件所賦的碼符號(hào)序列;碼字的長(zhǎng)度(碼長(zhǎng),字長(zhǎng)):每個(gè)碼字里的符號(hào)個(gè)數(shù)。圖象中每個(gè)灰度值sk(對(duì)灰度編碼)出現(xiàn)的概率:

式中,L為灰度級(jí)數(shù),nk是第k個(gè)灰度級(jí)出現(xiàn)的次數(shù),N是圖像中的像素總個(gè)數(shù)。不同灰度出現(xiàn)的概率不同。每個(gè)像素所需的平均比特?cái)?shù):

l(sk)表示sk的每個(gè)數(shù)值的比特?cái)?shù),由上式可知,每個(gè)像素所需比特?cái)?shù)是每個(gè)灰度的像素?cái)?shù)與用來(lái)表示這些灰度值所需比特?cái)?shù)的乘積的總和。所以,如能用較少的比特?cái)?shù)來(lái)表示出現(xiàn)概率較大的灰度級(jí),而用較多的比特?cái)?shù)來(lái)表示出現(xiàn)概率較小的灰度級(jí)就能達(dá)到減少平均比特的效果。如果編碼所用碼本不能使上式達(dá)到最小,就說(shuō)明存在編碼冗余,一般,如果編碼時(shí)沒(méi)有充分利用編碼對(duì)象的概率特性就會(huì)產(chǎn)生編碼冗余。8.1.2圖像編解碼圖8.1.2圖像編解碼過(guò)程圖像編解碼過(guò)程:圖像編解碼系統(tǒng):圖8.1.4編碼器和解碼器及其模塊8.1.3圖像保真度和質(zhì)量圖象保真度描述解碼圖象相對(duì)于原始圖象的偏離程度,是對(duì)信息損失的一種測(cè)度。主要分為兩大類:①客觀保真度(用編碼輸入圖與解碼輸出圖的某個(gè)確定函數(shù)表示損失的信息量,便于計(jì)算或測(cè)量)②主觀保真度(主觀測(cè)量圖象的質(zhì)量,因人而異,應(yīng)用不方便)1、客觀保真度(用編碼輸入圖與解碼輸出圖的某個(gè)確定函數(shù)表示損失的信息量,便于計(jì)算或測(cè)量)點(diǎn)誤差:圖誤差:均方根誤差:均方信噪比:兩幅圖尺寸均為M×N歸一化信噪比,令:可得到峰值信噪比:用分貝(dB)表示歸一化,則有:2、主觀保真度(主觀測(cè)量圖象的質(zhì)量,因人而異,應(yīng)用不方便)很多解壓圖象最終是供人看的,在這種情況下,用主觀的檢測(cè)常更合適。主觀保真度可分為3種:①損傷檢驗(yàn)(觀察者對(duì)圖象根據(jù)其損傷程度打分)②質(zhì)量檢驗(yàn)(觀察者對(duì)圖象根據(jù)其質(zhì)量排序)③對(duì)比測(cè)試(觀察者對(duì)圖象進(jìn)行兩兩比較)8.2編碼定理{信息論是圖像編碼的基礎(chǔ)}8.2.1信息單位和信源描述信息量:概率為P(E)的隨機(jī)事件E的信息量:I(E)稱為E的自信息(隨概率增加而減少),特例:P(E)=1(即事件總發(fā)生),那么I(E)

=0。信息的單位:比特(log以2為底)1個(gè)比特:即2個(gè)相等可能性的事件之一發(fā)生信源:一幅圖各像素的灰度值可看作一個(gè)具有隨機(jī)輸出的信源。信源符號(hào)集:S={s1,s2,…,sj},sj稱為信源符號(hào)信源產(chǎn)生符號(hào)sj這個(gè)事件的概率是P(sj)概率矢量:u=[P(s1)P(s2)…P(sj

)]T,用(S,u)可以完全描述信源。信源平均信息H(u):H(u)稱為信源的熵,它定義了觀察到單個(gè)信源符號(hào)輸出時(shí)所獲得的平均信息量,若信源各符號(hào)概率相等則熵達(dá)到最大值,此時(shí)信源提供最大可能的每信源符號(hào)平均信息量編碼輸出:因?yàn)樾旁吹妮敵鰰r(shí)一個(gè)離散隨機(jī)變量,所以編碼后的輸出也是一個(gè)離散隨機(jī)變量,它也是一個(gè)有限或無(wú)窮可數(shù)的符號(hào)集合中得到的。編碼輸出符號(hào)集:T={t1,t2,…,tK}概率矢量:v=[P(t1)P(t2)…P(tK

)]T,用(T,v)可以完全描述編碼輸出。編碼輸出的概率P(tk

)和信源u的概率分布:

式中,P(tksj

)是在信源符號(hào)sj產(chǎn)生條件下得到編碼輸出符號(hào)tk的概率。將條件概率放入一個(gè)K×

J的傳遞矩陣Q:編碼輸出符號(hào)集的概率分布:v=Qu互信息:對(duì)應(yīng)每個(gè)tk有一個(gè)條件熵函數(shù):

H(u|tk)對(duì)所有tk的期望值:編碼輸出符號(hào)tk的條件下信源符號(hào)sj產(chǎn)生的概率

H(u)和H(u|tk)的差是獲得單個(gè)輸出符號(hào)而接收到的平均信息,也稱u,v的互信息:表明互信息是U和Q的函數(shù),當(dāng)輸入和輸出符號(hào)統(tǒng)計(jì)獨(dú)立時(shí),I(u,v)取得最小值0.8.2.2無(wú)失真編碼定理無(wú)失真編碼定理給出在沒(méi)有失真的條件下(無(wú)損壓縮),編碼表達(dá)每個(gè)信源符號(hào)時(shí)可達(dá)到的最小平均碼字長(zhǎng)度。信源輸出一個(gè)塊(組)隨機(jī)變量,信源產(chǎn)生的概率,它與單符號(hào)概率P(sj)的關(guān)系為:信源的熵:由此可見(jiàn),產(chǎn)生塊隨機(jī)變量的信源的熵是對(duì)應(yīng)單符號(hào)信源的n倍。它也可看作是單符號(hào)信源的n階擴(kuò)展。P(σi)=P(σj1)P(σj2)…P(σjn)概率矢量:u'

=[P(σ1)P(σ2)…P(σJn)]T用長(zhǎng)度為的整數(shù)碼字來(lái)對(duì)編碼,滿足:取極限:各式乘以p(σi)并對(duì)所有i求和H(u)是L'avg/n的下限,所以效率可定義為:效率總是小于等于1的,所以也可以說(shuō)無(wú)損信源編碼的平均碼字長(zhǎng)度可接近信源的熵,但不能小于信源的熵。這是無(wú)損信源壓縮的極限。8.2.3率失真編碼定理

率失真編碼定理簡(jiǎn)稱率失真定理,也稱信源編碼定理。該定理將對(duì)固定字長(zhǎng)編碼方案的失真(重建誤差)D與編碼所用的數(shù)據(jù)率(如每象素比特?cái)?shù))R聯(lián)系在一起。它給出由于壓縮而產(chǎn)生的平均誤差被限制在某個(gè)最大允許水平D時(shí)的最小的R。用重建的均方誤差作為失真度:重建誤差的熵有如下的上限:率失真函數(shù):因?yàn)樾旁词请S機(jī)的,所以失真也是一個(gè)隨機(jī)變量。失真的平均值d(Q)可表示為:當(dāng)且僅當(dāng)Q對(duì)應(yīng)的平均失真小于或等于D時(shí),可以說(shuō)編碼解碼過(guò)程的允許失真是D。所有允許失真為D的編碼解碼過(guò)程的集合是:因而可進(jìn)一步定義率失真函數(shù):上式給出了在平均失真小于或等于D時(shí),信源可以傳送給編碼輸出的最小平均信息量為計(jì)算R(D),可通過(guò)合理選擇Q以求取I(u,v)的最小值,此過(guò)程要滿足3個(gè)約束條件:(1)Q的元素必須是正的(2)Q的任一列之和為1(3)允許最大可能的失真,就可獲得最小的數(shù)據(jù)率例8.2.3擴(kuò)展編碼的率失真函數(shù)特點(diǎn):R(D)總是正的,單減的在[0,Dmax]區(qū)間下凸R(D)在D<0時(shí)不存在D≥Dmax時(shí)有R(D)=08.3變長(zhǎng)編碼

變長(zhǎng)編碼是一種統(tǒng)計(jì)編碼壓縮方式,可減少編碼冗余。變長(zhǎng)編碼通過(guò)非配給出現(xiàn)頻率較高的符號(hào)以較短的碼字而出現(xiàn)頻率較低的符號(hào)以較長(zhǎng)的碼字來(lái)降低平均比特率。變長(zhǎng)編碼是一種信息保存型編碼方式。8.3.1哥倫布編碼哥倫布編碼是一種比較簡(jiǎn)單的變長(zhǎng)編碼方法??紤]像素間的相關(guān)性,相鄰像素灰度值的差將會(huì)呈現(xiàn)小值出現(xiàn)多、大直出現(xiàn)少的特點(diǎn),這種情況比較適合哥倫布編碼方法。給定一個(gè)非負(fù)整數(shù)n和一個(gè)正整數(shù)除數(shù)m,n相對(duì)于m的哥倫布碼記為Gm(n),它是對(duì)商

的一元碼和對(duì)余數(shù)nmodm的二值表達(dá)的組合。Gm(n)可根據(jù)以下3個(gè)步驟計(jì)算{對(duì)照例8.3.1}(1)構(gòu)建商的一元碼(整數(shù)I一元碼定義為I個(gè)1后面跟個(gè)0)(2)令c=2k

–m,r=nmodm,計(jì)算截?cái)嗟膔':(3)將上兩步驟的結(jié)果拼接起來(lái)得到Gm(n)。階為k的指數(shù)哥倫布碼Gk

exp(n)采用以下3個(gè)步驟{對(duì)照例8.3.2}:(1)確定滿足下式的整數(shù)i≥0:并構(gòu)建i的一元碼。(2)計(jì)算下式的二值表達(dá):并將其截?cái)嗟阶畹偷膋+i比特。(3)將上兩個(gè)步驟的結(jié)果拼接起來(lái)得到8.3.2哈夫曼編碼

哈夫曼編碼是消除編碼冗余最常用的技術(shù)。當(dāng)對(duì)信源符號(hào)逐個(gè)編碼時(shí),哈夫曼編碼能給出最短的碼字。根據(jù)無(wú)失真編碼定理,哈夫曼編碼方式對(duì)固定階數(shù)的信源是最優(yōu)的。哈夫曼編碼過(guò)程主要分為兩個(gè)步驟:縮減信源符號(hào)數(shù)量:

將信源符號(hào)按出現(xiàn)概率從大到小排列,為消減信源,先將概率最小的兩個(gè)符號(hào)結(jié)合得到一個(gè)組合符號(hào)。如果剩下的符號(hào)多余兩個(gè),則繼續(xù)以上過(guò)程直到信源中只有兩個(gè)符號(hào)為止。(2)

對(duì)每個(gè)信源符號(hào)賦值從(消減到)最小的信源開(kāi)始,逐步回到初始信源(參照?qǐng)D8.3.2)圖8.3.2哈夫曼賦值過(guò)程圖解最終得到的碼字見(jiàn)圖中“碼字”一列所示。對(duì)一個(gè)只有兩個(gè)符號(hào)的信源,最短長(zhǎng)度的二元碼由符號(hào)0和1組成,將他們賦予對(duì)應(yīng)最右列兩個(gè)概率的符號(hào),這里賦予0或1完全是隨機(jī)的,不影響結(jié)果,由于對(duì)應(yīng)概率為0.6的符號(hào)是由左邊兩個(gè)符號(hào)結(jié)合而成,所以先將0賦給這兩個(gè)符號(hào),然后再隨機(jī)地將0和1接在后面以區(qū)分這兩個(gè)符號(hào)。8.3.3香農(nóng)-法諾編碼

香農(nóng)-法諾編碼碼字中的0和1是獨(dú)立的,并且基本上等概率出現(xiàn)。它與哈夫曼編碼一樣都是所謂塊(組)碼,將每個(gè)信源符號(hào)映射成一組固定次序的碼符號(hào),這樣在編碼時(shí)可以一次一個(gè)符號(hào),也都需要知道各個(gè)信源號(hào)產(chǎn)生的概率。其主要步驟為:(1)源號(hào)依從到小列;(2)將信源符號(hào)分成概率之和相接近的兩部分;(3)分別給兩部分的信源符號(hào)組合進(jìn)行賦值(分別賦予0和1,也可1和0);(4)如果兩部分均只有一個(gè)信源符號(hào),編碼結(jié)束,否則返回(2)繼續(xù)進(jìn)行。8.3.4算術(shù)編碼算術(shù)編碼是一種從整個(gè)符號(hào)序列出發(fā),采用遞推形式連續(xù)編碼的方法。將需編碼的所有符號(hào)統(tǒng)一考慮,建立整個(gè)符號(hào)序列與一個(gè)實(shí)數(shù)區(qū)間的映射關(guān)系,算術(shù)編碼的特點(diǎn):1、只需用到加法和移位運(yùn)算(算術(shù));2、從整個(gè)符號(hào)序列出發(fā)采用遞推形式連續(xù)編碼;3、一個(gè)算術(shù)碼字要賦給整個(gè)信源符號(hào)序列;4、碼字本身確定0和1之間的一個(gè)實(shí)數(shù)區(qū)間;5、源符號(hào)和碼字間的一一對(duì)應(yīng)關(guān)系并不存在,算術(shù)碼不是塊碼編碼來(lái)自1個(gè)4-符號(hào)信源{s1,s2,s3,s4}組成的符號(hào)序列:s1s2s3s3s4(參見(jiàn)下圖)編碼開(kāi)始時(shí)符號(hào)占據(jù)整個(gè)區(qū)間[0,1],根據(jù)各個(gè)信源符號(hào)概率分成四段,第一個(gè)符號(hào)s1對(duì)應(yīng)[0,0.2],編碼時(shí)將這個(gè)區(qū)間擴(kuò)展成整個(gè)高度,再將此區(qū)間根據(jù)各信源符號(hào)概率擴(kuò)展成四段,然后對(duì)序列中第二個(gè)符號(hào)s2編碼,同理依次到最后一個(gè)符號(hào)編碼結(jié)束,最終得到一個(gè)區(qū)間[0.06752,0.0688],任何一個(gè)該區(qū)間的實(shí)數(shù)都可代表這個(gè)區(qū)間,從而代表對(duì)應(yīng)的符號(hào)序列。圖8.3.5算術(shù)編碼過(guò)程圖解8.4位平面編碼

位平面編碼先將許多灰度值圖像分解成一系列二值圖,然后對(duì)二值圖再用二元壓縮方法進(jìn)行壓縮。它不僅能消除或減少編碼冗余也能消除或減少圖象中的象素間冗余。8.4.1位平面的分解基本的位平面分解方法主要有:二值分解和灰度分解。1、二值分解對(duì)一幅用多個(gè)比特表示其灰度值的圖像來(lái)說(shuō),其中的每個(gè)比特可看作表示了一個(gè)二值的平面,也稱位平面(簡(jiǎn)稱位面)圖8.4.1圖像的位面表示來(lái)表示具有m比特灰度級(jí)的圖像中像素的灰度值。把一幅灰度圖分解成一系列二值圖集合的一種簡(jiǎn)單方法就是把上述多項(xiàng)式的m個(gè)系數(shù)分別分到m個(gè)1比特的位面中,稱為二值分解。這個(gè)分解方法的一個(gè)固有缺點(diǎn)是像素點(diǎn)灰度值的微小變化有可能對(duì)平面的復(fù)雜度產(chǎn)生明顯影響??捎萌缦露囗?xiàng)式:對(duì)一幅8比特灰度級(jí)圖像,當(dāng)代表一個(gè)像素灰度值字節(jié)的最高比特為1時(shí),該像素的灰度值必定大于或等于128,而當(dāng)這個(gè)像素的最高比特為0時(shí),該像素的灰度值必定小于或等于127.2、灰度碼分解

減少小灰度值變化影響的位面分解法,先用一個(gè)m比特的灰度碼表示圖像。m比特的灰度碼可由下式計(jì)算:

其中⊕代表異或操作。按上述方式分解為灰度碼分解,其結(jié)果仍是二值的位面。這樣得到的碼的獨(dú)特性質(zhì)是相連的碼字只有一個(gè)比特的區(qū)別,像素點(diǎn)灰度值的小變化就不易影響所有位面。8.4.2位平面的編碼位平面分解后得到的是二值圖,即像素值只有0或1兩種。另外,像素值為0或1的兩種像素在平面上是互補(bǔ)的。這些特性都可用來(lái)幫助編碼。1、常數(shù)塊編碼(CAC)

用專門(mén)的碼字表達(dá)全是0或1的連通區(qū)域,將圖象分成全黑,全白或混合的m×n尺寸塊出現(xiàn)頻率最高的類賦予1bit碼字0,其它兩類分別賦予2bit碼字10和11。壓縮:原需用mn比特表示的常數(shù)塊現(xiàn)在只用1bit或2bit碼字表示當(dāng)需壓縮的圖像主要由白色部分組成時(shí),更簡(jiǎn)單的方法是將白色區(qū)塊編為0,而將其他塊區(qū)域都用1街上該塊的位模式編碼。這種方法為跳躍白色塊(WBS).2、

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論