




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)字圖像處理第八章課件2023/4/10第1頁(yè),共147頁(yè),2023年,2月20日,星期五8.1概述8.1.1視頻壓縮編碼的必要性現(xiàn)以一路電視信號(hào)為例,看看將它數(shù)字化后的數(shù)碼率,按CCIR(ConsultativeCommitteeInternationalRadio)制定的CCIR601標(biāo)準(zhǔn),數(shù)字化后的分辨率為720×576,每秒25幀,Y:U:V為4:2:2,若以8bit表示Y信號(hào),則每像素占16bit,數(shù)碼率為165.9Mbps。以64kbps作為一個(gè)數(shù)字話路,若不加壓縮,為傳輸一路電視要占用2592個(gè)有效數(shù)字話路。這在實(shí)際應(yīng)用中是難以接受的。2023/4/10第2頁(yè),共147頁(yè),2023年,2月20日,星期五若用一個(gè)容量為1GB的硬盤或CD-ROM來(lái)存貯這樣的數(shù)據(jù),則只能存貯不到1分鐘的圖像,并且,所需的高數(shù)據(jù)呑吐率是一般的硬盤和CD-ROM難以達(dá)到的。若不加壓縮,HDTV信號(hào)的數(shù)碼率可接近1Gbps,更加驚人。再以指紋庫(kù)為例,若以(512×512)×8bit的灰度圖像來(lái)存貯一個(gè)手指的指紋,一個(gè)40萬(wàn)人的指紋庫(kù),每人十指,則共需1000GB的存貯量。由這些例子就可以看出圖像壓縮編碼的必要性。2023/4/10第3頁(yè),共147頁(yè),2023年,2月20日,星期五圖像編碼技術(shù)的進(jìn)展已使這些制約因素不再成為瓶頸,從而推動(dòng)了各類圖像通信系統(tǒng)的推廣和應(yīng)用。圖像編碼是各類圖像信息傳輸、存貯產(chǎn)品的一項(xiàng)核心技術(shù)。2023/4/10第4頁(yè),共147頁(yè),2023年,2月20日,星期五8.1.2圖像壓縮編碼的目的圖像編碼是一種信源編碼,其信源是各種類型的圖像信息。圖像壓縮編碼的目的是以盡量少的比特?cái)?shù)表征圖像,同時(shí)保持復(fù)原圖像的質(zhì)量,使它符合預(yù)定應(yīng)用場(chǎng)合的要求。節(jié)省圖像存儲(chǔ)器的容量、減少信道容量、縮短圖像處理時(shí)間。但這是以壓縮和解壓的時(shí)間為代價(jià)的。2023/4/10第5頁(yè),共147頁(yè),2023年,2月20日,星期五8.1.3圖像壓縮編碼的可行性圖像數(shù)據(jù)可以進(jìn)行壓縮有幾個(gè)方面的原因。首先,原始圖像數(shù)據(jù)是高度相關(guān)的,存在很大的冗余度。數(shù)據(jù)冗余造成比特?cái)?shù)浪費(fèi),消除這些冗余可以節(jié)約碼字,也就達(dá)到了數(shù)據(jù)壓縮的目的。2023/4/10第6頁(yè),共147頁(yè),2023年,2月20日,星期五1)
空間冗余度:大多數(shù)圖像內(nèi)相鄰像素之間有較大的相關(guān)性。2)
時(shí)間冗余度:序列圖像前后幀之間的較大的相關(guān)性。3)
頻率域冗余度:多光譜遙感圖像各譜間有相關(guān)性。2023/4/10第7頁(yè),共147頁(yè),2023年,2月20日,星期五4)
符號(hào)冗余度:若用相同碼長(zhǎng)表示不同出現(xiàn)概率的符號(hào)也會(huì)造成比特?cái)?shù)的浪費(fèi),這種浪費(fèi)稱為符號(hào)冗余度。如果采用可變長(zhǎng)編碼技術(shù),對(duì)出現(xiàn)概率高的符號(hào)用短碼字表示,對(duì)出現(xiàn)概率低的符號(hào)用長(zhǎng)碼字,就可消除符號(hào)冗余度,從而節(jié)約碼字。2023/4/10第8頁(yè),共147頁(yè),2023年,2月20日,星期五5)
視覺冗余度:允許圖像編碼有一定的失真也是圖像可以壓縮的一個(gè)重要原因。在許多應(yīng)用場(chǎng)合,并不要求經(jīng)壓縮及復(fù)原以后的圖像和原圖像完全相同,而允許有少量失真。只要這些失真并不被人眼所察覺,在許多情況下是完全可以接受的。這種有失真的編碼提供了十分有利的條件。2023/4/10第9頁(yè),共147頁(yè),2023年,2月20日,星期五6)
知識(shí)冗余度:在某些特定的應(yīng)用場(chǎng)合,編碼對(duì)象的某些特性可預(yù)先知道。例如,在可視電話中,編碼對(duì)象為人的頭肩像。這時(shí),可以利用對(duì)編碼對(duì)象的先驗(yàn)知識(shí)為編碼對(duì)象建立模型。通過(guò)提取模型參數(shù),對(duì)參數(shù)進(jìn)行編碼而不對(duì)圖像直接進(jìn)行編碼,可以達(dá)到非常高的壓縮比。這是模型編碼的基本思想。2023/4/10第10頁(yè),共147頁(yè),2023年,2月20日,星期五圖像編碼技術(shù)就是要把種種壓縮的可能性變?yōu)楝F(xiàn)實(shí)。2023/4/10第11頁(yè),共147頁(yè),2023年,2月20日,星期五8.1.4圖像壓縮編碼一般框圖圖像編碼的過(guò)程可以概括成圖1所示的三個(gè)步驟,原始圖像經(jīng)映射變換后的數(shù)據(jù),經(jīng)量化器和熵編碼器成為碼流輸出。圖1圖像壓縮編碼的一般框圖2023/4/10第12頁(yè),共147頁(yè),2023年,2月20日,星期五1)
映射變換映射變換是圖像編碼的一個(gè)核心部分,它決定了量化和編碼的對(duì)象類型,所以可以據(jù)此對(duì)編碼方法進(jìn)行分類。映射變換目的是通過(guò)映射改變圖像數(shù)據(jù)的特性,使之更有利于壓縮編碼。2023/4/10第13頁(yè),共147頁(yè),2023年,2月20日,星期五這樣做的一般優(yōu)于直接對(duì)原圖像進(jìn)行量化編碼。因?yàn)閳D像數(shù)據(jù)在相鄰像素間有較大的相關(guān)性,不管原圖像明暗如何,相鄰像素灰度差總是分布在零附近。進(jìn)一步的統(tǒng)計(jì)表明,差值信號(hào)的分布接近拉普拉斯分布,其標(biāo)準(zhǔn)差比原始圖像的標(biāo)準(zhǔn)差要小的多,因而對(duì)它進(jìn)行量化編碼所需的比特?cái)?shù)就較少。實(shí)際上,求差值的過(guò)程減少了相鄰像素間的相關(guān)性,從而減少了冗余度,因此可以實(shí)現(xiàn)壓縮。2023/4/10第14頁(yè),共147頁(yè),2023年,2月20日,星期五在實(shí)際應(yīng)用中,映射變換的方法種類繁多,還可以更復(fù)雜。如在變換編碼中,先將圖像分成若干個(gè)n×n大小的子塊,然后進(jìn)行映射變換。在這種情況下的映射變換是對(duì)各子塊進(jìn)行某種正交變換。而量化和編碼是對(duì)變換后所得系數(shù)進(jìn)行的。2023/4/10第15頁(yè),共147頁(yè),2023年,2月20日,星期五
2)
量化器
在限失真編碼中要對(duì)映射后的數(shù)據(jù)進(jìn)行量化。若量化是對(duì)映射后的數(shù)據(jù)逐個(gè)地進(jìn)行的,則稱標(biāo)量量化;若量化是成組地進(jìn)行的,則稱為矢量量化。量化器的引入是圖像編碼產(chǎn)生失真的根源。量化總是會(huì)造成某些信息丟失,形成失真,即量化失真或量化噪聲。為使失真小,應(yīng)量化精細(xì),但壓縮比就高不了。這是一對(duì)矛盾,應(yīng)選用恰當(dāng)?shù)牧炕?jí)數(shù)和量化曲線形狀來(lái)緩解矛盾。2023/4/10第16頁(yè),共147頁(yè),2023年,2月20日,星期五值得注意的是,對(duì)于同樣的量化失真,由不同的映射變換與反變換會(huì)引起不同性質(zhì)的復(fù)原圖像的失真,人眼對(duì)某些性質(zhì)的失真敏感而對(duì)另一些性質(zhì)的失真不敏感。2023/4/10第17頁(yè),共147頁(yè),2023年,2月20日,星期五3)
熵編碼器這一步是用來(lái)消除符號(hào)編碼冗余度的。它一般不產(chǎn)生失真。理想的情況是使編出的碼流的平均碼長(zhǎng)等于量化后的數(shù)據(jù)的信息熵。常用的編碼方法有許多種,例如分組碼:行程碼(RLC)和變長(zhǎng)碼(VLC);不分組碼:算術(shù)碼。行程碼傳輸?shù)氖菙?shù)據(jù)塊行程的長(zhǎng)度而不是數(shù)據(jù)本身。例如要傳200個(gè)0,用行程碼時(shí)改為傳行程碼標(biāo)記和行程長(zhǎng)度值“200”。2023/4/10第18頁(yè),共147頁(yè),2023年,2月20日,星期五在變長(zhǎng)碼中最常用的是霍夫曼(Huffman)碼,基本原則是對(duì)出現(xiàn)概率大的數(shù)值用短碼來(lái)編,對(duì)出現(xiàn)概率小的數(shù)值用長(zhǎng)碼來(lái)編,從而使平均碼長(zhǎng)減少,降低碼率。在實(shí)際編碼器中常把RCL和Huffman碼結(jié)合起來(lái),稱為Huffman行程碼,在H.261,JPEG,MPEG等國(guó)際標(biāo)準(zhǔn)中就用到它。而算術(shù)碼則用于JPEG,H.263等國(guó)際標(biāo)準(zhǔn)中。2023/4/10第19頁(yè),共147頁(yè),2023年,2月20日,星期五4)
上述三個(gè)步驟之間是相互聯(lián)系相互制約的對(duì)有些編碼方法,如預(yù)測(cè)編碼或變換編碼,映射變換后數(shù)據(jù)量并沒有減少,甚至因動(dòng)態(tài)范圍的加大而使數(shù)據(jù)量略有增加。但它為后兩步作了準(zhǔn)備,使它們能有效發(fā)揮作用。而在模型編碼中,經(jīng)映射變換后得到的模型參數(shù),其數(shù)據(jù)量已大大小于原始圖像,即第一步已經(jīng)實(shí)現(xiàn)了很大的壓縮。后面的量化編碼則是作進(jìn)一步的壓縮。其情況和變換編碼有很大的不同。2023/4/10第20頁(yè),共147頁(yè),2023年,2月20日,星期五5)
誤碼可能導(dǎo)致碼流結(jié)構(gòu)的變化,從而不能正確解碼如果碼流在信道中傳輸時(shí)產(chǎn)生誤碼,就會(huì)造成復(fù)原圖像質(zhì)量的下降。有時(shí)一個(gè)比特的誤碼會(huì)造成一大片復(fù)原圖像的錯(cuò)誤,這種現(xiàn)象稱誤碼擴(kuò)散現(xiàn)象。按信息論的觀點(diǎn),壓縮得越多、冗余度越小的碼流越難抵抗誤碼的影響。在實(shí)用的圖像編碼算法中必須對(duì)誤碼擴(kuò)散提出制約條件。一個(gè)好的熵編碼器應(yīng)該有自同步能力,能夠在受到誤碼影響后經(jīng)過(guò)一定的碼后仍能自動(dòng)回到正確解碼路徑上來(lái),而不會(huì)死機(jī)或一直錯(cuò)下去。2023/4/10第21頁(yè),共147頁(yè),2023年,2月20日,星期五8.1.5數(shù)字視頻壓縮編碼技術(shù)
數(shù)字視頻壓縮編碼技術(shù)大致可劃分為二代:以香農(nóng)信息論為基礎(chǔ),著眼于圖像信號(hào)的統(tǒng)計(jì)信號(hào)特性來(lái)設(shè)計(jì)編碼器的波形編碼方式,如統(tǒng)計(jì)編碼法、預(yù)測(cè)編碼法、變換編碼法、矢量量化編碼法、子帶-小波編碼法、神經(jīng)網(wǎng)絡(luò)編碼法等,統(tǒng)稱為第一代圖像壓縮編碼技術(shù);而將模型編碼方式,如圖像的輪廓-紋理方法、分形基的編碼方法、模型基編碼等,統(tǒng)稱為第二代圖像壓縮編碼技術(shù)。2023/4/10第22頁(yè),共147頁(yè),2023年,2月20日,星期五第一代的編碼方法具有如下共同特征:①接收端得到的圖像中每一像素,與原始圖像中對(duì)應(yīng)的像素是相似的;②把圖像分解成一些事先確定的固定大小的像素塊,這些塊的劃分方法與圖像內(nèi)容無(wú)關(guān),例如,8×8為一個(gè)像素塊;③通過(guò)運(yùn)動(dòng)補(bǔ)償(MC)技術(shù)減少時(shí)間冗余度,而MC并不考慮圖像內(nèi)容的結(jié)構(gòu);④只利用了人眼視覺(HVS)很少一些特性。2023/4/10第23頁(yè),共147頁(yè),2023年,2月20日,星期五由于人眼視覺系統(tǒng)是一種最優(yōu)的圖像編碼系統(tǒng),人眼視覺特性應(yīng)該與圖像中傳遞的本質(zhì)特征一致,基于模型的編碼方法正是基于這一思路發(fā)展而來(lái)的。1985年正式提出了第二代圖像編碼。2023/4/10第24頁(yè),共147頁(yè),2023年,2月20日,星期五從根本上講,實(shí)行圖像編碼可以分成兩步:第一步,把圖像數(shù)據(jù)變成一個(gè)消息序列;第二步,把碼字分配給這些消息。第一代方法重點(diǎn)在碼字分配。第二代方法則著重于圖像如何表示為消息序列,這時(shí)圖像中被編碼的實(shí)體不再是按像素或像素塊(8×8或16×16)來(lái)劃分,而是按其內(nèi)容進(jìn)行劃分。此外,第二代方法還應(yīng)考慮HVS,其碼率被進(jìn)一步壓縮,質(zhì)量仍達(dá)到人們可接收水平。2023/4/10第25頁(yè),共147頁(yè),2023年,2月20日,星期五8.2熵編碼方法8.2.1基本概念數(shù)據(jù)量是否等于信息量?
數(shù)據(jù)存在冗余(空間冗余、時(shí)間冗余、編碼冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺冗余等)信息量與數(shù)據(jù)量的關(guān)系I=D-du 其中I,D,du分別是信息量、數(shù)據(jù)量、冗余量。2023/4/10第26頁(yè),共147頁(yè),2023年,2月20日,星期五信息和熵信息是用不確定性的量度定的。 一個(gè)消息的可能性愈小,其信息量愈多;而消息的可能性愈大,其信息量愈少。信息量是指從N個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量。例如,要從64個(gè)數(shù)中選定某一個(gè)數(shù),可先提問“是否大于32?”在64個(gè)數(shù)中選定某一個(gè)數(shù)所需的信息量是2023/4/10第27頁(yè),共147頁(yè),2023年,2月20日,星期五設(shè):從N個(gè)數(shù)中選定一個(gè)數(shù)x的概率為P(x),假定選定任意一個(gè)數(shù)的概率都相等,即,因此定義信息量熵:如果將信源所有可能事件的信息量進(jìn)行平均,就得到信息的“熵”(entropy),熵就是平均信息量。2023/4/10第28頁(yè),共147頁(yè),2023年,2月20日,星期五1)
圖像熵(Entropy)
熵是隨機(jī)變量集合的隨機(jī)性程度的度量。最小隨機(jī)的情況是隨機(jī)變量具有概率為1,因而結(jié)果已預(yù)先知道,H=0。2023/4/10第29頁(yè),共147頁(yè),2023年,2月20日,星期五最大隨機(jī)的情況是所有的事件是等可能性的。在此情況下,
并且因此:
對(duì)于M個(gè)隨機(jī)變量的熵可以處在0到的范圍中。2023/4/10第30頁(yè),共147頁(yè),2023年,2月20日,星期五設(shè)圖像像素灰度級(jí)集合為(W1,W2,……,WK,…..,WM),其對(duì)應(yīng)的概率分別為P1,P2,……,PK,…..,PM,則熵H為
(1)
熵值反映了圖像的平均信息量,即圖像中各個(gè)灰度級(jí)比特?cái)?shù)的統(tǒng)計(jì)平均值。熵的單位是位/字符(bitspersymbol)。2023/4/10第31頁(yè),共147頁(yè),2023年,2月20日,星期五
(1)式的前提條件是像素的灰度級(jí)互不相關(guān),即為無(wú)記憶信源熵值,稱為0階熵H0(.);其含義是將一個(gè)輸入序列的每一個(gè)編碼所要求的平均比特?cái)?shù)的界限。對(duì)于有記憶信源,即后續(xù)的輸入不是獨(dú)立的,則對(duì)每一個(gè)輸入來(lái)講,與輸入序列相聯(lián)系的熵小于單獨(dú)輸入之熵。此時(shí),需要考慮聯(lián)合概率密度函數(shù)或條件概率:
(2a)(2b)
2023/4/10第32頁(yè),共147頁(yè),2023年,2月20日,星期五
其含義是將兩個(gè)輸入序列編碼時(shí),即連續(xù)輸入兩個(gè)量化級(jí)而輸出一個(gè)碼字,所需的比特?cái)?shù)的下限。稱為1階熵H1(.)。同理可推得高階熵。2023/4/10第33頁(yè),共147頁(yè),2023年,2月20日,星期五結(jié)論:H0(.)>H1(.)>H2(.)>……
信源熵是進(jìn)行無(wú)失真編碼的理論極限。低于此極限的無(wú)失真編碼方法是不存在的。使用高階熵可以獲得更高的壓縮比。在實(shí)際應(yīng)用中,我們不追求較高階熵的原因:求高階概率所需的計(jì)算量很大;在編碼器中,實(shí)際上執(zhí)行的是一種映射操作,通常將高度相關(guān)的輸入像素變換成一個(gè)較少相關(guān)的系數(shù)集合。2023/4/10第34頁(yè),共147頁(yè),2023年,2月20日,星期五2)
平均碼字長(zhǎng)度設(shè)為數(shù)字圖像第k個(gè)碼字的長(zhǎng)度(二進(jìn)制位數(shù)),概率為,則圖像的平均碼字長(zhǎng)度為2023/4/10第35頁(yè),共147頁(yè),2023年,2月20日,星期五3)
編碼效率與壓縮比
(%)結(jié)論:,總存在某種無(wú)失真編碼方法;,編碼效率低;,必然丟失信息;,為最佳編碼。2023/4/10第36頁(yè),共147頁(yè),2023年,2月20日,星期五4)
變長(zhǎng)最佳編碼定理—哈夫曼編碼的理論基礎(chǔ)出現(xiàn)概率大的信息符號(hào)賦予短碼字,出現(xiàn)概率小的信息符號(hào)賦予長(zhǎng)碼字;按出現(xiàn)概率的大小逆序排列,則編碼結(jié)果平均碼字長(zhǎng)度一定小于任何其它排列方式。2023/4/10第37頁(yè),共147頁(yè),2023年,2月20日,星期五5)
可變長(zhǎng)度最佳編碼的平均碼字長(zhǎng)度R—香農(nóng)編碼的理論基礎(chǔ)設(shè)D為碼元進(jìn)制,N為被編碼的信息符號(hào)總數(shù),為第個(gè)符號(hào)出現(xiàn)的概率,則R落在下列區(qū)域內(nèi):
式中
設(shè)為個(gè)符號(hào)的碼字長(zhǎng)度,則
2023/4/10第38頁(yè),共147頁(yè),2023年,2月20日,星期五對(duì)于二進(jìn)制碼進(jìn)一步簡(jiǎn)化成:上式說(shuō)明:碼字長(zhǎng)度由信息符號(hào)出現(xiàn)的概率來(lái)決定。2023/4/10第39頁(yè),共147頁(yè),2023年,2月20日,星期五6)
續(xù)長(zhǎng)代碼和非續(xù)長(zhǎng)代碼非續(xù)長(zhǎng)代碼:在代碼中任何一個(gè)碼字都不是另一個(gè)碼字的續(xù)長(zhǎng),即不能在某一個(gè)碼字后面添加一些碼元構(gòu)成另一個(gè)碼字。如[0,10,11]為非續(xù)長(zhǎng)代碼;[0,01,11]續(xù)長(zhǎng)代碼。2023/4/10第40頁(yè),共147頁(yè),2023年,2月20日,星期五7)
單義代碼任何有限長(zhǎng)的碼字序列,只能唯一地分割成一個(gè)個(gè)碼字。說(shuō)明:非續(xù)長(zhǎng)代碼一定是單義代碼,但單義代碼不一定是非續(xù)長(zhǎng)代碼。2023/4/10第41頁(yè),共147頁(yè),2023年,2月20日,星期五8.2.2哈夫曼編碼
哈夫曼編碼的平均碼字長(zhǎng)度比其它任何一種唯一可譯碼都小,即稱緊湊碼。步驟:1)
將輸入灰度級(jí)按概率大小由大到小排序;2)
將最小的兩個(gè)概率相加得到一個(gè)新的概率集合,重復(fù)第1步,直到只有兩個(gè)概率集合為止。3)
反向分配碼字。
2023/4/10第42頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.042023/4/10第43頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.12023/4/10第44頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.12023/4/10第45頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.32023/4/10第46頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.42023/4/10第47頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.401010101012023/4/10第48頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=12023/4/10第49頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S2=002023/4/10第50頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=0112023/4/10第51頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=01002023/4/10第52頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=010102023/4/10第53頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=010112023/4/10第54頁(yè),共147頁(yè),2023年,2月20日,星期五Huffman編碼討論(1)Huffman編碼是唯一可譯碼。短的碼不會(huì)成為更長(zhǎng)碼的啟始部分;(2)Huffman編碼的平均碼長(zhǎng)接近于熵;(3)缺點(diǎn):需要多次排序,耗費(fèi)時(shí)間。2023/4/10第55頁(yè),共147頁(yè),2023年,2月20日,星期五8.2.3香農(nóng)編碼
步驟:1)
按概率大小由大到小排序;2)
按概率對(duì)應(yīng)的碼字長(zhǎng)度的計(jì)算公式計(jì)算;3)
計(jì)算累加概率:4)
將累加概率轉(zhuǎn)換成二進(jìn)制數(shù)表示;5)去掉二進(jìn)制表示的累加概率中多于的尾數(shù),即得香農(nóng)編碼的碼字。2023/4/10第56頁(yè),共147頁(yè),2023年,2月20日,星期五8.2.4算術(shù)編碼基本思想:用[0,1]的線段上的一個(gè)區(qū)間表示一個(gè)符號(hào)序列,其長(zhǎng)度等于這個(gè)序列的概率。因?yàn)樗行蛄懈怕屎蜑?,所以對(duì)應(yīng)于所有可能序列的區(qū)間將填滿整個(gè)線段。一個(gè)序列的編碼比特實(shí)際上就變成對(duì)應(yīng)的區(qū)間中任何一點(diǎn)的二進(jìn)制表示。
2023/4/10第57頁(yè),共147頁(yè),2023年,2月20日,星期五例如,對(duì)于最簡(jiǎn)單的二值符號(hào)序列,假設(shè)“a1”的發(fā)生概率為p,則“a2”的發(fā)生概率為q=1-p,如果按先a1后a2的順序劃分對(duì)應(yīng)的子區(qū)間為:
長(zhǎng)度為2的符號(hào)序列對(duì)應(yīng)的子區(qū)間為:
2023/4/10第58頁(yè),共147頁(yè),2023年,2月20日,星期五符號(hào):00011011概率0.10.40.20.3初始間隔[0,0.1)[0.1,0.5)[0.5,0.7)[0.7,1)消息序列100011001011012023/4/10第59頁(yè),共147頁(yè),2023年,2月20日,星期五依此類推,可見隨著輸入符號(hào)的增多,序列不斷加長(zhǎng),其概率不斷減少,和序列相聯(lián)系的子區(qū)間的寬度逐漸變窄。
特點(diǎn):在算術(shù)編碼中,字母表中的符號(hào)和碼字間不再存在一一對(duì)應(yīng)關(guān)系,而是單個(gè)可變長(zhǎng)的碼字賦給由N個(gè)符號(hào)組成的信源符號(hào)序列,這里N也是可變的。2023/4/10第60頁(yè),共147頁(yè),2023年,2月20日,星期五8.2.5其它壓縮編碼方法2023/4/10第61頁(yè),共147頁(yè),2023年,2月20日,星期五1)
行程編碼RLE(RunLengthEncoding)
圖像中經(jīng)常包含一些區(qū)域,尤其是那些包含很少幾個(gè)灰度級(jí)的圖像,它們是由具有相同顏色或灰度的相鄰像素組成的。在一個(gè)逐行存儲(chǔ)的圖像中,具有相同灰度值的一些像素的序列,稱為一個(gè)行程。RLE編碼方法得到的代碼為:“80315084180”2023/4/10第62頁(yè),共147頁(yè),2023年,2月20日,星期五
RLE只用存一個(gè)代表那個(gè)灰度值的碼,另一個(gè)是行程的長(zhǎng)度,而不必將相同的灰度值存很多很多次??梢韵胂瘢簩?duì)于單一顏色背景可以達(dá)到很高的壓縮比,但對(duì)其它類型的圖像壓縮比很低,最壞的情況,每一個(gè)像素都與它周圍的像素不同,文件長(zhǎng)度加倍。2023/4/10第63頁(yè),共147頁(yè),2023年,2月20日,星期五2)
跳過(guò)白塊編碼(WBS)
對(duì)于二值圖像,目標(biāo)像素(設(shè)目標(biāo)像素為黑像素)占整幅圖像總像素往往是很少一部分。因此,若能跳過(guò)白塊,只對(duì)黑像素編碼,比特?cái)?shù)將減少。2023/4/10第64頁(yè),共147頁(yè),2023年,2月20日,星期五一維WBS的方法:將每一掃描行等分成若干段,設(shè)每段有N個(gè)像素。若某段N個(gè)像素均為白色,則編碼為“0”
若某段N個(gè)像素不全為白色,則用N+1個(gè)bit“1(段的自然編碼)”來(lái)編碼。人為增加一比特“1”碼元是為了構(gòu)成非續(xù)長(zhǎng)代碼。2023/4/10第65頁(yè),共147頁(yè),2023年,2月20日,星期五二維WBS:是一維WBS的推廣,將圖像劃分成若干個(gè)的塊。自適應(yīng)WBS:根據(jù)圖像的局部結(jié)構(gòu)或統(tǒng)計(jì)特性,改變像素塊的大小,以獲得更少的編碼比特?cái)?shù)。2023/4/10第66頁(yè),共147頁(yè),2023年,2月20日,星期五3)比特平面編碼思想:對(duì)于灰度或彩色圖像,如果每個(gè)像素用k位表示,將相同位上的0,1取出,就可以形成k個(gè)N*N的二值圖像。將每一個(gè)二值圖像稱為一個(gè)比特平面。方法:對(duì)于比特平面采用前述的無(wú)失真二值圖像壓縮技術(shù)。2023/4/10第67頁(yè),共147頁(yè),2023年,2月20日,星期五Lena圖像的比特平面2023/4/10第68頁(yè),共147頁(yè),2023年,2月20日,星期五8.3預(yù)測(cè)編碼方法
上面介紹的方法主要屬于統(tǒng)計(jì)編碼方法。統(tǒng)計(jì)編碼是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼,是一種無(wú)損壓縮編碼。這種編碼的關(guān)鍵在于:在消息和碼字之間找到明確的一一對(duì)應(yīng)關(guān)系,以便在恢復(fù)時(shí)能準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái),或者至少是極相似地找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系,并把這種失真或不對(duì)應(yīng)概率限制到可容忍的范圍內(nèi)。統(tǒng)計(jì)編碼的根本目的是使平均碼長(zhǎng)或碼率壓到最低限度,也就是減少編碼冗余。2023/4/10第69頁(yè),共147頁(yè),2023年,2月20日,星期五在壓縮編碼中,通常是通過(guò)給出現(xiàn)概率最大的符號(hào)賦上最短的碼字來(lái)減少編碼冗余,最常用的是變長(zhǎng)碼,變長(zhǎng)編碼的信源符號(hào)與碼字是一一對(duì)應(yīng)的,因此再現(xiàn)也是準(zhǔn)確無(wú)誤的,它在編譯碼過(guò)程中并不損失任何信息,屬于冗余壓縮法。統(tǒng)計(jì)編碼中常用的編碼有哈夫曼編碼、算術(shù)編碼、行程編碼等。2023/4/10第70頁(yè),共147頁(yè),2023年,2月20日,星期五預(yù)測(cè)編碼的基本思想是通過(guò)提取每個(gè)像素中的信息并對(duì)它們編碼來(lái)消除像素間的冗余,它是根據(jù)離散信號(hào)之間存在一定關(guān)聯(lián)性的特點(diǎn),利用前面一個(gè)或者多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)的差值(預(yù)測(cè)誤差)進(jìn)行編碼。2023/4/10第71頁(yè),共147頁(yè),2023年,2月20日,星期五如果預(yù)測(cè)比較準(zhǔn)確,那么誤差信號(hào)就會(huì)很小。這樣一來(lái),在同等精度要求條件下,就可以用較少的比特進(jìn)行編碼,達(dá)到數(shù)據(jù)壓縮的目的。預(yù)測(cè)編碼也成為差分脈沖編碼調(diào)制(DPCM),既可以在1幀圖像內(nèi)進(jìn)行幀內(nèi)預(yù)測(cè)編碼,也可以在多幀圖像之間進(jìn)行幀間預(yù)測(cè)編碼。預(yù)測(cè)編碼的基本技術(shù)是信號(hào)的最佳預(yù)測(cè)和最佳量化。2023/4/10第72頁(yè),共147頁(yè),2023年,2月20日,星期五1)
DPCM(差值脈沖編碼調(diào)制)基本原理
預(yù)測(cè)編碼是根據(jù)某一種模型,利用以前的(已收到)一個(gè)或幾個(gè)樣值,對(duì)當(dāng)前的(正在接收的)樣本值進(jìn)行預(yù)測(cè),對(duì)當(dāng)前樣本實(shí)際值和預(yù)測(cè)值之差(差值)進(jìn)行編碼。顯然如果模型足夠好,圖像樣本時(shí)間上相關(guān)性很強(qiáng),一定可以獲得較高的壓縮比。2023/4/10第73頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第74頁(yè),共147頁(yè),2023年,2月20日,星期五基于相鄰像素之間的相關(guān)性強(qiáng)的特點(diǎn),利用時(shí)刻前已知像素的灰度,對(duì)作預(yù)測(cè)得。差值,將作為量化器的輸入信號(hào),則量化器的輸出信號(hào)。量化誤差。2023/4/10第75頁(yè),共147頁(yè),2023年,2月20日,星期五設(shè)接收端輸出為,則收發(fā)兩端像素值之差為上式說(shuō)明:DPCM系統(tǒng)的誤差來(lái)源于量化器的誤差。設(shè),則為信息保持編碼;設(shè),且在一定的允許范圍內(nèi),則為保真度編碼;若在均方誤差最小的準(zhǔn)則下,則稱為最佳線性預(yù)測(cè)。2023/4/10第76頁(yè),共147頁(yè),2023年,2月20日,星期五2)
DPCM預(yù)測(cè)方法
前值預(yù)測(cè):通過(guò)來(lái)預(yù)測(cè)
一維預(yù)測(cè):通過(guò)同一掃描行的前若干個(gè)已知像素來(lái)預(yù)測(cè)
二維預(yù)測(cè):通過(guò)同一掃描行和前幾掃描行的前若干個(gè)已知像素來(lái)預(yù)測(cè)
三維預(yù)測(cè):通過(guò)二維預(yù)測(cè)+前幾幀的幀間預(yù)測(cè)2023/4/10第77頁(yè),共147頁(yè),2023年,2月20日,星期五3)
最佳量化器的設(shè)計(jì)
設(shè)為輸入灰度圖像,是量化值圖像,為輸入圖像灰度概率密度函數(shù),,于是有。設(shè)量化的總層數(shù)為,其中為判決電平,當(dāng)時(shí),設(shè)量化值為,量化誤差為。2023/4/10第78頁(yè),共147頁(yè),2023年,2月20日,星期五令,,可求得2023/4/10第79頁(yè),共147頁(yè),2023年,2月20日,星期五最佳量化器的結(jié)論:
當(dāng)常數(shù)時(shí),;當(dāng)不是常數(shù)時(shí),即是量化值間的中間值,而每一個(gè)是子區(qū)間上由構(gòu)成的曲邊梯形的形心。2023/4/10第80頁(yè),共147頁(yè),2023年,2月20日,星期五8.4
圖像變換編碼圖像信號(hào)一般具有較強(qiáng)的相關(guān)性,如果所選用的正交矢量空間的基矢量與圖像本身的主要特征很接近,那么在這種正交矢量空間中描述這一圖像信號(hào)將會(huì)更簡(jiǎn)單些。從本質(zhì)上說(shuō),圖像經(jīng)過(guò)正交變換后之所以能夠?qū)崿F(xiàn)數(shù)據(jù)壓縮,是因?yàn)榻?jīng)過(guò)多維坐標(biāo)系適當(dāng)?shù)男D(zhuǎn)變換后,把散布在各個(gè)原坐標(biāo)軸上的原始圖像數(shù)據(jù)集中到新坐標(biāo)系中的少數(shù)坐標(biāo)軸上了,從而為后繼的量化和編碼提供了高效數(shù)據(jù)壓縮的可能性。2023/4/10第81頁(yè),共147頁(yè),2023年,2月20日,星期五以二維傅立葉變換來(lái)說(shuō),頻譜幅值大的變換系數(shù)均集中在低頻部分,這幾乎占去了圖像信息的90%,而高頻部分均很小或趨于零。因而,我們完全可以對(duì)低頻的變換系數(shù)采用量化、編碼、傳輸,而高頻部分既不編碼也不傳輸,達(dá)到圖像數(shù)據(jù)壓縮的目的。早期的圖像變換編碼就是采用傅立葉變換進(jìn)行的,由于它有快速算法且容易在硬件中實(shí)現(xiàn),所以獲得了一定范圍的應(yīng)用。2023/4/10第82頁(yè),共147頁(yè),2023年,2月20日,星期五從數(shù)學(xué)角度看,可以提供許多正交變換的方法來(lái)應(yīng)用于圖像的壓縮編碼。除了傅立葉變換、Walsh-Hadmard變換以外,還有正弦變換、余弦變換、斜變換、K-L變換等。不同的變換會(huì)有不同的壓縮效果(主要是壓縮比和重建圖像品質(zhì)),以傅立葉變換為例,高頻信息去除越多,越有可能活得更大的壓縮比,但與此同時(shí)卻降低了重建圖像的分辨率。數(shù)學(xué)證明,采用均方差最小準(zhǔn)則,K-L變換具有最佳變換性質(zhì),而且隨著子圖像塊分割大小不同,誤差大小也不同。經(jīng)比較可以發(fā)現(xiàn),余弦變換的均方差最接近K-L變換,因而在目前所采用的變換編碼方法中,余弦變換是應(yīng)用最為廣泛的一種。2023/4/10第83頁(yè),共147頁(yè),2023年,2月20日,星期五數(shù)學(xué)證明,采用均方差最小準(zhǔn)則,K-L變換具有最佳變換性質(zhì),而且隨著子圖像塊分割大小不同,誤差大小也不同。經(jīng)比較可以發(fā)現(xiàn),余弦變換的均方差最接近K-L變換,因而在目前所采用的變換編碼方法中,余弦變換是應(yīng)用最為廣泛的一種。2023/4/10第84頁(yè),共147頁(yè),2023年,2月20日,星期五
1.思路:先將空間域圖像通過(guò)某種正交變換,獲得一系列變換系數(shù)。在變換過(guò)程中,使圖像變換系數(shù)能量相對(duì)集中,再對(duì)其變換系數(shù),進(jìn)行區(qū)域量化,按其所含能量大小,分配以不同的數(shù)據(jù)量(比特?cái)?shù))去描述,如高能量區(qū)域賦予多比特,反之,則短的比特?cái)?shù),這樣可以提高壓縮比。2.變換編碼原理框圖:2023/4/10第85頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第86頁(yè),共147頁(yè),2023年,2月20日,星期五問題:(1)分塊大?。?)變換方式(3)比特分配(4)編碼方案優(yōu)點(diǎn):(1)壓縮比高(2)視覺感覺好缺點(diǎn):計(jì)算復(fù)雜。2023/4/10第87頁(yè),共147頁(yè),2023年,2月20日,星期五3.
一種變換是否適用于數(shù)據(jù)壓縮,既取決于變換本身,又取決于被壓縮圖像的性質(zhì)。實(shí)用的方案不僅要考慮所能獲得的壓縮比,而且要考慮編碼解碼的計(jì)算量。因此,一種變換如果具有快速算法,那無(wú)疑是具有吸引力。
2023/4/10第88頁(yè),共147頁(yè),2023年,2月20日,星期五4.
變換編碼是一種圖像有損編碼。在能達(dá)到的壓縮比和信息損失之間存在一個(gè)折衷。一般情況下,人眼是信息丟失能否接受的最終裁判。對(duì)圖像失真的定量計(jì)算,如均方誤差,往往和人眼的主觀感覺不一致。2023/4/10第89頁(yè),共147頁(yè),2023年,2月20日,星期五5.
JPEG編碼標(biāo)準(zhǔn)簡(jiǎn)介
JPEG(JointPhotographicExpertsGroup)是一個(gè)由ISO和CCITT兩個(gè)組織機(jī)構(gòu)聯(lián)合組成的一個(gè)圖像專家小組,負(fù)責(zé)制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn),這個(gè)專家組開發(fā)的算法稱為JPEG算法,并且成為國(guó)際上通用的標(biāo)準(zhǔn)。JPEG是一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),既可用于灰度圖像又可用于彩色圖像。JPEG不僅適于靜止圖像的壓縮,電視圖像的幀內(nèi)圖像的壓縮編碼,也常采用此算法。JPEG標(biāo)準(zhǔn)還可以大范圍地調(diào)節(jié)圖像壓縮率及其保真度。2023/4/10第90頁(yè),共147頁(yè),2023年,2月20日,星期五標(biāo)準(zhǔn)主要采用了兩種基本的壓縮算法,一種是采用以離散余弦變換(DCT)為基礎(chǔ)的有損壓縮算法,另一種是采用以預(yù)測(cè)技術(shù)為基礎(chǔ)的DPCM無(wú)損壓縮算法。JPEG規(guī)定了4種運(yùn)行模式,以滿足不同需要:基于DPCM的無(wú)損編碼模式:壓縮比可以達(dá)到2:1?;贒CT的有損順序編碼模式:壓縮比可以達(dá)到10:1以上?;贒CT的遞增編碼模式基于DCT的分層編碼模式2023/4/10第91頁(yè),共147頁(yè),2023年,2月20日,星期五JPEG有損順序編碼算法的主要計(jì)算步驟如下:1.將源圖像分成幾個(gè)顏色平面(分量圖像)。2.分成8×8數(shù)據(jù)塊進(jìn)行正向離散余弦變換(FDCT)。2.量化(quantization)。3.Z字形排列量化結(jié)果(zigzagscan)。4.使用差分脈沖編碼調(diào)制(differentialpulsecodemodulation,DPCM)對(duì)直流系數(shù)(DC)進(jìn)行編碼。5.使用行程長(zhǎng)度編碼(run-lengthencoding,RLE)對(duì)交流系數(shù)(AC)進(jìn)行編碼。6.熵編碼(entropycoding)。2023/4/10第92頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第93頁(yè),共147頁(yè),2023年,2月20日,星期五解壓縮的過(guò)程與壓縮編碼過(guò)程正好相反。2023/4/10第94頁(yè),共147頁(yè),2023年,2月20日,星期五離散余弦變換對(duì)每個(gè)單獨(dú)的彩色圖像分量,把整個(gè)分量圖像分成8×8的圖像塊,如圖所示,并作為兩維離散余弦變換DCT的輸入。通過(guò)DCT變換,把能量集中在少數(shù)幾個(gè)系數(shù)上。2023/4/10第95頁(yè),共147頁(yè),2023年,2月20日,星期五量化對(duì)于有損壓縮算法,JPEG算法使用如圖所示的均勻量化器進(jìn)行量化,量化步距是按照系數(shù)所在的位置和每種顏色分量的色調(diào)值來(lái)確定。
2023/4/10第96頁(yè),共147頁(yè),2023年,2月20日,星期五因?yàn)槿搜蹖?duì)亮度信號(hào)比對(duì)色差信號(hào)更敏感,因此使用了兩種量化表:亮度量化值和色差量化值。此外,由于人眼對(duì)低頻分量的圖像比對(duì)高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。2023/4/10第97頁(yè),共147頁(yè),2023年,2月20日,星期五DC系數(shù)DPCM編碼和AC系數(shù)Z形排列之后采用RLE編碼2023/4/10第98頁(yè),共147頁(yè),2023年,2月20日,星期五熵編碼使用熵編碼還可以對(duì)DPCM編碼后的直流DC系數(shù)和RLE編碼后的交流AC系數(shù)作進(jìn)一步的壓縮。JPEG標(biāo)準(zhǔn)規(guī)定了兩種熵編碼算法:哈夫曼編碼和自適應(yīng)算術(shù)編碼。哈夫曼編碼采用的一般是固定的哈夫曼編碼表,而不是臨時(shí)統(tǒng)計(jì)出來(lái)的,并且對(duì)亮度分量和色度分量采用了不同的哈夫曼表。2023/4/10第99頁(yè),共147頁(yè),2023年,2月20日,星期五基于DPCM的無(wú)損編碼模式:主要采用了三鄰域二維預(yù)測(cè)編碼和熵編碼?;贒CT的遞增編碼模式:此模式與順序模式編碼步驟基本一致,不同之處在于遞增模式每個(gè)圖像分量的編碼要經(jīng)過(guò)多次掃描才完成。第一次掃描只進(jìn)行一次粗糙的壓縮,然后根據(jù)此數(shù)據(jù)先重建一幅質(zhì)量低的圖像,以后的掃描再作較細(xì)的掃描,使重建圖像質(zhì)量不斷提高,直到滿意為止。遞增模式分為兩種:(1)按頻段累進(jìn)。(2)按位累進(jìn)。2023/4/10第100頁(yè),共147頁(yè),2023年,2月20日,星期五基于DCT的分層編碼模式:(1)降低原始圖像的空間分辨率。(2)對(duì)已經(jīng)降低分辨率的圖像按照順序編碼模式進(jìn)行壓縮并存儲(chǔ)或傳輸。(3)對(duì)低分辨率圖像進(jìn)行解碼,然后用插值法提高圖像的分辨率。(4)將分辨率已經(jīng)升高的圖像作為原圖像的預(yù)測(cè)值,并把它與原圖像的差值進(jìn)行基于DCT的編碼。(5)重復(fù)步驟3、4直到圖像達(dá)到完整的分辨率。2023/4/10第101頁(yè),共147頁(yè),2023年,2月20日,星期五靜止圖像編碼國(guó)際標(biāo)準(zhǔn)JPEG壓縮率9.22023/4/10第102頁(yè),共147頁(yè),2023年,2月20日,星期五壓縮率18.42023/4/10第103頁(yè),共147頁(yè),2023年,2月20日,星期五壓縮率51.62023/4/10第104頁(yè),共147頁(yè),2023年,2月20日,星期五8.5分形編碼8.5.1概述分形編碼方法的目的是挖掘自然物體(比如天空、云霧、森林等)在結(jié)構(gòu)上的自相似性,這種自相似性是圖像整體與局部相關(guān)性的表現(xiàn)。分形壓縮利用分形幾何中的自相似性原理,首先對(duì)圖像進(jìn)行分塊,然后尋找各塊之間的相似性。這里的相似性的描述主要是依靠仿射變換來(lái)確定,一旦找到了每塊的仿射變換的系數(shù),因而圖像得以大幅度的壓縮。2023/4/10第105頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第106頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第107頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第108頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第109頁(yè),共147頁(yè),2023年,2月20日,星期五2023/4/10第110頁(yè),共147頁(yè),2023年,2月20日,星期五分形編碼的最顯著的特點(diǎn)是自相似性,與經(jīng)典方法相比,它不但去除了數(shù)據(jù)之間的局部相關(guān)性,而且去除了整體與局部之間的相關(guān)性,所以分形編碼以其獨(dú)特新穎的思想,有望達(dá)到經(jīng)典編碼方法所達(dá)不到的壓縮比,是一種思想全新、很有潛力的編碼技術(shù),成為目前數(shù)據(jù)壓縮領(lǐng)域的研究熱點(diǎn)之一。2023/4/10第111頁(yè),共147頁(yè),2023年,2月20日,星期五8.5.2分形結(jié)構(gòu)具有的特點(diǎn)(1)具有某種形式的自相似性或自仿射性.
(2)具有任意小的比例細(xì)節(jié).
(3)極不規(guī)則、極不光滑.
(4)沒有特定尺寸,無(wú)法用函數(shù)描述其形狀,但可用迭代方程刻劃其產(chǎn)生過(guò)程.
可見,分形幾何研究的對(duì)象和方法與歐氏幾何截然不同。分形幾何較適合于研究像云彩、地貌、樹木和海浪等等的自然現(xiàn)象。2023/4/10第112頁(yè),共147頁(yè),2023年,2月20日,星期五8.5.3分形編碼的理論基礎(chǔ)――迭代函數(shù)系統(tǒng)理論IFS給定一個(gè)完備度量空間(F,d),變換是一個(gè)壓縮變換,若存在正實(shí)數(shù)s(0<s<1)使其中s叫做壓縮因子。對(duì)于一個(gè)壓縮變換w,由壓縮變換不動(dòng)點(diǎn)定理可知,存在一個(gè)的不動(dòng)點(diǎn)或吸引子,使及
式中,,即x的n次w變換。2023/4/10第113頁(yè),共147頁(yè),2023年,2月20日,星期五于是,迭代函數(shù)系統(tǒng)理論說(shuō)明,對(duì)于一幅數(shù)字圖像F,若能找到一系列壓縮變換(代表其自相似性)構(gòu)成的一個(gè)以F為不動(dòng)點(diǎn)的壓縮變換W,則可用該變換代表該圖像,并可通過(guò)任意給定的初始圖像F0,經(jīng)過(guò)足夠多次的變換后,最終將逼近F。若表示這個(gè)變換所需要的數(shù)據(jù)量小于F的數(shù)字量,就可以起到圖像壓縮的作用。2023/4/10第114頁(yè),共147頁(yè),2023年,2月20日,星期五8.5.4編碼方法:分形圖像編碼的具體實(shí)現(xiàn)可分為對(duì)原始圖像進(jìn)行分塊、尋找合適的局部IFS以及分形變換參數(shù)編碼三個(gè)步驟。
首先將原始圖像劃分成一系列互不重疊的大小的值域塊和一系列可以有部分重疊的大小的定義域塊,為了滿足壓縮變換的要求,這里。
2023/4/10第115頁(yè),共147頁(yè),2023年,2月20日,星期五根據(jù)拼貼定理,為了利用和尋找自仿射性,對(duì)每個(gè)值域塊在整幅圖像尋找一個(gè)定義域塊,使定義在上的圖像經(jīng)過(guò)適當(dāng)?shù)姆律渥儞Q后,與上的圖像在Hausdorff測(cè)度下盡可能地接近,即。于是我們有IFS{}:
其中表示圖像曲面,表示劃分值域塊的個(gè)數(shù)。
2023/4/10第116頁(yè),共147頁(yè),2023年,2月20日,星期五在灰度圖像的分形壓縮方案中一般把它看作平面上二維仿射變換和方向上線性逼近的組合,即采用如下的仿射變換:
然而,直接獲取、量化和存儲(chǔ)這些系數(shù)較為困難。2023/4/10第117頁(yè),共147頁(yè),2023年,2月20日,星期五因此常用一個(gè)等價(jià)的組合變換來(lái)代替,即:
式中是尺度壓縮變換,將大小為的映射成大小為的塊;為旋轉(zhuǎn)和對(duì)折變換,一般將其取為8種變換,即圍繞中心旋轉(zhuǎn)、、、和沿垂直中心軸、水平軸、主對(duì)角線、次對(duì)角線的4種對(duì)折;為灰度處理算子,包含比例因子和灰度補(bǔ)償因子。
2023/4/10第118頁(yè),共147頁(yè),2023年,2月20日,星期五設(shè)的第個(gè)像素的值為,的第個(gè)像素的值為,則的分形編碼過(guò)程就是尋找合適的、和,使Hausdorff距離最小。由于Hausdorff距離計(jì)算的復(fù)雜性,一般以歐氏距離代替,即使
最小。式中,為值域塊的平均灰度值,為縮小后定義域塊的平均灰度值。2023/4/10第119頁(yè),共147頁(yè),2023年,2月20日,星期五分形圖像編碼就是對(duì)每個(gè)值域塊尋找最佳仿射變換和定義域塊,并將變換參數(shù)和位置參數(shù)進(jìn)行編碼、傳輸和存儲(chǔ)。在解碼時(shí),則任取一初始圖像,然后按照上述分形參數(shù),對(duì)每個(gè)值域塊,用其對(duì)應(yīng)的定義域塊的仿射變換去代替,并不斷迭代,這種迭代只需有限次即可收斂(一般需8次迭代)。
2023/4/10第120頁(yè),共147頁(yè),2023年,2月20日,星期五8.6子帶編碼8.6.1概述
Woods和O’Neil首先將子帶編碼引入圖像編碼中,他們將一維子帶濾波器擴(kuò)展到二維空域并導(dǎo)出了相應(yīng)的分析/綜合結(jié)構(gòu);也就是說(shuō),圖像的子帶編碼是把圖像分割成多個(gè)子帶,對(duì)各子帶獨(dú)立編碼,再綜合輸出。在分析/綜合器的設(shè)計(jì)上,均采用具有混疊抵消特性的濾波器組,其中最著名是正交鏡像濾波器QMF,可實(shí)現(xiàn)近似理想的子帶分割。
2023/4/10第121頁(yè),共147頁(yè),2023年,2月20日,星期五8.6.2子帶編碼設(shè)一維信號(hào)分別通過(guò)兩個(gè)沖擊響應(yīng)為,的濾波器,分解成低頻分量,,如圖所示。和兩個(gè)子帶信號(hào)數(shù)據(jù)量和原信號(hào)相同,
是2:1亞采樣;在接受端將各子帶信號(hào)先用進(jìn)行補(bǔ)零,使每個(gè)子帶信號(hào)都能與全信號(hào)同長(zhǎng),然后分別用合成濾波器和進(jìn)行內(nèi)插,最后相加得到重建信號(hào)。
2023/4/10第122頁(yè),共147頁(yè),2023年,2月20日,星期五由于子帶信號(hào),應(yīng)各自代表的低頻分量和高頻分量,因而這種分解先應(yīng)是正交的,以利于編碼壓縮;其次它們應(yīng)當(dāng)是完全的,即應(yīng)能將,中的混疊成分抵消得到完全恢復(fù)的信號(hào);同時(shí)濾波器還應(yīng)滿足線性相移條件,以使子帶信號(hào)沒有相位失真,而正交鏡相濾波器QMF正能滿足上述三個(gè)條件。
2023/4/10第123頁(yè),共147頁(yè),2023年,2月20日,星期五不難得出用QMF進(jìn)行子帶編碼分解與合成,最終只歸結(jié)為同一個(gè)低通濾波器的設(shè)計(jì)與復(fù)用,,,由下式得到
。2023/4/10第124頁(yè),共147頁(yè),2023年,2月20日,星期五對(duì)二維圖像信號(hào),采用可分解濾波器分兩步分解,每一步在一個(gè)方向上(行、列)將圖像分解成兩個(gè)子帶。下圖給出了二維倍頻程子帶分解的頻譜分布。將原圖像分解成屬于不同頻帶、不同方向的子帶圖像后,就能根據(jù)各子帶圖像的特性,分別對(duì)各子帶圖像進(jìn)行壓縮編碼。
2023/4/10第125頁(yè),共147頁(yè),2023年,2月20日,星期五LL分量最重要,應(yīng)該精確地編碼。一般可用DPCM,DCT等方法,量化也要精細(xì)一些。高頻分量的重要性差一些,不適合于用DCT編碼,量化后的數(shù)據(jù)可用Huffman行程碼來(lái)編碼來(lái)編碼,行程越長(zhǎng),編碼效率越高,所以根據(jù)各高頻子帶圖像內(nèi)含有不同邊的類型,可用不同的掃描方法加以展開,以提高平均行程的長(zhǎng)度。HL含水平邊,可按水平方向掃描展開;LH含垂直邊,可按垂直方向掃描展開;HH含斜邊,可按Z字形掃描展開。2023/4/10第126頁(yè),共147頁(yè),2023年,2月20日,星期五8.7小波編碼小波變換和子帶分解的主要方法上是基本相同的。因此,對(duì)小波變換系數(shù)的編碼,和對(duì)子帶的編碼方法也是相似的,對(duì)子帶的編碼方法都適用于對(duì)小波變換系數(shù)的編碼。在變換編碼中,經(jīng)過(guò)量化后,會(huì)出現(xiàn)較多取值為零的系數(shù),這些零系數(shù)大多分布于高頻部分,因此可以采用z形掃描它們連接在一起,并采用游程編碼,以提高編碼效率。同樣,采用適當(dāng)?shù)牧炕桨噶炕?,小波系?shù)中也會(huì)出現(xiàn)若干零系數(shù),但在各個(gè)尺度(子帶)中,零系數(shù)的分布并無(wú)固定的規(guī)律可循,因此需要采用另外的方法對(duì)各個(gè)系數(shù)的幅度和位置進(jìn)行編碼。
2023/4/10第127頁(yè),共147頁(yè),2023年,2月20日,星期五這里主要介紹一種被認(rèn)為最為有效的小波系數(shù)編碼方法_零樹編碼,或稱嵌入式零樹小波編碼(EZW,EmbeddedZerotreeWaveletCoding).一、
系數(shù)重要性圖與零樹零樹編碼的基本思路是:將對(duì)小波系數(shù)的編碼分解為對(duì)標(biāo)志系數(shù)特性的系數(shù)重要性圖的編碼和對(duì)重要系數(shù)的幅度編碼兩部分,利用不同尺度的小波系數(shù)間存在的較強(qiáng)的相關(guān)性,將多數(shù)的零系數(shù)組織成一種樹形結(jié)構(gòu),從而提高了總體編碼效率。
2023/4/10第128頁(yè),共147頁(yè),2023年,2月20日,星期五1.
系數(shù)重要性給定一個(gè)小波系數(shù)x和一個(gè)適當(dāng)?shù)拈撝礣,如果小于T,我們說(shuō)該系數(shù)是不重要的,即可將其看作零;否則,是重要的,即需要對(duì)其值進(jìn)行編碼。于是,每個(gè)小波系數(shù)都被賦予這樣一個(gè)屬性,而每個(gè)不同尺度的子圖像都對(duì)應(yīng)這樣一幅由屬性構(gòu)成的圖,這就是系數(shù)重要性圖。2023/4/10第129頁(yè),共147頁(yè),2023年,2月20日,星期五2.
不同尺度間系數(shù)的關(guān)系描述按照小波分解的規(guī)律,大尺度子帶圖像的系數(shù)和小尺度的系數(shù)在空間上有對(duì)應(yīng)關(guān)系。具體地,把一個(gè)大尺度系數(shù)叫做父系數(shù),在同一方向上下一個(gè)小尺度圖像中同一空間位置上對(duì)應(yīng)的系數(shù)為其子系數(shù);對(duì)于一個(gè)給定的父系數(shù),在同一方向上所有小尺度圖像中同一空間位置上對(duì)應(yīng)的所有系數(shù)為其后代系數(shù);同樣,對(duì)于一個(gè)給定的子系數(shù),在同一方向上所有大尺度圖像中同一空間位置上對(duì)應(yīng)的所有系數(shù)為其祖先系數(shù)。2023/4/10第130頁(yè),共147頁(yè),2023年,2月20日,星期五如圖所示,除了最低分辨率子帶圖像,即LL3,每個(gè)父系數(shù)都有四個(gè)子系數(shù),對(duì)于LL3,我們定義父子關(guān)系為每個(gè)父系數(shù)有三個(gè)子系數(shù)。2023/4/10第131頁(yè),共147頁(yè),2023年,2月20日,星期五3.
零樹通過(guò)對(duì)實(shí)際圖像小波分解發(fā)現(xiàn),當(dāng)一個(gè)父系數(shù)是不重要的,那么其所有的后代系數(shù)也很可能是不重要的。于是,以該父系數(shù)為樹根,可構(gòu)成一棵零根。零樹中所有后代系數(shù)的編碼,都可以通過(guò)對(duì)樹根的編碼得到。不屬于任何零樹的不重要系數(shù),則是孤立的零系數(shù)。引入零樹,并考慮重要系數(shù)取值的符號(hào)后,一個(gè)系數(shù)的屬性可通過(guò)四個(gè)符號(hào)表示,即零樹根,孤立點(diǎn),正和負(fù)。
2023/4/10第132頁(yè),共147頁(yè),2023年,2月20日,星期五確定系數(shù)屬性的流程如圖所示。圖中,當(dāng)一個(gè)系數(shù)為一個(gè)零樹根的后代時(shí),因?yàn)槠鋵傩允强深A(yù)測(cè)的,所以不需要編碼。在對(duì)系數(shù)進(jìn)行編碼時(shí),其掃描順序按照以下原則確定:父系數(shù)先于子系數(shù);大尺度先于小尺度。
2023/4/10第133頁(yè),共147頁(yè),2023年,2月20日,星期五二、
編碼過(guò)程在編碼時(shí),采用一種逐次逼近的所謂嵌入式編碼,即系數(shù)的編碼精度逐次提高,這樣,可以在任何時(shí)候,比如比特率達(dá)到某種要求時(shí)結(jié)束編碼或解碼。在編碼過(guò)程中,始終有兩個(gè)列表記錄當(dāng)前的狀態(tài)。主列表用以按掃描順序記錄每個(gè)尚未被確定為重要的系數(shù)坐標(biāo),副列表記錄所有已經(jīng)確定為重系數(shù)幅度。
2023/4/10第134頁(yè),共
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 城市規(guī)劃城市雨水收集與利用考核試卷
- 生態(tài)環(huán)境保護(hù)法律體系考核試卷
- 股權(quán)質(zhì)押簡(jiǎn)介及合同示例
- 建筑行業(yè)個(gè)人年終總結(jié)
- 安全生產(chǎn)違法處罰辦法輔導(dǎo)講座考核試卷
- 緊固件行業(yè)市場(chǎng)營(yíng)銷策略與品牌推廣考核試卷
- 海底隧道工程中的海底地震安全性評(píng)價(jià)考核試卷
- 稀土金屬壓延加工的市場(chǎng)需求預(yù)測(cè)考核試卷
- 紡織品功能性設(shè)計(jì)考核試卷
- 有機(jī)合成中涂料樹脂的合成與應(yīng)用考核試卷
- 2025年審計(jì)審查重點(diǎn)試題及答案
- 2025年證券從業(yè)資格證考試真題試題及答案
- 城市管理文明執(zhí)法規(guī)范(試行)
- 廣東省2024-2025學(xué)年佛山市普通高中教學(xué)質(zhì)量檢測(cè)物理試卷及答案(二)高三試卷(佛山二模)
- 【9數(shù)一?!?025年安徽合肥市第四十五中學(xué)九年級(jí)中考一模數(shù)學(xué)試卷(含答案)
- 2025年中石油政工師理論考試題庫(kù)(含答案)
- 2025年二建-水利-簡(jiǎn)答200問
- 安全專項(xiàng)施工方案內(nèi)容
- 2025天津市安全員《B證》考試題庫(kù)及答案
- 幼兒園趣味迷宮課件
- 電網(wǎng)工程設(shè)備材料信息參考價(jià)(2024年第四季度)
評(píng)論
0/150
提交評(píng)論