多媒體數(shù)據(jù)壓縮與編碼技術_第1頁
多媒體數(shù)據(jù)壓縮與編碼技術_第2頁
多媒體數(shù)據(jù)壓縮與編碼技術_第3頁
多媒體數(shù)據(jù)壓縮與編碼技術_第4頁
多媒體數(shù)據(jù)壓縮與編碼技術_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第4章多媒體數(shù)據(jù)壓縮與編碼技術本章重點:編碼模型編碼壓縮方法分類統(tǒng)計編碼的基本原理預測編碼的基本原理變換編碼的基本原理視頻編碼的基本原理第一頁,共七十七頁。?第4章多媒體數(shù)據(jù)壓縮與編碼技術4.1編碼壓縮的必要性與可能性4.2編碼模型4.3編碼壓縮方法分類4.4統(tǒng)計編碼4.5預測編碼4.6變換編碼4.7其他編碼4.8視頻編碼4.9本章小結(jié)第二頁,共七十七頁。?4.1編碼壓縮的必要性與可能性4.1.1編碼壓縮的必要性4.1.2編碼壓縮的可能性

第三頁,共七十七頁。?4.1.1編碼壓縮的必要性眾所周知,圖像量化所需數(shù)據(jù)量大。圖像和視頻的龐大數(shù)據(jù)對計算機的處理速度、存儲容量都提出過高的要求。因此必須進行數(shù)據(jù)量壓縮。從傳送的角度來看,在信道帶寬、通信鏈路容量一定的前提下,采用編碼壓縮技術,減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。因此,更要求數(shù)據(jù)量壓縮。第四頁,共七十七頁。?4.1.2編碼壓縮的可能性

眾所周知,視頻由一幀一幀的圖像組成,而圖像的各像素之間,無論是在行方向還是在列方向,都存在著一定的相關性,即冗余度。應用某種編碼方法提取或減少這些冗余度,便可以達到壓縮數(shù)據(jù)的目的。常見的靜態(tài)圖像數(shù)據(jù)冗余包括:1.空間冗余這是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一幅圖像記錄了畫面上可見景物的顏色。同一景物表面上各采樣點的顏色之間往往存在著空間連貫性,從而產(chǎn)生了空間冗余。

第五頁,共七十七頁。?4.1.2編碼壓縮的可能性2.時間冗余在視頻的相鄰幀間,往往包含相同的背景和移動物體,因此,后一幀數(shù)據(jù)與前一幀數(shù)據(jù)有許多共同的地方,即在時間上存在大量的冗余。3.結(jié)構(gòu)冗余在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。例如,方格狀的地板圖案等。我們稱這種冗余為結(jié)構(gòu)冗余。4.知識冗余有些圖像的理解與某些知識有相當大的相關性。例如,人臉的圖像有固定的結(jié)構(gòu)。這類第六頁,共七十七頁。?4.1.2編碼壓縮的可能性

規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。5.視覺冗余事實表明,人類的視覺系統(tǒng)對圖像場的敏感性是非均勻的和非線性的。然而,在記錄原始圖像數(shù)據(jù)時,通常假定視覺系統(tǒng)是線性的和均勻的,對視覺敏感和不敏感的部分同等對待,從而產(chǎn)生了比理想編碼更多的數(shù)據(jù),這就是視覺冗余。6.圖像區(qū)域的相同性冗余

是指在圖像中的兩個或多個區(qū)域所對應的所有第七頁,共七十七頁。?4.1.2編碼壓縮的可能性像素值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復性存儲,這就是圖像區(qū)域的相似性冗余。

7.紋理的統(tǒng)計冗余有些圖像紋理盡管不嚴格服從某—分布規(guī)律,但是它在統(tǒng)計的意義上服從該規(guī)律。利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量,所以我們稱之為紋理的統(tǒng)計冗余。

第八頁,共七十七頁。?4.2編碼模型

4.2.1信源編碼器和信源解碼器4.2.2信道編碼器和解碼器第九頁,共七十七頁。?4.2編碼模型

如圖4.1所示,一個壓縮系統(tǒng)包括兩個不同的結(jié)構(gòu)塊:一個編碼器和一個解碼器。圖像f(x,y)輸入到編碼器中,這個編碼器可以根據(jù)輸入數(shù)據(jù)生成一組符號。在通過信道進行傳輸之后,將經(jīng)過編碼的表達符號送入解碼器,經(jīng)過重構(gòu)后,就生成了輸出圖像。

第十頁,共七十七頁。?4.2.1信源編碼器和信源解碼器

信源編碼器的任務是減少或消除輸入圖像中的冗余。編碼的框圖如圖下圖(a)所示。從原理來看主要分為三個階段,第一階段將輸入數(shù)據(jù)轉(zhuǎn)換為可以減少輸入圖像中像素間冗余的數(shù)據(jù)的集合。第二階段設法去除原圖象信號的相關性,例如對電視信號就可以去掉幀內(nèi)各種相關,還可以去除幀間相關。這樣有利

第十一頁,共七十七頁。?4.2.1信源編碼器和信源解碼器于編碼壓縮。第三階段就是找一種更近于熵,又利于計算機處理的編碼方式。

下圖(b)中顯示的信源解碼器僅包含兩部分:一個符號解碼器和一個反向轉(zhuǎn)換器。這些模塊的運行次序與編碼器的符號編碼器和轉(zhuǎn)換模塊的操作次序相反。第十二頁,共七十七頁。?4.2.2信道編碼器和解碼器

當信道帶有噪聲或易于出現(xiàn)錯誤時,信道編碼器和解碼器就在整個譯碼解碼處理中扮演了重要的角色。最有用的—種信道編碼技術是由R.w.Hamming提出的。該技術基于這樣的思想,即向被編碼數(shù)據(jù)中加入足夠的位數(shù)以確保可用的碼字間變化的位數(shù)最小。例如,利用Hamming碼將3位冗余碼加到4位字上,使得任意兩個有效碼字間的距離為3,則所有的一位錯誤都可以檢測出來并得到糾止。與4位二進制數(shù)b3b2b1b0相聯(lián)系的7位Hamming(7,4)碼字

第十三頁,共七十七頁。?4.2.2信道編碼器和解碼器h1h2…h(huán)5h6h7是:這里表示異或運算。h1,h2和h4位分別是位字段b3b2b0,b3b1b0和b2b1b0的偶校驗位。

第十四頁,共七十七頁。?4.2.2信道編碼器和解碼器為了將漢明(Hamming)編碼結(jié)果進行解碼,信道解碼器必須為先前設立的偶校驗的各個位字段進行奇校驗并檢查譯碼值。一位錯誤由一個非零奇偶校驗字c4c2c1給出,這里,第十五頁,共七十七頁。?4.3編碼壓縮方法分類

數(shù)據(jù)壓縮的目標是去除各種冗余。根據(jù)壓縮后是否有信息丟失,多媒體數(shù)據(jù)壓縮技術可分為無損壓縮技術和有損壓縮技術兩類。數(shù)據(jù)壓縮編碼分類如圖4.3所示。常見的無損壓縮技術有:霍夫曼編碼算術編碼行程編碼詞典編碼

第十六頁,共七十七頁。?4.3編碼壓縮方法分類

常用的一些有損壓縮技術包括:預測編碼變換編碼基于模型編碼分形編碼其他編碼第十七頁,共七十七頁。?4.3編碼壓縮方法分類第十八頁,共七十七頁。?4.4統(tǒng)計編碼

統(tǒng)計編碼屬無損編碼,它是根據(jù)消息出現(xiàn)概率的分布特性而進行的壓縮編碼。統(tǒng)計編碼又可分為定長碼和變長碼。常用的統(tǒng)計編碼有Huffman編碼、行程編碼和算術編碼三種。

4.4.1哈夫曼(Huffman)編碼4.4.2香農(nóng)-費諾編碼4.4.3算術編碼4.4.4游程編碼(RLC)4.4.5LZW編碼第十九頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼

在一幅圖像中,有些圖像數(shù)據(jù)出現(xiàn)的頻率高,有些圖像數(shù)據(jù)出現(xiàn)的頻率低。如果對那些出現(xiàn)頻率高的數(shù)據(jù)用較少的位數(shù)來表示,而出現(xiàn)頻率低的數(shù)據(jù)用較多的位數(shù)來表示,這樣從總的效果來看還是節(jié)省了存儲空間。這種編碼思想首先由香農(nóng)(Shannon)提出,哈夫曼后來對它提出了一種改進的編碼方法,用這種方法得到的編碼稱為Huffman編碼,Huffman編碼是一種變長編碼。

第二十頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼1.理論基礎一個事件集合x1,x2,…,xn處于一個基本概率空間,其相應概率為p1,p2,…,pn,且p1+p2+…pn=1。每一個信息的信息量為(4-3)定義在概率空間中每—事件的概率不相等時的平均信息量為信息熵,則信息熵H可采用如下公式計算:(4-4)

第二十一頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼【例4.1】信息熵的計算。設8個隨機變量具有同等概率為1/8,則熵:即計算出H=3比特。2.Huffman編碼Huffman編碼是1952年由Huffman提出的一種編碼方法。它在變長編碼方法中是最佳的。第二十二頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼設信源A的信源空間為:其中,現(xiàn)用r個碼符號的碼符號集

對信源A中的每個符號(i=1,2,…,N)進行編碼。具體編碼的方法是:(1)把信源符號按其出現(xiàn)概率的大小順序排列起來;(2)把最末兩個具有最小概率的元素之概率加起來;

第二十三頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼(3)把該概率之和同其余概率由大到小排隊,然后再把兩個最小概率加起來,再重新排隊;重復步驟,直到最后只剩下兩個概率為止。在上述工作完畢之后,從最后兩個概率開始逐步向前進行編碼。對于概率大的賦予0,小的賦予1。第二十四頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼第二十五頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼經(jīng)霍夫曼編碼后,平均碼長為:

=0.4×1+0.30×2+0.1×4+0.06×5+0.04×5=2.20(bit)第二十六頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼3.Huffman編碼的幾點說明(1)Huffman編碼是最佳的,雖然構(gòu)造出來的碼不唯一,但其平均碼長卻相同,所以不影響編碼效率和數(shù)據(jù)壓縮性能。(2)由于Huffman碼的碼長參差不齊,因此,存在一個輸入、輸出速率匹配問題。解決的辦法是設置一定容量的緩沖存儲器。(3)Huffman碼在存儲或傳輸過程中,如果出現(xiàn)誤碼,可能會引起誤碼的連續(xù)傳播,1bit的誤碼可能把一大串碼字全部破壞,因此,限制了Huffman碼的使用。第二十七頁,共七十七頁。?4.4.1哈夫曼(Huffman)編碼

(4)Huffman編碼對不同信源其編碼效率也不盡相同。當信源概率是2的負次冪時,Huffman碼的編碼效率達到100%;當信源概率相等時,其編碼效率最低。這表明在使用Huffman方法編碼時,只有當信源概率分布很不均勻時,Huffman碼才會收到顯著的效果。(5)Huffman編碼應用時,均需要與其他編碼結(jié)合起來使用,才能進一步提高數(shù)據(jù)壓縮比。例如,在靜態(tài)圖像處理標準JPEG中,先對圖像像素進行DCT變換、量化、Z形掃描、游程編碼后,再進行霍夫曼編碼。第二十八頁,共七十七頁。?4.4.2香農(nóng)-費諾編碼

具體編碼方法如下:(1)把按概率由大到小、從上到下排成一列,然后把分成兩組,,并使這兩組符號概率和相等或幾乎相等,即:(2)把兩組分別按0,1賦值,例如將第一組賦值為0,則第二組賦值為1。然后分組、賦值,不斷反復,直到每組只有一種輸入為止。將每個所賦的值依次排列起來就是香農(nóng)-費諾編碼。第二十九頁,共七十七頁。?4.4.2香農(nóng)-費諾編碼

以前面的數(shù)據(jù)為例,香農(nóng)-編碼費諾如圖4.5所示。第三十頁,共七十七頁。?4.4.3算術編碼

理論上,用Huffman方法對源數(shù)據(jù)流進行編碼可達到最佳編碼效果。但由于計算機中存儲、處理的最小單位是“位”,因此,在一些情況下,實際壓縮比與理論壓縮比的極限相去甚遠。算術編碼把要壓縮處理的整段數(shù)據(jù)映射到—段實數(shù)半開區(qū)間[0,1]內(nèi)的某一區(qū)段,構(gòu)造出小于1且大于或等于0的數(shù)值。這個數(shù)值是輸入數(shù)據(jù)流的唯—可譯代碼。

第三十一頁,共七十七頁。?4.4.3算術編碼下面通過一個例子來說明算術編碼的方法。對一個5符號信源A={a1,a2,a3,a2,a4},各字符出現(xiàn)的概率和設定的取值范圍如下表4.2:

第三十二頁,共七十七頁。?4.4.3算術編碼為討論方便起見,假定有式中Ns為新子區(qū)間的起始位置;Fs為前子區(qū)間的起始位置,Cl當前符號的區(qū)間左端;Ne為新子區(qū)間的結(jié)束位置;Fe為前子區(qū)間的結(jié)束位置;Cr當前符號的區(qū)間右端;L為前子區(qū)間的長度。按上述區(qū)間的定義,最終結(jié)果如表4.3:

第三十三頁,共七十七頁。?4.4.3算術編碼

給定事件序列的算術編碼步驟如下:(1)編碼器在開始時將“當前間隔”[L,H]設置為[0,1)。(2)對每一事件,編碼器按步驟(a)和(b)進行處理第三十四頁,共七十七頁。?4.4.3算術編碼

(a)編碼器將“當前間隔”分為子間隔,每一個事件一個。(b)一個子間隔的大小與下一個將出現(xiàn)的事件的概率成比例,編碼器選擇子間隔對應于下一個確切發(fā)生的事件相對應,并使它成為新的“當前間隔”。最后輸出的“當前間隔”的下邊界就是該給定事件序列的算術編碼。第三十五頁,共七十七頁。?4.4.3算術編碼在算術編碼中有幾個問題需要注意:由于實際的計算機的精度不可能無限長,一個明顯的問題是運算中出現(xiàn)溢出,但多數(shù)機器都有16、32或者64位的精度,因此這個問題可使用比例縮放方法解決。

算術編碼器對整個消息只產(chǎn)生一個碼字,這個碼字是在間隔[0,1]中的一個實數(shù),因此譯碼器在接收到表示這個實數(shù)的所有位之前不能進行譯碼。算術編碼也是一種對錯誤很敏感的編碼方法,如果有一位發(fā)生錯誤就會導致整個消息譯錯。

第三十六頁,共七十七頁。?4.4.4游程編碼(RLC)

游程編碼是一種利用空間冗余度壓縮圖像的方法,相對比較簡單,也屬于統(tǒng)計編碼類。設圖像中的某一行或某一塊像素經(jīng)采樣或經(jīng)某種方法變換后的系數(shù)為,如圖4.7所示。某一行或某一塊內(nèi)像素值可分為k段,長度為的連續(xù)串,每個串具有相同的值,那么,該圖像的某一行或某一塊可由下面偶對來表示:,其中為每個串內(nèi)的代表值,為串的長度。

第三十七頁,共七十七頁。?4.4.4游程編碼(RLC)

第三十八頁,共七十七頁。?4.4.4游程編碼(RLC)

串長li就是游程長度(Run-length),簡寫為RL,即由字符或采樣值或灰度值構(gòu)成的數(shù)據(jù)流中各個字符等重復出現(xiàn)而形成的字符串的長度。基本結(jié)構(gòu)如圖4.8所示。

第三十九頁,共七十七頁。?4.4.4游程編碼(RLC)

游程編碼分為定長游程編碼和變長游程編碼兩類。定長游程編碼是指RL位數(shù)是固定的。變長游程編碼是指RL位數(shù)是不固定的。游程編碼一般不直接應用于多灰度圖像,但比較適合于二值圖像的編碼。例如黑白傳真圖像的編碼等。為了達到較好的壓縮效果,有時游程編碼和其他一些編碼方法混合使用。定義游程和游程長度后,就可以把任何二元序列變換成游程長度的序列,簡稱游程序列。這一變換是可逆的,一一對應的。第四十頁,共七十七頁。?4.4.5LZW編碼

LZW壓縮編碼是一種無損壓縮編碼。LZW的基本思想是用符號代替一串字符,這一串字符可以是有意義的,也可以是無意義的。在編碼中僅僅把字符串看成是一個號碼,而不去管它代表什么意思。1.編碼算法

LZW編碼是圍繞稱為詞典的轉(zhuǎn)換表來完成的。這張轉(zhuǎn)換表用來存放稱為前綴(Prefix)的字符序列,并且為每個表項分配一個碼字(Codeword),或者叫做序號。

第四十一頁,共七十七頁。?4.4.5LZW編碼LZW編碼算法的具體執(zhí)行步驟如下:步驟1:開始時的詞典包含所有可能的根(Root),而當前前綴P是空的;步驟2:當前字符(C):=字符流中的下一個字符;步驟3:判斷綴-符串P+C是否在詞典中如果“是”:P:=P+C,即用C擴展P);如果“否”把代表當前前綴P的碼字輸出到碼字流;把綴-符串P+C添加到詞典;令P:=C,即現(xiàn)在的P僅包含一個字符C;步驟4:判斷碼字流中是否還有碼字要譯如果“是”,就返回到步驟2;如果“否”把代表當前前綴P的碼字輸出到碼字流;結(jié)束。LZW編碼算法可用偽碼表示。開始時假設編碼詞典包含若干個已經(jīng)定義的單個碼字。

第四十二頁,共七十七頁。?4.4.5LZW編碼【例4.4】256個字符的碼字的偽碼形式表示:Dictionary[j]←allnsingle-character,j=1,2,…,nj←n+1Prefix←readfirstCharacterinCharstreamwhile((C←nextCharacter)!=NULL)BeginIfPrefix.CisinDictionaryPrefix←Prefix.CelseCodestream←cWforPrefixDictionary[j]←Prefix.Cj←n+1Prefix←CendCodestream←cWforPrefix第四十三頁,共七十七頁。?4.4.5LZW編碼2.譯碼算法LZW譯碼算法中還用到另外兩個術語:①當前碼字(Currentcodeword):指當前正在處理的碼字,用cW表示,用string.cW表示當前綴-符串;②先前碼字(Previouscodeword):指先于當前碼字的碼字,用pW表示,用string.pW表示先前綴-符串。LZW譯碼算法開始時,譯碼詞典與編碼詞典相同,它包含所有可能的前綴根(roots)。

第四十四頁,共七十七頁。?4.4.5LZW編碼LZW譯碼算法的具體執(zhí)行步驟如下:步驟1:在開始譯碼時詞典包含所有可能的前綴根(Root);步驟2:cW:=碼字流中的第一個碼字;步驟3:輸出當前綴-符串string.cW到碼字流;步驟4:先前碼字pW:=當前碼字cW;步驟5:當前碼字cW:=碼字流中的下一個碼字;步驟6:判斷先前綴-符串string.pW是否在詞典中如果“是”:把先前綴-符串string.pW輸出到字符流;當前前綴P:=先前綴-符串string.pW;當前字符C:=當前前綴-符串string.cW的第一個字符;把綴-符串P+C添加到詞典;如果“否”:當前前綴P:=先前綴-符串string.pW;當前字符C:=當前綴-符串string.cW的第一個字符;輸出綴-符串P+C到字符流,然后把它添加到詞典中。步驟7:判斷碼字流中是否還有碼字要譯如果“是”,就返回到步驟4;如果“否”,結(jié)束。第四十五頁,共七十七頁。?4.4.5LZW編碼

【例4.6】編碼字符串如表4.6所示,編碼過程如表4.7所示?,F(xiàn)說明如下:“步驟”欄表示編碼步驟;“位置”欄表示在輸入數(shù)據(jù)中的當前位置;“詞典”欄表示添加到詞典中的綴-符串,它的索引在括號中;“輸出”欄表示碼字輸出。

第四十六頁,共七十七頁。?4.4.5LZW編碼

表4.8解釋了譯碼過程。每個譯碼步驟譯碼器讀一個碼字,輸出相應的綴-符串,并把它添加到詞典中。例如,在步驟4中,先前碼字(2)存儲在先前碼字(pW)中,當前碼字(cW)是(4),當前綴-符串

第四十七頁,共七十七頁。?4.4.5LZW編碼

string.cW是輸出(“AB”),先前綴-符串string.pW("B")是用當前綴-符串string.cW("A")的第一個字符,其結(jié)果("BA")添加到詞典中,它的索引號是(6)。

第四十八頁,共七十七頁。?4.5預測編碼

4.5.1概述4.5.2無損預測編碼4.5.3有損預測編碼第四十九頁,共七十七頁。?4.5.1概述預測編碼是根據(jù)離散信號之間存在著一定的相關性,利用前面的一個或多個信號對下一信號進行預測,然后對實際值和預測值的差(預測誤差)進行編碼。預測編碼中典型的壓縮方法有脈沖編碼調(diào)制(PCM,PulseCodeModulation)、差分脈沖編碼調(diào)制(DPCM,DifferentialPulseCodeModulation)、自適應差分脈沖編碼調(diào)制(ADPCM,AdaptiveDifferentialPulseCodeModulation)等。預測編碼可分為無損預測編碼和有損預測編碼。

第五十頁,共七十七頁。?4.5.2無損預測編碼

無損預測編碼器的工作原理圖和預測原理如圖4.9和圖4.10所示。其中f(i,j)的預測值為,將的差值進行無損熵編碼,熵編碼器可采用霍夫曼編碼或算術編碼。圖4.10給出了像素(i,j)的預測圖,圖中給出了(i,j)的三個相鄰像素,由先前三點預測,定義為:其中a1,a2,a3稱預測系數(shù),都是待定參數(shù)。如果預測器中預測系數(shù)是固定不變的常數(shù),稱之為線性預測。

第五十一頁,共七十七頁。?4.5.2無損預測編碼圖4.9

無損預測編碼器工作原理壓縮源圖像預測器熵編碼器編碼表第五十二頁,共七十七頁。?4.5.2無損預測編碼

預測誤差計算公式如下:

設a=f(i,j-1),b=f(i-1,j),c=f(i-1,j-1),的預測方法如圖4.11所示,可有8種選擇方法。

第五十三頁,共七十七頁。?4.5.2無損預測編碼第五十四頁,共七十七頁。?4.5.2無損預測編碼【例4.7】設有一幅圖像,f(i-1,j-1),f(i-1,j),f(i,j-1),f(i,j)的灰度值分別為253,252,253,255,用圖4.11第四種選擇方法預測

f(i,j)的灰度值,并計算預測誤差。解:

=a+b-c=f(i,j-1)+f(i-1,j)-f(i-1,j-1)=253+252-252=253

預測誤差=255-253=2

第五十五頁,共七十七頁。?4.5.3有損預測編碼

如果不是直接對差值信號進行編碼,而是對差值信號進行量化后再進行編碼就稱之為有損預測編碼。有損預測方法有多種,其中差分脈沖編碼調(diào)制(DifferentialPulseCodeModulation,簡稱DPCM),是一種具有代表性的編碼方法。DPCM系統(tǒng)由編碼器和解碼器組成,它們各有一個相同的預測器。圖像DPCM系統(tǒng)的工作原理如圖4.12所示。系統(tǒng)包括發(fā)送、接收和信道傳輸三個部分。第五十六頁,共七十七頁。?4.5.3有損預測編碼第五十七頁,共七十七頁。?4.6變換編碼

4.6.1變換編碼的基本原理4.6.2離散余弦變換編碼4.6.3小波變換第五十八頁,共七十七頁。?4.6.1變換編碼的基本原理

變換編碼的原理如圖4.13所示。從圖中看出,存儲或傳輸都是在變換域中進行的,即傳輸或存儲都不是空域圖像而是變換域系數(shù)。圖4.13變換編碼、解碼原理框圖

第五十九頁,共七十七頁。?4.6.2離散余弦變換編碼

DCT計算復雜度適中,又具有可分離特性,還有快速算法等特點,所以近年來在圖像數(shù)據(jù)壓縮中,采用離散余弦變換編碼的方案很多,特別是20世紀80年代迅速崛起的多媒體技術中,JPEG、MPEG、H.261等壓縮標準,都用到離散余弦變換編碼進行數(shù)據(jù)壓縮。二維離散偶余弦正變換公式為:

式中,x,y,u,v=0,1……,N-1。,當u=v=0時。,當u=1,2…,N-1;v=1,2…,N-1時.第六十頁,共七十七頁。?4.6.2離散余弦變換編碼二維離散偶余弦逆變換公式為:式中,x,y,u,v=0,1……,N-1。

,當u=v=0時。,當u=1,2…,N-1;v=1,2…,N-1時。第六十一頁,共七十七頁。?4.6.2離散余弦變換編碼從圖4-14可以看出,采用DCT進行變換編碼時,通常首先將原始圖像分成子塊,對每一子塊經(jīng)正交變換得到變換系數(shù),并對變換系數(shù)經(jīng)過量化和取舍,然后采用熵編碼等方式進行編碼后,再由信道傳輸?shù)浇邮斩?。在接收端,?jīng)過解碼、反量化、逆變換后,得到重建圖像。第六十二頁,共七十七頁。?4.6.3小波變換

小波變換對圖像的壓縮類似于離散余弦變換,即都是對圖像進行變換。由時域變換到頻域,然后再量化、編碼、輸出。不同之處在于小波變換是對整幅圖像進行變換;小波變換沒有量化表,它主要依據(jù)變換后各級分辨率之間的自相似的特點,采用逐級逼近技術實現(xiàn)減少數(shù)據(jù)存儲的目的。小波變換繼承了Fourier分析的優(yōu)點,同時又克服它的許多缺點,所以它在靜態(tài)和動態(tài)圖像壓縮領域得到廣泛的應用,并且已經(jīng)成為某些圖像壓縮國際標準(如MPEG-4)的重要環(huán)節(jié)。

第六十三頁,共七十七頁。?4.7其他編碼

4.7.1分形編碼4.7.2矢量量化編碼4.7.3子帶編碼第六十四頁,共七十七頁。?4.7.1分形編碼分形編碼與分形幾何相關。所謂分形幾何就是研究無限復雜但具有一定意義下的自相似圖形和結(jié)構(gòu)的幾何學。分形編碼正是利用分形幾何中自相似的原理來實現(xiàn)數(shù)據(jù)壓縮的。首先對圖像進行分塊,然后再去尋找各塊之間的相似性,這里相似性的描述主要是依靠仿射變換來確定的,一旦找到了每塊的仿射變換,就保存下這個仿射變換的系數(shù),由于每塊的數(shù)據(jù)量遠大于仿射變換的系數(shù),因而圖像得以大幅度地壓縮。分形圖像編碼和解碼不夠成熟,產(chǎn)生的壓縮比不夠高。壓縮效果還不十分理想,在當前圖像壓縮編碼中還不能占據(jù)主導地位。第六十五頁,共七十七頁。?4.7.2矢量量化編碼

矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關性,將輸入圖像數(shù)據(jù)序列分組,每一組由m個數(shù)據(jù)構(gòu)成一個M維矢量,一起進行編碼,即一次量化多個點。根據(jù)香農(nóng)失真率理論,對于無記憶信源,矢量量化編碼總是優(yōu)于標量量化編碼。矢量量化編碼是有損編碼。第六十六頁,共七十七頁。?4.7.3子帶編碼

由于人眼對不同頻域段的敏感程度不同,圖像信號可以劃分為不同的頻域段。子帶編碼的基本思想是利用一濾波器組,將采樣將輸入信號分解為高頻分量和低頻分量,然后分別對高頻和低頻分量進行量化和編碼。解碼時,高頻分量和低頻分量經(jīng)過插值和共軛濾波器而合成原信號。第六十七頁,共七十七頁。?4.8視頻編碼

4.8.1幀內(nèi)預測編碼4.8.2幀間預測編碼4.8.3活動圖像幀間內(nèi)插第六十八頁,共七十七頁。?4.8視頻編碼視頻編碼系統(tǒng)的基本結(jié)構(gòu)如圖4.15所示。

信源模型量化參數(shù)參數(shù)統(tǒng)計特性重建視頻噪聲輸入視頻分析量化二進制編碼編碼器有損過程無損過程信道綜合反量化二進制解碼解碼器圖4.15視頻編碼系統(tǒng)的一般組成第六十九頁,共七十七頁。?4.8.1幀內(nèi)預測編碼

在視頻預測編碼中,主要分為幀內(nèi)預測編碼和幀間預測編碼。所謂幀內(nèi)預測,就是在一個視頻幀,即一幅圖像內(nèi)進行的預測。幀內(nèi)預測編碼的優(yōu)點是算法簡單,易于實現(xiàn),但壓縮比比較低,因此在視頻圖像壓縮中幾乎不單獨使用。第七十頁,共七十七頁。?4.8.2幀間預測編碼

幀間預測編碼就是利用視頻圖像幀間的相關性,即時間相關性,來獲得比幀內(nèi)編碼高得多的壓縮比。具有運動補償?shù)膸g預測編碼是視頻壓縮的關鍵技術之一,它包括以下幾個步驟:首先,將圖像分解成相對靜止的背景和若干運動的物體,通過運動估值得到每個物體的位移矢量;然后,利用位移矢量計算經(jīng)運動補償后的預測值最后對預測誤差進行量化、編碼、傳輸,同時將位移矢量和圖像分解方式等信息送到接收端。第七十一頁,共七十七頁。?4.8.2幀間預測編碼

在具有運動補償?shù)膸g

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論