圖像的編碼與壓縮_第1頁
圖像的編碼與壓縮_第2頁
圖像的編碼與壓縮_第3頁
圖像的編碼與壓縮_第4頁
圖像的編碼與壓縮_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

圖像的編碼與壓縮數(shù)據(jù)壓縮最初是信息論研究中的一個重要課題,在信息論中數(shù)據(jù)壓縮被稱為信源編碼。但近年來,數(shù)據(jù)壓縮不僅限于編碼方法的研究與探討,己逐步形成較為獨立的體系。它主要研究數(shù)據(jù)的表示、傳輸、變換和編碼方法,目的是減少存儲數(shù)據(jù)所需的空間和傳輸所用的時間。

1.為什么要壓縮?存儲VCD640MB傳輸:Cable1.5~10MbsATMupto34MbsMobileCommunication10Kbs~1Mbs(3)播放速度一、引言圖像數(shù)據(jù)的特點之一是信息量大。以像幅為23cm×23cm的航攝影像為例,若按采樣間隔25um、每象素8bit掃描,其數(shù)據(jù)量為84.5MB;一顆衛(wèi)星每半小時發(fā)回—次全波段(五個波段)數(shù)據(jù),每個波段圖像大小為2292×2190字節(jié)約4.90MB,每天的數(shù)據(jù)量高達(dá)1.2GB。如此海量數(shù)據(jù)需要巨大的存儲空間。在多媒體中,海量圖像數(shù)據(jù)的存儲和處理是難點之一。根據(jù)計算,一張600M字節(jié)的光盤,能存放20秒左右的640×480像素的圖像畫面信息,如不進(jìn)行編碼壓縮處理,多媒體信息保存有多么困難是可想而知的。

在現(xiàn)代通信中,圖像傳輸已成為重要內(nèi)容。除要求設(shè)備可靠、圖像保真度高以外,實時性將是重要技術(shù)指標(biāo)之一。很顯然,在信道帶寬、通信鏈路容量一定的前提下,采用編碼壓縮技術(shù),減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。

沒有圖像編碼壓縮技術(shù)的發(fā)展,大容量圖像信息的存儲與傳輸是難以實現(xiàn)的,多媒體、高速信息公路等新技術(shù)在實際中的應(yīng)用會碰到很大困難。

2.為什么能壓縮?

因為一般圖像中,存在很大的冗余度。因此圖像信息的壓縮是可能的。但到底能壓縮多少,除了和圖像本身存在的冗余度多少有關(guān)外,很大程度取決于對圖像質(zhì)量的要求。例如廣播電視要考慮藝術(shù)欣賞,對圖像質(zhì)量要求就很高,用目前的編碼技術(shù),即使壓縮比達(dá)到3∶1都是很困難的。而對可視電話,因畫面活動部分少,對圖像質(zhì)量要求也低,可采用高效編碼技術(shù),使壓縮比高達(dá)1500∶1以上。目前高效圖像壓縮編碼技術(shù)已能用硬件實現(xiàn)實時處理,在廣播電視、工業(yè)電視、電視會議、可視電話、傳真和互連網(wǎng)、遙感等多方面得到應(yīng)用。

二、圖像編碼的分類圖像編碼壓縮的方法目前有很多,其分類方法根據(jù)出發(fā)點不同而有差異。

根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差(對原圖像的保真程度),圖像編碼壓縮分為無誤差(亦稱無失真、無損、信息保持)編碼和有誤差(有失真或有損)編碼兩大類。

無損壓縮(冗余度壓縮、可逆壓縮):是一種在解碼時可以精確地恢復(fù)原圖像,沒有任何損失的編碼方法,但是壓縮比不大,通常只能獲得1~5倍的壓縮比。用于要求重建后圖像嚴(yán)格地和原始圖像保持相同的場合,例如復(fù)制、保存十分珍貴的歷史、文物圖像等;

有損壓縮(不可逆壓縮):只能對原始圖像進(jìn)行近似的重建,而不能精確的復(fù)原,適合大數(shù)工用于存儲數(shù)字化了的模擬數(shù)據(jù)。壓縮比大,但有信息損失。行程編碼(RLE)

在一個逐行存儲的圖像中,具有相同灰度值的一些象素組成的序列稱為一個行程。在編碼時,對于每個行程只存儲一個灰度值的碼,再緊跟著存儲這個行程的長度。這種按照行程進(jìn)行的編碼被稱為行程編碼(RunLengthEncoding)。

行程編碼對于僅包含很少幾個灰度級的圖像,特別是二值圖像,比較有效。2.1無損編碼LZW編碼

LZW編碼是由Lemple和Ziv提出并經(jīng)Welch擴(kuò)充而形成的無損壓縮專利技術(shù)。在對文件進(jìn)行編碼時,需要生成特定字符序列的表以及對應(yīng)的代碼。每當(dāng)表中沒有的字符串出現(xiàn)時,就把它與其代碼一道存儲起來。這以后當(dāng)該串再次出現(xiàn)時,只存儲其代碼。實際上,字符串表是在壓縮過程中動態(tài)生成的,而且由于解壓縮算法可以從壓縮文件中重構(gòu)字符串表,因而字符串表也不必存儲。Huffman編碼Huffman編碼是50年代提出的一種基于統(tǒng)計的無損編碼方法,它利用變長的碼來使冗余量達(dá)到最小。通過一個二叉樹來編碼,使常出現(xiàn)的字符用較短的碼代表,不常出現(xiàn)的字符用較長的碼代表。靜態(tài)Huffman編碼使用一棵依據(jù)字符出現(xiàn)的概率事先生成好的編碼樹進(jìn)行編碼。而動態(tài)Huffman編碼需要在編碼的過程中建立編碼樹。 由于Huffman編碼所得到的平均碼字長度可以接近信源的熵,因此在變長編碼中是最佳的編碼方法,故也稱為熵編碼。2.2有損編碼

量化將圖像用較少的灰度級別來表示是最簡單的減小數(shù)據(jù)量的方法,這種方法就是標(biāo)量量化方法。更一般的情況是,針對連續(xù)量的采樣過程,量化是用有限個狀態(tài)來表示連續(xù)值。預(yù)測編碼

預(yù)測編碼根據(jù)數(shù)據(jù)在時間和空間上的相關(guān)性,根據(jù)統(tǒng)計模型利用已有樣本對新樣本進(jìn)行預(yù)測,將樣本的實際值與其預(yù)測值相減得到誤差值,再對誤差值進(jìn)行編碼。由于通常誤差值比樣本值小得多,因而可以達(dá)到數(shù)據(jù)壓縮的效果。模擬量到數(shù)字量的轉(zhuǎn)換過程是脈沖編碼調(diào)制過程PCM,也稱PCM編碼。對于圖像而言,直接以PCM編碼,存儲量很大。預(yù)測編碼可以利用相鄰象素之間的相關(guān)性,用前面已出現(xiàn)的象素值估計當(dāng)前象素值,對實際值與估計值的差值進(jìn)行編碼。常用的一種線性預(yù)測編碼方法是差分脈沖編碼調(diào)制DPCM。DCT編碼

DCT變換是圖像壓縮標(biāo)準(zhǔn)中常用的變換方法,如JPEG標(biāo)準(zhǔn)中將圖像按照8x8分塊利用DCT變換編碼實現(xiàn)壓縮。Lena.bmp(原圖)Lenna.jpg(壓縮率9.2)Lenna.jpg(壓縮率18.4)Lenna.jpg(壓縮率51.6)其它變換編碼變換方法是實現(xiàn)圖像數(shù)據(jù)壓縮的主要手段,其基本原理是首先通過變換將圖像數(shù)據(jù)投影到另一特征空間,降低數(shù)據(jù)的相關(guān)性,使有效數(shù)據(jù)集中分布;再采用量化方法離散化,最后通過Huffman等無損壓縮編碼進(jìn)一步壓縮數(shù)據(jù)的存儲量。DCT是一種常用的變換域壓縮方法,是JPEG,MPEGI-II等圖像及視頻信號壓縮標(biāo)準(zhǔn)的算法基礎(chǔ)。在實際采用DCT編碼時,需要分塊處理,各塊單獨變換編碼,整體圖像編碼后再解壓會出現(xiàn)塊狀人工效應(yīng),特別是當(dāng)壓縮比較大時非常明顯,使圖像失真。因此,為了獲得更高的圖像壓縮比,人們提出了一些其它方法,如基于小波變換的圖像壓縮算法和基于分形的圖像壓縮算法等。基于小波變換的圖像壓縮算法首先使用某種小波基函數(shù)將圖像做小波變換,再根據(jù)四個通道的不同情況,分別量化編碼,比如對低頻頻段(LL)采用較多的量化級別,而對中間頻段(LH,RH)采用較少量化級別,對高頻頻段(HH)采用很少幾個量化級別,這樣根據(jù)重構(gòu)時對復(fù)原信號的重要程度分別對待的方式可以有效地提高壓縮比而又不產(chǎn)生明顯的失真。由于小波變換不使用DCT變換方法中的固定大小的塊分別編碼的處理方法,而是通過整體的多級(通常用3-5個級別)變換方法實現(xiàn),沒有塊狀效應(yīng)。小波變換可以獲得10-50倍的壓縮比而沒有明顯的失真。小波變換在靜態(tài)圖像壓縮中的作用已經(jīng)得到公認(rèn),為JPEG2000標(biāo)準(zhǔn)所采納。三、保真度準(zhǔn)則在圖像壓縮編碼中,解碼圖像與原始圖像可能會差異,因此,需要評價壓縮后圖像的質(zhì)量。描述解碼圖像相對原始圖像偏離程度的測度一般稱為保真度(逼真度)準(zhǔn)則。常用的準(zhǔn)則可分為兩大類:客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。

客觀保真度準(zhǔn)則最常用的客觀保真度準(zhǔn)則是原圖像和解碼圖像之間的均方根誤差和均方根信噪比兩種。令f(x,y)代表原圖像,代表對f(x,y)先壓縮又解壓縮后得到的f(x,y)的近似,對任意x和y,f(x,y)和之間的誤差定義為:若f(x,y)和均為M×N,則它們之間均方根誤差為:如果將看作原始圖f(x,y)和噪聲信號e(x,y)的和,那么解壓圖像的均方信噪比為:如果對上式求平方根,就得到均方根信噪比。

主觀保真度準(zhǔn)則盡管客觀保真度準(zhǔn)則提供了一種簡單、方便的評估信息損失的方法,但很多解壓圖最終是供人觀看的。事實上,具有相同客觀保真度的不同圖像,在人的視覺中可能產(chǎn)生不同的在視覺效果。這是因為客觀保真度是一種統(tǒng)計平均意義下的度量準(zhǔn)則,對于圖像中的細(xì)節(jié)無法反映出來。而人的視覺系統(tǒng)具有獨特的特性,能夠覺察出來。這種情況下,用主觀的方法來測量圖像的質(zhì)量更為合適。1種常用的方法是對1組(不少于20人)觀察者顯示圖像,并將他們對該圖像的評分取平均,用來評價一幅圖像的主觀質(zhì)量。評價也可對照某種絕對尺度進(jìn)行。下表給出一種對電視圖像質(zhì)量進(jìn)行絕對評價的尺度,根據(jù)圖像的絕對質(zhì)量進(jìn)行判斷打分。評分評價說明1優(yōu)秀圖像質(zhì)量非常好,如同人能想象出的最好質(zhì)量。2良好圖像質(zhì)量高,觀看舒服,有干擾但不影響觀看。3可用圖像質(zhì)量可接受,有干擾但不太影響觀看。4剛可看圖像質(zhì)量差,干擾有些妨礙觀看,觀察者希望改進(jìn)。5差圖像質(zhì)量很差,妨礙觀看的干擾始終存在,幾乎無法觀看。6不能用圖像質(zhì)量極差,不能使用。也可通過將和f(x,y)比較并按照某種相對的尺度進(jìn)行評價。如果觀察者將和f(x,y)逐個進(jìn)行對照,則可以得到相對的質(zhì)量分。例如可用來代表主觀評價{很差,較差,稍差,相同,稍好,較好,很好}。

四、霍夫曼編碼

Huffman編碼是1952年由Huffman提出的一種編碼方法。這種編碼方法根據(jù)源數(shù)據(jù)符號發(fā)生的概率進(jìn)行編碼。在源數(shù)據(jù)中出現(xiàn)概率越大的符號,相應(yīng)的碼越短;出現(xiàn)概率越小的符號,其碼長越長,從而達(dá)到用盡可能少的碼符號表示源數(shù)據(jù)。它在變長編碼方法中是最佳的。下面通過實例來說明這種編碼方法。

具體編碼方法是:①把輸入元素按其出現(xiàn)概率的大小順序排列起來,然后把兩個具有最小概率的元素之概率加起來;②把該概率之和同其余概率大小順序排隊,然后再把兩個最小概率加起來,再重新排隊;③重復(fù)②,直到最后得到和為1的根節(jié)點。

具體編碼方法是:①把輸入元素按其出現(xiàn)概率的大小順序排列起來,然后把兩個具有最小概率的元素之概率加起來;②把該概率之和同其余概率大小順序排隊,然后再把兩個最小概率加起來,再重新排隊;③重復(fù)②,直到最后得到和為1的根節(jié)點。

五、預(yù)測編碼預(yù)測就是根據(jù)過去時刻的樣本序列,運(yùn)用一種模型,預(yù)測當(dāng)前的樣本值。

預(yù)測編碼通常不直接對信號編碼,而是對預(yù)測誤差編碼。當(dāng)預(yù)測比較準(zhǔn)確,誤差較小時,即可達(dá)到編碼壓縮的目的。這種編碼稱之為差分脈沖編碼調(diào)制(DPCM),上圖是原理框圖。在該系統(tǒng)中,xN為tN時刻的亮度取樣值。預(yù)測器根據(jù)tN時刻之前的樣本x1,x2,…,xN-1對xN作預(yù)測,得到預(yù)測值x'N。xN與x'N之間的誤差為

量化器對eN進(jìn)行量化得到e‘N。編碼器對e’N

進(jìn)行編碼發(fā)送。接收端解碼時的預(yù)測過程與發(fā)送端相同,所用預(yù)測器亦相同。接收端恢復(fù)的輸出信號是xN的近似值,兩者的誤差是

當(dāng)ΔxN足夠小時,輸入信號xN

和DPCM系統(tǒng)的輸出信號幾乎一致。

六、圖像壓縮的標(biāo)準(zhǔn)

圖像壓縮的國際標(biāo)準(zhǔn)主要是由國際標(biāo)準(zhǔn)化組織(InternationalStandardizationOrganization,簡稱ISO)和國際電信聯(lián)盟(InternationalTelecommunicationUnion,簡稱ITU)制定的。國際電信聯(lián)盟的前身是國際電話電報咨詢委員會(ConsultativeCommitteeoftheInternationalTelephoneandTelegraph,簡稱CCITT)。由這兩個組織制定的國際標(biāo)準(zhǔn)可分成三個部分:靜止灰度(或彩色)圖像壓縮標(biāo)準(zhǔn)、運(yùn)動圖像壓縮標(biāo)準(zhǔn)和二值圖像壓縮標(biāo)準(zhǔn)。

靜止圖像壓縮標(biāo)準(zhǔn)由上述兩個組織的灰度圖像聯(lián)合專家組JPEG(JointPictureExpertGroup),建立了靜態(tài)灰度(或彩色)圖像壓縮的公開算法,并于1991年開始使用。它定義三種編碼系統(tǒng):(1)DCT有損編碼系統(tǒng);(2)擴(kuò)展編碼系統(tǒng);(3)無失真編碼系統(tǒng)。在視覺效果不受到嚴(yán)重?fù)p失的前提下,對灰度圖像壓縮算法可以達(dá)到15到20的壓縮比。如果在圖像質(zhì)量上稍微犧牲一點的話,可以達(dá)到40:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論