第5章多媒體數據壓縮技術.

上傳人：小*** IP屬地：天津上傳時間：2022-02-13 格式：DOC 頁數：38 大?。?.64MB 積分：30 舉報 版權申訴

已閱讀5頁，還剩33頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、www.wordwendan 中文Word文檔庫本文由【中文word文檔庫】搜集整理。中文word文檔庫免費提中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan word文檔供海量教學資料、行業(yè)資料、范文模板、應用文書、考試學習和社會經濟等第5章多媒體數據壓縮技術本章要點：多媒體數據壓縮技術概述量化統計編碼變換編碼數據壓縮編碼國際標準5.1多媒體數據壓縮技術概述（必要、可行、分類）5.1.1多媒體數據壓縮編碼的必要性由于多媒體元素種類繁多、構成復雜，使得數字計算機面臨的是數值、音樂、動畫、靜態(tài)圖像和電視視頻圖像等多種媒體元素，且要將它們在模擬量和數字量之間

2、進行自由轉換、信息吞吐、存儲和傳輸。目前，虛擬現實技術還要實現逼真的三維空間、3D立體聲效果和在實境中進行仿真交互，帶來的突出問題就是媒體元素數字化后數據量大得驚人，解決這一問題，單純靠擴大存儲器容量、增加通信干線傳輸率的辦法是不現實的。通過數據壓縮技術可大大降低數據量，以壓縮形式存儲和傳輸，既節(jié)約了存儲空間，又提高了通信干線的傳輸效率，同時也使計算機得以實時處理音頻、視頻信息，保證播放出高質量的視頻和音頻節(jié)目。5.1.2多媒體數據壓縮的可能性安特尼科羅威爾意意大利 1975年,300公斤中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 中文 word

3、文檔庫，海量 word 文檔免費下載www.wordwendan 中文Word文檔庫分析冗余? 中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 中文Word文檔庫圖像數據壓縮技術就是研究如何利用圖像數據的冗余性來減少圖像數據量的方法。下面是常見的一些圖像數據冗余：（1）空間冗余：是由于基于離散像素采樣的方法不能表示物體顏色之間的空間連慣性導致的；（2）時間冗余：就是對于象電視圖像、動畫等序列圖片，當其中物體有位移時，后一幀的數據與前一幀的數據有許多相同的地方；（3）結構冗余：在有些圖像的紋理區(qū)，圖像的像素值存在著明顯的分布模式；（4）知識冗余：對于圖像

4、中重復出現的部分，我們可構造其基本模型，并創(chuàng)建對應各種特征的圖像庫，進而圖像的存儲只需要保存一些特征參數，從而可大大減少數據量；（5）視覺冗余：事實表明，人類的視覺系統對圖像場的敏感性是非均勻和非線性的；6.1.3多媒體數據壓縮方法的分類1有損與無損壓縮：第一種分類方法是根據解碼后數據是否能夠完全無丟失地恢復原始數據，可分為：中文Word文檔庫1）無損壓縮：也稱可逆壓縮、無失真編碼、熵編碼等。原理：去除或減少冗余值，但這些值可在解壓縮時重新插入到數據中，恢復原始數據。它大多使用在對文本和數據的壓縮上，但是壓縮比較低，大致在2： 15： 1之間。典型算法有：Hufman編碼、Shannon-F

5、ano編碼、算術編碼、游程編碼和Lenpel-Ziv編碼等。2）有損壓縮：也稱不可逆壓縮和熵壓縮等。此法在壓縮時減少了的數據信息是不能恢復的。2、壓縮技術分類：第二種分類方法是按照壓縮技術所采用的方法來分的，見下表所示:多媒體數據編碼算法PCM自適應、固定式預測編碼自適應、固定式（DPCM、 M ）混合編碼變換編碼傅里葉、離散余弦（DCT ）、離散正弦（DST）、哈爾、斜變換、沃爾什 -哈密瓜達馬、卡胡南-勞夫（K-L ）、小波統計編碼（熵編碼）哈夫曼、算術編碼、費諾、香農、游程編碼（RLE ）、LZW靜態(tài)圖像編碼方塊、逐漸浮現、逐層內插、比特平面、抖動電視編碼幀內預測幀間運動估

6、計、運動補償、條件補充、內插、編碼幀間預測其他編碼矢量量化、子帶編碼、輪廓編碼、二值圖像3. 脈沖編碼調制 PCM （ Pulse Code Modulation ）編碼分類1）預測編碼（Predictiove Codi ng, PC）:這種編碼器記錄與傳輸的不是樣本的真實值，而是它與預期測值的差。預測值由欲編碼圖像信號的過去信息決定。由于時間、空間相關性，真實值與預測值的差值變化范圍遠遠小于真實值的變化范圍，因而可以采用較少的位數來表示。2）變換編碼（Tran sform Codi ng, TC ）:其主要思想是利用圖像塊內像素值之間的相關性，把圖像變換到一組新的基上，使得能量集中到少數幾個

7、變換系數上，通過存儲這些系數而達到壓縮的目的。3）統計編碼：最常用的統計編碼是 Hufman編碼。它對于出現頻率大的符號用較少的位數來表示，而對出現頻率小的符號用較多的位數來表示。其編碼效率主要取決于需編碼的符號出現的概率分布，越集中則壓縮比越高。5.2量化通常量化是指模擬信號到數字信號的映射，它是模擬量化為數字量必不可少的步驟。由于模擬量是連續(xù)的，而數字量是離散量，因此量化操作實質上是用有限的離散量代替無限的模擬量的多對一映射操作。5.2.1 比特率比特率是采樣率和量化過程中使用的比特數的產物。它是數據通信的一個重要參數。公用數據網的信道傳輸能力常常是以每秒傳送多少KB或多少GB信息量

8、來衡量的。中文Word文檔庫數字音頻格式比較應用類型采樣頻率(KHz )帶寬(KHz )頻帶(Hz)比特率(KB/S)電話8.03.0200320064遠程會議16.07.0507000256數字音頻光盤44.120.020200001410數字音頻帶48.020.020200001536522量化原理量化處理是使數據比特率下降的一個強有力的措施。脈沖編碼調制(PCM )的量化處理在采樣之后進行。數據壓縮編碼中的量化是指以PCM碼作為輸入，經正交變換、差分、或預測處理后，在熵編碼之前，對正交變換系數、差值或預測誤差的量化處理。模擬無限等級數字等級有限化t數字量化處理量化輸入值的動態(tài)范圍很大,需

9、要以多的比特數表示一個數值，量化輸出只能取有限個整數，稱作量化級，一般希望量化后的數值用較少的比特數就可表示。每個量化輸入被強行歸一到與其接近的某個輸出，即量化到某個級。量化處理總是把一批輸入, 量化到一個輸出級上，所量化處理是一個多對一的處理過程，是個不可逆過程，量化處理中有信息丟失，或者說會引起量化誤差(量化噪聲)。5.2.3標量量化器的設計1. 量化器的設計要求(1) 給定量化分層級數，滿足量化誤差最小；(2) 限定量化誤差，確定分層級數，滿足以盡量小的平均比特數，表示量化輸出。2. 量化方法和量化特性量化方法有標量量化和矢量量化之分，標量量化又可分為均勻量化、非均勻量化和自適應

10、量化。下圖畫出一個標量量化過程的示意圖：中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 中文Word文檔庫W1 W3W3W?W8：'-b覆區(qū)足埒量化的畫數，是一 1O像的灰度差值直方圖1|IIW5 W6W1W2W3W4W5W6W7W8.龍荒量化過程示意圖b區(qū)畫出了F勻量化"處理的昱化箱示意圖中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan XI X2 X3XA X5 X6采樣輸人譯杠值C區(qū)的雖化箱K等寬，中間欠概率處II

11、窄，購邊小樞血處箱寬t表示不均勾雖叱.量化器的量化特性曲線，有多種多樣，下圖給出一個八級均勻量化特性曲線:100101110()1101000100()F圖是給出一個非均勻量化特性曲線: 中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 100呈化輸出樣本a1（）1110011010001-I*I非均勻量化間隔000'-一亠XI X2X3X4X5采樣輸入樣本值中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 524 矢量量化矢量量化編碼一

12、般是失真編碼方法。矢量量化的名字是相對于標量量化而提出的，對于PCM數據，一個數一個數進行量化叫標量量化；若對這些數據分組，每組K個數構成一個K維矢量，然后以矢量為單元，逐個矢量進行量化，稱矢量量化。矢量量化可有效提高壓縮比，見下圖：5.3統計編碼本節(jié)介紹幾種典型的熵編碼方法，如Shannon與Fano編碼法和Hufman編碼法，算術編碼法與游程編碼法。其中尤以Hufman編碼法為最佳，在多媒體編碼系統中常用這種方法作熵保持編碼。預備知識：信息論基礎?今天有同學收到 EMAIL、TEL,.?今天有同學讀報？海報？今天有同學WATCH TV、RADIO? ?什么是信息？信息量多大？信息單位是什

13、么？當我們收到一封信或一個電話、傳真、電報、電子郵件時，便獲得一定的信息，在此之前我們并不能肯定其中的內容，如果我們早知其內容，也就沒有必要寫信、發(fā)電子郵件或打電話了，這也就不存在信息問題。那么信息是什么？簡單說：從上面可知信息就是消息，消息是由不知到知知的過程，信息量的大小就是消息的多少，也即由不知到知知的多少，這是一般定義上的理解，在數學怎么定義信息及信息量的大小。再從上面我們也可以知道，在信息中蘊含著不確性，這種不確性在數學上就是事件的概率，對確定事件（消息）概率大信息量少，否則信息量就大，所以一般而言，小概率事件信息量大，大概率事件信息量小，如果概率P=1信息

14、量則為0。例如：中文畑'd文會庫（1）百年不遇事件，概率較小，一旦發(fā)生，必定信息量驚人；（2）兩軍對持，若勢均力敵（等概率分布）很難判定誰是勝家，信息量大。如果兩軍實力相差較遠（不等概率），則信息量小，易判定勝負，這說明：基本事件的個數相同者，以等概率分布場平均信息量大。信息可以識別，轉換、存貯、傳送、增值、信息既不是物質，也不是意識，信息的存在具有特殊性，同時與物質與意識又密切相關。信息的過程包含有發(fā)送、傳輸、接收三個基本過程。香農提出了如下模型稱之為信息傳播的基本模型。«? J陵道凝越評澳大殛從這個模型可知，信息量實際就是發(fā)送、傳輸、接收這個信息所要求表示這個事件（信

15、息）最小比特數。如發(fā)送某一事件A，需要3位（二進數）來表示，則說明該信息的信息量是 3bit，按 shannon 理論：信息源S的信息量用熵（entropy ）來定義：1H （s） = " R log2（） = -' FJ log2 RiRiiRi是符號Si在S中出現的概率1log2（）表示包含在Si中信息量，即編碼 Si所需二進制位數，H（ s）是S的總信息量 R例如：（1）一幅256級灰度的黑白圖像，每個象素點灰度概率為Pi=1/256，那么編碼每個象素要Iog21/256=8bit 中文 word 文檔庫，海量 word 文檔免費下載中文Word文檔庫1111000

16、0, 10101010, 0101010b 11111111- 00000000用煩變映射做的毎白閤1 中文 word 文檔庫，海量 word 文檔免費下載(2)電視屏上約有 500 X 600=3 X 105個格點，按每個點 10種不同的亮度等級計算，則共組成多少個不同畫面？按等概率計算，每個畫面概率是多少？電視屏上約有2個格點，按每個點2種不同的亮度等級計算，則共組成多少個不同畫面？按等概率計算，每個畫面概率是多少？-個黑晤點卩rr個黑格點1n-個黑白格點 r二個黑白格點三個黑白辭點231 中文 word 文檔庫，海量 word 文檔免費下載1 中文 word 文檔庫，海量 wor

17、d 文檔免費下載(2)電視屏上約有 500 X 600=3 X 105個格點，按每個點 10種不同的亮度等級計算,1031。5H(s)二im則共組成多少個不同畫面？按等概率計算，每個畫面概率是多少平均每個畫面可提供信息量為：=3 X 105X 3.32=106bitlOg21(3 105 )10310(3) 千字文章假定每字可從萬字表中任選，則可有不同的千字文：N=100001000=104000篇，按等概率計算，平均每篇千字文可提供的信息量為：H (s) log2(N)= log2 N = 4 103 3.32 =1.3 104bit1 中文 word 文檔庫，海量 word 文檔免費下

18、載www.wordwendan 中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan 中文Word文檔庫結論：可見一個電視畫面的信息遠遠超過千字文，從計算可知前者是后者的loo倍，圖像信息量是遠遠大于文本信息量。幾種主要信息編碼方法1、Sha nnon-Fa no 算法編碼有一幅40象素組成的圖像，每個象素灰度用 5級來表示，分別記為 A、B、C、D、E， 40個象素中出現 A級灰度數為15個，出現B級為7個，出現C級為7個，出現D和E級分別為6個和5個，按照Shsnnon理論，這幅圖像的熵為：=2.196H(s)Wlog2 坐 Zog240Zog240log24

19、0 9og2 坐4015407407406405也就是說，這幅圖像內每個象素平均可用2.196位表示，整個圖像共需40 X2.196=87.84bit，下面按Shannon-Fano的編碼方法進行編碼，其基本步驟如下：(1) 計算各符號(A E)亦即灰度等級出現的概率，并排序，見表1(2) 列表并計算各自的比特數：log2()(3) 用遞歸法分成兩部分，每部分具有近似相目同的次數，如圖所示直至分到各種表示的符號級別，并給它們分配“0或“1；可以是概率大者為“0也可以是概率小者為 “ 0,”另外一個就對應為“1。符號出現的次數 )Lo亞1/PP分配的代碼需要的比特數A15(0.375)

20、L41500030B7(0 J 75)2.514501147(0,175)2.51451014D6() J 50)2.736911018E5(0.125)3.000011115/91罔Shannon-Fano算法實例壓縮比的計算利用這種算法，關鍵作用就是在傳遞這些信時，其傳輸比特位要少，亦即要求壓縮比較大，這種算法及編碼，簡單方便，其壓縮比為：如果不壓縮，每個象素有5級(A 巳灰度，每個象素至少要用 3bit來表示。此畫共有 40個象素，即要用120bit用Shsnnon-Fano算法則需共計91bit，因此壓縮比是1.3:1，這種壓縮比對圖像而言還是很小的。2、Huffman編碼算法前面介

21、紹的Sha nnon-Fa no是1948年提出的一種非定長編碼，稱為變長碼 (Variable-Length code),由于是據概率進行的編碼方法，所以又稱為統計編碼，或稱為熵編碼。Shannon-Fano編碼只是指出存在一種無失真的編碼，使得編碼平均碼長逼近熵值這個下限，但它并沒有給出具體的編碼方法。下面介紹另一種變長的統計熵編碼的方法，這就是Huffamn編碼方法。它是基于變字長編碼的最佳編碼定理。(定理)在變字長碼中，對于出現概率大的信息符號編短字長的碼，對于出現概率小的中文Word文檔庫信息符號編以長字長的碼，如果碼字長度嚴格按照符號概率的大小的相反順序排列，則平均碼字長度一定

22、小于按任意方式排列得到的碼字長度。(證明)：設最佳排列方式的碼字平均長度為L,則有m匚八mp(ai)i 4p(a)為信號源符號出現 ai的概率,ni是符號ai的編碼長度且規(guī)定：p(a) > p(as) ,ni w ns , i=1,2,3 .m, s=1,2,3 m如果將ai的碼字與 as的碼字互換，其余碼字不變，經過這樣互換后，平均碼字長度變成匸，即有：L =ni p(aj 爲*5 p(aj 爲卩(&)爲:;：rmpm)L ni p(aiK-n p(asK爲足 P(aJ ：nmP(am)L 匸=n P(aJ +n p(as) -ni p(a$) -nsP(aJ 匚二匚 hp(

23、as) nsp(aj - mp) - nsp(as)】 =L (ns -nJ Ip®) - p(a$)丨因為ns > ni , p(a)p(as),所以匚a l ，亦即l為是最短編碼。Hufnnan編碼方法于1952問世至今，經久不衰，廣泛應用于各種數據壓縮技術中，且仍不失為熵編碼中最佳方法就是因為滿足上述定理，下面舉例來具體說明編碼過程：假設要傳的信息源是下：8個不同的電平值，而這個電平值xi(i=1-8)對應的概率事先已知如電平編號i絡 x3X 4 x5x7出現概率Pi 0.40 0.20 0.15 0.10 0.071K04 0,03 0.011編碼步驟是(1) 計算

24、各信號源符號的概率；(2) 將信源符號按概率遞減順序排列；(3) 把兩個最小的概率相加作為新符號的概率，并按(2)重排；(4) 重復(2), (3)直至全部概率之和為1 ;(5) 在每次合并信源時，將兩個信源分別賦于“(和“1”(一般概率大賦值 0，概率小賦1, 也可相反)；(6) 尋找每一個信源的符號直到概率為1處，記錄其路徑上的“1和“ 0<(如圖所示。(7) 從尾部(含概率為1處)開始到信號源將其賦給的“ 0或 “ 1 代碼寫出，列于是表中文Word文檔庫信息Xi熵計算：1H(x)八 Pi log22.41bitPi亦即每個信息源（i=1-8）平均至少要 2.41bit，整個信息共

25、需要 2.41*8=19.28bits宿蕊i概率PjI IufTnnan 碼碼長ljbit碼長概率p"i=pJiXx0.4110.4X20.200030.6X30J5(101rJ045X,0.1001130.30論0.070101斗0,28冬0.040100050.20X70,0301001060.18Xs110101001160.06Huffman平均每個信息源xi平均需碼長為：L 八 Pih =2.47bit按定長編碼：信息源有8個，每個信息源至少要N=3位，可見，Huffman編碼比定長編碼要少 3-2.47=0.53bit，節(jié)省18%存儲空間編碼效率 =M/L=2.41/2.

26、47=97.6%Huffman的編碼雖然是可變的，但卻不需要碼同步信號，例如，碼串中的第一位為1，那么肯定是電平 X1，因為沒有其它電平代碼開始是1,因此下一位是下一個電平代碼的第一位。對Huffman編碼只要事先編寫一個解釋各種代碼意義的詞典”即碼薄即可依次解碼。Huffman具有以下特點：（1）平均碼長L - H （熵編碼）（2）平均碼長L N （等定長編碼）采用Huffman編碼時有幾個問題值得注意：（1）Huffman編碼沒有錯碼保護，而不具糾錯功能；（2）Huffman是可變長編碼，因此很難隨意查找或調用編碼圖象或文件之中的中間內容，然后再譯碼，就需要在存儲代碼之前加以考慮；中文Wo

27、rd文會庫（3） Huffman進行編碼解碼也相當費時。復習Huffman 一下喔？哈夫曼（Huffman ）編碼方法是利用了下面這個定理：在變字長碼中，對于出現概率大的信息符號以短字長編碼，對于出現概率小的信息符號以長字長編碼。如果碼字長度嚴格按照符號概率的大小的相反順序排列，則平均碼字長度一定小于按任何其他符號順序排列方式得到的碼字長度。Huffman編碼的具體步驟歸納如下：（1）概率統計（如對一幅圖像，或m幅同種類型圖像作灰度信號統計），得到n個不同概率的信源信息符號；（2）將信源信息符號的n個概率，按概率大小排序；（3）將n個概率中，最后兩個小概率相加，這時概率個數減為n-1個

28、；（4）將n-1個概率，按大小重新排序；（5）重復（3），將新排序后的最后兩個小概率再相加，相加和與其余概率再排序；（6）如此反復重復 n-2次，最后只剩兩個概率序列；（7）以二進制碼元（0，1）賦值，構成 Huffman碼字，編碼結束。3、算術編碼1. 算術編碼基本原理此法比Huffman編碼、行程長度等熵編碼方法都復雜，但它不需要傳送像Huffman編碼那樣的Huffman碼表，同時算術編碼還有自適應能力，所以算術編碼是實現高效壓縮數據中很有前途的編碼方法。它跳出了分組編碼的范疇，是從全序列出發(fā)，采用遞推形式的連續(xù)編碼。它不是將單個信源符號映射成一個碼字，而是將整個輸入符號序列

29、映射為實數軸上0，1區(qū)間內的一個間隔，其長度等于該序列的概率，并在該間隔內選擇一個代表性的二進制小數，作為實際的編碼輸出，使其平均碼長逼近信源的熵，從而達到高效編碼的目的。算術編碼（Orithmetic Coding ）是20世紀60年代初，由Elias提出的，1976年Rissanen 和Pasco首次介紹其實用技術。算術編碼的基本原理是：將編碼的信息表示成實數0和1之間的一個間隔（interval），信息越長，編碼間隔就越小，表示這一間隔所需的二進制位數就越長。2. 舉例說明設輸入數據為eaio u,其出現概率和所設定的取值范圍如下：a0.20,0.2eio0.2,0.

30、50.5,0.60.6,0.8u0.20.8,1.0Low=0 ； range為編碼間隔 rangehigh為編碼字符分配字符概率范圍設high為編碼間隔的高端，high=1;low為編碼間隔的低端，的長度，range=high-low; rangelow為編碼字符分配的間隔低端；的間隔高端。則一個字符編碼后新的low和hogh按下式計算：low=low+range x rangelow ;high=low+range x rangehigh(1) 在第一個字符 e被編碼時，e的rangelow=0.2 , rangehight=0.5 ,因此按公式:low=0+1 x 0.2=0.2high

31、=0+1 x 0.5=0.5ran ge=high-low=0.5-0.3=0.2此時分配給e的范圍為0.2,0.5第二個字符 a編碼時使用新生成范圍 0.2,0.5, a的rangelow=0 , rangehigh=0.2 。中文Word文檔庫low=0.2+0.3 X 0=0.2high=0.2+0.3 X 0.2=0.26ran ge=high-low=0.26-0.3=0.06此時分配給a的范圍為0.2, 0.26第三個字符i編碼時用新生成范圍，i的rangelow=0.5 , rangehigh=0.6，則:low=0.2+0.06 X 0.5=0.23high=0.2+0.06

32、X 0.6=0.236ran ge=high-low=0.236-0.23=0.006此時分配給i的范圍為0.23,0.236第四個字符 o編碼時o的rangelow=0.6, rangehigh=0.8,貝U:low=0.23+0.006 X 0.6=0.2336high=0.23+0.006 X 0.8=0.2348ran ge=high-low=0.2348-0.2336=0.0012此時分配給o的范圍為0.23396 , 0.2342(5)第五個字符 u 編碼時 u 的 rangelow=0.8 ,rangehigh=1.0,貝U：low=0.2336+0.0012 X 0.8=0.2

33、3396high=0.2348+0.0012 X 1.0=0.2342此時分配給u的范圍為0.23396,0.2342編碼結果如下表所示：輸入字符的算術編碼結果輸入字符lowhighrangeea0.20.260.06i0.230.2360.006o0.23360.23480.0012u0.233960.2342(6)譯碼的時候又是如何處理的呢？例：根據上面給定字符的概率和取值范圍，對代碼0.23396進行譯碼，步驟如下：根據代碼所在范圍確定當前代碼的第一個字符，并輸出。由于0.23396在0.2,0.5的范圍內，故代碼對應的第一字符必定是e。輸出字符e。用0.23396減去

34、e發(fā)生的概率取值下限 0.2,使代碼變?yōu)?.03396，再除以e范圍的寬度0.5-0.2=0.3。得到0.1132，落入區(qū)間0 , 0.2),所以對應后續(xù)字符為a。轉到(2),將0.1132作為代碼繼續(xù)確定下一個譯碼字符的范圍。3. 總結算術編碼的過程實際上是用新加入的符號的取值范圍來縮小代碼的取值范圍，而釋放的過程與其相反。4、游程編碼游程編碼(Run Length Encoder , RLE )是種壓縮編碼，實現簡單，還原后得到的數據與壓縮前的數據完全相同，是無損壓縮技術。但RLE所能獲得的壓縮比有多大，這主要取決于圖像本身的特點。如圖像中具有相同顏色的圖像塊越大，圖像塊數目越少，獲得的

35、壓縮比就越高，反之，壓縮比就越小。對于重復色彩特別少的圖像，如果仍然使用RLE編碼方法,不僅不能壓縮圖像數據，反而可能使原來的圖像數據變得更大。中文Word文檔庫010110101001101010100000000000000000001111111111111111111第一個字節(jié)S SS前后兩個非零AC 系數之間連續(xù)零下一個非零AC系數幅值徧瑪所需的個數的比特數符號2第二個字節(jié) 中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan F個非o值的實際值5.4變換編碼預測編碼是一種較好地去除音頻、圖像信號相關性的編碼技術，而變換編碼也可有效去除圖像信號的相關性，

36、而且其性能還往往優(yōu)于預測編碼。641 變換編碼的原理變換編碼不是直接對空域圖像信號編碼，而是首先在數據壓縮前對原始輸入數據作某種正交變換，把圖像信號映射變換到另外一個正交向量空間，產生一批變換系數，然后再對這些變換系數進行編碼處理。它首先在發(fā)送端將原始圖像分割成n個子圖像塊，每個子圖像塊經過正交變換、濾波、量化和編碼后送信道傳輸到達接收端，接收端作解碼、逆變換、綜合拼接，恢復出空域圖像。Fourier Transformer， Laplace T，?直角坐標到時極坐標, 下圖給出了其過程示意圖:變換編、解碼過程示意圖灰度國像接送）正交變換對數字圖像的處理到底有什么好處呢？如果有中文Word

37、文檔庫一個正弦波，用采樣、量化的方法把它變換到空域上，或者說在空間上用一個個離散的量化值記錄下來，隨著時間的增長，數據量會呈海量”增長。但是換個思路，一個正弦波，只要記錄頻域上的幅度值、以及它的頻率，就可以完全表示這個正弦波。可見在頻域上描述信號，可大大減少數據相關性以及數據冗余。同理，設有兩個相鄰的數據樣本 x1與x2，因為每個樣本采用 3個比特編碼，故共有23=8 個幅度等級。而兩個樣本的聯合事件共有8 X 8=64種可能性，二維平面坐標表示，見下圖：12 3 4 56 7(a)考慮到相鄰樣值的相關性，x1與 x2同時出現相近幅度的可能性最大。因此合成可能性往往落在圖中以 x1=x2為對稱

38、軸的圈內。相關性越強則圈子越扁；反之，圈越圓。一般情況下，要對圈內各點的位置進行編碼，就要對兩個差不多大的坐標值分別進行編碼，說明x1處于某一幅度等級時，x2可能出現在不相同的任意幅度等級上?，F在如對該數據進行正交變換，從幾何上相當于坐標系旋轉45°,變成y1、y2坐標系，那么此時相關圈正好處在y1坐標軸下，且該圈越扁長，其在y1上的投影就越大，而在 y2上投影就越小。見下圖所示：中文Word文檔庫(b)由此可知，正交變換實現數據壓縮的本質在于：經過坐標系適當的旋轉和變換，能夠把散布在各個坐標軸上的原始數據，在新的、適當的坐標系中集中到少數坐標軸上，因此，可用較少的編碼位數來表示

39、一組信號樣本，實現高效率的壓縮編碼。642K-L變換K-L變換(Karhunen-Loeve )亦稱主分量變換，它從圖像統計特性出發(fā)用一組不相關的系數來表示連續(xù)信號，實現正交變換。K-L變換使向量信號的各個分量互不相關，因而在均方誤差準則下，它是失真最小的一種變換，故稱為最佳變換。由于它的最佳”特性，所以常常作為對其他變換技術性能的評價標準。K-L變換的壓縮性能是：對語音而言，用 K-L變換在13.5Kbit/s下得到的語音質量可與 56Kbit/s的PCM編碼相擬：對圖像來講，2bit/pixel的質量可與7bit/pixel的PCM編碼相當。6.4.3離散余弦變換離散余弦變換(Disc

40、rete Cosine Transform,DCT )是傅里葉變換的一種特殊情況。在傅里葉級數展開式中，如果被展開的函數是實偶函數，那么，其傅里葉級數中只包含余弦項，再將其離散化由此可導出余弦變換。變換原理：DCT是一種正交變換，它將信號從空間域變換到頻率域。在頻率域中，大部分的能量集中在少數幾個低頻系數上，而且代表不同空間頻率分量的系數間的相關性大為減弱，只利用幾個能量較大的低頻系數就可以很好地恢復原始圖像。對于其余的那些低能量系數，可允許其有較大的失真，甚至可將其置為0,這是DCT能夠進行圖像數據壓縮的本質所在。644變換后的壓縮1. 區(qū)域濾波和量化區(qū)域濾波是一個簡單的數據壓縮方法，它將

41、經過某種正交變換所得的系數矩陣分成幾個區(qū)域，對每區(qū)域按照空間頻率的權重取一種量化級數，然后根據這個量化級數進行量化。另一種更細致的量化方法是，根據視覺對圖形的敏感程度(通過主觀實驗確定)，對于變換系數矩陣中的每個變換系數分別乘以一個視覺加權系數，由這一系數決定分配編碼量的多少。2. “的游程編碼見圖所示：DCT變換后，變換系數矩陣中除主對角線外的元素很多是0,或接近于0，再加下視覺加權處理和量化，會產生更多的0。中文Word丈檔庫如果一行行編碼，o在對角線附近，編碼過程就會斷掉，一個游程就會結束。怎樣可使一連串的0的數目更多呢？用 zig-zag掃描讀取方式即可。5.5 數據壓縮編碼國際標準

42、H.261是被可視電話、電視會議中采用的視頻、圖像壓縮編碼標準，由CCITT制定，1990年12月正式批準。JPEG是由ISO與CCITT成立的聯合圖片專家組（Joi nt Photograhpic Experts Grooup , JPEG） ”，制定的用于灰度圖、彩色圖的連續(xù)變化靜止圖像編碼標準，于 1992年正式通過。而 MPEG則是以H.261為基礎。發(fā)展而來的。它是由IEC和ISO成立的運動圖像專家組（Moving Picture Experts Group ,MPEG ） ”制定，于 1992 年通過了 MPEG-1。6.5.1 JPEGJPEG是聯合圖像專家小組的英文縮寫，其

43、算法稱為JPEG算法，并且成為國際上通用的標準，因此又稱為 JPEG標準。JPEG是一個適用范圍很廣的靜態(tài)圖像數據壓縮標準，即可用于灰度圖像又可用于彩色圖像。它滿足以下要求：（1）達到或接近當前壓縮比圖像保真度的技術水平，能覆蓋一個較寬的圖像質量等級范圍，能得到很好”到極好”的評估，與原始圖像相比，人的視覺難以區(qū)分。（2）能適用于任何種類的連續(xù)色調的圖像，且長寬比都不受限制，同時也不受限于景物內容、圖像的復雜程度和統計特性等。（3）計算機的復雜性是可控制的，其軟件可在各種 CPU上完成，算法也可用硬件實現。（4）JPEG算法具有4種操作方式。第一，為順序編碼，每個圖像分量按從左到右

44、，從上到下掃描，一次掃描完成編碼；第二，累進編碼，圖像編碼在多次掃描中完成，接收端收到圖像是一個由粗糙到清晰的過程；第三，無失真編碼；第四，分層編碼，對圖像按多個窨分辨率編碼，接收端按其顯示分辨率有選擇地解碼。JPEG壓縮是有損壓縮，它利用了人視覺系統的特性，去掉視覺冗余信息和數據本身的冗余信息，在壓縮比為25： 1的情況下，壓縮后的圖像與原始圖像相比較，非圖像專家難辨真?zhèn)巍?。其算法框圖如下：中文 word 文檔庫，海量 word 文檔免費下載中文Word丈檔庫<a) DCT編碼器壓堀編碼步驟(b) DCT編碼器解壓縮步驟中文 word 文檔庫，海量 word 文檔免費下載中文

45、word 文檔庫，海量 word 文檔免費下載JPEG的編碼解碼器及編碼主要步驟如下圖是JPEG的基于DCT的編碼步驟框圖，另一圖是基于DCT的解碼(譯碼)步驟框圖，解碼是編碼的逆過程。這里由圖可知其編碼主要步驟：源圖像數據分割成 8X8像塊 DCT變換量化 Z字形編碼成數據串使用DPCM對直流DC進行編碼使用行程長度編碼的RLE (run-Length Encoding )對交直流AC系數編碼熵編碼(Entropy encoding ) 中文 word 文檔庫，海量 word 文檔免費下載中文 word 文檔庫，海量 word 文檔免費下載圖JPEG編碼器過程中文 word 文檔庫，海

46、量 word 文檔免費下載www.wordwendan 中文Word丈檔庫解碼器IDCT 量化器爛編碼壓縮數據量化麥編碼表圖JPEG解碼器過程離散余弦變換JPEG采用的是8X 8大小子塊的二維離散余弦變換DCT，在編碼器的輸入端，把原始圖像順序地分割成8 X 8的子塊系列。設原始采樣精度為P位，是無符號整數，輸入時把(0-2P-1 )范圍變?yōu)?-2 P-1, 2 P-1-1),當P=8bit時，每個樣本值減去128,數值范圍為(-128 , 128)當 P=12 時，每個樣本值減2048，數值范圍為(-2048, 2048),然后送入FDCT，解碼時IDCT輸出是有符號的，要變換成無符號數用

47、于重構圖像：變換公式為：廠1r 77164其中；16彌沁h)co®嚴亠+晦 lbu - v = 0,C(理)=C(v) =uv 0,C(w) = C(v) = 1F(0：0)珂工丫/(工丿)平均值dc系數V <u?v)I uO.vO,則為交流系數中文 word 文檔庫，海量 word 文檔免費下載中丈Word文檔庫i ii 11 mu ii min2.使用加權函數對 FDCT系數進行量化這種量化是對經過 FDCT變換后的頻率系數進行加權量化，這個加權函數對于人的視中文 word 文檔庫，海量 word 文檔免費下載中文 word 文檔庫，海量 word 文檔免費下載“o值

48、系數的數目，它是圖像中文Word文檔庫覺系統是最佳的。量化的目的是減小非“o系數的幅度以及增加質量下降的最主要原因。對于有損壓縮算法，JPEG算法使用如下表所增添的均勻量化器進行量化，量化步距是按照系數所在的位置和每種顏色分量的色調值來確定。17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999亮度量化值16111016244051611212141926586055141316244057

49、6956141722295187806218223756681091037724355564811041139249647887103121120101729295987727100103993. Z字形編排量化后的DCT系數要重新編排，這樣做可增加連續(xù)的“0系數的個數，也就是說盡量增加“0游程長度，最好的辦法是采用“Z字蛇形”矩陣，見表所示。0156141527282471316262942381217253041439111824314044531019233239455254202233384651556021343747505659613536484957586263Z字型排列順序圖中文 word 文檔庫，海量 word 文檔免費下載www.wordwendan

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第5章多媒體數據壓縮技術.

文檔簡介

溫馨提示

最新文檔

評論

第5章多媒體數據壓縮技術.

文檔簡介

溫馨提示

最新文檔

評論

相關文檔