第3章多媒體數(shù)據(jù)壓縮-2010

上傳人：2*** IP屬地：湖北上傳時間：2022-07-29 格式：PPTX 頁數(shù)：169 大?。?8.04MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩164頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、1第3章多媒體數(shù)據(jù)壓縮(sh j y su)3.1 數(shù)據(jù)壓縮的基本原理和方法3.2 音頻壓縮(y su)標準3.3 圖像壓縮標準3.4 視頻壓縮標準共一百六十九頁23.1 數(shù)據(jù)壓縮(sh j y su)的基本原理和方法所謂“數(shù)據(jù)”，通常是指信源所發(fā)信號的數(shù)字化表示或記錄所謂數(shù)據(jù)壓縮，就是以最少的數(shù)碼表示信源所發(fā)出的信號，減少(jinsho)容納給定消息集合或數(shù)據(jù)采樣集合的信息空間。信息空間亦即被壓縮對象是指：物理空間：如儲存器、磁盤、光盤等數(shù)據(jù)存儲介質(zhì)時間區(qū)間：如傳輸給定消息集合所需的時間電磁頻譜區(qū)域：如傳輸給定消息集合所需的帶寬等。壓縮的必要性音頻、視頻的數(shù)據(jù)量很大，如果不進行處理，計算機

2、系統(tǒng)幾乎無法對它進行存取和交換。共一百六十九頁33.1 數(shù)據(jù)壓縮(sh j y su)的基本原理和方法1950年在計算機普及之前，世界范圍內(nèi)信息量的增長速度是每150年翻一番；隨著計算機的廣泛應(yīng)用，1950-1960年間信息量的增長達到每10年翻一番；1960-1992年間縮短為每5年翻一番。人們預(yù)計2020年以后信息量每73天就要翻一番。幾個未經(jīng)壓縮的數(shù)字化信息的例子：B5（180 x255mm）、300dpi（12像素點/mm）-6.61MB/頁-CD-ROM 98頁雙聲道立體聲激光(jgung)唱盤（CD-DA）： 44.1x103x16x2=1.41Mb/s，650M ：- 約一小時數(shù)

3、字音頻磁帶（DAT）：48x103x16=768kb/s共一百六十九頁43.1 數(shù)據(jù)壓縮(sh j y su)的基本原理和方法SIF（Source Input Format）格式，NTSC制式，4:4:4采樣(ci yn)每幀數(shù)據(jù)：352x240 x3=253KB每秒數(shù)據(jù)：253x30=7.603MB/sCCIR（International Consultative Committee for Radio）格式，PAL制式，4：4：4采樣每幀數(shù)據(jù)：720 x576x3=1.24MB每秒數(shù)據(jù)：1.24x25=31.3MB/s實驗表明，176144的YUV原始視頻在10Mbps的LAN上傳送速率是

4、3幀/秒左右。陸地衛(wèi)星遙感圖片的水平和垂直分辨率分別為2340及3240，四波段、采樣精度為7bit的一幅圖像的數(shù)據(jù)量為212Mb，按每天30幅計算，其數(shù)據(jù)量為6.36Gb，而每年的數(shù)據(jù)量則高達2300Gb。共一百六十九頁53.1 數(shù)據(jù)壓縮(sh j y su)的基本原理和方法壓縮的可行性信息論認為：若信源編碼(bin m)的熵大于信源的實際熵，該信源中一定存在冗余度?？臻g冗余、時間冗余、視覺冗余、聽覺冗余等共一百六十九頁63.1.1 數(shù)據(jù)壓縮(sh j y su)技術(shù)的性能指標有三個關(guān)鍵參數(shù)評價一個(y )壓縮系統(tǒng)壓縮比壓縮性能常常用壓縮比定義（輸入數(shù)據(jù)和輸出數(shù)據(jù)比）圖象質(zhì)量無損壓縮

5、（圖象質(zhì)量不變）有損壓縮，失真情況很難量化，只能對測試的圖象進行估計。壓縮和解壓的速度壓縮和解壓可能不同時用，壓縮、解壓速度分別估計。共一百六十九頁73.1.2 數(shù)據(jù)冗余的類型與壓縮方法(fngf)分類數(shù)據(jù)冗余的類型空間冗余時間冗余信息熵冗余視覺冗余聽覺(tngju)冗余其它冗余結(jié)構(gòu)冗余知識冗余共一百六十九頁83.1.2 數(shù)據(jù)(shj)冗余的類型與壓縮方法分類空間冗余這是圖像數(shù)據(jù)中經(jīng)常存在的一種冗余。在同一幅圖像中，規(guī)則物體和規(guī)則背景的表面物理特性(txng)具有相關(guān)性，這些相關(guān)性的光成像結(jié)構(gòu)在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。A共一百六十九頁93.1.2 數(shù)據(jù)冗余(rn y)的類型與壓縮方法分類

6、時間冗余這是序列(xli)圖像（電視圖像、運動圖像）和語音數(shù)據(jù)中經(jīng)常出現(xiàn)的冗余。T共一百六十九頁103.1.2 數(shù)據(jù)冗余的類型(lixng)與壓縮方法分類信息熵冗余（編碼冗余）信息熵（entropy）是指一組數(shù)據(jù)所攜帶的信息量H= - Pilog2Pi (i=0k-1) k為數(shù)據(jù)類數(shù)或碼元個數(shù)Pi為第i個數(shù)據(jù)類數(shù)或碼元發(fā)生的概率d=Pib(yi) (i=0k-1)b(yi)是分配(fnpi)給碼元yi的比特數(shù)，理論上應(yīng)該是b(yi) -log2Pi ，實際中很難估計出碼元的的概率，當選用等概率時，d則大于H共一百六十九頁113.1.2 數(shù)據(jù)冗余的類型與壓縮(y su)方法分類視覺冗余人類視覺系

7、統(tǒng)對于圖像場的任何變化，并不是都能感知的。人類視覺系統(tǒng)一般的分辨(fnbin)能力約為26灰度級一般圖像量化采用28灰度級聽覺冗余人耳對不同頻率的聲音的敏感性是不同的，并不能察覺所有頻率的變化，對某些頻率不必特別關(guān)注，存在聽覺冗余。知識冗余有許多圖像的理解與某些基礎(chǔ)知識有相當大的相關(guān)性。例如人臉的圖像有固定的結(jié)構(gòu)。共一百六十九頁123.1.2 數(shù)據(jù)(shj)冗余的類型與壓縮方法分類結(jié)構(gòu)(jigu)冗余共一百六十九頁133.1.2 數(shù)據(jù)冗余的類型與壓縮(y su)方法分類根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致可以分為兩大類：一類是熵編碼、冗余壓縮法，也稱無損壓縮法、無失真壓縮法、可逆編碼等多用于文

8、本、數(shù)據(jù)的壓縮，非線性編輯系統(tǒng)為了保證視頻質(zhì)量，有些高檔系統(tǒng)采用的是無失真壓縮方法。二是熵壓縮法，也稱有損壓縮法、有失真壓縮法。圖像、聲音(shngyn)、動態(tài)視頻根據(jù)編碼原理預(yù)測編碼，變換編碼，統(tǒng)計編碼，分析合成編碼，混合編碼等共一百六十九頁143.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理統(tǒng)計編碼(bin m)識別一個給定的數(shù)據(jù)流中出現(xiàn)頻率最高的比特或字節(jié)模式，并用比原始比特更少的比特數(shù)來對其編碼。頻率越低的模式，其編碼的位數(shù)越多，頻率越高的模式編碼位數(shù)越少。若碼流中所有模式出現(xiàn)的概率相等，則平均信息量最大，信源就沒有冗余。(1)香農(nóng)-范諾編碼(2)行程編碼(3)LZW編碼(4)

9、霍夫曼編碼(5)算術(shù)編碼共一百六十九頁153.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理(1)香農(nóng)-范諾編碼香農(nóng)-范諾編碼算法需要用到下面兩個基本概念：Entropy(熵)的概念: 熵是信息量的度量方法，它表示某一事件出現(xiàn)的消息越多，事件發(fā)生的可能性就越小，數(shù)學(xué)上就是概率越小。某個事件的信息量用:Ii- pi *log2 pi表示，其中pi為第i個事件的概率0 pi 1信源S的熵的定義:按照香農(nóng)(Shannon)的理論，信源S的熵定義為H(S) = EIi = pi*log2(1/pi) i：1n其中pi是符號(fho)Si在S中出現(xiàn)的概率；log2(1/pi)表示包含在Si中的

10、信息量，也就是編碼Si所需要的位數(shù)。共一百六十九頁163.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理例如，一幅用256級灰度表示的圖象，如果每一個象素點灰度的概率均為 pi=1/256，編碼每一個象素點就需要比特。有一幅40個象素組成的灰度圖象，灰度共有5級，分別用符號A、B、C、D和E表示，40個象素中出現(xiàn)灰度A的象素數(shù)有15個，出現(xiàn)灰度B的象素數(shù)有7個，出現(xiàn)灰度C的象素數(shù)有7個等等(dn dn)，如表3-01所示。如果用3個比特表示5個等級的灰度值，也就是每個象素用3比特表示，編碼這幅圖象總共需要120比特。按照香農(nóng)理論，這幅圖象的熵為：H(S) = (15/40) * l

11、og2 (40/15) + (7/40) * log2 (40/7) + . + (5/40) * log2 (40/5) =2.196這就是說每個符號用2.196比特表示可以，40個象素需用87.84比特。8表3-01共一百六十九頁173.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理最早闡述和實現(xiàn)這種編碼的是香農(nóng)(1948年)和范諾(1949年）。它采用從上到下的方法進行編碼。首先按照符號出現(xiàn)的頻度(pn d)或概率排序，例如A、B、C、D、E，如表3-02所示，然后使用遞歸方法分成兩個部分，每一部分具有近似相同的次數(shù)，如圖3-01所示。按照這種方法進行編碼得到的總比特數(shù)為91。壓縮比

12、約為1.3 : 1。表3-02 Shannon-Fano算法舉例表共一百六十九頁183.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理Shannon-Fano算法編碼(bin m)過程：符號ABCDE概率15/407/407/406/405/4001000111碼字000110110111共一百六十九頁193.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理(2)行程編碼基本原理：文字、圖象、聲音等數(shù)據(jù)中，會出現(xiàn)大量重復(fù)的字符或數(shù)值。重復(fù)的數(shù)據(jù)可以用該值以及重復(fù)的次數(shù)來代替。將一個相同值的連續(xù)串用其值和串長來代替。比如在傳真通信中，所傳的文件多數(shù)為二值（黑、白）圖像。連續(xù)出現(xiàn)的像素點數(shù)

13、稱為行程長度，簡稱長度。適合：如文字輸入的二值圖像、黑白或彩色圖像（它們的分布都屬于平穩(wěn)(pngwn)的隨機分布，在同一行或相鄰行的像素之間具有較強的相關(guān)性）-效果好；純隨機的“沙丘型”圖像-效果差共一百六十九頁203.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理主要技術(shù)是檢測重復(fù)的比特或字符序列，并用它們的出現(xiàn)次數(shù)取而代之。該方法(fngf)有兩大模式：一是消零(消空白)，將數(shù)字中連續(xù)的“0”或文本中連續(xù)的空白用一個標識符(或特殊字符)后跟數(shù)字N(連續(xù)“0”的個數(shù))來代替。如數(shù)字序列： 742300000000000000000055編碼為： 7423Z1855共一百六十九頁21

14、3.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理二是行(游)程(run length)編碼。任何重復(fù)的字符序列可被一個短格式取代。任何重復(fù)4次或4次以上的字符由“該字符記號(M)重復(fù)次數(shù)”代替。例如(lr)數(shù)字序列： Name: . . . . . . . . . . CR 編碼為： Name: . M10 CR 用RLE編碼方法得到的代碼為：80315084180。共一百六十九頁223.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理AAAAAAAAAAAAAAA15A壓縮率 15 bytes / 2 bytes = 7.5AAAABBBBBCCCCCCCCDEEEE 4

15、A5B8C1D4E 壓縮率 22 bytes / 10 bytes = 2.2 MyDogHasFleas 1M1y1D1o1g1H1a1s1F1l1e1a1s壓縮率 13 bytes / 26 bytes = 0.5 共一百六十九頁23RLE編碼方式共一百六十九頁24RLE編碼流程圖共一百六十九頁253.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理RLE編碼模式由于所針對的編碼類型的不同，RLE算法也有很大的區(qū)別對位圖圖像編碼時，根據(jù)所編碼的元素的類型，RLE編碼模式可以分為：位模式對Bit進行編碼，而忽略Byte和Word的界限單色圖像（monochrome ）字節(jié)模式對Byte進行

16、編碼，而忽略Bit和Word的界限2字節(jié)的數(shù)據(jù)包，適用于1Byte/Pixel像素(xin s)模式對Pixel進行編碼，一個Pixel用多個Byte表示一個Pixel包含多少個Byte的信息保存的圖像的Header部分共一百六十九頁26RLE編碼模式共一百六十九頁273.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理RLE中的負壓縮MyDogHasFleas經(jīng)過RLE編碼之后，長度被壓縮了0.5倍（即膨脹了1倍）如何解決？隨之而來的問題壓縮數(shù)據(jù)的行程由3個字符變成了4個，影響了壓縮效率控制字符的引入涉及到了控制字符的選擇，并且(bngqi)要把出現(xiàn)在數(shù)據(jù)中的控制字符編碼成3個共一百六十九

17、頁283.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理RLE的三字節(jié)編碼(bin m)模式共一百六十九頁293.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理RLE圖片格式選用RLE作為壓縮編碼算法(sun f)的圖片文件格式有：MacPaintBMPPDFPCXTIFFRLE（CompuServe ，Utah以及 Microsoft）以RLE（CompuServe）格式為例進行說明觀看2個RLE圖片使用PMView軟件共一百六十九頁303.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理RLE（CompuServe）CompuServe RLE文件格式形成于80年代，是為1-bi

18、t圖像制定(zhdng)的標準文件頭包含3個字符ASCII ESC（HEX 1B）ASCII G（HEX 47）ASCII H（HEX 48）或者M（HEX 4D）表示高分辨率圖像模式，分辨率為256192表示中分辨率圖像模式，分辨率為12896共一百六十九頁313.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理文件體文件體位于文件頭之后由一對ASCII碼表示，第一位ASCII碼表示背景像素（黑）的值，第二位ASCII碼表示前景像素（白）的值。ASCII值相應(yīng)的像素個數(shù) 32如HEX（20 7E）表示 0 個背景象素，94個前景像素文件尾再次瀏覽(li ln)RLE圖片用16進制編輯器

19、打開RLE文件，找到其中的文件頭，文件體以及文件尾共一百六十九頁323.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理(3)LZW編碼詞典編碼的思想：數(shù)據(jù)本身包含有重復(fù)代碼這個特性。例如文本文件就具有這種特性。詞典編碼法的種類很多，歸納起來大致有兩類。第一類詞典法的想法是企圖查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過，然后用已經(jīng)出現(xiàn)過的字符串替代重復(fù)的部分，它的輸出僅僅是指向早期出現(xiàn)過的字符串的“指針”。這里所指的“詞典”：是指用以前處理過的數(shù)據(jù)來表示編碼過程中遇到(y do)的重復(fù)部分。第二類算法的想法是企圖從輸入的數(shù)據(jù)中創(chuàng)建一個“短語詞典(dictionary of th

20、e phrases)”，短語可以是任意字符的組合。編碼數(shù)據(jù)過程中當遇到已經(jīng)在詞典中出現(xiàn)的“短語”時，編碼器就輸出這個詞典中的短語的“索引號”，而不是短語本身。共一百六十九頁333.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理共一百六十九頁343.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理J.Ziv和A.Lempel在1978年首次發(fā)表了介紹這種編碼方法的文章。在他們的研究基礎(chǔ)(jch)上，Terry A.Weltch在1984年發(fā)表了改進這種編碼算法的文章，因此把這種編碼方法稱為LZW(Lempel-Ziv Walch)壓縮編碼。LZW算法得到普遍采用，對LZW算法進

21、一步的改進是增加可變的碼字長度，以及在詞典中刪除老的綴-符串。在GIF圖象格式和UNIX的壓縮程序中已經(jīng)采用了這些改進措施之后的LZW算法。參考多媒體技術(shù)基礎(chǔ)，林福宗，清華大學(xué)出版社共一百六十九頁353.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理LZW編碼LZW編碼時，首先將原始的數(shù)據(jù)分成多個條紋，每個條紋都單獨進行壓縮。 LZW算法基于一個轉(zhuǎn)換表或字串表，它將輸入(shr)字符映象到編碼中，使用可變長代碼，最大代碼長度為12位。LZW算法中的字串表對于每個條紋都不同，并且不必保留給解壓縮程序，因為解壓縮過程中能自動建立完全相同的字串表。實際上，它是通過查找冗余字符串并將此字符串

22、用較短的符號標記替代的壓縮技術(shù)。共一百六十九頁363.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理LZW的實現(xiàn)有很多的技巧性，但是算法本身卻是非常簡單的。用字符串表中的一個索引代碼來替代相應(yīng)的字符串在具體(jt)實現(xiàn)時，大多都使用12位的索引代碼來代替8位的輸入字符。字符串表有4096個存儲空間，正好可以采用12位的代碼來定位. 前256個空間用來存儲單個字符 (location 0 stores 0, location 1 stores 1, 等). 專門用于清零代碼，專門用于信息結(jié)束代碼當從輸入字符串中發(fā)現(xiàn)一個新串時，將其添加到字符串表中,其存儲空間從258到4095，數(shù)據(jù)解析

23、器一直解析新輸入的字符，只要新生成的字符串位于字符串表中。一旦新的字符產(chǎn)生了一個新的字符串，把這個新的字符串添加到字符串表中，并輸出上次已知的字符串的索引代碼共一百六十九頁373.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理LZW壓縮算法用單個字符(z f)初始化字符(z f)串表 STRING = 第一個輸入字符WHILE 輸入流中還有字符CHARACTER = 下一個輸入字符IF STRING + CHARACTER 在字符串表中STRING = STRING + CHARACTERELSE 輸出 STRING 的索引代碼把 STRING + CHARACTER 添加到字符串表

24、中STRING = CHARACTEREND WHILE 輸出 string 的索引代碼共一百六十九頁383.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理BABAABAAAENCODEROUTPUTSTRINGTABLEoutput codeRepresentingcodewordstring66B258BA65A259AB258BA260BAA259AB261ABA65A262AA262257AA共一百六十九頁393.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理LZW解壓算法用單個字符(z f)初始化字符(z f)串表OLD_CODE =第一個輸入代碼輸出 OLD_C

25、ODE所代表的字符WHILE 輸入流中還有代碼NEW_CODE = 下一個輸入代碼IF NEW_CODE 不在字符串表中STRING = 得到 OLD_CODE所對應(yīng)的字符（串）STRING = STRING + CHARACTERELSE STRING = 得到 NEW_CODE所對應(yīng)的字符（串）輸出 STRINGCHARACTER = STRING的第一個字符把 OLD_CODE + CHARACTER添加到字符串表中OLD_CODE = NEW_CODEEND WHILE共一百六十九頁403.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理 OutputOldcodeNewcod

26、eStringcharString TablecodestringB66A6565AA258BABA258258BAB259ABAB259259ABA260BAAA6565AA261ABAAA262262AAA262AAEOL257共一百六十九頁413.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理(4)霍夫曼編碼1952年Huffman提出了對統(tǒng)計獨立信源能達到最小平均碼長的編碼方法，也即最佳碼。最佳性可從理論上證明。這種碼具有即時性和唯一可譯性。原理：對出現(xiàn)概率大的信源符號賦予(fy)短碼字，而對于出現(xiàn)概率小的信源符號賦予(fy)長碼字。如果碼字長度嚴格按照所對應(yīng)符號出現(xiàn)概率大小

27、的逆序排列，則編碼結(jié)果平均碼字長度一定小于任何其他排列方式。Morse碼：用較少的點和線表示出現(xiàn)頻率較大的字母E (.) T (-) Q(-.-)共一百六十九頁423.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理現(xiàn)仍以一個具體的例子說明它的編碼步驟1、初始化，根據(jù)符號概率的大小按由大到小順序?qū)Ψ栠M行排序，如表3-03和圖3-02所示。2、把概率最小的兩個符號組成一個節(jié)點，如圖3-02中的D和E組成節(jié)點P1。3、重復(fù)步驟2，得到節(jié)點P2、P3和P4，形成一棵“樹”，其中的P4稱為根節(jié)點。4、從根節(jié)點P4開始到相應(yīng)于每個符號的“樹葉”，從上到下標上“0”(上枝)或者“1”(下枝)，至

28、于哪個為“1”哪個為“0”則無關(guān)緊要，最后的結(jié)果僅僅是分配的代碼不同，而代碼的平均長度是相同的。5、從根節(jié)點P4開始順著樹枝到每個葉子(y zi)分別寫出每個符號的代碼，如表3-03所示。電信-伍衛(wèi)國共一百六十九頁433.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理按照Shannon理論(lln)，這幅圖象的熵為H(S) = (15/40) * log2 (40/15) + (7/40) * log2 (40/7) + + (5/40)* log2 (40/5) = 2.196壓縮比1.37:1。表3-03共一百六十九頁443.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原

29、理圖3-02 霍夫曼編碼方法霍夫曼碼的碼長雖然是可變的，但卻不需要另外附加同步代碼。例如，碼串中的第1位為0，那末肯定是符號A，因為表示其它符號的代碼沒有一個是以0開始的，因此下一位就表示下一個符號代碼的第1位。同樣，如果出現(xiàn)“110”，那么它就代表符號D。如果事先編寫出一本解釋各種代碼意義的“詞典”，即碼簿，那么就可以根據(jù)(gnj)碼簿一個碼一個碼地依次進行譯碼。A(15/40)B(7/40)C(7/40)D(6/40)E(5/40)00001111P2(14/40)P1(11/40)P3(25/40)P4(40/40)0100101110111共一百六十九頁453.1.3 常用數(shù)據(jù)壓縮(s

30、h j y su)方法的基本原理Huffman編碼(bin m)舉例共一百六十九頁463.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理概率分布為2的負數(shù)(fsh)冪共一百六十九頁473.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理Huffman-雙字長(z chn)編碼舉例共一百六十九頁483.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理Huffman編碼小結(jié)Huffman方法的構(gòu)造程序是明確的，但構(gòu)造出來的碼字并不是唯一的。為什么？編碼碼字字長(z chn)參差不齊，硬件實現(xiàn)不方便。碼字在存儲或傳輸過程中，如果出現(xiàn)誤碼時，可能引起誤碼的連續(xù)傳播。為什么？變化的碼

31、距對不同的信源其編碼效率是不同的什么情況下最高？什么情況下最低？解碼時必須參照Huffman編碼表Huffman編碼表的缺省使用：減少了編碼時間，便于硬件實現(xiàn)共一百六十九頁493.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理(5)算術(shù)編碼算術(shù)編碼把一個信源集合表示(biosh)為實數(shù)線上的0到1之間的一個開閉區(qū)間。這個集合中的每個元素都要用來縮短這個區(qū)間。信源集合的元素越多，所得到的區(qū)間間隔就越小，當區(qū)間變小時，就需要更多的數(shù)位來表示這個區(qū)間，這就是區(qū)間作為代碼的原理。方法：首先假設(shè)一個信源的概率模型，然后用這些概率來縮小表示信源集的區(qū)間間隔。對二進制編碼來說，信源符號只有兩個。因此在編

32、碼初始階段可預(yù)置一個大概率Pe和一個小概率Qe，然后對被編碼比特流符號進行判斷。共一百六十九頁503.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理編碼過程描述：初始化子區(qū)間為0，1），0的概率：Qe，1的概率：Pe=1-Qe新子區(qū)間的起始位置前子區(qū)間的起始位置當前符號(fho)的區(qū)間左端前子區(qū)間長度新子區(qū)間的長度前子區(qū)間的長度當前符號的概率最后得到的子區(qū)間的長度決定了表示該區(qū)域內(nèi)的某一個數(shù)所需的二進制位數(shù)。共一百六十九頁513.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理例1 已知信源：，按以上(yshng)規(guī)則，對1011進行算術(shù)編碼：011/43/4X= 設(shè)C

33、表示子區(qū)間的起始位置，A表示子區(qū)間的長度。Qe=1/4，Pe=3/4，所以符號“0”的區(qū)間左端為0，“1”的區(qū)間左端為1/4，初始子區(qū)間為0，1），初始值為C0，A1。編碼過程如下：共一百六十九頁523.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理最后的子區(qū)間的起始位置=(85/256)d=0.33203125=(0.01010101)b子區(qū)間的長度(chngd)=（27/256 )d =0.10546875（0.00011011 )b 子區(qū)間尾=(7/16 )d=0.4375 d=(0.0111 )b編碼結(jié)果為子區(qū)間頭尾間的取值，其值為“0.011”,可編碼為”011“。解碼是編碼的逆

34、過程。共一百六十九頁533.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理例2：假設(shè)信源符號為00, 01, 10, 11，這些符號的概率為 0.1, 0.4, 0.2, 0.3 ，根據(jù)概率可把間隔(jin g)0, 1)分成4個子間隔：0, 0.1), 0.1, 0.5), 0.5, 0.7), 0.7, 1)，其中x, y)表示半開放間隔，即包含x不包含y。上面的信息可綜合在表3-04中。表3-04共一百六十九頁543.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理如果二進制消息序列的輸入為：10 00 11 00 10 11 01。編碼時首先輸入的符號是10，找到它的編碼范

35、圍是0.5, 0.7)。由于消息中第2個符號00的編碼范圍是0, 0.1)，因此它的間隔(jin g)就取0.5, 0.7)的第一個十分之一作為新間隔0.5, 0.52)。依此類推，編碼第3個符號11時取新間隔為0.514, 0.52)，編碼第4個符號00時，取新間隔為0.514, 0.5146)，。消息的編碼輸出可以是最后一個間隔中的任意數(shù)。整個編碼過程如圖3-03所示。共一百六十九頁553.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理圖3-03整個編碼(bin m)過程共一百六十九頁563.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理從0.5143836, 0.5

36、14402中選擇一個(y )數(shù)作為輸出：0.51439共一百六十九頁573.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理譯碼的消息(xio xi)：10 00 11 00 10 11 01共一百六十九頁583.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理在算術(shù)編碼中有幾個問題需要注意：由于實際的計算機的精度不可能無限長，運算中出現(xiàn)溢出是一個明顯的問題，但多數(shù)機器都有16-, 32-或者64位的精度，因此這個問題可使用比例縮放的方法來解決。算術(shù)編碼器對整個消息只產(chǎn)生一個碼字，這個碼字是在間隔0, 1)中的一個實數(shù)，因此譯碼器在接受到表示這個實數(shù)的所有位之前不能進行譯碼。算術(shù)編碼

37、也是一種(y zhn)對錯誤很敏感的編碼方法，如果有一位發(fā)生錯誤就會導(dǎo)致整個消息譯錯。共一百六十九頁593.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理算術(shù)編碼總結(jié)：算術(shù)編碼可以是靜態(tài)的或者自適應(yīng)的。在靜態(tài)算術(shù)編碼中，信源符號的概率是固定的。在自適應(yīng)算術(shù)編碼中，信源符號的概率根據(jù)編碼時符號出現(xiàn)的頻繁程度動態(tài)地進行(jnxng)修改。在編碼期間估算信源符號概率的過程叫做建模。需要開發(fā)動態(tài)算術(shù)編碼的原因是因為事先知道精確的信源概率是很難的，而且是不切實際的。當壓縮消息時，我們不能期待一個算術(shù)編碼器獲得最大的效率，所能做的最有效的方法是在編碼過程中估算概率。因此動態(tài)建模就成為確定編碼器壓

38、縮效率的關(guān)鍵。共一百六十九頁603.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理-有損壓縮預(yù)測編碼是數(shù)據(jù)壓縮理論的一個重要分支預(yù)測編碼是指利用前面的一個或多個信號對下一個信號進行預(yù)測，然后對實際值和預(yù)測值的差進行編碼。DPCM與ADPCM是兩種典型的預(yù)測編碼。線性預(yù)測、非線性預(yù)測理論基礎(chǔ)：現(xiàn)代統(tǒng)計學(xué)和控制論目標：減少數(shù)據(jù)在時間和空間上的相關(guān)性應(yīng)用：時間序列數(shù)據(jù)，如語音的分析與合成圖像的編碼與解碼關(guān)鍵技術(shù)：預(yù)測器的設(shè)計(shj)-線性預(yù)測函數(shù)共一百六十九頁613.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理差分脈沖編碼調(diào)制(tiozh)DPCM（Differential Pulse

39、Code Modulation）原理預(yù)測器量化器編碼器解碼器預(yù)測器信道接收端輸出XNXNeNXNeNeNXN+輸入XN發(fā)送端+-共一百六十九頁623.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理符號說明：XN ：為采樣(ci yn)的圖像或聲音數(shù)據(jù)XN ：是XN的預(yù)測值eN：是實際值與預(yù)測值的差值（ XN- XN ）eN ：是eN的量化值XN :是引入了量化誤差的XN 。共一百六十九頁633.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理例子：假設(shè)預(yù)測器的預(yù)測值為前一個樣值（即預(yù)測器為單位延遲），量化器不進行量化，系統(tǒng)(xtng)的輸入為：0、1、2、1、1、2、3、3、4、4

40、、 XN ： 0、1、2、1、1、2、3、3、4、4 XN ： 0、0、1、2、1、1、2、3、3、4 eN ： 0、1、1、-1、0、1、1、0、1、 0 量化器預(yù)測器輸入輸出+-XNeNXNeNXN共一百六十九頁643.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理預(yù)測器的設(shè)計：預(yù)測器通常設(shè)計成用前面(qin mian)幾個樣值來預(yù)測新樣值，而不是利用整個數(shù)據(jù)信源模型，這是因為模型太復(fù)雜，且是時變的，在大多數(shù)情況下預(yù)測幾乎不能夠?qū)崿F(xiàn)。科爾莫戈羅夫（1941年）、維納（1942年）進行了關(guān)于線性預(yù)測的開創(chuàng)性工作。最小均方預(yù)測誤差為最優(yōu)預(yù)測，即：通常采用的誤差函數(shù)是均方誤差（mse）mse

41、=E（S0 S0）2 E：數(shù)學(xué)期望，S0：實際值，S0：預(yù)測值。DPCM的改進ADPCM共一百六十九頁653.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理預(yù)測器的設(shè)計（續(xù)）：若線性預(yù)測器用前面的樣值s1、s2、、sn來預(yù)測S0，則預(yù)測值為：S0 = a1s1 + a2s2 + + ansn （3.1）令E0 = S0 - S0S0的最佳估計值是能使平方誤差(wch)E0的期望值最小的S0。為求出這一最小值，需計算偏導(dǎo)數(shù)，并令偏導(dǎo)數(shù)為零，并由協(xié)方差的定義可等到一組聯(lián)立方程。預(yù)測系數(shù)依賴與原始數(shù)據(jù)的統(tǒng)計特性，這對實際使用是不方便的。共一百六十九頁663.1.3 常用數(shù)據(jù)壓縮(sh j

42、 y su)方法的基本原理預(yù)測器的設(shè)計（續(xù)）：為了簡化預(yù)測器，使DPCM系統(tǒng)能做到實時壓縮，在實際中常常用固定的預(yù)測參數(shù)來代替最佳系數(shù)。如JPEG：選用前一樣值作為(zuwi)下一樣值的預(yù)測值。圖像處理中采用四點預(yù)測：a1=0.702，a2=-0.200，a3=0.437，a4=0.061a1=0.75，a2=-0.5，a3=0.5，a4=0.25(日本人)考慮到硬件實現(xiàn)方便、人的主觀因素共一百六十九頁673.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理ADPCM ：進一步改善量化性能或壓縮數(shù)據(jù)率的方法分類：線性自適應(yīng)預(yù)測、非線性自適應(yīng)預(yù)測自適應(yīng)量化根據(jù)信號分布不均勻的特點，系統(tǒng)

43、具有隨輸入信號的變化而改變量化區(qū)間大小以保持輸入量化器的信號基本均勻的能力。自適應(yīng)預(yù)測預(yù)測參數(shù)(cnsh)仍采用固定的；但此時有多組預(yù)測參數(shù)(cnsh)可供選擇。編碼時具體采用哪組預(yù)測參數(shù)(cnsh)根據(jù)信源的特征來自適應(yīng)的確定。通常將信源數(shù)據(jù)分區(qū)間編碼，編碼時自動地選擇一組預(yù)測參數(shù)，使該區(qū)間實際值與預(yù)測值的均方誤差最小。共一百六十九頁683.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理DPCM 和ADPCM通常把樣值壓縮到34比特，比PCM用8比特或16比特可減少(jinsho)一半以上空間。MS ADPCM預(yù)測系數(shù)表共一百六十九頁693.1.3 常用(chn yn)數(shù)據(jù)壓縮方法

44、的基本原理變換編碼定義：是指先對信號進行某種函數(shù)變換(binhun)，從一種信號（空間）變換(binhun)到另一種信號（空間），然后對變換(binhun)后的信號進行編碼。例如：將時域信號變換到頻域，因為聲音、圖像大部分信號都是低頻信號，在頻域中，信號的能量集中，再進行采樣、編碼可以進一步壓縮數(shù)據(jù)。如傅氏變換：將時間函數(shù)變換成頻率函數(shù)共一百六十九頁703.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理變換編碼的原理框圖(kungt)：數(shù)據(jù)壓縮三步驟：變換、變換域采樣、量化采樣量化編碼變換解碼器反變換信道或存儲輸入輸出-GAUA填零GU共一百六十九頁713.1.3 常用(chn yn)數(shù)據(jù)

45、壓縮方法的基本原理離散(lsn)變換：可以用矩陣表示。設(shè)信源序列為一個n行k列矩陣X（例如圖像掃描結(jié)果）；假設(shè)采用一維變換，變換后輸出序列為Y；變換矩陣為T。則有：Y = TX （信源端）如果取正交變換，則有：X = T-1Y （接收端）T：的尋找，協(xié)方差矩陣！共一百六十九頁723.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理最佳的正交變換：當經(jīng)過正交變換后的協(xié)方差矩陣為一對角矩陣，且具有最小均方誤差時，該變換稱最佳變換，也稱Karhunen-Loeve變換。變換編碼的關(guān)鍵在于：在已知的條件下，根據(jù)它的協(xié)方差矩陣去尋找(xnzho)一種正交變換，使變換后的協(xié)方差矩陣滿足或接近為一對角矩陣

46、。K-L（ Karhunen-Loeve）變換是最佳變換，在數(shù)據(jù)壓縮技術(shù)中占有重要的地位。采用這種變換，對圖像信號而言，變換后2b/樣值的質(zhì)量可與7b/樣值的質(zhì)量相比擬。變換矩陣由信源特征確定，不是恒定形式。計算量大、實用性不太高共一百六十九頁733.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理次最佳的正交變換：DFT變換：變換后的協(xié)方差矩陣接近對角矩陣。對不同信源有固定的正交變換矩陣。簡便、易于(yy)實現(xiàn)運算次數(shù)太多，為了加快速度可使用快速傅立葉變換（FFT），但它需要復(fù)數(shù)運算。所以使用不方便，速度不理想。DCT：是DFT取實部，有快速算法，對于平穩(wěn)過度的信源來說，DCT的性

47、能十分接近KLT，所以DCT在圖像壓縮中得到廣泛應(yīng)用共一百六十九頁743.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理分析合成編碼通過對原始數(shù)據(jù)的分析，將其分解為一系列更適合于表示的基元或者從中提取出更有本質(zhì)意義的參數(shù)，編碼僅對這些基本單元或者特征參數(shù)進行，而解碼時則借助于一定的規(guī)則或者模型，按照一定的算法將這些基元或者參數(shù)再綜合成原始數(shù)據(jù)的一個逼近。(1)矢量(shling)量化(2)小波變換編碼(3)分形圖像編碼(4)子帶編碼共一百六十九頁753.1.3 常用數(shù)據(jù)壓縮(sh j y su)方法的基本原理(1)矢量量化量化編碼按照一次量化的碼元個數(shù)，可分為標量量化和矢量量化兩種

48、。對數(shù)字化后的數(shù)據(jù)或PCM數(shù)據(jù)（樣本值）一個一個地進行量化，稱為標量量化。標量量化中可在隨機變量X出現(xiàn)概率比較高的間隔內(nèi)，選擇較小的判決間隔，而在其他區(qū)域內(nèi)選擇較大的間隔，這樣可以以較小的量化均方誤差進行量化。將這些數(shù)據(jù)分組，每組K維矢量，再以矢量為單元逐個進行量化，稱其為矢量量化?；?jy)語義編碼，其基本思想是采用非線性量化器，即對空間頻率及能量分布較大的系數(shù)分配較多比特數(shù)；反之分配較少的比特數(shù)，從而達到壓縮的目的。共一百六十九頁763.1.3 常用(chn yn)數(shù)據(jù)壓縮方法的基本原理(2)小波變換編碼小波變換是一個線性變換，能夠?qū)⒁粋€信號分解成對空間和時間、頻率的獨立貢獻，同時又不

49、失原信號所包含的信息。經(jīng)過小波變換后的圖像能量很集中，便于對不同的分量作不同的處理，達到較高的壓縮比。(3)分形圖像編碼分形編碼是一種模型編碼，它利用模型的方法，對需要傳輸?shù)膱D像進行參數(shù)估測。(4)子帶編碼利用帶通濾波器組把信號頻帶分割成若干子頻帶，然后(rnhu)分別處理。共一百六十九頁773.1.4音頻壓縮編碼(bin m)的基本方法通常把已有的話音編譯碼器分成三種類型：波形編譯碼器(waveform codecs)，音源編譯碼器(source codecs)和混合編譯碼器(hybrid codecs)。一般來說：波形編譯碼器的話音質(zhì)量高，但數(shù)據(jù)率也很高；音源編譯碼器的數(shù)據(jù)率很低，產(chǎn)生的合

50、成話音的音質(zhì)有待(yudi)提高；混合編譯碼器使用音源編譯碼技術(shù)和波形編譯碼技術(shù)，數(shù)據(jù)率和音質(zhì)介于它們之間。共一百六十九頁78圖三種(sn zhn)編譯碼器的話音質(zhì)量和數(shù)據(jù)率的關(guān)系共一百六十九頁793.1.4音頻壓縮編碼的基本(jbn)方法無失真壓縮音頻壓縮方法有失真壓縮Huffman編碼行程編碼波形編碼參數(shù)編碼混合編碼全頻帶編碼PCMDPCMADPCM子帶編碼自適應(yīng)變換編碼ATC 心理學(xué)模型矢量量化線性預(yù)測LPC矢量和激勵線性預(yù)測VSELP多脈沖線性預(yù)測MP-LPC碼本激勵線性預(yù)測CELP共一百六十九頁803.1.4音頻(ynpn)壓縮編碼的基本方法波形編譯碼波形編譯碼的想法是，不利用生

51、成話音信號的任何知識而企圖產(chǎn)生一種重構(gòu)信號，它的波形與原始話音波形盡可能地一致。這種編譯碼器的復(fù)雜程度比較低，數(shù)據(jù)速率在16 kbps以上，質(zhì)量相當(xingdng)高。低于這個數(shù)據(jù)速率時，音質(zhì)急劇下降。共一百六十九頁813.1.4音頻壓縮編碼的基本(jbn)方法聲音數(shù)字化有兩個(lin )步驟：第一步是采樣，就是每隔一段時間間隔讀一次聲音的幅度；第二步是量化，就是把采樣得到的聲音信號幅度轉(zhuǎn)換成數(shù)字值。量化有好幾種方法，但可歸納成兩類：一類稱為均勻量化，另一類稱為非均勻量化。采用的量化方法不同，量化后的數(shù)據(jù)量也就不同。因此，可以說量化也是一種壓縮數(shù)據(jù)的方法。共一百六十九頁823.1.4音頻(y

52、npn)壓縮編碼的基本方法均勻量化如果采用相等的量化間隔對采樣(ci yn)得到的信號作量化，那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度，也稱為線性量化量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲。共一百六十九頁833.1.4音頻壓縮編碼的基本(jbn)方法非均勻量化對輸入信號進行(jnxng)量化時，大的輸入信號采用大的量化間隔，小的輸入信號采用小的量化間隔。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時，采用相同的規(guī)則。共一百六十九頁843.1.4音頻壓縮編碼的基本(jbn)方法子帶編碼SBC(subband cod

53、ing) ：首先使用一組帶通濾波器BPF(band-pass filter)把輸入音頻信號的頻帶分成若干個連續(xù)的頻段，每個頻段稱為子帶。對每個子帶中的音頻信號采用單獨的編碼方案編碼。在信道上傳送時，將每個子帶的代碼復(fù)合起來。在接收端譯碼時，將每個子帶的代碼單獨譯碼，然后(rnhu)把它們組合起來，還原成原來的音頻信號。共一百六十九頁853.1.4音頻壓縮編碼(bin m)的基本方法采用對每個子帶分別編碼的好處有：第一，對每個子帶信號分別進行自適應(yīng)控制，量化階的大小(quantization step)可以按照每個子帶的能量電平加以調(diào)節(jié)。具有較高能量電平的子帶用大的量化階去量化，以減少總的量化噪

54、聲。第二，可根據(jù)每個子帶信號在感覺上的重要性，對每個子帶分配不同的比特數(shù)，用來(yn li)表示每個樣本值。例如，在低頻子帶中，為了保護音調(diào)和共振峰的結(jié)構(gòu)，就要求用較小的量化階、較多的量化級數(shù)，即分配較多的比特數(shù)來表示樣本值。而話音中的摩擦音和類似噪聲的聲音，通常出現(xiàn)在高頻子帶中，對它分配較少的比特數(shù)。共一百六十九頁863.1.4音頻壓縮編碼(bin m)的基本方法音源編譯碼的思想是：企圖從話音(huyn)波形信號中提取生成話音的參數(shù)，使用這些參數(shù)通過話音生成模型重構(gòu)出話音。針對話音的音源編譯碼器叫做聲碼器(vocoder)。在話音生成模型中，聲道被等效成一個時變?yōu)V波器(time-varyin

55、g filter)，它由白噪聲無聲話音段激勵，或者由脈沖串有聲話音段激勵。因此需要傳送給解碼器的信息就是濾波器的規(guī)格、發(fā)聲或者不發(fā)聲的標志和有聲話音的音節(jié)周期，并且每隔1020 ms更新一次。這種聲碼器的數(shù)據(jù)率在2.4 kbps左右，產(chǎn)生的語音雖然可以聽懂，但其質(zhì)量遠遠低于自然話音。增加數(shù)據(jù)率對提高合成話音的質(zhì)量無濟于事，這是因為受到話音生成模型的限制。盡管它的音質(zhì)比較低，但它的保密性能好，因此這種編譯碼器一直用在軍事上。共一百六十九頁873.1.4音頻壓縮編碼(bin m)的基本方法線性預(yù)測編碼LPC(linear predictive coding)是一種非常重要的編碼方法。從原理上講，L

56、PC是通過分析話音波形來產(chǎn)生聲道激勵和轉(zhuǎn)移函數(shù)的參數(shù)，對聲音波形的編碼實際就轉(zhuǎn)化為對這些參數(shù)的編碼，這就使聲音的數(shù)據(jù)量大大減少。在接收端使用(shyng)LPC分析得到的參數(shù)，通過話音合成器重構(gòu)話音。合成器實際上是一個離散的隨時間變化的時變線性濾波器，它代表人的話音生成系統(tǒng)模型。時變線性濾波器既當作預(yù)測器使用，又當作合成器使用。分析話音波形時，主要是當作預(yù)測器使用，合成話音時當作話音生成模型使用。隨著話音波形的變化，周期性地使模型的參數(shù)和激勵條件適合新的要求。共一百六十九頁883.1.4音頻壓縮(y su)編碼的基本方法線性預(yù)測器是使用過去(guq)的P個樣本值來預(yù)測當前時刻的采樣值x(n)。

57、預(yù)測值可以用過去P個樣本值的線性組合來表示：線性預(yù)測誤差為在給定的時間范圍里，如n0，n1，使e(n)的平方和即e(n)2為最小，這樣可使預(yù)測得到的樣本值更精確。通過求解偏微分方程，可找到系數(shù)ai的值。共一百六十九頁89共一百六十九頁90共一百六十九頁91共一百六十九頁923.1.4音頻壓縮編碼(bin m)的基本方法混合編譯碼企圖填補波形編譯碼和音源編譯碼之間的間隔。波形編譯碼器雖然可提供(tgng)高質(zhì)量的話音，但數(shù)據(jù)率低于16 kbps的情況下，在技術(shù)上還沒有很好地解決音質(zhì)的問題；聲碼器的數(shù)據(jù)率雖然可降到2.4 kbps甚至更低，但它的音質(zhì)根本不能與自然話音相提并論。為了得到音質(zhì)高而數(shù)據(jù)

58、率又低的編譯碼器，歷史上出現(xiàn)過很多形式的混合編譯碼器，但最成功并且普遍使用的編譯碼器是時域合成-分析器。共一百六十九頁933.1.4音頻壓縮(y su)編碼的基本方法思想：這種編譯碼器使用的聲道線性預(yù)測濾波器模型與線性預(yù)測編碼LPC (linear predictive coding)使用的模型相同，不使用兩個狀態(tài)(有聲/無聲)的模型來尋找濾波器的輸入激勵信號，而是企圖尋找這樣一種激勵信號，使用這種信號激勵產(chǎn)生的波形盡可能接近于原始話音(huyn)的波形。AbS編譯碼器由Atal和Remde在1982年提出，并命名為多脈沖激勵MPE(multi-pulse excited)編譯碼器，在此基礎(chǔ)上

59、隨后出現(xiàn)的是等間隔脈沖激勵RPE(regular-pulse excited)編譯碼器、碼激勵線性預(yù)測CELP(code excited linear predictive)編譯碼器和混合激勵線性預(yù)測MELP(mixed excitation linear prediction)等編譯碼器。共一百六十九頁94圖 Abs編碼器（上）和譯碼器（下）共一百六十九頁953.1.4音頻壓縮編碼(bin m)的基本方法AbS編譯碼器把輸入話音信號分成(fn chn)許多幀(frames)，一般來說，每幀的長度為20 ms。合成濾波器的參數(shù)按幀計算，然后確定濾波器的激勵參數(shù)。AbS編碼器是一個負反饋系統(tǒng)，通

60、過調(diào)節(jié)激勵信號u(n)可使話音輸入信號s(n)與重構(gòu)的話音信號之差為最小，也就是重構(gòu)的話音與實際的話音最接近。這就是說，編碼器通過“合成”許多不同的近似值來“分析”輸入話音信號，這也是“合成-分析編碼器”名稱的來由。MPE，RPE和CELP編譯碼器之間的差別在于所使用的激勵信號的表示方法。共一百六十九頁963.1.4音頻壓縮(y su)編碼的基本方法在MPE中，對每幀話音所用的激勵信號u(n)是固定數(shù)目的脈沖(michng)，在一幀中脈沖(michng)的位置和幅度必須由編碼器來確定，這在理論上可以找到很好的值，但實際上不太可能，因為計算太復(fù)雜。因此在實際上就使用次佳方法，一般來說，每5 ms

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第3章多媒體數(shù)據(jù)壓縮-2010

文檔簡介

溫馨提示

最新文檔

評論

第3章 多媒體數(shù)據(jù)壓縮-2010

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第3章多媒體數(shù)據(jù)壓縮-2010