多媒體數(shù)據(jù)壓縮編碼技術

上傳人：不*** IP屬地：上海上傳時間：2024-04-23 格式：DOCX 頁數(shù)：11 大?。?5.15KB 積分：25 舉報 版權申訴

已閱讀5頁，還剩6頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

學習要點：1、多媒體數(shù)據(jù)要所編碼的重要性和分類。2、常用壓縮編碼算法的根本原理及實現(xiàn)技術，推測編碼、交換編碼〔K-L變換、DCT變換〕、統(tǒng)計編碼〔Hufman〕。3、量化的根本原理和量化器的設計思想。4、靜態(tài)圖象壓縮編碼的國際標準〔JPEG〕原理、實現(xiàn)技術，以及動態(tài)圖像壓縮編碼國際標準〔MPEG〕的根本原理。一、多媒體數(shù)據(jù)壓縮編碼的重要性和分類1、多媒體數(shù)據(jù)壓縮的重要性多媒體技術最大難題是海量數(shù)據(jù)存儲與傳送電視信號數(shù)字化后的數(shù)據(jù)量。2、多媒體數(shù)據(jù)壓縮的可能性空間冗余例:圖象中的“A”是一個規(guī)章物體。光的亮度、飽和度及顏色都一樣，因此，數(shù)據(jù)A有很大的冗余。時間冗余信息熵冗余信息量：指從N信息熵：指一團數(shù)據(jù)所帶的信息量，平均信息量就是信息熵〔entropy〕。64326164log264=6(bits)N個數(shù)中選任意一個數(shù)X的概率為P(x)，假定選定任意一個數(shù)的概率都相等，P(x)=1/N，因此定義信息量I(x)=log2N=-log2(1/N)=-log2P(x)=I[P(x)得到了信息熵(entropy)。熵就是平均信息量。Xj(j=1,2,3??..NXP(xj),則信息源X構造冗余圖象有格外強的紋理構造。如草席圖構造上存在冗余。學問冗余圖像的理解與某些根底學問有關。例:人臉的圖像有同樣的構造：嘴的上方有鼻子，鼻子上方有眼睛，鼻子在中線上??視覺冗余視覺冗余是非均勻、非線性的。22就是數(shù)據(jù)冗余。其他冗余：空白的非定長性3、多媒體數(shù)據(jù)壓縮方法的分類按壓縮方法分：有失真壓縮、無失真壓縮按編碼算法原理分:推測編碼變換編碼量化與向量量化編碼信息熵編碼子帶編碼構造編碼基于學問的編碼二、量化1、量化原理量化處理是使數(shù)據(jù)比特率下降的一個強有力的措施。脈沖編碼調(diào)制〔PCM〕的量化處理是采樣之后進行，從理論分析的角度，圖像灰度值是連續(xù)的數(shù)值，而我們通常看到的是以〔0～255〕的整數(shù)表示圖像灰度，這是經(jīng)A/D256log2256=8圖像像素的灰度值，或色差信號值。數(shù)據(jù)壓縮編碼中的量化處理，不是指A/D變換后的量化，而是指以PCM碼作為輸入，經(jīng)正交變換、差分、或推測處理后，熵編碼之前，對正交變換系數(shù)、差值或推測誤差的量化處理。量化輸入值的動態(tài)范圍很大，需要以多的比特數(shù)表示一個數(shù)值，量化輸出只能取有限個整數(shù)，稱作量化級，期望量化后的數(shù)值用較少的比特數(shù)便可表示。每個量化輸入被強行歸一到與其接近的某個輸出，即量化到某個級。量化處理總是把一批輸入，量化到一個輸出級上，所以量化處理是一個多對一的處理過程，是個不行逆過程，量化處理中有信息喪失，或者說，會引起量化誤差〔量化噪聲〕。2、標量量化器的設計通常設計量化器有下述兩種狀況：▲給定量化分層級數(shù)，滿足量化誤差最小?！薅炕`差，確定分層級數(shù)，滿足以盡量小的平均比特數(shù)，表示量化輸出。量化方法有標量量化和矢量量化之分，標量量化又可分為，均勻量化、非均勻量化和自適應量化。3、矢量量化矢量量化編碼是近年來圖像、語音信號編碼技術中頗為流行的一種型量化編碼方法。矢量量化編碼方法一般是有失真編碼方法。矢量量化的名字是相對于標量量化而提出的。對于PCM數(shù)據(jù)，一個數(shù)一個數(shù)地進展量化叫標量量化。假設對這些數(shù)據(jù)分組，每組K個數(shù)構成一個K維矢量，然后以矢量為單元，逐個矢量進展量化，稱矢量量化。三、統(tǒng)計編碼1、統(tǒng)計編碼原理——信息量和信息熵圖像的概率分布、信息量和信息熵之間有什么關系？在圖像編碼壓縮理論爭論中，為什么要引入信息論中“熵”值的概念，有什么重要意義？這是我們下面需要說明的問題。概念：信息:是用不確定性的量度定義的。信息量:從N個相等可能大事中選出一個大事所需要的信息度量或含量。熵:假設將信源全部可能大事信息量進展平均就得到信息的熵(熵就是平均信息量)。傳輸包括：傳輸所需要的信息。以任意小的失真或零失真接收這些信息。已經(jīng)證明：只要符號速率不超過信道容量C符號可以以任意小的過失概率向該信道中傳輸。另外幾種典型的方法是:Fans,Huffman,編碼方法定理,變字長編碼最正確編碼定理。在變字長編碼中，對于消滅概率大的信息符號，編以短字長的碼,對于消滅概率小的信息符號編以長字長的碼，假設碼字長度嚴格依據(jù)符號概率的大小的相反挨次排列，則平均碼字長肯定小于按任何其他符號挨次排列方式得到的碼字長度?！?〕熵、熵編碼原理、變字長編碼最正確編碼定理(2)Huffman2、哈夫曼編碼Huffman編碼就是利用變字長最正確編碼實現(xiàn)信源符號按概率大小挨次排列。信源符號按概率大小挨次排列：消滅概率最小的兩個符號概率相加合成一個概率。將合成概率看成一個組合符號概率，重復上述做法，直到最終只剩下兩個符號概率為止。反過來逐步向前編碼，每一步有兩個分支各賜予一個二進制碼，可以對概率大的賦編碼為“0”，概率小的賦編碼為“1”。〔反之，也可以大的賦“1”，小的賦“0”〕特點：Huffman編碼字長參差不齊。HuffmanHuffmanHuffman編碼表省缺。好處：解決對稱性，降低了編碼時間。概率統(tǒng)計和Huffman編碼一般不對稱。3、算術編碼2060E1ias1976Bissanen和Pasco術。JPEG，JBIG01間的實數(shù)進展編碼，算術編碼用到兩個根本的參數(shù)：符號的概率和它的編碼間隔。信源符號的概率打算壓縮編碼的效率，也打算編碼過程中信源符號的間隔，而這些間隔包含在01之間。編碼過程中的間隔打算了符號壓縮后的輸出。根本思路：用一個浮點輸出數(shù)值代替一個流的輸入符號；把要壓縮的整段數(shù)據(jù)映射到一段實數(shù)半開區(qū)間[0，1)內(nèi)的某一區(qū)段，然后構造出小于l且大于或等于0的一個數(shù)值，這個數(shù)值就是對該輸入流進展壓縮編碼后的輸出代碼。例如：可將輸入字符流“eai”映射到區(qū)間[0.23，0.2360.23，作為該輸入字符流的編碼。根本原理：01隔所需的二進制位就越多。是一種二元碼的編碼方法。在不考慮信源統(tǒng)計的狀況下，只要監(jiān)視一小段時間內(nèi)碼消滅的頻率，不管并且只有算術運算。設編碼初始化子區(qū)間為[0，1)，Qe0算起，則Pe=1-Qe。隨著被編碼數(shù)據(jù)流符號的輸入，子區(qū)間漸漸縮小。子區(qū)間的起始位置=前子區(qū)間的起始位置+當前符號的區(qū)間左端×前子區(qū)間長度；子區(qū)間的長度=前子區(qū)間的長度×當前符號的概率〔等價于范圍長度〕；最終得到的子區(qū)間的長度打算了表示該區(qū)域內(nèi)的某一個數(shù)所需的位數(shù)。算術編碼在編、譯碼的過程中，子區(qū)間的起始位置和長度值的小數(shù)點后的位數(shù)越來越長，實際中無法實現(xiàn)。因此較有用的改進算法是限制小數(shù)點后的位數(shù)。在算術編碼中需要留意的幾個問題：163264算術編碼器對消息只產(chǎn)生一個碼字，這個碼字是在[0,1]中的一個實數(shù)，因此譯碼器在承受到表示這個實數(shù)的全部位之前不能進展譯碼。算術編碼也是一種對錯誤很敏感的編碼方法，假設有一位發(fā)生錯誤就會導致整個消息譯錯。算術編碼可以是靜態(tài)的或者自適應的。在靜態(tài)算術編碼中，信源符號的概率是固定的。在自適應算術編碼中，信源符號的概率依據(jù)編碼時符號消滅的頻繁程度動態(tài)地進展修改，在編碼期間估算信源符號概率的過程叫做建模。需要開開發(fā)態(tài)算術編碼的緣由是由于事先知道準確的信源概率是很難的，而且是不切實際的。當壓縮消息時，我們不能期盼一個算術編碼器獲得最大的效率，所能做的最有效的方法是在編碼過程中估算概率。因此動態(tài)建模就成為確定編碼器壓縮效率的關鍵。特點：①不必預先定義概率模型，自適應模式具有獨特的優(yōu)點；②信源符號概率接近時，建議使用算術編碼，這種狀況下其效率高于Huffman③算術編碼實現(xiàn)方法簡單一些，但JPEG成員對多幅圖像的測試結果說明，算術編碼比Huffman編5%左右的效率，因此在JPEGHuffman四、推測編碼1、推測編碼方法根本原理從相鄰數(shù)據(jù)之間由強的相關性特點考慮，可以利用前面已經(jīng)消滅的數(shù)值，進展推測〔估量〕，得到一個推測值，將實際值與推測值求差，對這個差值信號進展編碼、傳送，這種編碼方法即成為推測編碼方法。不帶量化器的DPCM線性推測編碼，屬于無失真編碼系統(tǒng)；帶有量化器的DPCM線性推測編碼，屬于有失真編碼系統(tǒng)。最正確量化器的設計，可利用人眼的視覺可見度閾值和視覺掩蔽效應等生理特征，來確定量化器的級數(shù)和步距，使量化誤差總處于人眼難以覺察的范圍內(nèi)，到達主觀評定準則的要求。自適應推測編碼ADPCM：自適應技術的概念是：推測器的推測系數(shù)和量化器的量化參數(shù)，能夠依據(jù)圖像的局部區(qū)域分布特點自動調(diào)整。實踐證明，ADPCM編、解碼系統(tǒng)與DPCM編、解碼系統(tǒng)相比，不僅能改善恢復圖像的評測質量和視覺效果，同時還能進一步壓縮數(shù)據(jù)。ADPCM系統(tǒng)包括自適應推測，即推測系數(shù)的自適應調(diào)整和自適應量化，即量化器參數(shù)的自適應調(diào)整兩局部內(nèi)容。五、變換編碼1、變換編碼的根本原理通過存儲這些系數(shù)到達壓縮的目的。本方法承受對整幅的原始圖像分成很多個矩形區(qū)域子圖像獨立進展變換。常用變換有：卡亨南—洛維變換〔KLT〕離散余弦變換〔DCT〕沃爾什—哈達瑪變換〔WHT〕離散傅里葉變換〔DFT〕。六、多媒體數(shù)據(jù)壓縮編碼的國際標準由國際標準化協(xié)會ISO、國際電信協(xié)會IEC和國際點心協(xié)會ITU領導下，制定的三個有關視頻圖像壓縮編碼的國家標準：JPEGH·261MPEG1、靜態(tài)圖像壓縮編碼的國際標準〔JPEG〕JPEG——聯(lián)合圖像專家小組標準，一種對靜態(tài)圖像壓縮的編碼算法。聯(lián)合”：國際電報詢問委員會CCITT和國際標準化協(xié)會ISO聯(lián)合組成的圖像專家小組。JPEG給出了一個使用于連續(xù)色調(diào)圖像的壓縮方法。JPEG到達或接近當前壓縮比與圖像保真度的技術水平，能掩蓋一個較寬的圖像質量等級范圍，能到達“很好”到“極好”的評估，與原始圖像相比，人的視覺難以區(qū)分；能適用于任何種類的連續(xù)色調(diào)的圖像，且長寬比都不受限制，同時也不受限于景物內(nèi)容、圖像的簡單程度和統(tǒng)計特性等。計算的簡單性是可掌握的，其軟件可在各種CPU上完成，算法也可用硬件實現(xiàn)。JPEG挨次編碼——每一個圖像重量按從左到右，從上到下掃描，一次掃描完成編碼；累進編碼——圖像編碼在屢次掃描中完成。累進編碼傳輸時間長，接收端收到的圖像是圖像是屢次掃描由粗糙到清楚的累進過程；無失真編碼——保證解碼后，完全準確地恢復源圖像采樣值，其壓縮比低于有失真壓縮編碼方法；分層編碼——圖像在多個空間區(qū)分率進展編碼。在信道傳送速率慢，接收端顯示器區(qū)分率也不高的情況下，只需做低區(qū)分率圖像解碼。DCT第一步：分割子塊其次步：對子塊進展正向離散余弦變換FDCT；第三步：對獲得的DCT系數(shù)進展量化處理；第四步：DCAC第五步：熵編碼。熵編碼可分成兩步進展，先把DC碼和行程碼轉換為中間符號序列，然后給這些符號賦以變長碼字。JPEGHuffman使用熵編碼還可以對DPCM編碼后的直流DC系數(shù)和RLE編碼后的溝通AC在JPEG查表(lookuptable)方法進展編碼。壓縮數(shù)據(jù)符號時，霍夫曼編碼器對消滅頻度比較高的符號安排比較短的代碼，而對消滅頻度較低的符號安排比較長的代碼。這種可變長度的霍夫曼碼表可以事先進展定義。2、MPEGMPEGMovingPictureExpertsGroup是特地制定多媒體領域內(nèi)的國際標準的一個組織，該組織成立于1988300名多媒體技術專家組成。MPEGMPEG最初MPEG31.5Mbps，lOMbps，40Mbps命名為MPEG-1，MPEG-2，MPEG-3。l992年，MPEG-2適用范圍擴大到HDTV，能支持MPEG-3的全部功能，MFEG-3MPEG-1標準：MPEG-11.5MbpsMPEG-11.5Mbps一個單一的MPEGMPEG-14①MPEG②MPEG視頻：定義視頻數(shù)據(jù)的編碼和重建圖像所需的解碼過程，亮度信號區(qū)分率為360×240，色度信180×120；③MPEG④全都性測試。MPEG-1此外，MPEG解碼過程是不對稱算法，解碼過程要比編碼過程相對簡潔。實際上，MPEG-1MPEG-2方案，重點將解碼算法標準化。因而用硬件實現(xiàn)MPEG算法時，人們首先實現(xiàn)MPEG的解碼器，如C—CubeCL450MPEGMPEG音頻壓縮算法是第一個高保真音頻數(shù)據(jù)壓縮國際標準，它同時可完全獨立應用MPEG32kHz，44.1kHz48kHz；4種模式之一支持單聲道或雙聲道；壓縮后的比特流具有預定義的比特率之一；MPEG3編碼后的比特流支持循環(huán)冗余校驗CRC；MPEGMPEG僅使用幀內(nèi)編碼方法無法到達很高的壓縮比；用單一的靜止幀內(nèi)編碼方法能最好地滿足隨機存取的要求。具體實現(xiàn)中承受了一個折中解決方案，在MPEG算法中承受兩種根本技術：基于塊的運動補償技術，目的是削減時間上冗余性；基于DCT變換的ADCT基于塊的運動補償技術——MPEGMPEG3I利用圖像自身的相關性壓縮，供給壓縮數(shù)據(jù)流中的隨機存取的點，承受基于ADCT的編碼技術，壓縮1～2IJPEGP用最近的前一個I圖像(或P圖像)推測編碼得到(前向推測)，也可以作為下一次推測的參照圖像，也稱為推測圖。BB圖橡在推測時，既可使用前一個圖像作參照，也可使用下一個圖像作參照或同時使用前后兩個圖像作為參照圖像(雙向推測)，也稱雙圖。4幀內(nèi)編碼；(2)前向推測；(3)后向推測；(4)雙向推測基于塊的運動補償技術：運動補償技術主要用于消退P圖像和B圖像在時間上的冗余性，提高壓縮效率。MPEG所謂基于塊的運動補償技術即：在參照幀中查找符合肯定條件限制、當前被推測塊的最正確匹配塊；當找到匹配塊后，在恢復被推測塊時，承受兩種處理方法：直接用匹配塊代替；用匹配塊加上推測誤差〔推測誤差承受ADCT編碼〕。每個包含運動信息的16×16宏塊，相對于前面相鄰塊的運動信息作差分偏碼，得到運動差值；然后對運動差值，使用變長碼編碼方法，進一步壓縮數(shù)據(jù)。留意：MPEG標準只說明白怎樣表示運動信息，并沒有說明運動矢量如何計算。MPEG-2MPEG-219901993年ISO的高質量圖像和聲音編碼標準。MPEG-2可以說是MPEG-1MPEG-2增加了很多MPEG-1(scalability)功能。MPEG-24～9Mbit/s，最高達15Mbit/s。MPEG-2的標準號為ISO/IEC13818，標準名稱為“信息技術—電視圖像和伴音信息的通用編碼MPEG-2MPEG—2(1.5Mbps以上)，來支持具有更高區(qū)分率圖像的壓縮和更高的圖像質量；為了適應不同應用的要求，保證數(shù)據(jù)的可交換性，定義了不同的功能檔次，每個檔次又分為幾個等級編碼器的設計有較大的自由度MPEG-211種標準，以保證與MPEG-1求；MPEG-2MPEG—1MPEG-2的編碼方法和MPEG-l的區(qū)分主要是在隔行掃描制式下，DCT變換是在場內(nèi)還是在幀內(nèi)進展由用DCT；而細節(jié)少、運動重量多的圖像在場內(nèi)進展DCT。MPEG—2MPEG2視頻體系要求必需保證與MPEG1/

人人文庫> 全部分類> 應用文書 > 研究報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多媒體數(shù)據(jù)壓縮編碼技術

文檔簡介

溫馨提示

最新文檔

評論

多媒體數(shù)據(jù)壓縮編碼技術

文檔簡介

溫馨提示

最新文檔

評論

相關文檔