版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2章多媒體數(shù)據(jù)壓縮技術(shù)概述:
本章主要講述了多媒體數(shù)據(jù)的壓縮技術(shù)。
1、數(shù)據(jù)壓縮的基本原理和方法;
2、統(tǒng)計(jì)編碼
3、圖像壓縮編碼
4、數(shù)字音頻壓縮編碼
5、數(shù)字視頻壓縮編碼2.1數(shù)據(jù)壓縮的基本原理和方法
為什么要進(jìn)行數(shù)據(jù)壓縮?多媒體信息包括了文本、數(shù)據(jù)、聲音、動(dòng)畫、圖形、圖像以及視頻等多種媒體信息。雖然經(jīng)過(guò)數(shù)字化處理后其數(shù)據(jù)量是非常大的,如果不進(jìn)行數(shù)據(jù)壓縮處理,計(jì)算機(jī)系統(tǒng)就無(wú)法對(duì)它進(jìn)行存儲(chǔ)和交換。另一個(gè)原因是圖像、音頻和視頻這些媒體具有很大的壓縮潛力。因?yàn)樵诙嗝襟w數(shù)據(jù)中,存在著空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺(jué)冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì)冗余等。它們?yōu)閿?shù)據(jù)壓縮技術(shù)的應(yīng)用提供了可能的條件。空間冗余:相鄰區(qū)域時(shí)間冗余:相鄰時(shí)間結(jié)構(gòu)冗余:相鄰位置知識(shí)冗余:知識(shí)推理視覺(jué)冗余:邊緣區(qū)域相似性冗余:多個(gè)區(qū)域相似聽覺(jué)冗余:較弱的聲音2.1數(shù)據(jù)壓縮的基本原理和方法
數(shù)據(jù)壓縮技術(shù)的分類(1)根據(jù)質(zhì)量有無(wú)損失可分為有損失編碼和無(wú)損失編碼。(2)根據(jù)數(shù)據(jù)壓縮算法,可以將數(shù)據(jù)壓縮技術(shù)分為統(tǒng)計(jì)編碼、預(yù)測(cè)編碼、變換編碼、分析-合成編碼和其他編碼。
統(tǒng)計(jì)編碼:根據(jù)出現(xiàn)的概率分布預(yù)測(cè)編碼:原始信號(hào)取樣,量化存儲(chǔ)差值PCM編碼:對(duì)連續(xù)語(yǔ)音進(jìn)行采樣量化與向量化編碼:將模擬量轉(zhuǎn)化數(shù)字頻段劃分編碼:基于頻段劃分處理變換編碼:對(duì)信號(hào)進(jìn)行函數(shù)變換知識(shí)編碼:規(guī)則庫(kù)混合編碼:兩種以上編碼冗余壓縮法(無(wú)損壓縮法)該方法在壓縮時(shí)去掉部分冗余信息,而這些被丟失信息經(jīng)過(guò)解壓后可以完整的被恢復(fù)到壓縮前的狀態(tài),是一個(gè)可逆的過(guò)程。因此,冗余壓縮法不會(huì)產(chǎn)生數(shù)據(jù)失真,一般用于文本、數(shù)據(jù)的壓縮,以保證完全的恢復(fù)原始數(shù)據(jù)。但這種方法的壓縮比較小,一般在2:1~5:1之間。2.1數(shù)據(jù)壓縮的基本原理和方法
熵壓縮法(有損壓縮法)該方法壓縮時(shí)會(huì)丟失部分冗余信息,且這些被丟失信息不能被恢復(fù),是一個(gè)不可逆的過(guò)程。解壓后的數(shù)據(jù)存在一定程度的失真。這種壓縮方法的壓縮比可達(dá)幾十到上百,常用于圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓縮。2.1數(shù)據(jù)壓縮的基本原理和方法
2.1數(shù)據(jù)壓縮的基本原理和方法數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)
(1)壓縮比:壓縮比例(2)壓縮、解壓縮速度(3)壓縮質(zhì)量
:感知效果2.2統(tǒng)計(jì)編碼
統(tǒng)計(jì)編碼屬于無(wú)損壓縮編碼,是根據(jù)信源符號(hào)出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼。其目的是在信源符號(hào)和碼字之間建立明確的一一對(duì)應(yīng)關(guān)系,以便在恢復(fù)時(shí)能準(zhǔn)確地再現(xiàn)原信號(hào),同時(shí)要使平均碼長(zhǎng)或碼率盡量小。
2.2統(tǒng)計(jì)編碼
相關(guān)概念信息:信息是用不確定性的量度定義的。信息量:是指從N個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量,也就是在辯識(shí)N個(gè)事件中特定的一個(gè)事件的過(guò)程中所需要提問(wèn)“是或否”的最少次數(shù)2.2統(tǒng)計(jì)編碼
相關(guān)概念(3)熵:如果將信源所有可能事件的信息量進(jìn)行平均,就得到了信息熵(entropy)。熵就是平均信息量。2.2統(tǒng)計(jì)編碼如果用0和1組成的二進(jìn)制數(shù)碼為含有n個(gè)符號(hào)的某條信息編碼,假設(shè)符號(hào)Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn,則該符號(hào)的熵也即表示該符號(hào)所需的位數(shù)為:En=-log2(Pn)整條信息的熵,即表示整條信息所需的位數(shù)為:E=∑En2.2統(tǒng)計(jì)編碼例如:對(duì)下面這條只出現(xiàn)了a、b、c三個(gè)字符的字符串:aabbaccbaa,字符串長(zhǎng)度為10,字符a、b、c分別出現(xiàn)了5、3、2次,則a、b、c在信息中出現(xiàn)的概率分別為0.5、0.3、0.2,他們的熵分別為:Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322E=Ea*5+Eb*3+Ec*2=14.855位2.2統(tǒng)計(jì)編碼
最佳編碼定理在變字長(zhǎng)碼中,對(duì)于出現(xiàn)概率大的信息符號(hào)編以短字長(zhǎng)的碼,對(duì)于出現(xiàn)概率小的信息符號(hào)編以長(zhǎng)字長(zhǎng)的碼,如果碼字長(zhǎng)度嚴(yán)格按照符號(hào)概率的大小的相反順序排列,則平均碼字長(zhǎng)度一定小于按任何其它符號(hào)順序排列方式得到的碼字長(zhǎng)度。2.2統(tǒng)計(jì)編碼Huffman編碼步驟:(1)概率統(tǒng)計(jì),得到n個(gè)不同概率的信息符號(hào);(2)將n個(gè)信源信息符號(hào)的n個(gè)概率,按概率大小排序;(3)將n個(gè)概率中,最后兩個(gè)小概率相加,這時(shí)概率個(gè)數(shù)減為n-1個(gè);(4)將n-1個(gè)概率,按大小重新排序;(5)重復(fù)(3),將新排序后的最后兩個(gè)小概率相加,相加和與其余概率再排序;(6)如此反復(fù)重復(fù)n-2次,得到只剩兩個(gè)概率序列;(7)以二進(jìn)制碼元(0,1)賦值,構(gòu)成哈夫曼碼字,編碼結(jié)束。010.39010.35010.611000.261010.11a1a2a3a4a5a6a70.200.190.180.170.150.100.01101100000101001100111信源符號(hào)概率Huffman碼編碼過(guò)程Huffman編碼過(guò)程x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.200.200.400.350.250.600.40信源符號(hào)概率編碼過(guò)程第一步第二步第五步第四步第三步輸入輸入Huffman編碼步驟圖4.8Huffman碼字的構(gòu)成x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.200.200.400.350.250.600.40第一步第二步第五步第四步第三步碼長(zhǎng)輸入哈夫曼碼2233344001001001111011101111
0010010011110111
001011010011
00011011
1000101
x1x2x3x4x5x6x70.350.200.150.100.100.060.04碼長(zhǎng)哈夫曼碼2233344001001001111011101111
信源符號(hào)概率編碼過(guò)程010.25010.60010.4001010.20010.10碼字的平均碼長(zhǎng)N按下式計(jì)算:Pj:信源符號(hào)Xj出現(xiàn)的概率Lj:編碼長(zhǎng)度0.350.200.150.100.100.060.04碼長(zhǎng)2233344001001001111011101111
概率哈夫曼碼2.2統(tǒng)計(jì)編碼行程編碼行程編碼的基本原理是:用一個(gè)符號(hào)值或串長(zhǎng)代替具有相同值的連續(xù)符號(hào)(連續(xù)符號(hào)構(gòu)成了一段連續(xù)的“行程”),使符號(hào)長(zhǎng)度少于原始數(shù)據(jù)的長(zhǎng)度。
例如:5555557777733322221111111,其行程編碼為:(5,6)(7,5)(3,3)(2,4)(l,7)。
2.2統(tǒng)計(jì)編碼算術(shù)編碼算術(shù)編碼從全序列出發(fā),采用遞推形式的連續(xù)編碼。它不是將單個(gè)信源符號(hào)映射成一個(gè)碼字,而是將整個(gè)輸入符號(hào)序列映射為實(shí)數(shù)軸上的[0,1]區(qū)間內(nèi)的一個(gè)間隔,其長(zhǎng)度就等于該序列的概率,并在該間隔內(nèi)選擇一個(gè)代表性的二進(jìn)制小數(shù),作為實(shí)際的編碼輸出,使其平均碼長(zhǎng)逼近信源的熵,從而達(dá)到高效編碼的目的
2.2統(tǒng)計(jì)編碼LZW編碼LZW壓縮技術(shù)把數(shù)據(jù)流中復(fù)雜的數(shù)據(jù)用簡(jiǎn)單的代碼來(lái)表示,并把代碼和數(shù)據(jù)的對(duì)應(yīng)關(guān)系建立一個(gè)轉(zhuǎn)換表,又叫“字符串表”。轉(zhuǎn)換表是在壓縮或解壓縮過(guò)程中動(dòng)態(tài)生成的表,該表只在進(jìn)行壓縮或解壓縮過(guò)程中需要,一旦壓縮和解壓縮結(jié)束,該表將不再起任何作用。2.3圖像壓縮編碼及標(biāo)準(zhǔn)
圖像壓縮的基本方法預(yù)測(cè)編碼預(yù)測(cè)編碼是根據(jù)某一模型利用以往的樣本值對(duì)于新樣本進(jìn)行預(yù)測(cè),然后將樣本的實(shí)際值與預(yù)測(cè)值相減得到一個(gè)誤差值,對(duì)這一誤差值進(jìn)行編碼。DPCM它是利用圖像信號(hào)的相關(guān)性找出可反映信號(hào)變化特性的一個(gè)差值編碼。是對(duì)模擬信號(hào)幅度抽樣的差值進(jìn)行量化編碼的調(diào)制方式。這種方式是用已經(jīng)過(guò)去的抽樣值來(lái)預(yù)測(cè)當(dāng)前的抽樣值,對(duì)它們的差值進(jìn)行編碼。差值編碼可以提高編碼頻率,這種技術(shù)已應(yīng)用于模擬信號(hào)的數(shù)字通信之中。ADPCM綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。優(yōu)點(diǎn):算法復(fù)雜度低,壓縮比大、編解碼延時(shí)最短缺點(diǎn):還原質(zhì)量一般2.3圖像壓縮編碼及標(biāo)準(zhǔn)
圖像壓縮的基本方法變換編碼變換編碼不是直接對(duì)原圖像信號(hào)壓縮編碼,而是首先將圖像信號(hào)進(jìn)行某種函數(shù)變換,從一種信號(hào)映射到另一個(gè)域中,產(chǎn)生一組變換系數(shù),然后對(duì)這些系數(shù)量化、編碼、傳輸。在空間上具有強(qiáng)相關(guān)性的信號(hào),反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一起,或是變換系數(shù)矩陣的分布具有規(guī)律性??衫眠@些規(guī)律,在不同的頻域上分配不同的量化比特?cái)?shù),從而達(dá)到壓縮數(shù)據(jù)的目的。離散余弦變化壓縮離散傅里葉變換需要進(jìn)行復(fù)數(shù)運(yùn)算,盡管有FFT可以提高運(yùn)算速度,但在圖像編碼、特別是在實(shí)時(shí)處理中非常不便。離散傅里葉變換在實(shí)際的圖像通信系統(tǒng)中很少使用,但它具有理論的指導(dǎo)意義。根據(jù)離散傅里葉變換的性質(zhì),使偶函數(shù)的傅里葉變換只含實(shí)的余弦項(xiàng),因此構(gòu)造了一種實(shí)數(shù)域的變換——離散余弦變換(DCT)。通過(guò)研究發(fā)現(xiàn),DCT除了具有一般的正交變換性質(zhì)外,其變換陣的基向量很近似于Toeplitz矩陣的特征向量,后者體現(xiàn)了人類的語(yǔ)言、圖像信號(hào)的相關(guān)特性。因此,在對(duì)語(yǔ)音、圖像信號(hào)變換的確定的變換矩陣正交變換中,DCT變換被認(rèn)為是一種準(zhǔn)最佳變換。在近年頒布的一系列視頻壓縮編碼的國(guó)際標(biāo)準(zhǔn)建議中,都把DCT作為其中的一個(gè)基本處理模塊。K-L變換以矢量信號(hào)X的協(xié)方差矩陣Ф的歸一化正交特征矢量q所構(gòu)成的正交矩陣Q,來(lái)對(duì)該矢量信號(hào)X做正交變換Y=QX,則稱此變換為K-L變換(K-LT或KLT),K-LT是Karhunen-LoèveTransform的簡(jiǎn)稱,在模式識(shí)別和圖像處理中一個(gè)主要的問(wèn)題就是降維,在實(shí)際模式識(shí)別問(wèn)題中,我們選擇的特征經(jīng)常彼此相關(guān),在識(shí)別這些特征時(shí),數(shù)量很多,大部分都是無(wú)用的。如果我們能減少特征的數(shù)量,即減少特征空間的維數(shù),那么我們將以更少的存儲(chǔ)和計(jì)算復(fù)雜度獲得更高的準(zhǔn)確性。
KL變換是一種常用的特征提取方法,在消除模式特征之間的相關(guān)性、突出差異性方面有最優(yōu)的效果。小波變換小波變換是一種新的變換分析方法,它繼承和發(fā)展了短時(shí)傅立葉變換局部化的思想,同時(shí)又克服了窗口大小不隨頻率變化等缺點(diǎn),能夠提供一個(gè)隨頻率改變的“時(shí)間-頻率”窗口,是進(jìn)行信號(hào)時(shí)頻分析和處理的理想工具。它的主要特點(diǎn)是通過(guò)變換能夠充分突出問(wèn)題某些方面的特征,能對(duì)時(shí)間(空間)頻率的局部化分析,通過(guò)伸縮平移運(yùn)算對(duì)信號(hào)(函數(shù))逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時(shí)間細(xì)分,低頻處頻率細(xì)分,能自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求,從而可聚焦到信號(hào)的任意細(xì)節(jié),圖像壓縮的基本方法分形編碼分形圖像編碼是目前較有發(fā)展前途的圖像編碼方法之一,也是目前研究較為廣泛的編碼方法之一。對(duì)其研究已有近十年的歷史,其間,人們發(fā)現(xiàn)了它所具有的許多優(yōu)點(diǎn):比如,它突破以往熵壓縮編碼的界限,在編碼過(guò)程中,采用了類似描述的方法,而解碼是通過(guò)迭代完成的,且具有分辨率無(wú)關(guān)的解碼特性等。分形圖像編碼的思想最早由Barnsley和Sloan引入,將原始圖像表示為圖像空間中一系列壓縮映射的吸引子。在此基礎(chǔ)上,Jacquin設(shè)計(jì)了第一個(gè)實(shí)用的基于方塊分割的分形圖像編碼器,他首先將原始圖像分割為值域子塊和定義域子塊,對(duì)于每一個(gè)值域子塊,尋找一個(gè)定義域子塊和仿射變換(包括幾何變換、對(duì)比度放縮和亮度平移),使變換后的定義域子塊最佳逼近值域子塊。隨后Fisher等提出了四象限樹編碼方案,采用有效的分類技術(shù),極大的提高了編碼性能。隨著幾十種新算法和改進(jìn)方案的問(wèn)世,分形圖像編碼目前已形成了三個(gè)主要發(fā)展方向:加快分形的編解碼速
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 常見物質(zhì)的物性參數(shù)
- 陶瓷制品市場(chǎng)營(yíng)銷策略試題考核試卷
- 虛擬貨幣地址分析技術(shù)的研究-洞察分析
- 藝術(shù)品投資風(fēng)險(xiǎn)分析-洞察分析
- 鐵礦企業(yè)的資本運(yùn)作與融資模式考核試卷
- 語(yǔ)音識(shí)別與合成分析-洞察分析
- 音樂(lè)與社交網(wǎng)絡(luò)-洞察分析
- 司法制度與法律教育-洞察分析
- 涂料行業(yè)綠色發(fā)展-洞察分析
- 新教師師徒結(jié)對(duì)計(jì)劃
- 傳播學(xué)(東北林業(yè)大學(xué))知到智慧樹章節(jié)答案
- 2024年安全員之A證考試題庫(kù)及完整答案(網(wǎng)校專用)
- 統(tǒng)編版2024-2025學(xué)年三年級(jí)上冊(cè)語(yǔ)文期末情景測(cè)試卷 (無(wú)答案)
- 績(jī)效考核辦法1
- 【MOOC】外科護(hù)理學(xué)-中山大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 年度學(xué)校辦公室工作總結(jié)
- 2025版國(guó)家開放大學(xué)法律事務(wù)??啤睹穹▽W(xué)(2)》期末紙質(zhì)考試總題庫(kù)
- 【MOOC】思辨式英文寫作-南開大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 生物人教版(2024版)生物七年級(jí)上冊(cè)復(fù)習(xí)材料
- 企業(yè)地震應(yīng)急預(yù)案管理方案
- 房地產(chǎn)園林綠化行業(yè)研究報(bào)告:市場(chǎng)規(guī)模統(tǒng)計(jì)、供需態(tài)勢(shì)及發(fā)展前景預(yù)測(cè)報(bào)告(智研咨詢)
評(píng)論
0/150
提交評(píng)論