版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
多媒體數據的壓縮第一頁,共二十三頁,2022年,8月28日6.1數據壓縮概述
1、
壓縮的必要性聲音、圖像、視頻和動畫的數據量太大聲音1分鐘立體聲音樂采樣頻率為44.1KHZ,16位量化精度的數據量為
44.1*1000*16*2*60/8=10.09MB
存儲一首4分鐘的歌曲約需40MB圖像
1副640*480的RGB彩色圖像的存儲容量為
640*480*24/8=900KB視頻
1秒鐘(25幀/秒)的視頻數據量為
25*900KB=21.97MB1張650MB的CDROM光盤只能存儲約650/21.97=29.59秒的視頻第二頁,共二十三頁,2022年,8月28日
2數據冗余空間冗余:圖像內部相鄰像素之間的相關性時間冗余:視頻序列中前后幀之間的相關性視覺或聽覺冗余(人眼或人耳具有一定的掩蔽效應)知識冗余(具有規(guī)律性的結構,用于圖像理解上,如人臉)統(tǒng)計冗余(出現的頻率具有一定的規(guī)律性,如元音多,有些輔音很少出現)結構冗余(具有紋理結構的圖像區(qū)域)信息熵冗余(又叫編碼冗余,用相同位數進行編碼產生的冗余)第三頁,共二十三頁,2022年,8月28日6.2數據壓縮的基本原理1、信息編碼基礎壓縮的實質:根據數據的內在聯系將數據從一種編碼映射為另一種編碼,又叫壓縮編碼。編碼器(壓縮)存儲器或網絡解碼器(解壓縮)輸入數據輸出數據數據壓縮過程數據壓縮方法的衡量指標壓縮率:越大越好壓縮質量:數據失真越小越好壓縮與解壓縮的速度:速度越快越好第四頁,共二十三頁,2022年,8月28日2、數據壓縮方法無損壓縮有損壓縮混合編碼預測編碼變換編碼PCM編碼DPCM編碼ADPCM編碼幀間預測編碼離散余弦變換K-L變換小波變換JPEGMPEGH.261行程編碼哈夫曼編碼算術編碼香農編碼LZW編碼統(tǒng)計編碼第五頁,共二十三頁,2022年,8月28日6.3數據壓縮的編碼算法一、無損壓縮:減少或去除數據中的冗余,可以無失真地還原成原來的數據,一般適合壓縮數據或程序,但是壓縮比較小,一般在2:1到5:1之間。序號編碼方法基本原理1行程編碼將重復出現的數值序列采用出現次數和單個數值來表示2哈夫曼編碼利用不同碼字出現的概率不同,出現概率大的碼字短,出現概率小的碼字長。3算術編碼將編碼的消息表示成0到1之間的一個間隔,消息越長,間隔就越小,編碼所需二進制位數越多。第六頁,共二十三頁,2022年,8月28日1.行程編碼(游程編碼)原理:將連續(xù)相同的數據序列用重復次數和單個數據來表示。應用:用于圖像文件的壓縮(尤其適合于由計算機生成的圖像)如bmp和tiff等圖像格式。
(1)多值信息的編碼
編碼格式:信息重復次數+被重復的信息
例:字符串為:atttefppppppddddss
行程編碼為:a3tef6p4d2s
(2)二值信息的編碼
編碼格式:0或1重復的次數
例如二進制數據流為
假設行程約定以0開始,則編碼為:3654
若約定以1開始,則編碼為:03654第七頁,共二十三頁,2022年,8月28日2.哈夫曼(Huffman)編碼算法步驟:(1)按照符號出現的概率大小進行排序(2)把最小的兩個概率值相加,得到一個新的概率序列(3)重復上述兩個步驟,直到概率值為1(4)從后往前進行編碼,概率大的賦予1,概率小的賦予0。(反過來也可以)(5)寫出每個符號的碼字例1:字母ABCDE出現的概率分別為0.15、0.25、0.1、0.37和0.13,其哈夫曼編碼為:P(C)=0.1P(E)=0.13P(CE)=0.23P(A)=0.15P(ACE)=0.38P(B)=0.25P(D)=0.37P(BD)=0.62P(ACEBD)=100001111A:00B:10C:010D:11E:011
假設共有100個字符,若采用等長編碼,每個字符至少需要3位二進制,100個字母需要300位,采用哈夫曼編碼則只需要15*2+25*2+10*3+37*2+13*3=223位。壓縮比為300:223=1.34:1第八頁,共二十三頁,2022年,8月28日例2:字母ABCDE出現的概率分別為0.53、0.25、0.07、0.05和0.1,其哈夫曼編碼為:A:1B:01C:0011D:0010E:000
若采用等長編碼,至少需要3位二進制,100個字母需要300位,采用哈夫曼編碼則需要:53*1+25*2+7*4+5*4+10*3=181位壓縮比為300:181=1.65:10P(E)=0.1P(D)=0.05P(C)=0.07P(DC)=0.12P(EDC)=0.22P(B)=0.25P(EDCBA)=1000111P(EDCB)=0.47P(A)=0.5301第九頁,共二十三頁,2022年,8月28日3、算術編碼編碼原理:將被編碼信源表示為[0,1)區(qū)間的一個實數,根據各符號出現的概率構造其所在區(qū)間,隨著信息字符的不斷出現,其所在區(qū)間越來越小,對應表示的實數也越來越小,那么表示這一消息所需的二進制位數就越多。例:假設一個4個符號的信源A={a1,a2,a3,a4},各符號出現的概率及起始編碼區(qū)間如下表。信號字符出現概率編碼范圍a10.2[0,0.2)a20.4[0.2,0.6)a30.2[0.6,0.8)a40.2[0.8,1.0)第十頁,共二十三頁,2022年,8月28日如果要傳送的消息為a1a2a3a2,算術編碼過程為:區(qū)間計算方法:
新區(qū)間起始位置:前面區(qū)間起始位置+當前區(qū)間左端*前面區(qū)間長度
新區(qū)間長度:當前符號的概率*前面區(qū)間長度①a1,取值區(qū)間為[0,0.2)②a2,起點:0+0.2*0.2=0.04,長度0.4*0.2=0.08,新區(qū)間為[0.04,0.12)③a3,起點:0.04+0.6*0.08=0.088,長度0.2*0.08=0.016,新區(qū)間為[0.088,0.104)④a2,起點:0.088+0.2*0.016=0.0912,長度0.4*0.016=0.0064,新區(qū)間為[0.09120.0976)信息:a1a2a3a2信源符號0.20.120.1040.097600.040.0880.0912輸出區(qū)間內任一數編碼區(qū)間a4a3a2a10.20.60.801第十一頁,共二十三頁,2022年,8月28日二、有損壓縮:壓縮時會丟失部分數據,且丟失的數據無法恢復。是不可逆的壓縮,即解壓縮以后的數據與原始數據不完全一致。序號編碼方法基本原理1PCM編碼(脈沖編碼調制)將模擬量經過采樣、量化和編碼得到其數字編碼。2預測編碼根據算法模型,用已有的樣本值對新樣本進行預測,得到一個預測值,將實際值與預測值相減得到預測誤差,再對該誤差值進行編碼,如果預測越準確,誤差值就越小(那誤差的幅度肯定小于原始信號),那編碼所需的位數就可以減少,達到壓縮的目的。3變換編碼將原始信號從一個域(如時間域)變換到另一個域(如頻率域),然后對變換后的信號進行編碼。主要用于圖像數據的壓縮。第十二頁,共二十三頁,2022年,8月28日1.PCM(PulseCodeModulation,脈沖編碼調制)采樣:按固定時間間隔獲取一個樣本值量化:按允許的誤差將樣本對應到近似的數值(幅度上的離散化)。有均勻量化和非均勻量化。編碼:用二進制代碼表示采樣量化后的樣本值。第十三頁,共二十三頁,2022年,8月28日2.預測編碼(1)DPCM(差分脈沖編碼調制)編碼器量化器輸入預測器編碼器信道信道s+-ee’++s’s”編碼器預測器++s’s”e’輸出解碼器原始信號為:s,預測器產生的預測值為:s”預測誤差:e=s-s”發(fā)送端:發(fā)送經過量化的誤差e’接收端:用相同的預測器獲得預測值s”,
輸出s’=s”+e’最終誤差為:
s’-s=s”+e’-s=e’
–(s-s”)=e’-e(即量化器產生的量化誤差)第十四頁,共二十三頁,2022年,8月28日(2)ADPCM(自適應脈沖編碼調制)
自適應量化:當信號分布不均勻時,能隨輸入信號的變化改變量化區(qū)間的大小。自適應預測:采用過去的樣本值估算下一個輸入樣本的預測值,得到最小的實際樣本值與預測值之間的差值。(3)幀間預測編碼
利用視頻圖像各幀之間的時間相關性,減少幀內圖像信號的冗余,即不直接傳送當前幀的像素值,而是傳送x和其前一幀或后一幀對應像素x’之間的差值。運動補償的幀間預測幀間內插法(4)線性預測編碼(LinearPredictiveCoding,LPC)
采用過去的樣本值,以一種前向反饋的方式預測當前采樣值,預測值可以用過去p個樣本值的線性組合來表示。該方法被廣泛應用于語音處理。第十五頁,共二十三頁,2022年,8月28日3.變換編碼將圖像信號從一個域(如時間域)變換到另外一個域(如頻率域),然后對變換后的信號進行量化與編碼。正交變換前兩個樣本的聯合事件正交變換后兩個樣本的聯合事件例:有兩個相鄰的數據樣本x1和x2,每個樣本采用3bit編碼,各自都有8個幅度等級,兩個樣本的聯合事件共有64種可能,用64個點表示。對一般的像來說,兩個相鄰的數據樣本很有可能出現近似的幅度,即很可能出現在x1=x2直線附近。對該數據進行正交變換,將坐標系逆時針旋轉45度,在新坐標系中y1對應到x1=x2這條直線,那么變換后的數據樣本集中在y1軸上,對這部分數據進行量化、編碼和傳輸,其他數據不做處理,這樣就達到了壓縮數據的目的。常用的變換編碼方法有:1、K-L變換2、傅立葉變換3、離散余弦變換等第十六頁,共二十三頁,2022年,8月28日1.電話語音壓縮標準
數據:帶寬為200Hz~3.4kHz,采樣頻率為8kHz,8位量化,傳輸速率為64kb/s
語音壓縮標準:G.722(64kb/s)、G.721(32kb/s)、G.728(16kb/s)和G.729(8kb/s)
應用:數字電話通信。
6.4 常用多媒體數據壓縮標準
6.4.1音頻壓縮標準第十七頁,共二十三頁,2022年,8月28日2.調幅廣播語音壓縮標準
數據:帶寬為50hz~7khz的調幅廣播語音,使用16kHz采樣頻率和14位量化位數時,所對應的速率為224kb/s。
語音壓縮標準:G.722應用:優(yōu)質語音、音樂、音頻會議和視頻會議等。第十八頁,共二十三頁,2022年,8月28日3.高保真立體聲的寬帶音頻壓縮標準
數據:采樣頻率44.1kHz,用16位量化,速率為每聲道705kb/s。語音壓縮標準:MPEG音頻MPEG-1音頻:層Ⅰ(簡化的ASPEC)層Ⅱ(即MUSICAM,又稱MP2)層Ⅲ(又稱MP3)。
MPEG-2音頻:多聲道,5.1聲道形式及7.1聲道形式
應用:影劇院、家庭影院系統(tǒng),及將來的高清晰度電視(HDTV)。第十九頁,共二十三頁,2022年,8月28日6.4.2靜態(tài)圖像壓縮標準JPEG(jointphotographicexpertsgroup)聯合照片專家組
1.JPEG標準適應于彩色和單色多灰度或連續(xù)色調的靜止數字圖像。支持很高的圖像分辨率和量化精度,具有較高的壓縮比和圖像質量。包含了基于DCT的有損壓縮方法和基于預測方法的無損壓縮方法。
2.JPEG2000標準
特征:支持低比特率傳輸,支持無損和有損壓縮,象素精度和分辨率的漸進式傳輸,感興趣域編碼,隨機碼流訪問和處理。經典算法:包含三個部分:小波變換、畫布坐標系統(tǒng)、嵌入式優(yōu)化截斷編碼(EBCOT)。
第二十頁,共二十三頁,2022年,8月28日壓縮標準屏幕比例分辨率幀頻備注MPEG-14:3352x24029.97NTSC制式MPEG-14:3352x28825PAL制式MPEG-24:3720×48029.97NTSC制式MPEG-24:3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廚房用品采購合同
- 2025年分期車險購買合同
- 2025年教育培訓機構入駐合同
- 體育館裝修設計服務合同
- 退役軍人就業(yè)居間合同樣本
- 配件銷售框架合同
- 生鮮食品供應鏈優(yōu)化咨詢服務合同
- 電子競技產業(yè)園運營維護合同
- 企業(yè)級網站性能優(yōu)化合同
- 生物醫(yī)藥項目技術轉讓合同
- 高速公路巡邏車司機勞動合同
- 2025中國大唐集團內蒙古分公司招聘高頻重點提升(共500題)附帶答案詳解
- 充血性心力衰竭課件
- GB 4793-2024測量、控制和實驗室用電氣設備安全技術規(guī)范
- 挖掘機售后保養(yǎng)及維修服務協(xié)議(2024版)
- 2023-2024年度數字經濟與驅動發(fā)展公需科目答案(第5套)
- 職業(yè)分類表格
- 廣東省深圳高級中學2023-2024學年八年級下學期期中考試物理試卷
- 電網建設項目施工項目部環(huán)境保護和水土保持標準化管理手冊(變電工程分冊)
- 口腔門診部設置可行性研究報告
- 體檢科運營可行性報告
評論
0/150
提交評論