![數(shù)據(jù)壓縮預測編碼_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/8/4f32e898-d5b5-4dfb-a933-c46c9334040a/4f32e898-d5b5-4dfb-a933-c46c9334040a1.gif)
![數(shù)據(jù)壓縮預測編碼_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/8/4f32e898-d5b5-4dfb-a933-c46c9334040a/4f32e898-d5b5-4dfb-a933-c46c9334040a2.gif)
![數(shù)據(jù)壓縮預測編碼_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/8/4f32e898-d5b5-4dfb-a933-c46c9334040a/4f32e898-d5b5-4dfb-a933-c46c9334040a3.gif)
![數(shù)據(jù)壓縮預測編碼_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/8/4f32e898-d5b5-4dfb-a933-c46c9334040a/4f32e898-d5b5-4dfb-a933-c46c9334040a4.gif)
![數(shù)據(jù)壓縮預測編碼_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/8/4f32e898-d5b5-4dfb-a933-c46c9334040a/4f32e898-d5b5-4dfb-a933-c46c9334040a5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、1 第第5章章 預測編碼 具有具有M 種取值的符號序列種取值的符號序列 ,第,第L 符號的熵滿足:符號的熵滿足: k x 預測預測 HxxxxHxxxHxxHxHM LLLLLLLLL ),|(),|()|()(log 1212112 2 第第5章章 預測編碼 5.1 DPCM基本原理基本原理 工作過程:工作過程:1)先發(fā)送)先發(fā)送 2)在)在 基礎上進行預測,得到預測值;基礎上進行預測,得到預測值; 3)差分,量化和編碼)差分,量化和編碼 4)重復一樣的過程,預測器必須相同)重復一樣的過程,預測器必須相同 10 N xx 10 N xx 3 5.2 最佳線性預測最佳線性預測 非時變線性預測非
2、時變線性預測: 預測誤差預測誤差: 一、一、MMSE線性預測線性預測 預測誤差的均方值預測誤差的均方值 MSE最小的必要條件最小的必要條件 )( 22 kke xxE N i ikikkkk xaxxxe 1 N i ikik xax 1 0)( ikkk xxxE 0 )(2 2 i k kk i e a x xxE a ikkikk xxExxE 4 5.2 最佳線性預測最佳線性預測 定義自相關函數(shù) 得到 由于自相關函數(shù)滿足 當 廣義平穩(wěn)時有 ),( jix xEjiR k x ),( 1 ik N j jkiikk xxaExxEikkR N j i ikjkRa 1 ),( ),(),
3、(jkikRikjkR )()(),(ijRjiRjkikR 5 5.2 最佳線性預測最佳線性預測 得到 實對稱的 Toeplitz矩陣,正定,可逆。 如果 各態(tài)歷經(jīng)的且N 足夠大 由上述方法求出的最佳預測系數(shù)得到的最小均方誤差 )( )2( ) 1 ( )0( )2( ) 1( )2( )0( ) 1 ( ) 1( ) 1 ( )0( 2 1 NR R R a a a RNRNR NRRR NRRR N k x ki N i ix x N kR 1 1 )( N i i iRaR 1 2 min )()0( 6 5.2 最佳線性預測最佳線性預測 二、預測階數(shù)的選擇二、預測階數(shù)的選擇 l當當N
4、 足夠大使預測誤差不相關足夠大使預測誤差不相關 再增大再增大N 不會使均方誤差在減小。不會使均方誤差在減小。 l若若 為為N 階馬爾克夫過程,則用階馬爾克夫過程,則用N 階預測。階預測。 例5-2 設 為一階馬爾克夫序列,其相關系數(shù) 求解 的公式 若N =1,則 i a )0(0 jeeE jkk k x k x 7 5.2 最佳線性預測最佳線性預測 誤差: 有 若加大N =2, 與N =1時的預測表達式完全相等。 2 mine 8 5.3 音頻信號與聽覺感知音頻信號與聽覺感知 人耳可聽到的聲音頻率范圍:人耳可聽到的聲音頻率范圍:20Hz20KHz 一、語音信號的時域冗余度一、語音信號的時域冗
5、余度 1、幅度非均勻分布、幅度非均勻分布 2、樣本間的相關性、樣本間的相關性 3、基音之間的相關性、基音之間的相關性 語音語音 濁音(嗓音)濁音(嗓音) 清音(非嗓音)清音(非嗓音) 4、話音間隔、話音間隔 5、長時自相關函數(shù)、長時自相關函數(shù) 9 5.3 音頻信號與聽覺感知音頻信號與聽覺感知 二、語音信號的頻域冗余度二、語音信號的頻域冗余度 1、非均勻的長時功率譜密度、非均勻的長時功率譜密度 2、語音特有的短時功率譜密度、語音特有的短時功率譜密度 10 5.3 音頻信號與聽覺感知音頻信號與聽覺感知 三、單音的聽覺感知三、單音的聽覺感知 人類聽覺系統(tǒng)(人類聽覺系統(tǒng)(HAS,Human Audit
6、ory System) 帶通濾波器組,帶通濾波器組,一系列帶寬遞增的帶通濾波器組成一系列帶寬遞增的帶通濾波器組成 可聞閾(聽覺閾):人耳剛能聽見的聲壓級可聞閾(聽覺閾):人耳剛能聽見的聲壓級 疼痛閾:使人耳有痛感的聲壓級疼痛閾:使人耳有痛感的聲壓級 聽覺范圍:疼痛閾和可聞閾之差聽覺范圍:疼痛閾和可聞閾之差 HAS表現(xiàn)特性(純音)表現(xiàn)特性(純音) 1)響度:與頻率有關)響度:與頻率有關 1kHz/10dB 200Hz/30dB 2)頻率:可聞閾與頻率有關)頻率:可聞閾與頻率有關 24kHZ 低低 16kHz高高 3)相位:對相位感知不敏感)相位:對相位感知不敏感 11 5.3 音頻信號與聽覺感知
7、音頻信號與聽覺感知 三、多音的掩蔽效應三、多音的掩蔽效應 掩蔽效應:一個聲音的存在會影響人耳對另一掩蔽效應:一個聲音的存在會影響人耳對另一 個聲音的聽覺能力。個聲音的聽覺能力。 掩蔽閾:單音都有一個掩蔽閾掩蔽閾:單音都有一個掩蔽閾 其聲壓級越高,對其周圍頻率聲音的其聲壓級越高,對其周圍頻率聲音的 掩蔽效應越強。掩蔽效應越強。 12 5.4 語音信號的預測編碼語音信號的預測編碼 一、基于預測的語音壓縮技術一、基于預測的語音壓縮技術 波形編碼波形編碼:被編碼的語音信號與重建信號波形基 本相同。 語聲編碼語聲編碼:重建信號聽起來與原始聲音基本一樣 混合編碼混合編碼:綜合兩種方法 。 幾個階段:幾個階
8、段: 1)增量調(diào)制)增量調(diào)制 DM, Delta modulation 1 kkkkk xxxxe 13 5.4 語音信號的預測編碼語音信號的預測編碼 2)DPCM 3)ADPCM 預測器或量化器中引入自適應調(diào)節(jié) 1986-1990 ITU-T 制定的語音編碼標準技術基礎 4)LPC聲碼器:聲碼器: 不傳送預測誤差,傳送參數(shù) 波形編碼 參數(shù)編碼 14 5.4 語音信號的預測編碼語音信號的預測編碼 5)混合編碼)混合編碼 RELP: 殘差激勵線性預測 CELP:碼激勵線性預測(1984 提出) LD-CELP:低時延的碼激勵線性預測(G.728建議,1992) ACELP:代數(shù)碼激勵線性預測(G
9、.723.1建議,1996) CS-ACELP:共軛結(jié)構代數(shù)碼激勵線性預測(G.729建議,1996) 15 5.5 靜止圖像的預測編碼靜止圖像的預測編碼 一、預測器設計一、預測器設計 1、預測器 一維預測: 二維預測: 三維預測: 2、相關性的強弱 3、階數(shù)選擇 4、預測器實現(xiàn) 5、系數(shù)確定 16 5.5 靜止圖像的預測編碼靜止圖像的預測編碼 二、二、JPEG無損壓縮模式無損壓縮模式 空間域無量化DPCM,Huffman或算術編碼 17 5.5 靜止圖像的預測編碼靜止圖像的預測編碼 三、三、JPEG-LS壓縮標準壓縮標準 l近無損、無損壓縮標準,1998正式公布 lJPEG-LS編碼系統(tǒng) 1
10、)基于上下文的建模 計算其鄰域點變化量 判斷進入預測還是游程 18 5.5 靜止圖像的預測編碼靜止圖像的預測編碼 2)預測 自適應非線性預測 = 3)常規(guī)模式的誤差編碼 4)游程模式 19 5.6 視頻信號與視覺感知視頻信號與視覺感知 一、電視信號概述一、電視信號概述 PAL 25幀/s 625行 視頻帶寬6M 20 5.6 視頻信號與視覺感知視頻信號與視覺感知 二、數(shù)字化格式二、數(shù)字化格式 CCIT601:對彩色電視信號的亮度和色差采樣編碼 采樣頻率:13.5MHz(亮度) 21 5.6 視頻信號與視覺感知視頻信號與視覺感知 采樣頻率:13.5MHz(亮度) l采樣定理 l行頻的整數(shù)倍 l兼
11、容三種國際標準制式 取樣結(jié)構:4:4:4 4:2:2 4:1:1 數(shù)碼率:r=(13.5+6.75+6.75)*8=216Mb/s r=3*13.5*8=324Mb/s 22 5.6 視頻信號與視覺感知視頻信號與視覺感知 三、電視信號的冗余度三、電視信號的冗余度 空間冗余: 時間冗余(幀間冗余): l 幀間差值 l 對相鄰兩幀圖像進行測試 黑白圖像:幀間差值超過3的像素不到4% 變化劇烈的彩色序列:亮度6 只有7.5% 色度 只有千分之7.5 l 可視電話,電視會議 ),(),(),( 1 nmxnmxnmd 23 5.6 視頻信號與視覺感知視頻信號與視覺感知 四、人的視覺感知特性四、人的視覺
12、感知特性 彩色電視信號的數(shù)碼率彩色電視信號的數(shù)碼率 人類視覺系統(tǒng)人類視覺系統(tǒng) (HVS,human visual system) 1)亮度掩蔽特性:背景較明或較暗時,人眼對亮度分辨)亮度掩蔽特性:背景較明或較暗時,人眼對亮度分辨 能力下降。能力下降。 2)空間掩蔽特性:隨著空間變化頻率的提高,人眼對亮)空間掩蔽特性:隨著空間變化頻率的提高,人眼對亮 度(灰度)分辨能力下降度(灰度)分辨能力下降 3)時間掩蔽特性:隨著時間變化頻率的提高,人眼對細)時間掩蔽特性:隨著時間變化頻率的提高,人眼對細 節(jié)和亮度分辨能力下降節(jié)和亮度分辨能力下降 ( )()() srBZ rf RP YP CP CfR 2
13、4 5.7 活動圖像的預測編碼活動圖像的預測編碼 一、幀間預測編碼一、幀間預測編碼 1、發(fā)展、發(fā)展 2、編碼方法、編碼方法 1)條件幀修補法)條件幀修補法 2)運動補償預測)運動補償預測 電視圖像特點(可視電話、電視會議和電視等) l背景區(qū): l運動物體區(qū): l暴露區(qū): ),(),(),( 1 nmxnmxnmd 25 5.7 活動圖像的預測編碼活動圖像的預測編碼 3、運動補償預測組成運動補償預測組成 1)圖像分割:把圖像分為)圖像分割:把圖像分為 靜止和運動兩部分靜止和運動兩部分. 2)運動估值:估計物體的)運動估值:估計物體的 位移量,得到運動矢位移量,得到運動矢 量量. 3)運動補償:用
14、運動矢量)運動補償:用運動矢量 補償物體的運動效果,補償物體的運動效果, 再預測再預測. 4)編碼:幀間運動誤差和)編碼:幀間運動誤差和 運動矢量運動矢量. 26 5.7 活動圖像的預測編碼活動圖像的預測編碼 二、快匹配運動估值二、快匹配運動估值 l對當前幀的每一個子塊,對當前幀的每一個子塊, 在上一幀某一搜索范圍在上一幀某一搜索范圍 內(nèi)尋找最優(yōu)匹配,該子內(nèi)尋找最優(yōu)匹配,該子 塊和最優(yōu)匹配塊之間的塊和最優(yōu)匹配塊之間的 位移就是運動矢量。位移就是運動矢量。 當前幀 搜索窗 當前宏塊 匹配宏塊 運動矢量 參考幀 27 5.7 活動圖像的預測編碼活動圖像的預測編碼 1)判斷準則)判斷準則 歸一化互相
15、關函數(shù)歸一化互相關函數(shù)(NCCF) 均方誤差均方誤差(MSE) 最小絕對差最小絕對差(MAD) ) , ( | ),(),(| 1 ),( maxmaxmaxmax 11 1 dxjdxdyidy jnimxnmx MN jiMAD M m N n ),(),( ),(),( ),( 2/1 1 0 1 0 2 1 2/1 1 0 1 0 2 1 0 1 0 1 M m N n k M m N n k M m N n kk jnimxnmx jnimxnmx jiNCCF ( , )( , )(,) MN kk mn MSE i jx m nxmi nj MN 11 2 1 00 1 28 5
16、.7 活動圖像的預測編碼活動圖像的預測編碼 2)搜索策略)搜索策略 全局搜索法(Full Search Method,F(xiàn)S) 二維對數(shù)搜索法(Two-Dimensional Logarithmic,TDL 基本思想:從原點開始,以“十”字形分布的五個點構成每次 搜索的點群,通過快速搜索跟蹤最小塊誤差MAD點。 Step 1:從原點開始,選取一定的步長,以十字形分布的五個 點處進行MAD值的計算并比較。 Step 2:若MBD點在邊緣四個點處,則以該點為中心點,保持步 長不變,重新搜索十字形分布的五個點; 若MBD點位于中心點,則保持中心點位置不變,將十字 點群的步長減半,并在五個點處計算。 S
17、tep 3:若步長為1,在中心及周圍8個點處找出MBD點,該點所 在位置即對應最佳匹配點,算法結(jié)束;否則重復Step 2。 29 5.7 活動圖像的預測編碼活動圖像的預測編碼 0,-4、+4,-4、+6,-4是每個搜索階段的最小塊誤差點 若+5,-4是8個點中的最小MBD, 則運動矢量為+5,-4, 30 5.7 活動圖像的預測編碼活動圖像的預測編碼 2)搜索策略)搜索策略 三步搜索法(Three Step Search,TSS) 四步搜索法(Four Step Search,F(xiàn)SS) 基于塊的梯度下降搜索法 (Block-Based Gradient Descent Search,BBGDS
18、) 菱形搜索法(Diamond Search) 基本思想:兩種搜索模板,5個檢測點的小模板SDSM 和9 個檢測點的大模板LDSM。搜索時先用大模板計算,當 最小塊誤差MAD點出現(xiàn)在中心點處時,將大模板LDSM 換為SDSM,再進行匹配計算,這時5個點中的MAD即 為最優(yōu)匹配點。 31 5.7 活動圖像的預測編碼活動圖像的預測編碼 菱形搜索法 SDSM LDSM 32 5.7 活動圖像的預測編碼活動圖像的預測編碼 3)塊的劃分)塊的劃分 H261,MPEG1,2 16*16 H263 16*16 高級預測模式 4個8*8 H264 7種模式 33 5.8 高光譜遙感圖像的預測編碼高光譜遙感圖像的預測編碼 對同一對象(區(qū)域或目標)對同一對象(區(qū)域或目標) 在多個窄光譜波段范圍上獲在多個窄光譜波段范圍上獲 得的圖像得的圖像 。 一、特點一、特點 1)三維)三維 空間冗余空間冗余 譜間冗余譜間冗余 2)豐富紋理信息,空間相關性較弱)豐富紋理信息,空間相關
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一般物品拍賣考核試卷
- 電力交通工具-電動車的維修與保養(yǎng)之故障診斷
- 環(huán)境科學在醫(yī)療領域的應用
- 2025-2030年微波加熱漢堡肉行業(yè)跨境出海戰(zhàn)略研究報告
- 2025-2030年地鐵車站通風空調(diào)系統(tǒng)企業(yè)制定與實施新質(zhì)生產(chǎn)力戰(zhàn)略研究報告
- 2025-2030年園藝大師投幣版行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 2025-2030年地下水污染場地修復示范企業(yè)制定與實施新質(zhì)生產(chǎn)力戰(zhàn)略研究報告
- 2025-2030年可調(diào)節(jié)吧臺椅行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 2025-2030年手工銀飾設計企業(yè)制定與實施新質(zhì)生產(chǎn)力戰(zhàn)略研究報告
- 電商與版權共筑知識產(chǎn)權防線
- 山東省臨沂市蘭山區(qū)2024-2025學年七年級上學期期末考試生物試卷(含答案)
- 湖北省武漢市2024-2025學年度高三元月調(diào)考英語試題(含答案無聽力音頻有聽力原文)
- 一年級下冊勞動《變色魚》課件
- 商務星球版地理八年級下冊全冊教案
- 天津市河西區(qū)2024-2025學年四年級(上)期末語文試卷(含答案)
- 2025年空白離婚協(xié)議書
- 校長在行政會上總結(jié)講話結(jié)合新課標精神給學校管理提出3點建議
- T-CSUS 69-2024 智慧水務技術標準
- 2025年護理質(zhì)量與安全管理工作計劃
- 湖南大學 嵌入式開發(fā)與應用(張自紅)教案
- 地下商業(yè)街的規(guī)劃設計
評論
0/150
提交評論