




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、1第第5章章 預(yù)測編碼 具有具有M 種取值的符號序列種取值的符號序列 ,第,第L 符號的熵滿足:符號的熵滿足: kx預(yù)測預(yù)測 HxxxxHxxxHxxHxHMLLLLLLLLL),|(),|()|()(log12121122第第5章章 預(yù)測編碼 5.1 DPCM基本原理基本原理工作過程:工作過程:1)先發(fā)送)先發(fā)送 2)在)在 基礎(chǔ)上進行預(yù)測,得到預(yù)測值;基礎(chǔ)上進行預(yù)測,得到預(yù)測值; 3)差分,量化和編碼)差分,量化和編碼 4)重復(fù)一樣的過程,預(yù)測器必須相同)重復(fù)一樣的過程,預(yù)測器必須相同 10Nxx10Nxx35.2 最佳線性預(yù)測最佳線性預(yù)測非時變線性預(yù)測非時變線性預(yù)測:預(yù)測誤差預(yù)測誤差:一
2、、一、MMSE線性預(yù)測線性預(yù)測預(yù)測誤差的均方值預(yù)測誤差的均方值MSE最小的必要條件最小的必要條件)(22kkexxENiikikkkkxaxxxe1Niikikxax10)(ikkkxxxE0)(22ikkkieaxxxEaikkikkxxExxE45.2 最佳線性預(yù)測最佳線性預(yù)測定義自相關(guān)函數(shù)得到由于自相關(guān)函數(shù)滿足當(dāng) 廣義平穩(wěn)時有),(jixxEjiRkx),(1ikNjjkiikkxxaExxEikkRNjiikjkRa1),(),(),(jkikRikjkR)()(),(ijRjiRjkikR55.2 最佳線性預(yù)測最佳線性預(yù)測得到 實對稱的 Toeplitz矩陣,正定,可逆。 如果 各態(tài)
3、歷經(jīng)的且N 足夠大由上述方法求出的最佳預(yù)測系數(shù)得到的最小均方誤差)()2() 1 ( )0( )2( ) 1( )2( )0( ) 1 () 1( ) 1 ( )0(21NRRRaaaRNRNRNRRRNRRRNkxkiNiixxNkR11)(NiiiRaR12min)()0(65.2 最佳線性預(yù)測最佳線性預(yù)測二、預(yù)測階數(shù)的選擇二、預(yù)測階數(shù)的選擇l當(dāng)當(dāng)N 足夠大使預(yù)測誤差不相關(guān)足夠大使預(yù)測誤差不相關(guān) 再增大再增大N 不會使均方誤差在減小。不會使均方誤差在減小。l若若 為為N 階馬爾克夫過程,則用階馬爾克夫過程,則用N 階預(yù)測。階預(yù)測。例5-2 設(shè) 為一階馬爾克夫序列,其相關(guān)系數(shù)求解 的公式若N
4、 =1,則ia)0(0jeeEjkkkxkx75.2 最佳線性預(yù)測最佳線性預(yù)測誤差:有若加大N =2,與N =1時的預(yù)測表達式完全相等。2mine85.3 音頻信號與聽覺感知音頻信號與聽覺感知人耳可聽到的聲音頻率范圍:人耳可聽到的聲音頻率范圍:20Hz20KHz一、語音信號的時域冗余度一、語音信號的時域冗余度1、幅度非均勻分布、幅度非均勻分布2、樣本間的相關(guān)性、樣本間的相關(guān)性3、基音之間的相關(guān)性、基音之間的相關(guān)性語音語音 濁音(嗓音)濁音(嗓音) 清音(非嗓音)清音(非嗓音)4、話音間隔、話音間隔5、長時自相關(guān)函數(shù)、長時自相關(guān)函數(shù)95.3 音頻信號與聽覺感知音頻信號與聽覺感知二、語音信號的頻域
5、冗余度二、語音信號的頻域冗余度1、非均勻的長時功率譜密度、非均勻的長時功率譜密度2、語音特有的短時功率譜密度、語音特有的短時功率譜密度105.3 音頻信號與聽覺感知音頻信號與聽覺感知三、單音的聽覺感知三、單音的聽覺感知 人類聽覺系統(tǒng)(人類聽覺系統(tǒng)(HAS,Human Auditory System) 帶通濾波器組,帶通濾波器組,一系列帶寬遞增的帶通濾波器組成一系列帶寬遞增的帶通濾波器組成 可聞閾(聽覺閾):人耳剛能聽見的聲壓級可聞閾(聽覺閾):人耳剛能聽見的聲壓級 疼痛閾:使人耳有痛感的聲壓級疼痛閾:使人耳有痛感的聲壓級 聽覺范圍:疼痛閾和可聞閾之差聽覺范圍:疼痛閾和可聞閾之差HAS表現(xiàn)特性(
6、純音)表現(xiàn)特性(純音) 1)響度:與頻率有關(guān))響度:與頻率有關(guān) 1kHz/10dB 200Hz/30dB 2)頻率:可聞閾與頻率有關(guān))頻率:可聞閾與頻率有關(guān) 24kHZ 低低 16kHz高高 3)相位:對相位感知不敏感)相位:對相位感知不敏感115.3 音頻信號與聽覺感知音頻信號與聽覺感知三、多音的掩蔽效應(yīng)三、多音的掩蔽效應(yīng) 掩蔽效應(yīng):一個聲音的存在會影響人耳對另一掩蔽效應(yīng):一個聲音的存在會影響人耳對另一 個聲音的聽覺能力。個聲音的聽覺能力。 掩蔽閾:單音都有一個掩蔽閾掩蔽閾:單音都有一個掩蔽閾 其聲壓級越高,對其周圍頻率聲音的其聲壓級越高,對其周圍頻率聲音的 掩蔽效應(yīng)越強。掩蔽效應(yīng)越強。 1
7、25.4 語音信號的預(yù)測編碼語音信號的預(yù)測編碼一、基于預(yù)測的語音壓縮技術(shù)一、基于預(yù)測的語音壓縮技術(shù) 波形編碼波形編碼:被編碼的語音信號與重建信號波形基 本相同。 語聲編碼語聲編碼:重建信號聽起來與原始聲音基本一樣 混合編碼混合編碼:綜合兩種方法 。幾個階段:幾個階段:1)增量調(diào)制)增量調(diào)制 DM, Delta modulation 1kkkkkxxxxe135.4 語音信號的預(yù)測編碼語音信號的預(yù)測編碼2)DPCM3)ADPCM 預(yù)測器或量化器中引入自適應(yīng)調(diào)節(jié) 1986-1990 ITU-T 制定的語音編碼標(biāo)準(zhǔn)技術(shù)基礎(chǔ)4)LPC聲碼器:聲碼器: 不傳送預(yù)測誤差,傳送參數(shù) 波形編碼 參數(shù)編碼145
8、.4 語音信號的預(yù)測編碼語音信號的預(yù)測編碼5)混合編碼)混合編碼 RELP: 殘差激勵線性預(yù)測 CELP:碼激勵線性預(yù)測(1984 提出) LD-CELP:低時延的碼激勵線性預(yù)測(G.728建議,1992) ACELP:代數(shù)碼激勵線性預(yù)測(G.723.1建議,1996) CS-ACELP:共軛結(jié)構(gòu)代數(shù)碼激勵線性預(yù)測(G.729建議,1996)155.5 靜止圖像的預(yù)測編碼靜止圖像的預(yù)測編碼一、預(yù)測器設(shè)計一、預(yù)測器設(shè)計 1、預(yù)測器 一維預(yù)測: 二維預(yù)測: 三維預(yù)測:2、相關(guān)性的強弱3、階數(shù)選擇4、預(yù)測器實現(xiàn)5、系數(shù)確定165.5 靜止圖像的預(yù)測編碼靜止圖像的預(yù)測編碼二、二、JPEG無損壓縮模式無
9、損壓縮模式 空間域無量化DPCM,Huffman或算術(shù)編碼175.5 靜止圖像的預(yù)測編碼靜止圖像的預(yù)測編碼三、三、JPEG-LS壓縮標(biāo)準(zhǔn)壓縮標(biāo)準(zhǔn)l近無損、無損壓縮標(biāo)準(zhǔn),1998正式公布lJPEG-LS編碼系統(tǒng)1)基于上下文的建模 計算其鄰域點變化量 判斷進入預(yù)測還是游程185.5 靜止圖像的預(yù)測編碼靜止圖像的預(yù)測編碼2)預(yù)測 自適應(yīng)非線性預(yù)測 =3)常規(guī)模式的誤差編碼 4)游程模式195.6 視頻信號與視覺感知視頻信號與視覺感知一、電視信號概述一、電視信號概述 PAL 25幀/s 625行 視頻帶寬6M 205.6 視頻信號與視覺感知視頻信號與視覺感知二、數(shù)字化格式二、數(shù)字化格式CCIT601
10、:對彩色電視信號的亮度和色差采樣編碼采樣頻率:13.5MHz(亮度)215.6 視頻信號與視覺感知視頻信號與視覺感知采樣頻率:13.5MHz(亮度)1)采樣定理2)行頻的整數(shù)倍3)兼容三種國際標(biāo)準(zhǔn)制式取樣結(jié)構(gòu):4:4:4 4:2:2 4:1:1數(shù)碼率:r=(13.5+6.75+6.75)*8=216Mb/s r=3*13.5*8=324Mb/s225.6 視頻信號與視覺感知視頻信號與視覺感知三、電視信號的冗余度三、電視信號的冗余度空間冗余:時間冗余(幀間冗余):l 幀間差值 l 對相鄰兩幀圖像進行測試 黑白圖像:幀間差值超過3的像素不到4% 變化劇烈的彩色序列:亮度6 只有7.5% 色度 只有
11、千分之7.5l 可視電話,電視會議 ),(),(),(1nmxnmxnmd235.6 視頻信號與視覺感知視頻信號與視覺感知四、人的視覺感知特性四、人的視覺感知特性彩色電視信號的數(shù)碼率彩色電視信號的數(shù)碼率人類視覺系統(tǒng)人類視覺系統(tǒng) (HVS,human visual system)1)亮度掩蔽特性:背景較明或較暗時,人眼對亮度分辨)亮度掩蔽特性:背景較明或較暗時,人眼對亮度分辨能力下降。能力下降。2)空間掩蔽特性:隨著空間變化頻率的提高,人眼對亮)空間掩蔽特性:隨著空間變化頻率的提高,人眼對亮度(灰度)分辨能力下降度(灰度)分辨能力下降3)時間掩蔽特性:隨著時間變化頻率的提高,人眼對細)時間掩蔽特
12、性:隨著時間變化頻率的提高,人眼對細節(jié)和亮度分辨能力下降節(jié)和亮度分辨能力下降 ( )()()srBZrf RP YP CP CfR245.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼一、幀間預(yù)測編碼一、幀間預(yù)測編碼1、發(fā)展、發(fā)展2、編碼方法、編碼方法1)條件幀修補法)條件幀修補法2)運動補償預(yù)測)運動補償預(yù)測電視圖像特點(可視電話、電視會議和電視等)l背景區(qū):l運動物體區(qū):l暴露區(qū):),(),(),(1nmxnmxnmd255.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼3、運動補償預(yù)測組成運動補償預(yù)測組成1)圖像分割:把圖像分為)圖像分割:把圖像分為靜止和運動兩部分靜止和運動兩部分.2)運動估值:估
13、計物體的)運動估值:估計物體的位移量,得到運動矢位移量,得到運動矢量量.3)運動補償:用運動矢量)運動補償:用運動矢量補償物體的運動效果,補償物體的運動效果,再預(yù)測再預(yù)測.4)編碼:幀間運動誤差和)編碼:幀間運動誤差和運動矢量運動矢量.265.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼二、快匹配運動估值二、快匹配運動估值l對當(dāng)前幀的每一個子塊,對當(dāng)前幀的每一個子塊,在上一幀某一搜索范圍在上一幀某一搜索范圍內(nèi)尋找最優(yōu)匹配,該子內(nèi)尋找最優(yōu)匹配,該子塊和最優(yōu)匹配塊之間的塊和最優(yōu)匹配塊之間的位移就是運動矢量。位移就是運動矢量。當(dāng)前幀搜索窗當(dāng)前宏塊匹配宏塊運動矢量參考幀275.7 活動圖像的預(yù)測編碼活動圖
14、像的預(yù)測編碼1)判斷準(zhǔn)則)判斷準(zhǔn)則歸一化互相關(guān)函數(shù)歸一化互相關(guān)函數(shù)(NCCF)均方誤差均方誤差(MSE)最小絕對差最小絕對差(MAD) , ( | ),(),(|1),(maxmaxmaxmax111dxjdxdyidyjnimxnmxMNjiMADMmNn ),(),(),(),(),(2/11010212/11010210101MmNnkMmNnkMmNnkkjnimxnmxjnimxnmxjiNCCF( , )( , )(,)MNkkmnMSE i jx m nxmi nj MN1121001285.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼2)搜索策略)搜索策略全局搜索法(Full Se
15、arch Method,F(xiàn)S) 二維對數(shù)搜索法(Two-Dimensional Logarithmic,TDL基本思想:從原點開始,以“十”字形分布的五個點構(gòu)成每次搜索的點群,通過快速搜索跟蹤最小塊誤差MAD點。Step 1:從原點開始,選取一定的步長,以十字形分布的五個點處進行MAD值的計算并比較。Step 2:若MBD點在邊緣四個點處,則以該點為中心點,保持步長不變,重新搜索十字形分布的五個點; 若MBD點位于中心點,則保持中心點位置不變,將十字點群的步長減半,并在五個點處計算。Step 3:若步長為1,在中心及周圍8個點處找出MBD點,該點所在位置即對應(yīng)最佳匹配點,算法結(jié)束;否則重復(fù)St
16、ep 2。295.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼 0,-4、+4,-4、+6,-4是每個搜索階段的最小塊誤差點若+5,-4是8個點中的最小MBD, 則運動矢量為+5,-4, 305.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼2)搜索策略)搜索策略三步搜索法(Three Step Search,TSS) 四步搜索法(Four Step Search,F(xiàn)SS) 基于塊的梯度下降搜索法 (Block-Based Gradient Descent Search,BBGDS) 菱形搜索法(Diamond Search) 基本思想:兩種搜索模板,5個檢測點的小模板SDSM 和9個檢測點的大模板LD
17、SM。搜索時先用大模板計算,當(dāng)最小塊誤差MAD點出現(xiàn)在中心點處時,將大模板LDSM換為SDSM,再進行匹配計算,這時5個點中的MAD即為最優(yōu)匹配點。315.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼菱形搜索法SDSM LDSM 325.7 活動圖像的預(yù)測編碼活動圖像的預(yù)測編碼3)塊的劃分)塊的劃分H261,MPEG1,2 16*16H263 16*16 高級預(yù)測模式 4個8*8 H264 7種模式335.8 高光譜遙感圖像的預(yù)測編碼高光譜遙感圖像的預(yù)測編碼 對同一對象(區(qū)域或目標(biāo))對同一對象(區(qū)域或目標(biāo)) 在多個窄光譜波段范圍上獲在多個窄光譜波段范圍上獲 得的圖像得的圖像 。一、特點一、特點1)
18、三維)三維 空間冗余空間冗余 譜間冗余譜間冗余2)豐富紋理信息,空間相關(guān)性較弱)豐富紋理信息,空間相關(guān)性較弱 各波段的成像對象是同一地物,在結(jié)構(gòu)上具有相似性各波段的成像對象是同一地物,在結(jié)構(gòu)上具有相似性3)預(yù)測、變換和矢量量化等方法去除兩種冗余)預(yù)測、變換和矢量量化等方法去除兩種冗余4)無損壓縮、近無損壓縮。)無損壓縮、近無損壓縮。二、二、DPCM預(yù)測預(yù)測345.8 高光譜遙感圖像的預(yù)測編碼高光譜遙感圖像的預(yù)測編碼三、最小絕對權(quán)值(三、最小絕對權(quán)值(MAW)預(yù)測樹方法)預(yù)測樹方法1、原理、原理把一幅圖像看作一個加權(quán)圖把一幅圖像看作一個加權(quán)圖每個像素為圖中的一個頂點,四鄰域像素之間的連線每個像素為圖中的一個頂點,四鄰域像素之間的連線為圖中的邊,邊的兩端像素之差為邊的權(quán)值為圖中的邊,邊的兩端像素之差為邊的權(quán)值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年邯鄲貨運資格證模擬考試題
- AI算法設(shè)計與應(yīng)用操作手冊
- 食品原料來源可追溯管理系統(tǒng)開發(fā)
- 品味古典詩詞韻味之美-高三古詩文誦讀與賞析教學(xué)教案
- 2025年新疆從業(yè)資格證500道題速記
- 江干區(qū)小學(xué)英語試卷
- 鎢基高比重合金競爭策略分析報告
- 小學(xué)英語買試卷
- 公司承包轉(zhuǎn)讓合同范本
- 雙方變更合同范本
- 《火力發(fā)電廠水處理技術(shù)概述》課件
- 春節(jié)后復(fù)工安全培訓(xùn)課件
- 全國電子工業(yè)版初中信息技術(shù)第二冊第2單元2.1活動3《使用云盤備份數(shù)據(jù)》教學(xué)設(shè)計
- 招標(biāo)代理服務(wù)投標(biāo)方案(技術(shù)標(biāo))
- 財務(wù)人員防騙技巧培訓(xùn)課件
- 交替?zhèn)髯g課件外研社王丹
- 《餐飲業(yè)概述》課件 - 探索美食與服務(wù)之道
- 2024年哈爾濱電力職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 2024年金鑰匙科技知識競賽試題及答案
- 運用HFMEA品管工具優(yōu)化輸血全流程醫(yī)院品質(zhì)管理案例(血液科輸血科信息科醫(yī)務(wù)科護理部)
- 醫(yī)療設(shè)備維保投標(biāo)方案(技術(shù)方案)
評論
0/150
提交評論