




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于信源數(shù)字編碼技術(shù)第一頁,共一百七十三頁,2022年,8月28日3.1概述
圖3.1為一個完整的數(shù)字通信系統(tǒng)框圖,在該系統(tǒng)中,有兩個編碼功能塊:信源編碼和信道編碼。
信源編碼:對信源的信號進行變換,將其變換成適合數(shù)字傳輸系統(tǒng)的形式,進而提高傳輸?shù)挠行浴?/p>
信道編碼:通過信道編碼將數(shù)字信號變換成與調(diào)制方式和傳輸信道匹配的形式,從而降低傳輸誤碼率,提高傳輸?shù)目煽啃?。第二頁,共一百七十三頁?022年,8月28日圖3.1數(shù)字通信系統(tǒng)第三頁,共一百七十三頁,2022年,8月28日3.2模擬信號時域離散化與抽樣定理
信號時域離散化是用一個周期為T的脈沖信號控制抽樣電路對模擬信號進行抽樣,如圖3.2所示。模擬信號f(t)通過一個由周期為T的抽樣脈沖信號s(t)控制的抽樣器得到抽樣后的信號fs(t)。抽樣定理:如果一個帶限的模擬信號f(t)的最高頻率分量為fm,當(dāng)抽樣頻率fs≥2fm時,樣值序列fs(t)可以完全代表原模擬信號f(t)。第四頁,共一百七十三頁,2022年,8月28日
圖3.2模擬信號時域離散化過程(a)被抽樣的模擬信號;(b)抽樣信號;(c)抽樣后的信號第五頁,共一百七十三頁,2022年,8月28日3.3語音數(shù)字編碼技術(shù)
語音信源編碼主要分三類:波形信源編碼、參數(shù)信源編碼以及混合信源編碼。
波形編碼:直接對語音信號離散樣值編碼;
參數(shù)編碼:對離散語音信號中提取出來的反映語音的特征值編碼;
混合編碼:波形編碼和參數(shù)編碼的混合應(yīng)用。第六頁,共一百七十三頁,2022年,8月28日3.3.1波形編碼技術(shù)
波形編碼可以在時域進行,也可以在頻域進行。
時域編碼:脈沖編碼、差值脈沖編碼以及子帶編碼。頻域編碼:將語音信號的時域樣值通過某種變換在另一域編碼。第七頁,共一百七十三頁,2022年,8月28日1.脈沖編碼
脈沖編碼是在時域按照某種方法將離散的語音信號樣值變換成一個一定位數(shù)的二進制碼組的過程,由量化和編碼兩部分構(gòu)成,如圖3.3所示。圖3.3脈沖編碼過程第八頁,共一百七十三頁,2022年,8月28日
量化:幅度取值連續(xù)的模擬信號變成幅度取值離散的數(shù)字信號,分為標(biāo)量量化和矢量量化,其中標(biāo)量量化又分為均勻量化和非均勻量化。
編碼:量化后的信號電平值轉(zhuǎn)換為二進制碼組,分為線性編碼和非線性編碼第九頁,共一百七十三頁,2022年,8月28日
1)線性編碼線性編碼是先對樣值進行均勻量化,再對量化值進行簡單的二進制編碼。均勻量化:以等間隔對任意信號值來量化,將信號樣值幅度的動態(tài)范圍(-U~U)等分成N個量化級(間隔),記作Δ(3.3.1)樣值幅度落在某一量化級內(nèi),就由該級的量化值來代替第十頁,共一百七十三頁,2022年,8月28日圖3.4均勻量化曲線第十一頁,共一百七十三頁,2022年,8月28日
量化器輸入與輸出間的差值稱為量化誤差,記作用n位二進制碼對量化值進行編碼,碼組長度n與量化級數(shù)N之間的關(guān)系為線性編碼在輸入信號未過載時的量化信噪比為
其中:為量化噪聲功率,為信號功率,ue為輸入信號電壓有效值。
(3.3.2)(3.3.3)(3.3.4)第十二頁,共一百七十三頁,2022年,8月28日
2)非線性編碼均勻量化的小信號量化信噪比小,大信號的量化信噪比大,而語音信號中小信號是大概率事件,用非均勻量化來改善小信號的量化信噪比。(1)非均勻量化。語音信號中常用的非均勻量化方法是壓擴量化。圖3.5(a)為壓擴量化編碼的原理框圖,圖3.5(b)為壓擴原理示意圖。信號先經(jīng)過具有壓擴特性的放大系統(tǒng),再進行均勻量化。第十三頁,共一百七十三頁,2022年,8月28日圖3.5非均勻量化原理示意圖第十四頁,共一百七十三頁,2022年,8月28日壓擴特性應(yīng)滿足以下對數(shù)方程:
圖3.6(a)為壓擴特性曲線,對曲線作通過原點的切線,可得A壓擴律方程
(3.3.6)式中
(3.3.7)(3.3.5)第十五頁,共一百七十三頁,2022年,8月28日圖3.6理想對數(shù)壓擴特性第十六頁,共一百七十三頁,2022年,8月28日
令式(3.3.5)中常數(shù),并將分子由修改為ln(1+μ|x|),分母由修改為ln(1+μ),得μ壓擴律方程(3.3.8)第十七頁,共一百七十三頁,2022年,8月28日
(2)μ律、A律的折線實現(xiàn)通常用折線去逼近實現(xiàn)壓擴律特性①用折線逼近非均勻量化壓擴特性曲線;②各段折線的斜率應(yīng)隨x增大而減小;③相鄰兩折線段斜率之比保持為常數(shù);④相鄰的判定值或量化間隔成簡單的整數(shù)比關(guān)系。條折線逼近律壓擴曲線,相鄰兩折線斜率之比為m,各折線端點坐標(biāo)為:第十八頁,共一百七十三頁,2022年,8月28日(3.3.9)
圖3.7畫出了μ律255/15折線正半軸的折線圖,表3.1給出了μ律255/15折線各折線段的參數(shù)。第十九頁,共一百七十三頁,2022年,8月28日圖3.7μ律255/15折線壓擴律曲線第二十頁,共一百七十三頁,2022年,8月28日
表3.1μ律255/15折線段端點坐標(biāo)值和斜率
由上表可知,μ律各折線段端點之比不是m的倍數(shù)第二十一頁,共一百七十三頁,2022年,8月28日
NA條折線逼近A律壓擴曲線,相鄰兩折線斜率之比為m,各折線段端點之比為m的倍數(shù)各折線段長度之比為第二十二頁,共一百七十三頁,2022年,8月28日A律各折線段端點坐標(biāo)為:(3.3.12)
圖3.8畫出了A律87.6/13折線正半軸的折線圖,表3.2給出了A律87.6/13折線各折線段的參數(shù)。第二十三頁,共一百七十三頁,2022年,8月28日
圖3.813折線A壓擴律曲線第二十四頁,共一百七十三頁,2022年,8月28日表3.2A(87.6)律曲線和13折線段端點坐標(biāo)和斜率
第二十五頁,共一百七十三頁,2022年,8月28日國際上主要采用的壓擴律:A律13折線和μ律15折線,歐洲各國的PCM-30/32路系統(tǒng)采用A律13折線壓擴律,美國、加拿大、日本等國的PCM-24路系統(tǒng)采用μ律15折線壓擴律。(3)非線性編碼
非線性編碼以A律13折線為例。
碼字安排:用8位碼A1A2A3A4A5A6A7A8表示一個語音樣值:極性碼A1表示信號的極性(正信號為“1”,反之為“0”),段落碼A2A3A4表示13折線的8大段,段內(nèi)碼A5A6A7A8表示折線段內(nèi)的16個小段。
表3.3、表3.4分別給出了各段段落長度和段內(nèi)量化級、段落與電平關(guān)系。第二十六頁,共一百七十三頁,2022年,8月28日表3.3各段段落長度和段內(nèi)量化級
第一、二段長度為1/128,16等分后每小段為1/2048,是所有段中的最小量化單位,稱為最小量化級()。第二十七頁,共一百七十三頁,2022年,8月28日
表3.4段落與電平關(guān)系第二十八頁,共一百七十三頁,2022年,8月28日
編碼方法:常用的非線性PCM編碼方法有代碼變換法和直接編碼法。
●代碼變換:先進行12位線性編碼,然后將12位線性代碼變換為8位非線性代碼。表3.5給出了非線性與線性代碼電平關(guān)系。編碼步驟:①將樣值編成12位線性碼;②將11位線性幅度碼變換為7位非線性碼。
第二十九頁,共一百七十三頁,2022年,8月28日表3.5非線性與線性代碼電平關(guān)系表第三十頁,共一百七十三頁,2022年,8月28日
例1設(shè)語音樣值為+276Δ,用代碼變換法將其編成PCM碼。a)樣值極性為正,B0=1;b)將276轉(zhuǎn)換成二進制碼(276)10=(100010100)2樣值的12位線性碼為100100010100。c)由表3.5知,線性代碼除第1段外,其幅度代碼的首位均為“1”。第三十一頁,共一百七十三頁,2022年,8月28日(3.3.13)(3.3.14)為了求得樣值所在的折線段D,先求得二進制幅度碼有效位長W,再由第三十二頁,共一百七十三頁,2022年,8月28日
由W=9可知k=11-9=2,(5)10=(101)2,所以樣值在第6段,段落碼為A2A3A4=101。d)由表3.5知,線性代碼的幅度碼的第一個“1”后緊接著的4位代碼就是非線性代碼中的段內(nèi)碼。所以段內(nèi)碼A5A6A7A8=0001。+276Δ的PCM碼字為11010001,量化電平為256Δ+16Δ=272Δ,編碼誤差為276Δ-272Δ=4Δ<Δ′=256Δ/16=16Δ,Δ′為第6段內(nèi)的量化級。第三十三頁,共一百七十三頁,2022年,8月28日●直接編碼:直接對信號樣值進行非線性編碼。直接編碼法最常用的實現(xiàn)方法是逐次反饋比較法,圖3.9給出了逐次反饋編碼器的實現(xiàn)方框圖。
編碼步驟:①由極性判決電路確定極性碼A1;②對整流后的信號樣值幅度,用三次中值比較編出段落碼A2A3A4,求出對應(yīng)的段落起點電平;
③再用四次中值比較,確定段內(nèi)碼A5A6A7A8及相應(yīng)的電平;
④在各次比較編碼的同時輸出編出的碼組。第三十四頁,共一百七十三頁,2022年,8月28日圖3.9逐次反饋編碼器原理方框圖第三十五頁,共一百七十三頁,2022年,8月28日
例2對語音信號樣值+276Δ,用逐次反饋比較法編出相應(yīng)的PCM碼組。
D1時刻,IC>0,極性碼A1=1。
D2時刻,本地解碼器輸出IS=128Δ(第4、5段的分界電平),IC>IS,A2=1,信號在第5~8段。
D3時刻,本地解碼器輸出IS=512Δ(第6、7段的分界電平),IC<IS,A3=0,信號在第5~6段。
D4時刻,本地解碼器輸出IS=256Δ(第5、6段的分界電平),IC>IS,A4=1,信號在第6段。第三十六頁,共一百七十三頁,2022年,8月28日D5時刻,本地解碼器輸出IS=256Δ+8*16Δ=384Δ,(第8、9小段的分界電平),IC<IS,A5=0;
D6時刻,本地解碼器輸出IS=256Δ+4*16Δ=320Δ,(第4、5小段的分界電平),IC<IS,A6=0。
D7時刻,本地解碼器輸出IS=256Δ+2*16Δ=288Δ,(第2、3小段的分界電平),IC<IS,A7=0。
D8時刻,本地解碼器輸出IS=256Δ+16Δ=272Δ,(第1、2小段的分界電平),IC>IS,A8=1。
+276Δ的編碼為“11010001”,量化電平為256Δ+16Δ=272Δ,編碼誤差276Δ-272Δ=4Δ<Δ′=256Δ/16=16Δ,Δ′為第6段內(nèi)的量化級。
第三十七頁,共一百七十三頁,2022年,8月28日
2.差值脈沖編碼差值脈沖編碼是對抽樣信號當(dāng)前樣值的真值與估值的幅度差值進行量化編碼調(diào)制。圖2.10為差值編碼的原理框圖。圖3.10差值脈沖編碼的原理框圖第三十八頁,共一百七十三頁,2022年,8月28日
常用的差值編碼主要有增量調(diào)制(DM或ΔM
)、差值編碼調(diào)制(DPCM)以及自適應(yīng)差值脈沖編碼調(diào)制(ADPCM)1)增量調(diào)制對輸入信號樣值的增量(增加量或減少量)用一位二進碼進行編碼傳輸?shù)姆椒ǚQ作增量調(diào)制,簡稱DM或ΔM。增量大于0時為“1”,增量小于0時為“0”。圖3.11為DM構(gòu)成原理框圖及編碼過程。第三十九頁,共一百七十三頁,2022年,8月28日
圖3.11簡單DM原理與編碼過程第四十頁,共一百七十三頁,2022年,8月28日
DM調(diào)制原理框圖主要由減法電路,判決和碼形成以及本地解碼電路組成。圖中fs(t)為輸入信號,本地解碼器(可用簡單的RC積分電路實現(xiàn))預(yù)測輸出信號估值fdˊ(t),相減電路輸出e(t)=fs(t)-fdˊ(t),判決和碼形成電路判決e(t)極性并編碼,e(t)>0時判為“1”,輸出+E電平,e(t)<0時判為“0”,輸出-E電平。第四十一頁,共一百七十三頁,2022年,8月28日
圖32.11(b)~(d)說明了DM的工作過程。輸入信號為fs(t),積分器初始狀態(tài)為零,即,則有:當(dāng)t=0時,預(yù)測值編碼為“1”;當(dāng)t=T時,預(yù)測值編碼為“0”;第四十二頁,共一百七十三頁,2022年,8月28日當(dāng)t=2T時,預(yù)測值編碼為“1”;當(dāng)t=3T時,預(yù)測值編碼為“1”;當(dāng)t=4T時,預(yù)測值編碼為“1”;當(dāng)t=5T時,預(yù)測值編碼為“1”;第四十三頁,共一百七十三頁,2022年,8月28日當(dāng)t=6T時,預(yù)測值
編碼為“0”;當(dāng)t=7T時,預(yù)測值編碼為“0”;當(dāng)t=8T時,預(yù)測值編碼為“1”。第四十四頁,共一百七十三頁,2022年,8月28日
2)差值脈沖編碼調(diào)制將輸入信號樣值的差值量化、編碼成n位二進碼,稱為差值脈沖編碼調(diào)制(DPCM)。DM可看作DPCM的特例。圖3.12示出了基本的DPCM系統(tǒng)框圖,預(yù)測器產(chǎn)生預(yù)測信號,差值信號e(t)=fs(t)-fdˊ(t)經(jīng)過多電平均勻量化器Q[·]量化為多電平信號eˊ(t)
,eˊ(t)一路送線性PCM編碼器編碼成DPCM碼,另一路與相加后反饋到預(yù)測器。第四十五頁,共一百七十三頁,2022年,8月28日圖3.12DPCM系統(tǒng)原理框圖
第四十六頁,共一百七十三頁,2022年,8月28日
3)自適應(yīng)差值脈沖編碼調(diào)制自適應(yīng)差值脈沖編碼調(diào)制(ADPCM)系統(tǒng)是在DPCM系統(tǒng)基礎(chǔ)上,根據(jù)差值大小調(diào)整量化階大?。ㄗ赃m應(yīng)量化),使輸入信號與預(yù)測信號差值最小(自適應(yīng)預(yù)測)。圖3.13為ADPCM系統(tǒng)的原理框圖。第四十七頁,共一百七十三頁,2022年,8月28日圖3.13ADPCM系統(tǒng)原理框圖(a)編碼器;(b)解碼器第四十八頁,共一百七十三頁,2022年,8月28日(1)自適應(yīng)量化量化階距Δ(t)隨輸入信號能量變化。常用的自適應(yīng)量化實現(xiàn)方案有:前饋自適應(yīng)量化(直接用輸入信號方差控制Δ(t)的變化,如圖3.13中雙虛線所示),反饋自適應(yīng)量化(通過編碼器輸出碼流估算輸入信號方差,進而控制Δ(t),如圖3.13中單虛線所示)。(2)自適應(yīng)預(yù)測輸入信號預(yù)測值隨輸入信號能量變化。常用的自適應(yīng)預(yù)測實現(xiàn)方案有:前饋自適應(yīng)預(yù)測和反饋自適應(yīng)預(yù)測。ADPCM是語音波形壓縮編碼傳輸廣泛采用的一種方式。第四十九頁,共一百七十三頁,2022年,8月28日
3.子帶編碼將語音信號頻帶分割成若干個帶寬較窄的子帶,分別對這些子帶信號進行獨立編碼的方式,稱為子帶編碼(SBC—Sub-BandCoding)。1)SBC基本原理首先通過一組帶通濾波器把輸入信號頻帶分拆成若干個子帶信號,每個子帶信號經(jīng)過調(diào)制后,被變換成低通信號,然后進行單獨的編碼,再將各路子帶碼流用合路器復(fù)接起來。圖3.15為子帶編碼原理方框圖。第五十頁,共一百七十三頁,2022年,8月28日圖3.15子帶編碼原理框圖第五十一頁,共一百七十三頁,2022年,8月28日2)子帶的劃分語音信號通常分成4~6個子帶,各子帶的帶寬應(yīng)考慮到各頻段對主觀聽覺貢獻(xiàn)相等的原則做合理的分配,子帶間允許有小的間隙,如圖3.16所示。表3.6給出了一個16kb/s的子帶編碼器的典型參數(shù)(輸入信號取樣率為6400Hz)。第五十二頁,共一百七十三頁,2022年,8月28日圖3.16子帶劃分頻域示意第五十三頁,共一百七十三頁,2022年,8月28日表3.616kb/sSBC系統(tǒng)典型參數(shù)第五十四頁,共一百七十三頁,2022年,8月28日
4.變換域編碼先將信號進行某種函數(shù)變換(從一種描述空間變換到另一種描述空間),再對變換后的信號進行編碼。1)數(shù)學(xué)模型
將一幀語音信號s(n),0≤n≤N-1,描述為一個矢量:若A為正交變換矩陣,即(3.3.16)(3.3.17)(3.3.18)(3.3.19)第五十五頁,共一百七十三頁,2022年,8月28日
例3設(shè),變換矩陣為輸出序列:接收端反變換后恢復(fù)序列:第五十六頁,共一百七十三頁,2022年,8月28日2)幾種常用變換(1)離散傅氏變換(DFT)正變換:
式中:(3.3.20)反變換:(3.3.21)第五十七頁,共一百七十三頁,2022年,8月28日
例4由DFT定義,4×4DFT變換矩陣為設(shè)信源信號的協(xié)方差矩陣為第五十八頁,共一百七十三頁,2022年,8月28日變換后信號的協(xié)方差矩陣:第五十九頁,共一百七十三頁,2022年,8月28日(2)沃爾什—哈德曼變換(WHT)變換矩陣:式中,AWH(1)=1。WHT變換公式為第六十頁,共一百七十三頁,2022年,8月28日
例5設(shè)N=4第六十一頁,共一百七十三頁,2022年,8月28日信源信號協(xié)方差矩陣同例4,變換后信號的協(xié)方差矩陣:第六十二頁,共一百七十三頁,2022年,8月28日
(3)離散余弦變換(DCT)正變換:(3.3.24)(3.3.25)逆變換(IDCT):第六十三頁,共一百七十三頁,2022年,8月28日
例64階DCT變換矩陣為
c、d為實數(shù),信源信號協(xié)方差矩陣同例4,變換后信號的協(xié)方差矩陣:第六十四頁,共一百七十三頁,2022年,8月28日
3)自適應(yīng)變換編碼(ATC)實現(xiàn)原理ATC系統(tǒng)的實現(xiàn)原理:利用正交變換把時域信號變換到另一域,再對變換域信號進行最佳量化。圖3.17為ATC系統(tǒng)原理框圖,時域信號經(jīng)變換后,將表征信號譜的邊帶信息提取出來,邊帶信息一方面用來估計信號譜,從而控制量化間隔和編碼比特分配;另一方面被編碼傳送到收端用于重構(gòu)收端信源信號。第六十五頁,共一百七十三頁,2022年,8月28日圖3.17ATC系統(tǒng)原理框圖緩存變換量化編碼提取邊帶信息計算量化間隔、比特分配譜估計合路器分路器解碼s(n)輸入信道輸出逆變換緩存s(n)計算量化間隔、比特分配譜估計第六十六頁,共一百七十三頁,2022年,8月28日
3.3.2參數(shù)編碼技術(shù)對語音參數(shù)編碼來傳輸語音的方式稱為語音參數(shù)編碼。
1語音產(chǎn)生模型及特征參數(shù)1)語音信號模型根據(jù)激勵源與聲道模型的不同,語音可分為濁音和清音。
第六十七頁,共一百七十三頁,2022年,8月28日
(1)濁音及基音濁音,又稱有聲音。發(fā)濁音時聲帶在氣流的作用下準(zhǔn)周期地開啟和閉合,在聲道中激勵起準(zhǔn)周期的聲波,如圖3.18所示。
圖3.18濁音聲波波形圖第六十八頁,共一百七十三頁,2022年,8月28日
語音信號具有非平穩(wěn)性和隨機性,只能用短時傅氏變換求它的頻譜。圖3.19為采用漢明窗函數(shù)截短的濁音段及典型頻譜。頻譜圖上小峰點對應(yīng)基音的諧波頻率,“尖峰”形狀頻譜說明濁音信號的能量集中在各基音諧波頻率附近,而且主要集中于低于3000Hz的范圍內(nèi)。第六十九頁,共一百七十三頁,2022年,8月28日
圖3.19濁音段窗取波形及典型頻譜(a)漢明窗取濁音波形;(b)濁音典型頻譜第七十頁,共一百七十三頁,2022年,8月28日
(2)清音清音又稱無聲音。氣流速度達(dá)到某一臨界速度時就會引起湍流,此時聲帶不振動,聲道相當(dāng)于被噪聲狀隨機波激勵,產(chǎn)生較小幅度的聲波,其波形與噪聲很像,這就是清音,如圖3.20所示。第七十一頁,共一百七十三頁,2022年,8月28日
圖3.20清音波形圖第七十二頁,共一百七十三頁,2022年,8月28日圖3.21清音典型頻譜第七十三頁,共一百七十三頁,2022年,8月28日
(3)共振峰及聲道參數(shù)聲道頻率特性(唇口聲速u出與聲門聲速u入之比)與諧振曲線類似,如圖3.22所示。頻率特性對應(yīng)的諧振點叫共振峰頻率。圖3.22聲道頻率特性第七十四頁,共一百七十三頁,2022年,8月28日
(4)語音信號產(chǎn)生模型語音信號發(fā)生過程可以抽象為圖3.23所示的物理模型。圖3.23語音信號產(chǎn)生模型第七十五頁,共一百七十三頁,2022年,8月28日
2)語音特征參數(shù)及提取方法基音周期、共振峰頻率、清/濁音判決和語音強度等都屬于語音信號的特征參數(shù)?;糁芷诤颓?濁音判決可以同時獲得,其方法主要有三大類:①時域法,直接用語音信號波形來估計;②頻域法,將語音信號變換到頻域來估計;③混合法,綜合語音信號的頻域和時域特性來估計。聲道參數(shù)和語音強度等特征參數(shù)通過語音分析器或合成器中的線性預(yù)測分析系統(tǒng)獲取。第七十六頁,共一百七十三頁,2022年,8月28日
2聲碼器簡介及發(fā)展
語音信號的分析合成:發(fā)端分析提取表征音源和聲道的特征參數(shù),通過適當(dāng)量化編碼方式傳輸?shù)浇邮斩?,收端利用這些參數(shù)重新合成發(fā)端語音信號。聲碼器:實現(xiàn)語音信號分析合成的系統(tǒng)。常見的聲碼器有:相位聲碼器、通道聲碼器、共振峰聲碼器以及線性預(yù)測聲碼器。第七十七頁,共一百七十三頁,2022年,8月28日1)相位聲碼器
估計各通道信號的幅度和相位導(dǎo)數(shù),并對它們進行編碼。圖3.24為相位聲碼器單通道實現(xiàn)框圖。圖中,ωk為該通道濾波器的中心頻率,Wk(n)是分析窗函數(shù),輸入信號s(n)經(jīng)分析窗后得到信號的實部和虛部,轉(zhuǎn)換成對應(yīng)的幅度信號和相位導(dǎo)數(shù)信號,然后進行量化編碼傳輸。第七十八頁,共一百七十三頁,2022年,8月28日圖3.24相位聲碼器單通道實現(xiàn)框圖(a)發(fā)端;(b)收端第七十九頁,共一百七十三頁,2022年,8月28日2)通道聲碼器
圖3.25為通道聲碼器實現(xiàn)原理框圖。利用了人耳對相位特性的不敏感性,只傳送語音信號的幅度,而不考慮相位信息。圖3.25通道聲碼器原理方框圖第八十頁,共一百七十三頁,2022年,8月28日
3)共振峰聲碼器采用共振峰作為語音特征傳輸參數(shù)的聲碼器成為共振峰聲碼器。圖3.26為共振峰聲碼器原理框圖。發(fā)端提取的語音參數(shù)有基音周期(TP)、清/濁音判決(uv/v)、語音強度(G)和共振峰參數(shù)。F1~F3為共振峰頻率,A1~A3為相應(yīng)的共振峰強度。
第八十一頁,共一百七十三頁,2022年,8月28日圖3.26共振峰聲碼器原理框圖(a)發(fā)端;(b)收端
第八十二頁,共一百七十三頁,2022年,8月28日
4)線性預(yù)測聲碼器
線性預(yù)測聲碼器(LPC聲碼器)建立在二元語音信號模型(圖3.23)基礎(chǔ)上。將語音用少量特征參數(shù):清/濁音判決、基音周期、聲道參數(shù)和語音強度G來表示。圖3.27為LPC聲碼器的原理框圖。圖3.28為LPC聲碼器中的合成器框圖。第八十三頁,共一百七十三頁,2022年,8月28日圖3.27LPC聲碼器原理框圖(a)發(fā)端;(b)收端預(yù)加重反預(yù)加重自相關(guān)線性預(yù)測分析量化編碼s(n)Guv/vTP至信道解碼合成器自信道入合成語音加窗{ai}基音周期提取清/濁音判決(a)s(n)(b)第八十四頁,共一百七十三頁,2022年,8月28日圖3.28LPC聲碼器中的合成器第八十五頁,共一百七十三頁,2022年,8月28日
3.3.3混合編碼技術(shù)1LPC聲碼器的主要缺陷及改進方法
LPC聲碼器的缺點:①損失了語音自然度。②降低了方案的可靠性。③易引起共振峰位置失真。④帶寬估值誤差大。第八十六頁,共一百七十三頁,2022年,8月28日
LPC聲碼器的改進方案:
波形自適應(yīng)預(yù)測編碼(APC)在壓縮數(shù)碼率的同時能夠獲得較高質(zhì)量的重構(gòu)語音。圖3.29為APC與LPC的方案比較。圖(a)為APC原理框圖,線性預(yù)測分析估計出的M個LPC參數(shù)組成的M階FIR濾波器對語音樣值自適應(yīng)預(yù)測得預(yù)測誤差信號(余數(shù)信號),和量化編碼后送入信道。收端,解碼后的LPC參數(shù)和余數(shù)信號利用IIR濾波器恢復(fù)出語音信號。第八十七頁,共一百七十三頁,2022年,8月28日圖3.29APC與LPC方案比較(a)APC方案;(b)LPC方案第八十八頁,共一百七十三頁,2022年,8月28日
2余數(shù)激勵線性預(yù)測編碼聲碼器(RELPC)
語音余數(shù)信號低頻譜中的一部分(基帶余數(shù)信號)替代清/濁音判決和基音周期傳送到收端作為激勵信號,圖3.30為RELPC系統(tǒng)原理框圖。發(fā)端用低通濾波器濾出基帶余數(shù)信號,將預(yù)測參數(shù)和基帶余數(shù)信號量化編碼送入信道。收端,基帶余數(shù)信號通過插值、高頻再生得到全帶余數(shù)信號,解碼后的LPC參數(shù)和全帶余數(shù)信號用IIR濾波器恢復(fù)出語音信號。
第八十九頁,共一百七十三頁,2022年,8月28日圖3.30RELPC系統(tǒng)原理框圖(a)發(fā)端;(b)收端第九十頁,共一百七十三頁,2022年,8月28日3多脈沖激勵線性預(yù)測編碼聲碼器(MPC)通過研究語音模型的激勵形式可以發(fā)現(xiàn):無論是合成清音還是濁音,都采用一個數(shù)目有限、幅度和位置可以調(diào)整的脈沖序列作為激勵源,因而稱為多脈沖激勵LPC聲碼器。圖3.31為MPC算法原理框圖,根據(jù)合成語音與原始語音之間的均方誤差最小準(zhǔn)則,遞推分析出一組多脈沖參數(shù)(位置及幅度),然后與LPC參數(shù)量化編碼送入信道。第九十一頁,共一百七十三頁,2022年,8月28日圖3.31MPC算法原理框圖(a)發(fā)端;(b)收端第九十二頁,共一百七十三頁,2022年,8月28日4規(guī)則激勵長時預(yù)測編碼(RPE-LTP)
用一組由余數(shù)信號獲得的間距相等、相位與幅度優(yōu)化的規(guī)則脈沖代替余數(shù)信號,使得合成語音波形盡量逼近原始語音信號。圖3.32為GSMRPE-LTP編碼器原理框圖,主要由預(yù)處理、LPC分析、短時分析濾波、長時預(yù)測和規(guī)則激勵碼編碼五大部分構(gòu)成。
第九十三頁,共一百七十三頁,2022年,8月28日圖3.32GSMRPE-LTP編碼原理框圖第九十四頁,共一百七十三頁,2022年,8月28日
①預(yù)處理去除s0(n)中的支流分量;進行高頻分量預(yù)加重(鑒頻器的輸出噪聲功率譜按頻率的平方規(guī)律增加)。
②LPC分析提取LPC參數(shù)。先求出信號的自相關(guān)系數(shù),然后求出LPC反射系數(shù),反射系數(shù)先取對數(shù)面積比參數(shù)(減小量化誤差)后再量化編碼。
③
短時分析濾波
對信號s(n)進行LPC短時預(yù)測分析,產(chǎn)生余數(shù)信號d。
第九十五頁,共一百七十三頁,2022年,8月28日
④長時預(yù)測
對余數(shù)信號進行長時預(yù)測,分為長時分析和長時預(yù)測兩部分。長時分析估計預(yù)測系數(shù)b和預(yù)測最佳延時樣點數(shù)N,編碼后傳送到收端;長時預(yù)測利用恢復(fù)出的長時預(yù)測系數(shù)N′、b′和短時余數(shù)信號d′預(yù)測當(dāng)前子幀的余數(shù)信號d"。
⑤
規(guī)則激勵碼編碼
先提取規(guī)則序列碼,然后對所確定的序列進行量化編碼。第九十六頁,共一百七十三頁,2022年,8月28日
5矢量和激勵線性預(yù)測編碼(VSELP)對余數(shù)信號進行矢量量化,從激勵矢量碼本中挑選出一個最佳序列(激勵矢量)代替余數(shù)信號,使由其合成的語音波形與原始語音波形的加權(quán)均方誤差最小(只傳送激勵矢量在碼本中的序號和其他邊帶信息)。圖334為EIA/TIAVSELP方案實現(xiàn)原理框圖。
第九十七頁,共一百七十三頁,2022年,8月28日圖3.34EIA/TIAVSELP方案實現(xiàn)原理框圖(a)編碼器原理框圖;(b)解碼器原理框圖
加權(quán)濾波器W(z)碼本Ⅰ碼本ⅡH(z)∑e2長時預(yù)測狀態(tài)選擇I、L和H使總加權(quán)誤差最小LIHbg1加權(quán)綜合濾波器長時預(yù)測狀態(tài)碼本Ⅰ碼本Ⅱ基音濾波器綜合濾波器A(z)頻譜后濾波Hqg1qex(n)總加權(quán)誤差+輸出語音s(n)g2+{ai}+I(xiàn)qLqbg2q+{aiq}(a)(b)p(n)p'(n)_第九十八頁,共一百七十三頁,2022年,8月28日
VSELP編碼器中除了提取LPC參數(shù)外,主要是確定長時預(yù)測狀態(tài)和短時激勵失量。經(jīng)過短時、長時預(yù)測后的語音余數(shù)信號s(n)通過加權(quán)濾波后得信號p(n),與由矢量和激勵信號通過加權(quán)綜合濾波器恢復(fù)的余數(shù)信號p′(n)相減得誤差信號e(n),再利用加權(quán)誤差和最小準(zhǔn)則來確定長時預(yù)測狀態(tài)和短時激勵矢量。第九十九頁,共一百七十三頁,2022年,8月28日6低時延碼激勵線性預(yù)測編碼(LD―CELP)圖3.35為LD―CELP原理框圖,輸入PCM信碼經(jīng)非線性/線性轉(zhuǎn)換變成均勻量化的PCM信號并以5個樣值組成一個信源矢量存入緩沖器;虛線框輸出一個與輸入語音樣值誤差最小的合成語音樣值;合成語音樣值與緩沖器中的輸入語音矢量的誤差信號經(jīng)感覺加權(quán)濾波,根據(jù)最小均方誤差準(zhǔn)則輸出對應(yīng)的碼字編號傳送到接收端。第一百頁,共一百七十三頁,2022年,8月28日圖3.35LD―CELP原理框圖(a)發(fā)端編碼器;(b)收端編碼器非線性/線性轉(zhuǎn)換緩沖器5維激勵碼本增益控制50階綜合濾波器10階感覺加權(quán)濾波器均方誤差最小準(zhǔn)則后向LPC分析增益自適應(yīng)調(diào)節(jié)16kbit/s參數(shù)碼流+-5維激勵碼本增益控制50階綜合濾波器10階感覺加權(quán)濾波器線性/非線性轉(zhuǎn)換16kbit/s參數(shù)碼流后向LPC分析增益自適應(yīng)調(diào)節(jié)64kbit/sPCM碼流64kbit/sPCM碼流+(a)(b)第一百零一頁,共一百七十三頁,2022年,8月28日7多帶激勵線性預(yù)測編碼(MBE)
基于頻域的語音信號產(chǎn)生模型——多帶激勵模型,提高了合成語音的自然度。圖3.36為MBE語音信號產(chǎn)生模型,按基音各諧波頻率將語音頻譜分成若干個諧波帶,再將幾個諧波帶為一組進行分帶,分別對各帶進行清/濁音判決。濁音帶用以基音周期為周期的脈沖序列譜作為激勵信號譜,清音帶用白噪聲譜作為激勵信號譜。圖3.37、圖3.38分別MBE算法發(fā)端語音分析原理框圖和收端語音合成框圖。第一百零二頁,共一百七十三頁,2022年,8月28日圖3.36MBE語音信號產(chǎn)生模型生器發(fā)生器T
/1AM12M2Sw)P脈沖序列發(fā)生器白噪聲發(fā)生器Σ濁音清音頻域分帶uvv開關(guān)A頻帶頻帶頻帶…A(第一百零三頁,共一百七十三頁,2022年,8月28日圖3.37MBE模型參數(shù)分析提取過程第一百零四頁,共一百七十三頁,2022年,8月28日圖3.38MBE方案語音合成過程第一百零五頁,共一百七十三頁,2022年,8月28日3.4數(shù)字音頻編碼標(biāo)準(zhǔn)
3.4.1話音音頻編碼標(biāo)準(zhǔn)
1G.711標(biāo)準(zhǔn)CCITT于1972年規(guī)范了模擬話音信號用PCM編碼時的特性,主要內(nèi)容:①模擬信號取樣率標(biāo)稱值為每秒8000個樣值,容差為±50ppm。②推薦A律和μ律兩種編碼率,量化值的數(shù)目由編碼律決定,每個樣值編碼為8位二進制數(shù)碼。第一百零六頁,共一百七十三頁,2022年,8月28日
③A律(或μ律)的每一個“判決值”和“量化值”應(yīng)當(dāng)與一個“均勻的PCM值”相關(guān)聯(lián)。④串行傳輸時樣值編碼碼字中首先傳送極性比特,最后傳送最低有效位比特。⑤A律(或μ律)各規(guī)定了一個字符信號周期序列,周期序列加到PCM復(fù)用設(shè)備解碼器輸入端時,任一音頻輸出端應(yīng)當(dāng)出現(xiàn)一個標(biāo)稱電平為0dBm0的1kHz正弦信號。⑥理論負(fù)載容量:A律為+3.14dBm0,μ律為+3.17dBm0。第一百零七頁,共一百七十三頁,2022年,8月28日
2G.721標(biāo)準(zhǔn)
CCITT于1988年為實現(xiàn)64kb/sA律或μ律PCM與32kb/sADPCM數(shù)字信道之間相互轉(zhuǎn)換而制訂的。協(xié)議中提出了一種PCMADPCM轉(zhuǎn)換編碼算法。3G.722標(biāo)準(zhǔn)
CCITT于1988年規(guī)范了一種音頻(50~7000Hz)編碼系統(tǒng)的特性,該系統(tǒng)可用于各種質(zhì)量比較高的語聲應(yīng)用,編碼系統(tǒng)使用比特率在64kb/s以內(nèi)的子帶自適應(yīng)差分脈沖編碼調(diào)制(SC-ADPCM)。圖3.39為64kb/s音頻編/解碼器的原理框圖。表3.12為G.722基本工作模式。第一百零八頁,共一百七十三頁,2022年,8月28日圖3.39G.722編/解碼器原理框圖(a)發(fā)端編碼器;(b)收端解碼器第一百零九頁,共一百七十三頁,2022年,8月28日表3.12G.722基本工作模式第一百一十頁,共一百七十三頁,2022年,8月28日
4G.728標(biāo)準(zhǔn)CCITT于1992年制訂了G.728標(biāo)準(zhǔn),使用基于短時延碼本激勵線性預(yù)測編碼(LD―CELP)算法,標(biāo)準(zhǔn)對LD―CELP算法進行了概述,并分別介紹了發(fā)端編碼器和收端解碼器的實現(xiàn)原理和功能,而且對各種計算方法和參數(shù)進行了詳細(xì)規(guī)定。5G.729標(biāo)準(zhǔn)ITU-T于1995年制訂了G.729標(biāo)準(zhǔn),提出一種采用共軛結(jié)構(gòu)代數(shù)碼激勵線性預(yù)測(CS―ACELP)方法,以8kb/s速率對語音信號編碼。圖3.40、圖3.41分別為G.729給出的發(fā)端編碼器、收端解碼器的原理框圖。第一百一十一頁,共一百七十三頁,2022年,8月28日圖3.40CS―ACELP編碼器原理第一百一十二頁,共一百七十三頁,2022年,8月28日圖3.41CS―ACELP譯碼器原理第一百一十三頁,共一百七十三頁,2022年,8月28日3.4.2高保真立體聲音頻編碼標(biāo)準(zhǔn)
目前的音頻信號分為三類:電話質(zhì)量的語音信號、調(diào)幅廣播質(zhì)量的音頻信號和高保真立體聲音頻信號。
1MPEG-1音頻編碼標(biāo)準(zhǔn)(ISO/IEC11172-3)ISO/IEC制訂了MPEG-1音頻編碼標(biāo)準(zhǔn),是國際上第一個高保真立體聲音頻編碼標(biāo)準(zhǔn),是以MUSICAM(MaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing)為基礎(chǔ)的三層編碼結(jié)構(gòu),圖3.42為MUSICAM編碼器的原理框圖。
第一百一十四頁,共一百七十三頁,2022年,8月28日
濾波器組對信號進行頻率變換,并將信號分成32個子帶,每個子帶中確定一段信號的最大電平,由此得到比例因子編碼參數(shù);根據(jù)人耳的掩蔽效應(yīng)確定掩蔽門限,比特分配模塊自適應(yīng)分配比特;最后將音頻壓縮數(shù)據(jù)、比例因子和比特分配信息組合在一起構(gòu)成模塊,形成音頻編碼比特流。第一百一十五頁,共一百七十三頁,2022年,8月28日圖3.42MUSICAM編碼器框圖第一百一十六頁,共一百七十三頁,2022年,8月28日
圖3.43為MPEG-1音頻編碼的比特流幀結(jié)構(gòu)。幀標(biāo)志占32比特,由同步信息和狀態(tài)信息組成,同步碼由12比特全1碼組成;幀校驗碼占16比特,采用CRC校驗,用于檢測比特流中的傳輸差錯;音頻數(shù)據(jù)由比特分配信息、比例因子信息和子帶音頻樣點組成,不同層的音頻樣點不同;輔助數(shù)據(jù)在音頻比特流中提供一個長度可變的通道用于傳輸輔助數(shù)據(jù)。圖3.43MPEG―1音頻編碼比特流幀結(jié)構(gòu)第一百一十七頁,共一百七十三頁,2022年,8月28日
圖3.44為MPEG-1音頻解碼器的基本結(jié)構(gòu),幀分解進行分解和解碼,恢復(fù)出各種信息段(若編碼時采用了CRC校驗,還進行差錯檢測)。重建模塊重建一組變換樣點的量化形式;逆變換將這些變換樣點變換回均勻的PCM音頻樣點。圖3.44MPEG-1音頻解碼器基本結(jié)構(gòu)第一百一十八頁,共一百七十三頁,2022年,8月28日
2MPEG-2音頻編碼標(biāo)準(zhǔn)(ISO/IEC13818-3)
ISO/IEC于1994年制訂了MPEG-2音頻編碼標(biāo)準(zhǔn),在MPEG-1基礎(chǔ)上擴展了低碼率多聲道編碼,稱為MUSICAM環(huán)繞聲。該方案將MPEG-1的2聲道擴展至5.1個,即3個前聲道(左L、中C和右R)、2個環(huán)繞聲道(左LS、右RS)和1個超低音聲道LFE(常稱為0.1聲道),多聲道擴展信息加到MPEG-1音頻數(shù)據(jù)幀結(jié)構(gòu)的輔助數(shù)據(jù)段,圖3.45為MPEG-2音頻數(shù)據(jù)幀結(jié)構(gòu)。
第一百一十九頁,共一百七十三頁,2022年,8月28日圖3.45MPEG―2音頻數(shù)據(jù)幀結(jié)構(gòu)
第一百二十頁,共一百七十三頁,2022年,8月28日MPEG-1音頻編碼的第一層,多聲道擴展數(shù)據(jù)被分成三部分,在連續(xù)3幀MPEG-1音頻數(shù)據(jù)幀的輔助數(shù)據(jù)段傳送;在第二、三層,多聲道擴展數(shù)據(jù)在1個MPEG-1音頻數(shù)據(jù)幀的輔助數(shù)據(jù)段傳送。完整的MPEG-2數(shù)據(jù)幀包括:32位幀標(biāo)志碼,可選的16位CRC循環(huán)冗余校驗碼,音頻數(shù)據(jù)和輔助數(shù)據(jù)。MPEG-2音頻編碼能傳送多路音頻,并能確保比特流與MPEG-1前向和后向兼容。第一百二十一頁,共一百七十三頁,2022年,8月28日3MPEG-4音頻編碼標(biāo)準(zhǔn)(ISO/IEC14496)
ISO/IEC于1998年制訂了MPEG-4音頻編碼標(biāo)準(zhǔn),給利用窄帶ISDN實現(xiàn)交互式多媒體應(yīng)用提供支持,定義了3種類型的編碼器:①低速率音頻編碼,對8kHz取樣的語音2~4kb/s速率的編碼。②中速率音頻編碼,對8kHz或16kHz取樣的語音4~16~kb/s速率的編碼。③高速率音頻編碼,16kb/s以上速率的編碼。第一百二十二頁,共一百七十三頁,2022年,8月28日
4AC-3系統(tǒng)AC-3系統(tǒng)是新一代高保真立體聲音頻編碼系統(tǒng),為美國的全數(shù)字式高清晰度電視(HDTV)提供高質(zhì)量的伴音。1993年11月,美國高級電視系統(tǒng)委員會(ATSC)正式批準(zhǔn)其大聯(lián)盟高清晰度電視(GA-HDTV)系統(tǒng)采用AC-3音頻編碼方案。AC-3系統(tǒng)繼承了AC-2系統(tǒng)的許多優(yōu)點(變換編碼、自適應(yīng)量化和比特分配、人耳心理聽覺特性等),并采用了一些新技術(shù)(指數(shù)編碼、混合前/后向自適應(yīng)比特分配和耦合技術(shù)等)。圖3.46為AC-3系統(tǒng)的原理框圖。
第一百二十三頁,共一百七十三頁,2022年,8月28日圖3.46AC-3系統(tǒng)音頻編碼原理第一百二十四頁,共一百七十三頁,2022年,8月28日分析濾波器組將音頻信號從時域變換到頻域;比特分配模塊決定可接受的信噪比;最后頻域參數(shù)粗糙量化到所需精度,并編碼形成音頻基本碼流。音頻基本碼流的基本單元是AC-3同步幀,圖3.47為AC-3音頻編碼比特流幀結(jié)構(gòu)。每個AC-3同步幀由一個16比特同步信息(SI)字、碼流信息(BSI)、32ms的音頻編碼流和一個CRC差錯控制段(16比特)組成。圖3.47AC-3音頻編碼比特流幀結(jié)構(gòu)
第一百二十五頁,共一百七十三頁,2022年,8月28日3.5圖像編碼技術(shù)
3.5.1概述
目前,壓縮后的圖像信息傳輸主要采用兩類方式:模擬傳輸和數(shù)字傳輸。模擬傳輸采用某種調(diào)制方式將模擬圖像信號調(diào)制到相應(yīng)頻帶傳輸,抗干擾能力弱,傳輸中易造成波形失真;數(shù)字傳輸抗干擾能力強,容易實現(xiàn)加密,與B-ISDN傳輸匹配,適合于未來的多媒體通信。第一百二十六頁,共一百七十三頁,2022年,8月28日3.5.2圖像壓縮編碼(預(yù)測、變換、熵編碼)
1預(yù)測編碼利用差分脈沖編碼調(diào)制去除圖像數(shù)據(jù)間的空域冗余度和時間冗余度,可以在一幀圖像內(nèi)進行幀內(nèi)預(yù)測編碼,也可在多幀圖像間進行幀間預(yù)測編碼。
空間冗余:在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,區(qū)域中所有點光強、色彩及色飽和度都相同,有很大的空間冗余。
時間冗余:動畫等序列圖片中物體有位移時,后一幀數(shù)據(jù)與前一幀數(shù)據(jù)有許多共同地方,只有部分相鄰幀改變的畫面,這種冗余稱為時間冗余。第一百二十七頁,共一百七十三頁,2022年,8月28日
①
幀內(nèi)預(yù)測編碼圖3.48為DPCM幀內(nèi)預(yù)測編碼原理框圖,發(fā)端線性預(yù)測器預(yù)測當(dāng)前樣值的估值,量化編碼對誤差信號進行量化編碼傳輸;收端經(jīng)過DPCM解碼后利用一個與發(fā)端相同的預(yù)測器即可恢復(fù)發(fā)端原始信號x(n)的恢復(fù)近似值y(n)。第一百二十八頁,共一百七十三頁,2022年,8月28日
圖3.48DPCM原理框圖(a)編/解碼器;(b)一維預(yù)測與二維預(yù)測第一百二十九頁,共一百七十三頁,2022年,8月28日
②
幀間預(yù)測編碼
利用視頻信號相鄰幀間的相關(guān)性進行幀間編碼,可獲得比幀內(nèi)預(yù)測編碼高得多的壓縮比。
1)幀間統(tǒng)計特性視頻信號相鄰幀之間的時間間隔很小,相鄰幀間圖像細(xì)節(jié)的變化很少
2)幀重復(fù)靜止或活動很慢的視頻信號,可以少傳一些幀,例如,隔幀傳輸。未傳輸?shù)膸媒邮斩说膸鎯ζ髦斜4娴那耙粠瑪?shù)據(jù)作為該幀數(shù)據(jù)。第一百三十頁,共一百七十三頁,2022年,8月28日3)閾值法對幀間亮度差值超過某一閾值的像素編碼傳送。4)幀內(nèi)插對于活動緩慢的圖像,可使用前后兩幀圖像進行內(nèi)插,得到實際幀圖像的預(yù)測圖像,然后對實際幀與預(yù)測幀的差值信號進行編碼。5)運動補償預(yù)測編碼知道了運動物體的運動規(guī)律,就可從前一幀圖像推算出它在當(dāng)前幀的位置,編碼器將物體的運動信息告知解碼器,解碼器就可根據(jù)此信息和前一幀圖像來更新當(dāng)前圖像。第一百三十一頁,共一百七十三頁,2022年,8月28日
2變換編碼降低信源空間冗余度,常采用某種正交變換,將圖像取樣值變換到變換域,去除視頻圖像信號相關(guān)性。正交變換數(shù)據(jù)壓縮原理:首先,正交變換產(chǎn)生的變換域系數(shù)之間的相關(guān)性很小,可分別獨立進行處理;另外,正交變換后能量大多集中在少量變換域系數(shù),通過量化刪去對圖像信號貢獻(xiàn)小的系數(shù),用保留下來的系數(shù)恢復(fù)原始圖像。下面介紹數(shù)據(jù)壓縮中廣泛采用的離散余弦變換編碼。第一百三十二頁,共一百七十三頁,2022年,8月28日DCT編碼的主要步驟:(1)DCT變換(3.5.3)(3.5.4)第一百三十三頁,共一百七十三頁,2022年,8月28日
(2)系數(shù)量化系數(shù)量化是DCT編碼的關(guān)鍵,常用的方法有區(qū)域編碼、自適應(yīng)比特分配、門限控制和綜合法。區(qū)域編碼:將變換系數(shù)塊根據(jù)能量分布劃分成若干區(qū)域,對每個區(qū)域分別進行量化編碼。自適應(yīng)比特分配:根據(jù)變換系數(shù)的能量大小自適應(yīng)地分配變換所需的比特數(shù)。門限控制:小于門限的系數(shù)置0,增加無需編碼的系數(shù)個數(shù)。
第一百三十四頁,共一百七十三頁,2022年,8月28日
(3)系數(shù)排序通常按“Z”字形排列量化后的系數(shù)。
(4)熵編碼
通常的熵編碼方法:游程長度編碼、霍夫曼編碼、香農(nóng)編碼和算術(shù)編碼。視頻編碼中常用游程長度編碼和霍夫曼編碼。第一百三十五頁,共一百七十三頁,2022年,8月28日
3熵編碼去除信源的統(tǒng)計冗余。
1)游程長度編碼最早用于二值圖像的壓縮編碼。二值圖像的每一掃描行總是由若干段連著的白像素和黑像素組成,即所謂的白長和黑長,對不同的白長和黑長,按其出現(xiàn)的概率分配以不同的碼字。
2)Shannon-Fano編碼(次最佳不等長編碼)
第一百三十六頁,共一百七十三頁,2022年,8月28日第一百三十七頁,共一百七十三頁,2022年,8月28日3)Huffman編碼(最佳不等長編碼)1952年霍夫曼(Huffman)提出的最佳不等長編碼方法,是圖像壓縮編碼中最重要的編碼方法之一。霍夫曼編碼步驟:
①將輸入符號按出現(xiàn)概率從大到小順序排列(概率相同的符號可任意排列);②將最小的兩個概率相加,形成一個新的概率集合,再按第一步的方法重新排列,如此反復(fù)直到只有兩個概率為此;③為符號分配碼字。碼字分配從最后一步開始反向進行,對最后兩個概率,一個賦“1”碼,一個賦“0”碼。
第一百三十八頁,共一百七十三頁,2022年,8月28日第一百三十九頁,共一百七十三頁,2022年,8月28日圖3.49霍夫曼編碼結(jié)構(gòu)1S2S3碼長概率符號10.5S20.2530.12530.125S400.5100.25011圖3.49為霍夫曼編碼步驟,表3.14為霍夫曼編碼示例,表3.15等長編碼與霍夫曼編碼的比較。第一百四十頁,共一百七十三頁,2022年,8月28日
表3.14霍夫曼編碼示例第一百四十一頁,共一百七十三頁,2022年,8月28日表3.15等長編碼與霍夫曼編碼的比較
第一百四十二頁,共一百七十三頁,2022年,8月28日3.6圖像壓縮編碼標(biāo)準(zhǔn)3.6.1二值圖像壓縮標(biāo)準(zhǔn)
二值圖像指只有黑、白兩個亮度值的圖像。
1G3、G4標(biāo)準(zhǔn)
1)G3傳真裝置的特征
●主要用于公用交換電話網(wǎng),93年后可使用ISDN;
●
98年規(guī)定了錯誤校正方式(ECM)作為選用功能;
●采用編碼方式(MH方式)來削減傳真信號的冗余信息;
●不僅傳輸圖像,而且規(guī)定可選用功能傳輸二進制文件、文檔文件及字符等。第一百四十三頁,共一百七十三頁,2022年,8月28日
2)G4傳真裝置的特征
●基本是數(shù)據(jù)網(wǎng)用的傳真裝置;
●高速傳輸編碼方式的MMR方式和錯誤校正功能以標(biāo)準(zhǔn)功能裝在裝置中;
●
以O(shè)SI協(xié)議為準(zhǔn);
●三個級別:1類是能夠收/發(fā)編碼傳真文件的終端;2類是在1類的基礎(chǔ)上,還具備傳輸用戶電報編碼文件和混合方式文件的能力;3類是在2類功能上,增加傳輸電傳文件和混合方式文件的能力。第一百四十四頁,共一百七十三頁,2022年,8月28日
3)編碼方式MH方式:MH編碼是G3傳真的標(biāo)準(zhǔn)編碼方式,對行內(nèi)持續(xù)白(或黑)像素依次提取長度進行霍夫曼編碼,圖3.50為MH編碼示例。MR方式:MR編碼將已編碼的前一掃描線作為參考行,然后對其后的一條掃描線進行編碼,將編碼行變化像素相對參考行變化像素的位置偏差進行編碼,圖3.51為MR編碼示例。
MMR方式:MMR方式是G4傳真的標(biāo)準(zhǔn)編碼方式,對全部行都參照前面行進行編碼。
第一百四十五頁,共一百七十三頁,2022年,8月28日圖3.50MH編碼示例第一百四十六頁,共一百七十三頁,2022年,8月28日圖3.51MR編碼示例第一百四十七頁,共一百七十三頁,2022年,8月28日
2JBIG標(biāo)準(zhǔn)G3/G4標(biāo)準(zhǔn)不適應(yīng)于中間色調(diào)圖像,當(dāng)用G3/G4壓縮二值中間色調(diào)圖像時,不僅得不到壓縮,反而可能擴展數(shù)據(jù)量,制訂JBIG標(biāo)準(zhǔn)的主要原因是改進的壓縮性能。JBIG標(biāo)準(zhǔn)可以支持很高的分辨率,使用了與JPEG標(biāo)準(zhǔn)相同的自適應(yīng)無損編碼算法實現(xiàn)對二值圖像的無失真壓縮,其壓縮效率比G4標(biāo)準(zhǔn)提高30%。第一百四十八頁,共一百七十三頁,2022年,8月28日
3.6.2靜止圖像壓縮標(biāo)準(zhǔn)
1JPEG標(biāo)準(zhǔn)JPEG是JointPhotographicExpertsGroup(聯(lián)合圖片專家組)的縮寫。JPEG提供了四種算法模式:
●
基于DCT的順序模式(基本模式):適用于有損圖像壓縮的大多數(shù)場合,它不僅可用于靜止圖像,而且可用于活動圖像;
●
基于DCT的遞增模式:適用于對傳輸時間要求不嚴(yán),用戶喜歡圖像由粗糙到清晰的場合;第一百四十九頁,共一百七十三頁,2022年,8月28日
●
無損編碼模式:適用于要求無失真壓縮的場合;
●
分層編碼模式:可按多種分辨率對圖像進行編碼,適用于要求不同分辨率或圖像質(zhì)量的場合。JPEG編碼器和解碼器必須支持基本模式,基本模式基于DCT和可變長編碼(VLC)壓縮技術(shù),提供高達(dá)100:1的壓縮比,但是重建圖像不能精確再現(xiàn)原始圖像,表3.16為JPEG基本模式壓縮舉例。第一百五十頁,共一百七十三頁,2022年,8月28日表3.16JPEG基本模式壓縮舉例第一百五十一頁,共一百七十三頁,2022年,8月28日2JPEG的發(fā)展趨勢JPEG壓縮算法主要從以下方面進一步發(fā)展:(1)自適應(yīng)量化;(2)無損編碼的改進;(3)其他提高JPEG性能的可能途徑;(4)后向兼容。第一百五十二頁,共一百七十三頁,2022年,8月28日
3.6.3視頻壓縮標(biāo)準(zhǔn)按質(zhì)量分,視頻可分為三類:
●
低質(zhì)量視頻:畫面較小,通常為QCIF(CIF格式圖像像素的1/4)或CIF格式,幀速率低,可為黑白視頻也可為彩色視頻;
●
中等質(zhì)量視頻:中等大小的畫面,通常為CIF或CCIR601視頻格式;
●
高質(zhì)量視頻:畫面較大,通常為CCIR601視頻格式至高清晰度電視視頻格式。第一百五十三頁,共一百七十三頁,2022年,8月28日
1H.261標(biāo)準(zhǔn)H.261標(biāo)準(zhǔn)是CCITT制訂的國際上第一個視頻壓縮標(biāo)準(zhǔn),主要用于電視電話和會議電視,視頻算法的核心是運動估值預(yù)測和DCT編碼,圖3.52為H.261視頻編/解碼器原理框圖。信源編碼器先對視頻信號進行DCT變換,然后將變換后的系數(shù)量化;圖象復(fù)用編碼器把每幀圖像數(shù)據(jù)編排成4個層次的數(shù)據(jù)結(jié)構(gòu),同時對交流DCT系數(shù)進行可變長度編碼(VLC),對直流DCT系數(shù)進行固定長度編碼(FLC);傳輸緩沖器將速變碼流變換為固定碼率碼流。第一百五十四頁,共一百七十三頁,2022年,8月28日圖3.52H.261視頻編/解碼器第一百五十五頁,共一百七十三頁,2022年,8月28日
2MPEG-1視頻標(biāo)準(zhǔn)1991年通過的關(guān)于碼率為1.5Mb/s,用于數(shù)字存儲媒體的運動圖像和音頻的編碼標(biāo)準(zhǔn),MPE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 分期購買設(shè)備合同范本
- 買賣鋪面合同范本
- 南漳商品房買賣合同范本
- 廠房常保潔合同范例
- 前期物業(yè)協(xié)議合同范本
- 業(yè)務(wù)結(jié)算合同范本
- 體育公園合作合同范本
- 交工檢測合同范本
- 制作補充協(xié)議合同范本
- 養(yǎng)生館工作合同范本
- GB/T 3452.2-2007液壓氣動用O形橡膠密封圈第2部分:外觀質(zhì)量檢驗規(guī)范
- GB/T 30797-2014食品用洗滌劑試驗方法總砷的測定
- GB/T 20057-2012滾動軸承圓柱滾子軸承平擋圈和套圈無擋邊端倒角尺寸
- GB/T 19808-2005塑料管材和管件公稱外徑大于或等于90mm的聚乙烯電熔組件的拉伸剝離試驗
- GB/T 12771-2019流體輸送用不銹鋼焊接鋼管
- 工程驗收及移交管理方案
- 班組建設(shè)工作體系課件
- 圖片編輯概述課件
- 第章交通調(diào)查與數(shù)據(jù)分析課件
- 2023年岳陽職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試筆試題庫及答案解析
- 北師大版八年級數(shù)學(xué)上冊《認(rèn)識無理數(shù)(第2課時)》參考課件2
評論
0/150
提交評論