工學(xué)5第三講語音信號(hào)數(shù)字化及壓縮編碼課件_第1頁
工學(xué)5第三講語音信號(hào)數(shù)字化及壓縮編碼課件_第2頁
工學(xué)5第三講語音信號(hào)數(shù)字化及壓縮編碼課件_第3頁
工學(xué)5第三講語音信號(hào)數(shù)字化及壓縮編碼課件_第4頁
工學(xué)5第三講語音信號(hào)數(shù)字化及壓縮編碼課件_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三講 語音信號(hào)數(shù)字化及壓縮編碼(2)8/4/20221第1頁,共51頁。DPCM降低語音編碼速率的必要性模擬單邊帶多路載波電話的帶寬4K,而PCM的帶寬的理論值為32K在頻帶受限的應(yīng)用場(chǎng)合經(jīng)濟(jì)性太低,如衛(wèi)星通信、移動(dòng)通信等PCM占用高帶寬的原因分析為滿足語音信號(hào)的高動(dòng)態(tài)范圍而采用了多位的量化對(duì)每個(gè)采樣點(diǎn)都進(jìn)行量化,沒有考慮語音信號(hào)的前后相關(guān)性8/4/20222第2頁,共51頁。預(yù)測(cè)編碼的概念相鄰樣點(diǎn)之間可能只有一個(gè)量化間隔或少數(shù)個(gè)量化間隔的差別,PCM傳送的信息存在冗余在編碼前就去掉相關(guān)性很強(qiáng)的冗余,然后再進(jìn)行編碼傳送預(yù)測(cè)編碼,就是根據(jù)過去的信號(hào)樣值預(yù)測(cè)下一個(gè)樣值,并且把預(yù)測(cè)值與現(xiàn)實(shí)的采樣值

2、之差進(jìn)行量化加以編碼和傳送在接收端,經(jīng)過相同的預(yù)測(cè)和濾波,即可得到原始信號(hào)波形8/4/20223第3頁,共51頁。DPCM基本原理8/4/20224第4頁,共51頁。DPCM性能 一般總是大于1,稱為DPCM處理增益,其值主要取決于預(yù)測(cè)的效果由于量化的是樣值與預(yù)測(cè)值的差值信號(hào),因此動(dòng)態(tài)范圍可以減小,同時(shí)也可有效減小量化誤差,從而使DPCM在較低的編碼率下獲得較高的信噪比質(zhì)量需要研究的問題是:如何設(shè)計(jì)預(yù)測(cè)器獲得更好的SNR零點(diǎn)預(yù)測(cè)器極點(diǎn)預(yù)測(cè)器最佳預(yù)測(cè)器8/4/20225第5頁,共51頁。極點(diǎn)預(yù)測(cè)器N階預(yù)測(cè)器的輸出是前N個(gè)本地重建值的線性組合由于H(Z)只有極點(diǎn),稱這種預(yù)測(cè)器為全極點(diǎn)預(yù)測(cè)器8/4/

3、20226第6頁,共51頁。零點(diǎn)預(yù)測(cè)器M階預(yù)測(cè)器的輸出是前M個(gè)量化值的線性組合8/4/20227第7頁,共51頁。零極點(diǎn)預(yù)測(cè)器把零點(diǎn)預(yù)測(cè)器和極點(diǎn)預(yù)測(cè)器組合在一起,即構(gòu)成零極點(diǎn)預(yù)測(cè)器8/4/20228第8頁,共51頁。最佳預(yù)測(cè)器確定一組最佳預(yù)測(cè)系數(shù),使得 最小在全極點(diǎn)模型下,并忽略量化誤差最終輸出的信噪比與預(yù)測(cè)階數(shù)有關(guān)8/4/20229第9頁,共51頁。增量調(diào)制(,DeltaM)(1)簡(jiǎn)單增量調(diào)制可以認(rèn)為是 一位編碼時(shí)的特例,但編碼的是差值信號(hào)。編碼過程8/4/202210第10頁,共51頁。Q數(shù)碼形成Z-1C(n)S(n)e(n)-+Sl(n)解碼增量調(diào)制編碼器增量調(diào)制解碼器8/4/20221

4、1第11頁,共51頁。差值信號(hào)8/4/202212第12頁,共51頁。譯碼過程實(shí)際編碼譯碼器常用簡(jiǎn)單RC積分器和比較器來實(shí)現(xiàn) 和8/4/202213第13頁,共51頁。(2)斜率過載和量化信噪比當(dāng)信號(hào)變化速率超出 波形變化速率時(shí),會(huì)出現(xiàn)斜率過載現(xiàn)象,以單頻信號(hào)為例8/4/202214第14頁,共51頁。8/4/202215第15頁,共51頁。量化噪聲量化信噪比8/4/202216第16頁,共51頁。通常認(rèn)為 在 內(nèi)均勻分布,則低通濾波 后8/4/202217第17頁,共51頁。臨界過載時(shí)信噪比與信號(hào)幅度有關(guān),信號(hào)幅度小,信噪比降低8/4/202218第18頁,共51頁。例:結(jié)論: 與 三次方成

5、正比, 提 高一倍, 增大9 與 成反比,信號(hào)頻率提高一倍, 下降68/4/202219第19頁,共51頁。簡(jiǎn)單增量調(diào)制的性能改進(jìn)簡(jiǎn)單增量調(diào)制有兩個(gè)問題: 斜率過載 動(dòng)態(tài)范圍8/4/202220第20頁,共51頁。(1).數(shù)字壓擴(kuò)自適應(yīng)增量調(diào)制可同時(shí)解決動(dòng)態(tài)范圍和斜率過載問題?;靖拍睿喝缤蔷鶆?中那樣,改變量化間隔。 如果連續(xù)出現(xiàn)多個(gè)“1”或者“0,即可認(rèn)為信號(hào)有出現(xiàn)過載的可能,從而增大,使其本地譯碼信號(hào)跟上變化。 如果量階隨信號(hào)瞬時(shí)壓擴(kuò),則稱為瞬時(shí)壓擴(kuò),如果量階隨語音音節(jié)時(shí)間間隔中信號(hào)的平均斜率變化而進(jìn)行壓擴(kuò),則稱為CVSD連續(xù)可變斜率一音節(jié)基音周期(520)ms8/4/202221第2

6、1頁,共51頁。(2).增量總和調(diào)制可解決斜率過載問題其要點(diǎn)是:將信號(hào)先進(jìn)行積分,改變其頻率響應(yīng)。使高頻分量幅度下降(與預(yù)加重相反),然后再進(jìn)行 編碼。為此,在接收端為了不失真恢復(fù)原信號(hào),需要將解碼后信號(hào)進(jìn)行微分。8/4/202222第22頁,共51頁。信道誤碼對(duì) 的影響對(duì)簡(jiǎn)單 有8/4/202223第23頁,共51頁。例如: 抗誤碼性能優(yōu)于概念上來看:個(gè)別誤碼不會(huì)引起信號(hào)嚴(yán)重惡化8/4/202224第24頁,共51頁。簡(jiǎn)單增量調(diào)制與PCM的性能比較抽樣頻率PCM系統(tǒng)的抽樣頻率8K 系統(tǒng)的抽樣頻率不能根據(jù)抽樣定理來確定,而需要根據(jù)斜率過載條件以及信噪比來確定,一般情況下,為保證不發(fā)生斜率過載以

7、及保證與PCM系統(tǒng)有相同的信噪比, 的抽樣頻率將遠(yuǎn)高于PCM系統(tǒng)帶寬PCM碼速率64Kbit/s,帶寬需求32K如要求與PCM有相同的傳輸質(zhì)量,則要求抽樣頻率100K以上,帶寬要求50K 一般速率為32Kbit/s或16Kbit/s,但質(zhì)量不如PCM 8/4/202225第25頁,共51頁。量化信噪比(比較單頻正弦情況)抗信道誤碼性能 優(yōu)于PCM設(shè)備復(fù)雜度單路 簡(jiǎn)單,多路PCM簡(jiǎn)單8/4/202226第26頁,共51頁。ADPCM采用自適應(yīng)的必要性由于不同的講話人的語音信號(hào)的特性各不相同語音信號(hào)只能認(rèn)為是短時(shí)平穩(wěn)采用固定的預(yù)測(cè)系數(shù)不可能對(duì)所有的語音信號(hào)獲得最好的結(jié)果,因此有必要采取自適應(yīng)的算法

8、ADPCM的設(shè)計(jì)思路盡可能消除語音信號(hào)中的冗余對(duì)消除冗余后的信號(hào)進(jìn)行有效的比特分配,從自適應(yīng)角度進(jìn)行最佳編碼自適應(yīng)的方法自適應(yīng)量化自適應(yīng)預(yù)測(cè)8/4/202227第27頁,共51頁。自適應(yīng)量化針對(duì)被量化信號(hào)的變化狀態(tài),隨時(shí)調(diào)節(jié)量化臺(tái)階大小以匹配輸入信號(hào)的時(shí)變方差前向估值的自適應(yīng)量化對(duì)輸入信號(hào)尚未量化的樣本計(jì)算出其前向估值大小需要緩存訓(xùn)練的樣本,并傳送相關(guān)的邊信息,因此引入了編碼延時(shí)和占用了一定的信道容量后向估值的自適應(yīng)量化利用量化器的輸出樣本計(jì)算輸出信號(hào)的方差估值并確定量化臺(tái)階沒有延時(shí),但影響估值的追蹤速度8/4/202228第28頁,共51頁。自適應(yīng)預(yù)測(cè)前向估值的自適應(yīng)預(yù)測(cè)思路與前向估值量化一

9、致,同樣有編碼延時(shí)及邊信息傳輸?shù)葐栴}后向估值的自適應(yīng)預(yù)測(cè)利用已量化的樣本或發(fā)送數(shù)據(jù)更新預(yù)測(cè)系數(shù)8/4/202229第29頁,共51頁。信源編碼信源編碼的目的減少信源輸出符號(hào)序列的冗余度,提高符號(hào)的平均信息量信源編碼的主要方法針對(duì)信源輸出的符號(hào)序列的統(tǒng)計(jì)特性,尋找一定的方法把信源輸出序列符號(hào)變換為最短的碼字序列,使每個(gè)碼元所攜帶的平均信息量為最大,同時(shí)又盡可能保證無失真的恢復(fù)出原來的符號(hào)序列信源編碼的核心就是研究壓縮編碼算法,用盡可能低的傳輸碼率獲得盡可能好的質(zhì)量8/4/202230第30頁,共51頁。匹配編碼根據(jù)編碼對(duì)象出現(xiàn)的概率分配不同長(zhǎng)度的代碼,以保證總的代碼長(zhǎng)度最短需要知道信號(hào)的概率分布

10、,可采用數(shù)學(xué)模型建模的方式或根據(jù)大量樣本信號(hào)進(jìn)行統(tǒng)計(jì)得到典型編碼算法:Huffman編碼預(yù)測(cè)編碼利用信號(hào)之間的相關(guān)性,預(yù)測(cè)未來的信號(hào),對(duì)預(yù)測(cè)的殘差信號(hào)進(jìn)行編碼變換編碼利用信號(hào)在不同的函數(shù)空間分布的不同,選擇合適的函數(shù)將信號(hào)從一種信號(hào)空間變換到另一種有利于壓縮編碼的信號(hào)空間,再進(jìn)行編碼常用的函數(shù)變換:DFT、Walsh、DCT、Haar識(shí)別編碼分解文字、語音、圖象的基本特征,與匯集這些基本特征的樣本集進(jìn)行對(duì)照識(shí)別,選擇失真最小的樣本編碼傳送可用于印刷、打印等標(biāo)準(zhǔn)形狀的文字、符號(hào)和數(shù)據(jù)的編碼8/4/202231第31頁,共51頁。信源編碼算法信源編碼定理一個(gè)熵為H的信源,當(dāng)信源速率為R時(shí),只要RH

11、,則能夠以任意小的錯(cuò)誤概率進(jìn)行編碼;反之,如果RH,則無論采用多么復(fù)雜的編碼器和譯碼器,錯(cuò)誤概率都不可能達(dá)到任意小Shannon在1948年證明了該定理,但并沒有指出具體的編解碼算法信源編碼與失真度量編碼失真原始信號(hào)x經(jīng)過編碼以及解碼后恢復(fù)成x,失真量即為x與x之間的保真度或近似度的度量常用的失真度量:漢明失真、均方誤差等以一定的、可以接受的失真換取較高的信源壓縮效率8/4/202232第32頁,共51頁。語音與圖像壓縮編碼類型帶寬KHZ采樣率KHZ比特/樣點(diǎn)比特率kb/s電話語音0.33.481296寬帶語音0.0571614224調(diào)頻廣播0.02 153216512CD光盤0.01 204

12、4.116705.6DAB/DAT0.01 2048167688/4/202233第33頁,共51頁。類型格式分辨率幀頻HZ比特/像素比特率Mb/s電視電話QCIF17614429.97129.1會(huì)議電視CIF35228829.971236.4常規(guī)電視ITU-R6017205762516165.9HDTVITU-R709192011522516884.78/4/202234第34頁,共51頁。圖像壓縮編碼圖像壓縮編碼的必要性圖像的數(shù)據(jù)量巨大,一般必須進(jìn)行壓縮編碼圖像壓縮編碼的依據(jù)圖像信號(hào)在結(jié)構(gòu)和統(tǒng)計(jì)上存在大量的冗余度結(jié)構(gòu)冗余度:空間和時(shí)間上的強(qiáng)相關(guān)性統(tǒng)計(jì)冗余度:被編碼信號(hào)概率分布的不均勻基于人

13、眼的視覺特性人眼對(duì)某些失真較不敏感,察覺不到圖像的某些細(xì)微變化圖像壓縮編碼的評(píng)價(jià)壓縮效率:壓縮前后編碼速率的比值壓縮質(zhì)量:恢復(fù)圖像的質(zhì)量編碼算法的復(fù)雜度編解碼延時(shí)圖像編碼采取的主要技術(shù)措施利用離散余弦變換,去除各象素點(diǎn)在空間域的相關(guān)性通過幀間預(yù)測(cè)差分編碼,去除活動(dòng)圖像的時(shí)間相關(guān)性采用熵編碼技術(shù),使編碼域信源的概率模型相匹配利用人眼的視覺特性,進(jìn)行自適應(yīng)量化編碼通過緩沖存儲(chǔ)器實(shí)現(xiàn)變長(zhǎng)碼輸入與定長(zhǎng)碼輸出之間的匹配,8/4/202235第35頁,共51頁。圖像壓縮編碼方法8/4/202236第36頁,共51頁。圖像壓縮編碼舉例Huffman編碼基本思想對(duì)出現(xiàn)概率較大的信源符號(hào)編以較短的代碼,對(duì)出現(xiàn)概

14、率較小的信源符號(hào)編以較長(zhǎng)的代碼JPEG、H.261、MPEG-1、 MPEG-2中對(duì)量化后的DCT系數(shù)進(jìn)行Huffman編碼編碼算法 1. 初始化,根據(jù)符號(hào)概率的大小按由大到小順序?qū)Ψ?hào)進(jìn)行排序; 2. 把概率最小的兩個(gè)符號(hào)組成一個(gè)節(jié)點(diǎn); 3.重復(fù)步驟2,形成一棵“樹” ; 4.從根節(jié)點(diǎn)開始到相應(yīng)于每個(gè)符號(hào)的“樹葉”,從上到下標(biāo)上“0”(上枝)或者“1”(下枝),至于哪個(gè)為“1”哪個(gè)為“0”則無關(guān)緊要,最后的結(jié)果僅僅是分配的代碼不同,而代碼的平均長(zhǎng)度是相同的。 5.從根節(jié)點(diǎn)開始順著樹枝到每個(gè)葉子分別寫出每個(gè)符號(hào)的代碼8/4/202237第37頁,共51頁。編碼特點(diǎn)霍夫曼碼的碼長(zhǎng)雖然是可變的,但

15、卻不需要另外附加同步代碼。如果事先編寫出一本解釋各種代碼意義的“詞典”,即碼簿,那么就可以根據(jù)碼簿一個(gè)碼一個(gè)碼地依次進(jìn)行譯碼。霍夫曼碼沒有錯(cuò)誤保護(hù)功能,如果碼串中有錯(cuò)誤,哪怕是1位出現(xiàn)錯(cuò)誤,會(huì)出現(xiàn)錯(cuò)誤傳播(error propagation)?;舴蚵a是可變長(zhǎng)度碼,因此很難隨意查找或調(diào)用壓縮文件中間的內(nèi)容,然后再譯碼,這就需要在存儲(chǔ)代碼之前加以考慮8/4/202238第38頁,共51頁。預(yù)測(cè)變換編碼利用圖像信號(hào)的空間和時(shí)間冗余特性,用已知的相鄰象素或圖像塊預(yù)測(cè)當(dāng)前象素值,再對(duì)預(yù)測(cè)誤差進(jìn)行量化、編碼和傳輸幀內(nèi)預(yù)測(cè)編碼,在一幀圖像內(nèi)進(jìn)行預(yù)測(cè),消除圖像在空間的相關(guān)性幀間預(yù)測(cè)編碼,在多幅圖像之間進(jìn)行預(yù)

16、測(cè),消除圖像在時(shí)間域上的相關(guān)性關(guān)鍵在于預(yù)測(cè)算法的選取游程長(zhǎng)度編碼編碼對(duì)象為信源符號(hào)在信息流中連續(xù)出現(xiàn)的長(zhǎng)度,根據(jù)其出現(xiàn)概率的不同編成不同長(zhǎng)度的碼字常用于文件傳真系統(tǒng)中8/4/202239第39頁,共51頁。Standard OrganizationVideo Coding StandardTypical Range of Bit RatesTypical ApplicationsITU-TH.261P*64 k bits/sISDN Video ConferencingITU-TH.263, H.263+, H.263+Wide rangePSTN Video PhoneITU-TH.26L6

17、4kbits/sWide rangeISO11172-2MPEG-1 Video1.5 M bits/sCD-ROMISO13818-2MPEG-2 Video4-80 M bits/sSDTV, HDTVISO14496-2MPEG-4 VideoWide rangeWide rangeJVT (ITU-T, ISO)H.264Wide rangeWide range中國(guó)標(biāo)準(zhǔn)AVSWide rangeWide range8/4/202240第40頁,共51頁。語音壓縮編碼語音編碼的基本問題給定編碼速率的條件下,如何獲得更高質(zhì)量的重建語音給定重建語音質(zhì)量的條件下,如何降低編碼速率基本依據(jù)利用語

18、音信號(hào)本身的冗余度以及人耳的聽覺特性主要指標(biāo)語音編碼質(zhì)量編碼速率編碼算法的復(fù)雜度編解碼的延時(shí)8/4/202241第41頁,共51頁。語音壓縮編碼算法語音編碼器波形編碼器參量編碼器頻域時(shí)域非差分子帶編碼自適應(yīng)變換域編碼差分PCMDPCMM連續(xù)可變斜率MADPCMAPC線性預(yù)測(cè)編碼信道聲碼器共振峰聲碼器倒頻譜聲碼器語音激勵(lì)聲碼器多脈沖激勵(lì)LPC碼本激勵(lì)LPC矢量和激勵(lì)LPC混合編碼器8/4/202242第42頁,共51頁。波形編碼力圖使重建語音信號(hào)保持原始語音波形語音信號(hào)作為一般信號(hào)進(jìn)行處理適應(yīng)能力強(qiáng),重建語音質(zhì)量好編碼速率較高,一般應(yīng)用于6416K速率參量編碼(聲碼器)通過對(duì)語音信號(hào)特征參數(shù)的提

19、取及編碼,力圖使語音信號(hào)有盡可能高的可懂度,保持語音的語意重建語音信號(hào)的波形與原始語音信號(hào)的波形可能有相當(dāng)大的差別往往利用某種語音生成的模型,在幅度譜上逼近原始語音合成語音的自然度不好,抗背景噪聲的能力比較差混合編碼結(jié)合聲碼器的特點(diǎn),同時(shí)又利用波形編碼器的特點(diǎn)提取語音參數(shù),優(yōu)化激勵(lì)信號(hào)使其達(dá)到與原始語音的波形匹配中速率語音編碼4.816K,應(yīng)用于蜂窩移動(dòng)通信、衛(wèi)星通信、軍用通信低速率語音編碼100bit/s-4.8Kbit/s8/4/202243第43頁,共51頁。語音編碼的標(biāo)準(zhǔn)G.711 PCM (64k bps)G.721 ADPCM (32k bps)G.722 7kHz帶寬64k bp

20、s速率內(nèi)的音頻編碼G.723.1 6.3k/5.6k 雙速率多媒體語音編碼G.728 16k bps 語音編碼 LD-CELPG.729 8k bps多媒體語音編碼8/4/202244第44頁,共51頁。線形預(yù)測(cè)編碼LPC的原理原理:模型化人類語音信號(hào)產(chǎn)生的機(jī)制,提取模型參數(shù),并且只傳輸模型的參數(shù)。語音信號(hào)的產(chǎn)生模型:語音的產(chǎn)生,聲帶和聲道不同語音產(chǎn)生的原因:聲音激勵(lì)源和聲道不同聲音分類:濁音和清音發(fā)聲過程口腔和鼻腔形成時(shí)變?yōu)V波器8/4/202245第45頁,共51頁。LPC語音編碼語音信號(hào)相鄰樣點(diǎn)之間又很強(qiáng)的相關(guān)性,可以用過去的樣點(diǎn)的線性組合來預(yù)測(cè)未來的樣點(diǎn)預(yù)測(cè)的誤差因此上式可看成信號(hào)e(n)激勵(lì)一個(gè)全極點(diǎn)濾波器 得到語音信號(hào)與人的發(fā)聲過程吻合,采用清音及濁音二元激勵(lì)模型即可合成語音使誤差均方最小,可求得一組預(yù)測(cè)系數(shù)ak,傳送:預(yù)測(cè)系數(shù),基音周期和增益,清濁音判決8/4/202246第46頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論