移動通信中的語音編碼技術(shù)_第1頁
移動通信中的語音編碼技術(shù)_第2頁
移動通信中的語音編碼技術(shù)_第3頁
移動通信中的語音編碼技術(shù)_第4頁
移動通信中的語音編碼技術(shù)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2024/1/25語音編碼技術(shù)2024/1/25學(xué)習(xí)目標學(xué)習(xí)完本課程,您應(yīng)該能夠:掌握語音編碼的根本概念掌握語音編碼的分類及原理了解語音編碼質(zhì)量的評定了解常用的語音編碼算法2024/1/25課程內(nèi)容

第一節(jié)語音編碼技術(shù)介紹第二節(jié)移動通信系統(tǒng)中的語音編碼技術(shù)2024/1/25第一節(jié)語音編碼技術(shù)介紹語音編碼技術(shù)介紹波形編碼技術(shù)參數(shù)編碼技術(shù)混合編碼語音編碼質(zhì)量的評定2024/1/25語音編碼技術(shù)介紹信源編碼是指利用信源的統(tǒng)計特性,解除信源的相關(guān)性,去掉信源多余的冗余信息,以到達壓縮信源信息率,提高系統(tǒng)有效性的目的。語音編碼為信源編碼,語音信號是模擬信號,語音的編解碼就是將語音的模擬信號轉(zhuǎn)換為二進制數(shù)字信號,到了接收端,再將收到的數(shù)字信號復(fù)原為模擬語音,同時語音編碼的作用還有減少信源冗余、解除信源相關(guān)性,壓縮話音碼率、提高信源有效性語音編碼技術(shù)有波形編碼、參數(shù)編碼和介于兩者之間的混合編碼三大類,下面簡單介紹這三類編碼技術(shù)。2024/1/25第一節(jié)語音編碼技術(shù)介紹語音編碼技術(shù)介紹

波形編碼技術(shù)參數(shù)編碼技術(shù)混合編碼語音編碼質(zhì)量的評定2024/1/25波形編碼技術(shù)波形編碼技術(shù)是通過對語音波形進行采樣、量化,然后用二進制碼表示出來。波形編碼的根本原理是在時間軸上對模擬語音按一定的速率抽樣,然后將幅度樣本分層量化,并用代碼表示。解碼是其反過程,將收到的數(shù)字序列經(jīng)過解碼和濾波恢復(fù)成模擬信號。由于這種編碼系統(tǒng)保持了信號原始樣值的細節(jié)變化,從而保存了信號的各種過渡特征,所以波形編碼的語音質(zhì)量一般較高。但是由于波形編碼沒有充分利用語音信號的冗余特性,使其壓縮比不大,造成只有在較高速率上才能得到滿意的語音質(zhì)量,當編碼速率降低到16Kbps以下時,編碼語音質(zhì)量將迅速下降。脈沖編碼調(diào)制〔PCM〕和增量調(diào)制〔ΔM〕,以及它們的各種改進型自適應(yīng)增量調(diào)制〔ADM〕、自適應(yīng)差分編碼〔ADPCM〕等,都屬于波形編碼技術(shù)。2024/1/25第一節(jié)語音編碼技術(shù)介紹語音編碼技術(shù)介紹

波形編碼技術(shù)參數(shù)編碼技術(shù)混合編碼語音編碼質(zhì)量的評定2024/1/25參數(shù)編碼技術(shù)參數(shù)編碼技術(shù)利用人的發(fā)聲機制,僅傳送反映話音波形產(chǎn)生的主要變化參量〔主要是指表征聲門振動的鼓勵參數(shù)和表征聲道特性的聲道參數(shù)〕,在接收端根據(jù)發(fā)聲機制,由傳送來的變化參量人工合成話音。參量編碼是通過對語音信號特征參數(shù)的提取和編碼,力圖使重建語音信號具有盡可能高的可靠性,即保持原語音的語意,但重建信號的波形同原語音信號的波形可能會有相當大的差異。這種編碼技術(shù)可實現(xiàn)低速率語音編碼,比特率可壓縮到2~4.8Kbps,甚至更低,但語音質(zhì)量只能到達中等,特別是自然度較低,連熟人都不一定能聽出講話人是誰。線性預(yù)測編碼〔LPC〕及其他各種改進型都屬于參量編碼。2024/1/25第一節(jié)語音編碼技術(shù)介紹語音編碼技術(shù)介紹

波形編碼技術(shù)參數(shù)編碼技術(shù)混合編碼語音編碼質(zhì)量的評定2024/1/25混合編碼混合編碼是波形編碼和參數(shù)編碼兩種系統(tǒng)優(yōu)點的結(jié)合:既利用了語音生成模型,通過對模型中的參數(shù)進行編碼,減少了波形編碼對象的動態(tài)范圍或者數(shù)目,又使得編碼的過程產(chǎn)生接近原始語音波形的合成語音,以保存語音的各種自然特征,提高了合成語音的質(zhì)量。利用混合編碼技術(shù)能夠在4-16Kbps速率上能夠得到高質(zhì)量的合成語音。多脈沖鼓勵線性預(yù)測編碼〔MPLPC〕,規(guī)劃脈沖鼓勵線性預(yù)測編碼〔KPELPC〕,碼本鼓勵線性預(yù)測編碼〔CELP〕等都是屬于混合編碼技術(shù)。很顯然,混合編碼是適合于數(shù)字移動通信的語音編碼技術(shù)。2024/1/25第一節(jié)語音編碼技術(shù)介紹語音編碼技術(shù)介紹

波形編碼技術(shù)參數(shù)編碼技術(shù)混合編碼語音編碼質(zhì)量的評定2024/1/25語音編碼質(zhì)量的評定如何評價語音編碼質(zhì)量也成為語音編碼領(lǐng)域所研究的一個重要課題。對此多年來人們提出了許多方法,歸納起來大致可分為兩類,即客觀評定方法和主觀評定方法??陀^評定方法用客觀測量的手段來評價語音編碼的質(zhì)量,常用的方法有信噪比、加權(quán)信噪比、平均分段信噪比等。它們都是建立在度量均方誤差的根底上,其特點是計算簡單,但不能完全反映人對語音質(zhì)量的感覺。這個問題對于速率為16Kbit/s以下的中、低速率語音編碼尤為突出,因此主要適用于速率較高的波形編碼類型。主觀評定方法符合人類聽話時對語音質(zhì)量的感覺,因而目前得到廣泛應(yīng)用。最主要的主觀評定方法是主觀評定等級〔SubjectiveOpinionScale〕,或稱平均評定得分〔MeanOpinionScore,縮寫MOS〕。MOS得分采用五級評分標準,其方法是,由數(shù)十名試聽者在相同信道環(huán)境中試聽并給予評分,然后對評分進行統(tǒng)計處理,求出平均得分。2024/1/25主觀評定等級表質(zhì)量等級分數(shù)收聽注意力等級優(yōu)5可完全放松,不需要注意力良4需要注意,但不需明顯集中注意力滿意(正常)3中等程度的注意力差2需要集中注意力劣1即使努力去聽,也很難聽懂2024/1/25常見的語音編碼方案〔1/2〕編碼類型算法名稱數(shù)據(jù)速率ITU標準編號應(yīng)用MOS質(zhì)量評分波形編碼PCM均勻量化64kb/s

公共網(wǎng)

ISDN

配音4.0~4.5μ(A)μ(A)64kb/sG.711APCM自適應(yīng)量化

DPCM差值量化32kb/sG.721ADPCM

SB-ADP

CM自適應(yīng)差值量化

子帶-自適應(yīng)

差值量化64kb/s5.3kb/s6.3kb/sG.722

G.723參數(shù)編碼LPC線性預(yù)測編碼2.4kb/s

保密話聲2.5~3.52024/1/25常見的語音編碼方案〔2/2〕編碼類型算法名稱數(shù)據(jù)速率ITU標準編號應(yīng)用MOS質(zhì)量評分混合編碼CELPC碼激勵LPC4.8kb/s

移動通信4.0~3.7VSELP矢量和激勵LPC8kb/s

語音郵件RPE-LTP長時預(yù)測規(guī)則碼激勵13.2kb/s

ISDN移動通信

LD-CEL

PMPEG低延時碼激勵LPC多子帶

感知編碼16kb/s

128kb/sG.728

G.729CD5

AC-3感知編碼

音響52024/1/25課程內(nèi)容

第一節(jié)語音編碼技術(shù)介紹第二節(jié)移動通信系統(tǒng)中的語音編碼技術(shù)2024/1/25第二節(jié)移動通信系統(tǒng)中的語音編碼技術(shù)移動通信系統(tǒng)對語音編碼技術(shù)的要求移動通信系統(tǒng)中語音編碼算法介紹2024/1/25移動通信對數(shù)字語音編碼的要求速率較低,純編碼速率應(yīng)低于16kbit/s;在一定編碼速率下音質(zhì)應(yīng)盡可能高;編碼時延應(yīng)較短,控制在幾十毫秒以內(nèi);在強噪聲環(huán)境中,算法應(yīng)具有較好的抗誤碼性能,以保持較好的話音質(zhì)量;算法復(fù)雜程度適中,易于大規(guī)模集成。2024/1/25第二節(jié)移動通信系統(tǒng)中的語音編碼技術(shù)移動通信系統(tǒng)對語音編碼技術(shù)的要求

移動通信系統(tǒng)中語音編碼算法介紹2024/1/25GSM系統(tǒng)的語音編碼系統(tǒng)GSM的語音編碼系統(tǒng)采用規(guī)那么碼鼓勵長期預(yù)測編碼算法〔RPE-LTP〕。以下圖為RPE-LTP算法的編解碼原理圖:2024/1/25RPE-LTP算法RPE-LTP算法的對象是窄帶語音〔300~3400Hz〕經(jīng)8000Hz采樣進行13比特均勻量化后的數(shù)字信號。每20ms〔160樣點〕為一幀。每幀比特數(shù)為2080,編碼后成為大小為260比特的凈話音數(shù)據(jù)塊,所以編碼后的速率為260bit/20ms=13kbit/s。我們這里介紹的是GSM中全速率〔FR〕的編碼方式,除此之外還有半速率〔HR〕和增強型全速率〔EFR〕等編碼方式。2024/1/25IS-96CDMA系統(tǒng)的語音編碼系統(tǒng)IS-96CDMA系統(tǒng)的語音編碼系統(tǒng)采用QCELP〔QualcommCodeExcitedLinearPrediction〕方案,即碼鼓勵線性預(yù)測的可變速率混合編碼方案,該方案為美國Qualcomm通信公司的專利語音編碼算法,其特點為:基于線性預(yù)測編碼;使用矢量碼表替代簡單線性預(yù)測中產(chǎn)生的濁音準周期脈沖的脈沖位置和幅度,即使用碼表矢量量化差值信號;可變速率:采用話音激活檢測〔VAD〕技術(shù),在話音間隙期,根據(jù)不同信噪比背景分別選擇9.6kbit/s,4.8kbit/s,2.4kbit/s和1.2kbit/s4個檔次〔1,1/2,1/4,1/8〕的傳輸速率,它可以使平均速率比最高速率下降兩倍以上;參量編碼的主要參量分為三類,且每幀不斷更新。2024/1/25典型的QCELP方案實現(xiàn)框圖2024/1/25QCELP方案的實現(xiàn)在首先對模擬話音按8KHz取樣;其次按照20ms劃分為一個話音幀,每一幀會有160個樣點值;將160個樣點值生成3個參數(shù)子幀〔濾波參數(shù),音調(diào)參數(shù),碼表參數(shù)〕;3個參數(shù)不斷更新,更新后參數(shù)按一定幀結(jié)構(gòu)送至接收端,即完成整個語音編碼過程。2024/1/25WCDMA中的語音編碼AMR1999年初,3GPP(The3rdGenerationPartnershipProject)采納了由Ericsson,Nokia和Siemens提出的AMR標準(AdaptiveMulti-RateStandard)作為第三代移動通信中的語音編碼器的標準。AMR提供了多達8種的編碼速率,而且每種速率都有了不同的容錯度。AMR語音編碼器擁有12.2K到4.75K不同的編碼速率:一方面是為了提供不同無線傳愉環(huán)境下不同容錯率的編碼器,從而使系統(tǒng)中語音質(zhì)量和系統(tǒng)容量的折衷更加平穩(wěn)、靈活,更加完美;另一方面也是為了滿足系統(tǒng)可能的特殊要求,AMR有8種固定的信源速率模式,從4.75Kbit/s到12.2Kbit/s,2024/1/25AMR語音編碼編碼模式信源編碼比特率AMR12212.20kbit/s(GSMEFR)AMR10210.20kbit/sAMR7957.95kbit/sAMR7407.40kbit/s(IS-641)AMR6706.70kbit/s(PDC-EFR)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論