![G721ADPCM語音編碼標準的學習及實現(xiàn)_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/31/354bebe9-0682-4d69-b714-acc4c3f5921c/354bebe9-0682-4d69-b714-acc4c3f5921c1.gif)
![G721ADPCM語音編碼標準的學習及實現(xiàn)_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/31/354bebe9-0682-4d69-b714-acc4c3f5921c/354bebe9-0682-4d69-b714-acc4c3f5921c2.gif)
![G721ADPCM語音編碼標準的學習及實現(xiàn)_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/31/354bebe9-0682-4d69-b714-acc4c3f5921c/354bebe9-0682-4d69-b714-acc4c3f5921c3.gif)
![G721ADPCM語音編碼標準的學習及實現(xiàn)_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/31/354bebe9-0682-4d69-b714-acc4c3f5921c/354bebe9-0682-4d69-b714-acc4c3f5921c4.gif)
![G721ADPCM語音編碼標準的學習及實現(xiàn)_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/31/354bebe9-0682-4d69-b714-acc4c3f5921c/354bebe9-0682-4d69-b714-acc4c3f5921c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、G.721ADPCM語音編碼標準的學習及實現(xiàn)摘要語音是人類相互之間交流時最常使用的信息載體。在信息化高度發(fā)展的今天,語音處理技術(shù)以及它的應(yīng)用已經(jīng)成為信息化社會不可缺少的重要組成部分。而語音編碼作為語音信號處理的一個分支,目的就是要在保證語音音質(zhì)和可懂度的條件下,采用盡可能少的比特數(shù)來表示語音,它是現(xiàn)代通信和信息工程領(lǐng)域不可缺少的關(guān)鍵技術(shù)。語音編碼在數(shù)字通信網(wǎng)中占據(jù)著重要的位置。隨著通信技術(shù)和信息社會的飛速發(fā)展,頻率資源顯得越來越寶貴。因此,降低電話信道的傳輸碼率又或者是壓縮語音信號的傳輸帶寬,一直以來都是人們所追求的目標,語音編碼技術(shù)也因此顯得更加重要??偠灾?,數(shù)字語音通信與存儲技術(shù)和語音編
2、碼是密不可分的,語音應(yīng)答系統(tǒng)、語音信箱、數(shù)字錄音電話、語音查詢系統(tǒng)等,也都是隨著語音壓縮編碼技術(shù)而發(fā)展起來的。本文簡單介紹了語音信號的編碼技術(shù),主要學習了G.721 ADPCM語音編碼標準并通過編程實現(xiàn)。關(guān)鍵字:語音編碼、語音通信、壓縮、存儲、語音信號引言語音編碼是在保持一定的算法復(fù)雜度和通信時延的前提下,運用盡可能少的信道容量,傳輸盡可能高質(zhì)量的語音。編碼器的效率和算法復(fù)雜度之間通常呈正比關(guān)系,算法越復(fù)雜,時延和費用就越高。因此,必須在這兩個矛盾的因素之間尋找一個平衡點。語音編碼發(fā)展的目的是為了使平衡點向更低的比特率方向移動。ITU已經(jīng)制定了幾種碼率的語音編碼國際標準,這些標準推動了研究工作
3、的進展。1 語音編碼的分類、特性及現(xiàn)狀語音編碼編碼方式大致可以分為三種:波形編碼、參數(shù)編碼、混合編碼。波形編碼是將時間域或變換域信號直接變換成數(shù)字信號,力求使重建語音波形保持原始語音信號的波形形狀。參數(shù)編碼又稱聲碼器編碼,它是將信源信號在頻域或其他變換域提取特征參數(shù),然后對這些特征參數(shù)進行編碼和傳輸,在譯碼端再將接收到的數(shù)字信號譯成特征參數(shù),根據(jù)這些特征參數(shù)重建語音信號?;旌暇幋a將波形編碼和參數(shù)編碼結(jié)合起來,克服了波形編碼和參數(shù)編碼的缺點,吸收了他們的長處,能夠在較低速率上得到高質(zhì)量的合成語音。在編碼速率比較高的時候,波形編碼能夠很容易滿足抗噪聲、重構(gòu)語音質(zhì)量好、可靠性高等要求,但是一旦編碼速
4、率降低,即編碼質(zhì)量急劇下降。發(fā)展到現(xiàn)在,成熟并且廣泛使用的波形編碼方式有脈沖編碼調(diào)制(PCM)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)、自適應(yīng)增量調(diào)制(ADM)、自適應(yīng)預(yù)測編碼(APC)等。但是這些編碼方式在速率降低到16Kb/s以下時,重構(gòu)語音信號的效果就較差。結(jié)合波形編碼中與原始語音波形逼近的特點以及參數(shù)編碼中提取特征參數(shù)的優(yōu)點,混合編碼技術(shù)在合成語音質(zhì)量和速率兩方面都能達到較滿意的效果,因此被作為研究的主要方向不斷地得到發(fā)展。技術(shù)比較成熟并被反復(fù)研究的混合編碼算法有多脈沖激勵線性預(yù)測編碼(MPLPC)、碼本激勵線性預(yù)測編碼(CELP)、混合激勵線性預(yù)測編碼(MELP)。2語音編碼的國際標準
5、由于數(shù)字編碼技術(shù)具有廣闊的應(yīng)用范圍和良好的市場前景,從20世紀80年代開始,國際上著名大通信研究機構(gòu)和大學均大力開展高音質(zhì)低碼率的語音編碼技術(shù)研究,并且取得了豐碩的成果,因此,語音編碼技術(shù)的標準化工作就顯得尤為重要。ITU在語音編碼技術(shù)的標準化方面作了大量的工作,制定了很多標準,并且逐漸受到了業(yè)界的認同。在其中,比較典型的有G.711、G.721、G.728、G.729等標準。G.711標準最早的語音編碼方案是PCM編碼,PCM的碼率為64kbps。對語音信號按照8kHz進行采樣,再對每一個要樣本做8bit的標量量化。這種方案只能將語音由模擬信號變?yōu)閿?shù)字信號,但卻沒有做任何進一步的數(shù)學處理。雖
6、然它的碼率很高,但是處理程序卻很簡單,至今仍然在很多的場合中被采用。它被ITU定為G.711標準。G.721標準G.711標準產(chǎn)生之后,人們在語音壓縮編碼領(lǐng)域投入了大量的精力進行研究。經(jīng)很長時間的研究,一種致力于消除語音信號樣本間相關(guān)性的線性預(yù)測編碼算法被科學家們提出了。它可以在基本保證音質(zhì)的條件下,使碼率有了較大程度的壓縮。利用當時還處于初級階段的線性預(yù)測方法,科學家們成功開發(fā)出了碼率為32kbps的增量調(diào)制編碼ADPCM方案,但音質(zhì)略次于PCM編碼,可懂度和自然度都很不錯,立即受到了人們的青睞。它被ITU定位G.721標準。G.728標準正當人們對線性預(yù)測編碼技術(shù)進行深入研究的時候,另外一
7、種利用相關(guān)性壓縮量化編碼的方法即矢量量化方法被提出來。該技術(shù)在壓縮量化編碼上的效率很高,但其缺點是計算量太龐大,隨著IC技術(shù)的不斷發(fā)展,計算機和DSP的運行處理速度加快,這種編碼方式的可行性越加的明顯。不過現(xiàn)在的計算機和DSP芯片已經(jīng)能夠滿足它的計算要求。把矢量量化技術(shù)和線性預(yù)測編碼技術(shù)聯(lián)合起來使用,就產(chǎn)生了許多比較成功的音質(zhì)較好的線性預(yù)測編碼方法。例如:多脈沖激勵線性預(yù)測編碼算法、規(guī)則脈沖激勵線性預(yù)測編碼算法和碼激勵線性預(yù)測編碼算法。其中,由CELP算法衍生出的低延時碼激勵線性預(yù)測編碼算法更為成熟,1991年被ITU定為G.728標準。G.729標準保持高音質(zhì)就是要使合成原始語音的均方誤差始
8、終小到不易察覺。在這樣的前提下,通過改進算法,達到進一步壓縮碼率的目的。其中CS-ACELP算法就是該思路的產(chǎn)物,它實現(xiàn)了8kbps的碼率。ITU在1996年將它定制為G.729標準。3自適應(yīng)差分脈沖編碼調(diào)制ADPCM在許多應(yīng)用中,特別是長途傳輸系統(tǒng),64kbit/s的G.711標準占用的頻帶太寬,通信成本太貴。ITU-T從1981年起經(jīng)過三年的討論與研究,于1984年提出了G.721 32kbit/s ADPCM編碼標準,并于1986年根據(jù)兩年間運行中出現(xiàn)的問題做了進一步修正。ADPCM將脈沖編碼調(diào)制、差值調(diào)制和自適應(yīng)技術(shù)三者結(jié)合起來,進一步利用語音信號樣點間的相關(guān)性,并針對語音信號的非平衡
9、特點,使用了自適應(yīng)預(yù)測和自適應(yīng)量化,在32kbit/s速率上能夠給出網(wǎng)絡(luò)等級語音質(zhì)量,從而符合進入公用網(wǎng)的要求。下圖是G.721算法的框圖,其中虛線部分是解碼器框圖。由圖中可以看出,編碼器中嵌入一個解碼器,使得編碼器的自適應(yīng)修正完全取決于信號的反饋值。這個反饋值與解碼器的輸出是一致的,所以后續(xù)的差值采樣就補償了量化誤差,從而避免了量化誤差的積累。計算差值信號自適應(yīng)量化器自適應(yīng)逆量化器自適應(yīng)預(yù)測器重建信號計算量化階矩自適應(yīng) 速度控制自適應(yīng) 單頻與瞬變音檢測 G721編碼器原理框圖下面詳細介紹G.721各部分算法。(1) 求采樣值s(k)與其估計se(k)之差:dk=
10、sk-se(k)(2) 自適應(yīng)量化dk,并編碼輸出Ik:Ik=log2dk-y(k)其中,Ik還含有一位符號。表 給出Ik的編碼值。y(k)是量化階矩自適應(yīng)因子,它由調(diào)整短時能量變化較快的語音信號的yu(k)和調(diào)整數(shù)據(jù)類慢變信號的yl(k)兩部分,經(jīng)速度調(diào)整因子al(k)加權(quán)平均而成: yk=alkyuk-1+1-alkylk-1 0al1對快變信號al(k)趨于1,而對慢變信號alk趨于0。歸一化輸入log2dk-y(k)輸出代碼Ik歸一化量化輸出log2dqk-y(k)3.12,+73.322.72,3.1262.912.34,2.7252.521.91,2.3442.131.38,1.9
11、131.660.62,1.3821.05-0.98,0.6210.031-,-0.980-(3) 階矩自適應(yīng)因子yuk稱快速非鎖定標度因子,它的取值范圍在1.06yuk10區(qū)間,對應(yīng)的線性域為min=21.06=2.085,max=210=1024。yuk=1-2-5yk+2-5I(k)I(k)的取值如下表所示。|Ik|76543210I(k)70.1322.1912.387.004.002.561.13-0.75為了適應(yīng)語音預(yù)測差值信號中的基音引起的能量突變,I(k)的高端取值都很大。對于帶內(nèi)數(shù)據(jù),信號短時能量基本上是平穩(wěn)的,階矩自適應(yīng)采用如下算法:ylk=1-2-6ylk-1+2-6yuk
12、式中,ylk稱為鎖定標度因子。(4) 速度控制alk是速度控制因子,它是通過Ik的長時平均幅度值dmlk與短時平均幅度值dmsk的差求出的。它反映了預(yù)測余量信號的變化率。長時:dmlk=1-2-7dmlk-1+2-7FIk短時:dmsk=1-2-5dmsk-1+2-5FIk函數(shù)FIk的取值如下表所示。|Ik|76543210FI(k)73111000當余量信號短時能量平穩(wěn)時,Ik的統(tǒng)計特性隨時間變化很小,dml(k)與dmsk相差不大。而當余量信號短時能量起伏較大時,它們出現(xiàn)差值.利用這一特性先計算中間參數(shù)apk:apk=1-2-4apk-1+2-3,當|dmsk-dml(k)|2-3dmlk
13、或當yk<31-2-4apk-1, 其他情況顯然,當Ik幅度變化較大時,apk2,而差別小時apk0。條件yk3表明輸入信號很小,處于清音段或噪聲段,這時也有apk2,以便量化器處于快速自適應(yīng)狀態(tài)來等待輸入信號的突然變化。量器速度控制因子alk是通過對apk限幅得到的:alk=1, 當apk-11apk-1,當apk-1<1這樣,量化器從快速自適應(yīng)向慢速自適應(yīng)轉(zhuǎn)變有一個延時。對于帶內(nèi)調(diào)幅數(shù)據(jù),這種延遲效應(yīng)可以防止自適應(yīng)速度過早變慢,從而避免脈沖沿產(chǎn)生太大的畸變。(5) 自適應(yīng)逆量化器輸出dqk=2yk+I(k)(6) 自適應(yīng)預(yù)測預(yù)測器采用6階零點,2階極點的模型。預(yù)測信號為sen=
14、i=12ain-1srn-i+seznsezn=j=16bjn-1dq(n-j)重建信號為srn=sen+dq(n)極點、零點預(yù)測器系數(shù)分別是ai和bj。其調(diào)整方式為bjn=1-2-8bjn-1+2-7sgndqnsgndqn-j此式隱含差|bjn|2,為保證算法穩(wěn)定,二階極點預(yù)測器系數(shù)限制如下a2n0.75;a1n1-a2n-2-4它們的調(diào)整方式為a1n=1-2-8a1n-1+32-8sgnpnsgnpn-1a2n=1-2-7a2n-1+2-7sgnpnsgnpn-2-fa1n-1sgnpn-1式中pn=dqn+seznfa1=4a1 , 當|a1|122sgna1,當|a1|>12(
15、7) 單頻和瞬變調(diào)整當ADPCM編碼器遇到頻移鍵控信號(FSK)或其他窄帶瞬變信號時,需要將系統(tǒng)從慢速自適應(yīng)狀態(tài)強制性的調(diào)整到快速自適應(yīng)狀態(tài)。為此,引入單頻信號判定條件td和窄帶信號瞬變判據(jù)tr:tdn=1,若a2n<-0.718750, 其他trn=1,tdn=1同時dqn>24.2yln0, 其他當tdn=1時,就認為出現(xiàn)了單頻信號或頻率瞬變。這時強制將量化處于快速自適應(yīng)狀態(tài)。當trn=1時,還須要將ai(n)和bj(n)同時置零。采用這些措施后G.721 ADPCM可以傳遞4.8kbit/s的FSK信號。同時apn的判定也由下式?jīng)Q定:apn=1-2-4apn-1+2-3,當d
16、msn-dmln2-3dmln或當yn<3或tdn=11, trn=11-2-4apn-1, 其他當ADPCM與PCM之間發(fā)生換碼級聯(lián)的時候,需要在ADPCM內(nèi)部進行PCM級聯(lián)同步調(diào)整。方法就是在解碼端將重建信號srn重新編碼成ADPCM碼Idxn并與輸入的In比較,根據(jù)差值調(diào)整重建信號srn的電平級別。經(jīng)過同步調(diào)整過程,ADPCM就可以有效的防止同步級聯(lián)誤差積累。4 ADPCM的MATLAB編程實現(xiàn)為了便于理解G.721的MATLAB程序,特對各模塊功能介紹如下:ADPCMG721.m主函數(shù)程序文件,完成賦初值、信號輸入及調(diào)用語音編碼函,在MATLAB中加載G.721MATLAB程序文
17、件后,在命令窗口中輸入ADPCMG721并回車,即可完成G.721語音編解碼算法。ADPCMG721主程序:close all;clear all;coe=1,0,1,0,0,0,0,0,0,0,0;%初始化系數(shù),自適應(yīng)預(yù)測器的系數(shù)Sek_comcoe1=0,0,0;coe2=0,0,0,0,0,0,0,0,0,0;coe3=0;Dqk=zeros(1,7);fid=fopen('yy.txt','rt');%讀文件,文件格式為.txta=fscanf(fid,'%en');fclose(fid);%fid=fopen(yyG721.wav
18、9;);wavwrite(44100,fid);%轉(zhuǎn)換回wav格式音頻文件fid=fopen('yy721.txt','wt');fidI = fopen('yyIk.txt','wt');for i=1:size(a,1) Slk=a(i);%輸入信號 coe,coe1,coe2,coe3,Dqk=adpcm(Slk,coe,coe1,coe2,coe3,Dqk);%調(diào)用語音編解碼 fprintf(fid,'%fn',(coe2(5); fprintf(fidI,'%fn',(coe2(3);endfclose(fid);fclose(fidI);總結(jié)本文對語音信號編碼做了簡單的介紹,闡述了語音編碼的發(fā)展趨勢,語音編碼的目的,介紹了一些語音編碼的國際標準。接著就目前比較成熟的G.721 ADPCM標準進行了詳細介紹,并且通過Matlab軟件編程實現(xiàn)了該標準變換算法。通過本次作業(yè),我對語音編碼有了更深入的了解,并且進一步提高了我的Matlab編程能力。參考文獻1 張雪英,數(shù)字語音處理及MATLAB仿真,電子工業(yè)出版社,20102 陳杰, MATLAB寶典,電子工業(yè)出版社,2013年3 張星,齊
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生產(chǎn)效率的飛躍新世代生產(chǎn)設(shè)備介紹
- 幼兒園中國傳統(tǒng)節(jié)日活動方案
- 2023八年級數(shù)學下冊 第二章 一元一次不等式與一元一次不等式組6 一元一次不等式組第2課時 一元一次不等式組的解法(2)說課稿 (新版)北師大版001
- 12 寓言二則 說課稿-2023-2024學年語文二年級下冊統(tǒng)編版001
- 8我們受特殊保護 第二課時《專門法律來保護》說課稿-2024-2025學年六年級上冊道德與法治統(tǒng)編版
- 25《慢性子裁縫和急性子顧客》說課稿-2024-2025學年統(tǒng)編版語文三年級下冊
- Module 1(說課稿)-2023-2024學年外研版(一起)英語一年級下冊
- Module6 Unit2 He ran very fast(說課稿)2024-2025學年外研版(三起)英語五年級上冊
- 28 少年閏土 說課稿-2024-2025學年統(tǒng)編版六年級上冊
- 22《狐假虎威》第二課時 說課稿-2024-2025學年統(tǒng)編版語文二年級上冊
- 農(nóng)產(chǎn)品質(zhì)量評估與分級
- 社區(qū)成人血脂管理中國專家共識(2024年)
- 信息科技重大版 七年級上冊 互聯(lián)網(wǎng)應(yīng)用與創(chuàng)新 第1單元 單元教學設(shè)計 互聯(lián)網(wǎng)時代
- CR200J動力集中動車組拖車制動系統(tǒng)講解
- 骨盆骨折患者的護理
- 國際貨物運輸委托代理合同(中英文對照)全套
- 全面新編部編版四年級下冊語文教材解讀分析
- 江蘇農(nóng)牧科技職業(yè)學院單招《職業(yè)技能測試》參考試題庫(含答案)
- 三年級上冊脫式計算100題及答案
- 烹飪實訓(xùn)室安全隱患分析報告
- 《金屬加工的基礎(chǔ)》課件
評論
0/150
提交評論