(畢業(yè)論文)基于ADPCM的語(yǔ)音編解碼設(shè)計(jì)

上傳人：灰*** IP屬地：寧夏上傳時(shí)間：2021-05-18 格式：DOC 頁(yè)數(shù)：36 大?。?.33MB 積分：15 舉報(bào) 版權(quán)申訴

(畢業(yè)論文)基于ADPCM的語(yǔ)音編解碼設(shè)計(jì)_第2頁(yè)

(畢業(yè)論文)基于ADPCM的語(yǔ)音編解碼設(shè)計(jì)_第3頁(yè)

(畢業(yè)論文)基于ADPCM的語(yǔ)音編解碼設(shè)計(jì)_第4頁(yè)

(畢業(yè)論文)基于ADPCM的語(yǔ)音編解碼設(shè)計(jì)_第5頁(yè)

已閱讀5頁(yè)，還剩31頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1 緒論1.1 課題研究的背景和意義隨著社會(huì)時(shí)代的發(fā)展,人類迅速進(jìn)入信息時(shí)代,對(duì)于各種資源的利用率要求越來(lái)越高,從而推動(dòng)了語(yǔ)音編解碼技術(shù)的飛躍發(fā)展。與此同時(shí),伴隨著微電子技術(shù)的快速發(fā)展,以及超大規(guī)模集成電路設(shè)計(jì)技術(shù)的不斷完善,使得語(yǔ)音編解碼技術(shù)越來(lái)越廣泛的深入到通信領(lǐng)域、消費(fèi)電子領(lǐng)域,辟如數(shù)字錄音筆、ip電話、復(fù)讀機(jī)等等都是語(yǔ)音壓縮編碼技術(shù)的典型應(yīng)用。語(yǔ)音編碼技術(shù)就是將模擬的語(yǔ)音信號(hào)數(shù)字化離散化,利用語(yǔ)音聽(tīng)覺(jué)上的制約或者數(shù)據(jù)的冗余度來(lái)壓縮信號(hào)的一些不必要的信息,以此來(lái)增加傳輸速率、減少存儲(chǔ)容量,然后再進(jìn)行傳輸、存儲(chǔ)或者處理,而解碼就是相反的一個(gè)過(guò)程。adpcm是自適應(yīng)差分脈沖編碼調(diào)制的簡(jiǎn)稱，是

2、語(yǔ)音編碼的多種算法中的一種，更是最早使用于數(shù)字通信系統(tǒng)中的一種語(yǔ)音編解碼算法。此算法利用了語(yǔ)音信號(hào)樣點(diǎn)間的相關(guān)性，針對(duì)語(yǔ)音信號(hào)的非平穩(wěn)特點(diǎn)，使用了自適應(yīng)預(yù)測(cè)和自適應(yīng)量化，即預(yù)測(cè)器和量化器它們的參數(shù)能隨著輸入信號(hào)的統(tǒng)計(jì)特性，自適應(yīng)于或接近于最佳的參數(shù)狀態(tài)，在32kbps的速率上能夠給出網(wǎng)絡(luò)等級(jí)話音質(zhì)量。adpcm究其本質(zhì)是一種針對(duì) 16bits( 或8bits或者更高) 聲音波形數(shù)據(jù)的一種有損壓縮算法,它可以將聲音流中每次采樣的 16bit 數(shù)據(jù)用4bit 來(lái)存儲(chǔ),所以其壓縮比為 1:4。而且它的壓縮/解壓縮算法非常簡(jiǎn)單,所以又是一種低空間消耗、高質(zhì)量高效率聲音獲得的好途徑。adpcm 其主要是

3、針對(duì)連續(xù)波形數(shù)據(jù)的，保存的則是波形的變化情況，從而以達(dá)到描述整個(gè)波形的目的。1.2語(yǔ)音編碼的發(fā)展和研究狀況數(shù)字語(yǔ)音有很多的優(yōu)點(diǎn)是模擬語(yǔ)音不可比擬的，它能更方便的傳輸和存儲(chǔ)，可以在噪聲信道中進(jìn)行相當(dāng)可靠的傳輸，容易進(jìn)行交換，能夠很方便的對(duì)信號(hào)進(jìn)行加密傳輸。數(shù)字語(yǔ)音可以由模擬語(yǔ)音簡(jiǎn)單的抽樣，量化來(lái)得到，但由于數(shù)字語(yǔ)音其數(shù)據(jù)量比較大如果不經(jīng)過(guò)處理，那它在傳輸和存儲(chǔ)時(shí)就會(huì)占用很大量的信道資源以及存儲(chǔ)空間，那么給系統(tǒng)提出的要求勢(shì)必就會(huì)很高，所以數(shù)字語(yǔ)音通常情況下都是要進(jìn)行壓縮編碼的。在確保編碼語(yǔ)音一定質(zhì)量的前提下，究竟如何高效率進(jìn)行壓縮編碼，或者說(shuō)在給定信息速率的前提下，如何去提高編碼后的語(yǔ)音質(zhì)量，是

4、當(dāng)代語(yǔ)音編碼所要研究的重點(diǎn)。語(yǔ)音編碼技術(shù)一般分為兩種：信源編碼和信道編碼。信源編碼的目的是為了提高信號(hào)的傳輸和存儲(chǔ)效率，在這指的就是數(shù)字語(yǔ)音信號(hào)被壓縮的比特率(即每秒鐘傳輸語(yǔ)音信號(hào)所得出的比特?cái)?shù)，通常也可以稱為數(shù)碼率)，使得更多路的語(yǔ)音信號(hào)能在同樣的信道容量中傳輸，或者說(shuō)只需要較小的容量存儲(chǔ)數(shù)字語(yǔ)音信號(hào)，所以這一類編碼又被稱為語(yǔ)音信號(hào)的壓縮編碼。而信道編碼因?yàn)槭菫榱颂岣邆鬏數(shù)目煽啃远鞒龅奶幚恚杂直环Q為可靠性編碼。語(yǔ)音信號(hào)編碼從方法上講有波形編碼和分析合成系統(tǒng)兩大分支。波形編碼是以盡最大可能無(wú)失真的重構(gòu)出語(yǔ)音波形為目標(biāo)，在其編碼時(shí)以波形逼近為基本原則，在時(shí)域上或變換域上直接進(jìn)行編碼，雖然

5、這種方法壓縮效率不很高，但是在6416kb/s 的速率上，卻可以合成出相當(dāng)高的語(yǔ)音質(zhì)量，然而在速率進(jìn)一步下降時(shí)，編碼語(yǔ)音的質(zhì)量將會(huì)隨之大幅度下降。常用的波形編碼算法有：時(shí)域上編碼的pcm(pulse code modulation)，adpcm，apc(adaptive predictive coding)；在頻域上進(jìn)行編碼的子帶編碼sbc（sub-band coding）和自適應(yīng)變換編碼atc(adaptive transform cording)。分析合成系統(tǒng)是把語(yǔ)音信號(hào)產(chǎn)生模型作為基礎(chǔ)，把語(yǔ)音信號(hào)變換成模型參數(shù)后再進(jìn)行編碼，因此又稱之為參數(shù)編碼。參數(shù)編碼其出發(fā)點(diǎn)同波形編碼有所不同，它的

6、原則是以在盡量保持語(yǔ)音可懂度的條件下，為語(yǔ)音信號(hào)搭建一個(gè)數(shù)學(xué)模型，然后通過(guò)給定的語(yǔ)音信號(hào)計(jì)算模型參數(shù)并且量化編碼來(lái)實(shí)現(xiàn)。而且它的模型參數(shù)對(duì)比于語(yǔ)音波形來(lái)說(shuō)數(shù)據(jù)量是很小的，因而其壓縮效率很高。雖然也許參數(shù)編碼會(huì)導(dǎo)致重建話音和原始語(yǔ)音在它時(shí)域波形上有很大的區(qū)別，但它的可懂度仍然可以保持在一個(gè)相當(dāng)高的程度。現(xiàn)在，還時(shí)常采用混合編碼的方案，混合編碼是波形編碼和參數(shù)編碼優(yōu)點(diǎn)的結(jié)合，這種結(jié)合是保留分析合成編碼技術(shù)精華的基礎(chǔ)，引用波形編碼準(zhǔn)則優(yōu)化激勵(lì)源信號(hào)，從而在一個(gè)較小的數(shù)碼率上(4.89.6kbit/s)獲得更高質(zhì)量的合成語(yǔ)音。自1937年以來(lái)的脈沖編碼調(diào)制（pcm）是ah里夫斯已經(jīng)提出，語(yǔ)音編碼技術(shù)

7、的發(fā)展歷史已經(jīng)超過(guò)60年。尤其是在過(guò)去的20年里，隨著計(jì)算機(jī)的語(yǔ)音編碼技術(shù)和微電子技術(shù)的發(fā)展得到了快速發(fā)展。64kbit/s的pcm系統(tǒng)標(biāo)準(zhǔn)ccitt于1972年確定了64kbit/s的pcm語(yǔ)音編碼g. 711建議，已被廣泛應(yīng)用于數(shù)字交換機(jī)，數(shù)字通訊等領(lǐng)域，到現(xiàn)在為止，仍然是占主導(dǎo)地位。雖然這種編碼方法可以得到良好的語(yǔ)音質(zhì)量，但缺點(diǎn)是，它會(huì)占用更多的帶寬，有限的帶寬資源條件下不使用。ccitt在20世紀(jì)80年代初，就開(kāi)始專攻小于64kb/s的非pcm編碼算法，32k比特/秒adpcm語(yǔ)音編碼g. 721建議，于1984年通過(guò)，它不僅可以實(shí)現(xiàn)與pcm等效語(yǔ)音質(zhì)量，還更好的抗誤碼性能，它被廣泛用

8、于海底電纜，衛(wèi)星，和可變速率的數(shù)字語(yǔ)音內(nèi)插編碼器清空設(shè)備。連續(xù)地，在那之后，1986年，1988，做了進(jìn)一步的修改在此，也可以是32k比特/秒的pcm比特率，一般是高速率的一半，達(dá)到接近正常的pcm語(yǔ)音質(zhì)量，防誤性能優(yōu)于pcm格式。隨后頒布g. 723標(biāo)準(zhǔn)，擴(kuò)大到24kbit/s和40kbit/s的編碼標(biāo)準(zhǔn)稅率。 1990年g. 723，g. 721由itu合并，將進(jìn)一步擴(kuò)展的編碼率16kbit /秒，從而促進(jìn)g. 726標(biāo)準(zhǔn)形成的。語(yǔ)音插值技術(shù)和浮動(dòng)利率結(jié)合原來(lái)的pcm通道的adpcm編碼，可擴(kuò)展到8-10倍，稱之為數(shù)字語(yǔ)音通道倍增設(shè)備dcme。 g. 726標(biāo)準(zhǔn)算法不僅簡(jiǎn)單，但高品質(zhì)的聲音

9、，即使在經(jīng)過(guò)反復(fù)的切換，以確保他們的聲音質(zhì)量，所以網(wǎng)絡(luò)會(huì)議系統(tǒng),8-isdn通信和voip網(wǎng)絡(luò)通信等方面具有廣泛的應(yīng)用。然后16kb/s的低時(shí)延碼激勵(lì)線性預(yù)測(cè)（ld-celp）g. 728建議，在1992年出版。正是由于其較低的利率，高性能，低延遲在實(shí)踐中廣泛使用，如：?jiǎn)温穯屋d波衛(wèi)星，無(wú)繩電話和數(shù)字插值空氣設(shè)備，海事衛(wèi)星通信，存儲(chǔ)，數(shù)字移動(dòng)無(wú)線系統(tǒng)，分組語(yǔ)音，轉(zhuǎn)發(fā)系統(tǒng)，語(yǔ)音留言錄制。最后，在11月1995年共軛代數(shù)碼激勵(lì)線性預(yù)測(cè)（cs-acelp）8kb/s的語(yǔ)音編碼g. 729建議itu-tsgl5全體會(huì)議通過(guò)，并通過(guò)g. 729附件降低復(fù)雜8kb/s的cs-acelp講話編解碼器在itu-

10、tsgl5 1996年6月的會(huì)議上正式成為國(guó)際標(biāo)準(zhǔn)。這種編碼其延遲小，可以節(jié)省帶寬的87.5，為32kb/s的adpcm語(yǔ)音質(zhì)量，音質(zhì)在同級(jí)別最優(yōu)的比特率，在嘈雜的環(huán)境中也可以更好的語(yǔ)音質(zhì)量。雖然csacelp語(yǔ)音編解碼器占用比特率比adpcm的少，但是其算法復(fù)雜度遠(yuǎn)沒(méi)有adpcm的算法簡(jiǎn)單明了，所以在現(xiàn)代通信系統(tǒng)中，adpcm這種編碼算法仍然占主導(dǎo)地位。1.3 語(yǔ)音壓縮編碼的評(píng)價(jià)語(yǔ)音質(zhì)量是一個(gè)語(yǔ)音編碼系統(tǒng)必然要保證的性能指標(biāo),速率再低,編碼效率再高,不能得到滿意的語(yǔ)音質(zhì)量也不能算是一個(gè)優(yōu)良的編碼算法。那么，在語(yǔ)音壓縮編碼中，怎樣評(píng)價(jià)一個(gè)語(yǔ)音壓縮質(zhì)量的好壞就成為了是一個(gè)極其重要的概念，通常，評(píng)

11、價(jià)語(yǔ)音壓縮的標(biāo)準(zhǔn)主要有以下幾點(diǎn)：1）語(yǔ)音質(zhì)量語(yǔ)音質(zhì)量的評(píng)價(jià)方法可分為主觀評(píng)定和客觀評(píng)定兩大類。客觀評(píng)定方法用客觀測(cè)量的手段來(lái)評(píng)價(jià)語(yǔ)音編碼質(zhì)量,常用的方法有均方誤差、信噪比、加權(quán)信噪比、平均分段信噪比等。主觀評(píng)定方法是用人們自身去感受語(yǔ)音質(zhì)量的感覺(jué)，然后主觀評(píng)判其語(yǔ)音壓縮編碼的質(zhì)量。2)編碼速率編碼速率，可以使用“比特/秒”（比特/秒或bps）的措施，即總速率編碼，通常用i表示，即每秒的編碼比特的數(shù)量。3)編解碼復(fù)雜度所謂編解碼的復(fù)雜度指的就是實(shí)現(xiàn)一個(gè)信號(hào)編解碼算法的難易程度。編解碼算法的復(fù)雜程度和語(yǔ)音編碼的話音質(zhì)量有著相當(dāng)密切的聯(lián)系。在一個(gè)相同的數(shù)碼率情況下,算法復(fù)雜一些的將會(huì)獲得更好的語(yǔ)音質(zhì)

12、量。編解碼復(fù)雜度可以由算法復(fù)雜程度、硬件實(shí)現(xiàn)及價(jià)格等許多因素來(lái)衡量。4)編解碼延時(shí)數(shù)字音頻編解碼器的延遲主要由兩部分組成：算法延遲和處理延遲。之前的壓縮的音頻信號(hào)到高速緩存中的數(shù)據(jù)必須是有效的，這個(gè)時(shí)間延遲稱為算法延遲，它是不是唯一的方法，以減少通過(guò)改變延遲時(shí)間。即，音頻信號(hào)壓縮編碼器和解碼器的編解碼器的實(shí)現(xiàn)在不同的應(yīng)用程序所需的時(shí)間的處理延遲，國(guó)際社會(huì)已延時(shí)的編解碼器不同的要求，如長(zhǎng)途編解碼器延遲不超過(guò)5-10毫秒，但對(duì)于可視電話可以擴(kuò)展到幾十毫秒到幾百毫秒。5)穩(wěn)健性(robustness)所謂穩(wěn)健性是指編譯碼系統(tǒng)的抗噪聲、抗信道誤碼能力。一個(gè)實(shí)用的聲碼器,其誤碼率要求在10-3的信道上傳

13、輸時(shí),語(yǔ)音質(zhì)量不至于過(guò)分惡化,而對(duì)于移動(dòng)通信中的聲碼器則要求在信道誤碼率為310-2時(shí)仍能正常工作。adpcm就語(yǔ)音質(zhì)量的評(píng)價(jià)上來(lái)說(shuō)，語(yǔ)音質(zhì)量的客觀評(píng)價(jià)方法主要采用均方誤差和信噪比來(lái)評(píng)定。但客觀評(píng)價(jià)還不能全面反映人對(duì)語(yǔ)音質(zhì)量的感覺(jué)，而主觀評(píng)定方法符合人們對(duì)語(yǔ)音質(zhì)量感覺(jué)的要求。主觀評(píng)價(jià)的優(yōu)越性，主要體現(xiàn)在其處理還原后給人主觀感覺(jué)效果很好，感覺(jué)語(yǔ)音失真度?。痪途幋a速率來(lái)講，adpcm的編碼速率為16kb/s，優(yōu)于其他編碼方式；就其編解碼的復(fù)雜度而言，adpcm采用四位二進(jìn)制的差值編碼方式，使用起來(lái)簡(jiǎn)單又容易實(shí)現(xiàn)；它的抗噪能力也比較強(qiáng)即穩(wěn)健性相當(dāng)好。1.4 論文研究的主要內(nèi)容及章節(jié)內(nèi)容安排本論文研究

14、的內(nèi)容是語(yǔ)音編解碼的算法及軟件實(shí)現(xiàn)過(guò)程，主要是研究adpcm的語(yǔ)音編解碼算法及在matlab軟件中的實(shí)現(xiàn)。論文共分4章，各章內(nèi)容安排如下：第一章：簡(jiǎn)要介紹課題研究背景和意義，語(yǔ)音編解碼的發(fā)展和研究狀況以及它的評(píng)價(jià)標(biāo)準(zhǔn)。第二章：主要介紹語(yǔ)音信號(hào)脈沖編碼基本理論,為對(duì)語(yǔ)音進(jìn)行adpcm編碼譯碼系統(tǒng)提供理論依據(jù)。第三章：介紹pcm與dpcm（differential pulse code modulation）的工作原理，并對(duì)二者進(jìn)行比較，從而體現(xiàn)出dpcm編碼的優(yōu)越性。接著介紹增量調(diào)制dm(delta modulation)及自適應(yīng)增量調(diào)制adm(adaptive delta modulation

15、)的原理與運(yùn)用，二者比較得出adm更容易跟蹤信號(hào)變化快的的語(yǔ)言,最后闡述了adpcm的由來(lái)及主要原理。第四章：確定adpcm實(shí)現(xiàn)的總體設(shè)計(jì)框圖,以及adpcm編碼和解碼實(shí)現(xiàn)過(guò)程的設(shè)計(jì)流程圖, 并采用matlab軟件對(duì)adpcm編解碼系統(tǒng)的實(shí)現(xiàn)進(jìn)行了仿真。2 語(yǔ)音信號(hào)脈沖編碼基本理論當(dāng)前最主要的通信業(yè)務(wù)有電話、圖像(傳真、電視)等,它們都是時(shí)間上和幅度上連續(xù)的模擬信號(hào),如果要想實(shí)現(xiàn)數(shù)字化的傳輸和交換,則首先要做的就是把模擬信號(hào)變化成數(shù)字信號(hào)，電話信號(hào)數(shù)字化一般被稱為語(yǔ)音編碼,而圖像信號(hào)數(shù)字化就被稱為圖像編碼。雖然兩者各有各的特點(diǎn),但兩者的編碼原理基本上仍然是一致的。而當(dāng)前的通信網(wǎng)中很多業(yè)務(wù)基本上

16、都是電話業(yè)務(wù),因此語(yǔ)音編碼將為本章討論的重點(diǎn)?？梢哉f(shuō)這些理論對(duì)任何模擬信號(hào)數(shù)字化的實(shí)現(xiàn)過(guò)程都是適用的，其不失一般意義。依照語(yǔ)音的特點(diǎn),通常把語(yǔ)音編碼方法分為波形編碼和參量編碼，波形編碼是指對(duì)信號(hào)的波形進(jìn)行編碼,它具有較高重建信號(hào)質(zhì)量的能力。參量編碼則是通過(guò)提取語(yǔ)音信號(hào)的一些特征參量,從而對(duì)其進(jìn)行編碼,它的特點(diǎn)是碼速率較低,但其語(yǔ)音質(zhì)量要較波形編碼差一些。波形編碼的質(zhì)量比較高,通常在3003400hz話路通道中傳輸模擬信號(hào)(例如模擬數(shù)據(jù)信號(hào)、電話信號(hào)、傳真信號(hào)及各種隨路信令信號(hào)等)在數(shù)字化以后,仍然可以達(dá)到原來(lái)的質(zhì)量容限。這一特點(diǎn)是通信網(wǎng)由模擬轉(zhuǎn)換為數(shù)字過(guò)渡過(guò)程中極其重要的一點(diǎn)。根據(jù)語(yǔ)音的特性

17、，通常分為波形編碼和參數(shù)編碼類型的兩類語(yǔ)音編碼方法，波形編碼，用于編碼的信號(hào)波形，它具有更高的能力來(lái)重建信號(hào)的質(zhì)量。參數(shù)編碼是通過(guò)提取語(yǔ)音信號(hào)的參數(shù)的一些特點(diǎn)，從而編碼，它的特點(diǎn)是較低的比特率，但不如波形編碼的語(yǔ)音質(zhì)量。波形編碼質(zhì)量是比較高的，通常會(huì)在通道3003400hz傳輸各種模擬信號(hào)（如模擬數(shù)據(jù)信號(hào)，電話信號(hào)，傳真信號(hào)，與信道相關(guān)信令的各種信號(hào)）后的數(shù)字仍實(shí)現(xiàn)其原來(lái)的質(zhì)量寬容。的通信網(wǎng)絡(luò)，其特征在于由模擬到數(shù)字的轉(zhuǎn)換是非常重要的。語(yǔ)音信號(hào)有很多波形編碼方法,例如脈沖編碼調(diào)制（pcm）、自適應(yīng)增量調(diào)制(adm)、自適應(yīng)差值脈沖編碼調(diào)制(adpcm)、子帶編碼(sbc)、矢量編碼（vqc:v

18、ector quantitation coding）等。為對(duì)語(yǔ)音進(jìn)行adpcm編碼譯碼系統(tǒng)提供理論依據(jù)，下面主要介紹編碼的一些基本理論。2.1 語(yǔ)音信號(hào)壓縮的基本原理在數(shù)字通信中，語(yǔ)音信號(hào)被編碼為二進(jìn)制數(shù)字序列，通過(guò)信道傳輸或存儲(chǔ)，在經(jīng)過(guò)解碼后恢復(fù)為可懂的語(yǔ)音。將語(yǔ)音信號(hào)編碼為二進(jìn)制數(shù)字序列后再經(jīng)傳輸或儲(chǔ)存有其獨(dú)特的優(yōu)點(diǎn)。例如，可擺脫傳輸或存儲(chǔ)中噪聲的干擾。模擬傳輸信道的噪聲總是要使語(yǔ)音信號(hào)發(fā)生畸變，而數(shù)字通信只要有足夠的通信站，就能排除所有噪聲的影響；另一方面，磁帶錄音機(jī)存儲(chǔ)模擬信號(hào)時(shí)要受磁帶噪聲和其他噪聲的影響，而采用計(jì)算機(jī)存儲(chǔ)數(shù)字語(yǔ)音信號(hào)時(shí)，惟一的失真來(lái)自模數(shù)轉(zhuǎn)換前的低通濾波。另外，數(shù)字

19、編碼的信號(hào)還便于處理和加密、再生與轉(zhuǎn)發(fā)，也可與其他信號(hào)復(fù)用一個(gè)信道，設(shè)備便于集成等。最簡(jiǎn)單的語(yǔ)音編碼方法是對(duì)其直接進(jìn)行模/數(shù)變換；只要其取樣率足夠高，量化每個(gè)樣本的比特?cái)?shù)足夠大，那么就能保證解碼恢復(fù)的語(yǔ)音信號(hào)有非常好的音質(zhì)，而且也不會(huì)丟失有用信息。可是對(duì)語(yǔ)音信號(hào)直接進(jìn)行數(shù)字化其所需數(shù)碼率太高，比如普通電話通信中采用8khz取樣率，如用12bit進(jìn)行量化，則數(shù)碼率為96kbit/s，這樣大的數(shù)碼率即使對(duì)很大容量的傳輸信道也是難以承受的。而語(yǔ)音信號(hào)用pcm編碼后，數(shù)碼率為64kbit/s,不進(jìn)行壓縮很難用調(diào)制解調(diào)器在電話線路上傳輸，所以必須進(jìn)行壓縮編碼。對(duì)語(yǔ)音進(jìn)行編壓縮碼的基本依據(jù)有兩個(gè)。一是，從

20、產(chǎn)生的物理機(jī)理和語(yǔ)音結(jié)構(gòu)的性質(zhì)來(lái)看，語(yǔ)音信號(hào)中存在較大的冗余度。從信息保持的角度講，只有當(dāng)信源本身具有冗余度，才能對(duì)其進(jìn)行壓縮。語(yǔ)音壓縮實(shí)質(zhì)上就是識(shí)別語(yǔ)音中的冗余度并設(shè)法去除掉它們。冗余度最主要部分可以分別從時(shí)域或頻域來(lái)考慮，歸納起來(lái)有以下幾個(gè)方面：1，語(yǔ)音信號(hào)樣本間的相關(guān)性很強(qiáng)，即其短時(shí)譜不平坦。2，濁音語(yǔ)音段具有準(zhǔn)周期性。3，聲道的形狀及其變化比較慢。4，傳輸碼值的概率分布是非均勻的。語(yǔ)音編碼的第二個(gè)依據(jù)是利用人類聽(tīng)覺(jué)的某些特性。人耳聽(tīng)不到或感知不靈敏的語(yǔ)音分量可視為冗余（這種冗余可看作為主觀上的冗余），所以可以利用人耳感知模型，去除掉人耳感覺(jué)不靈敏的語(yǔ)音分量，而重構(gòu)后的語(yǔ)音質(zhì)量不明顯下降

21、?？傊?，利用冗余度或者是聽(tīng)覺(jué)上的制約，可以壓縮表示語(yǔ)音信號(hào)的必要信息，從而可降低傳輸速率或存儲(chǔ)容量。下面給出脈沖編碼的基本框圖：圖1 模擬脈沖編碼框圖2.2 采樣定理2.2.1 nyquist采樣定理采樣是指將時(shí)間上連續(xù)的模擬信號(hào)變?yōu)闀r(shí)間上離散樣值的過(guò)程。采樣定理最主要要回答的問(wèn)題是看能不能由離散樣值序列重建出原始的模擬信號(hào)。且抽樣定理還是任何模擬信號(hào)數(shù)字化的理論基礎(chǔ)。其主要有以下幾種:nyquist采樣定理；帶通采樣定理；自然采樣平頂采樣。接下來(lái)簡(jiǎn)單的介紹一下nyquist采樣定理和帶通采樣定理。 nyquist采樣定理:設(shè)定一個(gè)頻率帶限信號(hào)為,將其頻帶限制在(0, )或以下,若對(duì)以不低于的

22、采樣速率進(jìn)行等間隔采樣,那么獲得時(shí)間離散的采樣信號(hào) (其中稱為采樣間隔), 通過(guò)所得到的采樣值原信號(hào)將完全的確定。奈奎斯特采樣定理指出，如果信號(hào)是一個(gè)不小于2倍的采樣率進(jìn)行采樣的，則由所得到的離散采樣值就可以唯一的恢復(fù)原信號(hào)。根據(jù)抽樣理論，使采樣信號(hào)通過(guò)一個(gè)低通濾波器，其帶寬不小于，過(guò)濾掉高頻成分，因此它可以恢復(fù)的原始信號(hào)的無(wú)失真的從中。隨著時(shí)間離散采樣值來(lái)代替連續(xù)時(shí)間模擬信號(hào)的采樣定理的意義是，這將模擬信號(hào)處理數(shù)字化奠定了理論基礎(chǔ)。2.2.2 帶通信號(hào)采樣nyquist采樣定理僅僅討論了頻譜分布在(0, )上的基帶信號(hào)的采樣問(wèn)題, 但在實(shí)踐中，我們遇到的信號(hào)，尤其是語(yǔ)音信號(hào)中，通常會(huì)在一個(gè)

23、有限的頻帶(, )范圍內(nèi)的信號(hào)的帶通頻率分布，由奈奎斯特采樣定理，依然能按照的采樣速率去進(jìn)行采樣。當(dāng)時(shí),即當(dāng)信號(hào)最高頻率遠(yuǎn)遠(yuǎn)大于該信號(hào)帶寬b時(shí),若仍然按照nyquist采樣率去進(jìn)行采樣的話,那么它的采樣頻率就會(huì)變得很高,從而就很難去實(shí)現(xiàn), 或隨后的處理速度是非常困難符合要求的。帶通采樣定理:設(shè)一個(gè)帶限信號(hào),將其頻帶限制在(,)范圍內(nèi),若其采樣速率關(guān)系式滿足: （1）其中n為整數(shù),其取值區(qū)間為:0,n,n為/b的整數(shù)部分。那么的頻譜將不會(huì)發(fā)生混疊,即能從中無(wú)失真的恢復(fù)出。從以上采樣定理中很容易推導(dǎo)出最低采樣率（2）(當(dāng)n=最大值n時(shí), 最小)，且又由式可以得知:帶通采樣頻率最小值在2b到4b之

24、間，即（3）通常,當(dāng)帶通信號(hào)的帶寬比信號(hào)的最低頻率大時(shí),就可將此信號(hào)作為低通信號(hào)處理。只有當(dāng)不滿足上述條件時(shí)才使用帶通抽樣定理。2.3 量化定理2.3.1 基本概念量化是指將一個(gè)幅度連續(xù)變化的信號(hào)變?yōu)橐粋€(gè)離散信號(hào)的過(guò)程。由于用有限長(zhǎng)度的二進(jìn)制數(shù)字碼組表示模擬信號(hào)樣值是pcm的數(shù)字化過(guò)程,然而有限長(zhǎng)度的二進(jìn)制數(shù)字碼組又只能代表有限數(shù)量的樣值,所以若要用有限的數(shù)量樣值去表示原模擬信號(hào)無(wú)限個(gè)幅度抽樣值，那么就需要對(duì)其進(jìn)行量化。量化的方法就是，將所需量化樣值的最大變化范圍分成若干個(gè)相鄰區(qū)間段落,當(dāng)其樣值落在某一間區(qū)間內(nèi),它的輸出數(shù)值就用此區(qū)間內(nèi)的某一個(gè)單一固定值來(lái)表示。量化間隔可以是相等的,也可以是

25、不相等的,一般有均勻量化和非均勻量化兩種量化方法。從量化結(jié)果可以發(fā)現(xiàn),不論量化的間隔有多么小,都會(huì)帶來(lái)一定的誤差,隨之就產(chǎn)生了量化噪聲。雖然將量化間隔取得較小，量化級(jí)數(shù)會(huì)因此變多從而能減小一定的量化誤差,但與此同時(shí)，也會(huì)相應(yīng)的增加數(shù)碼率,提高編碼設(shè)備的復(fù)雜程度,而且需要較寬的傳輸信道。例如,對(duì)語(yǔ)音信號(hào),其抽樣速率為,如果每個(gè)樣值編碼8位,量化共有256個(gè)量化間隔,每路語(yǔ)音pcm編碼后的數(shù)碼率為8x8=64kib/s；如果每位樣值編11位碼,數(shù)碼率提高到88kbit/s。2.3.2 均勻量化均勻量化也叫線性量化,它在量化時(shí)各量化間隔是相等的。任意一個(gè)量化器都會(huì)有一定的量化范圍,通常取-vv。在均

26、勻量化的情況下與, 量化間隔()和量化級(jí)數(shù)n的關(guān)系為: （4）通常情況下每一個(gè)量化間隔內(nèi)的量化值可以取此區(qū)間內(nèi)的任意一值,但是理論上為了減小平均量化誤差功率, 一般量化值的取值會(huì)取量化間隔中間值,那么這樣量化的最大誤差便為/2。一般來(lái)說(shuō)，信源碼都是二元碼,所以其碼位n與量化級(jí)數(shù)n的關(guān)系為,即。對(duì)于均勻量化的量化間隔或是量化電平用n位碼表示,就得到了數(shù)字編碼信號(hào),通常稱為線性pcm編碼信號(hào)。2.3.3 非均勻量化非均勻量化是一種量化間隔取決于使用不同信號(hào)的，在信號(hào)幅度值比較小的區(qū)間內(nèi)就采用小的量化間隔,而在信號(hào)幅值比較大的區(qū)間內(nèi)則采用大的量化間隔,量化間隔不再是一個(gè)恒定值。非均勻量化較均勻量化方

27、法具有以下兩個(gè)優(yōu)點(diǎn)：a)當(dāng)對(duì)一個(gè)概率密度非均勻分布的語(yǔ)音信號(hào)進(jìn)行量化時(shí),非均勻量化方式就可以得到較高的平均信號(hào)量化噪聲功率比。b) 在非均勻量化，量化噪聲的語(yǔ)音信號(hào)的rms值的功率大致成比例的采樣，即，量化的或大或小的語(yǔ)音信號(hào)的量化噪聲信號(hào)的方法，無(wú)論水平是相同的，即改善均勻量化的聲音時(shí)，小信號(hào)量化噪聲比。非均勻量化小的用于小信號(hào)的量化噪聲，以確保在同一時(shí)間有一定的限制，在量化過(guò)程中，有足夠的動(dòng)態(tài)范圍的量化比特?cái)?shù)并沒(méi)有把一個(gè)大的信號(hào)過(guò)載。如果我們知道的語(yǔ)音信號(hào)的幅度的概率密度函數(shù)的序列，我們可以設(shè)計(jì)給定的量化比特?cái)?shù)的量化噪聲是最小的非均勻量化器。輸入語(yǔ)音信號(hào)的方差和概率密度函數(shù)進(jìn)行量化，與量化

28、的質(zhì)量密切相關(guān)，我們需要通過(guò)量化方法一種受二者影響較小的，目前在這方面的杰出貢獻(xiàn)的，我們經(jīng)?？吹降腶律或律量化。非均勻量化的過(guò)程中，可以等效地視為非線性的壓縮語(yǔ)音信號(hào)的振幅，然后的線性量化處理。非線性壓縮方法是目前理想的對(duì)數(shù)壓縮。所謂的對(duì)數(shù)壓縮，也就是說(shuō)，要量化的對(duì)數(shù)壓縮的語(yǔ)音信號(hào)的振幅值，振幅的第一語(yǔ)音信號(hào)的對(duì)數(shù)，然后量化值，提高量化器的動(dòng)態(tài)范圍。在解碼側(cè)，通過(guò)過(guò)程的逆過(guò)程 - 恢復(fù)的話音消息的采樣的指數(shù)函數(shù)的對(duì)數(shù)。僅取自量化步長(zhǎng)的量化噪聲對(duì)數(shù)壓縮，從該語(yǔ)音信號(hào)的方差。然而，其值的對(duì)數(shù)的語(yǔ)音信號(hào)的振幅可能很大，需要定量或定量的特定的量化比特的電平，以便對(duì)數(shù)壓縮更難以實(shí)現(xiàn)。可將對(duì)數(shù)壓縮特性作些

29、近似,這樣才有了后來(lái)的律的壓縮方式:先將語(yǔ)音抽樣信號(hào)作公式（5）變換得到,量化器再對(duì)進(jìn)行量化。（5）當(dāng)時(shí), 當(dāng)時(shí), 當(dāng)時(shí), 輸入輸出信號(hào)相同,即沒(méi)有進(jìn)行壓縮,信號(hào)子幅度范圍即量化電平均勻分布;當(dāng)很大,并且也很大時(shí),則有: （6）此時(shí)的律量化器的信噪比可推導(dǎo)為: （7）由上述公式可知: 律量化器信噪比與關(guān)系不大。大量實(shí)驗(yàn)結(jié)果表明,對(duì)于一個(gè)固定的值,若減為二分之一,則減少6db；而對(duì)于一個(gè)固定的值,碼每增加一位,則增加6db。律量化器以量化信噪比作較小犧牲為代價(jià),使量化器有一個(gè)比較寬的動(dòng)態(tài)范圍。通常作為“長(zhǎng)途電話質(zhì)量”語(yǔ)音波形標(biāo)準(zhǔn)的7位律pcm在動(dòng)態(tài)范圍合適的情況下保持有34db的信噪比。而若用

30、均勻量化器得到同樣寬度的動(dòng)態(tài)范圍,大約需要11位,比律量化器高出50%還多。2.3.4自適應(yīng)量化一方面，在語(yǔ)音信號(hào)中的量化器的量化步長(zhǎng)，從選定的足夠大，以適應(yīng)動(dòng)態(tài)范圍;另一方面，希望減小量化步長(zhǎng)，以減少量化噪聲相差。這種現(xiàn)象的原因是語(yǔ)音信號(hào)，語(yǔ)音通信過(guò)程是不固定的。與揚(yáng)聲器或通信環(huán)境的變化，和由濁音清音段到段的語(yǔ)音內(nèi)容，語(yǔ)音信號(hào)的幅度會(huì)在一個(gè)很寬的范圍內(nèi)。正如我們所看到的，使用非均勻量化，以適應(yīng)這些幅度的波動(dòng)是一種方式，還有一個(gè)比這更好的方式，采用自適應(yīng)量化，即使量化的量化步長(zhǎng)自動(dòng)適應(yīng)輸入電平的變化。在本節(jié)將介紹自適應(yīng)量化的一般原則。自適應(yīng)量化的基本思想，是使量化步長(zhǎng)的距離，變成輸入信號(hào)相匹配

31、的幅度變化，作為輸入信號(hào)的振幅從規(guī)定的變化，從而進(jìn)一步提高其定量結(jié)果的量化步。也可以在前面的一個(gè)固定量化器的自適應(yīng)增益控制，使之進(jìn)入到量化器的輸入信號(hào)保持到一個(gè)固定的常數(shù)方差。這兩種方法是等效的。這兩種方法應(yīng)容易地估計(jì)隨時(shí)間變化的輸入信號(hào)的振幅，來(lái)糾正從（n）的量化步長(zhǎng)的增益值。并根據(jù)不同的估計(jì)方法，自適應(yīng)量化可以分為兩種類型：一種是輸入振幅或輸入估計(jì)值本身的方差，此程序被稱為前饋?zhàn)赃m應(yīng)量化（aqf），另一種是，在根據(jù)與量化步長(zhǎng)從量化器輸出是自適應(yīng)的，或等價(jià)的輸出碼字c（n）自適應(yīng)調(diào)整，這個(gè)程序被稱為反饋?zhàn)赃m應(yīng)量化（aqb）。無(wú)論的aqf法或aqb方法，可以顯著提高量化的輸入信號(hào)電平變化的適應(yīng)

32、能力，可以使大或小信號(hào)輸入信號(hào)輸入具有很高的量化噪聲比。1）前饋?zhàn)赃m應(yīng)量化所謂前饋?zhàn)赃m應(yīng)是指，信號(hào)的能量或者方差是通過(guò)輸入信號(hào)其本身估算出來(lái)的，通常是先在估算出的方差后，然后令兩種系統(tǒng)輸出 (8)即正比于，而反比于盯。因?yàn)榱炕肼暡荒苡绊懙腶qf估值方法，所以aqf估值相當(dāng)可靠的。在同一時(shí)間，這也意味著，為了信息的傳送量，使用額外的比特到解碼器，被稱為邊信息。典型5-6位需要編寫每個(gè)量階，所以，估值的頻率不能太高，不然總的編碼速率過(guò)大，一般為10至30毫秒的時(shí)間估計(jì)。 aqf方法還具有的另一個(gè)問(wèn)題是，將引入一個(gè)較長(zhǎng)的編碼延遲，它經(jīng)常被用于子幀的編碼處理。2）反饋?zhàn)赃m應(yīng)量化器反饋?zhàn)赃m應(yīng)量化器的

33、估值方法是使用量化的信號(hào)后去提取量階信息，所以就避免了邊帶信息和延遲的問(wèn)題。 aqb的問(wèn)題是其估值精度將量化噪聲的影響，并會(huì)影響加劇量化粗糙性的增加，甚至有可能導(dǎo)致量化工作不正常。因此，aqb方法通常被用在相對(duì)較高的質(zhì)量在短暫的延遲語(yǔ)音編碼中。通常說(shuō)來(lái)，前饋的適應(yīng)性和反饋?zhàn)赃m應(yīng)相比，信噪比略高一些，但是前饋?zhàn)赃m應(yīng)需要延遲一段時(shí)間，短期時(shí)間去計(jì)算方差，而反饋?zhàn)赃m應(yīng)然后瞬間完成?？傊軌蚪o予超過(guò)律或a律自適應(yīng)量化量化的信號(hào)信噪比，適當(dāng)?shù)倪x擇，但也允許自適應(yīng)動(dòng)態(tài)范圍與后者相當(dāng)，選擇一個(gè)較小的無(wú)語(yǔ)言也使活動(dòng)時(shí)量化噪聲非常低，因此自適應(yīng)量化是一種非常有效的編碼方法。3 自適應(yīng)差分脈沖編碼調(diào)制adpcm

34、目前，脈沖編碼調(diào)制（pcm）的數(shù)字通信系統(tǒng)已經(jīng)在大容量數(shù)字微波、光纖通信系統(tǒng)，以及市話網(wǎng)局間中繼傳輸系統(tǒng)中獲得廣泛的應(yīng)用。但是現(xiàn)有的pcm編碼必須采用64kbit/s的a律或律對(duì)數(shù)壓擴(kuò)的方法，才能符合長(zhǎng)途電話傳輸語(yǔ)音的質(zhì)量指標(biāo)，其占用頻帶要比模擬單邊帶通信系統(tǒng)寬很多倍。這樣，對(duì)于費(fèi)用昂貴的長(zhǎng)途大容量傳輸，尤其是對(duì)于衛(wèi)星通信系統(tǒng)，采用pcm數(shù)字通信方式時(shí)的經(jīng)濟(jì)性很難和模擬相比擬。因此，人們一直致力于研究壓縮數(shù)字化語(yǔ)音占用頻帶的工作，也就是努力在相同質(zhì)量指標(biāo)的條件下，降低數(shù)字化語(yǔ)音數(shù)碼率，以提高數(shù)字通信系統(tǒng)的頻帶利用率。自適應(yīng)差值編碼調(diào)制（adpcm）是在差值脈沖編碼調(diào)制（dpcm）基礎(chǔ)上逐步發(fā)

35、展起來(lái)的。它在實(shí)現(xiàn)上采用預(yù)測(cè)技術(shù)減少量化編碼器輸入信號(hào)的多余度，將差值信號(hào)編碼以提高效率、降低編碼信號(hào)速率，這廣泛應(yīng)用于語(yǔ)音和圖像信號(hào)數(shù)字化。ccitt近幾年確定了64kb/s32kb/s的變換體制，將標(biāo)準(zhǔn)的pcm碼變換為32kb/s的adpcm碼，傳輸后再恢復(fù)為64kb/s的pcm信號(hào)，從而使64kb/s數(shù)字話音壓縮速率一倍，使傳輸信道的容易擴(kuò)大一倍。 adpcm中的量化器與預(yù)測(cè)器均采用自適應(yīng)方式，即量化器與預(yù)測(cè)器的參數(shù)能根據(jù)輸入信號(hào)的統(tǒng)計(jì)特性自適應(yīng)于最佳參數(shù)狀態(tài)。通常，人們把低于64kb/s數(shù)碼率的語(yǔ)音編碼方法稱為語(yǔ)音壓縮編碼技術(shù)，語(yǔ)音壓縮編碼方法很多，自適應(yīng)差值脈沖調(diào)制（adpcm）是語(yǔ)

36、音壓縮編碼中復(fù)雜程度較低的一種方法。它能32kbit/s數(shù)碼率上達(dá)到符合64kbit/s數(shù)碼率的語(yǔ)音質(zhì)量要求，也就是符合長(zhǎng)途電話的質(zhì)量要求。adpcm是波形編碼中非常有效的一種數(shù)字編碼方式。在adpcm系統(tǒng)中量化器和預(yù)測(cè)器均采用自適應(yīng)方式，即量化器和預(yù)測(cè)器的參數(shù)能隨輸入信號(hào)的統(tǒng)計(jì)特性自適應(yīng)于或接近于最佳的參數(shù)狀態(tài)。與pcm系統(tǒng)相比，adpcm的量化器和預(yù)測(cè)器都是根據(jù)前面出現(xiàn)的pcm抽樣值并對(duì)下一個(gè)抽樣值進(jìn)行預(yù)測(cè)，將當(dāng)前的抽樣值和預(yù)測(cè)值進(jìn)行求差，然后對(duì)差值進(jìn)行編碼。對(duì)差值編碼需要的位數(shù)要比直接對(duì)原始語(yǔ)音信號(hào)編碼所需的位數(shù)少，從而達(dá)到對(duì)信號(hào)壓縮的目的，在這里編碼所包含的信息從原來(lái)的原始語(yǔ)音信號(hào)變?yōu)?/p>

37、語(yǔ)音信號(hào)之間的變化。3.1 脈沖編碼調(diào)制pcmpcm編碼被稱為脈沖編碼調(diào)制，這是在一個(gè)數(shù)字通信的編碼，是最簡(jiǎn)單的波形編碼方法，編碼主要過(guò)程是語(yǔ)音，圖像，對(duì)其進(jìn)行采樣以規(guī)則的間隔上的一些模擬信號(hào)，使該信號(hào)是離散的，在同一時(shí)間的樣值被舍入，根據(jù)分層量化單元的舍入，而在采樣脈沖振幅的采樣值與一組二進(jìn)制碼。 pcm編碼的最大的優(yōu)點(diǎn)是，音質(zhì)好，最大的缺點(diǎn)是笨重。我們常見(jiàn)的音頻cd上使用了pcm編碼。pcm模式是抽樣，量化和編碼三個(gè)基本方面完成。音頻信號(hào)通過(guò)一個(gè)低通濾波器的帶限濾波處理，從取樣，量化和編碼三環(huán)節(jié)完成pcm調(diào)制，來(lái)實(shí)現(xiàn)a / d轉(zhuǎn)換，形成pcm數(shù)字信號(hào)的糾錯(cuò)編碼和調(diào)制，它被記錄在記錄介質(zhì)上。

38、數(shù)碼錄音cd和磁帶介質(zhì)。在播放期間，從記錄介質(zhì)中取出由數(shù)字信號(hào)處理，例如解調(diào)和糾錯(cuò)后，恢復(fù)成pcm數(shù)字信號(hào)，然后由數(shù)/模變換器以及低通濾波器還原成模擬音頻信號(hào)。在cd-pcm的數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào)，以恢復(fù)解碼器 - 被稱為cd-pcm解碼器。脈沖調(diào)制就是將一個(gè)時(shí)間連續(xù),取值連續(xù)的模擬信號(hào)變換成時(shí)間離散,取值離散的數(shù)字信號(hào)后在信道中傳輸。脈沖編碼調(diào)制的過(guò)程就是先對(duì)模擬信號(hào)進(jìn)行抽樣,再對(duì)樣值幅度量化,最后進(jìn)行編碼。模擬信號(hào)的周期性掃描的將時(shí)間連續(xù)信號(hào)轉(zhuǎn)換成離散時(shí)域信號(hào)的過(guò)程稱為采樣。經(jīng)過(guò)模擬信號(hào)采樣的原始信號(hào)也應(yīng)包含的所有信息，能恢復(fù)原來(lái)的模擬信號(hào)無(wú)失真。采樣速率的下限是由抽樣定理來(lái)確定。量化

39、在pcm中所指的就是將一個(gè)經(jīng)過(guò)抽樣后得到的瞬時(shí)值使其幅度離散化,即用一組規(guī)定的電平去表示其瞬時(shí)抽樣值最接近電平的值。通過(guò)采樣的模擬信號(hào)進(jìn)行量化獲得的量化的脈沖幅度調(diào)制信號(hào)，這是一個(gè)預(yù)定電平的樣值來(lái)表示的瞬時(shí)值的最近水平。對(duì)于編碼，使用一個(gè)二進(jìn)制代碼來(lái)表示每個(gè)組有一個(gè)固定的量化電平，但它實(shí)際上是量化同時(shí)在編碼過(guò)程中，因此也可以被稱為編碼處理的模擬/數(shù)字轉(zhuǎn)換，可以是a / d轉(zhuǎn)換的意思。3.2 差分脈沖編碼調(diào)制dpcm差分脈沖編碼調(diào)制記錄的不是信號(hào)的絕對(duì)大小而是相對(duì)大小。因?yàn)橥ǔＧ闆r下的信號(hào)的相對(duì)大小的變化小于信號(hào)本身，那么編碼所用的碼位也就少。假如取樣頻率足夠高的話，那么大多數(shù)連續(xù)采樣之間將產(chǎn)生

40、很大的關(guān)聯(lián)。所以差分系統(tǒng)就利用了這種信息的冗余，不在于記錄信號(hào)的大小，而是去記錄相鄰值之間差值的大小。圖2 dpcm編碼器示意圖差分編碼中使用的預(yù)測(cè)編碼技術(shù)，這個(gè)想法是從輸入中減去預(yù)測(cè)值，然后進(jìn)行量化的預(yù)測(cè)誤差，和最終的代碼的預(yù)測(cè)值和實(shí)際值之間的差值。與過(guò)去的數(shù)據(jù)來(lái)預(yù)測(cè)當(dāng)前樣本，然后使用的錯(cuò)誤代碼來(lái)重建原始樣品的解碼器。此方法使用一個(gè)相對(duì)較小的比特?cái)?shù)，但其性能依賴于它的能力，以適應(yīng)變化的信號(hào)和預(yù)測(cè)編碼方法。為了便于分析，我們需要定義預(yù)測(cè)器的性質(zhì)。按照語(yǔ)音產(chǎn)生模型和數(shù)學(xué)上容易進(jìn)行處理，通常是線性的預(yù)測(cè)，即預(yù)測(cè)輸出x（n）與前量化值的線性組合關(guān)系（9）為簡(jiǎn)單起見(jiàn)，往往可能采取以下的通式（10）在

41、一個(gè)固定的一階預(yù)測(cè)的形式（10）此時(shí)，差分方程滿足于，則系統(tǒng)函數(shù)有（11）當(dāng)系統(tǒng)函數(shù)的式（10）是相當(dāng)于數(shù)字積分器（當(dāng)a =1），且al時(shí)，它們可以被稱為“漏積分器”。大量實(shí)驗(yàn)表明，使用二階預(yù)測(cè)器有可能獲得一個(gè)大信號(hào)噪聲比（snr），即（12）則有（13）該系統(tǒng)函數(shù)有（14）當(dāng)兩個(gè)極點(diǎn)為實(shí)數(shù)時(shí)，就有二階預(yù)測(cè)器的性能高于一階的預(yù)測(cè)器，這種預(yù)測(cè)是通常被稱為“雙積分器”，比較一階預(yù)測(cè)器有4分貝的改善。這種線性預(yù)測(cè)系數(shù)在跟隨語(yǔ)音變化而變化時(shí)，那么它被稱為自適應(yīng)預(yù)測(cè)。自適應(yīng)預(yù)測(cè)有三個(gè)特點(diǎn)：首先，相同的量化的比特?cái)?shù)，信噪比總是大于非預(yù)測(cè)編碼，即，其自適應(yīng)預(yù)測(cè)增益總是大于1。二是它的增益是隨時(shí)間變

42、化的，因?yàn)樗切盘?hào)頻譜函數(shù)，譜的動(dòng)態(tài)范圍越大，其信號(hào)樣本之間相關(guān)性就越強(qiáng)，預(yù)測(cè)增益也就越高。因此，這種預(yù)測(cè)器又被稱之為基于頻譜包絡(luò)的預(yù)測(cè)。三，其量化噪聲是類似于白噪聲，因此輸出噪聲頻譜是平坦的。由2.3小節(jié)可知，自適應(yīng)量化包括前饋?zhàn)赃m應(yīng)量化和反饋?zhàn)赃m應(yīng)量化，同樣，自適應(yīng)預(yù)測(cè)器也可分為前饋?zhàn)赃m應(yīng)和反饋?zhàn)赃m應(yīng)，前饋?zhàn)赃m應(yīng)預(yù)測(cè)器計(jì)算預(yù)測(cè)系數(shù)是通過(guò)誤差（15）最小來(lái)求得。e(n)為線性預(yù)測(cè)誤差，是按照幀時(shí)來(lái)變化的，即按照10到30毫秒為一幀來(lái)決定求和樣本點(diǎn)數(shù)n和系數(shù)，而是式（15）使用了輸入語(yǔ)言信號(hào)，它在其接收端是得不到的，因而其預(yù)測(cè)系數(shù)必須作為邊信息傳輸?shù)浇邮斩?。?duì)反饋?zhàn)赃m應(yīng)預(yù)測(cè)器，預(yù)測(cè)系數(shù)從其序

43、列出發(fā)，使誤差（16）最小得到，由圖3可知，在發(fā)送端與接收端都能得到，所以除了傳送，無(wú)須要任何的附加邊信息傳給接收端。圖3 自適應(yīng)預(yù)測(cè)編碼系統(tǒng)為了清楚可見(jiàn)，現(xiàn)將前饋?zhàn)赃m應(yīng)預(yù)測(cè)和反饋?zhàn)赃m應(yīng)預(yù)測(cè)做一下簡(jiǎn)略的比較。1）效果是前饋反饋?zhàn)赃m應(yīng)預(yù)測(cè)一般稍好，但主要的問(wèn)題的前饋預(yù)測(cè)的發(fā)送到接收器的預(yù)測(cè)系數(shù)，并且，以確保準(zhǔn)確的傳遞，需要適當(dāng)?shù)牧炕途幋a它們，并有效地與結(jié)合起來(lái)，實(shí)現(xiàn)高效率的傳輸，這將使發(fā)件人反饋的預(yù)測(cè)變得更加復(fù)雜，并沒(méi)有這個(gè)問(wèn)題。2）傳輸?shù)恼`碼對(duì)反饋?zhàn)赃m應(yīng)預(yù)測(cè)的編碼影響比較大，在前饋?zhàn)赃m應(yīng)預(yù)測(cè)器中，誤碼不會(huì)影響預(yù)測(cè)器系數(shù)。當(dāng)然，預(yù)測(cè)系數(shù)其傳輸本身也會(huì)出現(xiàn)誤碼，但是它只局限于影響本幀的結(jié)果，在一

44、般情況下，編碼器的預(yù)測(cè)器系數(shù)時(shí)，將采取有效措施，即使發(fā)生誤碼，不會(huì)導(dǎo)致系統(tǒng)不穩(wěn)定。反饋預(yù)測(cè)算法獲得的預(yù)測(cè)系數(shù)，不保證它們形成的合成濾波器的一定的穩(wěn)定性，同時(shí)，又要考慮該算法的收斂性和有限字長(zhǎng)的影響，這將使得相對(duì)復(fù)雜反饋?zhàn)赃m應(yīng)預(yù)測(cè)算法。3.3增量調(diào)制dmdpcm對(duì)輸入信號(hào)與預(yù)測(cè)值之差進(jìn)行編碼，當(dāng)采樣頻率的增加，減少樣品之間的變化，樣本之間的相關(guān)性變強(qiáng)。增量調(diào)制本質(zhì)上是一個(gè)dpcm方法，與一般dpcm兩個(gè)主要區(qū)別是：首先，在delta調(diào)制的波形的采樣率遠(yuǎn)高于奈奎斯特采樣定理確定的采樣率，第二個(gè)是使用兩個(gè)電平值信號(hào)差即1比特量化器。這是在更高的采樣頻率和一個(gè)1-bit編碼。因?yàn)橹挥幸粋€(gè)量化電平來(lái)表示

45、樣本值的變化，以跟蹤信號(hào)的變化，則必須使用上述一般要求相對(duì)高的采樣頻率為200khz，因此，反映差分編碼本身，而不是原來(lái)的信號(hào)。圖4 使用1比特差分碼進(jìn)行編碼的調(diào)制dm，也被稱為調(diào)制器，它是一種預(yù)測(cè)編碼技術(shù)，被pcm編碼的基礎(chǔ)上發(fā)展而來(lái)的，它可以說(shuō)是一個(gè)變化的pcm，pcm編碼的每一個(gè)采樣信號(hào)的幅度是整個(gè)量化和編碼，所以它具有任意波形的編碼能力; dm實(shí)際采樣的采樣信號(hào)的極性之間的實(shí)際差異信號(hào)和預(yù)測(cè)編碼，有關(guān)的極性變成“0”和“1”兩個(gè)可能的值之一。如果實(shí)際的采樣信號(hào)減去采樣信號(hào)預(yù)測(cè)之間的差異是“積極的”（即“積極”的極性），然后用“1”，而是使用“0”。由于只有一個(gè)1-bit的dm編碼的語(yǔ)

46、音信號(hào)進(jìn)行編碼，編碼系統(tǒng)，也被稱為dm“升位系統(tǒng)”?？梢钥闯鰪膱D4中，在開(kāi)始階段，有調(diào)制器的輸出不能跟蹤的輸入信號(hào)的現(xiàn)象非?？焖俚淖兓?，我們稱這種現(xiàn)象為調(diào)制器的“斜率過(guò)載”。一般來(lái)說(shuō)，當(dāng)輸出信號(hào)的反饋環(huán)路中是最大變化速度超過(guò)的輸入信號(hào)的變化率，將有一個(gè)所謂的斜率過(guò)載。發(fā)生這種現(xiàn)象的主要原因，因?yàn)橛闪炕介L(zhǎng)的限制，和量化步長(zhǎng)的大小的變化的輸出信號(hào)的反饋環(huán)路的最大速率是固定的。從圖4可以看出，當(dāng)輸入信號(hào)的變化相對(duì)緩慢，即輸入信號(hào)和預(yù)測(cè)信號(hào)，當(dāng)該差值接近于零，delta調(diào)制器的輸出，有隨機(jī)交替的“0”和“l(fā) “的現(xiàn)象。這種現(xiàn)象被稱為“粒狀噪聲（顆粒噪聲）”調(diào)制器，該噪聲不能被消除。當(dāng)輸入信號(hào)的變化更

47、快，斜率過(guò)載將成為人們關(guān)注的焦點(diǎn)，當(dāng)輸入信號(hào)的變化慢時(shí)，它會(huì)再次成為關(guān)注的焦點(diǎn)粒狀噪聲。因此，為了避免發(fā)生斜率過(guò)載時(shí)，通常有必要增加量化步長(zhǎng)，但這樣做，它會(huì)成為較大的顆粒噪聲，相反，如果你想減少顆粒噪聲，那么它是必要的，以減少量化步長(zhǎng)，這樣就使得斜率過(guò)載會(huì)變得更加嚴(yán)重，因此，促進(jìn)自適應(yīng)增量調(diào)制adm的發(fā)展研究。3.4 自適應(yīng)增量調(diào)制adm自適應(yīng)增量調(diào)制的基本思想就是使增量自適應(yīng)于語(yǔ)音信號(hào)的平均斜率變化，當(dāng)語(yǔ)音信號(hào)波形的平均斜率變大時(shí)，就會(huì)自動(dòng)增大，反之，就會(huì)自動(dòng)減小，從而緩解增量調(diào)制中由于固定引起的矛盾。通常情況下，人耳對(duì)過(guò)載量化噪聲不是很敏感，而對(duì)顆粒噪聲較為敏感，因此就需要將的幅值取得足夠

48、的小。然而，雖然此時(shí)被取得比較小，隨之而來(lái)的過(guò)載噪聲就會(huì)因此增大，所以此時(shí)必須要通過(guò)增加采樣頻率來(lái)確保減少信號(hào)量化過(guò)程中的過(guò)載噪聲，但是如果此時(shí)去提高采樣頻率，又會(huì)使其信息壓縮的效果因此降低。所以綜上兩方面的要求，需要采用一種隨輸入波形自適應(yīng)改變大小的自適應(yīng)編碼方式，從而使得值隨信號(hào)平均斜率變化而變化：當(dāng)斜率大時(shí)，就會(huì)自動(dòng)增大；當(dāng)斜率大時(shí)，就會(huì)自動(dòng)減小。這就是自適應(yīng)增量調(diào)制adm（adaptive dm）。此方法的原理：在一段語(yǔ)音信號(hào)幅值變化不很大的區(qū)間內(nèi)，就取較小的值去抑制顆粒噪音；而在幅值變化比較大的區(qū)間內(nèi)，就取相對(duì)較大的值去減小過(guò)載噪音。它的增量幅度確定方法是，先在顆粒噪音不會(huì)產(chǎn)生大的影

49、響的條件下，確定一個(gè)最小的幅值。在相同符號(hào)持續(xù)產(chǎn)生的情況下，將幅值增加到原來(lái)的2倍。也就是當(dāng)+、+連續(xù)增加時(shí)，若下一個(gè)殘差信號(hào)仍然是相同的符號(hào)，則就再將幅值再次翻番，等等，還要確定最大限幅，只要的振幅的最大值一個(gè)持續(xù)產(chǎn)生相同的符號(hào)將繼續(xù)增加的幅度下來(lái)。如果相反，殘差信號(hào)是一個(gè)不同的符號(hào)，將前一個(gè)原始幅度的1/2作為這一次振幅。即，如果連續(xù)地產(chǎn)生相同的兩個(gè)或更多個(gè)相同的，而第三個(gè)將增加一倍幅，如果它們具有不同的符號(hào)，在的幅值被減小了1/2。此外，不同的電話號(hào)碼時(shí)，繼續(xù)產(chǎn)生時(shí)的振幅減小，已減少到最低限度，以便確定初始振幅極限為止。此adm算法，采樣率至少為16千赫。圖5 連續(xù)0和1引起增量步長(zhǎng)的改

50、變3.5 自適應(yīng)差分脈沖編碼調(diào)制adpcm3.5.1 編碼原理自適應(yīng)差分脈沖編碼調(diào)制就是用預(yù)測(cè)編碼去壓縮數(shù)據(jù)量。其主要結(jié)合了adm的差分信號(hào)和pcm的二進(jìn)制碼的方法，是一種性能非常好的波形編碼。它的核心思想是：一是使用自適應(yīng)量化步長(zhǎng)的想法來(lái)改變其大小，即小的差值用比較小的量化階去編碼，大的差值使用大的量化階去編碼；二是是使用以前的樣值來(lái)估計(jì)即將到來(lái)的下一個(gè)輸入樣本的預(yù)測(cè)值，所以實(shí)際樣本值和預(yù)測(cè)值之間的差已被保持在最低限度。圖6 adpcm原理框圖adpcm編碼的想法是實(shí)際樣本值與預(yù)測(cè)值和預(yù)測(cè)之間的差值被編碼，其量化的方式非均勻量化，并讓不同幅值信號(hào)的信噪比接近一致，以避免語(yǔ)音信號(hào)的小振幅的sn

51、r值是小的，但大幅值語(yǔ)音信號(hào)信噪?yún)s又比較大的現(xiàn)象。它的編碼過(guò)程如圖6所示。向編碼器輸入一個(gè)語(yǔ)音數(shù)據(jù)的16位的二進(jìn)制補(bǔ)碼，這是在32767-32767之間的范圍內(nèi)。為預(yù)測(cè)采樣值，其同線性輸入之間的差值為d。量化的差分量化器，用于產(chǎn)生一個(gè)帶符號(hào)的4的編碼數(shù)據(jù)i，該數(shù)據(jù)的表示7和-7之間的范圍內(nèi)，其特征在于，所述編碼的值的最高位是符號(hào)位的數(shù)據(jù)。編碼時(shí)，首先要計(jì)算出16位二進(jìn)制補(bǔ)碼的當(dāng)前采樣值與上一個(gè)預(yù)測(cè)采樣值的差值d，那么將輸出的4位adpcm值i即為該差值的量化編碼。在該算法的過(guò)程中，將存儲(chǔ)預(yù)測(cè)采樣定義為一個(gè)結(jié)構(gòu)變量，還定義一個(gè)量化步長(zhǎng)索引，并制定兩個(gè)表。一表是索引調(diào)整表，差值量化編碼i作為其輸人

52、，用以更新步長(zhǎng)索引；另一表為步長(zhǎng)調(diào)整表，將步長(zhǎng)索引為其輸人，步長(zhǎng)q為輸出。編碼時(shí)，先用上一個(gè)采樣點(diǎn)的步長(zhǎng)去索引查步長(zhǎng)調(diào)整表求出步長(zhǎng)q。若是當(dāng)前采樣值與采樣預(yù)測(cè)值之間的差值d為負(fù)，那么i的d3位置即最高位為1。假如該差值絕對(duì)值大于步長(zhǎng)q，那么i的d2位置1。若大于，則i的d1位置1，如果大于，則i的d0位置1。如果上述條件沒(méi)有得到滿足，那么相應(yīng)的位置將被設(shè)置為0。這將確定的編碼值i，然后，再將編碼值i作為指標(biāo)，來(lái)作為索引調(diào)整表的輸入，然后輸出索引調(diào)整通過(guò)查表所獲得，并與結(jié)構(gòu)變量中原步長(zhǎng)索引相加，生成新的步長(zhǎng)索引用于編碼下一個(gè)采樣值中使用。編碼輸出i后，還需要重復(fù)進(jìn)行相同的計(jì)算過(guò)程，從而獲得新的預(yù)

53、測(cè)樣本。 3.5.2 解碼原理解碼是編碼的相反的過(guò)程，給出adpcm的解碼過(guò)程框圖如圖7所示。將前面編碼輸出的i作為解碼器的輸入，然后通過(guò)逆量化器將編碼i逆量化成差值。差值和預(yù)測(cè)采樣相加后得到一個(gè)解碼輸出。解碼的過(guò)程和編碼過(guò)程中求圖7 解碼原理框圖預(yù)測(cè)采樣其原理是相同的，如果你想能夠在解碼端的也重現(xiàn)，那么你需要編碼端的能夠很好的跟蹤上。這里所涉及的因素算法本身的延遲和實(shí)施平臺(tái)，實(shí)時(shí)的方法等。解碼過(guò)程：首先求得獲得量化步長(zhǎng)，這個(gè)可以根據(jù)步長(zhǎng)索引查步長(zhǎng)調(diào)整表來(lái)得到，并讓差值量化編碼i經(jīng)過(guò)逆量化器后得到語(yǔ)音差值，這是求i的逆過(guò)程；接著和前次預(yù)測(cè)值一同重建當(dāng)前的語(yǔ)音信號(hào)；最后根據(jù)固定預(yù)測(cè)，更新預(yù)測(cè)采樣

54、，用i去更新量化步長(zhǎng)索引值。4 基于adpcm的語(yǔ)音編解碼設(shè)計(jì)的軟件實(shí)現(xiàn)本章提出了一種基于adpcm的語(yǔ)音編解碼設(shè)計(jì)，確定adpcm實(shí)現(xiàn)的總體設(shè)計(jì)框圖,以及adpcm編碼和解碼實(shí)現(xiàn)過(guò)程的設(shè)計(jì)流程圖, 并采用matlab軟件對(duì)adpcm編解碼系統(tǒng)的實(shí)現(xiàn)進(jìn)行了仿真。4.1 總體設(shè)計(jì)框圖依據(jù)adpcm編解碼的基本原理，得出該設(shè)計(jì)的總體設(shè)計(jì)框圖如圖8所示，首先用電腦自帶錄音軟件錄制一段“.wav”格式語(yǔ)音作為設(shè)計(jì)中的信源即“輸入語(yǔ)音信號(hào)”。用matlab自帶函數(shù)“wavread（文件名）”將語(yǔ)音信號(hào)讀取進(jìn)來(lái)(該函數(shù)讀入即為離散信號(hào))并對(duì)其采樣；然后，用adpcm的編碼方式對(duì)其編碼；再將編碼后的信號(hào)輸入到一個(gè)模擬的信道中模擬傳輸，在輸出端對(duì)信號(hào)進(jìn)行語(yǔ)音還原即adpcm的解碼，并求得原始信號(hào)與編解碼傳輸信號(hào)之后的誤差。圖8 程序框圖該主程序主要代碼如下：y,fs=wavread(lf.wav);sound(y,fs) %播放原始語(yǔ)言y=wavread(lf.wav); %讀入原始語(yǔ)音y1=y(1:1000:1323000 ,1); %采樣bmh=bm(y1); %對(duì)信號(hào)進(jìn)行編碼x=awgn(bmh,20); %加白噪聲模擬信道bmh=round（x）； %濾波取整y=jm(bmh)；

人人文庫(kù)> 全部分類> 生活休閑 > 科普知識(shí)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

(畢業(yè)論文)基于ADPCM的語(yǔ)音編解碼設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

(畢業(yè)論文)基于ADPCM的語(yǔ)音編解碼設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔