




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1 緒論1.1 課題研究的背景和意義隨著社會(huì)時(shí)代的發(fā)展,人類迅速進(jìn)入信息時(shí)代,對(duì)于各種資源的利用率要求越來(lái)越高,從而推動(dòng)了語(yǔ)音編解碼技術(shù)的飛躍發(fā)展。與此同時(shí),伴隨著微電子技術(shù)的快速發(fā)展,以及超大規(guī)模集成電路設(shè)計(jì)技術(shù)的不斷完善,使得語(yǔ)音編解碼技術(shù)越來(lái)越廣泛的深入到通信領(lǐng)域、消費(fèi)電子領(lǐng)域,辟如數(shù)字錄音筆、ip電話、復(fù)讀機(jī)等等都是語(yǔ)音壓縮編碼技術(shù)的典型應(yīng)用。語(yǔ)音編碼技術(shù)就是將模擬的語(yǔ)音信號(hào)數(shù)字化離散化,利用語(yǔ)音聽(tīng)覺(jué)上的制約或者數(shù)據(jù)的冗余度來(lái)壓縮信號(hào)的一些不必要的信息,以此來(lái)增加傳輸速率、減少存儲(chǔ)容量,然后再進(jìn)行傳輸、存儲(chǔ)或者處理,而解碼就是相反的一個(gè)過(guò)程。adpcm是自適應(yīng)差分脈沖編碼調(diào)制的簡(jiǎn)稱,是
2、語(yǔ)音編碼的多種算法中的一種,更是最早使用于數(shù)字通信系統(tǒng)中的一種語(yǔ)音編解碼算法。此算法利用了語(yǔ)音信號(hào)樣點(diǎn)間的相關(guān)性,針對(duì)語(yǔ)音信號(hào)的非平穩(wěn)特點(diǎn),使用了自適應(yīng)預(yù)測(cè)和自適應(yīng)量化,即預(yù)測(cè)器和量化器它們的參數(shù)能隨著輸入信號(hào)的統(tǒng)計(jì)特性,自適應(yīng)于或接近于最佳的參數(shù)狀態(tài),在32kbps的速率上能夠給出網(wǎng)絡(luò)等級(jí)話音質(zhì)量。adpcm究其本質(zhì)是一種針對(duì) 16bits( 或8bits或者更高) 聲音波形數(shù)據(jù)的一種有損壓縮算法,它可以將聲音流中每次采樣的 16bit 數(shù)據(jù)用4bit 來(lái)存儲(chǔ),所以其壓縮比為 1:4。而且它的壓縮/解壓縮算法非常簡(jiǎn)單,所以又是一種低空間消耗、高質(zhì)量高效率聲音獲得的好途徑。adpcm 其主要是
3、針對(duì)連續(xù)波形數(shù)據(jù)的,保存的則是波形的變化情況,從而以達(dá)到描述整個(gè)波形的目的。1.2語(yǔ)音編碼的發(fā)展和研究狀況 數(shù)字語(yǔ)音有很多的優(yōu)點(diǎn)是模擬語(yǔ)音不可比擬的,它能更方便的傳輸和存儲(chǔ),可以在噪聲信道中進(jìn)行相當(dāng)可靠的傳輸,容易進(jìn)行交換,能夠很方便的對(duì)信號(hào)進(jìn)行加密傳輸。數(shù)字語(yǔ)音可以由模擬語(yǔ)音簡(jiǎn)單的抽樣,量化來(lái)得到,但由于數(shù)字語(yǔ)音其數(shù)據(jù)量比較大如果不經(jīng)過(guò)處理,那它在傳輸和存儲(chǔ)時(shí)就會(huì)占用很大量的信道資源以及存儲(chǔ)空間,那么給系統(tǒng)提出的要求勢(shì)必就會(huì)很高,所以數(shù)字語(yǔ)音通常情況下都是要進(jìn)行壓縮編碼的。在確保編碼語(yǔ)音一定質(zhì)量的前提下,究竟如何高效率進(jìn)行壓縮編碼,或者說(shuō)在給定信息速率的前提下,如何去提高編碼后的語(yǔ)音質(zhì)量,是
4、當(dāng)代語(yǔ)音編碼所要研究的重點(diǎn)。 語(yǔ)音編碼技術(shù)一般分為兩種:信源編碼和信道編碼。信源編碼的目的是為了提高信號(hào)的傳輸和存儲(chǔ)效率,在這指的就是數(shù)字語(yǔ)音信號(hào)被壓縮的比特率(即每秒鐘傳輸語(yǔ)音信號(hào)所得出的比特?cái)?shù),通常也可以稱為數(shù)碼率),使得更多路的語(yǔ)音信號(hào)能在同樣的信道容量中傳輸,或者說(shuō)只需要較小的容量存儲(chǔ)數(shù)字語(yǔ)音信號(hào),所以這一類編碼又被稱為語(yǔ)音信號(hào)的壓縮編碼。而信道編碼因?yàn)槭菫榱颂岣邆鬏數(shù)目煽啃远鞒龅奶幚恚杂直环Q為可靠性編碼。語(yǔ)音信號(hào)編碼從方法上講有波形編碼和分析合成系統(tǒng)兩大分支。波形編碼是以盡最大可能無(wú)失真的重構(gòu)出語(yǔ)音波形為目標(biāo),在其編碼時(shí)以波形逼近為基本原則,在時(shí)域上或變換域上直接進(jìn)行編碼,雖然
5、這種方法壓縮效率不很高,但是在6416kb/s 的速率上,卻可以合成出相當(dāng)高的語(yǔ)音質(zhì)量,然而在速率進(jìn)一步下降時(shí),編碼語(yǔ)音的質(zhì)量將會(huì)隨之大幅度下降。常用的波形編碼算法有:時(shí)域上編碼的pcm(pulse code modulation),adpcm,apc(adaptive predictive coding); 在頻域上進(jìn)行編碼的子帶編碼sbc(sub-band coding)和自適應(yīng)變換編碼atc(adaptive transform cording)。分析合成系統(tǒng)是把語(yǔ)音信號(hào)產(chǎn)生模型作為基礎(chǔ),把語(yǔ)音信號(hào)變換成模型參數(shù)后再進(jìn)行編碼,因此又稱之為參數(shù)編碼。參數(shù)編碼其出發(fā)點(diǎn)同波形編碼有所不同,它的
6、原則是以在盡量保持語(yǔ)音可懂度的條件下,為語(yǔ)音信號(hào)搭建一個(gè)數(shù)學(xué)模型,然后通過(guò)給定的語(yǔ)音信號(hào)計(jì)算模型參數(shù)并且量化編碼來(lái)實(shí)現(xiàn)。而且它的模型參數(shù)對(duì)比于語(yǔ)音波形來(lái)說(shuō)數(shù)據(jù)量是很小的,因而其壓縮效率很高。雖然也許參數(shù)編碼會(huì)導(dǎo)致重建話音和原始語(yǔ)音在它時(shí)域波形上有很大的區(qū)別,但它的可懂度仍然可以保持在一個(gè)相當(dāng)高的程度。現(xiàn)在,還時(shí)常采用混合編碼的方案,混合編碼是波形編碼和參數(shù)編碼優(yōu)點(diǎn)的結(jié)合,這種結(jié)合是保留分析合成編碼技術(shù)精華的基礎(chǔ),引用波形編碼準(zhǔn)則優(yōu)化激勵(lì)源信號(hào),從而在一個(gè)較小的數(shù)碼率上(4.89.6kbit/s)獲得更高質(zhì)量的合成語(yǔ)音。 自1937年以來(lái)的脈沖編碼調(diào)制(pcm)是ah里夫斯已經(jīng)提出,語(yǔ)音編碼技術(shù)
7、的發(fā)展歷史已經(jīng)超過(guò)60年。尤其是在過(guò)去的20年里,隨著計(jì)算機(jī)的語(yǔ)音編碼技術(shù)和微電子技術(shù)的發(fā)展得到了快速發(fā)展。64kbit/s的pcm系統(tǒng)標(biāo)準(zhǔn)ccitt于1972年確定了64kbit/s的pcm語(yǔ)音編碼g. 711建議,已被廣泛應(yīng)用于數(shù)字交換機(jī),數(shù)字通訊等領(lǐng)域,到現(xiàn)在為止,仍然是占主導(dǎo)地位。雖然這種編碼方法可以得到良好的語(yǔ)音質(zhì)量,但缺點(diǎn)是,它會(huì)占用更多的帶寬,有限的帶寬資源條件下不使用。ccitt在20世紀(jì)80年代初,就開(kāi)始專攻小于64kb/s的非pcm編碼算法,32k比特/秒adpcm語(yǔ)音編碼g. 721建議,于1984年通過(guò),它不僅可以實(shí)現(xiàn)與pcm等效語(yǔ)音質(zhì)量,還更好的抗誤碼性能,它被廣泛用
8、于海底電纜,衛(wèi)星,和可變速率的數(shù)字語(yǔ)音內(nèi)插編碼器清空設(shè)備。連續(xù)地,在那之后,1986年,1988,做了進(jìn)一步的修改在此,也可以是32k比特/秒的pcm比特率,一般是高速率的一半,達(dá)到接近正常的pcm語(yǔ)音質(zhì)量,防誤性能優(yōu)于pcm格式。隨后頒布g. 723標(biāo)準(zhǔn),擴(kuò)大到24kbit/s和40kbit/s的編碼標(biāo)準(zhǔn)稅率。 1990年g. 723,g. 721由itu合并,將進(jìn)一步擴(kuò)展的編碼率16kbit /秒,從而促進(jìn)g. 726標(biāo)準(zhǔn)形成的。語(yǔ)音插值技術(shù)和浮動(dòng)利率結(jié)合原來(lái)的pcm通道的adpcm編碼,可擴(kuò)展到8-10倍,稱之為數(shù)字語(yǔ)音通道倍增設(shè)備dcme。 g. 726標(biāo)準(zhǔn)算法不僅簡(jiǎn)單,但高品質(zhì)的聲音
9、,即使在經(jīng)過(guò)反復(fù)的切換,以確保他們的聲音質(zhì)量,所以網(wǎng)絡(luò)會(huì)議系統(tǒng),8-isdn通信和voip網(wǎng)絡(luò)通信等方面具有廣泛的應(yīng)用。然后16kb/s的低時(shí)延碼激勵(lì)線性預(yù)測(cè)(ld-celp)g. 728建議,在1992年出版。正是由于其較低的利率,高性能,低延遲在實(shí)踐中廣泛使用,如:?jiǎn)温穯屋d波衛(wèi)星,無(wú)繩電話和數(shù)字插值空氣設(shè)備,海事衛(wèi)星通信,存儲(chǔ),數(shù)字移動(dòng)無(wú)線系統(tǒng),分組語(yǔ)音,轉(zhuǎn)發(fā)系統(tǒng),語(yǔ)音留言錄制。最后,在11月1995年共軛代數(shù)碼激勵(lì)線性預(yù)測(cè)(cs-acelp)8kb/s的語(yǔ)音編碼g. 729建議itu-tsgl5全體會(huì)議通過(guò),并通過(guò)g. 729附件降低復(fù)雜8kb/s的cs-acelp講話編解碼器在itu-
10、tsgl5 1996年6月的會(huì)議上正式成為國(guó)際標(biāo)準(zhǔn)。這種編碼其延遲小,可以節(jié)省帶寬的87.5,為32kb/s的adpcm語(yǔ)音質(zhì)量,音質(zhì)在同級(jí)別最優(yōu)的比特率,在嘈雜的環(huán)境中也可以更好的語(yǔ)音質(zhì)量。雖然csacelp語(yǔ)音編解碼器占用比特率比adpcm的少,但是其算法復(fù)雜度遠(yuǎn)沒(méi)有adpcm的算法簡(jiǎn)單明了,所以在現(xiàn)代通信系統(tǒng)中,adpcm這種編碼算法仍然占主導(dǎo)地位。1.3 語(yǔ)音壓縮編碼的評(píng)價(jià)語(yǔ)音質(zhì)量是一個(gè)語(yǔ)音編碼系統(tǒng)必然要保證的性能指標(biāo),速率再低,編碼效率再高,不能得到滿意的語(yǔ)音質(zhì)量也不能算是一個(gè)優(yōu)良的編碼算法。那么,在語(yǔ)音壓縮編碼中,怎樣評(píng)價(jià)一個(gè)語(yǔ)音壓縮質(zhì)量的好壞就成為了是一個(gè)極其重要的概念,通常,評(píng)
11、價(jià)語(yǔ)音壓縮的標(biāo)準(zhǔn)主要有以下幾點(diǎn):1)語(yǔ)音質(zhì)量語(yǔ)音質(zhì)量的評(píng)價(jià)方法可分為主觀評(píng)定和客觀評(píng)定兩大類。客觀評(píng)定方法用客觀測(cè)量的手段來(lái)評(píng)價(jià)語(yǔ)音編碼質(zhì)量,常用的方法有均方誤差、信噪比、加權(quán)信噪比、平均分段信噪比等。主觀評(píng)定方法是用人們自身去感受語(yǔ)音質(zhì)量的感覺(jué),然后主觀評(píng)判其語(yǔ)音壓縮編碼的質(zhì)量。2)編碼速率編碼速率,可以使用“比特/秒”(比特/秒或bps)的措施,即總速率編碼,通常用i表示,即每秒的編碼比特的數(shù)量。3)編解碼復(fù)雜度所謂編解碼的復(fù)雜度指的就是實(shí)現(xiàn)一個(gè)信號(hào)編解碼算法的難易程度。編解碼算法的復(fù)雜程度和語(yǔ)音編碼的話音質(zhì)量有著相當(dāng)密切的聯(lián)系。在一個(gè)相同的數(shù)碼率情況下,算法復(fù)雜一些的將會(huì)獲得更好的語(yǔ)音質(zhì)
12、量。編解碼復(fù)雜度可以由算法復(fù)雜程度、硬件實(shí)現(xiàn)及價(jià)格等許多因素來(lái)衡量。4)編解碼延時(shí)數(shù)字音頻編解碼器的延遲主要由兩部分組成:算法延遲和處理延遲。之前的壓縮的音頻信號(hào)到高速緩存中的數(shù)據(jù)必須是有效的,這個(gè)時(shí)間延遲稱為算法延遲,它是不是唯一的方法,以減少通過(guò)改變延遲時(shí)間。即,音頻信號(hào)壓縮編碼器和解碼器的編解碼器的實(shí)現(xiàn)在不同的應(yīng)用程序所需的時(shí)間的處理延遲,國(guó)際社會(huì)已延時(shí)的編解碼器不同的要求,如長(zhǎng)途編解碼器延遲不超過(guò)5-10毫秒,但對(duì)于可視電話可以擴(kuò)展到幾十毫秒到幾百毫秒。5)穩(wěn)健性(robustness)所謂穩(wěn)健性是指編譯碼系統(tǒng)的抗噪聲、抗信道誤碼能力。一個(gè)實(shí)用的聲碼器,其誤碼率要求在10-3的信道上傳
13、輸時(shí),語(yǔ)音質(zhì)量不至于過(guò)分惡化,而對(duì)于移動(dòng)通信中的聲碼器則要求在信道誤碼率為310-2時(shí)仍能正常工作。adpcm就語(yǔ)音質(zhì)量的評(píng)價(jià)上來(lái)說(shuō),語(yǔ)音質(zhì)量的客觀評(píng)價(jià)方法主要采用均方誤差和信噪比來(lái)評(píng)定。但客觀評(píng)價(jià)還不能全面反映人對(duì)語(yǔ)音質(zhì)量的感覺(jué),而主觀評(píng)定方法符合人們對(duì)語(yǔ)音質(zhì)量感覺(jué)的要求。主觀評(píng)價(jià)的優(yōu)越性,主要體現(xiàn)在其處理還原后給人主觀感覺(jué)效果很好,感覺(jué)語(yǔ)音失真度?。痪途幋a速率來(lái)講,adpcm的編碼速率為16kb/s,優(yōu)于其他編碼方式;就其編解碼的復(fù)雜度而言,adpcm采用四位二進(jìn)制的差值編碼方式,使用起來(lái)簡(jiǎn)單又容易實(shí)現(xiàn);它的抗噪能力也比較強(qiáng)即穩(wěn)健性相當(dāng)好。1.4 論文研究的主要內(nèi)容及章節(jié)內(nèi)容安排本論文研究
14、的內(nèi)容是語(yǔ)音編解碼的算法及軟件實(shí)現(xiàn)過(guò)程,主要是研究adpcm的語(yǔ)音編解碼算法及在matlab軟件中的實(shí)現(xiàn)。論文共分4章,各章內(nèi)容安排如下:第一章:簡(jiǎn)要介紹課題研究背景和意義,語(yǔ)音編解碼的發(fā)展和研究狀況以及它的評(píng)價(jià)標(biāo)準(zhǔn)。第二章:主要介紹語(yǔ)音信號(hào)脈沖編碼基本理論,為對(duì)語(yǔ)音進(jìn)行adpcm編碼譯碼系統(tǒng)提供理論依據(jù)。第三章:介紹pcm與dpcm(differential pulse code modulation)的工作原理,并對(duì)二者進(jìn)行比較,從而體現(xiàn)出dpcm編碼的優(yōu)越性。接著介紹增量調(diào)制dm(delta modulation)及自適應(yīng)增量調(diào)制adm(adaptive delta modulation
15、)的原理與運(yùn)用,二者比較得出adm更容易跟蹤信號(hào)變化快的的語(yǔ)言,最后闡述了adpcm的由來(lái)及主要原理。第四章:確定adpcm實(shí)現(xiàn)的總體設(shè)計(jì)框圖,以及adpcm編碼和解碼實(shí)現(xiàn)過(guò)程的設(shè)計(jì)流程圖, 并采用matlab軟件對(duì)adpcm編解碼系統(tǒng)的實(shí)現(xiàn)進(jìn)行了仿真。2 語(yǔ)音信號(hào)脈沖編碼基本理論當(dāng)前最主要的通信業(yè)務(wù)有電話、圖像(傳真、電視)等,它們都是時(shí)間上和幅度上連續(xù)的模擬信號(hào),如果要想實(shí)現(xiàn)數(shù)字化的傳輸和交換,則首先要做的就是把模擬信號(hào)變化成數(shù)字信號(hào),電話信號(hào)數(shù)字化一般被稱為語(yǔ)音編碼,而圖像信號(hào)數(shù)字化就被稱為圖像編碼。雖然兩者各有各的特點(diǎn),但兩者的編碼原理基本上仍然是一致的。而當(dāng)前的通信網(wǎng)中很多業(yè)務(wù)基本上
16、都是電話業(yè)務(wù),因此語(yǔ)音編碼將為本章討論的重點(diǎn)??梢哉f(shuō)這些理論對(duì)任何模擬信號(hào)數(shù)字化的實(shí)現(xiàn)過(guò)程都是適用的,其不失一般意義。依照語(yǔ)音的特點(diǎn),通常把語(yǔ)音編碼方法分為波形編碼和參量編碼,波形編碼是指對(duì)信號(hào)的波形進(jìn)行編碼,它具有較高重建信號(hào)質(zhì)量的能力。參量編碼則是通過(guò)提取語(yǔ)音信號(hào)的一些特征參量,從而對(duì)其進(jìn)行編碼,它的特點(diǎn)是碼速率較低,但其語(yǔ)音質(zhì)量要較波形編碼差一些。 波形編碼的質(zhì)量比較高,通常在3003400hz話路通道中傳輸模擬信號(hào)(例如模擬數(shù)據(jù)信號(hào)、電話信號(hào)、傳真信號(hào)及各種隨路信令信號(hào)等)在數(shù)字化以后,仍然可以達(dá)到原來(lái)的質(zhì)量容限。這一特點(diǎn)是通信網(wǎng)由模擬轉(zhuǎn)換為數(shù)字過(guò)渡過(guò)程中極其重要的一點(diǎn)。根據(jù)語(yǔ)音的特性
17、,通常分為波形編碼和參數(shù)編碼類型的兩類語(yǔ)音編碼方法,波形編碼,用于編碼的信號(hào)波形,它具有更高的能力來(lái)重建信號(hào)的質(zhì)量。參數(shù)編碼是通過(guò)提取語(yǔ)音信號(hào)的參數(shù)的一些特點(diǎn),從而編碼,它的特點(diǎn)是較低的比特率,但不如波形編碼的語(yǔ)音質(zhì)量。波形編碼質(zhì)量是比較高的,通常會(huì)在通道3003400hz傳輸各種模擬信號(hào)(如模擬數(shù)據(jù)信號(hào),電話信號(hào),傳真信號(hào),與信道相關(guān)信令的各種信號(hào))后的數(shù)字仍實(shí)現(xiàn)其原來(lái)的質(zhì)量寬容。的通信網(wǎng)絡(luò),其特征在于由模擬到數(shù)字的轉(zhuǎn)換是非常重要的。語(yǔ)音信號(hào)有很多波形編碼方法,例如脈沖編碼調(diào)制(pcm)、自適應(yīng)增量調(diào)制(adm)、自適應(yīng)差值脈沖編碼調(diào)制(adpcm)、子帶編碼(sbc)、矢量編碼(vqc:v
18、ector quantitation coding)等。為對(duì)語(yǔ)音進(jìn)行adpcm編碼譯碼系統(tǒng)提供理論依據(jù),下面主要介紹編碼的一些基本理論。2.1 語(yǔ)音信號(hào)壓縮的基本原理在數(shù)字通信中,語(yǔ)音信號(hào)被編碼為二進(jìn)制數(shù)字序列,通過(guò)信道傳輸或存儲(chǔ),在經(jīng)過(guò)解碼后恢復(fù)為可懂的語(yǔ)音。將語(yǔ)音信號(hào)編碼為二進(jìn)制數(shù)字序列后再經(jīng)傳輸或儲(chǔ)存有其獨(dú)特的優(yōu)點(diǎn)。例如,可擺脫傳輸或存儲(chǔ)中噪聲的干擾。模擬傳輸信道的噪聲總是要使語(yǔ)音信號(hào)發(fā)生畸變,而數(shù)字通信只要有足夠的通信站,就能排除所有噪聲的影響;另一方面,磁帶錄音機(jī)存儲(chǔ)模擬信號(hào)時(shí)要受磁帶噪聲和其他噪聲的影響,而采用計(jì)算機(jī)存儲(chǔ)數(shù)字語(yǔ)音信號(hào)時(shí),惟一的失真來(lái)自模數(shù)轉(zhuǎn)換前的低通濾波。另外,數(shù)字
19、編碼的信號(hào)還便于處理和加密、再生與轉(zhuǎn)發(fā),也可與其他信號(hào)復(fù)用一個(gè)信道,設(shè)備便于集成等。最簡(jiǎn)單的語(yǔ)音編碼方法是對(duì)其直接進(jìn)行模/數(shù)變換;只要其取樣率足夠高,量化每個(gè)樣本的比特?cái)?shù)足夠大,那么就能保證解碼恢復(fù)的語(yǔ)音信號(hào)有非常好的音質(zhì),而且也不會(huì)丟失有用信息。可是對(duì)語(yǔ)音信號(hào)直接進(jìn)行數(shù)字化其所需數(shù)碼率太高,比如普通電話通信中采用8khz取樣率,如用12bit進(jìn)行量化,則數(shù)碼率為96kbit/s,這樣大的數(shù)碼率即使對(duì)很大容量的傳輸信道也是難以承受的。而語(yǔ)音信號(hào)用pcm編碼后,數(shù)碼率為64kbit/s,不進(jìn)行壓縮很難用調(diào)制解調(diào)器在電話線路上傳輸,所以必須進(jìn)行壓縮編碼。對(duì)語(yǔ)音進(jìn)行編壓縮碼的基本依據(jù)有兩個(gè)。一是,從
20、產(chǎn)生的物理機(jī)理和語(yǔ)音結(jié)構(gòu)的性質(zhì)來(lái)看,語(yǔ)音信號(hào)中存在較大的冗余度。從信息保持的角度講,只有當(dāng)信源本身具有冗余度,才能對(duì)其進(jìn)行壓縮。語(yǔ)音壓縮實(shí)質(zhì)上就是識(shí)別語(yǔ)音中的冗余度并設(shè)法去除掉它們。冗余度最主要部分可以分別從時(shí)域或頻域來(lái)考慮,歸納起來(lái)有以下幾個(gè)方面:1,語(yǔ)音信號(hào)樣本間的相關(guān)性很強(qiáng),即其短時(shí)譜不平坦。2,濁音語(yǔ)音段具有準(zhǔn)周期性。3,聲道的形狀及其變化比較慢。4,傳輸碼值的概率分布是非均勻的。語(yǔ)音編碼的第二個(gè)依據(jù)是利用人類聽(tīng)覺(jué)的某些特性。人耳聽(tīng)不到或感知不靈敏的語(yǔ)音分量可視為冗余(這種冗余可看作為主觀上的冗余),所以可以利用人耳感知模型,去除掉人耳感覺(jué)不靈敏的語(yǔ)音分量,而重構(gòu)后的語(yǔ)音質(zhì)量不明顯下降
21、??傊?,利用冗余度或者是聽(tīng)覺(jué)上的制約,可以壓縮表示語(yǔ)音信號(hào)的必要信息,從而可降低傳輸速率或存儲(chǔ)容量。下面給出脈沖編碼的基本框圖:圖1 模擬脈沖編碼框圖2.2 采樣定理2.2.1 nyquist采樣定理采樣是指將時(shí)間上連續(xù)的模擬信號(hào)變?yōu)闀r(shí)間上離散樣值的過(guò)程。采樣定理最主要要回答的問(wèn)題是看能不能由離散樣值序列重建出原始的模擬信號(hào)。且抽樣定理還是任何模擬信號(hào)數(shù)字化的理論基礎(chǔ)。其主要有以下幾種:nyquist采樣定理;帶通采樣定理;自然采樣平頂采樣。接下來(lái)簡(jiǎn)單的介紹一下nyquist采樣定理和帶通采樣定理。 nyquist采樣定理:設(shè)定一個(gè)頻率帶限信號(hào)為,將其頻帶限制在(0, )或以下,若對(duì)以不低于的
22、采樣速率進(jìn)行等間隔采樣,那么獲得時(shí)間離散的采樣信號(hào) (其中稱為采樣間隔), 通過(guò)所得到的采樣值原信號(hào)將完全的確定。 奈奎斯特采樣定理指出,如果信號(hào)是一個(gè)不小于2倍的采樣率進(jìn)行采樣的,則由所得到的離散采樣值就可以唯一的恢復(fù)原信號(hào)。根據(jù)抽樣理論,使采樣信號(hào)通過(guò)一個(gè)低通濾波器,其帶寬不小于,過(guò)濾掉高頻成分,因此它可以恢復(fù)的原始信號(hào)的無(wú)失真的從中。隨著時(shí)間離散采樣值來(lái)代替連續(xù)時(shí)間模擬信號(hào)的采樣定理的意義是,這將模擬信號(hào)處理數(shù)字化奠定了理論基礎(chǔ)。2.2.2 帶通信號(hào)采樣nyquist采樣定理僅僅討論了頻譜分布在(0, )上的基帶信號(hào)的采樣問(wèn)題, 但在實(shí)踐中,我們遇到的信號(hào),尤其是語(yǔ)音信號(hào)中,通常會(huì)在一個(gè)
23、有限的頻帶(, )范圍內(nèi)的信號(hào)的帶通頻率分布,由奈奎斯特采樣定理,依然能按照的采樣速率去進(jìn)行采樣。當(dāng)時(shí),即當(dāng)信號(hào)最高頻率遠(yuǎn)遠(yuǎn)大于該信號(hào)帶寬b時(shí),若仍然按照nyquist采樣率去進(jìn)行采樣的話,那么它的采樣頻率就會(huì)變得很高,從而就很難去實(shí)現(xiàn), 或隨后的處理速度是非常困難符合要求的。帶通采樣定理:設(shè)一個(gè)帶限信號(hào),將其頻帶限制在(,)范圍內(nèi),若其采樣速率關(guān)系式滿足: (1) 其中n為整數(shù),其取值區(qū)間為:0,n,n為/b的整數(shù)部分。那么的頻譜將不會(huì)發(fā)生混疊,即能從中無(wú)失真的恢復(fù)出。從以上采樣定理中很容易推導(dǎo)出最低采樣率(2)(當(dāng)n=最大值n時(shí), 最小),且又由式可以得知:帶通采樣頻率最小值在2b到4b之
24、間,即 (3)通常,當(dāng)帶通信號(hào)的帶寬比信號(hào)的最低頻率大時(shí),就可將此信號(hào)作為低通信號(hào)處理。只有當(dāng)不滿足上述條件時(shí)才使用帶通抽樣定理。2.3 量化定理2.3.1 基本概念量化是指將一個(gè)幅度連續(xù)變化的信號(hào)變?yōu)橐粋€(gè)離散信號(hào)的過(guò)程。由于用有限長(zhǎng)度的二進(jìn)制數(shù)字碼組表示模擬信號(hào)樣值是pcm的數(shù)字化過(guò)程,然而有限長(zhǎng)度的二進(jìn)制數(shù)字碼組又只能代表有限數(shù)量的樣值,所以若要用有限的數(shù)量樣值去表示原模擬信號(hào)無(wú)限個(gè)幅度抽樣值,那么就需要對(duì)其進(jìn)行量化。量化的方法就是,將所需量化樣值的最大變化范圍分成若干個(gè)相鄰區(qū)間段落,當(dāng)其樣值落在某一間區(qū)間內(nèi),它的輸出數(shù)值就用此區(qū)間內(nèi)的某一個(gè)單一固定值來(lái)表示。量化間隔可以是相等的,也可以是
25、不相等的,一般有均勻量化和非均勻量化兩種量化方法。從量化結(jié)果可以發(fā)現(xiàn),不論量化的間隔有多么小,都會(huì)帶來(lái)一定的誤差,隨之就產(chǎn)生了量化噪聲。雖然將量化間隔取得較小,量化級(jí)數(shù)會(huì)因此變多從而能減小一定的量化誤差,但與此同時(shí),也會(huì)相應(yīng)的增加數(shù)碼率,提高編碼設(shè)備的復(fù)雜程度,而且需要較寬的傳輸信道。例如,對(duì)語(yǔ)音信號(hào),其抽樣速率為,如果每個(gè)樣值編碼8位,量化共有256個(gè)量化間隔,每路語(yǔ)音pcm編碼后的數(shù)碼率為8x8=64kib/s;如果每位樣值編11位碼,數(shù)碼率提高到88kbit/s。2.3.2 均勻量化均勻量化也叫線性量化,它在量化時(shí)各量化間隔是相等的。任意一個(gè)量化器都會(huì)有一定的量化范圍,通常取-vv。在均
26、勻量化的情況下與, 量化間隔()和量化級(jí)數(shù)n的關(guān)系為: (4)通常情況下每一個(gè)量化間隔內(nèi)的量化值可以取此區(qū)間內(nèi)的任意一值,但是理論上為了減小平均量化誤差功率, 一般量化值的取值會(huì)取量化間隔中間值,那么這樣量化的最大誤差便為/2。一般來(lái)說(shuō),信源碼都是二元碼,所以其碼位n與量化級(jí)數(shù)n的關(guān)系為,即。對(duì)于均勻量化的量化間隔或是量化電平用n位碼表示,就得到了數(shù)字編碼信號(hào),通常稱為線性pcm編碼信號(hào)。2.3.3 非均勻量化非均勻量化是一種量化間隔取決于使用不同信號(hào)的,在信號(hào)幅度值比較小的區(qū)間內(nèi)就采用小的量化間隔,而在信號(hào)幅值比較大的區(qū)間內(nèi)則采用大的量化間隔,量化間隔不再是一個(gè)恒定值。非均勻量化較均勻量化方
27、法具有以下兩個(gè)優(yōu)點(diǎn):a)當(dāng)對(duì)一個(gè)概率密度非均勻分布的語(yǔ)音信號(hào)進(jìn)行量化時(shí),非均勻量化方式就可以得到較高的平均信號(hào)量化噪聲功率比。b) 在非均勻量化,量化噪聲的語(yǔ)音信號(hào)的rms值的功率大致成比例的采樣,即,量化的或大或小的語(yǔ)音信號(hào)的量化噪聲信號(hào)的方法,無(wú)論水平是相同的,即改善均勻量化的聲音時(shí),小信號(hào)量化噪聲比。非均勻量化小的用于小信號(hào)的量化噪聲,以確保在同一時(shí)間有一定的限制,在量化過(guò)程中,有足夠的動(dòng)態(tài)范圍的量化比特?cái)?shù)并沒(méi)有把一個(gè)大的信號(hào)過(guò)載。如果我們知道的語(yǔ)音信號(hào)的幅度的概率密度函數(shù)的序列,我們可以設(shè)計(jì)給定的量化比特?cái)?shù)的量化噪聲是最小的非均勻量化器。輸入語(yǔ)音信號(hào)的方差和概率密度函數(shù)進(jìn)行量化,與量化
28、的質(zhì)量密切相關(guān),我們需要通過(guò)量化方法一種受二者影響較小的,目前在這方面的杰出貢獻(xiàn)的,我們經(jīng)??吹降腶律或律量化。非均勻量化的過(guò)程中,可以等效地視為非線性的壓縮語(yǔ)音信號(hào)的振幅,然后的線性量化處理。非線性壓縮方法是目前理想的對(duì)數(shù)壓縮。所謂的對(duì)數(shù)壓縮,也就是說(shuō),要量化的對(duì)數(shù)壓縮的語(yǔ)音信號(hào)的振幅值,振幅的第一語(yǔ)音信號(hào)的對(duì)數(shù),然后量化值,提高量化器的動(dòng)態(tài)范圍。在解碼側(cè),通過(guò)過(guò)程的逆過(guò)程 - 恢復(fù)的話音消息的采樣的指數(shù)函數(shù)的對(duì)數(shù)。僅取自量化步長(zhǎng)的量化噪聲對(duì)數(shù)壓縮,從該語(yǔ)音信號(hào)的方差。然而,其值的對(duì)數(shù)的語(yǔ)音信號(hào)的振幅可能很大,需要定量或定量的特定的量化比特的電平,以便對(duì)數(shù)壓縮更難以實(shí)現(xiàn)。可將對(duì)數(shù)壓縮特性作些
29、近似,這樣才有了后來(lái)的律的壓縮方式:先將語(yǔ)音抽樣信號(hào)作公式(5)變換得到,量化器再對(duì)進(jìn)行量化。 (5)當(dāng)時(shí), 當(dāng)時(shí), 當(dāng)時(shí), 輸入輸出信號(hào)相同,即沒(méi)有進(jìn)行壓縮,信號(hào)子幅度范圍即量化電平均勻分布;當(dāng)很大,并且也很大時(shí),則有: (6)此時(shí)的律量化器的信噪比可推導(dǎo)為: (7)由上述公式可知: 律量化器信噪比與關(guān)系不大。大量實(shí)驗(yàn)結(jié)果表明,對(duì)于一個(gè)固定的值,若減為二分之一,則減少6db;而對(duì)于一個(gè)固定的值,碼每增加一位,則增加6db。律量化器以量化信噪比作較小犧牲為代價(jià),使量化器有一個(gè)比較寬的動(dòng)態(tài)范圍。通常作為“長(zhǎng)途電話質(zhì)量”語(yǔ)音波形標(biāo)準(zhǔn)的7位律pcm在動(dòng)態(tài)范圍合適的情況下保持有34db的信噪比。而若用
30、均勻量化器得到同樣寬度的動(dòng)態(tài)范圍,大約需要11位,比律量化器高出50%還多。2.3.4自適應(yīng)量化一方面,在語(yǔ)音信號(hào)中的量化器的量化步長(zhǎng),從選定的足夠大,以適應(yīng)動(dòng)態(tài)范圍;另一方面,希望減小量化步長(zhǎng),以減少量化噪聲相差。這種現(xiàn)象的原因是語(yǔ)音信號(hào),語(yǔ)音通信過(guò)程是不固定的。與揚(yáng)聲器或通信環(huán)境的變化,和由濁音清音段到段的語(yǔ)音內(nèi)容,語(yǔ)音信號(hào)的幅度會(huì)在一個(gè)很寬的范圍內(nèi)。正如我們所看到的,使用非均勻量化,以適應(yīng)這些幅度的波動(dòng)是一種方式,還有一個(gè)比這更好的方式,采用自適應(yīng)量化,即使量化的量化步長(zhǎng)自動(dòng)適應(yīng)輸入電平的變化。在本節(jié)將介紹自適應(yīng)量化的一般原則。自適應(yīng)量化的基本思想,是使量化步長(zhǎng)的距離,變成輸入信號(hào)相匹配
31、的幅度變化,作為輸入信號(hào)的振幅從規(guī)定的變化,從而進(jìn)一步提高其定量結(jié)果的量化步。也可以在前面的一個(gè)固定量化器的自適應(yīng)增益控制,使之進(jìn)入到量化器的輸入信號(hào)保持到一個(gè)固定的常數(shù)方差。這兩種方法是等效的。這兩種方法應(yīng)容易地估計(jì)隨時(shí)間變化的輸入信號(hào)的振幅,來(lái)糾正從(n)的量化步長(zhǎng)的增益值。并根據(jù)不同的估計(jì)方法,自適應(yīng)量化可以分為兩種類型:一種是輸入振幅或輸入估計(jì)值本身的方差,此程序被稱為前饋?zhàn)赃m應(yīng)量化(aqf),另一種是,在根據(jù)與量化步長(zhǎng)從量化器輸出是自適應(yīng)的,或等價(jià)的輸出碼字c(n)自適應(yīng)調(diào)整,這個(gè)程序被稱為反饋?zhàn)赃m應(yīng)量化(aqb)。無(wú)論的aqf法或aqb方法,可以顯著提高量化的輸入信號(hào)電平變化的適應(yīng)
32、能力,可以使大或小信號(hào)輸入信號(hào)輸入具有很高的量化噪聲比。1)前饋?zhàn)赃m應(yīng)量化所謂前饋?zhàn)赃m應(yīng)是指,信號(hào)的能量或者方差是通過(guò)輸入信號(hào)其本身估算出來(lái)的,通常是先在估算出的方差后,然后令兩種系統(tǒng)輸出 (8)即正比于,而反比于盯。因?yàn)榱炕肼暡荒苡绊懙腶qf估值方法,所以aqf估值相當(dāng)可靠的。在同一時(shí)間,這也意味著,為了信息的傳送量,使用額外的比特到解碼器,被稱為邊信息。典型5-6位需要編寫每個(gè)量階,所以,估值的頻率不能太高,不然總的編碼速率過(guò)大,一般為10至30毫秒的時(shí)間估計(jì)。 aqf方法還具有的另一個(gè)問(wèn)題是,將引入一個(gè)較長(zhǎng)的編碼延遲,它經(jīng)常被用于子幀的編碼處理。2)反饋?zhàn)赃m應(yīng)量化器 反饋?zhàn)赃m應(yīng)量化器的
33、估值方法是使用量化的信號(hào)后去提取量階信息,所以就避免了邊帶信息和延遲的問(wèn)題。 aqb的問(wèn)題是其估值精度將量化噪聲的影響,并會(huì)影響加劇量化粗糙性的增加,甚至有可能導(dǎo)致量化工作不正常。因此,aqb方法通常被用在相對(duì)較高的質(zhì)量在短暫的延遲語(yǔ)音編碼中。通常說(shuō)來(lái),前饋的適應(yīng)性和反饋?zhàn)赃m應(yīng)相比,信噪比略高一些,但是前饋?zhàn)赃m應(yīng)需要延遲一段時(shí)間,短期時(shí)間去計(jì)算方差,而反饋?zhàn)赃m應(yīng)然后瞬間完成??傊軌蚪o予超過(guò)律或a律自適應(yīng)量化量化的信號(hào)信噪比,適當(dāng)?shù)倪x擇,但也允許自適應(yīng)動(dòng)態(tài)范圍與后者相當(dāng),選擇一個(gè)較小的無(wú)語(yǔ)言也使活動(dòng)時(shí)量化噪聲非常低,因此自適應(yīng)量化是一種非常有效的編碼方法。3 自適應(yīng)差分脈沖編碼調(diào)制adpcm
34、目前,脈沖編碼調(diào)制(pcm)的數(shù)字通信系統(tǒng)已經(jīng)在大容量數(shù)字微波、光纖通信系統(tǒng),以及市話網(wǎng)局間中繼傳輸系統(tǒng)中獲得廣泛的應(yīng)用。但是現(xiàn)有的pcm編碼必須采用64kbit/s的a律或律對(duì)數(shù)壓擴(kuò)的方法,才能符合長(zhǎng)途電話傳輸語(yǔ)音的質(zhì)量指標(biāo),其占用頻帶要比模擬單邊帶通信系統(tǒng)寬很多倍。這樣,對(duì)于費(fèi)用昂貴的長(zhǎng)途大容量傳輸,尤其是對(duì)于衛(wèi)星通信系統(tǒng),采用pcm數(shù)字通信方式時(shí)的經(jīng)濟(jì)性很難和模擬相比擬。因此,人們一直致力于研究壓縮數(shù)字化語(yǔ)音占用頻帶的工作,也就是努力在相同質(zhì)量指標(biāo)的條件下,降低數(shù)字化語(yǔ)音數(shù)碼率,以提高數(shù)字通信系統(tǒng)的頻帶利用率。 自適應(yīng)差值編碼調(diào)制(adpcm)是在差值脈沖編碼調(diào)制(dpcm)基礎(chǔ)上逐步發(fā)
35、展起來(lái)的。它在實(shí)現(xiàn)上采用預(yù)測(cè)技術(shù)減少量化編碼器輸入信號(hào)的多余度,將差值信號(hào)編碼以提高效率、降低編碼信號(hào)速率,這廣泛應(yīng)用于語(yǔ)音和圖像信號(hào)數(shù)字化。ccitt近幾年確定了64kb/s32kb/s的變換體制,將標(biāo)準(zhǔn)的pcm碼變換為32kb/s的adpcm碼,傳輸后再恢復(fù)為64kb/s的pcm信號(hào),從而使64kb/s數(shù)字話音壓縮速率一倍,使傳輸信道的容易擴(kuò)大一倍。 adpcm中的量化器與預(yù)測(cè)器均采用自適應(yīng)方式,即量化器與預(yù)測(cè)器的參數(shù)能根據(jù)輸入信號(hào)的統(tǒng)計(jì)特性自適應(yīng)于最佳參數(shù)狀態(tài)。通常,人們把低于64kb/s數(shù)碼率的語(yǔ)音編碼方法稱為語(yǔ)音壓縮編碼技術(shù),語(yǔ)音壓縮編碼方法很多,自適應(yīng)差值脈沖調(diào)制(adpcm)是語(yǔ)
36、音壓縮編碼中復(fù)雜程度較低的一種方法。它能32kbit/s數(shù)碼率上達(dá)到符合64kbit/s數(shù)碼率的語(yǔ)音質(zhì)量要求,也就是符合長(zhǎng)途電話的質(zhì)量要求。adpcm是波形編碼中非常有效的一種數(shù)字編碼方式。在adpcm系統(tǒng)中量化器和預(yù)測(cè)器均采用自適應(yīng)方式,即量化器和預(yù)測(cè)器的參數(shù)能隨輸入信號(hào)的統(tǒng)計(jì)特性自適應(yīng)于或接近于最佳的參數(shù)狀態(tài)。與pcm系統(tǒng)相比,adpcm的量化器和預(yù)測(cè)器都是根據(jù)前面出現(xiàn)的pcm抽樣值并對(duì)下一個(gè)抽樣值進(jìn)行預(yù)測(cè),將當(dāng)前的抽樣值和預(yù)測(cè)值進(jìn)行求差,然后對(duì)差值進(jìn)行編碼。對(duì)差值編碼需要的位數(shù)要比直接對(duì)原始語(yǔ)音信號(hào)編碼所需的位數(shù)少,從而達(dá)到對(duì)信號(hào)壓縮的目的,在這里編碼所包含的信息從原來(lái)的原始語(yǔ)音信號(hào)變?yōu)?/p>
37、語(yǔ)音信號(hào)之間的變化。3.1 脈沖編碼調(diào)制pcmpcm編碼被稱為脈沖編碼調(diào)制,這是在一個(gè)數(shù)字通信的編碼,是最簡(jiǎn)單的波形編碼方法,編碼主要過(guò)程是語(yǔ)音,圖像,對(duì)其進(jìn)行采樣以規(guī)則的間隔上的一些模擬信號(hào),使該信號(hào)是離散的,在同一時(shí)間的樣值被舍入,根據(jù)分層量化單元的舍入,而在采樣脈沖振幅的采樣值與一組二進(jìn)制碼。 pcm編碼的最大的優(yōu)點(diǎn)是,音質(zhì)好,最大的缺點(diǎn)是笨重。我們常見(jiàn)的音頻cd上使用了pcm編碼。pcm模式是抽樣,量化和編碼三個(gè)基本方面完成。音頻信號(hào)通過(guò)一個(gè)低通濾波器的帶限濾波處理,從取樣,量化和編碼三環(huán)節(jié)完成pcm調(diào)制,來(lái)實(shí)現(xiàn)a / d轉(zhuǎn)換,形成pcm數(shù)字信號(hào)的糾錯(cuò)編碼和調(diào)制,它被記錄在記錄介質(zhì)上。
38、數(shù)碼錄音cd和磁帶介質(zhì)。在播放期間,從記錄介質(zhì)中取出由數(shù)字信號(hào)處理,例如解調(diào)和糾錯(cuò)后,恢復(fù)成pcm數(shù)字信號(hào),然后由數(shù)/模變換器以及低通濾波器還原成模擬音頻信號(hào)。在cd-pcm的數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào),以恢復(fù)解碼器 - 被稱為cd-pcm解碼器。脈沖調(diào)制就是將一個(gè)時(shí)間連續(xù),取值連續(xù)的模擬信號(hào)變換成時(shí)間離散,取值離散的數(shù)字信號(hào)后在信道中傳輸。脈沖編碼調(diào)制的過(guò)程就是先對(duì)模擬信號(hào)進(jìn)行抽樣,再對(duì)樣值幅度量化,最后進(jìn)行編碼。 模擬信號(hào)的周期性掃描的將時(shí)間連續(xù)信號(hào)轉(zhuǎn)換成離散時(shí)域信號(hào)的過(guò)程稱為采樣。經(jīng)過(guò)模擬信號(hào)采樣的原始信號(hào)也應(yīng)包含的所有信息,能恢復(fù)原來(lái)的模擬信號(hào)無(wú)失真。采樣速率的下限是由抽樣定理來(lái)確定。量化
39、在pcm中所指的就是將一個(gè)經(jīng)過(guò)抽樣后得到的瞬時(shí)值使其幅度離散化,即用一組規(guī)定的電平去表示其瞬時(shí)抽樣值最接近電平的值。通過(guò)采樣的模擬信號(hào)進(jìn)行量化獲得的量化的脈沖幅度調(diào)制信號(hào),這是一個(gè)預(yù)定電平的樣值來(lái)表示的瞬時(shí)值的最近水平。對(duì)于編碼,使用一個(gè)二進(jìn)制代碼來(lái)表示每個(gè)組有一個(gè)固定的量化電平,但它實(shí)際上是量化同時(shí)在編碼過(guò)程中,因此也可以被稱為編碼處理的模擬/數(shù)字轉(zhuǎn)換,可以是a / d轉(zhuǎn)換的意思。3.2 差分脈沖編碼調(diào)制dpcm差分脈沖編碼調(diào)制記錄的不是信號(hào)的絕對(duì)大小而是相對(duì)大小。因?yàn)橥ǔG闆r下的信號(hào)的相對(duì)大小的變化小于信號(hào)本身,那么編碼所用的碼位也就少。假如取樣頻率足夠高的話,那么大多數(shù)連續(xù)采樣之間將產(chǎn)生
40、很大的關(guān)聯(lián)。所以差分系統(tǒng)就利用了這種信息的冗余,不在于記錄信號(hào)的大小,而是去記錄相鄰值之間差值的大小。圖2 dpcm編碼器示意圖差分編碼中使用的預(yù)測(cè)編碼技術(shù),這個(gè)想法是從輸入中減去預(yù)測(cè)值,然后進(jìn)行量化的預(yù)測(cè)誤差,和最終的代碼的預(yù)測(cè)值和實(shí)際值之間的差值。與過(guò)去的數(shù)據(jù)來(lái)預(yù)測(cè)當(dāng)前樣本,然后使用的錯(cuò)誤代碼來(lái)重建原始樣品的解碼器。此方法使用一個(gè)相對(duì)較小的比特?cái)?shù),但其性能依賴于它的能力,以適應(yīng)變化的信號(hào)和預(yù)測(cè)編碼方法。為了便于分析,我們需要定義預(yù)測(cè)器的性質(zhì)。按照語(yǔ)音產(chǎn)生模型和數(shù)學(xué)上容易進(jìn)行處理,通常是線性的預(yù)測(cè),即預(yù)測(cè)輸出x(n)與前量化值的線性組合關(guān)系 (9)為簡(jiǎn)單起見(jiàn),往往可能采取以下的通式(10)在
41、一個(gè)固定的一階預(yù)測(cè)的形式 (10)此時(shí),差分方程滿足于,則系統(tǒng)函數(shù)有 (11)當(dāng)系統(tǒng)函數(shù)的式(10)是相當(dāng)于數(shù)字積分器(當(dāng)a =1),且al時(shí),它們可以被稱為“漏積分器”。大量實(shí)驗(yàn)表明,使用二階預(yù)測(cè)器有可能獲得一個(gè)大信號(hào)噪聲比(snr),即 (12)則有 (13)該系統(tǒng)函數(shù)有 (14)當(dāng)兩個(gè)極點(diǎn)為實(shí)數(shù)時(shí),就有二階預(yù)測(cè)器的性能高于一階的預(yù)測(cè)器,這種預(yù)測(cè)是通常被稱為“雙積分器”,比較一階預(yù)測(cè)器有4分貝的改善。這種線性預(yù)測(cè)系數(shù)在跟隨語(yǔ)音變化而變化時(shí),那么它被稱為自適應(yīng)預(yù)測(cè)。自適應(yīng)預(yù)測(cè)有三個(gè)特點(diǎn):首先,相同的量化的比特?cái)?shù),信噪比總是大于非預(yù)測(cè)編碼,即,其自適應(yīng)預(yù)測(cè)增益總是大于1。二是它的增益是隨時(shí)間變
42、化的,因?yàn)樗切盘?hào)頻譜函數(shù),譜的動(dòng)態(tài)范圍越大,其信號(hào)樣本之間相關(guān)性就越強(qiáng),預(yù)測(cè)增益也就越高。因此,這種預(yù)測(cè)器又被稱之為基于頻譜包絡(luò)的預(yù)測(cè)。三,其量化噪聲是類似于白噪聲,因此輸出噪聲頻譜是平坦的。由2.3小節(jié)可知,自適應(yīng)量化包括前饋?zhàn)赃m應(yīng)量化和反饋?zhàn)赃m應(yīng)量化,同樣,自適應(yīng)預(yù)測(cè)器也可分為前饋?zhàn)赃m應(yīng)和反饋?zhàn)赃m應(yīng),前饋?zhàn)赃m應(yīng)預(yù)測(cè)器計(jì)算預(yù)測(cè)系數(shù)是通過(guò)誤差 (15)最小來(lái)求得。e(n)為線性預(yù)測(cè)誤差,是按照幀時(shí)來(lái)變化的,即按照10到30毫秒為一幀來(lái)決定求和樣本點(diǎn)數(shù)n和系數(shù),而是式(15)使用了輸入語(yǔ)言信號(hào),它在其接收端是得不到的,因而其預(yù)測(cè)系數(shù)必須作為邊信息傳輸?shù)浇邮斩?。?duì)反饋?zhàn)赃m應(yīng)預(yù)測(cè)器,預(yù)測(cè)系數(shù)從其序
43、列出發(fā),使誤差(16)最小得到,由圖3可知,在發(fā)送端與接收端都能得到,所以除了傳送,無(wú)須要任何的附加邊信息傳給接收端。圖3 自適應(yīng)預(yù)測(cè)編碼系統(tǒng)為了清楚可見(jiàn),現(xiàn)將前饋?zhàn)赃m應(yīng)預(yù)測(cè)和反饋?zhàn)赃m應(yīng)預(yù)測(cè)做一下簡(jiǎn)略的比較。1)效果是前饋反饋?zhàn)赃m應(yīng)預(yù)測(cè)一般稍好,但主要的問(wèn)題的前饋預(yù)測(cè)的發(fā)送到接收器的預(yù)測(cè)系數(shù),并且,以確保準(zhǔn)確的傳遞,需要適當(dāng)?shù)牧炕途幋a它們,并有效地與結(jié)合起來(lái),實(shí)現(xiàn)高效率的傳輸,這將使發(fā)件人反饋的預(yù)測(cè)變得更加復(fù)雜,并沒(méi)有這個(gè)問(wèn)題。2)傳輸?shù)恼`碼對(duì)反饋?zhàn)赃m應(yīng)預(yù)測(cè)的編碼影響比較大,在前饋?zhàn)赃m應(yīng)預(yù)測(cè)器中,誤碼不會(huì)影響預(yù)測(cè)器系數(shù)。當(dāng)然,預(yù)測(cè)系數(shù)其傳輸本身也會(huì)出現(xiàn)誤碼,但是它只局限于影響本幀的結(jié)果,在一
44、般情況下,編碼器的預(yù)測(cè)器系數(shù)時(shí),將采取有效措施,即使發(fā)生誤碼,不會(huì)導(dǎo)致系統(tǒng)不穩(wěn)定。反饋預(yù)測(cè)算法獲得的預(yù)測(cè)系數(shù),不保證它們形成的合成濾波器的一定的穩(wěn)定性,同時(shí),又要考慮該算法的收斂性和有限字長(zhǎng)的影響,這將使得相對(duì)復(fù)雜反饋?zhàn)赃m應(yīng)預(yù)測(cè)算法。3.3增量調(diào)制dmdpcm對(duì)輸入信號(hào)與預(yù)測(cè)值之差進(jìn)行編碼,當(dāng)采樣頻率的增加,減少樣品之間的變化,樣本之間的相關(guān)性變強(qiáng)。增量調(diào)制本質(zhì)上是一個(gè)dpcm方法,與一般dpcm兩個(gè)主要區(qū)別是:首先,在delta調(diào)制的波形的采樣率遠(yuǎn)高于奈奎斯特采樣定理確定的采樣率,第二個(gè)是使用兩個(gè)電平值信號(hào)差即1比特量化器。這是在更高的采樣頻率和一個(gè)1-bit編碼。因?yàn)橹挥幸粋€(gè)量化電平來(lái)表示
45、樣本值的變化,以跟蹤信號(hào)的變化,則必須使用上述一般要求相對(duì)高的采樣頻率為200khz,因此,反映差分編碼本身,而不是原來(lái)的信號(hào)。 圖4 使用1比特差分碼進(jìn)行編碼的調(diào)制dm,也被稱為調(diào)制器,它是一種預(yù)測(cè)編碼技術(shù),被pcm編碼的基礎(chǔ)上發(fā)展而來(lái)的,它可以說(shuō)是一個(gè)變化的pcm,pcm編碼的每一個(gè)采樣信號(hào)的幅度是整個(gè)量化和編碼,所以它具有任意波形的編碼能力; dm實(shí)際采樣的采樣信號(hào)的極性之間的實(shí)際差異信號(hào)和預(yù)測(cè)編碼,有關(guān)的極性變成“0”和“1”兩個(gè)可能的值之一。如果實(shí)際的采樣信號(hào)減去采樣信號(hào)預(yù)測(cè)之間的差異是“積極的”(即“積極”的極性),然后用“1”,而是使用“0”。由于只有一個(gè)1-bit的dm編碼的語(yǔ)
46、音信號(hào)進(jìn)行編碼,編碼系統(tǒng),也被稱為dm“升位系統(tǒng)”??梢钥闯鰪膱D4中,在開(kāi)始階段,有調(diào)制器的輸出不能跟蹤的輸入信號(hào)的現(xiàn)象非??焖俚淖兓?,我們稱這種現(xiàn)象為調(diào)制器的“斜率過(guò)載”。一般來(lái)說(shuō),當(dāng)輸出信號(hào)的反饋環(huán)路中是最大變化速度超過(guò)的輸入信號(hào)的變化率,將有一個(gè)所謂的斜率過(guò)載。發(fā)生這種現(xiàn)象的主要原因,因?yàn)橛闪炕介L(zhǎng)的限制,和量化步長(zhǎng)的大小的變化的輸出信號(hào)的反饋環(huán)路的最大速率是固定的。從圖4可以看出,當(dāng)輸入信號(hào)的變化相對(duì)緩慢,即輸入信號(hào)和預(yù)測(cè)信號(hào),當(dāng)該差值接近于零,delta調(diào)制器的輸出,有隨機(jī)交替的“0”和“l(fā) “的現(xiàn)象。這種現(xiàn)象被稱為“粒狀噪聲(顆粒噪聲)”調(diào)制器,該噪聲不能被消除。當(dāng)輸入信號(hào)的變化更
47、快,斜率過(guò)載將成為人們關(guān)注的焦點(diǎn),當(dāng)輸入信號(hào)的變化慢時(shí),它會(huì)再次成為關(guān)注的焦點(diǎn)粒狀噪聲。因此,為了避免發(fā)生斜率過(guò)載時(shí),通常有必要增加量化步長(zhǎng),但這樣做,它會(huì)成為較大的顆粒噪聲,相反,如果你想減少顆粒噪聲,那么它是必要的,以減少量化步長(zhǎng),這樣就使得斜率過(guò)載會(huì)變得更加嚴(yán)重,因此,促進(jìn)自適應(yīng)增量調(diào)制adm的發(fā)展研究。3.4 自適應(yīng)增量調(diào)制adm自適應(yīng)增量調(diào)制的基本思想就是使增量自適應(yīng)于語(yǔ)音信號(hào)的平均斜率變化,當(dāng)語(yǔ)音信號(hào)波形的平均斜率變大時(shí),就會(huì)自動(dòng)增大,反之,就會(huì)自動(dòng)減小,從而緩解增量調(diào)制中由于固定引起的矛盾。通常情況下,人耳對(duì)過(guò)載量化噪聲不是很敏感,而對(duì)顆粒噪聲較為敏感,因此就需要將的幅值取得足夠
48、的小。然而,雖然此時(shí)被取得比較小,隨之而來(lái)的過(guò)載噪聲就會(huì)因此增大,所以此時(shí)必須要通過(guò)增加采樣頻率來(lái)確保減少信號(hào)量化過(guò)程中的過(guò)載噪聲,但是如果此時(shí)去提高采樣頻率,又會(huì)使其信息壓縮的效果因此降低。所以綜上兩方面的要求,需要采用一種隨輸入波形自適應(yīng)改變大小的自適應(yīng)編碼方式,從而使得值隨信號(hào)平均斜率變化而變化:當(dāng)斜率大時(shí),就會(huì)自動(dòng)增大;當(dāng)斜率大時(shí),就會(huì)自動(dòng)減小。這就是自適應(yīng)增量調(diào)制adm(adaptive dm)。此方法的原理:在一段語(yǔ)音信號(hào)幅值變化不很大的區(qū)間內(nèi),就取較小的值去抑制顆粒噪音;而在幅值變化比較大的區(qū)間內(nèi),就取相對(duì)較大的值去減小過(guò)載噪音。它的增量幅度確定方法是,先在顆粒噪音不會(huì)產(chǎn)生大的影
49、響的條件下,確定一個(gè)最小的幅值。在相同符號(hào)持續(xù)產(chǎn)生的情況下,將幅值增加到原來(lái)的2倍。也就是當(dāng)+、+連續(xù)增加時(shí),若下一個(gè)殘差信號(hào)仍然是相同的符號(hào),則就再將幅值再次翻番,等等,還要確定最大限幅,只要的振幅的最大值一個(gè)持續(xù)產(chǎn)生相同的符號(hào)將繼續(xù)增加的幅度下來(lái)。如果相反,殘差信號(hào)是一個(gè)不同的符號(hào),將前一個(gè)原始幅度的1/2作為這一次振幅。即,如果連續(xù)地產(chǎn)生相同的兩個(gè)或更多個(gè)相同的,而第三個(gè)將增加一倍幅,如果它們具有不同的符號(hào),在的幅值被減小了1/2。此外,不同的電話號(hào)碼時(shí),繼續(xù)產(chǎn)生時(shí)的振幅減小,已減少到最低限度,以便確定初始振幅極限為止。此adm算法,采樣率至少為16千赫。圖5 連續(xù)0和1引起增量步長(zhǎng)的改
50、變3.5 自適應(yīng)差分脈沖編碼調(diào)制adpcm3.5.1 編碼原理自適應(yīng)差分脈沖編碼調(diào)制就是用預(yù)測(cè)編碼去壓縮數(shù)據(jù)量。其主要結(jié)合了adm的差分信號(hào)和pcm的二進(jìn)制碼的方法,是一種性能非常好的波形編碼。它的核心思想是:一是使用自適應(yīng)量化步長(zhǎng)的想法來(lái)改變其大小,即小的差值用比較小的量化階去編碼,大的差值使用大的量化階去編碼;二是是使用以前的樣值來(lái)估計(jì)即將到來(lái)的下一個(gè)輸入樣本的預(yù)測(cè)值,所以實(shí)際樣本值和預(yù)測(cè)值之間的差已被保持在最低限度。圖6 adpcm原理框圖adpcm編碼的想法是實(shí)際樣本值與預(yù)測(cè)值和預(yù)測(cè)之間的差值被編碼,其量化的方式非均勻量化,并讓不同幅值信號(hào)的信噪比接近一致,以避免語(yǔ)音信號(hào)的小振幅的sn
51、r值是小的,但大幅值語(yǔ)音信號(hào)信噪?yún)s又比較大的現(xiàn)象。它的編碼過(guò)程如圖6所示。向編碼器輸入一個(gè)語(yǔ)音數(shù)據(jù)的16位的二進(jìn)制補(bǔ)碼,這是在32767-32767之間的范圍內(nèi)。為預(yù)測(cè)采樣值,其同線性輸入之間的差值為d。量化的差分量化器,用于產(chǎn)生一個(gè)帶符號(hào)的4的編碼數(shù)據(jù)i,該數(shù)據(jù)的表示7和-7之間的范圍內(nèi),其特征在于,所述編碼的值的最高位是符號(hào)位的數(shù)據(jù)。編碼時(shí),首先要計(jì)算出16位二進(jìn)制補(bǔ)碼的當(dāng)前采樣值與上一個(gè)預(yù)測(cè)采樣值的差值d,那么將輸出的4位adpcm值i即為該差值的量化編碼。在該算法的過(guò)程中,將存儲(chǔ)預(yù)測(cè)采樣定義為一個(gè)結(jié)構(gòu)變量,還定義一個(gè)量化步長(zhǎng)索引,并制定兩個(gè)表。一表是索引調(diào)整表,差值量化編碼i作為其輸人
52、,用以更新步長(zhǎng)索引;另一表為步長(zhǎng)調(diào)整表,將步長(zhǎng)索引為其輸人,步長(zhǎng)q為輸出。編碼時(shí),先用上一個(gè)采樣點(diǎn)的步長(zhǎng)去索引查步長(zhǎng)調(diào)整表求出步長(zhǎng)q。若是當(dāng)前采樣值與采樣預(yù)測(cè)值之間的差值d為負(fù),那么i的d3位置即最高位為1。假如該差值絕對(duì)值大于步長(zhǎng)q,那么i的d2位置1。若大于,則i的d1位置1,如果大于,則i的d0位置1。如果上述條件沒(méi)有得到滿足,那么相應(yīng)的位置將被設(shè)置為0。這將確定的編碼值i,然后,再將編碼值i作為指標(biāo),來(lái)作為索引調(diào)整表的輸入,然后輸出索引調(diào)整通過(guò)查表所獲得,并與結(jié)構(gòu)變量中原步長(zhǎng)索引相加,生成新的步長(zhǎng)索引用于編碼下一個(gè)采樣值中使用。編碼輸出i后,還需要重復(fù)進(jìn)行相同的計(jì)算過(guò)程,從而獲得新的預(yù)
53、測(cè)樣本。 3.5.2 解碼原理解碼是編碼的相反的過(guò)程,給出adpcm的解碼過(guò)程框圖如圖7所示。將前面編碼輸出的i作為解碼器的輸入,然后通過(guò)逆量化器將編碼i逆量化成差值。差值和預(yù)測(cè)采樣相加后得到一個(gè)解碼輸出。解碼的過(guò)程和編碼過(guò)程中求圖7 解碼原理框圖預(yù)測(cè)采樣其原理是相同的,如果你想能夠在解碼端的也重現(xiàn),那么你需要編碼端的能夠很好的跟蹤上。這里所涉及的因素算法本身的延遲和實(shí)施平臺(tái),實(shí)時(shí)的方法等。解碼過(guò)程:首先求得獲得量化步長(zhǎng),這個(gè)可以根據(jù)步長(zhǎng)索引查步長(zhǎng)調(diào)整表來(lái)得到,并讓差值量化編碼i經(jīng)過(guò)逆量化器后得到語(yǔ)音差值,這是求i的逆過(guò)程;接著和前次預(yù)測(cè)值一同重建當(dāng)前的語(yǔ)音信號(hào);最后根據(jù)固定預(yù)測(cè),更新預(yù)測(cè)采樣
54、,用i去更新量化步長(zhǎng)索引值。4 基于adpcm的語(yǔ)音編解碼設(shè)計(jì)的軟件實(shí)現(xiàn)本章提出了一種基于adpcm的語(yǔ)音編解碼設(shè)計(jì),確定adpcm實(shí)現(xiàn)的總體設(shè)計(jì)框圖,以及adpcm編碼和解碼實(shí)現(xiàn)過(guò)程的設(shè)計(jì)流程圖, 并采用matlab軟件對(duì)adpcm編解碼系統(tǒng)的實(shí)現(xiàn)進(jìn)行了仿真。4.1 總體設(shè)計(jì)框圖依據(jù)adpcm編解碼的基本原理,得出該設(shè)計(jì)的總體設(shè)計(jì)框圖如圖8所示,首先用電腦自帶錄音軟件錄制一段“.wav”格式語(yǔ)音作為設(shè)計(jì)中的信源即“輸入語(yǔ)音信號(hào)”。用matlab自帶函數(shù)“wavread(文件名)”將語(yǔ)音信號(hào)讀取進(jìn)來(lái)(該函數(shù)讀入即為離散信號(hào))并對(duì)其采樣;然后,用adpcm的編碼方式對(duì)其編碼;再將編碼后的信號(hào)輸入到一個(gè)模擬的信道中模擬傳輸,在輸出端對(duì)信號(hào)進(jìn)行語(yǔ)音還原即adpcm的解碼,并求得原始信號(hào)與編解碼傳輸信號(hào)之后的誤差。圖8 程序框圖該主程序主要代碼如下:y,fs=wavread(lf.wav);sound(y,fs) %播放原始語(yǔ)言y=wavread(lf.wav); %讀入原始語(yǔ)音y1=y(1:1000:1323000 ,1); %采樣bmh=bm(y1); %對(duì)信號(hào)進(jìn)行編碼x=awgn(bmh,20); %加白噪聲模擬信道bmh=round(x); %濾波取整y=jm(bmh);
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 新技術(shù)在微生物檢驗(yàn)中的應(yīng)用趨勢(shì)及試題及答案
- 量子科技發(fā)展趨勢(shì)與市場(chǎng)潛力展望
- 微生物檢驗(yàn)技能的職業(yè)認(rèn)證試題及答案分享
- 注冊(cè)會(huì)計(jì)師考試2025年環(huán)境會(huì)計(jì)數(shù)據(jù)在決策中的應(yīng)用分析試題及答案
- 銀行信用評(píng)級(jí)標(biāo)準(zhǔn)試題及答案2025年理解
- 微生物檢驗(yàn)技師證書考前沖刺試題及答案
- 2025年注冊(cè)會(huì)計(jì)師考試進(jìn)階學(xué)習(xí)試題及答案
- 特許金融分析師考試重要概念試題及答案
- 2025年注冊(cè)會(huì)計(jì)師考試知識(shí)拓展試題及答案
- 2025年公司法熱點(diǎn)知識(shí)試題及答案
- 學(xué)前教育學(xué) 課件 第1、2章 緒論;學(xué)前教育的目標(biāo)、內(nèi)容的方法
- 部編人教版五年級(jí)語(yǔ)文下冊(cè)教學(xué)策略計(jì)劃
- 2025北京豐臺(tái)高三一模物理試題及答案
- 江南美術(shù)遺產(chǎn)融入美育的數(shù)智化路徑探索
- 動(dòng)物生理學(xué)第十二章-泌乳
- 互聯(lián)網(wǎng)+旅游創(chuàng)新創(chuàng)業(yè)
- 金屬礦床地下開(kāi)采-全知識(shí)點(diǎn)
- 西雅圖駕駛證考題及答案
- 綜合執(zhí)法考試試題及答案
- 軟式內(nèi)鏡消毒管理與質(zhì)量標(biāo)準(zhǔn)
- 血站服務(wù)禮儀培訓(xùn)
評(píng)論
0/150
提交評(píng)論