(通信與信息系統(tǒng)專業(yè)論文)非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究(1).pdf_第1頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究(1).pdf_第2頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究(1).pdf_第3頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究(1).pdf_第4頁(yè)
(通信與信息系統(tǒng)專業(yè)論文)非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究(1).pdf_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

(通信與信息系統(tǒng)專業(yè)論文)非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究(1).pdf.pdf 免費(fèi)下載

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

摘要 環(huán)境噪聲的污染使許多語(yǔ)音處理系統(tǒng)的性能急劇下降,因此對(duì)受背景噪聲污 染的語(yǔ)音進(jìn)行增強(qiáng)去噪成為目前迫切需要解決的問(wèn)題。 本文主要研究了非平穩(wěn)環(huán)境下的單通道語(yǔ)音增強(qiáng)方法。首先針對(duì)有聲無(wú)聲判 決進(jìn)行噪聲估計(jì)時(shí),低信噪比或非平穩(wěn)條件下性能較差以及不能實(shí)時(shí)跟蹤噪聲特 性變化的缺點(diǎn),采用改進(jìn)的基于統(tǒng)計(jì)最小的方法來(lái)完成噪聲的準(zhǔn)確估計(jì),并利用 子窗技術(shù)提高了算法的計(jì)算效率;然后結(jié)合人耳的聽(tīng)覺(jué)掩蔽效應(yīng),利用掩蔽閾值 對(duì)譜減法中的系數(shù)進(jìn)行自適應(yīng)調(diào)整。經(jīng)計(jì)算機(jī)仿真實(shí)驗(yàn)證明,本文算法能夠有效 地抑制背景噪聲,同時(shí)保持語(yǔ)音可懂度,在噪聲消除和語(yǔ)音失真之間做了一個(gè)良 好的折衷。此外本文還對(duì)基于聽(tīng)覺(jué)濾波器組的增強(qiáng)算法進(jìn)行了初步研究,討論了 分析綜合濾波器組的設(shè)計(jì)。 關(guān)鍵詞:語(yǔ)音增強(qiáng)統(tǒng)計(jì)最小聽(tīng)覺(jué)掩蔽譜減參數(shù) a b s t r a c t i nm a n yp r a c t i c a ls i t u a t i o n s ,s p e e c hp r o c e s s i n gs y s t e m sa r ec o n f r o n t e dw i t hh i g h a m b i e n tn o i s el e v e l s ,a n dt h e i rp e r f o r m a n c ed e g r a d e sd r a s t i c a l l y t h u s ,t h e r ei sa s t r o n g n e e dt oi m p r o v et h ep e r f o r m a n c eo ft h e s es y s t e m si nn o i s yc o n d i t i o n sb yd e v e l o p i n g e n h a n c e m e n ta l g o r i t h m s i nt h i sp a p e r , w ef o c u so ns i n g l ec h a n n e ls p e e c he n h a n c e m e n ti nn o n s t a t i o n a r y e n v i r o n m e n t s t h i sa l g o r i t h mu s e s i m p r o v e dm i n i m u ms t a t i s t i c sm e t h o df o rn o i s e e s t i m a t i n gt oo v e r c o m et h ed e f i c i e n c yo ft h ec o n v e n t i o n a lv o i c ea c t i v i t yd e t e c t o r s , w h i c ha r eo n l ye f f i c i e n tf o rs t a t i o n a r ye n v i r o n m e n t sa n dc a l l tt r a c kt h ev a r y i n gn o i s e w i t hc o n s t a n tt h r e s h o l d as u b - w i n d o wa p p r o a c hi su t i l i z e di nt h i sm e t h o dt os p e e du p t h ep e r f o r m a n c eo f t r a c k i n g f o l l o w i n g ,a u d i t o r ym a s k i n gp r o p e r t i e sa r ei n t r o d u c e di n t o t h es u b t r a c t i v e - t y p ee n h a n c e m e n tp r o c e s s i ta l l o w sf o ra na u t o m a t i ca d a p t a t i o ni nt i m e a n df r e q u e n c yo ft h ep a r a m e t r i ce n h a n c e m e n ts y s t e mw i t ht h em a s k i n gt h r e s h o l d ,a n d f i n d st h eb e s tt r a d e o f fb e t w e e nn o i s er e d u c t i o na n dt h es p e e c hd i s t o r t i o n o b j e c t i v ea n d s u b j e c t i v ee v a l u a t i o no ft h ep r o p o s e da l g o r i t h mi sp e r f o r m e dw i t hs e v e r a ln o i s et y p e si n t h en o i s e x 一9 2d a t a b a s e t h er e s u l t ss h o wt h a tt h i sm e t h o dl e a d st oas i g n i f i c a n t r e d u c t i o no fb a c k g r o u n dn o i s ea n dt h eu n n a t u r a ls t r u c t u r eo ft h er e s i d u a ln o i s e f u r t h e r m o r e ,a n o t h e rm e t h o di sr e s e a r c h e dp r i m a r i l yw h i c hi sb a s e do nt h ea u d i t o r y f i l t e rb a n k s ,a n dt h ed e s i g no ff i l t e rb a n k si sa l s od i s c u s s e di nt h i sp a p e r k e y w o r d s :s p e e c he n h a n c e m e n t m i n i m u ms t a t i s t i c s a u d i t o r ym a s k i n g s u b t r a c t i o np a r a m e t e r s 第一章緒論 第一章緒論 語(yǔ)音信號(hào)處理包含多個(gè)方面,如語(yǔ)音合成、語(yǔ)音編碼、語(yǔ)音識(shí)別、語(yǔ)音通信、 語(yǔ)音增強(qiáng)等。它是一門(mén)新興的、綜合性的學(xué)科,是一門(mén)涉及面很廣的交叉學(xué)科。 它與語(yǔ)音學(xué)、語(yǔ)言學(xué)、生理學(xué)、心理學(xué)等學(xué)科有密切的關(guān)系。語(yǔ)音信號(hào)處理是許 多信息領(lǐng)域應(yīng)用的核心技術(shù)之一,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域中的 一個(gè),其研究涉及一系列前沿科研課題,且處于迅速發(fā)展之中,研究成果具有重要 的學(xué)術(shù)及應(yīng)用價(jià)值。其中的語(yǔ)音增強(qiáng)是一種有效的解決噪聲污染、提高信噪比的 重要手段,是語(yǔ)音信號(hào)處理的一個(gè)重要分支,它在從帶噪語(yǔ)音信號(hào)中提取盡可能 純凈的原始語(yǔ)音,改進(jìn)語(yǔ)音質(zhì)量,消除背景噪聲等方面發(fā)揮著越來(lái)越重要的作用。 1 1 語(yǔ)音增強(qiáng)的意義 現(xiàn)時(shí)生活中的語(yǔ)音不可避免的要受到周?chē)h(huán)境的影響,很強(qiáng)的背景噪聲例如 機(jī)械噪聲、通信設(shè)備內(nèi)部電噪聲以及其他說(shuō)話者的語(yǔ)音均會(huì)嚴(yán)重影響語(yǔ)音信號(hào)的 質(zhì)量,環(huán)境噪聲的污染也使得許多語(yǔ)音處理系統(tǒng)的性能急劇惡化。例如,基于語(yǔ) 音生成模型的低碼率參數(shù)編碼中涉及至u l p c 系數(shù)的求解,該系數(shù)對(duì)語(yǔ)音的編解碼質(zhì) 量有重要的影響,由于噪聲的干擾導(dǎo)致l p c 系數(shù)的精確求解十分困難,從而極大地 降低了重建語(yǔ)音的質(zhì)量。目前的語(yǔ)音識(shí)別系統(tǒng)雖然己達(dá)到較高的識(shí)別率,但其前 提是在理想的環(huán)境或?qū)嶒?yàn)室環(huán)境中,在有噪聲的環(huán)境中,這些語(yǔ)音識(shí)別系統(tǒng)的識(shí) 別率會(huì)普遍地大幅度下降。原因在于大多數(shù)語(yǔ)音應(yīng)用系統(tǒng)都是建立在理想應(yīng)用環(huán) 境中的,所謂的理想環(huán)境是指不存在背景噪聲,話者干擾,和信道畸變的場(chǎng)合。 非理想環(huán)境對(duì)語(yǔ)音系統(tǒng)的影響,概括起來(lái)體現(xiàn)在以下幾個(gè)方面: ( 1 ) 在語(yǔ)音通信中使語(yǔ)音信號(hào)清晰度和可懂度下降,并導(dǎo)致聽(tīng)覺(jué)疲勞; ( 2 ) 在語(yǔ)音識(shí)別中使應(yīng)用條件與訓(xùn)練條件失配,從而導(dǎo)致識(shí)別率下降; ( 3 ) 在語(yǔ)音低速率參數(shù)編碼中使語(yǔ)音生成模型參數(shù)的提取受到嚴(yán)重干擾,導(dǎo)致 重建語(yǔ)音質(zhì)量惡化。 諸多干擾因素中,信道畸變?cè)诤芏嗲闆r下可以被有效的控制或避免,但是噪 聲的影響卻是無(wú)處不在,無(wú)法避免。語(yǔ)音增強(qiáng)是語(yǔ)音信號(hào)處理與識(shí)別系統(tǒng)的重要 組成部分。由于干擾通常都是隨機(jī)的,因而從帶噪語(yǔ)音中提取完全純凈的語(yǔ)音幾 乎不可能。因此語(yǔ)音增強(qiáng)的目的主要是改進(jìn)語(yǔ)音質(zhì)量,消除背景噪聲,提高語(yǔ)音 的自然度,使人樂(lè)于接受,這是一種客觀度量;其次是提高語(yǔ)音可懂度,這是一 種主觀度量。所以語(yǔ)音增強(qiáng)的目標(biāo)對(duì)收聽(tīng)人而占主要是減少疲勞,改善語(yǔ)音質(zhì)量, 提高語(yǔ)音可懂度;對(duì)語(yǔ)音處理系統(tǒng)( 識(shí)別器,聲碼器,手機(jī)) 而言主要是提高系 非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究 統(tǒng)的識(shí)別率和抗干擾能力。因此在實(shí)際需求的推動(dòng)下,語(yǔ)音增強(qiáng)在許多領(lǐng)域得到 了廣泛應(yīng)用。 1 2 語(yǔ)音增強(qiáng)的研究歷史 語(yǔ)音增強(qiáng)這個(gè)研究課題早在6 0 年代即引起人們的注意,隨著數(shù)字信號(hào)處理理 論的成熟,7 0 年代取得了一些基礎(chǔ)性成果,使語(yǔ)音增強(qiáng)發(fā)展成為語(yǔ)音信號(hào)處理領(lǐng) 域的一個(gè)重要分支。1 9 7 8 年,l i n 和o p p e h e i m 提出了語(yǔ)音增強(qiáng)的維納濾波方法【1 】o 1 9 7 9 年,b o l l 提出了用譜減法來(lái)抑制噪聲【2 j 。1 9 8 0 年,m a u l a y 和m a l p a s s 提出了 軟判決噪聲抑制方法【3 j 。1 9 8 4 年,e p h r a i n 和m a l a h 提出了基于m m s e 短時(shí)譜估 計(jì)的語(yǔ)音增強(qiáng)方法【4 】。1 9 8 7 年,p a l i w a l 把卡爾曼濾波引入到語(yǔ)音增強(qiáng)領(lǐng)域【5 】。在 近4 0 年的研究中,各種語(yǔ)音增強(qiáng)方法不斷被提出,奠定了語(yǔ)音增強(qiáng)領(lǐng)域的基礎(chǔ)并 使之逐漸走向成熟。 在語(yǔ)音增強(qiáng)過(guò)程中,消除噪聲、提高語(yǔ)音信噪比和提高語(yǔ)音的可懂度是一對(duì) 矛盾,要濾除噪聲或多或少肯定會(huì)損害語(yǔ)音信號(hào)。一般地說(shuō),噪聲濾除的越多, 語(yǔ)音信號(hào)被損的程度就越利害,語(yǔ)音的可懂度就越低,特別是在低信噪比的情況 下,這一矛盾更加突出。 近年來(lái),人們針對(duì)聽(tīng)覺(jué)外周提出了一些計(jì)算模型1 6 ,并在語(yǔ)音編碼,音頻壓縮 和音質(zhì)的客觀度量等方面獲得了應(yīng)用,同時(shí),基于人類聽(tīng)覺(jué)特性的語(yǔ)音增強(qiáng)研究 也取得了一些進(jìn)展。目前,在語(yǔ)音增強(qiáng)中用的比較成功的是聽(tīng)覺(jué)掩蔽效應(yīng)【7 ,8 ,9 】,通 過(guò)改變帶噪語(yǔ)音的短時(shí)譜幅度使得所有噪聲成分都能夠被語(yǔ)音信號(hào)掩蔽掉。但是 由于其算法復(fù)雜,實(shí)現(xiàn)起來(lái)有很大困難。 1 3 語(yǔ)音和噪聲特性 語(yǔ)音增強(qiáng)與語(yǔ)音信號(hào)處理理論有關(guān),而且涉及到人的聽(tīng)覺(jué)感知和語(yǔ)音學(xué);噪 聲來(lái)源眾多,隨應(yīng)用場(chǎng)合而異,它們的特性也不同,即使在實(shí)驗(yàn)室仿真條件下, 也難以找到一種通用的語(yǔ)音增強(qiáng)算法可以適用于各種噪聲環(huán)境。因此必須針對(duì)不 同環(huán)境下的噪聲采取不同的語(yǔ)音增強(qiáng)策略。我們首先要了解一下語(yǔ)音和噪聲的有 關(guān)特性【1 0 1 。 1 3 1 語(yǔ)音和人耳感知特性 語(yǔ)音是時(shí)變、非平穩(wěn)、非遍歷的隨機(jī)過(guò)程。語(yǔ)音發(fā)聲是一個(gè)時(shí)變過(guò)程,很多 因素造成了發(fā)聲系統(tǒng)的時(shí)變性,例如聲道的面積隨著時(shí)間和距離改變,氣流速度 隨著聲門(mén)處壓力變化而變化等。但是聲道形狀有相對(duì)穩(wěn)定性,在一段時(shí)間內(nèi) 第一章緒論 ( 1 0 3 0 m s ) ,人的聲帶和聲道形狀是相對(duì)穩(wěn)定的,可認(rèn)為其特征是不變的,因而 語(yǔ)音的短時(shí)譜具有相對(duì)穩(wěn)定性,在語(yǔ)音分析中可以把語(yǔ)音信號(hào)分為若干分析幀, 每一幀的語(yǔ)音可以認(rèn)為是準(zhǔn)穩(wěn)定的。 語(yǔ)音可以分為周期性的濁音和非周期的清音。濁音和清音經(jīng)常在一個(gè)音節(jié)中 同時(shí)出現(xiàn)。濁音部分和音質(zhì)關(guān)系密切,在時(shí)域上呈現(xiàn)出明顯的周期性,在頻域上 有共振峰結(jié)構(gòu),而且能量大部分集中在較低頻段內(nèi),是語(yǔ)音中大幅度高能量的部 分;清音則具有明顯的時(shí)域和頻域特征,類似于白噪聲,能量較小,在強(qiáng)噪聲中 容易被掩蓋,但在較高信噪比時(shí)能提供較多的信息。在語(yǔ)音增強(qiáng)中,可以利用濁 音的周期性特征,采用梳狀濾波器提取語(yǔ)音分量或者抑制非語(yǔ)音信號(hào),而清音則 難以與寬帶噪聲區(qū)分。 由于語(yǔ)音增強(qiáng)效果最終取決于人的主觀感受,所以語(yǔ)音感知對(duì)語(yǔ)音增強(qiáng)研究 有重要作用。人耳對(duì)背景噪聲有很大的抑制作用,了解其機(jī)理將有助于對(duì)語(yǔ)音增 強(qiáng)技術(shù)進(jìn)行研究。 語(yǔ)音感知問(wèn)題涉及到生理學(xué)、心理學(xué)、聲學(xué)和語(yǔ)音學(xué)諸多領(lǐng)域,其中很多問(wèn) 題有待進(jìn)一步研究。目前已有一些結(jié)論可用于語(yǔ)音增強(qiáng): ( 1 ) 人耳對(duì)語(yǔ)音的感知主要是通過(guò)語(yǔ)音信號(hào)頻譜幅度獲得的,對(duì)相位譜則不敏 感。 ( 2 ) 人耳對(duì)頻率高低的感受近似與該頻率的對(duì)數(shù)值成正比。 ( 3 ) 人耳有掩蔽效應(yīng),即強(qiáng)信號(hào)對(duì)弱信號(hào)有抑制作用,能夠?qū)⑵溲谏w。具體說(shuō) 來(lái),所謂人耳的聽(tīng)覺(jué)掩蔽效應(yīng)是指一個(gè)聲音的存在會(huì)影響對(duì)另外一個(gè)較弱聲音的 聽(tīng)覺(jué),即一個(gè)聲音在聽(tīng)覺(jué)上掩蔽了另一個(gè)較弱聲音的存在,使人覺(jué)得另一個(gè)較弱 的聲音不存在。另外,當(dāng)一個(gè)聲音突然停止,人耳約在1 5 0 m s 內(nèi)對(duì)其它弱音聽(tīng)不 清楚,甚至聽(tīng)不見(jiàn)。因而,利用人耳的生理特點(diǎn),提高語(yǔ)音信號(hào)的信噪比,使有 用的語(yǔ)音信號(hào)大于噪聲一定級(jí)別,就可以在語(yǔ)音與噪聲共存的情況下使人耳感覺(jué) 不到噪聲的存在。 ( 4 ) 共振峰對(duì)語(yǔ)音的感知十分重要,特別是第二共振峰比第一共振峰更為重 要,因此對(duì)語(yǔ)音信號(hào)進(jìn)行一定程度的高通濾波不會(huì)對(duì)可懂度產(chǎn)生影響。 ( 5 ) 人耳在兩個(gè)人以上的說(shuō)話環(huán)境中能夠分辨出需要聆聽(tīng)的聲音。 1 3 2 噪聲特性 噪聲來(lái)源取決于實(shí)際的應(yīng)用環(huán)境,因而噪聲特性可以說(shuō)變化無(wú)窮。噪聲可以 是加性的,也可以是非加性的,非加性噪聲主要是殘響及傳送網(wǎng)絡(luò)的電路噪聲等。 對(duì)于非加性噪聲,有些可以通過(guò)變換轉(zhuǎn)變?yōu)榧有栽肼?,例如,乘性噪聲可以通過(guò) 同態(tài)變換成為加性噪聲;某些與信號(hào)相關(guān)的量化噪聲可以通過(guò)偽隨機(jī)噪聲擾動(dòng)的 4 非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究 方法變換成與信號(hào)獨(dú)立的加性噪聲。加性噪聲大致上有:周期性噪聲、脈沖噪聲、 寬帶噪聲和同聲道的其它語(yǔ)音干擾等。 周期性噪聲主要來(lái)源于發(fā)動(dòng)機(jī)等周期性運(yùn)轉(zhuǎn)的機(jī)械,電氣干擾,特別是電源 交流聲也會(huì)引起周期性噪聲,其特點(diǎn)是有許多離散的窄譜峰。周期性噪聲可以通 過(guò)濾波或變換技術(shù)將其去除。 脈沖噪聲來(lái)源于爆炸、撞擊和放電等,表現(xiàn)為時(shí)域波形中突然出現(xiàn)的窄脈沖。 這種噪聲可以在時(shí)域內(nèi)進(jìn)行,根據(jù)帶噪語(yǔ)音幅度的平均值確定閾值,當(dāng)信號(hào)幅度 超出這個(gè)閾值時(shí),判別為脈沖噪聲并將其衰減消除。 寬帶噪聲的來(lái)源很多,包括熱噪聲、氣流( 如風(fēng)、呼吸) 噪聲及各種隨機(jī)噪 聲源,量化噪聲通常作為白噪聲來(lái)處理,也可視為寬帶噪聲。由于寬帶噪聲與語(yǔ) 音信號(hào)在時(shí)域和頻域上完全重疊,因而消除它最困難。平穩(wěn)的寬帶噪聲,通常可 認(rèn)為是白色高斯噪聲。 同聲道語(yǔ)音干擾是指當(dāng)多個(gè)語(yǔ)音疊加在一起同時(shí)在單信道中傳輸時(shí),雙耳信 號(hào)因合并而消失。消除這種干擾可以利用語(yǔ)音和干擾語(yǔ)音的基音不同并不成整數(shù) 倍,采用梳狀濾波器提取基音和各次諧波,再恢復(fù)出有用語(yǔ)音信號(hào)。 背景噪聲對(duì)發(fā)音的影響主要是指噪聲破環(huán)了語(yǔ)音信號(hào)原有的聲學(xué)持征和模型 參數(shù),模糊了不同語(yǔ)音之間的差別,使語(yǔ)音質(zhì)量下降,可懂度降低。強(qiáng)噪聲會(huì)使 人產(chǎn)生聽(tīng)覺(jué)疲勞,還對(duì)講話人產(chǎn)生影響,使講話人改變?cè)诎察o環(huán)境或低噪聲環(huán)境 中的發(fā)音方式,從而改變了語(yǔ)音的特征參數(shù),這對(duì)語(yǔ)音識(shí)別系統(tǒng)有很大影響。 1 4 語(yǔ)音增強(qiáng)算法概述 盡管目前語(yǔ)音增強(qiáng)在理論上尚未完全解決,還有待發(fā)展,但某些語(yǔ)音增強(qiáng)算 法已證明是有效的,它們大體上可分為四類:噪聲對(duì)消法、諧波增強(qiáng)法、基于參 數(shù)估計(jì)的語(yǔ)音再合成法和基于語(yǔ)音短時(shí)譜估計(jì)的語(yǔ)音增強(qiáng)算法【1 1 1 。上述算法各有 長(zhǎng)處及限制。 這里簡(jiǎn)單介紹一下各種語(yǔ)音增強(qiáng)方法的基本原理及其長(zhǎng)處與限制。 ( 1 ) 噪聲對(duì)消法 噪聲對(duì)消法的基本原理是從帶噪語(yǔ)音中減去噪聲。圖1 1 給出了雙話筒采集系 統(tǒng)的噪聲對(duì)消器原理框圖。圖中帶噪語(yǔ)音序列刪和噪聲序列d c n ) 經(jīng)傅里葉變換后 得到各自的頻域分量,噪聲分量幅度譜經(jīng)數(shù)字濾波后與帶噪語(yǔ)音相減,然后加上 帶噪語(yǔ)音頻譜分量的相位,再經(jīng)傅里葉反變換恢復(fù)為時(shí)域信號(hào)。 第一章緒論 圖1 1 雙話筒采集的噪聲對(duì)消法原理框圖 自適應(yīng)濾波器通常采用f i r 濾波器,其系數(shù)可以采用最小均方誤差( l m s ) 準(zhǔn)則進(jìn)行估計(jì),使如下誤差信號(hào)最?。?衛(wèi) e ( n ) = 【s ( n ) + d ( 玎) 卜,( 刀) = 【s ( n ) + d ( 刀) 】一芝:w k r ( n k ) ( 1 1 ) 西 式中,1 ,例是帶噪信號(hào)濾波后的結(jié)果,倒是第二個(gè)話筒采集到的噪聲信號(hào),為 濾波器系數(shù),為f i r 濾波器的抽頭數(shù)。只要噪聲與話音相互獨(dú)立,使p 例的平均 值最小,就能得到最接近于帶噪語(yǔ)音中的噪聲復(fù)制品。但若采集到的噪聲與話音 是相關(guān)的,則濾波器系數(shù)只能在語(yǔ)音間歇期間進(jìn)行刷新。抽頭數(shù)與兩個(gè)話筒相 隔距離有關(guān),兩個(gè)話筒相隔數(shù)米時(shí),值甚至可以取大于1 0 0 0 。 在強(qiáng)背景噪聲時(shí),這種方法可以得到很好的消噪效果。噪聲對(duì)消法的一個(gè)缺 點(diǎn)是增強(qiáng)后的語(yǔ)音中會(huì)含有明顯的“音樂(lè)噪聲 ,這是由頻譜相減而產(chǎn)生的一種殘 留噪聲,具有一定的節(jié)奏性起伏感,故而稱為“音樂(lè)噪聲 。自適應(yīng)對(duì)消器的性能 還受到串音及回響的影響【1 2 】,另外由于參考話筒的位置對(duì)降噪效果影響很大,使 其在頭戴式通信產(chǎn)品及整機(jī)中的安裝比較困難,給設(shè)計(jì)和使用帶來(lái)很多不方便。 ( 2 ) 諧波增強(qiáng)法 這是基于語(yǔ)音的周期性的一種增強(qiáng)方法。語(yǔ)音信號(hào)的濁音段有明顯的周期性, 利用這一特點(diǎn),可以采用自適應(yīng)梳狀濾波器來(lái)提取語(yǔ)音分量,抑制噪聲分量。 梳狀濾波器可以在時(shí)域?qū)崿F(xiàn),表達(dá)式為 旦 y ( 咒) = :c k x ( n 一肼) ( 1 - 2 ) 女三刁 式中,三為基頻周期:m 為常數(shù);x 例是濾波器的輸入信號(hào)序列;y 例是輸出信號(hào) 序列;g 為系數(shù),根據(jù)信號(hào)周期而變化。輸出信號(hào)是輸入信號(hào)延時(shí)加權(quán)和的平均 值。當(dāng)延時(shí)與周期一致時(shí),這個(gè)平均過(guò)程將使周期性分量得到加強(qiáng),抑制或消除 其他非周期性分量或與信號(hào)周期不同的其他周期性分量。 梳狀濾波器也可以在頻域?qū)崿F(xiàn)。對(duì)語(yǔ)音信號(hào)進(jìn)行傅里葉變換后可以鑒別出需 要提取的各次諧波分量,然后經(jīng)傅罩葉反變換恢復(fù)為時(shí)域信號(hào)。 這種方法關(guān)鍵是要精確估計(jì)出語(yǔ)音信號(hào)的基音周期,這在強(qiáng)背景噪聲干擾下 6 非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究 是很困難的事情。在基音發(fā)生變化的過(guò)渡段,這種方法會(huì)受到嚴(yán)重影響。 ( 3 ) 基于語(yǔ)音生成模型的增強(qiáng)算法 眾所周知,語(yǔ)音的發(fā)生過(guò)程可以模型化為激勵(lì)源作用于一個(gè)線性時(shí)變?yōu)V波器, 激勵(lì)源可以分濁音和清音兩類。時(shí)變?yōu)V波器則是聲道的模型,如圖1 2 所示。通常 認(rèn)為聲道模型是一個(gè)全極點(diǎn)濾波器,其參數(shù)可以通過(guò)線性預(yù)測(cè)分析得到,但考慮 到鼻腔的共鳴作用,采用零極點(diǎn)模型更為合適。所以,如果知道激勵(lì)參數(shù)和聲道 濾波器的參數(shù),就可利用語(yǔ)音生成模型合成得到“純凈的語(yǔ)音 ,這種方法的關(guān)鍵 在于如何從帶噪語(yǔ)音中準(zhǔn)確地估計(jì)語(yǔ)音模型的參數(shù)( 包括激勵(lì)參數(shù)和聲道參數(shù)) 。 鑒于激勵(lì)參數(shù)難以準(zhǔn)確估計(jì),也可以只利用聲道參數(shù)構(gòu)造濾波器進(jìn)行濾波處理。 傳統(tǒng)用的兩種基于語(yǔ)音生成模型的算法為維納濾波和卡爾曼濾波法i l 引。維納 濾波法,首先要依據(jù)最大后驗(yàn)概率準(zhǔn)則估計(jì)l p c 生成模型的參數(shù),然后利用參數(shù) 構(gòu)造非因果的維納濾波器對(duì)帶噪語(yǔ)音進(jìn)行濾波,但維納濾波只在平穩(wěn)的條件下才 能保證最小均方誤差意義下的最優(yōu)估計(jì),而語(yǔ)音是非平穩(wěn)的,只能在短時(shí)間內(nèi)近 似是平穩(wěn)的。另一方面它沒(méi)有完全利用語(yǔ)音的生成模型。而卡爾曼濾波可以彌補(bǔ) 以上兩個(gè)缺陷,它完全基于語(yǔ)音生成模型,且在非平穩(wěn)條件下,也保證最小均方 誤差意義下的最優(yōu)估計(jì)。 圖1 2 基于語(yǔ)音生成模型的語(yǔ)音增強(qiáng)原理框圖 實(shí)際的增強(qiáng)試驗(yàn)表明,兩種算法在不同程度上都能消除噪聲,提高信噪比。 但是主觀試聽(tīng)發(fā)現(xiàn)它們都對(duì)語(yǔ)音造成了一定的損傷。我們?cè)趯?duì)該算法的仿真中發(fā) 現(xiàn),上述算法的缺陷在于盡管多次迭代確實(shí)使后驗(yàn)概率增大了,但這種迭代也帶 來(lái)了明顯的副作用。其中之一就是每迭代一次聲道譜的共振峰寬度減小,同時(shí)位 置也出現(xiàn)抖動(dòng),從而使增強(qiáng)后的語(yǔ)音帶有不悅耳的聲音。 ( 4 ) 基于短時(shí)譜幅度估計(jì)的方法 如前所述,語(yǔ)音是非平穩(wěn)的隨機(jī)過(guò)程,但在1 0 - - 3 0 m s 內(nèi)可以近似看成是平穩(wěn) 的。如果能從帶噪語(yǔ)音的短時(shí)譜中估計(jì)出“純凈 語(yǔ)音的短時(shí)譜,則可達(dá)到增強(qiáng) 的目的。 基于s t s a 的語(yǔ)音增強(qiáng)法包括譜減法及其各種變形【1 】,最小均方誤差估計(jì)法 ( m m s e ) 等。該類方法認(rèn)為語(yǔ)音信號(hào)的短時(shí)譜幅度( s t s a ) 對(duì)語(yǔ)音的感知起主 第一章緒論 導(dǎo)作用,從而在語(yǔ)音增強(qiáng)中需要精確估計(jì),而相位對(duì)語(yǔ)音的感知并不重要,沒(méi)有 必要精確估計(jì)。文獻(xiàn) 1 4 1 通過(guò)試驗(yàn)為此提供了一定的依據(jù),文獻(xiàn) 4 ,1 5 】則證明在一 定條件下的語(yǔ)音相位的最小均方誤差估計(jì)值就是帶噪相位本身,因此基于s t s a 估計(jì)的語(yǔ)音增強(qiáng)方法一般都直接采用了帶噪語(yǔ)音的相位作為增強(qiáng)語(yǔ)音的相位。 譜減法通過(guò)從帶噪語(yǔ)音的s t s a 中直接減去噪聲的平均譜幅度來(lái)得到增強(qiáng)語(yǔ) 音的s t s a ,實(shí)現(xiàn)起來(lái)簡(jiǎn)單,但是剩余噪聲大,并且產(chǎn)生不舒服的“音樂(lè)噪聲 。 其基本原理框圖如圖1 3 所示。圖中,文、j ( 力) 為s k ,s ( n ) 的估值。后來(lái),e p h r a i m 等人提出了s t s a 的m m s e 估計(jì)法,部分的解決了“音樂(lè)噪聲 的問(wèn)題,但在帶 噪語(yǔ)音的信噪比( s n r ) 較低時(shí),其剩余噪聲還是很大的,尤其是當(dāng)信噪比小于 5 d b 時(shí),文獻(xiàn) 1 6 提出了一種幀間約束的m m s e 語(yǔ)音增強(qiáng)算法,但其算法復(fù)雜, 不易實(shí)時(shí)實(shí)現(xiàn)。為充分利用譜減法計(jì)算效率較高的優(yōu)點(diǎn),本文將人耳的聽(tīng)覺(jué)掩蔽 效應(yīng)引入進(jìn)來(lái),用來(lái)減小音樂(lè)噪聲的影響,具體算法將在第三章進(jìn)行詳細(xì)介紹。 “功= s 0 善0 ) 圖1 3 語(yǔ)音短時(shí)譜估計(jì)一般原理框圖 1 5 論文研究工作及內(nèi)容安排 本文研究了低信噪比非平穩(wěn)噪聲下的單通道語(yǔ)音增強(qiáng)算法??紤]到實(shí)時(shí)實(shí)現(xiàn) 對(duì)算法復(fù)雜度的要求,筆者采用了改進(jìn)的中、低復(fù)雜度的譜減法。論文回顧了譜 減的發(fā)展及其優(yōu)缺點(diǎn),然后將聽(tīng)覺(jué)掩蔽效應(yīng)引入到譜減法中,對(duì)譜減系數(shù)進(jìn)行自 適應(yīng)調(diào)整。在保證算法復(fù)雜度較低的前提下,克服了譜減法在低信噪比下音樂(lè)噪 聲較多的缺點(diǎn),提高了增強(qiáng)語(yǔ)音的可懂度。文章采用改進(jìn)的統(tǒng)計(jì)最小的方法對(duì)噪 聲進(jìn)行跟蹤估計(jì),彌補(bǔ)了基于有聲無(wú)聲檢測(cè)在非平穩(wěn)噪聲下不能準(zhǔn)確進(jìn)行噪聲估 計(jì)的缺陷,并利用子窗方法提高了噪聲估計(jì)的計(jì)算效率。此外本文還對(duì)基于聽(tīng)覺(jué) 濾波器組的增強(qiáng)算法進(jìn)行了初步研究。 論文具體的結(jié)構(gòu)和內(nèi)容安排如下: 第二章首先介紹了有聲無(wú)聲檢測(cè)噪聲估計(jì)方法的原理,分析了其主要缺點(diǎn)及 其在非平穩(wěn)噪聲下的不適應(yīng)性,由此引入了基于統(tǒng)計(jì)最小的方法,對(duì)此方法原理 及改進(jìn)進(jìn)行了詳細(xì)推導(dǎo)介紹。 第三章回顧了譜減法的發(fā)展及其優(yōu)缺點(diǎn),對(duì)一種經(jīng)典的改進(jìn)譜減法重點(diǎn)進(jìn)行 8 非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究 了分析,并將聽(tīng)覺(jué)掩蔽效應(yīng)引入到此算法中,依據(jù)掩蔽閾值對(duì)此方法的譜減系數(shù) 自適應(yīng)調(diào)整。詳細(xì)分析了該算法的原理,對(duì)算法各部分的具體實(shí)現(xiàn)作了詳細(xì)討論, 并對(duì)算法進(jìn)行性能評(píng)價(jià),以客觀測(cè)試指標(biāo)測(cè)試了算法仿真結(jié)果。最后,還對(duì)基于 聽(tīng)覺(jué)濾波器組的增強(qiáng)算法進(jìn)行了初步研究。 第四章是論文的總結(jié)和結(jié)論,并指出了今后需要進(jìn)一步研究的工作。 第二章噪聲估計(jì)算法分析與仿真 9 第二章噪聲估計(jì)算法分析與仿真 在基于單通道的帶噪語(yǔ)音信號(hào)處理中,噪聲估計(jì)是非常重要的工作,也是極 其關(guān)鍵的一步,估計(jì)的好壞直接關(guān)系著整個(gè)系統(tǒng)的性能。如果噪聲估計(jì)過(guò)低,殘 余噪聲將會(huì)被人耳感知到;估計(jì)過(guò)高,語(yǔ)音信號(hào)將會(huì)被抑制,同時(shí)降低了語(yǔ)音的 可懂度。然而在實(shí)際中對(duì)噪聲進(jìn)行精確的估計(jì)是相當(dāng)困難的,尤其是在非平穩(wěn)或 者信噪比較低的背景噪聲環(huán)境中。 大部分噪聲估計(jì)算法不能適用于多種復(fù)雜的噪聲環(huán)境,部分算法由于計(jì)算量 的問(wèn)題使得其實(shí)時(shí)性較差1 1 7 】。文獻(xiàn) 1 7 - 2 2 分別介紹了多種噪聲估計(jì)的算法,其中 以根據(jù)有聲無(wú)聲檢測(cè)估計(jì)方法最為成熟,并得到了廣泛應(yīng)用,然而此方法僅在平 穩(wěn)噪聲環(huán)境下較為適用1 2 0 】,當(dāng)噪聲為低信噪比或非平穩(wěn)的情況下,不能跟蹤上噪 聲變化,從而影響了算法的適用范圍,基于此本文提出了改進(jìn)的統(tǒng)計(jì)最小方法【2 4 1 進(jìn)行估計(jì),它能夠跟蹤噪聲的變化,從而能夠適應(yīng)非平穩(wěn)噪聲環(huán)境。本章將對(duì)這 兩種進(jìn)行分析、比較,并重點(diǎn)討論基于統(tǒng)計(jì)最小方法的實(shí)現(xiàn)過(guò)程。 2 1 基于有聲無(wú)聲檢測(cè)的噪聲估計(jì) 帶噪聲語(yǔ)音信號(hào)的有聲無(wú)聲檢測(cè)是帶噪語(yǔ)音信號(hào)處理中很重要的工作。在語(yǔ) 音增強(qiáng)處理中,有聲無(wú)聲檢測(cè)同樣得到了廣泛應(yīng)用,可以利用帶噪語(yǔ)音中檢測(cè)出 的無(wú)聲段噪聲對(duì)當(dāng)前噪聲進(jìn)行估計(jì)。對(duì)于帶噪語(yǔ)音而言,理論上,解決了噪聲估 計(jì)的問(wèn)題也就意味著解決了語(yǔ)音增強(qiáng)問(wèn)題。 傳統(tǒng)上有聲無(wú)聲檢測(cè)算法是利用語(yǔ)音信號(hào)的短時(shí)平穩(wěn)性以及帶噪語(yǔ)音的短時(shí) 能量的概率分布,通過(guò)對(duì)語(yǔ)音短時(shí)能量大小的檢測(cè)進(jìn)行判決。這種檢測(cè)算法的基 本思想是計(jì)算某幀信號(hào)的能量e ,選取適當(dāng)?shù)拈T(mén)限島,若e e r ,判定該幀為噪聲 幀,否則判定該幀為語(yǔ)音幀【2 們。然后再分別針對(duì)噪聲幀和語(yǔ)音幀進(jìn)行噪聲估計(jì)。 2 1 1 判決門(mén)限的選取 設(shè)帶噪語(yǔ)音信號(hào)中的噪聲為加性高斯噪聲【2 5 】,則帶噪語(yǔ)音可表示為 y ( i ) = s ( i ) + 刀( ,)( 2 1 ) 其中s ( i ) 、n ( i ) 分別為語(yǔ)音信號(hào)和噪聲信號(hào)的樣值。s ( i ) 、n ( i ) 不相關(guān),選取幀長(zhǎng) 為三點(diǎn),一幀信號(hào)可表示為 y ( a ,) = y ( a 足+ i ) h ( i ) 非平穩(wěn)環(huán)境下的語(yǔ)音增強(qiáng)算法研究 = s ( z ,f ) + 刀( a ,f ) ,0 i 三一1( 2 - 2 ) 式中y ( z ,i ) 、j ( a ,i ) 、胛( a ,i ) 代表加窗后分幀信號(hào),廳( f ) 為窗函數(shù)。當(dāng) s ( z ,i ) = o ( o i 三一1 ) 時(shí),貝0 y ( z ,f ) = n ( z ,f )( 2 3 ) 該幀信號(hào)為不含語(yǔ)音的純?cè)肼?,信?hào)能量可表示為 e n = y ( 圳】2 = 【咒( 允,i ) 1 2 ( 2 4 ) 一般認(rèn)為噪聲為零均值高斯過(guò)程,則n ( z ,i ) 的概率密度為 ( x ) = 赤e x p ( 一丟) ( 2 5 ) 其中,仃為噪聲均方差。 如果刀( f ) ,刀( ,+ 1 ) ,n ( i + k 一1 ) 互不相關(guān),則的概率密度可表示為口6 】 緲) : 兩志礦( 方肋寺圳 ( 2 - 6 ) t 0z 0 對(duì)于語(yǔ)音幀,由于s 。( f ) 與d 。( f ) 不相關(guān),能量可表示為 p ,= 【s ( f ) 】2 + 【”( 糾2 ( 2 - 7 ) 假設(shè)語(yǔ)音能量s ;k - - 1 【j ( f ) 】:,則該幀信號(hào)能量的條件概率分布為 f f 。o ( x s ) = 【志c 等尸2 一薔娜 p 8 , 0 x s 正倒囝是將向右平移了s 。由式( 2 _ 6 ) 、( 2 8 ) 可畫(huà)出、 | s ) 及誤判概率 圖如圖2 1 所示。 丘( 硝:矗( x ,研 隊(duì)。 圖2 1 厶( 力、0 $ 及誤判概率 第二章噪聲估計(jì)算法分析與仿真

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論