版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第5章語音增強譜減法維納濾波概述基礎(chǔ)知識自適應(yīng)濾波器法聽覺掩蔽法5.1概述現(xiàn)實生活中的語音不可避免的要受到周圍環(huán)境的影響,很強的背景噪聲例如機械噪聲、其它說話者的話音等均會嚴重的影響語音信號的質(zhì)量;此外傳輸系統(tǒng)本身也會產(chǎn)生各種噪聲,因此接收端的信號為帶噪語音信號。語音增強的目的包括:1)改進語音質(zhì)量,消除背景噪音,使聽者樂于接受,不感覺疲勞,這是一種主觀度量;2)提高語音可懂度,這是一種客觀度量。但是兩者往往不能兼得,所以實際應(yīng)用中總是視具體情況而有所側(cè)重的。語音增強不僅涉及信號檢測,波形估計等傳統(tǒng)信號處理理論,而且與語音特性,人耳感知特性密切相關(guān)。而且,實際應(yīng)用中噪聲的來源及種類各不相同,從而造成處理方法的多樣性。因此,要結(jié)合語音特性、人耳感知特性及噪聲特性,根據(jù)實際情況選用合適的語音增強方法。難點:某些噪聲很像語音;有些語音也算噪聲;降噪效率方法:對語音和噪聲分別建模噪音快速建模算法水平:達到軍工要求5.2基礎(chǔ)知識1)人耳感知語音主要是通過語音信號的頻譜分量的幅度,而對相位不敏感,且語音響度與頻譜幅度對數(shù)成正比;2)人耳對100Hz以下的低頻聲音不敏感,對高頻聲尤其是2000~5000Hz的聲音敏感,對3000Hz的聲音最敏感;3)人耳對于頻率的分辨能力受聲強的影響,過強或者太弱的聲音都會導(dǎo)致對頻率的分辨力降低;4)人耳具有掩蔽效應(yīng),聲強較低的頻率成分會受到聲強較高的頻率成分的影響,不易被人耳感知到。5)人類聽覺具有選擇性注意特性,指在嘈雜的環(huán)境下,能將注意力集中在感興趣的聲音上而忽略掉背景聲的能力。5.2.1人耳感知特性5.2.2語音特性語音信號是一種非平穩(wěn)的隨機信號,但在10ms~30ms的時間段內(nèi)語音的某些物理特性和頻譜特性可以近似看作是不變的,可以在語音增強中利用短時頻譜時的平穩(wěn)特性。語音的短時譜的統(tǒng)計特性服從高斯分布。濁音(包括元音)具有明顯的準周期性和較強的振幅,它們的周期所對應(yīng)的頻率就是基音頻率;清輔音的波形類似于白噪聲并具有較弱的振幅。在語音增強中可以利用濁音具有的明顯的準周期性來區(qū)別和抑制非語音噪聲,而清輔音和寬帶噪聲就很難區(qū)分。5.2.3噪聲特性噪聲可以是加性的,也可以是非加性的(可通過某種變換(如同態(tài)濾波)轉(zhuǎn)為加性噪聲)。(1)沖激噪聲:放電,打火,爆炸都會引起沖激噪聲,它的時域波形是類似于沖激函數(shù)的窄脈沖。(2)周期噪聲:最常見的有電動機,風(fēng)扇之類周期運轉(zhuǎn)的機械所發(fā)出的周期噪聲,50Hz交流電源也是周期噪聲。(3)寬帶噪聲:說話時同時伴隨著呼吸引起的噪聲、隨機噪聲源產(chǎn)生的噪聲、以及量化噪聲等都可以視為寬帶噪聲,近似為高斯噪聲或白噪聲。(4)語音干擾:干擾語音信號和待傳語音信號同時在一個信道中傳輸所造成的語音干擾稱為語音干擾。(5)傳輸噪聲:傳輸系統(tǒng)的電路噪聲,與背景噪聲不同,它在時間域里是語音和噪聲的卷積。Impulsivenoisewhitenoisepinknoisebrownnoise5.2.4語音質(zhì)量評價標(biāo)準主觀評價是以人為主體來評價語音的質(zhì)量。語音主觀評價方法種類很多,主要指標(biāo)包括清晰度或可懂度和音質(zhì)兩類。清晰度一般是針對音節(jié)以下(如音素,聲母、韻母)語音測試單元,可懂度則是針對音節(jié)以上(如詞,句)語音測試單元的;音質(zhì)則是指語音聽起來的自然度。無論哪種主觀測試都是建立在人的感覺基礎(chǔ)上的,為了消除個體的差異性,測試環(huán)境應(yīng)盡可能相同,測試語音的樣本也要盡量豐富。在選擇測試者時,不僅應(yīng)該包括女聲,男聲,同時還應(yīng)根據(jù)年齡(包括老人,青年和兒童)選擇不同語音。主觀評價的優(yōu)點是直接易于理解,能真實反映人對語音質(zhì)量的實際感覺,缺點是需要大量的測試者,實施起來比較麻煩,耗時耗力,靈活性差。*主觀評價1)可懂度評價(DRT)DRT是衡量通信系統(tǒng)可懂度的ANSI標(biāo)準之一,它主要用于低速率語音編碼的質(zhì)量測試。這種測試方法使用若干對(通常96對)同韻母單字或單音節(jié)詞進行測試,例如中文的“為”和“費”,英文的“veal”和“feel”等。測試中,評聽人每次聽一對韻字中的某個音,然后判斷所聽到的音是哪個字,全體評聽人判斷正確的百分比就是DRT得分。通常認為DRT為95%以上時清晰度為優(yōu),85%-94%為良,75%-84%為中,65%-75%為差,而65%以下為不可接受。DRT也有局限性,因為其只測試第一輔音,并且每次的選擇只有兩個。在這種情況下,Dynastant公司提出了更為復(fù)雜的改進型韻字測試MRT(ModifiedRhymeTest)。2)音質(zhì)評價——平均意見得分(MOS)MOS得分法是從絕對等級評價法發(fā)展而來的,用于對語音整體滿意度或語音通信系統(tǒng)質(zhì)量進行評價。MOS得分法一般采用5級評分標(biāo)準,包括優(yōu)、良、中、差和劣。得分質(zhì)量級別失真級別5優(yōu)(excellent)不察覺4良(good)剛有察覺,但不可厭3中(fair)有察覺且稍覺可厭2差(poor)明顯察覺且可厭但可忍受1劣(bad)非常可厭,不可忍受2)音質(zhì)評價——判斷滿意度測量(DAM)DAM方法是由Dynastant公司推出的一種評價語音通信系統(tǒng)和通信連接的主觀語音質(zhì)量和滿意度的評測方法,其將直接途徑與間接途徑結(jié)合在一起進行主觀質(zhì)量評價。評聽人既有機會表達個人主觀喜好,又能依標(biāo)準對每項指標(biāo)進行評測。另外,DAM方法要求評聽人分別對語音樣本本身、背景和其它因素進行評價。一個評聽人可將評價過程劃分為21個等級,其中10個等級是信號的感覺質(zhì)量,8個等級是背景情況,另外3級是可懂度、清晰度和總體滿意度。3)主觀測試的原則第一,要保證足夠的說話者,要求其聲音特征非常豐富,能夠代表實際用戶中的絕大部分;第二,要求有足夠多的數(shù)據(jù)。理論上,人數(shù)和數(shù)據(jù)越多越好,可以用方差作為判斷樣本數(shù)的尺度;第三,對于大部分編碼器來說,清晰度和品質(zhì)測試應(yīng)該都做。5.2.4語音質(zhì)量評價標(biāo)準客觀評價必然要借鑒主觀評價的那種高度智能和人性化的過程,但是不可能找到一個絕對完善的測度和十分理想的測試方法,只能盡量利用所獲信息做出基本正確的評價。一般地,一種客觀測度的優(yōu)劣取決于它與主觀評價結(jié)果的統(tǒng)計意義上的相關(guān)程度。主要的客觀評價方法有:基于信噪比的評價方法,如信噪比(SNR)、分段信噪比(segSNR)等,把信噪比作為評價語音質(zhì)量的指標(biāo);基于譜距離的評價方法,如加權(quán)譜斜率測度(WSS),主要比較語音信號之間的平滑譜;基于聽覺模型的評價方法,如語音質(zhì)量感知評價方法(PESQ),以人對語音的感知特性為基礎(chǔ)。*客觀評價1)信噪比SNR信噪比計算簡單,是一種應(yīng)用廣泛的客觀評價方法。由于計算時需要純凈的語音信號,而實際環(huán)境中難以獲得純凈的語音信號,因此信噪比主要用在純凈語音信號已知的實驗仿真中。2)分段信噪比
經(jīng)典形式的信噪比同等對待時域波形中的所有誤差,不能很好地反映語音質(zhì)量的屬性。由于語音信號的時變特性,不同時間段上的信噪比應(yīng)該是不一樣的。分段信噪比定義如下:分段信噪比先計算每一幀的信噪比,再對所有幀的信噪比取平均。3)加權(quán)譜斜率測度WSSWSS使用36個臨界頻帶濾波器來計算,反映純凈語音和處理后語音的頻帶譜斜率間的加權(quán)差距,WSS距離越小,表示兩者之間的差距越小,語音質(zhì)量越好。式中,W(k)表示權(quán)重,Sx(k)和?x(k)分別表示純凈語音和處理后語音的譜斜率,Cx(k)和?x(k)分別表示純凈語音和處理后語音的第k個臨界頻帶譜。4)語音質(zhì)量感知評價方法PESQPESQ方法是國際電信聯(lián)盟ITU在2001年提出的一種新的語音質(zhì)量評價方法,是目前與MOS評分相關(guān)度最高的客觀語音質(zhì)量評價算法,相關(guān)度系數(shù)達到0.97。該算法將參考語音信號和失真語音信號進行電平調(diào)整、輸入濾波器濾波、時間對準和補償、聽覺變換之后,分別提取兩路信號的參數(shù),綜合其時頻特性,得到PESQ分數(shù),最終將這個分數(shù)映射到主觀平均意見分上。PESQ得分范圍在-0.5—4.5之間,得分越高表示語音質(zhì)量越好。PESQ的總體思路為:首先將參考語音信號和失真語音信號的電平調(diào)整到標(biāo)準聽覺電平,再用輸入濾波器模擬標(biāo)準電話聽筒進行濾波,然后將兩個信號進行時間對齊,將對齊好的信號進行聽覺轉(zhuǎn)換,轉(zhuǎn)換之后的輸入和輸出信號差值稱為干擾度,通過認知模型處理,最后得到PESQ分值。在干擾度的處理中可能會識別出壞區(qū)間,這樣就需要對壞區(qū)間進行重新對齊。5)客觀評價特點客觀評定方法的特點是計算簡單,缺點是客觀參數(shù)對增益和延遲都比較敏感,而且最重要的是,客觀參數(shù)沒有考慮人耳的聽覺特性,因此客觀評定方法主要適用于速率較高的波形編碼類型的算法。總結(jié)起來,語音主觀評價和客觀評價各有其優(yōu)缺點。通常這兩種方法應(yīng)該結(jié)合起來使用。一般的原則是,客觀評價用于系統(tǒng)的設(shè)計階段,以提供參數(shù)調(diào)整方面的信息,主觀評價用于實際聽覺效果的檢驗。5.3譜減法譜減法是處理寬帶噪聲較為傳統(tǒng)和有效的方法,其基本思想是在假定加性噪聲與短時平穩(wěn)的語音信號相互獨立的條件下,從帶噪語音的功率譜中減去噪聲功率譜,從而得到較為純凈的語音頻譜。完整的譜減運算公式:將求得的信號
進行IFFT,并借助相位譜來恢復(fù)降噪后的語音時域信號。5.3.1基本原理5.3.1基本原理譜減公式為:式中,a為過減因子,b為增益補償因子。5.3.2改進算法1)在譜減法中使用信號的頻譜幅值或功率譜式中,當(dāng)
γ為1時,算法相當(dāng)于用譜幅值做譜減法;當(dāng)γ
為2時,算法相當(dāng)于用功率譜做譜減法。5.3.2改進算法2)計算平均譜值利用Yi(k)取代
Xi(k),可以得到較小的譜估算方差。3)減少噪聲殘留在減噪過程中保留噪聲的最大值,從而在譜減法中盡可能地減少噪聲殘留,從而削弱“音樂噪聲”。式中,max|NR(k)|代表最大的噪聲殘余。5.4維納濾波基本維納濾波就是用來解決從噪聲中提取信號問題的一種過濾(或濾波)方法。它基于平穩(wěn)隨機過程模型,且假設(shè)退化模型為線性空間不變系統(tǒng)的。實際上這種線性濾波問題,可以看成是一種估計問題或一種線性估計問題。基本的維納濾波是根據(jù)全部過去的和當(dāng)前的觀察數(shù)據(jù)來估計信號的當(dāng)前值,它的解是以均方誤差最小條件下所得到的系統(tǒng)的傳遞函數(shù)
或單位樣本響應(yīng)
的形式給出的,因此常稱這種系統(tǒng)為最佳線性過濾器或濾波器。5.4.1基本原理設(shè)帶噪語音信號為則經(jīng)過維納濾波器
的輸出響應(yīng)
為
由式可知,卷積形式可以理解為從當(dāng)前和過去的觀察值
來估計信號的當(dāng)前值
。因此,用
h(n)進行濾波實際上是一種統(tǒng)計估計問題。定義均方誤差為:5.4.1基本原理使
ξ最小的充要條件是
ξ對于h(n)的偏導(dǎo)數(shù)為零,即上式整理可得
代入可得用相關(guān)函數(shù)表示為5.4.1基本原理改為寫成卷積形式,可得轉(zhuǎn)換為頻域,可得因此,維納濾波器的頻率響應(yīng)為
由于信號與噪聲互不相關(guān),可得該式為維納濾波系統(tǒng)的增益函數(shù),則增強信號的頻譜估計值為
5.4.2改進算法傳統(tǒng)的維納濾波法需要估計出純凈語音信號的功率譜,一般用類似譜減法的方法得到,即用帶噪語音功率譜減去估計到的噪聲功率譜,這種方法會存在殘留噪聲大的問題。改進的維納濾波器為基于先驗信噪比的維納濾波器,其模型為:5.4.2改進算法基于Doblinger的最小值統(tǒng)計方法的噪聲譜估計方法:1)對帶噪語音信號功率譜進行平滑處理2)搜索各頻帶的最小值3)判斷帶噪語音功率譜中各頻帶是否存在語音5.4.2改進算法4)計算語音出現(xiàn)概率5)更新噪聲譜5.4.2改進算法基于更新的噪聲譜可推得改進的系統(tǒng)增益函數(shù):1)后驗信噪比2)先驗信噪比3)系統(tǒng)增益函數(shù)5.5自適應(yīng)濾波器法實際信號的頻譜分布是比較均勻的,因此對一個受到加性噪聲污染的信號通常采用自適應(yīng)濾波器進行降噪。自適應(yīng)濾波器具有自動調(diào)節(jié)自身參數(shù)的能力,故其對信號和噪聲的先驗知識需求較少。所謂自適應(yīng)濾波器就是利用前一時刻已獲得的濾波器參數(shù)等結(jié)果,自動地調(diào)節(jié)現(xiàn)時刻的濾波器參數(shù),以適應(yīng)信號和噪聲未知的隨機變化的統(tǒng)計特性,從而實現(xiàn)最優(yōu)濾波。因此,無論在信噪比方面還是在語音可懂度方面,自適應(yīng)濾波器都能獲得較大的提高。5.5.1最小均方誤差濾波器最小均方誤差(LMS)算法就是以已知期望響應(yīng)和濾波器輸出信號之間誤差的均方值最小為準的,依據(jù)輸入信號在迭代過程中估計梯度矢量,并更新權(quán)系數(shù)以達到最優(yōu)的自適應(yīng)迭代算法。LMS算法是一種梯度最速下降方法,其顯著的特點和優(yōu)點是它的簡單性,這種算法不需要計算相應(yīng)的相關(guān)函數(shù),也不需要進行矩陣運算。5.5.1最小均方誤差濾波器濾波器的輸出
表示為:誤差e(n)為優(yōu)化該問題可令E{|e2(n)|}對
wn*(k)的導(dǎo)數(shù)為零來求解,有代入,整理可得其矢量表示為:5.5.1最小均方誤差濾波器Rx(n)是一個
的共軛對稱自相關(guān)陣,如果矩陣是滿秩的,可得到權(quán)系數(shù)的最佳值:但是,等式右邊的運算在實際中是不易實現(xiàn)的。為此,對于一些在線或?qū)崟r應(yīng)用場合常使用迭代算法,對每次采樣值求出較佳權(quán)系數(shù)。迭代算法可以避免復(fù)雜的求逆運算,又能實時求得最佳近似解,因而切實可行。5.5.1最小均方誤差濾波器LMS算法是以最快下降法為原則的迭代算法,通過在二次誤差曲面的最大下降方向上取一個
步長的增量來修正結(jié)果。
由于期望值
是未知的,因此要用樣本平均來估計,即
當(dāng)用一個樣本來估計(N=1)時,權(quán)矢量修正式可簡化為
5.5.1最小均方誤差濾波器對于LMS算法來說,正值的步長μ
將影響權(quán)矢量收斂到誤差曲面極小點的速率。如果μ非常小,則wn的修正量也小,收斂速度較慢;若
μ增大,收斂速度加快。但是的增大有一個上限,超過該上限將導(dǎo)致wn的軌跡不穩(wěn)定,且無界。設(shè)計LMS自適應(yīng)濾波器的一個難點是步長μ的選擇。5.5.2歸一化最小均方誤差濾波器對于具有
個系數(shù)的濾波器,LMS算法每次修正權(quán)矢量只需N次乘法和N次加法,另外,計算誤差e(n)需要一次加法,計算μe(n)需要一次乘法。最后,計算輸出N次乘法和(N-1)次加法。所以,每次修正的總計算量是(2N+1)次乘法和2N次加法。雖然LMS算法對期望值的估計很粗略,但算法實現(xiàn)簡單,不依賴模型,性能穩(wěn)健,因此實際應(yīng)用比較成功。5.5.2歸一化最小均方誤差濾波器歸一化的NLMS算法可表示為:從計算量看,NLMS算法比LMS算法多了一個歸一化項||x(n)||2的計算。為減少其計算量,可遞歸的估算該項,即因此,每次只多了兩次平方運算、一次加法和一次減法。5.5.3自適應(yīng)陷波器對于周期噪聲,采用陷波器是較為簡便和有效的降噪方法。算法基本思路和要求是設(shè)計的陷波器的幅頻曲線的凹處對應(yīng)于周期噪聲的基頻和各次諧波,設(shè)計的關(guān)鍵是通過合理設(shè)計使這些頻率處的陷波寬度足夠窄。簡單的數(shù)字陷波器的傳遞函數(shù)如下:N/T(N為整數(shù))的頻率將被濾除掉。5.5.3自適應(yīng)陷波器數(shù)字濾波器的極零點接近時,信號頻譜變化較為緩慢,而在陷波頻率處急劇衰減,故引入反饋:當(dāng)
越接近1時,分母在零點附近處有抵消作用,梳齒帶寬變的越窄,通帶較為平坦,陷波效果越好。5.5.4干擾抑制對于大多數(shù)情況,純凈信號是不能直接獲得的,此類問題統(tǒng)稱為干擾抑制問題。此
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基礎(chǔ)路面土方合同范例
- 天津濱海職業(yè)學(xué)院《電磁場的數(shù)值方法》2023-2024學(xué)年第一學(xué)期期末試卷
- 專用裝備采購合同范例
- 施工投標(biāo)合同范例
- 會計合伙合同范例
- 倉房搭建合同范例
- 叉車購銷轉(zhuǎn)讓合同范例
- 商鋪租賃續(xù)租合同范例
- 口腔內(nèi)科學(xué)模擬練習(xí)題(附答案)
- 2025年鐵嶺貨運資格證考試有哪些項目
- 全套教學(xué)課件《工程倫理學(xué)》
- 大數(shù)據(jù)+治理智慧樹知到期末考試答案章節(jié)答案2024年廣州大學(xué)
- 江蘇省建筑與裝飾工程計價定額(2014)電子表格版
- T-SDDA 0002-2021 住宅裝飾裝修工程質(zhì)量驗收標(biāo)準
- 小學(xué)寫字閱讀考核實施方案
- 震雄注塑機Ai_01操作說明書(中文)
- 四川省煤礦探放水基準線“兩把鎖”管理規(guī)定
- 壓力管道元件產(chǎn)品合格證
- 10KV變電站供電系統(tǒng)設(shè)計
- 15立方米的液氯儲罐課程設(shè)計說明書
- 發(fā)現(xiàn)所授薪律師及律師助理管理辦法
評論
0/150
提交評論