版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1第九章語音檢測分析 9.1基 音 檢 測自相關(guān)法并行處理法倒譜法簡化逆濾波法9.2共振峰估值帶通濾波器組法離散傅里葉變換(DFT)倒譜法LPC法語音檢測分析主要涉及語音特征參數(shù)的提取和分析。 29.1基 音 檢 測基音是語音信號的一個重要參數(shù),在語音產(chǎn)生的數(shù)字模型中它也是激勵源的一個重要參數(shù)?;羰侵赴l(fā)濁音時聲帶振動所引起的周期性,而基音周期是指聲帶振動頻率的倒數(shù)。準(zhǔn)確地檢測語音信號的基音周期對于高質(zhì)量的語音分析與合成、語音壓縮編碼、語音識別和說話人確認(rèn)等具有重要的意義。 39.1基 音 檢 測基音檢測的主要困難反映在: 聲門激勵信號并不是一個完全周期的序列,在語音的頭、尾部并不具有聲帶振動
2、那樣的周期性。在許多情況下,清音語音和低電平濁音語音段之間的過渡段是非常細(xì)微的,確認(rèn)它是極其困難的。 從語音信號中去除聲道影響,直接取出僅和聲帶振動有關(guān)的激勵信號的信息并不容易,例如聲道的共振峰有時會嚴(yán)重影響激勵信號的諧波結(jié)構(gòu)。這種影響在發(fā)音器官快速動作而共振峰也快速改變時,對基音檢測是最具危害性的。49.1基 音 檢 測 語音信號包含有十分豐富的諧波分量,基音頻率最低可達(dá)80Hz左右,最高可達(dá)500Hz左右,但基音頻率處在100200Hz的情況占多數(shù)。因此,濁音信號可能包含有三四十次諧波分量,而其基波分量往往不是最強(qiáng)的分量。因為語音的第一共振峰通常在3001 000Hz范圍內(nèi),這就是說,28
3、次諧波成分常常比基波分量還強(qiáng)。豐富的諧波成分使語音信號的波形變得非常復(fù)雜,經(jīng)常發(fā)生基頻估計結(jié)果為實際值的二、三次倍頻或二次分頻的情況。59.1基 音 檢 測 在濁音段很難精確地確定每個基音周期的開始和結(jié)束位置,這不僅因為語音信號本身是準(zhǔn)周期性的(即音調(diào)是有變化的),還由于波形的峰或過零受共振峰的結(jié)構(gòu)、噪聲等的影響。 在實際應(yīng)用中,背景噪聲強(qiáng)烈影響基音檢測的性能,這對于移動通信環(huán)境尤為重要,因為經(jīng)常會出現(xiàn)高電平噪聲。 基音頻率變化范圍大,從老年男性的80Hz到兒童女性的500Hz,接近三個倍頻程,給基音檢測帶來了一定的困難。69.1基 音 檢 測基音檢測方法的研究: 穩(wěn)定并提取準(zhǔn)周期性信號的周期
4、性方法; 因周期混亂,采取基音提取誤差補償?shù)姆椒ǎ?消除聲道(共振峰)影響的方法。在基音提取時,容易錯誤地提取真正基頻兩倍的頻率(倍基音)和基頻一半的頻率(半基音),至于產(chǎn)生哪種錯誤隨抽取方法而變化。79.1基 音 檢 測基音檢測的方法大致可分為三類: 波形估計法。直接由語音波形來估計,分析出波形上的周期峰值。其特點除了比較簡單、硬件實現(xiàn)容易外,還可定出峰值點的位置,這在一些處理中是很有用的。 相關(guān)處理法。在時域中,周期信號的最明顯特征就是波形的類似性,因而可以通過比較原始信號和它位移后的信號之間的相似性來確定基音周期。如果移位距離等于基音周期,那么,兩個信號具有最大類似性(相關(guān)性最強(qiáng))。大多
5、數(shù)現(xiàn)存的基音檢測法都基于這一概念,最具代表性的是自相關(guān)函數(shù)法。這種方法在語音信號處理中被廣泛使用,這是因為相關(guān)處理法抗波形的相位失真強(qiáng),另外它在硬件處理上結(jié)構(gòu)簡單。 變換法。將語音信號變換到頻域或倒譜域來估計。比如倒譜法(CEP) 。雖然倒譜分析算法比較復(fù)雜,但基音估計效果較好。89.1基 音 檢 測直方圖(Histogram)也叫柱狀圖,是一種統(tǒng)計報告圖,由一系列高度不等的縱向條紋表示數(shù)據(jù)分布的情況。99.1基 音 檢 測自相關(guān)法 濁音信號的自相關(guān)函數(shù)在基音周期的整數(shù)倍位置上出現(xiàn)峰值,而清音的自相關(guān)函數(shù)沒有明顯的峰值出現(xiàn);因此檢測是否有峰值就可判斷是清音或濁音,檢測峰值的位置就可提取基音周期
6、值。短時自相關(guān)函數(shù)中保留的語音信號的幅度太多,它有許多峰值,而其中許多都起因于聲道響應(yīng)的阻尼振蕩。當(dāng)基音的周期性和共峰峰的周期性混疊在一起時,被檢測出來的峰值就會偏離原來峰值的真實位置。109.1基 音 檢 測自相關(guān)法 主要問題 第一共振峰可能對基音造成干擾:在某些濁音中,第一共振峰頻率可能會等于或低于基頻;如果其幅度很高,就可能在自相關(guān)函數(shù)中產(chǎn)生一個峰值,而該峰值又可以同基頻的峰值相比擬。例:圖9-1 一個女子發(fā)音的自相關(guān)函數(shù),語音信號以8kHz取樣119.1基 音 檢 測自相關(guān)法 處理思路:對語音信號進(jìn)行預(yù)處理以去除聲道響應(yīng)的影響及其他帶來擾亂的特征分析:語音信號的低幅度部分包含大量的共振
7、峰信息,而高幅度部分包含大量的基音信息。方法之一:非線性處理。非線性處理的優(yōu)勢是在采用硬件時可在時域低成本地實現(xiàn)。處理效果:任何削減或者抑制語音低幅度部分的非線性處理都會使自相關(guān)函數(shù)的性能得到改善。129.1基 音 檢 測自相關(guān)法 圖9-2中心削波中心削波后的語音通過一個自相關(guān)器,這樣在基音周期位置呈現(xiàn)大而尖的峰值,而其余的次要峰值幅度都很小。 139.1基 音 檢 測自相關(guān)法 計算自相關(guān)函數(shù)的運算量是很大的,其原因是計算機(jī)進(jìn)行乘法運算非常費時。為此可對中心削波函數(shù)進(jìn)行修正,采用三電平中心削波的方法 y(n)=Cx(n)1,x(n)CLy(n)=Cx(n)0,x(n)CLy(n)=Cx(n)-
8、1, x(n)-CL 三電平中心削波的自相關(guān)函數(shù)的計算很簡單,設(shè)y(n)表示削波器的輸出,則由自相關(guān)函數(shù)直接計算的公式Rn(k)y(n+m)w(m)y(n+m+k)w(m+k)如果窗口為直角窗,則上式變?yōu)镽n(k)y(n+m)y(n+m+k)上式中y(n+m)y(n+m+k)的取值只有-1、0、1三種情況,因而不需作乘法運算而只需要簡單的組合邏輯即可以。149.1基 音 檢 測自相關(guān)法 (a) 不削波(b) 中心削波(c) 三電平削波Rn(k)均歸一化圖9-4信號波形及其自相關(guān)函數(shù)的舉例159.1基音檢測并行處理法(時域估計方法)語音最初經(jīng)截止頻率為900Hz的低通濾波,如果需要的話還附加高通
9、濾波去除50Hz的交流聲。 語音信號在經(jīng)過預(yù)處理后,形成一系列脈沖,這一串脈沖保留了信號的周期性特性,而略去了與基音檢測無關(guān)的信息,找出峰點和谷點,再根據(jù)其位置和幅度產(chǎn)生6個脈沖序列 對這些基音檢測器的輸出作邏輯組合,得出估計值 估計這6個脈沖序列,得出6個基音周期的估值 m1(n)取峰值m2(n)峰值減前一谷值m3(n)峰值減前一峰值m4(n)取谷值m5(n)谷值減前一峰值m6(n)谷值減前一谷值169.1基音檢測并行處理法(時域估計方法)m1(n)取峰值m2(n)峰值減前一谷值m3(n)峰值減前一峰值m4(n)取谷值m5(n)谷值減前一峰值m6(n)谷值減前一谷值179.1基 音 檢 測倒
10、譜法濁音語音的復(fù)倒譜中存在峰值,其出現(xiàn)時間等于基音周期;而清音語音段的復(fù)倒譜則不出現(xiàn)這種峰值。利用這一性質(zhì)可以進(jìn)行清/濁音判斷并估計濁音的基音周期。這種方法的步驟:計算復(fù)倒譜解卷提取出聲門激勵信息,在預(yù)期的基音周期附近尋找峰值如果峰值超過了預(yù)先設(shè)定的門限,則語音段定為濁音,而峰的位置就是基音周期的估值。如果不存在超出門限的峰值,則語音段定為清音。如果計算的是依賴于時間的復(fù)倒譜,則可估計出激勵源模型及基音周期隨時間的變化。 189.1基 音 檢 測倒譜法倒譜和復(fù)倒譜表現(xiàn)出相同的性質(zhì)估計基音周期,因而沒有必要對語音波形完全解卷,所以用倒譜c(n)就完全可以,這樣可以從復(fù)雜的相位計算中解脫出來。由于
11、人耳對語音信號的相位不很敏感,因而可以假定輸入語音信號是最小相位序列,這樣可由最小相位信號法計算c(n)。 199.1基 音 檢 測倒譜法圖9-6 倒譜示意圖包括兩個分量:相應(yīng)于頻譜包絡(luò)的慢變分量、相應(yīng)于基音諧波峰值的快變分量。通過濾波或再取一次傅里葉反變換,即可將慢變分量與快變分量分離開??拷c的低倒頻部分是頻譜包絡(luò)的變換,而位于t0處的窄峰為諧波峰值的變換,表示基音周期。如果基音峰值的變換與頻譜包絡(luò)變換之間的間隔足夠大,則可很容易地提取基音信息。 209.1基 音 檢 測倒譜法 取樣率為10kHz,幀長51.2ms,然后求出c(n)。采用海明窗,長度及窗相對于語音信號的位置對倒譜峰的高度
12、有相當(dāng)大的影響。為使倒譜具有明顯的周期性,并考慮到窗的逐漸弱化效應(yīng),窗口選擇的語音段應(yīng)至少包含有兩個明顯的基音周期。窗應(yīng)盡可能短,使得分析間隔中的語音參數(shù)變化減至最小。這是短時處理的要求。219.1基 音 檢 測倒譜法 求出倒譜峰值IPK和其位置IPOS,如果峰值未超過某門限值,則進(jìn)行過零計算;若過零數(shù)超過某門限值,則為無聲語音幀。反之,則為有聲,且基音周期仍等于該峰值的位置。 無聲檢測器是時域信號的峰值檢測器;若低于某門限值,則認(rèn)為是無聲,勿須進(jìn)行上述由倒譜檢測基音的計算。229.1基 音 檢 測倒譜法圖9-9含噪語音的對數(shù)功率譜示意圖 對數(shù)功率譜的低電平部分被噪聲填滿,并處于主導(dǎo)地位,從而
13、掩蓋了基音諧波的周期性。這意味著倒譜的輸入不再是純凈的周期性成分,而倒譜中的基音峰值將會展寬并受到噪聲的污染。隨著噪聲電平的增加,對數(shù)功率譜的有用部分將會變得越來越小,從而使倒譜的靈敏度也隨之下降。 如何處理?239.1基 音 檢 測簡化逆濾波法逆濾波的作用:將頻譜包絡(luò)逐漸平坦下去。得到的線性預(yù)測誤差信號只包含有激勵的信息,而去除了聲道影響,所以它提供了一個簡化的(廉價的)頻譜平滑器。激勵信號正比于預(yù)測誤差信號,如果線性預(yù)測模型與產(chǎn)生實際語音信號的系統(tǒng)越接近,則e(n)就越接近激勵信號。對于濁音,可以預(yù)料在每一基音周期的起始處預(yù)測誤差較大。檢測e(n)信號相鄰兩最大脈沖之間的距離即可對基音周期
14、作出估計。 24提取LPC參數(shù)。這里L(fēng)PC濾波器的階數(shù)P4,因為,四階濾波器完全可作為01kHz頻率范圍內(nèi)信號譜的模型,因為此范圍內(nèi)通常只有12個共振峰。然后進(jìn)行逆濾波,得到接近平坦的譜。9.1基 音 檢 測簡化逆濾波法25進(jìn)行短時自相關(guān)運算,檢測出峰值及其位置,得到基音周期值。為提高基音周期值的分辨率,可以對最大峰值所處范圍的自相關(guān)函數(shù)進(jìn)行內(nèi)插。最后進(jìn)行有/無聲判決。此處與倒譜法類似,有一個無聲檢測器,以減少運算量。 圖9-12基音檢測的簡化逆濾波法9.1基 音 檢 測簡化逆濾波法269.1基 音 檢 測簡化逆濾波法279.1基 音 檢 測簡化逆濾波法289.1基 音 檢 測簡化逆濾波法 基
15、音檢測有很多方法,大多是基于低通濾波和自相關(guān)法的。其主要缺點是: 準(zhǔn)確性不夠高; 一般只能求出分析幀的平均基音周期值,難以對每個基音周期進(jìn)行準(zhǔn)確的定位和標(biāo)記,而這在許多場合卻是很重要的。采用小波分析技術(shù)進(jìn)行基音檢測能得到比較好的效果。 299.2共振峰估值 譜包絡(luò)中的極大值就是共振峰。共振峰估計存在的問題:虛假峰值。共振峰合并。高基音語音。 高基音語音(如女聲和童聲)的諧波間隔比較寬,因而為頻譜包絡(luò)估值所提供的樣點比較少,所以譜包絡(luò)本身的估計就不夠精確。即使采用線性預(yù)測方法,所得到的譜包絡(luò)的峰值仍然比較接近諧波峰值而常常偏離真正的共振峰位置。309.2共振峰估值 帶通濾波器組法 通過濾波器組的
16、設(shè)計可以使估計的共振峰頻率同人耳的靈敏相匹配,其匹配程度比線性預(yù)測法要好。濾波器的中心頻率有兩種分布方法:一種是等間距地分布在分析頻段上,則所有帶通濾波器的帶寬可設(shè)計成相同,從而保證了各通道的群延時相同。另一種是非均勻地分布,例如為了獲得類似于人耳的頻率分辨特性,在低頻端間距小,高頻端間距大,帶寬也隨之增加。這時濾波器的階數(shù)必須設(shè)計成與帶寬成正比,使得它們輸出的群延時相同,不會產(chǎn)生波形失真。為了使頻率分辨率提高,濾波器的階數(shù)應(yīng)取足夠大的值,使得帶通濾波器具有良好的截止特性,但同時也意味著每個濾波器均有較長的沖激響應(yīng)。由于語音信號具有時變特性,顯然較長的沖激響應(yīng)會模糊這種特性,所以頻率分辨率與時
17、間分辨率總是相互矛盾的。319.2共振峰估值 帶通濾波器組法 這種方法的缺點是:由于濾波器組中濾波器數(shù)目的限制,估計的共振峰頻率不可避免地存在誤差;而且對共振峰帶寬不易確定;由于無法去除聲門激勵的影響,可能會造成虛假峰值。圖9-15給出了一種利用濾波器組進(jìn)行共振峰估值的系統(tǒng)結(jié)構(gòu)示意圖。濾波器的中心頻率從150Hz到7kHz,分析帶寬從100Hz到1kHz,頻率按對數(shù)規(guī)律遞增。濾波器輸出經(jīng)全波整流而用于提供頻譜包絡(luò)估值。辨識邏輯用于對適當(dāng)頻率范圍內(nèi)的峰值進(jìn)行辨識而獲得前三個共振峰。頻譜峰值被依次指定,每一峰值都被約束在其已知的頻率范圍之內(nèi)并且高于前邊共振峰的頻率。329.2共振峰估值 離散傅里葉
18、變換1濁音時聲門激勵為周期脈沖序列,因而語音信號具有明顯的周期性,所以信號譜中出現(xiàn)多個諧波頻率,其值為nfp(這里fp為基頻,n為正整數(shù))。由于進(jìn)行DFT得到的頻譜受基頻諧波的影響,最大值只能出現(xiàn)在諧波頻率上,因此共振峰測定誤差較大。為減少誤差,可由諧波頻率n fp及上、下兩個次極值頻率(n-1) fp、(n+1) fp的插值求得共振峰頻率。339.2共振峰估值 離散傅里葉變換2清音時信號具有隨機(jī)噪聲的特點,其頻譜不具有離散諧波特性,但其包絡(luò)基本上反映了聲道的特性。對其頻譜進(jìn)行線性平滑而得到譜包絡(luò),并用一個峰值搜索算法來確定峰值,并標(biāo)記為共振峰參數(shù)。 349.2共振峰估值 倒譜法 可在倒譜域用
19、一個濾波器濾除聲門激勵的影響。這個濾波器稱為倒濾波器,其形式為l(n)1,nn0l(n)0,nn0 其中n0值應(yīng)選得比基音周期NP小。利用IDFT求c(n)時,與時域取樣類似,為避免發(fā)生混疊,需要將N取得足夠大 359.2共振峰估值 倒譜法 對于濁音和清音,倒譜法的檢測效果不同: 濁音時,若頻譜包絡(luò)的變換和基音峰值的變換在倒譜域中的間隔足夠大,則前者很容易識別。而聲道沖激響應(yīng)h(n)的倒譜的特性取決于聲道傳遞函數(shù)H(z)的極零點分布。當(dāng)H(z)的極零點的模不是很接近于1時,將隨n的增加而迅速減小。 清音時,聲門激勵序列具有噪聲特性,其倒譜沒有明顯峰值,且分布于從低倒譜域到高倒譜域的很寬的范圍內(nèi),因而在低倒譜域?qū)β暤理憫?yīng)的信息產(chǎn)生了影響。因而求得的聲道模型對數(shù)譜與實際的聲道對數(shù)譜之間將存
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版車輛租賃合同保證金及退還規(guī)定3篇
- 二零二五年度智能安防系統(tǒng)安裝與維護(hù)承包合同4篇
- 2025年度個人兼職勞動合同范本:旅游導(dǎo)游與講解服務(wù)3篇
- 二零二五年度高校學(xué)生實踐就業(yè)合作協(xié)議4篇
- 2025年度碼頭場地安全使用協(xié)議2篇
- 二零二五年綜合網(wǎng)絡(luò)安全評估與維護(hù)合同2篇
- 二零二五年度非物質(zhì)文化遺產(chǎn)保護(hù)宣傳合作協(xié)議3篇
- 2024物業(yè)公司物業(yè)推廣合同
- 大連2025版二手房房產(chǎn)交易稅費結(jié)算合同3篇
- 二零二五年度文化節(jié)慶活動聯(lián)合承辦服務(wù)協(xié)議3篇
- 深圳2024-2025學(xué)年度四年級第一學(xué)期期末數(shù)學(xué)試題
- 中考語文復(fù)習(xí)說話要得體
- 《工商業(yè)儲能柜技術(shù)規(guī)范》
- 華中師范大學(xué)教育技術(shù)學(xué)碩士研究生培養(yǎng)方案
- 醫(yī)院醫(yī)學(xué)倫理委員會章程
- xx單位政務(wù)云商用密碼應(yīng)用方案V2.0
- 風(fēng)浪流耦合作用下錨泊式海上試驗平臺的水動力特性試驗
- 高考英語語法專練定語從句含答案
- 有機(jī)農(nóng)業(yè)種植技術(shù)操作手冊
- 【教案】Unit+5+Fun+Clubs+大單元整體教學(xué)設(shè)計人教版(2024)七年級英語上冊
- 2024-2025學(xué)年四年級上冊數(shù)學(xué)人教版期末測評卷(含答案)
評論
0/150
提交評論