語音信號處理第6講_第1頁
語音信號處理第6講_第2頁
語音信號處理第6講_第3頁
語音信號處理第6講_第4頁
語音信號處理第6講_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、5.1 概述5.2端點(diǎn)檢測5.3基音周期估計5.4共振峰估計 語音信號是一種短時平穩(wěn)信號時變,復(fù)雜且攜帶包含語義、個人特征等有用信息 特征參數(shù)應(yīng)該能夠比較準(zhǔn)確地表達(dá)語音信號的特征,具有準(zhǔn)確性和唯一性,是語音識別的基礎(chǔ) 20世紀(jì)40年代,提出的語譜圖,對語音信號有很強(qiáng)的描述能力,形成最早的語音特征 后來,人們發(fā)現(xiàn)利用語音信號的時域特征可以從語音波形中提取反映語音特性的參數(shù),如短時幅度,短時幀平均能量,短時幀過零率,短時自相關(guān)系數(shù)、平均幅度差函數(shù)等不僅能減小模板數(shù)目,運(yùn)算量和存儲量,還能消除冗余信息 語音信號分幀提取,每幀構(gòu)成一個矢量,即語音信號特征是一個矢量序列 端點(diǎn)檢測:一段語音信號中準(zhǔn)確地找

2、出語音信號的起始點(diǎn)和結(jié)束點(diǎn) 目的:把有效的語音信號好無用的噪聲信號分離 在語音識別,語音增強(qiáng),語音編碼,回聲抵消等系統(tǒng)中應(yīng)用廣泛 語音端點(diǎn)檢測方法分類(1)基于閾值的方法:根據(jù)語音信號和噪聲信號的不同特征,提取每一段語音信號的特征并與設(shè)定的閾值進(jìn)行比較(2)基于模式識別的方法,需要估計語音信號和噪聲信號的模型參數(shù)來進(jìn)行比較,鑒于模式識別方法自身復(fù)雜度高,運(yùn)算量大,很難應(yīng)用到實時語音信號中 端點(diǎn)檢測本質(zhì)上是根據(jù)語音和噪聲的相同參數(shù)所表現(xiàn)出的不同特征來進(jìn)行區(qū)分。 傳統(tǒng)的短時能量和過零率相結(jié)合的語音端點(diǎn)檢測算法,短時過零率來檢測清音,用短時能量來檢測濁音,兩者相配合實現(xiàn)了信號信噪比較大情況下的端點(diǎn)檢

3、測(以短時能量檢測為主,短時過零率檢測為輔) 短時能量法(已講)可以較好地區(qū)分出濁音和靜音 短時過零率(已講)對于清音,其能量較小,會因為低于能量門限而被誤判為靜音,短時過零率可以區(qū)分靜音和清音 雙門限法:基于短時能量(高門限)和過零率(低門限)的雙門限端點(diǎn)檢測算法(當(dāng)?shù)烷T限被超過時,有可能是噪聲引起的,未必是語音的開始,當(dāng)高門限被超過并在接下來的時間段內(nèi)一直超過低門限時,意味著語音信號的開始) 雙門限法步驟:(1)計算短時能量(高門限) 和過零率(低門限)(2)選取一個較高的門限 ,語音信號的能量包絡(luò)大部分都在此門限之上,進(jìn)行一次初判,語音起止點(diǎn)位于該門限與短時能量包絡(luò)交點(diǎn)所對應(yīng)的時間間隔之

4、外(3)根據(jù)噪聲能量,確定一個較低的門限 并從初判起點(diǎn)往左,從初判終點(diǎn)往右搜索,分別找到能零比曲線 第一次與門限 ,相交的兩個點(diǎn),兩點(diǎn)之間段就是用雙門限方法所判定的語音段(4)以短時平均過零率為準(zhǔn),從低門限點(diǎn)往左右搜索,找到短時平均過零率低于某閾值的兩點(diǎn),為語音的起止點(diǎn)注:門限值要通過多次實驗來確定2T1T1T 自相關(guān)法:(1)短時自相關(guān)(已講)(2)由于兩種信號的自相關(guān)函數(shù)存在極大的差異,可以利用這種差別來提取語音端點(diǎn)。根據(jù)噪聲的情況,設(shè)置兩個閾值 和 ,當(dāng)相關(guān)函數(shù)最大值大于 時,便判定是語音;當(dāng)相關(guān)函數(shù)最大值大于或小于 時,則判定為語音信號的端點(diǎn)。 譜熵法u熵表示信息的有序程度,語音的熵和

5、噪聲的熵存在較大的差異,可以體現(xiàn)語音和噪聲在整個信號段中的分布概率u譜熵語音端點(diǎn)檢測方法是通過檢測譜的平坦程度,達(dá)到語音端點(diǎn)檢測的目的。2T1T1T2T 譜熵定義:設(shè)語音信號時域波形為 ,加窗分幀處理后得到的第n幀語音信號為 ,其FFT表示為 ,k表示為第k條譜線。該語音幀在頻域中的短時能量為:某一譜線k的能量譜為則每個頻率分量的歸一化譜概率密度函數(shù)為該語音幀的短時譜熵為:( )nXk2*0( )( )NnnnkEXk Xk( )x i( )nx m*( )( )nnnYXk Xk20( )( )( )nnnNnnlY kY kpEY l20( )ln( )NnnnlHp lp l 基于譜熵的

6、端點(diǎn)檢測:基于譜熵語音端點(diǎn)檢測方法是通過檢測譜的平坦程度,來進(jìn)行語音端點(diǎn)檢測的,為了更好地進(jìn)行語音端點(diǎn)檢測,采用語音信號的短時功率譜構(gòu)造語音信息譜熵,從而對語音段和噪聲段進(jìn)行區(qū)分。檢測思路:對語音信號進(jìn)行分幀加窗,取FFT的點(diǎn)數(shù)計算每一幀的譜能量計算出每一幀中每個樣本點(diǎn)的概率密度函數(shù)計算出每一幀的譜熵值設(shè)置判決門限 根據(jù)各幀的譜熵值進(jìn)行端點(diǎn)檢測20( )( )( )nnnNnnlY kY kpEY l20( )ln( )NnnnlHp lp l 比例法(1)能零比的端點(diǎn)檢測在噪聲情況下,信號的短時能量和短時過零率會發(fā)生一定變化,嚴(yán)重時會影響端點(diǎn)檢測。如右圖所示,語音信號的說話區(qū)間能量是向上凸起

7、的,而過零率相反,是下凹的,這說明說話區(qū)間能量值大,過零率小,噪聲區(qū)間能量值小,過零率大,從而可以檢測語音端點(diǎn) 比例法(1)能零比的端點(diǎn)檢測為此,提出改進(jìn)式能量 ,a為常數(shù),適當(dāng)?shù)娜≈涤兄趨^(qū)分噪聲和清音進(jìn)行限幅之后的過零率故能零比表示為 ,b為較小的常數(shù),用于防止分母為零(2)能熵比的端點(diǎn)檢測譜熵值類似于過零率,能熵比的表示為 對數(shù)頻譜距離法(自學(xué))lg 1nnELEa( )( )( )0( )nnnnx mx mx mx mnnnLEEZRZCRb1nnnLEEEFH 基音:一般的聲音都是由發(fā)音體發(fā)出的一系列頻率、振幅各不相同的振動復(fù)合而成的。這些振動中有一個頻率最低的振動,由它發(fā)出的音就

8、是基音基音,其余為泛音泛音。 基音周期是指聲帶振動頻率的倒數(shù)。 基音周期是語音信號最重要的參數(shù)之一,它描述了語音激勵源的一個重要特征。 基音周期信息在多個領(lǐng)域有著廣泛的應(yīng)用,如:語音識別、說話人識別、語音分析與綜合以及低碼率語音編碼、發(fā)音系統(tǒng)疾病診斷、聽覺殘障者的語言指導(dǎo)等。 由于漢語是一種有調(diào)語言,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息,有區(qū)別意義的功能,所以,基音的提取和估計對漢語更是一個十分重要的問題。 基音檢測的主要困難在于:聲門激勵信號并不是一個完整周期的序列,在語音的頭、尾部并不具有聲帶振動那樣的周期性,有些清音和濁音的過度幀是很難準(zhǔn)確地判斷是周期還是非周期性

9、的;在許多情況下,清音語音和低電平濁音語音段之間的過渡段是非常細(xì)微的,確定它是極其困難的;從語音信號中去除聲道影響,直接取出僅和聲帶振動有關(guān)的激勵信號的信息并不容易,例如聲道的共振峰有時會嚴(yán)重影響激勵信號的諧波結(jié)構(gòu)。這種影響在發(fā)音器官快速動作而共振峰也快速改變時,對對基音檢測是最具危害性的。 盡管基音檢測有許多困難,但因為它的重要性,基音的檢測提取一直是一個研究的課題。 為此提出了各種各樣的基音檢測算法,如u自相關(guān)函數(shù)(ACF)法、u峰值提取算法(PPA)、u平均幅度差函數(shù)(AMDF)法、u并行處理技術(shù)、u倒譜法、u簡化逆濾波法(SIFT)u譜圖法、u小波法u這一節(jié)將介紹幾種常用的基音提取方法

10、。語音信號是非平穩(wěn)的信號,所以對信號的處理都使用短時自相關(guān)函數(shù)。短時自相關(guān)函數(shù)是在信號的第N個樣本點(diǎn)附近用短時窗截取一段信號,做自相關(guān)計算所得的結(jié)果m表示窗函數(shù)是從第m點(diǎn)開始加入10)()()(kNmnnnkmSmSkR 自相關(guān)法自相關(guān)法語音信號s(m)經(jīng)窗長為N的窗口截取為一段加窗語音信號Sn(m)后,定義Sn(m)的自相關(guān)函數(shù)(ACF),Rn(k)(亦即語音信號s(m)的短時自相關(guān)函數(shù))為:Rn(k)不為零的范圍為是k=(-N+1)(N1),且為偶函數(shù)。由4章的分析可知,濁音信號的自相關(guān)函數(shù)在基音周期的整數(shù)倍位置上出現(xiàn)峰值;而清音的自相關(guān)函數(shù)沒有明顯的峰值出現(xiàn)。因此檢測是否有峰值就可判斷是

11、清音或濁音,檢測峰值的位置就可提取基音周期值。10)()()(kNmnnnkmSmSkRclcclear all x= wavread(C:UsersDesktopbearings.wav);figure(1); stem(x,.); n=160; %取20ms的聲音片段,即160個樣點(diǎn) for m=1:length(x)/n; %對每一幀求短時自相關(guān)函數(shù) for k=1:n; Rm(k)=0; for i=(k+1):n; Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n); end end p=Rm(10:n); %防止誤判,去掉前邊10個數(shù)值較大的點(diǎn) Rmax

12、,N(m)=max(p); %讀取第一個自相關(guān)函數(shù)的最大值 end %補(bǔ)回前邊去掉的10個點(diǎn) N=N+10; T=N/8; %計算出對應(yīng)的周期 figure(2);stem(T,.);axis(0 length(T) 0 10); xlabel(幀數(shù)(n);ylabel(周期(ms);title(各幀基音周期); 平均幅度差函數(shù)法(平均幅度差函數(shù)法(AMDFAMDF) 語音信號的短時平均幅度差函數(shù)(AMDF) Fn(k)定義為: 與短時自相關(guān)函數(shù)一樣,對周期性的濁音語音,F(xiàn)n(k)也呈現(xiàn)與濁音語音周期相一致的周期特性,不過不同的是Fn(k)在周期的各個整數(shù)倍點(diǎn)上具有谷值特性而不是峰值特性 因而

13、通過Fn(k)的計算同樣可以來確定基音周期。而對于清音語音信號,F(xiàn)n(k)卻沒有這種周期特性。利用Fn(k)的這種特性,可以判定一段語音是濁音還是清音,并估計出濁音語音的基音周期。 但是,短時平均幅度差函數(shù)來估計基音周期時,要求窗長取得足夠長??梢圆捎肔PC逆濾波和中心削波處理等方法來減少輸入語音中聲道特性或共振峰的影響,提供基音周期估計效果10)()()(kNmnnnmSkmSkF 無論是利用自相關(guān)函數(shù)還是平均幅度差函數(shù),語音幀應(yīng)使用矩形窗窗長的選擇要合適,一般認(rèn)為窗長至少應(yīng)該大于兩個基音周期,而為了改善估計結(jié)果,窗長應(yīng)選的更長一些,是幀信號包含足夠多個語音周期平均幅度差的計算無需乘法運(yùn)算,

14、其計算復(fù)雜度較小,且基音周期點(diǎn)處的平均幅度差的谷點(diǎn)銳度比自相關(guān)函數(shù)的峰點(diǎn)銳度更尖銳,估值精度更高(原因:平均幅度差與語音信號幅度的快速變化比較敏感,影響估計的精度)( ) ( )nnR kand F k 倒譜(倒譜(CEPCEP)法)法倒譜法是傳統(tǒng)的基音周期檢測算法之一,它利用語音信號的倒頻譜特征,檢測出表征聲門激勵周期的基音信息。原因:濁音語音的復(fù)倒譜中存在峰值,其出現(xiàn)時間等于基因周期;而清音語音段的復(fù)倒譜則不出現(xiàn)這種峰值。利用這一性質(zhì)可以進(jìn)行清/濁音判斷并估計濁音的基音周期。步驟:計算復(fù)倒譜解卷提取出聲門激勵信息,在預(yù)期的基音周期附近尋找峰值 如果峰值超過了預(yù)先設(shè)定的門限,則語音斷定為濁音

15、,而峰的位置就是基音周期的估值 如果不存在超出門限的峰值,則語音斷定為清音 如果計算的是依賴于時間的復(fù)倒譜,則可估計出激勵源模型及基音周期隨時間的變化 倒譜(倒譜(CEPCEP)法)法如前面所述,語音s(n)是由聲門脈沖激勵e(n)經(jīng)聲道響應(yīng)v(n)濾波而得。即:s(n)=e(n)*v(n)設(shè)三者的倒譜分別為 及 ,則有:可見,倒譜域中基音信息與聲道信息可以認(rèn)為是相對分離的。采取簡單的倒濾波方法可以分離并恢復(fù)出e(n)和v(n),根據(jù)激勵e(n)及其倒譜的特征可以求出基音周期。估計基音周期時,沒有必要對語音波形完全解卷,所以用倒譜c(n)就完全可以,這樣可以從復(fù)雜的相位計算中解脫出來;對于人耳

16、而言,對語音信號的相位不很敏感,可以假定輸入語音信號是最小相位序列,這樣可由最小相位信號法計算c(n)( ), ( )s n e n( )v n( )( )( )s ne nv n 倒譜(倒譜(CEPCEP)法)法 反應(yīng)信息的倒譜峰,在過渡音和含噪語音中將會變得不清晰甚至完全消失。其原因當(dāng)然主要是因為過渡音中周期激勵信號能量降低和類噪激勵信號干擾或含噪語音中的噪聲干擾所致。 對于一幀典型的濁音語音的倒譜,其倒譜域中基音信息與聲道信息并不是完全分離的,在周期激勵信號能量較低的情況下,聲道響應(yīng)(特別是其共振峰)對基音倒譜峰的影響就不可忽略。 如果設(shè)法除去語音信號中的聲道響應(yīng)信息,對類噪激勵和噪聲加

17、以適當(dāng)抑制,倒譜基音檢測算法的檢測結(jié)果將有所改善,特別對過渡語音的檢測結(jié)果將有明顯改善。 倒譜(倒譜(CEPCEP)法)法 除去語音信號中的聲道響應(yīng)信息可以采用LPC方法,此時語音信號可以表示為: 在預(yù)測分析之后,可構(gòu)成逆濾波器A(z)原始語音 逆濾波器A(z)進(jìn)行逆濾波 獲得預(yù)測余量信號 基音信息 倒譜分析1( )()( )piis na s niGe n 00( ),1piiiA za za理想情況下不包含聲道響應(yīng)信息( )( )nGe n( )n低通濾波抑制噪聲干擾注:倒譜法一般采用漢明窗 簡化逆濾波法(簡化逆濾波法(SIFTSIFT)簡化的逆濾波跟蹤(SIFT)算法是相關(guān)處理法進(jìn)行基音

18、提取的一種現(xiàn)代化的版本。該方法的基本思想是:先對語音信號進(jìn)行LPC分析和逆濾波,獲得語音信號的預(yù)測殘差,然后將殘差信號通過自相關(guān)濾波器濾波,再作峰值檢測,進(jìn)而獲得基音周期。語音信號通過線性預(yù)測逆濾波器后達(dá)到頻譜的平坦化,因為逆濾波器是一個使頻譜子坦化的濾波器,所以它提供了一個簡化的(亦即廉價的)頻譜平滑器。預(yù)測誤差是自相關(guān)器的輸入,通過與門限的比較可以確定濁音,通過輔助信息可以減少誤差。作用:將頻譜包絡(luò)逐漸平坦下去。得到的線性預(yù)測誤差信號只包含有激勵的信息,去除了聲道影響。所以SIFT提供了一個簡化的(廉價的)頻譜平滑器。 簡化逆濾波法(簡化逆濾波法(SIFTSIFT)簡化逆濾波器的原理框圖如

19、圖所示。其工作過程為:語音信號經(jīng)過8kHz取樣后,通過0-900Hz的數(shù)字低通濾器,其目的是濾除聲道譜中聲道響應(yīng)部分的影響,使峰值檢測更加容易。然后降低取樣率為原來的1/4(因為激勵序列的寬度小于1 kHz,所以用2kHz取樣就足夠了) 提取降低取樣率后的信號模型參數(shù)(LPC參數(shù))內(nèi)插提高采樣率,恢復(fù)到8kHz檢測出峰值及其位置就得到基音周期值。一幀語音信號低通/帶通濾波4:1降采樣LPC分析逆濾波求預(yù)測誤差計算預(yù)測誤差自相關(guān)函數(shù)1:4曾采樣峰值檢測基音周期值 基音檢測的后處理基音檢測的后處理無論采用哪一種基音檢測算法都可能產(chǎn)生基音檢測錯誤,使求得的基音周期軌跡中有一個或幾個基音周期估值偏離了

20、正常軌跡(通常是偏離到正常值的2倍或1/2),此情況如圖所示。并稱這種偏離點(diǎn)為基音軌跡的“野點(diǎn)”?;糁芷谲壽E以及軌跡中的“野點(diǎn)”為了去除這些野點(diǎn),可以采用各種平滑算法,其中最常用的是中值平滑算法和線性平滑算法。1 1中值平滑處理 中值平滑處理的基本原理是:設(shè)x(n)為輸入信號,y(n)為中值濾波器的輸出,采用一滑動窗,則n0處的輸出值y(n0)就是將窗的中心移到n0處時窗內(nèi)輸入樣點(diǎn)的中值。即在n0點(diǎn)的左右各取L個樣點(diǎn)。連同被平滑點(diǎn)共同構(gòu)成一組信號采樣值(共(2L+1)個樣值),然后將這(2L+1)個樣值按大小次序排成一隊,取此隊列中的中間者作為平滑器的輸出。 L值一般取為1或2,即中值平滑的

21、“窗口”一般套住3或5個樣值,稱為3點(diǎn)或5點(diǎn)中值平滑。 中值平滑的優(yōu)點(diǎn)是既可以有效地去除少量的野點(diǎn),又不會破壞基音周期軌跡中兩個平滑段之間的階躍性變化。2.2.線性平滑處理線性平滑是用滑動窗進(jìn)行線性濾波處理,即:其中(m),m = -L,-L+1,0,1,2,L為2L+1點(diǎn)平滑窗,滿足:例如三點(diǎn)窗的權(quán)值可取為0.25,0.5,0.25。線性平滑在糾正輸入信號中不平滑處樣點(diǎn)值的同時,也使附近各樣點(diǎn)的值做了修改。所以窗的長度加大雖然可以增強(qiáng)平滑的效果,但是也可能導(dǎo)致兩個平滑段之間階躍的模糊程度加重。為了改善平滑的效果,可以將中值平滑處理和線性平滑處理兩種平滑技術(shù)結(jié)合起來使用。( )1LmLmLLm

22、mmnsny)()()(3 3組合平滑處理為了改善平滑的效果可以將兩個中值平滑串接,圖a所示是將一個5點(diǎn)中值平滑和一個3點(diǎn)中值平滑串接.另一種方法是將中值平滑和線性平滑組合,如圖b所示。為了使平滑的基音軌跡更貼近,還可以采用二次平滑的算法,全部算法的框圖如圖所示。由于中值平滑和線性平滑都會引入延時,所以在實現(xiàn)上述方案時應(yīng)考慮到它的影響。d是一個采用襝延時的可實現(xiàn)二次平滑方案。其中的延時大小可由中值平滑的點(diǎn)數(shù)和線性平滑的點(diǎn)數(shù)來決定。聲道可以看成是一根具有非均勻截面的聲管,在發(fā)音時起共鳴器的作用。當(dāng)準(zhǔn)周期脈沖激勵進(jìn)入聲道時會引起共振特性,產(chǎn)生一組共振頻率,稱為共振峰頻率或簡稱共振峰。共振峰參數(shù)包括

23、共振峰頻率和頻帶寬度,它是區(qū)別不同韻母的重要參數(shù)。共振峰信息包含在語音頻譜包絡(luò)中,因此共振峰參數(shù)提取的關(guān)鍵是估計自然語音頻譜包絡(luò),并認(rèn)為譜包絡(luò)中的最大值就是共振峰。提取共振峰特性最簡便的手段是使用語譜儀。分析共振峰參數(shù)也可采用數(shù)字信號處理的方法,它可獲得與語譜圖相同的信息。但精確的共振峰估值是很困難的(原因:虛假峰值、共振峰合并、高音調(diào)語音)為此,下面討論常用的幾種解決方法。 帶通濾波器組法帶通濾波器組法這種方法類似于語譜儀,但由于使用了計算機(jī),使濾波器特性的選取更具靈活性,實現(xiàn)框圖如圖所示。這是共振峰提取的最早形式,與線性預(yù)測法相比,濾波器組法有些遜色。但通過濾波器組的設(shè)計可以使估計的共振峰

24、頻率同人耳的靈敏度相匹配,其匹配的程度比線性預(yù)測法要好。帶通濾波器組法提取共振峰 帶通濾波器組法帶通濾波器組法濾波器的中心頻率有兩種分布方法:等間距地分布在分析頻段上,則所有帶通濾波器的帶寬可設(shè)計成相同,從而保證了各通道的群延時相同。是非均勻地分布,例如為了獲得類似于人耳的頻率分辨特性,在低頻端間距小,高頻端間距大,帶寬也隨之增加,這時濾波器的階數(shù)必須設(shè)計成與帶寬成正比,使得它們輸出的群延時相同,不會產(chǎn)生波形失真。缺點(diǎn):p由于濾波器組中的濾波器數(shù)目有限,估計的共振峰頻率不可避免地存在誤差;p而且對共振峰帶寬不易確定;p由于無法去除聲門激勵的影響,可能會造成虛假峰值。 倒譜法倒譜法共振峰估計雖然

25、可以直接對語音信號求離散傅里葉變換(DFT),通過DFT譜來提取信號的共振峰參數(shù),但是,直接DFT的譜要愛基頻諧波的影響,最大值只能出現(xiàn)在諧波頻率上,因而共振峰測定誤差較大。為了消除基頻諧波的影響,可以采用同態(tài)解卷技術(shù),經(jīng)過同態(tài)濾波后得到平滑的譜,這樣簡單地檢測峰值就可以直接提取共振峰參數(shù),這種方法更為有效和精確。倒譜運(yùn)用對數(shù)運(yùn)算和二次變換將基音諧波和聲道的頻譜包絡(luò)分離開來。因此用低時窗l(fā)(n)從語音信號倒譜c(n)中所截取出來的沖激響應(yīng)h(n),能更精確地反映聲道響應(yīng)。由h(n)經(jīng)DFT得到的 ,就是聲道的離散譜曲線。用 代替直接DFT的頻譜,去除了激勵引起的諧波波動,可以更精確地得到共振峰

26、參數(shù)。( )H k( )H k 倒譜法倒譜法如圖所示,倒譜法求取語音頻譜包絡(luò)。倒譜法因為其頻譜曲線的波動比較小,所以估計共振峰參數(shù)的效果是較好的,但其運(yùn)算量太大。 111( )ln()ln()ln()jjjc nFS eFU eFH e聲門激勵序列的倒譜,是以基音周期為周期的沖激序列聲道沖激響應(yīng)序列的倒譜,集中在n=0附近的低倒譜 倒譜法倒譜法 111( )ln()ln()ln()jjjc nFS eFU eFH e聲門激勵序列的倒譜,是以基音周期為周期的沖激序列聲道沖激響應(yīng)序列的倒譜,集中在n=0附近的低倒譜可在倒譜域用一個濾波器(倒濾波器)消除聲門激勵的影響21101( )ln()ln()

27、,01NjknjjNkc nFH eH eenNN利用逆傅立葉變換求c(n)時,為避免發(fā)生混疊,需要將N取得足夠大 倒譜法倒譜法對于濁音和清音,倒譜法的檢測效果不同:p濁音時,若頻譜包絡(luò)的變換和基音峰值的變換在倒譜中的間隔足夠大,則頻譜包絡(luò)的變換很容易識別。而聲道沖激響應(yīng)h(n)的倒譜的特性取決于聲道傳遞函數(shù)H(z)的極零點(diǎn)分布。當(dāng)H(z)的極零點(diǎn)的模不是很接近于1時,將隨n的增加而迅速減小。p清音時,聲門激勵序列具有噪聲特性,其倒譜沒有明顯峰值,且分布于從低倒譜域到高倒譜域的很寬的范圍內(nèi),因而在低倒譜域?qū)β暤理憫?yīng)的信息產(chǎn)生了影響。注意:求得的聲道模型對數(shù)譜與實際的聲道對數(shù)譜之間將存在一定差別 倒譜法倒譜法倒譜法存在的缺陷:并不是所有的譜峰都為共振峰;帶寬的計算。 原因:當(dāng)兩個共振峰很靠近時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論