版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
..精選文檔精選文檔.精選文檔語(yǔ)音信號(hào)特征參數(shù)提取方法阮雄飛微電子學(xué)與固體電子學(xué)摘要:在語(yǔ)音技術(shù)的開(kāi)展過(guò)程中使用了大量的語(yǔ)音信號(hào)特征參數(shù),好的語(yǔ)音信號(hào)特征參數(shù)能對(duì)語(yǔ)音識(shí)別起至關(guān)重要的作用。本文對(duì)語(yǔ)音信號(hào)特征參數(shù)提取方法以及國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行了介紹,最后介紹了Hilbert-Huang這一新興理論成果以及在特征提取中的應(yīng)用。關(guān)鍵詞:語(yǔ)音技術(shù)特征提取HHT1引言語(yǔ)音信號(hào)是一種短時(shí)平穩(wěn)信號(hào),即時(shí)變的,十分復(fù)雜,攜帶很多有用的信息,這些信息包括語(yǔ)義、個(gè)人特征等,其特征參數(shù)的準(zhǔn)確性和唯一性將直接影響語(yǔ)音識(shí)別率的上下,并且這也是語(yǔ)音識(shí)別的根底[1]。特征參數(shù)應(yīng)該能夠比較準(zhǔn)確地表達(dá)語(yǔ)音信號(hào)的特征具有一定的唯一性。上世紀(jì)40年代,potter等人提出了“visiblespeech〞的概念,指出語(yǔ)譜圖對(duì)語(yǔ)音信號(hào)有很強(qiáng)的描述能力,并且試著用語(yǔ)譜信息進(jìn)行語(yǔ)音識(shí)別,這就形成了最早的語(yǔ)音特征,直到現(xiàn)在仍有很多的人用語(yǔ)譜特征來(lái)進(jìn)行語(yǔ)音識(shí)別[2]。后來(lái),人們發(fā)現(xiàn)利用語(yǔ)音信號(hào)的時(shí)域特征可以從語(yǔ)音波形中提取某些反映語(yǔ)音特性的參數(shù),比方:幅度、短時(shí)幀平均能量、短時(shí)幀過(guò)零率、短時(shí)自相關(guān)系數(shù)、平均幅度差函數(shù)等。這些參數(shù)不但能減小模板數(shù)目運(yùn)算量及存儲(chǔ)量而且還可以濾除語(yǔ)音信號(hào)中無(wú)用的冗余信息。語(yǔ)音信號(hào)特征參數(shù)是分幀提取的,每幀特征參數(shù)一般構(gòu)成一個(gè)矢量,所以語(yǔ)音信號(hào)特征是一個(gè)矢量序列。我們將語(yǔ)音信號(hào)切成一幀一幀,每幀大小大約是20-30ms。幀太大就不能得到語(yǔ)音信號(hào)隨時(shí)間變化的特性,幀太小就不能提取出語(yǔ)音信號(hào)的特征,每幀語(yǔ)音信號(hào)中包含數(shù)個(gè)語(yǔ)音信號(hào)的根本周期。有時(shí)希望相鄰幀之間的變化不是太大,幀之間就要有重疊,幀疊往往是幀長(zhǎng)的1/2或1/3。幀疊大,相應(yīng)的計(jì)算量也大[3]。隨著語(yǔ)音識(shí)別技術(shù)的不斷開(kāi)展時(shí)域特征參數(shù)的種種缺乏逐漸暴露出來(lái),如這些特征參數(shù)缺乏較好穩(wěn)定性且區(qū)分能力不好。于是頻域參數(shù)開(kāi)始作為語(yǔ)音信號(hào)的特征比方頻譜共振峰等。經(jīng)典的特征提取方法主要有LPCC〔線性預(yù)測(cè)倒譜系數(shù)〕、MFCC〔美爾頻率倒譜系數(shù)〕、HMM〔隱馬爾科夫模型〕、DTW〔動(dòng)態(tài)時(shí)間規(guī)整〕等。2語(yǔ)音信號(hào)特征參數(shù)提取方法對(duì)語(yǔ)音信號(hào)的大量分析說(shuō)明,語(yǔ)音信號(hào)中包含著持續(xù)的準(zhǔn)諧波成分和瞬變的遷越成分[4],即語(yǔ)音信號(hào)是一種多分量、非線性、非平穩(wěn)信號(hào)。諸如聲門(mén)、聲道以及輻射等影響因素很多,使得語(yǔ)音信號(hào)特征參數(shù)的準(zhǔn)確提取和修正較為困難。這就需要一種精確的時(shí)頻表示方法[5,6],來(lái)準(zhǔn)確表現(xiàn)語(yǔ)音信號(hào)的各種特征。傳統(tǒng)的語(yǔ)音信號(hào)處理都是基于語(yǔ)音信號(hào)的兩個(gè)根本假設(shè)[7],即人的發(fā)聲系統(tǒng)是線性的及語(yǔ)音信號(hào)是短時(shí)平穩(wěn)的。這兩個(gè)假定導(dǎo)出了各種“短時(shí)〞處理方法,如:短時(shí)傅里葉變換、倒譜分析和線性預(yù)測(cè)分析等。這些“短時(shí)〞處理方法雖然引入了時(shí)頻局部化思想,但它們的“短時(shí)窗口〞大小是固定不變的[8],不能敏感地反映信號(hào)的突變,從而忽略了語(yǔ)音信號(hào)的時(shí)變特征,所以提取出來(lái)的參數(shù)往往不夠精確。隨著小波分析理論[9]的開(kāi)展,小波分析也逐漸應(yīng)用于語(yǔ)音信號(hào)的分析和處理。雖然小波分析具有可調(diào)的時(shí)頻窗口,但是也存在一定的局限性,主要表現(xiàn)在以下幾個(gè)方面[9,10]:⑴難以選擇的小波基。在小波分析中,可以根據(jù)不同的要求構(gòu)造不同的小波基。但是對(duì)某一信號(hào),依據(jù)什么原那么、用什么判據(jù)選擇小波基在理論上和實(shí)際應(yīng)用中還是一個(gè)難點(diǎn)。⑵固定的基函數(shù)。小波基一旦選定就不能再更改,而小波基的選擇往往是根據(jù)特定的語(yǔ)音信號(hào)特征,所以它不具有自適應(yīng)性。⑶恒定的多分辨率。小波變換的多尺度特性使小波具有“數(shù)學(xué)顯微鏡〞的特性和多分辨率分析功能。然而,一旦選擇了小波基函數(shù)和變換尺度,分辨率的大小也就確定了,并不會(huì)隨信號(hào)的改變而改變,因此小波變換可以實(shí)現(xiàn)多分辨率分析,但其分辨率是恒定的。LPCC是基于聲道模型,它是目前應(yīng)用最多的一種倒譜特征提取方法。線性預(yù)測(cè)系數(shù)LPC用線性預(yù)測(cè)法分析語(yǔ)音信號(hào)相鄰樣值之間的關(guān)系,得到一組相關(guān)的參數(shù)。由此語(yǔ)音特派生的聲學(xué)特征還有線譜對(duì)LSP、PARCOR系數(shù)〔反射系數(shù)〕、對(duì)數(shù)面積比系數(shù)等。LPCC為L(zhǎng)PC的倒譜參數(shù),它的原理和計(jì)算都較為簡(jiǎn)單,容易實(shí)現(xiàn)。算的快速有效使得現(xiàn)在的很多商用化的語(yǔ)音識(shí)別系統(tǒng)都是用LPCC作為特征提取方法的?;谌祟惵?tīng)覺(jué)模型的MFCC,它所采用的mel頻率是人耳聽(tīng)到聲音的上下和實(shí)際頻率的非線性映射得到的一個(gè)頻率尺度。MFCC是繼LPCC之后語(yǔ)音識(shí)別領(lǐng)域中又一大創(chuàng)新理論,計(jì)算過(guò)程如圖1。相比于LPCC它的識(shí)別性能有明顯的改進(jìn),只是算量大于LPCC,用C語(yǔ)言在算機(jī)上做模擬時(shí)其運(yùn)算時(shí)間是LPCC的近十倍。由于它是一種基于聽(tīng)覺(jué)模型的特征提取方法,在有信道噪聲和頻譜失真的情況下,仍具有較高的識(shí)別精度,特別是對(duì)噪聲情況下的識(shí)別具有定的魯棒性。更隨著DSP技術(shù)的開(kāi)展以及它對(duì)FFT算的支持,使得MFCC的參數(shù)提取速度也很快。結(jié)合LPC與MFC的后來(lái)提出的一種特征提取的方法PLP〔感知線性預(yù)測(cè)參數(shù)〕,用durbin法計(jì)算LPC參數(shù),而在算自相關(guān)時(shí)用類似MFC的方法。PLP性能類似MFCC,甚至在某些特征提取結(jié)果上要好于MFCC[11]。王彪[12]提出了一種改進(jìn)的語(yǔ)音信號(hào)特征參數(shù)提取算法,即在MFCC參數(shù)的根底上參加了語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)平均過(guò)零率信息,結(jié)果如表1,說(shuō)明此改進(jìn)的MFCC方法是有效的。預(yù)處理預(yù)處理加窗離散余弦變換傅里葉變換濾波器組能量輸出語(yǔ)音輸入x(n)X(m)Θ(Mk)MFCC輸出圖1MFCC計(jì)算過(guò)程1998年,由美籍華人黃鍔(N.E.Huang)等人提出的Hilbert-Huang變換(Hilbert-HuangTransform,HHT)[13,14]具有精確的時(shí)頻表示,它不僅適合于非平穩(wěn)信號(hào)也適合于非線性信號(hào)。它通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解(EmpiricalModeDecomposition,EMD)把信號(hào)分解成一族固有模態(tài)函數(shù)(intrinsicmodefunction,IMF),然后將每個(gè)固有模態(tài)函數(shù)與它的Hilbert變換構(gòu)成一個(gè)復(fù)解析函數(shù),并由此導(dǎo)出作為時(shí)域函數(shù)的瞬時(shí)幅度(能量)和瞬時(shí)頻率,從而給出被分析信號(hào)幅度(能量)的時(shí)間-頻率分布,稱為信號(hào)的Hilbert譜(Hilbertspectrum)。這種Hilbert譜具有精確的時(shí)頻表示[15]。3語(yǔ)音特征提取的研究現(xiàn)狀概述3.1基音檢測(cè)和共振峰提取研究現(xiàn)狀概述語(yǔ)音信號(hào)的特征參數(shù)[7]主要指的是語(yǔ)音信號(hào)的基音頻率和共振峰頻率,語(yǔ)音特征參數(shù)的提取也主要是指語(yǔ)音信號(hào)的基音檢測(cè)和共振峰提取。(一)基音檢測(cè)自從進(jìn)行語(yǔ)音分析研究以來(lái),基音檢測(cè)一直是一個(gè)重點(diǎn)研究的問(wèn)題,很多方法已被提出,然而這些方法都有它們的局限性。迄今為止,尚未找到一個(gè)完善的可以適用于不同說(shuō)話人、不同環(huán)境要求的基音檢測(cè)方法。其原因主要有以下幾個(gè)方面[16]:(a)基音周期受聲道易變性、說(shuō)話人的情感、聲調(diào)等因素的影響;(b)基音周期變化范圍很大;(c)受說(shuō)話人的發(fā)音習(xí)慣的影響。基音周期的提取方法一般可以分為兩個(gè)大類[17]:基于分段的方法和基于事件的方法。基于分段的提取方法一般都先將語(yǔ)音信號(hào)分成長(zhǎng)度一定的語(yǔ)音幀,然后對(duì)每一幀語(yǔ)音數(shù)據(jù)求取平均基音周期。這些方法主要有:⑴自相關(guān)法;⑵倒譜法;⑶平均幅度差法;⑷簡(jiǎn)化逆濾波器法[18,19]等。它們的共同優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單。然而,由于它們都是建立在語(yǔ)音信號(hào)是線性和短時(shí)平穩(wěn)的假設(shè)上,因此,從本質(zhì)上說(shuō),這些方法都無(wú)法檢測(cè)幀內(nèi)基音周期的非平穩(wěn)變化,檢測(cè)精度不高。相比而言,基于事件[20]的基音周期提取方法并不多見(jiàn)。己有的幾種方法都是通過(guò)定位聲門(mén)關(guān)閉(聲門(mén)的一次關(guān)閉稱為一個(gè)事件)的瞬時(shí)時(shí)間,然后確定兩個(gè)相鄰的事件的時(shí)間間隔來(lái)確定基音周期。顯然,確定聲門(mén)關(guān)閉的瞬時(shí)時(shí)間是決定被提取的基音周期精度上下的關(guān)鍵所在。文獻(xiàn)[21]通過(guò)計(jì)算給定信號(hào)的自協(xié)方差矩陣行列式的極大值來(lái)確定事件發(fā)生的時(shí)刻。該方法對(duì)局部元音有很好的檢測(cè)精度,但它不適合所有元音,也不適合基音周期發(fā)生非平穩(wěn)性變化時(shí)的情況,并且,計(jì)算十分復(fù)雜。文獻(xiàn)[22,23]利用聲門(mén)關(guān)閉時(shí)聲門(mén)氣流的導(dǎo)數(shù)不連續(xù)這一性質(zhì)來(lái)確定事件發(fā)生的時(shí)刻,獲得了比較滿意的檢測(cè)精度。但是,它們對(duì)噪聲太敏感,不適合用于帶噪語(yǔ)音數(shù)據(jù)基音周期的提取。文獻(xiàn)[24]將最大似然關(guān)鍵點(diǎn)判別技術(shù)用于檢測(cè)聲門(mén)關(guān)閉事件,結(jié)果說(shuō)明,該方法對(duì)大局部元音、帶噪語(yǔ)音都有很高的檢測(cè)精度,但不適合用于高音調(diào)語(yǔ)音基音周期的提取。文獻(xiàn)[25,26]用小波方法來(lái)檢測(cè)聲門(mén)關(guān)閉引起的語(yǔ)音信號(hào)的導(dǎo)數(shù)不連續(xù)事件,實(shí)驗(yàn)說(shuō)明它們能適應(yīng)于很寬的基音周期變化,并且也具有較好的抗噪能力。這些方法有一個(gè)共同的假設(shè)是在聲門(mén)關(guān)閉的瞬時(shí)聲門(mén)鼓勵(lì)是瞬時(shí)中斷的,由此將導(dǎo)致語(yǔ)音信號(hào)在這一時(shí)刻其導(dǎo)數(shù)不連續(xù)。顯然,對(duì)于聲門(mén)關(guān)閉很好的元音它們會(huì)有很好的結(jié)果,但是對(duì)于聲門(mén)關(guān)閉比較緩慢的元音檢測(cè)精度將會(huì)受到很大的影響。(二)共振峰提取與基音檢測(cè)類似,共振峰提取外表上看起來(lái)很容易,而實(shí)際上又為許多問(wèn)題所困擾,這些問(wèn)題[27]是:⑴虛假峰值,⑵共振峰合并,⑶高音調(diào)語(yǔ)音。傳統(tǒng)的共振峰提取方法主要有倒譜法和線性預(yù)測(cè)法,這些方法是建立在語(yǔ)音信號(hào)是線性和短時(shí)平穩(wěn)的假設(shè)上。隨著對(duì)語(yǔ)音發(fā)生機(jī)理研究的深入,在理論分析與實(shí)驗(yàn)分析中都證實(shí)了在語(yǔ)音產(chǎn)生過(guò)程中存在非線性,語(yǔ)音信號(hào)的這種非線性特性是傳統(tǒng)的線性共振峰參數(shù)估計(jì)方法的準(zhǔn)確性受到影響的主要原因。另一方面,隨著對(duì)語(yǔ)音信號(hào)處理要求的不斷提高,共振峰參數(shù)隨時(shí)間快速變化的動(dòng)態(tài)信息也越來(lái)越受到語(yǔ)音研究者們的重視,但由于傳統(tǒng)分析方法的局限性,對(duì)快速變化的共振峰的提取無(wú)能為力。近年來(lái),盡管也提出了一些新的共振峰提取算法,如文獻(xiàn)[28]采用了基于逆濾波器的共振峰提取方法,文獻(xiàn)[29]將語(yǔ)音信號(hào)分解為調(diào)制成分并采用頻域線性預(yù)測(cè)算法的共振峰估計(jì)方法,但這些方法只是在處理方法和算法上作了一些改進(jìn),本質(zhì)上還是屬于線性分析方法的范疇,而且分析過(guò)程復(fù)雜,許多參數(shù)需要根據(jù)人的主觀經(jīng)驗(yàn)確定,會(huì)造成人為的不確定誤差和數(shù)據(jù)的不穩(wěn)定性。隨著語(yǔ)音信號(hào)非線性模型的開(kāi)展,近年來(lái)也提出了許多采用非線性處理方法提取共振峰的算法,其中最具有代表性的算法是文獻(xiàn)[30-32]中的基于多頻帶能量別離的共振峰提取算法,它以語(yǔ)音信號(hào)的調(diào)頻-調(diào)幅非線性產(chǎn)生模型為根底,用一組帶通濾波器把各個(gè)共振峰分量別離開(kāi)來(lái),再用能量別離算法求取各共振峰的瞬時(shí)頻率和瞬時(shí)幅度,但在濾波前,仍須用短時(shí)傅里葉變換粗略估計(jì)各個(gè)共振峰頻率和帶寬,依然存在受虛假峰值、共振峰合并和高音調(diào)語(yǔ)音的影響。3.2Hilbert-Huang變換研究現(xiàn)狀概述由于HHT具有自適應(yīng)性而且是分析非線性、非平穩(wěn)數(shù)據(jù)的有效工具,從1998年公開(kāi)發(fā)表到現(xiàn)在九年多時(shí)間里一直受到國(guó)內(nèi)外學(xué)者的廣泛關(guān)注。到目前為止HHT已被應(yīng)用于很多數(shù)據(jù)的分析,向世人展現(xiàn)了其強(qiáng)大的分析能力:黃本人將其應(yīng)用于[13,14]非線性系統(tǒng)分析、水波分析風(fēng)速分析、潮汐和海嘯分析、海洋環(huán)流分析和地震信號(hào)分析中,別人將其應(yīng)用到了醫(yī)藥學(xué)[33,34]、結(jié)構(gòu)土木工程[35]及機(jī)械故障診斷[36]等領(lǐng)域。國(guó)內(nèi)等高校均有學(xué)者著手對(duì)該算法進(jìn)行研究:大連理工大學(xué)的張海勇[37]將HHT與WVD結(jié)合起來(lái),提出了一種交叉信號(hào)分析方法;重慶大學(xué)的譚善文[38]提出了多分辨希爾伯特-黃變換;鐘佑明[39]強(qiáng)調(diào)了局瞬量的意義,提出了希爾伯特-黃變換局瞬信號(hào)分析方法;青島海洋大學(xué)的蔣濟(jì)同[40]將HHT應(yīng)用于海洋平臺(tái)損傷診斷;浙江大學(xué)的胡勁松[41]等人將HHT應(yīng)用于旋轉(zhuǎn)機(jī)械振動(dòng)信號(hào)。另外國(guó)內(nèi)的許多研究所及其下屬科室例如國(guó)家海洋局的第一及第三海洋研究室、中科院遙感應(yīng)用研究所等也對(duì)該算法進(jìn)行了研究和初步的應(yīng)用,并且得到了較好的應(yīng)用效果。在語(yǔ)音分析處理方面,國(guó)內(nèi)學(xué)者也對(duì)其進(jìn)行了大量的研究:湘潭大學(xué)的李凌[42]、浙江大學(xué)的許艷紅[43]把它應(yīng)用到說(shuō)話人識(shí)別,哈爾濱工業(yè)大學(xué)的申麗然[44]等把它應(yīng)用到語(yǔ)音增強(qiáng),在語(yǔ)音特征提取方面,文獻(xiàn)[45,46]把它應(yīng)用到基音檢測(cè),文獻(xiàn)[47]把它應(yīng)用到共振峰的提取。大量的事實(shí)說(shuō)明,HHT以其獨(dú)特的優(yōu)點(diǎn)在各種領(lǐng)域得到了廣泛成功的應(yīng)用,證明了其優(yōu)越性。事實(shí)也證明HHT在語(yǔ)音分析處理領(lǐng)域,特別是在語(yǔ)音特征提取中,有很多不同于傳統(tǒng)方法的優(yōu)點(diǎn):(1)不需要對(duì)語(yǔ)音信號(hào)作短時(shí)平穩(wěn)性假設(shè),可以一次性地分析和處理任意長(zhǎng)度的語(yǔ)音數(shù)據(jù),因此,用于分幀和拼合的開(kāi)銷(xiāo)減少,幀間拼合痕跡也減小;(2)檢測(cè)精度高,適應(yīng)范圍廣。這種高的檢測(cè)精度和強(qiáng)的適應(yīng)能力在理論上可以解釋為由于HHT的高時(shí)頻分辨能力和對(duì)信號(hào)的自適應(yīng)能力所致。在實(shí)際中也被來(lái)自于不同性別、年齡、語(yǔ)音采集環(huán)境等的實(shí)際語(yǔ)音信號(hào)的檢測(cè)結(jié)果所證實(shí);(3)具有跟蹤語(yǔ)音信號(hào)變化的能力。傳統(tǒng)方法大都是建立在語(yǔ)音信號(hào)短時(shí)平穩(wěn)性假設(shè)的根底上,因而提取出來(lái)的語(yǔ)音特征是一個(gè)語(yǔ)音幀內(nèi)的平均值。HHT方法打破了這一根本假設(shè),從本質(zhì)上就是把語(yǔ)音數(shù)據(jù)看成是非線性、非平穩(wěn)的數(shù)據(jù),因而,提取結(jié)果更加符合客觀實(shí)際。因此,語(yǔ)音信號(hào)作為一種典型的非平穩(wěn)信號(hào),研究應(yīng)用HHT處理語(yǔ)音信號(hào),無(wú)疑是一項(xiàng)很有意義的工作。4結(jié)論本文主要介紹了語(yǔ)音信號(hào)處理中的特征提取的方法,總結(jié)和展望了特征提取的各個(gè)常規(guī)方法以及一些研究成果。最后介紹了HHT在特征提取中的優(yōu)點(diǎn)及應(yīng)用,并指出這個(gè)新興理論的研究前景。參考文獻(xiàn)[1]湯子瀛.計(jì)算機(jī)操作系統(tǒng)[M].西安西安電子科技大學(xué)出版社,1996.[2]郭皞巖.Windows程序設(shè)計(jì)教程[M].北京人民郵電出版社,2021.[3]石海燕.語(yǔ)音信號(hào)特征參數(shù)研究[J].電腦知識(shí)與技術(shù),2021,4.[4]陳亮,張雄偉.語(yǔ)音信號(hào)非線性特征的研究[J].解放軍理工大學(xué)學(xué)報(bào),2000,1(2):11-17.[5]張賢達(dá).現(xiàn)代信號(hào)處理[M].北京:清華大學(xué)出版社,2002.349-492.[6]科恩L著.時(shí)頻分析:理論與應(yīng)用[M].白居憲譯.西安:西安交通大學(xué)出版社,1998.121-159.[7]韓紀(jì)慶,張磊,鄭鐵然.語(yǔ)音信號(hào)處理[M].北京:清華大學(xué)出版社,2004.11-94,160-189.[8]PatrickJLoughlin,LeonCohen.Theuncertaintyprinciple:Global,Local,orBoth?[J].IEEETransactionsSignalProcessing.2004,52(5),1218-1227.[9]梁學(xué)章,何甲興,王新民等.小波分析[M].北京:國(guó)防工業(yè)出版社,2004.1-162.[10]MasoudKarimi-Ghartemani,AlireraKZiarani.Anonlineartime-frequencyanalysismethod[J].IEEETransactionsonSignalProcessing,2004,52(6):1585-1595.[11]閻福智.語(yǔ)音信號(hào)處理中特征提取方法研究[J].中國(guó)新通信,2021,21:127-128.[12]王彪.一種改進(jìn)的語(yǔ)音信號(hào)特征參數(shù)提取算法研究[J].電子設(shè)計(jì)工程,2021,21:59-61.[13]HuangNE,ZhengShen.TheEmpiricalModeDecompositionandtheHilbertSpectrumforNonlinearandNon-StationaryTimeSeriesAnalysis[J].ProceedingsoftheRoyalSocietyofLondonSeries,1998,454:903-995.[14]HuangNE,ShenZheng,LongSR.Anewviewofnonlinearwaterwaves:theHilbertspectrum[J].AnnuRevFluidMech,1999,31(1):417-457.[15]MessinaAR,VittalV.Nonlinear,non-stationaryanalysisofinterareaoscillationsviaHilbertspectralanalysis[J].IEEETransactionsonPowerSystems,2006,21(3):1234-1241.[17]ReschB,NilssonM,EkmanA,KleijnWB.EstimationoftheInstantaneousPitchofSpeech[J].IEEETransactionsonAudio,SpeechandLanguageProcessing,2007,15(3):813-822.[18]LaneauJ,WoutersJ.Pitchperceptionincochlearimplantswithdifferentfilterbankdesigns[C].the25thAnnualInternationalConferenceoftheIEEEonEngineeringinMedicineandBiologySociety,2003,3:1995-1998.[19]SalorO,DemireklerM,OrgunerU.AnEfficientAlgorithmforPitchDeterminationofSpeechSignals-KalmanFilterApproach[C].SignalProcessingandCommunicationsApplications,2006.1-4.[20]BoLi,Ying-YingLi,Cheng-YouWang,etc.Anewefficientpitch-trackingalgorithm[C].IEEEInternationalConferenceonRobotics,IntelligentSystemsandSignalProcessing,2003,2:1102-1107.[21]YongDukCho,HongKookKim,MooYoungKim,SangRyongKim.Pitchestimationusingspectralcovariancemethodforlow-delayMBEvocoder[C].IEEEWorkshoponSpeechCodingForTelecommunicationsProceeding,1997.21-22.[22]AnanthapadmanabhaTV,YegnanarayanaB.Epochpredictionresidualforidentificationofclosedglottisinterval[J].IEEETransactionsonSignalProcessing,1979,27(4):309-319.[23]ChengYM,ShaughnessyDO.Automaticandreliableestimationofglottalclosureinstantandperiod[J].IEEETransactionsonSignalProcessing,1989,37(12):1805-1814.[24]DeshmukhO,SinghJ,Espy-WilsonC.Anovelmethodforcomputationofperiodicity,aperiodicityandpitchofspeechsignals[C].IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing,2004,1:117-120.[25]KadambeS,Boudreaux-BartelsGFaye.Applicationofthewaveletstransformforpitchdetectionofspeechsignals[J].IEEETransactionsonInformationTheory,1992,38(2):917-924.[26]LIJing,BAOChangchun.Apitchdetectorbasedonthedyadicwavelettransformandtheautocorrelationfunction[C].InternationalConferenceonSignalProcessing,2002,1:414-417.[27]YanQ,VaseghiS,RentzosD,etc.AnalysisandSynthesisofFormantSpacesofBritish,Australian,andAmericanAccents[J].IEEETransactionsonAudio,SpeechandLanguageProcessing,2007,15(2):676-689.[28]WATANABEA.Formantestimationmethodusinginversefiltercontrol[J].IEEETransactionsonSpeechandAudioProcessing,2001,9(4):317-326.[29]RAOP,BARMANAD.Speechformantfrequencyestimation:evaluatinganonstationaryanalysismethod[J].SignalProcessing,2000,80(8):1655-1667.[30]MaragosP,JamesFKaiser,ThomasFQuatieri.OnAmplitudeandFrequencyDemodulationUsingEnergyOperators[J].IEEETransactionsonSignalProcessing,1993,41(4):1532-1550.[31]PotamianosA,MaragosP.Speechformantfrequencyandbandwidthtrackingusingmultibandenergydemodulation[C].InternationalConferenceonAcoustics,Speech,andSignalProcessing,1995.784-787.[32]MaragosP,KaiserJF,QuatieriTF.EnergySeparationinSignalModulationswithApplicationtoSpeechAnalysis[J].IEEETransactionsonSignalProcessing,1993,41(2):3024-3051.[33]HuiFangChen.HeartRateVariabilityAnalysisofOrthostaticFaintinginSpinalCordInjuryTreatmentbyHilbertHuangTransform[D].[MasterDegreeThesis].Singapore:NationalUniversityofSingapore,2004.[34]WengBinwei,Blanco-VelascoManuel,BarnerKennethE.ECGDenoisingBasedonIEEEonEngineeringinMedicine
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州航天職業(yè)技術(shù)學(xué)院《數(shù)據(jù)挖掘與R語(yǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年護(hù)士個(gè)人工作計(jì)劃范文
- 2025年年度健康教育工作計(jì)劃
- 2025護(hù)士個(gè)人年度工作計(jì)劃例文
- 2025年大學(xué)生學(xué)習(xí)計(jì)劃
- Unit 8 Talent show Lesson 1 I'm from china(說(shuō)課稿)-2023-2024學(xué)年北師大版(三起)英語(yǔ)四年級(jí)下冊(cè)
- 2025年變電站工作計(jì)劃
- 2025年電力工作計(jì)劃
- 2025年度室內(nèi)設(shè)計(jì)師工作計(jì)劃書(shū)
- 人教版八年級(jí)上冊(cè) 歷史與社會(huì) 說(shuō)課稿 3.2秦末農(nóng)民起義與漢朝的建立1
- 對(duì)外投資合作國(guó)別(地區(qū))指南 -泰國(guó)
- 2023年-2024年崗位安全教育培訓(xùn)試題及答案通用
- 口腔修復(fù)學(xué)(全套課件290p)課件
- 小學(xué)生心理問(wèn)題的表現(xiàn)及應(yīng)對(duì)措施【全國(guó)一等獎(jiǎng)】
- 小學(xué)生科普人工智能
- 初中學(xué)段勞動(dòng)任務(wù)清單(七到九年級(jí))
- 退耕還林監(jiān)理規(guī)劃
- GB/T 1335.2-2008服裝號(hào)型女子
- GB 31247-2014電纜及光纜燃燒性能分級(jí)
- DCC20網(wǎng)絡(luò)型監(jiān)視與報(bào)警
- 項(xiàng)目實(shí)施路徑課件
評(píng)論
0/150
提交評(píng)論