《基于提升算法的語音基音周期檢測及MATLAB仿真研究》15000字（論文）

上傳人：E*** IP屬地：湖北上傳時(shí)間：2025-02-25 格式：DOC 頁數(shù)：43 大?。?.10MB 積分：27 舉報(bào) 版權(quán)申訴

《基于提升算法的語音基音周期檢測及MATLAB仿真研究》15000字（論文）_第2頁

《基于提升算法的語音基音周期檢測及MATLAB仿真研究》15000字（論文）_第3頁

《基于提升算法的語音基音周期檢測及MATLAB仿真研究》15000字（論文）_第4頁

《基于提升算法的語音基音周期檢測及MATLAB仿真研究》15000字（論文）_第5頁

已閱讀5頁，還剩38頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

摘要語音基音周期檢測概述2.1語音信號的基本模型語音信號的產(chǎn)生過程可以抽象為三個模型的級聯(lián)，這三個模型分別是激勵模型，聲道模型以及輻射模型，流程框圖如下圖所示：圖1語音信號產(chǎn)生的流程框圖激勵模型人在發(fā)濁音時(shí)，會產(chǎn)生脈沖，該脈沖的形狀看起來像斜三角形，此時(shí)經(jīng)過激勵形成的脈沖串的周期就是基音周期[8]。單個斜三角形脈沖串的數(shù)學(xué)表達(dá)式為：（2.1）式（2.1）中，為斜三角波的上升時(shí)間，為斜三角波下降的時(shí)間。單個斜三角形脈沖串的頻譜存在低通濾波器的特征，可以以Z變換的全極點(diǎn)形式表示：（2.2）上式中的c是常數(shù)，。單位脈沖串與幅值因子表示形式如下：（2.3）濁音的激勵模型可表示為：（2.4）而發(fā)清音時(shí)，聲帶比較松弛，可以用隨機(jī)白噪聲對激勵信號進(jìn)行模擬。聲道模型聲道的數(shù)學(xué)模型可以分為兩種：一是將聲道看作是一個由不同截面積的聲管連起來的系統(tǒng)，稱之為無損聲管模型；二是把聲道看作是一個諧振腔，這個諧振腔腔體的諧振頻率就是共振峰，從這個角度描述的聲道模型就是共振峰模型。輻射模型輻射阻抗，是聲壓波與速度波兩者之間的反比，可以用來顯示口唇的輻射效應(yīng)[9]。假如口唇的開口面積大小遠(yuǎn)遠(yuǎn)低于頭部外表的面積之和，那么就可以通過單板開槽輻射的處理方式來推導(dǎo)出輻射阻抗：（2.5）式子當(dāng)中，，。輻射引起的能量損耗正比于輻射阻抗的實(shí)部，輻射模型可以設(shè)置用一個高通濾波器表示，如：（2.6）式中r接近1。在工程應(yīng)用中處理信號的時(shí)候，通常采用該預(yù)加重技術(shù)。要想得到原信號，可以先對信號進(jìn)行采樣，在采樣結(jié)束之后插入一個一階的高通濾波器，最后進(jìn)行“去加重”。綜上，一個完整的語音信號的產(chǎn)生模型由三個子模型串聯(lián)而成，其傳遞函數(shù)為：（2.7）2.2語音基音周期人的發(fā)音有三種激勵方式，因而能夠形成清音、濁音和爆破音三種類型的聲音。當(dāng)聲道中某個地方的橫截面面積很小，氣流飛快地流經(jīng)此處形成湍流，當(dāng)氣流的速度與截面積的比值大于某個設(shè)定的門限值便會發(fā)出清音。如果聲道中某個地方完全閉合，在這瞬間釋放產(chǎn)生的聲音就是爆破音。當(dāng)氣流流經(jīng)聲門時(shí)，聲帶產(chǎn)生振動，能形成一股準(zhǔn)周期的脈沖串氣流，通過激勵聲道產(chǎn)生的語音就是濁音。這種聲帶振動的頻率又被稱為基頻，而基頻的倒數(shù)又稱為基音周期，基音周期的大小一般與聲帶的厚薄程度以及松緊程度等因素有關(guān)，除此之外，說話者是男是女也會對它的大小造成影響[10]。基音周期，它的提取問題一直是人們研究的問題，在語音信號處理中占有著重要的地位，基音檢測的主要困難表現(xiàn)在：（1）基音周期檢測會受到聲道的影響，一般不能直接從中提出只跟聲帶振動相關(guān)的聲源信息；（2）位于清音和濁音之間的過渡幀是否具有周期性；（3）聲道共振峰結(jié)構(gòu)、噪聲等一些因素會對波形的峰值造成影響，所以不能輕易判斷出每個基音周期的起始位置和終止位置；（4）一般男性說話的基音頻率比較低，而女性和小孩說話的基音頻率相對較高，基音頻率之間的差距會使得基音周期檢測有一定的難度[11]；（5）在工程應(yīng)用中，會受到噪聲環(huán)境的影響。2.3基音周期檢測的經(jīng)典方法2.3.1平均幅度差函數(shù)法傳統(tǒng)的平均幅度差函數(shù)（AMDF）定義為：（2.8）式中R是信號x（n）的平均值。平均幅度差函數(shù)算法和短時(shí)自相關(guān)函數(shù)類似，對于具有周期特性的濁音信號來說，相應(yīng)的也會具有一定的周期特性，并且周期等于濁音信號的周期。和自相關(guān)法不同的是，在周期的整數(shù)倍點(diǎn)上具有谷值特征。通過能夠計(jì)算出濁音信號的基音周期，但是清音信號沒有周期，所以也不會有有周期[12]。除此之外還能夠通過這種特性對自然語音段進(jìn)行清濁音判決，找出語音中的濁音段，然后對濁音段的基音周期進(jìn)行基音檢測。通過實(shí)驗(yàn)對比得出，平均幅度差函數(shù)法計(jì)算比短時(shí)自相關(guān)法簡單，計(jì)算錯判率小?；谄骄炔詈瘮?shù)的基音周期檢測算法框圖如圖2所示：圖2平均幅度差函數(shù)算法框圖2.3.2倒譜法語音信號，是卷積信號，初始序列的復(fù)倒頻譜，其定義可表示為[13]：（2.9）倒譜或稱“倒頻譜”的定義為：（2.10）通過對信號的短時(shí)譜取對數(shù)，然后再IDFT得到語音信號的倒譜，根據(jù)信號的倒頻譜特征可以檢測出基音信息。這種基音周期檢測法，往往能取到比較成功的結(jié)果，但是由于引進(jìn)了對數(shù)運(yùn)算，所以該算法在進(jìn)行具體數(shù)字實(shí)現(xiàn)時(shí)會有一定的難度，計(jì)算量較大。在信號沒有加噪時(shí)，該算法進(jìn)行基音周期檢測的準(zhǔn)確性很高，然而當(dāng)語音信號存在加性噪聲時(shí)，它的性能就會減弱，提取效果也會受到一定的影響，這是因?yàn)樵肼晻押胝Z音的對數(shù)功率譜的低電平部分填滿，使得基音峰值點(diǎn)的周期性無法顯示[14]。算法框圖如圖3所示：圖3倒譜法框圖2.3.3自相關(guān)法一般在時(shí)域中可以用相關(guān)函數(shù)對兩個信號的相似程度進(jìn)行測定，相關(guān)函數(shù)可以分為兩種：一種是自相關(guān)函數(shù)，一種是互相關(guān)函數(shù)，自相關(guān)函數(shù)能夠用來檢測語音信號之間的時(shí)域相關(guān)性。離散語音信號的自相關(guān)函數(shù)可以表示為下式：（2.11）如果信號是周期地或者是隨機(jī)的，則可以用自相關(guān)函數(shù)將信號表示成：（2.12）自相關(guān)函數(shù)的性質(zhì)有：如果信號是周期的，那么它的自相關(guān)函數(shù)也是周期的，且該自相關(guān)函數(shù)的周期等于信號的周期[15]。周期信號的自相關(guān)函數(shù)在抽樣為0，，，……的時(shí)候都能夠取到最大值。自相關(guān)函數(shù)是偶函數(shù)，圖像關(guān)于y軸對稱，=。結(jié)合上述性質(zhì)，利用自相關(guān)函數(shù)可以提取周期信號的周期。因?yàn)榍逡粜盘枦]有周期性，所以它的自相關(guān)函數(shù)也沒有周期性，k值越大，幅度越?。欢鴿嵋粜盘柺侵芷诘?，所以它的自相關(guān)函數(shù)也是周期的，周期等于信號周期，且濁音信號的會在基音周期的倍數(shù)點(diǎn)上有峰值出現(xiàn)。因此可以檢測信號的自相關(guān)函數(shù)是否有峰值對語音進(jìn)行清濁音判決，并且由第一個峰值點(diǎn)的位置可以求出基音周期。算法框圖如圖4所示[16]。圖4自相關(guān)函數(shù)算法框圖第3章基于提升算法的語音基音周期檢測3基于提升算法的語音基音周期檢測3.1小波變換的基本理論3.1.1小波變換的概念傅里葉分析，是一種常用的信號頻域分析方法，它使用的是一種全局的變換技術(shù)，所以僅用傅里葉變換，不能準(zhǔn)確描述信號的時(shí)頻局域化特性。但是時(shí)頻局部化性質(zhì)對非平穩(wěn)信號來說非常重要，所以傅里葉分析在處理非平穩(wěn)信號時(shí)就會顯得心有余而力不足。隨著科技的發(fā)展，研究人員又在傅里葉變換的基礎(chǔ)之上，提出了很多處理信號的方法，小波變換法由此誕生。在對信號進(jìn)行處理的時(shí)候，特別是非平穩(wěn)信號，它在每個時(shí)刻的頻域特征都不容忽視。小波變換法，一種嶄新的變換分析方法，與傅里葉變換不同的是，它能夠?qū)r(shí)域和頻域兩者有機(jī)地結(jié)合起來，處理很多傅里葉變換解決不了的問題。其基本思想是通過變換的方式著重強(qiáng)調(diào)有些問題的具體特征，通過伸縮、平移等一些基礎(chǔ)的運(yùn)算功能來對信號進(jìn)行多分辨率分析，最后實(shí)現(xiàn)高頻部分的時(shí)間細(xì)分與低頻部分的頻率細(xì)分，不放過信號的任意細(xì)節(jié)處理，稱為繼傅里葉變換在科學(xué)方法上的又一重大突破，展示了一種對信號進(jìn)行分析的新途徑。小波變換的定義為：（3.1）其逆變換為：（3.2）其中：（3.3）式中：為傅里葉變換，取有限值，a為縮放因子，b為平移因子。1.連續(xù)小波變換將任意空間中的函數(shù)在小波基下做出展開，一般把這種展開稱為函數(shù)的連續(xù)小波變換，用以下的等式來定義：（3.4）通過上面提到的連續(xù)小波變換的定義，能夠發(fā)現(xiàn)小波變換與傅里葉變換兩者之間的共同點(diǎn)就是它們都是一種積分變換，但兩者之間還存在很多不同點(diǎn)。若是采用的小波滿足“平方可積”條件，則連續(xù)小波變換存在逆變換，逆變換公式為：（3.5）式中，為對提出的“平方可積”條件。連續(xù)小波變換的主要性質(zhì)如下：（1）線性。（3.6）則（3.7）（2）時(shí)移共變性（3.8）（3）時(shí)標(biāo)定理（3.9）（4）微分運(yùn)算（3.10）2.離散小波變換離散小波變換的定義如下：（3.11）信號的離散小波變換的系數(shù)為：（3.12）離散小波變換的重構(gòu)公式可以用下式表示：（3.13）式（3.14）中的是一個常數(shù)，不會受到原始信號的影響，與原始信號無關(guān)。3.1.2利用小波變換進(jìn)行基音周期檢測的原理小波變換的主要特性如下：線性時(shí)移不變性；信號不連續(xù)性在小波變換不同分辨率下的傳遞性。因?yàn)槁曢T閉合的瞬間會在語音信號中以突變的形式存在，類似于圖像處理領(lǐng)域的邊緣檢測，Mallat等人指出，對多尺度的邊緣檢測在小波域中就是尋找局部極大值。Kadambe等人就是利用上述相關(guān)理論，并在這些理論的基礎(chǔ)之上提出一種基于小波變換的基音周期檢測法[17]。由小波變換知，假設(shè)為光滑函數(shù)，和定義如下：（3.14）記，則對一個實(shí)函數(shù)，在尺度S處有以下小波變換：（3.15）（3.16）由此得出，，分別能夠與實(shí)函數(shù)經(jīng)變換后得到的函數(shù)的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)成正比，而函數(shù)一階導(dǎo)數(shù)絕對值的最大值對應(yīng)的就是突變點(diǎn)，所以幅值局部極大值點(diǎn)就是函數(shù)的突變點(diǎn)[18]。假設(shè)將光滑函數(shù)的一階導(dǎo)數(shù)作為小波函數(shù)，那么可以用小波變換的模極大值來對信號的突變點(diǎn)進(jìn)行檢測，即如果在處存在尖銳的變化，那么該小波變換系數(shù)在時(shí)就會以極大值的方式呈現(xiàn)。人在發(fā)音時(shí)，聲門閉合，氣流陡然增加，在語音波形圖上表示為一個顯著的跳變，相鄰聲門閉合的時(shí)間間隔就是瞬態(tài)基音周期，對多個瞬態(tài)基音周期求平均值可以得出語音信號的基音周期，流程圖如下圖所示[19]。圖5小波變換法框圖3.1.3小波基的選取在實(shí)際應(yīng)用中，不同的小波函數(shù)性質(zhì)也會大不相同，在解決同一個問題時(shí)，使用不同的小波基函數(shù)可能會得到不同的檢測結(jié)果，所以小波基函數(shù)的選取非常重要，一般會按照自相似的原則來選取合適的小波基函數(shù)。在做實(shí)驗(yàn)時(shí)，通常需要提前了解各個小波函數(shù)及其性質(zhì)，最后憑借小波分析信號的實(shí)際結(jié)果與理論之間的誤差選取合適的小波基函數(shù)。常用的小波函數(shù)及性質(zhì)如下：Haar小波，如圖6所示，該小波是在20世紀(jì)初Haar利用平移思想構(gòu)造出來的首個規(guī)范正交的小波基函數(shù)，它是支撐域在范圍的單個矩形波，消失矩?cái)?shù)為1，計(jì)算量很小，是最簡單的正交小波函數(shù)。Haar函數(shù)的定義為：（3.17）但是Haar小波在時(shí)域上具有非連續(xù)性，所以一般作為基本小波使用時(shí)，性能方面不是很好，但是它也有一些優(yōu)點(diǎn)，比如運(yùn)算非常簡單等等，大部分用于理論方面的研究。圖6haar小波Daubechies小波，簡稱為dbN小波，N是它的階數(shù)，是由InridDaubechies，一個在世界上有著重要地位的小波分析學(xué)者構(gòu)造出來的小波函數(shù)，其數(shù)學(xué)表達(dá)式為：（3.18）式中，表示二項(xiàng)式的系數(shù)。Daubechies小波是具有緊支撐性、正交性以及雙正交性三種性質(zhì)的小波，且具有良好的正則性，能夠使信號在重構(gòu)過程中比較光滑，但它沒有對稱性，支撐寬度為2N-1，消失矩?cái)?shù)為N，其中dB6小波函數(shù)圖如圖7所示。隨著階數(shù)次數(shù)的增大，消失矩越大，光滑性就越好，且頻帶的劃分效果也顯得很好，但是計(jì)算量也會相應(yīng)的增加，導(dǎo)致時(shí)變性變差。圖7dB6小波（3）Symlets小波，一般表示為symN（N=2，3，……，8），是由小波分析學(xué)者Daubechies在db系小波函數(shù)的基礎(chǔ)上進(jìn)行改進(jìn)后構(gòu)造的一種近似對稱的函數(shù)，具有緊支撐性、雙正交性等性質(zhì)，其中sym6小波如下圖所示。symN小波的支撐寬度是2N-1，消失矩?cái)?shù)也是2N-1。圖8sym6小波（4）Meyer小波，小波函數(shù)圖為圖9所示，其函數(shù)定義為：（3.19）Meyer小波的小波函數(shù)跟尺度函數(shù)都是在頻域中進(jìn)行定義的，它不是緊支撐的，但它具有很快的收斂速度。Meyer小波具有正交性和雙正交性，可以進(jìn)行CWT和DWT，但是不存在快速算法FWT，且局部分析能力差。圖9Meyer小波（5）MexicanHat小波，其波形圖如圖10所示，它的定義為：（3.20）它是Gauss概率密度函數(shù)的二階導(dǎo)數(shù)，可以進(jìn)行CWT，但是不可以做DWT，而且它的形狀有點(diǎn)兒類似于墨西哥帽的截面，所以又叫墨西哥草帽函數(shù)。它在頻域和時(shí)域上都具備優(yōu)異的局部化性質(zhì)，并且滿足，多用于系統(tǒng)識別。圖10MexicanHat小波（6）Morlet小波，該小波圖如下圖所示，其定義函數(shù)為：（3.21）Morlet小波不存在尺度函數(shù)，也不具有正交性和雙正交性，屬于非正交分解，是一種高斯包絡(luò)下的單頻率正弦函數(shù)，不具備緊支撐性，應(yīng)用領(lǐng)域廣泛，可以用于信號表示和分類以及特征提取。圖11Morlet小波3.1.4小波變換分解層數(shù)的確定信號在不同層次上的小波變換系數(shù)代表了信號中包含的有效信息，由于小波變換在分解尺度變大的情況下，信號部分的小波系數(shù)增大，噪聲部分的小波系數(shù)將會降低。所以通過對信號的分解層數(shù)進(jìn)行增加能夠有效地區(qū)分出有用信號與噪聲信號。在具體的小波變換中，按照Mallat算法的2抽樣分解定理，即每分解一次，得到的數(shù)據(jù)就要進(jìn)行2抽樣，低頻部分的數(shù)據(jù)會被送到下一級再進(jìn)行分解，可選取的最大分解層數(shù)為。但結(jié)合實(shí)際情況來看，一般不會選擇很大的分解層數(shù)，雖然不會丟失有用的信息，但是隨著層數(shù)的增多，采樣點(diǎn)數(shù)就會減少，不利于觀察。而且隨著分解層數(shù)的增加，使得分解層數(shù)過多，對所有的各層小波空間的系數(shù)進(jìn)行閾值處理都會造成信號的信息丟失比較嚴(yán)重，有用的信息會變得越來越少。從信號重構(gòu)方面考慮，信號的分解次數(shù)越多，信號失真越嚴(yán)重，最終導(dǎo)致重構(gòu)信號和原信號之間的誤差很大，得到的信號遠(yuǎn)不如原來的信號，同時(shí)還會使得運(yùn)算量大大增加，使得處理變慢。對于不同信號類型，不同信噪比下都有一個理想的分解層數(shù)，從而取得更好的效果。3.2提升算法的基本理論3.2.1提升算法的基本思想在過去的二三十年里，科研人員提出多種對小波進(jìn)行構(gòu)造和對小波濾波器組進(jìn)行構(gòu)造的方法，為實(shí)際工程應(yīng)用等方面提供了許多不同的小波，如正交小波等等。這些構(gòu)造辦法絕大部分是在頻域中完成的，構(gòu)造過程相對繁瑣。1995年，Sweldens博士等人在一代小波變換的基礎(chǔ)之上提出了采用提升方法構(gòu)造的第二代小波(secondgenerationwavelet)方法，這種方法不僅是一種新型的基于空間域的小波構(gòu)造方法，而且還保留了傳統(tǒng)小波多分辨率的優(yōu)良特性，主要有以下四點(diǎn)優(yōu)勢[20-21]：提升算法構(gòu)造小波時(shí)不會再依賴于傅里葉變換，在自適應(yīng)構(gòu)造以及結(jié)構(gòu)化設(shè)計(jì)方面具有鮮明的優(yōu)點(diǎn)；構(gòu)造方法不拘泥于固有的模式，它能夠從一些相對單一的小波函數(shù)，通過提升方案對小波函數(shù)的特性進(jìn)行改善，最終能夠構(gòu)造出具有期望特性的小波；不依附于固定的小波函數(shù)的伸縮和平移，它適用于沒有采用等間隔采樣的小波構(gòu)造；該算法更加簡單，占用內(nèi)存少，能夠節(jié)約儲存空間，計(jì)算速度非?？?，能夠節(jié)約一半的計(jì)算量。1998年，Sweldens等眾多學(xué)者通過研究得出，對于任意一個具有FIR濾波器的小波變換，都能夠通過一系列多步提升方法來進(jìn)行解決，這一結(jié)論建立了傳統(tǒng)小波變換與提升算法之間的聯(lián)系[22]。從理論發(fā)展水平看，第二代小波在現(xiàn)階段有很多構(gòu)造方法，經(jīng)過國內(nèi)外學(xué)者的不斷研究，提升小波開始逐步由理論應(yīng)用到實(shí)際工程，在故障診斷等眾多領(lǐng)域得到了廣泛的應(yīng)用[23]。3.2.2提升算法1.提升算法的基本原理用提升算法對小波進(jìn)行構(gòu)造使，能夠通過一種簡便的途徑對小波的基本理論進(jìn)行闡述，并且在一代小波變換當(dāng)中都能夠找到跟它相對的提升算法。提升小波算法對信號的高頻部分和低頻部分進(jìn)行分離是通過預(yù)測和更新這兩個提升環(huán)節(jié)實(shí)現(xiàn)的，因?yàn)樾盘栕陨砭哂芯植肯嚓P(guān)性的特性，所以可以通過相鄰的信號值，經(jīng)過適當(dāng)?shù)念A(yù)測算子將某一點(diǎn)的信號值預(yù)測出來，信號中的高頻信息稱為預(yù)測誤差，這個過程稱為預(yù)測環(huán)節(jié)[24]。預(yù)測環(huán)節(jié)之后得出的高頻信息又經(jīng)過更新算子調(diào)整信號的下抽樣，得到信號的低頻信息，這個過程稱為更新環(huán)節(jié)。提升小波變換主要由正變換和逆變換構(gòu)成，即可以分為分解和重構(gòu)兩部分。提升算法的正變換主要有以下三個階段：

（1）分裂（Split）

分裂的目的將原始信號x(n)劃分成兩個相同長度、互相沒有交集的部分：即和。如果和之間的相關(guān)性越強(qiáng)，信號就會呈現(xiàn)出更好的分裂效果，一般常用的是惰性分裂法，惰性分裂法即按照奇偶性來對信號進(jìn)行奇采樣和偶采樣，一個為奇樣本，另一個為偶樣本，使得，：（3.22）分裂的反過程就是聚合(Merge)，將已知的偶樣本和奇樣本進(jìn)行合并，可方便地恢復(fù)原始信號x(n)。（2）預(yù)測(Prediction)預(yù)測，就是基于原始數(shù)據(jù)相關(guān)性的基礎(chǔ)之上，利用奇偶序列的相關(guān)性，用子數(shù)據(jù)集來對進(jìn)行預(yù)測，預(yù)測誤差如下：（3.23）其中，P(.)表示的是預(yù)測算子。在預(yù)測過程完成后，能夠計(jì)算得到信號的一半信息，用d(n)來代替。目前，多項(xiàng)式插值是常用的預(yù)測算子。對信號進(jìn)行預(yù)測的過程也是一個可逆的過程，通常情況下只要選出一種預(yù)測算子P(.)，就能夠通過和d(n)來對進(jìn)行修復(fù)，最終恢復(fù)到信號x(n)。（3.24）（3）更新（Update）更新的最終目的就是為了用d(n)對原始信號x(n)進(jìn)行修正，使得原始信號x(n)在經(jīng)過修正后只含有低頻成分，即（3.25）其中，式（3.25）中U(.)指的是更新算子。在此階段完成后，可以通過計(jì)算得出信號的另一半，用原信號的低頻信息來對這一半進(jìn)行替代，即用c(n)來代替。上文所述的三個步驟是信號的一層的提升分解，具體過程示意圖如下圖12所示。圖12提升分解結(jié)構(gòu)示意圖把上面分解的過程顛倒過來，再將加法和減法兩種運(yùn)算互相轉(zhuǎn)換的過程就是提升分解逆變換的過程。提升算法的逆變換過程和正變換過程類似，同樣也分為三個階段：反更新、反預(yù)測以及合并，逆過程如圖13所示。圖13提升重構(gòu)結(jié)構(gòu)示意圖2.提升小波分解與重構(gòu)的多相位表示設(shè)、、h、g是雙正交小波濾波器組，完美重建的條件如下所示：（3.26）多相位矩陣可以定義為：（3.27）在這個階段，小波變換是由多相矩陣進(jìn)行的。如果和設(shè)為1，且和兩者均為0，則為單位矩陣，小波變換稱為懶小波變換。懶小波變換除了將輸入信號分解為奇偶分量外，其他什么也不做。的定義與此類似。圖14為小波變換的多相顯示。圖14小波變換多相表示如圖所示，完全重建的條件現(xiàn)在由：（3.28）（3.29）假設(shè)行列式P（z）=1（3.30）提升定理表明，任何與h互補(bǔ)的其他有限長濾波器為：（3.31）其中，是勞倫多項(xiàng)式，這種形式的濾波器與h都能夠互補(bǔ)。如果是以多相形式寫入，那么新的多相矩陣如下所示：（3.32）同樣，可以使用提升定理來創(chuàng)建與互補(bǔ)的濾波器：（3.33）對偶多相矩陣為：（3.34）從所有給定的方程來看，可以明確得到提升算法的具體工作原理。過程是從懶小波開始的，然后兩個多相矩陣都等于單位矩陣。在對懶小波應(yīng)用原始或雙重提升步驟之后，能夠得出一個全新的更為繁瑣的小波變換。換句話說，將小波變換的復(fù)雜度提升到更高，可以執(zhí)行許多提升步驟來構(gòu)建高度復(fù)雜的小波變換。利用歐幾里德算法，可以將任意雙帶子頻帶的FIR濾波分解為一組提升步驟。多相矩陣被分解為三角形子矩陣的級聯(lián)，其中每個子矩陣對應(yīng)于提升或雙重提升步驟，圖15中濾波器組的多相矩陣被分解為三角形子矩陣（3.35）圖15左側(cè)是使用提升的正小波變換，右側(cè)是使用提升的逆小波變換3.2.3常用小波基的提升算法實(shí)現(xiàn)dB4小波濾波器的z變換為：（3.36）其中：（3.37）dB4小波濾波器的多相位矩陣在提升算法下的因式分解如下：（3.38）由上得出dB4小波變換的提升算法為：（3.39）其它小波基的算法構(gòu)造如下表所示表1小波基提升算法構(gòu)造HaarDaubechies4Daubechies6Filter(9-7)3.2.4基于提升算法的語音基音周期檢測本文采用的是基于提升算法的語音基音周期檢測，算法具體步驟如下所示：第一步：首先求出整個自然語音段波形幅值絕對值的最大值A(chǔ)；第二步：用平滑分析窗對語音信號進(jìn)行分幀，設(shè)置幀移；第三步：對第i幀語音信號進(jìn)行初步有聲無聲判斷。求出這一幀語音信號幅值絕對值的最大值，如果該值比A/15小，就判斷信號為無聲，i加1，繼續(xù)執(zhí)行該步驟，否則，執(zhí)行下一個步驟；第四步：計(jì)算得出語音信號第i幀的全局最大值；第五步：用提升算法對第i幀語音j尺度和j+1尺度二代小波變換系數(shù)進(jìn)行計(jì)算；第六步：找到j(luò)尺度和j+1尺度二代小波變換局部極大值，且局部極大值的數(shù)值要大于全局最大值的0.6倍，如果局部極大值點(diǎn)的個數(shù)少于2，就會把該幀信號判斷為清音，基音周期值設(shè)置為0，繼續(xù)執(zhí)行步驟八，否則，執(zhí)行步驟七；第七步：比較j尺度和j+1尺度的局部極大值點(diǎn)。若接近或重合，則基音周期為尺度j時(shí)局部極大值之間的距離，繼續(xù)下一步。否則，將j加1，執(zhí)行步驟五；第八步：將i加1，直到i為最大值。否則，執(zhí)行步驟三?；谔嵘惴ǖ恼Z音基音周期檢測算法流程圖如圖16所示。圖16基于提升算法的語音基音周期檢測算法流程圖3.3本章小結(jié)本章首先簡單的介紹了小波變換的基本概念和相關(guān)性質(zhì)，之后講述了如何通過小波變換來實(shí)現(xiàn)語音基音周期檢測，而在小波變換中，小波基的選擇也是一個關(guān)鍵步驟，所以接著又介紹了多種小波基的性質(zhì)以及小波變換分解層數(shù)的確定；在3.2節(jié)里主要講述了提升算法的相關(guān)理論，包括提升算法的提出、基本原理，以及一些常用小波基的提升算法實(shí)現(xiàn)。第4章算法仿真及結(jié)果分析4算法仿真及結(jié)果分析4.1MATLAB仿真平臺介紹MATLAB仿真軟件，是一款強(qiáng)大的應(yīng)用于商業(yè)的數(shù)學(xué)軟件，是由上個世紀(jì)美國MathWorks公司推出的一款軟件。該軟件主要應(yīng)用于數(shù)據(jù)分析、工程計(jì)算等領(lǐng)域，應(yīng)用范圍覆蓋率非常廣。MATLAB由matrix&laboratory單詞拼湊而成，代表著矩陣實(shí)驗(yàn)室，軟件自身主要負(fù)責(zé)面對數(shù)值計(jì)算以及可視化程序設(shè)計(jì)等之類的高科技工作環(huán)境。該軟件以矩陣運(yùn)算作為基礎(chǔ)，計(jì)算效率遠(yuǎn)遠(yuǎn)高于c和c++，把相當(dāng)多的功能融合到一個簡單易學(xué)、易于操作的視窗環(huán)境中。而且MATLAB仿真軟件內(nèi)部擁有功能豐富的應(yīng)用工具箱以及函數(shù)庫，降低了對用戶的數(shù)學(xué)基礎(chǔ)和計(jì)算機(jī)語言知識的要求，通過封裝大量的函數(shù)，使得用戶在進(jìn)行復(fù)雜的數(shù)學(xué)運(yùn)算時(shí)可以直接調(diào)用，只需要去關(guān)注模型建立的工作，而無需研究思考一些復(fù)雜繁碎的程序設(shè)計(jì)過程，進(jìn)而使得用戶在工作方面的效率得到一個大幅度的提升。經(jīng)過不斷的更新，MATLAB的功能也變得越來越強(qiáng)大，為用戶提供豐富的資源，涵蓋多種領(lǐng)域的研究，為社會上不同行業(yè)的科技工作者提供了極大的便利?，F(xiàn)如今，與mathematica、maple并稱為三大數(shù)學(xué)軟件。4.2算法仿真與結(jié)果分析4.2.1純凈信號的基音周期檢測仿真與分析實(shí)驗(yàn)處理的原始語音樣本是在安靜環(huán)境下錄制的元音“a”的wav音頻文件，該信號的采樣頻率是44.1kHz，每個樣點(diǎn)是用16bit量化，單聲道。選取該語音信號，波形如圖17所示。圖17元音“a”的原始信號波形本文分別采用兩種方法來檢測該純凈信號的基音周期：一是自相關(guān)函數(shù)法，如下圖所示，由于語音具有短時(shí)平穩(wěn)的特性，通過對原始語音信號進(jìn)行加窗（窗長為512的矩形窗），選取一幀語音信號，結(jié)果如圖18所示，計(jì)算其短時(shí)自相關(guān)函數(shù)，結(jié)果如圖19所示，由圖19可以看出自相關(guān)函數(shù)波形在時(shí)延為基音周期的倍數(shù)上存在極大值，根據(jù)圖中的極大值位置可以計(jì)算得出該純凈信號的基音周期值為4.1723ms。圖18一幀語音信號波形圖圖19一幀語音信號的自相關(guān)函數(shù)圖二是dB4提升小波法，通過dB4小波對該語音信號依次進(jìn)行三層分解，如圖20所示，選取二層分解后得到的波形計(jì)算出局部極大值點(diǎn)，局部極大值點(diǎn)的位置對應(yīng)著聲門閉合的瞬時(shí)，通過相鄰的兩個極大值之間的距離能夠求出該信號的語音基音周期，基音周期為4.1723ms。圖20dB4提升小波顯然，對于純凈的語音信號，兩種算法都能夠準(zhǔn)確提取出該信號的語音基音周期。自相關(guān)算法比較簡單，是求基音周期的經(jīng)典方法，而提升算法構(gòu)造方法靈活，計(jì)算速度快，便于硬件實(shí)現(xiàn)。4.2.2不同小波基的檢測效果比較因?yàn)椴煌男〔ê瘮?shù)之間存在著大不相同的性質(zhì)，在對問題進(jìn)行分析時(shí)，可以使用不同的小波基函數(shù)來分析同一個問題，并且得到的檢測結(jié)果可能也會有所區(qū)別，所以本文研究使用幾種不同的小波基的提升算法來對該語音信號進(jìn)行基音周期檢測。圖21Haar提升小波圖22dB6提升小波圖22filter（9-7）提升小波上述三個圖是分別用Haar小波和dB6小波以及filter（9-7）小波三種小波基來對原始語音信號進(jìn)行三層分解后所構(gòu)成的波形圖，通過實(shí)驗(yàn)可以求出波形的局部極大值的位置，進(jìn)而計(jì)算出基音周期為4.1723ms。實(shí)驗(yàn)結(jié)果表明，這三種小波基在沒有受到外界噪聲干擾的情況下，都能準(zhǔn)確地進(jìn)行基音周期檢測。由于噪聲環(huán)境會對語音基音周期檢測增加一定的難度，所以本文研究在不同信噪比之下常用小波基的抗噪聲性能，如表2所示：表2不同小波基在不同信噪比下檢測基音周期的性能比較10dB5dB0dB-5dB-10dBHaar小波4.1723ms4.1723ms4.1723ms3.4467ms-dB4小波4.1723ms4.1723ms4.1723ms4.0816ms-dB6小波4.1723ms4.1723ms4.1723ms4.1723ms3.0839msfilter（9-7）4.1723ms4.1723ms4.1723ms3.8095ms-實(shí)驗(yàn)結(jié)果表明，dB6小波函數(shù)的抗噪聲性能最好，在信噪比為-10dB的情況下也能提取出語音基音周期，提取出來的值為3.0839ms，誤差為1.0884ms，其它小波在噪聲信噪比設(shè)置為-10dB無法提取出語音基音周期，所以在噪聲環(huán)境下選取合適的小波基函數(shù)來實(shí)現(xiàn)基音周期檢測也顯得至關(guān)重要，它能夠影響基音周期檢測的準(zhǔn)確性。4.2.3算法抗噪性能分析語音是人與人之間交流信息和傳遞信息的一個重要手段，在進(jìn)行基音周期檢測時(shí)往往會受到外界噪聲環(huán)境的干擾，因此探討算法在進(jìn)行基音周期檢測時(shí)的抗噪聲性能已經(jīng)成為了一個重要的研究方向。為了研究算法的抗噪聲性能，本文利用三種算法仿真了不同信噪比下的語音信號基音周期檢測結(jié)果。1.自相關(guān)法圖23自相關(guān)法的檢測結(jié)果（snr=10）圖24自相關(guān)法的檢測結(jié)果（snr=5）圖25自相關(guān)法的檢測結(jié)果（snr=0）圖23-25三幅圖是對純凈語音信號加噪，信噪比分別設(shè)置為10dB、5dB以及0dB,利用自相關(guān)法對該加噪后的語音信號進(jìn)行基音周期檢測，實(shí)驗(yàn)結(jié)果表明信噪比大于等于5dB的時(shí)候，自相關(guān)法能夠準(zhǔn)確提取出語音基音周期，當(dāng)信噪比小于等于0dB的情況下，自相關(guān)函數(shù)的波形呈現(xiàn)不出周期性，自相關(guān)法檢測不出語音基音周期。2.提升小波算法該仿真實(shí)驗(yàn)中選用最簡單的harr小波。圖26haar提升小波法的檢測結(jié)果（snr=10）圖27haar提升小波法的檢測結(jié)果（snr=5）圖28haar提升小波法的檢測結(jié)果（snr=0）圖29haar提升小波法的檢測結(jié)果（snr=-5）圖26-29是對純凈語音信號加噪，信噪比分別設(shè)置為10dB、5dB、0dB以及-5dB,利用haar提升小波來對該加噪后的語音信號進(jìn)行三層分解后進(jìn)行基音周期檢測，通過三個局部極大值點(diǎn)的位置可以計(jì)算得出該信號的基音周期。實(shí)驗(yàn)結(jié)果表明當(dāng)信噪比大于等于-5dB的時(shí)候，該算法能夠準(zhǔn)確提取出語音基音周期，當(dāng)信噪比小于等于-10dB的時(shí)候，該提升小波算法提取不出基音周期。3.提升小波和自相關(guān)相結(jié)合法雖然提升算法確實(shí)在很多方面性能優(yōu)于一些經(jīng)典的基音周期檢測算法（如平均幅度差函數(shù)法、自相關(guān)法），但是因?yàn)檎Z音信號自身的復(fù)雜性，能夠準(zhǔn)確地對語音基音周期進(jìn)行檢測的難度就顯得非常大，所以本文又仿真分析了將自相關(guān)法和提升算法相結(jié)合的方法來實(shí)現(xiàn)語音基音周期檢測。圖30提升小波和自相關(guān)相結(jié)合法的檢測結(jié)果（snr=10）圖31提升小波和自相關(guān)相結(jié)合法的檢測結(jié)果（snr=5）圖32提升小波和自相關(guān)相結(jié)合法的檢測結(jié)果（snr=0）圖33提升小波和自相關(guān)相結(jié)合法的檢測結(jié)果（snr=-5）圖34提升小波和自相關(guān)相結(jié)合法的檢測結(jié)果（snr=-10）圖30-34是提升算法和自相關(guān)算法兩者相結(jié)合的語音基音周期檢測算法，依次為信噪比設(shè)置為10dB、5dB、0dB、-5dB以及-10dB，通過haar提升小波對加噪后的語音信號進(jìn)行三層分解并對該分解的信號求自相關(guān)。實(shí)驗(yàn)結(jié)果表明，在低信噪比的情況下，該算法能夠較為準(zhǔn)確地進(jìn)行語音基音周期檢測。表3不同方法檢測基音周期的抗噪聲性能比較10dB5dB0dB-5dB-10dB自相關(guān)法4.1723ms4.1723msHaar小波4.1723ms4.1723ms4.1723ms3.4467ms-提升小波-自相關(guān)4.1723ms4.1723ms4.1723ms4.1723ms-本文通過對純凈語音信號“a”進(jìn)行加噪來研究不同算法的抗噪聲性能，仿真實(shí)驗(yàn)中加的噪聲是高斯噪聲，再用自相關(guān)函數(shù)法,提升算法以及將提升算法和自相關(guān)算法兩者結(jié)合起來使用的方法來對SNR=10dB,SNR=5dB,SNR=0dB等不同信噪比下的語音信號進(jìn)行語音基音周期的檢測，結(jié)果圖23-34以及表2所示。通過表2可以發(fā)現(xiàn)當(dāng)對語音信號進(jìn)行加噪后，將信噪比設(shè)置為10dB和5dB的時(shí)候，三種方法都能夠比較準(zhǔn)確地提取出語音信號的基音周期。而信噪比設(shè)置為0dB后，自相關(guān)函數(shù)法無法提取出該語音信號的基音周期，而提升算法和提升小波-自相關(guān)法都可以在SNR=0dB的情況下準(zhǔn)確提取出語音基音周期，相比于自相關(guān)函數(shù)法，后兩者抗噪聲性能更好。通過表3中的實(shí)驗(yàn)結(jié)果還可以看出將提升算法和自相關(guān)函數(shù)法兩者相結(jié)合的方法在抗噪聲性能方面也具有明顯的優(yōu)勢，能夠在低信噪比的情況下準(zhǔn)確地進(jìn)行語音基音周期檢測，并且性能優(yōu)于提升算法。4.2.4自然語音段的基音周期檢測由于純凈的濁音信號具有較好的周期性，波形也比較穩(wěn)定，不能代表實(shí)際語音的不斷變化和波形的起伏，因此本文4.2.4節(jié)是對自然語音段進(jìn)行基音周期檢測，實(shí)驗(yàn)所要處理的語音樣本是在安靜環(huán)境下錄制的一個詞語“開始”的wav音頻文件，該信號的采樣頻率是44.1kHz，每個樣點(diǎn)是用16bit量化。原始信號的波形圖如圖34所示。圖34自然語音段波形示意圖圖35dB6提升小波法圖35是用提升小波對該自然段語音信號“開始”進(jìn)行的基音周期檢測圖，選取的小波基函數(shù)為dB6小波,幀長為512個采樣點(diǎn)，幀移為256個采樣點(diǎn)，通過實(shí)驗(yàn)可以得出該自然語音段的基音周期檢測圖，該信號基音周期較為平穩(wěn)，檢測的結(jié)果比較理想。第5章總結(jié)與展望5總結(jié)與展望語音信號處理技術(shù)的研究工作最早可以上溯到19世紀(jì)70年代，并且在上個世紀(jì)得到了長足的發(fā)展，現(xiàn)如今，隨著21世紀(jì)的到來，社會逐漸步入了高速發(fā)展、科技化的階段，語音技術(shù)應(yīng)用的范圍領(lǐng)域越來越廣泛，語音信號最基本的研究方向就是基音周期，所以能夠準(zhǔn)確地進(jìn)行語音基音周期檢測也顯得非常重要[25-26]。本文針對如何進(jìn)行語音基音周期檢測簡單地介紹了三種常用的經(jīng)典的方法，分別是平均幅度差函數(shù)法、倒譜法以及自相關(guān)函數(shù)法，主要研究了基于提升算法的語音基音周期檢測。最后對自相關(guān)算法和提升算法兩種方法做了一些仿真實(shí)驗(yàn)并對實(shí)驗(yàn)結(jié)果進(jìn)行了分析。具體工作內(nèi)容主要包括以下幾個方面：首先，通過兩種算法來檢測純凈的語音信號的基音周期：一個是經(jīng)典法，即自相關(guān)函數(shù)法，一個是提升算法。然后將兩種算法做一個比較來對它們的優(yōu)缺點(diǎn)進(jìn)行分析。實(shí)驗(yàn)表明自相關(guān)函數(shù)法和提升算法這兩種算法都能夠較為準(zhǔn)確地實(shí)現(xiàn)語音基音周期檢測，而提升算法構(gòu)造方法比較靈活，計(jì)算速度相當(dāng)快。其次，通過對純凈的語音信號進(jìn)行加噪，分別研究三種算法在不同信噪比之下能否提取出語音基音周期以及它們的抗噪聲性能如何。實(shí)驗(yàn)驗(yàn)證，經(jīng)典的基音周期提取算法自相關(guān)函數(shù)法在信噪比比較高的情況下能夠獲得令人滿意的提取效果，但是當(dāng)在低信噪比的情況下，它的基音周期提取效果就會大打折扣，甚至于提取不出來，而提升算法-自相關(guān)法抗噪聲性能優(yōu)于提升算法，而提升算法的抗噪聲性能又明顯優(yōu)于自相關(guān)算法。最后，錄制一段自然語音段，對語音段求出基音周期?；糁芷诘臋z測一直是重點(diǎn)研究問題，隨著科技的進(jìn)步，對基音檢測的技術(shù)要求也變得越來越高。本文只是涉及了整個大的課題中的冰山一角，除此之外還存在著很多問題和內(nèi)容等著去研究，還有很多工作需要進(jìn)一步改進(jìn)和完善，比如說人在不同情感下的語音基音周期的檢測結(jié)果是否相同等等。但是提升算法相對于一些經(jīng)典算法來說，不管是在運(yùn)算的效率方面還是抗噪聲方面，都有著良好的性能，可以預(yù)想在不久之后，提升算法在語音基音周期檢測方面會越來越受關(guān)注和研究。參考文獻(xiàn)參考文獻(xiàn)[1]劉維巍.語音信號基音周期檢測算法研究[D].哈爾濱:

人人文庫> 全部分類> 行業(yè)資料 > 工業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《基于提升算法的語音基音周期檢測及MATLAB仿真研究》15000字（論文）

文檔簡介

溫馨提示

最新文檔

評論

《基于提升算法的語音基音周期檢測及MATLAB仿真研究》15000字（論文）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔