版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、語音是交叉學(xué)科,有深遠(yuǎn)的研究價(jià)值近 50 年的研究歷史,語音識別技術(shù)已經(jīng)有了極大的發(fā)展但大多數(shù)產(chǎn)品能存在于實(shí)驗(yàn)室,沒有達(dá)到使用化的效果主要闡述小波變換在語音信號去噪的應(yīng)用,語音端點(diǎn)的檢測,語音特征的提取及一種簡單的語音識別算法。1語音是交叉學(xué)科,有深遠(yuǎn)的研究價(jià)值1引言語音識別(Voice Recognition 簡稱“VR”)也稱說話人識別,就是根據(jù)人的聲音特征,識別出某段語音是誰說的。聲紋識別兩方面:說話人辨認(rèn)和說話人確認(rèn)。fzhjkj/index.aspx福州海景科技開發(fā)有限公司Video1Video2引言語音識別(Voice Recognition 簡稱“VR小波變換在語音信號識別中的應(yīng)
2、用welcome to use these PowerPoint templates, New Content design, 10 years experience1.語音識別與小波分析簡介2.小波分析在語音識別中的應(yīng)用3.前端處理4.特征提取5.最終識別小波變換在語音信號識別中的應(yīng)用welcome to use 1.語音識別與小波分析簡介語音識別聲學(xué)語言學(xué)語音學(xué)數(shù)字信號處理信息論計(jì)算機(jī)科學(xué)目的:賦予機(jī)器以聽覺,使其能聽懂人的語言,實(shí)現(xiàn)人-機(jī)自由對話。應(yīng)用領(lǐng)域:計(jì)算機(jī)、辦公室自動化、通信、國防、機(jī)器人等。 語音識別的學(xué)科體系1.語音識別與小波分析簡介語聲學(xué)語言學(xué)語音學(xué)數(shù)字信號處理信息 語音識
3、別的研究方向語音識別語音輸入系統(tǒng)語音控制系統(tǒng)基于對話系統(tǒng)的數(shù)據(jù)庫查詢系統(tǒng)口語翻譯系統(tǒng)自動身份確認(rèn)計(jì)算機(jī)輔助教學(xué)1.語音識別與小波分析簡介 語音識別的研究方向語語音輸入系統(tǒng)語音控制系統(tǒng)基于對話系統(tǒng)的語音信號特征頻帶特征:人說話聲音頻率范圍是300Hz3400Hz, 男性大約在250Hz2 000 Hz之間,女性則大約在450Hz4 000 Hz之間。信號特征:是一種時變、非平穩(wěn)的隨機(jī)信號語音分類 清音無周期性,主要在高頻部分,易混于噪音 濁音接近周期信號,主要分布在低頻部分 噪音語音之間間隙,純噪音的“無聲區(qū)”語音信號特征頻帶特征:人說話聲音頻率范圍是300Hz340 語音識別系統(tǒng)的性能1.識別
4、詞匯表的大小和語音的復(fù)雜性;2.語音信號的質(zhì)量;3.單個說話人還是多個說話人;4.硬件因素(性價(jià)比)。語音信號特征 語音識別系統(tǒng)的性能1.識別詞匯表的大小和語音的復(fù)雜性;語音研究的熱點(diǎn)與難點(diǎn)1.語音識別系統(tǒng)的適應(yīng)性差;2.高噪聲環(huán)境下語音識別進(jìn)展困難;3.如何把語言學(xué)、生理學(xué)、心理學(xué)方面的研究成果量化、建模并用于語音識別,還需研究;4.我們對人類的聽覺理解、知識積累和學(xué)習(xí)機(jī)制以及大腦神經(jīng)系統(tǒng)的控制機(jī)理等分面的認(rèn)識還很不清楚;5.若將語音識別系統(tǒng)商品化,還有識別速度、拒識問題以及關(guān)鍵詞/句檢測技術(shù)等細(xì)節(jié)問題需要解決。研究的熱點(diǎn)與難點(diǎn)1.語音識別系統(tǒng)的適應(yīng)性差;小波分析一種強(qiáng)有力的信號分析工具語音
5、降噪技術(shù)是語音信號處理的一個重要分支當(dāng)噪聲與語音的頻譜相似時,傳統(tǒng)的單純時域或頻域處理往往無法達(dá)到很好的效果在信號的高頻域部分,可取得較好的時間分辨率在信號的低頻域部分,可取得較好的頻率分辨率小波閾值去噪方法是實(shí)現(xiàn)最簡單、計(jì)算量最小的一種方法,因而得到了最廣泛的應(yīng)用小波分析一種強(qiáng)有力的信號分析工具2 小波分析在語音識別中的應(yīng)用2.1 語音信號的降噪處理2.2 語音信號壓縮與重構(gòu)2.3 幅度突變信號的檢測2 小波分析在語音識別中的應(yīng)用2.1 語音信號的降噪處理2.1 連續(xù)小波基函數(shù)小波函數(shù)定義設(shè)(t)為一平方可積函數(shù),也即(t)L2(R) 。若其傅里葉變換()滿足條件 稱( t )為一個基本小波
6、或小波母函數(shù),將母函數(shù)(t)經(jīng)伸縮或平移后, 就可以得到一個小波序列。2 小波分析在語音識別中的應(yīng)用2.1 連續(xù)小波基函數(shù)小波函數(shù)定義設(shè)(t)為一平方可積函數(shù) ,2 小波分析在語音識別中的應(yīng)用連續(xù)小波基函數(shù)連續(xù)小波變換(CWT)連續(xù)小波變換的逆變換(ICWT) ,2 小波分析在語音識別中的應(yīng)用連續(xù)小波基函數(shù)連續(xù)小小波 (t)和原始信號f(t)的開始部分進(jìn)行比較 計(jì)算系數(shù)C該部分信號與小波的近似程度;C值越高表示信號與小波相似程度越高小波右移k得到的小波函數(shù)為 (t-k) ,然后重復(fù)步驟1和2,直到信號結(jié)束 擴(kuò)展小波,如擴(kuò)展一倍,得到的小波函數(shù)為 (t/2) 重復(fù)步驟14 連續(xù)小波變換的過程連續(xù)
7、小波運(yùn)算的基本步驟 小波 (t)和原始信號f(t)的開始部分進(jìn)行比較 連續(xù)小波 離散小波變換的逆變換(IDWT) 離散小波2 小波分析在語音識別中的應(yīng)用離散小波變換(DWT) 離散小波變換的逆變換(IDWT) 離散小波2 小波分析在語用于離散小波重構(gòu)的命令主要有如下幾個: idwt 用于單層小波重構(gòu) waverec 用于多層小波重構(gòu)原始信號,要求輸入?yún)?shù) 同小波分解得到結(jié)果的格式一致 wrcoef 用于重構(gòu)小波系數(shù)至某一層次,要求輸入?yún)?數(shù)同小波分解得到結(jié)果的格式一致 upcoef 用于重構(gòu)小波系數(shù)至上一層次,要求輸入?yún)?shù)同小波分 解得到結(jié)果的格式一致用于得到某一層次的小波系數(shù)的命令主要有以下
8、幾個: detcoef 求得某一層次的細(xì)節(jié)系數(shù) appcoef 求得某一層次的近似系數(shù) upwlev 重構(gòu)組織小波系數(shù)的排列形式2 小波分析在語音識別中的應(yīng)用用于離散小波重構(gòu)的命令主要有如下幾個:2 小波分析在語音識別dwt函數(shù)功能:1-D離散小波變換格式: cA,cD=dwt(X,wname) cA,cD=dwt(X,Lo_D,Hi_D)說明:cA,cD=dwt(X,wname)使用指定的小波基函數(shù)wname對信號X進(jìn)行分解,cA和cD分別是近似分量和細(xì)節(jié)分量;cA,cD=dwt(X,Lo_D,Hi_D)用指定的濾波器組Lo_D,Hi_D對信號進(jìn)行分解2 小波分析在語音識別中的應(yīng)用dwt函數(shù)
9、功能:1-D離散小波變換2 小波分析在語音識別中的idwt函數(shù)功能:1-D離散小波反變換格式:X=idwt(cA,cD,wname)X=idwt(cA,cD,Lo_R,Hi_R)X=idwt(cA,cD,wname,L)X=idwt(cA,cD,Lo_R,Hi_R,L)說明:由近似分量cA和細(xì)節(jié)分量cD經(jīng)過小波反變換,選擇某小波函數(shù)或?yàn)V波器組,L為信號X中心附近的幾個點(diǎn)2 小波分析在語音識別中的應(yīng)用idwt函數(shù)功能:1-D離散小波反變換2 小波分析在語音識別dwt2函數(shù)功能:2-D離散小波變換格式:cA,cH,cV,cD=dwt2(X,wname)cA,cH,cV,cD=dwt2(X,wnam
10、e)說明:cA近似分量,cH水平細(xì)節(jié)分量,cV垂直細(xì)節(jié)分量,cD對角細(xì)節(jié)分量2 小波分析在語音識別中的應(yīng)用dwt2函數(shù)功能:2-D離散小波變換2 小波分析在語音識別中功能:提取一維小波變換低頻系數(shù)格式:(1)Aappcoef(c,l,wname,N)(2)Aappcoef(c,l,wname)(3)Aappcoef(c,l,Lo-R,Hi-R )(4)Aappcoef(c,l,Lo-R,Hi-R ,N)說明:該函數(shù)是一個一維小波分解函數(shù),用于從 小波分解結(jié)構(gòu)C,L中提取一維信號的低頻系數(shù)。appcoef函數(shù)2 小波分析在語音識別中的應(yīng)用功能:提取一維小波變換低頻系數(shù)appcoef函數(shù)2 小波分
11、析detcoef函數(shù)功能:提取一維信號小波變換高頻系數(shù)格式: (1)d=detcoef(c,l,N) 提取N尺度的高頻系數(shù)。 (2)d=detcoef(c,l),提取最后一尺度的高頻系數(shù)。2 小波分析在語音識別中的應(yīng)用detcoef函數(shù)功能:提取一維信號小波變換高頻系數(shù)2 小波waverec函數(shù)功能:多尺度一維小波重構(gòu)格式:(1)x=waverec(c,l,wname)(2)x=waverec(c,l,Lo-R,Hi-R)(3)x waverec(wavedec(x,N,wavename), wavename)說明:該函數(shù)用指定的小波函數(shù)或重構(gòu)濾波器對 小波分解結(jié)構(gòu)(C,L)進(jìn)行多尺度一維小波
12、重構(gòu)。2 小波分析在語音識別中的應(yīng)用waverec函數(shù)功能:多尺度一維小波重構(gòu)2 小波分析在語音upwlev函數(shù)功能:單尺度一維小波分解的重構(gòu)格式:(1)nc,nl,ca=upwlev(c,l,wname) (2) nc,nl,ca=upwlev(c,l,Lo-R, Hi-R)說明:該函數(shù)用于對小波分解結(jié)構(gòu)C,L進(jìn)行單尺度重構(gòu),返回上一尺度的分解結(jié)構(gòu)并提取最后一尺度的低頻分量。2 小波分析在語音識別中的應(yīng)用upwlev函數(shù)功能:單尺度一維小波分解的重構(gòu)2 小波分析在wrcoef函數(shù)功能:對一維小波系數(shù)進(jìn)行單支重構(gòu)格式:(1)x=wrcoef(type,c,l,wname,N)(2)x=wrco
13、ef(type,c,l,Lo-R,Hi-R,N)(3)x=wrcoef(type,c,l,wname)(4)x=wrcoef(type,c,l,Lo-R,Hi-R)說明:對一維信號的分解結(jié)構(gòu)C,L用指定的小波函數(shù)或重構(gòu)濾波器進(jìn)行重構(gòu)。當(dāng)type=a時,對信號的低頻部分進(jìn)行重構(gòu),此時N可以為0;當(dāng)type=d時,對信號的高頻部分進(jìn)行重構(gòu),此時N為正整數(shù)。2 小波分析在語音識別中的應(yīng)用wrcoef函數(shù)功能:對一維小波系數(shù)進(jìn)行單支重構(gòu)2 小波分析upcoef函數(shù)功能:一維系數(shù)的直接小波重構(gòu)格式:(1)y=upcoef(0,x,wname,N) (2) y=upcoef(0,x,wname,N,L)
14、(3) y=upcoef(0,x,Lo-R,Hi-R,N) (4) y=upcoef(0,x,Lo-R,Hi-R,N,L) (5) y=upcoef(0,x,wname) (6) y=upcoef(0,x,Lo-R,Hi-R)2 小波分析在語音識別中的應(yīng)用upcoef函數(shù)功能:一維系數(shù)的直接小波重構(gòu)2 小波分析在語2.1 語音信號的降噪處理含噪的一維語音信號模型可以表示如下: s(k)=f(k)+e(k),k=0,1,n-1 s(k) 為含噪信號 f(k) 為有用信號 e(k) 為噪聲信號 (假設(shè)e(k)是一個高斯白噪,通常表現(xiàn)為高頻信號) 2.1 語音信號的降噪處理含噪的一維語音信號模型可以
15、表示如下 小波去噪方法基于小波變換模極大值原理進(jìn)行去噪對含噪聲信號作小波變換之后,計(jì)算相鄰尺度間小波系數(shù)的相關(guān)性,根據(jù)相關(guān)性區(qū)別小波系數(shù)的類型閾值去噪 對小波系數(shù)設(shè)置閾值, 在眾多小波系數(shù)中, 把絕對值較小的系數(shù)置為零,而讓絕對值較大的系數(shù)保留或收縮, 然后對閾值處理后的系數(shù)進(jìn)行小波逆變換,直接進(jìn)行信號重構(gòu), 即可達(dá)到去噪的目的。 2.1 語音信號的降噪處理 小波去噪方法2.1 語音信號的降噪處理小波閾值去噪的主要理論依據(jù)信號在小波域內(nèi)其能量主要集中在有限的幾個系數(shù)中, 而噪聲的能量卻分布于整個小波域內(nèi)(前提)經(jīng)小波分解后, 信號的小波變換系數(shù)要大于噪聲的小波變換系數(shù)(前提下的結(jié)果)可以找到一
16、個合適的數(shù)作為閾值,當(dāng)小波系數(shù)小于該閾值時, 認(rèn)為這時的小波系數(shù)主要是由噪聲引起的(平行推理)當(dāng)小波系數(shù)大于該閾值時, 則認(rèn)為其主要是由信號引起的。選擇一個合適的閾值, 對小波系數(shù)進(jìn)行閾值處理, 就可以達(dá)到去除噪聲而保留有用信號的目的(水到渠成的推理)2.1 語音信號的降噪處理小波閾值去噪的主要理論依據(jù)2.1 語音信號的降噪處理2.1 語音信號的降噪處理降噪過程1.一維信號小波分解;2.小波分解高頻系數(shù)閾值量化;3.小波逆變換,對一維小波重構(gòu)。2.1 語音信號的降噪處理降噪過程S:原始信號cA1,cA2,cA3:分解各層的逼近信號cD1,cD2,cD3:分解各層的細(xì)節(jié)信號如果將cD1,cD2,
17、cD3的分解系數(shù)都設(shè)置為零,而只保留cA3,而后進(jìn)行小波重構(gòu),得到的信號就是消噪之后的信號。分解后的各部分重構(gòu)分解結(jié)構(gòu)圖S:原始信號分解后的各部分重構(gòu)分解結(jié)構(gòu)圖消噪前后對比消噪前后對比2.1 語音信號的降噪處理降噪特性1.高頻部分影響小波分解的第一層細(xì)節(jié);2.低頻部分影響小波分解的最深層和最低頻層;3.高頻系數(shù)的幅值隨著分解層次的增加而迅速的衰減,且其方差也有同樣的變化趨勢。2.1 語音信號的降噪處理降噪特性基小波的選擇 根據(jù)小波基的性質(zhì)和具體信號的特征選擇合適的基小波。 小波分解層數(shù)的選擇 對一般的信號而言,若信噪比20,則最大分解尺度取3 ,否則,最大分解尺度取4好。閾值函數(shù)閾值選擇規(guī)則2
18、.1 語音信號的降噪處理基小波的選擇2.1 語音信號的降噪處理常用的硬閾值函數(shù)和軟閾值函數(shù)硬閾值函數(shù)軟閾值函數(shù)2.1 語音信號的降噪處理常用的硬閾值函數(shù)和軟閾值函數(shù)2.1 語音信號的降噪處理利用Matlab消噪1.用ddencmp生成信號的默認(rèn)閥值,后利用wdencmp進(jìn)行消噪;2.用wthresh函數(shù)進(jìn)行給定閥值量化處理,比默認(rèn)閥值可信度高;3.小波分解結(jié)構(gòu)中的高頻系數(shù)全部置0,強(qiáng)制消噪處理。利用Matlab消噪1.用ddencmp生成信號的默認(rèn)閥值,2.2 語音信號壓縮與重構(gòu) 1.信號的小波分解;2.對高頻系數(shù)進(jìn)行閥值量化處理;3.對量化后的系數(shù)進(jìn)行小波重構(gòu)。2.2 語音信號壓縮與重構(gòu) 1
19、.信號的小波分解;2.3 幅度突變信號的檢測小波分析能檢測信號幅值變化的準(zhǔn)確時間;目的:將信號幅度發(fā)生跳變的時間點(diǎn)檢測出來。2.3 幅度突變信號的檢測小波分析能檢測信號幅值變化的準(zhǔn)確時傳統(tǒng)的功率譜等方法只能給出信號全頻尺度特征,而沒有辦法說明信號發(fā)生突變的具體位置。而在信號分析中,突變點(diǎn)(奇異點(diǎn))往往代表了故障(聲音突變)的發(fā)生,在時域上則代表了故障(聲音突變)發(fā)生的具體時間點(diǎn)。因此功率譜對于信號的突變沒有時域分析能力。頻率突變信號的奇異性檢測2.3 幅度突變信號的檢測傳統(tǒng)的功率譜等方法只能給出信號全頻尺度特征,而沒有辦法說明信頻率突變信號的的小波分解 小波變換具有空間局部化性質(zhì),即可以描述信
20、號在不同頻率帶中不同時刻變換情況,因此可以利用小波來分析信號的奇異性,判斷信號中的突變情況。2.3 幅度突變信號的檢測頻率突變信號的的小波分解 小波變換具有空間局部化性幅值突變信號的奇異性檢測2.3 幅度突變信號的檢測幅值突變信號的奇異性檢測2.3 幅度突變信號的檢測3 語音識別的前端處理3.1 傳統(tǒng)的語音去噪流程方法存在問題:直接對語音信號進(jìn)行閾值處理,信號的高頻部分置0,造成去噪后信號的失真。3 語音識別的前端處理3.1 傳統(tǒng)的語音去噪流程方法存在問題3.2 語音信號去噪的改進(jìn)算法1.語音信號的清濁音分離;2.對清音段和濁音段分別進(jìn)行不同的閾值處理;3.離散小波反變換,獲得去噪后的語音信號
21、。 清濁音判定方法:3 語音識別的前端處理清音在較高的頻率段上能量比較強(qiáng)濁音的能量主要分布在較低的頻率上3.2 語音信號去噪的改進(jìn)算法1.語音信號的清濁音分離; 先進(jìn)行清濁音分離,后用不同閥值進(jìn)行處理3.2 語音信號去噪的改進(jìn)算法3 語音識別的前端處理先進(jìn)行清濁音分離,后用不同閥值進(jìn)行處理3.2 語音信號去噪的3.3 改進(jìn)閥值函數(shù)的小波語音去噪常用的幾種閾值函數(shù)使用中的缺點(diǎn):1.硬閥值法,去噪效果不理想,重構(gòu)產(chǎn)生振蕩;2.軟閥值法,重構(gòu)信號存在較大的失真;3.前三種閥值函數(shù), |X|T時都等于0,會導(dǎo)致去噪后的信號產(chǎn)生較大失真。3.3 改進(jìn)閥值函數(shù)的小波語音去噪常用的幾種閾值函數(shù)使用中的3.3 改進(jìn)閥值函數(shù)的小波語音去噪3.3 改進(jìn)閥值函數(shù)的小波語音去噪3.4 二次小波分解全局閾值方法1.首先對信號進(jìn)行三層小波分解,三個高頻系數(shù)和一個低頻系數(shù);2.其高頻部分由噪聲和信號兩部分混合組成,對高頻部分進(jìn)行二次小波分解,得到二次分解后的6個高頻系數(shù)和6個低頻系數(shù);3.此時對各高頻部分分解后得到高頻系數(shù)利用全局閾值進(jìn)行去噪處理,得到處理后的3個高頻部分;4.將處理后高頻系數(shù)和第一次分解
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- ERK2-IN-5-生命科學(xué)試劑-MCE-2561
- 二零二五年度文化旅游項(xiàng)目管理費(fèi)合同范本
- 二零二五年度體育賽事表演安全免責(zé)合同
- 施工日志填寫樣本建筑物綠化工程
- 小學(xué)數(shù)學(xué)課堂中的情境教學(xué)與興趣培養(yǎng)
- 酒店衛(wèi)生標(biāo)準(zhǔn)與旅客健康保障措施研究
- 個人土地承包合同示范文本
- 產(chǎn)品分銷區(qū)域合同范本
- SPA會所年度承包經(jīng)營合同
- 個人財(cái)產(chǎn)保險(xiǎn)合同模板(經(jīng)典)
- (一模)蕪湖市2024-2025學(xué)年度第一學(xué)期中學(xué)教學(xué)質(zhì)量監(jiān)控 英語試卷(含答案)
- 完整版秸稈炭化成型綜合利用項(xiàng)目可行性研究報(bào)告
- 詩經(jīng)楚辭文學(xué)常識單選題100道及答案
- AI輔助的慢性病監(jiān)測與管理系統(tǒng)
- 2025中國海油春季校園招聘1900人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 膽汁淤積性肝硬化護(hù)理
- Unit 6 Is he your grandpa 第一課時 (教學(xué)實(shí)錄) -2024-2025學(xué)年譯林版(三起)(2024)英語三年級上冊
- 《數(shù)據(jù)采集技術(shù)》課件-Scrapy 框架的基本操作
- (2024)河南省公務(wù)員考試《行測》真題及答案解析
- 湖北省十一校2024-2025學(xué)年高三上學(xué)期第一次聯(lián)考化學(xué)試題 含解析
- 醫(yī)療保險(xiǎn)結(jié)算與審核制度
評論
0/150
提交評論