語音信號基音周期的提取方法研究_第1頁
語音信號基音周期的提取方法研究_第2頁
語音信號基音周期的提取方法研究_第3頁
語音信號基音周期的提取方法研究_第4頁
語音信號基音周期的提取方法研究_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、20中1國2電-力1教0-育27#2012-10-27#22#000#16 年#2-研1究0綜-述2與7技#術(shù)#論#壇#專#刊#語音信號基音周期的提取方法研究馬夢軒趙振東(華北電力大學(xué)電子與通信工程系 ,河北 保定 071003)摘 要 :本文介紹從濁音語音信號中提取基音周期 ,提出一種改進的基音周期檢測算法 ( 自相關(guān)函數(shù)法) 。實驗結(jié)果表明所提出的方法能提供一種更精確和更平滑的基音周期軌跡 。用這種算法可以得到精確和穩(wěn)定的基音估值 。模擬試驗的結(jié)果 證明了這些算法的效果 。關(guān)鍵詞 :語音信號 ;基音周期檢測 ;自相關(guān)函數(shù)法語音 ( speech) 是聲音 (acoustic) 和語言 (l

2、anguage) 的組合體 ??梢赃@樣定義語音 ,語音是由一連串的音組成語言的聲 音 ?;羰侵赴l(fā)濁音時聲帶振動所引起的周期性頻率 。基 音周期值是聲帶振動頻率的倒數(shù) ,它是隨著時間和發(fā)音高低 而不斷變化的 。它的檢測和估計是語音信號處理中的一個 非常重要的問題 ,一項重要技術(shù)之一 ,與許多語音信號處理 技術(shù)相關(guān) ?;糁芷谧鳛檎Z音信號的一個重要參數(shù) ,它反映 了語音激勵 源 的 一 個 重 要 特 征 , 它 的 提 取 對 語 音 聲 調(diào) 的 識 別 ,特征的提取等有很大關(guān)系 。一個好的基音聲調(diào)的提取算 法對于高質(zhì)量的語音數(shù)據(jù)合成 、語音數(shù)據(jù)編碼及機器識別等 方面都具有十分重要的意義 。語

3、音信號的基音周期提取問題實質(zhì)上也就是準周期信 號的周期估計問題 。在收集語音音高模型數(shù)據(jù)時 ,一個快速 且可信的基音提取工具是十分必要的 。國內(nèi)使用的較多的 是 sfs 這種分析軟件 。基音提取的方法很多 ,諸如 :平均幅度差函數(shù) (amdf) 法( ross 等 1974) ;中心削波法 (自相關(guān)函數(shù) (acf) 法) (dubnows2 ki ,1978) ;倒譜 ( cep) 法 ( schafer 和 rablner ,1970) ;數(shù)據(jù)壓縮法 (miller ,1975 ) ; 線 性 預(yù) 測 法 ( atal ) ; 并 行 處 理 法 ( gold 和 rablner ,1969

4、) ;簡化逆濾波器跟蹤法 (markel ,1972) 等等 。上 述各種方法分屬于時域法 、變換域法和混合法 ,變換域法涉 及傅立葉變換或 lpc 運算 ,計算量大 ,影響估值速度 。基音提取的方法大致可分為三類 。波形估計法 : 直接由 語音波形來估計基音周期 ,分析出波形上的周期峰值 。包括 并行處理法 ( pproc) ,數(shù)據(jù)減少法 (dard) 等 。相關(guān)處理法 : 這種方法在語音信號處理中被廣泛使用 。這是因為相關(guān)處 理法抗波形的相位失真強 ,另外它在硬件處理上結(jié)構(gòu)簡單 。 包括波形自相關(guān)法 (mavto) ,平均幅度差函數(shù)法 (amdf) ,簡 化逆濾波法 ( sift) 等 。

5、變換法 : 將語音信號變換到頻域或倒 譜來估計基音周期 ,比如倒譜法 ( cep) 。它采用對數(shù)倒頻譜分析提取基音 。雖然倒譜分析算法比較復(fù)雜 ,但基音估計效果較好 。acf 法提取出的基音周期較為精確 。amdf 法無需 乘法運算 ,因而算法復(fù)雜度小 ,但當(dāng)語音信號幅度快速變化 時 ,amdf 法估計的精度不夠理想 。cep 法可以較好地從語 音信號中分離出基音信息和聲道信息 ( 共振峰信息) ,但是 , 反映基音信息的倒譜峰在過渡音和含噪語音中將會變得不 清晰甚至完全消失 。本文引入自相關(guān)函數(shù) (acf) 法對語音信號基因周期的提 取 。1. 對語音信號基音周期的提取(1) 自相關(guān)法基音周

6、期提取原理人在發(fā)音時 ,聲帶振動產(chǎn)生濁音 ( 有聲音) ,沒有聲帶振 動產(chǎn)生清音 (無聲音) 。漢語是音節(jié) - 聲調(diào)語言 。聲母 、韻母和聲調(diào)是漢語音節(jié) 的三個要素 。漢語聲調(diào)有重要的辨義作用 。漢語語音具有 前聲后韻的音節(jié)結(jié)構(gòu) ,其中聲母大都為清音 (m 、n 、l 除外) ,韻 母為濁音 。漢語聲調(diào)信息 ,載于其基音周期上 ,并主要在韻 母段上 ?;糁芷谑侵赴l(fā)韻母 (含濁輔音) 時 ,聲帶每開啟和 閉合一次的時間 。即聲帶的振動周期就是基音周期 。它的 倒數(shù)稱為基音頻率 。濁音的發(fā)音過程是 : 來自肺部的氣流沖擊聲門 ,造成聲 門的一張一合 ,形成一系列準周期的氣流脈沖 ,經(jīng)過聲道 (

7、含 口腔 、鼻腔) 的諧振及唇齒的輻射最終形成語音信號 。故濁 音波形呈現(xiàn)一定的準周期性 。所謂基音周期就是對這種準 周期而言的 ,它反映了聲門開關(guān)的頻率 。漢語韻母音段的大 部分具有較規(guī)則的周期結(jié)構(gòu) ,如圖 1 :而且能量比清音大得多 ,其基音僅用時域特征也可得到 很好的結(jié)果 。語音分析有時域分析 、頻域分析等方法 。時域分析用時 域波形圖 ,頻域分析用頻譜圖 。用時域波形來表示的語音信 號比較直觀 ,清晰易懂 。時域波形語音信號的數(shù)字處理硬件 作者簡介 : 馬夢軒 (1981 - ) ,男 ,河北行唐人 ,華北電力大學(xué)電子與通信工程系 04 級碩士研究生 。2012-10-27#2012-

8、10-27#2#0#1#2-10-27#2021322-10-27#語#音#信#號2基0音1周2-期1的0提-取2方7法#研#究#2#0#1#2-10-27#由此可見 ,自相關(guān)函數(shù) r ( k) 與周期序列 x ( m) 具有相同的周期 np ; r ( k) = r ( - k) ; | r ( k) | r ( 0) ; 在 0 , + - p , +- 2p , . . . . . . ,周期信號的自相關(guān)函數(shù)達到最大值 。 清音信號沒有周期性 ,它的自相關(guān)函數(shù) r ( k) 也沒有周期 ,r ( k) 會隨著 k 的增大迅速 衰 減 。濁 音 信 號 具 有 準 周 期 性 ,它的自相關(guān)

9、函數(shù) r ( k) 具有與 x ( m) 相同的周期 。濁音 信號的自相關(guān)函數(shù)在基音周期的整數(shù)倍位置上出現(xiàn)峰值 ,而 清音信號的自相關(guān)函數(shù)沒有明顯的峰值 。自相關(guān)法基音檢 測正是利用 r ( k) 的這一性質(zhì)對語音信號進行基音檢測的 。 濁音信號和清音信號的自相關(guān)函數(shù)如圖 2 和圖 3 所示 :實現(xiàn)起來比較簡單 ??梢缘玫秸Z音信號的一些重要特征 ,如過零分析 、幅度分析 、相關(guān)分析 (自相關(guān)和互相關(guān)) ,為分析語 音信號提供有用的基礎(chǔ) 。圖 1 漢語韻母段的周期結(jié)構(gòu)圖語音信號的基音周期都是隨時間緩慢變化的 。漢語聲調(diào)的變化就是濁音基音周期 (或基音頻率) 的變化 ,變化的軌 跡稱為聲調(diào)曲線 。

10、基音提取是聲調(diào)判別的關(guān)鍵 ,為提高處理 精度和速度 ,本文提出一種簡便的自相關(guān)基音提取算法 ?;?音檢測的方法很多 ,自相關(guān)法是目前最實用 、可靠和廣泛使 用的基音檢測方法之一 。這種算法是一種基于語音時域分 析理論的較 好 的 算 法 , 具 有 物 理 意 義 明 確 和 方 法 簡 便 等 優(yōu) 點 。經(jīng)過對算法編程 、調(diào)試 、實驗 ,它在保持較好準確率的基 礎(chǔ)上 ,提高了檢測效率 。語音中存在兩種類型的相關(guān)性 ,即樣點之間的短時相關(guān) 性和相鄰基音周期之間的長時相關(guān)性 。本文采用自相關(guān)法 提取基音周期 ,相關(guān)分析是一種常用的語音時域波形分析方 法 ,它由相關(guān)函數(shù)定義 。相關(guān)函數(shù)可用來測定信

11、號間的時域 相似性 。如果兩個信號波形完全不同 ,相關(guān)函數(shù)接近于零 ; 如果兩個信號波形相同 ,就會在超前 、滯后處出現(xiàn)峰值 。自 相關(guān)函數(shù)可用于研究信號本身 ,區(qū)分語音是清音還是濁音 , 估計波形的同步性 、周期性等等 。對于確定性信號序列 ,自相關(guān)函數(shù)定義如下 :圖 2 濁音信號 r ( k)圖 3 清音信號 r ( k)語音信號 是 短 時 周 期 性 的 , 其 自 相 關(guān) 函 數(shù) 是 同 周 期 性的 。對于濁音信號 ,只要檢測到 n 的位置 ,就可以估計語音 信號的基音周期值 。語音信號是非穩(wěn)態(tài)信號 ,它的特征是隨時間變化的 。但 在一個很短的時間段內(nèi) ,可以認為具有相對穩(wěn)定的特征

12、 ,故 稱為準平穩(wěn)信號 。這個時間段約為 5ms - 50ms。其統(tǒng)計特性 和頻譜特性都是對短時段而言的 。這使得要對語音信號作 數(shù)字處理必須先按短時段對語音信號分幀 ,這樣每一幀信號 都具有短時平穩(wěn)性 ,從而進行短時相關(guān)分析 。短時自相關(guān)函數(shù)的定義為 :+ rn ( k) = 6 x(m) w( n - m) x(m + k) w( n - m - k)m = - n - 1 - kr ( k) = 6 x (m) x (m + k)(2 - 1)m = - 對于隨機性信號序列或周期性信號序列 ,自相關(guān)函數(shù)定義為 :nr ( k) = lim 1 6 x (m) x (m + k)(2 -

13、2)n 2n + 1m = - n自相關(guān)函數(shù)有以下特性 : 如果序列 x ( n) 具有周期 np ,即 x ( n) = x ( n + np ) ,則6 x(m + n) x( n + m + k)(2 - 5)r ( k + np ) = 6 x (m) x (m + k + np )m = - m = 0其中 ,x( n) 為語音波形 ;w ( n) 為窗函數(shù) (矩形窗) ;n 為窗= 6 x (m) x (m + k) = r ( k)m = - (2 - 3)長 .n1(2) 算法流程自相關(guān)法基音檢測流程圖 ,圖 4 :r ( k + np ) = lim6 x (m) x (m

14、+ k + np )n 2n + 1m = - nn16 x (m) x (m + k) = r ( k)(2 - 4)= limn 2n + 1m = - n2012-10-27#2012-10-27#2#0#1#2-10-27#2012-10-27#語#音#信#號2基01音2周-期1的0提-取27方#法#研#究#2#0#1#2-10-27#2#33#期樣點值 。由窗口中看到 ,發(fā)音“機”時 ,中值平滑處理后的 p是一個 1 115 的矩陣 。即顯示出 115 幀語音信號的基音周 期樣點值 。其中 ,前 51 幀都是零值 ,從第 52 幀以后才有基音 周期樣點值 ,到第 84 幀為止 。這是

15、因為 52 到 84 幀對應(yīng)著語 音信號的濁音段 。而在第 108 幀又出現(xiàn)一個基音周期樣點 值 ,這是由于錄音時語音質(zhì)量問題造成的 。幀數(shù)及各幀基音 周期樣點數(shù)如下表所示 ,從表中由各幀基音周期樣點數(shù)就可 以算出這一幀的基音周期 。例如 ,第 84 幀的基音周期為 50 個樣點 , 由 公 式 ( 2 - 12) 的 t = 1000 3 / np 8000 ( ms) 得 : t =1000 508000 = 6. 25 ( ms) , 即基音頻率為 160hz 。其 余 各 幀 用相同的公式計算就能得出結(jié)果 。圖 4 算法流程圖算法中大致分為以下功能模塊 : 取樣 、分幀 、低通濾波 、

16、削波 、相關(guān)運算 、清濁音判決 、周期提取 、中值平滑濾波等幾 個模塊 。用傳統(tǒng)的自相關(guān)法基音檢測估計基音周期時 ,判錯的可 能性較大 ,一般采用譜平整的預(yù)處理和基音平滑后處理等技 術(shù)以改善基音估計的性能 。盡管可以從原語音信號中估計 濁音語音段的基音周期 ,但第一個共振峰頻率可能影響到估 計的準確性 。從語音信號中排除共振峰結(jié)構(gòu) ,使每個諧波有 相同的幅度這一過程稱為譜平整 。目前主要有兩種方法完 成這一功能 ,即線性方法和非線性方法 。本算法中同時用到 這兩種方法 。線性譜平整方法使用低通濾波器 ,從語音信號 中排除共振峰 。這個方法的主要缺點是對于高基音語音 ,如 婦女和兒童的語音 ,可

17、能破壞整個周期信息 。非線性譜平整 方法主要是通過中心削波語音信號來實現(xiàn) 。2. 用 matlab 編程實現(xiàn)對語音信號基音周期的提取在計算機上錄制了一個語音樣本 ,語音樣本是 wav 形 式 。本算法經(jīng)編程 、調(diào)試后 ,把語音信號輸入進行處理 。實 驗時用到了單字詞“機”、雙字詞“長度”、三字詞“計算機”和 四字詞“我的電腦”等語音信號進行基音周期提取實驗 。應(yīng) 當(dāng)指出 ,當(dāng)語音放大器的頻率響應(yīng)不好 ,造成各頻率分量之 間的相對位移 ,這將給銳變點的檢測帶來困難 。由于錄音設(shè)備比較簡陋 ,所以在錄音過程中不可避免的 產(chǎn)生誤差 。而且錄音過程不是在標準的無噪環(huán)境下進行 ,環(huán) 境中的噪聲對實驗也產(chǎn)

18、生了影響 。但是 ,實驗取得了比較滿 意的結(jié)果 ,如圖 5 所示 。由于語音的短時穩(wěn)定性一般在 20ms 到 30ms 之間 ,一般 來說 ,幀間疊加長度不大于幀長的一半將不會影響基音檢測 的精 度 。考 慮 到 如 此 , 幀 長 取 樣 點 為 240 點 。即 一 幀 為30ms 。幀間疊加 120 個樣點 ,幀間隔也是 120 個樣點 。此時 幀移沒有超過幀長的一半 。以上的基音周期軌跡圖是根據(jù)檢測到的各幀基音周期 樣點值做出的 。程序運行以后 ,在 matlab 的 workspace (工作窗口) 內(nèi) ,可以查到中值平滑處理前和處理后的基音周圖 5 發(fā)音“機”的時域圖及基音周期檢測

19、結(jié)果圖 6 、圖 7 、圖 8 都是取圖 5 的幀長及幀間隔運行程序得出的結(jié)果 。對于以下各圖用同上的方法來分析 ,得出的基音 周期值都比較令人滿意 ,這證明了本程序的實用性 。圖 6 發(fā)音“長度”的時域圖及基音周期檢測結(jié)果2012-10-27#2012-10-27#2#0#1#2-10-27#2021342-10-27#語#音#信#號20基1音2周-期1的0提-2取7方#法#研#究#2#0#1#2#-10-27#圖 8 發(fā)音“我的電腦”的時域圖及基音周期檢測結(jié)果圖 7 發(fā)音“計算機”的時域圖及基音周期檢測結(jié)果3. 結(jié)論本文引入自相關(guān)函數(shù) (acf) 法對語音信號基因周期的提 取 ,通過 matlab 編

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論