實(shí)驗(yàn)一語(yǔ)音信號(hào)端點(diǎn)檢測(cè)最終報(bào)告_第1頁(yè)
實(shí)驗(yàn)一語(yǔ)音信號(hào)端點(diǎn)檢測(cè)最終報(bào)告_第2頁(yè)
實(shí)驗(yàn)一語(yǔ)音信號(hào)端點(diǎn)檢測(cè)最終報(bào)告_第3頁(yè)
實(shí)驗(yàn)一語(yǔ)音信號(hào)端點(diǎn)檢測(cè)最終報(bào)告_第4頁(yè)
實(shí)驗(yàn)一語(yǔ)音信號(hào)端點(diǎn)檢測(cè)最終報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、實(shí)驗(yàn)一語(yǔ)音信號(hào)端點(diǎn)檢測(cè)一、實(shí)驗(yàn)?zāi)康膶W(xué)會(huì)MATLAB的使用,掌握MATLAB勺程序設(shè)計(jì)方法;掌握語(yǔ)音處理的基本概念、基本理論和基本方法;.掌握基于MATLAB編程實(shí)現(xiàn)帶噪語(yǔ)音信號(hào)端點(diǎn)檢測(cè);.學(xué)會(huì)用MATLAB寸信號(hào)進(jìn)行分析和處理。5.學(xué)會(huì)利用短時(shí)過(guò)零率和短時(shí)能量,對(duì)語(yǔ)音信號(hào)的端點(diǎn)進(jìn)行檢測(cè)。二、實(shí)驗(yàn)儀器設(shè)備及軟件HPD538、MATLAB三、實(shí)驗(yàn)原理端點(diǎn)檢測(cè)是語(yǔ)音信號(hào)處理過(guò)程中非常重要的一步,它的準(zhǔn)確性直接影響到語(yǔ)音信號(hào)處理的速度和結(jié)果。本次實(shí)驗(yàn)利用短時(shí)過(guò)零率和短時(shí)能量相結(jié)合的語(yǔ)音端點(diǎn)檢測(cè)算法利用短時(shí)過(guò)零率來(lái)檢測(cè)清音,用短時(shí)能量來(lái)檢測(cè)濁音,兩者相配合便實(shí)現(xiàn)了信號(hào)信噪比較大情況下的端點(diǎn)檢測(cè)。算法對(duì)于

2、輸入信號(hào)的檢測(cè)過(guò)程可分為短時(shí)能量檢測(cè)和短時(shí)過(guò)零率檢測(cè)兩個(gè)部分。算法以短時(shí)能量檢測(cè)為主,短時(shí)過(guò)零率檢測(cè)為輔。根據(jù)語(yǔ)音的統(tǒng)計(jì)特性,可以把語(yǔ)音段分為清音、濁音以及靜音(包括背景噪聲)三種。在本算法中,短時(shí)能量檢測(cè)可以較好地區(qū)分出濁音和靜音。對(duì)于清音,由于其能量較小,在短時(shí)能量檢測(cè)中會(huì)因?yàn)榈陀谀芰块T限而被誤判為靜音;短時(shí)過(guò)零率則可以從語(yǔ)音中區(qū)分出靜音和清音。將兩種檢測(cè)結(jié)合起來(lái),就可以檢測(cè)出語(yǔ)音段(清音和濁音)及靜音段1、短時(shí)能量計(jì)算定義n時(shí)刻某語(yǔ)言信號(hào)的短時(shí)平均能量En為::n-2-2En=x(m)w(n_m)x(m)w(n_m)二:m.(N-1)式中N為窗長(zhǎng),可見(jiàn)短時(shí)平均能量為一幀樣點(diǎn)值的平方和。特

3、殊地,當(dāng)窗函數(shù)為n矩形窗時(shí),有En=7x2(m)m.(N)2、短時(shí)過(guò)零率過(guò)零就是指信號(hào)通過(guò)零值。過(guò)零率就是每秒內(nèi)信號(hào)值通過(guò)零值的次數(shù)。對(duì)于離散時(shí)間序列,過(guò)零則是指序列取樣值改變符號(hào),過(guò)零率則是每個(gè)樣本的改變符號(hào)的次數(shù)。對(duì)于語(yǔ)音信號(hào),則是指在一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)??梢杂孟噜弮蓚€(gè)取樣改變符號(hào)的次數(shù)來(lái)計(jì)算。如果窗的起點(diǎn)是n=0,短時(shí)過(guò)零率Z為波形穿過(guò)橫軸(零電平)的次數(shù)N丄Zo|Sgn(Sw(n)-Sgn(Sw(n-1)|n-0sgn(x)1,x_0-1,x:0短時(shí)過(guò)零可以看作信號(hào)頻率的簡(jiǎn)單度量濁音的短時(shí)平均幅度最大,無(wú)聲的短時(shí)平均幅度最小,清音的短時(shí)過(guò)零率最大,無(wú)聲居中,

4、濁音的短時(shí)過(guò)零率最小。3、短時(shí)自相關(guān)函數(shù)N上Rw(k)-sw(n)sw(nk)nz0是偶函數(shù);s(n)是周期的,那么R(k)也是周期的;可用于基音周期估計(jì)和線性預(yù)測(cè)分析4、判斷語(yǔ)音信號(hào)的起點(diǎn)和終點(diǎn)利用短時(shí)平均幅度和短時(shí)過(guò)零率可以判斷語(yǔ)音信號(hào)的起點(diǎn)和終點(diǎn)。語(yǔ)音端點(diǎn)檢測(cè)方法可采用測(cè)試信號(hào)的短時(shí)能量或短時(shí)對(duì)數(shù)能量、聯(lián)合過(guò)零率等特征參數(shù),并采用雙門限判定法來(lái)檢測(cè)語(yǔ)音端點(diǎn),即利用過(guò)零率檢測(cè)清音,用短時(shí)能量檢測(cè)濁音,兩者配合。首先為短時(shí)能量和過(guò)零率分別確定兩個(gè)門限,一個(gè)是較低的門限數(shù)值較小,對(duì)信號(hào)的變化比較敏感,很容易超過(guò);另一個(gè)是比較高的門限,數(shù)值較大。低門限被超過(guò)未必是語(yǔ)音的開(kāi)始,有可能是很短的噪聲引

5、起的,高門限被超過(guò)并且接下來(lái)的自定義時(shí)間段內(nèi)的語(yǔ)音。四、實(shí)驗(yàn)步驟及程序?qū)嶒?yàn)步驟:1、取一段錄音作為音頻樣本。2、利用公式分別編程計(jì)算這段語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)過(guò)零率,然后分別畫(huà)出它們的曲線。3、調(diào)整能量門限。4、進(jìn)行幅度歸一化并設(shè)置幀長(zhǎng)、短時(shí)能量閾值、過(guò)零率閾值等參數(shù)。5、編寫(xiě)程序?qū)崿F(xiàn)語(yǔ)音端點(diǎn)檢測(cè)。6、最后得到語(yǔ)音端點(diǎn)檢測(cè)圖像。語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)程序流程圖:輸入語(yǔ)音信號(hào)幅度歸一化輸出樣本端點(diǎn)檢測(cè)圖像x,fs,nbits=wavread(x=x/max(abs(x);%參數(shù)設(shè)置%幀長(zhǎng)%未重疊部分圖1.1語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)程序流程圖語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)實(shí)驗(yàn)源程序:1.wav);%語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)

6、matlab實(shí)現(xiàn)%幅度歸一化到-1,1FrameLen=256;inc=90;amp1=10;amp2=2;zcr1=10;%短時(shí)能量閾值%過(guò)零率閾值z(mì)cr2=5;else%語(yǔ)音將結(jié)束minsilenee=6;minlen=15;status=0;count=0;silenee=0;%用無(wú)聲的長(zhǎng)度來(lái)判斷語(yǔ)音是否結(jié)束%判斷是語(yǔ)音的最小長(zhǎng)度%記錄語(yǔ)音段的狀態(tài)%語(yǔ)音序列的長(zhǎng)度%無(wú)聲的長(zhǎng)度%計(jì)算過(guò)零率tmpl=enframe(x(1:end-1),FrameLen,inc);tmp2=enframe(x(2:end),FrameLen,inc);signs=(tmp1.*tmp2)0.02;zcr=s

7、um(signs.*diffs,2);else%語(yǔ)音將結(jié)束else%語(yǔ)音將結(jié)束%計(jì)算短時(shí)能量amp=sum(abs(enframe(filter(12);%調(diào)整能量門限amp1=min(amp1,max(amp)/4);amp2=min(amp2,max(amp)/8);%開(kāi)始端點(diǎn)檢測(cè)forn=1:length(zcr)goto=0;switchstatuscase0,1ifamp(n)amp1x1=max(n-count-1,1);status=2;silenee=0;-0.9375,1,x),FrameLen,%0=靜音,1=可能開(kāi)始%確信進(jìn)入語(yǔ)音段%記錄語(yǔ)音段的起始點(diǎn)count=coun

8、t+1;elseifamp(n)amp2|zcr(n)zcr2%可能處于語(yǔ)音status=1;count=count+1;else%靜音狀態(tài)inc).A2,status=0;count=0;endcase2,ifamp(n)amp2|zcr(n)zcr2%2=語(yǔ)音段%保持在語(yǔ)音段count=count+1;silenee=silence+1;ifsileneeminsileneecount=count+1;elseifcountminlenstatus=0;silenee=0;count=0;elsestatus=3;endendcase3,break;endendcount=count-si

9、lence/2;x2=x1+count-1;subplot(3,1,1)plot(x)axis(1length(x)-11)xlabel(幀數(shù));ylabel(Speechline(x1*incx1*inc,-11,line(x2*incx2*inc,-11,subplot(3,1,2)plot(amp);axis(1length(amp)0max(amp)xlabel(幀數(shù));ylabel(Energyline(x1x1,min(amp),max(amp),line(x2x2,min(amp),max(amp),subplot(3,1,3)plot(zcr);axis(1length(zcr

10、)0max(zcr)xlabel(幀數(shù));ylabel(ZCR);line(x1x1,min(zcr),max(zcr),line(x2x2,min(zcr),max(zcr),%靜音還不夠長(zhǎng),尚未結(jié)束%語(yǔ)音長(zhǎng)度太短,認(rèn)為是噪聲%語(yǔ)音結(jié)束%記錄語(yǔ)音段結(jié)束點(diǎn));Color,red);Color,red););Color,red);Color,red);Color,red);Color,red);五、實(shí)驗(yàn)結(jié)果與分析圖1.2語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)實(shí)驗(yàn)結(jié)果輸出圖像(1)從圖中可以明顯看出,濁音的短時(shí)能量大、短時(shí)過(guò)零率低。清音的短時(shí)能量小、短時(shí)過(guò)零率高。(2)門限的選取對(duì)語(yǔ)音檢測(cè)結(jié)果有很大影響。(3)僅僅根據(jù)能量判斷是比較粗糙的,還需要根據(jù)過(guò)零率進(jìn)行判斷。因?yàn)榍逡艉驮肼暤亩虝r(shí)平均過(guò)零率比背景噪聲的平均過(guò)零率要高出好幾倍。六

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論