




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
通信課程設(shè)計(jì)語音信號(hào)處理部分基礎(chǔ)理論部分一、語音信號(hào)產(chǎn)生的機(jī)理人類的發(fā)聲過程是由于肺部的收縮,壓迫氣流由支氣管經(jīng)過聲門和聲道引起音頻振蕩而產(chǎn)生的,其中聲道起始于聲門處而終止于嘴唇,包括咽喉(連接食道和口)、口腔,鼻道則是從小舌開始到鼻孔為止,當(dāng)小舌下垂時(shí),鼻道與聲道發(fā)生耦合而產(chǎn)生語音中的鼻音。圖1-1是發(fā)音器官的示意圖。發(fā)音過程中聲道各處的截面積取決于舌、唇、頜以及小舌的位置。聲道截面積是隨縱向位置而變的函數(shù),稱為聲道截面積函數(shù),聲道的共振峰特性主要決定于聲道截面函數(shù),聲道的共振峰特性決定所發(fā)聲音的頻譜特性,即音色。圖1-1發(fā)音器官示意圖圖1-2簡(jiǎn)化的聲道示意圖
聲波是一種機(jī)械振功,它必須借助介質(zhì)質(zhì)點(diǎn)的振動(dòng)而傳播。要描述發(fā)音系統(tǒng)中空氣的振功,必須借助質(zhì)量守恒、動(dòng)量守恒及能量守恒以及熱力學(xué)、流體力學(xué)的基本定律,建立一組偏微分方程,但是這種方程的表述和求解是及其困難的。嚴(yán)格的聲學(xué)理論必須考慮以下各種影響,見圖1-2;
(1)聲道形狀的時(shí)變性質(zhì);
(2)由于聲道壁的熱傳導(dǎo)和粘滯摩擦導(dǎo)致的損耗;(3)聲音在嘴唇處的輻射;
(4)聲道壁的柔度;(5)鼻腔的耦合,
(6)聲道中的聲激勵(lì)。二、語音產(chǎn)生模型綜合考慮聲門激勵(lì)、聲道和嘴唇輻射影響就得到圖2—14所示的語音發(fā)生的離散系統(tǒng)模型。這就是說,語音信號(hào)可看作是激勵(lì)信號(hào)激勵(lì)一個(gè)線性系統(tǒng)而產(chǎn)生的輸出,其中是聲道響應(yīng)與嘴唇輻射模型R(z)相級(jí)聯(lián)而成,即:
對(duì)于濁音來講,我們還可以把聲門脈沖的影響也歸并到傳遞函數(shù)中,即:
這時(shí),濁音信號(hào)就可以看作是由一個(gè)準(zhǔn)周期性的6脈沖串激勵(lì)一個(gè)離散線性系統(tǒng)H(Z)而產(chǎn)生的輸出了。圖1-3是語音信號(hào)的產(chǎn)生模型:圖1-3語音信號(hào)產(chǎn)生的模型
長(zhǎng)期研究證實(shí),發(fā)不同性質(zhì)的音時(shí),激勵(lì)的情況是不同的,大致可以分為兩大類:(1)發(fā)濁音時(shí),此時(shí)氣流在通過緊繃的聲帶時(shí),沖激聲帶產(chǎn)生振動(dòng),使聲門處形成準(zhǔn)周期的脈沖串,并用它去激勵(lì)聲道。聲帶緊繃的程度不同時(shí),振動(dòng)頻率也就不同。該頻率就是音調(diào)頻率,其倒數(shù)就是音調(diào)周期。不同人的音調(diào)周期是不同的,男子大,女子??;老人大,小孩低。(2)發(fā)清音時(shí),此時(shí)聲帶松弛而不振動(dòng),氣流通過聲門直接進(jìn)入聲道。
總結(jié):人類發(fā)音過程有三類不同的激勵(lì)方式,因而能產(chǎn)生三類不同的聲音,即濁音、清音和爆破音。當(dāng)氣流通過聲門時(shí)聲帶的張力剛好使聲帶發(fā)生較低頻率的張弛振蕩.形成被周期性的空氣脈沖,這些空氣脈沖激勵(lì)聲迫使產(chǎn)生濁音。如果聲道中某處面積很小,氣流高速?zèng)_過此處時(shí)而產(chǎn)生湍流,當(dāng)氣流速度與橫截面積之比大于某個(gè)門限時(shí)(臨界速度)便產(chǎn)生摩擦音,即清音。如果聲道某處完全閉合建立起氣壓,然后突然釋放而產(chǎn)生的聲音就是爆破音。由于發(fā)音方式和聲道形狀的不同,人類可以發(fā)出無窮多種的、聽覺系統(tǒng)可以將它們相互區(qū)分的聲音。但是語音是人類交流傳息的手段,必須采用。一套大家都可以發(fā)出、大家又都可以辨別的基本語音單位才能交流信息,這種語音單位就是音素。顯然,這樣的音素是不會(huì)太多的,一般一種語言只有幾十個(gè)。音素相當(dāng)于通信系統(tǒng)中的編碼特號(hào)集,它是由有限個(gè)符號(hào)組成的集合。用它們進(jìn)行分組串行編碼便形成豐富多彩的語言。一個(gè)語句是由一串音素構(gòu)成的,但是一串音素不等于一個(gè)語句,語句中還含有反映語意、語感的韻律信息。這里的韻律特征包括各音素的相對(duì)強(qiáng)度、相對(duì)時(shí)長(zhǎng)、相對(duì)音高、高音之間的停頓以及音素之間相互影響而產(chǎn)生音素的變異等。因此人類用于交流信息的語音系統(tǒng)比目前能人工制造的通信系統(tǒng)愛復(fù)雜得多。
三、語音信號(hào)處理的補(bǔ)充知識(shí)1、語音信號(hào)的特點(diǎn)
(1)頻譜分量主要集中在300~3400HZ,可用帶通濾波器濾除,然后按8K采樣率對(duì)語音信號(hào)進(jìn)行采樣,從而得到數(shù)字語音信號(hào)。(2)短時(shí)平穩(wěn)性,語音信號(hào)的特征是隨時(shí)間變換的,只有在以小段時(shí)間間隔內(nèi)中,語音信號(hào)才保持相對(duì)穩(wěn)定的特征,時(shí)間一般選為10~30ms。因此語音信號(hào)的分析和處理采用分段處理,其中每小段稱為“幀”,最重要的語音信號(hào)“短時(shí)特征”和“短時(shí)參數(shù)”包括語音的“短時(shí)能量”、“短時(shí)過零率”、“短時(shí)相關(guān)函數(shù)”、“短時(shí)頻譜”等。(3)語音信號(hào)的最基本組成單位是音素。音素可以分為“清音”和“濁音”兩大類。如果將不含語音只包括環(huán)境噪聲的情況稱為“無聲”,那么音素可以分為“清音”、“濁音”和“無聲”三大類。在短時(shí)分析的基礎(chǔ)上可以分析語音段清濁音的分布情況,如果是濁音段可以測(cè)定它的一些其他重要參數(shù),比如基音周期和共振峰等等。2、語音信號(hào)的預(yù)處理(1)帶通濾波器濾波(2)A/D變換。包括采樣、量化步驟,其中采樣頻率為8KHZ。本實(shí)驗(yàn)讀入的已經(jīng)是數(shù)字語音信號(hào)。(3)預(yù)加重。原因:語音信號(hào)平均功率譜高頻段大約在800HZ以上按6DB/倍頻程跌落。目的:提升高頻部分,使信號(hào)的頻譜變得平坦,以便于進(jìn)行頻譜分析和聲道參數(shù)分析。方法:用具有6DB/倍頻程的數(shù)字濾波器實(shí)現(xiàn),它一般是一階的
H(z)=1-az-1,其中a的值接近于1。3、加窗分幀技術(shù)由于語音信號(hào)具有短時(shí)平穩(wěn)特性,所以對(duì)語音信號(hào)采用短時(shí)分析,信號(hào)流的處理采用分段或分幀來實(shí)現(xiàn)。一般每幀的時(shí)間是10~30ms,分幀可以采用連續(xù)分段的方法,但一般采用交疊分段的方法,這是為了使幀與幀之間平滑過渡,保持其連續(xù)性。前一幀和后一幀的非交疊部分稱為幀移。幀移與幀長(zhǎng)的比值一般取0~0.5。圖3-1為幀長(zhǎng)、幀移的概念和重疊相加的示意圖。圖3-1分幀示意圖分幀是用可移動(dòng)的有限長(zhǎng)度窗口進(jìn)行加權(quán)的方法來實(shí)現(xiàn),就是對(duì)語音信號(hào)進(jìn)行加窗處理,圖3-2是各種常見窗函數(shù)的時(shí)域?qū)Ρ葓D,窗口有多種形狀如海明窗(Hamming)、布拉克曼窗(Blackman-Harris)、海寧窗(Hanning)、三角窗(triang)、矩形窗(rectwin)等。圖3-2各種常見窗函數(shù)的時(shí)域圖對(duì)于語音信號(hào)的時(shí)域分析來說,窗口的形狀是很重要的,選用不同的窗口,將使信號(hào)的分析結(jié)果不同,最常用的是矩形窗和海明窗,矩形窗的譜平滑較好,但波形細(xì)節(jié)丟失;而海明窗則相反,圖3-3是兩個(gè)窗函數(shù)時(shí)域波形和頻域波形的對(duì)比。綠色表示矩形窗,紅色表示海明窗。圖3-3矩形窗與海明窗圖形對(duì)比由于矩形窗的主瓣寬度較小,但其旁瓣高度很高;海明窗的主瓣比較寬,而旁瓣高度很低。矩形窗的旁瓣太高,會(huì)產(chǎn)生嚴(yán)重的泄漏現(xiàn)象(Gibbs),因此只在某些些特殊場(chǎng)合中采用。海明窗旁瓣最低,可以有效地克服泄漏現(xiàn)象,具有更平滑的低通特性,因此應(yīng)用最為廣泛。對(duì)于同一種窗函數(shù),主瓣寬度與窗長(zhǎng)成反比。在本實(shí)驗(yàn)中用的是海明窗。矩形窗的時(shí)域表達(dá)式為:海明窗的時(shí)域表達(dá)式為:
時(shí)域分析法是最早的信號(hào)分析法,也是應(yīng)用范圍最廣的方法。各種電信號(hào)可以記錄為時(shí)域波形,比如腦電圖、心電圖,自然現(xiàn)象也可以記錄為時(shí)域波形。圖3-4是漢語“我到黑龍江”的時(shí)域波形圖,橫坐標(biāo)是時(shí)間,縱坐標(biāo)是幅值。龍黑我江到圖3-4漢語“我到黑龍江”的時(shí)域波形圖4、語音信號(hào)的時(shí)域分析仔細(xì)觀察波形,可以看出:(1)語音有些部分有較大的振幅,這對(duì)應(yīng)濁音的波形,有些部分振幅較小,這對(duì)應(yīng)于清音部分的波形。(2)此波形與該句的音素相對(duì)應(yīng),可以大致確定此句的起始點(diǎn)和終結(jié)點(diǎn),每個(gè)音素的起始點(diǎn)和終結(jié)點(diǎn);由此可以確定整句話的持續(xù)時(shí)間和每音素的持續(xù)時(shí)間(端點(diǎn)檢測(cè)技術(shù))。(3)此波形如有橫軸坐標(biāo),則可以大致確定此波形的哪部分過零(即波形與橫坐標(biāo)軸的交點(diǎn))的數(shù)目多,哪部分過零點(diǎn)數(shù)目少。相同時(shí)間間隔內(nèi)的過零點(diǎn),就是過零率。過零率高的是清音,過零率低的是濁音。時(shí)域分析的特點(diǎn):(1)表示的語音信號(hào)比較直觀,清晰易懂;(2)實(shí)現(xiàn)起來比較簡(jiǎn)單、運(yùn)算量少;(3)用時(shí)域進(jìn)行語音信號(hào)處理,可以得到語音信號(hào)的一些重要特性;(4)分析語音信號(hào)的時(shí)域波形,可以采用較為通用的設(shè)備,如示波器、存儲(chǔ)示波器等,使用方法較為簡(jiǎn)單。5、短時(shí)能量分析語音信號(hào)的能量分析是基于語音信號(hào)能量隨時(shí)間有相當(dāng)大的變化,特別是清音段的能量一般比濁音段的小很多這一特性,能量分析包括能量和幅度這兩個(gè)方面。
短時(shí)平均能量的定義:
其中En是語音信號(hào)的一幀的能量,Wn是窗函數(shù),這里選取為海明窗。短時(shí)平均能量相當(dāng)于語音信號(hào)平方通過一個(gè)線性濾波器的輸出,且濾波器的單位函數(shù)響應(yīng)為
語音信號(hào)的短時(shí)平均幅度定義為:En和Mn都反映信號(hào)強(qiáng)度,但其特性有所不同。短時(shí)能量反映了語音能量隨著時(shí)間變化的規(guī)律,其主要用途是:(1)可以區(qū)分清音段與濁音段,因?yàn)闈嵋舳蔚亩虝r(shí)平均能量比清音的大得多。(2)可以區(qū)分有聲與無聲,無語音信號(hào)的噪聲能量很小,而語音信號(hào)的能量顯著的增大到某一個(gè)數(shù)值,由此可以區(qū)分語音信號(hào)的開始點(diǎn)或終止點(diǎn)。6、短時(shí)過零率分析
過零就是信號(hào)通過零值,對(duì)于連續(xù)語音信號(hào),可以考察其時(shí)域波形通過時(shí)間軸的情況。而對(duì)于離散時(shí)間信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過零,由此可以計(jì)算過零率。過零率就是樣本改變符號(hào)的次數(shù)。單位時(shí)間內(nèi)的過零率稱為平均過零率。由于語音信號(hào)具有短時(shí)平穩(wěn)性,則可以計(jì)算其短時(shí)平均過零率,定義為:其中,sgn[.]是符號(hào)函數(shù),即W(n)是窗函數(shù),這里采用漢明窗。
實(shí)際應(yīng)用中,為了避免靜音段的隨機(jī)噪聲產(chǎn)生過高的過零率,通常都先設(shè)定一個(gè)門限,當(dāng)前后兩個(gè)采樣的符號(hào)不同,而且差值大于該門限的時(shí)候,就將過零率的數(shù)值加1。其核心思想是:判斷相鄰兩幀的符號(hào)是否小于零,并且兩幀的差值是否大于設(shè)定的一個(gè)門限值delta,如果滿足以上兩個(gè)條件,那么過零率加1。其中設(shè)置了門限delta=0.02,這是個(gè)經(jīng)驗(yàn)值,可以進(jìn)行細(xì)微的調(diào)整。在此條件下,可以得到漢語“我到黑龍江”的過零率波形,如圖3-6所示:語音波形過零率圖3-6漢語“我到黑龍江”的過零率分布圖語音波形短時(shí)能量過零率
將短時(shí)能量和過零率結(jié)合起來可以可以區(qū)分語音信號(hào)的開始點(diǎn)或終止點(diǎn),對(duì)語音信號(hào)進(jìn)行端點(diǎn)檢測(cè),檢測(cè)結(jié)果見圖3-7。圖3-7語音端點(diǎn)檢測(cè)的結(jié)果7、短時(shí)自相關(guān)分析短時(shí)自相關(guān)函數(shù)
時(shí)域離散確定信號(hào)的自相關(guān)函數(shù)定義為:
時(shí)域離散隨機(jī)信號(hào)的自相關(guān)函數(shù)定義為
周期為P的周期信號(hào)滿足:
采用短時(shí)分析方法,定義語音信號(hào)短時(shí)自相關(guān)函數(shù)為
因?yàn)樗哉Z音信號(hào)的短時(shí)自相關(guān)函數(shù)
定義那么短時(shí)自相關(guān)函數(shù)可以寫成:上式表明,序列經(jīng)過一個(gè)沖激響應(yīng)為的數(shù)字濾波器濾波即得到短時(shí)自相關(guān)函數(shù)
濁音的短時(shí)自相關(guān)函數(shù)
清音的短時(shí)自相關(guān)函數(shù)
濁音和清音的短時(shí)自相關(guān)函數(shù)有如下幾個(gè)特點(diǎn):1)短時(shí)自相關(guān)函數(shù)可以很明顯的反映出濁音信號(hào)的周期性。2)清音的短時(shí)自相關(guān)函數(shù)沒有周期性,也不具有明顯突出的峰值,其性質(zhì)類似于噪聲。3)不同的窗對(duì)短時(shí)自相關(guān)函數(shù)結(jié)果有一定的影響。不同矩形窗長(zhǎng)時(shí)的短時(shí)自相關(guān)函數(shù)實(shí)驗(yàn)內(nèi)容
語音信號(hào)的時(shí)域分析一、實(shí)驗(yàn)?zāi)康?、理解語音信號(hào)的短時(shí)平穩(wěn)性,并正確對(duì)語音信號(hào)進(jìn)行分幀加窗。2、了解語音信號(hào)的幾種時(shí)域分析方法:短時(shí)過零率、短時(shí)能量及自相關(guān)分析,并寫出正確的仿真程序。3、進(jìn)一步理解和掌握語音信號(hào)短時(shí)平均能量函數(shù)及短時(shí)平均過零數(shù)的計(jì)算方法和重要意義。
二、實(shí)驗(yàn)儀器
微型計(jì)算機(jī),Matlab軟件環(huán)境三、實(shí)驗(yàn)原理及方法一定時(shí)寬的語音信號(hào),其能量的大小隨時(shí)間有明顯的變化。其中清音段(以清音為主要成份的語音段),其能量比濁音段小得多。短時(shí)過零數(shù)也可用于語音信號(hào)分析中,發(fā)濁音時(shí),其語音能量約集中于3kHz以下,而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上,可認(rèn)為濁音時(shí)具有較低的平均過零數(shù),而清音時(shí)具有較高的平均過零數(shù),因而,對(duì)一短時(shí)語音段計(jì)算其短時(shí)平均能量及短時(shí)平均過零數(shù),就可以較好地區(qū)分其中的清音段和濁音段,從而可判別句中清、濁音轉(zhuǎn)變時(shí)刻,聲母韻母的分界以及無聲與有聲的分界。這在語音識(shí)別中有重要意義。四、實(shí)驗(yàn)內(nèi)容1.上機(jī)前用Matlab語言完成程序編寫工作。2.程序應(yīng)具有加窗(分幀)、計(jì)算、以及繪制曲線等功能。3.上機(jī)實(shí)驗(yàn)時(shí)先調(diào)試程序,通過后進(jìn)行信號(hào)處理。4.對(duì)錄入的語音數(shù)據(jù)進(jìn)行處理,并顯示運(yùn)行結(jié)果。5.依據(jù)曲線對(duì)該語音段進(jìn)行所需要的分析,并作出結(jié)論。6.改變窗的寬度(幀長(zhǎng)),重復(fù)上面的分析內(nèi)容。五、課程要求1.理解和掌握短時(shí)平均能量函數(shù)及短時(shí)平均過零數(shù)函數(shù)的意義及其計(jì)算方法。2.參考Matlab有關(guān)資料,設(shè)計(jì)并編寫出具有上述功能的程序。六、課程報(bào)告要求:1.報(bào)告中,要包括實(shí)驗(yàn)?zāi)康?、?shí)驗(yàn)原理、實(shí)驗(yàn)步驟、方法等內(nèi)容。2.畫出求得的短時(shí)分析曲線,注明語音段和所用窗函數(shù)及其寬度。闡述所作分析和判斷的過程,提出依據(jù),得出判斷結(jié)論。七、思考題1.語音信號(hào)短時(shí)平均能量及短時(shí)平均過零數(shù)分析的主要用途是什么?2.窗的寬度(幀長(zhǎng))的改變,對(duì)短時(shí)特性產(chǎn)生怎樣的影響?程序編寫的主體步驟:1、打開MATLAB操作環(huán)境,新建一個(gè).m文件。用wavread命令讀入語音文件‘ceshi.wav’,語句為:
[S,fs,bit]=wavread(‘d:/ceshi.wav’);2高頻預(yù)加重,命令:y=filter(B,A,x),其中B=[1-0.95],A=1.2、確定窗的長(zhǎng)度,幀位移的長(zhǎng)度:Winsiz=128;窗長(zhǎng)Shift=64;幀移3、計(jì)算語音信號(hào)總的幀數(shù):n=floor((len
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 書法代售合同范本
- 門診研究課題申報(bào)書
- 公司收購股權(quán)合同范本
- 廠場(chǎng)租賃合同范本
- 職業(yè) 課題申報(bào)書
- 醫(yī)療會(huì)議服務(wù)合同范本
- 員工入職合同范本文本
- 【復(fù)習(xí)大串講】【中職專用】高二語文上學(xué)期期末期末綜合測(cè)試題(二)(職業(yè)模塊)(解析版)
- 行動(dòng)導(dǎo)向課題申報(bào)書
- 三方租賃合同范本
- 皮膚性病學(xué)課件:濕疹皮炎
- 綠化養(yǎng)護(hù)重點(diǎn)難點(diǎn)分析及解決措施
- 醫(yī)療垃圾管理及手衛(wèi)生培訓(xùn)PPT課件
- 一體化學(xué)工服務(wù)平臺(tái)、人事管理系統(tǒng)、科研管理系統(tǒng)建設(shè)方案
- 市場(chǎng)營(yíng)銷學(xué)課后習(xí)題與答案
- 嚇數(shù)基礎(chǔ)知識(shí)共20
- 常暗之廂(7規(guī)則-簡(jiǎn)體修正)
- 10kV變電所設(shè)備檢修內(nèi)容與周期表
- 井控系統(tǒng)操作維護(hù)與保養(yǎng)規(guī)程
- 電子產(chǎn)品高可靠性裝聯(lián)工藝下
- 越南北部工業(yè)區(qū)資料(1060707)
評(píng)論
0/150
提交評(píng)論