



版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1第四章 短時傅立葉分析短時傅立葉變換的定義短時傅立葉變換的某些性質短時傅立葉變換的線性濾波實現短時傅立葉譜的取樣語音的短時合成技術短時分析合成數字濾波器組的設計用快速傅立葉變換進行短時傅立葉分析24.1 短時傅立葉變換-概述34.2.1 短時傅立葉變換-定義o 定義:短時傅立葉變換也叫短時譜(加窗的方式)o 短時譜的特點: 1)時變性:既是角頻率的函數又是時間n的函數2)周期性:是關于的周期函數,周期為2mmjjnemnwmxeX)()()( 短時傅立葉變換主要用于語音分析合成系統,由其逆變換可以精確地恢復語音波形;4o 短時傅里葉變換是窗選語音信號的標準傅里葉變換。下標n區(qū)別于標準的傅里葉
2、變換。w(n-m)是窗口函數序列。不同的窗口函數序列,將得到不同的傅里葉變換的結果。o 短時傅里葉變換有兩個自變量:n和,所以它既是關于時間n的離散函數,又是關于角頻率的連續(xù)函數。o 與離散傅里葉變換和連續(xù)傅里葉變換的關系一樣,若令2k/N,則得離散的短時傅里葉變換,它實際上是在頻域的取樣。10)()()()(22NkemnwmxkXeXNmkjmnNkjn4.2.1 短時傅立葉變換-定義5o 這兩個公式都有兩種解釋:n 當n固定不變時,它們是序列w(n-m)x(m) (-m)的標準傅里葉變換或標準的離散傅里葉變換。此時與標準傅里葉變換具有相同的性質,而Xn(k)與標準的離散傅里葉變換具有相同
3、的特性。n 當或k固定時,和Xn(k)看做是時間n的函數。它們是信號序列和窗口函數序列的卷積,此時窗口的作用相當于一個濾波器。4.2.1 短時傅立葉變換-定義64.2.1 短時傅立葉變換-定義o 頻率分辨率f、取樣周期T、加窗寬度N三者關系:o 窗形狀對短時傅立葉變換的影響 矩形窗主瓣窄,衰減慢; 漢明窗主瓣寬,衰減快;o 窗寬對短時頻譜的影響 窗寬長頻率分辨率高,能看到頻譜快變化; 窗寬短頻率分辨率低,看不到頻譜的快變化;1fNT 74.2.2 短時傅立葉變換-標準傅里葉變換的解釋o 短時傅里葉變換可寫為o 當n取不同值時窗w(n-m)沿著x(m)序列滑動,所以w(n-m)是一個“滑動的”窗
4、口。o 由于窗口是有限長度的,滿足絕對可和條件,所以這個變換是存在的。與序列的傅里葉變換相同,短時傅里葉變換隨著作周期變化,周期為2。 mjmjnemnwmxeX)()()(84.2.2 短時傅立葉變換-標準傅里葉變換的解釋9o 根據功率譜定義,可以寫出短時功率譜與短時傅里葉變換之間的關系o 式中*表示復共軛運算。同時功率譜是短時自相關函數 的傅里葉變換。o 下面將短時傅里葉變換寫為另一種形式。設信號序列和窗口序列的標準傅里葉變換為 均存在。當n取固定值時,w(n-m)的傅里葉變換為 2*| )(|)()()(jnjnjnjneXeXeXeS)()()()()(kmxmknwmxmnwkRmn
5、mjmjemxeX)()(mjmjemweW)()()()(jnjmjmeWeemnw4.2.2 短時傅立葉變換-標準傅里葉變換的解釋10o 根據傅里葉變換的頻域卷積定理,有)(*)()(jnjjjneWeeXeX4.2.2 短時傅立葉變換-標準傅里葉變換的解釋11o 用波形乘以窗函數,不僅為了在窗口邊緣兩端不引起急劇變化,使波形緩慢降為零,而且還相當于對信號譜與窗函數的傅里葉變換進行卷積。o 為此窗函數應具有如下特性:窗函數應具有如下特性:n 頻率分辨率高,即主瓣狹窄、尖銳;(矩形窗)(矩形窗)n 通過卷積,在其他頻率成分產生的頻譜泄漏少,即旁瓣衰減大。(海明窗)(海明窗)n這兩個要求實際上
6、相互矛盾,不能同時滿足。o 窗口寬度N、取樣周期T和頻率分辨率f之間存在下列關系f1/NT o 可見:n窗口寬度頻率分辨率 時間分辨率n窗口寬度頻率分辨率 時間分辨率,因而二者是矛盾的。4.2.2 短時傅立葉變換-標準傅里葉變換的解釋12o 第一個零點位置為第一個零點位置為2/N,顯然它與窗口寬度成反比。,顯然它與窗口寬度成反比。n矩形窗矩形窗,雖然頻率分辨率很高,但由于第一旁瓣的衰減只有13.2dB,所以不適合用于頻譜成分動態(tài)范圍很寬的語音分析中。n海明窗海明窗在頻率范圍中的分辨率較高,而且由于旁瓣的衰減大于42dB,具有頻譜泄漏少的優(yōu)點,頻譜中高頻分量弱、波動小,因而得到較平滑的譜。n漢寧
7、窗漢寧窗是高次旁瓣低,第一旁瓣衰減只有30dB。o 對語音波形乘以海明窗,壓縮了接近窗兩端的部分波形,等效于用作分析的區(qū)間縮短40%左右,因此,頻率分辨率下降40%左右。所以,即使在基音周期性明顯的濁音頻譜分析中,乘以合適的窗函數,也能抑制基音周期與分析區(qū)間的相對相位關系的變動影響,從而得到穩(wěn)定的頻譜。因為乘以窗函數將導致分幀區(qū)間縮短,所以為跟蹤隨時間變化的頻譜,要求一部分區(qū)間重復移動。4.2.2 短時傅立葉變換-標準傅里葉變換的解釋134.2.2 短時傅立葉變換-標準傅里葉變換的解釋14o其中圖(a)是海明窗的窗選信號,圖(b)是其對數功率譜;圖 (c)是矩形窗下的窗選信號,圖(d)是其對數
8、功率譜。o從圖 (a)可以明顯看出時間波形的周期性,此周期性同樣在圖(b)中表現出來。圖中基頻及其諧波在頻譜中表現為等頻率間隔的窄峰。圖(b)中的頻譜大約在300400Hz附近有較強的第一共振峰,而約在2000Hz附近有一個對應于第二、三共振峰的寬峰。此外,還能在3 800Hz附近看到第四個共振峰。最后,由于聲門脈沖譜的高頻衰減特性,頻譜在高頻部分表現出下降的趨勢。給出了N500時(取樣率10 kHz,窗持續(xù)時間50 ms)時直角窗及海明窗下濁音語音的頻譜。4.2.2 短時傅立葉變換-標準傅里葉變換的解釋15o將圖(b)和圖(d)比較可看出它們在基音諧波、共振峰結構以及頻譜粗略形狀上的相似性,
9、同樣也能看到其頻譜之間的差別。o最明顯的是圖(d)中基音諧波尖銳度增加,這主要是由于矩形窗頻率分辨率較高。o另一差別是矩形窗較高的旁瓣產生了一個類似于噪聲的頻譜。這是由于相鄰諧波的旁瓣在諧波間隔內的相互作用(有時加強有時抵消),因而在諧波間產生了隨機變化。這種相鄰諧波間不希望有的“泄漏”抵消了其主瓣較窄的優(yōu)點,o因此在語音頻譜分析中極少采用矩形窗。給出了N500時(取樣率10 kHz,窗持續(xù)時間50 ms)時直角窗及海明窗下濁音語音的頻譜。4.2.2 短時傅立葉變換-標準傅里葉變換的解釋16o圖4-3給出了N50的比較結果(取樣率與圖4-2中相同,因而窗口持續(xù)時間為5ms)。o由于窗口很短,因
10、而時間序列(圖(a)和(c)及信號頻譜(圖(b)和(d)均不能反映信號的周期性。o與圖4-2相反,圖4-3只大約在400、1 400及2 200Hz頻率上有少量較寬的峰值。它們與窗內語音段的前三個共振峰相對應。比較圖4-3(b)及(d)的頻譜后,再次表明矩形窗可以得到較高的頻率分辨率。4.2.2 短時傅立葉變換-標準傅里葉變換的解釋17o 結論結論:n 窗口寬度與短時傅里葉變換特性之間的關系窗口寬度與短時傅里葉變換特性之間的關系o 用窄窗可得到好的時間分辨率用窄窗可得到好的時間分辨率o 用寬窗可以得到好的頻率分辨率。用寬窗可以得到好的頻率分辨率。o 但由于采用窗的目的是要限制分析的時間以但由于
11、采用窗的目的是要限制分析的時間以使其中波形的特性沒有顯著變化,因而要折使其中波形的特性沒有顯著變化,因而要折衷考慮。衷考慮。 4.2.2 短時傅立葉變換-標準傅里葉變換的解釋18o w(n) -一個濾波器的單位函數響應o -該濾波器的輸出o x(n)-濾波器的輸入o 過程:調制+濾波4.2.3 短時傅立葉變換-濾波器的解釋一mmjjnmnwemxeX)()()()(jneX圖4-4 短時傅里葉變換濾波器解釋的第一種形式(a)復數運算194.2.3 短時傅立葉變換-濾波器的解釋二)()(| )(|)()(nnjjnjnjbaeeXeXn圖4-4 短時傅里葉變換濾波器解釋的第一種形式 (b)只有實
12、數運算20o 令m=n-m 4.2.3 短時傅立葉變換-濾波器的解釋三)()()()()()(mjmnjmnjmjnemnxmweemnxmweX)()()(:mjmjnemnxmweX令)()(:jnnjjneXeeX所以21o 為窄帶低通濾波器。第一種形式為低通濾波器;o 由于第二種形式中的濾波器單位函數響應為 ,所以它為帶通濾波器。 4.2.3 短時傅立葉變換-濾波器的解釋)(jeW)(njenw22o 如果將w(n)的濾波運算除外,短時傅里葉變換實際上是對信號的幅度調制。n第一種形式是在輸入端進行調制,x(n)乘以 相當于將x(n)的頻譜從移到零頻處;而w(n)(直角窗或海明窗等)為窄
13、帶低通濾波器。n后一種形式是在輸出端進行調制,此時先對信號進行帶通濾波,濾波器的單位函數響應為w(n) ,而調制后輸出的是中心頻率為的短時譜。4.2.3 短時傅立葉變換-濾波器的解釋2/1222/122)()(| )(| )(|)()(| )(|nnjnnjjnnnjnbaeXeeXbaeXnjenje23o 恢復出x(n)的過程稱為短時傅里葉反變換,是由短時譜合成語音信號的問題o 由于 是n和的二維函數,因而必須對 在所涉及的兩個變量,即時域及頻域內進行取樣,取樣率的選取應保證 不產生混疊失真,從而能夠恢復原始語音信號x(n)。 4.3 短時傅立葉變換的取樣率)(jneX)(jneX)(jn
14、eX)(jneX24o 當當為固定值時為固定值時, 是一個單位函數響應為w(n)的低通濾波器的輸出。設低通濾波器的帶寬為BHz,則 具有與窗相同的帶寬。根據取樣定理, 的取樣率至少為2B才不致混疊。o 低通濾波器的帶寬由w(n)的傅里葉變換 的第一個零點位置01決定,因而B值取決于窗的形狀與長度。 4.3 短時傅立葉變換的取樣率-時間取樣率)(jneX)(jneX)(jneX)(jeW25o 正弦序列的表達式為正弦序列的表達式為 n 幅值幅值A、初相、初相的含義與模擬正弦信號相同的含義與模擬正弦信號相同n 正弦序列的數字角頻率正弦序列的數字角頻率0的含義與一般模擬信號的含義與一般模擬信號模擬角
15、頻率模擬角頻率0的概念不同。的概念不同。n 離散信號定義的時間為離散信號定義的時間為kT,顯然有,顯然有0 =0 T,模擬角頻率模擬角頻率0的單位是的單位是rad/s,n 數字角頻數字角頻0的單位為的單位為rad/s s = rad。0表示表示相鄰兩個樣值間弧度的變化量。相鄰兩個樣值間弧度的變化量。 4.3 短時傅立葉變換的取樣率-時間取樣率)sin()(0kAkf26o 以直角窗和海明窗為例,其第一個零點位置分別為 2N和4No 數字角頻率與模擬頻率F之間的關系為2FT2Ffs(其中T是信號取樣周期,fs是取樣率),因而用模擬頻率表示的 的帶寬為4.3 短時傅立葉變換的取樣率-時間取樣率)(
16、jeW274.3 短時傅立葉變換的取樣率-頻率取樣率284.3 短時傅立葉變換的取樣率-總取樣率294.3 短時傅立葉變換的取樣率-總取樣率304.4 語音信號的短時綜合-濾波器組求和法 314.4 語音信號的短時綜合-濾波器組求和法 hk(n)是一個帶通濾波器,其中心頻率為k。yk(n)是第k個濾波器hk(n)的輸出。324.4 語音信號的短時綜合-濾波器組求和法 334.4 語音信號的短時綜合-濾波器組求和法 LN時,y(n)正比于x(n)且與窗口w(n)的形狀無關 LN時,通過合理地選取窗函數,也可以使y(n)得以精確地恢復。 344.4 語音信號的短時綜合-濾波器組求和法 354.4.
17、2 短時綜合的濾波器組相加法的MATLAB程序實現 o 程序filterbank1.m對應于圖4.6中的(b)圖,先調制后濾波,實現流程圖見圖4.10。o 圖4.6中的(b)圖36圖圖4.10 filterbank1的流程圖的流程圖YN讀入語音數據讀入語音數據分幀,不足補零,共分幀,不足補零,共N幀幀 加哈寧窗加哈寧窗 濾波濾波i=165取取k=1幀數據幀數據用用 調制調制 i=165用用 調制調制 i=165k=k+1輸出輸出 kN?njienjie)()(2)()(656421nynynyrealnykikikk)(nwi3738o 程序filterbank2.m對應于圖4.6中的(a)圖
18、,先濾波后調制,實現流程圖見圖4.12,程序運行結果見圖4.13。o 圖4.6中的(a)圖39)(nhi圖圖4.12 filterbank2的流程圖的流程圖YN讀入語音數據讀入語音數據分幀,不足補零,共分幀,不足補零,共N幀幀 各通道各通道 濾波濾波i=165取取k=1幀數據幀數據并分別送入并分別送入165通道的輸入端通道的輸入端 各通道各通道用用 調制調制 i=165各通道各通道用用 調制調制 i=165k=k+1輸出輸出 kN?njienjie)()(2)()(656421nynynyrealnykikikk)(nhi40414.4.3 語音信號的短時綜合-快速傅里葉變換求和法424.4
19、語音信號的短時綜合-快速傅里葉變換求和法434.4 語音信號的短時綜合-快速傅里葉變換求和法444.4 語音信號的短時綜合-快速傅里葉變換求和法454.4 語音信號的短時綜合-快速傅里葉變換求和法46o (4.41)o 式中r為一整數,0iN-1 ,上式的反變換為o (4.42)o 又 (4.43)o 因而 (4.44)jjj(e)(e)|(e)iiirnn rRrRYXX1jj01( )(e)eiiNnrriy nYN( )( ) (), (-)ry kx k w rR kk( )( )( )()rrry ny nx nw rRn假設在時域上利用周期為假設在時域上利用周期為R的取樣對的取樣對
20、 取樣得取樣得)(ijneX4.4.4 短時綜合的疊接相加法原理及MATLAB程序實現47o 將式(4.42)代入式(4.44)中,可得o o (4.45)o 如果R選得足夠小,這時不論n為何值均可寫出:o 因而,式(4.44)寫成 o (4.47) o o 上式說明,y(n)與x ( n )只差一個常系數,因而利用式(4.45)就能準確恢復x(n)。 1jj01( )(e)eiiNnrriy nYNj(0)0j0()()e(e )/rRrrw rRnw rRnWR(4.46)j0( )( ) (e )/ y nx nWR48 n = n + L/4 r = r + 1 n=L/4 r=1 形
21、成形成 w(rR-n)x(n) 填充零值得到填充零值得到 N 點序列點序列 N 點點 FFT 改變短時頻譜改變短時頻譜 y (k) = y (k) +yi (k) k = n-N+1,n-1,n N 點點 IFFT 形成窗函數形成窗函數 w(n) 預置預置 y(k) = 0,全部全部 k L 點點 圖圖 4.14 短時綜合疊接相加法流程短時綜合疊接相加法流程圖圖 49 圖圖 4.15 利用一個利用一個 L 點哈明窗時點哈明窗時 y(n)的計算過程的計算過程 x(k)-語音語音 第第 1 段段 第第 2 段段 第第 3 段段 第第 4 段段 )4(kLw)43(kLw)2(kLw)(kLw2L4
22、3L4L2L43L4L43L2L4L4L2L43L0 k k k k k 0 50o 圖4.15表示了按照式(4.44)的運算過程。o 當0nR-1時,y(n)可寫成oo o 當Rn2R-1時,則y(n)可以寫成: ( )( ) ()( ) (2) ( ) (3)( ) (4)y nx n w R nx n w R nx n w R nx n w R n( )( ) (2)( ) (3) ( ) (4)( ) (5) y nx n wRnx n w Rnx n w Rnx n w Rn(4.49)(4.50)51o 濾波器組相加法與頻率取樣有關,它所要求的頻率取樣數應使窗變換滿足下式:o 而重疊相加法要求時間抽樣率應使窗滿足下式:o o 式(4.51)與式(4.52)構成對偶數關系。1j()01(e)(0)iNiWwN j0(e )()rWw rRnR(4.51)(4.52)52下面給出短時綜合的疊接相加法的MATLAB程序實現的運行結果53o 語音的時域分析和頻域分析是語音分析的兩種重要方法。n這兩種方法均有局限性:n時域分析對語音信號的頻率特性沒有直觀的了解;n頻域特性中又沒有語音信號隨時間的變化關系。o 時間依賴于傅里葉分析的顯示圖形稱為語譜圖。n語譜圖中顯示了大量的與語音的語句特性有關的信息,它綜合了頻譜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 日常復習中的2025年稅法考試試題及答案
- 2025年現代漢語考試能力要求及挑戰(zhàn)試題及答案
- AI智能體的多智能體系統策略
- 人工智能系統的開發(fā)流程試題及答案
- 數據可視化的工具與技術選型研究試題及答案
- 歷史小說與真實的關系文學概論試題及答案
- WPS數字化辦公的未來展望試題及答案
- 羊奶市場需求分析與健康消費趨勢
- 構建知識框架計算機一級WPS考試試題及答案
- Msoffice學習資源與參考試題及答案
- 前額葉皮質在記憶中的作用與機制
- 小學少先隊活動課說課稿
- 頜下感染的護理查房
- 妊娠期常見的皮膚病
- T∕CACM 1078-2018 中醫(yī)治未病技術操作規(guī)范 拔罐
- 糖尿病膳食指南2024
- 腹腔穿刺術評分表
- 2024屆上海市閔行區(qū)三年級英語第二學期期中監(jiān)測模擬試題含答案
- 電氣一次主接線圖課件
- 打造近零能耗建筑示范實施方案
- 光伏并網前單位工程驗收報告-2023
評論
0/150
提交評論