




已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
資料收集于網(wǎng)絡(luò) 如有侵權(quán)請(qǐng)聯(lián)系網(wǎng)站 刪除 謝謝 南京郵電大學(xué)通達(dá)學(xué)院實(shí) 驗(yàn) 報(bào) 告實(shí)驗(yàn)名稱 語(yǔ)音時(shí)頻參數(shù)的提取和應(yīng)用實(shí)驗(yàn) 語(yǔ)音編碼實(shí)驗(yàn) 課程名稱 信息處理技術(shù)專業(yè)綜合實(shí)驗(yàn) 班級(jí)學(xué)號(hào) 姓 名 開(kāi)課時(shí)間 2016/2017 學(xué)年, 第 二 學(xué)期 實(shí)驗(yàn)一 語(yǔ)音時(shí)頻參數(shù)的提取和應(yīng)用一、實(shí)驗(yàn)?zāi)康氖煜せ镜恼Z(yǔ)音時(shí)頻參數(shù)提取方法,觀察并比較各類參數(shù)采用不同提取方法的效果,了解這些時(shí)頻參數(shù)在語(yǔ)音處理中的應(yīng)用。二、實(shí)驗(yàn)內(nèi)容1、編寫(xiě)并調(diào)試語(yǔ)音時(shí)域參數(shù)提取程序,包括短時(shí)功率、短時(shí)過(guò)零率等函數(shù)。2、編寫(xiě)并調(diào)試語(yǔ)音頻域參數(shù)提取程序,包括頻譜、語(yǔ)譜圖、基音頻率、共振峰等。3、利用提取出的時(shí)頻參數(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行靜/清/濁音的劃分。三、實(shí)驗(yàn)原理語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性,需對(duì)其進(jìn)行分段(幀)處理(幀長(zhǎng)一般取10至30ms之間)。根據(jù)激勵(lì)方式的不同,語(yǔ)音信號(hào)可以分成濁音和清音兩大類:濁音:激勵(lì)源可模擬成準(zhǔn)周期性的脈沖串。該周期稱為基音周期,其倒數(shù)就是基音頻率,基音頻率一般在幾百赫茲以內(nèi)。清音:激勵(lì)源可模擬成隨機(jī)白噪聲。簡(jiǎn)化的語(yǔ)音生成數(shù)學(xué)模型如圖所示:對(duì)語(yǔ)音時(shí)頻波形進(jìn)行繪制與觀察,有助于了解語(yǔ)音的清/濁音等特性。對(duì)基音周期等聲門(mén)參數(shù)和共振峰等聲道參數(shù)進(jìn)行提取與分析,是語(yǔ)音處理與應(yīng)用的重要內(nèi)容。 對(duì)于時(shí)變語(yǔ)音信號(hào),可以計(jì)算它的短時(shí)功率和短時(shí)過(guò)零率。第m幀(幀長(zhǎng)為N個(gè)樣點(diǎn))的功率計(jì)算公式為:過(guò)零率計(jì)算公式為:對(duì)于濁音語(yǔ)音,可以利用其頻譜具有豐富的諧波分量的特點(diǎn),求出其諧波乘積譜,計(jì)算公式為:式中,R一般取為5。在諧波乘積譜中,基頻分量變得很大,更易于估計(jì)基音周期。四、實(shí)驗(yàn)方法及程序1. 調(diào)用matlab中的wavread和wavplay讀入并播放語(yǔ)音文件。2. 調(diào)用fft命令計(jì)算語(yǔ)音的頻譜。3. 調(diào)用specgram命令得到語(yǔ)音的語(yǔ)譜圖。4. 調(diào)用plot命令繪制并觀察語(yǔ)音的時(shí)頻域波形。5. 根據(jù)短時(shí)功率、短時(shí)過(guò)零率、諧波乘積譜的計(jì)算公式,編寫(xiě)分別用以計(jì)算短時(shí)功率、短時(shí)過(guò)零率、基音頻率的函數(shù):function Px=stpower、function Zx = stzerocross(x, N) 和function HPSx = hpspectrum(x,N,R)。6. 利用短時(shí)功率和短時(shí)過(guò)零率這兩個(gè)參數(shù)可以對(duì)語(yǔ)音信號(hào)進(jìn)行濁音/清音分類。編寫(xiě)實(shí)現(xiàn)此分類功能的函數(shù)voiunvoi.m。五、實(shí)驗(yàn)結(jié)果與分析1. 清音和濁音的短時(shí)功率、短時(shí)過(guò)零率各有何特點(diǎn)?清音段的能量一般比濁音段的小得多。濁音時(shí)能量集中于較低頻率段內(nèi),具有較低的過(guò)零率,而清音時(shí)能量集中于較高頻率段內(nèi),具有較高的過(guò)零率。2. 如何利用短時(shí)功率和短時(shí)過(guò)零率這兩個(gè)參數(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行濁音/清音的分類? 發(fā)濁音時(shí),由于聲門(mén)波引起了譜的高頻跌落。所以其語(yǔ)音能量集中在3kHz以下;發(fā)清音時(shí),多數(shù)能量出現(xiàn)在高頻。高頻率意味著高的平均過(guò)零率,低頻率意味著低的平均過(guò)零率,一般可認(rèn)為濁音具有較低的平均過(guò)零率,清音具有較高的平均過(guò)零率。3. 如何根據(jù)時(shí)域波形估計(jì)各幀元音的基音周期? 看圖可知四幀語(yǔ)音的周期均為0.01s,第一幀0100Hz有10個(gè)峰值點(diǎn),基頻約為10Hz,第二幀0100Hz有5個(gè)峰值點(diǎn),基頻約為20Hz,第三幀0100Hz有5個(gè)峰值點(diǎn),基頻約為20Hz,第四幀0100Hz有4個(gè)峰值點(diǎn),基頻約為25Hz。4. 如何根據(jù)基于DFT的對(duì)數(shù)幅度譜估計(jì)某幀濁音的基音周期?01172為一個(gè)基因周期。5. 如何根據(jù)基于DFT的對(duì)數(shù)幅度譜,估計(jì)出共振峰頻率?有7個(gè)峰點(diǎn),因此基頻約為167。6. 時(shí)域?qū)φZ(yǔ)音信號(hào)進(jìn)行加窗,反映在頻域,其窗譜對(duì)基于DFT的對(duì)數(shù)幅度譜有何影響?如何估計(jì)出窗譜的主瓣寬度?因?yàn)闀r(shí)間窗幅度的傅立葉變換為脈沖狀態(tài),則頻譜偏差很小,當(dāng)定常過(guò)程x(n)的平均值為零且N很大時(shí) ETN()=f()(12) 所以加窗的周期圖TN()是頻譜密度函數(shù)的無(wú)偏估計(jì)。固有TN()=1+()f()。如果原始信號(hào)的頻譜成份與FFT中的譜線完全一致,這種情況下采樣數(shù)據(jù)的長(zhǎng)度為信號(hào)周期的整數(shù)倍,頻譜中只有主瓣。7. 如何根據(jù)窄帶、寬帶語(yǔ)譜圖,提取出語(yǔ)音的基音和共振峰軌跡?在基音提取中,廣泛采用語(yǔ)音波形或誤差信號(hào)波形的低通濾波。提取共振峰特性最簡(jiǎn)便的手段是使用語(yǔ)譜儀。提取共振峰還有倒譜法、LPC分析法等更為有效、準(zhǔn)確的方法。(做完試驗(yàn)后,記住要回答這些問(wèn)題)實(shí)驗(yàn)過(guò)程記錄與結(jié)果分析1、進(jìn)入matlab1.1 在Windows環(huán)境中,創(chuàng)建一個(gè)名為speech的文件夾,存放語(yǔ)音數(shù)據(jù)和與實(shí)驗(yàn)相關(guān)的Matlab文件。如:E:speech。用于實(shí)驗(yàn)的語(yǔ)音數(shù)據(jù)(.mat)及相應(yīng)說(shuō)明(.txt)包括:digits.mat % 英文數(shù)字 “0” 到 “9” 的發(fā)音digits.txt gliss.mat % 兩個(gè)包含/i/的滑音gliss.txt letters.mat % 英文字母表中26個(gè)字母的發(fā)音letters.txt ma1.txt ma1-1.mat % 一句連續(xù)語(yǔ)音ma1-2.mat % 一句連續(xù)語(yǔ)音ma1-3.mat % 一句連續(xù)語(yǔ)音ma1-4.mat % 一句連續(xù)語(yǔ)音timit.txttimit1.mat % 一句連續(xù)語(yǔ)音timit2.mat % 一句連續(xù)語(yǔ)音timit3.mat % 一句連續(xù)語(yǔ)音timit4.mat % 一句連續(xù)語(yǔ)音vowels.mat % 元音/a/, /i/, /o/, /u/的發(fā)音vowels.txtwords.mat % 十個(gè)孤立字的發(fā)音words.txt1.2 在Windows桌面上,雙擊Matlab的圖標(biāo),進(jìn)入Matlab的工作環(huán)境。在命令窗口提示符后,鍵入cd E:speech指令,進(jìn)入實(shí)驗(yàn)文件夾路徑。1.3 在命令窗口鍵入clear all指令,清除工作空間的所有變量。2、加載語(yǔ)音數(shù)據(jù),熟悉matlab命令2.1加載“timit1.mat”語(yǔ)音數(shù)據(jù),命令為:load timit12.2用命令“who”和“whos”列出當(dāng)前工作空間中的變量。變量“timit1”會(huì)以包含55911個(gè)元素的矩陣(列向量)形式出現(xiàn)Your variables are:timit1 Name Size Bytes Class Attributes timit1 55911x1 447288 double 2.3利用命令“l(fā)ength”和“size”查看語(yǔ)音信號(hào)timit1的長(zhǎng)度和維數(shù):m = length(timit1)m,n = size(timit1)(粘貼實(shí)驗(yàn)結(jié)果)m = 55911m = 55911n = 12.4通過(guò)以下命令,分別查看語(yǔ)音信號(hào)timit1中間的1個(gè)、2個(gè)和20個(gè)數(shù)據(jù)值: timit1(5001)timit1(5001,5003)timit1(5001:5020)(粘貼實(shí)驗(yàn)結(jié)果)ans = -0.0646ans = -0.0646 0.0111ans = -0.0646 0.0307 0.0111 -0.0200 0.2021 0.4012 0.1869 -0.1756 -0.1902 0.0823 0.2363 0.1712 0.0637 -0.0209 -0.0683 -0.0394 0.0081 0.0105 0.0311 0.06962.5 Matlab中,符號(hào)“”可以實(shí)現(xiàn)轉(zhuǎn)置運(yùn)算,運(yùn)行以下命令進(jìn)行觀察:size (timit1)(粘貼實(shí)驗(yàn)結(jié)果)ans = 1 559112.6使用函數(shù)max和min可以分別得到信號(hào)的最大值和最小值:max(timit1)min(timit1)(粘貼實(shí)驗(yàn)結(jié)果)ans = 1ans = -0.80683、語(yǔ)音信號(hào)的時(shí)域分析3.1使用以下命令,畫(huà)出語(yǔ)音信號(hào)timit1(采樣頻率為16kHz,長(zhǎng)度為3.5秒)的時(shí)域波形。plot (timit1)title (timit1)xlabel (Time Index,it n)ylabel (Amplitude)axis (0 length(timit1) -1 1)grid3.2分別畫(huà)出一幀濁音和一幀清音的語(yǔ)音時(shí)域波形(采樣頻率為16kHz,幀長(zhǎng)為25ms,每幀有400個(gè)樣點(diǎn))。subplot(211), plot(timit1(14501:14900) % /a/ in dark.subplot(212), plot(timit1(35501:35900) % /s/ in wash.3.3編寫(xiě)個(gè)一用以計(jì)算信號(hào)短時(shí)功率的函數(shù)“stpower.m”,其Matlab代碼如下:function Px=stpower (x, N)M = length (x);Px = zeros (M, 1);Px (N)=x (1:N)*x (1:N)/N;For (m = (N+1): M)Px (m) = Px (m-1)+ (x (m) 2-x (m-N) 2)/N;3.4編寫(xiě)一個(gè)用以計(jì)算信號(hào)短時(shí)過(guò)零率的函數(shù)“stzerocross.m”,其Matlab代碼如下:function Zx = stzerocross(x, N)M = length(x);Zx = zeros(M,1);Zx (N+1)=sum (abs (sign (x (2:N+1)sign (x (1:N) ) ) )/ (2*N);for (m= (N+2):M) Zx (m) = Zx (m-1) + (abs (sign (x (m) ) sign (x (m-1) ) ) abs(sign (x (m-N) ) sign (x (m-N-1 ) ) ) )/ (2*N);end3.5加載“digits.mat”語(yǔ)音數(shù)據(jù),該數(shù)據(jù)包含英文數(shù)字 “0” 到 “9”的發(fā)音。計(jì)算其中的單詞“four”的短時(shí)功率和過(guò)零率(采樣頻率為10kHz,幀長(zhǎng)為30ms,每幀有300個(gè)樣點(diǎn))。load digits;N = 300; x=digits.four1;Px = stpower (x,N);Zx = stzerocross (x,N);plot(Px*1e -5 Zx x/2000)3.6加載“vowels.mat”語(yǔ)音數(shù)據(jù),該數(shù)據(jù)包含元音/a/, /i/, /o/, /u/的發(fā)音。分別畫(huà)出一幀/a/、一幀/i/、一幀/o/ 和一幀/u/的時(shí)域波形(采樣頻率為10kHz,幀長(zhǎng)為30ms,每幀有300個(gè)樣點(diǎn))。load vowelssubplot(221)plot (vowels.a_1(2001:2300)subplot(222)plot (vowels.i_1(2001:2300)subplot(223)plot (vowels.o_1(2001:2300)subplot(224)plot (vowels.u_1(2001:2300)3.7編寫(xiě)一個(gè)利用短時(shí)功率和短時(shí)過(guò)零率這兩個(gè)參數(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行濁音/清音分類的函數(shù)“voiunvoi.m”,其Matlab代碼如下:function voi = voiunvoi(x,N,Pth,Zth)% Short-time power Px and zero crossing Zx measures.Px = stpower(x,N);Zx = stzerocross(x,N);% Compare estimates with threshold values.voi = (PxPth*max(Px) & (ZxZth);% Shift the voi-flag N/2 samples to the left (middle sample in window).voi = voi(fix(N/2)+1:length(voi);voi(length(voi)*ones(fix(N/2),1);4、語(yǔ)音信號(hào)的頻域分析4.1加載“ma1_1”語(yǔ)音數(shù)據(jù)?;贒FT變換,畫(huà)出其中一幀數(shù)據(jù)(采樣頻率為8kHz,幀長(zhǎng)為37.5ms,每幀有300個(gè)樣點(diǎn))的頻域波形(對(duì)數(shù)幅度譜)。load ma1_1;x = ma1_1 (4161:4460); subplot(121), plot(x) N = 1024; k = 0:N/2-1;X = fftshift (fft (x.*hann (length (x),N);subplot(122), plot (k,20*log10 (abs(X(N/2:-1:1), axis (0 N/2-1 -inf inf )4.2編寫(xiě)一個(gè)用以計(jì)算信號(hào)諧波乘積譜的函數(shù)“hpspectrum.m”,其Matlab代碼如下:function HPSx = hpspectrum(x,N,R)k = 1:R:N/2; K = length(k);X = fft (x.*hann(length(x), N);HPSx = X(k);for (r = R-1:-1:1) HPSx = HPSx.*X (1:r:r*K);end4.3利用函數(shù)“hpspectrum.m”,來(lái)估計(jì)一幀濁音的基音周期。代碼如下:X = ma1_1(4161:4460);N = 1024; R = 5;HPSx = hpspectrum (x, N, R);plot (20*log10 (abs (HPSx)4.4加載“vowels.mat”語(yǔ)音數(shù)據(jù),分別畫(huà)出一幀/i/和一幀/u/(采樣頻率為10kHz,幀長(zhǎng)為30ms,每幀有300個(gè)樣點(diǎn))的基于DFT的對(duì)數(shù)幅度譜。其Matlab代碼如下:load vowelsx = vowels.i_1(2001:2300);N = 1024; k= -N/2:N/2-1;X = fftshift (fft (x.*hann (length(x),N);plot (k,20*log10(abs(X), axis(0 fix (N/2) 0 100)x = vowels.u_1(2001:2300);N= 1024; k = - N/2:N/2-1;X = fftshift (fft (x.*hann(length(x),N);plot (k,20*log10(abs(X), axis(0 fix(N/2) 0 100)4.5畫(huà)出一幀清音語(yǔ)音的基于DFT的對(duì)數(shù)幅度譜。語(yǔ)音數(shù)據(jù)為ma1_1中的第1570115860個(gè)樣點(diǎn)(采樣頻率為8kHz,幀長(zhǎng)為20ms,每幀有160個(gè)樣點(diǎn))。load ma1_1;x = ma1-1 (4161:4460); plot (x)N = 1024; k = - N/2;N/2-1;X = fftshift (fft (x.*hann (length (x),N);plot (k,20*log10 (abs(X), axis (0 fix (N/2) - inf inf )4.6 加載“timit1”語(yǔ)音數(shù)據(jù)。利用函數(shù)specgram,畫(huà)出該句語(yǔ)音的語(yǔ)譜圖。其Matlab代碼如下:load timit1;NFFT = 256 ; Fs = 16000; Win = 256; Noverlap = 128;specgram(timit1, NFFT, Fs, Win, Noverlap);4.7加載“gliss”語(yǔ)音數(shù)據(jù)。畫(huà)出該句語(yǔ)音的語(yǔ)譜圖。load gliss;NFFT = 256 ; Fs = 10000; Win = 256; Noverlap = 128;specgram(gliss.i_2, NFFT, Fs, Win, Noverlap);4.8 基于濁音/清音分類函數(shù)voiunvoi.m和諧波乘積譜函數(shù)hpspectrum.m,編寫(xiě)一個(gè)用以計(jì)算濁音短時(shí)基音周期的函數(shù)“stpitch.m”。其Matlab代碼如下:function Fp = stpitch(x,N,Pth,Zth,NFFT,R,Fs)M = length(x);N = 2*fix(N/2);win = hann(N);Fp = zeros(M,1); voi = voiunvoi(x,N,Pth,Zth);invoi = 0; for (m=N:N/2:M) n1 = m-N+1:m-N/2; n2 = m-N/2+1:m; n = n1 n2; if (any(voi(n) if (invoi) Fp(n1) = Fmax; invoi = 0; end else HPSmax,Fmax = max(abs(hpspectrum(x(n),NFFT,R); if (invoi) Fp(n) = Fp(n) + win*Fmax; else Fp(n) = Fmax*ones(N/2,1) win(N/2+1:N); invoi = 1; end endend wsave = warning; warning(off);Fp = (Fp*Fs/NFFT).*(Fp./Fp);warning(wsave);1. 調(diào)用matlab中的wavread和wavplay讀入并播放語(yǔ)音文件。2. 調(diào)用fft命令計(jì)算語(yǔ)音的頻譜。3. 調(diào)用specgram命令得到語(yǔ)音的語(yǔ)譜圖。4. 調(diào)用plot命令繪制并觀察語(yǔ)音的時(shí)頻域波形。5. 根據(jù)短時(shí)功率、短時(shí)過(guò)零率、諧波乘積譜的計(jì)算公式,編寫(xiě)分別用以計(jì)算短時(shí)功率、短時(shí)過(guò)零率、基音頻率的函數(shù):function Px=stpower、function Zx = stzerocross(x, N) 和function HPSx = hpspectrum(x,N,R)。6. 利用短時(shí)功率和短時(shí)過(guò)零率這兩個(gè)參數(shù)可以對(duì)語(yǔ)音信號(hào)進(jìn)行濁音/清音分類。編寫(xiě)實(shí)現(xiàn)此分類功能的函數(shù)voiunvoi.m。4.9利用函數(shù)stpitch.m,分別求出兩句語(yǔ)音“timit1”和“timit2”的基音周期。實(shí)驗(yàn)二 語(yǔ)音編碼一、實(shí)驗(yàn)?zāi)康氖煜ふZ(yǔ)音基本壓縮編碼的方法,觀察語(yǔ)音壓縮效果,加深對(duì)語(yǔ)音線性預(yù)測(cè)編碼(LPC)的理解。二、實(shí)驗(yàn)內(nèi)容1、編寫(xiě)并調(diào)試語(yǔ)音LPC參數(shù)提取程序。2、編寫(xiě)并調(diào)試語(yǔ)音基音周期提取程序。3、編寫(xiě)并調(diào)試語(yǔ)音LPC合成程序。三、實(shí)驗(yàn)原理語(yǔ)音信號(hào)中含有大量的冗余信息,采用各種信源編碼技術(shù)減除語(yǔ)音信號(hào)的冗余度,并充分利用人耳的聽(tīng)覺(jué)掩蔽效應(yīng),就可以將其編碼速率壓縮很多倍,而仍能提供可懂語(yǔ)音。LPC聲碼器是一種比較簡(jiǎn)單實(shí)用的語(yǔ)音壓縮方法,其基本原理是:根據(jù)語(yǔ)音生成模型,將語(yǔ)音看作激勵(lì)源通過(guò)一個(gè)線性時(shí)不變系統(tǒng)產(chǎn)生的輸出,利用線性預(yù)測(cè)分析對(duì)聲道參數(shù)進(jìn)行估值,將求得的線性預(yù)測(cè)系數(shù),結(jié)合基音周期等少量參數(shù)進(jìn)行傳輸,就可以在接收端利用合成濾波器重構(gòu)語(yǔ)音信號(hào)。線性預(yù)測(cè)系數(shù)的估計(jì)方法為:假設(shè)語(yǔ)音的當(dāng)前樣值可以用過(guò)去的個(gè)語(yǔ)音樣值來(lái)進(jìn)行預(yù)測(cè) 式中即為線性預(yù)測(cè)系數(shù)。實(shí)際值和預(yù)測(cè)值之間的均方誤差可表示為 要求均方誤差總和最小,將關(guān)于的偏導(dǎo)數(shù)設(shè)置為零,可以得到通過(guò)采用自相關(guān)法、協(xié)方差法或格形法求解該方程,即可得到最優(yōu)的。四、實(shí)驗(yàn)方法及程序1. 調(diào)用xcorr命令計(jì)算一幀語(yǔ)音的自相關(guān)函數(shù)。2. 調(diào)用toeplitz命令形成該幀語(yǔ)音的自相關(guān)矩陣。3. 調(diào)用durbin命令,采用杜賓遞推算法計(jì)算該幀語(yǔ)音的線性預(yù)測(cè)系數(shù)。4. 編寫(xiě)lpcauto.m函數(shù),求取一句語(yǔ)音信號(hào)的線性預(yù)測(cè)系數(shù)及預(yù)測(cè)殘差。選擇設(shè)當(dāng)?shù)拇昂瘮?shù)對(duì)語(yǔ)音信號(hào)進(jìn)行分幀。5. 編寫(xiě)lpcpitch函數(shù),由殘差信號(hào)計(jì)算該句語(yǔ)音的基音周期。6. 編寫(xiě)lpcgain函數(shù),由預(yù)測(cè)殘差能量,求出該句語(yǔ)音的增益。7. 編寫(xiě)lpcsyn函數(shù),由該句語(yǔ)音的基音周期、預(yù)測(cè)殘差能量和增益進(jìn)行LPC合成。五、實(shí)驗(yàn)結(jié)果與分析1. 如何對(duì)全極點(diǎn)模型的線性預(yù)測(cè)參數(shù)進(jìn)行提???加窗等預(yù)處理對(duì)提取結(jié)果有何影響?自相關(guān)法、協(xié)方差法求解線性預(yù)測(cè)方程組、格型法。協(xié)方差法是先把計(jì)算均方誤差的間隔N固定下來(lái),再研究它對(duì)計(jì)算n(i,1)的其中N是基音周期值。添加漢明窗和漢寧窗可以得到效果不錯(cuò)的波形,很明顯兩個(gè)波形相似,矩形窗的波形相對(duì)不是很平穩(wěn)。通過(guò)改變幀長(zhǎng)、幀移后波形更加的清晰,特征更加的明顯,更方便觀察。2. 如何實(shí)現(xiàn)線性預(yù)測(cè)參數(shù)的各種表現(xiàn)方式之間的轉(zhuǎn)換?對(duì)于語(yǔ)音信號(hào),確定了各線性預(yù)測(cè)系數(shù)后,根據(jù)H(z)可得其頻率響應(yīng)的估值即LPC譜。3. 使用預(yù)測(cè)殘差求基音周期有何優(yōu)點(diǎn)? 該方法能進(jìn)一步去除聲道共振峰的影響,簡(jiǎn)化清濁音判決過(guò)程,提高判決精度,有效降低發(fā)生基音倍頻和半頻的錯(cuò)誤。4. 如何根據(jù)線性預(yù)測(cè)系數(shù)求得LPC頻譜?對(duì)于語(yǔ)音信號(hào),確定了各線性預(yù)測(cè)系數(shù)后,根據(jù)H(z)可得其頻率響應(yīng)的估值即LPC譜。5. LPC頻譜與基于DFT求得的語(yǔ)音對(duì)數(shù)幅度譜相比有何不同?LPC譜優(yōu)點(diǎn)在于可以很好地表示共振峰結(jié)構(gòu)而不出現(xiàn)額外的蜂起和起伏,基本不含有噪聲,其頻率靈敏度與人耳不相匹配;DET得到的對(duì)數(shù)幅度譜受基頻諧波的影響,最大值只出現(xiàn)在諧波頻率上,共振峰測(cè)定誤差較大。6. LPC合成語(yǔ)音的質(zhì)量如何?有何改進(jìn)措施?LPC合成技術(shù)的優(yōu)點(diǎn)是簡(jiǎn)單直觀。其合成過(guò)程實(shí)質(zhì)上只是一種簡(jiǎn)單的解碼和拼接過(guò)程。另外,由于波形拼接技術(shù)的合成基元是語(yǔ)音的波形數(shù)據(jù),保存了語(yǔ)音的全部信息,因而對(duì)于單個(gè)合成基元來(lái)說(shuō)能夠獲得很高的自然度。但是,由于自然語(yǔ)流中的語(yǔ)音和孤立狀況下的語(yǔ)音有著極大的區(qū)別,如果只是簡(jiǎn)單地把各個(gè)孤立的語(yǔ)音生硬地拼接在一起,其整個(gè)語(yǔ)流的質(zhì)量勢(shì)必是不太理想的。而LPC技術(shù)從本質(zhì)上來(lái)說(shuō)只是一種錄音+重放,對(duì)于合成整個(gè)連續(xù)語(yǔ)流LPC合成技術(shù)的效果是不理想的。因此,LPC合成技術(shù)必須和其他技術(shù)相結(jié)合,才能明顯改善LPC合成的質(zhì)量。實(shí)驗(yàn)過(guò)程記錄與結(jié)果分析1、計(jì)算短時(shí)自相關(guān)函數(shù)1.1 分別計(jì)算正弦信號(hào)和白噪聲的短時(shí)自相關(guān)函數(shù),估計(jì)正弦信號(hào)的基音周期。其Matlab代碼如下:x=sin(2*pi*0.01*(0:499);r,eta=xcorr(x,100,unbiased);stem(eta,r);w=randn(500,1);r,eta=xcorr(w,100,unbiased);stem(eta,r);1.2 計(jì)算正弦信號(hào)疊加白噪聲的短時(shí)自相關(guān)函數(shù),試估計(jì)正弦信號(hào)的基音周期。其Matlab代碼如下:x=sin(2*pi*0.01*(0:499);w=randn(500,1);x1=x+w;r,eta=xcorr(x1,100,unbiased);stem(eta,r);1.3 分別畫(huà)出一幀濁音和一幀清音的語(yǔ)音自相關(guān)波形(采樣頻率為10kHz,幀長(zhǎng)為25.6ms,每幀有256個(gè)樣點(diǎn)),估計(jì)濁音的基音周期。load digits; x=digits.three1;m=2756; N=256; n=m-N+1:m;r,eta=xcorr(x(n),250,unbiased);plot(eta,r);m=500; N=256; n=m-N+1:m;r,eta=xcorr(x(n),250,unbiased);plot(eta,r);2、求取LPC系數(shù)2.1加載“digits.three1”語(yǔ)音數(shù)據(jù)?;谧韵嚓P(guān)法,求出其中一幀數(shù)據(jù)(采樣頻率為10kHz,幀長(zhǎng)為25.6ms,每幀有256個(gè)樣點(diǎn))的14階LPC系數(shù)。畫(huà)出相應(yīng)的LPC譜。load digits; x=digits.three1;m=2756; N=256; n=m-N+1:m; M=14;r,eta=xcorr(x(n),250,unbiased);Rx=toeplitz(r(M+1:2*M);rx=r(M+2:2*M+1);a=Rxrx;NFFT=1024; k=1:NFFT/2;X=fft(x(n).*hann(N),NFFT);Theta=1./fft(1;-a,NFFT);plot(k,20*log10(abs(353*Theta(k) X(k)axis(0 NFFT/2 inf inf)2.2編寫(xiě)一個(gè)用以實(shí)現(xiàn)杜賓遞推算法的函數(shù)“durbin.m”,其Matlab代碼如下:function a,xi,kappa=durbin(r,M)kappa = zeros (M,1);a = zeros (M, 1);xi=r(1); zeros(M,1);for (j=1:M)kappa(j)=r(j+1)-a(1:j-1)*r(j:-1:2)/xi(j);a(j)=kappa(j);a(1:j-1)=a(1:j-1)-kappa(j)*a(j-1:-1:1);xi(j+1)=a(1:j-1)-kappa(j)*a(j-1:-1:1);xi(j+1)=xi(j)*(1-kappa(j)2);end2.3利用函數(shù)“durbin.m”,計(jì)算2.1中語(yǔ)音數(shù)據(jù)幀的14階LPC系數(shù),并與2.1中的結(jié)果進(jìn)行比較:x=digits.three1;m=2756; N=256; n=m-N+1:m; M=14;r,eta=xcorr(x(n),250,unbiased);aLD,xi,kappa=durbin(r(M+1:2*M+1),M);a, aLD, norm(a-aLD)a =Johannesburg n. 約翰內(nèi)斯堡 0.3512 0.2072 0.3808 0.3163 0.0522 -0.1639 -0.2903 -0.2898 -0.1222 0.1960 0.3492 0.3024 0.1713 -0.8258aLD = 0.3512 0.2072 0.3808 0.3163 0.0522 -0.1639 -0.2903 -0.2898 -0.1222 0.1960 0.3492 0.3024 0.1713 -0.8258ans = 1.0047e-142.4編寫(xiě)一個(gè)用以實(shí)現(xiàn)反射系數(shù)轉(zhuǎn)換為L(zhǎng)PC系數(shù)的函數(shù)“rf2lpc.m”,其Matlab代碼如下:function a = rf2lpc(kappa)M = length(kappa);a = zeros(M,1);for (j=1:M) a(j) = kappa(j); a(1:j-1) = a(1:j-1) - kappa(j)*a(j-1:-1:1);end2.5 編寫(xiě)一個(gè)用以實(shí)現(xiàn)LPC系數(shù)轉(zhuǎn)換為反射系數(shù)的函數(shù)“l(fā)pc2rf.m”,其Matlab代碼如下:function kappa = lpc2rf(a)M = length(a);kappa = zeros(M,1);for (j=M:-1:1) kappa(j) = a(j); a(1:j-1) = (a(1:j-1) + a(j)*a(j-1:-1:1)/(1 - kappa(j)2);end2.6使用函數(shù)“rf2lpc.m”和“l(fā)pc2rf.m”,檢驗(yàn)反射系數(shù)和LPC系數(shù)相互轉(zhuǎn)換結(jié)果。norm(kappa-lpc2rf(aLD)norm(aLD-rf2lpc(kappa)ans = 1.4760e-14ans = 03、語(yǔ)音信號(hào)的逆濾波3.1 利用2.3中求出的一幀語(yǔ)音數(shù)據(jù)的LPC系數(shù),構(gòu)造逆濾波器,并畫(huà)出該幀語(yǔ)音信號(hào)的殘差波形。ehat=filter(1;-1,1,x(n);plot(x(n) ehat)3.2編寫(xiě)一個(gè)用以實(shí)現(xiàn)語(yǔ)音信號(hào)LPC分析的函數(shù)“l(fā)pcauto”,其Matlab代碼如下:function ar,xi,e,m = lpcauto(x,M,win,Olap)Nx = length(x); N = length(win); if (N = 1) N = win; win = ones(N,1); endF = fix(Nx-Olap)/(N-Olap);ar = zeros(M+1,F);xi = zeros(M+1,F);e = zeros(Nx,1);m = zeros(F,1); n = 1:N; n1 = 1:Olap; n2 = N-Olap+1:N; n3 = Olap+1:N; win1 = win(n1)./(win(n1)+win(n2)+eps);win2 = win(n2)./(win(n1)+win(n2)+eps); for (f=1:F) r,eta = xcorr(x(n).*w
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 嵌入式產(chǎn)品的市場(chǎng)定位研究試題及答案
- 醫(yī)院助理護(hù)士管理制度
- 固定資產(chǎn)維修管理制度
- 加強(qiáng)公園設(shè)施管理制度
- 公路檢測(cè)設(shè)備管理制度
- 合伙創(chuàng)業(yè)薪資管理制度
- 前廳餐具衛(wèi)生管理制度
- 學(xué)生上網(wǎng)時(shí)間管理制度
- 幼兒園保管室管理制度
- 制衣車間紀(jì)律管理制度
- 生物質(zhì)材料及應(yīng)用淀粉
- 下線儀式串詞策劃
- GB/T 4223-2004廢鋼鐵
- 通用長(zhǎng)期供銷合同范本
- 新版《藥品管理法》解讀課件
- 《社區(qū)治理研究國(guó)內(nèi)外文獻(xiàn)綜述(1900字)》
- 2023浙江省學(xué)生藝術(shù)特長(zhǎng)測(cè)試A級(jí)理論復(fù)習(xí)資料
- 建筑業(yè)企業(yè)資質(zhì)職稱人員相近專業(yè)認(rèn)定目錄
- 擬投入本項(xiàng)目的主要施工設(shè)備表
- 湖北省環(huán)境監(jiān)測(cè)專業(yè)服務(wù)暫時(shí)行收費(fèi)重點(diǎn)標(biāo)準(zhǔn)
- GNSS實(shí)習(xí)報(bào)告
評(píng)論
0/150
提交評(píng)論