




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、語音的采集及分析處理Sound acquisition and analysis02013435 趙斌指導(dǎo)教師 胡建中課程:機械工程測試與控制技術(shù)時間:2016年5月19日School of mechanical engineering SEU摘要:本項目是對信號采集、分析與處理相關(guān)知識的一次應(yīng)用,通過錄音軟件獲得三個實驗者的聲音,并運用MATLAB軟件對采集的語音信號進行分析處理。此次項目研究主要分三個部分:首先是語音信號的采集,利用錄音軟件錄取三個實驗者的聲音。其次是對錄取的語音信號進行格式的轉(zhuǎn)換,統(tǒng)一轉(zhuǎn)換為MP3格式。最后是利用MATLAB對語音信號進行時域和頻域分析與處理。項目最終研究
2、結(jié)果成功將采集的人聲區(qū)分,并通過改變采樣頻率對聲音做了處理,使其相較與源語音發(fā)生了較大變化。關(guān)鍵詞:語音采集,時域分析,頻域分析,MATLAB1、 語音采集1.1 題目Computer can convert analog signals to digital signals by sampling the voice or the video. The sentence of mechanical engineering measurement and control technology must be read by more than 3 people and be recorded
3、under the condition of different environmental noise using microphone and sound card in computer.First, the recorded voice is converted into a data file ASCII text with the help of professional software, then spectrum analysis is processed and the figure in time domain and frequency domain is drawn.
4、Recording software, such as:藍光影音MP3錄音機Matlab program of reading MP3 files:mp3readwriteDiscussion:1)Understand the sampling frequency and its effect on quality for the APE, MP3 and WMA audio format file.2)How to set the sampling frequency(采樣頻率)? what is the appropriate sampling length(采樣長度)?3)Accordi
5、ng to your analysis, how to distinguish speech sound of different people?4)What measures can be taken to make your speech sound identified difficultly by others?1.2 原始信號采集與處理通過手機自帶錄音功能,錄取三位實驗者的“機械工程測試與控制系統(tǒng)”語句,得到三個語音文件zb.m4a,hdh.m4a,lxy.m4a。2、語音信號的分析處理2.1 語音格式轉(zhuǎn)換通過參考函數(shù)mp3write,將m4a格式轉(zhuǎn)換為mp3格式。在讀取語音文件時,
6、注意到MATLAB R2014版本函數(shù)庫中有讀取語音函數(shù)audioread,該函數(shù)支持mp3格式語音的讀取,所以在程序中沒有使用提供的函數(shù)mp3read。轉(zhuǎn)換完成保存。2.2 時域與頻域的分析處理對獲取的信號繪制時域波形,并通過FFT繪制頻域波形。圖(1) 實驗者zb語音的時域波形和幅頻譜圖圖(2) 實驗者hdh語音的時域波形和幅頻譜圖圖(3) 實驗者lxy語音的時域波形和幅頻譜圖3、討論3.1采樣頻率的影響采樣時在模數(shù)轉(zhuǎn)換過程中以一定規(guī)律,如時間間隔,對連續(xù)時間信號進行取值的過程。其數(shù)學(xué)描述就是用間隔為Ts的周期單位脈沖序列g(shù)(t)去乘以模擬信號x(t)。g(t)可寫為 ( )由函數(shù)性質(zhì)可知
7、 ( ) 說明經(jīng)時域采樣后,各采樣點的信號幅值為,其中Ts為采樣間隔,為采樣頻率。3.2采樣頻率的設(shè)置及采樣長度的確定通過MATLAB中函數(shù)獲得錄取語音的采樣頻率為48000Hz。通過查閱資料知道人聲音的頻率一般是204000Hz,當Fs=48000Hz時,滿足采樣定理,所以這樣設(shè)置采樣頻率合理。根據(jù)圖(1)(2)(3)可以看出,這樣設(shè)置采樣頻率獲得的圖像時全保真的。采樣長度取決于錄音的時間長短,但不易過短,過短不能完整體現(xiàn)整個語音長度的特征,過長會增加運算量,增加計算機負擔(dān)。3.3區(qū)分不同的聲音不同的實驗者,其說話聲音的響度和音調(diào)不同,反應(yīng)到時域上就是信號幅值的不同,反應(yīng)到頻域上就是特征頻率
8、在頻譜圖上的分布不同。三個實驗者均為男生,錄制環(huán)境為圖書館,通過圖(1)(2)(3)可以看出,不同實驗者時域圖的區(qū)別即為振幅的差異,頻域圖的區(qū)別為聲音特征頻率的分布不同,三個實驗者語音的特征頻率分布大致集中在250Hz左右。理論上,區(qū)分不同人聲的主要靠特征頻率的不同,但實驗對象均為男生,音調(diào)比較接近,在頻譜圖上看不出太大區(qū)別,但每個人的音調(diào)是不能改編的,所以用頻率特征區(qū)分不同人聲比較準確。雖然三個實驗者的時域波形有較大差異,但只要改變講話者的說話輕重,就能改變時域波形,所以時域特征不能用來區(qū)分不同的聲音。3.4 讓聲音沒有區(qū)分度的方法利用改變采樣頻率的處理方法,可使源語音的特征頻率改變。如圖圖
9、(4)Fs=48000Hz時的時域圖和頻域圖圖(5)Fs=60000Hz時的時域圖和頻域圖圖(6)Fs=60000Hz時的時域圖和頻域圖通過對比圖(4)(5)(6)中的頻域圖,可以看出隨著采樣頻率的增大(減小),對應(yīng)語音的特征頻率也增大(減小),即語音的音調(diào)改變。利用MATLAB中的函數(shù)sound可明顯的聽出語音音調(diào)的變化。致 謝感謝胡建中老師在測試系統(tǒng)學(xué)習(xí)方面給我的教導(dǎo)和幫助,在我做項目的過程中為我答疑解惑,解決難題,使我能夠順利完成項目內(nèi)容。參考文獻:1.賈平民,張洪亭主編. 測試技術(shù)(第二版). 北京:高等教育出版社. 2012. 31-692. Dan Ellis,demo_mp3re
10、adwriteEB/OL. 2009.附錄:matlab程序代碼x,fs=audioread(zb.m4a);mp3write(x,fs,zb.mp3)x,fs=audioread(zb.mp3); %read mp3 format file Fs=48000; % sampling frequencyL=length(x); t=(0:L-1)/Fs;subplot(211);plot(t,x);title(zb.mp3 waveform of time domain);xlabel(time/s);ylabel(amplitude); Y = fft(x,L)*2;f = Fs/L*(0:1:L-1);A = abs(Y); %amplitu
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《解決問題的策略-從條件出發(fā)》(教學(xué)設(shè)計)-2024-2025學(xué)年三年級上冊數(shù)學(xué)蘇教版
- 2025年度布料行業(yè)國際市場開拓合同
- 2025年度全國重點工程裝車承包合同示范文本
- 2025年中國電氣裝備電線電纜行業(yè)市場發(fā)展現(xiàn)狀及投資方向研究報告
- 2025年度泵車租賃與能源管理服務(wù)合同
- 2025年度婚姻市場調(diào)研與分析服務(wù)合同正本
- 2025年度電子合同智能風(fēng)險管理與服務(wù)合同
- 2025年旅游度假村投資開發(fā)保證合同
- 25《少年閏土》教學(xué)設(shè)計-2024-2025學(xué)年語文六年級上冊統(tǒng)編版
- 2025年度科技創(chuàng)新園區(qū)場地使用權(quán)及創(chuàng)新項目合作合同
- 2025年春季學(xué)期學(xué)校全面工作安排表
- 部編人教版小學(xué)4四年級《道德與法治》下冊全冊教案
- TCITSA 24-2022 基于ETC的高速公路自由流收費技術(shù)規(guī)范
- 2022年涉農(nóng)領(lǐng)域涉嫌非法集資風(fēng)險專項排查工作總結(jié)
- 起重裝卸機械操作工國家職業(yè)技能標準(2018年版)
- 叉車裝卸區(qū)域安全風(fēng)險告知牌
- 五年級下冊美術(shù)課件-第2課 新街古韻丨贛美版
- 秦荻輝科技英語寫作教程練習(xí)答案(共42頁)
- GB∕T 41168-2021 食品包裝用塑料與鋁箔蒸煮復(fù)合膜、袋
- 部編版語文一年級下冊繪本閱讀課-優(yōu)質(zhì)課件.pptx
- 新人教版九年級全一冊物理知識點填空題匯編
評論
0/150
提交評論