基于音頻水印技術(shù)的多機(jī)器人聲音身份識(shí)別仿真軟件_第1頁(yè)
基于音頻水印技術(shù)的多機(jī)器人聲音身份識(shí)別仿真軟件_第2頁(yè)
基于音頻水印技術(shù)的多機(jī)器人聲音身份識(shí)別仿真軟件_第3頁(yè)
基于音頻水印技術(shù)的多機(jī)器人聲音身份識(shí)別仿真軟件_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于音頻水印技術(shù)的多機(jī)器人聲音身份識(shí)別仿真軟件基于音頻水印技術(shù)的多機(jī)器人聲音身份識(shí)別仿真軟件1.引言機(jī)器人技術(shù)突飛猛進(jìn),是時(shí)代的潮流。將來(lái)機(jī)器人與人交流的情形將不再是一機(jī)對(duì)一人,而是多機(jī)對(duì)多人。然而與人交流時(shí)機(jī)器人之間需要通過(guò)聲音識(shí)別對(duì)方身份,同時(shí)不能讓參與交流的人有所覺(jué)察,所以需要在機(jī)器人聲音中嵌入特征水印,解決多個(gè)機(jī)器人之間的聲音識(shí)別問(wèn)題。語(yǔ)音識(shí)別和音頻水印技術(shù)是計(jì)算機(jī)信息處理的關(guān)鍵技術(shù)。音頻水印技術(shù)是指通過(guò)修改音頻信號(hào)從而在原始信號(hào)中嵌入附加信息的技術(shù)。目前音頻水印嵌入技術(shù)主要有DT域音頻水印嵌入、碼分復(fù)用數(shù)字音頻水印嵌入等等。音頻水印識(shí)別技術(shù)主要有系統(tǒng)特征參數(shù)提取識(shí)別、DT在線并行算法

2、識(shí)別等等。本文基于ATLAB開發(fā)環(huán)境,利用FDATl與用戶界面GUI等設(shè)計(jì)工具,通過(guò)分頻式音頻水印嵌入與提取方法,開發(fā)了一套模擬多機(jī)器人交談情形并識(shí)別各個(gè)機(jī)器人講話時(shí)刻的仿真軟件。2.音頻水印嵌入與提取方法音頻水印嵌入與提取方法的本質(zhì)本文由論文聯(lián)盟搜集整理是在一段聲音中嵌入特定的水印作為信息隱藏,接收后再將所隱藏信息提取出來(lái)的方法。在本仿真軟件中,首先選定一段聲音作為原始基音,設(shè)定原始基音就是多個(gè)機(jī)器人互相交談所發(fā)出的聲音。假設(shè)機(jī)器人有N個(gè),先在20HZ-20000HZ的頻率范圍內(nèi)為N個(gè)機(jī)器人選定N種水印載波頻率,依次用中心阻帶頻率為的N個(gè)帶阻濾波器對(duì)原始基音進(jìn)展濾波得到基音信號(hào)。然后為每個(gè)機(jī)

3、器人指定一個(gè)身份識(shí)別ID號(hào),把ID號(hào)的二進(jìn)制數(shù)作為待嵌入水印數(shù)據(jù),頻率選為。再用第i個(gè)待嵌入水印數(shù)據(jù)對(duì)頻率為fi的正弦波載波進(jìn)展調(diào)制,把調(diào)制后的信號(hào)幅值調(diào)整到基音信號(hào)平均幅值數(shù)倍以下與基音信號(hào)疊加。水印添加時(shí)刻統(tǒng)一指定為基音信號(hào)的時(shí)刻。至此得到各個(gè)機(jī)器人的音頻信號(hào),也就是講話聲音。模擬講話時(shí),各機(jī)器人在設(shè)定時(shí)刻輸出一次自己的音頻信號(hào),所有機(jī)器人的音樂(lè)聲互相疊加齊鳴。在多臺(tái)機(jī)器人講話的同時(shí),每一個(gè)機(jī)器人對(duì)齊鳴聲進(jìn)展采樣。先依次用中心通帶頻率為的帶通濾波器對(duì)齊鳴音信號(hào)進(jìn)展濾波,濾波后得到調(diào)制了的水印數(shù)據(jù)的正弦波載波信號(hào),再用通帶頻率為f0的低通濾波器進(jìn)展濾波,得到ID號(hào)的二進(jìn)制數(shù)據(jù)。在對(duì)所有的載波

4、頻率都進(jìn)展了一次同樣的操作后,一個(gè)機(jī)器人就得到了所有機(jī)器人的ID水印數(shù)據(jù),并獲得各機(jī)器人的發(fā)聲時(shí)刻。3.軟件設(shè)計(jì)與實(shí)現(xiàn)多機(jī)器人聲音身份識(shí)仿真別軟件主要由音頻水印嵌入模塊和身份ID識(shí)別模塊組成,通過(guò)ATLAB語(yǔ)言,F(xiàn)DATl設(shè)計(jì)工具實(shí)現(xiàn)音頻水印的嵌入與提取,運(yùn)用Siulink算法模擬多個(gè)機(jī)器人的交談情形,并通過(guò)GUI用戶界面設(shè)計(jì)工具實(shí)時(shí)檢驗(yàn)發(fā)聲機(jī)器人的身份ID和發(fā)生時(shí)刻。3.1音頻水印嵌入模塊Sineave模塊用于生成水印載波頻率為的正弦波,Subsyste模塊使用Step函數(shù)產(chǎn)生水印二進(jìn)制碼波形,并設(shè)置頻率為。Subsyste模塊后面的延時(shí)模塊Transprtdelay用于設(shè)置延遲播放聲音時(shí)間

5、。Triggeredsubsyste模塊用于接收到高電平時(shí)觸發(fā)顯示當(dāng)前接收時(shí)間。Sineave模塊和Subsyste模塊生成的波形疊加后通過(guò)零階保持器輸出至揚(yáng)聲器。3.2聲音身份識(shí)別模塊聲音身份識(shí)別模塊的根本構(gòu)造如圖2所示,F(xiàn)rAudiDevie模塊為麥克風(fēng)聲音拾齲設(shè)置高頻帶通濾波器中心通帶頻率為,將拾取到的聲音傳給高頻帶通濾波器DigitalFilterDesign,將攜帶二進(jìn)制水印數(shù)據(jù)的高頻正弦波留下,其余信號(hào)抑制掉。由于正弦波有負(fù)值部分,需要用絕對(duì)值函數(shù)Abs將正值部分取出。設(shè)置低通濾波器DigitalFilterDesign1的通帶頻率為f0,將正弦波的正值部分中頻率為f0的水印濾出。

6、為了獲得完好的二進(jìn)制水印波形,需要對(duì)波形幅值進(jìn)展調(diào)整。把水印信號(hào)送給Bias模塊和符號(hào)函數(shù)Sign后,得到幅值為1或-1的波形,再通過(guò)波形幅值加1和0.5倍增益運(yùn)算,提取出二進(jìn)制水印波形。3.3GUI用戶界面模塊GUI用戶界面如圖3所示。左上角的下拉菜單用于選擇機(jī)器人編號(hào),底下的滑動(dòng)條用于設(shè)置機(jī)器人發(fā)聲延遲時(shí)間。右上角的控制臺(tái)方框內(nèi)有兩個(gè)按鍵:講話和聆聽,點(diǎn)擊講話按鍵后揚(yáng)聲器輸出所選編號(hào)機(jī)器人的聲音,點(diǎn)擊聆聽按鍵后麥克風(fēng)接收外界聲音。在控制臺(tái)下方顯示的是識(shí)別出的各機(jī)器人的發(fā)聲時(shí)間。軟件界面中央是以時(shí)間為橫坐標(biāo)的各機(jī)器人聲音中所攜帶水印的波形圖。atlab的GUI用于實(shí)現(xiàn)用戶和機(jī)器之間的交互,在

7、仿真軟件中,底層程序?qū)?duì)Siulink模塊中的參數(shù)進(jìn)展設(shè)置,并將rkspae中產(chǎn)生的數(shù)據(jù)通過(guò)顯示在GUI用戶界面上。例如設(shè)置機(jī)器人發(fā)聲延遲時(shí)間時(shí),需要對(duì)滑動(dòng)條進(jìn)展操作來(lái)設(shè)定時(shí)間值f1=str2dublegethandles.edit1,String;set_paraterprnt3k/000/TransprtDelay1,delaytie,nu2strf1實(shí)現(xiàn)將滑動(dòng)條所設(shè)置的延遲時(shí)間傳遞給延時(shí)模塊Transprtdelay,用于tiedelay的參數(shù)設(shè)置。在用戶界面按下講話按鍵,GUI底層程序?qū)⒘⒓凑{(diào)用對(duì)應(yīng)的發(fā)聲模塊。圖3設(shè)置本臺(tái)機(jī)器為Rbt6,那么將調(diào)用si101函數(shù)。當(dāng)按下聆聽按鍵時(shí),GU

8、I調(diào)用siterprnt3k函數(shù)。Siulink模塊執(zhí)行完畢后,機(jī)器人發(fā)聲水印數(shù)據(jù)保存在rkspae中,通過(guò)assigninbase,y16,siuty=evalinbase,y16將rkspae中的數(shù)據(jù)傳遞給GUI,用axeshandles.axes1;pltt,y顯示水印數(shù)據(jù)。Triggeredsubsyste模塊將接收到高電平時(shí)的當(dāng)前時(shí)間保存至rkspae中,利用assigninbase,y24,siut8;y8=evalinbase,y24函數(shù)rkspae中的數(shù)據(jù)傳遞給GUI,sethandles.edit9,string,nu2stry8-0.16963函數(shù)將聲音接收時(shí)間轉(zhuǎn)化成字符串

9、顯示。GUI用戶界面的操作過(guò)程如下:翻開GUI用戶界面,先利用下拉菜單項(xiàng)選擇擇機(jī)器人編號(hào),再利用8個(gè)滑動(dòng)條設(shè)置8個(gè)機(jī)器人的發(fā)聲時(shí)間。設(shè)置完成后按下講話按鈕和聆聽按鈕,8個(gè)機(jī)器人的水印波形及發(fā)聲時(shí)間及顯示在界面上。4.軟件運(yùn)行實(shí)例翻開GUI用戶界面,在機(jī)器號(hào)選擇下拉菜單中選擇對(duì)應(yīng)本機(jī)的機(jī)器號(hào)6,那么將要嵌入的水印設(shè)置為二進(jìn)制數(shù)11011,D0位和D4位均為1,都為高電平,同樣其他的7臺(tái)電腦依次選定好機(jī)器號(hào),然后在機(jī)器人延遲時(shí)間選項(xiàng)中調(diào)節(jié)RBT1滑動(dòng)條,設(shè)置發(fā)聲時(shí)刻為第0.423912秒,其他7臺(tái)電腦依次按對(duì)應(yīng)的RBT號(hào)設(shè)置發(fā)聲時(shí)刻第0.71739秒、第0.978261秒、第1.30435秒、第1

10、.56522秒、第0.489129秒、第0.847827秒、第1.04348秒。按下講話按鍵,siulink讀取rkspae中的原始音頻,見圖4a,并用第i個(gè)待嵌入水印數(shù)據(jù)對(duì)頻率為fi的正弦波進(jìn)展載波,見圖b。隨后水印信號(hào)與原始音頻疊加,通過(guò)計(jì)算機(jī)的揚(yáng)聲器播放出。機(jī)器人發(fā)聲完畢后再按下聆聽按鍵,麥克風(fēng)接收其他計(jì)算機(jī)播放的聲音,通過(guò)高頻濾波器將混合音中的水印濾出,濾出的水印見圖4。載波水印通過(guò)低頻濾波器后,提取的水印見圖4d。圖4e為水印數(shù)據(jù)調(diào)整后的結(jié)果。待聆聽完畢后GUI用戶界面同時(shí)顯示8臺(tái)電腦的聲音身份ID號(hào)以及發(fā)聲時(shí)間:0.42393秒、0.71741秒、0.97828秒、1.3043秒、1.5652秒、0.48915秒、0.84785秒、1.0435秒。此運(yùn)行

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論