一個(gè)內(nèi)嵌FPGA硬件加速器的低價(jià)語(yǔ)音識(shí)別平臺(tái)_第1頁(yè)
一個(gè)內(nèi)嵌FPGA硬件加速器的低價(jià)語(yǔ)音識(shí)別平臺(tái)_第2頁(yè)
一個(gè)內(nèi)嵌FPGA硬件加速器的低價(jià)語(yǔ)音識(shí)別平臺(tái)_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一個(gè)內(nèi)嵌FPGA硬件加速器的低價(jià)語(yǔ)音識(shí)別平臺(tái)與機(jī)器進(jìn)行語(yǔ)言交談,讓它聽(tīng)明白你在說(shuō)什么,語(yǔ)音識(shí)別技術(shù)將人類(lèi)這一曾經(jīng)的夢(mèng)想變成了現(xiàn)實(shí)。語(yǔ)音識(shí)別就好比機(jī)器的聽(tīng)覺(jué)系統(tǒng),該技術(shù)讓機(jī)器可以通過(guò)識(shí)別和理解,把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。自1952年貝爾實(shí)驗(yàn)室研制出世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng),到如今,語(yǔ)音識(shí)別技術(shù)有了突破性的發(fā)展,不再局限于識(shí)別孤立詞的識(shí)別,現(xiàn)在,可以實(shí)現(xiàn)連續(xù)的多語(yǔ)言的實(shí)時(shí)識(shí)別。在現(xiàn)實(shí)生活中,語(yǔ)音識(shí)別的產(chǎn)品也已經(jīng)變得十分普遍,比如iPhone手機(jī)自帶的Srir應(yīng)用軟件,google基于安卓系統(tǒng)開(kāi)發(fā)的googleNow以及百度語(yǔ)音和微軟開(kāi)發(fā)的十分調(diào)皮的Cortana語(yǔ)音識(shí)別軟件。不過(guò),目前市場(chǎng)上流行的都是軟件實(shí)現(xiàn)的語(yǔ)音識(shí)別,下面將介紹一款基于FPGA實(shí)現(xiàn)的可應(yīng)用于語(yǔ)言識(shí)別板卡。MATRIXVoice語(yǔ)音識(shí)別平臺(tái):在Indiegogo項(xiàng)目籌資只剩下一個(gè)月的時(shí)候,MATRIXVoice開(kāi)源語(yǔ)音平臺(tái)的籌款已經(jīng)超出其預(yù)期目標(biāo)$5000達(dá)到預(yù)期的289%。MATRIXVoice是弗羅里達(dá)邁阿密MATRIX發(fā)起的第三個(gè)眾籌項(xiàng)目,實(shí)際上MATRIXVoice平臺(tái)是一個(gè)只有3.14英寸的環(huán)形電路板,但是此電路板不僅兼容最新的語(yǔ)言庫(kù)而且可以實(shí)時(shí)進(jìn)行連續(xù)的語(yǔ)言識(shí)別,還得到多家云端語(yǔ)言服務(wù)的認(rèn)可,包括微軟的識(shí)別服務(wù)器,亞馬遜的Alexa語(yǔ)音服務(wù),谷歌的語(yǔ)音API以及Wit的ai和Houndify。就結(jié)構(gòu)而言,MAXTRIXVoice是基于Xilinx的Spartan-6LX4FPGA實(shí)現(xiàn)的,其設(shè)計(jì)外形可以作為一個(gè)器件直插到一個(gè)低功耗的RaspberryPi的單板機(jī)上,也可以作為一個(gè)獨(dú)立的板卡使用。下面兩張圖分別顯示MATRIXVoice的頂層和底層版面視圖:圖1MATRIXVoicetopview

圖2MATRIXVoicebottomview從上面的圖片中可以看到,MATRIXVoice板卡的背面有七個(gè)MEMS麥克風(fēng),七個(gè)REG多色LED,同時(shí)Spartan-6FPGA芯片也在前面板上,在AMTRIXVoice的背面,有一個(gè)64Mbit的SDRAM和一組可以兼容Raspberrypi單板機(jī)的I/O接口。由于這是MATRIX實(shí)現(xiàn)系列開(kāi)發(fā)板中的最新版,所以,針對(duì)MATRIXVoice板卡已經(jīng)有具備比較復(fù)雜的分層的軟件堆支持,包括一個(gè)為透明化FPGA代碼的HAL(硬件抽象層)和一個(gè)C++函數(shù)庫(kù),還有以一個(gè)介于視頻流接口和視覺(jué)庫(kù)(主要是RaspberryPi攝像頭)之間的中間層,此外,還為MATRIXVoice頂層提供了MATRIX操作系統(tǒng)和高層API接口。同時(shí),在基于MATRIXVoice開(kāi)發(fā)的時(shí)候,用戶可以根據(jù)自己習(xí)慣選擇喜歡的語(yǔ)言,主要是因?yàn)镸ATRIXVoice軟件庫(kù)支持比較多的語(yǔ)言,包括主流的C++、Python、JavaScript以及硬件人員常用的Verilog和VHDL語(yǔ)言。下圖可以看到MATRIXVoice平臺(tái)的軟件開(kāi)發(fā)層次:圖3Softwarelayerview總結(jié):現(xiàn)在,科創(chuàng)眾籌項(xiàng)目已經(jīng)越來(lái)越普遍,基于FPGA開(kāi)發(fā)功能更強(qiáng)靈活性更大的前沿應(yīng)用是一個(gè)十分好的點(diǎn)子,不僅使得產(chǎn)品具有更自由豐富的接口,還可以自由加入有針對(duì)性的加速器模塊,使得最

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論