可編輯語音識(shí)別芯片LD3320_第1頁
可編輯語音識(shí)別芯片LD3320_第2頁
可編輯語音識(shí)別芯片LD3320_第3頁
可編輯語音識(shí)別芯片LD3320_第4頁
可編輯語音識(shí)別芯片LD3320_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Routein fo第 # 頁Routein foRouteLD3320語音識(shí)別芯片第 # 頁Routein fo(單芯片/非特定人/動(dòng)態(tài)編輯識(shí)別列表語音識(shí)別解決方案)用聲音去溝通VUI (Voice User Interface)ICRoute用聲音去溝通VUI (Voice User In terface)Web :Tel ail:in fo一、.語音識(shí)別芯片介紹LD3320是一顆基于非特定人語音識(shí)別(SI-ASR: Speaker-IndependentAutomatic Speech Recognition )技術(shù)的語音識(shí)別/聲控芯片。提供了真正的單 芯片語

2、音識(shí)別解決方案。LD3320芯片上集成了高精度的A/D和D/A接口,不再需要外接輔助的Flash和RAM即可以實(shí)現(xiàn)語音識(shí)別/聲控/人機(jī)對(duì)話功能。并且,識(shí)別的關(guān)鍵詞 語列表是可以動(dòng)態(tài)編輯的?;贚D3320可以在任何的電子產(chǎn)品中,甚至包括最簡單的51作為主控芯片的系統(tǒng)中,輕松實(shí)現(xiàn)語音識(shí)別/聲控/人機(jī)對(duì)話功能。為所有的電子產(chǎn)品增 加VUI( Voice User In terface)語音用戶操作界面。主要特色功能:非特定人語音識(shí)別技術(shù):不需要用戶進(jìn)行錄音訓(xùn)練可動(dòng)態(tài)編輯的識(shí)別關(guān)鍵詞語列表:只需要把識(shí)別的關(guān)鍵詞語以字符串的形式傳 送進(jìn)芯片,即可以在下次識(shí)別中立即生效。比如,用戶在51等MCU勺編程中

3、,簡單地通過設(shè)置芯片的寄存器,把諸如“你好”這樣的識(shí)別關(guān)鍵詞的內(nèi)容動(dòng)態(tài) 地傳入芯片中,芯片就可以識(shí)別這樣設(shè)定的關(guān)鍵詞語了。真正單芯片解決方案:不需要任何外接的輔助Flash和RAM真正降低系統(tǒng)成本。內(nèi)置高精度 A/D和D/A通道::不需要外接 AD芯片,只需要把麥克風(fēng)接在芯片的 AD引腳上;可以播放聲音文件,并提供550mW的內(nèi)置放大器。高準(zhǔn)確度和實(shí)用的語音識(shí)別效果支持用戶自由編輯 50條關(guān)鍵詞語 在同一時(shí)刻,最多在 50條關(guān)鍵詞語中進(jìn)行識(shí) 別,終端用戶可以根據(jù)場(chǎng)景需要,隨時(shí)編輯和更新這50條關(guān)鍵詞語的內(nèi)容。二、語音識(shí)別介紹語音識(shí)別 ASR技術(shù),是基于關(guān)鍵詞語列表識(shí)別的技術(shù)。只需要設(shè)定好要識(shí)

4、別的關(guān)鍵詞語列表,并把這些關(guān)鍵詞語以字符的形式傳送到LD3320內(nèi)部,就可以對(duì)用戶說出的關(guān)鍵詞語進(jìn)行識(shí)別。不需要用戶作任何地錄音訓(xùn)練。語音識(shí)別ASR現(xiàn)實(shí)意義:ASR 技術(shù)最重要的現(xiàn)實(shí)意義就在于提供了一種脫離按鍵,鍵盤,鼠標(biāo)的基 于語音的用戶界面 VUI: Voice User In terface 。使得用戶對(duì)于產(chǎn)品的操作更快速,更自然。非特定人語音識(shí)別技術(shù)ASR是對(duì)幾十 G的語音數(shù)據(jù)經(jīng)語言學(xué)家語音模型分析,科學(xué)家建立數(shù)學(xué)模型,并經(jīng)過反復(fù)訓(xùn)練提取基元語音的細(xì)節(jié)特征,以及 提取各基元間的特征差異??梢缘玫皆诮y(tǒng)計(jì)概率最優(yōu)化意義上的各個(gè)基元語音 特征。最后才由資深工程師將算法以及語音模型轉(zhuǎn)化為硬件芯

5、片以應(yīng)用在嵌入 式系統(tǒng)中?;陬I(lǐng)先的語音識(shí)別核心引擎,經(jīng)過在各大主流手機(jī)產(chǎn)品中三年來超過一 千萬份的量產(chǎn)檢驗(yàn),LD3320提供了可以真正實(shí)用的語音識(shí)別/聲控功能。ASR技術(shù)是基于關(guān)鍵詞語列表識(shí)別的技術(shù)。每次識(shí)別的過程,就是把用戶說出的語音內(nèi)容,通過頻譜轉(zhuǎn)換為語音特 征,和這個(gè)關(guān)鍵詞語列表中的條目進(jìn)行一一匹配,最優(yōu)匹配的一條作為識(shí)別結(jié) 果。比如在手機(jī)的應(yīng)用中,這個(gè)關(guān)鍵詞語列表的內(nèi)容就是電話本中的人名/手機(jī)的菜單命令/T卡中的歌曲名字。不論這個(gè)列表的條目內(nèi)容是什么,只需要用戶設(shè)置相關(guān)的寄存器,就可以 把相應(yīng)的待識(shí)別條目內(nèi)容以字符形式傳遞給識(shí)別引擎。LD3320可以識(shí)別列表中的關(guān)鍵詞,用戶說的語音可

6、以是這個(gè)列表中任意的 關(guān)鍵詞語,而且不需要用戶在識(shí)別前進(jìn)行任何訓(xùn)練。識(shí)別引擎不關(guān)心關(guān)鍵詞語列表中的關(guān)鍵詞語的內(nèi)容,可以是命令,人名, 歌曲名字,操作指令等等任何的漢字字符串。每條關(guān)鍵詞語最大可以支持的字?jǐn)?shù),從算法角度是限制在30字以內(nèi)。但是從實(shí)際情況來看,用戶一口氣說超過8個(gè)字以上的條目時(shí),幾乎肯定會(huì)出現(xiàn)說錯(cuò)字/說漏字/說多字/打嗝/停頓等情況,這些情況都會(huì)嚴(yán)重影響識(shí)別并造成識(shí) 別錯(cuò)誤。因而一般來說,如果要獲得理想的識(shí)別效果,建議每條關(guān)鍵詞語的字 數(shù)不要過長,避免影響效果。ASR技術(shù)上的局限性在于:ASR不是聽寫系統(tǒng)ASR不能把人的聲音轉(zhuǎn)換為確定的拼音串ASR不能任意地識(shí)別人的說話內(nèi)容ASR不

7、能識(shí)別關(guān)鍵詞語列表中的某個(gè)關(guān)鍵詞語的一部分內(nèi)容,除非這一部 分內(nèi)容自身也是一個(gè)關(guān)鍵詞語ASR不可以識(shí)別與關(guān)鍵詞語列表中列出的關(guān)鍵詞語不相符的情況 比如,前后加了 “嗯”,“阿”之類的語氣詞 比如,只說出了關(guān)鍵詞語中的一部分而不是整個(gè)關(guān)鍵詞語 比如,沒有列在關(guān)鍵詞語列表中的詞語三、應(yīng)用場(chǎng)景由于LD3320可以動(dòng)態(tài)編輯的識(shí)別關(guān)鍵詞語列表,因此其可以應(yīng)用的范圍大大超過了那些不可以改變識(shí)別列表的芯片。同時(shí),LD3320是一顆真正的單芯片解決方案,不需要輔助的外圍Flash/RAM/AD,只需要有一顆 51級(jí)別的單片機(jī)芯片就可以控制 LD3320從而降低了系統(tǒng)的成本。其應(yīng)用場(chǎng)景主要包括:1. 智能玩具/

8、對(duì)話玩具2. 導(dǎo)航儀3. MP3/MP44. 數(shù)碼像框5. 機(jī)頂盒/彩電遙控器6. 電磁爐/微波爐/洗衣機(jī)/智能家電操作7. PMP/游戲機(jī)8. 自動(dòng)售貨機(jī)9. 地鐵自動(dòng)售票機(jī)10. 導(dǎo)游機(jī)11. 樓宇電視的廣告點(diǎn)播(請(qǐng)參考“ LD3320語音識(shí)別芯片應(yīng)用場(chǎng)景”)四、主要技術(shù)參數(shù)1. 內(nèi)置單聲道m(xù)ono 16-bit A/D模數(shù)轉(zhuǎn)換2. 內(nèi)置雙聲道stereo 16-bit D/A數(shù)模轉(zhuǎn)換3. 內(nèi)置20mW聲道耳機(jī)放大器輸出4. 內(nèi)置550mW單聲道揚(yáng)聲器放大器輸出5. 支持并行接口或者 SPI接口6. 內(nèi)置鎖相電路 PLL,輸入主控時(shí)鐘頻率為2MHz - 34MHz7. 工作電壓:(VDD: for internal core) 3.3V8. 48pin 的QFN 7*7標(biāo)準(zhǔn)封裝9. 省電模式耗電:1uALD3320評(píng)估板的照片:(其中,控制MCU目前選用的是 STC的51單片機(jī))9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論