Nuance語音識別技術(shù)開啟人機交互方式3 0時代_第1頁
Nuance語音識別技術(shù)開啟人機交互方式3 0時代_第2頁
Nuance語音識別技術(shù)開啟人機交互方式3 0時代_第3頁
Nuance語音識別技術(shù)開啟人機交互方式3 0時代_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Nuance語音識別技術(shù),開啟人機交互方式3 0時代-訪Nuance大中華區(qū)總經(jīng)理鄭裕慶人物介紹:Nuance大中華區(qū)總經(jīng)理鄭裕慶(Daniel Cheng)英國Essex大學(xué)計算機系人工智能專業(yè)碩士,同時擁有Newcastle大學(xué)航海及造船專業(yè)學(xué)士學(xué)位。曾任賽門鐵克(Symantec)中國公司董事經(jīng)理、Business Objects大中華區(qū)董事經(jīng)理。在IT行業(yè)擁有近二十年的從業(yè)歷史,對亞洲及大中華區(qū)市場有著深刻的了解??v觀整個電子產(chǎn)品發(fā)展史,一個不變的趨勢是人機交互界面與操作方式越來越簡單化、傻瓜化。微軟的WINDOWS視窗系統(tǒng)將計算機從只有資深程序員才可操控的禁臠解放出來,革命性的將圖形

2、化操作界面引入到計算機中,大大降低了使用計算機的難度,使得家用電腦得到真正大規(guī)模的普及。蘋果IPHONE的多點觸摸功能將我們的手指從繁雜的鍵盤中解放出來,任何有手指有眼睛的人都可以通過最簡單的手勢來控制智能終端,瀏覽互聯(lián)網(wǎng),發(fā)布視頻和照片,進行電子商務(wù)。我們與智能移動終端的距離再一次被拉進。如果將前兩次革命性的操作變革分別稱為人機交互方式的1.0時代和2.0時代,那么美國Nuance(NASDAQ:NUAN)通訊公司帶來的語音識別及輸入解決方案則可稱為3.0時代。試想一下,當(dāng)任何文本輸入或指令輸入都可以用一句話來完成,那么估計3歲的兒童都可以輕易的學(xué)會使用智能設(shè)備上網(wǎng),不就是說一句"

3、我要上網(wǎng)"么?還要怎樣簡單呢?Nuance的語音輸入方式將徹底解放用戶的雙手與眼睛,這將是一項極為神奇的技術(shù),同時也將開啟一個新時代-不管是汽車、手持設(shè)備、PC、家用電器全都可以通過語音實現(xiàn)操控,這將給用戶帶來更有效率、更為便利的工作與生活方式。也將給產(chǎn)業(yè)界帶來更新的應(yīng)用賣點與商業(yè)機會。-題記4月22日,在深圳福田福朋喜來登酒店舉行的"2010年Nuance移動論壇"上,Nuance大中華區(qū)總經(jīng)理鄭裕慶、Nuance移動業(yè)務(wù)部產(chǎn)品管理副總裁Matt Revis接受了手機方案設(shè)計記者的采訪,并就記者所關(guān)心的諸多問題進行耐心解答。鄭裕慶表示,Nuance作為全球領(lǐng)先的

4、語音、文字智能輸入和圖像解決方案提供商,將以Nuance領(lǐng)先的語音技術(shù)為基礎(chǔ),深入拓展至整個大中華區(qū)(包括大陸、香港、臺灣)市場,為客戶提供完整的解決方案。以下為采訪實錄:技術(shù)領(lǐng)先,更關(guān)注具有國際視野的客戶手機方案設(shè)計:能否介紹一下Nuance公司的背景及發(fā)展情況?鄭裕慶:Nuance是一家美國的上市公司,我們現(xiàn)在的全球員工數(shù)大概有五六千人,去年的公司營收已經(jīng)超過十億美元,現(xiàn)在大概有50多億美元的市值。從軟件業(yè)來講,Nuance的發(fā)展速度還是比較快的。Nuance目前一共有四個業(yè)務(wù)部門:一個是醫(yī)療業(yè)務(wù)部,提供醫(yī)療中的病歷管理及手冊轉(zhuǎn)錄服務(wù);一個是企業(yè)業(yè)務(wù)部,尤其是銀行或者電信行業(yè)的用戶,提供客

5、戶服務(wù)及呼叫中心應(yīng)用;一個是圖像業(yè)務(wù)部,提供MFP多功能掃描、PDF以及文件自動化操作解決方案;最后一個是移動設(shè)備業(yè)務(wù)部,提供手機與汽車設(shè)備中的指令及控制功能、語音查找及短信應(yīng)用。在大中華區(qū),移動業(yè)務(wù)部與企業(yè)業(yè)務(wù)部是我們最關(guān)注的兩個部門。手機方案設(shè)計:Nuance目前主要合作以及關(guān)注的是哪一類的客戶?鄭裕慶:我們有很多知名的品牌客戶,基本上目前全球90%以上的手機輸入法都是采用Nuance公司的技術(shù)。合作伙伴比如摩托羅拉、諾基亞、北方電訊、三星、索尼等手機品牌,大陸的還有中興、華為、TCL等廠商也是我們的客戶。汽車業(yè)來講,包括上海大眾,GM,BMW和Ford等也在運用我們的車載語音解決方案。此

6、外,我們也在跟一些大陸比較有實力的品牌在溝通,比如說聯(lián)想、海爾、康佳等企業(yè)。我們的客戶同樣包含手機方案公司,比如說龍旗也是我們的一個合作方,在軟件的前裝、后裝方面,我們也有跟一些OEM、ODM的廠家合作開發(fā)一些產(chǎn)品。對于珠三角尤其是深圳地區(qū)的中小廠商,由于數(shù)量太多,而且單個廠商的量不太大。所以我們并未有直接的合作,主要通過ODM來做一些應(yīng)用的植入,包括目前跟MTK有合作,MTK可以整合Nuance的軟件在其客戶的產(chǎn)品。如果有一些中低端的手機廠商想要植入這些功能,可以根據(jù)自己的需要選擇性的購買。手機方案設(shè)計:您認為Nuance的產(chǎn)品優(yōu)勢主要在哪一方面呢?鄭裕慶:在大陸市場,可能影響客戶的很大因素

7、是價格,中低端手機廠商通常會采用一些價格比較低的產(chǎn)品。而Nuance的產(chǎn)品可能在成本上并不具備太大優(yōu)勢。我認為Nuance的優(yōu)勢主要在三個方面:首先是國際化程度更高,Nuance的語音解決方案支持多達52種語言和方言,此外在國際市場我們也具有較高的品牌與市場影響力。我想每個廠家都希望他們的手機不單只是在國內(nèi)銷售,肯定也希望進軍更廣闊的國際市場。那么有這方面需求的廠家,Nuance可以給予他們更大的幫助。第二,Nuance在整體的解決方案上面是比較完整的。比如現(xiàn)在很多公司有的是做觸摸輸入的,有的是做九鍵盤的,有的是做整鍵盤的。方案太多,變成廠家需要自己去整合一些方案,這中間的成本比較高,整合度也

8、不會這么好。Nuance則可以提供整體的解決方案,所有功能都可以共享,整體功能可以選擇?,F(xiàn)在一些廠家會看到,同質(zhì)化的產(chǎn)品已經(jīng)沒有利潤了,所以他們也會希望采用一些更高端的功能。第三,領(lǐng)先的技術(shù)優(yōu)勢。在手寫和語音輸入技術(shù)上面,我們的功能比其它的廠家都要強。比如Nuance的T9 Write文字輸入技術(shù),具備手寫與觸摸屏裝置,用戶可在同一位置上下疊加地輸入文字,在小屏全屏?xí)鴮懸部蓪崿F(xiàn)同樣的功能。另外Nuance最新推出的T9 Trace的滑行輸入法,提供了無縫的多模態(tài),在一個單詞內(nèi)實現(xiàn)滑行和點擊的無縫切換,國內(nèi)沒有廠家可以提供的。此外,現(xiàn)時iphone和ipad里面使用的語音應(yīng)用都是Nuance的語

9、音技術(shù)植入?;氐阶畛跛v的,Nuance不是單一的一個輸入方法,而是有整體的解決方案。最終我們會給我們的客戶提供多種選擇,由客戶根據(jù)他們的需求自己來選擇。語音技術(shù)前景廣闊,將會加大中國市場的投入人物介紹:Nuance移動業(yè)務(wù)部產(chǎn)品管理副總裁Matt Revis,哥倫比亞商學(xué)院MBA學(xué)位,曾就任過Dragon Naturally Speaking(Dragon自然語音技術(shù))的產(chǎn)品經(jīng)理,這是一款全球銷量最好的桌面級應(yīng)用語音識別軟件。手機方案設(shè)計:未來您更看好哪一些終端會采用語音輸入技術(shù)?Matt Revis:市場上有越來越多的觸摸屏的產(chǎn)品,不光是手機,還有平板電腦等類似于ipad的產(chǎn)品。觸摸屏的輸

10、入和傳統(tǒng)的有鍵輸入還是有區(qū)別的,尤其是像ipad這種產(chǎn)品,它上面設(shè)置有虛擬鍵盤,這個鍵盤手指頭一定要按上去,這個按鍵感覺跟鍵盤是不一樣的,很多人其實不太習(xí)慣。那么在這種設(shè)備上,語音輸入其實有著很大的潛力,Nuance會繼續(xù)發(fā)展多模式用戶界面,為用戶提供更多選擇空間。這是我們nuance公司接下來要注重發(fā)展的一個方面。對于語音識別技術(shù)應(yīng)用,語音在過去主要集中于一些簡單的命令,受語法限制,只有設(shè)計好的命令才可以使用。在將來你可以發(fā)出一些沒有語法定義的指令,充分實現(xiàn)自然語言理解和移動語音應(yīng)用,其中包括可以通過語音同時起草短信、寫郵件和調(diào)出收件人的信息等完全開放的語音識別,這樣真正能實現(xiàn)的是人機之間的

11、對話。對于觸摸屏的產(chǎn)品,除了語音之外,我們可以為客戶提供多模式輸入,并結(jié)合Nuance的T9系列文字輸入產(chǎn)品,這個技術(shù)有智慧預(yù)測和聯(lián)想功能,用戶只需單次按鍵輸入,NuanceT9便會根據(jù)按鍵組合智能猜測到所需要輸入的文字,這個技術(shù)是很有針對性的設(shè)計。語音技術(shù)有非常好的前景。人們會發(fā)現(xiàn)以后在汽車行駛的過程中,有語音的控制你會多么的方便。在幾千首音樂中調(diào)出歌來,你用不著再在屏幕中搜索了。一說歌名,馬上就可以幫你搜索出來。手機方案設(shè)計:能否具體介紹一下Nuance的語音控制技術(shù)?Matt Revis:我可以演示一個DEMO。比如我手中的手機,我對它說一句話,這句話中含有命令詞和內(nèi)容,手機會通過軟件識

12、別并執(zhí)行命令。我們的系統(tǒng)會自適應(yīng)不同人的語音、語調(diào)、口音,一開始識別的時候,基本的識別率本身就不錯;當(dāng)用戶用得越來越多,系統(tǒng)會適應(yīng)你的聲音,精度會越來越高。等到我們實現(xiàn)了中文的語音短信輸入和郵件輸入時,到時候輸入一篇文章可能不需要鍵盤,就說話就可以了,只需要再做一點編輯。語音技術(shù)可以預(yù)期在車載應(yīng)用功能上為廣泛使用,因為通過語音控制,可以讓駕駛員的眼專注在路上,手專注在方向盤上,從而避免很多事故?,F(xiàn)時Nuance的Dragon Dictation(讀寫)和Dragon Search(搜索)正受iphone廣泛使用,在iphone store里已經(jīng)有超過200萬人下載了Dragon語音輸入軟件(免

13、費),調(diào)查下來有20%是每個星期都會用的這項功能。這項技術(shù)將會在普通領(lǐng)域都有很廣泛的應(yīng)用。比如專門做翻譯的公司可以應(yīng)用我們的語音輸入軟件,開發(fā)語音翻譯的產(chǎn)品。包括現(xiàn)在很流行的物聯(lián)網(wǎng),肯定是語音應(yīng)用的一個新的方面。比如你在家可以跟烤箱、微波爐、電視直接對話。這方面市場也是很大的。所以現(xiàn)在在北美,我們跟一些研究機構(gòu)合作,做一些探索。當(dāng)然這個是應(yīng)用層面的問題,我們主要提供技術(shù),電器制造商會考慮這一方面?,F(xiàn)在這個軟件在所有的智能手機上面安裝都沒有問題,至于非智能手機只要用的是ARM9以上的都是可以使用的。手機方案設(shè)計:您認為語音識別的目標(biāo)客戶群是哪些?中國市場與其它市場是否有不同?Matt Revis:市場區(qū)域不一定有多大的區(qū)別,主要還是不同的人群。語音識別更適合那些更注重生產(chǎn)效率的人,因為語音效率更高一些。簡單的例子,如果你要在幾千個名單中找個地址簿出來,語音是最簡便的方法。尤其是在汽車領(lǐng)域,這是很方便的。手機方案設(shè)計:作為一家美國公司,您認為應(yīng)該如何實現(xiàn)本地化,使得用戶更容易接受?Matt Revis:首先Nuance作為世界語音技術(shù)的領(lǐng)先的公司,我們可以提供

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論