




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
——人工智能的另一種路徑 本人在2016年底的一個(gè),即智能音箱及其背后代表的聲學(xué)初擬結(jié)構(gòu)從早起的雞鳴到引力波——萬(wàn)事萬(wàn)物皆有亞馬遜ECHO的成功之道帶來(lái)的啟示備選:AI會(huì)對(duì)人類(lèi)的未來(lái)生活產(chǎn)生怎樣的【在“一刻”中講過(guò)部分相關(guān)話機(jī)構(gòu)簡(jiǎn)介 ,CEO。,的,團(tuán)隊(duì)人數(shù)目前是31人,負(fù)責(zé)技術(shù)研發(fā)、算法工程人員有28人,在人員配置概念解釋 AI 參考資料 機(jī)器人能獲得人類(lèi)的聽(tīng)覺(jué)(科學(xué)畫(huà)報(bào),201652016年1月14日,著名投資銀行高盛發(fā)布了一份長(zhǎng)達(dá)58頁(yè)的報(bào)告,詳細(xì)討論了虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)產(chǎn)業(yè)的未來(lái)發(fā)展趨勢(shì)。報(bào)告,VR/AR擁有巨大的發(fā)展?jié)撃?,它們很可能?huì)成為下一個(gè)大型計(jì)算平臺(tái)。到2025年,VR/AR硬件及軟件行業(yè)的年收益將達(dá)800億,如果它們能迅速跳出小眾市場(chǎng)大眾,則年收益將有可能達(dá)到1820億。已。筆者想談一談經(jīng)常被大家忽視的聲學(xué)領(lǐng)域。從誕生以來(lái)甚至一直到今天人們主要還是依靠聲音來(lái)傳遞信息。國(guó)聲學(xué)。然而,好景不長(zhǎng),隨著智能的興起,至少在消費(fèi)電子“實(shí)際上,在智能業(yè)發(fā)展形勢(shì)火爆的當(dāng)下,真正賺錢(qián)的光學(xué)廠家也不是太局,占據(jù)了地位。這一點(diǎn)我們從頭模組和電容觸摸屏行業(yè)分析中就可窺如歌爾聲學(xué)、共達(dá)電聲、新嘉聯(lián)等上市企業(yè),耳機(jī)配套廠家就了,就連造音(VA實(shí)際上,“虛擬現(xiàn)實(shí)”這種叫法并確,應(yīng)該叫“虛擬視覺(jué)”,因?yàn)楝F(xiàn)在的VR/AR我們以現(xiàn)在熱門(mén)的3D為例大家在3D的時(shí)候應(yīng)該能很明顯地感受到聲音或多或少總會(huì)和畫(huà)面的方位脫節(jié)特別是當(dāng)坐在院兩側(cè)過(guò)道3D投射產(chǎn)生的虛源聲音也屬于虛擬聽(tīng)覺(jué)的范疇。從現(xiàn)在的頭戴式VR/AR設(shè)備來(lái)看,虛擬環(huán)繞聲和虛擬3D聲應(yīng)該是最有應(yīng)用前景的。目前,虛擬環(huán)繞聲只能實(shí)現(xiàn)一個(gè)平面上定位,而虛擬3D聲則可以做到立體空間定位這種虛擬出來(lái)能讓人耳明確地感覺(jué)到聲音的(RA人的是什么?顯然傳感系統(tǒng)機(jī)械系統(tǒng)控制系統(tǒng)視覺(jué)系統(tǒng)聽(tīng)覺(jué)系統(tǒng)、首先是研究如何建立仿真聽(tīng)覺(jué)系統(tǒng)。1543年,著名醫(yī)學(xué)家維薩里了劃時(shí)代的著作《的構(gòu)造,向世人介紹了耳朵的解剖結(jié)構(gòu)。隨后,很多著名科學(xué)家都為人類(lèi)聽(tīng)覺(jué)認(rèn)知領(lǐng)域的發(fā)展盡了一份力。1961年,物理學(xué)家西因發(fā)現(xiàn)了耳蝸興奮的生理機(jī)制而榮獲生理學(xué)或醫(yī)學(xué)獎(jiǎng)雖然直到現(xiàn)在科學(xué)家仍讓機(jī)器人“聽(tīng)得到。想要達(dá)成這一目標(biāo),必須解決拾音、聲音定位、語(yǔ)音、開(kāi)發(fā)廠商,包括蘋(píng)果公司、谷歌公司和中國(guó)的訊飛等企業(yè)也都希望建、(DNN訓(xùn)練樣本總是特定的,而機(jī)器人的環(huán)境是多變的,我們需要機(jī)器人能像人類(lèi)最后機(jī)器人聽(tīng)覺(jué)技術(shù)還要解決自動(dòng)的問(wèn)題也就是讓機(jī)器“說(shuō)得出。機(jī)器人不同于其他設(shè)備,不能聽(tīng)到或聽(tīng)懂了之后卻一直默不作聲。人機(jī)自然也屬于聲學(xué)領(lǐng)域。不過(guò),人類(lèi)的系統(tǒng)結(jié)構(gòu)復(fù)雜,科學(xué)家至今仍沒(méi)有完全掌握最有效的自我保護(hù)和相互交流的而理想的機(jī)器人也必須能夠自主從環(huán)境中從底層聲學(xué)技術(shù)入手,幫廠商打造自家的Echo,聲智科技想做智能語(yǔ)音交互領(lǐng)域的MTK(20169AI解決這個(gè)難題。之所以會(huì)有這樣的觀點(diǎn)主要還是因?yàn)槁曋强萍嫉膱F(tuán)隊(duì)在做了多年聲一般來(lái)說(shuō),人聽(tīng)到包括直達(dá)聲和反射聲(人聽(tīng)自己說(shuō)話還包括骨導(dǎo)準(zhǔn)確率(也會(huì)產(chǎn)生語(yǔ)音喚醒等難題。樣本數(shù)據(jù)的精度和維度都有極高要求,而這主要依賴(lài)于訓(xùn)練數(shù)據(jù)和標(biāo)注,但是目前來(lái)說(shuō),這些數(shù)據(jù)的獲取幾乎都是依賴(lài)于人力來(lái)完成。顯然,這正是看中這個(gè)機(jī)會(huì),2016年4月,帶領(lǐng)團(tuán)隊(duì)從離職,成立了聲音定向等技術(shù)和麥克風(fēng)陣列等硬件已經(jīng)量產(chǎn)應(yīng)用這也意味著解決真實(shí)場(chǎng)景下語(yǔ)音識(shí)別與喚醒的思路經(jīng)過(guò)了驗(yàn)證。與此同時(shí)聲智科技以自己的技術(shù)和產(chǎn)品來(lái)真實(shí)場(chǎng)景下的遠(yuǎn)場(chǎng)語(yǔ)音數(shù)據(jù), 告訴36氪,目前已經(jīng)將真實(shí)90%以上的識(shí)別率。MTK(聯(lián)發(fā)科。從2004年起,MTK進(jìn)軍市場(chǎng),不同于當(dāng)時(shí)德州儀器、高通、英飛凌等國(guó)際廠商只提供平臺(tái)給廠商,MTK提供的是高性?xún)r(jià)比的“保姆式”的整套成熟方案,大幅減少?gòu)S商的研發(fā)周期與成本。隨著智能的普及,MTK股價(jià)一度8000億元。MTK,聲智科技產(chǎn)品化的第一步是先做底層器件——聲學(xué)模組,這(2.09如果客戶(hù)量足夠大,或者業(yè)務(wù)有需要時(shí),也會(huì)考慮做成。能音響的語(yǔ)音交互方案,包含硬件與云端服務(wù),目標(biāo)客戶(hù)定位于傳統(tǒng)音響聲波對(duì)碼等技術(shù),外接了第的語(yǔ)音識(shí)別、語(yǔ)義理解等技術(shù),可以簡(jiǎn)單理解成一個(gè)沒(méi)有殼的“Echo”APP7。據(jù)顯示,2014年全球電子音響行業(yè)產(chǎn)值約為4844,201562.6%Echo18300,20171000Echo的產(chǎn)品互聯(lián)網(wǎng)品牌的智能音響銷(xiāo)量都不太好認(rèn)為這主要是因?yàn)橹悄芤粝渖婕暗暮图夹g(shù)其實(shí)很復(fù)雜,但卻沒(méi)有公司提供優(yōu)質(zhì)的解決方案;。市面上重視智能音響市場(chǎng)的AI廠商還有不少,比如訊飛、思必馳都推出了相關(guān)的產(chǎn)品。不過(guò)創(chuàng)始人告訴36氪,這兩家公司也擁有成熟且經(jīng)過(guò)市場(chǎng)驗(yàn)證的麥克風(fēng)陣列技術(shù),這是Echo音箱的技術(shù),也是Echo音箱的主要麥克風(fēng)陣列是什么有哪些關(guān)鍵技(網(wǎng),2016年10月EchoHomeEchoHome技術(shù)AmazonEcho采用的是環(huán)形6+1麥克風(fēng)陣列而Hom(包括SurfaceStudio)只采用了2麥克風(fēng)陣列。這種差異我們?cè)谖恼隆秾?duì)比AmazonEcho,Home2可以簡(jiǎn)單理解為2個(gè)以上麥克風(fēng)組成的系統(tǒng)。2化,當(dāng)用戶(hù)從切換到類(lèi)似Echo智能音箱或者機(jī)器人的時(shí)候,實(shí)際上麥克前幾年,語(yǔ)音交互應(yīng)用最為普遍的就是以Siri為代表的智能,這個(gè)場(chǎng)人聲的干擾,語(yǔ)音識(shí)別顯然不能同時(shí)識(shí)別兩個(gè)以上。Echo、機(jī)器人或者汽車(chē)為主要場(chǎng)景的時(shí)的不同空間方向物理,只是完成了物理世界信號(hào)處理,得到了語(yǔ)音識(shí)別想要,依賴(lài)于輸入訓(xùn)練的樣本庫(kù)若處理后與樣本庫(kù)不匹配則識(shí)別效果也不會(huì)太WER消費(fèi)級(jí)的麥克風(fēng)陣列主要環(huán)境噪聲、房間混響、人聲疊加、模型噪聲、100比如天壇著名的回聲壁。實(shí)際上,這里所指的是語(yǔ)音交互設(shè)備自己發(fā)出,比如Echo音箱,當(dāng)歌曲的時(shí)候若叫Alexa,這時(shí)候麥克風(fēng)陣列實(shí)際上了正在的音樂(lè)和用戶(hù)所叫的Alexa聲音,顯然語(yǔ)音識(shí)別無(wú)法識(shí)別這兩類(lèi)聲就是偵測(cè)到與之人類(lèi)以便后續(xù)的波束形成聲源測(cè)向可以基于能量方TDOA的麥克風(fēng)陣列的各麥克風(fēng)輸出信號(hào)經(jīng)過(guò)處理(例如、時(shí)延、求和等)形成空間指向性的方法。波束形成主要是抑制主瓣以外干擾,這里也包括人聲,比如幾個(gè)人圍繞Echo談話的時(shí)候,Echo只會(huì)識(shí)別其中一個(gè)人。的突破才是未來(lái)的根本。希望能有熱愛(ài)人工智能的學(xué)生關(guān)注聲學(xué),報(bào)考我們制,現(xiàn)在的口徑還是較大,聲智科技現(xiàn)在可以做到2cm-8cm的間距,但是結(jié)構(gòu)布局仍然還是限制了ID設(shè)計(jì)的自由性。很多產(chǎn)品采用2個(gè)麥克風(fēng)其實(shí)并非成本問(wèn)題,而是ID設(shè)計(jì)的考慮。實(shí)際上,借鑒領(lǐng)域的合成孔徑方法,麥克風(fēng)陣列簡(jiǎn)單的更換器件而是整個(gè)結(jié)構(gòu)的重新設(shè)計(jì)包括器件算法和云端。這里要強(qiáng)調(diào)一下,并非2個(gè)麥克風(fēng)的陣列成本就便宜,實(shí)際上2個(gè)和4個(gè)麥克風(fēng)的耳朵可以在嘈雜的環(huán)境中分辨想要并且能夠同時(shí)識(shí)別多人說(shuō)話。智能的進(jìn)展相結(jié)合,可能會(huì)當(dāng)前的聲學(xué)信號(hào)處理以及語(yǔ)音識(shí)別方法。當(dāng)前成麥克風(fēng)陣列的主要包括:訊飛的2麥、4麥和6麥方案,思必馳6+1(科勝訊224(+1)麥陣列、6(+1)8(+1)麥陣列方案,其他家也有麥克風(fēng)陣列其中,22BroadsideEndfire360ID(也就是給人聽(tīng))情況下可以去除某個(gè)還要上升不少。2克風(fēng)(比如會(huì)議話筒)來(lái)模擬,這實(shí)際上就是2麥的Endfire結(jié)構(gòu),也就是1麥克風(fēng)通過(guò)原理設(shè)計(jì)模擬了2個(gè)麥克風(fēng)的功能指向性麥克風(fēng)的不方便之處就是若希望產(chǎn)品能適應(yīng)用戶(hù)場(chǎng)景,則可以類(lèi)似亞馬遜Echo一樣直接選用建議還是選用6個(gè)以上麥克風(fēng),至于汽車(chē)領(lǐng)域,最好是選用其他結(jié)構(gòu)形式的麥克體驗(yàn)才是的關(guān)鍵。Jawbone將死,智能硬件哀鴻遍野,為何亞馬遜Echo卻獨(dú)領(lǐng)風(fēng)(網(wǎng),2016年9月獨(dú)角獸正在。,JawboneFitbit技術(shù)門(mén)檻圈起小眾市場(chǎng)。因此,當(dāng)融資環(huán)境并不景氣時(shí)必然會(huì)失去話語(yǔ)權(quán)并,一點(diǎn)兒也不會(huì)感到讓人意外。,但是,Jawbone并不是孤立的案例,還有Glass、模塊化等也調(diào)概念,忽略?xún)r(jià)值,更加關(guān)注PR和融資,而不是技術(shù)和用戶(hù)體驗(yàn)。從最近爆出的各種創(chuàng)業(yè)來(lái)看,智能硬件創(chuàng)業(yè)領(lǐng)域哀鴻遍野。而與之形成鮮明對(duì)比的則是亞馬遜的Echo智能音箱,全球各大最近都在瘋狂,試圖分析和歸納出其成功的原因。亞馬遜的Echo誕世5年以來(lái),179的智能硬件來(lái)說(shuō)確實(shí)是個(gè)亮眼的業(yè)績(jī)?nèi)欢鼮橹匾膭t是Echo的我們先從市場(chǎng)的本質(zhì)屬性談起,在很多分析看來(lái),Jawbone是因的借口,不如先從自身來(lái)找找原因:第一:融資驅(qū)動(dòng)的太過(guò)嬌典型的案例還是亞馬遜,號(hào)稱(chēng)最的華爾街,竟然了這家公司20多連A股也難望其項(xiàng)背這種超級(jí)寬容同樣延伸到了創(chuàng)業(yè)領(lǐng)域于是就有了Jawbone連續(xù)融資13輪存這就傳遞了一個(gè)非常的信號(hào)全球很多,包括國(guó)內(nèi)的諸多這種寬松資本環(huán)境的另一惡果就是讓部分一直溫室之中經(jīng)不起任何市場(chǎng)的風(fēng)吹雨打既然錢(qián)如此好拿為何創(chuàng)業(yè)者還苦的去思考去干A是民營(yíng)資本少數(shù)成功的企業(yè)也都是苦熬磨難挺過(guò)來(lái)的不管是還,Echo5廣而反觀其他智能硬件的滿(mǎn)嘴概念不見(jiàn)產(chǎn)品Jawbone連耳機(jī)都做不好,何談可穿戴設(shè)備的鼻祖呢。當(dāng)然,技術(shù)投入是非?;ㄥX(qián)的,亞馬遜僅僅為了Echo的技術(shù)麥克風(fēng)EchoEcho加的自然。BCX求引領(lǐng)用戶(hù),但不意味著要讓用戶(hù)為技術(shù)創(chuàng)新直接,當(dāng)然間接是必須的,否形成良性循環(huán)。但是,這一切都被2VC的忽略了,不琢磨用戶(hù)的需求,反而研究起投資人。所以Jawbone很難從用戶(hù)角度去改進(jìn)產(chǎn)品,他們有大把Echo為何亞馬遜Echo、Echo分析深入探討過(guò),其中不乏峰瑞資本的,KEYTONEVENTURES的、確實(shí)重要,但不是Echo成功的,因?yàn)樵缙贓cho根本就沒(méi)啥生態(tài),哪有而是音箱。音箱這可是一個(gè)大產(chǎn)業(yè),國(guó)內(nèi)就是個(gè)千億級(jí)以上市場(chǎng),A的雖然不及但算下你家里的電子設(shè)備除了家電可不就是耳機(jī)和音箱?其次,有了需求,做不到也是沒(méi)有意義的。以HiFi和電腦音箱為代表的傳10怎么去做?WiFi音箱顯然是個(gè)方向,但是這里要注意一點(diǎn),智能音箱首先要解決它是一個(gè)“音箱”聲學(xué)也曾《智能音箱未來(lái)如何?到底有哪些神秘的聲學(xué)技術(shù)?那Echo最后,還要談?wù)勚悄艿膯?wèn)題,到底我們?cè)撚秩绾卫斫庵悄苣??Echo技術(shù),是下一代的語(yǔ)音交互界面。因此,Echo十分鮮明的去掉了觸摸屏,這十分國(guó)內(nèi)最先模仿Echo的產(chǎn)品就是京東和訊飛聯(lián)合推出的叮咚音箱,但是銷(xiāo)量KEYTONEVENTURES,這兩個(gè)產(chǎn)品音箱是因?yàn)闆](méi)有技
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 南京特殊教育師范學(xué)院《學(xué)前家庭教育》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西晉中理工學(xué)院《簡(jiǎn)帛書(shū)法》2023-2024學(xué)年第二學(xué)期期末試卷
- 漯河職業(yè)技術(shù)學(xué)院《電子商務(wù)項(xiàng)目策劃與管理》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶醫(yī)科大學(xué)《汽車(chē)先進(jìn)試驗(yàn)技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 滁州城市職業(yè)學(xué)院《企業(yè)管理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 皖南醫(yī)學(xué)院《林木遺傳學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣東機(jī)電職業(yè)技術(shù)學(xué)院《水處理工藝課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 鄭州輕工業(yè)大學(xué)《大數(shù)據(jù)分析與安全》2023-2024學(xué)年第二學(xué)期期末試卷
- 貴州工貿(mào)職業(yè)學(xué)院《數(shù)據(jù)結(jié)構(gòu)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 企業(yè)連帶擔(dān)保借款合同模板
- 育嬰師職業(yè)技能培訓(xùn)
- 事故隱患安全培訓(xùn)事故排查安全隱患
- 老年法律法規(guī)與標(biāo)準(zhǔn)單元一課件
- 職業(yè)中等專(zhuān)業(yè)學(xué)校2023-2024學(xué)年工作計(jì)劃
- 引水罐設(shè)計(jì)計(jì)算書(shū)-2
- 技術(shù)人員管理激勵(lì)制度
- 新公務(wù)員法培訓(xùn)課件
- 基層醫(yī)療機(jī)構(gòu)院感控考試試題及答案
- 領(lǐng)導(dǎo)干部的國(guó)學(xué)修養(yǎng)講義
- 人文素養(yǎng)知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)
- 外科學(xué)教學(xué)課件:腰椎間盤(pán)突出癥
評(píng)論
0/150
提交評(píng)論