中國智能語音行業(yè)競爭分析課件_第1頁
中國智能語音行業(yè)競爭分析課件_第2頁
中國智能語音行業(yè)競爭分析課件_第3頁
中國智能語音行業(yè)競爭分析課件_第4頁
中國智能語音行業(yè)競爭分析課件_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、凝望璀璨星河:中國智能語音行業(yè)競爭分析智能語音的概念智能語音即實現人與機器以語言為紐帶的通信智能語音即實現人與機器以語言為紐帶的通信。人類大腦皮層每天處理的信息中,聲音信息占20%,它是溝通最重要的紐 帶,人機對話將方便人們的工作與生活。完整的人機對話包括聲音信號的前端處理、將聲音轉為文字供機器處理、在機器 生成語言之后,用語音合成技術將文本語言轉化為聲波,從而形成完整的人機語音交互。來源:艾瑞2018年中國人工智能行業(yè)研究報告;百度AI。人機對話的實現流程對話輸入與 前端處理ASR語音識別NLU語音理解NLG語言生成TTS語音合成對話輸出0102030408070605DST對話狀態(tài)維護Po

2、licy動作候選排序信號及語音NLP2語音助手及其發(fā)展歷程來源:根據公開資料,艾瑞自主研究繪制。20142016國內蟲洞語陸續(xù)上線20182019中國智能音箱 銷量突破百萬科大訊飛第二代汽車語音 助理發(fā)布,上線語音喚醒 詞、語音交互打斷技術飛、搜狗語 Cortana,可在PC端使音智能助手 用,不再基于存儲式問答,實現了對話科大訊飛前裝智能網聯 車機發(fā)布,深度打通車 機和車聯網功能服務誕生期探索期發(fā)展期201120122013首個個人手機助理Siri 誕生,音、科大訊 微 軟 推 出 個 人 助 理隨 iPhone 4S發(fā)布科大訊飛發(fā)布 第一代智能汽 車語音助理, 上線命令詞語 音識別系統(tǒng)20

3、15亞馬遜智能音箱 Echo 搭載Alexa 發(fā)布2017智能語音助手賦能多類智能終端,構建全產業(yè)生態(tài)鏈消費級智能語音交互是人們接觸智能語音最普遍的渠道,從手機語音助手、家庭智能音箱、智能耳機、智能電視、故事機 到智能車載等等,根據艾瑞2020年中國智能物聯網(AIoT)白皮書,2018年消費級AIoT在總AIoT市場中占比68%, 市場規(guī)模達到1753億元,作為最早顯示出市場潛力的賽道,無論是硬件設備廠商還是互聯網公司、AI公司都瞄準消費級智 能交互終端。而智能終端的背后還有廣闊的生態(tài),包括面向開發(fā)者的語音開放平臺、語音操作系統(tǒng)及音頻內容等等。語音助手是用于終端的語音控制程序,通過智能對話與

4、即時問答的智能交互,讓智能機器助手幫助完成用戶指派的任務。2011 年第一款手機語音助手 Siri 伴隨 iPhone 4S 亮相,各大廠商紛紛入局。從 2017年下半年開始,通過開放語音生態(tài)系 統(tǒng),進行產業(yè)內合作,語音助手向家居、車載、可穿戴設備等領域不斷延伸和遷移,構建出全產業(yè)生態(tài)鏈。語音助手發(fā)展歷程小愛音箱累計語音交互 次數破百億,小愛同學 內置于手環(huán)、藍牙耳機、 電視、手表等硬件設備Google Assistant 伴 隨 Google Home 發(fā)布,實 現語音控制智能家居搜狗、科大訊飛等企業(yè)宣布其語音識別準確率達到97%多款搭載語音助 手的藍牙智能耳 機陸續(xù)發(fā)布3中國智能語音行業(yè)圖

5、譜來源:艾瑞根據公開資料自主研究繪制。以企業(yè)主營業(yè)務為準,圖標排序主要考慮排布整齊,無實際含義。基礎層數據及計算資源服務器數據云服務開源模型深度學習引擎層產品、解決方案、 算法平臺層智能硬件品牌產品對話式操作系統(tǒng)設備和技能語音能力開發(fā)麥克風及陣列解決方案智能音箱AI翻譯機AI錄音筆兒童產品智能家居醫(yī)療領域電子病歷語音輸入導診機器人智能臨床決策支持系統(tǒng)公檢法領域智慧庭審聲紋研判聲紋采集終端教育領域技術服務平臺AI口語應用口語機考客服領域技術服務平臺產品與解決方案語音審核AI課堂語言服務與泛傳媒語音輸入法金融聲紋識別AI同傳AI主播智能會議音視頻翻譯語音轉寫語言服務金融2019年中國智能語音行業(yè)圖

6、譜應用層醫(yī)療公檢法教育智能硬件客服AIUIiFLYOSTWS耳機YodaOS主控芯片語音芯片揚聲器音頻內容代工車載語音4中國智能語音行業(yè)熱度注釋:數據截至2019年12月。數據包含已上市企業(yè)和巨頭企業(yè)旗下品牌。來源:艾瑞根據烯牛數據整理繪制。市場較為理性,入局企業(yè)數量252家據統(tǒng)計,我國人工智能創(chuàng)業(yè)項目中處于語音識別和語義分析賽道的共有252家,占比10.6%。同時,根據國家工業(yè)信息安 全發(fā)展研究中心數據,截至2018年底,我國人工智能領域合計申請專利44.4萬件,而語音識別與自然語言處理技術則合計 申請專利6.1萬件,占比達到13.6%,反映出智能語音領域單位技術產出情況高于行業(yè)整體,且發(fā)展

7、也更倚重技術要素。中國人工智能投資數據概覽人工智能整體創(chuàng)業(yè)項目數量B輪后項目數量投資事件數量投資機構數量2,3717513,6001,822語音識別賽義分析賽道721110414052017教育政法汽車智能服務20182019H1開放平臺智能硬件與移動互聯網產品及服務其他79.2億元54.5億元42.3億元41%27%32%47%21%32%46%12%43%+164%+33%代表性企業(yè)案例科大訊飛注釋: “其他”指智慧城市行業(yè)應用、信息工程、電信增值產品運營、運營商大數據及其他業(yè)務。以AI解決社會剛需,三個同心圓造就行業(yè)頭部玩家科大訊飛股份有限公司成立于1999年,

8、是亞太地區(qū)知名的智能語音和人工智能上市企業(yè)。目前科大訊飛的人工智能產業(yè)生 態(tài)已經形成三個同心圓:第一層是核心層。圍繞“訊飛超腦”,科大訊飛的教育BG、智慧城市BG、消費者BG、智慧政法 BG、智慧醫(yī)療BU、智能服務BU、智能汽車BU、運營商BU、工業(yè)智能業(yè)務部等共同構筑科大訊飛人工智能產業(yè)生態(tài)的核 心層。第二層是探索層。在探索性方向,科大訊飛鼓勵內部實施創(chuàng)業(yè)機制和戰(zhàn)略合作機制,通過資本紐帶的形式推動人工 智能產業(yè)化。第三層是開發(fā)層。圍繞人工智能核心開發(fā)平臺,科大訊飛為創(chuàng)新創(chuàng)業(yè)者提供技術和數據支持,幫助創(chuàng)新創(chuàng)業(yè) 者在各應用領域進行業(yè)務創(chuàng)新探索,將自身源頭核心技術提供給平臺伙伴,推動整個產業(yè)生態(tài)構

9、建,截至2019年12月31 日,訊飛開放平臺已聚集超過 112W開發(fā)者團隊,總應用數超過73W,累計覆蓋終端用戶數 26.3億+,A.I.大學學員總量達 到33.3W+,以科大訊飛為中心的人工智能產業(yè)生態(tài)持續(xù)構建??拼笥嶏w人工智能產業(yè)生態(tài)與近期業(yè)務結構來源:艾瑞根據科大訊飛年報、半年報、2019年開發(fā)者大會公開披露數據整理。6代表性企業(yè)案例搜狗為語言理解而生:讓AI使人機交互更簡單搜狗成立于2003年,是中國搜索行業(yè)的挑戰(zhàn)者,AI領域的創(chuàng)新者。搜狗CEO王小川認為,隨著AI的發(fā)展和應用,搜索和 輸入法的未來將走向自動問答,從而形成前臺的自然交互與后臺的知識計算相結合的人工智能結構,搜狗是為語

10、言理解而 生的公司,在AI的探索上將以語言為核心?;凇白孉I使人機交互更簡單”的追求,2012年搜狗輸入法和地圖上線語音輸 入功能, 2016年上線以語音交互技術為核心的知音人工智能平臺,推出面向智能設備的“知音OS”,同年在第三屆世界 互聯網大會上,搜狗第一次把已有的語音技術和基于神經網絡的實時機器翻譯技術結合在一起,進行現場AI同傳,至今AI 同傳已服務數百場會議;2017年,推出語音實時變文字的速記工具“搜狗聽寫”,幫助用戶實現高效記錄和信息輸入等服 務;2018年,智能硬件翻譯寶與翻譯筆推出,為用戶的出行帶來便利,也為搜狗帶來了有用戶反饋閉環(huán)的場景,以便進一 步打磨技術,2019年搜

11、狗錄音筆C1上市,首發(fā)當日銷量突破了2萬臺,而降噪技術、聽感優(yōu)化、語音轉寫切分說話人、針 對連讀/發(fā)音模糊等細節(jié)的優(yōu)化也在不斷完善;同時,AI合成主播也于2019年迭代升級,基于AI分身技術的突破實現站播, 姿態(tài)和動作更自然。搜狗智能語音探索歷程企業(yè)用戶AI分身AI同傳互聯網產品智能硬件2012年AI語音登錄互聯網產品完成深度學習的研發(fā) 后,語音技術陸續(xù)接 入包括輸入法、地圖 在內的全線產品2016年技術對外輸出上線知音人工智能平 臺,推出面向智能設 備的“知音OS”; 推出AI同傳2017年文字轉寫服務上線發(fā)布語音轉寫文字工 具“搜狗聽寫”來源:艾瑞根據公開資料研究繪制。72018年智能硬件

12、與AI主播發(fā)布推出旅行翻譯寶、速記翻譯筆等智能硬件;搜狗與新華社聯合發(fā)布 全球首個全仿真智能 AI主持人2019年深入場景優(yōu)化產品搜狗錄音筆C1上市,前端信號處理、語第五屆世界互聯網大會上, 音識別等細節(jié)不斷優(yōu)化;AI合成主播迭代, 可實現站播代表性企業(yè)案例搜狗搜狗分身來源:艾瑞根據公開資料自主研究繪制。8搜狗輸入法個性化語音識別“變聲”功能多維輸入提升轉寫 準確率智能輔助編輯打通搜狗輸入 法,實現個性 化識別語音增強提供云端搜狗聽 寫服務糖貓兒童手表寓教于樂廣電AI主播司法虛擬法官金融業(yè)虛擬柜員搜狗同傳多場景音視頻轉 寫和翻譯服務融合OCR和知識 圖譜技術1.可強化學習已 登錄用戶的個人 詞

13、匯,使用戶常 用語識別錯誤率 相對下降近40% 2.可將用戶的聲 音轉換成特定人 的聲音,語速、 停頓、情感等說 話習慣均可被轉 換為超高逼真度 的指定角色聲音依托音視覺技術實現的多 度分析,模態(tài)識別能力,通 過對用戶唇形、語音、表情 的多維輸入視頻即可將視頻 內的語音更準確地轉寫為文 字,極大地提升了噪聲環(huán)境下語音識別 準確率多模態(tài)識別1.通過云端智能 糾錯編輯技術,針 對置信度低的轉寫 結果提供多個候選 詞,幫助用戶對轉寫結果進行糾正搜狗聽寫 2.轉寫準確率達到95%互聯網產品、智能硬件和知音平臺相輔相成基于輸入法用戶大數據的沉淀與積累,搜狗提升輸入法與聽寫服務中針對用戶個性化特色詞句的識

14、別準確率,提升用戶日 常生活中表達、傳遞信息的效率;另一方面搜狗注重技術打磨,其表征學習能力可通過小數據快速定制合成用戶個性化語 音,自研的Smart Voice麥克風陣列算法則能對噪聲和混響進行多重深度優(yōu)化,確保人聲的高保真還原,對技術細節(jié)優(yōu)化的 關注使搜狗得以打造出明星產品;而智能硬件又為搜狗帶來了向最終用戶輸出服務的通道,不僅組成了商業(yè)閉環(huán),也形成 了獲取用戶體驗反饋、進一步打磨技術的服務閉環(huán)。搜狗智能語音發(fā)展優(yōu)勢與業(yè)務矩陣1.Smart Voice麥克風陣列算法能夠對噪聲和混響進行多重深 度優(yōu)化,確保人聲的高保真還原2. 向其他錄音筆廠商開放搜狗語 音轉寫服務,拉動錄音筆行業(yè) 從以硬件

15、為主的單一收益模式 向硬件+服務的多種收益模式轉變搜狗錄音筆支持語音對講、位置 定位、體感游戲、語 音報時、趣配音口語 評測等功能利用少量目標說話人的音視頻數 據,即可完成其AI 分身定制;與新華 社合作的AI主播已 播報新聞超1.5萬分鐘可支持演講、 視頻會議、視頻 字幕、實時直播 等場景音視頻轉 寫與翻譯融合OCR和知 識圖譜,可提取 演講PPT文本與關鍵字,進行 海量領域詞的 匯詞擴展、優(yōu) 化專業(yè)術語的 翻譯效果技術打磨服務閉環(huán)優(yōu)勢輸入法用戶大數據代表性企業(yè)案例思必馳01思路 云+芯帶來全鏈路與大規(guī)模定制化服務能力DUI開放平臺一站式對話定制開發(fā)平臺,提供從信號處理到對話管 理等全鏈路對

16、話技術與開發(fā)件。平臺注重為開發(fā)者提 供超高度定制服務,除通用的喚醒詞、合成音的定制外,還支持每一輪交互邏輯、知識圖譜、產品技能、 圖形用戶界面的深度定制。AI語音芯片推出聚焦于語音應用場景下的AI專用芯片,主要面向 智能家居、智能終端、車載、手機、可穿戴設備等各 類終端設備。解決方案包含算法+芯片,具有完整語音 交互功能,可實現語音處理、語音識別、語音播報等 功能,支持離線語音交互。02思必馳核心技術優(yōu)勢 擁有近400語音語言研究人員,各項知識產權800余項,專利514項聚焦智能終端和企業(yè)智能對話服務,圍繞 “云+芯”重點布局思必馳是國內專業(yè)的對話式人工智能平臺公司,創(chuàng)立于2007年,專注于為

17、企業(yè)和開發(fā)者提供自然語言交互解決方案, 2018年公司入選國家發(fā)改委“互聯網+”重大工程和人工智能創(chuàng)新發(fā)展工程項目。思必馳于2014年起確定專注賦能終端的 業(yè)務方向,在智能車載與家用智能終端方面業(yè)務高速發(fā)展,并于2017年推出面向大規(guī)模個性化定制需求的全鏈路智能對話 定制平臺DUI;2018年切入企業(yè)服務市場,發(fā)布針對企業(yè)智慧服務的解決方案會話精靈,為企業(yè)提供智能客服和知識機器 人等服務;2019年,思必馳攜手中芯國際推出首款毫秒級語音AI專用芯片TH1520,打通智能語音交互全鏈路的最后一環(huán), 從芯片層推進語音語言技術的應用規(guī)模化,同時較上一年實現了近3倍業(yè)績增長。思必馳發(fā)展重心業(yè)務 智能終

18、端與企業(yè)信息服務兩大領域智能終端針對車載、白電、音箱、機器人、耳機等智能終端, 提供一站式產品方案,除對話操作系統(tǒng),還覆蓋麥克風 陣列、軟硬一體化解決方案、芯片及整機定制方案,方 案內置全鏈路智能對話技術和豐富的AI技能,并配以海 量第三方資源庫和專業(yè)用戶運維平臺服務;樹立了包括天貓精靈、美的空調、海信電視、OPPO手機、長城哈弗、小鵬汽車、榮威等諸多案例。企業(yè)智能信息服務-搭建面向全渠道的企業(yè)信息服務平臺“會話精靈”,提 供BOT定制能力,可用于呼叫中心、虛擬機器人、智能 會議設備等,以啟發(fā)式對話和復雜知識結構管理為特色-已服務于順豐、重慶農村商業(yè)銀行、碧桂園等。來源:艾瑞根據公開資料自主研

19、究繪制。9啟發(fā)式對話+復雜知識結構管理沉淀和管理企業(yè)復雜知識,建立知識點 之間的話題關聯,使對話系統(tǒng)能夠主動 發(fā)現相關知識,把與用戶意圖有關聯的 全部知識主動送達用戶學友的歌覆蓋多應用場景和豐你富好的小第馳,放首張三方內杭容州資現源在,什么天氣內置專那業(yè)邊的明語天限行號碼音及語下言周技五能是幾號 庫,能夠滿足用戶社交、學 習、娛樂休閑、 信息檢索、周 邊查詢、地圖 導航、O2O等 多樣化需求國內專業(yè)的AI技能商店代表性企業(yè)案例思必馳專注人性化的智能語音交互技術思必馳不僅關注語音控制,更關注人機對話式交互,多輪交互、打斷糾錯等技術業(yè)內領先,為產品提供專業(yè)深化的場景解 決方案,為企業(yè)提供啟發(fā)式對話

20、的智能服務,同時開放DUI全鏈路智能對話定制平臺,推進語音語言技術的應用規(guī)?;?。 思必馳智能交互技術支持“全雙工”架構的 全鏈路語音交互技術擁有完全自主產權的全系列語 音及語言交互技術,從感知到 認知,形成人機智能交互的完 整技術鏈條核心技術包含語音識別、語音 合成、語音識別+(含語音 喚醒、聲紋識別、情緒識別、 年齡識別等富信息識別)、語 義理解、智能對話五大方面來源:艾瑞根據公開資料自主研究繪制。10代表性企業(yè)案例依圖科技經驗+ 技術需求理解算法 優(yōu)質在語音識別、轉寫、搜索等領域準確 率高,通過“聽寫大會”小程序向用 戶驗證了依圖算法優(yōu)質性,相對于行 業(yè)先入者也依然處于領先地位。行 業(yè) 應

21、 用依圖科技智能語音應用領域(部分)企 業(yè) 優(yōu) 勢長期服務于政府機關、公檢法單位,對其 會議需求(特別是涉密單位)理解深刻;轉寫準確率和基于聲紋的說話人區(qū)分技術 接近人類。幫助互聯網公司尤其是語音社交平臺,精準識別各類涉政、涉黃、暴 恐、嬌喘等違規(guī)音頻內容。合作案例提供語音轉文字的API/SDK,幫助開發(fā)者實現語音搜索、客服機器人、質 檢等應用。后續(xù)還將陸續(xù)開放聲紋識 別等能力。合作案例在公共安全領域具有多年的經驗;召回率和準確率高。語音內容審核智能會議系統(tǒng)語音開放平臺由語音識別、NLP、聲紋識別三架算法馬車拉動的“跨界者”依圖科技創(chuàng)立于2012年,是人工智能獨角獸公司,擔綱科技部“視覺計算國

22、家新一代人工智能開放創(chuàng)新平臺”。依圖的愿 景是參與人工智能領域的基礎性科學研究,全面解決機器看、聽、理解的根本問題,建設更加安全、健康、便利的世界, 因此,除已取得重大成就的計算機視覺領域之外,依圖在語音識別與自然語言理解領域也厚積薄發(fā):2018年底公司首次對外公布語音識別能力,甫一公布便取得亮眼成績,語音識別算法大幅刷新全球最大開源中文數據庫 AISHELL-2上的字錯率記錄,字錯率僅3.71%,比過去領先水平還進一步提升約20%;2019年依圖NLP成果榮登Nature Medicine,這是該期刊全球首次刊發(fā)中文NLP在臨床智能診斷的研究成果;2019年榮獲國際權威聲紋識別競賽VoxSRC冠軍,并首次將等錯誤率(EER )記錄刷新至1%以內;2019年,在由網信辦、工信部及公安部三部委指導的首屆中國人工智

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論