智能語音行業(yè)分析研究報告_第1頁
智能語音行業(yè)分析研究報告_第2頁
智能語音行業(yè)分析研究報告_第3頁
智能語音行業(yè)分析研究報告_第4頁
智能語音行業(yè)分析研究報告_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

智能語音行業(yè)分析研究報告 5 82.1中國智能語音行 8 8 8 8 92.2.4自然語言理解技術(shù) 9 9 3.2.1深度學習 3.2.2云計算 4中國智能語音行業(yè)制約因素 4.1行業(yè)基礎層技 214.2技術(shù)瓶頸限 21 4.2.2自然語言處理技術(shù)尚不成熟 22 23 25 25 25 27 27 27 28 28 28 28 29 29 29 7.5.3競爭優(yōu)勢 7.6.1企業(yè)簡介 7.6.3競爭優(yōu)勢 圖表目錄圖2-1中國智能語音行業(yè)市場規(guī)模,2014年-2023年預測 圖2-2中國智能語音行業(yè)產(chǎn)業(yè)鏈 圖4-1中國智能語音行業(yè)國家性政策 >GUI——GraphicalUserI>算法——基于特定的計算模型,旨在解決某一信息處理問題而設計的一個指令序列。算力——計算機計算哈希函數(shù)輸出的速度。>定制化芯片——通過定制化半導體解決方案,面向特定領域提供的定制化芯片。類腦類芯片——仿照人類大腦的信息處理方式所制造的芯片,該類芯片可實現(xiàn)數(shù)據(jù)并HMM模型——HiddenMarkovModel,隱性馬爾可夫統(tǒng)計模型,用來描述一個含有>API接口——ApplicationProgrammingInterface,應用程序編程接口。語音芯片——具備語音交互功能的專用集成電路。>嵌入式語音軟件——滿足資源和運算受限環(huán)境下的各種嵌入式應用需求的語音軟件語音識別技術(shù)——將人類語音中的詞匯內(nèi)容轉(zhuǎn)換成計算機可以處理的輸入語料,最終聲紋識別技術(shù)——通過語音信號提取說話人獨有的聲門開合頻率、口腔大小形狀及聲>語音去噪技術(shù)——控制語音通信過程中的語音質(zhì)量,提高系統(tǒng)對于語音理解的準確性,>驀然認知——一家以認知計算、自然語言理解技術(shù)為核心的人工智能>思必馳———家專注于人性化智能語音交互技術(shù)的智能語音服>云知聲——一家專注于物聯(lián)網(wǎng)人工智能服務的智能語音識別服>地平線——中國人工智能芯片和算法軟件服是以語音為研究對象對語音語義進行識別、理解以及生成,使機器具備自然語言處理能力,語音合成技術(shù)是通過計算機將外部輸入的文字信息轉(zhuǎn)變成自然流暢的語言,賦予機器語音識別技術(shù)是將人類語音中的詞匯內(nèi)容轉(zhuǎn)換成計算機可以處理的音識別技術(shù)通過將用戶輸入的指令進行特征提取,形成特征數(shù)據(jù)流,然后與系統(tǒng)中已有的語音模型進行比對,尋找系統(tǒng)中最為接近的語音內(nèi)容。實現(xiàn)語音識別的過程主要分為四步(1)確定識別對象為單詞、音節(jié)或音素;(2)提取特征參數(shù),從語音波形中提取出重要的反應語音特征的相關(guān)信息;(3)建立聲學模型和語言模型,進行訓練和識別;(4)是后期的處理,身份。聲紋識別技術(shù)的作用主要包括兩方面:(1)發(fā)聲者辨認,主要用于在從某一語音材料的若干發(fā)聲者中尋找指定發(fā)聲者;(2)發(fā)聲者確認,主要用于確認某一語料是否由指定發(fā)聲語音去噪技術(shù)通過控制語音通信過程中的語音質(zhì)量,提高系統(tǒng)對于語音理解的準確性,型。有效的回聲消除算法需要持續(xù)的在一顆DSP芯片上運行,但有限的DS據(jù)沙利文數(shù)據(jù)統(tǒng)計,2014年中國智能語音行業(yè)市場規(guī)模僅有28.7億元(見圖2-1),得益于政策環(huán)境和技術(shù)實力的支持,中國智能語音行業(yè)得以快速發(fā)展。2018年中國智能語音行業(yè)的市場規(guī)模增長至157.9億元,2014年至2018年中國智能語音行業(yè)的年復合增長率達到53.2%。面的利好政策頻出,為智能語音產(chǎn)業(yè)的發(fā)展創(chuàng)造了良好的政策環(huán)境《新一代人工智能發(fā)展規(guī)劃》以及《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020年》中,政府均將推動智能制造行業(yè)上升為國家戰(zhàn)略,積極推動智能產(chǎn)品在各場景的集成應用。尤其在《行動規(guī)劃》中,政府的發(fā)展重點覆蓋智能語音行業(yè)的基礎層至應用層,發(fā)展。其次,語音識別、自然語言識別等核心技術(shù)的發(fā)展推動智能語音產(chǎn)品的商業(yè)化落地,目前,中國智能語音行業(yè)處于快速發(fā)展階段,各場景智能語音產(chǎn)品的商業(yè)化應用逐漸走向成熟。人工智能、語音識別技術(shù)等核心技術(shù)的快速發(fā)展推動下游各領域?qū)χ悄苷Z音的應用需求不斷擴大,吸引政府、資本的持續(xù)關(guān)注?;ヂ?lián)網(wǎng)企業(yè)、智能語音技術(shù)企業(yè)以及智能語音初創(chuàng)企業(yè)紛紛布局中國智能語音市場,推動智能語音行業(yè)市場規(guī)模持續(xù)擴容。沙利文預測,2023年中國智能語音行業(yè)市場規(guī)模將達到655.1億元。2.4中國智能語音行業(yè)產(chǎn)業(yè)鏈分析中國智能語音產(chǎn)業(yè)鏈的上游參與者分為基礎硬件供應商和軟件服務商兩類?;A硬件供應商主要為智能語音行業(yè)的上游提供人工智能芯片、傳感器等智能硬件。軟件服務商主要包括數(shù)據(jù)服務平臺服務商、云計算服務商等參與主體。行業(yè)中游的主要參與者主要包括智能語音科技企業(yè)、互聯(lián)網(wǎng)企業(yè)等參與主體。中國智能語音產(chǎn)業(yè)下游為智能語音產(chǎn)品及服務所覆蓋的應用領域,主要包括家居、醫(yī)療、教育等場景?;A硬件芯片其他軟件服務數(shù)據(jù)服務平臺云計算服務算法其他技術(shù)支持語音識別技術(shù)自然語言處理技術(shù)智能語音服務商智能語音科技企業(yè)互聯(lián)網(wǎng)企業(yè)其他智能家居智能可穿戴設備智能安防智能教育智能醫(yī)療智能客服上游:基礎設施供應商中游:智能語音服務商下游:應用領域來源:沙利文研究院繪制2.4.1中國智能語音行業(yè)產(chǎn)業(yè)鏈上游中國智能語音產(chǎn)業(yè)鏈上游基礎層主要為智能語音設備的運行提供計算力。上游的基礎設施供應商分為基礎硬件供應商和軟件服務商兩類?;A硬件供應商為行業(yè)上游提供人工智能人工智能芯片作為智能語音產(chǎn)業(yè)的核心,芯片的技術(shù)成熟度將影響智能語音設備的性能。人工智能芯片行業(yè)的技術(shù)門檻較高,海外廠商技術(shù)領先,中國人工智能芯片較依賴進口,導致智能語音服務商的制造成本居高不下,壓縮企業(yè)利潤空間。人工智能芯片按照不同應用場景可分為通用類AI芯片、云端AI芯片、終端AI芯片。在通用類AI芯片領域,美國英偉達的GPU芯片占據(jù)主導地位,中國AI芯片企業(yè)人工智能基礎層建設實力較薄弱,缺乏國際競爭力。在云端AI芯片領域,英特爾、亞馬遜等海外企業(yè)占據(jù)較大的市場份額,部分中國企業(yè)陸續(xù)布局云端推斷市場,但競爭實力較弱。在終端AI芯片領域,中國企業(yè)取得了較大的突破,代表企業(yè)包括寒武紀、地平線和深鑒科技等優(yōu)質(zhì)廠商。伴隨定制化芯片和類腦芯片的發(fā)展,中國人工智能芯片將逐漸打破海外芯片企業(yè)對中國市場的壟斷。>軟件服務巨頭占據(jù)算法行業(yè)較大的市場份額,中國僅有少數(shù)幾(2)云計算服務云計算服務為智能語音設備提供強大的運算能力和資源整合能力,提高了智能語音后臺技術(shù)>智能語音科技企業(yè)行業(yè)發(fā)展前期,智能語音科技企業(yè)以研發(fā)單一的智能語音技術(shù)為主企業(yè)收益。近年來,伴隨智能語音行業(yè)的發(fā)展,深度學習技術(shù)的應用、的積累、以及計算機算力的提升,使智能語音技術(shù)的調(diào)用得以簡化,技術(shù)門檻逐漸降低,導致智能語音科技企業(yè)的技術(shù)優(yōu)勢逐漸被削弱,智能語音科技術(shù)商轉(zhuǎn)型為全方位人工智能技術(shù)服務商。智能語音科技企業(yè)依托其下游各應用場景,通過為下游應用領域提供高端定制化>互聯(lián)網(wǎng)企業(yè)基于智能語音領域較好的發(fā)展前景,以BAT為代表的互聯(lián)網(wǎng)巨頭開始布局中國智能語的產(chǎn)品中,并利用其C端優(yōu)勢推動產(chǎn)品在下游各應用場景的落地?;ヂ?lián)網(wǎng)巨頭用戶流量優(yōu)>智能家居智能語音在醫(yī)療行業(yè)的應用主要體現(xiàn)在兩個方面:(1)利用智能語音技術(shù)實現(xiàn)病人電子電子病例系統(tǒng)下載完整的診療過程和病歷;(2)伴隨語音病歷的積累,醫(yī)院可以利用大數(shù)據(jù)>車載語音網(wǎng)系統(tǒng)。>智能教育 "平臺+內(nèi)容+終端+應用"的完整教育教學生態(tài)體系,推動教育信息化產(chǎn)業(yè)的快速發(fā)展。近準化輸出,且滿足24小時全天候在線服務。此外,智能客服的應用將最大程度上保障客戶智能語音領域的商業(yè)化應用較為廣泛,核心技術(shù)的發(fā)展推動各應用領域智能語音產(chǎn)品的落在語音合成技術(shù)中,最具代表性的語音合成方法為HMM模型,可以在不受人工干預深度學習是推動智能語音行業(yè)發(fā)展的關(guān)鍵性技術(shù),基于深度神經(jīng)網(wǎng)絡的語音識別技術(shù)和3.2.2云計算云計算服務為智能語音設備提供強大的運算能力和資源整合能力,提高智能語音后臺技術(shù)的智能化水平,使終端設備獲得云端服務器級別的運算能力,進一步提高語音識別能力,推動智能語音技術(shù)應用逐步落地。各智能語音服務商可以在傳統(tǒng)云計算結(jié)構(gòu)上建立新的服務層,提高智能語音設備在語音識別、自然語言處理等方面的核心能力。3.2.3大數(shù)據(jù)大數(shù)據(jù)技術(shù)的發(fā)展為智能語音后端數(shù)據(jù)存儲提供支持。大數(shù)據(jù)技術(shù)特有的分布式存儲技術(shù)能夠?qū)我惑w量巨大的語音數(shù)據(jù)文件切分成不同模塊,使其能夠存放于多臺計算機所建構(gòu)的集群中。多臺計算機之間通過相互通信將集群內(nèi)的存儲空間進行資源整合、數(shù)據(jù)虛擬化,并向外提供文件訪問服務的文件系統(tǒng)。大數(shù)據(jù)技術(shù)在智能語音領域的應用極大的降低了數(shù)據(jù)存儲所需的硬件成本。大數(shù)據(jù)技術(shù)可以對單一體量的數(shù)據(jù)進行切分、存儲、再整合,語音語料的數(shù)據(jù)存儲只需多個性能基本達標的存儲硬件,不再受限于計算機硬件的性能。大數(shù)據(jù)技術(shù)的應用可以保證所存儲數(shù)據(jù)的安全,由于大數(shù)據(jù)技術(shù)可以將單條語音數(shù)據(jù)重復分配至集群中的多個計算機中。當數(shù)據(jù)不慎丟失或破壞時,系統(tǒng)可以在集群中提取到完整大數(shù)據(jù)技術(shù)在智能語音領域降低了海量數(shù)據(jù)存儲的難度,同時替代了高性能存儲硬件的使用,為日益增長的進量數(shù)據(jù)以及原始數(shù)據(jù)的存儲提供技術(shù)支持。3.3語音交互的便利性優(yōu)勢語音交互技術(shù)的發(fā)展幫助用戶實現(xiàn)了本能表達,解放消費者感官的占用,優(yōu)化用戶的消語言交互是利用語言信息進行交互的技術(shù),在空間上打破了用戶與智能設備的距離限制。智能語音芯片等核心基礎元器件從投入到規(guī)模間所需資金投入較大且回報周期長,致力于基礎層核心元器件研發(fā)的企業(yè)需面臨較大的資金壓力。近年來,智能語音行業(yè)較好的發(fā)展前景吸引資本涌入,中國國內(nèi)資本持續(xù)加碼智能語智能語音基礎層核心元器件的技術(shù)瓶頸導致企業(yè)的國際競爭力不足。中國近90%的芯集地點變更導致的環(huán)境及背景噪音差異、語音信號傳輸載體方式多樣導致的傳輸信道差異,備無法保障智能語音系統(tǒng)對于用戶需求識別的準確率。自然語言處理(NLP)技術(shù)主要包含國務院國務院來源:沙利文研究院繪制2017年,政府為推動人工智能與實體經(jīng)濟的深度融合,積極落實“中國制造2025”和展三年行動計劃(2018-2020年》按照“系統(tǒng)布局、重點突破、協(xié)同創(chuàng)新、開放有序”的原則,為人工智能行業(yè)的發(fā)展提出了多方面的任務:(1)重點培育和發(fā)展車網(wǎng)聯(lián)汽車、智能經(jīng)濟社會的集成應用;(2)重點發(fā)展智能傳感器、神經(jīng)網(wǎng)絡芯片等關(guān)鍵環(huán)節(jié),夯實人工智能度日益增強。在《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020年》中,政府展。截至目前,中國已有逾20個省市出臺了人工智能產(chǎn)業(yè)鼓勵政策,其中江蘇、上海、廣6.1行業(yè)將大力發(fā)展深度集成語音AI芯片大的數(shù)據(jù)和運算量導致設備運行成本和功耗居高不下,且易出現(xiàn)語音交互“時延”的問題,影響用戶的消費體驗。AI芯片的算力決定了智能語音處理的速度以及語音交互的便利性,深度集成語音AI芯片利用主要算法和芯片架構(gòu)深度集成,將芯片和語音識別算法技術(shù)深度集成語音AI芯片擁有較大的數(shù)據(jù)存儲空間,無需將語音語料上傳至云端進行計算,保護信息安全性。深度集成語音AI芯片降低了設備的數(shù)據(jù)運算量及功耗,在節(jié)約設備運行成目前,中國智能語音行業(yè)進入快速成長期,語音技術(shù)在各下游場景的商業(yè)化應用日益廣泛,推動智能語音產(chǎn)業(yè)分工的細化以及科學技術(shù)的密集化。落地的智能語音產(chǎn)品會涉及眾多專利技術(shù),且分屬于不同所有者,眾多的專利請求、復雜的專利授權(quán)、以及高額的專利侵權(quán)賠償?shù)葐栴}將阻礙智能語音新技術(shù)的實踐運用。因此,中國智能語音行業(yè)有望建立智能語音專利池,引導和促進智能語音技術(shù)跨行業(yè)的實施和應用,推動語音相關(guān)產(chǎn)業(yè)的發(fā)智能語音專利池的建立可以有效降低交易成業(yè)間的專利糾紛、有利于專利技術(shù)的推廣應用。專利權(quán)人可以向智能語音專利池貢獻自己的核心專利,同時享有免費使用其他專利人專利的權(quán)利,免去了專利權(quán)相互交叉許可的交易成本。專利的有效管理消除了專利實施中重復授權(quán)的障礙,有效降低了專利許可中的交構(gòu)建智能語音專利池可以促進專利權(quán)人的相互合作,形成專利權(quán)人的共同開發(fā)研究智能語音產(chǎn)業(yè)的新型技術(shù),保持智能語音專利化。此外,智能語音專利池的建立將提高智能語音企業(yè)的國際競目前,中國國內(nèi)智能語音服務商共分為三類:(1)以百度為代表的互聯(lián)網(wǎng)巨頭;(2)以科大訊飛為代表的智能語音服務商;(3)以云知聲、圖靈機器為代表的深耕于垂直領域和細以科大訊飛為代表的中國國內(nèi)智能語音科技企業(yè)擁有較強的技術(shù)優(yōu)勢,該類型企業(yè)憑借頭為市場驅(qū)動型企業(yè),擁有較強的C端優(yōu)勢?;ヂ?lián)網(wǎng)企業(yè)利用其C端產(chǎn)品經(jīng)驗及用戶數(shù)據(jù)北京驀然認知科技有限公司成立于2016年5月,是以認知計算、自然語言理解技術(shù)為語音交互技術(shù)。企業(yè)的對話應用、對話式車機OS、智能語音座艙等核心產(chǎn)品主要應用于智>對話應用對話應用是企業(yè)打造車聯(lián)網(wǎng)應用生態(tài)的入口,企業(yè)致力于打造去APP化的語音代理,融合"VUI+GUI"的綜合性功能,以語音對流為軸心,實現(xiàn)跨場景融合,跨設備調(diào)用,連接>對話式車機OS圖像、大數(shù)據(jù)技術(shù)打造的車聯(lián)網(wǎng)場景一體化。對話式車機O

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論