基于大屏的語音交互平臺競品分析報(bào)告

上傳人：1*** IP屬地：湖南上傳時(shí)間：2024-06-11 格式：DOCX 頁數(shù)：23 大?。?54.79KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩18頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于大屏的語音交互平臺競品分析報(bào)告分析目的：了解語音助手的市場現(xiàn)狀以及趨勢，分析競品產(chǎn)品定位，異同點(diǎn)，深化對產(chǎn)品的理解。分析范疇：訊飛語點(diǎn)機(jī)頂盒，小米電視，小愛同學(xué)，小度DuerOs電視伴侶。分析方法：智能語音交互技術(shù)解析，智能語音市場分析，競品主要產(chǎn)品功能，競品體驗(yàn)。一、語音交互技術(shù)語音交互（VUI）指的是人類與設(shè)備通過自然語音進(jìn)行信息的傳遞，一次完整的語音交互需要經(jīng)歷ASR→NLP→Skill→TTS的流程。語音識別（AutomaticSpeechRecognition）：簡稱ASR，是將聲音轉(zhuǎn)化成文字的過程。自然語言處理（NaturalLanguageProcessing）：簡稱NLP，是理解和處理文本的過程。語音合成（Text-To-Speech）：簡稱TTS，是把文本轉(zhuǎn)化成語音的過程。智能語音交互系統(tǒng)作為人工智能最為典型的應(yīng)用之一，可以將其技術(shù)拆分為如上圖部分。在實(shí)際的應(yīng)用場景中，對智能語音交互系統(tǒng)將提出特定的需求，本報(bào)告集中于家庭大屏場景下的交互分析。值得注意的是，不同公司在智能語音技術(shù)的優(yōu)勢各有不同。其中，以行業(yè)龍頭科大訊飛為代表，基于其深耕行業(yè)20載，在語音識別，聲紋識別，語種識別有著較大的優(yōu)勢。二、語音助手的市場現(xiàn)狀1.全球智能語音市場分析據(jù)統(tǒng)計(jì)數(shù)據(jù)顯示：2017年全球智能語音美元，同比增長30%。隨著移動(dòng)互聯(lián)網(wǎng)，智能家居，汽車，醫(yī)療等領(lǐng)域的應(yīng)用帶動(dòng)智能語音產(chǎn)業(yè)規(guī)模持續(xù)快速增長，預(yù)計(jì)2019年全球智能語音市場規(guī)模將突破170億美元。2.全球智能語音市場份額在全球智能語音市場份額占比中，Nuance全球市場占有率排名第一，市占率達(dá)到31.6%；其次為谷歌，市場占有率為28.4%；排名第三的是蘋果，市占率為15.4%；其后為微軟以及科大訊飛分別占有8.1%以及4.5%的市場份額。3.中國智能語音市場分析在人工智能和物聯(lián)網(wǎng)技術(shù)的發(fā)展帶領(lǐng)下，智能家居蓬勃興起，互聯(lián)網(wǎng)巨頭及新興創(chuàng)業(yè)公司從硬件、技術(shù)、系統(tǒng)解決方案等不同角度進(jìn)行布局，智能家居系統(tǒng)初步顯現(xiàn)。預(yù)計(jì)2019年，中國智能家具市場規(guī)模將超1900億，雖增長規(guī)模有所放緩，但市場規(guī)模將保持穩(wěn)定增長，2020年將突破2000億元。4.語音交互的市場規(guī)模以及市場格局目前，中國智能語音市場的主要份額被科大訊飛、百度以及蘋果分割。數(shù)據(jù)顯示：目前為止，中國智能語音市場，科大訊飛市場占有率排名第一，市占率達(dá)到44%；其次為百度，市場占有率為28%;排名第三的是的蘋果，市占率為7%；其后為Nuance以及小i機(jī)器人占有均為3.0%的市場份額（前瞻產(chǎn)業(yè)研究）。5.中國家庭大屏產(chǎn)業(yè)中國電視機(jī)出貨量在經(jīng)歷2011年到2016年的持續(xù)正向增長后，2017年?次出現(xiàn)負(fù)增長，這?情況將在2018年有所好轉(zhuǎn)。同時(shí)，互聯(lián)?電視機(jī)出貨量占?連年穩(wěn)定攀升，預(yù)計(jì)2018年將達(dá)到88%，全年出貨量近4000萬臺。2018年上半年，受世界杯效應(yīng)影響，銷量同?增長3.6%，但受降價(jià)影響，整體營業(yè)額下降2%，綜合測算全年銷量同?增長3%。以電視機(jī)為代表的大屏設(shè)備在智能家居中扮演著舉足輕重的作用，作為智能家居最為主要的交互方式——語音交互，智能語音交互系統(tǒng)有著巨大的市場規(guī)模和發(fā)展?jié)摿?，本?bào)告聚焦于基于大屏的智能語音交互系統(tǒng)進(jìn)行分析。相較于移動(dòng)端的場景不同，大屏設(shè)備的主要使用場景在室內(nèi)，集中于家庭。目標(biāo)客戶和使用場景的獨(dú)特性，使得智能語音應(yīng)用在該場景的使用具有特殊性。例如用戶在近景中，我要看語文。這里“看”理解成學(xué)還是點(diǎn)播，意味著完全不同的跳轉(zhuǎn)頁面。這對于語義理解提出了較高的要求。大屏設(shè)備作為智能家居概念的重要組成部分，也是語音交互的重要入口必然成為市場必爭的重要領(lǐng)域。當(dāng)我們轉(zhuǎn)向用戶思考IOT時(shí)代萬物互聯(lián)，意味著你身邊的任何設(shè)備都是聯(lián)網(wǎng)的，你可以在任何地方、任何時(shí)間和任何設(shè)備交互（IOT的4A原則），所以IOT將大大消弱了手機(jī)當(dāng)前的交互中心地位。當(dāng)云端開始普及之后，未來計(jì)算平臺的前臺，是一系列形態(tài)、功能各異的智能硬件，這些硬件或大或小，有屏或無屏，近場或遠(yuǎn)場，位置固定或隨身移動(dòng)。雖然千差萬別，用戶卻希望在任何一臺設(shè)備上的交互狀態(tài)可以云端同步至其他設(shè)備，用戶可能隨時(shí)在設(shè)備間切換，但希望交互進(jìn)程和數(shù)據(jù)流不被中斷、持續(xù)向前（集群智能）。那么，什么樣的交互能夠支撐這種切換需求、適配各類設(shè)備而又保證體驗(yàn)的一致性呢？從這個(gè)角度思考，我們很容易就能發(fā)現(xiàn)語音交互的獨(dú)特優(yōu)勢。6.語音交互的優(yōu)勢解放雙手、雙眼、雙腿，接觸空間限制，近場，遠(yuǎn)場可交互；指向明確，語義直達(dá)目標(biāo)，縮短使用路徑；自然簡單人性化，學(xué)習(xí)門檻低；可以1對1，也可以1對多；對設(shè)備要求低。二、競品對比分析概覽1.競品簡介小愛同學(xué)是小米科技于2017年7月26日推出的智能語音交互系統(tǒng)，適用于智能音響及其他智能設(shè)備，建構(gòu)于小愛開放平臺上，可以通過連接進(jìn)入米家物聯(lián)網(wǎng)系統(tǒng)控制所有的米家智能設(shè)備。小度電視伴侶是百度旗下的一款智能硬件產(chǎn)品，內(nèi)置DuerOS系統(tǒng)。從產(chǎn)品的概念來看，其以Soundbar的形態(tài)融入高性能4K機(jī)頂盒、智能音箱的功能，其三合一的創(chuàng)新產(chǎn)品形態(tài)，為客廳影音場景帶來了簡潔的一體性解決方案。依托全語音交互大屏吸引，小度電視伴侶可實(shí)現(xiàn)利用語音打開設(shè)置中的藍(lán)牙開關(guān)、調(diào)整圖像設(shè)置等等。如“打開WiFi”“打開設(shè)置”等等，或者根據(jù)界面顯示的內(nèi)容，用語音命令指定播放視頻內(nèi)容，如“播放第三個(gè)”“這個(gè)人是誰”等等。此外，小度電視伴侶還可以通過語音控制多款智能設(shè)備，如“打開落地?zé)簟薄按蜷_空調(diào)”等等。訊飛語點(diǎn)是由科大訊飛推出的智能語音交互系統(tǒng)，在2015年，科大訊飛重新定義了萬物互聯(lián)時(shí)代的人機(jī)交互標(biāo)準(zhǔn)，發(fā)布了對人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI。2016年，圍繞科大訊飛人工智能開放平臺的使用人次與創(chuàng)業(yè)團(tuán)隊(duì)成倍增長。截至2017年1月，訊飛開放平臺在線日服務(wù)量超30億人次，合作伙伴達(dá)到25萬家，用戶數(shù)超9.1億，以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)持續(xù)構(gòu)建。2.目標(biāo)客戶本報(bào)告針對基于家庭大屏的智能語音交互系統(tǒng)的競品分析，故家庭大屏用戶為本報(bào)告產(chǎn)品的目標(biāo)用戶?，F(xiàn)階段，主流大屏視頻接入主要分為DTV，IPTV和OTT三種類型，截?2018年Q2,DTV、OTT的中國城鎮(zhèn)家庭?屏保有量均超過2億戶，IPTV??保有量達(dá)到1.42億。其中，中國移動(dòng)魔百和在?東省有約1000萬的?戶成功轉(zhuǎn)為IPTV?戶，移動(dòng)OTT盒?并?IPTV陣營可能成為趨勢，那么有望在短期內(nèi)使IPTV總?戶也躍升?2億戶。受限于數(shù)據(jù)和資料，本報(bào)告對不同類型的大屏終端用戶不作區(qū)分，以所有大屏用戶作為目標(biāo)用戶作為分析對象。大屏用戶性別分布比例：大屏用戶年齡分布比例：大屏用戶學(xué)歷分布比例：基于現(xiàn)有數(shù)據(jù)可以分析得出，大屏用戶的用戶分布較為平均。與傳統(tǒng)的人工智能產(chǎn)品以年輕人、高學(xué)歷、男性為主要目標(biāo)用戶不同；基于大屏的智能語音交互系統(tǒng)用戶分布更為平均和廣泛，這種特點(diǎn)對具體場景的需求設(shè)計(jì)提出的新的要求。目標(biāo)用戶群體畫像不具有代表性，使得產(chǎn)品在設(shè)計(jì)和開發(fā)時(shí)需要更多的關(guān)注于場景而不是用戶，從該場景下的通用需求出發(fā)對產(chǎn)品進(jìn)行設(shè)計(jì)和迭代。三、評價(jià)指標(biāo)本報(bào)告基于智能語音交互系統(tǒng)使用場景，在大屏語音交互外結(jié)合了車載語音交互系統(tǒng)評價(jià)的標(biāo)準(zhǔn)，制定出對于大屏語音交互的性能評價(jià)體系。智能語音交互系統(tǒng)的性能需滿足以下指標(biāo)要求，其中喚醒率和誤喚醒率應(yīng)針對支持語音喚醒功能的語音交互系統(tǒng)。1.ASR1.1字準(zhǔn)確率該指標(biāo)用于評價(jià)語音交互系統(tǒng)輸出的人類可是別的文本信息正確率。對于中文普通話語音交互系統(tǒng)，該項(xiàng)指標(biāo)的評價(jià)分類如表1。1.2識別成功率若語音交互系統(tǒng)在既定的識別輪數(shù)內(nèi)完成了語音識別任務(wù)，則此次語音識別成功。語音識別成功與否應(yīng)該兼顧語音交互系統(tǒng)動(dòng)作的可靠性問題。若語音交互系統(tǒng)共進(jìn)行了R次特定的語音識別任務(wù)，其中SR次識別成功，F(xiàn)R次識別出現(xiàn)誤操作（包括但不限于未在既定的識別輪數(shù)內(nèi)完成，未完成識別前提前退出，識別無響應(yīng)）。則：識別成功率=SR/R*100%誤操作率=FR/R*100%識別成功率+誤操作率=11.3平均響應(yīng)時(shí)間該指標(biāo)用于評價(jià)語音交互系統(tǒng)對語音識別任務(wù)的響應(yīng)速度，離線語音交互系統(tǒng)的平均響應(yīng)時(shí)間應(yīng)≤2S；在線語音交互系統(tǒng)的評價(jià)響應(yīng)時(shí)間應(yīng)≤3S。1.4喚醒率若語音交互系統(tǒng)共進(jìn)行了W次喚醒，其中SW次成功喚醒。則：喚醒率=SW/W*100%該指標(biāo)用于評價(jià)語音交互系統(tǒng)在有背景噪音情況下，對語音喚醒操作的正確響應(yīng)情況。1.5誤喚醒率若車載語音交互系統(tǒng)在T小時(shí)內(nèi)出現(xiàn)FW次誤喚醒。則：誤喚醒率=FW/T次/小時(shí)該指標(biāo)用于評價(jià)語音交互系統(tǒng)在有背景噪音的情況下，對語音喚醒操作的錯(cuò)誤響應(yīng)情況。2.TTS主觀測試（自然度），以MOS為主：MOS（MeanOpinionScores），專家級評測（主觀）；1-5分，5分最好；ABX，普通用戶評測（主觀）。讓用戶來視聽兩個(gè)TTS系統(tǒng)，進(jìn)行對比，評測出聲音的自然度。3.交流體驗(yàn)3.1用戶任務(wù)達(dá)成率（表征產(chǎn)品功能是否有用以及功能覆蓋度）比如智能客服，如果這個(gè)Session最終是以接入人工操作為結(jié)束的，那基本就說明機(jī)器的回答有問題，或者重復(fù)提供給用戶相同答案等。3.2對話交互效率比如用戶完成一個(gè)任務(wù)的耗時(shí)、回復(fù)語對信息傳遞和動(dòng)作引導(dǎo)的效率、用戶進(jìn)行語音輸入的效率等（可能和打斷，One-shot等功能相關(guān)）。3.3根據(jù)對話系統(tǒng)的類型分類1）閑聊型CPS（ConversationsPerSession，平均單次對話輪數(shù)）。值得注意的是此指標(biāo)為微軟小冰最早期提出的指標(biāo)，并且是小冰內(nèi)部的（唯一）最重要指標(biāo)。相關(guān)性和新穎性。與原話題要有一定的相關(guān)性，但又不能是非常相似的話；話題終結(jié)者。如果機(jī)器說過這句話之后，通常用戶都不會繼續(xù)接了，那這句話就會給個(gè)負(fù)分。2）任務(wù)型留存率：雖然是傳統(tǒng)的指標(biāo)，但是能夠發(fā)現(xiàn)用戶有沒有形成這樣的使用習(xí)慣；留存的計(jì)算甚至可以精確到每個(gè)功能，然后進(jìn)一步根據(jù)功能區(qū)做歸類，看看用戶對哪類任務(wù)的接受程度較高，還可以從用戶的問句之中分析發(fā)出指令的習(xí)慣去針對性的優(yōu)化解析和對話過程；到后面積累的特征多了，評價(jià)機(jī)制建立起來了，就可以上強(qiáng)化學(xué)習(xí)；比如之前百度高考，教考生填報(bào)志愿，就是這么弄的。完成度（即前文提過的“用戶任務(wù)達(dá)成率”）：由于任務(wù)型最后總要去調(diào)一個(gè)接口或者觸發(fā)什么東西來完成任務(wù)，所以可以計(jì)算多少人進(jìn)入了這個(gè)對話單元，其中有多少人最后調(diào)了接口。相關(guān)的還有（每個(gè)任務(wù)）平均slot填入輪數(shù)或填充完整度。即完成一個(gè)任務(wù)，平均需要多少輪，平均填寫了百分之多少的槽位slot。3）問答型最終借助人工操作的比例；重復(fù)問同樣問題的比例；“沒答案”之類的比例。整體來說，行業(yè)一般PR宣傳時(shí)，會更多的提CPS，其他指標(biāo)看起來可能相對太瑣碎或不夠高大上。但是，實(shí)際工作中，可能CPS更多是面向閑聊型對話系統(tǒng)；而其他的場景，可能更應(yīng)該從“效果”出發(fā)。比如，如果小孩子哭了，機(jī)器人能夠“哭聲安慰”，沒必要對話那么多輪次，反而應(yīng)該越少越好。4.語料自然度和人性化的程度目前對于這類問題，一般是使用人工評估的方式進(jìn)行。這里的語料，通常不是單個(gè)句子，而是分為單輪的問答對或多輪的一個(gè)session。一般來講，評分范圍是1~5分：1分或2分：完全答非所問，以及含有不友好內(nèi)容或不適合語音播報(bào)的特殊內(nèi)容；3分：基本可用，問答邏輯正確；4分：能解決用戶問題且足夠精煉；5分：在4分基礎(chǔ)上，能讓人感受到情感及人設(shè)。另外，為了消除主觀偏差，采用多人標(biāo)注、去掉極端值的方式。四、產(chǎn)品功能對比一覽可以看出智能語音交互系統(tǒng)不僅僅局限于對智能家居設(shè)備的語言控制，不同廠家的語言交互產(chǎn)品都進(jìn)行了大量的功能開發(fā)，包括但不限于生活管理服務(wù)、游戲、生活百科、增值服務(wù)。如何挖掘出該場景下用戶的深度需求，抓住場景下用戶的痛點(diǎn)變成了各家廠商需要重點(diǎn)考慮的問題。五、產(chǎn)品體驗(yàn)細(xì)節(jié)對比1.功能體驗(yàn)根據(jù)影響用戶選擇語音助手線上調(diào)查問卷的結(jié)構(gòu)，語音識別準(zhǔn)確度，操作便捷，輸入速度快，功能多樣，詞庫豐富等因素，對比分析部分產(chǎn)品體驗(yàn)細(xì)節(jié)。本報(bào)告針對語音交互系統(tǒng)中常用的業(yè)務(wù)場景進(jìn)行了測試，通過對具體功能的體驗(yàn)對比進(jìn)一步了解?；谏鲜龉δ荏w驗(yàn)，訊飛語點(diǎn)在語音合成失真度和反應(yīng)時(shí)間上具有一定的優(yōu)勢，這主要得益于科大訊飛在語音技術(shù)上的技術(shù)積累。小度在語音交互時(shí)，更加側(cè)重音樂搜索功能。在“劉德華的無間道”和黃梅戲的交互中，小度均直接跳轉(zhuǎn)進(jìn)QQ語音界面。在開放式聊天中，小度的體驗(yàn)感較差。無法理解用戶意圖時(shí)，采用了相同的語音反饋使得用戶的使用欲望降低。小愛同學(xué)針對開發(fā)式問題，有著不同的反饋。在知識百科場景下，小度體現(xiàn)出了較強(qiáng)的優(yōu)勢。該優(yōu)勢得益于百度在搜索引擎中的長期積累。2.VUI體驗(yàn)（因機(jī)頂盒配置問題，無法體驗(yàn)）六、總結(jié)分析智能語音交互系統(tǒng)依然存在著發(fā)展空間，競爭進(jìn)入了白熱化階段。以本報(bào)告的三款產(chǎn)品為例，訊飛語點(diǎn)，小愛同學(xué)和小度分別擁有自身的發(fā)展優(yōu)勢。但值得一提的是，暫時(shí)未出現(xiàn)一款絕對領(lǐng)先的產(chǎn)品。各款產(chǎn)品都擁有自己優(yōu)勢和劣勢，特別地在某些特定的場景中體驗(yàn)分化極大?，F(xiàn)階段，語音交互系統(tǒng)中語音識別環(huán)節(jié)暫無較大差距。盡管在地方性語言識別上科大訊飛擁有著較大優(yōu)勢，由于其使用場景較為單一且目標(biāo)用戶數(shù)量有限，難以形成產(chǎn)品優(yōu)勢。在NLP階段，由于各款產(chǎn)品技術(shù)背景的差異，使得其在不同場景下存在獨(dú)特的優(yōu)勢。例如：訊飛語點(diǎn)的方言識

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于大屏的語音交互平臺競品分析報(bào)告

文檔簡介

溫馨提示

最新文檔

評論

基于大屏的語音交互平臺競品分析報(bào)告

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔