AI的iPhone時刻云端算力奔騰終端泛音頻AIoT擴張

上傳人：b*** IP屬地：北京上傳時間：2023-04-09 格式：PPTX 頁數(shù)：18 大小：1.27MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩13頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

CONTENTS目錄2ChatGPT走向多模態(tài)：催生應用場景快速落地，帶來真正的需求驅(qū)動云端：算力需求顯著提升，外部限制下AI算力需要國產(chǎn)替代終端：應用場景打開，驅(qū)動智能音箱2.0升級，或成新需求帶動點3ChatGPT（Chat

Generative

Pre-trained

Transformer，聊天生成式預訓練器）是OpenAI開發(fā)的聊天機器人，于2022年11月推出。它建立在OpenAI開發(fā)的GPT-3大型語言模型之上，并使用監(jiān)督學習和強化學習（人類監(jiān)督）技術(shù)進行微調(diào)。雖然聊天機器人的核心功能是模仿人類談話者，但ChatGPT是多功能的。例如，它可以編寫和調(diào)試計算機程序，創(chuàng)作音樂、電視劇、童話故事和學生論文；回答測試問題(有時根據(jù)測試的不同，答題水平要高于平均水平)；寫詩和歌詞；模擬Linux系統(tǒng)；模擬整個聊天室等。ChatGPT背后的公司為OpenAI，成立于2015年，由特斯拉CEO埃隆·馬斯克、PayPal聯(lián)合創(chuàng)始人彼得·蒂爾、Linkedin創(chuàng)始人里德·霍夫曼、創(chuàng)業(yè)孵化器YCombinator總裁阿爾特曼（Sam

Altman）等人出資10億美元創(chuàng)立。OpenAI的誕生旨在開發(fā)通用人工智能（AGI）并造福人類。ChatGPT中的GPT（Generative

Pre-trained

Transformer），是OpenAI推出的深度學習模型。ChatGPT就是基于GPT-3.5版本的聊天機器人。截至2022年12月4日，OpenAI估計ChatGPT用戶已經(jīng)超過100萬；2023年1月，ChatGPT用戶超過1億，成為迄今增長最快的消費應用程序。2023年2月，OpenAI開始接受美國客戶注冊一項名為ChatGPT

Plus的高級服務，每月收費20美元；此外，OpenAI正計劃推出一個每月42美元的ChatGPT專業(yè)計劃，當需求較低時可以免費使用。2023年3月14日，OpenAI宣布正式推出

GPT-4。GPT-4

支持圖像+文本輸入，文本形式輸出，相比前兩代GPT-3和GPT3.5分別用于創(chuàng)造Dall-E

和ChatGPT，GPT-4提升了強大的識圖能力；文字輸入限制提升至

2.5

萬字；回答準確性顯著提高；能夠生成歌詞、創(chuàng)意文本，實現(xiàn)風格變化?！禩he

GPT-3

language

model,revolutionor

evolution?》（Beno?t

Favre，Géraldine

Damnati，F(xiàn)rédéric

Herledan等），中信證券研究部《6個問題，用專業(yè)視角帶你全方位了解ChatGPT》——甲子光年微信公眾號GPT系列模型的數(shù)據(jù)集訓練規(guī)模ChatGPT與GPT

1-3的技術(shù)對比1.1ChatGPT：基于OpenAI推出的深度學習模型GPT打造，成為迄今增長最快的消費應用程序4進入2023年，眾多科技巨頭相繼推出多模態(tài)模型，目前主要以視覺語言多模態(tài)模型為主。2月27日微軟推出的KOSMOS-1模型，能同時理解文字與圖像內(nèi)容，未來將會整合更多的輸入模式，如音頻、視頻；3月6日谷歌推出的palm-E為目前最大規(guī)模的視覺語言多模態(tài)模型(Visual

language

model，VLM)，其輸入包括視覺、連續(xù)狀態(tài)估計和文本，并可執(zhí)行包括機器人操作、視覺問題解答在內(nèi)的具體問題，此外還具備泛化能力，可以在未訓練的情況下推演執(zhí)行各種任務，比如可以操控機器人將“綠色物塊”推到未曾學習過的“烏龜”旁邊；3月14日OpenAI推出多模態(tài)的GPT-4版本，可以輸入圖像和文本然后輸出文本，微軟稍后即宣布其Microsoft

365將集成采用了GPT-4的生成式AI助手Copilot用于輔助辦公，Google則緊跟宣布其Workspace中的Gmail和Docs也將集成AI助手；百度于3月16日正式發(fā)布的文心一言亦已經(jīng)從單一的自然語言理解延伸到多模態(tài)，包括視覺、文檔、文圖、語音等多模態(tài)多功能，并可進行多模態(tài)生成?！禠anguage

Not

All

You

Need:

Aligning

Perception

with

Language

Models》（ShaohanHuang,

Dong,

Wenhui

Wang等）/10.48550/arXiv.2302.14045《PaLM-E:An

Embodied

Multimodal

Language

Model》——DannyDriess，

Fei

Xia，MehdiS.

Sajjadi等微軟KOSMOS-1多模輸入展示谷歌palm-E多模輸入展示1.2

多模態(tài)：從單一文字到“視覺+文圖+語音”，模型應用外延進一步拓寬5OpenAI發(fā)布GPT-3.5-turbo，接入成本降低90%。3月2日，OpenAI正式推出GPT-3.5-turbo，并開放API接口，第三方開發(fā)人員可以通過其API（應用程序編程接口）將ChatGPT直接集成到其應用程序和服務中，極大簡化了開發(fā)流程，此外ChatGPT

API價格為0.002美元/k

tokens（約2.7美元/百萬單詞），僅為GPT-3.5模型價格的十分之一。主要原因是以ChatGPT為代表的的AI模型單位算力成本不斷下降。ChatGPT延伸應用場景廣闊，

API開放需求旺盛。除網(wǎng)頁版ChatGPT的火爆外，下游應用場景對API開放的需求比較旺盛，諸多下游公司已將ChatGPT應用至不同場景。例如Snapchat、單詞背誦應用Quizlet、生鮮電商平臺Instacart、跨境電商平臺Shopify，此外DallE也采用了ChatGPT支持，Stable

Diffussion也使用了類似的支持技術(shù)。單位算力成本降低趨勢明確，AI產(chǎn)業(yè)逐步轉(zhuǎn)向需求驅(qū)動階段，推動AI芯片快速放量。AI相關(guān)基礎(chǔ)理論成形相對較早，但受技術(shù)、算力限制而發(fā)展緩慢，2016年以來AI產(chǎn)業(yè)逐步加速，主要由硬件基礎(chǔ)和訓練模型升級迭代推動，我們認為ChatGPT此次降價將推動整體市場接入AI計算更加平民化和普適化，以搜索引擎Y為例，2022年底，其使用AI提供搜索服務的成本比傳統(tǒng)互聯(lián)網(wǎng)搜索高出50%，但在GPT

3.5

turbo發(fā)布前，這一差距已降至5%，

隨著此次ChatGPT

API服務的大幅降價，使用AI提供搜索服務將具有可觀的經(jīng)濟效益。單位算力成本降低已為明確趨勢，盡管對應單位芯片需求降低，但隨著接入門檻降低、終端應用的快速落地和商業(yè)效益的逐步顯現(xiàn)，AI產(chǎn)業(yè)擦站將逐步轉(zhuǎn)向需求快速驅(qū)動階段，AI應用將成為

芯片需求放量的關(guān)鍵，交互、搜索、服務、醫(yī)藥、金融、無人駕駛等領(lǐng)域應用的快速擴張，將帶來長期更穩(wěn)定的AI芯片增量需求。ResearchGateSnapchat，Shopify蒸餾學習網(wǎng)絡示意圖Snapchat

for

Snapchat、Shopify對話購物功能示意圖1.3

算力平民化和普適化，催生應用場景快速落地，帶來真正的需求驅(qū)動6ChatGPT類應用或進一步提速全球算力規(guī)模增長，華為GIV預計至2030年突破56ZFlops，CAGR~65%，其中智能算力占比將超過90%。2021年全球算力規(guī)模已達615

Eflops，其中智能算力占比38%。在以萬物感知、萬物互聯(lián)、萬物智能為特征的數(shù)字經(jīng)濟時代背景下，根據(jù)中國信息通信研究院數(shù)據(jù)，2021年全球算力規(guī)模已達615

Eflops，同比+44%。構(gòu)成上看，基礎(chǔ)算力/智能算力/超算算力占比分別為60%/38%/2%。（智能算力：由基于GPU、通用AI芯片、FPGA、ASIC等加速計算平臺提供的算力，主要用于人工智能的訓練和推理計算，比如語音、圖像和視頻的處理）ChatGPT類應用的廣泛鋪開或進一步提速全球算力規(guī)模，華為GIV預計至2030年突破56ZFlops，屆時智能算力占比將超過90%。參考華為GIV預測，至2030年全球算力規(guī)模將保持CAGR~65%的高速增長態(tài)勢擴大至56

ZFlops（即56000

EFlops

），且智能算力將成為主要增長點，至2030年規(guī)模為52.5

Zflops，對應2021~2030年CAGR為80%。中國市場算力需求亦將快速增長，IDC預測2022~2026年CAGR~48%。根據(jù)IDC數(shù)據(jù)及其預測，2022年中國智能算力規(guī)模為268

EFlops

，至2026年有望擴張至1271

EFlops

。資料來源：中國信息通信研究院，IDC，Gartner，TOP500，華為

GIV（含預測）IDC（含預測），中信證券研究部全球算力規(guī)模及發(fā)展預測（單位：EFlops）中國智能算力需求規(guī)模及預測（單位：

EFlops

）1.4

算力發(fā)展：全球算力增加或提速，華為預計至2030年算力規(guī)模或擴大至56ZFlops，對應CAGR~65%61556000050010001500200025002016

2017

2018

2019

2020

20212030ECAGR~65%3275155268427641923127112001000800600400200014002019

2020

2021

2022

2023E2024E2025E2026ECAGR~48%7以音箱產(chǎn)品為例，從傳統(tǒng)音箱到智能音箱，智能化升級趨緩，市場需求疲弱ChatGPT技術(shù)可驅(qū)動智能音箱2.0升級，或成新需求帶動點建議關(guān)注前端成本占比高、具備技術(shù)壁壘的主控芯片及周邊芯片，后端關(guān)注有望與ChatGPT或其他大模型合作的品牌廠商及其ODMChatGPT類應用鋪開將驅(qū)動全球算力規(guī)模快速提升，并拉動AI芯片需求同頻增長當前AI芯片市場由海外龍頭如英偉達主導，國內(nèi)玩家快速追趕美政府嚴格限制對華銷售高端芯片，中長期AI芯片國產(chǎn)替代是必經(jīng)之路完善服務器核心生態(tài)的發(fā)展需求之下，國產(chǎn)CPU、配套元器件等也將迎來寶貴發(fā)展機遇1.5

AI產(chǎn)業(yè)新趨勢下，關(guān)注云端和終端投資機遇ChatGPT應用火熱云端：算力規(guī)?？焖僭鲩L終端：驅(qū)動智能化升級提速1、AI芯片：華為昇騰、寒武紀等國內(nèi)先行者2、CPU主核：龍芯中科、海光信息等3、服務器制造端：通富微電、長電科技等4、服務器配套元器件：PCB：滬電股份存儲、內(nèi)存接口芯片：江波龍、瀾起科技模擬芯片：裕太微、杰華特、納芯微等建議關(guān)注1、主芯片及周邊芯片：晶晨股份、恒玄科技、瑞芯微、全志科技、北京君正、樂鑫科技等2、后端環(huán)節(jié)：漫步者、國光電器、歌爾股份、百度、阿里、小米等資料來源：中信證券研究部CONTENTS目錄8ChatGPT走向多模態(tài)：催生應用場景快速落地，帶來真正的需求驅(qū)動云端：算力需求顯著提升，外部限制下AI算力需要國產(chǎn)替代終端：應用場景打開，驅(qū)動智能音箱2.0升級，或成新需求帶動點訓練需要密集的計算得到模型，沒有訓練，就不可能會有推理。訓練是指通過大數(shù)據(jù)訓練出一個復雜的神經(jīng)網(wǎng)絡模型，通過大量標記過的數(shù)據(jù)來訓練相應的系統(tǒng)得到模型，使其能夠適應特定的功能。訓練需要較高的計算性能、能夠處理海量的數(shù)據(jù)、具有一定的通用性，以便完成各種各樣的學習任務。推理是指利用訓練好的模型，使用新數(shù)據(jù)推理出各種結(jié)論。借助神經(jīng)網(wǎng)絡模型進行運算，利用輸入的新數(shù)據(jù)來一次性獲得正確結(jié)論的過程。根據(jù)承擔任務的不同，AI芯片可以分為：用于構(gòu)建神經(jīng)網(wǎng)絡模型的訓練芯片，利用神經(jīng)網(wǎng)絡模型進行推理預測的推理芯片。訓練，是指通過大數(shù)據(jù)訓練出一個復雜的神經(jīng)網(wǎng)絡模型，即用大量標記過的數(shù)據(jù)來“訓練”相應的系統(tǒng)，使之可以適應特定的功能。訓練需要極高的計算性能，需要較高的精度，訓練芯片受算力約束，一般只在云端部署。推理，是指利用訓練好的模型，使用新數(shù)據(jù)推理出各種結(jié)論。即借助現(xiàn)有神經(jīng)網(wǎng)絡模型進行運算，利用新的輸入數(shù)據(jù)來一次性獲得正確結(jié)論的過程，在云端和終端均有部署?！禢VIDIA

DEEP

LEARNING

INSTITUTE

》——英偉達AI

Conference《Lower

Numerical

Precision

DeepLearning

Inference

andTraining》——Intel

注：FP32和9BF16提供了相同的動態(tài)范圍，F(xiàn)P32由于更大的尾數(shù)提供了更高的精度。推理是將深度學習訓練成果投入使用的過程常見的32/16/8位數(shù)字格式對比2.1

人工智能的實現(xiàn)包括兩個環(huán)節(jié)：訓練(Training)和推理(Inference)訓練推理10AI芯片定義：從廣義上講，能運行AI算法的芯片都叫AI芯片，目前通用的CPU、GPU、FPGA、MLU、TPU等都能執(zhí)行AI算法，只是執(zhí)行效率差異較大；狹義上一般將AI芯片定義為“專門針對AI算法做了特殊加速設(shè)計的芯片”，例如谷歌TPU、寒武紀MLU等。在人工智能立夏將至的大趨勢下，芯片市場蛋糕越做越大，足以讓擁有不同功能和定位的芯片和平共存，百花齊放。后摩爾定律時代，我們強調(diào)AI芯片市場不是零和博弈。我們認為從深度學習到ChatGPT對AI芯片的需求是當仁不讓的市場主流，行業(yè)由上至下傳導形成明顯的價值擴張。在AI計算訓練端(主要用在云計算數(shù)據(jù)中心里)，以英偉達為代表的GPU是目前的第一選擇，但以谷歌TPU、寒武紀MLU為代表的通用AI芯片，也如雨后春筍，逐漸替代GPU的應用場景。AI計算推理端，以谷歌TPU、寒武紀370為代表的通用AI芯片，針對特定算法深度優(yōu)化和加速，將在確定性執(zhí)行模型(deterministic

executionmodel)的應用需求中發(fā)揮作用；次優(yōu)的GPU產(chǎn)品也可以應用于推理端；FPGA依靠電路級別的通用性，加上可編程性，適用于開發(fā)周期較短的IoT產(chǎn)品、傳感器數(shù)據(jù)預處理工作以及小型開發(fā)試錯升級迭代階段等。資料來源：英偉達、谷歌官網(wǎng)等，中信證券研究部2.2

AI芯片：后摩爾定律時代，AI

芯片市場百花齊放，各有所長幾種AI芯片的特點梳理11深度學習（Deep

Learning）：通過模仿人腦的機制來解釋數(shù)據(jù)，即通過組合低層特征形成更加抽象的高層特征（或?qū)傩灶悇e）。例如，在計算機視覺領(lǐng)域，深度學習算法從原始圖像去學習得到一個低層次表達，例如邊緣檢測器、小波濾波器等，然后在這些低層次表達的基礎(chǔ)上，通過線性或者非線性組合，來獲得一個高層次的表達。深度學習的本質(zhì)是高階張量，以矩陣運算為基礎(chǔ)。2016年3月，中科院計算所發(fā)布了全球首個能夠深度學習的神經(jīng)網(wǎng)絡處理器芯片，名為“寒武紀”。2021年寒武紀發(fā)布了第四代智能處理器架構(gòu)

MLUarch03，多算子硬件融合技術(shù)在軟件融合的基礎(chǔ)上大幅減少算子執(zhí)行時間。英偉達最初的GPGPU產(chǎn)品更多應用Cuda

core（全能型的浮點運算單元），在2017開始在GPU中加入了一塊專用的AI芯片叫Tensor

core（張量計算核心），TensorCore是專為執(zhí)行張量或矩陣運算而設(shè)計的專用執(zhí)行單元，Tensor

Core可實現(xiàn)混合精度計算，并能根據(jù)精度的降低動態(tài)調(diào)整算力，在保持準確性的同時提高吞吐量。

訓練：當今的

模型面臨著對話式

等更高層次的挑戰(zhàn)，這促使其復雜度呈爆炸式增長。在

FP32

精度下訓練這些大型模型可能需要數(shù)周甚至數(shù)月時間。Tensor

Core

能夠通過降低精度（如

Transformer

引擎中的

位浮點

(FP8)、Tensor

Float

(TF32)

和

FP16），在性能方面實現(xiàn)數(shù)量級的提高。從而在保持準確性的同時，大幅縮短從訓練到收斂的時間。AI

推理：優(yōu)秀的

推理加速器不僅要提供出色的性能，還要具備能夠加速不同神經(jīng)網(wǎng)絡的通用性，以及能夠使開發(fā)者構(gòu)建新神經(jīng)網(wǎng)絡的可編程性。要可靠地部署推理，關(guān)鍵的性能要求是在低延遲下實現(xiàn)高吞吐量，同時更大限度地提高利用率。Tensor

Core

提供了一整套精度（TF32、Bfloat16

浮點運算性能（BF16）、FP16、FP8

和

INT8），確保實現(xiàn)出色的通用性和性能。資料來源：英偉達技術(shù)論壇Tensor

Core輸入矩陣的精度為半精度，乘積可以達到完全精度2.3

深度學習：以矩陣運算為基礎(chǔ)，根據(jù)精度的需求動態(tài)調(diào)整算力資料來源：寒武紀官網(wǎng)寒武紀多種計算精度支持美政府針對高端GPU芯片的對華銷售實施限制，并嚴格設(shè)定界限阻礙先進計算芯片售往中國。2022年8月31日，美國政府要求英偉達的A100、H100系列和AMD的MI

250系列及未來的高端GPU產(chǎn)品，是否可以售賣給中國客戶，需要獲得美國政府的許可。這幾款芯片均為用于通用計算的高端GPGPU，通常應用在人工智能計算的云端訓練和推理場景和超級計算機中，在中國的客戶多為云計算廠商及高校和科研院所。2022年10月7日，美國商務部工業(yè)與安全局（BIS）公布了對于中國出口管制新規(guī)聲明，進一步加強了對中國出口相關(guān)產(chǎn)品的管制措施，聲明中包括更全面的與先進計算和半導體制造相關(guān)的限制措施，涉及高算力芯片、先進邏輯芯片和高端存儲芯片制造，其中具體的限制門檻包括：先進計算芯片：3A090規(guī)定GPU/ASIC/CPU/FPGA等各類芯片，滿足輸入輸出雙向傳輸速度高于600GB/s，同時每次操作的比特長度乘以TOPS計算出的處理性能合計為4800或更多算力的產(chǎn)品（注釋：英偉達A100的INT8算力是624TOPS@INT8，624*8=4992>4800，單精度（32位）浮點算力156TFLOPS，156*32=4992>4800，同時帶寬是600GB/s，觸碰到了紅線；此外，英偉達H100的INT8算力是2000TOPS，單精度浮點算力500TFLOPS，帶寬是900GB/s，更超越了紅線）。計算機部分：4A090包括計算機及計算機的相關(guān)的設(shè)備、組件以及附件，其中芯片也要按照3A090規(guī)定管理；對于超級計算機，在41,600立方英尺或者更小的體積內(nèi)，F(xiàn)P64（雙精度）理論計算能力是在100

petaFLOPS（每秒千萬億次浮點運算）或者以上，F(xiàn)P32（單精度）在200

petaFLOPS或者以上浮點算力的超級計算機，被定義為對中國管控的相關(guān)計算機。我們認為在需要大量算力的AI的訓練端和推理端中，短期可以采用海外廠商的次優(yōu)產(chǎn)品進行算力提升，中長期仍需國內(nèi)AI芯片滿足算力需求。短期來看，國內(nèi)可以選擇英偉達和AMD的還尚未被禁售的次優(yōu)GPU芯片。對于云端計算，算力既可以通過產(chǎn)品升級得以提升，也可以通過增加計算卡的數(shù)量進行提升，因此短期內(nèi)可以通過使用多個CPU、GPU和通用AI芯片來實現(xiàn)高端AI芯片的處理能力，基本可以滿足云端訓練和高性能計算的要求。中長期來看，AI芯片國產(chǎn)替代是必經(jīng)之路。短期內(nèi)可能會因為無法兼容在人工智能領(lǐng)域廣泛使用的CUDA架構(gòu)而遭遇替換困難，但是中長期來看，我們預計隨著國內(nèi)云廠商、芯片廠商、軟件開發(fā)者的密切配合，國產(chǎn)生態(tài)的實力會得到快速提升。因此，國產(chǎn)CPU、GPU、通用AI芯片將獲得前所未有的發(fā)展機會，通過軟硬件技術(shù)提升，逐步實現(xiàn)高端AI芯片的國產(chǎn)化替代，其中在軟硬件及自主生態(tài)布局較為領(lǐng)先的AI芯片企業(yè)預計將核心受益。122.4

AI芯片：美政府嚴格限制對華銷售高端芯片，國產(chǎn)替代是必經(jīng)之路132.5

AI芯片：國內(nèi)廠商在AI芯片領(lǐng)域的產(chǎn)品布局國內(nèi)GPGPU、AI加速芯片產(chǎn)品梳理及與國外GPGPU產(chǎn)品對比產(chǎn)品型號產(chǎn)品類型推出時間制造工藝封裝工藝FP64浮點算力(TFlops)FP32FP16/BF16INT8定點算力(TOPS)生態(tài)互聯(lián)帶寬顯存(GB)接口功耗華為昇騰910AI芯片20187nm320640MindSpore32PCIe

4.0310W寒武紀思元290AI芯片（訓練）20217nm2.5D

CoWoS支持支持512CambriconNeuware600GB/s32PCIe

4.0250W寒武紀思元370AI芯片（推訓一體）20217nmChiplet2496256CambriconNeuware614.4

GB/s48PCIe

4.0250W海光深算一號DCU20217nm5.4支持支持支持兼容

ROCm32PCIe

4.0350W天數(shù)智芯天垓100GPU20217nm2.5D

CoWoS37147295SIMT64

GB/s32PCIe

4.0250W壁仞B(yǎng)R100-OAMGPU20227nm2.5D

CoWoS25610242048BIRENSUPA512GB/s64PCle

5.0550W壁仞B(yǎng)R104-300W

PCleGPU20227nm2.5D

CoWoS1285121024BIRENSUPA192GB/s32PCle

5.0300W英偉達A100

PCleGPU20207nm9.719.5312624CUDA600GB/s80PCle

4.0400W英偉達H100

PCleGPU20224nm2.5D

CoWoS24488001600CUDA900GB/s80PCle

5.0350WAMD

InstinctMI100GPU20207nm11.523.192.3184.6AMD

ROCm276GB/s32PCle

4.0300WAMD

InstinctMI250XGPU20216nm2.5D

EFB47.947.9383362AMD

ROCm128PCle

4.0560W數(shù)據(jù)來源：各公司官網(wǎng)，中信證券研究部

注：未填寫的數(shù)字不代表不支持，而是未找到公開數(shù)據(jù)目前國內(nèi)廠商在計算性能和軟件生態(tài)上雖然和國際廠商還有一定的差距，但是差距已經(jīng)在逐漸縮短。此外，隨著國內(nèi)政策扶持及國內(nèi)廠商奮起直追，未來有望逐步實現(xiàn)AI芯片和AI算力國產(chǎn)化。目前國內(nèi)AI芯片主要廠商包括華為、寒武紀、海光、遂原、壁仞、天數(shù)智芯等，此外龍芯中科也在布局。華為昇騰及寒武紀均自主研發(fā)通用AI芯片，昇騰910、寒武紀思元290與英偉達A100均采用7nm先進制程工藝，在性能功耗比上較為接近，均面向AI訓練、推理任務。在峰值計算能力上，英偉達A100為624TOPS@INT8（非稀疏模式）；昇騰910和思元290為512TOPS@INT8。CONTENTS目錄14ChatGPT走向多模態(tài)：催生應用場景快速落地，帶來真正的需求驅(qū)動云端：算力需求顯著提升，外部限制下AI算力需要國產(chǎn)替代終端：應用場景打開，驅(qū)動智能音箱2.0升級，或成新需求帶動點15回顧過去，從傳統(tǒng)音箱到智能音箱，智能化升級趨緩，市場需求疲弱。從傳統(tǒng)音箱到HomePod、Echo、天貓精靈等智能音箱，是家居中智能語音的首個突破口，主要系音箱類產(chǎn)品具有傳統(tǒng)音頻播放功能的同時，具備較強的語音特性；產(chǎn)品功能相對集中、擺放靈活、成本可控、生產(chǎn)門檻不苛刻，新興廠商切入更加容易。從功能上看，智能音箱新增語音交互、聯(lián)網(wǎng)、家居控制、內(nèi)容服務等，核心技術(shù)門檻在于云端算力支持的語音交互能力，而這也是亞馬遜、谷歌、蘋果等科技巨頭的差異化優(yōu)勢。但近年來，智能音箱經(jīng)常出現(xiàn)聽不懂話、反應慢的狀況，或者對于相對復雜問題直接無法回答，只剩下聽音樂、定鬧鐘、問天氣等較為有限的互動，產(chǎn)品表現(xiàn)并不“智能”。Cary

Audio官網(wǎng)，百度官網(wǎng)，小米官網(wǎng)，中信證券研究部中信證券研究部繪制從傳統(tǒng)音箱到智能音箱功能的改變典型智能音箱語音交互流程圖3.1

智能終端：以智能音箱為例，“不夠智能”仍是當前產(chǎn)品的局限16ChatGPT通過大模型實現(xiàn)語義的深度理解，有望提升智能音箱等終端智能度，進而改善使用體驗。ChatGPT的核心是一個通過AI技術(shù)驅(qū)動的自然語言處理工具，重心在內(nèi)容，即大幅優(yōu)化用戶獲取內(nèi)容的流程，提升所獲內(nèi)容的精準度，從而改善語音助手的使用體驗。而對于未來的智能終端而言，我們預計約80%為語音輸入，20%為視頻輸入，未來語音/文本仍將是主流的交互方式，用戶語音→智能音箱等終端界面輸入→ChatGPT語義處理→智能音箱等終端輸出或是智能音箱新的業(yè)務形態(tài)。例如Bilibili用戶GPTHunt、Github用戶xiaogpt都已將ChatGPT接入音箱產(chǎn)品，實現(xiàn)更智能、更連續(xù)的交互。需要注意的是，智能音箱除了交互，另一個重要功能是控制，而使用ChatGPT功能時，目前只能實現(xiàn)多模態(tài)輸出

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

AI的iPhone時刻云端算力奔騰終端泛音頻AIoT擴張

文檔簡介

溫馨提示

最新文檔

評論

AI的iPhone時刻云端算力奔騰終端泛音頻AIoT擴張

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔