




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、3AI芯片行業(yè)概述1AI芯片應(yīng)用場景及市場需求分析2AI芯片行業(yè)產(chǎn)業(yè)鏈及商業(yè)模式分析3AI芯片行業(yè)發(fā)展展望4企業(yè)推薦5芯片工藝制程逼近物理極限;CPU芯片中大量晶體管用于 構(gòu)建邏輯控制和存儲單元,用 于構(gòu)建計算單元的晶體管占比 極小;為了保證兼容性,CPU構(gòu)架 演進(jìn)發(fā)展受限。關(guān)于人工智能芯片(AI芯片)AI芯片:基于矩陣運算、面向AI應(yīng)用的芯片設(shè)計方案1、定義:當(dāng)前AI芯片設(shè)計方案繁多,包括但不限于GPUFPGAASICDSP等。目前市場上的對于AI芯片并無明確統(tǒng)一的 定義,廣義上所有面向人工智能(Artificial Intelligence,AI)應(yīng)用的芯片都可以被稱為AI芯片。2、當(dāng)前A
2、I運算指以“深度學(xué)習(xí)” 為代表的神經(jīng)網(wǎng)絡(luò)算法,需要系統(tǒng)能夠高效處理大量非結(jié)構(gòu)化數(shù)據(jù)(文本、視頻、圖 像、語音等)。這需要硬件具有高效的線性代數(shù)運算能力,計算任務(wù)具有:單位計算任務(wù)簡單,邏輯控制難度要求低,但 并行運算量大、參數(shù)多的特點。對于芯片的多核并行運算、片上存儲、帶寬、低延時的訪存等提出了較高的需求。3、針對不同應(yīng)用場景,AI芯片還應(yīng)滿足:對主流AI算法框架兼容、可編程、可拓展、低功耗、體積及造價等需求。注釋:DL:Deep Learning,指深度學(xué)習(xí)。來源:Deep LearningIan Goodfellow、Yoshua Bengio、Aaron Courville;英偉達(dá)官網(wǎng)。
3、ControlALUALUALUALUCacheDRAMDRAMALU深度學(xué)習(xí)模型復(fù)雜度及規(guī)模對芯片算力需求激增42019.6 iResearch Inc.通過架構(gòu)設(shè)計AI芯片跨越工藝限制,算力效能對CPU實現(xiàn)大幅超越工藝提升緩慢,面對大規(guī)模 并行運算需求,需要對芯片 架構(gòu)進(jìn)行重新設(shè)計;GPU:開發(fā)即面向圖像處理等大規(guī)模運算需求;FPGA/ASIC:對緩存、計算 單元、連接進(jìn)行針對性優(yōu)化 設(shè)計。AI芯片實現(xiàn)算力提升注釋:PPA:POWER、PERFORMANCE、AREA,指芯片的算力、功耗和面積。 來源:Intel官網(wǎng);英偉達(dá)官網(wǎng);公開網(wǎng)絡(luò)數(shù)據(jù);艾瑞研究院。Intel-XEONIntel/A
4、ltera-Stratix 10SoCNvidia-TESLA V100Google-TPUv2AI芯片滿足AI應(yīng)用所需的“暴力計算”需求早在上世紀(jì)80年代,學(xué)術(shù)界已經(jīng)提出了相當(dāng)完善的人工智能算法模型,但直到近些年,模型的內(nèi)在價值也沒有被真正的實 現(xiàn)過。這主要是受限于硬件技術(shù)發(fā)展水平,難以提供可以支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練/推斷過程所需要的算力。直到近年來 GPUFPGAASIC等異構(gòu)計算芯片被投入應(yīng)用到AI應(yīng)用相關(guān)領(lǐng)域,解決了算力不足的問題。下圖以云計算場景為例,通過對全球幾大科技巨頭的代表性云端芯片產(chǎn)品計算性能對比,我們可以發(fā)現(xiàn)ASIC芯片相比起其 他幾種芯片,在計算效能、大小、成本等方面都有著
5、極大優(yōu)勢,未來隨著通用AI指令集架構(gòu)的開發(fā),預(yù)計會出現(xiàn)最優(yōu)配置 的AI計算芯片。典型的云端計算芯片算力表現(xiàn)比較Performance(TFLOPs)4515.70.001810CPUFPGA52019.6 iResearch Inc.GPUASIC優(yōu)點:通用性好,串行運算 能力強;適用于邏輯運算; 缺點:開發(fā)難度最大,大量 的晶體管用于構(gòu)建控制電路 和高速緩沖存儲器,運算單 元占比少,架構(gòu)限制了算力 的進(jìn)一步提升。優(yōu)點:相比CPU,由于其多 線程結(jié)構(gòu),擁有較強的并行 運算能力,與FPGA和ASIC 相比通用性更強;缺點:價格、功耗等不如 FPGA和ASIC,并行運算能 力在推理端無法完全發(fā)揮。
6、優(yōu)點:可對芯片硬件層進(jìn)行 靈活編譯,且功耗遠(yuǎn)遠(yuǎn)小于 CPU和GPU缺點:硬件編程語言難以掌 握,單個單元的計算能力比 較弱,硬件成本較高,電子 管冗余,功耗可進(jìn)一步壓縮。優(yōu)點:針對專門的任務(wù)進(jìn)行 架構(gòu)層的優(yōu)化設(shè)計,可實現(xiàn) PPA最優(yōu)化設(shè)計、量產(chǎn)后成 本最低;缺點:初始設(shè)計投入大,可 編程架構(gòu)設(shè)計難度較大,針 對性設(shè)計會限制芯片通用 性。AI芯片產(chǎn)品定位CPUGPUXPUDSPModemCamera ISP4K VideoHifi AudioLPDDR 4XUFSSensor ProcessorSecurity Engine來源:英偉達(dá)官網(wǎng),公開網(wǎng)絡(luò)數(shù)據(jù)。62019.6 iResearch In
7、c.AI芯片對CPU并非替代,與CPU共同滿足新時代計算需求目前來看,AI芯片并不能取代CPU的位置,正如GPU作為專用圖像處理器與CPU的共生關(guān)系,AI芯片將會作為CPU的AI運 算協(xié)處理器,專門處理AI應(yīng)用所需要的大并行矩陣計算需求,而CPU作為核心邏輯處理器,統(tǒng)一進(jìn)行任務(wù)調(diào)度。在服務(wù)器產(chǎn)品中,AI芯片被設(shè)計成計算板卡,通過主板上的PCIE接口與CPU相連;而在終端設(shè)備中,由于面積、功耗成本 等條件限制,AI芯片需要以IP形式被整合進(jìn)SoC系統(tǒng)級芯片,主要實現(xiàn)終端對計算力要求較低的AI推斷任務(wù)。服務(wù)器級產(chǎn)品中通過PCB上PCIE接口與CPU組成通過SoC封裝與CPU組成異構(gòu)計算單元 異構(gòu)計
8、算單元SoCAI芯片應(yīng)用場景算法下發(fā) 計算下沉云端數(shù)據(jù)回傳模型訓(xùn)練/推理邊緣+終端終 端 SoC+IP: DSP/GPU/ASIC邊緣智能服務(wù)器: GPU/FPGA/ASIC云數(shù)據(jù)機房智能服務(wù)器: GPU/FPGA/ASIC超大數(shù)據(jù)量本地處理斷網(wǎng)下獨立本地處理工業(yè)/ 農(nóng)業(yè)等家 庭數(shù)據(jù)安全、異構(gòu)、實時響應(yīng)基于對數(shù)據(jù)傳輸帶寬壓力、數(shù)據(jù)安全等因素的考量,邊緣和終端側(cè)承載了需要本地實時響應(yīng)的推理任務(wù)。需要獨立完成任務(wù)涵 蓋:數(shù)據(jù)收集、環(huán)境感知、人機交互以及部分的推理決策控制任務(wù)。自動駕駛智慧安防移動互聯(lián)網(wǎng)其他物聯(lián)網(wǎng)場景低功耗、數(shù)據(jù)安全AI芯片為AI應(yīng)用落地提供了商業(yè)化可行的算力解決方案在人工智能發(fā)展初
9、期,算法已經(jīng)通過數(shù)據(jù)中心(云端)在大數(shù)據(jù)分析、精準(zhǔn)營銷、商業(yè)決策等方面實現(xiàn)了成功地應(yīng)用落 地。而未來,智能化將會逐漸滲透進(jìn)入能源、交通、農(nóng)業(yè)、公共事業(yè)等更多行業(yè)的商業(yè)應(yīng)用場景中,除了部署在云端進(jìn)行 數(shù)據(jù)分析等工作,人工智能還需要下沉到攝像頭、交通工具、移動設(shè)備終端、工業(yè)設(shè)備終端中,與云計算中心協(xié)同實現(xiàn)本 地化的、低延時的人工智能應(yīng)用。考慮到任務(wù)算力需求,以及傳輸帶寬、數(shù)據(jù)安全、功耗、延時等客觀條件限制,現(xiàn)有云 端計算解決方案難以獨自滿足人工智能本地應(yīng)用落地計算需求,終端、邊緣場景同樣需要專用的AI計算單元。云端與邊緣側(cè)人工智能應(yīng)用場景對于AI芯片的需求云端負(fù)責(zé)承載智能數(shù)據(jù)分析、模型訓(xùn)練任務(wù)和部
10、分對傳輸帶寬要求不高的推理任務(wù)。來源:艾瑞研究院自主繪制。72019.6 iResearch Inc.20.23.439.120172022e云端訓(xùn)練AI芯片云端推斷AI芯片邊緣推斷AI芯片來源:AI芯片:應(yīng)用落地推動產(chǎn)品多樣化中金公司研究部2019.6 iResearch Inc.8AI芯片整體市場規(guī)模預(yù)測AI芯片市場規(guī)模未來5年增長有望達(dá)到10倍1、市場根據(jù)AI芯片功能及部署場景將AI芯片分為:訓(xùn)練/推斷、云端/邊緣兩個維度進(jìn)行劃分。訓(xùn)練端由于需要對大量原始 數(shù)據(jù)進(jìn)行運算處理,因此對于硬件的算力、計算精度,以及數(shù)據(jù)存儲和帶寬等都有較高要求,此外在云端的訓(xùn)練芯片應(yīng)該 有較好的通用性和可編程能
11、力。推理端對于硬件性能要求沒有推斷端高,實證證明一定范圍的低精度運算可達(dá)到同等推理 效果,但同時這要求模型訓(xùn)練精度要達(dá)到較高水平。2、根據(jù)中金公司研究部數(shù)據(jù)顯示,2017年,整體AI芯片市場規(guī)模達(dá)到62.7億美元,其中云端訓(xùn)練AI芯片20.2億美元,云 端推理芯片3.4億美元,邊緣計算AI芯片39.1億美元;到2022年,整體AI芯片市場規(guī)模將會達(dá)到596.2億美元,CAGR 57%,其中云端訓(xùn)練AI芯片172.1億美元,CAGR 53.5%,云端推斷芯片71.9億美元,CAGR 84.1%,邊緣計算AI芯片352.2億美元,CAGR 55.2%。注釋:AI芯片細(xì)分市場規(guī)模單位:億美元。201
12、7-2022年AI芯片細(xì)分市場規(guī)模預(yù)測CAGR:53.5%172.1CAGR:84.1%71.9CAGR:55.2%352.29AI芯片行業(yè)概述1AI芯片應(yīng)用場景及市場需求分析2AI芯片行業(yè)產(chǎn)業(yè)鏈及商業(yè)模式分析3AI芯片行業(yè)發(fā)展展望4企業(yè)推薦5102019.6 iResearch Inc.應(yīng)用場景:云計算來源:IBM。應(yīng)用 數(shù)據(jù) 運行 中間件 O/S 虛擬化 服務(wù)器 存儲 網(wǎng)絡(luò) 傳統(tǒng)IT應(yīng)用 數(shù)據(jù) 運行 中間件 O/S 虛擬化 服務(wù)器 存儲 網(wǎng)絡(luò) IaaS應(yīng)用 數(shù)據(jù) 運行 中間件 O/S 虛擬化 服務(wù)器 存儲 網(wǎng)絡(luò) PaaS應(yīng)用 數(shù)據(jù) 運行 中間件 O/S 虛擬化 服務(wù)器 存儲 網(wǎng)絡(luò) SaaS
13、云 廠 商 管 理客 戶 自 行 管 理云計算:共享規(guī)?;?jīng)濟(jì)效益有效降低邊際成本投入云計算是一種按使用計費的IT服務(wù)模型,實現(xiàn)對高可靠、可配置的計算資源池(服務(wù)器、存儲、網(wǎng)絡(luò)、應(yīng)用程序和服務(wù)) 的方便快捷的訪問,資源可通過最少的管理工作快速的配置和發(fā)布。云計算具有:資源池、廣泛的網(wǎng)絡(luò)訪問、按需自助服 務(wù)、快速彈性膨脹、測量服務(wù)等5個基本特征。云計算服務(wù)模式主要包括:IaaS、PaaS、SaaS:IAAS-提供基本的計算(虛擬或?qū)S糜布⒋鎯?、網(wǎng)絡(luò)資源,使用者在資源中部署運行任意應(yīng)用程序和操作系統(tǒng);PAAS-提供部署在云基礎(chǔ)設(shè)施上的編程語言、庫、服務(wù)和支持工具,為開發(fā)人員提供了一個自助服務(wù)門
14、戶而無需管理 底層基礎(chǔ)設(shè)施;SAAS-提供在云基礎(chǔ)設(shè)施上運行的應(yīng)用程序,程序運行管理皆由服務(wù)提供商負(fù)責(zé)。相比起傳統(tǒng)IT模式,云計算模式可實現(xiàn):降低用戶初始IT投資成本及IDC機房維護(hù)費用并實現(xiàn)資本效益配置最大化、IT資源快速彈性擴(kuò)展、數(shù)據(jù)價值的有效挖掘以及業(yè)務(wù)的快速上線部署等。云計算服務(wù)模型112019.6 iResearch Inc.2019.6 iResearch Inc.889.7952.5967.2988.7 1009.11107.9 1110.3 1145.17%2%2%2%10%0%3%201020112012201320142015201620172010-2017年全球服務(wù)器出
15、貨量及增速18%全球服務(wù)器出貨量(萬臺)同比(%)490046006700101001243168225494756-6%46%51%270%298%296%2014-2017年 Amazon&阿里巴巴云計算建設(shè)資本支出20162017阿里巴巴(百萬美元) 阿里巴巴(%)云計算中心服務(wù)器及硬件市場規(guī)模云計算發(fā)展帶動上游硬件市場需求近些年云廠商巨頭快速擴(kuò)張帶動了上游數(shù)據(jù)機房建設(shè)熱潮,雖然這會抵消部分企業(yè)自建機房及采購服務(wù)器的需求,但是這 部分需求并沒有消失而是轉(zhuǎn)移到了對云數(shù)據(jù)中心IT資源的需求上。中國云產(chǎn)業(yè)比美國發(fā)展晚24年左右,在全球云計算市 場中,美國占比達(dá)到54.1%,中國僅為5%。201
16、7年中國IT支出為2.4萬億人民幣,僅占全球IT總支出金額的9.92%,對應(yīng) 中國GDP水平仍有較大的提升空間。中國雖然起步較晚但發(fā)展迅猛,對比亞馬遜及阿里巴巴云計算資本支出數(shù)據(jù),可以看 到阿里巴巴在云計算領(lǐng)域支出總金額絕對值雖然少于亞馬遜,但增速卻顯著超過了亞馬遜的資本支出增速,這顯示了近年 來國內(nèi)加大對于計算資源基礎(chǔ)設(shè)施的建設(shè)力度,將極大受益于服務(wù)器廠商及上游芯片廠商業(yè)績。20142015Amazon(百萬美元) Amazon(%)來源:AMAZON、阿里巴巴公司年報披露數(shù)據(jù)。來源:Wind。云計算與人工智能服務(wù)注釋:AI服務(wù)器:指搭載了AI芯片、計算板卡并用于人工智能相關(guān)運算的服務(wù)器。
17、來源:AWS官網(wǎng)。云計算為AI開發(fā)部署提供多元化服務(wù)支持云計算服務(wù)供應(yīng)商可以向客戶提供包括計算、存儲、數(shù)據(jù)庫、分析、移動、物聯(lián)網(wǎng)和企業(yè)應(yīng)用等一系列多層級服務(wù)。在人 工智能應(yīng)用方面,由于人工智能(以深度學(xué)習(xí)為代表)的開發(fā)及應(yīng)用對于算力、數(shù)據(jù)有較大的需求,而云計算服務(wù)可以為 開發(fā)者提供AI計算芯片以及基于其開發(fā)的智能服務(wù)器集群等強大算力設(shè)施的租用,同時也可以為開發(fā)者提供PaaS級的開發(fā) 平臺或是直接提供已訓(xùn)練好的人工智能功能模塊等產(chǎn)品。通過多元化的服務(wù)模式,可以降低開發(fā)者的開發(fā)成本和產(chǎn)品開發(fā) 周期,為客戶進(jìn)行方便快捷的AI賦能。云計算核心產(chǎn)業(yè)鏈及云端人工智能服務(wù)模式軟件零售媒體游戲制造業(yè)金融房地產(chǎn)
18、廣告物流醫(yī)療教育通訊科技公共服務(wù)器云廠商DL-aaS:以云服務(wù)的形式提供高效的深度學(xué)習(xí)開發(fā)平臺AI-aaS:以云服務(wù)形式提供人工智能技術(shù)應(yīng)用AI InfrastructureAI FrameworksAI PlatformsAI Services122019.6 iResearch Inc.芯片客戶云計算與人工智能132019.6 iResearch Inc.任務(wù)硬件收費:$/h構(gòu)建標(biāo)準(zhǔn)實 例0.056.45GPU實例1.2634.27訓(xùn)練標(biāo)準(zhǔn)實 例0.136.45GPU實例1.2634.27模型 部署標(biāo)準(zhǔn)實 例0.076.45GPU實例1.2634.27云計算服務(wù)模式可顯著降低AI應(yīng)用開發(fā)、
19、部署成本云計算發(fā)展自互聯(lián)網(wǎng)廠商提升服務(wù)器使用效率(考慮為應(yīng)付黑色星期五、雙11等特殊日期訪問量激增而添置的巨量服務(wù)器 資源)而逐漸開始的服務(wù)器Web租賃服務(wù)。在云計算產(chǎn)業(yè)鏈中,云廠商負(fù)責(zé)基礎(chǔ)設(shè)施和云組織架構(gòu)的搭建,并為客戶提供 PaaS、SaaS服務(wù),具有極高的資本和技術(shù)門檻,在產(chǎn)業(yè)鏈中享有極大的話語權(quán)。如前文所述,在AI開發(fā)中,由于深度學(xué) 習(xí)模型開發(fā)及部署需要強大算力支持,需要專用的芯片及服務(wù)器支持。開發(fā)者如選擇自購AI服務(wù)器成本過高。通過云服務(wù) 模式,采取按需租用超算中心計算資源可極大降低項目期初資本投入同時也省卻了項目開發(fā)期間的硬件運維費用,實現(xiàn)資 本配置效率的最大化提升。來源:英偉達(dá)官
20、網(wǎng)、亞馬遜官網(wǎng)、公開網(wǎng)絡(luò)數(shù)據(jù)、專家訪問。服務(wù)器AI芯片CPU售價:$DGX-216*Tesl a V1002*intel Xeon Platinum 8168$399,00 0DGX-1(Volta)8*Tesla V1002*intel Xeon E5- 2698 v4$149,00 0DGX-1(Pascal)8*Tesla P1002*intel Xeon E5- 2698 v3$129,00 0部分云端AI智能服務(wù)器售價云計算AI服務(wù)收費(AWS)芯片功能售價:¥V100(GPU)訓(xùn)練10萬元,包含 硬件+軟件(驅(qū)動、許可、 保修)P4(GPU)推斷2萬元,包含 硬件+軟件FPGA推斷
21、45000元部分云端AI芯片售價云計算與AI芯片GPGPU+CUDA方案提供豐富的AI開發(fā)SDK及廣泛適用性英偉達(dá)除了在傳統(tǒng)獨立顯卡領(lǐng)域有近7成的市場份額,其在云計算智能服務(wù)器領(lǐng)域市場份額更是一家獨大。英偉達(dá)為客戶 提供了支持AI應(yīng)用開發(fā)的完備的TESLA GPU產(chǎn)品線,相比于傳統(tǒng)CPU服務(wù)器,在提供相同算力情況下,GPU服務(wù)器在成 本、空間占用和能耗分別為傳統(tǒng)方案的1/8、1/15和1/8。除了優(yōu)秀的硬件性能外,英偉達(dá)開發(fā)了基于GPU的“CUDA”開 發(fā)平臺,為開發(fā)者提供了豐富的開發(fā)軟件站SDK,支持現(xiàn)有的大部分的機器學(xué)習(xí)、深度學(xué)習(xí)開發(fā)框架 ,開發(fā)者可以在 CUDA平臺上使用自己熟悉的開發(fā)語
22、言進(jìn)行應(yīng)用開發(fā)。公司花費大量時間培養(yǎng)自己的開發(fā)生態(tài),包括與高校合作培訓(xùn)專業(yè) 人才、開展專業(yè)競賽,培養(yǎng)、發(fā)展英偉達(dá)“GPU+CUDA”的開發(fā)者群體,形成了相當(dāng)可觀的產(chǎn)品使用人群,構(gòu)建了當(dāng)前 英偉達(dá)在人工智能領(lǐng)域的霸主地位。英偉達(dá)云端軟硬件一體解決方案CUDA英偉達(dá)-Datacenter AI purpose GPUs英偉達(dá) TESLA P4AI-INFERENCE英偉達(dá) TESLA P40AI-INFERENCE/ GRAPHICS英偉達(dá) TESLA V100AI-TRAINING/ ACCELERATERDeep LearningMath/Linear AlgebraSiganl/Imge/V
23、ideoParallel AlgorithmcuBLASCUDA MathcuRANDcuFFTcuFFTNVgraphDeep Learning Framework Support:LanguageSupport:來源:英偉達(dá)公司官網(wǎng)。142019.6 iResearch Inc.152019.6 iResearch Inc.2019.6 iResearch Inc.6.713.787.50.03.435.318.362.5 57.0105.96.314.835.766.098.80.00.85.319.737.020162020e2016-2020年全球AI服務(wù)器及AI芯片市場規(guī)模2017
24、2018e2019eAI訓(xùn)練服務(wù)器(萬臺) AI推斷服務(wù)器(萬臺)AI訓(xùn)練芯片市場規(guī)模(億美元) AI推斷芯片市場規(guī)模(億美元)云計算中心AI芯片市場規(guī)模及份額GPU并非完美,市場期待替代GPU的云端AI芯片解決方案當(dāng)前全球云計算AI芯片市場英偉達(dá)一家獨大(尤其是訓(xùn)練端),主要原因是英偉達(dá)GPU產(chǎn)品線豐富,編程環(huán)境成熟,產(chǎn)品 支持市場上主要的開發(fā)框架和語言,產(chǎn)品廣受AI開發(fā)者好評。但同時其產(chǎn)品也存在著功耗偏大、價格昂貴等問題(V100芯 片售價達(dá)10萬元,DGX系列服務(wù)器售價過百萬元)?;诖耍鞔笤茝S商紛紛提出自己的AI芯片開發(fā)計劃以擺脫上游AI芯 片供貨商一家獨大的壟斷市場情況。此外根據(jù)數(shù)
25、據(jù)顯示,推斷市場未來增速和空間將會高于訓(xùn)練端市場,而GPU芯片并不 善于推斷任務(wù),因此,在當(dāng)前智能服務(wù)器滲透率尚低,GPU產(chǎn)品并非完美解決方案的情況下,我們認(rèn)為對于其他AI芯片廠 商云計算中心市場依然存在著較大的市場空間可以進(jìn)入。來源:IDC, Gartner。來源:IDC。90.0%90.0%80.0%75.0%70.0%65.0%60.0%60.0%50.0%40.0%35.0%30.0%30.0%2016-2022年全球云端AI芯片GPU市 場份額占比201620172018e2019e云端訓(xùn)練GPU占比(%)2020e2021e2022e云端推理GPU占比(%)云計算AI芯片發(fā)展趨勢來
26、源:艾瑞研究院自主繪制。XPU forCloud算力更大的存儲及更高的數(shù) 據(jù)訪存效率云端開發(fā)平臺軟件開發(fā)工具鏈芯片間實現(xiàn)高速互聯(lián), 靈活應(yīng)對訪問計算力需 求的彈性變動功耗通用性、可編程看好基于AI專用指令集的可編程ASIC芯片及配套開發(fā)平臺如前文所述,當(dāng)前在云端場景下被最廣泛應(yīng)用的AI芯片是英偉達(dá)的GPU,主要原因是:強大的并行計算能力(相比 CPU)、通用性以及成熟的開發(fā)環(huán)境。但是GPU也并非是完美無缺的解決方案,明顯的缺點如:高能耗以及高昂的價格。 目前包括創(chuàng)業(yè)公司、科技巨頭等都在積極尋找GPU的替代方案,希望實現(xiàn):既具有GPU通用性、又具有更好的能效和算力 表現(xiàn)的通用、可編程產(chǎn)品。當(dāng)前市
27、場上典型的替代方案包括Google的TPU系列以及寒武紀(jì)的MLU系列產(chǎn)品。云計算場景AI芯片設(shè)計思路及發(fā)展趨勢調(diào)整存儲單元與計算單元之間的距離,降低數(shù)據(jù)運算功耗為開發(fā)者提供易使用的 開發(fā)平臺降低對片外存儲依賴、盡量使用片 上存儲(SRAM、Cache)通用性,對多數(shù)AI開 發(fā)模型及編程框架形成 通用支持架構(gòu)設(shè)計:通過對主流算法模型進(jìn)行細(xì)?;?抽象出基礎(chǔ)算子,總結(jié)運算邏輯,對硬件進(jìn)行 針對性優(yōu)化設(shè)計,實現(xiàn)對主流算法模型的支持指令集開發(fā):開發(fā)專用的MLNNs指 令集,降低開發(fā)者編程難度采用新的存儲技術(shù),如片內(nèi)計算162019.6 iResearch Inc.應(yīng)用場景:邊緣計算來源:邊緣計算與云計
28、算協(xié)同產(chǎn)業(yè)白皮書工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟云計算層SaaS邊緣層EC-PaaSEC-IaaS設(shè)備接入 協(xié)議解析172019.6 iResearch Inc.數(shù)據(jù)回傳處理 (*部分場景下的數(shù)據(jù)處理需要在邊緣側(cè)完成)邊緣網(wǎng)關(guān) 邊緣控制器 邊緣云邊緣傳感器EC-SaaS預(yù)測維護(hù) 能效優(yōu)化 質(zhì)量提升 vFW vLB服務(wù)協(xié)同業(yè)務(wù)管理協(xié)同 應(yīng)用管理協(xié)同智能協(xié)同 數(shù)據(jù)協(xié)同資源協(xié)同應(yīng)用實例應(yīng)用部署軟硬件環(huán)境 分布式智能/推理 數(shù)據(jù)采集與分析鏈接數(shù)字世界現(xiàn)場設(shè)備物理世界業(yè)務(wù)編排PaaSIaaS應(yīng)用開發(fā)管理數(shù)據(jù)分析/訓(xùn)練邊云協(xié)同共同實現(xiàn)萬物互聯(lián)時代計算任務(wù)需求邊緣計算:在靠近數(shù)據(jù)源頭的網(wǎng)絡(luò)邊緣側(cè),融合網(wǎng)絡(luò)/計算/存儲/應(yīng)
29、用等核心能力的分布式開放平臺,就近提供邊緣智能服 務(wù),具有海量聯(lián)接、實時業(yè)務(wù)處理、數(shù)據(jù)優(yōu)化、應(yīng)用智能、安全與隱私保護(hù)等特點。邊緣計算對軟硬件系統(tǒng)提出了:1) 海量異構(gòu)聯(lián)接、2)計算任務(wù)在邊緣節(jié)點實時處理響應(yīng)、3)硬件功耗/成本/空間/抗干擾等有嚴(yán)格要求、4)分布式資源的動態(tài)調(diào)度與統(tǒng)一管理、5)支持聯(lián)接/數(shù)據(jù)/管理/控制/應(yīng)用/安全等方面的協(xié)同等要求。邊云協(xié)同放大邊緣計算及云計算價值: 邊緣計算承擔(dān)數(shù)據(jù)采集和部分的數(shù)據(jù)處理任務(wù),支撐云端應(yīng)用,而云計算通過大數(shù)據(jù)分析,優(yōu)化輸出的業(yè)務(wù)規(guī)則或模型, 下發(fā)到邊緣側(cè),為終端提供運行規(guī)則/模型。邊云協(xié)同組織架構(gòu)圖邊緣計算場景與人工智能芯片物聯(lián)網(wǎng)場景移動互聯(lián)網(wǎng)
30、智能安防自動駕駛?cè)蝿?wù)描述: 機器視覺 語音識別/自然語義處理1、圖像檢測2、視頻檢測3、語音識別4、語義理解1、照相-場景識別2、照相-美化3、AR應(yīng)用4、語音助手1、圖像檢測2、視頻檢測1、圖像語義分割2、數(shù)據(jù)融合 3、Slam定位 4、路徑規(guī)劃性 能 要 求算力Performance1TOPs18TOPs420TOPs204000TOPs(L3L5)能耗Power接入設(shè)備部署現(xiàn)場電源消費級聚合物鋰電池 2,0005,000mAh接入設(shè)備部署現(xiàn)場電源動力級硬殼鋰電池(組) 200,000500,000mAh面積Area高(SoC)極高(SoC)高低(SoC、Server)中 (PCIE co
31、ntains multiple SoC Chips)成本控制Cost高極高高低(IPC,NVR)中可靠性Reliability高(工業(yè))/中(家用)中高極高代表廠商邊緣側(cè)場景繁雜,綜合考量AI芯片 “PPACR”在邊緣計算場景,AI芯片主要承擔(dān)推斷任務(wù),通過將終端設(shè)備上的傳感器(麥克風(fēng)陣列、攝像頭等)收集的數(shù)據(jù)代入訓(xùn)練 好的模型推理得出推斷結(jié)果。由于邊緣側(cè)場景多種多樣、各不相同,對于計算硬件的考量也不盡相同,芯片可以是IP in SoC,也可以是邊緣服務(wù)器,對于算力和能耗等性能需求也有大有小。因此不同于云端場景的“高端、通用”,應(yīng)用于邊 緣側(cè)的計算芯片需要針對特殊場景進(jìn)行針對性設(shè)計以實現(xiàn)最優(yōu)的
32、解決方案。不同邊緣計算場景對AI芯片“PPACR”性能考察要求來源:網(wǎng)絡(luò)公開數(shù)據(jù)、艾瑞研究院自主繪制。182019.6 iResearch Inc.192019.6 iResearch Inc.2019.6 iResearch Inc.28921589181136611341-25% 42% -24%172%112% 6%481%-8%1349%-82%2018年城市級安防項目招標(biāo)統(tǒng)計招標(biāo)金額(億元)招標(biāo)同比(%)55276684123081883458110001380017100205002660053%80%83%25%24%20%15%2360013%201720182019e2020
33、e2021e2022e2017-2022年攝像頭AI芯片市場空間402%148%AI攝像頭出貨(萬個)AI攝像頭同比(%)IP攝像頭出貨(萬個)IP攝像頭同比(%)應(yīng)用場景1:智慧安防市場當(dāng)前國內(nèi)基于G端需求最明確的邊緣計算AI應(yīng)用場景在國內(nèi),安防市場是最為確定的邊緣側(cè)AI應(yīng)用場景,主要原因是大量的監(jiān)控視頻數(shù)據(jù)分析對人力的需求與當(dāng)前基層人力缺 失、人力成本上升之間的顯著矛盾。需求端來自于包括政府、大中企業(yè)以及個人安防需求,主要市場需求來自于政府,包 括平安城市、智慧交通管控、智慧城市、雪亮工程等,其中公安部“雪亮工程” 提出到2020年實現(xiàn)“全域覆蓋、全網(wǎng)共 享、全時可用、全程可控” ,智能攝
34、像頭的應(yīng)用可以有效解決基層數(shù)據(jù)傳輸帶寬壓力以及基層警力人員缺失等問題,預(yù)計 “雪亮工程”等政府項目將會對智能安防攝像頭市場帶來較大的驅(qū)動作用。來源:AI智道,不完全統(tǒng)計。來源:IDC。智慧安防與AI芯片前端:ISP核心芯片,對原始圖像信號進(jìn)行降噪、曝光調(diào) 整,決定最終成像效果的好壞;模擬監(jiān)控系統(tǒng)后端:DVR SoC將模擬音頻信號數(shù)字化、編碼壓縮與存儲(A/D芯片和 視頻編解碼芯片)。數(shù)字/網(wǎng)絡(luò)高清前端:IPC SoC集成CPU、ISP、高壓縮比視頻編解碼模塊、網(wǎng) 絡(luò)接口、加密模塊、內(nèi)存子系統(tǒng)等;后端:NVR SoC接收攝像機的IP碼流進(jìn)行編解碼、存儲,適用于環(huán)境復(fù) 雜和分散的大型監(jiān)控系統(tǒng)。智能
35、化升級前端:IPC SoC+AI-IP/獨立AI芯片-在現(xiàn)有IPC上集成算法實現(xiàn)識別任務(wù);-SoC中集成協(xié)處理器或增加獨立AI芯片進(jìn)行結(jié)構(gòu) 化分析或運行DL算法提升檢出率;公安交通智能樓宇金融能源司法文教衛(wèi)來源:艾瑞研究院自主繪制。結(jié)構(gòu)化分析攝像機智能網(wǎng)絡(luò)攝像機后端:GPU/ASIC智能服務(wù)器將智能推理功能集成在邊緣的服務(wù)器級產(chǎn)品中,實現(xiàn)更 大規(guī)模的人工智能應(yīng)用。如:GPU服務(wù)器或最新ASIC服 務(wù)器方案。深度學(xué)習(xí)攝像機202019.6 iResearch Inc.AI芯片為攝像頭提供邊緣智能解決方案降低數(shù)據(jù)回傳需求安防攝像頭發(fā)展經(jīng)歷了由模擬向數(shù)字化、數(shù)字化高清到現(xiàn)在的數(shù)字化智能方向的發(fā)展,最
36、新的智能攝像頭除了實現(xiàn)簡單的 錄、存功能外,還可以實現(xiàn)結(jié)構(gòu)化圖像數(shù)據(jù)分析。安防攝像頭一天可產(chǎn)生20GB數(shù)據(jù),若將全部數(shù)據(jù)回傳到云數(shù)據(jù)中心將 會對網(wǎng)絡(luò)帶寬和數(shù)據(jù)中心資源造成極大占用。通過在攝像頭終端、網(wǎng)絡(luò)邊緣側(cè)加裝AI芯片,實現(xiàn)對攝像頭數(shù)據(jù)的本地化實 時處理,經(jīng)過結(jié)構(gòu)化處理、關(guān)鍵信息提取,僅將帶有關(guān)鍵信息的數(shù)據(jù)回傳后方,將會大大降低網(wǎng)絡(luò)傳輸帶寬壓力。當(dāng)前主 流解決方案分為:前端攝像頭設(shè)備內(nèi)集成AI芯片和在邊緣側(cè)采取智能服務(wù)器級產(chǎn)品。前端芯片在設(shè)計上需要平衡面積、功 耗、成本、可靠性等問題,最好采取低功耗、低成本解決方案(如:DSP、ASIC);邊緣側(cè)限制更少,可以采取能夠進(jìn)行 更大規(guī)模數(shù)據(jù)處理任
37、務(wù)的服務(wù)器級產(chǎn)品(如:GPU、ASIC)。AI芯片在智能安防攝像頭中的應(yīng)用智慧安防芯片市場78%22%前端IPC芯片市場份額后端DVR/NVR市場份額市場考驗廠商綜合服務(wù)能力,海外廠商逐步退出國內(nèi)市場攝像頭由于任務(wù)相對單一,行業(yè)內(nèi)產(chǎn)品同質(zhì)化程度較高,導(dǎo)致行業(yè)競爭激烈。智能安防芯片領(lǐng)域參與者包括國際一線廠商 如:英偉達(dá)、華為、安霸、TI等,還有創(chuàng)業(yè)公司如:比特大陸、地平線、云天勵飛等,以及北京君正、國科微等傳統(tǒng)安防 半導(dǎo)體企業(yè),甚至下游的安防廠商如??低?、大華股份也開始自研AI芯片產(chǎn)品。英偉達(dá)作為AI巨頭在安防領(lǐng)域有前、后 端完整軟硬件解決方案,國內(nèi)諸多安防廠商均采購其產(chǎn)品;華為推出了Hi35
38、59等智能芯片,雖然算力性能表現(xiàn)暫時不如英 偉達(dá),但作為在國內(nèi)傳統(tǒng)IPC市場有近7成市場份額的企業(yè),基于其深厚的市場積累,能夠為客戶提供完善的、高性價比的 解決方案。在面臨越來越多的企業(yè)涌入安防芯片市場的情況下,行業(yè)客戶傾向于采購?fù)暾姆桨?,因此除了考察單一芯產(chǎn) 品性能以外,更加考察企業(yè)的行業(yè)積累及整體解決方案設(shè)計及交付能力。來源:CPS中安網(wǎng)、IHS、公開網(wǎng)絡(luò)數(shù)據(jù)。62%8%3%7%2016年IPC視頻編解碼芯片 市場份額20%海思AmbarellaTINXP其他212019.6 iResearch Inc.廠商產(chǎn)品算力前 端英偉達(dá)JETSON TX1- GPU1TOPs華為海思Hi3559
39、AV1004TOPs北京君正T01-ASIC地平線旭日1TOPs后 端英偉達(dá)TESLA P45.5TFlops比特大陸B(tài)M16823TFlops主要安防AI芯片解決方案2016年安防芯片市場份額應(yīng)用場景2:移動互聯(lián)網(wǎng)市場13.014.314.714.714.915.015.20.41.54.63.06.16.810%3%0%1%15.2 1%15.2 0%0%102%1%51%33%13%201420152016全球智能手機出貨量(億部)20172018AI手機出貨量(億部)2019e2020e智能手機 CAGR(%)2021e2022eAI手機 CAGR(%)來源:IDC。222019.6
40、iResearch Inc.AI芯片為移動互聯(lián)網(wǎng)消費電子類產(chǎn)品帶來新增市場空間智能手機在經(jīng)歷了近10年的高速增長后,市場已趨于飽和,出貨增速趨近于0,行業(yè)逐漸轉(zhuǎn)為存量市場。近年來,一批國 產(chǎn)廠商在產(chǎn)品質(zhì)量上逐漸達(dá)到了第一梯隊的水平,進(jìn)一步加劇了頭部市場的競爭。為實現(xiàn)差異化競爭,各廠商加大手機AI 功能的開發(fā),通過在手機SoC芯片中植入AI芯片實現(xiàn)在低功耗情況下AI功能的高效運行。隨著未來競爭進(jìn)一步加劇,以及 產(chǎn)量上升所帶來的成本下降,預(yù)計AI芯片將會進(jìn)一步滲透進(jìn)入到中等機型市場,市場空間廣闊。移動端AI芯片市場不止于 智能手機,潛在市場還包括:智能手環(huán)/手表、VR/AR眼鏡等市場。AI芯片在圖
41、像及語音方面的能力可能會帶來未來人機交 互方式的改變并進(jìn)一步提升顯示屏、攝像頭的能力,有可能在未來改變移動端產(chǎn)品。2014-2022年全球智能手機出貨量237%移動互聯(lián)網(wǎng)與AI芯片智能手機:SoC內(nèi)嵌AI IP實現(xiàn)手機AI功能的高效執(zhí)行通過云數(shù)據(jù)中心做手機端AI推理任務(wù)面臨網(wǎng)絡(luò)帶寬延遲瓶頸的問題,嚴(yán)重影響用戶使用體驗,而CPU適合邏輯運算,但并 不適合AI并行運算任務(wù),目前市場上流行在SoC中增加協(xié)處理器或?qū)S眉铀賳卧獊韴?zhí)行AI任務(wù)。以智能手機為代表的移動 互聯(lián)網(wǎng)終端是一個多傳感器融合的綜合數(shù)據(jù)處理平臺,AI芯片需要具備通用性,能夠處理多類型任務(wù)能力。由于移動終端 依靠電池驅(qū)動,而受制于電池倉
42、大小和電池能量密度限制,芯片設(shè)計在追求算力的同時對功耗有著嚴(yán)格的限制,可以開發(fā) 專用的ASIC芯片或者是使用功耗較低的DSP作為AI處理單元。照相-人臉識別照相-場景識別 照相-智能防抖照相-翻譯通話-降噪A/VR當(dāng)今手機電池電容量普遍在20005000mAh。有限的電量需要被被分配到AP、CP中的射頻、CPU、GPU、ISP等諸多 電子元器件,用于信號接發(fā)、編解碼、攝像頭、圖像處理/渲染等多類型任務(wù),對電子元器件功耗設(shè)計提出了極高的要 求。通過設(shè)計專用的AI加速運算單元并植入在SoC中,在功耗可控的情況下可實現(xiàn)高效的執(zhí)行AI運算任務(wù)。AI功能個人助理CPUGPUDSPISPAI-IPMemo
43、ry消費級聚合物鋰電池SoC外圍設(shè)備/傳感器來源:艾瑞研究院自主繪制。232019.6 iResearch Inc.IP廠商手機/SoC廠商242019.6 iResearch Inc.2019.6 iResearch Inc.廠商SoCAI技術(shù)性能SoC 廠商高通驍龍845Hexagon 685 DSP+CPU+GPU驍龍855Hexagon 690DSP+CPU+GPU7TOPs ,比上一代提升3倍蘋果A11Neural Engine0.6TOPsA12Neural Engine5TOPsMTKP60APU0.56TOPsP90APU2.02.25TOPs華為Kirin970NPU 1A0
44、.512TOPsKirin980NPU 1H5TOPsIP廠商ARMN/AML/OD ProcessorCadenceN/AP5/P6/Q6/C5SynopsysN/AEV5x/6xCEVAN/AXM6/XM4移動互聯(lián)網(wǎng)芯片市場傳統(tǒng)手機芯片廠商技術(shù)實力強勁,行業(yè)壁壘較高目前手機芯片市場存在以下情況:1)、AI應(yīng)用場景、功能有限;2)、AI芯片廠商一般向SoC廠提供IP并收取授權(quán)費,需 要AI-IP與整塊SoC進(jìn)行良好的匹配,而創(chuàng)業(yè)公司缺少與SoC廠商合作經(jīng)驗;3)、傳統(tǒng)手機SoC廠商和IP廠商都在開發(fā)自 己的AI加速器,傳統(tǒng)IP巨頭可以采取IP打包銷售的方式推廣其AI-IP產(chǎn)品。相比之下新進(jìn)廠
45、商在成本、功能、產(chǎn)品線、匹配 度等都不占優(yōu)的情況下很難在該領(lǐng)域存活。新進(jìn)廠商應(yīng)加強其軟件方面優(yōu)勢,并加深與手機廠商合作共同進(jìn)行手機AI功能開發(fā)。來源:公開網(wǎng)絡(luò)數(shù)據(jù),艾瑞研究院。來源:CounterPoint,中金研究部。主要手機AI芯片解決方案2017年手機SoC芯片市場份額41%21%18%6%8%5%1%QualcommHisiliconAppleSpreadtrumMediaTekSamsungOthers應(yīng)用場景3:自動駕駛來源:IHS,,天風(fēng)證券研究所,艾瑞研究院。302194100810.0%14.040.0%39.0%30.0%12.0% 14.5% 16.0%18.0% 20.
46、0%21.0%21.0%2.8%4.4%7.0%10.0%13.0%4.0%7.2% 10.5%15.0%0.6%1.0%1.8%0.0%0.3%0.6%1.2%2.3%687347056573278755727867648320543305952363595666202001045.0%48.0%49.0% 48.0%47.0%43.0%35.0%31.0%30.0%0.2%0.4%10.0%14.0%21.0%31.0%41.0%48.0%53.0%57.0%59.0%61.0%62.0%62.0%63.0%64.0%66.0%前景廣闊,但510年內(nèi)L45進(jìn)入乘用車平臺困難較大根據(jù)美國汽車
47、工程師協(xié)會(SAE)將自動駕駛按照車輛行駛對于系統(tǒng)依賴程度分為L0L5六個級別,L0為車輛行駛完全依 賴駕駛員操縱,L3級以上系統(tǒng)即可在特定情況下實現(xiàn)駕駛員脫手操作,而L5級則是在全場景下車輛行駛完全實現(xiàn)對系統(tǒng)的 依賴。目前商業(yè)化乘用車車型中僅有Audi A8、Tesla、凱迪拉克等部分車型可實現(xiàn)L2、3級ADAS。預(yù)計在2020年左右,隨 著傳感器、車載處理器等產(chǎn)品的進(jìn)一步完善,將會有更多的L3級車型出現(xiàn)。而L4、5級自動駕駛預(yù)計將會率先在封閉園區(qū) 中的商用車平臺上實現(xiàn)應(yīng)用落地,更廣泛的乘用車平臺高級別自動駕駛,需要伴隨著技術(shù)、政策、基礎(chǔ)設(shè)施建設(shè)的進(jìn)一步 完善,預(yù)計至少在2025年2030年
48、以后才會出現(xiàn)在一般道路上。2016-2030年全球汽車市場自動駕駛滲透率預(yù)測9581134662016L120172018e2019e-L5總車輛數(shù)(千輛)2020e2021e2022e2023e2024eL1/L2滲透率(%)L3滲透率(%)2025e2026eL4/L5滲透率(%2027e2028e2029e2030e)L1-L5總滲透率(%)252019.6 iResearch Inc.自動駕駛與汽車電子發(fā)展趨勢高級ADAS/自動駕駛需要中央“CPU+XPU”異構(gòu)處理器目前汽車電子控制系統(tǒng)是分布式ECU架構(gòu),不同的信息娛樂、車身、車輛運動和動力總成系統(tǒng)及其細(xì)分功能分別由不同獨 立的ECU
49、單元進(jìn)行獨立控制,部分高檔車型上的ECU數(shù)量超過100個。未來隨著汽車進(jìn)入L3級以上的高級別自動駕駛時代, 隨著車載傳感器數(shù)量及其所產(chǎn)生的數(shù)據(jù)量劇增,分布式電子系統(tǒng)難以滿足對大量、多元的傳感器數(shù)據(jù)進(jìn)行高效融合處理, 并綜合所有傳感器數(shù)據(jù)做出車輛控制決策等一系列操作需求。要滿足以上功能需求,汽車電子系統(tǒng)由需要向著域控制器(DCU)、多域控制器(MDC)等集中化方向發(fā)展,未來,汽車電子操控系統(tǒng)將會進(jìn)一步向著集中化、軟硬件解耦及平 臺化方向發(fā)展,汽車將會由統(tǒng)一的超算平臺對傳感器數(shù)據(jù)進(jìn)行處理、融合、決策最終實現(xiàn)高級別的自動駕駛功能。傳統(tǒng):分布式ECU汽車電子操縱系統(tǒng)未來:中央計算單元+操作平臺硬件層硬
50、件抽象層HAL中央處理器(冗余設(shè)置)操作系統(tǒng)/軟件車身系統(tǒng)動力總成 總線車輛運動系統(tǒng) 信息娛樂系統(tǒng)262019.6 iResearch Inc.Lv12Lv3Lv45傳感器毫米波1346610攝像頭12468激光雷達(dá)N/A0113算力需求50TOPS來源:恩智浦、德爾福、公開網(wǎng)絡(luò)數(shù)據(jù),艾瑞研究院自主繪制。自動駕駛與AI芯片DRIVE OS(底層開發(fā)平臺)NV MediaCUDATensorRTDeveloper ToolsDRIVEWORKS(服務(wù)器平臺配套解決方案)DRIVE AV(自動駕駛功能方案)DRIVE IX(人機交互方案)DRIVE CoreDRIVE CalibrationDRI
51、VE NetworksDRIVEPerceptionDRIVEMappingDRIVEPlanningVisualizatio nAICoPilot來源:英偉達(dá)官網(wǎng)。272019.6 iResearch Inc.AIAssistanceDRIVE PXParker AutoChaufferDRIVE PXParker AutoCruiseDRIVEXavierDRIVEPegasus英偉達(dá)-SelfDriving HardwareAI芯片廠商需提供可編譯的“硬件+軟件”產(chǎn)品解決方案伴隨人工智能技術(shù)在視覺領(lǐng)域的應(yīng)用,基于視覺技術(shù)的自動駕駛方案逐漸變?yōu)榭赡埽@需要在傳統(tǒng)行車電腦平臺上添加用 于視覺
52、算法處理的AI芯片。自動駕駛汽車計算單元設(shè)計需要考慮算力、功耗體積等問題,出于硬件資源最優(yōu)化應(yīng)用,往往 采取異構(gòu)計算平臺設(shè)計方案,及“CPU+XPU”(XPU包括:DSP/GPU/FPGA/ASIC),其中可采取DSP用于圖像特征提 取任務(wù)、GPU/FPGA/ASIC等計算單元用于目標(biāo)識別、追蹤任務(wù)等,而CPU則會用于定位、決策等邏輯運算任務(wù)。目前最典型的產(chǎn)品如英偉達(dá)的DRIVE PX系列及后續(xù)的Xavier、Pegasus等。除硬件計算平臺外,英偉達(dá)為客戶提供配套的 軟件平臺及開放的上層傳感器布局和自定義模塊使得客戶能夠根據(jù)自身需要進(jìn)行二次開發(fā),其還為客戶提供感知、制圖以 及行駛策略等解決方
53、案。目前其產(chǎn)品已經(jīng)被包括ZF、Bosch、Audi、Benz以及Tesla等Tier1s、OEMs廠商及諸多自動駕駛 創(chuàng)業(yè)公司采用作為其處理器方案所使用。行業(yè)需要完整的硬件+軟件整體解決方案(英偉達(dá) GPU+Software Stack)自動駕駛芯片市場來源:英偉達(dá)官網(wǎng)、Mobileye官網(wǎng)。282019.6 iResearch Inc.廠商SoC結(jié)構(gòu)性能英偉達(dá)AutoCruise2*Denver+4*Cortex A57+2*Pascal GPU 256 CUDA coresAutoChauffeur4*Denver+8*Cortex A57+4*Pascal GPU 512 CUDA co
54、res+2*dedicated M*M modules20TFLOPS(FP16)/250WXavier8* custom ARM64+Volta GPGPU 512 CUDA cores20 TOPS(INT8 )/30WPegasus16* Custom ARM64+2* Volta GPGPU CUDA cores+2*Volta GPU320TOPS((INT8)/500WMobileye(Intel)EyeQ30.256TFLOPS/2.5WEyeQ4MIPS Warrior CPU+6*VMP(Vector Microcode Processors)+MPC(Multithread
55、ed Processing Cluster);2.5TOPS/3WEyeQ58*CPU+18*Computer Vision Processors17TOPS/5W前裝市場壁壘高企,企業(yè)需有深厚的汽車電子設(shè)計經(jīng)驗積累在全部的邊緣計算場景中,用于自動駕駛的計算芯片設(shè)計難度最大,這主要體現(xiàn)在:1)算力要求高, L3級以上自動駕駛 需要復(fù)數(shù)種類的傳感器實現(xiàn)傳感器冗余,包括:612顆單目攝像頭、312臺毫米波雷達(dá)、5臺以內(nèi)的激光雷達(dá)等(不同方 案配置側(cè)重不同),因此產(chǎn)生的數(shù)據(jù)量極大( 估計L5級一天可產(chǎn)生數(shù)據(jù)量4000GB),在車輛高速行駛的情況下系統(tǒng)需要 能夠快速對數(shù)據(jù)進(jìn)行處理;2)汽車平臺同樣是由
56、電池供電,因此對于計算單元功耗有較高的要求,早期計算平臺功耗大、 產(chǎn)熱也較大,對于系統(tǒng)的續(xù)航及穩(wěn)定性都有較大的印象;3)汽車電子需要滿足ASIL-D車規(guī)級電子產(chǎn)品設(shè)計標(biāo)準(zhǔn),而使自 動駕駛所需要的中央處理器達(dá)到ASIL-D級設(shè)計標(biāo)準(zhǔn)難度更大。目前自動駕駛市場尚處于發(fā)展早期,市場環(huán)境不夠成熟,但以英偉達(dá)、Intel(Mobileye、Altera)等科技巨頭為代表的廠 商已經(jīng)投入巨資在該領(lǐng)域開發(fā)出了相關(guān)的硬件產(chǎn)品及配套軟件技術(shù)。人工智能芯片創(chuàng)業(yè)公司應(yīng)該加強與OEMs、Tier1或產(chǎn) 業(yè)聯(lián)盟合作為其提供AI芯片+軟件工具鏈的全套解決方案。行業(yè)主流自動駕駛核心處理器芯片解決方案邊緣計算AI芯片技術(shù)發(fā)展
57、趨勢XPU for Edge終端AI芯片多被集成 于SoC中,為客戶提供 完整的解決方案云端開發(fā)平臺軟件開發(fā)工具鏈采用ASIC設(shè)計專用的 AI加速單元,實現(xiàn)運 算效能最大化低功耗/高效能可編程適當(dāng)降低AI推斷的量 化比特精度提升存訪效率小型化/低成片外存儲單元的依賴本近數(shù)據(jù)運算,存內(nèi)計算對模型進(jìn)行剪枝處理, 降低模型復(fù)雜度針對自動駕駛、智能手 機等場景,為客戶提供 可進(jìn)行二次開發(fā)的產(chǎn)品提升基本運算單元效率簡化MAC運算時鐘門控Clock- gating企業(yè)應(yīng)該具有系統(tǒng)級設(shè)計能力,為客戶提供完整個解決方案邊緣計算場景呈現(xiàn)多樣化分布,除我們提到的安防監(jiān)控、移動互聯(lián)網(wǎng)、自動駕駛以外還涉及智慧家具、智
58、能制造、智慧醫(yī) 療等多樣化物聯(lián)網(wǎng)場景。不同的應(yīng)用場景基于計算任務(wù)、場景限制等,對AI芯片在算力、功耗、成本等方面提出了不同的 要求。但總體來看,相對于云計算中心來說,邊緣計算場景要求AI芯片在芯片體積、功耗、成本方面做到更經(jīng)濟(jì),由于邊 緣計算場景主要執(zhí)行推斷任務(wù),芯片算力及計算精度相對于云計算中心可適量下調(diào)。由于在功耗、面積、成本方面的限制, AI芯片企業(yè)往往需要將AI芯片作為協(xié)處理器內(nèi)置于SoC中,因此對于企業(yè)的SoC系統(tǒng)級產(chǎn)品開發(fā)能力提出了較強的要求。 此外,對于復(fù)雜應(yīng)用場景,如自動駕駛等,芯片企業(yè)應(yīng)為客戶提供硬件+軟件開發(fā)環(huán)境的全套解決方案。邊緣計算場景AI芯片設(shè)計思路及發(fā)展趨勢提升片上
59、存儲,降低對來源:艾瑞研究院繪制。292019.6 iResearch Inc.30AI芯片行業(yè)概述1AI芯片應(yīng)用場景及市場需求分析2AI芯片行業(yè)產(chǎn)業(yè)鏈及商業(yè)模式分析3AI芯片行業(yè)發(fā)展展望4企業(yè)推薦5AI芯片行業(yè)產(chǎn)業(yè)鏈FablessFoundryOSAT注釋: Fabless/Fab-lite指:無晶圓生產(chǎn)模式。來源:艾瑞研究院。云端312019.6 iResearch Inc.邊緣半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈長,具有資本和技術(shù)壁壘雙高的行業(yè)特點半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈從上游到下游大體可分為:設(shè)計軟件(EDA)、設(shè)備、材料(晶圓及耗材)、IC設(shè)計、代工、封裝等。 Fabless與IDM廠商負(fù)責(zé)芯片設(shè)計工作,其中I
60、DM廠商是指集成了設(shè)計、制造、封裝、銷售等全流程的廠商,一般是一些科 技巨頭公司,F(xiàn)abless廠商相比IDM規(guī)模更小,一般只負(fù)責(zé)芯片設(shè)計工作。分工模式(Fabless-Foundry)的出現(xiàn)主要是由于芯片制程工藝的不斷發(fā)展,工藝研發(fā)費用及產(chǎn)線投資升級費用大幅上升 導(dǎo)致一般芯片廠商難以覆蓋成本,而 Foundry廠商則是統(tǒng)一對Fabless和IDM的委外訂單進(jìn)行流片,形成規(guī)?;a(chǎn)優(yōu)勢,保證盈利的同時不斷投資研發(fā)新的制程工藝,是摩爾定律的主要推動者。當(dāng)前在半導(dǎo)體產(chǎn)業(yè)鏈中,我國在上游軟件、設(shè)備、 高端原材料以及代工制造與全球一線廠商差距較大,而在封裝環(huán)節(jié)擁有長電、華天、通富微等行業(yè)前十企業(yè),今年
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全指南試題及答案
- 共享出行平臺信用體系構(gòu)建與信用評級機制研究報告
- 農(nóng)產(chǎn)品溯源2025年智慧農(nóng)業(yè)與食品安全監(jiān)管融合報告
- 安全實務(wù)試題及答案
- 金融衍生品市場2025年創(chuàng)新產(chǎn)品開發(fā)與風(fēng)險管理體系研究報告
- 直播平臺內(nèi)容監(jiān)管與自律發(fā)展對直播行業(yè)監(jiān)管的創(chuàng)新報告
- 綠色建筑認(rèn)證體系在綠色生態(tài)園區(qū)建設(shè)的應(yīng)用與發(fā)展策略報告
- 月子中心醫(yī)護(hù)培訓(xùn)課件
- 中國醫(yī)藥電子課件
- 消毒供應(yīng)中心管理規(guī)范
- 計算流體力學(xué)完整課件
- 國開作業(yè)《監(jiān)督學(xué)》形成性考核(三)參考(含答案)238
- 人因工程學(xué)課后習(xí)題及解答
- 供應(yīng)商管理培訓(xùn) 課件
- 2022年廣東省中考地理試卷(含答案)
- 機關(guān)檔案管理工作培訓(xùn)課件
- 石材產(chǎn)品質(zhì)量保證書
- 部編版五年級語文下冊作文范文全套
- 衰老生物學(xué)ppt課件(PPT 57頁)
- 企業(yè)部門單位工傷事故報告書
- 注塑模具皮紋制作知識簡介課件
評論
0/150
提交評論