半導(dǎo)體人工智能芯片-新架構(gòu)改變世界_第1頁(yè)
半導(dǎo)體人工智能芯片-新架構(gòu)改變世界_第2頁(yè)
半導(dǎo)體人工智能芯片-新架構(gòu)改變世界_第3頁(yè)
半導(dǎo)體人工智能芯片-新架構(gòu)改變世界_第4頁(yè)
半導(dǎo)體人工智能芯片-新架構(gòu)改變世界_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明1半導(dǎo)體人工智能倒逼芯片底層的真正變革人類(lèi)精密制造領(lǐng)域(半導(dǎo)體制造是目前為止人類(lèi)制造領(lǐng)域的最巔峰)遇到硅基極限的挑戰(zhàn),摩爾定律的放緩似乎預(yù)示著底層架構(gòu)上的芯片性能的再提升已經(jīng)出現(xiàn)瓶頸,而數(shù)據(jù)量的增長(zhǎng)卻呈現(xiàn)指數(shù)型的爆發(fā),兩者之間的不匹配勢(shì)必會(huì)帶來(lái)技術(shù)和產(chǎn)業(yè)上的變革升級(jí)。變革從底層架構(gòu)開(kāi)始。計(jì)算的體系處于碎片化引發(fā)架構(gòu)變革。數(shù)據(jù)的擴(kuò)張遠(yuǎn)大于處理器性能的擴(kuò)張,依靠處理器性能在摩爾定律推動(dòng)下的提升的單極世界已經(jīng)崩潰,處理器性能提升的速度并不足以滿足AI所需的應(yīng)用程序的需求。大量數(shù)據(jù)消耗的數(shù)字運(yùn)算能力比幾年前所有數(shù)據(jù)中心加起來(lái)還要多。基于馮諾伊曼架構(gòu)的拓?fù)浣Y(jié)構(gòu)已經(jīng)持續(xù)了很多年并沒(méi)有本質(zhì)上的變化。而人工智能帶來(lái)的,是在摩爾定律放緩維度下引發(fā)芯片底層架構(gòu)重構(gòu)的變革。有可能引發(fā)的是一次超越以往任何時(shí)代的科技革命基于摩爾定律的機(jī)器時(shí)代的架構(gòu)——從Wintel到AA馮諾伊曼架構(gòu)帶來(lái)了計(jì)算體系的建立并通過(guò)Intel實(shí)現(xiàn)了最大化;ARM通過(guò)共享IP的商業(yè)模式帶來(lái)了更開(kāi)放的生態(tài)體系,實(shí)現(xiàn)了軟硬件的結(jié)合延伸了人類(lèi)的觸角觀察Intel和ARM的黃金十年,站在現(xiàn)在時(shí)點(diǎn)往后看,我們提出以下觀點(diǎn):過(guò)去十年以下游的應(yīng)用驅(qū)動(dòng)設(shè)計(jì)公司的成長(zhǎng)轉(zhuǎn)換為由設(shè)計(jì)公司主導(dǎo)應(yīng)用正在發(fā)生。從需求層面看企業(yè)成長(zhǎng)空間。類(lèi)似90年代的PC和10年的智能手機(jī)帶來(lái)的億級(jí)大空間增量市場(chǎng)將很容易推動(dòng)企業(yè)的快速增長(zhǎng)。設(shè)計(jì)企業(yè)能夠在成長(zhǎng)軌跡上實(shí)現(xiàn)跨越式突破的可能性來(lái)自于賽道的選擇。但站在現(xiàn)在時(shí)點(diǎn)看,人工智能是確定性的方向,在所有已有領(lǐng)域的人工智能滲透,都將極大的改變?nèi)祟?lèi)的生活。處于最前沿的芯片公司的革新正在以此而發(fā)生,重新定義底層架構(gòu)的芯片,從上游推動(dòng)行業(yè)的變革。在并沒(méi)有具體應(yīng)用場(chǎng)景爆發(fā)之前已經(jīng)給予芯片公司充分的高估值就是認(rèn)可設(shè)計(jì)公司的價(jià)值人工智能芯片——新架構(gòu)的異軍突起觀察人工智能系統(tǒng)的搭建,以目前的架構(gòu)而言,主要是以各種加速器來(lái)實(shí)現(xiàn)深度學(xué)習(xí)算法。討論各種加速器的形式和實(shí)現(xiàn),并探討加速器變革下引發(fā)的行業(yè)深層次轉(zhuǎn)變。認(rèn)為人工智能芯片將有可能在摩爾定律放緩維度下引發(fā)芯片底層架構(gòu)重構(gòu)的變革。從2個(gè)維度測(cè)算人工智能芯片空間從兩個(gè)維度討論人工智能芯片的市場(chǎng)空間測(cè)算。維度一從人工智能總市場(chǎng)規(guī)模空間反推芯片,維度二詳細(xì)拆分云端/移動(dòng)端所需人工智能加速器的BOM進(jìn)而推斷人工智能芯片市場(chǎng)空間。二個(gè)維度印證到2020年人工智能芯片將達(dá)到百億美元市場(chǎng)重點(diǎn)標(biāo)的:Intel,臺(tái)積電,NVIDIA,全志科技,富瀚微,北京君正證券研究報(bào)告2017年09月16日半導(dǎo)體滬深300-5%-11%-17%-23%資料來(lái)源:貝格數(shù)據(jù)1《半導(dǎo)體-行業(yè)研究周報(bào):一周半導(dǎo)體2《半導(dǎo)體-行業(yè)點(diǎn)評(píng):邊際改善提升業(yè)3《半導(dǎo)體-行業(yè)點(diǎn)評(píng):抽絲剝繭——探尋本輪半導(dǎo)體元器件漲價(jià)背后的原因》風(fēng)險(xiǎn)提示:人工智能芯片發(fā)展不達(dá)預(yù)期請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明21.人工智能倒逼芯片底層的真正變革 42.基于摩爾定律的機(jī)器時(shí)代的架構(gòu)——從Wintel到AA 62.1.Intel——PC時(shí)代的王者榮耀 6 62.1.2.Intel帶來(lái)的PC行業(yè)的市場(chǎng)規(guī)模變革和產(chǎn)業(yè)變化 72.2.ARM——開(kāi)放生態(tài)下移動(dòng)時(shí)代的新王加冕 9 92.2.2.ARM架構(gòu)——重新塑造移動(dòng)智能時(shí)代 102.2.3.生態(tài)的建立和商業(yè)模式的轉(zhuǎn)變——ARM重塑了行業(yè) 123.人工智能芯片——新架構(gòu)的異軍突起 15 16 17 193.3.ASIC——定制化的專(zhuān)用人工智能芯片 21 22 233.4.人工神經(jīng)網(wǎng)絡(luò)芯片 243.4.1.寒武紀(jì)——真正的不同 254.從2個(gè)維度測(cè)算人工智能芯片空間 265.重點(diǎn)標(biāo)的 29圖1:遵從摩爾定律發(fā)展到微處理器發(fā)展 4圖2:摩爾定律在放緩 4圖3:全球智能手機(jī)每月產(chǎn)生的數(shù)據(jù)量(EB)5年提升了13X 4圖4:?jiǎn)我簧窠?jīng)元VS復(fù)雜神經(jīng)元 5圖5:2次應(yīng)用驅(qū)動(dòng)芯片發(fā)展 6圖6:英特爾x86處理器總市場(chǎng)份額 6圖7:使用X86架構(gòu)的單元 7圖8:摩爾定律下推動(dòng)下的Intel股價(jià)上揚(yáng) 8圖9:Intel2012Q1-2016Q4各產(chǎn)品線增速 8 8圖11:IntelVS全球半導(dǎo)體增速 8圖12:ARM的商業(yè)模式 9圖13:ARM架構(gòu)的發(fā)展 10圖14:高級(jí)消費(fèi)電子產(chǎn)品正在結(jié)合更多的ARM技術(shù) 12圖15:ARM在智能手機(jī)中的成分 13圖16:基于ARM芯片的出貨量 13請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明3圖17:ARM在載有處理器芯片部門(mén)的市場(chǎng)占有率 14圖18:ARM收入及利潤(rùn)情況 14圖19:人工智能芯片產(chǎn)業(yè)鏈 15 16 16 17 17圖24:2012-2016年NVIDIA營(yíng)收情況 18圖25:2012-2016年NVIDIA毛利情況 18圖26:NVIDIA2017年上半年收入構(gòu)成 18 20 20 20 21 22 22 23圖34:3D景深結(jié)構(gòu) 23圖35:3D成像 23 23 24圖38:傳統(tǒng)硬件處理方式 25圖39:寒武紀(jì)處理方式 25圖40:寒武紀(jì)芯片性能/能效 25圖41:終端和移動(dòng)端 25圖42:人工智能市場(chǎng)規(guī)模 26圖43:人工智能芯片總市場(chǎng)規(guī)模 27表9:云端市場(chǎng)規(guī)模(單位:百萬(wàn)美元) 28圖44:云端領(lǐng)域人工智能芯片規(guī)模預(yù)測(cè) 28圖45:終端領(lǐng)域人工智能芯片市場(chǎng)規(guī)模預(yù)測(cè) 29表1:ARM架構(gòu)匯總 11表2:2020年ARM在各類(lèi)型智能手機(jī)部件中的可獲得的單機(jī)收入 13表3:人工智能系統(tǒng) 15 19 19表6:圖像應(yīng)用和語(yǔ)音應(yīng)用人工智能定制芯片 21表7:實(shí)現(xiàn)原理 22表8:馮諾伊曼架構(gòu)VS神經(jīng)網(wǎng)絡(luò)芯片架構(gòu) 24請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明4研究人類(lèi)的科技發(fā)展史,發(fā)現(xiàn)科技的進(jìn)步速度呈現(xiàn)指數(shù)型加速態(tài)勢(shì)。尤其在1950年以后進(jìn)入芯片時(shí)代,摩爾定律推動(dòng)下的每18個(gè)月“芯片晶體管同比例縮小一半”帶來(lái)的性能提升以倍數(shù)計(jì)。每一次加速的過(guò)程推動(dòng),都引發(fā)了產(chǎn)業(yè)的深層次變革,帶動(dòng)從底層到系統(tǒng)的階躍。我們本篇報(bào)告將著重從底層芯片角度出發(fā),探討人工智能芯片帶來(lái)的深層次變革。資料來(lái)源:Gartner,天風(fēng)證券研究所然而時(shí)至今日,人類(lèi)精密制造領(lǐng)域(半導(dǎo)體制造是目前為止人類(lèi)制造領(lǐng)域的最巔峰)遇到硅基極限的挑戰(zhàn),摩爾定律的放緩似乎預(yù)示著底層架構(gòu)上的芯片性能的再提升已經(jīng)出現(xiàn)瓶頸,而數(shù)據(jù)量的增長(zhǎng)卻呈現(xiàn)指數(shù)型的爆發(fā),兩者之間的不匹配勢(shì)必會(huì)帶來(lái)技術(shù)和產(chǎn)業(yè)上的變革升級(jí)。資料來(lái)源:IFS,天風(fēng)證券研究所86420資料來(lái)源:CiscoVNL,天風(fēng)證券研究所請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明5變革從底層架構(gòu)開(kāi)始計(jì)算芯片的架構(gòu)50多年來(lái)都沒(méi)有發(fā)生過(guò)本質(zhì)上的變化,請(qǐng)注意計(jì)算架構(gòu)的決定是資源的組織形式。而傳統(tǒng)的馮諾伊曼是采取控制流架構(gòu),采用的是線性的記憶體和布爾函數(shù)作為基線計(jì)算操作。處理器的架構(gòu)基于流水線串行處理的機(jī)制建立,存儲(chǔ)器和處理器分離,流水線的計(jì)算過(guò)程可以分解為取指令,執(zhí)行,取數(shù)據(jù),數(shù)據(jù)存儲(chǔ),依次循環(huán)。依靠整個(gè)串行的過(guò)程,邏輯清晰,但性能的提升通過(guò)兩種方式,一是摩爾定律下推動(dòng)下晶體管數(shù)量的增多實(shí)現(xiàn)性能倍增;二是通過(guò)并行多個(gè)芯片核來(lái)實(shí)現(xiàn)。無(wú)論何種方式,本質(zhì)上都是線性的性能擴(kuò)張。人工智能芯片根據(jù)數(shù)據(jù)流的碎片化和分布式而采取神經(jīng)網(wǎng)絡(luò)計(jì)算范式,特征在于分布式的表示和激活模式。變量由疊加在共享物理資源上的向量表示,并且通過(guò)神經(jīng)元的激活來(lái)進(jìn)行計(jì)算。以神經(jīng)元架構(gòu)實(shí)現(xiàn)深度學(xué)習(xí)人工智能的臨界點(diǎn)實(shí)現(xiàn)主要原因在于:數(shù)據(jù)量的激增和計(jì)算機(jī)能力/成本。深度學(xué)習(xí)以神經(jīng)元為架構(gòu)。從單一的神經(jīng)元,再到簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò),到一個(gè)用于語(yǔ)音識(shí)別的深層神經(jīng)網(wǎng)絡(luò)。層次間的復(fù)雜度呈幾何倍數(shù)的遞增。數(shù)據(jù)量的激增要求的就是芯片計(jì)算能力的提升。資料來(lái)源:NVIDIA,天風(fēng)證券研究所計(jì)算的體系處于碎片化引發(fā)架構(gòu)變革。數(shù)據(jù)的擴(kuò)張遠(yuǎn)大于處理器性能的擴(kuò)張,依靠處理器性能在摩爾定律推動(dòng)下的提升的單極世界已經(jīng)崩潰,處理器性能提升的速度并不足以滿足AI所需的應(yīng)用程序的需求。大量數(shù)據(jù)消耗的數(shù)字運(yùn)算能力比幾年前所有數(shù)據(jù)中心加起來(lái)還要多。我們?cè)谙乱徽聦⒂^察歷史上兩次重要的電子產(chǎn)業(yè)變革,試圖證明無(wú)論是PC時(shí)代的“Wintel”還是智能手機(jī)時(shí)代的“ARM+Android”,都還無(wú)法擺脫機(jī)器本身的桎梏。換句話說(shuō),截止于現(xiàn)階段的一切技術(shù)和應(yīng)用,基于馮諾伊曼架構(gòu)的拓?fù)浣Y(jié)構(gòu)已經(jīng)持續(xù)了很多年并沒(méi)有本質(zhì)上的變化。而人工智能帶來(lái)的,是在摩爾定律放緩維度下引發(fā)芯片底層架構(gòu)重構(gòu)的變革。有可能引發(fā)的是一次超越以往任何時(shí)代的科技革命。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明6本章我們重點(diǎn)討論兩次芯片架構(gòu)變化引發(fā)的產(chǎn)業(yè)變革和應(yīng)用爆發(fā)。Intel與Windows結(jié)合構(gòu)建PC生態(tài),本質(zhì)上誕生了軟硬件結(jié)合的機(jī)器時(shí)代。而在其基礎(chǔ)上的延升,2010后蘋(píng)果帶來(lái)的智能手機(jī)引發(fā)的ARM與Android生態(tài),將機(jī)器與人的結(jié)合拓展到了移動(dòng)端。我們回顧歷史上的芯片架構(gòu)歷史,認(rèn)為馮諾伊曼架構(gòu)帶來(lái)了計(jì)算體系的建立并通過(guò)Intel實(shí)現(xiàn)了最大化;ARM通過(guò)共享IP的商業(yè)模式帶來(lái)了更開(kāi)放的生態(tài)體系,實(shí)現(xiàn)了軟硬件的結(jié)合延伸了人類(lèi)的觸角。資料來(lái)源:SIA,天風(fēng)證券研究所觀察Intel和ARM的黃金十年,站在現(xiàn)在時(shí)點(diǎn)往后看,我們提出以下觀點(diǎn):過(guò)去十年以下游的應(yīng)用驅(qū)動(dòng)設(shè)計(jì)公司的成長(zhǎng)轉(zhuǎn)換為由設(shè)計(jì)公司主導(dǎo)應(yīng)用正在發(fā)生。從需求層面看企業(yè)成長(zhǎng)空間。類(lèi)似90年代的PC和10年的智能手機(jī)帶來(lái)的億級(jí)大空間增量市場(chǎng)將很容易推動(dòng)企業(yè)的快速增長(zhǎng)。設(shè)計(jì)企業(yè)能夠在成長(zhǎng)軌跡上實(shí)現(xiàn)跨越式突破的可能性來(lái)自于賽道的選擇。但站在現(xiàn)在時(shí)點(diǎn)看,人工智能是確定性的方向,在所有已有領(lǐng)域的人工智能滲透,都將極大的改變?nèi)祟?lèi)的生活。處于最前沿的芯片公司的革新正在以此而發(fā)生,重新定義底層架構(gòu)的芯片,從上游推動(dòng)行業(yè)的變革。在并沒(méi)有具體應(yīng)用場(chǎng)景爆發(fā)之前已經(jīng)給予芯片公司充分的高估值就是認(rèn)可設(shè)計(jì)公司的價(jià)值本節(jié)重點(diǎn)闡述Intel公司在X86時(shí)代的芯片架構(gòu)產(chǎn)品以及此架構(gòu)下公司以及行業(yè)的變化。2.1.1.Intel公司簡(jiǎn)介Intel是一家成立于1968年的半導(dǎo)體制造公司,總部位于美國(guó)加州。隨著個(gè)人電腦的普及和全球計(jì)算機(jī)工業(yè)的日益發(fā)展,公司逐漸發(fā)展成為全球最大的微處理器及相關(guān)零件的供應(yīng)商。公司在2016年實(shí)現(xiàn)營(yíng)業(yè)收入594億美元,世界500強(qiáng)排名158。公司分為PC客戶端部門(mén)、數(shù)據(jù)中心部門(mén)、物聯(lián)網(wǎng)、移動(dòng)及通訊部門(mén)、軟件及服務(wù)運(yùn)營(yíng),其他還有筆記本部門(mén)、新設(shè)備部門(mén)及NVM解決方案部門(mén)。公司主要營(yíng)業(yè)收入來(lái)自于PC客戶部門(mén),其次是數(shù)據(jù)中心部門(mén)。公司的主要產(chǎn)品X86處理器占主導(dǎo)地位,接近90%,包括蘋(píng)果在2006年放棄PowerPC改用英特爾的x86processors。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明7資料來(lái)源:Intel,天風(fēng)證券研究所P2、P3、P4都用的同一種CPU架構(gòu),統(tǒng)稱X86。大多數(shù)英特爾處理器都是基于x86指令集,被稱為x86微處理器。指令集是微處理器可以遵循的基本命令集,它本質(zhì)上是微處理器的芯片級(jí)“語(yǔ)言”。英特爾擁有x86架構(gòu)的知識(shí)產(chǎn)權(quán)和給AMD和Via做處理器的許可權(quán)。資料來(lái)源:wind,天風(fēng)證券研究所2.1.2.Intel帶來(lái)的PC行業(yè)的市場(chǎng)規(guī)模變革和產(chǎn)業(yè)變化回顧Intel90年代至今發(fā)展歷程,清晰看到90年代是Intel發(fā)展最快的階段并在2000年前后達(dá)到了峰值。顯而易見(jiàn)的原因是個(gè)人電腦的快速普及滲透。而遵從摩爾定律的每一代產(chǎn)品的推出,疊加個(gè)人電腦快速滲透的乘數(shù)效應(yīng),持續(xù)放大了企業(yè)的市值,類(lèi)似于戴維斯雙擊,推動(dòng)股價(jià)的一路上揚(yáng)。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明8資料來(lái)源:Wind,天風(fēng)證券研究所馮諾伊曼架構(gòu)帶來(lái)了計(jì)算體系的建立并通過(guò)Intel實(shí)現(xiàn)了最大化,但從本質(zhì)上說(shuō),英特爾參與的是機(jī)器時(shí)代的興起和計(jì)算芯片價(jià)值體現(xiàn)。但時(shí)至今日,在人口紅利消散,PC滲透率達(dá)到穩(wěn)定階段,依托于PC時(shí)代的處理器芯片進(jìn)入了穩(wěn)定常態(tài)。英特爾在總產(chǎn)品收入提升的情況下,PC端提供的收入增長(zhǎng)機(jī)會(huì)停滯。處理器依靠摩爾定律不斷推經(jīng)延續(xù)生命力,但在應(yīng)用增長(zhǎng)乏力的階段缺乏爆發(fā)式的再增長(zhǎng)。PC時(shí)代的處理器設(shè)計(jì)遵從了下游應(yīng)用驅(qū)動(dòng)上游芯片的實(shí)質(zhì)。資料來(lái)源:Intel,天風(fēng)證券研究所資料來(lái)源:Intel,天風(fēng)證券研究所進(jìn)入2010年后,英特爾的處理器增速同半導(dǎo)體行業(yè)基本協(xié)同一致,毫無(wú)疑問(wèn)超越行業(yè)增速的增長(zhǎng)已經(jīng)需要新的應(yīng)用拉動(dòng)。摩爾定律支撐了10多年的快速增長(zhǎng)再出現(xiàn)邊際改善的增長(zhǎng)需要重新審視。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明9資料來(lái)源:Intel,天風(fēng)證券研究所本節(jié)重點(diǎn)闡述ARM在移動(dòng)時(shí)代的芯片架構(gòu)產(chǎn)品以及此架構(gòu)下公司以及行業(yè)的變化。2.2.1.ARM公司簡(jiǎn)介ARM公司是全球領(lǐng)先的半導(dǎo)體知識(shí)產(chǎn)權(quán)(IP)提供商,專(zhuān)門(mén)從事基于RISC技術(shù)芯片設(shè)計(jì)開(kāi)發(fā),并因此在數(shù)字電子產(chǎn)品的開(kāi)發(fā)中處于核心地位。公司的前身Acorn于1978年在倫敦正式成立。1990年ARM從Acorn分拆出來(lái)。得益于20世紀(jì)90年代手機(jī)的快速發(fā)展,基于ARM技術(shù)的芯片出貨量飛速增長(zhǎng),并于2017年宣布正式達(dá)成1000億芯片出貨量的里程碑。2016年7月,日本軟銀以320億美元收購(gòu)了ARM。ARM本身不直接從事芯片生產(chǎn),只設(shè)計(jì)IP,包括指令集架構(gòu)、微處理器、圖形核心和互連架構(gòu),依靠轉(zhuǎn)讓設(shè)計(jì)許可由合作公司生產(chǎn)各具特色的芯片,目前它在世界范圍有超過(guò)1100個(gè)的合作伙伴。ARM的創(chuàng)新型商業(yè)模式為公司帶來(lái)了豐厚的回報(bào)率:它既使得ARM技術(shù)獲得更多的第三方工具、制造、軟件的支持,又使整個(gè)系統(tǒng)成本降低,使產(chǎn)品更容易進(jìn)入市場(chǎng)被消費(fèi)者所接受,更具有競(jìng)爭(zhēng)力。正因?yàn)锳RM的IP多種多樣以及支持基于ARM的解決方案的芯片和軟件體系十分龐大,全球領(lǐng)先的原始設(shè)備制造商(OEM)都在廣泛使用ARM技術(shù),因此ARM得以在智能手機(jī)、平板上一枝獨(dú)秀,全世界超過(guò)95%的智能手機(jī)都采用ARM架構(gòu)。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:ARM,天風(fēng)證券研究所2.2.2.ARM架構(gòu)——重新塑造移動(dòng)智能時(shí)代ARM沿用了馮諾伊曼架構(gòu),在性能和功耗上做到了更加平衡。在底層架構(gòu)沒(méi)有發(fā)生根本性變革的情況下,在架構(gòu)的橫向延伸上尋找到了技術(shù)的轉(zhuǎn)換,從而實(shí)現(xiàn)了智能手機(jī)時(shí)代移動(dòng)端的產(chǎn)品階躍。處理器架構(gòu)在根源上看ARM延續(xù)了X86的底層架構(gòu)。正如我們?cè)谥坝懻摷軜?gòu)時(shí)指出,處理器一般分為取指令,譯碼,發(fā)射,執(zhí)行,寫(xiě)回五個(gè)步驟。而我們說(shuō)的訪存,指的是訪問(wèn)數(shù)據(jù),不是指令抓取。訪問(wèn)數(shù)據(jù)的指令在前三步?jīng)]有什么特殊,在第四步,它會(huì)被發(fā)送到存取單元,等待完成。與X86不同的是在指令集方面,ARM架構(gòu)過(guò)去稱作進(jìn)階精簡(jiǎn)指令A(yù)RM指令集架構(gòu)的主要特點(diǎn):一是體積小、低功耗、低成本、高性能,因此ARM處理器非常適用于移動(dòng)通訊領(lǐng)域;二是大量使用寄存器且大多數(shù)數(shù)據(jù)操作都在寄存器中完成,指令執(zhí)行速度更快;三是尋址方式靈活簡(jiǎn)單,執(zhí)行效率高;四是指令長(zhǎng)度固定,可通過(guò)多流水線方式提高處理效率。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:ARM,天風(fēng)證券研究所V7Cortex-M、請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:ARM、滿天芯,天風(fēng)證券研究所2.2.3.生態(tài)的建立和商業(yè)模式的轉(zhuǎn)變——ARM重塑了行業(yè)ARM的商業(yè)模式值得真正的關(guān)注。ARM通過(guò)授權(quán)和版稅來(lái)賺取收入。使用ARM的授權(quán),跟據(jù)流片的次數(shù),可以付一次流片的費(fèi)用,也可以買(mǎi)三年內(nèi)無(wú)限次流片,更可以永久買(mǎi)斷。芯片量產(chǎn)后,根據(jù)產(chǎn)量,會(huì)按百分比收一點(diǎn)版稅。Intel通過(guò)售賣(mài)自己的芯片來(lái)贏得終端客戶和市場(chǎng),而ARM則是通過(guò)授權(quán)讓全世界的芯片制造商使用自家的產(chǎn)品來(lái)推廣。ARM的商業(yè)模式之所以在智能手機(jī)時(shí)代能夠推廣,是因?yàn)橐苿?dòng)端的生態(tài)更為開(kāi)放,自上而下的生態(tài)建立,不僅是芯片開(kāi)發(fā)者,也包括軟件開(kāi)發(fā)者,都被構(gòu)建在生態(tài)的范圍內(nèi)。智能移動(dòng)設(shè)備上包含多件ARM的處理器/技術(shù),每當(dāng)智能手機(jī)上新增一個(gè)功能時(shí),就為新的ARM知識(shí)產(chǎn)權(quán)帶來(lái)了新的機(jī)會(huì)。2016年,ARM在移動(dòng)應(yīng)用處理器(包括智能手機(jī)、平板電腦和筆記本電腦)上,根據(jù)量的測(cè)算,其市場(chǎng)份額高達(dá)90%,同時(shí)ARM估計(jì)移動(dòng)應(yīng)用處理器規(guī)模將從2016年的200億美元增長(zhǎng)到2025年的300億美元。資料來(lái)源:ARM,天風(fēng)證券研究所2016年,ARM各項(xiàng)技術(shù)在智能手機(jī)領(lǐng)域都有良好的滲透率:ARMv7-A技術(shù)早已完全滲入,ARMv8-A技術(shù)滲透率達(dá)到70%,Maligraphics達(dá)到50%,高核數(shù)技術(shù)(highcorecount)請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:ARM,天風(fēng)證券研究所ARM的累計(jì)出貨量已經(jīng)超過(guò)1000億支,2016年全年發(fā)出的基于ARM技術(shù)芯片達(dá)到177億,發(fā)貨量在過(guò)去5年時(shí)間中CAGR將近15%。ARM的增長(zhǎng)完美契合了智能手機(jī)的快速增請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:ARM,天風(fēng)證券研究所資料來(lái)源:ARM,天風(fēng)證券研究所資料來(lái)源:ARM,天風(fēng)證券研究所請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明觀察人工智能系統(tǒng)的搭建,以目前的架構(gòu)而言,主要是以各種加速器來(lái)實(shí)現(xiàn)深度學(xué)習(xí)算法。本章討論各種加速器的形式和實(shí)現(xiàn),并探討加速器變革下引發(fā)的行業(yè)深層次轉(zhuǎn)變,并從2個(gè)維度給出詳細(xì)的測(cè)算人工智能芯片的潛在空間首先我們必須描述人工智能對(duì)芯片的訴求,深度學(xué)習(xí)的目標(biāo)是模仿人類(lèi)神經(jīng)網(wǎng)絡(luò)感知外部世界的方法。深度學(xué)習(xí)算法的實(shí)現(xiàn)是人工智能芯片需要完成的任務(wù)。在算法沒(méi)有發(fā)生質(zhì)變的前提下,追根溯源,所有的加速器芯片都是為了實(shí)現(xiàn)算法而設(shè)計(jì)。資料來(lái)源:Wind,天風(fēng)證券研究所我們整理了人工智能芯片相關(guān)的類(lèi)型和產(chǎn)業(yè)鏈公司,傳統(tǒng)的芯片廠商/生態(tài)的建立者/新進(jìn)入者。傳統(tǒng)的芯片制造廠商:Intel,Nvidia和AMD。他們的優(yōu)勢(shì)在于在已有架構(gòu)上對(duì)人工智能的延伸,對(duì)于硬件的理解會(huì)優(yōu)于競(jìng)爭(zhēng)對(duì)手,但也會(huì)困頓于架構(gòu)的囹圄;2上層生態(tài)的構(gòu)建者進(jìn)入芯片設(shè)計(jì),比如蘋(píng)果和Google,優(yōu)勢(shì)在于根據(jù)生態(tài)靈活開(kāi)發(fā)定制各類(lèi)ASIC,專(zhuān)用性強(qiáng);新進(jìn)入者,某些全新的架構(gòu)比如神經(jīng)網(wǎng)絡(luò)芯片的寒武紀(jì),因?yàn)槭侨碌氖袌?chǎng)開(kāi)拓,具有后發(fā)先至的可能。新進(jìn)入者的機(jī)會(huì),因?yàn)槭莻€(gè)全新的架構(gòu)機(jī)會(huì),將有機(jī)會(huì)誕生獨(dú)角獸。資料來(lái)源:Wind,半導(dǎo)體行業(yè)觀察,天風(fēng)證券研究所請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明GPU使用SIMD(單指令多數(shù)據(jù)流)來(lái)讓多個(gè)執(zhí)行單元以同樣的步伐來(lái)處理不同的數(shù)據(jù),原本用于處理圖像數(shù)據(jù),但其離散化和分布式的特征,以及用矩陣運(yùn)算替代布爾運(yùn)算適合處理深度學(xué)習(xí)所需要的非線性離散數(shù)據(jù)。作為加速器的使用,可以實(shí)現(xiàn)深度學(xué)習(xí)算法。但注意的是,GPU架構(gòu)依然基于馮諾伊曼。我們以GPU和CPU的對(duì)比來(lái)說(shuō)明GPU所具有的架構(gòu)特點(diǎn)。GPU由元以及存儲(chǔ)單元構(gòu)成GPU擁有大量的核(多達(dá)幾千個(gè)核)和大量的高速內(nèi)存,擅長(zhǎng)做類(lèi)似圖像處理的并行計(jì)算,以矩陣的分布式形式來(lái)實(shí)現(xiàn)計(jì)算。同CPU不同的是,GPU的計(jì)算單元明顯增多,特別適合大規(guī)模并行計(jì)算。資料來(lái)源:NVIDIA,天風(fēng)證券研究所注意GPU并行計(jì)算架構(gòu),其中的流處理器組(SMs)類(lèi)似一個(gè)CPU核,多個(gè)流處理器組可實(shí)現(xiàn)數(shù)據(jù)的同時(shí)運(yùn)算。因此,GPU主要適用于在數(shù)據(jù)層呈現(xiàn)很高的并行特性(data-parallelism)的應(yīng)用。資料來(lái)源:NVIDIA,天風(fēng)證券研究所請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明CPU和GPU本身架構(gòu)方式和運(yùn)算目的不同導(dǎo)致了CPU和GPU之間的不同,主要不同點(diǎn)列舉如下資料來(lái)源:Intel,天風(fēng)證券研究所深度學(xué)習(xí)是利用復(fù)雜的多級(jí)「深度」神經(jīng)網(wǎng)絡(luò)來(lái)打造一些系統(tǒng),這些系統(tǒng)能夠從海量的未標(biāo)記訓(xùn)練數(shù)據(jù)中進(jìn)行特征檢測(cè)。因?yàn)镚PU可以平行處理大量瑣碎信息。深度學(xué)習(xí)所依賴的是神經(jīng)系統(tǒng)網(wǎng)絡(luò)——與人類(lèi)大腦神經(jīng)高度相似的網(wǎng)絡(luò)——而這種網(wǎng)絡(luò)出現(xiàn)的目的,就是要在高速的狀態(tài)下分析海量的數(shù)據(jù)。GPU擅長(zhǎng)的是海量數(shù)據(jù)的快速處理GPU的特征決定了其特別適合做訓(xùn)練。機(jī)器學(xué)習(xí)的廣泛應(yīng)用:海量訓(xùn)練數(shù)據(jù)的出現(xiàn)以及GPU計(jì)算所提供的強(qiáng)大而高效的并行計(jì)算。人們利用GPU來(lái)訓(xùn)練這些深度神經(jīng)網(wǎng)絡(luò),所使用的訓(xùn)練集大得多,所耗費(fèi)的時(shí)間大幅縮短,占用的數(shù)據(jù)中心基礎(chǔ)設(shè)施也少得多。GPU還被用于運(yùn)行這些機(jī)器學(xué)習(xí)訓(xùn)練模型,以便在云端進(jìn)行分類(lèi)和預(yù)測(cè),從而在耗費(fèi)功率更低、占用基礎(chǔ)設(shè)施更少的情況下能夠支持遠(yuǎn)比從前更大的數(shù)據(jù)量和吞吐量。與單純使用CPU的做法相比,GPU具有數(shù)以千計(jì)的計(jì)算核心、可實(shí)現(xiàn)10-100倍應(yīng)用吞吐量,因此GPU已經(jīng)成為數(shù)據(jù)科學(xué)家處理大數(shù)據(jù)的處理器。資料來(lái)源:NVIDIA,天風(fēng)證券研究所3.1.1.GPU芯片王者——NVIDIANVIDIA是一家以設(shè)計(jì)GPU芯片為主業(yè)的半導(dǎo)體公司,其主要產(chǎn)品從應(yīng)用領(lǐng)域劃分,包括GPU(如游戲圖形處理器GeForceGPU,深度學(xué)習(xí)處理器Tesla,圖形處理器GRID等)和請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明0 資料來(lái)源:公司年報(bào),天風(fēng)證券研究所0 資料來(lái)源:公司年報(bào),天風(fēng)證券研究所從收入構(gòu)成來(lái)看,公司GPU芯片業(yè)務(wù)從2012年的32.52億美元增至2016年的58.22億美元,實(shí)現(xiàn)穩(wěn)步增長(zhǎng),GPU業(yè)務(wù)在收入結(jié)構(gòu)中占比穩(wěn)定在76%以上。0請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:公司年報(bào),天風(fēng)證券研究所在高性能計(jì)算機(jī)、深度學(xué)習(xí)、人工智能等領(lǐng)域,NVIDIA的GPU芯片有十分關(guān)鍵的作用。NVIDIA的CUBA技術(shù),大幅度提高了純CPU構(gòu)成的超級(jí)計(jì)算機(jī)的性能。人工智能和深度學(xué)習(xí)需要大量的浮點(diǎn)計(jì)算,在高性能計(jì)算領(lǐng)域,GPU需求在不斷增強(qiáng)。目前NVIDIA的高性能顯卡已經(jīng)占有84%的市場(chǎng)份額。亞馬遜的AWS,F(xiàn)acebook,Google等世界一級(jí)數(shù)據(jù)中心都需要用NVIDIA的Tesla芯片,隨著云計(jì)算和人工智能的不斷發(fā)展,我們認(rèn)為NVIDIA的GPU芯片業(yè)務(wù)在未來(lái)將繼續(xù)維持增長(zhǎng)態(tài)勢(shì),我們分拆每個(gè)領(lǐng)域的出貨量,預(yù)計(jì)將從2016年的3602萬(wàn)顆增至2018年的4175萬(wàn)顆。3資料來(lái)源:Wind,天風(fēng)證券研究所FPGA是用于解決專(zhuān)用集成電路的一種方案。專(zhuān)用集成電路是為特定用戶或特定電子系統(tǒng)制作的集成電路。人工智能算法所需要的復(fù)雜并行電路的設(shè)計(jì)思路適合用FPGA實(shí)現(xiàn)。FPGA計(jì)算芯片布滿“邏輯單元陣列”,內(nèi)部包括可配置邏輯模塊,輸入輸出模塊和內(nèi)部連線三個(gè)部分,相互之間既可實(shí)現(xiàn)組合邏輯功能又可實(shí)現(xiàn)時(shí)序邏輯功能的獨(dú)立基本邏輯單元。注意FPGA與傳統(tǒng)馮諾伊曼架構(gòu)的最大不同之處在于內(nèi)存的訪問(wèn)。FPGA在本質(zhì)上是用硬件來(lái)實(shí)現(xiàn)軟件的算法,因此在實(shí)現(xiàn)復(fù)雜算法方面有一些難度。低高資料來(lái)源:Wind,天風(fēng)證券研究所架構(gòu)方面,F(xiàn)PGA擁有大量的可編程邏輯單元,可以根據(jù)客戶定制來(lái)做針對(duì)性的算法設(shè)計(jì)。除此以外,在處理海量數(shù)據(jù)的時(shí)候,F(xiàn)PGA相比于CPU和GPU,獨(dú)到的優(yōu)勢(shì)在于:FPGA請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明更接近IO。換句話說(shuō),F(xiàn)PGA是硬件底層的架構(gòu)。比如,數(shù)據(jù)采用GPU計(jì)算,它先要進(jìn)理,這過(guò)程并沒(méi)有時(shí)間優(yōu)勢(shì);而使用FPGA的話,數(shù)據(jù)I/O接口進(jìn)入FPGA,在里面解幀后進(jìn)行數(shù)據(jù)處理或預(yù)處理,然后通過(guò)PCIE接口送入內(nèi)存讓CPU處理,一些很底層的工作已經(jīng)被FPGA處理完畢了(FPGA扮演協(xié)處理器的角色且積累到一定數(shù)量后以DMA形式傳輸?shù)絻?nèi)存,以中斷通知CPU來(lái)處理,這樣效率就高得多。資料來(lái)源:人工智能實(shí)驗(yàn)室(AiLab天風(fēng)證券研究所信號(hào)處理,圖像處理)可能需要很多個(gè)時(shí)鐘周期,而FPGA可以通過(guò)編程重組電路,直接生成專(zhuān)用電路,加上電路并行性,可能做這個(gè)特定運(yùn)算只需要一個(gè)時(shí)鐘周期。比如一般CPU每次只能處理4到8個(gè)指令,在FPGA上使用數(shù)據(jù)并行的方法可以每次處理256個(gè)請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:Altera,天風(fēng)證券研究所資料來(lái)源:Altera,天風(fēng)證券研究所看到FPGA與個(gè)人應(yīng)用和數(shù)據(jù)中心應(yīng)用的整合根據(jù)Altera內(nèi)部文件顯示,Altera很早就在研發(fā)使用FPGA針對(duì)深度學(xué)習(xí)算法的應(yīng)用,并在2015年Intel的論壇上展示了產(chǎn)品的性能。結(jié)論是在功耗和性能上相對(duì)同等級(jí)的CPU,有較大的優(yōu)勢(shì)。CPU+FPGA在人工智能深度學(xué)習(xí)領(lǐng)域,將會(huì)是未來(lái)的一個(gè)重要發(fā)展方向資料來(lái)源:Altera,天風(fēng)證券研究所ASIC(專(zhuān)用定制芯片)是為實(shí)現(xiàn)特定要求而定制的芯片,具有功耗低、可靠性高、性能高、體積小等優(yōu)點(diǎn),但不可編程,可擴(kuò)展性不及FPGA,尤其適合適合高性能/低功耗的移動(dòng)端。我們梳理針對(duì)圖像和語(yǔ)音這兩方面的人工智能定制芯片,目前主要有專(zhuān)用于圖像處理的VPU,以及針對(duì)語(yǔ)音識(shí)別的FAGA和TPU芯片。等資料來(lái)源:Google,天風(fēng)證券研究所請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明3.3.1.VPU——你是我的眼VPU是專(zhuān)門(mén)為圖像處理和視覺(jué)處理設(shè)計(jì)的定制芯片。根據(jù)特定算法來(lái)實(shí)現(xiàn)定制化的芯片架構(gòu),實(shí)現(xiàn)特定的圖像處理能力,提高效率,是VPU的基礎(chǔ)理念。集成在攝像頭中的VPU,直接對(duì)輸入圖像進(jìn)行識(shí)別理解,消除了存儲(chǔ)器的讀寫(xiě)操作。相較主流的移動(dòng)處理芯片(集成GPU的SoCVPU的尺寸更小,視覺(jué)處理運(yùn)算的效能更高。以Movidiu公司產(chǎn)品Myriad2為例,VPU芯片包括接口電路(Interfaces)、硬件加速器(HardwareAccelerators),矢量處理器陣列(ArrayofVectorProcessors),精簡(jiǎn)指令集的CPU(RISCCPU)等部分。接口電路支持多路攝像頭傳感器等外部設(shè)備,硬件加速器可以迅速的提高運(yùn)算處理速度,矢量處理器陣列專(zhuān)門(mén)針對(duì)機(jī)器視覺(jué),精簡(jiǎn)指令集的CPU(RISCCPU)主要進(jìn)行任務(wù)分配。資料來(lái)源:Movidius,天風(fēng)證券研究所資料來(lái)源:Movidius,天風(fēng)證券研究所支持圖像信號(hào)和視覺(jué)信后的流水線信號(hào)處理,而32位的CPU,進(jìn)行任務(wù)分配資料來(lái)源:Movidius,天風(fēng)證券研究所VPU能夠處理各種不同的任務(wù):利用立體攝像機(jī)的數(shù)據(jù)處理深度信息,還有來(lái)自聲納傳感器的近距離、空間定位,以及用于識(shí)別和跟隨人的先進(jìn)光流;它也可以成為虛擬現(xiàn)實(shí)、現(xiàn)實(shí)增強(qiáng)技術(shù)的核心部分,讓智能手機(jī)以及更便宜的頭戴產(chǎn)品達(dá)成現(xiàn)如今較為昂貴的系統(tǒng)才能完成的目標(biāo)。如HTCVive,這臺(tái)設(shè)備需要比較詭異的頭戴式護(hù)目鏡,還需要兩個(gè)激光盒子繪制整個(gè)空間,并追蹤用戶的運(yùn)動(dòng)。而裝備VPU通過(guò)移動(dòng)設(shè)備或者耳機(jī)就能做到這一點(diǎn);此外,具備深度學(xué)習(xí)能力的VPU,能夠在設(shè)備本地就能利用強(qiáng)悍的圖像識(shí)別計(jì)算,設(shè)備能夠看見(jiàn)和理解周?chē)氖澜?,不需要檢索云端就能做到,避免了延遲的問(wèn)題。目前,VPU的應(yīng)用市場(chǎng)有機(jī)器人、物聯(lián)網(wǎng)、智能穿戴設(shè)備、智能手機(jī)、無(wú)人駕駛、無(wú)人機(jī)請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:Movidius,天風(fēng)證券研究所結(jié)合光學(xué),在前端實(shí)現(xiàn)智能處理識(shí)別運(yùn)算的芯片,正在移動(dòng)端不斷滲透提升。在蘋(píng)果推出帶3D感應(yīng)功能的結(jié)構(gòu)光方案之后,我們預(yù)計(jì)會(huì)深度推動(dòng)市場(chǎng)在向具有人工智能功能的特定芯片端邁進(jìn)。VPU實(shí)現(xiàn)了在移動(dòng)設(shè)備端具備PC級(jí)別的圖像處理能力。通常來(lái)說(shuō)這類(lèi)圖像處理芯片能耗非常高,而且也需要電腦支持,但通過(guò)VPU,成功將高級(jí)的圖像處理方案移植到移動(dòng)設(shè)備中。在前端設(shè)備中引入帶有AI功能的新架構(gòu)芯片將帶來(lái)移動(dòng)端價(jià)值量的提升和潛在的變革。資料來(lái)源:Movidius,天風(fēng)證券研究所資料來(lái)源:Movidius,天風(fēng)證券研究所TPU(TensorProcessingUnit)是谷歌的張量處理器,它是一款為機(jī)器學(xué)習(xí)而經(jīng)過(guò)了專(zhuān)門(mén)深度機(jī)器學(xué)習(xí)方面的訓(xùn)練,它有更高效能。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:Google,天風(fēng)證券研究所Google對(duì)GPU,IntelXeonE5v3CPU和TPU進(jìn)行了性能對(duì)比。在Googl用64位浮點(diǎn)數(shù)學(xué)運(yùn)算器的18核心運(yùn)行在2.3GHz的Ha瓦,其系統(tǒng)(擁有256GB內(nèi)存)滿載時(shí)消耗455瓦特。相比之下,TPU使用8位整數(shù)數(shù)學(xué)運(yùn)算器,擁有256GB的主機(jī)內(nèi)存以及32GB的內(nèi)存,能夠?qū)崿F(xiàn)34GB/秒的內(nèi)存帶寬,瓦。但TPU是專(zhuān)為Google深度學(xué)習(xí)語(yǔ)言TensorFlow開(kāi)發(fā)的一種芯片,不具有可擴(kuò)展性。資料來(lái)源:Google,天風(fēng)證券研究所從底層架構(gòu)的變革角度看,最前沿的革新以深度學(xué)習(xí)原理打造的人工神經(jīng)網(wǎng)絡(luò)芯片。人工神經(jīng)網(wǎng)絡(luò)是模仿生物神經(jīng)網(wǎng)絡(luò)的計(jì)算架構(gòu)的總稱,由若干人工神經(jīng)元節(jié)點(diǎn)互連而成,神經(jīng)元之間通過(guò)突觸連接。每個(gè)神經(jīng)元其實(shí)是一個(gè)激勵(lì)函數(shù),突觸則是記錄神經(jīng)元間聯(lián)系的強(qiáng)弱權(quán)值。神經(jīng)網(wǎng)絡(luò)是多層的,一個(gè)神經(jīng)元函數(shù)的輸入由與其相連的上一個(gè)神經(jīng)元的輸出以及連接突觸權(quán)重共同決定。所謂訓(xùn)練神經(jīng)網(wǎng)絡(luò),就是通過(guò)不斷自動(dòng)調(diào)整神經(jīng)元之間突觸權(quán)重的過(guò)程,直到輸出結(jié)果穩(wěn)定正確。然后在輸入新數(shù)據(jù)時(shí),能夠根據(jù)當(dāng)前的突觸權(quán)重計(jì)算出輸出結(jié)果。以此來(lái)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)對(duì)已有知識(shí)的“學(xué)習(xí)”。神經(jīng)網(wǎng)絡(luò)中存儲(chǔ)和處理是一體化的,中間計(jì)算結(jié)果化身為突觸的權(quán)重。馮諾伊曼架構(gòu)的傳統(tǒng)處理器處理神經(jīng)網(wǎng)絡(luò)任務(wù)時(shí)效率低下,是由其本身的架構(gòu)限制決定的。馮諾伊曼架構(gòu)存儲(chǔ)和處理分離,基本運(yùn)算為算術(shù)和邏輯操作,這兩點(diǎn)決定了一個(gè)神經(jīng)元的低高資料來(lái)源:Wind,天風(fēng)證券研究所請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明3.4.1.寒武紀(jì)——真正的不同真正打造的類(lèi)腦芯片,寒武紀(jì)試圖將通過(guò)低功耗高性能的架構(gòu)重塑,顛覆已有的馮諾伊曼架構(gòu),實(shí)現(xiàn)在移動(dòng)端/云端的加速器實(shí)現(xiàn)。資料來(lái)源:寒武紀(jì)資料,天風(fēng)證券研究所資料來(lái)源:寒武紀(jì)資料,天風(fēng)證券研究所從寒武紀(jì)披露的數(shù)據(jù)來(lái)看,其性能遠(yuǎn)超GPU和CPU。資料來(lái)源:寒武紀(jì)資料,天風(fēng)證券研究所寒武紀(jì)試圖將代表性智能算法的處理速度和性能功耗比提升一萬(wàn)倍,在移動(dòng)端實(shí)時(shí)完成圖像語(yǔ)音和文本的理解和識(shí)別,更為重要的是通過(guò)實(shí)時(shí)訓(xùn)練,還能不斷進(jìn)化提升能力,真正實(shí)現(xiàn)超越。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:寒武紀(jì)資料,天風(fēng)證券研究所我們?cè)谇岸轮攸c(diǎn)討論了Intel和ARM的歷史發(fā)展,認(rèn)為馮諾伊曼架構(gòu)帶來(lái)了計(jì)算體系的建立并通過(guò)Intel實(shí)現(xiàn)了最大化;ARM通過(guò)共享IP的商業(yè)模式帶來(lái)了更開(kāi)放的生態(tài)體系,實(shí)現(xiàn)了軟硬件的結(jié)合延伸了人類(lèi)的觸角。同時(shí)我們認(rèn)為人工智能芯片將有可能在摩爾定律放緩維度下引發(fā)芯片底層架構(gòu)重構(gòu)的變革。本章我們重點(diǎn)討論人工智能芯片的市場(chǎng)空間測(cè)算,我們從兩個(gè)維度來(lái)進(jìn)行估算,給出詳細(xì)的拆解。維度一:市場(chǎng)規(guī)模反推芯片空間根據(jù)Nvidia官方給出的資料統(tǒng)計(jì),到2020年,由軟件、硬件、服務(wù)三者組成的人工智能市場(chǎng)將達(dá)到400億美元,其中硬件占到1/3強(qiáng),為160億美元。而硬件的核心是芯片。我們估算硬件的BOM,芯片會(huì)占到60%,芯片空間將達(dá)到96億美元。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來(lái)源:NVIDIA,天風(fēng)證券研究所維度2:詳細(xì)拆分云端/移動(dòng)端所需人工智能加速器的BOM人工智能芯片從用途來(lái)看,分為云端加速器芯片和終端(包括智能手機(jī)、無(wú)人駕駛汽車(chē)、)智能芯片。我們基于這兩個(gè)場(chǎng)景,給出結(jié)論,預(yù)測(cè)至2021年,人工智能芯片市場(chǎng)有望達(dá)資料來(lái)源:Gartner,天風(fēng)證券研究所云端加速器詳細(xì)拆解億美元,其中,云基礎(chǔ)設(shè)施服務(wù)市場(chǎng)規(guī)模達(dá)863.5億美元。請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明請(qǐng)務(wù)必閱讀正文之后的信息披露和免責(zé)申明

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論