電子行業(yè)2023年中期AI與電子共舞_第1頁
電子行業(yè)2023年中期AI與電子共舞_第2頁
電子行業(yè)2023年中期AI與電子共舞_第3頁
電子行業(yè)2023年中期AI與電子共舞_第4頁
電子行業(yè)2023年中期AI與電子共舞_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

01證券研究報告 *

請務(wù)必閱讀最后一頁免責(zé)聲明證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明AI

與電子共舞民生電子團(tuán)隊2023年6月28日——電子行業(yè)2023年中期投資策略證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明2核心觀點以ChatGPT為代表的生成式AI,正引領(lǐng)科技產(chǎn)業(yè)的全新變革。電子產(chǎn)業(yè)作為基礎(chǔ)硬件,在AI浪潮中不可或缺。我們在此將電子AI標(biāo)的分為三大賽道:算力、邊緣域、Chiplet,并分別討論其投資思路。一、算力:大模型百花齊放之際,算力緊缺或?qū)⒊蔀槌B(tài)。AI服務(wù)器相較傳統(tǒng)服務(wù)器價值量大幅提升,從服務(wù)器整機(jī)到光模塊、PCB,參與全球競爭的龍頭公司,都有望具有較強(qiáng)的業(yè)績彈性。我們于2月22日發(fā)布的報告《

ChatGPT開啟行業(yè)變革,Chiplet引領(lǐng)破局之路》中,量化測算了AI服務(wù)器的中遠(yuǎn)期需求。同時,國產(chǎn)化驅(qū)動下,本土算力芯片也在加速跟進(jìn)全球龍頭的步伐。從訓(xùn)練到推理,均有長足突破。我們于3月19日發(fā)布的專題報告《國產(chǎn)AI算力芯片全景圖》,對國內(nèi)上市及未上市的算力芯片公司,做了系統(tǒng)梳理。二、邊緣域:如果說算力是供給側(cè),那么邊緣域則代表需求側(cè)。我們認(rèn)為邊緣域是未來的投資重點,全球龍頭紛紛下注,谷歌推出輕量化大語言模型PaLM

2,高通也在加強(qiáng)布局

AI和智能網(wǎng)聯(lián)邊緣領(lǐng)域。就投資方向來看:硬件側(cè),我們看好音頻產(chǎn)業(yè)率先發(fā)力。音頻作為輕交互的方式,更適用于碎片化場景。無論是智能音箱(智能家居)還是耳機(jī)(可穿戴設(shè)備),都已有諸多AI應(yīng)用涌現(xiàn)出來。而視頻則會隨后發(fā)力,成為全球龍頭決勝賽道。AIGC內(nèi)容快速增長下,海量及高清化視頻作為物聯(lián)網(wǎng)的絕對入口,對傳輸速率上限和帶寬提出更高的要求。同時,Meta發(fā)布SAM模型,也會加速機(jī)器視覺發(fā)展。高清視頻也對數(shù)字芯片提出更高的性能要求,有助產(chǎn)業(yè)鏈價量齊升。三、Chiplet:Chiplet是算力時代的主流方案。海外龍頭公司已經(jīng)率先發(fā)力,國內(nèi)算力芯片也將迎頭趕上。Nvdia的H100采用臺積電CoWoS

2.5D封裝,并配備最高80GB

HBM3。AMD則推出了更大規(guī)模的Chiplet產(chǎn)品,MI300

AI加速卡擁有13個小芯片。目前來看:1)封測廠商方面,為了滿足Chiplet的全新需求,主要發(fā)力中段的晶圓級封裝(Bumping)和后段的OS環(huán)節(jié)。2)設(shè)備廠商方面,Chiplet對晶圓級封裝設(shè)備及后道封測設(shè)備,都提出了更高的性能要求。3)材料方面,IC載板、ABF膜/可剝銅箔也是國產(chǎn)化替代的重點方向。我們看好AI產(chǎn)業(yè)加速發(fā)展,算力、邊緣域、Chiplet三大賽道至關(guān)重要。算力為供給側(cè),是AI產(chǎn)業(yè)發(fā)展的基石;邊緣域為需求側(cè),為AI應(yīng)用提供硬件落地;Chiplet則是算力時代的主流方案,也是未來技術(shù)發(fā)展的核心方向。建議關(guān)注相關(guān)產(chǎn)業(yè)鏈的投資機(jī)遇:1)算力:芯原股份、滬電股份、聯(lián)想集團(tuán)、工業(yè)富聯(lián);2)邊緣AI:安克創(chuàng)新、國光電器、樂鑫科技、晶晨股份;3)Chiplet:長電科技、甬矽電子、興森科技、長川科技。風(fēng)險提示:產(chǎn)業(yè)研發(fā)進(jìn)展不及預(yù)期的風(fēng)險;下游需求不及預(yù)期的風(fēng)險;競爭格局變化的風(fēng)險。證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明目錄CONTENT

S3AI芯片:算力核芯02服務(wù)器產(chǎn)業(yè)鏈:算力基座03回望GPT發(fā)展歷程,AI的“iPhone”時刻到來01邊緣域:催生邊緣芯片需求04Chiplet:助力AI芯實現(xiàn)算力跨越05重點公司盈利預(yù)測06風(fēng)險提示07證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明“iPhone”時刻到來01.

回望GPT發(fā)展歷程,AI的4證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明1.1資料來源:中國信通院《人工智能生成內(nèi)容白皮書》,民生證券研究院5ChatGPT

:AI的“iPhone“時刻到來近年來生成式AI步入快速發(fā)展期。1950年開始生成式AI出現(xiàn)早期萌芽,此后AIGC處于漫長的沉淀積累期,決策式AI占據(jù)主流。隨著2014年生成式對抗網(wǎng)絡(luò)等深度學(xué)習(xí)算法的提出,AIGC步入快速發(fā)展期,生成內(nèi)容的豐富度和精度都有了較大的提升。ChatGPT

為AI的“iPhone“時刻。3月21日,英偉達(dá)CEO黃仁勛在GTC

2023大會上將ChatGPT比作AI的“iPhone“時刻,AI時代加速來臨,推動生成式AI加速發(fā)展。從GPT-1到GPT-3.5,GPT模型的智能化程度不斷提升,

ChatGPT在擁有3000億單詞的語料基礎(chǔ)上預(yù)訓(xùn)練出擁有1750億個參數(shù)的模型(GPT-2僅有15億參數(shù)),預(yù)訓(xùn)練數(shù)據(jù)量從5GB增加到45TB。圖:AI模型發(fā)展歷程證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明6全球AI大模型進(jìn)展迅速1.2百度文心一言3月16日3月29日4月8日4月10日4月11日4月18日三六零大模型360

AI華為大模型盤古模型商湯大模型阿里大模型同花順AI產(chǎn)品阿里行業(yè)應(yīng)用模型科大訊飛AI學(xué)習(xí)機(jī)星火認(rèn)知大模型5月6日谷歌I/O大會,推出AI+Gmail&DOC5月10日騰訊發(fā)布MaaS能力全景圖微軟開發(fā)者大會發(fā)布新Windows等5月23日6月9日4月17日昆侖萬維「天工」3.5大語言模型4月13日 4月14日發(fā)布基于Web3的GPT大模型5月31日金山辦公發(fā)布WPS365、WPS

AI訊飛星火認(rèn)知大模型

V1.5發(fā)布6月13日360智腦大模型應(yīng)用發(fā)布會6月19日資料來源:金十?dāng)?shù)據(jù),快科技,新浪科技,澎湃,IT之家等,民生證券研究院整理圖:全球AI大模型進(jìn)展證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明7API端口開放+插件引入,海量應(yīng)用邁入AI新時代1.3資料來源:Open

AI,民生證券研究院Plugin開啟AI的“APP

Store“時代,生態(tài)版圖進(jìn)一步擴(kuò)展。2023年3月2日,Open

Al

推出了自然語言對話模型GPT-3.5-Turbo和語音轉(zhuǎn)文本模型

Whisper

models

的開發(fā)者

API,使得多種應(yīng)用程序可通過API的方式接入ChatGPT。3月24日,ChatGPTplugins的發(fā)布,進(jìn)一步擴(kuò)大了ChatGPT的應(yīng)用能力并催化至多場景的業(yè)務(wù)處理能力,AI的“APP

Store“時代到來。插件商城接入10余家應(yīng)用,具備檢索實時信息、檢索知識庫信息和代替用戶操作應(yīng)用功能。圖:Whisper

models

的開發(fā)者

API&

Plugin 圖:ChatGPT

plugins可接入的應(yīng)用證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明AI+電子全景圖1.48算力邊緣域服務(wù)器

聯(lián)想集團(tuán)工業(yè)富聯(lián)算力芯片寒武紀(jì)景嘉微海光信息PCB

滬電股份勝宏科技其他芯片晶豐明源江波龍電源芯片杰華特IP

芯原股份智能終端惠威科技

國光電器數(shù)字芯片

晶晨股份瑞芯微

全志科技

中科藍(lán)訊炬芯科技恒玄科技樂鑫科技富瀚微封裝測試Chiplet

長電科技甬矽電子華天科技通富微電偉測科技設(shè)備IP

芯原股份長川科技華峰測控新益昌材料

興森科技華正新材方邦股份IP

芯原股份

安克創(chuàng)新漫步者奮達(dá)科技裕太微

傳音控股小米集團(tuán)創(chuàng)維數(shù)字佳禾智能螢石網(wǎng)絡(luò)資料來源:民生證券研究院整理證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明902.

AI芯片:算力核芯*

請務(wù)必閱讀最后一頁免責(zé)聲明AI芯片:GPGPU+ASIC+FPGA2.1證券研究報資告料來源:華為云,芯東西,安寶磊《AI芯片的落地場景和關(guān)鍵技術(shù)分析》,民生證券研究院整理10圖形處理器(GPU)通用圖形處理器(GPGPU)現(xiàn)場可編程門陣列(FPGA)專用集成電路(ASIC)圖例定制化程度通用型通用型半定制化全定制化優(yōu)點編程靈活性高,相比CPU,有更高的并行計算能力;有成熟的軟件生態(tài)相較傳統(tǒng)GPU計算能力更高;通用性強(qiáng);具有軟件棧的易用性及豐富的軟件生態(tài)半定制,可對芯片硬件層進(jìn)行編程和配置;相對于GPU,功耗更低定制化帶來的低成本、低功耗、高性能特點缺點相對于FPGA和ASIC,價格和功耗較高能效比有待提升硬件編程語言難以掌握;功耗和成本有壓縮空間芯片通用性差;可編程架構(gòu)設(shè)計難度高、研發(fā)周期長、研發(fā)成本高AI芯片一般泛指所有用來加速AI應(yīng)用,尤其是用在基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)中的硬件。根據(jù)技術(shù)架構(gòu),可分為

GPU、

FPGA、

ASIC。GPGPU——優(yōu)勢:1)生態(tài)完善;2)可進(jìn)行通用計算,應(yīng)用范圍廣;3)目前算力最強(qiáng)。缺點:1)無法針對特定場景優(yōu)化;2)成本高。ASIC——優(yōu)勢:1)相同價格下算力強(qiáng)大;2)單算力功耗??;3)可以針對特定場景進(jìn)行優(yōu)化。缺點:1)沒有完整生態(tài),開發(fā)、使用成本高;2)通用性差,只能支持特定運算,如矩陣運算等。表:不同AI芯片架構(gòu)對比證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明2.2 AI芯片競爭格局:英偉達(dá)保持領(lǐng)先地位資料來源:IDC,民生證券研究院11據(jù)IDC數(shù)據(jù),2022年中國AI加速卡出貨量約為109萬張,其中英偉達(dá)在中國AI加速卡市場份額為85%,華為市占率為10%,百度市占率為2%,寒武紀(jì)和燧原科技均為1%。英偉達(dá)GPU產(chǎn)品憑借其性能優(yōu)勢在全球主要云平臺中得到了廣泛運用,如亞馬遜AWS、Google

Compute

Engine、阿里云等廠商云平臺的主要AI芯片均采購自英偉達(dá)。85%1%2%

10%1% 2%英偉達(dá) 華為 百度 寒武紀(jì) 燧原科技 其他圖:2022中國AI加速卡出貨量占比云平臺GPU產(chǎn)品型號亞馬遜AWS英偉達(dá)A100、V100、K80、A10G、T4G、Tesla

M60,RadeonPro

V520GoogleCompute

Engine英偉達(dá)L4、P100、P4、T4、V100、A100,TPU

v4

Pod、TPU

v3

Pod、TPU

v2

Pod騰訊云英偉達(dá)A10、A100、Tesla

V100、Tesla

P40、TeslaT4、Tesla

P4百度云英偉達(dá)A100、V100、A10阿里云英偉達(dá)A100、V100、A10、P100、P4、T4資料來源:各平臺官網(wǎng),民生證券研究院表:全球主要云平臺AI芯片配置情況證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明AI芯片市場空間:GPU為主,2021-2026年CAGR增速近30%資料來源:Frost&Sullivan、觀研天下,民生證券研究院122021年全球人工智能芯片市場規(guī)模為255億美元,據(jù)Frost&Sullivan預(yù)計,2026年市場規(guī)模將增長至920億美元,CAGR達(dá)29.3%。據(jù)IDC數(shù)據(jù),2022年中國仍以GPU為主實現(xiàn)數(shù)據(jù)中心計算加速,GPU在人工智能芯片市場中出貨量占比達(dá)86%。NPU占比達(dá)12%,較以往具有明顯增長。NPU芯片設(shè)計邏輯更為簡單,在處理推理工作負(fù)載時具有顯著的能耗節(jié)約優(yōu)勢。CAGR

+29.3%2.21752553614906307769201000900800700600500400300200100020202021 2022E2023E2024E2025E2026E圖:2020-2026全球人工智能芯片市場規(guī)模及預(yù)測(億美元)85.6%12.3%GPU NPU ASIC

FPGA圖:2022中國人工智能芯片出貨量占比1.7% 0.3%資料來源:IDC,民生證券研究院證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明AI芯片的硬件性能指標(biāo)2.3GPU在硬件方面的核心能力包括:算力:單位是FLOPS或者TOPS,表示GPU在單位時間內(nèi)的峰值運算次數(shù),是GPU的核心性能指標(biāo)。功耗:GPU的功耗和算力、制程、硬件架構(gòu)等因素有關(guān),相同算力情況下,功耗越大,意味著數(shù)據(jù)中心的運營成本越高,同時對服務(wù)器的電源、制冷都會有更高的要求。片間互聯(lián):大型AI訓(xùn)練需要使用多個GPU服務(wù)器,在服務(wù)器外部互聯(lián)通常使用光纖或高速電纜,而服務(wù)器內(nèi)部GPU之間(通常為8個),則使用NVLink等片間互聯(lián)技術(shù)進(jìn)行數(shù)據(jù)交互,如果片間互聯(lián)傳輸速率低于服務(wù)器外部傳輸速率,則可能會成為瓶頸。顯存帶寬:GPU與系統(tǒng)內(nèi)存之間的數(shù)據(jù)傳輸速率,單位GB/s;如果顯存帶寬不足,則系統(tǒng)會出現(xiàn)瓶頸,GPU運算核心可能處于空閑狀態(tài),但通常影響不大。算力顯存:顯存的大小在幾個GB到幾十GB之間,用于存儲運算中間過程的臨時數(shù)據(jù),在GPU算力足夠的情況下,顯存越大,讀取次數(shù)越小,延時越低。顯存功耗片間互聯(lián)13資料來源:英偉達(dá)官網(wǎng),民生證券研究院圖:英偉達(dá)A100

GPU規(guī)格示例*

請務(wù)必閱讀最后一頁免責(zé)聲明硬件性能:算力是AI芯片的核心參數(shù)2.3精度定義FP64雙精度浮點運算,精度為64位,通常用于HPCFP32單精度浮點數(shù),精度為32位,是神經(jīng)網(wǎng)絡(luò)計算的標(biāo)準(zhǔn)類型FP16半精度浮點數(shù),精度為16位,在對訓(xùn)練速度有需求的情況下也可用于訓(xùn)練BF16對FP32截斷數(shù)據(jù),8bit表示指數(shù),7bit表示小數(shù),和FP32精度相同但吞吐量更高TF32用Tensor

Core運算,默認(rèn)使用矩陣乘法,精度和FP32相同,但運算速度更快TF16用Tensor

Core運算,精度為16位INT8用CUDA

Core中的INT單元計算,8位整數(shù),通常用于推理一般而言,AI芯片采用16-32位精度算力進(jìn)行訓(xùn)練,采用8位精度算力進(jìn)行推理,而64位精度算力通常用于高性能計算場景。海外龍頭英偉達(dá)的H100芯片是目前市場上算力最高的產(chǎn)品,其他廠商均處于追趕狀態(tài)。國內(nèi)來看,寒武紀(jì)、海光、昇騰、沐曦等廠商進(jìn)展較快。高性能計算AI訓(xùn)練AI推理注:此處未展示廠商最新產(chǎn)品14NVIDIAH100

SXMAMD

MI250X寒武紀(jì)MLU370-X82壁礪100P2昇騰910曦思MXN100制程(nm)467777INT8算力(TOPS)39583832561920640160FP16算力197938396/32080BF16算力197938396960//內(nèi)存類型HBM2EHBM2ELPDDR5HBM2E/HBM2E內(nèi)存容量(GB)801284864//內(nèi)存帶寬(GB/s)34303276614.41679//互聯(lián)帶寬(GB/s)900/200448//證券研究報告 資料來源:各公司官網(wǎng),民生證券研究院表:AI芯片不同算力精度定義表:國內(nèi)外廠商AI芯片相關(guān)參數(shù)對比資料來源:英偉達(dá)、微軟官網(wǎng),甲子光年,CSDN,電子發(fā)燒友,民生證券研究院*

請務(wù)必閱讀最后一頁免責(zé)聲明硬件性能:片間互聯(lián)是AI芯片之間的數(shù)據(jù)交互的渠道2.3廠商型號互聯(lián)帶寬GB/s英偉達(dá)A100/A100

SXMNVLINK

600T432A800NVLink

400H100/H100SXMNVLink600/900AMDMI250X100寒武紀(jì)MLU290-M5600MLU370-X8200海光深算一號184沐曦MXN100-MXC500-天數(shù)Big

Island64壁仞B(yǎng)R

100P448昇騰昇騰930-燧原云燧T2130015證券研究報告 資料來源:搜狐新聞,民生證券研究院資料來源:各公司官網(wǎng),海光信息招股書,民生證券研究院在AI服務(wù)器中,GPU之間通常通過NVLink/NVSwitch等技術(shù)進(jìn)行GPU之間的通信,GPU再通過PCIe總線連接到PCIe

Switch,與CPU、外部服務(wù)器等進(jìn)行數(shù)據(jù)交互。GPU吞吐量越大,則所需的片間互聯(lián)傳輸速率和PCIe總線傳輸速率也越大,以A100為例,其NVLink傳輸速率為600GB/s,PCIe4.0總線雙向傳輸速率最大為64GB/s。圖:8GPU的片間互聯(lián)方案 表:AI芯片片間互聯(lián)能力對比*

請務(wù)必閱讀最后一頁免責(zé)聲明軟件生態(tài):衡量AI芯片公司能力更重要的因素2.3深度學(xué)習(xí)框架K8S集群運算符計算架構(gòu)容器平臺GPU、網(wǎng)卡等硬件編程語言廠商OpenCL蘋果等CUDA英偉達(dá)ROCmAMD框架名稱維護(hù)方支持語言TensorFlowGoogleC++/Python/Java/R等KerasGooglePython/RCaffeBVLCC++/Python/MatlabPyTorchFacebookC/C++/PythonTheanoUdeMPythonCNTKMicrosoftC++/Python/C#/.NET/Java/RMXNetDMLCC++/Python/R等PaddlePaddle百度C++/PythonDeeplearning4jEclipseJava/Scala等ONNXMicrosoft/FacebookPython/R16證券研究報告 資料來源:英偉達(dá)官網(wǎng),民生證券研究院資料來源:大數(shù)據(jù)DT,民生證券研究院GPU的軟件生態(tài)核心包括兩個部分:深度學(xué)習(xí)框架:一套對深度學(xué)習(xí)算法進(jìn)行模塊化封裝的開發(fā)工具。英偉達(dá)基于CUDA技術(shù)在2014年推出了深度學(xué)習(xí)庫cuDNN,同時英偉達(dá)的GPU也支持基于TensorFlow、PyTorch的TensorRT等深度學(xué)習(xí)庫。計算架構(gòu):異構(gòu)編程語言,是實現(xiàn)異構(gòu)計算單元(CPU/GPU/DSP/ASIC/FPGA等)在同一個計算框架下的關(guān)鍵。目前主流的GPU編程語言包括英偉達(dá)開發(fā)的CUDA、AMD開發(fā)的ROCm以及開源的OpenCL。其中CUDA和OpenCL分別主要被英偉達(dá)和AMD采用。由于目前CUDA是最主流的深度學(xué)習(xí)架構(gòu),因此市面上大部分GPU相關(guān)軟件都是用CUDA開發(fā),兼容CUDA可以大幅降低國產(chǎn)GPU的開發(fā)難度,提升產(chǎn)品可用度,增加產(chǎn)品穩(wěn)定性,而部分廠商則選擇推廣自己的軟件生態(tài),如寒武紀(jì)、百度等。圖:英偉達(dá)人工智能企業(yè)軟件層證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明訓(xùn)練:單模型訓(xùn)練成本近1200萬美金17以O(shè)pen

AI的GPT-3模型為例,擁有1750億個參數(shù),租用Azure云服務(wù)器進(jìn)行運算的成本約為200萬美金,而實際由于訓(xùn)練通常不止一次,且訓(xùn)練過程中還包括參數(shù)的調(diào)整等,參考Alchemy

API創(chuàng)始人Elliot

Turner估計,訓(xùn)練GPT-3的成本可能接近1200萬美金。訓(xùn)練成本模型參數(shù)Token數(shù)每Token單參數(shù)所需浮點運算次數(shù)芯片算力單位時間訓(xùn)練成本算力利用率公司模型名稱最新參數(shù)(億個)訓(xùn)練數(shù)據(jù)量(GB)Token數(shù)(億個)需算力(PFLOPS-day)使用芯片算力(PLOPs)租用單價(美元/h)訓(xùn)練成本(萬美元)Open

AIGPT

317504500030009874A1000.1561.4209騰訊混元1000017000113321316A1000.1561.44512.4按照ChatGPT計算用3000億個token對應(yīng)45TB數(shù)據(jù),一個Token大概對應(yīng)150個字節(jié)假設(shè)實際AI模型訓(xùn)練的算力利用率約為40%假設(shè)AI訓(xùn)練通常使用TF32(單精度浮點數(shù)算力),則使用A100對應(yīng)的算力為156TFLOPS按照Azure官網(wǎng)報價,8顆A100芯片服務(wù)器的租用價格最低可以降到約11美元/小時,即單顆1.4美元/小時左右。資料來源:Sunyan’s

Substack,量子位,CSDN,Azure官網(wǎng),英偉達(dá)官網(wǎng),民生證券研究院測算證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明推理:遠(yuǎn)期芯片及服務(wù)器需求快速增長181.

目前每日谷歌搜索量超過35億次,假設(shè)每次用戶提問10次,每次回答產(chǎn)生token數(shù)量為200個,訪問峰值流量是日均流量的5倍,算力利用率為20%;2.

AI推理通常使用INT8算力,則使用A100對應(yīng)的算力為624TOPS;3.

按照Azure官網(wǎng)報價,8顆A100芯片服務(wù)器的租用價格最低可以降到約11美元/小時,即單顆1.4美元/小時左右。推理成本模型參數(shù)回答Token數(shù)每Token單參數(shù)所需INT運算次數(shù)芯片算力單位時間訓(xùn)練成本算力利用率推理次數(shù)峰值流量倍數(shù)2.4項目數(shù)量日活(萬次)350000假設(shè)每次互動提問次數(shù)(次)10假設(shè)每個回答Token數(shù)200模型參數(shù)(億個)1750每Token推理所需運算次數(shù)2假設(shè)訪問峰值流量/日均流量5假設(shè)算力利用率20%芯片INT8算力(A100)(TOPS)624每天運算時間(秒)86400所需芯片顆數(shù)(顆)1136077所需服務(wù)器臺數(shù)(臺)142010近期:假如谷歌所有文字搜索場景全部接入chatgpt,按照gpt3的參數(shù)數(shù)量(1750億)計算,所需服務(wù)器數(shù)量仍然超過10萬臺量級。遠(yuǎn)期:考慮到未來模型參數(shù)呈指數(shù)級增長,且除文字交互外,未來圖像、視頻等多種形態(tài)對算力資源的消耗量或?qū)⒊蓴?shù)倍級增長,遠(yuǎn)期推理側(cè)所需服務(wù)器數(shù)量需求或?qū)⒊蓴?shù)倍級提升。表:近期服務(wù)器需求量測算資料來源:academic

accelerator,

Sunyan’s

Substack,英偉達(dá)官網(wǎng),Azure官網(wǎng),民生證券研究院測算證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明192.5項目海光NVIDIAAMD品牌深算一號Ampere

100MI100生產(chǎn)工藝7nm

FinFET7nm

FinFET7nm

FinFET核心數(shù)量4096(64

CUs)2560

CUDAprocessors640Tensor

processors120CUs內(nèi)核頻率Upto1.5GHz

(FP64)Upto

1.7Ghz(FP32)Upto

1.53GhzUpto

1.5GHz(FP64)Upto1.7Ghz

(FP32)顯存容量32GB

HBM280GB

HBM2e32GB

HBM2顯存位寬4096

bit5120

bit4096bit顯存頻率2.0

GHz3.2

GHz2.4

GHz顯存帶寬1024

GB/s2039

GB/s1228

GB/sTDP350

W400

W300WCPUtoGPU

互聯(lián)PCIeGen4x

16PCIeGen4x

16PCIeGEN4x

16GPUtoGPU

互聯(lián)xGMIx2,Upto

184GB/sNVLinkupto

600GB/sInfinityFabricx

3,upto276

GB/s海光信息:CPU與DCU協(xié)同發(fā)展資料來源:海光信息官網(wǎng)、海光信息招股說明書,民生證券研究院CPU:公司CPU產(chǎn)品按不同業(yè)務(wù)場景分成了高、中、低端的7000、5000、3000系列。海光CPU生態(tài)優(yōu)勢凸顯,國內(nèi)各大系統(tǒng)廠商,如曙光、浪潮、聯(lián)想、新華三、同方等都選用了海光的方案。下一代CPU產(chǎn)品海光四號、海光五號研發(fā)進(jìn)展順利。DCU:主要面向智能計算以及人工智能市場,采用GPGPU

模式,且支持FP64位運算。海光

DCU系列產(chǎn)品可兼容通用的“類CUDA”環(huán)境,可廣泛應(yīng)用于大數(shù)據(jù)處理、人工智能、商業(yè)計算等應(yīng)用領(lǐng)域。深算一號DCU部分參數(shù)已接近英偉達(dá)、AMD的高端GPU產(chǎn)品。風(fēng)險提示:行業(yè)競爭加劇的風(fēng)險;行業(yè)景氣度波動的風(fēng)險;行業(yè)技術(shù)路線變化的風(fēng)險;產(chǎn)品進(jìn)展不及預(yù)期。表:海光DCU:深算一號與NVIDIA、AMD高端GPU產(chǎn)品對比圖:海光CPU產(chǎn)品性能參數(shù)系列7000系列CPU5000系列CPU3000系列CPU核心規(guī)模16-32個核心8-16個核心4-9個核心PCIe通道128路64路32路DDR4通道8個4個2個內(nèi)存容量2TB1TB下游市場數(shù)據(jù)中心、云計算中心云計算、邊緣計算、分布式存儲等入門級服務(wù)器、工作站、工業(yè)控制等市場證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明寒武紀(jì):國內(nèi)ASIC領(lǐng)先企業(yè)2.5資料來源:寒武紀(jì)2022年年報,民生證券研究院20寒武紀(jì)成立于2016年,專注于人工智能芯片產(chǎn)品的研發(fā)與技術(shù)創(chuàng)新,是國際上少數(shù)幾家全面系統(tǒng)掌握智能芯片及其基礎(chǔ)系統(tǒng)軟件研發(fā)和產(chǎn)品化核心技術(shù)的企業(yè)之一。公司堅持自主研發(fā),目前公司的主要產(chǎn)品線包括云端產(chǎn)品線、邊緣產(chǎn)品線、IP

授權(quán)及軟件。公司思元370系列智能加速卡共有三種型號以適配不同場景,其中MLU370-X4及MLU370-X8加速卡的INT8算力均高達(dá)256TOPS。產(chǎn)品型號MLU370-S4MLU370-X4MLU370-X8面向市場機(jī)器視覺/推理任務(wù)互聯(lián)網(wǎng)行業(yè)等推理任務(wù)或訓(xùn)推一體場景訓(xùn)練任務(wù)市場特點整機(jī)計算密度較高單卡算力需求適中單卡算力需求較高單卡算力需求較高,互聯(lián)帶寬需求高算力192TOPS

(INT8)96TOPS

(INT16)72TFLOPS

(FP16)72TFLOPS

(BF16)18TFLOPS

(FP32)256TOPS

(INT8)128TOPS

(INT16)96TFLOPS

(FP16)96TFLOPS

(BF16)24TFLOPS

(FP32)256TOPS

(INT8)128TOPS

(INT16)96TFLOPS

(FP16)96TFLOPS

(BF16)24TFLOPS

(FP32)互聯(lián)帶寬307.2

GB/s307.2

GB/s614.4

GB/s資料來源:寒武紀(jì)2022年半年報,民生證券研究院表:寒武紀(jì)主要產(chǎn)品表:思元370系列產(chǎn)品參數(shù)產(chǎn)品線產(chǎn)品類型寒武紀(jì)主要產(chǎn)品云端產(chǎn)品線云端智能芯片及加速卡思元100(MLU100)思元270(MLU270)思元290(MLU290)思元370(MLU370)訓(xùn)練整機(jī)玄思

1000

智能加速器玄思

1001

智能加速器邊緣產(chǎn)品線邊緣智能芯片及加速卡思元

220(MLU220)芯片及邊緣智能加速卡IP授權(quán)及軟件終端智能處理器

IP寒武紀(jì)

1A

處理器寒武紀(jì)

1H

處理器寒武紀(jì)

1M

處理器基礎(chǔ)系統(tǒng)軟件平臺寒武紀(jì)基礎(chǔ)軟件開發(fā)平臺(適用于

公司所有芯片與處理器產(chǎn)品)證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明2.5 景嘉微:國內(nèi)圖形GPU領(lǐng)軍企業(yè)2014國內(nèi)首款高性能GPU芯片-JM5400研制成功2018第二代圖形處理器芯片JM7200研制成功2020JM72系列產(chǎn)品完成與國產(chǎn)CPU、國產(chǎn)操作系統(tǒng)、國產(chǎn)軟件、國產(chǎn)整機(jī)等適配工作,并實現(xiàn)規(guī)?;瘧?yīng)用202192

系列GPU

芯片研制成功2022.5完成JM9系列第二款圖形處理芯片的流片、封裝工作產(chǎn)品型號JM5400JM7200JM92系列發(fā)布年份201520182021核心頻率<=550MHz<=1300MHz<=1500MHz顯存1GB

DDR34GB

DDR38GB

GDDR6顯存帶寬12.8GB/s17GB/s128GB/s功耗6W10-40W<30W算力(FP32)--1.5TFlops應(yīng)用領(lǐng)域軍用領(lǐng)域通用領(lǐng)域可以滿足地理信息系統(tǒng)、媒體處理、CAD輔助設(shè)計、游戲、虛擬化等高性能顯示需求和人工智能計算需求軟件合作伙伴基礎(chǔ)硬件合作伙伴公司產(chǎn)品已與國內(nèi)多家軟硬件品牌完成適配JM系列產(chǎn)品持續(xù)迭代:2021年公司推出可滿足人工智能計算需求的JM92系列產(chǎn)品,22年5月已完成JM9系列第二款圖形處理芯片的流片、封裝工作;從JM5到JM9系列,產(chǎn)品性能不斷提升,應(yīng)用領(lǐng)域從軍用逐漸向外拓展。資料來源:景嘉微官網(wǎng),景嘉微公司公告,愛集微,民生證券研究院21證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明2.5 芯原股份:全球領(lǐng)先的IP提供商資料來源:芯原股份公司官網(wǎng),芯原股份官方微信公眾平臺,民生證券研究院芯原股份是基于自主IP的全球領(lǐng)先芯片定制服務(wù)公司,目前已形成了六大自主可控的IP組合,包括圖形處理器IP、神經(jīng)網(wǎng)絡(luò)處理器IP、顯示處理器IP、視頻處理器IP、數(shù)字信號處理器IP和圖像信號處理器IP。算力領(lǐng)域,公司內(nèi)置內(nèi)置芯原GPGPU

IP的Chiplet芯片算力可達(dá)8

TFLOPS,內(nèi)置芯原NPU

IP的Chiplet芯片算力可達(dá)240

TOPS,并且公司已經(jīng)助力藍(lán)洋智能部署基于Chiplet架構(gòu)的芯片產(chǎn)品,使得藍(lán)洋智能成為全球第一家采用Chiplet架構(gòu)技術(shù)開發(fā)大算力AI芯片的半導(dǎo)體公司。風(fēng)險提示:下游需求不及預(yù)期;上游產(chǎn)能供給受限;市場競爭加??;產(chǎn)品進(jìn)展不及預(yù)期。圖:芯原股份核心IP產(chǎn)品 圖:芯原股份VIP940022證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明2303.

服務(wù)器產(chǎn)業(yè)鏈:算力基座證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明傳統(tǒng)服務(wù)器和AI服務(wù)器BOM3.1整機(jī)6000美金算力芯片存儲PCB2900美金260美金整機(jī)20萬美金算力芯片存儲PCB2萬美金1300美金8萬美金模擬模擬60美金332美金DGX

A100服務(wù)器搭載8張A100,售價20萬美金,其他品牌方面,如超微搭載8張A100的服務(wù)器售價達(dá)13萬美金左右單張A100卡售價1萬美金,H100卡售價3萬美金,AI服務(wù)器拉滿需要8張;算力芯片為AI服務(wù)器各硬件中成本占比最高的部分AI服務(wù)器中PCB面積基本不變,PCB材質(zhì)提高、層數(shù)由14/16層提高至20層以上,價值量可達(dá)普通服務(wù)器PCB的5倍以上普通服務(wù)器256G內(nèi)存+16T

HHD/960G

SSD混合RAID,而AI服務(wù)器所需DRAM/NAND分別8倍/3倍于普通服務(wù)器,RAID卡價值量亦有所提升AI服務(wù)器每顆GPU對應(yīng)1顆多相控制器及16顆DrMos,8顆GPU帶來272美金增量無,一般采用集顯傳統(tǒng)服務(wù)器 → AI服務(wù)器24資料來源:財聯(lián)社,證券日報,新浪財經(jīng),聯(lián)想官網(wǎng),淘寶國際,京東,民生證券研究院證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明相比傳統(tǒng)服務(wù)器,AI服務(wù)器最大的區(qū)別是采用異架構(gòu),包括CPU+GPU、CPU+ASIC、CPU+FPGA等多種形態(tài),GPU更擅長數(shù)據(jù)密集、易于并行的AI計算,而傳統(tǒng)服務(wù)器往往采用X86架構(gòu),僅使用CPU而無需使用GPU。其他主要組成包括內(nèi)存、硬盤、主板、電源、網(wǎng)卡、風(fēng)扇、導(dǎo)風(fēng)罩等,用量及單機(jī)價值量在AI服務(wù)器中有不同程度提高當(dāng)前AI服務(wù)器出貨量在整體服務(wù)器中所占比重較低,根據(jù)Trendforce數(shù)據(jù),2022年AI服務(wù)器出貨量占比近1%。隨著ChatGPT點燃AI浪潮,AI服務(wù)器市場規(guī)模迅速擴(kuò)張,根據(jù)IDC數(shù)據(jù),預(yù)計2023年全球AI服務(wù)器市場規(guī)模將達(dá)到211億美元,并在2025年增長至317.9億美元,期間CAGR達(dá)22.7%AI服務(wù)器市場集中度相對較高,根據(jù)IDC數(shù)據(jù),浪潮、戴爾、惠普、聯(lián)想、華三前五大AI服務(wù)器制造商占據(jù)整體份額的47.2%,其中國產(chǎn)廠商浪潮、聯(lián)想、華三分別占據(jù)總市場的15.1%/5.6%/4.7%3.125圖:英偉達(dá)DGX

A100

AI服務(wù)器AI服務(wù)器:AI算力基座資料來源:IDC,Trendforce,英偉達(dá)官網(wǎng),民生證券研究院圖:1H22全球AI服務(wù)器競爭格局15.1%14.1%7.7%5.6%4.7%2.3%

3.9%1.0%45.1%InspurDellHPELenovoH3CIBMCiscoOracleOthers證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明全球第三服務(wù)器品牌,僅次于DELL、HPE,1Q23市場份額達(dá)7.1%。海外客戶占比70%+,客戶包括微軟,亞馬遜,百度,騰訊等各大互聯(lián)網(wǎng)云廠商。英偉達(dá)全球戰(zhàn)略合作伙伴,是中國大陸唯一的英偉達(dá)數(shù)據(jù)中心/工作站/邊緣計算三重認(rèn)證伙伴(其他認(rèn)證伙伴包括Dell和supermicro)ISG業(yè)務(wù)提速:22-23財年Q1\Q2\Q3\Q4的ISG基礎(chǔ)設(shè)施服務(wù)分別實現(xiàn)同比增速

14%/33%/48%/56%,呈現(xiàn)同比逐季加速態(tài)勢;公司AI服務(wù)器業(yè)務(wù)占比20%+,并采用ODM+業(yè)務(wù)模式,除整機(jī)組裝外,還參與主板、系統(tǒng)、機(jī)架等全方位設(shè)計過程3.126圖:聯(lián)想三大業(yè)務(wù)集團(tuán)聯(lián)想集團(tuán):服務(wù)器業(yè)務(wù)快速增長,深度合作微軟、英偉達(dá)SSG方案服務(wù)IDG ISG智能設(shè)備 基礎(chǔ)設(shè)施方案個人電腦

網(wǎng)絡(luò)硬件設(shè)備

行業(yè)智能方案智能手機(jī) 智能云服務(wù) 設(shè)備服務(wù)IoT設(shè)備 數(shù)據(jù)中心方案 運維服務(wù)…… …… ……端 - 邊 - 云 - 網(wǎng) - 智云計算虛擬化大數(shù)據(jù)應(yīng)用方案存儲業(yè)務(wù)連續(xù)性高性能網(wǎng)絡(luò)高性能計算超融合圖:聯(lián)想數(shù)據(jù)中心解決方案資料來源:聯(lián)想集團(tuán)公告,英偉達(dá)官網(wǎng),IDC,民生證券研究院證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明公司主要分為通信及網(wǎng)絡(luò)設(shè)備、云計算、工業(yè)互聯(lián)網(wǎng)三大業(yè)務(wù)板塊,2022年三大業(yè)務(wù)板塊營收占比分別為57.86%/41.51%/0.37%,2022年公司云計算業(yè)務(wù)收入2124.44億元,同比增19.56%,連續(xù)五年保持增長服務(wù)器業(yè)務(wù)方面,公司在云計算服務(wù)器出貨量持續(xù)位列全球第一,與全球各大CSP廠商深入合作,受益于AI蓬勃發(fā)展帶來的需求,AI服務(wù)器及HPC在2022年云服務(wù)商產(chǎn)品中占比增至約20%公司與英偉達(dá)合作多年,負(fù)責(zé)AI產(chǎn)線的子公司鴻佰科技為英偉達(dá)服務(wù)器供應(yīng)鏈合作伙伴,公司全程參與H100及H800計算卡生產(chǎn),并為CSP廠商提供高度定制化產(chǎn)品開發(fā)。當(dāng)前公司有意下調(diào)OEM比重,提高ODM及AI服務(wù)器比例,實現(xiàn)產(chǎn)品結(jié)構(gòu)的持續(xù)改善3.1圖:工業(yè)富聯(lián)三大業(yè)務(wù)板塊工業(yè)富聯(lián):產(chǎn)品結(jié)構(gòu)優(yōu)化調(diào)整,AI服務(wù)器業(yè)務(wù)向好圖:英偉達(dá)發(fā)布會展示工業(yè)富聯(lián)HGX

H100自動化產(chǎn)線資料來源:金融界,證券日報,工業(yè)富聯(lián)公告,工業(yè)富聯(lián)官網(wǎng),民生證券研究院27證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明對于PCB而言,PCIe4.0到5.0有哪些變化?層數(shù)增多

12/14→16/18 PCB價值量提升 CCL價值量提升 CCL損耗等級可低至Ultra-LowLoss對于PCB而言,應(yīng)用于AI服務(wù)器有哪些變化?GPU與主芯片數(shù)據(jù)交換量大,主板布線更密集,層數(shù)增加,材料要求更高,成本增加。除主板升級外,新增UBB及加速卡板層數(shù)進(jìn)一步提高可達(dá)28層,接近交換機(jī)層數(shù)CCL要M6級,甚至用到M7、M8PCB單臺價值量進(jìn)一步提高,可達(dá)1萬元3.2 服務(wù)器PCB價值量提升28資料來源:廣合科技招股說明書,生益電子公告,民生證券研究院證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明滬電股份:AI服務(wù)器PCB龍頭3.2公司名稱主要業(yè)務(wù)設(shè)計產(chǎn)能滬利微電高端汽車板150

萬平方米/年黃石一廠企業(yè)通訊市場板22

層以下PCB

產(chǎn)品(青淞廠轉(zhuǎn)入)75

萬平方米/年中低階汽車

PCB

產(chǎn)品(滬利微電轉(zhuǎn)入)黃石二廠汽車板為主的生產(chǎn)線75

萬平方米/年青淞工廠企業(yè)通訊市場板220

萬平方米/年企通板:企業(yè)通訊市場板業(yè)務(wù)占公司PCB營收70%左右,主要由數(shù)據(jù)中心(主要包括服務(wù)器、交換機(jī)、路由器、高速網(wǎng)卡)相關(guān)業(yè)務(wù)構(gòu)成。AI服務(wù)器PCB層數(shù)可達(dá)20層以上,滬電是市場上少數(shù)專注于高多層的PCB企業(yè),為AI服務(wù)器PCB全球龍頭。公司應(yīng)用于AI加速、Graphics的產(chǎn)品,應(yīng)用于GPU、OAM、FPGA等加速模塊類的產(chǎn)品以及應(yīng)用于UBB、BaseBoard的產(chǎn)品已批量出貨,應(yīng)用于800G的產(chǎn)品已實現(xiàn)小批量的交付;基于數(shù)據(jù)中心加速模塊的多階HDI

Interposer產(chǎn)品,已實現(xiàn)4階HDI的產(chǎn)品化,目前在預(yù)研6階HDI產(chǎn)品,同時基于交換、路由的NPO/CPO架構(gòu)的Interposer產(chǎn)品也同步開始預(yù)研。車載板:公司在4D車載雷達(dá),自動駕駛域控制器,智能座艙域控制器,車載網(wǎng)關(guān)等領(lǐng)域的產(chǎn)品已實現(xiàn)量產(chǎn),并利用通訊板技術(shù)優(yōu)勢,在車載通訊計算、高頻高速板方面深耕布局,當(dāng)前車載業(yè)務(wù)占公司營收比重達(dá)25%。風(fēng)險提示:云廠商資本開支放緩、汽車板價格競爭加劇、AI服務(wù)器放量不及預(yù)期、海外工廠建設(shè)不及預(yù)期。表:滬電生產(chǎn)線情況圖:滬電股份主要客戶29資料來源:滬電股份公告,民生證券研究院通信客戶數(shù)據(jù)中心客戶汽車客戶證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明AI算力拉動,存儲加速升級3.3資料來源:電子創(chuàng)新網(wǎng),民生證券研究院30內(nèi)存顯存NANDAI服務(wù)器存儲DDR4→DDR5,傳輸速率由3.2Gbps提升至6.4Gbps高帶寬催生HBM需求用量提升,且3D

NAND有望成為主流方向高帶寬存儲器(HBM)可為GPU提供更高的帶寬,DDR5亦能支持Intel和AMD的新一代服務(wù)器CPU。

DDR5標(biāo)準(zhǔn)的最高速率是DDR4的兩倍;而HBM基于TSV和芯片堆疊技術(shù)的堆疊DRAM架構(gòu),可實現(xiàn)高于256GBps的突破性帶寬,可以替代GDDR。3D

NAND有望成為主流方向,可突破存儲容量限制瓶頸。據(jù)美光數(shù)測算,AI服務(wù)器中

DRAM

容量是普通服務(wù)器的

8倍,NAND容量將是普通服務(wù)器的

3

倍。參數(shù)DDR4DDR5Frequency1600-3200Mbps3200-8400Mbpsdensity2Gb,4Gb,8Gb,16Gb8Gb,16Gb,24Gb,32Gb,64GbOndie

ECC不支持支持Bank16banks32banksVDD/VDDQ1.2V1.1VVPP2.5V1.8VBL816DFE無有Same

bankrefresh無有資料來源:SK

海力士,

民生證券研究院資料來源:Simms

International,民生證券研究院圖像128Gb2D

NAND3D

NAND容量(每個die)256Gb/512Gb(未來存在增長空間)浮動閘極(Floating

Gate)電荷捕捉(Charge

Trap)或浮動閘極(Floating

Gate)制成結(jié)構(gòu)循環(huán)壽命(寫入/擦除次數(shù))性能更低更慢更高(3D的單元間干擾更少)更快功耗高低表:DDR5和DDR4標(biāo)準(zhǔn)對比圖:算力時代,HBM取代GDDR優(yōu)勢明顯圖:3D

NAND與2D

NAND對比證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明AI算力拉動,存儲加速升級3.331資料來源:Wikipedia,SK

hynix官網(wǎng),搜狐網(wǎng),騰訊網(wǎng),EXPreview,36kr,民生證券研究院整理2013量產(chǎn)首款4GB

HBM2;宣布生產(chǎn)8GBHBM2;宣布開發(fā)低成本

HBM2015201620182019202020212022量產(chǎn)HBM1并首次被AMDFijiGPU納入使用發(fā)布4GBHBM2發(fā)布HBM2E量產(chǎn)HBM2E開發(fā)業(yè)界首款HBM3量產(chǎn)首款HBM3與AMD合作開發(fā)首款HBM1芯片量產(chǎn)當(dāng)前市場上數(shù)據(jù)傳輸速度最快的8GBHBM2——Aquabolt發(fā)布FlashboltHBM2E宣布開發(fā)帶內(nèi)存處理的HBM

PIM量產(chǎn)HBM3推出其首款HBM2方案發(fā)布

HBMnext(HBM3)標(biāo)準(zhǔn)HBM1

時代HBM2

時代HBM2E

時代HBM3

時代顆粒密度堆積高度內(nèi)存容量帶寬I/O

速度2

Gb4

Hi1

GB128

GB/s1

Gbps8Gb4/8

Hi4/8

GB307

GB/s2.4

Gbps16

Gb4/8

Hi8/16

GB460

GB/s3.6

Gbps16

Gb8/12

Hi16/24

GB819

GB/s6.4

Gbps各廠商爭搶HBM技術(shù)高地,形成三足鼎立之勢SK

hynix

獨霸HBM市場 Samsung

參與競爭,開啟雙雄爭霸局面 Micron

加入,三足鼎立局面形成證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明3.4 江波龍:存儲模組龍頭資料來源:江波龍招股說明書,民生證券研究院40.72%42.00%45.08%49.04%52.41%40.06%33.34%25.56%22.71%24.47%17.72%24.48%25.94%21.55%18.06%3.37%6.69%5.00%0%20%40%60%80%100%202020212022內(nèi)存條嵌入式存儲涵蓋eMMC、UFS、ePOP、eMCP、SLCNAND和LPDDR等固態(tài)硬盤覆蓋SATA和PCIe主流接口,持續(xù)拓展企業(yè)級和高端消費SSD移動存儲涵蓋USB、SD/MicroSD卡、Cfe影響卡、NM卡、Micro

UDP/UDO等覆蓋DDR4全系列規(guī)格,容量包含4GB-64GB手機(jī)通訊數(shù)據(jù)中心市場個人PC市場移動存儲消費市場汽車電子市場工業(yè)市場產(chǎn)品布局下游領(lǐng)域江波龍擁有嵌入式存儲、移動存儲、固態(tài)硬盤及內(nèi)存條四大產(chǎn)品線,為國內(nèi)存儲模組品牌龍頭,產(chǎn)品廣泛應(yīng)用于消費電子、工業(yè)、通信、汽車、安防、監(jiān)控等行業(yè)應(yīng)用市場和消費者市場。主要從事Flash及DRAM存儲器研發(fā)、設(shè)計和銷售,聚焦于存儲應(yīng)用產(chǎn)品的研發(fā)設(shè)計與品牌運營,形成固件算法開發(fā)、存儲芯片測試、集成封裝設(shè)計、存儲芯片設(shè)計等核心競爭力。公司旗下?lián)碛行袠I(yè)類存儲品牌FORESEE和國際高端消費類存儲品牌

Lexar(雷克沙),持續(xù)發(fā)力車規(guī)級存儲、服務(wù)器內(nèi)存條、企業(yè)級SSD、高端消費存儲等領(lǐng)域,豐富嵌入式存儲產(chǎn)品矩陣,鞏固行業(yè)龍頭地位。同時,公司與上游主要存儲晶圓原廠、主控芯片廠商建立了長期、穩(wěn)定和緊密的業(yè)務(wù)合作關(guān)系,鞏固自身在供應(yīng)鏈上的優(yōu)勢。圖:江波龍產(chǎn)品布局 圖:江波龍產(chǎn)品結(jié)構(gòu)占比嵌入式存儲 移動存儲 固態(tài)硬盤 內(nèi)存條 其他業(yè)務(wù)322018 2019資料來源:江波龍招股說明書,民生證券研究院證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明服務(wù)器出貨量增加催生電源管理芯片需求3.4市電最終輸入到

CPU等元器件的過程中,大致需要經(jīng)過三次電流改變,電源管理芯片為實現(xiàn)電流變換功能的必要器件。主板上的電源管理

IC主要包括

eFuse/熱插拔、多相電源、LDO

與降壓

Buck

等四類,服務(wù)器出貨量增加催生大量電源管理芯片需求。參考MPS數(shù)據(jù),其可面向的CPU/GPU服務(wù)器電源管理合計市場規(guī)模約15億美金,CPU服務(wù)器規(guī)模約10億美金,GPU服務(wù)器約5億美金。其中CPU服務(wù)器中,CPU供電用規(guī)模約6億美金左右,DDR5存儲用供電電源市場規(guī)模約2.8億美金。此外,服務(wù)器上還需用到大量eFuse/熱插拔和POL(負(fù)載點電源),市場規(guī)模均約為6000萬美金。33資料來源:MPS官網(wǎng),民生證券研究院資料來源:MPS官網(wǎng),民生證券研究院圖:服務(wù)器主板電源SAM規(guī)模圖:服務(wù)器電源芯片系統(tǒng)示意圖證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明服務(wù)器出貨量增加催生電源管理芯片需求3.4第二梯隊耕耘多年,前景存疑第三梯隊工藝封裝中等,國產(chǎn)化替代機(jī)會大公司名稱相數(shù)產(chǎn)品數(shù)量支持的協(xié)議TI123AMD

SVI3、Intel

VR14、其他84AMD

SVI3、Intel

VR14、其他72其他62Intel

VR12.x、其他51其他43Intel

VR12.x、其他34Intel

VR12.x、Intel

VR12、Intel

VR12.5、Intel

VR12.6、NVIDIATegra

2.5V

24V,其他英飛凌161AMD

SVI2、其他121Intel

VR1486Intel

VR14、Intel

VR13、其他71其他52Intel

VR14、Intel

VR13,其他42VR13,其他21其他MPS161NVIDIA

OpenVreg,其他101NVIDIA

OpenVreg,其他91AMD

SVI271Intel

VR13.HC,其他64NVIDIA

OpenVreg、Intel

VR12.5、其他51AMD

SVI241NVIDIA

Open

Vreg,其他21其他公司名稱電流分為產(chǎn)品數(shù)量產(chǎn)品最大電流TI40A以下1240-60A660A以上1375A、70A、60A英飛凌40A以下220A、35A40-60A160A60A以上490A、70Amps40A以下640A、25A、20A、12A40-60A1260A、55A、50A60A以上690A、80A、70A資料來源:MPS官網(wǎng),TI官網(wǎng),英飛凌官網(wǎng),民生證券研究院34 資料來源:杰華特、晶豐明源、芯朋微、矽力杰、長工微官網(wǎng),民生證券研究院表:TI、英飛凌、MPS多相控制器產(chǎn)品對比表:TI、英飛凌、MPS三家DrMOS產(chǎn)品對比參考英特爾VR

Controllers

Common

Footprint

Solution

Component

List,多相控制器方面有MPS、英飛凌、瑞薩、德州儀器、安森美、意法半導(dǎo)體、ADI(美信),DrMOS方面除前述廠商外,還有威世可提供產(chǎn)品。國內(nèi)廠商方面,杰華特、晶豐明源、矽力杰、芯朋微、長工微、寧波奧拉等公司也開始有產(chǎn)品推出,不過目前國產(chǎn)化幾乎為零。隨著近年來飛騰、中科海光、龍芯、寒武紀(jì)等廠商在CPU/GPU領(lǐng)域的突破,以及下游長城、聯(lián)想等服務(wù)器、PC廠商旺盛的本土化配套,給國內(nèi)多相電源廠商提供了有利的國產(chǎn)化替代機(jī)會,我們認(rèn)為,中國市場作為全球重要的PC、服務(wù)器及汽車制造中心,有望孕育出具有國際競爭力的多相電源龍頭廠商。圖:國內(nèi)外多相電源公司情況描述第一梯隊技術(shù)領(lǐng)先,市場地位穩(wěn)固證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明目前產(chǎn)品十余種

LED

照明驅(qū)動芯片產(chǎn)品系列,產(chǎn)品線齊全,市占30%+,為業(yè)內(nèi)龍頭復(fù)用LED驅(qū)動所積累技術(shù)、人才、銷售網(wǎng)絡(luò),快充+家電ACDC于21年下半年開始起量從ADI、MPS等大廠,以及國內(nèi)不斷招攬優(yōu)秀人才,多相電源開始出貨,DrMOS跑通工藝、送樣客戶。直流電機(jī)領(lǐng)域凌鷗創(chuàng)芯為國內(nèi)TOP3,晶豐與其并購協(xié)同后更有望于家電等領(lǐng)域快速放量,并實現(xiàn)汽車市場拓展拓展家電、快充AC/DC2008年-專注于LED驅(qū)動IC賽道2020年-2021年-向大電流DCDC進(jìn)軍,目標(biāo)PC、服務(wù)器市場2022年-并購凌鷗創(chuàng)芯,拓展電機(jī)控制新品晶豐明源:AI服務(wù)器電源管理芯片核心廠商3.435資料來源:晶豐明源公司公告,民生證券研究院DC/DC芯片2022年營收0.05億元(占0.47%)AC/DC芯片2022年營收1.20億元(占11.14%)電機(jī)控制與驅(qū)動芯片2022年營收0.22億元(占2.06%)LED照明驅(qū)動芯片2022年營收9.06億元(占83.93%)面板等照明驅(qū)動芯片原產(chǎn)品 新品布局全面覆蓋調(diào)光、非調(diào)光、智能

包括多相數(shù)字控制器、智能集成功率器件、降壓轉(zhuǎn)換器POL、電子開關(guān)/熱插拔控制包括隔離電源、非隔離電源包括電機(jī)驅(qū)動、MCU資料來源:Wind,晶豐明源公司官網(wǎng),民生證券研究院服務(wù)器電源核心廠商,國內(nèi)唯一獲得英偉達(dá)協(xié)議。公司于2020年開始布局大電流DCDC,目標(biāo)PC、服務(wù)器市場,多相電源方面,目前公司已覆蓋4相-16相系列產(chǎn)品,10相數(shù)字控制電源管理芯片

BPD93010

已正式量產(chǎn),2023年送樣16相方案,該產(chǎn)品可支持英偉達(dá)H100供電。

Drmos方面通過合并力來托團(tuán)隊(許博曾任職TI,為NexFET發(fā)明者)打造自有工藝平臺,目前正跑通工藝認(rèn)證,推動50/70/90A

Drmos送樣客戶測試。此外,公司已量產(chǎn)6、10A

POL,并規(guī)劃

Efuse熱插拔,全面覆蓋。主業(yè)LED驅(qū)動芯片底部回暖,行業(yè)庫存出清,公司賬上庫存邊際持續(xù)好轉(zhuǎn),由22年Q2的4.66億元持續(xù)下降至23年Q1的2.36億元,整體毛利率回升至Q1的23.2%,后續(xù)邊際持續(xù)向好確立。AC/DC方面,外置電源產(chǎn)品總共有14款產(chǎn)品推向市場,推出IGBT結(jié)構(gòu)復(fù)合功率管20W快充與磁耦65w快充產(chǎn)品,為國內(nèi)首批量產(chǎn),并研發(fā)第五代高壓

BCD-700V工藝平臺降低成本;內(nèi)置電源,小家電產(chǎn)品基本完成品類擴(kuò)展研發(fā),覆蓋大部分的生活電器、護(hù)理電器和部分廚電。大家電產(chǎn)品在重點客戶麥格米特的份額繼續(xù)擴(kuò)大,并成功在美的冰箱、TCL空調(diào)、創(chuàng)維洗衣機(jī)取得突破。并購凌歐創(chuàng)芯布局家電與車規(guī)級市場。2022年7月凌鷗車規(guī)級產(chǎn)品取得

AEC-Q100Grade

1

認(rèn)證證書,多款產(chǎn)品已完成了可靠性考核,車規(guī)級產(chǎn)品已經(jīng)量產(chǎn)出貨。風(fēng)險提示:技術(shù)研發(fā)不及預(yù)期的風(fēng)險;行業(yè)景氣度變化的風(fēng)險;DC/DC營收增長不及預(yù)期的風(fēng)險。圖:晶豐明源產(chǎn)品線布局 圖:晶豐明源產(chǎn)品及營收情況證券研究報告*

請務(wù)必閱讀最后一頁免責(zé)聲明組件高速互聯(lián),服務(wù)器接口芯片需求廣泛3.5技術(shù)廠商推出時間基本闡述原理構(gòu)成產(chǎn)品特性單鏈帶寬總帶寬NVLinkNvidia2016年第一代發(fā)布;2017年第二代發(fā)布;2020年第三代發(fā)布;2022年第四代發(fā)布世界首項高速GPU

互連技術(shù)一根Link由一對sub-link組成,一根sub-link又由八對差分線組成點對點的傳輸形式;一個設(shè)備可由多個NVLink

組成;網(wǎng)狀連接結(jié)構(gòu)基于Hopper架構(gòu)的NVLink

4.0可實現(xiàn)單鏈50

GB/s的雙向帶寬每個

GPU

可支持18鏈路,提供900

GB/s的總雙向帶寬InfinityFabricAMD2016年首次公布;2017年首次在Zen處理器中應(yīng)用IF總線,基于HyperTransport的通信總線技術(shù)由InfinityScalableData

Fabric(SDF)和InfinityScalableControl

Fabric(SCF)組成集數(shù)據(jù)傳輸與控制于一體InfinityArchitecture架構(gòu)可支持

InfinityFabric

3實現(xiàn)單鏈100GB/s

的帶寬加速器之間可支持8鏈路,提供800GB/s的總帶寬CXLIntel2019年CXL

1.0發(fā)布;2020

年CXL2.0

發(fā)布;2022年CXL

3.0發(fā)布ComputeExpressLink,開放性高速互聯(lián)協(xié)議由CXL.

io、CXL.

cache、CXL.

mem三個子協(xié)議組成基于PCIe協(xié)議,兼容性高;高效,低延遲,高帶寬;內(nèi)存一致性-CXL

3.0通過

x16

鏈路實現(xiàn)

128GB/s

的雙向帶寬資料來源:英偉達(dá)官網(wǎng),民生證券研究院36 資料來源:NVDIA官網(wǎng),AMD官網(wǎng),Wikipedia,民生證券研究院在DGX

H100服務(wù)器內(nèi)部,藍(lán)色方塊為IP網(wǎng)卡,既可充當(dāng)網(wǎng)卡又可發(fā)揮PCIeSwitch擴(kuò)展功能,成為CPU與GPU(H100)之間互聯(lián)的橋梁。此外,CX7

以網(wǎng)卡芯片的形式做成

2

塊板卡來插入服務(wù)器,每

4個

CX7芯片組成一塊板卡并且對外輸出2個800G

OSFP光模塊口。而GPU(H100)之間互聯(lián)主要通過NV

Switch芯片來實現(xiàn)。每個DGX

H100

內(nèi)的一個GPU向外伸出18個NVLink

,單鏈雙向帶寬為50

GB/s,共計18*50GB/s=900GB/s

雙向帶寬,拆分到4個板載的NV

Swit

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論