英偉達人工智能發(fā)展戰(zhàn)略研究報告_第1頁
英偉達人工智能發(fā)展戰(zhàn)略研究報告_第2頁
英偉達人工智能發(fā)展戰(zhàn)略研究報告_第3頁
英偉達人工智能發(fā)展戰(zhàn)略研究報告_第4頁
英偉達人工智能發(fā)展戰(zhàn)略研究報告_第5頁
已閱讀5頁,還剩144頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一之4為

j鄉(xiāng),.j

使尥:f1J削

I九訪先』鄉(xiāng)解以內(nèi)們見術(shù)訪巴ClaraCUDA『嘔c

o

resCUDAKernelCUDA

StreamsCUDA

Toolkit嚴醞cuOptDeep

learning

SDK邕DRIVE

Sim匡廣竺廷千Amperes組勾的兩咭 5G絡(luò)的

Al平臺一組預(yù)定義的函數(shù)或協(xié)議,用于構(gòu)洼軟件應(yīng)用程序話

一醫(yī)療旬

的Al廿年平臺CQ_mP._Ute

U

fiedDevice

Architecture的繼寫,呈NVIDIA的主甘扛迂墮熱郎

編程役型CUDA計耳單元,GPU中用丁并行處理任務(wù)的基本處理單元.CUDA程序中執(zhí)行的并行計棄函數(shù).CUDA的并行執(zhí)行機翊,允許多個任務(wù)在不同的流中開行處理.包含編譯器、蘆 開發(fā)工具和文檔的完整開發(fā)工具包,用千CUDA

編程嘈用千半導(dǎo)壞制適的計棄光刻技術(shù)用于物流和路徑優(yōu)化的Al工具NVIDIA

語供的軟件開發(fā)工具包,包含用于深宦字習的念和工具.專為數(shù)據(jù)中心設(shè)計的忘性能GPUEGXion)FP16(HalfPrecis-

-GeForceGPU蘆 rect| G-SYNCHGXIGXIsaac它數(shù)壇中心GPU-,尸叩、袒Al訓練和婦

廿克

覓升屯信網(wǎng)絡(luò)的性院和若能化支件開發(fā)和至成提升醫(yī)療設(shè)備和應(yīng)用的性能深度計棄件.__字一,NVIDIA的 .

習超級 ·機平臺,果成了諤

性蹺

GPU

和優(yōu)化的軟一

住Al

翊法

,

醞 賈 砌 輝 輸戲 測

百分辨迎礎(chǔ)專用千數(shù)郔璃的處理芯用于自動駕駛汽車垣擬譏際的軟件平臺,----一種能夠檢測和修正常見的數(shù)遐損壞類型內(nèi)存月 與的GPU平臺鈺 t

浮和

度 用于加速深度宅

祖擔

的汃際

和基

理.一CPU和主內(nèi)存的干預(yù).面向游戲哀樂領(lǐng)域的顯卡系列專門用千處理堡形和視覺計哀任務(wù)的處理器NVIDIA技術(shù),允許耳

接在

GPU之陬

專汾數(shù)據(jù),從而改少勛 蹤 旺

率與顯卡給出,農(nóng)

踵雨

撕裂月 忘性院計其的GPU平臺專為哲蕊邊忿設(shè)備設(shè)計的計棄平臺年和研發(fā)的軟硬滬抬1

i用于開發(fā)GPU_pt漣

的應(yīng)甩捏序擔年

生用千執(zhí)行弁行計五 任務(wù)

,加速

計耳藝

年和內(nèi)甩用于在

GPU

上執(zhí)行開行計棄任務(wù).ffl丁提了I并行計棄的

效率.尸

- guDA硒曬

.提升芯片制適的秸度和效率提商物流效率和任低成本用于開發(fā)和優(yōu)化深虔字習應(yīng)用.語供大規(guī)袒Al訓練和撐理能力二用千忘性能的深度字習訓練和準理.提升游戲幀率和圖像質(zhì)呈提 中心網(wǎng)絡(luò)和存儲性蕊提商目珈鴉子控的安全性和效王誦圣至實現(xiàn)實時Al痄瑪擇莊分析用于提禹計繭效率和減少內(nèi)存占用.虔性能游戲休驗提供圖彤渲染和視覺計罕能力用于提升

GPU之間的數(shù)據(jù)傳紛效翠改若游戲和視頑的視覺質(zhì)呈支了研究和妄雜計耳任務(wù)提供安全、忘效的邊淙凡計棄`

、眾詈四鼎帷咨詢「nJ

Jl.J上少etson

印ll

n』_

侖tmpoli巳.

I

GNeMoNVIOtA

GFENVID隊

Reflex.工.VLin

kNVSwit.ch

Omni心

QuadroRAPIDSReplicatorRiva

R歡

R僅

AlPCsSMPStudiouperNICTensor

Cor『eTensorRTIT1edal

1G1PT,okkioT”mn10

V

_0vGPU平臺

戲優(yōu)化的信;

在多 個 GPU

之1可逗供商速連接_

用于 3D設(shè)廿和實時

協(xié)作的平臺

砰臺存和王廈PU資三、 發(fā)展階段。吳偉達創(chuàng)寸3

至今纖過了創(chuàng)業(yè)初期、GP

U定義時期、GPU迭代時期、Al帕井時期、,\

J痄煌

時期

五個階段,

井在20

24年6月19日咸為全球市價員(..”的公司"內(nèi)S 推出公司首款產(chǎn)品N

V1`"7

.推出 全球 首款 128位

30處理 器RIVA

128六 7

.

推出Tesla

GPU六泗 在第一屆GPU技術(shù)大會上發(fā)布代

號為

械Ferm i嶺的新一{歡 UD A

GPU架構(gòu)如 1.推出線 苞衍又核移

動處器Tegra

2“'2 發(fā)布廷于Kepler架構(gòu)的GPU20f3

發(fā)布百款完全繼承的4GLTE移動處理器Tegra

4i;

面向游戲玩家推出GeForce

GTX

TI

TAN理 "4

;

發(fā)布192核超級芯片Tegra

K1,,

M

a

xwell(第10/tl忠勾)1022·

公布 錄新自 動駕

駛技術(shù) 平臺Drive

Hyperion

9;

發(fā)布云原生Al侯型和服務(wù)OmniverseAvatarCloud

Enginr(ACE)2O2).推出新一代GH

200

Grace

Hopper超級芯片,同時

佳出基千GH

2叨

構(gòu)建的

新服務(wù)

器設(shè)計10

Z4推出

N

VIDI

A

Blackwell平臺,以萬億會數(shù)規(guī)模推動Al計茛的新時代,

6月

,

偉達市佳登

頂鰭

第一超越微軟和蘋果11.:J匕

7創(chuàng)業(yè)初期,7 UlGPU迭代時期J u....作..Jd

4Al

輝捏時朋。GPU定義時1l111

芘" :

達克

市X咖 與臺

積電

簽約廷

合作伙

關(guān)系鄧 1. 攜nFORCE進軍栠

成顯卡

市場石峰、 推出

SU

技術(shù),允許多個GPU連接l006 推出用于通用GPU計茛的架構(gòu)CUDA.,., -'..1Al覺醒期時功' s.搭載TEGRA

X1的DRIVE問世2016

推出全球百款一體化深庋學習超級計瓦機DGX-1JO,S 推出開源GPU加速平臺RAPIDS,推出Turning

GPU架構(gòu)2019 在HPC`

嵌入式、數(shù)據(jù)中心、自動駕駛:

汽車和專業(yè)圖形市場中取得進展,血 0 推出

Am

pere

GPU

構(gòu)

力數(shù)

據(jù)中

,,產(chǎn)品

布局

GPU擴展至兼具OPL/及 1 發(fā)布

Grace

CPU,

專為巨型Al和商性能:

計苠工作負載設(shè)計,成

吳有

CPU、GPU、'

D

豎平狡泗鼎顱迭笱

扈階

段:

英偉達從游戲屈卡起家,并發(fā)布世界上第.汰貞正總義上的GPU產(chǎn)品,

成為浙戲品卡市場的傾導(dǎo)行和GPU產(chǎn)品的定義行I品

無7),市場競爭和財務(wù)困境創(chuàng)新精神和戰(zhàn)略轉(zhuǎn)型在圃夼芯片市場取得互要勝利成為專業(yè)可視化領(lǐng)域的領(lǐng)導(dǎo)者在GPU拽術(shù)、湔戲饑合作、和盄卡市場競爭方面取徇亙大進展CUD

A平臺的開發(fā)和推廣為A

l鋪路在游戲顯卡市場中占據(jù)領(lǐng)導(dǎo)地位頤嚨十算領(lǐng)疇翠推出革命GPU架構(gòu)和產(chǎn),實品現(xiàn)技術(shù)突

破_蹈介段第三階段[

1

993

,從畫 西

部. 通用圖 形計皿 步l儼推出第一個產(chǎn)品:針對游戲主機的1

99 5

年NVl顯卡199

5年

貊氣韌,推出關(guān)鍵芯片產(chǎn)品Riva1首 128位的3D處理器,在圖形芯開始崛起1999年,借GPUGeForce

256宰丙

就歡-BOX訂單

同年IPO成功 20

00行,收購3dfx,市場形成英偉達與ATI的雙雄格局I

200 1

年 推出業(yè)界篤

開始能夠利用面 阿 衄 GPU:

GeForce3,四

淚G

PU完成 為訓練Al大摸型埋下伏筆I 已 年,為疇 $3開發(fā)俎

匿叨

心邏鋁開頑2006年 CPU單 AMO收購ATI后由開

貪謠限制導(dǎo)致顯卡份額下沿 英偉達推出通用平行計筍平臺CUDA,廷立CUDAI

研究中心 ,后成為邸 學習和

Alijl晞的首選GPU架構(gòu),助力英偉達取待領(lǐng)先市場地位2007

年 Tesla

GPU問世,標志君NVIDIA在禹性綏泊算領(lǐng)吻為里大突破.使待GPU的強1大計

第能力 應(yīng)命 藥物發(fā)現(xiàn) 醫(yī)

學成

像等領(lǐng)域[

201 碑 ,提開

UDA核心至512個2014年 完全實現(xiàn)M

axwell設(shè)計架構(gòu),在2010年全球雖快超篤前五強中借助NVIDIATesla

GPU占領(lǐng)三個地位,在2012年雖快的超級電腦泰坦中有18,688顆基于Kepler的NY._IDIA

Tesla芯片公眾

號-

l

目鞏二陰段:加 J.')

年英偉達行次發(fā)布了面向深度學習處噸器,

GP

U芯片構(gòu)架向

\I方向大步邁進,日前人工罰能芯片方向的以市占書8

處于絕紂壟斷的地位,血d ,千三飛雪

邕 硬件供應(yīng)商+深度學習和人工智能時代為先行者和淮動者酮-`.過.人工智能方面處于絕對壟斷的地位(市占率80%)GPU技術(shù)深良學習Al

應(yīng)用并領(lǐng)域Al數(shù)寧生物氣候科學游戲自動駕駛汽車機器人等領(lǐng)域推出用千訓練深度神經(jīng)網(wǎng)絡(luò)的殿強器NVIDIAGeForceGTXTITANX芯片架構(gòu)開始往深度學習和凡方向前進發(fā)布Vo厄架構(gòu)和NVIDIATesla?V100GPU加速器極大提升Al運自改率Amper呻 對Tensor

Core進行了進—步的升級.爛加了對稀疏矩陣計茛的支待ao1s2016唯出16nmPasca唳構(gòu)引入新的總線相通佑協(xié)議NVLin,k

用于GPU和CPU,

及多個GPU間的

連接推出

Tu的計豆能力,同時實現(xiàn)游戲中可用的災(zāi)討光線追蹤洹染此結(jié)構(gòu)下的Tesla

T4

GPU計百皿頁器成為經(jīng)典

AJ豆

力卡發(fā)布4nm

工藝的

RTX

40系列顯卡,性能比上

50沒際 CPU產(chǎn)品Grace:這盄

芯總 部 rac或l

Hopper架構(gòu),為A印禹性能計百提供了強大的千U

+

GPU組合2017架構(gòu),邸 nsorCor心

血2020,

作文待設(shè)計、開發(fā)、部菩和軍郢沁

mnive<seClou

d, 實現(xiàn)先進工r 數(shù)

字化推出

GH

200U

及游戲兇鎂型

代工服務(wù)平臺

Avat

arCloudEngine(ACE)

forGame2022 2023還24發(fā)布Blac妞

ell

GPU8

100,

芯片尺寸

接近EUV光刻技態(tài)

郢侖極限 (858

平方去

,含有

1

040

個品體笸發(fā)布Rubin

GPU,

VeraCPU翌

Omniverse平臺提供方案筷擬、合成數(shù)據(jù)生成和忘保頁可視化等I坊g,幫助制造高優(yōu)化工廠布局、測試機器人系統(tǒng)并提禹工人安全公布戍須器人項目G

嘔;勹畟?瑰器人1 貫?隆詛L

_userid:529794,docid:174986,date:2024-09-18,3500031

9703000025000200001500012230公司廿屯收入和凈利潤均早現(xiàn)波動上升凸勢,

其中202:1年廿嘈.收入中數(shù)斟中心業(yè)分貞獻慫大`2

O20

年節(jié)20

:.t-l年占比

超過701111營業(yè)收入(億美元)007006005004003002001030025020015010050。52.73%_···166 .

7561.40%269.14營業(yè)收入2020凈利潤(億美元)43

.3

22020202155.58%2021269.740.22%勹2022變動比澤125.85%609.22/.市恒凈利潤97.523(26%43.62022150%100%50%0%各業(yè)務(wù)市值(億美元)100005000。3641.8I2023千 變動比率85.32%297.62023100%20%初%-140%80%60%40%20%0%2021各業(yè)務(wù)收入構(gòu)成(億美元)100%21106-

5.61252022 2023覜中心部戈可視化汽車倉16 一11104911502021^ 20公眾

c::::,475伴比例耘于研發(fā)伐川半.研從

20

21

年到202:1年,研發(fā)貸lf1和目,行與齊貸噸ItI均早

上升凸勢,銷仵與齊珂貸1tJ率下發(fā)費用從投入過去三年卅長約1

30%,

銷仵與管珂費用培加約4

(

)ll

”研發(fā)費用(億美元)9080706027.21

%50.40302010。產(chǎn)品研發(fā)嘈-研發(fā)費用率50.00%86.7573.3914.24%40.00%30.00%20.00%10.00%000%30252015105。銷售與管理費用(億美元)銷告與笆理費用`-費用率12%80%26.5424.460%21

.6

619

.440%20%8

%9

%4

%0%202020212022202320202021號

雷戶三、 發(fā)展戰(zhàn)購。英作達通過對計n機底足技術(shù)的全面更新,

CP

lT+GP

U+OJ>「l '.=大

為產(chǎn)品底庉,推動英偉達咸為人工許能計算頜域的領(lǐng)導(dǎo)行屈 沖心 lk k'創(chuàng) 造 下

業(yè)

推動

類迸,,.油

走入 人 工智 能和圖 形計 算的 新

-

E四計黜l )改變計茛的工作方式和計茛機的功能隨中心推動全球的數(shù)據(jù)中心行業(yè)現(xiàn)代化西引扣切冗蘆段質(zhì)氐貊行郵

翻、 研發(fā)單一行業(yè)刮礦幸現(xiàn)牢

目標市場如醫(yī)療、自動每使三芯戰(zhàn)略CPU中央處理器人工智能全球人工智能基礎(chǔ)設(shè)施的引婺機器人推動人工智能機器人和T1V豹字化酗節(jié)巒住鑿麗刊泌迫鯨 可供千A江業(yè)機器人訓練租封乍的3PU,

及乓對應(yīng)涸試、訓練用的底層軟件GPU

圖像處理器DPU

數(shù)據(jù)處理器英偉達把計應(yīng)饑整亡壓術(shù)重汀及曝了一遍11lI懟C

團11- mOGX專為合W級Al

設(shè)計平臺cuDNN深度神經(jīng)網(wǎng)絡(luò)的GPU加速庫園集成TensorCores技術(shù)的Al芯片架構(gòu)郢也NVLink忘諫可詫技術(shù)VoltaTuringEGX加速邊緣計算的平臺NVSwitch網(wǎng)絡(luò)交換機IGX

T級邊綠Al平臺AmpereHopperBlackwellNVLink-C2C芯片到芯片裸片到裸片的互連技術(shù)HGX靈活定利的Al硬件平臺M

GX

棧塊化貼 的計笢平臺TensorRT深度學習惟理引擎NCCL構(gòu)建多GPU和多節(jié)點井行應(yīng)用程序通信庫NVSHMEM為跨多個GPU

內(nèi)存數(shù)}匼創(chuàng)建0 全叢局即上衄人澗虧庫

可 l

nfi

ni

Band

技術(shù)SHARP伎術(shù)ASAP技術(shù)Spectrum?X葉霓沮吳偉達的產(chǎn)品

架構(gòu)包含以“CP

U+GPl巨

DPU" 為中心的硬件產(chǎn)品、以Cl

Tl).\為核心的軟件生態(tài)、以NVIOl

入M

-t-.、YIDL\

Omniw

rse為1:的平臺和各個場杲下的應(yīng)用柜架suLuD3I、應(yīng)用層...JNAIXINE!:MO-

`-,` 叫也:0'A

TARIVE1立

AC!>OLIS平臺

層NVHKAAINVIDIA0

"

se軟件生態(tài)嘩

J

義亟 ·Magnum

10DOCAIBase

CommandForge硬件

層蜘萸偉達托悄快速迭代的研發(fā)能力、供應(yīng)論的

l:導(dǎo)地位、多種廿銷策略、扁`μ化的組織、多元投資合作支撐游戲、專業(yè)可視化、數(shù)樞中心、汽年四大業(yè)務(wù)發(fā)展,

`步鞏同

企業(yè)在

\1市場

預(yù)尋地位四肥\,心說主癡,油生過創(chuàng)造下一個工業(yè)革命,推動人類進入人工智能和圖形計算的新紀元-

-

-

-丘計皿 )頤計算的工作方式和計算即內(nèi)功能郎中心推動全求的數(shù)據(jù)中心行業(yè)現(xiàn)代化密

如叩

吭3

畸釭抖加強對垂亙行業(yè)的服務(wù) 研發(fā)單一行業(yè)適配廣刮豆軟件}目

標市場如

醫(yī)療

、

自動駕駛墅雹雹房 Gc

l:OI“. .KI`系列旦卡GeForce

NOW云訪戲服務(wù).\

1

1屯石Q

1.

dr

',和R`T

系列J,P

L

業(yè)斗卡NVlDI乎\O

Inn”ersc上1m叮沁

文平臺專業(yè)工作站解決方案扂擬(;r

L?

(IGPU)人工智能全球人工智能基礎(chǔ)設(shè)施的引軍兇皿歷Al芯片

級芯片定制父快1幾、網(wǎng)卡零網(wǎng)絡(luò)

產(chǎn)品舶找計算饑及Al工廠印家主權(quán)

\

I、電信云邊緣計算平臺je15on云計算業(yè)務(wù)(量子計算)企業(yè)

、\dia

\

I

En1<'1'pri,

c

)機器人推動人工誓能機器人和T1K勸字化,.主訟坎伈鯨 可供千Al工業(yè)機器人訓練和民作GP的U,

及其對應(yīng)調(diào)試、訓練用的底層軟件亡貂烹巧自動五校芯片自動過校墻至IJJJI方案虐擬工廠規(guī)劃仿真設(shè)計祀Al+醫(yī)藥Al+汽左三 從

兩季度高透迭代創(chuàng)新超高研發(fā)人員占比酐發(fā)t/1構(gòu)與叮發(fā)合作伙伴J

研發(fā)實迄室布盡26大研發(fā)領(lǐng)域英偉達專利墻Al+機器入Al+軍工士會議行銷杜區(qū)營銷杜交媒體營銷品牌營銷呻哲悄全過化營銷社會責任污誚Al+娛樂Al+禹性能i1豆Al

+交通

Al+安全Al+孛告 Al+電信i見函瀝珀“胡蘿卜幾次神”

的管理方式大訂

單擠

卻 P.l

短缺組件供應(yīng)承諾訂單不可取

消漏保巨大供應(yīng)拽前支付預(yù)付謔占供應(yīng)人工節(jié)侔葦幣英偉達產(chǎn)地業(yè)位鏈____臼咄始人婦

專業(yè)與踴

背景兼ll極效以平化的組織架構(gòu)賦權(quán)式節(jié)理,不給工建作議摒

棄會議匯報繁卉傳飲戰(zhàn)略規(guī)劃向全體員工平

吵上

尸岱玉酢投資領(lǐng)域.機器人、入工智維、消戲.軟仵與硬仵、可視化、云計算與數(shù)據(jù).剛絡(luò)、自動駕校

生物科技與醫(yī)療等初創(chuàng)投資項目企業(yè)問的三級合作伙伴貫鞋冶詢二

產(chǎn)品茶略。未來釘力牛態(tài)以CPU、GP

U、DPU為二大核心n力芯片,英偉達、

英符爾、'

,

\

MD及其他代表企業(yè)搶占各芯片市場份額算力芯片 核心功能 代表企業(yè)CPU.系統(tǒng)管理維持軟硬件生態(tài).應(yīng)用程序已 AMDit'IA

RM"Qua

lco礎(chǔ)GPUDPU規(guī)則計筍科學計筍.數(shù)據(jù)生并行運用噱 CUDA的

核心.異構(gòu)計第.數(shù)據(jù)中心基礎(chǔ)設(shè)施"Datacenter

Tax"卸載網(wǎng)絡(luò)、存儲、安全業(yè)務(wù)急A已 AMDl11

@5

YST念

A中抖數(shù)控ll

I,Il1,CISCOn~BR

OA-DC-OM.(

:PU 叢戰(zhàn)之上,

開創(chuàng)中前GPU加速芯片時代 井將DPU作為切=

i:

力芯片作為構(gòu)建未英偉達在通lt1計W芯片來佴力的基石和庇痊I

l

i

i

1蘭牛單央處元理伙牛石的岱岱令序氏佐4哼益順染

形Contro1ALUAUALU

ALU爾憤葉諤臣 乒二曹正芷處違摯元嘗千趙務(wù)處Ciche”花已心的機部件ORAM口真AM井行計氏任務(wù)DPUC..,r

u架 雜度雖禹的心片之一便軟件和硬件躲藕,實現(xiàn)

更禹IPC和更忌頻率.`數(shù)據(jù)中心智能駕駛軟件耳于CPU構(gòu)建龐大生態(tài),如:

x86架構(gòu)服務(wù) 器端還足ARM

架構(gòu)移動端匡芒 」 玉 苠、浮部

應(yīng) 陣運笢,婦

5性能計芻雖里要的輔助計苠單元貫PC(一顆CPU)

和服務(wù)器(數(shù)雖不定)CUD

A便

GPU處理泵雜計笢問蓮開發(fā)者可使用C

語吉來編寫程序,早降低了 用戶甚 千

GPU并行編程門檻分為一路、雙路、四路及上以服務(wù)器;以雙路服務(wù)器為主對不同場杲構(gòu)廷的開發(fā)庫和中間件,建立了

飛PU+CUDA:'

的強大笢力生態(tài)預(yù)計升婦

千數(shù)據(jù)中心的DPU

數(shù)呈將達到和數(shù)據(jù)中心服廠務(wù)商數(shù)器同據(jù)等處理呈類級芯英偉達、英特爾等片

OPU/

IPU

大規(guī)模呈產(chǎn),全球DPU

市場將在未來幾年迎來燥發(fā)式培長叩氣益,拉芯片的癥從圖芘外評到數(shù)擺處理芯片蛻變四 飛心

麗型白'.第三顧主力”芯片公眾呈-一顯帷盜違l—基于未來以異構(gòu)計釘為

i:.的訂力發(fā)屁勢凸和片上模式為t

的數(shù)保中心

上流形態(tài),

英偉達陸紋通過自研及井購形成L了

GP

許CPU

tDPLl的三芯布從,實現(xiàn)為客戶役供更加全面、晶效的計餌解決方案元,憎計算力勹求的重要發(fā)展趨勢、,U、DPU

共存的

片上模式中心主流..`此咚皿 硐 成'郫戰(zhàn)鈕研壞肚r..,klGPU+OPU+亡PU叩的通廳算力保詡英偉達自1995年推出芭款GPU以

來,不斷創(chuàng)新發(fā)

哀成為圖形處理行業(yè)的領(lǐng)導(dǎo)生共GPUJ"'

葫邈了從消費級顯卡到忌性能計郘婦甜擴泛應(yīng)用.干心秅網(wǎng)唱沒C過過改露包和方屯力英偉達在2020年宣布陀購Mellano難

,開始涉足數(shù)據(jù)處理單元(DPU領(lǐng))

域.通過整合Mellano啪

捻術(shù)和資源,英偉達在數(shù)據(jù)中心和陣各設(shè)鋁員域嗨了布局為DPU市場發(fā)

哀奠定了基礎(chǔ)應(yīng)對各種計算任足匹些需要快速邏婦行處埋糙力2021年4月,NVID隊友片讓鞦

代號為.Grace·

的CPU其專

為巨型從

1和禹

性能計藎工

作負

載設(shè)計U+OPU協(xié)同

互補啤到命性能與離安全性、逐年飛躍、一個架構(gòu)”全面、高效的計算觥決方案公眾計訂機產(chǎn)業(yè)伴隨打兼行機的出現(xiàn),產(chǎn)量結(jié)構(gòu)從過去的縱向體化轉(zhuǎn)變?yōu)闃E向切片式.這種水平分層的產(chǎn)業(yè)形態(tài)邁就了計餌機產(chǎn)業(yè)叢礁只強慣性、凸壟斷性的符征歸甥腿彗.疇凹-約1

980

年銷售與分銷匾庶黑書叩

(并非按比例展示) 約19

9

5年銷

售與分銷

|商家郵購應(yīng)用軟件1

1應(yīng)用軟件罕告店L

_超市Word其他操作系統(tǒng)WordPerfect卜1

-操作系統(tǒng)計笢機DOS及Windo鄧0S/2 MacUNIX芯片1

1計算機畦戴爾恚菩PackardBellIBM

其他IBMDEC芯片英特爾架構(gòu)庫托羅拉SperryUnivat

e王安公司瑪簡指令栠計第機化會帶來上層豆復(fù)工的大幅增加哥史件瓦度統(tǒng)一的強訴求件強慣性、寬壟斷無法發(fā)生英偉達通過對計W機產(chǎn)品 的

譏新定義、計訂機形態(tài)的演化兌'舊及以漸進式改邊,還步朔泊計n機形態(tài)向"

利于自身的計開機演化方向18個月正新一代

CPU的笨略下不顯6個月發(fā)布一次新品,苠力性缸始GPU作

為一

個單獨的品

類存

活摩爾定飾甄 噓 上可勃 的晶閑

巨數(shù)目,每隔

18

月會增加玉 ,性 升 舊

,而價格下降為原來的 一半帛三.隊兩罕度的創(chuàng)新研覽告代役式即三個開行開發(fā)團隊專汪于獨立的分階段產(chǎn)品開發(fā),確保公司每孫

月推出一次新產(chǎn)品,與行業(yè)市場吁

頡圍保持一致,并領(lǐng)先市場1-2個研蕊動誚10'1?010

'I

O`1

0'1

0'10

'GPU-Computing

perf2X

戶汀

year1000XIn

10.,..,.1.1X

perye?r10'1.5Xperf

per

yearSin.9l·ethreodedCPU

perf1980 1990 2000 2010

2020

2030苞推別鈕墜粒認CPt1上取代英特爾,而足將其為嘰 給部

芯還包t

苠機系蛻邸亥亂純;p

t,

GPU的形態(tài)的難題CPU嘈.

其·代逐步玉令 CPU+GPU對復(fù)特爾來說,無論選擇職種方工比2

石貫養(yǎng)達設(shè)定的欄架內(nèi)克·亨如果英特爾選擇只做CPU,

它必須接受CPU加

GPU的體系也陀

悍供改進;GPU.

如果怓GPU,

將耳

接與英偉達克爭,可能導(dǎo)致GPU在

體系中的至

要性逐漸超過

CPU.

忌終

,大家都

專注

GPU,

間器薪變成了誰的GPU更強岔令并車星父了量

岱的立爭

,

而昆關(guān)于利用

CPU的競..帖在巨入侵課泗上,把這個產(chǎn)業(yè)帶到只有我們能楹 的地h

--20()9年黃仁勛采訪窖,畫硐一出30圖

形加

頑,配l

]竺咖泊 機的形態(tài)度 匹 婦 畛亟 — 」在數(shù)據(jù)中心市場,拴動在限務(wù)器中加入少呈顯卡,從僅便用CPU轉(zhuǎn)變?yōu)榻Y(jié)合GPU09形態(tài)隨吾顯卡數(shù)呈常加,權(quán)至增大,加入技術(shù)和符性,服務(wù)器轉(zhuǎn)變?yōu)镃PU必怨

車今GPU的形態(tài)元 服 器的標準酐舌i即書是2

和8

個GPU,彷關(guān).爾擠到相對邊經(jīng)的位否王曰...'"..

“'`'u

二..`',"M,,,0

1寰臧"心',

”“忙”心`...社仕達通i.l

份汛軟f于l

上、田

什發(fā)肴、發(fā)Ill場景*塑覓占柯干n,

時計算但演化方向英偉

達友布202fl-20

27年產(chǎn)品戍劃,Al芯片規(guī)劃的戰(zhàn)略校心是

“One

.\

rchite

c

ture"

統(tǒng)

.架構(gòu),Al芯片

從兩年次

的更新周期轉(zhuǎn)變?yōu)?/p>

·年

的更新周期,

下.

ft

Rubin榮構(gòu)及其對應(yīng)核心芯片已捉

上日程曠well

架構(gòu) ~ \

in

架構(gòu)GPUCPUNVUNKNICSWITCH日Hopper

GPU6SHBM3函hc11志王tcc.IswknL0占SV

9NQuantum-X400lnfinibandSwitchmuep二口G+repsp06HGrace

CPUBF3SuperNIC國Blackwell

CPU8S

HBM3eHcc口WieBs5

GKONO1

8L

1vNCXB

SuperNIC圈S沁

rum-X800Ethernet

Sw九chBlackwell

UltraCPU8SHBM3e12HQuantum-X800S沁,tumUltraX600Switch EthernetSwitch

512-RadixLu4云巳8uRVera

CPUECX9

SuperNIC16 ec貯RubinUltraGPU12S

HBM4NVLink

6switch3600GB/secX1600IS/Ethernet

Switch,20222023數(shù)據(jù)中心規(guī)涅2024p交.2025忮才限禮.2.K

I

)U:

美偉達自研(

mrace(

:

PU,在\RM榮構(gòu)和自9

技術(shù)優(yōu)勢從陸上渦足數(shù)據(jù)中心業(yè)務(wù)對干(

:PU的性能需求尺比如.......還

P吐叫

性l

..口景市場控術(shù)需求自身技術(shù)優(yōu)勢傳統(tǒng)的CPU架構(gòu)難以滿足凡及馮性能計至對計至能力秅求NVIDIA公司憑借其在圖形處理和并行計豆刃方技面術(shù)優(yōu)勢,推出GraceCPU蘆:Gta

ceCPU— 量虐應(yīng)

,面向服務(wù)器和數(shù)據(jù)中心生態(tài)系統(tǒng),可采用多種配君滿足不同數(shù)據(jù)中心的窯求艘藹性睛與四 ·

采用

ARM

架溝,擁有72

個Arm

Neoverse

N

2

內(nèi)核,配備

lP

DD

RSx

內(nèi)存,奧有超強的性能和效率雙庭懊隋羹效 .

可與

GPU

緊密結(jié)合以

增強加速計笛能力

,也可作為強大而忘效的獨立CPU進行部否翌Gr

e

Super

ch

ip兩個GraceCPU,

共1”

個內(nèi)核Grac

e

H

p

er

Superchip72核GraceCPUHopperH200GPU心采用 Arm

V

系列廷礎(chǔ)架構(gòu),CPU

內(nèi)核中的雖新產(chǎn)品一Arm距

overse

V2

CPU架構(gòu),經(jīng)過優(yōu)化后捏供領(lǐng)先的每線程性能

能效更禹曇實現(xiàn)了兩個單指令多數(shù)據(jù)(

SIMD)

向彰首令矣,可加速機器學習、縣因組學和密碼學等關(guān)鍵HPC應(yīng)用程序。子揉作Grace

CPU

Arm

v8.1

中芭次引入的大型系統(tǒng)擴展(LSE)

.提供低成本的原子操作,提禹 CPU到

CPU

通信

鎖和互斥鎖的系統(tǒng)是由NVIDIA

設(shè)計的可擴展一致性結(jié)(

SCF)

是一種網(wǎng)狀結(jié)構(gòu)和分布式緩存架構(gòu),提供超過3.2TB/s

的總二分帶寬Grace

CDDRSXPU

Superchip

使用禹達

960GB

的服務(wù)器、級低功耗(

LPODRSX)

內(nèi)存和

ECC,

實現(xiàn)帶寬、能雙 容雖和成本的昆佳平衡Grace

CPU

Superchip

支持

128

條PCle

Gen

5

通逄和128GB/s

的形狀

^^

l!aJ岫次連接 雙向帶寬,可分為2x8

個以足供額9頃

旌接,并支持各種PCle

插棺英偉達H前(irace

(:-P

U

怍俯表現(xiàn)出 色, 專 為矗怍 能 計 n及數(shù)斟中心打迅,并將在2位

6年推出下

1`

'r e

ra(:P

U,計劃于未米幾年推出悄貸行級別的CPLl產(chǎn)品a.0u性Pc適用于兩性能廿互(HPC)和云計瓦設(shè)滬晝多配備1”

個為

mv9

CPU刁系,云一氐

LPDOR5x

竺的沖接口900GB/s

,相比

PCleGon

5

7倍忠是

OIMM解決方案的兩倍過俘的,瓦當前幸CP

U的兩倍i'軒豐擊,#.,汒

干,多位

沔岱仆

~4“

七r

7995WX(96

Core/

5.1

GHz)NVIDIAG,ace,:T2Co,e/3.35

GHz)XeonW9-3495X(56Co,e/5.3GHzLN2

)仆'

.adripp,,,5995WX(64Core/4,3GHz)Thre心dppe,

3990X(64

Co,o/

4.1GHz)Ryzen97950)((16Core/Stock)Core;9-13900k(16Cote/St”

幻裹的性司運行所有NVIDIA歡仁逕往和平臺。81A千74.4千72.6干48.0千34.7干24.5千23.0千20000 40000 60000 80000 100000義芯片互連技術(shù)指令栠架構(gòu)核心數(shù)雖和線程數(shù)呈更多的核心數(shù)雖和線程數(shù)呈核心數(shù)呈和線程數(shù)呈相對較少線存架構(gòu)Arm指令栠架構(gòu)Gr

e

CR丿架構(gòu) "1tef

CP

U耍徇采用了NVIDIA獨特的

NVLin

k-C

2C

互連技

術(shù)

(飛大區(qū)

別)分布式緩存設(shè)計x86指令栠架構(gòu)層次式緩存設(shè)計內(nèi)存子系統(tǒng)低功耗的

LPDD

RSX

內(nèi)存通常采

DDR4

DDRS

內(nèi)存年肅度將

CP

U、GPU和其他組件栠成在一個芯片上通常霖要-虧其他芯片配合使用仇鰭英偉達在異構(gòu)計茛領(lǐng)域的進一步拓展在商性簇籵茛和服務(wù)器市場邁出的至要一步為Al工廠等新型數(shù)據(jù)中心提供強大的計筍支持墮沮惑j睬 計鐸領(lǐng)域:

構(gòu)

建再性

能計

餌系

統(tǒng),為科學研究和工程 的計苠支持人工智能領(lǐng)域:

NV

ID

IA

GPU

相結(jié)合,

為訓練和推理任務(wù)提供禹效的計笛平臺E忌哉歧lVera

CPU消費者級別CP

U與,足茫的,\r

m

數(shù)悅中心VIDT.\

Grace

CPU

軟件生態(tài)系繞將Jfl于

(-:PU、GPU

I)PU

的全紜

NVI

Ol\(

軟件生態(tài)系統(tǒng)相結(jié)合囡蓋鬧;

f.il;)J沮“口NVFO殼TIIANI心 c于-仁1l—CU8_j亡歸

UST嚴 戶云石]-- “ 7

嚴可頸吩酐--jH

PC·X

乓孟可二A等庫KDs郎工gggN瀑瘦孛習cuOFcuxltl..,“Sp"

'斗cuS1心9

1cuGR^陽cuMLcuB屯斗I_

cuTENOSRCU中]

(uAAND芷定泛巳頭,.m…四

位1m…RT- 川- ,趴斗占尸勹行,0“廠洶姿站

弓竺 k節(jié) i,— 也習

匹岱飛田IUl

i1I盲cuSOLV[LcuSP衄SE

_CUDA

Klfflttm侖“

ATHA門[ 如 CPU.O..正..叭.:.PU&心

J

中.…一蛇醞·蘭于--.二=-己`臣CPU

符合

Arm

服務(wù)器基礎(chǔ)系統(tǒng)架構(gòu)

(SBSA,)以砍卸

9硬件和軟件接口.

支持

Arm

服務(wù)器基本引導(dǎo)

要求

(SBBR),以

支待基于

Gra

ce

CPU的系統(tǒng)上啟用標準引導(dǎo)流程叩立年-NVIDIA

HPC

SDK

和每個

CUDA

組件都有Arm

原生安裝程序和容器.所有主要的

Linux

發(fā)行版.都可在

NVIDIAGrace

CPU

上完美運行.無霖修改編譯器、庫 工具、分析器、系統(tǒng)笸理實用程序以及用于容

器化和恁擬化的

框架可輕松地

在NVIDIA

Grace

CPU上安裝和使用NVIDIA

GPU

Cloud

(NGC)還提供深度學習墜氣

岱穹煙雁璧::

迤2.2GPU: GPl

要包栝核心、從{f、流處珂器守部件,單核心數(shù)坎運晶千(:PU,

因此兒付忙i效的井行處咒能力,在處珂沁址數(shù)據(jù)及加速計開時休現(xiàn)出蝕符架構(gòu)優(yōu)勢GPU嗯

上理

單殉是一

種專門 設(shè)計用喬 襯亙外一圖 像和槐 肪

侖的電

腦硬件它足現(xiàn)代計算機系統(tǒng)中的關(guān)鍵組件,特別杲在處理圖形空集型任務(wù)時-

畛 J網(wǎng)格核立記存-M刀)點

處理器冬".....'”

“,'

lI碼器,心光掃化單元忙千,""""''斗皿 笠勹 笠 尸 圖像的頑

和沁波,

泗一

勹的核心 ,

但和借誦常遠多于CPU,1

形和計互GPU開行處理穹n

力的苔礎(chǔ),使其蹤侈同時處

理大呈任務(wù).GPU臭有自己的專用顯存,通常為300R(圖

形雙倍數(shù)后速軍

)類型.顯存用于存儲圖形和視凌數(shù),其啟禹速度和大帝寬向生對千禹效圖形外 理至關(guān)繭要.迎 是GPU

內(nèi)嵌削

處慰

,負癡以強

和果羅

擔的并而

,厗處理器的數(shù)呈可以從幾百到幾節(jié)

,這亙接影晌

GPU的處理能力..君色器是運行在GPU上的小程序,用千洹染圖隘的石哉妥分,如頂點君色器、像索君 色器和幾何吾色.器.

光割化是蔣茹圖像轉(zhuǎn)換為2D圖堂的過程了元面瓦面冠豆r

這-

迥思

30圖骼酗

的建 酚 . .

這些接口,如HOM威

Displ<1y

Port,

負要將洹染叨妥像發(fā)送到顯示設(shè)各.,(O,O)「共享內(nèi)存F寄存器寄`TThread(O,O)*本地內(nèi)存出接口'..…“”心圖形一支持l·

現(xiàn)代

GPU支待禹級圖形特性,如邸寸光

柜職

寂RTX

技術(shù)沫}

'心返動的

的優(yōu)呻

DLSS)1 且叨1? GPU的設(shè)計至點在千并行處理能力,能夠同時處 理大雖的圖 形數(shù)據(jù)

,這圖

十、

類型的計苠空蜘

型任務(wù)中使待它在拙 吵 戲表現(xiàn)出色:令一

紋理內(nèi)存r— 全局內(nèi)存+-i-寄存器」Thread(2,0).本地內(nèi)存Thread(1,0)l本地內(nèi)存JT,英

偉 達 兩 年 迭 代 的

速 度

付續(xù) 更

新 GP

U

尖 構(gòu)

, 伐

米足 l止界上笱4汰貝正遼義上的GPl

T宏構(gòu),帕斯卡足行個加入了支持淶度學習功能的架構(gòu),伏符足八正岱義

上的第.放

\l

芯片即迦b侂

鄧,叫 1叩

i1`'iF 句

舊卜T`

``lJtI啟呻 {

:Ja11TI???..合.中文代

號"書斷拉

費米

開蕾勒曼克斯韋比哥卡伙特圖靈安培林怕布秉克威爾時問2006200920122014201620172018202020222024材欄40nm28nm28nm16nm12nm12nm8nm4nm4nm71

億8昭13

5億211

億146

億540

億800

億2080

億I品體笆1妃I3”

乙規(guī)壇484mm2466mm216

個551mm215

個核128

個SM食32CUDACor

e,

共計S總M消X度*(192

個+64

個512

個-CUDA雙栝層601mm2610mm2815mm25120

個754mm24608

個826mm2具有

6912

個814mm2吳有

18432

個814mm2具有

3072個CUDA核心CUDA核心、576

個張呈CUD凡安心、43

2個張呈FP32CUDA核心核心張呈核心核心,57

6

個CoreCUDAcore)首個支待超級在率、在人工舌能、HopperTrans包含2080

億計計至G豆P梧U和辰的架雙計待歪繭大芒民提升上.獲墻強了GPU的能密度效比,和功耗計只繭新培了R心a(y可硒RTTr件C加acrin速oe)g光核,光線追蹤和圖forme

r

引罕可個晶體芭,采以做到

FP16首個通用GPU計繭架構(gòu),采用全新的CUDA架構(gòu),計蕓空度足 有300

W,

比引入L1/L2快修速緩袁存功、

諾誤能以及GPU

Direct技術(shù)標K_e志p

l若er

的兩(

音,

M

a鄧

ell

架構(gòu)"

Pasca

啋構(gòu)提禹了近3倍,可以大大加速線追輝運百和FP8

之間逐N層V交I

O換I,利響用特

點形?言染等方面性能大犧沃升,功耗卻只有400W,

能效比顯若良忘的陡啟百盂方法來GPU

的 提離 50%以上

人工智能和深節(jié)能計

笙時代到來庋字習的訓練與推理用雙倍光刻極限尺寸的

揉片,通的過片間

1

0互T聯(lián)B/技S術(shù)連接成一塊年 的GPU構(gòu),計巨

能力比

Ferm

i架構(gòu)提離3-4倍,GPU

開始成為禹性能計繭的關(guān)注點婦 畦 C

語吉進行 GPU編程

,

標志若GPU

開始從專用圖形處理器轉(zhuǎn)變?yōu)樾刑幫ㄓ美頂?shù)臣器這使拐GPU

可以過心乏的人工舌能、汽車等新興應(yīng)用市場.L疊一·^

三一目I

沖Te

m

o

r

(:(

)re足筷偉達GPU成為Al芯

片的

關(guān)

鑲技

術(shù).加速深度學習模書訓練和推珂能力臀日 前

迭代

干笛五代匹 邑

勺.

君扣付景定義袒 竺萬冊鳥曬.

深庋學習技術(shù)的飛速發(fā)展對計莫能力提出了更禹要求,傳統(tǒng)的CUDA

Core在處理妄雜的大規(guī)模矩陣運茛和卷積任務(wù)時力不從心Tensor

Cores專門針對深妄學習授型訓練和推理中的常見操作進行優(yōu)化,是一種特殊的硬件加速器.被英偉達設(shè)計用于GPU功能 ·

忠莉匹

后度的同時大栝提升計苠效率SM.

將計至能力擴后到FP64、TF32

b

floa

t16

秸度,

TF32恪式.

.

--

-、.,、,--、,.

`.`·

--,_-

-`U匕 九on

Cachet

rud

ion

CacJ,ew.,P”已如1立“( 已 動

西如

尸UIch 戰(zhàn)pnThm石晌·一 .."9`

'`e,

心 (

”“

兇叮2

如t曄 5吐 tion_ca,

hW叮-p

Sc(U

th,.咄

亟i…

屯t<h7口函 .

1-1,..-.

°!Jltfi,..

?

業(yè)1碼

i,t“

(”“

小"

匕t`尸七i?r

-lI寸[,

...石、守盧巴巴叫F

l巨三戶戶匕l(fā)匕l(fā)

丘已巴巴曰巴三匿雛屆丐任屯9

F

]曰巨二—

,昌圈

匡匕

..匕已

呾 [

心臣莖唇盧已巴玉[一勹孚霪甲巳芒曰囡巳三l巴巴已R國..l

巨匕

一涕一代亨雹m

m

Core)令第二代J1令比.三代.一i眾仁,尸n....口-

·T一.心n一O一r.C--o·r-e-).引平紀”四“n代,or

Coro)ld乖日臧印令代T”“°r七

t)Tensor

Core支持的精度CUDA

Core支持的精度GPU

的活在吞吐雖提雨了多 達12倍,與前一

代的PascalGPU相比

瓬艦

V100的640

個核心提供商達勸孔遷都扜頃醫(yī)TensorCore

梧度從

FP16

擴展到包括lnt8、lnt

4和lnt1,

可以將GPU的性眵吞吐是加速至比PascalGPU離出多達

3

2

倍,且首次

在消雯級產(chǎn)品中配各Te

nsorCore.

隨君

Hop

per

微架構(gòu)發(fā)布,

NVIDIA聲稱這將便大邸

巨吉侯型邸 I,練

·比上-fl;快30倍蛉202

碑 NVIDIA發(fā)布第五代Blad<well

Tensor

Core,

與上一代相比.可為大型摸型提供3吭

加速,且提供野

生和梧度BlackwellHopperFP64,TF32,BF16,

FP16,FP8,INT8,FP6,

FP4FP64,TF32,8F16,FP16,FP8,

INT8FP64氏 2,

FP飛,BF16FP64,FP32,FP16,6

F16,么"號鼎唯臺詞出新Blackw(

II榮

構(gòu)搭載于Ci片

(i()、B101)、

B2叩

,推動數(shù)據(jù)中心進

轉(zhuǎn) ,

為許倩工廠奠定技術(shù)叢礎(chǔ)

=

.

l-, L I-BlackwellBlac屈

ell架構(gòu)采用了TSMC的4NP制圖

環(huán) ,特點

是搭載了

208

品休音和離達

192

GB的HBM3

存,以及BTB/s的

內(nèi)存帝寬,顯示出其在硅片設(shè)計和內(nèi)存技術(shù)方面的先進也架構(gòu)立待郡劉百臣擋式

和微張呈縮放技術(shù),便拐

Al淏型可以在保持禹捂民的同時實現(xiàn)更雨的性能。':,CUDA.

Tensor氏, w、“ Tor

ch蕁主;如也架摔客,

井虹習與各

夫生態(tài)系飲合仵伙伴協(xié)作

.贖淳了應(yīng)用開友和部害的靈右莊心轉(zhuǎn)型推動發(fā)展「環(huán)T

llaclc--,e!IBl?ckwcll架構(gòu)的出現(xiàn).代云合數(shù)抵中心轉(zhuǎn)型的實現(xiàn)和工業(yè)笞蒜化的還一步推進升級優(yōu)化Al芯片和胺務(wù)t今還苔盧-

工廠胥

,b`I餓芬化與蘭OE界M各和之云的人-=工王飛權(quán)合作函玩糾紜今如?,改猛灶僅忱氐_笠 寧

心到生產(chǎn)汀雪. Al線型的l'I.鈕的智蜓工廠和擦心設(shè)施^屯忱設(shè)施基于BlackwelGl

PU的幾種產(chǎn)品變體包括G82,00

B200fll8100,涵蓋從超級芯片到離散加逗器的多種配蕓,滿

足不同計豆君求和 荔麗鈺迸.GB200栠成了兩個Blac灼

ell

GPU和一個7難

的GraceCPU的超級芯片,在提供

一體化解決方案萬面 實力突出

.8200

GPU在Al計豆領(lǐng)域突出,處理1.8萬億參數(shù)的誤型,性能提升

1

5{生8100能應(yīng)對1

73吩數(shù)的燈吾言摸型.2000張BlackwelGl

PU僅栗1/4的電力即可完成與000

長HopperGPU相同的訓練任務(wù).GPU構(gòu)成區(qū)哀

H-(FP64/TF$V“

'

"

白芍/F悶)·HGXB200

8-GPUax

NVIO<A

8200

SXM3如 /

18PF/

36P打7咋HGXB100

8-G沁axN

VID

IA

8

幻OSXM/

144PF

2心

下I

14PF/

28PF八婦

I112PF

廷忑毛逞邊l

啟動Blac壓

elI芯片的呈產(chǎn).隆出墨于x8

6榮構(gòu)的H200h.

L40S、8100

扣B心芯片.H200將提升

內(nèi)存至282GB,

帶寬培加3倍,搭載

1

44GB的HBM

3內(nèi)存.上2024椿出Bl

ack

w,ell

Ultra

GPU8顆HBM3e

12hi內(nèi)存,井淮出腔艦阪B200A磁

HBM3e12hi,5i,'o-202推出Rubi

n

GPU

I采用8顆HBM

4內(nèi)存,Vera

CPU作為Blackw

ell平臺的繼任老.惟出Rub

in

Ultra

GPU12顆HBM4內(nèi)存Arm的Vera

CPU和NVLink

6

Switch(3600GB/s),進一步鞏固英偉達在禹性能計茛和Al市場的蜘 位,為職

靈茄

i

任務(wù)劇 乒支持

.:o。....202620

足同

內(nèi)

i:安(i

Pl1廠商以7Il

m

為主,

多數(shù)不從備雙付度.FI)6

4,較油外英偉達、Al\11)和萸符爾"

定距離呾吩上應(yīng)啡百擾_ -

驅(qū) 匝 役H100

PCle48TFLOPS9.7TFLOPS江350W竺『專而泣噓設(shè)計噓叩擔即彰蕊晦也黔畦英偉達西廣4nm7nm19.5

TFLOPS24

TFLOPS300W具備54

億個品體笆和第三代Tensor

Core7nm23.1

TFLOPS11.S

TFLOPS300W廷于CDNA架構(gòu)的數(shù)據(jù)中/心系列加速卡海外主要品牌AMO6nmA100

80GBPCleINSTINCTM1100IN

STINCTMl25045.3

TFLOPS45.3

TFLOPS560W英特爾銳炫Ar

c

A77

06nm17.2

TFLOPS不其備225W+離通Adreno

X14nm4.6TFLOPS扭備兩性能計豆和人工苦能h晦

卡,吳各

13

,

312

個淀處和

208

個計豆蘭元采用Xe

HPG8架新構(gòu)罕,VR支S待.DX12Ulti

mat

e、呼件光線追蹤可變刷 、XeSS超級采樣、PCle

4.0專為Wi

nd

ows

on

ARM系統(tǒng)設(shè)計的驍龍X系列soc的第一代栠成顯卡萃武紀思元3

70

X47nm24

TFLOPS不具備150W|

E

390妢 晶體音 ,即

共云郘

]邁沉

理器,滿足不同層次的人工否能計豆盂求?;忌畈菀惶?nm12

.2

TFLOPS10.1

TFLOPS350W國內(nèi)主要品牌摩爾紐MTT

S300015.2TFLOPS不具備<35W笠怔

l科技壁砑 100P7nm2456TFLOPS不具備450-SSOW1

內(nèi)唯 一

寺FP64

寺運

至,相當于英偉達A

100的70%1

M

U

S俎晌

,擊

第刁

噓 GPU

芯片.

春曉

”1

右像索頑垣充率和 Al

運亙性能 距邸

達到國際芍場天數(shù)智芯天該1007nm37

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論