![英偉達人工智能發(fā)展戰(zhàn)略研究報告_第1頁](http://file4.renrendoc.com/view12/M06/21/29/wKhkGWb-UEyAIz5lAALdWpn2XDw756.jpg)
![英偉達人工智能發(fā)展戰(zhàn)略研究報告_第2頁](http://file4.renrendoc.com/view12/M06/21/29/wKhkGWb-UEyAIz5lAALdWpn2XDw7562.jpg)
![英偉達人工智能發(fā)展戰(zhàn)略研究報告_第3頁](http://file4.renrendoc.com/view12/M06/21/29/wKhkGWb-UEyAIz5lAALdWpn2XDw7563.jpg)
![英偉達人工智能發(fā)展戰(zhàn)略研究報告_第4頁](http://file4.renrendoc.com/view12/M06/21/29/wKhkGWb-UEyAIz5lAALdWpn2XDw7564.jpg)
![英偉達人工智能發(fā)展戰(zhàn)略研究報告_第5頁](http://file4.renrendoc.com/view12/M06/21/29/wKhkGWb-UEyAIz5lAALdWpn2XDw7565.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一之4為
j鄉(xiāng),.j
使尥:f1J削
I九訪先』鄉(xiāng)解以內(nèi)們見術(shù)訪巴ClaraCUDA『嘔c
o
resCUDAKernelCUDA
StreamsCUDA
Toolkit嚴醞cuOptDeep
learning
SDK邕DRIVE
Sim匡廣竺廷千Amperes組勾的兩咭 5G絡(luò)的
Al平臺一組預(yù)定義的函數(shù)或協(xié)議,用于構(gòu)洼軟件應(yīng)用程序話
一醫(yī)療旬
酕
磁
的Al廿年平臺CQ_mP._Ute
U
fiedDevice
Architecture的繼寫,呈NVIDIA的主甘扛迂墮熱郎
編程役型CUDA計耳單元,GPU中用丁并行處理任務(wù)的基本處理單元.CUDA程序中執(zhí)行的并行計棄函數(shù).CUDA的并行執(zhí)行機翊,允許多個任務(wù)在不同的流中開行處理.包含編譯器、蘆 開發(fā)工具和文檔的完整開發(fā)工具包,用千CUDA
編程嘈用千半導(dǎo)壞制適的計棄光刻技術(shù)用于物流和路徑優(yōu)化的Al工具NVIDIA
語供的軟件開發(fā)工具包,包含用于深宦字習的念和工具.專為數(shù)據(jù)中心設(shè)計的忘性能GPUEGXion)FP16(HalfPrecis-
-GeForceGPU蘆 rect| G-SYNCHGXIGXIsaac它數(shù)壇中心GPU-,尸叩、袒Al訓練和婦
廿克
覓升屯信網(wǎng)絡(luò)的性院和若能化支件開發(fā)和至成提升醫(yī)療設(shè)備和應(yīng)用的性能深度計棄件.__字一,NVIDIA的 .
習超級 ·機平臺,果成了諤
性蹺
GPU
和優(yōu)化的軟一
住Al
翩
沺
翊法
,
醞 賈 砌 輝 輸戲 測
廚
百分辨迎礎(chǔ)專用千數(shù)郔璃的處理芯用于自動駕駛汽車垣擬譏際的軟件平臺,----一種能夠檢測和修正常見的數(shù)遐損壞類型內(nèi)存月 與的GPU平臺鈺 t
浮和
燭
度 用于加速深度宅
祖擔
的汃際
和基
理.一CPU和主內(nèi)存的干預(yù).面向游戲哀樂領(lǐng)域的顯卡系列專門用千處理堡形和視覺計哀任務(wù)的處理器NVIDIA技術(shù),允許耳
接在
GPU之陬
專汾數(shù)據(jù),從而改少勛 蹤 旺
嘶
率與顯卡給出,農(nóng)
踵雨
撕裂月 忘性院計其的GPU平臺專為哲蕊邊忿設(shè)備設(shè)計的計棄平臺年和研發(fā)的軟硬滬抬1
i用于開發(fā)GPU_pt漣
的應(yīng)甩捏序擔年
生用千執(zhí)行弁行計五 任務(wù)
,加速
計耳藝
年和內(nèi)甩用于在
GPU
上執(zhí)行開行計棄任務(wù).ffl丁提了I并行計棄的
效率.尸
- guDA硒曬
.提升芯片制適的秸度和效率提商物流效率和任低成本用于開發(fā)和優(yōu)化深虔字習應(yīng)用.語供大規(guī)袒Al訓練和撐理能力二用千忘性能的深度字習訓練和準理.提升游戲幀率和圖像質(zhì)呈提 中心網(wǎng)絡(luò)和存儲性蕊提商目珈鴉子控的安全性和效王誦圣至實現(xiàn)實時Al痄瑪擇莊分析用于提禹計繭效率和減少內(nèi)存占用.虔性能游戲休驗提供圖彤渲染和視覺計罕能力用于提升
GPU之間的數(shù)據(jù)傳紛效翠改若游戲和視頑的視覺質(zhì)呈支了研究和妄雜計耳任務(wù)提供安全、忘效的邊淙凡計棄`
曰
、眾詈四鼎帷咨詢「nJ
Jl.J上少etson
印ll
n』_
侖tmpoli巳.
I
GNeMoNVIOtA
GFENVID隊
Reflex.工.VLin
kNVSwit.ch
Omni心
吐
QuadroRAPIDSReplicatorRiva
R歡
R僅
AlPCsSMPStudiouperNICTensor
Cor『eTensorRTIT1edal
1G1PT,okkioT”mn10
V
_0vGPU平臺
戲優(yōu)化的信;
用
千
在多 個 GPU
之1可逗供商速連接_
用于 3D設(shè)廿和實時
協(xié)作的平臺
砰臺存和王廈PU資三、 發(fā)展階段。吳偉達創(chuàng)寸3
至今纖過了創(chuàng)業(yè)初期、GP
U定義時期、GPU迭代時期、Al帕井時期、,\
J痄煌
時期
五個階段,
井在20
24年6月19日咸為全球市價員(..”的公司"內(nèi)S 推出公司首款產(chǎn)品N
V1`"7
.推出 全球 首款 128位
30處理 器RIVA
128六 7
.
推出Tesla
GPU六泗 在第一屆GPU技術(shù)大會上發(fā)布代
號為
械Ferm i嶺的新一{歡 UD A
GPU架構(gòu)如 1.推出線 苞衍又核移
動處器Tegra
2“'2 發(fā)布廷于Kepler架構(gòu)的GPU20f3
發(fā)布百款完全繼承的4GLTE移動處理器Tegra
4i;
面向游戲玩家推出GeForce
GTX
TI
TAN理 "4
;
發(fā)布192核超級芯片Tegra
K1,,
推
出
M
a
xwell(第10/tl忠勾)1022·
公布 錄新自 動駕
駛技術(shù) 平臺Drive
Hyperion
9;
發(fā)布云原生Al侯型和服務(wù)OmniverseAvatarCloud
Enginr(ACE)2O2).推出新一代GH
200
Grace
Hopper超級芯片,同時
佳出基千GH
2叨
構(gòu)建的
新服務(wù)
器設(shè)計10
Z4推出
N
VIDI
A
Blackwell平臺,以萬億會數(shù)規(guī)模推動Al計茛的新時代,
6月
,
英
偉達市佳登
頂鰭
第一超越微軟和蘋果11.:J匕
7創(chuàng)業(yè)初期,7 UlGPU迭代時期J u....作..Jd
4Al
輝捏時朋。GPU定義時1l111
芘" :
納
斯
達克
上
市X咖 與臺
積電
簽約廷
立
合作伙
伴
關(guān)系鄧 1. 攜nFORCE進軍栠
成顯卡
市場石峰、 推出
SU
技術(shù),允許多個GPU連接l006 推出用于通用GPU計茛的架構(gòu)CUDA.,., -'..1Al覺醒期時功' s.搭載TEGRA
X1的DRIVE問世2016
推出全球百款一體化深庋學習超級計瓦機DGX-1JO,S 推出開源GPU加速平臺RAPIDS,推出Turning
GPU架構(gòu)2019 在HPC`
嵌入式、數(shù)據(jù)中心、自動駕駛:
汽車和專業(yè)圖形市場中取得進展,血 0 推出
Am
pere
GPU
架
構(gòu)
助
力數(shù)
據(jù)中
心
,,產(chǎn)品
布局
從
GPU擴展至兼具OPL/及 1 發(fā)布
Grace
CPU,
專為巨型Al和商性能:
計苠工作負載設(shè)計,成
為
吳有
CPU、GPU、'
D
豎平狡泗鼎顱迭笱
扈階
段:
英偉達從游戲屈卡起家,并發(fā)布世界上第.汰貞正總義上的GPU產(chǎn)品,
成為浙戲品卡市場的傾導(dǎo)行和GPU產(chǎn)品的定義行I品
無7),市場競爭和財務(wù)困境創(chuàng)新精神和戰(zhàn)略轉(zhuǎn)型在圃夼芯片市場取得互要勝利成為專業(yè)可視化領(lǐng)域的領(lǐng)導(dǎo)者在GPU拽術(shù)、湔戲饑合作、和盄卡市場競爭方面取徇亙大進展CUD
A平臺的開發(fā)和推廣為A
l鋪路在游戲顯卡市場中占據(jù)領(lǐng)導(dǎo)地位頤嚨十算領(lǐng)疇翠推出革命GPU架構(gòu)和產(chǎn),實品現(xiàn)技術(shù)突
破_蹈介段第三階段[
1
993
年
,從畫 西
部. 通用圖 形計皿 步l儼推出第一個產(chǎn)品:針對游戲主機的1
99 5
年NVl顯卡199
5年
貊氣韌,推出關(guān)鍵芯片產(chǎn)品Riva1首 128位的3D處理器,在圖形芯開始崛起1999年,借GPUGeForce
256宰丙
就歡-BOX訂單
同年IPO成功 20
00行,收購3dfx,市場形成英偉達與ATI的雙雄格局I
200 1
年 推出業(yè)界篤
開始能夠利用面 阿 衄 GPU:
GeForce3,四
哮
淚G
PU完成 為訓練Al大摸型埋下伏筆I 已 年,為疇 $3開發(fā)俎
匿叨
碩
心邏鋁開頑2006年 CPU單 AMO收購ATI后由開
貪謠限制導(dǎo)致顯卡份額下沿 英偉達推出通用平行計筍平臺CUDA,廷立CUDAI
研究中心 ,后成為邸 學習和
Alijl晞的首選GPU架構(gòu),助力英偉達取待領(lǐng)先市場地位2007
年 Tesla
GPU問世,標志君NVIDIA在禹性綏泊算領(lǐng)吻為里大突破.使待GPU的強1大計
第能力 應(yīng)命 藥物發(fā)現(xiàn) 醫(yī)
學成
像等領(lǐng)域[
201 碑 ,提開
UDA核心至512個2014年 完全實現(xiàn)M
axwell設(shè)計架構(gòu),在2010年全球雖快超篤前五強中借助NVIDIATesla
GPU占領(lǐng)三個地位,在2012年雖快的超級電腦泰坦中有18,688顆基于Kepler的NY._IDIA
Tesla芯片公眾
號-
l
目鞏二陰段:加 J.')
年英偉達行次發(fā)布了面向深度學習處噸器,
GP
U芯片構(gòu)架向
\I方向大步邁進,日前人工罰能芯片方向的以市占書8
們
處于絕紂壟斷的地位,血d ,千三飛雪
邕 硬件供應(yīng)商+深度學習和人工智能時代為先行者和淮動者酮-`.過.人工智能方面處于絕對壟斷的地位(市占率80%)GPU技術(shù)深良學習Al
應(yīng)用并領(lǐng)域Al數(shù)寧生物氣候科學游戲自動駕駛汽車機器人等領(lǐng)域推出用千訓練深度神經(jīng)網(wǎng)絡(luò)的殿強器NVIDIAGeForceGTXTITANX芯片架構(gòu)開始往深度學習和凡方向前進發(fā)布Vo厄架構(gòu)和NVIDIATesla?V100GPU加速器極大提升Al運自改率Amper呻 對Tensor
Core進行了進—步的升級.爛加了對稀疏矩陣計茛的支待ao1s2016唯出16nmPasca唳構(gòu)引入新的總線相通佑協(xié)議NVLin,k
用于GPU和CPU,
以
及多個GPU間的
連接推出
Tu的計豆能力,同時實現(xiàn)游戲中可用的災(zāi)討光線追蹤洹染此結(jié)構(gòu)下的Tesla
T4
GPU計百皿頁器成為經(jīng)典
AJ豆
力卡發(fā)布4nm
工藝的
RTX
40系列顯卡,性能比上
50沒際 CPU產(chǎn)品Grace:這盄
懿
芯總 部 rac或l
Hopper架構(gòu),為A印禹性能計百提供了強大的千U
+
GPU組合2017架構(gòu),邸 nsorCor心
血2020,
作文待設(shè)計、開發(fā)、部菩和軍郢沁
mnive<seClou
d, 實現(xiàn)先進工r 數(shù)
字化推出
GH
200U
以
及游戲兇鎂型
代工服務(wù)平臺
Avat
arCloudEngine(ACE)
forGame2022 2023還24發(fā)布Blac妞
ell
GPU8
100,
芯片尺寸
接近EUV光刻技態(tài)
郢侖極限 (858
平方去
米
)
,含有
1
040
億
個品體笸發(fā)布Rubin
GPU,
VeraCPU翌
Omniverse平臺提供方案筷擬、合成數(shù)據(jù)生成和忘保頁可視化等I坊g,幫助制造高優(yōu)化工廠布局、測試機器人系統(tǒng)并提禹工人安全公布戍須器人項目G
嘔;勹畟?瑰器人1 貫?隆詛L
_userid:529794,docid:174986,date:2024-09-18,3500031
9703000025000200001500012230公司廿屯收入和凈利潤均早現(xiàn)波動上升凸勢,
其中202:1年廿嘈.收入中數(shù)斟中心業(yè)分貞獻慫大`2
O20
年節(jié)20
:.t-l年占比
超過701111營業(yè)收入(億美元)007006005004003002001030025020015010050。52.73%_···166 .
7561.40%269.14營業(yè)收入2020凈利潤(億美元)43
.3
22020202155.58%2021269.740.22%勹2022變動比澤125.85%609.22/.市恒凈利潤97.523(26%43.62022150%100%50%0%各業(yè)務(wù)市值(億美元)100005000。3641.8I2023千 變動比率85.32%297.62023100%20%初%-140%80%60%40%20%0%2021各業(yè)務(wù)收入構(gòu)成(億美元)100%21106-
5.61252022 2023覜中心部戈可視化汽車倉16 一11104911502021^ 20公眾
c::::,475伴比例耘于研發(fā)伐川半.研從
20
21
年到202:1年,研發(fā)貸lf1和目,行與齊貸噸ItI均早
上升凸勢,銷仵與齊珂貸1tJ率下發(fā)費用從投入過去三年卅長約1
30%,
銷仵與管珂費用培加約4
(
)ll
”研發(fā)費用(億美元)9080706027.21
%50.40302010。產(chǎn)品研發(fā)嘈-研發(fā)費用率50.00%86.7573.3914.24%40.00%30.00%20.00%10.00%000%30252015105。銷售與管理費用(億美元)銷告與笆理費用`-費用率12%80%26.5424.460%21
.6
619
.440%20%8
%9
%4
%0%202020212022202320202021號
雷戶三、 發(fā)展戰(zhàn)購。英作達通過對計n機底足技術(shù)的全面更新,
以
“
CP
lT+GP
U+OJ>「l '.=大
芯
片
為產(chǎn)品底庉,推動英偉達咸為人工許能計算頜域的領(lǐng)導(dǎo)行屈 沖心 lk k'創(chuàng) 造 下
一
個
工
業(yè)
革
命
,
推動
人
類迸,,.油
走入 人 工智 能和圖 形計 算的 新
紀
元
-
E四計黜l )改變計茛的工作方式和計茛機的功能隨中心推動全球的數(shù)據(jù)中心行業(yè)現(xiàn)代化西引扣切冗蘆段質(zhì)氐貊行郵
翻、 研發(fā)單一行業(yè)刮礦幸現(xiàn)牢
目標市場如醫(yī)療、自動每使三芯戰(zhàn)略CPU中央處理器人工智能全球人工智能基礎(chǔ)設(shè)施的引婺機器人推動人工智能機器人和T1V豹字化酗節(jié)巒住鑿麗刊泌迫鯨 可供千A江業(yè)機器人訓練租封乍的3PU,
及乓對應(yīng)涸試、訓練用的底層軟件GPU
圖像處理器DPU
數(shù)據(jù)處理器英偉達把計應(yīng)饑整亡壓術(shù)重汀及曝了一遍11lI懟C
無
團11- mOGX專為合W級Al
設(shè)計平臺cuDNN深度神經(jīng)網(wǎng)絡(luò)的GPU加速庫園集成TensorCores技術(shù)的Al芯片架構(gòu)郢也NVLink忘諫可詫技術(shù)VoltaTuringEGX加速邊緣計算的平臺NVSwitch網(wǎng)絡(luò)交換機IGX
T級邊綠Al平臺AmpereHopperBlackwellNVLink-C2C芯片到芯片裸片到裸片的互連技術(shù)HGX靈活定利的Al硬件平臺M
GX
棧塊化貼 的計笢平臺TensorRT深度學習惟理引擎NCCL構(gòu)建多GPU和多節(jié)點井行應(yīng)用程序通信庫NVSHMEM為跨多個GPU
內(nèi)存數(shù)}匼創(chuàng)建0 全叢局即上衄人澗虧庫
可 l
nfi
ni
Band
技術(shù)SHARP伎術(shù)ASAP技術(shù)Spectrum?X葉霓沮吳偉達的產(chǎn)品
架構(gòu)包含以“CP
U+GPl巨
DPU" 為中心的硬件產(chǎn)品、以Cl
Tl).\為核心的軟件生態(tài)、以NVIOl
入M
-t-.、YIDL\
Omniw
rse為1:的平臺和各個場杲下的應(yīng)用柜架suLuD3I、應(yīng)用層...JNAIXINE!:MO-
`-,` 叫也:0'A
TARIVE1立
AC!>OLIS平臺
層NVHKAAINVIDIA0
斤
"
se軟件生態(tài)嘩
J
義亟 ·Magnum
10DOCAIBase
CommandForge硬件
層蜘萸偉達托悄快速迭代的研發(fā)能力、供應(yīng)論的
l:導(dǎo)地位、多種廿銷策略、扁`μ化的組織、多元投資合作支撐游戲、專業(yè)可視化、數(shù)樞中心、汽年四大業(yè)務(wù)發(fā)展,
進
`步鞏同
企業(yè)在
\1市場
預(yù)尋地位四肥\,心說主癡,油生過創(chuàng)造下一個工業(yè)革命,推動人類進入人工智能和圖形計算的新紀元-
-
-
-丘計皿 )頤計算的工作方式和計算即內(nèi)功能郎中心推動全求的數(shù)據(jù)中心行業(yè)現(xiàn)代化密
如叩
租
吭3
畸釭抖加強對垂亙行業(yè)的服務(wù) 研發(fā)單一行業(yè)適配廣刮豆軟件}目
標市場如
醫(yī)療
、
自動駕駛墅雹雹房 Gc
l:OI“. .KI`系列旦卡GeForce
NOW云訪戲服務(wù).\
1
1屯石Q
1.
dr
',和R`T
系列J,P
L
令
業(yè)斗卡NVlDI乎\O
Inn”ersc上1m叮沁
文平臺專業(yè)工作站解決方案扂擬(;r
L?
(IGPU)人工智能全球人工智能基礎(chǔ)設(shè)施的引軍兇皿歷Al芯片
級芯片定制父快1幾、網(wǎng)卡零網(wǎng)絡(luò)
產(chǎn)品舶找計算饑及Al工廠印家主權(quán)
\
I、電信云邊緣計算平臺je15on云計算業(yè)務(wù)(量子計算)企業(yè)
、\dia
\
I
En1<'1'pri,
c
)機器人推動人工誓能機器人和T1K勸字化,.主訟坎伈鯨 可供千Al工業(yè)機器人訓練和民作GP的U,
及其對應(yīng)調(diào)試、訓練用的底層軟件亡貂烹巧自動五校芯片自動過校墻至IJJJI方案虐擬工廠規(guī)劃仿真設(shè)計祀Al+醫(yī)藥Al+汽左三 從
兩季度高透迭代創(chuàng)新超高研發(fā)人員占比酐發(fā)t/1構(gòu)與叮發(fā)合作伙伴J
研發(fā)實迄室布盡26大研發(fā)領(lǐng)域英偉達專利墻Al+機器入Al+軍工士會議行銷杜區(qū)營銷杜交媒體營銷品牌營銷呻哲悄全過化營銷社會責任污誚Al+娛樂Al+禹性能i1豆Al
+交通
Al+安全Al+孛告 Al+電信i見函瀝珀“胡蘿卜幾次神”
的管理方式大訂
單擠
卻 P.l
短缺組件供應(yīng)承諾訂單不可取
消漏保巨大供應(yīng)拽前支付預(yù)付謔占供應(yīng)人工節(jié)侔葦幣英偉達產(chǎn)地業(yè)位鏈____臼咄始人婦
專業(yè)與踴
背景兼ll極效以平化的組織架構(gòu)賦權(quán)式節(jié)理,不給工建作議摒
棄會議匯報繁卉傳飲戰(zhàn)略規(guī)劃向全體員工平
吵上
眾
尸岱玉酢投資領(lǐng)域.機器人、入工智維、消戲.軟仵與硬仵、可視化、云計算與數(shù)據(jù).剛絡(luò)、自動駕校
生物科技與醫(yī)療等初創(chuàng)投資項目企業(yè)問的三級合作伙伴貫鞋冶詢二
、
產(chǎn)品茶略。未來釘力牛態(tài)以CPU、GP
U、DPU為二大核心n力芯片,英偉達、
英符爾、'
,
\
MD及其他代表企業(yè)搶占各芯片市場份額算力芯片 核心功能 代表企業(yè)CPU.系統(tǒng)管理維持軟硬件生態(tài).應(yīng)用程序已 AMDit'IA
RM"Qua
lco礎(chǔ)GPUDPU規(guī)則計筍科學計筍.數(shù)據(jù)生并行運用噱 CUDA的
核心.異構(gòu)計第.數(shù)據(jù)中心基礎(chǔ)設(shè)施"Datacenter
Tax"卸載網(wǎng)絡(luò)、存儲、安全業(yè)務(wù)急A已 AMDl11
@5
YST念
A中抖數(shù)控ll
I,Il1,CISCOn~BR
OA-DC-OM.(
:PU 叢戰(zhàn)之上,
開創(chuàng)中前GPU加速芯片時代 井將DPU作為切=
顆
i:
力芯片作為構(gòu)建未英偉達在通lt1計W芯片來佴力的基石和庇痊I
逸
l
i
包
i
1蘭牛單央處元理伙牛石的岱岱令序氏佐4哼益順染
形Contro1ALUAUALU
ALU爾憤葉諤臣 乒二曹正芷處違摯元嘗千趙務(wù)處Ciche”花已心的機部件ORAM口真AM井行計氏任務(wù)DPUC..,r
u架 雜度雖禹的心片之一便軟件和硬件躲藕,實現(xiàn)
更禹IPC和更忌頻率.`數(shù)據(jù)中心智能駕駛軟件耳于CPU構(gòu)建龐大生態(tài),如:
x86架構(gòu)服務(wù) 器端還足ARM
架構(gòu)移動端匡芒 」 玉 苠、浮部
應(yīng) 陣運笢,婦
5性能計芻雖里要的輔助計苠單元貫PC(一顆CPU)
和服務(wù)器(數(shù)雖不定)CUD
A便
GPU處理泵雜計笢問蓮開發(fā)者可使用C
語吉來編寫程序,早降低了 用戶甚 千
GPU并行編程門檻分為一路、雙路、四路及上以服務(wù)器;以雙路服務(wù)器為主對不同場杲構(gòu)廷的開發(fā)庫和中間件,建立了
飛PU+CUDA:'
的強大笢力生態(tài)預(yù)計升婦
千數(shù)據(jù)中心的DPU
數(shù)呈將達到和數(shù)據(jù)中心服廠務(wù)商數(shù)器同據(jù)等處理呈類級芯英偉達、英特爾等片
OPU/
IPU
大規(guī)模呈產(chǎn),全球DPU
市場將在未來幾年迎來燥發(fā)式培長叩氣益,拉芯片的癥從圖芘外評到數(shù)擺處理芯片蛻變四 飛心
麗型白'.第三顧主力”芯片公眾呈-一顯帷盜違l—基于未來以異構(gòu)計釘為
i:.的訂力發(fā)屁勢凸和片上模式為t
的數(shù)保中心
上流形態(tài),
英偉達陸紋通過自研及井購形成L了
GP
許CPU
tDPLl的三芯布從,實現(xiàn)為客戶役供更加全面、晶效的計餌解決方案元,憎計算力勹求的重要發(fā)展趨勢、,U、DPU
共存的
片上模式中心主流..`此咚皿 硐 成'郫戰(zhàn)鈕研壞肚r..,klGPU+OPU+亡PU叩的通廳算力保詡英偉達自1995年推出芭款GPU以
來,不斷創(chuàng)新發(fā)
哀成為圖形處理行業(yè)的領(lǐng)導(dǎo)生共GPUJ"'
葫邈了從消費級顯卡到忌性能計郘婦甜擴泛應(yīng)用.干心秅網(wǎng)唱沒C過過改露包和方屯力英偉達在2020年宣布陀購Mellano難
,開始涉足數(shù)據(jù)處理單元(DPU領(lǐng))
域.通過整合Mellano啪
捻術(shù)和資源,英偉達在數(shù)據(jù)中心和陣各設(shè)鋁員域嗨了布局為DPU市場發(fā)
哀奠定了基礎(chǔ)應(yīng)對各種計算任足匹些需要快速邏婦行處埋糙力2021年4月,NVID隊友片讓鞦
代號為.Grace·
的CPU其專
為巨型從
1和禹
性能計藎工
作負
載設(shè)計U+OPU協(xié)同
互補啤到命性能與離安全性、逐年飛躍、一個架構(gòu)”全面、高效的計算觥決方案公眾計訂機產(chǎn)業(yè)伴隨打兼行機的出現(xiàn),產(chǎn)量結(jié)構(gòu)從過去的縱向體化轉(zhuǎn)變?yōu)闃E向切片式.這種水平分層的產(chǎn)業(yè)形態(tài)邁就了計餌機產(chǎn)業(yè)叢礁只強慣性、凸壟斷性的符征歸甥腿彗.疇凹-約1
980
年銷售與分銷匾庶黑書叩
(并非按比例展示) 約19
9
5年銷
售與分銷
|商家郵購應(yīng)用軟件1
1應(yīng)用軟件罕告店L
_超市Word其他操作系統(tǒng)WordPerfect卜1
-操作系統(tǒng)計笢機DOS及Windo鄧0S/2 MacUNIX芯片1
1計算機畦戴爾恚菩PackardBellIBM
其他IBMDEC芯片英特爾架構(gòu)庫托羅拉SperryUnivat
e王安公司瑪簡指令栠計第機化會帶來上層豆復(fù)工的大幅增加哥史件瓦度統(tǒng)一的強訴求件強慣性、寬壟斷無法發(fā)生英偉達通過對計W機產(chǎn)品 的
譏新定義、計訂機形態(tài)的演化兌'舊及以漸進式改邊,還步朔泊計n機形態(tài)向"
利于自身的計開機演化方向18個月正新一代
CPU的笨略下不顯6個月發(fā)布一次新品,苠力性缸始GPU作
為一
個單獨的品
類存
活摩爾定飾甄 噓 上可勃 的晶閑
巨數(shù)目,每隔
18
砬
砱
月會增加玉 ,性 升 舊
,而價格下降為原來的 一半帛三.隊兩罕度的創(chuàng)新研覽告代役式即三個開行開發(fā)團隊專汪于獨立的分階段產(chǎn)品開發(fā),確保公司每孫
月推出一次新產(chǎn)品,與行業(yè)市場吁
頡圍保持一致,并領(lǐng)先市場1-2個研蕊動誚10'1?010
'I
O`1
0'1
0'10
'GPU-Computing
perf2X
戶汀
year1000XIn
10.,..,.1.1X
perye?r10'1.5Xperf
per
yearSin.9l·ethreodedCPU
perf1980 1990 2000 2010
2020
2030苞推別鈕墜粒認CPt1上取代英特爾,而足將其為嘰 給部
芯還包t
苠機系蛻邸亥亂純;p
t,
才
GPU的形態(tài)的難題CPU嘈.
其·代逐步玉令 CPU+GPU對復(fù)特爾來說,無論選擇職種方工比2
石貫養(yǎng)達設(shè)定的欄架內(nèi)克·亨如果英特爾選擇只做CPU,
它必須接受CPU加
GPU的體系也陀
悍供改進;GPU.
如果怓GPU,
將耳
接與英偉達克爭,可能導(dǎo)致GPU在
體系中的至
要性逐漸超過
CPU.
忌終
,大家都
專注
GPU,
間器薪變成了誰的GPU更強岔令并車星父了量
岱的立爭
,
而昆關(guān)于利用
CPU的競..帖在巨入侵課泗上,把這個產(chǎn)業(yè)帶到只有我們能楹 的地h
--20()9年黃仁勛采訪窖,畫硐一出30圖
形加
速
迼
入
頑,配l
移
部
珈
牢
]竺咖泊 機的形態(tài)度 匹 婦 畛亟 — 」在數(shù)據(jù)中心市場,拴動在限務(wù)器中加入少呈顯卡,從僅便用CPU轉(zhuǎn)變?yōu)榻Y(jié)合GPU09形態(tài)隨吾顯卡數(shù)呈常加,權(quán)至增大,加入技術(shù)和符性,服務(wù)器轉(zhuǎn)變?yōu)镃PU必怨
車今GPU的形態(tài)元 服 器的標準酐舌i即書是2
訪
切
揉
和8
個GPU,彷關(guān).爾擠到相對邊經(jīng)的位否王曰...'"..
“'`'u
二..`',"M,,,0
1寰臧"心',
”“忙”心`...社仕達通i.l
份汛軟f于l
上、田
什發(fā)肴、發(fā)Ill場景*塑覓占柯干n,
時計算但演化方向英偉
達友布202fl-20
27年產(chǎn)品戍劃,Al芯片規(guī)劃的戰(zhàn)略校心是
“One
.\
rchite
c
ture"
統(tǒng)
.架構(gòu),Al芯片
從兩年次
的更新周期轉(zhuǎn)變?yōu)?/p>
·年
次
的更新周期,
下.
ft
Rubin榮構(gòu)及其對應(yīng)核心芯片已捉
上日程曠well
架構(gòu) ~ \
in
架構(gòu)GPUCPUNVUNKNICSWITCH日Hopper
GPU6SHBM3函hc11志王tcc.IswknL0占SV
9NQuantum-X400lnfinibandSwitchmuep二口G+repsp06HGrace
CPUBF3SuperNIC國Blackwell
CPU8S
HBM3eHcc口WieBs5
GKONO1
8L
1vNCXB
SuperNIC圈S沁
rum-X800Ethernet
Sw九chBlackwell
UltraCPU8SHBM3e12HQuantum-X800S沁,tumUltraX600Switch EthernetSwitch
512-RadixLu4云巳8uRVera
CPUECX9
SuperNIC16 ec貯RubinUltraGPU12S
HBM4NVLink
6switch3600GB/secX1600IS/Ethernet
Switch,20222023數(shù)據(jù)中心規(guī)涅2024p交.2025忮才限禮.2.K
I
)U:
美偉達自研(
mrace(
:
PU,在\RM榮構(gòu)和自9
技術(shù)優(yōu)勢從陸上渦足數(shù)據(jù)中心業(yè)務(wù)對干(
:PU的性能需求尺比如.......還
P吐叫
性l
..口景市場控術(shù)需求自身技術(shù)優(yōu)勢傳統(tǒng)的CPU架構(gòu)難以滿足凡及馮性能計至對計至能力秅求NVIDIA公司憑借其在圖形處理和并行計豆刃方技面術(shù)優(yōu)勢,推出GraceCPU蘆:Gta
ceCPU— 量虐應(yīng)
,面向服務(wù)器和數(shù)據(jù)中心生態(tài)系統(tǒng),可采用多種配君滿足不同數(shù)據(jù)中心的窯求艘藹性睛與四 ·
采用
ARM
架溝,擁有72
個Arm
Neoverse
N
2
內(nèi)核,配備
lP
DD
RSx
內(nèi)存,奧有超強的性能和效率雙庭懊隋羹效 .
可與
GPU
緊密結(jié)合以
增強加速計笛能力
,也可作為強大而忘效的獨立CPU進行部否翌Gr
缸
e
Super
ch
ip兩個GraceCPU,
共1”
個內(nèi)核Grac
e
H
叩
p
er
Superchip72核GraceCPUHopperH200GPU心采用 Arm
V
系列廷礎(chǔ)架構(gòu),CPU
內(nèi)核中的雖新產(chǎn)品一Arm距
overse
V2
CPU架構(gòu),經(jīng)過優(yōu)化后捏供領(lǐng)先的每線程性能
能效更禹曇實現(xiàn)了兩個單指令多數(shù)據(jù)(
SIMD)
向彰首令矣,可加速機器學習、縣因組學和密碼學等關(guān)鍵HPC應(yīng)用程序。子揉作Grace
CPU
在
Arm
v8.1
中芭次引入的大型系統(tǒng)擴展(LSE)
.提供低成本的原子操作,提禹 CPU到
CPU
通信
鎖和互斥鎖的系統(tǒng)是由NVIDIA
設(shè)計的可擴展一致性結(jié)(
SCF)
是一種網(wǎng)狀結(jié)構(gòu)和分布式緩存架構(gòu),提供超過3.2TB/s
的總二分帶寬Grace
CDDRSXPU
Superchip
使用禹達
960GB
的服務(wù)器、級低功耗(
LPODRSX)
內(nèi)存和
ECC,
實現(xiàn)帶寬、能雙 容雖和成本的昆佳平衡Grace
CPU
Superchip
支持
128
條PCle
Gen
5
通逄和128GB/s
的形狀
^^
介
早
.
l!aJ岫次連接 雙向帶寬,可分為2x8
個以足供額9頃
旌接,并支持各種PCle
插棺英偉達H前(irace
(:-P
U
怍俯表現(xiàn)出 色, 專 為矗怍 能 計 n及數(shù)斟中心打迅,并將在2位
6年推出下
1`
'r e
ra(:P
U,計劃于未米幾年推出悄貸行級別的CPLl產(chǎn)品a.0u性Pc適用于兩性能廿互(HPC)和云計瓦設(shè)滬晝多配備1”
個為
mv9
CPU刁系,云一氐
LPDOR5x
竺的沖接口900GB/s
,相比
PCleGon
5
快
7倍忠是
OIMM解決方案的兩倍過俘的,瓦當前幸CP
U的兩倍i'軒豐擊,#.,汒
干,多位
沔岱仆
~4“
印
七r
7995WX(96
Core/
5.1
GHz)NVIDIAG,ace,:T2Co,e/3.35
GHz)XeonW9-3495X(56Co,e/5.3GHzLN2
)仆'
.adripp,,,5995WX(64Core/4,3GHz)Thre心dppe,
3990X(64
Co,o/
4.1GHz)Ryzen97950)((16Core/Stock)Core;9-13900k(16Cote/St”
幻裹的性司運行所有NVIDIA歡仁逕往和平臺。81A千74.4千72.6干48.0千34.7干24.5千23.0千20000 40000 60000 80000 100000義芯片互連技術(shù)指令栠架構(gòu)核心數(shù)雖和線程數(shù)呈更多的核心數(shù)雖和線程數(shù)呈核心數(shù)呈和線程數(shù)呈相對較少線存架構(gòu)Arm指令栠架構(gòu)Gr
釭
e
CR丿架構(gòu) "1tef
CP
U耍徇采用了NVIDIA獨特的
NVLin
k-C
2C
互連技
術(shù)
(飛大區(qū)
別)分布式緩存設(shè)計x86指令栠架構(gòu)層次式緩存設(shè)計內(nèi)存子系統(tǒng)低功耗的
LPDD
RSX
內(nèi)存通常采
用
DDR4
或
DDRS
內(nèi)存年肅度將
CP
U、GPU和其他組件栠成在一個芯片上通常霖要-虧其他芯片配合使用仇鰭英偉達在異構(gòu)計茛領(lǐng)域的進一步拓展在商性簇籵茛和服務(wù)器市場邁出的至要一步為Al工廠等新型數(shù)據(jù)中心提供強大的計筍支持墮沮惑j睬 計鐸領(lǐng)域:
構(gòu)
建再性
能計
餌系
統(tǒng),為科學研究和工程 的計苠支持人工智能領(lǐng)域:
與
NV
ID
IA
的
GPU
相結(jié)合,
為訓練和推理任務(wù)提供禹效的計笛平臺E忌哉歧lVera
CPU消費者級別CP
U與,足茫的,\r
m
數(shù)悅中心VIDT.\
Grace
CPU
軟件生態(tài)系繞將Jfl于
(-:PU、GPU
和
I)PU
的全紜
NVI
Ol\(
軟件生態(tài)系統(tǒng)相結(jié)合囡蓋鬧;
f.il;)J沮“口NVFO殼TIIANI心 c于-仁1l—CU8_j亡歸
UST嚴 戶云石]-- “ 7
嚴可頸吩酐--jH
PC·X
乓孟可二A等庫KDs郎工gggN瀑瘦孛習cuOFcuxltl..,“Sp"
'斗cuS1心9
1cuGR^陽cuMLcuB屯斗I_
cuTENOSRCU中]
(uAAND芷定泛巳頭,.m…四
位1m…RT- 川- ,趴斗占尸勹行,0“廠洶姿站
弓竺 k節(jié) i,— 也習
匹岱飛田IUl
i1I盲cuSOLV[LcuSP衄SE
_CUDA
Klfflttm侖“
ATHA門[ 如 CPU.O..正..叭.:.PU&心
J
中.…一蛇醞·蘭于--.二=-己`臣CPU
符合
Arm
服務(wù)器基礎(chǔ)系統(tǒng)架構(gòu)
(SBSA,)以砍卸
9硬件和軟件接口.
支持
Arm
服務(wù)器基本引導(dǎo)
要求
(SBBR),以
支待基于
Gra
ce
CPU的系統(tǒng)上啟用標準引導(dǎo)流程叩立年-NVIDIA
HPC
SDK
和每個
CUDA
組件都有Arm
原生安裝程序和容器.所有主要的
Linux
發(fā)行版.都可在
NVIDIAGrace
CPU
上完美運行.無霖修改編譯器、庫 工具、分析器、系統(tǒng)笸理實用程序以及用于容
器化和恁擬化的
框架可輕松地
在NVIDIA
Grace
CPU上安裝和使用NVIDIA
GPU
Cloud
(NGC)還提供深度學習墜氣
飛
岱穹煙雁璧::
迤2.2GPU: GPl
飛
要包栝核心、從{f、流處珂器守部件,單核心數(shù)坎運晶千(:PU,
因此兒付忙i效的井行處咒能力,在處珂沁址數(shù)據(jù)及加速計開時休現(xiàn)出蝕符架構(gòu)優(yōu)勢GPU嗯
盼
上理
單殉是一
種專門 設(shè)計用喬 襯亙外一圖 像和槐 肪
擊
侖的電
腦硬件它足現(xiàn)代計算機系統(tǒng)中的關(guān)鍵組件,特別杲在處理圖形空集型任務(wù)時-
畛 J網(wǎng)格核立記存-M刀)點
處理器冬".....'”
“,'
lI碼器,心光掃化單元忙千,""""''斗皿 笠勹 笠 尸 圖像的頑
函
和沁波,
邁
扜
生
噓
酌
泗一
勹的核心 ,
但和借誦常遠多于CPU,1
形和計互GPU開行處理穹n
力的苔礎(chǔ),使其蹤侈同時處
理大呈任務(wù).GPU臭有自己的專用顯存,通常為300R(圖
形雙倍數(shù)后速軍
)類型.顯存用于存儲圖形和視凌數(shù),其啟禹速度和大帝寬向生對千禹效圖形外 理至關(guān)繭要.迎 是GPU
內(nèi)嵌削
呾
處慰
玩
,負癡以強
哥
和果羅
擔的并而
團
排
,厗處理器的數(shù)呈可以從幾百到幾節(jié)
礙
,這亙接影晌
GPU的處理能力..君色器是運行在GPU上的小程序,用千洹染圖隘的石哉妥分,如頂點君色器、像索君 色器和幾何吾色.器.
光割化是蔣茹圖像轉(zhuǎn)換為2D圖堂的過程了元面瓦面冠豆r
這-
菲
迥思
是
30圖骼酗
的建 酚 . .
這些接口,如HOM威
Displ<1y
Port,
負要將洹染叨妥像發(fā)送到顯示設(shè)各.,(O,O)「共享內(nèi)存F寄存器寄`TThread(O,O)*本地內(nèi)存出接口'..…“”心圖形一支持l·
現(xiàn)代
GPU支待禹級圖形特性,如邸寸光
柜職
寂RTX
技術(shù)沫}
'心返動的
圖
的優(yōu)呻
孕
DLSS)1 且叨1? GPU的設(shè)計至點在千并行處理能力,能夠同時處 理大雖的圖 形數(shù)據(jù)
,這圖
形
跁
十、
視
癡
黏
瞇
琪
些
類型的計苠空蜘
型任務(wù)中使待它在拙 吵 戲表現(xiàn)出色:令一
:
紋理內(nèi)存r— 全局內(nèi)存+-i-寄存器」Thread(2,0).本地內(nèi)存Thread(1,0)l本地內(nèi)存JT,英
偉 達 兩 年 迭 代 的
速 度
付續(xù) 更
新 GP
U
尖 構(gòu)
, 伐
米足 l止界上笱4汰貝正遼義上的GPl
T宏構(gòu),帕斯卡足行個加入了支持淶度學習功能的架構(gòu),伏符足八正岱義
上的第.放
\l
芯片即迦b侂
鄧,叫 1叩
i1`'iF 句
舊卜T`
``lJtI啟呻 {
:Ja11TI???..合.中文代
號"書斷拉
費米
開蕾勒曼克斯韋比哥卡伙特圖靈安培林怕布秉克威爾時問2006200920122014201620172018202020222024材欄40nm28nm28nm16nm12nm12nm8nm4nm4nm71
億8昭13
5億211
億146
億540
億800
億2080
億I品體笆1妃I3”
乙規(guī)壇484mm2466mm216
個551mm215
個核128
個SM食32CUDACor
e,
共計S總M消X度*(192
個+64
個512
個-CUDA雙栝層601mm2610mm2815mm25120
個754mm24608
個826mm2具有
6912
個814mm2吳有
18432
個814mm2具有
3072個CUDA核心CUDA核心、576
個張呈CUD凡安心、43
2個張呈FP32CUDA核心核心張呈核心核心,57
6
個CoreCUDAcore)首個支待超級在率、在人工舌能、HopperTrans包含2080
億計計至G豆P梧U和辰的架雙計待歪繭大芒民提升上.獲墻強了GPU的能密度效比,和功耗計只繭新培了R心a(y可硒RTTr件C加acrin速oe)g光核,光線追蹤和圖forme
r
引罕可個晶體芭,采以做到
FP16首個通用GPU計繭架構(gòu),采用全新的CUDA架構(gòu),計蕓空度足 有300
W,
比引入L1/L2快修速緩袁存功、
諾誤能以及GPU
Direct技術(shù)標K_e志p
l若er
的兩(
音,
M
a鄧
ell
架構(gòu)"
Pasca
啋構(gòu)提禹了近3倍,可以大大加速線追輝運百和FP8
之間逐N層V交I
O換I,利響用特
點形?言染等方面性能大犧沃升,功耗卻只有400W,
能效比顯若良忘的陡啟百盂方法來GPU
的 提離 50%以上
,
人工智能和深節(jié)能計
笙時代到來庋字習的訓練與推理用雙倍光刻極限尺寸的
揉片,通的過片間
1
0互T聯(lián)B/技S術(shù)連接成一塊年 的GPU構(gòu),計巨
能力比
Ferm
i架構(gòu)提離3-4倍,GPU
開始成為禹性能計繭的關(guān)注點婦 畦 C
語吉進行 GPU編程
,
標志若GPU
開始從專用圖形處理器轉(zhuǎn)變?yōu)樾刑幫ㄓ美頂?shù)臣器這使拐GPU
可以過心乏的人工舌能、汽車等新興應(yīng)用市場.L疊一·^
^
三一目I
扯
次
沖Te
m
o
r
(:(
)re足筷偉達GPU成為Al芯
片的
關(guān)
鑲技
術(shù).加速深度學習模書訓練和推珂能力臀日 前
迭代
干笛五代匹 邑
勺.
君扣付景定義袒 竺萬冊鳥曬.
深庋學習技術(shù)的飛速發(fā)展對計莫能力提出了更禹要求,傳統(tǒng)的CUDA
Core在處理妄雜的大規(guī)模矩陣運茛和卷積任務(wù)時力不從心Tensor
Cores專門針對深妄學習授型訓練和推理中的常見操作進行優(yōu)化,是一種特殊的硬件加速器.被英偉達設(shè)計用于GPU功能 ·
祀
忠莉匹
后度的同時大栝提升計苠效率SM.
將計至能力擴后到FP64、TF32
和
b
floa
t16
秸度,
TF32恪式.
.
--
-、.,、,--、,.
`.`·
--,_-
-`U匕 九on
Cachet
rud
ion
CacJ,ew.,P”已如1立“( 已 動
西如
尸UIch 戰(zhàn)pnThm石晌·一 .."9`
'`e,
心 (
”“
兇叮2
如t曄 5吐 tion_ca,
hW叮-p
Sc(U
th,.咄
亟i…
屯t<h7口函 .
1-1,..-.
°!Jltfi,..
?
業(yè)1碼
i,t“
心
(”“
小"
匕t`尸七i?r
-lI寸[,
...石、守盧巴巴叫F
l巨三戶戶匕l(fā)匕l(fā)
丘已巴巴曰巴三匿雛屆丐任屯9
F
]曰巨二—
,昌圈
圈
圈
匡匕
出
..匕已
呾 [
心臣莖唇盧已巴玉[一勹孚霪甲巳芒曰囡巳三l巴巴已R國..l
圈
圈
■
巨匕
一涕一代亨雹m
m
昏
Core)令第二代J1令比.三代.一i眾仁,尸n....口-
·T一.心n一O一r.C--o·r-e-).引平紀”四“n代,or
Coro)ld乖日臧印令代T”“°r七
t)Tensor
Core支持的精度CUDA
Core支持的精度GPU
的活在吞吐雖提雨了多 達12倍,與前一
代的PascalGPU相比
,
瓬艦
V100的640
個核心提供商達勸孔遷都扜頃醫(yī)TensorCore
梧度從
FP16
擴展到包括lnt8、lnt
4和lnt1,
可以將GPU的性眵吞吐是加速至比PascalGPU離出多達
3
2
倍,且首次
在消雯級產(chǎn)品中配各Te
nsorCore.
隨君
Hop
per
微架構(gòu)發(fā)布,
NVIDIA聲稱這將便大邸
巨吉侯型邸 I,練
·比上-fl;快30倍蛉202
碑 NVIDIA發(fā)布第五代Blad<well
Tensor
Core,
與上一代相比.可為大型摸型提供3吭
酌
加速,且提供野
翩
雌
濕
生和梧度BlackwellHopperFP64,TF32,BF16,
FP16,FP8,INT8,FP6,
FP4FP64,TF32,8F16,FP16,FP8,
INT8FP64氏 2,
FP飛,BF16FP64,FP32,FP16,6
F16,么"號鼎唯臺詞出新Blackw(
II榮
構(gòu)搭載于Ci片
(i()、B101)、
B2叩
,推動數(shù)據(jù)中心進
步
轉(zhuǎn) ,
為許倩工廠奠定技術(shù)叢礎(chǔ)
=
.
l-, L I-BlackwellBlac屈
ell架構(gòu)采用了TSMC的4NP制圖
環(huán) ,特點
是搭載了
208
忒
分
品休音和離達
192
GB的HBM3
吶
存,以及BTB/s的
內(nèi)存帝寬,顯示出其在硅片設(shè)計和內(nèi)存技術(shù)方面的先進也架構(gòu)立待郡劉百臣擋式
和微張呈縮放技術(shù),便拐
Al淏型可以在保持禹捂民的同時實現(xiàn)更雨的性能。':,CUDA.
Tensor氏, w、“ Tor
ch蕁主;如也架摔客,
井虹習與各
夫生態(tài)系飲合仵伙伴協(xié)作
.贖淳了應(yīng)用開友和部害的靈右莊心轉(zhuǎn)型推動發(fā)展「環(huán)T
llaclc--,e!IBl?ckwcll架構(gòu)的出現(xiàn).代云合數(shù)抵中心轉(zhuǎn)型的實現(xiàn)和工業(yè)笞蒜化的還一步推進升級優(yōu)化Al芯片和胺務(wù)t今還苔盧-
工廠胥
,b`I餓芬化與蘭OE界M各和之云的人-=工王飛權(quán)合作函玩糾紜今如?,改猛灶僅忱氐_笠 寧
心到生產(chǎn)汀雪. Al線型的l'I.鈕的智蜓工廠和擦心設(shè)施^屯忱設(shè)施基于BlackwelGl
PU的幾種產(chǎn)品變體包括G82,00
B200fll8100,涵蓋從超級芯片到離散加逗器的多種配蕓,滿
足不同計豆君求和 荔麗鈺迸.GB200栠成了兩個Blac灼
ell
GPU和一個7難
的GraceCPU的超級芯片,在提供
一體化解決方案萬面 實力突出
.8200
GPU在Al計豆領(lǐng)域突出,處理1.8萬億參數(shù)的誤型,性能提升
1
5{生8100能應(yīng)對1
73吩數(shù)的燈吾言摸型.2000張BlackwelGl
PU僅栗1/4的電力即可完成與000
長HopperGPU相同的訓練任務(wù).GPU構(gòu)成區(qū)哀
H-(FP64/TF$V“
'
"
白芍/F悶)·HGXB200
8-GPUax
NVIO<A
8200
SXM3如 /
18PF/
36P打7咋HGXB100
8-G沁axN
VID
IA
8
幻OSXM/
144PF
2心
下I
14PF/
28PF八婦
I112PF
廷忑毛逞邊l
啟動Blac壓
elI芯片的呈產(chǎn).隆出墨于x8
6榮構(gòu)的H200h.
L40S、8100
扣B心芯片.H200將提升
內(nèi)存至282GB,
帶寬培加3倍,搭載
1
44GB的HBM
3內(nèi)存.上2024椿出Bl
ack
w,ell
Ultra
GPU8顆HBM3e
12hi內(nèi)存,井淮出腔艦阪B200A磁
HBM3e12hi,5i,'o-202推出Rubi
n
GPU
I采用8顆HBM
4內(nèi)存,Vera
CPU作為Blackw
ell平臺的繼任老.惟出Rub
in
Ultra
GPU12顆HBM4內(nèi)存Arm的Vera
CPU和NVLink
6
Switch(3600GB/s),進一步鞏固英偉達在禹性能計茛和Al市場的蜘 位,為職
靈茄
諱
i
任務(wù)劇 乒支持
.:o。....202620
足同
內(nèi)
i:安(i
Pl1廠商以7Il
m
制
程
為主,
多數(shù)不從備雙付度.FI)6
4,較油外英偉達、Al\11)和萸符爾"
定距離呾吩上應(yīng)啡百擾_ -
驅(qū) 匝 役H100
PCle48TFLOPS9.7TFLOPS江350W竺『專而泣噓設(shè)計噓叩擔即彰蕊晦也黔畦英偉達西廣4nm7nm19.5
TFLOPS24
TFLOPS300W具備54
億個品體笆和第三代Tensor
Core7nm23.1
TFLOPS11.S
TFLOPS300W廷于CDNA架構(gòu)的數(shù)據(jù)中/心系列加速卡海外主要品牌AMO6nmA100
80GBPCleINSTINCTM1100IN
STINCTMl25045.3
TFLOPS45.3
TFLOPS560W英特爾銳炫Ar
c
A77
06nm17.2
TFLOPS不其備225W+離通Adreno
X14nm4.6TFLOPS扭備兩性能計豆和人工苦能h晦
卡,吳各
13
,
312
個淀處和
208
個計豆蘭元采用Xe
HPG8架新構(gòu)罕,VR支S待.DX12Ulti
mat
e、呼件光線追蹤可變刷 、XeSS超級采樣、PCle
4.0專為Wi
nd
ows
on
ARM系統(tǒng)設(shè)計的驍龍X系列soc的第一代栠成顯卡萃武紀思元3
70
X47nm24
TFLOPS不具備150W|
蜘
E
了
390妢 晶體音 ,即
共云郘
]邁沉
蹤
處
理器,滿足不同層次的人工否能計豆盂求?;忌畈菀惶?nm12
.2
TFLOPS10.1
TFLOPS350W國內(nèi)主要品牌摩爾紐MTT
S300015.2TFLOPS不具備<35W笠怔
l科技壁砑 100P7nm2456TFLOPS不具備450-SSOW1
國
內(nèi)唯 一
能
完
寺FP64
鄧
蒜
尊
寺運
至,相當于英偉達A
100的70%1
岳
于
M
U
S俎晌
,擊
碑
了
第刁
眵
噓 GPU
芯片.
春曉
”1
右像索頑垣充率和 Al
運亙性能 距邸
哪
分
達到國際芍場天數(shù)智芯天該1007nm37
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 云南司法警官職業(yè)學院《電力系統(tǒng)微機保護》2023-2024學年第二學期期末試卷
- 2024年02月廣東2024年招商銀行東莞分行信息技術(shù)部招考筆試歷年參考題庫附帶答案詳解
- 統(tǒng)編版語文四年級下冊 第一單元任務(wù)群整體公開課一等獎創(chuàng)新教學設(shè)計
- 遼寧理工職業(yè)大學《家庭社會工作》2023-2024學年第二學期期末試卷
- 貴州城市職業(yè)學院《專業(yè)外語(自動化)》2023-2024學年第二學期期末試卷
- 昆明2025年云南昆明市盤龍區(qū)婦幼保健院招聘編外口腔醫(yī)師筆試歷年參考題庫附帶答案詳解
- 寧夏醫(yī)科大學《用戶體驗設(shè)計》2023-2024學年第二學期期末試卷
- 南京旅游職業(yè)學院《勞動合同法與就業(yè)促進法解讀》2023-2024學年第二學期期末試卷
- 甘肅林業(yè)職業(yè)技術(shù)學院《射頻電路理論》2023-2024學年第二學期期末試卷
- 大連工業(yè)大學《電氣工程設(shè)計》2023-2024學年第二學期期末試卷
- 《復(fù)旦大學》課件
- 《纏論的實戰(zhàn)技法》課件
- 新版標準化機電專業(yè)管理體系解讀課件
- 承包魚塘維修施工合同范例
- 耶魯綜合抽動嚴重程度量表正式版
- 水利水電工程建設(shè)常見事故類型及典型事故分析(標準版)
- 政府采購項目采購需求調(diào)查指引文本
- 2024建筑用輻射致冷涂料
- 2024年浙江省公務(wù)員錄用考試《行測》題(A類)
- 2024版《安全生產(chǎn)法》考試題庫附答案(共90題)
- 《化工設(shè)備機械基礎(chǔ)(第8版)》完整全套教學課件
評論
0/150
提交評論