人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練

上傳人：b*** IP屬地：北京上傳時(shí)間：2022-07-12 格式：PPTX 頁(yè)數(shù)：29 大?。?.68MB 積分：18 舉報(bào) 版權(quán)申訴

人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練_第2頁(yè)

人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練_第3頁(yè)

人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練_第4頁(yè)

人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練_第5頁(yè)

已閱讀5頁(yè)，還剩24頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練基于AMD Milan的人工智能一體機(jī)解析AMD Milan人工智能一體機(jī)的軟硬件融合架構(gòu)利用人工智能一體機(jī)一鍵深度學(xué)習(xí)訓(xùn)練AMD Milan 人工智能一體機(jī)行業(yè)應(yīng)用及案例分析目錄AMD EPYC（霄龍）處理器AMD Instinct GPUAMAX 產(chǎn)品AMD Milan人工智能一體機(jī)基于AMD Milan的人工智能一體機(jī)AMD EPYC（霄龍）處理器處理器組面向?qū)ο竺嫦驊?yīng)用單核心性能更高的頻率、更大的每核緩存75F3（32核-280W） 74F3（24核-240W）73F3（16核-240W） 72F3（8核-180W）企業(yè)級(jí)高端產(chǎn)品高頻交易證券交易高

2、性能計(jì)算EDA VMware高核心密度領(lǐng)先的核心及線程數(shù)7763（64核-280W）7713（64核-225W） 7713P（64核-225W單路）7663（56核-240W） 7643（48核-225W）超算領(lǐng)域互聯(lián)網(wǎng) 科研機(jī)構(gòu)高性能計(jì)算云計(jì)算虛擬化7543（32核-225W） 7543P（32核-225W單路）7513（32核-200W）市場(chǎng)主流應(yīng)用主流均衡優(yōu)化7453（28核-225W） 7443（24核-200W）企業(yè)級(jí)主流應(yīng)用科研機(jī)構(gòu)虛擬化數(shù)據(jù)庫(kù)性能及TCO7443P（24核-200W單路） 7413（24核-180W）通用型主流應(yīng)用編解碼7343（16核-190W） 7313

3、（16核-155W）存儲(chǔ)7343（16核-155W單路）4AMD EPYC（霄龍）處理器第二代和第三代 AMD EPYC（霄龍）處理器通過(guò) AMD Infinity Fabric 技術(shù)實(shí)現(xiàn)芯片間連接的全方位升級(jí)，帶來(lái)全面優(yōu)化的多處理器性能和可擴(kuò)展性。高速小芯片互連超大內(nèi)存帶寬超大 I/O 帶寬5每個(gè)插槽 8 個(gè)內(nèi)存通道峰值 410 GB/s DRAM 帶寬全部 8 x16 鏈路 PCIe 4.0單路 128 條 PCIe 4.0 通道每條鏈路 64GB/s 雙向帶寬，每個(gè)插槽 512GB/sCPU+GPU的異構(gòu)計(jì)算純CPU挑戰(zhàn)：模型全部由CPU進(jìn)行處理，CPU線程不足導(dǎo)致處理時(shí)間緩慢CPU+

4、GPU混合計(jì)算：復(fù)雜的并行計(jì)算有GPU完成，CPU處理串行數(shù)據(jù)，消除計(jì)算瓶頸數(shù)據(jù)計(jì)算過(guò)程讀取視頻數(shù)據(jù)：OpenCV模型訓(xùn)練方法：Tensorflow / Pytorch6AMD Instinct GPUPCIe 4.0 x16AMD CDNA 架構(gòu)120 個(gè)計(jì)算單元（7,680 個(gè)核心）高性能計(jì)算 GPU最高可達(dá) 11.5 TFLOPs 峰值 FP64 性能全新的 Matrix Core 技術(shù)可為高性能計(jì)算和人工智能工作負(fù)載提供最高可達(dá) 46.1 TFLOPs FP32 矩陣峰值性能可為超快人工智能訓(xùn)練提供最高可達(dá)184.6 TFLOPs FP16 和 92.3 TFLOPs bFloat

5、16 的峰值性能32 GB 超快 HBM2 糾錯(cuò)碼 (ECC) 顯存，可提供最高可達(dá) 1.2 TB/s 的顯存帶寬開(kāi)放且可移植的 AMD ROCm 生態(tài)系統(tǒng)第二代 Infinity 架構(gòu)，具有最高可達(dá) 340 GB/s 的總 P2P GPU I/O 帶寬7AMD Instinct GPU先進(jìn)的高性能計(jì)算 GPUAMD Instinct MI100 加速器可提供最高可達(dá) 11.5 TFLOPS 的雙精度 (FP64) 理論峰值性能，為高性能計(jì)算應(yīng)用帶來(lái)卓越的性能，較上一代 AMD 加速器有了大幅提升。 MI100 為高性能計(jì)算應(yīng)用帶來(lái)最高可達(dá) 74% 的代際雙精度性能提升。8隨時(shí)隨地釋放

6、智能AMD Instinct MI100 加速器采用全新 Matrix Core 技術(shù)，與上一代 AMD 加速器相比，為人工智能應(yīng)用帶來(lái)近 7 倍的 FP16 性能提升。 MI100 還針對(duì)人工智能和機(jī)器學(xué)習(xí)工作負(fù)載大幅提升混合精度計(jì)算和 P2P GPU 連接性能。初級(jí)服務(wù)器產(chǎn)品優(yōu)勢(shì)搭載雙路AMD處理器+4張AMD Instinct GPU支持NVME陣列支持6x PCIe 4.0 x 16 slots FHFL型號(hào)G224-H3機(jī)箱2U機(jī)架式CPU雙路AMD EPYC 7003系列處理器，最高240WGPU搭載2-4片雙寬GPU內(nèi)存16x DDR4 DIMM，Up to 4TB 3DS EC

7、C DDR4 3200MHz RDIMM/LRDIMM硬盤(pán)8 x 3.5”/2.5”SATA/SAS/NVMe U.2熱插拔硬盤(pán)網(wǎng)絡(luò)2 x 10GbE RJ45I/O4 x USB 3.1接口；1 x VGA接口；1 x RJ45 Mgmt接口電源2200W（1+1）冗余電源尺寸438.4mm x 87mm x 831mm (W x H x D)擴(kuò)展槽4 x PCIe4.0 x16 slots (FHFL)+2 x PCIe4.0 x16 slots (HHHL)9專(zhuān)業(yè)級(jí)服務(wù)器產(chǎn)品優(yōu)勢(shì)搭載雙路AMD處理器+8張AMD Instinct GPU支持NVME陣列支持10 x PCIe 4.0 x

8、16 slots FHFL型號(hào)G428-H2機(jī)箱4U機(jī)架式CPU雙路AMD EPYC 7003系列處理器，最高64核280WGPU搭載8片雙寬GPU內(nèi)存32 x DDR4 DIMM，Up to 8TB 3DS ECC DDR4 3200MHz RDIMM/LRDIMM硬盤(pán)24 x 2.5” SATA/SAS熱插拔硬盤(pán)，其中支持4 x U.2 NVMe SSD6 x 3.5” SATA熱插拔硬盤(pán)網(wǎng)絡(luò)2 x 1GbE RJ45I/O2 x USB 3.0接口；1 x VGA接口；1 x RJ45 Mgmt接口；1 x COM串口電源2000W（2+2）冗余電源尺寸437mm x 178mm x 7

9、37mm（Wx H x D)擴(kuò)展槽10 x PCIe 4.0 x 16 slots FHFL或9 x PCIe 4.0 x 16 slots FHFL+1 x PCIe4.0 x 8 slot LP+1 x PCIe 4.0 x 8 slot（in x 16）FHFL10Why 人工智能一體機(jī)?11人工智能一體機(jī)人工智能一體機(jī)融合傳統(tǒng)硬件與深度學(xué)習(xí)軟件，以AI Max為統(tǒng)一人工智能平臺(tái)，融合以AMDEPYC+Instinct加速的深度學(xué)習(xí)計(jì)算體系，構(gòu)建一體化的深度學(xué)習(xí)平臺(tái)，具備細(xì)粒度的權(quán)限管控，安全高效的數(shù)據(jù)管理，全面細(xì)致的監(jiān)控管理，為用戶最大化資源利用率。管理人工智能一體機(jī)的管理通過(guò)標(biāo)配的

10、管理平臺(tái)實(shí)現(xiàn)統(tǒng)一管理，能耗/溫度信息等統(tǒng)一檢測(cè)管理，遠(yuǎn)程桌面統(tǒng)一管理、設(shè)備狀態(tài)管理、資源消耗管理等，可有效便捷改善能源效率，提升管理水平，節(jié)省運(yùn)維成本。12AMD Milan人工智能一體機(jī)靈活硬件配置，適配各種業(yè)務(wù)支持多種硬件配置，滿足不同業(yè)務(wù)對(duì)計(jì)算、存儲(chǔ)和I/O的彈性要求。3節(jié)點(diǎn)即可搭建高可用平臺(tái)，適用于云計(jì)算、邊緣等應(yīng)用場(chǎng)景，是云數(shù)據(jù)中心IT基礎(chǔ)設(shè)施的理想選擇。統(tǒng)一管理，精簡(jiǎn)運(yùn)維物理機(jī)及虛擬(云)資源可通過(guò)統(tǒng)一圖形化操作界面進(jìn)行管理，多租戶體系，使IT資源需求方可通過(guò)圖形化操作界面實(shí)現(xiàn)自服務(wù)，降低對(duì)IT管理人員的技能要求和運(yùn)維負(fù)擔(dān)。平臺(tái)自帶的操作日志、權(quán)限管控功能，可滿足企業(yè)IT安全

11、、審計(jì)等要求。分布式存儲(chǔ)引擎，解決性能瓶頸分布式存儲(chǔ)方案，數(shù)據(jù)采用多副本模式，分布于多臺(tái)內(nèi)置硬盤(pán)或SSD存儲(chǔ)中，不僅避免了單機(jī)性能瓶頸，也降低了數(shù)據(jù)丟失的風(fēng)險(xiǎn)，其容量可以按需動(dòng)態(tài)擴(kuò)展，降低運(yùn)維、規(guī)劃存儲(chǔ)架構(gòu)的負(fù)擔(dān)。安全可靠，開(kāi)箱即用一體機(jī)在廠內(nèi)預(yù)裝，實(shí)現(xiàn)一站式交互，開(kāi)箱即用，運(yùn)維人員通過(guò)圖像化操作界面進(jìn)行部署，實(shí)現(xiàn)業(yè)務(wù) 快速上線，一體機(jī)具備多種數(shù)據(jù)安全機(jī)制（多副本、故障硬盤(pán)自動(dòng)隔離、快照備份等），支持虛擬機(jī) 熱遷移、熱補(bǔ)丁技術(shù)，內(nèi)置負(fù)載均衡，有效保障業(yè)務(wù)高可用。13人工智能一體機(jī)硬件架構(gòu)人工智能一體機(jī)軟件架構(gòu)解析AMD Milan人工智能一體機(jī)的軟硬件融合架構(gòu)人工智能一體機(jī)硬件架構(gòu)管理節(jié)點(diǎn)

12、專(zhuān)業(yè)計(jì)算節(jié)點(diǎn)以太網(wǎng) 交換機(jī)存儲(chǔ)節(jié)點(diǎn)管理節(jié)點(diǎn)2U服務(wù)器，冗余電源，性能穩(wěn)定，配置文件高效管理，一體機(jī)健康狀態(tài)與網(wǎng)絡(luò) 流量監(jiān)控，任務(wù)提交與調(diào)度，高可用。存儲(chǔ)節(jié)點(diǎn)采用分布式存儲(chǔ)架構(gòu)，通過(guò)統(tǒng)一的平臺(tái)提供，為企業(yè)用戶提供穩(wěn)定、彈性擴(kuò)張、高性能的分布式存儲(chǔ)服務(wù)。4U多GPU服務(wù)器，單節(jié)點(diǎn)可以支持8-10片GPU, 支持多種主流計(jì)算框架與分布式學(xué)習(xí)訓(xùn)練，利用容器技術(shù)實(shí)現(xiàn)秒級(jí)部署，支持超大容量AEP持久化內(nèi)存，大帶寬。專(zhuān)業(yè) 計(jì)算節(jié)點(diǎn)IB交換機(jī)15IB交換機(jī)計(jì)算與存儲(chǔ)節(jié)點(diǎn)使用IB交換機(jī)互聯(lián)，可實(shí)現(xiàn)低延遲，高帶寬的專(zhuān)用網(wǎng)絡(luò)。以太網(wǎng) 交換機(jī)采用千兆網(wǎng)絡(luò)作為管理網(wǎng)絡(luò)及IPMI網(wǎng)絡(luò)。人工智能一體機(jī)軟件架構(gòu)AI Ma

13、x人工智能平臺(tái)是一款基于 Docker + Kubernetes 的人工智能容器云平臺(tái)；能夠?qū)崿F(xiàn)異構(gòu)資源的高效管理、調(diào)度和監(jiān)控，提供了從模型開(kāi)發(fā)、訓(xùn)練到部署的完整流程和工具。廣泛適用于教育、科研、金融、醫(yī)療、能源各個(gè)行業(yè)；能極大降低人工智能進(jìn)入門(mén)檻，提高人工智能創(chuàng)新和研發(fā)的效率。AI Max人工智能平臺(tái)16人工智能一體機(jī)軟件架構(gòu)云支撐服務(wù)物理服務(wù)器網(wǎng)絡(luò)設(shè)備存儲(chǔ)設(shè)備Web門(mén)戶/命令行/API資源管理任務(wù)監(jiān)控任務(wù)調(diào)度模型訓(xùn)練超參調(diào)優(yōu)數(shù)據(jù)管理資源抽象資源調(diào)度集群管理資源監(jiān)控鏡像管理容器管理存儲(chǔ)管理多租戶可視化部署推理17資源調(diào)度鏡像訂制模型開(kāi)發(fā)調(diào)試分布式存儲(chǔ)系統(tǒng)利用人工智能一體機(jī)一鍵深

14、度學(xué)習(xí)訓(xùn)練資源調(diào)度19鏡像訂制20模型開(kāi)發(fā)調(diào)試21分布式訓(xùn)練22分布式存儲(chǔ)系統(tǒng)采用全對(duì)稱分布式架構(gòu)，解決存儲(chǔ)系統(tǒng)的靈活擴(kuò)展、高性能（IOPS+吞吐）支撐，兼容塊、對(duì)象、文件存儲(chǔ)，高效應(yīng)對(duì)數(shù)據(jù)管理、訪問(wèn)問(wèn)題，為用戶提供可靠穩(wěn)定的存儲(chǔ)服務(wù)，支持百億級(jí)文件存儲(chǔ)，優(yōu)化小文件存儲(chǔ)性能及具備多種數(shù)據(jù)安全策略，通過(guò)極簡(jiǎn)的運(yùn)維管理為用戶提供高性能的分布式存儲(chǔ)方案。23AMD Milan 人工智能一體機(jī)行業(yè)應(yīng)用案例分析AMD Milan 人工智能一體機(jī)行業(yè)應(yīng)用及案例分析應(yīng)用領(lǐng)域人工智能一體機(jī)內(nèi)置多種深度學(xué)習(xí)框架，利用容器技術(shù)封裝大量底層操作，降低深度學(xué)習(xí)從業(yè)人員技術(shù)門(mén)檻、最小化計(jì)算資源，助力輕量級(jí)AI業(yè)

15、務(wù)快速上線。制造業(yè)-異常檢測(cè)隨著物聯(lián)網(wǎng)的發(fā)展，制造企業(yè)從產(chǎn)線收集的大量生產(chǎn)數(shù)據(jù)通過(guò)深度學(xué)習(xí)，從復(fù) 雜系統(tǒng)提取眾多參數(shù)，通過(guò)一體機(jī)進(jìn)行細(xì)致化的分析、計(jì)算、建模、訓(xùn)練等，可快速應(yīng)用于異常檢測(cè)等場(chǎng)景。醫(yī)療-癌癥檢測(cè)人工智能對(duì)于疾病診斷，尤其是圖像識(shí) 別對(duì)于癌癥識(shí)別、檢測(cè)已取得較大進(jìn)步。針對(duì)需要圖像識(shí)別輔助診斷的領(lǐng)域，借助一體機(jī)，極大提高人工智能診斷的準(zhǔn) 確率及時(shí)效性。教育-教學(xué)實(shí)踐針對(duì)教學(xué)領(lǐng)域的人工智能熱潮，一體機(jī) 直面計(jì)算環(huán)境部署困難的問(wèn)題，利用容器技術(shù)封裝大量底層操作，實(shí)現(xiàn)開(kāi)箱即用，降低人工智能教學(xué)門(mén)檻，適用于各類(lèi)教育實(shí)踐環(huán)節(jié)。25行業(yè)應(yīng)用:計(jì)算機(jī)輔助診斷-病灶檢測(cè)病灶檢測(cè)，對(duì)可

16、疑病灶進(jìn)行識(shí)別和勾畫(huà)病灶量化診斷，幫助醫(yī)生鑒別疾病良惡性、分形分期等治療決策，通過(guò)相關(guān)性分析，支持臨床醫(yī)生進(jìn)行科學(xué)合理的治療決策26案例分享廣州中康資訊股份有限公司項(xiàng)目人工智能一體化解決方案“中康資訊股份有限公司運(yùn)建立圍繞醫(yī)、藥、患各環(huán)節(jié)多場(chǎng)景衍生的數(shù)據(jù)庫(kù)，運(yùn) 用先進(jìn)技術(shù)開(kāi)發(fā)智能化系統(tǒng)對(duì)大數(shù)據(jù)進(jìn)行管理、分析與挖掘，更立足產(chǎn)業(yè)高度，拓展數(shù)據(jù)在健康領(lǐng)域各種商業(yè)應(yīng)用。AMAX根據(jù)用戶需求，提供人工智能一體機(jī)解決方案，為用戶搭建深度學(xué)習(xí)私有云環(huán)境，通過(guò)一鍵式人工智能平臺(tái)與分布式存儲(chǔ)系統(tǒng)，降低用戶AI使用門(mén)檻的同時(shí)為用戶提供安全高效的數(shù)據(jù)存儲(chǔ)方案?？蛻魞r(jià)值低成本、高性能，快速為用戶構(gòu)建一個(gè)易用、高效、穩(wěn)定的深度學(xué)習(xí)環(huán)境，降低用戶AI業(yè)務(wù) 開(kāi)發(fā)門(mén)檻，加速AI產(chǎn)品研發(fā)與落地，提升市場(chǎng)競(jìng)爭(zhēng)力?！胺植际酱鎯?chǔ)私有云搭建一體化部署27案例分享蘇州大學(xué)項(xiàng)目加速AI科研，簡(jiǎn)化AI教學(xué)“蘇州大學(xué)積極響應(yīng)國(guó)家對(duì)人工智能人才需求的號(hào)召，以培養(yǎng)學(xué)生自主開(kāi)發(fā)實(shí)操能力

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 金融保險(xiǎn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人工智能一體機(jī)加速深度學(xué)習(xí)訓(xùn)練

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔