版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
MLPerfStorage評(píng)測(cè)工具解讀焱融科技/CTO&聯(lián)合創(chuàng)始人MLPerfStorageBenchmarkMLPerfStorage測(cè)試結(jié)果解讀AI業(yè)務(wù)特點(diǎn)和對(duì)存儲(chǔ)的挑戰(zhàn)..MLPerfStorageBenchmarkMLCommons是什么組織?MLPerf是由圖靈獎(jiǎng)得主大衛(wèi)·帕特森(DavidPatterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等頂尖為全球AI領(lǐng)域的“奧運(yùn)會(huì)”。MLCommons的基礎(chǔ)源于2018年的MLPerf基準(zhǔn)2.通過(guò)公平和有實(shí)際意義的衡量標(biāo)準(zhǔn)加速AI進(jìn)步MLPerfStorage的核心目標(biāo)和關(guān)鍵成果MLPerfStorage工作組的主要目標(biāo)是創(chuàng)建一個(gè)測(cè)試基準(zhǔn),用來(lái)評(píng)估特定的硬件。存儲(chǔ)測(cè)試基準(zhǔn)路標(biāo)MLPerfStorage是第一個(gè)測(cè)量機(jī)器學(xué)習(xí)(ML)工作負(fù)載存儲(chǔ)性能的基準(zhǔn)測(cè)試套件MLPerfStorageBenchmark工作原理MLPerfStorage通過(guò)對(duì)多種AI工作負(fù)載在各種加速器上的I/O型進(jìn)行混合匹配。MLPerfStorage可以在PyTorch和Tensorflow上評(píng)測(cè)MLPerf訓(xùn)練和HPC工作負(fù)載的存儲(chǔ)系統(tǒng)性能,并且無(wú)需使用昂捕獲了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的完整真實(shí)行為。MLPerfStorageBenchmarkv1.0種類型的加速器?!皌hinktime”MLPerfStorageBenchmarkv1.0模型TaskDatasetReferenceNetworkSamplesizeFrameworkReferenceQualitysegmentation(medical)Synthetic-fromKiTS193D-Unet146MBPyTorchmaximizeMB/s,and#ofacceleratorswith>90%acceleratorutilizationclassificationSynthetic–fromImageNetResNet50150KBTensorflowmaximizeMB/s,and#ofacceleratorswith>90%acceleratorutilizationScientific(cosmology)Synthetic–fromCosmoflowN-bodysimulationParameterprediction2MBTensorflowmaximizeMB/s,and#ofacceleratorswith>70%acceleratorutilization1.能夠模擬NVIDIAA100或者H1003.每個(gè)樣本的計(jì)算時(shí)間相差兩個(gè)數(shù)量級(jí)MLPerfStorageBenchmark概念加速器數(shù)量(ACC)一個(gè)ACC代表一個(gè)加速器數(shù)量(ACC)一個(gè)ACC代表一個(gè)GPU在滿足AU的前期下,ACC數(shù)量越ACC數(shù)量成正比MLPerfStorage通過(guò)DLIO生成每個(gè)MLPerfStorage基準(zhǔn)測(cè)試都需要至少5倍內(nèi)存大小的數(shù)據(jù)集AU表示加速器處于活動(dòng)狀態(tài)時(shí)間AU=(total_compute_time/total_benchmark_runing_time)*100基準(zhǔn)測(cè)試運(yùn)行5個(gè)epoch,AU最終要取5個(gè)epoch的平均值,并且5個(gè)epoch的結(jié)果誤差不超過(guò)5%MLPerfStorageBenchmarkv1.0結(jié)果分類closeddivision在同一類測(cè)試環(huán)境中進(jìn)行測(cè)試,不同存儲(chǔ)產(chǎn)品是可以進(jìn)行橫向比較opendivision鼓勵(lì)創(chuàng)新,可以修改benchmark工具,以便于獲取更好的性能和測(cè)試效果avaliable現(xiàn)實(shí)生產(chǎn)環(huán)境中可用的產(chǎn)品,已經(jīng)發(fā)布的成熟產(chǎn)品preview實(shí)驗(yàn)性的產(chǎn)品,或者開(kāi)發(fā)中的原型,未發(fā)布MLPerfStorageBenchmarkv2.0v2.0subgroupsv2.0roadmap12345MDTESTVDBENCHIO500帶寬、IOPS和延遲的測(cè)試工具,模擬各類并發(fā)文件系統(tǒng)元數(shù)據(jù)性能測(cè)試工具,模擬各類元數(shù)據(jù)操作帶寬和IOPS的測(cè)試工具,在高性能領(lǐng)域應(yīng)用廣泛模擬業(yè)務(wù)場(chǎng)景的測(cè)試工具IOR+MDTEST,模擬超算的復(fù)雜業(yè)務(wù)場(chǎng)景,最全面的文件系統(tǒng)測(cè)試集合?。。LPerfStorage測(cè)試結(jié)果解讀MLPerfStorage測(cè)試結(jié)果分析18000016000014000012000010000080000MB/sMB/s40000200000MBMB/sACC(Accelerator)3D-Unet700006000050000400003000020000100000 MBMB/sACC(Accelerator)CosmoFlow12000010000080000600004000020000096270540ACC(Accelerator)ResNet503D-Unet每GPU需要2.9GBps的讀帶寬千卡集群需要2.9TBps讀帶寬cosmoFlow每GPU需要600MBps的讀帶寬千卡集群需要600GBps讀帶寬ResNet50每GPU需要200MBps的讀帶寬千卡集群需要200GBps讀帶寬不同GPU類型對(duì)存儲(chǔ)的性能要求3D-Unet模型訓(xùn)練性能數(shù)據(jù)600005000030000200001000001GPU10GPU20GPU 5606724960270047026127807026379361012802914V100A100H100坐標(biāo)軸標(biāo)題如果是B200,存儲(chǔ)帶寬又需要多少?并且GPU的演進(jìn)還在繼續(xù)...模型驗(yàn)證Pre-Process?CheckpointNVIDIA存儲(chǔ)性能推薦/dgx-superpod/reference-architecture-scalable-infrastructure-h100/latest/storage-architecture.html容量文件數(shù)量6.7PB65億28PB57億7.6PB370億1.1PB36億500TB18億1.1PB1.4億AI未來(lái)對(duì)存儲(chǔ)性能要求的AI未來(lái)對(duì)存儲(chǔ)性能要求的定期的checkpoint產(chǎn)生瞬硬件升級(jí)彈性擴(kuò)展軟件升級(jí)硬件升級(jí)彈性擴(kuò)展軟件升級(jí)2倍以上帶寬性能提升F8000X全閃存儲(chǔ)2倍以上帶寬性能提升F8000X全閃存儲(chǔ)帶寬成本下降60%帶寬成本下降60%/400GbEEthernetRoCE支持E3.S/U.2PCIe5.0TLC和QLCNVMeSSD第4代AMD7543CPUNVIDIAHDR200InfiniBand支持U.2PC/200GbEEthernetRoCEQLCNVMeSSDNFSClientNFSNFSClientNFSClientNFSClientNFSClient !Disks傳統(tǒng)NAS升級(jí)為并行文件系統(tǒng)TCP/IP升級(jí)為RDMANFS協(xié)議升級(jí)為POSIX私有協(xié)議posixclientposixclientposixclient-posixclientposixclientposixclient--------->posixclientPFSServerPFSPFSServerPFSServerPFSServerScaleout-Scaleout--------->PFSServer1000500100050024250121251000存儲(chǔ)集群讀帶寬(存儲(chǔ)集群讀帶寬(GBps)800600400200066331個(gè)SU2個(gè)SU4個(gè)SU8個(gè)SU計(jì)算集群規(guī)模605040存儲(chǔ)集群規(guī)模存儲(chǔ)集群規(guī)模30200?元數(shù)據(jù)處理能力也可以隨MDS集群規(guī)模擴(kuò)大而提升// file2↓ file file2↓ file2 file2口MDS1口MDS2 ↓ file file2口MDS4Mast
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版購(gòu)車貸款利率調(diào)整合同3篇
- 金融服務(wù)工程承諾書(shū)
- 環(huán)保設(shè)備采購(gòu)招投標(biāo)合同范本
- 建筑工程腳手架租賃合同范本
- 律師協(xié)會(huì)財(cái)務(wù)風(fēng)險(xiǎn)管理規(guī)范
- 資金運(yùn)用監(jiān)控規(guī)范
- 眼鏡生產(chǎn)廠房租賃合同
- 非營(yíng)利組織安全責(zé)任區(qū)管理辦法
- 體育產(chǎn)業(yè)招投標(biāo)領(lǐng)導(dǎo)小組啟動(dòng)
- 垃圾處理安全事故防范指南
- 公務(wù)員行測(cè)真題題庫(kù)及答案
- 2025支部會(huì)議記錄范文
- 部隊(duì)保密安全課件
- 園林施工技術(shù)創(chuàng)新-洞察分析
- 湖北省黃岡市2023-2024學(xué)年高二上學(xué)期期末調(diào)研考試 地理 含解析
- 醫(yī)院窗簾、隔簾采購(gòu) 投標(biāo)方案(技術(shù)方案)
- 期末檢測(cè)卷(試題)-2024-2025學(xué)年三年級(jí)上冊(cè)數(shù)學(xué)人教版
- 圖書(shū)館管理系統(tǒng)答辯
- 先天性心臟病封堵術(shù)護(hù)理
- 2024北京初三(上)期末語(yǔ)文匯編:記敘文閱讀
- 三級(jí)安全教育試題(公司級(jí)、部門級(jí)、班組級(jí))
評(píng)論
0/150
提交評(píng)論