




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、華為高性能計算集群軟件方案1目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點4.華為HPC軟件應(yīng)用案例2高性能計算系統(tǒng)概述(source:)200020131990-20001980-19901970-1980MPP向量機DSMCluster01002003004005002009.62009.112010.62010.112011.62011.112012.62012.112013.62009-2013 TOP500 HPC系統(tǒng)架構(gòu)ClusterMPPSMP高性能計算系統(tǒng)的架構(gòu)演變?nèi)騂PC系統(tǒng)主流架構(gòu)(cluster和MPP)以計算為目的,
2、使用了很多處理器的單個計算機系統(tǒng)或者使用了多臺計算機集群的計算系統(tǒng)和環(huán)境什么是高性能計算3高性能計算系統(tǒng)的應(yīng)用領(lǐng)域4高性能計算系統(tǒng)組成Application : 計算應(yīng)用Scalable File System: 集群存儲Middleware: 計算通信中間件Development Tools: 開發(fā)工具Operating System: 集群操作系統(tǒng)Interconnect: 高速計算互聯(lián)設(shè)備Server: 節(jié)點服務(wù)器Storage: 硬件存儲設(shè)備Cluster Management: 集群和資源管理Deployment Toolkit: 部署工具Change Management: 配置變
3、更管理Health Monitoring: 狀態(tài)監(jiān)控Job Scheduling: 作業(yè)調(diào)度5X86,Linux,刀片系統(tǒng)占據(jù)主流,IB和GE平分秋色高性能計算系統(tǒng)的發(fā)展趨勢100%75%50%25%全球TOP 500 高性能計算機的使用情況81%10%95%66%41%處理器操作系統(tǒng)構(gòu)建方式互聯(lián)網(wǎng)絡(luò)Intel X869%AMDX869OthersLinuxBlade16%43%34%IBGEOthersOthersOthers5%6華為高性能計算解決方案硬件資源硬件資源計算環(huán)境計算環(huán)境并行文件系統(tǒng) (Lustre, NAS)管理服務(wù)管理服務(wù) 操作系統(tǒng)操作系統(tǒng) (RHEL 5.x/6.x, C
4、entOS 5.x/6.x, SLES11.x)記帳統(tǒng)計并行環(huán)境 (MPI/MPICH, PVM等)開發(fā)接口應(yīng)用服務(wù)應(yīng)用服務(wù)系統(tǒng)系統(tǒng)部署部署程序程序部署部署備份備份還原還原Intel HPC 編譯及開發(fā)環(huán)境C/C+/Fortran Intel MKL, Intel Vtune監(jiān)控告警流程管理資源管理作業(yè)調(diào)度系統(tǒng)服務(wù)應(yīng)用集成華華 為為 高高 性性 能能 計計 算算 服服 務(wù)務(wù) 平平 臺臺7目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點4.華為HPC軟件應(yīng)用案例8Huawei HPC軟件解決方案包HPC集群常用組件華為WisdomC+ 高性能計算軟件包1操作系統(tǒng)RedHat
5、 Linux 5.x, 6.x,CentOS 5.x, 6.x2集群管理工具WisdomC+ 集群管理工具,3資源管理和作業(yè)調(diào)度管理器WisdomC+ 作業(yè)調(diào)度和資源管理4并行計算消息通訊庫、測試工具WisdomC+ 并行計算組件包5文件系統(tǒng)NFS,Lustre6集群部署工具WisdomC+ 集群部署工具7工作流組件WisdomC+ 工作流工具8節(jié)能管理組件WisdomC+ 節(jié)能管理工具9許可證管理組件WisdomC+ 許可證管理工具10統(tǒng)計分析組件WisdomC+ 統(tǒng)計分析工具11帳戶及計費管理組件WisdomC+ 帳戶及計費管理工具9支持的典型行業(yè)應(yīng)用行業(yè)主要的計算任務(wù)支持的行業(yè)應(yīng)用軟件產(chǎn)
6、品CAE幾何建模電磁仿真計算流體力學(xué)有限元分析HFSS、COMSOL、Feko* (EMSS)、CST Microwave Studio、Zelan Fidelity、ABAQUS、ANSYS、LS-DYNA、FLUENT、STAR-CD 、Hspice、Maxwell、PoweSI、OptimizePI基礎(chǔ)科學(xué)物理科學(xué)計算化學(xué)分析計算材料科學(xué)計算VASP、Gaussian、Materials Studio石油勘探能藏模擬分析地震油層分析油層數(shù)據(jù)可視化VIIP、Eclipse、RMS生命科學(xué)基因測序蛋白質(zhì)分析醫(yī)藥研究BLAST/MPIBLAST、AMBER、Gromacs、NAMD氣象海洋氣候
7、模擬氣候預(yù)測MM5、WRF、ARPS、GRAPES、CMAQ、CCSM10l功能完備的集群管理和部署工具l可視化工作流工具,支持自定義流程l智能的能耗管理和靈活的調(diào)度策略高效易用l友好的圖形化統(tǒng)一管理界面l完善的作業(yè)管理和調(diào)度功能l支持多種類型的并行計算任務(wù)可靠l支持1000節(jié)點以上中大規(guī)模運算l管理節(jié)點互備,快速故障恢復(fù)l運算過程checkpoint,單點故障后續(xù)算專業(yè)l7*24小時專業(yè)支持服務(wù)l遍布全球的售后支持網(wǎng)絡(luò)l定制化服務(wù)華為HPC軟件特點11模塊化,可擴展,易升級Web Service InterfaceWeb Portal / CLIHTTP/SSHHTTP作業(yè)調(diào)度集群管理集群監(jiān)
8、控告警管理能耗管理用戶管理記賬統(tǒng)計安裝部署并行庫數(shù)學(xué)庫編譯器調(diào)測器RHEL 5.x/6.xSLES 11.xCentOS 5.x/6.x 生物制藥CAS仿真動漫渲染石油勘探軟件架構(gòu):組件化、Web化、開放預(yù)集成行業(yè)應(yīng)用軟件,集中調(diào)度管理維護簡單定制開發(fā)12與普通集成方案的區(qū)別功能華為HPC方案普通集成方案普通集成方案的補救措施便捷的集群安裝和部署YesNo自行下載相關(guān)軟件,手工進行安裝部署統(tǒng)一的圖形化集群管理YesNo自行集成第三方集群管理軟件直觀的集群和節(jié)點監(jiān)控YesNo自行集成和配置第三方集群監(jiān)控軟件豐富的告警管理YesNo應(yīng)用程序統(tǒng)一訪問門戶YesNoHPC必備組件(函數(shù)數(shù)學(xué)計算庫,開發(fā)
9、工具)YesNo自行查找、下載、編譯和安裝數(shù)學(xué)庫等組件,自行軟件包間依賴性問題高效的作業(yè)調(diào)度器YesNo自行下載、編譯、安裝和配置作業(yè)調(diào)度器完備的統(tǒng)計記賬YesNo智能的能耗管理YesNo網(wǎng)絡(luò)并行文件系統(tǒng)YesNo自行集成和配置第三方網(wǎng)絡(luò)并行文件系統(tǒng)靈活的工作流管理YesNoNO表示尚未具備商用軟件能力,YES表示已具備商用軟件能力13和普通集成方案對比組件華為HPC方案普通集成方案集群安裝部署工具 一鍵式批量部署,快速完成集群搭建 便捷的部署界面,靈活安裝部署新增節(jié)點 節(jié)點鏡像安裝和恢復(fù),提供完備的鏡像管理手工安裝操作系統(tǒng)手工編寫安裝腳本,軟件安裝困難無節(jié)點備份恢復(fù)功能圖形化集群管理工具統(tǒng)一
10、的圖形化集群管理工具集群節(jié)點管理功能、多節(jié)點并發(fā)命令工具、文件系統(tǒng)管理功能自行集成各種集群管理軟件包沒有統(tǒng)一的集群管理界面集群和節(jié)點監(jiān)控工具統(tǒng)一的集群和節(jié)點監(jiān)控工具豐富的報表和圖形展現(xiàn)自行查找和集成相關(guān)監(jiān)控用以動態(tài)監(jiān)控集群沒有統(tǒng)一的集群監(jiān)控界面告警管理工具豐富的告警管理,系統(tǒng)支持郵件發(fā)送通知無告警管理工具應(yīng)用程序統(tǒng)一訪問門戶統(tǒng)一的系統(tǒng)門戶,支持定制各種應(yīng)用的作業(yè)提交界面,預(yù)集成典型應(yīng)用的作業(yè)提供界面無應(yīng)用程序統(tǒng)一訪問界面HPC必備組件(函數(shù)數(shù)學(xué)計算庫,開發(fā)工具)包含MPICH1/2、MVAPICH、OpenMPI并行通信庫,包含MKL、ATLAS等主流數(shù)學(xué)計算庫自行查找、下載、編譯和安裝數(shù)學(xué)庫
11、等組件,自行軟件包間依賴性問題作業(yè)調(diào)度器提供高效的作業(yè)調(diào)度器,支持豐富的任務(wù)調(diào)度策略、資源分配策略和資源限制策略自行下載、編譯、安裝和配置作業(yè)調(diào)度器統(tǒng)計記賬工具完備的統(tǒng)計記帳工具,按需產(chǎn)生計費報表無統(tǒng)計記帳工具能耗管理工具智能的能耗管理工具,靈活的綠色節(jié)能算法無能耗管理工具網(wǎng)絡(luò)并行文件系統(tǒng)提供功能強大的Lustre并行文件系統(tǒng)自行集成和配置第三方網(wǎng)絡(luò)并行文件系統(tǒng)工作流管理工具圖形化的流程設(shè)計工具直觀的流程管理界面無工作流管理工具14目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點4.華為HPC軟件應(yīng)用案例15靈活的作業(yè)提交方式模板提交方式預(yù)集成典型應(yīng)用通用任務(wù)提交方式命令
12、行提交方式16完備的作業(yè)管理 。 郵件通知 數(shù)據(jù)轉(zhuǎn)移 后處理 調(diào)度執(zhí)行 預(yù)處理作業(yè)提交工作流引擎以工作流引擎為基礎(chǔ)的作業(yè)生命周期管理17高效的作業(yè)調(diào)度豐富的策略管理功能先來先服務(wù)MINRESOURCEMAXBALANCE任務(wù)調(diào)度策略資源分配策略資源限制策略搶占策略回填策略預(yù)留策略基于優(yōu)先級策略限制活動作業(yè)限制系統(tǒng)作業(yè)限制空閑作業(yè)ReQueueSuspendFirstFitBestFitGreedy資源預(yù)留18用戶目錄1用戶目錄2用戶目錄3用戶目錄4外部存儲運算結(jié)果自動傳輸完整的業(yè)務(wù)數(shù)據(jù)管理功能強大的web數(shù)據(jù)管理功能安全隔離的用戶數(shù)據(jù)19集群節(jié)點管理:注重整個集群中節(jié)點操作,如上下電;調(diào)度系統(tǒng)
13、節(jié)點管理:關(guān)注調(diào)度信息,如是否接收作業(yè)操作。分角色的集群節(jié)點管理調(diào)度相關(guān)計算節(jié)點管理帶外節(jié)點管理帶內(nèi)節(jié)點管理 通過并行命令可以同時對多個節(jié)點下發(fā)命令統(tǒng)一的集群管理多維度的集群節(jié)點管理多節(jié)點并發(fā)管理20直觀的集群監(jiān)控集群整體性能狀態(tài)監(jiān)控單個節(jié)點性能狀態(tài)所見即所得的設(shè)備管理21豐富的告警管理豐富的告警類型靈活的告警查詢可配置的告警閾值l提供CPU負(fù)載、CPU溫度、磁盤容量、內(nèi)存容量、主機連接狀態(tài)、系統(tǒng)服務(wù)狀態(tài)、自定義服務(wù)等多種告警l可按主機,類型,級別及時間查詢歷史告警信息l可配置不同告警閾值,以靈活應(yīng)對變化l郵件發(fā)送通知,以便及時處理方便的告警通知22智能的能耗管理聚合監(jiān)控系統(tǒng)的資源狀態(tài)和資源需
14、求,為能耗分析提供統(tǒng)一數(shù)據(jù)l計算集群信息l調(diào)度系統(tǒng)作業(yè)信息根據(jù)能效監(jiān)視數(shù)據(jù)及能耗配置信息,提供節(jié)能建議l豐富的節(jié)能算法l支持自定義算法l可動態(tài)配置QoS信息能效監(jiān)視分析診斷自動處理根據(jù)分析診斷建議,自動或人工確認(rèn)完成系統(tǒng)的處理l節(jié)點下電/降頻l節(jié)點上電23完善的帳號管理統(tǒng)一的用戶管理功能基于用戶的計費管理功能支持與操作系統(tǒng)統(tǒng)一的用戶以及群組管理,批量導(dǎo)入用戶功能與調(diào)度算法結(jié)合指定優(yōu)先級及資源限制??蓪?dǎo)出指定時間段內(nèi),用戶作業(yè)產(chǎn)生的費用報表24部署節(jié)點便捷的集群部署、靈活的規(guī)模伸縮管理節(jié)點業(yè)務(wù)量上升界面添加節(jié)點計算節(jié)點界面操作,方便快捷的擴減容業(yè)務(wù)量增加時擴充集群規(guī)模,應(yīng)對大量任務(wù);業(yè)務(wù)量減少時
15、縮小集群規(guī)模,實行資源共享,提高資源利用率。配置簡單,一鍵執(zhí)行批量安裝,省時省力動態(tài)伸縮,界面操作批量安裝(OS、軟件等)25實時的流程運行監(jiān)視圖友好的流程設(shè)計與直觀的流程管理并行分支條件分支圖形化的元素便捷的設(shè)置拖拽式的流程設(shè)計完備的流程實例管理圖形化的設(shè)計工具,支持多種流程完備的流程實例管理功能26鏡像備份通過鏡像批量部署管理節(jié)點熱備,主節(jié)點故障時快速接管。整個集群備份,在整個集群出現(xiàn)故障時,快速恢復(fù)方便的備份與恢復(fù),高可靠系統(tǒng)安裝好的初始節(jié)點支持系統(tǒng)鏡像管理:創(chuàng)建、刪除、瀏覽節(jié)點快照,快速恢復(fù)27目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點4.華為HPC軟件應(yīng)用
16、案例28生物超算云服務(wù)平臺 提供專業(yè)的HPC業(yè)務(wù)流程管理軟件,包括流程設(shè)計工具、流程執(zhí)行引擎、流程監(jiān)控等組件。 依托云平臺的海量計算資源和存儲資源,充分結(jié)合華為云平臺和HPC的特點,提供完善的超算云解決方案。解決方案 基因測序軟件:BLAST、BOWTIE2、SAMTOOLS 業(yè)務(wù)處理的步驟多,流程復(fù)雜,需要定義流程??蛻粜枨?提供專業(yè)的計算業(yè)務(wù)流程管理服務(wù),有效支撐基因測序等行業(yè)應(yīng)用,極大提高客戶業(yè)務(wù)效率。 充分利用華為云平臺的資源,提供按需使用、資源彈性伸縮、智能管理等特性的HPC服務(wù),滿足了客戶的計算和存儲需求。 完善的資源管理、作業(yè)調(diào)度、用戶管理,為客戶提供行業(yè)整體解決方案。客戶價值計
17、算節(jié)點: 采用50臺高內(nèi)存C型管理節(jié)點: 采用2臺標(biāo)準(zhǔn)均衡C型內(nèi)部存儲節(jié)點: 采用4臺標(biāo)準(zhǔn)均衡E型,采用云存儲,提供無限的對象存儲能力的服務(wù)軟件系統(tǒng): SUSE 、華為集群管理軟件(包含工作流組件)29華為中央硬件仿真平臺 提供專業(yè)的HPC集群管理軟件,包含安裝部署、調(diào)度、集群配置、監(jiān)控告警等 提供web界面,方便進行作業(yè)操作以及集群管理維護解決方案 仿真業(yè)務(wù)需要用到HFSS、Hspice、Maxwell和PoweSI應(yīng)用軟件。 自動化的安裝部署工具,操作簡單,維護管理便利??蛻粜枨?計算能力由原先200萬網(wǎng)格提升到超千萬,計算效率提升5倍,長期綜合成本可節(jié)約XXX萬。 用戶通過web界面進行
18、作業(yè)操作,使得用戶不必理解底層調(diào)度系統(tǒng)命令,更加聚焦本職工作,提高工作效率。 完善的資源管理、作業(yè)調(diào)度、賬戶管理等功能,為客戶提供行業(yè)整體解決方案??蛻魞r值當(dāng)前解決方案:計算節(jié)點:共60個節(jié)點(30臺RH2485 + 30臺RH2285)管理節(jié)點:采用1臺RH2285刀片服務(wù)器內(nèi)部存儲節(jié)點:NFS+華為D5100高速存儲軟件系統(tǒng):RHEL5.8 、華為集群管理軟件Copyright2012 Huawei Technologies Co., Ltd. All Rights Reserved.The information in this document may contain predictive statements including, without limitation, statements regarding the future financial and operating results, future product portfolio, new technology, etc. There are a number of factors that could cause actual results and developments to differ m
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年座椅支架農(nóng)機配件行業(yè)深度研究分析報告
- 《第6課 查看資源與文件》教學(xué)設(shè)計教學(xué)反思-2023-2024學(xué)年小學(xué)信息技術(shù)浙教版23三年級上冊
- 云存儲合同范本
- 2025年北京辦公樓裝修施工與智能化升級合同
- 市場調(diào)查報告模板合集5
- 2025年中國植保無人機行業(yè)發(fā)展監(jiān)測及投資戰(zhàn)略規(guī)劃研究報告
- 2025年耐熱鑄鐵項目投資可行性研究分析報告
- 2025年度租賃房屋租賃期限延長合同范本
- 中國過氧化苯甲酰糊行業(yè)市場需求預(yù)測及投資規(guī)劃建議報告
- 2025年新型社區(qū)公共場地管理合作協(xié)議
- 重慶市2024-2025學(xué)年高一上學(xué)期期末聯(lián)考生物試卷(含答案)
- 緊急疏散逃生方法
- 羊水栓塞護理應(yīng)急預(yù)案
- 2024年醫(yī)師定期考核臨床類考試題庫及答案(共500題)
- 工程進度款支付臺賬-1-
- 瀝青路面施工質(zhì)量控制要78課件講解
- 16.2《登泰山記》課件 2024-2025學(xué)年統(tǒng)編版高中語文必修上冊-9
- 【課件】如何保障我國未來的能源安全
- 2024年深圳科技企業(yè)員工聘用合同3篇
- 結(jié)腸術(shù)后恢復(fù)護理
- 綜藝節(jié)目贊助合同(2024年版)
評論
0/150
提交評論