OceanStor-9000-HPC行業(yè)技術建議書模板_第1頁
OceanStor-9000-HPC行業(yè)技術建議書模板_第2頁
OceanStor-9000-HPC行業(yè)技術建議書模板_第3頁
OceanStor-9000-HPC行業(yè)技術建議書模板_第4頁
OceanStor-9000-HPC行業(yè)技術建議書模板_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

XXX項目存儲系統(tǒng)方案技術建議書IssueV1.0DateDATE\@"yyyy-MM-dd"2020-10-28DOCPROPERTYConfidentialHPC存儲系統(tǒng)方案技術建議書DATE\@"yyyy-MM-dd"2020-10-28DOCPROPERTYProprietaryDeclaration華為專有和保密信息版權所有?華為技術有限公司第頁華為技術有限公司為客戶提供全方位的技術支持,用戶可與就近的華為辦事處聯(lián)系,也可直接與公司總部聯(lián)系。地址:深圳市龍崗區(qū)坂田華為總部辦公樓郵編:518129網(wǎng)址:客戶服務電話:0755-285600004008302118客戶服務傳真戶服務郵箱:Support@目錄TOC\o"1-2"\h\z\u1. 概述 61.1高性能計算環(huán)境發(fā)展的趨勢 61.2高性能計算應用的特點 71.3現(xiàn)網(wǎng)情況分析 71.4系統(tǒng)需求分析 81.5建設規(guī)模及目標 81.6方案設計原則 92. 系統(tǒng)設計方案 102.1HPC存儲系統(tǒng)概述 102.2配置計算說明 112.3Wushan分布式文件系統(tǒng) 133. 方案技術特點及優(yōu)勢 133.1彈性擴展 133.2卓越性能 153.3數(shù)據(jù)可靠 173.4簡化管理 193.5方案整體優(yōu)勢 204. 相關產(chǎn)品介紹 224.1產(chǎn)品概述 224.2產(chǎn)品形態(tài)介紹 224.3產(chǎn)品規(guī)格表 245. 縮略語表 27圖目錄TOC\h\z\c"圖表"圖表1基于OceanStor9000的HPC存儲方案拓撲圖 10圖表2OceanStor9000冗余配比對照表 12圖表3設備配置清單圖表 12圖表4文件條帶化示意圖 13圖表5統(tǒng)一命名空間功能示意圖 14圖表6無縫擴展功能示意圖 15圖表7ErasureCode原理說明圖 19圖表8Performancenode整機柜和單節(jié)點視圖 23圖表9Capacitynode節(jié)點整機柜和單節(jié)點視圖 24圖表10Mini-capacitynode整機柜和單節(jié)點視圖 24圖表11前后端組網(wǎng)類型支持 25圖表12CE6800交換單元 25圖表13產(chǎn)品規(guī)格表 27修訂記錄/ChangeHistory日期修訂版本描述作者2014-04-221.0初稿完成王媛2014-05-202.0按照評審意見修改王媛概述高性能計算環(huán)境發(fā)展的趨勢隨著技術的發(fā)展,客戶對現(xiàn)有的應用系統(tǒng)提出了更高計算能力要求。大規(guī)模的并行計算的方式激發(fā)有關行業(yè)對高性能計算機的需求:金融行業(yè)規(guī)避風險需要提升預測分析能力,高性能計算是重要手段;超級計算是精確地震預報、災害天氣預報的主要手段;此外,在應對能源和自然資源枯竭危機、環(huán)境污染、疾病威脅等人類面臨的重大問題的進程中,在探索宇宙、物質(zhì)和生命現(xiàn)象奧秘的過程中,高性能計算扮演著極為重要的角色。這些都為我國高性能計算中心的發(fā)展提供了極大的機遇。高性能計算環(huán)境面臨著以下幾個發(fā)展趨勢:更高、更全面的性能要求高性能技術計算是利用數(shù)值模擬和數(shù)字技術方法探索和預測未知世界的技術。隨著研究的深入和競爭的加劇,各個領域越來越多地使用模擬的方法來解決科研和生產(chǎn)中的實際問題。模擬的模型越來越大、計算的精度越來越高、對超級計算機性能要求也越來越高。例如,在一個3維模型中,如果把從每個方向取100個分點增加取到1000個分點,對計算機資源的需求將增加1000倍以上。高性能計算應用不僅規(guī)模越來越大,而且往往必須在規(guī)定的時間內(nèi)完成任務否則就失去了計算的價值(如天氣預報、傳染病防治)。這就對計算機系統(tǒng)的計算能力、系統(tǒng)帶寬、內(nèi)存容量、存儲設備和I/O吞吐能力以及應用軟件的開發(fā)技術都提出了更高、更全面的要求。更便捷的擴展能力當前,人類正在從工業(yè)化社會進入信息社會,技術的持續(xù)創(chuàng)新、市場需求的瞬息萬變、競爭空間的迅速擴大,要求企業(yè)采用Internet、電子商務、電子商務企業(yè)等現(xiàn)代化手段,來適應時代的發(fā)展。許多新型的企業(yè)應用對計算能力、存儲容量的要求都越來越高、越來越迫切。隨著系統(tǒng)管理技術的不斷完善,多核CPU、HPC、并行計算等新興技術的不斷發(fā)展,構建的系統(tǒng)規(guī)模也在不斷擴大,需要系統(tǒng)具備較好的擴展能力,滿足日益增長的數(shù)據(jù)需求,最大程度的簡化投資。更加嚴格的預算約束隨著競爭的加劇和應用的普及,高性能計算不再是一個不惜成本的應用領域,許多項目的預算約束越來越嚴格。這就要求廠商生產(chǎn)全系列的產(chǎn)品滿足不同規(guī)模應用的需求、更加可靠地保護用戶原有投資、加速IT投資回報,而且也要求實現(xiàn)資源按需供應和更大范圍的資源共享,推動了網(wǎng)格和公用服務等新的計算模式的發(fā)展。高性能計算應用的特點從20世紀70年代出現(xiàn)的第一代的高性能計算機開始,隨著新技術的不斷發(fā)展,90年代初期,大規(guī)模并行處理(MPP)系統(tǒng)取代SMP開始成為高性能計算機發(fā)展的主流。與此同時,集群系統(tǒng)(Cluster)也迅速發(fā)展起來。類似MPP結構,集群系統(tǒng)是由多個微處理器構成的計算機節(jié)點通過高速網(wǎng)絡互連而成。節(jié)點一般是可以單獨運行的商品化計算機。由于規(guī)模經(jīng)濟成本低的原因,集群系統(tǒng)具有比MPP更高的性/價比優(yōu)勢。集群系統(tǒng)還繼承了MPP系統(tǒng)的編程模型,更進一步加強其競爭優(yōu)勢。到2000年初集群實際上已經(jīng)構成了高性能計算機系統(tǒng)的主流。軟件方面,由于在集群系統(tǒng)中,使用廉價的PCServer做節(jié)點,在用SAN做后端存儲的條件下,吞吐量暫時可以達到系統(tǒng)要求,但是文件共享問題沒有解決,雖然可以用NFS之類的NAS解決,但是NAS需要在SAN前端加NAS頭,這個是很大的瓶頸所在;在沒有SAN做后端存儲的條件下,基于本地磁盤的IO吞吐量瓶頸很大,又無法滿足系統(tǒng)性能要求。所以,催生了分布式文件系統(tǒng),把數(shù)據(jù)分別存放在各個節(jié)點,把各個節(jié)點的磁盤存儲資源,整合成一個大的共享存儲資源,提高IO吞吐量。分布式文件系統(tǒng)一般都支持多節(jié)點可以讀寫同一個文件,利用加鎖機制。通過集群網(wǎng)絡通信,保持數(shù)據(jù)的一致性?,F(xiàn)網(wǎng)情況分析現(xiàn)網(wǎng)組網(wǎng)分析(請根據(jù)實際項目情況補充)設備和業(yè)務配置情況系統(tǒng)需求分析從現(xiàn)網(wǎng)情況和建設需求可看出,XX項目隨著系統(tǒng)規(guī)模的擴展,迅速增加的數(shù)據(jù)和計算任務將對存儲系統(tǒng)的容量、性能和可管理性提出更高的要求?,F(xiàn)有系統(tǒng)面臨的主要問題:(1)數(shù)據(jù)激增,需要高性能的存儲系統(tǒng)進行平滑擴展,滿足幾年內(nèi)業(yè)務的持續(xù)增長,最大程度的簡化投資;(2)現(xiàn)有系統(tǒng)采用單獨的存儲設備,資源無法統(tǒng)一分配和使用,存在存儲資源利用率低的問題,每套系統(tǒng)都剩余不少可用空間,但又無法給其他業(yè)務系統(tǒng)使用,存儲利用率低,造成資源浪費;(3)計算能力需求和集中存儲系統(tǒng)性能落差越來越大,計算周期太長,給高性能計算,并行計算,網(wǎng)格計算提出了巨大的挑戰(zhàn);(4)高性能計算系統(tǒng)的設備多,體積大、耗電多等弱點以及對龐大的計算機房空間需求、空調(diào)需求和用電量也已經(jīng)成為HPC行業(yè)的一大挑戰(zhàn);(5)管理維護復雜,設備部件多并且分散,存儲,服務器,連接部件等等可能來自不同的廠商,初期建設成本高,并且管理復雜,維護成本高。建設規(guī)模及目標根據(jù)XX項目的建設需求進行分析,通過本期項目建設,需要達到如下標準和要求:提供高性能的存儲服務,縮短計算周期,并能夠隨著計算任務的高速發(fā)展,性能可進行平滑擴展,使文件服務不會成為存儲系統(tǒng)的瓶頸實現(xiàn)存儲系統(tǒng)統(tǒng)一部署、統(tǒng)一管理、統(tǒng)一維護,支持科研用戶遠程訪問和管理高可靠的存儲應用,存儲系統(tǒng)能夠進行故障自動切換,切換過程不影響上層業(yè)務運行。系統(tǒng)支持在線動態(tài)擴容,以滿足增長的存儲業(yè)務需求。提供高性價比的存儲系統(tǒng),在滿足應用和擴展需求的前提下降低系統(tǒng)的初始投資和整體的運營費用。針對不同安全保護級別的數(shù)據(jù)實現(xiàn)數(shù)據(jù)安全保護,實現(xiàn)資源合理最優(yōu)的配置,同時可做到后續(xù)數(shù)據(jù)備份和容災平滑過渡;方案設計原則結合XXX單位的實際應用和發(fā)展要求,方案主要遵循以下原則進行設計:高性能:針對業(yè)務場景、文件類型、目錄結構、計算訪問模型進行深入分析,以提升科學計算的性能和效率為目標,滿足高性能計算的性能需求。高可靠性:對于存儲的高可靠性應該從幾個方面來進行考慮。首先,對于磁盤存儲進行較高級別的RAID冗余。其次,磁盤陣列系統(tǒng)本身的設計中不能存在部件的單點故障。還有,磁盤陣列與應用系統(tǒng)之間的連接上也不能存在單點故障??蓴U展性:方案的可擴展性的要求表現(xiàn)在以下幾方面:容量的可擴展性:存儲系統(tǒng)可以在現(xiàn)有容量的基礎上,為未來的應用提供足夠的擴展空間。接口的可擴展性:隨著用戶業(yè)務的增長,有更多的服務器可以很方便地使用存儲系統(tǒng),以實現(xiàn)數(shù)據(jù)的集中存儲和備份。新技術的可擴展性:方案采用的硬件設備和軟件產(chǎn)品都是業(yè)界相關領域的開放型主流產(chǎn)品,采取開放性模塊化設計,當新的存儲技術出現(xiàn)后,可以通過升級相應的模塊實現(xiàn)向新技術的擴展。兼容性:方案提供的存儲系統(tǒng)可以同時支持Windows、Linux、Unix等操作系統(tǒng)。磁盤共享:存儲共享的目的是節(jié)省投資,需要對每一業(yè)務系統(tǒng)規(guī)劃出所需的存儲空間,后續(xù)可很方便地針對每個業(yè)務系統(tǒng)存儲空間擴容。高性價比:首先要從系統(tǒng)的實用性角度出發(fā),滿足不同的業(yè)務系統(tǒng)的實際需要和前瞻性的同時,選擇最高性價比的設計方案。管理簡便,操作簡單,界面友好:良好的管理界面是方案設計所必需的。系統(tǒng)設計方案HPC存儲系統(tǒng)概述計算頭節(jié)點計算頭節(jié)點計算節(jié)點隊列1計算節(jié)點隊列2計算節(jié)點隊列3…核心交換機(萬兆或InfiniBand交換機)千兆GE交換機數(shù)據(jù)采集用戶查詢訪問萬兆以太網(wǎng)絡或InfiniBand網(wǎng)絡千兆以太網(wǎng)絡…OceanStor9000萬兆或InfiniBand交換機圖表SEQ圖表\*ARABIC1基于OceanStor9000的HPC存儲方案拓撲圖針對XX項目的高性能計算需求,建議配置OceanStor9000存儲系統(tǒng)。整體系統(tǒng)分為三個子系統(tǒng),計算子系統(tǒng)采用上百個計算節(jié)點作并行計算,存儲子系統(tǒng)提供大容量,高I/O處理的存儲空間,管理子系統(tǒng)提供資源調(diào)配和控制管理。為了提高網(wǎng)絡帶寬,OceanStor9000每個引擎節(jié)點配置兩張萬兆網(wǎng)卡或40GEInfiniBand網(wǎng)卡,與配置萬兆插卡的核心交換機或者InfiniBand交換機相連,提供萬兆或InfiniBand的交換能力。計算節(jié)點集群、采集服務器集群均采用萬兆上行,為線站數(shù)據(jù)采集節(jié)點、計算集群節(jié)點和核心存儲之間提供足夠的數(shù)據(jù)交換帶寬。OceanStor9000采用全對稱分布式機構,節(jié)點并發(fā)訪問,提供高并發(fā)、高帶寬的數(shù)據(jù)訪問性能。OceanStor9000系統(tǒng)針對不同的應用需求提供不同系列的硬件節(jié)點類型,有支持高頻度IO訪問的Performancenode(簡稱P節(jié)點)、滿足帶寬型應用的Capacitynode(簡稱C節(jié)點),滿足小容量需求的Mini-capacitynode(簡稱M節(jié)點)。不同類型節(jié)點可以單獨使用,也可以混合部署以達到整體最優(yōu),混合部署時每種節(jié)點最少配置為3臺。OceanStor9000支持多種磁盤類型混插,支持SSD、SATA、SAS、NLSAS盤(SSD盤存儲文件系統(tǒng)元數(shù)據(jù)),可以根據(jù)實際的業(yè)務模型和計算模型進行分類,針對不同類別的業(yè)務需求進行存儲單元、文件系統(tǒng)的配置優(yōu)化。配置計算說明存儲系統(tǒng)配置容量說明方案存儲平臺配置可用容量xxxTB,裸容量xxxTB,其中共計xxx塊200GBSSD硬盤、xxx塊600GB10krpmSAS/900GB10krpmSAS硬盤,共xx個p節(jié)點,xxx塊200GBSSD硬盤、xxx塊2TB/3TB/4TBSATA或2TB/4TBNLSAS盤,共xx個C節(jié)點或M節(jié)點。計算公式如下:SAS裸容量=600GB*硬盤數(shù)量SAS可用容量=600GB*硬盤數(shù)量*利用率*0.90SATA或NLSAS裸容量=2TB/3TB/4TB*硬盤數(shù)量SATA或NLSAS可用容量=2TB/3TB/4TB*硬盤數(shù)量*利用率*0.90整系統(tǒng)裸容量=SAS裸容量+SATA或NLSAS裸容量整系統(tǒng)可用容量=SAS可用容量+SATA或NLSAS可用容量 注:0.90為硬盤格式化后,可用容量的比例參數(shù)。硬盤利用率根據(jù)選擇的校驗份數(shù),按照9000冗余配比表中的利用率計算SSD盤存儲元數(shù)據(jù),系統(tǒng)容量計算中,默認不計算SSD盤容量。OceanStor9000冗余配比表對照表如下:配置節(jié)點數(shù)+1+2+3+4+2:1+3:132+1(66%)4+2:1(66%)4+3:1(57%)6+4:1(60%)4+2:1(66%)4+3:1(57%)43+1(75%)4+2:1(66%)4+3:1(57%)6+4:1(60%)6+2:1(66%)8+3:1(72%)54+1(80%)4+2:1(66%)4+3:1(57%)6+4:1(60%)8+2:1(80%)12+3:1(80%)64+1(80%)4+2(66%)4+3:1(57%)6+4:1(60%)12+2:1(85%)12+3:1(80%)74+1(80%)4+2(66%)4+3:1(57%)6+4:1(60%)12+2:1(85%)16+3:1(84%)84+1(80%)4+2(66%)4+3:1(57%)6+4:1(60%)12+2:1(85%)16+3:1(84%)94+1(80%)4+2(66%)4+3(57%)6+4:1(60%)16+2:1(88%)16+3:1(84%)106+1(85%)6+2(75%)6+3(66%)6+4(60%)16+2:1(88%)16+3:1(84%)116+1(85%)6+2(75%)6+3(66%)6+4(60%)16+2:1(88%)16+3:1(84%)128+1(88%)8+2(80%)8+3(72%)8+4(66%)16+2:1(88%)16+3:1(84%)138+1(88%)8+2(80%)8+3(72%)8+4(66%)16+2:1(88%)16+3:1(84%)148+1(88%)8+2(80%)8+3(72%)8+4(66%)16+2:1(88%)16+3:1(84%)158+1(88%)8+2(80%)8+3(72%)8+4(66%)16+2:1(88%)16+3:1(84%)1612+1(92%)12+2(85%)12+3(80%)12+4(75%)16+2:1(88%)16+3:1(84%)1712+1(92%)12+2(85%)12+3(80%)12+4(75%)16+2:1(88%)16+3:1(84%)1812+1(92%)12+2(85%)12+3(80%)12+4(75%)16+2:1(88%)16+3:1(84%)1912+1(92%)12+2(85%)12+3(80%)12+4(75%)16+2:1(88%)16+3:1(84%)2016+1(95%)16+2(88%)16+3(84%)16+4(80%)16+2:1(88%)16+3:1(84%)圖表SEQ圖表\*ARABIC2OceanStor9000冗余配比對照表存儲系統(tǒng)性能預估本次配置中配置xx個P節(jié)點,xx個C節(jié)點或M節(jié)點。存儲系統(tǒng)單節(jié)點萬兆組網(wǎng)最大可支持約500MB/s的性能吞吐帶寬,同時隨著節(jié)點數(shù)量的擴展,系統(tǒng)性能可達到線性增長,xx個節(jié)點可提供xxxxMB/s的吞吐帶寬,同時OceanStor9000最大可擴展至288個節(jié)點,可提供近200GB/s的性能帶寬,存儲容量最大可擴展至40PB,完全滿足未來業(yè)務增長需求。軟硬件配置清單描述需要配置的設備數(shù)量,接口及軟件等情況做出說明設備名稱規(guī)格型號數(shù)量備注圖表SEQ圖表\*ARABIC3設備配置清單圖表

方案技術特點及優(yōu)勢Wushan分布式文件系統(tǒng)文件的條帶化為實現(xiàn)數(shù)據(jù)保護和高性能讀寫,Wushan分布式文件系統(tǒng)對數(shù)據(jù)進行按節(jié)點條帶化處理,首先,創(chuàng)建新文件時文件系統(tǒng)會按照配置的保護級別挑選符合要求的節(jié)點,然后寫數(shù)據(jù)時文件系統(tǒng)將用戶的數(shù)據(jù)平均分布在各節(jié)點上,讀數(shù)據(jù)時文件系統(tǒng)從所有節(jié)點并行讀取。節(jié)點1節(jié)點2節(jié)點3節(jié)點1節(jié)點2節(jié)點3WushanFSPart1Part2Part3Part4Part5Part6Part1Part2Part3Part4Part5Part6圖表SEQ圖表\*ARABIC4文件條帶化示意圖上圖所示例的OceanStor9000系統(tǒng)由3個節(jié)點組成,用戶的數(shù)據(jù)平均分布在3個節(jié)點上。實際使用中用戶的數(shù)據(jù)分布需要根據(jù)配置而定,關于分布式文件系統(tǒng)所支持的具體分布方式細節(jié)請參考“分布式數(shù)據(jù)可靠技術”。統(tǒng)一命名空間Wushan分布式文件系統(tǒng)對外提供CIFS/NFS訪問接口,即最終用戶以文件名來操作文件,那么文件命名的有效范圍就稱之為命名空間。通常一個本地文件系統(tǒng),如ext3文件系統(tǒng),一個命名空間只能與一臺計算機或文件系統(tǒng)相關聯(lián),本地文件系統(tǒng)將元數(shù)據(jù)和數(shù)據(jù)都存儲在本地硬盤,訪問文件數(shù)據(jù)時文件系統(tǒng)首先從本地硬盤讀取元數(shù)據(jù)信息,然后通過元數(shù)據(jù)信息得知文件數(shù)據(jù)在本地硬盤存儲的布局和位置,再去讀寫本地硬盤完成訪問文件操作。所以本地文件系統(tǒng)的命名空間范圍都有限。Wushan分布式文件系采用全對稱結構,將所有節(jié)點的命名空間整合為統(tǒng)一命名空間,將整個系統(tǒng)的所有節(jié)點的存儲容量組成一個大的虛擬存儲池,元數(shù)據(jù)和數(shù)據(jù)保存在每個節(jié)點上,每個節(jié)點都是元數(shù)據(jù)服務器同時也是數(shù)據(jù)服務器,訪問文件數(shù)據(jù)時Wushan文件系統(tǒng)首先根據(jù)文件的元數(shù)據(jù)信息定位到文件所歸屬的元數(shù)據(jù)服務器,然后通過元數(shù)據(jù)服務器獲取文件的數(shù)據(jù)分布,即獲取文件分布在哪些節(jié)點上以及在節(jié)點上的具體位置,再去訪問這些節(jié)點完成數(shù)據(jù)讀寫操作。圖表SEQ圖表\*ARABIC5統(tǒng)一命名空間功能示意圖上圖中所示例的OceanStor9000系統(tǒng)由3個節(jié)點組成,這3個節(jié)點對用戶都是透明的,用戶并不會感知到是哪個節(jié)點在提供服務。假如用戶訪問不同的文件,實際上是由不同的節(jié)點在提供服務。Wushan分布式文件系統(tǒng)支持最大40PB全局命名空間,用戶不用管理多個命名空間,從而減輕管理復雜度。消除多個命名空間,也消除了多個命名空間帶來的數(shù)據(jù)孤島。文件系統(tǒng)無縫擴展Wushan分布式文件系統(tǒng)支持節(jié)點動態(tài)擴展,節(jié)點數(shù)目從3~288隨需而定,而且節(jié)點擴展中業(yè)務不中斷。Wushan分布式文件系統(tǒng)支持針對不同的應用需求提供不同的硬件節(jié)點類型,主要有支持高頻度IO訪問的Performancenode、滿足帶寬型應用的Capacitynode和Mini-capacitynode幾種類型的節(jié)點。圖表SEQ圖表\*ARABIC6無縫擴展功能示意圖彈性擴展高性能計算領域,存儲數(shù)據(jù)量增長比較迅速,需要數(shù)PB甚至數(shù)10PB的存儲容量,以應對數(shù)據(jù)增長過快的壓力,并需要平滑擴展能力。OceanStor9000采用Scale-out存儲架構,將海量數(shù)據(jù)壓力分散到多個并發(fā)存儲節(jié)點,數(shù)據(jù)和元數(shù)據(jù)均勻分布于各個節(jié)點上,避免資源爭用,系統(tǒng)性能(吞吐量)按照比例擴展,并且各個存儲節(jié)點之間負載均衡,有效避免單節(jié)點性能瓶頸。這種架構,不僅保持了對象存儲系統(tǒng)高可靠、高性能的優(yōu)點,而且使得OceanStor9000系統(tǒng)具有更好的擴展性。OceanStor9000通過Scale-out架構,輕松實現(xiàn)容量擴展,可實現(xiàn)從3節(jié)點到288節(jié)點的輕松擴容。OceanStor9000能夠根據(jù)業(yè)務增長進行平滑擴容,系統(tǒng)每增加一個存儲節(jié)點,都能夠自動識別,單節(jié)點擴容更是小于60秒,將該存儲空間加入到整系統(tǒng)中,并根據(jù)負載均衡的原則,優(yōu)先選擇新的節(jié)點存儲,從而簡化了系統(tǒng)擴容的管理,降低了操作成本。擴容時容量和性能支持線性擴展,最大可提供40PB規(guī)模的單一文件系統(tǒng),真正實現(xiàn)“應需而變”,為業(yè)務的長期高性價比提供保障。卓越性能OceanStor9000提供業(yè)界領先的NAS讀寫性能,OPS最大可突破500萬,而系統(tǒng)總帶寬可達200GByte/s,可充分滿足高性能計算等領域的性能要求。OceanStor9000性能提升的關鍵技術包括:SSD加速和自動分級存儲SSD硬盤可解決數(shù)據(jù)讀寫性能的瓶頸,提供低延遲和高吞吐量。OceanStor9000采用SSD硬盤存儲元數(shù)據(jù),加速元數(shù)據(jù)訪問效率,提升處理能力。此外OceanStor9000的動態(tài)分級存儲軟件(InfoTier)可自動識別小文件和熱點數(shù)據(jù),根據(jù)信息在不同的階段對于業(yè)務的價值不同,通過智能的I/O熱度統(tǒng)計,可以精確挖掘數(shù)據(jù)內(nèi)在價值,根據(jù)熱度在系統(tǒng)內(nèi)不同存儲介質(zhì)之間進行數(shù)據(jù)遷移,從而將數(shù)據(jù)進行合理的分布,將高Value的數(shù)據(jù)自動分布到高級別的存儲介質(zhì)上,而將低Value的數(shù)據(jù)自動遷移到更加廉價的介質(zhì)上,提升資源利用率。而這一切都在業(yè)務未曾感知的情況下自動完成。InfoTier軟件通過細粒度數(shù)據(jù)統(tǒng)計和自動遷移,并可根據(jù)業(yè)務特點設置不同的策略,可基于文件屬性(路徑,文件名,創(chuàng)建時間,訪問時間,修改時間,大小,UID/GID)和訪問頻率策略。InfoTier軟件可提升熱點數(shù)據(jù)的存儲性能,使高價值硬盤得以更充分的利用。統(tǒng)計周期設置是否合理對冷熱數(shù)據(jù)分析結果影響較大,應盡可能選擇能真實反映數(shù)據(jù)整體訪問頻度的周期。全局緩存數(shù)據(jù)在緩存中的讀寫速度遠高于硬盤,但單節(jié)點的緩存提升空間有限。同時如果各節(jié)點的緩存相互獨立,則緩存命中率難以提升,數(shù)據(jù)的一致性保證機制也會趨于復雜。OceanStor9000通過全局緩存模式,整合所有節(jié)點緩存,容量最大可達55TB的虛擬緩存池。同一文件的數(shù)據(jù)在緩存池只緩存一份,任意節(jié)點均可命中,有效提高數(shù)據(jù)訪問命中率,減少硬盤讀寫次數(shù),降低訪問時延,提升系統(tǒng)整體性能。高速互聯(lián)OceanStor9000支持10GE高速以太網(wǎng),單個節(jié)點可提供4個10GE端口。OceanStor9000還同時支持IB(InfiniBand)網(wǎng)絡,帶寬高達40Gbit/s,可滿足更加苛刻的性能要求。OceanStor9000可適配用戶的不同組網(wǎng)需求,通過節(jié)點間高速互聯(lián),降低系統(tǒng)內(nèi)部時延,提供卓越性能。并發(fā)訪問傳統(tǒng)的NAS系統(tǒng)由引擎和存儲單元組成。數(shù)據(jù)的全部并發(fā)訪問需要先由NAS引擎處理,因此引擎容易成為性能瓶頸。OceanStor9000采用全對稱的邏輯架構,每個節(jié)點均可提供業(yè)務服務。通過負載均衡設計,數(shù)據(jù)訪問在集群內(nèi)均勻分布,可大幅提升系統(tǒng)并發(fā)訪問能力。數(shù)據(jù)可靠對于高性能計算領域,原始數(shù)據(jù)和過程數(shù)據(jù)往往需要長期保存,要求存儲高可靠,數(shù)據(jù)不丟失,存儲系統(tǒng)長時間保存的可靠性成為其對存儲的要求之一。OceanStor9000采用業(yè)界最高水平的數(shù)據(jù)保護機制,保證數(shù)據(jù)的高可靠性:ErasureCodeOceanStor9000采用ErasureCode保障數(shù)據(jù)一致性,確保海量數(shù)據(jù)存儲場景下的數(shù)據(jù)安全可靠。ErasureCode是RAID的超集,能夠支持比傳統(tǒng)RAID算法更高的可靠性和更靈活的冗余策略,其設計思路是對文件進行原始分片(N份),通過糾錯編碼生成M個冗余校驗塊文件。寫入時,由客戶端進行切片(N)和轉(zhuǎn)碼(M),一共生成N+M份數(shù)據(jù),存儲系統(tǒng)自動從各存儲節(jié)點中選擇一個硬盤組成一個N+M個磁盤的磁盤組,分別寫入N+M份數(shù)據(jù)。任意一份數(shù)據(jù)損壞的情況下,可以通過其它數(shù)據(jù)恢復,最大可以支持M份數(shù)據(jù)的損壞。OceanStor9000采用ErasureCode算法保障數(shù)據(jù)可靠性,將N+M份數(shù)據(jù)保存在N+M個不同的虛擬節(jié)點上,其中N支持2-16,M支持1/2/3/4。可以看出,它最大可以支持4份數(shù)據(jù)同時損壞,并且可以通過其它數(shù)據(jù)分片,恢復原始數(shù)據(jù),而不影響系統(tǒng)業(yè)務的連續(xù)性,數(shù)據(jù)保護性強于傳統(tǒng)的RAID5(只允許一份數(shù)據(jù)損壞)、RAID6(只允許兩份數(shù)據(jù)損壞)。如下圖所示:圖表SEQ圖表\*ARABIC7ErasureCode原理說明圖OceanStor9000分布式存儲系統(tǒng)專門針對小文件存儲進行了優(yōu)化。如果配置了N+M的保護方式,當一個文件的數(shù)據(jù)量不超過一個分片大小時,系統(tǒng)會自動將其轉(zhuǎn)化為1+M份的存儲方式,當數(shù)據(jù)量超過一個分片大小,系統(tǒng)才會對它進行校驗計算。這種優(yōu)化,可以提高小文件的讀寫性能和存儲利用率。元數(shù)據(jù)高可靠OceanStor9000的分布式文件系統(tǒng)的元數(shù)據(jù),采用存儲多份副本的方式,并且對于配置了N+M保護方式的文件來說,其元數(shù)據(jù)的保存份數(shù)自動設定為M+2份,這使得OceanStor9000分布式存儲系統(tǒng)的元數(shù)據(jù)的可靠性高于其數(shù)據(jù)。數(shù)據(jù)自愈OceanStor9000分布式存儲系統(tǒng)采用的InfoProtector技術,是華為公司的專利技術。InfoProtector可以提供最多同時故障4個全節(jié)點的數(shù)據(jù)保護。并且硬盤故障時,InfoProtector確保將單個故障盤的重新構建時間縮至最短,達到1TB數(shù)據(jù)只需要1小時恢復時間,優(yōu)于友商的數(shù)據(jù)恢復速度。數(shù)據(jù)存儲時被分片打散到多個存儲節(jié)點上,這些分片數(shù)據(jù)支持分布在不同的存儲節(jié)點之間。在數(shù)據(jù)發(fā)生故障導致數(shù)據(jù)不一致時,OceanStor9000通過內(nèi)部的自檢機制,自動發(fā)現(xiàn)數(shù)據(jù)故障。發(fā)現(xiàn)故障后啟動數(shù)據(jù)修復機制,在后臺修復數(shù)據(jù)。由于數(shù)據(jù)被分散到多個不同的存儲節(jié)點上保存,數(shù)據(jù)修復時,在不同的節(jié)點上同時啟動修復,每個節(jié)點上只需修復一小部分數(shù)據(jù),多個節(jié)點并行工作,有效避免單個節(jié)點修復大量數(shù)據(jù)所產(chǎn)生的性能瓶頸,對上層業(yè)務的影響做到最小化。簡化管理OceanStor9000支持可視化自動部署,提供了專門的網(wǎng)管管理工具,它支持WEBUI形式,可以方便的顯示所有設備的組網(wǎng)結構,所有設備的容量,CPU,內(nèi)存等信息,以及所有進程的運行狀態(tài),業(yè)務的運行狀態(tài),實時展示系統(tǒng)性能信息,保存和查詢操作日志。管理維護高效集中,簡潔易用。管理員可以通過集群內(nèi)任意節(jié)點訪問網(wǎng)管界面,完成對硬件、軟件、集群和業(yè)務的統(tǒng)一管理。單個節(jié)點故障不影響網(wǎng)管的正常登錄和使用。自動精簡配置(ThinProvisioning)客戶側有多種應用的情況時,可能出現(xiàn)某些應用存儲的數(shù)據(jù)空間已經(jīng)飽和,另一些應用存儲的數(shù)據(jù)空間幾乎沒怎么使用,空間浪費率極高。OceanStor9000自動支持ThinProvisioning,可以按照客戶需要為客戶配置存儲空間,并且這個空間是動態(tài)分配的,支持彈性擴容,實際需要使用多少空間,OceanStor9000就為它分配多少空間,客戶存儲的數(shù)據(jù)容量增長時,分配的空間也彈性增長,為客戶解決了在項目初期為不同應用精確存儲空間規(guī)劃的苦惱,也有效避免了資源浪費。精細化配額管理高性能計算領域?qū)Υ鎯Φ臄?shù)據(jù)共享及空間分配需求,需要存儲系統(tǒng)支持空間配額管理,存儲資源可以靈活的劃分給不同的計算任務。OceanStor9000可實現(xiàn)對存儲空間的細化管理。支持按照用戶、用戶組或目錄的配額管理和配置,并且支持嵌套的配額管理,便于資源管理。OceanStor9000的InfoAllocator特性包括:基于目錄的配額:管理員可以針對為空的共享目錄設置配額,限制該目錄的最大可用存儲空間?;谟脩?用戶組的配額:管理員可以對任意用戶/用戶組設置配額,限制該用戶/用戶組可以使用的最大可用存儲空間。方案整體優(yōu)勢針對高性能計算應用的分布式架構OceanStor9000通過多個節(jié)點并發(fā)訪問提供服務,通過高效的分布式文件系統(tǒng)以及客戶端連接負載均衡技術,能夠最大程度的發(fā)揮系統(tǒng)的并發(fā)性能。同時通過高性能的分布式鎖機制,支持多節(jié)點或多線程對同一文件的不同部分并行讀寫,實現(xiàn)多節(jié)點高速并行IO訪問。并且,元數(shù)據(jù)存放在SSD硬盤中,提高系統(tǒng)訪問能力,在使用分級存儲功能時,大量熱點數(shù)據(jù)也存放在SSD硬盤中,加速熱點文件訪問,提高整體讀寫IO能力。滿足日益增長的容量擴展OceanStor9000分布式文件系統(tǒng)可提供海量存儲擴展能力,支持靈活地在線擴展節(jié)點,能夠更好的匹配高性能業(yè)務的發(fā)展需求。系統(tǒng)節(jié)點支持3~288節(jié)點的擴展能力,單一文件系統(tǒng)最大可擴展至40PB,隨著節(jié)點數(shù)的增多,容量和性能線性增長。全IP互聯(lián),簡化網(wǎng)絡架構,降低管理和維護成本相比于傳統(tǒng)NAS系統(tǒng)和SAN存儲系統(tǒng),OceanStor9000前后端支持10GE/Infiniband/GE組網(wǎng),全IP互聯(lián)的組網(wǎng),無需部署專門的存儲光纖網(wǎng)絡;全對稱分布式架構,沒有元數(shù)據(jù)節(jié)點,無需采購昂貴的IO節(jié)點和HBA卡以及光纖線纜,節(jié)省機柜,節(jié)約能源,降低盤陣采購成本。滿足系統(tǒng)信息流的共享OceanStor9000通過NFS和CIFS協(xié)議為前端服務器提供共享文件系統(tǒng),可以實現(xiàn)數(shù)據(jù)的完全共享。單一文件系統(tǒng),避免多個文件系統(tǒng)使用不均,提升空間利用率。同時,OceanStor9000的配額管理功能,能夠支持最大8層的目錄配額嵌套,更有豐富的配額管理策略,匹配“組織架構”的空間管理方式。能夠?qū)ξ募到y(tǒng)統(tǒng)一管理,保證信息流的暢通,協(xié)調(diào)各業(yè)務子系統(tǒng)有效的運作。保障業(yè)務高可靠運行OceanStor9000分布式集群存儲系統(tǒng)所有硬件部件采取冗余設計,不會出現(xiàn)單點故障。所有節(jié)點并發(fā)訪問,支持N+1到N+4的數(shù)據(jù)冗余配比,當出現(xiàn)節(jié)點或硬盤故障時(故障數(shù)量不超過系統(tǒng)冗余配比所支持的最大故障數(shù)量),可以保證業(yè)務正常運行。最優(yōu)性價比特有的動態(tài)分級存儲特性,實現(xiàn)了基于訪問頻度的自動數(shù)據(jù)分級,有效進行數(shù)據(jù)生命周期管理,節(jié)省成本,在保證同等性能的同時提供更低廉的價格。

相關產(chǎn)品介紹產(chǎn)品概述華為技術有限公司緊跟業(yè)界趨勢,在充分掌握了用戶需求的基礎上推出大數(shù)據(jù)存儲產(chǎn)品OceanStor9000,面向大數(shù)據(jù)存儲市場,以全對稱分布式架構為基礎,融合ErasureCode數(shù)據(jù)保護技術,提供業(yè)界領先的讀寫性能和超大單一文件系統(tǒng);對外提供統(tǒng)一的接口,承載多業(yè)務接入,滿足大數(shù)據(jù)存儲應用場景下海量數(shù)據(jù)存儲需求。產(chǎn)品形態(tài)介紹OceanStor9000包含幾種類型節(jié)點,Performancenode、Capacitynode,Mini-capacitynode。Performancenode應用于OPS密集型應用場景(2013年11月發(fā)布的100個該節(jié)點SPECsfs2008性能值達到了5,030,264OPS的優(yōu)越性能),在大量小文件頻繁讀寫場景下使用該節(jié)點(如媒資的非線編應用等)。Capacitynode應用于高帶寬型應用場景,在大文件順序讀寫場景下使用該節(jié)點(如衛(wèi)星圖片存儲、歸檔應用等)。Mini-capacitynode應用于小容量場景,在系統(tǒng)裸容量小于210TB,性能要求不高的情況下,使用該節(jié)點。Performancenode和Capacitynode或Performancenode和Mini-capacitynode可以在同一套系統(tǒng)內(nèi)配置,并可完成不同節(jié)點類型之間的分級存儲功能,用戶可根據(jù)不同的業(yè)務需求靈活的配置節(jié)點的數(shù)量(同類型節(jié)點至少三臺)。整機柜部署如下圖所示:圖表SEQ圖表\*ARABIC8Performancenode整機柜和單節(jié)點視圖圖表SEQ圖表\*ARABIC9Capacitynode節(jié)點整機柜和單節(jié)點視圖圖表SEQ圖表\*ARABIC10Mini-capacitynode整機柜和單節(jié)點視圖Performancenode:2U,25+2盤位操作系統(tǒng)盤2.5寸300GSAS數(shù)據(jù)盤支持2.5寸SSD、SAS標配1×200GSSD+24×600GSASCapacitynode:4U,36+2盤位操作系統(tǒng)盤2.5寸300GSAS數(shù)據(jù)盤支持3.5寸SSD、SATA、NLSAS標配1×200GSSD+35×2TB/4TBSATAMini-capacitynode:2U,12+2盤位操作系統(tǒng)盤2.5寸300GSAS數(shù)據(jù)盤支持3.5寸SSD、SATA、NLSAS標配1×200GSSD+11×2TB/4TBSATAOceanStor9000內(nèi)外部支持10GE、Infiniband或GE組網(wǎng),前后端網(wǎng)絡分離,組網(wǎng)類型支持如下表:前端業(yè)務網(wǎng)絡后端存儲網(wǎng)絡配套交換機(內(nèi)部組網(wǎng))是否是推薦組網(wǎng)類型10GE接入10GE接入CE6800主推10GE接入IB接入MellanoxIS5023-IB接入IB接入MellanoxIS5023-GE接入10GE接入CE6800-圖表SEQ圖表\*ARABIC11前后端組網(wǎng)類型支持10GE內(nèi)部組網(wǎng)情況下,10GE交換機CE6800的后視圖如下圖所示:圖表SEQ圖表\*ARABIC12CE6800交換單元產(chǎn)品規(guī)格表型號特性描述硬件特性系統(tǒng)架構全對稱分布式架構節(jié)點數(shù)3~288Performancenode標配2×IntelE5系列,48G內(nèi)存,1×2.5”200GSSD+24×2.5”600GSASCapacitynode標配2×IntelE5系列,48G內(nèi)存,1×3.5”200GSSD+35×3.5”4TBSATAMini-capacitynode標配2×IntelE5系列,32G內(nèi)存,1×200GSSD+11×2TBSATA客戶業(yè)務網(wǎng)絡類型10GEEthernet或40GEInfinib

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論