云存儲技術分析和架構框架設計_第1頁
云存儲技術分析和架構框架設計_第2頁
云存儲技術分析和架構框架設計_第3頁
云存儲技術分析和架構框架設計_第4頁
云存儲技術分析和架構框架設計_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

云存儲技術分析和架構框架設計

【摘要】隨著互聯(lián)網(wǎng)類新興業(yè)務的激增、業(yè)務數(shù)據(jù)快速增長,云存儲技術應運而生。本文深入剖析了云存儲通用框架、硬件架構以及其底層原理這三個技術層面的差異性,為云存儲架構框架設計提供了理論依據(jù);再結合細分行業(yè)及其業(yè)務應用場景的差異性需求,最終確定了滿足企業(yè)需求的云存儲總體架構,并詳細介紹了架構設計評估和技術選型過程中的一些實踐經(jīng)驗。1.概述隨著互聯(lián)網(wǎng)類新興業(yè)務的激增、業(yè)務數(shù)據(jù)快速增長,使得企業(yè)數(shù)據(jù)中心存儲系統(tǒng)面臨新的挑戰(zhàn):大數(shù)據(jù)、云計算等新技術應用帶來了新的存儲應用場景;海量數(shù)據(jù)存儲沖擊著傳統(tǒng)存儲架構,性能容量成為瓶頸;存儲系統(tǒng)擴容和新建周期長,無法滿足業(yè)務敏捷需求。云存儲技術應運而生,敏捷、資源可彈性部署、按需獲取的特性很好地滿足了數(shù)據(jù)中心海量數(shù)據(jù)和新興業(yè)務快速上線的存儲需求。2.云存儲技術分析顧名思義,云存儲是在云計算基礎上衍生和發(fā)展出來的,通過網(wǎng)絡將大量異構存儲設備構成了統(tǒng)一的存儲資源池,在集中式存儲技術基礎上,融合了分布式存儲、多租戶共享、軟件定義存儲等多種云存儲技術。新技術應用都有其兩面性,在設計構建云存儲架構框架之前,有必要詳細了解和剖析云存儲技術,這樣才能結合自身需求做好規(guī)劃。下文將從云存儲通用框架、存儲硬件架構以及分布式底層存儲技術這三方面展開敘述。2.1云存儲通用框架相比于傳統(tǒng)存儲來說,云存儲系統(tǒng)是一種層次化的體系結構,其通用框架可參考圖1分為云存儲服務和云存儲資源池兩種,其中云存儲資源池是云存儲最為核心的部分。

圖1.云存儲通用框架圖云存儲資源池又可細分為數(shù)據(jù)存儲層、存儲抽象層和存儲接口層。數(shù)據(jù)存儲層是云存儲的基礎,由不同類型的硬件設備組成,提供多種IO性能的存儲資源;存儲抽象層實現(xiàn)了不同類型的存儲設備的邏輯虛擬化管理,為上層應用提供不同存儲資源的抽象,實現(xiàn)存儲資源的靈活調(diào)配;存儲接口層提供了不同類型的存儲接口,實現(xiàn)存儲系統(tǒng)與外部應用的數(shù)據(jù)傳輸。云存儲服務為用戶提供統(tǒng)一的協(xié)議和編程接口,提供云數(shù)據(jù)盤和對象存儲服務,是云存儲資源調(diào)度控制的入口,授權用戶可以公共應用接口訪問云存儲。2.2云存儲硬件架構數(shù)據(jù)存儲層可根據(jù)差異化的需求、細分行業(yè)以及不同的應用場景,部署不同架構的數(shù)據(jù)存儲,這也是存儲硬件選型的關鍵。一般可分為集中式和分布式兩種存儲架構,其中分布式存儲中又可以依據(jù)計算與存儲是否解耦,再細分為獨立部署與超融合兩種架構,下文將對這三種架構存儲進行評估。2.2.1集中式存儲集中式存儲的代表是傳統(tǒng)SAN存儲或NAS存儲,使用專用硬件和存儲控制器。其架構如圖2所示,存儲控制器采用雙控或多控互聯(lián)架構,包含RAID功能和大容量Cache??刂破骱蠖诉B接到磁盤柜,磁盤柜包含了多個RAID組,每個RAID組又包含多塊磁盤,這就組成了集中式的磁盤陣列。

圖2.集中式存儲硬件架構示意圖集中式存儲一般提供塊存儲或文件存儲接口服務,其優(yōu)點可總結為:性能:IO分片粒度小,數(shù)據(jù)IO傳輸路徑短,表現(xiàn)為低時延和高IOPS;可靠性高

:專有硬件和存儲控制器的可靠性高,基于RAID和硬件冗余等技術也較成熟;數(shù)據(jù)強一致性:

控制器、磁盤間的集中式互聯(lián)架構最大限度地保證了數(shù)據(jù)的強一致性。當然傳統(tǒng)集中式存儲也有其劣勢,這也是分布式架構興起的原因,表現(xiàn)在:擴展性差:

集中式存儲是無法無限制地擴展磁盤柜的,受限于存儲控制器的擴展能力;成本較高:

集中式存儲的高可靠專有硬件也會帶來更高的設備采購成本和維保成本。2.2.2分布式存儲-獨立部署架構分布式存儲采用可擴展的系統(tǒng)結構,通過網(wǎng)絡將數(shù)據(jù)分散存儲在多臺獨立的存儲節(jié)點上,其架構如圖3所示,分布式存儲-獨立部署架構由多個專門的存儲節(jié)點組成,對外提供各種存儲服務。

圖3.分布式存儲-獨立部署架構示意圖分布式存儲不再依賴于傳統(tǒng)專用硬件,大部分部署在通用服務器之上,通過軟件定義的方式來實現(xiàn)核心存儲邏輯,其優(yōu)勢在于:靈活迭代:

相比于硬件的迭代,軟件版本迭代周期更快更靈活;硬件成本低:

消除了專有硬件依賴,硬件成本低;易擴展:

分布式架構易于橫向擴展,性能容量線性擴展。而分布式存儲的劣勢在于:復雜度高:

相比于集中式單體架構來說,分布式運維復雜度高;穩(wěn)定性低:

部分產(chǎn)品技術成熟度不夠,硬件故障或系統(tǒng)異常場景下,存儲性能易受影響。2.2.3分布式存儲-超融合架構超融合架構是一個包含計算、網(wǎng)絡、存儲的整體架構解決方案,其存儲本身也是分布式存儲。在超融合形態(tài)中,計算與存儲是同一軟件堆棧運行在通用服務器中的,其架構如圖4所示,大多數(shù)超融合產(chǎn)品在其節(jié)點上會部署控制器虛擬機CVM,CVM會承擔存儲服務功能,而普通的虛擬機需與CVM通信才可訪問數(shù)據(jù)存儲。

圖4.分布式存儲-超融合架構示意圖超融合傾向于計算層和存儲層可以很好耦合的設計理念,除了分布式存儲的優(yōu)點外,其優(yōu)勢還包括:降低運維復雜度:

通過架構設計、部署、日常運維管理的簡化,單一廠商可提供所有軟硬件的支持。而分布式存儲的獨立部署架構的優(yōu)勢在于資源自由調(diào)配、計算與存儲層可獨立部署擴展。這樣來看,超融合的劣勢如下:新的資源孤島:

無法與外部做資源共享,會帶來資源利用率和統(tǒng)一管理問題;性能問題:

計算與和存儲會爭搶服務器硬件資源和網(wǎng)絡帶寬,性能問題會更明顯;橫向擴展性不足:

性能風險也間接帶來了無法大規(guī)模部署的問題;系統(tǒng)內(nèi)部復雜性:

系統(tǒng)架構的簡化帶來了更高的內(nèi)部復雜性。2.3分布式底層存儲技術相比于集中式存儲,分布式存儲的復雜性更高,但更適應大規(guī)模的云部署場景,有必要深入了解其底層原理。分布式存儲存在著獨立部署和超融合的硬件架構差異,而從邏輯層面來看,不管是獨立部署還是超融合架構,又主要分為分布式文件系統(tǒng)(DFS)和分布式鍵值(k-v)存儲這兩種存儲技術。2.3.1分布式文件系統(tǒng)云存儲技術的復雜性還在于存儲虛擬化技術,它屏蔽了數(shù)據(jù)IO與底層數(shù)據(jù)存儲的映射與實現(xiàn)細節(jié)。如圖5所示,分布式文件系統(tǒng)(DFS)是一種虛擬文件系統(tǒng),本身有著文件目錄結構特征。而DFS對外提供的存儲單元則是由文件組成,這些文件又會被邏輯分片,再按照多數(shù)據(jù)副本分布算法分布到不同數(shù)據(jù)節(jié)點上。

圖5.基于DFS的云存儲底層原理示意圖基于DFS的云存儲邏輯清晰,也有著比較廣的應用范圍,比如GFS、HDFS等典型應用,包括一些超融合底層存儲也是基于DFS來實現(xiàn)的,但也存在著明顯缺陷:擴展性受限:

基于目錄結構的文件系統(tǒng),會成為DFS大規(guī)模擴展的瓶頸;性能方面:

文件目錄信息可以通過緩存到內(nèi)存中來提高定位數(shù)據(jù)的速度,但是當文件數(shù)量達到一定量級時,硬件無法滿足時,性能會急劇下降。2.3.2分布式鍵值存儲分布式文件系統(tǒng)的文件目錄管理遵循著map-reduce的設計思路,化大為小,分而治之,再合并處理,其架構中需要元數(shù)據(jù)管理節(jié)點來協(xié)調(diào),本質(zhì)上還是一種中心化;分布式鍵值(k-v)存儲是一種無中心化架構,解決了主節(jié)點本身的瓶頸,其架構設計思路則是均衡設計,所有節(jié)點的地位都是對等的,通過數(shù)據(jù)布局算法均衡分布在不同節(jié)點上。一致性hash算法和虛擬節(jié)點是一種通用做法,不同于簡單散列hash將數(shù)據(jù)分布在一條直線上,而是采用首尾相連,將整個哈希值空間組織成一個虛擬圓環(huán)。ceph是一種典型基于分布式鍵值的存儲系統(tǒng),其object數(shù)據(jù)分布采用的是crush算法,是在一致性hash算法基礎上,充分考慮多副本、故障域隔離等約束設計而來,其實現(xiàn)原理如圖6所示。

圖6.基于分布式KV的云存儲底層原理示意圖與基于DFS的云存儲相比,基于分布式KV的云存儲可以支持更好的擴展性,但是也存在如下缺陷:復雜度高:

基于分布式KV的云存儲又增加了一層存儲抽象,系統(tǒng)設計和運維復雜度都很高;性能方面:

寫入延時增加,多數(shù)據(jù)副本寫入的時延更高一些;3.云存儲架構框架設計3.1總體設計原則和方法云存儲總體設計應堅持以下三項原則:合適原則:

應與具體所處行業(yè)和應用場景相適應,考慮企業(yè)實際業(yè)務應用情況,注重成本、收益、風險三方面的平衡;簡單原則:

云存儲架構框架本身具有很高的復雜度,架構設計和實際落地過程中更應注意循序漸進,化繁為簡;前瞻性原則:

應采用業(yè)界主流云存儲技術,保持技術的先進性,考慮架構的擴展能力。云存儲分析設計包括兩種思維方法:1)自頂向下自頂向下方法是從云計算的整體架構出發(fā),逐步求精,去分析設計云存儲通用框架及其組成元素。該設計分析方法既需要對問題域有清晰的了解,對行業(yè)未來一段時間內(nèi)的應用場景有清晰的認識,又需要能把控住求解域,對云存儲技術發(fā)展和應用有深刻的認識。2)自底向上自底向上方法則相反,針對實際需要解決的問題,去做云存儲產(chǎn)品的技術選型,逐步搭建云存儲架構框架,從具體到抽象。云存儲架構框架設計采用哪種方法是需要根據(jù)企業(yè)實際情況來定的,自頂向下方法需要更高的技術把控力,也需要更多的項目預算,落地前需要謀而后動,充分測試;而自底向上的方法則追求快速應用落地,但需要注意技術應用的連貫性,也需要考慮架構框架最終目標。而以我司實際情況來看,更適合采用自低向上的方法,根據(jù)各種業(yè)務應用場景,去評估落地適合的云存儲方案,降低試錯成本,在不斷的實踐過程中,去推進云存儲架構框架的演進。3.2需求分析3.2.1應用場景分析不同行業(yè)、業(yè)務場景往往決定了云存儲不同的應用場景,傳統(tǒng)行業(yè)和互聯(lián)網(wǎng)行業(yè)之間往往也有著明顯差異:核心業(yè)務應用場景:

傳統(tǒng)行業(yè)核心業(yè)務邏輯的變化不頻繁,核心系統(tǒng)的業(yè)務量增長是規(guī)律的,可預估的,系統(tǒng)架構穩(wěn)定;而互聯(lián)網(wǎng)行業(yè)來說,業(yè)務系統(tǒng)追求敏捷迭代,業(yè)務量起伏變化較大,系統(tǒng)架構從簡單到復雜,要求彈性伸縮;互聯(lián)網(wǎng)業(yè)務應用場景:

對于傳統(tǒng)行業(yè)來說,互聯(lián)網(wǎng)是一種新的業(yè)務拓展渠道,是業(yè)務轉(zhuǎn)型的方向,需要逐步試點開放的;非結構化數(shù)據(jù)場景:

非結構化數(shù)據(jù)場景也有很大差異,在部分場景下,非結構化數(shù)據(jù)多是系統(tǒng)產(chǎn)生或收集的臨時數(shù)據(jù),一次寫入多次讀取,要求IO性能穩(wěn)定,如個人網(wǎng)盤場景;另外一些場景下,非結構化數(shù)據(jù)要求長期存放,一次寫入很少讀取,逐漸成為冷數(shù)據(jù),典型的如銀行保險業(yè)務雙錄場景;數(shù)據(jù)災備與安全:

無論是傳統(tǒng)行業(yè)還是互聯(lián)網(wǎng)行業(yè),都需要考慮業(yè)務連續(xù)性需求,建立數(shù)據(jù)災備體系和敏感數(shù)據(jù)保護方案。而金融行業(yè)還有著更加嚴格的國家法律法規(guī)和金融監(jiān)管部門要求,業(yè)務系統(tǒng)的RTO、RPO要求更加明確,重要、敏感數(shù)據(jù)需要安全可控,一般會審慎選擇云存儲的部署模式。3.2.2數(shù)據(jù)存儲需求部署模式敏感數(shù)據(jù)情況決定了云存儲的部署模式,對于涉及敏感數(shù)據(jù)較多的系統(tǒng),一般采用私有部署模式;對于非敏感數(shù)據(jù),云存儲的成本往往是一個是重要的考慮點,公有云部署除了考慮數(shù)據(jù)存儲費用外,也還需考慮存儲流量費用。綜合考慮我司的業(yè)務應用場景,云存儲排除了公有云模式,而是采用了私有部署模式。存儲訪問接口存儲訪問接口對應的是云存儲的功能需求,對于我司來說,包括塊存儲、NAS存儲接口和對象存儲S3接口。塊存儲對應于云服務器硬盤需求,NAS存儲對應于多個云服務器間的文件共享需求,對象存儲S3接口對應于互聯(lián)網(wǎng)類業(yè)務非結構化數(shù)據(jù)存儲和冷數(shù)據(jù)歸檔需求。數(shù)據(jù)存儲分級數(shù)據(jù)存儲分級可以在滿足不同業(yè)務系統(tǒng)存儲需求的基礎上,降低整體云存儲成本,結合我司業(yè)務情況分為:a).核心業(yè)務類型系統(tǒng)及其數(shù)據(jù)庫,需要最高的存儲性能和可靠性;b).其他輕量級數(shù)據(jù)庫,需要較高的存儲性能和可靠性;c).互聯(lián)網(wǎng)類新業(yè)務和其他非關鍵類應用,需要一定的存儲性能和較好的擴展性;d).非結構化類型業(yè)務數(shù)據(jù),需要較高的擴展性,存儲性能要求不高;e).數(shù)據(jù)備份與歸檔,數(shù)據(jù)存儲冷熱分層;f).開發(fā)測試系統(tǒng),利舊存儲。3.3云存儲總體架構從行業(yè)發(fā)展趨勢和企業(yè)IT戰(zhàn)略轉(zhuǎn)型方向看,我司傳統(tǒng)業(yè)務依然處于基礎性的重要地位,這也決定了集中式存儲架構將與分布式存儲架構長期并存的狀態(tài)。分布式存儲架構主要用于新的線上業(yè)務場景,集中式SAN存儲和NAS存儲在傳統(tǒng)業(yè)務場景依然占據(jù)重要地位。最終確立了統(tǒng)一納管異構存儲資源,提供多種類型數(shù)據(jù)接口、面向海量數(shù)據(jù)場景的云存儲架構,如圖7所示.可通過引入超融合架構來構建私有云IaaS平臺,實現(xiàn)IT基礎架構云化轉(zhuǎn)型,分別構建開發(fā)測試、互聯(lián)網(wǎng)類新業(yè)務應用等超融合集群。而海量的半結構化和非結構化數(shù)據(jù)需要通過分布式對象存儲來構建可彈性擴容的數(shù)據(jù)湖,采用基于策略的數(shù)據(jù)全生命周期管理,提供熱、溫、冷不同資源池,實現(xiàn)數(shù)據(jù)在不同資源池以及云平臺間的流動和分層。

圖7.云存儲架構示意圖3.4架構設計評估云存儲架構設計是否合理,需要從敏感點、權衡點以及架構風險點這三個方面去評估:敏感點敏感點對應于不同數(shù)據(jù)存儲的共有的一些特性,比如存儲的軟硬件成本、可靠性、存儲IO性能、架構復雜度、靈活擴展能力、資源孤島、故障域隔離和可管理性等屬性;權衡點權衡點則是影響多個架構質(zhì)量屬性的敏感點,需要架構師評估取舍的部分。比如存儲架構是集中式還是分布式?jīng)Q定了存儲的架構復雜度和靈活擴展能力;存儲的軟硬件成本也很大程度上決定了存儲的可靠性和性能;資源孤島雖然會造成資源浪費,但合理規(guī)劃好,也是故障域隔離的前提。風險點對于架構師來說,最需要關注的往往是架構中的風險點,是架構設計成敗的關鍵。分布式存儲架構存在著復雜度高、新技術引入風險以及版本迭代速度快等風險點;超融合架構還面臨著擴展性受限、資源孤島等風險;而傳統(tǒng)存儲架構主要風險點在于難以應對海量數(shù)據(jù)存儲擴展,成本較高,與新技術的適配度也不高。對應于我司的云存儲架構設計,傳統(tǒng)SAN存儲性能穩(wěn)定,IO延時低,成本高,不易擴展,但適合于核心業(yè)務場景;NAS存儲性能不高,但易于使用和文件共享,成本也不高,適合于絕大多數(shù)文件共享訪問場景;分布式對象存儲性能一般,架構復雜度高,但可以靈活擴展,支持海量數(shù)據(jù)存儲,成本低,適合于海量結構化數(shù)據(jù)存儲和互聯(lián)網(wǎng)業(yè)務場景;而超融合架構可以很好地與計算資源融合,架構簡單,成本低,雖然有擴展性受限和資源孤島問題,但結合公司業(yè)務和計算資源配比建立不同超融合集群,可以做好數(shù)據(jù)存儲分級,隔離不同的故障域。3.5技術選型按照云存儲架構設計評估,我司還需要分別引入分布式對象存儲和超融合兩種不同硬件架構的云存儲方案。結合云存儲底層存儲技術的分析,分布式對象存儲更適宜采用基于分布式鍵值存儲的產(chǎn)品,性能需求不高,擴展性更強;超融合則傾向于基于分布式文件系統(tǒng)的產(chǎn)品,邏輯架構更加清

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論