版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
云平臺存儲項目實施前的規(guī)劃
通過傳統(tǒng)數(shù)據(jù)中心存儲項目和云平臺存儲項目的對比分析,闡述云平臺存儲項目實施前的規(guī)劃思路,幫助同行們在進行類似項目實施前,可以預先做好準備。如何做好云平臺存儲項目實施前的規(guī)劃?一、前言隨著金融行業(yè)的迅速發(fā)展,基于互聯(lián)網(wǎng)業(yè)務的辦理方式逐步替換傳統(tǒng)的柜面方式。鑒于互聯(lián)網(wǎng)業(yè)務系統(tǒng)的多并發(fā)和多擴展的特點,云平臺架構方案逐步成為金融行業(yè)考慮的架構方案之一。云平臺是將物理資源(計算資源、存儲資源、網(wǎng)絡資源等)進行整合池化,靈活調(diào)用軟硬件資源,按需為用戶提供服務。在運行過程中通過實時監(jiān)控數(shù)據(jù)中心業(yè)務量和并發(fā)量可以進行資源的動態(tài)調(diào)整和在線擴容,進而達到以較小的資源成本來提供較高質(zhì)量服務的目的。在云平臺分支項目的存儲資源云平臺化中,前期的存儲項目設計規(guī)劃是云平臺搭建的重要組成部分。二、方案實施整體架構規(guī)劃按照業(yè)務系統(tǒng)的種類類型及數(shù)據(jù)特點,設計相應的云平臺存儲架構,以下為按照不同的業(yè)務場景進行設計的詳細架構圖:1.集中式SAN云存儲架構(見圖1)圖1:集中式SAN云平臺存儲架構(信貸業(yè)務系統(tǒng)設計圖)2.分布式云平臺存儲架構(互聯(lián)網(wǎng)業(yè)務,如圖2)三、云平臺存儲架構的分類如圖所示,圖1、2分別是根據(jù)不同業(yè)務系統(tǒng)場景和需求所制定的云平臺存儲架構設計。根據(jù)業(yè)務的類型選擇SAN云平臺存儲架構和分布式存儲架構。另外我們也可以根據(jù)數(shù)據(jù)類型進行分類。數(shù)據(jù)按照不同的定義劃分的類型不同。如:結構化數(shù)據(jù)與非結構化數(shù)據(jù);交易類數(shù)據(jù)與非交易類數(shù)據(jù);重要系統(tǒng)數(shù)據(jù)與非重要系統(tǒng)數(shù)據(jù)等。按照不同的數(shù)據(jù)類型可以選擇相應的云平臺存儲架構,比如大數(shù)據(jù)平臺因后續(xù)需要進行存儲資源的靈活擴展,選擇分布式云平臺存儲設計。圖2:互聯(lián)網(wǎng)業(yè)務分布式云平臺存儲架構四、云平臺存儲中的數(shù)據(jù)分布集中式存儲和分布式存儲的架構不同,也決定了集中式存儲和分布式上的數(shù)據(jù)分布有所不同。集中式存儲數(shù)據(jù)信息主要分布在單物理位置的存儲設備介質(zhì)上,存儲設備通過iSCSI、NAS、FC等協(xié)議連接,數(shù)據(jù)安全保護采用了RAID技術使用冗余的存儲空間條帶化存儲,存儲的可靠性高,存儲設備及介質(zhì)集中布放,易于管理維護;分布式存儲是將數(shù)據(jù)信息分布在多個不同物理位置的多個服務器存儲設備上,服務器存儲設備可以存放到不同的位置且彼此互聯(lián),使用多個服務器將數(shù)據(jù)存儲在一起,數(shù)據(jù)使用EC(糾刪碼)或多個副本方式存儲在不同的服務器上。五、總結云平臺存儲架構規(guī)劃需按照現(xiàn)有業(yè)務系統(tǒng)類型和數(shù)據(jù)結構類型而確定。建議分步驟分階段完成整體規(guī)劃,第一階段為測試開發(fā)類型的業(yè)務系統(tǒng);第二階段為管理和辦公類的業(yè)務系統(tǒng);最后在技術以及人員熟練度完備的情況下,將重要的業(yè)務系統(tǒng)逐步遷移至云平臺存儲中。
李威某金融機構架構師:云平臺存儲架構規(guī)劃設計與傳統(tǒng)數(shù)據(jù)中心存儲規(guī)劃設計實踐思路可以求同存異,都應該始于業(yè)務需求,而云平臺存儲架構規(guī)劃設計更是需求目標與設計實踐的一一對應,一般分為存儲選型、空間布局、性能優(yōu)化、故障容災等多個階段。但其規(guī)劃的基礎始終應該是項目前對業(yè)務系統(tǒng)的調(diào)研與分析。云平臺存儲架構規(guī)劃及設計,可以與傳統(tǒng)數(shù)據(jù)中心存儲的規(guī)劃實踐思路求同存異。同,是規(guī)劃與設計的方向相同。都是始于業(yè)務需求,著眼于存儲類型、數(shù)據(jù)量級、業(yè)務場景,于空間布局、增容擴展以及故障容災上進行精細配置。異,則是詳細設計的方向不同。傳統(tǒng)數(shù)據(jù)中心存儲的規(guī)劃與實踐注重于對存儲網(wǎng)絡、品牌性能、高級特性優(yōu)化的著墨,一般對存儲架構及性能的配置、調(diào)整、優(yōu)化重點關注,系一種架構思維去推動產(chǎn)品實踐的模式。而云平臺的存儲規(guī)劃,是鑒于云架構的服務化與平臺化的能力,云平臺存儲類型、規(guī)格、性能、擴縮容以及計費等模式一覽無余,即開即用無需繁雜的設計與規(guī)劃。云平臺存儲的規(guī)劃與設計,更像是“連連看”,將實際的業(yè)務需求、業(yè)務場景和與之最佳匹配的云存儲做連線,盡可能的將云下存儲服務的能力融入到業(yè)務多維度的數(shù)據(jù)需求,形成全方位的部署。因此,云平臺存儲的規(guī)劃與設計,幾乎是需求目標與設計實踐一對一的業(yè)務驅動科技的現(xiàn)實演繹。云平臺存儲架構規(guī)劃與設計的維度,一般分為存儲選型、空間布局、性能優(yōu)化、故障容災等多個階段。在進行云平臺存儲的細致設計之前,架構師首先會對云上業(yè)務系統(tǒng)的數(shù)據(jù)存儲需求進行調(diào)研與分析,在前期的摸排階段重點關注業(yè)務系統(tǒng)的量級、負載、可用性等關鍵業(yè)務指標,轉化成對云平臺存儲的需求,即存儲類別選型、初始空間評估、關鍵壓力性能、數(shù)據(jù)保護。存儲選型一般先做粗略分類,將結構化與非結構化存儲區(qū)分,然后在非結構化與結構化存儲上做細致分類。數(shù)據(jù)的存取形式與云平臺存儲的選型也存在很強的集聯(lián)關系:結構化云平臺存儲基于其關聯(lián)業(yè)務幾乎是在線業(yè)務或高負載業(yè)務,因此其選擇搭配范圍較為固定。生產(chǎn)ECS存儲一般業(yè)務選擇普通云盤、高負載業(yè)務優(yōu)先選擇讀寫密集型高效云盤。云數(shù)據(jù)庫存儲通常為高效型SSD;非結構化數(shù)據(jù)多為企業(yè)的歸結數(shù)據(jù)如證件材料圖片、視頻、交易報文等,此類數(shù)據(jù)的存儲選型很大程度取決于業(yè)務對數(shù)據(jù)的存取策略及性能要求,持續(xù)在線數(shù)據(jù)使用計算型存儲,低頻回訪數(shù)據(jù)使用歸檔存儲,IO頻繁則使用熱存儲,反之則選擇冷存儲。非結構化云存儲的選型上,通常推薦復合選擇以達到最佳實踐,這是因為非結構化數(shù)據(jù)在業(yè)務的不同時期其存取需求各異,在線生產(chǎn)經(jīng)營周期內(nèi)需要隨存隨取,不定時訪問進行業(yè)務生產(chǎn)并可能形成持續(xù)壓力,此時數(shù)據(jù)建議配置在對象存儲上。當超過生產(chǎn)經(jīng)營周期,數(shù)據(jù)由熱轉冷,不需要頻繁訪問,在此期間此類數(shù)據(jù)則建議由生產(chǎn)的對象存儲歸檔至低頻冷存儲上。冷熱數(shù)據(jù)存儲單獨配置,既適配了業(yè)務的負載特性又方便獨立管理,同時在云平臺的整體開銷上也形成了良性的優(yōu)化導向。在云平臺存儲空間布局上,通常使用年度測算法評估業(yè)務數(shù)據(jù)需求總量。例如以月度或季度統(tǒng)計業(yè)務的數(shù)據(jù)單位數(shù)據(jù)量,以一年為時間長度統(tǒng)計業(yè)務數(shù)據(jù)年度基礎量,評估出該業(yè)務正常經(jīng)營一年的數(shù)據(jù)量預估值。以三年為實時間長度模擬業(yè)務數(shù)據(jù)量的增長,最終評估出業(yè)務數(shù)據(jù)需求總量。云平臺存儲初始空間大小約等于最終業(yè)務數(shù)據(jù)需求總量除以經(jīng)典壓力負載常數(shù)(經(jīng)典值為70%)。云平臺存儲的空間通常宜多不宜少,尤其對于正處于發(fā)展期(經(jīng)營超過一兩年)的業(yè)務,空間測算時預估的年度增長值通常會低于業(yè)務實際增長。盡管云平臺存儲的空間分配與傳統(tǒng)存儲不同,模糊淡化了LUN的概念,但在云平臺存儲空間布局上仍要保持傳統(tǒng)存儲上LUN分配的幾個原則----“獨立不集中、宜多不宜大”。以ECS存儲配置為例,在分配ECS云盤資源時,系統(tǒng)盤與數(shù)據(jù)盤推薦獨立配置(獨立不集中),方便系統(tǒng)故障無法開啟可以將數(shù)據(jù)盤迅速掛載到其他ECS快速恢復業(yè)務數(shù)據(jù)。ECS不同數(shù)據(jù)盤之間,推薦多盤部署分攤業(yè)務IO、避免單盤過大造成恢復困難或觸達云盤性能瓶頸(宜多不宜大)。云平臺存儲除了滿足業(yè)務的基本需求,對云平臺存儲性能敏感的業(yè)務、難以抉擇云平臺存儲最佳選型的情況,均強烈推薦進行性能壓測,模擬真實業(yè)務運行監(jiān)測云存儲的實際運行效能,云平臺存儲服務標定的存儲規(guī)格及性能標定無法真實反映業(yè)務的實際運行情況。常見的云平臺存儲測試大致可分為三類:1.FIO類工具的復合云存儲測試,通過指定IO塊大小、IO深度、各IO百分比等參數(shù)模擬云存儲的裸盤性能。此類工具的測試結果可作為業(yè)務初步模擬的基礎參考,結果符合業(yè)務運行要求后再進行后續(xù)應用測試。2.真實業(yè)務模擬測試,通常部署業(yè)務應用集群,選擇核心業(yè)務流程,填充業(yè)務模擬數(shù)據(jù)進行低、中、高負載的多輪持續(xù)壓測,結合裸盤性能測試報告,持續(xù)變更云平臺存儲的配置進行業(yè)務適配性優(yōu)化。3.數(shù)據(jù)庫類應用測試,數(shù)據(jù)庫類測試工具非常多,如Sysbench、Swingbench、BenchmarkSQL等,選擇合適工具進行OLAP或OLTP測試。數(shù)據(jù)庫類測試結果的優(yōu)化往往需要DBA反復調(diào)試數(shù)據(jù)庫參數(shù),以及云平臺存儲工程師對存儲布局進行適配。在云平臺存儲的性能問題上,我們常常面對一個選擇----云平臺存儲的高級特性(如智能預讀、冷熱分層、重復數(shù)據(jù)刪除等)是否可以開啟利用?雖然高級特性帶來的存儲性能提升顯而易見,但是否是其業(yè)務運營發(fā)展需要?其次高級特性的方案成熟度是否完善、是否經(jīng)過時間的檢驗?最后開啟高級特性的副作用場景我們也應同步考慮,如智能預讀中部分場景的讀放大、冷熱分層特性中的緩存擊穿、重復數(shù)據(jù)刪除中元數(shù)據(jù)故障數(shù)據(jù)重構等問題。云平臺存儲事故無大小,一旦發(fā)生,其影響的點和面將相當廣。對于成熟的高級特性可適當計劃在生產(chǎn)實踐中開啟引用,但一切的前提均是在性能持續(xù)壓測中進行充分驗證。云平臺存儲的故障容災手段是相當豐富的,大多可實現(xiàn)數(shù)據(jù)的快速恢復,比如ECS云盤的快照、OSS的跨域同步、NAS的快照備份等。在項目實踐中如何做好合適的規(guī)劃呢?首先業(yè)務系統(tǒng)重要等級和數(shù)據(jù)完整性高低是云平臺存儲的數(shù)據(jù)保護基準也是核心參考,因此進行云平臺存儲項目前的業(yè)務調(diào)研報告就相當重要。核心等級越高、完整性要求越嚴格的業(yè)務數(shù)據(jù)啟用的云平臺存儲數(shù)據(jù)保護越全面,盡可能減少RPO和RTO。同時也要牢記一個原則——所有云平臺業(yè)務數(shù)據(jù)至少配置一種數(shù)據(jù)保護手段。在常規(guī)實踐中,云平臺存儲上的故障容災推薦以云服務數(shù)據(jù)保護為主,傳統(tǒng)備份恢復軟件為輔,云保護主要實現(xiàn)數(shù)據(jù)的迅速恢復,備份恢復軟件突出對數(shù)據(jù)的長期保存或異地離線需求。若以項目場景為例,ECS的云盤數(shù)據(jù)一般要求通過快照保護,若項目允許輔以備份恢復系統(tǒng)對ECS進行完整性備份或離線導出異地保存等,實現(xiàn)更高精度的備份恢復。OSS和NAS除了本身的復制、快照手段,還可以進行跨區(qū)域同步等能力實現(xiàn)多份數(shù)據(jù)的冗余,利用集中備份恢復系統(tǒng)實現(xiàn)周期性的合成全備份實現(xiàn)細粒度的恢復需求。云數(shù)據(jù)庫存儲的數(shù)據(jù)保護,物理備份、邏輯備份、沙箱保護等多種技術可進行多元組合,同時還可以結合備份恢復系統(tǒng)進行云數(shù)據(jù)庫的離線出庫等等。以上是云平臺存儲項目規(guī)劃的一點經(jīng)驗之談,或者說是項目規(guī)劃的綱要原則。云平臺存儲項目的規(guī)劃是一個實踐性的話題,不同的業(yè)務場景、不同的業(yè)務需求給出的規(guī)劃設計完全不同,并沒有一份標準的公共答案。但有一點是可以明確的,那就是項目前對業(yè)務系統(tǒng)的調(diào)研與分析,這才是云平臺存儲項目規(guī)劃的基礎。
王金東大連銀行系統(tǒng)工程師:云計算的急劇擴張與數(shù)據(jù)的急速增長需求,使得我們在進行云平臺存儲項目規(guī)劃時,要先從數(shù)據(jù)類型出發(fā),將業(yè)務類數(shù)據(jù)、應用類數(shù)據(jù)、備份歸檔類數(shù)據(jù)與不同的存儲類型進行有機組合,設計出適合的云平臺存儲規(guī)劃。隨著互聯(lián)網(wǎng)技術的深入發(fā)展,移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算和人工智能等新技術、新業(yè)務和新生態(tài)也得到加速推進發(fā)展,使得各種數(shù)據(jù)正迅速地膨脹并變大,數(shù)據(jù)呈爆炸性增長的趨勢。特別是近幾年,疫情深刻影響著各行各業(yè),為了提供更加豐富的、面向互聯(lián)網(wǎng)體驗良好的無接觸服務場景,由此產(chǎn)生的多媒體格式的數(shù)據(jù)更加速了數(shù)據(jù)的增長態(tài)勢。面對IT領域的變革日新月異,云計算的急劇擴張,各類數(shù)據(jù)的急速增長需求,我們該如何做好云平臺存儲項目實施前的規(guī)劃?一、存儲數(shù)據(jù)類型分析為適應存儲規(guī)劃的需求,我們對常用的數(shù)據(jù)按照產(chǎn)生或使用的維度不同大致分為業(yè)務類數(shù)據(jù)、應用類數(shù)據(jù)和備份歸檔類數(shù)據(jù):1.業(yè)務類數(shù)據(jù)業(yè)務類數(shù)據(jù)主要指應用系統(tǒng)運行產(chǎn)生的過程類或結果類數(shù)據(jù),包括結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)。其中,結構化數(shù)據(jù)主要指存儲于關系型數(shù)據(jù)庫的數(shù)據(jù),該類數(shù)據(jù)通常具有數(shù)據(jù)量較少、增速較慢等特點,同時對讀寫性能和可靠性的要求較高。半結構化數(shù)據(jù)主要指基于NoSQL/NewSQL數(shù)據(jù)庫的數(shù)據(jù),該類數(shù)據(jù)通常具有數(shù)據(jù)量較大、增速較快等特點,同時對讀寫性能和可靠性的要求較高。非結構化數(shù)據(jù)主要指文檔、日志、票據(jù)、影像、視頻等歸檔數(shù)據(jù),該數(shù)據(jù)通常具有數(shù)據(jù)量較大、增速較快等特點,同時對讀寫性能的要求相對較低。2.應用類數(shù)據(jù)應用類數(shù)據(jù)主要指應用系統(tǒng)、虛擬化、容器、VDI等數(shù)據(jù),該類數(shù)據(jù)通常用于支撐系統(tǒng)運行,數(shù)據(jù)量相對較小,且增長速度較慢,對讀寫性能的要求相對較高。3.備份歸檔類數(shù)據(jù)備份數(shù)據(jù)主要指為防止業(yè)務,或者應用類數(shù)據(jù)損壞導致的數(shù)據(jù)丟失制定的數(shù)據(jù)副本,僅在數(shù)據(jù)恢復的時候才會被讀取;歸檔類數(shù)據(jù)是滿足數(shù)據(jù)的長期存儲需求而保存的數(shù)據(jù),通常僅在偶發(fā)的查詢歷史歸檔數(shù)據(jù)的時候才會被讀取。備份歸檔類數(shù)據(jù)對讀寫的性能要求不高,同時具有數(shù)量大、數(shù)據(jù)增速較快等特點。二、存儲的實施規(guī)劃不同類型的數(shù)據(jù)和不同的存儲技術在實際應用中有多種不同的組合方式方式。一般下內(nèi)容暫以結構化數(shù)據(jù)存儲于集中存儲,應用類數(shù)據(jù)、非結構化數(shù)據(jù)和備份歸檔類存儲于分布式存儲,介紹存儲的實施規(guī)劃。1.集中存儲規(guī)劃集中存儲設備作為非結構化數(shù)據(jù)集中存放的核心設備,通常情況下將多個(或全部)應用系統(tǒng)存放于單臺或者有限的幾臺存儲設備中,一旦設備出現(xiàn)異常將會對其數(shù)據(jù)存取產(chǎn)生極大的影響,進而產(chǎn)生大面積的系統(tǒng)故障,引發(fā)嚴重生產(chǎn)運行事件。因此,存儲設備自身的可靠性必須得到保障,存儲設備自身的高可用主要考慮幾方面:1)磁盤組的RAID級保護支持多種RAID水平,包括RAID5、RAID6、RAID10、RAID50、RAID60等;支持針對高水平RAID數(shù)據(jù)保護的緩存加速選項,以優(yōu)化性能;支持大型、高度可擴展驅動群,以簡化存儲擴張和管理。2)組件的高可用保障組件的高可用硬件設計主要考慮幾方面,支持針對單點物理硬件故障應用訪問無感知的需求,支持雙引擎及雙控制平面設計等。當前主流廠商的存儲設備均能滿足單設備組件高可用的需求。3)存儲設備間的高可靠性存儲設備間的數(shù)據(jù)存儲也是存儲設備可靠性設計的重要環(huán)節(jié),存儲設備自身的可用性的依靠磁盤的RAID組和組件的高可用保障,但存儲設備運行在數(shù)據(jù)中心中,依賴于數(shù)據(jù)中心的風、火、水、電等基礎設施,一旦這些基礎環(huán)境出現(xiàn)問題也將導致存儲設備不可用。為避免此類故障對數(shù)據(jù)中心運行產(chǎn)生的影響,可考慮多存儲冗余設計,即存儲架構規(guī)劃。設備間的數(shù)據(jù)復制采用存儲層復制、存儲層雙活或者數(shù)據(jù)庫層復制的技術來滿足設備間數(shù)據(jù)存儲的需求,下圖(圖3)為兩地三中心存儲復制架構示例。圖3:兩地三中心存儲復制架構示例圖2.分布式存儲規(guī)劃分布式存儲是近年來新興的存儲形態(tài),且應用越來越廣泛,實際實施過程中考慮以下幾個方面。1)架構實施規(guī)劃分布式存儲在實施過程中架構比較靈活,可以考慮存算一體架構或是存算分離架構。存算一體適合面向業(yè)務負載較低的場景,業(yè)務種類比較固定、系統(tǒng)規(guī)模較小的場景,而不適合業(yè)務負載較重,需要高計算性能的場景;存算一體也適合業(yè)務配比比較固定,而非業(yè)務種類差異比較大的場景。而存算分離適合面向高彈性和高負
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度LNG運輸車輛改裝與安全檢測合同3篇
- 2024年食品行業(yè)社會保險管理與代繳合同
- 2025年度物流車輛智能系統(tǒng)升級合同4篇
- 2025年度醫(yī)療健康公司股權轉讓與產(chǎn)業(yè)鏈合作合同3篇
- 2025年度商業(yè)大廈車位包銷及物業(yè)管理合同4篇
- 2025年度智能倉儲物流系統(tǒng)建設承包經(jīng)營協(xié)議4篇
- 2024石材行業(yè)石材應用技術研究采購合同2篇
- 2025年度網(wǎng)絡直播個人勞務合同范本3篇
- 2025年度嬰幼兒專用牛奶采購合作協(xié)議書3篇
- 2025年電動自行車品牌代理銷售合同標準版2篇
- 《工貿(mào)企業(yè)有限空間作業(yè)安全規(guī)定》知識培訓
- 高層次人才座談會發(fā)言稿
- 垃圾清運公司管理制度(人員、車輛、質(zhì)量監(jiān)督、會計管理制度)
- 《建筑工程設計文件編制深度規(guī)定》(2022年版)
- 營銷人員薪酬考核方案
- 2024年版的企業(yè)績效評價標準
- 2024至2030年中國it外包服務行業(yè)市場深度分析及發(fā)展趨勢預測報告
- 工程項目計價結算付款情況統(tǒng)計表
- GB/T 20554-2024海帶
- 廣東廣州中醫(yī)藥大學第一附屬醫(yī)院招聘筆試真題2022
- ISO 15189醫(yī)學實驗室認可內(nèi)審員培訓試題附答案
評論
0/150
提交評論