




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)中心容災(zāi)備份方案概述概述當(dāng)今社會(huì),政府和企業(yè)利用計(jì)算機(jī)系統(tǒng)來提供及時(shí)可靠的信息和服務(wù)是必不可少的,另一方面,由于各種預(yù)見和不可預(yù)見的原因,計(jì)算機(jī)硬件和軟件都不可避免地會(huì)發(fā)生故障,導(dǎo)致不能及時(shí)的提供信息和服務(wù),甚至整個(gè)計(jì)算機(jī)系統(tǒng)的終止,網(wǎng)絡(luò)的癱瘓,等等,給政府和企業(yè)帶來極大的經(jīng)濟(jì)損失,影響政府、企業(yè)的形象。特別是數(shù)據(jù)庫數(shù)據(jù),一旦發(fā)生故障,引起數(shù)據(jù)丟失,不可恢復(fù)的話,將帶來嚴(yán)重后果。可見,對于這些政府部門和企業(yè),系統(tǒng)的容錯(cuò)性和不間斷性尤顯得重要。因此,必須采取適當(dāng)?shù)拇胧﹣泶_保計(jì)算機(jī)系統(tǒng)的容錯(cuò)性和不間斷性,以維護(hù)系統(tǒng)的高可用性和高安全性,最大可能減少由于各種故障造成的損失,提高政府和企業(yè)形象。數(shù)據(jù)備份是容災(zāi)的基礎(chǔ),是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失,而將全部或部分?jǐn)?shù)據(jù)集合從應(yīng)用主機(jī)的硬盤或陣列復(fù)制到其它的存儲(chǔ)介質(zhì)的過程。國家信息安全規(guī)范和政策進(jìn)入21世紀(jì),電子政務(wù)的建設(shè)已經(jīng)成為我國今后一個(gè)時(shí)期信息化工作的重點(diǎn),政府先行帶動(dòng)國民經(jīng)濟(jì)和社會(huì)發(fā)展信息化,同時(shí)加快政府職能的轉(zhuǎn)變,提高行政質(zhì)量和效率,增強(qiáng)政府監(jiān)管和服務(wù)能力,促進(jìn)社會(huì)監(jiān)督,實(shí)施信息化帶動(dòng)工業(yè)化的發(fā)展戰(zhàn)略,因此,電子政務(wù)意義重大,電子政務(wù)的信息安全更是重中之重,我國至今已發(fā)布一系列的文件對災(zāi)難備份建設(shè)進(jìn)行指導(dǎo)和監(jiān)督。⑴、2003年9月7日中共中央辦公廳、國務(wù)院辦公廳發(fā)出通知,轉(zhuǎn)發(fā)《國家信息化領(lǐng)導(dǎo)小組關(guān)于加強(qiáng)信息安全保障工作的意見》(簡稱中辦發(fā)[2003]27號文件),要求各地結(jié)合實(shí)際認(rèn)真貫徹落實(shí),各基礎(chǔ)信息網(wǎng)絡(luò)和重要信息系統(tǒng)建設(shè)要充分考慮抗毀性與災(zāi)難恢復(fù),并制定和不斷完善信息安全應(yīng)急處置預(yù)案?!秶倚畔⒒I(lǐng)導(dǎo)小組關(guān)于加強(qiáng)信息安全保障工作的意見》是為進(jìn)一步提高信息安全保障工作的能力和水平,維護(hù)公眾利益和國家安全,促進(jìn)信息化建設(shè)健康發(fā)展而提出的。⑵、2004年9月,國務(wù)院信息化辦公室專門下發(fā)了《關(guān)于做好國家重要信息系統(tǒng)災(zāi)難備份的通知》,要求在系統(tǒng)面臨自然災(zāi)害、網(wǎng)絡(luò)攻擊、恐怖活動(dòng)、戰(zhàn)爭行為、人為蓄意破壞以及大規(guī)模的設(shè)施故障等意想不到的災(zāi)難突發(fā)事件情況下,要提前做好災(zāi)難備份工作,提升系統(tǒng)災(zāi)難恢復(fù)能力,達(dá)到系統(tǒng)抗毀的有效性、重要數(shù)據(jù)保護(hù)的完整性和業(yè)務(wù)的連續(xù)性。通知明確強(qiáng)調(diào)“誰主管誰負(fù)責(zé)、誰運(yùn)營誰負(fù)責(zé)”,并特別指出了國家重點(diǎn)信息系統(tǒng)包括七大部門、三大信息基礎(chǔ)設(shè)施等,強(qiáng)調(diào)重點(diǎn)信息系統(tǒng)的建設(shè)及安全保障是直接關(guān)系到社會(huì)穩(wěn)定、國計(jì)民生等重大問題。⑶、為加強(qiáng)和規(guī)范重要信息系統(tǒng)的災(zāi)難恢復(fù)工作,2005年4月國務(wù)院信息化辦公室《重要信息系統(tǒng)\o"災(zāi)難恢復(fù)"災(zāi)難恢復(fù)指南》下發(fā)。《指南》主要從災(zāi)難恢復(fù)規(guī)劃的管理、災(zāi)難恢復(fù)的需求分析、災(zāi)難恢復(fù)等級的確定、災(zāi)難恢復(fù)等級的實(shí)現(xiàn)、災(zāi)難恢復(fù)預(yù)案的制訂、落實(shí)和管理等方面,對災(zāi)難恢復(fù)的規(guī)劃和準(zhǔn)備活動(dòng)的規(guī)范化要求進(jìn)行了全面的描述,規(guī)定了對重要信息系統(tǒng)的災(zāi)難恢復(fù)應(yīng)遵循的基本要求。《指南》還以規(guī)范性附錄的形式對災(zāi)難恢復(fù)的等級劃分進(jìn)行了描述,并以資料性附錄的形式對災(zāi)難恢復(fù)預(yù)案的框架進(jìn)行了說明,是我國第一個(gè)災(zāi)難備份指導(dǎo)性文件,對各個(gè)行業(yè)的災(zāi)難恢復(fù)計(jì)劃提出了明確的要求。它的出臺(tái)使得我國的災(zāi)難備份更加趨于規(guī)范和標(biāo)準(zhǔn),對于完善中國災(zāi)難備份市場具有深遠(yuǎn)的意義。⑷、2006年5月,中辦下發(fā)的《國家信息化領(lǐng)導(dǎo)小組關(guān)于推進(jìn)國家電子政務(wù)網(wǎng)絡(luò)建設(shè)的意見》(簡稱中辦發(fā)[2006]18號文件)中,將保障國家電子政務(wù)網(wǎng)絡(luò)和信息安全,作為電子政務(wù)建設(shè)的四項(xiàng)重要任務(wù)之一。⑸、2007年7月,國務(wù)院信息化工作辦公室領(lǐng)導(dǎo)編制的《重要信息系統(tǒng)災(zāi)難恢復(fù)指南》正式升級成為國家標(biāo)準(zhǔn)《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(GB/T20988-2007)。這是中國災(zāi)難備份與恢復(fù)行業(yè)的第一個(gè)國家標(biāo)準(zhǔn),并于2007年11月1日開始正式實(shí)施?!缎畔⑾到y(tǒng)災(zāi)難恢復(fù)規(guī)范》規(guī)定了信息系統(tǒng)災(zāi)難恢復(fù)應(yīng)遵循的基本要求,適用于信息系統(tǒng)災(zāi)難恢復(fù)的規(guī)劃、審批、實(shí)施和管理?!兑?guī)范》具體對災(zāi)難恢復(fù)行業(yè)相應(yīng)的術(shù)語和定義、災(zāi)難恢復(fù)概述(包括災(zāi)難恢復(fù)的工作范圍、災(zāi)難恢復(fù)的組織機(jī)構(gòu)、災(zāi)難恢復(fù)的規(guī)劃管理、災(zāi)難恢復(fù)的外部協(xié)作、災(zāi)難恢復(fù)的審計(jì)和備案)、災(zāi)難恢復(fù)需求的確定(包括風(fēng)險(xiǎn)分析、業(yè)務(wù)影響分析、確定災(zāi)難恢復(fù)目標(biāo))、災(zāi)難恢復(fù)策略的制定(包括災(zāi)難恢復(fù)策略制定的要素、災(zāi)難恢復(fù)資源的獲取方式、災(zāi)難恢復(fù)資源的要求)和災(zāi)難恢復(fù)策略的實(shí)現(xiàn)(包括災(zāi)難備份系統(tǒng)計(jì)數(shù)方案的實(shí)現(xiàn)、災(zāi)難備份中心的選擇和建設(shè)、專業(yè)技術(shù)支持能力的實(shí)現(xiàn)、運(yùn)行維護(hù)管理能力的實(shí)現(xiàn)、災(zāi)難恢復(fù)預(yù)案的實(shí)現(xiàn))等內(nèi)容作了具體描述。同時(shí),在《規(guī)范》附錄A對災(zāi)難恢復(fù)能力作了等級劃分(共6級:第1級基本支持,第2級備用場地支持,第3級電子傳輸和部分設(shè)備支持,第4級電子傳輸及完整設(shè)備支持,第5級實(shí)時(shí)數(shù)據(jù)傳輸及完整設(shè)備支持,第6級數(shù)據(jù)零丟失和遠(yuǎn)程集群支持);附錄A對災(zāi)難恢復(fù)能力等級評定原則、災(zāi)難備份中心的等級等也作了規(guī)范要求。附錄B對災(zāi)難恢復(fù)預(yù)案框架、附錄C對相應(yīng)行業(yè)RTO/RPO與災(zāi)難恢復(fù)能力等級的關(guān)系比例作了規(guī)范要求。信息系統(tǒng)災(zāi)難恢復(fù)能力等級與恢復(fù)時(shí)間目標(biāo)(RTO)和恢復(fù)點(diǎn)目標(biāo)(RPO)具有一定的對應(yīng)關(guān)系,各行業(yè)可根據(jù)行業(yè)特點(diǎn)和信息技術(shù)的應(yīng)用情況制定相應(yīng)的災(zāi)難恢復(fù)能力等級要求和指標(biāo)體系。總之,災(zāi)難備份作為信息安全的最后一道防線,已經(jīng)得到電子政務(wù)主管信息部門的高度重視。災(zāi)備建設(shè)目標(biāo)《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(2007年7月國務(wù)院信息化辦公室發(fā)布的國家標(biāo)準(zhǔn)GB/T20988-2007《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》)已經(jīng)給需要做災(zāi)備的企事業(yè)單位一個(gè)明確的方向和思路。在災(zāi)備建設(shè)中需遵循三步七要素,三步即新建物理災(zāi)備中心、完成兩個(gè)數(shù)據(jù)中心同步以及后期運(yùn)維體系及決策,其覆蓋了建設(shè)災(zāi)備系統(tǒng)所包含的七要素:備用基礎(chǔ)設(shè)施、備用網(wǎng)絡(luò)、數(shù)據(jù)備份系統(tǒng)、備用數(shù)據(jù)、技術(shù)支持、運(yùn)行維護(hù)管理、災(zāi)難恢復(fù)預(yù)案。兩者之間的關(guān)系如圖所示:備用網(wǎng)絡(luò)技術(shù)支持備用網(wǎng)絡(luò)技術(shù)支持備用數(shù)據(jù)處理系統(tǒng)災(zāi)難恢復(fù)預(yù)案數(shù)據(jù)備份系統(tǒng)備用基礎(chǔ)設(shè)施2.兩個(gè)數(shù)據(jù)中心同步3.運(yùn)維體系及決策1.新建物理災(zāi)備中心災(zāi)備建設(shè)三步曲運(yùn)行維護(hù)管理災(zāi)備災(zāi)備建設(shè)是以“恢復(fù)”為目標(biāo),“備份”是手段。不同的業(yè)務(wù)系統(tǒng),存在不同的安全需求、不同的保護(hù)等級,因此需要選取不同的災(zāi)備模式、不同的災(zāi)備標(biāo)準(zhǔn),完善并實(shí)現(xiàn)各系統(tǒng)的災(zāi)難恢復(fù)。經(jīng)過分析,災(zāi)備建設(shè)需要考慮的重點(diǎn)如下:災(zāi)備模式災(zāi)備類型不同,應(yīng)對的策略也不盡相同。對于IT系統(tǒng)災(zāi)難和人為災(zāi)難,可以在本地?cái)?shù)據(jù)中心或同城災(zāi)備中心完成災(zāi)難恢復(fù);而對于自然災(zāi)害、社會(huì)災(zāi)難,則需要通過異地災(zāi)備系統(tǒng),對業(yè)務(wù)運(yùn)營進(jìn)行保障。比較典型的方式是“兩地三中心”,即設(shè)立主生產(chǎn)中心、同城災(zāi)備中心和異地災(zāi)備中心。建立異地災(zāi)備中心的優(yōu)勢在于它具有強(qiáng)大的跨地域?yàn)?zāi)難抗御能力,能夠有效防止物理設(shè)備損傷所產(chǎn)生的災(zāi)難后果,同時(shí)實(shí)時(shí)數(shù)據(jù)復(fù)制提供強(qiáng)大的數(shù)據(jù)交換能力。由于信息系統(tǒng)應(yīng)用規(guī)模越來越龐大,同單位跨廣域會(huì)有多個(gè)數(shù)據(jù)中心,如果單獨(dú)建立一對一的災(zāi)備,在投入成本、管理、維護(hù)上顯然存在極大難度。因此多對一的運(yùn)營級災(zāi)備系統(tǒng)成為了災(zāi)備領(lǐng)域發(fā)展的重要趨勢之一,目前在國內(nèi)已有多個(gè)成功實(shí)踐案例,也成為后續(xù)災(zāi)備領(lǐng)域的新興關(guān)注重點(diǎn)。災(zāi)備等級災(zāi)難恢復(fù)等級的確定是信息系統(tǒng)災(zāi)備建設(shè)的重要考慮因素。《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》將災(zāi)難恢復(fù)能力劃分為6級,災(zāi)難恢復(fù)能力等級越高,對信息系統(tǒng)的保護(hù)效果越好,但同時(shí)成本也會(huì)急劇上升。因此,需要根據(jù)成本風(fēng)險(xiǎn)平衡原則(即災(zāi)難恢復(fù)資源的成本與風(fēng)險(xiǎn)可能造成的損失之間取得平衡),確定業(yè)務(wù)系統(tǒng)合理的災(zāi)難恢復(fù)能力等級。對于多個(gè)業(yè)務(wù)系統(tǒng),不同業(yè)務(wù)可采用不同的災(zāi)難恢復(fù)策略。災(zāi)難本身是個(gè)小概率事件,但影響卻是巨大的,提高投資回報(bào)率是必須考慮的重點(diǎn)。因此,災(zāi)難恢復(fù)等級的確定是信息系統(tǒng)災(zāi)備建設(shè)的重要考慮因素。災(zāi)備等級主要從RTO(恢復(fù)時(shí)間目標(biāo))和RPO(恢復(fù)點(diǎn)目標(biāo))來考慮,需要對業(yè)務(wù)和數(shù)據(jù)進(jìn)行重要性評估和分級,以確定相應(yīng)的RPO和RTO目標(biāo)。對于多業(yè)務(wù)系統(tǒng)要按需劃分災(zāi)備等級,災(zāi)備等級應(yīng)與業(yè)務(wù)和數(shù)據(jù)的重要程度相匹配。確定級別后,需要調(diào)研IT應(yīng)用環(huán)境,確定合適的災(zāi)備技術(shù),并檢查災(zāi)備建設(shè)成本是否符合預(yù)算并作相應(yīng)調(diào)整,最終達(dá)到保護(hù)等級與成本投資的平衡點(diǎn),獲得最高的投資回報(bào)率。根據(jù)對數(shù)據(jù)業(yè)務(wù)恢復(fù)的RPO和RTO的不同要求,災(zāi)備業(yè)務(wù)建設(shè)一般可分為:應(yīng)用級災(zāi)備、數(shù)據(jù)級災(zāi)備和備份級災(zāi)備。保護(hù)等級越高,成本會(huì)呈級數(shù)增長。沒有任何一種技術(shù)或方法能適應(yīng)所有業(yè)務(wù)的災(zāi)難備份需求,最好的解決方案是采用不同等級災(zāi)難備份與恢復(fù)的組合,實(shí)現(xiàn)最大業(yè)務(wù)范圍的災(zāi)難恢復(fù)和最少的成本投入。項(xiàng)目總體需求分析系統(tǒng)現(xiàn)狀描述系統(tǒng)及業(yè)務(wù)環(huán)境中復(fù)連眾自2010年大力實(shí)施信息化建設(shè)以來,硬件基礎(chǔ)環(huán)境、系統(tǒng)環(huán)境以及網(wǎng)絡(luò)環(huán)境都獲得了很大的改善。目前中復(fù)連眾主要使用兩個(gè)大的信息化系統(tǒng):SAPERP系統(tǒng)以及dominoOA系統(tǒng)。ERP系統(tǒng)經(jīng)過兩年多的運(yùn)行,目前數(shù)據(jù)量達(dá)到199996.12M,年數(shù)據(jù)增量約為37G,OA系統(tǒng)年度增長量為60G。OA系統(tǒng)的上線期(2013.01)初數(shù)據(jù)量為:郵件數(shù)據(jù)為42.9G,系統(tǒng)數(shù)據(jù)為2.23G。OA系統(tǒng)的當(dāng)前(2014.04)數(shù)據(jù)量為:郵件數(shù)據(jù)為83.5G,系統(tǒng)數(shù)據(jù)為22.7G,合同評審附件5GTOMCAT服務(wù)器60M。中復(fù)連眾數(shù)據(jù)全部集中存儲(chǔ)在宋跳廠區(qū)科研樓2樓機(jī)房內(nèi),通過EMCCX4-240實(shí)現(xiàn)數(shù)據(jù)的集中存儲(chǔ)。目前使用的備份軟件系統(tǒng)是IBMTivoli,備份磁帶庫是IBMTS3100,備份服務(wù)器是IBM3650。此次項(xiàng)目中復(fù)連眾有限制的服務(wù)器設(shè)備IBMP560一臺(tái),性能能夠滿足SAP系統(tǒng)的需求。數(shù)據(jù)備份窗口由中復(fù)連眾工程師近期的檢測發(fā)現(xiàn),當(dāng)前數(shù)據(jù)備份窗口時(shí)間已經(jīng)由一年前的5點(diǎn)左右結(jié)束,2-3小時(shí)的運(yùn)行時(shí)間,推遲到了現(xiàn)在的8點(diǎn)54分,已經(jīng)延生至現(xiàn)在的上班工作時(shí)間,嚴(yán)重影響了系統(tǒng)日常的運(yùn)作以及備份安全性,占用了大量的系統(tǒng)資源。圖1.備份日志圖2.備份明細(xì)現(xiàn)有拓?fù)浣Y(jié)構(gòu)圖3.中復(fù)連眾網(wǎng)絡(luò)拓?fù)鋱D圖4.中復(fù)連眾數(shù)據(jù)中心網(wǎng)絡(luò)現(xiàn)狀系統(tǒng)需求描述服務(wù)器更新隨著業(yè)務(wù)的增長,為了保證SAP服務(wù)器的運(yùn)行流暢,對現(xiàn)有兩臺(tái)IBMP550小機(jī)進(jìn)行升級、更新。數(shù)據(jù)遷移服務(wù)器升級隨之而來的業(yè)務(wù)及相關(guān)數(shù)據(jù)移動(dòng)工作,以保證新購服務(wù)器正常應(yīng)用。數(shù)據(jù)級備份從數(shù)據(jù)安全角度分析,數(shù)據(jù)作為信息架構(gòu)的核心,IT支撐系統(tǒng)在給中復(fù)連眾內(nèi)外部用戶提供便利服務(wù)的同時(shí),其業(yè)務(wù)運(yùn)行也更加依賴于信息化系統(tǒng)的穩(wěn)定運(yùn)行,其結(jié)果是,一旦發(fā)生IT系統(tǒng)停止運(yùn)行,那么關(guān)鍵業(yè)務(wù)系統(tǒng)將受到嚴(yán)重影響,用戶信息、業(yè)務(wù)記錄等也隨之丟失,特別因?yàn)樗疄?zāi)、火災(zāi)、地震等小概率自然災(zāi)害一旦到來,帶來的損失是具有毀滅性,即使在本地有多份數(shù)據(jù),都可能同時(shí)丟失。因此,小至一般性的硬件故障,大到區(qū)域性的自然災(zāi)害,從物理的設(shè)備不可用,到邏輯的人為失誤和破壞,都可能造成整個(gè)信息系統(tǒng)的全面癱瘓,導(dǎo)致業(yè)務(wù)運(yùn)營的停頓。為防患未然,現(xiàn)有SAP及OA數(shù)據(jù)需在大浦?jǐn)?shù)據(jù)中心放置副本。對應(yīng)連云港中復(fù)連眾的數(shù)據(jù)安全要求是嚴(yán)格的,如何將RPO降到最低,這就需要一套完整的數(shù)據(jù)備份方案,當(dāng)出現(xiàn)任何軟、硬件故障的情況下,迅速的將備份走的數(shù)據(jù)恢復(fù)出來,保證數(shù)據(jù)的正常使用。為了提高數(shù)據(jù)的安全級別中復(fù)連眾在分廠區(qū)(沈陽、大浦)也進(jìn)行數(shù)據(jù)的安全保存,需要解決方案有對異地?cái)?shù)據(jù)備份的高效、安全的支持能力。應(yīng)用級容災(zāi)在災(zāi)難備份與恢復(fù)行業(yè)國家標(biāo)準(zhǔn)《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》中,將信息系統(tǒng)的災(zāi)難恢復(fù)能力劃分為了6級,明確了RTO/RPO與災(zāi)難恢復(fù)能力等級的關(guān)系,在最高級(第6級)中要求RPO=0,RTO趨于0。從業(yè)務(wù)連續(xù)性角度分析,企業(yè)日常的辦公、財(cái)務(wù)、等核心系統(tǒng)均部署在服務(wù)器中,一旦現(xiàn)有的后端存儲(chǔ)系統(tǒng)出現(xiàn)硬件故障,前端業(yè)務(wù)將立即中斷,并且,隨著現(xiàn)有存儲(chǔ)系統(tǒng)使用年限的增加,故障率越來越高,用戶面對著可能隨時(shí)業(yè)務(wù)中斷的風(fēng)險(xiǎn)也越大,要求前端業(yè)務(wù)系統(tǒng)提供7*24小時(shí)的高可用性服務(wù),業(yè)務(wù)運(yùn)行不允許中斷,系統(tǒng)一旦停機(jī)會(huì)給企業(yè)造成巨大的損失。中復(fù)連眾的核心業(yè)務(wù)SAP和OA都是不允許存在中斷的風(fēng)險(xiǎn),目前雖然做了主機(jī)的高可用,但是仍然存在單點(diǎn)的故障,當(dāng)目前的EMC存儲(chǔ)設(shè)備出現(xiàn)故障將會(huì)影響兩大業(yè)務(wù)系統(tǒng)的運(yùn)行?;蛘弋?dāng)機(jī)房出現(xiàn)斷電、物理故障,可以在異地迅速的接管正常的核心業(yè)務(wù)系統(tǒng)。為業(yè)務(wù)連續(xù)性考慮,在大浦新建一個(gè)容災(zāi)機(jī)房,以滿足SAP及OA的災(zāi)難性事情發(fā)生時(shí)切換,以保證業(yè)務(wù)的24小時(shí)不間斷。高性能存儲(chǔ)考慮到SAP服務(wù)器更新、容災(zāi)中心數(shù)據(jù)備份及應(yīng)用級容災(zāi)考慮,需新加存儲(chǔ),其存儲(chǔ)空間能滿足五年的數(shù)據(jù)增長。從SAP、OA系統(tǒng)的性能需求角度分析,按照前端業(yè)務(wù)特點(diǎn)和數(shù)據(jù)類型,可大致分為兩類:服務(wù)器虛擬化,數(shù)據(jù)庫服務(wù)。主機(jī)虛擬化業(yè)務(wù)訪問存儲(chǔ)系統(tǒng)的特點(diǎn):(1)隨機(jī)性,虛擬機(jī)運(yùn)行的業(yè)務(wù)類型多樣,I/O絕大部分為隨機(jī)I/O。(2)突發(fā)性,可能同一時(shí)間訪問量很大,特別是上千個(gè)虛擬桌面同時(shí)啟動(dòng)帶來的“啟動(dòng)風(fēng)暴(即當(dāng)大量的用戶同時(shí)登錄系統(tǒng)時(shí)所造成的系統(tǒng)反應(yīng)非常緩慢,桌面啟動(dòng)時(shí)間長)”問題或前端部署了大規(guī)模應(yīng)用,同時(shí)并發(fā)訪問。(3)靈活性,虛擬機(jī)部署在不斷調(diào)整(虛擬機(jī)優(yōu)勢)。數(shù)據(jù)庫服務(wù)業(yè)務(wù)訪問存儲(chǔ)系統(tǒng)的特點(diǎn):(1)安全性,保證數(shù)據(jù)不能丟失。(2)穩(wěn)定性,業(yè)務(wù)不可中斷性。(3)性能要求高,特別是IOPS的要求,小文件隨機(jī)讀寫為主。服務(wù)器及服務(wù)器端業(yè)務(wù)一方面將產(chǎn)生的數(shù)據(jù)寫到存儲(chǔ),另一方面從存儲(chǔ)設(shè)備上讀取所需數(shù)據(jù),特別是現(xiàn)有數(shù)據(jù)庫及虛擬化業(yè)務(wù)對隨機(jī)讀寫數(shù)據(jù)、小數(shù)據(jù)塊讀寫,對存儲(chǔ)緩存要求更高,面對業(yè)務(wù)密集型應(yīng)用,更容易產(chǎn)生突發(fā)的數(shù)據(jù)沖擊,服務(wù)器及業(yè)務(wù)量越多,讀寫數(shù)據(jù)就越多,對存儲(chǔ)設(shè)備的IOPS要求就越高,因此需要更高的緩存來處理;一般的,服務(wù)器的緩存越大,代表著其處理性能越強(qiáng),對后端存儲(chǔ)要求更高,需要存儲(chǔ)配置相應(yīng)緩存,提升存儲(chǔ)的整體性能,滿足前端業(yè)務(wù)IO訪問需求。網(wǎng)絡(luò)加速針對IP連接大浦,且為2M帶寬,為保證應(yīng)用級容災(zāi)同步問題,以解決帶寬不足帶來的風(fēng)險(xiǎn)。復(fù)雜型需求中復(fù)連眾的現(xiàn)實(shí)環(huán)境較為復(fù)雜,數(shù)據(jù)保護(hù)復(fù)雜性是比較高的。一切圍繞著RPO和RTO這兩個(gè)重要的指標(biāo)外,還需要考慮到諸多因素。統(tǒng)一性管理:現(xiàn)狀的復(fù)雜環(huán)境,勢必需要有一個(gè)統(tǒng)一的數(shù)據(jù)保護(hù)平臺(tái),利于對所有數(shù)據(jù)的管理,減少IT部門的人力投入。數(shù)據(jù)備份代理類型:中復(fù)連眾采用的系統(tǒng)平臺(tái)和數(shù)據(jù)庫都多樣化,數(shù)據(jù)結(jié)構(gòu)也是復(fù)雜的,如何在統(tǒng)一的保護(hù)平臺(tái)中對各種數(shù)據(jù)庫和結(jié)構(gòu)有針對性的備份,對數(shù)據(jù)備份平臺(tái)的技術(shù)支持范圍有較高的要求。靈活的備份手段和機(jī)制:數(shù)據(jù)備份的目的是保護(hù)數(shù)據(jù)業(yè)務(wù),而不能對業(yè)務(wù)運(yùn)行產(chǎn)生影響,要為備份作業(yè)提供靈活的控制,需要為統(tǒng)一數(shù)據(jù)保護(hù)平臺(tái)提供靈活的的備份手段和機(jī)制?;謴?fù)流程:當(dāng)數(shù)據(jù)出現(xiàn)故障的情況下,能高效快速的自動(dòng)恢復(fù),是對RTO要求的直接反應(yīng)。報(bào)表提供:對于統(tǒng)一的數(shù)據(jù)保護(hù)平臺(tái),提供相應(yīng)的數(shù)據(jù)和介質(zhì)設(shè)備、備份資源狀態(tài)、恢復(fù)操作等匯總信息,利于信息管理人員進(jìn)行統(tǒng)計(jì)和審核工作。監(jiān)控能力:因?yàn)闃I(yè)務(wù)是時(shí)時(shí)刻刻進(jìn)行的,所以必須要有時(shí)時(shí)觀測業(yè)務(wù)環(huán)境的可視化控制臺(tái),讓所有的操作和業(yè)務(wù)運(yùn)行狀態(tài)得到自動(dòng)和手動(dòng)的監(jiān)控管理。結(jié)合中復(fù)連眾每個(gè)業(yè)務(wù)應(yīng)用的具體RPO和RTO需求,和復(fù)雜環(huán)境下各種參數(shù)需求,聯(lián)成科技提供以下整體的系統(tǒng)保護(hù)解決方案,力保當(dāng)出現(xiàn)系統(tǒng)故障時(shí)候,迅速的得到恢復(fù),保證業(yè)務(wù)服務(wù)的正常運(yùn)行。項(xiàng)目總體建設(shè)目標(biāo)及建設(shè)原則系統(tǒng)建設(shè)目標(biāo)按照統(tǒng)一規(guī)劃、統(tǒng)一管理、分步實(shí)施的建設(shè)思路,中復(fù)連眾單位數(shù)據(jù)處理中心規(guī)劃在優(yōu)化本地的數(shù)據(jù)集中存儲(chǔ)和備份的前提下,同時(shí)利用現(xiàn)有的廣域網(wǎng)網(wǎng)絡(luò)環(huán)境,在不影響現(xiàn)有業(yè)務(wù)應(yīng)用的條件下,為中復(fù)連眾單位業(yè)務(wù)系統(tǒng)建立完備的異地?cái)?shù)據(jù)及生產(chǎn)應(yīng)用容災(zāi)系統(tǒng)??傮w上,此次備份容災(zāi)系統(tǒng)的建設(shè)將至少達(dá)到如下目標(biāo):高性能雙活存儲(chǔ)系統(tǒng)實(shí)現(xiàn)高性能數(shù)據(jù)集中存儲(chǔ)、有效保護(hù),實(shí)現(xiàn)基于SAN網(wǎng)絡(luò)層的數(shù)據(jù)鏡像,數(shù)據(jù)中心兩套主存儲(chǔ)實(shí)現(xiàn)雙活和存儲(chǔ)虛擬化;本地存儲(chǔ)故障時(shí),要求實(shí)現(xiàn)數(shù)據(jù)無丟失、應(yīng)用不中斷,即RPO=0、RTO=0;實(shí)現(xiàn)OA/MAIL等應(yīng)用系統(tǒng)虛擬化集群及容災(zāi),容災(zāi)級別必須達(dá)到GB20988-2007-T信息安全技術(shù)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范,所規(guī)定的三級容災(zāi)級別,和三級容災(zāi)中心建設(shè)。備份容災(zāi)系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)中心存儲(chǔ)內(nèi)的數(shù)據(jù)基于現(xiàn)有網(wǎng)絡(luò)線路的遠(yuǎn)程備份,以最小的帶寬代價(jià)實(shí)現(xiàn)數(shù)據(jù)備份;在主數(shù)據(jù)中心大浦的存儲(chǔ)和遠(yuǎn)程容災(zāi)存儲(chǔ)之間實(shí)現(xiàn)基于磁盤陣列的數(shù)據(jù)塊層次的數(shù)據(jù)復(fù)制,可以定制符合現(xiàn)有IP網(wǎng)絡(luò)環(huán)境的復(fù)制策略,以最小的網(wǎng)絡(luò)帶寬代價(jià)實(shí)現(xiàn)快速的數(shù)據(jù)恢復(fù)或業(yè)務(wù)切換;持續(xù)數(shù)據(jù)恢復(fù)功能連續(xù)數(shù)據(jù)保護(hù)系統(tǒng)(CDP),采用“帶外”基于網(wǎng)絡(luò)的應(yīng)用裝置,不在主機(jī)到存儲(chǔ)的主I/O路徑中。實(shí)時(shí)對寫I/O監(jiān)控和復(fù)制保護(hù),不影響主機(jī)性能。要求提供原廠商彩頁證明和原廠商官方網(wǎng)站證明??梢詫?shí)現(xiàn)對物理和數(shù)據(jù)邏輯故障的恢復(fù),邏輯故障包括:數(shù)據(jù)庫邏輯錯(cuò)誤、人為誤操作和病毒等引起的數(shù)據(jù)庫數(shù)據(jù)丟失、人為或病毒引起的數(shù)據(jù)庫崩潰等故障。提供一致性組功能,可以將某個(gè)特定應(yīng)用程序的所有LUN綁定到一個(gè)一致性組中,以確保事務(wù)向以前時(shí)間點(diǎn)的回滾同時(shí)進(jìn)行,從而確保應(yīng)用程序的一致恢復(fù)。項(xiàng)目建設(shè)原則為了全面保證各單位數(shù)據(jù)中心建設(shè)目標(biāo),在數(shù)據(jù)中心存儲(chǔ)系統(tǒng)規(guī)劃、建設(shè)、實(shí)施、運(yùn)行和完善的過程中,必須應(yīng)遵循以下建設(shè)原則:(1)開放性:系統(tǒng)符合開放性設(shè)計(jì)原則,具備優(yōu)良的可擴(kuò)展性、可升級性,可以支持開放系統(tǒng)平臺(tái),運(yùn)行于現(xiàn)有的技術(shù)標(biāo)準(zhǔn)之上;(2)兼容性:與現(xiàn)有系統(tǒng)需要完全兼容,各個(gè)構(gòu)成子系統(tǒng)必須緊密銜接、高度集成,構(gòu)成一個(gè)整體;(3)穩(wěn)定性:要保證系統(tǒng)運(yùn)行的穩(wěn)定性,使系統(tǒng)運(yùn)行風(fēng)險(xiǎn)降至最低;(4)技術(shù)先進(jìn)性:系統(tǒng)設(shè)計(jì)應(yīng)采用當(dāng)前先進(jìn)而成熟的技術(shù),不僅可以滿足本期工程的需求,也應(yīng)把握未來的發(fā)展方向。(5)可擴(kuò)充性:在系統(tǒng)設(shè)計(jì)時(shí)應(yīng)充分考慮可擴(kuò)充性,從而確保新功能、新業(yè)務(wù)的增加在原有的系統(tǒng)平臺(tái)上擴(kuò)展和實(shí)現(xiàn)。(6)高可靠性:系統(tǒng)平臺(tái)具有高可靠性,支持服務(wù)器平臺(tái)的高可用性集群技術(shù);具備先進(jìn)的容災(zāi)的設(shè)計(jì);充分保證系統(tǒng)的高擴(kuò)展能力和高容錯(cuò)能力,具有通道負(fù)載自動(dòng)均衡能力和存儲(chǔ)系統(tǒng)性能調(diào)節(jié)能力,提供極為充分的可靠性各項(xiàng)指標(biāo)設(shè)計(jì)。(7)高可用性:在不停機(jī)情況下,實(shí)現(xiàn)不停機(jī)擴(kuò)容、維護(hù)、升級等服務(wù),提高性能以滿足新的業(yè)務(wù)需求。具備7×24×365連續(xù)工作的能力,系統(tǒng)的可用性應(yīng)大于99.999%。在自動(dòng)化管理軟件支持下可以實(shí)現(xiàn)磁盤數(shù)據(jù)的在線(不停機(jī))備份。(8)成熟性:應(yīng)盡量選用經(jīng)過大量運(yùn)用、成熟可靠的系統(tǒng)。(9)可實(shí)施性:選用成熟的技術(shù),成熟的案例經(jīng)驗(yàn)和設(shè)計(jì)方案,制定詳細(xì)的技術(shù)實(shí)施方案。(10)經(jīng)濟(jì)性原則:在滿足所有需求的前提下,選擇最合適的設(shè)備及管理軟件,使系統(tǒng)具有較好的性價(jià)比。(11)充分保護(hù)用戶現(xiàn)有投資:采用先進(jìn)技術(shù),將現(xiàn)有存儲(chǔ)系統(tǒng)無縫的整合在新系統(tǒng)中,實(shí)現(xiàn)對用戶現(xiàn)有設(shè)備的有效利用,達(dá)到保護(hù)用戶現(xiàn)有投資的目標(biāo)。項(xiàng)目總體方案設(shè)計(jì)及技術(shù)說明項(xiàng)目總體規(guī)劃方案設(shè)計(jì)針對以上項(xiàng)目建設(shè)目標(biāo),本次推薦采用以下高性能雙活數(shù)據(jù)中心容災(zāi)備份解決方案。在宋跳機(jī)房新增兩臺(tái)對稱雙活存儲(chǔ)系統(tǒng)MS3100替換原有存儲(chǔ)CX4-240,將原存儲(chǔ)上的數(shù)據(jù)遷移至新存儲(chǔ)MS3100,通過配置大容量緩存提升MS3100整體性能,提供高效數(shù)據(jù)支撐能力,同時(shí),確保當(dāng)主存儲(chǔ)系統(tǒng)MS3100出現(xiàn)故障時(shí),前端SAP及OA等所有業(yè)務(wù)系統(tǒng)可自動(dòng)切換到鏡像存儲(chǔ)MS3100上,最大限度減少數(shù)據(jù)的丟失量(包括RPO=0),最快速度的恢復(fù)關(guān)鍵應(yīng)用系統(tǒng)(RTO=0),提高信息系統(tǒng)的整體服務(wù)級別。針對原有CX4-240存儲(chǔ)的利舊,新增一臺(tái)宏杉科技存儲(chǔ)虛擬化CDP網(wǎng)關(guān)VS2100,可繼續(xù)對老存儲(chǔ)的空間與新增存儲(chǔ)資源進(jìn)行統(tǒng)一管理,并且,實(shí)現(xiàn)將主存儲(chǔ)生產(chǎn)數(shù)據(jù)持續(xù)保護(hù)到原有存儲(chǔ)CX4-240上,應(yīng)對實(shí)時(shí)的邏輯故障,做到基于IO級的數(shù)據(jù)恢復(fù)。新增一臺(tái)賽門鐵克備份一體機(jī)NBU3250,將主存儲(chǔ)數(shù)據(jù)實(shí)現(xiàn)基于多種豐富備份策略的近線備份,再與原有磁帶庫實(shí)現(xiàn)D2D2T備份,做到多重?cái)?shù)據(jù)保護(hù)。在異地遠(yuǎn)程災(zāi)備中心大浦機(jī)房配置一套MS2520i作為災(zāi)備系統(tǒng),通過在存儲(chǔ)底層的復(fù)制容災(zāi)軟件,將宋跳主存儲(chǔ)MS3100上的數(shù)據(jù)災(zāi)備到大浦,一旦宋跳數(shù)據(jù)中心兩臺(tái)存儲(chǔ)系統(tǒng)的數(shù)據(jù)均丟失,在異地留有一份數(shù)據(jù)副本,進(jìn)一步提高數(shù)據(jù)安全。原有的OA系統(tǒng)等業(yè)務(wù)系統(tǒng),通過部署VMware服務(wù)器虛擬化環(huán)境,兩臺(tái)IBMX3850服務(wù)器上各創(chuàng)建5個(gè)左右虛擬機(jī),將應(yīng)用部署在虛擬機(jī)上,并且,VMware可創(chuàng)建集群、支持虛擬機(jī)遷移等多種高級VMotion功能,提高應(yīng)用安全。項(xiàng)目總體方案拓?fù)鋱D圖5.方案總體系統(tǒng)架構(gòu)拓?fù)鋱D雙活存儲(chǔ)系統(tǒng)方案說明根據(jù)業(yè)務(wù)系統(tǒng)的存儲(chǔ)特點(diǎn),以及7*24小時(shí)不間斷業(yè)務(wù)系統(tǒng)的需求,搭建一個(gè)高安全、高性能、高可用、擴(kuò)展靈活、管理簡單的統(tǒng)一存儲(chǔ)平臺(tái),從而前端數(shù)據(jù)的集中整合,提升系統(tǒng)連續(xù)性和數(shù)據(jù)安全性,降低管理維護(hù)成本,實(shí)現(xiàn)投資保護(hù)。同時(shí)通過基于存儲(chǔ)底層的本地雙活技術(shù)SDAS實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)同步,前后端均配置多路徑冗余鏈路,當(dāng)主存儲(chǔ)發(fā)生故障時(shí),鏡像存儲(chǔ)可自動(dòng)接管前端業(yè)務(wù)系統(tǒng),RTO、RPO均為0。方案描述針對以上對業(yè)務(wù)RPO、RTO均為0的業(yè)務(wù)連續(xù)性需求,宏杉科技推薦采用以下雙活存儲(chǔ)解決方案。新增兩臺(tái)存儲(chǔ)系統(tǒng)MS3300,采用對稱配置方式,兩臺(tái)存儲(chǔ)之間完成數(shù)據(jù)的實(shí)時(shí)同步,一旦當(dāng)主存儲(chǔ)系統(tǒng)MS3300出現(xiàn)故障時(shí),鏡像存儲(chǔ)系統(tǒng)MS3300可自動(dòng)將前端業(yè)務(wù)切換過來,最大限度減少數(shù)據(jù)的丟失量(包括RPO=0),以最快速度在數(shù)據(jù)中心恢復(fù)關(guān)鍵應(yīng)用系統(tǒng)(RTO=0),提高業(yè)務(wù)系統(tǒng)的整體服務(wù)級別和業(yè)務(wù)連續(xù)性。存儲(chǔ)引擎A:新增一臺(tái)在線高性能存儲(chǔ)MS3300:針對目前本項(xiàng)目的各業(yè)務(wù)系統(tǒng)對存儲(chǔ)性能的需求,我們建議新增一套宏杉科技自主研發(fā)的MacroSANMS3300存儲(chǔ)產(chǎn)品用于存放各在線應(yīng)用系統(tǒng)基礎(chǔ)數(shù)據(jù),用于承載前端核心業(yè)務(wù)等:配置雙冗余控制器支持Active/Active負(fù)載均衡;同時(shí)配置SAN、NAS功能;此次配置32GB緩存,提高存儲(chǔ)的整體性能,滿足數(shù)據(jù)庫及虛擬化業(yè)務(wù)的IO讀寫性能需求;8個(gè)8GbFC主機(jī)接口,10個(gè)萬兆IP主機(jī)接口用于做兩臺(tái)存儲(chǔ)之間數(shù)據(jù)鏡像交叉直連。配置13塊10000轉(zhuǎn)600GB企業(yè)級SAS硬盤,12塊2TB7200轉(zhuǎn)企業(yè)級SAS硬盤,總?cè)萘繛?1TB。配置基于磁盤陣列底層的數(shù)據(jù)雙活功能SDAS軟件,完成數(shù)據(jù)中心A與數(shù)據(jù)中心B之間兩臺(tái)存儲(chǔ)引擎數(shù)據(jù)實(shí)時(shí)同步,一旦存儲(chǔ)引擎節(jié)點(diǎn)A故障,引擎節(jié)點(diǎn)B存儲(chǔ)可自動(dòng)將前端業(yè)務(wù)系統(tǒng)進(jìn)行接管,無需人為干預(yù),數(shù)據(jù)零丟失,RTO、RPO均為0,并且,前端無需配置任何第三方軟、硬件,部署簡單,屏蔽了前端主機(jī)物理特性及應(yīng)用類型特性(適用于所有應(yīng)用);存儲(chǔ)引擎B:新增一臺(tái)鏡像存儲(chǔ)MS3300。本次雙活數(shù)據(jù)中心平臺(tái)搭建,要求鏡像存儲(chǔ)與主存儲(chǔ)配置完全一致,保障系統(tǒng)可實(shí)現(xiàn)自動(dòng)切換且兩套系統(tǒng)無任何性能、容量等差異,切換過程中,前端用戶體驗(yàn)無任何變化感知,RTO、RPO均為0,達(dá)到應(yīng)用級容災(zāi)。雙活存儲(chǔ)工作機(jī)制:兩臺(tái)存儲(chǔ)系統(tǒng)同時(shí)處于工作狀態(tài),非“一主一備”模式,主機(jī)可以通過主、鏡像存儲(chǔ)同時(shí)進(jìn)行數(shù)據(jù)讀寫。并且,兩臺(tái)存儲(chǔ)也可以承載不同的應(yīng)用,相互鏡像,達(dá)到真正的雙活目標(biāo),兩臺(tái)雙活存儲(chǔ)系統(tǒng)做到負(fù)載均衡的作用,降低主存儲(chǔ)應(yīng)對前端數(shù)據(jù)讀寫壓力,實(shí)現(xiàn)數(shù)據(jù)分流作用。MS3300采用雙控制器架構(gòu),控制器、磁盤柜、緩存、硬盤等關(guān)鍵組件都采用冗余設(shè)計(jì),保障系統(tǒng)的5個(gè)9的高可靠性。MS3300的體系架構(gòu)有如下技術(shù)特點(diǎn):SAS傳輸通道:MS3300采用SAS傳輸技術(shù)構(gòu)建磁盤陣列內(nèi)部的數(shù)據(jù)傳輸通路,后端磁盤通道總帶寬達(dá)到96Gb;高性能存儲(chǔ)控制器:為了保障處理能力,MS3300在存儲(chǔ)控制器中采用了多核、PCI-E2.0總線等技術(shù),相比傳統(tǒng)控制器,能提供3倍以上的處理能力;千兆/萬兆/8GbFC主機(jī)接口:在前端主機(jī)接口上,MS3300可根據(jù)需要提供千兆、8GbFC、萬兆主機(jī)接口,并保障前端的業(yè)務(wù)帶寬;全交換磁盤柜:磁盤柜采用了SAS交換技術(shù),每個(gè)磁盤都有獨(dú)立6Gb數(shù)據(jù)訪問通路,不受其它磁盤的干擾;在磁盤選擇上,MS3300兼容高性能的SSD磁盤,并同時(shí)支持SAS、SATA磁盤。中間光纖交換機(jī):為了安全起見,考慮搭建全冗余鏈路平臺(tái),避免光纖交換機(jī)成為單點(diǎn)故障來源,中間部署兩臺(tái)博科24口FCSAN光纖交換機(jī),前端服務(wù)器通過雙端口HBA卡與中間兩臺(tái)光纖交換機(jī)交叉連接,再與后端存儲(chǔ)連接,構(gòu)建生產(chǎn)環(huán)境下的高可靠FCSAN存儲(chǔ)區(qū)域網(wǎng)。方案優(yōu)勢大容量緩存提升性能數(shù)十倍通過在計(jì)算、傳輸與存儲(chǔ)之間設(shè)置大容量、高速的緩沖區(qū),才有可能緩解前端電子設(shè)備與后端存儲(chǔ)硬盤之間上萬倍的性能差異。對于單個(gè)LUN,如果讀寫操作頻繁,如果配置更多的緩存,則讀取效率更高,特別適合本次前端數(shù)據(jù)庫級服務(wù)器虛擬化多業(yè)務(wù)并發(fā)模式。實(shí)踐證明,單個(gè)LUN推薦配置1GB大小,如果是相同大小的LUN,應(yīng)用相同時(shí),分別配置1GB和20GB緩存,其測試結(jié)果相差24倍左右。存儲(chǔ)端負(fù)載均衡 兩臺(tái)存儲(chǔ)系統(tǒng)同時(shí)處于工作狀態(tài),非“一主一備”模式,主機(jī)可以通過主、鏡像存儲(chǔ)同時(shí)進(jìn)行數(shù)據(jù)讀寫。并且,兩臺(tái)存儲(chǔ)也可以承載不同的應(yīng)用,相互鏡像,達(dá)到真正的雙活目標(biāo),兩臺(tái)雙活存儲(chǔ)系統(tǒng)做到負(fù)載均衡的作用,降低主存儲(chǔ)應(yīng)對前端數(shù)據(jù)讀寫壓力,實(shí)現(xiàn)數(shù)據(jù)分流作用。零數(shù)據(jù)丟失,業(yè)務(wù)自動(dòng)接管(RPO、RTO均為0)采用基于磁盤陣列間的數(shù)據(jù)同步鏡像技術(shù),兩端數(shù)據(jù)實(shí)時(shí)同步,業(yè)務(wù)系統(tǒng)自動(dòng)切換,無需手動(dòng)。主、鏡像存儲(chǔ)產(chǎn)品均采用全冗余的硬件架構(gòu)設(shè)計(jì),電源、風(fēng)扇、控制器等冗余部署的,不存在單點(diǎn)故障,可以在線更換部件,無影響業(yè)務(wù)連續(xù)性。借助宏杉科技獨(dú)特的CRAID技術(shù)解決了磁盤的安全性問題,大大降低數(shù)據(jù)丟失的風(fēng)險(xiǎn)。成本低、易部署(適用于所有應(yīng)用類型)本次雙活數(shù)據(jù)中心平臺(tái)搭建完全是基于兩臺(tái)雙活存儲(chǔ)底層,前端主機(jī)與存儲(chǔ)之間配置多路徑軟件即可實(shí)現(xiàn)鏈路的自動(dòng)切換,無需在主機(jī)端安裝其他第三方軟、硬件設(shè)備,非常簡便。易擴(kuò)展、易維護(hù)存儲(chǔ)平臺(tái)MS3000最大磁盤數(shù)量516,緩存最大可擴(kuò)展至64GB,充分滿足未來3-5年數(shù)據(jù)增長量需求;MS系列存儲(chǔ)提供完善的中文化GUI、CLI管理界面,操作簡單方便。通過應(yīng)用相關(guān)型的引導(dǎo)界面,管理員只需簡單的點(diǎn)擊鼠標(biāo),設(shè)置應(yīng)用類型和空間大小等信息,就能輕松完成資源分配;MS系列存儲(chǔ)支持EventLog、指示燈告警、控制臺(tái)告警、蜂鳴器告警、SNMP告警、郵件告警、短信告警等多種告警機(jī)制。在告警處理上,MS系列存儲(chǔ)支持故障事件和告警聯(lián)動(dòng)方式自定義,管理員可為每種事件配置不同的告警聯(lián)動(dòng)方式。本地化研發(fā)級原廠售后服務(wù)南京本地具有常駐機(jī)構(gòu),提供原廠工程師7*24小時(shí)售后服務(wù),定期巡檢和免費(fèi)升級,提供研發(fā)級別的技術(shù)支持。國產(chǎn)品牌,支持二次開發(fā)和定制功能。常見三種雙活存儲(chǔ)技術(shù)對比本次雙活存儲(chǔ)平臺(tái)建設(shè),從采購成本、部署及實(shí)施簡便性、應(yīng)用范圍等多方面綜合考了,建議采用宏杉科技本次推薦的完全基于存儲(chǔ)系統(tǒng)底層雙活鏡像軟件搭建雙活存儲(chǔ)解決方案,性價(jià)比等各方面都更加能滿足用戶實(shí)際需求。本地備份系統(tǒng)D2D2T方案說明方案描述為防患未然,現(xiàn)有SAP及OA數(shù)據(jù)需在本地進(jìn)行數(shù)據(jù)的備份。雖然現(xiàn)在已經(jīng)有了備份的機(jī)制,但是現(xiàn)有的機(jī)制顯然已經(jīng)沒有辦法滿足日益增長的數(shù)據(jù)和有限的備份窗口的要求,所以,目前公司需要一套有效的,快速的,穩(wěn)定的備份架構(gòu)來滿足這些要求。由于目前公司的大部分的架構(gòu)都是基于SAN的,所以,如果能夠利用光纖環(huán)境進(jìn)行備份的話,將會(huì)大大提高備份的速率和效率,保證在備份窗口內(nèi)完成備份的工作,不影響白天正常的辦公,同時(shí),在需要備份數(shù)據(jù)的時(shí)候能夠以最快的速度恢復(fù)相應(yīng)的數(shù)據(jù)。在備份介質(zhì)的選擇上,采用基于硬盤的備份解決方案顯然是最符合公司的備份要求的,原有有以下幾點(diǎn)磁盤被真正被作為磁盤來管理(隨機(jī)訪問)備份image過期管理基于磁盤可以同時(shí)讀寫image支持跨域的自動(dòng)映像復(fù)制備份軟件的高級磁盤管理功能虛擬合成備份,MediaServer負(fù)載均衡,存儲(chǔ)生命周期策略,智能的專用備份設(shè)備支持(OST)連云港中復(fù)聯(lián)眾對于數(shù)據(jù)安全的要求是嚴(yán)格的,如何將RPO降到最低,這就需要一套完整的數(shù)據(jù)備份方案,當(dāng)出現(xiàn)任何軟、硬件故障的情況下,迅速的將備份走的數(shù)據(jù)恢復(fù)出來,保證數(shù)據(jù)的正常使用。選擇原則實(shí)現(xiàn)一個(gè)真正滿足業(yè)務(wù)需求的備份環(huán)境是一項(xiàng)非常復(fù)雜的任務(wù)。對數(shù)據(jù)進(jìn)行備份是為了保證數(shù)據(jù)的一致性和完整性,消除系統(tǒng)使用者和操作者的后顧之憂。不同的應(yīng)用環(huán)境要求不同的解決方案來適應(yīng),一般來說,一個(gè)完善的備份系統(tǒng),需要滿足以下原則:穩(wěn)定性:備份系統(tǒng)的主要作用是為業(yè)務(wù)系統(tǒng)提供一個(gè)數(shù)據(jù)保護(hù)的方法,于是該系統(tǒng)本身的穩(wěn)定性和可靠性就變成了最重要的一個(gè)方面。首先,備份系統(tǒng)一定要與操作系統(tǒng)兼容,其次,當(dāng)事故發(fā)生時(shí),能夠快速有效地恢復(fù)數(shù)據(jù)。全面性:在復(fù)雜的計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中,可能會(huì)包括了各種操作平臺(tái),如各種廠家的UNIX、LINX、WindowsNT、VMS等,備份系統(tǒng)要支持各種操作系統(tǒng)、數(shù)據(jù)庫和典型應(yīng)用。靈活的備份策略:很多系統(tǒng)由于工作性質(zhì),對何時(shí)備份、用多長時(shí)間備份都有一定的限制。在下班時(shí)間系統(tǒng)負(fù)荷輕,適于備份??墒沁@會(huì)增加系統(tǒng)管理員的負(fù)擔(dān),由于精神狀態(tài)等原因,還會(huì)給備份安全帶來潛在的隱患。因此,備份方案應(yīng)能提供定時(shí)的自動(dòng)備份。在自動(dòng)備份過程中,還要有日志記錄功能,并在出現(xiàn)異常情況時(shí)自動(dòng)報(bào)警。操作簡單:數(shù)據(jù)備份應(yīng)用于不同領(lǐng)域,進(jìn)行數(shù)據(jù)備份的操作人員也處于不同的層次。這就需要通過直觀的、操作簡單的圖形化用戶界面,縮短操作人員的學(xué)習(xí)時(shí)間,減輕操作人員的工作壓力,使備份工作得以輕松地設(shè)置和完成。連云港中復(fù)聯(lián)眾現(xiàn)有的SAN(存儲(chǔ)區(qū)域網(wǎng)絡(luò))讓備份和恢復(fù)策略擁有更高的靈活性。通過SANClient技術(shù),通過光纖網(wǎng)絡(luò)進(jìn)行備份數(shù)據(jù)的傳輸,在減輕主機(jī)負(fù)擔(dān)的同時(shí),大大提升備份的速度和性能,備份硬件能夠在大量數(shù)據(jù)密集型系統(tǒng)之間實(shí)現(xiàn)共享,使得重要系統(tǒng)可以直接備份到存儲(chǔ)中,而無需通過業(yè)務(wù)網(wǎng)絡(luò)節(jié)省寶貴的網(wǎng)絡(luò)資源。該方案充分發(fā)揮了Netbackup備份一體機(jī)強(qiáng)大的性能以及功能優(yōu)勢,主要涉及到的功能有基于SAN-Client備份備份加速器(合成加速備份功能)重復(fù)數(shù)據(jù)刪除功能(源端以及目的端)NetbackupV-Ray技術(shù)有效的保護(hù)虛擬化環(huán)境SAN-Client備份所有接入SAN光纖存儲(chǔ)網(wǎng)絡(luò)的主機(jī),可以采用SANClient模式,在該模式下,在應(yīng)用系統(tǒng)主機(jī)上需要安裝NetBackupEnterpriseClient模塊和ApplicationandDatabasePack模塊(如果應(yīng)用系統(tǒng)沒有數(shù)據(jù)庫則不需要安裝ApplicationandDatabasePack模塊)。在備份操作時(shí),NetbackupEnterpriseClient模塊把需要備份的數(shù)據(jù)從生產(chǎn)數(shù)據(jù)存儲(chǔ)設(shè)備中讀入生產(chǎn)機(jī),然后把數(shù)據(jù)通過SAN寫到備份設(shè)備上;在恢復(fù)操作時(shí),NetBackupEnterpriseClient將通過SAN網(wǎng)從備份設(shè)備上讀入恢復(fù)數(shù)據(jù),在生產(chǎn)機(jī)內(nèi)把數(shù)據(jù)傳給數(shù)據(jù)庫或應(yīng)用代理模塊,數(shù)據(jù)庫或應(yīng)用代理模塊把數(shù)據(jù)寫入生產(chǎn)系統(tǒng)。在SANClient模式下,備份/恢復(fù)操作的數(shù)據(jù)經(jīng)過SAN網(wǎng)轉(zhuǎn)送。完全的介質(zhì)服務(wù)器控制設(shè)備,充分的資源共享、負(fù)載均衡,簡化管理。應(yīng)用服務(wù)器利用SAN驅(qū)動(dòng)、傳輸備份數(shù)據(jù)。備份設(shè)備完全由介質(zhì)服務(wù)器控制,管理獨(dú)立于應(yīng)用區(qū)域。讓備份與應(yīng)用完全隔開,對業(yè)務(wù)服務(wù)器影響最小。備份軟件升級對應(yīng)用影響最小。備份設(shè)備更換、維護(hù)、升級對應(yīng)用影響最小。通過擴(kuò)展介質(zhì)服務(wù)器無限擴(kuò)展備份域。備份加速器(合成加速備份功能)此功能使用Accelerator技術(shù)加快虛擬化備份速度,在完成增量備份期間還提供完全備份映像。僅將發(fā)生變化的數(shù)據(jù)塊從客戶端傳輸至介質(zhì)服務(wù)器。在我們的備份設(shè)備這里將之前的全量備份數(shù)據(jù)和新增的增量備份數(shù)據(jù)合成一份全新的全量備份數(shù)據(jù),這樣一來,我們便可以以增量備份的時(shí)間來完成全量備份。備份速度增加高達(dá)35倍,可以更好地滿足服務(wù)級別協(xié)議要求而不影響恢復(fù)減少了數(shù)據(jù)傳輸量,因此緩解了基礎(chǔ)架構(gòu)承受的壓力重復(fù)數(shù)據(jù)刪除簡化數(shù)據(jù)中心遷移和更新過程不論是傳統(tǒng)、虛擬化還是混合企業(yè)環(huán)境中,重復(fù)數(shù)據(jù)刪除功能正快速成為管理空前增長數(shù)據(jù)的基石。重復(fù)數(shù)據(jù)刪除功能的使用率穩(wěn)步上升,而眾多IT部門現(xiàn)在又面臨著問題:能否得到一種經(jīng)濟(jì)有效且可伸縮的重復(fù)數(shù)據(jù)刪除解決方案,可以簡化現(xiàn)有數(shù)據(jù)保護(hù)過程,能夠方便透明地部署,能隨著數(shù)據(jù)中心的擴(kuò)展而擴(kuò)展,并幫助減少和控制CAPEX和OPEX成本。在單一數(shù)據(jù)保護(hù)平臺(tái)中實(shí)現(xiàn)企業(yè)級“端到端”全局重復(fù)數(shù)據(jù)刪除采用V-Ray的智能NetBackupDeduplication使您可以輕松地部署企業(yè)級、高伸縮性、“端到端”全局重復(fù)數(shù)據(jù)刪除功能,整個(gè)過程只需動(dòng)動(dòng)鼠標(biāo)。NetBackup的整合和管理簡便易行,經(jīng)濟(jì)適用,適合企業(yè)全局部署計(jì)劃,提供了獨(dú)特的無縫集成功能,通過單一供應(yīng)商產(chǎn)品,為虛擬和物理服務(wù)器數(shù)據(jù)保護(hù)及重復(fù)數(shù)據(jù)刪除提供了“一步到位解決方案”。利用經(jīng)過實(shí)證的單一企業(yè)級數(shù)據(jù)保護(hù)平臺(tái),在數(shù)據(jù)中心面向虛擬化、新應(yīng)用程序和云不斷演變時(shí),NetBackup重復(fù)數(shù)據(jù)刪除功能具備與時(shí)俱進(jìn)的靈活性,不會(huì)產(chǎn)生高昂的成本。NetbackupV-Ray技術(shù)有效的保護(hù)虛擬化環(huán)境針對虛擬機(jī)工作負(fù)載的建議包括:采用統(tǒng)一的虛擬和物理保護(hù)–借助屢獲殊榮的NetBackup,用戶不需要使用兩種備份工具,也無需更換供應(yīng)商,即可獲得對虛擬和物理環(huán)境的企業(yè)級保護(hù)。作為首屈一指的虛擬機(jī)備份提供程序,NetBackup在單一備份和恢復(fù)平臺(tái)中提供了管理用戶環(huán)境所需的一切。在虛擬機(jī)內(nèi)采用應(yīng)用程序一致性恢復(fù)–眾所周知,備份的關(guān)鍵在于速度,但恢復(fù)更甚于此。如果只顧盡可能快地執(zhí)行備份而不考慮恢復(fù)問題,那么您將受益很淺—尤其是在嘗試恢復(fù)關(guān)鍵應(yīng)用程序時(shí)更是如此,這種情況下時(shí)間就是金錢。采用V-Ray技術(shù)的NetBackup不但可以非??斓貓?zhí)行備份,還可以確保虛擬機(jī)獲得應(yīng)用程序一致性備份且對虛擬應(yīng)用程序的恢復(fù)與數(shù)據(jù)一致。這有助于確保更快地完成恢復(fù),從而幫助用戶更好地滿足嚴(yán)苛的SLA的要求采用V-Ray技術(shù)的NetBackup提供很多獨(dú)特且強(qiáng)大的功能,在光纖的環(huán)境下,可以通過虛擬機(jī)存儲(chǔ)和備份一體機(jī)光纖連接的方式從存儲(chǔ)上直接將需要備份的數(shù)據(jù)傳送至Netbackup設(shè)備上,效率極高采用NetBackup虛擬機(jī)智能策略–NetBackup會(huì)監(jiān)控整個(gè)虛擬環(huán)境,并自動(dòng)對新的、移動(dòng)的或克隆的虛擬機(jī)應(yīng)用備份策略以確保保護(hù)不會(huì)停止。此外,NetBackup還能夠識(shí)別每個(gè)虛擬機(jī)的物理位置。這樣,NetBackup便可以在各主機(jī)服務(wù)器之間平衡備份負(fù)載,以防止通過備份進(jìn)程不公正地加載它們。這可以帶來大大高于競爭解決方案的備份成功率物理機(jī)到虛擬機(jī)的轉(zhuǎn)換以及備份鏡像到虛擬機(jī)的轉(zhuǎn)換:通過Netbackcp的P2V技術(shù),可以將物理機(jī)或者物理機(jī)的備份鏡像轉(zhuǎn)換成為虛擬機(jī),在虛擬化的環(huán)境下,大大提高系統(tǒng)包括數(shù)據(jù)恢復(fù)的速度和效率。提高了恢復(fù)時(shí)間目標(biāo)(RTO)可滿足嚴(yán)苛的災(zāi)難恢復(fù)(DR)SLA要求通過在虛擬環(huán)境上進(jìn)行災(zāi)難恢復(fù)(DR),減少OPEXIRV虛擬機(jī)瞬時(shí)啟動(dòng)功能,通過Netbackup提供的NFSdatastore,VMwareESXi將NFSmount起來作為它的datastore,此時(shí),便可以再ESXi上開啟這臺(tái)服務(wù)器,然后通過Storagevmotion的功能,將這個(gè)只讀的鏡像遷移到其他存儲(chǔ)上,便完成了虛擬機(jī)的瞬時(shí)恢復(fù),整個(gè)過程消耗幾分鐘,是一個(gè)非常有效的輕量級容災(zāi)功能只需幾步便完成系統(tǒng)和應(yīng)用的還原,效率極高不需要額外的license,在最新版的Netbackup里面便帶有這個(gè)功能BMR裸機(jī)恢復(fù)功能BMR技術(shù)主要的功能是能夠備份操作系統(tǒng)的狀態(tài)和應(yīng)用數(shù)據(jù),在恢復(fù)的時(shí)候連系統(tǒng)帶數(shù)據(jù)一并恢復(fù),并且支持不同設(shè)備之間的恢復(fù),例如,將一臺(tái)IBMP550的機(jī)器進(jìn)行BMR備份,在恢復(fù)的時(shí)候可以選擇IBMP750的小機(jī)進(jìn)行恢復(fù),一定程度上幫助完成了硬件的升級操作。BMR功能與NetBAckup備份協(xié)同工作。客戶機(jī)仍像以前那樣備份至NetBackup服務(wù)器。但在執(zhí)行每項(xiàng)預(yù)定備份任務(wù)之前,系統(tǒng)將自動(dòng)執(zhí)行附加過程,即記錄服務(wù)器配置的當(dāng)前狀態(tài),其中包括磁盤配置和網(wǎng)絡(luò)配置。如果服務(wù)器配置被修改,系統(tǒng)在執(zhí)行備份時(shí),將自動(dòng)捕捉和記錄這些修改,不需要用戶進(jìn)行干預(yù)。利用BMR進(jìn)行恢復(fù)非常容易,因?yàn)榛謴?fù)過程已經(jīng)實(shí)現(xiàn)自動(dòng)化。用戶既可以使用BMRserver的命令行,又可以使用基于瀏覽器的簡單界面。只要發(fā)出“preparetorestore”(準(zhǔn)備恢復(fù))命令,系統(tǒng)就開始執(zhí)行恢復(fù)。些時(shí),BMR將立即檢索客戶機(jī)配置數(shù)據(jù),并使用該數(shù)據(jù)創(chuàng)建一個(gè)定制化的客戶恢復(fù)程序。然后,通過網(wǎng)絡(luò)為客戶機(jī)發(fā)送相應(yīng)的引導(dǎo)數(shù)據(jù)和文件系統(tǒng)。客戶機(jī)將通過BMRbootserver執(zhí)行引導(dǎo),并開始運(yùn)行定制引導(dǎo)程序。引導(dǎo)程序?qū)?zhí)行一列任務(wù):如果不需要改變服務(wù)器配置,除初始網(wǎng)絡(luò)引導(dǎo)外,將不需要進(jìn)行人工干預(yù)。由于BMR是一種多平臺(tái)產(chǎn)品,用戶可以通過一個(gè)公用界面,恢復(fù)一系列系統(tǒng),從而大大降低成本。傳統(tǒng)恢復(fù)BareMetalRestore1.修理硬件1.修理硬件2.收集所有必需的介質(zhì)2.點(diǎn)擊“preparetorestor”3.重新啟動(dòng)3.重新啟動(dòng)4.通過CD-ROM或軟盤,重新安裝操作系統(tǒng)5.重新啟動(dòng)6.通過CD-ROM,重新安裝備份客戶端軟件7.重新啟動(dòng)8.從備份服務(wù)器進(jìn)行恢復(fù)9.重新啟動(dòng)顆粒度還原技術(shù)通過顆粒度還原技術(shù),可以還原備份鏡像的某個(gè)項(xiàng)目,例如,在回復(fù)exchange郵箱的時(shí)候,可以恢復(fù)某個(gè)用戶的某封郵件,甚至于某封郵件里面的某個(gè)附件,而不用還原整個(gè)mailbox里面的所有郵件,幫助管理員定位需要還原的組件,并且以最快最高效的速度還原單個(gè)項(xiàng)目。D2D2T的備份還原機(jī)制Netbackup備份一體機(jī)提供外置借口可以外接物理帶庫進(jìn)行數(shù)據(jù)的傳輸,從而實(shí)現(xiàn)D2D2T的備份方式,將最近的,需要恢復(fù)概率最高的那些數(shù)據(jù)存放在一體機(jī)的硬盤上,而將那些比較久的,恢復(fù)概率相對比較低的數(shù)據(jù)存放在外置的帶庫上,從來也可以充分利用中復(fù)聯(lián)眾現(xiàn)有的TS3100的物理帶庫來完成數(shù)據(jù)的長期保存。方案優(yōu)勢Netbackup一體機(jī)設(shè)備采用磁盤作為備份的介質(zhì),在空間使用率上相比之前的物理帶庫或者虛擬帶庫備份有著無法比擬的優(yōu)勢,其他各種實(shí)用的功能也久經(jīng)考驗(yàn),主要的優(yōu)勢體現(xiàn)有:通過完全基于光纖的SAN-Client的備份方式,減少備份操作對應(yīng)用主機(jī)的影響的同時(shí)提升備份的效率。采用備份加速器的功能,用增量備份的時(shí)間和資源消耗來完成全量備份,可以大大縮短備份窗口。采用源端和目的端的重復(fù)數(shù)據(jù)刪除技術(shù),更加有效的利用存儲(chǔ)空間。和Vmware整合的V-ray技術(shù),包括物理機(jī)到虛擬機(jī)的轉(zhuǎn)換,虛擬機(jī)的順時(shí)啟動(dòng)功能。BMR裸機(jī)恢復(fù)功能,可以在相同或者不同的硬件上對操作系統(tǒng)和應(yīng)用數(shù)據(jù)進(jìn)行恢復(fù)。利用Netbackup的顆粒度還原技術(shù),可以還原應(yīng)用程序的某個(gè)項(xiàng)目,例如某封郵件的某個(gè)附件。充分使用中復(fù)聯(lián)眾現(xiàn)有的物理帶庫資源實(shí)現(xiàn)D2D2T的備份模式。遠(yuǎn)程容災(zāi)系統(tǒng)方案說明方案描述新增一套宏杉科技存儲(chǔ)產(chǎn)品MS2520i,作為遠(yuǎn)程災(zāi)備存儲(chǔ)。遠(yuǎn)程災(zāi)備存儲(chǔ)主要作為主存儲(chǔ)的另一份數(shù)據(jù)副本資源,通過中復(fù)連眾現(xiàn)有的專網(wǎng)2M帶寬,提供基于IP的數(shù)據(jù)塊復(fù)制功能,將主存儲(chǔ)MS3100上的數(shù)據(jù)同步到MS2520上,為宋跳數(shù)據(jù)中心再提供一份實(shí)時(shí)的數(shù)據(jù)備份。當(dāng)宋跳數(shù)據(jù)中心的所有數(shù)據(jù)可能不可用時(shí),可通過遠(yuǎn)程災(zāi)備存儲(chǔ)MS2520實(shí)現(xiàn)數(shù)據(jù)的快速恢復(fù),當(dāng)然,如果前端業(yè)務(wù)服務(wù)器仍然可工作情況下,也可將災(zāi)備存儲(chǔ)MS2520i臨時(shí)搬到宋跳機(jī)房,完成數(shù)據(jù)一致性檢測以后,可重新臨時(shí)掛載前端業(yè)務(wù)。宋跳數(shù)據(jù)中心主存儲(chǔ)恢復(fù)工作以后,將MS2510中的數(shù)據(jù)可基于增量同步模式將這段時(shí)間發(fā)生變化的數(shù)據(jù)量同步回新主存儲(chǔ)MS3100上,保障數(shù)據(jù)安全,并將前端業(yè)務(wù)重新切換至主存儲(chǔ)。遠(yuǎn)程災(zāi)備存儲(chǔ):新增一臺(tái)宏杉科技MS2520i:作為主存儲(chǔ)MS3100的容災(zāi),提供一份與主存儲(chǔ)數(shù)據(jù)格式一致的數(shù)據(jù)副本:配置雙冗余控制器支持Active/Active負(fù)載均衡;此次配置16GB緩存;配置13塊4TB7200轉(zhuǎn)企業(yè)級SAS硬盤,總?cè)萘繛?2TB。配置基于磁盤陣列底層的IP數(shù)據(jù)復(fù)制軟件,完成將主存儲(chǔ)MS3300數(shù)據(jù)通過基于IP復(fù)制到災(zāi)備存儲(chǔ)MS2520上做數(shù)據(jù)同步;方案優(yōu)勢網(wǎng)絡(luò)帶寬可充分利用MS系列存儲(chǔ)數(shù)據(jù)復(fù)制通過IP網(wǎng)絡(luò)實(shí)現(xiàn),只要IP可達(dá),數(shù)據(jù)復(fù)制即可實(shí)現(xiàn)。但在不同的網(wǎng)絡(luò)環(huán)境下,復(fù)制的速率會(huì)有較大影響。下表給出了在特定數(shù)據(jù)庫環(huán)境下,復(fù)制的傳輸速率參考值。測試環(huán)境:40公里距離,MPLSVPN網(wǎng)絡(luò),Oracle數(shù)據(jù)庫網(wǎng)絡(luò)帶寬2Mbps10Mbps20Mbps100Mbps155Mbps1000Mbps不壓縮傳輸(MB/s)0.2111.0901.95510.01519.31323.894壓縮傳輸(MB/s)0.5692.8445.66214.48021.95326.235同步量(GB/小時(shí))0.7413.836.8735.167.884.0復(fù)制帶寬利用率(%)84.487.278.280.1299.6819.16由上表可得知如下結(jié)論:155Mb以下帶寬的IP鏈路,可充分利用帶寬,因此,本次遠(yuǎn)程容災(zāi)的網(wǎng)絡(luò)帶寬2M可得到充分利用。小帶寬鏈路下,復(fù)制壓縮效果明顯,可達(dá)2-3倍,不過壓縮比與數(shù)據(jù)格式相關(guān)。異地留有數(shù)據(jù)副本,可快速做數(shù)據(jù)恢復(fù)或臨時(shí)性業(yè)務(wù)接管將主存儲(chǔ)MS3300上的數(shù)據(jù)同步到MS2520上,為宋跳數(shù)據(jù)中心再提供一份實(shí)時(shí)的數(shù)據(jù)備份。當(dāng)宋跳數(shù)據(jù)中心的所有數(shù)據(jù)可能不可用時(shí),可通過遠(yuǎn)程災(zāi)備存儲(chǔ)MS2520實(shí)現(xiàn)數(shù)據(jù)的快速恢復(fù),當(dāng)然,如果前端業(yè)務(wù)服務(wù)器仍然可工作情況下,也可將災(zāi)備存儲(chǔ)MS2520i臨時(shí)搬到宋跳機(jī)房,完成數(shù)據(jù)一致性檢測以后,可重新臨時(shí)掛載前端業(yè)務(wù)。持續(xù)數(shù)據(jù)保護(hù)CDP功能說明方案描述數(shù)據(jù)備份已經(jīng)經(jīng)過了將近三十年的發(fā)展,存儲(chǔ)介質(zhì)、備份方式、備份級別等方面都產(chǎn)生過許多新概念。當(dāng)我們將隱藏在用戶復(fù)雜需求之后的本質(zhì)抽離出來,結(jié)論卻可能非常簡單——數(shù)據(jù)零丟失、業(yè)務(wù)不間斷,這是現(xiàn)代商務(wù)對于數(shù)據(jù)備份的核心要求。新型CDP技術(shù)完全契合商務(wù)備份需求,代表了數(shù)據(jù)備份的發(fā)展方向?,F(xiàn)代備份技術(shù)里,恢復(fù)點(diǎn)目標(biāo)(recoverypointobject,RPO)和恢復(fù)時(shí)間目標(biāo)(recoverytimeobject,RTO)是兩個(gè)關(guān)鍵性指標(biāo)。RPO是指當(dāng)災(zāi)難或事件發(fā)生時(shí),數(shù)據(jù)可以恢復(fù)到最近可用的時(shí)間點(diǎn)與故障時(shí)間點(diǎn)之間的時(shí)間差。RPO越小,數(shù)據(jù)丟失越少,RPO=0是容災(zāi)級備份技術(shù)的目標(biāo),即在災(zāi)難發(fā)生時(shí)實(shí)現(xiàn)數(shù)據(jù)零丟失。RTO是指災(zāi)難發(fā)生后,從系統(tǒng)宕機(jī)導(dǎo)致業(yè)務(wù)停頓到IT系統(tǒng)恢復(fù)并支持業(yè)務(wù)恢復(fù)運(yùn)營的時(shí)間間隔。RTO越低意味著業(yè)務(wù)中斷的時(shí)間越短。當(dāng)災(zāi)難發(fā)生時(shí),業(yè)務(wù)數(shù)據(jù)不受損,并實(shí)現(xiàn)業(yè)務(wù)不間斷,這是企業(yè)進(jìn)行數(shù)據(jù)備份的目標(biāo)。用備份術(shù)語來描述,就是在實(shí)現(xiàn)RPO=0的基礎(chǔ)上,實(shí)現(xiàn)盡可能低的RTO,這正是近年來新興的持續(xù)數(shù)據(jù)保護(hù)(ContinuousDataProtection,CDP)技術(shù)的典型特點(diǎn)。與傳統(tǒng)數(shù)據(jù)備份技術(shù)對數(shù)據(jù)進(jìn)行周期性備份相比較,CDP不僅從RTO、RPO指標(biāo)上進(jìn)行了顛覆,而且總體備份成本也得到了降低。本次持續(xù)數(shù)據(jù)保護(hù)通過虛擬化網(wǎng)關(guān)VS2000提供的“帶外”基于網(wǎng)絡(luò)的應(yīng)用裝置,不在主機(jī)到存儲(chǔ)的主I/O路徑中,實(shí)時(shí)對寫I/O監(jiān)控和復(fù)制保護(hù),不影響主機(jī)性能,將數(shù)據(jù)再實(shí)時(shí)備份至原有存儲(chǔ)CX4-240上??梢詫?shí)現(xiàn)對物理和數(shù)據(jù)邏輯故障的恢復(fù),邏輯故障包括:數(shù)據(jù)庫邏輯錯(cuò)誤、人為誤操作和病毒等引起的數(shù)據(jù)庫數(shù)據(jù)丟失、人為或病毒引起的數(shù)據(jù)庫崩潰等故障。提供一致性組功能,可以將某個(gè)特定應(yīng)用程序的所有LUN綁定到一個(gè)一致性組中,以確保事務(wù)向以前時(shí)間點(diǎn)的回滾同時(shí)進(jìn)行,從而確保應(yīng)用程序的一致恢復(fù)。方案優(yōu)勢CDP會(huì)對企業(yè)數(shù)據(jù)進(jìn)行自動(dòng)監(jiān)控,連續(xù)捕獲并備份數(shù)據(jù)變化,發(fā)生變化的數(shù)據(jù)會(huì)實(shí)時(shí)、準(zhǔn)確地備份下來。“持續(xù)回退”——當(dāng)出現(xiàn)故障或者用戶需要找回某特定時(shí)間點(diǎn)的數(shù)據(jù)時(shí),VS2000可按任意操作步數(shù)或時(shí)間點(diǎn)進(jìn)行數(shù)據(jù)快速恢復(fù)。對于數(shù)據(jù)庫類型的結(jié)構(gòu)化數(shù)據(jù),可以回到數(shù)據(jù)庫的任何狀態(tài);對于非結(jié)構(gòu)化數(shù)據(jù),可以回到指定的時(shí)間點(diǎn),幫助用戶找回?fù)p壞前的數(shù)據(jù)。在恢復(fù)的過程中不但保證了數(shù)據(jù)的完整型,而且能保證數(shù)據(jù)庫事務(wù)的完整性。VS2000的CDP實(shí)現(xiàn)了實(shí)時(shí)數(shù)據(jù)備份與持續(xù)回退,每次數(shù)據(jù)變化均產(chǎn)生回退點(diǎn),在數(shù)據(jù)無變化時(shí)則不產(chǎn)生回退點(diǎn),與定時(shí)備份相比,可大幅度節(jié)省備份空間。數(shù)據(jù)遷移方案建議本次項(xiàng)目中采用的數(shù)據(jù)遷移方法主要如下表所示:序號方法描述1直接拷貝方法利用操作系統(tǒng)命令直接拷貝要遷移的數(shù)據(jù),然后復(fù)制到要遷移到的目的地。2數(shù)據(jù)庫工具方法使用數(shù)據(jù)庫的自身工具對數(shù)據(jù)進(jìn)行遷移?;蚴褂脗浞蒈浖峁┑膶I(yè)軟件。直接拷貝方法關(guān)閉數(shù)據(jù)庫后,將存儲(chǔ)掛載到數(shù)據(jù)庫服務(wù)器上,利用操作系統(tǒng)的實(shí)現(xiàn)磁盤數(shù)據(jù)的直接復(fù)制,等待復(fù)制完成后替換原來數(shù)據(jù)所在盤符,適合于脫機(jī)遷移的環(huán)境。數(shù)據(jù)庫工具方法對于數(shù)據(jù)庫數(shù)據(jù),還可使用數(shù)據(jù)庫的自身工具,如Oracle、Sybase自帶復(fù)制工具等操作。方案實(shí)現(xiàn)之關(guān)鍵技術(shù)說明關(guān)鍵技術(shù)1——IP遠(yuǎn)程復(fù)制功能(實(shí)現(xiàn)遠(yuǎn)程容災(zāi))(1)基于磁盤陣列的遠(yuǎn)程復(fù)制技術(shù)磁盤陣列遠(yuǎn)程復(fù)制功能是災(zāi)備系統(tǒng)中業(yè)務(wù)數(shù)據(jù)實(shí)現(xiàn)多點(diǎn)到一點(diǎn)或一點(diǎn)到多點(diǎn)災(zāi)難備份的基礎(chǔ)。磁盤陣列通過IP鏈路進(jìn)行遠(yuǎn)程復(fù)制,能夠有效利用廣域網(wǎng)的各種IP鏈路,適用于IPv4和IPv6網(wǎng)絡(luò),并且復(fù)制過程對主機(jī)業(yè)務(wù)影響小,復(fù)制顆粒度細(xì)。遠(yuǎn)程復(fù)制過程中綜合采用數(shù)據(jù)塊微掃描、差異對比、數(shù)據(jù)壓縮、加密等技術(shù),有效節(jié)約帶寬資源。(2)磁盤陣列到磁盤陣列N對1復(fù)制災(zāi)備平臺(tái)與用戶端的存儲(chǔ)設(shè)備實(shí)現(xiàn)數(shù)據(jù)復(fù)制的過程中,磁盤陣列兩點(diǎn)之間的數(shù)據(jù)復(fù)制方式在投資可行性、運(yùn)維可行性、管理可行性等方面均無法達(dá)到令人滿意的要求。為有效利用災(zāi)備存儲(chǔ)資源,災(zāi)備數(shù)據(jù)大集中的環(huán)境下,磁盤陣列提供十二點(diǎn)到一點(diǎn)的基本復(fù)制能力,最高可以達(dá)到幾十點(diǎn)到一點(diǎn)的復(fù)制能力。有效降低災(zāi)備系統(tǒng)投資,極大程度簡化管理、運(yùn)維過程與成本。(1)網(wǎng)絡(luò)復(fù)制概述復(fù)制是宏杉科技MS系列存儲(chǔ)提供的存儲(chǔ)功能選項(xiàng)。它可實(shí)現(xiàn)兩臺(tái)MS系列所管理的資源(SAN資源或者組)之間的數(shù)據(jù)復(fù)制。遠(yuǎn)程復(fù)制功能支持在遠(yuǎn)程辦公地點(diǎn)與數(shù)據(jù)中心之間通過IP網(wǎng)絡(luò)對關(guān)鍵業(yè)務(wù)數(shù)據(jù)進(jìn)行策略性增量復(fù)制,實(shí)現(xiàn)數(shù)據(jù)的異地備份,并在發(fā)生意外災(zāi)難時(shí)對數(shù)據(jù)進(jìn)行快速恢復(fù),確保用戶業(yè)務(wù)的持續(xù)性。遠(yuǎn)程復(fù)制是在兩臺(tái)MS系列存儲(chǔ)所管理的資源之間進(jìn)行數(shù)據(jù)同步。這兩臺(tái)MS系列存儲(chǔ)分別稱為源服務(wù)器和目標(biāo)服務(wù)器,它們所處的站點(diǎn)分別稱為生產(chǎn)中心和災(zāi)備中心,其中,災(zāi)備中心為生產(chǎn)中心提供數(shù)據(jù)備份。如圖所示,當(dāng)條件滿足預(yù)設(shè)策略時(shí),生產(chǎn)中心的MS系列存儲(chǔ)啟動(dòng)數(shù)據(jù)復(fù)制,把源磁盤的數(shù)據(jù)復(fù)制到災(zāi)備中心的副本磁盤中,為源磁盤生成遠(yuǎn)端數(shù)據(jù)副本。(2)復(fù)制策略復(fù)制是將更改的數(shù)據(jù)從源磁盤傳輸?shù)礁北敬疟P,以便同步磁盤。它有策略性復(fù)制和自適應(yīng)復(fù)制兩種方式。策略性復(fù)制策略性復(fù)制將根據(jù)設(shè)置的條件(按預(yù)定的時(shí)間周期或閾值)觸發(fā)復(fù)制。啟動(dòng)初始復(fù)制,以后每隔設(shè)置的時(shí)間就觸發(fā)復(fù)制。假如客戶希望盡可能小的影響當(dāng)前業(yè)務(wù)系統(tǒng)的性能,則建議使用周期性觸發(fā),每天半夜或間隔幾小時(shí)開始執(zhí)行復(fù)制。周期最短為10分鐘。持續(xù)復(fù)制持續(xù)復(fù)制功能支持在遠(yuǎn)程辦公地點(diǎn)和數(shù)據(jù)中心之間通過IP網(wǎng)絡(luò)對關(guān)鍵業(yè)務(wù)數(shù)據(jù)進(jìn)行自適應(yīng)復(fù)制,在遠(yuǎn)端網(wǎng)絡(luò)中保存數(shù)據(jù)的完整副本。持續(xù)復(fù)制支持兩種復(fù)制方法:策略性復(fù)制和不間斷復(fù)制。如下圖所示,配置持續(xù)復(fù)制時(shí),需要先創(chuàng)建一個(gè)獨(dú)立、專用的不間斷復(fù)制資源,以提高數(shù)據(jù)磁盤的訪問速度。初始狀態(tài)下,持續(xù)復(fù)制采用不間斷復(fù)制方法。在生產(chǎn)中心,當(dāng)應(yīng)用服務(wù)器寫入數(shù)據(jù)時(shí),MS系列存儲(chǔ)同時(shí)把數(shù)據(jù)寫入源磁盤和不間斷復(fù)制資源。數(shù)據(jù)進(jìn)入不間斷復(fù)制資源后,就會(huì)被自動(dòng)持續(xù)寫入副本磁盤,實(shí)現(xiàn)對源磁盤持續(xù)的數(shù)據(jù)保護(hù)。如果不間斷復(fù)制資源被占滿,那么系統(tǒng)將自動(dòng)切換為策略性復(fù)制,當(dāng)策略性復(fù)制觸發(fā)的復(fù)制或執(zhí)行手動(dòng)同步復(fù)制完成時(shí),系統(tǒng)會(huì)自動(dòng)切換回不間斷復(fù)制。(3)復(fù)制速率MS系列存儲(chǔ)數(shù)據(jù)復(fù)制通過IP網(wǎng)絡(luò)實(shí)現(xiàn),只要IP可達(dá),數(shù)據(jù)復(fù)制即可實(shí)現(xiàn)。但在不同的網(wǎng)絡(luò)環(huán)境下,復(fù)制的速率會(huì)有較大影響。下表給出了在特定數(shù)據(jù)庫環(huán)境下,復(fù)制的傳輸速率參考值。測試環(huán)境:40公里距離,MPLSVPN網(wǎng)絡(luò),Oracle數(shù)據(jù)庫網(wǎng)絡(luò)帶寬2Mbps10Mbps20Mbps100Mbps155Mbps1000Mbps不壓縮傳輸(MB/s)0.2111.0901.95510.01519.31323.894壓縮傳輸(MB/s)0.5692.8445.66214.48021.95326.235同步量(GB/小時(shí))0.7413.836.8735.167.884.0復(fù)制帶寬利用率(%)84.487.278.280.1299.6819.16由上表可得知如下結(jié)論:155Mb以下帶寬的IP鏈路,可充分利用帶寬小帶寬鏈路下,復(fù)制壓縮效果明顯,可達(dá)2-3倍,不過壓縮比與數(shù)據(jù)格式相關(guān)關(guān)鍵技術(shù)2——CRAID技術(shù)(提高硬盤安全)據(jù)統(tǒng)計(jì),存儲(chǔ)系統(tǒng)的硬件故障90%以上是磁盤故障,而故障磁盤中,只有12%是完全的物理損壞,88%屬于部分/完全可用。如果磁盤發(fā)生錯(cuò)誤后立即被踢出陣列,一方面客戶需要為100%的故障磁盤買單,另外一方面客戶還需要承擔(dān)故障磁盤被踢出陣列到被更換過程中其他磁盤再次故障所導(dǎo)致的數(shù)據(jù)丟失風(fēng)險(xiǎn)。ODSP存儲(chǔ)軟件平臺(tái)在分層次、模塊化設(shè)計(jì)的基礎(chǔ)上,對多個(gè)層次上進(jìn)行了磁盤錯(cuò)誤處理。Cell,形象稱之為“細(xì)胞”,指帶“活性”的數(shù)據(jù)單元,是存儲(chǔ)資源管理的基本單位。引入Cell的概念后,資源管理層次如下圖所示,在具體的實(shí)現(xiàn)上,首先用物理磁盤創(chuàng)建RAID,然后把RAID的可用空間根據(jù)指定長度(默認(rèn)1GB)劃分為多個(gè)Cell,創(chuàng)建LUN時(shí),系統(tǒng)自動(dòng)分配空閑Cell,破除了LUN與RAID、Disk之間的捆綁關(guān)系,使RAID的最小維護(hù)單位由原來的磁盤變成了更小更靈活的Cell,實(shí)現(xiàn)了完全的虛擬化存儲(chǔ)架構(gòu)。3.1.1CRAID基于Cell的重建功能按照Cell維護(hù)健康狀態(tài),突破了傳統(tǒng)RAID對可容忍的磁盤數(shù)目的限制。比如,傳統(tǒng)的RAID5支持1塊磁盤故障,第2塊磁盤故障時(shí),RAID失效,不能繼續(xù)使用。在ODSP存儲(chǔ)軟件平臺(tái)的實(shí)現(xiàn)中,只要磁盤出錯(cuò)區(qū)域不在同一個(gè)Cell內(nèi),RAID中的數(shù)據(jù)仍然可以訪問,即RAID可容忍非同一個(gè)Cell內(nèi)多個(gè)磁盤發(fā)生介質(zhì)錯(cuò)誤,在極端的情況下,可能出現(xiàn)RAID中所有的成員磁盤上都存在介質(zhì)錯(cuò)誤,但是數(shù)據(jù)仍然可以訪問,提高了存儲(chǔ)產(chǎn)品對硬盤的容錯(cuò)性以及業(yè)務(wù)連續(xù)性。同時(shí),針對多個(gè)磁盤出錯(cuò)區(qū)域在同一個(gè)Cell內(nèi)的情況,ODSP存儲(chǔ)軟件平臺(tái)繼承了物理的處理方式,即這些磁盤錯(cuò)誤僅影響當(dāng)前的Cell,其他Cell仍然可以繼續(xù)訪問,使得錯(cuò)誤的影響范圍降到最小。3.1.2快速重建區(qū)別于傳統(tǒng)RAID先踢盤再重建的方式,CRAID的快速重建可只重建錯(cuò)誤磁盤上的損壞數(shù)據(jù)塊,未發(fā)生錯(cuò)誤的區(qū)域直接使用拷貝方式將數(shù)據(jù)塊復(fù)制到熱備盤,重建完成后,再將錯(cuò)誤磁盤轉(zhuǎn)移至IDDC磁盤診斷中心處理,該方式可明顯降低重建過程對RAID組性能造成的影響。傳統(tǒng)RAID組重建時(shí),最消耗性能和時(shí)間的原因是需要調(diào)用所有磁盤進(jìn)行異或校驗(yàn)??焖僦亟ㄓ捎趯⑷P校驗(yàn)改成了按Cell校驗(yàn)+磁盤復(fù)制,其校驗(yàn)任務(wù)只有傳統(tǒng)全盤重建的幾百分一或千分之一,校驗(yàn)時(shí)間幾乎可以忽略不記,而磁盤復(fù)制的速度可以達(dá)到磁盤讀寫的最大值。以1TB的SATA磁盤為例,在15塊盤的RAID中,全盤重建時(shí)間約30小時(shí),而快速重建的時(shí)間差最快可以達(dá)到6小時(shí)。3.1.3局部重建類似于快速重建,但不是重建熱備盤,而是只對原盤的變化部分進(jìn)行重建,使其同步。適用于磁盤未損壞,但發(fā)生過閃斷或人為誤操作,短時(shí)間內(nèi)拔出又插回的情況。該方法可重建5分鐘內(nèi)磁盤不在位過程中所丟失的數(shù)據(jù),重建時(shí)間短,極大降低RAID組受影響程度。3.1.4優(yōu)化重建僅重建被LUN使用的Cell,未使用的Cell不重建,如下圖,僅重建Cell1、2、3、4,Cell5、6不需重建;重建調(diào)度時(shí),優(yōu)先重建存在介質(zhì)錯(cuò)誤的Cell,然后再使用拷貝的方式重建其他Cell,以盡可能的避免該Cell所處的其它磁盤發(fā)生故障導(dǎo)致的Cell損壞;支持多重重建,可同時(shí)重建多個(gè)故障磁盤,如一個(gè)RAID組中的兩塊磁盤所處的不同Cell存在壞塊,可以兩個(gè)Cell并發(fā)重建,提高重建總體效率。3.1.5全盤重建與傳統(tǒng)RAID組一樣,適用于磁盤被拔走或者磁盤嚴(yán)重故障不能繼續(xù)使用的情況使用。關(guān)鍵技術(shù)3——大容量智能緩存管理(提升存儲(chǔ)性能)緩存調(diào)度是存儲(chǔ)陣列的核心機(jī)制,也是影響存儲(chǔ)控制器性能的最主要因素之一。由于技術(shù)上的限制,傳統(tǒng)存儲(chǔ)陣列的緩存容量小,擴(kuò)展困難,而且調(diào)優(yōu)管理非常復(fù)雜。在云計(jì)算環(huán)境下,存儲(chǔ)的并發(fā)I/O訪問量快速增長,數(shù)據(jù)存取熱點(diǎn)變動(dòng)頻繁,對存儲(chǔ)緩存的容量要求也急劇增長。與此同時(shí),大容量緩存對于存儲(chǔ)的緩存管理也提出了更高的要求。MS5000系列、MS3000系列、MS2500系列采用業(yè)界領(lǐng)先的智能緩存管理機(jī)制,大大提升了緩存的效率。容量按需配置:緩存大小是決定存儲(chǔ)陣列檔次的重要標(biāo)準(zhǔn),通過增加緩存能夠顯著的提升存儲(chǔ)性能。在緩存大小上,MS5000系列、MS3000系列、MS2500系列支持緩存靈活配置,用戶可根據(jù)實(shí)際的應(yīng)用需求來選擇。相對于采用更高的產(chǎn)品型號來增加性能的傳統(tǒng)方式,這種通過擴(kuò)展緩存來提高性能的方式,具有更高的性價(jià)比。全局智能調(diào)度:MMS5000系列、MS3000系列、MS2500系列采用智能緩存調(diào)度機(jī)制,對全局性緩存進(jìn)行管理。不僅單個(gè)控制器內(nèi)的讀、寫緩存可根據(jù)實(shí)際情況動(dòng)態(tài)調(diào)整,而且兩個(gè)控制器的緩存也無需對稱分配,以充分發(fā)揮控制器的性能。在具體調(diào)度策略上,讀、寫緩存被劃分為預(yù)留、共享、突發(fā)三大區(qū)塊,以滿足LUN的實(shí)時(shí)變化的性能需求。在這種機(jī)制下,LUN在大壓力下獲得大緩存空間,在小壓力下獲得小緩存空間,既保證單個(gè)LUN不存在性能瓶頸,也使得整個(gè)系統(tǒng)的緩存使用非常高效。數(shù)據(jù)安全可靠:在緩存數(shù)據(jù)的安全性上,不僅采用了緩存鏡像機(jī)制,而且具備掉電保護(hù)功能。在外部電源故障的情況下,寫緩存里的數(shù)據(jù)能夠被下刷保存到存儲(chǔ)陣列的前四塊磁盤(保留磁盤)里。當(dāng)供電恢復(fù)后,能夠從保留磁盤中將數(shù)據(jù)恢復(fù)回來。前四塊盤,部分空間預(yù)留,用于保存緩存數(shù)據(jù)前四塊盤,部分空間預(yù)留,用于保存緩存數(shù)據(jù)關(guān)鍵技術(shù)4——IDDC(主動(dòng)式磁盤檢測中心,提高數(shù)據(jù)安全)傳統(tǒng)意義的存儲(chǔ)安全,主要關(guān)注系統(tǒng)冗余性、數(shù)據(jù)保護(hù)二個(gè)方面,對磁盤安全的關(guān)注度不高。但是,據(jù)統(tǒng)計(jì),存儲(chǔ)系統(tǒng)的硬件故障90%以上都是由磁盤故障引發(fā)的。可以說,磁盤的安全才是存儲(chǔ)安全的根本?;诙嗄甏鎯?chǔ)維護(hù)經(jīng)驗(yàn)的深刻理解,MacroSAN開發(fā)了一套可以在不增加任何附加投資的條件下,最大化提高磁盤及RAID組安全性的,智能存儲(chǔ)磁盤維護(hù)檢測修復(fù)工具。IDDC:InitiativeDiskDiagnosisCenter,主動(dòng)式磁盤診斷中心該診斷中心包含了4個(gè)模塊(磁盤檢測、快速修復(fù)、壞塊復(fù)位、磁盤診斷),它可以通過預(yù)先設(shè)置的策略定期對磁盤進(jìn)行錯(cuò)誤檢測,用于發(fā)現(xiàn)磁盤中是否存在錯(cuò)誤碼。再根據(jù)錯(cuò)誤碼叛斷磁盤錯(cuò)誤類型,并進(jìn)行相應(yīng)的壞塊修復(fù)、磁盤遷移或磁盤修復(fù)等操作,以提早處理磁盤潛在故障隱患,降低RAID組重建損壞機(jī)率,提高設(shè)備穩(wěn)定性?!翊疟P檢測:(1)對所有磁盤進(jìn)行周期性全盤檢測,提前發(fā)現(xiàn)故障;(2)支持磁盤檢測速率動(dòng)態(tài)調(diào)整,不影響應(yīng)用性能;發(fā)現(xiàn)問題的磁盤交由診斷中心統(tǒng)一處理;●快速復(fù)位:結(jié)合CRAID的局部重建機(jī)制,可快速修復(fù)磁盤邏輯錯(cuò)誤,降低全盤重建機(jī)率?!駢膲K修復(fù):經(jīng)過檢測的磁盤發(fā)現(xiàn)存在壞塊(扇區(qū))后,會(huì)觸發(fā)磁盤自身的remap機(jī)制,將壞塊的指針重定向到好的保留扇區(qū)中。然后調(diào)用RAID組的校驗(yàn)功能,重建該數(shù)據(jù)塊,確保數(shù)據(jù)一致性。●磁盤診斷:所有告警磁盤、故障磁盤會(huì)在診斷中心進(jìn)行復(fù)診并嘗試修復(fù),減少磁盤故障誤判。修復(fù)后的磁盤自動(dòng)轉(zhuǎn)為全局熱備磁盤。●磁盤檢測:對所有磁盤進(jìn)行周期性全盤檢測,提前發(fā)現(xiàn)錯(cuò)誤并交由磁盤診斷中心統(tǒng)一處理。該功能可以通過以下幾個(gè)模塊實(shí)現(xiàn):快速復(fù)位磁盤子系統(tǒng)的核心功能之一就是磁盤錯(cuò)誤處理,在收到磁盤返回的磁盤錯(cuò)誤之后,根據(jù)不同的錯(cuò)誤,可以采取不同的錯(cuò)誤處理方案,包括:(1)重試,即針對磁盤可恢復(fù)的臨時(shí)性故障(磁盤的假故障,比如震動(dòng)引起的讀/寫錯(cuò)誤),磁盤子系統(tǒng)對命令進(jìn)行重試;(2)對磁盤下電再上電,即從硬件上復(fù)位磁盤,嘗試修復(fù)磁盤錯(cuò)誤,結(jié)合上面提到的RAID基于Cell的局部重建機(jī)制,復(fù)位磁盤過程中新寫入的數(shù)據(jù)可快速完成重建,恢復(fù)RAID的數(shù)據(jù)冗余性;磁盤錯(cuò)誤透傳,由RAID進(jìn)行處理。壞塊修復(fù)發(fā)現(xiàn)磁盤壞塊(扇區(qū)),根據(jù)RAID信息重建數(shù)據(jù),觸發(fā)磁盤自身的remap機(jī)制,實(shí)現(xiàn)壞塊替換磁盤在出廠前會(huì)留有一部份備用扇區(qū),當(dāng)正常使用的扇區(qū)出現(xiàn)損壞的情況下,磁盤會(huì)啟用remap自動(dòng)修復(fù)機(jī)制,將損壞扇區(qū)重定位到備用扇區(qū),這樣磁盤的整體容量和功能就不會(huì)受到影響,對于用戶來講,這個(gè)磁盤還是一個(gè)完整的好盤。采用remap機(jī)制把備用扇區(qū)替換到原始扇區(qū)后,雖然磁盤的功能得到恢復(fù),但是原始扇區(qū)中的數(shù)據(jù)是已經(jīng)丟失的,IDDC的壞塊修復(fù)功能可以根據(jù)RAID組校驗(yàn)信息,計(jì)算出損壞扇區(qū)中的數(shù)據(jù),并進(jìn)行恢復(fù),這個(gè)過程只是針對產(chǎn)生壞扇區(qū)的部份,而不需要對整個(gè)RAID進(jìn)行重建,重建過程所耗性能幾乎可以忽略不計(jì)。磁盤診斷所有告警磁盤、故障磁盤會(huì)在診斷中心進(jìn)行復(fù)診并嘗試修復(fù),減少磁盤故障誤判。修復(fù)后的磁盤自動(dòng)轉(zhuǎn)為全局熱備磁盤。磁盤檢測中心對磁盤進(jìn)行掃描后,會(huì)根據(jù)發(fā)現(xiàn)的磁盤錯(cuò)誤類型進(jìn)行標(biāo)記,如warning盤、fail盤等,并通過相應(yīng)的功能模塊將這部分磁盤替換出來,轉(zhuǎn)移到磁盤診斷中心由于磁盤檢測時(shí)只能對磁盤進(jìn)行全讀操作,對于一些邏輯錯(cuò)誤無法進(jìn)行準(zhǔn)確的判斷。所以磁盤診斷中心會(huì)對磁盤進(jìn)行全寫操作,并對邏輯錯(cuò)誤嘗試進(jìn)行修復(fù)??梢酝ㄟ^磁盤診斷中心修復(fù)的磁盤會(huì)被設(shè)置為熱備磁盤。不能通過的會(huì)被設(shè)為fail磁盤,并會(huì)通過通知模塊提醒用戶更換。關(guān)鍵技術(shù)5——雙活存儲(chǔ)技術(shù)(保障業(yè)務(wù)連續(xù)性)數(shù)據(jù)信息是當(dāng)今社會(huì)進(jìn)步、發(fā)展的關(guān)鍵,數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性顯得尤其重要。當(dāng)前大部分信息中心都采用中心服務(wù)器和單臺(tái)存儲(chǔ)的模式,服務(wù)器具有較高可靠性和可用性,存儲(chǔ)設(shè)備提供數(shù)據(jù)支持,一旦服務(wù)器或存儲(chǔ)出現(xiàn)故障,業(yè)務(wù)就會(huì)被中斷,并可能丟失關(guān)鍵數(shù)據(jù)。在一些行業(yè)或關(guān)鍵應(yīng)用,不允許有業(yè)務(wù)中斷和數(shù)據(jù)丟失。對于維護(hù)人員,數(shù)據(jù)中心應(yīng)用規(guī)模加大的同時(shí),帶來了更大的管理難度,如何在故障情況下盡快恢復(fù)使用并保證數(shù)據(jù)的安全,已經(jīng)成為一個(gè)日漸突出的問題。雙活存儲(chǔ)方案,正是解決本地由服務(wù)器或存儲(chǔ)軟硬件故障而引起的問題。該技術(shù)較為成熟,具有維護(hù)簡單、穩(wěn)定可靠等優(yōu)點(diǎn),能充分保障業(yè)務(wù)連續(xù)和數(shù)據(jù)安全。災(zāi)備運(yùn)行維護(hù)策略災(zāi)難恢復(fù)預(yù)案設(shè)計(jì)制定完備災(zāi)難恢復(fù)預(yù)案的主要目的是:規(guī)范災(zāi)難恢復(fù)流程,使重要信息系統(tǒng)在災(zāi)難發(fā)生后能夠快速地恢復(fù)數(shù)據(jù)處理系統(tǒng)運(yùn)行和業(yè)務(wù)運(yùn)作;重要信息系統(tǒng)可以根據(jù)災(zāi)難恢復(fù)預(yù)案對其數(shù)據(jù)處理中心的災(zāi)難恢復(fù)能力進(jìn)行測試;災(zāi)難恢復(fù)預(yù)案可作為相關(guān)人員的培訓(xùn)資料之一。災(zāi)難恢復(fù)的目標(biāo)和范圍災(zāi)難恢復(fù)的目標(biāo)災(zāi)難恢復(fù)是指利用技術(shù)、管理手段以及相關(guān)資源,確保已有的關(guān)鍵數(shù)據(jù)和關(guān)鍵業(yè)務(wù)在災(zāi)難發(fā)生后能夠快速的恢復(fù)數(shù)據(jù)處理系統(tǒng)運(yùn)行和業(yè)務(wù)運(yùn)作。災(zāi)難恢復(fù)可以防范的災(zāi)難包括地震、水災(zāi)等自然災(zāi)難以及火災(zāi)、戰(zhàn)爭、恐怖襲擊、網(wǎng)絡(luò)攻擊、設(shè)備系統(tǒng)故障、人為破壞等無法預(yù)料的突發(fā)事件。通過災(zāi)難恢復(fù)系統(tǒng)的建設(shè),提高抵御災(zāi)難和重大事故的能力,減少災(zāi)難打擊和重大事故造成的損失,確保關(guān)鍵數(shù)據(jù)和關(guān)鍵業(yè)務(wù)的數(shù)據(jù)安全和作業(yè)持續(xù)性。災(zāi)難恢復(fù)的范圍信息系統(tǒng)的災(zāi)難恢復(fù)工作,包括災(zāi)難恢復(fù)規(guī)劃和容災(zāi)備份中心的日常運(yùn)行,還包括災(zāi)難發(fā)生后的應(yīng)急響應(yīng)、關(guān)鍵業(yè)務(wù)功能在容災(zāi)備份中心的恢復(fù)和重續(xù)運(yùn)行,以及主系統(tǒng)的災(zāi)后重建和回退工作。災(zāi)難恢復(fù)的組織機(jī)構(gòu)組織機(jī)構(gòu)的設(shè)立信息系統(tǒng)的使用或管理組織(以下簡稱“組織”)應(yīng)結(jié)合其日常組織機(jī)構(gòu)建立災(zāi)難恢復(fù)的組織機(jī)構(gòu),并明確其職責(zé)。其中一些人可負(fù)責(zé)兩種或多種職責(zé),一些職位可由多人擔(dān)任。每一個(gè)團(tuán)隊(duì)都應(yīng)該得到培訓(xùn)并時(shí)刻準(zhǔn)備在中斷事件發(fā)生需要啟動(dòng)恢復(fù)預(yù)案時(shí)展開工作。這些團(tuán)隊(duì)將負(fù)責(zé)對事件進(jìn)行響應(yīng)、對功能進(jìn)行恢復(fù)和使系統(tǒng)回到正常運(yùn)行狀態(tài),恢復(fù)人員應(yīng)該被安排到其中的一個(gè)團(tuán)隊(duì)中。這樣,他們就需要明確了解團(tuán)隊(duì)在恢復(fù)工作中的目標(biāo)、他們要執(zhí)行的每一個(gè)步驟以及他們的團(tuán)隊(duì)與其它團(tuán)隊(duì)的關(guān)系。根據(jù)所涉及到的系統(tǒng)不同則團(tuán)隊(duì)的需求也就不同。不同的機(jī)構(gòu)中各團(tuán)隊(duì)的規(guī)模、團(tuán)隊(duì)名稱和構(gòu)成也不相同災(zāi)難恢復(fù)的組織機(jī)構(gòu)由管理、業(yè)務(wù)、技術(shù)和行政后勤等人員組成,一般分為災(zāi)難恢復(fù)領(lǐng)導(dǎo)小組、災(zāi)難恢復(fù)規(guī)劃實(shí)施組和災(zāi)難恢復(fù)日常運(yùn)行組和技術(shù)專家組。其中,災(zāi)難恢復(fù)領(lǐng)導(dǎo)小組主要由單位高級管理人員組成;實(shí)施組的人員在任務(wù)完成后可成為日常運(yùn)行組的成員,根據(jù)職能不同還可以細(xì)分為損害評估小組、操作系統(tǒng)管理小組、系統(tǒng)軟件小組、服務(wù)器恢復(fù)小組、數(shù)據(jù)庫恢復(fù)小組、網(wǎng)絡(luò)恢復(fù)小組、應(yīng)用恢復(fù)小組等等。組織還可聘請外部專家協(xié)助災(zāi)難恢復(fù)實(shí)施工作,也可委托外部機(jī)構(gòu)承擔(dān)實(shí)施組以及日常運(yùn)行組的部分或全部工作。另外,視單位實(shí)際情況,還可選擇組建“后勤保障組”和“媒體攻關(guān)組”等。組織機(jī)構(gòu)圖根據(jù)各小組的工作職能和職責(zé),可劃分災(zāi)難恢復(fù)的組織架構(gòu)圖如下所示災(zāi)難預(yù)警處理流程任何人員在發(fā)現(xiàn)災(zāi)難即將發(fā)生時(shí),應(yīng)立即報(bào)告災(zāi)難預(yù)警值班人員(日常運(yùn)行組成員),由值班人員確認(rèn)后及時(shí)報(bào)告有關(guān)領(lǐng)導(dǎo),并通知相關(guān)技術(shù)人員,為其正常關(guān)閉系統(tǒng),減少損失贏得時(shí)間。在某一時(shí)刻,單位的生產(chǎn)系統(tǒng)及其災(zāi)難保護(hù)系統(tǒng)總處于以下某一確定狀態(tài)。預(yù)警狀態(tài)屬于正常狀態(tài)和災(zāi)難狀態(tài)之間的臨界點(diǎn)。在正常狀態(tài)、預(yù)警狀態(tài)和演習(xí)狀態(tài)下都有可能發(fā)生人為的、有先兆的、可預(yù)料或不可預(yù)料的各種災(zāi)難,進(jìn)入災(zāi)難狀態(tài)。而正常狀態(tài)和演習(xí)狀態(tài)下發(fā)生災(zāi)難直接進(jìn)入災(zāi)難狀態(tài)的情況一般是屬于不可預(yù)料或沒有先兆的。我們希望在可預(yù)料或有先兆的災(zāi)難發(fā)生之前,能夠有一套規(guī)范、合理的處理流程,能夠及時(shí)排除故障、消除警報(bào),避免災(zāi)難的發(fā)生或盡量的減少災(zāi)難造成的損害,這就是災(zāi)難預(yù)警處理流程所應(yīng)具備的功能。災(zāi)難預(yù)警處理的一般流程如下:通知啟動(dòng)流程通知啟動(dòng)流程定義在探測到系統(tǒng)中斷或緊急情況發(fā)生或即將到來時(shí)采取的初步行動(dòng)。這個(gè)階段包括通知恢復(fù)人員、評估系統(tǒng)損害和實(shí)施計(jì)劃的運(yùn)作等。一旦完成了通知啟動(dòng)階段的活動(dòng),恢復(fù)人員將準(zhǔn)備在臨時(shí)系統(tǒng)上執(zhí)行恢復(fù)系統(tǒng)功能的應(yīng)急措施。事件通報(bào)流程任何人員在發(fā)現(xiàn)緊急事件發(fā)生或即將發(fā)生時(shí),應(yīng)按預(yù)定的流程報(bào)告相關(guān)人員,并由相關(guān)責(zé)任人員進(jìn)行初步判斷、通知和處置。災(zāi)難的發(fā)生可能有先兆也可能沒有先兆。例如,颶風(fēng)將影響某個(gè)地區(qū)或計(jì)算機(jī)病毒會(huì)在某日發(fā)作經(jīng)常會(huì)得到事先通知。但是,設(shè)備故障或犯罪活動(dòng)就可能沒有先兆。事件通報(bào)處理流程應(yīng)該包含這兩種情況。該流程應(yīng)該描述在工作時(shí)間和非工作時(shí)間內(nèi)通知恢復(fù)人員的方法,適當(dāng)?shù)耐ㄖ獙p少對IT系統(tǒng)的影響是很重要的。在一些情況下,它可以為允許系統(tǒng)人員正常關(guān)閉系統(tǒng)避免系統(tǒng)崩潰贏得足夠的時(shí)間。在災(zāi)難發(fā)生后,應(yīng)該通知損害評估負(fù)責(zé)人,使其能夠確定事態(tài)的嚴(yán)重程度和下一步將要采取的行動(dòng)。當(dāng)損害評估完成后,應(yīng)該通知相應(yīng)的恢復(fù)和支持小組。可以通過各種方法完成通知,包括電話(包括移動(dòng)電話)、電子郵件以及電臺(tái)、電視廣播和Web網(wǎng)站等。由于無法確定能否有效回復(fù),所以通過電子郵件發(fā)送通知應(yīng)該謹(jǐn)慎從事。事件通報(bào)流程中應(yīng)該定義在事件發(fā)生后人員無法聯(lián)絡(luò)時(shí)的采取的措施。一種通用的方法是呼叫樹,這種技術(shù)指定特定人員執(zhí)行通知任務(wù),此人負(fù)責(zé)通知其它的恢復(fù)人員。呼叫樹應(yīng)該包括主要的和備用的聯(lián)絡(luò)方法。需要通知的人員應(yīng)該在計(jì)劃附錄中的聯(lián)系清單中標(biāo)明。通知還應(yīng)該發(fā)給會(huì)因?yàn)椴恢槎艿截?fù)面影響的外部機(jī)構(gòu)或互聯(lián)的伙伴系統(tǒng),與外部機(jī)構(gòu)相連的每一個(gè)互聯(lián)系統(tǒng)應(yīng)互相協(xié)助,協(xié)助的方式應(yīng)該根據(jù)所提供的系統(tǒng)互聯(lián)協(xié)議確定。通知中所傳遞的信息類型應(yīng)該在預(yù)案中說明。所傳遞的信息數(shù)量和詳細(xì)程度可依據(jù)被通知的團(tuán)隊(duì)而定。根據(jù)需要,通知信息可包括但不限于以下內(nèi)容:所發(fā)生或?qū)l(fā)生的緊急情況的性質(zhì)死亡或受傷情況任何已知的評估結(jié)果響應(yīng)和恢復(fù)的細(xì)節(jié)何時(shí)何地召集會(huì)議介紹簡況或聽取進(jìn)一步的響應(yīng)指令在評估期間進(jìn)行重新部署準(zhǔn)備的指令使用呼叫樹完成通知的指令(如果需要)損害評估流程要確定應(yīng)急事件后如何實(shí)施應(yīng)急計(jì)劃,對系統(tǒng)損害性質(zhì)和程度的評估是非常重要的。在緊急事件發(fā)生后,災(zāi)難恢復(fù)責(zé)任人應(yīng)第一時(shí)間召集相應(yīng)的專業(yè)人員對緊急事件進(jìn)行慎重評估,確定事態(tài)的嚴(yán)重程度,以及緊急事件對信息系統(tǒng)造成的影響程度,并最終確定下一步將要采取的行動(dòng)。損害評估流程對于不同的系統(tǒng)是不同的,但是應(yīng)該涉及到但不限于以下領(lǐng)域:造成緊急情況或中斷的原因潛在的附加中斷或損失受到緊急情況影響的區(qū)域物理構(gòu)架(如數(shù)據(jù)中心結(jié)構(gòu)的完整性、電源、電信以及制熱、通風(fēng)和空調(diào)的情況)的狀況IT設(shè)備的總量和功能狀態(tài)(如具備完整功能、具備部分功能或喪失功能)IT設(shè)備及其存貨的損失類型(如水害、火災(zāi)或熱能、物理以及電涌影響)被更換的項(xiàng)目(如硬件、軟件、固件或支持材料)估計(jì)恢復(fù)正常服務(wù)所需的時(shí)間在書面計(jì)劃無法得到的情況下,具有損害評估職責(zé)的人員應(yīng)該了解和能夠執(zhí)行這些流程。災(zāi)難宣告流程應(yīng)預(yù)先制定災(zāi)難恢復(fù)預(yù)案啟動(dòng)的條件。當(dāng)損害評估的結(jié)果達(dá)到一項(xiàng)或多項(xiàng)啟動(dòng)條件時(shí),領(lǐng)導(dǎo)小組負(fù)責(zé)人將正式發(fā)出災(zāi)難宣告,宣布啟動(dòng)災(zāi)難恢復(fù)預(yù)案,并根據(jù)宣告流程通知各有關(guān)部門。各機(jī)構(gòu)的啟動(dòng)條件各不相同,應(yīng)該在災(zāi)難宣告流程中予以說明。條件可以基于以下方面:人員的安全和/或設(shè)施損失的程度系統(tǒng)損失的程度(如物理的、運(yùn)作的或成本的)系統(tǒng)對于機(jī)構(gòu)使命的影響程度(如保護(hù)資產(chǎn)的關(guān)鍵基礎(chǔ)設(shè)施)預(yù)期的中斷持續(xù)時(shí)間一旦明確了系統(tǒng)損害,應(yīng)急計(jì)劃協(xié)調(diào)人就可以選擇適當(dāng)?shù)幕謴?fù)策略,并通知相關(guān)的恢復(fù)團(tuán)隊(duì)。災(zāi)難恢復(fù)處理流程完成事件通報(bào)、損害評估和災(zāi)難宣告流程并通知相關(guān)人員、調(diào)動(dòng)相關(guān)恢復(fù)團(tuán)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 野生動(dòng)物疫病監(jiān)測與獸醫(yī)公共衛(wèi)生考核試卷
- 軟件測試工程師考試輕松掌握試題及答案
- 焙烤食品制造企業(yè)的營銷渠道與客戶關(guān)系管理考核試卷
- 公路工程生態(tài)設(shè)計(jì)理念試題及答案
- 船舶設(shè)計(jì)與仿真技術(shù)考核試卷
- 嵌入式開發(fā)實(shí)現(xiàn)中的思維方式探討試題及答案
- 現(xiàn)代數(shù)據(jù)庫與網(wǎng)絡(luò)服務(wù)整合試題及答案
- 大學(xué)公寓社區(qū)管理制度
- 公司現(xiàn)場定置管理制度
- 計(jì)算機(jī)二級MySQL實(shí)務(wù)題目及答案
- (全冊完整16份)北師大版五年級下冊100道口算題大全
- 維修電工求職簡歷
- 人教版歷史八年級上冊知識(shí)點(diǎn)
- 麻醉藥品和精神藥品培訓(xùn)試題
- GB/T 799-2020地腳螺栓
- 非小細(xì)胞肺癌寡轉(zhuǎn)移灶中立體定向放療的運(yùn)用,放射醫(yī)學(xué)論文
- 遠(yuǎn)足拉練動(dòng)員大會(huì)課件
- 出租房屋安全檢查記錄
- 夏季養(yǎng)胃知識(shí)課件
- 人教版PEP六年級英語下冊單詞聽寫(帶四線格)
- 國家開放大學(xué)《財(cái)務(wù)管理#》形考任務(wù)1參考答案
評論
0/150
提交評論