XXX系統(tǒng)維護(hù)及機(jī)房運維綜合管理方案_第1頁
XXX系統(tǒng)維護(hù)及機(jī)房運維綜合管理方案_第2頁
XXX系統(tǒng)維護(hù)及機(jī)房運維綜合管理方案_第3頁
XXX系統(tǒng)維護(hù)及機(jī)房運維綜合管理方案_第4頁
XXX系統(tǒng)維護(hù)及機(jī)房運維綜合管理方案_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、運維服務(wù)方案2016年5月18日XXX系統(tǒng)維護(hù)及機(jī)房運維方案二零一七年 六 月目 錄1服務(wù)內(nèi)容.3 1.1 服務(wù)目標(biāo).3 1.2 信息資產(chǎn)統(tǒng)計服務(wù).3 1.3 網(wǎng)絡(luò)、安全系統(tǒng)運維服務(wù).4 1.4 主機(jī)系統(tǒng)運維服務(wù).6 1.5 存儲系統(tǒng)運維服務(wù).101.6 數(shù)據(jù)安全存儲及災(zāi)備運維服務(wù).111.6.1 傳統(tǒng)的災(zāi)備方式.111.6.2 容災(zāi)方案的關(guān)鍵指標(biāo).131.6.3 常見的備份策略.141.6.4 容災(zāi)的核心問題.151.6.5 容災(zāi)的實現(xiàn)方式.161.6.6 異地容災(zāi)技術(shù).181.6.7 災(zāi)難恢復(fù)級別.201.7 容災(zāi)建設(shè)方式.211.7.1 企業(yè)信息系統(tǒng)保護(hù)層次.211.7.2 容災(zāi)技術(shù)模型

2、.231.7.3 業(yè)務(wù)平臺的保護(hù)-業(yè)務(wù)處理能力的冗余.231.7.4 數(shù)據(jù)平臺的保護(hù)-業(yè)務(wù)狀態(tài)數(shù)據(jù)的復(fù)制.241.7.5 接入平臺冗余和貼換.241.7.6 容災(zāi)模式.241.7.6.1 容災(zāi)層次.251.7.6.2 容災(zāi)范圍.251.7.6.3 同級容災(zāi)或降級容災(zāi).261.7.6.4 容災(zāi)技術(shù)概述.271.7.6.5 基于存儲的數(shù)據(jù)復(fù)制技術(shù)建設(shè)容災(zāi)系統(tǒng).281.7.6.6 小結(jié).312運維服務(wù)流程.323服務(wù)管理制度規(guī)范.34 3.1 服務(wù)時間. .34 3.2 行為規(guī)范. .34 3.3 現(xiàn)場服務(wù)支持規(guī)范. .35 3.4 問題記錄規(guī)范. . .354應(yīng)急服務(wù)響應(yīng)措施. .37 4.1 應(yīng)

3、急基本流程 . .37 4.2 預(yù)防措施. .37 4.3 突發(fā)事件應(yīng)急策略 .381 服務(wù)內(nèi)容1.1 服務(wù)目標(biāo)可為提供的運行維護(hù)服務(wù)包括,信息系統(tǒng)相關(guān)的主機(jī)設(shè)備、操作系統(tǒng)、存儲設(shè)備容災(zāi)的運行維護(hù)服務(wù),保證用戶現(xiàn)有的信息系統(tǒng)的正常運行,降低整體管理成本,提高網(wǎng)絡(luò)信息系統(tǒng)的整體服務(wù)水平。同時根據(jù)日常維護(hù)的數(shù)據(jù)和記錄,提供用戶信息系統(tǒng)的整體建設(shè)規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。用戶信息系統(tǒng)的組成主要可分為兩類:硬件設(shè)備和軟件系統(tǒng)。硬件設(shè)備包括網(wǎng)絡(luò)設(shè)備、安全設(shè)備、主機(jī)設(shè)備、存儲設(shè)備等;軟件設(shè)備可分為操作系統(tǒng)軟件、典型應(yīng)用軟件(如:數(shù)據(jù)庫軟件、中間件軟件等)、業(yè)務(wù)應(yīng)用軟件等。通過運行

4、維護(hù)服務(wù)的有效管理來提升用戶信息系統(tǒng)的服務(wù)效率,協(xié)調(diào)各業(yè)務(wù)應(yīng)用系統(tǒng)的內(nèi)部運作,改善網(wǎng)絡(luò)信息系統(tǒng)部門與業(yè)務(wù)部門的溝通,提高服務(wù)質(zhì)量。結(jié)合用戶現(xiàn)有的環(huán)境、組織結(jié)構(gòu)、IT資源和管理流程的特點,從流程、人員和技術(shù)三方面來規(guī)劃用戶的網(wǎng)絡(luò)信息系統(tǒng)的結(jié)構(gòu)。將用戶的運行目標(biāo)、業(yè)務(wù)需求與IT服務(wù)的相協(xié)調(diào)一致。提供的信息系統(tǒng)服務(wù)的目標(biāo)是,對用戶現(xiàn)有的信息系統(tǒng)基礎(chǔ)資源進(jìn)行監(jiān)控和管理,及時掌握網(wǎng)絡(luò)信息系統(tǒng)資源現(xiàn)狀和配置信息,反映信息系統(tǒng)資源的可用性情況和健康狀況,創(chuàng)建一個可知可控的IT環(huán)境,從而保證用戶信息系統(tǒng)的各類業(yè)務(wù)應(yīng)用系統(tǒng)的可靠、高效、持續(xù)、安全運行。服務(wù)項目范圍覆蓋的信息系統(tǒng)資源以下方面的關(guān)鍵狀態(tài)及參數(shù)指標(biāo):

5、 運行狀態(tài)、故障情況 配置信息 可用性情況及健康狀況性能指標(biāo)1.2 信息資產(chǎn)統(tǒng)計服務(wù)此項服務(wù)為基本服務(wù),包含在運行維護(hù)服務(wù)中,幫助我們對用戶現(xiàn)有的信息資產(chǎn)情況進(jìn)行了解,更好的提供系統(tǒng)的運行維護(hù)服務(wù)。機(jī)房服務(wù)內(nèi)容包括: 機(jī)房電源、溫度、濕度信息統(tǒng)計記錄 硬件設(shè)備型號、數(shù)量、版本等信息統(tǒng)計記錄 軟件產(chǎn)品型號、版本和補(bǔ)丁等信息統(tǒng)計記錄 存儲產(chǎn)品型號、版本和性能等信息統(tǒng)計記錄 網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)路由、網(wǎng)絡(luò)IP地址統(tǒng)計記錄 綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制 其它附屬設(shè)備的統(tǒng)計記錄1.2.1 機(jī)房電源、溫度、濕度要求 頻率輸入電壓相位電流開關(guān)備注50Hz220V單相 2線+地線20A單相交流電參數(shù)運行狀態(tài)非運行狀態(tài)溫

6、度 10-4010-50相對濕度 %8-808-90溫度變化 10 10 硬件設(shè)備清單如下表統(tǒng)計:1.3 網(wǎng)絡(luò)、安全系統(tǒng)運維服務(wù)從網(wǎng)絡(luò)的連通性、網(wǎng)絡(luò)的性能、網(wǎng)絡(luò)的監(jiān)控管理三個方面實現(xiàn)對網(wǎng)絡(luò)系統(tǒng)的運維管理。網(wǎng)絡(luò)、安全系統(tǒng)基本服務(wù)內(nèi)容:序號服務(wù)模塊內(nèi)容描述提供方1現(xiàn)場備件安裝配合用戶進(jìn)行,按備件到達(dá)現(xiàn)場時間工程師到達(dá)現(xiàn)場xxx公司2現(xiàn)場軟件升級首先分析軟件升級的必要性和風(fēng)險,配合用戶進(jìn)行軟件升級xxx公司3現(xiàn)場故障診斷按服務(wù)級別:724小時 58小時xxx公司4電話遠(yuǎn)程技術(shù)支持724小時xxx公司5問題管理系統(tǒng)對遇到的問題進(jìn)行匯總和發(fā)布xxx公司 機(jī)房網(wǎng)絡(luò)核心交換機(jī)信息系統(tǒng)管理單位: 維保單位:

7、設(shè)備名: 設(shè)備型號:管理IP:檢查內(nèi)容參考標(biāo)準(zhǔn)檢查結(jié)果檢查結(jié)論巡視方法描述巡檢周期硬件運行狀態(tài)電源運行狀態(tài)正常 異常風(fēng)扇運行狀態(tài)正常 異常模塊運行狀態(tài)正常 異常系統(tǒng)運行狀態(tài)檢查VLAN 狀態(tài)正常 異常配置 狀態(tài)正常 異常OSPF 狀態(tài)正常 異常日志檢查日志 狀態(tài)正常 異常其他檢查內(nèi)容正常 異常正常 異常正常 異常(1) 用戶現(xiàn)場技術(shù)人員值守可根據(jù)用戶的需求提供長期的用戶現(xiàn)場技術(shù)人員值守服務(wù),保證網(wǎng)絡(luò)的實時連通和可用,保障接入交換機(jī)、匯聚交換機(jī)和核心交換機(jī)的正常運轉(zhuǎn)。現(xiàn)場值守的技術(shù)人員每天記錄網(wǎng)絡(luò)交換機(jī)的端口是否可以正常使用,網(wǎng)絡(luò)的轉(zhuǎn)發(fā)和路由是否正常進(jìn)行,交換機(jī)的性能檢測,進(jìn)行整體網(wǎng)絡(luò)性能評估,

8、針對網(wǎng)絡(luò)的利用率進(jìn)行優(yōu)化并提出網(wǎng)絡(luò)擴(kuò)容和優(yōu)化的建議?,F(xiàn)場值守人員還進(jìn)行安全設(shè)備的日常運行狀態(tài)的監(jiān)控,對各種安全設(shè)備的日志檢查,對重點事件進(jìn)行記錄,對安全事件的產(chǎn)生原因進(jìn)行判斷和解決,及時發(fā)現(xiàn)問題,防患于未然。同時能夠?qū)υO(shè)備的運行數(shù)據(jù)進(jìn)行記錄,形成報表進(jìn)行統(tǒng)計分析,便于進(jìn)行網(wǎng)絡(luò)系統(tǒng)的分析和故障的提前預(yù)知。具體記錄的數(shù)據(jù)包括: 配置數(shù)據(jù) 性能數(shù)據(jù) 故障數(shù)據(jù)(2) 現(xiàn)場巡檢服務(wù)現(xiàn)場巡檢服務(wù)是對客戶的設(shè)備及網(wǎng)絡(luò)進(jìn)行全面檢查的服務(wù)項目,通過該服務(wù)可使客戶獲得設(shè)備運行的第一手資料,最大可能地發(fā)現(xiàn)存在的隱患,保障設(shè)備穩(wěn)定運行。同時,將有針對性地提出預(yù)警及解決建議,使客戶能夠提早預(yù)防,最大限度降低運營風(fēng)險。巡

9、檢包括的內(nèi)容如下:編號內(nèi)容1硬件運行狀態(tài)檢查項目單板狀態(tài)檢查電源模塊狀態(tài)檢查風(fēng)扇狀態(tài)檢查整機(jī)指示燈狀態(tài)檢查機(jī)框防塵網(wǎng)檢查機(jī)房溫度、濕度檢查設(shè)備地線檢查2軟件運行情況檢查項目設(shè)備運行情況檢查網(wǎng)絡(luò)報文分析設(shè)備對接運行狀況檢查路由運行情況檢查3網(wǎng)絡(luò)整體運行情況調(diào)查網(wǎng)絡(luò)運行問題調(diào)查網(wǎng)絡(luò)變更情況調(diào)查網(wǎng)絡(luò)歷史故障調(diào)查(3) 網(wǎng)絡(luò)運行分析與管理服務(wù)網(wǎng)絡(luò)運行分析與管理服務(wù)是指工程師通過對網(wǎng)絡(luò)運行狀況、網(wǎng)絡(luò)問題進(jìn)行周期性檢查、分析后,為客戶提出指導(dǎo)性建議的一種綜合性高級服務(wù),其內(nèi)容包括: 服務(wù)內(nèi)容服務(wù)優(yōu)點向客戶提供網(wǎng)絡(luò)專家電話號碼。保證重大問題第一連線至網(wǎng)絡(luò)專家。網(wǎng)絡(luò)專家組每周與客戶進(jìn)行不少于2小時的電話技術(shù)交

10、流以最小成本保證及時解答客戶關(guān)心的技術(shù)問題,并就某一領(lǐng)域技術(shù)問題展開深層次溝通。每月向客戶提交CASE匯總分析報告,并可擴(kuò)展到每年17次(月度、季度、年度)使客戶了解網(wǎng)絡(luò)歷史故障情況以及故障預(yù)防建議,最大程度減少網(wǎng)絡(luò)故障隱患,更高效的進(jìn)行網(wǎng)絡(luò)管理。(4) 重要時刻專人值守服務(wù)深刻知道保證重要時刻設(shè)備穩(wěn)定運行對客戶成功尤為關(guān)鍵,因此,可對客戶提供重要時刻的專人現(xiàn)場值守支持,包括政府客戶的重大會議期間、金融客戶的年終結(jié)算日、運營商客戶的生產(chǎn)網(wǎng)重大割接或其它任何客戶認(rèn)為可能對其業(yè)務(wù)運營產(chǎn)生重大影響的時刻。如需專人值守,客戶需至少提前3周與授權(quán)服務(wù)商客戶服務(wù)經(jīng)理聯(lián)系。對每位合約客戶,授權(quán)服務(wù)商均需按事

11、先合同約定提供專人值守服務(wù)??蛻羧缧璩龊贤s定范圍的更多值守支持,需額外支付相應(yīng)人力和差旅費用。1.4 主機(jī)系統(tǒng)運維服務(wù)現(xiàn)在造成IT架構(gòu)不可用的原因有很多,主要包括非計劃性宕機(jī)和計劃性宕機(jī)兩大類,其中,非計劃性宕機(jī)主要是由計算機(jī)故障或數(shù)據(jù)故障引起的;計劃性宕機(jī)主要是由于生產(chǎn)系統(tǒng)的數(shù)據(jù)改變或系統(tǒng)改變引起的。(1)、非計劃性宕機(jī)非計劃性宕機(jī)主要包括主機(jī)宕機(jī)、數(shù)據(jù)故障宕機(jī)、存儲故障、人為錯誤、數(shù)據(jù)損壞、站點故障等。 主機(jī)故障宕機(jī)當(dāng)主機(jī)系統(tǒng)或數(shù)據(jù)庫服務(wù)器出現(xiàn)意外故障并導(dǎo)致服務(wù)中斷時,主機(jī)系統(tǒng)就會發(fā)生故障。 數(shù)據(jù)故障宕機(jī)數(shù)據(jù)故障是指丟失、損壞或破壞關(guān)鍵企業(yè)數(shù)據(jù)。數(shù)據(jù)故障的原因比計算機(jī)故障更加錯綜復(fù)雜,

12、可能由于存儲硬件、人為錯誤、損壞或站點故障引起。 存儲故障單一存儲配置,目前都是采用磁盤RAID技術(shù)加熱備磁盤來解決,因此存儲系統(tǒng)的故障主要是由機(jī)房電力故障或人為因素導(dǎo)致存儲設(shè)備的電源發(fā)生故障。 人為錯誤人為錯誤包括:誤刪除重要數(shù)據(jù)或升級語句中不正確的“WHERE”子句更新了比預(yù)定更多的行。 數(shù)據(jù)損壞數(shù)據(jù)損壞通常由 I/O 堆棧中的故障組件導(dǎo)致,例如,數(shù)據(jù)庫將 I/O 作為更新交易的結(jié)果,該數(shù)據(jù)庫 I/O 將在各個組件中進(jìn)行傳輸,包括:操作系統(tǒng)的 I/O 代碼、文件系統(tǒng)、卷管理器、設(shè)備驅(qū)動程序、主機(jī)總線適配器、存儲控制器和磁盤驅(qū)動器,直至最后被寫入。I/O 堆棧中任何組件發(fā)生錯誤或硬件故障,都

13、可能“變換”數(shù)據(jù)中的一些位,進(jìn)而導(dǎo)致?lián)p壞的數(shù)據(jù)被寫入數(shù)據(jù)庫中,這一損壞可能是數(shù)據(jù)庫控制信息或用戶數(shù)據(jù),它們對于數(shù)據(jù)庫的正常工作至關(guān)重要;同樣,磁盤故障也可能損壞數(shù)據(jù)。 站點故障數(shù)據(jù)保護(hù)特性提供了預(yù)防災(zāi)難性事件的能力,這些事件可能在某一段時間內(nèi)嚴(yán)重減緩站點的處理能力,這些事件包括文件損壞、自然災(zāi)害、電力或通信中斷,甚至恐怖活動。(2)、計劃性宕機(jī)計劃性宕機(jī)是IT系統(tǒng)在運行階段所不可避免的,但I(xiàn)T系統(tǒng)停機(jī)運維會影響到數(shù)據(jù)庫停止對外提供服務(wù),會對業(yè)務(wù)運營造成一定影響,特別是對724365的業(yè)務(wù)系統(tǒng)、計費系統(tǒng)、在線交易系統(tǒng)等。計劃內(nèi)停機(jī)包括例行操作、定期維護(hù)和部署新設(shè)備等:例行操作指頻繁進(jìn)行的維護(hù)任務(wù)

14、,包括備份、性能管理、用戶管理和批處理;定期維護(hù),如安裝補(bǔ)丁和重新配置系統(tǒng),只是偶爾進(jìn)行,以更新數(shù)據(jù)庫、應(yīng)用程序、操作系統(tǒng)、中間件或網(wǎng)絡(luò);部署新設(shè)備包括硬件、操作系統(tǒng)、據(jù)庫、應(yīng)用程序、中間件或網(wǎng)絡(luò)的重大升級。申請計劃停機(jī)時不僅要考慮計劃的停機(jī)時間,同時還要考慮因停機(jī)造成的對整個業(yè)務(wù)系統(tǒng)的影響。 數(shù)據(jù)更改導(dǎo)致的停機(jī)對于數(shù)據(jù)的更改例如增加數(shù)據(jù)空間、改變數(shù)據(jù)庫的對象,添加及刪除數(shù)據(jù)庫對象,對數(shù)據(jù)庫的參數(shù)進(jìn)行調(diào)整等操作,都有可能導(dǎo)致計劃性停機(jī)。 系統(tǒng)更改而導(dǎo)致的停機(jī)由于系統(tǒng)更改導(dǎo)致的停機(jī)主要表現(xiàn)在兩方面:一是主機(jī)系統(tǒng)的更改,例如更新設(shè)備、添加硬件、調(diào)整參數(shù)造成主機(jī)系統(tǒng)重啟;二是數(shù)據(jù)庫系統(tǒng)的更改,例如數(shù)

15、據(jù)庫補(bǔ)丁升級,調(diào)整一些重要參數(shù)需要重新啟動數(shù)據(jù)庫的運維操作。提供的主機(jī)系統(tǒng)的運維服務(wù)包括:主機(jī)的日常監(jiān)控,設(shè)備的運行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護(hù),補(bǔ)丁升級等內(nèi)容。主機(jī)系統(tǒng)基本服務(wù)內(nèi)容:序號服務(wù)模塊內(nèi)容描述提供方1現(xiàn)場備件安裝配合用戶進(jìn)行。按備件到達(dá)現(xiàn)場時間工程師到達(dá)現(xiàn)場設(shè)備廠商、xxx公司2補(bǔ)丁服務(wù)消除軟件漏洞給系統(tǒng)帶來的安全隱患,并對安裝補(bǔ)丁所引起的系統(tǒng)連鎖反應(yīng)進(jìn)行合理的平衡。xxx公司3升級服務(wù)對系統(tǒng)進(jìn)行軟件或硬件的升級,以改進(jìn)、完善現(xiàn)有系統(tǒng)或消除現(xiàn)有系統(tǒng)的漏洞。xxx公司4現(xiàn)場故障診斷按服務(wù)級別:724小時 58小時xxx公司5電話遠(yuǎn)程技術(shù)支持724小時xxx公司6問題管理系統(tǒng)對遇到

16、的問題進(jìn)行匯總和發(fā)布xxx公司7系統(tǒng)優(yōu)化對客戶系統(tǒng)的括主機(jī)、存儲設(shè)備、操作系統(tǒng)、提供優(yōu)化服務(wù)?,F(xiàn)場值守人員可進(jìn)行監(jiān)控管理的內(nèi)容包括: CPU 性能管理; 內(nèi)存使用情況管理; 硬盤利用情況管理; 系統(tǒng)進(jìn)程管理; 主機(jī)性能管理; 實時監(jiān)控主機(jī)電源、風(fēng)扇的使用情況及主機(jī)機(jī)箱內(nèi)部溫度; 監(jiān)控主機(jī)硬盤運行狀態(tài); 監(jiān)控主機(jī)網(wǎng)卡、陣列卡等硬件狀態(tài); 監(jiān)控主機(jī)HA運行狀況; 主機(jī)系統(tǒng)文件系統(tǒng)管理; 監(jiān)控備份服務(wù)進(jìn)程、備份情況(起止時間、是否成功、出錯告警);服務(wù)器部分系統(tǒng)管理單位: XX供電公司設(shè)備名: 設(shè)備型號設(shè)備序列號管理IP:檢查內(nèi)容參考標(biāo)準(zhǔn)檢查結(jié)果狀態(tài)是否正常巡檢方法描述巡檢周期硬件運行狀態(tài)電源指示燈

17、正常 異常面板指示燈正常 異常內(nèi)置磁帶機(jī)正常 異常CPU 狀態(tài)正常 異常內(nèi)存狀態(tài)正常 異常磁盤狀態(tài)正常 異常網(wǎng)卡狀態(tài)正常 異常HBA卡運行狀態(tài)正常 異常系統(tǒng)檢查系統(tǒng)日志正常 異常Mail正常 異常文件系統(tǒng),包括磁盤卷剩余空間正常 異常硬件檢測正常 異常交換分區(qū)正常 異常固件版本正常 異常補(bǔ)丁包版本正常 異常系統(tǒng)鏡像正常 異常設(shè)備燈狀態(tài)正常 異常系統(tǒng)故障報告正常 異常進(jìn)程狀態(tài)正常 異常系統(tǒng)性能檢查CPU利用率正常 異常內(nèi)存利用率正常 異常磁盤I/O性能正常 異常集群檢查集群進(jìn)程狀態(tài)正常 異常集群日志正常 異常1.5 網(wǎng)絡(luò)存儲系統(tǒng)運維服務(wù)提供的機(jī)房存儲環(huán)境(SAN、NAS)運行維護(hù)服務(wù)是包括存儲的

18、IOPS和Space利用管理,存儲的主動IOPS性能和Space利用管理對系統(tǒng)運維非常重要??闪私庥肅IFS、iscsi、FC、FCoE、NFS協(xié)議運行狀況,通過性能管理可了解存儲的日常運行狀態(tài),識別存儲的IOPS性能,有針對性地進(jìn)行性能優(yōu)化。同時,密切注意存儲系統(tǒng)的變化,主動地預(yù)防可能發(fā)生的問題。存儲-主機(jī)規(guī)劃主機(jī)名 HostName分區(qū)Space應(yīng)用 ApplicationOS版本HA版本HBA型號IOPS (64K512K) 存儲故障單一存儲配置,目前都是采用磁盤RAID技術(shù)加熱備磁盤來解決,因此存儲系統(tǒng)的故障主要是由機(jī)房電力故障或人為因素導(dǎo)致存儲設(shè)備的電源發(fā)生故障。數(shù)據(jù)損壞通常由 I/

19、O 堆棧中的故障組件導(dǎo)致,例如,數(shù)據(jù)庫將 I/O 作為更新交易的結(jié)果,該數(shù)據(jù)庫 I/O 將在各個組件中進(jìn)行傳輸,包括:操作系統(tǒng)的 I/O 代碼、文件系統(tǒng)、卷管理器、設(shè)備驅(qū)動程序、主機(jī)總線適配器、存儲控制器和磁盤驅(qū)動器,直至最后被寫入。I/O 堆棧中任何組件發(fā)生錯誤或硬件故障,都可能“變換”數(shù)據(jù)中的一些位,進(jìn)而導(dǎo)致?lián)p壞的數(shù)據(jù)被寫入數(shù)據(jù)庫中,這一損壞可能是數(shù)據(jù)庫控制信息或用戶數(shù)據(jù),它們對于數(shù)據(jù)庫的正常工作至關(guān)重要;同樣,磁盤故障也可能損壞數(shù)據(jù)。為了減少單一站點的故障,是數(shù)據(jù)業(yè)務(wù)連續(xù)性,實現(xiàn)數(shù)據(jù)的異地備份,并在發(fā)生意外災(zāi)難時對數(shù)據(jù)進(jìn)行快速恢復(fù),確保客戶的業(yè)務(wù)持續(xù)性。提供的存儲運行維護(hù)服務(wù)還包括快速發(fā)

20、現(xiàn)、診斷和解決性能問題,在出現(xiàn)問題時,及時找出性能瓶頸,解決存儲性能問題,維護(hù)高效的應(yīng)用系統(tǒng)。存儲運行維護(hù)服務(wù),主要工作是使用技術(shù)手段來達(dá)到管理的目標(biāo),以系統(tǒng)最終的運行維護(hù)為目標(biāo),提高用戶的工作效率。1.6 數(shù)據(jù)安全存儲及災(zāi)備運維服務(wù) 1.6.1傳統(tǒng)的災(zāi)備方式 說到災(zāi)難恢復(fù),自然會想到備份。企業(yè)關(guān)鍵數(shù)據(jù)丟失會中斷企業(yè)正常商務(wù)運行,造成巨大經(jīng)濟(jì)損失,容災(zāi)和備份都是保護(hù)數(shù)據(jù)的有效手段。同時,數(shù)據(jù)容災(zāi)與數(shù)據(jù)備份相互聯(lián)系,主要體現(xiàn)在以下幾個方面: 數(shù)據(jù)備份是數(shù)據(jù)容災(zāi)的基礎(chǔ) 數(shù)據(jù)備份是系統(tǒng)、數(shù)據(jù)容災(zāi)的基礎(chǔ),也是低端容災(zāi)的實現(xiàn),是高端容災(zāi)(實時數(shù)據(jù)保護(hù))的有力保障。目前備份技術(shù)主要有快照備份、離線備份、異

21、地存儲備份。備份系統(tǒng)通過備份策略,對計算機(jī)信息系統(tǒng)的操作系統(tǒng)、文件系統(tǒng)、應(yīng)用程序、數(shù)據(jù)庫系統(tǒng)等數(shù)據(jù)集,實現(xiàn)某一時間點的完整拷貝,拷貝的數(shù)據(jù)處在非在線狀態(tài),不能被立刻訪問,必須通過相應(yīng)操作,如恢復(fù)等方式使用備份數(shù)據(jù)。這也解決了高端容災(zāi)(實時數(shù)據(jù)保護(hù))不能解決的問題:人為誤操作、惡意性操作等,這類操作,計算機(jī)系統(tǒng)是不能區(qū)分的,一旦執(zhí)行,將造成數(shù)據(jù)中心、災(zāi)備中心同時修改;對于數(shù)據(jù)庫系統(tǒng),在日志方式下,可以通過回滾方式修改,對于文件系統(tǒng)、操作系統(tǒng)等其他配置信息是不能回滾的,將造成毀滅性的結(jié)果。因此在建設(shè)高端容災(zāi)系統(tǒng)的前提,一定要做好本地系統(tǒng)的備份,這是容災(zāi)技術(shù)的起點。 數(shù)據(jù)備份是數(shù)據(jù)高可用的最后一道防

22、線,其目的是為了系統(tǒng)數(shù)據(jù)崩潰時能夠快速的恢復(fù)數(shù)據(jù)。雖然它也算一種容災(zāi)方案,但這種容災(zāi)能力非常有限,因為傳統(tǒng)的備份主要是采用數(shù)據(jù)內(nèi)置或外置的磁盤機(jī)進(jìn)行冷備份,備份磁盤同時也在機(jī)房中統(tǒng)一管理,一旦整個機(jī)房出現(xiàn)了災(zāi)難,如火災(zāi)、盜竊和地震等災(zāi)難時,這些備份磁盤也隨之銷毀,所存儲的磁盤備份也起不到任何容災(zāi)功能。 雙機(jī)熱備的備份方式面對災(zāi)難各大容災(zāi)廠商首先所提出的容災(zāi)解決方案就是雙機(jī)熱備技術(shù)。雙機(jī)熱備技術(shù)是基于應(yīng)用切換的原理即整個容災(zāi)系統(tǒng)由兩套業(yè)務(wù)系統(tǒng)和共享一個存儲陣列所構(gòu)成。一但主服務(wù)器出現(xiàn)異?;蚬收?,備份服務(wù)器立刻接管主服務(wù)器的應(yīng)用。也就是目前通常所說的 active/standby 方式,主要通過純

23、軟件切換的方式實現(xiàn)雙機(jī)容錯。因為兩臺服務(wù)器共享一個磁盤陣列上的數(shù)據(jù),所以當(dāng)磁盤損壞的時候就造成兩臺服務(wù)器都不可用,這樣就達(dá)不到容災(zāi)的效果。而且通過純軟件來切換的話存在誤切換的情況,就是當(dāng)主服務(wù)器還是正常的時候就把業(yè)務(wù)系統(tǒng)的連接切換到備用服務(wù)器上,這就會造成業(yè)務(wù)系統(tǒng)的暫時停頓等問題。 雙機(jī)雙存儲 雙機(jī)雙存儲即在雙機(jī)熱備的基礎(chǔ)上增加一套存儲,實現(xiàn)應(yīng)用層的切換和底層數(shù)據(jù)的不間斷復(fù)制。其工作原理與雙機(jī)熱備類似。數(shù)據(jù)庫若要能夠正常啟動,必會先檢測其數(shù)據(jù)文件,日志文件,控制文件等一系列文件的完整性,才可以正常啟動。對于雙機(jī)雙存儲的存儲層復(fù)制來說是文件層復(fù)制,他們無法做到檢測數(shù)據(jù)的一致性,一旦雙機(jī)雙存儲發(fā)生

24、的是邏輯錯誤時,無論是主服務(wù)器還是備用服務(wù)器都將無法啟動。 容災(zāi)不是簡單備份 真正的數(shù)據(jù)容災(zāi)就是要避免傳統(tǒng)冷備份的先天不足,它能在災(zāi)難發(fā)生時,全面、及時地恢復(fù)整個系統(tǒng)。容災(zāi)按其容災(zāi)能力的高低可分為多個層次,例如國際標(biāo)準(zhǔn) SHARE78 定義的容災(zāi)系統(tǒng)有七個層次:從最簡單的僅在本地進(jìn)行磁盤備份,到將備份的磁盤存儲在異地,再到建立應(yīng)用系統(tǒng)實時切換的異地備份系統(tǒng),恢復(fù)時間 也可以從幾天到小時級到分鐘級、秒級或 0 數(shù)據(jù)丟失等。1.6.2 災(zāi)備方案的關(guān)鍵指標(biāo) RTO (Recovery Time Object)RTO即恢復(fù)時間目標(biāo):是指“將信息系統(tǒng)從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運行狀態(tài),并將其

25、支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài)”所需時間,其中包括備份數(shù)據(jù)恢復(fù)到可用狀態(tài)所需時間、數(shù)據(jù)處理系統(tǒng)切換時間、以及備用網(wǎng)絡(luò)切換時間等,該指標(biāo)用以衡量容災(zāi)方案的業(yè)務(wù)恢復(fù)能力。 RPO (Recovery Point Time)RPO即數(shù)據(jù)恢復(fù)點目標(biāo):是指業(yè)務(wù)系統(tǒng)所允許的災(zāi)難過程中的最大數(shù)據(jù)丟失量(以時間來度量),這是一個與數(shù)據(jù)備份系統(tǒng)所選用的技術(shù)有密切關(guān)系的指標(biāo),用以衡量災(zāi)難恢復(fù)方案的數(shù)據(jù)冗余備份能力。 容災(zāi)半徑容災(zāi)半徑是指生產(chǎn)中心和災(zāi)備中心之間的直線距離,用以衡量容災(zāi)方案所能防御的災(zāi)難影響范圍。顯然,具有零 RTO、零 RPO 和大容災(zāi)半徑的災(zāi)難恢復(fù)方案是用戶最期望的,但受系統(tǒng)

26、性能要求、適用技術(shù)及成本等方面的約束,這種方案實際上是不大可行的。所以,用戶在選擇容災(zāi)方案時應(yīng)該綜合考慮災(zāi)難的發(fā)生概率、災(zāi)難對數(shù)據(jù)的破壞力、數(shù)據(jù)所支撐業(yè)務(wù)的重要性、適用的技術(shù)措施及自身所能承受的成本等多種因素,理性地作出選擇。1.6.3 常見的備份策略備份策略 描述 Full Backup 完全備份 是每次對系統(tǒng)進(jìn)行完全的備份。當(dāng)數(shù)據(jù)發(fā)生數(shù)據(jù)丟失災(zāi)難時。完全備份所需要的時間最長和消耗的磁帶最多,但恢復(fù)時間最短和操作最方便。 Incremental Backup 增量備份 是備份上一次全備份或者增量備份系統(tǒng)發(fā)生改變的數(shù)據(jù)。這種備份策略的優(yōu)點時節(jié)省了磁帶空間,縮短了備份時間。其缺點在于當(dāng)災(zāi)難發(fā)生時

27、,數(shù)據(jù)的恢復(fù)比較麻煩而且可靠性比較差。其中任何一盤磁帶出現(xiàn)問題都會影響之后的磁帶恢復(fù)。 Differential Backup 差量備份 是備份上一次全備份后到系統(tǒng)發(fā)生改變過的文件。其優(yōu)點是無需要每天對系統(tǒng)做完全備份,備份所需要時間短并且節(jié)省了磁帶空間。它的災(zāi)難恢復(fù)也很方便。系統(tǒng)管理員只需要全備份和增量備份的介質(zhì)就可以進(jìn)行系統(tǒng)的恢復(fù)。 Synthetic Backup 合成備份 是當(dāng)備份窗口較短時進(jìn)行。在進(jìn)行合成備份的時候,會從完全備份、增量備份和差量備份中讀取信息,然后創(chuàng)建一個新的完全備份。這種完全備份可以離線進(jìn)行且網(wǎng)絡(luò)還是在繼續(xù)使用,不會降低系統(tǒng)性能或者妨礙網(wǎng)絡(luò)中的用戶。 差異增量備份(D

28、ifferential Incremental Backup):此備份主要在于每次備份的內(nèi)容是從上次0級或1級備份以來發(fā)生改變的內(nèi)容。 累積增量備份(Cumulative Incremental Backup ):此備份主要在于每次備份的是從上次0級備份以來發(fā)生改變的內(nèi)容。 1.6.4容災(zāi)的核心問題 容災(zāi)適應(yīng)性指的是容災(zāi)系統(tǒng)在實施和使用的過程中對原有的生產(chǎn)系統(tǒng)、硬件系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)的影響,有的容災(zāi)系統(tǒng)可能需要凍結(jié)原有的生產(chǎn)系統(tǒng)的情況下進(jìn)行數(shù)據(jù)的復(fù)制,有點容災(zāi)系統(tǒng)可能要對硬件、網(wǎng)絡(luò)環(huán)境進(jìn)行改造,改造成系統(tǒng)所要求的條件。這些對改造對原有的系統(tǒng)和數(shù)據(jù)都存在一定的風(fēng)險性。 容災(zāi)可見性指的是容災(zāi)系統(tǒng)的容災(zāi)

29、效果是不是可見、可查詢的。有的容災(zāi)系統(tǒng)的容災(zāi)效果要等災(zāi)難發(fā)生之后,備用系統(tǒng)恢復(fù)之后才能驗證是不是真做到了數(shù)據(jù)零丟失的效果。如果數(shù)據(jù)復(fù)制失敗不能馬上反應(yīng)出來同樣達(dá)不到容災(zāi)的效果。所以容災(zāi)系統(tǒng)的核心問題:能否構(gòu)建一個綠色容災(zāi)系統(tǒng),在實施和使用過程中不會影響原生產(chǎn)系統(tǒng),無需改造硬件和網(wǎng)絡(luò)環(huán)境,其容災(zāi)結(jié)果的好與壞又實時可見、可驗證。1.6.5 容災(zāi)的實現(xiàn)方式通常,應(yīng)用服務(wù)器通過SAN訪問存儲資源。針對SAN共享存儲模型進(jìn)行了進(jìn)一步的細(xì)化,把SAN存儲分為: 應(yīng)用層 文件/記錄層 塊管理 物理存儲設(shè)備如下圖所示。SNA共享存儲模型因此,可以從文件/記錄層、塊管理層來實現(xiàn)容災(zāi)。根據(jù)容災(zāi)的發(fā)起端來進(jìn)行劃分,

30、容災(zāi)可分為: 數(shù)據(jù)庫級容災(zāi):基于數(shù)據(jù)庫的容災(zāi)技術(shù)傳輸?shù)氖荢QL指令或者重作日志文件。如Oracle數(shù)據(jù)庫自帶的Data Guard 技術(shù)。 卷管理級容災(zāi):基于主機(jī)卷管理軟件的容災(zāi)技術(shù)可以選擇同步或者異步復(fù)制方式。存儲目標(biāo)數(shù)據(jù)的邏輯卷不能被業(yè)務(wù)系統(tǒng)所使用,屬于冷容災(zāi)方式。如VERITAS VVR遠(yuǎn)程數(shù)據(jù)復(fù)制軟件。 網(wǎng)絡(luò)級容災(zāi):網(wǎng)絡(luò)級容災(zāi)主要是指基于虛擬存儲技術(shù)的容災(zāi)。例如IBM的 PPRC、 EMC 的Mirrorview、HDS 的Truecopy復(fù)制技術(shù)。 存儲設(shè)備級容災(zāi):通過存儲控制器實現(xiàn)的設(shè)備級數(shù)據(jù)遠(yuǎn)程鏡像或復(fù)制是傳統(tǒng)容災(zāi)方式中最高效最可靠的方式。 基于磁盤系統(tǒng)的同步數(shù)據(jù)復(fù)制功能可實現(xiàn)異

31、地數(shù)據(jù)的容災(zāi)。 虛擬化存儲產(chǎn)品實現(xiàn)遠(yuǎn)程復(fù)制1.6.6異地容災(zāi)技術(shù) 遠(yuǎn)程鏡像技術(shù)遠(yuǎn)程鏡像技術(shù)是在主數(shù)據(jù)中心和備援中心之間的數(shù)據(jù)備份時用到。遠(yuǎn)程鏡像又叫遠(yuǎn)程復(fù)制,是容災(zāi)備份的核心技術(shù),同時也是保持遠(yuǎn)程數(shù)據(jù)同步和實現(xiàn)災(zāi)難恢復(fù)的基礎(chǔ)。遠(yuǎn)程鏡像按請求鏡像的主機(jī)是否需要遠(yuǎn)程鏡像站點的確認(rèn)信息,又可分為同步遠(yuǎn)程鏡像和異步遠(yuǎn)程鏡像。同步遠(yuǎn)程鏡像(同步復(fù)制技術(shù))是指通過遠(yuǎn)程鏡像軟件,將本地數(shù)據(jù)以完全同步的方式復(fù)制到異地,每一本地的I/O事務(wù)均需等待遠(yuǎn)程復(fù)制的完成確認(rèn)信息,方予以釋放。同步鏡像使遠(yuǎn)程拷貝總能與本地機(jī)要求復(fù)制的內(nèi)容相匹配。當(dāng)主站點出現(xiàn)故障時,用戶的應(yīng)用程序切換到備份的替代站點后,被鏡像的遠(yuǎn)程副本可以

32、保證業(yè)務(wù)繼續(xù)執(zhí)行而沒有數(shù)據(jù)的丟失。但它存在往返傳播造成延時較長的缺點,只限于在相對較近的距離上應(yīng)用。異步遠(yuǎn)程鏡像(異步復(fù)制技術(shù))保證在更新遠(yuǎn)程存儲視圖前完成向本地存儲系統(tǒng)的基本I/O操作,而由本地存儲系統(tǒng)提供給請求鏡像主機(jī)的I/O操作完成確認(rèn)信息。遠(yuǎn)程的數(shù)據(jù)復(fù)制是以后臺同步的方式進(jìn)行的,這使本地系統(tǒng)性能受到的影響很小,傳輸距離長(可達(dá)1000公里以上),對網(wǎng)絡(luò)帶寬要求小。但是,許多遠(yuǎn)程的從屬存儲子系統(tǒng)的寫沒有得到確認(rèn),當(dāng)某種因素造成數(shù)據(jù)傳輸失敗,可能出現(xiàn)數(shù)據(jù)一致性問題。為了解決這個問題,目前大多采用延遲復(fù)制的技術(shù),即在確保本地數(shù)據(jù)完好無損后進(jìn)行遠(yuǎn)程數(shù)據(jù)更新。 快照技術(shù)遠(yuǎn)程鏡像技術(shù)往往同快照技術(shù)

33、結(jié)合起來實現(xiàn)遠(yuǎn)程備份,即通過鏡像把數(shù)據(jù)備份到遠(yuǎn)程存儲系統(tǒng)中,再用快照技術(shù)把遠(yuǎn)程存儲系統(tǒng)中的信息備份到遠(yuǎn)程的磁帶庫、光盤庫中??煺帐峭ㄟ^軟件對要備份的磁盤子系統(tǒng)的數(shù)據(jù)快速掃描,建立一個要備份數(shù)據(jù)的快照邏輯單元號LUN和快照cache,在快速掃描時,把備份過程中即將要修改的數(shù)據(jù)塊同時快速拷貝到快照cache中??煺誏UN是一組指針,它指向快照cache和磁盤子系統(tǒng)中不變的數(shù)據(jù)塊(在備份過程中)。在正常業(yè)務(wù)進(jìn)行的同時,利用快照LUN實現(xiàn)對原數(shù)據(jù)的一個完全的備份。它可使用戶在正常業(yè)務(wù)不受影響的情況下,實時提取當(dāng)前在線業(yè)務(wù)數(shù)據(jù)。其“備份窗口”接近于零,可大大增加系統(tǒng)業(yè)務(wù)的連續(xù)性,為實現(xiàn)系統(tǒng)真正的724運

34、轉(zhuǎn)提供了保證。快照是通過內(nèi)存作為緩沖區(qū)(快照cache),由快照軟件提供系統(tǒng)磁盤存儲的即時數(shù)據(jù)映像,它存在緩沖區(qū)調(diào)度的問題。 互連技術(shù)早期的主數(shù)據(jù)中心和備援?dāng)?shù)據(jù)中心之間的數(shù)據(jù)備份,主要是基于SAN的遠(yuǎn)程復(fù)制(鏡像),即通過光纖通道FC,把兩個SAN連接起來,進(jìn)行遠(yuǎn)程鏡像(復(fù)制)。當(dāng)災(zāi)難發(fā)生時,由備援?dāng)?shù)據(jù)中心替代主數(shù)據(jù)中心保證系統(tǒng)工作的連續(xù)性。這種遠(yuǎn)程容災(zāi)備份方式存在一些缺陷,如:實現(xiàn)成本高、設(shè)備的互操作性差、跨越的地理距離短(10公里)等,這些因素阻礙了它的進(jìn)一步推廣和應(yīng)用。目前,出現(xiàn)了多種基于IP的SAN的遠(yuǎn)程數(shù)據(jù)容災(zāi)備份技術(shù)。它們是利用基于IP的SAN的互連協(xié)議,將主數(shù)據(jù)中心SAN中的信息

35、通過現(xiàn)有的TCP/IP網(wǎng)絡(luò),遠(yuǎn)程復(fù)制到備援中心SAN中。當(dāng)備援中心存儲的數(shù)據(jù)量過大時,可利用快照技術(shù)將其備份到磁帶庫或光盤庫中。這種基于IP的SAN的遠(yuǎn)程容災(zāi)備份,可以跨越LAN、MAN和WAN,成本低、可擴(kuò)展性好,具有廣闊的發(fā)展前景。基于IP的互連協(xié)議包括:FCIP、iFCP、Infiniband、iSCSI等。 虛擬存儲在有些容災(zāi)方案產(chǎn)品中,還采取了虛擬存儲技術(shù),如西瑞異地容災(zāi)方案。虛擬化存儲技術(shù)在系統(tǒng)彈性和可擴(kuò)展性上開創(chuàng)了新的局面。它將幾個IDE或SCSI驅(qū)動器等不同的存儲設(shè)備串聯(lián)為一個存儲池。存儲集群的整個存儲容量可以分為多個邏輯卷,并作為虛擬分區(qū)進(jìn)行管理。存儲由此成為一種功能而非物理

36、屬性,而這正是基于服務(wù)器的存儲結(jié)構(gòu)存在的主要限制。虛擬存儲系統(tǒng)還提供了動態(tài)改變邏輯卷大小的功能。事實上,存儲卷的容量可以在線隨意增加或減少??梢酝ㄟ^在系統(tǒng)中增加或減少物理磁盤的數(shù)量來改變集群中邏輯卷的大小。這一功能允許卷的容量隨用戶的即時要求動態(tài)改變。另外,存儲卷能夠很容易的改變?nèi)萘?,移動和替換。安裝系統(tǒng)時,只需為每個邏輯卷分配最小的容量,并在磁盤上留出剩余的空間。隨著業(yè)務(wù)的發(fā)展,可以用剩余空間根據(jù)需要擴(kuò)展邏輯卷。你也可以將數(shù)據(jù)在線從舊驅(qū)動器轉(zhuǎn)移到新的驅(qū)動器上,而不中斷服務(wù)的運行。存儲虛擬化的一個關(guān)鍵優(yōu)勢是它允許異質(zhì)系統(tǒng)和應(yīng)用程序共享存儲設(shè)備,而不管它們位于何處。公司將不再需要在每個分部的服務(wù)

37、器上都連接一臺磁帶設(shè)備。1.6.7災(zāi)難恢復(fù)級別國家信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范中根據(jù)數(shù)據(jù)備份系統(tǒng)、備用數(shù)據(jù)處理系統(tǒng)、備用網(wǎng)絡(luò)系統(tǒng)、備用基礎(chǔ)設(shè)施、技術(shù)支持、運行維護(hù)支持、災(zāi)難恢復(fù)預(yù)案這七個要素的不同要求,把災(zāi)難恢復(fù)分為6個級別:2 容災(zāi)建設(shè)方法容災(zāi)建設(shè)項目和業(yè)務(wù)連續(xù)性項目與用戶的業(yè)務(wù)要求、應(yīng)用現(xiàn)狀密切相關(guān),并涉及眾多技術(shù)和產(chǎn)品以及繁多的供應(yīng)商,因而屬于建設(shè)復(fù)雜、風(fēng)險較高的項目之一。為降低項目風(fēng)險,保證容災(zāi)中心建設(shè)的成功,選擇有經(jīng)驗的合作伙伴、并且有成熟實用的方法論指導(dǎo)對信息中心容災(zāi)建設(shè)非常重要。 規(guī)劃(Plan)科學(xué)的規(guī)劃是項目成功的前提。規(guī)劃階段需要對企業(yè)的IT系統(tǒng)現(xiàn)狀進(jìn)行評估分析,根據(jù)企業(yè)的業(yè)務(wù)發(fā)展

38、的要求明確進(jìn)行需求定義,從而在確定的需求基礎(chǔ)上選擇合適的技術(shù),進(jìn)行技術(shù)架構(gòu)設(shè)計,選擇合適的技術(shù)方案并采購相應(yīng)的產(chǎn)品。 建設(shè)(Build) 本階段主要是進(jìn)行技術(shù)平臺建設(shè)(包括整合、數(shù)據(jù)遷移等)、測試,建設(shè)完整的“災(zāi)難恢復(fù)計劃(DRP)”或“業(yè)務(wù)連續(xù)性計劃(BCP)”。在科學(xué)、合理的規(guī)劃前提下,建設(shè)階段將相對比較有序。 管理(Manage)對容災(zāi)建設(shè)項目或業(yè)務(wù)連續(xù)性項目而言,建設(shè)了容災(zāi)技術(shù)平臺及相關(guān)的人員、流程要求僅僅是開始,而不是結(jié)束,必須定期更新、維護(hù)確保能夠滿足不斷變化的業(yè)務(wù)發(fā)展要求。貫穿“規(guī)劃、建設(shè)、管理”三個階段的是“項目管理和服務(wù)集成能力”。容災(zāi)或業(yè)務(wù)連續(xù)性建設(shè)涉及的技術(shù)和產(chǎn)品非常廣泛

39、,針對不同的業(yè)務(wù)應(yīng)用也可能采用不同的技術(shù)方案,這些方案來自不同的廠商;由于業(yè)務(wù)的相互關(guān)聯(lián),不同的技術(shù)方案之間也存在密切的聯(lián)系,甚至相互依賴。同時,在容災(zāi)建設(shè)過程中,將有多方供應(yīng)商提供服務(wù)支持,能夠協(xié)調(diào)多方關(guān)系,對項目實施進(jìn)度及質(zhì)量進(jìn)行統(tǒng)一控制,對多方服務(wù)進(jìn)行集成調(diào)度是“項目管理和服務(wù)集成”的重要工作,也是保證項目按時完成并保證質(zhì)量的重要因素。2.1 企業(yè)信息系統(tǒng)保護(hù)層次現(xiàn)代企業(yè)的數(shù)據(jù)中心IT平臺(包括主機(jī)平臺、網(wǎng)絡(luò)平臺、存儲平臺等)的保護(hù)和恢復(fù)有不同等級的技術(shù)手段,未來企業(yè)的業(yè)務(wù)連續(xù)性建設(shè)將需要不斷提高企業(yè)的信息、數(shù)據(jù)的保護(hù)和恢復(fù)的等級。不同層次的數(shù)據(jù)中心保護(hù)如上圖所示,對企業(yè)集中化數(shù)據(jù)中心的

40、IT系統(tǒng)和業(yè)務(wù)數(shù)據(jù)進(jìn)行保護(hù)可以有多種不同層次的保護(hù)方案,主要分為本地保護(hù)和遠(yuǎn)程保護(hù)兩個方面。企業(yè)數(shù)據(jù)中心面向運營的保護(hù)及恢復(fù)包括三個層次: 平臺保護(hù)主要是平臺的高可用,如采用主機(jī)群集系統(tǒng)和高可用存儲平臺(包括SAN網(wǎng)絡(luò)環(huán)境的高可用和存儲系統(tǒng)的高可用),保證IT平臺沒有單點故障,實現(xiàn)業(yè)務(wù)和應(yīng)用的高可用性。 數(shù)據(jù)備份對業(yè)務(wù)數(shù)據(jù)進(jìn)行經(jīng)常性的本地備份,在IT系統(tǒng)出現(xiàn)物理故障或邏輯故障時,數(shù)據(jù)備份都能提供可靠的數(shù)據(jù)保護(hù)。 數(shù)據(jù)恢復(fù)在出現(xiàn)數(shù)據(jù)錯誤或丟失時能夠進(jìn)行快速、可預(yù)見的數(shù)據(jù)恢復(fù),減少IT系統(tǒng)的中斷時間,降低對業(yè)務(wù)運營的影響。 建設(shè)了完善的本地保護(hù)和恢復(fù)后,企業(yè)需要規(guī)劃建設(shè)面向災(zāi)難保護(hù)及恢復(fù)的“遠(yuǎn)程”

41、數(shù)據(jù)及業(yè)務(wù)保護(hù),它包括三個層次: 遠(yuǎn)程的信息保護(hù)是將企業(yè)的所有重要數(shù)據(jù)安全的存儲在遠(yuǎn)程站點,提供保護(hù),避免災(zāi)難性的事件破壞數(shù)據(jù)。 遠(yuǎn)程自動處理除了提供對生產(chǎn)數(shù)據(jù)的遠(yuǎn)程保護(hù)外,能夠自動進(jìn)行系統(tǒng)切換、回切及數(shù)據(jù)恢復(fù)等工作,從而在災(zāi)難事件發(fā)生時能夠快速恢復(fù)業(yè)務(wù)運行。 多數(shù)據(jù)中心保護(hù)通過建設(shè)多個數(shù)據(jù)中心,采用多數(shù)據(jù)中心的數(shù)據(jù)保護(hù)、恢復(fù)技術(shù),防范更大范圍的災(zāi)難事件。2.1.1 容災(zāi)技術(shù)模型容災(zāi)技術(shù)平臺建設(shè)是企業(yè)業(yè)務(wù)連續(xù)性建設(shè)的重要基礎(chǔ)。XXX公司將企業(yè)的IT平臺劃分為“接入平臺、應(yīng)用平臺、數(shù)據(jù)平臺”三部分,建議企業(yè)的容災(zāi)技術(shù)平臺建設(shè)應(yīng)該主要著眼于對業(yè)務(wù)處理平臺,數(shù)據(jù)平臺和接入平臺這三個重要的系統(tǒng)領(lǐng)域的保護(hù)。容災(zāi)技術(shù)模型示意圖2.1.2 業(yè)務(wù)平臺的保護(hù)業(yè)務(wù)處理能力的冗余容災(zāi)技術(shù)方案建設(shè)中,對于企業(yè)的業(yè)務(wù)平臺的保護(hù),主要表現(xiàn)為對業(yè)務(wù)處理能力的冗余和復(fù)用,其中牽涉: 支持應(yīng)用系統(tǒng)運行的服務(wù)器和操作系統(tǒng)等系統(tǒng)軟件 支持應(yīng)用系統(tǒng)運行的存儲器及存儲器和服務(wù)器的連接(存儲網(wǎng)絡(luò)等) 連接服務(wù)器的IP網(wǎng)絡(luò)系統(tǒng) 支持應(yīng)用系統(tǒng)實現(xiàn)的中間件或數(shù)據(jù)庫等客戶將需要在容災(zāi)中心應(yīng)該配置與需要保護(hù)的生產(chǎn)中心相同廠家、相同版本、相同配置的應(yīng)用服務(wù)器、中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論