容災系統建設方案_第1頁
容災系統建設方案_第2頁
容災系統建設方案_第3頁
容災系統建設方案_第4頁
容災系統建設方案_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、xxxxxxx 應應用用容容災災 系系統統建建議議方方案案 目目 錄錄 1 1. . 用用戶戶需需求求及及針針對對本本需需求求的的容容災災系系統統設設計計綜綜述述.3 1.1 應用數據安全級別的分級考慮.3 1.2 用 戶 需 求 分析: .4 1.3 本項目中需要注意的幾個要點.6 2 2. .數數據據容容災災系系統統的的詳詳細細設設計計.8 2.1 系統設計原則.8 2.2 系統的產品選擇.9 3.3 災備中心的組建.11 2.4 數據容災系統的基本結構.12 2.5 數據的遠程復制流程.14 2.6 數據的遠程恢復流程.15 2.7 本容災系統的結構特點.18 2.8 數據容災系統擴展.

2、19 2.9 系統投資保障.19 3 3. .數數據據容容災災系系統統與與其其他他方方案案的的簡簡要要比比較較.19 4 4. .數數據據容容災災系系統統的的實實施施計計劃劃.21 4.1 系統實施需求 規(guī) 劃 .21 4.2 相關性要求 /實施步驟 .22 4.3 系統配置清單.24 5 5. .數數據據容容災災系系統統的的測測試試/ /驗驗收收計計劃劃 .24 5.1 基本測試及對ORACLE和其他類型數據的測試.25 5.2 切換及回切的測試.26 5.3 故障測試 .27 6 6. .數數據據容容災災系系統統的的日日常常管管理理/ /演演練練計計劃劃 .27 7 7. .應應用用級級容

3、容災災的的規(guī)規(guī)劃劃.28 8 8. .后后續(xù)續(xù)其其他他節(jié)節(jié)點點的的擴擴展展規(guī)規(guī)劃劃.28 1 10 0. . E EM MC C R RE EC CO OV VE ER RP PO OI IN NT T 的的維維護護 .28 附附件件一一:美美國國EMC 公公司司簡簡要要介介紹紹.29 x xx xx xx xx xx xx x 應應用用容容災災系系統統建建議議方方案案 1 1. . 用用戶戶需需求求及及針針對對本本需需求求的的容容災災系系統統設設計計綜綜述述 xxxxxxx 當前的應用系統類別較多,包括了辦公及業(yè)務等多個方面。在平臺上 包括 Windows 及當前主流的多種UNIX,在存儲體

4、系上也具有多種型號的存儲產 品。因此,整個系統的復雜程度較大。同時,由于應用系統一經處于比較完善的程 度,因此,任何的調整都將帶來很大的影響。 為此,為了確保數據的安全性,在早期用戶實施了數據的磁帶備份,但對于關 鍵數據來說,這種磁帶備份還不能夠完全滿足系統抵御各種災難的能力。為此,用 戶考慮對數據實施災備計劃。 數據的容災保護提供最基本的容災底線保證,確保在任何預計之外的災難發(fā)生 后,業(yè)務系統都可以在允許損失極少量數據(或無損失)的情況下,在一定的時間 內恢復,數據容災同時也是應用邏輯錯誤和數據庫軟件bug 的容災應對出發(fā) 點;可以通過一定的方式來恢復到這種故障之前的可用的狀態(tài)。 1 1.

5、.1 1 應應用用數數據據安安全全級級別別的的分分級級考考慮慮 鑒于當前存在的大量數據,在安全性的要求上建議分出不同的優(yōu)先級別,建立 不同安全級別的保護措施。這樣不僅在成本上會帶來優(yōu)勢,同時也可以確保最關鍵 數據的不丟失。 這種分級保護一般根據可以承受的數據丟失量(如半小時,或一天)來考慮。 我們不妨把不允許有任何數據丟失的應用定義為安全級別最高,要求進行實時的同 步的數據遠程傳輸,對于相對來講數據安全級別稍低者可以把數據傳輸的優(yōu)先級別 作相對較低的配置,從而確保在同一時間優(yōu)先發(fā)送最為關鍵的應用數據。 而對于數據安全要求一般的數據來說,建議采用本地的磁帶備份即可,而不必 納入到災備的體系中來。

6、 這樣不僅可以合理使用資金,同時也可以確保關鍵數據的最高級別保護。 1 1. . 2 2 用用戶戶需需求求分分析析: 用戶資料采集:用戶資料采集: xxxxxxx 當前當前 SAN 環(huán)境(圖)環(huán)境(圖) 用戶需求分析:用戶需求分析: 1) 數據的實時遠程復制 針對關鍵業(yè)務系統數據實現數據的實時的遠程復制,從而保障數據在本地發(fā)生 各種故障之后首先可以保障數據的完整性,并可以通過一定的途徑快速得以恢復, 或者根據情況在遠程直接啟動應用。 2) 災備數據的可處理性,包括對數據的讀寫操作。 所謂的讀操作,是指災備數據可以為其它的某些臨時的應用提供便利,支持對 這些數據的讀操作。從而可以方便地驗證災備體

7、系的工作是否正常,或者在必要的 時候利用這些數據進行諸如員工培訓、軟件調試、相關系統的引用等多種處理。 所謂的數據讀寫操作,是考慮利用災備數據提供諸如員工培訓、系統應用測試、 后續(xù)軟件調試或其他臨時應用的可能。這樣,可以為上述應用帶來最大的便利性。 但是,為了保持和原始數據的一致性,系統應該支持上述寫入操作的 Reset(重置 )操作,使得在上述任務結束后,可以方便地把數據恢復到沒有進行寫 入操作之前的狀態(tài),維持災備數據和源數據的嚴格一致。 另外一個方面,數據的讀寫支持,也可以很方便地驗證災備體系的工作是否正 常。 當然,這種讀寫操作必須要對數據的遠程復制和本地的應用不產生任何影響。 2) (

8、遠期)應用的可切換支持。 災備中心不應該作為純粹的備用系統,在提供諸如數據查詢等應用的同時,還 要提供自動的應用切換等支持,一旦在生產中心發(fā)生故障后,災備中心的關鍵系統 可以自動接管生產系統,提供持續(xù)的應用保障。 這種規(guī)劃建議作為遠期的目標之一,當前建議只以數據的遠程復制為主,但當 前的方案必須要考慮到本要素。 1 1. .3 3 本本項項目目中中需需要要注注意意的的幾幾個個要要點點 通過在對用戶的具體環(huán)境和需求作了細致的分析之后,我們認為用戶對該數據 容災系統給以了充分的重視,所提出的觀點和要求是十分詳細和具體的,在此,從 我們方案提供商的角度,對此作如下的概括,便于整體方案的分析。 方方案

9、案的的通通用用性性。 這種通用性體現在兩個方面:一是異構平臺、存儲設備的支持性,二是對不同 應用類型數據的適用性,只有這樣的方案才可以較好地保障用戶當前投資,達到與 應用類型無關、與平臺無關以及與磁盤陣列等存儲設備無關的適用性最廣的解決方 案。在當前,數據主要以Oracle、DB2、SQL2000 類型為主,但是隨著應用類 型的增加,產生不同類型數據的可能性還是很有可能的。如果現在選用了僅僅支持 如 Oracle 數據的解決方案,那末臨時性的其他數據將無法得到及時的復制,或者 今后的應用擴展將受到很大的制約。 實實時時的的數數據據復復制制解解決決方方案案。 我們認為最終用戶已經對不同應用數據的

10、安全性要求做出了很好的分析和劃分, 其中關鍵數據要求不丟失,或盡量少地丟失。因此,我們認為必須要采用真正的實 時的數據復制解決方案才可以滿足這種要求。在條件具備的情況下,應該做到無延 遲數據復制。而建議采用非實時或準實時復制方案。 災災備備數數據據的的可可用用性性 分為兩個方面,一是數據的實時復制的可靠性,要求復制數據要和源數據保持 嚴格一致,嚴格按照源數據的寫入順序進行復制,使得災備數據具有可用性。二是 在需要的時候可以很便利地對災備數據進行讀寫操作,但是,這種讀寫操作不應該 對數據的實時復制產生影響。還有,在對災備數據進行修改(如進行員工培訓、軟 件測試等操作時對數據的采集或調整測試)后可

11、以恢復到原有狀況,從而確保數據 的一致性和安全性。 擴擴展展的的便便利利性性 包括對當前和今后其他應用類型數據的實時復制的擴展,復制距離的擴展以及 復制節(jié)點數量的擴展等多個方面,在當前選擇方案的時候面對未來的需求進行全面 考慮。 數數據據的的丟丟失失量量 對于關鍵應用要求數據不丟失,因此,不建議采用諸如當前在主機上開辟一定 的緩存( Buffer)空間,用來存放待復制的數據,利用異步的方式發(fā)送到遠程。 這樣的產品無疑會因為各種原因導致數據的丟失率較大,如當主機資源意外掉電或 宕機時,上述Buffer(緩存)中的數據必然會被丟失。我們推薦在主機產生寫入 操作的同時數據被發(fā)送出去,這樣,數據始終保

12、持和本地的寫入同步,這樣的方案 才可以真正做到數據的無丟失。 數數據據的的可可回回滾滾性性(最最新新數數據據不不可可用用情情況況下下的的數數據據恢恢復復支支持持) 不可避免地會在某些情況下,最新復制的數據不可用的情況下,尤其對于 Oracle 數據庫,很可能在管理員發(fā)現故障時,其內部已經在幾分鐘之前就已經出 現了問題,那末,被復制過去的數據肯定也是不能夠被使用的。此時,我們必須要 具有數據的回滾性支持,比如可以往前回滾30 秒、 1 分鐘或 2 分鐘,并利用 這些數據獲得可用數據同時數據的丟失量最小化。 災災備備自自身身系系統統實實施施及及恢恢復復的的便便利利(簡簡易易 )性性 災備系統的實施

13、不應該對現有的應用系統作任何調整,尤其是對當前運行較穩(wěn) 定的系統。當然,即使需要一定的調整。那末。這種調整夜必須是系統管理員可以 理解并接受的。同樣,對于災備系統自身而言,發(fā)生問題后的解決或全面的恢復也 要簡易化,要支持如WEB 管理,圖形化管理,而不應該需要較復雜的配置。否 則,今后如果需要作系統調整,那末,系統管理員將無法面對這種配置和管理,甚 至導致日常的維護也不敢動手的現狀。 對對系系統統的的影影響響最最小小化化 由于當前應用系統的完善性和穩(wěn)定性,不建議為了本災備系統而對當前的應用 系統做任何方面的調整。主機資源不能夠因為災備系統的實施而顯得緊張,包括內 存、 CPU 等資源的占用應力

14、求最小化。當然這種影響我們認為同樣包括實施時候 對系統、對數據庫、對應用的調整合對存儲空間的調整等多個方面。 災災備備方方案案要要支支持持策策略略化化配配置置 便于不同的應用數據具有不同的復制優(yōu)先級別,以確保關鍵數據不丟失。 災災備備系系統統的的管管理理簡簡易易性性 為了確保災備系統的正常運行,在日常的管理中必須要進行一定的演練,以保 障需要時候的迅捷相應和確認災備系統可用性。那末,這種日常的演練活動必須要 簡單,也就是災備系統自身必須要具有簡易的人性化的管理,同時,在對災備數據 作驗證時不應當對生產系統產生任何影響。 還有,系統自身故障后應該具有很便利的方式直接來恢復,而不需要重新配置。 災

15、災備備數數據據具具有有不不影影響響復復制制的的讀讀寫寫支支持持,同同時時支支持持寫寫入入操操作作后后的的 Reset(數數據據重重置置 ) 為了充分利用災備數據,方案必須要支持對災備數據的讀寫,同時,該讀寫的 過程不應該影響數據的繼續(xù)復制。 這樣,我們可以利用災備數據進行諸如軟件調試、員工培訓、系統測試、災備 系統測試、演練等多種操作。但是,一旦在這種練習結束后,必須要要保證災備數 據恢復原樣,保持和實際數據一致。 相相關關故故障障的的自自恢恢復復故故障障報報警警功功能能 系統涉及到大量的專業(yè)設備或技術,因此,災備系統必須要具有很強的相關故 障自恢復功能。如WAN 故障、主機故障、應用系統故障

16、等相關因素在恢復正常 后,災備系統也應該自動恢復運行,保持數據的實時復制。 另外,災備系統自身應該具有完善的日志和報警機制,減輕管理員的負擔。 災災備備系系統統具具有有較較強強的的數數據據傳傳輸輸性性能能(如如高高度度的的壓壓縮縮等等能能力力) 由于系統基于IP 鏈路設計,因此,必須要具有很高的數據傳輸能力,才可以 保障在有限的帶寬資源環(huán)境下提高數據的復制性能。這種性能的提高很大程度上是 靠較高的壓縮率來時實現的,我們建議災備系統要具有超過10 倍的壓縮率。 2 2. .數數據據容容災災系系統統的的詳詳細細設設計計 2 2. .1 1 系系統統設設計計原原則則 在基于當前的先進技術及產品的情況

17、下,結合整體造價,提供最高性價比的整 體解決方案是我們這次規(guī)劃的主要原則。同時在遵循用戶提出的設計原則的前提下, 我們還充分考慮了如下的設計理念: 最高的性價比。根據用戶應用的實際需求,提供適宜的解決方案,在有限 的資金許可范圍內,提供符合上述需求的方案,并降低后續(xù)的維護成本, 從而提高系統的整體性價比。 實時的數據復制,數據丟失率最小化。 策略化的數據復制,保障關鍵應用和一般應用數據的優(yōu)先級別策略化,確 保關鍵數據不丟失。 嚴格的數據一致性。 災備數據的可讀寫支持,在進行讀寫的同時不影響正常的數據復制,災備 數據在被操作后致支持重置,確保與原數據一致。 基于 WEB、GUI(圖形管理)及CL

18、I(命令行 )多種管理方式。 對應用系統影響最小化;自身故障對應用系統無影響。 實施便利,無須對應用作任何調整。 廣泛的適用性,數據復制和應用類型、數據類型沒有任何關系,支持異構 的平臺和存儲設備。 高性能的數據傳輸,具有高度的數據壓縮率(高于10 倍) ,提高數據 復制性能。 2 2. .2 2 系系統統的的產產品品選選擇擇 我們選用業(yè)界最領先的美國EMC 公司的 RECOVERPOINT 產品作為本系統數 據的實時復制(容災)產品。 EMC 公司總部在美國加利福尼亞州,在美國紐約、圣何塞(硅谷)及以色列具 有研發(fā)基地,專門致力于數據安全解決方案的技術研發(fā)。在數據容災日益成為大家 關注的話題

19、的同時,EMC 推出了新一代的數據復制解決方案。 大體來說,美國EMC 產品具有如下的基本特點: 提供實時的數據復制保障,確保在各種故障發(fā)生的情況下數據的完整性。 便于實現應用的遠程容災。 支持異構存儲和異構服務器平臺。 這種功能的實現便于用戶提供對當前及未來存儲設備投資的保障,最大程度地 適應存儲設備的多樣性,避免在今后磁盤陣列的擴展成為被限制的一個方面。相反, 目前大多的數據容災解決方案均是以磁盤陣列為基礎進行復制,要求本地和遠程具 有相同的磁盤陣列類型。 基于標準 IP 網絡進行數據復制,同時采用智能化帶寬縮減技術來實現對 帶寬需求的空前降低。 目前的數據復制方案均要求在本地和遠程之間通

20、過專線連接,這樣無疑會帶來 巨大的成本要求。而EMC 的解決方案可以基于IP 網絡,同時具有帶寬約減技 術(較高的數據壓縮率) ,策略化地實現數據和應用對當前帶寬的適應性。 策略化的數據復制解決方案,支持全面的數據保護服務級別。 不同的應用數據具有不同的安全級別,因此,在數據復制的同時也可以按照不 同的應用給以不同的策略設置,確保關鍵數據的安全。如用戶可以定義關于延遲、 帶寬等方面的策略,使得用戶可以在性能、安全和成本之間均衡考慮。 同步、異步以及時間點多種模式的數據復制方式動態(tài)全面支持。 RECOVERPOINT 提供了無數據丟失的保護措施。一臺主機應用每次進行到本 地磁盤子系統的寫處理時,

21、會并行處理寫操作到本地的EMC 設備。 EMC 應 用這種同步連接,并利用獨特的緩沖(Buffer)來移交最新的數據保護級別, 達到無數據丟失的保護。EMC 的緩沖被內置在設備內,可以被置于遠遠超過光 纖所能達到的距離之外。 利用快照歷史可以允許恢復到任一時間點的數據狀態(tài)。 除了可以保持始終一致的數據復制之外,EMC 還提供了獨特的回滾能力: “小徑快照 ”提供頻繁的基于幾秒間隔的快照能力,這樣可以實現到任何時間點 (point-in-time)的數據恢復。在最新數據被破壞的情況下,可以從快照歷史庫中 選擇最近的一次完好可用的快照數據快速恢復到剛剛故障之前的狀態(tài)。這一極有價 值的能力非常引人注

22、目地減少了數據丟失以及對數據崩潰的保護。 在一定的程度上EMC 提供的該功能可以代替數據備份技術,甚至遠遠超過 了后者。 企業(yè)級高可用及可擴展性支持 在每個節(jié)點通過放置兩臺RECOVERPOINT 產品,可以達到自動化的冗余 設計,實現數據復制應用的高可用。 唯一的真正 “out-of-band”技術的采用使得實施簡單易行,同時對應用 的影響最小化。 EMC 基于智能化out-of-band 的一種設備,可以連接到SAN 和 IP 結構中。 也就是說,這種數據復制的過程是在數據路徑之外的,以一種非入侵的方式進行。 因此, EMC 的實施出人意料的簡單易行,另外,與in-band 產品相比, E

23、MC 的 out-of-band 解決方案提供了無限制的擴展能力,同時對應用無任何潛在的影響。 遠程數據的可用性支持 EMC 提供的復制解決方案支持遠程數據的可操作性,包括讀寫。這樣某些特 定的操作如生產數據的模擬化聯系,軟件的調整測試、系統開發(fā)測試、新軟件的升 級測試等等都可以在這些基礎上進行首先測試,確保沒有問題之后再于生產系統之 上進行實施。 遠程管理的支持 EMC 的 RECOVERPOINT 設備支持遠程的管理與維護,可以配置Email 地址,并選擇某一類型的信息發(fā)送到該地址。同時,經過用戶開放許可,在北京的 技術服務中心和美國EMC 公司的服務人員都可以隨時提供遠程支持。以最快的

24、速度解決問題。 便捷的配置恢復 在 RECOVERPOINT 自身發(fā)生故障,甚至需要更換時,可以便捷地從原來的 配置信息中恢復其配置。該信息被保存在磁盤陣列中,并且該空間只有 EMC 軟件可以支配,從而保障其安全可靠性。 靈活的擴展支持 EMC 的解決方案支持雙向的數據復制,支持異構的平臺和存儲設備,便于擴 展。 任何應用類型的適應性(方案的通用性) 由于 EMC 的獨特數據復制方式,決定了該方案可以適應任何的應用類型。這 樣便為用戶提供了靈活便利的應用擴展余地??梢苑奖愕匕呀窈蟮膽眉{入到本書 據復制體系中來。 綜上,我們認為采用EMC 的數據容災解決方案是最合適的選擇。 3 3. .3 3

25、 災災備備中中心心的的組組建建 根據當前的用戶應用環(huán)境和今后發(fā)展的考慮, 我們建議在遠程災備點組 建 SAN 的存儲架構用于省數據中心和今后其它生產點數據的集中災備中心。 基本的架構如下圖示意。 針對這種架構,我們建議在產品的選擇上作如下的基本要求: 1)在經費許可的情況下配置雙交換機,配置必要的服務器(但是對于 RECOVERPOINT 的解決方案來說,并不需要在災備中心配置服務器,我們建議配置 服務器的目的僅在于對數據的驗證和某些必要的操作)。 初期可以配置單臺光纖交換機。 2)磁盤陣列的選擇建議采用FC-SATA 的磁盤。作為數據的災備系統,日常 并不涉及到應用,因此,建議采用價格相對低

26、廉的FC-SATA 磁盤陣列。 3)關鍵產品配置冗余部件,提高安全性。磁帶庫可作為備選設備供遠期擴容之 用。 2 2. .4 4 數數據據容容災災系系統統的的基基本本結結構構 基于美國 EMC 公司的產品,我們提供了如下圖的數據安全保障體系架構。從 下圖可以看出,系統的配置簡單,結構清晰。在本方案中我們不需要在數據中心的 各服務器上安裝軟件,唯一需要的是在需要做數據復制的系統上安裝 RECOVERPOINT 的驅動程序,而不需要在服務器上作任何其他方面的調試。 該結構的主要配置如下: 在數據中心和 災備中心 分別配置兩臺RECOVERPOINT,分別連接到光纖存儲 交換機和以太網絡,每個點的R

27、ECOVERPOINT 之間可以自動冗余,保障數據容 災系統的不間斷運行。 在各服務器上只需要安裝RECOVERPOINT 的驅動程序,不需要安裝其他的任 何軟件。 具體請參考如下示意圖。 2 2. .5 5 數數據據的的遠遠程程復復制制流流程程 EMC 提供了完整的獨立于應用系統之外的數據容災體系。這樣對應用系統的影 響被降低到最低。 具體的數據復制過程如下所述: 在需要作數據復制的應用服務器上安裝RECOVERPOINT 的驅動軟件。在應 用數據進行寫操作時,這些驅動程序會截取這些寫入操作,并把該寫入操作在繼續(xù) 其正常寫入的同時并行地復制到本地的RECOVERPOINT 設備上。 數據中心

28、的RECOVERPOINT 設備在接收到上述數據之后通過諸如壓縮等方面 的處理,根據策略設置把相關數據傳遞到遠程(災備中心 )的 RECOVERPOINT 設備上。遠程( 災備中心 )的 RECOVERPOINT 設備把上述數據按 照嚴格的寫入順序寫入到遠程(災備中心 )的磁盤存儲系統,實現數據的一致 性遠程保存。 另外的一種方式,EMC 安裝在本地服務器上面的驅動在接收到遠程磁盤陣列 的寫入反饋( ACK)應答之后才繼續(xù)進行下一個寫入操作,這樣的方式是 100%同步的方式,可以保障數據100%的完整和可用性。 還有, EMC 的復制支持某一個時間點的復制方式,可以每隔幾秒鐘自動產生一 次快照

29、,并在遠程保存這些快照,這樣,快照歷史庫可以便利地恢復歷史庫中某一 個時間的數據。便于在最新數據被破壞的情況下,可用數據的恢復。 上述幾種方式的利用可以由RECOVERPOINT 自動優(yōu)化選擇,無需人工調整或 設置。 因此,從該方面來講,EMC 的解決方案不僅僅可以恢復最新的應用數據,同 時也可以恢復某一個時間點的數據。 基于上述數據復制原理,EMC 適應任何類型的應用數據,同時無需單獨購買 諸如針對 Oracle、Informix 等等不同應用的選件。這一方面也為用戶今后的擴 展提供了方便。 這種數據復制可以基于一定的策略設置,針對不同的應用采用不同的諸如延遲、 帶寬占用等方面的策略設置,確

30、保關鍵數據的可靠性復制。 由于數據在正常寫入的同時被傳遞到本地RECOVERPOINT 設備上,因此, 這種數據丟失的可能性被降低到最低的程度,在某種程度上EMC 提供了無數 居丟失的安全保障。 在本地配置兩臺RECOVERPOINT 設備,可以保障其中一臺故障的情況下,保 證數據實時復制的繼續(xù)性,起到冗余的作用。這種切換是自動的,無需人工調整。 2 2. .6 6 數數據據的的遠遠程程恢恢復復流流程程 在本地數據出現故障的情況下,可以通過RECOVERPOINT 的圖形界面方 便地把數據恢復過來。完整數據的恢復流程僅僅需要調整原來的數據復制方向,由 本地到遠程調整為由遠程到本地,那末,遠程的

31、數據將會作為源數據被復制到本地, 從而實現數據的恢復。 這種恢復是最新數據并且是最完整的恢復。 在某些情況下,被復制到遠程的數據可能因為在復制的同時本地數據已經被破 壞等原因導致最新數據不可用的情況。 此時,我們完全可以通過可用的最新數據快照恢復可用的數據。 由于 EMC 提供了數據快照歷史庫的原因,我們可以根據需要把數據恢復到原 來的某一個時刻,在一定程度上取代利用磁帶所作的數據備份的功能。當然這種取 代是在一定程度上的,并不能完全代替歷史數據的備份。 在某些情況下需要對部分文件進行恢復時,可以把災備中心 的數據復制卷 加載上來,隨意恢復任何一個文件。 4.6 RECOVERPOINT 的管

32、理與維護 RECOVERPOINT 支持基于 WEB 的全局管理,用戶可以便利地實現遠程監(jiān)控, 并可以通過email 來定制一定類型的活全部的系統信息,包括故障、警告等,從 而在最短的時間內獲得系統得異常信息。 下面是 RECOVERPOINT 的管理界面示意圖: 從上圖可以看到,系統中的SAN 組件, WAN 及主機均可以動態(tài)體現出來, 無論是其中的任何一個發(fā)生故障,那末,都會在該圖形上直接顯示,一旦故障解決, 系統可以自動恢復,無須人工處理。這位系統整體的管理帶來了直觀性和便利性。 系統的遠程維護: RECOVERPOINT 支持其遠程管理,在用戶許可并對管理員開放用戶名和密碼后, 可以通

33、過互聯網絡直接登錄到RECOVERPOINT,從而進行一定的分析與處理。 4 4. .7 7 基基本本的的策策略略設設置置 系統可以根據應用的不同、安全級別要求的不同、線路的利用要求等多方面進 行策略設置,這些策略包括: 優(yōu)先級別的設置,不同的復制組可以設置相對的優(yōu)先級別,從而保障關鍵應用 數據的不丟失,體現出不同應用數據不同的安全要求。 帶寬利用率的設置,如果用戶的帶寬比較緊張,那末可以限制數據復制所占用 的帶寬,從而,全面保障應用帶寬,保障應用性能。 高壓縮率的設置,系統提供可6-10 倍的壓縮率,對于數據庫應用甚至可以 高達 15 倍的壓縮,從而為數據的傳輸性能帶來保障。 高級策略設置:

34、 數據復制系統( RECOVERPOINT)故障后是否保持應用系統的繼續(xù)運行,否則, 一旦 RECOVERPOINT 故障,可以在同一時間終止應用系統的寫入,從而保障應用 系統數據和災備數據保持完整地一致。缺省情況下,RECOVERPOINT 的故障對 應用系統沒有任何影響。 在 WAN 故障情況下,是否允許應用系統得繼續(xù)運行。 等等。 4.8 整體的成本降低 從發(fā)展的角度來看,我們推薦的RECOVERPOINT 方案可以在如下的幾個方面 為用戶帶來附加的費用降低,從而帶來整體的投資降低: 1)對不同磁盤陣列的支持:本地和遠程的磁盤陣列可以不同,為今后的 擴展帶來便利。災備點的磁盤陣列可以根據

35、情況來選用中端或低端的產 品。 2)對不同應用類型的支持,避免了今后不同的應用需要需要采用另外的方 案來實現容災的目的。 3)低帶寬的要求,帶來后續(xù)帶寬成本的降低。 4)維護成本大大降低,由于涉及內容較少,和磁盤陣列、SAN、應用 等多個方面都沒有較大的關系,因此,維護的工作量大大降低,同時遠 程的維護支持帶來了7*24 維護的可能,代表著整體的維護成本的降 低。 5)后續(xù)擴展的成本,KBX 支持多對一的復制,也支持雙向的復制,因此, 對于今后的節(jié)點加入和擴展帶來了保障,無須另外的方案解決。 2 2. .7 7 本本容容災災系系統統的的結結構構特特點點 從上面的配置介紹及示意圖,我們可以清楚看

36、到本子系統的主要特點: 充分降低數據安全體系對系統的影響; 真正實時的數據遠程復制; 數據的完整恢復(零數據丟失)保障; 和應用無關;支持任何應用類型; 實施維護便利; 擴展便利;距離無限制,服務器增加或應用增加不需要重新購買相關軟件; 支持異構服務器和存儲環(huán)境(不同廠家的磁盤陣列); 100%的數據一致性恢復,確保數據的可用性。 自身具備高可用支持,保障了容災自身體系的不間段運行。 對現有的存儲系統及應用系統無須調整,確保當前應用系統的穩(wěn)定性。 持續(xù)的數據保護,可以把數據恢復到任意的時間點。 2 2. .8 8 數數據據容容災災系系統統擴擴展展 可以從三個方面來討論本問題: 1) 應應用用類

37、類型型的的擴擴展展 ,不可避免地會存在多種類型數據(應用)的遠程復 制(容災)要求,這樣,就要求當前的容災設計必須要適用這種多種類 型數據共存的需求。我們提供的解決方案和應用類型沒有任何關系,因 此,無論是何種應用類型產生的數據或任何的數據類型都能夠被本容災 系統復制到遠程。 2) 應應用用服服務務器器的的擴擴展展,我們提供的方案支持異構的平臺和磁盤陣列,因 此,面向未來的發(fā)展,無論是服務器的增加還是其他廠家(或型號)的 磁盤陣列的加入,都可以被輕松地納入到本容災體系中。還有我們提供 的方案在造價上和應用服務器的數量和類型沒有關系,便于隨時擴展服 務器。 3) 基基于于應應用用級級容容災災需需

38、求求的的擴擴展展。由于我們提供的方案保障了遠程數據的 可用性,因此,可以便利地利用其他高可用軟件來實現應用的遠程切換。 4) 今今后后其其他他點點的的加加入入: 如果有其他地點的數據需要作容災規(guī)劃,那末,只需要和本配置一樣配置 相應的 RECOVERPOINT 硬件產品即可。其他完全可以利用本災備中心的所 有資源。因此,這種擴展將極為便利,無須再添加其他的相關產品/ 設備。對當前整個的災備系統業(yè)沒有任何影響。 2 2. .9 9 系系統統投投資資保保障障 由于 EMC 的 RECOVERPOINT 產品和應用類型無關,支持異構的平臺和存儲設 備,因此,可以充分利用現有的系統環(huán)境,充分保障用戶現

39、有的投資。 同時上面對擴展性的靈活支持也是對用戶當前投資的一種充分保障。 3 3. .數數據據容容災災系系統統與與其其他他方方案案的的簡簡要要比比較較 當前,還有一些廠商提供了基于磁盤陣列的數據復制解決方案。主要包括 EMC、IBM 等廠家。其主要結構是在本地數據中心和災備中心均配置同一廠家的磁 盤陣列產品,中間通過光纖通道連接,以邏輯卷為基本單位,將本地磁盤陣列上的 數據同步鏡像到遠程的磁盤陣列上。 一般這樣的方案可以工作在同步和異步兩種模式下,同步要求帶寬要足夠寬, 異步則存在可能的數據丟失或對本地應用產生影響。 一般這些方案都不支持自動得快照功能,另外,快照也不是基于增量的,占用 較大空

40、間的同時,對應用等都將產生一定得影響。從而在最新數據不能夠利用的情 況下,數據的可用性恢復和數據的丟失量無法保障。 就此,我們作如下的簡要比較列表供大家參考: 序序功功能能EMC RECOVERPOINT 基基于于磁磁盤盤陣陣列列的的 方方案案 備備注注 1實時性實時準實時 2通用性和磁盤陣列無關只能適用于同一 個廠家的磁盤陣 列產品 遠程數據 可用性 支持讀寫,對生產應用 無任何影響, 不支持讀,不支 持寫入操作。 遠程數據 處理對復 制的影響 不影響不支持數據操作 (處理 ),如果需要 進行處理,那末, 必須中斷復制過 程。 3 遠程數據 處理(正 常復制過 程中) 遠程數據 的寫操作 及

41、數據重 置 支持,并支持數據重置 ( Reset) ,保持災備數 據始終保持與本地數據 的一致性。 不支持,如果遠 程數據被更改, 那末,沒有辦法 恢復本地和遠程 數據的一致性。 4最新生產 數可用時 始終可用可用 5 數據的可 用性 最新生產 數據不可 用時 可以通過回滾,來恢復 如 15 秒或 30 秒或幾分 鐘之前的數據,在保證 恢復可用數據的同時, 也保障數據的丟失量最 小 必須結合利用其 他工具進行快照 處理 ,但是 ,快照 的頻率較小 ,數據 可能的丟失率較 大。 部支持自動的快 照產生。 后者(基于 盤陣的解決 方案)的快 照對應用具 有很大的影 響,因為產 生快照的時 候,需要

42、暫 停應用。 6快照增量、自動非增量、需要腳 本實現自動化 7占用空間較小較大快照需要的 附加空間 8帶寬一般,無需專線很高,必須專線, 一般為光纖專線。 9技術復雜度極其簡單,支持 WEB、 GUI、 CLI 方式 的集中管理。 較復雜,兩套軟 件分別管理 難度簡單復雜10后期演練 快照數據 的利用 直接利用間接利用 11成本較低較高整體的購買 成本及維護 成本。 12自身高可用支持不支持 13高度壓縮6-10 倍無 14對應用系統的影響無影響自身故障,對應 用系統有影響 15策略化支持不支持 4 4. .數數據據容容災災系系統統的的實實施施計計劃劃 4 4. .1 1 系系統統實實施施需需

43、求求規(guī)規(guī)劃劃 初步建議用戶在每個點采用單臺RECOVERPOINT 設備,今后可以擴展到兩臺, 達到冗余的目的。在此情況下我們作如下的基本規(guī)劃: 在災備中心 的磁盤陣列上分別劃分出多個不同的LUN,分別供復制時接收 不同的應用類型數據使用。 在本地和和 災備中心 的磁盤陣列上再分別劃分出2 個 LUN,分別作為EMC Volume 和 Snapshot History Volume。前者用來保存RECOVERPOINT 的所有配 置信息,以及RECOVERPOINT 相關的集群狀態(tài)數據,空間要求為10GB 左右即 可。后者,用來保存快照記錄,用于在最新數據不可用的情況下,通過回滾來恢復 可用數

44、據,并保持最小化的數據丟失量。該卷的空間大小根據用戶說明,需要考慮 長達 24 小時的數據復制中斷情況下的數據變化量來綜合考慮。 在本地和 災備中心 的光纖交換機上分別配置兩個光纖口,連接 RECOVERPOINT。 在本地和 災備中心 的以太網絡交換機上分別配置兩個口,分別連接 RECOVERPOINT,其中每臺RECOVERPOINT 具有兩個以太網口,一個連接內部局域 網,另一個連接WAN。 進行簡單的圖形化配置RECOVERPOINT,完成數據的初始化,進入正常數據 復制。 進行相關測試,驗收。 進入后續(xù)維護期。 4 4. .2 2 相相關關性性要要求求 / /實實施施步步驟驟 在系統

45、的實施過程中,需要諸如磁盤陣列廠家、光纖交換機廠家及用戶或應用 軟件開發(fā)商提供簡單的協助,具體的任務計劃如下。(注:黃色部分均為實施 前的準備工作,真正的RECOVERPOINT 的實施步驟為下表中的7-13。整體的 實施周期為一周,包括實施及驗收、測試。) 序序 號號 項項目目 /任任務務內內容容負負責責方方完完成成時時間間備備注注 1確認 24 小時的數據最大 變化量 軟件開發(fā)商 和用戶 創(chuàng)建 LUN,用 于接收被 復制的數 據。 和生產用空間相同。 創(chuàng)建 EMC Volume 20GB10GB 2磁盤陣列 (數據中心 和災備中 心) 創(chuàng)建 Snapshot History Volume

46、磁盤陣列廠 商/維護人員 半天 =24 小時的最大 數據變化量。 3光纖交換機的 Zoning 設置 光纖交換機 廠商 &災備 系統實施方 需要把 EMC Volume 和 Snapshot Volume 及應用 LUN 進行 安全設置。 4連接 RECOVERPOINT,數 據中心和 災備中心 同時 進行 5配置 RECOVERPOINT,安 裝服務器端的 RECOVERPOINT 驅動 程序 軟件開發(fā)商 &災備系統 實施方 需要確認 RECOVERPOINT 利用的 IP 和 Gateway 地址,數 據中心和 災備中 心的 KBX 各需要 5 個 IP 地址。 6申請重新引導系統系統管理

47、員 /主機廠商 / 軟件開發(fā)商 半天 需要提前申請 7現有數據系統初始化軟件開發(fā)商 &災備系統 實施方 8系統初始化驗證軟件開發(fā)商 &災備系統 實施方 一天初始化最好在應用 停止的情況下進行, 當然也支持在線的 數據初始化。 9數據的持續(xù)性實時復制, 代表災備系統正常運行 10數據的驗證測試 11災備數據的可用性測試 12災備系統的回切(從災 備中心 到數據中心)的 測試 軟件開發(fā)商 &災備系統 實施方 一天 /二天 根據需要決定是否 進行本項測試 13進入系統正常運行、維 護期 轉交給用戶進行日常管理。需要定期的演練 4 4. .3 3 系系統統配配置置清清單單 針對上書分析,我們作如下的配

48、置清單列表: 序號產品名稱分布作用備注 1RECOVERPOINT 硬件設備 生產中心 和災備中 心各一。 發(fā)送 /接收數據遠期可以擴展到 各兩臺,達到冗 余目的。 2EMC 數據復制軟 件 一套RECOVERPOINT 的軟件及各服務器 的 RECOVERPOINT 驅動軟件。 詳細清單見附件。 3Emulex 光纖卡兩塊用于 RECOVERPOINT 對雙光纖交換機的 連接支持 RECOVERPOINT 缺省帶有一塊單 口的光纖卡。 5 5. .數數據據容容災災系系統統的的測測試試 / /驗驗收收計計劃劃 在本災備系統實施完畢,隨即就可以進行相應的測試計劃。測試的主要步驟列 表如下: 5

49、5. .1 1 基基本本測測試試及及對對O Or ra ac cl le e 和和其其他他類類型型數數據據的的測測試試 下面是以 Oracle 應用為例,對系統得測試/驗收步驟。 Oracle 應用數據是用戶最為關鍵的,在此,首先針對該應用進行測試。 測試名稱說說 明明測測試試方方式式資資源源 /備備注注 數據的實時復 制 察看 RECOVERPOINT 對數 據復制的實時性。 在應用端進行數據的 插入或刪除等類似操 作, 測試系統 數據的實 時復制的 可靠性。 遠程節(jié)點數據 可用性 測試 災備中心 數據的可用性。加載災備中心的 LUN,利用 Oracle作 數據的可用性檢查 遠程數據的完 整

50、性 測試災備中心數據的完整性。比較雙方在某一個時 刻點的數據一致性。 數據一致性測 試 測試數據中心和災備中心數據 的一致性。 插入 /刪除記錄等操作。 非 Oracle 數 據的復制測試 同上類似步驟同上類似驗證方案 的通用性 災備中心數據 支持讀寫 在正常的運行狀態(tài)下,對災備 中心的數據進行讀寫操作測試 災備中心數據 被寫入后的 Reset 操作 在諸如員工培訓、軟件調試等 情況下,對備份數據進行調整 治后可以再恢復到原來的一致 性 在災備中心對數據進 行出入操作,之后進 行Reset操作,察看該 中間過程忠對數據的 變更是否存在,產看 數據的一致性。 5 5. .2 2 切切換換及及回回

51、切切的的測測試試 在本地節(jié)點故障的情況下,用戶往往需要在遠程節(jié)點把應用迅速引導 起來,另外,在本地節(jié)點正常之后,需要把應用再次切換回來,這樣的 過程稱之為為切換 /回切。 測測試試名名稱稱描描 述述 測測試試方方式式 資資源源 /備備注注 兩個節(jié)點都 處于 Active 狀態(tài)下的切 換 正常運行情況下的手工切換,確 認被復制數據的可用性,災備中 心應用的正常運行。 裝載災備 中心的接 收LUN, 啟動 Oracle。 察看運行 是否正常, 數據是否 沒有必要影響 數據中心應用 的正常運行。 可用。 用戶初始化 故障的切換 以某種方式來模擬數據中心數據 (應用)故障,察看此時數據的 可用性。 最新數據被 破壞情況下 的數據恢復 進行一定的故障模擬,如果數據 中心的數據發(fā)生不可用的現象, 利用災備中心的數據恢復至可用 狀態(tài)。 本地數據崩 潰后進行回 切 進行數據中心的數據從災備中心 進行恢復。 需要用戶及軟 件提供商進行 故障模擬。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論