




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計(jì)1. 數(shù)據(jù)中心容災(zāi)備份解決方案隨著社會(huì)的發(fā)展和科技的進(jìn)步, 政府日常工作越來越依賴于數(shù)據(jù)處理來進(jìn)行, 政 務(wù)系統(tǒng)的連續(xù)性依賴于數(shù)據(jù)中心系統(tǒng)的穩(wěn)定運(yùn)行。 然而,災(zāi)難就像灰塵一樣伏擊 在運(yùn)營(yíng)環(huán)境周圍,政務(wù)系統(tǒng)的數(shù)據(jù)中心可能正在一個(gè)充滿風(fēng)險(xiǎn)和威脅的環(huán)境下運(yùn) 行。如果不能對(duì)這些風(fēng)險(xiǎn)采取有效治理, 一旦數(shù)據(jù)由于某種原因丟失, 就很有可 能對(duì)政府的日常工作造成嚴(yán)重的影響。 如果核心數(shù)據(jù)丟失, 將會(huì)使得某些核心功 能陷入癱瘓, 造成不可估量的損失。 因此,保證政務(wù)的連續(xù)性和數(shù)據(jù)的高可靠性 和可用性,已經(jīng)成為政府部門在數(shù)據(jù)中心建設(shè)中,必須要考慮的問題。1.1 災(zāi)備解決方案原則首先
2、,在制定容災(zāi)系統(tǒng)方案的過程中要考慮的就是容災(zāi)系統(tǒng)建設(shè)對(duì)原有業(yè)務(wù)系統(tǒng) 帶來的影響。比如,采用數(shù)據(jù)復(fù)制技術(shù)對(duì)系統(tǒng) I/O 帶來的延遲, 應(yīng)用數(shù)據(jù)同步對(duì) 日常業(yè)務(wù)處理系統(tǒng)帶來的壓力等。 因此,企業(yè)要通過周密的測(cè)試和分析來規(guī)避容 災(zāi)系統(tǒng)建設(shè)時(shí)帶來的這些風(fēng)險(xiǎn), 以保證業(yè)務(wù)系統(tǒng)不會(huì)因容災(zāi)系統(tǒng)的建設(shè)而出現(xiàn)在 處理性能上下降的問題。第二,數(shù)據(jù)狀態(tài)要保持同步。 為保證在災(zāi)難發(fā)生時(shí), 業(yè)務(wù)可以成功地切換到備份 中心,就必須保證容災(zāi)系統(tǒng)數(shù)據(jù)同步機(jī)制的可靠性。 因此, 建立可靠的數(shù)據(jù)同步 校驗(yàn)機(jī)制是必須的 ; 同時(shí),還要考慮建立定時(shí)的、 自動(dòng)的數(shù)據(jù)同步核查對(duì)比機(jī)制, 以檢驗(yàn)兩個(gè)中心數(shù)據(jù)的一致性,這是數(shù)據(jù)容災(zāi)工作中非常
3、重要的一部分。第三,容災(zāi)系統(tǒng)的日常維護(hù)工作要盡可能輕, 并能承擔(dān)部分業(yè)務(wù)處理和測(cè)試的工 作。容災(zāi)系統(tǒng)的維護(hù)和管理是容災(zāi)切換成功的重要保證, 在系統(tǒng)建設(shè)中, 就必須 要考慮系統(tǒng)的維護(hù)管理流程。 生產(chǎn)中心任何業(yè)務(wù)處理過程的改變都必須完整地復(fù) 制到備份中心 ; 所有新業(yè)務(wù)系統(tǒng)上線時(shí), 必須通知備份中心, 并在備份中心配置 好數(shù)據(jù)同步機(jī)制 ; 對(duì)原程序的改動(dòng)也必須保證兩個(gè)中心同時(shí)上線。第四,系統(tǒng)恢復(fù)時(shí)間要盡可能短。 容災(zāi)系統(tǒng)主要是為了實(shí)現(xiàn)在主中心系統(tǒng)發(fā)生災(zāi) 難時(shí),可以在規(guī)定時(shí)間切換到備份中心, 保證數(shù)據(jù)不會(huì)丟失, 并且繼續(xù)向用戶提 供服務(wù)。但往往在災(zāi)難發(fā)生時(shí), 主要技術(shù)人員不能及時(shí)到達(dá)現(xiàn)場(chǎng), 為了順利
4、實(shí)現(xiàn) 系統(tǒng)間的切換,應(yīng)該讓系統(tǒng)切換操作盡可能地簡(jiǎn)單 ; 并建立固定化的、 標(biāo)準(zhǔn)化的 切換流程,要求維護(hù)人員在切換演習(xí)時(shí)嚴(yán)格按照流程的指導(dǎo)步驟進(jìn)行操作。第五,可實(shí)現(xiàn)部分業(yè)務(wù)子系統(tǒng)的切換和回切。當(dāng)人事變動(dòng)、業(yè)務(wù)變化、 IT 設(shè)施 變化以及其他可能引起恢復(fù)規(guī)劃文檔失效的變化發(fā)生時(shí), 應(yīng)及時(shí)更新各恢復(fù)規(guī)劃 文檔,并在必要時(shí)啟動(dòng)模擬測(cè)試或演習(xí),確保業(yè)務(wù)連續(xù)性系統(tǒng)的工作能力。第六,技術(shù)方案選擇要遵循成熟穩(wěn)定、高可靠性、可擴(kuò)展性、透明性的原則。目 前,國(guó)際上比較成熟的容災(zāi)技術(shù)包括:SAN/NAS技術(shù)、遠(yuǎn)程鏡像技術(shù)、虛擬存儲(chǔ)、基于IP的SANS連技術(shù)以及快照技術(shù)等。其中基于IP的SAN遠(yuǎn)程數(shù)據(jù)容災(zāi) 備份技術(shù)應(yīng)
5、用比較廣泛,其是利用基于IP的SAN的互連協(xié)議,將主數(shù)據(jù)中心SAN 中的信息通過現(xiàn)有的TCP/IP網(wǎng)絡(luò),遠(yuǎn)程復(fù)制到備份中心的 SAN中的。當(dāng)備份中 心存儲(chǔ)的數(shù)據(jù)量過大時(shí), 可利用快照技術(shù)將其備份到磁帶庫(kù)或光盤庫(kù)。 這種基于 IP的SAN®程容災(zāi)備份,可以跨越 LAN MAN和WAN成本低、可擴(kuò)展性好?;?于 IP 的互連協(xié)議主要包括 FCIP、iFCP、InfiniBand 、iSCSI 等。第七,構(gòu)建系統(tǒng)方案可以選擇多種技術(shù)組合方式。 目前,業(yè)內(nèi)應(yīng)用較多的容災(zāi)方 案是基于智能存儲(chǔ)系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù), 它是由智能存儲(chǔ)系統(tǒng)自身實(shí)現(xiàn)的數(shù) 據(jù)遠(yuǎn)程復(fù)制和同步, 即智能存儲(chǔ)系統(tǒng)將對(duì)該系統(tǒng)中
6、的存儲(chǔ)器 I/O 操作請(qǐng)求復(fù)制到 遠(yuǎn)端的存儲(chǔ)系統(tǒng)中并執(zhí)行。 由于在這種方式下, 數(shù)據(jù)復(fù)制軟件運(yùn)行在存儲(chǔ)系統(tǒng)內(nèi), 因此較容易實(shí)現(xiàn)主中心和容災(zāi)備份中心的操作系統(tǒng)、 數(shù)據(jù)庫(kù)、系統(tǒng)庫(kù)和目錄的實(shí) 時(shí)拷貝及維護(hù)能力, 且不會(huì)影響主中心主機(jī)系統(tǒng)的性能。 如果在系統(tǒng)恢復(fù)場(chǎng)具備 了實(shí)時(shí)數(shù)據(jù), 那么就可以做到在災(zāi)難發(fā)生時(shí), 及時(shí)開始應(yīng)用處理過程的恢復(fù)。 但 這種方案也有開放性差 ( 不同廠家的存儲(chǔ)設(shè)備系統(tǒng)一般不能配合使用 ) 、對(duì)于主、 備中心之間的網(wǎng)絡(luò)條件 (穩(wěn)定性、帶寬、鏈路空間距離 )要求較苛刻等缺點(diǎn)。1.2 災(zāi)備解決方案設(shè)計(jì)需要考慮的因素1.2.1 RTO 和 RPORTO(RecoveryTime Ob
7、ject ):是指災(zāi)難發(fā)生后,從 IT 系統(tǒng)宕機(jī)導(dǎo)致業(yè)務(wù)停頓 之刻開始,到 IT 系統(tǒng)恢復(fù)至可以支持各部門運(yùn)作,業(yè)務(wù)恢復(fù)運(yùn)營(yíng)之時(shí),此兩點(diǎn) 之間的時(shí)間段成為RTO RTO是反映業(yè)務(wù)恢復(fù)及時(shí)性的指標(biāo),表示業(yè)務(wù)從中斷到 回復(fù)正常所需要的時(shí)間。RTO值越小,代表容災(zāi)系統(tǒng)的數(shù)據(jù)恢復(fù)能力越強(qiáng)。各種 容災(zāi)解決方案的RTC有較大差別,基于光通道技術(shù)的同步數(shù)據(jù)復(fù)制,配合異地備 用的業(yè)務(wù)系統(tǒng)和跨業(yè)務(wù)中心與備份中心的高可用管理, 這種容災(zāi)解決方案具有最 小的 RTC。RPC(Recovery Point Cbjective ),是指從系統(tǒng)和應(yīng)用數(shù)據(jù)而言,要實(shí)現(xiàn)能夠 恢復(fù)至可以支持各部門業(yè)務(wù)運(yùn)作, 系統(tǒng)及生產(chǎn)數(shù)據(jù)應(yīng)恢
8、復(fù)到怎樣的更新程度。 RPC 是反映恢復(fù)數(shù)據(jù)完整性的指標(biāo),在同步數(shù)據(jù)復(fù)制方式下,RPC等于數(shù)據(jù)傳輸延遲的時(shí)間;在異步數(shù)據(jù)復(fù)制下,RPC基本為異步傳輸數(shù)據(jù)排隊(duì)的時(shí)間。在實(shí)際應(yīng)用 中,考慮導(dǎo)數(shù)據(jù)傳輸?shù)囊蛩?,業(yè)務(wù)數(shù)據(jù)庫(kù)與容災(zāi)備份數(shù)據(jù)庫(kù)的一致性(SCN是不同的,RPC表示業(yè)務(wù)數(shù)據(jù)庫(kù)與容災(zāi)備份數(shù)據(jù)庫(kù) SCN勺時(shí)間差。發(fā)生災(zāi)難后,啟 動(dòng)容災(zāi)系統(tǒng)完成數(shù)據(jù)恢復(fù),RPC就是新恢復(fù)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)損失量。設(shè)計(jì)容災(zāi)系統(tǒng)不能只看 RTC和RPO對(duì)于不同的業(yè)務(wù)系統(tǒng)和用戶特殊的要求,其 它一些指標(biāo)有可能成為選擇容災(zāi)解決方案的主要因素。 例如,某些地區(qū)為了防范 一些特定自然災(zāi)害的風(fēng)險(xiǎn), 要求容災(zāi)備份中心與業(yè)務(wù)中心保持足夠的距
9、離, 在這 種情況下,容災(zāi)備份中心與業(yè)務(wù)中心的距離要求就是容災(zāi)系統(tǒng)的重要指標(biāo)。1.2.2 數(shù)據(jù)安全數(shù)據(jù)的完整性, 一致性是保證業(yè)務(wù)連續(xù)的關(guān)鍵。 在本地,數(shù)據(jù)安全需要使用 RAID 技術(shù)來保證。 在災(zāi)備方案的設(shè)計(jì)中, 數(shù)據(jù)復(fù)制方案的設(shè)計(jì)是整個(gè)設(shè)計(jì)的基礎(chǔ)。 目 前業(yè)界主流的數(shù)據(jù)復(fù)制技術(shù)有: 基于數(shù)據(jù)庫(kù)本身的復(fù)制技術(shù), 基于操作系統(tǒng)的數(shù) 據(jù)復(fù)制,基于虛擬存儲(chǔ)的復(fù)制技術(shù)和基于存儲(chǔ)的復(fù)制技術(shù)。 在方案所用技術(shù)的選 擇時(shí),應(yīng)當(dāng)根據(jù)客戶的預(yù)算,現(xiàn)場(chǎng)的條件,綜合來進(jìn)行考量。后續(xù)在 1.6.1 數(shù)據(jù) 同步章節(jié),將會(huì)有這 4 類數(shù)據(jù)復(fù)制技術(shù)的綜合對(duì)比,可以作為選擇的參考。1.2.3 網(wǎng)絡(luò)安全通信網(wǎng)絡(luò)是容災(zāi)系統(tǒng)的組
10、成部分, 通信線路的質(zhì)量也是容災(zāi)系統(tǒng)的性能指標(biāo)之一,其中包括網(wǎng)絡(luò)的數(shù)據(jù)傳輸帶寬、網(wǎng)絡(luò)傳輸通道的冗余和網(wǎng)絡(luò)服務(wù)商的服務(wù)水平(網(wǎng)絡(luò)年中斷率) 。如果容災(zāi)系統(tǒng)使用的通信網(wǎng)絡(luò)是確定的, 為了比較不同容災(zāi) 解決方案,可以用單位存儲(chǔ)容量的數(shù)據(jù)庫(kù)在同一通信網(wǎng)絡(luò)上的數(shù)據(jù)完全恢復(fù)時(shí)間 作為一項(xiàng)設(shè)計(jì)指標(biāo)。124業(yè)務(wù)連續(xù)性業(yè)務(wù)連續(xù)性是災(zāi)備方案的最終目標(biāo),是方案的價(jià)值所在。為了保證業(yè)務(wù)的連續(xù), 首先需要數(shù)據(jù)的連續(xù),之前我們討論了數(shù)據(jù)安全相關(guān)的內(nèi)容。 其次,在數(shù)據(jù)連續(xù) 的基礎(chǔ)上,出現(xiàn)災(zāi)難時(shí),系統(tǒng)需要能夠滿足(1)網(wǎng)絡(luò)切換(2)應(yīng)用切換。以此, 來保證系統(tǒng)能夠順利切換到災(zāi)備地,繼續(xù)安全運(yùn)營(yíng),最大化保證客戶利益。1.3國(guó)標(biāo)
11、系統(tǒng)災(zāi)備等級(jí)劃分及應(yīng)對(duì)措施國(guó)家信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范(GB/T 20988-2007)規(guī)定了六個(gè)級(jí)別的容災(zāi), 下表分別針對(duì)每個(gè)級(jí)別給出了相應(yīng)的應(yīng)對(duì)措施。級(jí)別內(nèi)容措施Level6數(shù)據(jù)零丟失和遠(yuǎn)程集群支持實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)實(shí)時(shí)備份,實(shí)現(xiàn)零丟失;應(yīng)用軟件可以實(shí)現(xiàn)實(shí)時(shí)無縫切換;遠(yuǎn)程集群系統(tǒng)的實(shí)時(shí)監(jiān)控和自動(dòng)切換能力;Level5實(shí)時(shí)數(shù)據(jù)傳輸及完整設(shè)備支持實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù);備用網(wǎng)絡(luò)也具備字哦那個(gè)或集中切換能力;Level4電子傳輸及完整設(shè)備支持配置所需要的全部數(shù)據(jù)和通訊線路及網(wǎng)絡(luò)設(shè)備,并處于就緒狀態(tài);7*24運(yùn)行;更高的技術(shù)支持和運(yùn)維管理;Level3電子傳輸和部分設(shè)備支持配置部分?jǐn)?shù)據(jù),通信線路和網(wǎng)絡(luò)設(shè)備;
12、每天實(shí)現(xiàn)多次的數(shù)據(jù)電子傳輸; 備用場(chǎng)地配置專制的運(yùn)行管理人員;Level2備用場(chǎng)地支持預(yù)定時(shí)間調(diào)配數(shù)據(jù),通信線路和網(wǎng)絡(luò)設(shè)備;備用場(chǎng)地管理制度;設(shè)備及網(wǎng)絡(luò)緊急供貨協(xié)議;Level1基本支持每周至少做一次完全數(shù)據(jù)備份;制定介質(zhì)存取/驗(yàn)證和轉(zhuǎn)儲(chǔ)的管理制度;完整測(cè)試和演練的災(zāi)難恢復(fù)計(jì)劃;1.4容災(zāi)技術(shù)分析1.4.1備份方式(1) 冷備份備份系統(tǒng)未安裝或未配置成與當(dāng)前使用的系統(tǒng)相同或相似的運(yùn)行環(huán)境,應(yīng)用系統(tǒng)數(shù)據(jù)沒有及時(shí)裝入備份系統(tǒng)。一旦發(fā)生災(zāi)難,需安裝配置所需的運(yùn)行環(huán)境,用 數(shù)據(jù)備份介質(zhì)(磁帶或光盤)恢復(fù)應(yīng)用數(shù)據(jù),手工逐筆或自動(dòng)批量追補(bǔ)孤立數(shù)據(jù), 將終端用戶通過通訊線路切換到備份系統(tǒng),恢復(fù)業(yè)務(wù)運(yùn)行。優(yōu)點(diǎn)
13、:設(shè)備投資較少, 節(jié)省通信費(fèi)用,通信環(huán)境要求不高。缺點(diǎn):恢復(fù)時(shí)間較長(zhǎng),一般要數(shù)天至1周,數(shù)據(jù)完整性與一致性較差。(2) 溫備份將備份系統(tǒng)已安裝配置成與當(dāng)前使用的系統(tǒng)相同或相似的系統(tǒng)和網(wǎng)絡(luò)運(yùn)行環(huán)境, 安裝了應(yīng)用系統(tǒng)業(yè)務(wù)定期備份數(shù)據(jù)。 一旦發(fā)生災(zāi)難,直接使用定期備份數(shù)據(jù),手 工逐筆或自動(dòng)批量追補(bǔ)孤立數(shù)據(jù)或?qū)⒔K端用戶通過通訊線路切換到備份系統(tǒng),恢復(fù)業(yè)務(wù)運(yùn)行。優(yōu)點(diǎn):設(shè)備投資較少,通信環(huán)境要求不高。缺點(diǎn):恢復(fù)時(shí)間長(zhǎng),一 般要十幾個(gè)小時(shí)至數(shù)天,數(shù)據(jù)完整性與一致性較差。(3) 熱備份備份處于聯(lián)機(jī)狀態(tài),當(dāng)前應(yīng)用系統(tǒng)通過高速通信線路將數(shù)據(jù)實(shí)時(shí)傳送到備份系統(tǒng), 保持備份系統(tǒng)與當(dāng)前應(yīng)用系統(tǒng)數(shù)據(jù)的同步;也可定時(shí)在備份
14、系統(tǒng)上恢復(fù)應(yīng)用系統(tǒng) 的數(shù)據(jù)。一旦發(fā)生災(zāi)難,不用追補(bǔ)或只需追補(bǔ)很少的孤立數(shù)據(jù),備份系統(tǒng)可快速 接替生產(chǎn)系統(tǒng)運(yùn)行,恢復(fù)營(yíng)業(yè)。優(yōu)點(diǎn):恢復(fù)時(shí)間短,一般幾十分鐘到數(shù)小時(shí),數(shù) 據(jù)完整性與一致性最好,數(shù)據(jù)丟失可能性最小。缺點(diǎn):設(shè)備投資大,通信費(fèi)用高, 通信環(huán)境要求高,平時(shí)運(yùn)行管理較復(fù)雜。在計(jì)算機(jī)服務(wù)器備份和恢復(fù)中,冷備份服務(wù)器(cold server )是在主服務(wù)器丟 失的情況下才使用的備份服務(wù)器。冷備份服務(wù)器基本上只在軟件安裝和配置的情 況下打開,然后關(guān)閉直到需要時(shí)再打開。溫備份服務(wù)器(warm server ) 一般都是周期性開機(jī),根據(jù)主服務(wù)器內(nèi)容進(jìn)行更 新,然后關(guān)機(jī)。經(jīng)常用溫備份服務(wù)器來進(jìn)行復(fù)制和鏡像
15、操作。熱備份服務(wù)器(hot server )時(shí)刻處于開機(jī)狀態(tài),同主機(jī)保持同步。當(dāng)主機(jī)失靈 時(shí),可以隨時(shí)啟用熱備份服務(wù)器來代替。對(duì)于關(guān)鍵的業(yè)務(wù),Primeton建議采用同城熱備+異地?zé)醾涞姆绞竭M(jìn)行部署,對(duì) 于一般性的業(yè)務(wù),建議采用同城熱備+異地溫備(應(yīng)用不啟動(dòng),數(shù)據(jù)保持異步復(fù) 制)的方式進(jìn)行部署。1.4.2數(shù)據(jù)復(fù)制技術(shù)目前數(shù)據(jù)復(fù)制技術(shù)主要有如下表所列 4種,基于紅色字體部分的要求,結(jié)合客戶 的需要,Primeton推薦采用基于存儲(chǔ)或者基于應(yīng)用程序的數(shù)據(jù)復(fù)制技術(shù)來進(jìn)行 數(shù)據(jù)同步?;驹?理數(shù)據(jù)的復(fù)制過程通過本 地的存儲(chǔ)系統(tǒng)和遠(yuǎn)端的 存儲(chǔ)系統(tǒng)之間的通信完 成。復(fù)制技術(shù)是伴隨著存儲(chǔ)局域 網(wǎng)的出現(xiàn)引入的
16、,通過構(gòu)建 虛擬存儲(chǔ)上實(shí)現(xiàn)數(shù)據(jù)復(fù)制。通過操作系統(tǒng)或者 數(shù)據(jù)卷管理器來實(shí) 現(xiàn)對(duì)數(shù)據(jù)的遠(yuǎn)程復(fù) 制。數(shù)據(jù)庫(kù)的異地復(fù)制技術(shù),通常采用日志復(fù) 制功能,依靠本地和遠(yuǎn)程主機(jī)間的日志歸 檔與傳遞來實(shí)現(xiàn)兩端的數(shù)據(jù)一致。平 臺(tái) 要 求同構(gòu)存儲(chǔ)與平臺(tái)無關(guān),需要增加專有的復(fù)制服務(wù)器或帶有復(fù)制功能的SAN交換 機(jī)同構(gòu)主機(jī)、異構(gòu)存儲(chǔ)與平臺(tái)無關(guān)復(fù)制性能高高高較高資 源 占 用對(duì)生產(chǎn)系統(tǒng)存儲(chǔ)性能有影響對(duì)網(wǎng)絡(luò)要求高對(duì)生產(chǎn)系統(tǒng)主機(jī)性能有影響占用部分生產(chǎn)系統(tǒng)數(shù)據(jù)庫(kù)資源技 術(shù) 成 熟 度成熟成熟度有待提高,非主流復(fù)制技術(shù)。成熟成熟投入成本咼,需要同構(gòu)存儲(chǔ)較高,需要專有設(shè)備較高,需要同構(gòu)主機(jī)一般部分軟件免費(fèi),如DataGuard復(fù)制
17、軟 件IBM PPRCEMC SRDFHP CA (ContinuesAccessHDS TrueCopyBrocade Tapestry DMMUIT SVMEMC VSM原廠技術(shù):IBM AIX LVMHP-UINXMirrorDiskSun Solaris SVM專業(yè)的復(fù)制軟件:Symantec SF/VVROracle DataGuardOracle GoldenGateDNT IDRDSG RealSyncQuest SharePlex1.4.3 重復(fù)數(shù)據(jù)刪除技術(shù)重復(fù)數(shù)據(jù)刪除技術(shù)是指將存儲(chǔ)系統(tǒng)中存在的大量?jī)?nèi)容相同的數(shù)據(jù)刪除, 只保留其 中一份, 從而縮減存儲(chǔ)空間的技術(shù)。 在云災(zāi)備中,
18、 該技術(shù)既能大幅減少災(zāi)備中心 存儲(chǔ)的數(shù)據(jù)量, 降低災(zāi)備中心的建設(shè)和運(yùn)維成本, 又能大幅減少數(shù)據(jù)備份和恢復(fù) 過程中用戶和災(zāi)備提供商間的數(shù)據(jù)傳輸量, 提高備份和恢復(fù)的性能, 是一項(xiàng)十分 重要的技術(shù)。隨著災(zāi)備中心的規(guī)模不斷增大, 存儲(chǔ)的數(shù)據(jù)量和訪問量不斷增加, 單一節(jié)點(diǎn)上的 重復(fù)數(shù)據(jù)刪除方法已不能滿足性能和容量的需求。 除上述基本重復(fù)數(shù)據(jù)刪除技術(shù) 外,一些優(yōu)化和改進(jìn)技術(shù)對(duì)云災(zāi)備是至關(guān)重要的,包括高性能、可擴(kuò)展的、分布 式的重復(fù)數(shù)據(jù)刪除技術(shù), 以及為提高災(zāi)備中心數(shù)據(jù)可靠性的高可靠重復(fù)數(shù)據(jù)刪除 技術(shù)。1.4.4 操作系統(tǒng)虛擬化技術(shù) ?除了數(shù)據(jù)級(jí)的災(zāi)備, 還應(yīng)提供系統(tǒng)級(jí)的災(zāi)備。 即在將數(shù)據(jù)復(fù)制到云端的同時(shí)
19、, 也 將受保護(hù)的應(yīng)用程序的狀態(tài)復(fù)制到云端, 當(dāng)災(zāi)難發(fā)生時(shí)可以立即切換到云端的應(yīng) 用程序運(yùn)行,保證業(yè)務(wù)連續(xù)性。 系統(tǒng)級(jí)災(zāi)備是通過操作系統(tǒng)虛擬化和檢查點(diǎn)實(shí)現(xiàn) 的。檢查點(diǎn)用來捕獲進(jìn)程某一時(shí)刻的運(yùn)行狀態(tài), 從而實(shí)現(xiàn)進(jìn)程遷移。 進(jìn)程遷移既 可以是用戶應(yīng)用程序進(jìn)程到云災(zāi)備中心的遷移, 也可以是云災(zāi)備中心內(nèi)部的虛擬 機(jī)池間進(jìn)程遷移,以實(shí)現(xiàn)根據(jù)前端用戶的需求自動(dòng)地調(diào)節(jié)災(zāi)備服務(wù)提供商有限的 硬件與軟件資源,動(dòng)態(tài)地、彈性的反應(yīng)前端業(yè)務(wù)對(duì)災(zāi)備的需求。當(dāng)程序因故障中斷, 如果不能保留其中間運(yùn)行狀態(tài), 恢復(fù)后從頭運(yùn)行將會(huì)帶來極 大的消耗。 檢查點(diǎn)技術(shù)能夠解決這個(gè)問題。 通過保留各個(gè)進(jìn)程的運(yùn)行狀態(tài), 恢復(fù) 時(shí)能夠復(fù)原到
20、最近一次保留的數(shù)據(jù)映像。傳統(tǒng)的檢查員機(jī)制是基于庫(kù)的檢查點(diǎn)機(jī)制。 例如以靜態(tài)庫(kù)的形式實(shí)現(xiàn), 或通過加 載動(dòng)態(tài)鏈接庫(kù)來追蹤程序運(yùn)行過程中的數(shù)據(jù)變化。 也有一些檢查點(diǎn)機(jī)制實(shí)現(xiàn)于內(nèi) 核級(jí)別甚至硬件級(jí)別。 例如通過在文件系統(tǒng)層之上引入一個(gè)中間層來實(shí)現(xiàn)保留文 件系統(tǒng)狀態(tài)的檢查點(diǎn)機(jī)制;或者借助 Fuse 內(nèi)核模塊實(shí)現(xiàn)的支持檢查點(diǎn)機(jī)制的文 件系統(tǒng),通過 Fuse 偵測(cè)、攔截內(nèi)核級(jí)別的文件系統(tǒng)操作并將控制權(quán)傳遞給用戶, 從而能夠在用戶空間對(duì)文件系統(tǒng)狀態(tài)進(jìn)行保留。隨著操作系統(tǒng)虛擬化技術(shù)的發(fā)展, 基于虛擬容器的檢查點(diǎn)技術(shù)也得到了很好的應(yīng) 用。虛擬容器是通過系統(tǒng)虛擬化技術(shù)構(gòu)建出來的一個(gè)進(jìn)程運(yùn)行的較獨(dú)立的上下文 環(huán)境。
21、虛擬容器檢查點(diǎn)技術(shù)能夠有效保護(hù)容器內(nèi)運(yùn)行的應(yīng)用程序和服務(wù)而不需要 對(duì)應(yīng)用進(jìn)行修改。1.5 總體架構(gòu)設(shè)計(jì)1.5.1Primeton “兩地三中心”容災(zāi)解決方案架構(gòu)設(shè)計(jì)結(jié)合近年國(guó)內(nèi)出現(xiàn)的大范圍自然災(zāi)害, 以同城雙中心加異地災(zāi)備中心的“兩地三中心”的災(zāi)備模式也隨之出現(xiàn),這一方案兼具高可用性和災(zāi)難備份的能力。1.5.1.1 “兩地三中心”本地高可用和容災(zāi)保護(hù)策略(1)本地保護(hù)策略:? 本地高可用? 本地 clone? 持續(xù)數(shù)據(jù)保護(hù)? B2D BVTL? 磁帶備份Archive Log 備份(2)容災(zāi)保護(hù)策略?應(yīng)用級(jí)或者數(shù)據(jù)級(jí)容災(zāi)?同級(jí)容災(zāi)、降級(jí)容災(zāi)?同步數(shù)據(jù)保護(hù)/異步數(shù)據(jù)保護(hù)?容災(zāi)數(shù)據(jù)復(fù)制技術(shù)?主備中
22、心運(yùn)營(yíng)方式/雙主中心運(yùn)營(yíng)方式/多中心運(yùn)營(yíng)方式?短、中、遠(yuǎn)期容災(zāi)策略1.5.1.2 “兩地三中心”功能定位生產(chǎn)中心同城備份中心異地災(zāi)備中心生產(chǎn)生產(chǎn)(雙活或熱備)生產(chǎn)備份備份備份災(zāi)備災(zāi)備災(zāi)備開發(fā)監(jiān)控測(cè)試測(cè)試監(jiān)控監(jiān)控管理管理同城雙中心是指在同城或鄰近城市建立兩個(gè)可獨(dú)立承擔(dān)關(guān)鍵系統(tǒng)運(yùn)行的數(shù)據(jù)中 心,雙中心具備基本等同的業(yè)務(wù)處理能力并通過高速鏈路實(shí)時(shí)同步數(shù)據(jù),日常情況下可同時(shí)分擔(dān)業(yè)務(wù)及管理系統(tǒng)的運(yùn)行,并可切換運(yùn)行;災(zāi)難情況下可在基本不 丟失數(shù)據(jù)的情況下進(jìn)行災(zāi)備應(yīng)急切換,保持業(yè)務(wù)連續(xù)運(yùn)行。與異地災(zāi)備模式相比 較,同城雙中心具有投資成本低、建設(shè)速度快、運(yùn)維管理相對(duì)簡(jiǎn)單、可靠性更高 等優(yōu)點(diǎn)。異地災(zāi)備中心是指在
23、異地的城市建立一個(gè)備份的災(zāi)備中心, 用于雙中心的數(shù)據(jù)備 份,當(dāng)雙中心出現(xiàn)自然災(zāi)害等原因而發(fā)生故障時(shí),異地災(zāi)備中心可以用備份數(shù)據(jù) 進(jìn)行業(yè)務(wù)的恢復(fù)。1.5.1.3 “兩地三中心”容災(zāi)架構(gòu)設(shè)計(jì)邏輯架構(gòu)模型設(shè)計(jì):Site副同it容災(zāi))Site A生產(chǎn)中心)Ml兀物理架構(gòu)設(shè)計(jì):10G0f199異步&據(jù)友劃r_*巧二匚 tL-P- I-*-萬案特點(diǎn):?同城范圍有效保證了數(shù)據(jù)的安全性和業(yè)務(wù)連續(xù)性;?異地復(fù)制數(shù)據(jù)根據(jù)災(zāi)難情形,盡可能降低數(shù)據(jù)丟失機(jī)率;?同城雙中心為同步復(fù)制,數(shù)據(jù)實(shí)時(shí)同步,RPO=0?異地?zé)o距離限制,保證數(shù)據(jù)一致性,保證了數(shù)據(jù)的有效保護(hù);?異地容災(zāi)帶寬要求低,先進(jìn)的復(fù)制機(jī)制提高帶寬利用率
24、。對(duì)于本地本級(jí)備份,應(yīng)建立在線、近線、離線等多級(jí)存儲(chǔ)備份系統(tǒng),充分利用先 進(jìn)的備份手段和備份策略,形成完整的本地備份管理解決方案;備份的數(shù)據(jù)包括 操作系統(tǒng)、數(shù)據(jù)文件以及應(yīng)用服務(wù)環(huán)境等多個(gè)方面;日常訪問的重要數(shù)據(jù)采用磁 盤或者虛擬帶庫(kù)方式備份,歸檔數(shù)據(jù)和非重要數(shù)據(jù)采用磁帶庫(kù)方式備份; 重要數(shù) 據(jù)應(yīng)至少保證每周做一個(gè)全量備份,平時(shí)做增量備份。對(duì)于數(shù)據(jù)級(jí)異地災(zāi)備中心,選址上,應(yīng)進(jìn)行風(fēng)險(xiǎn)分析,避免異地備份中心與主中 心同時(shí)遭受同類風(fēng)險(xiǎn);網(wǎng)絡(luò)備用系統(tǒng)上,必須在核心網(wǎng)絡(luò)層面實(shí)現(xiàn)熱備,保證災(zāi) 備中心區(qū)域內(nèi)通信的可靠性;數(shù)據(jù)備份系統(tǒng)上,主中心與備份中心的備份鏈路應(yīng) 有冗余,并確保2小時(shí)內(nèi)將主中心的增量數(shù)據(jù)復(fù)制
25、或備份到災(zāi)備中心; 數(shù)據(jù)處理 備用系統(tǒng)上,配備災(zāi)難恢復(fù)所需的全部數(shù)據(jù)處理設(shè)備, 并處于就緒狀態(tài)或運(yùn)行狀 態(tài),與主中心共同承擔(dān)部分核心應(yīng)用的查詢服務(wù)功能。對(duì)于同城應(yīng)用級(jí)災(zāi)備中心,選址上,主中心與同城災(zāi)備中心距離應(yīng)小于100KM網(wǎng)絡(luò)備用系統(tǒng)上,在核心網(wǎng)絡(luò)層面實(shí)現(xiàn)熱備,主中心與應(yīng)用級(jí)災(zāi)備中心間通過裸 光纖互聯(lián)或VPLS互聯(lián),部署TRILL構(gòu)建大二層網(wǎng)絡(luò),滿足虛擬化需求;網(wǎng)絡(luò)負(fù) 載均衡上,主中心網(wǎng)絡(luò)與災(zāi)備中心網(wǎng)絡(luò)的負(fù)載均衡,提高災(zāi)備網(wǎng)絡(luò)利用率與災(zāi)備 網(wǎng)絡(luò)可用性,正常情況下數(shù)據(jù)流同時(shí)使用兩個(gè)中心的網(wǎng)絡(luò),主中心網(wǎng)絡(luò)出現(xiàn)故障 時(shí),則全部數(shù)據(jù)流向?yàn)?zāi)備網(wǎng)絡(luò);應(yīng)用集群切換上,關(guān)鍵業(yè)務(wù)系統(tǒng)集群實(shí)現(xiàn)手動(dòng)切 換,主中心
26、與同城災(zāi)備中心之間建立高可用性監(jiān)控技術(shù),實(shí)現(xiàn)災(zāi)備中心應(yīng)用服務(wù)器集群與主中心生產(chǎn)服務(wù)器集群之間的高可用性切換;云計(jì)算技術(shù)采用上,采用 虛擬化技術(shù)對(duì)同城災(zāi)備中心進(jìn)行規(guī)劃建設(shè), 同時(shí),根據(jù)業(yè)務(wù)關(guān)鍵程度、對(duì)性能的 要求,系統(tǒng)平臺(tái)選擇不同檔次和不同平臺(tái)的主機(jī)資源池、存儲(chǔ)資源池。1.5.2基于不同服務(wù)需求選擇不同可靠性“兩地三中心”架構(gòu)1.521服務(wù)等級(jí)劃分的可靠性服務(wù)級(jí)別tierltier2tier3tier4服務(wù)內(nèi)容關(guān)鍵任務(wù)服務(wù),需要最 高級(jí)別的可靠性。高端 技術(shù)和工具將會(huì)被用來 滿足最高級(jí)別的可靠關(guān)鍵業(yè)務(wù)服務(wù)的運(yùn)維和 tierl 一樣,但是某些 限制非可靠級(jí)別的服務(wù) 可以容忍短時(shí)間的不可高端技術(shù)和工
27、具將會(huì)盡 量(略低于tierl和 tier2 )被用來滿足最高 級(jí)別的可靠性。允許有沒有關(guān)鍵服務(wù)運(yùn)行,運(yùn) 維和支撐只要能夠在一 個(gè)可以接受的范圍內(nèi)即 可。性。如果丟失一個(gè)組件, 如服務(wù)器,一塊存儲(chǔ), 或者一個(gè)通信鏈接,都 將會(huì)導(dǎo)致服務(wù)不可靠。 每個(gè)應(yīng)用和基礎(chǔ)服務(wù)都 會(huì)制定性能指標(biāo)。這些 指標(biāo)都將會(huì)被監(jiān)控,并 會(huì)通過業(yè)務(wù)支持的流程 以特定格式輸出。這個(gè) site不僅僅包含基礎(chǔ)架 構(gòu)組件。恢復(fù)的影響。高端技術(shù) 和工具將會(huì)盡量(略低 于tierl )被用來滿足 最高級(jí)別的可靠性。系 統(tǒng)設(shè)計(jì)和指導(dǎo)里面必須 包含沒有單點(diǎn)故 障。多個(gè)單點(diǎn)故障。僅僅在 計(jì)劃上有一些伸縮性。關(guān)鍵指標(biāo)99.99%的可靠性,數(shù)據(jù)
28、 中性能夠切換,廠家支 持(小于2小時(shí)的響應(yīng) 時(shí)間),硬件容錯(cuò)性, 沒有單點(diǎn)故障,N+1,數(shù) 據(jù)中心的切換選擇,硬 件冗余99.5%的可靠性,數(shù)據(jù)中 性能夠切換,廠家支持(小于4小時(shí)的響應(yīng)時(shí) 間),硬件具備容錯(cuò)性, 沒有單點(diǎn)故障,N+195%勺可靠性,數(shù)據(jù)中性 能夠切換,廠家支持(小 于24小時(shí)的響應(yīng)時(shí)間)沒有可靠性保證,最低級(jí)別的支持分鐘宕機(jī)/月4.32216.002160.001.522 Primet on通用的基于服務(wù)的“兩地三中心”架構(gòu)示意圖本地:生產(chǎn)環(huán)瓏+同拡冬份八、I廠 界地:和案二桶同或甫-和、牛產(chǎn)環(huán)境槨冋或擰沒有ffftffi (A)生產(chǎn)醉壇K*nnflArwclHL *sirt 瓦1lnqfKP&ZJWts-公H *驚.FUJgt1-M弄穴內(nèi)rt * -服務(wù)HA甚礎(chǔ)架構(gòu)計(jì)劃內(nèi)更新/可it性級(jí)別:99.XXX本地工W廠相皤徨遠(yuǎn)的異地1.5.2.3 Primeton基于不同的服務(wù)質(zhì)量,達(dá)到不同級(jí)別的整體可靠性(tier )(1)場(chǎng)景1主環(huán)境如圖中A所示,包含了數(shù)據(jù)庫(kù),應(yīng)用,Web三層服務(wù)結(jié)構(gòu),本地高可用環(huán) 境P作為同城備份站點(diǎn),復(fù)制100%A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 開發(fā)土地合同范本
- 用戶體驗(yàn)在網(wǎng)絡(luò)安全領(lǐng)域的應(yīng)用
- 科技創(chuàng)新驅(qū)動(dòng)的商業(yè)創(chuàng)新實(shí)踐
- 滴灌施工合同范本
- 科技產(chǎn)品線下推廣活動(dòng)策劃與執(zhí)行
- 招聘廠長(zhǎng)合同范本
- 社交媒體平臺(tái)下的網(wǎng)絡(luò)安全管理挑戰(zhàn)
- 2025至2030年中國(guó)苯甲醛-2-磺酸鈉數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 二零二五年度住宿安全保險(xiǎn)理賠服務(wù)合同
- 2025至2030年中國(guó)自動(dòng)人行道設(shè)備數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 冬季感冒知識(shí)講座
- 基于OBE理念的項(xiàng)目式學(xué)習(xí)模式設(shè)計(jì)與應(yīng)用研究
- 醫(yī)療護(hù)理醫(yī)學(xué)培訓(xùn) 小兒麻醉專家共識(shí)課件
- 模糊多屬性決策方法及其在物流服務(wù)供應(yīng)鏈管理中的應(yīng)用研究
- 2024年廣東省《輔警招聘考試必刷500題》考試題庫(kù)含答案
- 國(guó)家科技安全教學(xué)課件
- DB3301T 1088-2018 杭州龍井茶栽培技術(shù)規(guī)范
- 2010浙G22 先張法預(yù)應(yīng)力混凝土管樁
- 安徽省部分省示范中學(xué)2025屆高三第一次模擬考試英語試卷含解析
- 工程機(jī)械租賃服務(wù)方案及保障措施 (二)
- 國(guó)網(wǎng)基建安全管理課件
評(píng)論
0/150
提交評(píng)論