異地?cái)?shù)據(jù)備份方案_第1頁(yè)
異地?cái)?shù)據(jù)備份方案_第2頁(yè)
異地?cái)?shù)據(jù)備份方案_第3頁(yè)
異地?cái)?shù)據(jù)備份方案_第4頁(yè)
異地?cái)?shù)據(jù)備份方案_第5頁(yè)
已閱讀5頁(yè),還剩82頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

異地?cái)?shù)據(jù)備份方案異地?cái)?shù)據(jù)備份方案異地?cái)?shù)據(jù)備份方案資料僅供參考文件編號(hào):2022年4月異地?cái)?shù)據(jù)備份方案版本號(hào):A修改號(hào):1頁(yè)次:1.0審核:批準(zhǔn):發(fā)布日期:新一篇:

VERITAS的全線存儲(chǔ)備份容災(zāi)解決方案第一章 災(zāi)難備份背景及優(yōu)勢(shì) 3什么是計(jì)算機(jī)業(yè)務(wù)系統(tǒng)的災(zāi)難 3 國(guó)外計(jì)算機(jī)業(yè)務(wù)系統(tǒng)災(zāi)難備份應(yīng)用情況 3 國(guó)內(nèi)計(jì)算機(jī)系統(tǒng)的災(zāi)難備份計(jì)劃的應(yīng)用情況 4 建設(shè)災(zāi)難備份中心的重要意義 4第二章 災(zāi)難分析 7第三章 災(zāi)難備份設(shè)計(jì)目標(biāo) 8 災(zāi)難備份的設(shè)計(jì)目標(biāo) 8第四章 災(zāi)難備份設(shè)計(jì)思路及模型 9容災(zāi)項(xiàng)目開始 9災(zāi)難風(fēng)險(xiǎn)分析 9制定恢復(fù)計(jì)劃 9方案實(shí)施 9支持與維護(hù) 9第五章 xxxx業(yè)務(wù)系統(tǒng)災(zāi)難備份/恢復(fù)體系設(shè)計(jì) 12 災(zāi)難備份/恢復(fù)體系總體設(shè)計(jì) 12 應(yīng)用層方式容災(zāi)結(jié)構(gòu)簡(jiǎn)介 13 數(shù)據(jù)庫(kù)方式容災(zāi)結(jié)構(gòu)簡(jiǎn)介 15 鏡像軟件容災(zāi)方式結(jié)構(gòu)簡(jiǎn)介 19 XP磁盤陣列容災(zāi)方式結(jié)構(gòu)簡(jiǎn)介 215.5.1災(zāi)難恢復(fù)系統(tǒng)硬件,軟件配置說(shuō)明 235.5.2XPCA軟件容災(zāi)原理 245.5.3切換步驟 265.5.5XP容災(zāi)方案性能分析 30第六章 災(zāi)難備份恢復(fù)流程 31第七章 培訓(xùn)測(cè)試及維護(hù) 33 培訓(xùn) 33 測(cè)試災(zāi)難備份計(jì)劃 33 維護(hù) 34第八章 成功案例介紹 35 國(guó)外成功案例 35 國(guó)內(nèi)成功案例 35

第一章 災(zāi)難備份背景及優(yōu)勢(shì)什么是計(jì)算機(jī)業(yè)務(wù)系統(tǒng)的災(zāi)難今天,XXXX比以往任何時(shí)候都更加依賴于計(jì)算機(jī)系統(tǒng),計(jì)算機(jī)系統(tǒng)在為XXXX迅猛發(fā)展提供技術(shù)基礎(chǔ)架構(gòu)的同時(shí),由于用戶業(yè)務(wù)處理的高度集中,以及不可預(yù)見的故障和災(zāi)難,導(dǎo)致整個(gè)系統(tǒng)存在很多災(zāi)難性破壞的隱患,有可能成為整體系統(tǒng)中的單故障點(diǎn)。因此,業(yè)務(wù)的拓展與災(zāi)難的防范是所有用戶都必須同步重視的問題。那么,什么是計(jì)算機(jī)業(yè)務(wù)系統(tǒng)的災(zāi)難呢通常的定義是指采用計(jì)算機(jī)系統(tǒng)處理的重要電子數(shù)據(jù)丟失至不可恢復(fù)或由此導(dǎo)致業(yè)務(wù)中斷以至于延長(zhǎng)到不可接受的時(shí)間。 國(guó)外計(jì)算機(jī)業(yè)務(wù)系統(tǒng)災(zāi)難備份應(yīng)用情況災(zāi)難備份計(jì)劃在發(fā)達(dá)國(guó)家電信行業(yè)和金融行業(yè)得到了較早的實(shí)施,現(xiàn)已較為普遍。例如在美國(guó),因一九八五年紐約銀行計(jì)算機(jī)故障,聯(lián)邦管理部門更加強(qiáng)了在這方面的監(jiān)管力度?,F(xiàn)美國(guó)計(jì)算機(jī)業(yè)務(wù)系統(tǒng)一般出于以下三方面來(lái)考慮災(zāi)難備份計(jì)劃:重要數(shù)據(jù)保護(hù)與業(yè)務(wù)連續(xù)運(yùn)行的需要:在美國(guó),各行業(yè)內(nèi)部競(jìng)爭(zhēng)激烈;在計(jì)算機(jī)管理制度上較為完善;一旦因突發(fā)災(zāi)難而造成數(shù)據(jù)丟失或業(yè)務(wù)中斷,將會(huì)造成重大乃至致命的打擊。審計(jì)的要求:美國(guó)較大型的企業(yè)一般會(huì)由第三家獨(dú)立審計(jì)公司來(lái)提供其資信業(yè)務(wù)、管理等方面咨詢服務(wù),而世界著名的六大審計(jì)公司在對(duì)企業(yè)的評(píng)估項(xiàng)目中均包含災(zāi)難備份計(jì)劃一項(xiàng);評(píng)估企業(yè)數(shù)據(jù)在災(zāi)難等威脅破壞下數(shù)據(jù)的完整性,一致性與安全性,及業(yè)務(wù)的可恢復(fù)性等,有些咨詢審計(jì)公司還會(huì)參與驗(yàn)證所制訂的容災(zāi)計(jì)劃的具體過程和其可行性。缺少災(zāi)難備份計(jì)劃及其危害性會(huì)在評(píng)估報(bào)告中被顯示出來(lái)。法律的要求:美國(guó)政府及州政府通過多項(xiàng)法律強(qiáng)制性要求電信、金融業(yè)等大型企業(yè)備有計(jì)算機(jī)安全及災(zāi)難備份計(jì)劃。對(duì)于沒有遵守這項(xiàng)災(zāi)難備份計(jì)劃的企業(yè),會(huì)遭受曝光及罰款等嚴(yán)重處理,同時(shí)亦可能對(duì)相關(guān)責(zé)任人采取罰款甚至監(jiān)禁等處罰。已知的災(zāi)難例子有:日本神戶大地震、美國(guó)佛羅里達(dá)州颶風(fēng)(數(shù)百家企業(yè)實(shí)施了災(zāi)難備份計(jì)劃)、臺(tái)灣大地震等。 國(guó)內(nèi)計(jì)算機(jī)系統(tǒng)的災(zāi)難備份計(jì)劃的應(yīng)用情況隨著我國(guó)入“世”的腳步越來(lái)越近,傳統(tǒng)產(chǎn)業(yè)在進(jìn)入新市場(chǎng)新方式的競(jìng)爭(zhēng)中,企業(yè)的電子信息架構(gòu)的搭建,成為最具有戰(zhàn)略意義的資源投資。作為信息架構(gòu)核心的數(shù)據(jù),其安全備份和災(zāi)難恢復(fù)隨著世紀(jì)交替Y2K問題的引發(fā),逐漸引起人們的思考和重視?,F(xiàn)代企業(yè)必須直面一個(gè)迫在眉睫的問題:如何對(duì)數(shù)據(jù)進(jìn)行持續(xù)不斷地存儲(chǔ),并通過有效地應(yīng)用這些信息,提高企業(yè)的利潤(rùn)率和競(jìng)爭(zhēng)力。所以,在當(dāng)今企業(yè)運(yùn)營(yíng)電子化的進(jìn)程中,存儲(chǔ)將與網(wǎng)絡(luò)、軟件應(yīng)用和系統(tǒng)CPU處于同等重要的地位,成為決定系統(tǒng)成熟與否的關(guān)鍵。由于存在著各種數(shù)據(jù)丟失的可能,隨著人們對(duì)網(wǎng)絡(luò)系統(tǒng)的依賴日益增加,從硬件到軟件對(duì)數(shù)據(jù)的保護(hù)和備份確實(shí)是不容忽視的環(huán)節(jié)。企業(yè)的IT專家們逐漸認(rèn)識(shí)到,可能造成數(shù)據(jù)丟失的因素主要有三種:自然災(zāi)害的災(zāi)難性破壞造成數(shù)據(jù)永久丟失,最佳的解決方案就是異地?cái)?shù)據(jù)備份;計(jì)算機(jī)和網(wǎng)絡(luò)系統(tǒng)的硬件和軟件故障,這種損失也只有通過完整的數(shù)據(jù)備份來(lái)彌補(bǔ);另外,自然免不了黑客的破壞以及人員的操作失誤。這些事故的發(fā)生都是防不勝防的,唯一能把損失降到最低的辦法就只有依賴具有數(shù)據(jù)備份和災(zāi)難恢復(fù)功能的存儲(chǔ)設(shè)備。近年來(lái)國(guó)內(nèi)用戶在計(jì)算機(jī)應(yīng)用方面的飛速發(fā)展,計(jì)算機(jī)系統(tǒng)基礎(chǔ)架構(gòu)的建設(shè)、特別是計(jì)算機(jī)容災(zāi)系統(tǒng)的設(shè)計(jì)與建設(shè)正逐漸被用戶所重視。不言而喻,如果用戶的業(yè)務(wù)系統(tǒng)有一套完備的災(zāi)難備份/恢復(fù)體系,當(dāng)突發(fā)性災(zāi)難發(fā)生后,業(yè)務(wù)系統(tǒng)關(guān)鍵業(yè)務(wù)數(shù)據(jù)的損失將減至最小。特別是隨著中國(guó)加入WTO的日益臨近和行業(yè)競(jìng)爭(zhēng)越來(lái)越激烈,完善的災(zāi)難備份/恢復(fù)體系在不遠(yuǎn)的將來(lái)將是國(guó)內(nèi)企業(yè)發(fā)展的可靠保障。在國(guó)內(nèi),隨著Internet的逐漸普及和電子商務(wù)熱潮的興起,企業(yè)需要整合越來(lái)越多的數(shù)據(jù),而數(shù)據(jù)的合并、管理、分享、保護(hù)都需要一個(gè)強(qiáng)大的、高可靠性的數(shù)據(jù)中心;同時(shí),隨著國(guó)內(nèi)企業(yè)經(jīng)營(yíng)者對(duì)企業(yè)數(shù)據(jù)信息的價(jià)值和數(shù)據(jù)安全備份的認(rèn)識(shí)的提高,存儲(chǔ)設(shè)備的投資也正在企業(yè)信息化建設(shè)的投入中占據(jù)著越來(lái)越高的比重。IT行業(yè)權(quán)威人士認(rèn)為,在將來(lái)的一至兩年中,數(shù)據(jù)存儲(chǔ)系統(tǒng)要花費(fèi)所有企業(yè)計(jì)算系統(tǒng)投資的70%。 建設(shè)災(zāi)難備份中心的重要意義隨著計(jì)算機(jī)管理技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,為了提高企業(yè)業(yè)務(wù)管理水平、增強(qiáng)企業(yè)市場(chǎng)競(jìng)爭(zhēng)能力,越來(lái)越多的企業(yè)開始使用計(jì)算機(jī)來(lái)處理內(nèi)部日常事務(wù)和外部業(yè)務(wù)往來(lái),從而使得這些企業(yè)越來(lái)越依賴于系統(tǒng)管理數(shù)據(jù)和業(yè)務(wù)信息。尤其是在企業(yè)業(yè)務(wù)不斷增加、數(shù)據(jù)量成倍增長(zhǎng)乃至出現(xiàn)數(shù)據(jù)膨脹現(xiàn)象時(shí),由此引發(fā)的企業(yè)從數(shù)據(jù)膨脹、到計(jì)算機(jī)性能提高、再導(dǎo)致新一輪數(shù)據(jù)膨脹的循環(huán)不斷加劇,進(jìn)而在企業(yè)中引起新的數(shù)據(jù)安全恐慌,數(shù)據(jù)失效問題時(shí)有發(fā)生。建設(shè)災(zāi)難備份中心的目的就是在于防止一些災(zāi)難性的小概率事件可能對(duì)集中式信息系統(tǒng)造成的不可恢復(fù)的原始數(shù)據(jù)的丟失,這些災(zāi)難性事件可能包括為火災(zāi),地震,電源故障及一些人為的操作失誤等,如下圖所示。

現(xiàn)代企業(yè)管理非常重視總體擁有成本(TCO)。所謂TCO,實(shí)際上是由實(shí)際成本、使用成本和風(fēng)險(xiǎn)成本三項(xiàng)組成。實(shí)際成本和使用成本在企業(yè)的建設(shè)與生產(chǎn)中往往容易引起人們重視,因而考慮得非常周到。而風(fēng)險(xiǎn)成本不僅是企業(yè)看不見、摸不著的東西,也是企業(yè)運(yùn)作時(shí)很難預(yù)料和把握的內(nèi)容。在使用計(jì)算機(jī)系統(tǒng)的企業(yè)中,風(fēng)險(xiǎn)成本包含用于管理關(guān)系到企業(yè)生命的各項(xiàng)數(shù)據(jù)與信息的安全、正常、可靠的高速運(yùn)行的所需費(fèi)用。所以,為將風(fēng)險(xiǎn)成本降至最低,同時(shí)使企業(yè)長(zhǎng)期處于最佳狀態(tài),對(duì)企業(yè)業(yè)務(wù)和計(jì)算機(jī)管理與控制系統(tǒng)數(shù)據(jù)進(jìn)行全面存儲(chǔ)備份是一項(xiàng)絕對(duì)值得的、也是必要的投資。我們知道,隨著企業(yè)計(jì)算機(jī)系統(tǒng)建設(shè)計(jì)劃的逐步實(shí)施,XXXX的日常業(yè)務(wù)同計(jì)算機(jī)系統(tǒng)的聯(lián)系越來(lái)越緊密。因此,業(yè)務(wù)主機(jī)系統(tǒng)的運(yùn)行出現(xiàn)故障所帶來(lái)的業(yè)務(wù)影響范圍會(huì)被迅速擴(kuò)大,而客戶對(duì)企業(yè)計(jì)算機(jī)業(yè)務(wù)系統(tǒng)的連續(xù)運(yùn)行,業(yè)務(wù)系統(tǒng)、用戶數(shù)據(jù)的高可用性以及業(yè)務(wù)計(jì)算機(jī)系統(tǒng)抵御突發(fā)性災(zāi)難的能力的要求也必然急劇提高。XXXX建設(shè)災(zāi)難備份/恢復(fù)中心有如下的意義:重要業(yè)務(wù)數(shù)據(jù)在災(zāi)難發(fā)生后得以有效保護(hù)重要業(yè)務(wù)在災(zāi)難發(fā)生后可以在設(shè)定的時(shí)間內(nèi)恢復(fù),從而實(shí)現(xiàn)業(yè)務(wù)的連續(xù)運(yùn)行業(yè)務(wù)計(jì)算機(jī)系統(tǒng)抵御突發(fā)性災(zāi)難的能力和級(jí)別提高進(jìn)一步提高XXXX聲譽(yù),增強(qiáng)客戶及潛在客戶的信心擴(kuò)大對(duì)同行業(yè)競(jìng)爭(zhēng)對(duì)手的優(yōu)勢(shì)

第二章 災(zāi)難分析可能發(fā)生的災(zāi)難因各城市/地域的地理、氣候、社會(huì)治安、城市管理,如供水、供電、通訊條件等差異而有所不同。仔細(xì)地分析各種突發(fā)性災(zāi)害發(fā)生的可能性以及由此所造成的后果,對(duì)于制定和構(gòu)建完整的和有很強(qiáng)針對(duì)性的災(zāi)難備份體系是有很大幫助的。

下表是一張分析表樣本,可使我們對(duì)于可能發(fā)生的突發(fā)性災(zāi)難評(píng)估有較為清晰的概念。

可能的災(zāi)難可能性:

12345工作場(chǎng)所火災(zāi)

數(shù)據(jù)中心火災(zāi)

電源故障

氣候?yàn)?zāi)難(臺(tái)風(fēng),洪水等)

工業(yè)破壞

城市事件(罷工,動(dòng)亂等)

硬件故障

軟件故障

設(shè)備問題(如管道漏水等)

供水故障

通訊系統(tǒng)故障

計(jì)算機(jī)故意破壞(如病毒等)

爆炸威脅

工作場(chǎng)所的環(huán)境緊急事件(化學(xué)污染等)

第三章 災(zāi)難備份設(shè)計(jì)目標(biāo) 災(zāi)難備份的設(shè)計(jì)目標(biāo)采用何種容災(zāi)方式(邏輯數(shù)據(jù)復(fù)制/物理數(shù)據(jù)復(fù)制)實(shí)現(xiàn)災(zāi)難備份系統(tǒng)的設(shè)計(jì)目標(biāo)主要應(yīng)從以下四個(gè)方面來(lái)考慮:具體數(shù)據(jù)類型與目標(biāo)的災(zāi)難保護(hù):從用戶業(yè)務(wù)系統(tǒng)正常運(yùn)作的角度分析各種關(guān)鍵業(yè)務(wù)數(shù)據(jù),作出重要性與可恢復(fù)性要求的評(píng)估,并由此制定系統(tǒng)的數(shù)據(jù)災(zāi)難保護(hù)政策。災(zāi)難發(fā)生后的可恢復(fù)業(yè)務(wù)分析:對(duì)用戶各種業(yè)務(wù)與管理流程進(jìn)行分析評(píng)估,并據(jù)此制定出用戶核心業(yè)務(wù)系統(tǒng)的災(zāi)難備份/恢復(fù)策略。災(zāi)難發(fā)生后的可恢復(fù)分析:對(duì)于突發(fā)性災(zāi)難這樣的重大事件,有時(shí)受災(zāi)地區(qū)并不茍求所有業(yè)務(wù)系統(tǒng)都能夠可持續(xù)運(yùn)營(yíng),故可按實(shí)際需求和比例進(jìn)行分析,并由此配置相應(yīng)的容災(zāi)設(shè)備。災(zāi)難發(fā)生后的業(yè)務(wù)可恢復(fù)時(shí)間指標(biāo):可以將災(zāi)難的發(fā)生分為兩類,一類是可以預(yù)計(jì)具體時(shí)間的災(zāi)難,如損害性極大的臺(tái)風(fēng)等;另一類是不可預(yù)計(jì)具體時(shí)間的突發(fā)性的災(zāi)難,如地震、主機(jī)系統(tǒng)的非計(jì)劃性Down機(jī)等。針對(duì)兩種不同的災(zāi)難類型,要設(shè)定不同的業(yè)務(wù)恢復(fù)時(shí)間指標(biāo)。一般來(lái)說(shuō),對(duì)第一類災(zāi)難的業(yè)務(wù)恢復(fù)時(shí)間要大大短于對(duì)第二類突發(fā)性災(zāi)難的業(yè)務(wù)恢復(fù)時(shí)間.根據(jù)用戶對(duì)系統(tǒng)容災(zāi)能力的不同要求以及投資方面的因素,HP公司提供多種容災(zāi)解決方案,各有側(cè)重不同,我們會(huì)從不同的角度介紹容災(zāi)系統(tǒng)的實(shí)現(xiàn)方法,以及系統(tǒng)的典型配置。

第四章 災(zāi)難備份設(shè)計(jì)思路及模型為了設(shè)計(jì)與實(shí)施xxxx的災(zāi)難備份系統(tǒng),按照大型項(xiàng)目的管理方法和HP公司在項(xiàng)目管理方面所積累的豐富經(jīng)驗(yàn),在這里將整體項(xiàng)目的設(shè)計(jì)與實(shí)施分為五個(gè)階段:容災(zāi)項(xiàng)目開始明確xxxx災(zāi)難備份/恢復(fù)計(jì)劃的必要性明確災(zāi)難備份計(jì)劃的負(fù)責(zé)人和實(shí)施隊(duì)伍制定項(xiàng)目實(shí)施時(shí)間表。災(zāi)難風(fēng)險(xiǎn)分析確定對(duì)xxxx業(yè)務(wù)至關(guān)重要的系統(tǒng)、網(wǎng)絡(luò)和用戶確定由于自然或人為災(zāi)難對(duì)這些造成的威脅和損失,并盡可能準(zhǔn)確為具體的損失收集各種業(yè)務(wù)和用戶對(duì)系統(tǒng)中斷時(shí)間等的要求制定恢復(fù)計(jì)劃制定當(dāng)災(zāi)難發(fā)生,原業(yè)務(wù)主機(jī)系統(tǒng)或網(wǎng)絡(luò)系統(tǒng)不可用時(shí),提供第二主機(jī)(災(zāi)備主機(jī))或網(wǎng)絡(luò)(災(zāi)備網(wǎng)絡(luò))的選擇策略。方案實(shí)施開始實(shí)施災(zāi)難備份計(jì)劃,如數(shù)據(jù)實(shí)時(shí)在線備份、應(yīng)用系統(tǒng)切換、記錄本地?cái)?shù)據(jù)備份的磁帶管理等。支持與維護(hù)由指定的人員、部門或公司提供容災(zāi)系統(tǒng)的日常支持與維護(hù)服務(wù),保證災(zāi)難備份/恢復(fù)系統(tǒng)的可持續(xù),高可用運(yùn)行。以下為容災(zāi)方案實(shí)施各階段的框圖:項(xiàng)目開始災(zāi)難風(fēng)險(xiǎn)分析方案實(shí)施支持與維護(hù)制定恢復(fù)計(jì)劃

對(duì)于其中的核心部分-第三項(xiàng)“制定恢復(fù)計(jì)劃”,根據(jù)xxxx的業(yè)務(wù)特點(diǎn),這里分為以下幾個(gè)步驟:1、制定業(yè)務(wù)主機(jī)系統(tǒng)集群系統(tǒng)熱備份計(jì)劃:包括對(duì)服務(wù)器、操作系統(tǒng)、應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、重要數(shù)據(jù)等的熱備份計(jì)劃。2、制定位于生產(chǎn)地的、與業(yè)務(wù)主機(jī)系統(tǒng)相關(guān)的前置服務(wù)器數(shù)據(jù)熱備份計(jì)劃:包括對(duì)其他機(jī)型的操作系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、應(yīng)用系統(tǒng)、重要數(shù)據(jù)和通訊配置等的熱備份計(jì)劃。3、制定網(wǎng)絡(luò)通訊備份計(jì)劃:對(duì)網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)協(xié)議、網(wǎng)絡(luò)參數(shù)設(shè)定、故障切換的邏輯過程、通訊線路的備份計(jì)劃等。4、制定客戶端備份計(jì)劃:包括終端設(shè)備,終端用戶的注冊(cè)與權(quán)限管理的備份。5、制定磁帶備份計(jì)劃:包括系統(tǒng)備份、非系統(tǒng)數(shù)據(jù)文件備份、業(yè)務(wù)數(shù)據(jù)庫(kù)數(shù)據(jù)備份,及與備份系統(tǒng)相關(guān)的其他全量備份、增量備份等,以構(gòu)成完整的系統(tǒng)保護(hù)措施。6、制定災(zāi)難備份指示系統(tǒng):此系統(tǒng)用來(lái)提供清晰全面的災(zāi)難備份指南,可以在災(zāi)難發(fā)生時(shí)在最短時(shí)間內(nèi)找到災(zāi)難備份流程,與相關(guān)負(fù)責(zé)人和供應(yīng)商的聯(lián)系方式,以及應(yīng)當(dāng)采取的應(yīng)急措施等。

如下為流程框圖:

第五章 xxxx業(yè)務(wù)系統(tǒng)災(zāi)難備份/恢復(fù)體系設(shè)計(jì) 災(zāi)難備份/恢復(fù)體系總體設(shè)計(jì)惠普公司為xxxx業(yè)務(wù)系統(tǒng)提供的災(zāi)難備份/恢復(fù)方案可以滿足用戶對(duì)于計(jì)算機(jī)系統(tǒng)、數(shù)據(jù)的最高保護(hù)要求,保證即使發(fā)生斷電,火災(zāi)等嚴(yán)重災(zāi)難時(shí),用戶業(yè)務(wù)也可以7x24小時(shí)的連續(xù)運(yùn)行,同時(shí)確保業(yè)務(wù)數(shù)據(jù)在主中心和備份中心得到及時(shí)的更新,保證用戶數(shù)據(jù)最大的完整性。根據(jù)惠普公司多年來(lái)所積累的實(shí)施高可靠性災(zāi)難備份/恢復(fù)解決方案的成功經(jīng)驗(yàn),我們可以承諾用戶在最小的投資范圍內(nèi),按照惠普公司的項(xiàng)目實(shí)施流程,在最短的時(shí)間周期內(nèi)達(dá)到整個(gè)項(xiàng)目的設(shè)計(jì)目標(biāo),并且通過惠普公司完善周全的售后服務(wù)體系,確保XXXX核心業(yè)務(wù)計(jì)算機(jī)系統(tǒng)的全天候、安全、穩(wěn)定的運(yùn)行。由于用戶數(shù)據(jù)中心的核心業(yè)務(wù)系統(tǒng)相對(duì)集中,因此在數(shù)據(jù)中心實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)數(shù)據(jù)的規(guī)范化的本地?cái)?shù)據(jù)備份是災(zāi)備系統(tǒng)建設(shè)的前提基礎(chǔ);同時(shí)通過進(jìn)行重要業(yè)務(wù)數(shù)據(jù)的遠(yuǎn)程同步實(shí)現(xiàn)用戶重要業(yè)務(wù)數(shù)據(jù)的遠(yuǎn)程異地存儲(chǔ),為實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)的遠(yuǎn)程正常運(yùn)作奠定堅(jiān)實(shí)的基礎(chǔ);容災(zāi)系統(tǒng)的關(guān)鍵就是遠(yuǎn)程生產(chǎn)數(shù)據(jù)的自動(dòng)復(fù)制,由于用戶的應(yīng)用均為基于數(shù)據(jù)庫(kù)的聯(lián)機(jī)事務(wù)處理(OLTP)業(yè)務(wù)系統(tǒng),所以業(yè)務(wù)數(shù)據(jù)遠(yuǎn)程復(fù)制的關(guān)鍵就是確保數(shù)據(jù)庫(kù)數(shù)據(jù)的完整性、連續(xù)性,實(shí)時(shí)性和可恢復(fù)性。而現(xiàn)在惠普公司基于用戶不同的容災(zāi)需求所提供的災(zāi)難備份/恢復(fù)方案主要有以下四大類型:1)

通過應(yīng)用程序來(lái)進(jìn)行遠(yuǎn)程數(shù)據(jù)復(fù)制(應(yīng)用層次);其主要原理就是通過修改應(yīng)用程序或者使用BEA等公司的中間件產(chǎn)品,使得前端平臺(tái)在向數(shù)據(jù)庫(kù)服務(wù)器發(fā)送生產(chǎn)數(shù)據(jù)時(shí),同時(shí)向主數(shù)據(jù)中心和備份數(shù)據(jù)中心均發(fā)送交易數(shù)據(jù),主數(shù)據(jù)中心處理交易數(shù)據(jù)并返回處理結(jié)果,備份中心在正常情況下,只處理交易數(shù)據(jù),當(dāng)主數(shù)據(jù)中心無(wú)法正常工作時(shí),備份中心服務(wù)器接替主中心服務(wù)器向前端平臺(tái)返回處理結(jié)果。2)

利用數(shù)據(jù)庫(kù)廠家的軟件產(chǎn)品完成遠(yuǎn)程數(shù)據(jù)備份(數(shù)據(jù)庫(kù)層次);現(xiàn)有的一些數(shù)據(jù)庫(kù)廠家例如Oracle數(shù)據(jù)庫(kù)可以提供STANDBY數(shù)據(jù)庫(kù)功能,通過通信網(wǎng)絡(luò)將實(shí)際數(shù)據(jù)庫(kù)日志文件傳至備份中心存儲(chǔ)系統(tǒng),備份中心的STANDBY數(shù)據(jù)庫(kù)按照主數(shù)據(jù)庫(kù)結(jié)構(gòu)從日志文件中重新恢復(fù)數(shù)據(jù)庫(kù);又例如Informix數(shù)據(jù)庫(kù)可以提供HADR(High-AvailabilityDataReplication)功能,在初始化時(shí)將主數(shù)據(jù)中心的數(shù)據(jù)庫(kù)中的所有dbspace進(jìn)行一次零級(jí)備份,并恢復(fù)到備份數(shù)據(jù)中心的數(shù)據(jù)庫(kù)中,之后主數(shù)據(jù)中心的數(shù)據(jù)庫(kù)服務(wù)器可以通過通信網(wǎng)絡(luò)將生產(chǎn)數(shù)據(jù)庫(kù)的邏輯日志文件傳送至備份中心的數(shù)據(jù)庫(kù)服務(wù)器,備份中心的secondary數(shù)據(jù)庫(kù)將這些邏輯日志恢復(fù)到相應(yīng)的dbspace上.3)

利用主機(jī)上安裝的操作系統(tǒng)級(jí)鏡像軟件進(jìn)行遠(yuǎn)程數(shù)據(jù)鏡像(系統(tǒng)軟件,如HP-UXMirrorDisk/UX,VeritasVolumeReplicator等);主中心存儲(chǔ)設(shè)備與備份中心存儲(chǔ)設(shè)備進(jìn)行邏輯卷鏡像,主機(jī)同時(shí)將數(shù)據(jù)分別寫到本地和遠(yuǎn)程的磁盤設(shè)備上,實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)的遠(yuǎn)程復(fù)制。4)

通過惠普最新存儲(chǔ)產(chǎn)品XP系列磁盤陣列(磁盤陣列硬件層次),可以實(shí)現(xiàn)主數(shù)據(jù)中心和備份中心的操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫(kù)、應(yīng)用程序的實(shí)時(shí)遠(yuǎn)程拷貝復(fù)制。主、備中心XP磁盤陣列本身就可以通過陣列上的微處理器完成數(shù)據(jù)的實(shí)時(shí)同步功能,將災(zāi)難發(fā)生時(shí)關(guān)鍵數(shù)據(jù)的損失降至最低,而且不需要主機(jī)干涉或占用主機(jī)資源,可以做到災(zāi)難發(fā)生的同時(shí)實(shí)現(xiàn)應(yīng)用處理過程的恢復(fù)。遠(yuǎn)程備份系統(tǒng)的重新啟動(dòng)可以做到象一般輸入電源故障后的重新啟動(dòng)那么簡(jiǎn)單。以下是對(duì)各種容災(zāi)實(shí)現(xiàn)方案的總體比較:

數(shù)據(jù)量應(yīng)用復(fù)雜度數(shù)據(jù)實(shí)時(shí)性對(duì)主機(jī)性能影響帶寬投資成本交易數(shù)據(jù)備份交易數(shù)據(jù)高(可能修改應(yīng)用)低<10%幾十萬(wàn)數(shù)據(jù)庫(kù)日志備份2-4倍交易數(shù)據(jù)數(shù)據(jù)庫(kù)工具可能至少丟失1個(gè)LOG較高(10-20%)幾十萬(wàn)鏡像軟件4-8倍交易數(shù)據(jù)應(yīng)用透明高(I/O級(jí)),網(wǎng)絡(luò)/鏡像軟件故障影響主機(jī)業(yè)務(wù)高(10-30%)幾百萬(wàn)磁盤陣列4-8倍交易數(shù)據(jù)應(yīng)用透明高(I/O級(jí))無(wú)幾百萬(wàn)

應(yīng)用層方式容災(zāi)結(jié)構(gòu)簡(jiǎn)介利用應(yīng)用層容災(zāi)方式建立針對(duì)用戶業(yè)務(wù)的災(zāi)難備份系統(tǒng),其主要原理是通過應(yīng)用程序或者中間件產(chǎn)品同時(shí)向主中心和備份中心傳輸未經(jīng)處理的生產(chǎn)數(shù)據(jù),主中心服務(wù)器和備份中心服務(wù)器同時(shí)處理數(shù)據(jù)。在正常情況下,只用主中心和業(yè)務(wù)系統(tǒng)聯(lián)系,備份中心只在后臺(tái)處理數(shù)據(jù);當(dāng)主中心癱瘓時(shí),由于備份中心也存有生產(chǎn)數(shù)據(jù)庫(kù),也存有生產(chǎn)數(shù)據(jù),所以可以迅速接管業(yè)務(wù)。由于是利用應(yīng)用軟件來(lái)實(shí)現(xiàn)數(shù)據(jù)同步及保證一致性的,因而對(duì)于硬件方面的影響較小。如圖所示:這種方案的主要優(yōu)點(diǎn)就是:a)

由于通過網(wǎng)絡(luò)傳輸交易數(shù)據(jù)時(shí)未經(jīng)數(shù)據(jù)庫(kù)處理,所以傳輸數(shù)據(jù)量小,對(duì)傳輸數(shù)據(jù)的網(wǎng)絡(luò)帶寬要求不高;b)

傳輸數(shù)據(jù)過程中,主中心和備份中心異步進(jìn)行,由傳輸距離產(chǎn)生的延遲和通信帶寬瓶頸不會(huì)對(duì)應(yīng)用產(chǎn)生較大影響.缺點(diǎn)是:a)

對(duì)應(yīng)用程序修改較大,增加應(yīng)用軟件商二次開發(fā)負(fù)擔(dān);b)

由于主,備數(shù)據(jù)中心的業(yè)務(wù)處理過程為異步進(jìn)行,如何保障數(shù)據(jù)的一致性非常困難,需要在應(yīng)用中對(duì)數(shù)據(jù)的同步進(jìn)行周密的設(shè)計(jì);

這種容災(zāi)方式適合于傳輸距離極長(zhǎng)(幾千公里),且網(wǎng)絡(luò)傳輸帶寬和通信質(zhì)量無(wú)法得到有效保證的用戶環(huán)境.而對(duì)于存儲(chǔ)設(shè)備則沒有嚴(yán)格的限制,用戶可以靈活的選擇滿足容量和速度要求的存儲(chǔ)設(shè)備。 數(shù)據(jù)庫(kù)方式容災(zāi)結(jié)構(gòu)簡(jiǎn)介5.3.1原理數(shù)據(jù)庫(kù)方式由于只是傳送數(shù)據(jù)庫(kù)日志,與應(yīng)用沒有直接關(guān)系,因此無(wú)須對(duì)應(yīng)用程序作大量修改。以下介紹主要以O(shè)racle和Informix數(shù)據(jù)庫(kù)為主。數(shù)據(jù)庫(kù)方式容災(zāi)通過數(shù)據(jù)復(fù)制把數(shù)據(jù)定期、在線地復(fù)制到目的地的機(jī)器上去,以保持分布在不同地方的兩個(gè)或多個(gè)數(shù)據(jù)庫(kù)系統(tǒng)內(nèi)容的一致性,來(lái)實(shí)現(xiàn)數(shù)據(jù)保護(hù)。但它將消耗大量的主機(jī)資源(至少要占用監(jiān)控和復(fù)制兩個(gè)進(jìn)程)。復(fù)制的對(duì)象是數(shù)據(jù)庫(kù)的處理單位,如事務(wù)日志(邏輯日志),實(shí)現(xiàn)方式也有同步與異步兩種,嚴(yán)格來(lái)講,這種方法很難有真正的同步方案。因?yàn)橥綌?shù)據(jù)復(fù)制要求做任何一筆交易,都要實(shí)時(shí)地將結(jié)果發(fā)送到遠(yuǎn)程的站點(diǎn)中,等遠(yuǎn)程操作結(jié)束后,再執(zhí)行下一筆交易;而在實(shí)際操作中,很難做到這一點(diǎn),只能做異步的數(shù)據(jù)復(fù)制。所以一個(gè)實(shí)時(shí)應(yīng)用系統(tǒng)中,一般采用異步方式。

備份數(shù)據(jù)中心通過網(wǎng)絡(luò)連接到中央數(shù)據(jù)中心。在正常情況下,Oracle數(shù)據(jù)庫(kù)運(yùn)行在主數(shù)據(jù)中心的服務(wù)器上,數(shù)據(jù)存儲(chǔ)于主數(shù)據(jù)中心的磁盤陣列中。利用Oracle數(shù)據(jù)庫(kù)提供的STANDBY數(shù)據(jù)庫(kù)功能,可以通過通信網(wǎng)絡(luò)將實(shí)際數(shù)據(jù)庫(kù)日志文件傳至備份中心存儲(chǔ)系統(tǒng),備份中心的STANDBY數(shù)據(jù)庫(kù)按照主數(shù)據(jù)庫(kù)結(jié)構(gòu)從日志文件中重新恢復(fù)數(shù)據(jù)庫(kù),以保持?jǐn)?shù)據(jù)的一致性。一旦中央數(shù)據(jù)中心出現(xiàn)問題,用戶可以立即啟動(dòng)備份數(shù)據(jù)中心的備份數(shù)據(jù)庫(kù)以及相關(guān)應(yīng)用。Achivelog的備份方式

這一實(shí)現(xiàn)方式的關(guān)鍵在于通過一個(gè)專用程序?qū)⒅鲾?shù)據(jù)中心的數(shù)據(jù)庫(kù)中的AchiveLog定時(shí)通過通信網(wǎng)絡(luò)傳輸?shù)絺浞葜行牡臄?shù)據(jù)庫(kù)中。一旦主數(shù)據(jù)中心不能提供服務(wù),備份中心首先通過RedoLog恢復(fù)數(shù)據(jù),然后再代替主數(shù)據(jù)中心恢復(fù)應(yīng)用。基于數(shù)據(jù)庫(kù)方式的容災(zāi)能夠把變化了的數(shù)據(jù)定期、在線地復(fù)制到目的地的機(jī)器上去。對(duì)用戶來(lái)說(shuō),這種復(fù)制方式的優(yōu)點(diǎn)是能夠較好地保證數(shù)據(jù)的一致性,但它將消耗大量的主機(jī)資源(至少要占用監(jiān)控和復(fù)制兩個(gè)進(jìn)程)。此方案可以做到在有限的投資范圍內(nèi),充分利用現(xiàn)有機(jī)器設(shè)備,實(shí)現(xiàn)應(yīng)用系統(tǒng)和重要數(shù)據(jù)的災(zāi)難恢復(fù)功能。作為惠普公司成熟的災(zāi)難恢復(fù)技術(shù),此方案已經(jīng)在國(guó)內(nèi)許多用戶中成功實(shí)施過。其中包括:上海浦東國(guó)際機(jī)場(chǎng)災(zāi)難恢復(fù)系統(tǒng)等。

建立遠(yuǎn)程容災(zāi)環(huán)境:利用中央數(shù)據(jù)庫(kù)的全備份(零級(jí)備份)建立災(zāi)難備份數(shù)據(jù)庫(kù)由專門進(jìn)程負(fù)責(zé)傳輸中央數(shù)據(jù)庫(kù)生成的日志文件到遠(yuǎn)地,這里可以通過定義日志文件大小及傳輸時(shí)機(jī)來(lái)控制災(zāi)難發(fā)生時(shí)的數(shù)據(jù)損失盡量降低,并可加快容災(zāi)應(yīng)用切換速度,盡快恢復(fù)業(yè)務(wù)在備份數(shù)據(jù)中心系統(tǒng)上運(yùn)行。災(zāi)難備份數(shù)據(jù)庫(kù)使用傳輸來(lái)的日志文件(Archivelog或Logicallog)不斷更新備份數(shù)據(jù)庫(kù),這時(shí)數(shù)據(jù)庫(kù)一直處于恢復(fù)狀態(tài)(Informix數(shù)據(jù)庫(kù)為quiescent狀態(tài)),其數(shù)據(jù)不可被訪問(對(duì)于Informix數(shù)據(jù)庫(kù),備份數(shù)據(jù)庫(kù)中的數(shù)據(jù)可被用來(lái)進(jìn)行讀操作,但無(wú)法進(jìn)行寫操作)。災(zāi)難備份數(shù)據(jù)庫(kù)更新出錯(cuò)且無(wú)法解決時(shí),應(yīng)重新建立備份數(shù)據(jù)庫(kù)。災(zāi)難備份數(shù)據(jù)庫(kù)應(yīng)定期做激活測(cè)試,以確保其在關(guān)鍵時(shí)刻的可用性。應(yīng)用系統(tǒng)需考慮發(fā)生災(zāi)難時(shí)如何將聯(lián)接切換到災(zāi)難備份數(shù)據(jù)庫(kù)。

容災(zāi)切換:將中央數(shù)據(jù)庫(kù)的可取得的日志文件傳至災(zāi)難數(shù)據(jù)庫(kù)后,將災(zāi)難備份數(shù)據(jù)庫(kù)更新到最近點(diǎn),并開啟數(shù)據(jù)庫(kù)供應(yīng)用系統(tǒng)使用;立即對(duì)災(zāi)難數(shù)據(jù)庫(kù)做數(shù)據(jù)庫(kù)全備份;對(duì)損失的數(shù)據(jù)進(jìn)行修補(bǔ);以建立災(zāi)難數(shù)據(jù)庫(kù)的同樣方式建立中央數(shù)據(jù)庫(kù),并將運(yùn)行系統(tǒng)切換回中央數(shù)據(jù)庫(kù),該次切換可做到數(shù)據(jù)無(wú)損失;立即對(duì)中央數(shù)據(jù)庫(kù)做數(shù)據(jù)庫(kù)全備份;重新建立災(zāi)難備份環(huán)境,恢復(fù)容災(zāi)系統(tǒng).5.3.2容災(zāi)環(huán)境維護(hù)(中央數(shù)據(jù)庫(kù)結(jié)構(gòu)發(fā)生變化)日常管理中,需對(duì)中央數(shù)據(jù)庫(kù)的歸檔日志(邏輯日志)目錄定期進(jìn)行備份和清理,亦需清除災(zāi)難備份數(shù)據(jù)庫(kù)的歸檔日志(邏輯日志)目錄中使用過的歸檔日志(邏輯日志)。在系統(tǒng)運(yùn)行過程中,可能發(fā)生改變中央數(shù)據(jù)庫(kù)結(jié)構(gòu)的情況,這時(shí)需要進(jìn)行適當(dāng)?shù)牟僮魇篂?zāi)難備份數(shù)據(jù)庫(kù)跟上更新變化,保持?jǐn)?shù)據(jù)庫(kù)結(jié)構(gòu)的一致和同步:1增加數(shù)據(jù)文件在中央數(shù)據(jù)庫(kù)上增加數(shù)據(jù)文件將產(chǎn)生相應(yīng)的日志,當(dāng)被施用到災(zāi)難備份數(shù)據(jù)庫(kù)時(shí)控制文件中會(huì)加入此數(shù)據(jù)文件名,此時(shí)如災(zāi)難備份數(shù)據(jù)庫(kù)能在相應(yīng)目錄找到此數(shù)據(jù)文件,恢復(fù)操作繼續(xù);否則會(huì)停止,在繼續(xù)恢復(fù)操作之前,需選擇以下操作:-將此新數(shù)據(jù)文件拷貝到災(zāi)難備份節(jié)點(diǎn)的相應(yīng)目錄下;-在災(zāi)難備份數(shù)據(jù)庫(kù)上執(zhí)行命令A(yù)lterDatabaseCreateDatafile‘filename’.2數(shù)據(jù)文件更名對(duì)中央數(shù)據(jù)庫(kù)的數(shù)據(jù)文件進(jìn)行更名,需要刷新災(zāi)難備份數(shù)據(jù)庫(kù)控制文件,或在對(duì)中央數(shù)據(jù)庫(kù)作該操作時(shí)亦對(duì)災(zāi)難備份數(shù)據(jù)庫(kù)作類似操作,即可確保中央與災(zāi)難備份數(shù)據(jù)庫(kù)的同步。3修改聯(lián)機(jī)日志文件設(shè)置在對(duì)中央數(shù)據(jù)庫(kù)的聯(lián)機(jī)日志文件進(jìn)行增加、刪除等操作后,都不會(huì)影響災(zāi)難備份數(shù)據(jù)庫(kù)。但在中央數(shù)據(jù)庫(kù)上執(zhí)行命令A(yù)lterDatabaseClearUnarchivedLogfile,或以Resetlogs選項(xiàng)打開數(shù)據(jù)庫(kù),則會(huì)使容災(zāi)備份數(shù)據(jù)庫(kù)失效,因?yàn)槿轂?zāi)備份數(shù)據(jù)庫(kù)無(wú)法得到進(jìn)行恢復(fù)操作所需的歸檔日志文件,這時(shí)需要重新建立容災(zāi)環(huán)境。4修改控制文件若在中央數(shù)據(jù)庫(kù)上使用CreateControlfile命令執(zhí)行以下操作,將使容災(zāi)數(shù)據(jù)庫(kù)的控制文件失效:-改變聯(lián)機(jī)日志組或文件的最大數(shù)目參數(shù)-改變數(shù)據(jù)文件的最大數(shù)目參數(shù)-改變并發(fā)打開數(shù)據(jù)庫(kù)的實(shí)例的最大數(shù)目參數(shù)此時(shí)需要刷新災(zāi)難備份數(shù)據(jù)庫(kù)控制文件。在中央數(shù)據(jù)庫(kù)上使用帶Resetlogs選項(xiàng)的CreateControlfile命令將在下一次打開中央數(shù)據(jù)庫(kù)時(shí)重置聯(lián)機(jī)日志,日志序列回到1,從而導(dǎo)致容災(zāi)備份數(shù)據(jù)庫(kù)失效。5數(shù)據(jù)庫(kù)啟動(dòng)參數(shù)建議使中央數(shù)據(jù)庫(kù)與災(zāi)難備份數(shù)據(jù)庫(kù)的參數(shù)配置相同,以免因參數(shù)不同影響容災(zāi)數(shù)據(jù)庫(kù)的性能甚至恢復(fù)操作的實(shí)現(xiàn)。6刷新災(zāi)難備份數(shù)據(jù)庫(kù)控制文件當(dāng)中央數(shù)據(jù)庫(kù)控制文件發(fā)生改變時(shí),依照以下步驟刷新災(zāi)難備份數(shù)據(jù)庫(kù)的控制文件:-停止災(zāi)難備份數(shù)據(jù)庫(kù)的恢復(fù)操作-關(guān)閉災(zāi)難備份數(shù)據(jù)庫(kù)-在中央數(shù)據(jù)庫(kù)上執(zhí)行命令A(yù)lterDatabaseCreateStandbyDatabaseControlfileAs‘filename’創(chuàng)建供災(zāi)難備份數(shù)據(jù)庫(kù)使用的控制文件-在中央數(shù)據(jù)庫(kù)上執(zhí)行命令A(yù)lterSystemArchiveLogCurrent歸檔出當(dāng)前日志-將上兩步產(chǎn)生的控制文件及歸檔日志文件傳送至容災(zāi)節(jié)點(diǎn)-啟動(dòng)災(zāi)難備份數(shù)據(jù)庫(kù)在Nomount狀態(tài),執(zhí)行AlterDatabaseMountStandbyDatabase使數(shù)據(jù)庫(kù)處于Mount狀態(tài)-進(jìn)行災(zāi)難備份數(shù)據(jù)庫(kù)的正?;謴?fù)操作7關(guān)于Unrecoverable操作產(chǎn)生的數(shù)據(jù)中央數(shù)據(jù)庫(kù)上用Unrecoverable選項(xiàng)操作(如CreateTable…unrecoverable)產(chǎn)生的數(shù)據(jù)更新不生產(chǎn)日志,因此無(wú)法傳送到災(zāi)難備份數(shù)據(jù)庫(kù),此時(shí)只能采用以下三種方法之一:-在災(zāi)難備份數(shù)據(jù)庫(kù)中,使受該操作影響的數(shù)據(jù)文件處于Offline狀態(tài)。災(zāi)難切換后,刪除災(zāi)難備份數(shù)據(jù)庫(kù)中相應(yīng)的表空間。該方法在允許損失此整個(gè)表空間數(shù)據(jù)時(shí)才能使用。-重建容災(zāi)環(huán)境-在中央數(shù)據(jù)庫(kù)上備份該操作影響的表空間,歸檔當(dāng)前的日志,傳送到容災(zāi)節(jié)點(diǎn)后,開啟災(zāi)難備份數(shù)據(jù)庫(kù)的恢復(fù)操作。注意:如在中央數(shù)據(jù)庫(kù)做了Unrecoverable操作,而未采用以上方法進(jìn)行操作,仍在災(zāi)難備份數(shù)據(jù)庫(kù)上進(jìn)行正?;謴?fù),將不會(huì)有錯(cuò)誤信息提示,該錯(cuò)誤信息將出現(xiàn)在數(shù)據(jù)庫(kù)日記中($ORACLE_BASE/admin/<sid>/bdump/alert_<sid>.log)。因此管理員必須定期檢查數(shù)據(jù)庫(kù)日記。5.3.3優(yōu)缺點(diǎn)比較用數(shù)據(jù)庫(kù)功能實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制的優(yōu)點(diǎn)為:a)

支持廣域網(wǎng)協(xié)議,備份中心地點(diǎn)不受傳輸距離影響;b)

硬件/軟件投資較少;缺點(diǎn)主要為:a)傳輸歸檔日志或邏輯日志需占用主機(jī)資源(CPU,內(nèi)存,網(wǎng)絡(luò)等,具體指標(biāo)未確定);b)

當(dāng)災(zāi)難發(fā)生時(shí),業(yè)務(wù)無(wú)法在備份中心得到迅速恢復(fù);c)

備份中心的數(shù)據(jù)無(wú)法快速恢復(fù)回主數(shù)據(jù)中心,從而應(yīng)用無(wú)法快速切換回主中心運(yùn)行;d)

無(wú)法實(shí)現(xiàn)非數(shù)據(jù)庫(kù)數(shù)據(jù)的遠(yuǎn)程復(fù)制;

此種容災(zāi)方式適合于只遠(yuǎn)程備份數(shù)據(jù)庫(kù)數(shù)據(jù),傳輸距離較長(zhǎng)(幾百公里以上),且網(wǎng)絡(luò)傳輸帶寬不大的用戶環(huán)境. 鏡像軟件容災(zāi)方式結(jié)構(gòu)簡(jiǎn)介利用操作系統(tǒng)層的鏡像軟件,如HP-UXMirrorDisk/UX,實(shí)現(xiàn)本地主數(shù)據(jù)中心的邏輯卷和遠(yuǎn)端備份數(shù)據(jù)中心的邏輯卷之間的實(shí)時(shí)同步數(shù)據(jù)復(fù)制.當(dāng)主數(shù)據(jù)中心發(fā)生突發(fā)性災(zāi)難時(shí),用戶可以通過在備份中心服務(wù)器上激活相應(yīng)的卷組和邏輯卷,進(jìn)而啟動(dòng)備份中心服務(wù)器上的數(shù)據(jù)庫(kù)和應(yīng)用系統(tǒng),從而實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)災(zāi)難恢復(fù)的目標(biāo).

正常情況下,業(yè)務(wù)系統(tǒng)運(yùn)行在主中心服務(wù)器上,數(shù)據(jù)存儲(chǔ)在主中心磁盤陣列中,同時(shí)在備份中心配置相同容量的磁盤陣列。主中心和備份中心的距離通常限制在10公里左右,主中心的服務(wù)器使用光纖通道卡通過光纖交換機(jī)和光纜分別連接兩個(gè)中心的磁盤陣列,利用服務(wù)器端的鏡像軟件對(duì)數(shù)據(jù)鏡像存儲(chǔ)。在發(fā)生災(zāi)難時(shí)最嚴(yán)重的損失就是數(shù)據(jù)本身的丟失,而磁盤鏡像要求向磁盤進(jìn)行的每個(gè)物理寫操作都被復(fù)制到另一個(gè)地點(diǎn)的另一個(gè)磁盤。因?yàn)閺?fù)制是向磁盤進(jìn)行的物理寫操作,所以它與應(yīng)用程序無(wú)關(guān)。在主中心因故出現(xiàn)存儲(chǔ)陣列損壞、癱瘓時(shí),備份中心的數(shù)據(jù)仍然完好。主中心的服務(wù)器仍能正常的訪問備份中心的數(shù)據(jù)。一旦主中心的磁盤陣列恢復(fù)后,可以在系統(tǒng)上使用磁盤重新鏡像的命令將數(shù)據(jù)進(jìn)行同步,從而備份中心的陣列中的數(shù)據(jù)會(huì)拷貝到主中心的存儲(chǔ)陣列中。

鏡像軟件容災(zāi)方式優(yōu)缺點(diǎn)比較.優(yōu)點(diǎn):可完全確保數(shù)據(jù)復(fù)制的完整性,一致性;容災(zāi)結(jié)構(gòu)相對(duì)簡(jiǎn)單;對(duì)磁盤子系統(tǒng)透明,主/備數(shù)據(jù)中心可采用不同的磁盤陣列設(shè)備.缺點(diǎn):遠(yuǎn)程數(shù)據(jù)復(fù)制操作占用主機(jī)較多資源(10-30%);主中心應(yīng)用系統(tǒng)寫操作性能受主/備中心傳輸距離影響較大;網(wǎng)絡(luò)連接和鏡像軟件故障將導(dǎo)致主中心業(yè)務(wù)系統(tǒng)的中止;備份中心更新數(shù)據(jù)無(wú)法快速恢復(fù)回主數(shù)據(jù)中心;

這種容災(zāi)方式適用于對(duì)主機(jī)寫操作性能要求不高,而且業(yè)務(wù)系統(tǒng)可以忍受因光纖傳輸線路的臨時(shí)故障而導(dǎo)致業(yè)務(wù)中止的用戶環(huán)境. XP磁盤陣列容災(zāi)方式結(jié)構(gòu)簡(jiǎn)介惠普公司XP陣列由ContinuousAccessXP/XPExtension軟件提供完全的災(zāi)難備份/恢復(fù)功能。

主數(shù)據(jù)中心和備份數(shù)據(jù)中心的結(jié)構(gòu)基本一致:采用HPXP系列磁盤陣列作為中心存儲(chǔ),所有主機(jī)通過光纖與磁盤陣列相連。磁盤陣列上運(yùn)行ContinueAccessXP容災(zāi)軟件。主中心與備份中心之間的XP磁盤陣列物理上通過兩條光纖通道直聯(lián),采用XP磁盤陣列上的容災(zāi)軟件ContinueAccess做到兩地?cái)?shù)據(jù)實(shí)時(shí)同步。兩套磁盤陣列之間數(shù)據(jù)一致性依靠磁盤陣列本身的專用軟件(直接運(yùn)行在磁盤陣列上)來(lái)完成,完全不依賴主機(jī)系統(tǒng),也不影響本地應(yīng)用的響應(yīng)速度。當(dāng)配置了ContinuousAccessXP/XPExtension軟件的兩臺(tái)XP陣列分別處于兩數(shù)據(jù)中心時(shí),通過光纖線路進(jìn)行連接,主數(shù)據(jù)中心的XP存儲(chǔ)磁盤陣列可以隨時(shí)自動(dòng)將更新后的數(shù)據(jù)傳送至異地的備份XP存儲(chǔ)設(shè)備,以保持兩臺(tái)XP陣列數(shù)據(jù)的完全一致性。整個(gè)工作由XP陣列本身完成,對(duì)主機(jī)系統(tǒng)完全透明,不需占用任何主機(jī)資源。當(dāng)主數(shù)據(jù)中心由于地震,火災(zāi)等各種意外原因?qū)е抡麄€(gè)主中心核心業(yè)務(wù)系統(tǒng)崩潰時(shí),異地備份系統(tǒng)將完全接管全部工作,在極短時(shí)間內(nèi),恢復(fù)業(yè)務(wù)系統(tǒng)的運(yùn)行。客戶端也是災(zāi)難備份恢復(fù)系統(tǒng)防護(hù)的對(duì)象,需要通過網(wǎng)絡(luò)連接到災(zāi)難備份中心運(yùn)行系統(tǒng)。災(zāi)難備份中心運(yùn)行系統(tǒng)具有重構(gòu)運(yùn)行環(huán)境的能力,在災(zāi)難發(fā)生后替代生產(chǎn)中心行使運(yùn)行系統(tǒng)職能,接受客戶端注冊(cè)和訪問,其運(yùn)行環(huán)境和業(yè)務(wù)數(shù)據(jù)由備份服務(wù)器和備份數(shù)據(jù)系統(tǒng)提供。特點(diǎn):傳統(tǒng)的災(zāi)難備份系統(tǒng)主備機(jī)切換的過程為1)

主機(jī)發(fā)生故障2)

系統(tǒng)切換到備機(jī)3)

修復(fù)主機(jī)4)

關(guān)閉全套系統(tǒng)包括主機(jī)及備機(jī)5)

將系統(tǒng)從新切換回主機(jī)其中在第4個(gè)步驟中,用戶將不得不承受停機(jī)所帶來(lái)的損失。而惠普公司SureStoreEContinuousAccessXP/XPExtension軟件將使用戶避免這一損失,因?yàn)楫?dāng)系統(tǒng)從主機(jī)切換到備機(jī)后,備機(jī)將成為主機(jī),修復(fù)后的“主機(jī)”成為備機(jī)使用。此方案最大的優(yōu)勢(shì)就是對(duì)主機(jī)應(yīng)用完全透明,所有數(shù)據(jù)復(fù)制工作由磁盤陣列硬件層完成,不需修改應(yīng)用,而且可以保證大量數(shù)據(jù)復(fù)制的性能。由于磁盤陣列數(shù)據(jù)復(fù)制原理是利用磁盤遠(yuǎn)程鏡像功能,所以可以保證主數(shù)據(jù)中心關(guān)鍵業(yè)務(wù)數(shù)據(jù)和備份中心關(guān)鍵業(yè)務(wù)數(shù)據(jù)的完全一致,而且容災(zāi)系統(tǒng)實(shí)現(xiàn)起來(lái)非常簡(jiǎn)便。還可以充分利用現(xiàn)有服務(wù)器設(shè)備,實(shí)現(xiàn)應(yīng)用系統(tǒng)和重要數(shù)據(jù)的災(zāi)難恢復(fù)功能。作為惠普公司成熟的災(zāi)難備份/恢復(fù)技術(shù),此方案已經(jīng)在國(guó)內(nèi)外許多用戶環(huán)境中成功實(shí)施過。其中包括上海熱線,大連電信,云南建行,湖南建行等災(zāi)難備份恢復(fù)系統(tǒng)。由于XXXX的容災(zāi)距離,用戶環(huán)境和業(yè)務(wù)需求也十分適合于使用XP磁盤陣列實(shí)現(xiàn)存儲(chǔ)硬件層的災(zāi)難備份恢復(fù)方案,因此HP公司也向XXXX推薦這種容災(zāi)方式.而這種容災(zāi)方案的主要限制就是由于在磁盤一級(jí)進(jìn)行數(shù)據(jù)復(fù)制,對(duì)應(yīng)用系統(tǒng)完全透明,所以相比應(yīng)用層和數(shù)據(jù)庫(kù)層的容災(zāi)方式,復(fù)制的數(shù)據(jù)量較大,對(duì)光纖數(shù)據(jù)鏈路傳輸質(zhì)量和傳輸帶寬要求較高.優(yōu)點(diǎn):1、

目前而言是所有異地容災(zāi)方式中最為可靠和成熟的技術(shù);2、

有磁盤陣列自身來(lái)完成,完全不影響主機(jī)的性能,也不依賴于操作系統(tǒng)的平臺(tái),因此形式所有實(shí)現(xiàn)方式中性能最好,使用范圍最廣泛的一種;3、

通過磁盤陣列之間的專用互連完成通信,因此不占用局域網(wǎng)資源。缺點(diǎn):投資較大

5.5.1災(zāi)難恢復(fù)系統(tǒng)硬件,軟件配置說(shuō)明我們推薦數(shù)據(jù)中心的中心磁盤陣列采用HP的高性能全光纖通道交換式結(jié)構(gòu)的磁盤陣列XP512。為了適應(yīng)當(dāng)前數(shù)據(jù)中心越來(lái)越明顯的存儲(chǔ)中心化趨勢(shì)(即:存儲(chǔ)作為整套系統(tǒng)的關(guān)鍵,各種平臺(tái)的服務(wù)器作為存儲(chǔ)的外設(shè)),XP512與傳統(tǒng)的磁盤陣列相比已經(jīng)不是單純的硬盤堆疊,而是新一代的存儲(chǔ)+服務(wù)器結(jié)構(gòu)。無(wú)論從它的硬件結(jié)構(gòu)還是直接運(yùn)行在XP512上的多種多樣的軟件都可以明顯的感覺到這一點(diǎn)。系統(tǒng)的數(shù)據(jù)存儲(chǔ)在主中心存儲(chǔ)磁盤陣列XP512中。同時(shí)在異地備份中心配置相同結(jié)構(gòu)的存儲(chǔ)磁盤陣列XP。由于XXXX的容災(zāi)環(huán)境距離為10公里左右,從數(shù)據(jù)復(fù)制的性能以及數(shù)據(jù)復(fù)制的完整性和一致性方面考慮,建議用戶在主中心和備份中心之間構(gòu)建單模光纖線路用于傳輸備份數(shù)據(jù),并選用DWDM(密集波分復(fù)用)設(shè)備實(shí)現(xiàn)數(shù)據(jù)復(fù)制鏈路的多路復(fù)用,從而提高數(shù)據(jù)復(fù)制的傳輸帶寬,并改善遠(yuǎn)程數(shù)據(jù)傳輸性能。通過HP公司提供的災(zāi)難備份恢復(fù)軟件(HPContinuousAccessXP)可以自動(dòng)實(shí)現(xiàn)主中心存儲(chǔ)數(shù)據(jù)與備份中心數(shù)據(jù)的實(shí)時(shí)完整備份。在主數(shù)據(jù)中心,按照用戶要求,還可以配置磁帶備份服務(wù)器,用來(lái)安裝HP備份軟件OmnibackII,以及SureStoreE磁帶庫(kù)。備份服務(wù)器直接連接到存儲(chǔ)陣列和磁帶庫(kù),控制業(yè)務(wù)系統(tǒng)的日常數(shù)據(jù)的磁帶備份。為確保用戶主數(shù)據(jù)中心的主機(jī)系統(tǒng)的負(fù)載分擔(dān),容錯(cuò)能力等功能,惠普公司提供了先進(jìn)的,具有高度可靠性的群集結(jié)構(gòu)。該結(jié)構(gòu)可由兩臺(tái)或多臺(tái)HP9000/800系列高檔服務(wù)器組成,并通過LAN和共用硬盤構(gòu)成協(xié)調(diào)、高效的群集結(jié)構(gòu)。當(dāng)Cluster中的某個(gè)節(jié)點(diǎn)出現(xiàn)異常(服務(wù)器硬件,系統(tǒng)軟件,應(yīng)用程序和局域網(wǎng)故障等)時(shí),MC/ServiceGuard可以及時(shí)發(fā)現(xiàn)故障節(jié)點(diǎn),自動(dòng)將故障節(jié)點(diǎn)的當(dāng)前應(yīng)用系統(tǒng)遷移到其它正常節(jié)點(diǎn)中,使之繼續(xù)進(jìn)行正常的業(yè)務(wù)處理,并可自動(dòng)隔離故障節(jié)點(diǎn)以便于技術(shù)人員的故障排除工作,從而消除核心業(yè)務(wù)系統(tǒng)中的單故障點(diǎn)。主數(shù)據(jù)中心的配置為:部件名稱數(shù)量說(shuō)明XP5121臺(tái):高速數(shù)據(jù)緩存44塊x4GB(每塊)=8GB磁盤柜1

73GB光纖磁盤8822組x4(每組)x73GB=6424GBHOTSPARE磁盤222組x4(每組)x73GB=6424GB指令內(nèi)存2

主機(jī)接口卡2

CommandViewXP1不依賴于平臺(tái)的基于Web的控制管理軟件LUNConfigurationXP1LUN配置、管理軟件存儲(chǔ)光纖交換機(jī)2臺(tái):光纖端口24

備份數(shù)據(jù)中心的配置為:部件名稱數(shù)量說(shuō)明XP5121臺(tái):高速數(shù)據(jù)緩存44塊x4GB(每塊)=8GB磁盤柜1

73GB光纖磁盤8822組x4(每組)x73GB=6424GBHOTSPARE磁盤222組x4(每組)x73GB=6424GB指令內(nèi)存2

主機(jī)接口卡2

CommandViewXP1不依賴于平臺(tái)的基于Web的控制管理軟件LUNConfigurationXP1LUN配置、管理軟件存儲(chǔ)光纖交換機(jī)2臺(tái):光纖端口24

5.5.2XPCA軟件容災(zāi)原理

XP(MCU)RCP

XP(RCU)服務(wù)器(主)服務(wù)器(備)FiberChannel連接CA磁盤卷組拷貝方向SVPM-VOLR-VOLR-VOLLCPREMOTECONTROLREMOTECONTROL(TCP/IP)M-VOLSVP(TCP/IP)

(1)CA磁盤卷組CA的磁盤卷組由不同的XP磁盤陣列裝置內(nèi)或不同CLUSTER內(nèi)命名為M-VOL和R-VOL的2個(gè)邏輯磁盤卷構(gòu)成。在具有CA磁盤卷組關(guān)系后,M-VOL被稱為主磁盤卷。M-VOL可被讀/寫。R-VOL(遠(yuǎn)程磁盤卷)被稱為副磁盤卷。在XP磁盤陣列內(nèi)部的控制裝置的作用下,M-VOL的內(nèi)容和服務(wù)器來(lái)的寫數(shù)據(jù)被拷貝到R-VOL。CA卷組建立后,R-VOL為只讀磁盤卷。在一個(gè)XP設(shè)備內(nèi)部,既可有M-VOL,也可有R-VOL。這樣可以實(shí)現(xiàn)雙向的數(shù)據(jù)境像。

(2〕MCU和RCUMCU(主磁盤控制器)和RCU(遠(yuǎn)程磁盤控制器)分別和M-VOL,R-VOL相連,MCU控制由服務(wù)器來(lái)的寫向M-VOL的數(shù)據(jù)的寫操作,還控制M-VOL和R-VOL之間數(shù)據(jù)拷貝的操作。并且提供CA磁盤卷組的狀態(tài)和構(gòu)成的管理。RCU執(zhí)行由MCU發(fā)出的寫命令操作。寫操作的執(zhí)行方法和執(zhí)行服務(wù)器來(lái)的寫操作過程相同。除此之外,RCU還具有管理一部分CA磁盤卷組的狀態(tài)和構(gòu)成信息的能力。對(duì)于任何一個(gè)磁盤卷組,都需要定義MCU/RCU。一個(gè)XP設(shè)備的磁盤控制裝置在控制M-VOL時(shí),可作為MCU使用,當(dāng)控制R-VOL的時(shí)侯,又可作為RCU使用。(3)遠(yuǎn)程備份的連接MCU和RCU之間由專用光纖(ESCON)來(lái)連結(jié)。當(dāng)光纖直聯(lián),不增加任何設(shè)備時(shí),兩臺(tái)XP512之間最遠(yuǎn)可相隔3KM。在兩臺(tái)XP512之間加入ESCON的延長(zhǎng)裝置(ESCONDIRECTOR或REPATER)可使磁盤陣列間的距離最大延長(zhǎng)至43KM。如果使用E3或ATM遠(yuǎn)程電信協(xié)議,在兩臺(tái)XP512之間將不會(huì)有距離的限制。加入ESCON延長(zhǎng)裝置的連接圖如下圖所示:通過ESCON光纖通道,MCU和RCU可相互進(jìn)行數(shù)據(jù)傳送和控制命的傳送。在構(gòu)筑CA時(shí),考慮到消除單點(diǎn)故障的引患,兩臺(tái)XP512之間的ESCON光纖最低需要2根。這樣當(dāng)一根光纖出現(xiàn)意外不能使用時(shí),利用剩下的一根可完成MCU和RCU間的通信。不至引起系統(tǒng)數(shù)據(jù)傳輸?shù)闹袛?。?)RemotecontrolRemoteControl可完成CA的構(gòu)成設(shè)定,卷組的狀態(tài)變更和表示。

5.5.3高可靠性方案與高可用性方案的選擇當(dāng)主運(yùn)用端發(fā)生不可恢復(fù)的數(shù)據(jù)損失后,遠(yuǎn)地備份中心的鏡象磁盤卷R-VOL里的數(shù)據(jù)與數(shù)據(jù)損失發(fā)生前的主中心磁盤卷M-VOL的一致性往往會(huì)決定系統(tǒng)損失大小以及把主應(yīng)用恢復(fù)到正常狀態(tài)所需時(shí)間。鏡象卷組間數(shù)據(jù)完全一致時(shí),只要將遠(yuǎn)地備份中心的數(shù)據(jù)拷回到主運(yùn)用端起動(dòng)修復(fù)程序便可恢復(fù)到正常業(yè)務(wù)處理。但是由于數(shù)據(jù)傳輸是通過ESCON及CNT進(jìn)行,并且路徑較遠(yuǎn),鏈路的中斷等原因都有可能造成鏡象卷組間數(shù)據(jù)不完全一致。在鏡象卷組失去同步時(shí),主運(yùn)用端發(fā)生不可恢復(fù)的數(shù)據(jù)損失后,將會(huì)造成部分?jǐn)?shù)據(jù)丟失。當(dāng)然,鏈路故障與主運(yùn)用端同時(shí)發(fā)生損壞的可能性非常低?;谟脩粝到y(tǒng)是否有優(yōu)先保證在任何時(shí)候鏡象卷組都要一致的需要,CAXP提供兩種運(yùn)行方案:高可靠性方案與高可用性方案。高可靠性方案:在此方案中,將日志文件和表數(shù)據(jù)的更新拷貝模式都設(shè)為“DATA”。在這種拷貝模式下,在M-VOL和R-VOL鏡象卷組失去同步前,MCU會(huì)據(jù)絕服務(wù)器對(duì)M-VOL發(fā)出的寫操作并發(fā)出寫錯(cuò)誤信息。因此,M-VOL和R-VOL鏡象卷組的一致性得到保證。這種模式雖然提供了良好的一致性保證,但是對(duì)應(yīng)用環(huán)境也有較高的要求。當(dāng)兩條ESCON鏈路全部斷掉或者遠(yuǎn)地備份中心的XP512因停電造成運(yùn)行中斷等偶發(fā)性故障發(fā)生時(shí),CAXP鏡象卷組的M-VOL的狀態(tài)變?yōu)椤癝USPEND”,MCU檢測(cè)出此狀態(tài)后為了保證鏡象卷組的一致性將禁止M-VOL的寫操作即有可能中斷主運(yùn)用端應(yīng)用的正常運(yùn)行。因此,此方案要求系統(tǒng)具有忍受應(yīng)用暫時(shí)停止的能力。當(dāng)由于M-VOL以外的地方發(fā)生故障引起主運(yùn)用端應(yīng)用運(yùn)行的中斷時(shí),系統(tǒng)管理員又想繼續(xù)應(yīng)用的進(jìn)行,可以用命令刪除CAXP鏡象卷組的邏輯關(guān)系,使M-VOL的狀態(tài)該變?yōu)椤癝IMPLEX”,開放對(duì)M-VOL的寫操作。此后,主運(yùn)用對(duì)M-VOL的更新不會(huì)被反映到R-VOL端,即鏡象卷組失去同步。鏡像失去同步后建議增加對(duì)在本地M-VOL的在線BACKUP的頻度。高可靠性方案能夠保證M-VOL和R-VOL嚴(yán)格同步。但即使主運(yùn)用端不發(fā)生故障也有可能造成應(yīng)用中斷。此方案適用于優(yōu)先磁盤卷組內(nèi)容一致的系統(tǒng)運(yùn)用,且此方案要求系統(tǒng)具有忍受應(yīng)用暫時(shí)停止的能力。

高可用性方案在此方案中,將日志文件與表數(shù)據(jù)的更新拷貝模式都設(shè)為“NEVER”。在這種拷貝模式下建立起來(lái)的CAXP鏡像卷組即使在光纖或R-VOL故障引起M-VOL和R-VOL鏡象卷組失去同步后,只要M-VOL沒有遭到損壞,MCU就不會(huì)據(jù)絕服務(wù)器對(duì)M-VOL發(fā)出的寫操作。從服務(wù)器端來(lái)看,M-VOL對(duì)R-VOL鏡象卷的數(shù)據(jù)更新象在正常進(jìn)行,服務(wù)器的應(yīng)用也不會(huì)被中斷。但是實(shí)際當(dāng)光纖鏈路故障發(fā)生后,對(duì)R-VOL的更新會(huì)被停止,M-VOL里被更新的磁道會(huì)被標(biāo)上標(biāo)記,并且MCU向服務(wù)器和RETOMECONTROL發(fā)出磁盤卷組異常信息的提示。當(dāng)出現(xiàn)光纖、CNT、遠(yuǎn)地備份中心XP512停電等故障時(shí),因?yàn)椴挥绊憫?yīng)用的運(yùn)行,所以沒有必要象“DATA”那樣強(qiáng)制中斷CAXP卷組。在此期間M-VOL的更新數(shù)據(jù)會(huì)被記錄下來(lái)。故障修復(fù)后,可用激活命令執(zhí)行M-VOL更新部分的拷備再同步磁盤卷組。鏡像卷失去同步后建議增加對(duì)在本地M-VOL的在線BACKUP的頻度。此應(yīng)用方案適用于優(yōu)先保證主運(yùn)用的系統(tǒng)和光纖線路狀態(tài)不太安定的地區(qū)。但使用此方案前,必需有一個(gè)明確的認(rèn)識(shí),那就是在恢復(fù)CAXP卷組同步前,如果主運(yùn)用端發(fā)生不可修復(fù)的災(zāi)害,將會(huì)造成數(shù)據(jù)丟失。數(shù)據(jù)丟失量與R-VOL變?yōu)椤癝USPEND”的時(shí)間有關(guān),即M-VOL停止向R-VOL更新的時(shí)間。鑒于XXXX的業(yè)務(wù)為關(guān)鍵應(yīng)用,由于一些次要因素的故障如線路故障等停止在線服務(wù)會(huì)對(duì)信譽(yù),業(yè)務(wù)造成較大損失。因此我們建議用戶使用高可用性方案。5.5.4切換步驟向備份中心切換概要:(a)主中心端XP的MCU因?yàn)闉?zāi)難故障不能使用。卷組狀態(tài)

MCU

RCU服務(wù)器(主〕服務(wù)器(備用〕步驟1:分析R-VOL的一致性-從RCU看卷組狀態(tài)及更新拷備模式

RDeletePair步驟2:刪除所有CA卷組-在RCU側(cè)執(zhí)行DeletePair命令-R-VOL的狀態(tài)變?yōu)椤竤implex」

MCU

RCU服務(wù)器(主〕服務(wù)器(備用〕S如果沒有在備用服務(wù)器上再開新的應(yīng)用,則到此為止。

MCU

RCU服務(wù)器(主〕服務(wù)器(備用〕S步驟3:使用前準(zhǔn)備(如果在備用服務(wù)器上再開應(yīng)用〕-執(zhí)行Vgchang-ae命令-執(zhí)行Fsck命令-MountR-VOL

(b)由備份中心切換回主中心端

RCU

MCU服務(wù)器(主〕

服務(wù)器(備用〕MR步驟4:中止備用服務(wù)器上的應(yīng)用,從服務(wù)器上將M-VOL解放(unmount)

RCU

MCU服務(wù)器(主〕

服務(wù)器(備用〕MR步驟5:確任所有的CA磁盤卷組狀態(tài)都變?yōu)镈uplex。(CA卷組處于同步狀態(tài)〕CA卷組狀態(tài)

服務(wù)器(主〕

服務(wù)器(備用〕

SS步驟6:在RCU上刪除所有CA磁盤卷組。-DeletePair:刪除所有CA磁盤卷組-DeleteRCU-端口變更:將RCP改變?yōu)長(zhǎng)CP。DeletePairDeleteRCU變更Portmode

MCU

RCU服務(wù)器(主〕

服務(wù)器(備用〕步驟7:按原來(lái)的方向建立CA磁盤卷組(不執(zhí)行初始拷貝〕,MountM-VOL->恢復(fù)主運(yùn)用的運(yùn)行。將LCP端口改為RCP端口?AddRCU?AddPair

-MR

注:M:M-ROL,R:R-VOL,S:Simplex卷組

5.5.5XP容災(zāi)方案性能分析XP陣列在用光纖構(gòu)筑CAXP時(shí),為了保證系統(tǒng)不會(huì)因單點(diǎn)故障,而出現(xiàn)數(shù)據(jù)傳輸中斷的現(xiàn)象,要求至少配置兩根光纖通道,CNTUWM間的一條光纖的傳輸速率為100MB/Sec,可通過轉(zhuǎn)換FC波長(zhǎng)實(shí)現(xiàn)最多8路光纖信號(hào)的同時(shí)傳輸,即可達(dá)到800MB/Sec的傳輸帶寬.根據(jù)XXXX核心業(yè)務(wù)系統(tǒng)現(xiàn)有的和未來(lái)一段時(shí)間發(fā)展的業(yè)務(wù)量統(tǒng)計(jì),我們可以得出結(jié)論,XXXX需要實(shí)現(xiàn)的實(shí)時(shí)備份的每秒鐘數(shù)據(jù)傳輸量小于以上線路的實(shí)際傳輸能力,所以不會(huì)引起遠(yuǎn)程數(shù)據(jù)復(fù)制傳輸?shù)钠款i現(xiàn)象,對(duì)于客戶的系統(tǒng)數(shù)據(jù)有足夠的傳送能力。對(duì)異步寫的響應(yīng)時(shí)間計(jì)算:當(dāng)然在衡量CA構(gòu)成的合理性時(shí),不能單單只注重?cái)?shù)據(jù)的傳送能力,還有一個(gè)非常重要的指標(biāo)就是關(guān)于CA卷組的寫操作的響應(yīng)時(shí)間。雖然對(duì)于異步寫操作而言,XP之間的數(shù)據(jù)復(fù)制不直接影響生產(chǎn)系統(tǒng)的正常寫操作。但是在距離較遠(yuǎn)時(shí),由于時(shí)延較大,兩臺(tái)XP如果在較長(zhǎng)時(shí)間里得不到相互信息,將會(huì)影響到應(yīng)用系統(tǒng)運(yùn)行。關(guān)于CA卷組寫操作過程的介紹中,我們知道完成一個(gè)寫操作要有4個(gè)過程,其中影響寫性能的部分有:MCU,RCU處理寫操作的時(shí)間和由光纖引起的延遲2部分。

總時(shí)延=主機(jī)時(shí)延+4*CNT時(shí)延+數(shù)據(jù)塊大小/帶寬(FC)+2*傳輸時(shí)延

在XXXX的容災(zāi)環(huán)境中,由于傳輸距離約為10公里,經(jīng)計(jì)算,傳輸時(shí)延約為,CNTUWM時(shí)延為10ns,因此對(duì)主機(jī)應(yīng)用性能無(wú)明顯的影響.在實(shí)際情況中,為確保系統(tǒng)的正常運(yùn)行,我們必須同廣域網(wǎng)帶寬租賃商具體確認(rèn)數(shù)據(jù)傳輸延時(shí)(根據(jù)路由個(gè)數(shù))。

第六章 災(zāi)難備份恢復(fù)流程災(zāi)難恢復(fù)流程是指在主數(shù)據(jù)中心發(fā)生計(jì)算機(jī)系統(tǒng)故障或?yàn)?zāi)難事件時(shí),為了盡可能減少對(duì)業(yè)務(wù)造成的損失,而制定的搶救措施、故障隔離措施、恢復(fù)步驟和方法、與各有關(guān)部門和人員的聯(lián)系方式等。災(zāi)難恢復(fù)流程是控制風(fēng)險(xiǎn)的一種有效方法,是災(zāi)難備份恢復(fù)的一個(gè)重要組成部分。災(zāi)難恢復(fù)流程的內(nèi)容應(yīng)盡量詳盡,并易于操作。任何災(zāi)難恢復(fù)流程的實(shí)施都需要有一個(gè)強(qiáng)有力的、訓(xùn)練有素的工作小組去操作,小組中的人員應(yīng)熟知災(zāi)難恢復(fù)流程。平時(shí)應(yīng)對(duì)小組人員進(jìn)行培訓(xùn)和教育,以便使小組中每個(gè)人都明白在救災(zāi)和恢復(fù)過程中應(yīng)擔(dān)負(fù)的職責(zé),提高災(zāi)難救護(hù)和恢復(fù)技能。另外,應(yīng)定期對(duì)災(zāi)難恢復(fù)流程進(jìn)行演習(xí),使小組人員能夠在災(zāi)難發(fā)生時(shí)做到從容不迫、緊張有序地開展搶救、隔離和恢復(fù)工作。需要做好各個(gè)生產(chǎn)中心的相關(guān)數(shù)據(jù)和資料的收集整理工作,協(xié)調(diào)管理整個(gè)系統(tǒng)。各生產(chǎn)和備用服務(wù)器的數(shù)據(jù)庫(kù)、操作系統(tǒng)和應(yīng)用程序版本等都應(yīng)該保持一致,并記錄每個(gè)生產(chǎn)中心的系統(tǒng),網(wǎng)絡(luò)和應(yīng)用環(huán)境參數(shù)。并建議編制一套應(yīng)用程序,通過菜單界面來(lái)進(jìn)行核心業(yè)務(wù)系統(tǒng)的切換。災(zāi)難恢復(fù)系統(tǒng)可根

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論