ROSA服務(wù)器雙機熱備方案_第1頁
ROSA服務(wù)器雙機熱備方案_第2頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、雙機熱備方案愛科科技Accosoft成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD.一需求分析目前大多服務(wù)器應(yīng)用都是運行在單獨一臺服務(wù)器上面,同時所有數(shù)據(jù)也存放于此服務(wù)器上。由于近年來企業(yè)發(fā)展迅速,業(yè)務(wù)數(shù)據(jù)量越來越大,對數(shù)據(jù)庫等應(yīng)用系統(tǒng)的安全性要求也越來越高,基于這兩點,提出了對數(shù)據(jù)庫應(yīng)用系統(tǒng)做成雙機熱備系統(tǒng)。雙機熱備針對的是服務(wù)器的臨時故障所做的一種備份技術(shù),通過雙機熱備,來避免長時間的服務(wù)中斷,保證系統(tǒng)長期、可靠的服務(wù)。二技術(shù)介紹1.集群技術(shù)雙機熱備是集群技術(shù)的一種方式。集群(Cluster)技術(shù)是指一組相互獨立的計算機,利用高速通信網(wǎng)絡(luò)組成

2、一個計算機系統(tǒng),每個群集節(jié)點(即集群中的每臺計算機)都是運行其自己進程的一個獨立服務(wù)器。這些進程可以彼此通信,對網(wǎng)絡(luò)客戶機來說就像是形成了一個單一系統(tǒng),協(xié)同起來向用戶提供應(yīng)用程序、系統(tǒng)資源和數(shù)據(jù),并以單一系統(tǒng)的模式加以管理。一個客戶端(Client)與集群相互作用時,集群像是一個獨立的服務(wù)器。計算機集群技術(shù)的出發(fā)點是為了提供更高的可用性、可管理性、可伸縮性的計算機系統(tǒng)。一個集群包含多臺擁有共享數(shù)據(jù)存儲空間的服務(wù)器,各服務(wù)器通過內(nèi)部局域網(wǎng)相互通信。當(dāng)一個節(jié)點發(fā)生故障時,它所運行的應(yīng)用程序?qū)⒂善渌?jié)點自動接管。其中,只有兩個節(jié)點的高可用集群又稱為雙機熱備,即使用兩臺服務(wù)器互相備份。當(dāng)一臺服務(wù)器出現(xiàn)

3、故障時,可由另一臺服務(wù)器承擔(dān)服務(wù)任務(wù),從而在不需要人工干預(yù)的情況下,自動保證系統(tǒng)能持續(xù)對外提供服務(wù)??梢?,雙機熱備是集群技術(shù)中最簡單的一種。德林T3系統(tǒng)數(shù)據(jù)庫服務(wù)器也將選用這種集群方式。成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD.2系統(tǒng)的工作原理雙工方式(Active/Active)數(shù)據(jù)存儲于才磁盤陣列上。在Active/Active的工作模式下,2臺服務(wù)器都作為活動主機。當(dāng)Server1發(fā)生故障時(包括各種軟硬件故障),Server2通過心跳路徑偵測到Server1的故障并自動接管所有Server1上的資源(如IP地址、數(shù)據(jù)庫服務(wù)或其他應(yīng)用

4、程序、用戶數(shù)據(jù)、計算機名等等)和共享磁盤上的數(shù)據(jù),并繼續(xù)運行數(shù)據(jù)庫服務(wù)和相關(guān)應(yīng)用程序。對于客戶端來說這種接管過程是不可見的,用戶感覺不到這種故障切換,可以繼續(xù)使用備份服務(wù)器提供的服務(wù)。待Server修復(fù)后,可通過雙機軟件選擇手工或自動方式將所有已切換到Server2的資源切換回到Server,并且恢復(fù)對共享磁盤上數(shù)據(jù)的訪問。同理,當(dāng)Server2發(fā)生故障時,Server1也會按照上述工作原理進行自動接管。(兩臺主機同時運行各自的服務(wù)工作,且相互監(jiān)測對方的情況。當(dāng)一臺主機宕機時,另外一臺主機立即接管它的工作,保證工作不間斷。譬如:A機運行SQL數(shù)據(jù)庫應(yīng)用,B機運行IIS網(wǎng)站應(yīng)用。)主從方式(Ac

5、tive/Standby)主機工作,從機處于監(jiān)控準(zhǔn)備狀態(tài)。當(dāng)主機宕機時,從機接管從機的工作,待主機恢復(fù)正常后,按使用者的預(yù)定以自動或手動的方式將服務(wù)切換到主機上運行。3. 雙機熱備適用對象一般應(yīng)用服務(wù)器是要長年累月工作的,且為了工作上需要,其應(yīng)用服務(wù)器備份工作就絕對少不了。為了避免服務(wù)器故障產(chǎn)生數(shù)據(jù)丟失等現(xiàn)象,都會采用RAID技術(shù)和數(shù)據(jù)備份技術(shù)。但是數(shù)據(jù)備份只能解決系統(tǒng)出現(xiàn)問題后的恢復(fù);而RAID技術(shù),又只能解決硬盤的問題。我們知道,無論是硬件還是軟件問題,都會造成應(yīng)用服務(wù)的中斷,而RAID及數(shù)據(jù)備份技術(shù)恰恰就不能解決避免服務(wù)中斷的問題。要恢復(fù)服務(wù)器,再輕微的問題或者強悍的技術(shù)支持,服務(wù)器都要

6、中斷一段時間,對于一些德林公司需要隨時實時在線遠程訪問的用戶而言,服務(wù)器應(yīng)用停止就等于丟失金錢,損失可大可小,所以是很難忍受服務(wù)中斷的。因此,就需要通成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD.過雙機熱備,來避免長時間的服務(wù)中斷,保證系統(tǒng)長期、可靠的服務(wù)。4. 實現(xiàn)方案雙機熱備有兩種實現(xiàn)模式,一種是基于共享的存儲設(shè)備的方式,另一種是沒有共享的存儲設(shè)備的方式,一般稱為純軟件方式。1)基于共享的存儲設(shè)備的方式基于存儲共享的雙機熱備是雙機熱備的最標(biāo)準(zhǔn)方案。對于這種方式,采用兩臺服務(wù)器(數(shù)據(jù)庫同時運行在兩臺服務(wù)器上),使用共享的存儲設(shè)備磁盤陣列(數(shù)據(jù)

7、庫系統(tǒng)的數(shù)據(jù)都存放在該磁盤陣列中)。兩臺服務(wù)器可以采用互備、主從、并行等不同的方式。在工作過程中,兩臺服務(wù)器將以一個虛擬的IP地址對外提供服務(wù),依工作方式的不同,將服務(wù)請求發(fā)送給其中一臺服務(wù)器承擔(dān)。同時,服務(wù)器通過心跳線(目前往往采用建立私有網(wǎng)絡(luò)的方式)偵測另一臺服務(wù)器的工作狀況。當(dāng)一臺服務(wù)器出現(xiàn)故障時,另一臺服務(wù)器根據(jù)心跳偵測的情況做出判斷,并進行切換,接管服務(wù)。對于用戶而言,這一過程是全自動的,在很短時間內(nèi)完成,從而對業(yè)務(wù)不會造成影響。由于使用共享的存儲設(shè)備,因此兩臺服務(wù)器使用的實際上是一樣的數(shù)據(jù),由雙機或集群軟件對其進行管理。優(yōu)點:對于共享方式,數(shù)據(jù)庫放在共享的存儲設(shè)備上。當(dāng)一臺服務(wù)器提

8、供服務(wù)時,直接在存儲設(shè)備上進行讀寫。而當(dāng)系統(tǒng)切換后,另一臺服務(wù)器也同樣讀取該存儲設(shè)備上的數(shù)據(jù)。它可以在無人值守的情況下提供快速的切換,保證不會有數(shù)據(jù)丟失現(xiàn)象。成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD.缺點:增加了昂貴的存儲設(shè)備投資,對于有實力的企業(yè),可優(yōu)先考慮該方式。2)純軟件方式純軟件的方式,通過雙機鏡像軟件,將數(shù)據(jù)可以實時復(fù)制到另一臺服務(wù)器上,這樣同樣的數(shù)據(jù)就在兩臺服務(wù)器上各存在一份,如果一臺服務(wù)器出現(xiàn)故障,可以及時切換到另一臺服務(wù)器。優(yōu)點:a. 避免了磁盤陣列的單點故障:對于雙機熱備,本身即是防范由于單個設(shè)備的故障導(dǎo)致服務(wù)中斷,但磁盤

9、陣列恰恰又形成了一個新的單點。(比如,服務(wù)器的可靠系數(shù)是99.9%,磁盤陣列的可靠系數(shù)是99.95%,則純軟雙機的可靠系數(shù)是1-99.9%x99.9%=99.99%,而基于磁盤陣列的雙機熱備系統(tǒng)的可靠系數(shù)則會是略低于99.95%b. 節(jié)約投資:不需購買昂貴的磁盤陣列。c. 不受距離的限制:兩臺服務(wù)器不需受SCSI電纜的長度限制(光纖通道的磁盤陣列也不受距離限制,但投資會大得多)。這樣,可以更靈活地部署服務(wù)器,包括通過物理位置的距離來提高安全性。缺點:a. 可靠性相對較差,兩服務(wù)器間的數(shù)據(jù)實時復(fù)制是一個比較脆弱的環(huán)節(jié)。b. 旦某臺服務(wù)器出現(xiàn)中斷,恢復(fù)后還要進行比較復(fù)雜的數(shù)據(jù)同步恢復(fù)。并且,這個時

10、段系統(tǒng)處于無保護狀態(tài)。c. 沒有事務(wù)機制,由于其復(fù)制是在文件和磁盤層進行的,復(fù)制是否成功不會影響數(shù)據(jù)庫事務(wù)操作,因此有出現(xiàn)數(shù)據(jù)不完整變化的情況,這個存在著相當(dāng)成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD.的風(fēng)險。這里我們選擇第一種方案,也就是基于共享的存儲設(shè)備的雙機熱備方式。5. 雙機集群軟件搭建雙機熱備當(dāng)然少不了集群軟件。軟件包括心跳監(jiān)測部分和資源接管部分,心跳監(jiān)測可以通過網(wǎng)線和串口進行,而且支持冗余鏈路,它們之間相互發(fā)送報文來告訴對方自己當(dāng)前的狀態(tài),如果在指定的時間內(nèi)未收到對方發(fā)送的報文,那么就認(rèn)為對方失效,這時需啟動資源接管模塊來接管運行

11、在對方主機上的資源或者服務(wù)。6. 推薦配置項目型號配置數(shù)量服務(wù)器華為RH22882*E5-26306核/2.30G/15M/95W,2*300GSAS15K,32GDDR3,配置HBA卡,帶遠程管理網(wǎng)口2臺磁盤陣列華為S2200T雙控,12盤位,6*300GSAS15K1臺雙機軟件ROSEHAROSEHA1套三.ROSEHA雙機軟件RoseHA雙機系統(tǒng)的兩臺服務(wù)器(主機)都與磁盤陣列(共享存儲)系統(tǒng)直接連接,用戶的操作系統(tǒng)、應(yīng)用軟件和RoseHA高可用軟件分別安裝在兩臺主機上,數(shù)據(jù)庫等共享數(shù)據(jù)存放在存儲系統(tǒng)上,兩臺主機之間通過私用心跳網(wǎng)絡(luò)連接。配置好的系統(tǒng)主機開始工作后,RoseHA軟件開始監(jiān)

12、控系統(tǒng),通過私用網(wǎng)絡(luò)傳遞的心跳信息,每臺主機上的RoseHA軟件都可監(jiān)控另一臺主機的狀態(tài)。當(dāng)工作主機發(fā)生故障時,心跳信息就會產(chǎn)生變化,這種變化可以通過私用網(wǎng)絡(luò)被RoseHA軟件捕捉。當(dāng)捕捉到這種變化后RoseHA就會控成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD.制系統(tǒng)進行主機切換,即備份機啟動和工作主機一樣的應(yīng)用程序接管工作主機的工作(包括提供TCP/IP網(wǎng)絡(luò)服務(wù)、存儲系統(tǒng)的存取等服務(wù))并進行報警,提示管理人員對故障主機進行維修。當(dāng)維修完畢后,可以根據(jù)RoseHA的設(shè)定自動或手動再切換回來,也可以不切換,此時維修好的主機就作為備份機,雙機系統(tǒng)

13、繼續(xù)工作。RoseHA實現(xiàn)容錯功能的關(guān)鍵在于,對客戶端來說主機是透明的,當(dāng)系統(tǒng)發(fā)生錯誤而進行切換時,即主機的切換在客戶端看來沒有變化,所有基于主機的應(yīng)用都仍然正常運行。RoseHA采用了虛擬IP地址映射技術(shù)來實現(xiàn)此功能。客戶端通過虛擬地址和工作主機通訊,無論系統(tǒng)是否發(fā)生切換,虛擬地址始終指向工作主機。在進行網(wǎng)絡(luò)服務(wù)時,RoseHA提供一個邏輯的虛擬地址,任何一個客戶端需要請求服務(wù)時只需要使用這個虛擬地址。正常運行時,虛擬地址及網(wǎng)絡(luò)服務(wù)由主服務(wù)器提供。當(dāng)主服務(wù)器出現(xiàn)故障時,RoseHA會將虛擬地址轉(zhuǎn)移到另外一臺服務(wù)器的網(wǎng)卡上,繼續(xù)提供網(wǎng)絡(luò)服務(wù)。切換完成后,在客戶端看來系統(tǒng)并沒有出現(xiàn)故障,網(wǎng)絡(luò)服務(wù)

14、仍然可以使用。除IP地址外,HA還可以提供虛擬的計算機別名供客戶端訪問。對于數(shù)據(jù)庫服務(wù),當(dāng)有主服務(wù)器出現(xiàn)故障時,另外一臺服務(wù)器就會自動接管,同時啟動數(shù)據(jù)庫和應(yīng)用程序,使用戶數(shù)據(jù)庫可以正常操作。RoseHA主要功能特點友好的界面RoseHA提供了友好直觀的圖形安裝界面和監(jiān)控管理界面。通過直觀而又方便的JavaApplet管理界面,用戶可以交互式地對集群系統(tǒng)進行配置、監(jiān)控和管理,并可以利用Applet的網(wǎng)絡(luò)特性,通過網(wǎng)絡(luò)對系統(tǒng)進行遠程管理,實時地顯示出主機系統(tǒng)及服務(wù)的狀態(tài) 靈活的Active-Active模式和Active-Standby模式RoseHA支持Active-Active模式和Acti

15、ve-Standby模式。用戶可指定每臺服務(wù)器的作用(activeorstandby),指定要監(jiān)控的服務(wù)和硬件部分,定義指定的服務(wù)發(fā)生故障后要采取的進一步行動(如是否重新啟動該服務(wù)、允許的最大啟動時間等)。 支持多條心跳路徑可以將網(wǎng)線和RS-232串口線作為在RoseHA軟件的心跳路徑。配置多條心跳路徑可以避免系統(tǒng)的單點故障。 支持虛擬MAC地址在網(wǎng)絡(luò)環(huán)境中,每個IP與唯一的MAC綁定在一起。而傳統(tǒng)的集群結(jié)構(gòu)下,將致使集群的活動IP在不同時刻綁定不同的MAC地址,導(dǎo)致跨網(wǎng)段通信出問題。為了集群軟件更好的支持這種網(wǎng)絡(luò)安全級別較高的網(wǎng)絡(luò)環(huán)境,RoseHA提供了支持虛擬MAC地址的功能,使集群環(huán)境I

16、P地址實現(xiàn)與唯一MAC地址綁定。 自動切換當(dāng)系統(tǒng)出現(xiàn)故障時(如:系統(tǒng)宕機、HA進程/應(yīng)用進程被殺掉、RS-232、SCSI、光纖、網(wǎng)絡(luò)線纜斷開),RoseHA將確定故障原因,并采取相應(yīng)對策,并將這些應(yīng)用切換到備份服務(wù)器上。而故障服務(wù)器中未受影響的應(yīng)用不會被切換,既不會受任何影響。不需要系統(tǒng)管理員干預(yù)。 自動檢測在集群系統(tǒng)的每一臺服務(wù)器內(nèi),RoseHA具有兩個核心進程,它們互相監(jiān)控,如果其中一個進程失敗,另一個進程會立即進行恢復(fù)。成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD. 服務(wù)器可靠性在主服務(wù)器出現(xiàn)故障(如掉電或宕機)時,另外一臺服務(wù)器接管故

17、障服務(wù)器上運行的所有的關(guān)鍵性應(yīng)用。 網(wǎng)絡(luò)可靠性如果服務(wù)器的網(wǎng)絡(luò)部分發(fā)生故障,會導(dǎo)致客戶不能連接和訪問到服務(wù)器,這同樣是致命的故障。如果該服務(wù)器配備了冗余的網(wǎng)絡(luò)接口,RoseHA會使用它來恢復(fù)網(wǎng)絡(luò)連接。在沒有配備冗余的網(wǎng)絡(luò)接口,或者所有的網(wǎng)絡(luò)接口均出現(xiàn)故障時,HA會將該應(yīng)用切換到另外一臺服務(wù)器上。切換完成后,客戶在短暫的切換過程后能夠繼續(xù)訪問所需的服務(wù)。 存儲可靠性需要將應(yīng)用的全部數(shù)據(jù)存儲在兩臺服務(wù)器都能訪問到的共享磁盤中。建議使用磁盤陣列來存儲數(shù)據(jù),這樣可以避免單點固障,而且便于對系統(tǒng)的容量進行擴充。對由VolumeManager軟件管理的磁盤陣列,RoseHA提供了相應(yīng)的處理程序,以保證磁盤

18、陣列及數(shù)據(jù)的可靠性。 應(yīng)用可靠性在高可用性系統(tǒng)中可以運行多個應(yīng)用。每一個應(yīng)用是作為一個服務(wù)而存在的。在服務(wù)器中,當(dāng)某個服務(wù)失敗而其它服務(wù)正常運行時,RoseHA將處理這個失敗的服務(wù)。在將這個服務(wù)切換到另一臺服務(wù)器上時,該服務(wù)器上運行的服務(wù)也不會受到影響。對于與網(wǎng)絡(luò)不相關(guān)的純數(shù)據(jù)應(yīng)用,只需要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件。而在與網(wǎng)絡(luò)相關(guān)的客戶機/服務(wù)器應(yīng)用,除了要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件外,還需要切換相關(guān)的虛擬IP。如果希望兩個服務(wù)獨立地進行切換,則此兩個IP地址不能相同。如果使用了相同的IP地址,在發(fā)生切換時,RoseHA會將所有使用該IP的服務(wù)都切換到另外一臺服務(wù)器上去。豐富的附加功能提供不同

19、的針對特定應(yīng)用的Agent程序,使服務(wù)監(jiān)控更切實際,更加有效;提供用于開發(fā)Agent程序的應(yīng)用程序界面(API),使用者可針對特定的服務(wù)編寫Agent程序,執(zhí)行與特定服務(wù)相關(guān)的狀態(tài)診斷及錯誤恢復(fù)工作的。產(chǎn)品規(guī)格RoseHA支持系統(tǒng)及版本清單硬件平臺系統(tǒng)平臺支持系統(tǒng)列表當(dāng)前版本x86WindowsMicrosoftWindows2000Server,AdvancedServer,DataCenterMicrosoftWindowsServer2003Web,Standard.Enterprise,DataCenterMicrosoftWindowsServer2008Web,Standard,E

20、nterprise,DataCenterMicrosoftWindowsServer2008forItanium-basedSystemsVersion:8.8LinuxRedHat:Version:8.8愛科科技Accosoft成都市愛科科技實業(yè)有限公司AccosoftTechnology&IndustryLTD.RedhatLinux9.0RedhatEnterpriseLinux2.1RedhatEnterpriseLinux3.0RedhatEnterpriseLinux4.0RedhatEnterpriseLinux5.0RedhatEnterpriseLinux6.0SuSE:SuSELinuxEnterprise8.0SuSELinuxEnterprise9.0SuSELinuxEnterprise10.0SuSELinuxEnterprise11.0RedFlag:RedFalagDCServer4.0RedFalagDCServer5.0Asianux:Asianux1.0Asianux2.0Asianux3.0TurboLinux:TurboLinuxServer10.0SolarisSolaris9/10Version:8.0x64(AMD64&EM64T)WindowsMicrosoftW

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論