




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案Hacmp(High Availability Cluster Multi-Processing)雙機(jī)熱備份軟件的主要功能是提高客戶計算機(jī)系統(tǒng)及其應(yīng)用的可靠性,而不是單臺主機(jī)的可靠性。一、Hacmp雙機(jī)系統(tǒng)的工作原理HACMP的工作原理是利用LAN來監(jiān)控主機(jī)及網(wǎng)絡(luò)、網(wǎng)卡的狀態(tài)。在一個HACMP環(huán)境中有TCP/IP網(wǎng)絡(luò)和非TCP/IP網(wǎng)絡(luò)。TCP/IP網(wǎng)絡(luò)即應(yīng)用客戶端訪問的公共網(wǎng),該網(wǎng)可以是大多數(shù)AIX所支持的網(wǎng)絡(luò),如Ethernet,T.R.,F(xiàn)DDI,ATM,SOCC,SLIP,等等。 非TCP/IP網(wǎng)絡(luò)用來為HACMP對HA環(huán)境(Cluster)中
2、的各節(jié)點(diǎn)進(jìn)行監(jiān)控而提供的一個替代TCP/IP的通訊路徑,它可以是用RS232串口線將各節(jié)點(diǎn)連接起來,也可以是將各節(jié)點(diǎn)的SCSI卡或SSA卡設(shè)置成Target Mode方式。1、作為雙機(jī)系統(tǒng)的兩臺服務(wù)器(主機(jī)A和B)同時運(yùn)行Hacmp軟件; 2、服務(wù)器除正常運(yùn)行自機(jī)的應(yīng)用外,同時又作為對方的備份主機(jī); 3、兩臺主機(jī)系統(tǒng)(A和B)在整個運(yùn)行過程中,通過 “心跳線”相互監(jiān)測對方的運(yùn)行情況(包括系統(tǒng)的軟硬件運(yùn)行、網(wǎng)絡(luò)通訊和應(yīng)用運(yùn)行情況等); 4、一旦發(fā)現(xiàn)對方主機(jī)的運(yùn)行不正常(出故障)時,故障機(jī)上
3、的應(yīng)用就會立即停止運(yùn)行,本機(jī)(故障機(jī)的備份機(jī))就會立即在自己的機(jī)器上啟動故障機(jī)上的應(yīng)用,把故障機(jī)的應(yīng)用及其資源(包括用到的IP地址和磁盤空間等)接管過來,使故障機(jī)上的應(yīng)用在本機(jī)繼續(xù)運(yùn)行; 5、應(yīng)用和資源的接管過程由Ha軟件自動完成,無需人工干預(yù);6、當(dāng)兩臺主機(jī)正常工作時,也可以根據(jù)需要將其中一臺機(jī)上的應(yīng)用人為切換到另一臺機(jī)(備份機(jī))上運(yùn)行。HACMP雙機(jī)系統(tǒng)結(jié)構(gòu)圖(點(diǎn)擊看大圖) 二、Hacmp安裝配置前需作的準(zhǔn)備工作1、劃分清楚兩臺服務(wù)器主機(jī)各自要運(yùn)行的應(yīng)用(如A機(jī)運(yùn)行應(yīng)用,B機(jī)作為standby);2、給每個應(yīng)用(組)分配Service_ip、Standb
4、y_ip、boot_ip和心跳線tty,如:主機(jī)A(運(yùn)行應(yīng)用): Service_ip: 172.16.1.1 Standby_ip:
5、; 172.16.2.1 Boot_ip: 172.16.1.3主機(jī)B(standby):
6、60; Service_ip: 172.16.1.2 Standby_ip: 172.16.2.2
7、; Boot_ip: 172.16.1.43、按照各主機(jī)的應(yīng)用的要求,建立好各自的磁盤組,并分配好磁盤空間;4、根據(jù)Ha軟件的要求,對服務(wù)器操作系統(tǒng)的參數(shù)作必要的修改。三、IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案HACMP的安裝配置步驟如下:(一)在兩臺服務(wù)器上分別安裝HACMP軟件 #smit installp (二)分別檢查兩臺主機(jī)上安裝的軟件是否成功 #/usr/sbin/cluste
8、r/diag/clverify software cluster clverify>software Valid Options are: lpp clverify.software> lpp 若沒有error出現(xiàn)則安裝成功。(三)分別配
9、置兩臺服務(wù)器的boot IP地址和Standby IP地址,保證boot 網(wǎng)和Standby網(wǎng)能ping通(用smit tcpip命令),用netstat命令檢查配置是否正確: #netstat -i (四)利用smit tty在兩臺主機(jī)上增加一個TTY接口,配置心跳線(RS232): #smitty tty TTY
10、60; tty0 TTY type
11、160; tty TTY interface
12、160; rs232 Description As
13、ynchronous Terminal Status Available &
14、#160; Location 20-70-01-00 Parent adapter &
15、#160; sa2 PORT number
16、60; 0 Enable LOGIN
17、; disable BAUD rate
18、0; 9600 PARITY
19、0; none
20、; BITS per character 8 &
21、#160; Number of STOP BITS 1 用lsdev Cc tty查看tty是否配置好。 #lsdev Cc tt
22、y 在兩臺上分別輸入如下命令: S85_1# cat /etc/hosts >/dev/tty0 S85_2# cat 如果在S85_2機(jī)能接收到信息,則表明心跳線已經(jīng)配置好。 (五)具體配置及技巧 注:HACMP的配置(或修改配置)只需要在其中的一臺主機(jī)上進(jìn)行,當(dāng)配置(或修改)完畢后使用同步命令將配置結(jié)果傳到另外一臺主機(jī)上。一般選S85_1在進(jìn)行配置。在S85_1上運(yùn)行s
23、mit hacmp,然后按照下面的步驟進(jìn)行配置: #smit hacmp 1、 Cluster Configuration1.1、配置Cluster Topology配置Configure Cluster/ Add a Cluster Definition * Cluster ID
24、160; 100 # * Cluster Name
25、; sb_ha配置Configure Nodes,增加兩個Node * Node Names s
26、85_a * Node Names s85_b配置Configure Adapters,分別配置兩臺機(jī)的service地址,boot地址,sta
27、ndby地址及tty(a_svc、b_svc、a_boot、b_boot、a_stdby、b_stdby、a_tty、b_tty) * Adapter IP Label a_svc
28、; Network Type ether
29、0; Network Name ethnet
30、 Network Attribute public
31、0; Adapter Function
32、0; service Adapter Identifier
33、 172.16.1.1 Adapter Hardware Address Node Name
34、 s85_a 修改/etc/hosts及/.rhosts文件,如:修改/etc/hosts文件,增加以下內(nèi)容: 172.16.1.1
35、 a_svc 172.16.1.2 b_svc 172.16.1.3 a_boot
36、172.16.1.4 b_boot 172.16.2.1 a_stdby 172.16.2.2 &
37、#160; b_stdby修改/.rhosts文件,增加以下內(nèi)容: a_svc b_svc a_boot b_boot a_stdby b_stdby 1.2、同步cluster(Cluster Conf
38、iguration/ Cluster Topology/ Synchronize Cluster Topology) 在進(jìn)行同步的時候可以先進(jìn)行模擬(Emulate)同步,當(dāng)模擬同步OK后再進(jìn)行實(shí)際(actual)同步: Synchronize Cluster Topology Type or select v
39、alues in entry fields. Press Enter AFTER making all desired changes. TOP
40、 Entry Fields Ignore Cluster Verification Errors? No
41、160; + * Emulate or Actual? Emulate &
42、#160; + 2、配置Cluster Resources 2.1、定義一個資源組(Define Resource Groups) 注意,在定義資源組的時候,要注意Participating Node Names的先后順序。 Resource Group Name
43、; data_res New Resource Group Name
44、 Node Relationship cascading Participating Node Names
45、 s85_a s85_b 2.2、定義應(yīng)用服務(wù)器(Define Application Servers) Server Name &
46、#160; ora_app New Server Name
47、 start Script /etc/start Stop Script
48、; /etc/stop 2.3、修改資源組屬性(Change/Show Resources for a Resource Group)
49、; data_res組: Resource Group Name data_res Node Relationship
50、 cascading Participating Node Names &
51、#160; s85_a s85_b Service IP label a_svc Filesystems(default is al
52、l) Filesystems Consistency Check
53、160; fsck Filesystems Recovery Method sequential Filesystems to Export &
54、#160; Filesystems to NFS mount
55、60; Volume Groups datavg logvg Concurrent Volume gro
56、ups Raw Disk PVIDs
57、0; Application Servers ora_app
58、0;2.4、同步資源組(Synchronize Cluster Resources)在進(jìn)行同步的時候可以先進(jìn)行模擬(Emulate)同步,當(dāng)模擬同步OK后再進(jìn)行實(shí)際(actual)同步: Synchronize Cluster Resources Type or select values in entry f
59、ields. Press Enter AFTER making all desired changes. TOP
60、0; Entry Fields Ignore Cluster Verification Errors? No
61、 + * Emulate or Actual? Emulate
62、; + 3、HACMP的啟動及關(guān)閉 (1)啟動過程: #smit clstart #tail f /tmp/hacmp.out
63、160; May 22 17:29:23 EVENT COMPLETED: node_up_complete s85_a 如果/tmp/hacmp.out文件顯示類似上述信息,則表明HACMP在本機(jī)上可以正常啟動。 (2)關(guān)閉過程: #smit cl
64、stop 4、HACMP功能的測試在HACMP配置完成并檢查沒有錯誤后,即可按3的方法啟動HACMP,進(jìn)行功能測試。包括應(yīng)用在同一臺服務(wù)器的兩個網(wǎng)卡能否切換,在兩臺服務(wù)器間能否切換等??捎妹睿?#160; #netstat-in來看地址的切換情況四、HACMP常見的故障解決方法HACMP將診測并響應(yīng)于三種類型的故障:1網(wǎng)卡故障,2網(wǎng)絡(luò)工作,3節(jié)點(diǎn)故障。下面就這三種故障分別進(jìn)行介紹。 1、網(wǎng)卡故障 HACMP的群集結(jié)構(gòu)中,除了TCP/IP網(wǎng)絡(luò)以外,還有一個非TCP/IP網(wǎng)絡(luò),它實(shí)際上是一
65、根“心跳”線,專門用來診測是節(jié)點(diǎn)死機(jī)還是僅僅網(wǎng)絡(luò)發(fā)生故障。如下圖所示,一旦節(jié)點(diǎn)加入了 Cluster(即該節(jié)點(diǎn)上的HACMP已正常啟動),該節(jié)點(diǎn)的各個網(wǎng)卡、非TCP/IP網(wǎng)絡(luò)就會不斷地接收并送Keep-Alive信號,K-A的參數(shù)是可調(diào) 的,HA在連續(xù)發(fā)送一定數(shù)量個包都丟失后就可確認(rèn)對方網(wǎng)卡,或網(wǎng)絡(luò),或節(jié)點(diǎn)發(fā)生故障。因此,有了K-A后,HACMP可以很輕易地發(fā)現(xiàn)網(wǎng)卡故障,因?yàn)橐坏┠硥K網(wǎng)卡發(fā)生故障發(fā)往該塊網(wǎng)卡的K-A就會丟失。此時node 1上的cluster manager( HACMP的“大腦”)會產(chǎn)生一個swap-adapter的事件,并執(zhí)行該事件的script(HACMP中提供了大部分通
66、用環(huán)境下的事件scripts,它們是用標(biāo)準(zhǔn)AIX命令和HACMP工具來寫的)。每個節(jié)點(diǎn)上都有至少兩塊網(wǎng)卡,一塊是service adapter,提供對外服務(wù),另一塊是standby adapter,它的存在只有cluster manager知道,應(yīng)用和client并不知道。一旦發(fā)生swap-adapter事件后,cluster manager將原來service adapter的 IP地址轉(zhuǎn)移到standby adapter上,而standby地址轉(zhuǎn)移到故障網(wǎng)卡上,同時網(wǎng)絡(luò)上其他節(jié)點(diǎn)進(jìn)行ARP的刷新。網(wǎng)卡互換(swap-adapter)在幾秒內(nèi)就可完成,以太網(wǎng)為3秒,并且這種轉(zhuǎn)換對應(yīng)用和cli
67、ent來說是透明的,只發(fā)生延遲但連接并不中斷。2、網(wǎng)絡(luò)故障 如果發(fā)往node1上的service和standby網(wǎng)卡上的K-A包全都丟失,而非TCP/IP網(wǎng)絡(luò)上的K-A仍然存在,那么HACMP判斷node1仍然正常而網(wǎng)絡(luò)發(fā)生故障。此時HACMP執(zhí)行一個。 3 、節(jié)點(diǎn)故障 如果不僅TCP/IP網(wǎng)絡(luò)上的K-A全部丟失,而且非TCP/IP網(wǎng)絡(luò)上的K-A也丟失,那么HACMP斷定該節(jié)點(diǎn)發(fā)生故障,并產(chǎn)生node-down事件。此時將有資源接管,即放在共享磁盤陳列上的資源將由備份節(jié)點(diǎn)接管,接管包括一系列操作:Acquire disks,Varyon VG, Mount file systems,Export NFS file systems, Assume IP network Address, Restart highly available applications,其中IP地址接管和重新啟動應(yīng)用由HACMP來實(shí)現(xiàn),而其他是由AIX來完成。 當(dāng)整個節(jié)點(diǎn)發(fā)生故障時,HACMP將故障節(jié)點(diǎn)的service IP address轉(zhuǎn)移到備份節(jié)點(diǎn)上,使網(wǎng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 罐頭食品生產(chǎn)過程中的食品安全信息傳遞與溝通考核試卷
- 核輻射探測器件設(shè)計與優(yōu)化考核試卷
- 自行車的經(jīng)濟(jì)學(xué)與管理學(xué)考核試卷
- 森林防火與安全防護(hù)考核試卷
- 礦山機(jī)械振動分析與控制技術(shù)考核試卷
- 皮手套企業(yè)的市場營銷策略研究考核試卷
- 設(shè)備制造的能效提升與能源管理考核試卷
- 電子零售的直播銷售考核試卷
- 自然科學(xué)音像制品的教育價值考核試卷
- 復(fù)習(xí)時間管理演講
- 房地產(chǎn)行業(yè)信訪處理規(guī)范制度
- 綠色施工知識培訓(xùn)課件
- 幼兒園伙食費(fèi)管理制度
- 【MOOC】學(xué)術(shù)英語寫作-東南大學(xué) 中國大學(xué)慕課MOOC答案
- 應(yīng)激性心肌病指南解讀
- 【水利水電】李想 案例專項(xiàng)班教案 02-案例專項(xiàng)班(二)
- 教室租賃合同范本教程
- 三管三必須-新安法宣貫課件
- 山東長山列島國家地質(zhì)公園規(guī)劃編制說明(2020-2030年)
- 競聘醫(yī)院科室副主任
- 青島正日軟件藝術(shù)科目音樂、美術(shù)中考學(xué)業(yè)水平考試系統(tǒng)
評論
0/150
提交評論