IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案_第1頁
IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案_第2頁
IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案_第3頁
IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案_第4頁
IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案Hacmp(High Availability Cluster Multi-Processing)雙機(jī)熱備份軟件的主要功能是提高客戶計算機(jī)系統(tǒng)及其應(yīng)用的可靠性,而不是單臺主機(jī)的可靠性。一、Hacmp雙機(jī)系統(tǒng)的工作原理HACMP的工作原理是利用LAN來監(jiān)控主機(jī)及網(wǎng)絡(luò)、網(wǎng)卡的狀態(tài)。在一個HACMP環(huán)境中有TCP/IP網(wǎng)絡(luò)和非TCP/IP網(wǎng)絡(luò)。TCP/IP網(wǎng)絡(luò)即應(yīng)用客戶端訪問的公共網(wǎng),該網(wǎng)可以是大多數(shù)AIX所支持的網(wǎng)絡(luò),如Ethernet,T.R.,F(xiàn)DDI,ATM,SOCC,SLIP,等等。 非TCP/IP網(wǎng)絡(luò)用來為HACMP對HA環(huán)境(Cluster)中

2、的各節(jié)點(diǎn)進(jìn)行監(jiān)控而提供的一個替代TCP/IP的通訊路徑,它可以是用RS232串口線將各節(jié)點(diǎn)連接起來,也可以是將各節(jié)點(diǎn)的SCSI卡或SSA卡設(shè)置成Target Mode方式。1、作為雙機(jī)系統(tǒng)的兩臺服務(wù)器(主機(jī)A和B)同時運(yùn)行Hacmp軟件;    2、服務(wù)器除正常運(yùn)行自機(jī)的應(yīng)用外,同時又作為對方的備份主機(jī);    3、兩臺主機(jī)系統(tǒng)(A和B)在整個運(yùn)行過程中,通過 “心跳線”相互監(jiān)測對方的運(yùn)行情況(包括系統(tǒng)的軟硬件運(yùn)行、網(wǎng)絡(luò)通訊和應(yīng)用運(yùn)行情況等);    4、一旦發(fā)現(xiàn)對方主機(jī)的運(yùn)行不正常(出故障)時,故障機(jī)上

3、的應(yīng)用就會立即停止運(yùn)行,本機(jī)(故障機(jī)的備份機(jī))就會立即在自己的機(jī)器上啟動故障機(jī)上的應(yīng)用,把故障機(jī)的應(yīng)用及其資源(包括用到的IP地址和磁盤空間等)接管過來,使故障機(jī)上的應(yīng)用在本機(jī)繼續(xù)運(yùn)行;    5、應(yīng)用和資源的接管過程由Ha軟件自動完成,無需人工干預(yù);6、當(dāng)兩臺主機(jī)正常工作時,也可以根據(jù)需要將其中一臺機(jī)上的應(yīng)用人為切換到另一臺機(jī)(備份機(jī))上運(yùn)行。HACMP雙機(jī)系統(tǒng)結(jié)構(gòu)圖(點(diǎn)擊看大圖) 二、Hacmp安裝配置前需作的準(zhǔn)備工作1、劃分清楚兩臺服務(wù)器主機(jī)各自要運(yùn)行的應(yīng)用(如A機(jī)運(yùn)行應(yīng)用,B機(jī)作為standby);2、給每個應(yīng)用(組)分配Service_ip、Standb

4、y_ip、boot_ip和心跳線tty,如:主機(jī)A(運(yùn)行應(yīng)用):                 Service_ip:      172.16.1.1                 Standby_ip:  

5、;    172.16.2.1                 Boot_ip:         172.16.1.3主機(jī)B(standby):               

6、60; Service_ip:      172.16.1.2                 Standby_ip:      172.16.2.2                

7、; Boot_ip:         172.16.1.43、按照各主機(jī)的應(yīng)用的要求,建立好各自的磁盤組,并分配好磁盤空間;4、根據(jù)Ha軟件的要求,對服務(wù)器操作系統(tǒng)的參數(shù)作必要的修改。三、IBM HACMP雙機(jī)服務(wù)器系統(tǒng)的解決方案HACMP的安裝配置步驟如下:(一)在兩臺服務(wù)器上分別安裝HACMP軟件    #smit installp    (二)分別檢查兩臺主機(jī)上安裝的軟件是否成功    #/usr/sbin/cluste

8、r/diag/clverify    software    cluster    clverify>software             Valid Options are:    lpp    clverify.software> lpp    若沒有error出現(xiàn)則安裝成功。(三)分別配

9、置兩臺服務(wù)器的boot IP地址和Standby IP地址,保證boot 網(wǎng)和Standby網(wǎng)能ping通(用smit  tcpip命令),用netstat命令檢查配置是否正確:    #netstat -i    (四)利用smit tty在兩臺主機(jī)上增加一個TTY接口,配置心跳線(RS232):    #smitty tty      TTY        

10、60;                               tty0      TTY type           &#

11、160;                       tty      TTY interface                   &#

12、160;          rs232      Description                                As

13、ynchronous Terminal      Status                                     Available  &

14、#160;   Location                                   20-70-01-00      Parent adapter  &

15、#160;                          sa2    PORT number                  

16、60;             0                     Enable LOGIN                

17、;               disable                       BAUD rate           

18、0;                      9600                         PARITY  

19、0;                                  none                

20、;         BITS per character                         8               &

21、#160;            Number of STOP BITS                        1    用lsdev Cc tty查看tty是否配置好。    #lsdev Cc tt

22、y    在兩臺上分別輸入如下命令:    S85_1# cat /etc/hosts >/dev/tty0    S85_2# cat     如果在S85_2機(jī)能接收到信息,則表明心跳線已經(jīng)配置好。    (五)具體配置及技巧    注:HACMP的配置(或修改配置)只需要在其中的一臺主機(jī)上進(jìn)行,當(dāng)配置(或修改)完畢后使用同步命令將配置結(jié)果傳到另外一臺主機(jī)上。一般選S85_1在進(jìn)行配置。在S85_1上運(yùn)行s

23、mit hacmp,然后按照下面的步驟進(jìn)行配置:     #smit hacmp 1、 Cluster Configuration1.1、配置Cluster Topology配置Configure Cluster/ Add a Cluster Definition       * Cluster ID                 &#

24、160;        100                   #    * Cluster Name                  

25、;     sb_ha配置Configure Nodes,增加兩個Node    * Node Names                                    s

26、85_a    * Node Names                                    s85_b配置Configure Adapters,分別配置兩臺機(jī)的service地址,boot地址,sta

27、ndby地址及tty(a_svc、b_svc、a_boot、b_boot、a_stdby、b_stdby、a_tty、b_tty)    * Adapter IP Label                            a_svc      

28、;  Network Type                                  ether            

29、0;           Network Name                                  ethnet     

30、                 Network Attribute                             public  

31、0;                     Adapter Function                           

32、0;  service                       Adapter Identifier                       

33、     172.16.1.1      Adapter Hardware Address                             Node Name       

34、                              s85_a 修改/etc/hosts及/.rhosts文件,如:修改/etc/hosts文件,增加以下內(nèi)容:      172.16.1.1     

35、       a_svc      172.16.1.2            b_svc      172.16.1.3            a_boot     

36、172.16.1.4            b_boot      172.16.2.1            a_stdby      172.16.2.2          &

37、#160; b_stdby修改/.rhosts文件,增加以下內(nèi)容:      a_svc      b_svc      a_boot      b_boot      a_stdby      b_stdby    1.2、同步cluster(Cluster Conf

38、iguration/ Cluster Topology/ Synchronize Cluster Topology)    在進(jìn)行同步的時候可以先進(jìn)行模擬(Emulate)同步,當(dāng)模擬同步OK后再進(jìn)行實(shí)際(actual)同步:                   Synchronize Cluster Topology    Type or select v

39、alues in entry fields.    Press Enter AFTER making all desired changes.    TOP                                

40、                   Entry Fields      Ignore Cluster Verification Errors?              No     &#

41、160;          +    * Emulate or Actual?                         Emulate        &

42、#160;    +    2、配置Cluster Resources    2.1、定義一個資源組(Define Resource Groups)    注意,在定義資源組的時候,要注意Participating Node Names的先后順序。      Resource Group Name            

43、;               data_res       New Resource Group Name                          

44、 Node Relationship                             cascading       Participating Node Names        

45、              s85_a  s85_b     2.2、定義應(yīng)用服務(wù)器(Define Application Servers)    Server Name                   &

46、#160;               ora_app       New Server Name                          

47、         start Script                                  /etc/start    Stop Script 

48、;                                  /etc/stop    2.3、修改資源組屬性(Change/Show Resources for a Resource Group)   

49、; data_res組:             Resource Group Name                       data_res       Node Relationship 

50、                        cascading       Participating Node Names               &

51、#160;  s85_a  s85_b       Service IP label                          a_svc       Filesystems(default is al

52、l)                                       Filesystems Consistency Check        &#

53、160;    fsck         Filesystems Recovery Method               sequential       Filesystems to Export        &

54、#160;                     Filesystems to NFS mount                           

55、60;        Volume Groups                             datavg logvg         Concurrent Volume gro

56、ups                                     Raw Disk PVIDs            

57、0;                         Application Servers                       ora_app

58、0;2.4、同步資源組(Synchronize Cluster Resources)在進(jìn)行同步的時候可以先進(jìn)行模擬(Emulate)同步,當(dāng)模擬同步OK后再進(jìn)行實(shí)際(actual)同步:                      Synchronize Cluster Resources    Type or select values in entry f

59、ields.    Press Enter AFTER making all desired changes.    TOP                                  

60、0;                Entry Fields      Ignore Cluster Verification Errors?             No         

61、         +    * Emulate or Actual?                          Emulate         

62、;    +    3、HACMP的啟動及關(guān)閉     (1)啟動過程:            #smit clstart            #tail f /tmp/hacmp.out        &#

63、160;    May 22 17:29:23 EVENT COMPLETED: node_up_complete s85_a              如果/tmp/hacmp.out文件顯示類似上述信息,則表明HACMP在本機(jī)上可以正常啟動。    (2)關(guān)閉過程:            #smit cl

64、stop    4、HACMP功能的測試在HACMP配置完成并檢查沒有錯誤后,即可按3的方法啟動HACMP,進(jìn)行功能測試。包括應(yīng)用在同一臺服務(wù)器的兩個網(wǎng)卡能否切換,在兩臺服務(wù)器間能否切換等??捎妹睿?#160;   #netstat-in來看地址的切換情況四、HACMP常見的故障解決方法HACMP將診測并響應(yīng)于三種類型的故障:1網(wǎng)卡故障,2網(wǎng)絡(luò)工作,3節(jié)點(diǎn)故障。下面就這三種故障分別進(jìn)行介紹。     1、網(wǎng)卡故障 HACMP的群集結(jié)構(gòu)中,除了TCP/IP網(wǎng)絡(luò)以外,還有一個非TCP/IP網(wǎng)絡(luò),它實(shí)際上是一

65、根“心跳”線,專門用來診測是節(jié)點(diǎn)死機(jī)還是僅僅網(wǎng)絡(luò)發(fā)生故障。如下圖所示,一旦節(jié)點(diǎn)加入了 Cluster(即該節(jié)點(diǎn)上的HACMP已正常啟動),該節(jié)點(diǎn)的各個網(wǎng)卡、非TCP/IP網(wǎng)絡(luò)就會不斷地接收并送Keep-Alive信號,K-A的參數(shù)是可調(diào) 的,HA在連續(xù)發(fā)送一定數(shù)量個包都丟失后就可確認(rèn)對方網(wǎng)卡,或網(wǎng)絡(luò),或節(jié)點(diǎn)發(fā)生故障。因此,有了K-A后,HACMP可以很輕易地發(fā)現(xiàn)網(wǎng)卡故障,因?yàn)橐坏┠硥K網(wǎng)卡發(fā)生故障發(fā)往該塊網(wǎng)卡的K-A就會丟失。此時node 1上的cluster manager( HACMP的“大腦”)會產(chǎn)生一個swap-adapter的事件,并執(zhí)行該事件的script(HACMP中提供了大部分通

66、用環(huán)境下的事件scripts,它們是用標(biāo)準(zhǔn)AIX命令和HACMP工具來寫的)。每個節(jié)點(diǎn)上都有至少兩塊網(wǎng)卡,一塊是service adapter,提供對外服務(wù),另一塊是standby adapter,它的存在只有cluster manager知道,應(yīng)用和client并不知道。一旦發(fā)生swap-adapter事件后,cluster manager將原來service adapter的 IP地址轉(zhuǎn)移到standby adapter上,而standby地址轉(zhuǎn)移到故障網(wǎng)卡上,同時網(wǎng)絡(luò)上其他節(jié)點(diǎn)進(jìn)行ARP的刷新。網(wǎng)卡互換(swap-adapter)在幾秒內(nèi)就可完成,以太網(wǎng)為3秒,并且這種轉(zhuǎn)換對應(yīng)用和cli

67、ent來說是透明的,只發(fā)生延遲但連接并不中斷。2、網(wǎng)絡(luò)故障     如果發(fā)往node1上的service和standby網(wǎng)卡上的K-A包全都丟失,而非TCP/IP網(wǎng)絡(luò)上的K-A仍然存在,那么HACMP判斷node1仍然正常而網(wǎng)絡(luò)發(fā)生故障。此時HACMP執(zhí)行一個。    3 、節(jié)點(diǎn)故障     如果不僅TCP/IP網(wǎng)絡(luò)上的K-A全部丟失,而且非TCP/IP網(wǎng)絡(luò)上的K-A也丟失,那么HACMP斷定該節(jié)點(diǎn)發(fā)生故障,并產(chǎn)生node-down事件。此時將有資源接管,即放在共享磁盤陳列上的資源將由備份節(jié)點(diǎn)接管,接管包括一系列操作:Acquire disks,Varyon VG, Mount file systems,Export NFS file systems, Assume IP network Address, Restart highly available applications,其中IP地址接管和重新啟動應(yīng)用由HACMP來實(shí)現(xiàn),而其他是由AIX來完成。     當(dāng)整個節(jié)點(diǎn)發(fā)生故障時,HACMP將故障節(jié)點(diǎn)的service IP address轉(zhuǎn)移到備份節(jié)點(diǎn)上,使網(wǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論