華為虛擬化FusionSphere常見(jiàn)故障管理_第1頁(yè)
華為虛擬化FusionSphere常見(jiàn)故障管理_第2頁(yè)
華為虛擬化FusionSphere常見(jiàn)故障管理_第3頁(yè)
華為虛擬化FusionSphere常見(jiàn)故障管理_第4頁(yè)
華為虛擬化FusionSphere常見(jiàn)故障管理_第5頁(yè)
已閱讀5頁(yè),還剩107頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

華為虛擬化FusionSphere常見(jiàn)故障管理

目錄1故障處理概述 31.1故障處理流程 31.2故障分類(lèi) 42常見(jiàn)故障處理 62.1用戶(hù)虛擬機(jī)故障 62.1.1虛擬機(jī)藍(lán)屏 62.1.2重啟或關(guān)閉主機(jī)網(wǎng)絡(luò)服務(wù)后,主機(jī)網(wǎng)絡(luò)異常 92.1.3本地磁盤(pán)的ext4文件系統(tǒng)損壞 102.1.4虛擬機(jī)內(nèi)存數(shù)值顯示異常 132.1.5虛擬機(jī)重啟后網(wǎng)絡(luò)不通 152.2FusionCompute管理節(jié)點(diǎn)故障 162.2.1單個(gè)VRM虛擬機(jī)操作系統(tǒng)故障 162.2.2主機(jī)操作系統(tǒng)故障 252.2.3VRM虛擬機(jī)本地存儲(chǔ)雙盤(pán)故障 302.2.4VRM虛擬機(jī)關(guān)機(jī)后無(wú)法啟動(dòng) 412.3FusionManager管理節(jié)點(diǎn)故障 422.3.1修改FusionManager管理IP地址導(dǎo)致FusionManager連接異常 422.3.2修改VSAM管理IP地址導(dǎo)致VSAM連接異常 432.3.3單個(gè)FusionManager虛擬機(jī)故障 452.3.4VSAM虛擬機(jī)故障 502.3.5主備VSAM虛擬機(jī)同時(shí)故障 542.4FusionCompute操作維護(hù)類(lèi)故障 582.4.1FusionComute無(wú)法獲取監(jiān)控?cái)?shù)據(jù) 582.4.2修改虛擬機(jī)IP后虛擬機(jī)通信中斷 602.4.3主機(jī)管理網(wǎng)絡(luò)配置與交換機(jī)不匹配 622.4.4異常掉電再上電后,任務(wù)長(zhǎng)時(shí)間無(wú)響應(yīng) 632.4.5使用虛擬化SAN存儲(chǔ)的主機(jī)異常重啟 652.5FusionManager操作維護(hù)類(lèi)故障 672.5.1修改虛擬機(jī)IP后虛擬機(jī)通信中斷 672.5.2主機(jī)關(guān)聯(lián)的數(shù)據(jù)存儲(chǔ)異常 692.5.3界面字符顯示亂碼 702.5.4主備VSAM節(jié)點(diǎn)無(wú)法ping通仲裁IP地址 712.5.5刪除創(chuàng)建失敗的網(wǎng)絡(luò)后仍殘留端口組信息 733故障應(yīng)急處理 743.1主備VRM虛擬機(jī)操作系統(tǒng)同時(shí)故障 743.2主備VRM物理節(jié)點(diǎn)操作系統(tǒng)同時(shí)故障 903.3共享存儲(chǔ)的VIMS文件系統(tǒng)損壞 1003.4主備FusionManager虛擬機(jī)同時(shí)故障 108

1故障處理概述1.1故障處理流程故障處理總體流程主要分為四個(gè)過(guò)程:故障信息收集、故障判斷、故障定位、故障排除。具體實(shí)施過(guò)程如圖1所示。說(shuō)明:處理重大故障前,請(qǐng)先聯(lián)系技術(shù)支持處理。圖1常見(jiàn)故障處理流程故障信息收集故障信息是故障處理的重要依據(jù),系統(tǒng)維護(hù)人員應(yīng)盡可能多的收集故障信息。故障判斷排除故障之前,系統(tǒng)維護(hù)人員根據(jù)收集的故障詳細(xì)信息,對(duì)故障范圍和類(lèi)型進(jìn)行判斷。故障定位故障定位是指從眾多可能原因中找出故障原因的過(guò)程。通過(guò)一定的方法或手段分析、比較各種可能的故障成因,不斷排除非可能因素,最終確定故障發(fā)生的具體原因。以下是故障定位的常用方法:在管理界面查看告警信息在管理界面查看監(jiān)控信息是否正常查詢(xún)操作日志,分析操作過(guò)程是否有誤在管理界面檢查數(shù)據(jù)配置是否正確觀察設(shè)備指示燈狀態(tài)是否正常故障排除故障排除是指根據(jù)不同的故障原因清除故障的過(guò)程。故障排除包括檢修線路、修改配置數(shù)據(jù)、重啟相關(guān)進(jìn)程、重啟服務(wù)器等。說(shuō)明:當(dāng)系統(tǒng)維護(hù)人員無(wú)法自行排除故障時(shí),請(qǐng)聯(lián)系技術(shù)支持。確認(rèn)故障是否被排除通過(guò)查詢(xún)?cè)O(shè)備狀態(tài)、查看設(shè)備指示燈和告警等方法確認(rèn)系統(tǒng)已正常運(yùn)行,并進(jìn)行相關(guān)業(yè)務(wù)調(diào)測(cè)以確保業(yè)務(wù)正常。記錄故障處理過(guò)程故障排除后應(yīng)記錄故障處理要點(diǎn),給出針對(duì)此類(lèi)故障的防范和改進(jìn)措施,避免同類(lèi)故障再次發(fā)生。1.2故障分類(lèi)FusionCompute提供的故障處理如表1所示。

表1故障處理一覽表故障大類(lèi)故障子類(lèi)故障名稱(chēng)常見(jiàn)故障處理用戶(hù)虛擬機(jī)故障虛擬機(jī)藍(lán)屏SUSE虛擬機(jī)網(wǎng)卡不可用Ubuntu10.04及以上版本操作系統(tǒng)中uvp-monitor進(jìn)程未啟動(dòng)WindowsServer2003虛擬機(jī)綁定USB2.0設(shè)備后,虛擬機(jī)黑屏或關(guān)機(jī)失敗SUSE10虛擬機(jī)不能正常使用USB2.0設(shè)備SUSE11SP232bit多網(wǎng)卡虛擬機(jī)無(wú)法獲取到網(wǎng)關(guān)重啟或關(guān)閉主機(jī)網(wǎng)絡(luò)服務(wù)后,主機(jī)網(wǎng)絡(luò)異常虛擬機(jī)同時(shí)綁定SCSI磁盤(pán)和IDE磁盤(pán)時(shí)無(wú)法正常啟動(dòng)本地磁盤(pán)的ext4文件系統(tǒng)損壞虛擬機(jī)內(nèi)存數(shù)值顯示異常跨主機(jī)通信的虛擬機(jī)間通信帶寬過(guò)低虛擬機(jī)重啟后網(wǎng)絡(luò)不通管理節(jié)點(diǎn)故障單個(gè)VRM虛擬機(jī)操作系統(tǒng)故障單個(gè)VRM物理節(jié)點(diǎn)操作系統(tǒng)故障主機(jī)操作系統(tǒng)故障VRM虛擬機(jī)本地存儲(chǔ)雙盤(pán)故障VRM虛擬機(jī)關(guān)機(jī)后無(wú)法啟動(dòng)操作維護(hù)類(lèi)故障FusionComute無(wú)法獲取監(jiān)控?cái)?shù)據(jù)修改虛擬機(jī)IP后虛擬機(jī)通信中斷主機(jī)管理網(wǎng)絡(luò)配置與交換機(jī)不匹配異常掉電再上電后,任務(wù)長(zhǎng)時(shí)間無(wú)響應(yīng)網(wǎng)絡(luò)數(shù)據(jù)殘留導(dǎo)致添加主機(jī)失敗主備VRM節(jié)點(diǎn)無(wú)法ping通仲裁IP地址高斯數(shù)據(jù)庫(kù)分區(qū)使用率超過(guò)95%,導(dǎo)致FusionCompute無(wú)法登錄卷刪除成功后解關(guān)聯(lián)或銷(xiāo)毀數(shù)據(jù)存儲(chǔ)失敗使用虛擬化SAN存儲(chǔ)的主機(jī)異常重啟交換機(jī)開(kāi)啟STP功能導(dǎo)致添加主機(jī)失敗Tools故障Windows下安裝Tools時(shí)彈出警告提示W(wǎng)indows下安裝Tools時(shí)異常中止應(yīng)急處理管理節(jié)點(diǎn)故障主備VRM虛擬機(jī)操作系統(tǒng)同時(shí)故障主備VRM物理節(jié)點(diǎn)操作系統(tǒng)同時(shí)故障共享存儲(chǔ)的VIMS文件系統(tǒng)損壞部件更換-部件更換策略更換主機(jī)拆卸/增加/更換物理網(wǎng)卡FusionManager提供的故障處理如表2所示。表2故障處理一覽表故障大類(lèi)故障子類(lèi)故障名稱(chēng)常見(jiàn)故障處理管理節(jié)點(diǎn)故障修改FusionManager管理IP地址導(dǎo)致FusionManager連接異常修改VSAM管理IP地址導(dǎo)致VSAM連接異常單個(gè)FusionManager虛擬機(jī)故障VSAM虛擬機(jī)故障主備VSAM虛擬機(jī)同時(shí)故障VSA虛擬機(jī)故障VSAM數(shù)據(jù)庫(kù)密碼不一致導(dǎo)致連接異常操作維護(hù)類(lèi)故障修改虛擬機(jī)IP后虛擬機(jī)通信中斷主機(jī)關(guān)聯(lián)的數(shù)據(jù)存儲(chǔ)異常界面字符顯示亂碼主備VSAM節(jié)點(diǎn)無(wú)法ping通仲裁IP地址高斯r數(shù)據(jù)庫(kù)分區(qū)使用率超過(guò)95%,導(dǎo)致FusionManager與VSAM無(wú)法通信刪除創(chuàng)建失敗的網(wǎng)絡(luò)后仍殘留端口組信息應(yīng)急處理管理節(jié)點(diǎn)故障主備FusionManager虛擬機(jī)同時(shí)故障系統(tǒng)時(shí)間故障-系統(tǒng)時(shí)間錯(cuò)誤2常見(jiàn)故障處理2.1用戶(hù)虛擬機(jī)故障2.1.1虛擬機(jī)藍(lán)屏現(xiàn)象描述虛擬機(jī)藍(lán)屏或黑屏??赡茉蛱摂M機(jī)安裝的操作系統(tǒng)與虛擬機(jī)選項(xiàng)中的操作系統(tǒng)類(lèi)型或版本不同。主機(jī)異常下電,導(dǎo)致主機(jī)上的虛擬機(jī)操作系統(tǒng)文件被破壞。定位思路無(wú)。處理步驟檢查操作系統(tǒng)類(lèi)型以及版本號(hào)登錄FusionCompute。在出現(xiàn)故障的虛擬機(jī)的“選項(xiàng)>操作系統(tǒng)”頁(yè)面查看虛擬機(jī)選擇的操作系統(tǒng)類(lèi)型以及版本號(hào)。對(duì)比查看到的操作系統(tǒng)類(lèi)型以及版本號(hào)與虛擬機(jī)實(shí)際安裝的是否一致。是,執(zhí)行步驟8。否,執(zhí)行步驟4。關(guān)閉虛擬機(jī)。在虛擬機(jī)的“選項(xiàng)>操作系統(tǒng)”頁(yè)面,將操作系統(tǒng)類(lèi)型以及版本號(hào)修改為實(shí)際安裝的。啟動(dòng)虛擬機(jī)。故障是否恢復(fù)?是,處理完畢。否,執(zhí)行步驟10。重啟虛擬機(jī)重啟虛擬機(jī)。故障是否恢復(fù)?是,處理完畢。否,執(zhí)行步驟10。刪除虛擬機(jī)是否為新創(chuàng)建的虛擬機(jī)?是,步驟11。否,步驟12。刪除該虛擬機(jī),重新創(chuàng)建新虛擬機(jī)。處理完畢?;謴?fù)虛擬機(jī)說(shuō)明:以下操作以WindowsXP操作系統(tǒng)為例,使虛擬機(jī)通過(guò)光驅(qū)啟動(dòng),并完成相應(yīng)的操作。在FusionCompute中,使用VNC方式登錄故障虛擬機(jī)。掛載操作系統(tǒng)的ISO文件并重啟虛擬機(jī)。虛擬機(jī)重啟過(guò)程中,出現(xiàn)以下提示信息時(shí),按任意鍵,使虛擬機(jī)通過(guò)光驅(qū)啟動(dòng)。PressanykeytobootfromCD.按“Enter”。進(jìn)入安裝程序界面。輸入“R”。系統(tǒng)開(kāi)始修復(fù)安裝。根據(jù)界面提示,按照默認(rèn)設(shè)置完成安裝。卸載光驅(qū)。每個(gè)主機(jī)以本地方式最多只能給32個(gè)虛擬機(jī)掛載光驅(qū)。因此,使用完畢后,請(qǐng)及時(shí)卸載光驅(qū)。修改虛擬機(jī)啟動(dòng)方式選擇“虛擬機(jī)和模板”。在“虛擬機(jī)”頁(yè)簽,單擊虛擬機(jī)名稱(chēng)。顯示“概要”頁(yè)簽。在“選項(xiàng)”頁(yè)簽,將虛擬機(jī)的啟動(dòng)方式修改為“硬盤(pán)啟動(dòng)”。檢查虛擬機(jī)狀態(tài)重新登錄故障虛擬機(jī)。故障是否恢復(fù)?是,處理完畢。否,執(zhí)行步驟24?;謴?fù)虛擬機(jī)的系統(tǒng)盤(pán)在FusionCompute中,強(qiáng)制關(guān)閉該虛擬機(jī)。解綁定故障虛擬機(jī)的系統(tǒng)盤(pán)。將該磁盤(pán)以用戶(hù)磁盤(pán)的方式,綁定給另一臺(tái)虛擬機(jī)(以下操作中稱(chēng)為“虛擬機(jī)B”)。以VNC方式登錄虛擬機(jī)B。右鍵單擊“我的電腦”,選擇“管理”。彈出“計(jì)算機(jī)管理”窗口。選擇“存儲(chǔ)>磁盤(pán)管理”。右鍵單擊新綁定的磁盤(pán),選擇“更改驅(qū)動(dòng)器號(hào)和路徑”。單擊“更改”,并分配驅(qū)動(dòng)器號(hào),例如:E。單擊“確定”。彈出確認(rèn)提示框。單擊“是”。返回“計(jì)算機(jī)管理”窗口,更改完成。對(duì)該磁盤(pán)中的系統(tǒng)文件進(jìn)行恢復(fù),并備份用戶(hù)數(shù)據(jù)。具體操作請(qǐng)參考對(duì)應(yīng)操作系統(tǒng)的文檔。將該磁盤(pán)以系統(tǒng)磁盤(pán)的方式,重新綁定給原故障虛擬機(jī)。以VNC方式登錄故障虛擬機(jī)。故障是否恢復(fù)?是,處理完畢。否,請(qǐng)聯(lián)系技術(shù)支持。參考信息無(wú)。2.1.2重啟或關(guān)閉主機(jī)網(wǎng)絡(luò)服務(wù)后,主機(jī)網(wǎng)絡(luò)異?,F(xiàn)象描述重啟或關(guān)閉主機(jī)的網(wǎng)絡(luò)服務(wù)后,主機(jī)網(wǎng)絡(luò)異常,主機(jī)上的虛擬機(jī)無(wú)法對(duì)外通信??赡茉蜿P(guān)閉網(wǎng)絡(luò)服務(wù)后,系統(tǒng)會(huì)清除該主機(jī)上所有IP。網(wǎng)絡(luò)服務(wù)重啟后,主機(jī)上的網(wǎng)橋?qū)ο笕源嬖冢鳈C(jī)的IP已從Mgnt-0管理系統(tǒng)接口轉(zhuǎn)移至上行鏈路物理網(wǎng)口。帶有IP的上行鏈路物理網(wǎng)口連接在網(wǎng)橋上,因此主機(jī)及其上的虛擬機(jī)無(wú)法對(duì)外通信。定位思路無(wú)。處理步驟在本地PC上打開(kāi)瀏覽器,在瀏覽器地址欄輸入以下地址,按“Enter”。http://主機(jī)BMCIP地址或https://主機(jī)BMCIP地址進(jìn)入登錄界面。根據(jù)界面提示登錄主機(jī)BMC系統(tǒng)。主機(jī)的BMC默認(rèn)用戶(hù)名為“root”,默認(rèn)密碼為“Huawei12#$”。登錄后進(jìn)入主機(jī)管理頁(yè)面。說(shuō)明:如果刀片式服務(wù)器無(wú)法登錄單個(gè)刀片的BMC系統(tǒng),建議登錄刀片所在機(jī)框的管理模塊(SMM板),然后打開(kāi)對(duì)應(yīng)刀片的遠(yuǎn)程控制窗口。單擊“遠(yuǎn)程控制”。部分華為服務(wù)器需要在“遠(yuǎn)程控制”頁(yè)面選擇“遠(yuǎn)程虛擬控制臺(tái)(JRE支持)”打開(kāi)遠(yuǎn)程控制窗口。彈出主機(jī)遠(yuǎn)程控制窗口。以“root”用戶(hù)登錄主機(jī)。執(zhí)行以下命令,重啟主機(jī)。reboot主機(jī)重啟成功后,檢查主機(jī)及主機(jī)上的虛擬機(jī)對(duì)外通信是否正常。是,操作結(jié)束。否,請(qǐng)聯(lián)系技術(shù)支持。參考信息無(wú)。2.1.3本地磁盤(pán)的ext4文件系統(tǒng)損壞現(xiàn)象描述當(dāng)服務(wù)器被異常下電時(shí),存在虛擬機(jī)無(wú)法啟動(dòng)。虛擬化本地磁盤(pán)的ext4文件系統(tǒng)變?yōu)橹蛔x,甚至無(wú)法掛載。具體查看的方法:登錄異常的主機(jī),執(zhí)行命令cat/proc/mounts,回顯ro,說(shuō)明本地磁盤(pán)的ext4文件系統(tǒng)已損壞??赡茉虺?jí)塊損壞。超級(jí)塊是文件系統(tǒng)中最重要的數(shù)據(jù)結(jié)構(gòu),它是來(lái)描述整個(gè)文件系統(tǒng)信息。文件元數(shù)據(jù)損壞。元數(shù)據(jù)用來(lái)描述一個(gè)文件特征的系統(tǒng)數(shù)據(jù),諸如訪問(wèn)權(quán)限、文件擁有者以及文件數(shù)據(jù)塊的分布信息等等。定位思路無(wú)。處理步驟停止故障存儲(chǔ)設(shè)備上的業(yè)務(wù)運(yùn)行使用“PuTTY”登錄故障存儲(chǔ)設(shè)備所在主機(jī)。停止故障的存儲(chǔ)設(shè)備上運(yùn)行的所有業(yè)務(wù)。說(shuō)明:停止虛擬機(jī)會(huì)使該虛擬機(jī)上運(yùn)行的業(yè)務(wù)暫停,請(qǐng)?jiān)跓o(wú)業(yè)務(wù)時(shí)執(zhí)行該操作。停止虛擬機(jī)的方法:用戶(hù)虛擬機(jī):在FusionCompute界面上關(guān)閉所有的用戶(hù)虛擬機(jī),VRM虛擬機(jī):VRM虛擬機(jī)無(wú)法在界面上關(guān)閉,需登錄VRM所在主機(jī),執(zhí)行命令關(guān)閉。命令為:virshdestroy虛擬機(jī)ID執(zhí)行以下命令,記錄掛載目錄。mount回顯類(lèi)似如下信息:/dev/sdgon/mnttypeocfs2(rw,_netdev,noatime,nodiratime,novdilock,commit=1,localalloc=2048,heartbeat=local)其中,/mnt為ext4文件系統(tǒng)在主機(jī)上的掛載目錄。依次登錄所有使用該文件系統(tǒng)的主機(jī),執(zhí)行以下命令卸載該文件系統(tǒng),確保其不被任何節(jié)點(diǎn)使用。注意:不可對(duì)該文件系統(tǒng)進(jìn)行格式化操作。umountmount_point其中,mount_point為步驟3中記錄的ext4文件系統(tǒng)在主機(jī)上的掛載目錄。修復(fù)損壞的數(shù)據(jù)執(zhí)行如下命令,檢查故障設(shè)備。fsck.ext4-fndevice其中,device為故障存儲(chǔ)設(shè)備在主機(jī)上的存放路徑,例如“/dev/sda”。當(dāng)回顯信息出現(xiàn)“fsck.ext4:Superblockinvalid,tryingbackupblocks...”字樣時(shí),表示超級(jí)塊損壞。當(dāng)回顯信息出現(xiàn)“/dev/sda9:**********WARNING:Filesystemstillhaserrors**********”字樣時(shí),表示文件元數(shù)據(jù)損壞。根據(jù)損壞的數(shù)據(jù)類(lèi)型,執(zhí)行相應(yīng)的操作。超級(jí)塊損壞,執(zhí)行步驟7。文件元數(shù)據(jù)損壞,執(zhí)行步驟8。執(zhí)行以下命令,恢復(fù)超級(jí)塊數(shù)據(jù)。注意:如果損壞的文件系統(tǒng)中的數(shù)據(jù)非常重要,建議先通過(guò)ddif=<device>of=/backupdir/backupfile備份數(shù)據(jù),再執(zhí)行修復(fù)命令。fsck.ext4-bnumdevice-y其中,num為備份的超級(jí)塊序號(hào),可選擇設(shè)備大小范圍內(nèi)對(duì)應(yīng)的任意塊編號(hào),具體見(jiàn)如下說(shuō)明。device為步驟5中的存放路徑。說(shuō)明:ext4會(huì)通過(guò)備份文件系統(tǒng)超級(jí)塊的方式來(lái)提供文件系統(tǒng)的容錯(cuò)性,會(huì)在磁盤(pán)的多處備份超級(jí)塊。例如一個(gè)500G的設(shè)備,分別在設(shè)備的塊號(hào)為32768,98304,163840,229376,294912,819200,884736,1605632,2654208,4096000,7962624,11239424,20480000,23887872,71663616,78675968,102400000處備份。主超級(jí)塊損壞時(shí)可以用文件系統(tǒng)一致性檢查工具(fsck.ext4)把備用超級(jí)塊寫(xiě)回主超級(jí)塊處,恢復(fù)文件系統(tǒng)。該步驟執(zhí)行完成后,執(zhí)行步驟9。執(zhí)行以下命令,恢復(fù)文件元數(shù)據(jù)。注意:如果損壞的文件系統(tǒng)中的數(shù)據(jù)非常重要,建議先通過(guò)ddif=<device>of=/backupdir/backupfile備份數(shù)據(jù),再執(zhí)行修復(fù)命令。fsck.ext4-ydevicedevice為步驟5中的存放路徑。執(zhí)行如下命令,查看文件系統(tǒng)是否還有異常?fsck.ext4-fndevice是,請(qǐng)聯(lián)系技術(shù)支持。否,處理完畢。參考信息無(wú)。2.1.4虛擬機(jī)內(nèi)存數(shù)值顯示異?,F(xiàn)象描述如果虛擬機(jī)為以下操作系統(tǒng),且虛擬機(jī)所在集群已啟用“主機(jī)內(nèi)存復(fù)用”,虛擬機(jī)的內(nèi)存數(shù)值可能會(huì)出現(xiàn)異常,即total(總內(nèi)存)的數(shù)值小于free(空閑內(nèi)存)的數(shù)值。RedHatEnterpriseLinux6.032位RedHatEnterpriseLinux6.132位CentOS6.032位CentOS6.132位查詢(xún)虛擬機(jī)內(nèi)存數(shù)值時(shí),回顯如下所示。其中total的值(1904388)小于free的值(1916752)。[root@vm01~]#freetotalusedfreesharedbufferscachedMem:190438899124180526402322088268-/+buffers/cache:42949549321916752Swap:625868006258680可能原因虛擬機(jī)中關(guān)閉了kdump服務(wù),同時(shí)在Linux內(nèi)核啟動(dòng)配置文件中配置了參數(shù)“crashkernel=auto”,由于操作系統(tǒng)內(nèi)核本身對(duì)內(nèi)存初始化的特殊處理方法,導(dǎo)致Tools初始化時(shí)得到的內(nèi)存相關(guān)值與操作系統(tǒng)內(nèi)核本身的值存在差異,最終導(dǎo)致內(nèi)存數(shù)值出現(xiàn)異常。定位思路無(wú)。處理步驟登錄虛擬機(jī)。在命令行窗口中,執(zhí)行以下命令,使用vi編輯器打開(kāi)“menu.lst”文件。vi/boot/grub/menu.lst按“i”鍵,進(jìn)入編輯模式。配置文件示例如下。default=0timeout=5splashimage=(hd0,0)/grub/splash.xpm.gzhiddenmenutitleRedHatEnterpriseLinuxServer(2.6.18-164.el5)root(hd0,0)kernel/vmlinuz-2.6.18-164.el5roroot=/dev/VolGroup00/LogVol00crashkernel=autorhgbquietide0=noprobeide1=noprobeinitrd/initrd-2.6.18-164.el5.img刪除“crashkernel=auto”。按“Esc”退出編輯模式,并輸入:wq保存退出。重啟虛擬機(jī)。參考信息無(wú)。2.1.5虛擬機(jī)重啟后網(wǎng)絡(luò)不通現(xiàn)象描述配置了靜態(tài)IP地址和網(wǎng)關(guān)的虛擬機(jī)在重啟后出現(xiàn)網(wǎng)絡(luò)不通,VNC登錄該虛擬機(jī)查看網(wǎng)絡(luò)配置,發(fā)現(xiàn)網(wǎng)關(guān)丟失??赡茉蛱摂M機(jī)的計(jì)算機(jī)名與網(wǎng)絡(luò)中其他虛擬機(jī)計(jì)算機(jī)名相同,在網(wǎng)絡(luò)中注冊(cè)IP地址時(shí)導(dǎo)致沖突。定位思路對(duì)于Windows虛擬機(jī),VNC登錄虛擬機(jī),在“開(kāi)始菜單”右鍵單擊“計(jì)算機(jī)”,選擇“管理”,在計(jì)算機(jī)管理中選擇“計(jì)算機(jī)管理(本地)>系統(tǒng)工具>事件查看器>Windows日志>系統(tǒng)”中查看日志,其中存在級(jí)別為“錯(cuò)誤”的日志信息,描述為虛擬機(jī)的計(jì)算機(jī)名不能注冊(cè)到某IP地址,因?yàn)榱硪粋€(gè)IP地址已經(jīng)占用該計(jì)算機(jī)名。對(duì)于Linux虛擬機(jī),VNC登錄該虛擬機(jī),查看網(wǎng)卡配置,發(fā)現(xiàn)網(wǎng)卡的網(wǎng)關(guān)丟失。處理步驟判斷虛擬機(jī)操作系統(tǒng)類(lèi)型。Windows虛擬機(jī),執(zhí)行步驟2。Linux虛擬機(jī),執(zhí)行步驟7。(Windows虛擬機(jī)操作以Windows7操作系統(tǒng)為例)使用VNC登錄虛擬機(jī),在“開(kāi)始菜單”右鍵單擊“計(jì)算機(jī)”,選擇“屬性”。在右側(cè)單擊“更改設(shè)置”。彈出“系統(tǒng)屬性”窗口。在“計(jì)算機(jī)名”頁(yè)簽單擊“更改”。彈出“計(jì)算機(jī)名/域更改”對(duì)話框。修改計(jì)算機(jī)名為環(huán)境中唯一的計(jì)算機(jī)名,然后單擊“確定”。重新設(shè)置計(jì)算機(jī)的網(wǎng)卡屬性。處理完畢。(Linux虛擬機(jī)操作以SUSE操作系統(tǒng)為例)使用VNC登錄虛擬機(jī),執(zhí)行vi/etc/hostname命令以VI編輯器打開(kāi)主機(jī)名配置文件。說(shuō)明:對(duì)于RedHat操作系統(tǒng),需要先執(zhí)行echo'HOSTNAME='$hnOld>>$mountpath/etc/sysconfig/network命令將原主機(jī)名寫(xiě)入配置文件,然后執(zhí)行vi/etc/sysconfig/network命令以VI編輯器打開(kāi)主機(jī)名配置文件。按“i”進(jìn)入編輯模式,修改“HOSTNAME”的值為全網(wǎng)段唯一的名稱(chēng)。按“ESC”并輸入:wq保存修改。執(zhí)行vietc/syscionfig/network/route命令以VI編輯器打開(kāi)網(wǎng)關(guān)配置文件。按“i”進(jìn)入編輯模式,修改“default”后的值為正確的網(wǎng)關(guān)。按“ESC”并輸入:wq保存修改。處理完畢。說(shuō)明:對(duì)于有操作界面的Linux系統(tǒng),可通過(guò)界面直接修改網(wǎng)卡的網(wǎng)關(guān)信息。參考信息無(wú)2.2FusionCompute管理節(jié)點(diǎn)故障2.2.1單個(gè)VRM虛擬機(jī)操作系統(tǒng)故障現(xiàn)象描述系統(tǒng)運(yùn)行過(guò)程中,出現(xiàn)以下故障現(xiàn)象,需要參考本故障處理操作,使業(yè)務(wù)快速恢復(fù)正常。VRM主備部署時(shí),單個(gè)VRM虛擬機(jī)故障,且重啟該虛擬機(jī)后業(yè)務(wù)仍無(wú)法恢復(fù)。出現(xiàn)“ALM-15.1002000主備間節(jié)點(diǎn)心跳故障”告警。VRM主備部署時(shí),單個(gè)VRM虛擬機(jī)所在主機(jī)異常下電。主機(jī)重新上電后切換該VRM虛擬機(jī)為VRM主節(jié)點(diǎn),可打開(kāi)FusionCompute登錄界面,但無(wú)法登錄??赡茉騐RM虛擬機(jī)文件系統(tǒng)被破壞。定位思路無(wú)。處理步驟查詢(xún)故障VRM節(jié)點(diǎn)的信息登錄FusionCompute。說(shuō)明:若出現(xiàn)“現(xiàn)象描述”中第三種情況,此時(shí)無(wú)法登錄FusionCompute,則需要重啟故障VRM所在主機(jī),待主備VRM倒換后,再登錄FusionCompute。在“監(jiān)控>告警”頁(yè)面,找到生成的“ALM-15.1002000主備間節(jié)點(diǎn)心跳故障”告警,查看該告警的附加信息并記錄該故障節(jié)點(diǎn)的IP地址。選擇“虛擬機(jī)和模板”。在“虛擬機(jī)”頁(yè)面,通過(guò)虛擬機(jī)的IP地址找到故障VRM虛擬機(jī)。查看并記錄故障VRM虛擬機(jī)所屬的主機(jī)。在“主機(jī)”頁(yè)簽,通過(guò)主機(jī)名稱(chēng)找到故障VRM虛擬機(jī)所在主機(jī)。查看并記錄該主機(jī)的IP地址。修改主機(jī)配置使用“PuTTY”,登錄故障VRM節(jié)點(diǎn)所在主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,修改VRM監(jiān)控配置。cd/opt/galax/eucalyptus/usr/share/eucalyptusshvrm_monitor.shset顯示如下信息,表示VRM監(jiān)控配置修改成功。setVM_RECOVER_TIMEsucceed重新安裝故障VRM虛擬機(jī)在FusionCompute中,使用VNC方式登錄故障VRM虛擬機(jī)。掛載光驅(qū),選擇“FusionComputeV100R006C00U1_VRM.iso”。此處不勾選“立即重啟虛擬機(jī),安裝操作系統(tǒng)”。使用“PuTTY”,登錄故障VRM虛擬機(jī)所在主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,設(shè)置故障VRM虛擬機(jī)從光驅(qū)啟動(dòng)。/opt/galax/NCclientncModifyBootVRM虛擬機(jī)IDcdrom執(zhí)行以下命令,強(qiáng)制重啟故障VRM虛擬機(jī)。/opt/galax/NCclientncRebootVMVRM虛擬機(jī)ID1例如:/opt/galax/NCclientncRebootVMi-000000011重新安裝VRM虛擬機(jī)。安裝之前,請(qǐng)記錄VRM虛擬機(jī)原有的IP地址、主機(jī)名和用戶(hù)密碼,重新安裝時(shí),這些信息需要與原有的保持一致。說(shuō)明:重新安裝的VRM版本必須與故障前保持一致,如不一致,請(qǐng)重新安裝或者升級(jí)到相同版本。卸載光驅(qū)在虛擬機(jī)“硬件”頁(yè)簽中,單擊“光驅(qū)”。在光驅(qū)頁(yè)面,單擊“卸載光驅(qū)”。彈出提示框。單擊“確定”。完成卸載光驅(qū)。是否使用智能網(wǎng)卡?是,執(zhí)行步驟30。否,執(zhí)行步驟24。檢測(cè)和恢復(fù)網(wǎng)卡亂序使用“PuTTY”,登錄故障VRM虛擬機(jī)所在主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,查詢(xún)VRM虛擬機(jī)的DomainID。xllist回顯如下類(lèi)似信息,其中“ID”列顯示的值為虛擬機(jī)的DomainID。NameIDMemVCPUsStateTime(s)Domain-0035842r191256.0i-00000002130712-b125717.7i-0000000D33163832-b27127.6說(shuō)明:以查詢(xún)到的VRM虛擬機(jī)的DomainID為33為例,則eth0對(duì)應(yīng)的虛擬網(wǎng)口為vif33.0。執(zhí)行以下命令,查詢(xún)VRM虛擬機(jī)的eth0網(wǎng)口是否已亂序。xenstore-ls-f|grep"vif/DomainID/0/bridge"例如:xenstore-ls-f|grep"vif/33/0/bridge"顯示如下類(lèi)似信息,如果顯示信息中包含“br.1.pg.1”,說(shuō)明網(wǎng)卡沒(méi)有亂序,否則說(shuō)明網(wǎng)卡已亂序。/local/domain/0/backend/vif/33/0/bridge="br.1.pg.1"是,執(zhí)行步驟29。否,執(zhí)行步驟30?;謴?fù)亂序的網(wǎng)卡?;謴?fù)VRM虛擬機(jī)的規(guī)格說(shuō)明:故障前VRM虛擬機(jī)的規(guī)格,可在FusionCompute中VRM虛擬機(jī)的“硬件”頁(yè)簽中查詢(xún)。使用“PuTTY”,登錄新安裝的VRM節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止“PuTTY”超時(shí)退出。TMOUT=0執(zhí)行以下命令,進(jìn)入/opt/galax/vrm/tomcat/script目錄。cd/opt/galax/vrm/tomcat/script/執(zhí)行以下命令,運(yùn)行配置腳本。shmodifyVrmNodeMemory.sh命令參數(shù)命令參數(shù)的取值范圍如下:表1管理虛擬機(jī)配置腳本數(shù)據(jù)參數(shù)說(shuō)明取值樣例命令參數(shù)虛擬機(jī)規(guī)格的參數(shù)。取值范圍:S:虛擬機(jī)規(guī)格為2個(gè)CPU、3GB內(nèi)存M:虛擬機(jī)規(guī)格為4個(gè)CPU、5GB內(nèi)存L:虛擬機(jī)規(guī)格為8個(gè)CPU、8GB內(nèi)存XL:虛擬機(jī)規(guī)格為12個(gè)CPU、16GB內(nèi)存XXL:虛擬機(jī)規(guī)格為20個(gè)CPU、30GB內(nèi)存S例如:shmodifyVrmNodeMemory.shS回顯如下信息,表示執(zhí)行成功。modifyvrmjavaheapsuccessmodifyOMjavaheapsuccessmodifyPortaljavaheapsuccessmodifygaussdbspecsuccess執(zhí)行以下命令,重啟節(jié)點(diǎn)。reboot配置主備關(guān)系重新安裝VRM節(jié)點(diǎn)后,需要手動(dòng)配置該節(jié)點(diǎn)主備關(guān)系。判斷故障節(jié)點(diǎn)之前是否做過(guò)磁盤(pán)擴(kuò)容操作。是,執(zhí)行步驟37。否,執(zhí)行步驟38。參考為VRM節(jié)點(diǎn)磁盤(pán)進(jìn)行擴(kuò)容(VRM虛擬化部署)中的“為VRM虛擬機(jī)擴(kuò)容”部分,對(duì)磁盤(pán)分區(qū)空間進(jìn)行擴(kuò)容。使用“PuTTY”,登錄之前運(yùn)行正常的VRM節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,停止軟件監(jiān)控進(jìn)程。servicehadstop使用“PuTTY”,登錄新安裝的VRM節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,配置新安裝的VRM節(jié)點(diǎn)為備節(jié)點(diǎn)。sh/opt/galax/gms/common/ha/configHA.sh-mslave-l本節(jié)點(diǎn)管理IP地址-p對(duì)端節(jié)點(diǎn)管理IP地址-L本節(jié)點(diǎn)名稱(chēng)-P對(duì)端節(jié)點(diǎn)名稱(chēng)-f浮動(dòng)IP地址-g仲裁IP地址例如:sh/opt/galax/gms/common/ha/configHA.sh-mslave-l-p-LVRM01-PVRM02-f-g說(shuō)明:仲裁IP地址最多可以配置三個(gè),配置多個(gè)仲裁IP地址時(shí)需要使用英文逗號(hào)隔開(kāi),如:IP1,IP2。如果之前更換過(guò)VRM主備間HA的證書(shū),需要重新更換證書(shū),如果之前更新過(guò)VRM主備間HA加密私鑰口令的密鑰,需要重新更新密鑰,。在之前運(yùn)行正常的VRM節(jié)點(diǎn),執(zhí)行以下命令,判斷該節(jié)點(diǎn)是否為默認(rèn)主節(jié)點(diǎn)。cat/opt/galax/data/ha/hainfo|grepdftmode查看執(zhí)行結(jié)果,dftmode的值是否為primary。是,執(zhí)行步驟50。否,執(zhí)行步驟47。在新安裝的VRM節(jié)點(diǎn)上,執(zhí)行以下命令恢復(fù)默認(rèn)主節(jié)點(diǎn)HA配置。sh/opt/galax/gms/common/ha/InitPrimary.sh回顯“InitHAsuccessfully.”,表示執(zhí)行成功。執(zhí)行如下命令,檢查軟件監(jiān)控進(jìn)程是否運(yùn)行。servicehadstatus是,執(zhí)行步驟50。否,執(zhí)行步驟49。執(zhí)行如下命令,啟動(dòng)軟件監(jiān)控進(jìn)程。servicehadstartFusionCompute的數(shù)據(jù)業(yè)務(wù)是否部署到獨(dú)立的Oracle數(shù)據(jù)庫(kù)?是,執(zhí)行步驟51。否,執(zhí)行步驟53。在新安裝的VRM節(jié)點(diǎn)上,執(zhí)行以下命令切換目錄。cd/opt/galax/vrm/tomcat/script/db_shift執(zhí)行以下命令,切換為oracle數(shù)據(jù)庫(kù)。shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-instance"實(shí)例名"或shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-service"服務(wù)名"其中,“IP地址”:訪問(wèn)Oracle服務(wù)器的IP地址?!岸丝凇保涸L問(wèn)Oracle數(shù)據(jù)庫(kù)的端口號(hào)?!皩?shí)例”或“服務(wù)”:Oracle數(shù)據(jù)庫(kù)中已創(chuàng)建的實(shí)例或服務(wù)。執(zhí)行該命令大約耗時(shí)20秒。顯示如下信息,表示執(zhí)行成功。SwitchDBtoOraclesuccessed!完成后,執(zhí)行步驟53。在之前運(yùn)行正常的VRM節(jié)點(diǎn),執(zhí)行以下命令啟動(dòng)軟件監(jiān)控進(jìn)程。servicehadstart等待約1分鐘,執(zhí)行以下命令,查看主備狀態(tài)。servicehadquery顯示如下信息,表示主備狀態(tài)正常。dNODEROLEPHASERESSVERSTARTNODEROLEPHASERESSVERSTARTha2(VRM02)activeActivednormalV100R001C012014-11-0614:11:27ha1(VRM01)standbyDeactivednormalV100R001C012014-11-0614:10:31說(shuō)明:如果之前更換過(guò)VRM主備HA的證書(shū),需要參考更換VRM主備間HA的認(rèn)證證書(shū)重新更換證書(shū)。如果之前更新過(guò)VRM主備HA加密私鑰口令的密鑰,需要參考更新VRM主備間HA加密私鑰的密鑰重新設(shè)置?;謴?fù)VRM備節(jié)點(diǎn)NTP服務(wù)新安裝的VRM節(jié)點(diǎn)需要執(zhí)行此操作。在FusionCompute上選擇“系統(tǒng)管理>系統(tǒng)配置>時(shí)間管理”,記錄NTP服務(wù)器的IP地址。使用“PuTTY”登錄主VRM節(jié)點(diǎn),并切換至“root”用戶(hù)。執(zhí)行以下命令,獲取時(shí)區(qū)信息。cat/etc/sysconfig/clock|grepTIMEZONE顯示如下信息:TIMEZONE="Asia/Beijing"使用“PuTTY”登錄恢復(fù)后的VRM節(jié)點(diǎn),并切換至“root”用戶(hù)。執(zhí)行以下命令,為恢復(fù)后的VRM節(jié)點(diǎn)配置NTP服務(wù)。perl/opt/galax/gms/common/config/configNtp.pl-ntpipNTP服務(wù)器1的IP地址,NTP服務(wù)器12的IP地址,NTP服務(wù)器12的IP地址-cycle6-timezone時(shí)區(qū)信息-forcetrue例如:perl/opt/galax/gms/common/config/configNtp.pl-ntpip-cycle6-timezoneAsia/Beijing-forcetrue顯示如下信息:excuteconfigNtp.plbegin.Shuttingdownnetworktimeprotocoldaemon(NTPD)excuteconfigNtp.plsuccess修改ftppatchuser帳戶(hù)的密碼如果故障之前已經(jīng)修改過(guò)VRM節(jié)點(diǎn)的ftppatchuser帳戶(hù)的密碼,則需要在VRM節(jié)點(diǎn)恢復(fù)后修改它的ftppatchuser帳戶(hù)密碼,以保證主備VRM節(jié)點(diǎn)的密碼一致。故障之前是否修改過(guò)VRM節(jié)點(diǎn)的ftppatchuser帳戶(hù)的密碼?是,參考修改ftppatchuser帳戶(hù)密碼修改恢復(fù)后的VRM節(jié)點(diǎn)的ftppatchuser帳戶(hù)密碼。否,無(wú)需處理,跳轉(zhuǎn)至下一步。還原主機(jī)配置使用“PuTTY”,登錄備VRM節(jié)點(diǎn)所在的主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,還原VRM監(jiān)控配置。cd/opt/galax/eucalyptus/usr/share/eucalyptusshvrm_monitor.shreset顯示如下信息,表示VRM監(jiān)控配置還原成功。resetVM_RECOVER_TIMEsucceed配置告警上報(bào)和單點(diǎn)登錄功能如果系統(tǒng)已配置單點(diǎn)登錄和告警上報(bào)功能,VRM虛擬機(jī)恢復(fù)后,需重新配置該虛擬機(jī)(另一臺(tái)VRM虛擬機(jī)無(wú)需重新配置)。配置FusionCompute告警上報(bào),配置單點(diǎn)登錄,檢查系統(tǒng)狀態(tài)在FusionCompute中,查看“ALM-15.1002000主備間節(jié)點(diǎn)心跳故障”告警是否已自動(dòng)清除。是,處理完畢。否,聯(lián)系技術(shù)支持。參考信息無(wú)。2.2.2主機(jī)操作系統(tǒng)故障現(xiàn)象描述主機(jī)不能正常登錄或存在“ALM-10.1000027心跳異?!钡母婢?。可能原因主機(jī)的操作系統(tǒng)故障。主機(jī)的硬件故障。定位思路無(wú)。處理步驟排查告警登錄FusionCompute。查看告警列表中是否存在“ALM-10.1000027心跳異?!备婢?。是,執(zhí)行步驟3。否,執(zhí)行步驟5。單擊告警ID,按照彈出的告警幫助進(jìn)行告警恢復(fù)?;謴?fù)完成后,告警是否自動(dòng)清除?是,執(zhí)行步驟18。否,執(zhí)行步驟5。重啟主機(jī)在FusionCompute中,重啟故障主機(jī)。故障主機(jī)是否恢復(fù)?是,執(zhí)行步驟18。否,執(zhí)行步驟7。重新安裝主機(jī)重新安裝主機(jī)的操作系統(tǒng)。安裝完操作系統(tǒng)后,需對(duì)主機(jī)網(wǎng)絡(luò)信息進(jìn)行配置,并確認(rèn)配置的IP地址、主機(jī)名等信息和原主機(jī)保持一致。如果有用戶(hù)虛擬機(jī)使用了該主機(jī)的本地磁盤(pán),則在重裝操作系統(tǒng)時(shí),如果裝在原操作系統(tǒng)所在的磁盤(pán)上,則主機(jī)操作系統(tǒng)的分區(qū)大小必須與重裝之前的大小保持一致,也可以選擇裝在無(wú)用戶(hù)數(shù)據(jù)的新磁盤(pán)上,避免覆蓋用戶(hù)虛擬機(jī)的數(shù)據(jù)。查看原操作系統(tǒng)所在磁盤(pán)的方法:在FusionCompute中,選擇“計(jì)算池”。在左側(cè)導(dǎo)航樹(shù)上選中故障主機(jī),并在右側(cè)選擇“配置>存儲(chǔ)設(shè)備”。列表中顯示該主機(jī)所有存儲(chǔ)設(shè)備。找到磁盤(pán)名稱(chēng)為“xxxxx-part10”的磁盤(pán),則原操作系統(tǒng)所在磁盤(pán)名稱(chēng)為“xxxxx”。安裝主機(jī)時(shí),選擇磁盤(pán)的方法:進(jìn)入主機(jī)配置界面后,選中“Partition”,按“Enter”,即可進(jìn)入選擇磁盤(pán)的界面,如圖1所示。圖1選擇磁盤(pán)恢復(fù)主機(jī)數(shù)據(jù)使用“PuTTY”,登錄VRM主節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理平面浮動(dòng)IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,恢復(fù)主機(jī)配置。cd/opt/galax/vrm/tomcat/script/hostpowerscriptshhostfaultrestore.sh根據(jù)界面提示,輸入故障主機(jī)的管理平面IP地址和gesysman帳號(hào)的密碼,密碼為GeEnginE@123。例如:VRM01:/opt#cd/opt/galax/vrm/tomcat/script/hostpowerscriptVRM01:/opt/galax/vrm/tomcat/script/hostpowerscript#shhostfaultrestore.shPleaseinputhostIP:Pleaseinputpasswordofgesysman:顯示如下信息時(shí),表示數(shù)據(jù)恢復(fù)成功。Isbeingrestored,pleasewait...hostfaultrestoresuccess.說(shuō)明:重新安裝的CNA版本必須與故障前保持一致,如不一致,請(qǐng)重新安裝或者升級(jí)到相同版本。恢復(fù)命令不能重復(fù)執(zhí)行,如果執(zhí)行失敗,請(qǐng)?jiān)谂懦龁?wèn)題后重新安裝操作系統(tǒng),進(jìn)行數(shù)據(jù)恢復(fù)操作。如果無(wú)法排除問(wèn)題,請(qǐng)聯(lián)系技術(shù)支持。恢復(fù)多路徑數(shù)據(jù)當(dāng)使用的是華為的存儲(chǔ)設(shè)備時(shí),需要手動(dòng)對(duì)多路徑信息進(jìn)行恢復(fù)。當(dāng)前使用的存儲(chǔ)設(shè)備是否為華為的存儲(chǔ)設(shè)備?是,執(zhí)行步驟13。否,執(zhí)行步驟18。使用“PuTTY”,登錄主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,恢復(fù)多路徑信息。/opt/uvp/multipath/change_multipath_mode.sh1執(zhí)行以下命令,重啟主機(jī)。reboot啟動(dòng)管理虛擬機(jī)被恢復(fù)的主機(jī)是否是VRM、FusionManager、FusionStorageManager等管理虛擬機(jī)所在主機(jī)?是,執(zhí)行步驟19。否,處理完畢。在FusionCompute中,查看VRM、FusionManager、FusionStorageManager等管理虛擬機(jī)的狀態(tài)是否均為“運(yùn)行中”。是,執(zhí)行步驟21。否,執(zhí)行步驟20。啟動(dòng)未運(yùn)行的管理虛擬機(jī)。備份VRM數(shù)據(jù)若未重新安裝主機(jī)的操作系統(tǒng),無(wú)需執(zhí)行該操作。在FusionCompute中,查看并記錄該主機(jī)上運(yùn)行的VRM虛擬機(jī)ID。例如,VRM虛擬機(jī)的ID為“i-00000001”。使用“PuTTY”,登錄VRM主節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理平面浮動(dòng)IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,查看VRM節(jié)點(diǎn)配置文件的名稱(chēng)。cd/etc/galax/vm_xmlll說(shuō)明:“VRM節(jié)點(diǎn)配置文件”的格式為“VRM虛擬機(jī)ID.xml”。VRM節(jié)點(diǎn)配置文件保存在VRM默認(rèn)主節(jié)點(diǎn)上,如果當(dāng)前主節(jié)點(diǎn)沒(méi)有該配置文件,請(qǐng)登錄另一個(gè)VRM節(jié)點(diǎn)獲取。執(zhí)行以下命令,將運(yùn)行在該主機(jī)上的VRM節(jié)點(diǎn)的配置文件拷貝到該主機(jī)上。scpxml文件的名稱(chēng)gandalf@主機(jī)的IP地址:/home/GalaX8800例如:scpi-00000001.xmlgandalf@0:/home/GalaX8800輸入“yes”,保存配置。按照界面提示輸入主機(jī)操作系統(tǒng)密碼。說(shuō)明:主機(jī)操作系統(tǒng)gandalf用戶(hù)的默認(rèn)密碼為“Huawei@CLOUD8”。使用“PuTTY”,登錄主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,進(jìn)入“/home/GalaX8800”目錄。cd/home/GalaX8800執(zhí)行以下命令,將配置文件拷貝至“/etc/galax/eucalyptus”目錄。cpxml文件的名稱(chēng)/etc/galax/eucalyptus例如:cpi-00000001.xml/etc/galax/eucalyptus參考信息無(wú)。2.2.3VRM虛擬機(jī)本地存儲(chǔ)雙盤(pán)故障操作場(chǎng)景該任務(wù)指導(dǎo)維護(hù)工程師對(duì)VRM虛擬機(jī)和FusionCompute主機(jī)操作系統(tǒng)所屬的兩塊組為RAID1的磁盤(pán)同時(shí)故障時(shí)的恢復(fù)操作。對(duì)系統(tǒng)的影響VRM管理單節(jié)點(diǎn)故障,可能會(huì)發(fā)生主備倒換。必備事項(xiàng)前提條件已獲取VRM節(jié)點(diǎn)的浮動(dòng)IP地址以及gandalf用戶(hù)和root用戶(hù)的密碼。已獲取VRM節(jié)點(diǎn)數(shù)據(jù)庫(kù)galax用戶(hù)的密碼。已登錄FusionCompute。已獲取PuTTY工具(獲取途徑:/)。已獲取WinSCP工具(獲取途徑:/)。操作步驟記錄故障信息并更換故障硬盤(pán)在FusionCompute中,記錄以下故障信息。故障硬盤(pán)上運(yùn)行的VRM虛擬機(jī)的ID,例如:i-00000001。查看VRM虛擬機(jī)的ID的路徑為:“虛擬機(jī)和模板>虛擬機(jī)”。故障硬盤(pán)所對(duì)應(yīng)的數(shù)據(jù)存儲(chǔ)的名稱(chēng),例如:autoDS01。查看數(shù)據(jù)存儲(chǔ)名稱(chēng)的路徑為:“存儲(chǔ)池>數(shù)據(jù)存儲(chǔ)”。更換故障的兩塊本地硬盤(pán),并且為更換后的硬盤(pán)重新創(chuàng)建RAID組。修改數(shù)據(jù)存儲(chǔ)的關(guān)聯(lián)狀態(tài)使用“PuTTY”,登錄主VRM。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,修改數(shù)據(jù)存儲(chǔ)的關(guān)聯(lián)狀態(tài)。sh/opt/galax/vrm/tomcat/script/brm/mod_ds_status.sh"數(shù)據(jù)存儲(chǔ)的名稱(chēng)"例如:sh/opt/galax/vrm/tomcat/script/brm/mod_ds_status.sh"datastore"刪除故障硬盤(pán)上的虛擬機(jī)和邏輯磁盤(pán)執(zhí)行以下命令,修改VRM虛擬機(jī)的操作權(quán)限。說(shuō)明:系統(tǒng)默認(rèn)VRM虛擬機(jī)不允許刪除,所以需要修改VRM虛擬機(jī)的操作權(quán)限,才可以在FusionCompute中刪除故障硬盤(pán)上運(yùn)行的VRM虛擬機(jī)。sh/opt/galax/vrm/tomcat/script/OpenRights.sh故障硬盤(pán)上VRM虛擬機(jī)ID根據(jù)界面提示,輸入VRM數(shù)據(jù)庫(kù)的密碼,默認(rèn)密碼為“SingleLOUD!1”。提示以下信息說(shuō)明權(quán)限修改成功。OpenVMoperatingauthoritysucceed在FusionCompute中,刪除故障硬盤(pán)上的虛擬機(jī)和邏輯磁盤(pán)。故障硬盤(pán)上的虛擬機(jī)和邏輯磁盤(pán)可以通過(guò)以下路徑查詢(xún)。虛擬機(jī):“存儲(chǔ)池>數(shù)據(jù)存儲(chǔ)名稱(chēng)>虛擬機(jī)”邏輯磁盤(pán):“存儲(chǔ)池>數(shù)據(jù)存儲(chǔ)名稱(chēng)>磁盤(pán)”故障硬盤(pán)對(duì)應(yīng)數(shù)據(jù)存儲(chǔ)上的虛擬機(jī)和裸機(jī)磁盤(pán)刪除后,在FusionCompute中刪除該數(shù)據(jù)存儲(chǔ)。重新安裝主機(jī)重新安裝主機(jī)的操作系統(tǒng)。安裝完操作系統(tǒng)后,需對(duì)主機(jī)網(wǎng)絡(luò)信息進(jìn)行配置,并確認(rèn)配置的IP地址、主機(jī)名等信息和原主機(jī)保持一致。如果有用戶(hù)虛擬機(jī)使用了該主機(jī)的本地磁盤(pán),則在重裝操作系統(tǒng)時(shí),要將操作系統(tǒng)安裝在原操作系統(tǒng)所在磁盤(pán)或是無(wú)用戶(hù)數(shù)據(jù)的新磁盤(pán)上,避免覆蓋用戶(hù)虛擬機(jī)的數(shù)據(jù)。查看原操作系統(tǒng)所在磁盤(pán)的方法:在FusionCompute中,選擇“計(jì)算池”。在左側(cè)導(dǎo)航樹(shù)上選中故障主機(jī),并在右側(cè)選擇“配置>存儲(chǔ)設(shè)備”。列表中顯示該主機(jī)所有存儲(chǔ)設(shè)備。找到磁盤(pán)名稱(chēng)為“xxxxx-part10”的磁盤(pán),則原操作系統(tǒng)所在磁盤(pán)名稱(chēng)為“xxxxx”。安裝主機(jī)時(shí),選擇磁盤(pán)的方法:進(jìn)入主機(jī)配置界面后,選中“Partition”,按“Enter”,即可進(jìn)入選擇磁盤(pán)的界面,如圖1所示。圖1選擇磁盤(pán)

恢復(fù)主機(jī)數(shù)據(jù)使用“PuTTY”,登錄VRM主節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理平面浮動(dòng)IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,恢復(fù)主機(jī)配置。cd/opt/galax/vrm/tomcat/script/hostpowerscriptshhostfaultrestore.sh根據(jù)界面提示,輸入故障主機(jī)的管理平面IP地址和gesysman帳號(hào)的密碼。例如:VRM01:/opt#cd/opt/galax/vrm/tomcat/script/hostpowerscriptVRM01:/opt/galax/vrm/tomcat/script/hostpowerscript#shhostfaultrestore.shPleaseinputhostIP:Pleaseinputpasswordofgesysman:顯示如下信息時(shí),表示數(shù)據(jù)恢復(fù)成功。Isbeingrestored,pleasewait...hostfaultrestoresuccess.說(shuō)明:恢復(fù)命令不能重復(fù)執(zhí)行,如果執(zhí)行失敗,請(qǐng)?jiān)谂懦龁?wèn)題后重新安裝操作系統(tǒng),進(jìn)行數(shù)據(jù)恢復(fù)操作?;謴?fù)多路徑數(shù)據(jù)當(dāng)使用的是華為的存儲(chǔ)設(shè)備時(shí),需要手動(dòng)對(duì)多路徑信息進(jìn)行恢復(fù)。使用“PuTTY”,登錄主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,恢復(fù)多路徑信息。/opt/uvp/multipath/change_multipath_mode.sh1執(zhí)行以下命令,重啟主機(jī)。reboot掃描并添加數(shù)據(jù)存儲(chǔ)在FusionCompute中,進(jìn)入故障硬盤(pán)所在主機(jī)的配置頁(yè)面,掃描并添加數(shù)據(jù)存儲(chǔ)。重新創(chuàng)建并安裝VRM虛擬機(jī)在FusionCompute中,根據(jù)當(dāng)前正常運(yùn)行的VRM虛擬機(jī)規(guī)格,通過(guò)模板導(dǎo)入方式重新創(chuàng)建一個(gè)VRM虛擬機(jī),創(chuàng)建的VRM虛擬機(jī)名稱(chēng)需與原故障VRM虛擬機(jī)一致。且其所有的虛擬機(jī)設(shè)置、虛擬機(jī)屬性規(guī)格以及IP地址、主機(jī)名和用戶(hù)密碼均需要與原來(lái)的VRM虛擬機(jī)保持一致。說(shuō)明:重新安裝的VRM版本必須與故障前保持一致,如不一致,請(qǐng)重新安裝或者升級(jí)到相同版本?;謴?fù)VRM虛擬機(jī)的規(guī)格說(shuō)明:故障前VRM虛擬機(jī)的規(guī)格,可在FusionCompute中VRM虛擬機(jī)的“硬件”頁(yè)簽中查詢(xún)。使用“PuTTY”,登錄新安裝的VRM節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止“PuTTY”超時(shí)退出。TMOUT=0執(zhí)行以下命令,進(jìn)入/opt/galax/vrm/tomcat/script目錄。cd/opt/galax/vrm/tomcat/script/執(zhí)行以下命令,運(yùn)行配置腳本。shmodifyVrmNodeMemory.sh命令參數(shù)命令參數(shù)的取值范圍如下:表1管理虛擬機(jī)配置腳本數(shù)據(jù)參數(shù)說(shuō)明取值樣例命令參數(shù)虛擬機(jī)規(guī)格的參數(shù)。取值范圍:S:虛擬機(jī)規(guī)格為2個(gè)CPU、3GB內(nèi)存M:虛擬機(jī)規(guī)格為4個(gè)CPU、5GB內(nèi)存L:虛擬機(jī)規(guī)格為8個(gè)CPU、8GB內(nèi)存XL:虛擬機(jī)規(guī)格為12個(gè)CPU、16GB內(nèi)存XXL:虛擬機(jī)規(guī)格為20個(gè)CPU、30GB內(nèi)存S例如:shmodifyVrmNodeMemory.shS回顯如下信息,表示執(zhí)行成功。modifyvrmjavaheapsuccessmodifyOMjavaheapsuccessmodifyPortaljavaheapsuccessmodifygaussdbspecsuccess執(zhí)行以下命令,重啟節(jié)點(diǎn)。reboot配置主備關(guān)系重新安裝VRM節(jié)點(diǎn)后,需要手動(dòng)配置該節(jié)點(diǎn)主備關(guān)系。判斷故障節(jié)點(diǎn)之前是否做過(guò)磁盤(pán)擴(kuò)容操作。是,執(zhí)行步驟29。否,執(zhí)行步驟31。參考為VRM節(jié)點(diǎn)磁盤(pán)進(jìn)行擴(kuò)容(VRM虛擬化部署)的“為VRM虛擬機(jī)綁定新磁盤(pán)”部分,為VRM虛擬機(jī)綁定新磁盤(pán)。參考為VRM節(jié)點(diǎn)磁盤(pán)進(jìn)行擴(kuò)容(VRM虛擬化部署)的“為VRM虛擬機(jī)擴(kuò)容”部分,對(duì)磁盤(pán)分區(qū)空間進(jìn)行擴(kuò)容。使用“PuTTY”,登錄之前運(yùn)行正常的VRM節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,停止軟件監(jiān)控進(jìn)程。servicehadstop使用“PuTTY”,登錄新安裝的VRM節(jié)點(diǎn)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,配置新安裝的VRM節(jié)點(diǎn)為備節(jié)點(diǎn)。sh/opt/galax/gms/common/ha/configHA.sh-mslave-l本節(jié)點(diǎn)管理IP地址-p對(duì)端節(jié)點(diǎn)管理IP地址-L本節(jié)點(diǎn)名稱(chēng)-P對(duì)端節(jié)點(diǎn)名稱(chēng)-f浮動(dòng)IP地址-g仲裁IP地址例如:sh/opt/galax/gms/common/ha/configHA.sh-mslave-l-p-LVRM01-PVRM02-f-g說(shuō)明:仲裁IP地址最多可以配置三個(gè),配置多個(gè)仲裁IP地址時(shí)需要使用英文逗號(hào)隔開(kāi),如:IP1,IP2。如果之前更換過(guò)VRM主備間HA的證書(shū),需要重新更換證書(shū),如果之前更新過(guò)VRM主備間HA加密私鑰口令的密鑰,需要重新更新密鑰,。在之前運(yùn)行正常的VRM節(jié)點(diǎn),執(zhí)行以下命令,判斷該節(jié)點(diǎn)是否為默認(rèn)主節(jié)點(diǎn)。cat/opt/galax/data/ha/hainfo|grepdftmode查看執(zhí)行結(jié)果,dftmode的值是否為primary。是,執(zhí)行步驟43。否,執(zhí)行步驟40。在新安裝的VRM節(jié)點(diǎn)上,執(zhí)行以下命令恢復(fù)默認(rèn)主節(jié)點(diǎn)HA配置。sh/opt/galax/gms/common/ha/InitPrimary.sh回顯“InitHAsuccessfully.”,表示執(zhí)行成功。執(zhí)行如下命令,檢查軟件監(jiān)控進(jìn)程是否運(yùn)行。servicehadstatus是,執(zhí)行步驟43。否,執(zhí)行步驟42。執(zhí)行如下命令,啟動(dòng)軟件監(jiān)控進(jìn)程。servicehadstartFusionCompute的數(shù)據(jù)業(yè)務(wù)是否部署到獨(dú)立的Oracle數(shù)據(jù)庫(kù)?是,執(zhí)行步驟44。否,執(zhí)行步驟46。在新安裝的VRM節(jié)點(diǎn)上,執(zhí)行以下命令切換目錄。cd/opt/galax/vrm/tomcat/script/db_shift執(zhí)行以下命令,切換為oracle數(shù)據(jù)庫(kù)。shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-instance"實(shí)例名"或shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-service"服務(wù)名"其中,“IP地址”:訪問(wèn)Oracle服務(wù)器的IP地址?!岸丝凇保涸L問(wèn)Oracle數(shù)據(jù)庫(kù)的端口號(hào)?!皩?shí)例”或“服務(wù)”:Oracle數(shù)據(jù)庫(kù)中已創(chuàng)建的實(shí)例或服務(wù)。執(zhí)行該命令大約耗時(shí)20秒。顯示如下信息,表示執(zhí)行成功。SwitchDBtoOraclesuccessed!完成后,執(zhí)行步驟46。在之前運(yùn)行正常的VRM節(jié)點(diǎn),執(zhí)行以下命令啟動(dòng)軟件監(jiān)控進(jìn)程。servicehadstart等待約1分鐘,執(zhí)行以下命令,查看主備狀態(tài)。servicehadquery顯示如下信息,表示主備狀態(tài)正常。dNODEROLEPHASERESSVERSTARTNODEROLEPHASERESSVERSTARTha2(VRM02)activeActivednormalV100R001C012014-11-0614:11:27ha1(VRM01)standbyDeactivednormalV100R001C012014-11-0614:10:31恢復(fù)其他管理虛擬機(jī)若該故障磁盤(pán)上有其他的管理虛擬機(jī),例如FusionManager,則參考對(duì)應(yīng)產(chǎn)品的產(chǎn)品文檔進(jìn)行管理虛擬機(jī)的恢復(fù)。配置VRM虛擬機(jī)隨主機(jī)啟動(dòng)屬性在主VRM上執(zhí)行以下命令。sh/opt/galax/vrm/tomcat/script/configVRM.sh按照提示依次輸入當(dāng)前的新創(chuàng)建的VRM虛擬機(jī)ID,VRM數(shù)據(jù)庫(kù)密碼。默認(rèn)密碼為“SingleLOUD!1”。執(zhí)行以下命令,重啟VRM進(jìn)程。servicevrmdrestart使用“PuTTY”,登錄新創(chuàng)建的VRM。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止“PuTTY”超時(shí)退出。TMOUT=0執(zhí)行以下命令,關(guān)閉新創(chuàng)建的VRM虛擬機(jī)。halt在FusionCompute上,選擇“虛擬機(jī)和模板>虛擬機(jī)”,在虛擬機(jī)列表中啟動(dòng)新創(chuàng)建的VRM虛擬機(jī),使配置生效。關(guān)閉新創(chuàng)建VRM虛擬機(jī)的操作權(quán)限使用“PuTTY”,登錄主VRM虛擬機(jī)。以“gandalf”用戶(hù),通過(guò)浮動(dòng)IP地址登錄。系統(tǒng)同時(shí)支持密碼和公私鑰對(duì)進(jìn)行身份認(rèn)證,如果使用公私鑰對(duì)進(jìn)行登錄認(rèn)證,執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止“PuTTY”超時(shí)退出。TMOUT=0執(zhí)行以下命令,關(guān)閉修改VRM節(jié)點(diǎn)的權(quán)限。sh/opt/galax/vrm/tomcat/script/CloseRights.sh新創(chuàng)建VRM虛擬機(jī)的ID顯示如下信息:Pleaseimportdatabasepassword:按照提示輸入VRM數(shù)據(jù)庫(kù)密碼。默認(rèn)密碼為“SingleLOUD!1”。生成新創(chuàng)建VRM虛擬機(jī)的配置文件在VRM主節(jié)點(diǎn)上,執(zhí)行以下命令,生成新創(chuàng)建VRM虛擬機(jī)的配置文件。perl/opt/galax/vrm/tomcat/script/vrmWindowsInstall/bin/importVrmDb.pl-g-i新創(chuàng)建VRM虛擬機(jī)的ID虛擬機(jī)ID輸入新創(chuàng)建VRM虛擬機(jī)的ID,配置文件的格式為“新創(chuàng)建VRM虛擬機(jī)的ID.xml”,生成的配置文件保存在“/home”目錄下。執(zhí)行以下命令,將新創(chuàng)建VRM虛擬機(jī)的配置文件拷貝到其運(yùn)行的主機(jī)上。scpxml文件的名稱(chēng)gandalf@主機(jī)的IP地址:/home/GalaX8800/例如:scp/home/i-00000002.xmlgandalf@:/home/GalaX8800/按照界面提示輸入主機(jī)操作系統(tǒng)密碼。使用“PuTTY”登錄新創(chuàng)建VRM虛擬機(jī)所在的主機(jī),并切換至“root”用戶(hù)。執(zhí)行以下命令,防止“PuTTY”超時(shí)退出。TMOUT=0執(zhí)行如下命令,將新創(chuàng)建VRM虛擬機(jī)的配置文件移動(dòng)至“/etc/galax/eucalyptus/”目錄下。mv/home/GalaX8800/xml文件的名稱(chēng)/etc/galax/eucalyptus/例如:mv/home/GalaX8800/i-00000002.xml/etc/galax/eucalyptus/(可選)若主機(jī)操作系統(tǒng)安裝在U盤(pán),則執(zhí)行以下命令,持久化新創(chuàng)建VRM虛擬機(jī)的配置文件。uvp_configer_bakup-uGE-a/etc/galax/eucalyptus/xml文件的名稱(chēng)例如:uvp_configer_bakup-uGE-a/etc/galax/eucalyptus/i-00000002.xml配置新創(chuàng)建VRM虛擬機(jī)的NTP服務(wù)在FusionCompute上選擇“系統(tǒng)管理>系統(tǒng)配置>時(shí)間管理”,查看系統(tǒng)是否配置了NTP服務(wù)器。是,記錄NTP服務(wù)器的IP地址后,執(zhí)行步驟69。否,執(zhí)行步驟73。使用“PuTTY”登錄主VRM虛擬機(jī),并切換至“root”用戶(hù)。執(zhí)行以下命令,獲取時(shí)區(qū)信息。cat/etc/sysconfig/clock|grepTIMEZONE顯示如下信息:TIMEZONE="Asia/Beijing"使用“PuTTY”登錄新創(chuàng)建VRM虛擬機(jī),并切換至“root”用戶(hù)。執(zhí)行以下命令,配置新創(chuàng)建VRM虛擬機(jī)的NTP服務(wù)。perl/opt/galax/gms/common/config/configNtp.pl-ntpipNTP服務(wù)器1的IP地址,NTP服務(wù)器12的IP地址,NTP服務(wù)器12的IP地址-cycle6-timezone時(shí)區(qū)信息-forcetrue例如:perl/opt/galax/gms/common/config/configNtp.pl-ntpip-cycle6-timezoneAsia/Beijing-forcetrue顯示如下信息:excuteconfigNtp.plbegin.Shuttingdownnetworktimeprotocoldaemon(NTPD)excuteconfigNtp.plsuccess配置FusionCompute告警上報(bào)和單點(diǎn)登錄FusionSphere場(chǎng)景時(shí),在新安裝的VRM上配置FusionCompute告警上報(bào)和單點(diǎn)登錄,具體方法請(qǐng)參考配置FusionCompute告警上報(bào)與配置單點(diǎn)登錄。2.2.4VRM虛擬機(jī)關(guān)機(jī)后無(wú)法啟動(dòng)現(xiàn)象描述當(dāng)主備VRM虛擬機(jī)由于人為或者系統(tǒng)內(nèi)部異常原因,同時(shí)被下電后,致使依賴(lài)其運(yùn)行的FusionCompute服務(wù)異常,無(wú)法重新啟動(dòng)VRM虛擬機(jī)??赡茉蛟贔usionCompute中對(duì)虛擬機(jī)執(zhí)行關(guān)機(jī)操作。在VRM虛擬機(jī)上執(zhí)行關(guān)機(jī)命令。VRM操作系統(tǒng)異常引發(fā)VRM自動(dòng)關(guān)機(jī)。處理步驟使用“PuTTY”,登錄VRM節(jié)點(diǎn)所在主機(jī)。以“gandalf”用戶(hù),通過(guò)管理IP地址登錄。執(zhí)行以下命令,并按提示輸入“root”用戶(hù)的密碼,切換至“root”用戶(hù)。su-root執(zhí)行以下命令,防止系統(tǒng)超時(shí)退出。TMOUT=0執(zhí)行以下命令,查看以虛擬機(jī)id開(kāi)頭的xml文件,查找虛擬機(jī)id。ll/etc/galax/eucalyptus執(zhí)行以下命令,使用NCclient工具啟動(dòng)虛擬機(jī)/opt/galax/NCclientncStartInstances虛擬機(jī)ID例如:/opt/galax/NCclientncStartInstancesi-00000001說(shuō)明:該命令僅用于主備VRM都關(guān)機(jī)的場(chǎng)景。通過(guò)命令可以啟動(dòng)一個(gè)VRM虛擬機(jī),另一個(gè)VRM虛擬機(jī)需要通過(guò)FusionCompute啟動(dòng)。2.3FusionManager管理節(jié)點(diǎn)故障2.3.1修改FusionManager管理IP地址導(dǎo)致FusionManager連接異常現(xiàn)象描述修改FusionManager管理IP地址后,出現(xiàn)以下故障現(xiàn)象,需要參考本故障處理操作,使業(yè)務(wù)快速恢復(fù)正常。無(wú)法登錄FusionManager界面。無(wú)法ping通FusionManager管理IP地址??赡茉蛐碌腇usionManager管理IP地址不可用。FusionManager管理IP地址未配置成功。定位思路無(wú)。處理步驟檢查網(wǎng)絡(luò),確保新的FusionManager管理IP地址網(wǎng)絡(luò)正常,IP地址可用。說(shuō)明:若要修改FusionManager的網(wǎng)關(guān)地址,需要根據(jù)組網(wǎng)情況,同步修改管理平面的其他網(wǎng)絡(luò)配置。例如,相關(guān)物理設(shè)備上配置的網(wǎng)關(guān)地址。使用VNC方式,以“galaxmanager”用戶(hù)登錄FusionManager節(jié)點(diǎn)。執(zhí)行以下命令,查看當(dāng)前FusionManager管理IP地址是否為正確的新的管理IP地址。ifconfig是,請(qǐng)聯(lián)系技術(shù)支持。否,執(zhí)行步驟4。重新手動(dòng)配置FusionManager管理IP地址,具體操作方法請(qǐng)參考配置FusionManager。參考信息無(wú)。2.3.2修改VSAM管理IP地址導(dǎo)致VSAM連接異?,F(xiàn)象描述修改VSAM管理IP地址后,出現(xiàn)以下故障現(xiàn)象,需要參考本故障處理操作,使業(yè)務(wù)快速恢復(fù)正常。VSAM連接狀態(tài)異常。無(wú)法ping通VSAM管理IP地址??赡茉蛐碌腣SAM管理IP地址不可用。VSAM管理IP地址未配置成功。定位思路無(wú)。處理步驟在FusionCompute上,通過(guò)VNC登錄VSAM節(jié)點(diǎn)虛擬機(jī)。VSAM節(jié)點(diǎn)為主備部署時(shí),先登錄VSAM主節(jié)點(diǎn)進(jìn)行操作。以“root”用戶(hù)登錄后,執(zhí)行以下命令,查看并記錄管理網(wǎng)卡的IP地址。ifconfig-a執(zhí)行以下命令,使用vi編輯器編輯打開(kāi)文件。vi/opt/omm/ha/module/harm/plugin/conf/mngrFloatIp.xml按“i”進(jìn)入編輯模式,修改“primaryIp”的值為步驟2中記錄的IP地址。如果“primaryIp”已經(jīng)是步驟2中記錄的IP地址,無(wú)需進(jìn)行操作。按“ESC”,輸入:wq,保存并退出。執(zhí)行如下命令,清除路由信息。echo>/etc/sysconfig/network/routes執(zhí)行以下命令,修改VSAM節(jié)點(diǎn)的管理IP地址。sh/opt/galax/gms/common/modsysinfo/modifyMgntIP.shPrimaryIPSecondaryIPFloatIPFM_IPNetmaskGateway“PrimaryIP”:待修改的VSAM主節(jié)點(diǎn)管理IP地址。VSAM單節(jié)點(diǎn)部署時(shí),設(shè)置為VSAM節(jié)點(diǎn)管理IP地址?!癝econdaryIP”:待修改的VSAM備節(jié)點(diǎn)管理IP地址。VSAM單節(jié)點(diǎn)部署時(shí),設(shè)置為VSAM節(jié)點(diǎn)管理IP地址?!癋loatIP”:待修改的VSAM節(jié)點(diǎn)浮動(dòng)IP地址。VSAM單節(jié)點(diǎn)部署時(shí),設(shè)置為VSAM節(jié)點(diǎn)管理IP地址?!癋M_IP”:如果VSAM未接入FusionManager,設(shè)置為“”;如果VSAM已接入FusionManager,設(shè)置為FusionManager的浮動(dòng)IP地址。“Netmask”:待修改的IP地址所在網(wǎng)段的子網(wǎng)掩碼?!癎ateway”:待修改的IP地址所在網(wǎng)段的網(wǎng)關(guān)。示例:sh/opt/galax/gms/common/modsysinfo/modifyMgntIP.sh120執(zhí)行如下命令,重新配置VSAM的網(wǎng)關(guān)。echo"default待修改的IP地址所在網(wǎng)段的網(wǎng)關(guān)--">/etc/sysconfig/network/routesservicenetworkrestart示例:echo"default--">/etc/sysconfig/network/routesservicenetworkrestartVSAM節(jié)點(diǎn)主備部署時(shí),參考步驟1~步驟8,登錄VSAM備節(jié)點(diǎn)進(jìn)行操作。在VSAM主節(jié)點(diǎn)上,執(zhí)行以下命令,登錄數(shù)據(jù)庫(kù)。psql-Ugalaxvsam數(shù)據(jù)庫(kù)默認(rèn)密碼為“SingleLOUD!1”。執(zhí)行以下命令,查詢(xún)所有VSA虛擬機(jī)信息。select*fromtbl_vsa;回顯信息示例如下:VSA_ID|ADMIN_STATE|DESCRIPTION|IP_ADDRESS|NAME|STATUS+++++000000004f78889b014f788b22d00000|t|VSA91|1|VS

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論