版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、資料編碼產(chǎn)品名稱IBM小型機(jī)使用對象產(chǎn)品版本編寫部門資料版本P55A小型機(jī)故障基本定位方法擬 制:日 期:審 核:日 期:審 核:日 期:批 準(zhǔn):日 期:版權(quán)所有 侵權(quán)必究修訂記錄日期修訂版本描述作者目 錄第1章 故障的定義 1第2章 故障信息的收集 12.1 收集故障信息對于判斷診斷故障原因修復(fù)系統(tǒng)非常重要 12.2 系統(tǒng)故障記錄(errorlog 12.3 控制面板上的LED 代碼 32.4 SMS (System Management Service 故障記錄 42.5 MAIL 42.6 運(yùn)行故障診斷程序(Diagnostic 對系統(tǒng)硬件進(jìn)行檢查和診斷 42.7 其他用于收集系統(tǒng)信息的
2、命令 4第3章 硬件故障定位方法 73.1 IPL 流程 73.2 系統(tǒng)的啟動順序: 73.3 系統(tǒng)不能啟動 83.4 系統(tǒng)停在551555或557 83.5 CDE圖形界面掛死 93.6 系統(tǒng)dump 10第4章 7133-D40SSA磁盤柜的故障定位 11第5章 軟件故障定位方法 125.1 文件系統(tǒng)空間不夠 125.2 檢查文件系統(tǒng)的完整性 135.3 查看卷組信息(lsvg-lvg_name 135.4 檢查內(nèi)存交換區(qū)(pagingspace使用率(lsps-s 135.5 小型機(jī)內(nèi)存泄漏問題 13第6章 常用的系統(tǒng)狀態(tài)查詢命令 15第7章 網(wǎng)絡(luò)故障定位方法 167.1 網(wǎng)絡(luò)不通的診斷
3、過程 167.2 網(wǎng)絡(luò)配置的基本方法 16第8章 HACMP環(huán)境下的排錯(cuò) 168.1 了解問題的存在 178.2 判斷問題的出處 17第9章 附常用命令列表 19關(guān)鍵詞:故障處理 IBM AIX HACMP摘 要:縮略語清單:參考資料清單:第1章 故障的定義根據(jù)以下這些方面來考慮故障定位:弄清楚系統(tǒng)發(fā)生了什么問題系統(tǒng)現(xiàn)在能做什么不能做什么故障什么時(shí)候發(fā)生的有沒有做平時(shí)不同的操作故障有沒有規(guī)律定時(shí)還是不定時(shí)發(fā)生的頻率有多高是一臺機(jī)器出現(xiàn)故障還是多臺機(jī)器故障故障現(xiàn)象是否相同最近有沒有做改動如安裝了新的硬件軟件改變了系統(tǒng)的一些設(shè)置第2章 故障信息的收集2.1 收集故障信息對于判斷診斷故障原因修復(fù)系統(tǒng)
4、非常重要2.2 系統(tǒng)故障記錄(errorlogerrdemon 進(jìn)程在系統(tǒng)啟動時(shí)自動運(yùn)行記錄包括硬件軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog 可備份下來或拷貝到別的機(jī)器上分析errpt 命令的使用(普通用戶權(quán)限也可使用#errpt |more 列出簡短出錯(cuò)信息ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION192AC071 0723100300 T 0 errdemon Error logging turned off0E017ED1 0720131000 P H mem2 Memory failure9
5、DBCFDEE 0701000000 T 0 errdemon Error logging turned on038F2580 0624131000 U H scdisk0 UNDETERMINED ERRORAA8AB241 0405130900 T O OPERATOR OPERATOR NOTIFICATIONTIMESTAMP: MMDDHHMMYY (月日時(shí)分年T 類型: P 永久; T 臨時(shí); U 未知永久性的錯(cuò)誤應(yīng)引起重視C 分類: H 硬件; S 軟件; O 用戶; U未知#errpt -d H 列出所有硬件出錯(cuò)信息#errpt -d S 列出所有軟件出錯(cuò)信息#errpt -a
6、j ERROR_ID 列出詳細(xì)出錯(cuò)信息# errpt -aj 0502f666 <- ERROR_ID用大小寫均可例LABEL: SCSI_ERR1ID: 0502F666Date/Time: Jun 19 22:29:51Sequence Number: 95Machine ID: 123456789012Node ID: host1Class: HType: PERMResource Name: scsi0Resource Class: adapterResource Type: hscsiLocation: 00-08VPD: <- Virtal Product DataDe
7、vice Driver Level00Diagnostic Level00Displayable MessageSCSIEC LevelC25928FRU Number30F8834ManufacturerIBM97FPart Number59F4566Serial Number00002849ROS Level and ID24Read/Write Register Ptr0120DescriptionADAPTER ERRORProbable CausesADAPTER HARDWARE CABLECABLE TERMINATOR DEVICEFailure CausesADAPTERCA
8、BLE LOOSE OR DEFECTIVERecommended ActionsPERFORM PROBLEM DETERMINATION PROCEDURESCHECK CABLE AND ITS CONNECTIONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 00002.3 控制面板上的LED 代碼8 位代碼通常系統(tǒng)故障燈會同時(shí)亮起某些機(jī)型還會同時(shí)顯示故障設(shè)備位置代碼4 位代碼通常是Exxx3 位代碼通常為0yyy 只看后3位8 位和4位代碼可查看系統(tǒng)服務(wù)手冊(Service G
9、uide3 位代碼可查看系統(tǒng)診斷手冊(Diagnostic Information for Multiple BusSystem閃動的888, 系統(tǒng)崩潰硬件或軟件原因造成按reset 鍵會顯示更多內(nèi)容888-102 一般為軟件故障888-102-207 例外系統(tǒng)會產(chǎn)生一個(gè)dump888-102-xxx-0C9 系統(tǒng)正在做dump, 請等待888-102-xxx-0C0 系統(tǒng)dump完成可關(guān)電重啟888-103 或105硬件故障一般有SRN 代碼及位置代碼2.4 SMS (System Management Service 故障記錄如何進(jìn)入SMS 菜單當(dāng)主控臺出現(xiàn)鍵盤圖標(biāo)后(LED 顯示E1F1
10、時(shí)按1鍵選擇"Utilities"選擇"Error Log", 抄下8位故障代碼在SMS 中還可以更改系統(tǒng)啟動順序表2.5 MAIL#mail系統(tǒng)會向root用戶發(fā)mail報(bào)告出錯(cuò)信息通常系統(tǒng)出現(xiàn)故障后沒有進(jìn)行檢查修復(fù)系統(tǒng)會定時(shí)提醒root2.6 運(yùn)行故障診斷程序(Diagnostic 對系統(tǒng)硬件進(jìn)行檢查和診斷當(dāng)發(fā)現(xiàn)有硬件故障時(shí)應(yīng)立即使用diag#diag> 選高級診斷Advance Diagnostic> 選問題診斷Problem Determination 或選系統(tǒng)檢查System Verification(選PD 會對系統(tǒng)錯(cuò)誤記錄進(jìn)行分
11、析diag運(yùn)行后會給出SRN 代碼故障設(shè)備名稱及百分比地址代碼等對于PCI機(jī)型應(yīng)在系統(tǒng)報(bào)錯(cuò)7天之內(nèi)運(yùn)行diag程序?qū)Τ鲥e(cuò)記錄里的sense數(shù)據(jù)進(jìn)行分析2.7 其他用于收集系統(tǒng)信息的命令lsdev -C 系統(tǒng)設(shè)備信息#lsdev -Cc diskhdisk0 Available 00-06-00-2,0 45 GB 16 Bit SCSI Disk Drivehdisk1 Available 00-06-00-1,0 45 GB 16 Bit SCSI Disk Drivehdisk2 Defined 00-06-00-4,0 16 Bit SCSI Disk Drivelspv 查看物理卷信息
12、#lspvhdisk0 0007821160af3d76 rootvghdisk1 000782117f571294 rootvghdisk2 0000000045c45bde datavglsvg 查看卷組信息#lsvg datavgVOLUME GROUP: datavg VG IDENTIFIER: 0000000055e2458bVG STATE: active PP SIZE: 4 megabyte(sVG PERMISSION: read/write TOTAL PPs: 2169 (8676 megabytMAX LVs: 256 FREE PPs: 1 (4 megabytes
13、LVs: 3 USED PPs: 2168 (8672 megabytOPEN LVs: 2 QUORUM: 2TOTAL PVs: 1 VG DESCRIPTORS: 2STALE PVs: 0 STALE PPs: 0ACTIVE PVs: 1 AUTO ON: yesMAX PPs per PV: 2032 MAX PVs: 16#lsvg -l rootvgrootvg:LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 1 1 closed/syncd N/Alv00 jfs 51 102 1 closed/stale /i
14、bmcxxlv01 jfs 1 1 1 open/syncd /cics_regionslv02 jfs 4 4 1 open/syncd /var/mqmlslpp 查看文件組信息# lslpp -L |grep 23100020devicespci23100020rte 4327 C IBM PCI 10/100 Ethernet Adapt看某個(gè)文件組是否已安裝如以太網(wǎng)卡驅(qū)動也用于查詢補(bǔ)丁程序的版本lsattr 查看設(shè)備參數(shù)設(shè)置# lsattr -El ent2busio 0x7fffc00 Bus I/O address Falsebusintr 9 Bus interrupt lev
15、el Falseintr_priority 3 Interrupt priority Falsetx_que_size 512 TRANSMIT queue size Truerx_que_size 256 RECEIVE queue size Truerxbuf_pool_size 384 RECEIVE buffer pool size Truemedia_speed 10_Half_Duplex Media Speed Trueuse_alt_addr no Enable ALTERNATE ETHERNET address Truealt_addr 0x000000000000 ALT
16、ERNATE ETHERNET address Trueip_gap 96 Inter-Packet Gap Truelscfg 查看VPD信息Virtual Product Data# lscfg -vl ssa1DEVICE LOCATION DESCRIPTIONssa1 30-68 IBM SSA Enhanced RAID Adapter(14104500Part Number097H0645FRU Number097H0645 <- 備件號Serial NumberC8217227EC Level0000F20825ManufacturerIBM053ROS Level an
17、d ID7201 <- 微碼版本Loadable Microcode Level04Device Driver Level00Displayable MessageSSA-ADAPTERDevice Specific(Z0DRAM=032Device Specific(Z1CACHE=0Device Specific(Z2000000062955dab2Device Specific(YLP2-I7 <- 槽號不同的硬件設(shè)備有不同的VPD 所含的格式和信息都不一樣通常備件號和微碼版本最有參考價(jià)值注FRU(Field Replace Unit才是真正的備件號第1章 硬件故障定位方法I
18、BM 小型機(jī)故障定位方法包括小型機(jī)I/O柜上的顯示面板上的Checkpoints信息Error Code 和SRNsCheckpoints 檢查點(diǎn)是系統(tǒng)加電CMOS初始化程序(initial program load (IPL運(yùn)行后顯示在I/O柜的顯示面板上一系列信息1.1 IPL 流程當(dāng)交流電源接到系統(tǒng)后IPL流程就開始了IPL流程包括四個(gè)步驟Phase 1: Service Processor 的初始化Phase 1 開始于交流電源接到系統(tǒng)后直到OK顯示在I/O柜上的顯示面板上為止在這個(gè)步驟會顯示8xxx 或9xxx checkpoints代碼Phase2:由ServiceProcesso
19、r引導(dǎo)的硬件初始化Phase2開始于按下I/O柜上的白色電源開關(guān)在這個(gè)步驟會顯示9xxxcheckpoints91FF是最后的代碼標(biāo)志著第三步驟的開始Phase3:系統(tǒng)固件的初始化在Phase3,一個(gè)系統(tǒng)處理器接管控制并繼續(xù)初始化系統(tǒng)資源在這個(gè)步驟會顯示ExxxE105是最后的代碼標(biāo)志著第四步驟AIX啟動的開始在這個(gè)過程中還會顯示各種位置碼位置碼代表著系統(tǒng)的每一個(gè)部分Phase4:AIX啟動當(dāng)AIX開始啟動時(shí)顯示面板上的代碼為0xxx同時(shí)位置碼會出現(xiàn)在第二行當(dāng)AIX的登錄窗口出現(xiàn)在控制臺上時(shí)第四步驟結(jié)束同時(shí)顯示面板上再無任何信息出現(xiàn)ErrorCode當(dāng)系統(tǒng)運(yùn)行有錯(cuò)誤發(fā)現(xiàn)時(shí)一個(gè)8位碼會顯示在顯示
20、面板上同時(shí)在第二行顯示相對應(yīng)問題硬件的位置碼SRNsServicerequestnumbers,服務(wù)請求碼當(dāng)系統(tǒng)運(yùn)行有錯(cuò)誤發(fā)現(xiàn)時(shí)SRNs碼會以xxx-xxx的形式顯示在顯示面板上同時(shí)在AIX的errorlog中也會有記載以上所有代碼都會有相應(yīng)的步驟解決由于代碼繁多請?jiān)诔霈F(xiàn)問題后記錄下代碼并致電IBM服務(wù)熱線1.2 系統(tǒng)的啟動順序:1.3 系統(tǒng)不能啟動系統(tǒng)停在Stage1可能為電源系統(tǒng)板CPU內(nèi)存等硬件故障記錄故障代碼通知IBM工程師系統(tǒng)停在Stage2可能是啟動順序表(bootlist損壞或I/O子系統(tǒng)故障可嘗試進(jìn)入SMS菜單檢查啟動順序表并修改若在選擇bootlist時(shí)沒有硬盤設(shè)備可選或顯示
21、的硬盤信息不正確則可能是硬盤故障若根本沒有SCSI設(shè)備可選則鏈路有問題系統(tǒng)停在Stage3可能是硬盤數(shù)據(jù)損壞系統(tǒng)設(shè)置文件出錯(cuò)或I/O子系統(tǒng)故障1.4 系統(tǒng)停在551555或557發(fā)生在系統(tǒng)啟動的第三階段(Stage3可能是文件系統(tǒng)損壞文件系統(tǒng)日志(jfslog損壞rootvg中有壞硬盤修復(fù)方法用系統(tǒng)光盤或系統(tǒng)備份帶啟動必須與硬盤中的操作系統(tǒng)版本一致啟動后選擇選項(xiàng)3"StartMaintenanceModeforSystemRecovery">"AccessaRootVolumeGroup">"Accessthisvolumegrou
22、pandstartashellbeforemountingthefilesystems"格式化文件系統(tǒng)日志(jfslog#/usr/sbin/logform/dev/hd8檢查修復(fù)文件系統(tǒng)#fsck -y/dev/hd1/home文件系統(tǒng)#fsck -y/dev/hd2/usr文件系統(tǒng)#fsck -y/dev/hd3/tmp文件系統(tǒng)#fsck -y/dev/hd4/文件系統(tǒng)#fsck -y/dev/hd9var/var文件系統(tǒng)用exit命令退出文件系統(tǒng)會自動mount起來重建bootimage#lslv m hd5找出bootimage所在的硬盤如hdisk0#bosboot ad
23、/dev/hdisk0#bootlist m normal/dev/hdisk0重建啟動順序表重啟動系統(tǒng)#shutdown -Fr如上述步驟不奏效用系統(tǒng)備份帶恢復(fù)系統(tǒng)如備份帶不能恢復(fù)用診斷光盤DiagnosticCDROM檢查是否壞硬盤1.5 CDE圖形界面掛死CDE運(yùn)行時(shí)不要更改網(wǎng)絡(luò)參數(shù)如主機(jī)名和IP地址更改網(wǎng)卡設(shè)置請先退出CDE圖形環(huán)境選擇命令行方式登錄在字符界面下更改如CDE已經(jīng)掛死遠(yuǎn)程telnet登錄找出所有dt有關(guān)的進(jìn)程用kill命令殺掉#ps -ef|grepdt#killPID檢查當(dāng)前主機(jī)名#hostnametscf50查看主機(jī)名是否對應(yīng)有效的IP地址#netstat -i|gr
24、eptscf50tr0*1500918540tscf5050604902824700更改主機(jī)名或IP地址使主機(jī)名與當(dāng)前有效的IP地址存在對應(yīng)關(guān)系#smittytcpip重新啟動CDE界面#/etc/rcdtHACMP環(huán)境下可把主機(jī)名alias到127001上#cat /etc/hosts127001_loopbacklocalhosttscf50#loopback(lo0name/addressbvg1.6 系統(tǒng)dump發(fā)生在系統(tǒng)崩潰時(shí)AIX會做dump(系統(tǒng)內(nèi)存的快照此時(shí)機(jī)器會顯示閃動的888102xxx0cx代碼0c9系統(tǒng)dump進(jìn)行中0c9狀態(tài)可能會維持超過2分鐘不要關(guān)電和按reset,
25、等待dump做完0c0dump成功完成這時(shí)可以斷電重起0c2手動啟動dump功能0c4dump設(shè)備空間不足只有部分信息保存下來0c5不明原因?qū)е耫ump失敗一般dump是由于軟件出錯(cuò)引起(888-102-207除外機(jī)器通??梢灾貑⒅貑r(shí)可能提示用戶插入磁帶拷貝dump文件不要選擇退出這樣會丟失重要的故障信息dump的有關(guān)設(shè)置估算系統(tǒng)dump的大小在系統(tǒng)最繁忙時(shí)內(nèi)存使用最多#sysdumpdev -e0453-041Estimateddumpsizeinbytes:53477376#lsps -aPageSpacePhysicalVolumeVolumeGroupSize%UsedActivep
26、aging00hdisk0rootvg480MB1yeshd6hdisk1rootvg544MB1yes當(dāng)前的設(shè)置#sysdumpdev -lprimary /dev/hd6<-dump的主設(shè)備secondary /dev/sysdumpnullcopydirectory /var/adm/ras<-dump拷貝的目錄forced copy flag TRUEalways allow dump TRUEhd6應(yīng)比估算值稍大/var/adm/ras是默認(rèn)的dump拷貝目錄比較估算值保證/var文件系統(tǒng)有足夠的剩余空間拷貝dump文件否則機(jī)器重起時(shí)會提示用戶插入磁帶dump文件名為vm
27、core#對PCI機(jī)型如要手動做dump須把"alwaysallowdump"先設(shè)成true#sysdumpdev -Kdump打包#snap a -o/dev/rmt#或#snap a -c把/tmp/ibmsupt目錄做成一個(gè)壓縮文件snaptarZ如果/tmp文件系統(tǒng)空間不夠可用-ddirectory參數(shù)指定別的目錄代替/tmp/ibmsupt第1章 7133-D40SSA磁盤柜的故障定位當(dāng)SSA磁盤柜出現(xiàn)故障時(shí)在磁盤柜前面板的液晶顯示屏上會顯示相應(yīng)的SRNs,同時(shí)黃色的顯示燈會閃動在AIX的errorlog中也會有記載錯(cuò)誤信息如DISK_ERR1DISK_ERR4S
28、SA_ARRAY_ERROR等請?jiān)诔霈F(xiàn)問題后記錄下代碼并致電IBM服務(wù)熱線第2章 軟件故障定位方法軟件故障情況錯(cuò)綜復(fù)雜下面列舉幾個(gè)常見案例的故障處理方法2.1 文件系統(tǒng)空間不夠查看有沒有_滿_的文件系統(tǒng)特別是/var/tmp不要超過90%文件系統(tǒng)滿可導(dǎo)致系統(tǒng)不能正常工作尤其是AIX的基本文件系統(tǒng)如/(根文件系統(tǒng)滿則會導(dǎo)致用戶不能登錄用df_k查看#df -k(查看AIX的基本文件系統(tǒng)Filesystem1024-blocksFree%UsedIused%IusedMountedon/dev/hd424576145295%259922%/dev/hd9var8192454045%64932%/v
29、ar除/usr文件系統(tǒng)其他文件系統(tǒng)都不應(yīng)太滿一般不超過80%處理方法1刪除垃圾文件#du -sk*|sort -rn|head查找出當(dāng)前目錄下占空間最大的子目錄逐層往下直到找出占空間最大的文件要區(qū)分哪些目錄是文件系統(tǒng)的mountpoint哪些是文件系統(tǒng)的子目錄刪除文件釋放空間有時(shí)刪除文件后空間并不馬上釋放這是由于你刪除的文件正被某個(gè)程序打開只有當(dāng)這個(gè)程序停止后空間才釋放有時(shí)甚至需要重起系統(tǒng)處理方法2增加文件系統(tǒng)大小#smitty chjfs文件系統(tǒng)可以在任何時(shí)候加大前提是卷組(VG中有剩余空間2.2 檢查文件系統(tǒng)的完整性#umount filesystem_name#fsck y filesy
30、stem_name注意文件系統(tǒng)必須先umount再做檢查和修復(fù)否則可導(dǎo)致未知的后果2.3 查看卷組信息(lsvg-lvg_name有沒有"stale"狀態(tài)的邏輯卷若有用syncvg命令修復(fù)"stale"邏輯卷2.4 檢查內(nèi)存交換區(qū)(pagingspace使用率(lsps-s使用率是否超過70%若有則用chps_sXpgname增加X個(gè)PP或用mkps a -n-sX myvg在myvg上增加一個(gè)PP數(shù)為X的內(nèi)存交換區(qū)2.5 小型機(jī)內(nèi)存泄漏問題小型機(jī)出現(xiàn)內(nèi)存泄漏即系統(tǒng)或應(yīng)用進(jìn)程無法將使用過的內(nèi)存釋放使可用內(nèi)存的容量逐漸減少如果可用內(nèi)存降到某最小值將造成系統(tǒng)
31、或應(yīng)用程序無法FORK子進(jìn)程就會造成系統(tǒng)癱瘓通常我們可以用ps和sar命令來查看小型機(jī)內(nèi)存和CPU占用率的大概情況以及各進(jìn)程的內(nèi)存和CPU占用率的發(fā)展趨勢(a ps#psgv|head-n1;psgv|egrep-v"RSS"|sort+6b-7-n-r|head-n5PIDTTYSTATTIMEPGINSIZERSSLIMTSIZTRS%CPU%MEMCOMMAND2064-A2:135646448xx063920040kproc1806-A0:200166408xx063920040kprocSIZE virtual size(in the paging space,i
32、n kilobytes,RSS real-memory (resident set size in kilobytes of the process通過不同時(shí)間輸出的比較就能觀察出內(nèi)存和CPU占用率的基本情況找出其中占用內(nèi)存數(shù)不斷變大的進(jìn)程這個(gè)進(jìn)程可能就已經(jīng)發(fā)生了內(nèi)存泄漏(bsar指令也可以查看CPU占用率但統(tǒng)計(jì)的結(jié)果不是很準(zhǔn)確通常使用sar令的格式為#sar P ALL 2 1009:29:37cpu%usr%sys%wio%idle09:29:39000495110495-0049509:29:41002692134291-2349209:29:43031294122295-2129409
33、:29:45022790145686-3368809:29:47011296112296-1129609:29:490000100101099-00010009:29:51020098101098-1009809:29:53071686122590-5258809:29:55045563511225532-84553309:29:570168146411591165-1581264Average0321085143885-42985表示2秒鐘輸出一次結(jié)果總共有10次結(jié)果然后平均目前如果發(fā)現(xiàn)內(nèi)存泄漏最好重新啟動系統(tǒng)第3章 常用的系統(tǒng)狀態(tài)查詢命令#lsdev C -sscsi列出各個(gè)SCSI設(shè)備的
34、所有相關(guān)信息如邏輯單元號硬件地址及設(shè)備文件名等#ps -ef列出正在運(yùn)行的所有進(jìn)程的各種信息如進(jìn)程號及進(jìn)程名等#netstat -rn列出網(wǎng)卡狀態(tài)及路由信息等#netstat -in列出網(wǎng)卡狀態(tài)及網(wǎng)絡(luò)配置信息#df -k列出已加載的邏輯卷及其大小信息#mount列出已加載的邏輯卷及其加載位置#uname -a列出系統(tǒng)ID號系統(tǒng)名稱OS版本等信息#hostname列出系統(tǒng)網(wǎng)絡(luò)名稱#lsvg l rootvg, lsvg p rootvg顯示邏輯卷組信息如包含哪些物理盤及邏輯卷等#lslv -l datalv,lslv -p datalv顯示邏輯卷各種信息如包含哪些盤是否有鏡像等第4章 網(wǎng)絡(luò)故障定
35、位方法4.1 網(wǎng)絡(luò)不通的診斷過程ifconfig查看網(wǎng)卡是否啟動(upnetstat i查看網(wǎng)卡狀態(tài)Ierrs/Ipkts和Oerrs/Opkts是否>1%ping自己網(wǎng)卡地址(ip地址ping其它機(jī)器地址如不通在其機(jī)器上用diag檢測網(wǎng)卡是否有問題在同一網(wǎng)中subnet mask應(yīng)一致4.2 網(wǎng)絡(luò)配置的基本方法(1如需修改網(wǎng)絡(luò)地址主機(jī)名等一定要用chdev命令#chdev -l inet0 a hostname=myhost#chdev l en0 a netaddr='9324058' a netmask=2552552550_(2查看網(wǎng)卡狀態(tài)#lsdev Cc if
36、(3確認(rèn)網(wǎng)絡(luò)地址#ifconfig en0(4啟動網(wǎng)卡#ifconfige n0 up(5_配置路由有兩種方式加入路由永久路由#chdev l inet0-aroute=_104700_,_9324059_臨時(shí)路由用命令netstat -rn查看路由表第5章 HACMP環(huán)境下的排錯(cuò)在一般情況下,HACMP軟件很少需要手工干預(yù),但一旦有問題發(fā)生,診斷和恢復(fù)的技巧是很重要的需要能很快地?cái)喽▎栴}然后運(yùn)用你對HACMP的理解來恢復(fù)HACMP的正常運(yùn)作一般地,HACMP環(huán)境下的排錯(cuò)包括:了解問題的存在判斷問題的出處解決問題5.1 了解問題的存在您可以通過以下途徑了解到一個(gè)CLUSTER環(huán)境下出現(xiàn)了問題最
37、終用戶的投訴,他們無法訪問應(yīng)用程序控制臺上出現(xiàn)一些HACMP的信息應(yīng)用服務(wù)無法訪問最終用戶的抱怨通常預(yù)示CLUSTER出現(xiàn)了問題他們無法正常執(zhí)行應(yīng)用或是無法登錄到系統(tǒng)我們必須采集到詳細(xì)的信息以判斷到底那里出現(xiàn)了問題是否有錯(cuò)誤的信息提示?如果可能的話,讓用戶重復(fù)步驟以確定那里是錯(cuò)誤的開始您也可以在自己的系統(tǒng)上重復(fù)要知道用戶應(yīng)用不可用并不代表HACMP有問題問題可能出現(xiàn)在應(yīng)用程序本身或是它的啟動或終止腳本出現(xiàn)了問題因此應(yīng)用程序本身的排錯(cuò)也應(yīng)是HA排錯(cuò)的一部分2控制臺上出現(xiàn)一些HACMP的信息在HACMP啟動,終止或出錯(cuò)時(shí),控制臺上會出現(xiàn)一些HACMP的信息,同時(shí)也會寫入相應(yīng)的文件中5.2 判斷問題的出處當(dāng)錯(cuò)誤出現(xiàn)時(shí),我們應(yīng)嘗試發(fā)現(xiàn)錯(cuò)誤的所在但我
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度出樣產(chǎn)品環(huán)保技術(shù)研發(fā)與應(yīng)用協(xié)議3篇
- 2024年食品級原材料安全運(yùn)輸與購銷保障協(xié)議3篇
- 2024廣州二手房購房合同
- FBM模式2024年度汽車租賃合同
- 2024年賽事組織與執(zhí)行合同
- 2024年簡化版鋼管交易協(xié)議范例一
- 2025年生態(tài)環(huán)保型建筑施工安全生產(chǎn)責(zé)任書3篇
- 2024年財(cái)產(chǎn)抵押貸款合同
- 2024年飲料分銷合作伙伴協(xié)議3篇
- 2024智能交通系統(tǒng)技術(shù)開發(fā)與實(shí)施合同
- 第2課 各種各樣的運(yùn)動(說課稿)-2023-2024學(xué)年三年級下冊科學(xué)教科版
- 北京2025年首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院招聘140人歷年參考題庫(頻考版)含答案解析
- 股權(quán)質(zhì)押權(quán)借款合同模板
- 《工商管理專業(yè)畢業(yè)實(shí)習(xí)》課程教學(xué)大綱
- 2025年中國社區(qū)團(tuán)購行業(yè)發(fā)展環(huán)境、運(yùn)行態(tài)勢及投資前景分析報(bào)告(智研咨詢發(fā)布)
- 國開電大本科《西方經(jīng)濟(jì)學(xué)(本)》網(wǎng)上形考(作業(yè)一至六)試題及答案
- 提高有風(fēng)險(xiǎn)患者預(yù)防跌倒墜床護(hù)理措施落實(shí)率品管圈PDCA案例匯報(bào)
- 建材行業(yè)綠色建筑材料配送方案
- 2024年行政執(zhí)法人員執(zhí)法資格知識考試題庫(附含答案)
- 代理記賬有限公司簡介(5個(gè)范本)
- 高中英語新課程標(biāo)準(zhǔn)解讀課件
評論
0/150
提交評論