IBM小型機巡檢手冊_第1頁
IBM小型機巡檢手冊_第2頁
IBM小型機巡檢手冊_第3頁
IBM小型機巡檢手冊_第4頁
IBM小型機巡檢手冊_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、IBM小型機日常維護 第一篇:日常維護部分 第二篇:故障處理部分第1章 AIX系統(tǒng)管理日常工作(檢查篇)1.1 常用的命令CPUMemoryDiskNetwork標準UNIX命令(包括HP、SUN等)vmstat, sar, psvmstat, psiostat, sar, vmstat, netstat, nfsstatAIX 詳細輸出Tprofsvmon, rmssfilemon, fileplaceentstatAIX 非常詳細輸出syscalls, trace, emstat tracetracetrace, iptrace分析工具topastopastopastopas1.2 語法介

2、紹1.2.1 vmstat:檢查內(nèi)存、CPU、進程狀態(tài)# vmstat 2 6 kthr memory page faults cpu - - - - - r b avm fre re pi po fr sr cy in sy cs us sy id wa 1 0 28132 81277 0 0 0 0 0 0 132 375 67 65 1 34 0 2 0 28132 81277 0 0 0 0 0 0 127 338 131 99 0 0 0 2 0 28132 81277 0 0 0 0 0 0 132 316 131 99 0 0 0 2 0 28132 81277 0 0 0 0

3、0 0 120 317 126 99 0 0 0 2 0 28132 81277 0 0 0 0 0 0 146 316 127 99 0 0 0 2 0 28132 81277 0 0 0 0 0 0 130 317 125 99 0 0 0 2 0 28132 81277 0 0 0 0 0 0 135 316 127 99 0 0 0 2 0 28132 81277 0 0 0 0 0 0 129 317 124 99 0 0 0 2 0 28132 81277 0 0 0 0 0 0 133 304 127 99 0 0 0 r:正在運行的進程b:被阻擋的進程avm:活動的虛內(nèi)存,單位

4、4kbfre:自由列表,位4kbpo:頁換出pi:頁換入sy:系統(tǒng)占用CPUid:空閑CPUwa:等待的CPU1.2.2 sar:檢查CPU、IO例如:sar -u 1 30sar -P ALL 1 10語法:sar -abckmqruvwyA inteval repetition-b buffer 活動-c 系統(tǒng)調(diào)用-k 內(nèi)核進程統(tǒng)計.-m 消息及信號量活動-q 正在運行的隊列數(shù)及等待隊列數(shù)-r 頁交換統(tǒng)計-u CPU利用-P CPU負載.1.2.3 PS:檢查進程狀態(tài)命令ps:顯示當前SHELL重所有進程ps -ef :顯示系統(tǒng)中所有進程,f顯示更詳細信息ps -u oracle: 顯示o

5、racle用戶進程ps emo THREAD:顯示線程信息ps au;ps vg:按使用時間顯示進程(最近一次調(diào)用)ps aux:按使用時間顯示進程(進程啟動)1.2.4 svmon:顯示進程占用內(nèi)存svmon G:顯示系統(tǒng)占用內(nèi)存svmon -C command_name:顯示某個用戶進程占用內(nèi)存svmon -P pid顯示某個進程占用內(nèi)存svmon S:顯示段占用內(nèi)存1.2.5 iostat:顯示磁盤IOtty: tin tout avg-cpu: % user % sys % idle % iowait0.0 4.0 0.9 1.3 95.4 2.5 Disks: % tm_act Kb

6、ps tps Kb_read Kb_wrtnhdisk0 58.4 218.3 41.2 172 920hdisk1 16.8 85.6 21.4 428 0hdisk2 50.6 223.9 55.6 1100 20hdisk3 16.8 85.6 21.4 428 0hdisk4 0.0 0.0 0.0 0 0hdisk5 43.4 279.1 69.8 1396 0hdisk6 0.0 0.0 0.0 0 0hdisk7 16.4 27.2 20.2 0 136hdisk8 0.0 0.0 0.0 0 0hdisk9 9.4 156.0 11.4 0 780hdisk10 16.4 27

7、.2 20.2 0 136cd0 0.0 0.0 0.0 0 01.2.6 netstat, entstat:顯示網(wǎng)卡信息netstat en0:顯示en0信息netstat s:顯示網(wǎng)絡信息netstat -m顯示網(wǎng)絡 stat -i顯示網(wǎng)卡狀態(tài)netstat -I en0 1顯示eno網(wǎng)卡塞(1秒間隔)1.2.7 no:顯示tcpip參數(shù)設置no a:顯示tcpip所有參數(shù)當前設置no -o tcp_keepalivetime=7200000設置tcp_keepalivetime等于3600000秒no d 恢復默認值注:該方法在重啟后失效1.2.8 其它命令檢查文件

8、系統(tǒng)df -k檢查設備lsdev -C檢查物理卷lspv檢查交換區(qū)lsps a lsps -s檢查系統(tǒng)硬件配置lscfg vp prtconf檢查軟件lslpp -l操作系統(tǒng)版本檢查oslevel r uname -a操作系統(tǒng)補丁檢查Instfix i|grep ML 檢查系統(tǒng)盤的鏡像lspv l rootvg檢查邏輯卷lsvg o|lsvg il|more系統(tǒng)dump分區(qū)檢查sysdevdump lsysdumpdev -e系統(tǒng)引導順序檢查bootlist m noraml -oAIO參數(shù)檢查lsattr -El aio0IO參數(shù)設置smitty chgsyssyncd daemon的數(shù)據(jù)刷

9、新頻率more /sb in/rc.bootIBM雙機檢查lssrc g cluster/usr/sbin/cluster/clstat -a系統(tǒng)日志檢查errpt|moreerrpt dH errpt -dS系統(tǒng)關鍵進程檢查Ps ef|grep srcmstPs ef|grep errdemon操作系統(tǒng)備份與恢復1.3 用SMIT備份#smitty mksysb進行系統(tǒng)備份當COMMAND STATUS頁面中Command: OK出現(xiàn)后,表示備份成功。取出制作完畢的磁帶,在磁帶上的標簽上注明備份機器的名稱和序列號1.4 手工備份# mksysb i /dev/rmt01.5 恢復系統(tǒng)boot

10、info e檢查系統(tǒng)所帶的磁帶機是否能啟動系統(tǒng),如果返回值是1,表示該磁帶機支持啟動系統(tǒng),如果返回值是0,就是不支持。插入備份帶,檢查設備啟動順序:bootlist m service o如果需要,將啟動順序改為從磁帶啟動:bootlist m service rmt0重啟機器,系統(tǒng)從磁帶讀數(shù)據(jù),根據(jù)提示恢復系統(tǒng)。 故障處理部分1.6 收集故障信息對于判斷診斷故障原因修復系統(tǒng)非常重要1.7 系統(tǒng)故障記錄(errorlog)errdemon 進程在系統(tǒng)啟動時自動運行記錄包括硬件軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog 可備份下來或拷貝到別的機器上分析errpt 命令

11、的使用(普通用戶權(quán)限也可使用)#errpt |more 列出簡短出錯信息ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION192AC071 0723100300 T 0 errdemon Error logging turned off0E017ED1 0720131000 P H mem2 Memory failure9DBCFDEE 0701000000 T 0 errdemon Error logging turned on038F2580 0624131000 U H scdisk0 UNDETERMINED ERRORAA8A

12、B241 0405130900 T O OPERATOR OPERATOR NOTIFICATIONTIMESTAMP: MMDDHHMMYY (月日時分年T 類型: P 永久; T 臨時; U 未知永久性的錯誤應引起重視C 分類: H 硬件; S 軟件; O 用戶; U未知#errpt -d H 列出所有硬件出錯信息#errpt -d S 列出所有軟件出錯信息#errpt -aj ERROR_ID 列出詳細出錯信息# errpt -aj 0502f666 <- ERROR_ID用大小寫均可例LABEL: SCSI_ERR1ID: 0502F666Date/Time: Jun 19 22

13、:29:51Sequence Number: 95Machine ID: 123456789012Node ID: host1Class: HType: PERMResource Name: scsi0Resource Class: adapterResource Type: hscsiLocation: 00-08VPD: <- Virtal Product DataDevice Driver Level00Diagnostic Level00Displayable MessageSCSIEC LevelC25928FRU Number30F8834ManufacturerIBM97F

14、Part Number59F4566Serial Number00002849ROS Level and ID24Read/Write Register Ptr0120DescriptionADAPTER ERRORProbable CausesADAPTER HARDWARE CABLECABLE TERMINATOR DEVICEFailure CausesADAPTERCABLE LOOSE OR DEFECTIVERecommended ActionsPERFORM PROBLEM DETERMINATION PROCEDURESCHECK CABLE AND ITS CONNECTI

15、ONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 00001.8 控制面板上的LED 代碼8 位代碼通常系統(tǒng)故障燈會同時亮起某些機型還會同時顯示故障設備位置代碼4 位代碼通常是Exxx3 位代碼通常為0yyy 只看后3位8 位和4位代碼可查看系統(tǒng)服務手冊(Service Guide)3 位代碼可查看系統(tǒng)診斷手冊(Diagnostic Information for Multiple BusSystem)閃動的888, 系統(tǒng)崩潰硬件或軟件原因造成按reset 鍵會顯示更多內(nèi)容888-102

16、 一般為軟件故障888-102-207 例外系統(tǒng)會產(chǎn)生一個dump888-102-xxx-0C9 系統(tǒng)正在做dump, 請等待888-102-xxx-0C0 系統(tǒng)dump完成可關電重啟888-103 或105硬件故障一般有SRN 代碼及位置代碼1.9 SMS (System Management Service) 故障記錄如何進入SMS 菜單當主控臺出現(xiàn)鍵盤圖標后(LED 顯示E1F1時)按1鍵選擇"Utilities"選擇"Error Log", 抄下8位故障代碼在SMS 中還可以更改系統(tǒng)啟動順序表1.10 MAIL#mail系統(tǒng)會向root用戶發(fā)mail報告出錯信息通常系統(tǒng)出現(xiàn)故障后沒有進行檢查修

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論