H3C核心交換機(jī)常見(jiàn)故障定位手冊(cè)_第1頁(yè)
H3C核心交換機(jī)常見(jiàn)故障定位手冊(cè)_第2頁(yè)
H3C核心交換機(jī)常見(jiàn)故障定位手冊(cè)_第3頁(yè)
H3C核心交換機(jī)常見(jiàn)故障定位手冊(cè)_第4頁(yè)
H3C核心交換機(jī)常見(jiàn)故障定位手冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

核心交換機(jī)常見(jiàn)故障處理手冊(cè)-41目錄1故障處理通用流程 1-11.1信息搜集 1-11.1.1搜集設(shè)備日志信息 1-11.1.2搜集其他運(yùn)行信息 1-21.2故障定位和處理 1-21.2.1故障處理流程圖 1-21.2.2故障原因分類 1-31.2.3故障模型及影響分析 1-41.2.4常見(jiàn)的故障恢復(fù)措施 1-62硬件類故障處理 2-62.1單板故障 2-62.1.1故障描述 2-62.1.2故障處理步驟 2-82.2電源故障 2-92.2.1故障描述 2-92.2.2故障處理步驟 2-102.3風(fēng)扇故障 2-122.3.1故障描述 2-122.3.2故障處理步驟 2-122.4溫度告警 2-132.4.1故障描述 2-132.4.2故障處理步驟 2-133鏈路端口故障處理 3-143.1端口錯(cuò)包 3-143.1.1故障描述 3-143.1.2故障處理步驟 3-153.2端口無(wú)法up 3-163.2.1故障描述 3-163.2.2故障處理步驟 3-163.3端口由Up變成Down 3-173.3.1故障描述 3-173.3.2故障處理步驟 3-173.4端口頻繁Up/Down 3-183.4.1故障描述 3-183.4.2故障處理步驟 3-183.5光模塊故障 3-183.5.1故障描述 3-183.5.2故障處理步驟 3-184報(bào)文轉(zhuǎn)發(fā)故障處理 4-224.1ping不通或丟包 4-224.1.1故障描述 4-224.1.2故障處理步驟 4-224.2L2轉(zhuǎn)發(fā)故障 4-234.2.1故障描述 4-234.2.2故障處理步驟 4-234.3L3轉(zhuǎn)發(fā)故障 4-264.3.1故障描述 4-264.3.2故障處理步驟 4-274.4MPLS轉(zhuǎn)發(fā)故障 4-314.4.1故障描述 4-314.4.2故障處理步驟 4-325IRF類故障處理 5-355.1IRF無(wú)法形成 5-355.1.1故障描述 5-355.1.2故障處理步驟 5-355.2IRF出現(xiàn)分裂 5-365.2.1故障描述 5-365.2.2故障處理步驟 5-366系統(tǒng)管理維護(hù)類故障處理 6-376.1CPU占用率高 6-376.1.1故障描述 6-376.1.2故障處理步驟 6-386.2內(nèi)存占用率高 6-446.2.1故障描述 6-446.2.2故障處理步驟 6-446.3資源不足 6-456.3.1故障描述 6-456.3.2故障處理步驟 6-45故障處理通用流程信息搜集為方便故障快速定位,建議不要關(guān)閉設(shè)備的信息中心(info-centerenable)。缺省情況下信息中心處于開(kāi)啟狀態(tài)。搜集設(shè)備日志信息收集diag信息執(zhí)行displaydiagnostic-information命令后,請(qǐng)輸入“Y”,以選擇將diag保存到CF卡中(選擇display會(huì)出現(xiàn)信息搜集不全)。設(shè)備上單板越多,diag信息搜集的時(shí)間越長(zhǎng),信息搜集期間不能輸入命令,請(qǐng)耐心等待。<Sysname>displaydiagnostic-informationSaveordisplaydiagnosticinformation(Y=save,N=display)?[Y/N]:yPleaseinputthefilename(*.diag)[cfa0:/default.diag]:20130517.diagDiagnosticinformationisoutputtingtocfa0:/20130517.diag.Pleasewait...Savesuccessfully.也可以將diag信息直接顯示出來(lái)(不建議這樣搜集),搜集前請(qǐng)先執(zhí)行screen-lengthdisable,避免屏幕輸出被打斷,如下:<Sysname>screen-lengthdisable%Screen-lengthconfigurationisdisabledforcurrentuser.<Sysname>displaydiagnostic-informationSaveordisplaydiagnosticinformation(Y=save,N=display)?[Y/N]:n================================================================================runningCPUusageinformation=====================================================================================CurrentCPUusageinfo=====CPUUsageStat.Cycle:19(Second)CPUUsage:5%CPUUsageStat.Time:2013-05-2110:06:25CPUUsageStat.Tick:0x19aa(CPUTickHigh)0xa57f44e1(CPUTickLow)ActualStat.Cycle:0x0(CPUTickHigh)0x39fb1e03(CPUTickLow)……其他注意事項(xiàng)建議記錄設(shè)備操作時(shí)的命令行顯示信息,便于后續(xù)分析。明確每一配置操作的影響,保證出現(xiàn)異常時(shí)配置能夠被恢復(fù)。保證當(dāng)前配置與保存的配置一致,在IRF分裂、單板Fault、單板重啟時(shí)請(qǐng)不要保存配置,否則可能會(huì)導(dǎo)致配置不一致。操作執(zhí)行后請(qǐng)等待一定時(shí)間來(lái)確認(rèn)執(zhí)行效果。更換主控板時(shí),請(qǐng)確保新、老主控板的軟件版本一致。搜集其他運(yùn)行信息除設(shè)備日志信息外,還需要搜集設(shè)備的其他運(yùn)行信息(包括但不限于以下):故障現(xiàn)象、故障時(shí)間、網(wǎng)絡(luò)拓?fù)洹⑴渲眯畔?、現(xiàn)場(chǎng)處理措施及其實(shí)施后的現(xiàn)象效果;操作日志記錄、抓取的報(bào)文信息、Debug開(kāi)關(guān)打印信息、主控板與網(wǎng)板持續(xù)異常重啟的串口輸出信息等;設(shè)備故障時(shí)單板、電源、風(fēng)扇指示燈的狀態(tài)或現(xiàn)場(chǎng)圖片等搜集信息越全面、越詳細(xì),越有利于故障的快速定位。故障定位和處理設(shè)備出現(xiàn)故障時(shí),請(qǐng)先搜集設(shè)備運(yùn)行的相關(guān)信息,判斷大致的故障類型,然后參照對(duì)應(yīng)類型的故障處理流程進(jìn)行確認(rèn)。如遇到故障無(wú)法確認(rèn),請(qǐng)將故障描述連同搜集的信息發(fā)送給公司技術(shù)支持人員分析。故障處理流程圖REF_Ref360624190\r\h圖1為故障處理的一般流程,可以大致判斷出故障的類型。故障處理流程圖故障分析時(shí)常用的方法有:端口報(bào)文計(jì)數(shù)報(bào)文鏡像端口抓包配置QoS策略進(jìn)行流量統(tǒng)計(jì)Debug開(kāi)關(guān)信息對(duì)懷疑故障的模塊交叉驗(yàn)證(比如:懷疑某個(gè)端口光模塊異常,可以將其他正常的光模塊裝在這個(gè)端口、將懷疑異常的光模塊裝到別的端口進(jìn)行確認(rèn);懷疑某個(gè)槽位單板異常,可以將別的正常單板裝到這個(gè)槽位、將懷疑異常的單板裝到本設(shè)備其他槽位或裝到別的S12500-X上確認(rèn))。故障原因分類單板故障如單板出現(xiàn)異常重啟、狀態(tài)異常、無(wú)法啟動(dòng)、反復(fù)重啟,請(qǐng)參照REF_Ref360617737\n\h2.1REF_Ref360617740\h單板故障處理。電源故障如設(shè)備電源指示燈異常、不斷打印告警信息,請(qǐng)參照REF_Ref360617934\r\h2.2REF_Ref360617936\h電源處理。風(fēng)扇故障如設(shè)備風(fēng)扇指示燈異常、風(fēng)扇停轉(zhuǎn)、不斷打印風(fēng)扇告警信息,請(qǐng)參照REF_Ref360617971\r\h2.3REF_Ref360617952\h風(fēng)扇故障處理。溫度告警如設(shè)備打印溫度告警,請(qǐng)參照REF_Ref360617712\n\h2.4REF_Ref360617701\h溫度告警處理。鏈路端口故障如端口出現(xiàn)無(wú)法UP、頻繁UP/DOWN、端口錯(cuò)包,請(qǐng)參照REF_Ref360617778\r\h3REF_Ref360617780\h鏈路端口故障處理。硬件轉(zhuǎn)發(fā)故障如日志不斷出現(xiàn)Forwardingfault、Boardfault:chassisXslotY,pleasecheckit等打印信息,請(qǐng)參照REF_Ref361837906\r\h4REF_Ref361837908\h硬件轉(zhuǎn)發(fā)故障處理。報(bào)文轉(zhuǎn)發(fā)故障如出現(xiàn)ping、tracert丟包或不通、二層丟包或不通、三層丟包或不通、MPLS業(yè)務(wù)異常等,請(qǐng)參照REF_Ref360617827\r\h5REF_Ref360617829\h報(bào)文轉(zhuǎn)發(fā)故障處理。IRF故障如設(shè)備無(wú)法形成IRF、IRF分裂等,請(qǐng)參照REF_Ref360617917\r\h6REF_Ref360617920\hIRF類故障處理。CPU占用率高如設(shè)備單板CPU占用率很高,請(qǐng)參照REF_Ref360617852\r\h7.1REF_Ref360617854\hCPU占用率處理。內(nèi)存占用率高如設(shè)備單板內(nèi)存占用率很高,請(qǐng)參照REF_Ref360617875\r\h7.2REF_Ref360617877\h內(nèi)存占用率處理。資源不足如設(shè)備打印Noenoughresource資源不足,請(qǐng)參照REF_Ref360617905\r\h7.3REF_Ref360617907\h資源不足處理。故障模型及影響分析REF_Ref360625212\r\h圖2是一個(gè)典型網(wǎng)絡(luò)故障模型,為提高網(wǎng)絡(luò)的可靠性,便于故障時(shí)快速切換恢復(fù),組網(wǎng)中采用雙上行鏈路,兩臺(tái)核心交換機(jī)之間互為備份。典型網(wǎng)絡(luò)故障模型故障點(diǎn)影響分析故障點(diǎn)可能現(xiàn)象影響范圍1(含光模塊)端口down業(yè)務(wù)會(huì)切換端口錯(cuò)包增加影響該鏈路上的業(yè)務(wù)(影響范圍大)2單板fault業(yè)務(wù)會(huì)切換單板芯片故障(單板狀態(tài)正常)該芯片上的業(yè)務(wù)異常交換網(wǎng)板芯片故障會(huì)影響整機(jī)軟件異常設(shè)備重啟,業(yè)務(wù)會(huì)切換協(xié)議模塊異常一般會(huì)影響業(yè)務(wù)3同1影響該接入層交換機(jī)上的業(yè)務(wù)(影響范圍比故障點(diǎn)1小一些)4設(shè)備down影響該設(shè)備下的業(yè)務(wù)單板芯片故障影響部分端口或整機(jī)業(yè)務(wù)軟件異常設(shè)備重啟,影響設(shè)備下連業(yè)務(wù)協(xié)議模塊異常一般會(huì)影響業(yè)務(wù)5同1影響該鏈路上服務(wù)器涉及的業(yè)務(wù)6網(wǎng)絡(luò)正常,業(yè)務(wù)異常影響該服務(wù)器涉及業(yè)務(wù)常見(jiàn)的故障恢復(fù)措施常見(jiàn)的故障恢復(fù)措施故障原因業(yè)務(wù)恢復(fù)動(dòng)作故障排除動(dòng)作硬件隔離故障單板;調(diào)整業(yè)務(wù)流向來(lái)隔離故障設(shè)備(如可以調(diào)整路由的優(yōu)先級(jí),避免流量經(jīng)過(guò)故障設(shè)備,實(shí)現(xiàn)流量切換)更換備件(備件上線應(yīng)用前應(yīng)進(jìn)行必要的測(cè)試)軟件重啟故障設(shè)備的協(xié)議;調(diào)整業(yè)務(wù)流向來(lái)隔離故障設(shè)備升級(jí)版本(含補(bǔ)丁版本);調(diào)整組網(wǎng)或配置消除引發(fā)故障因素鏈路調(diào)整業(yè)務(wù)流向來(lái)隔離故障線路檢修線路其他修改錯(cuò)誤配置;正確連接設(shè)備端口;調(diào)整業(yè)務(wù)流向來(lái)隔離故障線路修改錯(cuò)誤配置;正確連接設(shè)備端口;檢修機(jī)房的電源、空調(diào)等支撐系統(tǒng)硬件類故障處理單板故障故障描述單板狀態(tài)異常(比如狀態(tài)為Absent、Fault、Loading)。單板出現(xiàn)異常重啟、無(wú)法啟動(dòng)或不斷重啟等。單板狀態(tài)查詢單板狀態(tài)包括:Normal、Master、Slave、Absent、Fault、Loading。Master與Slave分別表示主、備主控板。Normal表示單板處于正常運(yùn)行狀態(tài)。如果發(fā)現(xiàn)單板狀態(tài)出現(xiàn)Fault、Offline、Loading,或該槽位存在單板但狀態(tài)卻是Absent的,說(shuō)明單板可能出現(xiàn)故障,請(qǐng)參考REF_Ref360626329\r\h2.1.2REF_Ref360626331\h故障處理步驟處理。<Sysname>displaydeviceSlotNo.BrdTypeBrdStatusSubslotSftVerPatchVer0 LSX1TGS48EC1Normal0S12510-X-1005None1LSX1TGS48EC1Normal0S12510-X-1005None2LSX1TGS48EC1Normal0S12510-X-1005None3LSX1TGS48EC1Normal0S12510-X-1005None4LSX1TGS48EC1Normal0S12510-X-1005None5LSX1TGS48EC1Normal0S12510-X-1005None6LSX1TGS48EC1Normal0S12510-X-1005None7NONEAbsent0NONENone8NONEAbsent0NONENone9NONEAbsent0NONENone10LSX1FAB10B1Normal0S12510-X-1005None11LSX1FAB10B1Normal0S12510-X-1005None12LSX1FAB10B1Normal0S12510-X-1005None13LSX1FAB10B1Normal0S12510-X-1005None14LSX1FAB10B1Normal0S12510-X-1005None15LSX1FAB10B1Normal0S12510-X-1005None16LSX1SUP10A1Standby0S12510-X-1005None17LSX1SUP10A1Master0S12510-X-1005None單板重啟確認(rèn)可以通過(guò)logfile日志或displayversion查看設(shè)備啟動(dòng)后運(yùn)行時(shí)間來(lái)確認(rèn)單板有沒(méi)有出現(xiàn)過(guò)重啟,出現(xiàn)過(guò)重啟的單板運(yùn)行時(shí)間會(huì)明顯短于設(shè)備上其他單板。如果有單板出現(xiàn)過(guò)重啟,請(qǐng)參考REF_Ref360626329\r\h2.1.2REF_Ref360626331\h故障處理步驟處理。<Sysname>displayversionH3CComwareSoftware,Version7.1.045,Release1005Copyright(c)2004-2013HangzhouH3CTech.Co.,Ltd.Allrightsreserved.H3CS12510-Xuptimeis0weeks,4days,1hour,55minutesLastrebootreason:ColdrebootBootimage:flash:/S12500X-CMW710-BOOT-R1005.binBootimageversion:7.1.045P18,Release1005CompiledNov11201315:38:46Systemimage:flash:/S12500X-CMW710-SYSTEM-R1005.binSystemimageversion:7.1.045,Release1005CompiledNov11201315:39:12LPU0:Uptimeis0weeks,4days,1hour,52minutesH3CS12510-XLPUwith1XLP308ProcessorBOARDTYPE:LSX1TGS48EC1DRAM:4096MbytesFLASH:0MbytesNVRAM:0KbytesPCB1Version:VER.BPCB2Version:VER.CBootromVersion:108CPLD1Version:002CPLD2Version:002CPLD3Version:002ReleaseVersion:H3CS12510-X-1005PatchVersion:NoneRebootCause:ColdRebootLPU1:Uptimeis0weeks,4days,1hour,50minutesH3CS12510-XLPUwith1XLP308ProcessorBOARDTYPE:LSX1TGS48EC1DRAM:4096MbytesFLASH:0MbytesNVRAM:0KbytesPCB1Version:VER.BPCB2Version:VER.CBootromVersion:108CPLD1Version:002CPLD2Version:002CPLD3Version:002ReleaseVersion:H3CS12510-X-1005PatchVersion:NoneRebootCause:ColdRebootLPU2:Uptimeis0weeks,4days,1hour,52minutesH3CS12510-XLPUwith1XLP308ProcessorBOARDTYPE:LSX1TGS48EC1DRAM:4096MbytesFLASH:0MbytesNVRAM:0KbytesPCB1Version:VER.BPCB2Version:VER.CBootromVersion:108CPLD1Version:002CPLD2Version:002CPLD3Version:002ReleaseVersion:H3CS12510-X-1005PatchVersion:NoneRebootCause:ColdReboot故障處理步驟單板狀態(tài)Absent、Fault確認(rèn)單板是否插穩(wěn),如檢查單板與機(jī)框之間是否有空隙,也可以將單板拔出后重插入。將單板放到別的槽位,將框上別的正常的單板放到這個(gè)槽位,進(jìn)一步確認(rèn)是不是單板故障。檢查單板面板、內(nèi)部的指示燈是否發(fā)光。如果單板是主控板、網(wǎng)板,請(qǐng)連上串口線,查看配置終端上是否有單板正常啟動(dòng)的顯示信息、或單板啟動(dòng)是否異常。如確認(rèn)為單板故障,請(qǐng)更換單板并將故障信息發(fā)送技術(shù)支持人員分析。單板狀態(tài)Loading檢查單板面板、內(nèi)部的指示燈是否發(fā)光。如果單板是主控板、網(wǎng)板,請(qǐng)連上串口線,查看配置終端上是否有單板正常啟動(dòng)的顯示信息、或單板啟動(dòng)是否異常。如確認(rèn)為單板故障,請(qǐng)更換單板并將故障信息發(fā)送技術(shù)支持人員分析。單板重啟這里的單板重啟是指單板出現(xiàn)過(guò)重啟,而當(dāng)前單板狀態(tài)是Normal。通過(guò)日志或運(yùn)行時(shí)間分析重啟的時(shí)間段,確認(rèn)重啟的時(shí)間點(diǎn)附近有無(wú)用戶通過(guò)命令行reboot重啟或進(jìn)行單板上下電等操作。1005以上版本displayversion命令支持查詢單板最近一次重啟的原因。比如下面示例中“Poweron”表示單板最近一次重啟原因是掉電重啟。<Sysname>displayversionH3CComwareSoftware,Version7.1.045,Release1005Copyright(c)2004-2013HangzhouH3CTech.Co.,Ltd.Allrightsreserved.H3CS12510-Xuptimeis0weeks,4days,1hour,55minutesLastrebootreason:Coldreboot……如果所有單板同時(shí)出現(xiàn)重啟,請(qǐng)檢查設(shè)備電源模塊是否正常,確認(rèn)外部電源是否出現(xiàn)過(guò)停電,電源進(jìn)線是否插穩(wěn)、是否出現(xiàn)松動(dòng)。確認(rèn)日志中重啟時(shí)有無(wú)出現(xiàn)“SlotXneedtoberebootedautomatically!”提示信息,這種情況是不正常的。請(qǐng)更換單板并搜集故障信息并發(fā)送技術(shù)支持人員分析。確認(rèn)日志中有無(wú)Hardwareerror提示信息,設(shè)備運(yùn)行過(guò)程中單板出現(xiàn)Hardwareerror是不正常的。請(qǐng)搜集信息發(fā)送給技術(shù)支持人員分析。%@437307%May1522:03:02:1222013S12508-XDIAG/3/ERROR:Hardwareerror!chassis=1,slot=7,code=0%@437308%May1522:03:02:1222013S12508-XDIAG/3/ERROR:Hardwareerror!chassis=1,slot=7,code=1%@437309%May1522:03:02:1222013S12508-XDIAG/3/ERROR:Hardwareerror!chassis=1,slot=7,code=2如無(wú)法確認(rèn),請(qǐng)搜集故障信息并發(fā)送技術(shù)支持人員分析。電源故障故障描述設(shè)備電源指示燈異?;蛏蠄?bào)fault故障處理步驟檢查是否存在Fault或Absent狀態(tài)的電源模塊使用displaypower命令顯示電源模塊狀態(tài),查看是否存在Fault或Absent狀態(tài)的電源模塊。<HP>displaypowerPowerIDStateModeCurrent(A)Voltage(V)Power(W)1NormalAC2.6053.81139.902Absent--------3Absent--------4NormalAC1.6053.8286.115Absent--------6Absent--------7Absent--------8Absent--------如果存在Absent狀態(tài)的電源模塊,請(qǐng)前往步驟3。如果存在Fault狀態(tài)的電源模塊,請(qǐng)前往步驟4。檢查電源異常模塊查看電源異常狀態(tài):Absent或者Fault.使用displayalarm命令。[HP]displayalarmSlotLevelInfo-ERRORFan1isfaulty.-INFOPower1isabsent.-INFOPower2isabsent.-INFOPower3isabsent.-INFOPower5isabsent.-INFOPower6isabsent.-INFOPower7isabsent.-INFOPower8isabsent.如果存在Absent狀態(tài)的電源模塊,請(qǐng)前往步驟3。如果存在Fault狀態(tài)的電源模塊,請(qǐng)前往步驟4。檢查Absent狀態(tài)電源模塊如果電源模塊狀態(tài)為Absent,表示對(duì)應(yīng)槽位沒(méi)有在位的電源模塊或者電源模塊沒(méi)有安裝牢固。如果電源模塊槽位有電源模塊在位且顯示為Absent,請(qǐng)將電源模塊拆卸后重新安裝,然后使用displaypower命令查看對(duì)應(yīng)槽位電源狀態(tài)是否顯示為Normal。如果仍然顯示為Absent狀態(tài),請(qǐng)更換新電源模塊。如果更換新電源模塊后仍然顯示為Absent狀態(tài),請(qǐng)前往步驟5。檢查Fault狀態(tài)電源模塊如果存在Fault狀態(tài)電源模塊,表示該電源模塊異常,無(wú)法供電。電源處于Fault狀態(tài)可能有以下原因:(1).電源線可能沒(méi)接穩(wěn)而脫落。如果電源線脫落,那么電源的電流和電壓都會(huì)顯示為0,電源狀態(tài)顯示為Fault。請(qǐng)檢查電源是否接線,接線后使用displaypower命令查看對(duì)應(yīng)槽位電源狀態(tài)是否顯示為Normal。如果沒(méi)有恢復(fù)為Normal,請(qǐng)前往(2)。<HP>displaypowerPowerIDStateModeCurrent(A)Voltage(V)Power(W)1NormalAC2.6053.81139.902FaultAC000/*電源沒(méi)接線狀態(tài)顯示*/(2).可能是電源模塊本身溫度過(guò)高導(dǎo)致。如果電源模塊上積灰較多可能引起電源模塊溫度升高。請(qǐng)查看電源模塊積灰情況,如果灰塵較多,請(qǐng)清理灰塵,并將電源模塊拆卸后重新安裝。然后使用displaypower命令查看對(duì)應(yīng)槽位電源狀態(tài)是否顯示為Normal。如果沒(méi)有恢復(fù)為Normal,請(qǐng)將該電源模塊插入其它空閑電源模塊槽位并查看電源狀態(tài)是否為Normal。如果該電源模塊仍然顯示為Fault狀態(tài),請(qǐng)更換電源模塊。如果更換新電源模塊后仍然顯示為Fault狀態(tài),請(qǐng)前往步驟5。尋求技術(shù)支持如果上述檢查完成后故障仍無(wú)法排除,請(qǐng)聯(lián)系H3C的技術(shù)支持工程師。風(fēng)扇故障故障描述風(fēng)扇框指示燈異常,設(shè)備打印風(fēng)扇異常信息,如:%Sep2220:38:32:9472009H3Cxxxxxxx故障處理步驟風(fēng)扇框在位時(shí),用手放在設(shè)備出風(fēng)口,判斷是否有出風(fēng),如果出風(fēng)口無(wú)風(fēng),則風(fēng)扇異常檢查風(fēng)扇的入風(fēng)口、出風(fēng)口是否被擋住或積累太多灰塵。檢查風(fēng)扇框是否正常在位,各個(gè)風(fēng)扇的狀態(tài)是否正常、轉(zhuǎn)速是否相差達(dá)到50%以上。如存在異常,建議通過(guò)風(fēng)扇框拔插、更換交叉進(jìn)一步確認(rèn)。如果故障不能恢復(fù),需要更換該風(fēng)扇框,但當(dāng)前沒(méi)有風(fēng)扇框,請(qǐng)關(guān)閉設(shè)備以免發(fā)生溫度高導(dǎo)致單板燒壞;如果有降溫措施保證系統(tǒng)工作在xx度以下,可以暫時(shí)繼續(xù)使用設(shè)備。<System>displayfanFan-tray1:Status:NormalFannumber:5Fanmode:AutoAirflowDirection:Front-to-backFanStatusSpeed(rpm)1Normal37072Normal19093Normal20314Normal18635Normal1921Fan-tray2:Status:NormalFannumber:5Fanmode:AutoAirflowDirection:Front-to-backFanStatusSpeed(rpm)1Normal37762Normal19793Normal19334Normal19565Normal1969溫度告警故障描述設(shè)備打印溫度過(guò)低、過(guò)高等告警信息,如:%Sep2220:38:32:9472009H3CDEVM/4/BOARD_TEMPERATURE_TOOHIGH:BoardtemperatureistoohighonChassis1Slot5,typeisLSX1TGS48EC.故障處理步驟檢查環(huán)境溫度是否正常。如果環(huán)境溫度較高,請(qǐng)確認(rèn)原因,比如機(jī)房通風(fēng)不暢、空調(diào)制冷故障等。檢查設(shè)備當(dāng)前的temperature溫度是否超出上下的Warning、Alarm門限。也可以用手觸摸單板,確認(rèn)單板是不是很燙,如單板溫度很高,請(qǐng)立即檢查原因。持續(xù)處于較高的溫度下,可能會(huì)導(dǎo)致單板損壞。 如果溫度過(guò)高,請(qǐng)參照REF_Ref360627016\r\h2.3REF_Ref360627016\h風(fēng)扇故障確認(rèn)是否風(fēng)扇故障導(dǎo)致。 如果溫度值為error或出現(xiàn)明顯不合實(shí)際的值,可能是通過(guò)I2C總線訪問(wèn)單板溫度傳感器異常。設(shè)備光模塊信息訪問(wèn)也是通過(guò)相同的I2C總線,請(qǐng)繼續(xù)檢查單板讀取光模塊信息是否正常。如光模塊訪問(wèn)正常,請(qǐng)使用下面命令重新設(shè)置單板溫度,并通過(guò)displayenvironment查看是否設(shè)置成功。[Sysname]temperature-limitchassis1slot0hotspot1-208590<Sysname>displayenvironmentSystemtemperatureinformation(degreecentigrade):SlotSensorTemperatureLowerWarningAlarmShutdown0hotspot145-208590950hotspot24807590950hotspot34607590950hotspot44707590950hotspot54907590950hotspot64707590951hotspootspot24807590951hotspot3460759095……如果仍然無(wú)法確認(rèn)故障原因,請(qǐng)搜集信息并發(fā)送給技術(shù)支持人員協(xié)助分析。鏈路端口故障處理端口錯(cuò)包故障描述使用displayinterface命令查詢端口的入、出方向流量統(tǒng)計(jì)信息,發(fā)現(xiàn)錯(cuò)包統(tǒng)計(jì)計(jì)數(shù)不為0。<Sysname>displayinterfaceTen-gigabitethernet1/2/0/6Ten-GigabitEthernet1/2/0/6currentstate:UPIPPacketFrameType:PKTFMT_ETHNT_2,HardwareAddress:80f6-2ec3-ac04Description:SH-B15A-0202-J20-H5800-L-01-te1/0/49LoopbackisnotsetMediatypeisopticalfiber,Porthardwaretypeis10G_BASE_SR_SFP10Gbps-speedmode,full-duplexmodeLinkspeedtypeisforcelink,linkduplextypeisforcelinkFlow-controlisnotenabledTheMaximumFrameLengthis8168BroadcastMAX-ratio:100%UnicastMAX-ratio:100%MulticastMAX-ratio:100%AllowjumboframetopassPVID:1Linkdelayis2(sec)Ethernetportmode:LANPortlink-type:trunkVLANpassing:1(defaultvlan),10-28,91-93,106-108,121-123,184,401,999VLANpermitted:1(defaultvlan),2-4094Trunkportencapsulation:IEEE802.1qPortpriority:2Lastclearingofcounters:NeverPeakvalueofinput:10070bytes/sec,at2013-05-1419:11:30Peakvalueofoutput:315310bytes/sec,at2013-05-1419:56:27Last300secondsinput:0packets/sec90bytes/sec0%Last300secondsoutput:0packets/sec530bytes/sec0%Input(total):1617091packets,131185047bytes 1144855unicasts,79482broadcasts,392754multicasts,-pausesInput(normal):1617091packets,131185047bytes 1144855unicasts,79482broadcasts,392754multicasts,0pausesInput:0inputerrors,0runts,0giants,0throttles 0CRC,0frame,0overruns,-aborts -ignored,-parityerrorsOutput(total):7779022packets,862020306bytes 1138915unicasts,3567900broadcasts,3072207multicasts,-pausesOutput(normal):7779022packets,862020306bytes 1138915unicasts,3567900broadcasts,3072207multicasts,0pausesOutput:0outputerrors,-underruns,-bufferfailures 0aborts,0deferred,0collisions,0latecollisions -lostcarrier,-nocarrier端口入方向報(bào)文計(jì)數(shù)錯(cuò)誤字段解釋inputerrors:各種輸入錯(cuò)誤的總數(shù)。runts:表示接收到的超小幀個(gè)數(shù)。超小幀即接收到的報(bào)文小于64字節(jié),且包括有效的CRC字段,報(bào)文格式正確。giants:是超過(guò)端口設(shè)置的MaximumFrameLength的報(bào)文個(gè)數(shù)。CRC:表示接收到的CRC校驗(yàn)錯(cuò)誤報(bào)文個(gè)數(shù)。frame:端口接收時(shí)出錯(cuò)的報(bào)文。端口出方向報(bào)文計(jì)數(shù)錯(cuò)誤字段解釋outputerrors:各種輸出錯(cuò)誤的總數(shù)。aborts:表示發(fā)送失敗的報(bào)文總數(shù)。deferred:表示延遲報(bào)文的總數(shù)。報(bào)文延遲是指因延遲過(guò)長(zhǎng)的周期而導(dǎo)致發(fā)送失敗的報(bào)文,而這些報(bào)文由于發(fā)送媒質(zhì)繁忙而等待了超過(guò)2倍的最大報(bào)文發(fā)送時(shí)間。collisions:表示沖突幀總數(shù),即在發(fā)送過(guò)程中發(fā)生沖突的報(bào)文。latecollisions:表示延遲沖突幀,即發(fā)送過(guò)程中發(fā)生延遲沖突超過(guò)512bit時(shí)間的幀。故障處理步驟端口入方向出現(xiàn)CRC、frame、throttles錯(cuò)包且計(jì)數(shù)持續(xù)增加使用儀器測(cè)試鏈路,鏈路質(zhì)量差或者線路光信號(hào)衰減過(guò)大會(huì)導(dǎo)致報(bào)文在傳輸過(guò)程中出錯(cuò)。如鏈路故障請(qǐng)更換網(wǎng)線或光纖。如端口使用光模塊,參照REF_Ref360632157\r\h3.5REF_Ref360632159\h光模塊故障確認(rèn)是否光模塊故障導(dǎo)致。與別的正常的端口更換網(wǎng)線或光纖光模塊,如端口更換后錯(cuò)包消失,端口更換回來(lái)錯(cuò)包又再次出現(xiàn)端口相關(guān),應(yīng)為單板端口故障,請(qǐng)更換端口并將故障信息發(fā)送技術(shù)支持人員分析;如更換到其他正常端口仍會(huì)出現(xiàn)錯(cuò)包,則對(duì)端設(shè)備、中間傳輸鏈路故障的可能性較大,請(qǐng)排查。排查對(duì)端設(shè)備或者中間的傳輸設(shè)備。如故障無(wú)法確認(rèn),請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。端口入方向出現(xiàn)Overrun錯(cuò)包且計(jì)數(shù)持續(xù)增加Overrun計(jì)數(shù)是由于端口輸入速率超過(guò)端口處理能力,導(dǎo)致丟包。如果只有某一個(gè)端口收發(fā)包異常,或者某一個(gè)端口下掛設(shè)備的業(yè)務(wù)不通,同時(shí)這個(gè)單板上的其他端口都是正常的,可以多次查詢displayinterface命令:如果inputerrors有增加,且overruns沒(méi)有增加,請(qǐng)排查光纖/光模塊/對(duì)端設(shè)備;如果inputerrors有增加,且等于overruns的增加,那么可以懷疑是單板內(nèi)部擁塞或者堵死,請(qǐng)繼續(xù)判斷:如果overrun計(jì)數(shù)有增加,且Input(normal)計(jì)數(shù)沒(méi)有增加,表明所有入報(bào)文都o(jì)verrun,證明端口堵死,請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。如果overruns計(jì)數(shù)有增加,且Input(normal)計(jì)數(shù)有增加,表明部分入報(bào)文都o(jì)verrun,證明端口擁塞,請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。如果仍然無(wú)法確認(rèn),請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。端口入方向出現(xiàn)giants錯(cuò)包且計(jì)數(shù)持續(xù)增加檢查兩端的jumbo配置是否一致,如jumbo是否使能,端口默認(rèn)的最大報(bào)文長(zhǎng)度是否一致,允許最大報(bào)文長(zhǎng)度是否一致。如果仍然無(wú)法確認(rèn),請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。端口出方向出現(xiàn)錯(cuò)包且計(jì)數(shù)持續(xù)增加檢查端口是否配置為半雙工模式,如為半雙工,請(qǐng)更改為全雙工模式。如果仍然無(wú)法確認(rèn),請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。端口無(wú)法up故障描述端口無(wú)法正常Up。故障處理步驟端口無(wú)法Up測(cè)試端口之間網(wǎng)線、光纖鏈路是否正常,光纖兩端的發(fā)送/接收端是否錯(cuò)連;更換端口之間的網(wǎng)線、光纖或?qū)⒕W(wǎng)線、光纖放到別的正常端口,以確認(rèn)是否中間傳輸鏈路故障檢查本端、對(duì)端端口配置是否正確,如端口是否shutdown,速率、雙工、協(xié)商模式、MDI是否正確。[Sysname]displaycurrent-configurationinterfaceTen-gigabitethernet1/6/0/1#interfaceTen-GigabitEthernet1/6/0/1portlink-modebridgeportlink-typetrunkporttrunkpermitvlan1portlink-aggregationgroup1#Return雙工支持情況:SpeedDuplex10G1000M100M10MFullSupportSupportSupportSupportHalfNosupportNosupportNosupportNosupport 如端口使用光模塊,請(qǐng)檢查兩端光模塊類型是否一致,如速率、波長(zhǎng)、單模多模狀態(tài)等;與正常的光模塊交叉更換,并參照REF_Ref360628251\r\h3.5REF_Ref360628254\h光模塊故障排除是否為光模塊故障導(dǎo)致。[Sysname]displaytransceiverinterfaceTen-gigabitethernet2/9/0/1Ten-GigabitEthernet2/9/0/1transceiverinformation:TransceiverType:10G_BASE_LRM_SFPConnectorType:LCWavelength(nm):1310TransferDistance(m):220(50um),220(62.5um),220(om3)DigitalDiagnosticMonitoring:YESVendorName:FINISARCORP.如確認(rèn)為光模塊故障,請(qǐng)更換光模塊,并將故障信息發(fā)送技術(shù)支持人員分析。端口由Up變成Down故障描述端口狀態(tài)由Up變成Down。故障處理步驟查看本設(shè)備及對(duì)端設(shè)備日志,確認(rèn)有無(wú)端口shutdown操作。查看兩端端口狀態(tài),確認(rèn)是否為協(xié)議異?;蛟诰€診斷模塊檢測(cè)到異常將端口shutdown。如這里的Te2/8/0/1端口出現(xiàn)“Loopbackdetection

down”,是由于loopback-detection配置為shutdown,當(dāng)設(shè)備在線診斷模塊檢測(cè)到端口故障時(shí),將端口shutdown隔離,以便流量切換到備份鏈路。請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。[Sysname]displayinterfaceTen-gigabitethernet2/8/0/1Ten-GigabitEthernet2/8/0/1currentstate:DOWN(Loopbackdetection

down)IPPacketFrameType:PKTFMT_ETHNT_2,HardwareAddress:80f6-2ec3-ac05Description:SH-B15A-0202-V03-H5800-L-01-te1/0/50LoopbackisnotsetMediatypeisopticalfiber,Porthardwaretypeis10G_BASE_SR_SFP10Gbps-speedmode,full-duplexmodeLinkspeedtypeisforcelink,linkduplextypeisforcelinkFlow-controlisnotenabled……參照REF_Ref360628613\r\h3.2REF_Ref360628613\h端口無(wú)法up,排查兩端端口配置,網(wǎng)線、光模塊、光纖等鏈路是否正常。如仍無(wú)法確認(rèn),請(qǐng)搜集本端、對(duì)端設(shè)備信息,并將信息發(fā)送技術(shù)支持人員分析。端口頻繁Up/Down故障描述端口頻繁Up/Down。故障處理步驟對(duì)于光口,請(qǐng)參照REF_Ref360628823\r\h3.5REF_Ref360628826\h光模塊故障確認(rèn)光模塊是否異常。查看光模塊alarm信息來(lái)排查兩端光模塊以及中間光纖問(wèn)題;對(duì)于支持診斷功能的光模塊可以通過(guò)查看diagnosis信息確認(rèn)光模塊的光功率是否處于上下門限臨界值。如發(fā)送光功率處于臨界值,請(qǐng)更換光纖、光模塊做交叉驗(yàn)證;如接收光功率處于臨界值,請(qǐng)排查對(duì)端光模塊及中間光纖鏈路。對(duì)于電口,一般在自協(xié)商情況下容易出現(xiàn)協(xié)商不穩(wěn)定,這種情況請(qǐng)嘗試設(shè)置強(qiáng)制速率雙工。如果故障依存在,請(qǐng)排查鏈路、對(duì)端設(shè)備、中間設(shè)備。如仍無(wú)法確認(rèn),請(qǐng)將故障信息發(fā)送技術(shù)支持人員分析。光模塊故障故障描述安裝光模塊的接口不能正常工作。故障處理步驟檢查光模塊Alarm告警信息。告警信息中如果存在接收有問(wèn)題那一般是對(duì)端端口、光纖或中轉(zhuǎn)傳輸設(shè)備導(dǎo)致;如果是發(fā)送有問(wèn)題或者電流、電壓異常那就需要排查本端端口。<Sysname>displaytransceiveralarminterfaceGigabitEthernet2/0/1GigabitEthernet2/0/1transceivercurrentalarminformation:TXfaultPCSreceivelocalfaultLasertemperaturefault光模塊告警信息說(shuō)明字段描述SFP/SFP+RXlossofsignal接收信號(hào)丟失RXpowerhigh接收光功率高告警RXpowerlow接收光功率低告警TXfault發(fā)送錯(cuò)誤TXbiashigh偏置電流高告警TXbiaslow偏置電流低告警TXpowerhigh發(fā)送光功率高告警TXpowerlow發(fā)送光功率低告警Temphigh溫度高告警Templow溫度低告警Voltagehigh電壓高告警Voltagelow電壓低告警TransceiverinfoI/Oerror模塊信息讀寫(xiě)錯(cuò)誤Transceiverinfochecksumerror模塊信息校驗(yàn)和錯(cuò)誤Transceivertypeandportconfigurationmismatch模塊類型和端口配置不匹配Transceivertypenotsupportedbyporthardware端口不支持該模塊類型XFPRXlossofsignal接收信號(hào)丟失RXnotready接收狀態(tài)未就緒RXCDRlossoflockRXCDR時(shí)鐘失鎖RXpowerhigh接收光功率高告警RXpowerlow接收光功率低告警TXnotready發(fā)送狀態(tài)未就緒TXfault發(fā)送錯(cuò)誤TXCDRlossoflockTXCDR時(shí)鐘失鎖TXbiashigh偏置電流高告警TXbiaslow偏置電流低告警TXpowerhigh發(fā)送光功率高告警TXpowerlow發(fā)送光功率低告警Modulenotready模塊狀態(tài)未就緒APDsupplyfaultAPD(AvalanchePhotoDiode,雪崩光電二極管)錯(cuò)誤TECfaultTEC(ThermoelectricCooler,熱電冷卻器)錯(cuò)誤Wavelengthunlocked光信號(hào)波長(zhǎng)失鎖Temphigh溫度高告警Templow溫度低告警Voltagehigh電壓高告警Voltagelow電壓低告警TransceiverinfoI/Oerror模塊信息讀寫(xiě)錯(cuò)誤Transceiverinfochecksumerror模塊信息校驗(yàn)錯(cuò)誤Transceivertypeandportconfigurationmismatch模塊類型和端口配置不匹配Transceivertypenotsupportedbyporthardware端口不支持該模塊類型檢查光模塊的接收、發(fā)送光功率是否正常(即在該光模塊的光功率上下門限值之內(nèi))。H3C定制光模塊的接收光功率、發(fā)送光功率可以通過(guò)displaytransceiverdiagnosis命令查詢到(非H3C定制的光模塊可能查詢不到)。[Sysname]displaytransceiverdiagnosisinterfaceGigabitEthernet2/0/1GigabitEthernet2/0/1transceiverdiagnosticinformation:Currentdiagnosticparameters:Temp.(℃)Voltage(V)Bias(mA)RXpower(dBM)TXpower(dBM)403.341.13-10.430.20H3C定制光模塊的光功率上下門限值可以通過(guò)下面方式查看(二選一):部分GE端口光模塊通過(guò)_displaytransceiverinterface命令查詢接收光功率、發(fā)送光功率的上下門限值。[Sysname_hidecmd]_displaytransceiverinterfaceGigabitEthernet2/0/1GigabitEthernet2/0/1transceiverinformation:TransceiverType:10G_BASE_LRM_SFPConnectorType:LCWavelength(nm):1310TransferDistance(m):220(50um),220(62.5um),220(om3)DigitalDiagnosticMonitoring:YESVendorName:FINISARCORP.Max.TXPower(dBm):0.5Min.TXPower(dBm):-6.5Min.RXPower(dBm):-6.0Max.RXPower(dBm):1.5OriginalManufacturer:FINISARCORP.PartNumber:FTLX1371D3BCL-HCRevNumber:ASerialNumber:UG903SLProductDate:09-09-1410GE端口及部分GE端口光模塊需通過(guò)命令_displaytransceiverdiagnosisinterface查詢接收光功率、發(fā)送光功率的上下門限值。[Sysname-hidecmd]_displaytransceiverdiagnosisinterfaceTen-gigabitethernet1/6/0/1Ten-GigabitEthernet1/6/0/1transceiverdiagnosticinformation:Currentdiagnosticparameters:Temp.(°C)Voltage(V)Bias(mA)RXpower(dBM)TXpower(dBM)433.3745.200.08-2.41Alarmthresholds:Temp.(°C)Voltage(V)Bias(mA)RXpower(dBM)TXpower(dBM)High833.6380.002.501.50Low-13

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論