锐捷S5760C-X 所有端口都不亮

一、故障现象描述

交换机所有端口指示灯不亮,设备系统灯处于闪烁状态。

二、故障排查分析

  1. console登录没有任何信息输出;
  2. 同步现场@@@@m收集信息,发现信息输入@@@@m时设备有自动发生重启行为,正常情况下热键收集信息是不会重启设备的;
  3. 设备重启后可以正常登录设备,此时设备运行状态正常,带外管理业务也恢复正常。在进一步收集日志信息过程中,设备又异常自动重启;
  4. 通过收集的信息分析现场此设备存在大量的exception信息,提示“The ecc more than 1-bit error”以及“0 LMC DDR ECC ERROR ”
  5. 将异常信息反馈研发,经过分析确认是CPU出现DDR ECC错误触发中断导致的,属于硬件问题。DDR ECC中断会打印日志“The ecc more than 1-bit error”,如果DDR ECC错误严重会导致设备死机,死机LOG里面会提示“0 LMC DDR ECC ERROR ”。同时,判断步骤2里面出现重启也是由于DRR异常导致的重启。

三、故障根因说明

现场设备CPU出现DDR ECC错误触发中断导致的,进而导致设备重启。

四、故障解决方案

将异常交换机进行送修更换。

五、故障总结

异常信息里面出现日志“The ecc more than 1-bit error”以及“0 LMC DDR ECC ERROR ”,大概率是设备DDR异常导致查的,需要判断下设备是否存在硬件故障。
阅读剩余
THE END