锐捷S5760C-48GT4XS-X 设备异常重启

一、故障现象描述

现场S5760C-48GT4XS-X交换机未做任何操作突然异常重启。

二、故障排查分析

  1. 通过命令show reboot-reason查看设备的重启原因,提示有死机信息;
  1. 进一步通过命令show exception 查看异常堆栈信息,发现设备重启的原因是系统内核 panic 导致设备重启,由于hung_task进程检测到有进程异常挂死,触发内核重启设备。但是在堆栈信息没有记录到异常的进程信息。截图如下:
  1. 由于日志信息不足,无法明确哪个进程出现问题导致设备重启的。由于此故障非必现且之前类似故障内部一直未复现故障,同时考虑到客户业务稳定性,建议现场返修此设备。

三、故障根因说明

此故障目前判断属于硬件单体故障。目前通过分析导致设备重启的原因是系统内核 panic 导致设备重启,由于hung_task进程检测到有进程异常挂死,触发内核重启设备,但是目前通过堆栈信息没有看到具体的进程,经过分析判断怀疑是由于信息记录被从刷掉了。基于现场业务稳定性考虑,建议将异常重启的设备进行返修,保障业务稳定运行。截图如下:

四、故障解决方案

建议现场返修此设备。

 

版权声明:
作者:SE_You
链接:https://www.cnesa.cn/2863.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
锐捷S5760C-48GT4XS-X 设备异常重启
一、故障现象描述 现场S5760C-48GT4XS-X交换机未做任何操作突然异常重启。 二、故障排查分析 通过命令show reboot-reason查看设备的重启原因,提示有死机信息; 进一步通过命令show exception 查看异常堆栈信息,发现设备重启的原因是系统内核 panic 导致设备重启,由于hung_task进程检测到有进程异常挂死,触发内核重启设备。但是在堆栈信息没有记录到异常的进程信息。截图如下: 由于日志信息不足,无法明确哪个进程出现问题导致设备重启的。由于此故障非必现且之前类似故障内部一直未复现故障,同时考虑到客户业务稳定性,建议现场返修此设备。 三、故障根因说明 此故障目前判断属于硬件单体故障。目前通过分析导致设备重启的原因是系统内核 panic 导致设备重启,由于hung_task进程检测到有进程异常挂死,触发内核重启设备,但是目前通过堆栈信息没有看到具体的进程,经过分析判断怀疑是由于信息记录被从刷掉了。基于现场业务稳定性考虑,建议将异常重启的设备进行返修,保障业务稳定运行。截图如下: 四、故障解决方案 建议现场返修此设备。  
<<上一篇
下一篇>>