锐捷设备异常重启排查SOP

一、故障现象:

交换机整机或者线卡异常重启。

二、组网拓扑

单台交换机不涉及组网拓扑。

三、可能原因:

  1. 现场电源环境存在问题导致了设备异常重启;
  2. 由于软件逻辑错误导致了设备异常重启;

四、处理步骤:

步骤一: 排查现场环境是否正常

  1. 从外观查看电源线是否插紧,是否松动,线缆松动可能造成供电不稳定,设备异常重启;若可以最好对电源、插座部分进行拍照,同时检查同机柜其他设备是否有重启;
  2. 排查供电系统功率是否达到电源的额定输入功率,另外如果是双电源的机箱式设备,需要将线路分类别连接在不同线路的插排上,避免由于单系统输入不足;
  3. 现场环境温度是否过高,当设备温度超过设定阈值时会触发设备的重启动作导致设备重启;

步骤二:排查异常重启后的设备日志是否正常

  1. 查看重启对应的时间节点是否有异常log打印,可以通过show log来查看对应时间节点的日志打印情况,如果异常时间点日志被覆盖可以通过收集底层的syslog文件查看;
  2. 启动后查看交换机是否有死机堆栈信息,通过show exception进行查看,如下代表无死机信息
若以上排查无问题联系400协助核查;

五、故障信息收集:

11.X死机信息收集:

开shell:
封shell:

12.X死机信息收集:

收集以下信息加一键信息收集:04 交换机一键信息收集功能使用指导
ruijie#ter len 0
show clock
show version
show version detail
show version slot
show switch virtual config
show switch virtual link port
show vsl app port 0
show power
show power detail
show fan
show fan detail
show run
show upgrade auto
show log
show exception
show exception slot all
show reboot-reason
show reboot-reason detail
show reboot-reason all
show coredump files
show cli record
show security-log detail all
show upgrade history
show uptime history
show psh self
ter len 50

六、总结和建议

设备异常重启首先检查电源环境,电源环境无异常的情况下基本就是设备软硬件异常。

 

版权声明:
作者:SE_You
链接:https://www.cnesa.cn/2865.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
锐捷设备异常重启排查SOP
一、故障现象: 交换机整机或者线卡异常重启。 二、组网拓扑 单台交换机不涉及组网拓扑。 三、可能原因: 现场电源环境存在问题导致了设备异常重启; 由于软件逻辑错误导致了设备异常重启; 四、处理步骤: 步骤一: 排查现场环境是否正常 从外观查看电源线是否插紧,是否松动,线缆松动可能造成供电不稳定,设备异常重启;若可以最好对电源、插座部分进行拍照,同时检查同机柜其他设备是否有重启; 排查供电系统功率是否达到电源的额定输入功率,另外如果是双电源的机箱式设备,需要将线路分类别连接在不同线路的插排上,避免由于单系统输入不足; 现场环境温度是否过高,当设备温度超过设定阈值时会触发设备的重启动作导致设备重启; 步骤二:排查异常重启后的设备日志是否正常 查看重启对应的时间节点是否有异常log打印,可以通过show log来查看对应时间节点的日志打印情况,如果异常时间点日志被覆盖可以通过收集底层的syslog文件查看; 启动后查看交换机是否有死机堆栈信息,通过show exception进行查看,如下代表无死机信息 若以上排查无问题联系400协助核查; 五、故障信息收集: 11.X死机信息收集: 开shell: 11.X设备异常脚本(开shell) 封shell: 11.X设备异常脚本(封shell) 12.X死机信息收集: 收集以下信息加一键信息收集:04 交换机一键信息收集功能使用指导 ruijie#ter len 0 show clock show version show version detail show version slot show switch virtual config show switch virtual link port show vsl app port 0 show power show power detail show fan show fan detail show run show upgrade auto show log show exception show exception slot all show reboot-reason show reboot-reason detail show reboot-reason all show coredump files show ……
<<上一篇
下一篇>>