锐捷设备异常重启排查SOP
一、故障现象:
交换机整机或者线卡异常重启。
二、组网拓扑
单台交换机不涉及组网拓扑。
三、可能原因:
-
现场电源环境存在问题导致了设备异常重启;
-
由于软件逻辑错误导致了设备异常重启;
四、处理步骤:
步骤一: 排查现场环境是否正常
-
从外观查看电源线是否插紧,是否松动,线缆松动可能造成供电不稳定,设备异常重启;若可以最好对电源、插座部分进行拍照,同时检查同机柜其他设备是否有重启;
-
排查供电系统功率是否达到电源的额定输入功率,另外如果是双电源的机箱式设备,需要将线路分类别连接在不同线路的插排上,避免由于单系统输入不足;
-
现场环境温度是否过高,当设备温度超过设定阈值时会触发设备的重启动作导致设备重启;
步骤二:排查异常重启后的设备日志是否正常
-
查看重启对应的时间节点是否有异常log打印,可以通过show log来查看对应时间节点的日志打印情况,如果异常时间点日志被覆盖可以通过收集底层的syslog文件查看;
-
启动后查看交换机是否有死机堆栈信息,通过show exception进行查看,如下代表无死机信息
若以上排查无问题联系400协助核查;
五、故障信息收集:
11.X死机信息收集:
开shell:
封shell:
12.X死机信息收集:
收集以下信息加一键信息收集:
ruijie#ter len 0
show clock
show version
show version detail
show version slot
show switch virtual config
show switch virtual link port
show vsl app port 0
show power
show power detail
show fan
show fan detail
show run
show upgrade auto
show log
show exception
show exception slot all
show reboot-reason
show reboot-reason detail
show reboot-reason all
show coredump files
show cli record
show security-log detail all
show upgrade history
show uptime history
show psh self
ter len 50
六、总结和建议
设备异常重启首先检查电源环境,电源环境无异常的情况下基本就是设备软硬件异常。
版权声明:
作者:SE_You
链接:https://www.cnesa.cn/2865.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。
THE END
0
二维码
打赏
海报
锐捷设备异常重启排查SOP
一、故障现象:
交换机整机或者线卡异常重启。
二、组网拓扑
单台交换机不涉及组网拓扑。
三、可能原因:
现场电源环境存在问题导致了设备异常重启;
由于软件逻辑错误导致了设备异常重启;
四、处理步骤:
步骤一: 排查现场环境是否正常
从外观查看电源线是否插紧,是否松动,线缆松动可能造成供电不稳定,设备异常重启;若可以最好对电源、插座部分进行拍照,同时检查同机柜其他设备是否有重启;
排查供电系统功率是否达到电源的额定输入功率,另外如果是双电源的机箱式设备,需要将线路分类别连接在不同线路的插排上,避免由于单系统输入不足;
现场环境温度是否过高,当设备温度超过设定阈值时会触发设备的重启动作导致设备重启;
步骤二:排查异常重启后的设备日志是否正常
查看重启对应的时间节点是否有异常log打印,可以通过show log来查看对应时间节点的日志打印情况,如果异常时间点日志被覆盖可以通过收集底层的syslog文件查看;
启动后查看交换机是否有死机堆栈信息,通过show exception进行查看,如下代表无死机信息
若以上排查无问题联系400协助核查;
五、故障信息收集:
11.X死机信息收集:
开shell:
11.X设备异常脚本(开shell)
封shell:
11.X设备异常脚本(封shell)
12.X死机信息收集:
收集以下信息加一键信息收集:04 交换机一键信息收集功能使用指导
ruijie#ter len 0
show clock
show version
show version detail
show version slot
show switch virtual config
show switch virtual link port
show vsl app port 0
show power
show power detail
show fan
show fan detail
show run
show upgrade auto
show log
show exception
show exception slot all
show reboot-reason
show reboot-reason detail
show reboot-reason all
show coredump files
show ……
共有 0 条评论