锐捷S6150X 设备异常复位重启

一、故障现象描述

某客户使用我司S6150X交换机组VSU做汇聚设备,突发出现VSU 1机异常重启的情况。
设备型号:S6150-48VS8CQ-X
设备版本:S6150-X_RGOS 12.6(2)B1302, Release(09192208)

二、故障排查分析

  1. 分析对应设备日志以及重启记录,发现对应重启根因是因为VSU加入(异常时间段VSU主为2机),被当前VSU主机复位重置。
  1. 根据点1,需要进一步核查VSU分裂根因,核查日志,发现主要是两个VSL接口突发down,VSL均down,VSU无法进行报文交互保活分裂。
  1. 与客户方核查对应时间段,机房并无任何人员进行维护,两根VSL均down,物理模块光纤同时出问题可能性较低,排除人为或者模块光纤等环境问题。
  2. 拉通后台沟通,多个接口同时down,主要核查PHY\CPLD等是否存在异常。
PHY芯片:用于端口物理层信号协商和物理链路的对接。
CPLD:用于控制光模块发光、监听模块在位
  1. 检查发现当前设备命中CPLD版本缺陷问题,当前6150X的CPLD版本较老(210913),该版本已知有低概率引起端口21~48口发生up/down。客户端设备只用到后面28口的其中4个端口(即45~48口),软件分析由于这4口同时发生up/down触发VSU分裂复位重启,且故障发生时设备第1~20口未发生up/down。符合已知问题的现象,所以判断本次故障由于CPLD旧版本引起。
  2. 现场升级CPLD版本后,持续性观察1个月,未在出现相关接口异常down情况。

三、故障根因说明

CPLD版本异常,低概率会导致21~48口up/down,导致对应VSU分裂重组复位备机。

四、故障解决方案

1、升级CPLD版本。//需要注意升级CPLD版本后,必须下电冷重启才能生效,不能进行热重启。

五、经验总结

1、6150X出现异常多个接口同时UP/DOWN,可检查是否为CPLD版本异常导致。

 

版权声明:
作者:SE_You
链接:https://www.cnesa.cn/2859.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
锐捷S6150X 设备异常复位重启
一、故障现象描述 某客户使用我司S6150X交换机组VSU做汇聚设备,突发出现VSU 1机异常重启的情况。 设备型号:S6150-48VS8CQ-X 设备版本:S6150-X_RGOS 12.6(2)B1302, Release(09192208) 二、故障排查分析 分析对应设备日志以及重启记录,发现对应重启根因是因为VSU加入(异常时间段VSU主为2机),被当前VSU主机复位重置。 根据点1,需要进一步核查VSU分裂根因,核查日志,发现主要是两个VSL接口突发down,VSL均down,VSU无法进行报文交互保活分裂。 与客户方核查对应时间段,机房并无任何人员进行维护,两根VSL均down,物理模块光纤同时出问题可能性较低,排除人为或者模块光纤等环境问题。 拉通后台沟通,多个接口同时down,主要核查PHY\CPLD等是否存在异常。 PHY芯片:用于端口物理层信号协商和物理链路的对接。 CPLD:用于控制光模块发光、监听模块在位 检查发现当前设备命中CPLD版本缺陷问题,当前6150X的CPLD版本较老(210913),该版本已知有低概率引起端口21~48口发生up/down。客户端设备只用到后面28口的其中4个端口(即45~48口),软件分析由于这4口同时发生up/down触发VSU分裂复位重启,且故障发生时设备第1~20口未发生up/down。符合已知问题的现象,所以判断本次故障由于CPLD旧版本引起。 现场升级CPLD版本后,持续性观察1个月,未在出现相关接口异常down情况。 三、故障根因说明 CPLD版本异常,低概率会导致21~48口up/down,导致对应VSU分裂重组复位备机。 四、故障解决方案 1、升级CPLD版本。//需要注意升级CPLD版本后,必须下电冷重启才能生效,不能进行热重启。 五、经验总结 1、6150X出现异常多个接口同时UP/DOWN,可检查是否为CPLD版本异常导致。  
<<上一篇
下一篇>>