锐捷S2910E 多台设备反复异常重启

一、故障现象描述

某客户使用我司2910C设备作为接入交换机,多台设备反复出现多次异常重启的情况。
设备型号:RG-S2910C-24GT2XS-HP-E
设备版本:S29_RGOS 11.4(1)B70P1

二、故障排查分析

  1. 接到客户方报障多台2910C出现重启行为,分析设备日志以及软件记录信息,核查均为冷重启,且软件上无任何异常记录。
  1. 核查对应软件内部BUG库,并未找到会导致设备异常重启的软件BUG,结合客户方多台设备异常重启,初步怀疑异常时间设备供电异常导致。
  2. 针对客户方8台2910C设备重启行为和重启时间进行梳理,寻找对应规律和行为特征。
  1. 对应设备行为和重启时间上没有明显的特征,与客户方明确对应环境接线以及环境供电方面差异。明确对应供电S2910C=>UPS=>PDU=>市电。
  1. 派遣对应省区一线前往现场进行环境供电核实以及排查,发现对应客户方市电确实存在不稳情况,电脑直连PDU情况下,出现了掉电的情况;
  2. 基于市电不稳的固有背景条件下,核查对应同一UPS下,为什么仅有我司设备存在重启行为。现场通过多次拔插对应UPS供电,模拟市电不稳环境因素,成功复现S2910C重启,友商设备未重启情况。
  3. 了解对应UPS切换间断时间为4-8ms,内部拉通核实2910C当前使用电源模块切换间断为6ms,与UPS参数存在差异,当UPS间断时间超6ms,就会导致电源模块下电设备重启行为。

三、故障根因说明

我司当前型号适配电源模块实测切换时间在6ms,客户方当前UPS的切换间断为4-8ms,当UPS间断时间大于6ms,就会导致设备掉电重启,考虑电源模块单体和UPS单体之间的差异(叠加客户方市电不稳的固有环境因素),概率性会出现部分电源模块出现在UPS切换时掉电导致设备重启的行为。

四、故障解决方案

1、针对当前电源模块线路进行整改,整改后对应切换间断时间可达到12ms,满足客户方UPS切换间断要求。

五、经验总结

1、按照百度的业内要求,通常转换时间在10MS以内均可满足要求。
2、若是出现批量冷重启的情况,可以着重关注一下对应供电环境。

版权声明:
作者:SE_You
链接:https://www.cnesa.cn/2606.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
锐捷S2910E 多台设备反复异常重启
一、故障现象描述 某客户使用我司2910C设备作为接入交换机,多台设备反复出现多次异常重启的情况。 设备型号:RG-S2910C-24GT2XS-HP-E 设备版本:S29_RGOS 11.4(1)B70P1 二、故障排查分析 接到客户方报障多台2910C出现重启行为,分析设备日志以及软件记录信息,核查均为冷重启,且软件上无任何异常记录。 核查对应软件内部BUG库,并未找到会导致设备异常重启的软件BUG,结合客户方多台设备异常重启,初步怀疑异常时间设备供电异常导致。 针对客户方8台2910C设备重启行为和重启时间进行梳理,寻找对应规律和行为特征。 对应设备行为和重启时间上没有明显的特征,与客户方明确对应环境接线以及环境供电方面差异。明确对应供电S2910C=>UPS=>PDU=>市电。 派遣对应省区一线前往现场进行环境供电核实以及排查,发现对应客户方市电确实存在不稳情况,电脑直连PDU情况下,出现了掉电的情况; 基于市电不稳的固有背景条件下,核查对应同一UPS下,为什么仅有我司设备存在重启行为。现场通过多次拔插对应UPS供电,模拟市电不稳环境因素,成功复现S2910C重启,友商设备未重启情况。 了解对应UPS切换间断时间为4-8ms,内部拉通核实2910C当前使用电源模块切换间断为6ms,与UPS参数存在差异,当UPS间断时间超6ms,就会导致电源模块下电设备重启行为。 三、故障根因说明 我司当前型号适配电源模块实测切换时间在6ms,客户方当前UPS的切换间断为4-8ms,当UPS间断时间大于6ms,就会导致设备掉电重启,考虑电源模块单体和UPS单体之间的差异(叠加客户方市电不稳的固有环境因素),概率性会出现部分电源模块出现在UPS切换时掉电导致设备重启的行为。 四、故障解决方案 1、针对当前电源模块线路进行整改,整改后对应切换间断时间可达到12ms,满足客户方UPS切换间断要求。 五、经验总结 1、按照……
<<上一篇
下一篇>>