锐捷S7805C 直连S29 ping丢包
一、故障现象
交换机作为网络核心设备,新部署的S7805C与S29互ping存在丢包现象。
场景拓扑如下
二、故障排查分析
-
通过acl计数,发现S29 ping S78,S78收到并且发出5个包,此时S29仅收到一个包,而S78 ping S29,S78发出5个包,但此时S29未收到包,可以判断丢包点是在S78设备丢包或者是物理链路上丢包;
-
判断两端接口不存在drop、crc问题,并且接口光衰均正常。排除接口链路问题;
-
替换测试验证设备接口是否故障,同根链路同个模块,替换到S78的te1/2/28口正常不丢包,接回S78的te1/1/28口丢包。判断是S78设备的单点接口故障;
-
从上述排查中有一个异常点:S78的te1/1/28口存在丢包,但第一步判断丢包点的acl计数操作可以匹配到出接口的发出方向的流量。说明故障位置是在ACL过滤以后的组件上,怀疑是流量送到设备cpu处理后,acl计数的顺序在送cpu处理之前,导致被接口的acl计数匹配中。因此进一步分析线卡异常,根据收集的线卡的死机信息,明确该线卡存在大量故障期间的exception,exception信息“ERROR L2C_INT_REG[BIGWR]: Write reference past L2C_BIG_CTL[MAXDRAM] occurred”,此信息说明线卡存在L2C硬件 L2C_INT_REG访问芯片寄存器执行写操作异常,引发exception。
打印以下log是在CPU出现以下几种情况:sec_err,ded_err,rem_fault,loc_fault,均属于线卡CPU器件。
综上,可以说明线卡CPU异常,判断线卡存在硬件故障。
三、故障根因说明
当前S78设备的2线卡CPU 寄存器写操作异常,导致控制面报文处理异常,产生设备发包丢包,属于硬件故障问题,需要维修设备。
四、故障解决方案
线卡CPU异常,判断线卡存在硬件故障,建议客户走寄送修流程。
寄送修指南:微信公众号“锐捷服务”--“服务支持”--“自助保修”中自行保修。
版权声明:
作者:SE_You
链接:https://www.cnesa.cn/2597.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。
THE END
0
二维码
打赏
海报
锐捷S7805C 直连S29 ping丢包
一、故障现象
交换机作为网络核心设备,新部署的S7805C与S29互ping存在丢包现象。
场景拓扑如下
二、故障排查分析
通过acl计数,发现S29 ping S78,S78收到并且发出5个包,此时S29仅收到一个包,而S78 ping S29,S78发出5个包,但此时S29未收到包,可以判断丢包点是在S78设备丢包或者是物理链路上丢包;
判断两端接口不存在drop、crc问题,并且接口光衰均正常。排除接口链路问题;
替换测试验证设备接口是否故障,同根链路同个模块,替换到S78的te1/2/28口正常不丢包,接回S78的te1/1/28口丢包。判断是S78设备的单点接口故障;
从上述排查中有一个异常点:S78的te1/1/28口存在丢包,但第一步判断丢包点的acl计数操作可以匹配到出接口的发出方向的流量。说明故障位置是在ACL过滤以后的组件上,怀疑是流量送到设备cpu处理后,acl计数的顺序在送cpu处理之前,导致被接口的acl计数匹配中。因此进一步分析线卡异常,根据收集的线卡的死机信息,明确该线卡存在大量故障期间的exception,exception信息“ERROR L2C_INT_REG[BIGWR]: Write reference past L2C_BIG_CTL[MAXDRAM] occurred”,此信息说明线卡存在L2C硬件 L2C_INT_REG访问芯片寄存器执行写操作异常,引发exception。
打印以下log是在CPU出现以下几种情况:sec_err,ded_err,rem_fault,loc_fault,均属于线卡CPU器件。
综上,可以说明线卡CPU异常,判断线卡存在硬件故障。
三、故障根因说明
当前S78设备的2线卡CPU 寄存器写操作异常,导致控制面报文处理异常,产生设备发包丢包,属于硬件故障问题,需要维修设备。
四、故障解决方案
线卡CPU异常,判断线卡存在硬件故障,建议客户走寄送修流程。
寄送修指南:微信公众号“锐捷服务”--“服务支持”--“自助保修”中自行保修。
共有 0 条评论