锐捷S2628G-I 设备上线到INC之后反复重启

一、故障现象描述

设备上线到INC后就反复重启,从INC上删除后就恢复正常了。

二、故障排查分析

  1. 查看配置,没有配置定时重启;
  2. 收集设备的异常信息:debug support show exception,发现上线到INC的时间段内,存在大量的堆栈信息,其中异常的进程为r1_ssh-1
  1. 研发侧对堆栈进行解析,发现为ssh进程异常导致,命中之前的已知问题:设备端ssh密钥交互完成,对密钥的缓冲区进行释放。但是有些ssh客户端支持密钥的重新交互保证数据交互的安全性,因此设备端在重新接收到SSH2_MSG_KEXINIT报文之后,使用释放的缓冲区处理数据,导致出现堆栈;

三、故障根因说明

在ssh密钥交互完成,且shell终端已经创建后,设备端又收到ssh客户端的密钥交互的报文SSH2_MSG_KEXINIT,但是在第一次ssh密钥交互之后,就把密钥交互的缓冲区内存释放。多次密钥交换导致设备端使用已经释放的内存出现设备死机。

四、故障解决方案

部分设备可以升级到10.4(3b18)版本进行解决,若设备没有该版本,只能不上线INC进行规避。

 

阅读剩余
THE END