FusionCompute产品CNA节点重启问题

问题描述

某服务器虚拟化局点采用RH5885服务器作为CNA节点,两台CNA节点发生重启。

告警信息

处理过程

分别收集两台CNA的message日志分析,message日志显示现网2台CNA分别在15:38和19:50左右出现了异常重启。
1. 分析19:50重启后生成dump的文件,从dump信息看该节点重启原因为系统lpfc驱动异常触发。

2. 15:38分重启原因从串口日志中可以看出同样是由于lpfc驱动异常导致。

现网FusionSphere版本为R3C00SPC200,lpfc驱动版本为8.3.5.48.3p,经研发确认该版本驱动小概率异常情况下会导致服务器重启。FusionCompute R3C00SPC300版本已经修复该问题(驱动lpfc升级为8.3.7.18版本),现网升级到FusionCompute R3C00SPC300版本后问题解决。

根因

对于服务器重启问题,需要通过操作系统message日志和dump日志来分析问题原因。

建议与总结

针对RH5885服务器的lpfc驱动问题在已发布的FusionAdaptor版本修复,并在FusionCompute R3C00SPC300及R3C10版本合入,考虑到在FusionCompute R3C00SPC200使用RH5885的局点很少,且均已完成FusionAdaptor补丁安装。后续的新局点使用FusionCompute R3C00SPC300及R3C10版本交付。

版权声明:
作者:SE_You
链接:https://www.cnesa.cn/1623.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。

THE END
打赏
海报
FusionCompute产品CNA节点重启问题
问题描述 某服务器虚拟化局点采用RH5885服务器作为CNA节点,两台CNA节点发生重启。 告警信息 无 处理过程 分别收集两台CNA的message日志分析,message日……
<<上一篇
下一篇>>