FusionComputer同一网段两台虚拟机能够PING通,不能SSH到对方的故障处理案例

问题描述

FusionCompute创建两个分布在不同CAN上的管理平面虚拟机,互相能够PING通,也能SSH到对方,切换虚拟机端口组到业务平面端口组(两个虚拟机使用同一端口组),互相能够PING通,不能SSH到对方。
服务器:E9K
网卡:MZ510扣卡  BE3 10GE网卡
版本:FusionSphereR3C00SPC300

告警信息

FusionCompute同一网段两台虚拟机能够PING通,在业务网络不能SSH到对方,但在管理网络能够互相ssh对方

处理过程

1. 1. 查看虚拟机上SSH服务是否启动:ps –ef | grep ssh

结果:正常
2. 2. 查看虚拟机ssh端口是否正常: netstat –alt

3. 将虚拟机上iptables规则全部清空:iptables –F
结果:虚拟机仍然不能SSH到对方
4. 将虚拟机的pv-driver卸载
结果:虚拟机能SSH到对方
5. 安装虚拟机pv-driver,将两台虚拟机迁移到同一主机上
结果:虚拟机然SSH到对方
步骤5与局点现象相比,差异点是数据包一个不出CAN,一个出CAN,因此怀疑可能网卡驱动存在问题
6. 查看网卡驱动版本: ethtool –i eth0
linux-JyRAav:/home/GalaX8800 # ethtool -i eth0
driver: be2net
version: 4.1.402.6
firmware-version: 4.4.262.3
bus-info: 0000:02:00.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: no发现be2net网卡驱动版本与固件版本不一致,此前在山西孝义局点出现过版本不一致导致创建虚拟机慢(经分析是存储面丢包)

根因

Be2net网卡驱动版本与固件版本不一致的情况下,会出现各种网络问题(比如丢包,收发带有vlan标签的数据包时有时剥离vlan标签,有时不剥离)。

建议与总结

升级主机domain0的网卡驱动版本,与微码版本保持一致。
具体升级办法:
此处内容需要回复后并刷新才能查看
阅读剩余
THE END