FusionComputer PVDriver版本过低导致虚拟机之间数据拷贝速率低

问题描述

虚拟机A上运行着业务系统服务器,在虚拟机B上(客户端)通过浏览器访问虚拟机A的web页面,并进行数据上传操作,发现上传速度很慢,只有几十K/S。
进一步测试虚拟机A和虚拟机B拷贝速率,两台虚拟机相互拷贝数据,速率7M/S(正常情况下,同一局域网内的数据拷贝速率能达到几十M/S),该速率存在异常。
两个E6000上的计算节点分别有两台虚拟机A与B,虚拟机位置如下图:

告警信息

处理过程

升级虚拟机PVDriver版本到虚拟化平台对应版本,升级方式如下:
虚拟机数量较少时,建议手动为虚拟机重新安装PVDriver。参照产品文档如下章节:“操作与维护--->虚拟机管理--->Tools管理--->卸载Tools”。
虚拟机数量较多时,建议使用升级工具进行一并推送升级。详情请参照support网站升级安装指南,下载网址:http://support.huawei.com/enterprise/docinforeader.action?contentId=DOC1000027996&idPath=7919749|7919788|9856606|8576912

注意:
升级虚拟机PVDriver版本后需重启虚拟机生效,版本升级前需和客户做好沟通。

根因

  1. 排查虚拟机所在主机到共享存储的读写速率,发现主机到共享存储读写速率正常,如下图所示:
  1. 使用Jperf工具检测虚拟机A和虚拟机B之间的网络参数,发现网络带宽极不稳定,丢包严重。
  1. 根据以上分析问题根因为网络异常导致,根据虚拟机A到虚拟机B的数据包传输路径进项分段排查,传输路径:“虚拟机A->CNA13的Domain0->CNA13主机物理网卡->交换板->CNA04主机物理网卡->CNA04的Domain0->虚拟机B”。
  2. 首先检查“CNA13主机物理网卡->交换板->CNA4主机物理网卡”,从CNA13主机长PING CNA04主机,发现主机之间网络稳定,无抖动发生。

CNA13:~ # ping 192.168.8.19
PING 192.168.183.13 (192.168.183.13) 56(84) bytes of data.
64 bytes from 192.168.183.13: icmp_seq=1 ttl=64 time=0.238 ms
64 bytes from 192.168.183.13: icmp_seq=2 ttl=64 time=0.233 ms
64 bytes from 192.168.183.13: icmp_seq=3 ttl=64 time=0.236 ms
64 bytes from 192.168.183.13: icmp_seq=4 ttl=64 time=0.239 ms

  1. 进一步检查“虚拟机A->CNA13的Domain0”的通信机制,现网从SingleCloud V100R002C01版本割接到FusionCompute V100R003C00SPC300版本,虚拟机A上安装的PVDriver版本为1.1.5.28,而Domain0的PVDriver版本为1.2.0.42,存在前后端驱动版本不一致的问题。

  1.  升级虚拟机A的PVDriver版本,虚拟机A到虚拟机B的拷贝速率得到成倍提升,进一步升级虚拟机B的PVDriver版本,数据拷贝速率回归正常。

建议与总结

阅读剩余
THE END