FusionCompute V100R003C00 Datastore数据磁盘异常残留导致虚拟机一直处于故障恢复

问题描述

ALM-15.1005004 主机关联的数据存储异常。
CNA主机上的datastore显示异常:

告警信息

ALM-15.1005004 主机关联的数据存储异常。

处理过程

1. 检查存储状态
#upadm show path    //检查存储链路,发现有一半链路异常,一半正常
#iscsiadm -m session   //检查iscsi连接,发现存储iqn登录正常
#mount                       //检查lun是否在主机上被识别,都正常

2. 检查数据存储状态
#cd /POME
#ll
ls: cannot access datastore_20: Input/output error
d?????????  ? ?             ?                            ?   datastore_20

可以看到datastore_20 IO失败,并且在list命令中显示乱码,所以确认datastore_20异常。

3. 强制卸载datastore_20
#tap-ctl list            //可以看到datastore_20有残留,导致HA 虚拟机失败

#tap-ctl destroy -m 52 -p 7974    //手动清除datastore_20残留

手动清除数据存储残留后,因数据存储卸载成功,虚拟机重新在CNA主机上启动,并自动恢复。

#xm list     //检查虚拟机启动情况

根因

后端存储异常导致datastore卸载超时,VIMS进行HA虚拟机失败。

解决方案

手动清除数据存储残留

建议与总结

阅读剩余
THE END