FusionCompute V100R003C00 Datastore数据磁盘异常残留导致虚拟机一直处于故障恢复

问题描述

ALM-15.1005004 主机关联的数据存储异常。
CNA主机上的datastore显示异常:

告警信息

ALM-15.1005004 主机关联的数据存储异常。

处理过程

1. 检查存储状态
#upadm show path    //检查存储链路,发现有一半链路异常,一半正常
#iscsiadm -m session   //检查iscsi连接,发现存储iqn登录正常
#mount                       //检查lun是否在主机上被识别,都正常

2. 检查数据存储状态
#cd /POME
#ll
ls: cannot access datastore_20: Input/output error
d?????????  ? ?             ?                            ?   datastore_20

可以看到datastore_20 IO失败,并且在list命令中显示乱码,所以确认datastore_20异常。

3. 强制卸载datastore_20
#tap-ctl list            //可以看到datastore_20有残留,导致HA 虚拟机失败

#tap-ctl destroy -m 52 -p 7974    //手动清除datastore_20残留

手动清除数据存储残留后,因数据存储卸载成功,虚拟机重新在CNA主机上启动,并自动恢复。

#xm list     //检查虚拟机启动情况

根因

后端存储异常导致datastore卸载超时,VIMS进行HA虚拟机失败。

解决方案

手动清除数据存储残留

建议与总结

版权声明:
作者:SE_You
链接:https://www.cnesa.cn/1775.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
FusionCompute V100R003C00 Datastore数据磁盘异常残留导致虚拟机一直处于故障恢复
问题描述 ALM-15.1005004 主机关联的数据存储异常。 CNA主机上的datastore显示异常: 告警信息 ALM-15.1005004 主机关联的数据存储异常。 处理过程 1. 检查存储状态 #upadm show path    //检查存储链路,发现有一半链路异常,一半正常 #iscsiadm -m session   //检查iscsi连接,发现存储iqn登录正常 #mount                       //检查lun是否在主机上被识别,都正常 2. 检查数据存储状态 #cd /POME #ll ls: cannot access datastore_20: Input/output error d?????????  ? ?             ?                            ?   datastore_20 可以看到datastore_20 IO失败,并且在list命令中显示乱码,所以确认datastore_20异常。 3. 强制卸载datastore_20 #tap-ctl list            //可以看到datastore_20有残留,导致HA 虚拟机失败 #tap-ctl destroy -m 52 -p 7974    //手动清除datastore_20残留 手动清除数据存储残留后,因数据存储卸载成功,虚拟机重新在CNA主机上启动,并自动恢复。 #xm list     //检查虚拟机启动情况 根因 后端存储异常导致datastore卸载超时,VIMS进行HA虚拟机失败。 解决方案 手动清除数据存储残留 建议与总结 无
<<上一篇
下一篇>>