-
服务器虚拟化产品Fusioncompuer(V100R003C10SPC600)虚拟机蓝屏处理
问题描述 XX局点对华为虚拟化资源池中两台windows2003 R2 32bit ESB业务虚拟机(名称分别为:XX-esb-app1和XX-esb-app2)变更网络,完成业务重新部署后切换动作。在对两台虚拟机操作过程出现蓝屏现象,导致业务切换动作终止,具体问题如下: 一、问题现象1 【操作对象】xx-esb-app1 虚拟机 【现象描述】 1、 管理员用户登陆FusionCompute管理平台 2、 在虚拟机页签搜索到信息、XX-esb-app1虚拟机 3、 进入xx-esb-app1虚拟机页签,web界面上执行“关闭”操作 4、 关闭过程中VNC登陆观察虚拟机状态,发现蓝屏,见截图1。 5、 在虚拟机页签,web界面上执行“强制关闭” 6、 在虚拟机页签,web界面上执行“打开电源” 7、 启动后发现虚拟机蓝屏无法进入系统,蓝屏现象与关闭过程蓝屏报错相同,见截图2。 截图一 截图二、 问题现象2 【操作对象】XX-esb-app2 虚拟机 【现象描述】 1、 管理员用户登陆FusionCompute管理平台 2、 在虚拟机页签搜索到XX-esb-app2虚拟机 3、 进入XX-esb-app2虚拟机页签,执行VNC登陆 4、 VNC登陆后输入管理员用户密码,进入系统,发现系统提示“UVP TOOLS更新完成,请重启计算机”即华为虚拟化驱动,升级后提示要重启生效,见截图3。 5、 在系统内,手动执行重启虚拟机操作,重启关闭虚拟机过程出现蓝屏,现象与HN-esb-app1一致,见截图4。 6、 蓝屏后等待10s后,系统正常启动,但系统有报错。见截图5 7、 输入管理员用户密码,进入系统,发现 UVP TOOLS(PV Driver Upgrade) 服务未正常启动,界面显示“未运行”。见截图6 8、 卸载当前TOOLS,卸载过程发现TOOLS版本未升级成功仍为老版本。见截图7 9、 卸载TOOLS成功后,在界面挂载TOOLS重新安装,安装成功,虚拟机反复重启正常。 截图 3 截图4 截图5 截图6 截图7 告警信息 设备蓝屏 处理过程 此处内容需要 回……
SE_You 2024-09-0613 0 0 -
服务器虚拟化产品fusioncomputer(V100R003C10SPC600)的管理网口由于交换机上行链路出现网络堵塞导致虚拟机出现HA操作
问题描述 XX局点组网环境如下,fusioncomputer计算节点管理网络和业务网络采用主备模式,客户近期部署了NBU备份服务器备份挂接在接入层交换机SW3及SW4下的数据库服务器。 XX时间期间发生40台左右虚拟机发生HA,并有7台主机频发上报“主机与VRM心跳异常”告警,2台主机重启。 告警信息 告警有虚拟机发生HA提示,并有7台主机频发上报“主机与VRM心跳异常”告警,2台服务器重启 处理过程 此处内容需要 回复 后才能查看 原文
SE_You 2024-09-0511 0 0 -
云平台V1R3C10SPC500虚拟机调整挂载共享磁盘数量
问题描述 每个虚拟机绑定的共享磁盘数量不能超过8个,当时有些场景下需要绑定更多的共享磁盘,这时候可以通过调整配置文件来修改为11个。 解决方案 需要修改的配置文件路径: 主备VRM节点此路径对应的配置文件: /opt/galax/vrm/tomcat/webapps/ROOT/WEB-INF/classes/vrmconfig.properties 配置项: MAX_ATTACHED_SHAREVOL=8 此配置意义为:单个虚拟机最多可挂载共享卷个数,由于目前系统最多支持11个卷,因此此配置不应大于11 修改配置文件后,需要重启主节点上的VRM进程,命令为:service vrmd restart
SE_You 2024-08-2910 0 0 -
Fusioncompute V100R003C10SPC600分布式交换机设置后虚拟机网口异常
问题描述 Fusioncompute分布式交换机设置后,虚拟机绑定网口,配置ip后,显示网口异常,ping不通网关 告警信息 虚拟机网口状态异常 处理过程 1、 虚拟机安装windows2008操作系统后,安装tools工具,重启服务器,虚拟机tools显示运行. 2、 虚拟机绑定网口。 3、 设置分布式交换机,添加VLAN 4、 查看交换机配置,装Fusioncompute的服务器网卡2连接H3C S5500交换机15口,查看接口类型为access,VLAN:1001.配置虚拟机ip地址后,ping网关不通;将s5500交换机15口接口类型设置为trunk口,允许VLAN1001通过。在虚拟机上ping网关,显示超时。 5、 重启虚拟机,cmd下ping网关,网关ping通。Ping客户业务地址正常。 根因 1、 服务器虚拟机没有安装tools工具;安装tools后没有重虚拟机。 2、 虚拟机没有添加网卡,没有绑定网口 3、 Fusioncompute分布式交换机设置错误。没有添加Vlan 4、 交换机没有配置或配置不对。 解决方案 1、 虚拟机安装系统后,要安装tools工具,最好重启2次。绑定网口。 2、 Fusioncompute分布式交换机设置好后,配置交换机,交换机接口为trunk模式,允许通过VLAN为客户业务网段。 3、 虚拟机设置ip地址,ping网关不通后,将虚拟机重新启动。 建议与总结 1、 虚拟机安装系统后,要安装tools工具,最好重启2次。绑定网口。 2、 Fusioncompute分布式交换机设置好后,配置交换机,交换机接口为trunk模式,允许通过VLAN为客户业务网段。 3、 虚拟机设置ip地址,ping网关不通后,将虚拟机重新启动。
SE_You 2024-08-2229 0 0 -
FusionCompute V100R003C00 Datastore数据磁盘异常残留导致虚拟机一直处于故障恢复
问题描述 ALM-15.1005004 主机关联的数据存储异常。 CNA主机上的datastore显示异常: 告警信息 ALM-15.1005004 主机关联的数据存储异常。 处理过程 1. 检查存储状态 #upadm show path //检查存储链路,发现有一半链路异常,一半正常 #iscsiadm -m session //检查iscsi连接,发现存储iqn登录正常 #mount //检查lun是否在主机上被识别,都正常 2. 检查数据存储状态 #cd /POME #ll ls: cannot access datastore_20: Input/output error d????????? ? ? ? ? datastore_20 可以看到datastore_20 IO失败,并且在list命令中显示乱码,所以确认datastore_20异常。 3. 强制卸载datastore_20 #tap-ctl list //可以看到datastore_20有残留,导致HA 虚拟机失败 #tap-ctl destroy -m 52 -p 7974 //手动清除datastore_20残留 手动清除数据存储残留后,因数据存储卸载成功,虚拟机重新在CNA主机上启动,并自动恢复。 #xm list //检查虚拟机启动情况 根因 后端存储异常导致datastore卸载超时,VIMS进行HA虚拟机失败。 解决方案 手动清除数据存储残留 建议与总结 无
SE_You 2024-08-1917 0 0 -
FusionCompute 虚拟机磁盘无法扩容
问题描述 客户的一台虚拟机在运行一段时间后,磁盘空间不足,于是想对虚拟机的磁盘进行扩容,发现在操作过程中没有“调整容量”的选项,如下图: 处理过程 在FusionCompute中,数据存储有两种类型,两种数据存储支持的虚拟机磁盘又不同,详细如下表: “调整容量”、磁盘精简和虚拟机快照等功能需要在虚拟化存储中才可以支持。 解决方案 将虚拟机的迁移到虚拟化存储中去,再进行操作。做此操作前务必确认操作系统支持磁盘扩容。
SE_You 2024-08-0927 0 0 -
数据存储空间不足导致虚拟机删除快照失败
问题描述 2014年8月18日上午9:15左右接某局点上报虚拟机无法登录问题,虚拟机于8月17日凌晨1:10左右使用HyperDP做虚拟机备份,创建快照成功,但是删除快照时,截止到8月18号上午10:00,任务一直进行中。FC Portal上无法重启VM,提示有任务在进行 告警信息 FC Portal上有告警如下图: 处理过程 1、 登录VRM数据库查看快照删除任务的详细状态发现:虚拟机系统盘快照已经删除成功,数据盘快照一直处于删除中的状态 2、 为了尽快恢复客户业务,从底层对该虚拟机执行下电操作,虚拟机下电成功,再给系统进行上电,系统卡在启动页面,无法正常进入系统。登录虚拟机所在的CNA节点,虚拟机数据盘所在的数据存储HW_Cloud_P_lun01已经达到100%,实际可用空间变为0 3、 进一步分析问题触发因素:数据存储空间占用率过高→虚拟机创建快照→数据存储可用空间为0→虚拟机删除快照任务卡住→虚拟机无法重启、虚拟机故障、业务异常 4、问题出现的根因就是数据存储实际可用空间为0,导致虚拟机业务异常,因此需要迁移该数据存储中的部分磁盘至其他有可用容量的数据存储上去,然后执行快照删除动作,重新启动虚拟机 根因 数据存储空间被占满导致快照无法删除,从而影响虚拟机业务。 建议与总结 数据存储使用率已经接近或者达到100%,虚拟机在删除快照时,无法申请到可用空间,快照删除任务卡死。虚拟机手动关闭重新上电后,同样是因为数据存储使用率已经达到100%,导致无法正常读写数据,虚拟机启动异常。建议在存储空间使用上,要留有一定的余量,尽量在告警阀值一下,尤其是部署HDP的场景。
SE_You 2024-07-3022 0 0 -
Win2003 虚拟机vnc登录花屏
问题描述 某局点反馈多次通过mstsc远程登录win2003虚拟机且不及时注销退出,而是通过直接点击右上角的关闭按钮退出。一段时间后,因mstsc远程登录连接数满导致虚拟机无法远程登陆。客户通过管理平台VNC工具登录虚拟机,发现VNC界面呈现花屏状态且无法执行登录操作。 告警信息 无 处理过程 1、禁用Cirrus显卡,在出现花屏的虚拟机中禁用Cirrus显卡。 具体方法:右键“我的电脑”->管理->设备管理器->显示卡->右键“Cirrus Logical 5446 兼容图形适配卡”,选择“停用”。 此方法,禁用Cirrus显卡以后,仅支持800*600、1024*768和1280*1024三种分辨率调节 2、重启该VM 根因 1、通过FusionCompute集成的VNC工具登录虚拟机,发现VNC界面为花屏状态。首先怀疑是集成的VNC工具问题。通过本地的VNC工具登录虚拟机仍呈现花屏状态,可以排除此因素导致。 2、排除VNC客户端后,怀疑是VNC服务端的问题。通过登录出问题的虚拟机所在的CNA节点,收集相关底层虚拟化日志信息并进行分析,没有发现有异常日志信息。同时观察节点的压力也较轻,没有出现负载超负荷的情况。因此可以基本排除虚拟化层导致该问题。 3、最后怀疑GuestOS内部问题,通过查阅相关的资料,发现在案例库中有类似的相关案例。是win2003虚拟机将分辨率调大之后再调小后会出现花屏。或者长时间不使用导致屏幕锁定后也会有花屏现象出现(详情见附件)。综上分析,怀疑该局点的花屏问题跟cirrus显卡的显存信息相关度较大。建议局点按照以下的规避方案在其中一台多次出现花屏问题的虚拟机上实施并观测2周,如果没有问题就可以确认是同样的根因。 建议与总结 定期重启VM,如果出现花屏,建议禁用禁用Cirrus显卡
SE_You 2024-07-2923 0 0 -
如何处理数据存储空间占满导致虚拟机蓝屏问题
问题描述 虚拟机启动时出现蓝屏现象,如下所示: 告警信息 FusionCompute Portal界面上报“存储使用容量超过阈值”告警,告警ID为15.1005003,附加信息显示该数据存储占用率为100%。 处理过程 1) 对使用率占满数据存储上的虚拟机通过存储迁移,释放相应空间。 2) 将使用率占满数据存储上的不用虚拟机删除,释放空间。 根因 虚拟机所用存储类型为虚拟化数据存储,支持精简配置,该数据存储创建了大量虚拟机快照,当数据存储的已分配容量大于总容量时如果实际可用容量耗尽,则后续IO将无法分配到空间,虚拟机启动时概率性引起虚拟机卡死或蓝屏。 建议与总结 无
SE_You 2024-07-1021 0 0 -
虚拟机创建过快照导致解绑定磁盘失败
问题描述 虚拟机操作系统故障,已经分配了新的虚拟机,将故障虚拟机的数据磁盘解绑定时,提示存在快照,导致无法解绑定磁盘。 告警信息 解绑定磁盘时,提示虚拟机存在快照。 处理过程 1. 通过“监控”->“备份”,找到之前虚拟机创建快照的ID号。 2. 主备份服务器上,使用Admin账号(或通过VNC使用ssh Admin@127.0.0.1)登录命令行,切换到monitor模式。 3. 执行删除快照命令(delete snapshot snapshot_id=快照ID)。 4. 待快照删除后,解绑定磁盘。 根因 虚拟机之前通过HyperDP做过备份,怀疑备份类型为“快照比对”,导致虚拟机会一直保留一个快照。FusionCompute无法直接删除该快照,需要通过HyperDP备份服务器下发删除命令。 说明: “CBT备份” 方式,使用该备份方式,在虚拟机没有备份任务运行时,该虚拟机不需要保留备份快照。 “快照比对” 方式,使用该备份方式,在虚拟机没有备份任务运行时,该虚拟机也需要保留一个备份快照,对非备份期间虚拟机的性能影响较大。 建议与总结 无。
SE_You 2024-07-0510 0 0