-
虚拟机无法ping通网关思路分享
问题描述 使用FusionCompute 6.3.1平台发布测试虚拟机,但在进行业务测试时发现虚拟机内部ping不通网关,本地PC也ping不通虚拟机地址。 告警信息 处理过程 第一步,检查虚拟机 1.检查虚拟机IP地址 检查结果:虚拟机无IP地址 处理操作:添加虚拟机IP地址 将下图 修改为 再次查看 但仍然ping不通 2.检查Tools是否在运行中 第二步,检查防火墙配置 第三步,查看网卡,端口组,上行链路配置 第四步,查看交换机网络配置 接入交换机上学习不到MAC地址,判断为虚拟化平台未将包传递上去,即虚拟机传递出去的包在虚拟交换机上就被丢弃。所以当虚拟交换机端口类型从中继模式改为普通模式后即可。 根因 发现分布式虚拟交换机端口类型为中继,接入交换机上学习不到MAC地址,判断为虚拟化平台未将包传递上去,即虚拟机传递出去的包在虚拟交换机上就被丢弃。 解决方案 虚拟机—分布式虚拟交换机-交换机整条链路逐一排查,最后发现错误把端口类型从中继模式改为普通模式即可。 普通模式即为ACCESS,中继模式即为TRUNK,需要虚拟机自带vlan标签。 建议与总结 在进行虚拟机发放时,一定要注意细节。任何一个环节的缺失都会导致最终业务发放失败。另外,如果出现问题,如本次案例所示。可以沿着虚拟机—分布式交换机-物理机的整条链路逐一排查,思路清晰明确。 资源文件下载 来源:蓝奏网盘 立即下载
SE_You 2024-11-0712 0 0 -
fusioncompute v100r006c10sp105 主机异常重启
问题描述 fusioncompute v100r006c10sp105 主机异常重启 告警信息 无 处理过程 查看主机panic的堆栈信息,使用加密狗等人机交互设备在虚拟机开关机时走了HID设备的消息上报流程。HID设备相当于一个人机交互的设备,需要上报和下发进行数据交换和通信。 主机panic的原因是地址FFFF880C11DE02B8为无效地址。 2.查看对应代码,是在如下图红框中代码执行时出的问题,设备上报的value[n]过大,导致了usage数组越界。 解析出设备上报的field结构,根据如下图可以解析出usage数组长度为7,min值为0,max值为255,value[n]值为234,由于数组usage长度只有7,所以必然会越界。 根据USBHID协议说明,正常来说数组usage的长度就是max-min+1的差值。在访问usage数组之前会先判断value[n]值是否介于min和max值之间,只要value[n]值介于min和max值之间,访问usage数组是不会越界的。 而客户使用的加密狗软件上报上来的usage数组长度只有7,但是minimum 和maximum的值却是0和255,显然超过了7,只要硬件上报上来的value[n]值超过7,则必然会导致越界访问 3.根据之前见过的情况,请排查主机上是否有加密狗等人机交互的usb设备,以及使用方式(比如直通)。 如为加密狗则: 从support兼容性网站上查询兼容的加密狗外设,只显示兼容阿拉丁的加密狗,说明该加密狗是进行过验证的,建议使用该种加密狗设备。 根因 USB人机交互设备在上报流程中上报的最大usage只有7,而在虚拟机关机时实际上报上来的value的值过大,导致数组越界主机panic。这些数据都是加密狗报上来的,按照USB HID协议是不合理的。 解决方案 1.察看主机上插入的USB设备。 2.联系该USB人家交互设备的厂商咨询该设备是否支持SUSE 11SP3操作系统,是否支持该种使用方法。 建议与总结 建议使用兼容外设
SE_You 2024-11-066 0 0 -
Centos 7.3操作系统的虚拟机安装tools失败报“no such file or directory”错误
问题描述 在对Centos7.3操作系统的虚拟机安装tools时,安装失败,提示信息报“nosuch file or directory"错误。 处理过程 当虚拟机的操作系统版本为Centos7.3及以上时,安装tools工具,需注意要使用2.5.0.142版本的vmtools。现场使用的vmtools版本正确。光驱挂载的vmtools安装软件也已挂载并拷贝至虚拟机的相应目录下。 查看错误提示信息为“nosuch file or directory",怀疑是虚拟机未安装解压软件,导致vmtools文件无法识别、解压失败。 现场选择使用bzip2解压软件,前往Centos官方工具包网站下载bzip2的rpm包,通过winscp方式将rpm包上传至虚拟机文件夹。 使用命令yuminstall bzip2 -y完成安装bzip2软件。 重新进入vmtools安装软件所在目录,进行vmtools包解压tar -xjvf vmtools-2.5.0.142.tar.bz2,提示成功。 使用cd vmtools和./install命令成功完成vmtools的安装。 根因 通过检查vmtools文件挂载是否正常,核实vmtools版本是否与虚拟机操作系统匹配,使用的命令和文件目录是否正确等步骤,最终定位问题产生的根本原因为虚拟机未安装解压软件,导致vmtools文件无法识别、解压失败。 解决方案 当虚拟机的操作系统版本为Centos 7.3及以上时,安装tools工具,需注意要使用2.5.0.142版本的vmtools。另外在虚拟机上安装vmtools时,需注意核实是否已安装解压软件,并完成解压软件的安装。 建议与总结 当虚拟机的操作系统版本为Centos 7.3及以上时,安装tools工具,需安装2.5.0.142版本的vmtools。 Centos 7.3及以上版本的官方包网址为http://vault.centos.org/7.2.1511/os/x86_64/Packages/。
SE_You 2024-11-058 0 0 -
FusionCompute 6.3.1管理界面无法登录,点击登录无反应
问题描述 FusionCompute 6.3.1管理界面无法登录,点击登录无反应,如图: 处理过程 1、登录通过VRM浮动的IP地址登录后台,执行命令:service had query查看VRM主备状态正常,继续下一步排查 2、查看vrm-error报错日志,执行命令:vim /var/log/galaxenginelog/vrm/vrm-error.log 在日志中查看到有证书报错,如图: 3、在VRM上查看/etc/galax/cms/目录下没有certs文件夹,如图: 解决方案 1、执行命令,将/opt/galax/root/vrm/tomcat/script/omsconfig/conf/cms/certs目录下的文件拷贝到/etc/galax/cms,如图: 2、执行命令:service had query ,重启vrm服务 3、重新登录FC管理界面可以正常登录
SE_You 2024-11-0415 0 0 -
FusionManager页面无法导入license提示入参为空
问题描述 【适用版本】:FusionManager V100R003C10。 FusionManager的页面无法导入license,导入license的时候出现了页面提示“入参为空”,在FM的后台无法查看license文件,把license文件通过FTP工具传入到FM系统后在页面再次导入,导入成功。 处理过程 在通过web页面对FusionManager添加license的过程中,偶现license无法传入到FusionManager系统,导致在把license文件的内容写入系统时,始终无法获取license文件。 解决方案 通过FusionManager的后台登录到FusionManager上,然后导入: 1. 使用winscp工具,galaxmanager用户登录FusionManager的虚拟机。 2. 把license文件复制到FusionManager环境上,放在/opt/GalaxManager/data/license/目录下。 3. 打开FusionManager的portal页面,进入到licence导入的页面。 4. 添加licence文件执行导入。 5. 导入成功,页面显示新导入的license信息。 建议与总结 FusionManager的license导入出现文件无法上传现象,即再点击上传后页面出现了参数为空的提示,此时可以通过把license直接手动传到FusionManager的管理虚拟机上再进行导入,因为license的导入是分为两个步骤的,文件先上传,然后读取其中的数据信息。 原文
SE_You 2024-11-0125 0 0 -
在FC中使用模板部署VM时VM获取IP失败的解决方法
问题描述 在FC中模板部署多个VM时,VM获取IP失败,如下图所示无IP: 处理过程 1、 对抓取IP 失败的虚拟机进行分析:虚拟机分布在不同的CNA节点上,但是查看LLD发现他们处于一个机柜内,(此机柜是两个集群所在的机柜)红色标记是几个抓取IP失败的虚拟机所在节点 2、 选取一个节点进行测试(当时选择ctuci158cna)VNC登录此节点上的虚拟机 进入CMD 执行Ping 10.169.144.1(此子网的网关不通),ping10.169.133.240(DHCP服务器)也不通,尝试关闭VM的网卡并重启,删除网卡并添加,均不能获得IP。将IP设置为静态IP依然不能与网关和DHCP服务器联通 3、 登录FC解除IP与MAC绑定后再次ping网关和DHCP服务器均可以ping通,在此推测MAC地址与IP的绑定是网络不通的原因 4、 将ctuci158cna节点上的虚拟机迁移到可以获得IP的节点上,迁移后重启网络服务可以获得IP,由此怀疑网络配置导致不通 5、 登陆A17-07机柜的业务交换机S6724查看CNA业务端口配置,配置是正确无误的;查看上行业务端口,两个集群的数据都要通过本交换机进行交换,需要配置两个集群的VLAN,上行端口只配置了1集群的VLAN,没有配置2集群的VLAN,以致该机柜的CNA节点的端口组绑定VLAN 720-723的虚拟机无法抓取到动态IP 根因 由于机柜内是两个VLAN的服务器混合上架,接入交换机VLAN配置存在问题,少配了1个VLAN。 解决方案 1、通过IPOP工具进入交换机修改交换机配置: 2、在终端页面输入以下命令 #interface XG0/1/2(上行端口) #port trunk allow-vlan 720 to 723 (允许VLAN通过) 配置前输出信息: # interface XGigabitEthernet0/0/20 description TO_1A-08-09:5U_S9306(A)_10.156.173.4_XG1/0/2 port link-type trunk undo port trunk allow-pass vlan 1 port trunk allow-pass vlan 200 300 to 3……
SE_You 2024-10-3110 0 0 -
VIMS域信息一致性检查不合格的误告警判断方法
问题描述 利用FusionCare对云平台进行巡检,巡检结果不合格项包括VIMS域信息一致性检查这一项。其中scsi-xxxx为异常的设备ID,异常设备为故障主机名称。 告警信息 处理过程 1. 使用ssh工具登录CNA节点,切换到root用户 2. 进入/sys/kernel/debug/o2dlm目录,可以看到几个以id命名的目录。 3. 进入到每个目录中,执行命令 cat dlm_state | grep 'Domain Map' 例如 linux-kDQWjx:/sys/kernel/debug/o2dlm/223A1A20D3A74FA2B0CA9E8648480060# cat dlm_state | grep 'Domain Map' 回显如下: Domain Map: 5 6 9 10 Exit Domain Map: 4. 如果不同CNA节点相同id的目录名称,domain map里的数字和个数相同,那么可以初步判断为误告警,否则确实是域信息不一致。需要收集日志进行进一步处理。 根因 • 系统存储在暂态数据存储,即有创建、解关联、销毁数据存储。 • 主机的配置文件可能被修改。 • 主机状态异常。 原文 此处内容需要 回复 后才能查看
SE_You 2024-10-299 0 0 -
禁用FC接口账号导致FA调用虚拟机异常
问题描述 客户反馈通过FA,执行虚拟机的关机操作失败及在FA上监控不到虚拟机的硬件信息。如图: 告警信息 FA告警FusionCompute服务器异常,如图: 处理过程 将该接口用户解锁定,FA上即可正常操作。 根因 1. 登陆到FC查看各项状态均正常。 2. 通过ITApingVRM地址,均可以ping通。 3. 查看vdesktop日志发现,有如下报错信息:通过报错信息,可以看出,账号被锁定导致无法连接到后端的FC。如下图: 4.登陆到FC查看用户权限发现该账号被人工锁定。 建议与总结 经和客户确认,其认为该账号没用,就手动将该账号禁用了。建议后续开局时给客户说明默认的账号不要进行锁定等操作。 原文
SE_You 2024-10-2917 0 0 -
FusionComputeV3C00镜像制作创建虚拟机失败
问题描述 1、应某局点客户需求制作windows 64位中文版模板和镜像,并升级模板pvdriver和SPES。在创建裸虚拟机、安装基础操作系统、完成云软件和日常软件安装、完成系统配置后,封装成模板。在FusionCompute上模板导入虚拟机以测试模板系统配置情况,发现创建的虚拟机无法正常启动(反复重启),出现如下图所以情况: 2、解决问题1后,在FusionAccess上配置模板,以模板添加虚拟机,发现添加虚拟机失败,查看原因如下图: 处理过程 问题1处理过程: 桌面云模板制作要求把安装基础操作系统时产生的localAccount账户删除,用Administrator账号进行操作系统的配置。经过检查虚拟机,发现残留有localAccount账号信息,导致模板封装出现问题,虚拟机启动失败。经检查,删除localAccount账户是在计算机-管理-用户里删除的,所以导致账户信息删除不完全。在控制面板里吧该账户删除即可解决问题。 问题2处理过程: 创建虚拟机获取机器名失败。按如下步骤定位: 1、查看网络连接是否存在问题,服务器与存储的网络连接是否存在问题。经检查,网络并无问题; 2、查看是否在FusionAccess中创建虚拟机时选择端口错误。经检查端口选择无误。 3、在FusionCompute里用模板导入虚拟机,在虚拟机里查看winRM服务为启动并为自启动。命令行执行winRM quickconfig /q返回“winRM未启动,将其置为启动并为自启动。应该为系统启动winRM服务失败。只要在封装模板前执行一次winRM quickconfig /q即可解决问题。 原文
SE_You 2024-10-2820 0 0 -
CNA节点管理域CPU占用率超过阈值
问题描述 CNA节点管理域CPU占用率超过阈值告警,该节点只有2个业务虚拟机,迁移走后,管理域CPU占用率仍然没有得到释放。 告警信息 CNA节点管理域CPU占用率超过阈值告警。 处理过程 FC Portal产生管理域CPU占用率超过阈值告警,怀疑与业务压力有关。 1、排查CNA节点,发现只有2个业务虚拟机,将该CNA节点上的虚拟机迁移空后,管理域CPU占用率资源仍然没有得到释放,达90%以上,如下图所示。 2、root账号进入CNA节点操作系统,查看Domain-0虚拟机的CPU占用率情况,确实比较高,如下图所示。 进一步查看CNA进程资源使用情况,top命令发现IPMI进程的CPU占用率有些异常。 根据上面现象怀疑与环境有关。 3、从现场了解到,属于异构虚拟化环境,服务器硬件(联想服务器)无BMC模块,而UVP系统存在IPMI模块,软件狗喂硬件狗的动作是通过主机内的IPMI模板块与BMC模块之间的交互实现的;如服务器硬件无BMC模块来处理IPMI命令,IPMI模块在交互时未得到响应,导致IPMI进程持续等待,进入卡死状态。因此,此问题是由IPMI模块跟BMC模块交互导致的。 4、软件狗功能说明 周期监测与汇聚交换机的连通性、周期监控业务进程状态、控制DRBD升主降备、周期喂硬件狗。 根因 服务器硬件无BMC模块来处理IPMI命令,IPMI模块在交互时未得到响应,导致IPMI进程持续等待,进入卡死状态。 解决方案 此类现象可以使用停止IPMI服务的方法来解决。使用root账号登录CNA节点的UVP系统,执行如下操作停止IPMI服务。 1、停止IPMI服务。 service ipmi stop 2、取消ipmi服务开机启动。 chkconfig ipmi off 建议与总结 异构环境的服务器无BMC模块时,关闭UVP系统的IPMI模板。 原文 此处内容需要 回复 后才能查看
SE_You 2024-10-2523 0 0