-
OS上硬盘有IO报错
问题描述 A800-3010服务器已安装CentOS 7.5,使用parted -s devnvme0n1 mklabel gpt 命令创建分区时报message错误。报错如下图 处理过程 安装hioadm工具,工具下载地址:https://support.huawei.com/enterprise/zh/software/251983097-ESW2000297405 执行命令:hioadmin info -d nvme0 查询nvme信息,结果如下图: 格式是512+8 type 3 separate 模式 ,此模式开了DIF,有数据保护无法被OS写入。 执行:hioadm format -d nvme0 -t 0 格式化成512+0的普通硬盘正常安装。 相关说明参考:https://support.huawei.com/enterprise/zh/doc/EDOC1100030815/c6f5feb6
SE_Meng 2022-10-2514 0 0 -
设备在线且网络正常,HiLens Studio技能安装失败,显示device is offline | inactive | freeze
问题描述 HiLens Kit网络正常,且HiLens 控制台显示在线状态,但HiLens Studio安装技能时失败,提示device is offline | inactive | freeze 处理过程 1. HiLens Kit开机,确认网络正常,且HiLens控制台状态显示“在线” 2. 进入HiLens Studio,打开“口罩检测”模板项目,仿真测试正常 3. 在HiLens Studio设备区域,点击“operation”,“install” 根因 设备权限未激活 解决方案 1. 进入设备管理,找到对应的设备,检查基础技能权限是否显示“未激活”状态 2. 对“未激活”状态的设备,点击“权限激活”,激活后,即可正常安装技能 建议与总结 建议对此类错误,报错日志提示更加准确
SE_Meng 2022-10-164 0 0 -
Atlas 500Web界面NPU告警,JPEGD PROC失败
问题描述 Atlas500Web界面出现NPU告警,告警名称为JPEGD PROC失败。 告警信息 处理过程 结合页面告警现象及一线收集的日志,查看到SNAP日志里面有0x000E001E的告警,在告警处理的相关文档中可以看到对应的具体告警信息如下: 通过日志进一步查看(日志路径为NPU/var/dlog),将dlog下面的device和host日志解密之后,可以看到硬件解码失败,一行都没有解码成功。 用户输入的jpeg文件头有问题。 根因 界面NPU的告警是用户输入的jpeg文件头不符合规范导致失败。 解决方案 输入符合规范的jpeg文件,告警便会消失。 免责声明:本案例仅供参考不提供专业意见。
SE_Meng 2022-10-126 0 0 -
Atlas500智能小站硬盘访问阻塞
问题描述 电压跌落导致硬盘访问阻塞 主要表现:Atlas500智能小站的输入电压降低,无法满足硬盘的工作电压,直观表现为硬盘故障、无法访问;Web界面可能上报的告警为:MCU电压检测异常、M.2访问阻塞、存储设备丢失、存储设备分区丢失、存储设备挂载失败、M.2不在位等。 硬盘本身或者链路故障 主要表现:系统无法识别硬盘,Web界面可能上报告警:M.2访问阻塞、存储设备丢失、存储设备分区丢失、存储设备挂载失败、M.2不在位等。 处理过程 1:解压收集的日志压缩包,在路径\log\MCU\tmp\mcu_log下,查看error_log_0_XXX.log,看日志信息关键词“sensor(2)(14)”,其中sensor(2)指的是电压,后面14是传感器编号,对应为12V;若存在如下频繁打印(10次以上),可确认为电压跌落导致硬盘无法访问。 2: 排查方向:执行ls /sys/block/ -all命令,如果回显中存在红框中标注的两个参数值,表示系统可以识别硬盘,否则表示系统无法识别硬盘,硬盘本身故障或者链路故障。 解决方案 1: 处理方法:更换告警设备的电源线,或只更换线缆两端的绿色连接器(同时要检查现场环境,对Atlas 500智能小站、电源盒进行加固,并进行附件的点胶操作)。 2:处理方法:检查硬盘与Atlas 500 智能小站是否连接正常,并重新插拔;若插拔后仍故障,则更换硬盘。
SE_Meng 2022-10-1223 0 0 -
在A500-3000WEB界面无网管注册功能
问题描述 客户反馈在A500-3000无网管注册功能,当前版本为20.02.03.020 处理过程 当前版本无此功能选项,建议客户升到20.3.0的版本,特别注意对于老版本(20.2.xx及以下版本)需要进行多次升级才能升级到最新版本。20.2.xx及以下版本需要先升级到20.3.0版本;再由20.3.0版本升级到21.0.4.9版本;21.0.4.9版本可直接升级到21.0.4.9之后的任意版本。具体的版本升级和回退约束请参考各个版本的升级指导书。 根因 版本太低 免责声明:本案例仅供参考不提供专业意见。
SE_Meng 2022-10-1214 0 0 -
FAQ-9008 BMC无法支持过快插拔连续多张PCIE卡
问题描述 在上电情况下逐一按下9008计算框BIOC的所有PCIE卡热插拔按钮,然后逐一拔出所有的PCIE卡,然后迅速的插入后拔出的卡,等所有PCIE卡重新上电后,查看WEB发现有PCIE卡未刷新信息 解决方案 由于当前BMC采用轮询方式串行对所有PCIE卡信息在位信息进行获取,当获取到一张卡由在位变成不在位后,BMC上层APP会通知框架对当前卡进行卸载处理,每张卡卸载都需要时间,当后拔的卡又新插入新卡时候,由于BMC还在处理前面拔出的卡,所以当扫描到后面的卡时候该卡已经从不在位变成了在位,导致BMC未识别到该卡在位发生变化,未重新加载当前卡。 由于BMC识别过慢导致卡未识别到,只影响BMC对于卡的识别,不影响带内OS使用该卡 建议在更换多张卡的情况下保留一定的时间间隔,使得BMC能够卸载掉前面拔出的卡,然后加载正确的卡。 免责声明:本案例仅供参考不提供专业意见。
SE_You 2022-09-1320 0 0 -
eSight ICT统一管理系统-V300R010C00-eSight网管页面密码忘记,需要覆盖原密码
问题描述 1、问题描述:经客户通知eSight网管页面无法登录,经现场分析核实确认为密码丢失且无法找回,需要进去服务器数据库重新覆盖原密码。 2、版本信息:当前eSight版本为 ’‘eSight V300R010C00 安装盘(X86)’‘ 告警信息 硬件无故障告警信息 处理过程 经与客户沟通后准备实施方案,提前从官网下载好Xshell 工具,具体操作步骤如下。 (1)登录eSight后台,使用ossuser用户执行以下命令登录数据库(双机场景请登录主节点) (2)进去数据库后执行以下命令: Xshell 7 (Build 0122) Copyright (c) 2020 NetSarang Computer, Inc. All rights reserved. Type `help' to learn how to use Xshell prompt. [C:/~]$ Connecting to 113.19.8.58:22... Connection established. To escape to local shell, press 'Ctrl+Alt+]'. Authorized users only. All activities may be monitored and reported. WARNING! The remote SSH server rejected X11 forwarding request. Last login: Mon Apr 3 14:46:39 2023 Authorized users only. All activities may be monitored and reported. [root@eSightServer ~]# [root@eSightServer ~]# [root@eSightServer ~]# [root@eSightServer ~]# cd /opt/eSightZenith/app/bin [root@eSightServer /opt/eSightZenith/app/bin]# ll total 7432 -r-x------. 1 ossuser ossgroup 4430 Feb 17 2021 Common.py -r--------. 1 ossuser ossgroup 4288 Feb 17 2021 Common.pyc -r-x------. 1 ossuser ossgroup 13145 Feb 17 2021 GaussLog.py -r--------. 1 ossuser ossgroup 10828 Feb 17 2021 GaussLog.pyc -r-x------. 1 ossuser ossgroup 5997 Feb 17 2021 shutdowndb.sh -r-x------. 1 ossuser ossgroup 52631 Feb 17 2021 sql_process.py -r……
SE_You 2022-09-11152 0 0 -
eSight管理面备份失败
问题描述 系统上报eSight定时备份失败告警,eSight版本为eSight 22.0.0.SPC10 告警信息 处理过程 1、登录备份失败的eSight节点,切换到root用户,执行如下命令: ll /opt/oss/manager/var/tasks/ |wc -l 如果查出来的文件超过10000说明冗余文件较大,eSight搭载的Cloudsop平台原子能力打包超时默认时间是1小时,平台该版本未定期清理tasks目录下的冗余文件,管理面任务运行时,该目录下会生成任务文件,不会清除,导致管理面进行备份时,超过备份打包能力1小时,最终备份失败 根因 平台有个冗余文件问题 会导致管理面备份失败 解决方案 规避方法: 任务管理没有任务时,执行如下命令清理 su - ossadm cd /opt/oss/manager/var/tasks/ find /opt/oss/manager/var/tasks/ -name "taskid*" |xargs -i rm -r {} 清理完成后,手动进行管理面备份,如果想彻底解决该问题需要升级到eSight 22.0.0.SPC20 免责声明:本案例仅供参考不提供专业意见。
SE_You 2022-09-118 0 0 -
eSight如何配置 OptiXstar P813E 一个eth端口数据超过8个vlan
问题描述 esight 通过零配置部署下发 P813E 数据, 专业模式下默认一个eth 口只能最多配置8个vlan, 不能满足多个vlan通过一个eth口的特定场景。 解决方案 打开场景模板菜单,新增场景模板,并选择“专业模式”; 在“业务控制”的 “QoS控制”中选择“按业务规划”; 添加业务规划,并根据实际业务需要选择DBA模板: 开启QoS控制按业务规划时,最多配置7种业务,用户VLAN总数去重后不超过32个; 5.如需要建立新的DBA模板,可在下图位置新建: 免责声明:本案例仅供参考不提供专业意见。
SE_You 2022-09-1123 0 0 -
eSight 22.0.0 PC不能用sopuser账号SSH登录欧拉系统
问题描述 eSight 22.0.0 PC不能用sopuser账号SSH登录欧拉系统 报错如下: 告警信息 无 处理过程 1、PC 运行里ping eSight系统ip--结果:能ping通 2、登录eSight管理面,维护--启用操作系统用户和修改密码,查看操作系统用户是否启用--结果:已经启用 3、通过IBMC虚拟控制台登录后台,chage -l sopuser查看sopuser密码是否过期--结果:没有过期 4、netstat -nap | grep :22 查看端口是否有侦听--结果:没有侦听 5、通过命令service sshd restart报错如下 6、通过systemctl status sshd.service查看有异常 7、通过命令journalctl -xe | grep sshd_config,发现是sshd_config配置问题 8、vi /etc/ssh/sshd_config,查看line 157配置,发现配置PermitRootLongin 错误,应该为PermitRootLogin 9、修改该配置后,service sshd restart后,问题解决,sopuser能够ssh登录 根因 /etc/ssh/sshd_config配置有误,需要将PermitRootLongin修改为PermitRootLogin 解决方案 vi /etc/ssh/sshd_config,查看line 157配置,发现配置PermitRootLongin 被修改错误,应该为PermitRootLogin 建议与总结 无 免责声明:本案例仅供参考不提供专业意见。
SE_You 2022-09-1124 0 0