包含标签:告警 的文章
  • 在FC中,“外部NTP服务器与CNA之间心跳中断”告警的处理办法

    问题描述 登录FusionCompute,查看告警,发现有“外部NTP服务器与CNA之间心跳中断”告警,如下: 告警信息 请参考问题描述 处理过程 此处内容需要 回复 后才能查看 原文

    SE_You 2024-09-04
    11 0 0
  • 华为2288h v5 对iBMC上报Nand Flash预留块不足10%告警的说明

    问题描述 iBMC上报了“The remaining reserved blocks of the NAND flash are less than 10%.”告警,截图如下,客户咨询该告警含义、产生原因、是否有可能存在批量问题。 注意:该案例只适用于剩余预留块(The remaining reserved blocks),不适用于剩余寿命(The service life),请注意区分。 设备 预留块数量已经很低,可以尝试升级ibmc ,但是升级失败概率较高,需要更换主板。 问题确认 iBMC上报了“The remaining reserved blocks of the NAND flash are less than 10%.”告警 iBMC一键收集日志的\dump_info\AppDump\iBMC\nandflash_info.txt日志中记录Reserved Block的值低于10% 问题解决方法 旧版本有以下几种情况: 1.日志里记录剩余预留块数量>0%时,实际预留块数目>50%,还能够正常使用iBMC较长时间,只需要跟客户解释说明情况即可,也可以升级到iBMC 3.81及以上版本,升级后收集一键收集日志,在nandflash_info.txt日志里查看剩余预留块真实数目。 2.日志里记录剩余预留块数量=0%时,实际预留块数目≤50%,收集一键收集日志,有以下几种情况: a)一键收集日志出现乱码(例如黑底NUL等),或者从某一时间后没有再记录日志,说明实际预留块数目是真的不足,需要更换主板。 b)一键收集日志正常,则实际预留块数目可能足够也可能不足。如需确认实际预留块真实数目,可以升级到iBMC 3.81及以上版本,升级后收集一键收集日志,在nandflash_info.txt日志里查看剩余预留块真实数目。 c)如果升级iBMC异常失败,或升级成功但升级完成后iBMC主备区版本仍是老版本,说明预留块是真的不足,需要更换主板。 如果产生Nandflash剩余预留块不足告警后,过一段时间iBMC出现功能异常(例如收集日志失败、收集日志成功但日志出现乱码、WEB或SSH无法访问、升级失败、升级成功但实际版本没有刷新等现象),则可能是剩……

    SE_Meng 2024-03-11
    595 9 0
  • SMC 2.0 独立SC告警磁盘空间不足问题

    问题描述 独立SC存在磁盘空间不足告警,如下图所示: 处理过程 登录两套独立SC设备的122业务地址,查看设备状态为双机状态: 其中244节点为主节点(图1); 243节点为备节点(图2) 2、分别登录两套独立SC的操作系统后台检查磁盘空间状态: 【1】cd /opt/gaussdb/data/archive_log 【2】执行du –sh查看路径空间   备机空间信息如下: 主机空间信息如下: 经梳理现网情况,明确组网情况为独立SC与EUA(企业通讯录)为合设状态   根因 安装的V600R019C10SPC700(包括)之后版本的EUA,由于数据库变更,对应的配置也改变,新版本数据库的归档日志等文件占用硬盘空间过多导致独立SC出现磁盘空间不足的报警。 解决方案 修改备机数据库配置文件“zengine.ini”,增加清理旧归档日志配置,并在配置修改后重启数据库。 修改主机数据库配置文件,将配置项修改为“TRUE”即可。 修改前: 修改后: 配置后磁盘空间情况: 主机空间: 备机空间: 告警消除情况: 经确认操作后目前告警已经消除,业务确认无影响;后续持续观察。 免责声明:本案例仅供参考不提供专业意见。

    SE_Meng 2023-03-19
    12 0 0
  • iBMC硬盘告警异常问题解决案例

    问题描述 客户在系统下电的情况下将配置在RAID组里硬盘拔出以后,在上电以后将硬盘插入,在整个过程中iBMC都没有告警。 告警信息 客户在系统下电的情况下将配置在RAID组里硬盘拔出以后,在上电以后将硬盘插入,在整个过程中iBMC都没有告警。 处理过程 (1)在系统Power OFF 的情况下拔出RAID组中的硬盘,通过前置面板的电源键对系统上电,在RAID卡完成初始化之前插入硬盘,查看iBMC告警和事件日志。 (2)在iBMC没有硬盘相关告警,硬盘处于RAID组重构过程中。 (3)在系统Power OFF 的情况下拔出RAID组中的硬盘,通过前置面板的电源键对系统上电,在RAID卡完成初始化以后插入硬盘,查看iBMC告警和事件日志。 (4)在iBMC中有“In Failed Array”告警。 根因 通过上述对照实验可以发现,只有在RAID卡完成初始化以后才能检测到RAID组中有硬盘丢失,iBMC中才会显示相应的告警。如果下电状态下拔出的RAID组硬盘在上电以后并且RAID卡尚未完成初始化时插入就会出现RAID卡检测不到RAID组丢失硬盘的情况,从而iBMC也没有相关的告警。 解决方案 RAID卡只有在完成初始化以后才能检测到RAID组中有硬盘丢失,iBMC中才会显示相应的告警。如果下电状态下拔出的RAID组硬盘在上电以后,RAID卡尚未完成初始化时插入就会出现RAID卡检测不到RAID组丢失硬盘的情况,从而iBMC也没有相关的告警。 建议与总结 (1)对于RAID组里的硬盘:只有在RAID卡完成初始化以后拔出RAID组里的硬盘,RAID卡才能检测到RAID组中有硬盘丢失,iBMC中才会显示相应的告警。 (2)对于未配置RAID组的硬盘:硬盘拔出时iBMC无告警。   免责声明:本案例仅供参考不提供专业意见。

    SE_Meng 2022-12-18
    15 0 0
  • HCS 821云平台OC告警进程未启动,告警源组件是alarmserver

    问题描述 OC告警进程未启动,告警流水号102632723,告警源组件是alarmserver。 处理过程 1.根据告警详情中的定位信息,通过账户apigateway登录问题节点APIGateway管理虚拟机。 2.执行如下命令重启alarmserver进程。 sh /opt/apigateway/alarmserver/shell/restart.sh   3.通过执行如下命令查看alarmserver进程状态。normal为正常。 sh /opt/apigateway/alarmserver/shell/health_check.sh 4.删除告警后不再出现。 建议与总结 当API网关的alarmserver组件进程没有启动时,产生该告警。   免责声明:本案例仅供参考不提供专业意见。

    SE_You 2022-06-19
    4 0 0
  • UPS5000与FusionCol8000出现“备件未获授权”告警解决方案

    问题描述 UPS5000与FusionCol8000在模块替换后,LCD页面上会出现“备件未获授权”告警,显示效果如下 告警信息 告警名称:备件未获授权 告警ID:0691-001 告警级别:提示   处理过程 在数据中心领域 UPS5000-A/E/H、FusionCol8000-E/A等设备更换模块之后,软件版本在R23C00及后续版本,设备LCD上会出现“设备未获授权”告警。 根因 在SamrtDC R23C00及后续版本做了关键模块备件替换之后,需要校验备件来源合法性,备件替换之后LCD页面上都会产生该“备件未获授权”告警,需要通过NetEco APP、Power-Partner APP的“备件替换”功能来消除该告警。 解决方案 需要通过服务专家/NetEco/Power-Partner APP的备件替换功能来消除该告警。两种方案如下: 方案1:通过NetEco APP的“备件替换”来清除“备件未获授权”告警。 方案2:通过power-partner APP的“备件替换”来清除“备件未获授权”告警。 详细操作步骤参考:《交付案例:UPS5000与FusionCol8000出现“备件未获授权”告警解决方案》   建议与总结 交付或者维护过程中,如果UPS5000-A/E/H、FusionCol8000-E/A设备更换模块之后,出现“设备未获授权”告警,可以通过服务专家备件替换功能来清除该告警。 局点现场经常出现扫码之后提示授权码错误,有可能是SN码或验证码错误导致。请核对验证码和条码是否和LCD屏幕上一样。 免责声明:本案例仅供参考不提供专业意见。

    SE_You 2022-05-09
    7 0 0