存储S5500T(S3900)系统硬盘FW升级
问题描述
江苏某局点客户反馈S5500T存储硬盘故障率高,通过与原厂沟通,确认硬盘DOM 1217~DOM 1235批次Mickey Cert误重映射的FW BUG,该特性重映射标准过严,当业务模型为大量写数据集中在硬盘较小的范围内时,容易触发Mickey Cert 的重映射机制出现误重映射导致硬盘故障。
告警信息
存储硬盘故障,面板亮红色告警灯。
处理过程
首先,准备升级软件工具(SSH软件、串口线、网线、便携、OceanStor Toolkit升级工具、JRE1.6软件包、防静电手环),对用户进行停机宣传(提前三天开始),向客户索要升级存储的口令。
升级操作过程:
1、停止上层业务,关闭存储侧业务网口;
登录存储CLI,执行poweroffifmodule –c a –if 0和poweroffifmodule –c b –if 0分别将存储AB控的iSCSI接口卡下电
2、升级前检查,登录存储ISM检查阵列上是否有异常告警,如果有异常告警,处理后再执行操作。
3、升级存储硬盘FW,通过SSH Secure File Transfer上传升级脚本文件至存储任一控制器/home/permitdir目录下
4、CLI登陆升级脚本及硬盘FW升级包所在控制器,并进入debug模式。
输入developer命令进入developer模式
输入minisvstem命令,进入minisvstem模式,再输入vi进入编辑模式,然后输入shell进入debug模式。
5、最后再执行如下命令
chmod +x FW_updata.sh
dos2unix FW_updata.sh
6、执行./FW_updata.sh Compass_SAS_B004.LOD命令进入控制器保存脚本文件目录下,升级硬盘FW,脚本会自动判断存储上需要升级硬盘FW的硬盘数量并逐一对其进行升级。
7、最后升级完成后执行poweroffsys对存储进行下电并手动上电,上电直接按控制器上开关按钮
8、登录存储CLI模式,输入showdisk -physic检查所有硬盘的FW是否为B004版本,如果是BOO4则说明升级成功,以下图为例:
9、调整存储硬盘ERC时间,升级后前期修改的ERC时间会丢失,需重新修改。
点击OceanStor Toolkit工具,所有功能→维护→硬盘参数配置,运行硬盘ERC时间修改工具,修改完成后关闭ERC修改工具。
10、使用巡检工具检验存储是否有异常,如无任何异常,则存储系统硬盘FW升级完成。
根因
存储硬盘微码版本低导致存储硬盘FW bug,使存储硬盘故障率大大增加。
解决方案
针对S5500T存储硬盘故障率高,对存储系统硬盘FW微码升级。
建议与总结
该局点的存储硬盘故障率偏高,之前未进行过此项升级操作导致报出硬盘故障,直接更换硬盘。后来升级后发现硬盘故障率明显降低,所以存储硬盘故障并不是一方面因为设备使用时间过长而导致故障,建议后期升级版本同时针对硬盘微码也将此升级,根据需求定期升级硬盘FW微码,尽可能的降低硬盘故障率,从而延长存储使用寿命。