Chinaunix首页 | 论坛 | 博客
  • 博客访问: 9464
  • 博文数量: 1
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 10
  • 用 户 组: 普通用户
  • 注册时间: 2013-09-27 17:21
文章分类
文章存档

2013年(1)

我的朋友

分类: 服务器与存储

2013-09-27 17:23:26

 一:故障现象

 如图所示富士通存储E2KM200控制器模块1#出现cache故障,需要进行更换。

二:准备工作

    该控制器cache位于控制器内存,更换时需要将控制器拔出,更换完毕后在将控制器插回。

所以在更换的过程中属于控制器CM1上面的LUN需要切换到CM0上面,这个操作在hot maintence模式下面存储会一步一步完成,但切LUN过程可能会使主机和存储之间有短暂的闪断,所以建议局方,先停业务在进行更换。(当然一般来说,cache损坏之后控制器也就不能工作了,LUN应该早就切换了,但是这点得事先确认好)

所有业务不涉及阵列配置,对数据安全影响较小,但请尽量备份关键数据,以备不测。

更换过程大概需要1小时。

 

  流程如下

序号

      内容

负责方

所需时间

1

  协调停主机业务

局方

/

2

  协调备份存储数据

局方

/

3

  在线更换cache

工程师

1小时

4

  启动业务并测试

业务方

/

 

三:更换过程

 1.确认业务已经停止,数据已经备份完成,停掉所有IO,拔掉控制器上的光纤线,进行维护流程;

 2.通过IE登陆存储管理软件,点击Start Maintenance 图标,进入Maintenance状态,此状态下可以对阵列进行安全的更换操作。

  

3. 进入Maintenance 态点击左侧的故障cache,在右侧显示栏下有一个Hot Maintenance 按钮,点击它。

  

4. 接下来显示操作步骤,富士通提供了详细的操作步骤,可以操作一步,勾取一个小框,同时根据提示进行操作。

5. 操作完后点击Finish回到System主页面,页面右上角的状态灯为normal绿色,此时主页面右侧的LCD Message的报错信息被清除。 

6. 点击End maintenance退出维护状态,至此更换完成。 

四:更换失败处理方案

    如果更换cache后故障现象仍未恢复,则进行如下操作:

  1.整个存储下电(先关CE柜,在关DE柜),重启(先开DE柜,再开CE柜);

      2.重启后恢复则完成更换,重启后若cache仍然报错,则报告DOA,接上连线,恢复业务,准备二次现场;

  3.若重启或更换后cache不报错,控制器报错,则申请控制器备件(要求与另一CM相同的微码版本),接上连线,恢复业务,准备二次现场;

 

阅读(1697) | 评论(0) | 转发(0) |
0

上一篇:没有了

下一篇:没有了

给主人留下些什么吧!~~