Chinaunix首页 | 论坛 | 博客

YZQ

  • 博客访问: 196178
  • 博文数量: 17
  • 博客积分: 1606
  • 博客等级: 上尉
  • 技术积分: 338
  • 用 户 组: 普通用户
  • 注册时间: 2009-11-13 12:58
文章分类

全部博文(17)

文章存档

2017年(1)

2015年(6)

2012年(4)

2011年(1)

2010年(1)

2009年(4)

分类: 服务器与存储

2012-12-04 09:17:35

 一:故障现象

 如图所示富士通存储E2KM200控制器模块1#出现cache故障,需要进行更换。

二:准备工作

    该控制器cache位于控制器内存,更换时需要将控制器拔出,更换完毕后在将控制器插回。

所以在更换的过程中属于控制器CM1上面的LUN需要切换到CM0上面,这个操作在hot maintence模式下面存储会一步一步完成,但切LUN过程可能会使主机和存储之间有短暂的闪断,所以建议局方,先停业务在进行更换。(当然一般来说,cache损坏之后控制器也就不能工作了,LUN应该早就切换了,但是这点得事先确认好)

所有业务不涉及阵列配置,对数据安全影响较小,但请尽量备份关键数据,以备不测。

更换过程大概需要1小时。

 

  流程如下

序号

      内容

负责方

所需时间

1

  协调停主机业务

局方

/

2

  协调备份存储数据

局方

/

3

  在线更换cache

工程师

1小时

4

  启动业务并测试

业务方

/

 

三:更换过程

 1.确认业务已经停止,数据已经备份完成,停掉所有IO,拔掉控制器上的光纤线,进行维护流程;

 2.通过IE登陆存储管理软件,点击Start Maintenance 图标,进入Maintenance状态,此状态下可以对阵列进行安全的更换操作。

  

3. 进入Maintenance 态点击左侧的故障cache,在右侧显示栏下有一个Hot Maintenance 按钮,点击它。

  

4. 接下来显示操作步骤,富士通提供了详细的操作步骤,可以操作一步,勾取一个小框,同时根据提示进行操作。

5. 操作完后点击Finish回到System主页面,页面右上角的状态灯为normal绿色,此时主页面右侧的LCD Message的报错信息被清除。 

6. 点击End maintenance退出维护状态,至此更换完成。 

四:更换失败处理方案

    如果更换cache后故障现象仍未恢复,则进行如下操作:

  1.整个存储下电(先关CE柜,在关DE柜),重启(先开DE柜,再开CE柜);

      2.重启后恢复则完成更换,重启后若cache仍然报错,则报告DOA,接上连线,恢复业务,准备二次现场;

  3.若重启或更换后cache不报错,控制器报错,则申请控制器备件(要求与另一CM相同的微码版本),接上连线,恢复业务,准备二次现场;

 

阅读(3864) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~