Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1261816
  • 博文数量: 1211
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 14340
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-09 11:20
文章分类

全部博文(1211)

文章存档

2011年(1)

2008年(1210)

我的朋友

分类: 服务器与存储

2008-06-12 23:51:38

我步入存储行业已经3年了,现在就是不大不小不老不新不高不低普普通通的一个存储工程师。说起这一行,最让我难忘的就是一次次外出救火的经历。要知道,客户的关键业务数据都保存在存储系统上,不管发生任何问题,都需要第一时间赶到客户现场,要不然,耽误了事情可是要杀头的。而一次次外出救火的经历也让我学到了很多东西,多了不少现场解决问题的经验。

    下面我写下了在我刚入行不久的时候的一次救火经历,虽然事情本身并不那么惊心动魄,技术上也并没有很复杂的地方,但是因为整个问题带有一定的普遍性,所以我在这里写下来,希望与各位大虾们一起探讨。事情的经过是这样的……

外出救火,IBM带库无法正常使用

    “叮铃铃。。。。。。。叮铃铃。。。。。。”工作手机突然响个不停,要知道现在可是已经下班一小时了啊,又发生了什么火烧眉毛的事情?刚接起电话,那头就传来了小俞焦急的接近于咆哮的声音:“兄弟啊,赶紧过来帮忙,这边的带库我怎么连都连不上主机了。。。。。。客户这里不能等,哥们儿你打的过来,我给你报了……”

    哥们儿我晚上正用PS2玩战神呢,听到这里,实在没有拒绝的理由了,同事嘛互相帮助应该的,谁没有个麻烦时候呢,看来我的游戏进度又要受影响了。我打了个的,屁颠屁颠的跑过去,见着小俞第一件事就是微笑着双手奉上打车票。然后很诚恳的说:“哥们儿我饭都没吃过就赶来了,谢就不用谢了,同事兼兄弟嘛,赶紧说情况吧。”

    客户这里情况是这样的:一台备份服务器使用WINDOWS2003的操作系统,采用IBM TS3310磁带库备份其余的4台的数据服务器,使用Veritas BE 10D备份软件。环境较清晰简单,设备其实不多,应用也很简单,但就是备份服务器上通过Veritas备份软件找不到磁带库的介质槽,也看不到任何的磁带介质,当然Veritas备份软件上面的所有操作都宣告失败。

    一看表,已经7点30了,客户9点钟还有应用要上线,我也还记挂着我的游戏进度,决定速战速决解决问题。首先打开备份服务器上的设备管理器,查看磁带库的驱动程序,正常的话有四个驱动是一定要去关心的:磁带驱动器、介质转换器、CHANGE BUS DRIVER、TAPE BUS DRIVER。查看的结果显示,四个驱动用的都是IBM的驱动看来一切正常。

    然后打开Veritas备份软件,问题就出现了。备份软件里面显示的备份设备里面只能看到一个IBM驱动器,正常的话在驱动器下面应该还有一个介质槽,显示所有磁带库中扫描到的磁带介质。发生这样的问题最有可能的原因是介质转换器或者CHANGE BUS DRIVER有问题,这两个组件一个用于管理备份介质,一个用于管理磁带库机械臂。但是为什么会发生这样的问题?难道IBM磁带库与Veritas备份软件不能兼容支持?

不合常理的故障原因

    匆忙间,电话给一个做Veritas的朋友,临时帮我们查了Veritas的设备支持列表:“没问题啊,Veritas BE能支持IBM TS3310啊。”看来软硬件之间的支持和兼容应该是没有问题,理一下思绪,我决定先排查磁带库本身是否有硬件故障,好在我的笔记本上本身安装了IBM的TSM备份软件,通过笔记本上的TSM备份数据显示一切正常,我们定心了一半。既然硬件没有问题,软件的问题总有办法解决吧。

    我们倒带到第一步骤从零开始,首先把磁带库所有的驱动全部卸载,恢复成未安装前的样子,而服务器也是新安装的干净系统。然后在设备管理器中识别新设备磁带库,安装IBM的磁带库驱动,安装驱动程序中选择第二项,即支持第三方软件的驱动,安装完毕后前面所提到的四个驱动显示正常。到目前为止,所有的步骤都很顺利。

    因为要用Veritas管理,下一步我们接着安装Veritas的磁带系列驱动器。装完后察看,发现只有磁带驱动器的驱动变更了,换成了Veritas的驱动器驱动。怀着试一试的心情打开Veritas备份软件,以前的问题再一次出现,还是无法识别磁带介质。我们俩有点摸不着头脑了,这个问题的出现实在有点奇怪。对于一般厂商的产品,如果确实是相互支持的,按理不会出现这种状况啊?难道需要把所有的驱动都改成Veritas的?也不可能,因为如果Veritas的驱动能装上的话,一开始就会全部自动替换成Veritas驱动啊。

    时间一分一秒地过去了,离客户上线应用的时间越来越近了,我们俩仍然像没头的苍蝇似的丝毫没有头绪。看来光凭我们俩的经验也没法儿解决了,以下的时间我们俩分别电话向各路神仙求助。说句老实话,做工程师不积累一点人际关系还真不成,再牛的人也不能保证在客户这里能解决所有的问题,所以有问题向朋友们求助,就是最常见的解决办法了,毕竟多一个人多一种思路,所擅长的领域也各不相同。

    只是,我们四处求援后朋友们的回答都是如出一辙:“不可能啊,“怎么会啊”。我也晕,本来就是毫无道理的故障嘛。磁带库,没问题!备份软件,没问题!相互支持和兼容,据说也是没问题!看起来所有的环节都没有问题啊?但是,一位IBM软件开发部的哥们儿跟我提到了一项关于CHANGE BUS DRIVER这个驱动的信息。据他所知,这个驱动Veritas是不支持的,如果加载了这个驱动,自然就认不到有机械臂,就更别谈有任何其他的动作了,只是他也并不能完全确定。

不合常理的解决方式

搞什么嘛,明明是相互支持的软硬件,却不能支持CHANGE BUS DRIVER驱动!我们打开了一个一直被我们忽略的Veritas安装的系统检测功能,满怀疑虑的看着它检测,结果还真是在CHANGE BUS DRIVER上出现了黄色三角感叹号,进去看了详细信息,显示此设备是不支持设备……

我们两个一阵狂喜,总算找到问题的根源了。不过狂喜之余又开始思索,硬件既然不支持,那该怎么解决呢?很明显,Veritas备份软件无法支持CHANGE BUS DRIVER驱动就是故障的关键,只要这个问题解决了,所有的问题就会迎刃而解。

我们俩再次沉默,你看看我,我看看你,突然异口同声地开口说到:“既然不支持就删了吧。”老实说,这个想法有点突然,也完全不符合常理,关系着磁带库机械臂的驱动删了的话还能用吗?但是时间紧迫,我们也不管那么多了,有时候机器也并不完全是按规律运行的,它也有自己的小脾气,实际操作中,有时候不符合理论的操作却十分管用。

打开设备管理器,右键点击CHANGE BUS DRIVER一项,选择删除,然后就是重启服务器的漫长等待过程中了。时间是漫长的,这个开机过程等的我们这个汗啊。这可是我们最后一招儿了,如果这次再不行,就只能把客户这边的机器扛回公司,耽误了客户的应用上线,到时候……我们俩也就该考虑卷铺盖走人了

我没敢再往下想,好在机器已经启动完毕。打开Veritas,迫不及待鼠标就点击介质这一项查看结果,我们俩直勾勾的盯着屏幕,手指一动“……出来了……出来了……介质出来了……”,嘿嘿,Veritas的磁带库驱动器下面果然显示了备份介质,并扫描到了所有可用于备份的介质。我们俩这个兴奋劲啊,总算一晚上没打成游戏也没有白费。

接着我们试着按下了备份的按钮,等待……,“数据开始备份”看着Veritas软件界面上这几个熟悉的字还真是亲切阿,再看着后面不断增长的数据量,我们两个差点就抱在一起跳了,哈哈,总算在客户规定的9点前让磁带库安全上线工作了,我们也可以打道回府了。

屁颠屁颠儿跑去报告客户,客户虽说还有点疙瘩,但是看到我们一直到晚上9点还蹲在机房没有吃饭,也很诚恳地对我们说了句:辛苦了。从客户那里出来,已经9点半了,这个时候才发现刚才都已经麻木的肚子现在格外饿,二话不说,敲小俞请我吃饭好了。

总结:解决问题就是王道

事情虽然是解决了,但是解决的过程和方法都颇为蹊跷,在日后的工作当中我也特别留意了安装IBM其他磁带机、磁带库的方法,发现的确是采用删除CHANGE BUS DRIVER 这一项才能用Veritas备份软件去操作,问IBM 的技术人员也只是说这个驱动不支持,再多的解释也没有。既然没有解释那各位就暂且这么装吧,毕竟把设备用起来不出问题才是王道。

顺便一提的是可以这么用的磁带设备包括TS2230、TS3100和TS3310,TS3200则不支持Veritas BE 10d,需要更高一版本11d的支持。以上是本人安装过程中总结出来的,也尝试过确实有用,如各位高手有更好的方法或者也有类似经验并顺利解决的也可留言,互相学习哦。

阅读(288) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~