提起,我们不得不说到IBM eLiza(蜥蜴)计划以及IBM的小型机的RAS特性。
在当今的IT世界,众多企业都无情地面对一个巨大挑战:为了构成一个强大的灵活自如的电子商务运做环境,需要使用大量的服务器、网络设备、复杂的应用软件等,这些设备所涉及的IT技术在发生着日新月异的变化,企业严重缺乏有经验的工程师来维护和管理整个软硬件系统。
eLiza的称呼最早起源于六十年代中期IBM的一个计划,即采用人工智能技术设计一种实现人和计算机之间通讯的程序。在九十年代,IBM设计的深蓝超级计算机战胜了国际象棋大师卡斯帕罗夫,其综合处理能力可比喻于一个蜥蜴(lizard)所具有的功力,即具有预测防范、处理判断以及自我愈合再生能力。
IBM公司综合自己多年的IT经验,应运而生的提出了eLiza计划,并给它赋予了具有前瞻性的重要内容:即现代企业要想处于不败的竞争地位,其电子商务环境所使用的软硬件系统应具备下列四项原则:
1、自我保护能力:系统有能力保护自己,不受到非法访问和攻击。
2、自我配置能力:系统可以动态自我配置有关资源。
3、自我愈合能力:系统能够自动预测错误、避免错误、修复错误、取代有关错误部件。
4、自我优化能力:系统能够自动监视和管理有关资源,将系统性能调整到最佳状态。
为了达到以上目标,系统还需具备以下七个要素:
1、负载管理(WorkloadManagement)
2、群集技术(Clustering)
3、安全机制(Security)
4、虚拟主机托管(VirtualServerHosting)
5、端到端的自动控制(End-to-EndAutomation)
6、端到端的系统管理(End-to-EndSystemsManagement)
7、灾难恢复机制(DisasterRecovery)
下面,编者以服务器为例,介绍其RAS特性。
1、自动首次错误数据捕获和诊断错误隔离能力
2、自治愈内部组冗余
3、业界第一的PCI总线奇偶错误恢复
4、避免检查中止的不可收集错误处理
5、动态错误恢复:错误检查和纠正(ECC)或在主存上的等价保护,所有一、二、和三级缓存和内部处理器组
6、连续和冗余的位操作被使主存具有自治愈功能
7、针对处理器、缓存、、I/O和DASD的预计性错误分析
8、N+1的冗余电源,双电源线,和对电源及风扇的在线维护
9、在主存上具有的Chipkill纠正功能
10、基于运行时错误来决定是否分离处理器运行和启动(动态处理器离线和永久处理器离线)
11、缓存和主存的离线技术
12、针对、风扇和I/O子系统的基于首次故障数据捕获技术的并行、运行间检测技术。
13、通过选择高品质的部件最大限度的减少故障
阅读(442) | 评论(0) | 转发(0) |