分类: IT业界
2012-06-18 11:24:00
提起,我们不得不说到IBM eLiza(蜥蜴)计划以及IBM的小型机的RAS特性。 在当今的IT世界,众多企业都无情地面对一个巨大挑战:为了构成一个强大的灵活自如的电子商务运做环境,需要使用大量的服务器、网络设备、复杂的应用软件等,这些设备所涉及的IT技术在发生着日新月异的变化,企业严重缺乏有经验的工程师来维护和管理整个软硬件系统。 eLiza的称呼最早起源于六十年代中期IBM的一个计划,即采用人工智能技术设计一种实现人和计算机之间通讯的程序。在九十年代,IBM设计的深蓝超级计算机战胜了国际象棋大师卡斯帕罗夫,其综合处理能力可比喻于一个蜥蜴(lizard)所具有的功力,即具有预测防范、处理判断以及自我愈合再生能力。 IBM公司综合自己多年的IT经验,应运而生的提出了eLiza计划,并给它赋予了具有前瞻性的重要内容:即现代企业要想处于不败的竞争地位,其电子商务环境所使用的软硬件系统应具备下列四项原则: 1、自我保护能力:系统有能力保护自己,不受到非法访问和攻击。 2、自我配置能力:系统可以动态自我配置有关资源。 3、自我愈合能力:系统能够自动预测错误、避免错误、修复错误、取代有关错误部件。 4、自我优化能力:系统能够自动监视和管理有关资源,将系统性能调整到最佳状态。 为了达到以上目标,系统还需具备以下七个要素: 1、负载管理(WorkloadManagement) 2、群集技术(Clustering) 3、安全机制(Security) 4、虚拟主机托管(VirtualServerHosting) 5、端到端的自动控制(End-to-EndAutomation) 6、端到端的系统管理(End-to-EndSystemsManagement) 7、灾难恢复机制(DisasterRecovery) 下面,编者以服务器为例,介绍其RAS特性。 1、自动首次错误数据捕获和诊断错误隔离能力 2、自治愈内部组冗余 3、业界第一的PCI总线奇偶错误恢复 4、避免检查中止的不可收集错误处理 5、动态错误恢复:错误检查和纠正(ECC)或在主存上的等价保护,所有一、二、和三级缓存和内部处理器组 6、连续和冗余的位操作被使主存具有自治愈功能 7、针对处理器、缓存、、I/O和DASD的预计性错误分析 8、N+1的冗余电源,双电源线,和对电源及风扇的在线维护 9、在主存上具有的Chipkill纠正功能 10、基于运行时错误来决定是否分离处理器运行和启动(动态处理器离线和永久处理器离线) 11、缓存和主存的离线技术 12、针对、风扇和I/O子系统的基于首次故障数据捕获技术的并行、运行间检测技术。 13、通过选择高品质的部件最大限度的减少故障 |