Chinaunix首页 | 论坛 | 博客
  • 博客访问: 230325
  • 博文数量: 144
  • 博客积分: 5473
  • 博客等级: 大校
  • 技术积分: 2645
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-23 17:30
文章分类

全部博文(144)

文章存档

2012年(144)

我的朋友

分类: IT业界

2012-06-18 11:13:45

    提起,我们不得不说到IBM eLiza(蜥蜴)计划以及IBM的小型机的RAS特性。
  在当今的IT世界,众多企业都无情地面对一个巨大挑战:为了构成一个强大的灵活自如的电子商务运做环境,需要使用大量的服务器、网络设备、复杂的应用软件等,这些设备所涉及的IT技术在发生着日新月异的变化,企业严重缺乏有经验的工程师来维护和管理整个软硬件系统。
    eLiza的称呼最早起源于六十年代中期IBM的一个计划,即采用人工智能技术设计一种实现人和计算机之间通讯的程序。在九十年代,IBM设计的深蓝超级计算机战胜了国际象棋大师卡斯帕罗夫,其综合处理能力可比喻于一个蜥蜴(lizard)所具有的功力,即具有预测防范、处理判断以及自我愈合再生能力。
  IBM公司综合自己多年的IT经验,应运而生的提出了eLiza计划,并给它赋予了具有前瞻性的重要内容:即现代企业要想处于不败的竞争地位,其电子商务环境所使用的软硬件系统应具备下列四项原则:
  1、自我保护能力:系统有能力保护自己,不受到非法访问和攻击。
  2、自我配置能力:系统可以动态自我配置有关资源。
  3、自我愈合能力:系统能够自动预测错误、避免错误、修复错误、取代有关错误部件。
  4、自我优化能力:系统能够自动监视和管理有关资源,将系统性能调整到最佳状态。
  为了达到以上目标,系统还需具备以下七个要素:
  1、负载管理(WorkloadManagement)
  2、群集技术(Clustering)
  3、安全机制(Security)
  4、虚拟主机托管(VirtualServerHosting)
  5、端到端的自动控制(End-to-EndAutomation)
  6、端到端的系统管理(End-to-EndSystemsManagement)
  7、灾难恢复机制(DisasterRecovery)
  下面,编者以服务器为例,介绍其RAS特性。
  1、自动首次错误数据捕获和诊断错误隔离能力
  2、自治愈内部组冗余
  3、业界第一的PCI总线奇偶错误恢复
  4、避免检查中止的不可收集错误处理
  5、动态错误恢复:错误检查和纠正(ECC)或在主存上的等价保护,所有一、二、和三级缓存和内部处理器组
  6、连续和冗余的位操作被使主存具有自治愈功能
  7、针对处理器、缓存、、I/O和DASD的预计性错误分析
  8、N+1的冗余电源,双电源线,和对电源及风扇的在线维护
  9、在主存上具有的Chipkill纠正功能
  10、基于运行时错误来决定是否分离处理器运行和启动(动态处理器离线和永久处理器离线)
  11、缓存和主存的离线技术
  12、针对、风扇和I/O子系统的基于首次故障数据捕获技术的并行、运行间检测技术。
  13、通过选择高品质的部件最大限度的减少故障
阅读(388) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~