分类: 服务器与存储
2009-04-07 13:47:45
4月20日中国银联网络长时间全面瘫痪的事故,将金融行业业务连续性管理特别是灾难备份恢复系统建设的重要性,凸显了出来。 那一天,从上午10时56分起至晚上20时,银行卡交易大面积停止,据估计涉及全球至少34万家商户以及6万台ATM机,很多人不能取款转账,不能刷卡消费。给消费者带来不便,商家蒙受损失。 银联方面表示,此次事故是由于最近准备上线的某外围设备的隐性缺陷诱发了跨行交易系统主机的缺陷,使主机发生故障。事故只是使银行卡交易不能进行,对客户账户中的资金没有任何影响。 这是银联自2002年成立以来,首次因为系统故障而全面中断交易。虽然银联对此种情况目前并没有法定的赔偿责任,但是,作为国内独家的银行卡交易转接服务提供商,它的社会形象和声誉遭到难以弥补的损失。 也许普通消费者和商户只能发发牢骚,而业内人士和专家则提出了一些深层次的问题。 例如,像银联这样的金融机构,主体业务中断后果严重,较长时间的中断更是不能容忍,而要保证业务连续,务必保证灾难备份恢复系统发挥应有作用。国际上的其他银行卡组织的做法显然成熟得多。据了解,国际银行卡组织VISA在日本、英国和美国等地共有4个全球中心,互为备份,足以应付由于局部灾难或技术失败造成的严重冲击。它还与其他国际性卡组织订有协议,在自己的网络出现问题时,可以得到对方网络的支援。VISA有关人士曾表示,在技术和管理双重保障下,近5年来,该组织在全球范围内因各种原因导致停止交易的时间,累计不超过8分钟。 再如,银联初步查实,此次事故是由“外围设备的隐性缺陷诱发”的,如果最终调查结果证明确实如此,那么,有关测试工作显然做得不够充分。银联所使用的信息技术系统是庞大和复杂的,添加任何硬件和软件都有可能发生不匹配或冲突的现象,增加了发生故障的可能性。科学的、大强度的甚至是模拟极端情况测试,需要在引入前反复进行,同时也要做好各种应急准备。 还有,数据集中和业务集中在带来巨大好处的同时,也使风险集中和放大,对此必须有足够的认识,并在技术安排上实现一定的灵活性。据报道,此次事故对吉林的影响很小,长春市大型商场20日当天并没有发现银联交易系统有问题,顾客用POS机刷卡消费正常进行。这是由于吉林省银联交易与深圳、广州等地的交易模式不同,90%以上的银联交易是通过本地系统转换完成的,因此基本上没有受到银联总公司故障的影响。 故障出在银联,经验教训却可以为金融行业所共享。据银联人士透露,银联正在加紧建设北京备份中心,不久即可投入使用。到那时,像4月20日那样的灾难性事件当可避免。银联还表示,它十分重视跨行交易网络的运行质量,建立健全了各类安全生产的规章制度,逐步开始形成了有序的运行机制,组建了不断学习进步的技术团队,并定期对各种突发事件和网络故障进行模拟演练,保障网络运行的可靠稳定。 |
(2006年05月10日) |