Chinaunix首页 | 论坛 | 博客
  • 博客访问: 52362
  • 博文数量: 17
  • 博客积分: 1420
  • 博客等级: 上尉
  • 技术积分: 197
  • 用 户 组: 普通用户
  • 注册时间: 2009-04-03 20:34
文章分类
文章存档

2010年(16)

2009年(1)

我的朋友

分类: IT业界

2010-11-13 16:24:49

“云”可谓是现在的热门词汇,似乎不管什么公司,都要搭上“云”这个概念就是引领潮流、适应时代了, 所以“云杀毒”、“云安全”都出现了,一时间阿猫阿狗都上云了。《蜗居》里面有句台词:原本光鲜亮丽之后,就是衣衫褴褛。国际化大都市,就是一个舞台,所有的焦点,都会聚集在镁光灯照射的地方,观众能看到的,只是华美壮丽的一面。可这光鲜照 不到的地方,即便是有灰尘,甚至死耗子,谁又会注意呢?同样的,互联网上镁光灯聚焦的云计算背后,是否也有着不足为外人道的酸楚呢?下面表格列举了全球知名的一些云计算、云服务的提供者成长路上摔过的跤:

 

云供应商

发生时间

故障时间

影响范围

原因及总结

微软Azure

20093

中断近22个小时

测试阶段,试用期的测试应用

发生在测试期,令其管理者学会了应对灾难与宕机的处理方法

Rackspace

20096

200911

不详

服务器停机

跳闸后备份发电机又失效。

透明、持续地在博客上更新服务中断的原因及修复进展,得到用户的充分谅解

Salesforce

20101

1小时

68000Salesforce.com用户

数据中心的系统性错误

Heroku

20101

1小时

44千个运行服务中断

依赖的Amazon EC2实例出现瘫痪。

教训:全部运行实例都运行在一个单一的可用区域,容易发生服务中断故障

Terremark

20103

7小时

2%Terremark用户服务瘫痪

连接丢失导致。

用户对供应商的故障处理方式极为不满,没有提供状态报告和服务预警。

Intuit

2次:20106月、7

2天、数小时

包括Intuit自身主页在内的线上产品瘫痪

原因不详及停电

Amazon

20096

20104月、5

5小时、6小时、8小时……

服务中断、整机架服务器断电等

雷雨影响、UPS故障、电力短路、车撞电线杆……

Amazon一次比一次处理成熟,AWS状态页面提供背后原因相关的信息以及解决方案

 从以上事例可以看出,2009年至2010年 “云计算”概念喧嚣尘上的这段时间,全世界不同的云供应商发生了大大小小多次故障,原因有三类:电力系统、网络连接、自身软件问题,而其中电力系统占了多数。事情并不是到此为止,可以肯定的是,往后的日子里,这些大大小小的云朵,还会遇上风雨,甚至随风而逝。云计算并非生而完美,必定要经历一系列挫折,而 在这个过程中,供应商们需要做的就是研究这些故障产生的原因,及时改进,同时与用户充分沟通,达成谅解。唐太宗讲以史为鉴可以知兴替,这些前车之鉴,是我们很好的镜子,帮助我们避免重复犯相同的错误。 而云也不是解决一切问题的万能药,对天上飘着的云的朵,不能只看到它的美丽光鲜,也要看到其背后隐藏着的雷电。从结构设计上就可以考虑周全的,千万不要重复这些IDC停电、UPS故障、互联网出口单点之类的低级错误。


阅读(1444) | 评论(0) | 转发(0) |
0

上一篇:OCZ的固态硬盘新品,性能大幅提升

下一篇:没有了

给主人留下些什么吧!~~