Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1460067
  • 博文数量: 1125
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 16710
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-03 14:05
文章分类

全部博文(1125)

文章存档

2011年(1)

2008年(1124)

我的朋友

分类: 服务器与存储

2008-10-18 03:39:56

    Amazon Web Service的Simple Storage Service(S3)在7月出现了服务故障,故障持续了8个小时之久,依赖S3进行文件存储的在线公司因此蒙受了损失。
 
  S3在2月份的时候也出现过一次类似的故障,当时该故障持续了两个小时,这一事故让很多人开始置疑云计算模式,虽然这一模式目前日渐流行。
 
  Amazon在一份声明中表示,该公司对S3在过去两年多里的运作性能感到非常骄傲,客户通常也会感到很满意。Amazon在声明中表示,“但是任何当机都是难以接受的,我们永远不会感到满意,除非它已经达到完美的境界。”
 
  Amazon在声明中表示,“作为一套分布式系统,S3的不同部分必须了解其他部分的状况。” Amazon在声明中还表示,“例如,有了这种了解,该系统就能够知道将请求路由到哪台空闲的物理存储服务器上。我们在这些内部系统通信上遇到了一个问题,让这个部分无法和整个系统良好互动,消费者无法成功地提交请求。通过尝试了几种替代方案之后,该团队决定必须让该服务离线,以恢复系统间的通信,然后再恢复服务。这是一套成熟的系统,在这种情况下,需要花一点时间进行恢复——在对事故的原因进行了充分的调查分析之后,我们将为客户提供更详细的信息。”
 
  S3是2006年3月推出的,很多公司都将自己存储的一部分甚至全部外包给了AWS,其中包括37signals、YouOS、SmugMug、ElephantDrive和Jungle Disk.
 
  SmugMug使用S3服务来存储该公司客户的图片,SmugMug的CEO Don MacAskill很快就出面为AWS辩护。他星期日在一篇BLOG文章中表示,“Amazon的S3是SmugMug主要的存储供应商,目前遇到了一些问题。”他还表示,“结果,SmugMug存储的大部分图片和视频目前都不在网络上了。从历史上看,Amazon的系统相当稳定。在我们使用Amazon 的历史上(两年多的时间里),这种情况只出现了三次,包括这一次。我希望,和上两次一样,这次的问题也会很快得到解决,服务会很快恢复正常。”
 
  MacAskill强调说他对AWS的信任一直没有动摇过,他认为这些故障“非常稀少,而且延续的时间非常短,并得到了妥善的处理。”
 
  MacAskill从一开始就强烈支持AWS,这也就解释了为什么Amazon在过去的两年中一直将SmugMug作为示范客户,并且一直把该客户作为客户案例分析放在该公司的网站上。
 
  Amazon的一名官员表示,AWS和SmugMug不存在任何营销合作或交易。
 
  在AWS S3论坛上,其他一些S3用户更为苛刻。
 
  一位署名“David Campano”的用户表示,“我们一直用S3来保存Flash文件,大概有六个月了,现在我们越来越依赖我们自己的架构了,因为过去两个月已经出现了两次故障。”
 
  一名用户用“iehiapk”ID写道,“我一直认为S3是高度可靠的服务,但显然我被愚弄了。”他还写道,“我们现在不会考虑其他的服务。这让我们看起来象是业余的。”
 
  另一名用户用“M. McQuade”的ID写道,“我会一如既往地使用他们的服务,但是我会选择另一项类似的服务,这样再出现类似的情况,我们就能够有备无患。”他还写道,“我们已经有了一个内部的备份,但是如果我们的存储需求继续增长的话,也难以为继。我们需要两个‘S3’。”
 
  其他的S3用户对S3服务水平协议(SLA)也有抱怨,该协议要求希望得到服务额度的客户必须通过电子邮件进行申请。一名署名“Sam Beckett”的用户表示,“我们不应该被迫给Amazon写电子邮件申请SLA额度。”他还表示,“这个过程应该是自动的。”
 
  S3 SLA规定如果月正常工作时间达不到99%,那么客户就有权只支付25%的费用。Amazon无法提供单月正常工作时间数据,因为该公司的客户计算费用的周期都不相同。在7月份,工作时间应该是744小时,如果当机时间超过了7.44小时,就意味着月正常工作时间会低于99%.
 
  S3的状态页显示,该系统目前情况良好。
阅读(442) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~