linux工程师,RHCE
分类: 系统运维
2022-07-16 21:54:10
尽管云是一种非常强大的工具,但它并非万无一失。像网飞、亚马逊、推特这种大公司都遭受过云中断——即使是他们庞大的云网络也无法阻止。事实上,在大多数情况下,首先是云故障导致了中断。
即使它这样做的频率低于其他系统,它仍然可能出现故障。了解如何以及为什么是防止这种情况发生的第一步。但首先,您需要了解有关云的一些信息——也就是说,它不是一个单一的东西。
“有很多不同的产品自称为‘云’服务” Cloudflare 的 Matthew Prince 写道。“然而,这意味着从一项服务到另一项服务是非常不同的。”
他的意思是,一些云公司拥有并运营自己的硬件。其他人使用另一家公司的硬件来运行他们的服务。还有一些人在另一个云上运行他们的云服务。有趣的是,尽管存在这些差异,但所有三种“类型”的云都有可能以非常相似的方式失败。
网络犯罪是数据中心中断增长最快的原因,而云中断可以被视为其中的一个子集。鉴于它是基于软件的,云在这里特别容易受到攻击。也许是某个特别讨厌的恶意软件使某些关键系统脱机,或者 DDOS 使您的服务器不堪重负。
与任何其他系统相同的安全措施应该适用于云平台——立即应用安全更新,监控系统中的可疑活动,并在出现问题时准备好灾难响应计划。
一个负载均衡器没有做好它的工作、一个糟糕的软件更新、一个优化不佳的应用程序,所有这些都可能导致云性能受到拖累——通常到了完全无法使用的地步。
与安全性一样,请在此处小心操作。在这样做之前,请确保您上传或修改的任何内容都经过了彻底的测试。再次,监控您的软件,以确保您始终掌握任何潜在的错误。
人们很容易忘记,云并非存在于真空中。弥漫在我们周围空气中的并不是某种神奇的数字领域。与所有服务和系统一样,它基于物理基础设施——有时,该基础设施会出现故障。
与大多数 IT 系统一样,电源故障仍然是导致死云的主要硬件原因。如果您运营自己的云,请支持您的 IT 系统并确保它们具备故障转移能力。如果您使用其他人的,请确保他们这样做。
总结:云网络是可用的最强大的业务工具之一。然而,它们并非万无一失。如果管理不善,它们可能会像任何 IT 系统一样容易失败。通过了解这一点,您将更好地了解如何防止这种情况发生。
《linux就该这么学》不错的linux自学书籍