分类: 服务器与存储
2008-06-23 05:51:11
Linux 集群的迅速流行对存储提出了新的挑战
目前,Linux 集群正广泛应用于各种各样的计算环境。一个集群由多个通过高速网络互连的低价系统组成,它通常会采用专用软件来协助实现集群功能。现在,人们频繁地使用 Linux 集群来创建集群式高性能计算 (HPC) 系统、进行服务器集成以及保证应用的高可用性。
有诸多因素促成了 Linux 集群的迅速流行。许多人发现,与专用解决方案相比,Linux 集群不仅在性能方面毫不逊色,甚至还要稍胜一筹,而且还大幅度地降低了总拥有成本 (TCO)。具体说来,成本的降低可归功于以下几个因素:使用价格低廉的硬件和网络、更加简单的管理以及开放源代码软件 (OSS)。
由于 Linux 属于开放源代码软件,因此,可根据特定环境或应用的具体需要对其进行适当的修改。在 Linux 上运行的许多软件也是开放源代码软件,例如 Beowulf(用于高性能计算)、Apache(用于 Web 服务)和 MySQL(用于数据库)。这样,如果用户的集群中包括数十个甚至数百个节点,那么就可节省一笔数目不菲的许可证费用。由于使用的是低价硬件以及开放源代码软件,因此用户可以创建功能强大而又灵活的集群配置,同时避免陷入受供应商制约的被动局面。
随着低价服务器的性能和可扩展性不断增强,Linux 集群的性能也随之增强。新近面世的刀片式服务器设计先进,能在单个机柜中密集放置多台高性能服务器。它简化了集群的部署,从而更容易部署大型密集集群。随着 Linux 集群规模日渐扩大,而且功能和数据处理能力日渐增强,现在用户面临一个难题,即需要保证存储系统具有必要的容量、可靠性和性能,使集群能够以最佳性能工作,反过来这又会从整体上降低总拥有成本。
刀片式的集群存储设计
Linux 集群环境中存在的存储难题
对于 Linux 集群给存储带来的主要难题,究其根源可归结于多种存储设备的使用。通常,集群中各服务器都在本地有一些直接连接的存储设备 (DAS)。对于更大的外部存储池,则可通过存储区域网络 (SAN) 来提供。大多数应用还要求在多个节点之间共享某些数据。这可通过网络连接的存储设备 (NAS) 来实现。结果,在一个集群中将形成两个甚至三个截然不同的存储池。NAS 池和 SAN 池分别部署在由不同供应商提供的不同存储平台上,而且各自都有自己独特的管理工具。结果,不仅增加了系统的复杂程度和系统管理员的负担,而且增加了费用。
Linux集群中的存储组件
可扩展性和性能对于集群存储来说非常重要,对于共享数据来说尤其如此。随着单个集群节点的功能越来越强大,集群中的节点数目越来越多,NAS 的性能就变得非常关键了。如果采用错误的解决方案,那么即使是最快的服务器硬件也会在性能上受到制约。
集群能够产生大量的数据。随着数据存储量的增加,关键数据保护工作的难度就越来越大。而且,由于数据可能位于 DAS、SAN 和 NAS 上,所以该问题更加棘手。随着越来越多的关键业务应用加入到 Linux 集群中,单靠磁带备份已难以完全胜任数据保护工作。此时,高级业务连续性解决方案就显得非常必要,但适合于 Linux 环境的解决方案几乎没有。
目前有名目繁多的存储解决方案可帮助与低价服务器建立连接。但是,集群和单个服务器在存储方面的需求并不相同,而且人们最终往往发现,上述许多解决方案都无法独立完成所有任务。易管理性和可靠性非常重要,而为产品提供必要的服务和技术支持的供应商同样也非常重要。