集群系统的监视管理
当管理上百台结点的集群服务器时,能够在单一的机器上管理这么多的结点是个有用的功能。
在这方面有很多项目在进行,它们分别解决了不同的这方面的常见问题。
ClusterIt仅用于维护和管理过大数目的系统。
Ganglia是一个可扩展、有名的、大量测试过的、实时监视和远程执行环境。它在各地的大学、政府实验室、集群主机使用者中广泛使用,并得到一致好评。
Performance Co-Pilot由SGI公司发布的一个监视和管理软件,原来是为IRIX系统编写的,SGI公司将它改为在Linux上运行并改为开源版本。经过多年的开发,SGI应该能够将它的技术和经验转为项目稳定、可用的保证
以上项目可运行在任何系统上。除此之外,有些项目是为另一些专门的项目开发的,
如MOSIXVIEW是MOSIX集群系统管理的一个GUI界面。它支持MOSIX和OpenMosix,做为一个可执行命令的前端界面。
LVSmon是为LVS项目开发的维护LVS连接表的监视管理工具。
在这么多的项目中,很多项目是相似的。
下面只介绍一些常用的:
Syncopt是解决在多结点上保持软件一致性的问题。利用Syncopt,软件自动从一个中心服务器安装,保持各结点上的软件版本一致。
Fsync与rsync和CVS类似。它使得在不同的机器间的文件保持一致,有消除文件差异的功能和保持目录树结构的程序。它只是个Perl脚本,设计在以Modem网络连接速度上运行。Ghosts(global hosts)是个可对机器分组定义,生成宏定义的系统,利用这些宏,gsh,一个并行执行环境可以对不同的组执行相应的命令。
最后,有一个项目是pconsole,它和Ghosts类似。但它是个运行界面,实际提供的是一个管理shell环境。
用户可以通过它同时连接到多台结点机上,用户执行的命令将同时送到这些结点上运行。
阅读(611) | 评论(0) | 转发(0) |