Torque简介
Torque是一个开源的资源管理器,
来自于,
是一个社区基于PBS项目努力的结晶。它提供对批处理作业和分散的计算节点(Compute nodes)的控制。
- 安装Torque组件:在一个节点上(head
node)安装pbs_server,所有计算节点上安装pbs_mom,所有计算节点和提交节点上安装PBS客户端。至少做最基本的配置,使
Torque系统跑起来,也就是使pbs_server能知道该和哪些机器通话。
- 在pbs_server上创建一个作业提交队列。
- 在集群的所有节点上指定一个cluster name作为property。这可以用qmgr命令做到。比如:qmgr -c "set node node properties=cluster-name"。
- 确保作业可以提交到节点上去。这可以通过使用qsub命令做到。比如:echo "sleep 30" | qsub -l nodes=3。
阅读(1549) | 评论(0) | 转发(0) |