为了便于管理海量的作业,可以对作业定义作业组。
作业组的名字是类似于Linux的路径名的树状结构,如作业组/test,而/test/1和/test/2都属于/test。
需要注意的是作业组是全局的,创建者是这个作业组的拥有者,作业组拥有者可以对这个作业组及其子组内的所有作业进行控制(哪怕这个作业是其他人提交的,拥有者也能进行控制)。如果您不想作业被别人控制,请确保提交到的作业组从/开始拥有者都是自己。
创建作业组
- 显式创建作业组:bgadd /test
- 使用bsub提交作业时指定一个不存在的作业组,则作业组会被隐式创建:bsub -g /test
查看作业组
- bjgroup /test,最后一列就是作业组的拥有者,请注意拥有者也是层次继承的。
删除一个作业组
- bgdel /test
- 集群已经配置自动清理空的隐式创建的作业组
控制作业组作业
- 有了作业组以后就可以对一组作业进行控制了
- 查看指定作业组的作业:bjobs -g /test
- 终止指定作业组的所有作业:bkill -g /test 0