我很好奇是否有一种方法可以设置Slurm分区,这样调度程序就可以查询可用的分区,并根据请求的资源量分配给一个分区,例如。假设我有几个队列:
small_cpu = node1,2,3          <- assigned when requesting <= 10 cores
large_cpu = node4,5,6          <- assigned when requesting > 10 cores
big_mem = node7,8,9            <- assign when requesting > 100GB memory
fail/backfill = nodes10,11,12  <- assigned when the other queues are full我可以在PBS/Moab中做到这一点,但我在Slurm文档中尝试弄清楚它时遇到了困难。任何洞察力都是值得欣赏的。
我
发布于 2019-03-29 20:05:30
在Slurm中做这件事的方法是使用一个作业提交插件,它允许您在将作业路由到分区(以及更多)的过程中合并任何逻辑。
请参阅示例here。
https://stackoverflow.com/questions/55054803
复制相似问题