我正在使用Slurm作业管理器的集群机器上工作。我刚刚启动了一个多线程代码,我想检查给定节点ID的核心和线程使用情况。
scoreusage -N 92512
被“记分”是我不确定的命令。
发布于 2017-07-26 17:57:17
我已经有几年没有运行slurm集群了,但是squeue
应该可以满足您的需要。尝试:
squeue --nodelist 92512 -o "%A %j %C %J"
(这将为节点92512上的作业提供您的作业on、作业名称、cpus和线程)
顺便说一句,除非您只需要一个特定节点的详细信息,否则最好使用作业id而不是节点id进行搜索。
有很多好的网站都有关于使用slurm的文档,这些文档可以通过谷歌( google )很容易找到--大多数大学等运行HPC集群,编写自己的文档、帮助和“备忘单”,这些文档和“备忘单”都是针对特定集群的细节定制的(S)(因此,考虑到这一点,并根据集群的任何示例进行调整)。还有关于在slurm
上使用https://slurm.schedmd.com/documentation.html的很好的通用文档
https://unix.stackexchange.com/questions/381981
复制相似问题