我一直在使用一个由200个节点组成的集群,每个节点有32个核心,用于模拟随机过程。我必须对同一系统进行大约10000次模拟,所以我在一个节点的32个内核中运行相同的模拟(使用不同的RNG种子),直到它完成所有10000次模拟。在我的sbatch脚本中,我有以下内容: # Specify the number of nodes(nodes=) and the number of cores per nodes(tasks-pernode/main,直到使用了li
我正在管理一个在CentOS 7上使用slurm的小型计算机集群。我想劝阻用户在登录节点上运行程序。这可以通过将user hard cpu 1添加到/etc/security/limits.conf文件中来实现。但是,我不希望通过sshd从另一个集群传输的文件被中断。有没有办法调和这些看似相互冲突的目标?