首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >对斯隆来说很新鲜。如何让slurm在我的linux集群上运行多个核心作业?

对斯隆来说很新鲜。如何让slurm在我的linux集群上运行多个核心作业?
EN

Unix & Linux用户
提问于 2021-01-24 05:10:05
回答 1查看 129关注 0票数 2

我一直在尝试将一些现有进程转移到一个经过改进的linux集群中,该集群现在运行在slurm上。我以为我已经完成了,但我现在的问题是让多个内核运行。

这是我的投稿。

代码语言:javascript
运行
复制
   #!/bin/bash
   #
   #SBATCH --job-name=test_mpi
   #SBATCH --output=res_mpi.txt
   #
   #SBATCH -n 4
   #SBATCH --time=10:00
   srun mkdir -p /tmp/tedhyu/new
  srun cp Ru13.in /tmp/tedhyu/new/lcao.in
  srun cp ~tedhyu/atom_pbe/* /tmp/tedhyu/new
  srun cd /tmp/tedhyu/new
  srun -N 1  -n 4 --chdir=/tmp/tedhyu/new  mpiexec ~tedhyu/bin/origin1_centos6.4_mpich2_quest_265c.x

当我"qstat -n“时,它只显示一个核心:

作业id用户名队列名SessID NDS TSK内存时间使用S时间

11778 tedhyu原子test_mpi -- 14- 00:10 C 00:00节点3-5/4

下面是我输出的前几行,显示只有一个核心在运行:

代码语言:javascript
运行
复制
    srun: error: node3-5: tasks 0-3: Exited with exit code 1
     MPINFO::: Global Communicator        :::
     MPINFO::: Global Context = ****      :::
     MPINFO::: Global Size =       1      :::
     MPINFO::: Global Root =       0      :::
     MPINFO::: Global Rank =       0      :::
     DEV: VDW development version

全球大小应等于4

如果有人能指出正确的方向..。谢谢!

EN

回答 1

Unix & Linux用户

发布于 2021-02-14 10:06:32

不要在脚本的最后一行使用srun。只需使用mpirun或mpiexec启动可执行文件即可。

srun所做的:它启动命令的$SLURM_NTASKS实例(每个保留的CPU核心一个)。您不希望这样,您希望mpiexec将任务生成到CPU。你的最后一行可以是

mpirun -np $SLURM_NTASKS ./myexecutable.exe

票数 0
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/630676

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档