在Slurm中使用作业数组并行化Rscript

文章/答案/技术大牛

发布

1回答

、、

我想使用Slurm中的一个数组作业来运行一个Rscript.R，其中包含1-10个任务，由此来自该作业的任务id将被定向到Rscript，以编写一个名为"'task id'.out“的文件，其中包含'$SLURM_ARRAY_TASK_ID ~/Rscript_test.R如下所示： #!write.table(taskid, paste0("~/test/",

浏览 57提问于2021-02-12得票数 0

回答已采纳

1回答

R脚本不能在Slurm批处理作业中运行

、、、、

/usr/bin/env Rscript如果我直接在命令行中对我的数据运行该脚本，它启动时不会出现错误或警告。但是程序对计算的要求非常高，所以我需要使用名为Slurm的作业调度程序将作业提交到集群。当我在批处理作业文件中编写完全相同的表达式(如第二段所示)，然后使用sbatch提交作业时，它会立即终止，并且不会返回任何有助于我理解问题的错误或输出。我认为这与

浏览 2提问于2017-11-02得票数 0

1回答

slurm作业阵列与作业步骤绩效的差异

、、

我在slurm中运行了一组并行作业(大约1000)，每个任务都必须分配给一个CPU。每个Slurm作业可以包含多个作业步骤，而Slurm中用于管理作业步骤的开销要比单个作业低得多。作业数组是管理具有相同资源需求的批处理作业集合的有效机制。大多数Slurm命令可以作为单个元素(任务)或单个实体(例如，在单个命令中删除整个

浏览 4提问于2019-07-25得票数 4

回答已采纳

2回答

在SLURM中在多个目录上运行一个脚本的首选方法

、

我最典型的用例是在多个目录(通常是R或Matlab)上运行一个脚本。我可以访问一个高性能的计算环境(基于SLURM)。从我目前的研究来看，我不清楚以下哪种方法是最有效地利用可用CPU/核心的方法。方法1: 创建一个MPI作业

浏览 1提问于2018-08-03得票数 1

回答已采纳

1回答

如何使用带SLURM批处理的变量来设置输出/错误文件名？

我们刚刚切换到使用SLURM，我想使用循环和sbatch提交一系列作业。以前，我可以使用一个变量作为输出文件名的一部分。我一直试图在sbatch中使用--export传递变量，但无法获得要对std错误/输出文件名进行内插的变量。不过，我认为它适用于作业名称(-J)和--wrap部件。

浏览 0提问于2018-03-01得票数 0

1回答

Slurm作业数组错误: slurmstepd: error: execve()：Rscript:没有这样的文件或目录

、

我正在尝试让一个非常基本的作业数组脚本在HPC上使用Slurm作业调度程序工作。我得到了一个错误： slurmstepd: error: execve(): Rscript: No such file or directory 这类似于this，但我没有使用任何export命令，所以这不是这里的原因一些消息人士说，这可能与在Windows中创建这些脚本有关，因此行尾将不适用于Unix。这会是问题所在吗？如果是这样的话，我该如何检查呢？我的shell脚本： #!hell

浏览 1202提问于2021-04-28得票数 0

1回答

使用在其他文件中找到的不同变量运行作业脚本

、、、

假设我在一个txt文件(var.txt)中有以下变量列表： AAABBB#SBATCH --ntasks 8#SBATCH --output out Rscriptscript.R 如何按顺序运行job.sh脚本4次，每次都在sc

浏览 18提问于2021-11-16得票数 1

回答已采纳

1回答

使用SLURM数组将R脚本划分为子作业？

、、

我有一个R脚本，我想把它分成几个作业，每个作业都在集群的一个节点上。- cbind(data[,G1], data[,G2]) }#SBATCH --array=1-10 它

浏览 0提问于2019-04-12得票数 0

1回答

如何使用命令行中的rscript命令在R中运行作业数组？

、、、、

我想知道如何使用R函数在Rscript中运行500个并行作业。我目前有一个R文件，它的头位于顶部：B <- as.numeric(args[1])在R文件之外，我希望传递由B指定的500个作业中的哪个要运行。此外，我还想控制每个作业( Num.Cores )可用的核心/CPU的数量。我想知道是否有软件或指南允许这样做。我

浏览 1提问于2018-06-02得票数 0

回答已采纳

3回答

如何在slurm作业(从srun开始)完全完成之前保持脚本？

、

我使用SLURM运行一个作业数组，并使用下面的作业数组脚本(我是用sbatch job_array_script.sh [args]运行的)为了解释，我希望job_slurm_script.py作为数组作业运行1000次，最多并行2

浏览 3提问于2017-09-26得票数 8

回答已采纳

1回答

Slurm:使用多个节点的核心进行R并行化

、、、

我想在HPC上使用Slurm调度程序并行一个R脚本。每个计算节点有16个核心(32个线程)。我将R脚本传递给Slurm，配置如下，使用作为SLURM的接口。在问题中

浏览 0提问于2019-02-27得票数 3

回答已采纳

1回答

slurm可以运行3台独立的计算机作为一个“节点”吗？

我是一个实习生，负责在三个运行ubuntu的计算单元上安装slurm。现在的工作方式是将ssh放入其中一个计算单元中，并在其中运行一个作业，因为所有三个单元都通过nfs挂载共享内存。我的问题是，从我在文档中看到的情况来看，在安装slurm时，我会将每个计算单元指定为一个完全独立的节点，而我想要运行的任何使用多个核的作业仍然会受到单个节点上可用的核数的限制。然而，我的主管告诉我，这三个单元应该作为一个节点安装，当一个作业需要比单个计算单元上可用的内核更多的内核时，

浏览 0提问于2020-02-29得票数 0

回答已采纳

1回答

如何在DASK中批量调度dask_jobqueue作业而不是并发？

根据我对Dask-Jobqueue (https://jobqueue.dask.org/en/latest/)的阅读，以及在我们的SLURM集群上的测试，似乎当您设置cluster.scale(n)并创建client = Client(cluster)时，在您的作业的所有n都能够启动之前，没有一个作业能够启动。你永远不知道你能得到多大的并行性。您希望集群调度程序只接收999个作业(在slurm

浏览 30提问于2019-05-15得票数 0

1回答

有没有办法通过slurm在集群上单独使用CPU？

、

我一直在使用一个由200个节点组成的集群，每个节点有32个核心，用于模拟随机过程。我必须对同一系统进行大约10000次模拟，所以我在一个节点的32个内核中运行相同的模拟(使用不同的RNG种子)，直到它完成所有10000次模拟。在我的sbatch脚本中，我有以下内容： # Specify the number of nodes(nodes=) and the number of cores per nodes(tasks-pernode有没有办法将这些未使用的内核释放出来用于其他作业？有没有办法将这32个作业</em

浏览 20提问于2020-10-23得票数 1

2回答

Slurm:在所有节点上创建一个目录

我正在使用slurm启动一个并行执行作业。此作业需要在每个节点中存在特定的目录结构，但如果我在作业脚本中使用mkdir，则仅在第一个节点中创建目录。如何确保在作业使用的所有节点中都创建了目录？

浏览 0提问于2013-08-26得票数 1

1回答

调度比MaxArraySize更多的任务

这些命令被生成并存储在一个文件中，每一行一个。我想使用Slurm来调度和运行这些命令。然而，MaxArraySize的限制是2000年。因此，我不能使用一个作业数组来调度所有这些任务。给出了一种解决方案，在中，我们创建四个单独的作业，并在文件中使用算术索引，最后一个作业有较少的任务要运行(233)。是否可以使用一个带有一个作业ID的S批处理脚本来完成这个任务？我在使用作业数组

浏览 9提问于2022-05-10得票数 1

回答已采纳

1回答

在HPC上使用并行选项的简单方法--学习函数

、、、、

在许多功能中，学习实现了用户友好的并行化。例如，在sklearn.cross_validation.cross_val_score中，您只需在n_jobs参数中传递所需的计算作业数。但是，如果我想在高性能集群中使用这样的选项(安装了OpenMPI包并使用SLURM进行资源管理)？如我所知，sklearn使用joblib进行并行化，而后者使用multiprocessing。而且，正如我所知道的(例如，从这里，) mul

浏览 8提问于2016-07-26得票数 44

3回答

如何将作业提交到SLURM节点列表中的任意[子集]节点？

、、、

我有几千个作业要在一个有16个节点的SLURM集群上运行。这些作业只能在大小为7的可用节点的子集上运行。一些任务是并行化的，因此使用了单个节点的所有CPU能力，而其他任务是单线程的。因此，应该在单个节点上同时运行多个作业。任何任务都不应在多个节点上生成。目前，我提交的每个作业如下：然而，此参数使slurm等待，直到提交的作业终止，因此留下3

浏览 1提问于2014-10-06得票数 28

回答已采纳

1回答

如何在并行bash中运行这个简单的for循环？

、、、

我尝试使用不同的参数多次运行Rscript，并且我使用bash脚本来运行它(当我试图在R中与foreach和doParallel并行运行时出错了，但这不是问题所在)。我的脚本，我打算用$sbatch script.sh (在高性能hpc上)调用它，如下所示：dodo RscriptsomeRsc

浏览 1提问于2021-06-03得票数 0

回答已采纳

1回答

如何通过依赖于作业列表的sbatch提交SLURM作业

、、

我有一个shell脚本，它向SLURM提交多个作业。这些作业是在以下循环中提交的：slurmids=() # storage of slurm job ids for k in $(seq 1 $nb_partitions除了提交作业外，此循环还创建数组slurmids，该数组包含所有SLURM作业的作业ids列表。现在，我有另一个SLURM<e

浏览 2提问于2021-07-01得票数 1

回答已采纳

点击加载更多