腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
通过
Python
提交
SLURM
作业
的
最佳
实践
python
、
shell
、
slurm
、
snakemake
、
joblib
这是一种通用
的
最佳
实践
问题。我有一个
Python
脚本,它迭代一些参数并使用这些参数调用另一个脚本(这基本上是对一些简单
的
深度学习模型
的
网格搜索)。这在我
的
本地机器上工作得很好,但是现在我需要我
的
unis计算机集群
的
资源,它使用
SLURM
。我在
python
脚本中有一些逻辑,我认为在shell脚本中很难实现,而且可能不合时宜。我也不能一下子把所有
作业
都扔到集群上,因为我想跳过某些参数组
浏览 24
提问于2020-05-10
得票数 1
回答已采纳
1
回答
带依赖
作业
的
Slurm
作业
阵列
slurm
我有一组依赖
的
Slurm
作业
正在成功
提交
。这些
作业
的
设置如下: \ / | |我需要
提交
这组工作1000次,每次参数化略有不同。如果我要在没有依赖项
的
情况下
提交
大量
作业
,我将使用
作业
数组对其他用户和调度程序友好。
提交
相关
作业
的
作业
数组
的
最佳</e
浏览 8
提问于2022-08-17
得票数 1
回答已采纳
2
回答
处理
作业
提交
限制
slurm
我使用--array运行
slurm
作业
数组,我想运行大约2000个任务/数组项。但是,这超出了集群一次
提交
约500个
作业
的
限制。 有没有什么小贴士/
最佳
实践
来拆分这一切呢?我想一次
提交
所有的数组,如果可能的话,仍然可以将数组id参数1-2000传递给我
的
程序。我认为像等待
提交
数组片段这样
的
事情可能会有帮助,但目前我不确定如何做到这一点。
浏览 0
提问于2020-11-10
得票数 0
1
回答
在带有
SLURM
的
HPC系统上使用GNU并行运行多个
python
文件实例和两个输入文件
python
、
hpc
、
slurm
、
gnu-parallel
我试图在一个HPC-系统上并行运行一个
python
文件240次(因为每个单独
的
文件运行大约需要9分钟)。理想情况下,每个
python
文件都应该运行在单个核心上。每个节点有24个核心。
python
文件接受两个输入文件,每组一个:parallel="parallel --delay .2 \ -j $
SLURM
浏览 2
提问于2020-05-05
得票数 1
1
回答
我是否需要为
SLURM
中
的
每个任务使用一个bash文件?
bash
、
slurm
、
sbatch
我正在尝试在
SLURM
管理
的
集群中启动多个任务,并希望避免处理数十个文件。plotConvergence.py i 然后,我使用另一个bash文件
slurm
_run_all.sh
提交
所有这些任务 #!/bin/bash sbatch
slurm
_run_$i.sh done 这是可行
的
(集群上正在运行50个
作业
),但是我发现输入文件超过50个是很麻烦
的
。但是,我不能单独管理这些
作业<
浏览 38
提问于2020-04-16
得票数 1
回答已采纳
2
回答
使用
Python
子进程运行
SLURM
脚本以将多个长
作业
提交
到队列,并在继续执行
Python
脚本之前等待
作业
完成
python
、
queue
、
subprocess
、
wait
、
slurm
这种情况
的
基本情况是,我使用
Python
的
subprocess模块运行
SLURM
脚本,该脚本将大量
作业
提交
到我使用
的
一些高性能计算资源上
的
队列。我希望
Python
脚本等待所有
提交
的
作业
完成。我试着这样做:proc.wait() 但是
浏览 1
提问于2017-04-28
得票数 2
1
回答
如何使用
Slurm
/Sbatch
提交
/运行多个并行
作业
?
python
、
shell
、
slurm
、
sbatch
我正在尝试向
Slurm
服务器
提交
大量
作业
(数百个),并希望避免为我想要运行
的
每个
作业
提交
新
的
shell脚本。
提交
的
代码是一个
Python
脚本,它接受shell脚本中
的
两个输入变量,并且这些变量是在不同
作业
之间唯一变化
的
变量。以下是适用于单个
作业
的
简短shell脚本
的
示例: #!/bin/ba
浏览 1898
提问于2021-04-02
得票数 0
1
回答
SLURM
需要GPU资源请求
slurm
是否有一种方法要求
作业
具有--gres=gpu:X对S批处理和运行
作业
提交
?要么让
作业
需要该标志,要么设置每个
作业
(如DefMemPerNode )
的
默认gpus数。我
的
slurm
.conf当前设置为SelectType=select/cons_res SelectTypeParameters=CR_Core如果没有办法
通过
slurm
配置
浏览 4
提问于2022-02-15
得票数 0
1
回答
用于请求时间
的
Slurm
环境变量
slurm
对于
slurm
作业
,环境变量$
SLURM
_JOB_NUM_NODES提供请求
的
节点数。#!account=abc#SBATCH --job-name=xyz
浏览 7
提问于2022-01-28
得票数 2
回答已采纳
1
回答
在
python
中与
slurm
作业
交互
python
、
slurm
我需要
通过
python
与集群上
的
slurm
进行交互。具体地说,我需要
提交
一堆
作业
,检查成功
的
作业
,重新
提交
失败
的
作业
,收集结果,等等。在R中,有一个名为BatchJobs
的
包,它提供了这些功能。
Python
中
的
等价物是什么? 我在周围看到了PySlurm,但它看起来还在开发中,不会拥有我需要
的
所有功能。
浏览 0
提问于2018-05-06
得票数 1
4
回答
使用
python
自动创建bash脚本
python
、
bash
、
slurm
我正在尝试为我在中列出
的
一个问题寻求帮助,从一些进一步
的
研究中,我认为
Python
脚本可能是答案。也就是说,我是
Python
的
新手,不确定如何实现我
的
想法,也不确定它是否正确。我正在
通过
SLURM
脚本运行matlab函数。
SLURM
脚本(我认为)是一种bash脚本,但它专门用于在HPC上调度
作业
。我
的
问题是,例如,我希望一次
提交
10个
作业
,但所有
作业</e
浏览 1
提问于2019-07-19
得票数 0
1
回答
如何将
SLURM
作为输入参数传递给
python
?
deep-learning
、
python-3.6
、
slurm
我是用
SLURM
训练一批卷积神经网络
的
新手。为了跟踪所有训练好
的
CNN,我想把
SLURM
jobID作为输入参数传递给
python
。将其他变量作为参数传递很好。但是,我无法访问
SLURM
作业
人员
的
身份。以下是我
的</
浏览 1
提问于2019-08-10
得票数 2
回答已采纳
1
回答
在调用
slurm
sbatch之前为日志文件创建目录
bash
、
slurm
Slurm
sbatch将stdout和stderr定向到由-o和-e标志指定
的
文件,但如果文件路径包含不存在
的
目录,则无法这样做。是否有办法自动生成我
的
日志文件
的
目录?让
作业
名称
的
变化存在于文件名中,而不是目录中,这会造成大量
的
、组织不良
的
日志,当我需要检查我
的
作业
做得如何时,我必须对其进行排序。
python
./my_script.py $1 ${
SLURM<
浏览 0
提问于2019-01-25
得票数 9
3
回答
如何将
作业
提交
到
SLURM
节点列表中
的
任意[子集]节点?
cluster-computing
、
batch-processing
、
slurm
、
sbatch
我有几千个
作业
要在一个有16个节点
的
SLURM
集群上运行。这些
作业
只能在大小为7
的
可用节点
的
子集上运行。一些任务是并行化
的
,因此使用了单个节点
的
所有CPU能力,而其他任务是单线程
的
。因此,应该在单个节点上同时运行多个
作业
。任何任务都不应在多个节点上生成。目前,我
提交
的
每个
作业
如下: sbatch --nodelist=myCluster[10-16] myScri
浏览 1
提问于2014-10-06
得票数 28
回答已采纳
1
回答
是否从旧
作业
恢复
Slurm
作业
提交
脚本?
slurm
我使用rm命令意外地删除了终端中
Slurm
作业
的
作业
提交
脚本。据我所知,再也没有(相对容易
的
)方法来恢复那个文件了,我也没有把它保存在任何地方。我之前已经使用过这个
作业
提交
脚本很多次了,所以有很多
Slurm
作业
提交
(都完成了)都使用过它。是否可以
通过
某种方式从以前已完成
作业
中恢复
作业
脚本?
浏览 26
提问于2020-03-08
得票数 2
回答已采纳
1
回答
如何强迫用户在
slurm
中
的
某个目录中
提交
作业
slurm
我试图设置
SLURM
,使
SLURM
接受在某个目录中
提交
的
作业
,否则拒绝该
作业
。要激活prolog脚本,我已经将
slurm
.conf设置为:/etc/
slurm
/prolog中
的
prolog脚本: #!/bin/bash
浏览 0
提问于2019-05-04
得票数 1
回答已采纳
1
回答
SLURM
环境变量为空
slurm
我尝试
通过
命令行
提交
一个
作业
,而不是
通过
提交
脚本
提交
。由于某种原因,没有初始化任何
slurm
_variables: sbatch --job-name NVP --time 01:00:00 --nodes 1 --ntasks 1 --cpus-per-task2 --wrap "echo "var1:" $
SLURM
_CPUS_PER_TASK "var2:" $
SLURM
_JOB
浏览 3
提问于2020-11-30
得票数 0
回答已采纳
1
回答
slurm
作业
阵列与
作业
步骤绩效
的
差异
parallel-processing
、
slurm
、
gnu-parallel
我在
slurm
中运行了一组并行
作业
(大约1000),每个任务都必须分配给一个CPU。阅读,我发现了以下内容: 考虑将相关工作放入具有多个
作业
步骤
的
单一
Slurm
作业
中,这既是出于性能原因,也是为了便于管理。每个
Slurm
作业
可以包含多个
作业
步骤,而
Slurm
中用于管理
作业
步骤
的
开销要比单个
作业
低得多。 <e
浏览 4
提问于2019-07-25
得票数 4
回答已采纳
1
回答
为什么我不能在
SLURM
中模拟运行同一
python
脚本
的
多个实例
python
、
google-cloud-platform
、
google-compute-engine
、
slurm
我一直在努力尝试让
python
脚本
的
多个实例在
SLURM
上运行。我可以使用以下命令在登录节点上运行此脚本此外,我可以
提交
一个脚本submit.sh来运行该
作业
:found 当我尝试以数组
的
形式
提交
作业
时,我发现我遇到了同样
的
问题。
python
3.6 my
浏览 2
提问于2018-10-24
得票数 0
1
回答
如何根据
作业
id查找用于
slurm
作业
的
命令?
slurm
在使用sbatch file.
slurm
提交
slurm
作业
后,您将获得一个
作业
ID。您可以使用squeue和sacct来检查
作业
的
状态。但都不会返回
作业
的
原始
提交
命令(sbatch file.
slurm
)。是否有一个命令可以显示
提交
命令,即sbatch file.
slurm
?我需要将
作业
I与我
的
提交
命令链接起来
浏览 8
提问于2020-03-05
得票数 0
点击加载更多
相关
资讯
在 Python 中使用函数式编程的最佳实践!
使用Salt进行基础设施管理的Python开发-Salt被忽视的一面以及最佳实践
MOMAP2019B版本更新说明
Andrew Ng 机器学习课程的Python实现
吴恩达机器学习课程:完全用Python完成,可以的!
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券