腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
SLURM
-
如何
确定
作业
正在
使用
哪些
特定
的
CPU
?
、
、
、
我
正在
开发一个工具,用于监视当前在集群(19个节点,40个核心)上运行
的
作业
。有没有办法
确定
slurm
队列中
的
每个
作业
正在
使用
哪些
特定
的
cpus?我
正在
使用
'pidstat‘、'mpstat’和'ps -eFj‘获取数据,它们告诉我
哪些
进程
正在
特定
的</e
浏览 23
提问于2019-04-12
得票数 1
回答已采纳
1
回答
列出
作业
的
挂起步骤
在这种情况下,我将重新源(2个节点,64个
CPU
)分配给salloc:salloc: Granted job allocation 1720for i in (seq 70)end 因为我为我
的
工作创建了比可用
CPU
更多<
浏览 3
提问于2017-08-02
得票数 1
回答已采纳
1
回答
Cgroup和
Slurm
、
我知道
如何
使用
cgroups(分配内存、
cpu
使用
率...)和
slurm
(提交、挂起/停止
作业
)。我想知道cgroups是
如何
使用
slurm
的
。当我向
slurm
提交
作业
时,我可以在哪里修复内存或
CPU
使用
率?我阅读了
Slurm
Schedmd()
的
文档,但它没有给出很好
的
解释。也许这
浏览 4
提问于2017-05-22
得票数 3
1
回答
更改运行
Slurm
作业
的
CPU
计数
、
、
、
我有一个
SLURM
集群和一个
正在
运行
的
作业
,其中我请求了60个线程(我
使用
cgroup共享节点上
的
线程)Job is no longer pending execution for job 274332 该
作业
仍然分配了60RUNNING Reason=None Dependenc
浏览 0
提问于2019-09-05
得票数 4
回答已采纳
1
回答
在批处理中
使用
数组和节点列表
、
由于Matlab将
如何
利用计算集群上
的
资源
的
局限性,我想创建几个
作业
,每个
作业
都
使用
给定节点上
的
所有核心。我可以结合其他参数
使用
-数组选项来确保在一个单独
的
节点上得到每个
作业
。但是,出于某种原因,我们集群上
的
slurm
计划将我
的
作业
放在已经在
使用
的
节点上,即使我试图
使用
-c选项来最大化给定节点
浏览 1
提问于2014-09-03
得票数 1
回答已采纳
1
回答
MPI和
Slurm
概念
、
在理解以下基本概念方面,我遇到了一些困难: 我可以跨多个分区运行mpi
作业
吗?
浏览 9
提问于2015-10-04
得票数 4
回答已采纳
1
回答
如何
限制
slurm
的
cpu
使用
率?
因此,我在2台笔记本电脑(2个节点)上运行
slurm
作业
,我注意到这两台笔记本电脑都变得非常迟钝,以至于鼠标甚至不能移动。当我
使用
htop时,我发现
作业
使用
了4个内核,
使用
率为100%。我确信这个
作业
不会占用太多
的
cpu
资源。
如何
使
slurm
只
使用
所需
的
cpu
能力?
浏览 29
提问于2021-05-27
得票数 0
回答已采纳
1
回答
如何
在
Slurm
中设置每个
作业
允许
的
最大
CPU
数?
如何
在
Slurm
中设置每个
作业
可以请求
的
最大
CPU
数量? 我们
正在
运行GPU集群,并希望有合理数量
的
CPU
始终可用于GPU
作业
。只要任务需要GPU,这就没问题,因为gres.conf中有GPU <->
CPU
映射。但这并不会阻止不要求任何GPU
的
作业
不获取系统中
的
所有
CPU
。
浏览 126
提问于2020-03-30
得票数 0
1
回答
Slurm
-
作业
运行,获取数据,但提供超时错误。
、
、
、
、
所以我
正在
运行一些代码,在集群上运行大约需要2个小时。我检查了生成
的
文件存储在其中
的
目录,每次都成功地完成了模拟。尽管如此,
slurm
仍然保持
作业
运行,直到达到最大时间为止。.
浏览 1
提问于2022-03-06
得票数 -1
1
回答
如何
设置maxTRESperuser对每用户服务质量
的
限制
出于测试目的,我刚刚将qos参数MaxTRESperuser设置为
cpu
=10,但是
slurm
正在
调度
作业
。我
使用
:我们可以在上面查看 Name Priority GraceTime=1 squeue
浏览 82
提问于2017-07-15
得票数 1
回答已采纳
1
回答
在一个拥有2个gpu
的
NVIDIA主机上,两个远程用户
如何
在
SLURM
下通过srun命令
使用
一个gpu?
、
、
我有一个带有2个GPU
的
NVIDIA主机,有两个不同
的
远程用户需要在该主机上
使用
GPU。当每个任务都由
SLURM
管理
的
srun执行其任务时,其中一个将立即释放GPU资源,而对于另一个则处于等待资源
的
队列中。但是有两个GPU。为什么不是每个人都有GPU?我已经尝试过几种替代方案,它们都在参数中,但似乎在
使用
SRUN时,在交互形式下,负责执行任务的人在完成任务之前拥有整个机器领域。
浏览 20
提问于2022-11-22
得票数 0
1
回答
Slurm
并行“步骤”:25个独立运行,每个
cpu
使用
一个
cpu
,最多同时运行5个
、
我以前
使用
HTCondor作为集群调度程序。现在,即使在阅读
Slurm
文档之后,我也不知道
如何
并行化. 我想要实现
的
是--我认为--“令人尴尬
的
平行”:运行一个程序
的
多个独立实例(具有不同
的
输入)。我想要
的
是:请求5个
CPU
,可能在不同
的
节点上;每个
CPU
运行具有
特定
输入
的
单点程序。一旦释放了一个
CPU
,就启动队列中
的
下一个输入
浏览 9
提问于2022-05-12
得票数 0
1
回答
linux一个节点上并行运行
的
任务
的
单独.out文件
、
、
、
我在linux上
使用
slurm
并行运行
作业
,方法是请求一个节点,每个
cpu
运行一个任务。#!Always keep th
浏览 2
提问于2021-06-17
得票数 0
回答已采纳
1
回答
我
如何
知道
slurm
上
正在
运行
的
作业
的
实时内存
使用
情况?
我对
cpu
如何
与内存通信知之甚少,所以我不
确定
这是否是一个“正确”
的
问题。AveCPU|AveRSS|MaxRSS
如
浏览 0
提问于2018-11-27
得票数 4
回答已采纳
1
回答
编译器没有
使用
所有的
CPU
,我需要你
的
建议
、
、
、
我
的
PC有两个
cpu
xeon e5-2678v3,12个核心/24个线程每个
cpu
(总共24个核心/ 48个线程)我提交了
slurm
批处理
作业
,为我
的
代码请求多核(CFD fortran代码与英特尔fortran编译器在linux)代码运行良好,但似乎所有48个线程只在一个
cpu
上运行,而不是双
cpu
。我
使用
上面相同
的
slurm
批处理
作业
文件检查了串行和op
浏览 2
提问于2020-05-19
得票数 0
1
回答
使用
SLURM
的
非对称混合映射
、
、
、
、
我想用
slurm
做一个非对称
的
混合映射。#SBATCH --nodes 3#SBATCH --cpus-per-task 32 在此配置中,我为每个mpi task分配了但是节点0中
的
31个mpi task 0未被<
浏览 3
提问于2017-12-06
得票数 2
1
回答
从
SLURM
理解MaxRSS
我以为MaxRSS是用来理解
SLURM
作业
的
内存需求
的
;然而,现在我在质疑自己。 我
使用
sacct来检查
作业
失败
的
原因;但是,它似乎由于OOM这看起来很奇怪,因为它只尝试
使用
请求
的
1.61 Gb<e
浏览 4
提问于2020-10-26
得票数 4
回答已采纳
1
回答
slurm
作业
阵列与
作业
步骤绩效
的
差异
、
、
我在
slurm
中运行了一组并行
作业
(大约1000),每个任务都必须分配给一个
CPU
。阅读,我发现了以下内容: 考虑将相关工作放入具有多个
作业
步骤
的
单一
Slurm
作业
中,这既是出于性能原因,也是为了便于管理。每个
Slurm
作业
可以包含多个
作业
步骤,而
Slurm
中用于管理
作业
步骤
的
开销要比单个
作业
低得多。
作业
浏览 4
提问于2019-07-25
得票数 4
回答已采纳
1
回答
Snakemake WorkflowError:未能将
作业
组合在一起
、
背景:我必须将我
的
Snakemake管道从一个节点
的
使用
调整到一个具有资源管理
的
集群。
使用
特定
于
SLURM
的
Snakemake配置文件,我
的
规则成功地作为
SLURM
作业
提交,因此我继续将Snakemake指令resources添加到每个非本地规则中,以优化队列调度。问题:我
的
管道有许多小
的
单
CPU
作业
,我用Snakemake规则
浏览 5
提问于2021-11-12
得票数 0
回答已采纳
1
回答
slurm
- sbatch
作业
数组,用于并行执行
使用
wrap命令填充每个节点
的
串行
作业
、
我有一个文件,每行只有一个命令,如下所示: myprog.sh <args abc> myprog.sh <args def> 我
正在
尝试将这些提交为数组中
的
作业
。阵列应
使用
1台主机以及该主机上
的
所有cpus。相反,每个阵列
使用
2个主机,并在这两个主机上执行这两个命令。.out将具有来自
作业
1
的
标准输出,而
slurm
1_2.out将具有来自job2
的
标准输出。相反,
正在
发生<
浏览 100
提问于2021-06-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Netflix 的数据基础设施如何兼顾效率和成本?
你真的理解多程序,多任务,多线程和多处理之间的区别吗?
Salesforce如何连续分析数以万计的生产服务器
CPU Profiler 使用指南
送给计算同行们的13条金玉良言
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券