首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >slurmd:错误:找不到cgroup/v2的指定插件名,查看所有文件

slurmd:错误:找不到cgroup/v2的指定插件名,查看所有文件
EN

Stack Overflow用户
提问于 2022-10-12 08:24:53
回答 1查看 189关注 0票数 0

在我的计算节点上启动服务时,我面临的问题是.

×slurmd.service - Slurm节点守护进程

加载: loaded (/usr/lib/systemd/system/slurmd.service;已启用;供应商预置:禁用)自Wed 2022-10-12 04:10:25 EDT以来活动(结果:退出代码);7s前进程: 5839 ExecStart=/usr/sbin/slurmd -D -s $SLURMD_OPTIONS (code=exited,status=1/FAILURE)主PID: 5839 (code=exited,status=1/FAILURE) CPU: 3MSOct 1204:10:25 compute1.ghpcv3.au.dk systemd1:已启动Slurm节点守护进程。10月12日04:10:25 compute1.ghpcv3.au.dk systemd1: slurmd.service:主进程退出,code=exited,status=1/FAILURE 10月12 :10:25 compute1.ghpcv3.au.dk systemd1: slurmd.service: FAILURE和结果‘退出代码’。

#slurmd -D -vv slurmd:调试:日志文件重新打开slurmd:调试: CPUs:1板:1套接字:1 CoresPerSocket:1 ThreadsPerCore:1 slurmd:错误:未能为cgroup/v2找到指定的插件名称slurmd: error:无法找到cgroup/v2 slurmd的cgroup插件: error:无法为cgroup/v2 slurmd创建cgroup上下文:错误:无法初始化cgroup plugin : error: slurmd初始化失败

我错过了什么?

EN

回答 1

Stack Overflow用户

发布于 2022-10-26 17:38:12

您可能必须在slurm配置目录cgroup.conf https://stackoverflow.com/a/65226055/5749775中手动创建https://stackoverflow.com/a/65226055/5749775

我通过创建一个相当简单的conf来修复这个问题:

代码语言:javascript
运行
复制
# /etc/slurm-llnl/cgroup.conf

CgroupAutomount=yes
# CgroupReleaseAgentDir="/etc/slurm/cgroup"

ConstrainCores=yes
ConstrainDevices=yes
# TaskAffinity=yes
ConstrainRAMSpace=yes
# ConstrainSwapSpace=yes
MaxRAMPercent=98
AllowedSwapSpace=0
AllowedRAMSpace=100
MemorySwappiness=0
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74038679

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档