腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
没有
提交
文件
的
情况下
,如
何在
condor
中
提交
请求
特定
GPU
的
作业
?
、
我想做
的
是:
condor
_submit -i request_cpus=8 request_gpus=1 -requirements="(CUDADeviceName!='Tesla K40m')" 但是由于空格和逗号
的
原因,我不能这样做。我也尝试过:
condor
_submit -i request_cpus=2 request_gpus=1 -requirements=(CUDADeviceName!它确实适用于
提交
文件
,例如 Request
浏览 17
提问于2020-11-11
得票数 1
3
回答
如何强制
condor
向集群内所有节点
提交
作业
?
、
我有一个具有多个活动节点
的
condor
集群。但是如果我想强制
condor
使用所有的节点呢?仅仅是为了评估运行在多个节点上
的
进程时间还是
在
单个节点上运行
的
进程时间?我尝试
在
提交
文件
中
添加requirements = Mach
浏览 0
提问于2014-05-25
得票数 1
1
回答
Condor
Vanilla宇宙运行在
提交
机上
、
、
我是秃鹰
的
新手。我正在用no做秃鹰
的
主项目。覆盆子皮。目前,我已经将两个pi连接在一个秃鹰池中;我指的是"“网站来运行一个
作业
。但问题是
作业
是
在
提交
机器上运行
的
。Universe = vanillashould_transfer_files = yes when_to_transfer_output =Arg
浏览 1
提问于2016-02-25
得票数 0
1
回答
在
使用
condor
时,如何从环境变量
中
获取交互式
作业
的
作业
ID?
、
我通常通过以下命令获得工作id: MY_
CONDOR
_JOB_ID 但如果这是一个交互式
的
工作,我看不到它
的
设置。有
没有
办法设置它?当我获得资源时,我看到我
的
工作有一个
作业
id。有
没有
办法得到它?
浏览 14
提问于2021-03-26
得票数 1
回答已采纳
1
回答
如何修改飞马WMS
的
调度程序
、
我对科学
的
工作流调度很感兴趣。我试图从中找出并修改飞马工作流管理系统
中
的
现有调度算法,但我不知道它在哪里,也不知道如何做到这一点。谢谢!
浏览 3
提问于2013-07-06
得票数 0
回答已采纳
2
回答
如何检查发送到HTcondor
的
特定
作业
的
状态?
是否有方法检查
特定
作业
的
状态(例如,通过集群/进程id),以及如
何在
提交
作业
时检索这些id?
浏览 2
提问于2014-02-14
得票数 0
回答已采纳
1
回答
在
HTCondor
中
检索创建
的
输出
文件
我正在使用HTCondor运行一个耗费大量时间(数十小时)并定期生成
文件
(数十分钟)
的
作业
。我希望HTCondor
在
文件
创建后立即将
文件
传输到我
的
提交
目录
中
。我如何才能做到这一点呢?对于
condor
来说,有
没有
什么本机选项可以让我这样做?有
没有
其他方法? 我也可以尝试
在
创建
文件
时使用scp或mv,但我不知道如何手动将
文件
从<em
浏览 11
提问于2018-02-22
得票数 0
1
回答
如
何在
python和输出脚本
中
获得
condor
作业
号?
、
我想要两件事:##################### Simple HTCondor submit description file####################=
condor
_job_stdout.out我希望输出
浏览 2
提问于2020-05-03
得票数 1
回答已采纳
3
回答
如
何在
Condor
上运行python程序?
、
、
我是
Condor
的
新手,正在尝试
在
Condor
上运行我
的
Python程序,但有一个困难。我找到
的
所有教程都假定使用一个
文件
Python程序,但是我
的
Python程序由多个包和
文件
组成,并且还使用了其他库,
如
numpy和scipy。在这种
情况下
,我如何让
Condor
运行我
的
程序?我应该把程序转换成某种可执行
文件
吗?或者,有
没有
办法
浏览 8
提问于2017-04-05
得票数 4
1
回答
作业
永远停留在队列
中
(
Condor
- Parallel
Condor
)
我最近一直
在
尝试配置HTcondor。我设法
提交
了连续
的
(香草宇宙)
作业
,
没有
任何错误或问题。但是当我尝试
提交
并行(并行宇宙)
作业
时,这些
作业
似乎永远都会被塞进队列
中
。*
提交
文件
编码:executable = SommePerror = errorP.log = logP machine_count = 4
浏览 11
提问于2018-01-17
得票数 0
回答已采纳
1
回答
提交
秃鹰
作业
期间
的
代码更新
、
、
、
当使用
condor
在
专用计算机集群中分发
作业
时,首先向群集
提交
作业
,然后等待它们实际开始运行。取决于多种因素,它们可能在相当一段时间甚至几个小时内处于空闲状态。 假设我刚刚编译了将在
作业
中
运行
的
代码。我可以通过
condor
提交
文件
提交
作业
。然后,我意识到我想要更改原始代码,要么是因为其中有一些bug,要么是因为我想尝试不同
的
参数。如果代码
浏览 1
提问于2020-10-13
得票数 1
回答已采纳
2
回答
将%r
作业
提交
到
condor
时读取%r
文件
时出错
、
我有一个
提交
给
condor
的
R
作业
,当我向
condor
提交
作业
时,
提交
给
condor
的
R
文件
(one.R)正在读取另一个R
文件
(two.R),失败
的
原因是
提交
的
R(one.R)
文件
没有
读取文本
文件
中
的
调用R
文件
(two.R
浏览 2
提问于2010-08-22
得票数 0
回答已采纳
1
回答
访问从属
文件
而不在
condor
中共享
、
、
我有6个windows机器,
condor
可以在上面运行
作业
,当我
在
condor
上运行相互依赖
的
文件
(一个
文件
调用其他
文件
)时,我应该将调用
文件
共享(需要管理访问权限)给我正在运行
作业
的
机器上
的
每个人,并且碰巧
提交
的
文件
生成了放在文本
文件
中
的
输出,如果我将
作业
浏览 0
提问于2010-09-12
得票数 0
1
回答
Condor
中
的
wall time扩展
我
在
使用
Condor
提交
作业
时遇到了问题。 我
的
工作基本上是一个运行c++程序
的
shell脚本。 使用
Condor
提交
作业
时,我
的
作业
永远无法完成,因为 “
作业
已被用户中止。由于连接时间超过允许
的
最长时间,SYSTEM_PERIODIC_REMOVE删除了
作业
。”(从日志
文件
中
)从.out
文件
浏览 21
提问于2019-01-10
得票数 1
1
回答
强制htcondor
在
不显式指定
的
情况下
使用单个计算机
、
我想向htcondor
提交
一个本地并行
作业
,例如,它将总共使用10个CPUS和100G内存。它可以在任何机器上运行。我如何
请求
htcondor
在
一台机器上分配这些资源,而不是使用Machine == "machine1"之类
的
东西显式地指定一台机器,这会将其限制
在
特定
的
机器上?
浏览 22
提问于2020-09-02
得票数 1
回答已采纳
1
回答
如
何在
提交
工作以秃鹰完成后发送电子邮件?
在运行秃鹰
作业
后,我试图使用电子邮件选项。= file.logError = file.stderr # Use this to make sure 1
gpu
如何将其放入
提交
文件
中
?job.sub脚本
中
,还是不管。现在我
没有
在
condor
日志中看到错误,但我
没有
收到电子邮件。所以这意味着
condor
在
结束Que
浏览 3
提问于2020-03-26
得票数 3
回答已采纳
2
回答
如何告诉
Condor
只向集群上安装了"numpy“
的
机器分派
作业
?
、
、
、
我刚刚知道如何使用在集群上
的
机器上发送要处理
的
作业
。由于我们有很多机器,但并不是每台机器都配置相同,所以我想知道: 是否可以告诉秃鹰只将我
的
作业
(python脚本)分派给安装了numpy
的
机器,因为我
的
脚本依赖于这个包?
浏览 6
提问于2012-03-25
得票数 12
2
回答
在运行python
作业
时,如何让
condor
自动导入conda环境?
、
、
我将我
的
作业
提交
给
condor
,但是它说
没有
安装张力板--这是错误
的
,因为我
在
一个交互式
作业
上运行,所以它是安装
的
。##################### Experiments script# # reference: ht
浏览 6
提问于2020-10-22
得票数 1
1
回答
Ubuntu网络连接&秃鹰?
让它们都成为“网格”(例如,通过秃鹰)
的
一部分,以便
作业
可以
提交
到中央节点并在网络上进行处理,有多难呢?你知道怎么做/从哪里开始吗?
浏览 0
提问于2010-09-16
得票数 1
1
回答
为什么本机程序
在
直接执行时运行良好,但在通过
condor
提交
时却失败并出现seg错误
、
、
、
、
我有一个第三方库,我正尝试将其合并到一个模拟
中
。我们有静态库(.a),以及它
的
所有运行时依赖项(共享对象)。我已经创建了一个非常简单
的
应用程序(用C语言编写),它被链接到库
中
。如果我将可执行
文件
提交
到我们
的
Condor
网格,它将失败,并在strncpy (libc.so.6)上显示seg错误。我强制
condor
只
在
一台
特定
的
机器上运行可执行
文件
,如果我直接在那台机
浏览 3
提问于2011-04-18
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
蓝海创意云渲染客户端常见五大问题解答
Gaussian的跨节点并行
OpenPAI:大规模人工智能集群管理平台
Postman最详使用教程
高校大数据实训平台介绍
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券