试图让qsub在我的集群上工作(现在是单个节点,但更多的节点正在到来),到目前为止,尝试提交qsub的尝试正在返回。
error: commlib error: got select error (Connection refused)
Unable to run job: unable to send message to qmaster using port 536 on host "nes.local": got send error.
Exiting.
我跟踪了gridengine.org上的一些帖子,建议:
/etc/init.d/sgemaster.nes st
我有pip安装的tensorflow 1.4.1,但是系统默认的gcc库并不是最新的,它正在运行。
import tensorflow
将导致此错误
ImportError: /lib64/libc.so.6: version 'GLIBC_2.16' not found
因为我没有根权限,所以我创建了gcc库,并使用
alias python_cpu='/path/ld-linux-x86-64.so.2 --library-path /path/other_libs /path/python'
在CPU上运行tensorflow。
现
我尝试通过Torque PBS命令在集群上启动任务
qsub -o a.txt a.sh
文件a.sh包含单个字符串:
hostname
在命令qsub之后,我发出qstat命令,这将给出下一个输出:
Job ID Name User Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
302937.voms a.sh user
我正在尝试cross=compile一个简单的程序与内联汇编的各种ARM处理器。它包含汇编指令QSUB,根据的说法,QSUB既是有效的ARM指令,也是Thumb-2指令。
这对我来说在构建cortex A8时可以很好地编译。
当我尝试为cortex m3构建时,我在标题中得到了编译错误,但找不到原因。我尝试使用编译器开关-mthumb强制使用thumb模式,然后错误变为"selected processor not support thumb mode“。我有点困惑,因为cortex m3实际上支持拇指模式。
以下是我在codesourcery的gcc中使用的编译选项:
arm-non
我有一个将数据结构拆分成块的脚本。使用torque作业数组处理这些块,然后将其合并回单个结构。
合并操作依赖于作业数组的完成。如何让合并操作等待torque作业数组完成?
$ qsub --version
Version: 4.1.6
我的脚本如下:
# Splits the data structure and processes the chunks
qsub -t 1-100 -l nodes=1:ppn=40,walltime=48:00:00,vmem=120G ./job.sh
# Merges the processed chunks back into a single str
我有一个名为"minvappmpi“的程序,它被并行化,并将qsub作为子例程调用。
当我在集群上使用程序时,它会抛出错误。
qsub: command not found
如果我想用"qsub“提交另一份工作,那么一切都很好。只有当我在程序中调用"qsub“时,才会找到该命令。
我认为这个问题与路径有关:不知何故,我正在工作的环境知道可执行文件"qsub“在哪里,但是集群不知道?
我想知道:第一,如何确定批处理环境的路径是什么,以及它是否与登录环境的路径不同,第二,是否有一种方法可以在没有根权限的情况下更改批处理环境的路径?
非常感谢你的帮助!
我想使用qsub提交一个作业,它运行一些使用Numpy的Python代码。Numpy安装在我登录集群时激活的conda虚拟环境中,如果我只需在Python命令行解释器中调用import numpy,就可以导入它。 但是,当我使用qsub提交作业时,它会尝试在不使用该环境的情况下运行作业。经过一些测试,如果我使用-V选项传入所有变量,似乎可以让qsub在正确的环境中运行。 然而,这会使脚本的其他部分变得混乱。如果我可以只传入让qsub在正确的环境中运行所需的内容,那就更好了。我该怎么做呢? 附注:解决方案here对我不起作用;错误是Unable to locate a modulefile f
我一直在寻找一种简单的方法来捕获由qsub提交的作业ID。我看到有人建议给这份工作起一个名字,并使用这个名字。但这是个间接的方法。我试过这样做,但出错了
jobID="qsub job.sh"
35546.cell0 (This is the output I want to capture)
$jobID
qsub -W depend=afterok:$jobID analyze.sh
有谁能建议一种简洁的方法从qsub获取工作ID吗?
非常感谢。