有没有办法知道下一步在qsub中启动哪个作业？

在qsub中启动作业的顺序是由作业调度器决定的，通常作业调度器会根据作业的优先级、资源需求以及当前系统负载等因素进行决策。

在qsub命令中，并没有直接提供查看下一步将启动的作业的方法。但是可以通过以下方式来获取相关信息：

查看作业队列：可以使用qstat命令查看当前系统中的作业队列情况。qstat命令会显示正在运行、排队等待和完成的作业的状态信息。通过观察队列中的作业信息，可以了解到当前正在运行的作业和即将运行的作业。
查看作业调度策略：了解作业调度策略可以帮助我们推测下一步将启动的作业。作业调度策略通常考虑作业的优先级、资源需求、作业等待时间等因素来进行调度决策。可以通过查看作业调度器的相关配置文件或者咨询系统管理员来了解具体的作业调度策略。

总之，虽然无法直接知道下一步在qsub中将启动哪个作业，但通过观察作业队列和了解作业调度策略，可以对下一步即将启动的作业有一定的了解。

有没有办法知道下一步在qsub中启动哪个作业？

、、、

在我们的研究所(IISc班加罗尔)超级计算机中，我们使用qsub提交作业。作业将根据以下内容开始运行- (1)墙体时间(预计完工时间) (2)其在受尊重队列中的位置(小、中、大等)。因此，很难知道在完成当前正在运行的一个作业后将启动哪个作业。但qsub可能有自己的列表，根据这个列表，它是在立即完成另一个任务后开始另一个任务。有没有办法知道哪个作业将启动next.Is，有什么命令可以做到这一点。谢谢。

浏览 31提问于2020-05-30得票数 0

1回答

避免使用选项-sync yes在SGE中打印作业退出代码

我有一个Perl脚本，它向SGE提交了一堆数组作业。我希望所有作业并行运行以节省时间，并让脚本等待它们全部完成，然后继续下一个处理步骤，该步骤集成来自所有SGE输出文件的信息并生成最终输出。为了将所有作业发送到后台然后等待，我使用了Parallel::ForkManager和一个循环： $fork_manager = new Parallel::ForkManager(@as); # @as: Max nb of processes to run simultaneously for $a (@as) { $fork_manager->start and next; # St

浏览 2提问于2012-05-23得票数 0

1回答

Qsub -延迟/交错作业以作业数组开始

、

可以延迟或错开通过具有qsub的作业阵列启动的作业的开始，例如qsub -t1-4 launch.pbs 我可以通过在我的pbs脚本中随机休眠一小段时间来做到这一点，但是我想知道是否有一种直接的方法可以通过qsub将其指定给调度程序

浏览 0提问于2017-06-06得票数 0

1回答

将qsub作业数量限制在作业限制以下。

、、、、

我试图在光明计算集群上对我的学习模型进行参数调优，由于要调优的参数数量，它需要大量的作业。每一个参数的组合都需要大约162个qsub作业。大约有50个参数组合，我需要检查。这相当于运行大约162个*50个~= 8100作业。但是，在我正在使用的群集上，每个帐户有350 qsub作业限制。因此，我想知道bash脚本中是否有一种方法可以检查当前活动的qsub作业的数量，这样我就可以有效地自动启动新作业的过程。

浏览 2提问于2014-05-04得票数 0

2回答

我可以在没有源.bash_profile的情况下使用qsub吗

、、、、

当我使用qsub提交一堆作业时，qsub将首先提供.bash_profile。那么我怎么才能在没有源.bash_profile的情况下qsub一个作业呢？

浏览 1提问于2012-03-24得票数 2

1回答

如何才能看到用于提交作业的“`qsub`”命令？

、、

我有一个作业运行在远程集群中。有没有一种方法可以查看使用了什么qsub命令(选项等等)来启动作业？

浏览 2提问于2014-10-14得票数 0

回答已采纳

1回答

是否在使用qsub / torque提交作业时排除某些节点？

、

当使用qsub提交批处理作业时，有没有办法排除某个节点(通过主机名)？就像这样 # this is just a pseudo command: qsub myscript.sh --exclude computer01

浏览 2提问于2012-02-13得票数 8

2回答

太阳网格引擎qsub到所有节点

、、

我有一个主节点和两个节点。它们是与SGN一起安装的。我在所有节点上都准备好了一个shell脚本。现在，我想使用一个qsub在我的所有节点上提交作业。我用： qsub -V -b n -cwd /root/remotescript.sh 但似乎只有一个节点在做这项工作。我想知道如何为所有节点提交作业。命令是什么。我指的是这个

浏览 3提问于2015-05-07得票数 0

回答已采纳

1回答

在PBS脚本选项中使用qsub参数

、、、

我想使用我在PBS -N选项中传递给PBS脚本的参数。例如，当我运行PBS脚本时： #!/bin/bash #PBS -N job_${num} echo ${num} 使用 qsub -v num=0 script.sh 它将启动一个名称为job_0的作业。使用上面的代码，创建一个名称为job_{num}的作业。当我尝试使用行#PBS -N job_$num时，我收到一个错误，指出无法创建输出文件。有没有办法实现我想要的东西？

浏览 1提问于2014-06-28得票数 2

2回答

在cfncluster-SGE调度程序中以独占方式在单个实例上运行作业的命令

、、、

我想使用SGE调度程序qsub选项向cfncluster中的单个节点独占提交作业。有谁知道在cfncluster中为作业保留或使用完整实例的正确方法。 qsub -l hostname=node@123 script.sh 但我不想指定主机名，因为我们不知道节点的主机名，因为它还没有启动。是否有指定节点数或cores.Thanks的选项。

浏览 3提问于2016-07-28得票数 1

3回答

将键盘命令编码到Bash脚本中

、、、、

我使用qsub通过集群提交作业的方式如下： Submitting jobs from standard input To submit a PBS job by typing job specifications at the command line, the user types qsub [options] <return> then types any directives, then any tasks, followed by (in UNIX) CTRL-D on a

浏览 0提问于2009-03-12得票数 1

回答已采纳

3回答

Bash脚本，它允许qsub在扭矩中等待工作完成，就像SGE系统中的-sync y一样

、、

我正在使用一个带有Torque/Maui系统的集群。我有一个bash脚本，它使用qsub命令提交一个作业，然后做几件事情，比如移动文件、编写ASCII文件以及检查我提交的作业的输出。对于这个输出，基本上，如果它包含数字1，则需要再次提交作业。如果与1不同，bash脚本会执行其他操作。问题是qsub在后台运行，所有bash都是一次评估的。我想强迫qsub的行为很像awk，cat，排序等等.当脚本在这些命令完成后更进一步时--如果不是放在后台的话。所以，我需要bash在第一个qsub停止，然后在qsub完成后继续运行，这意味着，当作业完成时。有办法这样做吗？它将类似于： -sync y

浏览 9提问于2014-10-03得票数 5

1回答

如何在集群(qsub)中重新启动失败的PBS作业？

、、、

我正在使用qsub命令在集群中运行PBS作业(python)。我很想知道如何从失败的步骤重新启动相同的作业？任何类型的帮助都将受到高度赞赏。

浏览 2提问于2018-12-12得票数 2

2回答

自动通知qsub作业完成状态

、、、、

我有一个shell脚本，可以从中调用其他五个脚本。第一个脚本在集群中创建了50个qsub作业。单个作业的执行时间从几分钟到一小时不等。我需要知道所有50个作业何时完成，因为在完成所有作业后，我需要运行第二个脚本。如何查看是否所有的qsub作业都完成了？一种可能的解决方案是使用无限循环，通过使用带有作业ID的qstate命令来检查作业状态。在这种情况下，我需要不断地检查作业状态。这不是一个很好的解决方案。有没有可能在执行后，qsub job会自动通知我。因此，我不需要频繁地监视作业状态。

浏览 3提问于2015-07-28得票数 1

1回答

在网格引擎/ Sun网格引擎/网格引擎之子上使用Docker

、、、

有没有人有在网格引擎/ Sun网格引擎/网格引擎的儿子上运行Docker并能够的经验？问题是，当I qsub docker run ...时，容器中的实际进程是由docker守护进程而不是docker客户端运行的，这意味着进程树是不同的。 SGE有没有办法跟踪不同树中进程的资源(我假设没有)？另一种选择是qsub一个脚本，该脚本首先启动docker守护进程，然后运行所需的docker run命令，以便所有进程都位于SGE启动的同一进程树中。这将要求sge具有启动守护程序的权限(root访问权限)，并且还可能导致主机上运行多个docker守护程序。备用进程树的另一个问题是，如果提交的作业指定

浏览 1提问于2016-02-10得票数 3

1回答

同时启动Sun Grid Engine上的-hold_jid作业

、

如何启动一组SGE (Sun Grid Engine)作业，其中一些作业使用了-hold_jid选项，但不需要对qsub提交的顺序进行智能排序。如果我这样做，一切都很好，job2等待job1完成： qsub job1.sh qsub -hold_jid job1.sh job2.sh # OK: job2 waits for job1 但是，如果我按如下所示的不同顺序提交，则在没有等待job1的情况下，job2会错误地启动。大概是因为SGE认为没有job1需要等待，因为job1还没有提交。 qsub -hold_jid job1.s

浏览 1提问于2017-09-16得票数 0

2回答

.bashrc的SGE模拟？

、

当我向SGE提交一个包含qsub的作业时，该作业的外壳程序将不会读取.bashrc。是否存在类似于.bashrc的文件，该文件将由以qsub启动的所有作业的外壳程序读取我知道有一个.sge_request文件，但它只包含qsub的默认选项，而不是像.bashrc这样的命令列表。我想要的是为我的工作设置一些环境变量，比如$PATH和$LD_LIBRARY_PATH。我不认为我能用.sge_request做到这一点，但如果我能做到，那也能解决我的问题。

浏览 12提问于2015-05-20得票数 1

1回答

pbs/Torque交互式作业:启动后运行命令的bash技巧

、、

我在bash中使用pbs交互作业，使用qsub -I启动，我想在启动后运行一些命令。在运行此命令之后，我想继续像往常一样使用交互式预订。我不知道如何做到这一点，因为就像打开交互式ssh提示一样，在远程终端完成后发出的命令，即qsub -I; hello。编辑:为了澄清，在上面的示例(qsub -I; hello)中，我希望在qsub预订中运行hello，而不是在我预订的机器上运行。我知道我可以为qsub指定一个作业脚本，但在手册页中，我认为它做不到我想做的事情： ..。这项工作是一项互动的工作。脚本将被处理为指令，但不会包含在作业中。

浏览 0提问于2011-08-10得票数 2

1回答

SGE:如何实时查看输出

、、

我正在向Sun Grid Engine提交一个作业(脚本)。该作业是一个python程序。它可能需要几个小时才能运行，但它会定期写入stdout和stderr以通知我它的状态(比如完成了多少次迭代，等等)。问题是SGE正在缓冲输出，并且只在最后写入文件，这意味着我不能在屏幕上看到输出，也不能实时尾随文件。我只能在作业完成后才能知道状态。有没有办法通过配置SGE (qsub等)来解决这个问题？

浏览 4提问于2014-10-31得票数 3

1回答

如何将qsub作业从父目录转移到集群的子目录

、

在Linux中，我很难从父目录提交作业。假设在我的父目录中，有1000个名为1、2、3……、1000的子目录，其中所有子目录都有一个提交脚本submit.sh。我需要对父目录中的所有脚本执行qsub操作，这样所有的计算和输出都会被转储到相应的子目录中，而不是分别访问每个子目录和qsub，这当然会花费我大量的时间。有没有办法做到这一点？我非常感谢你的帮助。

浏览 2提问于2016-03-07得票数 0

2回答

如何使用sun grid engine qsub传递包含大括号的命令行参数？

、

我有一个想要在sun grid engine上运行的Python脚本，这个脚本接受一个可能包含大括号的字符串命令行参数。例如，脚本可以是script.py import sys print(sys.argv[1]) 如果我运行python script.py aaa{，输出是aaa{，如果我运行python script.py aaa{}，输出是aaa{}。这些都是所需的行为。但是，如果我运行qsub -b y -cwd python script.py aaa{，作业将失败并返回错误Missing }.；如果我运行qsub -b y -cwd python script.py aaa{}

浏览 58提问于2019-03-03得票数 0

回答已采纳

1回答

运行串行作业的HPC群集

、

我有一个在集群的单个核心上运行的脚本。每个串行作业都是独立的。我用来运行的集群在每次您执行qsub时都会分配一个内核，因此它假定为ppn=1，然后其他所有人都可以使用其他内核。我只需通过循环qsub提交我想要运行的串行作业的数量。然而，我们使用的另一个集群会自动为每个用户分配一个节点(他们已经将其设置为节点是最小的单元，而不是核心)。每个节点有16个核心。如果我随后提交我的脚本，它被分配了所有16个核心，但它只运行一个作业。因此，我想知道如何运行脚本并使其使用所有16个内核？我想到的一个想法是使用另一个脚本运行并发作业，该脚本循环我当前的脚本，如下所示： for I in {1..16}

浏览 0提问于2013-08-23得票数 0

2回答

同时执行多个qsub命令

、、、

我正在使用我们部门的计算集群和Sun Grid Engine。当我必须运行多个R作业时，我通常编写名称为s01.sh、s02.sh、...、s50.sh的shell脚本文件，其内容为'R CMD BATCH r01.r'，'R CMD BATCH r02.r'，...，'R CMD BATCH r50.r‘。然后我打开'PUTTY'，登录，然后必须输入'qsub s01.sh'，'qsub s02.sh‘....等。如果有数百个工作，那么手动键入数百个工作是一项真正的劳动。有没有办法同时运行多个'qs

浏览 2提问于2016-10-14得票数 1

2回答

PBS编程

、、、、

关于PBS的一些简短而愚蠢的问题： 1-我使用提交作业 qsub job_file 是否可以在作业文件中提交(子)作业？ 2-我有以下脚本： qsub job_a qsub job_b 对于启动job_b，如果在job_a的结果完成之前就有了，那就太好了。是否有可能设置某种障碍或其他解决方法，以便在job_a完成之前不会启动job_b？谢谢

浏览 2提问于2010-03-03得票数 1

回答已采纳

1回答

在qsub下重定向我的java程序的输出

、、、

我目前正在使用qsub运行多个Java可执行程序。我写了两个脚本: 1) qsub.sh，2) run.sh qsub.sh #! /bin/bash echo cd `pwd` \; "$@" | qsub run.sh #! /bin/bash for param in 1 2 3 do ./qsub.sh java -jar myProgram.jar -param ${param} done 考虑到上面的两个脚本，我将作业提交给 sh run.sh 我想重定向由myProgram.jar -param ${param}生成的消息因此，在run.sh中，我用以下代码替

浏览 7提问于2016-08-08得票数 1

回答已采纳

1回答

自动为qsub创建不同进程名称的最佳方式

我在一台高性能计算机上运行我的程序，通常使用不同的参数作为输入。这些参数通过参数文件提供给程序，即qsub文件如下所示 #!/bin/bash #PBS -N <job-name> #PBS -A <name> #PBS -l select=1:ncpus=20:mpiprocs=20 #PBS -l walltime=80:00:00 #PBS -M <mail-address> #PBS -m bea module load foss cd $PBS_O_WORKDIR mpirun main parameters.prm # Append th

浏览 0提问于2018-03-08得票数 2

1回答

在不带环境变量的情况下运行qsub时，在shell上打印用法

、

在不使用任何环境变量的情况下使用qsub提交时，有没有办法在终端上打印脚本的用法？例如，我有一个脚本"script.sh“，它应该接受4个变量"var1，var2，var3和var4”。所以脚本应该以qsub -v var1=a,var2=b... script.sh的形式提交。我想打印什么var1，var2..如果用户尝试在没有任何变量的情况下提交作业，请参阅。我知道我可以在脚本中设置一个检查点，并将其打印到一个文件中，但是当我尝试提交脚本时，我希望在终端本身打印使用情况。如果我说不清楚，请告诉我。谢谢

浏览 10提问于2019-05-20得票数 0

2回答

当qsub在服务器上提交的作业完成时，在我的本地计算机上运行脚本

、

我正在通过qsub向服务器提交作业，然后想在作业完成后在本地机器上分析结果。虽然我可以找到在服务器上提交分析作业的方法，但不知道如何在本地计算机上运行该脚本。 jobID=$(qsub job.sh) qsub -W depend=afterok:$jobID analyze.sh 但是，我想要的不是上面的内容，而是 if(qsub -W depend=afterok:$jobID) finished successfully sh analyze.sh else some script 我如何才能完成上述任务？非常感谢。

浏览 2提问于2013-12-26得票数 2

4回答

未使用qsub数组网格作业设置$SGE_TASK_ID

、、、、

使用一个非常简单的zsh脚本： #!/bin/zsh nums=(1 2 3) num=$nums[$SGE_TASK_ID] $SGE_TASK_ID是太阳网格引擎的任务id。我正在使用qsub提交一组作业。我正在遵循qsub手册页()中的建议，并将我的阵列作业提交为 #script name: job_script.sh qsub job_script.sh -t 1-3 没有为此阵列作业设置$SGE_TASK_ID ...有谁知道为什么吗？谢谢!

浏览 6提问于2013-05-10得票数 2

回答已采纳

1回答

打印qsub作业的墙时间

、

目前，我正在使用qsub在集群上运行作业，并对这些作业设置了10小时的墙时间。有时工作超过这一时间，因此被终止，有时由于其他原因而终止工作。无论哪种方式，我都希望在qsub日志文件的底部有一个脚注，它将指示作业何时终止(可选地使用状态代码指示它是成功完成还是被中断)和总壁时间。放置类似于： date command here date 在qsub文件中，由于最后一个date将不会被执行，如果作业持续了一段时间，它就无法工作。有谁知道怎么绕过这件事吗？

浏览 0提问于2014-08-12得票数 1

回答已采纳

1回答

将输出重定向到sun grid engine阵列作业的不同目录

我使用Sun Grid Engine运行了很多作业。由于这些是作业(~100000)，我想使用数组作业，这在队列中似乎更容易。另一个问题是，每个作业都会生成一个stdout和stderr文件，我需要它们来跟踪错误。如果我在qsub -t 1-100000 -o outputdir -e errordir中定义它们，我最终会得到包含100000个文件的目录，这太多了。有没有办法让每个作业将输出文件写入一个目录(例如，一个由作业ID的前2个字符组成的目录，它是随机的十六进制字母；或者作业号以1000为模，或类似的东西)。谢谢

浏览 0提问于2010-09-14得票数 6

1回答

是否可以使用qsub在具有多核的机器上分发作业？

、、、

我可以使用qsub在多核机器上分发作业吗？我的机器有8个内核，是否可以分别在这8个内核上使用PBS服务器分发作业(一组不同的程序)？如果没有，有没有其他的替代方案。程序的主脚本在并行模式下使用qsub在节点上分配6个不同的作业，但当用户不选择并行选项时，它只使用一个核心，而不是其他核心。

浏览 1提问于2016-03-10得票数 0

1回答

Sun Grid Engine -脚本启动数组作业并等待它们全部完成

、、、

当你提交一份工作时，你会做这样的事情： qsub -t 1-1000 -N myArray arrayjob.sh #This execute arrayjob 1000 simultaneus times, calling the job "myArray" 我想用另一个脚本来包装它，它告诉我"Ehi，所有的任务都完成了！“ 有人会提出： qsub somethingAfterAllTheTask.sh -hold_jid "myArray" 但我不想在myArray之后启动另一个要执行的作业:我想恢复执行myArray的qsub的脚本 m

浏览 0提问于2018-12-05得票数 0

回答已采纳

2回答

"qsub -now“等价于使用bsub

、、

在SGE中，我们有 qsub -now yes/no <command> 通过"-now yes“可以立即调度作业(如果可能)或者根本不调度作业。我们没有被放入挂起队列中。如果作业不能立即执行，则通过"-now no“将作业放入挂起队列中。但在LSF中，我们有等同于bsub的qsub。在bsub中，如果不能立即执行，我们将被放入挂起队列中。我们没有像qsub中那样的"-now yes“选项。我们是不是在bsub里写了"qsub -now“？附言:一种解决方案是，我们可以在运行bsub后检查一段时间(一些秒)，看看我们是否按计划运行，然后退出

浏览 12提问于2013-02-26得票数 0

回答已采纳

1回答

使用qsub取消所有等待的作业

、、

我已经向qsub提交了很多作业，我想取消所有当前未运行的作业。有没有一种方法可以在不知道所有jobID的情况下做到这一点？中的答案促使我尝试 qselect -u username -s qw | xargs qdel 但这不起作用，我不想意外删除我当前正在运行的作业。

浏览 47提问于2020-12-14得票数 0

1回答

qsub:我如何才能找到集群上到底安装了什么DRM中间件？

、

我在一个非常大的集群上有一个用户帐户。我以前有过使用Grid Engine的经验，并且希望将集群用于数组作业。文档告诉我使用"qsub“来平衡/提交许多作业。因此，我假设这意味着集群具有Grid引擎。但是，我所有的Grid引擎脚本都无法运行。我查了一下文件，这有点奇怪。现在，我慢慢地怀疑这个集群实际上没有网格引擎，也许它正在运行一个叫做Torque (?!)的东西。对于作为网格引擎用户的我来说，手册页面中的整个术语有点奇怪，例如，他们谈论的是“批量作业”，而不是“数组作业”。没有引用我所依赖的变量，比如SGE_TASK_ID等，而是引用以PBS_开头的变量。但是，仍然有qsub和q

浏览 0提问于2012-04-10得票数 2

1回答

用于在群集上提交作业的Bash脚本

、、、、

我正在尝试编写一个脚本，以便可以使用'qsub‘命令向集群提交作业。基本上，一旦我进入集群，我就转到我的文件所在的目录并执行以下步骤： export PATH=$PATH:$HOME/program/bin Then，program > run.log& 有没有办法把它写成脚本，这样我就可以把作业提交到队列中了？谢谢!

浏览 0提问于2017-07-19得票数 0

1回答

终止某个httpd作业

、

我们有一个运行CentOS脚本的PHP服务器。有时，当我们从浏览器启动脚本，而浏览器关闭时，作业会继续在服务器上运行。有没有办法终止这份特殊的工作？在服务器上，我可以看到一堆/usr/sbin/httpd作业在运行，但是我怎么知道这就是在浏览器中启动的作业，所以我要确保我没有杀死其他作业？

浏览 1提问于2014-12-30得票数 0

1回答

pbs/torque/maui如何选择节点？

、、

我们知道所有的节点特性都存储在server_priv/ the文件中。每次我们使用： qsub -l nodes=1:linux 或 #PBS -l nodes=1:linux 提交作业，因为我们可能有数百台具有linux特性的机器。我想知道扭矩如何选择正确的节点？从上到下搜索server_priv/ the文件？字母顺序？取决于机器的工作量？任何帮助都是非常感谢的！

浏览 5提问于2015-04-13得票数 1

回答已采纳

1回答

Snakemake无法识别由于超时而导致的作业失败，错误代码为-11

、、、

有没有人在识别超时作业时遇到了问题。我使用qsub向集群提交作业，每个规则都有一个超时设置： snakemake --jobs 29 -k -p --latency-wait 60 --use-envmodules \ --cluster "qsub -l walltime={resources.walltime},nodes=1:ppn={threads},mem={resources.mem_mb}mb" 如果脚本中的一个作业失败，则将执行下一个作业。但是，当作业达到规则中定义的超时时，不会执行队列中的下一个作业，从而随着时间的推移减少在群集上并行运行的作业总数。超时作业根

浏览 47提问于2020-11-13得票数 1

2回答

Snakemake SGE集群提交问题

、、、

我是新的蛇形和使用集群，所以我会感谢任何帮助！我有一个在服务器上正常工作的snakefile，但是当我试图在集群上运行它时，我没有找到提交作业并让它执行的适当命令。就像其他用户发现的那样，它是“停滞”的。我在SGE集群上运行它，其中只有一个节点( head节点)，我们通过该节点提交作业。我们不能以交互方式运行作业，也不能在head节点上运行密集命令。通常，我会运行bwa命令，如下所示： qsub -V -b y 'bwa mem -t 20 /reference/hg38.fa in/R_1.fastq in/R_2.fastq |samtools view -S -bh -@ 7

浏览 11提问于2017-05-16得票数 1

回答已采纳

2回答

排除(或包括) PBS Pro中的特定节点

、、

我正在处理一个有8个节点的集群；4个节点有python，4个节点没有。我如何确保我的python作业只分配给有python的节点？我在集群上没有管理权限。 PBS Pro 13.1 RedHat 5.11 以前有人问过这个问题，但这些解决办法对我没有用：我可以使用qsub -l host=good_node1选择一个节点。但是，我不能选择一组节点，也不能排除单个节点或一组节点。许多对我无效的尝试中的一个子集： qsub -l host=!bad_node1 qsub -l select=1:host=!bad_node1 qs

浏览 2提问于2016-08-03得票数 2

1回答

等待已完成的作业

、、、、

一旦其他脚本完成，我就会启动pbs脚本。为此，我使用以下命令： $ job1=$(qsub job1.pbs) $ jobN=$(qsub jobN.pbs) $ qsub -W depend=afterok:$job1:$jobN join.pbs 在大多数情况下，这是可行的。但是，如果我在job1和jobN已经完成时运行加入脚本，它将无限期地空闲，因为它正在等待已经完成的作业完成。这听起来很疯狂，但事实就是这样。如果我运行qstat，我可以清楚地看到我加入的工作正在被搁置('H') $ qstat -u me Job ID Username Queue

浏览 19提问于2016-07-28得票数 2

1回答

如何在qsub/torque中获取已完成或已中止作业的状态

、

在使用torque的情况下，如果我使用特定的参数使用qsub运行作业，作业将完成，并发生三件事。1)我得到了一个包含进程的stderr的file.eXXXX文件2)我得到了一个包含进程的stdout的file.oXXXX文件3)我收到了一封包含分配和退出状态等信息的电子邮件。我希望将此状态信息放在.oXXXX和.eXXXX文件旁边的文件中，因为要将100s的电子邮件与100s的作业输出文件关联起来太难了，尤其是在几天后。我找不到这样的内置功能。然而，我注意到我可以使用"qstat -f job-id“来获取与电子邮件中的信息非常相似的信息。但是我在文档中没有看到允许我运行qstat的

浏览 7提问于2018-03-30得票数 2

1回答

扭矩qsub使工作依赖于其他工作

、

我想使用qsub启动一组作业，只有当所有其他作业完成“没有错误”时，最后的作业才会运行。在我的例子中，“无错误”意味着它们与status=0一起退出。qsub的手册页在-W depend=afterok描述中说:只有在作业作业结束后，才能计划执行该作业，而没有错误。不幸的是，它似乎无法解释(或找不到)“没有错误”是什么意思。我的一些脚本很可能会将信息打印到stderr，但我不希望这被解释为错误。问题1: qsub文档所说的“没有错误”是什么意思？问题2:如何使作业显式地依赖于状态为0的所有作业集合？

浏览 1提问于2018-01-25得票数 1

回答已采纳

2回答

如何动态缩放星团/qsub/ec2以跨多个节点运行并行作业

、、、、

我刚开始使用Start集群/qsub/grid引擎来运行并行作业，我试着阅读了其他几篇关于相同的文章。我仍然不知道如何为我的特定需求构建一个可伸缩的解决方案。在进行同样的工作之前，我想再听取一些建议。以下是我的要求：我有一个巨大的tar文件~40-50 GB，它可以高达100 GB-->我在这里无能为力。我接受一个巨大的tar文件作为输入。我必须解压缩和解压缩它-->我运行tar xvf tarfilename.tar平行pbzip -d来解压缩和解压缩。这个解压缩的输出是几十万个文件，大约50万个文件。这个未压缩的文件必须处理。我有模块化的代码，可以接受

浏览 6提问于2013-03-11得票数 1

1回答

如何更改slurum上的工作目录

、、、、

我在一个slurm集群上工作，在那里我运行着几个作业。我很难逐个检查每个目录中的作业。我可以使用以下命令检查作业正在运行的目录 scontrol show job JOB_ID 这个命令在输出中显示了不同的行。下面列出了其中的几个 OverSubscribe=OK Contiguous=0 Licenses=(null) Network=(null) Command=/home/astha/vt-st/scf-test/303030/49/qsub.job WorkDir=/home/astha/vt-st/scf-test/303030/49 StdErr=/hom

浏览 24提问于2020-11-17得票数 1

回答已采纳

1回答

静默向SGE提交qsub作业

、

我有一个bash脚本，它使用qsub将成百上千的作业提交到一个响应缓慢的SGE队列(每个作业ID显示需要很好的一秒钟)。为了绕过这个耗时的过程，并且在退出shell时不会杀死我的脚本，我通过附加&将脚本作为后台作业运行。虽然这为我节省了半个小时的时间，但作业ID仍然会出现，并与命令提示符打乱。我想知道是否有可能禁止显示作业ID，或者以某种方式将作业静默提交到队列中。尽管这篇谈到了-z参数，但它不起作用，在qsub手册页上也没有提到它。谢谢!

浏览 1提问于2013-04-18得票数 0

回答已采纳

1回答

ModuleNotFoundError:在人工智能DevCloud英特尔中没有命名为“keras”的模块

、、

我正在尝试运行qsub myjob，但是我得到了一个错误。到目前为止，我所做的是： conda create -n myenv intel python=3 source activate myenv 升级了一些图书馆： pip install --ignore-installed --upgrade keras pip install --ignore-installed --upgrade tensorflow 创建包含以下行的我的作业文件： #PBS -l nodes=1 cd $PBS_O_WORKDIR回波启动计算python NASNet.py回波结束计算

浏览 0提问于2018-05-01得票数 1

回答已采纳

1回答

设置SGE以运行在不同节点上具有不同输入文件的可执行文件(更新:有一些问题)

、、、、

我知道我之前也从这个链接上问过同样的问题：就像我在那个线程中说的，我以前在SLURM系统上做过这样的工作，没有任何问题，因为所有的东西都封装在一个提交脚本中。然而，从上述链接中的前一个问题来看，下面是我在SGE上的方法(我知道这是一个糟糕的实践，但我真的想不出更好的方法.) 作业通过4+N脚本链接：run.sh、submitSerial.sh、wrap.sh、temp.sh和job{1-N}.sh。 run.sh：主要作业脚本 #!/bin/bash ...some stuffs... ...create N directories to run N input files in

浏览 4提问于2015-04-03得票数 0