Snakemake等待完成所有并行作业，然后再开始下一个并行作业

Snakemake是一个用于构建和管理复杂的数据分析工作流的工具。它基于Python语言开发，可以帮助用户定义工作流中的任务依赖关系，并自动执行这些任务以完成数据分析流程。

在Snakemake中，可以使用并行作业来加速工作流的执行。并行作业是指同时执行多个任务，以提高整体的执行效率。然而，默认情况下，Snakemake会等待所有并行作业完成后才开始下一个并行作业的执行。

这种等待所有并行作业完成后再开始下一个并行作业的方式称为全局同步。全局同步可以确保前一个并行作业的结果对后续作业的执行是可用的，从而避免了数据依赖的问题。

Snakemake还提供了一些配置选项，可以对并行作业的行为进行调整。例如，可以设置并行作业的最大并发数，以控制同时执行的任务数量。可以使用--jobs参数指定最大并发数，例如--jobs 4表示最多同时执行4个任务。

此外，Snakemake还支持分布式执行，可以将任务分发到多台计算机上并行执行。这可以通过配置集群资源管理器（如Slurm、SGE、PBS等）来实现。具体的配置方法可以参考Snakemake官方文档中的相关说明。

总结起来，Snakemake等待完成所有并行作业，然后再开始下一个并行作业的执行，以确保数据依赖的正确性。可以通过配置选项来调整并行作业的行为，包括最大并发数和分布式执行等。

Snakemake等待完成所有并行作业，然后再开始下一个并行作业

、、

我已经编写了Snakemake规则，它运行肌肉(MSA-tool)来计算一个目录中所有文件的多序列比对(MSA)。该任务是微不足道的并行，因为不同的文件彼此不依赖。问题是，Snakemake在n个“批”中运行这个规则，其中n是作为参数提供给Snakemake的核心： snakemake -j 4 msa。Snakemake从并行运行4个作业开始，它等待每个作业完成

浏览 53提问于2021-07-27得票数 0

回答已采纳

1回答

在Talend中，多线程执行和并行化在作业性能方面有什么不同？

、

多线程过剩并行化

浏览 0提问于2017-04-06得票数 2

回答已采纳

1回答

如何在启动新作业之前了解spark作业是否已完成

我想通过yarn并行运行一组spark作业，然后等待它们全部完成，然后再启动另一组作业。我如何才能知道我的第一组作业何时完成？谢谢。

浏览 10提问于2018-08-21得票数 1

回答已采纳

1回答

我一直在DB2 LUW数据库工作，我想提交程序作为一个并行的工作。这意味着我有一个过程，它将对一个表执行一些DDL，DML语句。这个表有大量的数据，同样的过程需要运行在很少多的表并行运行。我使用DBMS_JOB.SUBMIT语句提交作业，并使用DBMS_JOB.RUN语句执行作业。我有一个作业处理程序，它可以帮助并行地完成这个任务。但是每个作业都是按顺序执行的(意味着第一个作业完成了，第二个作业<e

浏览 2提问于2018-05-12得票数 0

1回答

Informatica并行作业在Teradata上创建mload问题

、、

在ETL中有两个并行作业，这两个作业几乎同时运行开始和完成。当它们完成后，他们将更新几个细节到一个相同的查找表。这两个并行作业都需要相同的时间才能完成。如果两个作业同时启动，那么这些作业将在查找表上创建一个mlock，并且两个作业都失败了。试着释放mlock并再次运行它们。但这还在继续。因此，在第一个并行作业之前增加了20秒的等待</em

浏览 3提问于2021-03-18得票数 2

回答已采纳

1回答

为什么talend组件在tParallelize依赖关系完成之前就开始了？

为什么作业在tParallelize依赖关系完成之前就开始了？ 

浏览 4提问于2022-08-09得票数 0

回答已采纳

1回答

Matlab并行处理:我可以限制在parfor级别使用的工人数量吗？

、

我知道如何在matlab并行池中更改#的工作人员，但我想快速和动态地更改分配给parfor循环的工作人员。Rational:我有一些长时间运行的parfor循环，有时会有一些奇数的作业(比如5 )，在最后一个任务开始之前，会留下一个等待其他4个作业完成，这比只并行运行所有5个任务要慢得多。我想要的是一些代码，可以确定是否有5个作业，并行运行所有5个作业，但是如果有

浏览 1提问于2016-03-27得票数 0

回答已采纳

1回答

循环中的顺序使用

、、

我想在前一个作业开始后立即开始每个作业。使用下面的脚本，每个作业都会在下一个作业开始之前完成。我怎么能强制等待并并行运行它们呢？ #!

浏览 2提问于2017-02-07得票数 0

1回答

Jenkins在并行执行流水线时陷入死锁

、、、

在6个阶段中的4个阶段，管道使用build job触发Jenkins作业。当我运行10个并行并发流水线时，一切工作正常。但是如果我运行10个以上的并行管道，那么所有这些管道似乎都处于死锁状态，无论你等待多长时间，它们都不会完成，它们都在等待对方完成。如果我终止了第11次执行

浏览 35提问于2020-02-15得票数 1

1回答

如何在Bash中为GNU并行创建堆栈或LIFO

、、、、

我需要一种方法，以添加到并行的列表，当它运行。如果并行占用了它的所有处理器，它将暂停工作，直到处理器可用为止。通过使用--ungroup参数，一旦队列满了，并行将处理/输出作业

浏览 2提问于2015-08-25得票数 3

回答已采纳

1回答

您可以按顺序运行两个不同的Quartz作业实例吗？

、

嗨，我有一个作业1触发每分钟和一个作业2触发每5分钟。因此，每隔五分钟，两个作业将同时运行，我希望避免这种情况，并强制第二个作业触发，以等待另一个作业完成后再开始。我见过@DisallowConcurrentExecution，但这只会避免相同作业的两个实例并行运行，而不是不同作业之间的并行运行。

浏览 13提问于2017-03-02得票数 0

2回答

shell脚本，for循环，循环等待命令的执行以迭代

、、、

循环在迭代之前是否等待其主体中的命令执行？这是我的代码。这些命令是按顺序执行还是并行执行？

浏览 2提问于2015-06-05得票数 7

回答已采纳

2回答

Autosys -当不存在运行条件时，作业并行运行

我有五个箱式作业a，b，c，d，e。每个箱式作业都有一个开始条件。(n=not运行)，这些作业将每隔1小时触发大约10分钟。作业"a“开始于上午9:00，作业"b”开始于上午9:10，作业"c“开始于上午9:20，依此类推。根据上述条件，运行b、c、d、e的作业"a“不应运行。但我实时发现的是，它们是并行运行的。以下是示例。让我们假设

浏览 1提问于2014-01-03得票数 1

1回答

为什么第一次并行任务总是慢下来？

、、、

这个任务可以并行运行，因为它们是相互独立的。这意味着我想并行化它。我用python和bash脚本尝试了它。问题是，当我第一次运行这个程序时，大约需要30-40岁才能完成。当我连续多次运行程序时，只需1s-3s即可完成。即使我用不同的输入输入分类器，我也得到了不同的结果，所以似乎没有缓存。当我运行一些其他的程序，然后重新运行程序，那么它再次需要40多岁才能完成。每个函数都调用并行化分类的函数。当我处理请求时，它的行为方式与下面的程序相同。首先对方法A的请求需要很多，然后后续的请求就像1s

浏览 1提问于2017-12-19得票数 5

1回答

多弹簧批作业

、、

我正在使用Spring中的@调度注释来触发多个作业。} //Job definition is here. }谢谢!

浏览 2提问于2015-05-19得票数 1

回答已采纳

1回答

如何在两个下游作业完成之前阻止父作业

I有4个作业(作业A、B、C和D)，其中作业A触发B、C和D作为下游项目。B和C应该并行运行，A必须等待，直到这两个作业都完成。根据作业C的结果(失败/不稳定)，需要触发作业D(与作业B的状态无关)。对于作业B和C，我已经尝试了两次"Trigger/call builds on other projects“，并且我为一个作业选择了”阻塞直到触发的项目

浏览 8提问于2019-08-06得票数 0

1回答

以最快的方式处理javascript中嵌套的承诺树？

、

我正试图找到处理嵌套作业树的最快方法，这些作业树返回javascript中的承诺。我有以下条件： });当我在我的网络控制台中运行它时，我会得到以下结果： 30 (took

浏览 1提问于2019-02-25得票数 1

回答已采纳

1回答

程序写入/tmp时的Snakemake影子规则

、、

我正在使用Snakemake来运行defense-finder程序。此程序创建并覆盖/tmp/defense-finder中的通用临时文件，即文件名不包含唯一标识符。当在不同输入文件的不同内核上运行我的规则时，由于/tmp/defense-finder中的冲突，Snakemake崩溃。当不同的作业写入工作目录中的相同文件时，Shadow rules似乎可以提供帮助。当程序写入/tmp目录时，有没有办法使用影子规则？

浏览 44提问于2021-11-16得票数 2

回答已采纳

3回答

从闭包并行运行Jenkins Pipeline作业

、、、

在这种情况下，我希望并行启动几个构建，并等待构建完成，然后再进入我的管道的下一个阶段。如果我显式地写出构建作业，我就能够成功地做到这一点，如下所示： build job: 'job1', createParallel('

浏览 3提问于2016-08-16得票数 2

2回答

Jenkins:并行测试执行

、、

我开始在我的项目中使用Jenkins，我正在尝试将我的测试套件(Rspec测试用例)并行化，用Jenkins中的4个文件编写。spec/features/|-- test2.rb|-- test4.rb “阻止直到触发的项目完成其构建”此选项监视子

浏览 4提问于2013-12-17得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Snakemake等待完成所有并行作业，然后再开始下一个并行作业

相关·内容

Snakemake等待完成所有并行作业，然后再开始下一个并行作业

在Talend中，多线程执行和并行化在作业性能方面有什么不同？

如何在启动新作业之前了解spark作业是否已完成

DB2 LUW并行作业执行

Informatica并行作业在Teradata上创建mload问题

为什么talend组件在tParallelize依赖关系完成之前就开始了？

Matlab并行处理:我可以限制在parfor级别使用的工人数量吗？

循环中的顺序使用

Jenkins在并行执行流水线时陷入死锁

如何在Bash中为GNU并行创建堆栈或LIFO

您可以按顺序运行两个不同的Quartz作业实例吗？

shell脚本，for循环，循环等待命令的执行以迭代

Autosys -当不存在运行条件时，作业并行运行

为什么第一次并行任务总是慢下来？

多弹簧批作业

如何在两个下游作业完成之前阻止父作业

以最快的方式处理javascript中嵌套的承诺树？

程序写入/tmp时的Snakemake影子规则

从闭包并行运行Jenkins Pipeline作业

Jenkins:并行测试执行

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐