用于分析的Snakemake规则，其中为diff参数生成单个结果文件，并且参数来自另一个规则输出内容 - 腾讯云开发者社区

shell、output、wildcard、rules、snakemake

对于一个相当简单的规则，我得到了一个错误。我必须为另一个程序写一个任务文件，期望是一个tsv文件。我从配置文件中读取了一定数量的参数，并使用shell命令将它们写到一个文件中。代码： rule create_tasks: output: temp("tasks_{sample}.tsv") params: ID="{sample}", file=lambda wc: samples["path"][wc.sample] , bigwig=lambda wc: sa

浏览 17提问于2020-10-12得票数 2

3回答

snakemake -不要删除失败规则的输出

snakemake

我有一个snakemake工作流，其中包含一个运行另一个“内部”snakemake工作流的规则。有时内部工作流的某个规则失败，这意味着内部工作流失败。因此，内部工作流的output下列出的所有文件都会被外部工作流删除，即使创建它们的内部工作流规则成功地完成了它们。是否有办法防止snakemake删除失败规则的输出？或者你可以提出另一个解决办法？几个注意事项：内部工作流的输出必须列出，b/c作为外部工作流中其他规则的输入。我尝试将内部工作流的输出设置为protected，但这没有帮助。我还尝试在调用结束时添加exit 0到内部工作流，以使snakemake认为它已经成功完

浏览 6提问于2020-12-22得票数 0

回答已采纳

2回答

什么是snakemake元数据文件？我什么时候能擦除这些？

snakemake

我注意到我的备份rsync脚本花费了相当长的时间从.snakemake/metadata文件夹中复制带有随机名称的内容。这些文件是用来做什么的？在snakemake运行完成后，我能安全地擦除它们吗?或者，对于snakemake，是否需要它们才能正确地执行下一次运行？更普遍地说，有没有一些关于snakemake在.snakemake文件夹中创建的文件的文档？

浏览 1提问于2017-08-10得票数 8

回答已采纳

2回答

Snakemake:在执行shell命令之前避免删除输出文件

python、snakemake

在执行shell命令之前，是否有可能避免删除snakemake规则中定义的输出文件？我在这里找到了对这种行为的描述：我要做的是为输入列表和输出文件列表(N:M关系)定义一个规则。如果其中一个输入文件已更改，则应触发此规则。然后，在shell命令中调用的python脚本只创建那些不存在的输出，或者与已经存在的文件相比内容已经更改的输出(即在python脚本中实现了更改检测)。我希望下面这样的规则能够解决这个问题，但是由于output.jsons在运行python脚本之前被删除了，所以所有的output.jsons都将使用一个新的时间戳来创建，而不仅仅是那些已经更改的。 rule jsons:

浏览 0提问于2018-03-08得票数 2

回答已采纳

2回答

子工作流和includes指令之间的实际区别是什么？[蛇造者]

workflow、snakemake

在Snakemake文档中，includes directive可以将另一个工作流的所有规则合并到主工作流中，并且显然可以在snakemake --dag -n | dot -Tsvg > dag.svg中显示。另一方面，如果您开发依赖于其输出的规则，则可以在主工作流之前执行Sub-workflows。我的问题是:这两者到底有什么不同？现在，我正在处理一个工作流，似乎只需使用includes并将输出的名称放在主工作流的rule all中就可以了。我甚至可以将输出放在主工作流规则的input中，使includes工作流在该规则之前执行。此外，无论出于什么原因，我都无法想象包含子工作流的

浏览 22提问于2019-09-07得票数 2

回答已采纳

2回答

Snakemake:无法更改名称的捕获输出文件

snakemake

作为我正在构建的Snakemake管道的一部分，我必须使用不允许我指定输出文件的文件路径或名称的程序。例如，当在工作目录workdir/中运行程序时，它会产生以下输出：workdir/output.txt 我的snakemake规则是这样的： rule NAME: input: "path/to/inputfile" output: "path/to/outputfile" shell: "somecommand {input} {output}" 因此，每次规则名运行时，我都会在snakemake工作目录中获得一个额外

浏览 10提问于2021-08-25得票数 1

回答已采纳

3回答

在规则中使用配置数据的语法

python、output、config、snakemake

在snakemake规则中有没有完整描述配置数据使用的地方？在yaml文件的用户指南中有一个这样的示例： samples: A: data/samples/A.fastq B: data/samples/B.fastq 然后，在如下规则中使用它： bam=expand("sorted_reads/{sample}.bam", sample=config["samples"]), 上面的代码似乎会将{sample}替换为“data/samples/A.fast q”而不是"A“(和"B”等)。显然是这样的。在输出规则中使用配置数

浏览 0提问于2017-08-04得票数 1

3回答

当文件丢失时，是否可以强制SnakeMake重新运行规则

delete-file、snakemake

当之前在流水线中创建的文件被删除时，SnakeMake似乎不认为这是一个问题，只要后面的文件还在： rule All: input: "testC1.txt", "testC2.txt" rule A: input: "{X}{Y}.txt" output: "{X}A{Y}.txt" shell: "cp {input} {output}" rule B: input: "{X}A{Y}.txt" output: "{X}B{Y}.txt

浏览 1提问于2017-09-01得票数 9

2回答

成功处理第一个输入后，Snakemake规则停止并显示'MissingOutputException‘

python、snakemake

我写了我的第一个使用python脚本处理文件的snakemake规则： rule sanitize_labels: input: "data/raw/labels/rois_essence_31_10_2019_final.shp", "data/raw/labels/pts_carte_auto_final.shp" output: "data/interim/labels/rois_essence_31_10_2019_final.csv", "data/

浏览 112提问于2020-02-10得票数 0

回答已采纳

2回答

在snakemake中是否有一个函数使输出列表依赖于传递到shell命令的参数

python、snakemake、directed-acyclic-graphs、wildcard-expansion

我有一个调用python程序的snakemake规则，python程序的输出依赖于传递的参数。我想让snakemake知道在传递某个参数(布尔值)或不传递参数时，期望输出之间的差异。我的当前解决方案是根据参数的配置创建一个输出list_phen_gen_output列表。但是，当源程序接受改变源程序产生的输出列表的3参数时，这种情况会呈指数增长。请参阅其中一个参数的当前解决方案。当extract_genotypes == "T"或extract_genotypes是假的时候。 if extract_genotypes == "T": list_phe

浏览 15提问于2022-08-08得票数 1

回答已采纳

1回答

没有提取Snakemake规则，并且无法指定输出文件。

python、snakemake

我有一个文件夹，其中生成规则的输出。我在运行snakemake时遇到了很大的麻烦。如果我没有在rule all中指定输出，则根本不运行规则(称为neo4j)。如果我尝试用snakemake neo4j手动运行它(我不希望如此)，那么我会得到一个错误： WorkflowError:目标规则可能不包含通配符。请指定没有通配符的具体文件或规则。我试着以不同的方式指定规则的输出，但没有一种方法起作用。使用expand：展开(‘results/ne4j/{sample}/cl_nodes.csv’，expand('results/neo4j/{sample}/cl_contai

浏览 1提问于2018-08-29得票数 0

回答已采纳

1回答

Snakemake-输入文件中的通配符无法从输出文件中确定。

snakemake

我在snakemake是个新手，我试着去了解它是如何工作的。我试着拉一个简单的蛇形 from snakemake.utils import min_version min_version("5.3.0") max_reads: 250000 sra_id: ["SRR1187735"] rule all: input: "DATA/{sra_id}.fastq.gz" rule prefetch: output: "DATA/{sra_id}.fastq.gz" p

浏览 5提问于2021-04-01得票数 1

1回答

只有当另一条规则失败时，才在Snakemake中运行规则，对于它失败的特定示例？

bioinformatics、snakemake

我在Snakemake开了一条元经济学管道。我正在为我的程序集运行MetaSPAdes，但是对于特定的示例，MetaSPAdes经常会失败，这并不少见。如果MetaSPAdes失败，我想只在失败的示例上运行MEGAHIT。有没有办法在Snakemake中创建这种规则依赖关系？例如：如果规则失败，将生成特定文件(在本例中，使用MetaSPAdes组装)。我认为这意味着MetaSPAdes规则的输出需要是contigs，或者是一个“这个失败的”输出文件。这将有助于Snakemake识别不重新运行此规则。创建规则失败的示例列表，而只在这个有失败MetaSPAdes程序集的示例列表上运行不同的规则

浏览 2提问于2021-06-21得票数 2

回答已采纳

3回答

蛇形基本问题

snakemake

我试着在本地电脑上运行Snakemake命令。即使我使用了最简单的代码结构，它也没有工作，如下所示：规则fastqc_raw:输入：“原始/快速”输出：“输出/fastqc_raw/a.html”外壳："fastqc {input} -o {output} -t 4“ 它显示了以下错误：规则fastqc_raw: fastqc_raw:1输出: output/ fastqc _raw/A.html RuleException: CalledProcessError在/Users/01/Desktop/Snakemake/Snakefile:命令‘set -euo pipe

浏览 1提问于2018-10-03得票数 3

1回答

当使用目录作为输出时，Snakemake SyntaxError

directory、output、snakemake

我想运行一个命令(chipseq-greylist)，它在每次使用一个输入文件运行时输出三个文件。输出文件的名称由命令自动选择。一个例子是： chipseq-greylist --outdir out_dir A.bam 这一行将产生三个输出文件：A-greystats.csv, A-greydepth.tsv and A-grey.bed。我感兴趣的是将所有*-grey.bed文件收集到一个目录中，以便稍后使用。由于这是我在许多文件上使用的管道的一部分，所以我使用Snakemake来处理所有这些作业。我知道将目录指定为输出()是可能的，这将完全符合我的要求。但是，当我以一个目录作为输出制定

浏览 0提问于2018-08-24得票数 0

1回答

在Snakefile中指定输入和输出文件

snakemake

我是Snakemake的新手，我想创建一个管道，它接受给定的输入文本文件，并将其内容连接到给定的输出文件。但是，我希望能够在运行时指定输入和输出文件的名称，因此这两个文件名都不是在Snakefile中硬编码的。现在我能想到的就是： rule all: input: "{input}.txt", "{output}.txt" rule output_files: input: "{input}.txt"

浏览 2提问于2020-06-25得票数 0

2回答

Snakemake重建/重新安排工作时间

python、bioinformatics、jobs、job-scheduling、snakemake

我在Snakemake中为那些没有多少编程知识的人编写了一个管道，所以我希望他们能够通过在命令行中请求snakemake all -c来运行整个管道。我的Snakefile中有两个配置文件： configfile: "config.yaml" configfile: "config_samples.yaml" 这些配置文件将由Snakemake合并。 config.yaml是标准配置文件。config_samples.yaml是一个配置文件，其内容随管道输入而变化。如下所示： samples: CYP20130000B: R1: CYP201300

浏览 7提问于2021-10-25得票数 1

回答已采纳

1回答

snakemake -通过集群配置文件将命令行参数替换为通配符

snakemake

我正在编写一个snakemake管道，以最终识别冠状病毒变体。下面是一个包含三个步骤的最小示例： LOGDIR = '/path/to/logDir' barcodes = ['barcode49', 'barcode50', 'barcode51'] rule all: input: expand([ # guppyplex "out/guppyplex/{barcode}/{barcode}.fastq", #

浏览 54提问于2021-06-09得票数 1

回答已采纳

2回答

Snakemake:如何在没有显式输出文件的情况下创建规则，并且只有指定的输入和日志文件？

python、pipeline、snakemake

我想创建一个Snakemake规则，其中有:输入、日志、shell部分。没有输出，我只想捕获日志作为命令的结果。

浏览 5提问于2020-08-18得票数 1

回答已采纳

1回答

使用检查点的多个输出的Snakemake语法

pipeline、snakemake

我正在用snakemake建一条管道。我有一个检查点，它应该产生多个输出文件。这些输出文件稍后将在我的规则中使用，全部在expand中使用。问题是我不知道将产生的文件量，因此不能在扩展中指定数据集。这些文件将在R脚本中生成。示例： rule all: input: expand(["results/{output}], output=????) checkpoint rscript: input: "foo.input" output: report(

浏览 35提问于2020-01-07得票数 1

回答已采纳

2回答

使用脚本生成许多中间文件的Snakemake

snakemake

我想知道为有许多中间文件的脚本编写规则的最佳实践是什么？ R脚本示例如下所示： data <- read_rds(snakemake@input[["data"]]) # generate and save many plots for sanity check plt1 ggsave("plt1.pdf", plt1) plt2 ggsave("plt2.pdf", plt2) # and many other figs # No actual output 我写的规则是： rule transform: input:

浏览 0提问于2021-06-24得票数 1

回答已采纳

2回答

Snakemake等待完成所有并行作业，然后再开始下一个并行作业

python、pipeline、snakemake

我已经编写了Snakemake规则，它运行肌肉(MSA-tool)来计算一个目录中所有文件的多序列比对(MSA)。该任务是微不足道的并行，因为不同的文件彼此不依赖。问题是，Snakemake在n个“批”中运行这个规则，其中n是作为参数提供给Snakemake的核心： snakemake -j 4 msa。 Snakemake从并行运行4个作业开始，它等待每个作业完成后才开始新的4个作业的“批处理”。这浪费了CPU时间，因为输入文件的大小变化很大，并且它们的MSA计算时间可能从几秒到几分钟不等。导致以下执行流程： job1|----- |job5|----- |..

浏览 53提问于2021-07-27得票数 0

回答已采纳

2回答

在最后执行某些规则

workflow、snakemake

我目前正在编写一个Snakefile，它做了很多后对齐质量控制(CollectInsertSizeMetics, CollectAlignmentSummaryMetrics, CollectGcBiasMetrics，.)。在Snakefile的末尾，我运行multiQC来将所有指标合并到一个html报告中。我知道，如果我使用规则A的输出作为规则B的输入，规则B只有在规则A完成后才会执行。在我的例子中，问题是multiQC的输入是一个目录，它从一开始就存在。在这个目录中，multiQC将搜索某些文件，然后创建报告。如果我目前正在执行我的Snakemake文件，那么在执行所有质量控制(例如，

浏览 4提问于2020-09-03得票数 2

回答已采纳

2回答

Snakemake -如何使用输入文件的每一行作为通配符

python、snakemake

我对使用Snakemake还很陌生，我已经看了一遍，看看下面的问题是否有解决方案--我几乎已经接近解决方案了，但还没有。我有一个包含SRA id列表的列文件，我想使用snakemake来定义我的规则，以便该文件中的每个SRA id都成为命令行上的一个参数。 #FileName = Samples.txt Samples SRR5597645 SRR5597646 SRR5597647 Snakefile如下： from pathlib import Path shell.executable("bash") import pandas as pd import os imp

浏览 14提问于2019-06-11得票数 4

回答已采纳

2回答

在Snakemake中使用多个文件名作为通配符

input、wildcard、snakemake

我正在尝试创建一个在snakemake中实现snakemake的规则，它将在另一个目录中使用一堆文件来closest一个文件。我拥有的是，在/home/bedfiles目录下的20个床文件： 1A.bed , 2B_83.bed , 3f_33.bed ... 我想要的是，在/home/bedfiles目录下，20个修改过的床文件： 1A_modified, 2B_83_modified , 3f_33_modified ... 所以bash命令是： filelist='/home/bedfiles/*.bed' for mfile in $filelist; do bed

浏览 2提问于2018-01-25得票数 1

回答已采纳

1回答

Snakemake:如何使用列表中的一个整数作为脚本的输入？

r、python-3.x、snakemake

我正在练习用snakemake编写工作流。我的Snakefile的内容 configfile: "config.yaml" rule get_col: input: expand("data/{file}.csv",file=config["datname"]) output: expand("output/{file}_col{param}.csv",file=config["datname"],param=config["cols"]) params: col=

浏览 10提问于2020-10-28得票数 1

回答已采纳

2回答

自定义脚本的Snakemake用连体分割床头图

python、bioinformatics、snakemake

我对生物信息学和Snakemake这两个方面都很陌生，但我正在尝试为Tn-seq数据分析建立一个自动化管道。我已经编写了一个脚本，它读取一个.bedgraph文件，并为每个contig输出不同的文件，因为我想分别分析每个contig。我编写了代码以输出带有输入文件的basename + contig名称的文件： input_handle = FILE path = PATH import csv import re contigs = {} with open(input_handle) as data: data_reader = csv.reader(data, delim

浏览 5提问于2021-08-10得票数 1

1回答

在'run:‘上下文中执行的python函数返回输出文件的路径，并将其提供给' output :’上下文

python、output、workflow、snakemake

我有一个snakemake工作流，其中在“run：”上下文中执行的python函数返回输出文件的路径。我希望将其捕获为输出中的变量，并将其提供给“Snakefile：”上下文。这样我就可以自动填写我的output:了。我想知道在snakemake中是否有任何方法可以做到这一点。请让我知道。关于python函数的更多信息:它处理input:上下文中提供的文件，并返回单个字符串，即输出文件的路径。规则看起来像这样： rule task01: input: "path/to/input.tsv" run: from module

浏览 30提问于2021-10-22得票数 1

1回答

访问下标中的snakemake变量

python、snakemake

我有一个Snakemake工作流，其中一个python文件中的函数在另一个python文件中调用，类似于以下内容： ### Snakefile rule test: input: "input.file" output: "output.file" script: "test_script.py" ### script.py from test_subscript import run_test if __name__ == "__main__":

浏览 28提问于2020-06-12得票数 1

回答已采纳

2回答

snakemake警告说，用于生成一个或多个输出文件的代码已经更改，但它们没有

python、snakemake

我遇到了一个问题，当我尝试一条规则时，我会收到这样的信息. The code used to generate one or several output files has changed: To inspect which output files have changes, run 'snakemake --list-code-changes'. To trigger a re-run, use 'snakemake -R $(snakemake --list-code-changes)'. 当我查看有更改的文件时，它们的时间戳比用于生成它

浏览 11提问于2022-04-06得票数 2

2回答

如何避免在更新输入或中间输出文件后运行Snakemake规则

file、caching、build、workflow、snakemake

即使Snakemake构建的输出文件已经存在，Snakemake也只想重新运行我的整个管道，因为我已经修改了第一个输入或中间输出文件之一。我用-n做了一次Snakemake预演，给出了以下更新输入文件的报告，解决了这个问题： Reason: Updated input files: input-data.csv 和这条更新中间文件的消息 reason: Input files updated by another job: intermediary-output.csv 如何强制Snakemake忽略文件更新？

浏览 1提问于2019-06-28得票数 13

1回答

snakemake中的未知输出

bioinformatics、snakemake

我正致力于在snakemake中实现一个非常简单的管道，希望用一个内聚的Snakefile来替换一系列烦人的bash脚本。我在编写一个规则时遇到了困难，该规则将文件分割成更小的部分(使用GNU拆分)，然后导致第二个规则，其中的输出被连接在一起。我不知道如何在concat步骤中为输入编写什么，因为我不知道如何定义所有适合模式bam_files/test*的文件。我试过用glob，但这显然是行不通的(看起来它实际上是跳过了所有的分裂，其中包括了glob )。有什么更好的办法让我这么做吗？ # test snakemake pipeline import glob SAMPLE_IDS =

浏览 1提问于2018-10-01得票数 1

回答已采纳

1回答

Snakemake:构建工作DAG ...无事可做

r、workflow、snakemake

关于snakemake 我得到了 Building DAG of jobs... Nothing to be done. 如果我试着 snakemake -n dag 我得到了 Building DAG of jobs... MissingRuleException: No rule to produce dag (if you use input functions make sure that they don't raise unexpected exceptions). 我不知道问题出在哪里。我的主要snake文件： configfile: "config_rules

浏览 0提问于2019-05-23得票数 1

1回答

R中的S4 snakemake对象中缺少通配符

snakemake

我正在运行一个带有主Snakefile的工作流，其中包括rules文件夹中的规则，并从这些包含的规则中调用rscript。下面是几行代码及其特定的文件： Snakefile： samples = pd.read_table("samples.csv", header=0, sep=',', index_col=0) rule extract: input: 'summary/umi_expression_matrix.tsv' include: "rules/extract_expression_single.s

浏览 1提问于2018-01-06得票数 1

2回答

Snakemake:命名规则而不是目标文件

makefile、snakemake

以下是snakemake教程的高级部分中的一个简短示例： rule bwa_map: input: "data/genome.fa", lambda wildcards: config["samples"][wildcards.sample] output: "mapped_reads/{sample}.bam" threads: 8 shell: "bwa mem -t {threads} {input} | samtools view -Sb - > {output}" 现在假设我在几个月

浏览 1提问于2016-11-11得票数 4

2回答

仅在.sln中发布已构建的TeamCity文件构件

.net、build、msbuild、continuous-integration、teamcity

我们有一个包含大约6个.sln文件的git存储库。每个解决方案大约有15个项目。我们还使用TeamCity轮询我们的git存储库，并在发现任何更改时进行构建。我想通过以下几点来增强我们的构建：只构建--只实际被提交更改的项目。只发布，将已更改的输出作为构建工件(在TeamCity中)发布。例如，如果开发人员在两个不同的项目中更改文件，那么只有这些项目才会被重建，并且只有它们的输出将作为当前构建的输出复制到某个位置。第一点是使用"Build“目标是可能的，但是我无法找到将构建的项目的输出复制到某个地方的方法。

浏览 1提问于2012-12-24得票数 0

2回答

强制在结束时执行某个规则

workflow、snakemake

我的问题与this one非常相似。我正在写一个snakemake管道，它做了很多对齐前后的质量控制。在流水线的末尾，我对这些QC结果运行multiQC。基本上，工作流程是:预处理-> fastqc ->对齐和对齐后QC，如picard、qualimap和preseq -> peak calling -> motif -> multiQC。只要MultiQC支持这些输出，multiQC就应该生成所有这些输出的报告。强制multiqc在最后运行的一种方法是将上述规则的所有输出文件包含在multiqc规则的input指令中，如下所示： rule a: i

浏览 62提问于2021-06-24得票数 3

回答已采纳

1回答

来自github的snakemake模块改变目标？

github、module、snakemake

希望你能帮我解决我的问题或者告诉我提交报告。我正在从另一个蛇形文件中的github“导入”一个snakemake模块，这是本地的。这似乎打乱了当地蛇形动物的目标。当第二个snakefile被导入时，目标不再是规则'all‘所指定的目标，而是由一些任意的(?)规则在导入的snakefile中，即使导入的snakefile不包含任何相关规则。我已经在github上编写了两个回购的示例集，它们都遇到了这个问题(lpagie/repo1和lpagie/repo2)。从repo1/readme.md： ============== 这个回购是为了说明一个问题(?)使用github中的snak

浏览 4提问于2021-10-06得票数 1

回答已采纳

1回答

Snakemake:为某个目录中的所有文件组合不同的规则

snakemake

最近，我开始使用snakemake进行数据分析。我还是个初学者，这是我在stackoverflow上的第一篇文章。我有不同的规则来产生不同的输出，但所有的规则都应该在某个目录下的所有文件上运行。下面是一个简化的示例： LABELS, = glob_wildcards('{label}.dat') rule all: input: expand('{label}-A.out', label=LABELS), expand('{label}-B.out', label=LABELS) rule A: input: e

浏览 6提问于2020-10-23得票数 0

回答已采纳

1回答

snakemake如何处理由于规则并行运行而导致的可能损坏，同时附加到单个文件中？

snakemake

我想了解snakemake如何处理以下情况，以及避免碰撞/腐蚀的最佳实践是什么。 rule something: input: expand("/path/to/out-{asd}.txt", asd=LIST) output: "/path/to/merged.txt" shell: "cat {input} >> {output}" 使用snakemake -j10时，该命令将尝试同时追加到同一个文件，而我无法确定这是否会导致可能的损坏

浏览 6提问于2022-04-20得票数 2

回答已采纳

1回答

Snakemake:使用--debug-dag检测循环依赖

snakemake

我在NGS分析的工作流程中使用了snakemake。在一条规则中，我利用了来自另一条规则的唯一(临时)输出。这条规则的rule.The输出也是唯一的，有助于创建最终的输出。在这些规则上使用简单的通配符{sample}。我没有看到任何循环依赖，但是snakemake告诉我有： Snakefile第xxx行中的CyclicGraphException :对规则的循环依赖我知道有一个选项可以调查这个问题：--debug-dag。我如何解释输出？候选人与被选中的是什么？这是规则的我的(伪)代码： rule split_fasta: input: dataFile="

浏览 22提问于2019-07-26得票数 2

1回答

蛇形星模问题及附加问题

snakemake

我发现输出为'BAM未排序‘。 Q1:有没有办法将其更改为： -outSAMtype SortedByCoordinate 当我在“额外”选项中添加该选项时，会收到关于重复定义的错误消息： EXITING: FATAL INPUT ERROR: duplicate parameter "outSAMtype" in input "Command-Line" SOLUTION: keep only one definition of input parameters in each input source Nov 15 09:46:07 ...

浏览 1提问于2018-11-15得票数 0

1回答

向Snakemake流水线添加自动QC，以过滤流水线中间质量不佳的样本

python、automation、filtering、pipeline、snakemake

我的问题类似于这个：我在shell中尝试了dariober的要点答案"if- else“，但是输出空文件或文件夹的else语句总是会被snakemake删除，并且snakemake会报告错误(我甚至为每个shell命令添加了"|| true”，以防止非零退出代码，但仍然没有帮助)。如果我在snakemake之外运行if-else shell，将会生成文件和文件夹。然后，我尝试在"run“部分编写python脚本，而不是shell，类似于： rule G_move_7: input: passORnot_file = '{sample

浏览 0提问于2020-09-11得票数 0

2回答

Snakemake:如何在同一调用的多个实例中维护一个蛇形实例值

variables、workflow、instance、snakemake

我希望在我的蛇文件的一部分python代码中保存一些信息，并将这些信息用于snakemake在运行工作流时创建的每个实例中的python代码中。但是单独运行的工作流应该有自己独立的信息实例。例如，假设我要在python代码中创建一个UUID，然后在python代码中使用它。但是，我希望UUID在所有运行的工作流实例中都是相同的。相反，每次启动实例时都会创建一个新的UUID。如果同时启动snakemake两次，我希望这两次运行中的每一次都创建自己的UUID，但在每次运行中，由运行创建的所有实例都将使用相同的UUID。怎么做？在snakemake对象中是否有一个标识符在所有实例的一个运行过程中

浏览 2提问于2018-07-03得票数 1

回答已采纳

1回答

如何避免Snakemake规则使用其他规则不完整输出文件

snakemake

rule rule1: output: tsv = "..." input: faa = "..." shell: """ awk ... > {output.tsv} some commands {input.faa} | awk ... >> {output.tsv} """ rule rule2: output: tsv = "..." input:

浏览 30提问于2021-08-08得票数 0

1回答

如何让snakemake重建丢失的输入？

snakemake

有没有办法让snakemake在输入丢失的情况下表现得像make一样？snakemake当前的行为是bug还是一个特性？ $ ls b Makefile Snakefile $ cat Makefile b: a touch b a: touch a $ make -n touch a touch b $ cat Snakefile rule b: input: "a" output: touch("b") rule a: output: touch("a") $ snakemake -n B

浏览 14提问于2020-08-14得票数 2

4回答

如何在snakemake中只运行一条规则

snakemake

我已经在snakemake中创建了一个工作流，当我只想运行一个规则时，我遇到了一个问题。实际上，它为我运行规则，其中的输出是我的规则的输入，即使这些规则之前已经创建过。示例： rule A: input A output A rule b: input b = output A output b rule c: input c = output b output c 我怎么能只运行规则C呢？

浏览 6提问于2019-04-24得票数 6

1回答

snakemake:模糊规则未被检测到？

exception、snakemake

下面的Snakefile在AmbiguousRuleException中失败 library_id = ['S1'] run_id = ['R1'] samples = dict(zip(library_id, run_id)) rule all: input: expand('{library_id}.bam', library_id= library_id), rule bwa: output: '{run_id}.bam', rule merge_bam: in

浏览 4提问于2021-08-23得票数 1

回答已采纳

1回答

尝试通过snakemake配置文件设置命令行值时出错

python、snakemake

我正在尝试让snakemake (运行在Ubuntu20.04上的5.20.0版本)的--profile参数正常工作。我设置了一个配置文件目录，其中包含一个config.yaml文件。如果我把这个放到config.yaml中 verbose: 1 然后运行snakemake --profile xxx target，一切都很顺利。但是，如果配置文件包含 set-threads: "trim=7 diamond_dna=5" snakemake抱怨道： MissingRuleException: No rule to produce --set-threads=trim=7 di

浏览 0提问于2020-08-01得票数 1

1回答

Snakemake -从输入文件动态派生目标

python、python-3.x、bioinformatics、snakemake

我有大量的输入文件组织如下： data/ ├── set1/ │ ├── file1_R1.fq.gz │ ├── file1_R2.fq.gz │ ├── file2_R1.fq.gz │ ├── file2_R2.fq.gz | : │ └── fileX_R2.fq.gz ├── another_set/ │ ├── asdf1_R1.fq.gz │ ├── asdf1_R2.fq.gz │ ├── asdf2_R1.fq.gz │ ├── asdf2_R2.fq.gz | : │ └── asdfX_R2.fq.gz : └── m

浏览 8提问于2019-08-02得票数 3

回答已采纳