我必须为一个巨大的蛋白质组文件计算很多东西,因为我在数据集中有大约30000个蛋白质组。我有一个脚本,其中有许多需要单个蛋白质文件的子脚本
在perl中:
my output = `somescript -do_something -with_this_single_protein_file`
我想问,有什么方法可以避免将数据集分割成30000个文件,每个文件包含一个蛋白质?也许在Python语言中,有一种方法可以给Popen一个stringIO,一个文件处理程序或者别的什么?
谢谢,加博
发布于 2015-03-04 17:44:32
您可以使用Bash的process substitution自动创建所需的临时文件。
while(<DATASET>) {
my $output = system("/bin/bash", "-c", "somescript -do_something -with_this_single_protein_file <(echo \"$_\")");
}
https://stackoverflow.com/questions/28849902
复制相似问题