首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >将前一序列的长度相加后计算序列的长度

将前一序列的长度相加后计算序列的长度
EN

Stack Overflow用户
提问于 2016-07-27 14:54:35
回答 1查看 109关注 0票数 0

我想确定multifasta文件中单个序列的长度。我从传记手册中得到了这段生物爬虫代码:

代码语言:javascript
运行
复制
from Bio import SeqIO
import sys
cmdargs = str(sys.argv)
for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):
 output_line = '%s\t%i' % \
(seq_record.id, len(seq_record))
 print(output_line)

我的输入文件如下:

代码语言:javascript
运行
复制
>Protein1
MNT
>Protein2
TSMN
>Protein3
TTQRT

然后代码会产生:

代码语言:javascript
运行
复制
Protein1        3
Protein2        4
Protein3        5

但是我想计算一个序列的长度,然后再加上之前序列的长度。它将如下所示:

代码语言:javascript
运行
复制
Protein1        1-3
Protein2        4-7
Protein3        8-12

我不知道我需要修改上面代码中的哪一行才能得到输出。感谢在这个问题上的任何帮助,谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-07-27 15:52:10

只需简单地获得总长度:

代码语言:javascript
运行
复制
from Bio import SeqIO
import sys
cmdargs = str(sys.argv)
total_len = 0
for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):
    total_len += len(seq_record)
    output_line = '%s\t%i' % (seq_record.id, total_len))
    print(output_line)

要获取范围,请执行以下操作:

代码语言:javascript
运行
复制
from Bio import SeqIO
import sys
cmdargs = str(sys.argv)
total_len = 0
for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):
    previous_total_len = total_len
    total_len += len(seq_record)
    output_line = '%s\t%i - %i' % (seq_record.id, previous_total_len + 1, total_len)
    print(output_line)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38605751

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档