首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python三剪短肽正则表达式?

Python三剪短肽正则表达式?
EN

Stack Overflow用户
提问于 2013-08-22 01:51:25
回答 1查看 841关注 0票数 2

目的是在Python中编码蛋白质序列的理论胰蛋白酶切割。胰蛋白酶的切割(切割)规则是:在R或K之后,但不在P之前(即胰蛋白酶在每个K或R之后切割蛋白质序列,除非(K或R)后面跟着一个P)。

这是我的正则表达式:

代码语言:javascript
运行
复制
pattern = re.compile('[KR]?[^P].*?[KR](?!P)')
peptides = pattern.findall('GGRGAGSAAWSAAVRYLTMMSSLYQT')

输出:

代码语言:javascript
运行
复制
GGR and GAGSAAWSAAVR

我想要的是:

代码语言:javascript
运行
复制
GGR and GAGSAAWSAAVR and YLTMMSSLYQT

Findall只返回被剪切的部分,而不返回剩余的部分。谢谢

EN

回答 1

Stack Overflow用户

发布于 2014-03-13 07:19:49

这是一个非常好的解决问题的方法,也是最简单的方法:

代码语言:javascript
运行
复制
peptideo=""
proteina=raw_input("Digite a sequencia da proteina a ser digerida: ")
i=0
for i in range (0,len(proteina)):
    peptideo=peptideo+proteina[i]
    if (proteina[i]==("R") and not (proteina[i+1]=="P")):
        print "Peptideo digerido", peptideo
        peptideo=""
    if (proteina[i]==("P") and not (proteina[i+1]=="P")):
        print "Peptideo digerido", peptideo
        peptideo=""
print "Peptideo digerido", peptideo    
票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18364380

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档