首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何使用Ubuntu命令行删除fasta文件中其他字符/字符串/模式之间、之前和之后的字符/字符串/模式

如何使用Ubuntu命令行删除fasta文件中其他字符/字符串/模式之间、之前和之后的字符/字符串/模式
EN

Ask Ubuntu用户
提问于 2022-07-24 20:44:23
回答 1查看 517关注 0票数 0

如何从以下内容更改fasta文件中的所有行:

代码语言:javascript
运行
复制
>vsearch_derep1;size=1 331 95 544  TRINITY_DN40607_c0_g1_i1 len=2000path=[0:0-1097]
ATGGGATTAACTGGTAAGTTAATTGCTGCAATAGAGTTTAAGGCTGGTGGTGATGTTTTC
CATGAGCTGTTCAGGCACAAGCCACAACATTTATCCACAGTAAGCTCTGAGAAAGTACAA

对此:

代码语言:javascript
运行
复制
>TRINITY_DN40607_c0_g1_i1
ATGGGATTAACTGGTAAGTTAATTGCTGCAATAGAGTTTAAGGCTGGTGGTGATGTTTTC
CATGAGCTGTTCAGGCACAAGCCACAACATTTATCCACAGTAAGCTCTGAGAAAGTACAA

这意味着我想删除">“和"TRINITY_”之间的任何内容,以及"TRINITY_DN40607_c0_g1_i1“之后的任何内容。请注意,"i“后面的"1”在fasta文件中各不相同。

我会感谢你的帮助

EN

回答 1

Ask Ubuntu用户

发布于 2022-07-24 23:48:37

您可以使用sed正则表达式\(TRINITY_[^[:blank:]]*\)来匹配TRINITY_之后最长的非空白字符序列,并重新替换整个序列描述:

sed‘S/^>.(TRINITY_[^*空白:])*/>1/’-就地file.fasta

票数 1
EN
页面原文内容由Ask Ubuntu提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://askubuntu.com/questions/1420234

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档