如何从以下内容更改fasta文件中的所有行:
>vsearch_derep1;size=1 331 95 544 TRINITY_DN40607_c0_g1_i1 len=2000path=[0:0-1097]
ATGGGATTAACTGGTAAGTTAATTGCTGCAATAGAGTTTAAGGCTGGTGGTGATGTTTTC
CATGAGCTGTTCAGGCACAAGCCACAACATTTATCCACAGTAAGCTCTGAGAAAGTACAA对此:
>TRINITY_DN40607_c0_g1_i1
ATGGGATTAACTGGTAAGTTAATTGCTGCAATAGAGTTTAAGGCTGGTGGTGATGTTTTC
CATGAGCTGTTCAGGCACAAGCCACAACATTTATCCACAGTAAGCTCTGAGAAAGTACAA这意味着我想删除">“和"TRINITY_”之间的任何内容,以及"TRINITY_DN40607_c0_g1_i1“之后的任何内容。请注意,"i“后面的"1”在fasta文件中各不相同。
我会感谢你的帮助
发布于 2022-07-24 23:48:37
您可以使用sed正则表达式\(TRINITY_[^[:blank:]]*\)来匹配TRINITY_之后最长的非空白字符序列,并重新替换整个序列描述:
sed‘S/^>.(TRINITY_[^*空白:])*/>1/’-就地file.fasta
https://askubuntu.com/questions/1420234
复制相似问题