我有一个FASTA文件,我只想去掉序列(偶数行)的冗余,而不是标题。
>headerX
**SEQUENCE1**
>headerY
SEQUENCE2
>headerZ
**SEQUENCE1**
我想去掉相同序列的(SEQUENCE1)
发布于 2018-07-26 07:07:41
您可以使用'sed‘来实现这一点,
sed -n 2~2p data.fasta | sort -u
这将打印data.fasta中所有偶数编号的行,然后对结果进行排序以删除重复项。
https://stackoverflow.com/questions/51528457
复制相似问题