我一直在运行一个名为genewise的程序,将核苷酸序列转换为基因的蛋白质序列。输入包括来自许多样本的组装的核苷酸序列。为了解析genewise输出,我使用以下命令选择了fasta头:
for i in `ls`; do (cd "$i" && awk '/^>*/{flag=1;} /\/\// {flag=0}flag' out
我有一个包含几个序列的fasta文件,但是所有序列的第一行以相同的字符串(ABI)开头,我想更改它,并将其替换为存储在不同文本文件中的物种的名称。我的fasta文件看起来AGCTAGTCCCGGGTTTATCGGCTATACACCCCTTGACTGACATGGTACGATGACATTTCGACTGGTGTCGATAGGCAGCATABI头,并用我的物种的名称来替换它们,使用这个精确的顺序。Miconia cf.gracilis
ATT