我正在使用Biopython打开一个大型的单项fasta文件(514兆碱基),这样我就可以从特定的坐标中提取出DNA序列。返回序列是相当慢的,我只是想知道是否有更快的方法来执行这个我还没有弄清楚的任务。速度不是一两次点击的问题,但我迭代了145,000个坐标的列表,这将需要几天的时间:/from Bio import SeqIO
我有一个多fasta文件,我需要从其中提取100到200范围的基,包括它们的相应的头。我知道‘削减-c 100-200’可以做到这一点,而没有相应的标题。在Perl或bash中有什么方法可以做到吗?8YS68_00012_00035
seq id -ATCGATCGATCG这意味着,我想准确地提取每个序列的100到200之间