我有一个蛋白质对的列表,我想将"BLAST Two Sequence“的速度和准确性与Smith-Waterman程序进行比对。我知道在NCBI网站上有一个"Blast Two Sequence“选项,但我想从python脚本运行它。也许Biopython有这个能力?如果我不能使用Blast两个序列,我将比较不同版本的Smith-Waterman,但这不会那么令人兴奋:)或者,如果有人对生物信息学中涉及比较蛋白质对的大四项目有其他想法,请不要犹豫让我知道!
我试图扫描可能的SNPs和indels,通过调整支架子序列从一个参考基因组。(原始读取不可用)。有没有人建议使用更好的对齐算法来对较长的序列?已经使用BLAST进行了初始比对,以找到参考基因组的区域来对齐。我并不完全相信BLAST在正确放置indels方面的可靠性,我还没有找到一个像生物字符串那样好的api来解析原始的爆炸比对。genome_file_name)[[1]] #genome is a "DNAString" instance
#qstart, qend