如何根据小序列(<=40残基)在初始蛋白质中的位置来表示它们的分布?
我有几个序列如下。第一列是当前序列的编号。第二列是起始位置,第三列是当前序列在其初始蛋白质中的停止位置。
1 18 34
2 39 55
3 30 46
4 20 36
5 22 46
6 22 46
7 25 50
8 33 50
9 46 63
这些序列并不都来自相同的蛋白质,它们来自不同长度的蛋白质。
考虑到蛋白质并不都有相同的长度,将这些序列映射到横坐标上,看看它们是更多地位于蛋白质的开头,还是更多地在蛋白质的末端,或者更多的在中间,最好的想法是什么?
我写了一个算法,根据这些序列的起始和终止位置,将它们映射到横坐标上,但问题是,由于蛋白质具有不同的长度,因此无法解释该图。我的图表显示,序列更多的是蛋白质的开始,但这只是由于一些蛋白质比其他蛋白质短的事实,所以这是一个问题。
有人对此有更好的想法吗?
提前谢谢。
发布于 2014-04-04 02:08:56
这些蛋白质是否足够相似,可以进行多序列比对?如果是这样,那么您可以将读数与多个序列比对对齐,以便它们都在相同的坐标空间中。
https://stackoverflow.com/questions/22817580
复制相似问题