我们在研究基因或者病毒的时候,经常会得到一堆未知的序列来进行分析。比如要比较不同的 COIVD 病毒的序列相似性,或者查看某一个蛋白家族序列之间的相似性。这类的分析的话,一般都可以进行进化分析来进行展示。之前我们介绍过如果解读一个进行树 [[为什么要做进化分析]] ,同时也介绍了 [[如何下载数据构建进行进化分析]],另外也介绍了一个 [[一站式进化分析]] 工具。 对于上面那个工具,在我们只是想简单的看一眼多个序列之间的差异的时候就显得有一些麻烦了。所以今天就介绍一个简单好用的的工具 MetaLogo: a heterogeneity-aware sequence logo generator and aligner: http://metalogo.omicsnet.org/about
在 MetaLogo 当中点击Analysis即可进行序列的分析。
分析的第一步就是上传数据,在数据上传当中,需要指定上传的数据类型是 [[Fasta基因序列格式]] 还是 FASTQ 的。其他的则主要是上传序列文件。可以直接粘贴到数据库当中也可以上传一个序列文件。
之后就是来选择序列分析的方法和进化树可视化的类型。其中关于序列比对的结果可以是横向的也可以是放射性的等等
最后则可以选择比对结果图片的格式。比如图片的题目,导出的格式等等
在选择好之后,点击Submit即可进行分析。
在序列比对结果展示的主要就是下面这个进化树 ➕后面的序列比较的 [[转录因子调控|motif]]。
再往下可以看到输入的序列长度的统计汇总,包括总共序列长度的汇总分布
同时还可以看到序列之间相关性的热图等等。
以上就是 MetaLogo 的主要使用方法了。主要还是用来快速分析多个序列之间的相关程度。同时生成一个还算不错的进化序列。当然如果想要更好的可视化树的话,那还是得用 ggtree。