今天在群里看到一个提问,很有趣,好像是有一个网页工具可以把fastq格式转为phylip格式。我虽然没有使用过这个软件,但是我觉得这个提问,可能是忽略了计算过程,直接说结果。应该是问题本身就错误的。
我们四年前就系统性整理过生信基础知识名词本,其中就有数据格式专题,目录如下:
虽然没有phylip格式,但是如果你理解了格式,就知道,其实无非就是软件开发者定义好的规则。我以前分享过HPV的病毒进化树,可以把这个当做是学徒作业了。
国家生物信息中心 2019新型冠状病毒信息库 (2019nCoVR)
大机构大组织做的很全面:
不仅仅是有热点病毒序列,甚至有全部的冠状病毒信息,下面是网页公布的一些信息
机构对这些序列进行了一些探索,绘制了两个典型的图,如下:
这个图没有看出来是怎么制作的,多序列比对可能不够,看起来应该是固定一个病毒序列为参考基因组,然后所有的其它地方检测到的病毒也进行测序后,比对到我们人为规定的参考基因组上面,看变异位点哦。
一般来说,其它地方检测到的病毒基因组变异位点都是在个位数这样的数量级,因为病毒进化是有速度的。
这个就比较常规了,如果只有Windows电脑的,使用mega就足够了
如果有Linux操作系统,可以参考我以前的博客:
因为确实不做这方面研究,这个探索性课题,就留给我的学徒吧!